Skript zur Vorlesung Theoretische Physik IV: Statistische Physik von Volker Meden gehalten im Wintersemester 2014/2015 an der RWTH Aachen 16. September 2014 2 Inhaltsverzeichnis 1 Eine kurze Einführung 5 2 Grundüberlegungen 2.1 Eigenschaften makroskopischer Systeme . . . . . . 2.2 Grundbegriffe der mathematischen Statistik . . . 2.3 Die mikrokanonische Zustandssumme . . . . . . . 2.4 Die Zustandssumme des idealen Gases . . . . . . 2.5 Nebenbedingungen, Gleichgewicht, Irreversibilität 2.6 Der erste Hauptsatz der Thermodynamik . . . . . 2.7 Vollständige Differentiale . . . . . . . . . . . . . . 2.8 Quasistatische Prozesse . . . . . . . . . . . . . . . 2.9 Temperatur und Entropie . . . . . . . . . . . . . 2.10 Kleine Wärmemengen . . . . . . . . . . . . . . . 2.11 Die kanonische Verteilung . . . . . . . . . . . . . 2.12 Nochmal: Das klassischen idealen Gases . . . . . . 2.13 Gleichgewicht, Entropie und Kräfte . . . . . . . . 2.14 Der zweite und der dritte Hauptsatz . . . . . . . 2.15 Messung makroskopischer Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Thermodynamik 3.1 Differentiale . . . . . . . . . . . . . 3.2 Zustandsgleichungen . . . . . . . . 3.3 Thermodynamik des idealen Gases 3.4 Potentiale und Maxwell-Relationen 3.5 Zustandsänderungen . . . . . . . . 3.6 Wärmekraftmaschinen . . . . . . . 3.7 Variierende Teilchenzahl . . . . . . 3.8 Mischungen, Lösungen, Reaktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 . 65 . 73 . 79 . 83 . 87 . 91 . 97 . 103 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 9 15 20 24 28 29 31 32 37 42 43 45 51 56 58 4 Klassische statistische Mechanik 117 4.1 Mikroskopische Dynamik und Phasenraum . . . . . . . . . . . . . 117 4.2 Ensembles der klassischen Mechanik . . . . . . . . . . . . . . . . . 126 3 4 5 Quantenstatistik 5.1 Dichtematrix und von Neumann-Gleichung 5.2 Die Ensembles der Quantenstatistik . . . . 5.3 Fermi-Dirac und Bose-Einstein Verteilung 5.4 Klassischer Limes und Virialentwicklung . 5.5 Die Bose-Einstein Kondensation . . . . . . 5.6 Das entartete Fermigas . . . . . . . . . . . 5.7 Photonen und Phononen . . . . . . . . . . INHALTSVERZEICHNIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 143 149 153 159 164 172 180 Kapitel 1 Eine kurze Einführung In der statistischen Physik versucht man (traditionell) die physikalischen Eigenschaften von makroskopischen Systemen, also z.B. einem Behälter mit einem Liter Gas bei “normalem” Druck, einem Stück Eisen der Größe 1cm3 oder eine Polymerlösung in einem Reagenzglas zu beschreiben. Da sie hinreichend groß sind, sind solche Systeme direkter Bestandteil unserer Sinneswelt. Wie wir heutzutage wissen, bestehen die makroskopischen Körper jedoch aus mikroskopischen Bausteinen. Da es von der untersuchten Fragestellung abhängen mag, welche mikroskopischen Teilchen man als die Elementaren betrachten sollte (z.B. Elektronen und Atomkerne, Atome oder Moleküle), werden wir die in der statistischen Physik untersuchten Systeme zunächst verallgemeinernd als solche mit vielen mikroskopischen Freiheitsgraden bezeichnen. Im Laufe ihres bisherigen Studiums haben sie gelernt, daß die Bewegung auf der atomaren (mikroskopischen) Skala durch die Gesetze der Quantenmechanik beschrieben wird. Unter gewissen einschränkenden Bedingungen kann manchmal auch die klassische Mechanik angewandt werden.1 In beiden Teilgebieten der theoretischen Physik haben sie die physikalischen Eigenschaften von Systemen mit nur wenigen Freiheitsgraden erfolgreich untersucht.2 Mit diesem Vorwissen liegt es nahe, die physikalischen Eigenschaften von Systemen mit vielen Freiheitsgraden durch Anwenden der Quantenmechanik oder der klassischen Mechanik auf das Vielteilchenproblem zu berechnen. Betrachten wir dazu ein Beispiel. Uns interessiere die Änderung des Drucks (Kraft pro Fläche) eines Gases auf einen Kolben, wenn wir das Volumen beliebig langsam von V1 nach V2 ändern. Es wird sofort ein grundsätzliches Problem klar. Um eine einzige Meßgröße zu berechnen muß man bei diesem Vorgehen einen extrem großen Satz von Bewegungsglei1 In einem Gas z.B. dann, wenn die mittlere de Broglie Wellenlänge sehr viel kleiner ist, als der mittlere Abstand der Konstituenten. 2 Es sei daran erinnert, daß in der klassichen Mechanik auch ausgedehnte Körper (z.B. Planeten) meist als Punktteilchen idealisiert werden, welche nur drei Freiheitsgrade der Bewegung haben. Bei der Diskussion des makroskopischen starren Körpers wird auch dieser aufgrund seiner Starrheit als ein System mit wenigen Freiheistgraden behandelt. 5 6 KAPITEL 1. EINE KURZE EINFÜHRUNG chungen lösen und einen großen Satz von Anfangsbedingungen kennen.3 Kurzes Innehalten macht klar, daß eine alternative Herangehensweise wünschenswert wäre und ihnen in Form der Thermodynamik auch bereits begegnet ist (siehe die Experimentalphysik I Vorlesung). Die Thermodynamik liefert (einfache) Zusammenhänge zwischen Meßgrößen, jedoch keine mikroskopische Erklärung für die relevanten Konzepte, wie z.B. das der Temperatur. Im obigen Beispiel des Gasdrucks, in dem wir ausgehend von den Anfangsbedingungen des Vielteilchensystems die Bewegungsgleichungen lösen, wäre der Druck auch nach erreichen von V2 eine Funktion der Zeit mit kleinen Fluktuationen auf sehr kurzen Zeitskalen. Fluktuationen dieser Art sind unserer Sinneswahrnehmung in sehr vielen für uns relevanten Situationen nicht zugänglich4 und oft auch in Messungen nicht nachweisbar (nachdem V2 erreicht wurde zeigt unser Meßgerät innerhalb der Meßzeit einen zeitlich konstanten Druck an). Wir sind daher gar nicht an einer mikroskopisch detaillierten Beschreibung interessiert, da wir die mikroskopischen Details der mehr als 1023 (=1 Mol) Teilchen weder kontrollieren noch messen können.5 Anders gesagt, liefert die mikroskopische Rechnung zu viel Information und wir sind vielmehr an Mittelwerten (wie den obigen Druck) interessiert. Dabei stellt sich sofort die Frage, ob wir Mittelwerte über verschiedene nahezu identische Systeme oder über die Zeit bilden sollten. Wir werden im Laufe der Vorlesung auf diesen wichtigen Punkt zurückkommen. Die Aufgabe besteht also darin eine statistische Beschreibung zu finden, mit deren Hilfe man viele Phänomene und Experimente beschreiben kann. Die Stärke der statistischen Vorgehensweise besteht darin, Verfahren anzugeben, mit deren Hilfe man Zusammenhänge zwischen Kontrollparametern (dem Volumen) und Mittelwerten (dem Druck) direkt bestimmen kann, nach der Devise: Erst mitteln und dann rechnen – nicht umgekehrt. Ziel der neuen Theorie, der statistischen Mechanik, ist es, die Parameter zu identifizieren, die für eine makroskopische Beschreibung am brauchbarsten sind, um die wesentlichen Eigenschaften und Gesetzmäßigkeiten von Vielteilchensystemen aufzuzeigen und die es uns erlauben quantitative Vorhersagen zu machen. So liefert sie die mikroskopische Begründung für die Thermodynamik, die isoliert betrachtet, eine phänomenologische Theorie darstellt. Wenn sie sich an die Vorlesung zur Experimentalphysik I zurück erinnern, so sollte ihnen klar sein, daß die Thermodynamik Zusammenhänge zwischen makroskopischen Eigenschaften (Druck, Temperatur, usw.) von Systemen mit vielen Freiheitsgraden liefert, ohne dabei eine mikroskopische 3 Im quantenmechanischen Fall ist es mit Hilfe von Computern möglich, die Dynamik von Systemen mit einigen hundert Freiheistgraden (auf sehr kurzen Zeitskalen) zu berechnen und im klassischen Fall sogar für Systeme im Bereich von 104 Teilchen. Ein makroskopischer Köper besteht jedoch aus sehr viel mehr Teilchen, nämlich meist mehr als 1023 (=1 Mol). 4 Ein Gegenbeispiel ist die Brownsche Bewegung, die in Form der Zitterbewegung von Pflanzensamen auf einer Flüssigkeitsoberfläche unter einem “einfachen” Mikroskop “sichtbar” wird. 5 In einem Experiment werden wir typischerweise nicht in der Lage sein, die Bewegung aller Freiheitsgrade zu verfolgen. 7 Begründung für diese zu geben. Die theoretische Thermodynamik ist ebenfalls Bestandteil dieser Vorlesung. Obwohl die Grundgesetze der Dynamik (klassisch oder quantenmechanisch) bekannt sind, stellt die Entwicklung von Begriffen und Methoden, mit denen das obige Ziel erreicht werden kann eine große intellektuelle Herausforderung dar. Wenn man sich daran erinnert, wie aufwendig und kompliziert bereits die (oft nur näherungsweise) Beschreibung von Systemen mit wenigen Freiheitsgraden ist, könnte man befürchten, daß das Ziel ein quantitatives Verständis von Vielteilchensystemen zu erlangen eventuell überhaupt nicht erreicht werden kann. Es ist hier jedoch gerade die große Zahl der Freiheitsgrade, die es erlaubt, statistische Methoden besonders wirkungsvoll zu verwenden. Nach dem “Gesetz der großen Zahlen” (siehe später und Vorlesungen zur Wahrscheinlichkeitstheorie und Statistik) werden die relativen Schwankungen mit Zunahme der Zahl der Teilchen immer kleiner. Damit ergeben sich praktisch wieder Gesetzmäßigkeiten von deterministischem Typ. Die typische Situation bei makroskopischen Systemen ist dadurch gegeben, daß man ihren “mikroskopischen Zustand” im einzelnen nicht kennt. Diesem trägt man Rechnung, indem man Wahrscheinlichkeitsverteilungen für die Größen einführt, die einen Zustand festlegen. Obwohl man nur am Verhalten eines makroskopischen Systems interessiert ist, betrachtet man es in der statistischen Beschreibung so implizit als Bestandteil einer Vielzahl identischer Systeme. Gemeinsam bilden diese ein Ensemble welches durch eine Häufigkeits-(Wahrscheinlichkeits-)verteilung charakterisiert ist. Die Gesamtheit (Das Ensemble) wird durch eine makroskopische Präparationsvorschrift festgelegt. So sollen z.B. alle Systeme eine Energie, einen Druck und eine Teilchenzahl innerhalb einer gewissen Standardabweichung von bestimmten Sollwerten haben. Der Makrozustand ist durch diese Vorschrift festgelegt. Im Rahmen der klassischen Mechanik (wenn anwendbar) wird dagegen ein Mikrozustand durch die Angabe aller Orte und Impulse der 1023 Teilchen (und der Hamiltonfunktion) festgelegt und im Rahmen der Quantenmechanik durch die Angabe der Vielteilchenwellenfunktion im Hilbertraum (und des Hamiltonoperators). Wie diese Diskussion andeutet, werden wir also meist Mittelwerte über Systeme und nicht die Zeit bilden (siehe oben). Die Frage, inwieweit man ein einzelnes mechanisches System zu verschiedenen Zeiten als Realisierung der verschiedenen Systeme eines statistischen Ensembles und damit die entsprechenden Zeitmittelwerte als Mittelwerte einer Gesamtheit betrachten kann, ist Gegenstand der sogenannten Ergodentheorie. Ein weiteres kollektives Phänomen, welches sich bereits im Alltag beobachten läßt, macht die Notwendigkeit einer neuen Herangehensweise6 offensichtlich. Den mikroskopischen Bewegungsgesetzen ist keineswegs anzusehen, daß Wasser bei Erhöhung des Drucks oder Erniedrigung der Temperatur fest wird. Die statisti6 “Neu” verglichen mit der “brute force” Lösung der mehr als 1023 Bewegungsgleichungen (seien sie quantenmechanisch oder klassisch) unter Berücksichtigung einer entsprechenden Zahl von Anfangsbedingungen. 8 KAPITEL 1. EINE KURZE EINFÜHRUNG sche Beschreibung des Phänomens der Phasenübergänge wird wichtige Beiträge zum Verständnis dieser beitragen. Man unterscheidet in der statistischen Mechanik und auch der Thermodynamik zwischen der Beschreibung von Gleichgewichtssituationen und des Nichtgleichgewichts – Begriffe, die wir hier noch nicht genau definieren wollen, sondern davon ausgehen, daß sie ein intuitives Verständnis von ihnen haben. Zur ersten Problemklasse gehören einfache thermodynamische Zusammenhänge von Gasen aber auch Aussagen zu magnetischen Eigenschaften von Festkörpern. Ebenfalls in diese Klasse fällt die Betrachtung von Phasenübergängen (z.B. fest-flüssiggasförmig aber auch magnetisch-nichtmagnetisch). In der Nichtgleichgewichtsphysik kann man einerseits zwischen Störungen des Gleichgewichts mit kleinen Amplituden – die man in der sogenannten linearen Antworttheorie untersucht – und der “echten” Nichtgleichgewichtssituation unterscheiden und andrerseits zwischen Systemen, die sich einem Gleichgewichtszustand annähern (Relaxation abgeschlossener Systeme), und solchen, die durch eine äußere Störung getrieben werden. Sowohl Fragen der Gleichgewichts- (z.B. sogenannte Quantenphasenübergänge oder der Glasübergang) wie auch der Nichtgleichgewichtsphysik sind Gegenstand der aktuellen Forschung in der Vielteilchenphysik. Wie die obigen Überlegungen andeuten, werden wir in dieser Vorlesung mit der statistischen Mechanik beginnen und die Thermodynamik aus ihr herleiten. In der Literatur werden sie ebenfalls die alternative Herangehensweise finden, in der die Thermodynamik als eigene phänomenologische Theorie ihrer statistischen Begründung voran gestellt wird. Konzeptionell bietet es sich meist an (siehe unten), bei der Beschreibung der Konstituenten des makroskopischen Systems die Quantenmechanik zu verwenden.7 Wenn es uns angebracht erscheint, werden wir den klassischen Limes diskutieren oder gleich mit einer klassischen Beschreibung starten. 7 Das gilt, obwohl wir im ersten Beispiel im nächsten Kapitel gleich eine Ausnahme betrachten wollen. Kapitel 2 Grundüberlegungen 2.1 Eigenschaften makroskopischer Systeme Wir betrachten als einfaches Beispiel eines makroskopischen Systems ein Gas aus N 1 gleichartigen Atomen oder Molekülen welches sich in einem Gefäß mit Volumen V befinde. Das System sei idealisierend als isoliert betrachtet, das heißt, es stehe mit keinem weiteren System in Kontakt. Weiterhin nehmen wir an, daß das System für längere Zeit sich selbst überlassen, also nicht gestört, wurde. Diese beiden Annahmen zusammenfassend bezeichnet man das System als abgeschlossen. Wir nehmen an, daß das Gas hinreichend verdünnt ist, d.h. die Anzahl der Teilchen pro Volumeneinheit wird als klein angenommen. Damit ist die mittlere Entfernung zwischen den Teilchen groß1 und es kommt selten zu Stößen zwischen den Teilchen und mit der Wand. Wir sind dabei davon ausgegangen, daß die Wechselwirkung zwischen den Teilchen und mit der Wand kurzreichweitig ist, so daß das Konzept “Stoß” sinnvoll ist. Die potentielle Energie der N Teilchen ist daher sehr viel kleiner als ihre kinetische Energie und man bezeichnet das Gas als ideal. Um Komplikationen der Quantenmechanik, wie z.B. die aus der Ununterscheidbarkeit folgenden (siehe die Theorie III Vorlesung), zu vermeiden, nehmen wir weiterhin an, daß das Gas so verdünnt ist, daß die mittlere de Broglie Wellenlänge λ = h/|~p| der Teilchen sehr viel kleiner als der mittlere Teilchenabstand ist. In diesem Fall ist eine klassische Beschreibung der Teilchen näherungsweise zulässig. Beobachten wir das Gas über ein Zeitintervall, so wird uns die Bewegung des Gases als recht “durcheinander” erscheinen, obwohl die Bewegung jedes einzelnen Teilchens im mikroskopischen sehr simple ist. Jedes Teilchen bewegt sich geradlinig mit konstanter Geschwindigkeit bis auf die Zeiten in denen die “seltenen” Stöße auftreten. 1 Ich gehe davon aus, daß sie auch ohne genauer Definition eine Vorstellung davon haben, was die mittlere Entfernung ist. 9 10 KAPITEL 2. GRUNDÜBERLEGUNGEN Gedanklich teilen wir das Volumen V nun in zwei gleich große Teile (den linken und den rechten Teil), die beide eine identische Form haben. Die Teilchenzahlen in den jeweiligen Teilen bezeichnen wir mit N 0 und N 00 , wobei N = N 0 + N 00 . Für sehr große N “erwarten” wir, daß für gewöhnlich N 0 ≈ N 00 gilt. Sicherlich gilt diese Aussage nur näherungsweise (daher das ≈-Zeichen), da sich die Moleküle ja bewegen und vom einen in den anderen Teil des Behälters übergehen können. Die Zahl N 0 (und damit auch N 00 = N − N 0 ) wird also fluktuieren, aber “für gewöhnlich” werden diese Fluktuationen um N/2 “klein” (gegenüber N ) sein. Um die in Anführungsstrichen stehenden Begriffe genauer zu fassen wollen wir uns die Frage nach den Wahrscheinlichkeiten des Auftretens gewisser Konfigurationen stellen. Ein Teilchen kann in unserer Überlegung in zwei Konfigurationen vorkommen. Es kann im linken oder rechten Volumen sein. Da beide Hälften identisch sind, ist die Wahrscheinlichkeit für jede der beiden Konfigurationen 1/2. Dabei ist die Wahrscheinlichkeit als die relative Häufigkeit von “Teilchen links” bzw. “Teilchen rechts” im idealisierten Limes einer unendlichen Zahl von Beobachtungen definiert. Genauer replizieren wir unser System (also hier konkret ein Gasteilchen im Behälter mit Volumen V ) sehr häufig – betrachten es also als Teil eines Ensembles – und schauen zu einer gegebenen Zeit t nach, in wievielen der Replikas das Teilchen im linken Volumen ist. Die relative Häufigkeit dieser Beobachtung wird im Limes eines großen Ensembles gegen 1/2 gehen. Es wird aus dieser Grundüberlegung sofort klar, daß die Wahrscheinlichkeit für das Auftreten einer spezifischen Konfiguration im Fall von N Teilchen durch P = 1 2N gegeben ist. Wir gehen dabei davon aus, daß die identischen Teilchen unterscheidbar sind (also z.B. numeriert oder dadurch unterscheidbar, daß wir alle Teilchenbahnen verfolgen). Betrachten wir zunächst die Grenzfälle (a) N 0 = N und (b) N 0 = N/2, so kann man sich sehr schnell klar machen, daß es nur eine Konfiguration mit (a) aber, für große N , sehr viele Konfigurationen mit (b) gibt. Die Wahrscheinlichkeit für (a) ist somit PN 0 =N = 1 2N während die für (b) durch PN 0 =N/2 = C(N 0 = N/2) PN 0 =N 2N gegeben ist, da C(N 0 = N/2) C(N 0 = N ) = 1 gilt. So ergibt sich bereits für N = 4, C(2) = 6 aber C(4) = 1 und damit P2 = 3/8 aber P4 = 1/16. Wir würden die Verteilung mit N 0 ≈ N/2 als ungeordnet bezeichnen und die mit N 0 = N als “geordnet”. Wir können schließen, daß die Wahrscheinlichkeit für das Auftreten 2.1. EIGENSCHAFTEN MAKROSKOPISCHER SYSTEME 11 von gleichförmigen, ungeordneten Verteilungen sehr viel größer ist als die von “geordneten” oder noch konsequenter formuliert: Ist die Gesamtzahl der Teilchen N sehr groß, so kommen Verteilungsschwankungen die zu einer verhältnismäßig uneinheitlichen Teilchenverteilung führen so gut wie nie vor. Mit ∆N = N 0 −N/2 weisen nur Werte von N 0 mit |∆N |/N 1 eine signifikante Häufigkeit auf. Wir könnten nun auf die Idee kommen, statt eines Ensembles vieler identischer Systeme zu fester Zeit, ein System über eine längere Zeit zu beobachten. Die Zahl N 0 in der linken Hälfte des Systems wäre dann eine Funktion der Zeit, die um den Mittelwert N/2 schwankt. Unser klassisches Gas wird eindeutig beschrieben, wenn wir zu jedem Zeitpunkt “alles” über seinen Mikrozustand wissen, also Informationen über alle Teilchenkoordinaten und -geschwindigkeiten haben. Mikroskopisch betrachtet ist die Bewegung komplex. Sind wir dagegen nur am Makrozustand interessiert, wird sich die Situation generisch als einfacher herausstellen. Um das zu begreifen, sollten wir zunächst festlegen, was wir unter dem Makrozustand verstehen möchten. Auf den ersten Blick mag die genaue Definition davon abhängen, welche Fragen über das System wir beantworten möchten. Ein Beispiel dafür wodurch ein Makrozustand festgelegt wird, könnte die Teilchenzahl N 0 in der linken Hälfte des Volumens sein.2 Betrachten wir N 0 (t) vom Zeitpunkt t1 an über das Intervall ∆t und von t2 an aus ebenfalls über das Intervall ∆t (wobei t2 > t1 + ∆t gelten soll), so sehen die beiden Funktionen qualitativ ähnlich aus. Die Teilchenzahl N 0 wird um N/2 herum schwanken, mit typischen Abweichungen von N/2 die in beiden Fällen identisch sind. Jegliche Abweichung von diesem Verhalten, also z.B. große Fluktuationen, sind für große N so unwahrscheinlich, daß sie praktisch ausgeschlossen ist. Man sagt dann, daß der Makrozustand des Gases zeitlich konstant ist und sich das System im Gleichgewicht befindet. Wir wollen nun die Situation betrachten, daß das Volumen durch eine reale Trennwand zunächst in zwei gleich große Teile getrennt wird und sich alle Teilchen in der linken Hälfte befinden, also gilt N 0 = N . Wird die Trennwand zur Zeit t = 0 entfernt, so befindet sich das Gas sicherlich nicht im gerade diskutierten Gleichgewichtszustand. Im Laufe der Zeit wird sich das Gas auf das ganze Volumen ausbreiten und entwickelt sich vom “geordneten” in den “ungeordneten” Zustand mit N 0 ≈ N/2, wobei diese Tendenz von kleinen Fluktuationen überlagert sein wird. Das System relaxiert in seinen Gleichgewichtszustand. Diese Feststellung sagt jedoch nichts über die Zeitskala aus, über die die Relaxation stattfindet. In der Natur können solche Zeitskalen über Größenordnungen variieren. Die Aussage über das Streben in einen Gleichgewichtszustand besagt, daß sich ein isoliertes System, das sich zeitlich ändert dies immer in eine ganz bestimmte Richtung tun wird. Würde man einen Film der zeitlichen Entwicklung 2 Eine etwas feinere makrsokopische Beschreibung könnten wir dadurch erlangen, daß wir das Volumen nicht nur in zwei gleich große, sondern M gleich große unterteilen und bestimmen wieviele Teilchen sich jeweils in den Teilvolumina befinden. Dabei sollte V /M noch so groß sein, daß sich im “Normalfall” viele Teilchen darin befinden. 12 KAPITEL 2. GRUNDÜBERLEGUNGEN nach entfernen der Trennwand drehen, so könnte man beim Abspielen des Films feststellen, ob er vorwärts oder rückwärts abläuft. Würde man einen analogen Film nach erreichen des Gleichgewichts drehen, so ist es nicht möglich zu entscheiden ob dieser vorwärts oder rückwärts abläuft. Diese Überlegungen führen auf das Konzept der Irreversibilität. Ein Prozeß wird als irreversibel bezeichnet, wenn seine zeitliche Umkehr (praktisch) nie vorkommt. Nach den obigen Überlegungen sollte klar sein, daß man dem idealisierten Konzept der Irreversibilität immer näher kommt, je größer die Zahl der Teilchen N im System ist. Im Alltag haben wir es ständig mit Systemen zu tun, die sich nicht im Gleichgewicht befinden. Damit wird klar, warum die Zeit für uns eine eindeutige Richtung zu haben scheint. Nur dadurch können wir zwischen Vergangeheit und Zukunft unterscheiden. Die mikroskopischen Bewegungsgesetze zeichnen dagegen keine Richtung der Zeit aus. Eine solche ergibt sich nur, wenn wir es mit einem isolierten makroskopischen System zu tun haben von dem wir wissen, daß es sich zu einer Zeit t0 in einem besonders “geordneten” Zustand befunden hat. Wir wollen uns nun die Frage stellen, wie die im abgeschlossenen Gassystem konstante Gesamtenergie E auf die Freiheitsgrade verteilt ist. Da wir ein ideales Gas voraussetzen, ist die potentielle Energie gegenüber der kinetischen Energie vernachlässigbar. Jedes einzelne Teilchen hat die durch seine Geschwindigkeit P gegebene kinetische Energie i = m~vi2 /2, mit i = 1, 2, . . . , N und E = N i=1 i . Die Frage ist nun, wie E über die i verteilt ist. Analog zu den Überlegungen oben sollte klar sein, daß es (bei festem E) sehr viel mehr Konfigurationen gibt, in denen viele Teilchen eine Energie i ≈ E/N haben als solche, in denen ein paar Teilchen eine sehr hohe Energie tragen und die Restlichen in Ruhe sind. Aufgrund von Stößen, würde sich dieser Nichtgleichgewichtszustand auch nicht lange halten. Grob gesprochen (“in nullter Näherung”) wird die kinetische Energie also so über die Teilchen verteilt sein, daß in der Verteilung der Einteilchenenergien ein scharfes Maximum in der Nähe von E/N auftritt. Wie wir uns jetzt klar machen wollen, kann man die Dämpfung eines schwingenden Pendels in einem Gas als Effekt des Strebens des Gesamtsystems in einen ungeordneten Zustand (viele Konfigurationen) verstehen. Wir betrachten dazu einen abgeschlossenen Behälter in dem sich ein ideales Gas (gleiche Teilchen) befindet und ein Pendel schwingt. Reibungseffekte die sich durch die Aufhängung ergeben wollen wir vernachlässigen. Die Pendelschwingung wird nun dadurch gedämpft, daß das Pendel mit den Gasmolekülen stößt. Die große Energie des Pendels (große Masse verglichen mit der Molekülmasse) wird sukzessive auf die Moleküle übertragen. Wenn das Pendel (auf makroskopischer Skala) zur Ruhe gekommen ist, ist ein weniger geordneter Zustand erreicht und das Gesamtsystem ist im Gleichgewicht. Zwei makroskopische Systeme können miteinander in Wechselwirkung stehen (sind also jeweils nicht isoliert) und Energie austauschen. Dabei unterscheidet man zwischen zwei Fällen. Im ersten, wird beim Energieaustausch makroskopisch erkennbare Arbeit verrichtet. Dies ist z.B. dann der Fall, wenn sich eine 2.1. EIGENSCHAFTEN MAKROSKOPISCHER SYSTEME 13 zur Zeit t = 0 gelockerte, verschiebbare Trennwand zwischen zwei idealen Gasen bewegt. Ein Energieaustausch kann aber auch so stattfinden, daß keine makroskopisch erkennbare Arbeit verrichtet wird. Man bezeichnet diese Wechselwirkung als thermisch. Die Energie wird dabei nur im atomaren Bereich übertragen. Die übertragene Energie bezeichnet man als Wärme – im Gegensatz zur obigen Arbeit. Für zwei ideale Gase ist diese Situation z.B. dann realisiert, wenn sie durch eine makroskopisch unbewegliche Trennwand getrennt sind. Die Gasmoleküle auf der einen Seite stoßen dann mit den Molekülen der Trennwand und diese mit den Gassmolekülen auf der anderen Seite. Auf diese Art wird Energie auf atomarer Ebene ausgetauscht. Wir wollen nun zwei beliebige Systeme A und A0 betrachten, die in termischem Kontakt sind. Dabei könnte es sich um zwei Gasvolumina handeln, aber z.B. auch um ein Metallwürfel A in einem mit Wasser gefüllten Gefäß A0 . Das Gesamtsystem sei abgeschlossen. Damit ist die Summe der Energien in den Teilsystemen E + E 0 konstant (erhalten). Wir stellen nun die Frage, wie die Gesamtenergie auf die Teilsysteme aufgeteilt ist. Nehmen wir an, daß sich das Gesamtsystem im Gleichgewicht befindet, so ist die Energieverteilung so festgelegt, daß sich für das Gesamtsystem eine größt mögliche Zahl von mikroskopischen Zuständen ergibt in der diese Energieverteilung realisiert ist. Betrachten wir zunächst den Fall, daß beide Teilsysteme Gase aus gleichen Molekülen sind. In diesem Fall ist aus unseren obigen Überlegungen klar, daß der “zufälligste” Zustand derjenige ist, in dem jedes Teilchen die gleiche (mittlere) Energie hat. Es gilt somit ungefähr = E0 E = 0 = 0 , N N wobei N und N 0 die Zahl der Moleküle in A und A0 sind. Angenommen, daß A und A0 anfangs getrennt voneinander im Gleichgewicht sind. Die Anfangsenergien Ea und Ea0 werden dann im Allgemeinen so sein, daß a 6= 0a gilt. Das Zusammengesetzte und in thermischem Kontakt stehende System ist daher nicht im Gleichgewicht. Die beiden Systeme werden nachdem sie in thermischen Kontak gebracht wurden also Energie in Form von Wärme austauschen, bis e = 0e . Dabei gilt natürlich Ea + Ea0 = Ee + Ee0 und daher ∆E + ∆E 0 = 0 , wobei ∆E = Ee − Ea und analog für ∆E 0 . Mit der Bezeichnung Q = ∆E bzw. Q0 = ∆E 0 für die bei der Wechselwirkung von A bzw. A0 absorbierten Wärme folgt Q + Q0 = 0. Dabei kann die absorbierte Wärme auch negativ sein. Falls nicht Q = Q0 = 0 gilt, die Systeme also bereits vor dem Herstellen des thermischen Kontakts im Gleichgewicht waren, muß entweder Q > 0 und Q0 < 0 oder umgekehrt gelten. Das System (A oder A0 ) welches nach dem Herstellen des Kontakts und erreichen des Gleichgewichts eine positive absorbierte Wärme hat, wird als das (vorher) kältere bezeichnet – das andere ist dann das (vorher) wärmere. 14 KAPITEL 2. GRUNDÜBERLEGUNGEN Es ist zu betonen, daß dieses die erste Stelle ist, an der wir Bezug zum Konzept einer relativen Temperatur machen. Dieses verwenden wir nun, wenn wir zur allgemeineren Situation übergehen, daß die beiden Teilsysteme aus unterschiedlichen Atomen bestehen und sich beide womöglich in unterschiedlichen Phasen (z.B. das oben zitierte Beispiel fest/flüssig) befinden. Wir können davon ausgehen, daß sich unsere obigen Überlegungen qualitativ weiter anwenden lassen. Es sollte also für jedes der Teilsysteme einen Parameter T , die Temperatur, geben der proportional zur mittleren Energie eines Atoms/Moleküls dieses Teilsystems ist. Für den Gleichgewichtszustand, der der “zufälligsten” Energieverteilung entspricht soll dann die Bedingung T = T 0 gelten. An dieser Stelle kann das so eingeführte Konzept einer absoluten Temperatur nicht genauer definiert werden, ohne, daß wir genau festlegen, was wir unter dem Grad der Zufälligkeit verstehen wollen. Dies werden wir später nachholen. Eine Temperatur (nicht absolute Temperatur) läßt sich nach obigen Überlegungen jedoch dadurch festlegen, daß wir sie auf ein bestimmtes Thermometer beziehen. Unter diesem versteht man ein beliebiges “kleines” aber makroskopisches System, bei dem sich ein makroskopischer Parameter ändert, wenn es Wärme absorbiert. Diesen bezeichnet man als den thermometrischen Parameter θ. Dabei sollte das Thermometer “klein” sein, damit das System A mit dem es bei der Temperaturmessung in Kontakt gebracht wird, möglichst wenig gestört wird, d.h. die ausgetauschte Wärmemenge gegenüber der Gesamtenergie von A vernachlässigbar ist. Auch das Konzept der Temperatur in Bezug auf ein spezifisches Thermometer ist bereits sehr hilfreich, da wir z.B. lernen können, daß zwei Systeme A und A0 mit θA = θA0 wenn wir sie in thermischen Kontakt bringen keine Wärme austauschen werden. Wir haben hier häufig das ideale Gas als ein typisches Beispielsystem betrachtet um einige wesentliche Konzepte der statitsischen Mechanik einzuführen. Ein wesentlicher Teil der Vorlesung wird darin bestehen die vorgestellten Ideen systematisch auszuarbeiten. Ein weiteres einfaches Beispielsystem, welches gerne zur Illustration herangezogen wird, ist das System von N idealen Spins. Physikalisch spielt es zur Erklärung des Phänomens des Magnetismus eine wichtige Rolle. Wir betrachten eine Ansammlung von N identischen Teilchen (z.B. einen Typ von Atomen oder Ionen eines Festkörpers), bei dem jedes Teilchen (im einfachsten Fall) einen Spin-1/2 trägt und damit ein magnetisches Moment ±µ0 (siehe Vorlesung Theorie III). Zur Vereinfachung nehmen wir an, daß die Teilchen sich nicht bewegen können (Festkörper), so daß der Spin den einzigen Freiheitsgrad darstellt. Das Spinsystem wird als ideal bezeichnet, wenn die Spins praktisch nicht wechselwirken, was der Fall ist, wenn der mittlere räumliche Abstand der Spins so groß ist, daß das aus den magnetischen Momenten der anderen Spins resultierende Magnetfeld an der Position jedes Spins praktisch vernachlässigbar ist. Die Restwechselwirkung führt dazu, daß sich die Richtung der Spins mitunter ändert (entspricht dem “seltenen” Stoß im idealen Gas). Identifiziert man nun “linke Hälfte” mit “Spin rauf” und “rechte Hälfte” mit “Spin runter”, so kann man Überlegungen völlig analog zum idealen Gas anstellen. 2.2. GRUNDBEGRIFFE DER MATHEMATISCHEN STATISTIK 15 Dieses Kapitel abschließend sollte angemerkt werden, daß das hier diskutierte Verhalten von makroskopischen Systemen wie z.B. die Annäherung an einen zeitlich konstanten Gleichgewichtszustand, mit Alltagsbeobachtungen im Einklang steht, daß es aber durchaus Ausnahmen davon geben kann. So gibt es z.B. spezielle Typen von Systemen, die bei spezieller Wahl der Systemparameter und bei spezieller Wahl von Anfangszuständen nicht in ein zeitunabhängiges Gleichgewicht relaxieren. Die Untersuchung der Relaxation wechselwirkender Vielteilchensysteme ist Gegenstand aktueller experimenteller und theoretischer Forschung. 2.2 Grundbegriffe der mathematischen Statistik Aus den obigen physikalischen Überlegungen sollte klar geworden sein, daß wir uns mit den grundlegenden mathematischen Konzepten der Wahrscheinlichkeitstheorie vertraut machen müssen um die statistische Physik entwickeln zu können. Im Folgenden bietet es sich an, als konkretes Beispiel den Wurf eines Würfels im Hinterkopf zu haben. Den Begriff der Wahrscheinlichkeit pi für ein bestimmtes Ereignis i definieren wir als das Verhältnis der Zahl des Auftretens Ni von i und der Gesamtzahl der Versuche N im Limes großer N , also Ni . N →∞ N pi = lim In der Praxis muß N oft nur “hinreichend” groß sein. Aus der Definition folgt sofort, daß X pi = 1 i gilt, wobei die Summe über alle möglichen Ausgänge eines Versuchs geht. Man kann die Wahrscheinlichkeiten pi nun auf zwei Arten bestimmen. Eine Möglichkeit wäre es den Versuch an einem System immer wieder auszuführen (Zeitmittel), eine andere an einem Ensemble N identischer Systeme gleichzeitig den Versuch auszuführen (Ensemblemittel). Sind i und j zwei sich ausschließende Ereignisse, so gilt für die Wahrscheinlichkeit pi oder j , daß i oder j eintritt pi oder j = pi + pj . Die Wahrscheinlichkeit pi,j , daß bei zwei Systemen das erste im Zustand i und das zweite im Zustand j ist, ist durch pi,j = pi pj gegeben. Der Mittelwert (Erwartungswert) für eine beliebige Systemgröße x die in i den Wert xi annimmt ist bei vorgegebenen pi durch X hxi = p i xi i 16 KAPITEL 2. GRUNDÜBERLEGUNGEN definiert, wobei die Summe über alle möglichen Ereignisse geht. Diese Definition läßt sich sofort auf eine Funktion f von x übertragen X hf (x)i = pi f (xi ) . i Die Schwankung ∆x von x ist durch 1/2 ∆x = (x − hxi)2 definiert. Wie man leicht nachrechnet gilt äquivalent 1/2 . ∆x = x2 − hxi2 Anhand des eindimensionalen sogenannten random walk wollen wir nun fortgeschrittenere Konzepte der Wahrscheinlichkeitstheorie diskutieren. Wir wollen zunächst das mathematische Problem beschreiben und dann ein Beispiel für das Auftreten des random walk in der statistischen Physik diskutieren. In einem eindimensionalen random walk werden N Schritte auf einer Geraden (der x-Achse) ausgeführt. Der random walk startet bei x = 0. Ein Schritt besteht aus einem Sprung um δx = ±1. Der Sprung um +1 erfolgt mit Wahrscheinlichkeit p der um −1 mit q. Es gilt p + q = 1. Die einzelnen Schritte sind unabhängig voneinander. Zusammen geben die Zahl der positiven n+ und negativen Schritte n− die Gesamtzahl, also n+ + n− = N . Wir wollen nun die folgenden Größen bestimmen: (i) Die Wahrscheinlichkeit PN (m) nach N Schritten bei x = m = n+ − n− anzukommen, was der Wahrscheinlichkeit WN (n) entspricht, daß n = n+ = m + n− positive Schritte ausgeführt wurden. (ii) Die Mittelwerte hmi und hni. (iii) Die Schwankungen ∆m und ∆n. (iv) Die kontniuierliche Verteilung die sich im Limes großer N ergibt. Als physikalisches Beispiel betrachten wir ein eindimensionales Gitter bei dem auf jedem Gitterpunkt ein Spin-1/2 mit Betrag des magnetischen Moments µ0 sitzt. Wie wir später genauer verstehen werden nimmt die z-Komponente ~ = B~ez die Werte ~/2 mit Wahrdes Spins in einem äußeren Magnetfeld B scheinlichkeit p = c exp (−µ0 B/[kB T ]) und −~/2 mit Wahrscheinlichkeit q = c exp (µ0 B/[kB T ]) an. Dabei bezeichnet T die absolute Temperatur und kB ≈ 8.617 · 10−5 eV/K ist die sogenannte Boltzmannkonstante. Die Normierungskonstante c ist so zu bestimmen, daß p + q = 1. In diesem Beispiel gibt PN (m) die Wahrscheinlichkeit an, daß bei N Spins die Anzahl der zu B parallelen magnetischen Momente um m größer ist als die Zahl der antiparalellen (und damit ein Gesamtmoment mµ0 vorliegt). Ein weiteres physikalisches Beispiel in dem der random walk in zwei Dimensionen eine Rolle spielt ist die Brownsche Bewegung. Wir kehren nun zur abstrakten Sichtweise zurück und stellen die Frage nach der Wahrscheinlichkeit für eine bestimmte Abfolge von Schritten, z.B. den Fall (+1, −1, −1, +1, +1). Diese ergibt sich zu pqqpp = p3 q 2 . 2.2. GRUNDBEGRIFFE DER MATHEMATISCHEN STATISTIK 17 Es gibt natürlich weitere Wege, die bei N = 5 zu m = 1 bzw. n+ = n = 3 führen. Da sich diese Wege gegenseitig ausschließen, sind die Wahrscheinlichkeiten für diese zu addieren, wenn man P5 (1) bestimmen möchte. Da alle Wahrscheinlichkeiten gleich sind (es müssen immer 3 Vorwärtsschritte und 2 Rückwärtsschritte auftreten), müssen wir nur noch die Zahl der möglichen Abfolgen bestimmen. Es gibt 5! Möglichkeiten 5 Dinge aneinander zu reihen. Sind dabei 3 Dinge identisch, so unterscheinden sich die 3! Permutationen dieser Dinge nicht. Damit folgt für unser Beispiel, daß es 5!/(3!2!) = 10 verschiedene Wege mit m = 1 gibt. Die Wahrscheinlichkeit nach 5 Schritten zu m = 1 zu gelangen ist somit 5! 3 2 pq = P5 (1) = W5 (3) = 3!2! 5 3 2 pq 3 mit dem Binomialkoeffizienten 53 . Die obigen Überlegungen lasse sich sofort verallgemeinern und wir erhalten N n N −n PN (m) = WN (n) = p q , n n= N +m . 2 (2.1) Man bezeichnet diese Wahrscheinlichkeitsverteilung als die Binomialverteilung. Sie ist in den folgenden Abbildungen für p = q = 1/2 (links) und p = 1/4, q = 3/4 (rechts) dargestellt. 0.1 W50(n) W50(n) 0.1 0.05 0 0 10 20 n 30 40 50 0.05 0 0 10 20 n 30 40 50 In Gl. (2.1) kann n die Werte 0, 1, . . . , N annehmen. Damit gilt N X N X N n N −n WN (n) = p q = (p + q)N = 1 , n n=0 n=0 also die Normierungsbedingung. Wir wollen nun den Mittelwert hni und die Schwankung ∆n berechnen. Es 18 KAPITEL 2. GRUNDÜBERLEGUNGEN gilt N X N n N −n hn+ i = hni = n p q n n=0 N X N ∂ n N −n = p p q n ∂p q+p=1 n=0 ∂ = p (p + q)N = pN (p + q)N −1 q+p=1 ∂p q+p=1 = Np . Es gilt dabei zu beachten, daß man erst nach Ausführen der Ableitung q + p = 1 setzen darf. Völlig analog gilt hn− i = N q, woraus hmi = hn+ i − hn− i = N (p − q) folgt. Für die späteren Überlegungen ist es wichtig festzustellen, daß die Mittelwerte mit N anwachsen. Die Schwankung können wir auf ähnliche Art bestimmen. Wir berechnen zunächst N X 2 2 N n pn q N −n n = n n=0 ∂ ∂ ∂ N N −1 = p =p p (p + q) pN (p + q) ∂p ∂p ∂p q+p=1 2 q+p=1 2 = N p + N (N − 1)p = N pq + hni . Hieraus folgt ∆n = 2 1/2 p n − hni2 = N pq . Im Gegensatz zum Mittelwert, wächst die Schwankung nur mit relative Breite der Verteilung WN (n) folgt damit r ∆n q 1 N →∞ √ = −→ 0 hni p N √ N an. Für die Die relative Breite wird also mit wachsendem N immer kleiner und tendiert gegen Null. Betrachtet man somit statt der Variablen n = n+ (bzw. m) die Größe n/N (bzw. m/N ) für die hn/N i = p (bzw. hm/N i = p − q) gilt, so wird die Verteilung dieser im Limes N → √ ∞ scharf um den Mittelwert lokalisiert, genauer ihre Schwankungen gehen wie 1/ N gegen Null. Diese Beobachtung wird später eine zentrale Rolle in unseren Überlegungen spielen. Grob formuliert bedeutet dieses Ergebnis, daß die Schwankungen bei wachsendem N eine immer weniger wichtige Rolle spielen. In einem nächsten Schritt werden wir die Bedeutung der Gaußschen Verteilung kennenlernen. Wir wollen die Binomialverteilung Gl. (2.1) für kleine Abweichungen vom Mittelwert n − hni entwickeln. Da WN (n) Faktoren wie pn und n! 2.2. GRUNDBEGRIFFE DER MATHEMATISCHEN STATISTIK 19 enthält, die sehr stark von n abhängen (also stark variieren, wenn man n variiert) ist es besser diese Funktion nicht direkt zu entwickeln (dies würde zu schlechter Konvergenz führen), sondern ln WN (n) zu betrachten.3 Es gilt ln WN (n) = ln N ! − ln n! − ln (N − n)! + n ln p + (N − n) ln q . Für die Taylorentwicklung benötigen wir die Ableitungem dieses Ausdrucks nach n an der Stelle hni.4 Die Ableitung von ln n! nähern wir durch den Differenzenquotienten an, was eine gute Näherung für n 1 darstellt ln (n + 1)! − ln n! d ln n! ≈ = ln (n + 1) ≈ ln n . dn 1 Gilt hni = N p 1 und N − hni = N q 1, d.h. zusammengefaßt N pq 1, so können wir diese Näherung zur Bestimmung der Ableitung von ln n! und ln (N − n)! bei der Berechnung der Taylorkoeffizienten verwenden. Dies führt auf d ln WN (n) = [− ln n + ln (N − n) + ln p − ln q]n=hni = 0 . dn n=hni Für N pq 1 hat die Verteilung somit ein Maximum5 am Mittelwert. Für die zweite Ableitung gilt 1 1 d2 ln WN (n) 1 1 =− <0. = − − =− 2 dn n N − n n=hni N pq (∆n)2 n=hni Wir erhalten somit für n in der Nähe von hni (n − hni)2 3 ln WN (n) = ln WN (hni) − + O [n − hni] 2(∆n)2 und damit (n − hni)2 , WN (n) ≈ WN (hni) exp − 2(∆n)2 Gehen wir nun zu einer kontinuierlichen Variablen n über, so sollten sie die genäherte Verteilung als eine Gaußverteilung mit Mittelwert hni und Standardabweichung (Schwankung) ∆n erkennen. 3 Machen sie sich die Frage der Konvergenz der Funktion bzw. des Logarithmus der Funktion anhand des Beispiels f (n) = pn , mit einer Konstanten p klar! 4 Die Variable n ist natürlich zunächst nur für n ∈ N0 definiert. Man kann WN (n) aber auf reelle n erweitern, in dem man den Zusammenhang Γ(n + 1) = n! verwendet (siehe Übung). 5 Es ist anschaulich klar, daß es sich um ein Maximum handeln muß. Formal wird das durch die zweite Ableitung bestätigt. 20 KAPITEL 2. GRUNDÜBERLEGUNGEN Für eine große Zahl von Schritten N ergibt sich die Variable n in unserem Beispiel des eindimensionalen random walk als Summe einer großen Zahl von Zufallsvariablen. Es ist eine generelle Beobachtung (siehe die Literatur über Wahrscheinlichkeitstheorie), daß solche Summen unabhängiger Variablen für große N gegen eine Gaußverteilung (Normalverteilung) konvergieren (zentraler Grenzwertsatz). Man zeigt das am einfachsten mit Hilfe der sogenannten erzeugenden Funktion einer Wahrscheinlichkeitsverteilung, was nichts anderes als die FourierTransformierte der Verteilung ist. Für kontinuierliche Wahrscheinlichkeitsverteilungen P (x) ≥ 0 mit x ∈ I gilt Z 1 = P (x) dx , I Z hxi = x P (x) dx , I ∆x = 2.3 (x − hxi)2 1/2 . Die mikrokanonische Zustandssumme Nach diesem Ausflug in die Mathematik wollen wir nun den Begriff des Mikrozustands eines (Vielteilchen-) Systems genauer definieren. Der Mikrozustand muß eine vollständige mikroskopische Beschreibung des Systems liefern. Für eine Beschreibung von abgeschlossenen Systemen (keine Zeitabhängkeit des Hamitonoperators Ĥ) im Rahmen der Quantenmechanik wählen wir als Mikrozustände die Eigenzustände des (Vielteilchen-) Hamiltonoperators Ĥ mit Eigenwerten Er . Es gilt also Ĥ |ri = Er |ri. Es sollte klar sein, daß die Vielteilcheneigenzustände für ein System mit f Freiheitsgraden in dem die Wechselwirkung der Konstitutenen vernachlässigt wird, von f Quantenzahlen nj abhängt. Beispiele dafür sind das ideale Gas und das oben erwähnte ideale Spinsystem die sie in den Übungen genauer diskutieren werden. Durch die Angabe von r = (n1 , n2 , . . . , nf ) wird damit der Mikrozustand eindeutig festgelegt. Wir können davon ausgehen, daß die Quantenzahlen diskret sind. Im Beispiel des idealen Gases aus Atomen ergibt sich dieses dadurch, daß wir das abgeschlossenen System zunächst in ein endliches Volumen einschließen. Für die späteren Überlegungen ist es wichtig festzuhalten, daß es bei fest vorgegebener Energie eine endliche Anzahl von Mikrozuständen gibt. In der klassischen Mechanik wird der Mikrozustand eines abgeschlossenen Systems durch die Angabe der verallgemeinerten Koordinaten (q1 , q2 , . . . , qf ) und verallgemeinerten Impulsen (p1 , p2 , . . . , pf ) zu einer beliebigen Zeit, d.h. r̃ = (q1 , q2 , . . . , qf ; p1 , p2 , . . . , pf ) 2.3. DIE MIKROKANONISCHE ZUSTANDSSUMME 21 also einem Punkt im 2f -dimensionalen Phasenraum festglegt. Für das klassische ideale Gas mit N Konsitutenten gilt z.B. r̃ = (~r1 , . . . , ~rN ; p~1 , . . . , p~N ). Im Gegensatz zum quantenmechanischen Fall stehen auf der rechten Seite der Definition von r̃ im klassischen Fall kontinuierliche Größen. Für eine statistische Beschreibung müssen wir die Mikrozustände jedoch abzählen können.6 Dies kann auch im klassischen Fall gelingen, wenn wir uns, zunächst für f = 1, an die Unschärferelation ∆p ∆q ≥ ~/2 erinnern und daran, daß die klassische Mechanik ein Grenzfall der Quantenmechanik ist. Ein quantenmechanischer (Einteilchen-) Zustand steht im Einklang mit der Unschärferelation und nimmt daher im Phasenraum eine “Fläche” von der Gößenordnung ~ ein. Aufgrund der Quantenmechanik ist es also nicht möglich den Zustand im Phasenraum genauer als auf eine “Fläche” der Größenordnung ~ festzulegen. Daher teilen wir den Phasenraum bei f Freiheitsgraden in Zellen von der Größenordnung ~f ein. Diese Zellen lassen sich nun nummerieren. Die zunächst kontinuierlichen Zustände werden damit abzählbar. Wie wir später sehen werden, spielt (im Rahmen der klassischen statistischen Mechanik) der genaue Vorfaktor bei der Wahl des Phasenraumvolumens keine Rolle. Betrachtet man typische einfache Quantensysteme wie den harmonischen Oszillator oder das Teilchen im (unendlich hohen) Potentialtopf, so gibt es pro “Phasenraumfläche” 2π~ gerade einen Quantenzustand. Wir wählen daher für die Zellengröße (2π~)f . Nach diesem durch die Quantenmechanik motivierten “coarse graining” des Phasenraums wird der Mikrozustand eines Systems r in der klassischen Mechanik somit durch die Angabe der Zelle des Phasenraums festgelegt, in der die verallgemeinerten Koordinaten und Impulse des Systems liegen. Die Zahl der zugänglichen Zellen läßt sich zählen. Bereits vor der Entwicklung der Quantenmechanik wurde in der klassischen statistischen Mechanik die Einteilung des Phasenraums in Zellen verwendet. Dem lag die Vorstellung zu Grunde, daß die Zahl der Zustände proportional zum betrachteten Phasenraumvolumen ist. Die Größe der Phasenraumzelle blieb dabei offen, was jedoch kein Problem darstellt, da die wesentlichen Ergebnisse, wie oben bereits erwähnt, von dieser unabhängig sind. Wie bereits oben wiederholt diskutiert, wird es für ein Vielteilchensystem mit mehr als 1023 Freiheitsgraden im Allgemeinen nicht möglich sein, den Mikrozustand anzugeben. Für unsere statistischen Betrachtungen ist dieses aber auch nicht erforderlich. Es ist dagegen zentral festzustellen, welche Mikrozustände in unserem Ensemble (replizierte Systeme) überhaupt auftreten und mit welchem statistischen Gewicht. In diesem Fall beschreiben wir den Makrozustand des Systems durch die Angabe der Wahrscheinlichkeiten Pr für das Auftreten des Mikrozustands r. Die Wahrscheinlichkeit ist dabei zu verstehen als die relative Häufigkeit des Auftretens im Ensemble im Limes eines unendlich großen Ensembles. Damit wird ein Makrozustand durch das statistische Ensemble repräsentiert. 6 Wie wir später sehen werden, müssen wir z.B. die Frage beantworten können, wieviele Zustände es bei vorgegebener Energie gibt. 22 KAPITEL 2. GRUNDÜBERLEGUNGEN Wir betrachten nun ein abgeschlossenes System. Nach dem obigen Überlegungen befindet sich dieses im Gleichgewicht und makroskopische Observable (z.B. der Druck) nehmen zeitunabhängige Werte an. Wir stellen ein der statistischen Beschreibung zugrunde liegendes Postulat auf. Postulat: Ein abgeschlossenes System im Gleichgewicht ist mit gleicher Wahrscheinlichkeit in jedem seiner zugänglichen Mikrozustände. Solange keiner der Mikrozustände ausgezeichnet ist, ist dieses eine plausible Annahme. Die sich aus dieser “Hypothese” ableitbaren, empirisch überprüfbaren Aussagen stellen eine Verifikation des Postulats dar. Zur Illustration betrachten wir ein System aus vier “idealen” Spins in einem äußeren Magnetfeld der Stärke B in z-Richtung. Die Energie ist dann durch Er = −2µ0 B 4 X sz,ν , ν=1 mit dem Bohrschen Magneton µ0 , gegeben, wobei sz,ν die Werte ±1/2 annehmen kann. Im betrachteten Gleichgewichtszustand sei E = −2µ0 B. Damit kann das System in eime der vier mögliche Mikrozustände r = (↑, ↑, ↑, ↓) , (↑, ↑, ↓, ↑) , (↑, ↓, ↑, ↑) , (↓, ↑, ↑, ↑) sein. Gemäß des oben formulierten Postulats gilt, daß Pr = 1/4 für die vier obigen Mikrozustände und Pr = 0 für alle anderen. Wir wollen das Postulat als nächstes in eine allgemeine mathematische Form bringen. In der jetzigen Form kann es durch const. alle zugänglichen Zustände Pr = 0 alle anderen Zustände ausgedrückt werden. Wir müssen nun noch spezifizieren, was wir mit “zugänglich” meinen.7 Ein Hamiltonoperator bzw. eine Hamiltonfunktion hängt neben den Koorrdinaten und Impulsen oft von zusätzlichen äußeren Parametern a = (a1 , a2 , . . . , an ) ab. Im Fall des Gases sind dies z.B. die Teilchenzahl und das Volumen. Welche äußeren Parameter zu berücksichtigen sind hängt von der betrachteten Situation ab. Im Allgemeinen wird auch der Mikrozustand von den äußeren Parametern abhängen. Wir wollen zunächst nur Fälle studieren, in denen a zeitlich konstant ist. Die Zugänglichkeit eines Mikrozustandes hängt eng mit der Frage von Erhaltungsgrößen eines mechanischen oder quantenmechanischen Systems zusammen. Die möglichen Mikrozustände müssen mit den Erhaltungsgrößen kompatibel sein. Von besonderer Bedeutung im Fall abgeschlossener Systeme ist die Energie E. Für alle zugänglichen Mikrozustände muß daher 7 Im obigen Beispiel des Spinsystems war dieses durch die Angabe der Energie festgelegt. 2.3. DIE MIKROKANONISCHE ZUSTANDSSUMME 23 Er = E gelten, wobei die Energie eines Mikrozustands von den äußeren Parametern abhängen wird, also Er = Er (a) gilt. Im quantenmechanischen Fall ist Er (a) der Energieeigenwert. Für klassische Mikrozustände folgt Er (a) aus der Hamiltonfunktion Er (a) = H(q, p; a) mit r = (q, p).8 Da die äußeren Bedingungen (z.B. die Gefäßform) die zu weiteren möglichen Erhaltungsgrößen (z.B. Impuls und Drehipuls) gehörenden Symmetrien brechen, spielen diese generisch keine Rolle. Damit sind im Sinne des obigen Postulats die Mikrozustände zugänglich, für die Er (a) gleich der erhaltenen Energie ist. Die Größe X Ω(E, a) = 1 (2.2) r:E≤Er (a)≤E+δE bezeichnen wir als die mikrokanonische Zustandssumme. Dabei geht die Summe über die verschiedenen (zugänglichen) Mikrozustände r. Sie gibt die Zahl der Mikrozustände an, deren Energie im Intervall [E, E + δE] liegt. Wir nähern uns damit dem in Kapitel 2.1 formulierten Ziel an, ein quantitatives Maß für die Zahl möglicher (zugänglicher) Mikrozustände zu entwickeln. Makroskopisch betrachtet soll δE klein sein, d.h. es gilt δE/E 1. Mikroskopisch betrachtet soll δE dagegen hinreichend groß sein, also z.B. sehr viel größer als die Energie eines Konstituenten des Vielteilchensystems. Damit enthält das Summationsintervall viele zugängliche Mikrozustände. Die Zustandsumme ist sowohl für quantenmechanische als auch klassischen Mikrozustände definiert. Im klassischen Fall wird jede zugängliche Phasenraumzelle im obigen Sinne (“coarse graining”) als ein Zustand gezählt. Damit bekommt das obige Postulat die mathematische Form 1 E ≤ Er (a) ≤ E + δE Ω(E,a) , (2.3) Pr = Pr (E, a) = 0 sonst wobei die Zustände mit Energie im Intervall [E, E+δE] zugänglich sind. Das statistische Ensemble besteht somit aus einer großen Zahl M von Systemen, von denen Mr = M Pr im Mikrozustand r sind. Man bezeichnet das betrachtete Ensemble als das mikrokanonische Ensemble. Physikalisch ist dieses dadurch definiert, daß das System isoliert und die Energie vorgegeben ist. Später werden wir weitere Ensembles kennen lernen, z.B. eines, bei dem man davon ausgeht, daß nicht die Energie, sondern durch Wechselwirkung mit einem Wärmebad die Temperatur vorgegeben ist. Gemäß der obigen Überlegung ist der Makrozustand eines Systems durch die Angabe der Pr festgelegt. Im mikrokanonischen Ensemble gilt Pr = Pr (E, a) = Pr (E, a1 , . . . , an ). Der Makrozustand ist daher durch die Größen (E, a1 , . . . , an ) definiert. Alle makroskopischen Größen, die im Gleichgewichtszustand festgelegt 8 Die Größen q bzw. p stehen für alle qi und pi . 24 KAPITEL 2. GRUNDÜBERLEGUNGEN sind nennen wir Zustandsgrößen. Dazu gehören also offensichtlich (E, a1 , . . . , an ) aber zusätzlich alle Größen, die Funktionen dieser sind fi (E, a1 , . . . , an ). Anstelle von (E, a1 , . . . , an ) kann der Makrozustand auch durch n+1 andere geeignete Zustandsgrößen (f1 , . . . , fn+1 ) festgelegt werden. Wie sie Bereits aus dem Thermodynamikteil der Experimentalphysik wissen sollten, kann man z.B. den Zustand eine idealen klassischen Gases durch E, das Volumen V und N oder die Temperatur T , den Druck P und N festlegen. Die zur Charakterisierung ausgewählten Zustandsgrößen nennt man Zustandsvariable. Durch den Übergang vom Mikrozum Makrozustand haben wir die Zahl der Variablen drastisch reduziert. Einfachheitshalber wollen wir für die folgende Überlegung ein quantenmechanisches System betrachten. In Gl. (2.2) wählen wir die Energie E so, daß keiner der diskreten Energieeigenwerte Er des Systems dieser genau entspricht. Damit geht Ω(E, a) für δE → 0 gegen Null. In einer Taylorentwicklung von Ω(E, a) um δE = 0 herum gilt Ω(E, a) = ρ(E, a) δE + O([δE]2 ) , (2.4) wobei ρ(E, a) nicht von δE abhängt. Definieren wir Φ(E, a) als die Zahl der Mikrozustände deren Energie kleiner gleich E ist, so können wir schreiben Ω(E, a) = Φ(E + δE, a) − Φ(E, a) ≈ dΦ(E, a) δE = ρ(E, a) δE . dE Aufgrund dieser Relation bezeichnte man ρ(E, a) als Zustandsdichte. Bevor wir uns Gedanken über die Energieabhängigkeit von Ω(E, a) und Φ(E, a) für ein allgemeines System machen, wollen wir zunächst exemplarisch die mikrokanonische Zustandssumme des idealen (einatomigen) Gases berechnen. 2.4 Die Zustandssumme des idealen Gases Zur Berechnung der mikrokanonischen Zustandssumme eines quantenmechanischen Systems müssen wir zunächst den Hamiltonoperator Ĥ aufstellen. Wir gehen davon aus, daß sich das Gas von N identischen Teilchen der Masse m in einem Behälter mit Volumen V befindet. Damit hängt Ĥ von den äußeren Parametern N und V ab. Wir betrachten die Situation eines einatomigen Gases, so daß wir in diesem die Vibrations- und Rotationsfreiheitsgrade, wie sie für ein Gas aus Molekülen wichtig sein könnten, nicht berücksichtigen müssen. Im Sinne der Definition des Begriffs “ideal” vernachlässigen wir die Wechselwirkung der Atome untereinander und mit der Wand des Gefäßes. Weiterhin werden wir die inneren elektronischen Freiheitsgrade des Atoms nicht berücksichtigen. Typische elektronische Anregungen eines Atoms sind von der Größenordnung Elektronenvolt. Ein Elektronenvolt entspricht einer Temperatur von 104 K, so daß innere Anregungen des Atoms bei Raumtemperatur in guter Näherung vernachlässigt 2.4. DIE ZUSTANDSSUMME DES IDEALEN GASES 25 werden können.9 Der Hamiltonoperator des N -Teilchensystems ist dann durch Ĥ(V, N ) = N X ν=1 " # 2 N X p~ˆν ˆ + V (~xν ) = ĥν (V ) 2m ν=1 gegeben, wobei ~xˆν den Orts- und p~ˆν den Ortsoperator des ν-ten Teilchens bezeichnet. Die Einteilchenoperatoren (also auch ĥν ) sind als Operatoren auf dem Tensorproduktraum zu verstehen (siehe die Vorlesung Theoretische Physik III). Gemäß unserer Annahmen ist das Potential V (~x) null im Inneren des Volumens und unendlich außerhalb. Wir betrachten daher das Problem des “Teilchens im unendlich hohen Potentialtopf”. Wie sie in einer Übunsgaufgabe gezeigt haben, ist der Mikrozustand durch die Angabe von 3N Quantenzahlen r = (n1 , . . . , n3N ), mit nk = 1, 2, . . . gegeben. Er hat die Energie 3N N X X π 2 ~2 2 p~ν2 = n , Er (N, V ) = 2 k 2m 2mL ν=1 k=1 wobei wir uns auf einen kubischen Potentialtopf mit Volumen V = L3 beschränkt haben. Wir wollen nun zunächst die Zahl der verschiedenen Zustände Φ(E, V, N ) = X 1 r:Er (V,N )≤E mit Energie kleiner gleich E bestimmen. Die Summe über r übersetzt sich in eine Mehrfachsumme über n1 = 1, 2, . . ., n2 = 1, 2, . . ., . . ., n3N = 1, 2, . . . (natürlich unter der Nebenbedingung Er ≤ E). Dabei müssen wir jedoch berücksichtigen, daß die Teilchen ununterscheidbar sind und wir so einen Faktor N ! zu viele Mikroszustände zählen. Wir müssen also durch N ! teilen. Wir wollen diese Summe im klassischen Limes ausführen, in dem die typischen Impulse der Teilchen viel größer als der quantenmechanische Minimalwert ~/L sind. Die Ununterscheidbarkeit der Teilchen führt dazu, daß sich die Bedingung an den klassischen Limes verschärft (siehe später); der typische Impuls muß sehr viel Größer als N 1/3 ~/L sein. Für gewöhnliche Gase ist auch diese Bedingung 9 In dieser Argumentation bin ich davon ausgegangen, daß ihnen die Kelvin-Skala der absoluten Temperatur aus der Experimentalphysik I bekannt ist. 26 KAPITEL 2. GRUNDÜBERLEGUNGEN (bei Raumtemperatur) erfüllt.10 Damit gilt X Φ(E, V, N ) = 1 r:Er (V,N )≤E ∞ X ∞ X 1 = ... 1 N ! n =1 n =1 |1 {z 3N } Er ≤E Z ∞ Z ∞ 1 1 dn3N 1 dn1 . . . ≈ N ! 23N −∞ −∞ | {z } N V 1 = N ! (2π~)3N Z Er ≤E ∞ dp1 . . . −∞ | {z P3N k=1 1 1 = N ! (2π~)3N Z Z −∞ p2k ≤2mE ∞ Z dp1 . . . −∞ | {z P3N k=1 ∞ dp3N 1 } ∞ dp3N −∞ } Z L Z L dx3N 1 . . . . dx1 . . . 0 0 p2k ≤2mE Bis auf den Faktor 1/N ! ist der Ausdruck in der letzten Zeile derjenige, den wir gemäß unseren obigen Überlegungen zum Zählen von Mikrozuständen in der klassischen statistischen Mechanik hingeschrieben hätten – Integral über der Phasenraum mit den Einschränkungen Er ≤ E und 0 ≤ xk ≤ L (aufgrund des Behälters) unter der Berücksichtigung des Zellenvolumens (“coarse graining”) (2π~)3N . Der Faktor 1/N ! kommt hinzu, da wir oben die Ununterscheidbarkeit nicht berücksichtigt haben. Wie nicht anders zu erwarten, liefert also die Betrachtung des klassischen Limes ausgehend vom quantenmechanischen Ausdruck dasselbe Resultat, wie die direkte Rechnung für das klassische ideale Gas. Die Integration in der vorletzten Zeile des obigen Ausdrucks für Φ(E, V, N ) entspricht√der Bestimmung des Volumens einer 3N -dimensionalen Kugel mit Radius R = 2mE. Dieses Volumen ist proportional zu R3N , so daß wir Φ(E, V, N ) = c̃(N ) 1 V N E 3N/2 , N ! (2π~)3N mit dem E- und V -unabhängigen Vorfaktor c̃(N ) erhalten. Um diesen zu bestimmen, müssen wir das Volumen VK der 3N -dimensionalen Kugel mit Radius R genauer auswerten π 3N/2 3N 1 VK = R ≈√ (3N/2)! 3πN 10 2πe 3 3N/2 R2 N 3N/2 , Lange bevor die Bedingung verletzt ist, kondensiert ein Gas aus den meisten Atomsorten. 2.4. DIE ZUSTANDSSUMME DES IDEALEN GASES 27 wobei wir die Stirlingsche Formel verwendet haben (siehe Übung). Erneute Verwendung dieser für den Faktor 1/N ! liefert cN Φ(E, V, N ) = √ 3πN V N N E N 3N/2 , mit einer (dimensionsbehafteten) Konstanten c (die die Masse m, die Eulersche Zahl e und numerische Faktoren enthält). Mit ρ(E, V, N ) = dΦ(E, V, N )/dE folgt für die mikrokanonische Zustandssumme N 3N/2−1 V E 3 cN δE . Ω(E, V, N ) = √ 2 3πN N N Wir betrachten nun E 3N V ln + ln Ω(E, V, N ) = N ln c + N ln N 2 N 3 δE + ln √ + ln E/N 12πN V 3N E ≈ N ln c + N ln + ln . N 2 N Die zweite Zeile folgt dabei im Limes sehr großer N . Diese Überlegung zeigt, daß ln Ω(E, V, N ) ≈ ln Φ(E, V, N ) ⇒ Ω(E, V, N ) ≈ Φ(E, V, N ) . In Worten sagt dieses Ergebnis, daß die Gesamtheit aller Zustände mit Energie kleiner gleich E in einer dünnen Schale der Dicke δE unterhalb der Oberfläche (die durch E definiert wird) liegt, wenn der 3N -dimensionale Zustandsraum im Limes großer N betrachtet wird.11 Dieses Ergebnis zeigt auch, daß die Abhängigkeit von Ω(E, V, N ) von δE (ist linear; siehe Gl. (2.4)) verglichen mit der von E extrem schwach ist. Für die mikrokanonische Zustandssumme des idealen Gases gilt damit (im Limes großer N ) 3N E V + ln . ln Ω(E, V, N ) = N ln c + N ln N 2 N Wir wollen diese Überlegungen über die Zahl der zugänglichen Zustände nun verallgemeinern und abschätzen, wie Ω(E) und Φ(E) von der Energie E abhängen. Wir nehmen an, daß jeder der f Freiheitsgrade durch eine Quantenzahl beschrieben wird. Jeder Quantenzahl ist eine Teilenergie der Gesamtenergie 11 Anders gesagt: Wenn N sehr groß ist, liegt der wesentliche Beitrag zum Volumen einer N -dimensionalen Kugel mit Radius R in einer dünnen Schale unter der Oberfläche. 28 KAPITEL 2. GRUNDÜBERLEGUNGEN E zugeordnet. Mit φ() bezeichnen wir die Gesamtzahl der möglichen Werte der “Einfreiheitsgrad”-Quantenzahl, wenn der Energiewert kleiner gleich ist. Dieser Wert wird eins, wenn die Energie den kleinst möglichen Wert 0 erreicht. Mit wachsendem wird φ im Allgemeinen zunehmen. Sollte das System nur eine endliche Zahl von Zuständen haben (z.B. Spinsystem), dann saturiert φ bei großen Energien. Bleiben wir hinreichend weit weg von der größtmöglichen Energie (sollte diese existieren), so gilt näherungsweise φ() ∼ ( − 0 )α , mit einer Zahl α von der Größenordnung eins. Als Beispiel sei das oben diskutierte ideale Gas genannt, bei dem α = 1/2 gilt, was man sofort sieht, wenn man das oben bestimmte Φ auf den Fall mit einem Freiheitsgrad einschränkt. Für eine grobe Abschätzung der Zustände des Systems mit f Freiheitsgraden können wir E − E0 ≈ f ( − ) setzen und erhalten Φ(E) ≈ [φ()]f . Damit folgt Ω(E) = dΦ(E) δE dE dφ() δE dE dφ() = [φ()]f −1 δE . d ≈ f [φ()]f −1 Nimmt nun E zu, so nimmt auch die mittlere Energie pro Freiheitsgrad zu, wenn auch langsam. Da wir aber [φ()]f −1 ≈ [φ()]f mit einer sehr großen Zahl f bilden, nehmen Ω(E) und Φ(E) extrem rasch mit E zu. Damit gilt für jedes gewöhnliche System Φ(E) ≈ Ω(E) ∼ (E − E0 )f wenn wir hinreichend weit von einer womöglich existierenden Maximalenergie weg bleiben. Wie im Beispiel des idealen Gases ist die Abhängigkeit von Ω(E) von E sehr viel stärker, als die von δE (linear). 2.5 Nebenbedingungen, Gleichgewicht, Irreversibilität Nachdem wir nun ein quantitatives Maß für die Zahl von Zuständen, die unter einem Satz von Nebenbedingungen (E, a) realisierbar sind, eingeführt haben, 2.6. DER ERSTE HAUPTSATZ DER THERMODYNAMIK 29 können wir unsere Überlegungen aus Kapitel 2.1 zur Relaxation ins Gleichgewicht und zur Irreversibilität quantifizieren. Ist das abgeschlossene System im Gleichgewicht, so ist die Wahrscheinlichkeit für das Auftreten jedes der Ω(E, a) realisierbaren Mikrozustände im Ensemble gleich groß. Ist im Gegenzug die Wahrscheinlichkeit nicht gleich groß, so ist die statistische Situation nicht zeitunabhängig. das System wird sich zeitlich entwickeln, bis alle realisierbaren Zustände gleichwahrscheinlich sind. Betrachten wir ein abgeschlossens System, welches sich unter den makroskopischen Nebenbedingungen (E, a1 , . . . , an ) im Gleichgewicht befindet, z.B. ein ideales Gas im Volumen Va . Heben wir nun eine der Nebenbedingungen a auf, vergrößern wir also z.B. das Volumen von Va zu Ve durch herausziehen einer Trennwand, so wird die Zahl der dann realisierbaren Zustände Ωe im Allgemeinen sehr viel größer sein als Ωa .12 Unmittelbar nach dem Ändern der Nebenbedingung herrscht im Ensemble offensichtlich keine Gleichverteiling der Wahrscheinlichkeit über die jetzt möglichen Ωe Mikrozustände. Das System wird sich zeitlich entwickeln bis alle Ωe Zustände mit gleicher Wahrscheinlichkeit vorliegen und somit ein neues Gleichgewicht erreicht ist. Wurde der Gleichgewichtszustand erreicht, so unterscheidet sich die Endverteilung deutlich von der Anfangsverteilung. Der anfängliche Zustand des Ensembles kann nicht einfach wieder dadurch hergestellt werden, in dem wir die Nebenbedingung wieder einführen (also z.B. die Trennwand wieder einführen) und dabei das Gesamtsystem isoliert lassen (kein Austauch von Energie mit einem weiteren System). Man nennt solch einen Prozeß mit Ωe > Ωa daher irreversibel. Anstatt, wie in Kapitel 2.1, die Irreversibilität anhand der zeitlichen Entwicklung eines Systems zu charakterisieren, haben wir dieses jetzt im Rahmen unserer Ensemble-Beschreibung getan. Wir können nun ebenfalls die sehr qualitative Diskussion des Strebens eines Systems von einem “geordneten” (“weniger zufälligen”) in einen “ungeordneten” (“zufälligeren”) Zustand aus Kapitel 2.1 quantifizieren. Als statistisches Maß für die Zufälligkeit können wir die Zahl der Mikrozustände heranziehen. Der Prozeß, in dem ein isoliertes System nach Aufheben einer Nebenbedingung ein neues Gleichgewicht erreicht, resultiert aus Ωe > Ωa . 2.6 Der erste Hauptsatz der Thermodynamik In diesem Anschnitt wollen wir die in Kapitel 2.1 ebenfalls recht qualitativ diskutierte Wechselwirkung zwischen makroskopischen Systemen genauer untersuchen. Wir betrachten also wieder zwei Systeme A und A0 die zusammengenommen ein abgeschlossenes System, mit erhaltener Energie, bilden. Im Rahmen der statistischen Beschreibung replizieren wir das Gesamtsystem und betrachten sehr viele Systempaare. Nicht in jedem Systempaar des Ensembles wir die Gesamtenergie Eg vor der Wechselwirkung auf gleiche Weise auf A und A0 aufgeteilt sein. Analog 12 Die Energie soll beim Aufheben der Nebenbedingung konstant gleich E bleiben. 30 KAPITEL 2. GRUNDÜBERLEGUNGEN wird die Wechselwirkung zwischen A und A0 für gewöhnlich nicht in jedem Systempaar des Ensembles den exakt gleichen Energietransport (sei es Arbeit oder Wärme) zwischen A und A0 bewirken. Wir können jedoch die Wahrscheinlichkeit für den Transport eines bestimmten Energiebetrags und damit den Mittelwert bestimmen. Wir betrachten die Mittelwerte der Energien hEa i, hEa0 i, hEe i und hEe0 i der Teilsysteme bevor (“a”) sie in Kontakt gebracht wurden und nachdem (“e”) der Kontakt hergestellt wurde und sich ein neuer Gleichgewichtszustand eingestellt hat. Für diese gilt hEa i + hEa0 i = hEe i + hEe0 i = Eg . Entsprechend gilt ∆ hEi + ∆ hE 0 i = 0 , wobei ∆ hEi = hEe i − hEa i und analog für A0 . Bei einer thermischen Wechselwirkung werden nun alle äußeren makroskopischen Parameter konstant gehalten, d.h. die (quantenmechanischen) Energieniveaus der Teilsysteme ändern sich nicht. Für die von A absorbierte Wärmemenge Q gilt dann Q = ∆ hEi und analog für A0 . Aufgrund der Energieerhaltung gilt Q = −Q0 . Die Energie wird nicht deshalb zwischen den Teilsystemen transferiert, weil sich die Energien der möglichen Quantenzustände geändert hätte (diese bleiben gleich, da die makroskopischen Parameter gleich bleiben), sondern weil nach dem Energieaustausch eine größere Zahl von erreichbaren Zuständen für das Gesamtsystem existiert. Zwei Teilsysteme sind adiabatisch voneinander getrennt, wenn sie untereinander keine Energie austauschen können, solange ihre äußeren Parameter konstant gehalten werden. Sind zwei Teilsysteme gegeneinander Wäremisoliert, so können sie weiterhin in Wechselwirkung stehen und Energie austauschen, falls sich äußere Parameter im Laufe dieses Prozesses ändern. Einen Prozeß, bei dem sich äußere Parameter ändern und keine Wärme ausgetauscht wird, nennt man adiabatischen Prozeß, die zugehörige Wechselwirkung der Teilsysteme nennt man adiabatische Wechselwirkung. Die Zunahme der mittleren Energie eines adiabatisch isolierten Systems ist die an dem System verrichtete makroskopische Arbeit W . Es gilt W = −W 0 . Da sich im Laufe des adiabatischen Prozesses einige der äußeren Parameter ändern, ändern sich für gewöhnlich auch einige der Energieniveaus der Teilsysteme. Die mittlere Energie ändert sich dann dadurch, daß sowohl die Energieniveaus sich ändern, als auch die Wahscheinlichkeit sich ändert, daß ein System sich in einem solchen Zustand befindet (Übergänge zwischen Mikrozuständen während der Wechselwirkung). Normalerweise wir die Wechselwirkung zwischen zwei Teilsysteme eines abgeschlossenen Gesamtsystems weder ein adiabatischer Prozeß sein, noch werden die 2.7. VOLLSTÄNDIGE DIFFERENTIALE 31 äußeren Parameter konstant bleiben. Die gesamte mittlere Energieänderung des Teilsystems A kann dann als ∆ hEi = W + Q (2.5) geschrieben werden. Diese Aufteilung ist dann sinnvoll, wenn die beiden Teilbeträge experimentell getrennt gemessen werden können. Man nennt diesen Zusammenhang den ersten Hauptsatz der Thermodynamik. Wir haben ihn hier im Rahmen unserer auf der Mikroskopik beruhenden statistischen Herangehensweise hergeleitet. Ein Wechselwirkungsprozeß ist besonders einfach darzustellen, wenn er infinitesimal ist. Dabei wird das Teilsytem von einem Anfangs- in einen Endmakrozustand gebracht, die sich beide nur infinitesimal unterscheiden. Für die infinitesimale Zuwachs der mittleren Energie schreiben wir d hEi. Für die am Teilsystem verrichtete infinitesimale Arbeit führen wir das Symbol d¯W ein. Es ist wichtig festzuhalten, daß sich d hEi und d¯W konzeptionell unterscheiden und deshalb eine andere Bezeichnung tragen (“d” versus “d¯”). Die infinitesimale Arbeit kann (i) nicht als Differenz zweier Arbeitsbeträge verstanden werden. (ii) Damit im Zusammenhang steht, daß die Arbeit keine Zustandsgröße ist. (iii) Bei der infinitesimalen Arbeit handelt es sich nicht um ein vollständiges Differential (siehe weiter unten). Diese drei Eigenschaften der Arbeit bzw. der infinitesimale Arbeit stehen im Gegsatz zu denen der mittleren Energie bzw. der infinitesimalen Änderung der selben. Analog zur infinitesimalen Arbeit verhält es sich mit der absorbierten infinitesimalen Wärme, die wir daher konsistent mit d¯Q bezeichnen. Die infinitesimale Version des ersten Hauptsatz lautet daher d hEi = d¯W + d¯Q . (2.6) Im folgenden Kapitel werden wir uns weitere Gedanken zum Unterschied von “d” und “d¯” machen. 2.7 Vollständige Differentiale Sei F = F (x, y) eine Funktion von zwei Variablen. Geht man von (x, y) zu (x + dx, y + dy), so ändert sich der Wert von F um dF = F (x + dx, y + dy) − F (x, y) = ∂F (x, y) ∂F (x, y) dx + dy . ∂x ∂y Die partiellen Ableitungen sind dabei im Allgemeinen weiterhin Funktionen von x und y. Die infinitesimale Größe dF ist dann ein vollständiges Differential. Das Linienintegral über dF hängt nur vom Anfangs- und Endpunkt ab, nicht jedoch von den Details des Weges. Es sollte klar sein, daß nicht jede infinitesimale Größe ein vollständiges Differential ist. Betrachten wir z.B. d¯G = G1 (x, y)dx + G2 (x, y)dy . (2.7) 32 KAPITEL 2. GRUNDÜBERLEGUNGEN Im Allgemeinen wird es nun nicht so sein, daß es einen Funktion G(x, y) gibt für den G(x + dx, y + dy) − G(x, y) mit der rechten Seite von Gl. (2.7) übereinstimmt. Ebenfalls wird das Integral von Gl. (2.7) über einen Weg in der (x, y)-Ebene im Allgemeinen von den Details des Weges abhängen (und nicht nur vom Anfangsund Endpunkt). Im Abschnitt zur Thermodynamik werden wir nocheinmal genauer auf die mathematischen Eigenschaften eines vollständigen Differentials eingehen. Wir haben bereits das Konzept der Zustandsgrößen eingeführt. Es handelt sich dabei um die makroskopischen Größen, die im Gleichgewichtszustand festgelegt sind. Bei der Diskussion der mikrokanonischen Zustandssumme haben wir den Satz von Zustandsgrößen E, V und N genannt, mit deren Hilfe man den Makrozustand eindeutig festlegt (dann Zustandsvariablen). Andere Zustandsgrößen, wie z.B. der Druck sind dann aus E, V und N berechenbar.13 In allgemeineren Betrachtungen (Ensembles) wird nicht die Energie, sondern der Ensemblemittelwert hEi eine Zustandsgröße sein. Damit ist klar, daß eine Größe wie dp, als infinitesimale Differenz zweier wohldefinierter Größen, ein vollständiges Differential ist. Gleiches gilt für die mittlere Energie hEi. Die übertragene mittlere Energie ist eine Funktion der betrachteten Makrozustände, hängt also nur vom Anfangs- und Endzustand ab, nicht jedoch davon, entlang welchen Weges der Wechselwirkungsprozeß abgelaufen ist. Betrachtet man dagegen die beim Übergang vom Anfangs- zum Endzustand geleistete Arbeit, so ist diese im Allgemeinen keine Differenz zwischen zwei Größen, die sich auf benachbarte Makrozustände beziehen. Es macht keinen Sinn einem Makrozustand eine bestimmte Arbeit zuzuordnen. Die infinitesimale Arbeit ist kein vollständiges Differential und die bei einem Wechselwirkungsprozeß geleistete Arbeit hängt vom Weg den der Prozeß genommen hat ab. Da die geleistete Arbeit vom Weg abhängt, nicht jedoch die übertragene Energie, muß nach Gl. (2.5) auch die übertragene Wärme vom Weg abhängen. Damit ist auch die infinitesimale übertragene Wärme kein vollständiges Differential. Erneut mach es keinen Sinn einem Makrozustand eine bestimmte Wärme zuzuordnen. 2.8 Quasistatische Prozesse Im letzten Abschnitt haben wir die Wechselwirkung zwischen zwei Systemen untersucht. Wir wollen folgend eine spezielle Klasse solcher Wechselwirkungsprozesse beschreiben, die besonders einfach ist. Diese zeichnet sich dadurch aus, daß die Geschwindigkeit mit der die äußeren Parameter verändert werden, bzw. die Wärmezufuhr stattfindet sehr klein ist. Um dieses “sehr klein” zu spezifizieren, führen wir zwei Zeitskalen ein. Auf der einen Seite steht die Zeitskala τvar auf der die äußeren Parameter variiert werden bzw. die Wärme zugeführt wird, auf 13 Im nächsten Abschnitt werden wir den Druck als Funktion der Energie und des Volumens für das ideale Gas bestimmen, bei dem die Teilchenzahl fest ist. 2.8. QUASISTATISCHE PROZESSE 33 der anderen die systemabhängige Skala τrel die ein System benötigt, um nach einer Veränderung in einen neuen Gleichgewichtszustand zu relaxieren. Man nennt einen Wechselwirkungsprozeß quasistatisch, wenn τvar τrel (der Prozeß verläuft hinreichend (“unendlich”) langsam). Während der quasistatische Prozeß abläuft stellt sich somit immer wieder ein Gleichgewichtszustand ein. Genauer durchläuft das System eine Reihe von Gleichgewichtszuständen. Weiterhin sind die Änderungen der äußeren Parameter a so langsam, daß durch sie keine Übergänge zwischen den quantenmechanischen Mikrozuständen auftreten. Damit folgt der Mikrozustand r = r(a) von A einfach der Änderung von a. Wir haben soeben explizit davon gebrauch gemacht, daß es sich bei r um einen Quantenzustand handelt, da es nur bei diesen sinnvoll ist davon zu sprechen, daß keine Übergänge auftreten. Da jedoch die Quantenmechanik die klassische Mechanik umfaßt, kann diese Einschränkung nicht von fundamentaler, sondern nur von praktischer Natur sein. Wir werden später auf diesen Aspekt zurückkommen. Wir wollen nun betrachten, wie sich die Energieeigenwerte Er = Er (a1 , . . . , an ) ändern (bei festem quantenmechanischen Mikrozustand r), wenn wir die äußeren Parameter um infinitesimale Beträge aj → aj + daj ändern. Es gilt dEr (a) = n X ∂Er j=1 daj . ∂aj Die Arbeit, die am System geleistet wird wenn es im Mikrozustand r verbleibt ist durch n X d¯Wr = dEr (a) = − αj,r daj , j=1 mit der verallgemeinerten Kraft im Zustand r αj,r = − ∂Er , ∂aj gegeben. Sollte aj eine Länge bezeichnen, so hat αj,r die Dimension der “gewöhnlichen” Kraft. Wir betrachten nun wieder einen Makrozustand, der durch die Angabe der Wahrscheinlichkeiten Pr gegeben ist, mit der sich das Teilsystem A im Mikrozustand r befindet. Wenn die Änderung der Parameter quasistatisch abläuft, haben die verallgemeinerten Kräfte zu jeder Zeit wohldefinierte Mittelwerte hαj i. Diese sind mit der Verteilung {Pr } zu berechnen, die zum aktuell vorliegenden Gleichgewicht gehört. Damit gilt für die makroskopische Arbeit d¯W , die sich durch infinitesimale, quasistatische Änderung der äußeren Parameter ergibt wenn keine Wärme ausgetauscht wir (adiabatischer Prozeß) d¯W = X r Pr dEr (a) = − n X j=1 hαj i daj . 34 KAPITEL 2. GRUNDÜBERLEGUNGEN Die makroskopische Arbeit W bei einer endlichen quasistatischen Änderung kann durch Integration bestimmt werden. Als erster Beispiel für eine verallgemeinerte Kraft betrachten N Spin-1/2 in einem äußeren Magnetfeld in z-Richtung. Die Amplitude a1 = B dieses Magnetfelds soll nun quasistatisch variiert werden. Für die Energie eines Mikrozustand gilt Er = −2µ0 B N X sz,ν . ν=1 Die verallgemeinerte Kraft in einem Mikrozustand ist damit α1,r N X ∂Er = 2µ0 sz,ν . =− ∂B ν=1 Nach der Erwartungswertbildung mit der Verteilung Pr folgt hα1 i = 2µ0 N X hsz,ν i . ν=1 Die rechte Seite ist das mittlere magnetische Moment aller Spins, das somit gleich der verallgemeinerten Kraft für die quasistatische Änderung des B-Feldes ist. Als weiteres Beispiel zum Begriff der verallgemeinerten Kraft betrachten wir den Druck. Ein Gas (Teilsystem A) befinde sich in einem zylindrischen Gefäß welches wärmeisoliert ist (adiabatischer Prozeß). Bei der Wechselwirkung mit A0 wird ein beweglicher Kolben ausgehend von der Position L quasistatisch verschoben. Das Gas übt eine Kraft F senkrecht auf die Kolbenfläche aus. Für die Verschiebung um dL muß am System die Arbeit d¯W = −F dL = − F F AdL = − dV = −P dV A A (2.8) mit der infinitesimalen Volumenänderung dV = AdL und der Querschnittsfläche A geleistet werden.14 Die verallgemeinerte Kraft entspricht damit dem Druck P . Man sagt auch, daß der Druck P die zum Volumen V konjugierte Kraft ist. Wir wollen den Druck nun mikroskopisch berechnen. Gemäß der obigen Überlegungen ist der sich ändernde äußere Parameter durch V gegeben. Somit gilt ∂Er P =− . ∂V Obwohl man dem Symbol P , welches wir für den Druck eingeführt haben, nicht ansieht, daß es sich um einen Ensemble-Mittelwert handelt, wird dieses durch 14 Die Vorzeichenwahl ist konsistent mit der Idee, daß die am System geleistete Arbeit positiv sit, wenn das Volumen abnimmt. 2.8. QUASISTATISCHE PROZESSE 35 den obigen Zusammenhang evident. Die Beziehung Gl. (2.8) gilt allgemein unabhängig von der Form des Gefäß und der Form der quasistatischen Volumenänderung. Da der Druck im Gleichgewicht überall gleich groß ist, ergibt jede infinitesimale Änderung der Oberfläche P den gleichen Betrag P δv. Die Gesamtvolumenänderung ist durch dV = δv gegeben, woraus die Formunabhängigkeit folgt. Um die Arbeit zu berechnen, die sich bei einer endlichen quasistatischen Volumenänderung ergibt, müssen wir das Integral Z Ve P (V )dV W =− Va auswerten. Der Betrag der Arbeit entspricht somit der zwischen P (V ) und der V -Achse (zwischen Ve und Va ) eingeschlossenen Fläche. Dieses ist in der folgenden Skizze veranschaulicht (in dieser gilt W > 0). P 0.2 0.1 0 2 Ve 3 V 4 Va Wir wollen nun den Druck eines idealen Gases explizit berechnen. Wir betrachten das Gas in einem quaderförmigen Behälter mit den Seitenlängen Lj . Als veränderlichen äußern Parameter wählen wir die Seitenlänge a1 = L1 . Der Mikrozustand bei N Teilchen ist durch r=( n1 , n2 , n3 , n ,n ,n , n7 , . . . , n3N ) | {z } | 4 {z5 }6 erstes Teilchen zweites Teilchen festgelegt. Die zugehörige Energie bei festem r ist Er = N N X 3 X X p~ν2 ~2 π 2 2 . = n 2 3(ν−1)+j 2m 2mL j ν=1 ν=1 j=1 36 KAPITEL 2. GRUNDÜBERLEGUNGEN Für die infinitesimale Arbeit, bei quasistatischer15 Änderung von L1 gilt nun * N + ∂Er 2 X ~2 π 2 2 d¯W = dL1 = − dL1 . n ∂L1 L1 ν=1 2mL21 3(ν−1)+1 Im Gleichgewicht sind alle Impulsrichtungen für ein herausgegriffenes Teilchen gleichwahrscheinlich. Damit ist die mittlere kinetische Energie der Bewegung für alle drei Raumrichtungen gleich groß. Es gilt also * N + * N + 3 X ~2 π 2 X X ~2 π 2 1 1 n2 = n2 = hEi , 2 3(ν−1)+1 2 3(ν−1)+j 2mL1 3 j=1 ν=1 2mLj 3 ν=1 mit der mittleren Energie hEi (im System A). Zusammengefaßt gilt also 2 hEi 2 hEi dL1 = − dV . L1 3 3 V Für eine endliche Volumenänderung sind für jeden Abschnitt des Prozesses die aktuellen Werte von hEi und V einzusetzen und es muß über V integriert werden. Für den Druck des idealen Gases erhalten wir damit durch Vergleich mit Gl. (2.8) d¯W = − 2 hEi . (2.9) 3 V Bisher haben wir nur adiabatische, quasistatische Prozesse betrachtet. Wird in einem quasistatischen Prozeß auch Wärme übertragen, so muß dieses ebenfalls hinreichend langsam geschehen, so daß man weiter davon ausgehen kann, daß das System ständig in einem Gleichgewichtszustand ist. Wie für jeden infinitesimalen Wechselwirkungsprozeß gilt dann P = d hEi = d¯W + d¯Q Wegen hEi = X Pr Er r gilt d hEi = X (Pr dEr + Er dPr ) . r Wie wir oben schon verwendet haben, entfällt der zweite Term wenn keine Wärme übertragen wird. Werden dagegen die äußeren Parameter konstant gehalten und nur Wärme quasistatisch ausgetauscht, so gilt X d¯Q = Er dPr . r 15 Bei quasistatischer Änderung wird zu jeder Zeit ein Gleichgewichtszustand angenommen. Damit sich dieser einstellen kann, müssen Wechselwirkunsgprozesse zwischen den Teilchen des idealen Gases vorhanden sein, die normalerweise keine Rolle spielen und vernachlässigt werden. 2.9. TEMPERATUR UND ENTROPIE 2.9 37 Temperatur und Entropie Wir wollen nun die thermische Wechselwirkung zwischen zwei Systemen A und A0 noch genauer analysieren. Da dabei alle äußeren Parameter a (die von A, A0 und dem Gesamtsystem) konstant bleiben schreiben wir im folgenden nur die Abhängigkeit von der Energie. Die folgende Diskussion wird es uns ermöglichen den Begriff der Temperatur genau zu definieren. Die Energien der Teilsysteme seien E und E 0 , wobei die Wechselwirkung so schwach sei, daß E + E 0 = Eg konstant ist. Der Hamiltonoperator des Gesamtsystems Ĥg hat die Form Ĥg = Ĥ + Ĥ 0 + ĤWW , wobei Ĥ bzw. Ĥ 0 nur von den Variablen von A bzw. A0 abhängt. Der Wechselwirkunsgteil ĤWW hängt dagegen von beiden Variablesätzen ab. Unsere obige Annahme, daß praktisch keine Energie in der Wechselwirkung steckt, besagt dann, daß ĤWW zwar nichtverschwindend ist, aber gegenüber Ĥ und H 0 zu vernachlässigen ist. Diese Feinheit haben wir bei unseren bisherigen Überlegungen zur Energieerhaltung bei thermischer Wechselwirkung ignoriert. Wir betrachten nun wieder ein Ensemble von Systempaaren und nehmen an, daß A und A0 im Gleichgewicht miteinander sind. Das System A kann nun verschiedene Energiewerte E annehmen, die jedoch mit unterschiedlicher Wahrscheinlichkeit auftreten. Hat A die Energie E, so ist die von A0 durch E 0 = Eg − E gegeben. Die Zahl der dem Gesamtsystem zugänglichen Zustände Ωg kann somit als Funktion der Energie des Systems A aufgefaßt werden Ωg = Ωg (E). Genauer ist Ωg (E) die Zahl der zugänglichen Zustände mit einer Energie des Teilsystems A in [E, E + δE]. Das grundlegende Postulat verlangt, daß das Gesamtsystem im Gleichgewicht mit gleicher Wahrscheinlichkeit in einem der zugänglichen Zustände sein muß. Damit ist die Wahrscheinlichkeit P (E), daß A eine Energie zwischen E und E + δE hat proportional zu Ωg (E). Es gilt P (E) = Ωg (E) , Ωtot wobei Ωtot die Gesamtzahl der dem Gesamtsystem zugänglichen Zustände ist.16 Wir können Ωtot dadurch bestimmen, daß wir Ωg (E) über alle möglichen E von A aufsummieren. Wenn A die Energie E hat, dann ist das Teilsystem in einem seiner Ω(E) zugänglichen Mikrozustände. Gleichzeitig ist dann A0 in einem seiner Ω0 (Eg −E) zugänglichen Zuständen. Da jeder Zustand von A mit jedem möglichen Zustand von A0 zu einem Zustand des Gesamtsystems kombiniert werden kann gilt Ωg (E) = Ω(E)Ω0 (Eg − E) Diese hängt natürlich von der Gesamtenergie E + E 0 ab. Da die Abhängigkeit im folgenden nicht wichtig sein wird, schreiben wir sie nicht mit. 16 38 KAPITEL 2. GRUNDÜBERLEGUNGEN und damit P (E) = Ω(E)Ω0 (Eg − E) . Ωtot (2.10) Da die beiden Teilsysteme A und A0 jeweils sehr viele Freiheitsgrade enthalten, sind Ω(E) und Ω0 (E 0 ) normalerweise sehr schnell wachsende Funktionen ihrer Energievariable. Damit nimmt Ω(E) sehr schnell mit E zu, während Ω0 (Eg − E) sehr schnell mit E abnimmt. Das Produkt der beiden Faktoren, d.h. die Wahrscheinlichkeit P (E), das A die Energie E annimmt, hat damit ein sehr scharfes Maximum für einen speziellen Wert EM der Energie. Dies ist in der folgende Skizze dargestellt. Die rote bzw. die blaue KurveR stellen Ω(E) bzw. Ω0 (Eg − E) dar. Die grüne Kurve ist die aus eins normierte ( P (E)dE = 1) Wahrscheinlichkeitsverteilung P (E). 10 20 P(E) 10 10 0 -20 Eg 10 -40 0 0.5 1 E/EM 1.5 2 Wie wir aus unseren qualitativen Überlegungen vom Ende von Kapitel 2.4 wissen 0 gilt Ω ∼ E f und Ω0 ∼ (Eg − E)f und damit ln P (E) = f ln E + f 0 ln (Eg − E) + const. . Als Funktion von E zeigt dieser Ausdruck genau ein Maximum. Die Skizze macht eindrücklich klar, daß P (E) auf der Skala von Eg bei hinreichend großer Zahl von Freiheitsgraden (in der Skizze nur f = f 0 ∼ O(102 )) eine extrem scharfe Verteilung ist (beachte die log-Skala der y-Achse). Wie sie in einer Übungsaufgabe durch Taylorentwicklung zeigen werden, gilt für die relative Breite der Verteilung 2.9. TEMPERATUR UND ENTROPIE 39 P (E) ∆E 1 ∼√ EM f falls O(f ) = O(f 0 ). Um die Lage des Maximums von P (E), oder äquivalent ln P (E) genauer zu bestimmen betrachten wir die Bestimmungsgleichung d ln P (E) 1 dP (E) = =0. dE E=EM P (E) dE E=EM Nach Gl. (2.10) gilt ln P (E) = − ln Ωtot + ln Ω(E) + ln Ω0 (E 0 ) , wobei E 0 = Eg − E. Die Bestimmungsgleichung für das Maximum wird so zu d ln Ω0 (E 0 ) d ln Ω(E) − =0. 0 dE E=EM dE 0 E =Eg −EM =E 0 M Mit der Abkürzung β(E) = d ln Ω(E) dE und analog für β 0 gilt am (scharfen) Maximum somit 0 β(EM ) = β 0 (EM ). Der Parameter β hat die Dimension einer reziproken Energie. Wir führen den dimensionsbehafteten Parameter T = T (E) gemäß kB T = β −1 ein, wobei kB die Boltzmannkonstante ist. Diese Definition legt die absolute Temperatur fest. Am Maximum von P (E) gilt 0 T (EM ) = T 0 (EM ). Definieren wir weiter die Entropie S als S(E) = kB ln Ω(E) so folgt T −1 = dS dE 40 KAPITEL 2. GRUNDÜBERLEGUNGEN und die Bedingung für das Maximum der Wahrscheinlichkeit kann durch die Forderung, daß S + S 0 maximal wird ersetzt werden. Die Gesamtentropie wird maximal, wenn T = T 0 . Wir wollen nocheinmal daran erinnern, daß Ω verglichen mit der E-Abhängigkeit nur sehr schwach von δE abhängt. Daher beeinflußt δE die obigen Überlegungen nicht. Insbesondere ist der Parameter β per Definition (Logarithmus und Ableitung!) unabhängig von δE. In unserer in diesem Abschnitt verwendeten Notation haben wir die äußeren Parameter nicht mitgeschrieben, da sie konstant gehalten wurden. An dieser Stelle ist aber wichtig festzuhalten, daß die soeben eingeführte absolute Temperatur T und die Entropie im Allgemeinen nicht nur Funktionen der Energie, sondern zusätzlich der weiteren äußeren Parameter sind T = T (E, a1 , . . . , an ) ; S = S(E, a1 , . . . , an ) . Die Bedingung T = T0 oder äquivalent S + S 0 maximal ist die Gleichgewichtsbedingung in dem Fall, daß A und A0 Wärme austauschen können. In einer thermodynamischen Sichtweise kann der Temperaturunterschied als die treibende Kraft für den Wärmeaustausch angesehen werden. Mikroskopisch liegt diesem natürlich erneut das Streben nach einer Gleichverteilung über alle Mikrozustände des Gesamtsystems zugrunde. Wir wollen nun eine Liste wichtiger Eigenschaften der absoluten Temperatur und der Entropie zusammenstellen. 1. Die Definitionen von T und S beziehen sich auf den Gleichgewichtszustand eines Vielteilchensystems. 2. Die Temperatur und die Entropie sind makroskopische Größen, die meßbar sind. Die Relation S = kB ln Ω stellt einen Zusammenhang zwischen der Mikroskopik und der Makroskopik her. 3. Die Entropie ist additiv. Für zwei Teilsysteme gilt Ωg = ΩΩ0 und damit Sg = kB ln Ωg = kB ln Ω + kB ln Ω0 = S + S 0 . 4. Stellt man für zwei anfangs getrennte Systeme A und A0 die jeweils im Gleichgewicht sind und damit eine Temperatur Ta und Ta0 haben einen thermischen Kontakt her und gilt Ta 6= Ta0 , so tauschen sie Wärme aus und es stellt sich ein gemeinsames Gleichgewicht mit Te = Te0 und maximaler Gesamtentropie S + S 0 ein. 2.9. TEMPERATUR UND ENTROPIE 41 5. Die Entropie ist ein Maß für die Zahl der zugänglichen Mikrozustände und damit ein Maß für die Unordnung. Je mehr zugängliche Mikrozustände es gibt, desto ungeordneter ist der Gleichgewichstzustand. 6. Die Temperatur ist (für “normale” Systeme) ein Maß für die Energie pro Freiheitsgrad eines Systems. Um dies einzusehen verwenden wir unsere grobe Abschätzung Ω(E) = cE f . Mit T −1 = ∂S/∂E folgt17 kB T = E . f 7. Für “normale” Systeme ist die absolute Temperatur eine positive Größe. Gemäß Definition gilt T −1 = kB ∂ ln Ω/∂E. Da für “normale” Systeme die Zahl der Zustände mit steigender Energie (stark) zunimmt, gilt T > 0. 8. Die absolute Temperatur ist für “normale” Systeme eine zunehmende Funktion seiner Energie. Nach 6. ist dieses bereits klar, wir können es aber auch allgemeiner untersuchen. Nach der Skizze auf Seite 38 ist klar, daß ln Ω(E) konkav ist. Damit gilt ∂β/∂E < 0 und damit ∂ 1 1 ∂β ∂T = =− >0. ∂E ∂E kB β kB β 2 ∂E Damit ist klar, daß die Wärme nach Herstellen eines thermischen Kontakts zwischen zwei Systemen immer vom ursprünglich wärmeren zum ursprünglich kälteren fließt. 9. Bei Energien E in der Nähe der Grundzustandsenergie E0 des Systems sind diesem meist nur noch wenige Zustände zugänglich und die Entropie wird klein. Im Limes E → E0 geht S gegen eine Konstante, die durch lim S(E) = kB ln Ω(E0 ) E→E0 gegeben ist. Ist der Grundzustand nicht entartete, so gilt lim S(E) = 0 E→E0 (keine Entartung) . Für entartete Grundzustände, ist limE→E0 S(E) ein Maß für die Entartung. Dieses Grenzwertverhalten der Entropie können wir auch mit Hilfe der Temperatur ausdrücken. Wegen ∂T /∂E > 0 nimmt T mit E → E0 ab. Da ln Ω für bei E0 startende Energie im Allgemeinen sehr schnell anwächst gilt in guter Näherung lim β = lim E→E0 E→E0 ∂ ln Ω(E) =∞ ∂E und damit T → 0. 17 Da S im Allgemeinen von E und den a abhängt, verwenden wir jetzt wieder die partielle Ableitung. 42 KAPITEL 2. GRUNDÜBERLEGUNGEN Wir haben gesehen, daß für den Gleichgewichtszustand des Gesamtsystems bei Wärmeaustausch zwischen zwei Teilsystemen A und A0 die Gesamtentropie S + S 0 einen maximalen Wert annimmt. Weiter unten werden wir zeigen, daß die maximale Entropie unter allgemeinen Voraussetzungen das Gleichgewicht eines abgeschlossenen Systems bestimmt (siehe auch Kapitel 2.5). Bevor wir dazu kommen, werden wir aber einige etwas anders geartete Überlegungen anstellen. 2.10 Kleine Wärmemengen In diesem kurzen Abschnitt wollen wir den Transport kleiner Wärmemengen zwischen den Teilsystemen A und A0 untersuchen. Er wird uns auf eine in der Thermodynamik wichtige Relation führen und in ihm werden wir das zentrale Konzept eines Wärmereservoirs einführen. Ein System A im Gleichgewicht werde mit einem anderen Gleichgewichtssystem A0 in Kontakt gebracht. Für die Wärmemenge die bis zum Erreichen des gemeinsamen Gleichgewichts von A absorbiert wird gelte |Q| hEi − E0 . (2.11) Die Wärmemenge ist somit klein verglichen mit der auf die Grundzustandsenergie E0 bezogene mittlere Energie des Systems. Die Änderung der mittleren Energie ∆ hEi = Q ist damit klein verglichen mit hEi − E0 . Dies impliziert, daß sich die Temperatur nur um einen vernachlässigbaren Betrag ändert, was man wie folgt sieht. Es gilt ∆β = f β ∂β Q≈− Q≈− Q, 2 ∂E (hEi − E0 ) hEi − E0 wobei wir die grobe Abschätzung zur Zahl der zugänglichen Zustände verwendet haben. Die Ungleichung (2.11) liefert dann ∂β |∆β| = Q β . ∂E Aus T = (kB β)−1 folgt ∆T ∆β =− T β und damit |∆T | 1. T (2.12) Im Folgende werden wir Q als “klein” bezeichnen, wenn die Ungleichung (2.12) gilt. 2.11. DIE KANONISCHE VERTEILUNG 43 Wenn A eine solche kleine Wärmemenge absorbiert hat, dann werden seine Anfangs- bzw. Endenergie mit großer Wahrscheinlichkeit den mittleren Energien hEi bzw. hEi + Q entsprechen. Nach Aufnahme der Wärme und erreichen eines neuen Gleichgewichts hat sich die Zahl der zugänglichen Zustände Ω von A entsprechend geändert. Es gilt18 1 ∂ 2 ln Ω ∂ ln Ω Q+ Q2 + O(Q3 ) ln Ω(hEi + Q) − ln Ω(hEi) = ∂E E=hEi 2 ∂E 2 E=hEi 1 ∂β = β(hEi)Q + Q2 + O(Q3 ) . 2 ∂E E=hEi Den zweiten Term können wir nun ebenfalls vernachlässigen da |∂β/∂E Q| β gilt und erhalten ∆[ln Ω(hEi)] = β(hEi)Q bzw. ∆S = Q . T Für infinitesimal kleine Wärmemengen folgt dS = d¯Q . T Dabei ist dS als infinitesimale Differenz der makroskopischen Entropie vor und nach der Wechselwirkung ein vollständiges Differential. Die Temperatur macht in diesem Sinne aus d¯Q ein vollständiges Differential. Mathematisch betrachtet stellt sie damit den integrierenden Faktor von d¯Q dar. Wir werden folgend sehen, daß diese Relation auch unter allgemeineren Bedingungen gültig ist (nicht nur für kleinen Wärmeübertrag). Ein System A wird mit Bezug auf eine Reihe andere Systeme als Wärmereservoir bezeichnet, wenn es so groß ist, daß sich seine Temperatur durch eine thermische Wechselwirkung mit diesen anderen Systemen praktisch nicht ändert. Die obige Beziehung ∆S = Q/T ist damit als Relation zwischen der Entropieänderung ∆S und der absorbierten Wärmemenge Q anwendbar. 2.11 Die kanonische Verteilung Wir wollen nun die Situation genauer betrachten, daß ein System A im Kontakt mit einem Wärmebad (Wärmereservoir) A0 steht. Dieses ist eine der generischen 18 Da die Verteilung der Energie P (E) für eine große Zahl von Freiheitsgraden extrem scharf ist, können wir im Ω des Systems A, E durch hEi bzw. durch hEi + Q ersetzen. 44 KAPITEL 2. GRUNDÜBERLEGUNGEN Situationen, mit denen wir in der Praxis zu tun haben. Für einen nicht wärmeisolierten Behälter mit Gas oder ein Stück Metall, dient das Labor als ein Wärmebad. Wir wollen nun herleiten, wie groß unter Gleichgewichtsbedingungen die Wahrscheinlichkeit ist, daß sich A im Mikroszutand r mit Energie Er befindet. Dabei enthält der Zustand r nur “Variable” von A. Wie wir sehen werden, muß das System A nicht notwendigerweise makroskopisch sein (siehe Kapitel 2.12). Aufgrund der Energieerhaltung im abgeschlossenen Gesamtsystem gilt wieder Eg = E + E 0 .19 Wenn A im festen Zustand r mit Energie Er ist, gilt somit E 0 = Eg − Er . Ist A in diesem einen Mikrozustand r, so ist die Zahl der für das Gesamtsystem A+A0 realisierbaren Zustände durch Ω0 (Eg −Er ) gegeben. In Analogie zu Gl. (2.10) folgt dann für die Wahrscheinlichkeit, daß A im Mikrozustand r ist Pr ∝ Ω0 (Eg − Er ) da der erste Faktor im Zähler in Gl. (2.10) gleich eins ist. Dieses Ergebnis ergibt sich natürlich auch dadurch, daß wir unser fundamentales Postulat bemühen, welches besagt, daß die Wahrscheinlichkeit für alle realisierbaren Zustände des abgeschlossenen Gesamtsystems gleich groß ist. Nach diesen allgemeinen Überlegungen wollen wir nun verwenden, daß A sehr viel kleiner als das Reservoir A0 ist. Es gilt dann Er Eg . Wir können damit einen guten Näherung für Ω0 (Eg − Er ) herleiten, wenn wir den langsam veränderlichen Logarithmus dieser Größe in einer Taylorreihe um Eg entwickeln. 0 ∂ ln Ω Er + . . . ln Ω0 (Eg − Er ) = ln Ω0 (Eg ) − ∂E 0 E 0 =Eg = ln Ω0 (Eg ) − β 0 Er + . . . , wobei wir über β 0 = 1/(kB T 0 ) die “konstante” (siehe die Diskussion in Kapitel 2.10) Temperatur T 0 des Wärmereservoirs eingeführt haben. Wir werden diese Temperatur im Folgenden mit T statt T 0 , bzw. die “inverse Temperatur” mit β statt β 0 , bezeichnen. Da Ω0 (Eg ) eine von r unabhängige Konstante ist, können wir in guter Näherung (d.h. unter Vernachlässigung der durch die Punkte angedeuteten Terme höherer Ordnung) Pr = ce−βEr schreiben. Die Proportionalitätskonstante c können wir aus der Forderung bestimmen, daß X Pr = 1 r 19 Wir vernachlässigen somit wieder die Energie, die in der Wechselwirkung steckt. 2.12. NOCHMAL: DAS KLASSISCHEN IDEALEN GASES 45 gelten muß, wobei über alle Mikrozustände r von A summiert werden muß. Damit folgt 1 Pr = e−βEr , Z mit X Z= e−βEr . r Man bezeichnet den Exponentialfaktor exp (−βEr ) als den Boltzmannfaktor. Die durch Pr gegebene Wahrscheinlichkeitsverteilung heißt die kanonische Verteilung und ein Kollektiv von Systemen, welche sich alle in Kontakt mit einem Wärmereservoir befinden ist das kanonische Ensemble. Neben dem mikrokanonischen Ensemble haben wir somit unser zweites statistisches Ensemble kennen gelernt. Statt eines Ensembles abgeschlossener Systeme betrachtet man eines von Systemen, die Energie mit einem Wärmebad austauschen können und damit eine feste Temperatur (aber eine leicht fluktuierende Energie) hat. Den Normierungsfaktor Z = Z(T ) bezeichnet man als die kanonische Zustandssumme. Mit der soeben eingeführten Wahrscheinlichkeitsverteilung kann man nun Erwartungswerte für physikalisch relevante Größen berechnen. Wir werden dies im folgen Kapitel exemplarisch für das einatomige ideale Gas tun. In den Übungen werden sie ein weitere Beispiele von physikalischem Interesse untersuchen. 2.12 Nochmal: Das klassischen idealen Gases Wir betrachten erneut das einatomige ideale Gas in einem quaderförmigen Volumen V = L1 L2 L3 . Im Gegensatz zur Rechnung in Kapitel 2.4, in der wir das Gas als abgeschlossenes System betrachtet haben, befinde sich dieses jetzt in thermischen Kontakt mit einem Wärmereservoir. Das Gas befinde sich bei der durch das Reservoir vorgegebenen Temperatur im Gleichgewicht. Wir werden wieder am klassischen Limes interessiert sein und nehmen an, daß die de Broglie Wellenlänge eines Atoms sehr viel kleiner als der mittlere Abstand dieser ist (verdünntest Gas). Wir können dann davon ausgehen, daß Teilchen unterscheidbar sind, da wir die Bahn der Teilchen (im Prinzip) verfolgen können. Es bietet sich nun an, nicht das Gas als ganzes als System A aufzufassen, sondern ein einzelnen Atom dieses. Für dieses bildet nun das Restgas zusammen mit dem ursprünglichen Reservoir das Wärmereservoir der Temperatur T . Die Wahrscheinlichkeit, daß ein Atom einen seiner Einteilchenquantenzustände ρ mit Einteilchenenergie ρ aufweist, ist dann durch die kanonische Verteilung e−βρ Pρ = P −βρ ρe 46 KAPITEL 2. GRUNDÜBERLEGUNGEN gegeben. Wie in Kapitel 2.4 ist die Energie nur durch die kinetische Energie der Schwerpunktsbewegung des Atoms π 2 ~2 n21 n23 n23 ρ = + + 2m L21 L23 L23 wobei der Einteilchenzustand ρ durch die drei Quantenzahlen (n1 , n2 , n3 ), mit ni ∈ N, charakterisiert ist. Die mittlere Energie eines Atoms ist durch hi = X ρ P −βρ ρ ρ e Pρ ρ = P −βρ ρe gegeben. Diese Größe können wir nun umschreiben. Mit X ρ e−βρ = − ρ ∂Z ∂ X −βρ e =− ∂β ρ ∂β folgt hi = − 1 ∂Z ∂ ln Z =− . Z ∂β ∂β Wir können die mittleren kinetischen Energie eines Atoms des Gases also aus der Zustandssumme Z berechnen. Die Zustandssumme ist durch ∞ X ∞ X ∞ X n23 n23 βπ 2 ~2 n21 + + = Z1 Z2 Z3 Z= exp − 2m L21 L22 L23 n =1 n =1 n =1 1 2 3 gegeben und zerfällt in das Produkt aus drei unabhängige Summen des Typs ∞ X βπ 2 ~2 n2i Zi = exp − . 2m L2i n =1 i Es ist nun recht einfach diese Summe auszuführen, wenn wir annehmen, daß T so groß ist (β so klein ist), daß für den Vorfaktor vor dem n2i im Exponenten βπ 2 ~2 1 1 2m L2i gilt. Aufeinanderfolgende Summanden unterscheiden sich dann nur sehr wenig und wir können sie Summe durch ein Integral ersetzen. Für hinreichend hohe 2.12. NOCHMAL: DAS KLASSISCHEN IDEALEN GASES 47 Temperaturen, d.h. im klassichen Limes in dem Quanteneffekte keine Rolle mehr spielen gilt dann Z ∞ βπ 2 ~2 n2i dn1 Zi ≈ exp − 2m L2i 1 1/2 Z 2m Li ∞ = exp [−u2 ] du , β π~ ui mit ui = β 2m 1/2 π~ 1. Li Aufgrund dieser Ungleichung können wir die untere Grenze des Integrals in der zweiten Zeile der obigen Gleichung durch 0 ersetzen ohne einen großen Fehler zu machen. Das Integral kann dann leicht ausgeführt werden und wir erhalten 1/2 √ m 1/2 L π 2m Li i Zi ≈ = . 2 1/2 2 β π~ 2π~ β Damit folgt für die kanonische Zustandssumme Z= m 3/2 V , 2π~2 β 3/2 V = L1 L2 L3 . (2.13) Mit der Beziehung π 2 ~2 2 p2i = n 2m 2mL2 i können wir Z im klassischen Limes auch als Integral über den Einteilchenphasenraum in der Form Z Z ∝ e−βH(~x,~p) d3 x d3 p mit der Einteilchenhamiltonfunktion H(~x, p~) schreiben. Wir werden später auf diesen Ausdruck zurückkommen. Aus Gl. (2.13) folgt 3 m 3 ln Z = ln V − ln β + ln 2 2 2π~2 und für die mittlere Energie eines Atoms hi = − ∂ ln Z 3 1 3 = = kB T . ∂β 2β 2 (2.14) 48 KAPITEL 2. GRUNDÜBERLEGUNGEN Für die mittlere Energie aller N identischen Atome des Gases gilt dann 3 hEi = N kB T . 2 (2.15) Diese Relation zwischen Energie (dort nicht als Mittelwert, sondern “scharf”), Teilchenzahl und Temperatur ist ihnen bereits im Rahmen der Behandlung des idealen einatomigen Gases im mikrokanonischen Ensemble in einer Übungsaufgabe begegnet. Dabei war jedoch die Energie E fest (Gesamtenergie des abgeschlossenen Systems) und die Temperatur (bzw. β) eine abgeleitete Größe. Im kanonischen Ensemble ist dagegen die Temperatur fest durch das Wärmebad gegeben und die Energie ein Mittelwert. In beiden Ensembles kommt man somit für große N (die wir hier betrachten) zu identischen Ergebnissen. Dies ist ein Beispiel für die allgemeingültige Einsicht, daß man für die unterschiedlichen Ensembles im Limes großer N zu gleichen Ergebnissen kommt. Wir werden dies weiter unter genauer begründen. Dies ist eine gute Stelle nocheinmal zur Berechnung der Zustandsdumme für das ideale einatomige Gas im Rahmen des mikrokanonischen Ensembles (abgeschlossenes System) zurückzukehren (Kapitel 2.4). Wir haben gezeigt, daß Φ(E, V, N ) = f (N )V N E 3N/2 , mit einer E und V unabhängigen Funktion f (N ). Die Form des Ergebnisses wäre dieselbe, wenn wir den Faktor 1/N ! und den Faktor 1/(2π~)3N nicht berücksichtigt hätten, wobei sich eine andere Funktion f (N ) ergeben würde. Den ersten Faktor haben wir “per Hand” hinzugefügt, um auch im klassischen Limes die Ununterscheidbarkeit zu berücksichtigen, der zweite ergibt sich aus dem “coarse graining” des Phasenraums – welches wir durch die Unschärferelation der Quantenmechanik motiviert haben. Wie bereits angedeutet, hat man dieses “coarse graining” bereits vorgenommen, bevor die Quantenmechanik entwickelt war, wobei jedoch das Zellenvolumen unbestimmt blieb. Aus den obigen Überlegungen wird sofort klar, daß dieses kein Problem darstellt, solange man nur an der E- und V -Abhängigkeit von Φ interessiert ist. Völlig analog zu unseren Überlegungen aus Kapitel 2.4 kann man auch mit unbestimmtem f (N ) zeigen, daß ln Φ ≈ ln Ω . Aufgrund der Definition der Temperatur als Ableitung von ln Ω nach E wird diese nicht durch den Faktor f (N ) beeinflußt. Damit gilt unabhängig von f (N ) und damit Unabhängig von jeder Form von die N -Abhängigkeit betreffenden quantenmechanischen Überlegungen, daß E = 3N kB T /2 (siehe Übungen). Auch der (mittlere) Druck (siehe Kapitel 2.8) ist unabhängig von die N -Abhängigkeit betreffenden quantenmechanischen Überlegungen.20 Zusammenfassen kann 20 Damit ist auch die Zustandsgleichung P V = N kB T (siehe Übungen und weiter unten) unabhängig von solchen Überlegungen. 2.12. NOCHMAL: DAS KLASSISCHEN IDEALEN GASES 49 man feststellen, daß wir die N -Abhängigkeit von Φ bzw. Ω für unsere bisherigen Überlegungen nicht genauer hätten untersuchen müssen. Es ist daher auch nicht verwunderlich, daß wir in diesem Kapitel, in dem wir in unserer Rechnung für Z im klassischen Limes die Ununterscheidbarkeit nicht berücksichtigt haben (siehe Annahmen vom Beginn dieses Kapitels), auf die gleichen Ergebnisse stoßen. Es ist wichtig festzuhalten, daß die mittlere Energie Gl. (2.15) des einatomigen idealen Gases nicht vom Volumen abhängt. Dies ist physikalisch einsichtig. Die kinetische Energie eines Teilchens hängt nicht von der Entfernung der Teilchen voneinander und damit bei festem T und N nicht vom Volumen V ab. Berücksichtigt man die potentielle Energie (löst man sich also von der Idealisierung des idealen Gases), so gilt dies nicht mehr. Sie haben ein Beispiel dazu in Form des van-der-Waals Gases in den Übungen kennengelernt. Wir wollen nun ebenfalls den Druck des idealen Gases im kanonischen Ensemble berechnen. Wie im mikrokanonischen Ensemble ist der Druck im kanonischen Ensemble ein Mittelwert. Wir betrachten wieder einen quaderförmigen Behälter. Mit fρ bezeichnen wir die Kraft, die ein einzelnes Atom im Einteilchenzustand ρ in die x-Richtung auf die rechte Begrenzungswand (in der y-z-Ebene) ausübt. Ändern wir nun L1 um dL1 so verrichtet das Atom an der Wand die Arbeit fρ dL1 , die gleich der Abnahme der Energie −dρ sein muß fρ dL1 = −dρ ⇒ fρ = − ∂ρ . ∂L1 Für die mittlere Kraft hf i die ein Atom auf die rechte Begrenzungswand ausübt gilt dann hf i = X Pρ f ρ ρ = − 1 X −βρ ∂ρ e Z ρ ∂L1 1 Z 1 = β 1 ∂Z β ∂L1 ∂ ln Z , ∂L1 = Mit der sogenannten freien Energie F = −kB T ln Z entspricht diese Relation hf i = − ∂F . ∂L1 50 KAPITEL 2. GRUNDÜBERLEGUNGEN Wie sie später genauer verstehen werden, spielt die freie Energie im Rahmen des kanonischen Ensembles in vielerlei Hinsicht dieselbe Rolle wie die Entropie im Rahmen des mikrokanonischen. Mit Gl. (2.14) für den Logarithmus der kanonischen Zustandssumme, können wir die mittlere Kraft explizit berechnen hf i = 1 ∂ ln V 1 1 ∂ ln Z = = . β ∂L1 β ∂L1 βL1 Der (mittlere) Druck P aller N Teilchen ist dann durch P = N hf i N = kB T L2 L3 V gegeben. Wir erhalten somit die Zustandsgleichung P V = N kB T des einatomigen idealen Gases, welche ihnen abgleitet im Rahmen des mikrokanonischen Ensembles bereits in einer Übungsaufgabe begegnet ist. Aus der Zustandsgleichung lassen sich verschiedene wichtige Voraussagen gewinnen. 1. Wird eine bestimme Menge eines idealen Gases (d.h. N fest) auf konstanter Temperatur gehalten (thermischer Kontakt zum Wärmereservoir), so gilt P V = const. d.h. der Druck ist dem Volumen umgekehrt proportional. Man nennt sie auch Boylesches bzw. Boyle-Mariottsches Gesetz.21 Dies ist in der folgenden Skizze dargestellt. Man nennt die Linien die Isothermen. 20 P 15 10 > T 5 < T 0 0 1 2 3 V 21 Die Beziehung wurde 1662 von Boyle experimentell entdeckt. 4 2.13. GLEICHGEWICHT, ENTROPIE UND KRÄFTE 51 2. Wir eine bestimmte Gasmenge auf konstantem Volumen gehalten, so ist sein Druck seiner absoluten Temperatur proportional. Diese Relation kann zur Messung der absoluten Temperatur verwendet werden. 3. Die Zustandsgleichung gilt völlig unabhängig vom Typ der betrachteten Atome. Dieses ist experimentell auch nachgewiesen. 2.13 Gleichgewicht, Entropie und Kräfte In Kapitel 2.9 habe wir gezeigt, daß der Gleichgewichtszustand eines zusammengesetzten Systems mit Wärmeaustausch, aber für feste äußere Parameter a (keine Arbeit), dadurch festgelegt ist, daß die Entropie S + S 0 des Gesamtsystems ein Maximum annimmt. Man kann die Temperatur als die treibende Kraft des Wärmeaustauschs vestehen. Wir werden nun zeigen, daß auch bei allgemeiner Wechselwirkung zwischen zwei Systemen das Gleichgewicht durch das Maximum der Gesamtentropie festgelegt ist. Es wird klar werden, daß die verallgemeinerten Kräfte hαi i in Analogie zur Temperatur als treibende Kräfte eines “ai -Austauschs” verstanden werden können. Wie sie in einer Übungsaufgabe gezeigt haben, hat die Wahrscheinlichkeitsverteilung für die Energie des Subsystems A bei reinem Wärmeaustausch zwischen A und A0 näherungsweise die Gauß-Form (E − EM )2 Ω(E)Ω0 (Eg − E) ≈ P (EM ) exp − , P (E) = Ωtot 2(∆E)2 √ wobei ∆E ∼ 1/ f . Der Gleichgewichtszustand ist durch das Maximum EM bestimmt. Die mikrokanonische Zustandssumme des Gesamtsystems hängt neben (g) (g) der Energie von den äußeren Parametern des Gesamtsystems a(g) = (a1 , . . . , an ) ab. Da das Gesamtsystem abgeschlossen ist bleibt a(g) beim Wechselwirkungsprozeß konstant. Jeden der konstanten äußeren Parameter des Gesamtsystems zerlegen wir analog zu Energie in ein ai und ein a0i für die Teilsysteme A und A0 . Dabei können sich ai und a0i während des Wechselwirkungsprozesses ändern, wobei jedoch ai +a0i = a(g) konstant bleibt. Als Beispiel zur Veranschaulichung diene das Volumen. Zur Vereinfachung wollen wir im Folgenden annehmen, daß es nur einen äußeren Parameter ag gebe. Die Verallgemeinerung auf n solche sollte am Ende unserer Diskussion evident sein. Das Ziel der folgenden Überlegungen ist es, zu zeigen, daß im Gleichgewicht zwischen A und A0 , die Wahrscheinlichkeitsverteilung P (E, a) dafür, daß der äußere Parameter im Teilsystem A den Wert a annimmt und die Energie von A den Wert E, ebenfalls von der obigen Gauß-Form ist und die relative Schwankung in a-Richtung mit der Zahl der Freiheitsgrade (Teilchen) gegen Null geht. Damit ist P (E, a) eine sehr scharfe Verteilung um das Maximum (EM , aM ). Für das Beispiel des idealen Gases und dem Volumen als äußeren Parameter ist dieses leicht einsichtig. Wie wir in Kapitel 2.4 gesehen 52 KAPITEL 2. GRUNDÜBERLEGUNGEN haben, ist Ω(E, V ) auch als Funktion von V eine extrem schnell anwachsende Funktion. Basierend auf unserem Grundpostulat der Gleichverteilung auf alle zugänglichen Zustände und V + V 0 = Vg können wir dann völlig analog wie in Kapitel 2.9 vorgehen, wobei E durch V zu ersetzen ist. Das Gleichgewicht ist dann durch (EM , VM ) und damit durch das Maximum der Entropie des Gesamtsystems gegeben. Die Schwankungen um das Maximum verschwinden (in beide Richtungen) wieder wie die inverse Wurzel des Zahl der Freiheitsgrade (Teilchen). Wir wollen nun ein allgemeines System mit dem extensiven äußeren Parameter ag betrachten. Der äußere Parameter heißt extensiv, wenn er linear mit der Teilchenzahl ansteigt. Im Gleichgewicht sind alle Ωg (E, a) Mikrozustände des Gesamtsystems gleichwahrscheinlich. Wir parametrisieren Ωg durch den Wert des Parameters a im Teilsystem A, was möglich ist, da ag = a + a0 und durch die Energie E von A. Damit ist die Wahrscheinlichkeit, daß a einen bestimmte Wert annimmt proportional zur Zahl der Mikrozustände zu genau diesem Wert P (E, a) = cΩg (E, a) = c exp [Sg (E, a)/kB ] . Wir haben dabei die von a und E unabhängige Konstante c eingeführt. Wir gehen nun davon aus, daß Sg (E, a) ein absolutes Maximum (EM , aM ) hat22 ∂Sg ∂Sg =0, =0 (2.16) ∂E E=EM ,a=aM ∂a E=EM ,a=aM und entwickeln ln P (E, a) um (E, a) = (EM , aM ) in einer Taylorreihe.23 Brechen wir bei der quadratischen Ordnung in der Abweichung vom Maximum ab,24 so gilt (E − EM )2 1 (a − aM )2 1 1 exp − exp − , P (E, a) ≈ 2π ∆E 2(∆E)2 ∆a 2(∆a)2 mit s ∆a = − kB (∂ 2 S/∂a2 ) >0 E=EM ,a=aM und ∆E wie bereits berechnet. Wir haben dabei die Normierung der Wahrscheinlichkeitsverteilung berücksichtigt. Da (EM , aM ) ein Maximum von Sg (E, a) sein soll, gilt (∂ 2 S/∂a2 )a=aM < 0.25 Da a als extensiv angenommen wurde, gilt 22 Mit dem Beispiel des Volumens im idealen Gas im Hinterkopf ist dieses plausibel; siehe auch die Überlegungen zur Energieabhängigkeit. 23 In strikter Analogie zur Untersuchung von P (E); siehe Übung. 24 Im Beispiel des idealen Gases und a = V wird aus der Produktform von Ω (siehe Kapitel 2.4) sofort klar, daß die in der Taylorentwicklung auftetenden Terme mit gemischten zweiten Ableitungen am Maximum verschwinden. Wir gehen hier davon aus, daß dieses allgemein gilt. 25 In der Übungsaufgabe zum idealen Gas haben sie dieses explizit gesehen (siehe V -Abhängigkeit der Entropie dort). 2.13. GLEICHGEWICHT, ENTROPIE UND KRÄFTE 53 aM = O(N ) und damit nach der Definition der Schwankung ∆a = O(N 1/2 ), da S als additive Größe ebenfalls extensiv ist. Dies bedeutet, daß 1 ∆a ∼√ . aM N Damit liegen für große N fast alle Mikrozustände beim Maximum (EM , aM ) von (E, a).26 Es ist somit gezeigt, daß die Verteilung extrem scharf ist und daß das Maximum der Gesamtentropie damit den Gleichgewichtszustand bestimmt. Dies schließt den ersten wichtigen Schritt in diesem Kapitel ab. Um das Problem der treibenden Kräften eines “ai -Austauschs” zu verstehen, betrachten wir im Folgenden die Abhängigkeit der Entropie von den äußeren Paramtern und bestimmen die partiellen Ableitungen ∂S/∂ai = kB ∂ ln Ω/∂ai . Dies führt uns zu einer allgemeineren Definition der in Kapitel 2.8 eingeführten verallgemeinerten Kräfte. Die mikrokanonische Zustandssumme ist durch X Ω(E, a) = 1 r:E≤Er (a)≤E+δE gegeben. Es gilt für jeden beliebigen der äußeren Parameter (den wir hier als a1 wählen ln Ω(E, a1 + δa1 , a2 , . . . , an ) − ln Ω(E, a1 , a2 , . . . , an ) ∂ ln Ω = lim . δa1 →0 ∂a1 δa1 Um diesen Ausdruck auszuwerten müssen wir die beiden Zustandssummen bestimmen. Wir betrachten also X Ω(E, a1 + δa1 , a2 , . . . , an ) = 1 r:E≤Er (a1 +δa1 ,...,an )≤E+δE X = 1 r:E≤Er (a1 ,...,an )+dEr ≤E+δE X = 1 r:E−hdEr i≤Er (a1 ,...,an )≤E−hdEr i+δE = Ω(E − hdEr i , a1 , a2 , . . . , an ) . Die Summe läuft über sehr viele Mikrozustände r (diejenigen mit Energie in [E, E + δE]), die alle mit dem gleichen Gewicht beitragen. Dies entspricht der Mittelwertbildung mit der Verteilung Gl. (2.3) und wir haben die Energieverschiebung dEr = 26 ∂Er δa1 ∂a1 Erneut in strikter Analogie zu den Überlegungen zur Verteilung der Energie. 54 KAPITEL 2. GRUNDÜBERLEGUNGEN durch den Mittelwert hdEr i = ∂Er ∂a1 δa1 = − hα1 i δa1 ersetzt. Wir haben dabei die in Kapitel 2.8 eingeführte verallgemeinerte Kraft in die Gleichung eingeführt. Zusammengenommen gilt dann ∂ ln Ω ∂ ln Ω = hα1 i = β hα1 i . ∂a1 ∂E Für ein allgemeines ai ergibt sich hαi i = kB T ∂ ln Ω(E, a) ∂S(E, a) =T . ∂ai ∂ai Wir haben damit eine sehr fundamentale Relation zwischen den verallgemeinerten Kräften und der Ableitung der Entropie nach den äußeren Parametern hergeleitet. Wir hätten diese auch von Anfang an als die Definitionsgleichung für die verallgemeinerten Kräfte nehmen können! Sie ist allgemeingültiger als die Einführung dieser Kräfte in Kapitel 2.8 der ein quasistatischer Prozeß und der Bezug zur Arbeit zugrunde lag. Im Rahmen des mikrokanonischen Ensembles können wir damit aus der mikroskopischen Größe Ω(E, a) die makroskopischen Größen Entropie S = kB ln Ω(E, a) , Temperatur T −1 = ∂S(E, a) ∂E und verallgemeinerte (konjugierte) Kräfte hαi i = T ∂S(E, a) ∂ai berechnen. Alle diese Größen sind Funktionen der den Makrozustand festlegenden Parameter E und a. Betrachten wir als konkretes Beispiel das ideale Gas (bei fester Teilchenzahl N ) und ai = V , so gilt (siehe auch Übungen) S(E, V ) = kB ln Ω(E, V ) , 1 ∂S(E, V ) = , T (E, V ) ∂E P (E, V ) ∂S(E, V ) = . T (E, V ) ∂V Wir werden nun die beiden wesentlichen Einsichten diese Kapitels zusammenführen. Wir betrachten dazu exemplarisch zwei Systeme A und A0 zwischen denen Volumen und Wärme ausgetauscht werden kann (denken sie an das ideale 2.13. GLEICHGEWICHT, ENTROPIE UND KRÄFTE 55 Gas), wobei die Gesamtenergie Eg = E +E 0 und das Gesamtvolumen Vg = V +V 0 konstant bleiben. Nach unseren obigen Überlegungen wird die Gesamtentropie im Gleichgewicht maximal sein. Mathematisch wird Sg (E, V ) = S(E, V ) + S 0 (Eg − E, Vg − V ) maximal bei den Gleichgewichtswerten von E und V . Somit muß nach Gl. (2.16) ∂Sg (E, V ) =0 ∂E T = T0 ⇒ und gleichzeitig auch ∂Sg (E, V ) ∂S(E, V ) ∂S 0 (E 0 , V 0 ) = − =0, ∂V ∂V ∂V 0 also ∂S(E, V ) ∂S 0 (E 0 , V 0 ) = ∂V ∂V 0 ⇒ P P0 = 0 T T gelten. Bei Wärme und Volumenaustausch ist somit das Gleichgewicht durch eine gleiche Temperatur und einen gleichen Druck in beiden Untersystemen gegeben. Dieses Kapitel abschließend wollen wir noch die Relation dS = d¯Q/T die wir in Kapitel 2.10 für den Austausch kleiner Wärmemengen hergeleitet haben verallgemeinern. Wir betrachten dazu einen infinitesimalen quasistatischen Prozeß in dem das System A durch Wechselwirkung mit A0 vom Gleichgewichtszustand (hEi , ha1 i , . . . , han i) in den Gleichgewichtszustand (hEi + d hEi , ha1 i + d ha1 i , . . . , han i + d han i) gebracht wird (Austausch der Energie und der äußeren Parameter). Die Zahl der zugänglichen Zustände ändert sich gemäß n X ∂ ln Ω ∂ ln Ω d hEi + d hai i d ln Ω = ∂E ∂ai i=1 ! n X = β d hEi + hαi i d hai i , i=1 wobei wir die allgemeine Definition der äußeren Kräfte verwendet haben. Der zweite Term in der Klammer ist nun das negative der quasistatischen makroskopischen Arbeit (siehe Kapitel 2.8). Damit gilt unter Verwendung des ersten Hauptsatzes T dS = d hEi − d¯W ⇒ dS = d¯Q . T Dies ist die angestrebte Verallgemeinerung der Relation aus Kapitel 2.10 die mithin gültig bleibt, wenn die äußeren Parameter quasistatisch verändert werden. 56 KAPITEL 2. GRUNDÜBERLEGUNGEN Läuft der Prozeß zusätzliche adiabatisch ab, d.h. gilt d¯Q = 0, so folgt dS = 0 . Also ändert sich S bzw. die Zahl der Mikrozustände Ω nicht (die Energie aber schon!), wenn die äußeren Parameter quasistatisch um einen endlichen Bertrag verändert werden. Der Prozeß ist reversibel, da Se = Sa (bzw. Ωe = Ωa ; siehe Kapitel 2.5). 2.14 Der zweite und der dritte Hauptsatz In diesem Kapitel wollen wir die obige Diskussion in Form des zweiten und dritten Hauptsatzes im Hinblick auf die Thermodynamik zusammenfassen. Zur Erinnerung und der Vollständigkeit halber erwähnen wir zunächst den im Kapitel 2.6 hergeleiteten ersten Hauptsatz. Bei einem infinitesimalen Prozeß gilt dE = d¯Q + d¯W . Die Energieänderung dE = d hEi eines Systems27 wird in die aufgenommene Wärme d¯Q und die am System geleistete Arbeit d¯W zerlegt. Praktisch unterscheidet man dadurch zwischen beiden, daß man im Experiment die beiden Grenzfälle untersucht, in denen sich entweder die äußeren Parameter nicht ändern (d¯W = 0) oder durch thermische Isolierung dem System keine Wärme zugefügt wird (d¯Q = 0). Um den Unterschied zu nachfolgenden Überlegungen klar zu machen soll betont werden, daß das betrachtete System nicht abgeschlossen ist. Man führt manchmal auch einen nullten Hauptsatz ein. Er lautet: Sind zwei Gleichgewichtssysteme mit einem dritten im thermischen Gleichgewicht, so sind sie auch miteinander im thermischen Gleichgewicht. Diese Überlegung hat offensichtlich eine sehr enge Beziehung zum Begriff der Temperatur. Wir wollen nun den zweiten Hauptsatz formulieren. Dazu betrachten wir zunächst ein abgeschlossenes (Gesamt-)System. Basierend auf unserem fundamentalen Postulat haben wir gezeigt, daß der Gleichgewichtszustand durch das Maximum der (Gesamt-)Entropie festgelegt ist. Damit gilt für die Änderung der Entropie in einem abgeschlossenen (Gesamt-)System ∆S ≥ 0 . (2.17) Die Definition der Entropie setzt das Gleichgewicht voraus. Damit muß die Entropieänderung ausgehend von einem Gleichgewichtszustand und nach Erreichen eines neuen bestimmt werden (z.B. für zwei zunächst nicht in Kontakt stehende Subsysteme, die jeweils im Gleichgewicht sind und dann in Kontakt gebracht werden und ein neues Gleichgewicht erreichen). 27 Da ja P (E, a) im Gleichgewicht scharf um die Mittelwerte zentriert ist, werden wir nicht zwischen E und dem Mittelwert hEi unterscheiden. 2.14. DER ZWEITE UND DER DRITTE HAUPTSATZ 57 Als nächstes betrachte wir ein offenes System, also das Subsystem A eines zusammengesetzten Systems. Die Entropie des Gleichgewichtszustands von A hängt von E = hEi und a = hai ab.28 Es gilt n n X ∂S dE X hαi i ∂S dE + dai = + dai . dS = ∂E ∂ai T T i=1 i=1 Im letzten Kapitel hatten wir für einen quasistischen Prozeß aus dieser Relation geschlossen, daß dS = d¯Qqs . T (2.18) Später werden wir betrachten wie sich die Situation ändert, wenn der Prozeß nicht quasistatisch verläuft. Die Gln. (2.17) und (2.18) können beide als der zweite Hauptsatz aufgefaßt werden. Es gibt heutzutage keine einheitliche Formulierung dieses. Sie werden womöglich schon von den traditionellen, thermodynamischen Formulierungen des zweiten Haupsatzes gehört haben, die zum Teil Bezug zu sogenannten Wärmekraftmaschienen und perpetum mobiles machen. Wir werden diese im Abschnitt über die Thermodynamik betrachten. Wir wollen bereits hier kurz andeuten, wie man die Relation (2.18) in der Thermodynamik verwenden kann, um die Entropieänderung ∆S bei einem Prozeß von einem Gleichgewichtszustand (a; mit Ta , Va , . . .)29 zu einem anderen (e; Te , Ve , . . .) zu berechnen. Wir gehen dabei davon aus, daß der Makrozustand nur durch die Temperatur charaketrisiert ist, was dann der Fall ist, wenn alle anderen Parameter (z.B. Druck und Volumen) konstant gehalten werden. Wir müssen natürlich entlang eines quasistatischen Weges gehen da die zu verwendende Relation sonst ihre Gültigkeit verliert. Längs diese Weges durchläuft das System eine Reihe von Gleichgewichtszuständen, so daß die Temperatur T (E, a) bei jedem Zwischenschritt definiert ist. Es gilt dann Z e d¯Qqs ∆S = . T a In einem quasistatischen Prozeß wird die Temperatur durch die Zufuhr der Wärme d¯Qqs von T auf T + dT erhöht. Als C= 28 d¯Qqs dT Da ja P (E, a) im Gleichgewicht scharf um die Mittelwerte zentriert ist, werden wir nicht zwischen den Werten der Parameter E und a und ihren Mittelwerten unterscheiden. 29 Der Kontext sollte klar machen, ob mit a die äußeren Parameter oder der Index für “Anfang” gemeint ist. 58 KAPITEL 2. GRUNDÜBERLEGUNGEN definiert man die Wärmekapazität. Bezieht man diese Größe auf die Masse ergibt sich die spezifische Wärme c. Man unterscheidet die Wärmekapazität bzw. die spezifische Wärme danach, welcher der makroskopischen äußeren Parameter (Druck oder Volumen) bei der Wärmezufuhr konstant gehalten wird (cP und cV ). Mehr dazu später. Nehmen wir nun an, daß die Wärmekapazität (zumindest für das uns interessierende Intervall) nicht von der Temperatur abhängt. Dann gilt Z e Z e dT Te d¯Qqs C = = C ln . ∆S = T T Ta a a Für die Wärmemenge gilt ∆Q = C(Te − Ta ) . Sollte die Wärmemenge bei konstanten äußeren Parametern zugefügt werden, so können wir diese Ergebnisse auch verwenden, wenn der Prozeß nicht quasistatisch verläuft (siehe Kapitel 2.10). Wir kommen nun zum dritten Hauptsatz der Thermodynamik. Er besagt, daß die Entropie eines Gleichgewichtssystems die in Kapietl 2.9 diskutierte Eigenschaft T →0 ⇒ S → S0 mit einer vom Entartungsgrad abhängigen Konstante S0 hat. Auch wenn wir die Hauptsätze aus unseren mikroskopischen Überlegungen extrahiert haben, machen sie selbst keinen Bezug zur Mikroskopik mehr. Man kann sie daher auch ohne jeglichen mikroskopischen Bezug als Grundlage (genauer als Postulate) einer phänomenologischen Theorie, der Thermodynamik, betrachten. Der Bezug zur statistsichen Mechanik entsteht, wenn man die mikrokanonischen Zustandssumme Ω bzw. die Entropie S = kB ln Ω für ein gegebenes System berechnet. Wir haben bereits gesehe, wie man aus dieser die Temperatur und die verallgemeinerten (konjugierten) Kräfte berechnen kann. 2.15 Messung makroskopischer Parameter Bevor wir uns im Abschnitt über die Thermodynamik von der mikroskopischen Begründung der Hauptsätze vollkommen befreien können, müssen wir betrachten, wie man die zentralen makroskopischen Größen “im Prinzip” messen kann. Die an einem System geleistete Arbeit ist einfach zu bestimmen, da man die äußere makroskopischen Parameter und die mittleren verallgemeinerten Kräfte direkt messen kann (Bezug zur Mechanik). Betrachten wir als Beispiel die Situation in dem das Volumen eines Systems quasistatisch verändert wird und während dieses Prozesses einen meßbaren (mittlere) Druck P (V ) hat. Wir gehen dann vom 2.15. MESSUNG MAKROSKOPISCHER PARAMETER 59 durch Va definierten Makrozustand in den durch Ve definierten über. Dann gilt (wie bereits in Kapitel 2.8 angedeutet) Z Ve P (V )dV . W =− Va Die Messung der Energieänderung ∆ hEi eines Systems können wir auf die geleistete Arbeit zurückführen, wenn wir ein thermisch isoliertes System betrachten. Dann gilt ∆ hEi = W . Wir können also Energiedifferenzen ∆ hEi = hEe i − hEa i messen. Nur solche sind von physikalischer Bedeutung, so daß die Energie nur bis auf einen willkürlichen Nullpunkt festgelegt ist. Dieses sollte ihnen aus der klassischen Mechanik bekannt sein (additive Konstante bei potentieller Energie). Man bezeichnet die (mittlere) Energie hEi im Rahmen der Thermodynamik auch gerne als innere Energie. Die Wärme die beim Übergang von einem Makrozustand (Index a) zu einem anderen (Index e) absorbiert wird ist nach dem ersten Hauptsatz durch Q = hEe i − hEa i − W gegeben. Da bereits klar ist, wie man ∆ hEi = hEe i − hEa i und W (“im Prinzip”) messen kann, kann auch Q gemessen werden. Da wir zuvor immer darauf geachtet haben, daß die Aufteilung in Arbeit und Wärme “sinnvoll” sein muß, sollten wir kurz exemplarisch beschreiben, wie man mit Hilfe dieser Relation die Wärme die einem System zugeführt wird messen kann. Wir nehmen an, daß wir die Wärme Q messen wollen, die von einem System A absorbiert wird, wenn die äußeren Parameter festgelegt sind. Wir bringen A in einen thermischen Kontakt mit einem System A0 an dem Arbeit geleistet werden kann. Mit Hilfe der Arbeit W die an A0 geleistet wird führen wir über den thermischen Kontakt dem System A die Wärme Q zu. Da das zusammengesetzte System aus A und A0 mit keinem anderen System Wärme austauscht gilt W = ∆ hEi + ∆ hE 0 i . Für das System A gilt (da an ihm keine Arbiet geleistet wird) Q = ∆ hEi . Insgesamt erhalten wir also Q = W − ∆ hE 0 i . Da wir nun bereits wissen, wie wir W und ∆ hE 0 i messen können, können wir Q messen. In Kapitel 2.1 haben wir diskutiert, wie man die Temperatur in Bezug auf ein bestimmtes Thermometer bestimmen kann. Dabei wird jedoch nicht die Messung 60 KAPITEL 2. GRUNDÜBERLEGUNGEN der absoluten Temperatur T festgelegt. Die absolute Temperatur liefert (i) einen “Parameter” Temperatur, der unabhängig von der Natur des zur Messung benutzten Thermometers ist und ist (ii) einen “Parameter” der in die fundametalen Gleichungen eingeht. Da wir ja auf die Thermodynamik abzielen, wollen hier hier natürlich am liebsten zur Bestimmung von T nur Relationen wählen, die auf rein makroskopischen Aussagen beruhen, also z.B. auf dS = d¯Q/T . Dies ist möglich (auch wenn wir zuvor noch sagen müßten, wie wir die Entropie messen), jedoch mit dem bisher hier dargestellten noch zu schwer verständlich. Wir wählen somit eine “Meßmethode” die zu unseren mikroskopischen Überlegungen Bezug nimmt. In den Übungen haben sie die Zustandsgleichung des idealen Gases P V = N kB T im mikrokanonischen Ensemble hergeleitet und in Kapitel 2.12 haben sie gesehen, daß diese auch im Rahmen des kanonischen Ensembles abgeleitet werden kann. Man geht nun wie folgt vor. Wir nehmen ein “Gasthermometer” bei dem das Volumen konstant gehalten wird. Damit ist der Druck der thermometrische Parameter. Dieser ist nach der Zusandsgleichung der absoluten Temperatur proportional. Wird das Gasthermometer mit einem System A in Kontakt gebracht, so stellt sich nach Erreichen des Gleichgewichts der Druck PA ein. Ein Druck PB stellt sich ein, wenn das Thermometer mit dem System B in thermischen Kontakt gebracht wird. Es gilt dann TA PA = PB TB mit den absoluten Temperaturen TA und TB der Systeme. Damit ist das Verhältnis zweier absoluter Temperaturen festgelegt. Wählt man nun das Systme B als ein “Meßnormal” in einem festgelegten Standardmakrozustand, so mißt man mit dem Gasthermometer das Verhältnis der absoluten Temperatur T irgendeines Systems zur Temperatur TB des Meßnormals. Gemäß Konvention wählt man (reines) Wasser als Meßnormal und als Standardmakrozustand, den Zustand des Wassers, bei dem die feste, flüssige und gasförmige Phase miteinander im Gleichgewicht sind.30 Man nennt diesen Punkt den Tripelpunkt. Man legt dann fest, daß am Tripelpunkt Ttrip = 273.16K (in der Kelvin-Skala) gelten soll. Diese Festlegung ist eindeutig, da es nur einen einzigen Wert von Druck und Temperatur gibt, bei dem alle drei Phasen im Gleichgewicht koexistieren. Das Phasendiagramm ist in der folgenden Abbildung skizziert. 30 Wir werden in dieser Vorlesung natürlich Phasen und die Übergänge von einer zu einer anderen noch genauer diskutieren. 2.15. MESSUNG MAKROSKOPISCHER PARAMETER 61 P flüssig fest gasf. 273.16 K T Die Wahl von Ttrip = 273.16K ist historisch motiviert (Übereinstimmung mit älterer Skala). Ist nun die absolute Temperatur festgelegt, so läßt sich aus der Zustandsgleichung die (Boltzmann-)Konstante festlegen (den Wert haben wir bereits weiter oben genannt). Ein makroskopisches System sei nun durch eine absolute Temperatur und eine weitere Zustandsgröße z (z.B. Volumen oder Druck) beschrieben. Wir führen dem System bei Temperatur T die infinitesimale Wärmemenge d¯Q zu. Die resultierende Temperaturänderung dT hängt dann vom konkreten System und T sowie z ab. Wir definieren die oben bereits eingeführte Wärmekapazität bei konstantem z als31 d¯Q . Cz (T, z) = dT z Gemäß d¯Q = T dS können wir auch Cz (T, z) = T ∂S ∂T z schreiben. In dem wir Cz durch die Zahl der Mole (siehe später) oder die Masse teilen, können wir die spezifische Wärme cz einführen. Bei einem Gas oder einer Flüssigkeit spielen CP (cP ) und CV (cV ) eine wichtige Rolle. Bei der Bestimmung von CV bzw. cv gilt d¯Q = d hEi da keine Arbeit geleistet wird. Um cp zu bestimmen muß man dagegen zulassen, daß sich das Volumen ändert. Damit folgt d¯Q = d hEi + P dV (P > 0 und dV > 0). Für ein festes d¯Q wird somit die innere Energie und auch die Temperatur im zweiten Fall um einen kleineren Betrag 31 Schon hier wollen wir festhalten, daß d¯Q 6= 0 nicht zwangsläufig dT 6= 0 bedingt. Bei Phasenänderungen kann es dazu kommen, daß sich trotz Wärmezufuhr die Temperatur nicht ändert (latente Wärme). 62 KAPITEL 2. GRUNDÜBERLEGUNGEN zunehmen. Aufgrund dieser Überlegung erwartet man cP > cV . Werden alle äußeren Parameter konstant gehalten so gilt d¯W = 0, also d¯Q = d hEi und damit ∂E d¯Q = . CV = dT V ∂T V In einem letzten Schritt müssen wir nun noch diskutieren, wie die Entropie zu messen ist. Wir können die Entropie eines Makrozustands (Index e) bezogen auf einen Bezugszustand (Index a) “messen”, in dem wir von a nach e mit einem beliebigen quasistatischen Prozeß gehen und das Integral Z e d¯Q Se − Sa = T a berechnen (d¯Q und T sind “bereits” meßbar!). Im letzten Kapitel haben wir dieses Integral ja bereits für den Fall exemplarisch ausgewertet, bei dem der Makrozustand nur durch die Temperatur festgelegt ist und die Wärmekapazität als temperaturunabhängig angenommen wird. Wir kehren zu dieser Situation zurück und betrachten als Beispiel den Fall, daß zwei Systeme A und A0 in thermischen Kontakt gebracht werden. Vor dem Kontakt haben sie die Temperaturen T bzw. T 0 und nachher (im Gleichgewicht) die Temperatur Te . Dann gilt nach unserer obigen Überlegung ∆S = S(Te ) − S(T ) = mA cA ln Te T und analog für A0 . Hier bezeichnet cA (bzw. cA0 ) die spezifische Wärme des Systems A (bzw. A0 ) bei konstanten äußeren Parametern. Für die gesamte Änderung der Entropie gilt somit ∆S + ∆S 0 = mA cA ln Te Te + mA0 cA0 ln 0 . T T Wir wollen nun explizit zeigen, daß ∆S + ∆S 0 als Gesamtentropieänderung eines abgeschlossenen Systems nicht negativ ist (im Einklang mit dem zweiten Hauptsatz Gl. (2.17)). Wir verwenden dabei ln x ≤ x − 1 , wobei Gleicheit für x = 1 gilt. Daraus folgt ln x ≥ 1 − x−1 , 2.15. MESSUNG MAKROSKOPISCHER PARAMETER 63 mit Gleichheit ebenfalls bei x = 1. Damit können wir abschätzen T T0 0 ∆S + ∆S ≥ mA cA 1 − + m A 0 cA 0 1 − Te Te −1 = Te [mA cA (Te − T ) + mA0 cA0 (Te − T 0 )] . Da aber nun wegen des ersten Hauptsatzes (siehe Kapitel 2.14) Q + Q0 = mA cA (Te − T ) + mA0 cA0 (Te − T 0 ) = 0 folgt ∆S + ∆S 0 ≥ 0 . Wir haben jetzt wieder die Situation, daß unsere Vorschrift nur die Messung von Differenzen, hier Entropiedifferenzen ermöglicht. Für die Situationen, in denen es nur auf solchen ankommt, benötigen wir keine weiteren Überlegungen. Wie wir jedoch bereits aus der Mikroskopik wiessen, ist die Entropie (im Gegensatz z.B. zur Energie) eine eindeutige Größe. Wenn man den Bezug zu dieser zuläßt, dann könnte man einfach die Entropie S0 im Limes T → 0 für einen Standardzustand berechnen oder man mißt relativ zu einem Bezugssystem dessen S0 (für T → 0) man kennt. 64 KAPITEL 2. GRUNDÜBERLEGUNGEN Kapitel 3 Thermodynamik In den vorhergehenden Kapiteln haben wir uns von der mikroskopischen Betrachtung von Vielteilchensystemen unabhängig gemacht und die Hauptsätze der Thermodynamik formuliert. Diese bilden die Grundlage der phänomenologischen Betrachtung von makroskopischen Eigenschaften von Vielteilchensystemen im Rahmen der Thermodynamik. 3.1 Differentiale In der Thermodynamik betrachten wir homogene Gleichgewichtszustände. Die Prozesse werden meist als quasistatisch angenommen, so daß bei allen Zwischenzuständen die Thermodynmik angewandt werden kann. Auf makroskopischer Skala gelingt die Charakterisierung mit Hilfe weniger Zustandsgrößen. Als solche haben wir bereits die Teilchenzahl N , das Volumen V den Druck P , die Temperatur T , die Energie1 E und die Entropie S kennen gelernt. Weitere solche ~ und das externe Magnetfeld B ~ in Zustandsgrößen sind die Magnetisierung M magnetischen Systemen oder die elektrische Polarisation P~ und das externe elek~ in elektrisch geladenen Systemen. Wie auch bereits wissen sind trische Feld E nicht alle diese Größen unabhängig. Es ist nun eine der Aufgaben der Thermodynamik aufbauend auf den axiomatischen Hauptsätzen Beziehungen zwischen den Zustandsgrößen herzustellen. Diese Beziehungen sind die Zustandsgleichungen, z.B. P = P (T, V, N ) thermische Zustandsgleichung , E = E(T, V, N ) kalorische Zustandsgleichung , ~ = M ~ (T, V, B) ~ paramagnetische Zustandsgleichung M und der gewählte Satz von unabhängigen Zustandsgrößen bildet die Zustandsvariable. Wie wir bereits aus unseren Grundüberlegungen wissen, sind dieses z.B. 1 Wir unterscheiden hier nicht mehr zwischen E und hEi. 65 66 KAPITEL 3. THERMODYNAMIK die makroskopischen Variable (E, V, N ) , (T, V, N ) , (T, P, N ) , (S, V, N ) , . . . . Welchen Satz man hier wählt ist eine Frage der Zweckmäßigkeit. Es ist wichtig festzuhalten, daß man normalerweise für eine Zustandsgröße nur einen Buchstaben einführt auch wenn diese unterschiedliche Funktionen der verschiedenen Sätze von Zustandsvariablen sein können. So schreiben wir einerseits S = S(E, V ) wenn (bei festem N ) E und V als Zustandsvariable gewählt werden, aber auch S = S(T, V ) wenn T und V die Zustandsvariablen sind. Beide Größen sind natürlich unterschiedliche Funktionen ihrer zwei Variablen. Man muß also sehr genau aufpassen, welches die aktuellen Variablen sind. Die Thermodynamik liefert auch Beziehungen zwischen den Zustandsgleichungen. Ein Beispiel ist ∂P ∂E = −P + T . ∂V T,N ∂T V,N Die Indizes zeigen an, welche Zustandsvariablen konstant gehalten werden. Die Thermodanymik liefert ebenfalls Zusammenhänge zwischen infinitesimalen Änderungen von Zustandsgrößen, z.B. für einen quasistatischen Prozeß (bei festem N ) dE = T dS − pdV . Eine Zustandsgröße f kann extensiv oder intensiv sein. Diese Begriffe definieren wir wie folgt. Wir betrachten zwei Subsysteme A und A0 . Die Zustandsgröße f ist dan extensiv falls2 fg = f + f 0 . Daraus ergibt sich, daß f proportional zur Teilchenzahl ist. Beispiele sind E und S. Die Größe heißt intensiv falls fg = f = f 0 . Beispiele dafür sind der Gleichgewichtsdruck P und die Temperatur T . Werden bei Prozessen Zustandsgrößen nicht geändert, so erhalten sie die Vorsilbe “iso”, z.B. isotherm (T =const.), isobar (P =const.) und isochor (V =const.). Wie diese Überlegungen andeuten, müssen wir genauer lernen mit Differentialen umzugehen. Wir betrachten eine vektorwertige Funktion f~ (mit n Komponenten) eines Vektors ~x (ebenfalls mit n Komponenten): f~(~x). Wir ändern nun die Variable von ~x nach ~x + d~x und betrachten das Differential f~(~x) · d~x = n X fi (~x)dxi . i=1 2 Notation wie in den vorhergehenden Kapiteln. 3.1. DIFFERENTIALE 67 Der Satz von Stokes lautet dann in n Dimensionen I Z X ∂f ∂f j i − dxi dxj . f~(~x) · d~x = σi,j ∂x ∂x j i C F i,j i>j Dabei bezeichnet C eine geschlossene Kurve, Fi,j die Fläche, die von der Projektion von C auf die (xi , xj )-Ebene eingeschlossen wird und σi,j das von der Orientierung mit der Fi,j durchlaufen wird abhängige Vorzeichen. Um diese Aussage zu “beweisen” zerlegen wir das Integral über den geschlossenen Weg C in eine Summe von Integralen über kleine geschlossene Rechtecke. Damit müssen wir den Satz von Stokes nur für ein Rechteck zeigen. Wegen der Drehinvarianz (f~(~x) · d~x ist ein Skalar), reicht es, daß Rechteck in die (x1 , x2 )-Ebene zu legen. Es gilt I f~(~x) · d~x = R Z x1 +dx1 f1 (x01 , x2 )dx01 x1 x2 +dx2 + f2 (x1 + dx1 , x02 )dx02 x2 Z x1 +dx1 − Z Z x1 x1 +dx1 = f1 (x01 , x2 + dx2 )dx01 Z x2 +dx2 − f2 (x1 , x02 )dx02 x2 [f1 (x01 , x2 ) − f1 (x01 , x2 + dx2 )] dx01 x1 Z x2 +dx2 + [f2 (x1 + dx1 , x02 ) − f2 (x1 , x02 )] dx02 x2 ≈ − ∂f2 ∂f1 dx1 dx2 + dx1 dx2 ∂x2 ∂x1 wobei wir in der letzten Zeile Terme höherer Ordnung in den kleinen Größen dx1 und dx2 vernachlässigt haben. Es gilt also I ∂f1 ∂f2 ~ − dx1 dx2 f (~x) · d~x ≈ ∂x1 ∂x2 R und damit der Satz von Stokes. Aus dem Satz von Stokes folgt, daß die folgenden Aussagen äquivalent sind: 1. Integrabilitäsbedingung 2. H C ∂fi ∂xj = ∂fj ∂xi für alle i, j. f~(~x) · d~x = 0. 3. Es existiert eine Funktion F (~x) mit dF = F (~x + d~x) − F (~x) = f~(~x) · d~x. Gelten diese Relationen, so nennt man das Differential vollständig, sonst nicht vollständig. Wir wollen diese Äquivalenzen “beweisen”. Dabei ist wegen des Satz 68 KAPITEL 3. THERMODYNAMIK von Stokes klar, daß 1. ⇒ 2.. Wir zeigen als nächstes 2. ⇒ 3.. Dazu definieren wir Z f~(~x0 ) · d~x0 F (~x) = F (~x0 ) + C~x0 →~x wobei C~x0 →~x ein beliebiger Weg ist, der ~x0 mit ~x verbindet. Wegen 2. kommt es auf den Weg selbst nicht an. Der Wert des Integrals ist immer derselbe. Das Verschwinden des geschlossenen Integrals bedeutet auch, daß F (~x) keine Sprünge hat. Wählt man jetzt als C~x→~x+d~x eine Gerade, so gilt F (~x + d~x) = F (~x) + f~(~x) · d~x ⇒ dF~ = f~(~x) · d~x . Es fehlt nun noch, daß wir 3. ⇒ 1. zeigen. Es gilt ∂F · d~x , f~(~x) · d~x = F (~x + d~x) − F (~x) = ∂~x wobei wir in der letzten Gleichung eine Taylorentwicklung angewandt haben. Da d~x beliebig ist, gilt f~ = ∂F/∂~x und damit ∂ 2F ∂ 2F ∂fj ∂fi = = = . ∂xj ∂xj ∂xi ∂xi ∂xj ∂xi Damit ist die Äquivalenz der Aussagen “gezeigt”. Um endliche Änderungen einer Zustandsgröße bei einem Prozeß zu berechnen ist es wichtig zu wissen, wie man F (~x) aus dem Gradienten ∂F/∂~x berechnen kann. Liegt ein vollständiges Differential vor, so gilt Z ∂F F (~x) = F (~x0 ) + (~x) · d~x x C~x0 →~x ∂~ unabhängig vom gewählten Weg, der ~x0 mit ~x verbindet. Dabei ist F (~x0 ) eine Integrationskonstante. Wir stellen somit fest, daß wir den Weg geeignet wählen können. Als Beispiel betrachten wir n = 2 und wählen Geradenstücke entlang der xi -Richtungen als Weg. Dann gilt F (x1 , x2 ) = (0) (0) F (x1 , x2 ) Z x1 + (0) x1 (0) ∂F (x01 , x2 ) 0 dx1 + ∂x01 Z x2 (0) x2 ∂F (x1 , x02 ) 0 dx2 . ∂x02 Folgend wollen wir wichtige Relationen zwischen partiellen Ableitungen diskutieren. Gegeben sei die Funktion zweier Veränderlicher z = z(x, y). Wir gehen davon aus, daß man diese Beziehung eindeutig auflösen kann3 und erhalten so 3 Weitere Überlegungen dazu finden sie in der mathematischen Literatur oder im Skript zur “Einführung in die Theoretische Physik”; siehe L2 P. 3.1. DIFFERENTIALE x = x(y, z) sowie y = y(x, z). Es gilt dann ∂z 1 = ∂x , ∂x y ∂z y ∂z ∂y ∂z = − . ∂x y ∂y x ∂x z 69 (3.1) (3.2) In der ersten Relation ist y konstant gehalten, so daß man sie als Beziehung zwischen der Ableitung einer Funktion einer Veränderlichen und der Ableitung der entsprechenden Umkehrfunktion verstehen kann. In diesem Kontext zeigt man sie sehr leicht mit Hilfe der Kettenregel oder Konstruktiv.4 Wir können hier aber durch die Bertrachtung von Differentialen auch anders vorgehen. Dazu betrachten wir ∂z ∂z dz = dx + dy . ∂x y ∂y x “Multiplizieren” wir nun mit 1/dz und setzen dy = 0 so folgt ∂z ∂x 1= ∂x y ∂z y und damit die erste Relation. Die zweite erhalten wir, in dem wir mit mit 1/dx “multiplizieren” und dz = 0 setzen ∂z ∂z ∂y 0= + . ∂x y ∂y x ∂x z Um zu zeigen, daß dieser “elegante Beweis” tatsächlich richtig ist, gehen wir noch einmal “konventioneller” vor. Wir betrachten z = z(x(y, z), y) (implizite Gleichung). Bilden wir die partielle Ableitung nach z bei konstantem y so gilt nach Kettenregel (wie oben schon erwähnt) ∂x ∂z . 1= ∂x y ∂z y Bilden wir die partielle Ableitung nach y bei konstantem z so gilt nach Kettenregel ∂z ∂x ∂z 0= + . ∂x y ∂y z ∂y x Mit Hilfe der ersten Beziehung folgt dann die zweite. 4 Siehe z.B. Skript zur “Einführung in die Theoretische Physik”; siehe L2 P. 70 KAPITEL 3. THERMODYNAMIK Aus diesen Überlegungen zu den partiellen Ableitungen folgt, daß wenn (∂z/∂x)y und (∂z/∂y)x bekannt sind, alle anderen partiellen Ableitungen berechenbar sind, da 1 ∂x ∂x ∂z ∂x = ∂z , =− ∂z y ∂y z ∂z y ∂y x ∂x y und analog mit x und y vertauscht. Weitere wichtige Beziehungen zwischen partiellen Ableitungen ergeben sich aus den folgenden Überlegungen. Es seien f (x, y) und z(x, y) gegeben. Wie oben sei es möglich z “aufzulösen”: x = x(y, z), y = y(x, z). Damit können wir f1 (y, z) = f (x(y, z), y) , f2 (x, z) = f (x, y(x, z)) betrachten. Der in der Thermodynamik üblichen Notation folgend (siehe die Bemerkung oben) bezeichnen wir jedoch sowohl f1 wie auch f2 folgend mit f ! Wenn wir nun partielle Ableitungen bilden sieht man wieder an der auftretenden Variablen nach der abgeleitet wird und dem Index (konstantgehaltene Variable) um welche Funktion (f , f1 oder f2 ) es sich handelt. Wir betrachten das vollständige Funktional ∂f ∂f dx + dy . (3.3) df = ∂x y ∂y x “Multiplizieren” wir nun mit 1/dx und setzen dz = 0 so folgt ∂f ∂f ∂y ∂f = + . ∂x z ∂x y ∂y x ∂x z (3.4) “Sauberer” leitet man dieses Ergebnis mit Hilfe der Kettenregel her ∂f ∂f ∂y ∂f2 (x, z) = (x, y(x, z)) + (x, y(x, z)) (x, z) . ∂x ∂x ∂y ∂x “Multiplizieren” wir Gl. (3.3) mit 1/dz und setzen danach dx = 0 so folgt ∂f ∂f ∂y = . ∂z x ∂y x ∂z x Auch hier ergibt sich ein “sauberer” Beweis mit Hilfe der Kettenregel.5 Sind also die beiden in Gl. (3.3) auftretenden partiellen Ableitungen und y = y(x, z) bekannt, so kann man die partiellen Ableitungen auf den linken Seiten die f2 involvieren, berechnen. Analoge Relationen, die auf der linken Seite dann f1 involvieren, genauer die partiellen Ableitungen (∂f /∂y)z und (∂f /∂z)y , kann man 5 Sollte ihnen das nicht sofort klar sein, rechnen sie es bitte nach! 3.1. DIFFERENTIALE 71 aus Gl. (3.3) herleiten, in dem man die Rollen von x und y vertauscht. Im Ergebnis sind dann ebenfalls x und y vertauscht. Wir können also alle sechs möglichen partiellen Ableitungen von f aus nur zweien berechnen.6 Setzen wir jetzt (∂f /∂x)y und (∂f /∂x)z als bekannt voraus, so können wir weitere partielle Ableitungen wie folgt berechnen. Mit Gl. (3.4) folgt ∂f ∂f ∂y ∂f − = ∂x z ∂x y ∂y x ∂x z " # ∂f ∂f ∂f ∂x ⇒ = − . ∂y x ∂x z ∂x y ∂y z Durch die Kombination mit den obigen Ergebnissen lassen sich auf ähnliche Art erneut alle sechs partiellen Ableitungen aus zweien berechnen. Wir sehen also, daß nur zwei der partiellen Ableitungen bei gegebenem z = z(x, y) unabhängig sind. Wir wollen als nächstes in der Thermodynamik wichtige Homogenitätsrelationen beweisen. Wir betrachten dazu die Funktion f (~x, ~y ) mit x ∈ Rn und y ∈ Rm . Die Funktion sei homogen 1. Grades in ~x, d.h. es gilt f (λ~x, ~y ) = λf (~x, ~y ) . Unter dieser Voraussetzung folgt f (~x, ~y ) = ~x · ∂f (~x, ~y ) . ∂~x (3.5) Diese Beziehung folgt sofort wenn wir die Homogenitätsrelation nach λ differenzieren und anschließend λ = 1 setzen. Der Gradient F~ = ∂f /∂~x ist eine vektorwertige Funktion. Es gilt ~x · dF~ = 0 was man wie folgt sieht ∂f = ~x · F~ ∂~x df = ~x · dF~ + F~ · d~x = ~x · dF~ + df ~x · dF~ = 0 . f = ~x · ⇒ ⇒ Für n = 1 folgt speziell, daß (bei x 6= 0) ∂f f = ∂x ~y x 6 Dabei geht natürlich zusätzlich die Information über z = z(x, y) ein. 72 KAPITEL 3. THERMODYNAMIK unabhängig von x ist. Dies sieht man wie folgt f =x ∂f ∂x ⇒ ∂f 1 (x, ~y ) = f (x, ~y ) = f (x/x, ~y ) = f (1, ~y ) . ∂x x Folgend werden wir noch das wichtige Konzept der Legendre-Transformation einführen, welches ihnen bereits in der Vorlesung zur klassischen Mechanik begegnet sein sollte. Dazu sei f (x, y) gegeben. Wir definieren ∂f ∂f , Y = . X= ∂x y ∂y x Damit gilt df = Xdx + Y dy , wobei (x, X) und (y, Y ) konjugierte Paare bilden, und ∂X ∂Y = ∂y x ∂x y was die Integrabilitätsbedingung ist. Wir definieren die Legendre-Transformation ∂f . g = f − xX = f − x ∂x y Es gilt dg = df − xdX − Xdx = −xdX + Y dy , so daß X und y die natürlichen Variablen von g sind: g = g(X, y). Für g gilt ∂g ∂g −x = , Y = ∂X y ∂y X und (Integrabilitätsbedingung) ∂x ∂Y − = . ∂y X ∂X y Um X und y als Variable wählen zu können, muß man die Beziehung X = X(x, y) = ∂f (x, y) ∂x nach x auflösen können: x = x(X, y). Gelingt das, so kann man g(X, y) = f (x(X, y), y) − x(X, y)X , Y (X, y) = ∂f (x(X, y), y) ∂y 3.2. ZUSTANDSGLEICHUNGEN 73 schreiben. Kann man X(x, y) nur lokal nach x auflösen (nicht global), so kann die Legendre-Transformation nur lokal definiert werden. Man kann nun auch noch einen Variablenwechsel von y zu Y vornehmen. Dazu betrachten wir die zweite Legendre-Transformation ∂f . h = g − yY = g − y ∂y x Analog zum ersten Schritt gilt (h = h(X, Y )) dh = −xdX − ydY , ∂h ∂h −x = , −y = , ∂X Y ∂Y X ∂x ∂y = . ∂Y X ∂X Y Man könnte natürlich auch nur eine Legendre-Transformation mit dem Variablenwechsel y → Y durchführen, aber bei x als Variabler bleiben ∂f v = f − yY = f − y ∂y x dv = Xdx − ydY , ∂v ∂v , −y = , X = ∂x Y ∂Y x ∂X ∂y = − . ∂Y x ∂x Y Die Integrabilitätsbedingung für die vier verschiedenen Sätze von unabhängigen Variablen führt auf vier Beziehungen zwischen partiellen Ableitungen. 3.2 Zustandsgleichungen Die Beziehung P = P (T, V ) nennt man die thermische Zustandsgleichung. Wir gehen dabei weiter davon aus, daß die Teilchenzahl N fest ist. Im Allgemeinen ist P auch eine Funktion von N . Wie wir bereits wissen gilt für das Beispiel des idealen Gases P = N kB T /V . Ändert man die Variablen so gilt ∂P ∂P dP = dT + dV . ∂T V ∂V T 74 KAPITEL 3. THERMODYNAMIK Man definiert nun das Kompressionsmodul ∂P K = −V ∂V T und den Spannungskoeffizienten 1 β= P ∂P ∂T . V Sind K und β als Funktionen von V und T bekannt, kann daraus nach unseren mathematischen Überlegungen des letzten Kapitels P (T, V ) duch Integration bis auf eine Konstante bestimmt werden. Die Größen K und β hängen direkt mit der isothermen Kompressibilität 1 1 ∂V = κ=− V ∂P T K (klar wegen Gl. (3.1)) und dem Ausdehnungskoeffizienten 1 ∂V β α= =P V ∂T P K zusammen. Letzteres sieht man wie folgt ∂V ∂P ∂V =− =− ∂T P ∂P T ∂T V 1 ∂P ∂V T ∂P ∂T , V wobei wir Gln. (3.1) und (3.2) angewandt haben. Sind κ und α als Funktionen von T und P bekannt so kann daraus durch Integration V (T, P ) bis auf eine Konstante bestimmt werden. Für das ideale Gas kann man sich die Zustandsgleichung auch ohne Bezug zur Mikroskopik verschaffen, in dem man beachtet, daß das ideale Gas im Limes N/V → 0 realisiert wird. Eine Taylorentwicklung gibt dann P̃ (T, N/V ) = P̃ (T, 0) + f (T ) = 0 + f (T ) N + O([N/V ]2 ) V N + O([N/V ]2 ) , V wobei der erste Summand Null ist, da der Druck bei N/V = 0 verschwinden muß. Damit folgt bereits P V = N f (T ) was das experimentell gefundene Gesetz von Boyle-Mariott ist (siehe oben). Experimentell stellt man weiter fest, daß f (T ) für alle Gase bei hinreichend hohen Temperaturen identisch ist. Die ist das Gesetz von Gay-Lussac. Mit der richtigen Wahl der Temperaturskala folgt dann die uns bereits bekannte Zustandsgleichung P V = N kB T . Man schreibt diese 3.2. ZUSTANDSGLEICHUNGEN 75 oft auch in anderer Form. Dazu geben wir die Teilchenzahl N auf andere Art an. Die Stoffmenge ν wird in der Chemie in der Einheit Mol angegeben, wobei 1 Mol der in 12 g des reinen Isotops Kohlenstoff-12 vorkommenden Zahl von Teilchen enspricht. Dies sind 6.022 . . . · 1023 Teilchen (Avogadro-Konstante). Durch die Stoffmenge ausgedrückt gilt P V = νRT mit der universellen Gaskonstanten R = 8.314 . . . J/(Mol K). Die Einsicht, daß die Molvolumina V /ν = RT /P für alle idealen Gase gleich sind bezeichnet man auch als Gesetz von Avogadro. Die Kompressibilität und den Ausdehnungskoeffizienten für das ideale Gas werden sie in Übungsaufgaben bestimmen. Wie wir bereits wissen haben die Isothermen P (V ) = kB T /(N V ) eines idealen Gases eine sehr einfache Form (siehe oben). Noch einfacher sind die Isobare V (T ) = N kB T /P und die Isochoren P (T ) = N kB T /V die lineare Funktionen sind. Wir wollen nun eine Zustandsgleichung betrachten, die im Gegensatz zu der des idealen Gases Aspekte der Wechselwirkung der Konstituenten berücksichtigt. Ein typisches Zweiteilchen-Wechselwirkungspotential ist in der folgenden Skizze dargestellt. 3 V(r) 2 1 0 -1 0 1 2 3 r 4 5 6 7 In ihm gibt es ein abstoßenden Potentialkern und einen anziehenden Schwanz, der durch die wie 1/r6 abfallenden van-der-Waals Wechselwirkungen erzeug wird.7 Den Effekt dieser Wechselwirkung versucht man im sogenannten van-der-Waals Gas an zwei Stellen zu berücksichtigen. Die abstossende Komponente führt dazu, daß andere Teilchen nicht in einen Bereich um ein Teilchen eindringen können. Wenn V das Volumen des Behälters ist, in dem sich das Gas befindet, dann ist das für ein Teilchen aufgrund dieses Effekts zur Verfügung stehende Volumen 7 Die van-der-Waals Wechselwirkung ist einen Diplowechselwirkung, die durch “Quantenfluktuationen” entsteht. 76 KAPITEL 3. THERMODYNAMIK um das sogenannte Eigenvolumen b mal der Teilchenzahl N reduziert und damit V /N → V /N − b. Es muß V /N > b gelten. Der anziehenden Komponenten wird durch folgenden Überlegung Rechnung getragen. Ziehen sich die Teilchen paarweise an, so kann es zu gebundenen Zuständen kommen. Dies führt dazu, daß sich der Druck auf die Wänden reduziert. Die Abhängigkeit dieser Reduktion von V und N können wir abschätzen. Die Reduktion ∆P des Druck auf die Wände ist proportional zur Zahl der pro Zeiteinheit auf ein Oberflächenelement auftreffenden Teilchen – die proportional zur Dichte N/V ist – und proportional zur Änderung des Impulsübertrags durch die Anziehungskräfte – der ebenfalls proportional zu N/V ist. Damit folgt ∆P = a/(V /N )2 , mit einer Konstanten a. Um den Druck im Sinne der Zustandsgleichung des idealen Gases zu erhalten, müssen wir P → P + ∆P ersetzen.8 Daraus ergibt sich die (phänomenologische) Zustandsgleichung P+ a [V /N ]2 V −b N = kB T . Diese Stuktur kann auch im Rahmen einer mikroskopischen Herangehensweise begründet werden, was wir hier jedoch aus Zeitgründen nicht vertiefen wollen. Mit dem Volumen pro Teilchen v = V /N lautet die Isothermengleichung P (v) = a kB T − 2 . v−b v (3.6) Wir wollen untersuchen, ob diese Funktion für v > b Extremalstellen aufweist. Nullsetzen der Ableitung liefert die Bedingung kB T (v/b − 1)2 =b . 3 (v/b) 2a Die linke Seite nimmt als maximalen Wert 4/27 an, so daß die Gleichung erfüllbar ist, falls die Temperatur kleiner ist als die kritische Temperatur 4 kB Tc =b 27 2a ⇒ Tc = 8 a 27 kB b ist. Die Isothermen zeigen den folgend skizzierten Verlauf. 8 Der “echte” Druck des Systems ist durch Pkinet. − a/(V /N )2 gegeben. Durch die Zustandsgleichung wird Pkinet. festgelegt. 3.2. ZUSTANDSGLEICHUNGEN 77 P T>Tc T=Tc Pc 2 3 1 T<Tc v2(T) v1(T) v Für hinreichend große T und v ist der Verlauf der Isothermen ähnlich zu dem des idealen Gases. Bei T = Tc gibt es einen Sattelpunkt. Durch ihn wird ein vc und ein Pc festgelegt. Es gilt 4 (vc /b − 1)2 = 3 (vc /b) 27 kB Tc a Pc = − 2 vc − b vc ⇒ vc = 3b , ⇒ Pc = 1 a . 27 b2 Bereiche mit negativer Kompressibilität (∂V /∂P )T sind instabil (und müssen eliminiert werden; siehe unten). Man kann versuchen, das Auftreten dieser Bereiche auf die implizite Annahme zurückzuführen, daß das System homogen ist. Im folgenden werden wir zulassen, daß zwei verschiedene Phasen (gasförmig und flüssig) in gewissen Bereichen des P − v-Diagramms koexistieren können. Eine solche Sichtweise liefert die sogenannten Maxwell-Konstruktion. Für Koexsitenz müssen die beiden Zustände gleiche P und T haben. In der Skizze sind das die Punkte 1, 2 und 3. Als weiteres Prinzip verwenden wir, daß das Gesamtsystem seine Energie minimiert. Gemäß dem ersten Haupsatz kann die Energieänderung durch Integrieren von −P dV entlang eines Isothermen bestimmt werden Z ∆E = − P dV . isoth. Im interessierenden Bereich können wir diese Integration graphisch ausführen, was in der folgenden Skizze gezeigt ist. 78 KAPITEL 3. THERMODYNAMIK P Pc 2 3 1 v ∆E v 2 a b 1 Den Punkt 2 interpretieren wir als den, wo das System homogen in der flüssigen Phase ist, den Punkt 1 als den wo das System homogen in der Gasphase ist. Der Punkt b in der unteren Kurve, der auf der gemeinsamen Tangente der Punkte 1 und 2 liegt, stellt einen Zustand dar, in dem Gas und Flüssigkeit koexistieren. Die Energie ist in diesem Fall offensichtlich eine Linearkombiantion der Energie der flüssigen und der Gasphase (Lage auf Geraden!). Der Punkt b hat eine niedrigere Energie, als der aus der Isotherme durch Integration folgende Punkt a, so daß b und damit Phasenkoexistenz, den Gleichgewichtszustand beschreibt. Zwischen den Punkten 1 und 2 tritt somit statt des Verlaufs der Isothermen des van-der-Waals Gases Koexistenz auf und der Druck P bleibt konstant (entspricht der gestrichelten, horizontalen Linie). Es handelt sich hierbei um einen Phasenübergang erster Ordnung. Man interpretiert das Ergebnis dann wie folgt. Für T > Tc ist das van-der-Waals Gas für alle v in der Gasphase. Für T < Tc liegt bei v > v1 (T ) die Gasphase vor und für v < v2 (T ) die flüssige Phase. Für T < Tc und v2 (T ) < v < v1 (T ) gibt es eine Koexistenz zwischen der Gasphase und der flüssigen Phase. In diesem Bereich muß P (V ) durch eine horizontale Linie ersetzt werden. Die Punkte 1 und 2 werden dabei wie folgt bestimmt. Es muß an diesen Punkten der gleiche Druck herschen, also ∂∆E ∂∆E − =− ∂V V =V1 ∂V V =V2 3.3. THERMODYNAMIK DES IDEALEN GASES 79 und es muß eine gemeinsame Tangente vorliegen ∆E1 − ∆E2 ∂∆E ∂∆E = = . V1 − V2 ∂V V =V1 ∂V V =V2 Kombiniert liefert dieses ∂∆E = −(∆E1 − ∆E2 ) −(V1 − V2 ) ∂V V =V2 oder Z V1 P dV = P (V2 )(V1 − V2 ) . V2 Die beschriebene phänomenologische Herangehensweise an ein Gas mit Zweiteilchen-Wechselwirkung liefert somit unseren ersten Kontakt mit dem Konzept verschiedener Phasen und von Phasenübergängen. In den Übungen werden sie ein ähnliches Verhalten für den Fall eines Spinsystems, d.h. für Magnetismus diskutieren. 3.3 Thermodynamik des idealen Gases Im Rahmen der Thermodynamik können wir die Zustandsgleichung des idealen Gases P V = νRT als phänomenologische Beziehung auffassen, in der experimentelle Ergebnisse zusammengefaßt sind. Basierend auf dieser Gleichung wollen wir nun mit Methoden der Thermodynamik zeigen, daß die (innere) Energie des idealen Gases nicht vom Volumen abhängt. Mikroskopisch haben wir dieses bereits in Form der Gl. (2.15) im Kapitel über die Behandlung des Gases im kanonischen Ensemble gesehen. Die innere Energie von ν Molen eines idealen Gases kann allgemein als E = E(T, V ) geschrieben werden. Es gilt ∂E ∂E dT + dV dE = ∂T V ∂V T Nach dem ersten und zweiten Hauptsatz gilt für eine quasistatische Parameteränderung T dS = d¯Q = dE + P dV . Nutzen wir die Zustandsgleichung aus, so folgt dS = 1 νR dE + dV , T V (3.7) 80 KAPITEL 3. THERMODYNAMIK bzw. mit obigem Ausdruck für dE 1 ∂E νR 1 ∂E dT + + dV . dS = T ∂T V T ∂V T V Da S = S(T, V ) ein vollständiges Differential ist, können wir folgern ∂S 1 ∂E ∂S 1 ∂E νR = , = + ∂T V T ∂T V ∂V T T ∂V T V und wegen der Gleichheit der gemischten Ableitungen 1 ∂ 2E 1 ∂E 1 ∂E 2 =− 2 + +0. T ∂V ∂T T ∂V T T ∂T ∂V Da auch für E(T, V ) die gemischetn zweiten Ableitungen identisch sein müssen, gilt ∂E =0 ∂V T und E = E(T ) für das ideale Gas. Experimentell wurde dieses Ergebnis von Joule wie folgt nachgewiesen. Ein Behälter, der aus zwei durch ein Ventil getrennten Kammern besteht, ist in ein Wasserbad getaucht (gleiche Temperatur des Gases und des Wassers). Zu Beginn des Experiments befindet sich das Gas in der linken Kammer und die rechte ist evakuiert. Öffnet man das Ventil, so kann sich das Gas frei ausdehnen und die beiden Kammern ausfüllen, wobei keine Arbeit geleistet wird. Nach dem ersten Haupsatz gilt dann bei diesem Prozeß Q = ∆E mit der Änderung der inneren Energie des Gases. In dem Experiment stellt man fest, daß sich die Temperatur des Wassers nicht ändert, so daß Q = 0 und damit ∆E = E(T, Ve ) − E(T, Va ) = 0 , also E = E(T ). Wir wollen nun die spezifische Wärme des idealen Gases betrachten (siehe auch Übungen). Nach dem ersten Hauptsatz gilt für einen Prozeß mit konstantem Volumen (Berechnung von CV ) d¯Q = dE und somit für die “molare” spezifische Wärme bei konstantem Volumen 1 d¯Q 1 ∂E = . (3.8) cV = ν dT V =const. ν ∂T V 3.3. THERMODYNAMIK DES IDEALEN GASES 81 Da E von V unabhängig ist, gilt dE = ∂E ∂T dT , V d.h. die Energieänderung hängt nur von der Temperaturänderung ab, selbst, wenn sich das Volumen ebenfalls ändert. Mit Gl. (3.8) folgt dE = νcV dT . (3.9) Für die “molare” spezifische Wärme bei konstantem Druck gilt. Mit Gl. (3.9) folgt aus dem ersten Hauptsatz d¯Q = νcV dT + pdV . (3.10) Da der Druck konstant gehalten wird, hängen eine Volumen- und eine Temperaturänderung über die Zustandsgleichung zusammen. Es gilt P dV = νRdT und damit d¯Q = ν (cV + R) dT . Nach Definition folgt dann 1 d¯Q = cV + R . cP = ν dT P =const. Wie bereits in Kapitel 2.15 allgemein diskutiert folgt also cP > cV . Verwendet man das uns aus den mikroskopischen Überlegungen bekannte Ergebnis G. (2.15) E = 3N kB T /2 = 3νRT /2, so folgt 3 1 ∂E cV = = R = 12.47 J/(K mol) ν ∂T V 2 und 5 cP = cV + R = R 2 bzw. für die spezifischen Wärmen pro Teilchen 1 ∂E 3 c̃V = = kB . N ∂T V 2 Die experimentellen Werte von Helium und Argon für cV bei 15 Grad Celsius und 1 bar ist 12.5 J/(K mol). 82 KAPITEL 3. THERMODYNAMIK Bei einer isothermen Zustandsänderung, d.h. für ein System in Kontakt mit einem Wärmebad, gilt P V =const.. Ist das Gas dagegen thermisch isoliert, findet die Zustandsänderung also adiabatisch statt, so ergibt sich ein anderer Zusammenhang zwischen P und V (siehe auch Übungen). Aus dem ersten Hauptsatz folgt νcV dT + P dV = 0 . Verwendet man nun die Zustandsgleichung um dT auf kosten von dP zu eliminieren, so läßt sich durch Integration leicht zeigen (siehe auch Übungen), daß P V γ = const. , wobei γ= cP . cV Völlig analog kann man V γ−1 T = const. , zeigen. Wir wollen abschließend noch die Entropie des idealen Gases diskutieren. Gln. (3.7), (3.10) und die Zustandsgleichung liefern für einen quasistatischen Prozeß T dS = νcV dT + νRT dV V also dS = νcV dV dT + νR . T V Durch Integration können wir so die Entropieänderung bei einem quasistatischen Prozeß zwischen zwei Makrozuständen mit (T, V ) und (T0 , V0 ) berechnen. Für den Fall dV = 0 (keine Arbeit) haben wir das bereits am Ende von Kapitel 2.15 getan, wobei wir explizit die Temperaturunabhängigkeit von cV (wie sie im idealen Gas gegeben ist) ausgenutzt haben. Wir wählen nun den Anfangszustand (T0 , V0 ) als Standsadzustand der eine Entropie νs0 haben soll. Ausgehend von diesem können wir einen “geeigneten” quasistatischen Prozeß ausführen, um S(T, V ) zu bestimmen, da die Integration über das vollständige Differential dS von den Details des Weges unabhängig ist (hängt nur vom Anfangs- und Endpunkt ab). Wir wählen dann wie schon zuvor den Weg, der aus zwei Teilstücken parallel zu den Koordinatenachsen besteht. Damit folgt Z T Z V dT dV S(T, V ) − νs0 = ν cV +R , T T0 V0 V 3.4. POTENTIALE UND MAXWELL-RELATIONEN 83 bzw. nach Ausführen der Integrale s(T, V ) = S(T, V ) = cV ln T + R ln V + const. , ν wobei wir alle Konstanten in einem Term zusammengefaßt haben und die “molare” Entropie s eingeführt haben. 3.4 Potentiale und Maxwell-Relationen Wir betrachten ein homogenes System, für das das Volumen der einzige äußere Parameter ist. Ausgangspunkt unser Überlegungen ist die Grundgleichung für einen quasistatischen infinitesimalen Prozeß T dS = d¯Q = dE + P dV . (3.11) Umformung ergibt dE = T dS − P dV , wobei E als Funktion von S und V aufgefaßt wird. Aus der allgemeinen Beziehung ∂E ∂E dE = dS + dV ∂S V ∂V S können wir folgern, daß ∂E ∂E =T , = −P . ∂S V ∂V S Die Integrabilitätsbedingung liefert dann ∂P ∂T =− . ∂V S ∂S V Wie wollen nun zu unabhängigen Variablen S und P übergehen. Dazu ersetzen wir in Gl. (3.11) P dV durch d(P V )−V dP (Legendre-Transformation). Dies liefert dE = T dS − d(pV ) + V dP oder d(E + P V ) = T dS + V dP . Wir definieren dann die Enthalpie H = E + P V = H(S, P ) 84 KAPITEL 3. THERMODYNAMIK und erhalten das vollständige Differential dH = T dS + V dP . Mit der allgemeinen Beziehung ∂H ∂H dH = dS + dP ∂S P ∂P S folgt ∂H ∂S =T , P ∂H ∂P =V . S Die Integrabilitätsbedingung liefert ∂T ∂V = . ∂P S ∂S P Während die innere Energie E die relevante Größe ist, wenn S und V als Variable gewählt werden, so ist die Enthalpie H die entsprechende Größe für S und P als Variable. Die nächste Legendre-Transformation führen wir so aus, daß T und V die Variable werden. Es gilt dE = d(T S) − SdT − P dV oder dF = −SdT − P dV mit der freien Energie9 F = E − T S = F (T, V ) . Mit analogen Schritten wie zuvor folgt ∂F ∂F = −S , = −P ∂T V ∂V T und 9 ∂S ∂V = T ∂P ∂T . (3.12) V Die freie Energie haben wir bereits bei der Diskussion der kanonischen Zustandssumme eingeführt. Das es sich bei dem dort betrachteten F und dem F hier um das gleiche Objekt handelt, werden wir später diskutieren. 3.4. POTENTIALE UND MAXWELL-RELATIONEN 85 Die letzte Variante erhält man durch “zweifache” Legendre-Transformation dE = d(T S) − SdT − d(P V ) + V dP oder dG = −SdT + V dP mit der freien Enthalpie G = E − T S + P V = G(T, P ) . Es folgt ∂G ∂T = −S , P ∂G ∂P =V T und − ∂S ∂P = T ∂V ∂T . (3.13) P Die sich aus den jeweiligen Integrabilitätsrelationen ergebenden Beziehungen bezeichnet man als Maxwell-Relationen. Sie sind ein unmittelbare Folge daraus, daß die Zustandsgrößen T , S, P und V nicht unabhängig voneinander sind, sondern über die Grundgleichung dE = T dS − P dV verknüpft sind. Aus der mikroskopischen Perspektive ist klar, daß Zusammenhänge der obigen Art bestehen müssen, da sich die ganze Thermodynamik aus der Entropie S = kB ln Ω = S(E, V ) ergibt. Die Funktionen (ihrer jeweiligen Variablen) E, H, F und G bezeichnet man als die thermodynamischen Potentiale. Jedes der Potentiale enthält die vollständige thermodynamischen Information über das betrachtete System. Wir wollen kurz diskutieren, wie sich die Überlegungen verallgemeinern lassen, wenn mehr als ein äußerer Parameter a = (a1 , a2 , . . . , an ) vorliegt. Den Diskussionen der Kapitel 2.8, 2.13 und 2.14 folgend ergibt sich für einen quasistatischen Prozeß aus dem ersten Hauptsatz dE = T dS − n X αi ai , i=1 wobei wir darauf verzichten, die verallgemeinerten Kräfte αi in Erwartungswertsklammern zu setzen. In E könnte z.B. neben S und V noch ein Magnetfeld B als 86 KAPITEL 3. THERMODYNAMIK äußerer Parameter und das magnetische Moment M als verallgemeinerte Kraft auftreten (siehe Kapitel 2.8). Dann gilt dE = T dS − P dV − M dB und ∂E ∂S =T , V,B ∂E ∂V = −P , S,B ∂E ∂B = −M . S,V Aus der Integrabilitätsbedingung ergeben sich dann sechs Maxwell-Relationen. Durch Legendre-Transformation lassen sich analog die anderen thermodynamischen Potentiale bestimmen. Dieses Kapitel abschließend wollen wir uns überlegen, daß die Potentiale im Gleichgewicht Extremalbedingungen erfüllen, so wie wir das bereits von der Entropie eines abgeschlossenen Systems S(E, V ) =max kennen (wenn wieder V der einzige äußere Parameter ist).10 Wir betrachten zwei makroskopische Systeme A und A0 die Wärme oder Wärme und Volumen austauschen können. Das System A soll viel kleiner als A0 sein, so daß E Eg = E + E 0 und V Vg = V + V 0 . Damit dient A0 als ein Wärmereservoir (T von A ist durch A0 festgelegt) oder ein Wärme- und Druckreservoir (T und P von A sind durch A0 festgelegt). Für den Fall, daß nur Wärmeausgetauscht wird gilt für die Entropie des Gesamtsystems Sg (E) = S(E, V ) + S 0 (Eg − E, V 0 ) = max . Wir führen nun eine Taylorentwicklung für kleine E/Eg aus ∂S 0 0 0 (E , V ) E ∂E 0 E = S + S 0 (Eg , V 0 ) − , T mit der Temperatur T des Wärmebads. Für die freie Energie F des Untersystems A gilt Sg ≈ S + S 0 (Eg , V 0 ) − F = E − T S ≈ E − T Sg + T S 0 (Eg , V 0 ) − E = −T Sg + T S 0 (Eg , V 0 ) . Da S 0 (Eg , V 0 ) für das Gesamtsystem eine Konstante ist (V 0 is nach Annahme nicht veränderlich), so liefert die Bedingung Sg =max für das Gesamtsystem die Bedingung F =min für das Untersystem A. Analog geht man nun für den Fall vor, daß Wärme und Volumen ausgetauscht werden können. In diesem Fall muß man eine zweidimensionale Taylorentwicklung ausführen. Es gilt analog zu oben Sg 10 ∂S 0 0 0 ∂S 0 0 0 ≈ S + S (Eg , Vg ) − (E , V ) E − (E , V ) V ∂E 0 ∂V 0 E PV = S + S 0 (Eg , Vg ) − − , T T 0 Wir verwenden also wieder Informationen aus unserem statistischen Zugang. 3.5. ZUSTANDSÄNDERUNGEN 87 mit der Temperatur T und dem Druck P des Wärme- und “Druck”-bads. Für die freie Enthalpie G = E − T S + P V des Subsystems A folgt dann G = E − T S + P V ≈ E + P V − T Sg + T S 0 (Eg , Vg ) − E − P V = −Sg + S 0 (Eg , Vg ) und damit aus Sg =max für das Gesamtsystem G =min für das Subsystem A. 3.5 Zustandsänderungen In Analogie zum Kapitel 3.3, wo wir unter anderem die Zustandsänderung bei Wärmezufuhr und Volumenänderung betrachtet haben, wollen wir dieses nun für ein allgemeines homogenes System mit zwei Zustandsvariablen tun. Bei quasistatischer Wärmezufuhr ist die Temperaturerhöhung durch ∂S d¯Q = T CP = dT P =const. ∂T P oder ∂S d¯Q =T CV = dT V =const. ∂T V bestimmt. Für das ideale Gas hatten wir in Kapitel 3.3 CP − CV = νR = N kB gefunden. Jetzt werden wir CP − CV unter Annahme eine beliebigen Zustandsgleichung P = P (T, V ). Es gilt ∂S ∂S dT + dV dS = ∂T V ∂V T bzw. unter Ausnutzung der Maxwell-Relation Gl. (3.12) und der Definition von CV ∂P CV dT + dV . (3.14) dS = T ∂T V Zur Bestimmung von CP benötigen wir S als Funktion von T und P (weil P =const.). Wir betrachten also V = V (T, P ) und ∂V ∂V dT + dP , dV = ∂T P ∂P T so daß CV dS = dT + T ∂P ∂T V ∂V ∂T dT + P ∂V ∂P dP T . 88 KAPITEL 3. THERMODYNAMIK Damit folgt für CP CP = CV + T ∂P ∂T V ∂V ∂T . P Mit der isothermen Kompressibilität κ und dem Ausdehnungskoeffizienten aus Kapitel 3.2 sowie der in Kapitel 3.1 hergeleiteten Beziehung ∂V ∂V ∂P =− / = α/κ (3.15) ∂T V ∂T P ∂P T folgt CP − CV = V T α2 . κ (3.16) Für Gase lassen sich CP , CV , κ und α gut messen. Für Festkörper und Flüssigkeiten ist die Bedingung P =const. leichter als V =const. zu realisieren. Daher ist CP leichter zugänglich. In einer mikroskopischen Berechnung tritt (meist) V als äußerer Parameter auf und damit ist CV leichter zu berechnen. Wie wir im Zusammenhang mit dem van-der-Waals Gas diskutiert haben, muß für eine stabile Situation κ > 0 gelten. Für den Ausdehnungskoeffizienten kann jedoch α > 0 und α < 0 realisiert sein. Zum Beispiel gilt für Wasser im Bereich zwischen 0 und 4 Grad Celsius α < 0. Ein weiteres Beispiel ist ein Gummiband, welches sich bei Erwärmung zusammenzieht. Wie schon zuvor beobachtet, gilt CP > CV . Durch Einsetzen der Zustandsgleichung erhält man für das ideale Gas aus Gl. (3.16) wieder die das Ergebnis CP − CV = νR aus Kapitel 3.3. Als nächste Zustandsänderung betrachten wir die Expansion (bzw. Kompression). Dabei unterscheiden wir drei Fälle: (i) Die freie Expansion mit E =const.. (ii) die quasistatische, adiabatische Expansion mit S =const.. (iii) Die JouleThomson-Expansion mit H =const.. Die Zustände des homogenen Systems seien durch zwei Variablen festgelegt, so daß die Angabe einer Zustandsgröße ausreicht, um die Art der Expansion eindeutig festzulegen. Wir wollen die mit der Expansion verbundene Temperaturänderung berechnen, sind also an ∂T ∂T ∂T , , ∂V E ∂V S ∂P H interessiert. In Joule-Thompson-Expansion wird die Temperaturänderung auf den Druck bezogen (nicht auf das Volumen), da die Drücke vorgegeben sind. Die gesuchten partiellen Ableitungen für (i) und (ii) können wir aus dem vollständigen Differential der jeweiligen konstant gehaltenen Größe X = X(T, V ) ∂T y dX = xdT + ydV ⇒ =− ∂V X x 3.5. ZUSTANDSÄNDERUNGEN 89 berechnen. Bei (iii) müssen wir V durch P ersetzen. Wir beginnen mit der freien Expansion. Wir betrachten einen durch eine Trennwand in zwei Teile getrennten Behälter. Zu Beginn des Experiments ist ein Teil mit Va und Ta mit Gas gefüllt, der andere ist evakuiert. Das System ist themisch isoliert, d.h. es gilt d¯Q = 0. Dann wird eine Drosselklappe geöffnet, wobei keine Arbeit geleistet wird. Ohne Arbeitsleistung verteilt sich das Gas dann in das Gesamtvolumen Ve . Damit ist auch d¯W = 0 und es gilt nach dem ersten Hauptsatz dE = 0. Der Prozeß ist irreversibel (Ωe Ωa , bzw. Se > Sa ) und nicht quasistatisch (läuft nicht über Gleichgewichtszustände ab). Nach Einstellen des Gleichgewichts gilt E(Ta , Va ) = E(Te , Ve ) und wir wollen Te berechnen. Es gilt (siehe Gl. (3.14)) ∂P ∂S CV ∂S dT + dT + dV = dV . dS = ∂T V ∂V T T ∂T V Damit folgt ∂P dE = T dS − P dV = CV dT + T − P dV . ∂T V Dem allgemeinen Rezept folgend ergibt sich damit 1 ∂P ∂T = P −T . ∂V E CV ∂T V Mit den Zustandsgleichungen des idealen Gases bzw. des van-der-Waals Gas folgt ∂T =0 ∂V E bzw. ∂T ∂V E aN 2 =− . CV V 2 Das Ergebnis für das ideale Gas ist uns schon in Form der Volumenunabhängigkeit der Energie dieses begegnet. In einem realen Gas führt die freie Expansion zu einer Abkühlung. Energetisch versteht man das wie folgt. In einem größeren Volumen spüren die Teilchen (im Mittel) weniger von der Anziehung (siehe van-der-Waals Gas) und daher nimmt die potentielle Energie zu. Wegen der Energieerhaltung (dE = 0) muß die kinetische Energie abnehmen und damit auch die Temperatur. Wir betrachten nun die quasistatische, adiabatische Expansion. Ein thermisch isoliertes Gas (d¯Q = 0) werde durch langsames Herausziehen eines Kolben expandiert. Das Gas leistet dabei die Arbeit d¯W = −P dV . Der zweite Hauptsatz liefert für diesen adiabatischen Prozeß dS = d¯Q =0. T 90 KAPITEL 3. THERMODYNAMIK Also gilt S(Ta , Va ) = S(Te , Ve ). Dem allgemeinen Schema folgend betrachten wir (siehe oben) CV ∂P dS = dT + dV = 0 . T ∂T V Es ergibt sich ∂T ∂V S T =− CV ∂P ∂T =− V T α , CV κ wobei wir im letzten Schritt Gl. (3.15) verwendet haben. Für das ideale Gas folgt daraus ∂T P =− ∂V S CV Für Gase gilt α > 0 (zum Vorzeichen von α für allgemeine Systeme siehe oben), so daß (∂T /∂V )S < 0 und sich das Gas bei einer quasistatischen, adiabatischen Expansion immer abkühlt. Dies kann in einer Kältemaschiene zur Kühlung verwendet werden. Am Beginn des Prozesses hat das Gas die Umgebungstemperatur T1 . Es wird nun quasistatisch und adiabatisch komprimiert, wobei es sich erwärmt. Durch den thermischen Kontakt mit der Umgebung kühlt das Gas sich dann wieder auf T1 ab. Nun wird es quasistatisch und adiabatisch expandiert und erreicht die Temperatur T2 < T1 . Läßt sich nun ein Wärmereservoir mit T2 finden, so kann man den Prozeß hin zu einer Temperatur T3 < T2 wiederholen. Als letztes Expansionsexperiment betrachten wir den Joule-Thompson-Prozeß. Dabei wird ein Gas mit Druck Pa durch einen porösen Stopfen gepresst. Hinter dem Stopfen hat das Gas dann den niedrigeren Druck Pe . Der Druckunterschied und die zugehörige Strömungsgeschwindigkeit hängt von der Struktur des Stopfens ab. Das System sie thermisch Isoliert, d.h. es gilt d¯Q = 0. Das Gesamtsystem hat keine bestimmte Temperatur, ist also nicht in einem Gleichgewichtszustand. Es liegt also kein quasistatischer Prozeß vor, so daß d¯Q nicht dS = 0 impliziert. Für die beiden Teilsysteme links und rechts vom Stopfen liegen aber (näherungsweise) Gleichgewichtszustände vor. Zum Durchpressen des Gases muß Arbeit aufgewendet werden. Hat ein Mol des Gases vor dem Stopfen das Volumen Va , so muß die Arbeit Pa Va zum Weiterschieben dieser Gasmenge nötig. Hinter dem Stopfen muß das Gas die Arbeit Pe Ve verrichten um ebenfalls ein Mol Gas weiterzuschieben. Die dem Gas zugeführte Gesamtarbeit ist daher ∆W = Pa Va − Pe Ve . Aus dem ersten Hauptsatz folgt ∆E = Ee − Ea = ∆W = Pa Va − Pe Ve 3.6. WÄRMEKRAFTMASCHINEN 91 und damit Ee + Pe Ve = Ea + Pa Va . Also ist die Enthalpie H = E + P V bei diesem Prozeß konstant H(Te , Pe ) = H(Ta , Pa ) . Daraus können wir die Temperaturänderung bei gegebener Druckdifferenz berechnen. Es gilt ∂S ∂S dH = T dS + V dP = T dT + dP + V dP ∂T P ∂P T ∂V = CP dT − T dP + V dP = CP dT + V (1 − T α)dP . ∂T P Dabei haben wir die Maxwell-Relation Gl. (3.13) und die Definition des Ausdehnungskoeffizienten verwendet. Als Zwischenergebnis erhalten wir ∂S ∂H =T , CP = ∂T P ∂T P so daß CP auf einfache Weise mit H zusammenhängt. Diese Beziehung ist analog zu CV = (∂E/∂T )V . Für die gesuchte Temperaturänderung erhalten wir mit dH = 0 ∂T V µJT = = (T α − 1) . ∂P H CP Man bezeichnet µJT als den Joule-Thompson-Koeffizienten. Wegen α = 1/T verschwindet dieser für das ideale Gas. Für reale Gase kann µJT positiv oder negativ sein. Falls µJT > 0 kann ein Joule-Thompson-Prozeß mit dP < 0 zur Abkühlung verwendet werden. 3.6 Wärmekraftmaschinen Wir wollen in diesem Abschnitt kurz Maschinen diskutieren, in denen Wärme in Arbeit umgewandelt wird. Von besonderer Bedeutung sind Maschinen, die zyklisch arbeiten, d.h. die Maschine nach einer bestimmten Zeitspanne wieder in den selben Zustand zurückkehrt. Die ideale Wärmekraftmaschine wäre eine, die in einem Zyklus einem (idealisiert unendlich großen) Wärmebad die Wärme q > 0 entnimmt, diese zu hundert Prozent in Arbeit w = q umwandelt und keine weiteren Änderungen an der “Umwelt” vornimmt (oft als Joule-Thompson Maschine bezeichnet). Man bezeichnet 92 KAPITEL 3. THERMODYNAMIK eine solche hypothetische Maschine als perpetuum mobile 2. Art. Wie wir diskutieren werden, ist diese selbst dann nicht realisierbar, wenn wir von Reibungsverlusten (und ähnlichem) absehen. Dabei ist solch ein Prozeß mit dem ersten Hauptsatz verträglich, da nach einem Zyklus die Maschine M wieder im selben Zustand ist, also ∆EM = 0 = q − w gilt. Mit dem ersten Hauptsatz würde eine Maschine im Konflikt stehen, die aus dem “Nichts” Arbeit erzeugt. Solch eine nennt man perpetuum mobile 1. Art. Wir wollen für die Maschine mit q = w nun den zweiten Hauptsatz diskutieren. Dazu betrachten wir das abgeschlossene Gesamtsystem, welches aus der Maschine M , dem Wärmereservoir R und einem Speicher S für die Arbeit besteht. In letzterem wird die Arbeit in potentielle Energie umgewandelt. Der Speicher könnte z.B. durch eine Feder oder eine Masse, die im Schwerefeld gehoben wird, realisiert werden. Für die Entropie des abgeschlossenem System gilt nach dem zweiten Hauptsatz ∆S = ∆SR + ∆SM + ∆SS ≥ 0 . Der Speicher sei nun so konstruiert, daß er aus nur einem Freiheitsgrad besteht (siehe die beiden Beispiele). Dann gilt SS = O(kB ) was gegenüber der Entropie SR = O (1024 kB ) des Wärmebads vollkommen zu vernachlässigen ist. Um diese Einsicht auszunutzen, müssen wir uns klar machen, daß dieses Argument auch für die Entropieänderung angewandt werden kann. Klar ist, daß die Entropieänderung des Speichers ∆SS klein ist (wenn nicht sogar Null). Für die Entropieänderung der Maschine gilt nach einem Zyklus ∆SM = 0. Gemäß dem zweiten Hauptsatz ergibt sich nach einem Zyklus für das Wärmebad ∆SR = − q T da d¯Q = −q. Da dem Wärmereservoir nur Wärme entzogen wird, gilt diese Relation auch wenn der Prozeß nicht quasistatisch abläuft (siehe Kapitel 2.10). Aufgrund der Konstruktion des “Arbeitsspeichers” können wir ∆SS gegenüber |∆SR | vernachlässigen. Damit folgt ∆S = − q <0. T Dieses Ergebnis steht im Widerspruch zum zweiten Hauptsatz, so daß ein perpetuum mobile 2. Art nicht realisierbar ist. Um dieses Ergebnis basierend auf unseren mikroskopischen Überlegungen “zu verstehen”, betrachten wir einen konkreten Realisationsversuch. Dabei stehe ein Gas in einem Behälter mit der Umgebung bei Temperatur T im thermischen Kontakt. Dann wird das Gas thermisch isoliert. Wir warten bis sich durch Fluktuationen alle Teilchen in der linken Hälfte des Behälters befinden und führen dann eine Trennwand ein (ohne Arbeit zu leisten). Das Gas wird dann adiabatisch und quasistatisch auf sein Ursprungsvolumen expandiert und leistet die Arbeit 3.6. WÄRMEKRAFTMASCHINEN 93 w (siehe Kapitel 3.5). Dabei nimmt die Temperatur des Gases ab. Die Isolierung wird entfernt und das Gas erwärmt sich durch den Kontakt mit der Umgebung wieder auf Temperatur T . Der Prozeß kann nun zyklisch wiederholt werden. Das Problem dieses Versuchs liegt in dem Schritt, in dem wir auf eine Schwankung warten, bei der alle Teilchen in der linken Hälfte sind. Wie wir in den statistischen Überlegungen der Anfangskapitel dieser Vorlesung gesehen haben, ist diese für eine hinreichend große Zahl von Teilchen praktisch ausgeschlossen. Die Zeit bis so eine Schwankung auftritt, würde das Alter des Universums bei weitem überschreiten. Ähnliche Überlegungen gelten, wenn wir auf eine weniger extreme Situation warten, bei der ein kleines Ungleichgewicht der Teilchenzahl zwischen der linken und der rechten Hälfte herrscht, bevor wir die Trennwand einführen. Für ein Gas mit O (1024 ) Teilchen gilt ∆N/N ≈ 10−12 . Damit würde ein Teilchenungleichgewicht von 1% bedeuten, daß die Fluktuation 1010 Standardabweichungen beträgt. Solche Fluktuationen kommen praktisch nicht vor. Aus den “natürlichen” Fluktuationen läßt sich mit “realen” Wänden keine Arbeit gewinnen. Wir sehen also, daß das perpetuum mobile 2. Art im obigen Beispiel deshalb ausgeschlossen ist, weil es spontan praktisch nicht zu “geordneteren” Zuständen kommt. Überlegungen dieser Art waren der Grund dafür, das Konzept Entropie einzuführen. Es gibt viele Gedankenexperimente zur Konstruktion eines perpetuum mobile 2. Art, die natürlich wegen des zweiten Hauptsatzes alle zum Scheitern verurteilt sind. Ein bekanntes Beispiel ist das Konzept des Mawellschen Dämons. Dieser sitzt an einer Klappe zwischen zwei Gasvolumina. Er öffnet die Klappe, wenn zufällig ein schnelles Teilchen von rechts bzw. ein langsames von links auf die Klappe zufliegt. Sonst bleibt die Klappe geschlossen. Damit wird sich im Laufe der Zeit die Temperatur links erhöhen und rechts erniedrigen. Die Temperaturdifferenz könnte dann zur Gewinnung von Arbeit eingesetzt werden. Man kann nun ein Vielzahl von Überlegungen anstellen, die zeigen, daß es dem Dämon nicht möglich ist, den zweiten Hauptsatz zum umgehen. Eine Klasse von Argumenten beruht darauf, daß das öffnen und schließem der Klappe eine Arbeit wK kostet. Diese sollte kleiner sein, als die Arbeit, die man durch den Übertritt eines Teilchens gewinnen kann. Die mittlere kinetische Energie eines Teilchens beträgt kB T , so daß wK kB T gelten sollte. Die Klappe muß also “sehr leicht zu öffnen und schließen” sein. Auch die Klappe selbst hat, wenn sie im Gleichgewicht mit der Umgebung ist, eine thermische Energie eK ≈ kB T (ein Freiheitsgrad). Die Klappe wird sich dann also unkontrolliert öffnen und schließen und der Dämon kann seine Aufgabe nicht erfüllen. Andere Argumente beruhen darauf, daß der Dämon die Geschwindigkeit von Teilchen messen müßte. Würde er das Meßergebnis danach löschen, so würde sich das was man als Informationsentropie bezeichnet erhöhen. Wir werden später eventuell auf diesen Begriff zurückkommen. Wichtig für die Argumentklasse ist, daß die Änderung der Gesamtentropie, die die Informationsentropie enthält, in jedem realisierbaren Experiment zunimmt. Unsere kurze Diskussion kann natürlich keinen vollständigen Überblick über sämtliche Versuche darstellen, zur Konstruktion eines perpetuum mobile 2. Art den zweiten 94 KAPITEL 3. THERMODYNAMIK Hauptsatz zu umgehen. Wie im Kapitel 2.14 erwähnt, wird die Unmöglichkeit eine periodisch arbeitenden Maschine zu konstruieren, die ausschließlich einem Wärmebad eine Wärmemenge q entnimmt und in Arbeit w umwandelt als alternative Formulierung des zweiten Hauptsatzes verwendet. In dieser wird der Unterschied zwischen den Energieformen Wärme (“ungeordneten” Energie) und Arbeit (“geordnete” Energie) evident. Während die Umwandlung w → q vollständig möglich ist (Auslenken eines Pendels aus Ruhelage als Arbeit, vollständige Umwandlung in Wärme durch Reibung beim Pendeln) gilt das umgekehrt nicht. Man kann “geordnete” Arbeit aus “ungeordneter” Wärme dadurch gewinnen, daß man das obige System, mit einem weiteren Hilfssystem koppelt und so die obige Abnahme der Entropie durch die Zunahme dieser im Hilfssystem kompensiert. Ein einfaches Hilfssystem ist ein Wärmebad mit einer Temperatur T2 < T1 , wobei T1 die Temperatur des ursprünglichen Wärmebads bezeichnet. Die Maschine entzieht Bad 1 die Wärmemenge q1 , wandelt einen Teil davon in die Arbeit w um und gibt die Wärmemenge q2 an das Bad 2 ab. Die Hauptsätze schränken dann den Wirkungsgrad (zur genauen Definition siehe unten) ein. Nach dem ersten Hauptsatz gilt nach einem Zyklus ∆EM = q1 − q2 − w = 0 ⇒ w = q1 − q2 . Aus dem zweiten Hauptsaz ergibt sich ∆S = ∆SR1 + ∆SR2 + ∆SM + ∆SS ≥ 0 , mit der selben Notation wie oben, wobei es jetzt zwei Reservoire gibt. Analog zu oben gilt nach einem Zyklus ∆SM = 0 , ∆SS ≈ 0 , ∆SR1 = − q2 q1 , ∆SR2 = . T1 T2 Insgesamt ergibt sich ∆S = q2 q1 − ≥0 T2 T1 ⇒ q2 T2 ≥ . q1 T1 (3.17) In einem Kraftwerk muß die Wärmemenge q1 , die dem Reservoir mit hoher Temperatur pro Zyklus entnommen wird, laufend ersetzt werden (z.B. durch Heizen). als den Wirkungsgrad definiert man daher η= erzeugte Arbeit w q 1 − q2 q2 = = =1− . aufgewndete Wärme q1 q1 q1 Mit der Ungleichung (3.17) folgt η ≤1− T2 . T1 3.6. WÄRMEKRAFTMASCHINEN 95 Der maximal (ideal) zu erreichende Wirkungsgrad ist daher durch den relativen Temperaturunterschied ηideal = T1 − T2 T1 gegeben. Das Standardbeispiel für eine Maschine mit idealem Wirkungsgrad ist der Carnotprozeß. Es sei x der äußere Parameter der Maschine, der mit der Arbeit verknüpt ist. Zu Anfang des Kreisprozesses befindet sich die Maschine im Zustand xa und die Temperatur T sei identisch zur Temperatur T2 des kälteren Wärmebads. Die Maschine durchläuft nun quasistatisch die folgenden Schritte 1. a → b: Die Maschine wird thermisch isoliert. Der äußere Paremeter x wird langsam von xa nach xb geändert bis T = T1 . 2. b → c: Zwischen der Maschine und dem Reservoir der Temperatur T1 wird thermischer Kontakt hergestellt. Der äußere Parameter wir weiter auf xc verändert. Dabei nimmt die Maschine bei konstanter Temperatur die Wärme q1 auf. 3. c → d: Die Maschine wird wieder thermisch isoliert. Der Parameter wird bis auf xd verändert derart, daß T1 → T2 . 4. d → a: Der Prozeß wird dadurch geschlossen, daß die Maschine in thermischen Kontakt mit dem Reservoir der Temperatur T2 gebracht wird und anschließend xd → xa vollzogen wird. Dabei verbleibt die Maschine bei T2 und gibt die Wärmemenge q2 ab. Einfach läßt sich dieser Prozeß mit Hilfe eines Gases (nicht notwenidg ideal) in einem Volumen V realisieren. Die quasistatischen Schritte sind dann: 1. a → b: Adiabatische Kompression wobei T von T2 nach T1 . 2. b → c: Isotherme Expansion unter Aufnahme von q1 bei T = T1 . 3. c → d: Adiabatische Expansion wobei T von T1 nach T2 . 4. d → a: Isotherme Kompression unter Abgabe von q2 bei T = T2 . Der Kreisprozeß ist in der folgenden Skizze dargestellt. 96 KAPITEL 3. THERMODYNAMIK P b c a d V Die Arbeit ist durch die eingeschlossene Fläche im P -V -Diagramm, also das Integral über P dV entlang der skizzierten Wege, gegeben. Man kann nun den Prozeß einer Wärmekraftmaschine auch umkehren. Dabei “pumpt” man unter Aufwendung der Arbeit w die Wärme q2 vom Reservoir mit niedrigerer Temperatur T2 in die Maschine und die Wärme q1 von der Maschine zu dem Reservoir mit höherer Temperatur T1 . Man kann diese Maschine als Kühlschrank oder auch Wärmepumpe betreiben. Da q1 , q2 und w positiv sein sollen, ergibt sich nach einem Zyklus für den ersten Hauptsatz ∆EM = 0 = w + q2 − q1 ⇒ w = q1 − q 2 . Der zweite Haupsatz liefert nach einem Zyklus ∆S = q1 q2 − ≥0. T1 T2 Bei der Wärmepumpe ist das Reservoir 1 das zu heizende Gebäude und das Reservoir 2 die Umgebung (in der Praxis wohl der Erboden in einer bestimmten Tiefe). Der Wirkungsgrad ist durch η= q1 . w Für die ideale Maschine gilt ηideal = T1 . T1 − T2 Als Beispiel betrachten wir T1 = 293K und T2 = 273K. Damit ergibt sich ηideal ≈ 15. Im Prinzip könnte man also mit Hilfe einer elektrischen Energie von 1kWh 3.7. VARIIERENDE TEILCHENZAHL 97 mit einer Wärmepumpe eine Wärmemenge von 15kWh ins Haus “pumpen”. Für einen Kühlschrank folgt völlig analog η= 3.7 q2 w ⇒ ηideal = T2 . T1 − T2 Variierende Teilchenzahl Sowohl in unseren mikroskopischen, wie auch unseren thermodynamischen Überlegungen sind wir bisher davon ausgegangen, daß die Teilchenzahl N konstant ist, d.h. dN = 0 gilt. Wir werden in diesem Abschnitt die zum äußeren Parameter N konjugierte Kraft einführen, die man chemisches Potential nennt. Dabei werden wir Teilweise Bezug zu unser mikroskopischen Diskussion bezug nehmen. Wie wir in den Anfangskapiteln dieser Vorlesung gesehen haben, ist die Energie eines Mikrozustands r im Allgemeinen eine Funktion des Volumens – einer Abhängigkeit, die wir schon intensiv diskutiert haben – und der Teilchenzahl N . Wir wollen nun die Einschränkung dN = 0 aufgeben. Den allgemeinen Überlegungen für quasistatische Prozesse aus Kapitel 2.8 folgend gilt d¯W = −P dV + µdN , wobei wir die verallgemeinerte Kraft ∂Er (V, N ) µ= ∂N eingeführt. Man bezeichnet µ als das chemische Potential. Für die Änderung der Energie bei einem quasistatischen Prozeß gilt somit dE = d¯Q + d¯W = T dS − P dV + µdN . (3.18) Thermodynamisch gelesen bedeutet dies ∂E ∂S µ= = −T , ∂N S,V ∂N E,V wobei die zweite Gleichheit durch Auflösen von Gl. (3.18) nach dS folgt. Liegen verschiedene Typen i von Teilchen mit Anzahl Ni vor, so definieren wir ein chemisches Potential der Teilchensorte i gemäß ∂E ∂S µi = = −T , ∂Ni S,V,{Nj }j6=i ∂Ni E,V,{Nj }j6=i wobei S und E von allen Ni abhängen. Damit folgt analog zu oben X dE = d¯Q + d¯W = T dS − P dV + µi dNi . i 98 KAPITEL 3. THERMODYNAMIK In Kapitel 3.4 haben wir die verschiedenen thermodynamischen Potentiale durch Legendre-Transformationen eingeführt. Da wir in diesen N als Variable beibehalten wollen, bleibt ihre Definition unverändert, also z.B. H = E + P V . Die Differentiale der Potentiale erhalten dagegen aufgrund von Gl. (3.18) jeweils einen Zusatzterm dE dF dH dG = = = = T dS − P dV + µdN , −SdT − P dV + µdN , T dS + V dP + µdN , −SdT + V dP + µdN . Jede dieser Gleichungen führt nun zu drei statt einer Maxwell-Relation, die wir hier jedoch nicht auflisten wollen. Durch eine weitere Legendre-Transformation können wir zu jedem der vier thermodynamischen Potentiale ein weiteres definieren. Das wichtigste dieser ist das sogenannte großkanonische Potential J = E − T S − µN = F − µN = J(T, V, µ) mit dJ = −SdT − P dV − N dµ . Wie zur freien Energie F (kanonisches Ensemble; T , V und N als Variable; Kontakt mit Wärmebad) gehört zum großkanonischen Potential ein bestimmtes Ensemble, welches man als großkanonisches Ensemble bezeichnet. Von der mikroskopischen Seite werden wir dieses weiter unten kennen lernen. Durch den Kontakt mit einem Wärme- und “Teilchen”-Reservoir, sind in ihm T , V und µ die Variablen. Liegen wieder verschiedene Teilchensorten vor, so muß man in allen obigen Gleichungen bei Audrücken des Typs µN → X µi Ni i die angegebene Ersetzung machen. Dabei kann vor dem µ oder N jeweils auch ein “d” stehen. Das großkanonische Potential ist dann eine Funktion von T , V und den µi . Die Entropie ist eine extensive Größe. Im Fall verschiedener Teilchensorten bedeutet das S = S(E, V, {Ni }) = N s(e, v, {xi }) , N= X i Ni 3.7. VARIIERENDE TEILCHENZAHL 99 mit e = E/N , v = V /N und xi = Ni /N , wobei dann (Homogenität!) P i xi = 1. Mit Gl. (3.5) folgt ∂S X ∂S ∂S +V + Ni ∂E ∂V ∂Ni i 1 P X µi = E +V − Ni T T T i S = E bzw. TS = E + PV − X Ni µi . (3.19) i Zwischen dem chemischen Potential und der freien Enthalpie G = G(T, P, {Ni }) besteht ein einfacher Zusammenhang, den wir jetzt herleiten wollen. Für eine Teilchensorte gilt mit der Definition von G und Gl. (3.19) G = E − T S + P V = E − E − P V + µN + P V = µN und µ= ∂G ∂N = g(T, P ) = T,P G . N Die freie Enthalpie pro Teilchen g ist somit gleich dem chemischen Potential und G(T, P, N ) = E − T S + P V = N µ(P, T ) . (3.20) Die freie Enthalpie ist extensiv. Für das großkanonische Potential J = E − T S − µN folgt durch Einsetzen J = −P V . Für das vollständige Differential dG folgt so dG = N dµ + µdN = −SdT + V dP + µdN und daher dµ = −sdT + vdP , mit s = S/N und v = V /N . Diese Gleichung bezeichnet man als Gibbs-DuhemRelation. Die “natürlichen” Variablen von µ sind ihr folgend T und P : µ = µ(T, P ). Bei mehreren Teilchensorten ergibt sich analog X G= Ni µi . i 100 KAPITEL 3. THERMODYNAMIK Wie wir uns in Kapitel 3.4 überlegt haben, wird G im Gleichgewicht minimal. Mit G = N µ impliziert das, daß bei fester Teilchenzahl (eine Sorte) im Gleichgewicht µ(T, P ) =min gilt. Als Beispiel wollen wir das chemische Potential des einatomige, idealen Gases berechnen. Mit P V = N kB T , E = E(T, N ) = N e(T ) und der extensiven Entropie S = S(T, V, N ) (siehe Kapitel 3.3) V (3.21) S(T, V, N ) = N s(T, V /N ) = N cV ln T + kB ln + const. N folgt mit Gl. (3.20) E TS PV V µ= − + = e(T ) − T cV ln T + kB ln + const. + kB T . N N N N Als Funktion von P und T geschrieben und mit e(T ) = 3kB T /2 (siehe “Mikroskopik”) folgt so 3 P µ = − ln T + ln + const. . kB T 2 kB T Im Folgenden wollen wir die physikalischen Konsequenzen von Extremalbedingungen diskutieren wenn nur eine Teilchensorte vorliegt. Wir betrachten zunächst ein System, welches aus zwei Teilsystemen A und A0 besteht, zwischen denen Wärme, Volumen und Teilchen ausgetauscht werden können. Das Gesamtsystem ist abgeschlossen, so daß die “Gesamtgrößen” Eg = E + E 0 , Vg = V + V 0 und Ng = N + N 0 erhalten sind. Wir betrachten unsere grundlegende Extermalbedingung Sg (E, V, N ) = S(E, V, N ) + S 0 (Eg − E, Vg − V, Ng − N ) = max . Damit muß die partielle Ableitung von Sg “in alle Richtungen”, d.h. bezüglich E, V und N , verschwinden. Wie in Kapitel 2.13 führt uns das auf die Gleichgewichtsbedingungen T = T0 , P = P0 , µ = µ0 , (3.22) wobei die neue Gleichgewichtsbedingung aus 0= ∂S ∂S 0 µ µ0 ∂Sg = − = − + ∂N ∂N ∂N 0 T T0 folgt. Ein Beispiel für solche eine Situation ist ein System aus zwei Phasen eines Stoffs, z.B. Wasser und Wasserdampf. Die Gleichgewichtsbedingung (3.22) ist nur entlang einer bestimmten Kurve im T -P -Diagramm erfüllt. Man bezeichnet diese Kurve als Dampfdruckkurve. Entlang ihr herrscht Phasengleichgewicht. 3.7. VARIIERENDE TEILCHENZAHL 101 Folgend werden wir eine Konsequenz des Teilchenaustauschs diskutieren – das bereits oben angedeuteten Phasengleichgewicht. Abhängig von der Temperatur T und dem Druck P können Stoffe in verschiedenen Phasen auftreten. Ein Standardbeispiel sind die feste (Eis), flüssige und gasförmige Phasen eines Systems aus H2 O-Molekülen. In der festen Phase kommt es bei vielen Systemen vor, daß es unterschiedliche Kristallstrukturen gibt, die jeweils eine eigene Phase bilden. Ein weiteres Beispiel, welches uns bereits begegnet ist, sind die ferromagnetische und paramagnetische Phasen eines Spinsystems. Für die folgenden Überlegungen verwenden wir die Zustandsvariable T , P und N . Die Variablen T und P legen das thermodynamische Potential pro Teilchen G(T, P, N )/N = µ(T, P ) fest. In diesem Sinne legt die Angabe von T und P bis auf die Teilchenzahl den Zustand bereits eindeutig fest. Wir betrachten nun ein inhomogenes System in dem zwei verschiedene Phasen eines Stoffs auftreten. Zwischen diesen können Teilchen ausgetauscht werden (z.B. geht ein H2 O-Molekül von der Gasphase in die flüssige Phase über). Nach den obigen Überlegungen sind beide Phasen A und A0 im Gleichgewicht, wenn bei gegebenem T und P µ(T, P ) = µ0 (T, P ) (3.23) gilt. Da die Phasen unterschiedlich sind, gilt gleiches für die Funktionen (zweier Veränderlicher) µ und µ0 . Die Gl. (3.23) definiert im Allgemeinen eine Kurve im P -T -Diagramm. Für den Fall der flüssigen und gasförmigen Phase spricht mann dann von der Dampfdruckkurve Pd (T ) bzw. (andersherum “gelesen”) von der Siedetemperatur Ts (P ). Weg von den Übergangskurven gilt µ 6= µ0 und die Substanz liegt in der Phase mit kleinerem chemischen Potential vor, da ja im Gleichgewicht µ =min gilt. Ein P -T -Diagramm mit den Übergangslinien heißt Phasendiagramm. Das Phasendiagramm von Wasser ist in der folgenden Skizze nocheinmal (siehe Kapitel 2.15) dargestellt (wobei der Fokus jetzt auf anderen Charakteristika liegt). P flüssig kritischer Punkt fest Tripelp. gasf. T 102 KAPITEL 3. THERMODYNAMIK Der Übergang über eine Linie hinweg ist ein Phasenübergang. Nach Gl. (3.23) ist das chemische Potential beim Übertreten der Phasengrenzlinien stetig. Anderen Größen, wie z.B. die Entropie pro Teilchen können möglicherweise unstetig sein. Wir werden auf diese Überlegungen innerhalb der statistischen Beschreibung später zurückkommen. Neben dem diskteren Übergang z.B. an der Dampfdrucklinie, kann es auch zu einem kontinuierlichen Übergang zwischen zwei Phasen kommen. An diesem gilt v = v 0 und s = s0 . Der Übergang zwischen der flüssigen und der gasförmigen Phase endet in einem kritischen Punkt. Man kann daher von der gasförmigen zu der flüssigen Phase auch auf einem Weg um den kritischen Punkt herum kommen, ohne die Dampfdruckkurve zu kreuzen. Das Ende einer Koexistenzlinie im P -T -Diagramm in einem kritischen Punkt ist möglich, wenn sich die beiden Phasen nur quantitativ unterscheiden, also z.B. durch eine unterschiedliche Dichte (wie beim flüssig-gasförmig Übergang), nicht jedoch qualitativ (z.B. wenn unterschiedliche Symmetrien vorliegen; siehe den flüssig-fest Übergang). Am Tripelpunkt, der uns bereits in Kapitel 2.15 begegnet ist liegt Koexsitenz dreier Phasen (A, A0 und A00 ) vor und es gilt µ(T, P ) = µ0 (T, P ) = µ00 (T, P ) . Diese Überlegungen liefern jedoch keinen Einblick ob und warum es verschiedene Phasen gibt, oder welche Struktur sie haben. Dazu werden wir uns später Gedanken machen. Wie wir bei der Diskussion des van-der-Waals Gases in Kapitel 3.2 gesehen haben, liefert nicht nur ein P -T -Diagramm Einsichten über Phasenübergänge, sondern auch ein P -v-Diagramm. Das zur obigen Skizze (Wasser) gehörende ist folgend dargestellt. Die gestrichelten Linien sind die Isothermen. P . /flüs fest flüssig fest gasf. flüs./gasf. fest/gasf. v Wir wollen nun aufbauend auf der Gleichgewichtsbedingung Gl. (3.23) weitere Konsequenzen diskutieren. Wir betrachten die Dampfdruckkurve. Diese ist durch µ(T, Pd (T )) = µ0 (T, Pd (T )) 3.8. MISCHUNGEN, LÖSUNGEN, REAKTIONEN 103 definiert. Wir differenzieren diese Bedingung nach der Temperatur. Es gilt 0 0 ∂µ ∂µ dPd ∂µ ∂µ dPd + (T ) = + (T ) . ∂T P ∂P T dT ∂T P ∂P T dT Wegen dµ = −sdT + vdP folgt (v − v 0 ) dPd (T ) = s − s0 . dT An jedem Punkt auf der Dampfdruckkurve Pd (T ) sind die Phasen für sich und miteinander im Gleichgewicht. Der Prozß der Umwandlung von einer in die andere Phase kann daher quasistatisch und bei konstanter Temperatur ablaufen. Damit gilt nach Kapitel 3.4 dH = T dS + V dP , woraus bei im vorliegenden Fall konstantem Druck ∆s = ∆h/T mit h = H/N folgt. Dies impliziert s − s0 = h − h0 q = . T T Die eingeführte Größe q = h − h0 heißt Umwandlungsenthalpie oder auch lax Umwandlungswärme oder latente Wärme. Da aber der Druck und nicht das Volumen konstant gehalten wird, handelt es sich streng genommen um eine Enthalpieänderung nicht um eine Wärme. Wenn man sich auf einen bestimmten Übergangstyp bezieht, dann spricht man z.B. auch von Verdampfungsenthalpie oder Schmelzenthalpie. Die beiden letzten Gleichungen zusammengenommen liefern die Clausius-Clapeyron-Gleichung q dPd (T ) = . dT T (v − v 0 ) Diese Relation stellt einen Zusammenhang zwischen der Steigung der Phasenumwandlungslinie und der zum Übergang gehörenden Entropie- und Volumenänderung dar. 3.8 Mischungen, Lösungen, Reaktionen In diesem Kapitel untersuchen wir, was wir aus der Thermodynamik über Mischungen von verschiedenen Substanzen lernen können. Wir beginnen dabei mit dem einfachen Beispiel einer Mischung aus zwei idealen Gasen in einem Behälter mit Volumen V . Neben V sind noch T und N1 , N2 gegeben. Wir nehmen an, daß keine Wechselwirkung zwischen den Gasen herrscht. Es gilt Pi V = Ni kB T , i = 1, 2, und damit nach addieren P V = N kB T . Der Druck setzt sich als Summe zweier Partialdrücke P = P1 + P2 zusammen. Die Partialdrücke ergeben sich aus Pi = xi P , mit xi = Ni /N . Da keine Wechselwirkung herrscht ist die Energie additiv E(T, N1 , N2 ) = E1 (T, N1 ) + E2 (T, N2 ) . (3.24) 104 KAPITEL 3. THERMODYNAMIK Als nächstes betrachten wir die Entropie. Da die beiden Teilchentypen nicht wechselwirken, ist es möglich sie ohne Aufwand von Arbeit zu trennen (z.B. über für jeweils nur eine Teilchensorte durchlässige Wände), wobei das Volumen für jede Teilchensorte gleich V bleibt. Vollführt man die Trennung dann noch adiabatisch, so gilt d¯Q = 0. Damit ergibt sich für das Gemisch der idealen Gase bei der Trennung ∆E = 0 = 2 X (i) Ni cV (T 0 − T ) , i=1 (i) wobei cV die auf die Teilchenzahl bezogene spezifische Wärme des Teilchentyps i ist (beim idealen Gas natürlich für beide i gleich; eine Verallgemeinerung ist aber möglich so lange keine Wechselwirkung zwischen den Teilchentypen herrscht) sowie T und T 0 die Temperatur der Gase vor und nach der Trennung sind. Wir Fragen nun danach, ob sich die Temperatur oder die Partialdrücke bei der Trennung ändern. Aus ∆E = 0 folgt T = T 0 und wegen der Zustandsgleichung auch P1 = P10 sowie P2 = P20 . Aus ∆Q = 0 folgt ebenfalls ∆S = 0 und damit S(T, V, N1 , N2 ) = S1 (T, V, N1 ) + S2 (T, V, N2 ) , (3.25) so daß die Entropie für “ideale” Gemische (keine Wechselwirkung zwischen Teilchen) additiv ist. Wir gehen nun über zu T , P und {Ni } als Variable. Es gilt E(T, P, N1 , N2 ) = X Ni ei (T ) , i mit der Energie pro Teilchen (ideale Gase) (i) (i) ei (T ) = e0 + cV T welche unabhängig von P ist. Um die Entropie als Funktion von T , P , N1 und N2 zu berechnen stellen wir eine Vorüberlegung an. Es gilt für das ideale Gas einer Teilchensorte (siehe Gl. (3.21) und Zustandsgleichung) V N kB T s0 + cV ln T + kB ln P s̃0 + (cV + kB ) ln T − kB ln P s̃0 + cP ln T − kB ln P s(T, P ) , s = s0 + cV ln T + kB ln = = = = 3.8. MISCHUNGEN, LÖSUNGEN, REAKTIONEN 105 wobei wir cP − cV = kB verwendet haben. Für die Entropie eines Gemischs verschiedener idealer Gase folgt (Additivität siehe oben; Pi = xi P ) X S(T, P, N1 , N2 ) = Si (T, Pi , Ni ) i = X Ni si (T, Pi ) i = X = X = X = (i) (i) Ni s̃0 + cP ln T − kB ln Pi i (i) (i) Ni s̃0 + cP ln T − kB ln xi − kB ln P i Ni si (T, P ) − kB X i i X Ni si (T, P ) − kB X i Ni ln xi Ni ln i Ni . N (3.26) Wir wollen folgend die freie Enthalpie G = E − T S + P V untersuchen. Wie bereits oben erwähnt gilt für das ideale Gas Pi V = Ni kB T und P V = N kB T . Damit folgt G(T, P, {Ni }) = E − T S + P V X X = [Ni ei (T ) − T Ni si (T, P ) + Ni kB T ] + kB T Ni ln xi i = X i Ni gi (T, P ) + kB T i X Ni ln xi , i mit gi (T, P ) = ei (T ) − T si (T, P ) + kB T . (3.27) Für das chemische Potential ergibt sich ∂G µi = ∂Ni T,P,{Nj }j6=i = gi (T, P ) + kB T ln xi + kB T X Nj j ∂ ln xj ∂Ni 1 ∂xj xj ∂Ni j ∂ X = gi (T, P ) + kB T ln xi + kB T N xj ∂Ni j | {z } = gi (T, P ) + kB T ln xi + kB T X Nj =1 = gi (T, P ) + kB T ln xi = µi (T, P, xi ) . (3.28) 106 KAPITEL 3. THERMODYNAMIK Es ergibt sich somit, daß für ideale Gase µi nur einen Funktion von xi (nicht der {Nj }) und T , P ist. Mit der Beziehung für G folgt damit auch X G(T, P, {Ni }) = Ni µi (T, P, xi ) , i was wir im Kapitel 3.7 ja bereits allgemein gesehen haben. Wir können die obigen Überlegungen für ideale Gase zweier Teilchensorten sofort auf n Sorten verallgemeinern, da wir die Sortentrennung suksessive ausführen können. Die obigen Formeln gelten also, wenn die Summen bis n laufen, auch allgemeiner. Der zweite in Gl. (3.26) auftauchende Term hat eine physikalische Bedeutung, die wir jetzt untersuchen wollen. Wir betrachten dazu einen (irreversiblen) Mischvorgang. In ihm sind die beiden idealen Gase zunächst in getrennten Volumina V1 und V2 eingeschlossen. Die jeweiligen Teilchenzahlen sind N1 und N2 und der Druck und die Temperatur seien in beiden Teilvolumina gleich und durch Ta , Pa gegeben (z.B. durch eine Wärmedurchlässige, verschiebbare Wand realisiert). Die Wand wird dann ohne Arbeit zu leisten weggenommen und das System sei thermisch isoliert. Nach dem ersten Hauptsatz gilt dann ∆E = 0 = E(Te , N1 , N2 ) − E1 (Ta , N1 ) − E2 (Ta , N2 ) = E1 (Te , N1 ) + E2 (Te , N2 ) − E1 (Ta , N1 ) − E2 (Ta , N2 ) , wobei wir in der zweiten Zeile Gl. (3.24) ausgenutzt haben. Damit ergibt sich Te = Ta . Aus den Zustandsgleichungen Pa Vi = Ni kB Ta folgt V1 /V2 = N1 /N2 und durch Summation Pa (V1 + V2 ) = Pa V = (N1 + N2 )kB Ta = N kB Te , also Pa V = N kB Te = Pe V was Pa = Pe impliziert. Nach diesen Vorarbeiten können wir nun die Entropieänderung beim Mischen berechnen. Es gilt mit Gl. (3.25) (Te = Ta = T ) ∆S = S(T, V, N1 , N2 ) − S1 (T, V1 , N1 ) − S2 (T, V2 , N2 ) X = [Si (T, V, Ni ) − Si (T, Vi , Ni )] i = X = X [Si (T, Pi , Ni ) − Si (T, P, Ni )] i Ni [si (T, Pi ) − si (T, P )] i = −kB X = −kB X Ni ln i Pi P Ni ln xi . i Da xi < 1 folgt ∆S = −kB X i Ni ln xi > 0 . 3.8. MISCHUNGEN, LÖSUNGEN, REAKTIONEN 107 Man nennt diese Größe die Mischungsentropie. Sie gilt natürlich nur für verschiedene Gasesorten. Bei gleichen Sorten gilt bei der Mischung unter obigen Bedingungen ∆S = 0 (siehe Übungsaufgabe zu diesem Gibbsschen Paradoxon). Bei der Herleitung dieser Beziehung haben wir den Entmischungsvorgang benutzt, der bei gleichen Sorten nicht funktionieren würde. Wir wollen als nächstes Beispiel eines Systems mit verschiedenen Teilchensorten verdünnte Lösungen betrachten. Dabei seien n Stoffe in einem Lösungsmittel gelöst, wobei die Konzentration der gelösten Stoffe klein sein soll, d.h. es gilt Ni N0 , wobei N0 die Zahl der Lösungsmittelteilchen bezeichnet. Obwohl die gelösten Stoffe im Allgemeinen sehr stark mit dem Lösungsmittel wechselwirken werden wir sehen, daß die für das ideale Gas hergeleiteten Beziehungen X E(T, P, {Ni }) = Ni ei (T, P ) , i S(T, P, {Ni }) = X Ni si (T, P ) − kB X i G(T, P, {Ni }) = X Ni ln xi , i Ni gi (T, P ) + kB T i X Ni ln xi , i µi (T, P, xi ) = gi (T, P ) + kB T ln xi , (3.29) gi (T, P ) = ei (T, P ) − T si (T, P ) + P vi (T, P ) (3.30) mit P weiterhin gültig sind. Wie zuvor gilt xi = Ni /N mit N = i Ni . Die Summen laufen von 0 bis n. Die auftreten Funktionen ei , si , gi und vi werden wir weiter unten definieren. Dieses Ergebnis liefert ein Begründung dafür, warum wir uns so ausführlich mit der (für sich genommen wenig interessant erscheinenden) Mischung zweier idealer Gase beschäftigt haben. Wichtig ist, daß ei hier im Allgemeinen eine Funktion von T und P sein wird (im Gegensatz zum idealen Gas) und daß wir keine Beziehungen mehr verwenden dürfen in denen Partialdrücke auftauchen (diese setzten P das Verschwinden der Wechselwirkung voraus), wie z.B. S(T, P, {Ni }) = i Ni si (T, Pi ). Um die obige Relation für E herzuleiten entwickeln wir diese Funktion bis zur ersten Ordnung in Ni /N0 , i = 1, 2, . . . , n. Es gilt E(T, P, {Ni }) = N0 E(T, P, 1, N1 /N0 , . . . , Nn /N0 ) n X Ni ∂E N0 (T, P, 1, 0, . . . , 0) , = N0 E(T, P, 1, 0, . . . , 0) + {z } | N0 ∂Ni i=1 | {z } =e0 (T,P ) =ei (T,P ) = n X i=0 Ni ei (T, P ) . 108 KAPITEL 3. THERMODYNAMIK Analog ergibt sich V (T, P, {Ni }) = N0 V (T, P, 1, N1 /N0 , . . . , Nn /N0 ) n X Ni ∂V (T, P, 1, 0, . . . , 0) , = N0 V (T, P, 1, 0, . . . , 0) + N0 | {z } N0 ∂Ni i=1 | {z } =v0 (T,P ) =vi (T,P ) = n X Ni vi (T, P ) . i=0 Aufgrund der Mischungsentropie läßt sich die Entropie nicht so einfach nach Ni /N0 entwickeln. Wir betrachten zunächst den Fall Ni =const.. Dann gilt für einen quasistatischen Prozeß T dS = dE + P dV = n X i=0 Ni [dei (T, P ) + P dvi (T, P )] . | {z } =T dsi (T,P ) Mit dieser Definition von dsi (T, P ) folgt ∂ei ∂vi ∂si = +P , T ∂T P ∂T P ∂T P ∂ei ∂vi ∂si = +P , T ∂P T ∂P T ∂P T so daß si (T, P ) bis auf eine Integrationskonstante eindeutig festgelegt ist. Es folgt somit für Ni =const. dS = d n X Ni si (T, P ) i=0 ⇒ S(T, P, {Ni }) = n X Ni si (T, P ) + S0 (N0 , N1 , . . . , Nn ) . i=0 Die Konstante S0 (bezüglich T und P ) bestimmen wir für P → 0 und T → ∞ in dem sowohl das Lösungsmittel, wie die gelösten Stoffe durch ideale Gase beschrieben werden können. Der Vergleich mit Gl. (3.26) liefert dann S0 ({Ni }) = −kB n X Ni ln xi . i=0 Die Relation für G folgt aus denen für E und S durch Einsetzen in die Definitionsgleichung. Die Relation für das chemische Potential ergibt sich wie in Gl. (3.28). 3.8. MISCHUNGEN, LÖSUNGEN, REAKTIONEN 109 Setzt man in den obigen Beziehungen N1 = N2 = . . . = Nn = 0 so folgt E = N0 e0 (T, P ) , S = N0 s0 (T, P ) , G = N0 g0 (T, P ) und die Funktionen e0 , s0 sowie g0 beschreiben das reine Lösungsmittel. Die Funktionen ei , si und gi für i = 1, 2, . . . , n können nicht entsprechend interpretiert werden. Für P → 0 und T → ∞ gehen sie in die entsprechenden Größen für das ideale Gas über (siehe oben). Nach der Definitionsgleichung von dsi folgt T dsi = dei + P dvi und es gelten die üblichen thermodynamischen Beziehungen für die Differentiale für alle i. Mit dieser Relation und Gl. (3.30) folgt z.B. dgi = −si dT + vi dP . Wie üblich kann man auch Maxwell-Relationen herleiten. In der Gleichung für das chemische Potential µi (T, P, xi ) = gi (T, P ) + kB T ln xi , können wir für i = 0 noch nach den xi entwickeln. Es gilt µ0 (T, P, x0 ) = g0 (T, P ) + kB T ln x0 = g0 (T, P ) + kB T ln 1 − n X ! xi i=1 = g0 (T, P ) − kB T n X xi . (3.31) i=1 Für die zu den gelösten Teilchen gehörenden µi geht dieses natürlich nicht. Wir wollen nun Anwendungen dieser Überlegungen betrachten. Starten werden wir mit dem Sättingungsgleichgewicht. Dazu betrachten wir den Fall einer verdünnten Lösung mit einem gelösten Stoff, dessen Konzentration die Sättigung erreicht hat, d.h. er liegt auch in fester Form vor. Wir wollen die Sättigungskonzentration (s) (s) c1 N = 1 V (F ) berechnen. Neben N0 und N1 tritt jetzt auch N1 für die Zahl der Teilchen des festen Stoffs auf. Die Temperatur und der Druck sind gegeben (durch Wärmeund “Druck”-bad) und die Teilchenzahl insgesamt ist konstant. Nach unseren Überlegungen aus Kapitel 3.4 bietet es sich daher an, die freie Enthalpie G zu betrachten. Diese wird im Gleichgewicht minimal. Es gilt (F ) (F ) G(T, P, N0 , N1 , N1 ) = GL (T, P, N0 , N1 ) + GF (T, P, N1 ) (g) = GL (T, P, N0 , N1 ) + GF (T, P, N1 − N1 ) 110 KAPITEL 3. THERMODYNAMIK (F ) (g) und N1 + N1 = N1 =const. sowie N0 =const.. Ableiten nach N1 und Null setzen (wegen Minimum) liefert (s) (s) (F ) µ1 (T, P, x1 ) = µ1 (T, P ) , N1 (s) x1 = (s) . N0 + N1 Nach Gl. (3.29) gilt (s) (s) µ1 (T, P, x1 ) = g1 (T, P ) + kB T ln x1 ⇒ ⇒ (s) (F ) kB T ln x1 = µ1 (T, P ) − g1 (T, P ) " # (F ) µ (T, P ) − g (T, P ) 1 (s) . x1 = exp 1 kB T Mit (s) (s) N c1 = x 1 V , (s) N = N0 + N1 folgt für die Sättingungskonzentration " (s) c1 (T, P ) # (F ) µ1 (T, P ) − g1 (T, P ) = c exp , kB T c= N . V (s) Man bezeichnet c1 auch als die Löslichkeit. Als nächstes berechnen wir die Lösungswärme. Dazu betrachten wir eine verdünnte, nicht gesättigte Lösung, in der der gelöste Stoff auch fest vorliegt. Wir wollen die Wärmezufuhr berechnen, wenn ∆N1 Teilchen gelöst werden. Der Druck und die Temperatur sind durch die “Umwelt” festgelegt. Mit dH = T dS + V dP (Teilchenzahl ist konstant) folgt für dP = 0, daß ∆H = Q. Daher betrachten wir im vorliegenden Fall die Enthalpie. Es gilt (Taylor-Entwicklung) Q = ∆H (F ) = HL (T, P, N0 , N1 + ∆N1 ) + HF (T, P, N1 − ∆N1 ) (F ) −HL (T, P, N0 , N1 ) − HF (T, P, N1 ) ! ∂HL ∂HF ∆N1 . ≈ − (F ) ∂N1 T,P,N0 ∂N1 T,P 3.8. MISCHUNGEN, LÖSUNGEN, REAKTIONEN 111 Mit HL/F = GL/F + T SL/F folgt ∂GL ∂SL ∂HL = +T ∂N1 T,P,N0 ∂N1 T,P,N0 ∂N1 T,P,N0 ∂µ1 = µ1 (T, P, x1 ) − T ∂T P,N0 ,N1 ∂µ1 = µ1 (T, P, x1 ) − T ∂T P,x1 ∂ µ1 (T, P, x1 ) 2 = −T ∂T T P,x1 wobei wir die aus dG = −SdT + V dP + µdN folgende Maxwell-Relation ∂S ∂µ − = ∂N T,P ∂T P,N ausgenutzt haben. Analog gilt ! ∂HF (F ) ∂N1 T,P = −T 2 ∂ ∂T (F ) µ1 (T, P ) T ! . P Für die Wärme bedeutet dies (F ) Q = −T 2 ∂ µ1 (T, P, x1 ) − µ1 (T, P ) ∂T T ! ∆N1 . P,x1 Aus Gl. (3.28) folgt (F ) (F ) µ1 (T, P, x1 ) − µ1 (T, P ) = g1 (T, P ) − µ1 (T, P ) + kB T ln x1 (s) = −kB T ln x1 (T, P ) + kB T ln x1 (s) x1 (T, P ) x1 (s) c (T, P ) = −kB T ln 1 , c1 = −kB T ln (s) (s) mit c1 = x1 N/V und c1 = x1 N/V . Eingesetzt in den Ausdruck für die Wärme folgt ∂ (s) 2 Q = kB T ln c1 (T, P ) ∆N1 . ∂T Nimmt die Löslichkeit also mit zunehmender Temperatur zu, so wird beim Lösen Wärme frei (Q > 0). Anderenfalls gilt Q < 0. 112 KAPITEL 3. THERMODYNAMIK Als nächste Anwendung betrachten wir die Osmose. Dabei sind zwei verdünnte Lösungen (gleicher gelöster Stoff) unterschiedlicher Konzentrationen über eine semipermeable Membran getrennt. Durch diese kann nur das Lösungsmittel treten. Die Lösung links ist durch T , PL , VL , N0L und N1L charakterisiert und analog für rechts (L → R). Wir sind dabei davon ausgegangen, das die Membran wärmedurchlässig ist und damit TL = TR = T gilt. Man kann nun qualitativ leicht verstehen, daß im Gleichgewicht PL 6= PR da der Partialdruck des Lösungsmittels auf beiden Seiten gleich sein wird (weil dieses ja durch die Membran treten kann), nicht jedoch der Partialdruck des gelösten Stoffs. Im Gleichgewicht erwarten wir daher ∆P = PL − PR 6= 0 eine Größe die man den osmotischen (Gleichgewichts-)Druck nennt. Das Gesamtsystem sei abgeschlossen, so daß die Entropie im Gleichgewicht maximal wird. Da das Lösungsmittel ausgetauscht werden kann, bedeutet das nach unseren Überlegungen aus Kapitel 3.7, daß µ0 (T, PL , xL0 ) = µ0 (T, PR , xR 0) . Mit Gl. (3.31) folgt g0 (T, PL ) − kB T xL1 = g0 (T, PR ) − kB T xR 1 bzw. unter der Annahme, daß xL1 − xR 1 und ∆P klein (Taylor-Entwicklung) ∂g0 ∆P = kB T (xL1 − xR 1) , ∂P T wobei P = (PL +PR )/2. Der osmotische (Gleichgewichts-)Druck ergibt sich damit zu ∆P = kB T (xL1 − xR 1) , v0 (T, P ) mit dem nur vom Lösungsmittel abhängenden Volumen ∂g0 . v0 (T, P ) = ∂P T Im Spezialfall, daß rechts das reine Lösungsmittel vorliegt, also für xR 1 = 0, folgt ∆P = kB T L kB T N1L x = v0 1 v0 NL mit NL = N0L + N1L . Da v0 NL ≈ (VL /N0L )N0L = VL ergibt sich die van’t Hoffsche Gleichung für den osmotischen (Gleichgewichts-)Druck ∆P VL = N1L kB T . 3.8. MISCHUNGEN, LÖSUNGEN, REAKTIONEN 113 In dieser Situation entspricht ∆P dem Partialdruck des gelösten Stoffes auf der linken Seite und wir reproduzieren die ideale Gasgleichung. Als letztes Beispiel diskutieren wir das Massenwirkungsgesetz. Dazu betrachten wir eine Mischung von n Stoffen, die miteinander chemisch reagieren können. Ein Beispiel ist die Reaktion (n = 3) 2H2 + O2 → 2H2 O . Wir gehen davon aus, daß alle n Stoffe entweder als ideale Gase behandelbar sind, oder als verdünnte Lösungen vorliegen, so daß µi (T, P, xi ) = gi (T, P ) + kB T ln xi (3.32) gilt. Wir wollen das Reaktionsgleichgewicht beschreiben. Wir gehen von der “typischen” Situation aus, daß T und P durch die “Umwelt” gegeben sind und keine Teilchen mit der “Umwelt” ausgetauscht werden. Dann wird die freie Enthalpie G im Gleichgewicht minimal, also G(T, P, N0 , N1 ; . . . , Nn ) = min , wobei N0 die Zahl der Teilchen des Lösungsmittels angibt (N0 = 0 ist möglich). Die Ni , i = 1, 2, . . . , n sind nicht unabhänging sondern durch die Reaktionsgleichung miteinander verknüpft. Mit νi bezeichnen wir die Zahl der Moleküle/Atome der Sorte i, die bei der Reaktion erzeugt werden. Im obigen Beispiel gilt also νH2 = −2, νO2 = −1 und νH2 O = 2. Die Zahl ∆λ = ∆Ni νi ist unabhängig von i und gibt die Zahl der Reaktionen an. Da G minimal wird und dN0 = 0 gilt folgt 0 = ∆G n X ∂G ∆Ni = ∂N i T,P,{N } j j6 = i i=1 = n X µi (T, P, xi )νi ∆λ i=1 für alle “infinitesimalen” ∆λ, also n X i=1 µ i νi = 0 . 114 KAPITEL 3. THERMODYNAMIK Dies ist die Gleichgewichtsbedingung für die chemische Reaktion. Mit Gl. (3.32) ergibt sich 0 = = n X i=1 n X νi gi (T, P ) + kB T νi gi (T, P ) + kB T n X i=1 n X i=1 νi ln xi ln, (xνi i ) . i=1 Daraus folgt das Massenwirkungsgesetzt für das Reaktionsgleichgewicht " # Q n n |νi | X Y x 1 νi gi (T, P ) = K(T, P ) . xνi i = Q Ende i |νi | = exp − k T B x i i=1 i=1 Anfang Um dieses besser zu verstehen, gehen wir nun davon aus, daß alle beteiligten Stoffe als ideale Gase beschreibbar sind. Dann gilt nach Gl. (3.27) gi (T, P ) = ei (T ) − T si (T, P ) + kB T (i) (i) (i) (i) = e0 + cV T − T s0 − T cP ln T + T kB ln P + kB T (i) (i) (i) (i) = e0 + (cV + kB )T − T s0 − T cP ln T + T kB ln P " # (i) (i) c e 1 (i) (i) (c − s0 ) + 0 − P ln T + ln P . = kB T kB P kB T kB Damit ergibt sich für die Funktion K " # P 1 X (i) (i) − i νi K(T, P ) = exp − νi (cP − s0 ) P | {z } kB i P {z } abhängig | T,P unabhängig # 1 X (i) − Pi νi c(i) P /kB × exp − νi e 0 T kB T i | {z } " T = const. e ∆E/(kB T ) abhängig T ∆cP /kB P −∆N , mit ∆E = X ∆cP = X ∆N = X (i) νe0 , i (i) νi cP , i i νi . 3.8. MISCHUNGEN, LÖSUNGEN, REAKTIONEN 115 Deise Größen sind jeweils die Änderung der Energie, spezifischen Wärme und der Teilchenzahl bei einer Reaktion. Wir können die verschiedenen Terme interpretieren. Für ∆E < 0(> 0) ergibt sich eine Verschiebung zu den Endstoffen (Anfangsstoffen). Die Reaktion versucht die Energie zu minimieren. Dieses ist aber nicht der einzig bestimmende Faktor (siehe unten). Als Beispiel betrachten wir die Reaktion H2 → 2 H. Die Dissoziationsenergie von H2 ist 4eV. Da 1meV ≈ kB 10K folgt ∆E/kB ≈ 4 · 104 K. Damit ergibt sich e∆E/(kB T ) ≈ e40000K/T und Wasserstoff wird erst bei ca. 40000K relevant dissoziieren. Der Faktor e∆E/(kB T ) dominiert in der Praxis die T -Abhängigkeit von K(T, P ). Er besagt, daß angeregte Zustände erst möglich sind, wenn ∆E ∼ kB T . Für ∆CP > 0(< 0) ergibt sich eine Verschiebung zu den Endstoffen (Anfangsstoffen). Das Reaktionsgleichgewicht verschiebt sich bei Temperaturerhöhung auf die Seite der größeren Wärmekapazität, so daß die Temperaturerhöhung minimiert wird. Man nennt dieses das Prinzip des kleinsten Zwangs. Für ∆N < 0(> 0) ergibt sich eine Verschiebung zu den Endstoffen (Anfangsstoffen). Damit verschiebt sich das Reaktionsgleichgewicht bei Druckerhöhung auf die Seite mit der kleineren Teilchenzahl. Auch dieses Ergebnis ist Teil des Prinzip des kleinsten Zwangs. Mit diesen Überlegungen, die in der physikalischen Chemie von großer Relevanz sind, schließen wir das Kapitel zur Thermodynamik ab und kehren zu einer mikroskopischen Beschreibung von Vielteilchensystemen zurück. 116 KAPITEL 3. THERMODYNAMIK Kapitel 4 Klassische statistische Mechanik In diesem Kapitel wenden wir uns erneut der klassischen statistischen Mechanik zu, wobei wir formaler als in Kapitel 2 vorgehen werden. Wir werden sehr häufig den Bezug zu unseren Grundüberlegungen herstellen. 4.1 Mikroskopische Dynamik und Phasenraum Wie in Kapitel 2 diskutiert, bilden die mikroskopische Hamiltonfunktion und die zugehörigen Bewegungsgleichungen die Grundlage der Beschreibung unseres abgeschlossenen Vielteilchensystems. Letztere können für viele Freiheitsgrade nicht exakt gelöst werden. Es ist nicht einmal möglich alle Anfangsbedingungen anzugeben. Die Bewegunsgleichungen besitzen jedoch allgemeine Eigenschaften, die wichtig für die (formale) Theorie (die statistische Mechanik) sind, in unseren bisherigen Überlegungen aber noch nicht das ihnen zustehende Gewicht bekommen haben. Wie in Kapitel 2 illustriert beschreiben wir unser Ensemble von (replizierten) Systeme in der klassischen statistischen Mechanik anhand einer Wahrscheinlichkeitsverteilung über dem Phasenraum (siehe Beispiel der Gleichverteilung über dem zugänglichen Teil des Phasenraums in der mikrokanonischen Verteilung in Kapitel 2.3). Wir werden uns daher zunächst mit Eigenschaften des Phasenraums und mit der Dynamik auf diesem beschäftigen. Im Verlauf dieser Überlegungen werden wir auf die Frage der (erhofften!?) Gleichheit von Ensemblemittelwerten (Theorie) und Zeitmittelwerten (Experiment) stoßen, auf die wir bereits in der Einführung (Kapitel 1) und in Kapitel 2 hingewiesen haben. Wir betrachten ein klassisches System mit der Hamiltonfunktion H und der Hamiltonschen Dynamik ∂H , ~q˙ = ∂~p ∂H p~˙ = − . ∂~q Die qi und pi sind (jeweils) f verallgemeinerte Koordinaten und Impulse. Das Endziel unserer Überlegungen ist es, Systeme im statistischen (thermodynami117 118 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK schen) Gleichgewicht (im bereits intensiv diskutierten Sinn) zu beschreiben. Daher darf die Hamiltonfunktion keine explizite Zeitabhängigkeit haben, da sich ein solches sonst im Allgemeinen nicht einstellen kann. Die Hamiltonschen Bewegungsgleichungen beschreiben Trajektorien im 2f -dimensionalen Phasenraum Γ, mit Elementen1 ~z = ~z(t) gemäß ∂H ∂~ p = f (~z) . (4.1) ~z˙ = − ∂H ∂~ q Diese Differentialgleichung erster Ordnung hat eine eindeutige Lösung, wenn man den Anfangswert ~z0 = ~z(t0 ) vorgibt. Zu jedem ~z0 erhält man eine Bahnkurve im Phasenraum Γ. Aufgrund der Eindeutigkeit, können sich Bahnkurven nicht schneiden. Da wir abgeschlossene Systeme (ohne explizite Zeitabhängigkeit) betrachten ist die Energie durch die Hamiltonfunktion gegeben und entlang einer Bahnkurve konstant, d.h. H(~z(t)) = E =const.. Das H konstant ist folgt direkt aus der Bewegungsgleichung ∂H ˙ ∂H ˙ ∂H ∂H ∂H ∂H d H(~z(t)) = · ~q + · p~ = · − · =0. dt ∂~q ∂~p ∂~q ∂~p ∂~p ∂~q Mit der Energieerhaltung verlaufen die Phasenraumtrajektorien in einer (2f −1)dimensionalen Hyperfläche. Liegen weitere Erhaltungsgrößen vor (Impuls, Drehimpuls, . . .), so reduziert sich die Dimensionalität entsprechend. Wir betrachten eine Teilmenge γ0 von Γ mit Volumen ω0 . Alle ~z ∈ γ0 seien Anfangspunkte für Trajektorien. Gemäß der Bewegungsgleichung wird γ0 = γ(t0 ) auf ein γ(t), mit Volumen ω(t) abgebildet. Der Satz von Liouville besagt, daß ω(t) = ω(t0 ) , das Phasenraumvolumen also invariant ist. Zum Beweis betrachten wir ein infinitesimales Phasenraumvolumen dω(t0 ) = d2f z . Mit Hilfe einer Variablentransformation von zi (t0 ) nach zi (t) können wir eine Beziehung zwischen den Phasenraumvolumina zur Zeit t0 und t herstellen. Es gilt ∂z(t) dω(t) = det dω(t0 ) , ∂z(t0 ) wobei der erste Faktor die Funktionaldeterminante der Variablentransformation bezeichnet. Um die Invarianz des Phasenraumvolumens zu zeigen genügt es also ∂z(t) =1 D(~z(t0 ); t, t0 ) = det ∂z(t0 ) 1 Im Vektor ~z sind erst die verallgemeinerten Orte und dann die verallgemeinerten Impulse angeordnet. 4.1. MIKROSKOPISCHE DYNAMIK UND PHASENRAUM 119 zu beweisen. Gemäß der Definiton gilt D(~z(t0 ); t0 , t0 ) = 1 , D(~z(t0 ); t, t0 ) = D(~z(t1 ); t, t1 )D(~z(t0 ); t1 , t0 ) . Wir betrachten zunächst einen infinitesimalen Zeitschritt t − t0 = . Es gilt ~z(t) = ~z(t0 ) + ~z˙ (t0 ) + O(2 ) ∂H (~z(t0 )) ∂~ p = ~z(t0 ) + + O(2 ) . − ∂H (~ z (t )) 0 ∂~ q Damit ergibt sich für die Matrix aus der die Funktionaldeterminante folgt ! ∂qi (t) ∂qi (t) ∂z(t) ∂qj (t0 ) ∂pj (t0 ) = ∂pi (t) ∂pi (t) ∂z(t0 ) ∂qj (t0 ) ∂pj (t0 ) ! 2H 1 + ∂p∂ i ∂q (~ z (t )) O() 0 j = . 2H O() 1 − ∂q∂i ∂p (~z(t0 )) j Also sind alle Nichtdiagonalelemente von der Größenordnung O(). Wenn wir nur Terme bis zur Ordnung O() berücksichtigen folgt für die Funktionaldeterminante Y f f Y ∂ 2H ∂ 2H D(~z(t0 ); t, t0 ) = (~z(t0 )) 1− (~z(t0 )) + O 2 1+ ∂pi ∂qi ∂qi ∂pi i=1 i=1 f X ∂ 2H ∂ 2H (~z(t0 )) − (~z(t0 )) + O 2 = 1+ ∂pi ∂qi ∂qi ∂pi i=1 = 1 + O 2 . Für einen infinitesimalen Zeitschritt ist die Funktionaldeterminante somit gleich 1. Dies impliziert, daß ∂ D(~z(t0 ); t, t0 ) =0 ∂t t=t0 ∂ ⇒ D(~z(t1 ); t, t1 )D(~z(t0 ); t1 , t0 ) =0 ∂t t=t0 ∂ ⇒ D(~z(t1 ); t, t1 ) =0. ∂t t=t0 Da diese Relationen für alle t0 gelten müssen, folgt ⇒ ∂ D(~z(t0 ); t, t0 ) = 0 ∂t D(~z(t0 ); t, t0 ) = D(~z(t0 ); t0 , t0 ) = 1 120 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK was es zu beweisen galt. Als nächstes wollen wir den Wiederkehrsatz von Poincaré diskutieren. Dazu betrachten wir ein System, welches sich in einem endlichen Ortsvolumen befindet. Dieses ist z.B. durch Wände oder periodische Randbedingungen zu realisieren. Das System habe eine endliche Energie E. Unter diesen Annahmen hat der Phasenraum ein endliches Volumen. Dann gilt der Wiederkehrsatz von Poincaré, der besagt, daß (fast) jede Trajektorie im Phasenraum nach einer gewissen (endlichen) Zeit ihrem Ausgangspunkt beliebig nahe kommt. Das “fast” bedeutet, daß die Aussage nur für Anfangspunkte vom Maß Null nicht gilt. Mathematisch genauer gilt, daß es für jede offene Teilmenge des Phasenraums Trajektorien gibt, die die Teilmenge unendlich oft schneiden. Zum “Beweis” betrachten wir eine beliebige kleine Umgebung γ0 mit Volumen ω0 um den Ausgangspunkt ~z0 = ~z(t0 ). Durch den Phasenraumfluß Gl. (4.1) wird γ0 im Laufe der Zeit eine “Stromröhre” bilden – die Vereinigung aller γt die sich gemäß der Zeitentwicklung ergeben. Zu jeder Zeit t gilt nach dem Liouvilleschen Satz ωt = ω0 . Da sich Phasenraumtrajektorien nicht schneiden können, darf sich die Stromröhre nicht selbst schneiden. Da das von der Stromröhre eingenommene Volumen konstant anwächst (Satz von Liouville) verkleinert sich das der Stromröhre zugängliche Volumen im Laufe der Zeit. Da das Gesamtvolumen des Phasenraum endlich ist, besteht ab einer gewissen endlichen Zeit nur die Möglichkeit, daß die Stromröhre in ihren Ausgangspunkt zurückkehrt, sich also schließt. Da wir nun ω0 beliebig klein wählen können und ~z0 in γ0 vorkommt, folgt die Aussage. Es ist natürlich immer möglich, daß ein System an seinen Ausgangspunkt zurückkehrt ohne, daß das ganze zugängliche Phasenraumvolumen überstrichen wurde. Die Erfahrung lehrt, daß dieses bei Systemen die wir im Rahmen der statistischen Mechanik beschreiben wollen die Ausnahme ist. Systeme die die Phasenraum-Hyperfläche zur Energie E ausschöpfen (d.h. die Trajektorien laufen für große Zeiten durch jedes beliebig kleine Gebiet der Hyperfläche), nennt man ergodisch. Die Zeit (Wiederkehrzeit), die ein System benötigt, um wieder in seinen Ausgangspunkt zurückzukehren, kann für Systeme mit vielen Freiheitsgraden sehr groß werden. Läßt man daher zuerst die Zahl der Teilchen N (und damit der Freiheitsgrade) gegen unendlich gehen und dann die Zeiten groß werden, so wird keine Wiederkehr auftreten. Nur in diesem Sinn ist es möglich eine irreversible Dynamik aus reversiblen mikroskopischen Bewegungsgleichungen zu erhalten. Der Limes N → ∞ wird dabei so ausgeführt, daß die Dichte gleich bleibt. Wir betrachten also N → ∞, V → ∞, mit N/V =const.. Dies ist der thermodynamische Limes. Nach diesen Vorüberlegungen wollen wir uns nun der Frage nähern, ob die von uns bisher betrachteten Ensemblemittelwerte den in Experimenten meist betrachteten Zeitmittelwerten entsprechen. Im Gegensatz zu unserem bisherigen Vorgehen, wäre es von der experimentellen Seite kommend plausibel folgende statistische Sichtweise anzunehmen: Der Versuch ein Vielteilchensystem vollständig mikroskopisch in der Zeit zu verfolgen muß aufgegeben werden. Daher betrachtet man Meßgrößen die über hinreichend lange (im Vergleich zu mikroskopischen 4.1. MIKROSKOPISCHE DYNAMIK UND PHASENRAUM 121 Änderungen, also z.B Stöße) Zeiten gemittelt sind Z 1 t0 +τ (t0 ) ¯ fτ = f (~z(t))dt τ t0 wobei f = f (q1 , . . . qf , p1 , . . . pf ) eine Eigenschaft des Systems beschreibt (z.B. die instantane Kraft pro Fläche). Wie in Kapitel 2 zerlegen wir den Phasenraum nun wieder in kleine Zellen (“coarse graining”), die kleiner als die “Meßgenauigkeit” sein sollen (untere Grenze ist das durch die Quantenmechanik vorgegebene Volumen (2π~)f ). Wir teilen das Zeitintervall [t0 , t0 + τ ] in kleine Intervalle der Größe ∆t und markieren die Phasenraumpunkte für jeden Zeitschritt in Phasenraum ~z(t0 ), ~z(t1 ), . . . , ~z(t0 + τ ). Damit ergibt sich die relative Aufenthaltszeit des Systems in Phasenraumzelle r zu Nr ∆tr = , τ N wobei Nr die Zahl der Punkte (entsprechend unser Diskretisierung) in Phasenraumzelle r bezeichnet und N die Gesamtzahl der Punkte. Diese Größe können wir auch wie folgt schreiben ∆tr = ρτ (~zr ) d2f zr , τ mit der Phasenraumdichteverteilung ρτ (~z) und dem Volumen der Phasenraumzelle r, d2f zr . Für den Zeitmittelwert gilt dann f¯τ(t0 ) ≈ X f (~zr ) r ∆tr X = f (~zr )ρτ (~zr )d2f zr τ r und die Phasenraumdichte ist wegen 1= X Nr r N = X ρτ (~zr )dzr2f Z → ρτ (~z)d2f z r normiert. Statt eines Zeitmittels über die Phasenraumtrajektorie eines Systems betrachten wir nun ein Ensemble von identischen Systemen zu einem Zeitpunkt (z.B. t0 ), in dem die Wahrscheinlichkeit ein System in der Zelle r des Phasenraums zu finden durch ρτ (~zr )d2f zr gegeben ist. Gemäß Konstruktion des Ensembles bedeu(t ) tet dieses, daß f¯τ 0 auch durch den Ensemblemittelwert gegeben ist. Wir haben aber durch diese Überlegungen noch nichts gewonnen, da sich das Ensemble ohne Kenntniss der Trajektorie nicht angeben läßt. Auch die Anfangsbedingungen für die Trajektorie sind nicht bekannt. Wir haben nun die Erwartung, daß das System für große Zeiten einen von den Anfangsbedigungen unabhängigen Gleichgewichtszustand anstrebt. Diese wird 122 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK für die meisten Systeme (generische Systeme) von Interesse durch die Erfahrung bestätigt. Die Erwartung berücksichtigen wir durch die Annahme – die Ergodenhypothese – daß 0) lim ρ(t z ) = ρ(~z) τ (~ τ →∞ existiert und unabhängig von t0 und der Anfangsbedingung ist. Das sich so ergebende ρ ist die Phasenraumdichte eines stationären Ensembles. Damit folgt Z 1 t0 +τ f (~z(t)) dt lim τ →∞ τ t 0 Z = f (~z)ρ(~z)d2f z . hf i = f¯ = Die Idee hinter dieser Überlegung ist, daß das System für große τ die überwiegende Zeit im Gleichgewicht verbringt und der frühe Beitrag zum Zetintegral daher vernachlässigbar ist. In einem nächsten Schritt untersuchen wir, wie das uns bereits gut bekannte mikrokanonische Ensemble ins Spiel kommt. Wir betrachten also wieder ein Vielteilchensystem mit Hamiltonfunktion H welches eine Energie im Interval [E, E + δE] haben soll. Die Bewegung sei durch keine weiteren Erhaltungsgrößen eingeschränkt (der Impuls eines Gases in einem endlichen Volumen ist z.B. aufgrund von Stößen mit der Wand nicht erhalten). Genauer sind die Translationsund Rotationsinvarianz im allgemeinen durch Randbedingungen gebrochen, nicht jedoch die Zeittranslationsinvarianz, da das Gleichgewicht nach Annahme unabhängig vom Anfangszustand bei t0 ist. Es gibt nun sehr viele Mikrozustände, die zwischen den beiden Energieflächen im Phasenraum liegen. Das System ändert seinen Mikrozustand (Phasenraumpunkt) durch Stöße, ohne, daß sich die Dichte ρ(~z) ändert (im Gleichgewicht). Damit kommen wir erneut zu der plausiblen Annahme, daß sich das System mit gleicher Wahrscheinlichkeit in jedem seiner zugänglichen Mikrozustände befindet2 ρ(~z) = 1 Ω(E) 0 für E < H(~z) < E + δE , sonst wobei Z Ω(E) = d2f z . E<H(~ z )<E+δE 2 Im Gegensatz zu Kapitel 2.3, wo wir Zustände gezählt haben, ist die Verteilung hier kontinuierlich (über dem Phasenraum). Wenn man Erwartungswerte oder die Zustandssumme berechnet, macht dieses Verglichen mit Kapitel 2.3 und folgenden keinen Unterschied, da wir dort immer zu Integralen übergegangen sind. 4.1. MIKROSKOPISCHE DYNAMIK UND PHASENRAUM 123 Für ein gegebenes System sollte diese mikrokanonische Verteilung beweisbar sein, in der Praxis ist dies aber sehr schwierig. Die Ensemblemittelwerte von Observablen sind durch Z Z 1 2f hf i = f (~z)ρ(~z)d z = f (~z)d2f z Ω(E) E<H(~z)<E+δE gegeben. Oben haben wir ein hypothetisches Ensemble mit einer Wahrscheinlichkeitsverteilung ρ(~z) im Phasenraum konstruiert, um das Zeitmittel durch ein Ensemblemittel bei einer festen Zeit zu ersetzen. Um die anschließend angenommene Gleichverteilung besser zu begründen, betrachten wir jetzt die Zeitentwicklung des Ensembles mit Dichte ρ(~z; t) bei gegebenem ρ(~z, t0 ). Es ist zu beachten, daß eine allgemeine Dichte explizit von der Zeit abhängen kann. Gemäß unserer Konstruktion, durchlaufen die N Repräsentanten (entstanden durch Diskretisierung der Zeit) alle dieselbe Trajektorie, jedoch zeitverschoben, da sie an verschiedenen Anfangspunkten starten. Aus der klassischen Mechanik wissen sie, daß die Zeitentwicklung jeder Funktion auf dem Phasenraum, also auch von ρ, durch f X ∂ρ ∂ρ ∂ρ dρ = q̇i + ṗi + dt ∂qi ∂pi ∂t i=1 ∂ρ , (4.2) ∂t mit der Poissonklamer {. . . , . . .} gegeben ist. Da ρ eine Wahrscheinlichkeitsdichte ist, gilt für sie eine Kontinuitätsgleichung (siehe die Theorie II oder III Vorlesungen für verwandte Beispiele) = {ρ, H} + ∂ ~ ∂ ρ(~z(t); t) + · j(~z(t); t) = 0 ∂t ∂~z mit der Stromdichte ~j(~z(t); t) = ρ(~z(t); t) ~z˙ (t) . Der zweite Term in der Kontinuitätsgleichung läßt sich umformen zu ∂ h ˙ i ∂ρ d~z ∂ · ρ ~z = · + ρ · ~z˙ . ∂~z ∂~z dt ∂~z Aufgrund der Hamiltonschen Bewegungsgleichung verschwindet der zweite Summand f X ∂ ˙ ∂ q̇i ∂ ṗi · ~z = + ∂~z ∂q ∂pi i i=1 f 2 X ∂ H ∂ 2H = − ∂q p ∂pi qi i i i=1 = 0 124 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK und es gilt die Liouvillsche Gleichung ∂ ρ + {ρ, H} = 0 . ∂t Aus Gl. (4.2) schließen wir somit dρ =0. dt Da die mikrokanonische Vetreilung ρ(~z) nicht explizit zeitabhängig und konstant in ~z ist, ist sie mit dieser Bedingung, die aus der Mikroskopik folgt, verträglich. Dies ist ein weiteres Argument für die mikrokanonische Verteilung als stationäres Ensemble . Wir betrachten nun ein ergodisches System. Dann gilt das Ergodentheorem 1. Der Limes f¯ = limτ →∞ f¯τ existiert. 2. Es gibt eine stationäres Ensemble, so daß f¯ durch den Ensemblemittelwert hti gegeben ist. 3. Das einzige stationäre Ensemble ist das mikrokanonische. Mit unseren Vorüberlegungen ist der dritte Punkt sehr plausibel, da dρ/dt = 0 (längs einer Trajektorie) und da aufgrund der Ergodizität die Trajektorie jedem Punkt beliebig nahe kommt, ist ρ überall (auf der Energieschale) konstant. Somit kann für ein ergodisches System das Zeitmittel mit Hilfe des mikrokanonischen Ensembles berechnet werden. Es ist sehr wichtig festzustellen, daß Ergodizität nicht notwendigerweise bedeutet, daß ein Einzelsystem (Punkt im Phasenraum zu fester Zeit) oder ein Ensemble (Menge im Phasenraum zu fester Zeit) gegen einen zeitunabhängigen Gleichgewichtszustand strebt. Dafür benötigen wir, daß das System mischend ist. Dies bedeutet, daß eine im Phasenraumvolumen γt0 konstante und außerhalb diesem verschwindende Anfangsdichte ρ(~z; t0 ) sich für große Zeiten in eine zerfaserte Dichte ρ(z; t) entwickelt, wobei zerfasert bedeutet, daß ρ(z; t) konstant ist, wenn über beliebig kleine Volumina gemittelt wird. Da das Volumen ωt des sich aus γt0 entwickelnden Phasenraumgebiets nach dem Liouvillschen Satz gleich ωt0 ist, kann die Gleichverteilung nur durch Zerfaserung erreicht werden. Um die Begriffe ergodich und mischend zu erläutern, wollen wir Beispiele betrachten. Ein einzelner harmonischer Oszillator ist ergodisch. Mehrere ungekoppelte harmonische Oszillatoren gleicher Frequenz dagegegen nicht. Ihre Bewegung überstreicht nicht den gesamten durch Energieerhaltung zugelassenen Teil des Phasenraum, sondern bleibt aufgrund der fehlenden Wechselwirkung auf einen kleinen Unterraum beschränkt. 4.1. MIKROSKOPISCHE DYNAMIK UND PHASENRAUM 125 Als weiteres Beispiel betrachten wir ein eindimensionales System mit Hamiltonfunktion H = p − αq und Wertebereich 0 < q, p < 1 (periodische Randbedingungen). Es ist wichtig festzuhalten, daß H in diesem Beispiel keine Erhaltungsgröße ist. Die Bewegungsgleichungen lauten ṗ = α , q̇ = 1 und die Lösung dieser p = p0 + αt mod 1 , q = q0 + t mod 1 . Damit folgt p(t) = p0 + α[q(t) − q0 ]. In der linken Skizze ist eine typische Phasenraumtrajektorie dargestellt. p p q q Es treten nun zwei Situationen auf. Für rationales α = m/n ist die Bahn periodisch mit einer Wiederkehrzeit tP = n. Das System ist nicht ergodisch. Ist α dagegen irrational, so füllt die Trajektorie das Quadrat dicht aus und das System ist ergodisch. Das dynamische System ist jedoch nicht mischend, da eine Anfangsverteilung auf dem Phasenraum in der Zeit nur verschoben wird, nicht jedoch zerfasert (siehe rechte Skizze). Als letztes Beispiel betrachten wir ein Gas aus harten, elastisch Stoßenden Kugeln mit Radius r0 in einem Container (geht auf Sinai zurück). Bei einem Stoß führt schon ein kleiner Unterschied im Stoßpunkt dazu, daß sich zwei sehr unterschiedliche Zustände ergeben. Dies macht plausibel, daß das Gas für große Zeiten den Phasenraum vollständig überdecken wird (mischend) und ergodisch ist. Die Liouvillsche Gleichung für ρ(~z; t) ist invariant unter Zeitumkehr. Dies bedeutet, daß wenn man zu einer Zeit tR > t0 alle Geschwindigkeiten umkehrt 126 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK das System zum Ausgangszustand ρ(~z, t0 ) zurückkehrt. Dies gilt auch für mischenden Systeme – sie entmischen sich. Die Bewegung ist vollständig reversibel. Diese Überlegung mach nocheinmal klar, daß man erst durch zwischengeschaltete Grenzprozesse eine irreversible Dynamik erhält (siehe den obigen thermodynamischen Limes). Führt man für ein mischendes System eine Mittelung über die zerfaserte Verteilung aus, so wird es meist nicht mehr möglich sein zur Ausgangsverteilung zurückzufließen. Man geht meist einfach davon aus, daß ein Vielteilchensystem mit hinreichend komplizierten Wechselwirkungen mischend und ergodisch ist und damit einen Gleichgewichtszustand anstrebt, der durch das mikrokanonische Ensemble beschrieben wird. Mit dieser Festellung wollen wir unsere Überlegungen zum Verhältnis von Ensemble- und Zeitmittel und zur Relaxation in ein Gleichgewicht abschließen. Diese Diskussion erhebt keinen Anspruch auf Vollständigkeit und sollte sie im Wesentlichen mit den wichtigen Ideen vertraut machen. Untersuchungen dazu sind Gegenstand aktueller Forschung. Im Folgenden nehmen wir den am Beginn dieses Absatzes formulierten pragmatischen Standpunkt ein, der sich in der Praxis vorzüglich bewährt hat. Als wir in Kapitel 2.3 die mikrokanonische Zustandssumme eingeführt haben, haben wir in der quantenmechanischen Betrachtung die Wechselwirkung bei der Charakterisierung des Systems (Quantenzahlen) einfachheitshalber nicht berücksichtigt. Auch wenn wir dieses in Kapitel 2.3 bei den klassischen Überlegungen nicht gemacht haben, wollen wir betonen, daß wir uns im aktuellen Kapitel bezüglich der Wechselwirkung nicht eingeschränkt haben. Im Gegenteil, wie wir jetzt besser verstehen, ist die Wechselwirkung für die Relaxation ins Gleichgewicht und die Ensemblebeschreibung essentiell. Im Kapitel 5 zur Quantenstatistik werden wir entsprechend auch wechselwirkenden Systeme betrachten. 4.2 Ensembles der klassischen Mechanik Wie mehrfach diskutiert stellt die mikrokanonische Verteilung (Gesamtheit) das fundamentale statistische Ensemble zur Beschreibung von abgeschlossenen Systemen bei gegebener Energie zwischen E und E + δE dar. Nach den Überlegungen des letzten Kapitels können wir ein abgeschlossenes Vielteilchensystem im Gleichgewicht durch eine Dichte ρ(~z) auf dem Phasenraum beschreiben. Für N gleiche Teilchen gilt 1 für E < H(~z) < E + δE Ω(E) , ρ(~z) = 0 sonst wobei die mikrokanonische Zustandssumme durch Z 1 Ω(E) = d3N xd3N p = ρ(E)δE N !(2π~)3N E<H(~z)<E+δE 4.2. ENSEMBLES DER KLASSISCHEN MECHANIK 127 gegeben ist. Die Zustandsdichte ist wie gehabt durch ρ = dΦ/dE definiert. Wir gehen dabei davon aus, daß die Koordinaten durch Orte und Impulse gegeben sind. Den Überlegungen des letzten Kapitels haben wir im Einklang mit Kapitel 2.4 die Vorfaktoren 1/N ! und (2π~)−3N hinzugefügt. Ignorierend, daß uns natürlich bereits klar ist, warum diese Faktoren sinnvoll sind (Quantenmechanik, Extensitivität der Entropie), kann man sie an dieser Stelle auch als Konvention betrachten, gemäß der die Normierung der Dichte durch Z 1 ρ(~z)d3N xd3N p = 1 (4.3) 3N N !(2π~) gegeben ist. Da wir in der Zwischenzeit über Systeme mit verschiedenen Teilchensorten nachgedacht haben, bietet es sich an, an dieser Stelle eine entsprechende Verallgemeinerung einzuführen. Statt des Faktors 1/N ! tritt dann der Faktor " n Y #−1 Ni ! i=1 auf. Wir betonen noch einmal, daß der Faktor (2π~)−3N , ρ(~z) und Ω(E) zu dimensionslosen Größen macht. Für die Zahl der Zustände mit Energie kleiner E erhalten wir in Anlehnung an Kapitel 2.4 Z 1 Θ(E − H(~z))d3N x d3N p (4.4) Φ(E) = N !(2π~)3N mit der Hamiltonfunktion H(~z). Für die Zustandsdichte ρ(E) können wir daher 1 dΦ(E) = ρ(E) = dE N !(2π~)3N Z δ(E − H(~z))d3N x d3N p schreiben. Diese Schreibweisen sind für formale Überlegungen sehr hilfreich. Wir können auch die Dichte über dem Phasenraum durch eine δ-Funktion schreiben. Im Limes δE → 0 gilt ρ(~z) = 1 δ(E − H(~z)) . ρ(E) (4.5) Nach der Definition von ρ(~z) ist diese Funktion bei H(~z) = E konzentriert. Wir müssen noch überprüfen, ob das so gegebene ρ(~z) auch normiert ist. Um dieses zu sehen, verwenden wir die Beziehung Z 3N d 3N xd Z Z p= H(~ z )=E 1 dS dE |∂H/∂~z| 128 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK mit dem (6N − 1)-dimensionalem Oberflächenelement dS auf der Fläche H(~z) = E. Diese folgt aus ∂H 3N 3N dz⊥ = dE d x d p = dz⊥ dS , ∂~z 1 , ⇒ d3N x d3N p = dEdS |∂H/∂~z| wobei z⊥ die Komponente ist, die senkrecht auf der Oberfläche dS steht. Damit folgt Z Z Z 1 1 1 3N 3N δ(E − H(~z))d x d p = δ(E − H(~z))dSdE 0 ρ(E) |∂H/∂~ z | ρ(E) 0 H(~ z )=E Z 1 1 = dS ρ(E) H(~z)=E |∂H/∂~z| Z 1 dSdz⊥ = ρ(E)δE H(~z)=E Z 1 = d3N x d3N p ρ(E)δE E<H(~z)<E+δE = N !(2π~)3N was es zu zeigen galt. Wir wollen nun kurz diskutieren, wie sich im Stile der obigen Herangehensweise der erste und zweite Hauptsatz ergeben (siehe auch Kapitel 2.8 und 2.9). Wir betrachten eine Hamiltonfunktion, die von einem Satz äußerer Parameter ~a abhängt, die wiederum Funktionen der Zeit ~a = ~a(t) sind (z.B. das Volumen). Es gilt also H = H(~z, ~a(t)) . Die zeitliche Änderung von a soll nun langsam auf der Skala der Relaxationszeit des Systems sein, d.h. der Zeit, die das System benötigt um ins Gleichgewicht zu relaxieren. Die Änderung ist also quasistatisch. Entlang einer Trajektorie ~z(t) ändert sich H gemäß d ∂H ˙ ∂H ˙ ∂H ˙ H(~z(t), ~a(t)) = · ~x + · p~ + · ~a dt ∂~x ∂~p ∂~a ∂H ˙ = · ~a , ∂~a wobei wir die Hamiltonschen Bewegungsgleichungen verwendet haben. Damit folgt Z te ∂H ˙ ∆H = · ~a(t) dt . a ta ∂~ 4.2. ENSEMBLES DER KLASSISCHEN MECHANIK 129 Da sich ~a(t) nur langsam ändert ist ~a˙ (t) praktisch konstant im Intervall ∆t = te − ta und es folgt Z te ∂H ˙ dt ∆H ≈ ~a · a ta ∂~ Z te 1 ∂H = ∆~a · dt ∆t ta ∂~a = ∆~a · ∂H . ∂~a Dabei ergibt sich in der letzten Zeile der zeitliche Mittelwert von ∂H/∂~a wenn man beachtet, daß wir wegen der nur kleinen Änderung ∆~a von ~a in der Zeit ∆t ∂H ∂H (~z(t), ~a(t)) ≈ (~z(t), ~a(ta )) ∂~a ∂~a setzen können. Das Zeitintervall ∆t ist hinreichend groß auf der Skala der Relaxationszeiten, so daß wir mit dem Ergodentheorem den Zeitmittelwert durch den Mittelwert über das mikrokanonische Ensemble ersetzen können Z 1 ∂H ∆H ≈ ∆~a · ρ(~ z ) (~z, ~a)d6N z . 3N N !(2π~) ∂~a Die Energie des Ensembles ist dabei die zur Zeit ta . Die Änderung der Energie ∆H entspricht der quasistatischen Arbeit, so daß infinitesimal geschrieben ∂H d¯W = · d~a ∂~a folgt, was uns natürlich aus Kapitel 2.8 bekannt ist. In einem zweiten Schritt berechnen wir die Änderung von Φ = Φ(E, N, ~a) bei einer Änderung von E und ~a.3 Es gilt dΦ = = = = = 3 ∂Φ ∂Φ dE + · d~a ∂E ∂~a Z 1 ∂ ρ(E, N, ~a)dE + Θ(E − H(~z, ~a))d6N z · d~a 3N N !(2π~) ∂~a Z ∂H 1 ρ(E, N, ~a)dE − δ(E − H(~z, ~a))d6N z · d~a 3N N !(2π~) ∂~a Z 1 ∂H ρ(E, N, ~a)dE − ρ(E, N, ~ a ) ρ(~z)d6N z · d~a 3N N !(2π~) ∂~a ∂H ρ(E, N, ~a)dE − ρ(E, N, ~a) · d~a . ∂~a Wir haben N explizit aufgeführt und nicht bei den Parametern (a1 , . . . , an ) berücksichtigt, da N nicht verändert wird. 130 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK Dabei haben wir Gl. (4.5) verwendet. Setzen wir jetzt noch den Ausdruck für die Arbeit ein, so folgt 1 dΦ ρ −1 ∂Φ 1 dΦ = ∂E Φ Φ 1 = ∂ d(ln Φ) . ln Φ ∂E dE − d¯W = Mit den uns bekannten Definitionen von Entropie S = kB ln Ω ≈ kB ln Φ und Temperatur T −1 = (∂S/∂E)N,~a folgt dE = d¯W + T dS für quasistatische Prozesse. Wir wollen nun sehen, wie man mit Gl. (4.4) die Entropie des idealen einatomigen Gases berechnen kann. Dabei tritt im Gegensatz zu der Rechnung in Kapitel 2.4 keine Summe, sondern direkt das relevante Integral auf. Die Hamiltonfunktion ist H= N X p~i2 , ~xi ∈ V . 2m i=1 Mit Gl. (4.4) folgt Z 1 Φ(E, V, N ) = Θ(E − H(~z))d3N x d3N p N !(2π~)3N Z ∞ Z ∞ 1 VN dp1 . . . dp3N 1 . = N ! (2π~)3N −∞ −∞ | {z } P3N k=1 p2k ≤2mE Dies ist exakt das Integral – Volumen der 3N -dimensionalen Kugel mit Radius √ 2mE – welches wir in Kapitel 2.4 ausgewertet haben. Da wir später mit der im Rahmen des kanonischen Ensembles berechneten Entropie vergleichen wollen, analysieren wir dieses Integral hier “noch genauer” als in Kapitel 2.4. Es gilt (siehe Mathematikvorlesungen) Φ(E, V, N ) = VN π 3N/2 (2mE)3N/2 N !(2π~)3N Γ(3N/2 + 1) mit der Gamma-Funktion Γ(x). Mit der asymptotischen Entwicklung (vergleiche mit Strirlingscher Formel!) ln Γ(x + 1) = x(ln x − 1) + 1 ln (2πx) + O(1/x) 2 4.2. ENSEMBLES DER KLASSISCHEN MECHANIK 131 und daraus für x = N ∈ N (es gilt Γ(N + 1) = N !) ln N ! = N (ln N − 1) + 1 ln (2πN ) + O(1/N ) 2 (4.6) folgt S(E, V, N ) = kB ln Ω(E, V, N ) ≈ kB ln Φ(E, V, N ) V 3 E 5 3 4πm = N kB ln + ln + + ln N 2 N 2 2 3(2π~)2 +O(ln N ) . (4.7) Die Entropie des idealen Gases ist, wie allgemeine zu fordern, extensiv (N tritt als Vorfaktor auf und E und V nur als die Größen pro Teilchen). Um dieses Ergebnis zu erhalten, ist es essentiell den Faktor 1/N ! zu berücksichtigen. Es gilt 31 ∂S 3 1 = N kB = ⇒ E = N kB T , T ∂E V,N 2E 2 P ∂S N kB = ⇒ P V = N kB T . = T ∂V E,N V Im Rahmen der klassischen statistischen Mechanik läßt sich der sogenannten Gleichverteilungssatz (Äquipartitionstheorem) beweisen. Es gilt ∂H = kB T zi ∂zi für alle Komponenten (Koordinate oder Impuls) zi des Phasenraumvektors (also einer Koordinate oder einem Impuls). Zum Beweis betrachten wir R ∂H zi ∂zi δ(E − H(~z))d6N z ∂H R zi = ∂zi δ(E − H(~z))d6N z R ∂ zi ∂zi Θ(E − H(~z))d6N z = − R δ(E − H(~z))d6N z R ∂ R [zi Θ(E − H(~z))] d6N z Θ(E − H(~z))d6N z ∂zi R R = − + . δ(E − H(~z))d6N z δ(E − H(~z))d6N z Das Integral über zi im Zähler des ersten Summanden können wir nun leicht ausführen. Es ist durch lim|zi |→∞ zi Θ(E − H(~z)) gegeben. Da starre Wände vorliegen gilt für alle Ortskomponenten lim xi Θ(E − H(~x, p~)) = 0 . |xi |→∞ 132 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK Für periodische Randbedingungen heben sich die Beiträge von der oberen und der unteren Grenze weg. Da die Energie endliche ist folgt ebenfalls lim pi Θ(E − H(~x, p~)) = 0 . |pi |→∞ Der erste Summand verschwindet somit und es folgt R Θ(E − H(~z))d6N z ∂H R = zi ∂zi δ(E − H(~z))d6N z Φ(E) = ρ(E) Φ = ∂Φ/∂E 1 = ∂ ln Φ/∂E 1 ≈ ∂ ln Ω/∂E = kB T . Dieses Ergebnis ist sehr nützlich. Sei H homogen vom Grade n in einer Teilmenge von Koordinaten und/oder Impulsen {zi }, i = 1, . . . , f . Dies gilt z.B. P für n = 2 und alle Impulskomponenten bei der standard kinetischen Energie i p~i2 /(2m). Dann gilt H = H1 (z1 , . . . , zf ) + H2 (zf +1 , . . . , z6N ) mit f X H1 (z1 , . . . , zf ) = ai1 ,...,in zi1 . . . zin i1 ,...,in =1 ⇒ f X i=1 ⇒ zi ∂H1 = nH1 (z1 , . . . , zf ) ∂zi hH1 (z1 , . . . , zf )i = f kB T , n d.h. jeder Freiheitsgrad, der in n-ter Ordnung in H vorkommt, trägt zum Erwartungswert der Energie den Beitrag kB T /n bei. Dieser Fall tritt wie oben schon beispielhaft erwähnt oft für n = 2 auf (kinetische Energie, harmonisches Potential, Vibrationsenergie, Rotationsenergie). Für das ideale einatomige Gas ergibt sich so direkt 3 hEi = N kB T (= E) . 2 Ist zusätzlich zur quadratischen kinetischen Energie das Potential homogen vom Grad n in allen xi , so folgt 3 3 hHkin i = N kB T , hHpot i = N kB T 2 n 4.2. ENSEMBLES DER KLASSISCHEN MECHANIK 133 und damit der Virialsatz 2 hHkin i = n hHpot i = 3N kB T . (4.8) Wir wenden uns nun der kanonischen Gesamtheit zu. Wie in Kapitel 2.11 diskutiert ist diese relevant für Systeme, die Energie (Wärme) mit einem großen Wärmebad austauschen können. Dabei soll das Volumen V und die Teilchenzahl N des betrachteten Subsystems fest sein. Wir sind dabei davon ausgegangen, daß die Wechselwirkung zwischen dem System und dem Wärmereservoir zwar vorhanden ist (wichtig für Energieaustausch) aber als “Oberflächeneffekt” gegenüber den Energien des Reservoirs und des Systems vernachlässigbar ist. Aus der in Kapitel 2.11 unter diesen Annahmen hergeleiteten Wahrscheinlichkeitsverteilung {Pr } läßt sich sofort die Phasenraumdichte des Ensembles für das Subsystem ablesen ρ(~z) = ρ(~x, p~) = 1 −βH(~x,~p) e , Z β= 1 kB T mit der kanonischen Zustandssumme Z 1 Z = Z(T, V, N ) = e−βH(~x,~p) d3N xd3N p . N !(2π~)3N Es gilt die Normierung wie in Gl. (4.3). Der Mittelwert und die Schwankung der Energie lassen sich leicht durch Ableiten von ln Z bestimmen (siehe auch Kapitel 2.12 für ein Beispiel). Es gilt Z 1 1 H(~x, p~)e−βH(~x,~p) d3N xd3N p hEi = N !(2π~)3N Z Z 1 1 ∂ = − e−βH(~x,~p) d3N xd3N p N !(2π~)3N Z ∂β 1 ∂ Z = − Z ∂β ∂ = − ln Z (4.9) ∂β und ⇒ ⇒ ⇒ Z 1 [H(~x, p~) − hEi] e−β[H(~x,~p)−hEi] d3N xd3N p = 0 N !(2π~)3N Z ∂ hEi 1 βhEi − Ze − [H(~x, p~) − hEi]2 e−β[H(~x,~p)−hEi] d3N xd3N p 3N ∂β N !(2π~) Z 1 ∂ hEi −β[H(~x,~p)−hEi] 3N 3N + [H(~x, p~) − hEi] β e d xd p = 0 3N N !(2π~) ∂β ∂ hEi Z eβhEi − (∆E)2 Z eβhEi + 0 = 0 − ∂β ∂ hEi ∂ 2 ln Z (∆E)2 = − = . (4.10) ∂β ∂β 2 134 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK Dabei haben wir von der ersten zur zweiten Zeile nach β abgeleitet. Der Erwartungswert der Energie entspricht der inneren Energie eines Systems. Wir können somit den Kontakt zur Thermodynamik herstellen und schreiben ∂U ∂T ∂U ∂ hEi 2 =− =− = kB T 2 CV , (∆E) = − ∂β ∂β V,N ∂β ∂T V,N wobei wir, um eine Doppeltbelegung der Symbole zu vermeiden, das Symbol für die innere Energie eingeführt haben. Für makroskopische Systeme sind hEi bzw. die Wärmekapazität proportional zur Zahl der Freiheitsgrade, so daß wir 1 ∆E ∼√ hEi N (4.11) erhalten. Die Verteilung der Energie des Subsystems hat ein sehr scharfes Maximum um den Mittelwert (siehe Kapitel 2.11). Auch wenn die kanonische Gesamtheit Systeme mit verschiedener Energie enthält, so haben für große N fast alle Systeme die Energie hEi. Die kanonische Zustandssumme läßt sich oft leichter berechnen als die mikrokanonische. Aus Z läßt sich ebenfalls die gesamte Thermodynamik herleiten, wobei sämtliche Unterschiede zwischen in den beiden Ensembles berechneten Größen im thermodynamischen Limes verschwinden. Ein Beispiel für diese Beobachtung liefert die Energie, die nach Gl. (4.11) für große N auch im kanonischen Ensemble “scharf” wird. Um diese Aussagen genauer zu untersuchen betrachten wir wie sich Z (genauer ln Z) ändert, wenn man die Temperatur T und die äußeren Parameter ~a variiert. Es gilt 1 dZ Z Z −βH(~x,~p) 3N 3N 1 1 = d e d xd p Z N !(2π~)3N Z 1 1 ∂H −βH(~ x,~ p) = e · d~a d3N xd3N p −Hdβ − β Z N !(2π~)3N ∂~a ∂H = − hHi dβ − β · d~a ∂~a 1 1 ∂H = hHi dT − · d~a . kB T 2 kB T ∂~a d ln Z = Der zweite Summand enthält wieder die Arbeit,4 so daß 1 U d ln Z = dT − d¯W , kB T T Genauer gesagt, verwenden wir ∂H · d~a als die Definiton der Arbeit im kanonischen ∂~ a Ensemble (siehe Kapitel 2.8). Dies gilt es zu vergleichen mit der “Herleitung” im Falle des mikrokanonischen Ensembles. Betrachten wir ein konkretes Beispiel: Den Druck definieren wir als den Mittelwert über das kanonische Ensemble von ∂H ∂V . 4 4.2. ENSEMBLES DER KLASSISCHEN MECHANIK 135 bzw. d(−kB T ln Z) = −kB T d ln Z − kB ln ZdT 1 = d¯W − (U + kB T ln Z) dT . T Wir definieren daher die freie Energie als F = F (T, V, N ) = −kB T ln Z(T, V, N ) und die Entropie als S= 1 (U − F ) = kB (ln Z + βU ) T woraus sich die uns aus der Thermodynamik bekannten Relationen (d¯W = −P dV im einfachsten Fall; vergleiche Kapitel 3.4) dF = d¯W − SdT , F = U − TS ergeben. Die freie Energie F ist das zum kanonischen Ensemble gehörende thermodynamische Potential. Wir müssen jetzt noch zeigen, daß die mikrokanonisch und die kanonisch definierten Entropien übereinstimmen. Dazu betrachten wir die Wahrscheinlichkeit P (E)δE, daß die Energie des (Sub-)Systems (im kanonischen Ensemble) in [E, E + δE] liegt Z 1 1 e−βH(~x,~p) d3N xd3N p P (E)δE = 3N N !(2π~) Z E<H(~x,~p)<E+δE Z 1 1 ≈ δE δ(E − H(~x, p~)) d3N xd3N p e−βE Z N !(2π~)3N 1 = δE ρ(E)e−βE , Z also P (E) = 1 ρ(E)e−βE . Z (4.12) Da P (E) normiert sein muß folgt5 Z Z= 5 ρ(E)e−βE dE . Da in diesem Ausdruck das ρ(E) vorkommt (siehe mikrokanonisches Ensemble) ist er nicht direkt zur Berechnung von Z geeignet. 136 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK Wie wir in Kapitel 2.13 gezeigt haben, kann P (E) näherunsgweise als Gaußkurve um hEi mit Breite ∆E beschrieben werden. Damit folgt Z Z = ρ(E)e−βE dE Z [E − hEi]2 −βhEi = ρ(hEi)e exp − dE 2(∆E)2 = ρ(hEi)e−βhEi [2π(∆E)2 ]1/2 also 1 ln [2π(∆E)2 ] 2 = Smikro + O(ln N ) , ln Z = ln ρ(U ) − βU + ⇒ Skan wobei wir Smikro (E) = ln Ω(E) ≈ ln ρ(E) verwendet haben. Für große N (im thermodynamischen Limes) spielt es also keine Rolle, ob wir die Entropie im Rahmen des kanonischen oder des mikrokanonischen Ensembles berechnen. Ersteres ist im Allgemeinen einfacher. Als Beispiel dazu betrachten wir die Entropie des idealen Gases. Für das mikrokanonische Ensemble haben wir sie in Gl. (4.7) berechnet. Für das Gas mit N identischen wechselwirkungsfreien Teilchen folgt im kanonischen Ensemble6 Z Z PN 1 2 e−β i=1 p~i /(2m) d3N xd3N p Z = 3N N !(2π~) ~ xi ∈V N Z N V 1 −β~ p2 /(2m) 3 e dp = N ! (2π~)3N 3N/2 V N mkB T = . N! 2π~2 Damit folgt für die innere Energie ∂ ln Z 1 ∂Z 1 3N 3N U =− =− =− − Z = ∂β Z ∂β Z 2β 2β 3 ⇒ U = N kB T 2 und für die freie Energie (mit Gl. (4.6)) 3N mkB T F = −kB T ln Z = −kB T N ln V − ln N ! + ln 2 2π~2 V 3 2πmkB T = −N kB T ln + 1 + ln + O(ln N ) . N 2 (2π~)2 6 Verglichen mit dem Ergebnis für Z aus Kapitel 2.12 ergeben sich durch die andere Normierung der Zustandsdichte auf dem Phasenraum andere Abhängigkeiten (speziell von N ). Im Gegensatz zu Kapiteln 2.4 (mikrokanonisch) und 2.12 (kanonisch) gehen wir hier was die N -Abhhängigkeit angeht in beiden Ensembles konsistent vor (siehe Diskussion in Kapitel 2.12). 4.2. ENSEMBLES DER KLASSISCHEN MECHANIK 137 Für die Entropie folgt so S = 1 (U − F ) T = N kB ln V N 5 3 + + ln 2 2 3N kB T 2N 3 + ln 2 4πm 3(2π~)2 + O(ln N ) , also bis auf Korrekturen der Ordnung ln N dasselbe wie im mikrokanonischen Fall Gl. (4.7). Wir haben damit sowohl allgemein, wie auch in einem Beispiel gezeigt, daß es für große N egal ist, ob man eine Meßgröße im kanonischen oder mikrokanonischen Ensemble berechnet. Im thermodynamischen Limies sind beide Ensembles äquivalent. Wäre dieses nicht der Fall, so könnte man die Relevanz beider Ensembles anzweifeln. Dies sieht man leicht, wenn man sich ein großes homogenes System in ein kleines und ein Reservoir zerlegt vorstellt. Das kleine Subsystem muß weiterhin die gleichen thermodynamischen Eigenschaften haben, wie das Gesamtsystem, wobei man ersteres durch das kanonische, aber letzteres durch das mikrokanonische Ensemble beschreiben wird. Beide Ensembles sollten also für hinreichend große Teilchenzahlen äquivalent sein. Wir hatten bereits in Kapitel 2.4 gesehen, daß es keinen relevanten Unterschied macht, ob man die Entropie als den Logarithmus der Zahl der Zustände mit Energie in [E, E + δE] oder mit Energie kleiner E definiert. Das thermodynamische Verhalten ist in beiden Fällen gleich, wenn N groß ist. Jetzt sehen wir, daß es für große N keinen Unterschied macht, ob wir die Energie, oder die Temperatur vorgeben. Durch die Vorgabe des einen, ist das andere (bis auf verschwindende relative Schwankungen) festgelegt und die Thermodynamik ist diesselbe. Wie im mikrokanonischen Ensemble gilt der Gleichverteilungssatz ∂H = kB T , zi ∂zi was man wie folgt sieht Z 1 1 ∂H −βH(~x,~p) 3N 3N ∂H = z e d xd p zi i ∂zi N !(2π~)3N Z ∂zi Z 1 1 1 ∂ −βH −βH = − zi e −e d3N xd3N p 3N N !(2π~) Z β ∂z Z i 1 1 1 = 0+ e−βH d3N xd3N p 3N N !(2π~) Z β = kB T . Das noch fehlende Ensemble ist das großkanonische. Dieses ist relevant für Subsysteme die sowohl Energie als auch Teilchen mit einem großen Reservoir austauschen können. Wie üblich gilt E E 0 und N N 0 (sowie V V 0 ). 138 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK Wir gehen wieder davon aus, daß die Hamlitonfunktionen der beiden Systeme (Subsystem und Reservoir) additiv sind Hg (~zg ) = H(~z) + H 0 (~z0 ) , die Wechselwirkungsenergie zwischen den Systemen also verglichen mit den Energien der beiden Einzelsysteme vernachlässigt werden kann (“Oberflächeneffekt”). Das Gesamtsystem ist abegschlossen und durch das mikrokanonische Ensemble beschrieben. Wie in Kapitel 3.7 (siehe Seite 100) bereits hergeleitet gilt im Gleichgewicht T = T0 , µ = µ0 , mit ∂S ∂ = = ln Ω(E, N ) , ∂E ∂E E=hEi,N =hN i µ ∂S ∂ − = = ln Ω(E, N ) . T ∂N ∂N E=hEi,N =hN i 1 T Um die Wahrscheinlichkeitsdichte ρN (~z) der großkanonischen Verteilung auf dem Phasenraum zu bestimmen, gehen wir völlig ananolg zu Kapitel 2.11 vor, entwickeln aber ln Ω0 nicht nur nach der Energie, sondern zusätzlich nach der Teilchenzahl. Mit der Definition des chemischen Potentials erhalten wir ρN (~x, p~) = 1 −β[H(~x,~p)−µN ] e , Zgk mit der großkanonischen Zustandssumme Zgk ∞ X 1 = Zgk (T, V, µ) = N !(2π~)3N N =0 Z e−β[H(~x,~p)−µN ] d3N xd3N p und der Normierung ∞ X 1 N !(2π~)3N N =0 Z ρN (~x, p~) d3N xd3N p = 1 . Die auftretende Hamiltonfunktion H versteht sich dabei immer als Hamiltonfunktion eines N -Teilchen Systems. Wie in Gl. (4.12) zeigt man für die Wahrscheinlichkeit, daß sich N Teilchen im (Sub-)System mit Energie in [E, E + δE] befinden P (E, N ) = 1 ρ(E)e−β(E−µN ) . Zgk 4.2. ENSEMBLES DER KLASSISCHEN MECHANIK 139 Da P (E, N ) normiert sein muß folgt Zgk = ∞ Z X ρ(E, N )e−β(E−µN ) dE . N =0 Die Mittelwerte und Schwankungen von Energie und Teilchenzahl im großkanonischen Ensemble berechnet man einfach, wenn man die Zustandssumme als Funktion von β und α = βµ auffaßt ∞ X 1 Z̃gk (T = 1/(kB β), V, α) = N !(2π~)3N N =0 Z e−βH(~x,~p)+αN d3N xd3N p . In vollständiger Analogie zu Gln. (4.9) und (4.10) zeigt man ∂ ln Z̃gk , ∂β ∂ hEi ∂ 2 ln Z̃gk (∆E)2 = − = , ∂β ∂β 2 ∂ ln Z̃gk hN i = , ∂α ∂ 2 ln Z̃gk ∂ hN i = . (∆N )2 = ∂α ∂α2 hEi = − Einige dieser Ausdrücke lassen sich auch einfach mit ln Zgk schreiben ∂ ln Zgk , ∂β 1 ∂ ln Zgk hN i = , β ∂µ 1 ∂ 2 ln Zgk (∆N )2 = . β 2 ∂µ2 hEi − µ hN i = − Der Ausdruck für (∆E)2 mit ln Zgk ist unhandlich. Wie wir gleich sehen werden, gilt ln Zgk ∼ hN i , so daß die relativen Schwankungen von Energie und Teilchenzahl erneut wie die inverse Wurzel der Teilchenzahl verschwinden. Im großkanonischen Ensemble haben somit für hinreichend große Teilchenzahlen (also bei fester Dichte für Subsysteme mit hinreichend großem Volumen) fast alle Systeme die Energie hEi und die Teilchenzahl hN i. Dies liefert einen ersten Hinweis, daß das großkanonische Ensemble für N → ∞ äquivalent zu den anderen beiden Ensembles ist. 140 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK Um dieses weiter zu untersuchen betrachten wir wieder wie sich der Logarithmus der Zustandssumme ändert, wenn wir die Parameter des Ensembles T , ~a und µ variieren 1 dZgk Zgk ∞ 1 X d ln Zgk = = Zgk 1 N !(2π~)3N N =0 Z d e−β[H(~x,~p)−µN ] d3N xd3N p Z ∞ 1 1 X = e−β[H(~x,~p)−µN ] Zgk N =0 N !(2π~)3N ∂H × −(H − µN )dβ − β · d~a + βN dµ d3N xd3N p ∂~a ∂H · d~a + β hN i dµ = − (hEi − µ hN i) dβ − β ∂~a 1 1 = [U − µ hN i]dT + hN i dµ − d¯W . kB T T Damit gilt d(−kB T ln Zgk ) = −kB T d ln Zgk − kB ln Zgk dT 1 = d¯W − (U − µ hN i + kB T ln Zgk ) dT − hN i dµ . T Wir definieren daher das großkanonische Potential als J = J(T, V, µ) = −kB T ln Zgk (T, V, µ) und die Entropie als 1 (U − µ hN i − J) (4.13) T woraus sich die uns aus der Thermodynamik bekannten Relationen (d¯W = −P dV im einfachsten Fall; vergleiche Kapitel 3.7) S= dJ = d¯W − SdT − N dµ , J = U − T S − µN ergeben. Wir haben dabei hN i ≈ N verwendet. Das großkanonische Potential J ist das zum großkanonischen Ensemble gehörende thermodynamische Potential. Aus J = −kB T ln Zgk = U − T S − µN wird offensichtlich, daß ln Zgk ∼ N ≈ hN i, wie oben bereits angekündigt (und verwendet). Völlig analog zum Vergleich der Entropie des kanonischen und des mikrokanonischen Ensembles zeigt man, daß Sgk = Smikro + O(ln hN i) . 4.2. ENSEMBLES DER KLASSISCHEN MECHANIK 141 Als Beispiel betrachte wir erneut das ideale Gas. Für dieses gilt Z Z ∞ X P 1 −β N ~2i /(2m) βµN 3N i=1 p Zgk = e e d xd3N p 3N N !(2π~) ~ xi ∈V N =0 3/2 !N ∞ X 1 2πmk T B V eβµ = 2 N ! (2π~) N =0 ( 3/2 ) 2πmk T B . = exp V eβµ (2π~)2 Den dabei auftretenden Faktor z = eβµ bezeichnet man als Fugazität und den Bruch λT = √ 2π~ 2πmkB T (4.14) als die thermische Wellenlänge. Sie entspricht der quantenmechanischen Wellenlänge eines Teilchens der kinetischen Energie p~2 /(2m) = πkB T . Für das großkanonische Potential folgt dann 3/2 βµ 2πmkB T . (4.15) J(T, V, µ) = −kB T V e (2π~)2 Es ist bemerkenswert, daß wir zur Herleitung dieses Ausdrucks nicht die Stirlingsche Formel verwenden mußten (siehe die Potentiale der anderen Ensembles). Um die Erwartungswerte von Teilchenzahl und Energie zu berechnen betrachten wir 3/2 2πm α ln Z̃gk = V e (2π~)2 β ⇒ hEi = U = − hN i = ⇒ ∂ ln Z̃gk 3 = kB T ln Z̃gk , ∂β 2 ∂ ln Z̃gk = ln Z̃gk ∂α 3/2 3 µ/(kB T ) 2πmkB T U = hN i kB T , hN i = V e , 2 (2π~)2 (4.16) also unsere wohlbekannte Beziehung zwischen Energie, Teilchenzahl und Temperatur. Mit Gl. (4.15) folgt 3/2 βµ 2πmkB T J = −kB T V e = − hN i kB T (2π~)2 142 KAPITEL 4. KLASSISCHE STATISTISCHE MECHANIK und mit der allgemeinen Beziehung J = −P V (siehe Kapitel 3.7) ergibt sich die Zustandsgleichung P V = hN i kB T . Hält man µ fest und variiert T , so führt das zu im großkanonischen Ensemble zu einer Änderung der Teilchenzahl, bzw. der Dichte n = hN i /V . Dies ist meist nicht die Situation an der wir interessiert sind. Daher geben wir meist die Dichte vor und bestimmen µ als Funktion der Dichte und der Temperatur. Wir können Gl. (4.16) nach µ auflösen7 hN i 3 2πmkB T (4.17) µ = kB T ln − ln V 2 (2π~)2 und erhalten so für die Entropie Gl. (4.13) 1 (U − µ hN i − J) T µ 5 − = hN i kB 2 kB T 5 3 3 hN i kB T 3 4πm V = hN i kB ln + + ln + ln , hN i 2 2 2 hN i 2 3(2π~)2 S = also denselben Ausdruck wie im kanonischen und mikrokanonischen Ensemble. Hier mußten wir jedoch keine Näherungen machen. Dieses Beispiel zeigt klar, daß das großkanonische Ensemble für große hN i ≈ N äquivalent zu den anderen beiden Ensembles ist. Aus ihm folgt die uns bekannte Thermodynamik. Dies war nicht anders zu erwarten, da sich die Überlegungen von Seite 137 auf das großkanonische Ensemble erweitern lassen. Meist ist die Berechnung der großkanonischen Zustandssumme noch einfacher, als die Berechnung der kanonischen (siehe das Beispiel des idealen Gases). Daher ist das großkanonische Ensemble das für mikroskopische Rechnungen meist verwendete der drei Ensembles. Da sich der Gleichverteilungssatz nicht auf das großkanonische Ensemble erweitern läßt, verwendet man dafür das kanonische und die Tatsache, daß die Erwartungswerte in beiden Ensembles für große Teilchenzahl identisch sind. 7 Das Ergebnis ist für festes n aus Seite 165 skizziert. Kapitel 5 Quantenstatistik In Kapitel 4 haben wir einen genaueren Blick auf die klassische statistische Mechanik geworfen. Gleiches wollen wir hier für die Quantenstatistik machen. Wir werden dabei auch klären, unter welchen Bedigungen die klassische Sichtweise gültig ist und diverse Anwendungen diskutieren. 5.1 Dichtematrix und von Neumann-Gleichung Ein quantenmechanisches Vielteilchensystem wird durch einen selbstadjungierten Hamiltonoperator der Form " # N X X p~ˆi2 Ĥ = + V (~xˆi ) + vi,j (~xˆi , ~xˆj ) 2m i i=1 i>j beschrieben. Dabei bezeichnen ~xˆi bzw. p~ˆi die Orts- bzw. Implusoperatoren des i-ten Teilchens, V ein äußeres Potential und vi,j eine Zweiteilchenwechselwirkung (z.B. das Potential der Coulombwechselwirkung bei geladenen Teilchen). Da wir später am Gleichgewicht interessiert sind, gehen wir schon jetzt davon aus, daß das äußere Potential zeitunabhängig ist. Die auftretenden Operatoren sind als Tensorprodukte zu verstehen, die auf einem Raum operieren, der sich als Produktraum der Hilberträume der einzelnen Freiheitsgrade ergibt. Der N Teilchenzustand wird durch den auf Eins normierten Vektor |ψi beschrieben; hψ| ψi = 1. Dieser Zustand erfüllt die normerhaltende Schrödingergleichung i~ d |ψ(t)i = Ĥ |ψ(t)i dt mit der Anfangsbedingung |ψ(t0 )i = |ψ0 i. Die Erwartungswerte von Observablen, die durch selbstadjungierte Operatoren Ô gegeben sind, berechnen sich gemäß D E Ô (t) = hψ(t)| Ô |ψ(t)i . 143 144 KAPITEL 5. QUANTENSTATISTIK Der Satz {|ni} von Vielteilchenzuständen sei ein vollständiges Orthonormalsystem des gegebenen Problems. Dabei bezeichne n einen Multiindex der alle Quantenzahlen umfaßt. Da wir zunächst Systeme mit endlichem Volumen betrachten, gehen wir davon aus, daß alle Quantenzahlen diskret sind. Dann läßt sich jeder Zustand in der Form |ψi = X cn |ni n mit cn = hn |ψi schreiben, wobei hn |mi = δn,m , 1 = X |ni hn| n ausgenutzt wird. Die quantenmechanische Wahrscheinlichkeit das System bei einer Messung aller das vollständige Orthonormalsystem festlegenden Observablen im Zustand |ni anzutreffen ist durch |hn |ψi|2 gegeben. Diese quantenmechanische Wahrscheinlichkeit ist dem einzelnen System inhärent und ist daher von der durch eine Ensemblebeschreibung ins Spiel kommende Wahrscheinlichkeit zu unterscheiden. Das Konzept der Wahrscheinlichkeit ist auch z.B. dann in der Quantenmechanik unvermeidbar, wenn – wie wir bisher in diesem Kapitel angenommen haben – der Anfangszustand vollständig bekannt ist. Wie in der klassischen statistischen Mechanik – und basierend auf identischen Überlegungen – betrachten wir nun ein Ensemble von Systemen, die alle durch den gleichen Hamiltonoperator beschrieben werden. Zur willkürlich gewählten Anfangszeit t0 seien dieses die (auf Eins normierten) Zustände |ψ1 (t0 )i , |ψ2 (t0P )i , . . .. Jeder komme mit der Wahrscheinlichkeit p1 , p2 , . . . im Ensemble vor, wobei i pi = 1 gilt. Diese Wahrscheinlichkeiten ändern sich zeitlich nicht, während die Dynamik der zugehörigen Zustände durch die Schrödingergleichung gegeben ist. Der Mittelwert (oder Erwartungswert) einer Observablen ergibt sich dann zu D E X Ô (t) = pi hψi (t)| Ô |ψi (t)i , (5.1) i hat also einen Beitrag durch die Ensemblebetrachtung und einen aufgrund der quantenmechanischen Beschreibung. Um ein quantenmechanisches Analogon der Wahrscheinlichkeitsdichte ρ(~x, p~) auf dem Phasenraum zu finden, schreiben wir den Erwartungswert Gl. (5.1) um. 5.1. DICHTEMATRIX UND VON NEUMANN-GLEICHUNG 145 Es gilt D E X Ô (t) = pi hψi (t)| Ô |ψi (t)i i = XX pi hψi (t)| ni hn| Ô |mi hm| ψi (t)i n,m i ! = X X hm| n,m pi |ψi (t)i hψi (t)| |ni hn| Ô |mi i {z | = X =ρ̂(t) } hm| ρ̂(t) |ni hn| Ô |mi n,m = X hn| ρ̂(t)Ô |ni n h i = Tr ρ̂(t)Ô , mit der Spur eines Operators  Tr = X hn|  |ni , n und der durch das Ensemble festgelegten Dichtematrix (dem statistischen Operator) ρ̂(t) = X pi |ψi (t)i hψi (t)| . i Wir haben somit eine elegante Art gefunden den Erwartungswert einer Observablen zu schreiben. Wie wir gleich zeigen werden, ist die Spur und damit der Erwartungswert unabhängig vom gewählten vollständigen Orthonormalsystem. Da es sich bei Ô um eine Observable handelt, ist es immer möglich ein vollständiges Orthonormalsystem aus Eigenzuständen zu Ô zu wählen. Für dieses gilt Ô |ni = on |ni. In dieser Basis gilt D E h i Ô (t) = Tr ρ̂(t)Ô X = hn| ρ̂(t)Ô |ni n = X on hn| ρ̂(t) |ni . n Die in diesem Ausdruck auftretenden Diagonalelemente der Dichtematrix können 146 KAPITEL 5. QUANTENSTATISTIK nach der Definitionsgleichung dieser als X hn| ρ̂(t) |ni = pi hn |ψi (t)i hψi (t)| ni i X = pi |hn| ψi (t)i|2 i geschrieben werden. Der zweite Faktor gibt dabei die (quantenmechanische) Wahrscheinlichkeit ein einzelnes System im Zustand |ni zu finden, während der erste die (Ensemble-)Wahrscheinlichkeit ist. Dies liefert eine alternative Sichtweise darauf, daß der obige Ausdruck in der Tat den Erwartungswert einer Observablen angibt. Die Dichtematrix (der statistische Operator) hat die wichtigen Eigenschaften (Normiertheit und Selbstadjungiertheit) Trρ̂(t) = 1 , ρ̂(t) = ρ̂† (t) , die man wir folgt beweist Trρ̂(t) = X hn| ρ̂(t) |ni n = X pi X hψi (t)| ni hn| ψi (t)i n i = X = X pi hψi (t)| ψi (t)i i pi i = 1, !† ρ̂† (t) = X pi |ψi (t)i hψi (t)| i = X = X p∗i (|ψi (t)i hψi (t)|)† i pi |ψi (t)i hψi (t)| i = ρ̂(t) . Die Spur ist zyklisch invariant, d.h. es gilt Tr(ÂB̂) = Tr(B̂ Â) , 5.1. DICHTEMATRIX UND VON NEUMANN-GLEICHUNG 147 was man wie folgt sieht Tr(ÂB̂) = X hn| ÂB̂ |ni n = X = X hn|  |mi hm| B̂ |ni n,m hm| B̂ |ni hn|  |mi n,m = X hm| B̂  |mi m = Tr(B̂ Â) . Weiterhin gilt für einen beliebigen unitären Operator Û (d.h. einen Operator mit Û −1 = Û † ) Tr(Û −1 ÂÛ ) = Tr(Û † ÂÛ ) = Tr(Û Û † Â) = Tr . Damit ist die Spur unabhängig von der gewählten Basis (dem gewählten vollständigen Orthonormalsystem). Die zeitliche Dynamik der Dichtematrix ergibt sich aus der Schrödingergleichung. Mit i~ d |ψ(t)i = Ĥ |ψ(t)i dt folgt −i~ d hψ(t)| = hψ(t)| Ĥ dt und damit X d d d pi i~ |ψ(t)i hψ(t)| + i~ |ψ(t)i hψ(t)| i~ ρ̂(t) = dt dt dt i = Ĥ ρ̂(t) − ρ̂(t)Ĥ h i = Ĥ, ρ̂(t) , mit dem Kommutator [. . . , . . .]. Dies ist das quantenmechanische Analogon zur klassischen Liouvillschen Gleichung (siehe Kapitel 4.1). Man bezeichnet die Bewegungsgleichung als von Neumann-Gleichung. Die Anfangsbedingung ist durch ρ̂(t0 ) = ρ̂0 gegeben. Da der Hamiltonoperator als zeitunahbängig angenommen wurde, kann die Schrödingergleichung einfach formal gelöst werden |ψ(t)i = e−iĤ(t−t0 )/~ |ψ(t0 )i . 148 KAPITEL 5. QUANTENSTATISTIK Für die formale Lösung der von Neumann-Gleichung bedeutet dies X ρ̂(t) = pj |ψj (t)i hψj (t)| j = X pj e−iĤ(t−t0 )/~ |ψj (t0 )i hψj (t0 )| eiĤ(t−t0 )/~ j −iĤ(t−t0 )/~ = e ρ̂(t0 )eiĤ(t−t0 )/~ . Man beachte, daß im Vergleich zur Zeitenwicklung eines Operators im Heisenbergbild andere Vorzeichen in dem Exponentialfaktoren auftreten. Wir kommen nun zur Frage der Entwicklung einer Dichtematrix in eine stationäre. Wie im klassischen Fall ist dieses ein diffiziler Punkt, der Gegenstand aktueller Forschung ist. Wir gehen davon aus (oder erwarten), daß sich die Dichtematrix nach dem Ausführen des thermodynamischen Limes (um Wiederkehreffekte zu verhindern) für hinreichend große Zeiten in eine stationäre Gleichgewichtsverteilung ρ̂eq = lim lim ρ̂(t) t→∞ N →∞ entwickelt. Dieses sollte zumindest dann gelten, wenn nur Erwartungswerte eines Teilsystems (“lokale” Erwartungswerte) berechnet werden. Genauer wollen wir dieses Problem hier nicht diskutieren. Im stationären Fall folgt aus der von Neumann-Gleichung, daß [Ĥ, ρ̂eq ] = 0 , d.h. die stationäre Dichtematrix vertauscht mit dem Hamiltonoperator. Damit haben ρ̂eq und Ĥ eine gemeinsame Basis aus Eigenvektoren |ni Ĥ |ni = En |ni , ρ̂eq |ni = pn |ni und ρ̂eq = X pn |ni hn| n in dieser Basis. In Analogie zum klassischen Fall erwarten wir, daß alle Zustände zu gleicher Energie die gleiche Wahrscheinlichkeit haben, so daß pn = pm für En = Em . Damit gehen wir davon aus, daß ρ̂eq nur eine (operatorwertige) Funktion der Erhaltungsgröße Ĥ sein wird,1 d.h. ρ̂eq = ρeq (Ĥ) . Dies führt uns auf die Ensemble der Quantenstatistik. Bevor wir dazu kommen sei angemerkt, daß wir in diesem Kapitel keine Enschränkung bezüglich der Wechselwirkung zwischen unseren Teilchen getroffen haben (vergleiche mit Kapitel 2.3). 1 Aus den gleichen Gründen wie im klassischen Fall, spielen weitere Erhaltungsgröße meist keine Rolle. 5.2. DIE ENSEMBLES DER QUANTENSTATISTIK 5.2 149 Die Ensembles der Quantenstatistik Bei gegebener Energie, d.h. für ein abgeschlossenes System ist das mikrokanonische Ensemble das relevante. Bei der Diskussion dieses können wir noch direkter Kontakt mit dem Kapitel 2.3 herstellen, als es im klassischen Fall möglich war, dar dieses ja primär auf den Quantenfall ausgerichtet war. Das betrachtete System habe ein Energie zwischen E und E + δE. Der Hamiltonoperator habe Energieeigenwerte En mit den Eigenzuständen |ni. Die Zahl der Zustände im Energieintervall ist wieder Ω(E) = ρ(E)δE mit der Zustandsdichte ρ(E). Das mikrokanonische Ensemble ist durch den (Gleichgewichts) statistischen Operator X ρ̂ = pn |ni hn| n mit pn = 1 Ω(E) 0 E ≤ En ≤ E + δE sonst definiert. Mit δ(E) ≈ 1 δE 0 0 ≤ E ≤ δE sonst folgt pn = 1 δ(E − En ) ρ(E) und ρ̂ = 1 X 1 δ(E − En ) |ni hn| = δ(E − Ĥ) . ρ(E) n ρ(E) Da die Summe über alle pn Eins ergeben muß folgt X ρ(E) = δ(E − En ) = Tr δ(E − Ĥ) . (5.2) n Führen wir wieder die Zahl der Zustände Φ(E) mit Energie kleiner als E ein, so gilt X Θ(E − En ) = Tr Θ(E − Ĥ) . Φ(E) = n In einem nächsten Schritt machen wir uns klar, wie aus diesen Überlegungen die Thermodynamik folgt. Dabei gehen wir völlig analog wie am Anfang von 150 KAPITEL 5. QUANTENSTATISTIK Kapitel 4.2 für den klassischen Fall vor. Es gilt dΦ = = = = = = = ∂Φ ∂Φ dE + · d~a ∂E ∂~ a ∂ ρ(E)dE + Tr Θ(E − Ĥ(~a)) · d~a ∂~a # " ∂ X Θ(E − En (~a)) · d~a ρ(E)dE + ∂~a n X ∂En (a) δ(E − En (~a)) · d~a ρ(E)dE − ∂~ a n " # ∂ Ĥ(~a) ρ(E)dE − Tr δ(E − Ĥ(~a)) · d~a ∂~a " # ∂ Ĥ(~a) ρ(E)dE − ρ(E)Tr ρ̂ · d~a ∂~a + * ∂ Ĥ(~a) · d~a . ρ(E)dE − ρ(E) ∂~a Der zweite Summand ist wie im klassischen Fall proportional zur Arbeit und es folgt völlig analog zu den Schritten auf Seite 130, daß dE = d¯W + T dS , mit S = kB ln Ω ≈ kB ln Φ und T −1 = (∂S/∂E)N,~a . Es ist wichtig festzuhalten, daß der Gleichverteilungssatz der klassischen statistischen Mechanik in der Quantenstatistik im Allgemeinen nicht gilt. Nur im Limes hoher Temperaturen bzw. niedriger Dichten, in der die klassische statistische Mechanik und die Quantenstatistik identisch werden (siehe später), ist der Gleichverteilungssatz anwendbar. Wir werden dieses später genauer untersuchen. Wir betrachten nun wieder ein aus einem uns interessierenden Subsystem und einem Wärmebad zusamenngesetztes Gesamtsystem, wobei kein Teilchenaustausch möglich sein soll. Dies führt auf das kanonische Ensemble. Aus den Vorüberlegungen von Kapitel 2.11 und Kapitel 4.2 ist klar, daß der statistische Operator des Subsystems durch ρ̂ = 1 −β Ĥ e , Z β= 1 , kB T mit der kanonischen Zustandssumme (Normierung!) Z = Tr e−β Ĥ , 5.2. DIE ENSEMBLES DER QUANTENSTATISTIK 151 gegeben ist. Die das Ensemble definierende Wahrscheinlichkeit eines Energieeigenzustandes |ni ist durch (vergleiche Kapitel 2.11) pn = hn| ρ̂ |ni = 1 −βEn e Z gegeben. Mit der Spur ausgeführt in der Basis der Energieeigenzustände (des Subsystems) folgt für die Zustandssumme X Z= e−βEn . n Diese läßt sich auch über die Zustandsdichte (des Subsystems) Gl. (5.2) als Z Z = ρ(E)e−βE dE schreiben. Ist somit das Eigenwertproblem (die zeitunabhängige Schrödingergleichung) Ĥ |ni = En |ni gelöst, so kann Quantenstatistik betrieben werden. Basierend auf diesen Grundüberlegungen können alle weiteren Schritte hin zur Thermodynamik wie im klassischen Fall (Kapitel 4.2) gegangen werden. Völlig analog kann man auch die Aussagen über die Äquivalenz mit dem mikrokanonischen Ensemble im Limes großer N (Fluktuationen!) zeigen. Das thermodynamische Potential des kanonischen Ensembles ist wie gehabt die freie Energie F = F (T,DV, N E ) = −kB T ln Z(T, V, N ). Die Entropie ist durch S = (U − F )/T (mit U = Ĥ ) gegeben. Wir betrachten die Wahrscheinlichkeit pn im Limes kleiner Temperaturen β → ∞. Wir nehmen zunächst an, daß der Grundzustand des Vielteilchensystems nicht entartet ist. In diesem Fall gilt e−βEn lim P −βEm β→∞ me e−β(En −E0 ) = lim P −β(Em −E0 ) β→∞ me = δn,0 , pn = mit der Grundzustandsenergie E0 . Ist der Grundzustand g-fach entartet, so hat im Limes T → 0 jeder der Zustände die gleiche Wahrscheinlichkeit 1/g. Angeregte N -Teilchen Zustände können nur besetzt werden, wenn der Abstand ∆E zum Grundzustand von der Ordnung kB T oder kleiner ist. Man spricht dann von der thermischen Anregung eines (Sub-)Systems durch die Wechselwirkung mit dem Wärmebad. Dieses Kapitel abschließend betrachten wir wieder ein Subsystem im Kontakt mit einem Wärme- und Teilchenreservoir, was auf das großkanonische Ensemble 152 KAPITEL 5. QUANTENSTATISTIK führt. Aus den Überlegungen aus Kapitel 4.2 ist offensichtlich, daß die Dichtematrix des (Sub-)Systems bei fester Teilchzahl N durch ρ̂N = 1 −β(Ĥ−µN ) e , Zgk mit der großkanonischen Zustandssumme Zgk = ∞ X TrN e−β(Ĥ−µN ) = Tr e−β(Ĥ−µN̂ ) , N =0 gegeben ist. Dabei bezeichnet TrN die Spur bezüglich aller Vielteilchenzustände bei festem N und Tr die Summe über alle N -Teilchen Spuren. Der Operator N̂ ist der Teilchenzahloperator (siehe Vorlesung Theoretische Physik III). Der auftretende Hamiltonoperator versteht sich als einer für N Teilchen. Die Wahrscheinlichkeit, daß sich N -Teilchen im Energieeigenzustand |n(N )i befinden ist durch pn (N ) = hn(N )| ρ̂ |n(N )i = 1 −β[En (N )−µN ] e Zgk gegeben, wobei wir den Operator (mit Teilchenzahloperator!) ρ̂ = 1 −β(Ĥ−µN̂ ) e Zgk verwendet haben. Mit der Spur ausgeführt in der Basis der Energieeigenzustände (des Subsystems) folgt für die Zustandssumme Zgk = ∞ X X N =0 e−β[En (N )−µN ] . n Diese läßt sich auch über die Zustandsdichte (des Subsystems) Gl. (5.2) als Zgk = ∞ Z X ρ(E, N )e−β[E−µN ] dE N =0 schreiben. Basierend auf diesen Grundüberlegungen können alle weiteren Schritte hin zur Thermodynamik wie im klassischen Fall (Kapitel 4.2) gegangen werden. Völlig analog kann man auch die Aussagen über die Äquivalenz mit dem mikrokanonischen und dem kanonischen Ensemble im Limes großer N (Fluktuationen!) zeigen. Das thermodynamische Potential des großkanonischen Ensembles ist wie gehabt das großkanonische Potential J = J(T, V, µ) =D−kEB T ln Zgk (T, V, µ). Die Entropie ist durch S = (U − µ hN i − J)/T (mit U = Ĥ ) gegeben. 5.3. FERMI-DIRAC UND BOSE-EINSTEIN VERTEILUNG 153 Wir betrachten nun wieder den Limes kleiner Temperaturen T → 0. In diesem Fall stellt sich der Zustand so ein, daß En (N ) − µN (mit µ fest und n sowie N variabel) minimal wird (Exponentialfaktor!). Für festes N bedeutet dies, daß En (N ) die Grundzustandsenergie E0 (N ) wird. Die Teilchenzahl stellt sich also so ein, daß E0 (N ) − µN minimal (stationär) wird, also E0 (N − 1) − µ(N − 1) ≈ E0 (N ) − µN ≈ E0 (N + 1) − µ(N + 1) . Damit ergibt sich µ(T = 0) ≈ E0 (N + 1) − E0 (N ) ≈ E0 (N ) − E0 (N − 1) . Bei T = 0 ist das chemische Potential also gleich der Änderung der Grundzustandsenergie, wenn man dem System ein Teilchen hinzufügt. 5.3 Fermi-Dirac und Bose-Einstein Verteilung Wir werden nun ideale Quantengase, also freie Teilchen ohne Wechselwirkung, betrachten. Die N Teilchen seien ununterscheidbar und im Volumen V = L3 (einfachheitshalber!) eingeschlossen. Wir gehen von periodischen Randbedingungen aus.2 Der Hamiltonoperator Ĥ für N Teilchen ist eine Summe über Einteilchenhamiltonoperatoren ĥ ĤN = N X h(~xˆi , p~ˆi , ~sˆi ) , i=1 wobei wir verglichen mit unserer vorherigen Überlegungen den Spinoperator ~sˆi des i-ten Teilchens hinzugefügt haben. Das Eigenwertproblem zum Einteilchenhamiltonoperator sei durch ĥ |αi = α |αi gegeben. Dabei bezeichnet α die Einteilchenquantenzahlen. Für freie Teilchen mit Masse m und Spin s gilt ĥ = E E p~ˆ 2 , ĥ ~k, σ = ~k ~k, σ , 2m ~k = ~2~k 2 2m mit n1 E E E 1 ~ 2π ~ n2 , n i ∈ Z k, σ = ~k ⊗ |σi , h~x| ~k = √ eik·~x , ~k = L V n3 2 Im thermodynamischen Limes spielen die Randbedingungen keine Rolle mehr. 154 KAPITEL 5. QUANTENSTATISTIK und ŝ3 |σi = ~σ |σi , σ = −s, −s + 1, . . . , s . Für die Vielteilcheneigenzustände von ĤN können Produktzustände |α1 , α2 , . . . , αN i = |α1 i ⊗ |α1 i ⊗ . . . ⊗ |αN i angesetzt werden. Wegen der Ununterscheidbarkeit3 müssen diese dann je nachdem ob Fermionen oder Bosonen vorliegen noch antisymmetrisiert (Index “-”) oder symmetrisiert (Index “+”) werden (siehe Vorlesung Theoretische Physik III). Es gilt |α1 , α2 , . . . , αN i∓ = N! Q α nα ! 1/2 1 X (∓1)p αP (1) , αP (2) , . . . , αP (N ) , N! P wobei P eine (der N !) Permutation(en) der Zahlen 1, . . . , N ist und p = 0 gilt, wenn P eine gerade Permutation ist4 bzw. p = 1, wenn P eine ungerade Permutation ist. Weiterhin bezeichnet nα die Zahl der αi mit αi = α. Man bezeichnet nα als die Besetzungszahl des Einteilchenzustands mit Quantenzahl α. Für Fermionen kann nα nur die Werte 0 und 1 annehmen (Pauli-Prinzip) und für Bosonen die Werte 0, 1, 2, . . .. Die nα müssen die Nebenbedingung X N= nα (5.3) α erfüllen. Jeder Vielteilcheneigenzustand kann somit durch die Besetzungszahlen nα bezüglich der Einteilchenbasis {|αi} eindeutig charakterisiert werden. Für unser wechselwirkungsfreies Vielteilchenproblem gilt ĤN |α1 , α2 , . . . , αN i∓ = E |α1 , α2 , . . . , αN i∓ mit E= X α α nα , N= X nα . α Die Formulierungen am Anfang dieses Kapitels legen nahe, daß wir am kanonischen Ensemble interessiert sind. Die Nebenbedingung Gl. (5.3) impliziert jedoch, daß sich die zugehörige Zustandssumme nicht einfach berechnen läßt. Daher wählen wir das großkanonische Ensemble um die Zustandssumme und damit die ganze Quantenstatistik (und Thermodynamik) zu berechnen. Wir erinnern 3 Diese impliziert, daß es keinen Sinn macht die Frage zu stellen, in welchem Einteilchenzustand ein bestimmtes Teilchen ist, sondern nur die Frage, mit wievielen Teilchen ein bestimmter Einteilchenzustand besetzt ist. 4 Also aus einer gerade Anzahl von Paarvertauschungen zusammengesetzt ist. 5.3. FERMI-DIRAC UND BOSE-EINSTEIN VERTEILUNG 155 daran, daß im Limes großer N beide Ensemble äquivalent werden. Trotzdem muß man die Verwendung des großkanonischen Ensembles an dieser Stelle als “Trick” auffassen. In dem meisten Situationen von experimentellem Interesse, findet zwar ein Wärmeaustausch mit der Umgebung, jedoch kein Teilchenaustausch statt. Im großkanonischen Ensemble müssen die Besetzungszahlen aufgrund der Summe über alle N nur noch die Bedingung nα = 0, 1 für Fermionen bzw. nα ∈ N0 für Bosonen erfüllen. Es gilt ∞ X Zgk = TrN e−β(Ĥ−µN ) N =0 ∞ X = X e−β ( P α α nα −µ P α nα ) P N =0 {nα }: α nα =N X P −β α (α −µ)nα = e {nα } XY = e−β(α −µ)nα {nα } α YX = α e−β(α −µ)nα . nα Damit läßt sich Zgk als Produkt von einzelnen Zα schreiben Y X Zgk = Zα , Zα = e−β(α −µ)n . α n Für Fermionen folgt Zα = 1 X e−β(α −µ)n = 1 + e−β(α −µ) (5.4) n=0 und für Bosonen Zα = ∞ X e−β(α −µ)n = n=0 1 1− e−β(α −µ) , (5.5) wobei diese Summe nur für α > µ konvergiert. Für Bosonen müssen wir also die Bedingung µ < min α = 0 einführen. Setzen wir den (willkürlichen) Nullpunkt der Einteilchenenergien so fest, daß 0 = 0, so folgt µ<0 156 KAPITEL 5. QUANTENSTATISTIK für Bosonen.5 Für das großkanonische Potential folgt X X J = −kB T ln Zgk = −kB T ln Zα = ∓kB T ln 1 ± e−β(α −µ) , α (5.6) α wobei die oberen Vorzeichen für Fermionen und die unteren für Bosonen zu wählen sind. Aus diesem Ausdruck läßt sich die gesamte Quantenstatistik und Thermodynamik ableiten. Um ein besseres Verständnis der Quantenstatistik zu gewinnen wollen wir nun die Wahrscheinlichkeit Wα (n) berechnen, daß der Einteilchenzustand mit Quantenzahl α mit n Teilchen besetzt ist. Die Wahrscheinlichkeit P{nα } für einen Vielteilchenzustand mit Besetzungszahlen {nα } ist durch P{nα } = 1 −β Pα (α −µ)nα e Zgk gegeben. Damit folgt Wα (n) = X P{nα } {nα }:nα =n = = 1 Zgk X Y e−β(γ −µ)nγ {nα }:nα =n γ 1 −β(α −µ)n Y X −β(γ −µ)nγ e e Zgk γ6=α n γ 1 −β(α −µ)n = e . Zα (5.7) Dies entspricht (wie zu erwarten) der großkanonischen Verteilung für ein System mit nur einem Einteilchenzustand |αi. Der Mittelwert und die Schwankungen der Besetzungszahl des Einteilchenzustandes mit Quantenzahl α können damit gemäß der bekannten Beziehungen hn̂α i = 1 ∂ hn̂α i 1 ∂ 2 ln Zα 1 ∂ ln Zα , (∆nα )2 = = 2 β ∂µ β ∂µ β ∂µ2 berechnet werden. Mit Gln. (5.4) und (5.5) folgt ln Zα = ± ln 1 ± e−β(α −µ) ⇒ hn̂α i = 1 ∂ ln Zα ±e−β(α −µ) 1 =± = −β( −µ) β( −µ) α β ∂µ 1±e e α ±1 und (∆nα )2 = 5 1 ∂ hn̂α i −eβ(α −µ) 2 β(α −µ) =− . 2 = hn̂α i e β( −µ) α β ∂µ (e ± 1) Mit dieser Festlegung messen wir das chemische Potential relativ zu 0 . (5.8) 5.3. FERMI-DIRAC UND BOSE-EINSTEIN VERTEILUNG 157 Mit der wichtigen Beziehung hn̂α i eβ(α −µ) = 1 ∓ hn̂α i (5.9) (∆nα )2 = hn̂α i (1 ∓ hn̂α i) . (5.10) ergibt sich Die Verteilungen Gl. (5.8) bezeichnet man als die Fermi-Dirac bzw. die BoseEinstein Verteilung. Im Limes −µ/(kB T ) 1 gilt unabhängig davon ob Bosonen oder Fermionen vorliegen hn̂α i ≈ e−β(α −µ) . (5.11) Wie wir bald sehen werden, entspricht dieser Limes dem Limes kleiner Dichten bzw. hoher Temperaturen und damit dem klassischen Limes. Entsprechend ist Gl. (5.11) eine klassische Verteilung. Man bezeichnet sie als die Maxwell-Boltzmann Verteilung. Die drei Verteilungen sind in der folgenden Skizze dargestellt. 6 Bose-Einstein Fermi-Dirac Maxwell-Boltzmann <n> 4 2 0 -4 -2 0 2 4 β(ε-µ) Für große β(α − µ) werden die drei Verteilungen identisch. Aufgrund des PauliPrinzips gilt für Fermionen 0 ≤ hn̂α i ≤ 1. Für α → µ divergiert die Bose-Einstein Verteilung. Dies ist ein Hinweis auf die sogenannte Bose-Einstein-Kondensation die wir weiter unten analysieren werden. Mit der mittleren Besetzung hn̂α i läßt sich leicht die mittlere Teilchenzahl D E X X ∂J 1 N̂ = hn̂α i = =− (5.12) β( −µ) α e ±1 ∂µ T,V α α 158 KAPITEL 5. QUANTENSTATISTIK und die mittlere Energie D E X X Ĥ = α hn̂α i = α α α β( −µ) α e ±1 =U angeben. Wir wollen nun zusätzlich den Druck und die Entropie der idealen Quantengase berechnen. Es gilt ∂J J = −P V , S = − . ∂T V,µ Um diese Ausdrücke auszuwerten, drücken wir das großkanonische Potential durch die Besetzungsfunktionen aus. Nach Gl. (5.6) gilt X ln 1 ± e−β(α −µ) J = ∓kB T α = ±kB T X α = ±kB T X = ±kB T X = ±kB T X α ln 1 1± e−β(α −µ) eβ(α −µ) ln β(α −µ) e ±1 ln eβ(α −µ) hn̂α i α ln (1 ∓ hn̂α i) , α wobei wir im letzten Schritt Gl. (5.9) verwendet haben. Für den Druck ergibt sich so sofort X P V = ∓kB T ln (1 ∓ hn̂α i) . α Für die Entropie erhalten wir ∂J S = − ∂T V,µ X X = ∓kB ln (1 ∓ hn̂α i) + kB T α α 1 1 ∓ hn̂α i ∂ hn̂α i ∂T . µ Mit (siehe Gl. (5.9)) ∂ hn̂α i α − µ α − µ 2 β(α −µ) = hn̂α i (1 ∓ hn̂α i) = − hn̂α i e − 2 ∂T kB T kB T 2 µ 5.4. KLASSISCHER LIMES UND VIRIALENTWICKLUNG 159 folgt S = −kB X [± ln (1 ∓ hn̂α i) − β(α − µ) hn̂α i] α X = −kB ± ln (1 ∓ hn̂α i) − ln eβ(α −µ) hn̂α i α X 1 ∓ hn̂α i = −kB ± ln (1 ∓ hn̂α i) − ln hn̂α i hn̂ i α α X = −kB [± ln (1 ∓ hn̂α i) − {ln (1 ∓ hn̂α i) − ln hn̂α i} hn̂α i] α = −kB X [hn̂α i ln hn̂α i ± (1 ∓ hn̂α i) ln (1 ∓ hn̂α i)] . α Im Limes kleiner Besetzungen hn̂α i 1 (für alle α) gilt X ln (1 ∓ hn̂α i) ≈ ∓ X D E hn̂α i = ∓ N̂ , α α ±(1 ∓ hn̂α i) ln (1 ∓ hn̂α i) ≈ ±(1 ∓ hn̂α i)(∓ hn̂α i) ≈ − hn̂α i . Mit diesen Näherungen ergibt sich D E N̂ kB T , X S ≈ −kB hn̂α i (ln hn̂α i − 1) . PV ≈ α Es folgt also die ideale Gasgleichung der klassischen statistischen Mechanik. Auch der Ausdruck für die Entropie ist aus der klassischen statistischen Mechanik bekannt (kinetische Gastheorie, Boltzmanngleichung). Wir wollen diese Einsicht zum Anlaß nehmen den klassischen Limes genauer zu untersuchen. 5.4 Klassischer Limes und Virialentwicklung Wir werden nun den Limes kleiner Dichten bzw. hoher Temperaturen der idealen Quantengase untersuchen. Wie wir später sehen werden, entspricht dieses dem Limes −µ/(kB T ) 1 bzw. dem Limes kleiner Fugazität z = eβµ 1 . 160 KAPITEL 5. QUANTENSTATISTIK Wir werden daher das großkanonische Potential J nach der Fugazität z entwickeln, was man als die Virialentwicklung bezeichnet. Es gilt X J = ∓kB T ln 1 ± ze−βα α ∞ XX (−1)j+1 = ∓kB T α = ± ∞ X j=1 j j=1 (∓1)j j (±1)j e−βα j z j ! X e−βα j zj . α Im Folgenden betrachten wir das bereits oben erwähnte Beispiel des Systems freier (ununterscheidbarere) Teilchen der Masse m und des Spins s im Volumen V = L3 (mit periodischen Randbedingungen). Dann gilt α = (~k, σ), mit ki = 2πni /L, ni ∈ Z, und σ = −s, −s + 1, . . . , s. Die Einteilchenenergien sind α = ~k = ~2~k 2 /(2m). Damit folgt X X 2~ 2 e−βα j = (2s + 1) e−β~ k j/(2m) . α ~k Für große Volumina V → ∞ ergibt sich (Gaußsches Integral) Z X V 2~ 2 −βα j e ≈ (2s + 1) e−β~ k j/(2m) d3 k 3 (2π) α 3/2 2πm = (2s + 1)V . βj(2π)2 ~2 Damit ergibt sich für das großkanonische Potential im Limes großer V ∞ V X (∓1)j j z , J = ±(2s + 1)kB T 3 λT j=1 j 5/2 mit der thermischen Wellenlänge λT Gl. (4.14). Wie bereits oben erwähnt entspricht6 sie der de Broglie Wellenlänge eines Teilchens mit Energie ∼ kB T p~2 (2π~)2 = kB T = 2m 2mλ2 ⇒ λ= √ √ 2π~ = πλT . 2mkB T Die thermische Wellenlänge ist die Längenskala anhand der die Wichtigkeit von Quantenkorrekturen abgeschätzt werden kann. Falls D E1/3 λT V / N̂ ⇒ nλ3T 1 , 6 Man beachte den Faktor π (siehe Kapitel 4.2), der jedoch nichts an der Größenordnung ändert. 5.4. KLASSISCHER LIMES UND VIRIALENTWICKLUNG 161 D E mit der Dichte n = N̂ /V , so kann man erwarten, daß Quantenkorrekturen keine Rolle spielen. In diesem Fall ist λT sehr viel kleiner als der mittlere Teilchenabstand (1/n)1/3 . Um ein lokalisiertes Teilchen der Energie kB T zu beschreiben bilden wir ein Wellenpaket mit Impulsunschärfe ∆p ~λ−1 T . Gemäß der Unschärferelation hat dieses eine räumliche Ausdehnung ∆x ∼ ~/∆p λT . Ist nun der mittlere Teilchenabstand sehr viel größer als λT , so befinden wir uns in dem Limes, in dem die Wellenpakete wenig überlappen und die Konsequenzen der quantenmechanischen Ununterscheidbarkeit spielen keine Rolle. Wir erreichen also den klassischen Limes. Weiter unten werden wir sehen, daß nλ3T 1 äquivalent zu z 1 ist. Mit der Virialentwicklung von J berechnen wir den Druck P und die Dichte n. Es gilt ∞ kB T X (∓1)j j J z . P = − = ∓(2s + 1) 3 V λT j=1 j 5/2 Mit D E N̂ n= V 1 =− V ∂J ∂µ T,V 1 =− V ∂J ∂z T,V ∂z ∂µ T βz =− V ∂J ∂z T,V folgt ∞ 1 X (∓1)j j n = ∓(2s + 1) 3 z . λT j=1 j 3/2 In führender Ordnung in z ergibt sich so P = (2s + 1) ⇒ P = nkB T , kB T z, λ3T n = (2s + 1) µ = kB T ln 1 z, λ3T nλ3T . 2s + 1 Die erste Gleichung ist die Zustandsgleichung des klassischen idealen Gases und der Ausdruck für das chemische Potential entspricht ebenfalls dem klassischen Analogon Gl. (4.17), wenn man s = 0 setzt – was dem auf Seite 142 klassisch diskutieren Fall spinloser Teilchen entspricht. Die zweite Beziehung in der ersten Zeile der obigen Gleichung zeigt zusätzlich, daß nλ3T 1 in der Tat äquivalent zu z 1, d.h. −µ/(kB T ) 1, ist. Damit ist klar, daß sich die klassische Physik für 3 2π~ 3 nλT = n √ 1, 2πmkB T 162 KAPITEL 5. QUANTENSTATISTIK d.h. im Limes hoher Temperaturen bzw. kleiner Dichten ergibt. Um die führende Ordnung von Quantenkorrekturen zu diskutieren, gehen wir eine Ordnung in z weiter. Dann gilt 1 kB T (5.13) P = (2s + 1) 3 z 1 ∓ 5/2 z , λT 2 1 1 n = (2s + 1) 3 z 1 ∓ 3/2 z . (5.14) λT 2 Mit dem Ansatz (motiviert durch die erste Ordnung) nλ3T nλ3T 3 2 z= 1+γ + O [nλT ] 2s + 1 2s + 1 eingesetzt in Gl. (5.14) folgt nλ3T 1 nλ3T 1 = 1+γ 1 ∓ 3/2 + O [nλ3T ]2 2s + 1 2 2s + 1 3 1 nλT = 1 + γ ∓ 3/2 + O [nλ3T ]2 2 2s + 1 und damit γ = ±1/23/2 . Es gilt also 1 nλ3T nλ3T βµ 1 ± 3/2 + O [nλ3T ]3 . z=e = 2s + 1 2 2s + 1 (5.15) Eingesetzt in Gl. (5.13) folgt für den Druck 1 nλ3T 1 nλ3T 3 2 1 ∓ 5/2 + O [nλT ] P = nkB T 1 ± 3/2 2 2s + 1 2 2s + 1 1 nλ3T 3 2 = nkB T 1 ± 5/2 + O [nλT ] . 2 2s + 1 Man sieht also, daß sich verglichen mit dem klassischen Ergebnis der Druck für Fermionen erhöht und für Bosonen erniedrigt. Um dieses Ergebnis interpretieren zu können vergleichen wir mit der Zustandsgleichung des van-der-Waals Gas Gl. (3.6). Mit n = 1/v und nach Entwickeln nach n ergibt sich diese zu a P = nkB T 1 + n b − + O(n3 ) . kB T Dabei war b > 0 ein Maß für die abstoßenden Wechselwirkung zwischen den Teilchen und a > 0 eines für die anziehende Komponente dieser. Den Ausdruck für den Druck im Quantengas kann man also so interpretieren, daß die Antisymmetrisierung für Fermionen (also das Pauli-Prinzip) zu einer effektiven Abstoßung 5.4. KLASSISCHER LIMES UND VIRIALENTWICKLUNG 163 und die Symmetrisierung für Bosonen zu einer effektiven Anziehung der Teilchen führt. Abschließend wollen wir noch die innere Energie (exakt – also ohne Entwicklung) berechnen. Es gilt (siehe Seite 139) D E ∂ ∂ ln Z̃gk (β, V, α) = βJ(β, V, z) Ĥ = − ∂β ∂β ∞ ∂ 1 X (∓1)j j = ±(2s + 1)V z ∂β λ3T j=1 j 5/2 U = ∞ −3kB T /2 X (∓1)j j z = ±(2s + 1)V λ3T j 5/2 j=1 3 = − J. 2 Somit folgt 3 3 U = − J = PV 2 2 ⇒ P = 2 nu , 3 u= U . N (5.16) Setzen wir jetzt die Entwicklung für den Druck bis zur zweiten Ordnung ein, so ergibt sich 3P 3 1 nλ3T 3 2 u= = kB T 1 ± 5/2 + O [nλT ] . 2 n 2 2 2s + 1 (5.17) Damit wird verglichen mit dem Ergebnis für das klassische ideale Gas die inneren Energie (pro Teilchen) für Fermionen erhöht und für Bosonen erniedrigt. Dies ist konsistent mit der obigen Interpretation einer effektiv abstoßenden bzw. anziehenden Wechselwirkung. Die einfache Beziehung P = 2nu/3 zwischen dem Druck und der inneren Energie läßt sich auf andere (als quadratische) Dispersionsrelationen und andere (als drei) Dimensionen verallgemeinern. Wir zeigen folgend, daß für ~k ∼ |~k|κ für das d-dimensionale ideale Quantengas P = κ nu d 164 KAPITEL 5. QUANTENSTATISTIK gilt. Dies sehen wir für große V → ∞ wie folgt (hn̂α i = n(k )) J = ±kB T (2s + 1) X ln [1 ∓ n(k )] ~k L 2π d Z L 2π d ≈ ±kB T (2s + 1) = ±kB T (2s + 1) = = = ≈ = = Z od ∞ k d−1 ln [1 ∓ n(k )] dk 0 d Z ∞ ∞ L d 1 d−1 d ±kB T (2s + 1) k k ln [1 ∓ n(k )] dk od k ln [1 ∓ n(k )] 0 − 2π d dk 0 d Z ∞ 1 ∂k n0 (k ) L od k d−1 k dk kB T (2s + 1) 2π d 0 ∂k 1 ∓ n(k ) d Z L 1 ∞ d−1 −kB T (2s + 1) k κk βn(k )dk od 2π d 0 d Z ∞ κ L od k d−1 k n(k )dk − (2s + 1) d 2π 0 κX − k n(k ) d ~k,σ D E κ − Ĥ d κ − U. d = ln [1 ∓ n(k )] dd k Dabei bezeichnet od die von den Winkelintegrationen stammende Konstante. Wegen J = −P V folgt daraus die Behauptung. Die verallgemeinerte Beziehung werden wir später nutzen um den sogenannten Strahlungsdruck elektromagnetischer Wellen (Photonen) zu berechnen. Nachdem wir erfolgreich Kontakt mit der klassischen statistischen Mechanik (Thermodynamik) eines idealen Gases gemacht haben, wollen wir nun den entgegengesetzten Limes betrachten und ein (extremes) Quantenphänomen – die Bose-Einstein Kondensation – untersuchen. 5.5 Die Bose-Einstein Kondensation Wir wollen uns für Bosonen (also das ideale Bosegas) aus dem klassischen Limes kommend (d.h. von hohen Temperaturen) dem Bereich nähern, in dem Quanteneffekte dominieren. Zur Vereinfachung wollen wir uns hier auf den Fall s = 0 beschränken. In der folgenden Skizze ist die aus Gl. (5.15) folgende Temperatu- 5.5. DIE BOSE-EINSTEIN KONDENSATION 165 rabhängigkeit des chemischen Potenials des idealen Gases bei fester Dichte µ 3 T T0 1 ≈ ln − 3/2 kB T0 2 T0 T 2 T0 T 1/2 , die die erste Korrektur zum klassischen Ergebnis enthält, mit ebend diesem (erster Summand in obiger Gleichung) verglichen. Wir haben dabei die charakteristische Temperatur T0 gemäß T0 T 3/2 = nλ3T eingeführt. µ/(kBT0) 0 ? -2 -4 -6 -8 0 klassisch erste qm Korrektur 1 2 3 T/T0 4 Die Korrektur ist negativ, so daß sich für T /T0 → ∞ die quantenmechanische Kurve der klassische von unten annähert. Wie wir bereits festgestellt haben, muß für Bosonen µ < 0 gelten und es stellt sich die Frage, der T -Abhängigkeit von µ bei kleinen T (Bereich des Fragezeichens in der Skizze). Analog ist in der folgenden Skizze der aus Gl. (5.17) folgende Ausdruck für die spezifische Wärme (pro Teilchen) cV = du/dT mit der ersten quantemechanischen Korrektur cV 3 3 1 = + kB 2 4 25/2 T0 T 3/2 mit dem klassischen Ergebnis cV /kB = 3/2 verglichen. 166 KAPITEL 5. QUANTENSTATISTIK cV/kB 2 ? 1.5 klassisch erste qm Korrektur 0 1 2 T/T0 3 4 In diesem Fall ist die Korrektur positiv. Wir werden beide Skizzen später vervollständigen. Um uns dem Bereich kleiner T zu nähern, betrachten wir den Ausdruck für die mittlere Teilchenzahl Gl. (5.12) D E X 1 N̂ = . β −1 e ~k − 1 z ~ k Mit der Einteilchenzustandsdichte (für große V ) X δ( − k ) g() = ~k Z ∞ V m ≈ 4π k 2 2 δ(k − k()) , 3 (2π) ~k 0 3/2 √ Vm = √ 2π 2 ~3 | {z } k() = √ 2m/~ =c folgt √ d . (5.18) −1 β z e −1 0 D E Damit dieses Integral den fest vorgegebenen Wert N̂ (für feste Dichte!) bei abnehmenden T erreichen kann, muß µ anwachsen. DaDaber E µ < 0 gelten muß, gibt es eine Temperatur Tc , wobei für T < Tc der Wert N̂ nicht mehr erreicht Z D E N̂ = c ∞ 5.5. DIE BOSE-EINSTEIN KONDENSATION 167 wird. Aus dieser Forderung läßt sich Tc berechnen. Bei Tc gilt µ = 0 also z = 1, so daß √ Z ∞ D E V m3/2 d N̂ = √ /(k T )−1 c 2 3 B 2π ~ 0 e Z ∞ 1/2 V m3/2 x 3/2 = √ dx (kB Tc ) x e −1 2π 2 ~3 0 V m3/2 √ = (kB Tc )3/2 Γ(3/2)ζ(3/2) , 2 3 2π ~ √ mit der Riemannschen Zeta-Funktion ζ(x). Es gilt Γ(3/2) = π/2 und ζ(3/2) = 2.612 . . .. Daraus folgt kB Tc ≈ 3.313 ~2 n2/3 . m Bei dieser Überlegung ist es wichtig, daß das Integral auf der rechten Seite von Gl. (5.18) an der unteren Grenze nicht divergiert. Dieses ist in zwei bzw. einer Raumdimension mit Einteilchenzustandsdichten g() ∼ 0 bzw. g() ∼ −1/2 (siehe unten) nicht der Fall, so daß in d = 1, 2 die mittlere Teilchenzahl mit einem kleinen −µ > 0 bei allen T > 0 konstant gehalten werden kann. Somit gibt es in d = 1, 2 kein Tc > 0 im obigen Sinne. Mit Gl. (5.16) erhalten wir analog Z ∞ √ V m3/2 2D E 2 PV = −√ Ĥ = U . ln 1 − ze−β d , P V = kB T 3 3 2π 2 ~3 0 D E Das N̂ nicht mehr konstant gehalten werden kann, deutet auf ein Problem bei der bisherigen Analyse hin. Durch den Übergang zur Zustandsdichte und dem Integral über hat der Grundzustand mit = 0 das statistische Gewicht Null bekommen. Das stellt ein Problem dar, da bei T = 0 alle (wechselwirkungsfreien) Bosonen sich in gerade diesem Einteilchzustand befinden sollten. Wir modifizieren daher unser obiges Vorgehen und behandeln den Einteilchenzustand mit = 0 getrennt (bevor wir die Zustandsdichte und ein Integral einführen). Dies führt auf D E √ Z ∞ N̂ m3/2 1 z = √ d + , V V 1−z 2π 2 ~3 0 z −1 eβ − 1 Z ∞ 1 √ P m3/2 ln 1 − ze−β − ln(1 − z) . = −√ kB T V 2π 2 ~3 0 Im (klassischen) Limes nλ3T 1 gilt z 1 und damit ln(1 − z)/V 1 sowie z/[V (1 − z)] 1. Die abgetrennten Terme können also vernachlässigt werden (wie zu erwarten war). Im “Quantenlimes” nλ3T ≈ 1 gilt dagegen 1 z N0 = = O(1) , V 1−z V 168 KAPITEL 5. QUANTENSTATISTIK mit der Zahl der Bosonen N0 im Einteilchengrundzustand. Für T → 0 wird der Einteilchenzustand mit = 0 makroskopisch besetzt. Wie wir jetzt zeigen werden, können wir für die weiteren Rechnungen den abgespaltenen Term zum Ausdruck für den Druck trotzdem vernachlässigen. Es gilt ⇒ N0 z = N0 ⇒ z = , 1−z N0 + 1 1 1 N0 1 1 − ln(1 − z) = − ln 1 − = ln (1 + N0 ) = O ln V . V V N0 + 1 V V Für große V geht dieser Term gegen Null und kann daher gegenüber dem Integral vernachlässigt werden. Wir betrachten daher folgend Z ∞ √ m3/2 P 3/2 √ (kB T ) x ln 1 − ze−x dx = − kB T 2π 2 ~3 0 Z ∞ 3/2 1 4 x √ dx = 3 −1 λT 3 π 0 z ex − 1 1 = F5/2 (z) , λ3T mit 1 Fn (z) = Γ(n) Z 0 ∞ xn−1 dx . z −1 ex − 1 Von der ersten zur zweiten Zeile haben wir eine partielle Integration ausgeführt. Für die innere Energie (wichtig für die spezifische Wärme; siehe oben) ergibt sich 3 1 U = kB T V 3 F5/2 (z) . 2 λT Für die Teilchezahl in angeregten Einteilchenzuständen ergibt sich D E N̂ − N0 1 = 3 F3/2 (z) . V λT Für z 1 kann man diese Ausdrücke auswerten und erhält die uns schon bekannten Ergebnisse für den klassischen Limes und die führenden Quantenkorekturen. Wir werten den Ausdruck für die Teilchenzahl für T ≤ Tc aus. Es ist dabei “natürlich” anzunehmen, dass soviele Teilchen wie möglich in angeregten Einteilchenzuständen sind, wobei µ praktisch Null ist. Damit folgt D E N̂ − N0 1 1 = 3 F3/2 (1) = 3 ζ(3/2) V λT λT " 3/2 # D E D E 1 mk 3/2 D E T B ⇒ N0 = N̂ − N̂ . ζ(3/2)T 3/2 = N̂ 1 − 2 n 2π~ Tc 5.5. DIE BOSE-EINSTEIN KONDENSATION 169 Es bestätigt sich also, daß der Einteilchengrundzustand für T < Tc makroskopisch besetzt ist. Für z folgt aus diesem Ergebnis z= N0 1 1 = =1− + O(N0−2 ) , 1 + N0 1 + 1/N0 N0 also im thermodynamischen Limes z = 1 für T ≤ Tc , d.h. konsistenterweise µ = 0. Damit können wir die Skizze der Temperaturabhängigkeit des chemischen Potentials vervollständigen. µ/(kBTc) 0 -2 -4 -6 -8 0 1 2 3 4 T/Tc Nachfolgend ist die Besetzung des Einteilchengrundzustands als Funktion der Temperatur skizziert (im thermodynamischen Limes). 170 KAPITEL 5. QUANTENSTATISTIK Für den Druck folgt bei T ≤ Tc P 1 = 3 ζ(5/2) kB T λT ⇒ P ∼ T 5/2 , mit einer Proportionalitätskonstanten die Unabhängig von der Dichte (dem Volumen) ist. Man spricht daher von einer Kondensation. Für D Efestes T (Isotherme) ergibt sich die Kondensation beim kritischen Volumen ( N̂ fest) V λ3T D cE = ∼ T −3/2 . ζ(3/2) N̂ Dieses Verhalten is folgend skizziert. 5.5. DIE BOSE-EINSTEIN KONDENSATION P 171 T2 T2 > T1 T1 Vc,2 Vc,1 V Wir untersuchen jetzt die spezifische Wärme für T ≤ Tc . Es gilt 3 3 1 ∂ T 15 1 1 cv 1 ∂P V = D E = ζ(5/2) = ζ(5/2) 3 ∼ T 3/2 . 3 kB 2 N̂ k ∂T 2n ∂T λT 4 n λT B Bei T = Tc gilt cv 15 Vc 1 15 λ3Tc ζ(5/2) 15 ζ(5/2) 3 D E ζ(5/2) 3 = = = = 1.925 . . . > . 3 kB 4 N̂ λTc 4 ζ(3/2) λTc 4 ζ(3/2) 2 Damit können wir die Skizze für cV teilweise vervollständigen. 2 ? 3/2 ~T -3/2 ~T cV/kB 1.5 1 0.5 0 0 1 2 3 4 T/Tc Aus Zeitgründen wollen wir hier darauf verzichten, die durch das Fragezeichen indizierte “Lücke” in der Temperaturabhängigkeit der spezifischen Wärme durch 172 KAPITEL 5. QUANTENSTATISTIK eine analytische Rechnung zu schließen. Im L2 P finden sie einige handschriftliche Notizen in der die entsprechende Diskussion (teilweise) geführt wird. Wie dort gezeigt, ist cV bei T = Tc stetig, aber die erste Ableitung macht einen Sprung. Bei Tc entsteht eine “Spitze”. Man kann die Bose-Einstein Kondensation eines wechselwirkungsfreien (!!) Bosegases (in vielerlei Hinsicht) als Phasenübergang D E betrachten. Dabei ist die Besetzung des Einteilchengrundzustands N0 / N̂ der Ordnungsparamter. Für D E T > Tc verschwindet N0 / N̂ im thermodynamischen Limes, während diese Größe für T < Tc einen endlichen Wert annimmt. Sie korrespondiert zu der Magnetisierung in dem magnetischen Phasenübergang, den sie in einer Übungsaufgabe untersucht haben. Die makroskopische Besetzung des Einteilchengrundzustandes verschwindet in der Nähe von Tc wie (Tc − T )/Tc , so daß der kritische Exponent des Ordnungsparameters β = 1 ist. Da die spezifische Wärme am Übergang stetig ist, handelt es sich um einen kontinuierlichen Phasenübergang (auch Phasenübergang 2. Ordnung). Der Phasenübergang zeigt sich in einer Nichtanalytizität der spezifische Wärme als Funktion von T (hier als Sprung der ersten Ableitung von cV nach T ). Dieses Verhalten kann man zu dem an einem Phasenübergang 1. Ordnung (mit latenter Wärme) kontrastieren, wie es uns exemplarisch im Phasendiagramm von Wasser begegnet ist. Es ist wichtig festzuhalten, daß Nichtanalytizitäten und damit Phasenübergänge nur nach Ausführen des thermodynamischen Limes auftreten können. Die Bose-Einstein Kondensation wurde bereits 1925 durch Einstein vorhergesagt. Der experimentelle Nachweis gelang jedoch erst 1995 an verdünnten Gasen von Alkaliatomen. Dafür erhielten Cornell, Wieman und Ketterle 2001 den Nobelpreis. Die Kondensation wäre jedoch ohne die Vorarbeiten zur sogenannten Laserkühlung von Chu, Cohen-Tannoudji und Philips unmöglich gewesen, die daher zuvor, nämlich 1997, den Nobelpreis erhalten hatten. Auch der Nobelpreis an Hänsch im Jahre 2005 ist im Zusammenhang mit Experimenten an kalten Atomgasen zu sehen. 5.6 Das entartete Fermigas Wir betrachten nun ein Gas von Fermionen (mit halbzahligem Spin s) im Quantenlimes kB T µ (also Fugazität z 1), d.h. bei hoher Dichte bzw. tiefer Temperatur. Im Vergleich zu Bosonen kann µ hier positiv sein. Die Fermi-Dirac Verteilung hn̂α i = 1 eβ(α −µ) + 1 hat dann die skizzierte Form. → 1 für α < µ , |α − µ| kB T 0 für α > µ , |α − µ| kB T 5.6. DAS ENTARTETE FERMIGAS 173 ~kBT 1 <n> 0.8 0.6 0.4 0.2 0 0 1 2 3 εα/µ Für T = 0 erhält man eine Stufenfunktion hn̂α i|T =0 = Θ(µ(T = 0, n) − α ) , d.h. alle Einteilchenniveaus bis zur sogenanten Fermienergie F (n) = µ(T = 0, n) sind einfach besetzt (α < F ), alle anderen unbesetzt. Man bezeichnet diese Situation als das entartete Fermigas. Zum Vergleich betrachten wir den klassischen Grenzfall mit z 1, also −µ/(kB T ) 1. Da (nach Konvention; siehe oben) alle α ≥ 0 sind in diesem Limes alle Einteilchenniveaus nur exponentiell klein besetzt hn̂α i|klassisch ∼ e−β(α −µ) 1 . Eine der Bedeutungen des entarteten Fermigases liegt darin begründet, daß für Elektronen in (normalen) Metallen die Bedingung kB T µ bei Zimmertemperatur sehr gut erfüllt ist F ≈ 10eV ≈ kB 105 K kB 300K . Dabei spielt es (erstaunlicherweise) keine entscheidenen Rolle, daß die Elektronen in Metallen aufgrund der relativ hohen Dichte eine große Elektron-ElektronWechselwirkung haben. Im Rahmen der sogenannten Fermiflüssigkeitstheorie kann man zeigen, daß die Elektronen in normalen Metallen effektiv durch ein wechselwirkungsfreies entartetes Fermigas beschreibbar sind. Genauer untersucht man diese Frage in einer Vorlesung zur Festkörperphysik bzw. quantenmechanischen Vielteilchentheorie. 174 KAPITEL 5. QUANTENSTATISTIK Wir betrachten nun wieder das Beispiel freier Teilchen der Masse m, mit Spin s und quadratischer Einteilchendispersion. Die Dichteabhängigkeit der Fermienergie kann nun leicht berechnet werden. Wegen ~k = ~2~k 2 , 2m sind bei T = 0 alle ~k-Zustände mit k = |~k| < kF besetzt, wobei jeder Einteilchen~k-zustand (2s + 1)-fach entartet ist. Der Fermiwellenvektor kF ist durch F = ~2 kF2 /(2m) definiert. ~kF = pF bezeichnet den Fermiimpuls und vF = pF /m die Fermigeschwindigkeit. Da jeder ~k-Vektor ein Volumen (2π/L)d einnimmt und (2s + 1)-fach besetzt ist, folgt D E N̂ Volumen der Fermikugel = Zahl der ~k-Vektoren in der Fermikugel = . 2s + 1 (2π/L)d D E d Mit V = L und n = N̂ /V ergibt sich D E N̂ d=3: d=2: d=1: 2 1/3 4πkF3 /3 V kF3 6π n = = ⇒ k = , F 2s + 1 (2π/L)3 6π 2 2s + 1 D E 1/2 N̂ πkF2 V kF2 4πn , = = ⇒ kF = 2s + 1 (2π/L)2 4π 2s + 1 D E N̂ 2kF V kF πn = = ⇒ kF = 2s + 1 2π/L π 2s + 1 und damit (6π 2 )2/3 für d = 3 ~ n F = = × 4π für d = 2 . 2m 2m 2s + 1 π2 für d = 1 P Weiter unten werden wir häufig Summen der Form ~k f (~k ) im Limes L → ∞ berechnen. Daher führen wir wieder die Einteilchenzustandsdichte (siehe Seite 166) ein, wobei wir diesmal jedoch mit dem Faktor V anders verfahren. Es soll gelten Z ∞ X f (~k ) → V D()f () d , ~2 kF2 2 ~k 2/d 0 mit der Zustandsdichte D() “pro Spin und Volumen”. Der Term V D()d gibt die Zahl der Einteilchenniveaus mit Energie zwischen und + d und festem 5.6. DAS ENTARTETE FERMIGAS 175 Spin. Da diese Niveaus für unser Beispiel in einer d-dimensionalen Kugelschale liegen ergibt sich Volumen der Kugelschale im ~k-Raum (2π/L)d d 4πk 2 dk für d = 3 L 2πkdk für d = 2 . = × 2π 2dk für d = 1 V D()d = Aus ~k = ~2 k 2 /(2m) folgt d = ~2 kdk/m und damit 1 d/2 π für d = 3 1 2m d/2−1 1 für d = 2 . D() = × 4π ~2 2 für d = 1 Die -Abhängigkeit dieses Ergebnisses haben wir schon verwendet um zu begründen, daß es im Bosegas nur für d = 3 ein endliches Tc gibt. Zusammen mit dem Resultat für F ergibt sich das nützliche Ergebnis F D(F ) = dn . 2(2s + 1) Nach diesen Vorarbeiten wollen wir das großkanonische Potential berechnen. Für große V schreiben wir Z ∞ J = −kB T (2s + 1)V D() ln 1 + e−β(−µ) . 0 Dieses Integral berechnet man nun, in dem man ausnutzt, daß die Ableitung von ln 1 + e−β(−µ) nach die Fermifunktion liefert d −βe−β(−µ) ln 1 + e−β(−µ) = = −βn() , d 1 + e−β(−µ) mit der auf Seite 164 eingeführten Bezeichnung für die Verteilungsfunktion. Die zweite Ableitung liefert die erste Ableitung der Fermifunktion. Bei kleinen Temperaturen ist diese sehr scharf um µ zentriert d2 −β(−µ) ln 1 + e = −βn0 () . 2 d Man versucht daher im Ausdruck für das großkanonische Potential durch zweifaches partielles Integrieren n0 () zu erhalten und entwickelt anschließend alle Funktionen im Integranden, die mit n0 () multipliziert werden und im Energiebereich ≈ µ langsam verglichen mit n0 () variieren, in eine Taylorreihe um = µ. 176 KAPITEL 5. QUANTENSTATISTIK Man bezeichnet dieses Vorgehen als die Sommerfeldentwicklung. Um dieses Vorgehen auszuführen bertachten wir d d2 D() = a() = 2 b() d d mit 2 a() = D() , d b() = 4 2 D() . d(d + 2) Damit ergibt sich J = −kB T (2s + 1)V 2 = 0 − (2s + 1)V d 2 = − U = −P V , d Z ∞ a() ln 1 + e−β(−µ) 0 + β Z ∞ a()n()d 0 ∞ D() n() d 0 wobei wir die letzte Zeile bereits auf Seite 164 gezeigt haben. Die zweite partielle Integration liefert Z ∞ J = −(2s + 1)V a() n() d 0 Z ∞ ∞ 0 = −(2s + 1)V b()n()|0 − b()n ()d 0 Z ∞ = (2s + 1)V b()n0 ()d . (5.19) 0 Wir entwickeln dann b() in einer Taylorreihe um = µ ∞ X 1 dl b b() = (µ)( − µ)l . l l! d l=0 Da n0 () nur in der Nähe von µ nicht verschwindent klein ist machen wir nur einen Fehler der Ordnung e−µ/(kB T ) , was im uns interessierenden Limes µ kB T exponentiell klein ist, wenn wir das Integral in Gl. (5.19) bis nach −∞ Rausdehnen. R∞ ∞ Weiterhin ist n0 () eine gerade Funktion, so daß nach der Ersetzung 0 → −∞ nur noch gerade Potenzen von l beitragen. Es gilt ( ) Z ∞ Z ∞ ∞ X d2l b 1 0 2l 0 J ≈ (2s + 1)V b(µ) n () d + (µ) ( − µ) n () d . d2l (2l)! −∞ −∞ l=1 Mit Z ∞ b(µ) −∞ n0 () d = 4 4 µ2 D(µ) [n(∞) − n(−∞)] = − µ2 D(µ) d(d + 2) d(d + 2) 5.6. DAS ENTARTETE FERMIGAS 177 und 1 (2l)! Z ∞ 2l 0 ( − µ) n ()) d = −∞ = = = Z ∞ 1 d 1 (kB T ) x2l dx x (2l)! −∞ dx e + 1 Z ∞ d 1 2l 2 (kB T ) x2l dx x (2l)! 0 dx e + 1 2l ∞ Z ∞ 2l−1 x x 2l 2 − 2l dx (kB T ) (2l)! ex + 1 0 ex + 1 0 1 2l −(kB T ) 2 1 − 2l−1 ζ(2l) 2 2l ergibt sich für das großkanonische Potential ( J ≈ −(2s + 1)V ) ∞ 2l−2 X 1 d D 4 µ2 D(µ) + 2 1 − 2l−1 ζ(2l) 2l−2 (µ)(kB T )2l . d(d + 2) 2 d l=1 Bis zur Ordnung (kB T )2 gilt ( J ≈ −(2s + 1)V µ2 D(µ) 4 π2 + d(d + 2) 6 kB T µ 2 ) . Ausgehend von J wollen wir jetzt n(µ, T ) bzw. durch Umkehren µ(n, T ) berechnen. Es gilt (bis zur zweiten Ordnung in kB T ) ∂J ∂µ T,V 4 ∂ 2 π2 2 0 ≈ (2s + 1) [µ D(µ)] + (kB T ) D (µ) d(d + 2) ∂µ 6 4 d π2 2 d − 2 D(µ) = (2s + 1) + 1 D(µ)µ + (kB T ) d(d + 2) 2 6 2 µ ( ) 2 2 π 2 kB T . = (2s + 1)D(µ)µ + (d − 2) d 12 µ 1 n = − V Um diese Relation nach µ(n, T ) bzw. µ(F , T ) aufzulösen verwenden wir D() = γd d/2 2 n = (2s + 1) F D(F ) . d 178 KAPITEL 5. QUANTENSTATISTIK Dies gibt ⇒ ⇒ ( 2 ) 2 d π 2 kB T 2 F D(F ) ≈ D(µ)µ 1 + (d − 2) d d 2 12 µ ( 2 ) 2 d 2 π 2 kB T d/2 d/2 1 + (d − 2) γd F ≈ γd µ d d 2 12 µ )−2/d ( 2 π 2 kB T d + O [kB T /µ]4 µ = F 1 + (d − 2) . 2 12 µ Durch Iterieren ergibt sich ( µ = F π2 d 1 + (d − 2) 2 12 kB T F 2 + O [kB T /F ] )−2/d 4 und durch Entwickeln bis zur Ordnung (kB T )2 folgt ( 2 ) π 2 kB T . µ(F , T ) ≈ F 1 − (d − 2) 12 F (5.20) Primär sind wir natürlich am Fall d = 3 interessiert. Es ist aber interessant festzustellen, daß (aufgrund der -Unabhängigkeit von D()) µ in zwei Raumdimensionen für kleinen T keine Korrekturen zweiter Ordnung in T aufweist. Geht man bis zu höheren Ordnungen, so kann man zeigen, daß µ in zwei Raumdimensionen keine potenzgesetzartige T -Abhängigkeit hat. Das Verhalten von µ(F , T ) in drei Raumdimensionen ist für feste Dichte (feste F ) in der folgenden Skizze dargestellt. µ/ε F 1 ~T 2 1 k BT/ ε F klassisch Dieses Kapitel abschließend berechnen wir noch die innere Energie, die spezifische Wärme und den Druck des entarteten Fermigases. Aus den obigen Rech- 5.6. DAS ENTARTETE FERMIGAS 179 nungen erhalten wir (siehe Seite 175) d d U = − J ≈ (2s + 1)V µ2 D(µ) 2 2 ( 2 4 π + d(d + 2) 6 kB T µ 2 ) . Mit Gl. (5.20) können wir U als Funktion von F und T schreiben. Dazu betrachten wir V D(µ)µ2 = V γd µd/2+1 2 #d/2+1 2 π k T B d/2+1 V γd F 1 − (d − 2) 12 F " 2 # 2 π d k T B + 1 (d − 2) V D(F )2F 1 − 2 12 F " # 2 d2 − 4 π 2 kB T dn F 1 − V 2(2s + 1) 2 12 F " 2 # D E 2 π d k T B N̂ F 1 − (d2 − 4) . 2(2s + 1) 24 F " ≈ ≈ = = Damit ergibt sich für die innere Energie " 2 # " 2 # D E d2 d2 − 4 π 2 kB T π 2 kB T 4 U ≈ N̂ F 1 − + 4 4 6 F d(d + 2) 6 F " 2 2 # D E d2 d2 − 4 4 4 π kB T F + 1− ≈ N̂ 4 d(d + 2) 4 d(d + 2) 6 F " # 2 D E d2 2 π 2 kB T 4 F + = N̂ . 4 d(d + 2) d 6 F Damit folgt dann für kB T /F 1 (d.h. im Quantenlimes) " 2 # U d π 2 kB T u = D E ≈ F +d , d + 2 12 F N̂ ∂u ∂u π 2 kB T cV = = ≈ d kB , ∂T n ∂T F 6 F " 2 # J 2 2 π 2 kB T P v = − D E = u ≈ F + . d d + 2 6 F N̂ Verglichen mit den klassischen Ergebnissen d u = kB T , 2 d cv = kB , 2 P v = kB T 180 KAPITEL 5. QUANTENSTATISTIK muß man die Ersetzung T ↔ TF mit kB TF = F machen. Die Rolle der Temperatur spielt somit im entarteten Fermigas (kleine kB T /F ) die Fermitemperatur TF . Im Gegensatz zum klassischen idealen Gas geht der Druck des Fermigases für kleine T nicht gegen Null. Man bezeichnet den T = 0 Wert des Drucks als den aus dem Pauliprinzip resultierenden Fermidruck. Die spezifische Wärme im entarteten Fermigas ist einen Faktor T /TF kleiner als im klassischen Limes, da aufgrund des Pauliprinzips nur Elektronen in der Nähe von F angeregt werden können. Die Temperaturabhängigkeit von cV für d = 3 ist folgend skizziert. cV/k B 3/2 ~T 1 k BT/ εF In “normalen” Metallen ist der elektronische Beitrag zur spezifischen Wärme bei Raumtemperatur und niedrigeren Temperaturen proportional zu T . Verglichen mit dem obigen Ergebnis für wechselwirkungsfreie Elektronen ist jedoch der Vorfaktor durch die Coulombwechselwirkung modifiziert. Einen weiteren Beitrag zur spezifischen Wärme eines kristallinen Festkörpers liefern die Gitterschwingungen. Unteranderem diesen werden wir im nächsten Kapitel untersuchen. 5.7 Photonen und Phononen Wir betrachten in diesem Kapitel die “quantisierte” Hohlraumstrahlung (elektromagnetische Strahlung; Photonen) und “quantisierte” Gitterschwingungen im Festkörper (Phononen). Beide Systeme können (in erster Näherung) als unabhängige harmonische Oszillatoren beschrieben werden. Daher behandeln wir zunächst den harmonischen Oszillator. Diesem sind sie bereits in einer Übungsaufgabe begegnet. Wir betrachten einen einzelnen harmonischen Oszillator welcher sich im Kontakt mit einem Wärmebad befindet. Der Hamiltonoperator des Oszillators lautet 1 1 1 p̂2 2 2 † + mω x̂ = ~ω â a + = ~ω n̂ + , Ĥ = 2m 2 2 2 5.7. PHOTONEN UND PHONONEN 181 mit den bekannten Auf- und Absteigeoperatoren, bzw. dem Besetzungszahloperator n̂ = ↠a. Das Spektrum ist durch En = ~ω(n + 1/2), mit n ∈ N0 gegeben, so daß sich für die kanonische Zustandssumme Z= ∞ X −βEn e n=0 =e −β~ω/2 ∞ X n=0 e−β~ω n = e−β~ω/2 1 − e−β~ω ergibt. Die Wahrscheinlichkeit für den Eigenzustand |ni ist e−βEn e−β~(n+1/2)ω P pn = = ∞ −β~(m+1/2)ω = e−β~ω/n 1 − e−β~ω . Z m=0 e Dieses Ergebnis ist sehr ähnlich zu dem für das freie Bosegas Gl. (5.7) mit den zwei wichtigen Unterschieden, daß das chemische Potential nicht auftritt (bzw. µ = 0 gilt) da die Zahl der Schwingungsmoden (im Gegensatz zur Teilchenzahl bei Bosonen) nicht erhalten ist und daß nur eine Frequenz vorkommt. Für die mittlere Besetzungszahl und die Schwankung erhalten wir daher analog zu Gln. (5.8) und (5.10) hn̂i = 1 , (∆n)2 = hn̂i (1 + hn̂i) . β~ω e −1 Die Abwesenheit des chemischen Potentials führt dazu, daß keine Bose-Einstein Kondensation auftritt. Für die mittlere Energie ergibt sich ∞ ∞ D E X X ~ω ~ω Ĥ = En pn = ~ω (n + 1/2)pn = ~ω(hn̂i + 1/2) = + β~ω . 2 e −1 n=0 n=0 D E D E Für kB T ~ω gilt Ĥ ≈ ~ω/2 und für kB T ~ω, Ĥ ≈ kB T . Mit Hilfe des Virialsatzes Gl. (4.8) erhält man D E D E D E D E D E D E D E Ĥkin = Ĥpot ⇒ Ĥ = Ĥkin + Ĥpot = 2 Ĥkin = 2 Ĥpot also D E p̂2 /(2m) = mω 2 x̂2 /2 = Ĥ /2 . Im klassischen Limes kB T ~ω ergibt sich 2 p̂ /(2m) = mω 2 x̂2 /2 ≈ kB T /2 , also das Ergebnis des klassischen Gleichverteilungssatzes (siehe Seiten 131 und 132). 182 KAPITEL 5. QUANTENSTATISTIK Liegen nun f unabhängige Oszillatoren mit gleicher (Kreis-)Frequenz ω vor, so muß man die mittlere Energie offensichtlich einfach mit f multiplizieren. Dann gilt D E kB TE kB TE + f T /T , Ĥ = f E 2 e − 1 D E 2 ∂ Ĥ TE eTE /T = f kB , ⇒ CV = 2 ∂T T (eTE /T − 1) mit der charakteristischen Einsteintemperatur TE = ~ω/kB . Das vorliegende Modell ist relevant bei der Beschreibung der Thermodynamik sogenannter optischer Phononen eines kristallinen Festkörpers (siehe weiter unten) und heißt das Einsteinmodell. Wir betrachten noch die Limites T TE und T TE . Für T TE gilt D E 1 Ĥ ≈ f kB TE + f kB TE e−TE /T , 2 2 TE CV ≈ f kB e−TE /T T und für T TE (klassischer Limes) D E 1 Ĥ ≈ f kB TE + f kB T , 2 CV ≈ f kB Im klassischen Limes sind die Resultate im Einklang mit dem Gleichverteilungssatz. Für tiefe Temperaturen ergibt sich eine exponentiell kleine spezifische Wärme, da aufgrund der Energielücke zu angeregten Zuständen, diese nur mit einer exponentiell kleinen Wahrscheinlichkeit besetzt sind. Die Temperaturabhängigkeit der spezifische Wärme des Einsteinmodells ist folgend skizziert. CV /k B f −T /T ~e E 1 T/TE 5.7. PHOTONEN UND PHONONEN 183 Wir werden uns nun der elektromagnetischen Hohlraumstrahlung zuwenden und das Plancksche Strahlungsgesetz herleiten. Wir betrachten freie elektromagnetische Strahlung (keine Ladungen und Ströme) in Wechselwirkung mit einem Wärmebad. Dieses soll Energie bei jeder Frequenz mit der Strahlung austauschen können. Man spricht in diesem Fall von schwarzen Strahlung. Ein typischer experimenteller Aufbau ist folgend skizziert. Wand mit T Strah− lung Beobachtungs− loch Um die Quantenstatistik dieses Systems untersuchen zu können, bringen wir die Maxwellgleichungen auf eine kanonische Form. Da es auf die genaue Form der Wechselwirkung der Strahlung mit der Wand nicht ankommt,7 verwenden wir periodische Randbedingungen für die elektromagnetischen Potentiale φ(~x, t) ~ x, t) in einem Kasten der Kantenlänge L, also Volumen V = L3 . In der und A(~ ~ ·A ~ = 0 gilt φ = 0 und die Wellengleichung (in cgs-Einheiten) Coulombeichung ∇ ~+ −∆A 1 ~¨ A=0. c2 Im Fourierraum sind die Lösungen transversale, ebene Wellen mit der allgemeinen Form (~s~k ∈ C3 ) ~ x, t) = A(~ i Xh ~ ~s~k ei(k·~x−ωk t) + c.c. , ~k wobei n1 2π n2 , ωk = c|~k| , ~k · ~s~k = 0 , ~k = L n3 7 ni ∈ Z . Die Wechselwirkung wird als Oberflächeneffekt später vernachlässigt. 184 KAPITEL 5. QUANTENSTATISTIK Zur Zeit t = 0 (Anfangsbedingung) gilt i Xh ~ ~ x, 0) = A(~ ~s~k + ~s∗−~k eik·~x , ~k ~˙ x, 0) = A(~ X i h ~ (−iωk ) ~s~k − ~s∗−~k eik·~x , ~k ~ und A ~˙ eindeutig festd.h. durch die ~s~k werden die Anfangsbedingungen von A gelegt. Da ~k · ~s~k = 0 können wir ~s~k in zwei transversale Polarisationsvektoren zerlegen 1/2 X 4π (0) q~k,s ~e~k,s , ~k · ~e~k,s = 0 . ~s~k = c V s=1,2 Der auftretende Vorfaktor ist eine Konvention. Mit (0) q~k,s (t) = q~k,s e−iωk t folgt ~ x, t) = c A(~ 4π V 1/2 X h i i~k·~ x ~e~k,s q~k,s (t)e + c.c. , ~k,s wobei die q~k,s (t) die Bewegungsgleichung q̇~k,s = −iωk q~k,s erfüllen. Wir führen nun die reellen Größen Q~k,s = q~k,s + ∗ q~k,s , P~k,s = −iωk q~k,s − ∗ q~k,s ein. Diese erfüllen die kanonischen Bewegungsgleichungen eines harmonischen Oszillators (mit Masse m = 1) Q̇~k,s = P~k,s , Ṗ~k,s = −ωk2 Q~k,s . Die zu diesen Bewegungsgleichungen gehörende Hamiltonfunktion ist also X1 2 2 2 H= P + ωk Q~k,s . 2 ~k,s ~k,s Dieser Ausdruck entspricht auch der elektromagnetischen Energie der Felder8 Z 1 ~2+B ~ 2 )d3 x . (E H= 8π V 8 p Dies liefert die Begrüngung für den oben gewählten Vorfaktor c 4π/V . 5.7. PHOTONEN UND PHONONEN 185 Der Impuls des Strahlungsfeldes ist durch 1 X ~k 1 2 2 2 ~ P + ωk Q~k,s P = c k 2 ~k,s ~k,s gegeben. Wir quantisieren nun die elektromagnetische Strahlung gemäß dem üblichen Vorgehen. Die Q~k,s und P~k,s fassen wir als Operatoren Q̂~k,s und P̂~k,s auf, die die kanonischen Vertauschungsrelationen h i h i h i Q̂~k,s , Q̂~k0 ,s0 = 0 = P̂~k,s , P̂~k0 ,s0 , Q̂~k,s , P̂~k0 ,s0 = i~δ~k,~k0 δs,s0 erfüllen. Aus der Hamiltonfunktion wird so ein Hamiltonoperator von unabhängigen harmonischen Oszillatoren. Für jede Mode (~k, s) führen wir Auf- und Absteigeoperatoren ein r â~k,s = ωk 2~ r i i ωk † Q̂~k,s + P̂~k,s , â~k,s = Q̂~k,s − P̂~k,s ωk 2~ ωk ein, so daß H= X ~k,s 1 ~ωk n̂~k,s + , n̂~k,s = a~†k,s a~k,s . 2 Das Spektrum ist durch E{n~k,s } = X ~k,s 1 , ~ωk n~k,s + 2 n~k,s ∈ N0 gegeben. Dabei ist n~k,s die Zahl der Photonen mit Impuls ~~k (siehe Ausdruck für den Impuls des Strahlungsfeldes) und Polarisation s. Nach diesen Vorarbeiten, können wir zur statistischen Beschreibung der schwarzen Strahlung die obigen Ausdrücke des freien Bosesgases E (mit µ = 0) “abschrei ben”. Für die Wahrscheinlichkeit des Zustands {n~k,s } erhalten wir −βE{n~ p{n~k,s } = e k,s } =P Z e−β P ~ k,s −β e n~0 k,s = P e−β n~0 k,s P e ~ k,s −β ~ωk n~k,s P ~ k,s ~ωk n~0 k,s . ~ωk (n~k,s +1/2) P ~ k,s ~ωk (n~0 +1/2) k,s 186 KAPITEL 5. QUANTENSTATISTIK Für die Wahrscheinlichkeit, daß n Photonen mit Impuls ~~k und Polarisation s auftreten folgt ∞ X e−β~ωk n e−β~ωk n . ; Z~k,s = W~k,s (n) = Z~k,s n=0 Der Mittelwert der Zahl der Photonen im Zustand (~k, s) (in einer spezifischen Mode) und die Schwankungen dieser Zahl ist durch D E n̂~k,s = 1 eβ~ωk − 1 E E D D . , (∆n~k,s )2 = n̂~k,s 1 + n̂~k,s Für die mittlere Energie der Photonen mit Impuls ~k und Polarisation s folgt D D E E 1 ~ω ~ωk k E{n~k,s } = ~ωk n̂~k,s + = + β~ω . 2 2 e k −1 Mit diesem Ergebnis können wir die mittlere Energie im Frequentzintervall [ω, ω+ dω] bestimmen [2 V D(ω)dω] [~ω] 1 , −1 eβ~ω wobei die erste Klammer die Zahl der Moden in [ω, ω + dω] angibt (D(ω) ist die Zustandsdichte pro Polarisationsrichtung und Volumen), die zweite die Energie und die dritte die Besetzungszahl. Wir haben den Beitrag der temperaturunabhängigen Nullpunktsenergie weggelassen. Für die Zahl der Moden gilt V D(ω)dω = Zahl der ~k-Vektoren mit Modenenergie in [ω, ω + dω] Volumen einer Kugelschale im ~k-Raum = Volumen eines ~k-Vektors 4πk 2 dk = (2π/L)3 1 4πω 2 dω = 3 V , c (2π)3 wobei wir im letzten Schritt ωk = ck verwendet haben. Damit folgt für die Zustandsdichte D(ω) = ω2 . 2π 2 c3 Die mittlere Energie pro Volumen und Frequenzintervall ist damit W (ω) = 2D(ω) ~ω ω2 ~ω = . β~ω 2 3 β~ω e −1 π c e −1 5.7. PHOTONEN UND PHONONEN 187 Dies ist das Plancksche Strahlungsgesetz. Die Frequenzabhängigkeit ist folgend skizziert. 2 3 2 3 π c h β W(ω) 2 1.5 1 0.5 0 0 2.82 5 10 hω/(kBT) Das Maximum liegt bei ~ωmax ≈ 2.82kB T . Dieses Wiensche Verschiebungsgesetz gibt an, wie sich das Maximum mit der Temperatur des Wärmebads (der Wände) verschiebt. Für ~ω kB T erhält man das Rayleigh-Jeans-Gesetz ω2 W (ω) ≈ 2 3 kB T π c welches als fett gedruckte gestrichelte Linie in der obigen Skizze eingezeichnet ist. Es entspricht dem klassischen Gleichverteilungssatz W (ω) = 2D(ω)kB T , mit der mittleren Energie kB T eines klassischen harmonischen Oszillators. Die klassische Behandlung führt auf eine Ultraviolettkatatstrophe: Jede Mode, auch die mit hoher Frequenz, bekommt nach dem Gleichverteilungssatz die mittlere Energie kB T . Da die Zustandsdichte mit ω 2 anwächst führen die hohen Frequenzen zu einer unendlichen Gesamtenergie, die sich durch Integration über W (ω) ergibt. Eine rein klassische Betrachtung der Hohlraumstrahlung führt also zu unphysikalischen Ergebnissen die auch im Widerspruch zu gemessenen Verteilungen stehen. Diese Situation hat Planck 1900 dazu geführt ad-hoc anzunehmen, daß die Energie jeder Schwingung nur in diskreten Quanten vorkommen kann. Dies war ein wichtiger Schritt bei der Entwicklung der Quantenmechanik. Für ~ω kB T folgt das Wiensche Gesetz ω2 W (ω) ≈ 2 3 ~ω e−~ω/(kB T ) . π c 188 KAPITEL 5. QUANTENSTATISTIK Das “Photonengas” abschließend wollen wir die freie Energie, innere Energie und den Strahlungsdruck berechnen. Die kanonische Zustandssumme ergibt sich als Produkt von Zustandssummen Z~k,s unabhängiger Oszillatoren. Es gilt Z = e−βE0 Y Z~k,s , E0 = X ~ωk ~k,s ~k,s 2 mit Z~k,s = ∞ X e−β~ωk n = n=0 1 . 1 − e−β~ωk Dabei ist E0 die Nullpunktsenergie, die zwar divergiert, aber in allen Erwartungswerten als Konstante herausfällt. Wir lassen sie daher im Folgenden weg. Die freie Energie ist durch F = −kB T ln Z X = −kB T ln Z~k,s ~k,s = kB T X ln 1 − e−β~ωk ~k,s Z ≈ 2kB T V ∞ D(ω) ln 1 − e−β~ω dω 0 gegeben, wobei wir im letzten Schritt große V angenommen haben. Diese Formel ist (bis auf die Nullpunktsenergie) äquivalent zu dem Ergebnis eines freien Bosegases mit µ = 0. Nach den Überlegungen von Seite 164 gilt für eine lineare Dispersion mit κ = 1 und für µ = 0 (was J = F impliziert) 1 F =− U , 3 mit der inneren Energie U = hEi − E0 . Für U erhalten wir (große V ) X ~ωk U = eβ~ωk − 1 ~k,s Z ∞ ~ω ≈ 2V D(ω) β~ω dω e −1 0 Z ∞ ~ω 3 V = dω π 2 c3 0 eβ~ω − 1 4 Z ∞ V 1 x3 = ~ dx π 2 c3 β~ ex − 1 0 | {z } π 4 /15 2 = V π (kB T )4 . 3 3 15~ c 5.7. PHOTONEN UND PHONONEN 189 Dies ist das sogenannte Stefan-Boltzmann Gesetz. Für den Strahlungsdruck ergibt sich dann 1U π2 ∂F = = P =− (kB T )4 . ∂V T 3V 45~3 c3 Abschließend wollen wir uns mit der statistischen Mechanik (Thermodynamik) von Gitterschwingungen eines kristallinien Festkörpers beschäftigen. Diese können in harmonischer Näherung (Entwicklung des Potentials bis zur zweiten Ordnung in der Auslenkung um die Ruhelage), d.h. bei kleiner Auslenkung, als Überglagerung von unabhängigen harmonischen Oszillationen dargestellt werden. Wie für das elektromagnetische Feld werden diese Schwingungen quantisiert, was uns auf die Phononen führt. In der Vorlesung zur Festkörperphysik wird gezeigt, daß das Phononespektrum für einen dreidimensionalen Ionenkristall (Metall) die folgend skizzierte Form hat. ω k,s π /a j k j −π /a j Dabei kann j die Werte 1, 2 und 3 annehmen und aj bezeichnet die Gitterkonstante in die j-Richtung. Die drei Zweige mit linearer Dispersion bei kleinen k sind die akustischen Zweige. Es gibt 3(r − 1) sogenannte optischen Zweige mit nahezu konstanter Frequenz, wobei r die Zahl der Atome pro Elementarzelle des Gitters bezeichnet (siehe Vorlesung zur Festkörperphysik). Die akustischen Moden kann man noch in zwei transversale und eine longitudinale Mode unterteilen. Für ka 1 (wobei a eine “typische” Gitterkonstante ist) gilt für die akustischen Moden ω~k,s ≈ cs (~k/k) k , wobei cs (~k/k) die richtungsabhängige Schallgeschwindigkeit bezeichnet. Für isotrope Kristalle hängt cs nicht von der Richtung ab. Für einen endlichen Krsitall mit N Gitterpunkten, sind die ~k diskret und es gibt genau 3N Frequenzen. Die 190 KAPITEL 5. QUANTENSTATISTIK komplizierte Form der ~k-Abhängigkeit der Frequenzen wird oft qualitativ im Rahmen des sogenannten Debyemodells beschrieben. In diesem vernachlässigt man die Unterschiede zwischen den verschiedenen Zweigen und setzt ω~k = ωk = ck für 0 ≤ ωk < ωD , mit der Debyefrequenz ωD . Man geht also von einer isotropen und linearen Dispersionsrelation mit mittlerer Schallgeschwindigkeit c aus. Die Debyefrequenz ist dabei so festzulegen, daß die totale Zahl der Frequenzen wie gefordert gleich 3N ist Z ωD X ≈V D(ω)dω = 3N . ~k 0 Dabei bezeichnet D(ω) die Zustandsdichte pro Volumen für die wir, wie für die vereinfachte Dispersion wie bei Photonen, ω2 2π 2 c3 erhalten. Ausgedrückt durch die Zustandsdichte, stellt das Debyemodell die folgend skizzierte Vereinfachung dar. D(ω) = D(ω) opt. akust. ωD ω Da das Modell die reale Zustandsdichte bei sehr kleinen Energie gut beschreibt, können wir davon ausgehen, daß es eine gute Beschreibung der Thermodynamik bei hinreichend kleinen Temperaturen kB T ~ωD liefert. Diese Erwartung wird zusätzlich durch unsere Rechnungen zum Einsteinmodell unterstützt. Dieses Modell beschreibt die optischen Phononen. Wir hatten gesehen, daß die Energielücke (wegen nahezu ~k-unabhängiger Frequenz) zu einer exponentiellen Unterdrückung der spezifischen Wärme bei kleinen T führt. Der Beitrag der optischen Phononen ist also bei kleinen T vernachlässigbar. Für ωD ergibt sich Z ωD V ω 2 dω = 3N ⇒ ωD = 91/3 (2π 2 )1/3 n1/3 c . 2π 2 c3 0 5.7. PHOTONEN UND PHONONEN 191 Da n1/3 der mittlere Abstand der Atome (Ionenrümpfe) darstellt, erhalten wir als Größenordnung für ωD ~ωD ∼ ~c/aB = e2 me2 c c= mc2Licht ∼ 10−2 eV ∼ kB 100 K . ~ ~cLicht | {z } cLicht | {z } ∼0.5 MeV | {z } ∼1/137 ∼10−6 Für die Debyetemperatur kB TD = ~ωD ergibt sich TD ∼ 100K. Wir wollen nun die innere Energie und die spezifische Wärme des Debyemodells berechnen. Dazu schreiben wir D(ω) = 9n ω2 . 3 ωD Damit folgt U = = = = ωD ~ω ~ω V D(ω) + β~ω dω 2 e −1 0 ! 3 3 Z ωD 1 ω ω 1 9N ~ + dω 2 ωD ωD eβ~ω − 1 0 Z 1 x3 1 3 x + xT /T 9N ~ωD dx 2 e D −1 0 4 Z TD /T 9 T x3 N kB TD + 9N kB TD dx . 8 TD ex − 1 0 Z Im Limes T TD , in dem das Modell entsprechend der obigen Überlegungen die Thermodynamik von Gitterschwingungen gut beschrieben sollte, folgt mit Z TD /T Z ∞ Z ∞ π4 x3 → , dx = ex − 1 15 0 0 0 das Ergebnis 4 9 3π 4 T U ≈ N kB TD + N kB TD , 8 5 TD 3 ∂U 12π 4 T ≈ N kB , CV = ∂T V 5 TD also ein kubische Abhängigkeit der spezifische Wärme von der Temperatur. Für ein (dreidimensionales) Metall gibt es somit bei kleinen Temperaturen einen Beitrag ∝ T von den Leitungselektronen und einen Beitrag ∝ T 3 von den Phononen 192 KAPITEL 5. QUANTENSTATISTIK (Gitterschwingungen) zur spezifischen Wärme. Diese Vorhersagen sind experimentell sehr gut bestätigt. Für T TD gilt im Debyemodell 3 Z TD /T Z TD /T 1 TD x3 2 x dx = dx ≈ ex − 1 3 T 0 0 und damit 9 N kB TD + 3N kB T , 8 ≈ 3N kB , U ≈ CV wie aus dem klassischen Gleichverteilungssatz zu erwarten.