Thermodynamik: 1. Hauptsatz • Energieerhaltung: Arbeit plus Wärmeentwicklung gleich Änderung der inneren Energie ∆E = w + q • kein Perpetuum Mobile der 1. Art (also: keine Maschine verrichtet Arbeit ohne Brennstoff) • differentielle Form: dE = dw + dq I dE = 0 Energie ist eine Zustandsfunktion E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 1 Thermodynamik: 2. Hauptsatz • Entropie ist eine Zustandsfunktion • Wärme kann nicht 100%ig in Arbeit umgewandelt werden • kein Perpetuum Mobile der 2. Art • differentielle Form: dS = I dqrev T dS = 0 dabei ist T die Temperatur und qrev die bei reversibler Prozessführung ausgetauschte Wärme E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 2 Thermodynamik Kombination von 1. und 2. Hauptsatz: dE = dq + dw = dqrev + dwrev dE = T dS − pdV (in einem abgeschlossenen Einkomponentensystem) dE = T dS − pdV + µdN dE = T dS − pdV + (weil E eine Zustandsfunktion ist) X i (in einem offenen Einkomponentensystem) µidNi (in einem Mehrkomponentensystem) (Druck p, Volumen V , chemisches Potential µ und Teilchenzahl N ) E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 3 Thermodynamik Da die Energie eine Zustandsfunktion ist, ist dE ein exaktes Differential. Außerdem sind S, p und N Zustandsvariablen. Deshalb gilt dS = 1 T dE + p T dV − µ T dN was wiederum bedeutet, daß aus S(N, V, E) alle anderen Zustandsvariablen berechnet werden können, gemäß 1 T p T µ T ∂S = = ∂E V,N ∂S ∂V =− E. Spohr, Theoretische Chemie, Masterstudium E,N ∂S ∂N SS 2017. E,V Universität Duisburg-Essen 4 Thermodynamik: 3. Hauptsatz wir haben dabei implizit angenommen, daß die Integrationskonstante trivial ist, d.h., daß für T → 0 die Entropie gegen einen trivialen konstanten Wert geht. Normalerweile setzt man diese Konstante gleich null. Man bezeichnet die Tatsache, daß die Entropie am absoluten Nullpunkt gegen Null geht, allgemein als 3. Hauptsatz der Thermodynamik. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 5 Grundlagen der Statistischen Mechanik: Isoliertes System weder Energie- noch Materieaustausch mit der Umgebung U,V, makroskopisch: N1, N2, . . . wohldefinierte innere Energie U , Volumen V und Teilchenzahl(en) Ni Prozesse laufen so ab, daß S maximiert wird. Endzustand aller Prozesse ist der Gleichgewichtszustand. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 6 Grundlagen der Statistischen Mechanik: Isoliertes System mikroskopisches Bild: klassisch V, N1, N2, . . . q ~i p ~i (i: Partikelindex) E. Spohr, Theoretische Chemie, Masterstudium quantenmechanisch V, N1, N2, . . . ψj , j , nj (j: Zustandsindex) SS 2017. Universität Duisburg-Essen 7 Grundlagen der Statistischen Mechanik: Isoliertes System klassisch: System ist eindeutig durch Angabe der Koordinaten q ~i und Impulse p ~i der Atome (Elektronen, Moleküle, “Teilchen”) i definiert. Die innere Energie ist gleich des Wertes der klassischen Hamiltonfunktion H, die von den Koordinaten und Impulsen abhängt. E = U = H({~ qi, p ~i}) Hier ist H = Ekin({~ qi, p ~i}) + Epot({~ qi}) Die potentielle Energie Epot beschreibt die intermolekularen oder interatomaren Wechselwirkungen. Sie heißt konservativ, wenn Epot keine Funktion der Impulse p ~i ist. 1X p ~2i Die kinetische Energie Ekin = kann (z. B. in kurvilinearen Koordinatensystei 2 mi men) auch von den {~ qi} abhängen. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 8 Grundlagen der Statistischen Mechanik: Isoliertes System quantenmechanisch: System ist eindeutig durch Angabe der Zustände ψj , deren Energieniveaus j und Besetzungszahlen nj bestimmt. Ĥ = (Ĥ)({q̂i, p̂i}) j ψj = Ĥψj E= X j nj j Ĥ = Ĥ(q̂i, p̂i) ist der Hamiltonoperator (das quantenmechanische ‘Äquivalent’ der Hamiltonfunktion) V und Ni gehen bereits in die Berechnung der Energieeigenwerte des Systems ein. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 9 Isoliertes System: quantenmechanische Zustände Interpretationsmöglichkeiten für die ψj • als Vielteilchenzustände des Gesamtsystems: also: alle nj = 0 außer nk = 1, d.h., das System befindet sich zu einem Zeitpunkt t1 im Zustand ψk . Da das System mikroskopisch zeitabhängig ist, befindet es sich zu einem späteren Zeitpunkt t2 in einem anderen Zustand, z. B. ψl . Dann ist nl = 1. Es gibt sehr viele dieser Zustände k und l. Sie besitzen alle die gleiche Energie, das System besitzt also viele energetisch entartete Zustände. Ein Weg wäre nun, die ψj alle zu berechnen. Dies ist für N ≈ 1023 unmöglich!!!!. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 10 Isoliertes System: quantenmechanische Zustände • Man nimmt an, daß die Moleküle näherungsweise voneinander unabhängig sind (z. B. in verdünnten Gasen), oder daß sich kollektive Quasi-Teilchen definieren lassen, wie z. B. Phononen (in periodischen Festkörpern), oder daß sich das System in einer anders gearteten Weise (näherungsweise) in Untersysteme zerlegen lässt, so daß eine Einteilchennäherung möglich ist. Es gibt dann z.B. eine große Zahl von molekularen Energieniveaus, deren Besetzungszahlen > 1 sein können (analog eine große Zahl von Phononenniveaus, deren Besetzung 0 oder 1 ist). E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 11 Isoliertes System: quantenmechanische Zustände In jedem Fall gibt es mehr als ein nj , dessen Wert von 0 verschieden ist. Es gilt also allgemein E= X j nj j und N = X j nj Man wird in jedem Fall zu einer Verteilung von Besetzungszahlen für einen gegebenen Zustand des Gesamtsystems gelangen. Die vielen entarteten Zustände zeichnen sich jeder durch einen speziellen Wert des Vektors ~ n = {n1, n2, n3, . . .} aus! Wenn das Einteilchensystem sehr viel mehr Zustände als Teilchen besitzt, wird ni sehr selten größer als 1 sein. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 12 Isoliertes System: klassische Zustände Jede Systemkonfiguration, bei der alle Teilchen sich im Volumen V befinden und die Summe aus kinetischer und potentieller Energie gleich der Gesamtenergie ist, stellt einen mikroskopischen Zustand dar. Anmerkung: Frage: wie groß darf δq oder δp sein, damit das System sich in zwei “wirklich” unterschiedlichen Konfigurationen befindet? Antwort: größenordnungsmäßig δqδp ≥ h̄/2 genaue Rechnung: δqδp = h E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 13 Klassische Dynamik: Newton’sche Bewegungsgleichungen Kraft = Masse mal Beschleunigung q̇ = F = m · a = m · q̈ p m ṗ = F wobei q die Teilchenposition und p der Teilchenimpuls ist. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 14 Klassische Dynamik: Hamilton’sche Bewegungsgleichungen • das System verhalte sich hamiltonisch, d. h., es sei durch eine Hamiltonfunktion H = V({qk }) + T ({qk , pk }) beschrieben, aus der sich die Hamiltonschen Bewegungsgleichungen ableiten lassen: ∂H ∂qi ∂H = −ṗi ∂pi = q̇i • in kartesischen Koordinaten hängt die kinetische Energie nur von den {pk } ab: 2 X pk T = T ({pk }) = k 2mk die Bewegungsgleichungen lauten dann: ∂H ∂qi = ∂V ∂qi = −ṗi ∂H ∂pi = ∂T ∂pi = pi mi = q̇i =⇒ miq̈i = − (Äquivalenz der Newtonschen und Hamiltonschen Bewegungsgleichungen) E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 15 ∂V ∂qi Klassische statistische Mechanik Im folgenden seien folgende Annahmen erfüllt: • das System verhält sich klassisch • hinreichend gut isoliertes System • Wechselwirkungen zwischen den Atomen / Molekülen können durch eine Potentialfunktion beschrieben werden Die Newtonsche Dynamik (Bewegungsgleichungen) beschreiben also die Evolution des Systems durch die Trajektorie {qi(t), pi(t)} in einem (6N-dimensionalen) Phasenraum. Punkte in diesem 6N-dimensionalen Phasenraum (3N Freiheitsgrade für die Koordinaten qi der N Atome 3N Freiheitsgrade für die Impulse pi der N Atome) bezeichnet man häufig durch das Symbol Γ. das System ist dynamisch: Γ = Γ(t) die Trajektorie des Systems durchläuft nacheinander die für ein bestimmtes System in Frage kommenden Punkte Γ (die Mikrozustände) E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 16 Klassische statistische Mechanik Makroskopische Eigenschaften Makroskopische Observable OM akro sind dann offensichtlich(?) zeitliche Mittelwerte Ō über die Trajektorie während der Beobachtungszeit T OM akro = Ō = 1 Z T T O(Γ(t))dt für T → ∞ erwartet man, daß die Trajektorie alle möglichen Zustände des Systems durchläuft. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 17 Klassische statistische Mechanik Makroskopische Eigenschaften vergessen wir die zeitliche Abfolge der Zustände und nehmen wir an, daß zu irgendwelchen Zeitpunkten ti stichprobenartig Zustände Γi herausgegriffen werden Dann ist in einem isolierten System folgendes plausibel Postulat der gleichen a priori Wahrscheinlichkeiten Das System befindet sich mit gleicher Wahrscheinlichkeit in einem beliebigen der mit dem vorgegebenen Makrozustand kompatiblen Mikrozustände Das Postulat bildet das Rückgrat der statistschen Mechanik!! Die Gesamtzahl der möglichen Mikrozustände ist eine systemabhängige Größe Ω(N, V, E) E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 18 Entropie und Mikrozustände Betrachtet man das thermodynamische Gleichgewicht als den wahrscheinlichsten Makrozustand, so ist ebenfalls plausibel, daß der makroskopische Gleichgewichtszustand dadurch charakterisiert ist, daß die Zahl Ω maximal ist. Makroskopisch ist der Gleichgewichtszustand auch durch die Forderung, daß die Entropie maximal wird, charakterisiert. Offensichtlich muß also S eine monoton steigende Funktion von Ω sein! Welche? E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 19 Entropie und Mikrozustände S ist eine extensive Größe. Bringt man also zwei isolierte Systeme 1 und 2 zusammen, so ist S = S1 + S2. Die Zahl der mikroskopischen Zustände ist Ω = Ω1 · Ω2, da für jede Konfiguration (Mikrozustand) des Systems 1 alle Ω2 Zustände des Systems 2 möglich sind. miteinander vereinbar ist dies nur, wenn gilt S ∝ ln Ω. nach Boltzmann gilt: S = k · ln Ω Boltzmannkonstante k = 1.38 · 10−23JK−1 Anmerkung: S = 0 ⇐⇒ Ω = 1 E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 20 Ensembletheorie Def.: Die Gesamtheit aller Mikrozustände, die mit den makroskopischen Systemgrößen kompatibel ist, bilden ein Ensemble Die einzelnen Mikrozustände nennt man Ensemblemitglieder; sie sind gedankliche Kopien des Systems. 2 Betrachtungsweisen: 1. Die einzelnen Ensemblemitglieder stellen den Zustand des Systems zu verschiedenen Zeiten ti dar. Wenn die Zeiten ti nach aufsteigender Zeit geordnet werden, dann spiegeln sie also die zeitliche Evolution des Systems wieder. Sie stellen eine Diskretisierung der Phasenraumtrajektorie dar. 2. Die einzelnen Ensemblemitglieder stellen den Zustand vieler äquivalenter Systeme (zum gleichen Zeitpunkt t) dar. Dies ist der Standpunkt der Ensembletheorie. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 21 Ensembletheorie: Ergodenhypothese Ist die Ensembleinterpretation nützlich? ja, wenn folgendes wahr ist: Ergodenhypothese: (Boltzmann 1981) Ein System ist ergodisch, wenn die ungestörte Bewegung des Systems — über einen beliebig langen Zeitraum verfolgt — letztendlich jeden Punkt im Phasenraum, der mit einem bestimmten Wert der Energie E vereinbar ist, durchläuft. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 22 Ensembletheorie: Quasiergodenhypothese wegen der kontinuierlichen Natur der klassichen Variablen ist dies nur näherungsweise erfüllt. =⇒ Quasiergodenhypothese: Ein System ist quasiergodisch, wenn die ungestörte Bewegung des Systems — über einen beliebig langen Zeitraum verfolgt — letztendlich die Nachbarschaft jedes Punktes im Phasenraum, der mit einem bestimmten Wert der Energie E vereinbar ist, durchläuft. nicht beweisbar man nimmt oft an, daß, wenn sich das System hinreichend ergodisch verhält, die Untermenge der (wie auch immer) generierten Ensemblemitglieder repräsentativ für das gesamte Ensemble ist, was in der Praxis oft, jedoch nicht immer, erfüllt ist. Dies ist häufig ein heikler Punkt für die Bewertung der erhaltenen Simulationsergebnisse!! E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 23 Ensembletheorie: Mittelwerte Konsequenz: In einem ergodischen System ist der Ensemblemittelwert hOi zu irgendeiner Zeit t gleich dem Langzeitmittelwert Ō irgendeines Ensemblemitgliedes. 1 Zt Ō = lim t→∞ hOi = 1 X t0 O(t0)dt0 O(Γi(t)) Ω i Ō = hOi (Meßgröße) (Theorie: statistische Mechanik) Die Zahl der Mikrozustände in einem System mit N Atomen ist von der Größenordnung 23 10N , also 1010 . Es ist also offensichtlich unmöglich, ein komplettes Ensemble zu generieren. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 24 Ensembletheorie: Computersimulation man benötigt also: • analytische Verfahren, um über alle Ensemblemitglieder mitteln zu können. (Domäne der “traditionellen” statistischen Mechanik) • numerische Verfahren, die Ensemblemitglieder generieren, über deren Eigenschaften gemittelt werden kann. (Domäne der Computersimulation) 7 10 1023 Problem: es können nur endlich viele, z. B. 10 – 10 statt 10 Zustände generiert werden. Computersimulationen stellen eine Methode dar, um repräsentative Ensemblemitglieder zu generieren! Computersimulationen müssen repräsentative Ensemblemitglieder generieren! E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 25 Ensembletheorie: Charakterisierung eines Ensembles • die makroskopischen Größen (“kompletter” Satz von thermodynamischen Variablen zur Beschreibung des Systems) • eine Dichtefunktion im Phasenraum ρ(Γ) ρ(Γ)dΓ ist die Zahl der Ensemblemitglieder im Phasenraumbereich x1, x1 + dx1 y1, y1 + dy1 z1, z1 + dz1 ... [Γ; Γ + dΓ] = zN , zN + dzN px1 , px1 + dpx1 ... pzN , pzN + dpzN E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 26 Ensembletheorie: Charakterisierung eines Ensembles • eine Zustandssumme Z (zur Normierung der Dichtefunktion) • ein dazugehöriges thermodynamisches Potential Φ Φ = − ln Z wobei gelten muß, daß Φ im Gleichgewicht minimal ist. Die Ensembletheorie geht auf Gibbs zurück (1902) E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 27 Liouville-Theorem Das Liouville-Theorem schränkt die Wahl der Dichtefunktionen für stationäre Ensembles sehr stark ein. ∂ρ Stationäre Ensembles = 0 sind solche, die Systeme im thermodynamischen Gleich∂t gewicht beschreiben. (Ein System im Ggw. hat naturgemäß keine zeitabhängige Dichteverteilung!) Liouville-Theorem: 0= dρ({qi, pi}, t) dt Der Phasenraum eines Systems ist inkompressibel (sein “Volumen” ist constant). E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 28 Liouville-Theorem dρ dt dρ dt = = ∂ρ ∂t ∂ρ ∂t N X ∂ρ i=1 ∂qi N X ∂ρ i=1 ∂qi + + · · ∂qi ∂t ∂H ∂pi + − N X ∂ρ i=1 ∂pi N X ∂ρ i=1 ∂pi · · ∂pi ∂t ∂H ∂qi (Hamiltonsche Bewegungsgleichungen (äquivalent zu Newtonschen Bewegungsgleichungen)) dρ dt = =⇒ {ρ, H} = ∂ρ ∂t 3N X i=1 + {ρ, H} ∂ρ ∂qi · ∂H ∂pi − ∂ρ ∂pi ∂H · ∂qi muß also im Gleichgewicht gleich Null sein. Dies ist zum Beispiel dann erfüllt, wenn ρ eine explizite Funktion von H, nicht aber von den qi und pi ist. E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 29 Mikrokanonisches Ensemble • beschreibt isoliertes System: U = E = const ,N = const, V = const • Dichtefunktion ρ(Γ) = ρ0δ(H − E) (erfüllt Liouville-Theorem) • Zustandssumme Z = Ω = 1/ρ0 • thermodynamisches Potential Φ = − S k (aus S = k ln Ω; wird in der Tat minimal, da im isolierten System S im Ggw. maximal wird) 1 X • Ensemblemittelwert einer Observablen: hOi = O(Γi) N i E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 30 Kanonisches Ensemble • beschreibt geschlossenes System: T = const, N = const, V = const E • Dichtefunktion ρ(Γ) = ρ0 exp − kT (“Boltzmannfaktor”) E X • Zustandssumme Z = QN V T = exp − i kT • thermodynamisches Potential Φ = − A kT (also freie Helmholtz-Energie A = −kT ln QN V T ) E O(Γi) exp − kT i ! P E exp − kT i ! P • Ensemblemittelwert einer Observablen: hOi = E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 31 Großkanonisches Ensemble • beschreibt offenes System: T = const, µ = const, V = const E µN + • Dichtefunktion ρ(Γ) = exp − kT kT X µN • Zustandssumme Z = QµV T = Ξ = exp · QN V T N kT PV • thermodynamisches Potential Φ = − KT (also pV = kT ln QµV T ) µN (Γi ) i) O(Γi) exp − E(Γ + kT kT i ! P E exp − kT + µNkT(Γi) i P • Ensemblemittelwert einer Observablen: hOi = E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 32 ! Isobar-isothermes Ensemble Mikrokanonisches, kanonisches, und großkanonisches Ensemble sind die am häufigsten verwendeten. Daneben wird noch das isotherm-isobare Ensemble verwendet: • T = const, P = const, N = const −pV E + • Dichtefunktion ρ(Γ) = exp − kT kT • Zustandssumme Z = QN P T = Ξ = Z exp −pV kT V • thermodynamisches Potential Φ = − · QN V T G KT (also freie Gibbs-Energie G = −kT ln QN P T ) pV (Γi ) i) O(Γi) exp − E(Γ − kT kT i ! P (Γi ) E exp − kT − pVkT i P • Ensemblemittelwert einer Observablen: hOi = E. Spohr, Theoretische Chemie, Masterstudium SS 2017. Universität Duisburg-Essen 33 ! Zustandssummen Wir haben die Zustandssumme als “Summe über Zustände” eingeführt Ei({qk , pk }) X = exp − i kT z.B. im kanonischen Ensemble: Z = QN V T Diese Definition birgt keine Probleme für eine quantenmechanische Beschreibung des Systems in einem festen Volumen V , da dort die Zustände diskret und damit abzählbar sind. In der Praxis sind auch in einem quantenmechanisch beschriebenen System mit makroskopischem Volumen V die Translationszustände quasikontinuierlich: h2 2 2 1/3 Teilchen im Kasten mit Länge V : Ei = i = i 2mV 2/3 für ein Proton in V = 1cm3: = [6.625 · 10−34]2/[2 · 1.008 · 1.6605 · 10−27 · 10−4] ≈ 1.3 · 10−36J E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 1 Zustandssummen andererseits ist bei 298 K: kT ≈ 4.1 · 10−21J d. h., kT / ≈ 3 · 1015 =⇒ i ≈ 5 · 107 maW: bei Raumtemperatur gibt es ungefähr 106 Translationszustände pro Kelvin und Freiheitsgrad. D. h., mit experimentell handhabbarer Temperaturkontrolle kann man bei Raumtemperature selbst für ein einzelnes Proton die diskrete Natur der Translation kaum feststellen. für • ein größeres Volumen • größere Atommasse • und besonders: eine große Anzahl von Atome wird die Zustandsdichte noch wesentliche größer E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 2 Zustandssummen bei einer klassischen Beschreibung sind die Zustände des Systems durch die Angabe aller Koordinaten und Impulse {qk , pk } kontinuierlich beschrieben. Man geht daher von der Summe über Zustände zum Integral über den Phasenraum über : im kanonischen Ensemble: Ei({qk , pk }) X = exp − i kT Z = QN V T Ei({qk , pk }) Z = ω dΓ exp − kT −→ Z mit dΓ = dq1dq2 . . . dq3N dp1dp2 . . . dp3N ; R ist ein 6N-dimensionales Integral E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 3 Zustandssummen Wie groß ist der Proportionalitätsfaktor ω ? Antwort: ω = 1 N ! h3N Die Argumentation ist komplex, jedoch kann man die Richtigkeit der Formel z. B. durch die statistisch-mechanische Behandlung des idealen Gases verifizieren. vereinfacht: N ! ist eine Konsequenz der Ununterscheidbarkeit der Atome h3N ist eine Konsequenz der Unschärferelation E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 4 Die freie Energie des idealen Gases Kann man mit dem ganzen Formalismus irgendetwas ausrechnen? Ja, z. B. die Eigenschaften des idealen Gases man startet von der Beziehung A = −kT ln Q 1 = −kT ln N !h3N E({qk , pk }) dΓ exp − kT Z Z 3N p~i 2 pα 2 X für das ideale Gas gilt: E({qk , pk }) = E({pk }) = = α=1 2mα i=1 2mi das ideale Gas befinde sich im Volumen V , also gilt: N X Z dq1dq2 . . . dq3N = N Y ( dxi dyi dzi) = V N Z i=1 V alle Teilchen mögen die gleiche Masse mi = m haben E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 5 Die freie Energie des idealen Gases also gilt: = −kT = −kT = −kT = −kT = −kT 2 1 pα N V . . . exp − dp α 3N α=1 2mkT α=1 N !h 2 1 pα Y Z N 3N ln V ) dpα exp(− 3N α=1 N !h 2mkT 3N 2 Z 1 p N ln V ) dp exp(− 3N N !h 2mkT ! √ Z 3N 1 N 2 ln V 2mkT dx exp(−x ) 3N N !h ! √ √ 3N 1 N V 2mkT π ln 3N N !h 3N/2 1 2πmkT ln V N 2 N! h 1 ln V N Λ3N N! A = −kT ln = −kT Z Z 3N X 3N Y r mit der de Broglie’schen (“thermischen”) Wellenlänge Λ = 2πmkT /h2 E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 6 Die freie Energie des idealen Gases also: 1 N 3N A = −kT ln V Λ N! = kT [ln(N !) − N kT ln V − 3N ln Λ] = N kT [− ln V − 3 ln Λ + ln N − 1] Partielle Ableitungen von A ∂A 1 P := − = +N kT ∂V N,T V =⇒ (Stirlingsche Formel: ln(N !) ≈ N ln N − N ) Zustandsgleichung: pV = NkT ∂A ∂ ln Λ S := − = −N k [− ln V − 3 ln Λ + ln N − 1] + 3N kT ∂T N,V ∂T 1 = −N k [− ln V − 3 ln Λ + ln N − 1] + 3N kT 2T 3 = −N k [− ln V − 3 ln Λ + ln N − 1] + N k 2 E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 7 Die freie Energie des idealen Gases Ferner gilt A = U − T S oder U = A + TS = N kT [− ln V − 3 ln Λ + ln N − 1] 3 −N kT [− ln V − 3 ln Λ + ln N − 1] + N kT 2 3 = N kT kT/2 pro Freiheitsgrad 2 E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 8 Die innere Energie mikroskopisch: U = A + TS ∂A = A − T · ∂T N,V = −kT ln Q − T −k ln Q − kT ∂ ln Q kT 2 ∂T N,V 1 ∂Q kT 2 Q ∂T N,V Z Z 1 1 E({qk , pk }) E({qk , pk }) kT 2 dΓ exp − 2 Q N !h3N kT kT " # R E({qk ,pk }) dΓE({qk , pk }) exp − kT " # = hEi R E({qk ,pk }) dΓ exp − kT = = = = ∂ ln Q ∂T N,V die innere Energie ist ein einfacher Mittelwert (im kanonischen Ensemble) E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 9 Zustandssummen für das ideale Gas war die Separierung der Zustandssumme in Zustandssummen pro Freiheitsgrad vollständig, maW: Z Z dΓ = dq1dq2 . . . dq3N dp1dp2 . . . dp3N Z Z Z Z Z = ( dq1) · ( dq2) . . . ( dq3N ) · ( dp1) . . . ( dp3N ) für konservative Systeme in kartesischen Koordinaten kann man generell kinetische und potentielle Beitäge separieren: E({qk , pk } = T ({pk }) + V({qk }) und damit auch die Zustandssumme E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 10 Zustandssummen E({qk , pk }) 1 Z dΓ exp − N !h3N kT 1 Z T ({p }) + V({q }) k k dΓ exp − N !h3N kT T ({p }) + V({q }) 1 Z k k − dq dq . . . dq dp dp . . . dp exp 1 2 3N 1 2 3N N !h3N kT Z 1 Z T ({p }) V({q }) k k dq dq . . . dq dp dp . . . dp exp − · exp − 1 2 3N 1 2 3N N !h3N kT kT Z V({q }) T ({p }) 1 Z k k dq1 . . . dq3N exp − · dp1 . . . dp3N exp − 3N N !h kT kT 2 Z Z 3N 1 V({qk }) pk X dq . . . dq exp − · dp . . . dp exp − 1 3N 1 3N N !h3N kT k=1 2mkT Z 1 V({qk }) 3N dq dq . . . dq exp − · Λ 1 2 3N N! kT Q = = = = = = = E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 11 Konfigurationsintegral Man nennt V({qk }) . . . dq3N exp − kT Z Z ZN = dq1 dq2 Z Z Konfigurationsintegral Für das ideale Gas kann man ZN ausrechnen und erhält V N . Die analytische Berechnung des Konfigurationsintegrals ist im allgemeinen Fall nicht oder nur näherungsweise möglich. Das Konfigurationsintegral ist der “nichttriviale”, das kinetische Energieintegral der “triviale” Beitrag zur Zustandssumme E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 12 Dichtefunktion und Mittelwerte Die Dichtefunktion im Phasenraum ist mit 1 1 E({qk , pk }) · exp − Q N !h3N kT ρ({qk , pk }) = Z so definiert, dass dq1dq2 . . . dq3N dp1dp2 . . . dp3N ρ({qk , pk }) = 1 Ein Ensemblemittelwert einer Observablen O({qk , pk }) ist definiert als: hOi = Z dq1dq2 . . . dq3N dp1dp2 . . . dp3N ρ({qk , pk })O({qk , pk }) k ,pk }) dq1dq2 . . . dq3N dp1dp2 . . . dp3N O({qk , pk }) exp − E({qkT " # R E({qk ,pk }) dq1dq2 . . . dq3N dp1dp2 . . . dp3N exp − kT " R = E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 13 # Ensemblemittelwerte hängt O nur von den qk ab, so kann man wieder kinetische und potentielle Beiträge separieren " R hOi = k ,pk }) dq1dq2 . . . dq3N dp1dp2 . . . dp3N O({qk }) exp − E({qkT " # R E({qk ,pk }) dq1dq2 . . . dq3N dp1dp2 . . . dp3N exp − kT R V({qk }) k }) · dq dq . . . dq O({q }) exp − dp1dp2 . . . dp3N exp − T ({p 1 2 3N k kT kT #! #! " " R R V({qk }) T ({pk }) · dq1dq2 . . . dq3N exp − kT dp1dp2 . . . dp3N exp − kT #! " R = " k }) dq1dq2 . . . dq3N O({qk }) exp − V({q kT " #! R V({qk }) dq1dq2 . . . dq3N exp − kT " R = # 1 = ZN #! V({qk }) dq1dq2 . . . dq3N O({qk }) exp − kT Z Es wurde “über die Impulse integriert” (gemittelt). E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 14 #! Ensemblemittelwerte hängt O nur von den pk ab, gilt analog: " R hOi = k ,pk }) dq1dq2 . . . dq3N dp1dp2 . . . dp3N O({pk }) exp − E({qkT " # R E({qk ,pk }) dq1dq2 . . . dq3N dp1dp2 . . . dp3N exp − kT k }) dp1dp2 . . . dp3N O({pk }) exp − T ({p kT " #! R R T ({pk }) dp1dp2 . . . dp3N exp − kT · " R = = k }) · dq1dq2 . . . dq3N exp − V({q kT #! " k }) dq1dq2 . . . dq3N exp − V({q kT #! k }) dp1dp2 . . . dp3N O({pk }) exp − T ({p kT " #! R T ({pk }) dp1dp2 . . . dp3N exp − kT " R # " R #! Es wurde “über die Koordinaten integriert” (gemittelt). E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 15 #! Mittelwert der kinetischen Energie pi 2 O({qk , pk }) = O({pk }) = T ({pk }) = i=1 2mi also 3N X k }) dp1dp2 . . . dp3N O({pk }) exp − T ({p kT " #! R T ({pk }) dp1dp2 . . . dp3N exp − kT " R hT i = = R 3N pi 2 dp1dp2 . . . dp3N P 2m i i=1 R 3N P = R i=1 R " k }) exp − T ({p kT " #! T ({pk }) dp1dp2 . . . dp3N exp − kT pi 2 dp1dp2 . . . dp3N 2mi k }) exp − T ({p kT " #! T ({pk }) dp1dp2 . . . dp3N exp − kT " #! # #! von den 3N Integralen im Zähler und im Nenner sind jeweils 3N − 1 paarweise gleich, R lediglich die Integrale dpi sind voneinander verschieden: E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 16 Mittelwert der kinetischen Energie also 3N P hT i = R i=1 R 3N P = R i=1 R pi 2 dp1dp2 . . . dp3N 2m i " k }) exp − T ({p kT " #! T ({pk }) dp1dp2 . . . dp3N exp − kT pi 2 exp − 2mikT " #! pi 2 dpi exp − 2mikT pi 2 dpi 2mi " #! #! = ... = 3N 2 kT Äquipartitionstheorem E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 17 Mittelwert der inneren Energie wir hatten gesehen, daß U = A + TS # " R E({qk ,pk }) dΓE({qk , pk }) exp − kT " # = R E({qk ,pk }) dΓ exp − kT R = dΓ (T " k }) ({pk }) + V({qk })) exp − T ({pk }+V({q kT " # R k }) dΓ exp − T ({pk }+V({q kT dq1dq2 . . . dq3N V({qk }) exp = hT i + ZN R = hT i + hVi = " k }) − V({q kT # # 3N kT + hVi 2 Wenn V = 0, erhalten wir wieder die Formel für das ideale Gas! E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 18 Andere Mittelwerte • man kann fragen: Wie groß ist die Wahrscheinlichkeit, daß ein bestimmtes Atom k einen bestimmten Impuls in, z. B. x-Richtung besitzt, unabhängig von seinem Ort, und unabhängig von den Orten und Impulsen der anderen Atome? =⇒ Maxwellsche Geschwindigkeitsverteilung p(vx) es handelt sich um eine Mittelung über alle 3N Koordinaten und über 3N − 1 Impulse • Wie groß ist die Wahrscheinlichkeit, daß ein bestimmtes Atom k an einem bestimmten Ort (x, y, z) ist? =⇒ Einteilchendichte ρ(x, y, z) (wg. der Homogenität ist in einer Flüssigkeit ρ = const., nicht aber an einer Grenzfläche oder in einem Festkörper) Mittelung über 3N Impulse und 3N − 3 Koordinaten E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 19 Andere Mittelwerte • Wie groß ist die Wahrscheinlichkeit, ein bestimmtes Atom k in einem Abstand z von der Oberfläche, unabhängig von seiner x und y-Position über der Oberfläche zu finden? =⇒ Dichteprofil ρ(z) Mittelung über 3N Impulse und 3N − 1 Koordinaten • Wie groß ist die Wahrscheinlichkeit, daß in einer atomaren Flüssigkeit, z. B. Argon, zwei Atome k und m einen Abstand r voneinander besitzen? Koordinatentransformation: (xk , yk , zk , xm, ym, zm) −→ (xk , yk , zk , r, θ, φ) r mit dem Abstand r = (xm − xk )2 + (ym − yk )2 + (zm − zk )2 und θ und φ zwei (Euler)Winkeln, die die Orientierung des Verbindungsvectors x~m − x~k beschreiben. =⇒ Paarkorrelationsfunktion g(r) Mittelung über 3N Impulse und 3N − 1 Koordinaten (d. h. über alle Koordinaten außer über r) E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 20 Andere Mittelwerte • Wie sieht die Konformationsverteilung Butan, gelöst in DMSO, aus? Koordinatentransformation: (kart. Koordinaten der C-Atome in Butan) −→ (interne Koordinaten mit Torsionswinkel φ) =⇒ Verteilung der Torsionswinkel p(φ) unabhängig von allen anderen internen Koordinaten und Geschwindigkeiten Mittelung über 3N Impulse und 3N − 1 Koordinaten (d. h. über alle Koordinaten außer über φ) man kann dann als nächstes definieren, welche Bereiche der φ-Koordinate einer “trans”-Konfiguration entspricht und welche Bereiche einer “gauche”-Konfiguration entspricht. Integration von p(φ) über die entsprechenden Bereiche ergibt dann Anteile von trans und gauche-Konfigurationen Beispiel für ein grundsätzliches Problem: die Definition z. B. der der transKonformation zugeordneten Bereiche ist bis zu einem gewissen Grad arbiträr! E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 21 Andere Mittelwerte • “Reaktionswahrscheinlichkeit” für die Umwandlung von Sessel- in Wannenform von Cyclohexan in flüssiger Phase? =⇒ Ratenkonstanten der Reaktionskinetik kompliziertere Verteilungsfunktionen / Mittelwerte −→ (vielleicht später) Computersimulationen können zur Berechnung solcher Mittelwerte herangezogen werden, in der Regel ohne daß die Zustandssummen explizit ausgewertet werden müssen E. Spohr, Theoretische Chemie, Masterstudium SS 2017, Universität Duisburg-Essen 22 Simulationsmethoden ←→ deterministisch Brownsche Molekulardynamik Dynamik Langevin Dynamik E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. stochastisch Force-bias Monte Carlo Universität Duisburg-Essen Monte Carlo 1 Molekulardynamik • das System verhalte sich hamiltonisch, d. h., es sei durch eine Hamiltonfunktion H = V({qk }) + T ({qk , pk }) beschrieben, aus der sich die Hamiltonschen Bewegungsgleichungen ableiten lassen: ∂H = −ṗi ∂qi ∂H = q̇i ∂pi • in kartesischen Koordinaten hängt die kinetische Energie nur von den {pk } ab: 2 X pk T = T ({pk }) = k 2mk die Bewegungsgleichungen lauten dann: ∂H ∂V = = −ṗi ∂qi ∂qi ∂H ∂T pi = = = q̇i ∂pi ∂pi mi ∂V =⇒ miq̈i = − ∂qi (Äquivalenz der Newtonschen und Hamiltonschen Bewegungsgleichungen) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 2 Molekulardynamik • Ein Hamiltonsches System besitzt konstante Energie E = H, also stellt die Trajektorie von N Teilchen in einem Volumen V (oder äquivalent: der Dichte ρ = N/V eine Serie von Zuständen des Mikrokanonischen Ensembles dar. • wir nehmen an, daß die Zustände repräsentativ sind, daß also der Trajektorienmittelwert einer Observablen O N N N 1 X 1 X 1 X O(Γ(ti)) = O(ti) = O(t0 + i · ∆t) M (O) = N i=1 N i=1 N i=1 eine gute Näherung für den Ensemblemittelwert darstellt. M (O) ist eine Stichprobe im statistischen Sinne. • Annahme der Ergodizität: lim M (O) = hOi = Ō N →∞ also: ein kurzes Stück der Trajektorie sei eine gute Näherung. E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 3 Molekulardynamik • ∆t ist dabei die Diskretisierung, die festlegt, in wieviele Intervalle die Trajektorie zum Zweck der Mittelwertbestimmung zerlegt wird. • ∆t ist nicht frei wählbar: • es muß gewährleistet sein, daß 2 aufeinander folgende Zeitpunkte hinreichend verschiedene Zustände darstellen. • insbesondere ist ∆t nicht gleich der Länge des Integrationszeitschrittes (s.u.). • “hinreichend verschieden” wird später so definiert, daß keine Korrelationen zwischen den Eigenschaften der Zustände existieren. • m.a.W: hat man N Zeitschritte simuliert, so heißt dies nicht, daß man über eine statistische Stichprobe aus N Einzelmessungen verfügt. E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 4 Endliche Differenzmethoden eine Standardmethode zur Lösung gewöhnlicher Differentialgleichungen wie z. B. ∂V({qk }) i = 1, . . . , N miq̈i == ∂qi basiert auf der Approximation der Differentialquotientent durch endliche Differenzenquotienten, z. B. dqi δqi q̇i = ≈ dt δt wobei δt ein kleines aber endliches Zeitintervall, δqi die dazugehörige Differenz der Orte des Teilchens ist, also q(tend) − q(tan) q̇ ≈ tend − tan Wahl von δt: • deutlich kleiner als die Zeit, in der sich das Atom um eine Länge vergleichbar seines Durchmessers bewegt. • deutlich kleiner als die Periode der schnellsten Schwingung (Bewegungsmode), an der das Atom beteiligt ist E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 5 Der Verlet-Algorithmus Zweck: Lösung einer oder mehrerer gekoppelter Differentialgleichungen 2. Ordnung vom Typ ÿ(x) = f (y), also eines Spezialfalles der allgemeinen DGL ÿ(x) = f (ẏ, y, x) Mit y → qi (qi sei eine Koordinate, z. B., x1, y3, z137) und x → t läßt sich das Verfahren auf die Newtonschen EOMs (“equations of motion”) anwenden. In diesem Falle ist fi(qi) die auf die Koordinate qi wirkende Kraft, die sich aus dem Wechselwirkungspotential V ergibt miq̈i(t) = fi(qi) = − E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. ∂V({qk }) ∂qi Universität Duisburg-Essen 6 Verlet-Algorithmus Taylorentwicklung für kurzes Zeitinkrement δt: 1 vorwärts: qi(t + δt) = qi(t) + q̇i(t) · δt + q̈i(t) · (δt)2 ± . . . 2 1 rückwärts: qi(t − δt) = qi(t) + q̇i(t) · (−δt) + q̈i(t) · (−δt)2 ± . . . 2 Aufaddieren: qi(t + δt) + qi(t − δt) = 2qi(t) + q̈i(t) · (δt)2 Nach Umformen erhält man: qi(t + δt) = 2qi(t) − qi(t − δt) + q̈i(t) · (δt)2 hat man qi(t + δt) auf diese Weise bestimmt, so läßt sich daraus qi(t + 2δt) berechnen: mit t0 := t + δt wird qi(t + δt) → qi(t0) und qi(t) → qi(t0 − δt), was man wieder in die Gleichung einsetzen kann. E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 7 Verlet-Algorithmus Startproblem (t = 0): Normalerweise gibt man bei einem Anfangswertproblem im Falle einer DGL 2. Ordnung zwei Größen vor, hier: qi(0) und q̇i(0). Der Algorithmus verlangt stattdessen qi(0 − δt)! Es ist also ein Startschritt erforderlich: 1 t = 0 : qi(δt) = qi(0) + q̇i(0) · δt + fi({qk (0)}) 2 Danach: qi(2δt) = P(qi(δt), qi(0)) und allgemein qi(t + δt) = P(qi(t), qi(t − δt)) mit P(xk , xk−1) = 2xk − xk−1 + f (xk )(δt)2 Bestimmung der Geschwindigkeiten durch Subtraktion der beiden Taylorentwicklungen qi(t + δt) − qi(t − δt) = 2q̇iδt qi(t + δt) − qi(t − δt) also q̇i = 2δt (“zentrale Differenz”) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 8 Verlet-Algorithmus Datenfluss t− δ t t t+ δ t t− δ t t t+ δ t t− δ t t t+ δ t t− δ t q . q q . q q . q q . q f f f f Vorzüge zeitlich umkehrbar einfach t+ δ t t+2 δt t Nachteile Geschwindigkeiten werden “asynchron” berechnet Fehler von q̇ ist 2. Ordnung in δt E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 9 Monte Carlo Methoden (entwickelt während des II. Weltkriegs von von Neumann, Ulam, und Metropolis zur Untersuchung der Diffusion von Neutronen in spaltbaren Materialien ) • Name rührt daher, daß massiver Gebrauch von Zufallszahlen gemacht wird • es gibt eine Vielzahl verschiedener Monte Carlo-Schemata, die vorstellbar und/oder getestet sind. • wichtigstes: Metropolis Monte Carlo Methode • Zweck: Generierung einer Trajektorie im Phasenraum, die Stichproben eines gewählten statistisch-mechanischen Ensembles erstellt. • maW: die Wahrscheinlichkeit, einen Punkt im Phasenraum entlang dieser Trajektorie zu finden, muß konsistent mit der Dichteverteilung ρ des Ensembles sein • letztendlich ist die Trajektorie weniger interessant als die Mittelwerte von Observablen, die makroskopisch meßbar sind: R =⇒ Berechnung von multidimensionalen Integralen vom Typ hOi = E(Γ)ρ(Γ)dΓ • nichttriviale Aufgabe, MC ist die einzige Methode für vieldimensionale Integrale E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 10 Monte Carlo Integration: “hit and miss” Algorithmus Problem: numerische Abschätzung der Fläche des Einheitskreises oder, dazu äquivalent, numerische Bestimmung von π y x • zunächst generiert man einen Satz von Paaren x unabhängiger Zufallszahlen, die von einer unix formen (gleichförmigen) Verteilung von Zufallszahlen auf dem Interval [0; 1] “gezogen” werden. x Jedes Paar von Zufallszahlen bestimmt einen Punkt in der (x,y)-Ebene. √ 2 • als nächstes berechnet man den Abstand r = x + y 2 vom Ursprung x • Vergleiche r mit 1: wenn r ≤ 1, dann hat der “Versuchsschuß” den Kreis getroffen; wenn r > 1, dann hat er ihn verfehlt. E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 11 Monte Carlo Integration: “hit and miss” Algorithmus • das Ergebnis ist statistischer Natur: jeder Punkt (x) hat die gleiche Wahrscheinlichkeit. • man registriert die Zahl τshot der Schüsse und die Zahl τhit der Treffer im roten Gebiet. • offensichtlich gilt: Fläche des Einheitsviertelkreises π τhit ≈ = τshot Fläche des Einheitsquadrates 4 =⇒ π≈ 4τhit τshot • Die Grundlage des Algorithmus ist die Generierung von 2τshot Zufallszahlen (s.u.) • Schätzwert für π hängt von der Zahl der Schüsse ab, der Fehler ist von der Grö√ ßenordnung 1/ τshot [O(τshot−1/2] • =⇒ für 108 Versuche kann man eine Genauigkeit von 1/104, also 4 Stellen erwarten (z. B. 3.14173 statt 3.14159. . .) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 12 Monte Carlo Integration: “Sample Mean Integration” • allgemeiner anwendbar als der “hit and miss”-Algorithmus • genauerer Schätzwert für das Integral x2 Z x2 Z f (x) x1 x1 ρ(x) mit einer beliebigen Wahrscheinlichkeitsverteilungsfunktion ρ. • man betrachte dazu das Integral F = dxf (x) = dxρ(x) • es werde eine Anzahl Versuche τ gemacht, wovon jeder darin besteht, eine Zufallszahl ζτ aus der Verteilung ρ(x) im Intervall [x1; x2] zu ziehen. f (ζτ ) + • offensichtlich gilt: F = ρ(ζτ ) V ersuche h. . .iV ersuche ist der Mittelwert über alle Versuche * E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 13 Monte Carlo Integration: “Sample Mean Integration” √ π Z1 √ 2 • in unserem Beispiel: = dx 1 − x , also f (x) = 1 − x2. 4 0 • einfachste Anwendung: ρ(x) ist uniform 1 wennx1 ≤ x ≤ x2 x −x 2 1 ρ(x) = 0 andernfalls • dann kann F abgeschätzt werden durch F = = = * f (ζτ ) ρ(ζτ ) + = τmax P f (ζτ ) 1 τmax τ =1 x −x 2 1 1 r P x2 −x1 τmax τmax τ =1 1 1 τmax X τmax τ =1 f (ζτ ) ρ(ζτ ) x2 − x1 τmax X = f (ζτ ) τmax τ =1 − ζτ 2 (vgl. Simpson-Regel) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 14 Monte Carlo Integration: “Sample Mean Integration” • natürlich ist das Verfahren für eine einfache 1-dimensionale Integration nicht konkurrenzfähig zur normalen numerischen Integration (mit Hilfe der Simpson-Regel oder der Trapezregel) • mit Hilfe der Simpson-Regel würden z. B. schon 104 Schritte ausreichen, um π auf 7 Stellen zu berechnen (im Ggs. zu 108 Schritten für eine Genauigkeit von 4 Stellen) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 15 Monte Carlo Integration: “Sample Mean Integration” • aber: für die vieldimensionalen Integrale der statistischen Mechanik ist die “Sample Mean Integration” die einzige sinnvolle Methode, eine vernünftige Wahl von ρ(x) vorausgesetzt. Z • man betrachte z. B. das Konfigurationsintegral ZN V T = d~r exp(−βV({qk }) für ein System aus nur N = 100 Atomen in einem Würfel der Kantenlänge L (V = L3). • d~r repräsentiert eine 300-dimensionale Integration! eine extrem ungenaue Integration mit der Simpson-Regel würde 10 Funktionsauswertungen in jeder “Richtung” erfordern, um den Bereich [0; L] vernünftig aufzuspannen =⇒ 10300 Funktionsauswertungen unmöglich • außerdem würde der Integrand für die überwältigende Mehrzahl der Funktionsauswertungen aufgrund eines ungünstigen Boltzmannfaktors (ungünstige Überlappung von Atomen, sogenannte “bad contacts”) praktisch gleich Null sein und nur wenige Punkte (Konfigurationen) würden signifikant zum Integral beitragen E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 16 Monte Carlo Integration: “Sample Mean Integration” Das “Sample-mean Integration” Verfahren sähe also folgendermaßen aus: • wähle eine zufällige Konfiguration (Punkt im 300-dimensionalen Konfigurationsraum), indem 300 Zufallszahlen im Bereich [0; L], als Tripel zusammengefasst, die Koordinaten jedes Atoms bestimmen • berechne potentielle Energie V(τ ) und den Boltzmannfaktor • wiederhole diese beiden Schritte viele Male. • das Konfigurationsintegral kann dann abgeschätzt werden mittels ZN V T V N τmax X exp[−βV(τ )] = τ =1 τmax • man kann erwarten, daß man weniger als 10300 Konfigurationen für eine vernünftige Schätzung benötigt • aber wieder würde die überwältigende Mehrzahl der Konfigurationen zu einem Boltzmannfaktor ≈ 0 führen (“unnötige Arbeit”) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 17 Monte Carlo Integration: “Sample Mean Integration” • =⇒ für dichte Flüssigkeiten übersteigt der Rechenzeitbedarf der Methode die Fähigkeiten heutiger (und wohl auch zukünftiger) Computer • Die Methode wurde angewandt auf die Untersuchung der strukturellen Eigenschaften von Fluiden aus harten Kugeln bei niedriger Dichte (Alder et al, 1955) • die Probleme mit den vieldimensionalen Integralen der statistischen Mechanik kommen daher, daß die Verteilung extrem scharfe Maxima der Dichtefunktion besitzt und riesige Regionen die Dichte ρ ≈ 0 besitzen! • Analoge Probleme treten bei der Berechnung von Ensemblemittelwerten auf: d~rA exp(−βV({~r}) = R ≈ d~r exp(−βV({~r}) R hAiN V T τmax P A(τ ) exp(−βV(τ )) τ =1 τmax P τ =1 exp(−βV(τ )) • für realistische Dichten kann das Problem gelöst werden, indem die Zufallskoordinaten von einer nichtgleichförmigen Verteilung ermittelt werden. • =⇒ Importance Sampling (Metropolis-Sampling) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 18 Importance Sampling Zufallszahlen werden von einer nichtgleichförmigen Verteilung ρ(x) ausgewählt, wodurch die Funktionsauswertungen auf die Regionen im Phasenraum konzentriert werden, die die wichtigen (“important”) Beiträge zur Zustandssumme machen: Z hAiN V T = dΓρN V T (Γ)A(Γ) 1 exp[−βV(Γ)]. Der Integrand lautet also A(Γ)ρN V T (Γ). ZN V T Sammelt man nun Konfigurationen von einer (frei wählbaren) Verteilung ρ, so kann man das Integral abschätzen als mit ρN V T (Γ) = hAiN V T = h AρN V T iV ersuche ρ Für die meisten Funktionen A(Γ) ist der Integrand ρN V T A nur dort signifikant, wo ρN V T signifikant ist. In diesem Falle sollte also die Wahl ρ = ρN V T eine akkurate Abschätzung des Integrals ermöglichen. (funktioniert meistens, nicht immer!) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 19 Metropolis Monte Carlo • im Falle ρ = ρN V T gilt also hAiN V T = hAiV ersuche • wir haben das Problem nur neu formuliert, jedoch nicht gelöst! • Das Problem lautet nun: Wie kann ich eine kanonische Verteilung generieren? • Ein solches Verfahren wurde von Metropolis et al. (1953) entwickelt. • die Schwierigkeit: Wie findet man eine Methode, die eine Sequenz von zufälligen Zuständen so generiert, daß nach Ende der Simulation jeder Zustand mit der adäquaten Wahrscheinlichkeit vorkam? • Dies ist möglich, und sogar so, daß man nie den Normierungsfaktor von ρN V T , also die Zustandssumme selbst, berechen muß. • die Methode: Generierung einer Markov-Kette E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 20 Markov-Ketten Definition: Eine Markov-Kette ist eine Sequenz von Versuchen (“Versuchskonfigurationen”), die folgenden zwei Bedingungen genügt: a) Das Ergebnis jedes Versuchs gehört zu einer endlichen Menge möglicher Ergebnisse, {Γ1, Γ2, Γ3, . . . , Γm, . . . , Γn, . . .}, dem Zustandsraum. b) Das Ergebnis jedes Versuchs hängt allein vom unmittelbar vorhergehenden Zustand ab. • 2 Zustände Γm und Γn sind über eine Übergangswahrscheinlichkeit Πmn verknüpft, die die Wahrscheinlichkeit für den Übergang vom Zustand Γm nach Γn (kurz m nach n) darstellen. • in einem endlichen Zustandsraum, kann man die Verteilungsfunktion ρ als Vektor ρ~ = (ρ1, ρ2, . . . , ρn) charakterisieren • die Πmn sind dann die Elemente einer Matrix Π E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 21 Markov-Ketten • man startet mit einer Anfangsverteilung ρ~ (1) . • die Verteilungsfunktion nach einem Schritt: ρ~ nach 2 Schritten: ρ~ . . . ρ~ and so on (2) (3) (4) = Π · ρ~ (1) = ρ~ (2) · Π = ρ~ (1) · Π · Π = ρ~ (1) · Π · Π · Π • schließlich wird dies zu einer Grenzverteilung ρ~ konvergieren: ρ~ = τlim ρ~ →∞ (1) Πτ • die Wahrscheinlichkeit, daß ein Übergang vom Zustand m in irgendeinen Zustand (des endlichen Zustandsraumes) passiert, inkl. des Übergangs m → m (kein Übergang), ist gleich 1 (100%). • eine solche Matrix Π mit sich zu 1 addieren). X n Πmn = 1 heißt stochastische Matrix (da ihre Zeilen E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 22 Markov-Ketten • Wenn also die Grenzverteilung existiert, dann muß offensichtlich folgende Eigenwertgleichung gelten: ρ~ · Π = ρ~ = ρ~ · 1 P oder m ρmΠmn = ρn • Perron-Frobenius-Theorem: In einer irreduziblen Markovkette (eine, in der jeder Zustand von jedem anderen Zustand aus erreicht werden kann) gibt es einen linksseitigen Eigenwert 1, für den der Eigenvektor gleich der Grenzverteilung ist. Die anderen Eigenwerte sind kleiner als 1 und bestimmen die Konvergenzrate. • ρ ist unabhängig von der Anfangsverteilung ρ~ (1) • Dies ist eine extrem wichtige Eigenschaft: Konsequenz: thermodynamische Ergebnisse hängen nicht von der Wahl des Anfangszustand ab! E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 23 Beispiel für eine Markovkette Zuverlässigkeit des Rechenzentrums: Man beobachtet: • Wenn heute alles funktioniert, dann wird es auch morgen mit 60%iger Wahrscheinlichkeit funktionieren! • Wenn heute nichts geht, dann ist die Wahrscheinlichkeit 70%, daß morgen auch nichts funktioniert! Der Zustandsraum hat 2 Zustände (1. Zustand: ↑ 2. Zustand: ↓) Π = 0.6 0.4 0.3 0.7 Wie sehen die Aussichten aus, in den nächsten Tagen arbeiten zu können? E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 24 Beispiel für eine Markovkette Fall I: Heute funktioniert der Rechner also: ρ~ (1) = (1, 0) morgen? ρ~ (2) übermorgen? ρ~ (3) ρ~ (4) ρ~ (5) ρ~ = ρ~ (1) · Π = ρ~ (2) · Π = ρ~ (3) · Π = ρ~ (4) · Π ... (1) τ = τlim ρ ~ · Π →∞ (good news?) = = = = (0.6, 0.4) (0.48, 0.52) (0.444, 0.556) (0.4332, 0.5668) =(0.4286,0.5714) = (3/7, 4/7) E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 25 Beispiel für eine Markovkette Fall II: Heute funktioniert der Rechner nicht (bad news?) also: ρ~ (1) = (0, 1) morgen? ρ~ (2) = ρ~ (1) · Π = (0.3, 0.7) übermorgen? ρ~ (3) = ρ~ (2) · Π = (0.39, 0.61) ρ~ (4) = ρ~ (3) · Π = (0.417, 0.583) ρ~ (5) = ρ~ (4) · Π = (0.4251, 0.5749) =⇒ In vier Tagen sind unsere Chancen, arbeiten zu können, praktisch unabhängig von der heutigen Situation! E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 26 Metropolis Monte Carlo • für das kanonische Ensemble kennen wir die stochastische Matrix der Übergangswahrscheinlichkeiten nicht • stattdessen kennen wir aber die Grenzverteilung ρn exp(−βVn) = = exp[−β(Vn − Vm)] ρm exp(−βVm) • es gibt viele Möglichkeiten, dies zu erreichen. =⇒ Wahlfreiheit • insbesondere können wir die unnötig strenge Bedingung der mikroskopischen Reversibilität fordern: Πmn ρn = ρmΠmn = ρnΠnm ⇐⇒ ρm Πnm das bedeutet, daß das Verhältnis der direkten Übergangswahrscheinlichkeiten zwischen den beiden Zuständen gleich ρm/ρn ist: die anderen Übergänge müssen also das korrekte Verhältnis nicht erzwingen. E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 27 Metropolis Monte Carlo Die Wahl von Metropolis et al.: Πmn = αmn wenn ρn ≥ ρm Πmn = αmn(ρn/ρm) wenn ρn < ρm X Πmm = 1 − Πmn und m 6= n und m = 6 n (also Πmn < αmn) n6=m αmn ist eine symmetrische stochastische Matrix: αmn = αnm meist wird αmn = const. gewählt. E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 28 Metropolis Monte Carlo Beweis: • nach Voraussetzung ist αmn eine stochastische Matrix, also • daher gilt: P m6=n P m αmn = 1 Πmn < 1, weil der Faktor ρn/ρm nur dann benutzt wird, wenn er kleiner als 1 ist. • also Πmn < αmn für alle m 6= n. • man definiert Πnn := 1 − P Πmn, m6=n also ist Π eine stochastische Matrix. • wenn ρn > ρm, dann ist Πmn = αmn und Πnm = αnm(ρm/ρn) • also: Πnmρn = αnmρm = αmnρm = Πmnρm • und damit ist auch die mikroskopische Reversibilität erfüllt und jeder Zustand erscheint mit der korrekten kanonischen Wahrscheinlichkeit E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 29 Metropolis Monte Carlo: Implementation • starte von einem Zustand m, definiert durch Angabe aller Atomkoordinaten. • * suche zufällig ein Atom aus • ziehe 3 Zufallszahlen aus dem Intervall [0; 1] und verschiebe das ausgewählte Atom entsprechend dieser Zufallszahlen innerhalb eines Volumens (2δrmax)3 um die Position des gewählten Atoms nach der Verschiebung befindet sich das Atom irgendwo (mit gleicher Wahrscheinlichkeit) in der schraffierten Region δ r max E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 30 Metropolis Monte Carlo: Implementation • dieser Schritt definiert α: αmn = 1/NR wenn die Endposition innerhalb des schraffierten Bereiches αmn = 0 andernfalls NR ist die große (aber, wegen der endlichen Genauigkeit der Zahlendarstellung im Rechner, immer endliche) Zahl der Zustände mit dem Atom i irgendwo in der schraffierten Region. • δrmax ist ein geeignet gewählter Parameter • berechne (Vn − Vm) und daraus ρn/ρm • Fall α wenn ρn > ρm, dann akzeptiere die Verschiebung und gehe zurück zu * • wenn ρm ≥ ρn, dann akzeptiere die Verschiebung mit einer Wahrscheinlichkeit ρn/ρm = exp[−β(Vn − Vm)] folgendermaßen: a) berechne exp[−β(Vn − Vm)] (< 1 und > 0) b) ermittle eine Zufallszahl im Intervall [0; 1]. E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 31 Metropolis Monte Carlo: Implementation • Fall β wenn die Zufallszahl kleiner als exp[−β(Vn − Vm)] ist, dann akzeptiere die Verschiebung und gehe zurück zu * • Fall γ wenn nicht, dann akzeptiere die Verschiebung nicht, man ändere also die Koordinaten von Atom i nicht, zähle den Zustand m noch einmal und gehe zurück zu * (Πmm-Fall!) Monte Carlo Simulation: dieser Zyklus wird millionen- oder milliardenfach wiederholt E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 32 Bemerkungen • δrmax wird normalerweise so gewählt, daß die mittlere Akzeptanzrate ungefähr 50 % beträgt: – sehr hohe Akzeptanz bedeutet geringe Energieunterschiede und damit langsame Bewegung durch den Konfigurationsraum (δrmax ist klein!) – sehr niedrige Akzeptanz bedeutet, daß die meisten Energieänderungen sehr ungünstig sind, weil δrmax zu groß ist und daher häufig eine signifikante Überlappung des Atoms i mit anderen Atomen zustande kommt • eine typische Simulation dauert 105 bis 106 Durchgänge (1 Durchgang (“pass”) = eine versuchte Verschiebung / Atom) • Akzeptanzrate von 0.5 ist nicht notwendigerweise das Optimum. Dies hängt von Systemgröße, Wechselwirkungsenergie, Temperatur, Dichte etc. ab. • Man kann die zugrundeliegende stochastische Matrix α auch verändern, z. B. so, daß mehrere oder alle Atome gleichzeitig verschoben werden. E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 33 Bemerkungen • man kann nicht über alle Zustände summieren =⇒ ZN V T ist nicht direkt berechenbar • Konsequenz: es gibt kein direktes Verfahren, um die thermodynamischen Größen “statistischer Natur” wie A, S und µ zu berechnen. • dies gelingt mit Hilfe anderer Techniken wie Thermodynamische Integration Umbrella Sampling Großkanonische Monte Carlo-Methoden E. Spohr, Master-Vorlesung Theoretische Chemie SS 2008. Universität Duisburg-Essen 34