Dr. T.-P. Hack Inst. f. Theoretische Physik Wintersemester 2015/16 TP4 - Quantenmechanik 2 / Thermodynamik und Statistik 2 (StEx LA) Vorlesungsskript (Stand: 2. Februar 2016) Inhaltsverzeichnis 1 Quantenmechanik 2 1.1 Wiederholung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Motivation: Quantenmechanik im Alltag . . . . . . . . . . . . . . . . . . 1.1.2 Der konzeptionelle und mathematische Rahmen der Quantenmechanik 1.2 Drehimpulsaddition & allgemeine Drehimpulskopplung . . . . . . . . . . . . . 1.2.1 Kombination von Systemen, Tensorprodukt . . . . . . . . . . . . . . . . 1.2.2 Drehimpulsaddition: allgemeiner Fall . . . . . . . . . . . . . . . . . . . 1.2.3 Allgemeine Drehimpulskopplung . . . . . . . . . . . . . . . . . . . . . . 1.2.4 Drehimpulsaddition: Spin 1/2 und Spin 1/2 . . . . . . . . . . . . . . . . 1.2.5 Drehimpulsaddition: Bahndrehimpuls und Spin 1/2 . . . . . . . . . . . . 1.3 Teilchen im elektromagnetischen Feld . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Hamiltonoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2 Normaler Zeemann-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.3 Aharonov-Bohm-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Zeitunabhängige Störungstheorie . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Allgemeine Herleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Harmonischer Oszillator im Gravitationsfeld . . . . . . . . . . . . . . . 1.4.3 Feinstruktur des Wasserstoffatoms . . . . . . . . . . . . . . . . . . . . . 1.5 Zustandsgemische und Dichtematrizen . . . . . . . . . . . . . . . . . . . . . . 1.5.1 Die Dichtematrix eines reinen Zustandes . . . . . . . . . . . . . . . . . 1.5.2 Gemischte Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.3 Unterschiede zwischen reinen und gemischten Zuständen . . . . . . . 1.5.4 Die Zeitentwicklung gemischter Zustände . . . . . . . . . . . . . . . . 1.6 EPR-Paradoxon, Bell’sche Ungleichungen und Quantenkryptographie . . . . . 1.6.1 Das EPR-Paradoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2 Die Bell’sche Ungleichung . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.3 Verschränkte Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 3 4 18 19 22 25 27 29 29 29 32 33 37 37 40 41 44 44 47 49 50 52 52 54 58 1.6.4 Quantenkryptographie . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Vielteilchensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.1 Vielteilchenwellenfunktionen und Vielteilchen-Schrödingergleichung 1.7.2 Ununterscheidbare Teilchen . . . . . . . . . . . . . . . . . . . . . . . . 1.7.3 Das Heliumatom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.4 Das Wasserstoffmolekül . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.5 Atomaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Energiebänder in Festkörpern . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8.1 Gitter und reziprokes Gitter . . . . . . . . . . . . . . . . . . . . . . . . 1.8.2 Translationoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8.3 Bloch-Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8.4 Die quasifreie Elektronen-Approximation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Thermodynamik und Statistik 2 2.1 Wiederholung: phänomenologische Thermodynamik . . . . . . . . . . . . . . . . . 2.1.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 Der nullte Hauptsatz: die Existenz der Temperatur . . . . . . . . . . . . . . . 2.1.3 Der erste Hauptsatz: Energieerhaltung . . . . . . . . . . . . . . . . . . . . . 2.1.4 Der zweite Hauptsatz: Entropie und irreversible Prozesse . . . . . . . . . . . 2.1.5 Der dritte Hauptsatz: Unerreichbarkeit des Temperaturnullpunktes . . . . . . 2.1.6 Gleichgewichtsbedingungen und Konkavität/Konvexität . . . . . . . . . . . . 2.1.7 Zustandsgleichungen und thermodynamische Potentiale . . . . . . . . . . . 2.2 Phasengleichgewichte und Phasenübergänge . . . . . . . . . . . . . . . . . . . . . 2.2.1 Phasenübergang flüssig/gasförmig beim van der Waals-Gas . . . . . . . . . 2.3 Ensembles in der statistischen Mechanik . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Wiederholung: Der Zustandsbegriff in der statistischen Mechanik . . . . . . 2.3.2 Das mikrokanonische Ensemble, Boltzmann- und von Neumann-Entropie . . 2.3.3 Das kanonische Ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4 Der Fockraum und das großkanonische Ensemble . . . . . . . . . . . . . . . 2.4 Bose(-Einstein) und Fermi(-Dirac) Statistik . . . . . . . . . . . . . . . . . . . . . . . 2.5 Ideale Quantengase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Das ideale Fermigas, weiße Zwerge, Neutronensterne und schwarze Löcher 2.5.2 Das ideale Bosegase, Strahlungsgesetze, Bose-Einstein-Kondensation . . . . 2.6 Ferromagnetismus, das Ising-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . 2 59 61 62 63 66 68 70 71 72 74 75 76 82 82 82 84 84 87 89 89 91 94 96 101 101 103 105 107 110 112 113 115 116 1 Quantenmechanik 2 1.1 Wiederholung 1.1.1 Motivation: Quantenmechanik im Alltag Es wird oft gesagt, dass Quantenmechanik mikroskopische Phänomene beschreibt. Tatsächliche gibt es aber, abgesehen von den bekannten und eher akademischen Beispielen des Doppelspaltoder Stern-Gerlach-Experimentes, zahlreiche aus dem Alltag bekannte Phänomene oder technische Anwendungen in denen quantenmechanische Effekte direkt makroskopisch beobachtbar sind. • Laser (in DVD-Playern, Druckern, Barcodescannern, ...): Die Energieniveaus von Elektronen in Atomen sind diskret bzw. quantisiert. “Fällt” ein angeregtes Elektron in einen niederenergetischeren Zustand zurück, wird dabei Licht einer der Energiedifferenz entsprechenden definierten Frequenz (Farbe) emittiert. Ein Laser ist eine Lichtquelle die auf diesem Prinzip beruht. • Halbleiter (in LEDs, Solarzellen, Computerchips, Digitalkameras, ...): In Festkörpern bzw. Kristallen ergeben sich für die Elektronen komplexere Energieniveaus als in einzelnen Atomen; tatsächlich gibt es sogenannte erlaubte Energiebänder, wobei das Leitungsband ein Energieband bezeichnet, das Elektronen enthalten kann die beweglich sind und daher Strom leiten können. Bei bestimmten Kristallen ist dieses Band durch eine endliche aber nicht zu große Lücke von den niederenergetischeren Bändern getrennt. Man spricht dann von einem Halbleiter da z.B. durch thermische Anregungen Elektronen in das Leitungsband gehoben werden können und das Material dann von einem Isolator zu einem Leiter wird. • Permanentmagnete (in Festplatten, Lautsprechern, Elektromotoren, ...): Elektronen besitzen einen intrinsischen Drehimpuls, den sogenannten Spin, und damit ein intrinsisches magnetisches Moment. In Ferromagneten bzw. Permanentmagneten sind diese Drehimpulse in großen Volumina parallel ausgerichtet, so dass sich die mikroskopischen magnetischen Momente zu einem makroskopischen addieren. • Tageslicht (Tunneleffekt bei Kernfusion in der Sonne): bei der Kernfusion in der Sonne verschmelzen vier Protonen zu einem Heliumkern wobei die überschüssige Energie u.a. als Licht abgestrahlt wird. Dafür müssen sich die geladenen Protonen sehr nahe kommen und entsprechend die elektrostatische Abstoßung überwinden. Man kann abschätzen, dass die thermische kinetische Energie der Protonen dafür nicht ausreicht, die Kernfusion im Rahmen der klassischen Physik also nicht möglich ist. Sie wird erst möglich durch das “quantenmechanische Tunneln” durch die Potentialbarierre. • Quantencomputer und Quantenkryptographie: quantenmechanische Effekte wie die Verschränkung beziehungsweise die Beeinflussung des Zustandes durch die Messung ma3 chen es möglich effizientere und schnellere logische Schaltkreise und Verschlüsselungsalgorithmen zu entwickeln. Die Grundlagen dieser Effekte und Anwendungen werden wir teilweise in der Vorlesung diskutieren. 1.1.2 Der konzeptionelle und mathematische Rahmen der Quantenmechanik Analog zur klassischen Mechanik möchten wir in der Quantenmechanik Observablen und Zustände eines physikalischen Systems modellieren. Observablen sind beobachtbare Größen wie z.B. Energie, Impuls, Ort, Drehimpuls, und entsprechen in Laborsituationen geeigneten Messapparaturen. Zustände sind die möglichen Konfigurationen eines physikalischen Systems; in Laborsituationen entsprechen sie den Präparationen eines physikalischen Systems, die in einem Experiment ausgemessen werden. Zustände, Hilberträume. In der Quantenmechanik werden (reine) Zustände durch Vektoren in einem Hilbertraum mathematisch modelliert. Ein Hilbertraum H ist ein komplexer Vektorraum mit einem einer hermiteschen, positiv definiten Form, einem Skalarprodukt (·, ·), d.h. für beliebige Vektoren v1 , v2 , v3 ∈ H und komplexe Zahlen a1 , a2 ∈ C: • (v1 , v2 ) ∈ C. Das Skalarprodukt weist zwei Vektoren eine komplexe Zahl zu. • (v1 , v2 )∗ = (v2 , v1 ). Komplexe Konjugation vertauscht die Einträge im Skalarprodukt. Wir erinnern uns, dass für a ∈ C mit a = x + iy , x, y ∈ R die komplexe Konjugation definiert ist als a∗ = x − iy . • (v3 , a1 v1 + a2 v2 ) = a1 (v3 , v1 ) + a2 (v3 , v2 ). Das Skalarprodukt ist linear im 2. Eintrag. • (a1 v1 + a2 v2 , v3 ) = a∗1 (v1 , v3 ) + a∗2 (v2 , v3 ). Das Skalarprodukt ist antilinear im 1. Eintrag. (Das folgt bereits aus den zwei vorherigen Eigenschaften.) 4 • (v1 , v1 ) = 0 ⇔ v1 = 0 ∈ H . (v1 , v1 ) ≥ 0 , Das Skalarprodukt ist positiv definit und das Skalarprodukt eines Vektors mit sich selbst verschwindet nur für den Nullvektor. Aus der letzten Eigenschaft folgt, dass man aus dem Skalarprodukt eine Norm konstruieren kann. Diese ist definiert als p kv1 k = (v1 , v1 ) . Jeder Hilbertraum besitzt (mindestens) eine normierte Orthogonalbasis oder Orthonormalbasis, d.h. eine Familie von Vektoren1 {v1 , v2 , . . . , vd−1 , vd } wobei die Anzahl der Vektoren d der Dimension des Hilbertraumes entspricht. Diese Vektoren sind paarweise orthogonal und haben Norm 1 (vm , vn ) = δmn , wobei δmn das Kronecker-Delta ist δmn = 1 0 wenn m = n, wenn m = 6 n. Eine Basis ist vollständig, d.h. jeder Vektor v ∈ H lässt sich als Linearkombination der Basisvektoren schreiben. v= d X an vn n=1 Aus der Orthogonalität folgt, dass die Entwicklungskoeffizienten sich berechnen lassen als an = (vn , v) . Folglich hängen sie von der gewählten Basis ab. In der Quantenmechanik haben wir es mit endlichdimensionalen (d < ∞) und unendlichdimensionalen (d = ∞) Hilberträumen zu tun. Beispiele sind: • H = C2 . Die Zustände des Spins eines Elektrons werden durch Vektoren in diesem zweidimensionalen Hilbertraum modelliert. Das Skalarprodukt ist a1 b , 1 = a∗1 b1 + a∗2 b2 . a2 b2 1 Für mathematisch Interessierte: wir haben hier angenommen, dass der Hilbertraum separabel ist, d.h. eine abzählbare Basis besitzt. Das ist in der Physik in der Regel der Fall. 5 Eine mögliche Basis ist 1 0 , . 0 1 Der erste (zweite) Vektor dieser Basis wird üblicherweise mit dem Zustand “spin up” (“spin down”) identifiziert. • H = L2 (R), der Raum der quadratintegrablen Funktionen auf R. Die Zustände – die möglichen Wellenfunktionen – eines Punktteilchens in einer Raumdimension werden durch Vektoren in diesem unendlichdimensionalen Hilbertraum modelliert. Elemente von L2 (R) sind also Funktionen2 ψ:R→C für die gilt Z Z ∗ dx ψ(x) ψ(x) = dx |ψ(x)|2 < ∞ . R R Das Skalarprodukt auf L2 (R) is für beliebige ψ1 , ψ2 ∈ L2 (R) gegeben durch Z (ψ1 , ψ2 ) = dx ψ1 (x)∗ ψ2 (x) . R Bei den Elementen von L2 (R) handelt es sich also um Funktionen mit endlicher Norm kψk < ∞. Eine mögliche Basis von L2 (R) ist gegeben durch die Eigenfunktionen des Hamiltonoperators des harmonischen Oszillators. • H = L2 (R3 ), der Raum der quadratintegrablen Funktionen auf R3 . Dieser unendlichdimensionale Hilbertraum ist analog zum vorherigen Beispiel definiert und modelliert die Zustände eines Punktteilchens in drei Raumdimensionen. Für einen Vektor ψ ∈ H und eine beliebige komplexe Zahl a ∈ C interpretieren wir ψ und aψ als denselben physikalischen Zustand. Es ist daher zweckmäßig, in der Regel mit normierten Vektoren zu rechnen, d.h. ohne Beschränkung anzunehmen, dass kψk = 1. Im Fall H = L2 (R3 ) ist es daher sinnvoll, die Wellenfunktion ψ(~ x) derart zu interpretieren, dass das Betragsquadrat 2 |ψ(~x)| die Wahrscheinlichlichkeit angibt, das Punktteilchen am Ort ~x ∈ R3 vorzufinden (und analog im Fall H = L2 (R)). kψk = 1 ist dann gleichbedeutend damit, dass das Teilchen sich irgendwo im Raum befinden muss. Die Tatsache, dass wir Zustände als Elemente eines Hilbertraums, also eines Vektorraums, modellieren, impliziert insbesondere dass das Superpositionsprinzip gilt: Die Summe ψ1 +ψ2 von zwei physikalischen (reinen) Zuständen ψ1 , ψ2 ist wieder ein gültiger Zustand. Alle Vektoren des Hilbertraums entsprechen also möglichen Zuständen. Tatsächlich gibt es aber Zustände, die sich nicht durch Vektoren in einem Hilbertraum modellieren lassen. Letztere entsprechen den sogenannten reinen Zuständen, in Laborsituationen Für die mathematisch Interessierten: Elemente von L2 (R) sind eigentlich sog. Äquivalenzklassen von Funktionen, siehe z.B. das QM1 Skript von Fredenhagen oder das Buch von Münster. 2 6 entsprichen diese den idealen Präparationen des Systems (z.B. ist ein perfektes Vakuum ein reiner Zustand im wahrsten Sinne des Wortes). Darüber hinaus gibt es aber noch die sogenannten gemischen Zustände oder Zustandsgemische. Diese sind u.a. relevant für die Thermodynamik und werden später diskutiert. Observablen, Operatoren. In der Quantenmechanik werden Observablen durch lineare Operatoren auf dem betrachteten Hilbertraum modelliert. Lineare Operatoren sind lineare Abbildungen die Vektoren auf Vektoren abbilden. Im Fall von endlichdimensionalen Hilberträumen mit Dimension d sind das einfach d × d–Matrizen. Im Fall von unendlichdimensionalen Hilberträumen kann man sich Operatoren zwar als unendlichdimensionale Matrizen vorstellen (wie Born, Heisenberg und Jordan in ihren frühen quantenmechanischen Arbeiten zur “Matrizenmechanik”), manchmal ist das aber nicht zweckmässig. Die Matrixelemente Amn eines Operators A (auf einem endlich- oder unendlichdimensionalen Hilbertraum H ) bezüglich einer Basis {ψ1 , . . . , ψd } sind definiert als Amn = (ψm , Aψn ) . Eine besondere Klasse von Operatoren sind hermitesche Operatoren. Dazu definieren wir das (hermitesch) Adjungierte A† eines Operators A3 für beliebige (geeignete) ψ1 , ψ2 ∈ H als (ψ1 , A† ψ2 ) = (Aψ1 , ψ2 ) . Für die Matrixelemente von A und A† gilt A† mn = A∗nm . Ein Operator wird hermitesch genannt, wenn A† = A gilt. In der Literatur spricht man auch oft von selbstadjungierten Operatoren. Tatsächlich gibt es im Fall von unendlichdimensionalen Hilberträumen einen mathematischen Unterschied zwischen “hermitesch” und “selbstadjungiert” auf den wir in dieser Vorlesung nicht näher eingehen wollen. Mathematisch Interessierte können z.B. im QM1-Skript von Fredenhagen oder im Buch von Münster weitere Details finden. Hermitesche Operatoren besitzen im Gegensatz zu allgemeinen linearen Operatoren reelle Eigenwerte (s. Aufgabe 1.1). Dabei nennen wir einen Vektor ψ ∈ H , ψ 6= 0 der für einen Operator A und eine komplexe Zahl a ∈ C Aψ = aψ erfüllt, einen Eigenvektor (oder Eigenzustand) des Operators A zum Eigenwert a. Man kann ebenfalls zeigen, dass Eigenvektoren eines hermiteschen Operators zu unterschiedlichen Eigenwerten orthogonal sind (s. Aufgabe 1.1). Darüber hinaus gilt sogar, dass die Eigenvektoren eines 3 sprich: “A dagger” 7 selbstadjungierten Operators eine Basis des Hilbertraums bilden.4 In dieser Basis {ψ1 , . . . , ψd } gilt für die Matrixelemente des selbstadjungierten Operators A: Amn = an δmn wobei an der Eigenwert zum Eigenvektor ψn ist. Amn sind also die Matrixelemente einer Diagonalmatrix, daher spricht man beim Finden der Eigenvektoren und Eigenwerte von A vom Diagonalisieren des Operators A. Ein Postulat der Quantenmechanik ist, dass Messwerte Eigenwerten eines Operators entsprechen, der die entsprechende Observable modelliert. Da Messwerte immer reelle Zahlen sind, modelliert man in der Quantenmechanik physikalische Observablen durch hermitesche Operatoren. Dirac-Notation. Eine suggestive Notation für Vektoren, Operatoren, Skalarprodukte und Matrixelemente ist folgende Notation von Dirac, die wir im Folgenden verwenden werden. • Vektoren ψ ∈ H schreiben wir als |ψi (“ket”). Im Fall einer Orthonormalbasis {ψ1 , . . . , ψd } schreiben wir in der Regel |ψn i als |ni. Einen Eigenzustand zum Eigenwert a schreiben wir oft als |ai. • Skalarprodukte (ψ1 , ψ2 ) schreiben wir als hψ1 |ψ2 i. Dabei ist hψ| (“bra”) gleichbedeutend mit (|ψi)† , dem hermitesch adjungierten (oder dualen) Vektor zum Vektor |ψi. • Matrixelemente Amn = (ψm , Aψn ) schreiben wir als hψm |A|ψn i bzw. hm|A|ni. • Die Vollständigkeit einer Basis {ψ1 , . . . , ψd }, lässt sich ausdrücken durch X 1= |nihn| n wobei 1 der Einsoperator ist und |nihn| der Projektor auf den Zustand |ni. Hier und im P Pd Folgenden werden wir die Summe n=1 vereinfachend als n notieren. Beispiel: Für H = C2 mit Orthonormalbasis |1i = ist z.B. 1 , 0 |2i = 0 1 † 1 0 1 1 1 1 0 = , |1ih1| = = 0 0 0 0 0 4 Für mathematisch Interessierte: Im Allgemeinen gilt das nicht für hermitesche Operatoren die nicht selbstadjungiert sind. Des Weiteren gilt die Aussage für selbstadjungierte Operatoren so nur für den Fall eines diskreten Spektrums, d.h. benachbarte Eigenwerte sind durch einen endlichen Abstand getrennt. Im Fall eines kontinuierlichen Spektrums (z.B. beim Hamiltonoperator des freien Teilchens) gibt es keine echten Eigenvektoren, die Elemente des Hilbertraums sind und damit endliche Norm haben sondern nur sogenannte schwache Eigenvektoren die formal unendliche Norm haben (z.B. ebene Wellen). 8 wobei der letzte Schritt sich aus direkter Matrixmultiplikation ergibt. |1ih1| ist also tatsächlich ein Operator, der wegen |1ih1| (a1 |1i + a2 |2i) = |1i (a1 h1|1i + a2 h1|2i) = a1 |1i , oder äquivalent in Matrix-/Vektorschreibweise 1 0 a1 a1 = , 0 0 a2 0 einen beliebigen Vektor |vi = a1 |1i + a2 |2i auf a1 |1i abbildet, also auf den |1i-Zustand projiziert. Erwartungswerte, Messung, Wahrscheinlichkeitsinterpretation. und einen selbstadjungierten Operator A nennen wir Für einen Vektor |ψi hAiψ = hψ|A|ψi den Erwartungswert der Observable A im Zustand ψ . Dieser Erwartungswert entspricht in der Regel nicht einem direkten Messwert sondern muss statistisch interpretiert werden, da wie schon vorweggenommen ein Messwert eines einzelnen Experimentes immer einem konkreten Eigenwert entspricht. Tatsächlich wird in der Quantenmechanik postuliert, dass bei der Messung der Observable A in einem Zustand |ψi dieser Zustand in einen Eigenzustand der Observable A übergeht (Zustandsreduktion bzw. der Spezialfall des “Zusammenbruchs der Wellenfunktion” bei der Messung des Ortes). Wir können |ψi nach den Eigenvektoren |ni des Operators A entwickeln |ψi = 1|ψi = X |nihn|ψi = n X hn|ψi|ni . n Das Betragsquadrat |hn|ψi|2 des Entwicklungskoeffizienten interpretieren wir als Wahrscheinlichkeit, dass der Zustand |ψi bei der Messung von A in den Eigenzustand |ni übergeht. Tatsächlich gilt X X hψ|nihn|ψi = hψ|1|ψi = hψ|ψi = 1 . |hn|ψi|2 = n n Entsprechend gilt für den Erwartungswert hAiψ = hψ|A|ψi = hψ|1A1|ψi = X hψ|nihn|A|mihm|ψi = n,m X n,m hψ|nian δmn hm|ψi = X an |hn|ψi|2 . n Mit der Wahrscheinlichkeit |hn|ψi|2 wird also bei der Messung von A der (Eigen-)Wert an gemessen. Der Erwartungswert hAiψ ergibt sich entsprechend als Mittelwert einer (im idealisierten Fall unendlich oft) wiederholten Messung derselben Observable am identisch präparierten physikalischen System. 9 Daraus folgt, dass ein Zustand |ψi so zu interpretieren ist, dass er einem Ensemble von N 1 gleichartig präparierten Systemen entspricht. Wird an diesen N Systemen die Observable A gemessen, so finden sich die Messwerte an mit der Häufigkeit N (an ) so dass N= X N (an ) n und N (an ) ≈ |hn|ψi|2 . N Diese approximative Identität wird umso besser je größer N ist, so dass N (an ) = |hn|ψi|2 . N →∞ N lim Die einzelnen Messwerte, die gemittelt dem Erwartungswert hAiψ entsprechen, besitzen eine gewisse Streuung oder Varianz ∆ψ (A). Diese ist gegeben durch den Erwartungswert der quadratischen Abweichung vom Mittelwert (∆ψ (A))2 = (A − hAiψ )2 ψ = hA2 iψ − hAi2ψ . Ist |ψi ein (normierter) Eigenzustand von A so ist ∆ψ (A) = 0. Die Observable A ist also im Eigenzustand |ψi “scharf”. Jeder Messwert entspricht dem Erwartungswert und es gibt keine inhärente statistische Unsicherheit bei der Messung. In allen Zuständen, die keine Eigenzustände sind, gilt aber ∆ψ (A) > 0. Beispiel: Wir messen den Spin in z=x3 -Richtung im Zustand der eine Superposition aus “spin up” und “spin down” ist. Die Observable A ist also ~ A = S3 = Sz = 2 1 0 . 0 −1 Für spätere Zwecke halten wir fest, dass es sich um die Eigenschaft bezüglich der z−Richtung handelt und nennen die Zustände entsprechend “z−spin up” |z ↑i und “z−spin down” |z ↓i. Konkret nehmen wir an, dass der Zustand |ψi gegeben ist durch 1 1 |ψi = √ (|z ↑i + |z ↓i) = √ 2 2 so dass |hz ↑|ψi|2 = 1 , 2 1 1 1 0 + =√ , 0 1 2 1 |hz ↓|ψi|2 = 1 . 2 Offenbar gilt für den Erwartungswert hAiψ = 0, wobei in 50% aller Messungen der Messwert 12 ~ und in 50% aller Messungen der Messwert − 21 ~ gemessen wird. Das Stern-Gerlach-Experiment 10 (SG) ist eine experimentelle Realisierung dieser Situation. Eine Elektronenkanone “schießt” in regelmäßigen Abständen Elektronen die im Zustand |ψi präpariert sind durch eine Stern-GerlachApparatur5 , in der ein in z−Richtung inhomogenes, aber in x− und y -Richtung homogenes Magnetfeld vorherrscht, die Apparatur ist also in z−Richtung ausgerichtet. Hinter der Apparatur ist ein Schirm aufgestellt, der die Position der auftreffenden Elektronen registriert. Die Kombination aus SG-Apparat und Schirm entspricht der Messung des Spins in z−Richtung. Man stellt fest, dass jedes Elektron entweder oben (“z−spin up”), oder unten (“z−spin down”) auf dem Schirm auftrifft. Ist nach N abgeschossenen Elektronen N (z ↑) die Anzahl der oben auftreffenden Elektronen und N (z ↓) die Anzahl der unten auftreffenden Elektronen, so gilt N (z ↑) 1 ≈ , N 2 N (z ↓) 1 ≈ , N 2 wobei diese Identität immer exakter wird je größer N ist. Für die Varianz ∆ψ (Sz ) erhalten wir 2 (∆ψ (Sz )) = hSz2 iψ − hSz i2ψ ~2 1 0 1 1 1 ~2 √ =√ 1 1 −0= 4 0 1 4 2 2 1 | {z } Sz2 ⇒ ∆ψ (Sz ) = ~ . 2 Das leuchtet ein, da das (in diesem Spezialfall) gerade der Abstand der möglichen Messwerte ± 21 ~ vom Erwartungswert 0 ist. Am SG-Experiment kann man auch sehr gut verdeutlichen, dass eine quantenmechanische Messung den ausgemessenen Zustand ändert, indem er ihn in einen Eigenzustand der gemessenen Observable überführt. Dazu betrachten wir folgende Anordnung. Nach der ersten z−SGApparatur wird ein Schirm aufgestellt, der nur die z−spin down Elektronen registriert und die z−spin up Elektronen passieren lässt, die z−spin up Elektronen werden also herausgefiltert. Diese Filterung entspricht bereits einer Messung. Im Falle, dass ein Elektron den Filter passiert, wurde durch die Messung der Zustand |ψi in den Zustand |z ↑i überführt. Schaltet man eine weitere z−SG-Apparatur hinter die erste, passieren die herausgefilterten Elektronen diese ohne 5 Tatsächlich benutzt man im SG-Experiment zunächst vollständig unpolarisierte Elektronen (bzw. Silberatome, weil diese neutral sind). Man kann aber die hier beschriebene Situation problemlos experimentell realisieren indem man einen weitere geeignete SG-Apparatur vorschaltet, siehe den folgenden Abschnitt. 11 Zustandsänderung, da sie bereits in einem Eigenzustand der Sz -Observable sind. Insbesondere werden am hinteren Schirm keine z−spin down Elektronen registriert. Um die Zustandsänderung noch stärker zu verdeutlichen, führen wir eine zweite Observable ein, den Spin in x−Richtung, sowie die entsprechenden x−spin up und x−spin down Eigenzustände (siehe Aufgabe 1.3) ~ S1 = Sx = 2 0 1 , 1 0 1 |x ↑i = √ 2 1 , 1 1 |x ↓i = √ 2 1 . −1 Sx wird experimentell durch eine x−SG-Apparatur implementiert, also eine SG-Apparatur die in x−Richtung ausgerichtet ist. Mathematisch gilt offenbar 1 |z ↑i = √ (|x ↑i + |x ↓i) , 2 was in folgender Versuchsanordnung sichtbar wird. Wir leiten den im vorigen Experiment gefil- terten Strahl aus z−spin up Elektronen nicht in einen weiteren z−SG-Apparat, sondern in einen x−SG-Apparat, dessen Ausrichtung relativ zum z−SG-Apparat also um 90◦ verdreht ist (wegen der zweidimensionalen Darstellung ist das im Bild leider nicht realistisch wiedergegeben). Die Messung ergibt dabei, dass jeweils 50% der gefilterten Elektronen als x−spin up und x−spin down gemessen werden. Darüber hinaus erkennen wir, dass der als Eingangszustand präparierte Zustand |ψi tatsächlich der Zustand |x ↑i ist (und wissen inzwischen, wie wir diesen durch 12 einen x−SG-Filter präparieren können). Es wird also deutlich, dass der eingangs präparierte Zustand |x ↑i durch die Messung von Sz entweder in |z ↑i oder |z ↓i übergeht. Filtert man den |z ↑i-Anteil heraus und misst Sx , sind beide Alternativen x−spin up und x−spin down als Messergebnis möglich. Die eingangs präparierte Eigenschaft der Elektronen, im x−spin up Zustand zu sein, wird durch die Sz -Messung also gewissermaßen “gelöscht”. Zeitentwicklung, Korrespondenzprinzip, Schrödingergleichung Für die kräftefreie Bewegung eines Teilchens in drei Raumdimensionen gelten für Energie E und Impuls p ~ die de Broglie-Beziehungen p~ = ~~k , E = ~ω , wobei ω die Kreisfrequenz und ~k der Wellenzahlvektor sind. Aus der (nichtrelativistischen) EnergieImpuls-Beziehung E= p~2 2m folgt daher die (nichtrelativistische) Dispersionsrelation ω= ~ ~2 k . 2m Materiewellen, die dieser Dispersionsrelation genügen sind ebene Wellen i ~ ψ(t, ~x) = ae ~ (k·~x−ωt) die der Differentialgleichung i~ ∂ ~2 ~ 2 ~2 ψ(t, ~x) = − ∇ ψ(t, ~x) = − ∆ψ(t, ~x) ∂t 2m 2m genügen, wobei ~ = ∇ der Gradient und ∂ ∂x∂ 1 ∂x2 ∂ ∂x3 2 2 2 ~2 = ∂ + ∂ + ∂ ∆=∇ ∂x21 ∂x22 ∂x23 der Laplaceoperator ist. Die de Broglie-Beziehungen motivieren die Interpretation, dass der Operator ~~ ~ P~ = ∇ = −i~∇ i der Impulsoperator (im Ortsraum) ist, während der Operator H= P~ 2 2m der “Energieoperator” bzw. Hamiltonoperator des freien Teilchens ist. 13 In der klassischen Mechanik ist die Observable, die der Energie entspricht die Hamiltonfunktion h(~ p, ~q), wobei die Koordinate ~q im einfachsten Fall dem Ort ~q = ~x entspricht. Der Bewegung eines Teilchens in drei Raumdimensionen unter dem Einfluss des Potentials V (~ q ) entspricht die Hamiltonfunktion h(~ p, ~q) = p~ 2 + V (~q) . 2m Gemäß des Korrespondenzprinzips ordnet man klassischen Observablen, die Funktionen von p ~ und ~ q sind, entsprechende Observablen in der Quantentheorie zu indem man dieselben Funktionen nimmt und die Ersetzung p~ → P~ , ~ ~q → Q ~ der Ortsoperator, der (im Ortsraum) der Multipliktion mit ~q = ~x entspricht. vornimmt. Dabei ist Q Orts- und Impulsoperator genügen den berühmten Heisenberg’schen Kommutatorrelationen6 [Qi , Pj ] = Qi Pj − Pj Qi = i~δij 1 . Aufgrund des Korrespondenzprinzips ordnen wir nun der Observablen, die der Energie eines Teilchens das sich in drei Raumdimensionen unter dem Einfluss des Potentials V (~ q ) bewegt entspricht, den Hamiltonoperator H= P~ 2 ~ + V (Q) 2m zu und postulieren, dass der Zustand dieses physikalischen Systems zu jedem Zeitpunkt t durch eine Wellenfunktion ψ(t, ~ x) beschrieben wird, die der zeitabhängigen Schrödingergleichung i~ ∂ ψ(t, ~x) = Hψ(t, ~x) ∂t genügt. Dabei ist für einen festen Zeitpunkt t die Wellenfunktion ψ(t, ~ x) eine quadratintegrable 2 3 Funktion von ~ x, also ein Vektor im Hilbertraum L (R ). Die zeitabhängige Schrödingergleichung bestimmt die Dynamik eines quantenmechanischen Systems und ist gewissermassen das quantenmechanische Analogon der Hamilton’schen bzw. Newton’schen Bewegungsgleichungen in der klassischen Mechanik. Die zeitabhängige Schrödingergleichung ist auch sinnvoll für Systeme die sich durch endlichdimensionale Hilberträume modellieren lassen. Für die Beschreibung der Zeitabhängigkeit eines Elektronspins in einem äußeren Magnetfeld gilt z.B. eine analoge Gleichung wobei die Zustandsfunktion ψ(t) oder |ψ(t)i zu jedem Zeitpunkt ein Vektor in C2 ist und der Hamiltonoperator eine geeignete 2 × 2 Matrix ist. Für eine allgemeine Lösung der zeitabhängigen Schrödingergleichung ist die Wahrscheinlichkeitsdichte |ψ(t, ~ x)|2 zeitabhängig (die Norm kψ(t, ~x)k aber nicht!). Da der Hamiltonoperator 6 Aus diesem Grund ist das Korrespondenzprinzip in der Regel nicht eindeutig, da man z.B. der klassischen Observablen q1 p1 = p1 q1 die quantenmechanischen Observablen Q1 P1 oder P1 Q1 = Q1 P1 + i~1 zuordnen könnte. Dieses Problem wird uns in der Vorlesung in der Regel aber nicht betreffen. 14 nicht von der Zeit abhängt sollte es allerdings Lösungen der zeitabhängigen Schrödingergleichung geben für die |ψ(t, ~ x)|2 zeitunabhängig ist. Um diese zu finden machen wir den Ansatz ψ(t, ~x) = f (t)ψ(~x) . Einsetzen in die zeitabhängige Schrödingergleichung ergibt f (t) = exp(−i Et ~ ) mit E ∈ R und damit ψ(t, ~x) = e−i Et ~ ψ(~x) , Hψ(~x) = Eψ(~x) . Diese speziellen Lösungen der zeitabhängigen Schrödingergleichung nennt man stationäre Lösungen. Der räumliche Anteil der Wellenfunktion erfüllt dabei die zeitunabhängige Schrödingergleichung Hψ = Eψ . Diese Gleichung ist eine Eigenwertgleichung für den Hamiltonoperator H , stationäre Zustände entsprechen also den Eigenzuständen von H . Da H eine Observable ist verlangen wir, dass H ein hermitescher (selbstadjungierter) Operator ist. Die Eigenzustände von H bilden also eine Basis für den Hilbertraum. Darüber hinaus lässt sich eine allgemeine Lösung der zeitabhängigen Schrödingergleichung als Superposition von stationären Zuständen schreiben. In der Regel ist es also ausreichend, die zeitunabhängige Schrödingergleichung zu betrachten. Verträgliche Observablen, Unschärferelation. Wir wollen nun in einem Zustand |ψi zunächst die Observable A und anschließend die Observable B messen. Nach der Messung von A geht |ψi in einen Eigenzustand |ai von A über und man misst den Eigenwert a. Bei der anschließenden Messung von B geht |ai abermals in einen Eigenzustand |bi von B über und man misst den Eigenwert b. War |ψi bereits ein gemeinsamer Eigenvektor von A und B , ändert er sich bei den Messungen nicht und die Messungen von A und B ergeben den jeweils gleichen Messwert, unabängig davon welche der beiden Observablen zuerst gemessen worden ist. Mathematisch wird das ausgedrückt durch die Tatsache, dass der Erwartungswert hψ| (AB − BA) |ψi des Kommutators [A, B] = AB − BA im Zustand |ψi verschwindet. Man kann zeigen, dass das Verschwinden des Kommutators [A, B] als Observable (d.h. der Erwartungswert des Kommutators verschwindet in allen Zuständen) äquivalent dazu ist, dass es eine Basis des Hilbertraums gibt, die aus Vektoren besteht, die gemeinsame Eigenvektoren von A und B sind. Man spricht in diesem Fall davon, dass A und B gleichzeitig diagonalisierbar sind. Physikalisch bedeutet das, dass A und B gleichzeitig scharf messbar sind. Daher werden Observablen A und B deren Kommutator verschwindet verträglich oder kommensurabel genannt. Sind zwei Observablen nicht verträglich, lässt sich der “Grad der Unverträglichkeit in einem Zustand ψ ” durch die allgemeine Unschärferelation 1 ∆ψ (A)∆ψ (B) ≥ |h[A, B]iψ | 2 15 charakterisieren. Im Falle von A = Q (Ortsoperator) und B = P (Impulsoperator) bekommt man aufgrund der Kommutatorrelation [Q, P ] = i~1 die Heisenberg’sche Unschärferelation ∆ψ (P )∆ψ (Q) ≥ ~ 2 deren rechte Seite universell, d.h. zustandsunabhängig ist. Diese Unschärferelation ist folgendermaßen zu interpretieren: Es ist nicht möglich das System in einem Zustand ψ zu präparieren in dem das Produkt der Varianzen von P und Q beliebig klein wird. Dies lässt sich am besten an einem Gauss’schen Wellenpaket x2 ψ(x) = − 2 1 exp 4σ0 (2πσ02 ) 4 1 illustrieren, das in der Quantenmechanik dem klassischen Zustand eines Punktteilchens (hier ruhend, im Ursprung und in einer Raumdimension) entspricht. Man findet ∆ψ (P ) = ~ , 2σ0 ⇒ ∆ψ (Q) = σ0 ∆ψ (P )∆ψ (Q) = ~ . 2 Präpariert man diesen Zustand also so, dass ∆ψ (Q) klein ist, dann ist ∆ψ (P ) zwangsläufig groß und umgekehrt. Darüber hinaus sind Gauss’sche Wellenpakete offenbar Zustände in denen ∆ψ (P )∆ψ (Q) den kleinstmöglichen Wert einnimmt. Auch wenn der nichtverschwindende Kommutator von P und Q damit zusammenhängt, dass sich die Messungen von P und Q beeinflussen können, ist diese Beeinflussung nicht die Ursache für die Unschärferelation. Man kann z.B. ein Ensemble von N 1 Elektronen im Zustand ψ präparieren. An der einen Hälfte dieser Elektronen wird P bzw. ∆ψ (P ) gemessen, and der anderen Hälfte wird – zur Verdeutlichung z.B. einen Tag später – Q bzw. ∆ψ (Q) gemessen. Die Messungen sind unabhängig und können sich nicht gegenseitig beeinflussen. Trotzdem findet man ∆ψ (P )∆ψ (Q) ≥ 21 ~. Man muss die gegenseitige Beeinflussung der Messungen und die Unschärferelation also als Konsequenzen der gemeinsamen Ursache [Q, P ] 6= 0, also der Unverträglichkeit von Q und P , ansehen. Schrödingerbild, Heisenbergbild Im zuvor diskutierten Schrödingerbild wird die Zeitentwicklung eines Zustandes durch die zeitabhängige Schrödingergleichung i~ ∂ |ψ(t)i = H|ψ(t)i , ∂t bestimmt. Die allgemeine Lösung dieser Gleichung ist i |ψ(t)i = e− ~ Ht |ψ(0)i wobei |ψ(0)i die Rolle eines Anfangswertes spielt. In speziellen Fall, dass |ψ(0)i ein Eigenzustand des Hamiltonoperators zur Energie E ist, gilt i |ψ(t)i = e− ~ Et |ψ(0)i 16 im Einklang mit der Diskussion im vorigen Abschnitt. Dies folgt aus der Tatsache, dass allgemein für den Eigenzustand |ai eines selbstadjungierten Operators A zum Eigenwert a gilt, dass f (A)|ai = f (a)|ai für beliebige (genügend reguläre) Funktionen f . Ist eine Observable A nicht explizit zeitabhängig, so ergibt sich die Zeitabhängigkeit des Erwartungswertes im Schrödingerbild hAiψ(t) = hψ(t)|A|ψ(t)i vollständig aus der Zeitabhängigkeit von |ψ(t)i. Allerdings sind es in der Quantenmechanik die Erwartungswerte selbst die den Kontakt zum Experiment darstellen, es spielt also gewissermaßen keine Rolle wie diese Erwartungswerte mathematisch zustande gekommen sind. Daher ist der Standpunkt des Heisenbergbildes (mathematisch und physikalisch) äquivalent zum Schrödingerbild. Im Heisenbergbild postuliert man, dass die Zustände |ψH i selbst zeitunabhängig sind. Dagegen sind die Observablen zeitabhängig, wobei die Zeitabhängigkeit durch die Heisenberggleichung i~ d AH (t) = −[H, AH (t)] dt bestimmt ist. Die allgemeine Lösung dieser Gleichung ist i i AH (t) = e ~ Ht AH (0)e− ~ Ht , wobei AH (0) analog zum Schrödingerbild die Rolle eines Anfangswertes spielt. Die mathematische Äquivalenz der beiden Bilder wird durch den unitären Operator i U (t) = e− ~ Ht vermittelt, wobei wir uns erinnern, dass ein Operator A unitär genannt wird, wenn A† = A−1 . Konkret setzen wir AH (t) = U (t)−1 AU (t) , |ψH i = U (t)−1 |ψ(t)i , d.h. wir identifizieren den Anfangswert AH (0) im Heisenbergbild mit dem Operator A im Schrödingerbild, und den Anfangswert |ψ(0)i im Schrödingerbild mit dem Zustand |ψH i im Heisenbergbild. Die physikalische Äquivalenz der beiden Bilder folgt dann aus hψH |AH (t)|ψH i = (|ψH i)† AH (t)|ψH i = U (t)−1 |ψ(t)i † U (t)−1 AU (t)U (t)−1 |ψ(t)i = hψ(t)|U (t)U (t)−1 AU (t)U (t)−1 |ψ(t)i = hψ(t)|A|ψ(t)i . Erhaltungsgrößen eines quantenmechanischen Systems sind Observable deren Erwartungswerte in allen Zuständen zeitunabhängig sind. Im Heisenbergbild ist das äquivalent damit dass [H, AH (t)] = 0. Dann gilt aber auch AH (t) = AH (0) = A. Unabhängig vom verwendeten Bild kann man daher sagen, dass Erhaltungsgrößen durch die Bedingung [H, A] = 0 charakterisiert sind. 17 Zusammenfassung: die Postulate der Quantenmechanik. schnitt diskutierten Postulate der Quantenmechanik zusammen. Wir fassen die in diesem Ab- 1. Reine Zustände eines physikalischen System werden durch (normierte) Vektoren eines komplexen Hilbertraums H repräsentiert. Es gilt das Superpositionsprinzip: die Summe zweier Zustandsvektoren entspricht wieder einem physikalischen Zustand; dies gilt entsprechend für alle Vektoren in H . 2. Die Observablen eines physikalischen Systems werden durch hermitesche (selbstadjungierte) Operatoren auf H modelliert. Die möglichen Messwerte entsprechen den Eigenwerten dieser Operatoren. 3. Wird die Observable A in einem durch den Zustand |ψi repräsentierten System gemessen und wird dabei der Messwert a gefunden so geht das System nach der Messung in den Eigenzustand |ai von A zum Eigenwert a über (Zustandsreduktion). 4. Der Erwartungswert der Observable A im Zustand |ψi ist gegeben durch hAiψ = hψ|A|ψi . Er entspricht dem Mittelwert der Messwerte, die sich aus einer wiederholten Messung an einem Ensemble N 1 identisch präparierter Systeme ergeben. 5. Im Schrödingerbild wird die Zeitentwicklung eines Zustandes |ψ(t)i durch die zeitabhängige Schrödingergleichung i~ ∂ |ψ(t)i = H|ψ(t)i , ∂t bestimmt, deren allgemeine Lösung i |ψ(t)i = e− ~ Ht |ψ(0)i ist. Im Heisenbergbild wird die Zeitentwicklung einer Observablen durch die Heisenberggleichung i~ d AH (t) = −[H, AH (t)] dt bestimmt, deren allgemeine Lösung i i AH (t) = e ~ Ht AH (0)e− ~ Ht ist. 1.2 Drehimpulsaddition & allgemeine Drehimpulskopplung Wenn in einem System zwei unabängige Drehimpulse auftreten, können diese zu einem Gesamtdrehimpuls kombiniert werden. Mögliche Beispiele sind: 18 ~ und Spin S ~ zum Gesamtdrehimpuls J~ = L ~ +S ~ a) Addition von Bahndrehimpuls L ~ (1) und S ~ (2) zum Gesamtspin S ~=S ~ (1) + S ~ (2) b) Addition von zwei Spins S An dieser Stelle soll noch einmal erinnert werden, dass der Spin im Gegensatz zum Bahndrehimpuls eine intrinsische Eigenschaft bzw. ein intrinsischer Freiheitsgrad eines Teilchens ist der nicht mit einer Bewegung im Raum zusammenhängt. Versucht man z.B. den Spin des Elektrons durch eine Eigendrehung des Teilchens zu erklären so kommt man zu dem Schluss, dass die (hypothetische) Oberfläche des Elektrons sich mit Überlichtgeschwindigkeit drehen müsste, im Widerspruch zur Relativitätstheorie. Die Addition von Drehimpulsen ist ein Spezialfall der Kombination von quantenmechanischen Systemen. Für die mathematische Beschreibung solch einer Kombination benötigt man das Tensorprodukt, das wir im Folgenden kurz diskutieren. 1.2.1 Kombination von Systemen, Tensorprodukt Möchte man zwei Systeme kombiniert beschreiben, wobei die Zustände der jeweiligen Systeme Elemente der Hilberräume H (1) und H (2) sind, so ist der geeignete Hilbertraum für das kombinierte System das Tensorprodukt H = H (1) ⊗ H (2) . Um die Eigenschaften dieses Produkts zu beschreiben, betrachten wir beliebige Vektoren |vi (1) |wi ∈H (1) , (2) |vi (2) , |wi ∈H (2) (1) , und beliebige komplexe Zahlen a, b ∈ C. • Das Tensorprodukt ist linear in beiden Faktoren. a|vi(1) + b|wi(1) ⊗ |vi(2) = a |vi(1) ⊗ |vi(2) + b |wi(1) ⊗ |vi(2) |vi(1) ⊗ a|vi(2) + b|wi(2) = a |vi(1) ⊗ |vi(2) + b |vi(1) ⊗ |wi(2) Das heißt insbesondere, dass die Klammern auf der rechten Seite weggelassen werden können. • Das Tensorprodukt ist verträglich mit dem Skalarprodukt (1) |vi(1) ⊗ |vi(2) , |wi(1) ⊗ |wi(2) = hv|wi(1) | {z } | {z } Skalarprodukt in H (1) Skalarprodukt in H = H (1) ⊗ H (2) Daraus folgt inbesondere: Ist |ni |ni (1) ⊗ |mi (2) (1) × (2) | hv|wi(2) {z } . Skalarprodukt in H (2) (2) eine ONB von H (1) und |mi eine ONB von H (2) , so ist eine ONB von H = H (1) ⊗ H (2) . Beispiele von Tensorprodukten sind: 19 • Die Zustände eines Spin- 12 Teilchens unter Vernachlässigung der räumlichen Dynamik sind Elemente von C2 . Will man die Spins zweier solcher (unterscheidbarer) Teilchen als kombiniertes System beschreiben, so sind die Zustände dieses Systems Elemente von C2 ⊗ C2 = C4 . = (a1 , b1 ) und |vi(2) = (a2 , b2 ) das Tensorprodukt definiert a1 a2 ! a1 b2 a1 |vi(2) |vi(1) ⊗ |vi(2) = = (2) b1 a2 . b1 |vi b1 b2 Dabei ist für zwei Vektoren |vi als7 (1) • Allgemein gilt Cm ⊗ Cn = Cmn . • Die Dynamik eines Elektrons in drei Raumdimensionen unter Vernachlässigung des Spins wird beschrieben durch Zustände in L2 (R3 ). Will man Spin und räumliche Dynamik gleichzeitig beschreiben, betrachtet man das Tensorprodukt L2 (R3 ) ⊗ C2 = L2 (R3 → C2 ) also den Raum der Funktionen von R3 nach C2 die quadratintegrabel sind, d.h. für Ψ ∈ L2 (R3 → C2 ) ψ1 (~x) , Ψ(~x) = ψ2 (~x) kΨk2 = Z d3 x |ψ1 (~x)|2 + |ψ2 (~x)|2 < ∞ . R3 Dabei gilt für ψ(~ x) ∈ L2 (R3 ) und (a, b) ∈ C2 aψ(~x) a . = ψ(~x) ⊗ bψ(~x) b • Will man die räumliche Dynamik von n (unterscheidbaren) Teilchen im dreidimensionalen Raum beschreiben, so ist der entsprechende Hilbertraum L2 (R3 ) ⊗ · · · ⊗ L2 (R3 ) = L2 (R3n ) . | {z } n mal Dabei ist (ψ1 ⊗ · · · ⊗ ψn ) (~x1 , . . . , ~xn ) = ψ1 (~x1 )ψ2 (~x2 ) . . . ψn (~xn ) . Das Tensorprodukt von Zuständen entspricht also in diesem Fall dem Produkt von Wellenfunktionen. 7 Dies ist nur eine mögliche Definition, alle anderen sind jedoch (unitär) äquivalent. 20 In der Literatur und im Folgenden wird das Tensorprodukt von Vektoren oft vereinfacht so geschrieben, dass das Symbol ⊗ weggelassen wird, d.h. |vi(1) |vi(2) |vi(1) ⊗ |vi(2) . entspricht Um Observable des durch H = H (1) ⊗ H (2) beschriebenen Systems zu modellieren benötigen wir das Tensorprodukt von Operatoren. Sind A(1) , A(2) lineare Operatoren auf H (1) , H (2) so ist A(1) ⊗ A(2) ein linearer Operator auf H (1) ⊗ H (2) . Dieser wirkt auf Tensorprodukte von Vektoren als A(1) ⊗ A(2) |vi(1) ⊗ |vi(2) = A(1) |vi(1) ⊗ A(2) |vi(2) . Daraus folgt für das Operatorprodukt A(1) ⊗ A(2) B (1) ⊗ B (2) = A(1) B (1) ⊗ A(2) B (2) . Beispiel: sind A(1) und A(2) jeweils Matrizen auf C4 , so ist A(1) ⊗ A(2) die folgende Matrix auf C4 : A A(1) ⊗ A(2) (1) a1 b1 = , c1 d1 (2) A = a2 b2 c2 d2 , a1 a2 a1 b2 b1 a2 b1 b2 a1 c2 a1 d2 b1 c2 b1 d2 a1 A(2) b1 A(2) = = c1 a2 c1 b2 d1 a2 d1 b2 c1 A(2) d1 A(2) c1 c2 c1 d2 d1 c2 d1 d2 Sind A(1) , A(2) hermitesch bzw. selbstadjungiert, so gilt das auch für A(1) ⊗ A(2) . Das Tensorprodukt von zwei Observablen ist also wieder eine Observable. Betrachtet man das Tensorprodukt eines Operators mit dem Einheitsoperator auf dem jeweils anderen Hilbertraum, wird dieses oft nicht explizit ausgeschrieben, so dass der ursprüngliche Operator in kanonischer Weise als Operator auf dem Tensor-Hilbertraum aufgefasst wird: A(1) als Operator auf H (1) ⊗ H (2) entspricht A(1) ⊗ 1(2) , A(2) als Operator auf H (1) ⊗ H (2) entspricht 1(1) ⊗ A(2) . Sind die zwei kombinierten Teilsysteme nicht in Wechselwirkung miteinander, so setzt sich der Hamiltonoperator H wie folgt aus den Hamiltonoperatoren H (1) , H (2) der Einzelsysteme zusammen: H = H (1) ⊗ 1(2) + 1(1) ⊗ H (2) , bzw., in vereinfachter Schreibweise, H = H (1) + H (2) . Das drückt die physikalische Tatsache aus, dass die Gesamtenergie zweier Systeme beim Fehlen einer Wechselwirkung gerade die Summe der einzelnen Energien ist. 21 Die Aussage “A(1) und A(2) wirken auf unterschiedliche Objekte, darum gilt automatisch [A(1) , A(2) ] = 0.” folgt in expliziter Schreibweise aus A(1) ⊗ 1(2) 1(1) ⊗ A(2) − 1(1) ⊗ A(2) A(1) ⊗ 1(2) = A(1) ⊗ A(2) − A(1) ⊗ A(2) = 0 . Das motiviert die vereinfachte Schreibweise: A(1) A(2) = A(2) A(1) A(1) ⊗ A(2) . entspricht Wir werden im Folgenden meistens die vorgestellten vereinfachten Schreibweisen verwenden um im Einklang mit dem Großteil der Literatur zu sein und um Formeln übersichtlicher zu gestalten. Die vereinfacht geschriebenen Formeln lassen sich immer eindeutig interpretieren, wenn man im Hinterkopf behält, welcher Operator auf welchen Tensorfaktor des Hilbertraums wirkt. 1.2.2 Drehimpulsaddition: allgemeiner Fall Wir betrachten nun die Addition zweier allgemeiner Drehimpulse J~ (1) , J~ (2) deren Komponenten jeweils hermitesche Operatoren auf den Hilberträumen H (1) , H (2) – und damit auch auf dem Tensorprodukt H (1) ⊗ H (2) – sind. Diese Komponenten erfüllen die Kommutatorrelationen h (1) (1) Ji , Jj i = i~ X (1) ijk Jk , h (2) (2) Ji , Jj i = i~ k X (2) ijk Jk , h i (1) (2) Ji , Jj = 0. k Wir betrachten Darstellungen der zwei Drehimpulse zu jeweils festen Drehimpulsquantenzahlen j1 und j2 . D.h. H (1) = Hj1 = C2j1 +1 , H (2) = Hj2 = C2j2 +1 , wobei ONBs der zwei Hilberträume gegeben sind durch |j1 , m1 i für m1 ∈ {−j1 , −j1 + 1, . . . , j1 } und |j2 , m2 i für m2 ∈ {−j2 , −j2 + 1, . . . , j2 } mit J~ (1) 2 |j1 , m1 i = ~2 j1 (j1 + 1)|j1 , m1 i , J3 |j1 , m1 i = ~m1 |j1 , m1 i , J~ (2) 2 |j2 , m2 i = ~2 j2 (j2 + 1)|j2 , m2 i , J3 |j2 , m2 i = ~m2 |j2 , m2 i . (1) (2) Wir betrachten nun den Gesamtdrehimpulsoperator J~ = J~ (1) + J~ (2) auf dem Hilbertraum Hj1 &j2 = Hj1 ⊗ Hj2 = C(2j1 +1)(2j2 +1) . Wir wissen bereits, dass eine ONB dieses Hilbertraums gegeben ist durch |j1 , m1 ; j2 , m2 i = |j1 , m1 i|j2 , m2 i . 22 Man überprüft leicht, dass die Komponenten des Gesamtdrehimpulsoperators ebenfalls hermitesch sind und die Drehimpulsalgebra erfüllen [Ji , Jj ] = i~ X ijk Jk . k Das impliziert, dass es eine ONB |j, m; j1 , j2 i von Hj1 &j2 geben muss mit J~ 2 |j, m; j1 , j2 i = ~2 j(j + 1)|j, m; j1 , j2 i , J3 |j, m; j1 , j2 i = ~m|j, m; j1 , j2 i . Dabei wissen wir schon, dass m die Werte m ∈ {−j, −j + 1, . . . , j} annehmen kann, wir wissen allerdings noch nicht, welche Werte für j möglich sind. Der Grund, warum wir die ONB zusätzlich zur Indizierung mit den Quantenzahlen j und m auch noch mit den Quantenzahlen j1 und j2 indizieren, wird gleich deutlich werden. Im Folgenden möchten wir nun zwei Fragen beantworten: a) Welche Werte für j sind möglich? b) Wie hängen die ONB |j1 , m1 ; j2 , m2 i und |j, m; j1 , j2 i miteinander zusammen? Zur Beantwortung dieser Fragen stellen wir zunächst fest, dass 2 2 2 2 (2) (1) (2) (1) 2 2 ~ ~ ~ ~ ~ ~ = 0, = J3 , J = J3 , J = J , J J , J wie sich leicht überprüfen lässt. Die Vektoren |j, m; j1 , j2 i sind also auch Eigenvektoren von J~ (1) 2 und J~ (2) 2 , bzw. diagonalisieren auch diese Operatoren; daher wurden für die Indizie- rung von |j, m; j1 , j2 i auch die Quantenzahlen j1 , j2 verwendet. Allerdings verifiziert man h i h i h i (1) (2) (2) J~ 2 , J3 = J~ 2 , J3 − J3 = − J~ 2 , J3 6= 0 . (1) Die Vektoren |j, m; j1 , j2 i sind also im Allgemeinen keine Eigenvektoren von J3 Umgekehrt gilt allerdings (1) (2) J3 |j1 , m1 ; j2 , m2 i = J3 + J3 |j1 , m1 ; j2 , m2 i = ~(m1 + m2 )|j1 , m1 ; j2 , m2 i . Daraus folgt: 1. m = m1 + m2 . m kann also die Werte m ∈ {−(j1 + j2 ), −(j1 + j2 ) + 1, . . . , j1 + j2 } annehmen. 23 (2) und J3 . 2. Das größtmögliche j ist jmax = mmax = j1 + j2 . 3. Mit ein bisschen mehr Aufwand kann man zeigen, dass das kleinstmögliche j jmin = |m2,max + m1,min | = |m2,min + m1,max | = |j2 − j1 | ist und das j alle Werte j ∈ {|j2 − j1 |, |j2 − j1 | + 1, . . . , j1 + j2 } annehmen kann. Man kann sich jmin und jmax als die Länge der Vektoren ~jmin = j2~ez − j1~ez , ~jmax = j2~ez + j1~ez , veranschaulichen. Allerdings ist diese klassische Analogie nur begrenzt hilfreich, weil es sich bei der quantenmechanischen Drehimpulsaddition gewissermaßen um eine “quantisierte Vektoraddition” handelt. 4. Mathematisch bedeutet die vorige Aussage, dass der Hilbertraum Hj1 &j2 = Hj1 ⊗ Hj2 in eine direkte orthogonale Summe zerfällt. Hj1 &j2 = Hj1 ⊗ Hj2 jM 1 +j2 = Hj C(2j1 +1)(2j2 +1) = C2j1 +1 ⊗ = = = j=|j2 −j1 | C2j2 +1 jM 1 +j2 = C2j+1 j=|j2 −j1 | Das bedeutet, dass Hj1 ⊗ Hj2 ein kartesisches Produkt der Hj ist und dass die UnterHilberträume Hj für unterschiedliche j paarweise orthogonal in Hj1 ⊗ Hj2 liegen. Ein Vektor v ∈ Hj1 ⊗ Hj2 kann also durch eine unitäre Transformation – d.h. eine Basistransformation – auf die Form v|j2 −j1 | v|j −j |+1 2 1 v= , .. . vj1 +j2 vj ∈ Hj gebracht werden. Als Kontrolle dieser Tatsache können wir die Dimensionsverhältnisse überprüfen. Dazu nehmen wir ohne Beschränkung der Allgemeinheit an, dass j2 ≥ j1 . jX 1 +j2 j=|j2 −j1 | 2j + 1 = [2(j2 − j1 ) + 1] + [2(j2 − j1 + 1) + 1] + · · · + [2(j2 + j1 ) + 1] {z } | 2j1 +1 Summanden = (2j1 + 1)(2j2 + 1) + 2[(−j1 ) + · · · + (j1 )] | {z } =0 24 Nachdem wir die Frage nach den möglichen j beantwortet haben, widmen wir uns der Relation zwischen den ONB |j, m; j1 , j2 i und |j1 , m1 ; j2 , m2 i. Da es sich um ONB handelt, muss es eine unitäre Transformation – d.h. eine Matrix A auf C(2j1 +1)(2j2 +1) mit A† = A−1 – geben, die die letztere Basis auf die erstere abbildet. Wegen j1 X |j, m; j1 , j2 i = 1|j, m; j1 , j2 i = j2 X |j1 , m1 ; j2 , m2 ihj1 , m1 ; j2 , m2 |j, m; j1 , j2 i m1 =−j1 m2 =−j2 = j1 X j2 X hj1 , m1 ; j2 , m2 |j, m; j1 , j2 i|j1 , m1 ; j2 , m2 i m1 =−j1 m2 =−j2 sind die Matrixelemente dieser Matrix gerade die Clebsch-Gordon-Koeffizienten hj1 , m1 ; j2 , m2 |j, m; j1 , j2 i . Wir wissen bereits, dass m = m1 + m2 . Daraus folgt: 1. hj1 , m1 ; j2 , m2 |j, m; j1 , j2 i ∝ δm1 +m2 ,m . 2. Für die maximalen bzw. minimalen Werte m1 = j1 , m2 = j2 und m1 = −j1 , m2 = −j2 , muss |j1 , m1 ; j2 , m2 i gerade der Vektor zum maximalen j und maximalen m sein, also (bis auf eine irrelevante Phase) |j1 , m1 = ±j1 ; j2 , m2 = ±j2 i = |j = j1 + j2 , m = ±(j1 + j2 ); j1 , j2 i ⇒ hj1 , m1 = ±j1 ; j2 , m2 = ±j2 |j = j1 + j2 , m = ±(j1 + j2 ); j1 , j2 i = 1 . Die vollständigen Clebsch-Gordon-Koeffizienten lassen sich unter Zuhilfenahme der Leiteroperatoren aus diesen Beziehungen ausrechnen. 1.2.3 Allgemeine Drehimpulskopplung Mathematisch sind die ONB |j, m; j1 , j2 i und |j1 , m1 ; j2 , m2 i äquivalent. Physikalisch hängt es von der jeweiligen Situation ab, welche Basis besser zur Beschreibung des quantenmechanischen Systems geeignet ist. Der Hamiltonoperator H , der die Dynamik der zwei Drehimpulse in einem ~ beschreibt enthält im Allgemeinen die Terme externen Magnetfeld B ~, H1 = c1 J~ (1) · B ~, H2 = c2 J~ (2) · B H3 = c3 J~ (1) · J~ (2) . mit geeigneten dimensionsbehafteten Konstanten c1 , c2 , c3 ; d.h. H = H0 + H1 + H2 + H3 25 mit einem Beitrag H0 für den hier nur wichtig ist, dass [H0 , Hi ] = 0 für i ∈ {1, 2, 3} . Die Terme H1 , H2 , H3 entsprechen jeweils der individuellen Kopplung der zwei Drehimpulse an das Magnetfeld sowie der Kopplung der Drehimpulse untereinander. Diese Kopplungen entstehen dadurch, dass den Drehimpulsen, unter der Annahme, dass es sich um Drehimpulse geladener Teilchen handelt, magnetische Momente entsprechen. Es sind nun zwei physikalische Situationen möglich. 1. Schwaches Magnetfeld. In diesem Fall dominiert H3 über H1 und H2 . Wegen 1 J~ (1) · J~ (2) = 2 2 2 J~ 2 − J~ (1) − J~ (2) sind die Zustände |j, m; j1 , j2 i – im Gegensatz zu den Zuständen |j1 , m1 ; j2 , m2 i – Eigenzustände von H3 und daher besser geeignet zur Beschreibung des Systems. Zur Behandlung der Terme H1 und H2 , die in der Basis |j, m; j1 , j2 i nicht diagonal sind, können folgende Approximationsmethoden verwendet werden: a) Die Terme H1 und H2 können störungstheoretisch behandelt werden. Diese Methode werden wir im Laufe der Vorlesung allgemein diskutieren. b) Physikalisch erwartet man, dass die Drehimpulse J~ (1) , J~ (2) um den Gesamtdrehimpuls J~, bzw. dessen magnetisches Moment, präzedieren (siehe Aufgabe 2.2). Man kann daher approximativ die Drehimpulse J~ (1) , J~ (2) durch ihre Zeitmittel, also die Projektionen auf die J~-Achse ersetzen. (1) J~ (1) ≈ J~Zeitmittel (2) J~ (2) ≈ J~Zeitmittel 2 2 ~ 2 + J~ (1) − J~ (2) J (1) ~ ~ J ·J ~ = J= J~ J~ 2 2J~ 2 2 2 2+ J (2) (1) ~ ~ ~ J − J (2) J~ · J~ ~ = J= J~ J~ 2 2J~ 2 Ersetzt man H1 und H2 entsprechend durch ihre jeweiligen Zeitmittel, so erhält man Operatoren die in der Basis |j, m; j1 , j2 i ebenfalls diagonal sind. In beiden Fällen ist der Gesamtdrehimpuls, nicht aber die einzelnen Drehimpulse, approximativ eine Erhaltungsgrösse des Systems, da [H, Ji ] ≈ 0 für i ∈ {1, 2, 3} . ~ , J~ (2) = S ~ Bahndrehimpuls und Spin eines Elektrons in einem Atom Im Fall dass J~ (1) = L ~ induzierte sind, entspricht H3 der Spin-Bahn-Kopplung und die via H1 und H2 durch B Aufspaltung der Energieniveaus – und damit der Spektrallinien – wird Zeemann-Effekt genannt. 26 2. Starkes Magnetfeld. In diesem Fall dominieren H1 und H2 über H3 . Die Kopplung zwischen J~ (1) und J~ (2) wird aufgelöst und der Gesamtdrehimpuls J~ ist keine Erhaltungsgröße, während das für J~ (1) und J~ (2) approximativ der Fall ist. Die Zustände |j1 , m1 ; j2 , m2 i sind gut geeignet für die Beschreibung des Systems und approximative Eigenzustände von H . Der Term H3 kann störungstheoretisch behandelt werden. ~ , J~ (2) = S ~ Bahndrehimpuls und Spin eines Elektrons in einem Atom Im Fall, dass J~ (1) = L ~ induzierte Aufspaltung der Energieniveaus Paschensind, wird die via H1 und H2 durch B Back-Effekt genannt. Das Muster der Spektrallinien ist im Allgemeinen deutlich anders als beim Zeemann-Effekt, typischerweise gibt es deutlich weniger Spektrallinien. 1.2.4 Drehimpulsaddition: Spin 1/2 und Spin 1/2 Wir wollen nun die Drehimpulsaddition am Beispiel zweier 21 -Spins im Detail betrachten. Die ~ (1) und J~(2) = S ~ (2) werden zum Gesamtspin einzelnen Spins J~(1) = S ~=S ~ (1) + S ~ (2) J~ = S (1) kombiniert. Die Komponenten Si ratoren auf (2) und Sj der individuellen Spinoperatoren sind jeweils Ope- H (1) = H 1 = C2 , H (2) = H 1 = C2 2 2 und damit – wie auch die Komponenten Si des Gesamtspins – Operatoren auf dem Tensorprodukt H (1) ⊗ H (2) = C2 ⊗ C2 = C4 . Die Eigenzustände (1) |s1 , m1 i , s1 = 1 2 , m1 = ± 12 von ~ (1) )2 , S , (S 3 |s2 , m2 i , s2 = 1 2 , m2 = ± 21 von ~ (2) )2 , S (S 3 (2) bilden jeweils ONB von H (1) und H (2) . Für die ONB |s1 , m1 ; s2 , m2 i = |s1 , m1 i|s2 , m2 i von H (1) ⊗ H (2) verwenden wir im Folgenden die vereinfachte Notation |↑↑i = 21 , 21 ; 21 , 12 , |↓↑i = 12 , − 21 ; 21 , 12 , |↑↓i = 12 , 12 ; 12 , − 12 , |↓↓i = 12 , − 12 ; 12 , − 21 . Für die ONB von H (1) ⊗ H (2) aus den Eigenzuständen |s, m; s1 , s2 i von ~ 2 , S3 S verwenden wir die vereinfachte Notation |s, m; s1 , s2 i = |s, mi . 27 Aus den allgemeinen Überlegungen zur Drehimpulsaddition folgt, dass für die maximal und minimal möglichen Werte für s smin = |s2 − s1 | = 0 smax = s2 + s1 = 1 , gilt. Da die möglichen Werte von s sich nur um eine ganze Zahl unterscheiden können impliziert das bereits s ∈ {0, 1} . Entsprechend gilt 2 = H1 ⊗ H1 2 C4 2 = H1 + H0 = = 2 = H1&1 = C2 ⊗ C2 = C3 ⊕ C und die ONB |s, mi besteht aus den Vektoren |1, 1i , |1, 0i , |1, −1i , |0, 0i . Aus den allgemeinen Überlegungen zur Drehimpulsaddition folgt ebenfalls direkt, dass |1, 1i = |↑↑i , |1, −1i = |↓↓i . Die übrigen zwei Vektoren |1, 0i und |0, 0i müssen wegen m = m1 + m2 also eine Linearkombination aus |↑↓i und |↓↑i sein. Um diese genau zu bestimmen, berechnen wir 2 2 ~ (2) + 2 S (1) S (2) + S (1) S (2) + S (1) S (2) ~ (1) + S ~2 = S S 1 1 2 2 3 3 2 2 ~ (1) + S ~ (2) + S (1) S (2) + S (1) S (2) + 2S (1) S (2) = S + − − + 3 3 und damit ~ 2 |↑↓i = ~2 1 (1 + 1 + 0 + 0 + 2) |↑↓i = ~2 |↑↓i , S 4 ~ 2 |↓↑i = ~2 1 (1 + 1 + 0 + 0 + 2) |↓↑i = ~2 |↓↑i . S 4 Daraus folgt ~ 2 (|↑↓i + |↓↑i) = 2~2 (|↑↓i + |↓↑i) , S ~ 2 (|↑↓i − |↓↑i) = 0 S und damit |1, 0i = √1 2 (|↑↓i + |↓↑i) , |0, 0i = √1 2 (|↑↓i − |↓↑i) . Abschließend stellen wir fest, dass die Zustände zum Spin s = 1 symmetrisch unter Vertauschung der Spins sind, während der Zustand zum Spin s = 0 antisymmetrisch unter dieser Vertauschung ist. Dieser Sachverhalt wird bei der Diskussion des Heliumatoms eine wichtige Rolle spielen. 28 1.2.5 Drehimpulsaddition: Bahndrehimpuls und Spin 1/2 ~ , J~ (2) = S ~ Bahndrehimpuls Als zweites wichtiges Beispiel besprechen wir den Fall, dass J~ (1) = L und Spin eines Elektrons in einem Atom sind. Die Drehimpulsquantenzahlen sind also j 1 = l ∈ N0 , j2 = s = 1 2 . Wir betrachten zunächst den Fall l = 0. In diesem Fall gibt es nur eine Möglichkeit für j , und zwar j = s = 12 . Es gilt also 1 , ± 1 ; 0, 1 = 0, 0; 1 , ± 1 . 2 2 2 2 2 Für l ≥ 1 gilt j = l ± 21 . Wie gehabt gilt zunächst l + 1 , ± l + 1 ; l, 1 = l, ±l; 1 , ± 1 . 2 2 2 2 2 Für die anderen Zustände ergibt eine einfache aber unübersichtliche Rechnung mit Leiteroperatoren s l ± 1 , mj ; l, 1 = 2 2 l + 12 ∓ mj l, mj + 21 ; 12 , − 12 ± 2l + 1 s l + 12 ± mj l, mj − 21 ; 21 , 12 . 2l + 1 Diese Formel ist auch für die Extremfälle j = jmax = l + 12 , mj = ±jmax gültig. 1.3 Teilchen im elektromagnetischen Feld In der ersten Vorlesung zur Quantenmechanik wurde der Einfluss eines elektrischen Feldes auf ein quantenmechanisches System am Beispiel des Wasserstoffatoms diskutiert. Es gibt jedoch wichtige Phänomene die mit dem Einfluss magnetischer Felder zusammenhängen wie z.B.: a) Paramagnetismus, die Induktion eines gleichgerichteten Magnetfeldes durch ein äußeres Magnetfeld, b) Diamagnetismus, die Induktion eines entgegengesetzt ausgerichteten Magnetfeldes durch ein äußeres Magnetfeld, c) der Zeemann-Effekt und der Paschen-Back-Effekt, die Aufspaltung der Energieniveaus des Elektrons im Wasserstoffatom in einem Magnetfeld. 1.3.1 Hamiltonoperator Um diese Effekte in der Quantenmechanik zu beschreiben müssen wir den entsprechenden Ha~ , Q) ~ konstruieren. Wie zuvor wollen wir diesen durch das Korrespondenzprinmiltonoperator H(P zip aus der klassischen Hamiltonfunktion H(~ p, ~q) erhalten. Um diese zu motivieren, erinnern wir 29 ~ und das Magnetfeld B ~ durch das skalare uns, dass in der Elektrodynamik das elektrische Feld E ~ Potential φ und Vektorpotential A ausgedrückt werden können: ~ ~ = − ∂ A − ∇φ ~ , E ∂t ~ =∇ ~ ×A ~, B wobei wir im Folgenden immer von der Coulomb-Eichung ~ ·A ~=0 ∇ ~ als divergenzfrei annehmen. Die klassiche Bewegung eines Teilchens ausgehen wollen, d.h. A der Masse m und Ladung q unter dem Einfluss dieser Felder wird durch die Newton’sche Bewe~L als Quellterm auftaucht gungsgleichung bestimmt, in denen die Lorentzkraft F ~ ¨ = F~L = q E ~ + ~x˙ × B ~ = q − ∂ A − ∇φ ~ ×A ~ ~ + ~x˙ × ∇ m~x ∂t X ~ ∂A ~ ~ j − ~x˙ · ∇ ~ A ~ . = q − − ∇φ + ẋj ∇A ∂t ! j Diese Gleichungen lassen sich aus der klassischen Hamiltonfunktion 2 ~ p~ − q A h(~ p, ~q) = 2m + qφ herleiten. Tatsächlich lauten die Hamilton’schen Bewegungsgleichungen q̇i = ẋi = ∂h , ∂pi ṗi = − ∂h ∂h =− , ∂qi ∂xi woraus folgt ẋi = ṗi = − ∂h pi − qAi = ∂pi m ⇒ ∂Aj ∂h q X ∂φ = − (pj − qAj ) ∂xi m ∂xi ∂xi j ~ p~ − q A ~x˙ = , m X ~ j − q ∇φ ~ . ⇒ p~˙ = q ẋj ∇A j Ableitung der ersten Gleichung nach der Zeit und einsetzen der zweiten in das Ergebnis liefert ~ x(t), t) = ∂ A(~ ~ x(t), t) + (~x˙ · ∇) ~ A ~ !). ~˙ x(t), t) = d A(~ das gewünschte Resultat (Vorsicht: A(~ dt ∂t Daher machen wir folgenden Ansatz für den Hamiltonoperator eines Teilchens in einem elektromagnetischen Feld H= ~ P~ − q A 2m 2 + qφ = ~ − qA ~ · P~ + q 2 A ~2 P~ 2 − q P~ · A + qφ . 2m 30 Wir betrachten nun den Spezialfall eines homogenen Magnetfeldes. In diesem Fall ist ein mögliches divergenzfreies Vektorpotential ~ ~ = − ~x × B . A 2 Einsetzen in den Hamiltonoperator ergibt H= ~ 2 P~ 2 q ~ ~ q 2 (~x × B) L·B+ − + qφ , 2m 2m 2m wobei ~ =Q ~ × P~ = ~x × ~ ∇ ~ L i der Bahndrehimpulsoperator ist und wir ausgenutzt haben dass ~ ·A ~=0 ∇ ~=A ~ · P~ . P~ · A ⇒ Der Term HB,L = − q ~ ~ L·B 2m ~ entspricht der potentiellen Energie eines magnetischen Momentes linear in B ~L = q L ~ M 2m ~ und ist verantwortlich für den Paramagnetismus von Atomen. Der Term in einem Magnetfeld B ~ entspricht ebenfalls einem induzierten, allerdings entgegengerichteten maquadratisch in B gnetischen Moment und kann daher für diagmagnetische Effekte verantwortlich sein. Für nicht zu starke Magnetfelder kann dieser Term vernachlässigt werden. Der bisher diskutierte Hamiltonoperator – ein Operator auf dem Hilbertraum H = L2 (R3 ) – beschreibt nur die räumliche Dynamik des Teilchens, z.B. eines Elektrons, im elektromagnetischen Feld. Um gleichzeitig die Spindynamik zu beschreiben machen wir den Ansatz, dass der entsprechende Beitrag zum Hamiltonoperator – der nun ein Operator auf dem Hilbertraum H = L2 (R3 ) ⊗ C2 ist – von der Form HB,S = − gs q ~ ~ S·B 2m (Pauli-Term) ~ das magnetische Moment ist, d.h. wir ordnen dem Spin S ~ S = gs q S ~ M 2m zu. Hierbei ist gs der Landé-Faktor. Während für den Bahndrehimpuls aus der klassischen Theorie der Landé-Faktor gl = 1 vorhergesagt werden kann, ist das für den Spin nicht möglich, da dieser kein klassischer Effekt ist. Aus der relativistischen Quantenmechanik, wie auch aus Experimenten lässt sich für das Elektron der Wert gs = 2 ableiten. Tatsächlich liefert eine verfeinerte theoretische und experimentelle Analyse den Wert gs ' 2.00231930436182(52) 31 der sich in der Quantenelektrodynamik ergibt. Im Folgenden rechnen wir der Einfachheit halber mit gs = 2 und bemerken, dass die Tatsache dass gs 6= 1 ein weiterer Beleg dafür ist, dass der Spin eine intrinsische Eigenschaft ist die nicht mit einer räumlichen Bewegung zusammenhängt. Insgesamt erhalten wir für ein nicht zu starkes Magnetfeld den folgenden Beitrag zum Ha~ miltonoperator eines Elektrons im homogenen Magnetfeld B HB = HB,L + HB,S = − q ~ ~ ·B ~. L + 2S 2m Wie schon in der Diskussion der allgemeinen Drehimpulskopplung vorweggenommen, sehen wir, dass es nicht der Gesamtdrehimpuls ~ +S ~ J~ = L ~ und S ~ separat an B ~ koppeln. ist, der an das Magnetfeld koppelt, sondern dass im Allgemeinen L 1.3.2 Normaler Zeemann-Effekt Wir möchten im Folgenden den normalen Zeemann-Effekt diskutieren, wobei wir im Widerspruch zu Theorie und Experiment den Spin vernachlässigen um die Berechnung einfacher zu gestalten. Der realistische Fall – der anomale Zeemann-Effekt – soll später behandelt werden. Wir betrachten den Hamiltonoperator H = H0 + e0 ~ ~ L·B 2m (q = −e0 ) auf H = L2 (R3 ), wobei H0 = P~ 2 γ − , 2m |~x| γ= e20 4π0 der Hamiltonoperator des Wasserstoffatoms (unter Vernachlässigung von z.B. Spin und bei abgeschaltetem Magnetfeld) ist. Wenn wir annehmen, dass das Magnetfeld homogen ist, können wir ~ legen, so dass B ~ = (0, 0, B) ohne Beschränkung der Allgemeinheit die z -Achse in Richtung von B und damit H = H0 + e0 B Lz . 2m Die Eigenwerte und Eigenfunktionen von H0 sind aus der ersten Quantenmechanikvorlesung bekannt. Es gilt H0 |n, l, ml i = En,0 |n, l, ml i , En,0 = − R , n2 n ∈ N, R= wobei R die Rydbergkonstante ist. 32 l ∈ {0, 1, . . . , n − 1} , me40 , 2(4π0 )2 ~2 Die Zustände |n, l, mi sind gleichzeitig Eigenzustände zum Quadrat des Bahndrehimpulses 2 ~ L sowie zu Lz mit den bekannten Eigenwerten ~2 l(l + 1) und ~ml . Es gilt daher ml ∈ {−l, . . . , l} und die Zustände |n, l, ml i sind ebenfalls Eigenzustände des vollen Hamiltonoperators H . Tatsächlich gilt H|n, l, ml i = En,ml |n, l, ml i , En,ml = En,0 + ~e0 B ml . 2m Pn−1 2 Im Fall B = 0 sind die Energieeigenwerte des Wasserstoffatoms l=0 (2l + 1) = n -fach 2 entartet, d.h. es gibt für jeden Eigenwert En,0 n dazugehörige Eigenzustände. Diese Entartung wird durch die Kopplung an das Magnetfeld teilweise aufgehoben, da die Energieniveaus sich abhängig von der magnetischen Quantenzahl ml verschieben. Entsprechend spalten sich die Spektrallinien des Wasserstoffs im Magnetfeld auf. Die durch die obige Rechnung vorhergesagte Aufspaltung entspricht aber nicht der gemessenen Aufspaltung. Der Grund hierfür ist die Vernachlässigung des Spins. Tatsächlich war die Diskrepanz zwischen den beobachtenen und der durch den (normalen) Zeemann-Effekt vorhergesagten Aufspaltung der Spektrallinien ein Indiz für die Existenz des Spins als zusätzliche Eigenschaft bzw. zusätzlicher Freiheitsgrad eines Elektrons. 1.3.3 Aharonov-Bohm-Effekt Ein äußerst verbüffender quantenmechanischer Effekt in einem elektromagnetischen Feld, der erneut die Unterschiede zwischen klassischer und Quantenphysik offenbart, ist der AharonovBohm-Effekt. Dazu betrachten wir folgende Versuchsanordnung: Wir modifizieren die Versuchsanordnung 33 des Doppelspaltexperimentes für Elektronen derart, dass wir hinter die Wand mit den zwei Spalten eine dünne stromdurchflossene Spule anbringen, die parallel zu den Spalten ausgerichtet ~ 6= 0 existiert, ist. Ziel ist es, dass innerhalb der Spule ein nichtverschwindendes Magnetfeld B ~ ~ während überall außerhalb der Spule B = 0 (außerdem soll E überall verschwinden). Das ist allerdings nur exakt der Fall wenn die Spule unendlich lang ist, im Realfall gibt es also ein kleines nichtverschwindendes Magnetfeld außerhalb der Spule. Dieses lässt sich aber experimentell gut kontrollieren, und es lässt sich a posteriori ausschließen, dass es für den im Folgenden beschriebenen Effekt verantwortlich ist. Daher können wir guten Gewissens annehmen, dass außerhalb ~ = 0 gilt. Zudem nehmen wir an, dass der Spulendurchmesser klein gegenüber dem der Spule B Spaltabstand ist, so dass klassische Elektronbahnen die Spule nicht berühren und quantenmechanisch die Aufenthaltswahrscheinlichkeit des Elektrons innerhalb der Spule verschwindend gering ist. ~ und damit auch den maIndem wir den Strom durch die Spule kontrollieren, können wir B gnetischen Fluss Z ~ · dΣ ~ B Φ= Σ kontrollieren, wobei Σ eine beliebige zweidimensionale Fäche ist, die die Spule durchschneidet. Inbesondere ist Φ, da das Magnetfeld außerhalb der Spule verschwindet, unabhängig von der Wahl einer solchen Fläche Σ. Wir führen nun das Doppelspaltexperiment durch: Wir schießen in endlichen Zeitabständen N 1 einzelne Elektronen auf die Spaltebene und nehmen das Interferenzmuster auf. Im Falle Φ = 0 sieht man das übliche Muster, bei einer typischen Versuchsanordnung ist in der Mitte des Schirms das Maximum der Verteilung. Dreht man das Magnetfeld auf, dann ändert sich das Interferenzmuster stetig. Bei qΦ = π~ sieht man die größte Änderung und das zentrale Maximum “spaltet sich auf”, bei qΦ = 2π~ und verallgemeinert bei qΦ = 2nπ~ mit n ∈ Z sieht man wiederum keine Änderung mehr. Klassisch erwarten wir keinen Einfluss auf das Interferenzmuster, da das Elektron sich niemals im Bereich des nichtverschwin~ = 0 (und E ~ = 0 was wir denden Magnetfeldes aufhält und die Lorentzkraft verschwindet wenn B voraussetzen) ist. Wie ist es also möglich, dass das Elektron das Magnetfeld trotzdem “sieht”? Um diesen Effekt theoretisch herzuleiten erinnern wir uns an einige Tatsachen aus der Elektrodynamik. Wir betrachten eine geschlossene Kurve γ , die eine Fläche Σ umschließt, d.h. γ = ~ zu B ~ ∂Σ. Nach dem Stokes’schen Satz gilt für ein Vektorpotential A Z γ ~ · d~γ = A Z Σ ~ × A) ~ · dΣ ~ = (∇ Z ~ · dΣ ~ = B Σ Φ wenn γ die Spule umläuft8 . 0 wenn γ die Spule nicht umläuft. Daraus können wir Zweierlei folgern: 1. Auch wenn das Vektorpotential “unphysikalisch” ist, da zwei sich um eine Eichung unter~ + ∇λ ~ 9 zum selben Magnetfeld B ~ =∇ ~ ×A ~=∇ ~ ×A ~0 ~ und A ~0 = A scheidende Potentiale A 8 9 Das gilt für einen Umlauf gegen den Uhrzeigersinn, andernfalls gibt es ein Vorzeichen. ~ ·A ~ = 0 erfüllen sollen mit ∆λ = 0 wenn beide Vektorpotentiale die Coulombeichbedingung ∇ 34 führen, ist das Integral des Vektorpotentials entlang einer geschlossenen Kurve physikalisch und kann den eingeschlossenen magnetischen Fluss “messen” auch wenn überall auf der Kurve das Magnetfeld verschwindet. Das liegt natürlich daran, dass das Vektorpotential selbst auf der Kurve nicht verschwindet. Z.B. ist −y Φ ~ x) = x A(~ 2π(x2 + y 2 ) 0 für ~ x außerhalb der Spule ein mögliches Vektorpotential eines Spulenfeldes für eine Spule in z -Richtung mit magnetischem Fluss Φ. 2. Für zwei Punkte ~ x0 und ~x und zwei Kurven γ~x0 ,~x , γ~x0 0 ,~x die beide bei ~x0 beginnen und bei ~x ~ zu B ~ enden gilt für ein Vektorpotential A Z γ~x0 ,~x ~ · d~γ = A Z γ~x0 ~ · d~γ 0 A wenn γ~x0 ,~x , γ~x0 0 ,~x beide ober-/unterhalb der Spule verlaufen. x 0 ,~ D.h. diese Integrale hängen nur von ~ x und ~x0 ab. Tatsächlich kann man zeigen, dass Z ~ ~x ∇ |{z} ~ · d~γ = A(~ ~ x) . A γ~x0 ,~x Gradient nach ~ x Um das Experiment quantenmechanisch zu beschreiben suchen wir nach Lösungen der sta~ tionären Schrödingergleichung im Magnetfeld B ~ P~ − q A HψA~ (~x) = 2 ψA~ (~x) = 2m ~~ i∇ ~ − qA 2 ψA~ (~x) = EψA~ (~x) . 2m ~ indiziert um zu betonen, dass sie im AllgemeiDie Wellenfunktionen ψA~ (~ x) haben wir hier mit A nen von der Wahl des uneindeutigen Vektorpotentials zum eindeutigen Magnetfeld abhängen. Das Betragsquadrat |ψA~ (~ x)|2 darf allerdings nicht von der Wahl des Vektorpotentials abhängen, weil es einer direkten physikalischen Observablen entspricht. Wir machen daher für (~ x ausserhalb der Spule und) ~ x0 beliebig den Ansatz ψA~ (~x) = fA~ (~x)ψ0 (~x) , fA~ (~x) = exp iq ~ Z ! ~ · d~γ A . γ~x0 ,~x Aus der vorigen Diskussion folgt ~~ ~ ~ (~x) ∇fA~ (~x) = q Af A i ⇒ ⇒ ~~ ~~ ~ ∇ − q A fA~ (~x)ψ0 (~x) = fA~ (~x) ∇ψ x) , 0 (~ i i HψA~ (~x) = fA~ (~x)Hψ0 (~x) . ~ = Also löst ψA~ (~ x) die Schrödingergleichung mit A 6 0 genau dann wenn ψ0 (~x) die Schrödinger~ = 0 löst und es gilt die Eichinvarianzbedingung |ψ ~ (~x)|2 = |ψ ~ 0 (~x)|2 = |ψ0 (~x)|2 . gleichung mit A A A 35 Das beim Doppelspaltexperiment gemessene Interferenzmuster entspricht dem Betragsquadrat 2 x) + ψA,↓ x) ψA,↑ ~ (~ ~ (~ der Superposition aus der Wellenfunktion ψA,↑ x) die der Situation “oberer Spalt offen, unterer ~ (~ Spalt geschlossen” und der Wellenfunktion ψA,↓ x) die der Situation “oberer Spalt geschlossen, ~ (~ unterer Spalt offen”, entspricht. Die Wellenfunktionen ψA,↑ x), ψA,↓ x) sollen stetig in ~x sein und für ~x weit vor der Spaltebene ~ (~ ~ (~ übereinstimmen. Daraus folgt: a) Die Integrationspfade γ↑ , γ↓ in ψA,↑ x) = exp ~ (~ iq ~ Z ! ~ · d~γ A ψ0,↑ (~x) , γ↑ ψA,↓ x) = exp ~ (~ iq ~ Z ! ~ · d~γ A ψ0,↓ (~x) , γ↓ müssen beim gleichen Startpunkt ~ x0 beginnen; dieser kann ohne Beschränkung der Allgemeinheit als sich vor der Spaltebene befindend angenommen werden. b) Der Pfad γ↑ muss für ~ x jenseits der Spaltebene durch den oberen Spalt führen, der Pfad γ↓ entsprechend durch den unteren. Aus diesen beiden Aussagen folgt wiederrum, dass für ein ~ x jenseits der Spaltebene (z.B. auf dem Schirm) 2 x) + ψA,↓ x) ψA,↑ ~ (~ ~ (~ !! Z Z iq iq ~ · d~γ + ~ · d~γ − =|ψ0,↑ (~x)| + |ψ0,↓ (~x)| + 2< A A ~ γ↑ ~ γ↓ !! Z iq 2 2 ∗ ~ · d~γ =|ψ0,↑ (~x)| + |ψ0,↓ (~x)| + 2< ψ0,↑ (~x)ψ0,↓ (~x) exp A ~ γ↓ −γ↑ iqΦ 2 2 ∗ =|ψ0,↑ (~x)| + |ψ0,↓ (~x)| + 2< ψ0,↑ (~x)ψ0,↓ (~x) exp . ~ 2 2 ∗ (~x)ψ0,↓ (~x) exp ψ0,↑ Hierbei ist γ↓ − γ↑ der geschlossene Pfad, der sich ergibt wenn man γ↓ entlanggeht und dann entlang γ↑ zurückgeht. Wir sehen also, wie die nichttriviale zusätzliche relative Phase qΦ/~ den Interferenzterm und damit das Interferenzmuster abändert. Zum Abschluss soll betont werden, dass man die Integrationspfade nicht als klassische Pfade des Elektrons auffassen darf, da das Doppelspaltexperiment ja gerade zeigt, dass man einem Elektron, dass auf den Schirm auftrifft, keinen klassischen Pfad zuweisen kann. Die Aussage, dass “die Phase qΦ/~ der Phasenverschiebung zwischen einem Elektron, das obenherum fliegt und einem Elektron, das untenherum fliegt, entspricht” ist also keine gute Interpretation des Effektes. 36 1.4 Zeitunabhängige Störungstheorie Es gibt wenige physikalische Systeme die sich exakt (klassisch und) quantenmechanisch berechnen lassen. Einige davon haben wir bereits in dieser Vorlesung oder in Quantenmechanik 1 kennengelernt: 1. das freie Teilchen, 2. der harmonische Oszillator, 3. das Teilchen im Coulombpotential (Wasserstoffatom in der minimalen Version), 4. Systeme endlich vieler Spins, 5. . . . , 6. und Kombinationen dieser Systeme. Diese Modellsysteme sind in einigen Situationen gute Näherungen für ein realistisches System. Im Allgemeinen hat man es aber mit komplizierteren Systemen zu tun, die nicht in diese Klasse fallen, so dass man sich etwas einfallen lassen muss um zumindest einige Berechnungen durchführen zu können oder zumindest approximative Lösungen zu bekommen. Eine Methode, die sich dabei gut bewährt hat, und die Grundlage der meisten Berechnungen in der Teilchenphysik dargestellt, ist die Störungstheorie. 1.4.1 Allgemeine Herleitung Um die Methode der Störungstheorie zu entwickeln betrachten wir den Hamiltonoperator H = H0 + λH1 wobei H0 der ungestörte Hamiltonoperator ist, und wir λH1 , mit einer dimensionslosen Konstanten λ und einem Operator H1 als kleine Störung auffassen wollen. Es ist nicht im Allgemeinen möglich zu sagen wann λH1 “klein” im Vergleich zu H0 ist, aber wenn λ 1 ist, dann ist das folgende Verfahren oft gut geeignet um ausgehend von den bekannten Eigenzuständen und Eigenwerten von H0 die Eigenzustände und Eigenwerte von H näherungsweise zu berechnen. Wir betrachten zunächst den Fall, dass H1 zeitunabhängig ist. Der zeitabhängige Fall soll später behandelt werden. (0) Dazu seien |n(0) i und En die Eigenzustände und Eigenwerte von H0 H0 |n(0) i = En(0) |n(0) i . 37 (0) Wir nehmen an, dass diese Eigenwerte nicht entartet sind, es gibt zu jedem En also genau einen Eigenzustand. Wir möchten die Eigenzustände |ni und Eigenwerte En von H H|ni = En |ni berechnen. Dazu nehmen wir an, dass diese Größen in eine Potenzreihe entwickelt werden können. En = En(0) + λEn(1) + λ2 En(2) + . . . , |ni = |n(0) i + λ|n(1) i + λ2 |n(2) i + . . . . Wir können nun die Eigenwertgleichung (H0 + λH1 ) |n(0) i + λ|n(1) i + . . . = En(0) + λEn(1) + . . . |n(0) i + λ|n(1) i + . . . nach Potenzen von λ sortieren. Da höhere Potenzen von λ nach Annahme “weniger wichtig sind” als niedrigere Potenzen, verlangen wir, dass die obige Eigenwertgleichung zu jeder Ordnung in λ erfüllt ist. Zur untersten Ordnung bekommen wir erwartungsgemäß H0 |n(0) i = En(0) |n(0) i . Die erste und zweite Ordnung geben hingegen H0 |n(1) i + H1 |n(0) i = En(0) |n(1) i + En(1) |n(0) i H0 |n(2) i + H1 |n(1) i = En(0) |n(2) i + En(1) |n(1) i + En(2) |n(0) i . Wir können diese Gleichungen umschreiben als H0 − En(0) |n(1) i = −H1 |n(0) i + En(1) |n(0) i H0 − En(0) |n(2) i = −H1 |n(1) i + En(1) |n(1) i + En(2) |n(0) i . Wir multiplizieren die obere Gleichung von links mit einem Eigenzustand hm(0) | und erhalten dann ⇒ hm(0) | H0 − En(0) |n(1) i = −hm(0) |H1 |n(0) i + En(1) hm(0) |n(0) i (0) Em − En(0) hm(0) |n(1) i = −hm(0) |H1 |n(0) i + En(1) δmn . Aus dem Fall m = n können wir direkt die erste Korrektur zum Energieeigenwert ablesen En(1) = hn(0) |H1 |n(0) i , nicht ganz überraschend ergibt sich diese Korrektur also als Erwartungswert der Störung im ungestörten Zustand. Aus dem Fall m 6= n können wir dagegen |n(1) i bestimmen. Dazu erinnern wir uns dass |n(0) i ja nach Annahme eine ONB des Hilbertraums ist. Daher können wir |n(1) i in dieser ONB entwickeln |n(1) i = X m |m(0) i hm(0) |n(1) i = | {z } (1) cm,n 38 X m (0) c(1) m,n |m i . Aus der Gleichung zur ersten Ordnung mit m 6= n erhalten wir entsprechend hm(0) |H1 |n(0) i (0) (1) c(1) m,n = hm |n i = (0) für m 6= n . (0) En − Em (1) Zur eindeutigen Bestimmung von |n(1) i fehlt uns noch der Koeffizient cn,n , dieser ist jedoch durch die hergeleiteten Gleichungen nicht festlegbar. Diese Unbestimmtheit entspricht der Tatsache, dass der Zustand |ni nur bis auf einen komplexen Vorfaktor festgelegt ist, da zwei “parallele Vektoren” in einem Hilbertraum demselben physikalischen Zustand entsprechen. Es ist nicht zweckmässig diesen Vorfaktor z.B. durch die Bedingung festzulegen, dass |ni normiert ist. Für Berechnungen ist es stattdessen besser, diesen Vorfaktor durch die Bedingung hn(0) |ni = 1 zu fixieren. Das impliziert hn(0) |n(k) i = 0 für alle k ≥ 1 und damit insbesondere (0) (1) c(1) n,n = hn |n i = 0 . Damit erhalten wir |n(1) i = X hm(0) |H1 |n(0) i (0) En m6=n − (0) Em |m(0) i . Aus den bisherigen Überlegungen folgt für die Korrektur zur Energie in zweiter Ordnung En(2) = hn(0) | H0 − En(0) |n(2) i + hn(0) |H1 |n(1) i + En(1) hn(0) |n(1) i | {z } {z } | = =0 X |hm(0) |H1 |n(0) i|2 (0) (0) En − Em m6=n =0 . Dieses Verfahren lässt sich zu beliebig hohen Ordnungen fortsetzen. Oft geben aber die untersten ein oder zwei Ordnungen schon gute Resultate. (0) Wir haben zu Beginn angenommen, dass die Energien En nicht entartet sind. Ist das der Fall, muss man ein wenig mehr rechnen. Dies ist allerdings nicht nötig wenn der Operator H1 (0) diagonal in dem Unterraum zur Energie En (0) ist. D.h. seien |nk i k ∈ {1, . . . , N } die (gewähl(0) ten10 ) Eigenvektoren der ONB aus Eigenzuständen von H0 zur Energie En . Dann können wir die Matrixelemente (0) (0) H1,k,l = hnk |H1 |nl i (1) definieren. Ist H1,k,l ∝ δkl , dann gilt die Formel für En unverändert, während bei den Formeln (2) (0) für |n(1) i und En die Summe alle “Indizes zum selben Eigenwert En ” ausspart. Diese Diagonalitätseigenschaft von H1 wird in allen in der Vorlesung und den Übungen diskutierten Beispielen vorhanden sein. 10 Diese sind für N > 1 nicht eindeutig, wenn man keine weitere Bedingung fordert. 39 1.4.2 Harmonischer Oszillator im Gravitationsfeld Bevor wir Anwendungen der Störungstheorie besprechen in denen die Berechnungen (im Rahmen der nichtrelativistischen Quantenmechanik) nur störungstheoretisch möglich sind, wollen wir die Gültigkeit dieser Methode an einem Beispiel testen, das exakt gelöst werden kann. Dazu betrachten wir den harmonischen Oszillator im Gravitationsfeld der Erde. Der Hamiltonoperator ist H= P2 mω 2 2 + Q + mgQ {z } |2m {z 2 } |H 1 H0 wobei wir die Erdbeschleunigung g als “Störparameter” ansehen wollen. Im hier betrachteten Fall spielt es keine Rolle ob g klein in einem geeigneten Sinn ist, da wir das System auch exakt lösen können. Tatsächlich können wir H umschreiben als H= P2 mω 2 2 P2 mω 2 g mg 2 . + Q + mgQ = + Q+ 2 − 2m 2 2m 2 ω 2ω 2 Daraus können wir ablesen, dass der Einfluss der Schwerkraft den Punkt, um den der Oszillator oszilliert verschiebt und zwar so, dass die Rückstellkraft und die Gravitationskraft sich an diesem Punkt gerade ausgleichen. Da die Verschiebung des Oszillationsnullpunktes keinen Einfluss auf die Energieeigenwerte hat, können wir sofort ablesen, dass die Eigenwerte des Oszillators im Gravitationsfeld von der Form En = En(0) − mg 2 1 mg 2 = ~ω n + − 2 2ω 2 2ω 2 sind. Inbesondere sehen wir, dass die exakt berechnete Änderung der Energieeigenwerte quadratisch in g ist. Wenn die störungstheoretische Rechnung sinnvoll ist, müsste sich also zur ersten Ordnung eine verschwindende Korrektur der Erwartungswerte ergeben, während zur zweiten Ordnung bereits das exakte Resultat herauskommen sollte. Um dies zu verifizieren, erinnern wir uns and die Leiteroperatoren a, a† des harmonischen Oszillators 1 a= √ 2 1 d Q+i P d ~ , 1 a† = √ 2 1 d Q−i P d ~ r , d= Diese wirken wie folgt auf die normierten Eigenzustände |n(0) i von H0 : a|n(0) i = √ n|(n − 1)(0) i , a† |n(0) i = √ n + 1|(n + 1)(0) i . Daraus folgen direkt die Eigenwerte von H0 , weil sich dieser Operator als 1 † H0 = ~ω a a + 2 schreiben lässt, wie man leicht verifiziert. Wegen d Q = √ a + a† 2 40 ~ . mω und der Orthogonalität der Zustände |n(0) i gilt ∗ hn(0) |a|n(0) i = hn(0) |a† |n(0) i = 0 ⇒ hn(0) |Q|n(0) i = 0 ⇒ En(1) = hn(0) |H1 |n(0) i = 0 wie erwartet. Andererseits gilt En(2) = X |hm(0) |H1 |n(0) i|2 (0) m6=n 1.4.3 (0) En − Em = m2 g 2 d2 2 X |hm(0) |(a + a† )|n(0) i|2 (0) (0) En − Em ! |h(n − 1)(0) |a|n(0) i|2 |h(n + 1)(0) |a† |n(0) i|2 + ~ω −~ω = m2 g 2 d2 2 = m2 g 2 d2 mg 2 (n − (n + 1)) = − 2 . 2~ω 2ω m∈{n−1,n+1} Feinstruktur des Wasserstoffatoms Als zweite Anwendung der Störungstheorie diskutieren wir die Feinstruktur des Wasserstoffspektrums. Auch hierbei handelt es sich um einen Effekt, der im Prinzip exakt berechnet werden kann. Allerdings ist das nur in der relativistischen Quantenmechanik möglich, in der die Diracgleichung die räumliche und Spindynamik eines Elektrons beschreibt. Diese Gleichung soll hier nicht vollständig und im Detail diskutiert werden. Stattdessen möchten wir nur einige Aspekte der Diracgleichung hervorheben: 1. Der nichtrelativistischen Limes der Diracgleichung im Coulombpotential, d.h. die unterste ~ /(mc) – wobei P~ /m als “Geschwindigkeitsoperator” aufgefasst werden kann Ordnung in P –, ergibt die (nichtrelativistische) Schrödingergleichung im Coulombpotential. Die Diracgleichung ist also eine relativistische Verallgemeinerung der (nichtrelativistischen) Schrödingergleichung für ein Teilchen mit Spin 1/2. ~ er2. Der nichtrelativistische Limes der Diracgleichung in einem homogenen Magnetfeld B gibt den bekannten Zusatzbeitrag HB = − q ~ ~ ·B ~ L + 2S 2m zum Hamiltonoperator. Der Spin ist also eine Eigenschaft, die durch die relativistische Quantenmechanik vorhergesagt wird, und zwar mit dem (fast) korrekten Landé-Faktor gs = 2. 3. Die Energieeigenwerte der Diracgleichung sind derart, dass für jeden Eigenwert E auch der Eigenwert −E existiert. Die entsprechenden Zustände mit negativer Energie werden als Zustände des Antiteilchens des Elektrons, des Positrons interpretiert. In diesem Sinne ist die Existenz von Antiteilchen eine Vorhersage der relativistischen Quantenmechanik. 41 ~ /(mc) und betrachtet nicht 4. Entwickelt man die Diracgleichung im Coulombpotential in P nur die unterste Ordnung, sondern auch noch die nächsthöhere, erhält man folgende Zusatzbeiträge zum Hamiltonoperator des Elektrons im Coulombpotential: a) Erste relativistische Korrektur zur kinetischen Energie. Die Entwicklung der relativistischen Energie-Impuls-Beziehung 2 2 2 p p ~ 1 p ~ 2 E = m2 c4 + p~ 2 c2 = mc + − + ... 2m 8 m3 c2 ergibt zur ersten Ordnung in p ~/(mc) einen Zusatzterm der analog im Hamiltonoperator dem Zusatzbeitrag 2 ~2 P 1 =− 8 m3 c2 HR.K. entspricht. b) Spin-Bahn-Kopplung. Die Diracgleichung liefert ebenfalls einen Term, der den Spin und den Bahndrehimpuls des Elektrons miteinander koppelt HS.B. = 1 γ ~ ~ 1 γ ~ 2 ~ 2 ~ 2 . S · L = J −L −S 2m2 c2 |~x|3 4m2 c2 |~x|3 Dieser Term kann so interpretiert werden, dass das Elektron in seinem Ruhesystem das Magnetfeld des (sich bewegenden) Kerns spürt, das über den üblichen Pauliterm ~ ·B ~ an das magnetische Moment des Spins koppelt. Wie bereits vorweggenommen, ∝S ~ und S ~ selbst keine Erhaltungsgrößen ist diese Kopplung dafür verantwortlich, dass L ~ +S ~ der Fall ist. des Systems sind, während das für den Gesamtdrehimpuls J~ = L c) Darwin-Term. Der dritte Korrekturbeitrag von der Diracgleichung ist von der Form HDa. = − ~2 γ π~2 γ ∆ = δ(~x) . 8m2 c2 |~x| 2m2 c2 Dieser Term hat als Ursache die sogenannte “Zitterbewegung” des Elektrons: Die Existenz der bereits erwähnten Lösungen der Diracgleichung zu negativer Energie führt dazu, dass die Position des Elektrons nur bis auf seine Comptonwellenlänge λCo. = ~ mc genau bestimmt ist. Entsprechend spürt das Elektron das Coloumbpotential nicht direkt, sondern gemittelt über Abstände λCo. . Der Term HDa. kann als Resultat der Ersetzung γ γ − →− |~x| |~x| mittel, λCo. interpretiert werden. 42 Wir möchten nur den Einfluss der relativistischen Korrekturen auf das Spektrum des Wasserstoffatoms in erster Ordnung Störungstheorie berechnen. Der ungestörte Hamiltonoperator sei H0 = P~ 2 γ P~ 2 ~cα − = − , 2m |~x| 2m |~x| α= e20 1 ' , ~c(4π0 ) 137 wobei α die Sommerfeld’sche Feinstrukturkonstante ist. Die Energieeigenwerte En,0 = − 1 mc2 α2 me40 = − , 2(4π0 )2 ~2 n2 2 n2 sind bekanntlich entartet. Im Hinblick auf die Spin-Bahn-Kopplung wählen wir als ONB von Eigenzuständen zu H0 die Gesamtdrehimpuls-ONB |n; j, mj ; l, si , n ∈ N0 , l ∈ {0, . . . , n − 1} , j =l± 1 , 2 mj ∈ {−j, . . . , j} . Die erste Korrektur der Energieniveaus ist der Erwartungswert der Störung H1 = HR.K. + HS.B. + HDa. in den Zuständen |n; j, mj ; l, si. Nach einer längeren Rechnung, die wir hier nicht im Detail besprechen wollen, bekommt man En,j = En,0 + hn; j, mj ; l, s|H1 |n; j, mj ; l, si !! α2 3 n mc2 α2 1− 2 − . =− 2 n2 n 4 j + 21 Die Energiekorrekturen sind also von der Ordnung α4 und damit im Vergleich zun den ungestörten Energien um den Faktor α2 ≈ 5.3 × 10−5 kleiner. Darüber hinaus wird die Entartung der Energieniveaus teilweise in Abhängigkeit von der Gesamtdrehimpulsquantenzahl j aufgehoben. Dies ist die Feinstruktur des Spektrums. Auf Grundlage der Diracgleichung können die Energieeigenwerte exakt berechnet werden. Man erhält −2 − 21 s 2 1 1 = mc2 1 + α2 n − j + + j+ − α2 − mc2 2 2 En,j,exakt Die obige störungstheoretische Berechnung entspricht dem α4 -Beitrag der Taylorentwicklung dieses exakten Resultats. Für schwerere Elemente gilt die obige Formel mit der Ersetzung α → Zα mit der Kernladungszahl Z . Da j ≥ 21 kann man also ablesen, dass Atome mit Z > 1/α ≈ 137 nicht mehr (stabil) existieren können, da die Energieeigenwerte komplex werden und damit der Hamiltonoperator nicht mehr selbstadjungiert ist. Nimmt man die endliche Kernausdehnung in Betracht, bekommt man die verfeinerte Stabilitätsgrenze Z ≈ 172. 43 1.5 Zustandsgemische und Dichtematrizen Bisher haben wir Zustände eines quantenmechanischen Systems mit Vektoren (oder besser “Richtungen”11 ) in einem Hilbertraum identifiziert. Die Zustände dieser Art nennt man reine Zustände, physikalisch entsprechen sie optimalen Präparationen eines Systems. Tatsächlich gibt es aber Zustände, die sich nicht derart beschreiben lassen, die gemischten Zustände oder Zustandsgemische. Viele physikalische Situationen lassen sich nicht mit reinen Zuständen beschreiben, sondern nur mit Zustandsgemischen, z.B.: 1. Ein Gas einer bestimmten Temperatur ist in einem gemischten Zustand. Details dazu im zweiten Vorlesungsteil zur Statistik. 2. Der Eingangszustand im Stern-Gerlach-Experiment ist ein gemischter Zustand. Details dazu in den Übungsaufgaben. Um gemischte Zustände mathematisch zu beschreiben, müssen wir zunächst eine neue, aber äquivalente, Schreibweise für reine Zustände und Erwartungswerte in diesen Zuständen entwickeln. 1.5.1 Die Dichtematrix eines reinen Zustandes Dazu betrachen wir einen beliebigen reinen Zustand ψ , d.h. einen normierten Vektor |ψi in einem Hilbertraum H . Aus diesem Vektor können wir den uns schon bekannten Operator ρψ = |ψihψ| konstruieren. Dieser wirkt auf einen anderen reinen Zustand |φi als ρψ |φi = |ψihψ|φi = hψ|φi|ψi . Der Operator ρψ projiziert also den Vektor |φi auf den Vektor – oder besser, die Richtung des Vektors – |ψi, darum nennen wir ihn einen Projektor. Allgemein ist ein Projektor ein linearer Operator A auf einem Hilbertraum H , der selbstadjungiert ist und dessen Quadrat wieder den Operator selbst gibt, d.h. A† = A , A2 = A . Wir verifizieren leicht, dass ρψ diese Eigenschaften besitzt: † † ρ†ψ = (|ψihψ|)† = |ψi (|ψi)† = (|ψi)† (|ψi)† = |ψihψ| , ρ2ψ = |ψi hψ|ψi hψ| = |ψihψ| = ρψ . | {z } =1 11 Der mathematisch korrekte Begriff ist Strahl. 44 Beispiel: Es sei |ψa,b i ∈ C2 der normierte Vektor a |ψa,b i = p , 2 2 |a| + |b| b 1 Dann ist ρψa,b 1 = |ψa,b ihψa,b | = 2 |a| + |b|2 a, b ∈ C . 2 1 a |a| ab∗ ∗ ∗ a b = 2 . b |a| + |b|2 a∗ b |b|2 Allgemeine Projektoren projizieren nicht auf einen einzelnen Vektor, sondern auf einen Unterraum des Hilbertraums, z.b. eine “Fläche” im Hilbertraum. Der Einsoperator 1 lässt sich z.B als ein Projektor auf den ganzen Hilbertraum auffassen, da 1† = 1 und 12 = 1. Wir haben bereits oft verwendet, dass sich der Einsoperator als Summe der Projektoren auf die Vektoren einer ONB |ni schreiben lässt X 1= |nihn| . n Im Allgemeinen ist die Summe mehrerer Projektoren aber nicht wieder ein Projektor12 . Die Tatsache, dass ρ2ψ = ρψ impliziert inbesondere, dass die Eigenwerte von ρψ nur 1 oder 0 sein können. Das folgt aus der Tatsache, dass, wenn a ein Eigenwert von A ist, a2 ein Eigenwert von A2 ist und alle Eigenwerte von A2 von dieser Form sind. Beispiel: Für den besprochenen Vektor |ψa,b i ∈ C2 ist ρψa,b eine 2 × 2-Matrix. Allgemein gilt, dass die Spur – d.h. die Summe der Diagonalelemente – einer Matrix die Summe ihrer Eigenwerte (mit Vielfachheit) ist, während die Determinante einer Matrix das Produkt der Eigenwerte (mit Vielfachheit) ist. Für eine 2 × 2-Matrix kann man die Eigenwerte also direkt aus der Spur und der Determinante berechnen. Es gilt Sp(ρψa,b ) = |a|2 + |b|2 = 1 = 1 + 0, |a|2 + |b|2 det(ρψa,b ) = |a|2 |b|2 − ab∗ a∗ b (|a|2 + |b|2 )2 = 0 = 1 · 0. Daraus folgt, dass ρψa,b die Eigenwerte 1 und 0 hat. Wir nennen den Operator ρψ die Dichtematrix oder den statistischen Operator des Zustandes ψ . Wie lassen sich Erwartungswerte im Zustand ψ mit Hilfe von ρψ berechnen? Dazu brauchen wir den Begriff der Spur eines Operators. Die Spur eines Operators ist die Verallgemeinerung der Spur einer Matrix. Gegeben eine ONB |ni eines Hilbertraums H , lassen sich die Matrixelemente Amn eines Operators A auf H bekanntermaßen als Amn = hm|A|ni definieren. Wir definieren die Spur von A als die Spur der Matrix Amn : Sp(A) = X Ann = n 12 X hn|A|ni . n Dies gilt nur, wenn die aufsummierten Projektoren orthogonal sind, d.h. die Summe A + B von zwei Projektoren A und B ist wieder ein Projektor wenn AB = 0 (und damit BA = 0). 45 Die Spur hat einige wichtige mathematische Eigenschaften. 1. Die Spur hängt nicht von der Wahl der ONB |ni ab. Man kann zur Berechnung der Spur also eine beliebige ONB verwenden. 2. Die Spur eines Produktes zweier Operatoren hängt nicht von der Reihenfolge ab, d.h. es gilt Sp(AB) = Sp(BA) . 3. Das komplexkonjugierte der Spur ist die Spur des adjungierten Operators. (Sp(A))∗ = Sp(A† ) Es sei A eine Observable, also ein selbstadjungierter Operator A. Wir berechnen nun den Ausdruck Sp(ρψ A) = Sp(Aρψ ) unter Verwendung einer beliebigen ONB |ni: Sp(ρψ A) = X hn|ρψ A|ni = n = hψ|A X n X hn|ψi hψ|A|ni = | {z } | {z } Zahl Zahl X n hψ|A|ni hn|ψi | {z } | {z } Zahl Zahl |nihn| |ψi = hψ|A|ψi = hAiψ n | {z =1 } Wir sehen also, dass sich der Erwartungswert hAiψ der Observable A im Zustand ψ auf zwei Arten und Weisen ausrechnen lässt: 1. als Spur Sp(ρψ A) des Produktes der Dichtematrix ρψ und des Operators A 2. und als Skalarprodukt des Vektors |ψi mit dem Vektor A|ψi. Insbesondere ist der Erwartungswert des Einsoperators gerade das Quadrat der Norm des Vektors |ψi h1iψ = Sp(ρψ 1) = Sp(ρψ ) = hψ|ψi = 1 . Die Tatsache, dass |ψi normiert ist, ist also äquivalent zur Tatsache, dass die Spur der Dichtematrix ρψ gleich 1 ist. Andererseits folgt die Tatsache, dass Erwartungswerte von selbstadjungierten Operatoren immer reell sind, in der Berechnung mittels der Dichtematrix aus der dritten erwähnten mathematischen Eigenschaft der Spur und der Selbstadjungiertheit von ρψ : (hAiψ )∗ = (Sp(ρψ A))∗ = Sp((ρψ A)† ) = Sp(A† ρ†ψ ) = Sp(Aρψ ) = Sp(ρψ A) = hAiψ . Wir fassen die charakteristischen Eigenschaften der Dichtematrix ρψ eines reinen Zustandes ψ zusammen: 1. Sp(ρψ ) = 1. Dies entspricht der Tatsache, dass der Erwartungswert des Einsoperators 1 ist, d.h. der Zustand ist normiert. 46 † 2. ρψ = ρψ . Dies entspricht der Tatsache, dass Erwartungswerte von selbstadjungierten Operatoren – d.h. Observablen – reell sind. 3. ρ2ψ = ρψ . Dies entspricht der Tatsache, dass die Eigenwerte von ρψ nur 1 oder 0 sind. 1.5.2 Gemischte Zustände Allgemeine quantenmechanische Zustände ψ erhält man nun, indem man die dritte Eigenschaft in dem Sinne aufweicht, dass man nicht notwendigerweise verlangt, dass ρ2ψ = ρψ und damit, dass die Eigenwerte von ρψ nur 1 oder 0 sind, sondern nur verlangt, dass die Eigenwerte von ρψ alle ≥ 0 sind – die physikalische Bedeutung dieser Bedingung wird später diskutiert. Aus der Bedingung, dass Sp(ρψ ) = 1 folgt dann sogar, dass die Eigenwerte ≤ 1 sind. In den Postulaten der Quantenmechanik im Abschnitt 1.1.2 verallgemeinern wir das Zustandsund das Erwartungswertpostulat also folgendermaßen: • Zustände ψ eines physikalischen Systems werden durch eine Dichtematrix repräsentiert, d.h. einen linearen Operator ρψ auf einem Hilbertraum H der folgende Eigenschaften erfüllt: ρ†ψ = ρψ , Die Eigenwerte von ρψ sind ≥ 0. Sp(ρψ ) = 1 , Gilt ρ2ψ = ρψ , spricht man von einem reinen Zustand und es existiert ein Vektor |ψi ∈ H so dass ρψ = |ψihψ| . Ist das nicht der Fall, so nennt man ψ einen gemischten Zustand. • Der Erwartungswert hAiψ einer Observable A in einem Zustand ψ ist gegeben durch hAiψ = Sp(ρψ A) Er entspricht dem Mittelwert der Messwerte, die sich aus einer wiederholten Messung an einem Ensemble N 1 identisch präparierter Systeme ergeben. Im Falle eines reinen Zustandes gilt hAiψ = hψ|A|ψi . Warum nennt man nicht-reine Zustände gemischt? Das liegt daran, dass man zeigen kann, dass die Dichtematrix ρψ eines gemischten Zustandes sich immer als konvexe Kombination von Dichtematrizen reiner Zustände schreiben kann. D.h. es existieren Vektoren |ψi i, i ∈ {1, . . . , N } und Koeffizienten ci ≥ 0 , N X i=1 47 ci = 1 so dass ρψ = N X ci ρψi = i=1 N X ci |ψi ihψi | . i=1 Dabei ist N = ∞ erlaubt und es ist erlaubt, dass die |ψi i nicht alle linear unabhängig oder gar orthogonal sind. Für den Erwartungswert einer Observablen A gilt folglich hAiψ = Sp(ρψ A) = N X ci Sp(ρψi A) = i=1 N X ci hAiψi = i=1 N X ci hψi |A|ψi i . i=1 Daher interpretieren wir ci als die Wahrscheinlichkeit, dass das System im reinen Zustand ψi ist. Diese statistische Unsicherheit entspricht einer klassischen Unsicherheit. Diese besteht in gemischten Zuständen zusätzlich zur quantenmechanischen Unsicherheit, mit der einzelne Messungen von Observablen in reinen Zuständen behaftet sind. Zur Verdeutlichung sei |ni eine ONB aus Eigenzuständen von A mit Eigenwerten an . Dann gilt hAiψ = = N X i=1 N X X i=1 = ci hψi |A|ψi i , X aus Kapitel 1.1.2 : hψi |A|ψi i = X |hn|ψi i|2 an n ci |hn|ψi i|2 an n pn an , pn = n N X ci |{z} i=1 klass. Wahrsch. dass System im Zust. ψi ist |hn|ψi i|2 | {z } . QM-Wahrsch. dass Zust. ψi bei Messung von A in Zust. |ni überg. Insbesondere ist also im obigen Ausdruck der Koeffizient pn von an die gemischt klassischquantenmechanische Wahrscheinlichkeit, bei einer Messung der Observable A im Zustand ψ den Messwert an zu finden. Die Zerlegung eines gemischten Zustandes in reine Zustände ist im Allgemeinen nicht eindeutig. Wegen pn = N X i=1 ci |hn|ψi i|2 = N X ci hn|ψi ihψi |ni = hn|ρψ |ni i=1 ist die physikalisch relevante Wahrscheinlichkeit pn aber unabhängig von der gewählten Zerlegung. Jetzt könner wir auch die Bedingung, dass die Eigenwerte von ρψ ≥ 0 sind verstehen. Diese Bedingung garantiert nämlich, dass ci ≥ 0 und damit, dass pn ≥ 0 und die Interpretation der pn als Wahrscheinlichkeiten sinnvoll ist. Diese Interpretation ist weiterhin auch nur dann konsistent, P wenn n pn = Sp(ρψ ) = 1, was die Spurbedingung erklärt. 48 1.5.3 Unterschiede zwischen reinen und gemischten Zuständen Um die Unterschiede zwischen reinen und gemischten Zuständen nochmals zu verdeutlichen betrachten wir zwei reine Zustände |ϕ1 i und |ϕ2 i und konstruieren daraus die reine Superposition 1 |ψsup i = √ (|ϕ1 i + |ϕ2 i) , N N = (hϕ1 | + hϕ2 |) (|ϕ1 i + |ϕ2 i) und den gemischten Zustand ρψgem = 1 (|ϕ1 ihϕ1 | + |ϕ2 ihϕ2 |) . 2 Es sei A eine Observable. Für den Erwartungswert von A in den konstruierten Zuständen berechnen wir hAiψsup = hψsup |A|ψsup i = 1 (hϕ1 |A|ϕ1 i + hϕ1 |A|ϕ2 i + hϕ2 |A|ϕ1 i + hϕ2 |A|ϕ2 i) , N hAiψgem = Sp(ρψgem A) = 1 (hϕ1 |A|ϕ1 i + hϕ2 |A|ϕ2 i) . 2 Wir sehen, also, dass im Erwartungswert des gemischten Zustandes die für eine Superposition charakteristischen Interferenzterme fehlen. Besonders anschaulich ist das am Beispiel des Doppelspaltexperimentes mit Elektronen. Hier ist der Zustand des Elektrons hinter der Spaltebene im Fall dass beide Spalte geöffnet sind eine Superposition aus dem reinen Zustand ψ↑ , der der Situation “oberer Spalt geöffnet, unterer Spalt geschlossen” und dem reinen Zustand ψ↓ , der der Situation “oberer Spalt geschlossen, unterer 49 Spalt geöffnet” entspricht. Modifiziert man das Doppelspaltexperiment derart, dass immer nur ein Spalt geöffnet ist, wobei für jedes abgeschossene Elektron per Münzwurf festgelegt wird welcher der Spalte geöffnet ist, so befindet sich das Elektron hinter der Spaltebene in dem gemischten Zustand 1 (|ψ↑ ihψ↑ | + |ψ↓ ihψ↓ |) 2 und das Interferenzmuster verschwindet. Die Koeffizienten 1/2 drücken dabei die klassische ρψgem = statistische Unsicherheit aus, die dadurch resultiert, dass man vorher nicht mit Bestimmtheit weiß, welcher Spalt geöffnet ist. 1.5.4 Die Zeitentwicklung gemischter Zustände Wir kennen bereits die Zeitentwicklung reiner Zustände. Diese wird durch die zeitabhängige Schrödingergleichung i~ ∂ |ψ(t)i = H|ψ(t)i , ∂t bestimmt. Die allgemeine Lösung dieser Gleichung ist i |ψ(t)i = e− ~ Ht |ψ(0)i wobei |ψ(0)i die Rolle eines Anfangswertes spielt. Drückt man diese Tatsachen durch die Dichtematrix ρψ(t) des reinen Zustandes aus, bekommt man wegen i † i † i hψ(t)| = (|ψ(t)i)† = e− ~ Ht |ψ(0)i = (|ψ(0)i)† e− ~ Ht = hψ(0)|e ~ Ht die Beziehung i i i i ρψ(t) = |ψ(t)ihψ(t)| = e− ~ Ht |ψ(0)ihψ(0)|e ~ Ht = e− ~ Ht ρψ(0) e ~ Ht . Hierbei ist es wichtig zu bemerken, dass die Vorzeichen im Exponenten im Gegensatz zum Heisenbergbild gerade “umgekehrt” sind. Darum erfüllt ρψ(t) auch die “Heisenberggleichung mit falschem Vorzeichen” (die von Neumann-Gleichung) i~ ∂ ρ = [H, ρψ(t) ] . ∂t ψ(t) Am einfachsten sieht man diesen “Vorzeichenwechsel” im Heisenbergbild. Für eine Observable AH (t) im Heisenbergbild gilt i i AH (t) = e ~ Ht AH (0)e− ~ Ht , AH (0) = A Für den Erwartungswert im Zustand ψH = ψ(0) gilt also i i i i hAH (t)iψH = Sp(ρψH AH (t)) = Sp ρψH e ~ Ht AH (0)e− ~ Ht = Sp e− ~ Ht ρψH e ~ Ht AH (0) | {z } =ρψ(t) wobei wir ausgenutzt haben dass Sp(AB) = Sp(BA). Das motiviert die folgende Verallgemeinerung des Zeitentwicklungspostulats für das Schrödingerbild aus dem Abschnitt 1.1.2: 50 • Im Schrödingerbild wird die Zeitentwicklung eines Zustandes ψ(t) durch die von NeumannGleichung i~ ∂ ρ = [H, ρψ(t) ] . ∂t ψ(t) bestimmt, deren allgemeine Lösung i i ρψ(t) = e− ~ Ht ρψ(0) e ~ Ht ist. Im Fall dass ψ(t) ein reiner Zustand ist, ist diese Gleichung äquivalent zur zeitab∂ hängigen Schrödingergleichung i~ ∂t |ψ(t)i = H|ψ(t)i, deren allgemeine Lösung |ψ(t)i = i e− ~ Ht |ψ(0)i ist. Kommutiert die Dichtematrix ρψ(t) eines gemischten Zustandes ψ(t) mit dem Hamiltonoperator H so nennt man ψ(t) stationär, da i~ ∂ ρ = [H, ρψ(t) ] = 0 . ∂t ψ(t) Das verallgemeinert stationäre reine Zustände, d.h. Eigenzustände des Hamiltonoperators. Für solche gilt nämlich i i |ψ(t)i = e− ~ Ht |ψ(0)i = e− ~ Et |ψ(0)i und damit i i i i ρψ(t) = |ψ(t)ihψ(t)| = e− ~ Et |ψ(0)ihψ(0)|e ~ Et = |ψ(0)ihψ(0)|e− ~ Et e ~ Et = ρψ(0) . Die Dichtematrix eines Zustandes ist das quantenmechanische Analogon der Wahrscheinlichkeitsdichte %(q, p) in der klassischen Mechanik. Entsprechend ist die von Neumann-Gleichung das quantenmechanische Analogon der Liouville-Gleichung ∂ %(q, p) = {h(q, p), %(q, p)} ∂t mit der Hamiltonfunktion h und der Poisson-Klammer {·, ·}. Wenn [H, ρψ ] = 0, dann haben H und ρψ gemeinsame Eigenvektoren, und zwar gerade die reinen stationären Zustände von H . Ist allgemein A ein selbstadjungierter Operator mit ONB |ni aus Eigenzuständen mit Eigenwerten an so kann man schreiben13 : A= X an |nihn| . Test: A|mi = n X n an |ni hn|mi = am |mi . | {z } =δmn Ist |ni die ONB aus Eigenvektoren von H mit Eigenwerten En gilt also H= X En |nihn| , ρψ = n 13 X pn |nihn| . n Entartete Eigenwerte zählen wir hier mehrfach, entsprechend ihrer Vielfachheit. 51 In diesem Fall ist ψ also eine Mischung aus reinen stationären Zuständen und die Eigenwerte pn von ρψ geben gerade die klassische Wahrscheinlichkeit an, dass ψ im Zustand |ni ist. Wenn die Energieeigenwerte En nicht entartet sind, folgt sogar, dass ρψ eine Funktion fψ (H) von H ist, denn für eine solche gilt fψ (H) = fψ (H)1 = fψ (H) X |nihn| = X n fψ (En )|nihn| . n Die Wahrscheinlichkeiten pn sind also für nicht entartete En von der Form pn = fψ (En ), wobei die Funktion fψ für alle n dieselbe ist. Dieser Sachverhalt wird im zweiten Vorlesungsteil zur Statistik eine wichtige Rolle spielen. Sind die Energieeigenwerte En entartet, dann benötigt man noch weitere Erhaltungsgrößen des Systems um einen gemischen stationären Zustand in der obigen Weise auszudrücken. Beispiel: Wir betrachten die zwei selbstadjungierten Matrizen H= 1 0 , 0 −1 a b + ic , b − ic d A= a, b, c, d ∈ R Es soll gelten [H, A] = 0, daraus folgt 0 −2(b + ic) 2(b − ic) 0 0 = [H, A] = ⇒ b=c=0 ⇒ a 0 . A= 0 d Daher können wir A umschreiben als A= a+d a 0 2 + = 0 d 0 a−d 2 a+d 2 0 − a−d 2 a+d = 2 a−d 1 0 1 0 + . 0 1 0 −1 2 Daher gilt A= 1.6 a+d 2 a−d H + H = fA (H) . 2 2 EPR-Paradoxon, Bell’sche Ungleichungen und Quantenkryptographie Wie wir wissen sind in der Quantenmechanik im Allgemeinen nur statistische Aussagen über den Ausgang einzelner Messungen möglich. Eigenschaften einzelner Teilchen wie Ort, Impuls, Spin in z -Richtung etc. sind im Allgemeinen vor der Messung dieser Eigenschaft nicht scharf definiert, so dass Aussagen wie “Die z -Richtung des Teilchenspins is ~/2” im Allgemeinen nur nach der Messung dieser Spinrichtung möglich sind, vorher aber nicht. Viele Physiker haben diese Tatsache kritisiert und damit die Quantenmechanik an sich. Berühmt ist der (sinngemäße) Ausspruch von Einstein: “Gott würfelt nicht!”. 1.6.1 Das EPR-Paradoxon Ein wichtiger Beitrag zu dieser Diskussion ist ein Argument von Einstein, Podolski und Rosen (EPR) aus dem Jahre 1935, hier in der vereinfachten Version von Bohm aus 1951. 52 Ein Teilchen mit Spin 0 zerfällt in zwei Teilchen mit Spin 1/2, z.B. zerfällt ein neutrales Pion (π -Meson) in ein Elektron und ein Positron (Antielektron). Die zwei Teilchen mit Spin 1/2 fliegen in entgegengesetzter Richtung entlang der x-Achse auseinander. Nach einer gewissen Zeit t misst Alice die z -Komponente des Spins des linken Teilchens und findet den Wert ~/2. Kurz danach, zu der Zeit t+, misst Bob die z -Komponente des Spins des rechten Teilchens. Wegen der Erhaltung des Gesamtdrehimpulses bzw. Gesamtspins – und damit insbesondere seiner z -Komponente – kann man vorhersagen, dass Bob den Wert −~/2 finden muss. Das Experiment soll dabei so durchgeführt werden, dass die Entfernung der zwei Teilchen nach der Zeit t und t + derart groß ist, dass eine Kommunikation zwischen Alice und Bob in dem Zeitintervall nach den Gesetzen der speziellen Relativitätstheorie nicht möglich ist, d.h. es soll gelten |xrechts (t + ) − xlinks (t)| > c . Diese Voraussetzung kann immer geschaffen werden, wenn Alice lange genug wartet (t groß) und Bob kurz nach Alice misst ( klein). Unter diesen Voraussetzungen kann man also im Rahmen der speziellen Relativitätstheorie ausschließen, dass die Messung von Alice die Messung von Bob direkt beeinflusst, z.B. indem bei der Messung von Alice ein Lichtstrahl zu Bob ausgesandt wird, der mit dem rechten Teilchen wechselwirkt und seinen Spin in die richtige Richtung dreht. Die konservativste Annahme ist, also, dass die z -Komponente der Spins beider Teilchen schon vor der Messung feststand. Nun wiederholen Alice und Bob das Experiment, messen aber die x-Komponente der Teilchenspins. Wieder gilt: Findet Alice den Messwert a, muss Bob den Messwert b = −a finden. Wieder ist die konservativste Annahme, dass die x-Komponente der Spins beider Teilchen schon vor der Messung feststand. Wegen [Sx , Sz ] 6= 0 ist diese Annahme aber nicht mit der Quantenmechanik verträglich (siehe auch die Diskussion des Messprozesses am Beispiel des SternGerlach-Experiments in Abschnitt 1.1.2): Es ist im Rahmen der Quantenmechanik nicht möglich, dass die x- und z -Komponente der Teilchenspins gemeinsam vor der Messung feststehen. EPR haben diese Beobachtungen (vereinfacht) so interpretiert: Die verschieden Spinkomponenten der Teilchen haben gleichzeitig einen bestimmten Wert. Im Rahmen der Quantenmechanik ist dies nicht möglich. Also kann die Quantenmechanik keine vollständige Theorie sein. Somit stellt sich die Frage: Ist es möglich die Quantenmechanik zu vervollständigen um das Paradoxon aufzulösen? Eine naheliegende Möglichkeit ist die folgende. Man postuliert, dass alle Spinkomponenten beider auseinanderfliegender Teilchen vor der Messung klar definierte Größen sind. In der Quantenmechanik gilt das nur für die jeweils gemessene Komponente. Die anderen beiden sind in der Quantenmechanik selbst nicht zugänglich und werden als “verborgene Variablen” angesehen. Die statistischen Aussagen der Quantenmechanik ergeben sich durch Mittelung über diese unbekannten Größen, analog zur klassischen statistischen Mechanik, wo sich Messgrößen – wie z.B. die Temperatur eines Gases – als Mittelung über sehr viele unbekannte Größen – wie z.B. die Geschwindigkeiten jedes einzelnen Gasteilchens – ergeben. 53 1.6.2 Die Bell’sche Ungleichung Die Frage nach der Existenz verborgene Variablen wurde heiß diskutiert. Bell hat 1964 ein theoretisches Kriterium entwickelt, anhand dessen man überprüfen kann, ob verborgende Variablen existieren können. Es ist sehr wichtig, sich klarzumachen, dass dieses Kriterium die Quantenmechanik nicht voraussetzt. Es ist also ein unabhängiges Kriterium, dass an der Quantenmechanik oder einer anderen Theorie überprüft werden kann. Dazu stellen wir folgende Vorüberlegungen an. Das EPR Gedankenexperiment kann mit Messungen der Spinkomponenten in beliebigen Richtungen durchgeführt werden, d.h. die Messapparaturen (z.B. Stern-Gerlach-Apparate) von Alice und Bob können in verschiedene Richtungen ~a und ~b ausgerichtet sein, wobei ~a und ~b dreidimensionale Vektoren der Länge 1 sind. Die Observablen sind also ~ (1) ~a · S ~b · S ~ (2) Spin des linken Teilchens in Richtung ~a , entspricht entspricht Spin des rechten Teilchens in Richtung ~b . Die möglichen Messwerte dieser Observablen seien per Annahme (allerdings ohne die Annahme, dass die Quantenmechanik gültig ist) ±~/2. Um die Diskussion übersichtlicher zu gestalten, teilen wir alle Messwerte durch ~/2, wir setzen also ~σ (1) = 2 ~ (1) S , ~ ~σ (2) = 2 ~ (2) S ~ und betrachten die Observablen ~a · ~σ (1) ~b · ~σ (2) entspricht entspricht Spin des linken Teilchens in Richtung ~a in Einheiten Spin des rechten Teilchens in Richtung ~b in Einheiten ~ , 2 ~ , 2 deren mögliche Messwerte ±1 sind. Das EPR-Gedankenexperiment wird nun N mal durchgeführt, wobei N 1. Für ein beliebiges i ∈ {1, . . . , N } definieren wir nun MiA (~a) = Messwert der Observable ~a · ~σ (1) bei der i-ten Messung , MiB (~b) = Messwert der Observable ~b · ~σ (2) bei der i-ten Messung . Wir gehen nun davon aus, dass MiA (~a) und MiB (~b) für beliebige i und ~a, ~b bereits vor der Messung feststehen, auch wenn immer nur ein Richtungspaar (~a, ~b) = (~ai , ~bi ) ausgemessen wird. Die MiA (~a), MiB (~b) für (~a, ~b) 6= (~ai , ~bi ) sind dann die verborgenen Variablen. Zusammen legen diese Zahlen den Zustand ψ der N Teilchenpaare auf eine deterministische Art und Weise fest. Wegen der Drehimpulserhaltung gilt ~b = ~a ⇒ MiB (~b) = −MiA (~a) . 54 In Fall, dass ~b 6= ~a, gibt es eine solche zwingende Relation nicht. Allerdings gilt folgende Relation immer für vier beliebige Vektoren ~k , ~l, m ~ , ~n und ein beliebiges i: A~ B ~ B A B ~ B ~ + Mi (~n) Mi (l) − Mi (m) ~ = 2. Mi (k) Mi (l) + Mi (m) Dies folgt sofort aus der Tatsache dass entweder MiB (m) ~ = MiB (~l), dann verschwindet der 2. Term, oder MiB (m) ~ = −MiB (~l), dann verschwindet der 1. Term. Der nichtverschwindende Term ist immer = ±2 und hat damit den Betrag 2. Wir betrachten nun für beliebige ~a, ~b die Produktobservable (~a · ~σ (1) )(~b · ~σ (2) ) . Diese entspricht dem Produkt der beiden Spinkomponenten und hat darum die möglichen Messwerte MiA (~a)MiB (~b) . Der Erwartungswert Eψ (~a, ~b) = h(~a · ~ σ (1) )(~b · ~σ (2) )iψ entspricht im deterministischen Zustand ψ dem Mittelwert N D E 1 X A (1) ~ (2) ~ Mi (~a)MiB (~b). Eψ (~a, b) = (~a · ~σ )(b · ~σ ) = N ψ i=1 Dieser Erwartungswert ist eine Zahl im Intervall [−1, 1] und ist folgendermaßen zu interpretieren. Wenn Eψ (~a, ~b) sehr nahe an ±1 ist, dann kommt es sehr häufig vor, dass MiA (~a) = ±MiB (~b) und man sagt, dass die Observablen ~a · ~ σ (1) und ~b · ~σ (2) stark (anti)korreliert sind. Wenn Eψ (~a, ~b) sehr nahe an 0 ist, dann kommen die Fälle MiA (~a) = MiB (~b) und MiA (~a) = −MiB (~b) in etwa gleich häufig vor und man sagt dass die Observablen sehr schwach bzw. gar nicht korreliert sind. Darum nennt man Eψ (~a, ~b) die Korrelation zwischen den Messgrößen ~a · ~ σ (1) und ~b · ~σ (2) . Diese Zahl ist ein Maß dafür wie stark diese Messgrößen im betrachteten Zustand miteinander zusammenhängen. Bell hat nun folgende Korrelationsgröße betrachtet14 . Für vier beliebige Einheitsvektoren ~k , ~l, m ~ , ~n definieren wir die Bell’sche Korrelationsgröße Bψ (~k, ~l, m, ~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m) ~ + Eψ (~n, ~l) − Eψ (~n, m)| ~ . 14 Hier in der von Clauser, Home, Shimony und Holt in 1969 vorgeschlagenen Form. 55 Es gilt unter Verwendung der Dreieckungsungleichung und der weiter oben gefundenen Identität Bψ (~k, ~l, m, ~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m) ~ + Eψ (~n, ~l) − Eψ (~n, m)| ~ N h 1 X i A ~ B ~ A ~ B A B ~ A B = Mi (k)Mi (l) + Mi (k)Mi (m) ~ + Mi (~n)Mi (l) − Mi (~n)Mi (m) ~ N i=1 N h 1 X i MiA (~k) MiB (~l) + MiB (m) ~ + MiA (~n) MiB (~l) − MiB (m) ~ = N ≤ = 1 N 1 N i=1 N X A~ ~ + MiA (~n) MiB (~l) − MiB (m) ~ Mi (k) MiB (~l) + MiB (m) i=1 N X 2=2 i=1 insgesamt also Bψ (~k, ~l, m, ~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m) ~ + Eψ (~n, ~l) − Eψ (~n, m)| ~ ≤ 2. Das ist gerade die Bell’sche Ungleichung, die sich als Vorhersage aus der Existenz von verborgenen Variablen, bzw. aus der Annahme eines deterministischen Zustandes ergibt. Wir können nun diese Ungleichung in der Quantenmechanik testen. Der Zustand ψ der beiden Teilchen im EPR-Gedankenexperiment ist 1 1 |ψi = |0, 0i = √ (|↑↓i − |↓↑i) = √ 2 2 1 0 0 1 . ⊗ − ⊗ 0 1 1 0 In der Quantenmechanik gilt also für beliebige ~a, ~b D E Eψ (~a, ~b) = (~a · ~σ (1) )(~b · ~σ (2) ) = h0, 0|(~a · ~σ (1) )(~b · ~σ (2) )|0, 0i = −~a · ~b , ψ wie in den Übungsaufgaben zu zeigen ist. Hierbei erinnern wir uns, dass die Observable (~a · ~σ (1) )(~b · ~σ (2) ) eine verkürzte Schreibweise für (~a · ~σ (1) ) ⊗ (~b · ~σ (2) ) ist. Anschaulich ist es leicht nachzuvollziehen, dass Eψ (~a, ~b) = −~a ·~b. Der Zustand ψ ist invariant unter Drehungen, d.h. Eψ (~a, ~b) muss invariant unter Drehungen sein. Gleichzeitig muss diese Größe linear in ~a und ~b sein. Man kann zeigen, dass daraus folgt, dass Eψ (~a, ~b) = c~a · ~b mit einer Konstante c die nicht von ~a und ~b abhängt. Es reicht daher c für ein einfaches Beispiel zu berechnen. An Eψ (~a, ~b) = −~a · ~b sieht man deutlich, dass die Aussage “Wenn Alice in Richtung ~a das Messergebnis a findet, dann findet Bob in Richtung ~b = ~a das Messergebnis b = −a.” für alle ~a gültig ist, obwohl man den Zustand |0, 0i zunächst aus Eigenzuständen von Sz konstruiert 56 ~ für beliebiges ~a hat. Tatsächlich kann man den Zustand |0, 0i aus Eigenzuständen von ~a · S konstruieren. Wir können nun die Bell’sche Korrelationsgröße in der Quantenmechanik abschätzen. Es gilt Bψ (~k, ~l, m, ~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m) ~ + Eψ (~n, ~l) − Eψ (~n, m)| ~ = | − ~k · ~l − ~k · m ~ − ~n · ~l + ~n · m| ~ = |~k · (~l + m) ~ + ~n · (~l − m)| ~ ≤ |~k · (~l + m)| ~ + |~n · (~l − m)| ~ ≤ |~k||~l + m| ~ + |~n||~l − m| ~ = |~l + m| ~ + |~l − m| ~ p p = 2 + 2 cos φ + 2 − 2 cos φ cos φ = ~l · m ~ , φ ∈ [0, π) φ φ φ φ = 2 cos + sin cos φ = 2 cos2 − 1 = − sin2 + 1 2 2 2 2 √ φ π + = 2 2 sin 2 4 √ ≤ 2 2. wobei wir mehrmals die trigonometrischen Additionstheoreme verwendet haben. Wir bekommen also eine höhere obere Schranke als in der Bell’schen Ungleichung. Das heißt jedoch nicht, dass diese verletzt ist. Tatsächlich ist das aber der Fall, denn für z.B. ~k = √1 (~ez + ~ey ) , 2 ~l = ~ez , m ~ = ~ey , 1 ~n = √ (~ez − ~ey ) 2 gilt Bψ (~k, ~l, m, ~ ~n) = |Eψ (~k, ~l) + Eψ (~k, m) ~ + Eψ (~n, ~l) − Eψ (~n, m)| ~ 1 = √ | (~ez + ~ey ) · (~ez + ~ey ) + (~ez − ~ey ) · (~ez − ~ey ) | 2 √ 2+2 = √ = 2 2. 2 Die Bell’sche Ungleichung ist also in der Quantenmechanik verletzt! Daher sind die Aussagen der Quantenmechanik nicht kompatibel mit der Existenz von verborgenen Variablen und diese können nicht zu einer Vervollständigung der Quantenmechanik dienen. Die Verletzung der Bell’schen Ungleichungen wurde auch experimentell nachgewiesen (allerdings nicht mit Spin 1/2 Teilchen und Stern-Gerlach-Apparaten, sondern mit polarisierten Photonen und doppelbrechenden Kristallen), zunächst von Aspect et al. in 1981 und später mit besseren Experimenten von Zeilinger et al. und Gisin et al. in 1998. Man kann also die Quantenmechanik als vollständig ansehen und muss eben “akzeptieren”, dass sie sich teilweise radikal von der klassischen deterministischen Physik unterscheidet. 57 1.6.3 Verschränkte Zustände Die Verletzung der Bell’schen Ungleichung in der Quantenmechanik ist auf die Existenz verschränkter Zustände zurückzuführen. Ein reiner Zustand ψ eines quantenmechanischen Systems aus zwei Teilchen (oder Freiheitsgraden) heißt separabel wenn er von der Form |ψi = |ψi(1) ⊗ |ψi(2) ist, sich also als ein Tensorprodukt von Zuständen der Einzelsysteme schreiben kann. Ein gemischter Zustand heißt separabel, wenn er eine Mischung aus separablen reinen Zuständen ist. Ein Zustand der nicht separabel ist, wird verschränkt genannt. In reinen separablen Zuständen gilt für Observablen von der Form A = A(1) ⊗ A(2) immer hAiψ = hψ|A|ψi = (1) hψ|A(1) |ψi(1) (2) hψ|A(2) |ψi(2) = hA(1) iψ(1) hA(2) iψ(2) , d.h. Erwartungswerte sind Produkte von Erwartungswerte in den einzelnen Systemen. Für verschränkte Zustände ist das im Allgemeinen nicht der Fall und es gibt “Mischterme”. Anschaulich kann man das so interpretieren, dass in verschränkten Zuständen die Korrelationen zwischen Observablen in den einzelnen Systemen größer sind als in separablen Zuständen. Tatsächlich ist der Zustand im EPR-Gedankenexperiment verschränkt, da er eine Superposition von separablen Zuständen ist die sich nicht als Tensorprodukt umschreiben lässt: 1 1 |ψi = |0, 0i = √ (|↑↓i − |↓↑i) = √ 2 2 1 0 0 1 . ⊗ − ⊗ 0 1 1 0 Dagegen sind in separablen Zuständen die Bell’schen Ungleichungen erfüllt. Z.B. ist E↑↓ (~a, ~b) = h↑↓|(~a · ~σ (1) )(~b · ~σ (2) )|↑↓i = −a3 b3 E↓↑ (~a, ~b) = h↓↑|(~a · ~σ (1) )(~b · ~σ (2) )|↓↑i = −a3 b3 wie in den Übungen gezeigt wird. Daraus folgt B↑↓ (~k, ~l, m, ~ ~n) = |k3 (l3 + m3 ) + n3 (l3 − m3 )| ≤ |k3 (l3 + m3 )| + |n3 (l3 − m3 )| ≤2 58 und analog für |↓↑i. Der letzte Schritt folgt dabei aus k3 , l3 , m3 , n3 ∈ [−1, 1] und n3 (l3 − m3 ) = n3 l3 (1 ± k3 m3 ) −n3 m3 (1 ± k3 l3 ) | {z } | {z } ≥0 ≥0 ⇒|n3 (l3 − m3 )| ≤ |n3 l3 |(1 ± k3 m3 ) + |n3 m3 |(1 ± k3 l3 ) = 2 ± k3 (l3 + m3 ) | {z } | {z } ≤1 ≤1 ⇒|n3 (l3 − m3 )| ≤ 2 − |k3 (l3 + m3 )| ⇒|n3 (l3 − m3 )| + |k3 (l3 + m3 )| ≤ 2 . 1.6.4 Quantenkryptographie Die Tatsache, dass verschränkte Zustände die Bell’schen Ungleichungen verletzen können, während das für separable nicht gilt, kann man ausnutzen um verbesserte digitale Verschlüsselungsmechanismen zu entwickeln. Tatsächlich werden solche quantenkryptographischen Methoden verwendet und entsprechende Apparate sind käuflich zu erwerben. Grundsätzlich funktioniert eine digitale Verschlüsselung folgendermaßen. Alice möchte Bob eine digitale Nachricht übermitteln. Diese setzt sich aus einzelnen Bits zusammen und ist daher von der Form Nachricht (unverschüsselt): 0 1 0 1 1 0 1 1 . . . Diese Nachricht lässt sich mittels eines zufälligen digitalen Schlüssels verschlüsseln. Zufälliger Schlüssel: 0 0 1 1 0 1 0 0 ... Dazu werden Nachricht und Schlüssel bitweise addiert nach der Vorschrift 1 + 0 = 0 + 1 = 1, 1 + 1 = 0 + 0 = 0. Man bekommt also Nachricht (unverschüsselt): Zufälliger Schlüssel: Nachricht (verschüsselt): 0 1 0 1 1 0 1 1 ... 0 0 1 1 0 1 0 0 ... 0 1 1 0 1 1 1 1 ... Die Nachricht lässt sich entschlüsseln in dem man die verschlüsselte Nachricht und den Schlüssel erneut bitweise addiert. Es gilt nach der obigen Additionsvorschrift nämlich a + b + b = a + (b + b) = a + 0 = a für beliebige a, b ∈ {0, 1}. Alice kann also beliebig viele verschlüsselte Nachricht sicher über “unsichere Kanäle” an Bob senden (und umgekehrt), solange Bob den geheimen Schlüssel kennt. Der Schwachpunkt dieser Verschlüsselungsmethode ist die eine notwendige Nachricht, mit der Alice Bob den geheimen Schlüssel mitteilt oder umgekehrt. Es gibt also zwei Probleme 59 1. Wie können sich Alice und Bob möglichst abhörsicher den Schlüssel gegenseitig mitteilen? 2. Wie können Alice und Bob feststellen, dass sie bei der Schlüsselmitteilung abgehört wurden (und dann daraus die Konsequenz ziehen, dass ein neuer Schlüssel nötig ist)? Die Quantenmechanik liefert eine Lösung für diese Probleme. Verschiedene Verschlüsselungsprotokolle basierend auf verschränkten Zuständen sind bereits theoretisch entwickelt worden und einige davon werden in der Praxis auch verwendet. Hier wollen wir ein einfaches Protokoll diskutieren, das 1991 von Ekert vorgeschlagen wurde. Dazu wird das EPR-Experiment wie folgt verwendet. Alice und Bob legen vier Vektoren ~k , ~l, m ~ , ~n fest – z.B. die vier oben diskutierten – die derart sind, dass √ im verschränkten Zustand |ψi = |0, 0i für die Bell’sche Korrelationsgröße Bψ (~k, ~l, m, ~ ~n) = 2 2 gilt. Das Experiment wird N 1 mal durchgeführt. Bei jedem Durchlauf bestimmen Alice und Bob unabhängig voneinander und zufällig jeweils eine Messrichtung ~a, ~b ∈ {~k, ~l, m, ~ ~n}. Ein möglicher Ausgang des Experiments sieht also wie folgt aus, wobei wir ↑ und ↓ für die Messwerte und +1 und −1 schreiben. Messung # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 . . . Messrichtung Alice ~k ~ n ~n Messrichtung Bob m ~ m ~ ~l ~k ~n ~k ~l ~l m ~ ~l ~n ~k ~l m ~ m ~ ~k ~l ~n m ~ ~l ~k ~l ~k m ~ ~l ~n ~k m ~ ... ~l m ~ m ~ ... Messwert Alice ↑ ↑ ↑ ↓ ↓ ↑ ↑ ↑ ↓ ↑ ↓ ↑ ↑ ↓ ↑ ↓ ↑ ↓ ... Messwert Bob ↑ ↑ ↓ ↑ ↑ ↓ ↓ ↑ ↑ ↓ ↓ ↓ ↓ ↓ ↑ ↓ ↓ ↑ ... ~n ~n Nach Abschluss der Messreihe teilen sich Alice und Bob über einen beliebigen, nicht notwendigerweise sicheren, Kanal gegenseitig die ausgemessenen Richtungen mit, nicht aber die gemessenen Werte. Anschließend teilen Alice und Bob die einzelnen Messungen in zwei Gruppen auf: Gruppe 1. die Messungen bei denen sie beide dieselbe Richtung ausgemessen haben Gruppe 2. und die übrigen Messungen. Auf Grundlage der Messungen aus Gruppe 1 legen Alice und Bob den Schlüssel wie folgt fest. Misst Alice ↑ und Bob ↓, entspricht das einer 1, im anderen Fall einer 0. Schließlich teilen sich Alice und Bob die Messwerte für die Messungen aus Gruppe 2 mit (nicht aber die aus Gruppe 1!). Auf Grundlage dieser Messwerte kann die Bell’sche Korrelationsgröße Bψ (~k, ~l, m, ~ ~n) berechnet werden. Diese wird aus den Messungen ermittelt, indem man entsprechend der Postulate der Quantenmechanik den Erwartungswert Eψ (~a, ~b) mit dem Mittelwert E(~a, ~b) = 1 N (~a, ~b) N (~a,~b) X i=1 60 MiA (~a)MiB (~b) , identifiziert, wobei nur die Einzelmessungen beitragen, bei denen tatsächlich die Messrichtungen (~a, ~b) ausgemessen wurden und N (~a, ~b) ≤ N die Anzahl dieser Messungen ist. Da die Messrichtungen aus einer endlichen Menge von Möglichkeiten zufällig bestimmt√wurden, impliziert N 1 auch N (~a, ~b) 1 und Alice und Bob erwarten, Bψ (~k, ~l, m, ~ ~n) ' 2 2 zu finden. Sollten Sie allerdings Bψ (~k, ~l, m, ~ ~n) ≤ 2 finden, dann ist das ein sicherer Hinweis darauf, dass ein dritter mit der Messung interferiert hat und der generierte Schlüssel darum nicht sicher ist. Um das im Detail zu verstehen betrachten wir den Fall, dass Eve Kenntnis über den Schlüssel erlangen will. Dazu kann Eve folgendes machen: Sie misst die Spins der zwei Teilchen aus, bevor diese zu Alice und Bob gelangen. Das bringt allerdings zwei Probleme mit sich: 1. Für jede mögliche Vorschrift die Eve wählt, um ihre Messrichtungen für die beiden Teilchen festzulegen, gilt: Eves Messungen geben nur Aufschluss über den generierten Schlüssel, wenn sie dieselben Richtungen ausgemessen hat, für die sich Alice und Bob zufällig auch entschieden haben. Mit großer Wahrscheinlichkeit wird Eve also nur einen Bruchteil des Schlüssels erfahren. 2. Nach der Messung von Eve sind die beiden Teilchen nicht mehr in einem verschränkten Zustand, sondern in einem separablen. Misst Eve z.B. jeweils in Richtung ~l = ~ ez dann ist der Zustand |0, 0i nach der Messung entweder in den Zustand |↑↓i oder in den Zustand |↓↑i übergegangen. Daher können Alice und Bob die Aktion von Eve durch die Bestimmung der Bell’schen Korrelationsgröße aufdecken und sich dafür entscheiden, den Schlüssel nicht zu verwenden. Wie bei der experimentellen Überprüfung der Verletzung der Bell’schen Ungleichung verwendet man für solche und ähnliche Quantenkrytographieprotokolle keine Spin 1/2 Teilchen sondern polarisierte Photonen, da diese relativ störungsfrei über Glasfaserkabel übertragen werden können. In 2014 wurde mit einem in 2005 entwickelten Quantenkryptographieprotokoll ein Schlüssel über eine Distanz von 307 km übertragen. Für Details siehe: http://arxiv.org/abs/1407.7427. 1.7 Vielteilchensysteme Bislang haben wir im hauptsächlich Systeme untersucht bei denen es um einen oder mehrere Freiheitsgrade eines einzelnen Teilchens geht, oder nur bestimmte Aspekte von Vielteilchensystemen betrachtet. Im Folgenden sollen nun fundamentale Aspekte von Vielteilchensystemen diskutiert werden. Wichtige Beispielssysteme sind: • höhere Elemente im Periodensystem, z.b. He, Li, ... • chemische Bindungen / Moleküle, z.B. H2 , ... • Festkörper, Gase, ... • ... 61 1.7.1 Vielteilchenwellenfunktionen und Vielteilchen-Schrödingergleichung Wie bereits diskutiert gilt: Werden die reinen Zustände N einzelner Teilchen durch Vektoren in den Hilberträumen H1 , . . . , HN beschrieben, so werden die reinen Zustände des Gesamtsystems der N Teilchen durch Vektoren im Hilbertraum H = H1 ⊗ · · · ⊗ HN beschrieben. Für N Teilchen in drei Raumdimensionen unter Vernachlässigung des Spins gilt insbesondere H1 = · · · = HN = L2 (R3 ) , H = L2 (R3 ) ⊗ · · · ⊗ L2 (R3 ) = L2 (R3N ) , | {z } N mal so dass die Wellenfunktion eines N -Teilchenzustandes von der Form ψ(~x1 , . . . , ~xN ) ist. Betrachtet man zusätzlich den Spin der Teilchen dann hat die Wellenfunktion mehrere Komponenten. Haben z.B. alle N Teilchen Spin 1/2, dann gilt H1 = · · · = HN = L2 (R3 ) ⊗ C2 = L2 (R3 → C2 ) , N H = L2 (R3 → C2 ) ⊗ · · · ⊗ L2 (R3 → C2 ) = L2 R3N → C2 , | {z } N mal eine Wellenfunktion von zwei Elektronen hat also z.B. vier Komponenten die wir bekanntermaßen in einer 4 × 4 Matrix anordnen können. Einfache Zustände ψ zweier Elektronen haben Wellenfunktionen von der Form ψOrt (x1 , x2 )ψSpin , ψSpin ∈ {|↑↑i, |↑↓i, |↓↑i, |↓↓i} . Allgemeine Zustände zweier Elektronen sind Superpositionen von Zuständen solcher Art. Der Hamilonoperator eines N -Teilchensystems (unter Vernachlässigung des Spins) ist typischerweise von der Form H= N ~2 X Pi ~ 1, . . . , Q ~N) , + V (Q 2mi ~ ~x , P~i = −i~∇ i ~ i = ~xi . Q i=1 Die kinetische Energie des Gesamtsystems ist also die Summe der kinetischen Energien der einzelnen Teilchen. Für die potentielle Energie gilt das im Allgemeinen nicht, da es Wechselwirkungen zwischen den Teilchen geben kann. Die Schrödingergleichung für N Teilchen ohne Spin ist also typischerweise von der Form ∂ i~ ψ(t, ~x1 , . . . , ~xN ) = ∂t N X i=1 ! ~2 − ∆~x + V (~x1 , . . . , ~xN ) ψ(t, ~x1 , . . . , ~xN ) . 2mi i 62 1.7.2 Ununterscheidbare Teilchen Wir betrachten zwei Teilchen mit identischen Eigenschaften, d.h. z.B. identischer Ladung, Masse, Spin. In der klassischen Mechanik gilt Folgendes: Wir können die zwei Teilchen gedanklich mit “1” und “2” benennen und ihre Bahnkurven im Raum für alle Zeiten einzeln verfolgen, selbst wenn sie sich zu einigen Zeitpunkten schneiden. D.h. wir können die zwei Teilchen zu allen Zeiten unterscheiden. In der Quantenmechanik gilt dies nicht! Im Prinzip ist diese Tatsache ein weiteres unabhängiges Postulat, das sich also nicht aus den anderen Postulaten ableiten lässt. Dennoch lässt sich dieses Postulat sehr gut anschaulich motivieren. Wir betrachten zwei Teilchen mit identischen Eigenschaften die durch Wellenfunktionen ψ1 (~ x1 ), ψ2 (~x2 ) beschrieben werden. Um nahe an der Situation klassischer Bahnkurven zu sein, kann man sich diese Wellenfunktionen als Gauss’sche Wellenpakete vorstellen. Im Gegensatz zur klassischen Mechanik haben diese Wellenpakete eine endliche Breite. Wenn sich die Schwerpunkte der Wellenpakete zu einem Zeitpunkt nahe kommen – entsprechend der analogen Situation, dass sich in der klassischen Mechanik die Bahnkurven der zwei Teilchen nahe kommen –, dann gibt es einen großen Bereich V ⊂ R3 im Raum in dem für alle ~ x ∈ V gilt |ψ1 (~x)|2 0 , |ψ2 (~x)|2 0 , d.h. die Wellenfunktionen der zwei Teilchen “überlappen sich” und die Aufenthaltswahrscheinlichkeiten beider Teilchen in diesem Gebiet sind sehr groß. Daher gibt es kein Experiment, das im Gebiet V die Teilchen unterscheiden kann. Sind die Schwerpunkte der Wellenpakete jedoch weit voneinander entfernt, dann gilt “ist |ψ1 (~ x)|2 groß, dann ist |ψ2 (~x)|2 klein (und umgekehrt)”. Man kann also mit guter Genauigkeit die beiden Teilchen unterscheiden, und zwar umso besser, je weiter die Schwerpunkte der Wellenfunktionen voneinander entfernt sind. Das reproduziert die bekannte Situation aus der klassischen Physik. Haben die zwei Teilchen unterschiedliche Eigenschaften, z.B. unterschiedliche Massen oder Ladungen, dann sind sie auch in der Quantenmechanik jederzeit unterscheidbar, da man ja z.B. die Ladung oder Masse messen kann und anhand der unterschiedlichen Messwerte die Teilchen unterscheiden kann. Das Ununterscheidbarkeitspostulat lässt sich folgendermaßen formulieren: • Die Erwartungswerte in einem quantenmechanischen System von N identischen Teilchen dürfen nicht von der Nummerierung der Teilchen abhängen. Konkret bedeutet das Folgendes. Wie wir wissen sind einfache reine Zustände eines Zweiteilchensystems von der Produktform |ψ1 ; ψ2 i = |ψ1 i|ψ2 i = |ψ1 i ⊗ |ψ2 i wobei ψ1 und ψ2 reine Zustände des Einteilchensystems sind. Allgemeine reine Zustände des Zweiteilchensystems sind Superpositionen solcher Produktzustände. Wir definieren nun den Permutationsoperator P12 P12 |ψ1 ; ψ2 i = |ψ2 ; ψ1 i 63 der die Nummerierung der zwei Teilchen vertauscht. Für diesen Operator gilt 2 P12 = 1. † P12 = P12 , P12 ist also ein selbstadjungierter Operator dessen Quadrat die Identität ist. Die Eigenzustände und Eigenwerte von P12 sind also von der Form 1 (|ψ1 ; ψ2 i ± |ψ2 ; ψ1 i) N± mit Eigenwerten ± 1, sind sind also entweder symmetrisch oder antisymmetrisch unter Umnummerierung der Teilchen. Beispiel: Für ein System von zwei Spin 1/2 Teilchen unter Vernachlässigung der räumlichen Dynamik kennen wir die “Einzelspin-ONB” |↑↑i, |↑↓i, |↓↑i, |↓↓i. Auf diese Zustände wirkt P12 wie folgt P12 |↑↑i = |↑↑i , P12 |↑↓i = |↓↑i , P12 |↓↑i = |↑↓i , P12 |↓↓i = |↓↓i . Daher sind die Zustände der “Gesamtspin-ONB” |1, −1i = |↓↓i 1 |1, 0i = √ (|↑↓i + |↓↑i) , 2 1 |0, 0i = √ (|↑↓i − |↓↑i) 2 |1, 1i = |↑↑i , Eigenzustände von P12 mit Eigenwert 1 (Gesamtspin 1) und −1 (Gesamtspin 0). Das Ununterscheidbarkeitspostulat bedeutet in diesem Fall: Für beliebige Zustände ψ und Observablen A eines Systems zweier identischer Teilchen muss gelten: Die Erwartungswerte von A in den Zuständen |ψi und P12 |ψi müssen übereinstimmen: hAiψ = hψ|A|ψi = (|ψi)† A|ψi = hAiP12 ψ = (P12 |ψi)† AP12 |ψi = hψ|P12 AP12 |ψi = hP12 AP12 iψ . Daraus kann man zwei Forderungen ableiten: 1. Observablen eines Systems zweier identischer Teilchen müssen mit P12 kommutieren, also invariant unter Umnummerierung sein, denn: [A, P12 ] = 0 ⇔ 2 P12 AP12 − A = P12 AP12 − P12 A = P12 [A, P12 ] = 0 . |{z} =1 2. Zustände eines Systems zweier identischer Teilchen müssen Eigenzustände von P12 sein, d.h. entweder symmetrisch oder antisymmetrisch, denn dann gilt hP12 AP12 iψ = (±1)2 hAiψ = hAiψ . Tatsächlich reicht zur Erfüllung des Ununterscheidbarkeitspostulats eine der beiden Forderungen – analog zur Äquivalenz von Schrödinger- und Heisenbergbild. Es ist zweckmäßig mit der zweiten Forderung zu arbeiten. In der Praxis betrachtet man dann dennoch zusätzlich als 64 Observablen nur Operatoren, die die erste Forderung erfüllen, da von nichtsymmetrischen Operatoren bei der Berechnung von Erwartungswerten in (anti)symmetrischen Zuständen sowieso nur der symmetrisierte Anteil beiträgt. Für ein System zweier identischer Teilchen mit Spin wirkt der Permutationsoperator P12 sowohl auf den Ortsanteil ψOrt (x1 , x2 ) als auch auf den Spinanteil ψSpin eines Zustandes. Die Wirkung auf den Spinanteil haben wir am Beispiel Spin 1/2 diskutiert. Die Wirkung auf den Ortsanteil ist P12 ψOrt (x1 , x2 ) = ψOrt (x2 , x1 ) . Daraus ergeben sich folgende Möglichkeiten das Ununterscheidbarkeitspostulat zu erfüllen (mit ± für symmetrisch/antisymmetrisch): ψOrt ψSpin ψ = ψOrt ψSpin + + + + − − − + − − − + Der Orts- und Spinanteil müssen also separat symmetrisch oder antisymmetrisch sein, wobei verschiedene Kombinationen insgesamt eine symmetrische oder antisymmetrische Gesamtwellenfunktion ergeben. Wir betrachten nun den allgemeinen Fall N identischer Teilchen. Allgemeine N -Teilchenzustände sind wieder Superpositionen von Produktzuständen |ψ1 ; . . . ; ψN i = |ψ1 i ⊗ · · · ⊗ |ψN i . Für beliebige i, j ∈ {1, . . . , N } definieren wir den Vertauschungsoperator Pij durch Pij |ψ1 ; . . . ; ψi ; . . . ; ψj ; . . . ; ψN i = |ψ1 ; . . . ; ψj ; . . . ; ψi ; . . . ; ψN i . Pij vertauscht also die Nummerierung der Teilchen i und j . Wie im einfachen Fall gilt Pij2 = 1 . Pij† = Pij , D.h. die Eigenwerte λij von Pij sind λij = ±1 entsprechend den Zuständen die symmetrisch/ antisymmetrisch unter Vertauschung von i und j sind. Das Ununterscheidbarkeitspostulat impliziert, dass ein Zustand |ψi des Systems N identischer Teilchen ein Eigenzustand aller Pij sein muss, da Erwartungswerte unter beliebigen Vertauschungen invariant sein müssen. Erstaunlicherweise folgt für solche gemeinsamen Eigenzustände, dass die Eigenwerte λij alle dasselbe Vorzeichen haben müssen, denn es gilt für beliebige i, j : Pij = P1i P2j P12 P1i P2j ⇒ λij = λ1i λ2j λ12 λ1i λ2j = λ21i λ22j λ12 = λ12 . Wir finden also: 65 • Für Zustände eines Systems N identischer Teilchen sind nur folgende Möglichkeiten mit dem Ununterscheidbarkeitspostulat verträglich: 1. Der Zustand ist vollständig symmetrisch unter Vertauschung der Teilchen. Teilchen mit dieser Eigenschaft nennt man Bosonen. 2. Der Zustand ist vollständig antisymmetrisch unter Vertauschung der Teilchen. Teilchen mit dieser Eigenschaft nennt man Fermionen. Folgender Sachverhalt lässt sich (in der Quantenfeldtheorie) theoretisch herleiten und experimentell verifizieren: • Teilchen mit halbzahligen Spin (z.B. Elektronen, Spin 1/2) sind Fermionen. Teilchen mit ganzzahligem Spin (z.B. Photonen, Spin 1) sind Bosonen. Das impliziert sofort das berühmte Pauli-Prinzip oder auch Pauli’sche Ausschließungsprinzip: • Zwei identische Fermionen (z.B. zwei Elektronen) können nicht denselben Einteilchenzustand besetzen. Denn wäre |ψi dieser Einteilchenzustand, dann müsste der Zweiteilchenzustand |ψi⊗|ψi−|ψi⊗ |ψi, also das antisymmetrisierte Tensorprodukt, sein. Dieses verschwindet aber, entspricht also keinem physikalischen Zustand. In den Folgenden Beispielen werden wir sehen, dass das Pauli-Prinzip die Grundlage für das Verständnis vieler wichtiger physikalischer Systeme darstellt. 1.7.3 Das Heliumatom Als erstes Beispiel für ein Vielteilchensystem diskutieren wir das Heliumatom. Wie beim Wasserstoff vernachlässigen wir die Dynamik des Atomkerns und betrachten nur die Dynamik der zwei Elektronen. Der Hilbertraum ist also H = L2 (R6 ) und der Hamiltonoperator ist15 H= P~12 Zγ P~ 2 Zγ γ − + 2 − + , ~ 1 | 2m |Q ~ 2 | |Q ~1 − Q ~ 2| 2m |Q | {z } | {z } | {z } =H (1) =H (2) Z = 2, γ= e2 . 4π0 =V H ist offenbar symmetrisch unter Vertauschung der Teilchen. Das Pauli-Prinzip verlangt, dass die Gesamtwellenfunktion der beiden Elektronen antisymmetrisch ist. Offenbar vertauscht H ~ (1) und S ~ (2) und daher auch mit dem Gesamtspin S ~=S ~ (1) + S ~ (2) . Damit den Spinoperatoren S her sind Eigenzustände von H von der Form ψOrt (~ x1 , ~x2 )ψSpin wobei ψSpin eine beliebige Linearkombination der Einzelspin-ONB-Vektoren |↑↑i, |↑↓i, |↓↑i, |↓↓i sein kann. Wir wissen aber bereits, 15 Wir vernachlässigen hier der Übersicht halber die vom Wasserstoff bekannten relativistischen Korrekturen. 66 dass ψOrt und ψSpin selbst symmetrisch oder antisymmetrisch sein müssen. Daher gibt es nur zwei Möglichkeiten: 1. ψSpin ist symmetrisch und daher eine Linearkombination der “Triplett-Zustände” |1, −1i, |1, 0i, |1, 1i, d.h. der Zustand hat Gesamtspin 1. ψOrt ist dann antisymmetrisch. Dieser Fall wird Orthohelium genannt (“orthos”, griechisch für “aufrecht”, “gerade”). 2. ψSpin ist antisymmetrisch und daher der “Singulett-Zustand” |0, 0i, d.h. der Zustand hat Gesamtspin 0. ψOrt ist dann symmetrisch. Dieser Fall wird Parahelium genannt (“para”, griechisch für “trotz”, “gegen[über]”). Im Gegensatz zum Wasserstoffatom lässt sich das Heliumatom nicht exakt analytisch berechnen, wir müssen daher auf Störungstheorie zurückgreifen. Dazu betrachten wir H0 = H (1) +H (2) als ungestörten Hamiltonoperator und V als Störung. Die Ortsanteile der Eigenzustände von H (i) , i = 1, 2 sind von der Form ψni ,li ,mi (~xi ) mit Eigenwerten Eni = −Z 2 RHe 1 n2i wobei RHe ' R die Rydbergkonstante von Helium ist. Bis auf die Modifikation durch die höhere Kernladungszahl Z (und die etwas geringere reduzierte Masse durch das höhere Kerngewicht), haben wir es also mit Eigenfunktionen und Eigenwerten des Wasserstoffatoms zu tun. Wegen des Pauli-Prinzips sind die “erlaubten” Eigenzustände von H0 solche in denen der Ortsanteil der Wellenfunktion ein (anti)symmetrisiertes Produkt der ψni ,li ,mi (~ xi ) ist. Für Parahelium kommt also nur ψab+ (~x1 , ~x2 ) = N (ψn1 ,l1 ,m1 (~x1 )ψn2 ,l2 ,m2 (~x2 ) + ψn2 ,l2 ,m2 (~x1 )ψn1 ,l1 ,m1 (~x2 )) infrage, wobei wir a = (n1 , l1 , m1 ) und b = (n2 , l2 , m2 ) setzen. a = b ist erlaubt. Die Energieeigenwerte dieser Zustände sind (0) Eab 2 = −Z RHe 1 1 + 2 2 n1 n2 . Der Zustand mit der niedrigsten Energie ist ψ11+ . Für Orthohelium bekommen wir hingegen 1 ψab− (~x1 , ~x2 ) = √ (ψn1 ,l1 ,m1 (~x1 )ψn2 ,l2 ,m2 (~x2 ) − ψn2 ,l2 ,m2 (~x1 )ψn1 ,l1 ,m1 (~x2 )) , 2 wobei a = b nicht erlaubt ist. Die Energieeigenwerte dieser Zustände sind ebenfalls (0) Eab 2 = −Z RHe 1 1 + 2 2 n1 n2 . (0) (0) Der Zustand mit der niedrigsten Energie ist diesmal ψ21− = ψ12− . Wegen E21 > E11 ist ψ11+ der Grundzustand von H0 und ψ21− ist ein angeregter Zustand. 67 (1) Wir wollen nun die erste Energiekorrektur Eab± berechnen (1) Eab± = hψab± |V |ψab± i . Für den Grundzustand bekommt man wie erwartet eine Korrektur durch die gegenseitige Abstoßung der Elektronen. Für ψab± mit a 6= b bekommt man stattdessen (1) Eab± = Kab ± Aab , Z d3 x1 d3 x2 |ψa (~x1 )ψb (~x2 )|2 Kab = R6 Z Aab = R6 γ , |~x1 − ~x2 | d3 x1 d3 x1 ψa∗ (~x1 )ψb∗ (~x2 )ψa (~x2 )ψb (~x1 ) γ . |~x1 − ~x2 | Kab ist erneut die Coloumbenenergie, die erwartete Korrektur durch die gegenseitige Abstoßung der Elektronen. Aab ist hingegen die sogenannte Austauschenergie, die klassisch nicht interpretiert werden kann sondern ein rein quantenmechanischer Effekt, d.h. eine Konsequenz des Pauliprinzips ist. Man findet für a = (1, 0, 0) und b 6= a beliebig dass Kab > 0 und Aab > 0. D.h. die Energiekorrektur ist für das Orthohelium kleiner als für das Parahelium. Das Orthohelium – und damit die Triplettzustände der Spins – ist also durch die gegenseitige Abstoßung der Elektronen energetisch begünstigt. Anschaulich ist das nachvollziehbar. Bei Orthohelium sind durch die antisymmetrische Ortswellenfunktion die Elektronen im Mittel weiter voneinander entfernt (siehe Übung), dadurch wird ihre positive Abstoßungsenergie minimiert. Am Beispiel des Heliums sehen wir eine wichtige Konsequenz des Pauliprinzips: Auch wenn der Hamiltonoperator keine explizit Spin-abhängigen Terme enthält, hängen die Energien von Vielteilchensystemen wegen des Pauli-Prinzips im Allgemeinen sehr wohl von den Spins der Teilchen ab. 1.7.4 Das Wasserstoffmolekül Als nächstes wichtiges Beispiel für ein Vielteilchensystem diskutieren wir das Wasserstoffmolekül H2 . Dazu seien ~ xa und ~xb die Positionen der zwei Protonen und Rab = |~xa − ~xb | ihr relativer Abstand. Der Hamiltonoperator enthält wegen der insgesamt vier geladenen Teilchen (von denen wir die Dynamik zwei, der Protonen, wie üblich außer acht lassen), zahlreiche Beiträge: H= P~12 γ P~ 2 γ γ γ γ γ − + 2 − − − + + . ~ 1 − ~xa | 2m |Q ~ 2 − ~xb | |Q ~ 1 − ~xb | |Q ~ 2 − ~xa | |Q ~1 − Q ~ 2 | Rab 2m |Q | {z } | {z }| {z } =H (1) =V =H (2) Erneut sehen wir, dass H mit den Spinoperatoren vertauscht. Analog zur Diskussion des Heliumatoms haben wir also die zwei Möglichkeiten: Spin-Triplett & antisymmetrische Ortswellenfunktion oder Spin-Singulett & symmetrische Ortswellenfunktion. 68 Für die Gesamtwellenfunktion haben Heitler und London den störungstheoretisch motivierten Ansatz ψab± (~x1 , ~x2 ) = 1 (ψa (~x1 )ψb (~x2 ) ± ψb (~x1 )ψa (~x2 )) N± vorgeschlagen, wobei ψa , ψb respektive Eigenfunktionen von H (1) und H (2) zur Energie Ea , Eb – d.h. Eigenfunktionen eines Wasserstoffatoms in Position ~ xa , ~xb – sind. Der Normierungsfaktor N± ist Z N±2 = 2(1 ± |S|2 ) , S= R3 d3 x ψa∗ (~x)ψb (~x) . Wir berechnen nun die Gesamtenergie in diesen Zuständen Eab± = hψab± |H|ψab± i = Ea + Eb + Kab ± Aab , 1 ± |S|2 Z γ d3 x1 d3 x2 |ψa (~x1 )ψb (~x2 )|2 |~x1 − ~x2 | R6 Z Z γ γ 3 2 3 2 − d x1 |ψa (~x1 )| − d x2 |ψb (~x2 )| , |~x1 − ~xb | |~x2 − ~xa | R3 R3 Kab = γ + Rab Z γ γ|S|2 3 3 ∗ ∗ = +< d x1 d x2 ψa (~x1 )ψb (~x2 )ψa (~x2 )ψb (~x1 ) Rab |~x1 − ~x2 | R6 Z Z γ γ −< S ∗ d3 x1 ψa∗ (~x1 )ψb (~x1 ) −< S d3 x2 ψb∗ (~x1 )ψa (~x1 ) , |~x1 − ~xb | |~x2 − ~xa | R3 R3 Aab erneut ist Kab ein direkt und klassisch interpretierbares Coulombintegral während die Austauschenergie Aab ein genuin quantenmechanischer Effekt ist. Für den Grundzustand des Moleküls ist sicher der Fall relevant, dass ψa und ψb die jeweiligen Wasserstoffgrundzustände sind. In diesem Fall kann man die Integrale analytisch oder numerisch berechnen (ein vereinfachter Fall wird in den Übungen diskutiert). Eab± ist eine Funktion des Kernabstandes Rab . Man findet, dass für nicht zu kleine Rab gilt, dass Aab < 0 und Kab > 0. Im Gegensatz zum Helium ist hier der Singulettzustand energetisch bevorzugt. Das lässt sich so interpretieren, dass die Elektronen in diesem Zustand im Mittel näher zusammen sind und sich vor allem im Mittel mit größerer Wahrscheinlichkeit zwischen den Protonen aufhalten und damit, je nach Sichtweise, die Abstoßung der Protonen abschirmen oder aber die Protonen anziehen. Dieser Effekt ist hier größer als der positive Energiebeitrag durch die verstärkte gegenseitige Abstoßung der Elektronen. Qualitativ ergibt sich folgendes Bild für die Abhängigkeit der Eab± von Rab . Offenbar hat Eab− ein Minimum, d.h. ein bestimmter Kernabstand ist energetisch begünstigt. Man findet, dass der Heitler-London-Ansatz den Kernabstand und die Bindungsenergie des Wasserstoffmoleküls bis auf ca 30% Abweichung korrekt wiedergibt. Erneut sehen wir, dass Spins mittels des Pauliprinzips einen großen indirekten Einfluss auf die Energieniveaus von Systemen identischer Teilchen haben können. 69 1.7.5 Atomaufbau Mit dem Pauliprinzip können wir auch die Grundzüge des Aufbaus des Periodensystems der Elemente verstehen. Dazu machen wir folgende Nährungen für die Beschreibung der Elektronen in höheren Elementen: 1. Wir vernachlässigen (wie schon beim Heliumatom) direkte Drehimpulswechselwirkungen, d.h. z.B. Spin-Spin-Kopplungen zwischen Paaren von Elektronen. 2. Wir nehmen an, dass sich die Wirkung der Z − 1 Restelektronen auf ein betrachtetes Elek~ approximieren lässt, dass zudem von der Form tron durch ein Potential V (Q) e ~ = − γZ V (Q) ~ |Q| e < Z die effektive Kernladung ist, die kleiner als Z ist weil die Restelektronen ist, wobei Z die Kernladung effektiv abschirmen. Mit dieser Nährung bewegt sich jedes einzelne Elektron unabhängig unter dem Einfluss des ~ und kann die möglichen Zustände ψn,l,m ,m mit n ∈ N, l ∈ effektiven Coulombpotentials V (Q) s l {0, 1, . . . , n − 1}, ml ∈ {−l, . . . , l}, ms = ± 21 und En,l,ml ,ms = En = −Ze2 Rn−2 einnehmen. Man macht deshalb den Ansatz dass der Gesamtzustand aller Z Elektronen ein vollständig antisymmetrisierter Produktzustand aus Einzelzuständen ψni ,li ,ml,i ,ms,i ist. Die Gesamtenergie dieses Zustandes ist die Summe der einzelnen Energien Eni . Für ein vorgegebenes Z erwartet man, dass der Grundzustand dadurch zu finden ist, dass man die Z Zustände mit der niedrigsten Energie auffüllt. 70 Für n = 1 gilt l = m = 0 es gibt also zwei mögliche Zustände (Spin-Up und Spin-Down), die Wasserstoff und Helium entsprechen, bzw. allgemein die innerste “Elektronenschale” bilden. Für n = 2 gibt es l = m = 0 (2 Zustände) und l = 1, m ∈ {−1, 0, 1} (6 Zustände), insgesamt also acht Zustände, die die zweite Elektronenschale bilden. Für höhere Elektronenschalen gilt das einfache Modell nicht mehr, weil u.a. Elektronen in Zuständen mit niedrigem l eine höhere Aufenthaltswahrscheinlichkeit nahe am Kern haben, was wegen der geringeren Abschirmung der Kernladung energetisch günstiger ist. Die Reihenfolge der höheren Schalen wird daher nicht nur durch n sondern auch durch l bestimmt. 1.8 Energiebänder in Festkörpern Aus der Diskussion des unendlich hohen Potentialtopfes wissen wir, dass die möglichen Energieniveaus diskret sind. Zwischen diesen diskreten Energieniveaus liegen endliche Intervalle in denen sich gewissermaßen keine Eigenzustände des Hamiltonoperators energetisch aufhalten können. Heuristisch ist das so zu verstehen dass Wellen an den Potentialwänden mehrfach reflektiert werden. Haben diese Wellen gerade die passende Wellenlänge und damit passenden Impuls und passende Energie, dann können sich stehende Wellen ausbilden. Für andere Energien und damit Wellenlängen interferieren sich die Mehrfachreflektionen weg und die Ausbildung einer stehenden Welle ist nicht möglich. Festkörper sind im einfachsten Fall Kristalle. D.h. die Atomkerne der entsprechenden Atome sind in einem regelmäßigen dreidimensionalen Muster angeordnet. Die Coulombpotentiale all dieser Atomkerne addieren sich zu einem Gesamtpotential, in dem sich die Elektronen bewegen. Auch wenn das Coulombpotential sich deutlich vom unendlichen hohen Potentialtopf unterscheidet, kann man sich die Situation heuristisch so vorstellen, dass die Elektronenwellen, zumindest teilweise, an den Atomkernen mehrfach reflektiert werden. Daraus folgt, dass die Eigenzustände des Hamiltonoperators zumindest zum Teil den Charakter von stehenden Wellen haben. Daher ist es nicht überraschend, dass es in Kristallen auch endliche Energieintervalle gibt, in denen man keine Eigenzustände des Hamiltonoperators findet. Dazwischen liegen Intervalle, in denen sehr wohl Energieigenzustände zu finden sind. Man spricht von “erlaubten” und “verbotenen” Zonen oder Bändern, da Elektronen (in Zuständen die sehr nahe an Energieeigenzuständen sind) sich in den “verbotenen” Zonen energetisch nicht aufhalten “dürfen”. Die erlaubten Zonen sind nicht diskret sondern endliche Intervalle. Man kann sich diese als überlagerung von vielen, sehr nahe beieinander liegenden diskreten Energieniveaus vorstellen. Diese kommen dadurch zustande, dass die diskreten Niveaus der Elektronen in einzelnen Atomen durch die Nähe zu den anderen Atomen und deren Elektronen auf verschiedene mögliche Arten und Weisen “verschoben” werden und die diskreten einzelnen Energieniveaus sich daher zu endlichen Intervallen verbreitern. Diese Struktur der Energieniveaus in Kristallen beeinflüsst entscheidend die physikalischen Eigenschaften des entsprechenden Festkörpers, insbesondere ihre Fähigkeit, Strom zu leiten. Um das zu verstehen benötigen wir den Begriff der Fermienergie EF . Dieser wird im zweiten Vorlesungsteil präzise diskutiert. An dieser Stelle reicht die folgende Definition: EF ist dadurch 71 charakterisiert, dass bei Temperatur T = 0K die Energieniveaus für E < EF vollständig mit Elektronen besetzt sind, während die Energieniveaus für E > EF vollständig unbesetzt sind. Man kann sich Stromleitung nun vereinfacht so vorstellen, dass Elektronen durch ein angelegtes elektrisches Feld in benachbarte Energieniveaus “geschoben werden”. Daher unterscheidet man folgende Materialien. • Leiter: Die Fermienergie EF liegt in einem erlaubten Energieband, das deswegen Leitungsband genannt wird. Es stehen benachbarte Energieniveaus zur Verfügung, die Elektronen haben also “genug Platz um Strom zu leiten”. • Isolatoren: Die Fermienergie EF liegt in einer verbotenen und sehr großen Bandlücke. Es stehen also keine benachbarten Energieniveaus zur Verfügung, die Elektronen haben “keinen Platz um Strom zu leiten”. • Halbleiter: Die Fermienergie EF liegt in einer verbotenen und vergleichsweise kleinen Bandlücke. Das erlaubte Band jeweils über/unter der Bandlücke wird Leitungs-/Valenzband genannt. Durch eine endliche Temperatur kann die durch EF vorgegebene “Energiegrenze” aufgeweicht werden, so dass die Niveaus für EF < E . EF + kB T (kB BoltzmannKonstante, T Temperatur) teilweise besetzt sein können (dieser Sachverhalt wird im zweiten Vorlesungsteil präzise behandelt). Ist die Bandlücke klein gegen kB T , dann stehen benachbarte Energieniveaus zur Verfügung. Stromleitung ist also bei genügend hohen Temperaturen möglich. Aus diesen Definition sollte klar sein, dass es keine scharfe Grenze zwischen Halbleitern und Isolatoren gibt. Nach diesen einleitenden Betrachtungen zur Existenz und Relevanz von Energiebändern in Festkörpern werden wir nun diskutieren, wie diese im Detail zustandekommen und berechnet werden können. 1.8.1 Gitter und reziprokes Gitter Wie bereits angedeutet sind Festkörper im einfachsten Fall Kristalle, also regelmäßige dreidimensionale Gebilde. Für die Diskussion in diesem Abschnitt nehmen wir idealisiert an, dass diese unendlich ausgedehnt sind und vernachlässigen damit Effekte an den Kristallrändern. Die Atomkerne in den Kristallen bilden ein Gitter. Mathematisch lässt sich ein Gitter A beschreiben als eine Menge von Punkten A ⊂ R3 . Diese Menge wird charakterisiert durch drei primitive Vektoren {~a1 , ~a2 , ~a3 }, die linear unabhängig sind und die Eigenschaft haben, dass eine Verschiebung des Gitters um diese Vektoren das Gitter in sich selbst überführt. Um die Definition möglichst eindeutig zu machen, verlangen wir, dass diese Vektoren die kleinstmögliche Länge haben. Im Fall, dass der Festkörper ein Kristall aus Atomen eines einzigen chemischen Elementes ist – auf den wir uns der Einfachheit halber einschränken wollen –, entsprechen die primitiven Vektoren 72 dann gerade den Verbindungsvektoren zwischen einem beliebigen Atom und einer Hälfte seiner nächsten Nachbarn. Beispiel: Im Falle eines rechtwinkligen Gitters bei dem die Atomabstände in x-, y - und z Richtung gerade a1 , a2 und a3 betragen sind mögliche primitive Vektoren a1 ~a1 = 0 , 0 0 ~a2 = a2 , 0 0 ~a3 = 0 . a3 Man kann aber auch einen oder mehrere dieser Vektoren mit −1 multiplizieren und erhält wieder einen gültigen primitiven Vektor. Aus dieser Diskussion folgt, dass sich – in einem Koordinatensystem mit einem Gitterpunkt im Ursprung – die Punkte im Gitter A vollständig durch die primitiven Vektoren ausdrücken lassen: ~ ∈ R3 von der Form A ~ = n1~a1 + n2~a2 + n3~a3 mit n1 , n2 , n3 ∈ Z} . A = {Menge aller A Der gesamte dreidimensionale Raum R3 wird durch das Gitter in einzelne Volumina unterteilt, die man als Volumen eines Gitteratoms interpretieren kann. Wie bereits erwähnt wählt man die Koordinaten in R3 so, dass ein Gitteratom im Ursprung liegt. Das entsprechende Volumen nennt man Wigner-Seitz-Zelle ZA . ZA wird konkret folgendermaßen konstruiert: Man betrachtet die halben Verbindungsvektoren ± 12 ~ai , i ∈ {1, 2, 3} vom Ursprungsatom zu seinen nächsten Nachbarn. Auf die Enden dieser Vektoren “legt” man Ebenen, die senkrecht auf diesen Vektoren stehen. Diese Ebenen schneiden sich an gewissen Linien und bilden ein Volumen, das das Ursprungsatom umschließt und es als Zentrum hat. Dieses Volumen ist gerade die Wigner-Seitz-Zelle. Beispiel: Für ein eindimensionales Gitter mit Gitterabstand a gilt h a ai ZA = − , ⊂ R. 2 2 Zu jeden Gitter A lässt sich ein zweites Gitter B konstruieren, das sogenannte reziproke Gitter. Dieses ist so definiert, dass die primitiven Vektoren {~b1 , ~b2 , ~b3 } dieses Gitters ~bi · ~aj = 2πδij erfüllen. Diese Vektoren lassen sich ausrechnen durch die Formel iT h ~b1 ~b2 ~b3 = 2π [~a1 ~a2 ~a3 ]−1 . Dabei ist für drei Vektoren ~ vi , i ∈ {1, 2, 3} [~v1 ~v2 ~v3 ] die Matrix deren i-te Spalte durch ~vi gegeben ist. 73 Beispiel: Wir betrachten ein zweidimensionales Gitter, das durch die primitiven Vektoren (2, 0) und (0, 1) gegeben ist. Es gilt dann h iT ~b1 ~b2 = 2π 2 0 0 1 !−1 =π 1 0 0 2 ! 1 0 =π !T ⇒ 0 2 ~b1 = π 0 ! , ~b2 = 0 ! 2π . Wie beim Gitter selbst gilt für das reziproke Gitter ~ ∈ R3 von der Form B ~ = n1~b1 + n2~b2 + n3~b3 mit n1 , n2 , n3 ∈ Z} . B = {Menge aller B Die Wigner-Seitz-Zelle ZB des reziproken Gitters nennt man Brillouin-Zone. Die Relevanz des reziproken Gitters und seiner Brillouin-Zone für die aktuelle Diskussion wird in Kürze deutlich werden. 1.8.2 Translationoperator Ein Gitter A ist wie besprochen invariant unter Translationen um die Vektoren ~ai , i ∈ {1, 2, 3}. Wir erwarten, dass diese Symmetrie sich in den Wellenfunktionen der Elektronen in den Gitteratomen widerspiegelt. Um diesen Sachverhalt zu formulieren benötigen wir den Translationsoperator T (~a). Für einen beliebigen räumlichen Vektor ~a ∈ R3 wird T (~a) definiert durch seine Wirkung auf die Wellenfunktion ψ(~ x) eines beliebigen reinen Zustandes ψ ∈ L2 (R3 ): T (~a)ψ(~x) = ψ(~x + ~a) . Um die Eigenschaften dieses Translationsoperators zu untersuchen, betrachten wir die Fourierzerlegung Z ~ d3 k ψ̂(~k)eik·~x ψ(~x) = R3 wobei ψ̂(~k) die Fouriertransformierte von ψ(~ x) ist. Es gilt Z T (~a)ψ(~x) = ~ ~ d k ψ̂(~k) eik·~a eik·~x = 3 Z R3 i ~ i ~ ~ d3 k ψ̂(~k) e ~ P ·~a eik·~x = e ~ P ·~a ψ(~x) , R3 ~ = −i~∇ ~ der Impulsoperator ist. Es gilt also wobei P i ~ T (~a) = e ~ P ·~a . Daraus folgt, dass die Eigenwerte von T (~a) von der Form ~ ~k ∈ R3 eik·~a , ~ sind. Mögliche Eigenfunktionen zu diesen Eigenwerten sind die ebenen Wellen eik·~x . Es gibt jedoch noch anderen Eigenfunktionen zu diesen Eigenwerten. Einige davon – die sogenannten Bloch-Wellen – spielen eine wichtige Rolle für das Verständnis der Energiebänder in Festkörpern. 74 1.8.3 Bloch-Wellen Das System der gesamten Elektronen im Kristallgitter wird durch einen Hamiltonoperator H beschrieben der die Wechselwirkungen der Elektronen untereinander und mit allen vorhandenen Atomkernen an den Gitterpunkten beschreibt. Wegen der diskreten Translationssymmetrie des Gitters muss gelten [H, T (~a1 )] = [H, T (~a2 )] = [H, T (~a3 )] = 0 , d.h. der Hamiltonoperator kommutiert mit den Translationsoperatoren für die primitiven Vektoren. Wir erwarten, dass Eigenzustände von H , die gleichzeitig Eigenzustände von den T (~ai ) sind, eine ausgezeichnete Rolle spielen. Tatsächlich gilt für solche Eigenzustände von T (~ai ) wie besprochen ~ T (~ai )ψ~k0 (~x) = ψ~k0 (~x + ~ai ) = eik0 ·~ai ψ~k0 (~x) für einen geeigneten Vektor ~k0 . Daraus folgt sofort |ψ~k0 (~x + ~ai )|2 = |ψ~k0 (~x)|2 , die Wahrscheinlichkeitsdichte in Eigenzuständen von T (~ai ) ist also invariant unter Translationen ~ um ~ai . Hier haben wir die Eigenfunktionen mit dem Vektor ~k0 indiziert, der den Eigenwert eik0 ·~ai festlegt. Wir wollen nun die allgemeine Form dieser Eigenfunktionen ermitteln. Dazu betrachten wir wieder die Fourierzerlegung von ψ~k (~ x) und finden 0 Z T (~ai )ψ~k0 (~x) = R3 Z ~ ~ d3 k ψ̂~k0 (~k) eik·~ai eik·~x = ~ ~ R3 ~ d3 k ψ̂~k0 (~k) eik0 ·~ai eik·~x = eik0 ·~ai ψ~k0 (~x) . Diese Identität gilt genau dann wenn unter dem Integral für alle ~k gilt ψ̂~k0 (~k) = 0 oder ~ ~ eik·~ai = eik0 ·~ai . ~ ∈ B im Die zweite Bedingung ist genau dann für alle i ∈ {1, 2, 3} erfüllt wenn es einen Vektor B reziproken Gitter gibt, so dass ~k = ~k0 + B ~ denn ~ · ~ai = (n1~b1 + n2~b2 + n3~b3 ) · ~ai = 2πni . B Es folgt also, dass die Fouriertransformierte ψ̂~k (~k) nur dann von Null verschieden sein kann, 0 ~ ist. Das Fourierintegral lässt sich in diesem Fall durch eine wenn ~k von der Form ~k = ~k0 + B Summe über die Punkte im reziproken Gitter ausdrücken: ψ~k0 (~x) = X ~ B∈B ~ ~ ~ i(k0 +B)·~x = ψ̂~k0 (~k0 + B)e X ~ ~ ~ B∈B | {z =u~k (~ x) 0 75 ~ ~ iB·~x eik0 ·~x = u~ (~x)eik0 ·~x . ψ̂~k0 (~k0 + B)e k0 } x) ist invariant unter Translationen um ~ai für alle i ∈ Die hierbei auftauchende Funktion u~k (~ 0 {1, 2, 3} denn u~k0 (~x + ~ai ) = ~ x iB·~ ~ ~ iB·~ ψ̂~k0 (~k0 + B)e e ai = X X ~ x i2πni ~ iB·~ ψ̂~k0 (~k0 + B)e e = u~k0 (~x) . ~ B∈B ~ B∈B Funktionen von der Form “ebene Welle mal Funktion invariant unter Gittertranslationen” nennt man Bloch-Wellen. Wir haben also bewiesen: ψ~k0 (~x) ist Eigenfunktion zu T (~ai ), für alle i ∈ {1, 2, 3} ⇔ ψ~k0 (~x) ist eine Bloch-Welle. Daher suchen wir im Folgenden nach Eigenfunktionen des Hamiltonoperators die gleichzeitig Bloch-Wellen sind. ~ Wir haben die Bloch-Wellen bislang mit einem Vektor ~k0 indiziert, der den Eigenwert eik0 ·~ai bestimmt. Für den Rest der Diskussion lassen wir den Index 0 der Einfachheit halber weg. Für eine Bloch-Welle ψ~k (~ x) wird p~ = ~~k der Quasiimpuls oder Kristallimpuls genannt. Dieser ist nicht eindeutig bestimmt, denn für be~ ∈ B gilt liebige B ~ ~ ~ ~ ~ ~ ei(k+B)·~ai = eik·~ai eiB·~ai = eik·~ai e2πini = eik·~ai , ~k ist also nur bis auf einen Vektor im reziproken Gitter bestimmt. In der Literatur hat sich folgende Konvention allgemein durchgesetzt: Um ~k eindeutig festzulegen, bestimmt man dass ~k ∈ ZB gelten soll, d.h. dass ~k einen Punkt in der Brillouinzone angibt. Das führt allerdings dazu, dass es mehrere mögliche Bloch-Wellen zum selben Quasiimpuls ~~k gibt, wie wir gleich sehen werden. 1.8.4 Die quasifreie Elektronen-Approximation Wir wollen nun die Energieniveaus des Hamiltonoperators bestimmen, der das System der Elektronen im Kristall beschreibt. Die vollständige Form des Operators enthält natürlich Coulombwechselwirkungen zwischen allen Elektronen untereinander und mit allen Atomkernen und kann darum wegen seiner Komplexität nicht exakt analysiert werden. Man macht deshalb die vereinfachende Annahme – die sogenannte Mean-Field-Näherung (etwa “Gemittelte–Feld–Näherung”) –, dass sich die Coulombwechselwirkungen zwischen einem ausgewählten Elektron und allen anderen durch eine einzige effektive Potentialfunktion approximieren lässt. Damit lässt sich die gesamte potentielle Energie eines einzelnen Elektrons durch eine einzige effektive Potentialfunktion V (~ x) angeben. Wegen der Gittersymmetrie muss gelten V (~x) = V (~x + ~ai ) für alle i ∈ {1, 2, 3}. Analog zur Diskussion des translationsinvarianten Anteils u~k (~ x) einer BlochWelle folgt aus der Translationsinvarianz von V (~ x), dass V (~x) von der Form V (~x) = X ~ x ~ iB·~ V̂ (B)e . ~ B∈B 76 sein muss. Da das Potential reell ist, d.h. V (~ x)∗ = V (~x), gilt außerdem ~ = V̂ (B) ~ ∗. V̂ (−B) Schließlich können wir ohne Beschränkung der Allgemeinheit annehmen, dass V̂ (0) = 0 ist, denn V̂ (0) 6= 0 wäre nur eine konstante Verschiebung der potentiellen Energie die keinen Einfluss auf die Dynamik hat. Für das Verständnis der elektrischen Leitfähigkeit von Festkörpern sind wir vor allem an Eigenzuständen des Hamiltonoperators interessiert, deren Energie in der Umgebung der Fermienergie ist. Für ein einzelnes Atom heißt das, dass wir vor allem an relativ hochenergetischen Elektronen in den äußeren Schalen interessiert sind. Dieses Bild ist natürlich nicht ganz korrekt, da ein Stromfluss gerade bedeutet, dass die Elektronen delokalisiert sind und nicht mehr einem einzelnen Atom zugeordnet werden können. Dennoch kann man daraus folgern, dass die relevanten Elektronenzustände solche sind, in denen die Wahrscheinlichkeit, dass ein Elektron sich nahe an einem Atomkern aufhält, sehr gering ist. Für solche Elektronen ist die Abschirmung der positiven Kernladungen durch die anderen Elektronen im Kristall besonders groß. Daher erwartet man, dass die potentielle Energie V (~ x) für solche Elektronen betragsmäßig besonders klein ist. Das motiviert eine an die Störungstheorie angelehnte approximative Behandlung der Wirkung des Potentials V (~ x) auf die möglichen Energieniveaus eines Elektrons im Kristall. In nullter Ordnung Störungstheorie betrachten wir deshalb für ein einzelnes Elektron den Hamiltonoperator H0 = P~ 2 ~2 ∆ =− . 2m 2m Wir suchen nach Eigenzuständen dieses Operators, die gleichzeitig Eigenzustände der Translationsoperatoren T (~ai ) sind, da jedes noch so kleine V (~ x) mit V (~x) = V (~x + ~ai ) dem System diese diskrete Symmetrie vorgibt. Zusammengefasst suchen wir also nach Bloch-Wellen, die Eigenfunktionen von H0 sind. Die möglichen Energieeigenwerte indizieren wir analog zur Indizierung der Bloch-Wellen mit dem Wellenzahlvektor ~k des Quasiimpulses. Aus der stationären Schrödingergleichung bekommen wir ~2 ∆ − ψ~ (~x) = E~k ψ~k (~x) 2m k ⇔ ⇔ ⇔ X ~ B∈B ~ 2 ~2 (~k + B) E~k − 2m ~ ∈ B gilt entweder für alle B ~ 2 ~2 (~k + B) E~k − 2m ! ~ x ~ i(~k+B)·~ ψ̂~k (~k + B)e =0 ! ~ =0 ψ̂~k (~k + B) ~ 2 ~2 (~k + B) E~k − 2m Die Lösungen dieser Gleichung sind daher von der Form ~ ~ ψ~k (~x) = Cei(k+B)·~x 77 ~ ∈B für alle B ! =0 oder ~ = 0. ψ̂~k (~k + B) ~ und den möglichen Energien mit einer Konstanten C = ψ̂~k (~k + B) E~k = ~ 2 ~2 (~k + B) . 2m Wenig überraschend finden wir also dass freie Bloch-Wellen ebene Wellen sein müssen, wo~ ∈ B möglich sind gilt, der Impuls bei wegen der Tatsache, dass beliebige ~k ∈ ZB und B ~ 3 beliebige Werte annehmen kann und somit alle ebenen Wellen mögliche ~ ∈ R p~ = ~(~k + B) Bloch-Eigenzustände sind. Im Gegensatz zum “vollständig freien” Fall ohne Gittersymmetrie gilt allerdings nicht, dass beliebige Superpositionen der ebenen Wellen mit Impuls p ~ und −~ p immer noch mögliche Eigenzustände von H0 sind, da wir gleichzeitig Eigenzustände der T (~ai ) haben wollen. Tatsächlich ist ~ ~ ~ ~ Cei(k+B)·~x + De−i(k+B)·~x ~ für D 6= 0 genau dann eine Eigenfunktion von allen T (~ai ) zum Eigenwert eik·~ai für alle i ∈ {1, 2, 3} wenn ~ ~k = − B und, wegen der Einschränkung ~k ∈ ZB , 2 ~ = n1~b1 + n2~b2 + n3~b3 mit n1 , n2 , n3 ∈ {−1, 0, 1} B gilt; ~k muss also am Rande oder in der Mitte der Brillouin-Zone liegen. Insgesamt finden wir also dass zu jedem der möglichen Energieniveaus E~k genau ein Bloch-Eigenzustand existiert, außer wenn ~k am Rande oder in der Mitte der Brillouin-Zone liegt; in diesem Fall sind die Energieniveaus (unendlichfach) entartet. Außerdem sehen wir, dass zu einem beliebig vorgebenen Quasiimpuls p = ~~k wegen der Einschränkung ~k ∈ ZB undlich viele verschiedene Bloch-Eigenzustände mit unterschiedlichen Energien existieren. Diese Energieniveaus lassen sich im eindimensionalen Fall für ein Gitter mit Gitterabstand a und reziprokem Gitterabstand b = 2π/a graphisch darstellen in dem man die Energieparabeln jeweils um Vielfaches von b nach links und rechts verschiebt und kopiert. 78 Das Resultat kann man auch dadurch erhalten, dass man die Energieparabel an den Rändern der Brillouinzone mehrfach “spiegelt”. Im obigen Bild sind die Schnittpunkte der Parabeln gerade die Punkte an denen die Energieniveaus entartet sind. In drei Dimensionen muss man entsprechend in alle drei Richtungen ~ai verfahren, die Energieparabeln müssen also an allen “Außenwänden” der Brillouin-Zone gespiegelt werden und es ergeben sich komplexere Energieniveaus. Um den Einfluss des Potentials V (~ x) auf diese Energieniveaus zu bestimmen, betrachten wir zunächst den eindimensionalen Fall qualitativ. Für den speziellen Entartungspunkt k = b/2 = π/a sind die ebenen Wellen bx bx ei 2 und e−i 2 mögliche Bloch-Eigenzustände, aber auch beliebige Linearkombinationen davon. Wir betrachten speziell die Linearkombinationen die sich durch Summe und Differenz ergeben πx bx = cos , 2 a πx bx −i bx 2 −e ) = sin . = sin 2 a bx 1 bx ψ+ (x) = (ei 2 + e−i 2 ) = cos 2 ψ− (x) = 1 i bx (e 2 2i Wie wir bereits aus allgemeinen Überlegungen wissen, sind die Wahrscheinlichkeitsdichten |ψ+ (x)|2 , |ψ− (x)|2 invariant unter Translation um a, d.h. sie sind periodisch mit Periode a. Wie wir in folgendem Bild sehen, hat ein Elektron im Zustand ψ± eine höhere/niedrigere Aufenthaltswahrscheinlichkeit in der Nähe der Atomkerne als ein Elektron im Zustand gegeben durch eine der ebenen Wellen. Daher erwarten wir, dass der Einfluss des Potentials V (x) derart ist, dass die Energie von ψ± nach unten/oben verschoben wird und damit die Energieentartung aufgehoben wird. Das lässt sich auch näherungsweise berechnen. Wir betrachten dafür die Schrödingergleichung für den vollen Hamiltonoperator H = H0 + V (~x) = − 79 ~2 ∆ + V (~x) , 2m wobei das Potential periodisch ist und sich daher wie besprochen in ebene Wellen mit Wellenzahlvektoren aus dem reziproken Gitter zerlegen lässt. Setzen wir diese Zerlegung, sowie die Zerlegung einer Bloch-Welle in die Schrödingergleichung ein, erhalten wir X ~ B∈B ~ 2 ~2 (~k + B) E~k − 2m ! ~ ~ X ~ i(k+B)·~x = ψ̂~k (~k + B)e ~ ~0 ~ 0 )ei(k+B )·~x ψ̂~k (~k + B = ~ 00 ·~ x ~ 00 )eiB V̂ (B ~ 00 ∈B B ~ 0 ∈B B X X ~ 0) ψ̂~k (~k + B ~ 0 ∈B B X ~ x ~ −B ~ 0 )ei(~k+B)·~ V̂ (B ~ B∈B ~ =B ~0 + B ~ 00 gesetzt haben und die Summe wobei wir im zweiten Schritt auf der rechten Seite B ~ 00 durch die Summe über B ~ ausgedrückt haben. Analog zum Fall V = 0 ist diese Gleichung über B ~ ∈ B erfüllt ist: genau dann erfüllt wenn die folgende Gleichung für alle B ~ 2 ~2 (~k + B) E~k − 2m ! ~ = ψ̂~k (~k + B) X ~ 0 )V̂ (B ~ −B ~ 0) . ψ̂~k (~k + B ~ 0 ∈B B ~ entsprechen im Fall Diese Gleichung ist wie folgt zu interpretieren. Die Koeffizienten ψ̂~k (~k + B) ~ ~ V (~x) = 0 verschiedenen Bloch-Eigenzuständen ei(k+B)·~x zum gleichen Quasiimpuls ~~k . Durch das Potential werden diese verschiedenen Zustände aneinander gekoppelt. Wir stellen die obige Gleichung nun um und erhalten X ~ = ψ̂~k (~k + B) ~ 0 )V̂ (B ~ −B ~ 0) ψ̂~k (~k + B ~ 0 ∈B B ~ 2 ~2 (~k + B) E~k − 2m . Wir betrachten nun den Fall, dass E~k das durch das Potential V (~ x) gestörte niedrigste Energie2~ 2 2~ 2 k k , dass E~k ' ~2m . Der Nenner auf niveau zum Quasiimpuls ~~k ist. Dann gilt wegen V (~ x) ~2m der rechten Seite wird also minimal und der Ausdruck auf der rechten Seite wird maximal wenn ~ 2 = ~k 2 (~k + B) ~ ~ = 0 oder ~k = − B , B 2 ⇔ ~ = n1~b1 + n2~b2 + n3~b3 mit n1 , n2 , n3 ∈ wobei erneut, und für den Rest der Diskussion gilt: B ~ {−1, 0, 1}, so dass ± B2 ∈ ZB . Diese Beobachtung ist folgendermaßen zu interpretieren: die durch ~ ~ das Potential V (~ x) induzierte Kopplung zwischen den ungestörten Zuständen ei(k+B)·~x ist im Fall der untersten Energieniveaus am stärksten für die beiden Zustände ei ~ x B·~ 2 und e−i ~ x B·~ 2 . Für die anderen Zustände ist sie vergleichsweise schwach und wir werden sie im Folgenden daher als Approximation vernachlässigen. Diese zwei Zustände entsprechen gerade einem möglichen Energieentartungspunkt am Rand der Brillouin-Zone, den wir im eindimensionalen Fall 80 bereits qualitativ betrachtet haben. Eine analoge Aussage gilt für alle anderen Energieentartungspunkte am Rand oder in der Mitte der Brillouin-Zone. Für den betrachteten Entartungspunkt reduziert sich die Schrödingergleichung also (unter Ausnutzung von V̂ (0) = 0) in guter Näherung auf das Gleichungssystem E− B~ 2 E− B~ 2 ~2 ~2 B − 8m ~2 ~2 B − 8m ! ~ B 2 ψ̂− B~ 2 ! ψ̂− B~ 2 ! ~ B − 2 ~ B − 2 = ψ̂− B~ 2 ! ~ B 2 = ψ̂− B~ 2 ! ~ , V̂ (B) ! ~ , V̂ (−B) das wir umschreiben können als ~2 ~2 B 8m ~ ψ̂− B~ − B2 2 = 0, ~ − E− B~ ψ̂− B~ B2 ~ ∗ V̂ (B) − E− B~ 2 ~2 ~2 B 8m ~ V̂ (B) 2 2 ~ = V̂ (B) ~ ∗ verwendet haben. Diese Gleichung hat nur dann wobei wir V (~ x)∗ = V (~x) ⇔ V̂ (−B) eine nichttrivialle Lösung wenn die Determinante der Matrix verschwindet. Daraus folgt für die möglichen Energieniveaus unter dem Einfluss des Potentials E− B~ = E± = 2 ~2 ~2 B ~ . ± |V̂ (B)| 8m Diese entsprechen gerade den Zuständen ~ ψ̂− B~ − B2 2 ∝ ~ ψ̂− B~ B2 2 81 ∓1 1 ! d.h. den Zuständen ! ~ x ~ x B·~ 1 B·~ ψ+ (~x) = (ei 2 + e−i 2 ) = cos 2 ~ · ~x B 2 ~ x ~ x B·~ B·~ 1 ψ− (~x) = (ei 2 − e−i 2 ) = sin 2i ~ · ~x B 2 , ! . Wir sehen also, dass die qualitativen Überlegungen in einer Dimension richtig waren. Die Ener~ , dem Betrag der gieniveaus der Zustände ψ± werden verringert/erhöht, und zwar um |V̂ (B)| ~ ~ Fouriertransformierten des Potentials an einer bestimmten Stelle B = 2k , wobei ~k der betrachtete Entartungspunkt am Rand oder in der Mitte der Brillouin-Zone ist. Die grafische Darstellung der Energieniveaus in der Brillouin-Zone ändert sich also folgendermaßen ab: Die Parabeln werden an den Energieentartungspunkten in der Mitte und am Rand der BrillouinZone durch das Potential “auseinandergebogen”. Dadurch entstehen “verbotene Zonen”, im Bild durch graue Balken markiert. Die Breite einer verbotenen Zone – die Bandlücke – ist gerade so ~ . groß wie 2|V̂ (B)| 2 Thermodynamik und Statistik 2 2.1 Wiederholung: phänomenologische Thermodynamik Die phänomenologische Thermodynamik beschäftigt sich mit den phänomenologischen Eigenschaften von makroskopischen Systemen im Gleichgewicht. Die dabei postulierten Gesetze und Zusammenhänge sind zunächst rein empirisch motiviert, können aber im Rahmen der statistischen Physik (zumindest zu einem großen Teil) mikroskopisch hergeleitet werden. 2.1.1 Grundbegriffe Die der phänomenologischen Thermodynamik grundlegenden empirischen Beobachtungen sind: 1. Der Zustand eines Systems (Gas, Füssigkeit, Festkörper) lässt sich durch wenige intensive Größen charakterisieren. Das sind Größen, die in einem Gebiet, das groß im Vergleich zu atomaren Ausdehnungen aber klein im Vergleich zur Gesamtgröße des Systems ist, gemessen werden können. Beispiele sind: Druck, chemisches Potential, Dichten, Strömungsgeschwindigkeiten, Stoffkonzentrationen, Temperatur. Im Gegensatz dazu gibt es extensive Größen die das Gesamtsystem beschreiben und derart sind, dass sie sich bei Kombination von mehreren Einzelsystemen zu einem Gesamtsystem addieren, z.B. Energie, Volumen, Teilchenzahl, Entropie, Magnetisierung. Diese hängen von den intensiven Größen ab. In dieser Beschreibung ist ein Zustand eines Systems zu einem Zeitpunkt t gegeben durch 82 ~ ~x) dessen Komponenten Zi (t, ~x) den Wert der i-ten Zustandsgröße am ein Vektorfeld Z(t, Ort ~ x und zum Zeitpunkt t angeben. 2. Der Zustand eines abgeschlossenen Systems tendiert immer zu einem stationären, d.h. zeitunabhängigen Zustand. Ein Beispiel ist der Druckausgleich der stattfindet, wenn man einen verschlossenen, mit Gas gefüllten Behälter in ein abgeschlossenes Vakuum einbringt ~ ~x) = Z ~ (0) (~x) wobei Z ~ (0) (~x) ein Gleichgeund öffnet. Mathematisch heißt das limt→∞ Z(t, wichtszustand genannt wird. Man beobachtet, dass in einem Gleichgewichtszustand das ~ (0) (~x) jeGesamtvolumen V eines Systems in mehrere Teilvolumina Vi zerfällt in denen Z weils konstant ist. In der Diskussion von Gleichgewichtszuständen können also alle Zuständsgrößen als ortsunabhängig angesehen werden; sie können nur zwischen homogenen Subsystemen des Gesamtsystems variieren. Im Kontext eines homogenen Systems A im Gleichgewicht unterscheiden sich intensive und extensive Grössen folgendermaßen. Teilt man A in zwei Subsyteme A1 und A2 auf so gilt für eine intensive Größe I und eine extensive Größe E I(A1 ) = I(A2 ) = I(A) , E(A1 ) + E(A2 ) = E(A). Oft lassen sich Zustände eines Systems durch zwei Grössen eindeutig charakterisieren, z.B. Druck & Temperatur oder Druck & Volumen für ein Gas das aus einer festgelegten Anzahl N 1 Atomen oder Molekülen besteht. Ist zusätzlich N variabel, muss man eine weitere Größe, z.B. N selbst, zur eindeutigen Charakterisierung dazunehmen. Für solche Systeme kann es allerdings passieren, dass für bestimmte Werte der Zustandsgrößen mehr als ein Zustand existiert. Man spricht dann von unterschiedlichen koexistierenden Phasen und die Werte der jeweiligen Zustandsgrößen markieren einen Phasenübergang, z.B. jenen von fest nach füssig, oder, z.B. bei Wasser, den Tripelpunkt an dem die feste, flüssige und gasförmige Phase koexistieren. Ziel der phänomenologischen Thermodynamik ist es nun, Gleichgewichtszustände selbst und mögliche Übergänge zwischen diesen zu charakterisieren. Dabei betrachtet man in der Regel quasistatische Prozesse, d.h. man stellt sich vor, dass der Zustand eines Systems im Gleichgewicht sich dadurch ändert, dass man es schwach an ein zweites System im Gleichgewicht koppelt. Ein Beispiel wären zwei Gasbehälter mit unterschiedlichen Drücken, bei denen der Druckausgleich durch einen sehr dünnen Verbindungsschlauch passiert. In einem solchen Fall kann man annehmen, dass die Änderung des Gleichgewichtszustandes derart ist, dass jeder Zwischenschritt selbst ein Gleichgewichtszustand ist. Die Alternative würde ein genaues Verständnis von Nichtgleichgewichtszuständen erfordern, das im Allgemeinen nicht einfach zu erlangen ist. Quasistatische Prozesse sind also eindimensionale Kurven im Raum der Zustände, den wir uns in vielen Fällen als zweidimensionalen oder dreidimensionalen Raum parametrisiert durch z.B. die Variablen (p, V ) beziehungsweise (p, V, N ) vorstellen können. Die Hauptsätze der Thermodynamik charakterisieren die möglichen Prozesse. 83 2.1.2 Der nullte Hauptsatz: die Existenz der Temperatur Es seien A und B zwei Systeme die jeweils in einem Gleichgewichtszustand sind. Wir bringen A und B in thermischen Kontakt, das heißt, dass A und B derart in Kontakt sind, dass eine mechanische Wechselwirkung oder ein Austausch von Materie zwischen A und B nicht möglich ist. Ein Beispiel sind zwei gasgefüllte Behälter deren Außenwände sich berühren. Wir sagen nun dass A und B im (gegenseitigen) thermischen Gleichgewicht sind, wenn sich der Zustand von A und B durch den Kontakt nicht ändert. Der nullte Hauptsatz besagt nun für drei Systeme A, B , C : Ist A im thermischen Gleichgewicht mit B und B im thermischen Gleichgewicht mit C dann ist A im thermischen Gleichgewicht mit C . Das impliziert sofort die Existenz einer intensiven Zustandsgrösse T die man Temperatur nennt. 2.1.3 Der erste Hauptsatz: Energieerhaltung Sind A und B zwei Systeme im thermischen Kontakt die nach dem Kontakt zunächst nicht im thermischen Gleichgewicht sind, dann werden sich die Zustände von A und B ändern, bis Gleichgewicht herrscht. Dabei wird im Allgemeinen Energie zwischen den beiden Systemen ausgetauscht. Diese Energie nennt man Wärme Q. Bei einem allgemeinen Kontakt zwischen den Systemen A und B wird nicht nur Wärme übertragen sondern ein System kann an dem anderen z.B. mechanische oder chemische Arbeit leisten. Jedes System besitzt eine gewisse innere Energie E (im Gegensatz zur kinetischen oder potentiellen Energie). Bei einem abgeschlossenen System ist die Energie erhalten. Der erste Hauptsatz besagt gerade, dass die Änderung der Energie bei einem nicht abgeschlossenen System notwendigerweise auf Beiträge wie mechanische Arbeit oder Wärmeaustausch zurückzuführen ist. Zur Formulierung des ersten Hauptsatzes erinnern wir an den mathematischen Begriff des Differenzials und den Zusammenhang mit partiellen Ableitungen. Dazu betrachten wir eine Funktion f (x, y) von zwei Variablen. Wie gesagt lassen sich Zustände von vielen homogenen Systemen oft durch die Angabe von zwei Zustandsvariablen bereits eindeutig charakterisieren, die anderen Zustandsgrößen sind dann notwendigerweise Funktionen dieser Variablen. Wir definieren das totale Differential df der Funktion f (x, y) als df (x, y) = ∂f (x, y) ∂f (x, y) dx + dy ∂x ∂y und interpretieren diese Grösse als die infinitesimale Änderung von f bei infinitesimaler Änderung von x und y . Rechenregeln: d(f g) = gdf + f dg , d(f + g) = df + dg . In der Thermodynamik schreibt man das oft äquivalent als df = ∂f ∂x dx + y 84 ∂f ∂y dy x um zu betonen, dass z.B. ∂f ∂x y der Ableitung von f nach x mit festgehaltenem y , also ∂f (x, y) , ∂x entspricht. Die Motivation der expliziten Ausweisung der Variablen, die beim Ableiten “festgehalten wird”, ist folgende. Es ist in der phänomenologischen Thermodynamik oft nützlich eine Funktion der Zustandsvariablen, d.h. eine allgemeine Zustandsgröße, durch andere äquivalente Variable auszudrücken, die man etwa leichter experimentell kontrollieren kann. Z.B. kann es manchmal nützlich sein einen Gleichgewichtszustand durch Druck p und Volumen V zu beschreiben, ein anderes Mal kann aber eine Beschreibung durch Druck p und Temperatur T geeigneter sein. Im ersteren Fall würde man (p, V ) als Zustandsvariablen verwenden, im letzteren (p, T ). Die funktionale Abhängigkeit einer anderen Zustandsgröße hängt natürlich von der Wahl dieser Variablen ab und das gilt auch für ihre partiellen Ableitungen, die selbst Zustandsgrößen sind. Beispiel: Es sei f (x, y) = xy 2 . Wir wollen f durch die Variablen u, y ausdrücken, wobei u = u(x, y) = xy ist. Dazu bemerken wir dass x = u/y und damit f˜(u, y) = f (x(u, y), y) = uy . Es gilt also ∂f (x, y) = 2xy , ∂y ∂ f˜(u, y) = u. ∂y In der Thermodynamik hat sich die Schreibweise durchgesetzt, dass f˜ auch als f geschrieben wird da es dieselbe Funktion ist, bzw. physikalische Zustandsgröße ist, die nur durch andere Variablen ausgedrückt wird. Man identifiziert daher (in diesem Beispiel und sonst analog) ∂f ∂y x ∂f (x, y) ' , ∂y ∂f ∂y ' u ∂ f˜(u, y) . ∂y Drückt man nun (∂f /∂y)u als Funktion von (x, y) aus, findet man ∂f ∂y = u = xy 6= 2xy = u ∂f ∂y . x Es wird also deutlich, dass es eine wichtige Rolle spielt, welche Größe man beim partiellen Ableiten “festhält”, d.h. genauer welche Grössen man als weitere Variablen wählt, da sich partielle Ableitungen in verschiedenen Koordinatensystemen im Allgemeinen unterscheiden und damit im Allgemeinen unterschiedlichen physikalischen Zustandsgrößen entsprechen. Neben den oben erwähnten totalen Differentialen spielen auch allgemeine Differentiale eine wichtige Rolle. Diese sind bei der Wahl der Variablen (x, y) von der Form α(x, y) = αx (x, y)dx + αy (x, y)dy 85 Man kann zeigen, dass (auf einem sternförmigen Gebiet) α genau dann ein totales Differential ist – d.h. es gibt eine Funktion f (x, y) mit α = df –, wenn ∂αy (x, y) ∂αx (x, y) = . ∂y ∂x Diese Bedingung ist analog zur Bedingung, dass (αx , αy ) die Komponenten eines konservativen (Kraft-)Feldes in zwei Raumdimensionen sind. f mit α = df wäre dann das Potential zu diesem Feld. Der Unterschied zwischen allgemeinen und totalen Differentialen ist folgender. Wir betrachten eine Kurve γ in einem zweidimensionalen Raum, z.B. einen thermodynamischen Prozess. Es lässt sich zeigen, dass das Integral eines Differentials α entlang dieser Kurve genau dann nur von Start- und Endpunkt der Kurve abhängt wenn α ein totales Differential ist. Beispiel: Wir betrachten die Variablen (p, V ) und die zwei stückweise geraden Kurven γ1 : (p0 , V0 ) → (p0 , V1 ) → (p1 , V1 ), γ2 : (p0 , V0 ) → (p1 , V0 ) → (p1 , V1 ), sowie das Differential δA = −pdV . δA entspricht der infinitesimalen mechanischen Arbeit, die benötigt wird um das Volumen V einen Systems mit Druck p um dV zu vergrößern (also δA > 0 bei p > 0 und Kompression). Offenbar ist δA kein totales Differential, da δA = −pdV = −pdV + 0dP , ∂(−p) = −1 6= 0 . ∂p Tatsächlich gilt Z Z δA = −p0 (V1 − V0 ) 6= −p1 (V1 − V0 ) = γ1 δA . γ2 Andererseits gilt für das totale Differential α = df mit f (p, V ) = −pV Z Z d(−pV ) = − γ1 Z pdV − γ1 V dp = −p0 (V1 − V0 ) − V1 (p1 − p0 ) = −V1 p1 + V0 p0 = γ1 Z = −p1 (V1 − V0 ) − V0 (p1 − p0 ) = d(−pV ) . γ2 Wir sehen also, dass die an einem System geleistete Arbeit prozessabhängig ist. Der Anfangsund Endzustand von Prozessen mit gleichen Start- und Endpunkt und die damit zusammenhängenden Zustandsgrößen sind allerdings per Definition prozessunabhängig. Daraus folgt: • Die infinitesimale Änderung von Zustandsgrößen Z (z.B. Energie, Temperatur, Druck, ...) bei einer infinitesimalen Zustandsänderung wird durch ein totales Differential dZ ausgedrückt. • Die infinitesimalen Änderung von prozessabhängigen Größen P (z.B. geleistete mechanische Arbeit A, Wärmeübertrag Q, geleistete chemische Arbeit C ) wird durch ein Differential δP ausgedrückt das nicht total ist. 86 Wir können nun den ersten Hauptsatz formulieren als dE = δA + δQ + δC = δQ − pdV + µdN wobei δC = µdN die chemische Arbeit ist und µ das chemische Potential. D.h. µ ist die Arbeit, die geleistet werden muss um bei konstantem Druck und konstanter Temperatur die Teilchenzahl des betrachteten (hier der Einfachheit halber einatomigen) Systems um eins zu erhöhen. Im allgemeinen kann es noch weitere (z.B. elektromagnetische) Beiträge zur Änderung der Energie geben. Der erste Hauptsatz kann auch als Definition von δQ und damit der Wärme aufgefasst werden. Dabei werden reversible Prozesse dadurch definiert, dass für ein abgeschlossenes System δQ = 0 gilt. Im Gegensatz dazu gilt für irreversible Prozesse δQ 6= 0. Prozesse mit δQ = 0 werden auch adiabatisch genannt. Der Unterschied zwischen den Begriffen adiabatisch und irreversibel besteht im Wesentlichen darin, dass “adiabatisch” auch oft für ein Teilsystem eines Gesamtsystems gebraucht wird, z.B. wenn ein zu betrachtendes System an ein “externes” System gekoppelt wird, während wir hier den Standpunkt einnehmen wollen, dass “irreversibel” nur für abgeschlossene Systeme ein sinnvoller Begriff ist. 2.1.4 Der zweite Hauptsatz: Entropie und irreversible Prozesse Wie bereits diskutiert existieren in der phänomenologischen Thermodynamik irreversible Prozesse. Im zweiten Hauptsatz werden diese genauer charakterisiert. Es gibt unterschiedliche Äquivalente Formulierungen dieses Satzes. Die Version von Clausius lautet: Es gibt keine Zustandsänderung, die allein darin besteht, dass Wärme von einem Wärmespeicher mit T1 auf einen Wärmespeicher mit T2 > T1 übergeht. Die Formulierung von Kelvin lautet hingegen: Es gibt keine Zustandsänderung, die allein darin besteht, dass eine Wärmemenge einem Wärmespeicher entzogen und vollständig in Arbeit umgesetzt wird. Die Äquivalenz der Formulierungen kann man folgendermaßen sehen. Angenommen die Bedingung von Kelvin ist verletzt, dann könnte man dem kalten Reservoir Wärme entziehen, vollständig in mechanische Arbeit umwandeln, und das warme Reservoir, z.B. durch Reibung, erhitzen; die Bedingung von Clausius wäre also auch verletzt. Umgekehrt nehmen wir an, dass diese verletzt ist. Dann kann man eine Maschine konstruieren, die nacheinander 1) einem Reservoir mit T2 die Wärmemenge Q2 entnimmt, 2) die mechanische Arbeit A leistet und gleichzeitig dem Reservoir mit T1 < T2 die Wärmemenge Q1 zuführt und 3) diese Wärmemenge dem System mit T2 zurückführt. Wegen des ersten Hauptsatzes gilt A = Q2 − Q1 und die Maschine hat bei einem vollen Zyklus die Wärmemenge Q2 − Q1 vollständig in die mechanische Arbeit A überführt. Eine weitere äquivalente Formulierung des zweiten Hauptsatzes bzw. eine Konsequenz ist die Existenz einer Zustandsgröße S – die Entropie –, die folgende Bedingungen erfüllt und irre87 versible Prozesse quantitativ charakterisiert: 1. Bei irreversiblen Prozessen gilt für ein abgeschlossenes System dS > 0 (die Entropie erhöht sich), bei reversiblen Prozessen gilt für ein abgeschlossenes System dS = 0 (die Entropie ändert sich nicht). 2. S ist extensiv. Durch diese Bedingungen wird S bis auf eine additive Konstante (und eine Einheit) festgelegt. Tatsächlich folgt aus δQ = 0 für reversible Prozesse, dass dS = βδQ wobei β eine Funktion der Zustandsvariablen ist. β wird integrierender Faktor genannt, weil durch Multiplikation mit β aus dem nicht-totalen Differential δQ ein totales Differential dS wird. Anders gesagt, schafft man es durch die Einführung der Entropie die prozessabhängige Größe Q durch eine prozessunabhängige Zustandsgröße S auszudrücken. Man kann durch weitere Überlegungen zeigen, dass β = 1/T die inverse (absolute, thermodynamische) Temperatur T ist. Genaugenommen wird durch dS = δQ/T die thermodynamische Temperatur T erst vollständig und systemunabhängig definiert. Die infinitesimale Änderung der inneren Energie gemäß des ersten Hauptsatzes lässt sich also umschreiben als dE = T dS − pdV + µdN . Das ist die sogenannte Gibbs’sche Fundamentalform. Als Beispiel betrachten wir den thermischen Kontakt zweier Systeme die jeweils im Gleichgewicht sind mit jeweiligen Temperaturen T1 < T2 . Aus den Eigenschaften der Entropie und der Irreversibilität des Temperaturausgleichs folgt dS = δQ1 δQ2 + >0 T1 T2 wobei δQ1 und δQ2 die jeweils ausgenommenen Wärmemengen bei einem infinitesimalen Temperaturausgleichsprozess sind. Wegen Energieerhaltung und dem Fehlen von mechanischer und chemischer Arbeit gilt δQ1 + δQ2 = 0 und damit dS = δQ1 1 1 − T1 T2 >0 ⇒ δQ1 > 0 (da T2 > T1 ). Die Forderung dS > 0 impliziert also, dass das wärmere System Wärme an das kältere abgibt. An diesem Beispiel wird auch deutlich, dass die Entropie eines Subsystems durchaus abnehmen kann. Die Forderung dS ≥ 0 gilt nur für abgeschlossene Systeme. 88 2.1.5 Der dritte Hauptsatz: Unerreichbarkeit des Temperaturnullpunktes Nernst hat beobachtet, dass die Entropie eines Systems (eines perfekten Kristalls) nahe am Temperaturnullpunkt eine universelle Größe ist, die nicht von den anderen (über die Temperatur hinaus zur eindeutigen Charakterisierung eines Zustandes benötigten) Zustandsvariablen ~ abhängt. Da S durch den zweiten Hauptsatz nur bis auf eine additive Konstante festgelegt Z ist, kann man die universelle Entropie bei T = 0 als S = 0 festlegen. Diese Tatsache lässt sich mathematisch als dritten Hauptsatz formulieren: ~ = 0. lim S(T, Z) T →0 Zusätzlich fordert man oft, dass diese Eigenschaft auch für die partiellen Ableitungen von S gilt: lim T →0 ~ ∂S(T, Z) ∂Zi ! = 0. T,Zj6=i Diese Tatsache impliziert, dass die mögliche Entropieentnahme durch Prozesse nahe am absoluten Temperaturnullpunkt ebenfalls immer kleiner wird. Diese Prozesse sind aber nötig, um ein Teilsystem immer weiter abzukühlen. Es folgt also, dass es nicht möglich ist in endlicher Zeit bzw. endlich vielen Prozessschritten ein Teilsystem auf T = 0 abzukühlen. Diese Tatsache folgt nicht bereits aus dem zweiten Hauptsatz nach Clausius. Dieser besagt nämlich zunächst nur, dass ein reiner Wärmeübertrag von einem kalten zu einem warmen System unmöglich ist. Die Möglichkeit, dass dieses unter gleichzeitiger Verrichtung von Arbeit passiert, ist zunächst nicht explizit ausgeschlossen. 2.1.6 Gleichgewichtsbedingungen und Konkavität/Konvexität Die Entropie ist im Gleichgewicht maximal in folgenden Sinn. Wir betrachten zwei Systeme A1 und A2 die jeweils im Gleichgewicht sind. Die Gleichgewichtszustände der Systeme werden je~ i = (Ei , Vi , Ni ), i = 1, 2 eindeutig bestimmt. Wir bringen die weils durch die Zustandsvariablen Z beiden Systeme in Kontakt (z.B. thermisch oder mechanisch) und nehmen an, dass sie vor dem Kontakt nicht miteinandeinder im Gleichgewicht waren. Der Prozess des z.B. Druck- oder Temperaturausgleichs nach dem Kontakt ist irreversibel, daher wächst die Entropie diesem Prozess an und wird im Gleichgewicht maximal. Konkret bedeutet das folgendes. Die Systeme können bei der Einstellung des Gleichgewichts z.B. Energie oder Volumen austauschen und haben im ~0, Z ~ 0 mit Gleichgewicht die neuen Zustandsvariablen Z 1 2 ~ ~ 10 + Z ~ 20 = Z ~1 + Z ~2 = Z Z Also gilt nach der Einstellung des Gleichgewichts ~ = S(Z ~ 10 ) + S(Z ~ 20 ) = S(Z ~ 10 ) + S(Z ~ −Z ~ 10 ) . S(Z) 89 ~ als Funktion von Z ~ 0 im Gleichgewicht maximal wird. InsMaximalität bedeutet jetzt, dass S(Z) 1 besondere gilt dann im Vergleich zur Vorgleichgewichtssituation ~ ≥ S(Z ~ 1 ) + S(Z ~2) . S(Z) Diese Aussage lässt sich natürlich für beliebig viele Systeme verallgemeinern. Wenn man annimmt dass ∂S ∂E = V,N 1 >0 T ⇔ T >0 also dass S(E, V, N ) eine streng monotone Funktion der inneren Energie ist, dann folgt aus der Maximalität der Entropie die Minimalität der inneren Energie im Gleichgewicht nach Prozessen bei denen sich S , V und N nicht ändern. Das ist wie folgt zu sehen. Wir betrachten wieder zwei Systeme A1 und A2 die jeweils im Gleichgewicht sind. A1 und A2 werden in Kontakt miteinander und mit einem dritten System B (einem “Bad”) gebracht. Es stellt sich (quasistatisch) ein Gleichgewicht zwischen allen drei Systemen A1 , A2 und B ein, wobei B während dieses Prozesses ständig als sich im Gleichgewicht befindend angenommen wird. Der Kontakt ist derart, dass S1∪2 = S(A1 ) + S(A2 ) sich beim Übergang zum wechselseitigen Gleichgewicht aller Systeme nicht ändert, während S(B) sich sehr wohl ändern kann. Da A1 ∪ A2 ∪ B abgeschlossen ist, ist E = E1∪2 + E(B) erhalten und wir nehmen an, dass ein Austausch von V, N zwischen A1 und A2 möglich ist, nicht aber zwischen A1 ∪ A2 und B . Nachdem alle drei Systeme im Gleichgewicht sind, ist S1∪2 + S(B) maximal. Wegen (∂S(B)/∂E(B))V (B),N (B) > 0 muss E(B) auch maximal sein, darum ist E1∪2 minimal. Hierbei ist zu beachten dass “E(B) maximal” kein Widerspruch zum abgeleiteten Resultat ist, da B sich ständig im Gleichgewicht befunden hat. Aus der Maximalität der Entropie folgt eine wichtige Eigenschaft für die Entropie eines einzelnen Systems. Dazu betrachten wir ein System A dessen Zustand durch die extensiven Variablen E, V, N festgelegt ist. Für ein kombinbiertes System aus λ Kopien des Systems A gilt wegen der Extensivität der Entropie S(λE, λV, λN ) = λ X S(E, V, N ) = λS(E, V, N ) , i=1 d.h. die Entropie ist homogen für beliebige λ ∈ [0, ∞)16 . Analog sind alle extensiven Zustandsgrößen homogene Funktionen extensiver Zustandsvariablen. Aus der Maxmimalität der Entropie folgt nun, dass die Entropie eine konkave Funktion der ~ = (E, V, N ) beextensiven Zustandsgrößen ist. Und zwar können wir ein Gesamtsystem mit Z ~ ~ ~ liebig aus zwei kleineren Kopien mit Z = λZ1 + (1 − λ)Z2 , λ ∈ (0, 1) zusammensetzen. Es gilt also ~ 1 ) + (1 − λ)S(Z ~ 2 ) = S(λZ ~ 1 ) + S((1 − λ)Z ~ 2 ) ≤ S(λZ ~ 1 + (1 − λ)Z ~2) . λS(Z |{z} |{z} Hom. Max. 16 Aus der Homogenität für natürliche Zahlen kann man unter der Annahme dass S für alle positiven reellen E, V, N definiert und stetig ist zunächst die Homogenität für inverse natürliche Zahlen, dann die Homogenität für rationale Zahlen und aus der angenommenen Stetigkeit schließlich die Homogenität für beliebige relle Zahlen folgern. 90 ~ 1 und Z ~ 2 so wählen können, dass Es gilt nicht notwendigerweise das Gleichheitszeichen, da wir Z im jeweils dazugehörigen Gleichgewichtszustand z.B. die Temperaturen T1 und T2 unterschied~ 1 und Z ~ 2 , und damit auch die Systeme mit λZ ~ 1 und (1−λ)Z ~2, lich sind, so dass die Systeme mit Z im Allgemeinen nicht im Gleichgewicht miteinander sind. Analog zu der Tatsache, dass die Maximalität der Entropie impliziert, dass S(E, V, N ) eine konkave Funktion ist, impliziert die Minimalität der inneren Energie, dass E(S, V, N ) eine konvexe Funktion ist. Für eine konvexe Funktion f (x) einer Variablen die zweimal differenzierbar ist gilt ∂ 2 f (x)/∂x2 ≥ 0. Für eine konvexe Funktion f (x1 , . . . , xn ) mehrerer Variablen gilt analog, dass die Matrix der zweiten Variablen ∂ 2 f (x)/(∂xi ∂xj ) positiv semidefinit ist, d.h. alle Eigenwerte sind ≥ 0. Insbesonder impliziert das für die Diagonalelemente ∂ 2 f (x)/∂x2i > 0. 2.1.7 Zustandsgleichungen und thermodynamische Potentiale Wie besprochen lassen sich Gleichgewichtszustände oft durch zwei oder drei Zustandsvaria~ eindeutig charakterisieren. Die anderen Zustandsgrößen sind dann notwendigerweise blen Z ~ . Die Form dieser Funktionen bzw. allgemein die Relation zwischen anderen Funktionen von Z ~ wird durch Zustandsgleichungen festgelegt. Zustandsgrössen und Z Beispiel: für das ideale Gas gilt die Relation pV = N kT wobei k die Boltzmann-Konstante k = 1.38064852(79) × 10−23 J · K−1 ~ = (p, V, N ) als Zustandsvariablen ergibt sich die thermische Zustandsist. Betrachtet man Z gleichung T (p, V, N ) = pV . Nk Aus dem Gleichverteilungssatz der klassischen statistischen Mechanik bekommt man die kalorische Zustandsgleichung E(T, V, N ) = f N kT 2 wobei f die Anzahl der Freiheitsgrade eines Gasteilchens ist z.B. f = 3 bei einem einatomigen Gas. Bei der Beschreibung eines Gases als ideales Gas macht man unter anderen folgende vereinfachte Annahmen, die in vielen Situationen nicht gültig sind. 1. Man vernachlässigt die attraktive Wechselwirkung der Gasteilchen untereinander. 2. Man vernachlässigt das endliche Volumen der einzelnen Gasteilchen und nimmt diese als punktförmig an. Genaugenommen impliziert das, dass man eine repulsive Wechselwirkung der Gasteilchen untereinander vernachlässigt. 91 Reale Gase werden daher besser durch die van der Waals-Gleichung beschrieben, die die thermische Zustandsgleichung des idealen Gases verallgemeinert. T (p, V, N ) = 1 k aN 2 V p+ 2 −b V N Dabei sind a ≥ 0 und b ≥ 0 materialabhängige Konstanten, die das endliche Volumen (b) und die gegenseitige Wechselwirkung der Gasteilchen (a) parametrisieren. In der Literatur findet man verschiedene äquivalente Schreibweisen der van der Waals-Gleichung. Wichtig für das Verständnis ist die physikalische Bedeutung der Korrekturterme. Die das passende erweiterte kalorische Zustandsgleichung ist E(T, V, N ) = f aN 2 N kT − . 2 V Wie wir später sehen werden, ist die van der Waals-Gleichung auch nur eine Nährung an die reale Situation, die in manchen Fällen nicht zutrifft. Daher nennen wir das durch diese Gleichung beschriebene System van der Waals-Gas. Analog zur klassischen Mechanik und Elektrodynamik sind thermodynamische Potentiale Zustandsgrößen aus denen sich Zustandsgleichungen für andere Zustandsgrößen als partielle Ableitungen ergeben. Wir haben bereits zwei thermodynamische Potentiale kennengelernt. Zum einen die innere Energie E . Aus der Gibbs’schen Fundamentalform dE = T dS − pdV + µdN folgen die Zustandsgleichungen T (S, V, N ) = ∂E ∂S p(S, V, N ) = − , V,N ∂E ∂V , µ(S, V, N ) = S,N ∂E ∂N . S,V ~ = (S, V, N ) angesehen, da diese Dabei wird E als Funktion der extensiven Zustandsvariablen Z Variablen im totalen Differential als Differentiale auftauchen. Daher nennt man (S, V, N ) die natürlichen Variablen von E . Offensichtlich bekommt man aus E Zustandsgleichungen die Größen ebenfalls als Funktionen dieser natürlichen Variablen ausdrücken. Ein weiteres thermodynamisches Potential ist die Entropie S selbst mit natürlichen Variablen (E, V, N ). Es gilt p µ 1 dE + dV − dN T T T dS = und damit T (E, V, N ) = ∂S ∂E −1 , p(E, V, N ) = T (E, V, N ) V,N µ(E, V, N ) = −T (E, V, N ) ∂S ∂N ∂S ∂V , E,N . E,V Offensichtlich kann man für eine Zustandsgrösse verschiedene Zustandsgleichungen erhalten, je nach Wahl der Zustandsvariablen. Abhängig von der betrachteten physikalischer Situation 92 kann man einige Zustandsvariablen gut kontrollieren und andere nicht. Darum ist es hilfreich, wenn man beliebige Paare der Größen (p, V, T, S) bzw. beliebige Tripel der Größen (p, V, T, S, µ, N ) als Zustandsvariablen verwenden kann. Eine mathematische Vorschrift um ausgehend von der inneren Energie E(S, V, N ) eine extensive Variable (S, V, N ) durch eine intensive Variable (T, p, µ) zu ersetzen, die (bis auf ein Vorzeichen bei p) gerade die partielle Ableitung von E nach der extensiven Variable ist, ist die Legendre-Transformation. Als Beispiel betrachten wir eine differenzierbare und konvexe Funktion f (x, y). Wir setzen ∂f (x, y) u(x, y) = = ∂x ∂f ∂x . y Wenn f (x, y) konvex ist, dann lässt sich die obige Gleichung nach x eindeutig auflösen und man bekommt x(u, y) als Funktion von u und y . Als Gegenbeispiel betrachten wir f (x, y) = sin(x)y . Diese Funktion ist nicht konvex und tatsächlich kann man ∂f (x, y) u(x, y) = = ∂x ∂f ∂x = − cos(x)y y nicht eindeutig nach x auflösen. Für ein konvexes f definieren wir die Legendre-Transformierte von f bezüglich x als g(u, y) = ux(u, y) − f (x(u, y), y) . Es gilt, dass g(u, y) wieder eine konvexe Funktion ist und dass f die Legendre-Transformierte von g bezüglich u ist. Um zu “kontrollieren”, dass g(u, y) wirklich nicht mehr (explizit) von x abhängt berechnen wir ∂f ∂f ∂f dx + dy = udx + dy df = ∂x y ∂y x ∂y x ∂f ∂f dy = xdu + dy . dg = d(ux − f ) = xdu + udx − df = xdu + udx − udx + ∂y x ∂y x Es gilt also ∂g ∂x =0 u,y und g hängt damit nur via u und y von x ab, x ist also keine natürliche Variable für g . Als Beispiel betrachten wir die Enthalpie H = E + pV . Diese ist die negative Legendretransformierte von E bezüglich V . Folglich gilt dH = dE + pdV + V dp = T dS + V dp + µdN = δQ + V dp + µdN und H ist eine Funktion der natürlichen Variablen (S, p, N ). Da −H konvex ist ist H konkav. Die Enthalpie ist eine wichtige Größe in der Chemie. Bei chemischen Reaktionen gilt häufig dp = 0 (isobarer Prozess) und dN = 0 und damit dH = δQ. Daher entscheidet das Vorzeichen von dH ob es sich bei einer Reaktion (also einem Prozess) um eine endotherme oder eine exotherme Reaktion handelt, d.h. ob Wärme aufgenommen oder abgegeben wird. 93 Eine wichtige Größe in der Thermodynamik sind Wärmekapazitäten. Anschaulich geben diese den infinitesimalen Wärmeübertrag bei Änderung der Temperatur und Festhalten der übrigen Variablen an. Da die Wärme selbst keine Zustandsgröße ist, muss man ein entsprechendes thermodynamisches Potential wählen, dass bei Festhalten der übrigen Variablen gerade δQ entspricht. Beispiel: die isobare (p konstant) und isochore (V konstant) Wärmekapazität ist definiert als CV = ∂E ∂T , Cp = V,N ∂H ∂T . p,N Analog zur Enthalpie lassen sich durch alle möglichen Legendre-Transformationen folgende thermodynamischen Potentiale konstruieren. Thermodyn. Potantial Definition innere Energie Totales Differential Natürliche Variablen dE = T dS − pdV + µdN S, V, N dS = Entropie 1 T dE + p T dV − µ T dN E, V, N freie Energie F = E − TS dF = −SdT − pdV + µdN T, V, N Enthalpie H = E + pV dH = T dS + V dp + µdN S, p, N freie Enthalpie / Gibbs-Energie G = F + pV dG = −SdT + V dp + µdN T, p, N großkan. Potential Ω = F − µN dΩ = −SdT − pdV − N dµ T, V, µ Diese sind entweder konvex (E , G, Ω) oder konkav (S , F , H ) und sind analog zur inneren Energie wegen der Maximalität der Entropie minimal bei Prozessen bei denen die natürlichen Variablen festgehalten werden. Daher sind die freie Energie und das großkanonische Potential von besonderer Bedeutung für die statistische Mechanik, da sie minimal werden bei Prozessen bei denen bei konstantem V und T Energie (F ) oder Energie und Teilchen (Ω) ausgetauscht werden. 2.2 Phasengleichgewichte und Phasenübergänge Wir betrachten ein System dessen Gleichgewichtszustände generisch durch die intensiven Variablen (p, µ, T ) eindeutig festgelegt sind. In diesem Zusammenhang bedeutet “generisch” dass (nur) in Ausnahmen für bestimmte Werte dieser Variablen kein eindeutiger Zustand existiert. Gibt es in einem solchen Fall ϕ > 1 mögliche Zustände, spricht man von ϕ koexistierenden Phasen und man muss an diesen Punkten im Zustandsraum eine weitere, allerdings diskrete, Variable α ∈ {1, . . . , ϕ} einführen um mit (p, µ, T, α) einen Zustand eindeutig zu charakterisieren. Beispiel: Wasser hat bei Normaldruck einen Siedepunkt von T = 373K. Für (unter anderem) diese Werte von p und T koexistieren also die flüssige und die gasförmige Phase von Wasser. Wir betrachten ein System im Gleichgewicht, das in ϕ Phasen vorliegt. Wir denken uns das ~ = (E, V, N ) System in ϕ Teilsysteme zerlegt, die den homogenen Phasen entsprechen. Sind Z 94 die extensiven Zustandsgrößen des Gesamtsystems gilt ~= Z ϕ X ~α . Z α=1 ~ nach Phasen ist eindeutig. Wäre sie das nicht, dann könnte man die Dieser Zerlegung von Z unterschiedlichen Phasen nicht eindeutig anhand von Zustandsgrößen unterscheiden bzw. iden~ α linear unabtifizieren. Mathematisch bedeutet die eindeutige Zerlegung, dass die Vektoren Z hängig sind. Da das Gesamtsystem nach Annahme im Gleichgewicht ist, sind die intensiven Variablen (p, µ, T ) in allen Phasen identisch. ~ α einer jeden Phase individuell skalieren, d.h. jede Wir können nun die extensiven Variablen Z Phase vergrößern oder verkleinern, ohne das Gleichgewicht zu stören. In Formeln bedeutet das, ~ 0 von der Form dass alle Z ~0 = Z ϕ X ~α . λα Z α=1 für beliebige λα > 0 einen Gleichgewichtszustand mit den gleichen intensiven Größen (p, µ, T ) und der gleichen Anzahl ϕ von koexistierenden Phasen charakterisieren. Bei vorgegebenen Werten für (p, µ, T ) und ϕ bilden die dazugehörigen Gleichgewichtszustände also einen Kegel im ~ α ist dieser Kegel dreidimensionalen Zustandsraum. Wegen der linearen Unabhängigkeit der Z ϕ-dimensional. Daraus folgt sofort, dass in der betrachteten Situation nie mehr als drei Phasen koexistieren können. Da alle Phasen nach Annahme miteinander im Gleichgewicht sind, gilt für die Entropie ~ 0) = S(Z ϕ X ~α) . λα S(Z α=1 Im Koexistenzkegel der Phasen im Zustandsraum ist die Entropie also nicht strikt konkav sondern linear. Man kann sich nun fragen, wieviel Spielraum es für (p, µ, T ) bei vorgegebem ϕ gibt. Konkret fragt man nach der möglichen Freiheit den ϕ-dimensional Kegel von Zuständen mit ϕ koexistierenden Phasen im dreidimensionalen Zustandsraum zu verschieben. Diese ist gerade durch die Anzahl 3−ϕ von zu dem Kegel transversalen Richtungen gegeben (Gibbs’sche Phasenregel). Bei drei koexitierenden Phasen gibt es also einen ausgezeichneten Punkt (p0 , µ0 , T0 ) an dem Koexistenz herrscht. Weicht man von diesem Punkt ein wenig ab, können nur noch maximal zwei Phasen koexistieren; ein Beispiel ist der Tripelpunkt von Wasser. Bei zwei koexistierenden Phasen gibt es eine mögliche transversale Richtung. Es gibt also z.B. Funktionen p(T ) und µ(T ) so dass für ein gewisses Temperaturintervall für alle Werte (p(T ), µ(T ), T ) zwei Phasen koexistieren. In einem p-T -Diagramm wäre das eine Kurve; ein Beispiel ist die Dampfdruckkurve von Wasser. Beim 95 generischen Fall ϕ = 1 gibt es z.B. eine Funktion µ(p, T ) die µ einschränkt, aber keine Einschränkungen an (p, T ) (außer natürlich die Einschränkung, dass man von den Koexistenzkurven oder -punkten fernbleibt). Diese Überlegungen lassen sich verallgemeinern auf ein Stoffgemisch von k verschiedenen Stoffen mit Teilchenzahlen N1 , . . . , Nk . Dann gibt es 2 + k − ϕ freie Richtungen im Zustandsraum und es können maximal 2 + k Phasen koexistieren. 2.2.1 Phasenübergang flüssig/gasförmig beim van der Waals-Gas Als Beispiel für Phasenkoexistenz bzw. einen Phasenübergang betrachten wir das van der WaalsGas. Wir definieren die extensiven Größen pro Teilchen E , N S V , v= . N N Für die Diskussion spielen nur diese eine Rolle. N selbst ist nicht relevant, da für N 1 die e= s= genaue Größe des Systems für die Vorgänge unerheblich ist. Die Isothermen des van der Waals-Gases für T /Tkr = 0.8, 0.9, 1, 1.1, 1.2 In den neuen Größen lauten die thermische und kalorischen Zustandsgleichungen T (v, p) = a 1 p + 2 (v − b) , k v 96 e(v, T ) = f a kT − . 2 v Wir interessieren uns für die Isothermen des van der Waals-Gases, das sind die Kurven im p-T -Diagramm die einer konstanten Temperatur entsprechen. Aus der kalorischen Zustandsgleichung erhalten wir p(v, T ) = kT a − 2. v−b v Die Isothermen sind daher von der unten abgebildeten Gestalt, wobei T auf jeweils höherliegenden Isothermen größer ist. Es seien p, T vorgegeben. Wir können Folgendes beobachten. Für genügend große T gibt es zu (p, T ) genau ein v(p, T ), die Funktion p(v, T ) ist monoton fallend in v . Für genügend kleine T hat p(v, T ) ein Minimum und ein Maximum bezüglich v , es gibt also zu (p, T ) mit geeignetem p ≥ 0 genau drei mögliche v(p, T ). Es gibt eine kritische Temperatur Tkr die gerade einen Wechsel zwischen den beiden Situationen markiert. Für T = Tkr fallen das Minimum und das Maximum von p(v, T ) bezüglich v zu einem Sattelpunkt zusammen. Das ist gerade bei der mittleren abgebildeten Isotherme der Fall. Für p < 0 gibt es nur zwei mögliche v(p, T ), allerdings ist p < 0 in diesem Zusammenhang unphysikalisch. Die Tatsache, dass die van der Waals-Gleichung p < 0 ermöglicht ist bereits ein erstes Indiz dafür, dass sie nicht vollständig korrekt sein kann. Die kritischen Werte für Tkr , pkr und vkr lassen sich explizit berechnen aus den Bedingungen für einen Sattelpunkt: 2 ∂p ∂ p = 0, ∂v Man findet vkr = 3b , =0 ∂v 2 T kTkr = T 8a , 27b pkr = a . 27b2 Wir wollen nun die Isothermen für T < Tkr analysieren. Dazu betrachten wir die isotherme Kompressibilität κT . Für diese muss gelten 1 κT = − V ∂V ∂p T,N 1 =− v ∂v ∂p ≥0 ⇔ T ∂p ∂v = T ∂v ∂p −1 ≤ 0. T Ein System mit κT < 0 ist mechanisch instabil da in diesem Fall eine Volumenverkleinerung zu einem kleineren Druck führt anstatt zu einem größeren, es gibt also zur Kompression keine rücktreibende Kraft. Daher kann man den Abschnitt der Isotherme in der p anwächst als unphysikalisch ausschließen. Tatsächlich muss man einen größeren Bereich der Kurve als unphysikalisch ausschließen, da dieser nicht mit den Eigenschaften von Gleichgewichtszuständen, d.h. den Hauptsätzen der Thermodynamik verträglich ist. Ein weiteres Argument dafür ergänzend zum obigen Kompressibilitätsargument ist die Betrachtung der Entropie pro Teilchen. Analog zum idealen Gas, kann man aus der thermischen und kalorischen Zustandsgleichung des van der Waals-Gases folgende Entropiefunktion herleiten. fk s(v, e) = log 2 e + av e0 + k log 97 v−b v0 + s0 (v0 , e0 ) Wie man in der folgenden Abbildung sieht ist dieser Funktion für genügend kleine e keine konkave Funktion von v . Das ist äquivalent dazu, dass S(E, V, N ) = N s(E/N, V /N ) keine konkave Funktion von V ist. Die Entropie pro Teilchen s(e, v) für e = e(vkr , Tkr ) in Abhängigkeit von v . Zur Verdeutlichung wird für v eine logarithmische Achse verwendet. Zusammenfassend kann man sagen, dass die van der Waals-Gleichung die van der Waals 1873 in seiner Doktorarbeit eingeführt hat, für manche Werte der Zustandsgrößen nicht mit den Gesetzen der Thermodynamik verträglich ist. Trotzdem hat van der Waals 1910 den Nobelpreis dafür bekommen, da man auf Grundlage seiner Gleichung den Phasenübergang flüssig/gasförmig und die Existenz und das Verhalten bei der kritischen Temperatur qualitativ verstanden hat. Dazu kann die van der Waals-Gleichung in den fehlerhaften Bereichen modifiziert werden um den Hauptsätzen der Thermodynamik zu genügen. Eine “minimale” Modifikation ist die von Maxwell 1875 vorgeschlagene Maxwell-Konstruktion. Die Isotherme für T = 0.9Tkr mit den Größen aus der Maxwell-Konstruktion Zur Diskussion der Maxwell-Konstruktion betrachten wir die Isotherme für T = 0.9Tkr . Für sehr große v spielt die durch die Konstante a parametrisierte attraktive Wechselwirkung der Gasteilchen keine Rolle und die van der Waals-Gleichung geht über in die (thermische) Zustandsgleichung des idealen Gases. Wir können für große v also den Zustand des van der Waals-Gases als 98 gasförmig bezeichnen bzw. annehmen, dass dieser Bereich der Isotherme die gasförmige Phase des van der Waals-Gases beschreibt. Für sehr kleine v gilt hingegen v & b da b nach Konstruktion das minimale Volumen pro Teilchen ist für das der Druck ins Unendliche geht. In diesem Bereich der Isotherme sind die Gasteilchen also sehr nahe beieinander und wir können diesen Bereich daher als die flüssige Phase des van der Waals-Gases interpretieren. Der Bereich mittlerer v der zumindest teilweise unphysikalisch ist, muss also dem Phasenübergang von flüssig nach gasförmig entsprechen. Empirisch beobachtet man, dass bei diesem Phasenübergang der Druck konstant bleibt während v variiert. Das motiviert folgende Konstruktion. Wir betrachten einen Druck pd für die Gerade p = pd =konst. die Isotherme dreimal schneidet. Wie bereits diskutiert ist der mittlere Schnittpunkt auf jeden Fall unphysikalisch, da dort die isotherme Kompressibilität negativ ist. Wir bezeichnen das v des linken/rechten Schnittpunktes mit va /vb und interpretieren va als Volumen pro Teilchen der flüssigen Phase und vb als Volumen pro Teilchen der gasförmigen Phase beim Phasenübergang, also bei der Phasenkoexistenz flüssig/gasförmig. Im Falle einer Phasenkoexistenz muss gelten, dass die intensiven Größen (p, T, µ) in beiden Phasen gleich sind. Im Allgemeinen gilt für ein pd mit drei Schnittpunkten dass µ(pd , va , T ) 6= µ(pd , vb , T ). Man kann nun zeigen, dass es genau ein pd gibt so dass µ(pd , va , T ) = µ(pd , vb , T ). Dieser Verdampfungsdruck lässt sich grafisch finden, indem man verlangt, dass die zwei von der Isotherme und der Schnittgerade eingeschlossenen Flächen links und rechts des mittleren Schnittpunktes genau gleich groß sind. Man ersetzt nun die van der Waals-Isotherme zwischen va und vb durch die Konstante Funktion p = pd und bekommt entsprechend eine korrigierte van der Waals-Gleichung. Es lässt sich zeigen, dass die dazugehörige Entropiefunktion konkav ist.17 Die korrigierte van der Waals-Isotherme lässt sich folgendermaßen interpretieren. Wenn man von der gasförmigen Phase kommend v verringert erhöht sich der Druck immer weiter bis man pd erreicht. Für p infinitesimal kleiner als pd liegt das van der Waals-Gas vollständig in seiner gasförmigen Phase vor. Für p = pd gibt es ein Phasengleichgewicht, d.h. die gasförmige und flüssige Phase koexistieren. Beispielsweise liegt für p = pd und v = 0.6va + 0.4vb das van der Waals-Gas zu 60% in der flüssigen und zu 40% in der gasförmigen Phase vor. Verringert man v weiter, dann liegt für p größer als pd das van der Waals-Gas vollständig in seiner flüssigen Phase vor. Die korrigierte van der Waals-Gleichung ist offenbar bei va und vb stetig aber nicht stetig differenzierbar, d.h. (∂p/∂v)T und damit die Kompressibilität springt an diesen Stellen. Dieses Verhalten ist typisch für Phasenübergange. Was passiert bei der kritischen Temperatur T = Tkr ? Nähert man sich dieser von unten dann rücken va und vb immer näher zusammen und die füssige und gasförmige Phase werden sich “immer ähnlicher”. Bei T = Tkr gilt gerade va = vb = vkr und man kann nicht mehr von einer flüssigen oder gasförmigen Phase sprechen, es existiert nur noch eine einzige Phase die überkritisch genannt wird. Bei Wasser (H2 O) liegt dieser kritische Punkt bei Tkr = 647K und pkr = 22.064MPa. Überkritisches Wasser hat in der Industrie zahlreiche Anwendungen18 . Die durch die Maxwell-Konstruktion korrigierte van der Waals-Gleichung gibt das Verhalten 17 Tatsächlich lässt sich die Maxwell-Konstruktion auch so formulieren, dass man die van der Waals-Entropiefunktion durch ihre “konkave Einhüllende” ersetzt, also durch die kleinste Funktion die konkav ist und überall größergleich der ursprünglichen Funktion. In diesem Sinne ist die Maxwell-Konstruktion minimal. 18 siehe https://de.wikipedia.org/wiki/%C3%9Cberkritisches_Wasser 99 von Stoffen an der Phasengrenze flüssig/gasförmig inklusive der Existenz eines kritischen Punktes erstaunlich gut wieder. Man kann z.B. die dimensionslose Größe α= pkr vkr kTkr betrachten. Beim van der Waals-Gas gilt α = 3/8 = 0.375. Bei Wasser (H2 0) gilt α = 0.23, bei molekularem Wasserstoff (H2 ) α = 0.304. Allerdings kann die van der Waals-Gleichung das Verhalten bei niedrigen Temperaturen, also insbesondere den Phasenübergang fest/flüssig, nicht richtig wiedergeben. p-T -Phasendiagramme von van der Waals- und realem Gas im Vergleich v -T -Phasendiagramm des gasförmig/flüssig Übergangs Es ist aufschlussreich sich den gasförmig/flüssig Übergang des van der Waals-Gases bzw. eines realen Gases auch im v -T Diagramm anzuschauen, in das man va und vb als Funktion von T einträgt. Die darin sichtbare “parabelförmige” Phasengrenze ist ebenfalls typisch für Phasenübergänge und wird uns bei der Diskussion des Ferromagnetismus wieder begegnen. Das 100 Volumen pro Teilchen spielt dabei die Rolle des sogenannten Ordnungsparameters anhand dessen man die verschiedenen Phasen im Falle einer Phasenkoexistenz unterscheiden kann. Für T = Tkr stimmen die Ordnungsparameter der Phasen überein und der Unterschied zwischen den beiden Phasen verschwindet. Der von der Parabel eingeschlossene Bereich ist verboten im Sinne, dass zu diesen Zustandsgrößen keine homogene Phase existiert. 2.3 Ensembles in der statistischen Mechanik 2.3.1 Wiederholung: Der Zustandsbegriff in der statistischen Mechanik Wir betrachten das abgeschlossenes System eines Gasvolumens. Die innere Energie E ist erhalten und kann im Prinzip beliebig genau bestimmt werden. Diese setzt sich natürlich zusammen aus den Energien der einzelnen Gasteilchen. Da aber typischerweise N & 1023 gilt ist es erstens schwer vorstellbar, dass es praktisch möglich ist, die Eigenschaften jedes einzelnen Teilchens exakt zu bestimmen um daraus die makroskopischen Eigenschaften des Gasvolumens abzuleiten. Zweitens zeigt die Erfahrung, dass das für eine zufriedenstellende makroskopische Beschreibung gar nicht nötig ist. Man findet dass eine statistische mikroskopische Beschreibung vollkommen ausreichend ist, d.h. man macht keine Aussage über präzise Eigenschaften einzelner Teilchen sondern nur über geeignete Mittelwerte. Das ist dadurch gerechtfertigt, dass für sehr große Systeme mit N & 1023 die Schwankungen dieser Mittelwerte vernachlässigbar sind. Als Beispiel betrachten wir den Druck des obigen Gasvolumens. Dieser setzt sich mikroskopisch zusammen aus der Kraft die einzelne Gasteilchen auf z.B. eine der Wände des Gasbehälters ausüben. Als Funktion der Zeit ist diese Kraft natürlich nicht konstant sondern schwankt im Allgemeinen sehr stark. Bei der Messung des Drucks messen wir aber nicht diese Funktion, sondern ihren Mittelwert über ein Zeitintervall ∆t das groß gegen mikroskopische Zeitenskalen aber klein gegen makroskopische Zeitskalen ist. Für die empirische Beschreibung des makroskopischen Zustands des Systems betrachten wir also eine Mittelung über eine große Menge mikroskopischer Zustände, in diesem Fall der Zustände die das System im für die Messung relevanten Zeitintervall annimmt. In unserem Beispiel wissen wir dass alle diese Zustände die Gesamtenergie E besitzen. Folgende Hypothese – die sogenannte Ergoden-Hypothese – hat sich als gute Motivation für die Entwicklung der statistischen Mechanik herausgestellt, auch wenn sie im Allgemeinen nicht oder nicht exakt erfüllt ist: Im Limes eines unendlich großen Zeitintervalls nimmt das System innerhalb dieses Intervalls alle mikroskopischen Zustände zur Gesamtenergie E an. Die zeitliche Mittelung über die mikroskopischen Zustände des Systems entspricht also der Mittelung über die Menge aller mikroskopischen Zustände des Systems mit Gesamtenergie E . Die Menge dieser Zustände nennt man Ensemble oder Gesamtheit. Ein Ensemble stellt man sich vor als verschiedene Kopien des gleichen Systems, jeweils eine Kopie für/in jeden/m möglichen mikroskopischen Zustand zur Gesamtenergie E . Die Ergoden-Hypothese besagt also: Für jede Zustandsgröße Z eines makroskopischen Systems im Gleichgewicht gilt für genü101 gend (im Idealfall unendlich) große Zeitintervalle: Z (Zeitmittel) = hZi (Ensemble-Mittel). Etwas allgemeiner ist es auch sinnvoll Situationen zu betrachten in denen die Energie E nicht genau bestimmt ist sondern nur N und V oder sogar nur V . Ein Ensemble entspricht dann allen mikroskopischen Zuständen des Systems die für die vorgegebenen Größen N und V oder V möglich sind, bzw. entsprechend vielen identischen Kopien des Systems, eine in jedem dieser Zustände. Ein Ensemble repräsentiert folglich den makroskopischen Zustand des makroskopischen Systems und die Ensemble-Mittelwerte werden mit den makroskopischen Zustandsgrößen in der phänomenologischen Thermodynamik identifiziert. Dieses Postulat ist lose verwandt mit dem Wahrscheinlichkeitspostulat der Quantenmechanik, wobei wir es hier in der statistischen Mechanik mit einer klassischen statistischen Unsicherheit über den genauen Zustand des mikroskopischen Systems zu tun haben, während wir es in der Quantenmechanik im Falle von reinen Zuständen mit einer quantenmechanischen statistischen Unsicherheit zu tun haben. Wie wir bei der Diskussion von gemischten Zuständen in der Quantenmechanik gesehen haben, stellen gemischte quantenmechanische Zustände gerade eine Situation dar, in denen die klassische und quantenmechanische Unsicherheit kombiniert auftreten. In der quantenstatistischen Beschreibung der Thermodynamik werden Ensembles daher durch gemischte quantenmechanische Zustände ψ , also durch Dichtematritzen ρψ (auch: statistische Operatoren) repräsentiert. Im Folgenden diskutieren wir nur Quantenstatistik, da die klassische statistische Mechanik im Prinzip aus der ersten Vorlesung zu dem Thema bekannt ist. Beim Ensemble-Mittel geht jeder mögliche mikroskopische Zustand zur Gesamtenergie E mit einem bestimmten statistischen Gewicht ein. Diese Gewicht entspricht der Wahrscheinlichkeit, ein System im durch das Ensemble beschriebenen makroskopischen Zustand bei einer hypothetischen Messung aller mikroskopischen Größen im jeweiligen mikroskopischen Zustand vorzufinden. Zur Festlegung dieser Wahrscheinlichkeiten wird folgendes zweite Postulat herangezogen. Im Gleichgewicht ist jeder mikroskopische Zustand zur festen Gesamtenergie E gleich wahrscheinlich. Dieses Postulat lässt sich im Gegensatz zur Ergoden-Hypothese einfacher mikroskopisch motivieren. Ein Gleichgewichtszustand ist per Definition statisch, ändert sich also nicht mit der Zeit. In der Quantenstatistik verschwindet entsprechend der Kommutator der Dichtematrix ρψ mit dem Hamiltonoperator H . [ρψ , H] = 0 Wie in Abschnitt 1.5.4 diskutiert, folgt daraus unter der Annahme, dass die Eigenwerte von H nicht entartet sind dass ρψ eine Funktion fψ (H) des Hamiltonoperators ist. Sind die Eigenwerte von H entartet (die Situation, in der das obige Postulat überhaupt nicht-trivial ist), dann folgt ρψ = fψ (H) nicht notwendigerweise, es ist aber sinnvoll diese Eigenschaft zu postulieren, nicht zuletzt in Hinblick auf die Empirie der phänomenologischen Thermodynamik, die besagt, dass 102 sich Gleichgewichtsysteme durch sehr wenige Größen beschreiben lassen19 . Zerlegt man ρψ = fψ (H) in (reine) Eigenzustände |n, ii zu H mit H|n, ii = En |n, ii wobei i die Zustände zu festem En durchnummeriert, gilt also ρψ = fψ (H) = X fψ (En )|n, iihn, i| n,i und die statistischen Gewichte fψ (En ) der einzelnen Zustände hängen nur von En d.h. n ab und nicht von i. 2.3.2 Das mikrokanonische Ensemble, Boltzmann- und von Neumann-Entropie Das einfachste und fundamentalste Ensemble ist das mikrokanonische Ensemble, das einem abgeschlossenes System im Gleichgewicht zu scharfer innerer Energie E entspricht. Die extensiven Größen E , V , N sind also extern fest vorgegeben bzw. bekannt. Aus den allgemeinen Überlegungen im vorigen Abschnitt folgt, dass die Dichtematrix des mikrokanonischen Ensembles von der Form P ρψ = |ni ONB von HE,V,N |nihn| W (E, V, N ) ist. Die darin auftretenden Größen und Objekte sind • HE,V,N = Hilbertraum der Zustände des Systems zu festem E , V , N , insbesondere also H|ni = E|ni für alle |ni ∈ HE,V,N • die mikrokanonische Zustandssumme W (E, V, N ) = dim HE,V,N , d.h. die Anzahl der linear unabhängigen reinen Zustände zu vorgegebenem E , V , N Beispiel: Wir betrachten ein System von zwei Spin 1/2 Teilchen mit Ladung q > 0 und Masse m > 0 unter Vernachlässigung der räumlichen Dynamik. Wir nehmen an, dass die Teilchen an unterschiedlichen klar definierten Orten “sitzen”, so dass sie unterscheidbar sind. Der Hilbertraum ist also H = C4 mit ONB |↑↑i, |↑↓i, |↓↑i, |↓↓i. Es gilt N = 2 und in dieser vereinfachten Situation ist es natürlich nicht sinnvoll und hilfreich, von einem Volumen V zu sprechen. Der ~ = (0, 0, B), B > 0 sei Hamiltonoperator des Systems in einem homogenen Magnetfeld B H=− 2νB (1) qB (1) (Sz + Sz(2) ) = − (Sz + Sz(2) ) , m ~ ν= ~q > 0. 2m Die möglichen Eigenwerte und Eigenzustände dieses Operators sind |↑↑i mit Eigenwert E = −2νB , 19 Eine sehr konkrete Motivation für das Postulat ρψ = fψ (H) ist die Tatsache, dass diese Beziehung die Stabilität des Zustandes ψ unter kleinen Störungen impliziert. Diese Stabilität ist eine Eigenschaft, die empirisch bei Systemen im Gleichgewicht beobachtet wird. Für Details sei auf Kapitel II.2 des Skripts von Klaus Fredenhagen verwiesen. 103 |↓↑i, |↑↓i |↓↓i E = 0, mit Eigenwert E = 2νB . mit Eigenwert Die mikrokanonischen Ensembles sind also ρE=−2νB = |↑↑ih↑↑| , |↑↓ih↑↓| + |↓↑ih↓↑| , 2 ρE=2νB = |↓↓ih↓↓| , ρE=0 = wobei das erste hier dem Grundzustand des Systems entspricht. Das zum mikrokanonischen Ensemble zugehörige thermodynamische Potential ist die BoltzmannEntropie SB = k log W . Es lässt sich zeigen dass diese Größe die charakteristischen Eigenschaften Maximalität und Extensivität hat. Die intensiven Zustandsgrößen p,µ, T lassen sich wie in der phänomenologischen Thermodynamik diskutiert durch partielle Ableitungen aus der Entropie gewinnen. Beim obigen Beispiel mit diskreten Energieniveaus ist eine partielle Ableitung von z.B. S nach E zur Bestimmung der (inversen) Temperatur offenbar nicht wohldefiniert. In der Thermodynamik interessieren wir uns allerdings nur für makroskopische Systeme in denen die Energieniveaus “fast” kontinuierlich (sehr großes Volumen) oder kontinuierlich (unendlich großes Volumen) sind. An dieser Stelle können wir den dritten Hauptsatz der Thermodynamik “beweisen”. Wie wir bereits diskutiert haben ist die Temperatur eine monotone Funktion der inneren Energie. Am Temperaturnullpunkt ist also auch die Energie minimal. Ist der Grundzustand des betrachteten Systems nicht entartet, dann gilt für den Grundzustand W = 1 und damit S = 0. Eine weitere und allgemeinere Definition der Entropie ist die von Neumann-Entropie (oder auch Informationsentropie, Shannon-Entropie) S = −k Sp(ρψ log ρψ ) = −khlog ρψ iψ . Für das mikrokanonische Ensemble gilt (weil |ni Eigenzustände von H und daher auch von ρψ ) log ρψ = X |nihn| log 1 W 1 W |ni ONB von HE,V,N und damit S = −k Sp(ρψ log ρψ ) = −k X |ni ONB von HE,V,N 1 log W =k W log W = SB . W Wir sehen also dass die von Neumann-Entropie beim mikrokanonischen Ensemble der BoltzmannEntropie entspricht. Die von Neumann-Entropie kann für allgemeine gemischte Zustände definiert werden. Wie wir gesehen haben ist sie für reine Zustände immer Null und allgemein ≥ 0. Sie kann also als ein Maß für den “Mischungsgrad” des Zustandes angesehen werden. 104 2.3.3 Das kanonische Ensemble Das kanonische Ensemble beschreibt ein System mit festem V , N aber nicht scharf festgelegtem E , z.B. ein System das im thermischen Kontakt mit einem zweiten ist. Wir betrachten so eine Situation. Das Gesamtsystem bestehend aus den zwei Teilsystemen soll eine scharfe Energie E haben und kann daher durch ein mikrokanonisches Ensemble beschrieben werden. Die Dichtematrix des kanonischen Ensembles für das z.B. erste System kann nun aus diesem Ensemble und der Bedingung des Gleichgewichts hergeleitet werden. Eine übersichtlichere Herleitung ist Folgende. Es seien H1 , H2 die Hamiltonoperatoren der beiden Systeme mit (möglicherweise entarteten) Eigenzuständen |n1 i, |n2 i. Wie bereits diskutiert postulieren oder folgern wir für die Dichtematrix beider invidueller Systeme im Gleichgewicht ρ1 = f1 (H1 ) und ρ2 = f2 (H2 ), d.h. ρ1 = f1 (H1 ) = X f1 (En1 )|n1 ihn1 | , ρ2 = f2 (H2 ) = X f1 (En2 )|n2 ihn2 | . |n2 i |n1 i Der Hamiltonoperator des Gesamtsystems ist H1&2 = H1 + H2 mit Eigenzuständen |n1 , n2 i = |n1 i ⊗ |n2 i. Für die Dichtematrix des Gesamtsystems (eines mikrokanonischen Ensembles) gilt ebenfalls X f (En1 + En2 )|n1 , n2 ihn1 , n2 |. ρ1&2 = f1&2 (H1&2 ) = |n1 ,n2 i Da die zwei Teilsysteme im gegenseitigen Gleichgewicht als unabhängig angesehen werden können muss gelten ρ1&2 = ρ1 ⊗ ρ2 und damit f1&2 (En1 + En2 ) = f1 (En1 )f2 (En2 ) für beliebige n1 , n2 . Wir differenzieren nun diese Gleichung nach En1 und En2 . Da beide Ableitungen bei f1&2 (En1 + En2 ) der Ableitung nach E = En1 + En2 entsprechen, muss gelten f10 (En1 )f2 (En2 ) = f1 (En1 )f20 (En2 ) ⇔ f0 f10 = 2, f1 f2 wobei beide Seiten der zweiten Gleichung konstant sein müssen, da sie von unterschiedlichen Variablen En1 und En2 abhängen. Wenn wir diese Konstante mit −β bezeichnen, erhalten wir für jedes der Systeme die Dichtematrix des kanonischen Ensembles ρ = f (H) = e−βH , Z Z = Sp(e−βH ) . Der Normierungsfaktor Z ist dabei die kanonische Zustandssumme. Bislang haben wir Dichtematritzen mit ρψ angegeben um zu verdeutlichen, dass sie einen bestimmten gemischten quantenmechanischen Zustand ψ repräsentieren. Im Folgenden werden 105 wir den Index ψ weglassen, da wir immer nur jeweils ein Ensemble und damit einen konkreten Zustand diskutieren werden. Was ist β ? Um das festzulegen betrachten wir die innere Energie und (von Neumann-) Entropie E im kanonischen Ensemble. Es gilt E = hHi = Sp(He−βH ) Z , S = −khlog ρi = k h(βH + log Z)i = kβE + k log Z . Das motiviert folgende Interpretationen der auftretenden Größen. • β = (kT )−1 ist die inverse thermodynamische Temperatur. • F (β, V, N ) = − β1 log Z(β, V, N ) ist die freie Energie. Denn mit ∂ ∂Z = Sp(e−βH ) = −Sp(He−βH ) = −ZE ∂β ∂β ⇔ E=− ∂ log Z ∂β lässt sich leicht verifizieren, dass ∂F ∂F = −kβ 2 = −S ∂T ∂β gilt, also die uns bereits aus der phänomenologischen Thermodynamik bekannte Beziehung. Bei den partiellen Ableitungen nach β oder T wird hier jeweils V und N festgehalten. Als Beispiel für ein kanonisches Ensemble betrachten wir den eindimensionalen harmonischen Oszillator, d.h. es gilt für die Teilchenzahl N = 1 und das Volumen V ist in diesem Fall keine sinnvolle Größe. Es sei |ni die ONB aus Eigenzuständen des entsprechenden Hamiltonoperators mit den bekannten nichtentarteten Energieeigenwerten En = ~ω(n + 12 ). Für die Zustandssumme berechnen wir Z = Sp(e −βH )= ∞ X −βH hn|e n=0 |ni = ∞ X −βEn e =e −~βω/2 n=0 ∞ X e−~βω n n=0 1 1 = , 2 sinh (~βω/2) 1 − e−~βω P∞ n −1 wobei wir die Identität der geometrischen Reihe n=0 α = (1 − α) , gültig für |α| < 1, ver= e−~βω/2 wendet haben. Daraus können wir sofort die innere Energie und Wärmekapazität berechnen. Da V keine Rolle spielt und N konstant ist, ist es nicht nötig diese Variablen explizit bei den partiellen Ableitungen “festzuhalten”. E=− ∂ ~ω log Z = coth(~βω/2) ∂β 2 106 C= ∂E ∂E 1 = −kβ 2 = k(~βω/2)2 2 ∂T ∂β sinh (~βω/2) Wir wollen das Ergebnis nun interpretieren. In der klassischen statistischen Mechanik bekommt man Eklass = kT = β −1 und damit Cklass = k . Trotz der Tatsache, dass wir es mit einem Freiheitsgrad zu tun haben, gilt nicht Eklass = kT /2 da die potentielle Energie des Oszillators auch in E eingeht und die Formel Eklass = f kT /2 für f Freiheitsgrade nur für die kinetische Energie, also freie Teilchen gilt. Für große Temperaturen, d.h. kleine β , bekommen wir wegen sinh(x) ≈ x für kleine x das klassische Resultat. Für kleine Temperaturen, d.h. große β bekommen wir wegen sinh(x) ≈ exp(x)/2 für große x dass C verschwindet, wobei E sich dem konstanten Wert E = ~ω/2 nähert, der gerade der Grundzustandsenergie entspricht. Dieses Verhalten lässt sich derart interpretieren, dass für T → 0 der Freiheitsgrad des Oszillators “einfriert” und sich der Oszillator daher wie ein System ohne dynamische Freiheitsgrade verhält. Dieses Einfrieren von Freiheitsgraden ist charakterischtisch für das thermodynamische Verhalten quantenmechanischer Systeme und entspricht den experimentellen Befunden, die also nochmals klar verdeutlichen, dass die klassische Physik nur eine teilweise gültige approximative Beschreibung der Natur liefert. Beim diskutierten Beispiel des Oszillators wird die Grenze der Gültigkeit der klassischen Beschreibung durch die Energieskala ~ω bzw. die Temperaturskala ~ω/k markiert. Für Kristallgitterschwingungen in z.B. Diamant ist ω ≈ 1THz = 1012 Hz. Daraus ergibt sich für die charakteristischen Skalen ~ω ≈ 10−22 J, ~ω/k ≈ 10K. Wir halten also fest: • Für große Temperaturen / Energien zeigen quantenmechanische (d.h. reale) Systeme klassisches Verhalten und können durch klassische Physik gut beschrieben werden. • Für kleine Temperaturen / Energien liefert die klassische Physik keine gute Beschreibung und quantenmechanische Effekte werden relevant. 2.3.4 Der Fockraum und das großkanonische Ensemble Im Gegensatz zum kanonischen Ensemble beschreibt das großkanonische Ensemble Systeme bei denen sowohl Energie als auch Teilchenzahl nicht fest vorgegeben sind. Ein Bespiel sind zwei Teilsysteme die thermisch und chemisch gekoppelt sind. Zur Diskussion des großkanonischen Ensemble benötigen wir als Werkzeug zunächst einmal die grundsätzliche quantenmechanische Beschreibung von Systemen mit variabler Teilchenzahl. Es sei H1 der Hilbertraum eines einzelnen Teilchens. Für die Beschreibung zweier identischer, also ununterscheidbarer Teilchen benötigen wir den Hilbertraum H2 = H1 ⊗A/S H1 107 wobei ⊗A das antisymmetrische und ⊗S das symmetrische Tensorprodukt bezeichnet. Wie wir diskutiert haben müssen Zustände identischer Teilchen entweder vollständig symmetrisch (Bosonen) oder vollständig antisymmetrisch (Fermionen) unter Umnummerierung der Teilchen sein. Daher tritt für Bosonen das symmetrische und für Fermionen das antisymmetrische Tensorprodukt auf. Einfache reine Zustände in H2 sind bekanntlich von der Form |ψi = |ψ1 i ⊗ |ψ2 i ± |ψ2 i ⊗ |ψ1 i wobei ψ1 , ψ2 Zustände in H1 sind und für Bosonen/Fermionen das positive/negative Vorzeichen gilt. Allgemeine reine Zustände in H2 sind lineare Superpositionen solcher Zustände. Das lässt sich nun auf N Teilchen mit N beliebig verallgemeinern. Der Hilbertraum ist HN = H1 ⊗A/S · · · ⊗A/S H1 . | {z } N mal Einfache reine Zustände in HN sind von der Form |ψi = X sign(π)α |ψπ(1) i ⊗ · · · ⊗ |ψπ(N ) i Perm. π von {1,. . . ,N} |ψ1 i, . . . , |ψN i ∈ H1 . α = 0, 1 für Bosonen/Fermionen , Man summiert also über alle Permutationen π von {1, . . . , N } und berücksichtigt bei Fermionen das Vorzeichen sign(π)α der Permutation π , das ±1 ist für gerade/ungerade Permutationen. Wie im Fall von zwei Teilchen sind allgemeine reine Zustände in HN Linearkombinationen solcher Zustände. Wir fassen nun die N -Teilchen-Hilberträume für alle N zu einem einzigen Hilbertraum, dem Fockraum HF = ∞ M HN N =0 zusammen. Reine Zustände ψ in HF sind von der Form |ψi = (|ψ0 i, |ψ1 i, |ψ2 i, . . . ) mit |ψN i ∈ HN d.h. (im Prinzip unendlich große) Vektoren deren Komponenten jeweils Vektoren/reine Zustände zu einer festgelegten Teilchenzahl sind. Dabei ist H0 = C der Hilbertraum für 0 Teilchen, der bis auf Normierung nur einen Zustand, das “Vakuum” enthält. Die einfachsten Operatoren auf dem Fockraum sind solche die die Teilchenzahl erhalten. Diese sind von der Form A0 0 0 ... 0 A1 0 . . . A= 0 0 A2 . . . .. . .. . 108 .. . .. . mit Operatoren AN auf HN . Ein Beispiel ist der Teilchenzahloperator 0 0 0 ... 0 N = 0 11 0 0 212 .. . .. . . . . . . . .. . .. . wobei 1N der Einheitsoperator im Hilbertraum HN ist. Ein anderes Beispiel ist (in vielen Systemen) der Hamiltonoperator 0 0 0 ... 0 H1 0 . . . H= 0 0 H2 . . . .. . .. . .. . .. . Dabei gilt für wechselwirkungsfreie Systeme wie das ideale Gas, dass der Hamiltonoperator HN für N Teilchen einfach die Summe aus N “Kopien” von H1 ist. Wir haben die “Vakuumenergie” H0 = 0 gesetzt da sie für unsere Diskussion keine Rolle spielt. Wir können nun das großkanonische Ensemble herleiten. Dazu postulieren wir als Verallgemeinerung der Bedingung ρ = f (H) beim mikrokanonischen und kanonischen Ensemble die Bedingung ρ = f (H, N ), d.h. die Dichtematrix ρ soll eine Funktion von H und N sein. Das ist gleichbedeutend damit, dass die Zustände für gleiche Energie und Teilchenzahl im Ensemble gleich wahrscheinlich sind und die natürliche Verallgemeinerung der entsprechenden Bedingung nur für die Energie. Analog zum kanonischen Ensemble kann man sich nun zwei Systeme vorstellen die thermisch und chemisch gekoppelt sind und für die entsprechenden Dichtematritzen f1&2 (E1 + E2 , N1 + N2 ) = f1 (E1 , N1 )f2 (E2 , N2 ) folgern. Daraus kann man dann verallgemeinernd schließen, dass für das großkanonische Ensemble gelten muss ρ = f (H, N ) = e−β(H−µN ) , ZG ZG = Sp(e−β(H−µN ) ) . mit der großkanonischen Zustandssumme ZG . Wie zuvor ist dabei β = (kT )−1 und die zweite Konstante µ ist das chemische Potential. Das entsprechende thermodynamische Potential zum großkanonischen Ensemble ist das großkanonische Potential Ω(β, V, µ) = − 1 log(ZG (β, V, µ)) β und es lässt sich leicht nachrechnen, dass die Identität ∂Ω ∂T = −S = khlog ρi µ,V 109 gilt. Abschließend sei bemerkt, dass die drei diskutierten Ensembles in manchen Situationen eine gleich gute Beschreibung liefern. Für hohe Energien und Teilchenzahlen sind die relativen Schwankungen dieser Größen, d.h. ∆H/H , ∆N/N , in den jeweiligen Ensembles wo diese Größen variabel sind klein und können daher vernachlässigt werden. 2.4 Bose(-Einstein) und Fermi(-Dirac) Statistik Wie wirken sich die unterschiedlichen Eigenschaften von Bosonen und Fermionen thermodynamisch aus? Dazu diskutieren wir Operatoren die die Teilchenzahl nicht erhalten, die sogenannten Erzeugungs- und Vernichtungsoperatoren. Diese sind mit den Leiteroperatoren in der Diskussion des harmonischen Oszillators oder des Spins verwandt. Es sei ϕ ein reiner Einteilchenzustand und wie zuvor |ψi = X sign(π)α |ψπ(1) i ⊗ · · · ⊗ |ψπ(N ) i Perm. π von {1,. . . ,N} |ψ1 i, . . . , |ψN i ∈ H1 α = 0, 1 für Bosonen/Fermionen , ein reiner N -Teilchenzustand. Wir definieren nun den Vernichtungsoperator aϕ und den Erzeu† gungsoperator aϕ als aϕ |ψi = √ X N sign(π)α hϕ|ψπ(1) i|ψπ(2) i ⊗ · · · ⊗ |ψπ(N ) i , Perm. π von {1,. . . ,N} a†ϕ |ψi = √ X 1 sign(π)α |ψπ(0) i ⊗ · · · ⊗ |ψπ(N ) i , N + 1 Perm. π von {0,. . . ,N} wobei wir im letzteren Fall |ψ0 i = |ϕi setzen. Die Interpretation dieser Operatoren ist, dass sie ein Teilchen im Zustand ϕ vernichten † bzw. erzeugen. Daher ist aϕ |ψi ein N − 1-Teilchenzustand und aϕ |ψi ein N + 1-Teilchenzustand. † Darüber hinaus sind aϕ und aϕ zueinander adjungiert wie die Notation bereits andeutet. Es lässt sich verifizieren, dass die Erzeugungs- und Vernichtungsoperatoren zu zwei im allgemeinen unterschiedlichen Zuständen ϕ, χ folgende kanonische (Anti-)Vertauschungsrelationen erfüllen aϕ a†χ ∓ a†χ aϕ = hϕ|χi , aϕ aχ ∓ aχ aϕ = 0 Das negative/positive Vorzeichen gilt dabei für Bosonen/Fermionen. Aus der Definition folgt ebenfalls folgende Vertauschungsrelationen mit dem Teilchenzahloperator [N, aϕ ] = −aϕ . 110 Diese gibt gerade an, dass aϕ die Teilchenzahl um eins verringert. Wir betrachten nun eine ONB |ni aus Eigenzuständen des Einteilchenhamiltonoperators H1 zu Energien En und ein nichtwechselwirkendes System bei dem H Blockform hat und jeder Blöcke HN wie besprochen eine Summe aus N Kopien von H1 ist. Für die dazugehörigen Erzeugungsund Vernichtungsoperatoren gilt dann an a†m ∓ a†m an = hn|mi = δn,m , am an ∓ an am = 0 . und [H, an ] = −En an . Letztere Identität besagt gerade, dass an die Energie um En , also die Energie des vernichteten Teilchens, verringert. Aus der Vertauschungsrelationen mit N und H folgt die Relation [H − µN, a†n ] = (En − µ)a†n bei der sichtbar wird, dass die Erzeugung eines Teilchen gerade die Energie µ kostet. Wir können nun den Teilchenzahloperator durch Erzeugungs- und Vernichtungsoperatoren ausdrücken. Dazu definieren wir Nn = a†n an . Dieser Operator gibt grob gesprochen “die Anzahl der Teilchen im Zustand |ni” an. Diese Aussage ist nicht ganz exakt, da der Erwartungswert von Nn auch in Zuständen, in denen die einzelnen Teilchen nicht exakt im Zustand |ni sondern z.B. in der Superposition |ni + |mi sind, nicht verschwindet. Es gilt allerdings die exakte Operatorgleichung N= X Nn . n Was ist der Erwartungswert von Nn im großkanonischen Ensemble? Dazu berechnen wir ha†n am i = Sp(a†n am ρ) = = 1 1 Sp(a†n am e−β(H−µN ) ) = Sp(a†n e−β(H−µN ) am (β)) ZG ZG 1 Sp(am (β)a†n e−β(H−µN ) ) = ham (β)a†n i ZG mit am (β) = eβ(H−µN ) am e−β(H−µN ) . Hierbei haben wir ausgenutzt, dass Sp(AB) = Sp(BA). Der β -abhängige Operator am (β) erfüllt die Differentialgleichung und Anfangsbedingung ∂ am (β) = eβ(H−µN ) [H − µN, am ]e−β(H−µN ) = −(Em − µ)am (β) , ∂β Daraus folgt am (β) = e−β(Em −µ) am . 111 am (0) = am . Es gilt also die KMS-Bedingung (nach Kubo, Martin, Schwinger) ha†n am i = e−β(Em −µ) ham a†n i . Diese Relation charakterisiert das grosskanonische Ensemble vollständig, d.h. die Eigenschaften des grosskanonischen Ensembles können aus dieser Relation gefolgert werden. Insbesondere erhalten wir aus der KMS-Bedingung und den kanonischen (Anti-)Vertauschungsrelationen ha†n am i = e−β(Em −µ) ham a†n i = e−β(Em −µ) ±ha†n am i + δmn ⇒ ha†n am i = δmn 1 eβ(Em −µ) ∓1 1 ⇒ hNn i = eβ(En −µ) ∓1 = δmn hNn i . Dabei gilt das negative/positive Vorzeichen für Bosonen/Fermionen. Aus der physikalischen Bedingung hNn i ≥ 0 können wir folgendes schließen: • Für Fermionen sind im Prinzip alle Werte für β und µ erlaubt. • Für Bosonen sind ist nur β ≥ 0 möglich und µ muss kleiner oder gleich der Grundzustandsenergie für ein Teilchen sein. Wir können ebenfalls ablesen, dass µ für Fermionen die Rolle der Fermi-Energie spielt. Im Limes T → 0 d.h. β → ∞ gilt hNn i = 1 für Zustände mit En < µ und hNn i = 0 für Zustände mit En > µ. Insbesondere kann jeder Zustand gemäß des Pauli-Prinzips nur höchstens einmal besetzt werden. Für Bosonen gilt diese Begrenzung nicht und hNn i kann beliebige positive Werte annehmen. Für große Werte von β(En − µ) geht das Resultat über in die klassische MaxwellBoltzmann-Verteilung hNn i ≈ e−β(En −µ) . 2.5 Ideale Quantengase Die einfachsten Beispiele für großkanonische Ensembles sind ideale Quantengase. Strenggenommen ist die bisherige Diskussion von thermodynamischen Ensembles nur gültig im Falle eines endlichen Volumens (und damit endlicher Teilchenzahl, Energie). Für die Diskussion idealer Quantengase müssen wir aber den idealisierten Fall betrachten, dass V unendlich groß ist, den sogenannten thermodynamischen Limes. Formal stellt man sich dazu ein System vor bei dem E, V, N gegen unendlich gehen, wobei die Teilchen- und Energiedichten n= N , V %= E V (oder alternativ, falls es keine Phasenübergänge gibt, die intensiven Größen µ, T ) festgehalten werden. 112 Im thermodynamischen Limes ist im Allgemeinen die Beschreibung eines Ensembles durch eine Dichtematrix nicht möglich weil die Zustandssumme im Limes V → ∞ divergiert. Stattdessen muss man den entsprechenden gemischten Zustand direkt durch seine Erwartungswerte charakterisieren, die durch die – auch im thermodynamischen Limes sinnvolle – KMS-Bedingung bestimmt sind. Für ein ideales Gas mit Ein-Teilchen-Hamilton-Operator H1 = P~ 2 2m lautet diese analog zum Fall endlichen Volumens: ha~† aq~i = e−β(E~k −µ) haq~a~† i , k E~k = k ~2~k 2 . 2m † Dabei sind a~ , a~k Erzeungs- und Vernichtungsoperatoren zum scharfen Impuls ~~k und erfüllen k die kanonischen (Anti-)Vertauschungsrelationen a~k a†q~ ∓ a†q~a~k = δ(~k − ~q) , aq~a~k ∓ a~k aq~ = 0 . Analog zum Fall endlichen Volumens kann man aus diesen Relationen und der KMS-Bedingung den Erwartungswert der Teilchenzahldichte pro scharfem Impuls n~k hn~k i = 1 1 3 β(E −µ) (2π) e ~k ∓1 herleiten, wobei sich die gesamte Teilchenzahldichte als Z 1 hni = d k hn~k i = (2π)3 R3 3 Z d3 k R3 1 β(E~k −µ) e ∓1 berechnet. Wie zuvor gilt das negative/positive Vorzeichen für Bosonen/Fermionen. 2.5.1 Das ideale Fermigas, weiße Zwerge, Neutronensterne und schwarze Löcher Wie bereits erwähnt zeigen quantenmechanische Systeme bei tiefen Temperaturen deutliche Abweichungen vom klassisch erwarteten Verhalten. Wie manifestiert sich das beim idealen Fermigas? Wir berechnen die Teilchenzahldichte des idealen Fermigases bei T = 0, d.h. β = ∞. Das Integral lässt sich leicht berechnen, da hn~k i bis zur Fermienergie konstant ist und danach verschwindet. Man findet 1 4π hni = (2π)3 3 2mµ ~2 3/2 = (αmµ) 3/2 , und damit, durch Auflösen nach µ, µ= 1 hni2/3 . αm 113 α= 1 4π (2π)3 3 2/3 2 ~2 Wir wollen daraus den Druck hpi berechnen. Aus der phänomenologischen Thermodynamik wis∂p sen wir, dass n = ∂µ gilt. Daraus folgt20 2 2 1 hpi = (αm)3/2 µ5/2 = hni5/3 . 5 5 αm Beim klassischen idealen Gas gilt p= N kT = nkT , V d.h. p = 0 für T = 0, auch wenn n > 0. Beim fermionischen idealen Quantengas finden wir dass bei T = 0 der Druck nicht verschwindet wenn die Teilchendichte endlich ist. Dieser quantenmechanische Effekt, der letztlich das Pauli-Prinzip bzw. das Ununterscheidbarkeitsprinzip als seine Ursache hat, wird Entartungsdruck genannt. Dabei bezieht sich “entartet” nicht auf etwaige entartete Energieniveaus, sondern ist ein Ausdruck für die große Abweichung vom klassisch erwarteten Verhalten. Der Entartungsdruck spielt eine große Rolle beim Verständnis des Lebenszyklus eines Sterns. Ein Stern ist zunächst einmal eine große Kugel aus Wasserstoff. Wegen der gegenseitigen gravitativen Anziehung ist diese Kugel bestrebt sich zu verkleinern, die Materie innerhalb der Kugel ist also einem großen Druck ausgesetzt, der im Zentrum maximal ist und umso größer ist, je größer die Gesamtmasse des Sterns ist. Durch diesen hohen Druck wird das Wasserstoff zu einem Plasma – d.h. die Bindung zwischen Elektronen und Atomekernen wird vollständig aufgehoben – und Kernfusion möglich. Die dabei entstehende Energie wird in Form von (u.a.) Wärmestrahlung frei. Der entsprechende Strahlungdruck wirkt dem Gravitationsdruck entgegen und stabilisiert somit den Stern. Hat der Stern am Ende seines “Lebens” den Fusionsbrennstoff aufgebraucht, hört die Kernfusion auf und der stabilisierende Strahlungsdruck fehlt. Nun gibt es verschiedene Möglichkeiten. • Ist der Stern vergleichsweise leicht (bis ca. 10 Sonnenmassen), schrumpft ein großer Teil der Materie zu einem weißen Zwerg zusammen (der Rest wird in der letzten Brennstufe durch den Strahlungsdruck “weggeblasen”). Ein weißer Zwerg lässt sich relativ gut als ideales Fermigas modellieren und so ist es gerade der Entartungsdruck der Elektronen, der dem gravitativen Druck entgegenwirkt und die “Sternenleiche” stabilisiert. Der mögliche Beitrag zum Entartungsdruck durch die tausendfach schwereren Atomkerne ist wegen hpi ∝ m−1 vernachlässigbar. Weiße Zwerge sind folglich sehr klein (etwa so groß wie die Erde) und sehr dicht (ca. 1t/cm3 ). • Ist der Stern mittelschwer (ca. 10-20 Sonnenmassen), dann wäre der entstehende weiße Zwerg so schwer, dass selbst der Entartungsdruck der Elektronen dem gravitativen Druck nicht mehr widerstehen kann.21 Stattdessen werden die Elektronen von den Protonen der Atomkerne unter Bildung von Neutronen eingefangen, so dass schließlich nur Neutronen 20 Man kann zeigen, dass hpi wirklich homogen in µ ist, d.h. für µ = 0 verschwindet. Zur exakten Berechnung dieser sogenannten Chandrasekar-Grenze muss man das relativistische Fermigas betrachten. 21 114 übrigbleiben, daher spricht man von einem Neutronenstern. Der Entartungsdruck der Neutronen, die ebenfalls Fermionen sind, stabilisiert nun (zusätzlich zur sogenannten starken Wechselwirkung zwischen ihnen) die Sternenleiche. Neutronensterne sind folglich noch kleiner als weiße Zwerge (Radius ca. 10km) und noch dichter (ca. 1000t/mm3 ). • Ist der Stern schwerer als ca. 20 Sonnenmassen reicht selbst der Entartungsdruck der Neutronen nicht mehr aus um seinen Überrest zu stabilisieren und dieser kollabiert völlig zu einem sogenannten schwarzen Loch. Heuristisch kann man sich dabei vorstellen, dass die gesamte Masse des Sternenüberrestes zu einem einzigen Punkt kollabiert. Allerdings lässt sich das “Innere” eines schwarzen Loches mit “normaler” Physik nicht beschreiben und es gibt tatsächlich zahlreiche Aspekte schwarzer Löcher die nicht gut verstanden sind. Es gibt allerdings wenig Zweifel daran und zahlreiche Indizien dafür, dass kompakte Objekte, die dichter als Neutronensterne sind, existieren und bislang ist keine stabile Form von Materie mit dieser Eigenschaft bekannt. 2.5.2 Das ideale Bosegase, Strahlungsgesetze, Bose-Einstein-Kondensation Wir betrachten nun die Teilchendichte beim idealen Bosegas. Z 1 hni = d k hn~k i = (2π)3 R3 3 Z d3 k R3 1 β(E~k −µ) e −1 p −3 Diese wird maximal für µ → 0 und erreicht den kritischen Wert hni = nkr ≈ 2.61 2πβ~2 /m . Was passiert bei größeren Teilchendichten? Analog zum Phasenübergang gasförmig/flüssig bei realen Gasen am kritischen Druck tritt eine Kondensation auf, die sogenannten Bose-EinsteinKondensation. D.h. dass es zu festen intensiven Größen µ, β (mindestens) zwei homogene Gleichgewichtszustände, also Phasen, geben muss. Um diese zu finden betrachten wir erneut die KMS-Bedingung unter Ausnutzung der Vertauschungsrelationen ha~† aq~i = e−β(E~k −µ) haq~a~† = e−β(E~k −µ) ±ha~† aq~i + δ(~q − ~k) k k k ⇔ eβ(E~k −µ) − 1 ha~† aq~i = δ(~q − ~k) k Bei µ = 0 gilt für ~k = 0 dass E~k = 0 und damit (eβ(E~k −µ) − 1) = 0. Die Gleichung lässt sich † also nicht eindeutig nach ha~ aq~ i auflösen und die Teilchendichte ist für ~k = 0 durch die KMSk Bedingung nicht eindeutig festgelegt. Für eine (genügend reguläre) Funktion f (~k) gilt im Produkt mit der Delta-Distribution δ(~k) f (~k)δ(~k) = f (0)δ(~k) weil δ(~k) außerhalb von Null verschwindet. Daher können wir bei µ = 0 die KMS-Bedingung etwas allgemeiner durch z.B. ha~† aq~i = k δ(~k − ~q) e β(E~k −µ) −1 + n1 (2π)3 δ(~k)δ(~q) , 115 n1 ≥ 0, lösen. Die Teilchendichte in diesem Zustand ist hni = nkr + n1 . Anschaulich passiert also folgendes. Bei µ = 0 kostet es keine Energie, ein Teilchen im Grundzustand (d.h. mit ~k = 0 und damit E~k = 0) dem System hinzuzufügen. Daher kann dieser Zustand mit einer makroskopischen Anzahl von Teilchen besetzt werden. Bose-Einstein-Kondensate wurden im Labor zum ersten Mal 1995 hergestellt (Nobelpreis für Physik 2001). Wir betrachten nun das ideale Bosegas als Beschreibung von Photonen, also Lichtteilchen. Da diese masselos p sind, müssen wir relativistisch rechnen, also die relativistische Dispersions- relation E~k = m2 c4 + ~2~k 2 c2 , in diesem Fall E~k = ~c|~k|, verwenden. Für %~k , die Energiedichte pro scharfem Impuls ~k gilt dann – wegen µ = 0 für Photonen und zwei unabhängigen Polarisationszuständen – h%~k i = E~k hn~k i = 2 ~c|~k| ~ω 2 = , 3 3 β~ω ~ β~c| k| (2π) e (2π) e −1 −1 ω = c|~k| . Für die gesamte Energiedichte gilt also das bekannte Planck’sche Strahlungsgesetz Z h%i = R3 2.6 d3 k h%~k i = 1 π2 Z ∞ dω 0 ~ω 3 1 . c3 eβ~ω − 1 Ferromagnetismus, das Ising-Modell Zum Abschluss wollen wir das Ising-Modell diskutieren, das eine stark vereinfachte Beschreibung für Ferrogmagnetismus liefert. Wir betrachten ein kubisches Gitter mit N Gitterpunkten. (i) An jedem Gitterpunkt i ∈ {1, 2, . . . , N } sitzt ein Spin 1/2 Freiheitsgrad. Es sei σi = 2/~Sz der entsprechende Spin-z Operator in Einheiten von ~ mit Eigenwerten ±1. Der Hamiltonoperator sei N X J X H=− σi σj − h σi , 2 i,j n.N. i=1 wobei h die Kopplung an ein externes homogenes Magnetfeld darstellt, J die Kopplung zwischen zwei benachbarten Spins angibt und “n.N.” bedeutet, dass man beim Wechselwirkungsterm nur über nächste Nachbarn summiert. Man nimmt also an, dass übernächste Nachbarn nicht miteinander wechselwirken. Wir betrachten eine ferrogmagnetische Kopplung J > 0, d.h. die Parallelstellung benachbarter Spins ist im Gegensatz zur Antiparallelstellung energetisch bevorzugt. Im Abschnitt über Quantenmechanik haben wir diskutiert dass zu jedem geladenen Teilchen mit Spin ein magnetisches Moment gehört, so dass zwischen geladenen Teilchen mit Spin eine direkte magnetische Wechselwirkung vorhanden ist. Wir haben in Form der Austauschwechselwirkung auch eine indirekte magnetische Wechselwirkung kennengelernt. Diese indirekte Wechselwirkung resultiert aus dem Pauli-Prinzip, das z.B. impliziert, dass zwei ununterscheidbare Spin 1/2 Teilchen mit 116 paralleler Spinausrichtung im Mittel weiter voneinander entfernt sein müssen als zwei solche Teilchen mit antiparalleler Spinausrichtung. Es stellt sich heraus, dass diese indirekte magnetische Wechselwirkung in der Regel deutlich über die direkte dominiert, so dass Ferromagnetismus auf die Austauschwechselwirkung und damit das Pauli-Prinzip zurückgeführt werden kann. Um die Frage zu beantworten, ob und wie das Ising-Modell Ferromagnetismus beschreibt, betrachten wir das dazugehörige kanonische Ensemble beschrieben durch die Dichtematrix ρ= e−βH . Z Die entscheidende Größe ist die (mittlere) Magnetisierung N N 1 X −βH 1 X hσi i = Sp σi e . m= N ZN i=1 i=1 m ist eine Funktion von β und h. Von einem ferromagnetischen Verhalten sprechen wir, wenn bei h = 0 m 6= 0 ist, d.h. auch bei abgeschaltetem äußerem Magnetfeld bleibt der Kristall magnetisch. Es stellt sich heraus, dass bei endlichem N , also einem endlichen Gitter, kein ferromagnetisches Verhalten sichtbar wird. Daher betrachten wir den thermodynamischen Limes N → ∞. Weil das System im thermodynamischen Limes translationsinvariant ist und wir einen Gleichgewichtszustand beschreiben wollen der per Definition homogen ist, muss gelten hσi i = m für alle i . Um m zu berechnen müssen wir im Prinzip die Eigenzustände von H kennen. In einer und zwei Raumdimensionen ist es möglich das Ising-Modell exakt zu lösen. In drei Raumdimensionen ist eine exakte Methode nicht bekannt, daher greift man auf die sogenannte Molekularfeldnährung – im Englischen treffender mean field approximation genannt – zurück. In dieser Nährung nimmt man an, dass auf den Spin am i-ten Gitterplatz nur die Mittelwerte hσj i = m seiner nächsten Nachbarn wirken. Man ersetzt also H durch HMF = −Jν X i σi m − h X σi = −(Jνm + h) i X σi . i Dabei ist ν die Anzahl der nächsten Nachbarn, in einem dreidimensionalen kubischen Gitter also ν = 6. In dieser Näherung haben wir es offenbar mit unendlich vielen Kopien desselben Systems zu tun, die jeweils nicht miteinander wechselwirken sondern nur mit dem effektiven externen Feld Jvm+h, das hier eine unbekannte Größe ist. Wegen hσi i = m reicht es also, zur Berechnung von m ein einzelnes System mit Hamiltonoperator und Dichtematrix HMF,1 = −(Jνm + h)σ , 117 ρMF,1 = e−βHMF,1 Z zu betrachten. Es gilt Sp σeβ(Jνm+h)σ −e−β(Jvm+h) + eβ(Jvm+h) = = tanh (β(Jνm + h)) . m = hσi = Sp(σρMF,1 ) = e−β(Jvm+h) + eβ(Jvm+h) Sp eβ(Jνm+h)σ Wir erhalten also im Fall h = 0 mittels der Molekularfeldnäherung die Selbstkonsistenzgleichung m = tanh (βJνm) . Wir können die Lösungen dieser Gleichung graphisch bestimmen. tanh (βJνm) für βJν ∈ {1/2, 1, 3/2, 2} im Vergleich zu m (gestrichelt). Für βJν < 1 gibt es nur eine Lösung m = 0. Für βJν > 1 gibt es drei Lösungen, zum einen m = 0 und zum anderen m(β) = ±|m(β)|, wobei |m(β)| eine monoton steigende Funktion von β ist mit |m(β)| = 1 für β → ∞. Die Lösung m = 0 kann man im letzteren Fall außer Acht lassen, da sie energetisch höher als die anderen beiden liegt. Der Wechsel zwischen den beiden Situationen wird durch die kritische Curie-Temperatur Tkr = Jν k 118 markiert, die – nicht überraschend – groß ist, wenn die effektive Kopplung Jν groß ist, das Material also ein “guter” Ferromagnet ist22 . Wir finden also ein Verhalten analog zum Phasenübergang flüssig/gasförmig bei realen Gasen: Für T < Tkr gibt es zwei Phasen mit m(T ) = ±|m(T )| die koexistieren können und das Material ist ferromagnetisch, für T > Tkr existiert nur noch eine nicht ferromagnetische Phase mit m = 0. Das m-T -Phasendiagramm ähnelt dabei verbüffend dem v -T - Phasendiagramm des realen Gases und verdeutlicht die Universalität von Phasenübergängen. v -T -Phasendiagramm des gasförmig/flüssig Übergangs eines realen Gases m +|m(T)| ferromagnetisch mkr= 0 “verboten” nicht ferromagnetisch --|m(T)| ferromagnetisch Tkr T m-T -Phasendiagramm des Phasenübergangs eines Ferromagneten 22 Tatsächlich findet man in einer Raumdimension, also bei ν = 2, dass die exakte Lösung kein ferromagnetisches Verhalten zeigt, das ist erst in zwei und (vermutlich) mehreren Raumdimensionenen der Fall. Im Limes ν → ∞ wird die Molekularfeldnäherung exakt. 119