Theoretische Physik für das Lehramt L2 Teil II Statistische Physik und Thermodynamik Helmut Neufeld Fakultät für Physik Universität Wien Wintersemester 2008/09 ii Inhaltsverzeichnis 1 Statistische Physik 1 1.1 Aufgabenstellung der statistischen Physik . . . . . . . . . . . . . 1 1.2 Entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 Gleichgewichtszustände 5 2.1 Allgemeine Charakterisierung von Gleichgewichtszuständen . . . . 5 2.2 Mikrokanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . 6 2.3 Kanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . . . . 8 2.4 System in Kontakt mit einem Wärmebad . . . . . . . . . . . . . . 10 2.5 Temperatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.6 Paramagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.7 Großkanonisches Ensemble . . . . . . . . . . . . . . . . . . . . . . 14 3 Thermodynamik 17 3.1 Hauptsätze der Thermodynamik . . . . . . . . . . . . . . . . . . . 17 3.2 Einfache Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . 19 4 Identische Teilchen 23 4.1 Mehrteilchensysteme . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.2 Quantenstatistik nicht wechselwirkender Teilchen . . . . . . . . . 26 4.3 Maxwell-Boltzmann-Statistik . . . . . . . . . . . . . . . . . . . . 28 4.4 Ideales Gas im klassischen Limes . . . . . . . . . . . . . . . . . . 29 iii INHALTSVERZEICHNIS iv 5 Photonen 33 5.1 Energie des elektromagnetischen Feldes . . . . . . . . . . . . . . . 33 5.2 Freies elektromagnetisches Feld . . . . . . . . . . . . . . . . . . . 36 5.3 Feldquantisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5.4 Teilcheninterpretation 41 . . . . . . . . . . . . . . . . . . . . . . . . 6 Plancksches Strahlungsgesetz 43 6.1 Hohlraumstrahlung . . . . . . . . . . . . . . . . . . . . . . . . . . 43 6.2 Strahlungsdruck . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 6.3 Schwarzer Strahler . . . . . . . . . . . . . . . . . . . . . . . . . . 48 6.4 Oberflächentemperatur von Planeten . . . . . . . . . . . . . . . . 50 A Unitäre Vektorräume 53 A.1 Komplexes Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . 53 A.2 Norm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 A.3 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . 56 A.4 Adjungierte Abbildung . . . . . . . . . . . . . . . . . . . . . . . . 57 A.5 Orthonormalbasis . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 A.6 Projektionsoperatoren . . . . . . . . . . . . . . . . . . . . . . . . 62 A.7 Hermitesche Operatoren . . . . . . . . . . . . . . . . . . . . . . . 63 A.8 Unitäre Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . 65 A.9 Normale Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . 66 A.10 Spektralsatz für normale Operatoren . . . . . . . . . . . . . . . . 67 A.11 Gleichzeitige Diagonalisierbarkeit . . . . . . . . . . . . . . . . . . 72 A.12 Funktionen normaler Operatoren . . . . . . . . . . . . . . . . . . 73 B Einfache Quantensysteme 77 B.1 Grundpostulate der Quantentheorie . . . . . . . . . . . . . . . . . 77 B.2 Spin 1/2 System . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 B.3 Zeitentwicklung in der Quantenmechanik . . . . . . . . . . . . . . 87 INHALTSVERZEICHNIS C Literatur v 89 C.1 Statistische Physik und Thermodynamik . . . . . . . . . . . . . . 89 C.2 Mathematische Methoden . . . . . . . . . . . . . . . . . . . . . . 89 vi INHALTSVERZEICHNIS Kapitel 1 Statistische Physik 1.1 Aufgabenstellung der statistischen Physik Es wäre ein aussichtsloses Unterfangen, den Zustand eines makroskopischen Systems, das aus einer sehr großen Anzahl von Teilchen besteht, durch einen reinen Zustand beschreiben zu wollen. In diesem Fall haben wir es mit gemischten Zuständen zu tun, die bekanntlich durch Dichteoperatoren dargestellt werden können. Jene Dichteoperatoren, die thermodynamischen Gleichgewichtszuständen entsprechen, können sehr leicht durch Wahrscheinlichkeitsargumente gefunden werden. Hat man es mit Systemen zu tun, die aus einer sehr großen Anzahl N von Teilchen (typische Größenordnung: Loschmidtsche Zahl L ∼ 6 × 1023 mol−1 ) bestehen, so ist es unmöglich jene vollständige Information zu besitzen, die zur Festlegung eines reinen Zustandes derartiger Systeme nötig wäre. Klassisch gesprochen, müsste man dafür zu einem bestimmten Zeitpunkt die Positionen und Geschwindigkeiten aller N Teilchen genau kennen (das entspräche der Kenntnis von 6N reellen Zahlen). Bei der quantenmechanischen Beschreibung eines Systems von N spinlosen Teilchen müsste man (wenn man in der Ortsdarstellung arbeitet) eine Wellenfunktion der Form ψ(x1 , . . . xN ) angeben, was ebenfalls völlig aussichtslos wäre. Tatsächlich steht uns bei der Beschreibung des Zustands eines makroskopischen System nur eine sehr viel geringere Information zur Verfügung, die weit von jener maximalen Information entfernt ist, die zur Festlegung eines reinen Zustandes nötig wäre. Betrachten wir etwa ein Gas, das sich in einem geschlossenen Behälter befindet, so kennen wir vielleicht die Art des Gases (z.B. Helium), das von ihm eingenommene Volumen V , seine Gesamtmasse M, den Druck p, den es auf die Wände ausübt. Weiters könnte uns bekannt sein, dass der Gasbehälter schon so lange in einem Raum mit konstanter Zimmertemperatur steht, sodass sich auch 1 KAPITEL 1. STATISTISCHE PHYSIK 2 die Temperatur T des Gases jener der Umgebung angeglichen hat. Durch welchen Dichteoperator ρ wird der so festgelegte Zustand des Gases beschrieben? Wir werden uns in dieser Vorlesung fast ausschließlich mit sogenannten Gleichgewichtszuständen beschäftigen. Die entsrechenden Dichteoperatoren lassen sich in diesem Fall nämlich sehr leicht durch Wahrscheinlichkeitsargumente finden. 1.2 Entropie Die Entropie spielt in der statistischen Physik eine zentrale Rolle. Sie ist ein Maß für die Gemischtheit“ eines Zustandes. ” Ein bestimmter Zustand werde durch den Dichteoperator ρ= pn |nn| , pn ≥ 0, Trρ = n n pn = 1, n beschrieben. Man kann sich diesen Zustand durch eine sehr große Anzahl N von Kopien des Systems vorstellen, wobei sich N1 = p1 N von ihnen im reinen Zustand |1 befinden, N2 = p2 N im Zustand |2, usw., wobei Nn = N . n In diesem Fall gibt es N! N1 ! N2 ! . . . verschiedene Möglichkeiten, dass sich von den insgesamt N Kopien des Systems N1 = p1 N im reinen Zustand |1 befinden, N2 = p2 N im Zustand |2, und so fort. Da Γ (in den uns interessierenden Fällen) i.A. eine sehr große Zahl sein wird, ist es vorteilhaft, die etwas handlichere Größe ln Nn ! ln Γ = ln N ! − Γ= n zu verwenden. Aus dem selben Grund kann man die Stirlingsche Formel ln N ! N ln N − N + . . . anwenden, die für N 1 mit sehr guter Genauigkeit erfüllt ist. Man erhält daher ln Γ N ln N − N − (Nn ln Nn − Nn ) = N ln N − n n Nn ln Nn . 1.2. ENTROPIE 3 Setzt man in diesen Ausdruck Nn = pn N ein, so erhält man N pn (ln N + ln pn ) ln Γ N ln N − = −N n pn ln pn = −N Tr(ρ ln ρ) n bzw. ln Γ −Tr(ρ ln ρ). N Die rechte Seite der letzten Formel ist unabhängig von N und wird (abgesehen von einem historisch bedingten Faktor k) als Entropie des durch den Dichteoperator ρ beschriebenen Zustands bezeichnet: S = −k Tr(ρ ln ρ) Der Proportionalitätsfaktor k 1.38 × 10−23 JK−1 wird als Boltzmann1 -Konstante bezeichnet. Bemerkung: ln Γ N S/k ⇔ Γ exp(N S/k). Beispiele: Wir betrachten einen N-dimensionalen Zustandsraum H. 1. Für einen reinen Zustand ρ = |ψψ| (ψ|ψ = 1) ist −Tr(ρ ln ρ) = 0 und die Entropie somit minimal. 2. Im Zustand ρ = /N (maximale Mischung) ist −Tr(ρ ln ρ) = ln N. Die Entropie ist in diesem Fall maximal. 1 Ludwig Boltzmann, 1844 Wien – 1906 Duino. 4 KAPITEL 1. STATISTISCHE PHYSIK Kapitel 2 Gleichgewichtszustände 2.1 Allgemeine Charakterisierung von Gleichgewichtszuständen Thermodynamische Gleichgewichtszustände sind zeitlich konstante Zustände, für welche die Entropie, unter Berücksichtigung aller vorhandenen Nebenbedingungen, maximal ist. Ein quantenmechanisches System werde durch den Hamiltonoperator H beschrieben. Ein Gleichgewichtszustand dieses Systems kann durch die folgenden Forderungen charakterisiert werden: 1. Der Dichteoperator ρ soll zeitlich konstant sein. 2. Die Entropie soll unter Berücksichtigung aller Nebenbedingungen, denen das System unterliegt, maximal sein. Wegen der von Neumann1 -Gleichung, ih̄ dρ(t) = [H, ρ(t)], dt folgt aus der oben geforderten zeitlichen Konstanz des Dichteoperators, dass H und ρ vertauschen. Es existiert somit ein gemeinsames vollständiges Orthonormalsystem |1, |2, . . . von Eigenvektoren: H|n = En |n, ρ|n = pn |n. Bemerkung: Sind außer der Energie weitere Erhaltungsgrößen vorhanden, können diese auf analoge Weise berücksichtigt werden. 1 Johann von Neumann, 1903 Budapest – 1957 Washington, D.C. 5 KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE 6 2.2 Mikrokanonisches Ensemble Wir wollen den Dichteoperator eines abgeschlossenenen Systems im thermischen Gleichgewicht finden. Die Energie des Systems sei auf den Bereich I(E, δE) = [E − δE, E] beschränkt. In diesem Fall müssen wir also das Maximum von pn ln pn − En ∈I(E,δE) unter Berücksichtigung der Nebenbedingung pn = 1 En ∈I(E,δE) finden. Die Nebenbedingung wird am besten durch einen Lagrangeschen2 Multiplikator berücksichtigt. Wir betrachten daher die Funktion f (p1 , p2 , . . . , λ) = − pn ln pn + λ(1 − pn ). En ∈I(E,δE) En ∈I(E,δE) Nullsetzen der Ableitungen nach p1 , p2 , . . . und λ ergibt ∂f = 0 ⇒ ln pm = −1 − λ, ∂pm ∂f =0 ⇒ pn = 1. ∂λ En ∈I(E,δE) Das heißt, für alle n mit En ∈ I(E, δE) ist pn eine von n unabhängige Konstante. Bezeichnet man die Anzahl der Zustände im zugänglichen Energieintervall I(E, δE) mit Ω(E, δE) = 1, En ∈I(E,δE) so erhält man 1/Ω(E, δE) für En ∈ I(E, δE) . pn = 0 sonst Das ist gleichbedeutend mit ρM K = 2 1 Ω(E, δE) |nn|. En ∈I(E,δE) Joseph-Louis Lagrange, 1736 Turin – 1813 Paris. 2.2. MIKROKANONISCHES ENSEMBLE 7 Für die Entropie ergibt sich daher S = k ln Ω(E, δE). Befindet sich ein abgeschlossenenes (isoliertes) System im thermodynamischen Gleichgewicht, tritt also jeder der zugänglichen Energieeigenzustände |n (En ∈ I(E, δE)) mit der gleichen Wahrscheinlichkeit pn = 1 Ω(E, δE) auf, wobei Ω(E, δE) die Anzahl der im Intervall I(E, δE) befindlichen Energieeigenzustände ist. Diese Charakterisierung wird manchmal auch als Fundamentalpostulat (FP) der statistischen Physik bezeichnet. Bemerkungen3 : Das FP definiert“ das Gleichgewicht, seine Rechtfertigung ist ” durch das Experiment gegeben. Unter welchen Annahmen folgt das FP aus der Quantenmechanik? Welche dieser Annahmen haben physikalischen (und nicht nur rein mathematischen) Inhalt? Klarerweise gilt das FP nur für makroskopische Systeme. Um ein makroskopisches System zu erhalten, kann man die Teilchendichte N/V konstant halten, aber N und V sehr groß werden lassen (thermodynamischer Limes). Lässt man die Zeitentwicklung bei t = 0 in einem reinen Zustand starten, wird das System i.A. nicht im Gleichgewicht sein. Erst nach einer Zeit t τr wird sich das Gleichgewicht einstellen, wobei τr die Relaxationszeit des Systems ist (τr ist die typische Zeit, die ein System braucht, um nach einer plötzlichen Störung wieder ins Gleichgewicht zu kommen; ein System kann für verschiedene Freiheitsgrade unterschiedliche Relaxationszeiten haben). Der Übergang vom reinen Zustand bei t = 0 zum gemischten Gleichgewichtszustand kann nicht durch die von NeumannGleichung beschrieben werden (dabei würde sich die Entropie nicht ändern). Für den Übergang von einem reinen Zustand zum mikrokanonischen Ensemble im Fall eines abgeschlossenen makroskopischen Systems wurden unter anderem folgende Begründungen angegeben: • Die Anzahl der dem Experimentator zugänglichen Observablen ist viel kleiner als die Anzahl der Freiheitsgrade des Systems (siehe frühere Diskussion). Man sieht somit effektiv einen gemischten Zustand. Die ursprünglich vorhandene Information über das System kann im Laufe der Zeitentwicklung schwerer zugänglich werden, was der kurzsichtige“ Beobachter als Streben ” zum Gleichgewicht interpretiert. • Makroskopische Messungen dauern eine endliche Zeit τM δτ , wobei δτ die typische Zeit ist, in der eine Wechselwirkung der Teilchen untereinander stattfindet. 3 Diese Bemerkungen sind dem T4 Skriptum von Walter Grimus entnommen. KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE 8 • Es tragen auch kleine Wechselwirkungen der Teilchen untereinander, die im Hamiltonoperator H vernachlässigt werden, zur Durchmischung“ bei. ” Weiters ist das System nie vollständig von seiner Umgebung isolierbar. Jeder dieser Punkte kann in gewissen Fällen für die Begründung“ des FP aus ” der Quantenmechanik herangezogen werden. Eine allgemein gültige Herleitung ist schwierig, z.B. können in einem System mehrere Relaxationszeiten von völlig unterschiedlicher Größenordnung auftreten. Zur Erläuterung des dritten Punktes betrachten wir einen Hamiltonoperator H̄ = H + W + U. Die Klassifikation der Energieeigenzustände des Systems erfolt nach H, die innere Störung (Restwechselwirkung der Teilchen, die nicht in H enthalten ist) wird durch W beschrieben und die äußere Störung (Wechselwirkung mit der Umgebung) durch U. Ein typisches Beispiel wäre ein ideales Gas, wo der Beitrag der Wechselwirkung zwischen den Molekülen in H vernachlässigt wird, diese ist jedoch für das Zustandekommen des Gleichgewichts wesentlich! 2.3 Kanonisches Ensemble In diesem Fall wird die mittlere Energie pn En = E = const. n als Nebenbedingung vorgegeben. Man sucht also das Maximum von S/k = − pn ln pn n unter Berücksichtigung der beiden Nebenbedingungen pn = 1, pn En = E. n n Analog zu vorhin, betrachten wir jetzt die Funktion f (p1 , p2 , . . . , λ, β) = − pn ln pn + λ(1 − pn ) + β(E − pn En ). n n Nullsetzen der Ableitungen nach p1 , p2 , . . ., λ und β ergibt ∂f = 0 ⇒ ln pm = −1 − λ − βEm , ∂pm ∂f =0 ⇒ pn = 1, ∂λ n ∂f pn En = E. =0 ⇒ ∂β n n 2.3. KANONISCHES ENSEMBLE ⇒ 9 pn = Ce−βEn Die Konstante C kann mit Hilfe der Nebenbedingung pn = 1 bestimmt werden: n C= 1 e−βEn n e−βEn pn = −βEm e ⇒ m Das ist gleichbedeutend mit e−βH . Tre−βH Die absolute Temperatur T kann durch die Beziehung ρK = β= 1 kT definiert werden. Durch die Nebenbedingung n pn En = E besteht ein Zusam- menhang zwischen β (bzw. T ) und der mittleren Energie E: −βEn e En n −βE = E. m e m Definiert man die kanonische Zustandssumme e−βEn ⇔ Z = Tre−βH , Z= n so kann man die mittlere Energie (den Erwartungswert von H) folgendermaßen berechnen: −βEn e En ∂ ln Z n = −βEm . H = − ∂β e m Aufgabe: Zeigen Sie, dass die Entropie eines kanonischen Ensembles durch S= gegeben ist. E + k ln Z T KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE 10 2.4 System in Kontakt mit einem Wärmebad Man kann auch durch eine andere Überlegung zum kanonischen Ensemble gelangen: Wir betrachten ein kleines“ System A (kann auch ein mikroskopisches Sy” stem sein) im thermischen Kontakt mit einem Wärmebad“ B (makroskopisches ” System). Das aus A und B bestehende System sei abgeschlossen. Der Hamiltonoperator des Gesamtsystems is HA + HB + W . Der Wechselwirkungterm W ist für den thermischen Kontakt der beiden Subsysteme zwar wesentlich, wir wollen aber annehmen, dass wir ihn in der Gesamtenergiebilanz vernachlässigen können: E = EA + EB . Die Energieeigenzustände von HA seien mit |n bezeichnet. Befindet sich das abgeschlossene Gesamtsystem im thermischen Gleichgewicht, so ist die Wahrscheinlichkeit, dass sich das System A im n-ten Energieeigenzustand mit Energie En befindet durch ΩB (E − En , δE) pn = Ω(E, δE) gegeben. Dabei ist Ω(E, δE) die Anzahl der zugänglichen Zustände des Gesamtsystems A+B und ΩB (E − En , δE) die Anzahl der Zustände des Systems B mit Energie E−En (innerhalb des Energieintervalls δE). Die Taylorreihenentwicklung ln ΩB (E − En , δE) = ln ΩB (E, δE) − En ∂ ln ΩB (E, δE) +... ∂E β liefert ΩB (E − En , δE) = ΩB (E, δE)e−βEn . Für die Wahrscheinlichkeit, dass sich das System A im n-ten Energieeigenzustand befindet, ergibt sich daher wie früher pn = Ce−βEn , beziehungsweise pn = 1 −βEn e , Z Z= e−βEn . n Wir sehen, dass zwischen der Temperatur T des Wärmebades und der Abhängigkeit der Anzahl seiner Zustände von der Energie die Beziehung β= 1 ∂ ln ΩB (E, δE) = ∂E kT besteht. Man kann also das kanonische Ensemble auch als ein System auffassen, das sich im Gleichgewicht mit einem Wärmebad mit vorgegebener Temperatur T befindet. 2.5. TEMPERATUR 2.5 11 Temperatur Die absolute Temperatur ist eine Gleichgewichtsgröße, d.h. nur einem System, das sich im Gleichgewicht befindet, kann man eine Temperatur T zuschreiben. Wir hatten die absolute Temperatur T zunächst über den Parameter β = 1/kT des kanonischen Ensembles eingeführt, pn = 1 −βEn e , Z Z= e−βEn n und dann gesehen, dass man diese Größe auch im mikrokanonischen Ensemble durch die Formel ∂ ln Ω(E, δE) 1 β= = ∂E kT definieren kann. Wir betrachten zwei kanonische Ensembles A, B mit den Temperaturen TA = 1/kβA und TB = 1/kβB . Die Energieeigenzustände des Systems A werden mit |n bezeichnet, jene des Systems B mit |r. Die entsprechenden Wahrscheinlichkeiten sind dann durch 1 −βEnA 1 −βErB pA e , pB e n = r = ZA ZB gegeben. Die beiden Systeme werden nun in thermischen Kontakt gebracht, sodass Energieaustausch möglich wird (Hamiltonoperator H = HA + HB + W ). Ist die Wechselwirkung zwischen den beiden Systemen schwach (W HA,B ), so können die Energieeigenzustände des Gesamtsystems näherungsweise durch die Quantenzahlen “ |n, r mit dazugehörigen Energieeigenwerten En,r = EnA + ErB ” charakterisiert werden. Unmittelbar nachdem A und B in thermischen Kontakt gebracht wurden sind die Wahrscheinlichkeiten der Energieeigenzustände des Gesamtsystems A B e−βA En e−βB Er A B . pn,r = pn pr = ZA ZB Dies beschreibt nur dann einen Gleichgewichtszustand, falls βA = βB =: β ist. In diesem Fall erhält man die kanonische Verteilung A pK n,r B e−β(En +Er ) = . ZA ZB Ist dagegen βA = βB , so entsprechen die pn,r keiner kanonischen Verteilung und somit keinem Gleichgewichtszustand. In diesem Fall wird es zu einer Zustansänderung kommen, bis schließlich die kanonische Verteilung pK n,r (der Zustand mit maximaler Entropie) für einen gewissen Wert von β erreicht ist. KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE 12 Bemerkung: Wir sehen, dass die kanonische Zustandsumme Z zweier schwach miteinander wechselwirkender Systeme einfach das Produkt der Zustandssummen der Teilsysteme ist: A B A B A B Z= e−β(En +Er ) = e−βEn e−βEr = e−βEn e−βEr . n,r n r ZA ZB Analog ist die Entropie S des zusammengesetzten Systems die Summe der Entropien der Teilsysteme: S= 2.6 E EA + EB + k ln Z = + k(ZA + ZB ) = SA + SB . T T Paramagnetismus Unsere Überlegungen zur kanonischen Verteilung sollen nun auf ein sehr einfaches physikalisches System angewendet werden. Wir betrachten eine Substanz mit N0 magnetischen Momenten μ (mit Spin 1/2) pro Volumen in einem äußeren = Bez . Der Hamiltonoperator für einen der Spins ist dann Magnetfeld B −μB 0 = −μBσ3 = H = −μ · B 0 +μB Die Energieeigenwerte sind E↑ = −μB, E↓ = +μB und die dazugehörigen (normierten) Eigenvektoren 1 0 χ↑ = , χ↓ = . 0 1 Hat die Substanz die Temperatur T = 1/kβ, so wirkt diese für den betrachteten Spin als Wärmebad und seine Zustandssumme Z = Tre−βH = eβμB + e−βμB = 2 cosh(βμB), entsprechend der kanonischen Verteilung p↑ = eβμB , Z p↓ = e−βμB . Z Den Mittelwert der Komponente des magnetischen Moments in Richtung des angelegten äußeren Feldes erhält man durch Berechnung von μ̄z = p+ μ + p− (−μ) = μB eβμB μ − e−βμB μ = μ tanh(βμB) = μ tanh . βμB −βμB e μ+e μ kT 2.6. PARAMAGNETISMUS 13 Bemerkung: Man hätte natürlich auch ∂ ln Z/∂(βB) berechnen können: μ̄z = sinh(βμB) μ = μ tanh(βμB). cosh(βμB) Für die Magnetisierung M̄0 (mittleres magnetisches Moment pro Volumen) erhält man M̄0 = N0 μ̄z = N0 μ tanh(βμB). Im Grenzfall großer Temperaturen (μB kT ) ergibt sich μ̄z μ2 B kT bzw. M̄0 N0 μ2 B . kT Die Größe N0 μ2 kT wird als magnetische Suszeptibilität bezeichnet, die Tatsache, dass sich diese für große Temperaturen wie χ ∼ 1/T verhält, ist das Curiesche Gesetz. χ= Dagegen sind im Limes kleiner Temperaturen (μB kT ) die Spins im Grundzustand eingefroren und man erhält μ̄z μ bzw. M̄0 N0 μ. Wir wollen uns jetzt überlegen, welche statistischen Schwankungen in einem System von N Spins mit magnetischem Moment μ auftreten. (Dabei muss vorausgesetzt werden, dass die verschiedenen Spins im Prinzip an verschiedenen Gitterpunkten lokalisierbar sind.) Wir haben oben die Zustandssumme für ein magnetisches Moment berechnet: Z1 = 2 cosh(βμB). Die Zustandssumme von N schwach miteinander wechselwirkenden magnetischen Momenten ist daher ZN = Z1N = 2N coshN (βμB). Wie bereits besprochen, kann man das mittlere magnetische Moment eines Spins durch differenzieren von Z1 nach βB erhalten: μ̄z = μ tanh(βμB). Durch nochmaliges Differenzieren ergibt sich das Schwankungsquadrat des magnetischen Moments: ∂ μ̄z ∂ eβμB μ − e−βμB μ = ∂(βμ) ∂(βμ) Z1 βμB 2 −βμB e μ +e (−μ)2 μ2 (eβμB − e−βμB )2 = − Z1 Z12 = μ2z − (μ̄z )2 = (Δμz )2 . KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE 14 ⇒ = (Δμz )2 = μ2 . cosh2 (βμB) Für den Erwartungswert des gesamten magnetischen Moments aller N Spins erhält man daher ∂ ln Z ∂(βB) ∂ ∂ ln(2N coshN (βμB)) = N cosh(βμB) . = ∂(βB) ∂(βB) (1) (2) (n) M = μz + μz + . . . + μz = μ̄z Analog erhält man für das Schwankungsquadrat von M: (ΔM)2 = ⇒ ΔM = M ∂M = N(Δμz )2 , ∂(βB) √ 1 Δμz 1 1 N Δμz =√ =√ , N μ̄z N μ̄z N sinh(βμB) wird für großes N (makroskopisches d.h. die relative Schwankung ΔM/M √ System) verschwindend klein (∼ 1/ N ) Bemerkung: Im thermodynamischen Limes (N → ∞) besteht, wegen des Verschwindens der relativen Schwankungen, zwischen mikrokanonischem und kanonischem Ensemble kein Unterschied mehr. Da die Berechnung der kanonischen Zustandssumme Z i.A. einfacher ist als die Ermittlung der Anzahl Ω(E, δE) der Zustände in einem Energieintervall beim mikrokanonischen Ensemble, wird die Verwendung des kanonische Ensembles bei praktischen Rechnungen bevorzugt. Aufgabe: Behandeln Sie die Theorie des Paramagnetismus mit Hilfe des mikrokanonischen Ensembles. 2.7 Großkanonisches Ensemble Kann ein Subsystem A mit einem großen System B nicht nur Energie, sondern auch Teilchen austauschen, so gelangt man im Gleichgewicht zur großkanonischen Verteilung. Der Hamiltonoperator des Systems A werde mit H und der Teilchenzahloperator mit N bezeichnet. Wir nehmen an, dass H und N vertauschen und es daher eine gemeinsame Orthonormalbasis {|n} von Eigenvektoren der beiden Operatoren gibt: H|n = En |n, N|n = Nn |n. 2.7. GROSSKANONISCHES ENSEMBLE 15 Zum Ausdruck für den Dichteoperator des großkanonischen Ensembles gelangt man wieder am einfachsten dadurch, dass man das Maximum der Entropie bei vorgegebener mittlerer Energie E und mittler Teilchenzahl N bestimmt: H = E, N = N . Wir bestimmen das Maximum der Funktion pn )+β(E− pn En )+α(N− pn Nn ). f (p1 , p2 , . . . , λ, β, α) = − pn ln pn +λ(1− n n n n ∂f = 0 = − ln pm − 1 − λ − βEm − αNm ∂pm ⇒ pn = Ce−βEn −αNn Wir definieren das chemische Potential μ = α/β und erhalten pn = Ce−β(En −μNn ) . Die Konstante C ist wieder durch die Normierungsbedingung pn = 1 n festgelegt: pn = 1 −β(En −μNm ) , e Y Y = e−β(En −μNm ) . n Y wird als großkanonische Zustandssumme bezeichnet. Der Dichteoperator des großkanonischen Ensembles hat daher die Form: ρGK = 1 −β(H−μN ) e , Y Y = Tre−β(H−μN ) . 16 KAPITEL 2. GLEICHGEWICHTSZUSTÄNDE Kapitel 3 Thermodynamik Die Thermodynamik kann zwar aus der statistischen Physik hergeleitet werde, sie ist jedoch eine rein makroskopische Theorie, die keinen Bezug auf die mikroskopische Struktur der Materie nimmt. 3.1 Hauptsätze der Thermodynamik Wir betrachten ein System, das durch einen Hamiltonoperator H(x1 , x2 , . . .) beschrieben wird. Die Größen x1 , x2 , . . . sind dabei gewisse äußere Parameter des Systems. Beispiele: 1. Unser betrachtetes System bestehe aus N Spins, die sich in einem äußeren befinden. Der Hamiltonoperator hat (bei vernachlässigbarer Magnetfeld B Spin-Spin-Wechselwirkung) die Form =− H(B) N (k) · B. μ k=1 sind in diesem Fall äußere Parameter Die Komponenten des Magnetfeldes B des Systems. 2. N Teilchen seien in einem Behälter mit dem Volumen V eingeschlossen. V ist ein äußerer Parameter dieses Systems. Befindet sich das System in dem durch den Dichteoperator ρ beschriebenen Zustand, so ist der Erwartungwert der Energie des Systems durch E = Tr H(x1 , x2 , . . .)ρ) 17 KAPITEL 3. THERMODYNAMIK 18 gegeben. In einem thermisch und mechanisch isolierten System ist ρ(t) = exp(−iHt/h̄)ρ(0) exp(iHt/h̄) und E daher zeitlich konstant. Eine Änderung von E kann nun auf zwei verschiedene Arten erfolgen: Entweder durch Änderung eines (oder mehrerer) der äußeren Parameter (das äußere Magnetfeld, in dem sich das Spinsystem befindet, wird geändert; das Volumen des Gasbehälters wird verkleinert). In diesem Fall spricht man von der durch die Änderungen Δx1 , Δx2 , . . . am System geleisteten Arbeit A. Bleiben dagegen alle äußeren Parameter x1 , x2 , . . . des Systems unverändert, so kann eine Änderung von E dennoch durch Wärmeaustausch“ mit der Umgebung stattfinden, bei der ” sich der Dichteoperator ρ ändert. Eine derartige Energieänderung bezeichnet man als die dem System zugeführte Wärme Q. Diese Beobachtungen werden im 1. Hauptsatz der Thermodynamik zusammengefasst: ΔE = A + Q. Bemerkung: Handelt es sich um einen Gleichgewichtszutand, so ist dessen in” nere Energie“ E durch seine Entropie S und die äußeren Parameter x1 , x2 , . . . festgelegt. Die Entropie eines isolierten Systems nimmt zu, bis schließlich der Gleichgewichtszustand erreicht ist, in dem die Entropie ihren maximalen Wert annimmt. Diese Aussage wird als 2. Hauptsatz der Thermodynamik bezeichnet: ΔS ≥ 0 Bei nicht isolierten Systemen, sind sogenannte quasistatische Prozesse besonders wichtig. Darunter versteht man einen Vorgang, bei dem das betrachtete System zu jedem Zeitpunkt in guter Näherung durch einen Gleichgewichtszustand beschrieben werden kann. Die Zeit, in der eine Änderung des Systems erfolgt, muss dabei viel größer sein als die typischen Relaxationszeiten des Systems. In diesem Fall besteht zwischen der dem System zugeführten Wärme δQ und der dabei erfolgten Entropieänderung der Zusammenhang dS = δQ . T Dazu müssen wir uns nur an einige Formeln erinnern, die wir für das mikrokanonische Ensemble hergeleitet hatten. Die Entropie war durch S = k ln Ω(E, δE) und der Zusammenhang mit der absoluten Temperatur durch ∂ ln Ω(E, δE) 1 = ∂E kT 3.2. EINFACHE ANWENDUNGEN 19 gegeben. Kombiniert man beide Gleichungen, so erhält man 1 ∂S = . ∂E T Diese Gleichung kann man so interpretieren: Ändert man die innere Energie des Systems ohne Änderung seiner äußeren Parameter um den Betrag δQ (zugeführte Wärme), so ändert sich die Entropie um dS = δQ/T , was gerade die behauptete Relation ist. Schließlich besagt der 3. Hauptsatz, dass die Entropie für T → 0 gegen eine von allen Parametern des Systems unabhängige Konstante S0 strebt: lim S = S0 . T →0 Bemerkung: Der 3. Hauptsatz der Thermodynamik kann durch Betrachtung des kanonischen Ensembles verstanden werden. Werden die voneinander verschiedenen Energien des Systems mit E0 < E1 < . . . und die dazugehörigen Vielfachheiten mit ν0 , ν1 , . . . bezeichnet, so ist die Wahrscheinlichkeit, dass das System die Energie Er besitzt durch νr e−Er /kT νr e−(Er −E0 )/kT pr = −Es /kT = −(Es −E0 )/kT νs e νs e s gegeben. Da für r = 0 gilt, dass Er − E0 echt größer als Null ist, folgt lim e−(Er −E0 )/kT = 0 T →0 und (r = 0) 1 für r = 0 . lim pr = T →0 0 für r = 0 Die Entropie für T → 0 ist daher S0 = ln ν0 , der natürliche Logarithmis des Entartungsgrades des Grundzustands. 3.2 Einfache Anwendungen Wir wollen die Thermodynamik auf ein ideales Gas anwenden. Ein solches wird durch die Zustandsgleichung pV = NkT KAPITEL 3. THERMODYNAMIK 20 beschrieben. Im Rahmen der Thermodynamik ist dies eine rein phänomenologische Beziehung zwischen den Größen p (Druck), V (Volumen) und T (absolute Temperatur), die man für die betrachtete Substanz gefunden hat. (Später werden wir das ideale Gas im Rahmen der statistischen Physik behandeln, der Proportionalitätsfaktor N wird sich dann als die Anzahl der Teilchen in dem betrachteten Gasvolumen herausstellen.) Bei einem quasistatischen Prozess haben wir ganz allgemein dE = δA + T dS, bei einem Gas ist δA = −p dV , sodass wir in diesem Fall die Beziehung dE = −p dV + T dS ⇔ dS = p 1 dE + dV T T erhalten. Wesentlich ist, dass dE und dS totale Differentiale sind, im Gegensatz zu δA = −p dV oder δQ = T dS. Setzen wir nun die Zustandsgleichung für ein ideales Gas ein, so erhalten wir dS = 1 Nk dE + dV. T V Dabei betrachten wir sowohl die Entropie S als auch die innere Energie E als Funktionen der unabhängigen Variablen T und V : S = S(T, V ), E = E(T, V ). Wir schreiben dE in der Form dE = ∂E ∂E dT + dV ∂T ∂V und setzen dies in den obigen Ausdruck für dS ein: 1 ∂E 1 ∂E Nk dS = dT + + dV . T ∂T V T ∂V ∂S ∂T ∂S ∂V Somit erhalten wir ∂ ∂V ∂ ∂T ∂S ∂T ∂S ∂V 1 ∂ ∂E , T ∂V ∂T 1 ∂E 1 ∂ ∂E = − 2 + . T ∂V T ∂T ∂V = Wegen ∂ ∂E ∂ ∂E = , ∂T ∂V ∂V ∂T ∂ ∂S ∂ ∂S = ∂T ∂V ∂V ∂T 3.2. EINFACHE ANWENDUNGEN 21 folgt ∂E = 0, ∂V das heißt die innere Energie eines idealen Gases hängt nicht von dem von ihm eingenommenen Volumen V ab: E = E(T ) (ideales Gas). Bemerkung: Wir betrachten einen thermisch isolierten Behälter, der durch eine bewegliche Trennwand in einen linken und rechten Teil getrennt ist. Ein ideales Gas befinde sich zunächst nur auf der linken Seite der geschlossenen Trennwand, das Gas nehme dabei das Volumen V1 ein. Nun wird die Trennwand geöffnet, das Gas kann sich nun auf das Volumen V2 > V1 verteilen. Da durch das Öffnen der Trennwand keine Arbeit geleistet wird und das System von außen keine Wärme aufnehmen kann, bleibt die innere Energie des Systems konstant. Da diese bei einem idealen Gas nur von der Temperatur, aber nicht vom Volumen abhängt, ändert sich auch die Temperatur bei diesem Expansionsvorgang nicht. Bei einem realen Gas (z.B. van der Waals1 -Gas) ist das nicht der Fall. Hier ist E = E(T, V ) und bei einer Volumsänderung bei konstanter innerer Energie kommt es i.A. auch zu einer Temperaturänderung. 1 Johannes Diderik van der Waals, 1837 Leiden – 1923 Amsterdam. 22 KAPITEL 3. THERMODYNAMIK Kapitel 4 Identische Teilchen Eines der fundamentalen Theoreme der relativistischen Quantenfeldtheorie besagt, dass Teilchen gemäß ihrem Spin in zwei große Klassen eingeteilt werden können. Solche mit ganzzahligem Spin sind verträgliche Wesen, man kann beliebig viele identische Teilchen dieser Art in den gleichen Einteilchenzustand hineinpferchen. Teilchen mit dieser Eigenschaft nennt man Bosonen. Teilchen mit halbzahligem Spin sind unsozial, sie bestehen auf einem Privatzimmer. Nur eines von ihnen kann in einem bestimmten Einteilchenzustand sitzen. Teilchen dieser Art heißen Fermionen. 4.1 Mehrteilchensysteme Ein reiner Zustand eines Systems von zwei unterscheidbaren Teilchen (z.B. ein pe− -System) kann (im Ortsraum) durch eine Wellenfunktion der Form ψ(x1 , σ1 ; x2 , σ2 ) beschrieben werden. Dabei sind x1 , σ1 die Orts-und Spinkoordinaten des ersten Teilchens, x2 , σ2 jene des zweiten. Handelt es sich um ein Zweiteilchensystem identischer (ununterscheidbarer) Teilchen, so gibt es zwei Möglichkeiten: 1. Die Wellenfunktion ist symmetrisch bei gleichzeitiger Vertauschung von Orts- und Spinkoordinaten: ψ(x1 , σ1 ; x2 , σ2 ) = ψ(x2 , σ2 ; x1 , σ1 ). Teilchen von diesem Typ heißen Bosonen1 1 Benannt nach Satyendra Nath Bose, 1894 Kalkutta – 1974 Kalkutta. 23 KAPITEL 4. IDENTISCHE TEILCHEN 24 2. Die Wellenfunktion ist antisymmetrisch bei gleichzeitiger Vertauschung von Orts- und Spinkoordinaten: ψ(x1 , σ1 ; x2 , σ2 ) = −ψ(x2 , σ2 ; x1 , σ1 ). Teilchen von diesem Typ heißen Fermionen2 Im allgemeinen Fall von N ununterscheidbaren Teilchens ist ψ(x1 , σ1 ; x2 , σ2 ; . . . xN , σN ) im Fall von Bosonenen total symmetrisch und im Fall von Fermionen total antisymmetrisch, d.h. bei einer Vertauschung (xi , σi ) ↔ (xj , σj ) (i = j) ändert sich bei Bosonen die Wellenfunktion nicht, bei Fermionen wechselt sie das Vorzeichen. Die Tatsache, dass die Wellenfunktion eines Systems von identischen Fermionen bei Vertauschung zweier Argumente (xi , σi ) ↔ (xj σj ) das Vorzeichen wechselt, wird auch als Pauli-Prinzip3 oder (Paulisches) Ausschließungsprinzip bezeichnet. Für Fermionen gilt nämlich ψ(x, σ; x, σ) = −ψ(x, σ; x, σ) ⇒ ψ(x, σ; x, σ) = 0, d.h. zwei Fermionen mit gleicher Polarisation können nicht am gleichen Ort sitzen. Allgemein gilt folgendes: Gegeben sei eine Orthonormalbasis von Einteilchenwellenfunktionen φn (x, σ). Jede Zweiteilchenwellenfunktion kann dann in der Form ψ(x1 , σ1 ; x2 , σ2 ) = cmn φm (x1 , σ1 )φn (x2 , σ2 ) m,n geschrieben werden. Für Fermionen folgt aus ψ(x1 , σ1 ; x2 , σ2 ) = −ψ(x2 , σ2 ; x1 , σ1 ), dass cmn = −cnm und insbes. cnn = 0. Befindet sich bereits ein Fermion im Einteilchenzustand φn , so ist dieser Zustand für das zweite Fermion ausgeschlossen. Für Bosonen ist die Situation anders: Hier folgt aus ψ(x1 , σ1 ; x2 , σ2 ) = ψ(x2 , σ2 ; x1 , σ1 ), dass cmn = cnm und zwei identische Bosonen können sehr wohl im gleichen Einteilchenzustand sitzen. 2 3 Benannt nach Enrico Fermi, 1901 Rom – 1954 Chikago. Wolfgang Pauli, 1901 Wien – 1958 Zürich. 4.1. MEHRTEILCHENSYSTEME 25 Es war zunächst nur empirisch bekannt, dass Teilchen mit halbzahligem Spin (z.B. Elektron, Proton) Fermionen und Teilchen mit ganzzahligem Spin (z.B. Photon, 4 He) Bosonen sind. Im Jahr 1940 konnte Wolfgang Pauli zeigen, dass dieser Zusammenhang zwischen Spin und Statistik“ aus der relativistischen ” Quantenfeldtheorie (Kombination von Relativitätstheorie und Quantentheorie) folgt. Beispiel: Identische Teilchen in einem würfelförmigen Gefäß G = [0, L] × [0, L] × [0, L] mit dem Volumen V = L3 . Der Einteilchen-Hamiltonoperator hat in der Ortsdarstellung die Form h̄2 ∂ 2 ∂2 ∂2 + + H1 = − 2m ∂x2 ∂y 2 ∂z 2 Die Energieeigenzustände eines Teilchens mit Spin s sind daher durch die Einteilchenwellenfunktionen 3/2 πx x 2 πy y πz z φ,τ = δτ σ sin sin sin L L L L gegeben, mit x,y,z = 1, 2, . . . und τ = −s, −s + 1, . . . , +s. Dabei wurde die Randbedingung φ = 0 verwendet. Die zum Zustand φ,τ gehörende Energie ist ∂G ε,τ = h̄2 π 2 2 h̄2 π 2 2 = . 2mL2 2mV 2/3 Bringt man N nicht wechselwirkende Teilchen in das Gefäß und fragt sich z.B. nach der Grundzustandenergie des N-Teilchen-Systems, so kann man im Fall von Bosonen alle N Teilchen in den Einteilchenzustand mit niedrigster Energie setzen. Bei Fermionen ist dies wegen des Paulischen Ausschließungsprinzips nicht möglich. Aufgaben: Ermitteln Sie die Grundzustandsenergie eines Systems von N identischen Teilchen mit Spin s für 1. s = 0, N = 4 (Lösung: 6h̄2 π 2 /mV 2/3 ) 2. s = 1/2, N = 4 (Lösung: 9h̄2 π 2 /mV 2/3 ) Hinweis: Fertigen Sie Skizzen der zu besetzenden Einteilchen-Energieniveaus an. KAPITEL 4. IDENTISCHE TEILCHEN 26 4.2 Quantenstatistik Teilchen nicht wechselwirkender Gegeben sei ein Einteilchen-Hamiltonoperator H1 mit Energieeigenvektoren |r (r = 1, 2, . . .) und dazugehörigen Energieeigenwerten εr . Unter der Voraussetzung nicht wechselwirkender Teilchen kann man die Energieeigenzustände des Mehrteilchensystems |n1 , n2 , . . . , nr , . . . festlegen, wobei nr die Besetungszahl des r-ten Einteilchenzustands ist. Die Besetungszahlen können folgende Werte annehmen: 0, 1, 2, . . . für Bosonen nr = . 0, 1 für Fermionen Bezeichnet man den Teilchenzahloperator des Mehrteilchensystems mit N und den Hamiltonoperator mit H, so ist |n1 , n2 , . . . , nr , . . . ein gemeinsamer Eigenvektor beider Operatoren: N|n1 , n2 , . . . , nr , . . . = (n1 + n2 + . . . + nr + . . .)|n1 , n2 , . . . , nr , . . ., H|n1 , n2 , . . . , nr , . . . = (n1 ε1 + n2 ε2 + . . . + nr εr + . . .)|n1 , n2 , . . . , nr , . . .. Wir verwenden das großkanonische Ensemble mit Dichtematrix ρGK und großkanonischer Zustandssumme Y : ρGK = 1 −β(H−μN ) , e Y Y = Tre−β(H−μN ) . Daraus erhalten wir für die Wahrscheinlichkeit, dass sich das System im Zustand |n1 , n2 , . . . , nr , . . . befindet den Wert pn1 ,n2 ,... = und für die Zustandssumme Y 1 −β(n1 ε1 +n2 ε2 +...−μ(n1 +n2 +...)) e Y = e−β(n1 ε1 +n2 ε2 +...−μ(n1 +n2 +...)) n1 ,n2 ,... = n1 e−β(ε1 −μ)n1 e−β(ε2 −μ)n2 . . . . n2 Y1 Man muss also nur die Summe nr Y2 e−β(εr −μ)nr 4.2. QUANTENSTATISTIK NICHT WECHSELWIRKENDER TEILCHEN 27 berechnen. Für Bosonen läuft die Summation über nr = 0, 1, 2, . . . (unendliche Summe), während für Fermionen nur über nr = 0, 1 summiert wird. Dies ergibt: ⎧ 1 ⎨ für Bosonen −β(ε r −μ) Yr = 1 − e ⎩1 + e−β(εr −μ) für Fermionen Wir wollen nun die mittlere Besetungszahl n̄r des r-ten Einteilchenzustands berechnen. In der entsprechenden Summe pn1 ,n2 ,...nr n̄r = n1 ,n2 ,... kürzen sich alle Terme bis auf jene mit nr weg und man erhält n̄r = − 1 ∂ 1 ∂ ln Yr = − ln Y. β ∂εr β ∂εr Für Bosonen erhält man die sogenannte Bose-Einstein4 -Verteilung: n̄r = 1 eβ(εr −μ) Bemerkung: Durch die Formel N= n̄r = r r −1 . 1 eβ(εr −μ)−1 wird ein Zusammenhang zwischen der mittleren Gesamtteilchenzahl N und dem chemischen Potential μ hergestellt. Für den Spezialfall μ = 0 erhält man aus der Bose-Einstein-Verteilung die Photonverteilung, welche der Situation entspricht, dass die Gesamtteilchenzahl nicht eingeschränkt ist: 1 . n̄r = βεr e −1 Diese wird auch als Planckverteilung5 bezeichnet. Für Fermionen erhält man die Fermi-Dirac6 -Verteilung n̄r = 1 eβ(εr −μ) +1 . Man sieht, dass n̄r (wie es sein muss) nur zwischen dem Minimalwert 0 und dem maximal möglichen Wert 1 liegen kann. 4 Albert Einstein, 1879 Ulm – 1955 Princeton. Benannt nach Max Planck, 1858 Kiel – 1947 Göttingen. 6 Paul Adrien Maurice Dirac, 1902 Bristol – 1984 Tallahassee. 5 KAPITEL 4. IDENTISCHE TEILCHEN 28 Bemerkung: Wieder besteht zwischen dem chemischen Potential μ und der mittleren Teilchenzahl 1 N= n̄r = β(ε −μ) e r +1 r r ein eindeutiger Zusammenhang. Für den Logarithmus der großkanonischen Zustandsumme hat man die Formeln ln(1 ± e−β(εr −μ) ) (+ f ür FD, − f ür BE). ln Y = ± r Daraus erhält man ∂ ln Y ∂β 1 ∂ ln Y β ∂μ − 4.3 = H − μN = E − μN, = N Maxwell-Boltzmann-Statistik Falls für alle r gilt, dass n̄r 1, dann verschwindet der Unterschied zwischen BE- und FD-Statistik: n̄r → eβμ e−βεr 1 Aus N= n̄r = eβμ r folgt N eβμ = n̄r ⇒ r ln Y r = ± → e−βεr n̄r = N n̄r ln(1 ± e−β(εr −μ) ) r e−β(εr −μ) = N. r Die Situation, dass alle mittleren Besetzungszahlen viel kleiner als 1 sind, entspricht dem klassischen Limes. Die entsprechende Verteilung wird als Maxwell7 Boltzmann-Verteilung bezeichnet. Bemerkung: Bei einem Gas entspricht der klassische Limes bei festgehaltener Temperatur dem Grenzfall kleiner Dichte (N klein), bzw. bei festgehaltenem N dem Limes großer Temperatur (β klein). 7 James Clark Maxwell, 1831 Edinburgh – 1879 Cambridge. 4.4. IDEALES GAS IM KLASSISCHEN LIMES 4.4 29 Ideales Gas im klassischen Limes Die Energieeigenfunktionen eines Teilchens mit Spin 0 und Masse m, das sich in einem Behälter G = [0, Lx ] × [0, Ly ] × [0, Lz ] befindet, sind 1/2 1/2 1/2 2 2 πx x πy y πz z 2 sin sin sin , φx ,y ,z (x, y, z) = Lx Ly Lz Lx Ly Lz (4.1) x,y,z = 1, 2, . . . , mit dazugehörigen Energieeigenwerten 2y h̄2 π 2 2x 2z + + εx ,y ,z = . 2m L2x L2y L2z Berechnung der großkanonischen Zustandssumme im klassischen Limes: e−β(εr −μ) ln Y = eβμ r = eβμ 2 2 − βh̄2mπ e 2 2 x + y 2 L2 L x y 2 + z2 Lz x ,y ,z βμ = e ∞ − e βh̄2 π 2 2 x 2mL2 x x =1 Man muss also die Summe ∞ − e βh̄2 π 2 2 y 2mL2 y y =1 ∞ e− ∞ − e βh̄2 π 2 2 z 2mL2 z z =1 βh̄2 π 2 2 2mL2 =1 berechnen. Da die Abmessungen Lx,y,z eines makroskopischen Behälters viel größer sind als die typische de Broglie8 -Wellenlänge des Teilchens, kann diese Summe mit hervorragender Genauigkeit durch das Integral ∞ 2 βh̄2 π 2 2 2πmL m 1 L − d e 2mL2 = 2 2 = 2 βh̄ π h̄ 2πβ 0 approximiert werden. ⇒ 8 3/2 m V ln Y = e , h̄3 2πβ βμ Louis de Broglie, 1892 Dieppe – 1987 Louveciennes. V = Lx Ly Lz . KAPITEL 4. IDENTISCHE TEILCHEN 30 Somit hat man 1 ∂ ln Y = ln Y, β ∂μ 3/2 ∂ m 3 −5/2 βμ V E − μN = − ln Y = −μN + e β 3 ∂β 2 h̄ 2π Somit folgt für die innere Energie eines monoatomaren Gases: ⇒ E= 3 3N = N kT. 2β 2 Welche Kraft übt ein Teilchen, das sich im Einteilchenzustand |r befindet, auf die rechte Wand aus? 6y Ly Fr - - Lx x ∂εr . ∂Lx Die von allen Teilchen auf die rechte Wand ausgeübte mittlere Kraft ist daher ∂εr F = n̄r − . ∂Lx r Fr ΔLx = −Δεr ⇒ Fr = − Im klassischen Limes ist n̄r = eβμ e−βεr und man erhält ∂εr 1 ∂ βμ −βεr βμ −βεr F = e e e e . − = ∂L β ∂L x x r r ln Y ⇒ 1 ∂ βμ Lx Ly Lz F = e β ∂Lx h̄3 m 2πβ 3/2 = 1N . β Lx 4.4. IDEALES GAS IM KLASSISCHEN LIMES Der (mittlere) Druck ist daher p̄ = F NkT 1N = . = Ly Lz βV V Das ist die Zustandsgleichung eines idealen Gases. Bemerkung: Man hätte auch p̄ = verwenden können. 1 ∂ ln Y β ∂V 31 32 KAPITEL 4. IDENTISCHE TEILCHEN Kapitel 5 Photonen 5.1 Energie des elektromagnetischen Feldes Die Grundgleichungen der (zunächst nichtquantisierten) Elektrodynamik werden durch die Maxwellschen Gleichungen und den Ausdruck für die Lorentzkraft1 zusammengefasst. Im SI-System haben diese die folgende Form: SI ∂B SI , = − rot E ∂t SI = ρSI /ε0 , div E SI ∂E SI SI c rot B , = j /ε0 + ∂t SI + v × B SI . F = q SI E 2 SI = 0, div B Im SI-System tritt nicht nur das historische Relikt ε0 = 8.854 . . . × 10−12 F m−1 auf, sondern zu allem Überdruss haben auch noch das elektrische und magnetische Feld verschiedene Dimensionen, obwohl es sich doch um Größen handelt, die beim Übergang von einem Inertialsystem auf ein anderes untereinander vermischt werden. Durch eine Reskalierung der elektromagnetischen Größen (mechanische Größen bleiben unverändert), = √ε 0 E SI , E √ ρ = ρSI / ε0 1 SI , = c √ε 0 B B √ ⇒ j = j SI / ε0 Benannt nach Hendrik Antoon Lorentz, 1853 Arnheim – 1928 Haarlem. 33 KAPITEL 5. PHOTONEN 34 gelangt man zu den elektromagnetischen Grundgleichungen im Heaviside2 System: = ρ, = − 1 ∂B , divE rot E c ∂t = j/c + 1 ∂ E , = 0, rot B div B c ∂t . + v × B F = q E c In dieser Form ist auf einen Blick zu sehen, dass lediglich die Lichtgeschwindigkeit c die einzige in der klassischen (nichtquantisierten) elektromagnetischen Theorie auftretende Naturkonstante ist. Wir betrachten nun ein dreidimensionales Gebiet V , in dem sich ein elektro x), B(t, x) und Punktteilchen mit Massen m(a) und magnetischisches Feld E(t, (a) Ladungen q befinden. Die Teilchen bewegen sich auf den Trajektorien r (a) (t). Ich behaupte nun, dass das elektromagnetische Feld den Beitrag 1 Feld 2 + B 2) d 3 x (E EV = 2 V zu der in V enthaltenen Gesamtenergie liefert. Um dies zu sehen, betrachten wir die zeitliche Änderung des obigen Ausdrucks: d Feld E = dt V ∂E ∂B +B· d x E· ∂t ∂t 3 V · (c rot B − j) + B · (−c rot E)] d3 x [E = V = − +c d x j · E · rot B −B · rot E). d 3 x (E 3 V V Unter Verwendung der Abkürzungen v (a) = dr (a) (t) , dt (a) = E t, r (a) (t) E können wir das erste Integral in der letzten Zeile folgendermaßen schreiben: = (a) . d3 x j · E q (a)v (a) · E V 2 a∈V Oliver Heaviside, 1850 London – 1925 Torquay. 5.1. ENERGIE DES ELEKTROMAGNETISCHEN FELDES 35 Das ist aber nichts anderes als die Leistung, die an den in V befindlichen geladenenen Teilchen vom elektrischen Feld verrichtet wird (das Magnetfeld leistet keine Arbeit), da (a) dE (a) (a) + v × B (a) , (a) ) = q (a)v (a) · E = q (a)v (a) · (E dt c wobei m(a) c2 E (a) = 1 − v (a) · v (a) /c2 die Energie des a-ten Teilchens ist. Wir sehen also, dass d Feld (a) · rot B −B · rot E). E = c d 3 x (E EV + dt a∈V V Das hier verbliebene Integral wollen wir noch weiter umformen. Der Integrand lässt sich nämlich als Divergenz eines Vektorfeldes schreiben! Unter Verwendung von Indexschreibweise und Summenkonvention erhält man tatsächlich Ei εijk ∇j Bk − Bk εkji∇j Ei = εijk ∇j (Ei Bk ) = −∇j (εjik Ei Bk ) × B). = −div(E Wir können nun den Satz von Gauß3 anwenden und das auf der rechten Seite stehende Volumsintegral in ein Oberflächenintegral umwandeln: d Feld (a) × B. + E = − df c E E dt V a∈V ∂V Wie man sieht, kann = cE ×B S als Energiestromdichte des elektromagnetischen Feldes interpretiert werden. Diese Größe wird auch als Poyntingvektor4 bezeichnet. Aufgabe: Den obigen Ausdruck für die Energiebilanz kann man auch auf folgende Weise erhalten: Man zeigt mit Hilfe der Maxwellschen Gleichungen, dass die Energiedichte 1 2 2 u = (E +B ) 2 die Kontinuitätsgleichung und der Poyntingvektor S ∂u = −j · E + div S ∂t erfüllen. Bemerkung: Durch analoge Überlegungen kann man zeigen, dass die Impuls 2 gegeben ist. dichte des elektromagnetischen Feldes durch S/c 3 4 Carl Friedrich Gauß, 1777 Braunschweig – 1855 Göttinge.n Benannt nach John Henry Poynting, 1852 Monton – 1914 Birmingham. KAPITEL 5. PHOTONEN 36 5.2 Freies elektromagnetisches Feld Im ladungs- und stromfreien Raum (ρ = 0, j = 0) lauten die Maxwellschen Gleichungen: = − 1 ∂B , rot E c ∂t 1 ∂E = rot B , c ∂t = 0, divE = 0. div B Wir wollen nun die allgemeine Lösung dieses Systems von partiellen Differentialgleichungen suchen. Unter Verwendung der Formel rot rot = −Δ + grad div finden wir, dass sowohl das elektrische als auch das magnetische Feld die (freie) Wellengleichung erfüllen: 1 ∂2E = 0, − ΔE c2 ∂t2 1 ∂2B = 0. − ΔB c2 ∂t2 Insbesondere erfüllt jede einzelne Komponente dieser Felder die Wellengleichung 1 ∂2f − Δf = 0. c2 ∂t2 Um nun die allgemeine Lösung dieser Gleichung zu finden, erlegen wir der Funktion f (t, x) periodische Randbedingungen in einem Würfel mit Kantenlänge L auf: f (t, x + L, y, z) = f (t, x, y + L, z) = f (t, x, y, z + L) = f (t, x, y, z). Das wäre an sich nicht nötig, vereinfacht jedoch die weitere Diskussion. Die Funktionen exp(ikx x) exp(iky y) exp(ikz z) exp(ik · x) √ √ √ √ = , V L L L k = 2π , L ∈ 3 , V = L3 bilden ein vollständiges Orthonormalsystem für den oben besprochenen Raum periodischer Funktionen mit dem Skalarprodukt L L dx 0 L dy 0 ∗ dz g(x, y, z) h(x, y, z) = 0 V d3 x g(x)∗ h(x). 5.2. FREIES ELEKTROMAGNETISCHES FELD 37 Wie man leicht nachrechnet, ist tatsächlich die Orthonormierungsrelation exp(−ik · x) exp(ik · x) √ √ d3 x = δkk V V V erfüllt. Das Funktionenystem ist vollständig, das heißt man kann jede periodische Funktion f (x) als Fourierreihe5 schreiben: f (x) = exp(ik · x) √ ck . V k Unter Verwendung der Orthonormierungsrelation kann man die Fourierkoeffizienten durch die Formel exp(−ik · x) √ ck = d3 x f (x) V V aus der Funktion f (x) gewinnen. Um nun die allgemeine Lösung der Wellengleichung zu finden, schreiben wir die Funktion f (t, x) als Fourierreihe: f (t, x) = exp(ik · x) √ ck (t). V k Da die Funktion f (t, x) jetzt zusätzlich zeitabhängig ist, hängen natürlich auch ihre Fourierkoeffizienten von t ab. Einsetzen in die Wellengleichung und Beachtung der linearen Unabhängigkeit der Basisfunktionen ergibt, dass die Fourierkoeffizienten ck (t) Lösungen der folgenden gewöhnlichen Differentialgleichung zweiter Ordnung sein müssen: d2 ck (t) = c2k 2 ck (t). dt2 Das ist natürlich nichts anderes als die Schwingungsgleichung eines harmonischen Oszillators mit Kreisfrequenz ωk = c k . Die allgemeine Lösung für ck (t) ist daher eine Linearkombination der Funktionen exp(±iωk t): ck (t) = ak exp(−iωk t) + bk exp(iωk t) und 1 exp(ik · x) ak exp(−iωk t) + bk exp(iωk t) f (t, x) = √ V k 5 Benannt nach Joseph Fourier, 1768 Auxerre – 1830 Paris. KAPITEL 5. PHOTONEN 38 ist die gesuchte allgemeine Lösung der Wellengleichung, es handelt sich um eine Überlagerung von ebenen Wellen. Ist man nur an reellen Lösungen interessiert, so muss die Beziehung bk = a∗−k gelten und man kann die Lösung in der Form 1 i(k·x−ω t) −i(k· x−ωk t) ∗ k a + e e ak f (t, x) = √ k V k schreiben. Wir betrachten nun eine spezielle Lösung für das elektrische Feld in Form einer ebenen Welle mit Wellenzahlvektor k: N i(k·x−ω t) −i(k· x−ωk t) ∗ x) = √ k a + e e a ε. E(t, V N ist ein an dieser Stelle an sich überflüssiger reeller Normierungsfaktor und ε ein Einheitsvektor, der die Polarisationsrichtung des elektrischen Feldes angibt. x) in die bisher noch nicht verwendete Maxwellgleichung divE =0 Setzen wir E(t, ein, so stellen wir fest, dass der Polarisationsvektor ε auf den Wellenzahlvektor normal stehen muss: k · ε = 0. Es gibt also zu einem vorgegebenen Wellenzahlvektor k zwei linear unabhängige Polarisationsmöglichkeiten des elektrischen Feldes (normal auf k). Mit Hilfe der Maxwellschen Gleichung = − 1 ∂B rot E c ∂t finden wir die Lösung x) = k × E(t, x) B(t, k für das Magnetfeld Die beiden restlichen Maxwellschen Gleichungen, = rot B 1 ∂E , c ∂t = 0, div B sind damit automatisch erfüllt. Im Fall einer ebenen elektromagnetischen Welle stehen also das elektrische Feld und das Magnetfeld normal aufeinander, im Hea und B schwingen beide transversal visidesystem haben sie den gleichen Betrag. E B, k bilden ein Rechtssystem). Im vorliegenden Fall zum Wellenzahlvektor k (E, erhält man für die Energiedichte daher 1 2 2 2 u = (E +B )=E 2 5.2. FREIES ELEKTROMAGNETISCHES FELD 39 und für den Poyntingvektor = cE ×B = cu k , S k das heißt die Feldenergie strömt tatsächlich in die Ausbreitungsrichtung der ebenen Welle. Für die gesamte, im Volumen V enthaltenene Feldenergie erhalten wir E = d3 x u = N 2 (aa∗ + a∗ a) V und für den Gesamtimpuls des Feldes 2 = N k (aa∗ + a∗ a) = E k . P = d3 x S/c c k c k V Die allgemeine Lösung der freien Maxwellschen Gleichungen erhält man nun wie vorhin durch Superposition aller möglichen ebenen Wellen: N x) = √ k ei(k·x−ωk t) ak,λ + e−i(k·x−ωk t) a∗k,λ εk,λ , E(t, V k,λ k N x) = √ k ei(k·x−ωk t) ak,λ + e−i(k·x−ωk t) a∗k,λ × εk,λ . B(t, V k k,λ Dabei bezeichnet der Index λ = 1, 2 die beiden möglichen Polarisationsrichtun gen. Die Vektoren εk,1 und εk,2 bilden zusammen mit k/ k eine Orthonormalbasis im dreidimensionalen Raum. Die Gesamtenergie des im Volumen V befindlichen elektromagnetischen Feldes ist E= Nk2 (ak,λ a∗k,λ + a∗k,λ ak,λ ) k,λ und der Impuls des Feldes ist durch P = N2 k (ak,λ a∗k,λ + a∗k,λak,λ ) c k k k,λ gegeben. Das freie elektromagnetische Feld kann man daher als System von unendlich vielen ungekoppelten harmonischen Oszillatoren interpretieren. Zu jedem (k, λ) gibt es einen derartigen Oszillator mit Kreisfrequenz ωk = c k . KAPITEL 5. PHOTONEN 40 5.3 Feldquantisierung Die Quantisierung des freien elektromagnetischen Feldes ist nun kein Problem mehr, wir wissen ja bereits wie man einen harmonischen Oszillator quantisiert! Wir befördern die Fourierkoeffizienten a∗k,λ , ak,λ zu Erzeugungs- und Vernich- tungsperatoren (Leiteroperatoren) a†k,λ , ak,λ . Wenn wir die noch unbestimmten Normierungsfaktoren Nk,λ so wählen, dass Nk2 = h̄ωk /2 ist, dann müssen die Erzeugungs- und Vernichtungsoperatoren die Vertauschungsrelationen ak,λ , a†k ,λ = δkk δλλ , ak,λ , ak,λ = 0 erfüllen. Aus dem Ausdruck für die Gesamtenergie des Systems wird nun der Hamiltonoperator h̄ω h̄ω k k (ak,λ a†k,λ + a†k,λ ak,λ ) = + h̄ωk a†k,λ ak,λ . 2 2 k,λ k,λ k,λ Die hier auftretende unendlich große Energie des Grundzustands (Vakuumenergie) kann man durch eine Verschiebung des Energienullpunktes loswerden. Man definiert einfach H= h̄ωk a†k,λ ak,λ k,λ als Hamiltonoperator. Ganz analog kann man den Impulsoperator des elektromagnetischen Feldes in der Form P = h̄k a†k,λ ak,λ k,λ schreiben. Aufgabe: Man kann leicht überprüfen, dass man auf diese Weise das freie elektromagnetische Feld richtig“ quantisiert hat. In dem hier verwendeten Heisen” bergbild erfolgt die Zeitentwichklung einer Observablen A(t) gemäß der Heisenbergschen Bewegungsgleichung dA(t) i = [H, A(t)] . dt h̄ Berechnen Sie die Kommutatoren x) , x) H, E(t, H, B(t, und verifizieren Sie, dass die entsprechenden Heisenbergschen Bewegungsgleichungen tatsächlich das von den Maxwellschengleichungen geforderte zeitliche Verhalten der Operatoren für das elektrische und magnetische Feld ergeben. 5.4. TEILCHENINTERPRETATION 5.4 41 Teilcheninterpretation Der Grundzustand |0 des Hamiltonoperators des elektromagnetischen Feldes, h̄ωk a†k,λ ak,λ , H= k,λ ist durch ak,λ |0 = 0 ∀ k, λ bestimmt. Somit ist H|0 = 0, P |0 = 0, das heißt die Energie und der Impuls des Grundzustandes sind Null. Wendet man den Erzeugungsoperator a†k,λ auf |0 an, so erhält man wieder einen Eigenzustand von H und P , Ha†k,λ |0 = h̄ωk a†k,λ |0, mit Energieeigenwert P a†k,λ |0 = h̄ka†k,λ |0, E = h̄ωk = h̄c k und Impulseigenwert p = h̄k, das heißt E und p erfüllen die Energie-Impulsbeziehung eines masselosen Teilchens: E = c |p | . Die Anregungen des quantisierten elektromagnetischen Feldes können also als masselose Teilchen interpretiert werden, man nennt sie Photonen (oder Lichtquanten). Der Grundzustandsvektor |0 entspricht der Situation, dass keine Photonen vorhanden sind, man bezeichnet diesen Zustand auch als Vakuumzustand. Der Zustandsvektor a†k,λ |0 beschreibt einen Zustand mit einem einzigen Photon, das den Impuls p = h̄k und die Polarisation λ besitzt. Der Vektor a†k 1 ,λ1 a†k 2 ,λ2 |0, (k1 , λ1 ) = (k2 , λ2 ) beschreibt einen Energie-Impuls-Eigenzustand mit zwei Photonen: Ha†k 1 ,λ1 a†k 2 ,λ2 |0 = (h̄ωk1 + h̄ωk2 )a†k P a†k 1 ,λ1 a†k 2 ,λ2 |0 = (h̄k1 + h̄k2 )a†k 1 ,λ1 1 ,λ1 a†k a†k 2 ,λ2 2 ,λ2 |0, |0. KAPITEL 5. PHOTONEN 42 Allgemein beschreibt |nk1 ,λ1 , nk2 ,λ2 , . . . = (a†k 1 ,λ1 ) nk 1 ,λ1 nk1 ,λ1 ! (a†k 2 ,λ2 ) nk 2 ,λ2 nk2 ,λ2 ! . . . |0 einen Energie-Impuls-Eigenzustand von nk1 ,λ1 Photonen mit gleichen Impulsen h̄k1 und Polarisationen λ1 , nk2 ,λ2 Photonen mit Impulsen h̄k2 und Polarisationen λ2 , und so weiter. Da Photonen Bosonen sind, können beliebig viele von ihnen im gleichen Einteilchenzustand sitzen. Ein beliebiger Zustandsvektor des Photonfeldes lässt sich nun als Linearkombination der so konstruierten Basis der Energie-Impuls-Eigenvektoren erhalten. Kapitel 6 Plancksches Strahlungsgesetz 6.1 Hohlraumstrahlung Wir haben im vorigen Kapitel das freie elektromagnetische Feldes in einem Würfel mit Kantenlänge L und periodischen Randbedingungen betrachtet. Die vorliegende Situation lässt sich auch so interpretieren, dass man die einander gegenüber liegenden Würfelflächen identifiziert. Hätten wir den Fall von nur einer Raumdimension, so ergäbe sich (topologisch gesehen) ein Kreisring, bei zwei Raumdimensionen ein Torus. Klassifiziert man die Eigenschwingungen nach ebenen Wellen der Form exp(ikx x) exp(iky y) exp(ikz z) so kann der Wellenzahlvektor k die möglichen Werte kx = 2πx /L, ky = 2πy /L, kz = 2πz /L, x,y,z ∈ annehmen. Bei vorgegebenem k können zwei Ploarisationsrichtungen (λ = 1, 2) auftreten. Die dazugehörige Kreisfrequenz ist durch 2πc 2 2 2 2 ωk = c k = c kx + ky + kz = x + 2y + 2z L gegeben. Wir wollen nun die Anzahl der Schwingungsmoden mit Kreisfrequenz im Intervall [ω, ω + dω] bestimmen. Dazu zählen wir die Anzahl der Gitterpunkte“ ” ∈ 3 , die sich im Gebiet Lω 2πc 2 ≤ 2x + 2y + 2z 43 ≤ L(ω + dω) 2πc 2 KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ 44 befinden, ab. Das Ergebnis müssen wir dann noch mit zwei multiplizieren, um die zwei möglichen Polarisationsrichtungen zu berücksichtigen: 2 Lω Ldω V ω 2dω × 4π × = . 2 2 c3 2πc 2πc π Pol. Kugeloberfläche Schichtdicke Bemerkung: Man kann diese Formel auch so herleiten: Wir berechnen die Anzahl der Schwingungsmoden N (ω) mit Kreisfrequenz ≤ ω. N (ω) ist einfach das doppelte Volumen einer Kugel mit Radius Lω/2πc: 3 V ω3 4π Lω = 2 3. N (ω) = 2 × 3 2πc 3π c Durch Berechnen von N (ω + dω) − N = N (ω)dω = V ω 2dω π 2 c3 erhalten wir das gleiche Ergebnis wie vorhin. Aufgabe: Betrachten Sie statt periodischer Randbedingungen den Fall stehender elektromagnetische Wellen ∼ sin(kx x) sin(ky y) sin(kz z) in einem Würfel mit der Kantenlänge L. Man sich die Situation vorstellen , dass das elektromagnetische Feld in einem Hohlraum mit ideal reflektierenden Wänden eingeschlossen ist. Zeigen Sie, dass sich die Eigenschwingungen des Feldes durch kx = mx π/L, ky = my π/L, kz = mz π/L, mx,y,z ∈ , sowie durch die Angabe der Polarisationsrichtung λ (λ = 1, 2) klassifizieren lassen. Die dazugehörige Kreisfrequenz ist wieder durch ωk = c k = c kx2 + ky2 + kz2 gegeben. Ermitteln Sie die Anzahl der ,,Punkte“ (k, λ), deren Kreisfrequenz im Intervall [ω, ω + dω] liegt. Sie werden feststellen, dass Sie das gleiche Ergebnis wie im Fall periodischer Randbedingungen erhalten. (Die Anzahl der möglichen Schwingungsmoden in einem Volumen V ist von der Wahl der Randbedingungen unabhängig.) Nach der Quantentheorie des elektromagnetischen Feldes (Quantenelektrodynamik) entspricht jedem erlaubten (k, λ) ein Ein-Photon-Zustand mit der Energie Ek = h̄ωk . Da die Energie des Teilchens in diesem Zustand einen scharfen Wert 6.1. HOHLRAUMSTRAHLUNG 45 hat, spricht man auch von einem Energieeigenzustand. Im Fall der periodischen Randbedingungen hat auch der Impuls des entsprechenden Photons einen scharfen Wert, nämlich gerade p = h̄k. Diese Zustände sind also auch Impulseigenzustände. Dagegen entsprechen den stehenden Wellen im Fall des Hohlraums mit reflektierenden Wänden zwar Energieeigenzustände, jedoch keine Impulseigenzustände, sondern Überlagerungen von Zuständen mit entgegengestztem Impuls. Formuliert in der Sprache der Quantentheorie, haben wir also die Anzahl der Energieeigenzustände eines Photons, das sich in einem Gebiet mit dem Volumen V = L3 befindet, im Energieintervall [E, E + dE] bestimmt. Das Ergebnis war von der Wahl der Randbedingungen unabhängig. Befindet sich das Photonsystem im thermischen Gleichgewicht bei einer Temperatur T , so ist die mittlere Besetzungszahl des Einteilchenzustands a†k,λ |0 durch nk,λ = 1 e −1 gegeben (Bose-Einstein-Statistik mit μ = 0). Für die mittlere Energiedichte (Energie/Volumen) der Hohlraumstrahlung. die von den Photonen im Kreisfrequenzintervall [ω, ω + dω] herrührt den Ausdruck βh̄ωk h̄ω ω 2 dω h̄ ω 3 dω . = eβh̄ω − 1 π 2 c3 π 2 c3 eβh̄ω − 1 Verwendet man die dimensionslose Größe h̄ω η = βh̄ω = , kT so ergibt sich der Ausdruck 4 3 kT η dη h̄ . u(ω, T )dω = 2 3 π c h̄ eη − 1 u(ω, T )dω = Durch Integration über alle Frequenzen gelangt man zur totalen Energiedichte: ∞ u(T ) = dω u(ω, T ) 0 h̄ = 2 π c3 kT h̄ 4 ∞ 0 = π2 k4 4 T . 15 (h̄c)3 η3 eη − 1 dη π 4 /15 KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ 46 Diese Formel wird als Stefan1 -Boltzmann-Gesetz bezeichnet. Für kleine Frequenzen η= h̄ω 1 kT kann man die Näherung eη 1 + η verwenden und erhält aus dem allgemeinen Ausdruck für u(ω, T )dω die Rayleigh2 -Jeans3 -Formel u(ω, T )dω kT × ω 2 dω π 2 c3 (f ür h̄ω kT ) Diese von h̄ unabhänge Näherungsformel lässt mit Hilfe der klassischen Elektrodynamik so verstehen: Jeder Schwingungsfreiheitsgrad gibt einen Beitrag kT zur mittleren Energie des Systems, multipliziert mit der Anzahl der Schwingungsmoden im Intervall [ω, ω+dω] ergibt sich der obige Ausdruck. Sie zeigt die Grenze der Anwenbarkeit der klassischen Elektrodynamik. Würde man die Rayleigh-JeansFormel für beliebig große Frequenzen ernst nehmen, so ergäbe sich ein divergenter Ausdruck für die totale Energiedichte: kT π 2 c3 ∞ dω ω 2 = ∞. 0 Dies wird auch als Ultraviolett-Katastrophe der klassischen Elektrodynamik bezeichnet. Wir haben oben gesehen, wie die Quantentheorie dieses Problem löst. Der sogenannte Wiensche4 Grenzfall ergibt sich für große Frequenzen (η 1): u(ω, T )dω h̄ 3 −h̄ω/kT ω e dω π 2 c3 (f ür h̄ω kT ) Oft wird statt u(ωT )dω die Energieverteilung f(λ, T ) bezüglich der Wellenlänge λ = 2πc/ω verwendet: 2πc 2πc ⇒ dω = − 2 dλ λ λ 8πch dλ . f (λ, T )dλ = 5 hc/λkT λ e −1 ω= ⇒ 1 Josef Stefan, 1835 St. Peter (Klagenfurt) – 1893 Wien. John Rayleigh, 1842 Langford Grove – 1919 Terlin Place. 3 James Jeans, 1877 London – 1948 Dorking. 4 Benannt nach Wilhelm Wien, 1864 Fischhausen – 1928 München. 2 6.2. STRAHLUNGSDRUCK 47 Wir wollen nun jene Wellenlänge λmax finden, für welche die Funktion f (λ, T ) (bei festgehaltener Temperatur T ) ihr Maximum annimmt: ∂f (λ, T ) =0 ∂λ λ=λmax 1 hc . −hc/λ max kT λmax kT 1 − e ⇒ 5= η̃ = hc λmax kT Mit Hilfe der Abkürzung können wir diese Gleichung in der Form 5[1 − exp(−η̃)] = η̃ schreiben. Der (nichtriviale) Fixpunkt der Funktion η → 5[1 − exp(−η)] lässt sich durch Iteration ermitteln. Mit dem Startwert η0 = 4.9 erhält man bereits nach der vierten Iteration eine Genauigkeit von 6 Stellen nach dem Dezimalpunkt: η̃ = 4.965114. Damit erhält man das Wiensche Verschiebungsgesetz λmax T = 2.89777 × 10−3 m K Als einfache Anwendung des Wienschen Verschiebungsgesetzes wollen wir die Oberflächentemperatur der Sonne bestimmen. Die Intensitätsverteilung der elektromagnetischen Strahlung in der Photosphäre der Sonne entspricht in guter Näherung der besprochenen Spektralverteilung mit λmax ≈ 500 nm. Somit erhält man für die Oberflächentemperatur der Sonne den Wert T = 6.2 2.9 × 10−3 m K = 5800 K 500 × 10−9 m Strahlungsdruck Den von einem Photonengas auf eine Wand ausgeübten mittleren Druck erhält man mit Hilfe der Formel ∂Ek p= nk,λ − . ∂V k,λ KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ 48 Da die Abhängigkeit der Energie des Photons vom Volumen V durch Ek = h̄cπ h̄cπ |m| = 1/3 |m| L V gegeben ist, erhalten wir − ∂Ek 1 Ek = ∂V 3V und daher p= 6.3 E 1 = u(T ). 3V 3 Schwarzer Strahler Ein kleines Loch in der Wand eines mit elektromagnetischer Strahlung (Photonen) erfüllten Hohlraumes (Temperatur T ) ergibt einen sogenannten schwarzen Strahler. Der Grund für diese Bezeichnung ist der, dass von außen durch das Loch eindringende Strahlung vollständig absorbiert wird. Das Loch eines schwarzen Strahlers der Temperatur T = 0 erscheint vollständig schwarz. Wir wollen die von einer Öffnung mit der Fläche dA in das Kreisfrequenzintervall [ω, ω+dω] abgegebene Strahlungleistung P(ω, T ) dω dA. Die Anzahl der Zustände pro Volumen in [kx , kx + dkx ] × [ky , ky + dky ] × [kz , kz + dkz ] ist 2× d3 k dlx dly dlz =2× . V (2π)3 Die mittlere Photonendichte im obigen k-Bereich ist daher 2 k 2 dk dΩ d3 k 1 1 = 2 , 3 βh̄ω 3 βh̄ω (2π) e −1 (2π) e −1 ω = ck , wobei auf der rechten Seite Kugelkoordinaten verwendet wurden. Somit erhalten wir 2 P(ω, T ) dω dA dt = k 2 dk 3 (2π) 2π π/2 dϕ dθ sin θ cos θ c dt dA 0 0 2π = h̄ω −1 eβh̄ω 1/2 c ω 3 dω h̄ dA dt = u(ω, T ) dω dA dt. 2 2 βh̄ω 4π c e −1 4 6.3. SCHWARZER STRAHLER 49 θ dA Das heißt also, P(ω, T ) = 6 c dt cos θ ? c u(ω, T ). 4 Die Gesamtleistung der von einem schwarzen Strahler pro Fläche abgegebenen Strahlung erhalten wir durch Integration über alle Frequenzen: ∞ c dω P(ω, T ) = 4 0 ∞ c c π 2 (kT )4 dω u(ω, T ) = u(T ) = 4 4 15 (h̄c)3 0 P(T ) ist also proportional zur vierten Potenz der absoluten Temperatur, P(T ) = π2k4 4 3 2 T , 60h̄ c σ der Proportionalitätsfaktor π2 k4 −8 σ= W m−2 K−4 3 2 = 5.67 × 10 60h̄ c wird als Stefan-Boltzmann-Konstante bezeichnet. Bemerkung: Die Strahlungsleistung eines beliebigen Körpers mit Temperatur T ist durch a(ω) P(ω, T ) gegeben, wobei a(ω) der Absorptionskoeffizient des betreffenden Körpers für elektromagnetische Strahlung mir Kreisfrequenz ω ist. Der schwarze Körper mit a(ω) = 1 entspricht maximalem Absorptionsvermögen für einfallende Strahlung und damit maximalem Emissionsvermögen bei vorgegebener Temperatur. Beispiel: Die Strahlungsleistung der Sonne beträgt 2 = 5.67 × 10−8 (5800)4 4π (6.961 × 108 )2 W = 3.9 × 1026 W. σ T4 4π R KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ 50 Für die Solarkonstante erhält man bei einem mittleren Radius der Erdbahn r 1.5 × 1011 m den Wert 2 2 σ T4 4π R R 4 = σ T 1.38 W m−2 2 4π r r Das heißt, der Energiefluss der Sonne auf die Erde beträgt (vor dem Durchgang durch die Atmosphäre) etwa 1.38 kW m−2 . Aufgabe: Geben Sie eine größenordnungsmäßige Abschätzung der entsprechenden Anzahl von Photonen pro Zeit und Fläche. 6.4 Oberflächentemperatur von Planeten Der Zusammenhang zwischen der Oberflächentemperatur der Sonne (T 5800 K) und der Oberflächentemperatur eines Planeten (TP ) kann näherungsweise durch folgende Überlegung erhalten werden: Man fasst sowohl die Sonne als auch den Planeten als schwarze Strahler auf und nimmt weiters an, dass die gesamte von der Sonne auf den Planeten eingestrahlte Leistung auch wieder abgestrahlt wird. Weiters ist zu beachten, dass der Planet nur auf der der Sonne zugewandten Seite Strahlung aufnehmen kann, diese jedoch (falls Tag Jahr) in alle Richtungen abgibt. Bezeichnungen: T TP R LP RP σ ... ... ... ... ... ... Temperatur der Sonne Temperatur des Planeten Radius der Sonne (mittlerer) Abstand Planet − Sonne Radius des Planeten Stefan−Boltzmann−Konstante von der Sonne abgestr. Leistung 2 σT4 4π R × RP2 π 4πL2P = σ T 4 4π R2 P P vom Planeten abgestrahlte Leistung vom Planeten aufgenommene Leistung ⇒ das Endergebnis hängt nicht von σ und auch nicht vom Radius des Planeten ab: R TP = T , T 5800 K, R = 6.961 × 108 m. 2LP 6.4. OBERFLÄCHENTEMPERATUR VON PLANETEN 51 Erde: L = 1.496 × 1011 m ⇒ T 280 K = 7◦ C Venus: L = 1.082 × 1011 m ⇒ T 392 K = 56◦ C Mars: L = 2.279 × 1011 m ⇒ T 227 K = −46◦ C Merkur: L 0.5 × 1011 m. In diesem Fall ist die obige Formel nicht gut, da ein Merkurtag 59 Erdtage beträgt, das Merkurjahr jedoch 88 Erdtage. Man verwendet daher R T 635 K. TMerkur = LMerkur (Die tatsächliche Maximaltemperatur auf dem Merkur beträgt etwa 700 K). 52 KAPITEL 6. PLANCKSCHES STRAHLUNGSGESETZ Anhang A Unitäre Vektorräume Die Verwendung des Grundkörpers der komplexen Zahlen besitzt eine Reihe von rechentechnischen Vorteilen. Will man etwa die Eigenwerte einer n × n-Matrix bestimmen, so besitzt das dazugehörige charakteristische Polynom über stets n (eventuell teilweise zusammenfallende) Nullstellen, was über ja bekanntlich nicht der Fall zu sein braucht. Darüberhinaus ist die Theorie der unitären Vektorräume in der Physik von allergrößter Bedeutung, handelt es sich dabei doch um jene mathematischen Methoden, die in der Quantentheorie ihre natürliche Anwendung finden. Wir beschränken uns hier ausschließlich auf den endlichdimensionalen Fall. Es sei jedoch darauf hingewiesen, dass die hier dargestellte Theorie ihre volle Bedeutung erst im unendlichdimensionalen Fall erlangt, wo sie im Rahmen der Funktionalanalysis in die Theorie der (unendlichdimensionalen) Hilberträume übergeht. A.1 Komplexes Skalarprodukt Definition: Ein (endlichdimensionaler) Vektorraum H über heißt unitär (oder endlichdimensionaler Hilbertraum), wenn ∀ ϕ, ψ ∈ H ein Skalarprodukt (inneres Produkt) ϕ | ψ ∈ H definiert ist mit den folgenden Eigenschaften: 1. ϕ | c1 ψ1 + c2 ψ2 = c1 ϕ | ψ1 + c2 ϕ | ψ2 , ∀ ϕ, ψ1,2 ∈ H, ∀ c1,2 ∈ 2. ϕ | ψ = ψ | ϕ∗ 3. ψ | ψ ≥ 0, ψ | ψ = 0 ⇔ ψ = 0 Bemerkungen: ϕ | ψ ist sesquilinear, d.h. linear in der zweiten Variablen 53 ANHANG A. UNITÄRE VEKTORRÄUME 54 und antilinear in der ersten Variablen, da c1 ϕ1 + c2 ϕ2 | ψ = ψ | c1 ϕ1 + c2 ϕ2 ∗ = c∗1 ψ | ϕ1 ∗ + c∗2 ψ | ϕ2 ∗ = c∗1 ϕ1 | ψ + c∗2 ϕ2 | ψ. Wir verwenden hier die in der physikalischen Literatur üblichen Konventionen. In der mathematischen Literatur ist das innere Produkt oft in der ersten Variablen linear und in der zweiten antilinear. Weiters findet man dort häufig die Schreibweise z̄ statt z ∗ für die zur komplexen Zahl z = a + ib (a, b ∈ ) konjugiert komplexe Zahl z ∗ = a − ib. Beispiele für unitäre Vektorräume: 1. U n = n mit dem Skalarprodukt x | y = n x∗k yk . k=1 2. Der Vektorraum, der auf [a, b] ⊂ definierten komplexen Polynome vom Grad ≤ n, n p(x) = ck xk , ck ∈ , x ∈ [a, b] k=0 mit dem inneren Produkt b p | q = dx p(x)∗ q(x). a 3. Der Vektorraum der komplexwertigen Funktionen der Form ψ(x) = N cn e2πinx , cn ∈ , n=−N auf dem Intervall [0, 1] mit dem Skalarprodukt 1 ϕ | ψ = 0 dx ϕ(x)∗ ψ(x). A.2. NORM 55 4. Der Vektorraum der komplexwertigen Funktionen der Form ϕ(x) = e−x 2 /2 p(x) auf , wobei p(x) ein Polynom vom Grad ≤ n ist, mit dem Skalarprodukt ∞ ϕ | ψ = −∞ ∞ = dx ϕ(x)∗ ψ(x) 2 dx e−x p(x)∗ q(x), −∞ wobei ψ(x) = e−x A.2 2 /2 q(x). Norm In einem unitären Vektorraum H definiert man die Norm ψ eines Elementes ψ ∈ H durch ψ = ψ|ψ. Für das Skalarprodukt gilt die Ungleichung von Cauchy-Schwarz: |ϕ | ψ| ≤ ϕψ. Beweis: Für ϕ = 0 oder ψ = 0 ist die Ungleichung trivialerweise erfüllt. Man kann sich daher auf den Fall ϕ = 0 ∧ ψ = 0 beschränken. Es sei ε ∈ (|ε| = 1) so gewählt, dass εϕ | ψ = |ϕ | ψ| ε∗ ϕ | ψ∗ = |ϕ | ψ| . ϕ ψ ϕ ψ εϕ|ψ ε∗ ψ|ϕ 0 ≤ −ε −ε =2− − ϕ ψ ϕ ψ ϕψ ϕψ |ϕ|ψ| = 2 1− ⇒ |ϕ|ψ| ≤ ϕψ. ϕψ ⇒ ⇒ Eigenschaften der Norm: 1. ψ ≥ 0, ψ = 0 ⇔ ψ = 0 ANHANG A. UNITÄRE VEKTORRÄUME 56 2. aψ = |a|ψ ∀ a ∈ , ∀ψ ∈ H 3. ϕ + ψ ≤ ϕ + ψ Beweis: Die ersten beiden Eigenschaften folgen unmittelbar aus der Definition der Norm. Die dritte Eigenschaft (Dreiecksungleichung) ergibt sich aus der Ungleichung von Cauchy-Schwarz: ϕ + ψ2 = ϕ + ψ|ϕ + ψ = ϕ|ϕ + ψ|ψ + 2Reϕ|ψ ≤ ϕ2 + ψ2 + 2ϕψ = (ϕ + ψ)2 . Definition: Ein Vektor ψ heißt normiert oder Einheitsvektor, wenn ψ = 1 ist. Zwei Vektoren ϕ, ψ heißen orthogonal, wenn ϕ|ψ = 0 ist. Beispiel: Wir betrachten in dem Vektorraum der komplexen Polynome vom Grad ≤ n auf [0, 1] mit dem inneren Produkt 1 p|q = dx p(x)∗ q(x) 0 √ √ die Elemente p0 (x) = 1, p1 (x) = x und p2 (x) = x2 . p0 , 3p1 und 5p2 sind Einheitsvektoren, p0 und p1 sind nicht orthogonal, jedoch sind p0 und p0 − 2p1 orthogonal. In einem unitären Vektorraum gilt die sogenannte Polarisierungsidentität: 1 k ψ | ϕ = i ϕ + ik ψ2 4 k=1 4 A.3 Lineare Abbildungen U und V seien Vektorräume über dem Grundkörper der komplexen Zahlen. Eine Abbildung A : U → V heißt linear, falls A(c1 ψ1 + c2 ψ2 ) = c1 Aψ1 + c2 Aψ2 ∀ c1,2 ∈ , ∀ ψ1,2 ∈ U. Die Menge aller linearen Abbildungen von U nach V bezeichnen wir mit L(U, V). Falls die Räume U und V übereinstimmen, schreiben wir L(U, U) = L(U). Ist V = (also der Grundkörper), schreibt man L(U, ) = U. U wird Dualraum von U genannt, die Elemente von U heißen lineare Funktionale. A.4. ADJUNGIERTE ABBILDUNG 57 Ist {ϕ1 , . . . , ϕn } eine Basis von U und {χ1 , . . . , χm } eine Basis von von V, dann lässt sich die Wirkung einer linearen Abbildung A ∈ L(U, V) auf die Basisvektoren {ϕ1 , . . . , ϕn } eindeutig bezüglich der Basis {χ1 , . . . , χm } zerlegen: Aϕl = m χk Akl , 1 ≤ l ≤ n, Akl ∈ . k=1 Die m × n Matrix (Akl ) bezeichnet man als Matrixdarstellung der linearen Abbildung A bezüglich der gewählten Basissysteme. A.4 Adjungierte Abbildung Die Rolle der transponierten Matrix AT wird im komplexen Fall durch die adjungierte Matrix A† = (AT )∗ übernommen. Die Operation A ∈ L(U n , U m ) → A† ∈ L(U m , U n ) besitzt die folgende Eigenschaften: (c1 A1 + c2 A2 )† = c∗1 A†1 + c∗2 A†2 , (AB)† = B † A† , A†† = A Fasst man im Raum U n ein Element c1,2 ∈ ⎞ x1 ⎟ ⎜ x = ⎝ ... ⎠ xn ⎛ als n × 1-Matrix auf, dann ist x† = (x∗1 , . . . , x∗n ) und das Skalarprodukt kann in Matrixnotation x | y = x† y geschrieben werden. Die Abbildung x → x† stellt eine Identifizierung“ des U n ” n dar, allerdings ist diese Identifizierung“ mit seinem Dualraum U nicht linear: ” (c1 x1 + c2 x2 )† = c∗1 x†1 + c∗2 x†2 Das Konzept der adjungierten Abbildung kann nun leicht auf den allgemeinen Fall eines beliebigen unitären Raumes H erweitert werden. Da wir ein Skalarprodukt auf kanonische zur Verfügung haben, können wir H mit seinem Dualraum H zu, Weise identifizieren“ . Dazu ordnen wir jedem ϕ ∈ H das Funktional ϕ† ∈ H ” welches durch ϕ† ψ = ϕ | ψ ∀ ψ ∈ H ANHANG A. UNITÄRE VEKTORRÄUME 58 definiert ist. Diese Abbildung führt linear unabhängige Vektoren wieder in linear unabhängige Vektoren über und ist injektiv. Da die Dimension von H mit der seines Dualraums übereinstimmt, ist sie auch surjektiv. Die inverse Abbildung bezeichnen wir ebenfalls mit † , sodass ϕ†† = ϕ gilt. Seien U und V unitäre Vektorräume und A : U → V eine lineare Abbildung. Die zu A adjungierte Abbildung A† : V → U ist durch A† ϕ | ψU = ϕ | AψV ∀ ψ ∈ U, ∀ ϕ ∈ V definiert. Diese Definition ist äquivalent mit A† ϕ = (ϕ† A)† ∀ ϕ ∈ V. Die so definierte Abbildung ist wohldefiniert und linear, da † A† (c1 ϕ1 + c2 ϕ2 ) = (c1 ϕ1 + c2 ϕ2 )† A † = (c∗1 ϕ†1 + c∗2 ϕ†2 )A = c1 (ϕ†1 A)† + c2 (ϕ†2 A)† = c1 A† ϕ1 + c2 A† ϕ2 ϕ1,2 ∈ V, c1,2 ∈ . Eigenschaften der adjungierten Abbildung: 1. (c1 A1 + c2 A2 )† = c∗1 A†1 + c∗2 A†2 , 2. A†† = A, A1,2 ∈ L(U, V). A ∈ L(U, V). 3. (BA)† = A† B † , A.5 c1,2 ∈ , A ∈ L(U, V), B ∈ L(V, W). Orthonormalbasis Bezüglich einer ONB {ϕ1 , . . . , ϕn } eines n-dimensionalen unitären Vektorraumes H lässt sich jedes ψ ∈ H in der Form ψ= n ϕ k ck k=1 schreiben, wobei die Entwicklungskoeffizienten ck ∈ eindeutig durch ck = ϕk | ψ = ϕ†k ψ gegeben sind. Das heißt, dass ψ= n k=1 ϕk ϕ†k ψ ∀ ψ ∈ H, A.5. ORTHONORMALBASIS 59 und man erhält somit die Vollständigkeitsrelation für den Fall eines unitären Vektorraumes: n ϕk ϕ†k = 1. k=1 Das bedeutet, dass eine Menge von n Vektoren {ϕ1 , . . . , ϕn } in einem ndimensionalen unitären Vektorraum H genau dann eine ONB von H ist, falls die Bedingungen n ϕk | ϕl = δkl , ϕk ϕ†k = 1 k=1 erfüllt sind. Beispiel: Verifizieren Sie die oben angegebenen Eigenschaften für die folgende ONB von U 2 : 1 1 1 i √ , √ . 2 i 2 1 Bemerkung: Die Funktionen en (x) = e2πinx (−N ≤ n ≤ N) bilden eine ONB des im Abschnitt A.1 in Beispiel 3 angegebenen unitären Vektorraumes. Aus diesem Grund lassen sich die Entwicklungskoeffizienten cn in der Form 1 cn = en | ψ = dx e−2πinx ψ(x) 0 schreiben. Im (formalen) Limes N → ∞ erhält man die Fourierreihe cn e2πinx . ψ(x) = n∈ Das Gram-Schmidtsche Orthonormalisierungsverfahren ist eine Methode, ausgehend von einer beliebigen Basis {χ1 , . . . , χn } eines unitären Vektorraumes, eine ONB (ein VONS) {ϕ1 , . . . , ϕn } zu konstruieren. ϕ1 = χ1 χ1 χ2 = ϕ1 ϕ1 |χ2 + χ2 − ϕ1 ϕ1 |χ2 ) ϕ1 ⇒ ϕ2 = ⊥ϕ1 χ2 − ϕ1 ϕ1 |χ2 χ2 − ϕ1 ϕ1 |χ2 ANHANG A. UNITÄRE VEKTORRÄUME 60 χ3 = ϕ ϕ |χ + ϕ ϕ |χ 1 1 3 2 2 3 + χ3 − ϕ1 ϕ1 |χ3 − ϕ2 ϕ2 |χ3 ⊥ϕ1 ,ϕ2 liegt in dem von ϕ1 , ϕ2 aufgespannten linearen Teilraum ⇒ ϕ3 = χ3 − ϕ1 ϕ1 |χ3 − ϕ2 ϕ2 |χ3 χ3 − ϕ1 ϕ1 |χ3 − ϕ2 ϕ2 |χ3 usw. → VONS {ϕ1 , . . . , ϕn }. Bemerkung: Aus diesem Resultat folgt auch unmittelbar, dass ein VONS stets existiert. Ein beliebiger n-dimensionaler unitärer Vektorraum H unterscheidet sich in gewisser Weise nicht von einem U n . Wählt man nämlich in H eine ONB {ϕ1 , . . . , ϕn }, so lässt sich jedes ψ ∈ H eindeutig in der Form ψ= n ϕ k ck , ck = ϕk |ψ k=1 schreiben. Der Vektor ψ ∈ H ist also die n Zahlen ⎛ c1 ⎜ .. ⎝ . (bei vorgegebener ONB) eindeutig durch ⎞ ⎟ n ⎠∈U cn bestimmt. Diese Zuordnung ⎞ c1 ⎟ ⎜ ψ ∈ H ↔ ⎝ ... ⎠ ∈ U n cn ⎛ respektiert sowohl die Vektoraddition, die Multiplikation mit Skalaren als auch die Bildung des Skalarprodukts. Man sagt auch, dass jeder n-dimensionale unitäre Vektorraum isomorph zu U n ist. Die Matrixdarstellung (Akl ) einer linearen Abbildung A ∈ L(H) hat bezüglich einer ONB {ϕ1 , . . . , ϕn } eine besonders einfache Form. Bildet man nämlich das Skalaprodukt von ϕk mit dem Ausdruck Aϕl = n j=1 ϕj Ajl , A.5. ORTHONORMALBASIS 61 so erhält man ϕk |Aϕl = ϕk | n ϕj Ajl = j=1 n j=1 Ajl ϕk |ϕj = Akl . δkj Das heißt, man bildet einfach ein Sandwich“ des Operators A zwischen den ” Vektoren ϕk und ϕl um das Matrixelement Akl zu erhalten: Akl = ϕk | Aϕl = ϕ†k Aϕl . Für die Matrixelemente des zu A ∈ L(H) adjungierten Operators A† ∈ L(H) erhält man daher bezüglich einer ONB (A† )kl = ϕk | A† ϕl = Aϕk | ϕl = ϕl | Aϕk ∗ = A∗lk . Das heißt, die Zeilen werden mit den Spalten vertauscht und die Matrixelemente werden komplex konjugiert. Bemerkung: In der Physik wird oft die sogenannte Diracschreibweise verwendet. Statt ψ ∈ H schreibt man dann |ψ ∈ H (ket-Vektor) und für ein Element verwendet man die Notation ψ| (bra-Vektor). Die etwas des Dualraums ψ † ∈ H seltsame Sprechweise kommt von dem englischen Wort bracket = Klammer = | . In der Diracschreibweise schreibt man z.B. die Vollständigkeitsrelation als n |ϕk ϕk | = 1, k=1 oder oft in der Form n |kk| = 1, k=1 wobei |k kurz für den Vektor |ϕk der gewählten ONB steht. Einige weitere Beispiele mit Übersetzung“ : ” |ϕψ| = ϕψ † |kl| = |ϕk ϕl | = ϕk ϕ†l k|l = ϕk |ϕl = ϕ†k ϕl k |A| l = ϕk |A| ϕl = ϕk | Aϕl = Akl ANHANG A. UNITÄRE VEKTORRÄUME 62 A.6 Projektionsoperatoren Sei M ein Teilraum eines unitären Vektorraumes H. Dann bezeichnen wir mit M⊥ das orthogonale Komplement von M, welches aus allen Elementen ψ ∈ H mit ϕ|ψ = 0 ∀ ϕ ∈ M besteht. Dann ist M⊥ wieder ein Teilraum von H und M ∩ M⊥ = {0}, denn ψ1,2 ∈ M⊥ ⇒ ϕ | c1 ψ1 + c2 ψ2 = c1 ϕ | ψ1 + c2 ϕ | ψ2 = 0 ⇒ c1 ψ1 + c2 ψ2 ∈ M⊥ , ψ | ψ = 0 ⇒ ψ = 0. ψ ∈ M ∩ M⊥ ⇒ ∈M ∈M⊥ Mit dem Skalarprodukt von H ist M selbst ein unitärer Raum. Daher besitzt M eine ONB {ϕ1 , . . . ϕm }. Für jeden Vektor ψ ∈ H sei ψM = m ϕk ϕk | ψ = k=1 m ϕk ϕ†k ψ k=1 Dann ist ψM ∈ M und ψ − ψM ∈ M⊥ , weil ϕk | ψ − ψM = ϕk | ψ − ϕk | ψM m % & ϕl ϕl | ψ = ϕk | ψ − ϕk | = ϕk | ψ − m l=1 l=1 ϕl | ψ ϕk | ϕl = ϕk | ψ − ϕk | ψ = 0 δkl ∀ k = 1, . . . , m ⇒ ψ = ψM + (ψ − ψM ) mit ψM ∈ M und ψ − ψM = ψM⊥ ∈ M⊥ . Diese Darstellung ist eindeutig, weil M ∩ M⊥ = {0} ist, d.h. H = M ⊕ M⊥ und dim M ⊥ = dim H − dim M. Weiters ist M⊥⊥ = M für jeden Teilraum M. Man bezeichnet ψM als die orthogonale Projektion von ψ auf den Teilraum M. Aus der Gleichung ψM = m ϕk ϕ†k ψ k=1 sieht man, dass der Operator PM = m k=1 ϕk ϕ†k = m |ϕk ϕk | ∈ L(H) (m ≤ dim H) k=1 die Projektion ψ → ψM auf den m-dimensionalen Teilraum M bewerkstelligt, wobei PM M⊥ = 0. PM heißt daher (orthogonaler) Projektionsoperator oder A.7. HERMITESCHE OPERATOREN 63 (orthogonaler) Projektor auf M. PM ist natürlich von der Wahl der ONB {ϕ1 , . . . , ϕm } in M unabhängig. Eigenschaften von PM : 2 = PM (idempotent) wegen PM ψ = ψM , PM ψM = ψM . 1. PM Anderer Beweis: 2 PM = m ϕk ϕ†k k=1 m ϕl ϕ†l = l=1 m ϕk ϕ†k ϕl k,l=1 ϕ†l = m ϕk ϕ†k = PM k=1 δkl † 2. PM = PM (einen Operator mit dieser Eigenschaft nennt man hermitesch oder selbstadjungiert). ' † PM = m († ϕk ϕ†k = k=1 m ϕk ϕ†k † = k=1 m k=1 † ϕ†† k ϕk = m ϕk ϕ†k = PM k=1 Umgekehrt definiert jeder Operator P ∈ L(H), der die Eigenschaften P 2 = P und P † = P erfüllt, durch sein Bild M = P H einen linearen Teilraum, wobei P M⊥ = 0, da χ | P ψ = P †χ | ψ = P χ | ψ = 0 ∀ ψ ∈ M⊥ , ∀χ ∈ H ∈M wobei P † = P verwendet wurde. Bemerkung: PM⊥ = 1 − PM , PM PM⊥ = 0. PM besitzt die Eigenwerte 0 (falls dim M < dim H = n) und 1, da PM ϕ = ϕ, ∀ ϕ ∈ M und PM ψ = 0 ∀ ψ ∈ M⊥ und H = M ⊕ M⊥ . Man kann die ONB {ϕ1 , . . . , ϕm } von M (die aus n linear unabhängigen Eigenvektoren von PM zum Eigenwert 1 besteht) durch die Hinzunahme einer beliebigen ONB {ϕm+1 , . . . , ϕn } von M⊥ (die aus n − m linear unabhängigen Eigenvektoren von PM zum Eigenwert 0 besteht) zu einem VONS {ϕ1 , . . . , ϕm , ϕm+1 , . . . , ϕn } des ganzen Raumes H = M ⊕ M⊥ ergänzen. A.7 Hermitesche Operatoren Definition: Ein Operator A ∈ L(H) (H ist ein unitärer Vektorraum) heißt hermitesch oder selbstadjungiert, wenn A† = A ist. ANHANG A. UNITÄRE VEKTORRÄUME 64 Die Eigenwerte eines hermiteschen Operators sind reell: Sei ψ ∈ H ein Eigenvektror von A mit Eigenwert a (Aψ = aψ). Dann ist ψ | Aψ = ψ | aψ = aψ | ψ. Andererseits ist wegen A† = A ψ | Aψ = A† ψ | ψ = Aψ | ψ = aψ | ψ = a∗ ψ | ψ, und somit (a − a∗ )ψ | ψ = 0. Da ψ als Eigenvektor nicht der Nullvektor sein kann, ist auch ψ | ψ = 0, woraus a = a∗ ∈ folgt. Bemerkung: Die Umkehrung gilt nicht, das heißt ein Operator, der nur reelle Eigenwerte besitzt, ist nicht notwendigerweise hermitesch. Gegenbeispiel im U 2 : 1 0 1 1 † , A= = A = 1 1 0 1 jedoch hat A den (einfach entarteten) Eigenwert 1. Beispiele für hermitesche Operatoren: 1. Die allgemeine Form einer hermiteschen Matrix im U 2 ist a c + id A= , a, b, c, d ∈ . c − id b Überzeugen Sie sich, dass die Eigenwerte von A tatsächlich reell sind. 2. Mit den orthogonalen Projektoren (P 2 = P, P † = P ) haben wir bereits Spezialfälle von hermiteschen Operatoren kennengelernt. Man kann auch sagen, dass die Projektionsoperatoren genau jene hermiteschen Elemente aus L(H) sind, deren Eigenwerte 0 oder 1 sind. 3. In einem unitären Vektorraum H mögen die Vektoren {ϕ1 , . . . , ϕn } ein VONS von H bilden. Dann ist A= n k=1 ak ϕk ϕ†k = n ak |ϕk ϕk | , ak ∈ k=1 ein hermitescher Operator. Die reellen Zahlen ak (k = 1, . . . , n) sind Eigenwerte von A und die ONB {ϕ1 , . . . , ϕn } besteht aus Eigenvektoren von A. Wir werden später sehen, dass sich jeder hermitesche Operator in der oben angegebenen Form (Spektraldarstellung) schreiben lässt. A.8. UNITÄRE OPERATOREN A.8 65 Unitäre Operatoren Definition: Ein Operator U ∈ L(H) (H ein unitärer Vektorraum) heißt unitär, falls U invertierbar ist mit U −1 = U † (d.h. U † U = UU † = 1). Satz: Sei U ∈ L(H) (H ein unitärer Vektorraum). Dann sind die folgenden Aussagen äquivalent: 1. U ist unitär. 2. Uϕ | Uψ = ϕ | ψ 3. Uψ = ψ ∀ ϕ, ψ ∈ H. ∀ ψ ∈ H. 4. U bildet jede ONB von H wieder auf eine ONB von H ab. Bei dem Beweis dieses Satzes bereitet nur die Implikation 3 ⇒ 2 etwas Mühe. Nehmen wir an, dass Uψ = ψ ∀ψ ∈ H erfüllt ist, so folgt unter Verwendung der Polarisierungsidentität, dass 1 k i Uϕ + ik Uψ2 Uψ | Uϕ = 4 k=1 4 1 k = i U(ϕ + ik ψ)2 4 k=1 4 1 k = i (ϕ + ik ψ)2 4 k=1 4 = ψ | ϕ. Sind U1 , U2 ∈ L(H) zwei unitäre Operatoren, dann ist auch das Produkt U1 U2 ein unitärer Operator, da (U1 U2 )−1 = U2−1 U1−1 = U2† U1† = (U1 U2 )† Die Eigenwerte eines unitären Operators haben den Betrag eins, da Uψ = uψ (ψ = 0, u ∈ ) ⇒ ψ | ψ = Uψ | Uψ = uψ | uψ = |u|2 ψ | ψ ⇒ |u| = 1 =0 ⇒ iα u=e , α ∈ . Das heißt, das Spektrum (die Menge der Eigenwerte) eines unitären Operators ist eine Teilmenge des Einheitskreises in der komplexen Zahlenebene. Beispiele von unitären Abbildungen: ANHANG A. UNITÄRE VEKTORRÄUME 66 1. Sei U eine unitäre Matrix auf U n . Dann wird die Standardbasis {e1 , . . . , en } (VONS von U n ) in einanderes VONS von U n {Ue1 , . . . , Uen } = {f1 , . . . , fn } übergeführt. Wegen nk=1 fk fk† = 1 kann man schreiben: U = U1 = U n ek e†k = k=1 n k=1 Uek e†k fk = n fk e†k = (f1 , . . . , fn ), k=1 d.h. die Spalten einer unitären Matrix bilden ein VONS. 2. Die allgemeine Form einer unitären 2 × 2 Matrix ist daher: a −b∗ U= eiα , a, b ∈ , |a|2 + |b|2 = 1, α ∈ . b a∗ 3. Die Vektoren {ϕ1 , . . . , ϕn } mögen ein VONS eines unitären Vektorraums bilden. Dann ist n n † iαk U= e ϕk ϕk = eiαk |ϕk ϕk | , αk ∈ , k=1 k=1 ein unitärer Operator. Die komplexe Zahl eiαk ist ein Eigenwert von U mit dazugehörigem Eigenvektor ϕk . Wieder kann man zeigen, dass sich jeder unitäre Operator in der obigen Form schreiben lässt. A.9 Normale Operatoren Definition: Ein Operator A ∈ L(H) (H ein unitärer Vektorraum) heißt normal, falls AA† = A† A. Bemerkung: Definiert man den Kommutator zweier Operatoren A, B ∈ L(H) durch [A, B] = AB − BA, so ist die Eigenschaft, dass bei einem normalen Ope rator A und A† vertauschen, gleichbedeutend mit A, A† = 0. Beispiele für normale Operatoren: 1. Hermitesche und unitäre Operatoren sind normal. 2. Sei {ϕ1 , . . . , ϕn } ein VONS eines unitären Vektorraumes H. Dann ist A= n k=1 ak ϕk ϕ†k = n ak |ϕk ϕk | , ak ∈ k=1 ein normaler Operator. Wir werden im nächsten Abschnitt zeigen, dass sich jeder normale Operator in dieser Form schreiben lässt. Das ist die Aussage des Spektralsatzes für normale Operatoren. Dieser behauptet nämlich, dass die normalen Operatoren genau diejenigen sind, die eine ONB von Eigenvektoren besitzen. A.10. SPEKTRALSATZ FÜR NORMALE OPERATOREN 67 Bemerkungen: 1. Im Raum U 2 ist die Matrix A= 1 1 0 1 nicht normal (AA† = A† A). Diese Matrix hat nur einen Eigenvektor! 2. Für jedes A ∈ L(H) sind A† A und AA† hermitesch. 3. Für jedes A ∈ L(H) sind A1 = 1 A + A† 2 und A2 = 1 A − A† 2i hermitesche Operatoren und es gilt A = A1 + iA2 Der Operator A ist genau dann normal, wenn [A1 , A2 ] = 0 gilt. Daraus ergibt sich, dass man normale Operatoren in gewisser Hinsicht als Verallgemeinerung der komplexen Zahlen interpretieren kann, wobei die hermiteschen Operatoren den reellen Zahlen entsprechen. Die unitären Operatoren (U † U = UU † = 1) stellen das Analogon zu einer komplexen Zahl z mit z ∗ z = 1, d.h. |z| = 1, dar. A.10 Spektralsatz für normale Operatoren Normale Operatoren lassen sich dadurch charakterisieren, dass sie ein vollständiges Orthonormalsystem von Eigenvektoren besitzen. Die Spektraldarstellung normaler Operatoren ist eine unmittelbare Folgerung aus dieser Eigenschaft. Diese wird in den verschiedensten physikalischen Anwendungen benötigt. Spektralsatz für normale Operatoren: Jeder normale Operator in einem unitären Vektorraum besitzt ein vollständiges Orthonormalsystem von Eigenvektoren. Beweis: Sei A ∈ L(H) ein normaler Operator ( A, A† = 0) in einem ndimensionalen unitären Vektorraum H. Dann besitzt das charakteristische Polynom von A, pA (a) = det(a1 − A), mindestens eine Nullstelle a1 ∈ . Die Eigenwertgleichung Aϕ = a1 ϕ ANHANG A. UNITÄRE VEKTORRÄUME 68 besitzt daher eine nichttriviale Lösung ϕ1 = 0, wobei man ϕ1 |ϕ1 = 1 wählen kann. Da A normal ist, ist ϕ1 auch Eigenvektor des adjungierten Operators A† zum Eigenwert a∗1 : A† ϕ1 = a∗1 ϕ1 . Das kann man folgendermaßen sehen: % 0 = % = % = % = % = (A − a1 )ϕ1 | (A − a1 )ϕ1 & ϕ1 | (A − a1 )† (A − a1 )ϕ1 ϕ1 | (A − a1 )(A − a1 )† ϕ1 & & (A − a1 )† ϕ1 | (A − a1 )† ϕ1 (A† − a∗1 )ϕ1 | (A† − a∗1 )ϕ1 & & A† ϕ1 = a∗1 ϕ1 ⇒ Man betrachtet nun den (n-1)-dimensionalen Teilraum N = [ϕ1 ]⊥ = {ψ ∈ H | ϕ1 |ψ = 0} . Die Anwendung von A bzw. A† auf Elemente von N führt aus diesem Teilraum nicht heraus, denn für ψ ∈ N gilt ϕ1 | Aψ = A† ϕ1 | ψ = a∗1 ϕ1 | ψ = a1 ϕ1 | ψ = 0 und ϕ1 | A† ψ = Aϕ1 | ψ = a1 ϕ1 | ψ = a∗1 ϕ1 | ψ = 0. Man kann daher A als Opertaor auf N auffassen, der natürlich auch normal ist. Man wiederholt nun das Verfahren von vorhin und erhält ein ϕ2 ∈ N (d.h. ϕ2 |ϕ1 = 0), ϕ2 = 1, mit Aϕ2 = a2 ϕ2 . Die weitere Fortsetzung dieser Prozedur liefert nach insgesamt n Schritten ein VONS {ϕ1 , . . . , ϕn } von Eigenvektoren von A: Aϕk = ak ϕk . Zur Spektraldarstellung eines normalen Operators, A= n ak ϕk ϕ†k = k=1 n ak |ϕk ϕk | , k=1 gelangt man nun einfach durch die Verwendung der Vollständigkeitsrelation für die ONB {ϕ1 , . . . , ϕn }: A = A1 = A n k=1 ϕk ϕ†k = n k=1 Aϕk ϕ†k = n k=1 ak ϕk ϕ†k A.10. SPEKTRALSATZ FÜR NORMALE OPERATOREN 69 Bemerkung: Sei A ∈ L(U n ) eine normale n × n-Matrix. Dann gibt es ein VONS {f1 , . . . , fn } von Eigenvektoren von A: fk† fl = δkl , n fk fk† = 1, k=1 A= n k=1 ⎛ ⎜ fk ak fk† = (f1 , . . . , fn ) ⎝ U a1 Afk = ak fk . ⎞⎛ ⎞ f1† ⎟ ⎜ .. ⎟ .. ⎠⎝ . ⎠ . an fn†  Die Matrizen U= n U† fk e†k = (f1 , . . . , fn ) k=1 und ⎞ f1† ⎟ ⎜ ek fk† = ⎝ ... ⎠ U† = k=1 fn† ⎛ n sind unitär (UU † = U † U = 1). Der Spektralsatz besagt also, dass man jede normale n × n-Matrix in der Form A = U ÂU † schreiben kann, wobei U unitär ist und  die aus den Eigenwerten a1 , . . . , an gebildete Diagonalmatrix  = diag(a1 , . . . , an ) ist. Multipliziert man die obige Gleichung von links mit U † und von rechts mit U, so erhält man U † AU =  d.h. eine n × n-Matrix lässt sich genau dann durch eine unitäre Transformation auf Diagonalgestalt bringen, wenn sie normal ist. An dieser Stelle sei an den allgemeinen Fall einer diagonalisierbaren n × n-Matrix erinnert, bei der eine Basis {f1 , . . . , fn } von Eigenvektoren Afk = ak fk existiert. Bildet man die Matrix S = (f1 , . . . fn ), so ist S −1 AS =  = diag(a1 , . . . , an ) die gewünschte Diagonalisierung. In unserem Fall einer normalen Matrix haben wir also den Spezialfall, dass die Eigenvektoren eine ONB bilden und S daher unitär ist (S −1 = S † ). Kochrezept für das Diagonalisieren einer normalen n × n-Matrix A (d.h. einer Matrix mit A, A† = 0): 1. Man berechne das charakteristische Polynom von A: pA (a) = det(a1 − A) ANHANG A. UNITÄRE VEKTORRÄUME 70 2. Man berechne die Eigenwerte von A, indem man die Nullstellen des charakteritischen Polynoms bestimmt. Es kann natürlich vorkommen, dass manche der Eigenwerte entartet sind. 3. Man ermittle die dazugehörigen Eigenvektoren fk aus der Eigenwertgleichung Afk = ak fk und normiere sie (fk = 1). Eigenvektoren zu verschiedenen Eigenwerten (ak = al ) sind automatisch orthogonal, denn † fk† Afl = al fk† fl = A† fk fl = ak fk† fl ⇒ (ak − al ) fk† fl = 0 fk† fl = 0. ⇒ =0 Ist ein Eigenwert d-fach entartet, so gibt es d linear unabhängige Eigenvektoren (d.h. der Eigenraum dieses Eigenwertes ist d-dimensional). Diese Eigenvektoren können aber stets orthonormal gewählt werden. Auf diese Weise erhält man ein VONS {f1 , . . . , fn } von U n . 4. Man bilde die unitäre Matrix U = (f1 , . . . , fn ) mit den Eigenvektoren als Spalten ⇒ U † AU =  = diag(a1 , . . . , an ). Beispiele: 1. Die Matrix R= cos θ − sin θ sin θ cos θ ist in U 2 unitär, ihre Eigenwerte sind e±iθ , die dazugehörigen normierten Eigenvektoren sind 1 1 (zum Eigenwert e+iθ ), f1 = √ −i 2 1 1 (zum Eigenwert e−iθ ). f2 = √ i 2 somit ist 1 U = (f1 , f2 ) = √ 2 und 1 1 −i i U † RU = diag eiθ , e−iθ . A.10. SPEKTRALSATZ FÜR NORMALE OPERATOREN 2. Die 3 × 3-Matrix 71 ⎛ ⎞ 1 −2 1 A = ⎝ −2 1 1 ⎠ 1 1 −2 ist hermitesch, die Eigenwerte müssen daher reell sein. Für das charakteristische Polynom erhält man pA (a) = a(a2 − 9) und somit die Eigenwerte a1 = 0, a2 = 3, a3 = −3. Die Eigenwertgleichungen Af1 = 0, Af2 = 3f2 , Af3 = −3f3 ergeben die (normierten) Lösungen ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 1 1 1 1 1 f1 = √ ⎝ 1 ⎠ , f2 = √ ⎝ −1 ⎠ , f3 = √ ⎝ 1 ⎠ , 3 2 6 1 0 −2 Man überprüft leicht, dass {f1 , f2 , f3 } tatsächlich eine ONB von U 3 ist. Ebenso kann man als Probe die Spektraldarstellung A= 3 ak fk fk† = 3 f2 f2† − f3 f3† k=1 überprüfen“. Für die unitäre Matrix U = (f1 , f2 , f3 ), welche die Diagona” lisierung von A in der Form U † AU = diag(0, 3, −3) bewerkstelligt, erhält man daher ⎛ ⎞ ⎜ U =⎝ √1 3 √1 3 √1 3 √1 2 − √12 0 √1 6 √1 6 − √26 ⎟ ⎠. Bemerkung: Wir haben die Spektraldarstellung eines normalen Operators A in einem n-dimensionalen unitären Raum so formuliert, dass wir A als Linearkombination von eindimensionalen Projektionsoperatoren |ϕk ϕk | geschrieben haben, n A= ak |ϕk ϕk | . k=1 Wenn es entartete Eigenwerte gibt, dann sind einige der ak gleich und es ist möglich die entsprechenden Terme zusammenzufassen. Dazu ändern wir unsere Notation etwas ab: {aα }m α=1 sei das Spektrum von A (d.h. aα = aβ für α = β). a1 , . . . , am bezeichnen also jetzt die m ≤ n verschiedenen Eigenwerte von A mit dazugehörigen Eigenräumen Mα (α = 1, . . . , m), die paarweise aufeinander orthogonal stehen: Mα ⊥ Mβ für α = β, H = M 1 ⊕ · · · ⊕ Mm . ANHANG A. UNITÄRE VEKTORRÄUME 72 Durch eine geeignete Umbenennung der Vektoren der ONB {|ϕ1 , . . . , |ϕn } in {| α, r} r = 1, . . . dα = dim Mα α = 1, . . . m, kann man die Projektoren auf die Eigenräume Mα (α = 1, . . . , m) in der Form PMα = dα | α, rα, r | r=1 schreiben. Die Tatsache, dass die PMα orthogonale Projektionsoperatoren auf die paarweise orthogonal stehenden Teilräume M1 , . . . , Mm sind, drückt sich durch die Relationen † PMα PMβ = δαβ PMα , PM = PMα α aus. Zusammen mit der Vollständigkeitsrelation m PMα = 1 α=1 gelangen wir schließlich zur gewünschten alternativen Formulierung der Spektraldarstellung von A: m A= aα PMα . α=1 A.11 Gleichzeitige Diagonalisierbarkeit Das folgende Kriterium für die gleichzeitige Diagonalisierbarkeit normaler Operatoren wird vor allem in der Quantenmechanik oft benötigt. Satz: A, B ∈ L(H) seien normale Operatoren, die miteinander vertauschen ([A, B] = 0). Dann gibt es eine gemeinsame ONB von Eigenvektoren für beide Operatoren. Beweis: Seien aα (α = 1, . . . m) die verschiedenen Eigenwerte von A und Mα die entsprechenden Eigenräume. ψ ∈ Mα ⇒ Bψ ∈ Mα , denn ABψ = BAψ = Baα ψ = aα Bψ ⇒ B|Mα ist ein normaler Operator auf Mα ⇒ ∃ ONB von Mα {|α, 1, . . . |α, dα} von Eigenvektoren von B. Außerdem ist natürlich A|α, r = aα |α, r. Die Vektoren |α, r (α = 1, . . . m, r = 1, . . . , dα = dim Mα ) bilden ein VONS von H, das aus Eigenvektoren von A und B gebildet wird. Bemerkung: Für normale n × n-Matrizen A, B mit [A, B] = 0 bedeutet das: ∃ unitäre Matrix U, sodass U † AU und U † BU Diagonalmatrizen sind. (A und B sind gleichzeitig diagonalisierbar.) A.12. FUNKTIONEN NORMALER OPERATOREN A.12 73 Funktionen normaler Operatoren Funktionen von linearen Operators treten etwa bei der Behandlung von Systemen linearer Differentialgleichungen, der Beschreibung von Symmetrietransformationen und der Zeitentwicklung in der Quantenmechanik auf. Die Berechnung der Funktion eines normalen Operators ist erstaunlich einfach. Sie kann auf die Bestimmung der Funktionswerte auf dem Spektrum des Operators zurückgeführt werden. Um dies zu sehen, gehen wir von der Spektraldarstellung eines normalen Operators A in der Form n A= ak ϕk ϕ†k k=1 aus. Multipliziert man diesen Ausdruck mit sich selbst (was einer nochmaligen Anwendung der Abbildung A entspricht), so erhält man 2 A = AA = n ak ϕk ϕ†k k=1 = n n al ϕl ϕ†l l=1 = n k,l=1 ak al ϕk ϕ†k ϕl ϕ†l δkl a2k ϕk ϕ†k k=1 bzw. für beliebiges m ∈ , · · A = A =A · m m-mal n † am k ϕk ϕk . k=1 Ebenso erhält man für ein Polynom von A den Ausdruck ' ( n n † m m cm A = cm ak ϕk ϕk = p(ak )ϕk ϕ†k . p(A) = m k=1 m k=1 Für eine beliebige komplexwertige Funktion f , die auf dem Spektrum des normalen Operators A ∈ L(H) (das ist die Menge der Eigenwerte von A) definiert ist, kann man f (A) ∈ L(H) daher durch f (A) = n f (ak )ϕk ϕ†k k=1 definieren, wobei f (A) natürlich wieder ein normaler Operator ist. ANHANG A. UNITÄRE VEKTORRÄUME 74 Beispiele: 1. Sei A ∈ L(U n ) eine normale n×n-Matrix. A =U ÂU † ,  = diag(a 1 , . . . , an ), † U unitär ⇒ f (A) = Uf (Â)U , f (Â) = diag f (a1 ), . . . , f (an ) . 2. Sei U ∈ L(H) ein unitärer Operator. Seine Eigenwerte haben dann die Gestalt eiαk (α ∈ ) und die Spektraldarstellung lautet U= n eiαk ϕk ϕ†k = eiA , k=1 wobei A = n † k=1 αk ϕk ϕk = A† . Das heißt, jeder unitäre Operator kann in der Form U = eiA , A = A† , geschrieben werden. 3. Die Funktion f (A) eines normalen Operators A in einem zweidimensionalen unitären Raum kann als Linearkombination des Einheitsoperators und von A selbst geschrieben werden. Sind die zwei möglichen Eigenwerte entartet, so ist A = a1 und daher f (A) = f (a)1, womit die Behauptung offensichtlich erfüllt ist. Im Fall verschiedener Eigenwerte (a1 = a2 ) hat man A = a1 P1 + a2 P2 , P1 + P2 = 1, wobei P1 = ϕ1 ϕ†1 , P2 = ϕ2 ϕ†2 die beiden eindimensionalen Projektoren auf die von den Eigenvektoren ϕ1,2 aufgespannten Eigenräume sind. Aus der Spektraldarstellung und der Vollständigkeitsrelation kann man die beiden Projektionsoperatoren als Linearkombinationen von 1 und A schreiben: P1 = A − a2 , a1 − a2 P2 = A − a1 . a2 − a1 Somit erhält man A − a2 A − a1 + f (a2 ) a1 − a2 a1 − a2 f (a2 )a1 − f (a1 )a2 f (a1 ) − f (a2 ) = 1+ A. a1 − a2 a1 − a2 f (A) = f (a1 )P1 + f (a2 )P2 = f (a1 ) A.12. FUNKTIONEN NORMALER OPERATOREN 75 4. In der Quantenmechanik treten bei der Beschreibung des Spin 1/2-Systems die Paulischen Spinmatrizen 0 1 0 −i 1 0 σ1 = , σ2 = , σ3 = 1 0 i 0 0 −1 auf. Sie sind in U 2 hermitesch mit Eigenwerten ±1. Sie erfüllen die Vertauschungsrelationen [σk , σl ] = 2i 3 klm σm m=1 und die Antivertauschungsrelationen σk σl + σl σk = 2δkl . Bildet man die Linearkombination n · σ = 3 ni σi k=1 mit einem Einheitsvektor ⎛ ⎞ n1 ⎝ n2 ⎠ ∈ 3 , n3 n21 + n22 + n23 = 1, so ist n · σ wieder hermitesch mit Eigenwerten ±1. Bei der Beschreibung der räumlichen Drehung eines Spins um den Winkel α mit Drehachse n, tritt die Matrix e−iαn·σ/2 auf. Überprüfen Sie, dass diese Matrix in der Form e−iαn·σ/2 = 1 cos α α − in · σ sin 2 2 geschrieben werden kann. Hinweis: Wenden Sie die Formel von Beispiel 3 an. 76 ANHANG A. UNITÄRE VEKTORRÄUME Anhang B Einfache Quantensysteme Die in der Theorie der unitären Räume eingeführten mathematischen Konzepte haben eine unmittelbare Entsprechung zu jenen grundlegenden physikalischen Begriffen, die bei der Formulierung der Grundpostulate der Quantentheorie verwendet werden. Obwohl man zur Beschreibung der meisten realistischen quantenmechanischen Systeme unendlichdimensionale Hilberträume benötigt, können die wesentlichen Grundideen der mathematischen Struktur der Quantentheorie bereits an Hand des einfacheren Spezialfalls eines endlichdimensionalen Zustandsraumes erläutert werden. B.1 Grundpostulate der Quantentheorie Zu jedem quantenmechanischen System gibt es einen geeigneten Hilbertraum H, den sogenannten Zustandsraum des betrachteten Systems. Obwohl der Zustandsraum i.Allg. unendlichdimensional ist, gibt es physikalische Probleme, bei denen nur ein endlicher Teilraum des gesamten Hilbertraums relevant ist. Wir wollen uns also bei der Formulierung der Axiome der Quantentheorie auf Systeme beschränken, die sich durch einen endlichdimensionalen Zustandsraum H (unitären Vektorraum) beschreiben lassen. Die beobachtbaren Größen (Observable) des betrachteten quantenmechanischen Systems werden durch die hermiteschen Elemente der Observablenalgebra L(H) repräsentiert. Beispiele für Observable wären etwa die Energie oder der Drehimpuls des Systems. Der wesentliche Unterschied zur klassischen Physik liegt darin, dass man es in der Quantenmechanik mit einer nichtkommutativen Obervablenalgebra zu tun hat, d.h. es gibt Operatoren A, B ∈ L(H) mit [A, B] = 0. 77 ANHANG B. EINFACHE QUANTENSYSTEME 78 Die möglichen Messwerte der durch den hermiteschen Operator A ∈ L(H) beschrieben Observablen sind die Elemente des Spektrums von A (d.h. die Eigenwerte von A). D.h. bei einer Messung der Observablen A kann als Messergebnis immer nur einer der Eigenwerte a1 , . . . , an von A auftreten. Bemerkung: Eine besondere Rolle spielen die Projektionsoperatoren, die als hermitesche Operatoren ja ebenfalls beobachtbare Größen repräsentieren. Ist ein hermitescher Operator durch seine Spektraldarstellung A= m aα Pα α=1 gegeben (m ist die Anzahl der verschiedenen Eigenwere von A), so entspricht dem Projektor Pα (der auf den Eigenraum des Eigenwertes aα projiziert) die Durchführung des folgenden ja-nein-Experiments: Erhält man bei einer Messung ” der Observablen A den Messwert aα ?“ Da der Projektionsoperator Pα nur die Eigenwerte 1 und 0 besitzt, entspricht dem Eigenwert 1 die Antwort ja“ und ” dem Eigenwert 0 die Antwort nein“. ” Die möglichen Zustände des Systems werden durch lineare Funktionale auf der Observablenalgebra beschrieben, die zusätzlich nicht negativ und normiert sind. Bei einem Zustand ω handelt es sich also um eine Abbildung ω : L(H) → mit folgenden Eigenschaften: 1. ω(c1 A1 + c2 A2 ) = c1 ω(A1 ) + c2 ω(A2 ), 2. ω(A† A) ≥ 0 c1,2 ∈ , A1,2 ∈ L(H) ∀ A ∈ L(H) 3. ω(1) = 1 Durch den Zustand ω wird jeder Observablen A ihr Erwartungswert ω(A) zugeordnet. Für den Projektionsoperator Pα = Pα† = Pα Pα erhält man wegen der Eigenschaft 2 pα = ω(Pα ) = ω(PαPα ) = ω Pα† Pα ≥ 0. pα = ω(Pα ) ist die Wahrscheinlichkeit bei einer Messung der Observablen A den Messwert aα zu erhalten, wenn sich das System in dem durch ω beschriebenen Zustand befindet. Wegen der Vollständigkeitsrelation m Pα = 1 α=1 und der Linearität der Normierung von ω erhält man ( ' m m m pα = ω(Pα ) = ω Pα = ω(1) = 1 α=1 α=1 α=1 B.1. GRUNDPOSTULATE DER QUANTENTHEORIE 79 für die Wahrscheinlichkeit irgendeinen der Eigenwerte von A zu messen. Der Erwartungswert von A im Zustand ω lässt sich dann, wieder unter Verwendung der Linearität von ω, in der Form ' m ( m m ω(A) = ω aα Pα = aα ω(Pα) = aα pα α=1 α=1 α=1 schreiben. Präpariert man eine große Anzahl N von identischen Kopien des Systems alle im gleichen Zustand ω und führt dann an jeder dieser Kopien eine Messung der Observablen A durch, so wird man Nα -mal den Messwert aα erhalten, wobei Nα −→ pα N N →∞ und m α=1 Nα = N ist. Für den Mittelwert der Messwerte ergibt sich daher m m Nα aα aα pα = ω(A). −→ N N →∞ α=1 α=1 Beispiele von Zuständen: 1. ψ ∈ H sei ein Einheitsvektor. Dann wird durch ω(A) = ψ|Aψ ∀ A ∈ L(H) ein sogenannter reiner Zustand definiert. Man überzeugt sich leicht, dass die Eigenschaften 1-3 tatsächlich erfüllt sind. Man nennt ψ dann den Zustandsvektor des entsprechenden reinen Zustands. Bemerkung: Der Zustandsvektor eiϕ ψ beschreibt den selben Zustand. 2. ω1 , ω2 , . . . , ωr seien Zustände r und p1 , p2 , . . . , pr positive Zahlen mit r j=1 pj = 1. Dann ist ω = j=1 pj ωj ebenfalls ein Zustand. Insbesondere wird durch r ω(A) = pj ψj |Aψj ∀A ∈ L(H) j=1 ein Zustand definiert, wenn die |ψj (nicht notwendigerweise aufeinander normal stehende) Zustandsvektoren (ψj |ψj = 1) sind. Zustände, die man nicht in der Form ω(A) = ψ|Aψ schreiben kann, heißen gemischte Zustände. Man kann eine Standardform für die Beschreibung von Zuständen angeben. Da ω(A) linear in A ist, muss sich ω(A) in der Form ω(A) = ρkl Alk k,l ANHANG B. EINFACHE QUANTENSYSTEME 80 schreiben lassen, wobei Alk = ϕl |Aϕk die Matrixelemente des Operators A bezüglich einer beliebigen ONB {ϕ1 , . . . , ϕn } (n = dim H) sind. Die Koeffizienten ρkl ∈ kann man dann ebenfalls als die Matrixelemente eines Operators ρ ∈ L(H) bezüglich der selben ONB auffassen (ρkl = ϕk |ρϕl ). ⇒ n n ω(A) = ϕk | ρϕl ϕl | Aϕk k=1 l=1 n = ϕk | ρAϕk = Tr(ρA), k=1 wobei die Spur eines Operators B, n n TrB = ϕk | Bϕk = Bkk k=1 k=1 unabhängig von der gewählten Basis ist. (Tr = trace = Spur). Bis jetzt wurde nur die Linearität von ω verwendet. Die Eigenschaft ω A† A ≥ 0 ∀ A ∈ L(H) liefert eine weitere Einschränkung an den Operator ρ. Nimmt man für A nämlich den eindimensionalen Projektor A = |ϕϕ| (wobei |ϕ ein beliebiger Einheitsvektor ist), so erhält man wegen A† A = A ϕ | ρϕ ≥ 0. Ergänzt man nämlich |ϕ zu einer ONB {|ϕ, |ϕ2, . . . , |ϕn } von H, so ergibt sich n Tr ρA A = Tr (ρA) = ϕ | ρϕ ϕ | ϕ + ϕk | ρϕ ϕ | ϕk † 1 k=2 0 = ϕ | ρϕ ≥ 0 und daher mit |ψ = c|ϕ (c ∈ ) die Aussage ψ | ρψ ≥ 0 ∀ ψ ∈ H. Einen Operator mit dieser Eigenschaft nennt man nicht negativ (ρ ≥ 0). Man kann zeigen, dass die folgenden Aussagen äquivalent sind: 1. ψ | ρψ ≥ 0 ∀ ψ ∈ H. B.1. GRUNDPOSTULATE DER QUANTENTHEORIE 81 2. ρ ist hermitesch und alle Eigenwerte sind ≥ 0. 3. Es gibt einen Operator A ∈ L(H), sodass ρ = A† A. Beweis: 1 ⇒ 2 : Es seien ψk und ψl zwei aufeinander orthogonal stehende Einheitsvektoren. Dann ist laut Vorraussetzung ψk + ψl |ρ(ψk + ψl ) = ρkk + ρll +ρkl + ρlk ≥ 0 ≥0 ⇒ Im(ρkl + ρlk ) = 0, ≥0 ψk + iψl |ρ(ψk + iψl ) = ρkk + ρll +iρkl − iρlk ≥ 0 ≥0 ⇒ ⇒ Re(ρkl − ρlk ) = 0, ≥0 ρkl = ρ∗lk ⇒ ρ = ρ† . Ist nun χk = 0 ein Eigenvektor von ρ zum Eigenwert ρk , so ist χk |ρχk = χk |ρk χk = ρk χk |χk ≥ 0 ⇒ ρk ≥ 0. >0 2 ⇒ 3 : Laut Voraussetzung gibt es eine ONB {χ1 , . . . , χn } von Eigenvektoren von ρ mit Eigenwerten ρk ≥ 0. In der Spektraldarstellung hat ρ die Gestalt ρ= n ρk |χk χk | k=1 Man kann hier problemlos den hermiteschen (und ebenfalls nicht negativen) Operator n √ √ ρ= ρk |χk χk | k=1 √ √ √ √ bilden und erhält ρ = ρ ρ = ( ρ)† ρ. 3 ⇒ 1 : ψ|ρ|ψ = ψ|A† Aψ = Aψ|Aψ ≥ 0. Die Implikationskette 1 ⇒ 2 ⇒ 3 ⇒ 1 ist somit geschlossen und die Äquivalenz von 1,2,3 gezeigt. Jede dieser drei Eigenschaften kann daher zur Definition eines nicht negativen Operators herangezogen werden. Es gibt also eine ONB {χ1 , . . . , χn } von Eigenvektoren von ρ mit Eigenwerten ρk ≥ 0. Schließlich impliziert die Normierungsbedingung ω(1) = Trρ = 1 ⇒ n k=1 ρk = 1. ANHANG B. EINFACHE QUANTENSYSTEME 82 Der Dichteoperator ρ= n ρk |χk χk | , ρk ≥ 0, Trρ = k=1 n ρk = 1, k=1 liefert also mit ω(A) = Tr(ρA) ∀ A ∈ L(H) die gewünschte Standardform für die Darstellung des Zustands ω. Man kann sich also einen beliebigen Zustand ω als statistisches Gemisch von reinen Zuständen (repräsentiert durch die Zustandsvektoren |χk ) vorstellen, wobei |χk mit der Wahrscheinlichkeit ρk auftritt. Ein reiner Zustand ist dadurch charakterisiert, dass alle ρk bis auf eines verschwinden. Der Dichteoperator, der dem Zustandsvektor |ψ entspricht, ist ρψ = |ψψ|, also ein eindimensionaler Projektor (ρ†ψ = ρψ , ρ2ψ = ρψ ). Die Eigenschaft ρ2 = ρ charakterisiert jene Dichteoperatoren, die reinen Zuständen entsprechen, denn in diesem Fall kann n ρ nur die Eigenwerte 0, 1 besitzen und wegen der Normierungsbedingung k=1 ρk = 1 kann der Eigenwert 1 nur ein einziges Mal auftreten ⇒ ρ = |ψψ|. Für den Erwartungswert eines Operators A in einem beliebigen (gemischten) Zustand ergibt sich ω(A) = Tr(ρA) = n χk | ρAχk = k=1 n ρk χk | Aχk . k=1 Hat A die Spektraldarstellung A= m aα Pα , α=1 so erhält man ω(A) = n m k=1 α=1 ρk χk | Pα χk aα . pkα Es treten hier sowohl die quantenmechanischen“ Wahrscheinlichkeiten pkα als ” auch die klassischen“ statistischen Wahrscheinlichkeiten ρk auf. pkα ist die Wahr” scheinlichkeit bei einer Messung der Observablen A in dem durch den Zustandsvektor |χk beschriebenen reinen Zustand den Messwert aα zu erhalten. Dagegen ist ρk die Wahrscheinlichkeit in dem gemischten Zustand ω den durch |χk beschriebenen reinen Zustand vorzufinden. Die Wahrscheinlichkeit bei einer Messung von A im Zustand ω den Messwert aα zu erhalten, ist daher ω (Pα ) = n k=1 ρk χk | Pα χk = n k=1 ρk pkα . B.1. GRUNDPOSTULATE DER QUANTENTHEORIE 83 Ist ωψ ein reiner Zustand (mit Dichteoperator ρψ = |ψψ|), so vereinfachen sich die Formeln: ωψ (A) = ψ | Aψ = m ψ | Pα ψaα , α=1 ωψ (Pα ) = ψ | Pα ψ. Verwendet man die Spektraldarstellung Pα = dα |α, rα, r| r=1 des Projektors auf den Eigenraum Mα , so kann man auch schreiben: ωψ (Pα ) = dα ψ | α, rα, r | ψ = dα r=1 |α, r | ψ|2 . r=1 Ist dα = 1, so hat man einfach ωψ (Pα ) = |α|ψ|2. Beispiele für Dichteoperatoren gemischter Zustände: 1. Sei dim H = n, dann beschreibt der Dichteoperator ρ = 1/n den Zustand mit maximaler Mischung. 2. Jener hermitesche Operator, welcher der Observablen Gesamtenergie des ” Systems“ entspricht, wird als Hamiltonoperator H bezeichnet. Befindet sich das betrachtete System im thermischen Gleichgewicht mit einem Wärmebad“ der absoluten Temperatur T , so wird der entsprechende ” Zustand des Systems durch den Dichteoperator ρ= e−H/kT Tre−H/kT beschrieben, wobei k 1.38 × 10−23 JK−1 die Boltzmann-Konstante ist. Ist {|ϕ1 , . . . , |ϕn } eine ONB von Eigenvektoren von H, H|ϕk = Ek |ϕk , ϕk |ϕl = δkl , n |ϕk ϕk | = 1, k=1 so ist die Spektraldarstellung des Dichteoperators durch ρ= n e−El /kT l=1 gegeben. Z |ϕl ϕl | , Z= n l=1 e−El /kT ANHANG B. EINFACHE QUANTENSYSTEME 84 B.2 Spin 1/2 System Die doch einigermaßen abstrakten allgemeinen Spielregeln der Quantentheorie sollen nun durch ihre Anwendung auf ein möglichst einfaches quantenmechanisches System mit etwas mehr Leben erfüllt werden. Sieht man von den Translationsfreiheitsgraden eines Elektrons (oder eines beliebigen anderen Spin 1/2 Teilchens) ab, so werden seine Spinfreiheitsgrade durch einen zweidimensionalen Zustandsraum beschrieben. Da ein zweidimensionaler unitärer Vektorraum isomorph zu U 2 ist, kann man die Zustandsvektoren durch komplexe zweidimensionale Spaltenvektoren darstellen, die Observablenalgebra ist dann nichts anderes als die Menge der komplexen 2 × 2-Matrizen. Den drei entsprechen räumlichen Komponenten S1 , S2 , S3 des Spindrehimpulsvektors S die hermiteschen Matrizen Sk = h̄ σk 2 (1 ≤ k ≤ 3) mit den bereits früher besprochenen Paulischen Spinmatrizen σk . Die Komponenten des Spinvektors in einer beliebigen räumlichen Richtung n (|n| = 1) wird durch die Matrix 3 h̄ h̄ h̄ n1 − in2 n3 nk σk = n · σ = −n3 2 2 2 n1 + in2 k=1 beschrieben. Die Eigenwerte dieser Matrix sind ±h̄/2, d.h. bei der Messung einer Spinkomponente in einer beliebigen räumlichen Richtung kann als Messwert nur entweder +h̄/2 oder −h̄/2 auftreten (daher Spin 1/2“ ). ” Die Matrix h̄/2 0 S3 = 0 −h̄/2 besitzt die ONB von Eigenvektoren 1 , χ↑ = 0 wobei S3 χ↑ = h̄ χ↑ , 2 Dagegen besitzt S1 = die ONB von Eigenvektoren 1 ϕ↑ = √ 2 1 1 , χ↓ = 0 1 , h̄ S3 χ↓ = − χ↓ . 2 0 h̄/2 h̄/2 0 1 ϕ↓ = √ 2 1 −1 , B.2. SPIN 1/2 SYSTEM 85 mit S1 ϕ ↑ = h̄ ϕ↑ , 2 h̄ S1 ϕ ↓ = − ϕ ↓ . 2 Nehmen wir nun an, dass sich das System in dem durch den Zustandsvektor χ↑ beschriebenen reinen Zustand ω befindet (d.h. ω(A) = χ†↑ Aχ↑ , A ∈ L(U 2 )). Die Wahrscheinlichkeit bei einer Messung der Spinkomponente S3 in diesem Zustand den Messwert +h̄/2 zu erhalten, ist durch den Erwartungswert des Projektionsoperators χ↑ χ†↑ gegeben: † ω χ↑ χ↑ = χ†↑ χ↑ χ†↑ χ↑ = 1. 1 1 Das heißt, bei einer Messung von S3 erhält man in diesem Zustand immer den Messwert +h̄/2. Dementsprechend ist die Wahrscheinlichkeit in diesem Zustand für S3 den Messwert −h̄/2 zu erhalten gleich null: † ω χ↓ χ↓ = χ†↑ χ↓ χ†↓ χ↑ = 0. 0 0 Der Erwartungswert von S3 ist in diesem Zustand dann natürlich durch ω(S3 ) = χ†↑ S3 χ↑ = h̄ 2 gegeben. Misst man dagegen in dem selben Zustand die Spinkomponente S1 , so erhält man für die Erwartungswerte der Projektoren ϕ↑ ϕ†↑ , ϕ↓ ϕ†↓ ω ϕ↑ ϕ†↑ 1 = χ†↑ ϕ↑ ϕ†↑ χ↑ = , 2 √1 2 1 √ 2 1 ω ϕ↓ ϕ†↓ = χ†↑ ϕ↓ ϕ†↓ χ↑ = , 2 √1 2 1 √ 2 was bedeutet, dass man bei einer Messung von S1 in der Hälfte der Fälle den Messwert +h̄/2 und in der anderen Hälfte den Messwert −h̄/2 erhalten wird. Der Erwartungswert von S1 muss in dem betrachteten Zustand dann klarerweise verschwinden: ω(S1 ) = χ†↑ S1 χ↑ = 0 Wir wollen noch kurz den allgemeinen Fall der Messung der Spinkomponente = h̄ n · σ , n · S 2 |n| = 1 ANHANG B. EINFACHE QUANTENSYSTEME 86 besprechen. Man kann den räumlichen Einheitsvektor n in der Form ⎛ ⎞ ⎛ ⎞ n1 sin θ cos φ ⎝ n2 ⎠ = ⎝ sin θ sin φ ⎠ n3 cos θ parametrisieren. Für den Projektor P↑ auf den (eindimensionalen) Eigenraum zum Eigenwert +1 von n · σ erhält man 1 1 + cos θ sin θ e−iφ 1 + n · σ = P↑ = sin θ eiφ 1 − cos θ 2 2 und für den Projektor P↓ auf den Eigenraum zum Eigenwert −1 von n · σ 1 1 − n · σ 1 − cos θ − sin θ e−iφ = P↓ = . 2 2 − sin θ eiφ 1 + cos θ Nehmen wir wieder an, dass sich unser System in dem durch den Zustandsvektor 1 χ↑ = 0 beschriebenen reinen Zustand ω befindet, so ist ω (P↑ ) = 1 + cos θ θ = cos2 , 2 2 ω (P↓ ) = 1 − cos θ θ = sin2 . 2 2 Für den speziellen Wert θ = π/2 ergeben sich die früher erhaltenen Resultate. Für den durch die Dichtematrix ρ = 1/2 beschriebenen maximal gemischten Zustand (entspricht z.B. einem Strahl unpolarisierter Teilchen) erhält man die Erwartungswerte 1 Tr(ρA) = TrA. 2 Somit verschwinden in diesem Fall die Erwartungswerte von S1 , S2 , S3 , dagegen 2 erhält man wegen Si2 = h̄4 1 h̄2 Tr(ρSi2 ) = . 4 Befindet sich ein Spin 1/2-System mit magnetischem Moment μ = μσ so ist der Hamiltonoperator in einem äußeren Magnetfeld B, H = −μ · B. B.3. ZEITENTWICKLUNG IN DER QUANTENMECHANIK 87 Legt man die 3-Achse des räumlichen Koordinatensystems in Richtung des Ma = Be3 ), so ist gnetfeldes (B −μB 0 H = −μBσ3 = 0 +μB diagonal mit Energieeigenwerten E↑ = −μB, E↓ = +μB und dazugehörigen (normierten) Eigenvektoren 1 0 χ↑ = , χ↓ = . 0 1 Befindet sich dieses magnetische Moment nun im Kontakt mit einem Wärmebad der Temperatur T , so ist seine Dichtematrix μB/kT 1 1 −H/kT 0 e , = ρ= e 0 e−μB/kT Z Z wobei μB . kT Die Erwartungswerte vo μ1 und μ2 (bzw. auch S1 und S2 ) verschwinden in diesem Zustand, dagegen erhält man für den Erwartungswert von μ3 den Ausdruck Z = Tre−H/kT = eμB/kT + e−μB/kT = 2 cosh Tr(ρμ3 ) = μ tanh μB , kT der in der Theorie des Paramagnetismus eine Rolle spielt. B.3 Zeitentwicklung in der Quantenmechanik In der Quantenmechanik wird die Zeitentwicklung eines Zustandsvektors ψ(t) ∈ H (im Schrödingerbild) durch die Schrödingergleichung ih̄ dψ(t) = Hψ(t) dt beschrieben. Dabei ist H ein hermitescher Operator (Hamiltonoperator), welcher der Observablen Gesamtenergie des betrachteten Systems“ entspricht. Die ” Lösung der Schrödingergleichung ist dann (wenn H zeitlich konstant ist) durch ψ(t) = exp(−iHt/h̄) ψ(0) gegeben. Da H hermitesch ist, ist der hier auftretende Operator exp(−iHt/h̄) ANHANG B. EINFACHE QUANTENSYSTEME 88 unitär, woraus folgt, dass sich die Norm des Zustandsvektors nicht ändert: ψ(t)|ψ(t) = ψ(0)|ψ(0). Da H weiters eine ONB von Eigenvektoren, {φ1, . . . φn }, Hφk = Ek φk besitzt (E1 , . . . En sind die Energieeigenwerte), hat H die Spektraldarstellung H= n Ek φk φ†k = k=1 n Ek |φk φk |. k=1 Somit ist exp(−iHt/h̄) = n e−iEk t/h̄ φk φ†k = k=1 n e−iEk t/h̄ |φk φk | k=1 und ψ(t) = exp(−iHt/h̄) ψ(0) n = e−iEk t/h̄ φk φ†k ψ(0) k=1 = n e−iEk t/h̄ |φk φk |ψ(0). k=1 Beschreibt man den dem Vektor |ψ(t) entsprechenden reinen Zustand durch den Dichteoperator ρψ (t) = |ψ(t)ψ(t)|, so liest man die Zeitentwicklung ρψ (t) = exp(−iHt/h̄) ρψ (0) exp(iHt/h̄) ab. Diese Formel für die Zeitentwicklung, ρ(t) = exp(−iHt/h̄) ρ(0) exp(iHt/h̄) gilt auch ganz allgemein für Dichtematrizen ρ(t), die gemischten Zuständen entsprechen. Differenziert man die letzte Gleichung nach der Zeit, so erhält man die von Neumann-Gleichung dρ(t) = [H, ρ(t)]. ih̄ dt Mit ihrer Hilfe kann die Zeitentwicklung eines gemischten Zustands auch dann beschrieben werden, wenn der Hamiltonoperator explizit von der Zeit abhängt. Anhang C Literatur C.1 Statistische Physik und Thermodynamik T. Fließbach, Statistische Physik, BI Wissenschaftsverlag F. Reif, Statistische Physik (Berkeley Physik Kurs, Band 5), Vieweg F. Reif, Fundamentals of Statistical and Thermal Physics, McGraw-Hill B. Diu, C. Guthmann, D. Lederer, B. Roulet, Grundlagen der statistischen Physik, Walter de Gruyter W. Grimus, Skriptum zur Vorlesung Theoretische Physik T4: Statistische Physik ” und Thermodynamik“ (Sommersemester 2007) C.2 Mathematische Methoden H. Neufeld, Skriptum zur Vorlesung Mathematische Methoden der Physik I“ ” (Sommersemester 2008) F. Embacher, Mathematische Grundlagen für das Lehramtsstudium Physik, Vieweg + Teubner 89