T30f Theoretische Teilchen- und Kernphysik Prof. Dr. Nora Brambilla Quantenmechanik I Vorlesung Sommersemester 2016 TUM Prof. Dr. Nora Brambilla Dr. Johannes Heinrich Weber Technische Universität München Physik Department Inhaltsverzeichnis 1 Einleitung 6 2 Ursprünge der Quantenmechanik 8 2.1 Klassische Physik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2 Photonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.2.1 Strahlung eines Schwarzen Körpers (Hohlraumstrahlung) . . . . . . 9 2.2.2 Photoelektrischer Effekt . . . . . . . . . . . . . . . . . . . . . . . . 12 2.2.3 Compton Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3 2.4 Atomare Spektren und Quantisierung von Materie . . . . . . . . . . . . . . 15 2.3.1 Atomare Spektren . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.3.2 Diskrete Energieniveaus . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3.3 Experimentelle Bestätigung der Existenz der Energieniveaus: der Franck-Hertz Versuch . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3.4 Andere Beispiele der Quantisierung: Raumquantisierung . . . . . . 21 Erfolge und Grenzen der alten Quantentheorie . . . . . . . . . . . . . . . . 22 3 Wellenfunktion und Schrödingergleichung 25 3.1 Wellen- und Teilchenaspekte von Strahlung . . . . . . . . . . . . . . . . . . 25 3.2 Teilchencharakter von Materie und de Broglie’sche Hypothese . . . . . . . 25 3.3 Die Schrödinger Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.4 Experimentelle Bestätigung der Welleneigenschaften von Materieteilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.5 Kontinuitätsgleichung und statistische Interpretation der Wellenfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.6 Die statistische Interpretation und die Beschreibung mittels Welle-TeilchenDualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.7 Heisenberg’sches Unschärfeprinzip und Unschärferelationen . . . . . . . . . 36 3.7.1 Beugung an einem Spalt . . . . . . . . . . . . . . . . . . . . . . . . 37 3.7.2 Lokalisation mit einem Mikroskop . . . . . . . . . . . . . . . . . . . 38 3.7.3 Energie-Zeit-Unschärfe . . . . . . . . . . . . . . . . . . . . . . . . . 38 1 4 Die Schrödingergleichungen 4.1 40 Mathematische Eigenschaften der Schrödingergleichung und des Hamiltonoperators . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.1.1 Schrödingergleichung . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.2 Operatoren und ihre Wirkung auf Elemente des Hilbertraums . . . . . . . 41 4.3 b . . . . . . . . . . 43 Eigenwerte und Eigenvektoren des Hamiltonoperators H 4.4 Entwicklung der Wellenfunktion nach einer Basis von orthonormalen Eigenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.5 Allgemeine Lösung der Schrödingergleichung . . . . . . . . . . . . . . . . . 49 4.6 Physikalische Interpretation der Schrödingergleichung . . . . . . . . . . . . 51 5 Allgemeine Prinzipien der Quantenmechanik und Formalismen 56 5.1 Allgemeine Postulate der Quantenmechanik . . . . . . . . . . . . . . . . . 56 5.2 Orts- und Impulsobservablen: Größen mit klassischen Analoga . . . . . . . 64 5.2.1 Ort als Observable . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 5.2.2 Impuls als Observable . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.2.3 Unschärferelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 5.2.4 Allgemeinere Observablen . . . . . . . . . . . . . . . . . . . . . . . 68 5.3 Kommutatoren und Unbestimmtheitsrelationen . . . . . . . . . . . . . . . 71 5.4 Zeitabhängigkeit des Mittelwerts einer Observablen und Ehrenfest’sches Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.5 Konstanten der Bewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.6 Drehimpuls eines Teilchens . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.7 Parität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 6 Anwendungen der Schrödingergleichung: eindimensionale Probleme 80 6.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 6.2 Freies Teilchen 6.3 Potentialtopf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6.3.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 Allgemeine Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . 83 2 6.3.2 6.4 6.5 Unendlich tiefer Potentialtopf . . . . . . . . . . . . . . . . . . . . . 84 Endlicher Potenialtopf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 6.4.1 Bindungszustände (diskretes Spektrum, −V0 < E < 0) . . . . . . . 87 6.4.2 Streuzustände (Kontinuierliches Spektrum, E > 0) Tunneleffekt an der Potentialschwelle . . . . . . . . . . . . . . . . . . . . . 92 6.5.1 Endliche Potentialbarriere (V0 > E) . . . . . . . . . . . . . . . . . . 92 6.5.2 Transmissionskoeffizient beim Tunneleffekt . . . . . . . . . . . . . . 92 6.5.3 Physikalische Beispiele für den Tunneleffekt . . . . . . . . . . . . . 93 7 Harmonischer Oszillator 7.1 . . . . . . . . . 90 95 Algebraische Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 7.1.1 Leiteroperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 7.1.2 Spektrum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 7.1.3 Nullpunktsenergie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 7.2 Vergleich zum Klassischen Oszillator . . . . . . . . . . . . . . . . . . . . . 101 7.3 Besetzungszahldarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 7.4 Analytische Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 7.5 Kohärente Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8 Anwendungen der Schrödingergleichung mit Separation der Variablen: Teilchen im Zentralpotential 109 8.1 Schrödinger Gleichung in drei Dimensionen . . . . . . . . . . . . . . . . . . 109 8.2 Zentralpotential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.2.1 Multiplikativer Separationsansatz . . . . . . . . . . . . . . . . . . . 111 8.2.2 Die Azimuthalgleichung . . . . . . . . . . . . . . . . . . . . . . . . 112 8.2.3 Die Polargleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 8.2.4 Die Radialgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 8.2.5 Parität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 8.3 Freies Teilchen in sphärischen Koordinaten . . . . . . . . . . . . . . . . . . 121 8.4 Coulomb Potential und Wasserstoff Atom . . . . . . . . . . . . . . . . . . . 123 3 8.4.1 Exkurs: Relativ- und Schwerpunktskoordinaten . . . . . . . . . . . 126 8.4.2 Termschema und Quantenzahlen . . . . . . . . . . . . . . . . . . . 127 8.4.3 Struktur der eigentlichen Eigenfunktionen . . . . . . . . . . . . . . 128 9 Geladene Teilchen im elektromagentischen Feld 132 9.1 Bewegung im konstanten elektromagnetischen Feld . . . . . . . . . . . . . 134 9.2 Normaler Zeeman Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 10 Spin und Drehimpuls 138 10.1 Herleitung der Quantisierung . . . . . . . . . . . . . . . . . . . . . . . . . 139 10.1.1 Normierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 10.2 Bezug zum Bahndrehimpuls . . . . . . . . . . . . . . . . . . . . . . . . . . 143 10.3 Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 10.3.1 Historische Perspektive . . . . . . . . . . . . . . . . . . . . . . . . . 144 10.3.2 Das Stern-Gerlach Experiment . . . . . . . . . . . . . . . . . . . . . 144 10.3.3 Vektormodell für Atome, Drehimpuls-Kopplung, Spin-Anomalie . . 144 10.3.4 Formalismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 10.4 Teilchen mit Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 10.4.1 Schrödinger-Darstellung für ein Teilchen mit Spin . . . . . . . . . . 146 10.4.2 Zustände und Spinoren . . . . . . . . . . . . . . . . . . . . . . . . . 148 10.4.3 Schrödingergleichung für ein Teilchen mit Spin . . . . . . . . . . . . 150 10.5 Kopplung von Drehimpulsen & Clebsch-Gordan Koeffizienten . . . . . . . 152 10.5.1 Addition von Spin 1/2 Operatoren . . . . . . . . . . . . . . . . . . 156 10.5.2 Addition von Bahndrehimpuls und Spin 1/2 Operatoren . . . . . . 158 11 Näherungsmethoden zur Lösung der Schrödingergleichung 159 11.1 Störungstheorie (Perturbative Methode) . . . . . . . . . . . . . . . . . . . 159 11.1.1 Zeitunabhängige Störungstheorie (nicht-entarteter Fall) . . . . . . . 159 11.1.2 Anwendungen der Störungstheorie . . . . . . . . . . . . . . . . . . . 162 11.1.3 Relativistische Korrekturen beim Wasserstoff . . . . . . . . . . . . . 163 4 11.2 Variationsmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 Anhänge 167 A Notation und Konventionen 167 A.1 Einheiten und Werte von Naturkonstanten . . . . . . . . . . . . . . . . . . 167 A.2 Vektoren und Metrik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 A.3 Wellenfunktionen und Zustandsvektoren . . . . . . . . . . . . . . . . . . . 169 A.4 Fourier-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 A.5 Delta-Distribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 A.5.1 Eigenschaften der δ- und θ-Funktion . . . . . . . . . . . . . . . . . 171 A.5.2 Darstellungen der Dirac’schen Delta-Distribution . . . . . . . . . . 171 B Zusammenfassung des Formalismus B.1 172 Hilbertraum, Operatoren und Skalarprodukt . . . . . . . . . . . . . . . . . 172 B.1.1 Allgemeine Eigenschaften von Vektorräumen . . . . . . . . . . . . . 172 B.1.2 Operatoren und ihre Wirkung auf Elemente von Vektorräumen . . . 172 B.1.3 Skalarprodukt und Norm . . . . . . . . . . . . . . . . . . . . . . . . 174 B.1.4 Weitere Eigenschaften: Operatornorm, Beschränktheit . . . . . . . . 174 B.1.5 Lineare Abhängigkeit, Orthogonalität, Vollständigkeit, Basis, Dimensionalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 B.2 Eigenschaften von Hilberträumen . . . . . . . . . . . . . . . . . . . . . . . 176 C Dirac Notation 177 D Abbildungen und Tabellen 178 D.1 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 D.2 Tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 Bibliographie 194 5 1 Einleitung “Quantenmechanik” (QM) ist die genaue Beschreibung des Verhaltens von Materie und Licht und – im Speziellen – von Prozessen auf atomaren Skalen. QM ist einer der Grundpfeiler der Physik. Sie ist essentiell sowohl für moderne Atom-, Molekül-, Kern- und Elementarteilchenphysik als auch für große Teile der Chemie und Physik der Kondensierten Materie. Im Besonderen ist die Kombination aus QM und spezieller Relativitätstheorie der Ursprung von Quantenfeldtheorie (QFT), welche das theoretische Fundament des Standardmodells der Teilchenphysik bildet: dieses beschreibt derzeit unser fundamentalstes Wissen über die Natur. QM hat unser Verständnis von Systemen auf Längenskalen weniger Nanometer beeinflusst, welche für Chemie, Materialwissenschaften, Optik und Elektronik eine wesentliche Rolle spielen. Die Existenz von Orbitalen und Energieniveaus ist ausschließlich durch QM erklärbar. Sie erklärt damit das Verhalten von Isolatoren, Leitern und Halbleitern sowie Riesenmagnetowiderstand. Sie erklärt die Existenz von “Löchern” und den Transport von Löchern und Elektronen in elektronischen Geräten. QM spielt eine wesentliche Rolle in Photonik, Quantenelektronik, Mikroelektronik und vielen neuen und zukünftigen Technologien. Ein solcher Bereich ist die Nanotechnik, ermöglicht durch Aufkommen der Nano-Fabrikation in der jüngsten Vergangenheit. Während Transistoren in der Elektronik immer kleiner werden, ändert sich die Art und Weise wie Elektronen sich durch die Bauteile bewegen: nano-elektronischer Transport unterscheidet sich deutlich von mikroelektronischem Transport. Die Quantisierung des elektromagnetischen Feldes ist wesentlich für die Forschunsbereiche der Nano- und Quantenoptik. Sie erklärt wie Photonen mit atomaren Systemen und sonstiger Materie wechselwirken, insbesondere erklärt QM die Strahlung eines heißen Körpers und seine Farbveränderung mit der Temperatur. Sie erlaubt die Verwendung von elektromagnetischen oder optischen Feldern um Quanteninformation zu tragen. Außerdem wird QM benötigt um die Wechselwirkung von Photonen in Solarzellen zu verstehen, wie auch in vielen anderen Bereichen der Materialwissenschaften. Wenn zwei Objekte auf sehr geringen Abstand zusammengeführt werden, erfahren sie eine Kraft – die sogenannte Casimir-Kraft – die lediglich mit den Mitteln der QM verstanden werden kann. Dies ist wichtig für unser Verständnis von mikro-/nano-elektromechanischen Sensorsystemen. Darüber hinaus ist das Verständnis von Spins für Spintronik unverzichtbar, eine weitere aufkommende Technologie in der Riesenmagentowiderstand, magnetischer Tunnelwiderstand sowie Spintransfer verwendet werden. QM ermöglicht ebenso die Forschungsbereiche Quanteninformation, Quantenkryptographie und Quantencomputer. Es ist offenkundig dass die reichhaltige Welt der Quantenphysik auf viele Aspekte zukünftiger Technologien einen großen Einfluss haben wird. Das Verhalten physikalischer Objekte auf kleinen Skalen ist im Widerspruch zu Ihrer direkten Erfahrung. Physikalische Objekte verhalten sich weder wie Wellen noch wie Teilchen noch wie irgendetwas anderes, das Sie jemals gesehen haben. Wir haben keine direkte Erfahrung in dieser Domäne der Physik und daher keinerlei Intuition wie sich diese mikroskopischen Systeme verhalten. Das Verhalten von Quantensystemen unterscheidet sich wesentlich vom Verhalten makroskopischer Systeme in der “Klassischen Mechanik”. Quantenmechanische Gleichungen wurden postuliert um experimentelle Beobachtungen zu erklären, aber die Interpretation der tieferen Bedeutung der Gleichungen erwies sich 6 als schwierig, da atomares Verhalten von unserer Alltagserfahrung grundverschieden ist. Die Prinzipien der Quantenmechanik sind derart inkompatibel zu unserer alltäglichen Intuition, dass sie am ehesten durch einen Blick auf ihre Vorgeschichte motiviert werden können. Im nächsten Kapitel werden wir einige Probleme betrachten mit denen Physiker zu Beginn des zwanzigsten Jahrhunderts konfrontiert waren und die letzten Endes zur modernen Quantenmechanik führten. Literaturempfehlung: R.P. Feynman Lectures of Physics, Volume 3, Sections 1.1 – 1.7 7 2 Ursprünge der Quantenmechanik Newtonsche Mechanik und Maxwells Theorie des elektromagnetischen Felds waren die Grundpfeiler der Physik bis zum Ende des neunzehnten Jahrhunderts. Anschließend wurde jedoch eine Reihe von Phänomenen entdeckt, welche im Zusammenhang dieser Theorien völlig unverständlich waren. Deren Erklärung führte zu einer Kombination neuer Hypothesen, aus welchen sich über die Jahre die heutige Form der Quantenmechanik (QM) heraus kristallisierte. 2.1 Klassische Physik Bis zum Beginn des zwanzigsten Jahrhunderts konnten physikalische Phänomene unter Verwendung der Klassischen Physik erklärt werden. In der Klassischen Physik ordnet man dem betrachteten physikalischen System eine gewisse Zahl von dynamischen Variablen zu; jede dieser Variablen hat zu jedem Zeitpunkt einen wohldefinierten Wert und der vollständige Satz dieser Werte definiert den dynamischen Zustand des Systems zu diesem Zeitpunkt. Die Zeitentwicklung eines solchen Systems ist vollständig festgelegt, sofern man seinen Zustand zu einem gegebenen Ausgangszeitpunkt kennt. Daher besteht die Vorgehensweise der klassischen theoretischen Physik darin, zunächst die dynamischen Variablen des betrachteten Systems zu erkennen und hiernach die Bewegungsgleichungen (Equations of Motion, EOM) zu bestimmen, welche die Zeitentwicklung im Einklang mit experimentellen Beobachtungen beschreiben. Seit der Formulierung der Newtonschen Mechanik bis zum Ende des neunzehnten Jahrhunderts war diese Vorgehensweise erfolgreich und erlaubte, neu beobachtete Phänomene in das allgemeine Schema einzubinden. Innerhalb dieses Schemas wurde im Besonderen zwischen zwei Kategorien von Objekten unterschieden: Materie und Strahlung. Materie wurde als aus exakt lokalisierbaren Korpuskeln (Massenpunkte) bestehend betrachtet, welche sich gemäß der Gesetze der Newtonsche Mechanik verhalten; der Zustand eines jeden Korpuskels wurde zu jedem Zeitpunkt durch seinen Ort und seine Geschwindigkeit vollständig beschrieben. Strahlung hingegen gehorchte Maxwells Gesetzen des Elektromagnetismus; die dynamischen Variablen waren die Komponenten der elektrischen und magnetischen Felder an sämtlichen Punkten des Raumes. Als bekannt galt, dass Strahlung – im Gegensatz zur Materie – wellenartiges Verhalten zeigt; typische Beispiele sind Phänomene wie Interferenz und Beugung. Als jedoch unsere Kenntnisse der Phänomene auf mikroskopischen Skalen (d.h. auf atomaren Skalen, welchen Längenskalen von bis zu einigen Ångström entsprechen) präziser wurden, geriet die Klassische Physik in eine schwere Krise. Es wurde offenkundig, dass Phänomene auf atomaren und subatomaren Skalen nicht in die klassischen Schemata passen und deren Erklärung auf grundlegend neuen Prinzipien gegründet sein muss. Die Enthüllung dieser neuen Prinzipien erfolgte schrittweise und erst um etwa 1925 ergab sich mit der Formulierung der Quantenmechanik eine in sich schlüssige Theorie der mikroskopischen Phänomene. Um 1900 konzentrierten sich die Bemühungen der Experimentatoren auf zwei eng zusammenhängede Bereiche: eine präzise Analyse der mikroskopischen Struktur von Materie 8 und die Bestimmung der gegenseitigen Wechselwirkung zwischen materiellen Korpuskeln sowie deren Wechselwirkung mit dem elektromagnetischen Feld. Die ersten Beiträge zum korrekten Verständnis der Struktur von Materie wurden durch Beobachtungen von Strahlung in Gasentladungen in verdünnten Gasen, Kathodenstrahlung sowie Kanalstrahlung gewonnen, welche richtigerweise als Strahlen von elektrisch geladenen Teilchen interpretiert wurden. Auf diese Art und Weise wurde 1897 das Elektron durch J.J. Thomson als das Teilchen der Kathodenstrahlung entdeckt. Sein Verhalten im elektromagnetischen Feld wurde beobachtet und durch die Theorie von H.A. Lorentz beschrieben. Sukzessive wurde man sich der Existenz von Atomen und Molekülen bewusst. Den überzeugendsten Befund lieferte die Beobachtung der Brownschen Molekularbewegung, die eine ungeordnete Zitterbewegung winziger Teilchen in Flüssigkeiten oder Gasen beschreibt. Diese Bewegung der Partikel wird auf häufige Kollisionen mit den Molekülen des umgebenden Mediums zurückgeführt. Später erlaubten bessere experimentelle Techniken die Beobachtung einzelner mikroskopischer Phänomene oder die Zählung einzelner mikroskopischer Teilchen (z.B. Messung der elektrischen Ladung durch R.A. Millikan in 1910, erste Beobachtung von Trajektorien geladener Teilchen in der (Wilsonschen) Nebelkammer durch C.T.R. Wilson in 1912, erstes Geiger-Müller-Zählrohr durch H. Geiger in 1913). Überdies wurde 1896 ein neues Kapitel der Physik durch die Entdeckung der Radioaktivität begonnen. Zusätzlich eröffnete diese Entdeckung eine leistungsfähige Methode zur experimentellen Untersuchung der atomaren Struktur – die Alpha-Strahlung, d.h. Helium-Kerne mit hohen Geschwindigkeiten. Indem er verschiedene Targets der AlphaStrahlung aussetzte, konnte E. Rutherford 1911 die Struktur von Atomen durch Streuung von Alpha-Teilchen vermessen. Es stellte sich heraus, dass Atome von einem zentralen Kern sehr kleiner Größe (10−15 − 10−14 m) und in dessen Umfeld befindlichen Elektronen gebildet werden. In der Zwischenzeit wurde der Kenntnisstand bezüglich elektromagnetischer Wellen, vgl. Tab. 6, zu kurzen Wellenlängen hin durch die Entdeckung von Röntgenstrahlung (W.C. Röntgen, 1895) erweitert, deren Wellennatur durch Beugungsexperimente an Kristallen in 1912 durch M.v. Laue etabliert wurde. Die Spektralanalyse von Strahlung wurde immer präziser und erlaubte die Ansammlung eines großen Wissensschatzes über die Wechselwirkung von Materie und Strahlung auf mikroskopischen Skalen. Die Lorentz’sche Theorie der Elektronen machte eindeutige Vorhersagen über all diese Phänomene. Im Vergleich der Vorhersagen dieser Theorie mit der neu gewonnenen Fülle experimenteller Ergebnisse zeigte sich der erste Widerspruch zwischen der klassischen Theorie und dem Experiment überdeutlich. 2.2 2.2.1 Photonen Strahlung eines Schwarzen Körpers (Hohlraumstrahlung) Die ersten Schwierigkeiten traten in der Untersuchung der Spektralverteilung elektromagnetischer Strahlung im thermodynamischen Gleichgewicht mit Materie auf. Der typische Fall ist der eines schwarzen Körpers (auch: Schwarzer Strahler), d.h. eines Körpers der sämtliche einfallende Strahlung absorbiert. Sehr allgemeine thermodynamische Betrachtungen zeigen, dass die Strahlung eines Schwarzen Körpers lediglich von dessen Tem9 peratur abhängt. Die Spektralverteilung der Intensität dieser Schwarzkörperstrahlung ist daher eine fundamentale Größe, die mittels Methoden der statistischen Thermodynamik aus den allgemeinen Gesetzmäßigkeiten der Wechselwirkung von Materie und Strahlung herleitbar sein müsste. Die in der klassischen Theorie hergeleitete Formel steht im eklatanten Widerspruch zum Experiment. Im Jahr 1900 gelang es M. Planck diese Schwierigkeit durch Abkehr von den klassischen Gesetzen zur Wechselwirkung von Materie und Strahlung zu beheben. Stattdessen postulierte er, dass Energieaustausch zwischen Materie und Strahlung nicht auf kontinuierliche Art und Weise geschieht, sondern in diskreten und unteilbaren Mengen bzw. Quanten von Energie. Im Folgenden betrachten wir kurz die klassische Vorhersage sowie den experimentellen Kenntnisstand zur Zeit Plancks. Wie bereits erwähnt, bezeichnet Schwarzkörperstrahlung jene Art von elektromagnetischer Strahlung, welche von einem Schwarzen Körper (ein opaker, nicht-reflektierender Körper) abgegeben wird. Hierbei wird die Temperatur über das gesamte Volumen einheitlich und konstant gehalten. Schwarzkörperstrahlung hat daher ein charakteristisches Spektrum und eine charakteristische Intensitätsverteilung, welche lediglich von der Temperatur des Körpers abhängt, vgl. Abb. D.1. Wärmestrahlung der Art, wie sie spontan von vielen gewöhnlichen Objekten emittiert wird, kann approximativ als Schwarzkörperstrahlung behandelt werden. Ein vollständig isolierter Hohlraum, in dessen Innern thermisches Gleichgewicht herrscht, enthält Schwarzkörperstrahlung. Durch ein Loch in einer Wand des Hohlraums wird diese Hohlraumstrahlung emittiert. Die Hohlraumstrahlung hat die Charakteristika derSchwarzkörperstrahlung, sofern das Loch klein genug ist und lediglich einen vernachlässigbaren Einfluß auf das thermische Gleichgewicht hat. Als Schematisierung betrachten wir nun elektromagnetische Strahlung innerhalb eines kubischen Hohlraums mit Volumen V = L3 und Temperatur T , die sich im thermischen Gleichgewicht befinde, vgl. Abb. D.2. Die darin enthaltene Energiedichte (Energie/Volumen) u(ω, T ) ist eine Funktion von der Frequenz ω und der Temperatur T . Die Energidichte u(ω, T ) wird klassisch durch das Rayleigh-Jeans-Gesetz (J.W. Strutt, 1900; J. Jeans, 1905) bestimmt, kB T 2 ω , (2.1) π 2 c3 wobei kB = 1.3806 × 10−23 J/K die Boltzmann-Konstante und c = 2.998 × 108 m/s die Lichtgeschwindigkeit im Vakuum ist. u(ω, T ) = Um dieses Ergebnis zu erhalten kann man folgendermaßen vorgehen: wir beschreiben das Strahlungsfeld innerhalb des kubischen Hohlraums als Summe der Normalmoden im Fourier-Raum. Die Randbedingungen auf gegenüberliegenden Seiten des Hohlraums sind gleich, so dass sich die Phase des Strahlungsfelds über die Länge L um ein ganzzahliges Vielfaches von 2π ändert. Somit ist das Strahlungsfeld durch eine Summe von Termen proportional zu ebenen Wellen exp (ir · k) gegeben. Wegen der Randbedingungen sind die hierbei beitragenden Wellenzahlen k = 2πn/L und werden durch den Vektor n festgelegt, welcher ausschließlich ganzzahlige Komponenten n1 , n2 , n3 besitzt. Daher ist jeder einzelne Normalmode ein Tupel n1 , n2 , n3 sowie einer von zwei Polarisationszuständen zugeordnet. Jedes dieser Tupel nimmt genau eine Volumeneinheit im Vektorraum von n ein. Für jedes Tupel n1 , n2 , n3 im Fourier-Raum sind zwei Polarisationszustände – links- oder rechtshändig zirkulare Polarisation – möglich, welche durch einen zusätzlichen Faktor 2 10 berücksichtigt werden. Da die Wellenzahl k = |k| (vgl. Anhang A) mit der Frequenz durch die Dispersionsrelaton ω = ck zusammenhängt, kann eine Integration über das sphärische Volumenelement d3 n in ein Integral über die Frequenz ω überführt werden. Wir erhalten für die Zahl der Normalmoden im Frequenzintervall [ω, ω + dω] unter Berücksichtigung beider Polarisationsrichtungen 3 L 2 3 ω 2 dω, (2.2) dN = N (ω)dω = 2 × d n = 2 × dΩ |n| d|n| = 2 × 4π 2πc wobei wir die Winkelintegration trivial ausühren konnten. Jede einzelne Normalmode mit Frequenz ω kann als ein harmonischer Oszillator mit der gleichen Frequenz ω beschrieben werden (vgl. Übung 2.1, wo Sie dies explizit nachvollziehen). Da jeder Oszillator in der Klassischen statistischen Mechanik die thermische Energie kB T beiträgt1 , ist die gesamte Energiedichte in der Klassischen Physik durch 1 L3 2 kB T u(ω, T )dω = kB T 3 2 3 ω dω = 2 3 ω 2 dω L π c π c (2.3) gegeben. Hierbei wurde die Energie durch das Volumen V = L3 geteilt. Obwohl Glg. (2.3) für niedrige Frequenzen experimentelle Befunde R ∞ sehr gut beschreibt, müsste der Energieinhalt des Hohlraums unendlich sein wegen 0 dωu(ω) = ∞ im Widerspruch zu experimentellen Tatsachen (Ultraviolettkatastrophe). Stattdessen wurde in 1896 von W. Wien als empirischer Befund für hohe Frequenzen exponentiell gedämpftes Verhalten gemäß ω→∞ u(ω, T ) −→ Aω 3 exp (−gω/T ); A, g = const (2.4) beobachtet. Das scheinbar unverträgliche Verhalten der Energiedichte für hohe und niedrige Frequenzen konnte erst 1900 durch Planck in einer einzigen Formel beschrieben 1 Dieser Sachverhalt lässt sich per Gleichverteilungssatz zeigen. Wir betrachten ein physikalisches System, dessen Hamiltonfunktion H(q, p) quadratisch in den kanonischen Variablen qi und in den kanonisch konjugierten Impulsen pi ist, d.h. qi ∂H/∂qj = 2Eqi δij und pi ∂H/∂pj = 2Epi δij erfüllt, wobei Eqi bzw. Epi die innere Energien sind, welche in dem Freiheitsgraden qi bzw. pi gespeichert sind. Dann gilt für ∂H den thermischen Erwartungswert hqi ∂q i: j Z ∂H −βH 1 ∂ −βH dΓ qi dΓ qi e =− e ∂qj βZ ∂qj Z Z ∂qi δij 1 1 dΓ e−βH = + dΓ e−βH = δij kB T. =+ βZ ∂qj β Z | {z } | {z } 1 ∂H hqi i= ∂qj Z Z =1 =δij Hierbei wurde die kanonische Gesamtheit verwendet (System in Kontakt mit Wärmebad, d.h. bei fester Temperatur T ). Eine genauere Einführung der kanonische Gesamtheit geht über eine kurze Fußnote hinaus; schlagen Sie dazu bitte in einem Lehrbuch Ihres Vertrauens nach. Für die kanonische Gesamtheit R R sind thermische Erwartungswerte allgemein durch hOi = 1/Z dΓ Oe−βH gegeben, wobei Z = dΓ e−βH und dΓ das Integralmaß des gesamten Phasenraums ist, d.h. für ein dreidimensionales N -Teilchen-System gilt dΓ = d3N q d3N p. Ferner wird hier die Abkürzung β = 1/(kB T ) verwendet und beim Übergang von der ersten zur zweiten Zeile einmal unter Vernachlässigung der Randterme partiell intergriert. Unter Verwendung der inneren Energien Eqi der Orts-Freiheitsgrade sehen wir also h2Eqi i = kB T bzw. hEqi i = kB T /2. Der Beweis für die thermischen Erwartungswerte der inneren Energien Epi der Impuls-Freiheitsgrade ist identisch und führt ebenfalls zu hEpi i = kB T /2. Da man für den harmonischen Oszillator sowohl kinetische Epi als auch potentielle Energie EqI hat, ergibt sich für jede Raumrichtung in der Summe hEpi + Eqi i = kB T . 11 werden, die er zur Interpolation zwischen beiden experimentellen Befunden postulierte, vgl. Abb. D.3. Diese Planck’sche Strahlungsformel u(ω, T )dω = ω 3 dω ~ π 2 c3 exp ~ω − 1 bzw. u(ν, T )dν = kB T 8πh ν 3 dν c3 exp hν − 1 (2.5) kB T erforderte die Einführung einer neuen Naturkonstante – das Planck’sche Wirkungsquantum – ~ = 1.0546 × 10−34 J. Dieses tritt in zwei verschiedenen Normierungen (h und ~) in der Literatur auf: ~ω = hν 2πν = ω ⇔ (2.6) ~= h 2π (2.7) Unter seiner revolutionären Hypothese, dass Energieaustausch zwischen Wand2 und Strahlungsfeld der Frequenz ω nur für ganzzahlige Vielfache von ~ω möglich sei, gelang Planck eine Herleitung seines Strahlungsgesetzes – ein unmissverständlicher erster Hinweis auf die Quantisierung des elektromagnetischen Felds, vgl. Tab. 6. Sie werden diese Herleitungen (Rayleigh-Jeans’sches und Plack’sches Gesetz) in den Übungen (Übung 2.1) nachvollziehen und werden insbesondere sehen, dass die verschiedenen Moden des Strahlungsfeld in einem Hohlraum sich wie harmonische Oszillatoren verhalten. Diese Übung wird ihnen von großem Nutzen sein, da Sie in der Quantenmechnanik zahllosen Problemen begegnen werden, für deren Lösung das Auffinden und Berechnen der stationären Moden essentiell ist. Außerdem wiederholt sich der konzeptionelle Schritt des Übergangs von stationären Moden zu harmonischen Oszillatoren in der Quantenfeldtheorie. 2.2.2 Photoelektrischer Effekt Im Jahr 1905 entwickelte A. Einstein Plancks Quantenhypothese weiter und konnte damit schließlich den Photoelektrischen Effekt erklären. Bereits am Ende des neunzehnten Jahrhunderts war bei Bestrahlung mit elektromagnetischer Strahlung ausreichend hoher Frequenz Emission von Elektronen an Metalloberflächen im Vakuum beobachtet worden, vgl. Abb. D.4. Dieses Phänomen hatte folgende Charakteristika: 1. Der Effekt tritt nur auf, falls die Frequenz der einfallenden Strahlung einen für das jeweilige Metall spezifischen Mindestwert ω0 überschreitet. 2. Die aus dem Metall austretenden Elektronen haben unterschiedliche Geschwindigkeiten im Intervall zwischen Null und einer maximalen Geschwindigkeit. Die der maximalen Geschwindigkeit entsprechende Energie ist eine lineare Funktion der Frequenz. 2 Die Wand ist hier stellvertretend für irgendeine nicht weiter spezifizierte Form von Materie, d.h. Plancks Hypothese gilt für jegliche Wechselwirkung zwischen dem Strahlungsfeld und Materie im Allgemeinen. 12 3. Die Rate der pro Flächeneinheit emittierten Elektronen ist für feste Frequenz proportional zur Intensität der Strahlung, aber die Geschwindigkeit der Elektronen ist unabhängig von der Intensität. Versuche diese Beobachtungen mittels Klassischer Elektrodynamik zu erklären waren erfolglos, und die drei primären Charakteristika blieben unverständlich. Insbesondere konnte man unter der Annahme, dass die Energie der Strahlung gleichmäßig über die bestrahlte Oberfläche verteilt wird, nicht verstehen, weshalb die Emission selbst bei sehr niedrigen Intensitäten sofort einsetzt. Man erwartete stattdessen, dass eine gewisse Zeit benötigt würde, bis ausreichend Energie angesammelt wäre, um das Elektron aus dem Metall heraus zu lösen. Diese Beobachtung führte Einstein 1905 zur Hypothese, dass Licht aus Quanten der Energie ~ω bestehe, und, dass Elektronen nur herausgelöst werden könnten, sofern die Energie der Photonen die Austrittsarbeit W0 nicht unterschreite, ~ω > W0 , vgl. Abb. D.5. Einstein zeigte, dass das Phänomen auf Grundlage von Plancks Hypothese erklärbar ist. Er nahm an, dass die Energie des Strahlungsfelds nicht nur während Absorption und Emission sondern auch während der Ausbreitung im Raum in Form von Strahlungsquanten mit Energie ~ω quantisiert ist. Hiermit kann der Photoelektrische Effekt als ein Streuprozess zwischen einfallenden Strahlungsquanten (Photonen3 ) und den in Atomen gebundenen Elektronen des Metalls verstanden werden. In dieser Vorstellung erhält das von einem Photon getroffene Atom sofort dessen volle Energie ~ω. Ein Elektron kann nur emittiert werden, falls diese Energie größer ist als die Austrittsarbeit W0 , welche zu seiner Ablösung vom Atom benötigt wird; der Effekt tritt folglich nur im Fall ~ω > W0 auf. Somit kann das erste Charakteristikum verstanden werden, indem man ω0 = W0 /~ definiert. Sofern die Bedingung ω > ω0 erfüllt ist, tritt aus dem Metall ein Elektron mit maximaler Energie E = ~ω − W0 aus. Man findet Emax = ~(ω − ω0 ) (2.8) in Übereinstimmung mit dem zweiten Charakteristikum. Schlußendlich versteht man auch das dritte Charakteristikum, da bei Variation der Intensität die Rate der Photonen pro Flächeneinheit geändert wird aber nicht deren Energie. Zur Zeit von Einsteins Hypothese waren experimentelle Daten nicht präzise genug, um Glg. (2.8) zu bestätigen. Eine präzise Verifikation wurde später durch R.A. Millikan durchgeführt, der damit eine unabhängige Bestimmung von ~ erreichte. Aufgrund der Beobachtung, dass eine Gruppe elektromagnetischer Wellen nicht nur Energie E sondern auch einen Impuls p = E/c trägt, wies Einstein den Photonen einen Impuls mit Betrag p = ~ω/c = h/λ entlang deren Ausbreitungsrichtung zu. Wegen des relativisp 2 2 tischen Ausdrucks für die Energie eines Teilchens, E = c m c + p2 sehen wir, dass das Photon formell als Teilchen mit verschwindender Ruhemasse betrachtet werden kann. 2.2.3 Compton Effekt Einige Jahre später (1923) entdeckte A.H. Compton ein Phänomen (Compton Effekt), in dem die Existenz von Photonen besonders offenkundig wurde. Der Compton Effekt tritt als Streuung von Röntgen - und Gammastrahlung in Gasen, Flüssigkeiten und Festkörpern 3 Die Bezeichnung Photon zur Beschreibung der Strahlungsquanten kam erst 1927 auf. 13 auf. Wenn ein dünnes Strahlenbündel aus Röntgenstrahlung mit Wellenlänge λ eine Substanz (am Besten mit geringem Atomgewicht, z.B. Kohlenstoff) durchdringt, werden Röntgenstrahlen in alle Richtungen gestreut. Wenn man die gestreute Strahlung in einer Richtung, welche mit der Einfallsrichtung den Winkel ϕ bildet, mit einem Kristallspektrographen analysiert, misst man eine Wellenlänge λ0 . Diese ist gegenüber der Wellenlänge λ der einfallenden Strahlung geringfügig erhöht. Zusätzlich zu dieser gestreuten Strahlung mit Wellenlänge λ0 findet man ebenso gestreute Strahlung mit Wellenlänge λ, d.h. ohne Änderung der Wellenlänge. Daher enthält das Spektrum der gestreuten Strahlung zwei sehr nahe beieinander liegende Linien, eine bei der ursprünglichen Wellenlänge λ und eine bei der anderen, leicht erhöhten Wellenlänge λ0 , vgl. Abb. D.7. Diese Variation der Wellenlänge λ0 − λ ist unabhängig von der Substanz, welche die Streuung verursacht. Stattdessen hängt sie gemäß λ0 − λ = 0.024(1 − cos ϕ) Å vom Winkel zwischen der Streurichtung und der Richtung des einfallenden Strahls ab (vgl. Abb. D.8); daher ist die Änderung der Wellenlänge maximal im Fall von Rückstreuung. Die klassische Theorie des Elektromagnetismus kann das Vorhandensein einer zweiten Linie bei verschiedener Wellenlänge nicht erklären. Stattdessen versteht man mit der Theorie der Strahlungsquanten diese Streuung als Streuung eines Photons der einfallenden Strahlung an einem der Elektronen in der Substanz, in welcher die Streuung stattfindet. Durch die Streuung werden die Photonen in verschiedene, durch den Winkel ϕ spezifizierte Richtungen abgelenkt. Wir beschreiben diese Streuung mittels Energie- und Impulserhaltung, mit Hilfe der relativistischen Energie-Impuls Beziehung sowie mit der im vorigen Abschnitt eingeführten Ausdrücke für Impuls und Energie der Photonen, (p = ~k bzw. p = ~k = h/λ = hν/c = ~ω/c sowie E = hν = ~ω). Dann erhalten wir me c2 + ~ω 0 , me c2 + ~ω = q 2 1 − vc2 (2.9) me v ~ω 0 0 ~ω k̂ = q k̂ . + 2 c c 1 − vc2 (2.10) Hierbei ist me = 511.0 keV/c2 die Elektronenmasse und v ist die Geschwindigkeit des Elektrons nach der Streuung. Wir nehmen hierbei an, dass das Elektron vor der Streuung frei (nicht in einem Potential) und in Ruhe ist. Ferner gilt ω = 2πc/λ sowie ω 0 = 2πc/λ0 und k̂ sowie k̂0 sind die Einheitsvektoren, welche die Richtung der einfallenden und gestreuten Röntgenstrahlung repräsentieren. Aufgrund der Definition des Winkels ϕ als der Winkel, in den das Photon gestreut wird, gilt k̂ · k̂0 = cos ϕ. Die Wellenzahlen hängen mit den Wellenlängen über k = 2π/λ sowie k 0 = 2π/λ0 zusammen. Aus Glg. (2.10) erhalten wir m2e v 2 ~ω ~ω 0 ~2 ω 2 ~2 ω 0 2 = + − 2 cos ϕ. (2.11) 2 c2 c2 c c 1 − vc2 Mittels Einsetzen von Glg. (2.9) eliminieren wir v und erhalten ω − ω0 = ~ c c 2π~ ωω 0 (1 − cos ϕ) bzw. λ0 − λ = 0 − = (1 − cos ϕ). me c ω ω me c (2.12) Nach Einsetzen der numerischen Werte für 2π~/(me c) findet man in der Tat 0.024 Å. 14 In dieser Herleitung wurde das Elektron als freies Teilchen betrachtet. Diese Art der Beschreibung kann für weiter außen im Atom befindliche Elektronen verwendet werden. Falls das Photon an einem im Atom weiter innen befindlichen (stärker gebundenen) Elektron streut, findet Impulsaustausch nicht nur mit dem Elektron sondern mit dem gesamten Atom statt. In diesem Fall muss man in den Formeln die Masse des Elektrons durch die Masse des Atoms austauschen, welche um ein Tausendfaches größer ist. Daher findet man dann beide Linien bei nicht unterscheidbaren Wellenlängen. 2.3 2.3.1 Atomare Spektren und Quantisierung von Materie Atomare Spektren Seit dem frühen neunzehnten Jahrhundert war Physikern bekannt, dass atomare Gase Licht nur bei bestimmten Frequenzen absorbieren und emittieren. Diese festen Frequenzen wurden zwar erfolgreich als Charakteristika zur Identifikation bekannter oder Entdeckung neuer Atome (z.B. unabhängige Entdeckung des Heliums mittels seiner Spektrallinien im Sonnenlicht durch J. Jansen und N. Lockyer, beide 1868) verwendet, aber in keinster Weise verstanden. Fortschritt im Verständnis atomarer Spektren war nicht möglich, ohne etwas über die Struktur der Atome zu wissen. Die Entdeckung der Kathodenstrahlung (J. Plücker 1858, W. Hittorf 1869, J.J. Thomson 1894), des Elektrons (J.J. Thomson, 1897) sowie der radioaktiven Stoffe (A.H. Becquerel 1896, M. und P. Curie 1898, E. Rutherford und F. Soddy, 1902) führten zu Beginn des zwanzigsten Jahrhunderts zur Beschreibung der elektrisch neutralen Atome mit dem Thomson’schen Atommodell (Rosinenkuchenmodell). Hier nahm man an, dass die Elektronen wie Rosinen in einem Kuchen in einer kontinuierlichen positiven Ladungsverteilung säßen. Aufgrund von Werten für mittlere freie Weglängen in molekularen Gasen und für Dichten von Festkörpern mit bekannter chemischer Zusammensetzung ordnete man Atomen Radien in der Größenordnung von 10−10 m zu. Streuexperimente von P. Lenard in Jahr 1903 zeigten, dass Atome für schnelle Elektronen beinahe transparent waren. Daher bestand die Herausforderung, die Verteilung der Bestandteile eines Atoms in dessen Innern zu verstehen. Um diese räumliche Struktur genauer zu verstehen, führten E. Rutherford, H. Geiger und E. Marsden im Jahr 1911 Streuversuche an einer dünnen Goldfolie mit Alpha-Teilchen (ein 42 He Nukleus) aus dem radioaktiven Zerfall einer Radiumquelle durch. Die gestreuten Alpha-Teilchen wurden durch Lichtblitze beim Auftreffen auf einer Folie aus Zinksulfid detektiert. Während man in Vorwärtsrichtung erwartungsgemäß eine geringe Strahlaufweitung beobachtete, wurde auch Rückstreuung gemessen. Dieser Befund stand in völligem Widerspruch zu Thomsons Atommodell. Im folgenden betrachten wir die Kinematik dieses Streuprozesses. Ein Alpha-Teilchen der Masse M streue an einem Target der Masse m und alle Geschwindigkeiten seien klein genug, dass eine nicht-relativistische Näherung ausreiche. Das Problem werde hier nur in einer Dimension betrachtet (eine positive Geschwindigkeit ist eine Geschwindigkeit entlang der Flugrichtung des einfallenden Alpha-Teilchens, während eine negative Geschwindigkeit eine Geschwindigkeit in entgegengesetzter Richtung ist). Aus 15 Energie- und Impulserhaltung folgt 1 1 1 M v 2 = mu2 + M v 0 2 . (2.13) 2 2 2 Nach Eliminieren der Geschwindigkeit u erhält man 02 M v M v0 M m−M 0 0= 1+ −2 −1+ ⇔ v = v 1, − . (2.14) m v2 m v m m+M M v = mu + M v 0 , Die erste Lösung entspricht einem ungestreuten Teilchen, die zweite Lösung hingegen kommt durch die eigentliche Streuung zustande. Diese Lösung kann nur negativ werden (Rückstreuung), sofern m > M ist. Da Alpha-Teilchen circa 7300 mal schwerer sind als Elektronen, ist diese Rückstreuung an einem Elektron als Streuzentrum nicht möglich. Rückstreuung erfordert die Existenz eines ausreichend schweren und kleinen Streuzentrums, in welches das Projektil nicht eindringt. Wir schätzen nun den Radius dieses massereichen Streuzentrums ab und betrachten das Coulomb-Potential eines ausreichend schweren, positiv geladenen Teilchens mit Ladung +Ze. Der Umkehrpunkt für ein Alpha-Teilchen wird in diesem Potential bei einer Distanz r erreicht, bei welcher die kinetische Energie vollständig in potentielle Energie umgewandelt wird, das heißt, wenn 1/2M v 2 = (2e)(Ze)/r. Daraus ergibt sich r = 4Ze2 /(M v 2 ) als maximale Größe des Streuzentrums. Ein kurzer Überschlag mit Geschwindigkeit v = 2.09 × 107 m/s des einfallenden Alpha-Teilchens und Ordungszahl Z = 79 für Gold ergibt einen maximalen Radius des Streuzentrums von circa r ∼ 2.5 × 10−4 Å. Dies ist wesentlich kleiner als typische atomare Skalen und nicht mit der Thomson’schen Vorstellung vereinbar. Rutherford zog hieraus den Schluss (Kern-Hülle Modell), dass Atome einen sehr kleinen positiv geladenen Kern besitzen, welcher nahezu die komplette Masse trägt. Die Elektronen müssten sich auf Bahnen um diesen Kern bewegen wie Planeten um die Sonne. Da jedoch eine derartige Bahn im Zentralkraftpotential (vgl. Kepler-Problem) eine beschleunigte Bewegung ist und beschleunigte Ladungen Energie in Form von Strahlung emittieren (vgl. Hertz’scher Dipol4 ), müssten diese Elektronen kontinuierlich auf immer kleinere Bahnen wechseln und schlussendlich in den Kern stürzen. Eine solche kontinuierliche Emission (und der Kollaps der Atome) wird nicht beobachtet. Darüber hinaus könnte man die mittlere Lebensdauer eines Atoms in dieser Beschreibung als 10−8 s abschätzen. Daher wären Atome in diesem Bild nicht stabil und würden Strahlung mit einem kontinuierlichen Spektrum emittieren. Dies widerspricht der Beobachtung von stabilen Atomen mit diskreten Absorptions- und Emissionsspektren, welche aus schmalen und isolierten Linien bestehen, vgl. Abb. D.9. Das Spektrum von atomarem Wasserstoff war bekannt: es besteht aus Linien im sichtbaren, infraroten und ultravioletten Wellenlängenbereich. Dieses Spektrum war das erste, für dessen Verteilung von Spektrallinien eine einfache empirische Regel gefunden wurde, nämlich zunächst die Balmer Formel (J.J. Balmer, 1885) und drei Jahre später deren Verallgemeinerung, die Rydberg Formel (J. Rydberg, 1888), 1 1 1 , m > n > 0, (2.15) − ν̃ = = RH λ n2 m2 4 Die abgestrahlte Energie einer beschleunigten Ladung ist in Dipolnäherung dE/dt = ist e die Ladung des Teilchens, a dessen Beschleunigung und c die Lichtgeschwindigkeit. 16 2 e2 2 3 c3 a . Hierbei wobei m, n ganzzahlige Werte annehmen und RH = 109678 cm−1 eine numerische Konstante (die Rydbergkonstante) ist. Die Linien treten in Serien auf. Die ersten vier beobachteten Serien sind: n=1 n=2 n=3 n=4 m=2,3,4,. . . m=3,4,5,. . . m=4,5,6,. . . m=5,6,7,. . . Lyman Serie (ultraviolett), Balmer Serie (sichtbar), Paschen Serie (infrarot), Bracket Serie (infrarot). Jede Serie strebt für steigendes m gegen den Grenzwert RH /n2 , d.h. die Linien werden dicht um einen Grenzwert, vgl. Abb. D.10. Nahe dieses Grenzwerts sind die Linien derart dicht, dass sie nicht aufgelöst werden können. Ein charakteristische Eigenschaft von Glg. (2.15) ist, dass Wellenzahlen von mehreren Linien durch Differenzen zweier Terme von der Form Tn = RH /n2 (Spektralterme) ausgedrückt werden können. Zwar sind für kompliziertere Atome die Spektralterme nicht so einfach wie für Wasserstoff, aber man kann für jedes Element verschiedene Reihen von verallgemeinerten Spektraltermen einführen und die Wellenzahlen der Linien aus Differenzen einiger Spektralterme bestimmen (Rydberg-Ritz’sches Kombinationsprinzip, W. Ritz, 1905). Man kann für jedes Element eine Reihe von Spektraltermen Tns bestimmen, so dass sich alle Linien der jeweiligen Spektren durch Beziehungen zwischen diesen Spektraltermen ausdrücken lassen, z.B. 0 ν̃n0 s0 ,ns = Tns0 − Tns . (2.16) Jedoch sind nicht alle möglichen Kombinationen in der Natur realisiert (es gibt Auswahlregeln). 2.3.2 Diskrete Energieniveaus Um diese Schwierigkeiten zu überwinden und die Charakteristika der Absorptions- und Emissionsspektren zu erklären, führte N. Bohr 1913 folgende Hypothese ein: 1. Für die Elektronen eines Atoms existieren einige ausgezeichnete Bahnen. Sofern sich das Elektron entlang dieser Bahnen bewegt, emittiert es keine Strahlung. Diese Bahnen sind diskret und deshalb sind die Energiewerte ebenso diskret (Energieniveaus). In anderen Worten, das Atom existiert nur in einem diskreten Satz von Zuständen mit Energien (in aufsteigender Abfolge) E1 , E2 , . . . 2. Absorption oder Emission von Strahlung findet statt, wenn das Elektron zwischen einem niedrigeren und höheren Energieniveau wechselt. In Übereinstimmung mit Plancks Hypothese findet in diesen Prozessen Absorption oder Emission eines einzelnen Strahlungsquants statt. Wenn En und Em die Energien der zwei Bahnen (mit m > n) sind, zwischen denen der Übergang stattfindet, und ω die Frequenz des emittierten (bzw. absorbierten) Strahlungsquants ist, gilt aufgrund der Energieerhaltung Em − En = ~ω. (2.17) Diese Formel ist die Kernaussage des Bohr’schen Atommodells. Setzt man Tn = −En /hc, 17 (2.18) so kann man die Energieniveaus zu den Spektraltermen aus Glg. (2.16) in Beziehung setzen und einen Rahmen schaffen, um das Rydberg-Ritz’sche Kombinationsprinzip zu verstehen. Diese zwei Hypothesen sind allgemein und sollten auch für komplexere Atome und Moleküle gültig sein. Im Fall von Wasserstoff gab Bohr auch eine quantitative Regel zur Bestimmung der erlaubten Bahnen und zur Berechnung der Energieniveaus an. Genauer gesagt nahm Bohr an, dass lediglich Kreisbahnen möglich seien und, dass gemäß der Beobachtung, dass der Drehimpuls die gleiche Dimension wie die Wirkung besitzt, 2 Länge Länge [Länge] = [Masse] [Zeit] = [Energie][Zeit], [Drehimpuls] = [Masse] Zeit Zeit (2.19) der Drehimpuls lediglich ganzzahlige Vielfache von ~ = h/(2π) annehmen könne. Damit erhalten wir die Bohr’sche Quantisierungsregel me vr = n~, n = 1, 2, . . . , (2.20) und für Kreisbahnen in Coulombpotential5 me v 2 = e2 /r. (2.21) Durch Eliminieren von v zwischen beiden Gleichungen erhalten wir für den Radius der n-ten Bahn ~2 (2.22) r ≡ rn = n2 2 . e me Daher finden wir unter Verwendung von Glg. (2.21) für die Energie eines Elektrons auf der n-ten Bahn me v 2 e2 1 e2 En = − =− . (2.23) 2 rn 2 rn Dieses Ergebnis6 kann man mittels Glg. (2.22) als En = −hcR 1 n2 (2.24) formulieren, wobei R = 2π 2 e4 me /(h3 c). Hierdurch erhält man die Balmer Formel wenn man R = RH identifiziert. Durch Einsetzen der fundamentalen Konstanten h, c, e und me erhält man R = 109700 cm−1 (2.25) 5 In dieser Vorlesung wird das Gauß’sche Einheitensystem (cgs System) verwendet, vgl. Anhang A, in welchem die Coulomb-Kraft zwischen zwei Ladungen Q1 und Q2 durch F = Q1 Q2 /r2 gegeben ist. Im Gegensatz dazu ist die Coulomb Kraft im SI System (MKSA System) F = 1/(4πε0 )Q1 Q2 /r2 , wobei ε0 die Permittivitität des Vakuums ist. 6 Hinweis: Obgleich die Ausdrücke Glg. (2.24) und Glg. (2.28) in der üblichen Formulierung von QM weiterhin für ganzzahliges n gültig sind, wird dieses n als Hauptquantenzahl bezeichnet und hat nichts mit dem Bahndrehimpuls zu tun. Genau genommen kann in QM eine Zustand mit Hauptquantenzahl n den Betrag des quantisierten Bahndrehimpulses L2 = ~2 l(l + 1) haben. Hierbei ist l = 0, 1, 2, . . . , n − 1. 18 in Übereinstimmung mit experimentellen Werten7 . Die Energieniveaus von Wasserstoff sind in Abb. D.10 gezeigt. Von besonderer Wichtigkeit sind die Energie des Grundzustands, E1 = −hcR = −13.6 eV, (2.26) sowie der Radius der ersten Bahn, r1 = ~2 = 0.529 Å. e2 me (2.27) Dieser wird auch als Bohr’scher Radius bezeichnet, typischerweise durch das Symbol a0 . Wir führen hier zwei weitere Beobachtungen an. Die Ionen He+ und Li++ sind ähnlich wie Wasserstoff und unterscheiden sich von diesem lediglich durch die Kernladungszahl. In diesen Fällen kann man das vorige Prozedere modifizieren und erhält En = −hcR Z2 , n2 (2.28) wobei Z die Ordnungszahl des jeweiligen Elements ist (Z = 2 für Helium, Z = 3 für Lithium). Die Position der Spektrallinien die man mittels Glg. (2.28) bestimmt ist in guter Übereinstimmung mit experimentellen Daten. In der vorigen Rechnung wurde der Atomkern als räumlich fest betrachtet. Dies entspricht der Annahme, die Masse des Kerns sei sehr viel größer als die des Elektrons. Der Wert von R in Glg. (2.25) wird daher allgemein als R∞ bezeichnet. Aufgrund der präzisen spektroskopischen Messungen ist die Bewegung des Nukleus jedoch eine nicht völlig vernachlässigbare Korrektur. Man kann diese einfach berücksichtigen indem man in den vorigen Formeln die Elektronenmasse me durch die reduzierte Masse µ = (mN me )/(mN + me ) des Elektron-Nukleus-Systems ersetzt. Wenn man dies durchführt, erhält man den Ausdruck RN = R∞ me . 1+ m N (2.29) Diese Formel konnte durch Vergleich der Linienspektren von He+ und Wasserstoff verifiziert werden. Setzt man Z = 2 in Glg. (2.28) ein, sollten die Linien für 2n → 2m mit jenen für n → m für Wasserstoff übereinstimmen. Sie weichen jedoch in der Natur geringfügig voneinander ab und sind um ca. 1 Å verschoben. Diese Verschiebung kann man messen. Wir machen hier die folgenden zwei Anmerkungen: In seiner Herleitung verließ sich Bohr auf die alte Idee der klassischen Theorie des Strahlungfelds, dass die Frequenz der Spektrallinien mit der Frequenz der Bahnbewegung des Elektrons übereinstimmt, aber er nahm dies nur für die äußersten Bahnen8 (große Werte von n) an. Diese Idee entspricht dem Korrespondenzprinzip, und obwohl dieses von Bohr bis 1923 nicht klar formuliert worden 7 Tatsächlich ist R in dieser naı̈ven Rechnung die Rydberg-Konstante R∞ die am genauesten gemessene Naturkonstante überhaupt. Ihr aktueller Wert ist R∞ = 109737, 31568508(65) cm−1 und gilt in der Näherung eines unendlich schweren Kerns, siehe auch Glg. (2.29) und die zugehörige Diskussion im Text. Aus experimentellen Beobachtungen kann erhält man einen Wert RN der durch Glg. (2.29) mit R∞ verknüpft ist. 8 Beispielsweise gibt das Bohr’sche Modell einen inkorrekten Wert L = ~ für den Drehimpuls im Grundzustand an. Aus dem Experiment ist jedoch bekannt, dass der Drehimpuls des echten Grundzustands verschwindet. 19 war, inspirierte es doch all seine vorherige Arbeiten. Die Aussage des Korrespondenzprinzips ist, dass die Klassische Theorie makroskopisch korrekt ist, d.h. sie beschreibt Phänomene im Limes, dass Quanteneffekte (Diskontinuitäten) als unendlich klein angesehen werden können: in diesem Limes müssen die Vorhersagen der exakten Theorie mit den Vorhersagen der Klassischen Theorie übereinstimmen. Das Korrespondenzprinzip besagt, dass die Quantentheorie sich asymptotisch der Klassischen Theorie annähert im Limes großer Quantenzahlen. Damit diese Bedingung erfüllt ist, legt man fest, dass eine formelle Analogie zwischen Quantentheorie und Klassischer Theorie besteht: diese Korrespondenz zwischen den zwei Theorien besteht bis hinab zu den kleinsten Details und muss als Leitlinie zur Interpretation der Ergebnisse der neuen Theorie gelten. Die Bohr’sche Theorie ist nur für Kreisbahnen anwendbar, aber wie im Fall des Sonnensystems ist die allgemeinste Bahn eines gebundenen Teilchens in einem Coulomb Feld nicht ein Kreis sondern eine Ellipse. Eine Verallgemeinerung der Bohr’schen Quantisierungsbedingung, Glg. (2.20), wurde von P. Ehrenfest 1914 vorgeschlagen. Diese wurde anschließend von A. Sommerfeld 1916 verfeinert und zur Berechnung der Energien von Elektronen auf elliptischen Bahnen verwendet. Sommerfelds Quantisierungsbedingung war für ein System formuliert, das durch die Hamiltonfunktion H(q, p) beschrieben wird, mit mehreren Koordinaten qi und kanonisch konjugierten Impulsen pi , welche die Hamilton’schen Gleichungen erfüllen. In dem Fall, dass alle qi und pi eine periodische Zeitabhängigkeit haben, gilt für jedes i I dqi pi = ni h (2.30) mit ganzzahligen Werten ni . Das Integral wird über eine volle Periode der Bewegung ausgewertet. In Bezug auf das Wasserstoffatom lieferten die Sommerfeld’sche und die Bohr’sche Quantisierungsbedingung die gleichen Ergebnisse, wie Sie in Übung 2.2 selbst sehen werden. Aber die Sommerfeld’sche Quantisierungsbedingung ließ sich auch für Alkaliatome, die Feinstruktur des Atoms in Bezug zu relativistischen Korrekturen zur Elektronenbewegung sowie für die Spektren von zweiatomigen Molekülen anwenden. Mittels des Korrespondenzprinzips konnte man Auswahlregeln für die Emission von Strahlung und Intensitäten der Spektrallinien berechnen. Zusätzlich ergibt die Sommerfeld’sche Quantisierungsbedingung angewandt auf den harmonischen Oszillator den Ausdruck En = n~ω in Übereinstimmung mit der Planck’schen Hypothese. Die Bohr-Sommerfeld’schen Quantisierungsregeln haben aber mehrere Einschränkungen: sie können nicht für Systeme verwendet werden, die nicht multi-periodisch sind, sie benötigen ad-hoc Korrekturen um quantitative Ergebnisse zu erhalten, und sie liefern in manchen Fällen komplett falsche Ergebnisse. 2.3.3 Experimentelle Bestätigung der Existenz der Energieniveaus: der Franck-Hertz Versuch Das von Bohr postulierte, zugrunde liegende Konzept der quantisierten Energieniveaus fand eine direkte experimentelle Bestätigung in einer Reihe von Experimenten von J. Franck und G. Hertz. Der experimentelle Aufbau ist als Schaltbild in Abb. D.11 skizziert. Er besteht aus einer Glasröhre, welche eine Substanz enthält, deren Energieniveaus man untersuchen möchte. Innerhalb dieser Röhre befindet sich eine Glühkathode K, aus welcher per thermoelektrischem Effekt Elektronen austreten, und ein Gitter G, welches 20 sich auf einem positiven Potential gegenüber K befindet. Das elektrische Feld zwischen K und G beschleunigt die Elektronen, die daher zum Gitter wandern und es teilweise durchqueren. Hinter G befindet sich eine Absorberplatte A, die sich auf einem niedrigeren Potential als G befindet, so dass Elektronen auf dem Weg von G nach A gebremst werden. Die Elektronen, die A erreichen, werden durch ein Galvanometer zu K zurückgeführt. Dabei wird die Stromstärke gemessen. Falls die Elektronen keine inelastischen Streuungen (Streuungen mit Verlust von Energie zur Anregung der Atome) erlitten haben, bewegen sie sich mit beschleunigter Bewegung zu G, wo sie ihre maximale kinetische Energie errei2 chen gemäß Tmax = 1/2me vmax = eUb , wobei Ub die Beschleunigungsspannung zwischen Kathode K und Gitter G ist. Die angesammelte kinetische Energie ist ausreichend groß um die Gegenspannung Ug zwischen dem Gitter G und dem Absorber A zu überwinden, so dass jene Teilchen, die G durchqueren, bei A ankommen und vom Galvanometer registriert werden. Erhöht man die Beschleunigungsspannung Ub so weit, dass eUb geringfügig über der Energiedifferenz E2 − E1 zwischen dem ersten angeregten Zustand und dem Grundzustand der Substanz liegt, können die Elektronen, sobald sie in die Nähe von G gekommen sind und die Potentialdifferenz eUb (größtenteils) durchlaufen haben, inelastisch an den Atomen in der Röhre streuen. Auf diese Art und Weise verlieren sie fast ihre komplette kinetische Energie und können daher die Gegenspannung zwischen G und A nicht mehr überwinden, d.h. sie erreichen A nicht mehr. Deshalb zeigt das Galvanometer einen starken Abfall des Stroms an, vgl. Abb. D.11. Daher kann die Energiedifferenz zum ersten angeregten Zustand aus E2 − E1 = eUb0 (2.31) bestimmt werden, wobei Ub0 die Beschleunigungsspannung beim ersten Stromabfall ist. Wenn man die Beschleunigungsspannung Ub weiter erhöht als Ub0 , findet die inelastische Streuung in einer Region näher bei K statt und die Elektronen, welche Energie in der inelastischen Streuung verloren haben, können später wieder beschleunigt werden und so A erreichen. Wenn eUb den Wert 2(E2 − E1 ) erreicht, können die Elektronen zweimal inelastisch streuen, einmal vorher (auf halber Strecke) und einmal nahe beim Gitter, und daher fällt der Strom erneut stark ab. Das gleiche Verhalten wiederholt sich für eUB = 3(E2 − E1 ) und so fort, aber auch für eUb = (E3 − E1 ) und so weiter. Differenzen zwischen Energieniveaus, die im Franck-Hertz Versuch bestimmt werden können, sind typischerweise von der Größenordnung einiger eV bis zu ca. 20 eV. 2.3.4 Andere Beispiele der Quantisierung: Raumquantisierung Ein anderer Typ von experimentell beobachteter Quantisierung ist jene der Richtungsquantisierung oder Raumquantisierung von atomaren Systemen. Man beobachtet diese immer wenn ein Atom sich in einem äußeren Feld mit einer bevorzugten Orientierung befindet. Die relative Orientierung des atomaren Systems ist dabei nicht beliebig sondern auf bestimmte diskrete Werte beschränkt. Die direkteste Bestätigung dieses Typs von Quantisierung tritt im Stern-Gerlach Versuch (O. Stern, W. Gerlach, 1922) auf, als Abweichung von paramagnetischen Atomstrahlen in einem stark inhomogenen Magnetfeld. Paramagnetische Atome haben eine permanentes magnetisches Moment µ und können als kleine, elementare Kreisel mit Drehimpuls L angesehen werden. µ ist dabei proportional und parallel zu L. In einem Magnetfeld B präzediert der Drehimpuls um B (Larmor Präzession). Wenn B konstant ist, bleibt die magnetische Energie −µ·B konstant und unabhängig von der Position des Massenschwerpunkts des Atoms, der sich in einem Zustand 21 geradlinig gleichförmiger Bewegung befindet. Falls jedoch B nicht konstant ist, erfährt der Massenschwerpunkt des Atoms eine Kraft F = ∇(µ · B) und eine entsprechende Ablenkung. Dies beobachtet man im Stern-Gerlach Versuch wie in Abb. D.12 schematisch gezeigt wird. Nimmt man an, dass Bz Bx und By ist, so dass die anderen Kompoz ẑ. Die Ablenkung ist nenten vernachlässigt werden können, dann erhält man F = µz ∂B ∂z daher proportional zur z Komponente des magnetischen Moments. Wenn man, nachdem der Strahl eine feste Strecke innerhalb des Magnetfelds durchquert hat, den Einschlag der Atome auf einem Schirm misst, würde man in der klassischen Physik aufgrund der kontinuierlichen Variation von µz erwarten, dass der Strahl über einen großen Bereich aufgefächert ist, welcher allen Werten von µz zwischen +µ und −µ entspricht. Im Experiment hingegen beobachtet man eine Reihe kleiner Punkte bei gleichen Abständen, welche parallel zu ẑ ausgerichtet sind. Wenn man das magnetische Feld variiert, ändern sich die Abstände zwischen den Punkten entsprechend ohne weitere Veränderung des Musters. Insbesondere bleibt die Anzahl der Punkte konstant. Jeder dieser Punkte entspricht einem spezifischen Wert von µz . Dementsprechend ist µz eine quantisierte Größe die λ verschiedene Werte annimmt. Neben dem Stern-Gerlach Versuch gibt es weitere direkte Manifestationen der Raumquantisierung. Im Speziellen sei hier der Effekt eines konstanten magnetischen Felds auf die Struktur der Spektren – der Zeeman Effekt – erwähnt, welchen wir später besprechen werden. Alle diese Phänomene haben einen gemeinsamen Ursprung: die Quantisierung des Drehimpulses. 2.4 Erfolge und Grenzen der alten Quantentheorie Die Bohr-Sommerfeld’sche Theorie war bis 1926/27 das einzige theoretische Gefüge um die vielen in der Atomphysik auftretenden experimentellen Befunde zu erklären. Ihr großer Verdienst ist die Einführung des Konzepts von Energieniveaus, die durch Quantenzahlen beschrieben werden, ein noch immer gültiges fundamentales Konzept für die mikroskopische Welt. Nichtsdestotrotz war selbst in der Zeit ihrer größten Erfolge klar, dass es sich nicht um eine endgültige physikalische Theorie handelt sondern nur um eine teilweise und provisorische Ansammlung von Korrekturen, um eine Anwendung von Klassischer Mechanik und Klassischer Elektrodynamik auf die atomare Welt zu ermöglichen. Nicht nur, dass die Bohr-Sommerfeld’sche Theorie nicht dazu in der Lage war, verschiedene experimentelle Fakten zu erklären, sie war auch auf multi-periodische Systeme beschränkt und konnte nicht für Stöße zwischen Systemen verwendet werden. Ihr fehlten zu einer echten Theorie gehörende Eigenschaften wie Kohärenz, Vollständigkeit und Exaktheit. Einerseits verwendete man die Gesetze der Klassischen Mechanik um Bahnen der Elektronen zu berechnen oder die Ausbreitung elektromagnetischer Wellen zu untersuchen, andererseits führte man Quantisierungsregeln und Hypothesen zur Absorption und Emission ein, welche in völligem Widerspruch zu den klassischen Gesetzen stehen Die vollwertige und kohärente Theorie, die quantenmechanische Theorie, wurde auf zweierlei unabhängige Arten in der Zeit von 1924 bis 1927 erlangt. Einerseits hatte L. de Broglie bereits 1924 vorgeschlagen, dass Teilchen (wie bereits für elektromagnetische Strahlung geschehen) eine zweifache Beschaffenheit haben, also sowohl teilchen- als auch wellenartige Attribute tragen. E. Schrödinger formulierte mittels einer Wellengleichung für Teilchen die Wellenmechanik (1926). Andererseits erlangten W. Heisenberg, M. Born und P. Jordan ausgehend vom Korrespondenzprinzip ein Formulierung der Matrizenmechanik (1925). 22 Anschließend zeigte Schrödinger die mathematische Äquivalenz der beiden Theorien und Born, Jordan und P. Dirac konstruierten die axiomatische Formulierung der QM. Dies wird Thema des nächsten Kapitels sein. 23 Tabellarischer Überblick der Frühgeschichte der Quantenmechanik: 1827 1868 1868 1895 1896 1897 1898 1900 1905 1910 1911 1912 1913 1914 1919 1922 1923 1925 1927 1925-28 1932 R. Brown Beobachtung der Brown’schen Bewegung J. Jansen, N. Lockyer Endeckung des Heliums via Spektrallinien J. J. Balmer Balmer Formel für Wasserstoff W.C. Röntgen Entdeckung der Röntgenstrahlung A.H. Becquerel Entdeckung der Radioaktivität J.J. Thomson Entdeckung des Elektrons M. & P. Curie Entdeckung von Polonium & Radium M. Planck Schwarzkörperstrahlung A. Einstein Photoelektrischer Effekt, Brown’sche Bewegung R.A. Millikan Messung der Elektronenladung E. Rutherford Streuung von α-Teilchen & Kern-Hülle Modell M.v. Laue Röntgenbeugung an Kristallen C. Wilson Trajektorien in der Nebelkammer H. Geiger Geiger-Müller-Zählrohr N. Bohr Bohr’sches Atommodell H.G. Moseley Messung der Kernladungszahl J. Franck, G. Hertz Elektronenstreuung an Atomen A. Sommerfeld Atombau & Spektrallinien E. Rutherford Entdeckung des Protons O. Stern, W. Gerlach Raumquantisierung L. de Broglie Materiewellen & Welle-Teilchen-Dualismus A.H. Compton Compton-Streuung S. Goudsmith, G. Uhlenbeck Elektronenspin C. Davisson, L. Germer Elektronenbeugung an Kristallen M. Born, P. Jordan, W. Heisenberg Göttinger Matrizenmechanik E. Schrödinger Wellenmechanik (Wien) J. Chadwick Entdeckung des Neutrons Literaturempfehlung: A. Messiah F. Schwabl S. Weinberg Quantum Mechanics, Volume 1 Quantenmechanik (QM I) Lectures on Quantum Mechanics 24 Sections 1.1 – 1.5 Kapitel 1 Sections 1.1 – 1.2 3 Wellenfunktion und Schrödingergleichung 3.1 Wellen- und Teilchenaspekte von Strahlung Im achtzehnten Jahrhundert wurden zwei verschiedene Theorie vorgeschlagen um die Ausbreitung von Licht zu beschreiben: eine korpuskulare Theorie von I. Newton und eine Wellentheorie von C. Huygens. Die Theorie Newtons wurde verworfen, als Interferenzund Beugungsphänomene entdeckt wurden. Diese zeigten nicht nur die Wellennatur des Lichts sondern gestatteten auch dessen Wellenlänge zu messen. Rufen Sie sich in diesem Zusammenhang die Ihnen bekannten Experimente von T. Young und A. Fresnel und die Beugungsexperimente an einem Spalt in Erinnerung! Auch für Röntgenstrahlung konnte man nachweisen, dass es sich um elektromagnetische Wellen mit Wellenlängen zwischen 0.5 und 500 Å handelt. Dies wurde durch Untersuchungen von Röntgenbeugung an Kristallen nachgewiesen – im Wesentlichen natürliche dreidimensionale Gitter mit Gitterkonstanten in der Größenordnung eines Ångström. Zwei verschiedene Arten von Experimenten wurden an den Kristallen durchgeführt: Beugung durch Transparenz (M. von Laue, 1912) und Beugung durch Reflexion (W.L. und W.H. Bragg, 1913). Alle diese Phänomene bestätigen die Wellennatur der elektromagnetischen Strahlung. Nichtsdestotrotz zeigt die Planck’sche Hypothese sowie alle anderen im vorigen Kapitel besprochenen Phänomene, dass man in gewisser Art und Weise elektromagnetischer Strahlung einen Teilchencharakter zuordnen kann. In der Tat können der Photoelektrische Effekt und der Compton Effekt als Ergebnis von Stößen zwischen Photonen und Elektronen beschrieben werden. In diesen Stößen verhalten sich die Photonen in gewisser Weise ähnlich wie Materieteilchen. Wir werden später sehen, wie diese zwei Charakteristika miteinander in Einklang gebracht werden können. 3.2 Teilchencharakter von Materie und de Broglie’sche Hypothese Was Materie angeht erschien es schon immer natürlich, anzunehmen, dass kleinere Teile makroskopischer Materie materielle Korpuskel seien, welche den Bewegungsgleichungen der Klassischen Mechanik gehorchen. Dies wurde auch durch die Chemie sowie die kinetische Theorie bestätigt. Als Beispiele seien hier die Thomson’sche Methode zur Bestimmung des Verhältnisses von Ladung zu Masse beim Elektron, welche auf Parabelbahnen des Elektrons in einem magnetischen Feld basiert, und die Millikan’sche Methode zur Messung der Elementarladung angeführt. Innerhalb der Wilson’schen Kammer (auch: Blasenkammer) konnte man die Trajektorien der Elementarteilchen sichtbar machen. Insbesondere war es möglich, die Stöße zwischen Teilchen sichtbar zu machen und zu bestätigen, dass Energie- und Impulserhaltungssätze erüllt sind. Trotz dieser experimentellen Beweise schlug L. de Broglie im Jahr 19239 vor, dass Materieteilchen eine Welle-Teilchen Doppelnatur zuzuordnen sei. Er nahm an, dass auf diese Art und Weise die Existenz der 9 De Broglie war zu dieser Zeit Doktorand in Paris. 25 Energieniveaus im Atom zu erklären sei. Wie wir im vorigen Kapitel gesehen haben, muss gemäß Planck und Einstein dem Quant der elektromagnetischen Strahlung – dem Photon – mit Frequenz ν und Wellenlänge λ eine Energie E = hν und ein Impuls p = h/λ zugeordnet werden. Im Umkehrschluss schlug de Broglie vor, einem Teilchen in Bewegung mit Impuls p eine ebene Welle i ψ(x, t) = A exp { (p · x − Et)} ~ (3.1) mit Ausbreitungsrichtung in Richtung des Impulses p zuzuordnen, deren Frequenz und Wellenlänge wiederum zu Energie und Impuls durch E = hν und p = h/λ in Beziehung stehen. In einer relativistischen Betrachtung wird verlangt, dass (p, E) und (k, ω) als Vierervektoren transformieren. Wir merken an, dass die Phasengeschwindigkeit (z.B. die Ausbreitungsgeschwindigkeit von ebenen Wellen gleicher Phase) der ebenen Welle in Glg. (3.1) durch vph = E p (3.2) gegeben ist. Wenn man stattdessen ein Wellenpaket betrachtet (z.B. die Superposition von ebenen Wellen mit benachbarten Impulsen oder Wellenzahlen), Z i ψ(x, t) = d3 p c(p) exp { (p · x − Et)}, (3.3) ~ dann ist die Gruppengeschwindigkeit vg durch vg = dE dp (3.4) definiert und daher gleich der Geschwindigkeit des Teilchens sowohl in relativistischen als auch nicht-relativistischen Behandlungen. De Broglies Gedanke war, dass die Existenz der Energieniveaus innerhalb des Atoms dem Phänomen der charakteristischen Frequenzen entspricht, das auftritt, wenn eine Welle innerhalb eines gegebenen Raumbereiches eingesperrt ist (vgl. Übung 1 auf Blatt 2 als Beispiel für derartiges Verhalten). Eine Rechtfertigung für diese Idee findet man bereits mittels folgender einfacher Betrachtung: Nehmen wir an, dass innerhalb eines Wasserstoffatoms das Elektron sich auf einer kreisförmigen Bahn r befinde. Wenn p sein Impuls ist, beträgt die zugehörige Wellenlänge auf Basis der de Broglie Beziehung λ = h/p. Die Bedingung für stationäre Wellen ist, dass die Länge der Trajektorie des Elektrons ein ganzzahliges Vielfaches n der Wellenlänge λ sei, 2πr = nλ = nh/p, (3.5) was mit der Bohr’schen Quantisierungsbedingung übereinstimmt, vgl. Glg. (2.20). Allgemeiner kann man die Sommerfeld’sche Quantisierungsbedingung, vgl. Glg. (2.30), als die Forderung verstehen, dass die Phase der Welle sich über eine volle Periode um ein ganzzahliges Vielfaches von 2π ändert. 26 3.3 Die Schrödinger Gleichung De Broglie hatte die Eingebung, dass ein Teilchen mit einer Welle verbunden sein müsse, doch es gelang ihm nicht, eine präzise mathematische Formulierung für seine Idee zu finden. An seiner statt gelang es E. Schrödinger im Jahre 1926 eine Wellengleichung für die Ausbreitung dieser Welle niederzuschreiben. Die ursprünglichen Überlegungen10 Schödingers, um diese Schrödingergleichung zu erhalten, beruhten auf der Hamilton-Jacobi Formulierung der Klassischen Mechanik. Wir werden diese Herleitung hier nicht nachvollziehen und uns auf sehr viel einfachere Argumente beschränken. Wie wir gesehen haben, sollte man einem freien Teichen mit Impuls p und Energie E eine ebene Welle gemäß Glg. (3.1) zuordnen. Dann erfüllt diese die Gleichungen ~ b ∇x ψ(x, t) = pψ(x, t), i ∂ i~ ψ(x, t) =Eψ(x, t) ∂t (3.6) (3.7) Dann erhält man für jeden Zustand der Energie E i ψ(x, t) = e− ~ Et φ(x), (3.8) wobei für ein freies Teilchen im nicht-relativistischen Fall E = p2 /2m gilt. Der Wechsel der Notation wird im Anhang erläutert. Daher ist in diesem Fall φ(x) eine Lösung der Gleichung (mit Laplace Operator ∆x = ∇2x ) 1 Eφ(x) = 2m ~ ∇x i 2 φ(x) = − pb2 ~2 ∆x φ(x) = φ(x), 2m 2m (3.9) wie sich nach zweifacher Anwendung von Glg. (3.6) ergibt. Da die Energie eines Teilchens in einem Potential V (x) allgemeiner durch E = p2 /2m + V (x) gegeben ist, ist es eine naheliegende Vermutung, dass man für ein solches Teilchen nach wie vor Glg. (3.8) verwenden kann, aber nun ~2 (3.10) Eφ(x) = − ∆x + V (x) φ(x) 2m bzw. ∂ i~ ψ(x, t) = ∂t ~2 − ∆x + V (x) ψ(x, t) 2m (3.11) b auf die gilt. Wenn man die Wirkung des Hamilton-Operators (auch: Hamiltonian) H Wellenfunktion als ~ b b Hψ(x, t) = H(b x, p)ψ(x, t) = H(x, ∇x )ψ(x, t) i 10 E. Schrödinger, Ann. Phys. 79, 361 (1926). 27 (3.12) identifiziert, kann man Glg. (3.11) umschreiben als i~ ~ ∂ b b ψ(x, t) = Hψ(x, t) = H(b x, p)ψ(x, t) = H(x, ∇x )ψ(x, t). ∂t i (3.13) Dies ist die zeitabhängige Schrödingergleichung für die Wellenfunktion ψ(x, t). Wir nehmen an, dass jedem Teilchen eine komplexe Wellenfunktion ψ(x, t) zugeordnet ist, welche der Schrödingergleichung Glg. (3.13) genügt, wobei h (bzw. ~ = h/2π) gleich der Plank’schen Konstanten h = 6.626 × 10−34 Js ist. Dies gilt in voller Allgemeinheit und unabhängig davon, wie wir diese Gleichung erhalten haben. Wir bemerken, dass Glg. (3.13) eine Differentialgleichung erster Ordnung in der Zeit ist und daher ψ(x, t) durch die anfängliche Verteilung ψ(x, 0) festgelegt ist. Da Glg. (3.13) eine lineare Gleichung in ψ(x, t) ist, gilt das Superpositionsprinzip, d.h. Linearkombinationen von Lösungen sind ebenfalls Lösungen und Interferenzeffekte treten auf, wie sie aus der Optik bekannt sind. Wie die Gleichungen für transversale Schwingungen einer Saite eines Musikinstruments, hat auch diese Gleichung nur für bestimmte Werte der Energie Lösungen. In diesen Fällen ist die Randbedingung, dass φ(x) eine einwertige Funktion die für |x| → ∞ verschwindet. Wie Schrödinger in seinem ersten Papier zur Wellenmechanik bemerkte: “ Als das Wesentliche erscheint mir, daßin der Quantenvorschrift nicht mehr die geheimnisvolle “Ganzzahligkeitsforderung” auftritt, sondern diese ist sozusagen einen Schritt weiter zurückverfolgt: sie hat ihren Grund in der Endlichkeit und Eindeutigkeit einer gewissen Raumfunktion.” [E. Schrödinger, Annalen der Physik (1926)] Darüber hinaus besitzt die Schrödingergleichung eine offensichtliche Verallgemeinerung für Mehrteilchensysteme. Wenn ein System durch einen Hamilton-Operator H(b x1 , . . . ; pb1 , . . .) (die Punkte . . . repräsentieren die Ortskoordinaten und Impulse weiterer Teilchen) gegeben ist, dann nimmt die Schrödingergleichung die Form ∂ ~ (3.14) H(x1 , . . . ; ∇x1 , . . .)ψn (x1 , . . .) = i~ ψn (x1 , . . .) = En ψn (x1 , . . .) i ∂t an. Der Hamilton-Operator für N Teilchen der Massen mi mit i = 1, . . . , N mit dem allgemeinen Potential V (x1 , . . . , xN ) ist beispielsweise durch X pb2 i b bN ) H= + V (b x1 , . . . , x (3.15) 2m i i gegeben, und die erlaubten Energien sind jene, für welche es eine eindeutige Lösung ψ(x1 , . . . , xN ) gibt, die für jegliches |xi | → ∞11 verschwindet. Die Schödingergleichung lautet in diesem Fall ! X ~2 i Eφ(x1 , . . . , xN ) = − ∆x + V (x1 , x2 , . . . , xN ) φ(x1 , . . . , xN ). (3.16) 2mi i i Ausgestattet mit dieser Gleichung war es nun – zumindest im Prinzip – möglich, die Spektren nicht nur von Wasserstoff sondern ebenso von allen anderen Atomen sowie von jeglichem anderen nicht-relativistischen System mit bekanntem Potential auszurechnen. 11 Diese Bedingungen werden später in Kapitel XXX en détail besprochen. 28 3.4 Experimentelle Bestätigung der Welleneigenschaften von Materieteilchen Die Schrödingergleichung, Glg. (3.13), ist Grundlage der Erklärungen aller Eigenschaften von Atomen und Molekülen. In sämtlichen Fällen, in denen es möglich ist, die Gleichung zu lösen oder effektive Näherungsmethoden zu verwenden, stimmen die Ergebnisse mit experimentellen Daten überein. Nichtsdestotrotz ist auch eine direkte Bestätigung der Welleneigenschaften von Materieteilchen wichtig. Diese Bestätigung wurde 1927 zum ersten Mal durch C. Davisson und L. Germer sowie unabhängig davon durch G.P. Thomson erbracht. Zunächst bemerken wir, dass die typische Größenordnung der de Broglie Wellenlänge so ist, dass kein Widerspruch zu makroskopischen Erfahrungen auftritt. Hat beispielsweise ein Körper eine Masse 10−5 g (klein auf einer makroskopischen Skala) und eine Geschwindigkeit von einigen cm/s, so hat er eine de Broglie Wellenlänge von 10−24 m, welche sicherlich nicht direkt beobachtbar ist. Bedingungen, die sehr viel günstiger zur Beobachtung der Welleneigenschaften von Teilchen sind, liegen für leichte Teilchen wie Elektronen√vor. Die einem Elektron mit kinetischer Energie T zugeordnete Wellenlänge p ist λ = h/ 2me T = 12.25 Å/ T /eV . Für T von der Größenordnung 100 eV ist λ von der Größenordnung 1 Å, ähnlich zur Wellenlänge von Röntgenstrahlung. Daher könnte man die Beugung von Elektronen an Kristallen nutzen, um die Wellenlänge der Elektronen nachzuweisen. Das Experiment von Davisson und Germer basiert auf Reflexion ähnlich wie die Beugungsexperimente von Bragg mit Röntgenstrahlen. Die Elektronen werden von einer Glühkathode F emittiert und durch eine Spannung zwischen F und einer Blende D beschleunigt. Durch Variation der Spannung zwischen D und F kann die Geschwindigkeit der Elektronen variiert werden. Ein dünner Strahl von Elektronen geht durch ein Loch in der Blende und trifft auf einen Nickel-Einkristall R. Die Elektronen werden am Kristall gestreut und in einem beweglichen Detektor P gesammelt, vgl. Abb. D.13. Der gesamte Aufbau befindet sich in einem Hochvakuum. Auf diese Weise kann man die gesamte Winkelverteilung der gestreuten Elektronen messen. Das Experiment von Thomson wurde mittels eines Aufbaus realisiert, der dem Aufbau Laues zuw Messung der Beugung von Röntgenstrahlung mittels Transparenz von Kristallen ähnelt. In diesem Aufbau emittiert ein Glühdraht im Hochvakuum Elektronen durch den thermoelektrischen Effekt. Die Elektronen werden zur Blende D durch eine Spannung U = V /e beschleunigt. Danach werden sie nicht mehr durch Kräfte beeinflusst. Die zweite Lochblende D0 erzeugt einen dünnen Strahl der auf eine photographische Platte L aufschlägt und einen hellen, runden Fleck erzeugt. Wenn man nun in die Flugbahn der Elektronen eine dünne Kristallschicht einsetzt, treten auf der Photoplatte Leuchtpunkte in einer regelmäßigen Anordnung um den zentralen Punkt auf, wie es für ein Beugungsphänomen, dessen Symmetrie von der Symmetrie der Kristallgitter abhängt, charakteristisch ist. Die Ergebnisse, die man in diesen beiden Experimenten erhält, sind sehr ähnlich zu jenen der Experimente mit Röntgenstrahlung. Die Beobachtungen beider Experimente sind in Abb. D.14 gezeigt. Indem man die Beugungsbilder betrachtet, kann man die Wellenlänge des Elektrons bestimmen, und findet, dass die de Broglie Beziehung vollständig bestätigt wird. Nach diesen Experimenten mit Elektronen wurden ähnliche Experimente mit Atomen und leichten Molekülen durchgeführt (I. Estermann, O. Stern, 1929). Es ist hier von Interesse, die Werte von λ für einige Atome und Moleküle mit mittlerer thermischer Geschwidigkeiten bei Raumtemperatur anzugeben, vgl. Tab. 8. 29 Später wurden Beugungsexperimente mit Neutronen, Protonen und anderen bekannten Teilchen ausgeführt. Unter den Experimenten mit Neutronen führen wir insbesondere jene von E. Fermi und L. Woods Marshall in Jahr 1947 an, in welchen ein monoenergetischer Neutronenstrahl mit Impuls p sich wie ein Strahl monochromatischer Strahlung mit λ = h/p verhält. Diese Experimente brachten ähnlich wie Experimente mit Röntgenstrahlung eine ganze Klasse von Phänomenen wie Streuung, Reflexion und so weiter hervor. Heute verwenden wir die Welleneigenschaften von Neutronen in der Erforschung der Struktur von Kristallen. Sie selbst werden zur de Broglie Wellenlänge einige Betrachtungen in Übungsaufgabe 3.1 anstellen. 3.5 Kontinuitätsgleichung und statistische Interpretation der Wellenfunktion Wir wollen nun die physikalische Bedeutung der Wellenfunktion ψ(x, t) verstehen, welche die Schrödingergleichung, Glg. (3.13), erfüllt. Zunächst schlug Schrödinger die Größe P (x, t) = ψ ∗ (x, t)ψ(x, t) (3.17) als Ladungsdichte am Punkt x zur Zeit t vor12 . Dann sollte eine Kontinuitätsgleichung der Form (die Beziehung zwischen ρ und P wird später genauer diskutiert) ∂ ρ + ∇x · j = 0 ∂t (3.18) gelten, wobei ρ die Dichte und j der zugehörige Strom ist, j = ρv. Unter Verwendung der Schrödingergleichung, Glg. (3.13) und der komplex konjugierten Schrödingergleichung ist es möglich, eine Kontinuitätsgleichung für P zu erhalten. Wir erhalten durch Umstellen aus den beiden äquivalenten Formen der Schrödingergleichung i ∂ 2m V (x)ψ(x, t) + 2m ψ(x, t) = 0, 2 ~ ~ ∂t i ∂ ∗ 2m ψ (x, t) = 0, ∆x ψ ∗ (x, t) − 2 V (x)ψ ∗ (x, t) − 2m ~ ~ ∂t ∆x ψ(x, t) − (3.19) (3.20) und multiplizieren die beiden Gleichungen mit ψ ∗ (x, t) bzw. ψ(x, t), um die zweite danach von der ersten zu subtrahieren. Damit erhalten wir ψ ∗ (x, t)∆x ψ(x, t) − ψ(x, t)∆x ψ ∗ (x, t) + 2m i ∂ ∗ [ψ (x, t)ψ(x, t)] = 0, ~ ∂t (3.21) was in die Form von ∂P =0 ∂t gebracht werden kann. Hierbei ist die Stromdichte ∇x · S + S(x, t) = 12 ~ (ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t)) . 2im Das erste neutrale Teilchen – das Neutron – wurde erst 1932 entdeckt. 30 (3.22) (3.23) Glg. (3.22) hat die Form einer Kontinuitätsgleichung. Nun integrieren wir Glg. (3.22) über das Volumen V und wenden für das Integral den Gauß’schen Integralsatz13 an, um Z Z d ∂ψ ∗ (x, t) ~ ∂ψ(x, t) 3 ∗ ∗ − ψ(x, t) (3.24) d x ψ (x, t)ψ(x, t) = − dσ ψ (x, t) dt V 2im σ ∂n ∂n zu erhalten. Hierbei bezeichnet σ die Oberfläche des Volumens V und sowohl ∂ψ(x, t)/∂n als auch ∂ψ ∗ (x, t)/∂n bezeichnen Normalenableitungen von ψ(x, t) bzw. ψ ∗ (x, t) auf der Oberfläche. Wenn wir annehmen, dass ψ(x, t) und ψ ∗ (x, t) und ihre Ableitungen schnell genug für |x| → ∞ abfallen, und V über den kompletten Raum R3 ausdehnen, verschwindet das Integral über die Oberfläche auf der rechten Seite. Wir erhalten damit Z d d3 xψ ∗ (x, t)ψ(x, t) = 0, (3.25) dt R das wichtige Ergebnis, dass d3 x ψ ∗ (x, t)ψ(x, t) zeitunabhängig ist. Da es sich bei der Schrödingergleichung um eine homogene Gleichung handelt, kann man ψ(x, t) mit einer geeigneten Konstante multiplizieren, so dass Z d3 x ψ ∗ (x, t)ψ(x, t) = 1 (3.26) R 3 grundsätzlich gilt. Falls d x ψ ∗ (x, t)ψ(x, t) = C gilt, ist es ausreichend, ψ(x, t) durch √ 1/ Cψ(x, t) zu ersetzen, damit die neue Wellenfunktion “normiert” ist, d.h. dass die “Norm” Z Z 2 2 3 kψ(x, t)k ≡ d x |ψ(x, t)| = d3 x ψ ∗ (x, t)ψ(x, t) (3.27) gleich eins ist. Glg. (3.27) wird als “Normierungsbedingung” bezeichntet und der Faktor mit dem man ψ(x, t) multiplizieren muss als “Normierungskonstante”. Diese Normierungskonstante kann immer bis auf einen konstanten Phasenfaktor eiα bestimmt werden, dessen Wahl keinerlei Einfluss auf die Ausdrücke für S und P hat. Auf jeden Fall kann man, falls Glg. (3.25) erfüllt ist, die Ausdrücke ρ(x, t) =eψ ∗ (x, t)ψ(x, t), e~ j(x, t) = (ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t)) 2im (3.28) (3.29) als Ladungdichte bzw. Stromdichte interpretieren, wobei e die dem Teilchen zugeordnete Ladung ist. Nichtsdestotrotz bringt diese Interpretation große Probleme mit sich. Zunächst einmal kann sich die Welle ψ(x, t) während ihrer Ausbreitung beträchtlich ausdehnen, und die entsprechende Ausdehnung müsste ebenso mit der vom Teilchen getragenen elektrischen Ladung geschehen. Insbesondere müsste in den Fällen von Beugung und Interferenz, die in den vorigen Abschnitten besprochen wurden, das Elektron über die gesamte Region verteilt sein, in welcher das Interferenzmuster beobachtet wird. Dies steht jedoch in direktem Widerspruch zur experimentellen Tatsache, dass sich das Elektron zu jedem Zeitpunkt, an dem man es beobachtet, als unteilbare Einheit und als im Wesentlichen punktförmiges Objekt erweist. Darüber hinaus sollte ein Elektron in einem 13 R R Der Gauß’sche Satz besagt V dn x∇x · A = dσn−1 A · n̂, wobei n̂ der nach außen orientierte Normaleneinheitsvektor des n − 1 dimensionalen Oberflächenelements dσn−1 ist, welches das Volumen V begrenzt. 31 Atom nicht nur von der vom Kern ausgeübten Kraft und der von anderen Elektronen ausgeübten Kraft beeinflusst werden sondern auch von jener Kraft, die von seinem eigenen geladenen “Fluid” ausgeht. Für dieses Beispiel sollte also das in der Schrödingergleichung für das Wasserstoffatom zu verwendende Potential Z ψ ∗ (x0 , t)ψ(x, t) e2 2 d 3 x0 (3.30) V (x) = − + e r |x0 − x| lauten und die Korrektur wäre nicht-linear in ψ(x, t). Wie wir im Kapitel XXX sehen werden, sind die korrekten Energieniveaus des Wasserstoffatoms jene, die man für das Potential V (x) = −e2 / |x| erhält. Um zu verstehen, wie diese Interpretation modifiziert werden sollte, könnte man zu den Interferenz- und Beugungsexperimenten zurückkehren, wie zum Beispiel zu dem von Davisson und Germer. In dem originalen Experiment, vgl. Abb. D.15, werden die vom Galvanometer G als Funktion des Winkels θ angezeigten Minima und Maxima als Krönchen bezeichnet, zu dem sehr viele Elektronen beitragen. Wenn man sich vorstellen würde, den Detektor P durch ein Instrument zu ersetzen, das jedes Elektron für sich einzeln zählen würde, dann könnte man das vollständige Beugungsmuster rekonstruieren, und zwar, als das Resultat der statistischen Verteilung der Elektronen, die in verschiedene Richtungen gestreut wurden, vgl. Abb. D.16. All dies motiviert uns, eine statistische Interpretation des Wellenobjekts ψ(x, t) in Erwägung zu ziehen. Der erste, der zu dieser Interpretation gelangte, war M. Born (1926). Auf diese Art und Weise interpretieren wir P (x, t)d3 x = ψ ∗ (x, t)ψ(x, t)d3 x (3.31) als die Wahrscheinlichkeit, das Teilchen zur Zeit t in dem Volumenelement d3 x um den Ort x herum zu beobachten. Indem wir mit dσ ein allgemeines Oberflächenelement eines den Ort x beinhaltenden Volumens und mit n̂ den senkrecht zu dieser Oberfläche nach außen weisenden Einheitsvektor bezeichnen, identifizieren wir auf gleiche Art und Weise S(x, t) · n̂dσdt = ~ (ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t)) · n̂dσdt 2im (3.32) als die Wahrscheinlichkeit, dass ein Teilchen das Flächenelement dσ im Zeitintervall dt in Richtung des Vektors n̂ durchquert. Hierbei ist dσ = dσ n̂ der Normalenvektor des Flächenelements, der orthogonal auf dieser Fläche steht und nach außen weist, sowie n̂ der zugehörige Einheitsvektor. Nun wollen wir besprechen, was in den vorigen Behauptungen postuliert worden ist. Das Konzept der Wahrscheinlichkeit hat für ein Einzelereignis keinerlei Bedeutung, und daher macht das, was wir postuliert haben, keinerlei Aussage über das Verhalten eines einzelnen Teilchens. Sobald wir jedoch mehrere gleiche Teilchen betrachten, die alle den gleichen physikalischen Anfangszustand haben (im konkreten Fall ein Strahl von Teilchen) und in ausreichend großer Zahl vorliegen, dass statistische Schwankungen vernachlässigt werden können, dann liefert Glg. (3.31) den Anteil der Teilchen, die tatsächlich in dem Volumen d3 x beobachtet werden, und der Ausdruck Glg. (3.32) gibt den Anteil der Teilchen an, welche durch die Oberfläche dσ in der Zeit dt gegangen sind. Entsprechend gilt für den Fall der geladenen Teilchen, dass Glgn. (3.28) und (3.29) nach Multiplikation mit der 32 Gesamtzahl der Teilchen N die makroskopische Ladungs- und Stromverteilung des Strahls beschreiben. Die Interpretation, mit der wir Glgn. (3.31) und (3.32) versehen haben, gilt gleichermaßen für geladene und neutrale Teilchen. 3.6 Die statistische Interpretation und die Beschreibung mittels Welle-Teilchen-Dualität Wir haben am Anfang des Kapitels angesprochen, dass Materieteilchen zwei Merkmale haben, die widersprüchlich erscheinen: Welleneigenschaften und Teilcheneigenschaften. Der Wellencharakter tritt in Interferenz- und Beugungsphänomenen in Erscheinung, während der Teilchencharakter sich in der Tatsache zeigt, dass die Teilchen, wann immer sie individuell beobachtet werden, sich als unteilbare Einheit zeigen. Die statistische Interpretation, die wir im vorigen Abschnitt erläutert haben, vereinbart diese beiden Aspekte. Das Objekt, das wir ein Teilchen nennen, sollte man sich weder als Korpuskel noch als Welle mit der üblichen Bedeutung dieser zwei Konzepte vorstellen, die auf unserer Erfahrung mit makroskopischen Objekten beruhen. Es gibt solche Situationen, in denen das Verhalten der Teilchen als Ausbreitung von Wellen beschreibbar ist, und andere Situationen, in welchen es als Bewegung eines kleinen Körpers beschreibbar ist. Von keinem der beiden Konzepte sollte man auf allgemeingültiges Verhalten schließen. Stattdessen sollten wir den Versuch einer Beschreibung von Teilchen auf Grundlage unserer gewöhnlichen Erfahrung aufgeben. Eine sehr klare Darstellung dieser Situation erhält man in der Diskussion des Doppelspaltexperiments, vgl. Abb. D.17. Wir wollen das Experiment – soweit möglich – rein schematisch beschreiben. Ein Strahl von Elektronen bei fester Energie tritt aus einer Quelle aus und trifft auf eine Oberfläche Σ1 , welche zwei Löcher (Spalte) 1 und 2 hat. Dann wird jedes Elektron durch eine monochromatische Welle beschrieben, die zum Teil an Σ1 reflektiert wird, und deren anderer Anteil beim Durchgang durch die beiden Spalte gebeugt wird. Wir nennen die beiden gebeugten Wellen ψ1 (x, t) und ψ2 (x, t). Dann ist die gesamte Welle nahe beim Schirm Σ2 durch ψ(x, t) = ψ1 (x, t) + ψ2 (x, t) gegeben, so dass die Wahrscheinlichkeit, dass ein Detektor M an irgendeiner Position x entlang des Schirms Σ2 zum Zeitpunkt t den Aufschlag des Elektrons misst, durch S(x, t) · n̂dσ = ~ n ∗ [ψ1 (x, t) + ψ2∗ (x, t)] ∇x [ψ1 (x, t) + ψ2 (x, t)] 2im o − [ψ1 (x, t) + ψ2 (x, t)] ∇x [ψ1∗ (x, t) + ψ2∗ (x, t)] · n̂dσ (3.33) gegeben ist, wobei n̂ der Normaleneinheitsvektor zu Σ2 ist und dσ das dem Detektor M entsprechende Oberflächenelement ist. Da alle Elektronen die gleichen Anfangsbedingungen haben, gibt der zeitliche Mittelwert von Glg. (3.33) aufgrund des Gesetzes der großen Zahlen den Fluss der Elektronen in M pro Zeiteinheit an. Wenn man die Position von M entlang des Schirms verschiebt, sollte der beobachtete Fluss Minima und Maxima aufweisen, wie man sie von typischen Interferenzmustern kennt. Nun wollen wir vor den beiden Spalten 1 und 2 die zwei Detektoren C1 und C2 aufstellen. Von den Teilchen, die M erreichen, wird ein Anteil von dem Detektor C1 gemessen – wir sagen, sie sind durch den Spalt 1 gegangen – und der andere Anteil wird von dem 33 Detektor C2 gemessen – wir sagen, sie sind durch den Spalt 2 gegangen. Der Fluss des ersten Anteils ist proportional zu S1 (x, t) · n̂dσ = ~ {ψ1∗ (x, t)∇x ψ1 (x, t) − ψ1 (x, t)∇x ψ1∗ (x, t)} · n̂dσ, 2im (3.34) der Fluss des zweiten Anteils ist S2 (x, t) · n̂dσ = ~ {ψ ∗ (x, t)∇x ψ2 (x, t) − ψ2 (x, t)∇x ψ2∗ (x, t)} · n̂dσ. 2im 2 (3.35) Daher ist der gesamte Fluss durch die Summe der einzelnen Flüsse gegeben, S1 (x, t) · n̂dσ + S2 (x, t) · n̂dσ, (3.36) und wir sehen, dass S1 (x, t) + S2 (x, t) 6= S(x, t). Die Verteilungen von S(x, t) · n̂, S1 (x, t) · n̂, S2 (x, t) · n̂, [S1 (x, t) + S2 (x, t)] · n̂ sind durch die Kurven (a), (b), (c) und (d) in Abb. D.18 gezeigt. Die unterschiedlichen Charakteristika der Kurven (a) und (d) sind offenkundig, insbesondere hat die Kurve (d) keine Minima und Maxima des Interferenzmusters der Kurve (a) mehr. Wir müssen daraus schlussfolgern, dass die Anwesenheit der Detektoren C1 und C2 das Phänomen beinflusst und die Interferenz komplett zerstört hat. Kehren wir nun zur Idee eines Teilchens zurück. Falls wir uns das Elektron als Korpuskel vorstellen, sagt uns die gewöhnliche Intuition, dass es notwendigerweise, um den Detektor M zu erreichen, entweder durch den Spalt 1 oder durch den Spalt 2 gegangen sein muss. Wenn dem so wäre, müsste man erwarten, dass die Verteilung von Elektronen auf dem Schirm Σ2 von der Form (d) ist. Dies müsste sowohl in Anwesenheit wie in Abwesenheit der Detektoren C1 und C2 gelten. Jedoch widerspricht dies der Vorhersage der Schödingergleichung und den Ergebnissen der Interferenz- und Beugungsexperimente mit Elektronen, die in den vorigen Abschnitten besprochen wurden. Nur falls wir die Detektoren vor den Spalten platziert haben, können wir sagen, dass das Elektron mit Sicherheit durch einen bestimmten Spalt gegangen ist. Daher können wir die Beschreibung als Korpuskel nicht im Allgemeinen ohne Einschränkung verwenden. Andererseits ist die Wellenbeschreibung nicht kompatibel mit der Beobachtung des Durchgangs eines einzelnen Elektrons durch den Detektor. Zu jeder Zeit beobachtet jeweils nur einer der beiden Detektoren vor den Spalten den Durchgang des Elektrons. Wenn der Detektor M aus einem System von Einzeldetektoren aufgebaut ist, die über den Schirm Σ2 verteilt sind, und die Intensität des Elektronenstroms ausreichend gering ist, beobachten diese die einzelnen Elektronen jedes für sich und nur die statistische Verteilung der Zählraten wird in Übereinstimmung mit der Schrödingergleichung sein, vgl. Abb. D.16. Das hier beschriebene Experiment ist zu einem Gutteil ein idealisiertes Experiment, ein Gedankenexperiment. In Wirklichkeit wäre es schwierig ob der Größe der Spalte Detektoren zu realisieren, die zwischen Teilchen unterscheiden können, welche durch die Spalte 1 und 2 gehen. Aber es zeigt charakteristische Eigenschaften, die in real durchgeführten Experimenten tatsächlich zu beobachten sind. Insbesondere stimmen die Kurven (a), (b) und (c) vollständig mit den Beobachtungen in Beugungsexperimenten mit Elektronen an ein oder zwei Spalten überein, wie sie in dem vorigen Abschnitt beschrieben werden. Daher sehen wir, dass wir eine intuitive Beschreibung elementarer Objekte aufgeben müssen, und, dass dies eine inhärente Eigenschaft der QM ist (der Theorie des Verhaltens 34 elementarer Objekte), die diese Objekte in rein probabilistischen (d.h wahrscheinlichkeitstheoretischen) Begriffen beschreibt. Auf Grundlage von Informationen, die wir bezüglich eines Quantensystems haben, können wir nicht allgemein vorhersagen, welche Ergebnisse man bei einer einzelnen Beobachtung des Systems erhalten wird. Stattdessen können wir nur Wahrscheinlichkeiten für verschiedene Ergebnisse vorhersagen. In dem Doppelspaltexperiment erlaubt uns die Kenntnis der anfänglichen Energie des Elektrons nicht, vorherzusagen, an welchen Punkt des Schirms Σ2 dieses einzelne Elektron beobachtet werden wird, sondern sie erlaubt uns nur, die statistische Verteilung vieler Elektronen mit exakt gleichen Anfangsbedingungen vorherzusagen. Wie Sie vielleicht im Bezug zur Thermodynamik bereits in den Experimentalphysikvorlesungen gesehen oder in Lehrbüchern zur Experimentalphysik gelesen haben, taucht der Begriff der Wahrscheinlichkeit bereits in der klassischen Physik für die Theorie der Zusammensetzung von Körpern aus atomaren oder molekularen Bestandteilen auf. Ihnen sollten bereits einige Beispiele aus der kinetischen Gastheorie (z.B. Maxwell-Boltzmann Verteilung, barometrische Höhenformel, etc.) bekannt sein. Die gleichen Methoden finden ganz allgemein in der statistische Mechanik Anwendung. Diese Theorien haben das Ziel, das mittlere Verhalten von Systemen zu beschreiben, die aus einer Vielzahl von Teilchen bestehen. In diesen Theorien wurde die Verwendung von probabilistischen Rechnungen auf Grundlage praktischer Überlegungen vorgeschlagen. Dabei bezog man sich auf den Mangel an detailliertem Wissen bezüglich des genauen Zustands des Systems. In solchen Fällen wäre das Verhalten des Systems im Prinzip exakt vorhersagbar, falls man über ausreichend Information bezüglich des Zustands des Systems verfügte. In der Quantenmechanik hingegen hat die probabilistische Beschreibung einen fundamentalen Charakter und ist nicht – in einer naı̈ven Art und Weise – auf einen (behebbaren) Mangel an Wissen zurückzuführen. Zusammenfassend und in anderen Worten (R.P. Feynman, [2]): 35 a) Die Wahrscheinlichkeitsdichte eines Ereignisses in einem idealen Experiment ist durch den Absolutbetrag der komplexen Zahl ψ gegeben, welche wir die Wahrscheinlichkeitsamplitude nennen: P (x, t) =Wahrscheinlichkeitsdichte, ψ(x, t) =Wahrscheinlichkeitsamplitude, (3.37) (3.38) P (x, t) = |ψ(x, t)|2 . (3.39) b) Wenn ein Ereignis auf verschiedene, alternative Wege zustande kommen kann, so ist die Wahrscheinlichkeitsamplitude des Ereignisses gleich der Summe der separaten Wahrscheinlichkeitsamplituden für jeden einzelnen Weg. Insbesondere tritt Interferenz auf: ψ(x, t) =ψ1 (x, t) + ψ2 (x, t), (3.40) 2 P (x, t) = |ψ1 (x, t) + ψ2 (x, t)| . (3.41) c) Wenn ein Experiment so durchgeführt wird, dass bestimmt werden kann, welche der verschiedenen Alternativen tatsächlich gewählt wurde, so ist die Wahrscheinlichkeitsdichte des Ereignisses die Summe der Wahrscheinlichkeitsdichten für jede einzelne Alternative. Insbesondere tritt keine Interferenz auf: P (x, t) = P1 (x, t) + P2 (x, t). 3.7 (3.42) Heisenberg’sches Unschärfeprinzip und Unschärferelationen In der Diskussion des Doppelspaltexperiments in dem vorigen Abschnitt haben wir gesehen, dass es unmöglich ist, zu beobachten, durch welchen Spalt das Elektron gegangen ist (beispielsweise, indem man das Elektron mittels einer Lichtquelle oder Photon-ElektronStreuung detektiert), ohne zur gleichen Zeit auch das Interferenzmuster zu zerstören. W. Heisenberg schlug im Jahre 1927 vor, dass die damals neuen Naturgesetze nur dann konsistent sein könnten, falls eine bisher nicht erkannte, grundlegende Beschränkung unserer experimentellen Möglichkeiten bestehe. Er schlug sein Unschärfeprinzip als allgemeines Prinzip vor, das wir bezüglich unseres Experiments folgendermaßen formulieren können: “Es ist unmöglich einen Mechanismus zu entwickeln, der zwar ermittelt, durch welchen Spalt das Elektron geht, der aber nicht zur gleichen Zeit die Elektronen stört und das Interferenzmuster zerstört.” Wenn ein Vorgang die Möglichkeit bietet, zu bestimmen, durch welchen Spalt das Elektron geht, dann kann er nicht so behutsam sein, dass er nicht das Muster auf wesentliche Art und Weise stört. Niemand hat jemals eine Methode gefunden (oder auch nur erdacht), um das Unschärfeprinzip zu umgehen. Daher müssen wir davon ausgehen, dass es sich um eine fundamentale Eigenschaft der Natur handelt. Die vollständige Theorie der QM, die wir inzwischen verwenden um Atome und – streng genommen – sämtliche Materie zu beschreiben, hängt von der Richtigkeit des Unschärfeprinzips ab. Heisenbergs ursprüngliche Formulierung des Unschärfeprinzips lautet: Wenn man eine Messung an einem Objekt durchführt und die x-Komponente seines Impulses 36 mit der Unsicherheit ∆p kennt, kann man nicht zur gleichen Zeit seinen x-Ort genauer als ∆x ≥ h/∆p kennen. Zu jedem Zeitpunkt muss das Produkt der Unsicherheiten des Orts und des Impulses eines Teilchens größer oder gleich der Planck’schen Konstanten sein. Dies bedeutet, dass eine intrinsische Grenze besteht, jenseits derer eine Verbesserung der Genauigkeit der Messung des Orts eines Teilchens zu Lasten der Genauigkeit der Bestimmung seines Impulses geht. Wir werden weiter im Kapitel 5 sehen, dass die Genauigkeit um einen Faktor 4π gesteigert werden kann, und, dass die obige Relation für ein Teilchen in drei Dimensionen zu folgender Aussage verallgemeinert werden kann: ∆x∆px ≥ ~/2, ∆y∆py ≥ ~/2, ∆z∆pz ≥ ~/2. (3.43) In dieser Gleichung repräsentieren ∆x, ∆y und ∆z die Unsicherheit, mit der die Koordinaten x, y und z bestimmt sind, und ∆px , ∆py und ∆pz beschreiben die Unbestimmtheit, mit der die Komponenten des Impulses festliegen. Dieser Satz von Ungleichungen wird als Heisenberg’sche Unschärferelation bezeichnet. Im Hinblick auf Glg. (3.43) ist es klar, dass man sich ein Teilchen nicht als ein Korpuskel vorstellen kann. Es handelt sich um ein fundamentales Prinzip, das nichts mit technischen Unzulänglichkeiten eines Messapparates zu tun hat. Wir können das Unschärfeprinzip auch in folgender Weise formulieren: Wann immer die Ortsmessung genau ist (z.B. genaue Information über die derzeitige Position des Teilchens), ist die Information über den Impuls ungenau oder unsicher und umgekehrt. Wir wollen einige Gedankenexperimente besprechen, die Heisenberg analysiert hatte, um sein Unschärfeprinzip zu erhalten. 3.7.1 Beugung an einem Spalt Wir wollen annehmen, dass eine Strahl von Teilchen senkrecht auf einen Schirm AB mit einem Loch der Länge d fällt, vgl. Abb. D.19. Die Koordinate y eines Teilchens, das durch den Spalt geht, ist mit einer Unschärfe ∆y = d (3.44) bestimmt. Andererseits ist einem Teilchen mit Impuls p eine Wellenlänge λ = h/p zugeordnet. Beim Durchgang durch den Spalt, wird die Welle um einen Winkel α0 gebeugt, der durch sin α0 ∼ λ/d14 gegeben ist. Dies bedeutet, dass das Teilchen beim Durchgang durch den Spalt von seiner ursprüngliche Bewegungsrichtung innerhalb einers Winkels α zwischen +α0 und −α0 abweichen kann. Daher hat die Impulskomponente py = p sin α, die zu Beginn gleich Null war, nun einen Wert zwischen ±p sin α0 und ist nur mit der Unsicherheit h (3.45) ∆py ∼ p sin α0 = d bestimmt. Wenn wir dies mit Glg. (3.44) zusammenfügen, erhalten wir ∆y∆py ∼ h. 14 Die Beugungsbedingung lautet für das ersten Intensitätsminimum d sin θ = λ. 37 3.7.2 Lokalisation mit einem Mikroskop Wir versuchen mit einer Linse den Ort P eines Elektrons mit Impuls p zu bestimmen, vgl. Abb. D.20, indem wir es mit einem kleinen Strahl monochromatischen Lichts beleuchten, (die Ausbreitungsrichtung des Lichts ist in der Abbildung gezeigt). Ein an dem Elektron gestreutes Photon erzeugt ein Bild P 0 auf dem Schirm S 0 . Unter den optimalen Bedingungen wird man – wie aus der Optik bekannt – in P 0 ein Beugungsmuster sehen, das folgende Genauigkeit bei der Messung der Orts P erlaubt: ∆x = λ . sin (3.46) Hierbei ist λ die Wellenlänge des Lichts und ist die Hälfte des Winkels, unter dem von P aus die Linse zu sehen ist. Da die Linse eine endliche Größe hat, ist es nicht möglich, die Richtung genau zu kennen, entlang derer das Photon gestreut worden ist, welches das Bild in P 0 erzeugt. Das Photon mit Wellenlänge λ hat den Impuls p = h/λ und daher wird die Unbestimmtheit von px ungefähr h/λ sin sein. Da in dem Experiment der Impuls des Gesamtsystems (Teilchen, Photon und Mikroskop) erhalten sein muss, wird die Unbestimmtheit der Komponente px des Teilchenimpulses nach der Streuung des Photons gleich der entsprechenden Unbestimmtheit für das Photon sein. Daher erhalten wir die Unbestimmtheit ∆px ' h/λ sin . (3.47) Wir kombinieren diese mit Glg. (3.46) und erhalten schließlich ∆x∆px ∼ h. 3.7.3 (3.48) Energie-Zeit-Unschärfe Eine Gleichung analog zu Glg. (3.43) existiert auch, wenn man zugleich die Bestimmung sowohl der Energie E eines Teilchens als auch der Zeit t betrachtet, zu der ein bestimmtes Ereignis stattfindet, welches ebendieses Teilchen betrifft. Wenn ∆E die Unbestimmtheit der Energie und ∆t die Unbestimmtheit der Zeit ist, erhalten wir die Relation ∆E∆t ∼ h. (3.49) Typische Beispiele der Anwendung von Glg. (3.49) sind Zerfälle von instabilen Systemen, wie es beispielsweise radioaktive Kerne, Atome oder instabile Teilchen sind. Die solchen Systemen zugeordnete Welle kann keine einzelne monochromatische stationäre Welle sein, da das System nicht stabil ist. Es muss sich um eine Superposition verschiedener monochromatischer Komponenten handeln, die einem kleinen Frequenzintervall ∆ν entspricht. Entsprechend ist die Energie des Systems lediglich mit Unschärfe ∆E = h∆ν (3.50) bestimmt. Dann bezeichnen wir die mittlere Lebensdauer des Systems mit τ und stellen fest, dass τ die Unbestimmtheit der Zeit ist, zu welcher der Übergang von dem ursprünglichen instabilen System zu einem stabilen System stattfindet (z.B. der Zerfall eines Teilchens). Wir erhalten τ ∼ h/∆E, (3.51) 38 eine Relation, die verwendet werden kann, um die Größenordnung von τ zu bestimmen, falls ∆E bekannt ist, oder umgekehrt. Literaturempfehlung: R.P. Feynman A. Messiah S. Weinberg Lectures of Physics, Volume 3 Quantum Mechanics, Volume 1 Lectures on Quantum Mechanics 39 Sections 1 – 3 Sections 2.I – II, 4.I – III Sections 1.3, 1.5 4 Die Schrödingergleichungen 4.1 Mathematische Eigenschaften der Schrödingergleichung und des Hamiltonoperators In Übereinstimmung mit der im vorherigen Kapitel besprochenen statistischen Interpretation muss die Untersuchung der Schrödingergleichung im Hilbertraum L2 (R3 ) durchgeführt werden. Mit L2 (R3 ) bezeichnen wir den Raum von reellen oder komplexwertigen messbaren Funktionen, welche auf R3 quadrat-integrabel sind, d.h. die Funktionen χ(x), für welche Z d3 x |χ(x)|2 < ∞ (4.1) R3 15 gilt . Dieser Raum hat die Struktur eines Hilbertraums16 da er mit dem Skalarprodukt17 Z hχ1 | χ2 i ≡ d3 x χ∗1 (x)χ2 (x) (4.3) ausgestattet ist. Eine genaue Definition und weitere mathematische Details bezüglich Hilbertraum und Skalarprodukt finden Sie im Anhang B.1. 4.1.1 Schrödingergleichung Wir betrachten nun die Schrödingergleichung ~2 ∂ψ(x, t) − ∆x + V (x, t) ψ(x, t) = i~ 2m ∂t (4.4) und formulieren diese in Operatorschreibweise, ∂ψ(x, t) b Hψ(x, t) = i~ , ∂t (4.5) 15 Die Definition kann auf beliebige Körper erweitert werden, insbesondere auch auf deren Unterräume. Beispielsweise bezeichnen mit L2 (T ) den Raum von reellen oder komplexwertigen messbaren Funktionen, welche auf einer Untermenge T des R3 quadrat-integrabel sind, d.h. die Funktionen χ(x), für welche gilt: Z 2 d3 x |χ(x)| < ∞. (4.2) T 16 Das mathematische Konzept eines Hilbertraums (benannt nach David Hilbert) verallgemeinert das Konzept eines Euklidischen Raums. Dabei werden die Methoden der Vektoralgebra und der Analysis von der zweidimensionalen Euklidischen Ebene und vom dreidimensionalen Vektorraum auf Räume mit der Struktur eines inneren Produkts (Skalarprodukt) erweitert, welches die Messung von Längen und Winkeln gestattet. Desweiteren sind Hilberträume vollständig: es existieren ausreichend Grenzwerte im Hilbertraum um die Anwendung der Techniken der Analysis zu erlauben. Betrachten Sie hierzu Anhang B.1 bezüglich weiterer Information zu Hilbertraum und Skalarprodukt. 17 Das Punktprodukt oder Skalarprodukt (teilweise auch inneres Produkt im Kontext Euklidischer Räume) ist eine algebraische Operation die aus zwei Reihen von Zahlen (üblicherweise die Koordinaten von Vektoren) als Argument eine einzelne Zahl erhält. Das Skalarprodukt zweier Vektoren kann basisunabhängig konstruiert werden, indem man die Komponente eines Vektors in Richtung des anderen mit dem Betrag des anderen Vektors multipliziert. 40 wobei wir mit ψ(x, t) ein Element von L2 (R3 ) bezeichnen, das eine Funktion der Zeit ist, und wir den sogenannten Hamiltonoperator als 2 ~2 pb b + V (b x, t) = − ∆x + V (x, t) (4.6) H= 2m 2m schreiben. Da die Energie reell ist, muss dieser Operator hermitesch (selbstadjungiert) b =H b †18 Wir werden sehen, dass man das Problem, die Schrödingergleichung sein, d.h. H zu lösen, auch als das Problem, die Eigenwerte und Eigenvektoren des Hamiltonoperators b zu finden, formulieren kann. Als Konsequenz können wir wieder ohne Einschränkung H das Ergebnis von Glg. (3.25) erhalten. Wir definieren kψ(x, t)k2 ≡ hψ(x, t) | ψ(x, t)i (4.8) und erhalten dψ(x, t) dψ(x, t) ψ(x, t) + ψ(x, t) dt dt D E D E i i b b Hψ(x, t) ψ(x, t) − ψ(x, t) Hψ(x, t) = 0. = ~ ~ d kψ(x, t)k2 = dt (4.9) Darüber hinaus ist Glg. (4.4) von erster Ordnung in der Zeitableitung. Dies legt den Schluss nahe, dass es eine eindeutige Lösung ψ(x, t) gibt, welche die Anfangsbedingung ψ(x, 0) = χ0 (x) (4.10) erfüllt. Es ist offensichtlich, dass eine derartige Lösung eindeutig ist. Tatsächlich müsste, falls ψ1 (x, t) und ψ2 (x, t) zwei verschiedene Lösungen zur gleichen Anfangsbedingung ψ1 (x, 0) = ψ2 (x, 0) = χ0 (x) wären, kψ1 (x, t) − ψ2 (x, t)k = kψ1 (x, 0) − ψ2 (x, 0)k = 0 (4.11) gelten und dann wäre ψ1 (x, t) = ψ2 (x, t) für beliebige Werte von t. Dies erkennt man daran, dass gemäß Glg. (4.9) die Norm eines jeden Vektors und daher auch die Norm von ψ1 (x, t) − ψ2 (x, t) zeitunabhängig sein muss. 4.2 Operatoren und ihre Wirkung auf Elemente des Hilbertraums Wir erinnern uns hier an die Definitionen und Eigenschaften linearer Operatoren auf Vektorräumen. Die grundlegenden Begrifflichkeiten dazu finden Sie im Anhang B.1. In der QM spielen lineare Operatoren auf dem Hilbertraum L2 (R3 ) eine besondere Rolle, 18 b adjungierte Operator wird auch hermitesch adjungiert, hermitesch konjugiert oder hermiDer zu A b† bezeichnet. In einem Hilbertraum ist A b folgendermatesch transponiert genannt und mit dem Symbol A ßen definiert: für beliebige Vektoren χ1 und χ2 gilt: E D D E b† χ1 χ2 = χ1 Aχ b 2 . A (4.7) 41 daher spezialisieren wir die folgenden Betrachtungen auf den Hilbertraum L2 (R3 ). Für Vektoren χ1 (x) ∈ L2 (R3 ) definiert die Vorschrift b 1 (x) = χ2 (x) ∈ L2 (R3 ), Aχ (4.12) b auf den Vektor χ1 (x). Dies bedeutet, dass ein die Wirkung des linearen Operators A linearer Operator eine lineare Abbildung von L2 (R3 ) auf L2 (R3 ) ist. Die Eigenschaft der Homogenität ist hierbei wesentlich, b 1 χ1 (x) + α2 χ2 (x)) = α1 Aχ b 1 (x) + α2 Aχ b 2 (x), A(α (4.13) da diese Operatoren bei Anwendung auf Linearkombinationen von Vektoren einem Distributivgesetz genügen. Für den weiteren Verlauf besonders relevante Beispiele sind folgende Operatoren: ∂ ∂ , ∇2x , oder f (x, t) als Multiplikator. (4.14) xi , ∂xi ∂t Mit Hilfe dieser Operatoren kann der Hamiltonoperator bzw. die Schrödingergleichung, vgl. Glg. (4.4), geschrieben werden. Wie man an der Liste dieser Operatoren bereits sieht, kommutieren Operatoren im Allb und B b das gemeinen nicht. Wir definieren für den Kommutator zweier Operatoren A Symbol b B] b =A bB b−B b A. b [A, (4.15) Zwei essentielle Beispiele linearer Operatoren in der QM sind der Impulsoperator pb und b. Wie Glg. (3.6) nahelegt, sind die Wirkung des Impulsoperators auf der Ortsoperator x eine L2 (R3 ) Funktion ganz allgemein durch ~ b (4.16) pχ(x) = ∇x χ(x) i und die Wirkung des Ortsoperators auf eine L2 (R3 ) Funktion ganz allgemein durch bχ(x) = xχ(x) x (4.17) gegeben. Wir betrachten nun den Kommutator der räumlichen i und j Komponenten dieser beiden fundamentalen Operatoren. Die Auswertung dieses Kommutators lässt sich am leichtesten bewerkstelligen, indem man die Operatoren innerhalb des Kommutators auf einen beliebigen Vektor χ(x) betrachtet. Wir finden für diese Kommutatorrelation ~ ∂χ(x) ∂{xi χ(x)} ~ ∂ χ(x) = xi − [b xi , pbj ] χ(x) = xi , i ∂xj i ∂xj ∂xj ∂xi ~ ∂χ(x) ∂χ(x) −χ(x) = xi − xi = i~δi j χ(x), i ∂xj ∂xj ∂xj | {z } |{z} =0 (4.18) =δi j wobei man nun den beliebigen Vektor χ(x) entfernen kann. Daher kann man diesen sogenannten Heisenberg Kommutator auch verkürzt schreiben: [b xi , pbj ] = i~δi j . (4.19) Im Verlauf der Vorlesung werden Sie Stück für Stück verstehen, warum Glg. (4.19) der Inbegriff der Quantenmechanik ist und die zentralen Wesenszüge der Quantenwelt Konsequenzen dieser Gleichung sind. 42 4.3 b Eigenwerte und Eigenvektoren des Hamiltonoperators H Wie wir sehen werden, ist eine der grundlegenden Problemstellungen in der QM die Betrachtung der Eigenvektoren (bzw. Eigenfunktionen) und Eigenwerte eines hermiteschen b auf einem gegebenen Hilbertraum (H). Insbesondere ist diese Betrachtung Operators A b wesentlich, um Lösungen der Schrödingergleichung für den Fall des Hamiltonoperators H zu konstruieren, welche Glg. (4.9) erfüllen. Den gesamten Satz der Eigenwerte eines Operators bezeichnet man als dessen “Spektrum”. Die Ursache für das besondere Interesse an den Eigenvektoren eines hermiteschen Operators liegt darin, dass diese ein vollständiges System bilden in einem Sinne, den wir noch definieren werden19 . Wir wiederholen hier einige wohlbekannte Definitionen und Eigenschaften der (eigentlichen) Eigenvektoren. Für b erfüllt dessen Eigenvektor die Gleichung einen Operator A b α = αχα , Aχ (4.20) wobei α eine komplexe Zahl ist. Der Wert von α, für den Glg. (4.20) erfüllt ist, heißt der zu χα zugehörige Eigenwert. Die Eigenwerte und Eigenvektoren hermitescher Operatoren haben einige wichtige und einfache Eigenschaften. Wenn wir mit χα0 einen zweiten Eigenvektor zum zugehörigen Eigenwert α0 bezeichnen, erhalten wir b α0 = α0 χα0 Aχ (4.21) b und nach Verwendung der Hermitezität von A b α i − hAχ b α0 |χα i = (α − α0 ∗ ) hχα0 |χα i . 0 = hχα0 |Aχ (4.22) Im Fall gleicher Eigenvektoren (χα0 = χα ) und daher auch gleicher Eigenwerte (α = α0 ) führt dies zu α∗ = α. (4.23) Dies bedeutet, dass die Eigenwerte hermitescher Operatoren reell sind. Für unterschiedliche Werte von α und α0 (d.h. α 6= α0 ) erhält man hχα0 |χα i = 0, (4.24) was bedeutet, dass verschiedenen Eigenwerten zugeordnete Eigenvektoren zueinander orthogonal sind. Darüber hinaus gilt für α = α0 , dass auch jede Linearkombination a χα + b χα0 (mit beliebigen komplexen Zahlen a und b) ein Eigenvektor ist. Die Menge aller Eigenvektoren zu einem bestimmten Eigenwert α bildet einen Unterraum Hα von H, der als Eigenraum (zum Eigenwert α) bezeichnet wird. Falls Hα die Dimension eins hat, d.h. falls der Eigenvektor zu α bis auf einen konstanten Faktor eindeutig bestimmt ist, so nennt man den Eigenwert einfach. Andernfalls nennen wir diesen entartet und die Dimension von Hα den Entartungsgrad von α. Offensichtlich sind zwei zu verschiedenen Eigenwerten α und α0 gehörende Eigenräume Hα und Hα0 zueinander orthogonal. Da in einem separierbaren Hilbertraum eine Menge von Eigenräumen, die jeweils zueinander orthogonal sind, 19 Genau genommen müsste man, um Vollständigkeit zu realisieren, die eigentlichen Eigenfunktionen, deren Eigenwerte zum diskreten Spektrum gehören, mit den uneigentlichen Eigenfunktionen kombinieren, deren Eigenwerte zum kontinuierlichen (Streuungs-) Spektrum gehören. Die uneigentlichen Eigenfunktionen gehören zu einem linearen Raum, der größer ist als der ursprüngliche Hilbertraum H. 43 höchstens abzählbar ist, können die eigentlichen Eigenwerte mit ganzen Zahlen20 indiziert werden, d.h. sie können als α1 , α 2 , . . . , α n , . . . (4.25) b geschrieben werden und ihre Menge ist das diskrete Spektrum von A. Falls alle Eigenwerte einfach sind, können die Eigenvektoren mit den gleichen ganzen Zahlen wie die entsprechenden Eigenwerte indiziert werden, so dass der dem Eigenwert αn entsprechende Eigenvektor als χn (d.h. χαn ≡ χn ) bezeichnet werden kann21 . Dann sind zwei verschiedene Eigenvektoren immer zueinander orthogonal, und man kann hχm |χn i = kχn k2 δm n (4.26) schreiben, wobei δm n das Kroneckersymbol ist. Wenn wir darüber hinaus die multiplikative Konstante derart wählen, dass χn normiert ist, d.h. dass kχn k = 1 (4.27) gilt, so erhalten wir aus Glg. (4.26) die Orthonormalitätsrelation hχm |χn i = δm n . (4.28) Wenn stattdessen einige oder alle Eigenwerte entartet sind, so können wir in jedem Eigenraum Hαn (bzw. Hn ) eine vollständige Orthonormalbasis χn 1 , χn 2 , . . . wählen. Dann finden wir als Verallgemeinerung von Glg. (4.28) die Beziehung hχn0 s0 |χn s i = δn0 n δs0 s . (4.29) b kann Ein maximales System unabhängiger Eigenvektoren eines hermiteschen Operators A immer als orthonormal gewählt werden. Im Folgenden werden wir den Entartungsindex s nicht immer explizit zeigen. b und spezifizieren drüber hinWir betrachten nun als Spezialfall den Hamiltonoperator H aus, dass das Potential zeitunabhängig ist, d.h. Vb ≡ V (b x). In Bezug auf den Hamiltonb schreiben wir die Eigenwertgleichung als operator H b = Eφ Hφ (4.30) oder explizit ~2 ∆x + V (x) φ(x) = Eφ(x). − 2m (4.31) Dies ist eine gewöhnliche Differentialgleichung im Raum C 2 (R3 )22 und wird als formale Eigenwertgleichung bezeichnet. Falls V (x) überall stetig ist (z.B. ohne singuläre Punkte oder singuläre Oberflächen), erlaubt diese Gleichung unendlich viele Lösungen. Indessen 20 Es ist eine willkürliche und keine zwangsläufige Wahl, dass die Indizierung in diesem Beispiel mit 1 beginnt. Insbesondere gibt es verschiedene quantenmechanische Systeme, für die eine Bezeichnung des Zustands mit dem niedrigsten Eigenwert mit dem Index 0 (oder mit bestimmten negativen ganzen Zahlen) geradezu natürlich erscheint. 21 Im gleichen Sinne kann man den betreffenden Eigenraum ebenso als Hn bezeichnen. Letzteres gilt auch im Fall von Entartung. 22 Der Raum C 2 (R3 ) bezeichnet alle Funktionen, die auf dem R3 mindestens zweimal stetig differenzierbar sind. 44 suchen wir in der QM nach Lösungen im Raum L2 (R3 ). In diesem Fall wird die Gleichung Glg. (4.30) nur für einige spezielle Werte von E gelöst, welche reell und diskret23 sind: E1 , E2 , . . . , En , . . . . (4.32) Falls V (x) Singularitäten hat, erlaubt Glg. (4.31) keine Lösungen im Raum C 2 (R3 ). Man kann Lösungen in den Regionen definieren, welche die Singularitäten ausschließen. Diese Lösungen haben im Allgemeinen zumindest eine unstetige zweite Ableitung, falls sie zu b singulären Punkten fortgesetzt werden. In diesem Fall werden die Eigenfunktionen von H 2 3 mit den verallgemeinerten Lösungen im Raum L (R ) identifiziert und genügen folgenden Eigenschaften: 1. Außerhalb der Singularitäten von V (x) sind diese Lösungen C 2 (R3 )-Funktionen und erfüllen Glg. (4.31) im üblichen Sinne. 2. Auf den Oberflächen σi der Singularitäten sind die Normalenableitungen der Lösungen stetig. Wenn wir mit φ+ (x) und ∂φ+ (x)/∂n sowie φ− (x) und ∂φ− (x)/∂n die Grenzewerte von φ(x) und ∂φ(x)/∂n auf beiden Seiten der Oberflächen σi der Singularitäten bezeichnen, gilt φ+ (x) = φ− (x), ∂φ− (x) ∂φ+ (x) = ∂n ∂n ∀x ∈ σi (4.33) und in einzelnen singulären Punkten xj gilt lim φ(x) = endliche Größe. x→xj (4.34) Im allgemeinen Fall, wenn in V (x) mehrere Singularitäten vorliegen24 , wird der Raum durch die Oberflächen der Diskontinuitäten in verschiedene nicht überlappende Bereiche geteilt, und Glg. (4.31) wird in jeder dieser Regionen einzeln gelöst. Anschließend wird Glg. (4.33) genutzt, um die Lösung in einem Bereich eindeutig mit den Lösungen in anderen Regionen zu verbinden. Dann identifiziert die Bedingung, dass die Lösung in L2 (R3 ) liegt, lediglich einige reelle und diskrete Werte von E. 4.4 Entwicklung der Wellenfunktion nach einer Basis von orthonormalen Eigenfunktionen b mit Eigenvektoren χn , welche einen Nun betrachten wir einen hermiteschen Operator A abzählbaren und vollständigen Satz von Basisvektoren des Hilbertraums bilden (Orthonormalbasis). Dies wäre beispielsweise der Fall, wenn wir den Hamiltonoperator eines Systems mit einem diskreten Spektrum betrachteten. Dann kann man einen beliebigen Vektor χ innerhalb des Hilbertraums H durch X χ(x) = an s χn s (x), (4.35) n,s 23 Diskrete Werte von E gelten für das diskrete Spektrum und die eigentlichen Eigenwerte. Wir werden dazu einige Beispiele in der Vorlesung sehen, unter anderem das Beispiel des Potentialtopfs oder die Lösung des Wasserstoffatoms. 24 45 darstellen, wobei die Koeffizienten an s durch an s = hχn s | χi (4.36) gegeben sind. Indem wir uns eine gleichartige Zerlegung für einen beliebigen zweiten Vektor ξ hinzunehmen, X ξ(x) = bn s χn s (x), (4.37) n,s können wir das Skalarprodukt von χ mit ξ bzw. mit sich selbst mittels der Basisvektoren χn s vereinfachen zu + * X XX X X bn0 s0 χn0 s0 = a∗n s bn0 s0 hχn s | χn0 s0 i = hχ | ξi = an s χ n s a∗n s bn s , | {z } 0 0 n,s 0 0 n,s n,s n ,s kχk2 = * X n,s n ,s =δn n0 δs s0 (4.38) + X XX X an0 s0 χn0 s0 = a∗n s an0 s0 hχn s | χn0 s0 i = an s χ n s |an s |2 . 0 0 | {z } 0 0 n,s n ,s n ,s =δn n0 δs s0 n,s (4.39) b auf den Vektor χ: Darüber hinaus finden wir für die Wirkung des Operators A X X X b b b χn s (x) = Aχ(x) =A an s χn s (x) = an s A an s αn χn s (x). n,s n,s (4.40) n,s Diese einfachen Ergebnisse müssen modifiziert werden, wenn wir ein System betrachten, dessen vollständiger Satz orthogonaler Zustände25 ein Kontinuum bildet (bzw. beinhaltet). Wie wir später in diesem Abschnitt sehen werden, ist dies der Fall, wenn wir ein System mit einem freien Teilchen und dem zugehörigen Hamiltonoperator betrachten. Im Fall eines Kontinuums benötigen wir eine allgemeinere Art von Eigenfunktionen – sogenannte uneigentliche Eigenfunktionen oder uneigentliche Eigenvektoren. Diese haben eine unendliche Norm und gehören daher nicht direkt zum Hilbertraum H, aber man kann in diesem Fall die Konzepte von Orthogonalität und Normierung erweitern. Den Hamiltonoperator auf dem erweiterten Funktionenraum bezeichnen wir ebenfalls mit dem Symbol b Wir betrachten eine Menge von uneigentlichen Eigenfunktionen φE (x), die, für eine H. b welche durch E ∈ R+ Teilmenge σc des kontinuierlichen Spektrums von H, 0 (E ist die Energie) festgelegt wird, eine kontinuierliche Funktionsschar des Parameters E bilden. Diese sind verallgemeinerte Lösungen von Glg. (4.31), so dass E+∆E Z dE 0 φE 0 (x) (4.41) E eine L2 (R3 ) Funktion und von Null verschieden ist. φE s (x) und φE 0 s0 (x) seien zwei uneigentliche Eigenfunktionen zu den uneigentlichen Eigenwerten E und E 0 des kontinuierlichen Spektrums (und den Entartungsindizes s und s0 ). Wir definieren dann hφE s | φE 0 s0 i = δ(E − E 0 ) δs s0 25 (4.42) Die genaue Beziehung zwischen den Begriffen der Zustände und denen der Wellefunktionen bzw. der Vektoren wird an späterer Stelle noch detailliert erklärt. 46 und verallgemeinern damit die Orthonormalitätsrelation, vgl. Glg. (4.28). Hierbei ist δ(x) die Dirac’sche Deltafunktion (siehe Anhang A OR SOMEWHERE ELSE). An dieser Stelle können wir die vorherige Zerlegung eines Vektors χ im Hilbertraum L2 (R3 ), vgl. Glg. (4.35), verallgemeinern und auf ein vollständiges Orthonormalsystem bestehend aus eigentlichen Eigenfunktionen φn s und uneigentlichen Eigenfunktionen φE 1 , φE 2 , . . . ausdehnen: X XZ χ(x) = an s φn s (x) + dE as (E) φE s (x). (4.43) n,s s σ cs Dabei haben wir sowohl Glgn. (4.29) und (4.42) vorausgesetzt, als auch Orthogonalität zwischen eigentlichen und uneigentlichen Eigenfunktionen26 angenommen, welche dann in Form von Z an s = hφn s | χi = d3 x φ∗ns χ(x) (x), (4.47) Z (4.48) as (E) = hφE s | χi = d3 x φ∗Es χ(x) (x). die Berechnung der Koeffizienten an s bzw. Koeffizienten(-funktionen) as (E) gestattet. Ferner betrachten wir einen zweiten Vektor ξ im Hilbertraum L2 (R3 ), der ebenso in eine Form X XZ dE bs (E) φE s (x) (4.49) ξ(x) = bn s φn s (x) + n,s s σ cs zerlegt werden kann. Unter Verwendung von Glgn. (4.29), (4.45) und (4.46) erhalten wir XZ X ∗ dE a∗s (E) bs (E) (4.50) an s b n s + hχ | ξi = s σ cs n,s und 2 kχk = hχ | χi = X 2 |an s | + n,s XZ dE |as (E)|2 . Daher ist die Bedingung für die Konvergenz dieser Art von Ausdrücken X XZ 2 |an s | + dE |as (E)|2 < ∞, n,s (4.51) s σ cs (4.52) s σ cs 26 Dieses Konzept muss entsprechend definiert sein, d.h. für zwei Mengen {φE a (x)} und {φE b (x)} von uneigentlichen Eigenfunktionen können wir zwei L2 (R3 ) Funktionen ηa (x) und ηb (x) definieren, Z Z ηa (x) = dE b(E) φE b (x), (4.44) dE a(E) φE a (x), ηb (x) = σc a σc b so dass hφn s | ηa i = hφn s | ηb i = 0 sowie Z dE a∗ (E) b(E) hηa | ηb i = σc a ∩σc b gilt. 47 (4.45) (4.46) und man den Begriff der Normierung verallgemeinern: X XZ 2 2 kχk = |an s | + dE |as (E)|2 = 1. n,s (4.53) s σ cs b auf einen solchen Vektor χ erhalten wir Durch Anwenden des Hamiltonoperators H X XZ b Hχ(x) = an s En φn s (x) + dE as (E)EφE s (x), (4.54) n,s s σ cs indem wir für χ die Zerlegung in das vollständige Orthonormalsystem der Energieeigenfunktionen (Energiebasis), vgl. Glg. (4.43), sowie die Beziehungen E D E D D E b b b φn s Hχ = Hφn s χ = En hφn s | χi , φE s Hχ = E hφE s | χi . (4.55) b verwenden. Insbesondere ergibt sich dann bei Bildung des Skalarprodukts von χ und Hχ b unter Verwendung der Energiebasis für die Zerlegung von sowohl χ als auch Hχ Z E X D X b = |an s |2 En + dE |as (E)|2 E, (4.56) χ Hχ n,s s σ cs indem man die entsprechenden Orthonormalitätsrelationen der eigentlichen Eigenvektoren φn s und uneigentlichen Eigenvektoren φE s , vgl. Glgn. (4.29), (4.45) und (4.46) benutzt. Im Verlauf der Vorlesung werden wir viele und unterschiedliche Beispiele und Realisierungen dieser Formeln sehen. Wir wollen mit einem einfachen Beispiel zum kontinuierlichen Spektrum und den uneigentlichen Eigenfunktionen beginnen und betrachten dabei im Raum L2 (R) den Ortsoperator x b, der durch die Beziehung x bχ(x) = xχ(x) (4.57) definiert wird. Die Eigenwertgleichung lautet x bχξ (x) = ξχξ (x) (4.58) oder nach Kombination von Glgn. (4.57) und (4.58) (x − ξ)χξ (x) = 0. (4.59) χξ (x) = δ(x − ξ), (4.60) Eine zugehörige Lösung ist wie man leicht sieht, da Glg. (4.59) offenkundig ein spezielles Beispiel der allgemeinen Eigenschaft der Delta-Distribution, f (x)δ(x − ξ) = f (ξ)δ(x − ξ), (4.61) darstellt. In diesem Fall kann χξ (x) als uneigentliche Eigenfunktion von x b interpretiert werden und wir sehen, dass x b ein rein kontinuierliches Spektrum entlang der gesamten reellen Achse hat. Dann erhalten wir für jede Funktion χ(x) in L2 (R) die Identität Z+∞ χ(x) = dξ χ(ξ)δ(x − ξ), −∞ 48 (4.62) was man als eine Entwicklung von χ nach dem vollständigen Orthonormalsystem χξ betrachten kann. Im Einklang mit dieser Interpretation können wir Z+∞ hχξ0 | χξ i = dx δ(x − ξ 0 )δ(x − ξ) = δ(ξ 0 − ξ) (4.63) −∞ schreiben, so dass die χξ ein vollständiges Orthonormalsystem bilden. Darüber hinaus kann man χ als Z+∞ χ(x) = dξ c(ξ)χξ (x) (4.64) −∞ schreiben, so dass man die Entwicklungskoeffizienten c(ξ) als Z+∞ c(ξ) = hχξ | χi = dx δ(x − ξ)χ(x) = χ(ξ), (4.65) −∞ identifiziert. Schließlich ist – gemäß der vorangegangen Diskussion – die Wahrscheinlichkeit das Teilchen zur Zeit t im Intervall (ξ, ξ + ∆ξ) zu messen durch P (ξ < x < ξ + ∆ξ, t) = |ψ(ξ, t)|2 ∆ξ = |χ(ξ)|2 ∆ξ (4.66) gegeben. 4.5 Allgemeine Lösung der Schrödingergleichung Wir konstruieren nun für den Fall eines zeitunabhängigen Potentials die allgemeine Lösung der zeitabhängigen Schrödingergleichung, vgl. Glg. (4.4), welche die Anfangsbedingung ψ(x, 0) = χ0 (x) erfüllt. Wir schreiben die zeitabhängige Schrödingergleichung als ~2 ∂ψ(x, t) ∆x + V (x) ψ(x, t) = i~ (4.67) − 2m ∂t und suchen nach einer partikulären Lösung der Form (multiplikativer Separationsansatz) ψ(x, t) = φ(x)ξ(t), (4.68) die das Produkt zweier Faktoren ist, deren erster nur vom Ort x und deren zweiter nur von der Zeit t abhängig ist. Indem man den Separationsansatz einsetzt, erhält man 1 ~2 1 ∂ξ(t) − ∆x + V (x) φ(x) = i~ (4.69) φ(x) 2m ξ(t) ∂t und erkennt direkt, dass beide Seiten der Gleichung unabhängig sind (d.h. entweder nur von x oder nur von t abhängen). Deren Gleichheit kann nur gelten, falls beide konstant sind und denselben Wert annehmen, den wir mit E bezeichnen wollen. Dann spaltet sich die Gleichung in zwei verschiedene Gleichungen auf: i~ 49 ∂ξ(t) =Eξ(t), ∂t (4.70) ~2 − ∆x + V (x) φ(x) =Eφ(x), 2m (4.71) wobei E a priori beliebig ist. Glg. (4.70) kann direkt integriert werden und wir erhalten i ξ(t) = A exp [− Et]. ~ (4.72) Was Glg. (4.71) betrifft, handelt es sich um eine Eigenwertgleichung vom Typ, der im vorigen Abschnitt besprochen wurde. Wenn wir mit En die eigentlichen Eigenwerte von b bezeichnen und mit φn s (x) die zugehörigen eigentlichen Eigenfunktionen, von denen wir H annehmen, dass sie gemäß Glg. (4.29) normiert sind, dann ist eine Klasse von Lösungen durch i (4.73) ψn s (x, t) = φn s (x) exp [− En t] ~ gegeben. Jede dieser Lösungen entspricht einem scharf definierten Wert der Frequenz νn = |En | /h. Diese Lösungen sind analog zu den stationären Wellen in einem Medium innerhalb eines Hohlraums und werden daher auch stationäre Lösungen oder stationäre Zustände genannt. Diese haben die bemerkenswerte Eigenschaft, dass sie eine zeitunabhängige Wahrscheinlichkeitsverteilung des Ortes ergeben. Tatsächlich findet man |ψn s (x, t)|2 = |φn s (x)|2 . (4.74) In diesem Rahmen bezeichnet man Glg. (4.71) als Schrödingergleichung für stationäre Zustände. Unter formalen Gesichtspunkten gibt es eine zweite Klasse von Lösungen, welche durch i (4.75) ψE s (x, t) = φE s (x) exp [− Et] ~ b gehört und φE s (x) eine gegeben sind, wobei E nun zum kontinuierlichen Spektrum von H uneigentliche Eigenfunktion ist. Natürlich gehört φE s (x) nicht zu L2 (R3 ) und kann daher für sich allein keinerlei physikalische Bedeutung haben. Nichtsdestotrotz suggeriert die Linearität von Glg. (4.67), dass man allgemeinere Lösungen vom Typ XZ X cn s ψn s (x, t) + dEcs (E)ψE s (x, t) ψ(x, t) = s σ cs n,s = X n,s X i cn s φn s (x) exp [− En t] + ~ s Z σc s i dEcs (E)φE s (x) exp [− Et] ~ (4.76) in Betracht zieht. Falls Glg. (4.76) eine Lösung von Glg. (4.67) ist, muss diese Lösung zu L2 (R3 ) gehören und X XZ 2 2 dE |cs (E)|2 E 2 < ∞ (4.77) |cn s | En + n,s s σ cs b erfüllen. Wenn Glg. (4.77) gilt, können wir für Hψ(x, t) mittels Glg. (4.54) X XZ i i b Hψ(x, t) = cn s En φn s (x) exp [− En t] + dEcs (E)EφE s (x) exp [− Et] (4.78) ~ ~ n,s s σc s 50 2 b schreiben27 und Hψ(x, t) ist gleich der linken Seite von Glg. (4.77). Dann können wir ebenso Glg. (4.76) nach der Zeit ableiten28 , um XZ ∂ψ(x, t) X i i i~ = cn s En φn s (x) exp [− En t] + dEcs (E)EφE s (x) exp [− Et] ∂t ~ ~ n,s s σc s (4.79) zu erhalten. Wenn wir nun Glgn. (4.78) und (4.79) vergleichen, zeigen wir, dass unter der Bedingung Glg. (4.77) ψ(x, t) eine Lösung von Glg. (4.67) ist. Ein wesentlicher Fakt ist, dass es immer möglich ist, die Koeffizienten(-funktionen) cn s und cs (E) in Glg. (4.76) derart zu wählen, dass eine Anfangsbedingung ψ(x, 0) = χ0 (x) (4.80) für beliebiges χ0 erfüllt ist. Indem wir Glg. (4.76) in Glg. (4.80) einsetzen, erhalten wir X XZ cn s φn s (x) + dEcs (E)φE s (x) = χ0 (x), (4.81) n,s s σ cs welches immer eine Lösung hat, da der gemeinsame Satz von eigentlichen und uneigentb eine Orthonormalbasis (vollständiges Orthonormalsystem) lichen Eigenfunktionen von H ist. Aufgrund von Glgn. (4.47) und (4.48) finden wir cn s = hφn s | χ0 i , cs (E) = hφE s | χ0 i . (4.82) (4.83) Die Koeffizienten cn s und cs (E) spielen eine Rolle, die analog zu jener der unbestimmten Konstanten im allgemeinen Integral einer Differentialgleichung ist, und aus diesem Grund heißt Glg. (4.76) allgemeine Lösung der Schrödingergleichung. 4.6 Physikalische Interpretation der Schrödingergleichung Wir wollen nun die im vorangegangenen Abschnitt konstruierte allgemeine Lösung der Schrödingergleichung, XZ X i i dEcs (E)φE s (x) exp [− Et] ψ(x, t) = cn s φn s (x) exp [− En t] + (4.84) ~ ~ s n,s σc s betrachten und annehmen, φn s (x) und φE s (x) seien orthonormiert gemäß hφn0 s0 | φn s i = δs0 s δn0 n , hφn0 s0 | φE s i = 0, hφE 0 s0 | φE s i = δs0 s δ(E 0 − E). 27 (4.85) b in die Summe bzw. in das Integral hineinziehen. [. . . ], beispielsweise, indem wir H Dieser Schritt ist legitim sofern die rechte Seite von Glg. (4.78) in t gleichförmig konvergiert, und dies is klar, da die Konvergenzbedingung für diesen Ausdruck erneut aus Glg. (4.77) folgt, welche nicht von der Zeit abhängt. 28 51 Wir bemerken, dass ψ(x, t) in Glg. (4.84) eine Superposition von verschiededenen diskreten monochromatischen Komponenten mit Frequenzen νn = |En | /(2π~) = |En | /h und von verschiedenen kontinuierlichen monochromatischen Komponenten mit Frequenzen ν = |E| /(2π~) = |E| /h ist. Das Auftreten von einem diskreten Frequenzspektrum zusammen mit einem kontinuierlichen Frequenzspektrum ist die wesentliche Neuerung gegenüber den Phänomenen bei der Ausbreitung von Wellen in einem dispersiven Medium von unendlicher Ausdehnung. Um den Ursprung dieser Neuerung und die Bedeutung der Terme in Glg. (4.84) zu verstehen, nehmen wir an, dass das Potential V (x) für |x| → ∞ zu Null abfällt und ein einfaches Verhalten zeigt wie in Abb. D.21. Unter dieser Annahme ist die Phasengeschwindigkeit für E < 0, vgl. Glg. (3.2), durch vph (x, ν) = p |E| 2m(E − V (x)) (4.86) gegeben. Daher sieht man, dass die Phasengeschwindigkeit vph (x, ν) innerhalb des Raumbereichs Λ(E) = {x |V (x) ≤ E} rein reell und außerhalb dieser Region rein imaginär ist. In der Theorie der Wellenausbreitung entspricht eine komplexe Phasengeschwindigkeit einem absorbierenden Medium. Somit liegt in diesem Fall eine in einem begrenzten Raumbereich “eingesperrte” Welle vor und daher treten die diskreten stationären Frequenzen auf. Um genau zu sein, divergieren die Lösungen von Glg. (4.71) mit E < 0 für |x| → ∞ sehr stark (typischerweise exponentiell). Lediglich für einen Satz von speziellen Werten E1 , E2 , . . . für E zwischen −V0 und 0 gibt es Lösungen φ1 (x), φ2 (x), . . . die sehr schnell außerhalb von Λ(E) zu Null abfallen. Diese Lösungen entsprechen den eigentlib und sind mit dem diskreten Anteil des Spektrums verknüpft. chen Eigenfunktionen von H Für E > 0 ist die Phasengeschwindigkeit vph (x, ν) immer reell und daher gibt es keine “Einschränkung” der Lösung auf einen bestimmten Raumbereich. Diese Lösungen von Glg. (4.71) sind endlich im gesamten Raum für beliebige Werte von E. Sie entsprechen den uneigentlichen Eigenfunktionen und sind mit dem kontinuierlichen Anteil der Entwicklung von Glg. (4.84) verbunden. Insbesondere beinhaltet das kontinuierliche Spektrum die gesamte positive relle Achse σc = (0, +∞). Wir wollen nun den Fall betrachten, dass ψ(x, t) aus lediglich einer einzigen diskreten Komponente besteht, z.B. wenn ψ(x, t) von der Form i ψ(x, t) = ψn s (x, t) = φn s (x) exp [− En t] ~ (4.87) ist. Entsprechend der statistischen Interpretation ist |ψn s (x, t)|2 d3 x = |φn s (x)|2 d3 x (4.88) die Wahrscheinlichkeit, das Teilchen im Volumenelement d3 x zu finden. Dann implizieren die gerade besprochenen Eigenschaften von φn s (x) den Fakt, dass die Wahrscheinlichkeit, das Teilchen außerhalb des Raumbereichs Λ(En ) zu finden, verschwindend gering ist. Die Wellenfunktion von Glg. (4.87) beschreibt eine Situation in welcher das Teilchen auf eine Region, in der das Potential V (x) deutlich von Null verschieden ist, beschränkt ist: sie beschreibt einen Bindungszustand des Teilchens. Dann wird mit Bezugnahme auf die allgemeinen Ideen von de Broglie die Energie −En = hνn als die Bindungsenergie des Teilchens interpretiert. In Übereinstimmung mit der klassischen Mechanik ist Λ(En ) der 52 Raumbereich, in welchem das Teilchen eingesperrt ist, und die Werte E1 , E2 , . . . sind die Energieniveaus des betrachteten Potentials. Wir wollen nun eine Wellenfunktion der Form ∞ XZ i 0 ψ (x, t) = dEcs (E)φE s (x) exp [− Et] ~ s (4.89) 0 betrachten, die durch die Superposition mehrerer kontinuierlicher Komponenten gebildet wird, und wir wollen annehmen, dass die Koeffizienten cs (E) nur in einer gewissen Umgebung eines Wertes E 0 wesentlich von Null verschieden sind. Dann stellt Glg. (4.89) ein Wellenpaket mit mittlerer Frequenz ν 0 = E 0 /h dar. Wenn das Potential p V (x) ausreichend langsam als Funktion von x im Vergleich zur Wellenlänge λ = h/ 2m(hν − V (x)) = p h/ 2m(E − V (x)) variiert, verhält sich das Wellenpaket wie ein klassisches Teilchen der Energie E 0 . Wir können dann generell sagen, dass das Wellenpaket ein Teilchen der Energie E 0 beschreibt. Wenn man den Ausdruck |ψ 0 (x, t)|2 für das in Glg. (4.89) definierte Wellenpaket auswertet, ist dieser ebenfalls für eine bestimmte Wahl der Zeit t nur in einem bestimmten Raumbereich deutlich von Null verschieden, da ψ 0 (x, t) ebenso eine L2 (R3 ) Funktion ist. Im Unterschied zum Ergebnis für |ψn s (x, t)|2 jedoch ändert sich der Raumbereich mit von Null verschiedenem |ψ 0 (x, t)|2 mit der Zeit t und bewegt sich mit der Zeit weg von der Region in der V (x) von Null verschieden ist. Daher werden Lösungen des Typs von Glg. (4.89) typischerweise zur Beschreibung von Streuprozessen verwendet (Streulösungen). Wir merken an, dass im Fall eines Coulomb-Potentials die Lösungen des Typs von Glg. (4.87) elliptischen Bahnen der Klassischen Mechanik und die Lösungen des Typs von Glg. (4.89) hyperbolischen Bahnen der Klassischen Mechanik entsprechen. Wir bemerken darüber hinaus, dass die Tatsache, dass für Bindungszustände die Energie nur einige diskrete Werte annehmen kann, während sie sich für Streulösungen des Typs von Glg. (4.89) kontinuierlich verändern kann, eine einfache physikalische Bedeutung hat. Im zweiten Fall nämlich kann die Energie durch den Experimentator gewählt werden. Wir wollen nun noch die Bedeutung von Glg. (4.89) für jenen Fall besprechen, dass die Koeffizienten cs (E) in einem beliebig großen Intervall von Null verschieden sind. Als ein konkretes Beispiel betrachten wir den Fall eines geladenen Teilchens in einer Wilson’schen Blasenkammer. Die Energie des Teilchens kann mittels der Krümmung seiner Spur innerhalb eines konstanten, homogenen Magnetfelds B gemessen werden. Nehmen wir an, B sei orthogonal zur anfänglichen Richtung des Teilchens. Dann gilt gemäß der Klassischen Mechanik, dass das Teilchen eine Kreisbahn beschreibt, deren Radius r sich aus der Beziehung v mv 2 =e B (4.90) r c ergibt. Dann erhält man die Energie des Teilchens29 aus dem Krümmungsradius als e2 E= B 2 r2 . 2 2mc (4.91) Im Fall, dass ein Feld (wie hier das B Feld) mit makroskopischen Mitteln erzeugt wird, werden die Bedingungen für die Anwendbarkeit der Klassischen Mechanik selbst für sehr 29 Glg. (4.91) gilt offensichtlich nur für den nicht-relativistischen Grenzfall. 53 kleine Energien (große Wellenlängen) bestätigt. Dann beschreibt ein Wellenpaket vom Typ, den wir beschrieben haben, ein Teilchen der Energie E 0 auf einer Trajektorie, welche identisch zu jener eines klassischen Teilchens mit Energie E 0 ist, und der Radius der Trajektorie wird nach wie vor durch Glg. (4.91) (hierbei ist selbstverständlich E = E 0 ) beschrieben. Daher kann die Krümmung der Spur in der Wilson’schen Kammer vorhergesagt werden, falls die dem Teilchen zugeordnete Wellenfunktion ein Wellenpaket ist. Wir wollen nun diskutieren, welche Ergebnisse für die allgemeinere Lösung möglich sind. Wir unterteilen das Intervall (0, +∞) in hinreichend kleine Teilintervalle (E j , E j+1 ). Dann können wir die Wellenfunktion als eine Superposition von Teilwellenfunktion X ψ 0 (x, t) = ψ j (x, t) (4.92) j schreiben, wobei die Teilwellenfunktionen auf jeweils ein Teilintervall beschränkt sind, E j+1 X Z i dEcs (E)φE s (x) exp [− Et]. ψ j (x, t) = ~ s (4.93) Ej Wir betrachten alle Trajektorien, die für eine gegebene anfängliche Bewegungsrichtung des Teilchens den Energien . . . , E j , E j+1 , . . . entsprechen, vgl. Abb. D.22. Die durch das Magnetfeld B erfolgende Projektion dieser Trajektorien auf Kreisbahnen teilt die Kammer in viele Bereiche ω j auf, welche den Teilintervallen E j < E < E j+1 entsprechen. Dann ordnen wir einem Teilchen die Energie zwischen E j und E j+1 zu, wenn die von ihm hinterlassene Spur sich im Bereich ωj befindet. Die Wahrscheinlichkeit, das Teilchen mit der Energie in einem solchen Intervall ω j zu beobachten, ist Z j j+1 P (E < E < E ) = d3 x |ψ(x, t)|2 . (4.94) ωj Andererseits bewegt sich jede der Wellengruppen ψ j (x, t) auf einer anderen Trajektorie, und wird daher im Bereich ω j bleiben und nach kurzer Zeit nicht mehr mit den anderen Gruppen überlagert sein. Dann können wir P (E j < E < E j+1 ) = Z 2 X d3 x ψ j (x, t) = s E Zj+1 dE |cs (E)|2 (4.95) Ej schreiben. Falls wir eine Wellenfunktion der allgemeinen Form betrachten, vgl. Glg. (4.84), bemerken wir dass +∞ X n,s 2 |cn s | + XZ s 2 Z dE |cs (E)| = d3 x |ψ(x, t)|2 = 1. (4.96) 0 Dann können wir auf Grundlage der Diskussion, die uns zu Glg. (4.95) geführt hat, schlussfolgern, dass wir den Ausdruck X P (E < E < E + ∆E) = |cs (E|2 ∆E (4.97) s 54 als die Wahrscheinlichkeit der Messung einer Energie des Teilchens im Intervall (E, E + ∆E) des kontinuierlichen Spektrums und den Ausdruck X P (E = En ) = |cn s |2 (4.98) s als die Wahrscheinlichkeit für eine Messung der Energie des Teilchens beim Wert En aus dem diskreten Spektrum interpretieren können. Wir bemerken, dass die Ausdrücke in Glgn. (4.97) und (4.98) unabhängig von der Zeit sind, was mit der Tatsache in der Klassischen Mechanik übereinstimmt, dass es sich bei der Energie um eine Konstante der Bewegung handelt. Wir sehen, dass die Glg. (4.98) eine Bedeutung hat, die nicht so offensichtlich ist wie jene von Glg. (4.97). Wie wir sehen werden wird Glg. (4.98) bei Betrachtungen von Absorption und Emission von Strahlung in einem Atom genutzt sowie in allen Prozessen, in denen Anregung und Abregung von Atomen, Molekülen und Kernen eine Rolle spielen. Die Interpretation der stationären Zustände und Wellenpakete als Zustände mit gegebener Energie muss als die Definition dessen, was die Existenz eines Teilchens mit einer gegebenen Energie in der QM bedeutet, verstanden werden. Die klassische Definition der Energie als Summe von kinetischer und potentieller Energie verliert ihre Bedeutung aufgrund der Heisenberg’schen Unschärferelation, da man den Teilchen keinen definitiven Ort oder Impuls zuweisen kann. Wir erinnern uns, dass in der Klassischen Mechanik zwei Eigenschaften das Konzept der Energie besonders nützlich machen, nämlich die Energieerhaltung und jene Tatsache, dass für ein System von Teilchen, die ausreichend weit voneinander entfernt sind, die Gesamtenergie gleich der Summe der Einzelenergien der Teilchen ist. Beide Eigenschaften bleiben in der QM bestehen. Daher kann in einem Streuprozess die Energie in der QM so wie in der Klassischen Mechanik behandelt werden: die Summe der Energien der Teilchen des Systems vor der Streuung muss gleich der Summe der Energien der Teilchen des Systems nach der Streuung sein, und dies ist unabhängig davon, welche Phänomene während der Streuung stattfinden (An- oder Abregung von Atomen, Kernreaktionen, Erzeugung und Vernichtung von Teilchen). Insbesondere bedeutet dies, dass, falls ein Elektron innerhalb eines Atoms sich in einem Bindungszustand mit Energie En befindet, und dieses später einen Übergang zu einem Zustand Em unter Emission eines Lichtquants vollzieht, die Energie des anfänglichen und finalen Zustands gleich sein müssen und man En = Em + hν (4.99) erhält, und daher die Frequenz des emittierten Lichts durch ν= En − Em h (4.100) b mit den von gegeben sein muss. Daher sehen wir, dass die eigentlichen Eigenwerte von H Bohr eingeführten Energieniveaus identifiziert werden müssen. Literaturempfehlung: F. Schwabl A. Messiah S. Weinberg Quantenmechanik, Bd. 1 Quantum Mechanics, Volume 1 Lectures on Quantum Mechanics 55 Kapitel 2.8 – 2.10 Section 5 Section 3.1 – 3.3 5 Allgemeine Prinzipien der Quantenmechanik und Formalismen In den vorherigen Kapiteln wurde die Wellenmechanik eines einzelnen Teilchens eingeführt. Beginnend mit der Schrödingergleichung, ∂ψ(x, t) ~2 ∆x + V (x) ψ(x, t) = i~ , (5.1) − 2m ∂t haben wir eine statistische Interpretation von ψ(x, t) gefunden. Daher haben wir Lösungen von Glg. (5.1) im Hilbertraum L2 (R3 ) betrachtet, welche die Normierungsbedingung Z d3 x |ψ(x, t)|2 = 1 (5.2) erfüllen, so dass die Wahrscheinlichkeit zur Zeit t innerhalb des Volumenelements d3 x das Teilchen zu finden durch |ψ(x, t)|2 d3 x gegeben ist. Wir haben Glg. (5.1) in Operatorschreibweise geschrieben, ∂ψ(x, t) b (5.3) Hψ(x, t) = i~ ∂t und wir haben beobachtet, dass eine Lösung, welche die Anfangsbedingung ψ(x, 0) = ψ0 (x) erfüllt, immer in Form von X XZ i i dEcs (E)φE s (x) exp [− Et] ψ(x, t) = cn s φn s (x) exp [− En t] + ~ ~ n,s s (5.4) (5.5) σc s geschrieben werden kann, wobei die Koeffizienten cn s und cs (E) durch cn s = hφn s | ψ0 i und cs (E) = hφE s | ψ0 i (5.6) gegeben sind und φn s (x) und φE s (x) die eigentlichen und uneigentlichen Eigenfunktionen des Hamiltonoperators sind. Wir haben die Mengen der diskreten Eigenwerte b und das kontinuierliche Spektrum σc (H) b mit den möglichen Werten der {En } = σd (H) Energie des Teilchens identifiziert und die Ausdrücke |cns |2 und |cs (E)|2 ∆E für die Wahrscheinlichkeiten des Wertes En bzw. eines Wertes im Intervall (E, E+∆E) bei der Messung der Energie erhalten. Bevor wir zu Anwendungen des Formalismus der QM weitergehen, wollen wir in diesem Kapitel eine allgemeinere Formulierung der QM präsentieren, die sich auf beliebige Systeme anwenden lässt und die auf einer Reihe von Postulaten basiert. 5.1 Allgemeine Postulate der Quantenmechanik Zunächst stellen wir fest, dass eine offensichtliche Verallgemeinerung der Schrödingergleichung für den Fall von N Teilchen durch ! N 2 X ~ ∂ψ(x1 , . . . , xN , t) ∆xj + V (x1 , . . . , xN ) ψ(x1 , . . . , xN , t) = i~ (5.7) − 2mj ∂t j=1 56 gegeben ist, wobei der Laplace-Operator als ∆xj = ∂2 ∂2 ∂2 + + ∂x2j ∂yj2 ∂zj2 (5.8) definiert ist und V (x1 , . . . , xN ) das Potential ist, welches die Kräfte beschreibt, die auf die N Teilchen wirken. Wir könnne für Glg. (5.7) die Überlegungen zu Glg. (5.1) erweitern. Insbesondere können wir fordern, dass die Wellenfunktionen ψ(x1 , . . . , xn , t) für beliebige Werte von t zu L2 (R3N ) gehören und die Normierungsbedingung Z d3 x1 . . . d3 xN |ψ(x1 , . . . , xN , t)|2 = 1 (5.9) erfüllen. Wir können daher dem Ausdruck |ψ(x1 , . . . , xN , t)|2 d3 x1 . . . d3 xN (5.10) die Bedeutung der Wahrscheinlichkeit geben, zur Zeit t das Teilchen 1 im Volumenelement d3 x1 , das Teilchen 2 im Volumenelement d3 x2 , . . . sowie das Teilchen N im Volumenelement d3 xN zu finden. Im Allgemeneinen sind daher folgende Postulate gültig: • Postulat 1: Jedem physikalischen System C ist ein entsprechender Hilbertraum HC zugeordnet. Jeder mögliche Zustand des Systems C kann durch ein Element ψ von HC dargestellt werden, welches eine Norm kψk = 1 hat. Solch ein Element wird als Zustandsvektor bezeichnet und enthält sämtliche Informationen über das System. Die Zeitentwicklung des Zustandsvektors wird durch die Gleichung i~ dψ(t) b = Hψ(t) dt (5.11) b ein hermitescher Operator ist. beschrieben, wobei der Hamiltonoperator H Glg. (5.11) wird auch hier als Schrödingergleichung bezeichnet und spielt in der allgemeinen Quantenmechanik die im Spezialfall der Wellenmechanik von Glg. (3.13) eingenomme Rolle. Das Wesen der von ψ(t) beinhalteten Information sowie die Art und Weise, wie diese darin enthalten ist, wird im zweiten Postulat definiert. Gemäß der statistischen Interpretation der Quantenmechanik können wir im Bezug auf die Entwicklung des mikrophysikalischen Systems nur über solche Größen sprechen, für die ein wohldefinierter Messprozess existiert. Unser zweites Postulat muss die Wahrscheinlichkeit berücksichtigen, dass man in einem solchen Messprozess zu irgendeinem Zeitpunkt einen bestimmten Wert aus der Klasse der möglichen Ergebnisse erhält. Aus diesem Grund werden diese Größen als Observablen30 bezeichnet. 30 Die Observablen sind die zu den klassischen dynamischen Variablen analogen Größen. Größen, die feststehenden Eigenschaften des Systems entsprechen, wie etwa die Masse oder Ladung eines Teilchens, b fallen nicht in diese Kategorie. Sie treten stattdessen in der spezifischen Form des Hamiltonoperators H auf. 57 • Postulat 2a: b auf dem Hilbertraum a) Jeder Observablen A ist ein hermitescher Operator A des jeweiligen physikalischen Systems HC zugeordnet. b und das kontinuierliche Spektrum σc (A) b bilden b) Das diskrete Spektrum σd (A) zusammen die Menge der möglichen Messwerte der Observablen A. c) Unter Verwendung der Eigenwertgleichungen b r u =αr χr u , Aχ b α u =αχα u Aχ (5.12) (5.13) (wobei wir mit χr u und χα u die eigentlichen und uneigentlichen orthonormierten Eigenvektoren bezeichnen) und der Entwicklung des Zustandsvekb in der Form tors ψ(x, t) nach den betreffenden Eigenfunktionen von A X X Z ψ(t) = cru (t)χr u + dα cu (α, t)χα u (5.14) r,u u b σc (A) ergibt sich die Wahrscheinlichkeit, bei Messung der Observablen A zur Zeit b oder einen Wert im Intervall (α, α + dα) ∈ σc (A) b zu t den Wert αr ∈ σd (A) messen, als X X |hχr u | ψ(t)i|2 , (5.15) |cru (t)|2 = P (A = αr , t) = u u P (α ≤ A ≤ α + dα, t) = X 2 |cu (α, t)| dα = X |hχα u | ψ(t)i|2 dα. (5.16) u u Das zweite Postulat (2a) ist für beliebige Observablen31 eine Verallgemeinerung dessen, was bereits im vorigen Kapitel für die Energie festgestellt wurde. Wir bemerken, dass die Normierungsbedingung die Form X X Z 2 |cru (t)| + dα |cu (α, t)|2 = kψ(t)k2 = 1 (5.17) r,u u b σc (A) annimmt. Falls zu einer bestimmten Zeit t0 der Zustandsvektor des Systems mit einem b zum Eigenwert αr übereinstimmt, z.B. eigentlichen Eigenvektor von A X ψ(t0 ) = cu χ r u (5.18) u die Anfangsbedingung zur Zeit t0 ist, dann ist die Wahrscheinlichkeit bei Messung der Observablen A durch P (A = αr , t0 ) = 1 (5.19) 31 Der Begriff Observable wird auch oft zur Bezeichnung des zugehörigen Operators verwendet. Man b zur Observablen A auf verschiedenen physollte sich dabei trotzdem bewusst sein, dass der Operator A sikalischen Systemen unterschiedlich definiert ist. Ein offensichtliches Beispiel ist die Gesamtenergie des Systems, gemessen durch den Hamiltonoperator, der offensichtlich von der Anzahl der Teilchen abhängt. 58 gegeben, d.h. in diesem Fall ergibt eine Messung von A zur Zeit t0 mit Sicherheit das b auch als EigenErgebnis A = αr . Aus diesem Grund werden die Eigenvektoren von A b bezeichnet. Das zweite Postulat (2a) bezieht sich lediglich zustände (des Operators A) auf eine Observable. Es ist daher notwendig, das zweite Postulat (2a) auf die simultane Messung von zwei oder mehr Observablen zu verallgemeinern. Wir haben in Kapitel 3 besprochen, dass eine Einschränkung bei der gleichzeitigen Messung von Ort und Impuls (Heisenberg’sche Unschärferelation) besteht. Im Allgemeinen ist es nicht möglich, gleichzeitig zwei beliebige Observablen zu messen. Wir unterscheiden zwischen kompatiblen (gleichzeitig scharf messbar) und inkompatiblen (nicht gleichzeitig scharf messbar) Observablen. Im ersten Fall ist es möglich, das Ergebnis eines bestimmten Experiments mittels Zuweisung von wohldefinierten Werten für beide Observablen zu beschreiben. Im zweiten Fall ist dies nicht möglich. Wir wollen nun zwei kompatible Observablen A und B betrachten. Dann gilt gemäß des zweiten Postulats (2a), dass mögliche Ergebnisse der simultanen Messung von A und B in der Menge der Eigenwerte liegen, A = αr , B = βs . (5.20) b und B b ein gemeinsames vollständiges Nun wollen wir annehmen, dass die Operatoren A Orthonormalsystem von Eigenfunktionen (orthonormale Eigenbasis, ONEB) haben, z.B., dass eine ONEB χr s u existiert, so dass b r s u = αr χr s u , Aχ b r s u = βs χr s u , Bχ (5.21) wobei u den Entartungsindex darstellt. Wir wollen nur rein diskrete Spektren betrachten (der Einfachheit halber, die Verallgemeinerung auf kontinuierliche Spektren ist offensichtlich). In diesem Fall kann man X cr s u (t)χr s u (5.22) ψ(t) = r,s,u schreiben und annehmen, dass die Wahrscheinlichkeit, bei Messung der Observablen A und B die Eigenwerte αr und βs zu beobachten, durch den Ausdruck X P (A = αr , B = βs , t) = |hχr s u | ψ(t)i|2 (5.23) u gegeben ist. Daher können wir das zweite Postulat (2a) auf folgende Art und Weise verallgemeinern: • Postulat 2b: b Zwei oder mehr kompatible Observablen A, B, . . . werden durch Operatoren A, b B, . . . dargestellt, die ein gemeinsames vollständiges Orthonormalsystem von Eigenvektoren besitzen. Die Wahrscheinlichkeit bei der gleichzeitigen Messung der Observablen A und B die Ergebnisse A = αr und B = βs zu erhalten, ist durch Glg. (5.23) (bzw. die offensichtliche Verallgemeinerung auf mehr als zwei Variablen) gegeben. Wir weisen auf die Beziehungen 59 P (A = αr , t) = X P (A = αr , B = βs , t) = X s P (B = βs , t) = |cr s u (t)|2 , (5.24) s,u X P (A = αr , B = βs , t) = r X |cr s u (t)|2 (5.25) r,u hin. Unter Bezugnahme auf Glg. (5.21) weisen wir darauf hin, dass zwei Vektoren der Form X X as u χr s u bzw. br u χ r s u (5.26) s,u r,u b bzw. B b sind. Dann drückt Glg. (5.21) die Tatsache Eigenvektoren zu nur dem Operator A b so zu wählen, dass diese ebenfalls eine ONEB aus, dass es möglich ist, eine ONEB von A b ist (die umgekehrte Schlussrichtung gilt natürlich auch), aber nicht, dass jeder von B b automatisch auch ein Eigenvektor von B b ist. Letzteres könnte aufgrund Eigenvektor von A b einfach sind. von Glg. (5.21) nur für den Fall zutreffen, dass alle Eigenwerte von A Aus praktischen Gründen ist es von wesentlicher Bedeutung, eine Bedingung zu finden, welche die Beurteilung erlaubt, ob die Observablen A und B kompatibel sind oder nicht, ohne dass die explizite Konstruktion der gemeinsamen ONEB erforderlich ist. Zu diesem Zweck betrachten wir zunächst bBχ b r s u = α r βs χ r s u , A b Aχ b r s u = βs αr χr s u , B (5.27) und schließen daraus, dass bBχ b rsu = B b Aχ b rsu A (5.28) gilt. Da das System χr s u gemäß als vollstn̈dig angenommen wurde, vgl. Glg. (5.22), gilt Glg. (5.28) für beliebige Vektoren ψ(t) und daher gilt die Operatoridentität bB b=B bA b A (5.29) b B] b = 0, [A, (5.30) b B] b =A bB b−B bA b [A, (5.31) bzw. wobei wir den Kommutator definiert haben. Man kann nun folgendes Theorem zeigen: Eine notwendige und hinreichende Bedingung für die Existenz einer gemeinsamen b und B b ist, dass diese vertauschen, vollständigen Orthonormalbasis zweier Operatoren A b b d.h. dass [A, B] = 0 gilt. Daher gilt für untereinander kompatible Observablen, dass jegliche ihnen zugeordnete Operatoren untereinander kommutieren. Nun kann man für ein System von kompatiblen Observablen das Konzept der maximalen Beobachtung einführen. Der Index u in Glg. (5.21) zeigt an, dass χr s u bei Eigenwerten αr b und B b für weitere Operatoren ein Eigenvektor sein kann. und βs für die Operatoren A b B b und C, b die alle kommutieren (d.h. [A, b B] b = Wenn ein System von Operatoren A, 60 b C] b = [C, b A] b = 0), die Eigenschaft hat, dass es jeweils nur genau einen Eigenvektor [B, χr s t für jedes Tupel (αr , βs , γt ) von Eigenwerten gibt, d.h. dass b r s t = αr χr s t , Aχ b r s t = βs χr s t , Bχ b r s t = γt χr s t Cχ (5.32) gilt, so wird dieses als vollständiges System von kommutierenden Operatoren (vSkO) bezeichnet. Wir nennen ein solches System von Operatoren ein kommutierendes System. Systeme von Observablen, die einem vSkO zugeordnet werden, sind von besonderer Bedeutung in QM und müssen en detail besprochen werden. Zunächst wollen wir den Begriff einer Funktion mehrerer kommutierender Operatoren einführen. Gegeben sei eine Funktion f (x, y, z), die durch eine Potenzreihe X f (x, y, z) = f l m n xl y m z n (5.33) l,m,n dargestellt werden kann. Auf gleiche Art und Weise kann eine Funktion von Operatoren durch eine Potenzreihe von Operatoren32 X bl B bmC bn b B, b C) b = fl m n A (5.34) f (A, l,m,n ausgedrückt werden. Ausgehend von Glg. (5.32) erhält man bl B bmC bn χr s t = αrl βsm γtn χr s t , A (5.35) b B, b C)χ b r s t = f (αr , βs , γt )χr s t f (A, (5.36) was schließlich auf b führt. Man kann daher aufgrund von Glg. (5.36) schlussfolgern, dass ein Operator G, der mit allen Operatoren aus einem vSkO kommutiert, zwangsläufig eine Funktion dieser b mit einem Satz miteinander kommutierenOperatoren ist. Tatsächlich gilt, dass, falls G b B b und C b kommutiert, G b mit diesen Operatoren ein gemeinsames, der Operatoren A, b B b und C b ein vSko vollständiges System von Eigenvektoren besitzt. Wenn zusätzlich A, bilden, dann sind alle gemeinsamen Eigenvektoren der drei zugleich Eigenvektoren von b Unter dieser Bedingung können wir G. b r s t = ηr s t χ r s t Gχ (5.37) b = f (A, b B, b C) b schreiben und dann gilt aufgrund der Definition f (αr , βs , γt ) ≡ ηr s t , dass G b B b und C b zu ist. Dieses Ergebnis ist wichtig, denn es besagt, dass, falls die Operatoren A, den Observablen A, B und C ein vSkO bilden, durch gleichzeitige Messung einer Größe G, b mit A, b B b und C b kommutiert, keine weitere Information erlangt werden deren Operator G kann, da der Wert von G a priori auf Grundlage der beobachteten Werte für A, B und C berechnet werden kann. Aus diesem Grund bezeichnet man die Messung aller Operatoren eines vSkO mit dem Begriff der maximalen Beobachtung. Wir wollen uns nun erneut den zuvor eingeführten ersten beiden Postulaten zuwenden. Das erste Postulat erlaubt uns, den Zustandsvektor ψ(t) zu einer beliebigen Zeit t > t0 zu berechnen, sofern der Anfangszustand ψ(t0 ) gegeben ist. Das zweite Postulat erlaubt 32 Hinweis: Operatoren vertauschen im Allgemeinen nicht! 61 uns, Vorhersagen bezüglich der möglichen Ergebnisse einer Messung einer Observablen zur Zeit t zu machen, wenn wir den Zustandsvektor ψ(t) kennen. An diesem Punkt benötigen wir ein Kriterium, dass die Konstruktion eines Zustandsvektors ψ(t0 ) für den Anfangszeitpunkt gestattet. Diese Präparation des Systems besteht in idealisierter Form aus einer ersten Beobachtung (Messung) des Systems und einer danach erfolgenden vorhersagbaren Veränderung der experimentellen Apparatur. Man sollte daraus ψ(t0 ) konstruieren können. Um dieses Ziel zu erreichen, muss man sich zunächst darüber klar werden, dass nicht jede Beobachtung, die man an dem System vornehmen kann, nützlich sein kann, um dessen darauf folgende Zeitentwicklung vorherzusagen. Mittels einer Terminologie, die auf Wolfgang Pauli zurückgeht, ordnen wir Messungen in zwei Kategorien ein: Messungen der ersten Art und Messungen der zweiten Art. Eine Messung der ersten Art ist eine Beobachtung, bei welcher die beobachtete Observable nicht auf eine merkliche Art und Weise gestört wird, oder aber auf eine bekannte Art gestört wird, in dem Sinne, dass eine direkte Wiederholung der gleichen Beobachtung das gleiche oder ein vorhersagbares Ergebnis ergibt. Eine Messung der zweiten Art ist eine Beobachtung, die auf wesentliche und nicht vorhersagbare Art und Weise die untersuchte Observable stört. Ein Beispiel einer Messung der ersten Art ist die Messung der Energie eines Teilchens (mit bekannter Masse und Ladung), welche man mittels der Bestimmung der Krümmung jener Bahn erhält, die von diesem Teilchen beim Durchgang durch ein Magnetfeld in einer Wilson’schen Blasenkammer hinterlassen wird. Eine Bestimmung der Krümmung der Bahn auf dem als Nächstes angrenzenden Linienelement wird das gleiche Ergebnis haben. Ein typisches Beispiel einer Messung der zweiten Art ist die Beobachtung eines Photons mittels eines Photomultipliers. Während seiner Beobachtung wird das Photon vollständig absorbiert, so dass man nicht mehr von anschließenden Beobachtungen des Photons sprechen kann. Damit erreichen wir das dritte Postulat. • Postulat 3: Wir wollen annehmen, dass wir zu einer Zeit t0 eine Messung der ersten Art an einem System vorgenommen haben. Die Beobachtung besteht aus der Messung eines Satzes von kommutierenden Observablen, die im Folgenden mit A und B bezeichnet werden. Wir wollen annehmen, dass wir die Messwerte A = αr und B = βs erhalten haben. Wenn der Zustandsvektor direkt vor der Beobachtung durch ψ(t0 ) gegeben ist, dann ist der Zustandsvektor ψ(t0 + τ ) direkt nach der Beobachtung (bis auf die Normierung) durch die Projektion von ψ(t0 ) auf den Unterraum, der den Eigenwerten αr und βs entspricht, gegeben. Im konkreten Fall bedeutet dies, dass falls der Zustandsvektor ψ(t0 ) vor der Messung durch (vgl. Glg. (5.22)) X ψ(t0 ) = cr s u χ r s u (5.38) r,s,u gegeben ist, der Zustandsvektor ψ(t0 + τ ) nach der Messung durch ψ(t0 + τ ) = rP 1 |cr s u |2 u 62 X u cr s u χ r s u (5.39) gegeben ist. Wenn die betrachtete Messung eine maximale Beobachtung ist, hier A = αr , B = βs und C = γt , dann gilt im Speziellen (vgl. Glg. (5.32)) ψ(t0 + τ ) = χr s t . (5.40) Wir merken an, dass uns Glg. (5.40) erlaubt, den Zustand ψ(t0 + τ ) zu präparieren ohne irgendeine weitere Information über das System zu haben. Glg. (5.39) ist stattdessen nur nützlich, falls man zusätzlich über weitere Informationen über ψ(t0 ) verfügt. Diese Vorschrift gilt im Allgemeinen sowohl für das diskrete wie auch für das kontinuierliche Spektrum33 . Eine Konsequenz all dessen ist, dass der Zustandsvektor zur Zeit des Messvorgangs eine diskontinuierliche und irreversible Veränderung erfährt, die sich von der durch die Schrödingergleichung, Glg. (5.11), beschriebenen ungestörten Zeitentwicklung drastisch unterscheidet. Dies ist kein Problem, da der Zustandsvektor ein reines Hilfsmittel zur Formulierung der statistischen Vorhersagen ist und für sich genommen keinerlei Signifikanz besitzt. Wir erinnern uns, dass in der Wahrscheinlichkeitsrechnung die Konzepte des Erwartungswerts (oder Mittelwerts) und der Varianz (oder quadratischen Standardabweichung) von wesentlicher Bedeutung sind und wichtige Informationen bezüglich einer jeweils vorliegenden statistischen Verteilung beinhalten. Wir wollen diese Konzepte nun für die Wahrscheinlichkeitsverteilung spezifizieren, welche im zweiten Postulat einer generischen Observablen A und einerD bestimmten Lösung ψ(t) der Schrödingergleichung zugeordnet ist. E b Der Erwartungswert A von A bezüglich des Zustandsvektors ψ(t) ist durch t D E X X b ≡ αr |cr u (t)|2 (5.41) αr P (A = αr , t) = A t r,u r gegeben, wobei die erste Gleichheit eine Definition ist und die zweite Gleichheit sich durch Verwendung von Glgn. (5.12), (5.14) und (5.15) ergibt. Der Einfachheit halber behandeln wir hier nur den Fall eines rein diskreten Spektrums. Für die Wurzel der Varianz bzw. für die Standardabweichung erhalten wir rD D E E sX D E 2 D E 2 b b b b (A − A ) = αr − A P (A = αr , t) ∆A = t t t t r s = X D E 2 b αr − A |cr u (t)|2 . (5.42) t r,u D E b ist ein Maß für die Unbestimmtheit, mit der A für ein System im ZuDie Größe ∆A t stand ψ(t) bekannt ist34 . Die Gültigkeit der Glgn. (5.41) und (5.42) kann man in wenigen 33 Genau genommen erfordert Glg. (5.40) offensichtlich, dass der Zustand χr s t ein eigentlicher Eigenvektor ist. Eine Messung, die Werte im kontinuierlichen Spektrum ergibt, hat immer eine gewisse Ungenauigkeit, die man zwar verringern aber nicht zu Null reduzieren kann. Daher gehört diese Messung selbst bei einer maximalen Beobachtung zum Fall von Glg. (5.39). Nichtsdestotrotz könnte man bei einer direkten Wiederholung der Messung eine nahezu vollständige Bestimmung des Zustands erreichen. Dieser Fall gilt zum Beispiel bei der Bestimmung der Spur eines Teilchens in einer Wilson’schen Blasenkammer, welche eine wohlbestimmte Zuordnung eines Wellenpakets D E zu dem Teilchen erlaubt. 34 b und verschweigt damit implizit die AbhängigMan schreibt oft auch einfach ∆A anstelle von ∆A t keit der Varianz von der Wahl des Zustands ψ(t). Wir versuchen dies im Folgenden zu vermeiden und die Abhängigkeit vom Zustand ψ(t) explizit zu zeigen. 63 Zeilen zeigen: D E D E D E X b b ∗ b A = ψ(t) Aψ(t) = cr u (t)cs v (t) χr u Aχs v t r,s,u,v = X c∗r u (t)cs v (t)αs δr s δu v = r,s,u,v X αr |cr u (t)|2 , (5.43) r,u 2 D E2 D E 2 D E b b = ψ(t) A b− A b b ∆A ψ(t) = A − A ψ(t) t t t D E 2 X ∗ b b = cr u (t)cs v (t) χr u A − A χs v t r,s,u,v D E 2 X ∗ b = cr u (t)cs v (t) χr u αr − A χs v t r,s,u,v = X r,u D E 2 b αr − A |cr u (t)|2 . (5.44) t Diese Gleichungen finden zahllose praktische Anwendungen. 5.2 Orts- und Impulsobservablen: Größen mit klassischen Analoga Wie wir gesehen haben, kann jeder physikalischen Größe ein hermitescher Operator zugeordnet werden. Das zweite Postulat, welches diese Zuordnung herstellt, verallgemeinert die Rechenregeln und interpretativen Beschreibungen, die für den Spezialfall der Energie im vorherigen Kapitel besprochen wurden, für beliebige physikalische Messgrößen. Nun wollen wir untersuchen, auf welche Art und Weise sich die bereits für ein einzelnes Teilchen in einer Dimension gewonnenen Erkenntnisse in das Schema für N Teilchen (in drei Dimensionen) einfügen. Insbesondere wollen wir die Bestimmung der Wahrscheinlichkeit verallgemeinern, ein Teilchen in einem bestimmten Raumbereich oder Impulsbereich zu finden. Wir müssen nun ebensolche Regeln wie für die allgemeine Konstruktion des Hamiltonoperators angeben und die genaue analytische Form der Operatoren bestimmen, die den Observablen entsprechen. Insbesondere ist es von Bedeutung, präzise Regeln für die Konstruktion der Operatoren jener Größen zu haben, die eindeutige klassische Analoga besitzen. Aus diesem Grund führen wir das vierte Postulat ein. • Postulat 4: Der Hilbertraum eines Systems von N Teilchen ist der Raum L2 (R3N ) von Funktionen des Typs χ(x1 , . . . , xN ). Den kartesischen Koordinaten (xi , yi , zi ) des iten Teilchens werden die Operatoren (b xi , ybi , zbi ) zugeordnet, die durch (b xi χ)(x1 , . . . , xN ) = xi χ(x1 , . . . , xN ), (b yi χ)(x1 , . . . , xN ) = yi χ(x1 , . . . , xN ), (b zi χ)(x1 , . . . , xN ) = zi χ(x1 , . . . , xN ). (5.45) definiert werden. 64 Wie wir sehen werden, gestattet uns dieses Postulat, die Born’sche Wahrscheinlichkeitsinterpretation zu erhalten, die bereits in einem vorherigen Kapitel (vgl. Kapitel 3) besprochen wurde. Die Definition eines (linearen) Impulses35 , die zunächst in Bezug auf ein freies Teilchen angegeben wurde, kann zu einer neuen, allgemeineren Definition in Beziehung gesetzt werden, wie wir im Folgenden zeigen werden. Definition: Für ein System von N Teilchen nennen wir die vektorielle Größe mit kartesischen Komponenten (b pi x χ)(x1 , . . . , xN ) = (b pi y χ)(x1 , . . . , xN ) = (b pi z χ)(x1 , . . . , xN ) = ~ ∂χ(x1 ,...,xN ) , i ∂xi ∂χ(x ,...,x ) ~ 1 N , i ∂yi ~ ∂χ(x1 ,...,xN ) . i ∂zi (5.46) den (linearen) Impuls des iten Teilchens. Wir können hiermit die folgenden Observablen definieren. 5.2.1 Ort als Observable Wir haben bereits im Kapitel 3 den eindimensionalen Fall besprochen. Nun wollen wir den Ort eines Teilchens im dreidimensionalen Raum betrachten. Die Operatoren x b, yb und zb kommutieren miteinander und haben eine gemeinsame ONEB, x bχ(x, y, z) = xχ(x, y, z) = ξχ(x, y, z), ybχ(x, y, z) = yχ(x, y, z) = ηχ(x, y, z), zbχ(x, y, z) = zχ(x, y, z) = ζχ(x, y, z). (5.47) Die erste dieser Gleichungen wird für χ(x, y, z) = A(y, z)δ(x − ξ) gelöst. Die Lösung der zweiten ist χ(x, y, z) = B(x, z)δ(y − η) und der dritten ist χ(x, y, z) = C(x, y)δ(z − ζ). Daher werden die drei Gleichungen simultan durch χξ (x) = δ(x − ξ)δ(y − η)δ(z − ζ) = δ 3 (x − ξ) (5.48) gelöst, wobei wir ξ = (ξ, η, ζ) definiert haben. Hierbei handelt es sich um eine uneib ist von rein gentliche Eigenfunktion für beliebige Werte von ξ und das Spektrum von x kontinuierlicher Natur. Die beliebige multiplikative Konstante wurde in Glg. (5.48) auf eins gesetzt. Auf diese Art und Weise sind die χξ (x) normiert und man erhält die Orthonormalitätsrelation Z hχξ0 | χξ i = d3 x δ 3 (x − ξ 0 )δ 3 (x − ξ) = δ 3 (ξ − ξ 0 ) (5.49) sowie die Zerlegung beliebiger Wellenfunktionen nach der Ortsbasis, Z Z 3 3 ψ(x, t) = d ξ ψ(ξ, t)δ (x − ξ) = d3 ξ ψ(ξ, t)χξ (x), (5.50) womit sich die statistische Interpretation gemäß P (ξ ≤ x ≤ ξ + dξ, t) = |ψ(ξ, t)|2 d3 ξ 35 (5.51) Wir sprechen hier von einem linearen Impuls um hervorzuheben, dass es sich nicht um einen Drehimpuls handelt. Drehimpulse in der Quantenmechanik werden an späterer Stelle (Abschnitt 5.6) behandelt. 65 ergibt36 . Die Verallgemeinerung auf ein System von N Teilchen ist offensichtlich. 5.2.2 Impuls als Observable Für ein Teilchen in einer Dimension lautet die Eigenwertgleichung für pb pbϕ(x) = ~ ∂ϕ(x) = pϕ(x) i ∂x (5.53) und deren Lösung ist eine ebene Welle, i ϕ(x) = A exp [ px]. ~ (5.54) Hierbei handelt es sich um eine uneigentliche Eigenfunktion für beliebige Werte von p und das Spektrum von pb ist von rein kontinuierlicher Natur. Die normierten Eigenfunktionen lauten i 1 exp [ px] (5.55) ϕp (x) = √ ~ 2π~ und erfüllen die Orthonormalitätsrelation Z+∞ i i dx exp [− p0 x] exp [+ px] = δ(p0 − p). ~ ~ 1 hϕp0 | ϕp i = 2π~ (5.56) −∞ Wir merken an, dass die Impulseigenfunktionen für ein freies Teilchen mit den Eigenfunkb zusammenfallen. Auch sonst kann eine Wellenfunktion ψ(x, t) stets nach tionen von H Impulseigenfunktionen entwickelt werden, 1 ψ(x, t) = 2π~ Z+∞ Z+∞ i i dp dx0 ψ(x0 , t) exp [− px0 ] exp [+ px] ~ ~ −∞ 1 = √ 2π~ −∞ Z+∞ −∞ i dp c(p, t) exp [ px]. ~ (5.57) Dann können wir die Koeffizienten c(p, t) durch 1 c(p, t) = hϕp | ψ(t)i = √ 2π~ Z+∞ i dx exp [− px]ψ(x, t) ~ (5.58) −∞ erhalten und wir finden für das zweite Postulat 2 P (p0 ≤ p ≤ p0 + dp0 , t) = |c(p0 , t)| dp0 . 36 (5.59) Die Bedeutung von ξ ≤ x ≤ ξ + dξ ist als ξ ≤ x ≤ ξ + dξ, η ≤ y ≤ η + dη, p oder auch als |ξ − x| = (ξ − x)2 ≤ |dξ| zu verstehen. 66 ζ ≤ z ≤ ζ + dζ, (5.52) Die Lösung der Schrödingergleichung für ein freies Teilchen ist von der Form 1 ψ(x, t) = √ 2π~ so dass wir Z+∞ i p2 dp c0 (p) exp px − t , ~ 2m (5.60) −∞ i p2 c(p, t) = c0 (p) exp − t ~ 2m (5.61) finden. Die Tatsache, dass die Wahrscheinlichkeit P (p0 ≤ p ≤ p0 + dp, t) für ein freies Teilchen zeitunabhängig ist, 2 2 P (p0 ≤ p ≤ p0 + dp0 , t) = |c(p0 , t)| dp0 = |c0 (p0 )| dp0 = P (p0 ≤ p ≤ p0 + dp0 ). (5.62) stimmt mit der Tatsache überein, dass der Impuls (eines freien Teilchens) in der Klassischen Physik eine Konstante der Bewegung ist. Wir wollen nun ein Teilchen in drei Dimensionen betrachten. Die Operatoren pbx , pby und pbz vertauschen und die entsprechenden Observablen sind kompatibel. Die simultane Eigenwertgleichung lautet pbx ϕ(x, y, z) = pby ϕ(x, y, z) = pbz ϕ(x, y, z) = ~ ∂ϕ(x,y,z) i ∂x ~ ∂ϕ(x,y,z) i ∂y ~ ∂ϕ(x,y,z) i ∂z = px ϕ(x, y, z), = py ϕ(x, y, z), = pz ϕ(x, y, z). (5.63) Die Lösungen der ersten, zweiten und dritten Gleichung sind entsprechend i A(y, z) exp [ px x], ~ i i B(x, z) exp [ py y] und C(x, y) exp [ pz z]. ~ ~ (5.64) Darum ist eine gleichzeitige Lösung durch i i i ϕ(x, y, z) = K exp [ px x] exp [ py y] exp [ pz z] ~ ~ ~ (5.65) gegeben und die normierten Eigenfunktionen sind ϕp (x) = 1 i 1 i exp [ (px x + py y + pz z)] = 3 exp [ p · x] ~ ~ (2π~) (2π~) 2 3 2 (5.66) und erfüllen die Orthonormalitätsrelation hϕp0 | ϕp i = δ 3 (p0 − p). (5.67) Wir können damit das Wellenpaket als Superposition dieser Lösungen schreiben, d.h. die Wellenfunktion ψ(x, t) nach den Impulseigenfunktionen entwickeln, Z Z 1 i 3 ψ(x, t) = d p c(p, t)ϕp (x) = d3 p c(p, t) exp [ p · x], (5.68) 3 ~ (2π~) 2 wobei im Allgemeinen die Beziehungen c(p, t) = hϕp | ψ(t)i = Z 1 (2π~) 3 2 67 i d3 x exp [− p · x]ψ(x, t), ~ (5.69) 2 P (p0 ≤ p ≤ p0 + dp0 , t) = |c(p0 , t)| d3 p0 , gelten. Für das freie Teilchen reduziert sich Glg. (5.69) zu i p2 c(p, t) = hϕp | ψ(t)i = c0 (p) exp − t , ~ 2m (5.70) (5.71) wie bereits im eindimensionalen Fall. Eine Verallgemeinerung dieser Betrachtungen zu Systemen mit N Teilchen ist offensichtlich. 5.2.3 Unschärferelation Wie wir gesehen haben, vertauschen Ortsoperatoren untereinander, und das Gleiche gilt auch für Impulsoperatoren. Dies kann jedoch nicht für beliebige Kombinationen von Ortsund Impulsoperatoren gültig sein. Wenn wir die kte Koordinate des jten Teilchens mit xj k und die k 0 te Impulskomponente des j 0 ten Teilchens mit pj 0 k0 bezeichnen, erhalten wir ∂χ(x1 , . . . , xN ) ~ , (b xj k pbj 0 k0 χ)(x1 , . . . , xN ) = xj k i ∂xj 0 k0 ~ ∂xj k χ(x1 , . . . , xN ) (b pj 0 k 0 x bj k χ)(x1 , . . . , xN ) = , i ∂xj 0 k0 ~ ∂χ(x1 , . . . , xN ) ~ = xj k + δj j 0 δk k0 χ(x1 , . . . , xN ) i ∂xj 0 k0 i (5.72) (5.73) und darum ([b xj k pbj 0 k0 − pbj 0 k0 x bj k ]χ)(x1 , . . . , xN ) = i~δj j 0 δk k0 χ(x1 , . . . , xN ). (5.74) Da χ(x1 , . . . , xN ) eine beliebige Wellenfunktion ist, gilt somit [b xj k , x bj 0 k0 ] = [b pj k , pbj 0 k0 ] = 0, [b xj k , pbj 0 k0 ] = i~δj j 0 δk k0 . (5.75) Somit sehen wir in Übereinstimmung mit dem Heisenberg’schen Unschärfeprinzip, dass eine Ortskoordinate niemals mit dem zu ihr kanonisch konjugierten Impuls kompatibel sein kann. 5.2.4 Allgemeinere Observablen Nun müssen wir über die analytische Form von Operatoren nachdenken, die allgemeineren Observablen entsprechen. In der Klassischen Mechanik wird eine dynamische Variable für ein System von N Teilchen immer durch eine Funktion der kanonischen Variablen dargestellt, F = F (x1 , y1 , z1 , . . . , pN x , pN y , pN z ). Dies legt nahe, dass eine gleichartige Konstruktion in der Quantenmechanik auftritt. Daher formulieren wir das fünfte Postulat. 68 • Postulat 5: Die den Observablen eines Systems von N Teilchen entsprechenden Operatoren sind von der Form Fb = F (b x1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z ), (5.76) d.h. sie sind Funktionen der fundamentalen Operatoren x b1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z . (5.77) Wir merken zunächst an, dass wir Ausdrücken vom Typ F (b x1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z ) durch die Substitution x1 → x b1 , y1 → yb1 , . . . , pN z → pbN z (5.78) eine Bedeutung geben können, falls die Funktion F (x1 , y1 , z1 , . . . , pN x , pN y , pN z ) in einer Potenzreihe entwickelt werden kann. Aber im Gegensatz zu den Verhältnissen für kompatible Operatoren führt die Substitution, Glg. (5.78), nicht zu einer eindeutigen Form, da die verschiedenen Terme der Potenzreihe aus im Allgemeinen nicht kommutierenden Operatoren bestehen, für welche die Reihenfolge daher relevant ist. Darüber hinaus ist, falls wir keine angemessene Vorschrift für die Ordnung der nicht kommutierenden Operatoren verwenden, der für Fb erhaltene Operator nicht hermitesch. Um einen hermiteschen Operator zu erhalten ist es wesentlich, jeden einzelnen Term der Potenzreihe in geeigneter Art und Weise zu symmetrisieren. Beispielsweise37 könnten wir X Fb = am n (b xm pbn )sym (5.79) m,n schreiben, wobei wir mit der Notation (. . .)sym beispielsweise (b xpb)sym = 1 (b xpb + pbx b) 2 (5.80) meinen. Man sieht durch explizite Rechnung leicht, dass (b xpb)sym † = 1 1 1 † † (b xpb + pbx b) † = pb x b +x b† pb† = (b px b+x bpb) = (b xpb)sym . 2 2 2 (5.81) Da derartige Symmetrisierungsvorschriften für komplizierte Operatoren zu länglichen Ausdrücken ohne signifikanten Lerneffekt für Sie führen, werden wir darauf im Folgenden nicht weiter eingehen. Nun betrachten wir die Beziehung zwischen einer quantenmechanischen Observablen F mit dem zugehörigen Operator Fb und der Klassischen Bewegungsgröße F , auf deren Grundlage der Operator Fb definiert ist. 37 Es existieren keine zwangsläufigen allgemeinen Vorschriften zur Symmetrisierung. Daher ist die Zuordnung ausgehend von einer Klassischen Bewegungsgröße zu einem bestimmten quantenmechanischen Operator nicht eindeutig. Der Umkehrschluss gilt jedoch, so dass die Zuordnung ausgehend von einem quantenmechanischen Operator zu einer Klassischen Bewegungsgröße eindeutig ist (sofern möglich). 69 Wenn wir den Zustandsvektor ψ(t) des gegebenen Quantensystems zur Zeit t betrachten, sind hb x1 it , . . . , hb pN z it sowie h∆b x1 it , . . . , h∆b pN z it die Erwartungswerte und Standardabweichungen der fundamentalen Observablen bezüglich des Zustands ψ(t). Falls die Standardabweichungen h∆b x1 it , . . . , h∆b pN z it auf der Skala der Beobachtung vernachlässigbar klein sind und falls die Klassische Größe F (x1 , . . . , pN z ) nur unwesentlich bei Schwankungen der x1 , . . . , pN z von der Ordnung h∆b x1 it , . . . , h∆b pN z it um die Werte hb x1 it , . . . , hb pN z it fluktuiert, ist die dem Operator Fb zugeordnete quantenmechanische Observable praktisch identisch zu F (hb x1 it , . . . , hb pN z it ). Wir werden dies in einer Übung zeigen. In diesem Grenzfall kann die dem Operator Fb zugeordnete Observable mit der Klassischen Größe F (x1 , . . . , pN z ) identifiziert werden. Es gibt jedoch auch quantenmechanische Observable, die keine klassischen Analoga besitzen, wie beispielsweise der Spin eines Teilchens. Außerdem können a priori mehrere verschiedene quantenmechanische Größen der gleichen Klassischen Größe entsprechen. Wir wollen nun den Drehimpuls als ein konkretes Beispiel einer solchen allgemeineren Observablen betrachten. Klassisch ist diese Größe durch L = x × p = ijk xi pj êk (5.82) oder äquivalent Lx = ypz − zpy , Ly = zpx − xpz , Lz = xpy − ypx (5.83) definiert. In diesem Fall bestehen keinerlei Probleme mit der Ordnung in der Substitution in Glg. (5.78). Die Lx , Ly und Lz entsprechenden Quantenoperatoren sind eindeutig definiert und sie sind durch ~ ∂ ∂ b −z y , (5.84) Lx = ybpbz − zbpby = i ∂z ∂y ~ ∂ ∂ by = zbpbx − x L bpbz = −x z , (5.85) i ∂x ∂z ∂ ∂ ~ bz = x x −y (5.86) L bpby − ybpbx = i ∂y ∂x gegeben. Wir bezeichnen diese hermiteschen Operatoren als die Komponenten des Drehimpulsoperators und nennen die zugeordnete Observable den quantenmechanischen oder quantisierten Drehimpuls. Wir bemerken hier, dass die Komponenten des Drehimpulsoperators nicht miteinander vertauschen, bx , L by ] 6= 0, [L by , L bz ] 6= 0, [L bz , L bx ] 6= 0. [L (5.87) bx , L by und L bz – Daher sind die Komponenten des quantenmechanischen Drehimpulses – L keine kompatiblen Observablen und es ist nicht möglich dem Vektor L in der Quantenmechanik einen wohldefinierten Wert zuzuweisen. Wir betrachten nun die Klassische Hamiltonfunktion eines Systems von N Teilchen, N X p2j H(x1 , . . . , pN ) = + V (x1 , . . . , xN ). 2mj j=1 70 (5.88) b lautet Der zugehörige Hamiltonoperator H b = H(b H x1 , . . . , pbN ) = N X pb2j bN ) + V (b x1 , . . . , x 2m j j=1 (5.89) bzw. explizit in Ortsdarstellung b =− H N X ~2 ∆x + V (x1 , . . . , xN ). 2mj j j=1 (5.90) Dieser Operator stimmt mit jenem in Glg. (5.7) als Verallgemeinerung von Glg. (5.1) auf N -Teilchensysteme definierten Operator überein. Wir führen nun das sechste Postulat ein. • Postulat 6: Für ein System von N Teilchen ist der Operator, der in der Schrödingergleichung, vgl. Glg. (5.7), auftritt, von der Form von Glg. (5.89). Die Form des Potentials V (x1 , . . . , xN ) kann in manchen Fällen wie beispielsweise für elektrostatische Kräfte mit dem entsprechenden Klassischen Potential identifiziert werden. In anderen Fällen, wie beispielsweise für Kernkräfte, muss das Potential direkt aus den Daten erhalten werden. In den häufigsten Fällen liegt eine Zweikörper-Wechselwirkung vor und das Potential ist von der Form V (x1 , . . . , xN ) = N X Vj (xj ) + j=1 X Vi j (|xi − xj |), (5.91) i<j wobei der Term Vj (xj ) die Wirkung äußerer Kräfte auf das jte Teilchen darstellt, während der Beitrag Vi j (|xi − xj |) die Wechselwirkungsenergie zwischen den Teilchen i und j beschreibt (diese Energie sollte unter Rotationen und Translationen invariant sein). Somit kann der Hamiltonoperator eines Atoms mit Z Elektronen (und Kernladungszahl Z) als Z Z X X X pb2j Ze2 e2 pb20 b + − + H= 2M0 j=1 2me j=1 |x0 − xj | i<j |xi − xj | (5.92) geschrieben werden, wobei sich der Index 0 auf den Atomkern und die übrigen Indizes i, j = 1, 2, . . . , Z auf die Elektronen beziehen. 5.3 Kommutatoren und Unbestimmtheitsrelationen Der Ausdruck b B] b =A bB b−B b A, b [A, (5.93) der bereits in Glg. (5.31) eingeführt wurde, wird als Kommutator bezeichnet. Der Kommutator besitzt die folgenden wesentlichen Eigenschaften, b =0, [c, A] (5.94) 71 b B] b = − [B, b A], b [A, b B] b =c[A, b B], b [cA, (5.95) (5.96) b + B, b C] b =[A, b C] b + [B, b C], b [A bB, b C] b =A[ b B, b C] b + [A, b C] b B, b [A b B], b C] b + [[B, b C], b A] b + [[C, b A], b B], b 0 =[[A, (5.97) (5.98) (5.99) die Sie in Übungsaufgabe 5.4 untersucht haben. Glg. (5.99) ist als Jacobi Identität bekannt. Wir betrachten nun ein System von N Teilchen und schreiben die Kommutatoren von Glg. (5.75) erneut, [b xj k , x bj 0 k0 ] = [b pj k , pbj 0 k0 ] = 0, [b xj k , pbj 0 k0 ] = i~δj j 0 δk k0 . (5.100) Diese Gleichungen stimmen bis auf den Faktor i~ mit den Ausdrücken für Poissonklammern38 überein, wie sie für die entsprechenden Klassischen Observablen auftreten. Insbesondere gibt es eine Korrespondenz i b b {A, B} → − [A, B], ~ (5.102) b und B b quantenmechanische Operatoren wobei A und B Klassische Variablen sind und A zu den entsprechenden quantenmechanischen Observablen. Wenn wir den Drehimpulsoperator eines einzelnen Teilchens betrachten, finden wir unter Verwendung der Eigenschaften des Kommutators bx , L by ] =[b [L y pbz − zbpby , zbpbx − x bpbz ] = [b y pbz , zbpbx ] + [b z pby , x bpbz ] bz =b y [b pz , zb]b px + x b[b z , pbz ]b py = −i~b y pbx + i~b xpby = i~L (5.103) bx , L by ] = i~L bz [L (5.104) bi , L bj ] = i~ijk L bk . [L (5.105) [b xn , pbx ] = i~nb xn−1 (5.106) und daher bzw. im Allgemeinen Wir können ebenso erhalten, was sich mit Leichtigkeit (durch vollständige Induktion) zeigen lässt: [b xn , pbx ] =[b xx bn−1 , pbx ] = [b x, pbx ]b xn−1 + x b[b xn−1 , pbx ] =i~b xn−1 + x bi~(n − 1)b xn−2 = i~nb xn−1 . (5.107) Damit finden wir Kommutatoren für Funktionen der Operatoren, 38 Die Poissonklammer ist für ein System mit M Freiheitsgraden durch M X ∂A ∂B ∂B ∂A {A, B} = − ∂xi ∂pi ∂xi ∂pi i=1 gegeben. 72 (5.101) ∂F (b x, yb, zb) , ∂x ∂G(b px , pby , pbz ) [b x, G(b px , pby , pbz )] =i~ , ∂px [F (b x, yb, zb), pbx ] =i~ (5.108) (5.109) indem wir diese in Potenzreihen entwickeln. Die Verallgemeinerung dieser Gleichungen zu anderen Komponenten ist offensichtlich. Wie wir bereits gesehen haben, gilt für zwei kompatible Observablen A und B, dass die entsprechenden Operatoren kommutieren, b B] b = 0. [A, (5.110) Falls die Observablen inkompatibel sind, gilt stattdessen b B] b 6= 0. [A, (5.111) In einem solchen Fall gilt außerdem D E D E b b b h∆Bi b ≥ 1 [ A, B]ψ(t) ψ(t) ∆A , t 2 t t (5.112) wobei ψ(t) ein beliebiger Zustandsvektor ist. Sie werden diese Identität auf Übungsblatt 7 überprüfen. Wenn wir A mit einer kartesischen Koordinate des Teilchens und B mit der entsprechenden Impulskomponente identifizieren, ergibt Glg. (5.112) die Heisenberg’sche Unschärferelation als Konsequenz des Heisenberg Kommutators [b x, pbx ] = i~, vgl. Glg. (5.75). Man erhält daher h∆b xit h∆b pit ≥ ~ . 2 (5.113) Glg. (5.112) stellt eine Verallgemeinerung der Heisenberg’schen Unbestimmtheitsregeln dar, vgl. Glg. (3.43). Für das Beispiel des Drehimpulses, vgl. Glg. (5.104), erhalten wir D E D E ~ Db E b b Lz . (5.114) ∆Lx ∆Ly ≥ 2 t t t Sie werden auf Übungsblatt 7 zeigen, dass man einen Zustandsvektor konstruieren kann, für den die Unbestimmtheit minimal ist. Für den Fall eines freien Teilchens in einer Dimension entspricht dieser Zustand dem Gauß’schen Wellenpaket. 5.4 Zeitabhängigkeit des Mittelwerts einer Observablen und Ehrenfest’sches Theorem Für eine allgemeine Observable F können wir den Erwartungswert konstruieren, D E D E b F = ψ(t) Fbψ(t) , (5.115) t welcher zu einer gegebenen Lösung ψ(t) der Schrödingergleichung gehört. Dann gilt * + d hF it ∂ Fb i b b = − [F , H] . (5.116) dt ∂t ~ t 73 Glg. (5.116) kann unmittelbar aus Glg. (5.115) erhalten werden, indem man deren Zeitableitung bildet, die Schrödingergleichung verwendet und die Hermitezität des Hamiltonoperators verwendet: * + ∂ Fb E dψ(t) dψ(t) b d D b b ψ(t) F ψ(t) = ψ(t) ψ(t) + F ψ(t) + ψ(t) F ∂t dt dt dt * + ∂ Fb i b i b b b = + − Hψ(t) F ψ(t) + ψ(t) F (− H)ψ(t) ∂t ~ ~ +t * + * E iD ∂ Fb i b b ∂ Fb b b − ψ(t) [F , H]ψ(t) = − [F , H] . (5.117) = ∂t ~ ∂t ~ t t Dabei wurde in Glg. (5.116) eine explizite Zeitabhängigkeit des Operators Fb mitberücksichtigt. Wir bemerken, dass Glg. (5.116) analog zur Klassischen Beziehung dF ∂F = + {F, H} dt ∂t (5.118) ist (hierbei ist {., .} die Poissonklammer). Wir wollen nun ein System von N Teilchen betrachten, deren Hamiltonoperator durch Glg. (5.89) gegeben ist. Ausgehend von Glg. (5.116) sowie Glgn. (5.108) and (5.109) erhalten wir E X [b xj , pb2j 0 ] t bj ∂x i d iD b hb xj it = [b xj , H] =0− − dt ∂t t ~ ~ j0 2mj t 2 hpbj 0 it i X 1 δj j 0 = − i~ = hpbj it , ~ 2m m j j 0 j * + E b iD ∂ pbj i ~ ∂ H d b − hpbj it = [pbj , H] =0− dt ∂t t ~ ~ i ∂xj t t bN ) ∂V (b x1 , . . . , x =− . ∂xj t (5.119) (5.120) Diese Gleichungen werden als das Ehrenfest’sche Theorem39 bezeichnet. Falls die Unbestimmtheit von Ort und Impuls des Teilchens hinreichned klein (bezüglich der Beobachtungsskala) sind und die Ableitungen des Potentials langsam mit dessen Argumenten variieren, können wir ∂V (hx1 it , . . . , hxN it ) ∂V (x1 , . . . , xN ) ' (5.121) ∂xj ∂ hxj it t schreiben. Dann kann Glg. (5.120) mit den Klassischen Hamilton’schen Gleichungen identifiziert werden. Wir werden ein Anwendungsbeispiel dieses Theorems auf Übungsblatt 8 sehen. 39 In der Literatur ist die Bezeichnung Ehrenfest’sches Theorem auch für Glg. (5.116) gebräuchlich. 74 5.5 Konstanten der Bewegung In der Klassischen Mechanik haben wir Konstanten der Bewegung als jene dynamischen Variablen F (q, p, t) definiert (wobei wir mit q und p die die verschiedenen Orts- und Impulsvariablen zusammenfassen), deren Werte sich mit der Zeitentwicklung des Systems nicht ändern, d.h. d/dtF (q(t), p(t), t) = 0 für jegliche Lösungen der Hamilton’schen Gleichungen. Da man in der QM nicht zu jedem Zeitpunkt einer beliebigen Größe einen wohldefinierten Wert zuweisen kann, muss diese Definition modifiziert werden. In der QM definieren wir eine Konstante der Bewegung als eine Größe, deren Erwartungswert für jede beliebige Lösung ψ(t) der Schrödingergleichung zeitunabhängig ist: E d D d D bE ψ(t) Fbψ(t) = 0. F = dt dt t (5.122) Dann folgt aufgrund von Glg. (5.116) als notwendige und hinreichende Bedingung, dass F eine Konstante der Bewegung ist, dass ∂ Fb i b =0 − [Fb, H] ∂t ~ (5.123) erfüllt ist. b Tatsächlich ist eine hinreichende und notwendige Bedingung, dass hψ(t)|Aψ(t)i = 0 mit † b=A b erfüllt ist, dass A b = 0 ist. Daher gilt, falls F nicht explizit zeitabhängig ist, und A b =0 [Fb, H] (5.124) gilt, dass F eine Konstante der Bewegung ist, falls der entsprechende Operator Fb mit dem b kommutiert. Das erste Beispiel einer Konstanten der Bewegung ist Hamiltonoperator H die Energie eines Systems, dessen Hamiltonoperator nicht explizit von der Zeit abhängt: in der Tat kommutiert der Hamiltonoperator mit sich selbst. Man kann zeigen (siehe Übungsblatt 7), dass für ein freies Teilchen die drei Komponenten des (linearen) Impulses und des Drehimpulses Konstanten der Bewegung sind. Im Falle eines Teilchens im Zentralpotential sind die drei Komponenten des Drehimpulses Erhaltungsgrößen. Für einen Hamiltonoperator vom Typ b= H N X X pb2j bj 0 |) + Vj j 0 (|b xj − x 2mj j<j 0 j=1 (5.125) sind sowohl die drei Komponenten der linearen Gesamtimpulses, Pb = N X pbj , (5.126) j=1 als auch die drei Komponenten des Gesamt-Bahndrehimpulses, b= L N X bj × pbj , x j=1 Konstanten der Bewegung. 75 (5.127) Ein weiteres typisches Problem ist es, den maximalen Satz von kompatiblen Konstanten der Bewegung zu finden. Diese sind Observable, welche durch Operatoren repräsentiert werden, die untereinander und mit dem Hamiltonoperator kommutieren. Beispielsweise gilt im Fall des Teilchens im Zentralpotential, dass die drei Komponenten des Bahndrehimpulses zwar erhalten aber nicht zueinander kompatibel sind. Man kann stattdessen als vollständigen Satz kompatibler Erhaltungsgrößen beispielsweise die Energie, das Betragsquadrat des Drehimpulses sowie eine einzelne Komponente des Drehimpulses annehmen (vgl. Übungsblatt 6). Mittels dieses Satzes kann man eine maximale Beobachtung des Systems definieren. Wir betonen, dass Glgn. (5.123) und (5.124) Konsequenzen haben, die über die Erhaltung des Mittelwerts von F hinaus gehen. Wir wollen nun annehmen, dass F nicht explizit b eine gemeinzeitabhängig ist. Dann folgt aus Glg. (5.124), dass die Operatoren Fb und H same ONEB beistzen, b r s = Er φr s , Hφ Fbφr s = λs φr s . (5.128) Eine allgemeine Lösung der Schrödingergleichung kann in der Form ψ(t) = X r,s i cr s φr s exp [− Er t] ~ geschrieben werden und wir erhalten für das zweite Postulat 2 X X i cr s exp [− Er t] = |cr s |2 . P (F = λs , t) = ~ r r (5.129) (5.130) Daher sehen wir, dass im Fall einer Konstanten der Bewegung, die nicht explizit zeitabhängig ist, nicht nur der Mittelwert, sondern auch die Wahrscheinlichkeitsverteilung der Observable zeitunabhängig ist. Einige Beispiele dieser Eigenschaft haben wir bereits gesehen, unter anderem die Wahrscheinlichkeitsverteilung der Energie für beliebige zeitunabhängige Hamiltonoperatoren sowie die Wahrscheinlichkeitsverteilung des Impulses eines freien Teilchens. Dieses Ergebnis kann auch auf explizit zeitabhängige Konstanten der Bewegung erweitert werden. Tatsächlich kann man folgendes Theorem zeigen. Wenn F Glg. (5.123) erfüllt gilt: 1. Die Eigenwerte von F sind zeitunabhängig (die Eigenvektoren hängen im Allgemeinen von der Zeit ab). 2. Die Wahrscheinlichkeitsverteilung von F ist zeitunabhängig. Schließlich bemerken wir, dass die Bestimmung der Konstanten der Bewegung wie schon in der Klassischen Physik auch in der Quantenmechanik sehr nützlich ist, um die Eigenschaften der Lösungen der Bewegungsgleichungen (Schrödingergleichung in QM) zu untersuchen und diese Lösungen ganz konkret zu konstruieren. Insbesondere kann Glg. (5.128) auf den Fall mehrerer zeitunabhängiger, kompatibler Konstanten der Bewegung verallgemeinert werden. Die Kenntnis des Systems dieser Konstanten der Bewegung gewährt uns a priori Wissen bezüglich des Wesens der Energie-Eigenfunktionen. 76 5.6 Drehimpuls eines Teilchens Wir haben gesehen, dass die drei Komponenten des Bahndrehimpulses in der QM durch die drei Operatoren bx = ybpbz − zbpby , L by = zbpbx − x L bpbz , bz = x L bpby − ybpbx , (5.131) oder ∂ ∂ ~ b y −z , Lx = i ∂z ∂y ∂ ∂ ~ b z −x , Ly = i ∂x ∂z ~ ∂ ∂ bz = L x −y i ∂y ∂x (5.132) (5.133) (5.134) gegeben sind. Ferner haben wir gesehen (vgl. Übungsblatt 4), dass die Vertauschungsrebx , L by und L bz durch lationen zwischen L bi , L bj ] = i~ijk L bk [L (5.135) gegeben sind. An Glg. (5.135) sehen wir, dass die Observablen Lx , Ly und Lz nicht kompabx , L by und L bz (oder auch nur zwei von diesen Operatoren) tibel sind und die Operatoren L nicht gestatten, ein vollständiges System von gemeinsamen Eigenvektoren zu bilden. Wenn wir das Betragsquadrat des Drehimpulses bilden, b2 = L b2 + L b2 + L b2 , L x y z (5.136) b 2 mit den drei Komponenten kommutiert, können wir (vgl. Übungsblatt 6) zeigen, dass L b 2, L b 2, L b 2, L b x ] = [L b y ] = [L bz ] = 0. [L (5.137) b 2 und Daher ist es möglich ein gemeinsames Orthonormalsystem von Eigenvektoren zu L bz , zu finden. Insbesondere können wir, nach einer der drei Drehimpulskomponenten, z.B. L Übergang zu Kugelkoordinaten (sphärische Polarkoordinaten), x = r cos ϕ sin ϑ, y = r sin ϕ sin ϑ, z = r cos ϑ, (5.138) herleiten, dass ~ ∂ cos ϕ ∂ bx = − L sin ϕ + , i ∂ϑ tan ϑ ∂ϕ ~ ∂ sin ϕ ∂ by = − L − cos ϕ + , i ∂ϑ tan ϑ ∂ϕ bz = ~ ∂ L i ∂ϕ und b2 2 L = −~ 1 ∂ sin ϑ ∂ϑ ∂ 1 ∂2 sin ϑ + ∂ϑ sin2 ϑ ∂ϕ2 gelten. 77 (5.139) (5.140) (5.141) (5.142) 5.7 Parität Bisher haben wir verschiedene Beispiele von Observablen betrachtet, die recht eindeutige Klassische Analoga haben, beispielsweise den Ort, den (linearen) Impuls, den Drehimpuls und die Energie. Es gibt aber auch Größen, die kein wesentliches Klassisches Analogon besitzen. Unter diesen ist die Parität von besonderem Interesse. Wir wollen den Fall eines einzelnen Teilchens betrachten. Der Paritätsoperator ist durch die Beziehung Pbχ(x) = χ(−x) (5.143) definiert. Der Operator Pb ist hermitesch und kann einer beobachtbaren Größe zugeordnet werden. Die Eigenwertgleichung kann als Pbχ(x) = εχ(x) (5.144) geschrieben werden, was so viel heißt wie χ(−x) = εχ(x) (5.145) oder (durch Ersetzung von x durch −x) χ(x) = εχ(−x). (5.146) Indem wir Glg. (5.145) in Glg. (5.146) einsetzen, erhalten wir χ(x) = ε2 χ(x), ε2 = 1 (5.147) und damit ε = ±1. (5.148) Einerseits werden die zu ε = +1 gehörenden Eigenfunktionen durch χ(−x) = χ(x) (5.149) charakterisiert, d.h. sie sind gerade Funktionen. Andererseits werden die zu ε = −1 gehörenden Eigenfunktionen durch χ(−x) = −χ(x) (5.150) charakterisiert und sind daher ungerade Funktionen. Da der Paritätsoperator Pb hermitesch ist, ist das System seiner Eigenfunktionen vollständig und jeder Zustandsvektor χ(x) kann als Summe einer geraden und einer ungeraden Funktion geschrieben werden. Dies kann durch die Zerlegung χ(x) = 1 1 [χ(x) + χ(−x)] + [χ(x) − χ(−x)] 2 2 (5.151) erreicht werden. Wir bemerken, dass Pbx b = −b xPb, Pbyb = −b y Pb, Pbzb = −b z Pb, Pbpbx = −b px Pb, Pbpby = −b py Pb, Pbpbz = −b pz Pb (5.152) gilt. Aus diesen Beziehungen folgt Pbpb2 /(2m) = pb2 /2mPb. Nun können wir ein allgemeines Potential PbV (b x) = V (−b x)Pb betrachten. Falls V (b x) eine gerade Funktion ist, kommutiert 78 b und Parität ist eine Konstante der Bewegung. In diesem Fall haben H b und Pb mit H Pb einen vollständigen Satz gemeinsamer Eigenfunktionen und daher ist es möglich, die b so zu wählen, dass diese gerade oder ungerade sind. Wir werden Eigenfunktionen von H Beispiele hierfür sehen, wenn wir ein Teilchen im Zentralpotential betrachten. Der Paritätsoperator kann ohne Komplikationen auf Mehrteilchensysteme erweitert werden. Für eine beliebige Wellenfunktion eines N Teilchensystems gilt Pbχ(x1 , . . . , xN ) = χ(−x1 , . . . , −xN ), (5.153) für eine beliebige Mehrteilcheneigenfunktion des Paritätsoperators gilt Pbχ(x1 , . . . , xN ) = εχ(−x1 , . . . , −xN ), (5.154) und der Hamiltonoperator erfüllt b 1 , . . . , pN ) = H(−x b b PbH(x 1 , . . . , −pN )P . (5.155) Weitere Verallgemeinerungen sind offensichtlich und werden daher Ihnen selbst überlassen. Literaturempfehlung: F. Schwabl A. Messiah S. Weinberg Quantenmechanik, Bd. 1 Quantum Mechanics, Volume 1 Lectures on Quantum Mechanics 79 Kapitel 8 Sections 5, 8.1 Section 3 6 6.1 Anwendungen der Schrödingergleichung: eindimensionale Probleme Einleitung Um ein ausreichendes Maß an praktischer Erfahrung im Umgang mit der Schrödingergleichung zu erlangen, werden wir im Folgenden die Wellenmechanik einiger eindimensionaler Systeme betrachten. Einerseits sind eindimensionale Systeme als einfache Modelle von Interesse, da sie uns erlauben, bestimmte Eigenschaften, die auch bei komplexeren Quantensystemen auftreten, in einem einfacheren Rahmen zu untersuchen. Andererseits sind eindimensionale Systeme ebenfalls von Interesse, da man bei einer ganzen Reihe von mehrdimensionalen Problemen nach Sequenzen von geeigneten Manipulationen diese Gleichungen auf den gleichen Typus wie die eindimensionale Schrödingergleichung reduzieren kann. Wir wollen ein Teilchen der Masse m betrachten, welches auf Bewegung entlang der x Achse innerhalb eines Potenzials V (x) beschränkt ist. Die zugehörige Schrödingergleichung lautet ~2 ∂ 2 ∂ + V (x) ψ(x, t). (6.1) i~ ψ(x, t) = − ∂t 2m ∂x2 Wir interessieren uns insbesondere für die Suche nach den stationären Zuständen, cf. Abschnitt 4.5. Falls E die Energie eines stationären Zustands ist, kann die Zeitabhängigkeit separiert werden, i ψ(x, t) = φ(x)e− ~ Et , (6.2) und die Funktion φ(x) ist eine Lösung der zeitunabhängigen Schrödingergleichung ~2 ∂ 2 − + V (x) φ(x) = Eφ(x). (6.3) 2m ∂x2 Innerhalb dieses Abschnitts werden wir die Notation V (x) = ~2 ~2 U (x), E = ε 2m 2m (6.4) verwenden, die uns erlaubt, die vorige Gleichung als φ00 (x) + [ε − U (x)]φ(x) = 0 (6.5) zu schreiben. Glg. (6.5) ist eine Differenzialgleichung vom Sturm-Liouville Typ, für die wir Lösungen finden wollen, welche endlich, stetig und im gesamten Intervall (−∞, +∞) differenzierbar sind. Falls solch eine Lösung existiert, sind alle Vielfachen dieser Lösung ebenso Lösungen. Wir werden keine zwei Lösungen als verschieden betrachten, sofern sie sich nur um einen konstanten multiplikativen Faktor unterscheiden. Falls zwei linear unabhängige Lösungen (zum gleichen Eigenwert ε) akzeptable Lösungen sind, ist ebenso jedwede Linearkombination der beiden eine Lösung. Ein solcher Eigenwert wird als entartet bezeichnet. Der Entartungsgrad ist als die Anzahl der linear unabhängigen Eigenfunktionen zum gleichen Eigenwert definiert. 80 Glg. (6.5) ist reell (sofern U (x) eine reelle Funktion von x ist). Falls φ(x) eine Eigenfunktion ist, gilt in diesem Fall, dass auch deren Real- und Imaginärteil Eigenfunktionen sind (die beiden sind notwendigerweise Vielfache voneinander, falls die Eigenfunktion nicht entartet ist). Daher ist es ausreichend, die reellen Eigenfunktionen zu bestimmen, um alle Eigenfunktionen zu einem bestimmten Eigenwert konstruieren zu können. Dieser Umstand vereinfacht die Rechnungen deutlich. 6.2 Freies Teilchen Wir wollen zunächst den Fall eines freien Teilchens betrachten, für das V (x) = 0 gilt. Dann lautet die Schrödingergleichung (ε = 2mE/~2 wie in Glg. (6.4) definiert) φ00 (x) + εφ(x) = 0. (6.6) Wir haben diesen Fall bereits auf Übungsblatt 5 betrachtet und gelöst. Die Glg. (6.6) hat zwei linear unabhängige Lösungen, √ √ φE− (x) = B exp −i εx . (6.7) φE+ (x) = A exp +i εx , Für E < 0 (daher auch ε < 0) divergieren beide Lösungen exponentiell – die erste (φE+ (x)) für x → −∞ und die zweite (φE− (x)) für x → +∞ und können daher weder eigentliche b keine Punkte noch uneigentliche Eigenfunktionen sein. Daher gibt es im Spektrum von H auf der negativen reellen Achse. Für E > 0 ist es praktisch r r p √ 2mE 2m p2 = ±~ = ± p2 (6.8) p = ±~ ε = ±~ ~2 ~2 2m zu definieren und φE+ (x) sowie φE− (x) können zusammen als i ϕp (x) = Ap exp px , ~ (6.9) wobei −∞ < p < +∞ ist. Die Funktion ϕp (x) gehört nicht zu L2 (R) und stellt für jedes p ∈ (−∞, +∞) eine uneigentliche Eigenfunktion des Impulsoperators dar. Das Spektrum b ist rein kontinuierlich und stimmt mit dem Intervall 0 < E < +∞ überein. Es ist von H leicht zu sehen, dass die Energieeigenwerte zweifach entartet sind, d.h. dass es zwei Werte +p und −p für jeden Wert E gibt. Eine normierte Eigenfunktion ist durch 1 exp ϕp (x) = √ 2π~ i px ~ (6.10) definiert. Wir bestätigen dafür die Orthonormalitätsrelation (vgl. Übung 4.2): 0 p−p Z+l i 0 i 1 sin ~ l 1 hϕp0 | ϕp i = lim dx exp − p x exp px = lim = δ(p − p0 ). l→∞ π 2π~ l→∞ ~ ~ p − p0 −l (6.11) 81 Wie wir bereits in den Abschnitten 3.3 und 4.6 gesehen haben, ist die allgemeine Lösung der Schrödingergleichung in Glg. (6.6) ein Wellenpaket, 1 ψ(x, t) = √ 2π~ Z+∞ i ~2 ε dp c(p) exp px − t , ~ 2m (6.12) −∞ dessen Koeffizienten c(p) durch die Anfangsbedingung ψ(x, 0) = ψ0 (x) (6.13) so bestimmt werden, dass für c(p) 1 c(p) = hϕp | ψ0 i = √ 2π~ Z+∞ i dx exp − px ψ0 (x) ~ (6.14) −∞ gilt. In Übung 3.2 haben wir bereits Glg. (6.12) mit der Gauß’schen Anfangsbedingung 2 r a a i 2 ψ0 (x) = √ exp − (x − x0 ) + p0 (x − x0 ) (6.15) 2 ~ π betrachtet. Wir haben für das Gauß’sche Wellenpaket die Varianz zur Anfangszeit, v v u Z+∞ u Z+∞ u u a u u 2 h∆b xi0 = t dx (x − x0 )2 |ψ0 (x)| = t √ dx (x − x0 )2 exp [−a2 (x − x0 )2 ] π −∞ −∞ v u Z+∞ u 1 ∂ u 1 dx exp [−a2 (x − x0 )2 ] = √ , = t √ (− ) 2 π ∂a a 2 (6.16) −∞ und den Koeffizienten c(p), s c(p) = 1 i 1 2 √ exp − 2 2 (p − p0 ) − px0 , 2~ a ~ ~a π (6.17) berechnet. Wir haben den Mittelwert von x zur Zeit t bestimmt, hb xit = x0 + (p0 /m) t, und die Varianz des Orts h∆b xit zur gegebenen Zeit t, v u Z+∞ r u 1 ~ 2 a4 u 2 h∆b xit = t dx (x − hb xit )2 |ψ(x, t)| = √ 1 + 2 t2 (6.18) m a 2 −∞ berechnet. Wir haben auch die Varianz des Impulses berechnet, v u Z+∞ u a~ u h∆b pit = t dp (p − p0 )2 |ψ(x, t)|2 = √ 2 −∞ 82 (6.19) und die Beziehung ~ h∆b xit h∆b pit = 2 bewiesen, so dass in der Tat r 1+ ~2 a4 2 ~ t ≥ m2 2 (6.20) ~ (6.21) 2 gilt. Wir haben ebenso in einer anderen Übungsaufgabe gezeigt, dass das Gleichheitszeichen in Glg. (6.21) nur dann gilt, falls das Wellenpaket zur Zeit t von der Form Glg. (6.15) ist, d.h. Gauß’sch ist. Daher haben Gauß’sche Wellenpakete minimale Unschärfe. In der Tat gilt exakt ~ h∆b xi0 h∆b pi0 = , (6.22) 2 da ψ0 (x) ein Gauß’sches Wellenpaket ist. h∆b xit h∆b pit ≥ Schließlich bemerken wir, dass das Teilchen als Klassisches Teilchen beschrieben werden kann, falls unter den gegebenen experimentellen Bedingungen h∆xit klein gegenüber der Genauigkeit der Ortsmessung ist. Insbesondere muss h∆xit klein bleiben im Vergleich zu der Distanz, die das Teilchen zurücklegt, d.h. es sollte h∆b xit p0 t m (6.23) gelten. Unter Verwendung der Varianz bzw. von h∆b xit finden wir für große Werte von t s 2 h∆b pit pit t→∞ h∆b 2 t2 → h∆b xit = h∆b xi0 + t. (6.24) m m Darum ist Glg. (6.23) äquivalent zu h∆b pit p0 und es gilt h∆b xi t ≥ 1 1 ~ 1~ = λde Broglie . 2 h∆b pit 2 p 0 4π (6.25) Wir sehen daher, dass die Bedingung für die Klassische Beschreibung eines Teilchens ist, dass die Genauigkeit von dessen Ortsmessung deutlich geringer ist als dessen de Broglie Wellenlänge λde Broglie . 6.3 6.3.1 Potentialtopf Allgemeine Bemerkungen Damit typische Quanteneffekte auftreten können, muss das Potential auf Distanzen von der Größenordnung der Wellenlänge eine ausreichend starke relative Veränderung zeigen. Der einfachste Typ von Potential, das diese Bedingungen erfüllt, ist das Kastenpotential: dieses Potential besitzt Diskontinuitäten erster Art (d.h. endliche Sprungstellen) an bestimmten Punkten und ist überall sonst konstant. Die Existenz von Diskontinuitäten der ersten Art im Potential U (x) ändert die an φ(x) gestellten Regularitätsbedingungen nicht. In der Tat gilt, aufgrund der Schrödingergleichung, φ00 (x) = (U (x) − ε)φ(x), 83 (6.26) dass bei jeder Diskontinuität des Potentials U (x) die zweite Ableitung der Wellenfunktion, φ00 (x), einen Sprung um einen endlichen Wert haben muss, aber das Integral von φ00 (x) an diesen Punkten kontinuierlich bleibt: daher sind φ0 (x) und erst recht φ(x) überall stetige Funktionen. Nun wollen wir annehmen, Ui sei der konstante Wert von U (x) im iten Intervall (i = 1, 2, . . . , n). Die allgemeine Lösung in dieser Region ist eine Linearkombination von Exponentialfunktionen, und ihr Verhalten ist tatsächlich sehr unterschiedlich, je nachdem, ob ε−Ui positiv oder negativ ist. Einerseits gilt für ε > Ui , dass es sich um eine Kombination von komplexen Exponentialfunktionen handelt, p (6.27) eiki x und e−iki x (ki = ε − Ui ), oder – in einer anderen Darstellung – um eine Kombination von Sinus- und Cosinusfunktionen: diese Lösung besitzt ein oszillatorisches Verhalten. Andererseits gilt für ε < Ui , dass es sich um eine Kombination von reellen Exponentialfunktionen handelt, p (6.28) e+κi x und e−κi x (κi = Ui − ε). In diesem Fall sagen wir, dass die Lösung exponentielles Verhalten besitzt. Um eine allgemeine Lösung der DGL zu erhalten, schreibt man diese in Form einer Linearkombination von (komplexen oder reellen) Exponentialfunktionen für jedes einzelne der n Intervalle in denen das Potential konstant ist. Die Parameter dieser Kombinationen (2n Parameter) werden durch Stetigkeitsbedingungen an die Funktion und an deren (erste) Ableitung fixiert. Diese Prozedur liefert 2(n − 1) Bedingungen, da n − 1 Diskontinuitäten vorliegen. Daher besitzt die derart erhaltene allgemeine Lösung zwei freie Parameter, wie zu erwarten war. Die Lösung muss, um eine geeignete Eigenfunktion zu sein, überall begrenzt sein, d.h. für die Grenzfälle x → ±∞ beschränkt sein. Wir merken an, dass, falls die Energie kleiner als das Potential über das gesamte Intervall (∞, +∞) ist, die allgemeine Lösung überall exponentielles Verhalten zeigen muss, und die zweite Ableitung immer das gleiche Vorzeichen wie die Funktion selbst hat. Daher kann man schließen, dass eine solche Funktion bei einem oder auch beiden Grenzfällen x → ±∞ exponentiell anwächst. Daher hat das Eigenwertproblem in diesem Fall keine Lösung. Ebenso ist in der Klassischen Mechanik keine Bewegung möglich, wenn die Energie das Potential nicht in irgendeinem Teil des Intervalls überschreitet. Wenn ε zumindest eine der Größen Ui überschreitet, hängt die Existenz und Anzahl der Eigenfunktionen wesentlich vom exponentiellen oder oszillatorischen Verhalten der allgemeinen Lösung an den zwei Extremwerten der x Achse (±∞) ab. 6.3.2 Unendlich tiefer Potentialtopf Wir beginnen die konkreten Betrachtungen mit einem unendlich tiefen Potentialtopf, dargestellt durch ein Potential V (x), vgl. Abb. D.23, so dass 0 für x ∈ [0, L] . (6.29) V (x) = ∞ sonst Dies bedeutet, dass das Teilchen auf eine bestimmte Region zwischen x = 0 und x = L beschränkt ist. Innerhalb dieser erlaubten Region kann es sich zwar frei bewegen, aber 84 diese kann nicht verlassen werden. Daher muss die Wellenfunktion außerhalb der erlaubten Region verschwinden, φ(x) = 0 für x 6∈ [0, L]. (6.30) Aufgrund der Stetigkeit der Wellenfunktion muss diese an den Randpunkten des erlaubten Intervalls verschwinden, φ(0) = φ(L) = 0. (6.31) Die einzige Region, in der das Teilchen sein kann, ist innerhalb des Potentialtopfs, wo es sich wie ein freies Teilchen verhält, d.h. es spürt keinerlei Potential. Daher müssen wir die zeitunabhängige Schrödingergleichung, φ00 (x) = −εφ(x) (6.32) mit den Randbedingungen von Glg. (6.31) lösen. Unter Verwendung der Abkürzung k= √ ε= 1√ 2mE ~ (6.33) vgl. Glg. (6.27), schreiben wir als allgemeine Lösung dieser Gleichung φ(x) = a sin(kx) + b cos(kx). (6.34) Hierbei sind a und b zwei Konstanten, die durch die Randbedingungen bestimmt werden. Ausgehend von der Randbedingung φ(0) = 0 gilt 0 = φ(0) = a sin(0) + b cos(0) = b ⇒ b=0 (6.35) und ausgehend von der Randbedingung φ(L) = 0 gilt 0 = φ(L) = a sin(kL) ⇒ kL = nπ ⇔ k= nπ , L (6.36) wobei n = 1, 2, 3, . . . eine beliebige natürliche Zahl ist. Durch Einsetzen der Randbedingung in Glg. (6.33) finden wir die Quantisierung der Energieniveaus. Wenn wir die verschiedenen Energieniveaus mit n indizieren, finden wir nπ 2 εn = L bzw. En = n2 π 2 ~2 . 2mL2 (6.37) Schließlich bestimmen wir die Konstante a aus der Normierungsbedingung der Wellenfunktion, ! ZL 2 2 ZL dx |φ(x)| = |a| 1= 0 x L sin2 nπ = |a|2 L 2 ⇒ |a|2 = 2 . L (6.38) 0 Daher sind die Bindungszustände des unendlich tiefen Potentialtopfs durch r nπ 2 φn (x) = sin x L L (6.39) gegeben, und diese stellen eine ONEB dar. Den niedrigsten Bindungszustand, n = 1, bezeichnen wir als den Grundzustand, die Zustände zu n > 1 als angeregte Zustände. 85 6.4 Endlicher Potenialtopf Wir betrachten nun ein ähnliches Problem wie im vorigen Abschnitt, aber mit der Änderung, dass die Wände des Potentialtopfs nicht mehr unendlich hoch sind, d.h. ein Potential wie in Abb. D.27. In der Klassischen Mechanik ist ein Teilchen der Energie E 40 mit −V0 < E < 0 in diesem Potentialtopf eingeschlossen und kann p diesen nicht verlassen. Sein Impuls in diesem √ Bindungszustand ist p = ± 2mEkin = ± 2m(V0 + E). Für größere Energien, d.h. E > 0 kann sich das Teilchen zunächst außerhalb des Potentialtops befinden und hat einen √ eindringt, wächst Impuls von p = ± p2mE. Wenn das Teilchen in den Potentialtopf √ dessen Impuls auf ± 2m(V0 + E) an und fällt wieder zu p = ± 2mE ab, wenn es den Potentialtopf verlässt. Eine Klassische Lösung zu E < −V0 existiert nicht. b im Bereich (−∞, −V0 ) In der QM gibt es ebenso keinerlei Punkte im Spektrum von H in Übereinstimmung mit der Klassischen Erwartung. Im Intervall (−V0 , 0) findet man bei diskreten Energien nur eine endliche Zahl eigentlicher Eigenwerte, deren Eigenfunktionen außerhalb des Klassisch erlaubten Bereichs rasch zu Null abfallen. Schließlich gibt es im Intervall (0, +∞) das kontinuierliche Spektrum, dass aufgrund der Symmetrie zweifach entartet ist (beide Vorzeichen des Impulses). Dass die Energie dabei jeden möglichen Wert annehmen kann, spiegelt die offensichtliche Tatsache wider, dass ein Experimentator die Energie bzw. den Impuls eines eingeschossenen Teilchen beliebig wählen kann. Im Gegensatz zum Klassischen Fall erlaubt die QM aber auch in diesem Fall eine Reflexion des Teilchens am Potentialtopf. Klassisch ist das Teilchen nach wie vor in der Box eingesperrt, falls seine kinetische Energie geringer ist als die Höhe der Potentialwände, d.h. die Wahrscheinlichkeit, es außerhalb der Box zu finden, ist Null. Wir werden nun explizit berechnen, inwiefern es sich in der QM damit anders verhält. Auch hier ist unser Ausgangspunkt wieder die zeitunabhängige Schrödingergleichung, vgl. Glg. (6.5), wobei wir nun das folgende Potential V (x) im Hamiltonoperator verwenden, −V0 for |x| ≤ L V (x) = . (6.41) 0 for |x| > L Wir betrachten nun Energieeigenwerte in zwei Intervallen, 0 > E > −V0 und E > 0, wobei erstere den Bindungszuständen und letztere den Streuzuständen entsprechen. Wir teilen das Problem in drei verschiedene Regionen I, II und III entlang der x Achse auf. 40 Die Wahl des Energienullpunktes ist beliebig, (d.h. V0 + E > 0) beschreibt ein Teilchen mit der kinetischen Energie D E pb2 b Ekin = = V0 + E ≥ 0. (6.40) 2m Die Notation mit negativen Energien ist zugegebenermaßen nicht sehr intuitiv, aber in hohem Maße verbreitet. 86 6.4.1 Bindungszustände (diskretes Spektrum, −V0 < E < 0) Region I: x < −L, V (x) = 0 Hier gilt die freie Schrödingergleichung, φ00 (x) = −εφ(x), was wir durch Substitution κ = ist, gilt κ > 0 und wir finden √ (6.42) −ε umschreiben, vgl. Glg. (6.28). Da E < 0 (und ε < 0) φ00 (x) = κ2 φ(x). (6.43) Wie zuvor besprochen, vgl. Glg. (6.28), ist die zugehörige Lösung φI (x) = Ae−κx + Be+κx , (6.44) wobei A und B noch zu bestimmende Konstanten sind. Da wir in der Region x < −L < 0 sind, würde der Exponent des ersten Terms für x → −∞ unbegrenzt anwachsen. Um die Normierbarkeit der Wellenfunktion zu gewährleisten, müssen wir fordern, dass A identisch zu Null ist. Daher lautet die Lösung in der Region I φI (x) = Beκx . (6.45) Region II: −L ≤ x ≤ +L, V (x) = −V0 In dieser Region wirkt das Potential, und die Schrödingergleichung lautet φII 00 (x) = (U (x) − ε)φII (x), (6.46) p p was wiederum durch Substitution k = ε − U (x) = ~−1 2m(V0 + E) umgeschrieben wird, vgl. Glg. (6.27). Da E > −V0 (d.h. V0 + E > 0) ist k > 0 und wir finden φII 00 (x) = −k 2 φII (x) (6.47) φII (x) = C̄e−ikx + D̄e+ikx = C sin(kx) + D cos(kx). (6.48) mit der allgemeinen Lösung Auch in diesem Fall sind C = i(D̄ − C̄) und D = C̄ + D̄ später noch zu bestimmende Konstanten. Region III: x > L, V (x) = 0 Hier liegt ein zu Region I gleich gelagerter Fall vor, d.h. es gilt Glg. (6.43) und die Lösung lautet φIII (x) = F e−κx + Ge+κx . (6.49) Nun müssen wir aber, um die Normierbarkeit der Wellenfunktion zu gewährleisten, G = 0 fordern, da ansonsten der entsprechende Exponent für x → ∞ unbegrenzt anwachsen würde. Wir erhalten daher die Lösung φIII (x) = F e−κx . 87 (6.50) Zusammenfassung Die Lösung für 0 > E > −V0 über alle Regionen lautet Be+κx in Region I C sin(kx) + D cos(kx) in Region II φ(x) = F e−κx in Region III. (6.51) Die Konstanten B, C, D und F müssen nun noch durch Stetigkeitsbedigungen für φ(±L) und φ0 (±L) verknüpft werden. Wir bemerken, dass die Bewegung eines Klassischen Teilchens mit Energie 0 > E > −V0 strikt auf die Region II beschränkt ist. Nichtsdestotrotz kann ein quantenmechanisches Teilchen in die Klassisch verbotenen Bereiche I und III eindringen, d.h. die Wahrscheinlichkeitsdichte verschwindet nicht, |φ(x)|2 6= 0. Wie weit ein Teilchen in diese Regionen eindringen kann, hängt von dessen Energie ab. Das Teilchen kann eine Eindringtiefe von ca. δx ∝ ~ ~ 1 =p =p κ 2m |−E| 2m |V0 − hEkin i| (6.52) erreichen. Diese ist nimmt mit größeren Werten von hEkin i zu. Entsprechend gibt es eine Impuls-Unschärfe, welche ein Klassisches Teilchen benötigen würde, um die Potentialbarriere zu überwinden, p ~ = 2m |−E|. (6.53) ∆p ∝ ∆x An dieser Stelle könnte man nun die Randbedingungen aufstellen, φI (−L) =φII (−L), φ0I (−L) =φ0II (−L), φII (+L) =φIII (+L), φ0II (+L) =φ0III (+L) (6.54) (6.55) und die Stetigkeitsbedingungen in Matrixnotation schreiben, z.B. an der Grenze I zu II −ikL 0 e−κL A e e+ikL C̄ . (6.56) = i −ikL −i +ikL 0 κ1 e−κL D̄ B e e k k Man vereinfacht zu einer einzelnen Matrix und kann so schließlich mehrere Randbedingungen koppeln, indem man die Koeffizienten der dazwischenliegenden Intervalle eliminiert. Wir wollen hier jedoch eine einfachere Methode verwenden, und die Symmetrie des Problems ausnutzen. Indem wir uns an Glg. (5.151) erinnern, sehen wir, dass der Hamiltonoperator für das vorliegende symmetrische Potential V (x), vgl. Glg. (6.41) mit dem Paritätsoperator vertauscht. Daher können die Basiszustände derart gewählt werden, dass sie entweder nur aus geraden oder ungerade Funktionen bestehen. Diese Familien von geraden und ungeraden Lösungen bestimmen bezeichnen wir als φ(+) (x) und φ(−) (x). Diese sind durch I Be+κx −Be+κx I D cos(kx) II C sin(kx) II φ(+) (x) = φ(−) (x) = (6.57) −κx −κx Be III Be III 88 gegeben und in Abb. D.24 skizziert. An den Rändern des Potentialtopfs müssen die unterschiedlichen Lösungen in den verschiedenen Regionen kontinuierlich ineinander übergehen. Mathematisch bedeutet dies, dass die Wellenfunktion überall stetig differenzierbar sein muss, d.h., dass die Wellenfunktion und deren erste Ableitung an den Grenzen des Potentialtopfs x = ±L übereinstimmen müssen41 . Wir können diese beiden Forderungen in eine Aussage über die logarithmische Ableitung zusammenfassen: φ0 (x) ! d log φ(x) = = dx φ(x) Für gerade Lösungen bedeutet dies φ(+)0 (x) ! = stetig (+) φ (x) x→L stetig. −Bκe−κL −Dk sin(kL) = , D cos(kL) Be−κL ⇔ (6.58) (6.59) was nach Vereinfachung k tan(kL) = κ (6.60) ergibt. Nachdem man Glg. (6.60) einen Moment auf sich wirken lässt, erkennt man, dass dies eine transzendente Gleichung ist, d.h. nicht analytisch lösbar ist. Da κ und k von der Energie via 1p 1p 2m |−E|, k= 2m(V0 + E) (6.61) κ= ~ ~ abhängen, ist Glg. (6.60) eine Formel für die erlaubten Energieeigenwerte, und daher deren Quantisierungsbedingung. Die analoge Rechnung für ungerade Lösungen ergibt k cot(kL) = −κ. (6.62) Sie werden die graphische Lösung dieser Gleichungen sowie einige analytische Näherungen, die für bestimmte Grenzfälle erhalten werden können, auf Übungsblatt 8 untersuchen. Wir merken an, dass der eindimensionale Potentialtopf immer einen Bindungszustand hat. Dies ist für beliebige Dimensionen nicht automatisch der Fall. Insbesondere erlaubt die dreidimensionale Schrödingergleichung nicht automatisch einen Bindungszustand für ein solches Problem. Zwar kann man, wie Sie in späteren Kapiteln sehen werden, die dreidimensionale Schrödingergleichung durch Einführung von Kugelkoordinaten mittels eines Radius r umschreiben und damit auf ein eindimensionales Problem reduzieren, wobei der Radius r auf R+ 0 definiert ist im Gegensatz zu x ∈ R im eindimensionalen Fall. Weil man bei Separation des Radialteils einen zusätzlich Faktor 1/r erhält, muss die Wellenfunktion am Ursprung verschwinden sofern kein Delta-Potential vorliegt. Lösungen dieser Art können nur mit ungeraden Funktionen realisiert werden. Die Details hierzu werden Sie später noch sehen. Daher ist der Grundzustand des dreidimensionalen Potentialtopfs eine ungerade Wellenfunktion, vgl. Abb. D.25, welche dem ersten angeregten Zustand in unserem eindimensionalen Problem entspricht, und daher für zu kleine Werte der Energie nicht erzeugt werden kann. Wir wenden uns jetzt erneut den geraden und ungeraden Lösungen zu, vgl. Glg. (6.57), wo wir immer noch die Konstanten B, C und D bestimmen müssen. Wir verwenden zunächst Kontinuität bei x = L um die Anschlussbedingungen für den nten Zustand φ(+) (x) : Dn cos(kn L) = Bn e−κn L , φ(−) (x) : 41 Cn sin(kn L) = Bn e−κn L (6.63) Aufgrund der Symmetrie des Potentials sind die Intervallgrenzen bei x = +L und x = −L, d.h. zwischen den Regionen I und II bzw. II und III gleichwertig. Die Betrachtung einer Diskontinuität ist daher ausreichend. 89 zu erhalten. Inden wir die Normierungsbedingung einfordern, fixieren wir Bn als √ √ κn cos(kn L) +κn L κn sin(kn L) +κn L (+) (−) φ (x) : Bn = √ e , φ (x) : Bn = √ e , 1 + κn L 1 + κn L und damit dann letzten Endes die anderen beiden Koeffizienten, √ κn Cn = Dn = √ . 1 + κn L (6.64) (6.65) Physikalische Interpretation des endlichen Potentialtopfs Der endliche Potentialtopf findet Anwendung als Modell für freie Elektronen in Metallen und wird in der Festkörperphysik verwendet. Dort ist die Aufenthaltswahrscheinlichkeit der Elektronen über die Atome des metallischen Kristalls verteilt. Die Elektronen können sich innerhalb des Kristalls quasi-frei bewegen, aber sind durch eine Potentialbarriere gezwungen, darin zu bleiben. Daher ist in erster Näherung das endliche Kastenpotential ein gutes Modell für diese Situation. Diese Situation ist in Abb. D.26 skizziert. Dabei entspricht W der Austrittsarbeit, vgl. hierzu Abschnitt 2.2.2. 6.4.2 Streuzustände (Kontinuierliches Spektrum, E > 0) Wir werden nun die Schrödingergleichung mit dem Potential von Glg. (6.41) für positive Energien E > 0 betrachten. Wir nehmen an, dass eine anfängliche ebene Welle von x = −∞ auf des Potential zuläuft, und betrachten die möglichen Zustände, die nicht gebunden sind, sondern gestreut werden, d.h. durch das Potential transmittiert oder an dem Potential reflektiert werden, vgl. Abb. D.27. Sie werden die zugehörigen Koeffizienten A, B, C, D und F auf Übungsblatt 8 berechnen und mit diesen die Lösung Ae+ikx + Be−ikx in Region I C sin(qx) + D cos(qx) in Region II φ(x) = (6.66) +ikx Fe in Region III. finden. In der beschriebenen Situation stellt Ae+ikx eine einlaufende Welle und Be−ikx eine auslaufende (d.h. reflektierte) Welle in der Region I dar. In der Region IIIpwird F e+ikx als eine auslaufende (d.h. transmittierte) Welle verstanden. Hierbei ist ~q = 2m(E + V0 ) > √ ~k = 2mE > 0. Damit können wir die Reflexions- und Transmissionskoeffizienten bestimmen. Diese geben die Wahrscheinlichkeiten an, dass ein Teilchen, welches auf den Potentialtopf trifft, an dieser reflektiert oder durch diese transmittiert wird. Die Verhältnisse der Koeffizienten B und A bzw. F und A werden als Transmissions- und Reflexionsamplituden bezeichnet und sind ein Maß für die reflektierten und transmittierten Anteile der Welle. Nach einigen Umformungen finden wir τ= F e−2ikL = q i k A cos(2qL) − 2 q + k sin(2qL) 90 (6.67) ρ= e−2ikL 2i q k k q − sin(2qL) B = A cos(2qL) − 2i kq + kq sin(2qL) (6.68) und bestimmen damit den Transmissionskoeffizienten T (E), 1 T (E) = |τ |2 = 1+ V02 sin2 (2qL) 4E(E+V0 ) (6.69) und den Reflexionskoeffizienten R(E) R(E) = |ρ|2 = V02 sin2 (2qL) 4E(E+V0 ) 1+ V02 sin2 (2qL) 4E(E+V0 ) 6= 0. (6.70) Da alle nicht reflektierten Teilchen offensichtlich transmittiert werden müssen, ergibt sich zwangsläufig R(E) + T (E) = 1, (6.71) was sich nach Einsetzen der vorigen Ergebnisse in der Tat zeigt. Bei Betrachtung des Reflexions- oder Transmissionskoeffizienten sieht man leicht, dass die Sinusfunktion für bestimmte Argumente verschwindet und daher die Transmissionswahrscheinlichkeit für bestimmte Energien En gleich eins ist, T (En ) = 1, vgl. Abb. D.28. Eine derartige Beobachtung wurde bereits im Jahre 1920 vor der Formulierung der Quantenmechanik gemacht. C. Ramsauer beobachtete, dass Edelgase für niederenergetische Elektronen eine unerwartet hohe Durchlässigkeit besitzen. Der Streuwirkungsquerschnit hängt auf höchst nicht-klassische Weise von der kinetischen Energie ab und zeigt ausgeprägte Minima, die teilweise deutlich unterhalb des Klassisch berechneten gaskinetischen Wirkungsquerschnitts liegen. Dieser Effekt wird nach seine Entdeckern als RamsauerTownsend Effekt bezeichnet. Um die entsprechenden Energien En zu finden, betrachten wir die Nullstellen des Sinus und finden die folgende Bedingung, ⇒ sin(2qn L) = 0 2L p 2m(En + V0 ) = nπ, ~ (6.72) wobei n ∈ N die Energien En bezeichnet. Diese Streuzustände werden als Resonanzen bezeichnet. Wir erhalten daher für die Positionen der Resonanzen eines endlichen Potentialtopfs innerhalb des kontinuierlichen Spektrums die diskreten Werte En = n2 π 2 ~2 − V0 . 2m(2L)2 (6.73) Für diese Energien ist das Potential transparent. Diese Resonanzbedingungen stimmen interessanterweise genau mit den erlaubten Energiewerten eines unendlich tiefen Potentialtopfs überein (bis auf die additive Konstante −V0 ). Entsprechend findet man Minima der Transmission unter der Bedingung sin(2qn L) = ±1 ⇒ 2L p π 2m(En + V0 ) = (2n + 1) . ~ 2 91 (6.74) 6.5 6.5.1 Tunneleffekt an der Potentialschwelle Endliche Potentialbarriere (V0 > E) Der sogenannte Tunneleffekt in der QM kann vom Spezialfall eines Potentialtopfs abgeleitet werden, indem man −V0 zu +V0 ändert und damit eine Potentialbarriere erzeugt, +V0 for |x| ≤ L V (x) = . (6.75) 0 for |x| > L vgl. Abb. D.29. Klassisch könnte ein Teilchen mit niedrigerer Energie als die Potentialbarriere diese niemals durchqueren und würde immer reflektiert. Da jedoch in der QM die Wellenfunktion aufgrund der Stetigkeitsbedingungen in der Klassisch verbotenen Region II exponentiell abfällt, verschwindet die Wahrscheinlichkeitsdichte in der Region III nicht. Dies erlaubt dem Teilchen, die Barriere zu passieren. In Analogie zu einen Tunnel durch einen Berg spricht man daher vom Tunneleffekt. Mathematisch können wir die Streulösungen des endlichen Potentialtopfs, vgl. Glg. (6.66), verwenden, wenn wir dabei −V0 durch +V0 in der Region II ersetzen, Ae+ikx + Be−ikx in Region I Ce−qx + De+qx in Region II , φ(x) = (6.76) +ikx Fe in Region III wobei die “Impulse” durch k= 1√ 2mE ~ und q= 1p 2m(V0 − E) ~ (6.77) gegeben sind. Da die Lösung in der Region II nicht mehr komplex ist, können wir die Sinus- und Cosinusfunktionen des vorigen Abschnitts durch ihre hyperbolischen Gegenparts ersetzen42 , sin[2qL] → sinh[2qL], cos[2qL] → cosh[2qL] und (6.78) und anschließend die fehlenden Konstanten mittels der Anschlussbedingungen fixieren. Diese Rechnung wird hier nicht wiederholt. 6.5.2 Transmissionskoeffizient beim Tunneleffekt Wir erhalten für die Transmissionsamplitude τ= e−2ikL 2 (6.79) 2 −k cosh[2qL] − i q 2kq sinh[2qL] bzw. unter Verwendung von cosh2 [x] − sinh2 [x] = 1, den Transmissionskoeffizienten T (E) = τ 2 = 1 1+ (k2 +q 2 )2 4k2 q 2 2 sinh [2qL] 42 1 = 1+ sinh2 [2qL] 4E(V0 −E) V02 6= 0. (6.80) Ganz nonchalant übergehen wir hier das Auftreten des Faktors i. Es ist einfach, dies in einem stillen Moment selbst auszuarbeiten. 92 Unter der Bedingung qL 1, die zumeist eine gute Näherung ist43 , gilt approximativ 2 sinh[2qL] ≈ exp [2qL] und wir nähern den Bruch durch T (E) ≈ 16E(V0 − E) 1 ≈ exp [−4qL]. 4qL 2 V02 e V0 1+ 4E(V0 − E) 4 | {z } (6.81) 1 Wir exponenzieren den Vorfaktor mittels x = exp [log x] und erhalten den gesamten Transmissionskoeffizient als Exponentialfunktion, Lp 16E(V0 − E) . (6.82) T (E) ≈ exp −4 2m(V0 − E) + log ~ V02 Da wir vorausgesetzt haben, dass qL wesentlich größer als eins ist und der Logarithmus nur sehr langsam wächst, schlussfolgern wir, dass der erste Term im Exponenten ein deutlich größeres Gewicht hat als der zweite, welchen wir daraufhin vernachlässigen. Wir erhalten Lp T (E) ≈ exp −4 2m(V0 − E) . (6.83) ~ was eine gute Näherung für die Transmissionswahrscheinlichkeit einer einzelnen Potentialschwelle ist, die in einem bestimmten Intervall konstant ist und außerhalb verschwindet. Dieses Potential ist eine recht krude Näherung von realen Potentialen, die im Allgemeinen wesentlich komplizierter sind. Um diese Bedenken zu berücksichtigen, verallgemeinern wir den Transmissionskoeffizienten zu dem sogenannten Gamow Faktor, indem wir ein gegebenes Potential in infinitesimal breite Potentialstufen mit konstanten Werten unterteilen, und diese über ein sinnvolles Intervall [x1 , x2 ] integrieren, innerhalb dessen das Potential überhalb eines bestimmten Wertes liegt, vgl. Abb. D.30 Damit erhalten wir Zx2 p 2 dx 2m(V (x) − E), . (6.84) T (E) ≈ exp − ~ x1 6.5.3 Physikalische Beispiele für den Tunneleffekt Hier sprechen wir kurz einige physikalisch besonders relevante Beispiele für den Tunneleffekt an. α-Zerfall In der Kernphysik spielt der Tunneleffekt eine wesentliche Rolle beim α-Zerfall. Innerhalb des Kerns können zwei Protonen und zwei Neutronen sich zu einem α-Teilchen (einem 4 He Kern) formieren, welcher dank der bei der Bindung gewonnene Energie durch die Coulomb-Barriere tunneln kann, vgl. Abb. D.31. Beispielsweise lautet die Reaktionsgleichung für den α Zerfall für das Polonium-Isotop 212 Po 212 Po → 208 Pb + α, 43 (6.85) Die zugrunde liegende Tatsache ist, dass Potentialbarrieren üblicherweise (am höchsten Punkt) sehr viel höher als die Energie sind. Daher ist q sehr groß. 93 d.h. dabei entsteht das Blei-Isotop 208 Pb und ein freier 4 He Kern. Kernfusion Kernfusion ist im Wesentlichen die Umkehr eines Kernzerfalls, vgl. Abb. D.31. Hierbei werden im allgemeinen Kerne mit positiver Kernladung fusioniert, so dass diese die gegenseitige Coulomb-Abstoßung überwinden müssen. Zwar könnte man diese CoulombBarriere nun einfach durch höhere Einschussenergie überwinden, aber dann wäre der neu gebildete, gebundene Zustand hoch angeregt und nur von kurzer Lebensdauer. Daher schießt man Kerne bei Energien unterhalb der Potentialbarriere ein und lässt diese durch den Tunneleffekt in den Targetkern eindringen. Die Überwindung der Coulomb-Barriere ist natürlich stark unterdrückt und findet nur bei sehr hohen Teilchendichten und Temperaturen mit einer signifikanten Rate statt. Diese Unterdrückung ist von essentieller Bedeutung für die lange Lebensdauer von Sternen. Kalte Emission Elektronen können bei sehr niedrigen Temperaturen selbst ohne einfallendes Licht aus Metallen emittiert werden, falls ein äußeres elektrisches Feld anliegt. Unter der Annahme, dass die Elektronen eine sehr niedrige Energie im Vergleich zur Potentialbarriere haben, ist es nicht sehr wahrscheinlich, dass ein Elektron durch die Barriere tunneln kann. Indem man die externe elektrische Feldstärke erhöht, wächst die verfügbare Energie des Elektrons, der Transmissionskoeffizient nimmt zu und Emission von Elektronen kann beobachtet werden. Tunneln zwischen Leitern Wenn zwei elektrische Leiter durch eine dünne Schicht eines Isolators getrennt sind, gestattet der Tunneleffekt den Elektronen durch diese Barriere zu tunneln und auf diese Art und Weise einen Strom zu erzeugen. Dieser Effekt wir auch bei supraleitenden Materialien beobachtet und dort als Josephson Effekt bezeichnet. 94 7 Harmonischer Oszillator In diesem Kapitel werden wir den harmonischen Oszillator betrachten. Das Potential des harmonischen Oszillators lautet mω 2 2 V (x) = x, (7.1) 2 d.h. es ist das einfachste mögliche Potential, das ein isoliertes Minimum und keinerlei Unstetigkeiten besitzt. Beim harmonischen Oszillator sind die Korrespondenzen zwischen Klassischer und quantenmechanischer Beschreibung besonders transparent. Der harmonische Oszillator ist eines der wichtigsten Probleme in der Physik, da sich viele kompliziertere Probleme in diversen Grenzfällen durch einen harmonischen Oszillator approximieren lassen. Beispielsweise kann jede Funktion, die ein Minimum besitzt und in dessen Umgebung stetig ist, für kleine Abweichungen von diesem Minimum durch eine Parabel angenähert werden. Darüber hinaus ist ein Verständnis der quantenmechanischen Eigenschaften der Oszillatormoden eine wesentliche Grundlage der zweiten Quantisierung und der Quantenfeldtheorie (QFT). Eine wesentliche Besonderheit des harmonischen Oszillators in der QM ist, dass er mittels zweier verschiedener Methoden exakt lösbar ist. Jede einzelne dieser Methoden findet auch in anderen, schwierigeren Problemen Anwendung. Die erste dieser Methoden – die algebraische Methode – wird uns zum Konzept der Leiteroperatoren und zu den Besetzungszahlen führen. Später werden wir ein konzeptionell sehr ähnliches Vorgehen für den Drehimpuls in der QM verwenden. Die zweite dieser Methoden – die analytische Methode – wird uns explizit das System der Eigenfunktionen liefern, die wir mit einer Potenzreihenentwicklung mit Abbruchbedingung erhalten. Letztere Methode wird Ihnen beim Wasserstoffatom erneut begegnen. Desweiteren können wir am harmonischen Oszillator einen ersten Blick auf die Konzepte des Fock-Raums und der Besetzungszahldarstellung werfen. Dieser Abschnitt wird durch einen knappen Exkurs zu kohärenten Zuständen beendet, bei denen sich die Korrespondenz zwischen Klassischer und quantenmechanischer Beschreibung besonders schön zeigen lässt. 7.1 7.1.1 Algebraische Methode Leiteroperatoren Wir beginnen mit der eindimensionalen zeitunabhängigen Schrödingergleichung, in welcher wir den Hamiltonoperator des harmonischen Oszillators mω 2 2 ~2 d2 2 b Hφ(x) = pb + V (b x) φ(x) = − + x φ(x) = Eφ(x) (7.2) 2m dx2 2 einsetzen. Wir erkennen, dass es sich bei der Kombination der Konstanten r ~ x0 = mω 95 (7.3) um eine für den harmonischen Oszillator natürliche Längenskala44 handelt und schreiben damit die Schrödingergleichung als 2 2 ! ~ω d x b Hφ(x) = ix0 + φ(x) = Eφ(x) (7.4) 2 dx x0 um. Der Ausdruck in Klammern ist eine Summe von inkompatiblen Operatoren, die wir nun vereinfachen wollen. Es gilt 2 2 d x d d x x − x0 + x0 + 1. (7.5) ix0 + = dx x0 x0 dx x0 dx Darum bietet es sich an, zwei sogenannte Leiteroperatoren b a und b a† einzuführen: b a := b a† := √1 2 √1 2 x x0 x x0 d + x0 dx = d − x0 dx = √ 1 2mω~ √ 1 2mω~ (mωb x + ib p) Vernichter (mωb x − ib p) Erzeuger. (7.6) Diese Operatoren werden auch als Aufsteigeoperatoren (Erzeuger) und Absteigeoperatoren (Vernichter) bezeichnet. Die Begriffsbildung wird im Folgenden klar werden. Man sieht leicht, dass sich Orts- und Impulsoperatoren durch die Erzeuger und Vernichter ausdrücken lassen, √ √ −i~ 2mω~ 2mω~ x0 † † † b a+b a , pb = √ b a−b a† . x b= √ b a+b a = b a−b a = −i 2mω 2 2 2x0 (7.7) Wir bestimmen die Vertauschungsrelationen der Leiteroperatoren. Zunächst berechnen wir ! 2 2 x d 1 − x0 +1 (7.8) b ab a† = 2 x0 dx ! 2 2 1 x d b a† b a= − x0 −1 (7.9) 2 x0 dx und finden daher die Vertauschungsrelationen [b a, b a] = [b a† , b a† ] = 0, [b a, b a† ] = 1. (7.10) Nun können wir mittels der Leiteroperatoren den Hamiltonoperator vereinfachen, 2 2 ! ~ω d x ~ω 1 † † b ix0 + = 2b ab a + 1 = ~ω b ab a+ , (7.11) H= 2 dx x0 2 2 wie man unter Verwendung von Glgn. (7.5) und (7.6) leicht sieht. Daher lässt sich die Schrödingergleichung als E 1 † − φ(x) (7.12) b ab aφ(x) = ~ω 2 44 Die Bedeutung der natürlichen Längenskala wird im Folgenden noch klar werden. 96 schreiben. Wir wollen nun dem Operator b a†b a eine Interpretation als Besetzungszahloperator geben, b =b N a†b a Besetzungszahloperator. (7.13) b die Vertauschungsrelationen Es ist einfach zu zeigen, dass N b, b [N a† ] = b a† , b, b [N a] = −b a, (7.14) b auch als den Anzahloperator. erfüllt. Man bezeichnet N 7.1.2 Spektrum b (und damit auch von H) b mit dem Index n und Wir bezeichnen die Eigenwerte von N werden nun die zugehörigen Eigenfunktionen φn (x) bestimmen, b φn (x) = nφn (x). N (7.15) Wir bilden dazu ein Skalarprodukt und schreiben dies als Norm um, D E b φn = φn b a† b aφn = hb n kφn k2 = n hφn | φn i = φn N aφn | b aφn i = kb aφn k2 ≥ 0. (7.16) | {z } >0 Zunächst einmal verstehen wir, dass die Eigenwerte n nicht-negativ sind, d.h. es gilt n ≥ 0. Selbstverständlich gilt Gleichheit nur, falls der Vektor b aφn der Nullvektor ist. Dann muss der Eigenwert n ebenfalls verschwinden. Also ist n = 0 der niedrigste mögliche Eigenwert (Grundzustand, Vakuum): n=0 ⇒ b aφ0 = 0. (7.17) Der Grundzustand (n = 0) wird also durch den Operator b a vernichtet. Durch Einsetzen von Glg. (7.6) in Glg. (7.17) finden wir x d 1 + x0 0=b aφ0 (x) = √ φ0 (x), dx 2 x0 (7.18) was sich durch Separation der Variablen lösen lässt, Z Z dφ0 1 x2 = − 2 dx x ⇒ ln φ0 (x) = − + ln N , φ0 x0 2x0 2 (7.19) wobei N eine noch zu bestimmende Normierungskonstante ist. Die Grundzustandwellenfunktion lautet also x2 (7.20) ⇔ φ0 (x) = N exp − 2x0 2 und ist eine Gauß-Funktion, deren Normierung offensichtlich durch N2 = √ 1 πx0 2 bzw. 97 1 N = (πx0 2 )− 4 (7.21) √ gegeben ist. Daher verstehen wir direkt, dass x0 / 2 die Standardabweichung des Teilchenorts im Grundzustand ist45 . Wir bemerken, dass die Unschärferelation die Ursache für die nicht-verschwindende Standardabweichung des Ortes vom Minimum des Potentials ist. Wir werden im nächsten Abschnitt den Grundzustand noch detailliert betrachten und dieses Argument genauer verstehen. Wir wollen nun zeigen, dass Folgendes gilt: b zum Eigenwert n ist, so ist durch b • Falls φn eine Eigenfunktion von N a† φn eine b gegeben, die dem Eigenwert n + 1 zugeordnet ist. weitere Eigenfunktion von N b zum Eigenwert n ist, so ist durch b • Falls φn eine Eigenfunktion von N aφn eine b gegeben, die dem Eigenwert n − 1 zugeordnet ist. weitere Eigenfunktion von N Wir verwenden nun Glg. (7.14) um diese Behauptungen zu zeigen: b + 1)φn = b b a† φ n = b b +b a† ( N a† (n + 1)φn = (n + 1)b a† φn , Nb a† N a† φn = b (7.22) womit die erste Behauptung bewiesen ist. Die Norm des Zustands b a† φn ergibt * + D E † † b † b a φn b a φn = φn |{z} b ab a φn = φn (N +1)φn = (n + 1) hφn | φn i = (n + 1), (7.23) | {z } =ba† ba+1 =1 womit wir für einen normierten Zustand φn+1 √ b a† φn = n + 1 φn+1 (7.24) erhalten. Wir zeigen die zweite Behauptung, b aφn = b b −b b − 1)φn = b Nb aN a φn = b a(N a(n − 1)φn = (n − 1)b a† φn , (7.25) und bestimmen die Norm von b aφn durch E † D b hb aφn | b aφn i = φn b ab aφn = φn N φn = n hφn | φn i = n, | {z } (7.26) =1 so dass wir b aφn = √ n φn−1 (7.27) erhalten. Damit sind beide Behauptungen gezeigt. Wir sehen, dass man mittels der beiden Leiteroperatoren b a† und b a den Eigenwert n des Besetzungszahloperators in Schritten von ±1 ändern kann. Wir wissen auch, dass der Eigenwert des Grundzustands durch n = 0 gegeben ist. Daher gilt, dass n nur ganzzahlige, positive Werte annimmt. Von nicht ganzzahligen Werten könnte man zu n < 0 hin absteigen, was aufgrund von Widerspruch zu Glg. (7.16) verboten sein muss. Wir bemerken hier, dass die Ganzzahligkeit von n eine Quantisierungsbedingung für die Energie darstellt, 45 2 Machen Sie sich bewusst, dass die Wahrscheinlichkeitsdichte |φ0 (x)| ist, dann leuchtet es sofort ein. 98 vgl. Glg. (7.12). Daher können sämtliche möglichen Eigenzustände φm des harmonischen Oszillators durch sukzessive Anwendung der Leiteroperatoren b a und b a† auf einen beliebigen Eigenzustand φn erhalten werden. Zusammenfassung Die zeitunabhängige Schrödingergleichung für den harmonischen Oszillator führt zur Eigenwertgleichung 1 1 b n (x) = ~ω N b+ φn (x) = ~ω n + φn (x). (7.28) En φn (x) = Hφ 2 2 Die Energieeigenwerte sind äquidistant und durch die Quantenzahl n ∈ N0 bestimmt, 1 En = ~ω n + , (7.29) 2 und können durch Anwendung der Leiteroperatoren b a† und b a in Schritten von ±~ω erhöht oder abgesenkt werden46 . Insbesondere ist E0 = ~ω/2, d.h. die Energie des Grundzustands ist von Null verschieden. Die Energieeigenfunktionen sind durch 1 x2 1 2 − 41 † n † n a ) φ0 (x) = √ (πx0 ) (b a ) exp − (7.30) φn (x) = √ (b 2x0 2 n! n! p gegeben, wobei x0 = ~/(mω) die natürliche Längenskala des harmonischen Oszillators ist. Die Grundzustandswellenfunktion ist eine Gauß-Funktion x2 2 − 41 . (7.31) φ0 (x) = (πx0 ) exp − 2x0 2 Wir werden später sehen, dass die Energieeigenfunktionen als Produkt von der Grundzustandsfunktion und von den sogenannten Hermite Polynomen geschrieben werden können. Wie man in Abb. D.32 erkennen kann, sind die Eigenfunktionen zu (un-)geraden Werten von n (un-)gerade Funktionen. 7.1.3 Nullpunktsenergie Wie wir bereits gesehen haben, ist die Nullpunktsenergie (d.h. die Energie des Grundzustands) nicht Null, sondern E0 = ~ω/2. Wir wollen nun diese Grundzustandsenergie auf Basis der Unschärferelation verstehen. Während die potentielle Energie V (x) in der näheren Umgebung des Punktes x = 0 abnimmt, d.h. V (x → 0) → 0, muss die kinetische Energie durch die Impulsunschärfe im gleichen Maße zunehmen. Daher nimmt die Impulsunschärfe zu, bis sich die Gesamtenergie stabilisiert. Wir wollen dies nun mittels expliziter Rechnung zeigen. Wir berechnen nun die Erwartungswerte hb xi und hb x2 i. Zunächst sehen wir, dass hb xi = 0: hb xi = hφn | x bφn i ∝ φn (b a+b a† )φn ∝ hφn | φn−1 i + hφn | φn+1 i = 0. (7.32) 46 Aus diesem Bild ergibt sich die Bezeichnung als Leiteroperatoren. Skizzieren Sie einfach das Spektrum! 99 Außerdem finden wir E 2 2 x0 2 x0 2 D 2 † 2 †2 † † x b = φn x b φn = φn (b a+b a ) φn = φn (b a +b a +b ab a +b ab a)φn 2 2 (7.33) D E 1 1 2 2 2 2 b a +b a† )φn = (n + )x0 2 . = x0 φn (N + )φn + x0 φn (b 2 2 | {z } (7.34) =0 p Da x0 = ~/(mω), verschwindet die Ortsunschärfe in den Grenzfällen ~ → 0 oder m → ∞. Für den Impulserwartungswert gilt hb pi = 0 mit im Wesentlichen gleicher Rechnung wie für hb xi. Wir berechnen zu guter Letzt noch hb p2 i und finden E 2 2 ~2 ~2 D 2 † 2 †2 † † φn (b a−b a ) φn = − φn (b a +b a −b ab a −b ab a)φn pb = φn pb φn = − 2x0 2 2x0 2 (7.35) = ~2 2x0 2 E 1 ~2 D 2 1 ~2 †2 b φ (b a + b a )φ ) . φn (N + )φn − = (n + n n 2 2x0 2 | 2 x0 2 {z } (7.36) =0 Wir sehen also für beide Observablen, dass die Varianz und der Erwartungswert des Quadrats des Operators jeweils gleich sind. Nun können wir die Standardabweichungen bestimmen und finden r r 1 ~ 1 h∆xi = x0 n + , h∆pi = n+ , (7.37) 2 x0 2 bzw. für das Produkt die Unschärferelation 1 h∆xi h∆pi = ~ n + 2 . (7.38) Im Grundzustand ist die Unschärferelation mit Gleichheit erfüllt, wie es für eine Gauß’sche Wellenfunktion zu erwarten ist. Wir können nun die Unschärferelation in den Erwartungswert des Hamiltonoperators einsetzen47 . Es gilt also D E ~2 2 1 2 1 2 ~4 1 1 2 b pb + 4 x b = pb + (n + ) 4 2 , (7.39) En = H = 2m x0 2m 2 x0 hb pi wobei wir im letzten Schritt die Unschärferelation, Glg. (7.38), eingesetzt haben und h∆b xi2 = hb x2 i sowie die analoge Beziehung für pb benutzt haben. Wir bestimmen das Minimum von E durch Variation von hb p2 i, 1 ~4 1 0 = 1 − (n + )2 4 2 x0 hb p2 i2 47 ⇒ 2 ~2 1 pb = 2 (n + ), x0 2 (7.40) Vergleichen Sie hierzu übungsaufgabe 4.1, bei der Sie ein ähnliches Prozedere angewandt haben. 100 und setzen dies wiederum in Glg. (7.39) ein. Dann erhalten wir 1 En = ~ω n + 2 (7.41) und sehen, dass die Energie des harmonischen Oszillators, vgl. Glg. (7.29), exakt mit der minimalen mit der Unschärferelation verträglichen Energie übereinstimmt. Daher ist die Grundzustandsenergie des harmonischen Oszillators durch die Unschärferelation vorgegeben. Man bezeichnet im Allgemeinen die kleinstmögliche Energie, die mit der Unschärferelation für ein bestimmtes physikalisches System vereinbar ist, als dessen Nullpunktsenergie. Die Energie des Grundzustands entspricht der Nullpunktsenergie. 7.2 Vergleich zum Klassischen Oszillator Hier wollen wir den quantenmechanischen Oszillator mit einem Klassischen Oszillator bei gleicher Frequenz vergleichen. Die Klassischen Bewegunsgleichungen werden durch die Ortsraumfunktion x(t) = q0 sin(ωt) (7.42) gelöst und die Gesamtenergie ist durch E= mω 2 2 q 2 0 (7.43) gegeben, wobei die Frequenz ω ein fester Wert ist und q0 durch die Anfangsbedingung festgelegt wird. Um mit der QM zu vergleichen, definieren wir eine Klassische Wahrscheinlichkeitsdichte dt , (7.44) P klass (x)dx = T /2 wobei dt das Zeitintervall ist, in dem der Massenpunkt des Klassischen Oszillators im Volumenelement dx gefunden werden kann und T = 2π/ω die volle Periodendauer des Oszillators ist48 . Wir bestimmen das Volumenelement dx durch Differentiation von Glg. (7.42), s q x2 dx = q0 ω cos(ωt)dt = q0 ω 1 − sin2 (ωt) dt = q0 ω 1 − 2 dt. (7.45) q0 Daher ist die Klassische Wahrscheinlichkeitsdichte durch s ! 2 πq x 0 P klass (x) = 1 − 2 −1 2 q0 (7.46) gegeben, wie sich durch Koeffizientenvergleich ergibt. Wir fixieren die Anfangsbedingung q0 durch Vergleich der quantenmechanischen und Klassischen Energien, En = 2n + 1 ~ω 2 ↔ 48 E klass = mω 2 2 q , 2 0 (7.47) Innerhalb jeder Periode wird jeder Ort (bis auf die Endpunkte) genau zweimal erreicht. Daher müssten wir für eine volle Periode dx halbieren oder dt verdoppelt. 101 womit sich eine Beziehung zwischen dem Klassischen Parameter q0 und der charakteristischen Längenskala x0 des quantenmechanischen Oszillators ergibt, √ q0 = 2n + 1 x0 . (7.48) Für niedrige Zustände findet man selbsverständlich beträchliche Unterschiede zwischen den Klassischen und quantenmechanischen Wahrscheinlichkeitsdichten, aber für hochangeregte Zustände ist eine geglättete49 quantenmechanische Wahrscheinlichkeitsdichte der Klassischen Wahrscheinlichkeitsdichte in hohem Maße ähnlich, vgl. Abb. D.33 für den Zustand mit n = 100. 7.3 Besetzungszahldarstellung In diesem Abschnitt wollen wir skizzieren, wie der harmonische Oszillator in der sogenannten Besetzungszahldarstellung behandelt wird. Hierbei führen wir das Konzept des Fock-Raums ein. Eine solche Darstellung ist für die relativistische Quantenmechanik angemessen, d.h. für QFT. Wir schreiben die normierte Eigenbasis des harmonischen Oszillators als Spaltenvektoren mit unendlich vielen Komponenten50 , wobei alle Komponenten bis auf jeweils eine verschwinden. Diese eine nicht-verschwindende Komponente ist die (n + 1) te Komponente für den n ten Eigenzustand, d.h. für den Zustand der den Eigenwert n bei Anwendung des Besetzungszahloperators ergibt: . .. 0 1 0 1 0 φn = 1 = |ni . φ1 = 0 = |1i , (7.49) φ0 = 0 = |0i , 0 .. .. . . .. . Diese Vektoren (wie beispielsweise |ni) bilden ein vollständiges Orthonormalsystem des sogenannten Fock-Raums51 . Die Leiteroperatoren b a und b a† erhalten damit eine Darstellung als Matrizen, die auf den Fock-Raum Zuständen wirken. Die wichtigsten Relationen beim harmonischen Oszillator lauten in dieser Darstellung: hn | mi = δn,m 1 a† )n |0i |ni = √ (b n! √ † b a |ni = n + 1 |n + 1i √ b a |ni = n |n − 1i 49 (7.50) (7.51) (7.52) (7.53) Mit Glättung ist hier gemeint, dass eine Mittelung über die hochfrequenten Oszillationen notwendig ist, beispielweise Mittelung des Wertes von einem lokalen Maximum bis zum nächsten. 50 Aufgrund der unendlich vielen Komponenten ist die Notation mit Spaltenvektoren natürlich nicht angemessen. Nichtsdestotrotz ist sie nützlich, um sich die Bedeutung der Fock-Raum Zustände (z.B. |ni) bewusst zu machen. 51 In der Vielteilchentheorie und in der QFT wird der Fock-Raum Zustand |ni tatsächlich als Zustand mit n (reellen) Teilchen verstanden. 102 b |ni = b N a† b a |ni = n |ni 1 1 b |ni = ~ω N b+ |ni = ~ω n + |ni . H 2 2 (7.54) (7.55) Wir können die einzelnen Matrixelemente als Übergangsamplituden zwischen verschiedenen Zuständen verstehen, beispielweise wird Glg. (7.50) in Matrixnotation durch 1 0 ... 0 1 hm | ni = δn,m ←→ (7.56) .. ... . dargestellt. Analog dazu ist die Darstellung der Leiteroperatoren durch 0 0 . . . √ 1 0 0 ... √ † √ 0 2 0 0 ←→ m b a n = n + 1 hm | n + 1i √ 0 | {z } 0 3 0 =δm,n+1 .. ... . 0 0 √ 0 1 √0 0 ... 0 0 2 0 0 √ √ ←→ hm | b a | ni = n hm | n − 1i .. 3 0 0 | {z } . 0 =δm,n−1 .. ... . 0 0 (7.57) (7.58) b und der Hamiltonoperator H b sind im Fock-Raum gegeben. Der Besetzungszahloperator N diagonal, 0 0 ... 0 1 0 ... D E 0 0 2 0 0 b m N n = nδn,m hm | ni ←→ (7.59) . . | {z } . 0 0 3 0 =δm,n .. .. . . 0 0 1 0 ... 2 0 23 0 . . . D E 5 1 b 0 0 mH ←→ ~ω 0 0 2 n = ~ω(n + )δn,m hm | ni . (7.60) .. | {z } 2 7 0 . 0 0 =δm,n 2 .. .. . . 0 0 In dieser Darstellung erkennen Sie deutlich die Dirac Notation, vgl. Anhang C. 7.4 Analytische Methode In diesem Abschnitt betrachten wir die analytische Methode zur Lösung des harmonischen Oszillators. Wir definieren ξ = x/x0 und = 2E/(~ω) um dimensionslose Größen einzuführen. Anschließend multiplizieren wir die Schrödingergleichung auf beiden Seiten mit ~ω/2 um d2 φ(ξ) = ξ 2 − φ(ξ) (7.61) 2 dξ 103 zu erhalten. Um sicherzustellen, dass die Lösungen L2 (R) Funktionen sind, bestimmen wir zunächst das erforderliche asymptotische Verhalten der Lösungen für große Werte von ξ und vernachlässigen daher (gegenüber ξ 2 ). Die Schrödingergleichung vereinfacht sich daher zu d2 φ(ξ) = ξ 2 φ(ξ). (7.62) 2 dξ Wir verlangen, um Normierbarkeit zu gewährleisten, dass die Wellenfunktion hinreichend schnell (d.h. wie eine Gauß-Funktion) abfällt und dass das Verhalten der am schnellsten wachsenden Terme reproduziert wird. Daher machen wir einen Ansatz mit einer GaußFunktion φ(ξ) = exp [−ξ 2 /2]. Dann finden wir für die Ableitungen d ξ2 ξ2 exp [− ] = −ξ exp [− ], dξ 2 2 d2 ξ2 ξ2 2 ] = (ξ − 1) exp [− ], exp [− dξ 2 2 2 (7.63) wobei der zweite Term in der Klammer vom Typus des vernachlässigten ist. Wir schließen daraus, dass eine Gauß-Funktion das asymptotische Verhalten korrekt beschreibt und konkretisieren den Ansatz, indem wir die Gauß-Funktion mit einer Funktion52 h(ξ) multiplizieren, d.h. der Ansatz lautet 2 ξ (7.64) φ(ξ) = h(ξ) exp − 2 und dessen Ableitungen sind 2 d dh(ξ) ξ φ(ξ) = − ξh(ξ) exp − dξ dξ 2 2 2 2 d h(ξ) dh(ξ) ξ d 2 φ(ξ) = − 2ξ + (ξ − 1)h(ξ) exp − . dξ 2 dξ 2 dξ 2 (7.65) (7.66) Nun setzen wir Glg. (7.66) in Glg. (7.61) ein und entfernen die Gauß-Funktion (diese ist immer von Null verschieden). Daher erhalten wir eine DGL zweiter Ordnung für die Funktion h(ξ), h00 (ξ) − 2ξh0 (ξ) + ( − 1)h(ξ) = 0, (7.67) die sich mit einem Potenzreihenansatz lösen lässt. Wir setzen also h(ξ) = ∞ X aj ξ j (7.68) j=0 ein und erhalten ∞ X j=2 (j)(j − 1)aj ξ j−2 −2 ∞ X j (j)aj ξ + ( − 1) j=1 52 ∞ X aj ξ j = 0. (7.69) j=0 Wir sollten hier zunächst von einer beliebigen Funktion sprechen, die wir dann in einer Potenzreihe in ξ entwickeln. Wenn wir dann die Koeffizienten dieser Potenzreihe bestimmen, ist es erforderlich eine Abbruchbedingung zu finden. Ansonsten erhält man fast unweigerlich eine Funktion, die exponentielles Wachstum aufweist. Dabei ginge die Normierbarkeit verloren. Daher bekommen wir zwar am Ende immer ein Polynom, aber wir machen einen allgemeinen Ansatz. 104 Bei diesem Ansatz suchen wir Rekursionsrelationen der Koeffizienten der Potenzreihe, d.h. wir sortieren die verschiedenen Summen nach gemeinsamen Potenzen von ξ 53 und erhalten ∞ X {(j + 2)(j + 1)aj+2 − 2jaj + ( − 1)aj } ξ j = 0. (7.70) j=0 Offensichtlich gilt dies für beliebige Werte von ξ und damit für jeden einzelnen Term. Die gesuchte Rekursionsrelation lautet also 2j + 1 − aj+2 = . aj (j + 2)(j + 1) (7.71) Im Fall des harmonischen Oszillators lässt sich diese DGL bzw. die Rekursionsrelation (durch Nachschlagen in mathematischer Literatur oder schlichte Erfahrung) als Hermite’sche DGL identifizieren, sofern die Energie die Abbruchbedingung (der Potenzreihe) 2E = = 2j + 1 ~ω (7.72) erfüllt. Ansonsten wüchse die Funktion h(ξ) exponentiell an und die Wellenfunktion wäre nicht normierbar54 . Die Quantisierungsbedingungen haben also in der analytischen Methode den Charakter von Abbruchbedingungen der Potenzreihen. Wir merken an, dass die DGL für h(ξ) von zweiter Ordnung ist und daher zwei frei wählbare Konstanten vorliegen. Diese entsprechen den Koeffizienten a0 und a1 . Sowohl für gerade als auch für ungerade j ergibt sich die gleiche Rekursionsformel. Da die Abbruchbedingung aber nur für einen der beiden Fälle zugleich erfüllbar ist, erfordert Konvergenz der Reihe, dass entweder a1 = 0 oder a0 = 0. Ersteres entspricht den geraden Funktionen (d.h. positive Parität), letzteres den ungeraden Funktionen (d.h. negative Parität). Die letzte freie Konstante, d.h. a0 bzw. a1 wird anschließend durch die Normierungsbedingung fixiert. Die Lösungen der Hermite’schen DGL sind die sogenannten Hermite Polynome Hn (ξ), eine Familie von Polynomen (benannt nach C. Hermite), so dass wir h(ξ) → Hn (ξ), n ∈ N0 finden. Diese Identifikation definiert die Quantisierungsbedingung 1 . E = ~ω n + 2 (7.74) (7.75) 53 Wir benennen den Index der ersten Summe um und verschieben diesen dann so, dass diese Summe ebenfalls bei Null anfängt. Bei der zweiten Summe kann man den Term zu j = 0 einfach addieren, da dieser verschwindet. Wenn sich für einige der ersten Terme weitere Beiträge ergeben, die nicht in der Rekursionsrelation berücksichtigt werden, verwendet man diese, um (üblicherweise eine der) Integrationskonstanten der Lösung zu fixieren. 54 Um das asymptotische Verhalten der nicht-abbrechenden, Potenzreihe zu untersuchen betrachtet man beispielsweise 2 aj+2 = lim . (7.73) lim j→∞ j j→∞ aj Dies ist das gleiche asymptotische Verhalten, das von der Potenzreihe der Exponentialfunktion exp [ξ 2 ] an den Tag gelegt würde. Daher divergiert h(ξ) exponentiell (und zwar sogar schneller als die Exponentialfunktion im Ansatz der Glg. (7.64) konvergiert). 105 Mithilfe der Hermite Polynome können alle Eigenfunktionen in geschlossener Form angegeben werden, x2 1 x 2 − 41 (πx0 ) Hn exp − 2 . (7.76) φn (x) = p x0 2x0 2n (n!) Die einfachste Methode, um die Hermite Polynome zu bestimmen, ist die Formel von Rodrigues, n d −ξ2 n ξ2 Hn (ξ) = (−1) e e . (7.77) dξ n Die niedrigsten Hermite Polynome sind H0 (ξ) = 1, H1 (ξ) = 2ξ, H2 (ξ) = 4ξ 2 − 2, H3 (ξ) = 8ξ 3 − 12ξ, H4 (ξ) = 16ξ 4 − 48ξ 2 + 12. (7.78) Wir merken noch an, dass Hermite Polynome eine Orthogonalitätsrelation erfüllen, Z+∞ √ 2 dξ Hm (ξ)Hn (ξ)e−ξ = π2n (n!)δm,n . (7.79) −∞ Dies spiegelt sich natürlich in der Orthonormalität der Eigenfunktionen wider. Zusammenfassung Hier fassen wir noch einmal das allgemeine “Kochrezept” zusammen. Zunächst schreiben wir die Schrödingergleichung auf eine dimensionslose DGL zweiter Ordnung um. Dieser Schritt ist nicht notwendig, aber grundsätzlich hilfreich. Danach untersuchen wir das asymptotische Verhalten und machen einen Ansatz mit einer Exponentialfunktion, welcher die Normierbarkeit garantiert und die asymptotisch anwachsenden Koeffizienten der DGL reproduziert. Diese Exponentialfunktion wird mit einer weiteren Funktion multipliziert, welche wir in einer Potenzreihe entwickeln. Diese Potenzreihe muss im Allgemeinen abbrechen, um Normierbarkeit zu gewährleisten. Daher bilden wir Rekursionrelationen für deren Koeffizienten und suchen eine Abbruchbedingung, die dann die Rolle einer Quantisierungsbedingung spielt. Die verbleibende DGL für die nun abbrechende Potenzreihe lässt sich bei exakt lösbaren Problemen immer auf ein aus der Mathematik bekanntes orthogonales Funktionensystem zurückführen. Da die Schrödingergleichung eine DGL zweiter Ordnung ist, gibt es zwei beliebige Konstanten, die durch Anfangsbedingungen fixiert werden. Eine davon wird in jedem Fall durch die Normierungsbedingung fixiert. Wenn Parität eine Symmetrie der DGL ist, kann jeweils eine der beiden Konstanten auf Null gesetzt werden, um gerade oder ungerade Lösungen zu erhalten. 106 7.5 Kohärente Zustände Als kurzen Exkurs greifen wir hier kohärente Zustände auf, ohne auch nur zu versuchen, diese umfassend und systematisch einzuführen. Wir verweisen hierbei auf die weiter unten genannte originale Literatur. Kohärente Zustände sind Eigenzustände des Vernichters b a, d.h. es gilt b aφα = αφα . (7.80) Da b a nicht hermitesch ist, ist α = |α| eiϕ offensichtlich komplex. Bis auf den Grundzustand φ0 , der trivialerweise ein kohärenter Zustand ist, sind diese im Allgemeinen Superpositionen von Fock-Raum Zuständen zu unendlich vielen verschiedenen Eigenwerten des b . Eine wesentliche Eigenschaft der kohärenten Zustände ist, Besetzungszahloperators N dass zwischen allen diesen Fock-Raum Zuständen eine präzise definierte komplexe Phasenbeziehung besteht55 . Daher sind kohärente Zustände beispielsweise eine angemessene Form der Beschreibung von Laserstrahlen, deren Eigenschaften sich nicht ändern, wenn man einzelne Photonen aus dem Strahl heraus nimmt. Man kann nun jeden kohärenten Zustand als Superposition von unendlich vielen FockRaum Zuständen schreiben und findet damit die kohärente Wellenfunktion, φα (x) = hχx | φα i = ∞ X hχx | φn i hφn | φα i n=0 ∞ ∞ 1 2 X αn 1 2 X αn √ hχx | φn i = exp − |α| √ φn (x). = exp − |α| 2 2 n! n! n=0 n=0 (7.81) Die zeitabhängigen kohärenten Zustände werden dann aus den zeitabhängigen Fock-Raum Zuständen gewonnen, ∞ ∞ 1 2 −i ωt X (αe−iωt )n 1 2 X αn √ ψn (x, t) = exp − |α| e 2 √ φn (x), ψα (x, t) = exp − |α| 2 2 n! n! n=0 n=0 (7.82) bzw. nach Definition des zeitabhängigen α(t) = αe−iωt ωt ψα (x, t) = φα(t) (x)e−i 2 . (7.83) Wenn man nun den Ortserwartungswert für den kohärenten Zustand |αi bestimmt, findet man nach kurzer Rechnung hb xit,α = hψα (t) | x bψα (t)i = φα(t) x bφα(t) † x0 x0 φα(t) + φα(t) b a +b a)φα(t) = √ b a φ a φ = √ φα(t) (b α(t) α(t) {z } | {z } 2 2 | α∗ (t)hφα(t) | φα(t) i α(t)hφα(t) | φα(t) i √ √ x0 = √ (α∗ (t) + α(t)) = 2x0 Re (αe−iωt ) = 2x0 |α| cos (ωt − ϕ). (7.84) 2 Daher kann man sagen, dass kohärente Zustände eine Oszillation zeigen, die der Lösung der Klassischen Bewegungsgleichungen sehr ähnlich ist. 55 Im Gegensatz ist bei einem Fock-Raum die Phase völlig beliebig. 107 Zur weiteren Vertiefung empfehlen wir die TUM Physik Zentralübungen sowie als Literatur typische Lehrbücher aus der Literatursammlung und natürlich die originalen Publikationen von E. Schrödinger56 und R.J. Glauber57 . Gerade die Publikation von Schrödinger aus der Frühzeit der Quantenmechanik ist recht kurz und mit ihrem bisherigen physikalischen Wissen gut nachvollziehbar, so dass wir Ihnen diese zur entspannten Lektüre wärmstens empfehlen. Literaturempfehlung: A. Messiah J.J. Sakurai F. Schwabl S. Weinberg Quantum Mechanics, Volume 1 Section 12 Modern Quantum Mechanics, 2nd Ed. Kapitel 2.3 Quantenmechanik, Bd. 1 Kapitel 3.1 Lectures on Quantum Mechanics Section 2.5 56 E. Schrödinger, Die Naturwissenschaften 14, 664 (1926) “Der stetige Übergang von der Mikro- zur Makromechanik”. 57 Roy J. Glauber, Phys. Rev. 130, 2529, (1963) “The Quantum Theory of Optical Coherence”. 108 8 Anwendungen der Schrödingergleichung mit Separation der Variablen: Teilchen im Zentralpotential Wie wir gesehen haben, ist ein wesentlicher Bestandteil der Untersuchung eines physikalischen Systems in der QM die Lösung der zeitunabhängigen Schrödingergleichung. Insbesondere tritt diese Eigenwertgleichung bei den zwei in der Quantenphysik am häufigsten anzutreffenden Problemen auf, nämlich: • die Bestimmung der Energieniveaus von Bindungszuständen – diese sind Eigenwerte des diskreten Spektrums des Hamiltonoperators, • die Bestimmung der Streuwirkungsquerschnitte. Die Schrödingergleichung in der Wellenmechanik ist eine partielle DGL zweiter Ordnung. Für ein eindimensionales System reduziert sich diese auf eine gewöhnliche DGL. Wir haben Eigenwertprobleme dieser Art in einer Dimension in den Kapiteln 6 und 7 betrachtet. Im Allgemeinen ist das Problem schwieriger, wenn eine größere Zahl von Dimensionen vorliegt. 8.1 Schrödinger Gleichung in drei Dimensionen Im dreidimensionalen Fall hat die stationäre Schrödingergleichung, ~2 ∆x + V (x) φ(x) = Eφ(x) − 2m (8.1) für einen gegebenen Wert von E unendlich viele linear unabhängige Lösungen. Die einzige bekannte allgemeine Lösungsmethode ist die Methode der Trennung der Variablen (multiplikativer Separationsansatz), welche jedoch nur anwendbar ist, falls das Potential einige spezielle Symmetrieeigenschaften besitzt. Symmetrieeigenschaften des Hamiltonoperators können im Allgemeinen das Finden der Lösung erleichtern. Insbesondere kann in manchen Fällen eine passende Variablensubstitution dazu führen, dass die partielle DGL in den neuen Variablen separabel ist. Das Eigenwertproblem wird in mehrere einfachere Eigenwertprobleme aufgespalten, die eine jeweils geringere Zahl an Dimensionen betreffen. Ein solcher Fall tritt beim Teilchen im Zentralpotential auf, d.h. bei einem Potential, das lediglich vom Abstand r des Teilchens zum Kraftzentrum, aber nicht von der Richtung des Vektors r (vom Kraftzentrum zum Teilchen) abhängt. Da der Hamiltonoperator sphärische Symmetrie besitzt, entkoppeln die Variablen vollständig, wenn man das Problem mittels sphärischer Polarkoordinaten (Kugelkoordinaten) löst. Nach Separation der Winkelvariablen reduziert sich die Lösung der Schrödingergleichung auf die Lösung einer gewöhnlichen DGL ausschließlich in der radialen Variable. Eine solche Gleichung kann immer numerisch integriert werden. Für den Fall eines freien Teilchens, für das CoulombPotential und für den harmonischen Oszillator kann die separierte Schrödingergleichung analytisch gelöst werden. 109 Der einfachste Fall eines Potentials, dessen Lösung durch Separation der Variablen erhalten werden kann, ist V (x) = V1 (x) + V2 (y) + V3 (z). (8.2) Sie werden dieses Problem auf dem Übungsblatt 10 betrachten. Dieses Problem beinhaltet bereits den Fall V = 0, d.h. ein freies Teilchen, für welches das Problem mittels Trennung der Variablen lösbar ist (für verschiedene Wahlmöglichkeiten der Koordinaten – auf Blatt 10 werden Sie die Lösung in kartesischen Koordinaten betrachten, in der Vorlesung verwenden wir Kugelkoordinaten). 8.2 Zentralpotential Wir betrachten ein Zentralpotential V ≡ V (r), r= p x2 + y 2 + z 2 = |x| , x = (x, y, z), (8.3) für das auch als Bezeichnung “Potential mit sphärischer Symmetrie” gebräuchlich ist. Wir müssen nun 2 ~ b Hφ(x) = − ∆x + V (r) φ(x) = Eφ(x) (8.4) 2m lösen. Da das Problem sphärische gelkoordinaten zu formulieren, x= y= z= Symmetrie aufweist, ist es günstig, dieses mittels Kur cos ϕ sin ϑ 0 ≤ r < ∞ r sin ϕ sin ϑ 0 ≤ ϑ < π , r cos ϑ 0 ≤ ϕ < 2π (8.5) vgl. Abb. D.34. Wir haben die Variablensubstitution von kartesischen zu sphärischen Polarkoordinaten bereits in Übungsaufgabe 6.1 durchgeführt. Dabei fanden wir für den Laplace-Operator ∆x = ∂2 ∂2 1 ∂ 2∂ 1 ∂ 1 ∂ ∂2 ∂2 + + = r + sin ϑ + . ∂x2 ∂y 2 ∂z 2 r2 ∂r ∂r r2 sin ϑ ∂ϑ ∂ϑ r2 sin2 ϑ ∂ϕ2 (8.6) Wir haben ebenso gezeigt, dass dieser Ausdruck mit ∆x = 1 ∂ 2∂ 1 b2 r − 2 2L 2 r ∂r ∂r ~ r b 2 als übereinstimmt, wobei das Quadrat des Drehimpulsoperators L 2 1 ∂ ∂ 1 ∂ 2 2 b = −~ L sin ϑ + sin ϑ ∂ϑ ∂ϑ sin2 ϑ ∂ϕ2 (8.7) (8.8) identifiziert wird und der quantenmechanische Drehimpulsoperator durch b = x × p = ~ (x × ∇x ) L i (8.9) definiert ist, vgl. Glgn. (5.142) und (5.82). Damit können wir Glg. (8.4) in Kugelkoordinaten umschreiben, 110 1 ∂ 1 ∂ ∂ 1 ∂2 2 ∂ r φ(r, ϑ, ϕ) + 2 sin ϑ φ(r, ϑ, ϕ) + 2 2 φ(r, ϑ, ϕ) r2 ∂r ∂r r sin ϑ ∂ϑ ∂ϑ r sin ϑ ∂ϕ2 2m + 2 [E − V (r)] φ(r, ϑ, ϕ) = 0. (8.10) ~ Wir bemerken, dass die Abbildung auf Kugelkoordinaten auf der z-Achse nicht bijektiv ist, insbesondere im Punkt r = 0. Die Punkte auf der z-Achse und der Ursprung r = 0 sind singuläre Punkte der Transformation. Dies spiegelt sich in den Singularitäten der Koeffizienten von Glg. (8.10) für r = 0 und ϑ = 0, π wider, welche in der kartesischen Form der Gleichung nicht auftreten. Insbesondere besitzt eine Lösung von Glg. (8.10) Singularitäten in diesen Punkten unabhängig davon, ob V (r) Singularitäten besitzt oder nicht. Daher müssen wir Lösungen derart auswählen, dass sie auch an diesen Punkten endlich (für x → xj muss gelten: limx→xj φ(x) = endlich) und stetig sind, vgl. Abschnitt 4. Eine ähnliche Komplikation tritt auch bezüglich ϕ auf. Eine Lösung von Glg. (8.10) könnte für gegebene Werte von r und ϑ verschiedene Werte für ϕ = 0 und ϕ = 2π annehmen, so dass die Funktion und ihre Ableitungen nicht automatisch stetig in ϕ = 0 wären. Wir müssen daher die Stetigkeit der Lösung für ϕ = 0 explizit fordern. 8.2.1 Multiplikativer Separationsansatz Nun wollen wir Glg. (8.10) lösen und beginnen mit einem multiplikativen Separationsansatz für ϑ und ϕ, φ(r, ϑ, ϕ) = R(r)Y (ϑ, ϕ). (8.11) Wir setzen Glg. (8.11) in Glg. (8.10) ein, multiplizieren mit r2 /(RY ) und erhalten 1 ∂ 2Y 2m ∂ ∂Y 1 1 ∂ 2 2 ∂R = 0. (8.12) r + 2 [E − V (r)] r + sin ϑ + R ∂r ∂r ~ Y sin ϑ ∂ϑ ∂ϑ Y sin2 ϑ ∂ϕ2 Dies zerfällt in zwei separate Gleichungen, 1 ∂ ∂Y 1 ∂ 2Y = − λ, sin ϑ + Y sin ϑ ∂ϑ ∂ϑ Y sin2 ϑ ∂ϕ2 1 d 2 dR 2m r + 2 [E − V (r)] r2 = λ. R dr dr ~ (8.13) (8.14) Die erste dieser Gleichungen ist unabhängig von V (r) und damit allgemeingültig für ein Teilchen in einem beliebigen Zentralpotential. Wir können zusätzlich noch in Y (ϑ, ϕ) die Abhängigkeit von ϑ und ϕ separieren, indem wir den Ansatz Y (ϑ, ϕ) = Θ(ϑ)Φ(ϕ) (8.15) verwenden. Dann finden wir d2 Φ + µΦ =0, dϕ2 h 1 d dΘ µ i sin ϑ + λ− Θ =0. sin ϑ dϑ dϑ sin2 ϑ 111 (8.16) (8.17) Daher ist das Problem, die Eigenwerte und Eigenvektoren des Hamiltonoperators mit V (r) zu finden auf die Suche nach Lösungen zu Glgn. (8.14), (8.16) und (8.17) reduziert, welche quadratintegrabel und inklusive ihrer ersten Ableitungen stetig in den Diskontinuitäten sind. 8.2.2 Die Azimuthalgleichung Die Lösung von Glg. (8.16) ist einfach. Wir müssen Φ0 (0 = Φ0 (2π), Φ(0) = Φ(2π), Φ00 (0) = Φ00 (2π) (8.18) fordern und finden für µ = 0 Φ = A + Bϕ. (8.19) Aus Glg. (8.18) folgt B = 0. Für µ 6= 0 finden wir Φ = Aei √ µϕ + Be−i √ µϕ . (8.20) Aus Glg. (8.18) folgt wiederum A + B = Aei √ µ 2π + Be−i √ µ 2π A − B = Aei , √ µ 2π − Be−i √ µ 2π . (8.21) Die Bedingung für welche dieses System eine nicht-triviale Lösung hat ist √ √ 1 − ei µ 2π √ 1 − e−i √µ 2π ! √ (8.22) 1 − ei µ 2π −(1 − e−i µ 2π ) = 4(cos(2π µ) − 1) = 0, √ was nur eine Lösung hat, falls µ eine ganze Zahl ist. In diesem Fall werden automatisch alle Stetigkeitsbedingungen in Glg. (8.18) erfüllt. Eine mögliche Wahl von unabhängigen Eigenfunktionen ist durch Φm (ϕ) = Am eimϕ , m = 0, ±1, ±2, . . . (8.23) gegeben, wobei die Eigenwerte µm = m2 (8.24) sind. Der Koeffizient Am wird aus der Normierungsbedingung bestimmt, Z2π Z2π 2 dϕ |Φm | 1= ⇒1= 0 1 ⇒ Am = √ , 2π dϕ |Am |2 (8.25) 0 0 und wir finden Orthogonalität für m 6= m , Z2π dϕ Φ∗m (ϕ)Φm0 (ϕ) Z2π = 0 0 dϕ ei(m −m)ϕ = 0. (8.26) 0 Mit beiden Gleichungen zusammen können wir also Z2π dϕ Φ∗m (ϕ)Φm0 (ϕ) = δm m0 (8.27) 0 schreiben. Wir bemerken, dass {Φm (ϕ)} die Fourier-Basis von L2 (0, 2π) ist und in diesem Raum vollständig ist. 112 8.2.3 Die Polargleichung Wir setzen in Glg. (8.17) µ = m2 ein und transformieren die Variable zu q = cos ϑ58 . Somit lautet die Polargleichung m2 d 2 dΘ (1 − q ) + λ− Θ = 0, (8.29) dq dq 1 − q2 bzw. d2 Θ λ 2q dΘ m2 + Θ = 0, − − dq 2 1 − q 2 dq 1 − q 2 (1 − q 2 )2 (8.30) wobei der Definitionsbereich von Θ(q) durch ϑ ∈ (0, π) ⇒ q ∈ (−1, +1) gegeben ist. Hierbei kann Glg. (8.30) als die verallgemeinerte Legendre’sche DGL erkannt werden. Indem wir aus den Lösungen von Glg. (8.30) jene auswählen, die an den Intervallgrenzen (des Definitionsbereiches) – d.h. q → ±1 – endlich sind, beschränken wir den Wert von λ auf die Form λ = (ν + |m|)(ν + |m| + 1), ν = 0, 1, 2, . . . . (8.31) Wir können dann ` = ν + |m| definieren und die Eigenwerte als ` = |m| , |m| + 1, . . . λ = `(` + 1), (8.32) schreiben. Die Eigenfunktionen sind durch |m| |m| |m| |m| Θ` (q) = C` P` (q) = C` (−1)|m| (1 − q 2 ) |m| 2 d|m| P` (q) dq |m| (8.33) |m| gegeben und daher assoziierte Legendre-Polynome P` , die ausgehend von gewöhnlichen Legendre-Polynomen59 P` berechnet werden können. Die P` erfüllen die Rodrigues-Formel 1 d` P` (q) = (−1) ` (1 − q 2 )` . ` 2 `! dq ` (8.34) Die ersten Legendre-Polynome lauten P0 (q) = 1, P1 (q) = q, 1 P2 (q) = (3q 2 − 1), 2 1 P3 (q) = (5q 3 − 3q), 2 (8.35) und die ersten assoziierten Legendre-Polynome60 sind (siehe auch Wikipedia) P11 (q) = − p 1 − q2, p 15q 2 − 3 p 1 − q 2 , P31 (q) = − 1 − q2, 2 P22 (q) = 3(1 − q 2 ), P32 (q) = +15q(1 − q 2 ), P21 (q) = −3q 3 P33 (q) = −15(1 − q 2 ) 2 . 58 Wegen dq = − sin ϑdϑ gilt d d = − sin ϑ . dϑ dq 59 60 (8.36) Sie finden dazu mehr Details in mathematischer Standardliteratur oder auch auf Wikipedia. Es gilt offensichtlich Pn0 (q) = Pn (q). 113 (8.28) Die assoziierten Legendre-Polynome erfüllen die Orthogonalitätsrelationen (d.h. Orthogonalität für unterschiedliche ` 6= `0 ) Z+1 |m| |m| dq P`0 (q)P` (q) = 2 (` + |m|)! δ`0 ` , 2` + 1 (` − |m|)! (8.37) −1 aber sind für unterschiedliche m 6= m0 nicht orthogonal, Z+1 |m0 | |m| dq P`0 (q)P` (q) 6= 0. (8.38) −1 Aus Glg. (8.37) folgt für die Normierung der Wellenfunktion s 2` + 1 (` − |m|)! |m| C` = . 4π (` + |m|)! (8.39) Zusammenfassung des Winkelanteils Die Wellenfunktion wird mit Separationsanatz in der Form φ(r, ϑ, ϕ) = R(r)Y` m (ϑ, ϕ) (8.40) geschrieben, wobei die Kugelflächenfunktionen (“spherical harmonics”) Y` m durch s |m|−m 2` + 1 (` − |m|)! |m| Y` m (ϑ, ϕ) = (−1) 2 P (cos ϑ)eimϕ (8.41) 4π (` + |m|)! ` gegeben sind. Dabei sind die Werte der Konstanten m und ` auf m = 0, ±1, ±2, . . . , ` = 0, 1, 2, . . . ` = |m| , |m| + 1, . . . m = −`, −` + 1, . . . , ` − 1, ` bzw. (8.42) (8.43) beschränkt. Die Kugelflächenfunktionen Y` m bilden ein vollständiges Orthonormalsystem auf L2 (Ω), d.h. alle quadratintegrablen Funktionen auf der Sphäre lassen sich nach den Y` m zerlegen. Die Orthonormalitätsrelation lautet Z2π Zπ dϕ 0 dϑ sin ϑY`∗0 m0 (ϑ, ϕ)Y` m (ϑ, ϕ) = δm0 m δ`0 ` . (8.44) 0 Für das Raumwinkelelement schreiben wir auch dΩ = sin ϑdϑdϕ = d cos ϑ dϕ. (8.45) Die Y` m sind tabelliert, z.B. auf Wikipedia. Einige der ersten Lösungen werden hier gezeigt, r 1 Y0 0 (ϑ, ϕ) = , 4π 114 r Y1 0 (ϑ, ϕ) = Y1 ±1 (ϑ, ϕ) = Y2 0 (ϑ, ϕ) = Y2 ±1 (ϑ, ϕ) = Y2 ±2 (ϑ, ϕ) = 3 cos ϑ, 4π r 3 ∓ sin ϑe±iϕ , 8π r 45 1 2 cos ϑ − , 16π 3 r 15 sin 2ϑe±iϕ , ∓ 32π r 15 sin2 ϑe±2iϕ . 32π (8.46) b 2, Wie wir bereits angemerkt haben, entspricht Glg. (8.13) der Eigenwertgleichung von L b 2 Y` m = λY` m L b 2 Y` m = `(` + 1)~2 Y` m . L → (8.47) Darüber hinaus gilt ~ ∂ bz = x L bpby − ybpbx = i ∂ϕ (8.48) bz Y` m = m~Y` m , L (8.49) und wobei die Eigenwerte auf ` = 0, 1, . . . , ∞ und m = −`, −` + 1, . . . , ` beschränkt sind. Wir werden diese Gleichungen auch mit der algebraischen Methode (in einer gewissen Analogie zum harmonischen Oszillator) im Kapitel zum Drehimpuls erhalten. Wir können daher b 2 und L b L bz betrachten. sagen, dass wir gemeinsame Eigenfunktionen von H, 8.2.4 Die Radialgleichung Wir wollen nun die Radialwellenfunktion R(r) betrachten, welche eine Lösung von 1 d 2 dR 2m `(` + 1) r + 2 E − V (r) − R=0 (8.50) r2 dr dr ~ r2 sein muss. Die Bedingung, dass φ(x) quadratintegrabel ist, lautet Z∞ dr r2 0 Zπ Z2π dϑ sin ϑ 0 dϕ |φ(r, ϑ, ϕ)|2 < ∞. (8.51) 0 Daraus folgt für den Radialteil der eigentlichen Eigenfunktionen Z∞ dr r2 |R(r)|2 < ∞. (8.52) 0 Für die uneigentlichen Eigenfunktionen ergibt sich E+∆E 2 Z Z∞ 2 0 dr r dE RE 0 (r) < ∞. 0 E 115 (8.53) Wir verwenden die Identität 1 d 2 dR 1 d2 r = [rR] r2 dr dr r dr2 (8.54) um Glg. (8.50) zu vereinfachen. Wir definieren R(r) = y(r) r und setzen dies in Glg. (8.50) ein, ~2 d2 ~2 `(` + 1) − y(r) = Ey(r), + V (r) + 2m dr2 2m r2 (8.55) (8.56) und verlangen für die eigentlichen Eigenfunktionen Z∞ dr |y(r)|2 < ∞ (8.57) 0 bzw. für die uneigentlichen Eigenfunktionen E+∆E 2 Z Z∞ dr dE 0 yE 0 (r) < ∞. 0 (8.58) E Die Regularitätsanforderungen an R(r) übertragen sich also in Regularitätsanforderungen an y(r) für r > 0 und in die Forderung, dass y(0) → 0. Damit R endlich bleibt heißt dies y(r) 7−→ r r→0 endlich. (8.59) Man kann für ein Potential der Form V (r) = f /r + V1 (r)61 zeigen, dass zwei Lösungen y(r) existieren, deren Verhalten bei r → 0 durch r`+1 r−` y(r) (8.60) beschrieben wird. Nur die erste dieser Lösungen genügt der Regularitätsbedingung in Glg. (8.59), während die zweite verworfen werden muss. Daher sehen wir, dass das Problem der Bestimmung der Eigenwerte und der eigentlichen und uneigentlichen Eigenfunktionen des Hamiltonoperators für ein Teilchen im Zentralpotential auf das entsprechende eindimensionale Problem eines Teilchens auf einer Achse im effektiven Potential V eff (r) ≡ V (r) + ~2 `(` + 1) 2m r2 für r > 0 und V = ∞ für r ≤ 0 (8.61) reduziert worden ist. Wir sehen, dass V eff von ` abhängt. Wir können den aufgrund des Bahndrehimpulses des Teilchens auftretenden Term ~2 `(` + 1) als die Stärke eines Zentrifugalpotentials interpretieren. 61 Hierbei nehmen wir an, dass V1 (r) eine reguläre Funktion ist, also insbesondere keinerlei Singularität bei r → 0 besitzt. 116 Nun wollen wir die Lösungen von Glg. (8.56) besprechen. Wir können für Glg. (8.56) ähnliche Betrachtungen wie für die eindimensionale Schrödingergleichung anstellen. Wir nehmen an, dass V (r) für r → ∞ gegen Null strebt, lim V (r) = 0, (8.62) r→∞ und von kurzer Reichweite ist, wobei ebenfalls Z∞ dr |V (r)| < ∞ (8.63) a für ein beliebiges a > 0 gelten muss. Dann ist für jedes gegebene ` das asymptotische Verhalten der Lösungen für E < 0 von der Form √ √ + ~1 2m|E|r − ~1 2m|E|r + B` (E)e E<0 (8.64) y` (r) 7−→ A` (E)e r→∞ und für E > 0 von der Form i y` (r) 7−→ C` (E)e− ~ r→∞ √ 2mEr i + D` (E)e+ ~ √ 2mEr , E > 0. (8.65) Nachdem wir die Regularität am Ursprung einfordern, vgl. Glg. (8.59), sind die Koeffizienten A` (E), B` (E), C` (E) und D` (E) bis auf eine multiplikative Konstante vollständig bestimmt62 . Im Fall E < 0 ist es klar, dass wir in Glg. (8.64) um eine L2 (R3 )Funktion zu erhalten B` = 0 (8.66) fordern müssen. In diesem Fall erhalten wir eigentliche Eigenfunktionen, d.h. Glg. (8.57) ist erfüllt. Die Eigenwerte zu diesen Eigenfunktionen sind E0` , E1` , . . . und wir stellen fest, dass grundsätzlich E0` > min[V eff (r)] gilt (für r ∈ (0, ∞)). Wir werden mit nr den ganzzahligen Index der Energieeigenwerte (Enr ` ) bezeichnen. √ Im Fall E > 0 sind die Eigenfunktionen yp` , wobei p = 2mE der Impuls ist, keine eigentlichen Eigenfunktionen und genügen E+∆E 2 Z Z∞ √ 0 (8.67) dr dE yp` (r) < ∞, wobei p = 2mE 0 . 0 E Damit verfügen wir über einen vollständigen Satz von eigentlichen {ynr ` (r)} und uneigentlichen {yp` } Eigenfunktionen, so dass Z∞ dr yn∗ 0r ` (r)ynr ` (r) = δn0r nr (8.68) 0 Z∞ ∗ dr yp` (r)ynr ` (r) = 0 0 62 Die Begründung hierfür werden Sie später in der Herleitung von Glg. (8.86) verstehen. 117 (8.69) Z∞ dr yp∗0 ` (r)yp` (r) = δ(p0 − p) (8.70) 0 gilt. Wir bemerken, dass im Allgemeinen Z∞ dr yn∗ 0r `0 (r)ynr ` (r) 6= 0, (8.71) 0 gilt, da yn0r `0 und ynr ` Eigenfunktionen zu zwei unterschiedlichen Operatoren sind. Wir bilden damit die gesamte Wellenfunktion, 1 φnr `m (r, ϑ, ϕ) = Rnr ` (r)Y` m (ϑ, ϕ) = ynr ` (r)Y` m (ϑ, ϕ), (8.72) r 1 φp`m (r, ϑ, ϕ) = Rp` (r)Y` m (ϑ, ϕ) = yp` (r)Y` m (ϑ, ϕ), (8.73) r wobei als Indizes die Quantenzahlen nr = 0, 1, . . ., ` = 0, 1, . . . und m = −`, −` + 1, . . . , ` sowie der Impuls p ∈ (0, ∞) auftreten. Glgn. (8.72) und (8.73) bilden eine vollständige b Das Spektrum von H b besteht aus einem System diskreter Eigenwerte im ONEB von H. Intervall zwischen dem Minimum von V (r) und Null (die zu den eigentlichen Eigenfunktionen gehören) und aus einem kontinuierlichen Spektrum, das sich von Null bis +∞ ausdehnt (und den uneigentlichen Eigenfunktionen entspricht). Die Orthogonalität und Normierung der φnr `m und φp`m sind direkte Konsequenzen der Glgn. (8.68) - (8.70) und Glg. (8.44). Tatsächlich erhalten wir aus diesen Gleichungen Z 3 dr φ∗n0r `0 m0 (x)φnr ` m (x) Z∞ = dr yn∗ 0r `0 (r)ynr ` (r) Z dΩ Y`∗0 m0 (ϑ, ϕ)Y` m (ϑ, ϕ) 0 Z∞ dr yn∗ 0r `0 (r)ynr ` (r) δ`0 ` δm0 m = δn0r nr δ`0 ` δm0 m (8.74) und auf gleiche Art und Weise Z d3 r φ∗p`0 m0 (x)φnr `m (x) = 0 Z d3 r φ∗p0 `0 m0 (x)φp`m (x) = δ(p0 − p)δ`0 ` δm0 m . (8.75) = 0 (8.76) Die Vollständigkeit dieser Basis kann gezeigt werden. Diese ist klar verständlich, wenn man sich bewusst macht, dass L2 (R3 ) in das Tensorprodukt von L2 ((0, ∞), r2 dr)63 und L2 (Ω) zerlegt werden kann. b werden durch die Quantenzahlen Die Eigenfunktionen von H nr , `, m p, `, m 63 diskretes Spektrum kontinuierliches Spektrum (8.78) L2 ((0, ∞), r2 dr) ist so definiert, dass Z∞ 2 dr r2 |R(r)| < ∞. 0 118 (8.77) bestimmt, wobei nr ` m radiale Quantenzahl azimutale Quantenzahl magnetische Quantenzahl (8.79) genannt werden64 . nr ist dabei die Anzahl der Nullstellen (mit r > 0, d.h. außerhalb des Ursprungs) der Funktion ynr ` (r). Sie sehen in Abb. D.35 das charakteristische Verhal~2 `(`+1) für ten der radialen Wellenfunktion für nr = 0, 1, 2. Da das Zentrifugalpotential 2m r2 größere Werte von ` stark zunimmt, wachsen die Eigenwerte Enr ` für festes nr mit steigendem ` deutlich an. Es gilt Enr ` < Enr `0 falls ` < `0 . Wir bemerken ebenfalls, dass die eigentlichen Eigenwerte (Energieniveaus) Enr ` nicht von der Quantenzahl m abhängen. Daher ist m von seinem Wesen her ein Entartungsindex und der Eigenwert Enr ` hat mindestens den Entartungsgrad 2` + 1. Im Allgemeinen entsprechen verschiedene Werte der Quantenzahlen (nr , `) verschiedenen Werten der Energieeigenwerte. Das Auftreten zweier gleicher Energieeigenwerte En0r `0 = Enr ` für verschiedene (n0r , `0 ) 6= (nr `) nennt man zufällige Entartung (accidental degeneracy). Ein wesentliches Beispiel dafür tritt beim Coulomb-Potential auf. Die Anzahl der gebundenen Zustände kann – abhängig von der Form des Potentials V (r) – endlich oder auch (abzählbar) unendlich sein. Eine hinreichende Bedingung für eine endliche Zahl der Bindungszustände ist, dass für große Abstände das Potential V (r) schneller als 1/r2 zu Null abfällt. Die Eigenwerte des kontinuierlichen Spektrums werden vollständig durch den Parameter √ p = 2mE bestimmt. In diesem Fall sind sowohl ` als auch m Entartungsindizes und der Entartungsgrad ist unendlich. Wir betrachten nun Glg. (8.65) und verwenden die Beziehung65 Zr dyp` (r) dyp∗0 ` (r) ∗ = ~ yp0 ` (r) − yp` (r) (p − p ) dr dr dr 0 nh h i i i 2 ∗ 0 − ~i p0 r ∗ 0 ~i p0 r i pr − ~i pr ~ 7−→ ~ C` (p )e p C` (p)e − D` (p)e + D` (p )e r→∞ ~ h ih io i i 0 ∗ 0 − i p0 r ∗ 0 ~i p0 r pr − ~i pr ~ ~ − D` (p )e C` (p)e + D` (p)e + p C` (p )e h ~ i i i 0 0 = C`∗ (p0 )C` (p)e ~ (p−p )r − D`∗ (p0 )D` (p)e ~ (p −p)r i~(p0 + p) + . . . , 02 2 yp∗0 ` (r0 )yp` (r0 ) 2 (8.80) wobei . . . für verschiedene Terme steht, die im Fall gleicher Impulse verschwinden66 . Dann gilt für p0 = p, dass die linke Seite verschwindet. Daher gilt aufgrund der rechten Seite |C` (p)|2 = |D` (p)|2 , (8.82) 64 Die Bezeichnung von ` als azimutale Quantenzahl, wie sie teilweise in der Literatur gebräuchlich ist, mutet befremdlich an, wenn man bedenkt, dass die entsprechende Quantisierungsbedingung aus der Polargleichung folgt. Von daher ist die Bezeichung als Drehimpulsquantenzahl sehr viel eingängiger. Namen sind Schall und Rauch, merken Sie sich einfach “`”! 65 Diese Beziehung ist leicht aus der Schrödingergleichung zu erhalten. 66 Diese Terme sind die folgenden Kombinationen von C` und D` : i h 0 0 i i C`∗ (p0 )D` (p)e− ~ (p +p)r − D`∗ (p0 )C` (p)e ~ (p+p )r i~(p0 − p). (8.81) 119 so dass sich C` (p) und D` (P ) nur durch eine Phase unterscheiden können. Dann gilt (p−p0 )r Zr sin ~ dr0 yp∗0 ` (r0 )yp` (r0 ) 7−→ 2~ |C` (p)|2 7−→ 2π~ |C` (p)|2 δ(p − p0 ), (8.83) 0 r→∞ r→∞ p −p 0 so dass die Normierungsbedingung |C` (p)| = √ 1 2π~ (8.84) erfordert. Unter diesen Umständen können wir die Phasenfaktoren so wählen, dass C` (p) = √ 1 eiα` (p) , 2π~ 1 e−iα` (p) , 2π~ (8.85) 2 pr cos [ + α` (p)] π~ ~ (8.86) D` (p) = √ so dass die uneigentliche Eigenfunktion die Form i i 1 h i pr+iα` (p) yp` (r) 7−→ √ e~ + e− ~ pr−iα` (p) = r→∞ 2π~ r annimmt. Wir bemerken dass die Art des Potentials sich in dieser Betrachtung nur in Form von α` (p), also der relativen Phase zwischen C` und D` , zeigt. 8.2.5 Parität Ein Zentralpotential ist grundsätzlich invariant unter Parität, d.h. V (x) = V (−x), da V (x) = V (r). Dann können die Eigenfunktionen als gerade oder ungerade Funktionen geschrieben werden. Die Eigenfunktionen, die wir bereits gefunden haben, besitzen eine wohldefinierte Parität. Tatsächlich gilt φnr `m (−x) = (−1)` φnr `m (x), φp`m (−x) = (−1)` φp`m (x). (8.87) Daher sind diese Eigenfunktionen gerade für gerades ` und ungerade für ungerades `. Glg. (8.87) ist eine Konsequenz der Symmetrie der Kugelflächenfunktionen, Y` m (π − ϑ, π + ϕ) = (−1)` Y` m (ϑ, ϕ), (8.88) und der Tatsache, dass x → −x in Polarkoordinaten der Transformation der Winkel ϑ → π − ϑ, ϕ→π+ϕ (8.89) entspricht. Die Symmetrie der Kugelflächenfunktionen in Glg. (8.88) ergibt sich wiederum aus den Symmetrien ihrer Faktoren, |m| |m| P` (−q) = (−1)`−|m| P` (q), 120 eim(ϕ+π) = (−1)m eimϕ . (8.90) 8.3 Freies Teilchen in sphärischen Koordinaten Ein spezieller Fall eines Potentials mit sphärischer Symmetrie ist der Fall von V = 0, d.h. wir können den bereits entwickelten Formalismus anwenden, um die Lösung für ein freies Teilchen in Kugelkoordinaten zu erhalten. Diese Lösung ist besonders nützlich für Streuprozesse.√Wir verwenden die reduzierte Radialgleichung, Glg. (8.56), und setzen V = 0 (daher k = 2mE/~), um d2 y `(` + 1) 2 y=0 (8.91) + k − dr2 r2 zu erhalten. Wir suchen Lösungen dieser Gleichung, und beginnen mit ` = 0. Dafür finden wir zwei linear unabhängige Lösungen sin(kr) und cos(kr), von denen aber nur die erste der Regularitätsbedingung am Ursrprung, y(r) 7−→ O(r), (8.92) r→0 genügt und damit als Lösung akzeptabel ist. Für r → ∞ zeigt diese Lösung ein Verhalten vom Typ der Glg. (8.65) und ist eine uneigentliche Eigenfunktion für E > 0. Für E < 0 divergiert die Lösung immer exponentiell, so dass keine Lösungen für E < 0 akzeptabel sind. Die Normierung ergibt sich durch Vergleich mit Glg. (8.86), r pr 2 y0 (p, r) = sin , (8.93) π~ ~ wobei der Impuls p = ~k ist. In diesem Fall haben wir bezüglich Glg. (8.86) die Phase α0 (p) = −π/2. Wir wollen nun ` 6= 0 betrachten. In diesen Fällen ist Glg. (8.91) nicht so einfach lösbar. Wir führen zunächst die dimensionslose Variable ρ = kr ein, so dass Glg. (8.91) zu d2 y` (ρ) `(` + 1) + 1− y` (ρ) = 0 (8.94) dρ2 ρ2 wird. Wir haben bereits gesehen, dass eine Gleichung wie Glg. (8.94) im Allgemeinen zwei unabhängige Lösungen hat, die sich für ρ → 0 wie ρ`+1 oder wie ρ−` verhalten. Man kann zeigen, dass die akzeptablen Lösungen von der Form ` 1 d sin ρ `+1 y` (ρ) = N` ρ (8.95) ρ dρ ρ sind und für große ρ finden wir d` `π ` y` (ρ) 7−→ N` ` sin ρ = N` (−1) sin ρ − . ρ→∞ dρ 2 (8.96) Daher sind diese Lösungen für E > 0 uneigentliche Eigenfunktionen, die zum kontinuierlib in diesem Fall nur das kontinuierliche Spektrum, chen Spektrum gehören. Daher besitzt H das mit dem Intervall (0, ∞) identifiziert werden kann. Der vollständige Satz der Eigenfunktionen ist r " ` # 2 1 d sin ρ yp` (r) = (−1)` ρ`+1 (8.97) π~ ρ dρ ρ pr ρ= 121 ~ und in diesem Fall gilt π α` (p) = −(` + 1) . 2 Aus Glg. (8.97) erhalten wir die unreduzierten Radialfunktionen r " ` # 2 yp` (r) 1 d sin ρ ` 1 ` Rp` (r) = = (−1) 3 p ρ r ρ dρ ρ ~2 π (8.98) . (8.99) ρ= pr ~ Der in Glg. (8.99) auftretende Ausdruck ` ` j` (ρ) = (−1) ρ 1 d ρ dρ ` sin ρ ρ (8.100) ist eine “klassische” Funktion der mathematischen Physik und wird als sphärische Besselfunktion der ersten Art bezeichnet67 . Für diese gilt ρ` , ρ→0 (2` + 1)!! 1 π j` (ρ) 7−→ cos ρ − (` + 1) . ρ→∞ ρ 2 j` (ρ) 7−→ (8.101) Die ersten Besselfunktionen sind sin ρ , ρ 3 j2 (ρ) = − ρ2 j0 (ρ) = sin ρ cos ρ j1 (ρ) = 2 − , ρ ρ 1 3 sin ρ − 2 cos ρ, . . . . ρ ρ (8.102) Zusammenfassend können wir die Eigenfunktionen für ein freies Teilchen in Kugelkoordinaten als r pr 1 2 φp`m (r, ϑ, ϕ) = 3 pj` ( )Y` m (ϑ, ϕ) (8.103) ~ ~2 π schreiben. Man kann eine nützliche Beziehung zwischen den durch Separation der Variablen in Kugelkoordinaten, Glg. (8.103), und in kartesischen Koordinaten erhaltenen Eigenfunktionen, i 1 p·x ~ (8.104) ϕp (x) = 3 e (2π~) 2 finden. Man findet ϕp (x) = X i` `,m p Y`∗m (α, β)φp`m (r, ϑ, ϕ), (8.105) wobei α und β die Winkel sind, welche die Richtung von p bzgl. der kartesischen Achsen beschreiben. Wir verweisen hierbei auf das Streuproblem in Kugelkoordinaten auf Übungsblatt 11. 67 Sie finden dazu mehr Details in mathematischer Standardliteratur oder auch auf Wikipedia. 122 8.4 Coulomb Potential und Wasserstoff Atom Ein weiterer sehr wichtiger Typ von Zentralpotential ist das Coulomb Potential, welches in der Untersuchung der Struktur des Wasserstoffatoms auftritt. Diese Betrachtung ist wesentlich für die Quantenphysik und die Grundlage für Diskussionen komplexerer Atome. Wir werden die Bewegung eines Teilchens der Ladung −e0 und der Masse me (das Elektron) in einem Coulomb-Feld eines raumfesten Kerns der Ladung Ze0 (Wasserstoff-artiges Atom) betrachten, d.h. das Potential ist Ze20 . V (r)) − r (8.106) Dann lautet die Radialgleichung, Glg. (8.56): d2 y Ze20 `(` + 1) 2me E+ − y = 0. + dr2 ~2 r r2 Wir definieren p 2m |E| , K= ~ a0 = ~2 , e20 me ζ= Z , Ka0 (8.107) (8.108) wobei a0 der Bohr’sche Radius ist, vgl. Glg. (2.27). Wir betrachten den Fall E < 0 (diskretes Spektrum) und führen einen dimensionslosen Radius ein, ρ = 2Kr. Dann erhält Glg. (8.107) die vereinfachte Form 1 ζ `(` + 1) d2 y + − + − y=0 (8.109) dρ2 4 ρ ρ2 als DGL zweiter Ordnung in y(ρ). Wir wir bereits besprochen haben, kann man zeigen, dass Glg. (8.109) zwei Lösungen hat, ρ`+1 ρ−` y(ρ) (8.110) und wir hatten auch bereits gesehen, dass lediglich die zweite Lösung akzeptabel ist (bei ρ → 0). WIr haben ebenso bereits angesprochen, dass für ρ → ∞ der Teil ζ/ρ−`(`+1)/ρ2 zu Null abfällt und die Lösung sich asymptotisch wie 1 e2ρ bzw. 1 e− 2 ρ (8.111) verhält, wobei hier nur das zweite Verhalten akzeptabel ist. Unter diesen Bedingungen empfiehlt sich ein Ansatz ρ y` (ρ) = ρ`+1 e− 2 v` (ρ). (8.112) Wir setzen den Ansatz aus Glg. (8.112) in die Radialgleichung, Glg. (8.109), ein und erhalten d2 v` dv` ρ dρ2 + (2` + 2 − ρ) − (` + 1 − ζ) v` = 0. (8.113) dρ Glg. (8.113) ist ein Spezialfall der Gleichung x d2 η dη + (c − x) − aη = 0 2 dx dx 123 (8.114) für die Funktion η(x). Diese wird als “konfluente” hypergeometrische Gleichung bezeichnet und hat bekannte Lösungen. In den Fällen mit c 6= 0, −1, −2, . . . hat sie immer eine Lösung, die mittels Potenzreihenansatzes bestimmt werden kann. Diese Lösung wird als “konfluente” hypergeometrische Funktion bezeichnet und hat die allgemeine Form Φ(a; c; x) ≡ 1 + ∞ X a(a + 1) . . . (a + n − 1) xn n=0 für c 6= 0, −1, −2, . . . c(c + 1) . . . (c + n − 1) n! (8.115) wobei eine zweite linear unabhängige Lösung exisitiert, η(x) = x1−c Φ(a − c + 1; 2 − c; x) für c 6= 1, 2. (8.116) Falls c stattdessen eine positive ganze Zahl ist, z.B. c = n + 1 mit n = 0, 1, . . ., so ist die zweite Linear unabhängige Lösung durch ΨI (a; n + 1; x) gegeben, wo ΨI (a; n + 1; x) die logarithmische Ableitung der Gamma Funktion Z∞ Γ (x) = dt tx−1 e−t (8.117) 0 ist. Für große Werte von x verhält sich ΨI (a; n + 1; x) wie ΨI (a; n + 1; x) 7−→ log x. (8.118) ρ→∞ In unserem Fall ist a = ` + 1 + ζ, c = 2` + 2 ` ∈ N0 . (8.119) Die zweite Lösung ist wegen ihres Verhaltens bei r → 0 nicht akzeptabel. Zusammenfassend finden wir also, dass die Lösung durch ρ y` (ρ) = Aρ`+1 e 2 Φ(` + 1 − ζ; 2` + 2; ρ) (8.120) gegeben ist und man kann zeigen, dass für ` + 1 − ζ 6= −nr , nr ∈ N0 (8.121) y` (ρ) ein inakzeptables Verhalten bei ρ → ∞ aufweist und daher keine quadratintegrable Lösung darstellt. Darum müssen wir ` + 1 − ζ = −nr (8.122) fixieren. In diesem Fall reduziert sich Φ(` + 1 − ζ; 2` + 2; ρ) auf ein Polynom vom Grad nr und y` ist eine eigentliche Eigenfunktion. Da wir aufgrund von Glg. (8.108) wissen, dass ζ = Z/(Ka0 ) und K 2 = 2m |E| /~2 gilt, finden wir (` + 1 + nr )2 = ζ 2 = Z 2 ~2 a20 2me |E| (8.123) und daher die Energieeigenwerte Enr ` Z 2 ~2 1 Z 2 e40 me 1 =− 2 . 2 = − 2 a0 2me (` + 1nr ) 2~ (` + 1nr )2 124 (8.124) nr muss mit der radialen Quantenzahl identifiziert werden, die wir in Glg. (8.79) eingeführt haben. Aufgrund der speziellen Abhängigkeit der Enr ` von nr und ` ist es praktisch, die Hauptquantenzahl n = nr + ` + 1 (8.125) einzuführen, so dass wir Glg. (8.124) als Z 2 e40 me 1 , n ∈ N = 1, 2, . . . 2~2 n2 schreiben können. Die entsprechende Eigenfunktion lautet En = − yn ` (r) = An ` (2Kn r)`+1 Φ(−n + ` + 1; 2` + 2; 2Kn r)e−Kn r , worin wir (8.126) (8.127) p 2m |E|n Z = (8.128) ~ na0 verwendet haben. Im Fall E > 0 (Streuung) erhält man die Lösung aus Glg. (8.127) indem man Kn → iK ersetzt und sich im Speziellen für das asymptotische Verhalten interessiert. Kn = Um die Struktur und damit die chemischen und physikalischen Eigenschaften des Wasserstoffatoms zu beschreiben, benötigen wir die Eigenfunktionen und Eigenwerte des diskreten Spektrums, welche wir im Folgenden detailliert besprechen wollen. Wenn wir R= 2π 2 me e40 me e40 = 4π~3 c h3 c (8.129) schreiben, können wir Glg. (8.126) in die Form 1 (8.130) n2 bringen, d.h. der Ausdruck für En is identisch zum Ausdruck für die Bindungsenergien in der Bohr’schen Theorie. Während die Eigenfunktionen von n, `, m abhängen, sind die entsprechenden Energieeigenwerte nur von der Hauptquantenzahl n = nr +`+1 abhängig. En = −RZ 2 hc Wie wir bereits gesehen haben, findet man perfekte Übereinstimmung68 mit experimentell gemessenen Werten, wenn man die Elektronenmasse durch die reduzierte Masse µ= me M me + M (8.131) 68 Es sollte eigentlich klar sein, dass echte Atome etwas komplizierter sind. Über die vom hier behandelten Coulomb-Problem vorgegebene Struktur hinaus besitzen reale Atome eine sogenannte Feinstruktur und auch eine Hyperfeinstruktur. Die zugehörigen Änderungen der Energieniveaus sind aber sehr klein, im Wesentlichen um eine Potenz von α (definiert in Glg. (8.146)) bei der Feinstruktur und zusätzlich um eine Potenz me /M für die Hyperfeinstruktur unterdrückt. Die Feinstruktur resultiert unter Anderem aus einer korrekten quantenmechanischen Behandlung der Photonen des Coulomb-Feldes (Vakuum-Polarisation), aus der Berücksichtigung relativistischer Korrekturen für das Elektron und aus einer Kopplung des Bahndrehimpulses mit dem inhärenten Drehimpuls (Spin) des Elektrons. Diese Korrekturen sind bei einer von vorne herein relativistischen Behandlung alle bereits erhalten und heben die Entartung der Energieniveaus mit unterschiedlicher Quantenzahl ` auf. Die Hyperfeinstruktur ist schließlich auf die Wechselwirkung des Kernspins mit dem durch das Elektron erzeugten Magnetfeld zurück zu führen. Weitere Details dazu gehen über die Vorlesung deutlich hinaus, aber werden Ihnen in Vorlesungen zur höheren Quantenmechanik oder Atomphysik sicher noch begegnen. Die perfekte Übereinstimmung ist hier folgendermaßen zu verstehen. Wenn man aus den experimentell gemessen Spektren die theoretisch berechneten Beiträge von Feinstruktur und Hyperfeinstruktur entfernt, dann erhält man ein Spektrum, dass perfekt mit dem Coulomb-Problem übereinstimmt. 125 des Elektron-Nukleus Systems ersetzt. Tatsächlich haben wir bisher die Elektronen so behandelt als bewegten sie sich im Coulomb Feld eines unendlich schweren Nukleus. Wenn wir berücksichtigen, dass der Nukleus eine endliche Masse besitzt, müssen wir die Schrödingergleichung für ein System von zwei Körpern lösen (Zweikörperproblem). Dazu separieren wir wie in der klassischen Mechanik die Bewegung des Schwerpunkts und erhalten eine Schrödingergleichung für die Relativkoordinaten die bis auf die Ersetzung von me durch die reduzierte Masse µ von der gleichen Form wie im Fall des als unendlich schwer angenommenen Kerns ist. 8.4.1 Exkurs: Relativ- und Schwerpunktskoordinaten Der Hamiltonoperator eines allgemeinen Zwei-Teilchensystems ist pb22 pb21 b b2 ). + + V (b x1 , x H= 2m1 2m2 (8.132) Wenn das Potential ausschließlich aus deren Wechselwirkung besteht, d.h. keine äußere Kraft vorliegt, kann diese Kraft nur vom Relativvektor der beiden Teilchen abhängen, d.h. b2 ) = V (b V (b x1 , x x1 −b x2 ). Wir führen nun die Gesamtmasse M und reduzierte Masse µ sowie die Schwerpunktskoordinate R und den Gesamtimpuls P sowie die Relativkoordinate r und den Relativimpuls p ein, M = m1 + m2 , µ= m1 m2 , m1 + m2 b 1 + m2 x b2 b = m1 x R , m1 + m2 Pb = pb1 + pb2 , b=x b1 − x b2 , x pb = m2 pb1 − m1 pb2 , m1 + m2 (8.133) (8.134) und übertragen damit die Bewegung zweier realer Teilchen auf eine Beschreibung der Bewegung zweier fiktiver Teilchen. Eines davon hat die Gesamtmasse M , befindet sich b und hat dem Gesamtimpuls Pb , während auf dieses keinerlei am Ort des Schwerpunkts R äußere Kraft wirkt – es ist ein freies Teilchen. Das andere hat die Masse µ, befindet sich b, hat den Impuls pb und erfährt das Potential V (b am Ort x x). Die Geschwindigkeit des b = pb1 /m1 − pb2 /m2 gemessen. Es zweiten fiktiven Teilchens wird durch den Operator p/µ gilt offensichtlich für die Impulse pb2 pb2 Pb 2 pb21 + 2 = + 2m1 2m2 2µ 2M (8.135) und für die Drehimpulse b1 × pb1 + x b2 × pb2 = x b × pb + R × Pb x bzw. b `b1 + `b2 = `b + L. (8.136) Die Vertauschungsrelationen lassen sich auf die Relativ- und Schwerpunktskoordinaten übertragen, so dass lediglich die Kombinationen [b xi , pbj ] = i~δi j , b i , Pbj ] = i~δi j , [R (8.137) nicht-trivial sind, während die anderen Kommutatoren verschwinden. Der Hamiltonoperator zerfällt in 2 b2 b = P + pb + V (x) H (8.138) 2M 2µ 126 und die Eigenvektoren können als Tensorprodukt von Eigenvektoren zum Hamiltonopeb r der Relativkoordinaten und der Eigenvektoren zum Hamiltonoperator H b R der rator H Schwerpunktskoordinaten geschrieben werden, vgl. hierzu unter formalen Gesichtspunkten die Diskussion zu Glg. (8.2). Jeder Eigenvektoren bildet jeweils ein vollständiges System, so dass Relativ- und Schwerpunktsbewegung entkoppeln. Die Schrödingergleichung in diesen Koordinaten lautet dann ~2 ~2 ∆R − ∆x + V (x) Φ(R, x) = EΦ(R, x) (8.139) − 2M 2µ und der Separationsansatz lautet Φ(R, x) = φ̄(R)φ(x). (8.140) Die separierten Gleichungen sind 2 b R φ̄(R) = − ~ ∆R φ̄(R) = ER φ̄(R), H 2M2 ~ b Hr φ(x) = − ∆x + V (x) φ(x) = Er φ(x) 2µ (8.141) (8.142) und die Energie werden einfach addiert, E = ER + Er . (8.143) Die anfängliche Wellenfunktion ist das Produkt der zwei Faktoren φ̄(R) und φ(x). Diese Eigenschaft bleibt beim Übergand zum Schwerpunktsystem unverändert. Da die Schwerpunktsbewegung sich als Bewegung eines freien Teilchens gestaltet, erfordert die Lösung des Zweiteilchen-Problems lediglich die Lösung eines Einteilchen-Problems in einem externen Potential V (x). 8.4.2 Termschema und Quantenzahlen Das Schema der Energieniveaus ist in Abb. D.10 gezeigt. Außer n = 1 sind alle anderen Energieniveaus entartet. Wir finden ~ λe /(2π) ~2 = = = 0.529 × 10−10 m Bohr’scher Radius, (8.144) 2 me e 0 me cα α E1 = − 13.6 eV = −1 Ry für Z = 1 (Wasserstoff), (8.145) e2 1 α= 0 = Sommerfeld’sche Feinstrukturkonstante. (8.146) ~c 137.037 a0 = Atomare Spektren entstehen durch Übergänge zwischen den diskreten Energieniveaus. Im Wasserstoffatom ist die Energieänderung beim Übergang von einem Anfangszustand m zu einem Endzustand n durch 1 1 ~ωm n = Em − En = 1 Ry − 2 + 2 (8.147) m n gegeben. Daher finden wir das Ritz’sche Kombinationsprinzip. 127 Die Eigenfunktionen des diskreten Spektrums sind φn ` m (r, ϑ, ϕ) = yn ` (r) Y` m (ϑ, ϕ), r (8.148) wo yn ` durch Glg. (8.127) definiert sind. Der Wertebereich der Quantenzahlen ist m = 0, ±1, ±2, . . . , ` = 0, 1, 2, . . . n = ` + 1, ` + 2, ` + 3, . . . n = 1, 2, 3, . . . ` = |m| , |m| + 1, . . . m = −`, −` + 1, . . . , ` − 1, ` bzw. (8.149) (8.150) (8.151) Wir finden daher 2` + 1 unabhängige Eigenfunktionen für einen gegebenes Wertepaar (n, `) und n−1 X (2` + 1) = n2 (8.152) `=0 unabhängige Eigenfunktionen für den gleichen Wert n. Da die Energie eines Zustands lediglich von n abhängt, haben jeweils n2 Zustände die gleiche Energie. Wenn wir berücksichtigen, dass das Elektron einen intrinsischen Drehimpuls besitzt, der als Spin bezeichnet wird mit S = 1/2, kann jeder Zustand doppelt besetzt werden (mit zwei Elektronen von unterschiedlicher Spin Projektion). Daher ist für gegebenes n die tatsächliche Entartung 2n2 . Wir sehen, dass Eigenfunktionen zum gleichen n aber verschiedenen ` und m zwar zur gleichen Energie gehören aber physikalisch unterschiedliche Zustände des Atoms beschreiben. 8.4.3 Struktur der eigentlichen Eigenfunktionen In der Spektroskopie werden sind für Zustände69 mit bestimmtem ` folgende Bezeichnungen üblich: `=0 s Zustände `=1 p Zustände (8.153) `=2 d Zustände `=3 f Zustände Wir charakterisieren einen Zustand indem wir das Symbol s, p, d hinter die Hauptquantenzahl n stellen, z.B. 3p ist ein Zustand mit n = 3 und ` = 1. Dies charakterisiert den Zustand noch nicht vollständig, da es drei (zu m = 0, ±1 zugehörige) 3p Zustände gibt. Die Menge aller Zustände mit gleichem n wird als eine Schale bezeichnet, wobei hierbei die Begriffe K-Schale für n = 1, L-Schale für n = 2, M -Schale für n = 3, usw. usf. üblich sind. Wir haben einen Ausdruck für die yn ` unter Verwendung der “ konfluenten” hypergeometrischen Funktionen angegeben. Wir können diese Funktionen durch die assoziierten Laguerre Polynome ausdrücken. Diese sind durch n ds ρ d n −ρ s ρ e n = 0, 1, 2, . . . , s = 0, 1, . . . , n (8.154) Ln (ρ) ≡ s e dρ dρn 69 Man spricht hierbei auch von Orbitalen. 128 definiert, wobei L0n (ρ) Lsn (ρ) = Ln (ρ), = 0 ∀s > n, Lsn (0) s = (−1) n! n s (8.155) gilt. Die ersten assoziierten Laguerre Polynome sind L11 (ρ) = −1, L13 (ρ) = −3ρ2 + 18ρ − 18, L12 (ρ) = 2ρ − 4, L23 (ρ) = −6ρ + 18, L22 (ρ) = 2 L33 (ρ) = −6, . . . . (8.156) Die assoziierten Laguerre Polynome haben eine Beziehung zu den “konfluenten” hypergeometrischen Funktionen: n s s Φ(−n + s; 1 + s; ρ), (8.157) Ln (ρ) = (−1) n! s so dass wir für die Radialwellenfunktion auch −Kn r Rn ` (r) = Cn ` (2Kn r)` L2`+1 n+` (2Kn r)e (8.158) schreiben können. Hierbei ist Kn durch Glg. (8.128) definiert. Indem wir die Beziehung Z∞ 3 2`+1 2 = 2n [(n + `)!] dρ ρ2`+2 e−ρ Ln+` (n − ` + 1)! (8.159) 0 verwenden, finden wir für die Normierungskonstante s (n − ` − 1)! Cn ` = (2Kn )3 , 2n[(n + `)!]3 (8.160) so dass letzten Endes die Eigenfunktionen des Wasserstoffatoms als s ` 3 Zr 2Z (n − ` − 1)! − na 2Z 2Z 2`+1 e 0 r Ln+` r Y` m (ϑ, ϕ) φn ` m (r, ϑ, ϕ) = − na0 2n[(n + `)!]3 na0 na0 (8.161) geschrieben werden können. Die ersten Wellenfunktionen sind in der Tab. 9 gegeben. Die Eigenfunktionen in Glg. (8.161) bestimmen die geometrische Form und Ausdehnung des Wasserstoffatoms. Wir wollen nun deren allgemeine Charakteristika betrachten und beginnen mit dem niedrigsten Zustand 1s (n = 1, ` = 0, m = 0) mit der Eigenfunktion 1 − r φ1 0 0 = p 3 e a0 . πa0 (8.162) Die Wahrscheinlichkeitsverteilung des Elektrons im Atom ist durch |φ1 0 0 |2 = 1 − a2r e 0. πa30 (8.163) gegeben. Sie besitzt offensichtlich sphärische Symmetrie und fällt exponentiell zu Null ab für r → ∞. Das Atom besitzt keine wohldefinierte Grenze, innerhalb derer sich das Elektron befindet, sondern ist in gewisser Weise über den gesamten dreidimensionalen Raum 129 ausgedehnt, da die Wahrscheinlichkeit das Elektron bei einer beliebigen Distanz zu beobachten niemals vollständig verschwindet. Sie wird jedoch sehr klein, sofern der Abstand groß ist, z.B. r ≥ 2-3a0 . In diesem Sinne kann man also doch sagen, dass die Ausdehnung eines Wasserstoffatoms in seinem Grundzustand von der gleichen Größenordnung wie der Bohr’sche Radius ist. Wir wollen insbesondere die Wahrscheinlichkeit betrachten, dass das Elektron sich innerhalb eine Kugelschale mit Radius r und Dicke dr befindet, Es gilt 2 Zπ D(r)dr = r dr Z2π dϑ 0 |φ1 0 0 (r, ϑ, ϕ)|2 = |y1 0 (r)|2 dr = 0 4 2 − a2r r e 0 dr, a30 (8.164) und wir sehen, dass diese Funktion ihr Maximum bei r = a0 = 0.529 Å annimmt und dann schnell abfällt, vgl. Abb. D.36. Die angeregten Zustände n > 0 haben in vieler Hinsicht ähnliche charakteristische Eigenschaften. Ein wesentlicher Unterschied der Zustände mit ` > 0 ist, dass diese nicht mehr sphärisch symmetrisch sind. Um diese angeregten Zustände besser zu verstehen, ist es sinnvoll sich die über die Kugelschale integrierte Wahrscheinlichkeitsverteilung in r, d.h. D(r) anzusehen. Mit Blick auf Abb. D.37 sehen wir, dass es für n > 1 bestimmte Werte von r gibt, bei denen die Radialwellenfunktion auf Null abfällt, d.h. Rn ` (r) = 0. Diese Werte entsprechen Kugelschalen, auf denen die Wahrscheinlichkeitsdichte verschwindet. Um eine intuitive Vorstellung von der Wahrscheinlichkeitsdichte |φn ` m |2 zu erhalten, könnte man lokale Kurven in den jeweiligen Ebenen, z.B. in der xy Ebene zeichnen. Diese Abbildungen finden sich in vielen Büchern oder auch auf Wikipedia70 . Die genauere Struktur der Abhängigkeit der Eigenfunktionen von den Winkeln ϑ und ϕ kann zur physikalischen Bedeutung der Quantenzahlen ` und m in Beziehung gesetzt und verstanden werden. Wie wir bereits besprochen haben, kann `(` + 1)~2 als der Erwartungswert des b 2 des Elektrons im Zustand φn ` m verstanden werden, Quadrats des Drehimpulsoperators L und die Größe m~ kann als der Erwartungswert der z Komponente des Drehimpulsopebz , verstanden werden. In diesem Sinne entsprechen die Eigenfunktionen zu den rators, L gleichen Werten n und ` aber unterschiedlichen Werten von m (in passenden Linearkombinationen) lediglich verschiedenen Orientierungen der gleichen geometrischen Struktur im dreidimensionalen Raum. Betrachten Sie hierzu im Anhang. b 2 und L bz wohldeWir merken hier zwei Beobachtungen an. Zunächst sehen wir, dass L b b finierte Werte im Zustand φn ` m annehmen. Dies D E giltD jedoch E nicht für Lx und Ly . Wir bx und ∆L by beide von Null verschieden werden auf Übungsblatt 12 sehen, dass ∆L sind. Man kann zeigen (Übungsblatt 11), dass hrin ` Z+∞ 1 a0 3n2 − `(` + 1) = dx φ∗n ` m (x)rφn ` m (x) = 2Z (8.165) −∞ und insbesondere hrin ` a0 = Z 1 n(n + ) 2 70 (8.166) Behalten Sie hierbei im Hinterkopf, dass die Wellenfunktion immer zur Darstellung auf eine Ebene projiziert werden muss. Insbesondere sind die Orbitale px und py Linerarkombinationen der Orbitale zu ` = 1 und m = ±1. 130 gilt. Man kann ebenso 2 a2 1 r n n−1 = 02 n2 (n + 1)(n + ) Z 2 zeigen, so dass für φn n−1 m die radiale Unschärfe durch r q 1 na0 1 2 2 (n + ) h∆b rin n−1 = hb r in n−1 − hb rin n−1 = Z 2 2 (8.167) (8.168) gegeben ist. Somit ist die relative Fluktuation des Radius durch h∆b rin n−1 1 =√ 7−→ 0 hb rin n−1 2n + 1 n→∞ (8.169) gegeben. Wir sehen also, dass für große Energien die XXXX wohldefiniert sind, wie man es nach dem Korrespondenzprinzip erwarte würde. Zu den Radien merken wir als Letztes an, dass für eine gegebene Energie die Klassischen Bahnen mit maximalem Drehimpuls Kreisbahnen sind. Durch Superposition von Zuständen φn n−1 n−1 für große n könnte man Wellenpakete kanstruieren, die genau die Klassischen Kreisbahnen darstellen und das dritte Kepler’sche Gesetz erfüllen. Als allerletzten Punkt merken wir hier an, dass die Energie und der mittlere Radius (bzw. Bohr’sche Radius) unterschiedliches Skalenverhalten aufweisen, mα2 hri ∼ mαn2 . (8.170) En ∼ − 2 , n Damit hat man bereits eine recht klare Vorstellung, wie sich beispielsweise muonische Atome mµ = 106 MeV/c2 im Vergleich zu den üblichen elektronischen Atomen verhalten. Außerdem bekommt man ein intuitives Bild von der Größe eines zum Wasserstoff (oder Positronium, d.h. Wasserstoff mit einem Positron als Kern) analogen System der starken Wechselwirkung, einem sogenannten Quarkonium71 72 . 71 Beispielweise ist die starke Ladung für die Bindung eines Charm-Anticharm Quarkoniums (Charmonium) ungefähr αs ∼ 0.3 und die Masse des Charm Quarks ist ca. mc ∼ 1.27 GeV. Damit können Sie bereits die Größenordnung der Bindungsenergien dieser Zustände abschätzen. Die reale Bindungszustände der Quarkonia sind deutlich komplizierter, da aufgrund Feinstruktur und Hyperfeinstruktur deutlich relevanter sind als beim elektromagnetischen Systemen. Beide Punkte können Sie durch Überlegungen bzgl. des Abstands zwischen beiden Teilchen bereits verstehen. 72 Die Untersuchung von Quarkonia ist ein sehr aktives experimentelles und theoretisches Feld. Unter anderem ist die genaue Untersuchung von Quarkonia ein wesentlicher Schwerpunkt der Experimente P̄ANDA, BES III, Belle, BaBar, LHCb untersucht. Bei Collider Experimenten mit Schwerionen dienen die dabei produzierten Quarkonia als Testteilchen für die thermischen Eigenschaften des entstehenden Quark-Gluon-Plasmas (“The hottest stuff in the universe”), z.B. bei ALICE, CMS am LHC oder PHENIX und STAR am RHIC (BNL). Viele Aktivitäten der Forschungsgruppe T30f von Prof. Brambilla tragen zu diesem Feld mit Methoden der Effektiven Feldtheorie sowie mit numerischen Simulationen der Gitter Eichtheorie bei. Falls Sie daran Interesse haben, kommen Sie auf uns oder Ihre Tutoren zu! 131 9 Geladene Teilchen im elektromagentischen Feld Das interessanteste Charakteristikum des Wasserstoffatoms ist dessen Absorptions- bzw. Emissionsspektrum. Um dieses zu verstehen, müssen wir das Verhalten eines geladenen Teilchens (das Elektron im Atom) in einem externen elektromagnetischen Feld untersuchen und die Störungstheorie als Methode einführen. Im Rahmen dieser Methode diskutieren wir dann die Schrödingergleichung für eine geladenes Teilchen im elektromagnetischen Feld. Bisher haben wir das Verhalten eines Teilchens in einem Kraftfeld, das durch ein Potential beschrieben werden kann, betrachtet. Das Verhalten des Teilchens im elektromagnetischen Feld ist nicht von diesem Typ. Wir wollen nun die Verallgemeinerung der Schrödingergleichung für diesen Fall betrachten. Wir betrachten ein Teilchen mit Ladung e, das sich mit Geschwindigkeit v innerhalb eines elektrischen Felds E und eines magnetischen Felds B bewegt. Klassisch wirkt auf ein solches Teilchen die Lorentz-Kraft 1 (9.1) F =e E+ v×B . c Wir wissen aus der Elektrodynamik, dass wir die Felder E und B mittels elektromagnetischer Potentiale U (skalares Potential) und A (Vektorpotential) definieren können, 1∂ A, B)∇ × A. (9.2) c ∂t Für gegebenes E und B sind die Potentiale V und A nicht unzweideutig durch Glg. (9.2) festgelegt. Tatsächlich können wir immer eine Eichtransformation durchführen, E = −∇U − U →U− 1∂ Λ, c ∂t A → A + ∇Λ, (9.3) so dass E und B invariant bleiben. Der erste Schritt an dieser Stelle ist sich nun zu erinnern, welche Größen dem Klassische Drehimpuls L und der Klassische Hamiltonfunktion H für ein geladenes Teilchen der Ladung e entsprechen, wenn sich dieses durch die Felder E und B bewegt. In der Klassischen Mechanik finden wir die folgende Verallgemeinerung der Lagrangefunktion für den Fall geschwindigkeitsabhängiger Kräfte: 1 1 2 ẋ = v. (9.4) L(x, ẋ, t) = mẋ − e U (x, t) − ẋ × A , 2 c Um den Übergang zur Hamilton’schen Formulierung zu vollziehen, führen wir den kanonisch konjugierte Impuls ein, pi = ∂L e = mxi + Ai , ∂ ẋi c d.h. e p = mx = A, c (9.5) wobei wir mx als kinetischen Impuls73 bezeichnen. Wir sehen, dass p nicht mehr mit der rein kinetischen Größe übereinstimmt. Indem wir Glg. (9.5) invertieren, finden wir 1 e ẋ ≡ ẋ(p) = p− A (9.6) m c 73 Der kinetische Impuls ist als Ableitung der kinetischen Energie T definiert, mxi = ∂T /∂xi 6= ∂L/∂xi . 132 und die Hamiltonfunktion H(x, p, t) = [p · ẋ(p) − L(x, ẋ(p), t)] = 1 e 2 p − A + eU (x, t) = T + V. 2m c (9.7) 2 1 p − ec A die kinetische Energie und eV die potentielle Energie. Wenn Hierbei ist T = 2m das elektromagnetische Feld zeitunabhängig ist, gilt ∂A ∂U = =0 ∂t ∂t −→ ∂H =0 ∂t −→ dH = 0, dt (9.8) so dass die Energie in diesem Fall erhalten ist. In diesem Fall können wir Glg. (9.7) inklusive eines beliebigen zusätzlichen Potentials V (x) als quantenmechanischen Hamiltonoperator annehmen und die Schrödingergleichung als i~ ∂ b ψ(x, t) = Hψ(x, t) ∂t (9.9) schreiben, wobei der Hamiltonoperator die (symmetrisierte) Form74 pb2 e e2 b2 b b b b + Vb H= − pb · A + A · pb + A + eU 2m 2mc 2mc2 (9.12) annimmt. Dann folgt aus Glg. (5.108) b=A b · pb − i~∇ · A b pb · A (9.13) 2 2 b · pb + i~ e ∇ · A b+ e A b2 + eU b = pb − e A b + Vb H 2m mc 2mc 2mc2 (9.14) und wir finden Glg. (9.14) ist zur Anwendung besonders günstig. In Ortsdarstellung (indem wir pbx = −i~∂/∂x (usw.) schreiben) lautet der Hamiltonoperator 2 2 b = − ~ ∆x + i~ e A(x) · ∇ + i~ e ∇ · A(x) + e A2 (x) + eU (x) + V (x) (9.15) H 2m mc 2mc 2mc2 und die Schrödingergleichung kann als e e e2 ~2 2 A (x) + eU (x) + V (x) ψ(x, t) − ∆x + i~ A(x) · ∇ + i~ ∇ · A(x) + 2m mc 2mc 2mc2 ∂ = i~ ψ(x, t) (9.16) ∂t geschrieben werden. 74 Es gehört zu den nicht-trivialen Quantisierungsregeln, dass der kanonisch konjugierte Impulsoperator die Vertauschungsrelationen erfüllt. Es gelten die kanonischen Vertauschungsrelationen, [b xi , pbj ] = i~δi j , [b xi , x bj ] = [b pi , pbj ] = 0, (9.10) ḃj ] = i~δi j , [b xi , x ḃi , x ḃj ] = i~ e ijk Bk . [x c (9.11) aber es gilt auch 133 9.1 Bewegung im konstanten elektromagnetischen Feld Wir wollen nun ein (zeitlich wie räumlich) konstantes magnetisches Feld B betrachten. Es kann mittels eines Vektorpotentials A als 1 A(x) = − x × B 2 (9.17) geschrieben werden75 . Für diese Feldkonfiguration können wir die verschiedenen Terme in Glg. (9.15) berechnen76 . Mittels (a × b) · c = (b × c) · a = (c × a) · b = −(a × c) · b finden wir i~ e e A · ∇ψ(x, t) = −i~ (x × B) · ∇ψ(x, t) mc 2mc e e = +i~ (x × ∇) · Bψ(x, t) = − L · Bψ(x, t), 2mc 2mc (9.19) b = x b × p, b benutzt wobei wir die Impuls- und Drehimpuloperatoren, pb = −i~∇ und L haben. Wir erhalten ebenso e2 e2 e2 2 2 A ψ(x, t) = (x × B) ψ(x, t) = (ijk xj Bk ilm xl Bm )ψ(x, t) 2mc2 8mc2 8mc2 e2 e2 B 2 2 2 2 2 = (x B − (x · B) )ψ(x, t) = (x + y 2 )ψ(x, t), 8mc2 8mc2 (9.20) wo wir im letzten Schritt angenommen haben, dass das Magnetfeld entlang der z-Achse ausgerichtet ist, B = B ẑ. Der sogenannte Pauli Term in Glg. (9.19) trägt zum Paramagnetismus bei, während der Term in Glg. (9.20) zum Diamagnetismus beiträgt. Nun wollen wir die Größe der beiden Terme abschätzen und betrachten die Beträge. Wir sehen e2 B 2 (x2 8mc 2D e 2mc + y2) e a20 B e2 B −10 B E ∼ = ∼ 1.1 × 10 , 2 4c ~B 4~c e/a 1 Gs b 0 Lz B (9.21) D E bz ∼ ~ abgeschätzt haben. Wir erkennen, dass der quawobei wir x2 + y 2 ∼ a20 und L dratische Term grundsätzlich vernachlässigbar ist sofern hLz i = 6 0 gilt. Unter Laborbedingungen (B . 105 Gs) sind diamagnetische Effekte immer kleiner als paramagnetische Effekte für in Atomen gebundenen Elektronen. Es gibt jedoch auch physikalische Situationen, in denen diamagnetische und paramagnetische Effekte vergleichbar stark sind. Ein solcher Fall tritt beispielsweise bei freien Elektronen auf. Diamagnetismus ist wichtig bei der Behandlung von Materie unter extremen Bedingungen, wie sie auf der Oberfläche von Neutronensternen auftreten. Dort erreichen Magnetfelder Stärken von bis zu 1022 Gs, was 75 Es gilt offensichtlich 1 1 (∇ × A)i = ijk ∂j Ak = ijk (− klm xl Bm ) = − (δi l δjm − δi m δjl )δj l Bm 2 2 1 1 1 = (+δi m δjj − δi l δj m δj l )Bm = (+δjj − 1)Bi = (3 − 1)Bi . = Bi 2 2 2 76 Ohne Rechnung erkennt man, dass in diesem Fall ∇ · A = 0 gilt. 134 (9.18) gravierende Änderungen der atomaren Struktur zur Folge hat. Wir können den paramagnetischen Term ebenso mit der Coulomb Energie vergleichen, e hLz i B a0 mc a20 α −10 B 2mc ∼ ~B = B ∼ 2 × 10 . (9.22) 2 e 2 |e| 2 |e| 1 Gs r Auch hier sind paramagnetische Effekte bei typischen Laborfeldern als sehr klein anzusehen. 9.2 Normaler Zeeman Effekt Wie wir im vorigen Abschnitt gesehen haben, ist der Hamiltonoperator für das Wasserstoffatom77 im konstanten, äußeren Magnetfeld entlang der z-Achse durch 2 e0 bz = H b 0 + e0 B L bz b = pb + V (b r) + BL H 2me 2me c 2me c (9.23) gegeben, wobei H0 der Hamiltonoperator ohne äußeres Magnetfeld ist und V (r) = −e20 /r b 0 die Vertauschungsrelationen das übliche Coulomb Potential ist. Wir bemerken, dass für H b0, L bi ] = 0 [H für i = 1, 2, 3 (9.24) b stattdessen gelten, aber für H b L bz ] = 0, [H, b L bx ] 6= 0, [H, b L by ] 6= 0 [H, (9.25) gilt. Nach wie vor gilt b 2 ] = 0. b L [H, (9.26) b2 b0, L Glg. (9.25) bedeutet, dass Lx und Ly keine Erhaltungsgrößen mehr sind. Aber H bz vertauschen und haben ein vollständiges System gemeinsamer Eigenfunktionen, und L b 0 φn ` m = E (0) φn ` m H n` 2 2 b L φn ` m = ~ `(` + 1)φn ` m bz φn ` m = ~mφn ` m . L (9.27) (9.28) (9.29) Dann ergibt sich, dass die Energieeigenwerte des vollen Hamiltonoperators durch (0) b Hφn ` m = En ` + mµB B φn ` m , µB = e~ 2me c (9.30) gegeben sind. In dieser Näherung, in der Terme der Ordnung B 2 vernachlässigt wurden, ändert die Wirkung des äußeren Magnetfelds die Eigenfunktionen nicht, sondern modifiziert nur die Eigenwerte, die sich zu (0) En ` m = En ` + mµB B 77 (9.31) Beim Wasserstoffatom gilt e = −e0 , daher ist das Vorzeichen des Pauli Terms gegenüber Glg. (9.19) nur scheinbar gedreht. 135 ändern. Das Magnetfeld bricht die Rotationssymmetrie und führt eine privilegierte Richtung ẑ – die Richtung des Magnetfelds – ein. Daher wird die Entartung in m aufge(0) hoben und jedes Energieniveau En ` in 2` + 1 äquidistante Komponenten aufgespalten, vgl. Abb. D.38. Die Größe µB wird auch als Bohr’sches Magneton bezeichnet, µB = 0.9274 × 10−20 erg/Gs = 0.5788 × 10−8 eV/Gs. (9.32) Man kann für diese Ergebnisse eine intuitive Erklärung finden. Die Größe µ=− e0 L 2me c (9.33) kann als das aufgrund seiner Bahnbewegung dem Elektron zugeordnete magnetische Moment verstanden werden. Der im Hamiltonoperator auftretende Term −µ·B = e0 L·B 2me c (9.34) ist die Energie eines magnetischen Dipols µ im Feld B. Das gyromagnetische Verhältnis (auch gyromagnetischer Faktor) g = |µ| / |L| ist das Gleiche, das man in einer Klassischen Rechnung erhalten würde, wenn man das Elektron auf seiner Bahn als eine Kreisförmige Stromschleife behandeln würde. Aber man würde Klassisch für ein festes |L| alle Werte von Lz zwischen − |L| und |L| finden können, während in der QM lediglich Werte m~ auftreten. Daher gibt es nur eine diskrete Anzahl von zulässigen Orientierungen für L und µ. Glg. (9.16) hat Konsequenzen für die Struktur von Absorptions- und Emissionsspektren in einem externen Magnetfeld. Die Frequenz der Linie zum Übergang (n, `, m) → (n0 , `0 , m0 ) ist durch (0) νn `→n0 `0 (0) E − En0 `0 µB B µB B En ` m − En0 `0 m0 (0) = n` +(m−m0 ) = νn `→n0 `0 +∆m , (9.35) = h h h h (0) wobei νn `→n0 `0 die Frequenz der ohne äußeres Magnetfeld emittierten Strahlung ist. Man kann zeigen, dass die Theorie eine Reihe von Auswahlregeln liefert. Nicht alle denkbaren Übergänge sind tatsächlich möglich78 . Wir finden die Auswahlregeln ∆` = ±1, ∆m = 0, ±1. (9.36) (0) Dann sollte sich die Linie zu νn `→n0 `0 innerhalb des Magentfelds B in drei äquidistante Linien mit Frequenzen (0) νn `→n0 `0 − µB B , h (0) νn `→n0 `0 , (0) νn `→n0 `0 + µB B h (9.37) aufspalten. Dieses Ergebnis stimmt aber nicht mit experimentellen Beobachtungen überein. Insbesondere findet man, wenn man aus der Analyse der Spektrallinien die ursprünglichen Energieniveaus rekonstruiert, dass jedes Energieniveau sich in 2(2` + 1) Linien aufspaltet anstelle der 2` + 1 vorhergesagten Linien. Wie wir sehen werden, wird uns dies zur 78 Diese Auswahlregeln werden detailliert in QM II behandelt. Dazu benötigt man noch die Quantisierung des Strahlungsfelds und zerlegt dann den zugehörigen Wechselwirkungsoperator nach (verallgemeinerten) Drehimpulsoperatoren. Diese Drehimpulsoperatoren zwischen atomaren Wasserstoffzuständen bestimmen die Auswahlregeln. Die Auswahlregeln sind also Konsequenzen der Drehimpulserhaltung. 136 Einführung des Spins im nächsten Kapitel führen. Wenn man hingegen starke Magnetfelder verwendet, so dass µB B/h groß wird (im Vergleich zur Aufspaltung der Energieniveaus durch die Feinstruktur), nehmen die Linien die vorhergesagte Form an. Dieses Phänomen wird als Zeeman Effekt bzw. in diesem Fall als “normaler Zeeman Effekt” bezeichnet, da man die Anzahl der Linien N (bis auf die Quantisierung) auch aus Klassischen Modellen als Konsequenz der Präzessionsbewegung findet. Der Zeeman Effekt für schwache Magnetfelder mit einer Aufspaltung in 2(2` + 1) Linien wird als “anomaler Zeeman Effekt” bezeichnet und erfordert die Einführung des Spins. Der Wechsel vom anomalen zum normalen Zeeman Effekt bei steigendem Magnetfeld wird als PaschenBack Effekt bezeichnet. Eine schöne graphische Darstellung dieser Aufspaltungen ist auf Wikipedia zu finden. 137 10 Spin und Drehimpuls In QM wie auch in der Klassischen Physik kommt durch die Rotation eines Systems der Drehimpuls ins Spiel und Rotationsinvarianz der Bewegungsgleichungen spiegelt sich in der Erhaltung des Drehimpulses wider. Dies ist ein Beispiel für die fundamentale Verbindung zwischen Symmetrien und Erhaltungsgrößen, welche außerordentlich bedeutend für die QM und QFT sind. Die Unterschiede zwischen QM und Klassischer Mechanik bestehen darin, dass der Drehimpuls in der QM kein gewöhnlicher Vektor sondern ein Vektoroperator ist, dessen drei Komponenten nicht miteinander kommutieren. Wir haben bereits die Vertauschungsrelationen für die Drehimpulskomponenten ausgearbeitet, bh , L bk ] = i~hkl Ll , [L b 2, L bh ] = 0 [L (10.1) und wir haben bereits die Eigenwertgleichungen definiert, b 2 Y` m = ~2 `(` + 1)Y` m , L bz Y` m = ~mY` m . L (10.2) Wir verwenden nun die Dirac Notation, vgl. Anhang C, die Sie bereits als die Besetzungszahlnotation, vgl. Abschnitt 7.3, im Einsatz gesehen haben. Wir definieren die Vektoren |`, mi durch h`, m | xi = R∗ (r)Y`∗m (ϑ, ϕ), hx | `, mi = R(r)Y` m (ϑ, ϕ), (10.3) wobei R(r) der Radialteil der Wellenfunktion ist. Damit ist der Vektor |`, mi als Verallgemeinerung von Glg. (7.49) zu verstehen. Die Wirkung von Operatoren auf dem Raum dieser Vektoren kann völlig analog zum Fall von Abschnitt 7.3 durch Matrizen dargestellt werden. Wir schreiben damit die Eigenwertgleichungen als b 2 |`, mi = ~2 `(` + 1) |`, mi , L bz |`, mi = ~m |`, mi . L (10.4) Diese Vektoren sind also durch die explizite Darstellung in Kugelkoordinaten definiert. Nun wollen wir die gleichen Ergebnisse nur mittels Vertauschungsrelationen und allgemeinen Eigenschaften erhalten. Wir verwenden im Folgenden eine algebraische Methode, wie sie bereits beim harmonischen Oszillator benutzt wurde, vgl. Abschnitt 7.1. Dazu definieren wir auch hier Erzeugungs- und Vernichtungsoperatoren. Wir betrachten auf einem gegebenen Hilbertraum H drei hermitesche Operatoren Jbx , Jby und Jbz . Wir werden diese später mit den drei Komponenten des Spins eines Teilchens, mit den drei Komponenten seines Bahndrehimpulses oder mit den drei Komponenten des Drehimpulses eines komplizierteren Systems identifizieren. Wir wissen, dass Jb2 = Jbx2 + Jby2 + Jbz2 , [Jbi , Jbj ] = i~ijk Jbk und [Jb2 , Jbi ] = 0 für i = x, y, z (10.5) gelten. Wir können nun das vollständige Orthonormalsystem der gemeinsamen Eigenvektoren von Jb2 und Jbz betrachten. Im Allgemeinen bilden diese in H kein vSkO. Wir wollen b einen Operator bezeichnen, der mit Jb2 , Jbz sowie Jbx und Jby vertauscht. Dann kann mit A b so gewählt werden, dass A b zusammen mit Jb2 und Jbz ein vSkO bilden. A 138 10.1 Herleitung der Quantisierung Wir betrachten nun einen gegebenen Eigenwert ~2 λ von Jb2 und einen gegebenen Eigenb und bezeichnen den von den entsprechenden Eigenvektoren aufgespannten wert α von A Unterraum mit Hαλ . Dann wissen wir, dass Hαλ invariant unter der Anwendung der Operatoren Jbx , Jby und Jbz ist und dass innerhalb dieses Unterraum die Operatoren Jb2 b beide Vielfache der Identität (des Einsoperators) sind (Lemma von Schur). Wir und A wählen nun die Eigenwerte α und λ fest und beschränken uns auf den Unterraum Hαλ . Wir bezeichnen einen generischen Eigenvektor zu Jbz in Hαλ mit |mi und mit ~m den entsprechenden Eigenwert, Jb2 |mi = ~2 λ |mi , Jbz |mi = ~m |mi . (10.6) Nun führen wir Leiteroperatoren als Linearkombinationen inkompatibler Operatoren ein, Jb± = Jbx ± iJby . (10.7) Wir können zeigen79 , dass [Jbz , Jb± ] = ±~Jb± , [Jb± , Jb∓ ] = ±2~Jbz und Jb∓ = (Jb± )† . (10.9) Außerdem findet man nach kurzer Rechnung Jb∓ Jb± = (Jbx ∓ iJby )(Jbx ± iJby ) = Jbx2 + Jby2 ± i[Jbx , Jby ] = Jb2 − Jbz2 ∓ ~Jbz (10.10) und natürlich 1 b b J+ J− + Jb− Jb+ + Jbz2 . Jb2 = 2 Daher gilt aufgrund von Glgn. (10.6) und (10.10) Jb∓ Jb± |mi = ~2 [λ − m(m ± 1)] |mi und wir finden mittels Glg. (10.9) h i Jbz Jb± |mi = Jb± Jbz ± ~J+ |mi = ~(m ± 1)Jb± |mi . (10.11) (10.12) (10.13) Glg. (10.13) sagt aus, dass für jeden Eigenvektor |mi mit Eigenwert ~m (für Jbz ) ebenso die Vektoren Jb± |mi Eigenvektoren mit den Eigenwerten ~(m±1) (für Jbz ) sind. Dies bedeutet noch keine Quantisierung der Eigenwerte ~m, da im Prinzip beliebig nahe beieinander liegende Werte von m noch nicht ausgeschlossen sind. Dies nehmen wir als nächstes in Angriff. Wir betrachten nun den Eigenwert ~m0 . Dann erhalten wir durch iterative Anwendung von Glg. (10.13) Jbz Jb±p |m0 i = ~(m0 ± p)Jb±p |m0 i . (10.14) 79 Beides ist durch Einsetzen von Glg. (10.7) zu zeigen, denn [Jbz , Jb± ] = [Jbz , Jbx ] ± i[Jbz , Jby ] = i~Jby ± i2 ~(−Jbx ) = ±~(Jbx ± iJby ) = ±~Jb± . 139 (10.8) Daher können wir ausgehend von |m0 i die komplette Reihe von Zuständen Jb−q |m0 i , . . . , Jb−1 |m0 i , |m0 i , Jb+ |m0 i , . . . , Jb+p |m0 i (10.15) erzeugen, die den Eigenwerten ~(m0 − q), . . . , ~(m0 − 1), ~m0 , ~(m0 + 1), . . . , ~(m0 + p) (10.16) entsprechen. Diese Reihe sollte aber sowohl im oberen als auch im unteren Teil abbrechen. Das heißt, es sollte zwei Werte p0 und q0 geben, so dass Jb+p0 |m0 i = 6 0 und Jb+p0 +1 |m0 i = 0 Jb−q0 |m0 i = 6 0 und Jb−q0 +1 |m0 i = 0 (10.17) gilt. Nun wollen wir die Existenz minimaler und maximaler Werte von p0 und q0 bzw. minimaler und maximaler Eigenwerte ~m begründen. Wegen Glg. (10.12) gilt also Jb− Jb+ Jb+p |m0 i = ~2 [λ − (m0 + p)(m0 + p + 1)] Jb+p |m0 i , (10.18) Jb+ Jb− Jb−q |m0 i = ~2 [λ − (m0 − q)(m0 − q − 1)] Jb−q |m0 i , (10.19) sowie so dass für beliebig große Werte von p bzw. q die Eigenwerte von Jb∓ Jb± nicht mehr zwangsläufig positiv wären. Nun gilt aber aufgrund von Glg. (10.9), dass Jb∓ Jb± = (Jb± )† Jb± ein positiver Operator ist80 und daher 2 E D b b b b b (10.21) hm| J∓ J± |mi = J± m J± m = |J± mi ≥ 0 gelten muss. Dem widerspräche die Existenz negativer Eigenwerte, so dass diese verboten sein müssen. Wir müssen daher fordern, dass ein p0 bzw. q0 existiert, so dass Jb− Jb+ Jb+p0 |m0 i = ~2 [λ − (m0 + p0 )(m0 + p0 + 1)] Jb+p0 |m0 i = 0, (10.22) Jb+ Jb− Jb−q0 |m0 i = ~2 [λ − (m0 − q0 )(m0 − q0 − 1)] Jb−q0 |m0 i = 0. (10.23) Damit diese Gleichungen für einen beliebigen Eigenvektor |m0 i gelten, muss λ = (m0 + p0 )(m0 + p0 + 1) λ = (m0 − q0 )(m0 − q0 − 1) bzw. (10.24) realisiert sein und daher q0 − p 0 . (10.25) 2 Da p0 und q0 ganzzahlig sind, ist m0 ganz- oder halbzahlig. Wir definieren dann m0 = j = m0 + p0 = p0 + q0 2 und λ = j(j + 1), (10.26) so dass j ebenfalls notwendigerweise ganz- oder halbzahlig ist. Daher sind die erlaubten Eigenwerte von Jb2 von der Form ~2 j(j + 1) mit j ∈ {0, 12 , 1, 23 , 2, . . .}. Darüber hinaus 80 b ist durch Ein positiver Operator A b |χi ≥ 0 hχ| A ∀χ (10.20) definiert, d.h. er hat ausschließlich positive Eigenwerte. Wenn der Eigenwert Null ebenfalls auftritt, ist ein Operator strenggenommen positiv semidefinit. 140 bemerken wir mit Blick auf Glg. (10.16), dass die minimalen und maximalen Werte von m durch q0 + p0 q0 + p0 = −j und m ≤ m 0 + p0 = + = +j (10.27) m ≥ m0 − q0 = − 2 2 gegeben sind, so dass zu jedem j ein Satz von 2j + 1 Eigenwerten m gehört, m = j, j − 1, . . . , −j + 1, −j, (10.28) wobei dies unabhängig davon gilt, ob j ganz- oder halbzahlig ist. Die Eigenschaften der Eigenvektoren |mi hängen vom Wert j ab, so dass wir von jetzt ab den gegebenen Unterraum durch Hαj bezeichnen und die normierten Eigenvektoren von Jbz mit |j, mi bezeichnen, Jb2 |j, mi = ~2 j(j + 1) |j, mi , 10.1.1 Jbz |j, mi = ~m |j, mi . (10.29) Normierung Auf Grundlage der vorigen Diskussion können wir dann alle Zustände zu gegebenem j durch |j, mi = Cj−m Jb−j−m |j, ji , |j, mi = Cj+m Jb+j+m |j, −ji , (10.30) erzeugen. Dabei sind Cj±m Normierungskonstanten, welche bis auf einen Phasenfaktor eindeutig festgelegt sind. Mit dieser neu gewonnenen Einsicht können wir Glg. (10.19) als Jb− Jb+ Jb+p |m0 i = const Jb+p |m0 i , (10.31) Jb+ Jb− Jb−q |m0 i = const Jb−q |m0 i (10.32) schreiben oder auch als Jb− |j, mi = Kj−m |j, m − 1i , Jb+ |j, mi = Kj+m |j, m + 1i . (10.33) Bis auf die besagte Phase können die Koeffizienten Kj±m aus der Normierungsbedingung 2 1 1 hj, m − 1|j, m − 1i = − 2 Jb− |j, mi = − 2 hj, m| Jb+ Jb− |j, mi K K jm jm = ~2 (j(j + 1) − m(m − 1)) ~2 (j + m)(j − m + 1) = − 2 − 2 K K jm (10.34) jm bestimmt werden. Im letzten Schritt haben wir dabei Glg. (10.12) verwendet und finden damit also p − K = ~ (j + m)(j − m + 1). (10.35) jm Genauso erhält man das wenig überraschende Ergebnis p + K = ~ (j − m)(j + m + 1). jm (10.36) Die Phasenfaktoren der Kj±m hängen von der Konvention81 zu den Phasenfaktoren ab, die den Vektoren |j, mi zugewiesen werden. Wenn man diese so wählt, dass alle Kj−m reell 81 Die weiter unten beschriebene Konvention mit reellen Koeffizienten ist die Phasenkonvention von Condon und Shortley, kurz die Condon-Shortley Konvention. Diese ist am weitesten verbreitet. 141 und positiv sind, sind auch alle Kj+m reell und positiv, so dass wir p Jb− |j, mi = ~ (j + m)(j − m + 1) |j, m − 1i , (10.37) p Jb+ |j, mi = ~ (j − m)(j + m + 1) |j, m + 1i erhalten. Durch iterative Anwendung ergeben sich alle Zustände als q (j+m)! bj−m 1 √1 |j, mi = ~j−m J |j, ji , (j−m)! − (2j)! q (j−m)! bj+m 1 √1 |j, mi = ~j+m J |j, −ji . (j+m)! + (10.38) (2j)! Mittels Glg. (10.37) finden wir die Matrixelemente der Leiteroperatoren Jb+ und Jb− p hj, m0 | Jb∓ |j, mi = ~ (j ± m)(j ∓ m + 1)δm0 ,m∓1 . (10.39) Dann rekonstruieren wir Jbx und Jby aus den Leiteroperatoren und finden mittels 1 Jby = (Jb+ − Jb− ) 2i 1 Jbx = (Jb+ + Jb− ), 2 (10.40) die Matrixelemente p ~ p (j − m)(j + m + 1)δm0 ,m+1 + (j + m)(j − m + 1)δm0 ,m−1 , 2 (10.41) p ~ p (j − m)(j + m + 1)δm0 ,m+1 − (j + m)(j − m + 1)δm0 ,m−1 , hj, m0 | Jby |j, mi = 2i (10.42) hj, m0 | Jbz |j, mi = ~mδm0 ,m . (10.43) hj, m0 | Jbx |j, mi = Wir geben die Matrizen zu Jbx , Jby und Jbz für j = 21 und j = 1 in expliziter Form an. Bei j = 12 ~ ~ ~ 0 1 0 −i 1 0 j = 12 Jbx = Jby = Jbz = (10.44) i 0 2 1 0 2 2 0 −1 erkennen wir die Pauli-Matrizen 0 1 σ1 = 1 0 σ2 = 0 −i i 0 d.h. es gilt Jbx = ~2 σ1 , Jby = ~2 σ2 und Jbz = ~2 σ3 . Für 0 1 0 0 ~ ~ b b 1 0 1 i j = 1 Jx = √ Jy = √ 2 2 0 1 0 0 Schlussfolgerung: 142 σ3 = 1 0 0 −1 , (10.45) j = 1 erhalten wir −i 0 1 0 0 0 −i Jbz = ~ 0 0 0 . i 0 0 0 −1 (10.46) Alleine die Vertauschungsrelationen der Komponenten des Drehimpulsoperators sind ausreichend, um a priori die erlaubten Eigenwerte von Jb2 festzulegen und in einem beliebigen Unterraum Hαj die Eigenwerte und Eigenvektoren zu Jbz zu bestimmen und die Wirkung von Jbx und Jby auf diese zu berechnen. Dies sagt uns aber nicht, welche Eigenwerte von Jb2 für ein bestimmtes physikalisches System auftreten, d.h. welche Unterräume Hαj diesem zuzuordnen sind. Ferner sind die Operatoren Jbx , Jby und Jbz lediglich bis auf eine unitäre Transformation bestimmt. 10.2 Bezug zum Bahndrehimpuls Es ist nun interessant zu sehen, wie diese allgemeine Behandlung sich im Fall des Bahnb=x b 2, L bx , L by b × pb manifestiert. Hier haben wir bereits die Operatoren L drehimpulses L 2 b und L bz besprochen und die gemeinsamen Eigenvektoren zu A, b L bz konstruiert, und L φnr ` m = Rnr ` (r)Y` m (ϑ, ϕ) (10.47) wobei die Quantenzahlen durch nr = 0, 1, 2, 3, . . ., ` = 0, 1, 2, . . . und m = −`, . . . , +` gegeben sind. Die Eigenwertgleichungen sind b nr ` m = αnr ` φnr ` m , Aφ b 2 φnr ` m = ~2 `(` + 1)φnr ` m , L bz φnr ` m = ~mφnr ` m . L (10.48) (10.49) (10.50) b der Hamiltonoperator H b gewählt werden kann sofern In diesem Fall sahen wir, dass für A b2 das Potential einer Zentralkraft zugeordnet ist. Wir sehen, dass die Eigenwerte von L 2 bz genau von der allgemeinen Form für die Eigenwerte von Jb und Jbz sind, wenn man und L j durch ` ersetzt. Aber ` ist ganzzahlig und nimmt alle möglichen ganzzahligen Werte an. b 2 vollständig bestimmt sind, bedeutet, dass die Die Tatsache, dass die Eigenwerte von L Beziehung b=x b × pb L (10.51) eine physikalische Bedeutung hat die über die bloße Existenz der durch Glg. (10.51) erfüllten Vertauschungsrelation bx , L by ] = i~L bz [L und zyklische Permutationen (10.52) hinaus geht. 10.3 Spin Wir haben im vorigen Kapitel gesehen, dass man bei der Untersuchung der Feinstruktur von Alkaliatomen (Alkalimetalle wie etwa Natrium sind Elemente mit einem einzigen Elektron im s-Orbital der äußersten Schale) eine höhere Anzahl von Energieniveaus findet als man aufgrund der bisherigen Theorie erwarten würde. Insbesondere zeigt der “anomale Zeeman Effekt”, dass die Zahl der Energieniveaus doppelt so groß wie erwartet ist. 143 10.3.1 Historische Perspektive Die quantenmechanischen Postulate, die wir besprochen haben, übertragen das idealisierte Konzept eines materiellen Punktteilchens – d.h. eines massiven Objekts mit drei Translationsfreiheitsgraden – in den Formalismus der Quantenmechanik. Die Konfigurationen dieses Teilchens sind also durch drei Koordinaten gegeben. Wenn wir das Elektron stattdessen als einen starren Körper betrachten würden (wie in einigen Modellen des Elektrons von Lorentz), dann sollte dieses drei zusätzliche Freiheitsgrade der Rotation besitzen, beispielsweise die drei Euler Winkel. In einem solchen Falle könnte das Elektron nicht Energie in Form der Translationsbewegung aufnehmen, sondern auch in Form Rotationsbewegung, einer inneren Bewegung also. Durch diese “interne Bewegung” hätte das Elektron einen intrinsischen Drehimpuls und ein intrinsisches magnetisches Moment. Zwar sind sämtliche Modelle eines ausgedehnten Elektrons gescheitert, aber im Jahr 1925 schlugen Goudsmit und Uhlenbeck auf Grundlage dieser Ideen vor, dem Elektron einen intrinsischen Drehimpuls oder Spin S zuzuweisen. Das zugehörige magnetische Moment ist durch e0 S (10.53) µS = −gS 2me c gegeben, wobei gS ein zu bestimmender Proportionalitätsfaktor ist. Wie man sich mit Blick auf die Jahreszahl denken kann, arbeiteten Goudsmit und Uhlenbeck hierbei im Kontext einer auf den Bohr-Sommerfeld’schen Quantisierungsregeln beruhenden Theorie. Diese Theorie ergab Quantisierungsregeln für den Bahndrehimpuls: |L| ist auf Werte ~` p mit ` = 0, 1, 2, . . . beschränkt – unvereinbar mit ~ `(` + 1) wie wir in der echten QM gesehen haben – und Lz konnte 2` + 1 Werte annehmen (−~`,. . . +~`). 10.3.2 Das Stern-Gerlach Experiment In Abschnitt 2.3.4 und Abb. D.12 haben wir bereits das Stern-Gerlach Experiment als Nachweis der Raumquantisierung angesprochen. Dieses Experiment wurde im Jahr 1922 mit Silberatomen durchgeführt. Silberatome haben eine sphärisch symmetrische Ladungsverteilung plus ein weiteres 5s Elektron. Daher ist der gesamte Bahndrehimpuls des Silberatoms Null, ` = 0. Daher sollte keinerlei Aufspaltung auftreten. Wenn die Elektronen auf der äußersten Schale in einem 5p Zustand wären, würde man eine Aufspaltung in drei Linien erwarten. Stattdessen sieht man eine Aufspaltung in zwei Linien. Dies lässt sich dadurch erklären, dass der Spin des Elektrons den Wert 12 besitzt. 10.3.3 Vektormodell für Atome, Drehimpuls-Kopplung, Spin-Anomalie Dann nahmen sie an, dass ähnliche Quantisierungsregeln auch für den Spin S des Elektrons gelten sollten. Dann würden S die Werte s und ms (entsprechend zu ` und m) zugewiesen. Damit könnte jedes Energieniveau für das Elektron in einem magnetischen Feld in 2s + 1 verschiedene Niveaus aufgespalten werden. Die charakteristischen Eigenschaften des anomalen Zeeman Effekts erfordern 2S + 1 = 2 und daher s = 12 . Die Zuweisung des Spins s = 21 für das Elektron führte zum sogenannten “Vektormodell” des Atoms. In diesem Modell ist der Gesamtdrehimpuls J des Elektrons mit wohldefinier144 ten Regeln aus dem Bahndrehimpuls L und dem Spin S zusammengesetzt, J = L + S, (10.54) und das magnetische Moment aufgrund des Bahndrehimpulses, cL = − µ e0 b L, 2me c (10.55) wird mit dem magnetischen Moment aufgrund des Spins, cS = −gS µ e0 b S, 2me c (10.56) kombiniert um das gesamte magnetische Moment zu erhalten, b=µ cL + µ cS . µ (10.57) Das Vektormodell des Atoms erklärt die Charakteristika der Feinstruktur und des anomalen Zeeman Effekts, wenn wir gS 6= 1 (10.58) annehmen, d.h. wenn wir für das Elektron ein (im Vergleich zum Bahndrehimpuls) “anomales intrinsisches gyromagnetisches Verhältnis annehmen (Spin Anomalie). Man erhält eine gute Übereinstimmung mit experimentellen Daten (bis auf kleine Korrekturen, die man (im Wesentlichen) im Rahmen der QFT versteht), indem man gS = 2 (10.59) setzt. 10.3.4 Formalismus Die Konzept des Spins hat sich bei der Interpretation der Eigenschaften von Atomen und Molekülen als außerordentlich nützlich erwiesen. Insbesondere erlaubt der Spin eine präzise Formulierung des Pauli-Verbots und daher umfassendes Verständnis der Struktur des Periodensystems der Elemente. Heutzutage weisen wir allen Elementarteilchen einen intrinsischen Drehimpuls – den Spin – zu und betrachten diesen als ein charakteristisches, fundamentales Merkmal des Teilchens auf der gleichen konzeptionellen Ebene wie dessen Masse. Beispielsweise ordnen wir Spin 21 den Teilchen wie e± , µ± , p, n, ν, Λ, Σ, Ξ, . . . zu. Wir ordnen anderen Teilchen ganzzahlige Spins zu, beispielsweise Spin 0 für manche Mesonen – z.B. π und K Mesonen – und für das Higgs Teilchen, aber auch den Spin 1 für das Photon sowie diverse Mesonen – z.B. ρ und ω Mesonen – usw.82 In der QM wird ein Teilchen mit Spin als ein System beschrieben, das als fundamentale Observablen neben den drei Komponenten des Ortes x b, yb und zb und des (linearen) Impulses über drei b aufgeb b b weitere Observablen Sx , Sy und Sz verfügt, die als Komponenten eines Vektors S fasst werden. Diesen Observablen sind hermitesche Operatoren zugeordnet, die folgende Vertauschungsrelationen erfüllen: Es gibt auch Teilchen mit intrinsischem Spin 32 – z.B. das ∆ und das Ω Baryon – und schließlich weist man dem Graviton – sofern man es berücksichtigt – einen Spin von 2 zu. 82 145 [b xi , x bj ] = [b pi , pbj ] = 0, [b xi , pbj ] = i~δi j , [Sbi , Sbj ] = i~ijk Sbk . (10.60) (10.61) (10.62) b=x b × pb konstruieren und wir erhalten Aus x b und pb lässt sich der Bahndrehimpuls L bi , L bj ] = i~ijk L bk . [L (10.63) b sich auf eine intrinsische Eigenschaft des Teilchens bezieht und nicht von dessen Da S Bewegungszustand abhängen sollte, fordern wir bi , Sbj ] = 0. [b xi , Sbj ] = [b pi , Sbj ] = [L (10.64) b bilden zusammen in einem dem Teilchen zugeordnetem Hilb, pb und S Die Operatoren x bertraum ein irreduzibles System83 , d.h. jede andere Observable kann als Funktion dieser b2 , Sbz ] = 0 können wir ein gemeinfundamentalen Operatoren geschrieben werden. Da [S b2 und Sbz finden. Wie wir gesehen haben, sind die a sames System von Eigenvektoren zu S b2 von der Form ~2 s(s + 1) mit s = 0, 1 , 1, 3 , 2, . . . und priori möglichen Eigenwerte von S 2 2 im zu einem festen s gehörenden Unterraum gibt es zu Sbz die Eigenwerte ~s, . . . , −~s. Da b2 mit x b und pb kommutiert, folgt aus der Irreduzibilitätsbedingung, dass dieser Operator S zu 1 proportional ist. Nur ein einziger der möglichen Werte für s sollte für ein bestimmtes Teilchen realisiert werden. 10.4 Teilchen mit Spin 10.4.1 Schrödinger-Darstellung für ein Teilchen mit Spin Wir beginnen mit b2 = ~2 s(s + 1)1. S (10.65) Da s eine charakteristische Eigenschaft des betrachteten Teilchens ist, ist es ein gegebener, fester Wert. x b, yb, zb und Sbz bilden ein vSkO und wir bezeichnen mit |x, ms i dessen normierte Eigenvektoren, x b |x, ms i = x |x, ms i , yb |x, ms i = y |x, ms i , zb |x, ms i = z |x, ms i , Sbz |x, ms i = ~ms |x, ms i (10.66) mit ms = +s, +s − 1, . . . , −s. Die Orthonormalitätsrelation lautet hx0 , m0s |x, ms i = δm0s ms δ 3 (x0 − x). 83 (10.67) b B, b . . .} in einen Hilbertraum wird als irreduzibles System bezeichnet, Eine Menge von Operatoren {A, wenn es keinen Unterraum von eigentlichen Vektoren gibt, der unter allen Operatoren dieser Menge b invarianter Unterraum invariant ist. Ein Unterraum eines Hilbertraums wird als unter dem Operator A bezeichnet, wenn alle Vektoren aus diesem Unterraum durch diesen Operator auf Vektoren im selben b ∈ H̄ bzw. A( b H̄) ⊂ H̄. Unterraum abgebildet werden, d.h. χ ∈ H̄ ⇒ Aχ 146 Wir zerlegen einen allgemeinen Vektor χ in dem diesem Teilchen zugeordneten Hilbertraum nach den Basisvektoren, XZ XZ 3 |χi = d x |x, ms i hx, ms |χi = d3 x |x, ms i χms (x), (10.68) ms ms und finden hχ|ξi = XZ 3 dx 2 χ∗ms (x)ξms (x), kχk = ms XZ d3 x |χms (x)|2 . (10.69) ms Unser Hilbertraum kann ganz konkret mit einem System von 2s + 1 Kopien von L2 (R3 ) (des spinlosen Hilbertraums) identifiziert werden, 2s+1 H = L2 (R3 ) ⊗ . . . ⊗ L2 (R3 ) = L2 (R3 ) = L2 (R3 ) × C2s+1 , | {z } (10.70) 2s+1 Kopien wobei C2s+1 der Raum der komplexen Zahlen in 2s + 1 Dimensionen ist. In diesem Sinne würde man Vektoren als direktes Produkt schreiben, |x, ms i = |xi ⊗ |ms i . (10.71) Es ist auch hilfreich, den Wert von ms beginnend bei eins zu zählen, d.h. ω = s − ms + 1 ∈ {1, 2, . . . , 2s + 1} (10.72) und damit χms (x) → χω (x) zu schreiben. Dann können wir die Spinkomponenten über einen Spaltenvektor – einen sogenannten Spinor – verteilen, χ1 (x) χ2 (x) χ(x) = (10.73) .. . χ2s+1 (x) und für das Skalarprodukt Z hχ, ξi = d3 x χ1 (x) . . . χ2s+1 (x) ξ1 (x) .. . (10.74) ξ2s+1 (x) schreiben. Dann können wir auf Grundlage unserer vorangegangenen Definitionen und der uns inzwischen vertrauten Notation hx, ms | x bk |x0 , m0s i = xk δms m0s δ 3 (x − x0 ), hx, ms | pbk |x0 , m0s i = ~ ∂ δm m0 δ 3 (x − x0 ), i ∂xk s s hx, ms | Sbk |x0 , m0s i = δ 3 (x − x0 ) hms | Sbk |m0s i schreiben und mittels der Spinor Notation 147 (10.75) x bk χ1 (x) .. . = χ2s+1 (x) pbk χ1 (x) .. . Sbk χ1 (x) .. . = = χ2s+1 (x) xk χ1 (x) .. . = x bk χ2s+1 (x) χ2s+1 (x) x bk χ1 (x) .. . = xk χ1 (x) .. . (10.76) xk χ2s+1 (x) χ2s+1 (x) ~ ∂ χ (x) χ1 (x) pbk χ1 (x) i ∂xk 1 ~ ∂ .. .. .. = = . . . i ∂xk ~ ∂ χ2s+1 (x) pbk χ2s+1 (x) χ (x) i ∂xk 2s+1 (10.77) (SK )1,1 . . . (SK )1,2s+1 χ1 (x) .. .. .. (10.78) , . ... . . (SK )2s+1,1 . . . (SK )2s+1,2s+1 χ2s+1 (x) wobei (SK )ω,ω0 = hms | Sbk |m0s i ein Matrixelement des Spinoperators ist. Die hier eingeführte Darstellung wird als Schrödinger Darstellung für ein Teilchen mit Spin s bezeichnet. Dann kann des Zustandsvektor als ψ1 (x, t) .. ψ(x, t) = (10.79) . ψ2s+1 (x, t) dargestellt werden und der Ausdruck |ψω (x, t)|2 d3 x gibt die Wahrscheinlichkeit zur Zeit t an, im Volumen d3 x um den Punkt x den Wert Sz = ~(s − ω + 1) zu messen. Im Fall eines Teilchens mit Spin 21 und insbesondere im Fall eines Elektrons ist der Hilbertraum ein Raum von “Paaren” und das allgemeine Element hat die Form χ1 (x) χ(x) = . (10.80) χ2 (x) 10.4.2 Zustände und Spinoren b2 und Sbz betrachten. Da zu Sbz die Eigenwerte ± ~ Wir wollen nun die Operatoren S 2 gehören, verwendet man oft die Notation 1 |ms = + i = |+i , 2 1 |ms = − i = |−i , 2 (10.81) und stellt diese in einem Spaltenvektor |+i |−i (10.82) dar. Damit schreibt man ~ Sbz |±i = ± |±i , 2 b2 |±i = ~2 1 ( 1 + 1) |±i S 2 2 (10.83) und h+|+i = h−|−i = 1, h+|−i = h−|+i = 0. 148 (10.84) Wir können ebenso Leiteroperatoren definieren, Sb± = Sbx ± iSby 1 Sby = (Sb+ − Sb− ). 2i 1 Sbx = (Sb+ + Sb− ), 2 (10.85) Aus der vorangegangenen Diskussion ergibt sich Sb+ |+i = 0 Sb+ |−i = ~ |+i Sb− |+i = ~ |−i , Sb− |−i = 0 (10.86) so dass wir den Spinoperator mittels der Spinmatrizen in der Basis der |±i Zustände schreiben können, ! bi |+i h+| Sbi |−i h+| S Sbi = . (10.87) h−| Sbi |+i h−| Sbi |−i Aus Glgn. (10.86) und (10.87) folgt damit 0 1 0 0 Sb+ = ~ , Sb− = ~ , 0 0 1 0 ~ Sbz = 2 1 0 0 −1 , (10.88) so dass wir b = ~σ S (10.89) 2 schreiben können, wobei σ der Vektor der drei Pauli-Matrizen ist, 0 1 0 −i 1 0 σx = σ1 = , σy = σ 2 = , σz = σ3 = . (10.90) 1 0 i 0 0 −1 In diesem Fall ist diagonal in in der Sbx oder haben wir ein Beispiel für einen endlich-dimensionalen Zustandsraum. Sbz der Basis der |±i, aber wir hätten auch eine andere Basis wählen können, Sby diagonal wären. Pauli-Matrizen haben eine Reihe wichtiger Eigenschaften, die wir hier aufzählen: σ12 = σ22 = σ32 = 1 (1 = 2 × 2 Einheitsmatrix), [σx , σy ] = 2iσz bzw. [σi , σj ] = 2iijk σk , {σi , σj } = σi σj + σj σi = 2δi j 1, σi σj = δij 1 + iijk σk , Tr σi = 0 für i = {1, 2, 3}, det σi = −1 für i = {1, 2, 3}. (10.91) (10.92) (10.93) (10.94) (10.95) (10.96) Diese Beziehungen gelten unabhängig von der Darstellung und es gilt (a · σ)(b · σ) = 1 (a · b) + iσ · (a × b) (10.97) für beliebige Vektoren a und b, wenn diese mit σ kommutieren. In dieser Darstellung kann eine beliebiger Spin-Zustand mittels der Basis |±i als |χi = α+ |+i + α− |−i 149 (10.98) geschrieben werden, wobei α± komplexe Koeffizienten sind. Die Normierung erfordert 1 = hχ|χi = |α+ |2 + |α− |2 . (10.99) Der Zustand kann auch als Spinor (d.h. als Spaltenvektor) geschrieben werden, α+ χ= , α+ = h+|χi , α− = h−|χi . (10.100) α− Die Vollständigkeitsrelation der Spin 1 2 Basis kann auch als (|+i h+|) + (|−i h−|) = 1 (10.101) oder in Matrixnotation 1 0 1 0 0 0 1 0 (1 0) + (0 1) = + = = 1. 0 1 0 0 0 1 0 1 10.4.3 (10.102) Schrödingergleichung für ein Teilchen mit Spin Wir wollen nun die Schrödingergleichung für ein gebundenes Elektron im Potential V (x) beschreiben, welches sich innerhalb eines externen elektromagnetischen Felds befindet. Die Klassische Hamiltonfunktion ist 1 e0 e 0 2 H= p + A − e0 U + (g − 1)S · E × p − µS · B (10.103) 2 2 S c{z } |2me c |2m {z } wobei der erste Teil die Hamiltonfunktion eines geladenen Teilchens im elektromagnetischen Feld ist und der zweite Teil die Wechselwirkung des intrinsischen magnetischen Moments mit dem Feld darstellt. −µS · B ist die statische Energie eines magnetischen Dipols in einem äußeren Magnetfeld. Der Term 2me20 c2 (gS −1)S ·E ×p ist das Drehmoment, e das auf einen magnetischen Dipol wirkt, wenn sich dieser durch ein externes elektrisches Feld bewegt. Wir erhalten den quantenmechanischen Hamiltonoperator, indem wir b, x→x b p → p, µS → − e0 gS b S 2me c (10.104) ersetzen84 Darüber hinaus gilt für ein statisches Feld (d.h. für ein zeitunabhängiges Feld) E = −∇U (x), d.h. wir können bk , pbl ] = [E ~ ∂2 U, i ∂xl ∂xk (10.106) (10.107) so dass 2 b · (E b × p) b · (pb × E). b (10.108) bk pbl = ~ mkl Sbm ∂ bk = −S b = mkl Sbm E S U + mkl Sbm pbl E i ∂xl ∂xk 84 Wir bemerken, dass hier die Operatorordnung kein Problem darstellt, da die Operatoren vertauschen: b·B b =B b ·S b S und b · (E b × p) b × p) b b = (E b · S. S 150 (10.105) Insbesondere ist die Form des Hamiltonoperators für ein Elektron in einem Alkaliatom85 bei Anwesenheit eines konstanten äußeren Magnetfelds von Interesse. Bei einem derart symmetrischen System besitzt das auf das Elektron wirkende elektrostatische Feld sphärische Symmetrie und es gilt 1 ∂U b b b·E b × pb = −S b · ( 1 ∂U x b × p) b =− S S · L, r ∂r r ∂r (10.109) wobei wir ∂U (r) ∂U (r) x ∇r = − ∂r ∂r r verwendet haben. In Abwesenheit eines magnetischen Felds finden wir − ∇U (r) = − 2 b · L. b b = pb + V (r) + q(r)S H 2m (10.110) (10.111) Hierbei ist der letzte Term die sogenannte Spin-Bahn-Wechselwirkung und es gilt V (r) = −e0 U (r), q(r) = (gS − 1) 1 ∂V (r) . 2m2e c2 r ∂r (10.112) In Anwesenheit eines konstanten Magnetfelds und unter Vernachlässigung der Terme proportional zu B 2 erhalten wir – unter Verwendung der bereits für den Fall eines (spinlosen) geladenen Teilchens im externen Magnetfeld gefundenen Ergebnisse, vgl. Kapitel 9 – den Hamiltonoperator 2 b·L b + e0 B · ( L b +g S b ). b = pb + V (r) + q(r)S H | {z S } 2m 2me c (10.113) b b =J+(g S −1)S Diese Gleichungen sind die Grundlage zur Erklärung der Multiplett-Struktur in den Spektren der Alkalimetalle und von Wasserstoff und zur Erklärung des anomalen Zeeman Efb·L b vertauscht nicht mit dem Drehimpuls L, b so dass die fekts. Der Spin-Bahn Term q(r)S b in einem System mit Spin nicht mehr die Rolle als Konstanten der Komponenten von L Bewegung haben. Stattdessen können wir b · L] b = [Jbk , Sbl ]L bl + Sbl [Jbk , L bl ] = i~ klm (Sbm L bl + Sbl L bm ) = 0. [Jbk , S |{z} | {z } antisym. (10.114) symmetrisch Damit sehen wir, dass ohne äußeres Magnetfeld die Komponenten von Jb Konstanten b 2 nach wie vor eine Konstante der Bewegung, so der Bewegung sind. Außerdem ist L b 2 , Jb2 b L dass eine möglich Wahl der kompatiblen Konstanten der Bewegung durch H, 2 2 b b b und Jz gegeben ist. Auch in Anwesenheit eines Magnetfelds sind L und J immer noch Konstanten der Bewegung, während Jbz lediglich unter der Annahme B k ẑ tatsächlich noch eine Konstante der Bewegung ist. 85 Die allgemeinen Eigenschaften der Spektren von Alkalimetallen können durch eine Behandlung dieser Elemente als Atome mit einem einzigen Elektron erklärt werden, d.h. indem man das Verhalten des optischen Elektrons in einem mittleren Feld betrachtet, welches vom Kern und den Elektronen auf den weiter innen liegenden Schalen ausgeht. Das mittlere Feld, das auf das optische Elektron wirkt, kann als sphärisch symmetrisches Potential V (r) aufgefasst werden. 151 Der Spin-Bahn Wechselwirkungsterm ist ein Term, der von der Ordnung (v/c)2 ist, d.h. b Wir haben bisher ausschließvon der selben Ordnung wie relativistische Korrekturen zu H. lich nicht-relativistische QM betrachtet. Relativistische Korrekturen zur Schrödingergleichung können aus dem nicht-relativistischen Grenzfall der Diracgleichung erhalten werden. In Anwesenheit von einem elektrostatischen Zentralfeld und eines konstanten magnetischen Felds ist der zur Diracgleichung gehörige Hamiltonoperator in nicht-relativistischer Näherung (Entwicklung in (v/c)2 und in der inversen Masse des Teilchens, d.h. in 1/me ) durch 2 b + gS S) b b 0 = pb + V (r) + e0 B · (L H 2m 2me c 2 2 2 2 b ·S b + ~ ∆x V (r) + e0 (B × x b 1 = − (pb ) + q(r) L b )2 H 8m2e c2 8m2e c2 8me c2 {z } {z } | | {z } | {z } | I II III (10.115) (10.116) IV gegeben. pDer Term I ist die erste relativistische Korrektur aus der kinetischen Energie, Ep = p2 c2 + m2e c4 und der Term II ist der Spin-Bahn Term. Der Term III ist der sogenannte Darwin-Term, welcher kein Klassisches Analogon besitzt. Der letzte Term IV schließlich wird ohne tieferen Sinn als B 2 Term bezeichnet und hat – wie wir bereits festgestellt haben – einen Bezug zum Diamagnetismus. Alle diese Terme sind von der gleichen Größenordnung, aber den Spin-Bahn Term ist im b und L b verAllgemeinen am wichtigsten. Da dieser nicht mit den einzelnen Operatoren S tauscht, ist der Spin-Bahn Term für die Verdopplung der Energieniveaus verantwortlich. Die anderen Terme verschieben die Energieniveaus lediglich, aber verändern nicht deren Multiplizitäten. Eine Vorhersage der Diracgleichung ist der Wert gS = 2, welcher bis auf prinzipiell verstandene quantenfeldtheoretische Korrekturen sehr gut mit dem experimentellen Wert übereinstimmt86 . Man kann die Beiträge aller dieser Terme im Rahmen der Störungstheorie bestimmen. 10.5 Kopplung von Drehimpulsen & Clebsch-Gordan Koeffizienten Die vorherige Beobachtung, dass in Anwesenheit des Spin-Bahn Terms der Gesamtdreb+S b erhalten ist, während L b und S b beide einzeln nicht erhalten sind, himpuls Jb = L führt uns dazu, die Kopplung zweier Drehimpulse im Allgemeinen zu behandeln. Wir betrachten zwei Drehimpulse Jb1 und Jb2 , die miteinander vertauschen, d.h. [Jb1 k , Jb2 l ] = 0 ∀ k, l ∈ {1, 2, 3}. 86 (10.117) Die Bestimmung dieser Korrekturen, die im Allgemeinen unter dem Rahmenbegriff g − 2 firmiert, ist eines der aktivsten Forschungsgebiete zur Suche nach “neuer Physik” jenseits des Standardmodells (der Elementarteilchenphysik). Tatsächlich findet man nach derzeitigem Stand der Forschung eine Diskrepanz von ca. fünf Standardabweichungen zwischen dem experimentell gemessenen und dem theoretisch berechneten Wert für g − 2 beim Muon und beide Werte sind mit über zehn Stellen Genauigkeit bekannt. Beim Elektron ist die Übereinstimmung wesentlich besser, was wahrscheinlich daran liegt, dass das ca. 200 mal schwerere Muon im Mittel deutlich näher am Kern ist (der Bohrradius skaliert mit der inversen Masse). Daher ist es plausibel, dass Muon und Elektron verschieden große Empfindlichkeiten für diverse physikalische Effekte haben. Die entsprechenden Messungen und Rechnungen erfordern Beiträge aus allen denkbaren Bereichen der Teilchenphysik und bilden eine der großen physikalischen Herausforderungen der ersten Hälfte des 21. Jahrhunderts. 152 Wir definieren den Gesamtdrehimpuls Jb = Jb1 + Jb2 (10.118) [Jb, Jb12 ] = [Jb, Jb22 ] = [Jb, Jb1 · Jb2 ] = 0. (10.120) und finden87 damit Wir betrachten Eigenfunktionen zum Satz der Drehimpulsoperatoren Jb12 , Jb22 , Jb1 z und Jb2 z , Jb12 |j1 , m1 ; j2 , m2 i = ~2 j1 (j1 + 1) |j1 , m1 ; j2 , m2 i , Jb2 |j1 , m1 ; j2 , m2 i = ~2 j2 (j2 + 1) |j1 , m1 ; j2 , m2 i , (10.121) Jb1 z |j1 , m1 ; j2 , m2 i = ~m1 |j1 , m1 ; j2 , m2 i , Jb2 z |j1 , m1 ; j2 , m2 i = ~m2 |j1 , m1 ; j2 , m2 i , (10.123) 2 (10.122) (10.124) und wollen diese durch Eigenfunktionen zum Satz der Drehimpulsoperatoren der gekoppelten Basis88 , Jb12 , Jb22 , Jb2 und Jbz , Jb12 |j, mi0 = ~2 j1 (j1 + 1) |j, mi0 , Jb22 |j, mi0 = ~2 j2 (j2 + 1) |j, mi0 , Jb2 |j, mi0 = ~2 j(j + 1) |j, mi0 , 0 0 Jbz |j, mi = ~m |j, mi , (10.125) (10.126) (10.127) (10.128) ausdrücken. Da Jb12 und Jb22 mit Jb kommutieren, folgt dass der Unterraum der Vektoren |j1 , m1 ; j2 , m2 i zu festen Werten j1 und j2 invariant unter der Anwendung der Operatoren Jbx , Jby und Jbz ist. Daher müssen die Vektoren |j, mi0 innerhalb desselben Unterraums liegen. Da Jbz = Jb1 z + Jb2 z ist, gilt Jbz |j1 , m1 ; j2 , m2 i = ~(m1 + m2 ) |j1 , m1 ; j2 , m2 i . (10.129) Daher müssen wir Linearkombinationen der Vektoren |j1 , m1 ; j2 , m2 i konstruieren, die zu einem gegebenen Wert von m1 + m2 gehören und ebenfalls Eigenvektoren zu Jb2 sind. Um die Struktur zu verdeutlichen, bilden wir eine Tabelle. Wir verlangen hierbei j2 ≤ j1 , um die Diskussion überschaubarer zu halten. In der Tabelle sind die zum gleichen Wert von m1 + m2 gehörenden Vektoren in der gleichen Zeile aufgeführt, wobei der Wert von m1 von links nach rechts abnimmt. Nur ein einziger Vektor tritt in der ersten Zeile zu m1 + m2 = j1 + j2 auf. In den anderen Zeilen bis zur Mitte bei m1 + m2 = j1 − j2 hin nimmt die Zahl der Vektoren in Schritten von Eins zu, d.h. die mittlere Zeile beinhaltet 2j2 + 1 Vektoren. Von dieser Zeile an bis zur Zeile zu m1 + m2 = −(j1 − j2 ) bleibt die Zahl der Vektoren unverändert. Anschließend nimmt die 87 Der letzte Ausdruck der folgenden Gleichung folgt offensichtlich aus [Jb, Jb2 ] = 0 durch Ausmultiplizieren: 2Jb1 · Jb2 = Jb2 − (Jb12 + Jb22 ). (10.119) 88 Für die Schreibweise dieser Eigenfunktionen gibt es unterschiedliche Konventionen in der Literatur. Man schreibt für die Zustände typischerweise |j1 , j2 ; j, mi oder |j, mi und mit oder ohne ‘0 ’. Wir verwenden 0 hier die Konvention |j, mi . 153 m1 + m2 j1 + j2 j1 + j2 − 1 .. . j1 − j2 j1 − j2 − 1 .. . −(j1 + j2 ) + 1 −(j1 + j2 ) beitragende Zustände |j1 , j1 ; j2 , j2 i |j1 , j1 ; j2 , j2 − 1i |j1 , j1 − 1; j2 , j2 i .. . |j1 , j1 ; j2 , −j2 i |j1 , j1 − 1; j2 , −j2 i ... ... |j1 , −j1 ; j2 , −j2 + 1i |j1 , −j1 ; j2 , −j2 i |j1 , j1 − 2j2 ; j2 , j2 i |j1 , j1 − 2j2 − 1; j2 , j2 i .. . |j1 , −j1 + 1; j2 , −j2 i Tabelle 1: Kopplung von Drehimpulsen. Zahl der Vektoren wieder mit jeder Zeile um Eins ab, um bei m1 + m2 = −(j1 + j2 ) erneut nur einen einzigen Vektor zuzulassen. Der von den Vektoren in einer Zeile aufgespannte Unterraum entspricht einem bestimmten Eigenwert von Jbz und wir sollten daher daraus die gemeinsamen Eigenvektoren von Jb2 und Jbz konstruieren. Da der zu m1 + m2 = j1 + j2 gehörende Unterraum aus nur einem Eigenvektor besteht, muss dieser automatisch ein Eigenvektor von Jb2 sein. Da m1 + m2 = j1 + j2 einem maximalen Eigenwert von Jbz entspricht, muss der entsprechende Wert von j daher j = j1 + j2 (10.130) |j1 + j2 , j1 + j2 i0 = |j1 , j1 ; j2 , j2 i (10.131) sein. Daher können wir schreiben. Nach dem was wir vorher bezüglich der allgemeinen Theorie des Drehimpulses besprochen haben, gibt es zu jedem j entsprechend 2j + 1 Eigenvektoren von Jbz mit Eigenwerten ~j, ~(j − 1), . . . , −~j. Diese Eigenvektoren können mittels Leiteroperatoren konstruiert werden, indem man beim Eigenvektor zum maximalen Eigenwert, m = j beginnt, d.h. von |j1 + j2 , j1 + j2 i0 = |j1 , j1 ; j2 , j2 i . (10.132) und dann durch Absteigen mittels p Jb∓ |j, mi = ~ (j ± m)(j ∓ m + 1) |j, m ∓ 1i (10.133) den nächsten Eigenvektor erhält, p Jb− |j1 + j2 , j1 + j2 i0 = ~ (j1 + j2 + j1 + j2 )(j1 + j2 − j1 − j2 + 1) × |j1 + j2 , j1 + j2 − 1i0 p = ~ 2(j1 + j2 ) |j1 + j2 , j1 + j2 − 1i0 . Wir fordern die Normierung und erhalten |j1 + j2 , j1 + j2 − 1i0 1 = p Jb− |j1 + j2 , j1 + j2 i0 ~ 2(j1 + j2 ) 1 = p (Jb1 − + Jb2 − ) |j1 , j1 ; j2 , j2 i ~ 2(j1 + j2 ) 154 (10.134) p p 1 = p ~ 2j1 |j1 , j1 − 1; j2 , j2 i + ~ 2j2 |j1 , j1 ; j2 , j2 − 1i , ~ 2(j1 + j2 ) (10.135) so dass wir schließlich s |j1 +j2 , j1 +j2 − 1i0 = j1 |j1 , j1 − 1; j2 , j2 i + j1 +j2 s j2 |j1 , j1 ; j2 , j2 − 1i j1 +j2 (10.136) erhalten. Auf gleiche Art und Weise können wir weiter absteigen und finden |j1 + j2 , j1 + j2 − 2i0 = 1 p (Jb1 − + Jb2 − )2 |j1 , j1 ; j2 , j2 i (j1 + j2 )[2(j1 + j2 ) − 1] ~2 2 s j1 (2j1 − 1) |j1 , j1 − 2; j2 , j2 i (j1 +j2 )[2(j1 +j2 ) − 1] s j1 j2 |j1 , j1 − 1; j2 , j2 − 1i +2 (j1 +j2 )[2(j1 +j2 ) − 1] s j2 (2j2 − 1) |j1 , j1 ; j2 , j2 − 2i + (j1 +j2 )[2(j1 +j2 ) − 1] = (10.137) usw. usf. Insbesondere finden wir (nicht unerwartet) |j1 + j2 , −(j1 + j2 )i0 = |j1 , −j1 ; j2 , −j2 i (10.138) und erhalten so alle möglichen Eigenvektoren |j1 +j2 , mi0 . Dann haben wir in dem Unterraum, welcher der zweiten Zeile der Tabelle entspricht, noch den Vektor s s j2 j1 |j1 , j1 − 1; j2 , j2 i + |j1 , j1 ; j2 , j2 − 1i (10.139) − j1 +j2 j1 +j2 als zu |j1 +j2 , j1 +j2 − 1i0 orthogonalen Vektor. Es muss sich dabei ebenso um einen Eigenvektor von Jb2 handeln. Wenn wir nun alle Eigenvektoren von Jb2 mit Eigenwert ~2 (j1 +j2 )(j1 +j2 + 1) auschließen, dann muss dieser Vektor ebenfalls ein Eigenvektor mit maximalem Eigenwert zu Jbz sein, aber zu j = j1 +j2 − 1, so dass dieser mit dem Vektor |j1 +j2 −1, j1 +j2 −1i0 (10.140) identifiziert werden kann. Durch sukzessive Anwendung von Jb− erhalten wir dann alle Eigenvektoren des Typs |j1 +j2 −1, mi0 . Diese Prozedur kann iteriert werden bis alle Eigenvektoren von Jb2 und Jbz bestimmt worden sind. Zusammenfassung: Im Unterraum für gegebene Werte von j1 und j2 nimmt der Operator Jb2 die Eigenwerte j = {j1 +j2 , j1 +j2 − 1, . . . , j1 −j2 } (10.141) oder (nach Streichung der Annahme j1 ≥ j2 ) j = {j1 +j2 , j1 +j2 − 1, . . . , |j1 −j2 |} 155 (10.142) an. Wir bemerken, dass die Zahl der Eigenvektoren durch j1 +j2 X (2j + 1) = (2j1 + 1)(2j2 + 1) (10.143) j=|j1 −j2 | sich dabei nicht ändert. Man kann im Allgemeinen für die Drehimpulskopplung X |j, mi0 = |j1 , m1 ; j2 , m2 i hj1 , m1 ; j2 , m2 |j, mi (10.144) m1 ,m2 schreiben. Hierbei sind die Koeffizienten89 hj1 , m1 ; j2 , m2 |j, mi (10.145) die sogenannten Clebsch-Gordan Koeffizienten (CG Koeffizienten). Diese sind nur dann von Null verschieden, falls j einen der Werte in Glg. (10.142) annimmt und m = m1 + m2 . Die Clebsch-Gordan Koeffizienten sind tabelliert und in den meisten Computer-Algebra Systemen bereits implementiert. Mit unseren Konventionen (Condon-Shortley) sind alle CG Koeffizienten reell. Die inverse Relation zu Glg. (10.144) ist X |j1 , m1 ; j2 , m2 i = |j, mi0 hj, m|j1 , m1 ; j2 , m2 i (10.146) j,m und aufgrund der Realiät der CG Koeffizienten gilt natürlich hj, m|j1 , m1 ; j2 , m2 i = hj1 , m1 ; j2 , m2 |j, mi . 10.5.1 (10.147) Addition von Spin 1/2 Operatoren b=S b1 + S b2 . Die Wir betrachten als konkretes Beispiel die Addition von zwei Spins, d.h. S 2 b2 b b b Eigenzustände von S1 , S2 , S1 z und S2 z sind |++i = |+i |+i , |−−i = |−i |−i , |+−i = |+i |−i , beziehungsweise in der | 12 , ms1 ; 12 , ms2 i Notation 1 1 1 1 | 12 , + 21 ; 12 , − 21 i = |+−i , | 2 , + 2 ; 2 , + 2 i = |++i , | 21 , − 12 ; 21 , + 21 i = |−+i , | 12 , − 21 ; 21 , − 12 i |−+i = |−i |+i , (10.148) (10.149) = |−−i . b2 , Sbz , S b2 und S b2 bestimmen. Aufgrund dessen, was Wir wollen nun die Eigenwerte von S 1 2 wir im allgemeinen Fall gesehen haben, wissen wir, dass s = (s1 + s2 ), . . . , |s1 − s2 | = 1, 0 0 89 (10.150) Diese Koeffizienten sind in der Tat das Skalarprodukt von |j, mi und |j1 , m1 ; j2 , m2 i, wie es die Schreibweise schon andeutet, allerdings lassen wir den 0 hier weg. Dadurch lassen sich die Koeffizienten der inversen Relation etwas einfacher schreiben. 156 und außerdem → → für s = 1 : für s = 0 : ms = −1, 0, 1, ms = 0. (10.151) b2 durch die beiden Spins aus und finden Wir drücken S b2 = S b2 + S b2 + 2S b1 · S b2 = 3 ~2 + 2Sb1 z Sb2 z + Sb1 + Sb2 − + Sb1 − Sb2 + . S 1 2 2 (10.152) Nun verwenden wir Glg. (10.144) um die CG Koeffizienten zu erhalten. Die Ergebnisse für allgemeines j1 und für j1 = 1/2 sind in Tabn. 2 und 3 zu finden j j1 + j1 − 1 2 1 2 m2 = − 12 q 1 m2 = + 21 q 1 j1 +m+ 2 − q 2j1 +1 j1 −m+ 12 2j1 +1 q j1 −m+ 2 2j1 +1 j1 +m+ 12 2j1 +1 Tabelle 2: Clebsch-Gordan Koeffizienten für j1 ⊗ 1/2. j 1 0 1 mq 2 = +2 1+m 2 − q 1−m 2 1 mq 2 = −2 1−m 2 q 1+m 2 Tabelle 3: Clebsch-Gordan Koeffizienten für 1/2 ⊗ 1/2. Wir erhalten aus Tab. 3 den Singulett-Zustand 1 1 1 1 1 1 1 1 1 1 |+−i − |−+i √ |0, 0i0 = − √ | , − ; , + i + √ | , + ; , − i = 2 2 2 2 2 2 2 2 2 2 2 und die Triplett-Zustände r 1+1 1 1 1 1 0 |1, 1i = | , + ; , + i = |++i , 2 2 2 2 2 r r 1 1 1 1 1 1 1 1 1 1 |+−i + |−+i 0 √ |1, 0i = | ,+ ; ,− i + | ,− ; ,+ i = , 2 2 2 2 2 2 2 2 2 2 2 r 1 − (−1) 1 1 1 1 0 |1, −1i = | , − ; , − i = |−−i . 2 2 2 2 2 (10.153) (10.154) (10.155) (10.156) Damit haben wir (2j1 + 1)(2j2 + 1) = 4 Eigenvektoren von Jb2 und Jbz gefunden. Insbesondere gilt für die Triplett-Zustände in der Tat b2 |1, ms i0 = ~2 s(s + 1) |1, ms i0 = 2~2 |1, ms i0 , S Sbz |1, ms i0 = ~ms |1, ms i0 mit ms = −1, 0, +1 (10.157) (10.158) und für den Singulett-Zustand b2 |0, 0i0 = 0, S Sbz |0, 0i0 = 0. 157 (10.159) (10.160) 10.5.2 Addition von Bahndrehimpuls und Spin 1/2 Operatoren Auf gleiche Art und Weise können wir b +S b Jb = L (10.161) ausrechnen. Wir erhalten Tab. 2 mit der Ersetzung j1 → `, d.h. ` − 12 ≤ j ≤ ` + 12 . Die Anzahl der gemeinsamen Eigenvektoren von Jb2 und Jbz ist durch (2` + 1)(2 12 + 1) = 4` + 2 gegeben. Beispielsweise gilt für ` = 1 und s = 12 : j = { 32 , 21 }. Die Zustände in der gekoppelten Basis sind r r 1 1 0 1 1 1 2 1 1 | ,+ i = − |1, 0; , + i + |1, +1; , − i (10.162) 2 2 3 2 2 3 2 2 r r 2 1 1 1 0 1 1 1 1 | ,− i = − |1, −1; , + i + |1, 0; , − i (10.163) 2 2 3 2 2 3 2 2 3 3 0 1 1 | , + i = |1, +1; , + i (10.164) 2 2 r 2 2 r 1 1 1 1 3 1 0 2 1 |1, 0; , + i + |1, +1; , − i (10.165) | ,+ i = + 2 2 3 2 2 3 2 2 r r 3 1 0 1 1 1 1 1 2 | ,− i = + |1, −1; , + i + |1, 0; , − i (10.166) 2 2 3 2 2 3 2 2 3 3 0 1 1 | , − i = |1, −1; , − i . (10.167) 2 2 2 2 158 11 Näherungsmethoden zur Lösung der Schrödingergleichung Es gibt nur wenige Fälle, in denen wir die Schrödingergleichung exakt lösen können: das freie Teilchen, der harmonische Oszillator, das Coulomb-Potential. In vielen Fällen ist das Potential derart beschaffen, dass es unmöglich ist eine exakte Lösung der Schrödingergleichung zu finden. Man verwendet dann Näherungsmethoden. Darunter sind die Störungstheorie (perturbative Methode), die Variantionsmethode und die WKB (WentzelKramers-Brillouin) Näherung. Schließlich kann man – wenn nichts anderes mehr hilft – die Schrödingergleichung schlicht und einfach nuemrisch lösen. Im Folgenden wollen wir die Störungstheorie in ihrer einfachsten Form und die Variationsmethode besprechen. 11.1 Störungstheorie (Perturbative Methode) Diese Methode wird zur Lösung der Schrödingergleichung verwendet, wenn der Hamiltonoperator in eine Summe von Termen zerlegt werden kann, unter welchen einige sehr viel größer sind als die anderen und wenn man die Schrödingergleichung für die großen Terme gut lösen kann, d.h. falls b =H b 0 + λH b1 H und falls i~ b1 H b0, mit λH und λ 1 ∂ b 0 ψ(x, t) ψ(x, t) = H ∂t (11.1) (11.2) b 0 um Eigut lösbar ist. In diesem Fall löst man zunächst die Schrödingergleichung für H genvektoren und Eigenwerte zu erhalten. Dies ist die ungestörte Lösung, bzw. die nullte Ordnung der Störungsreihe. Dann rechnet man mit der perturbativen Methode aus, wie b 1 modiEigenwerte und Eigenfunktionen durch die Anwesenheit der kleineren Terms λH fiziert werden. Es gibt zwei Varianten der Störungstheorie. Die erste, genannt statische Störungstheorie b 1 nicht von der Zeit oder zeitunabhängige Störungstheorie, ist nur anwendbar, falls λH abhängt und liefert gestörte Eigenvektoren und gestörte Eigenwerte. Die zweite Variante, genannt zeitabhängige Störungstheorie, liefert direkt eine approximative Lösung der b1 zeitabhängigen Schrödingergleichung und kann sowohl für Fälle mit zeitabhängigem λH b wie auch für Fälle mit zeitunabhängigem λH1 verwendet werden. Die zweite Methode ist besonders nützlich, um übergangswahrscheinlichkeiten von einem ungestörten Zustand zu einem anderen ungestörten Zustand zu berechnen (notwendig, um Absorptions- und Emissionsspektren zu berechnen). Die zweite Methode wird erst in QM2 besprochen. Hier beschränken wir uns auf zeitunabhängige Störungstheorie. 11.1.1 Zeitunabhängige Störungstheorie (nicht-entarteter Fall) Wir wollen ein System betrachten, dass durch den Hamiltonoperator b =H b 0 + λH b1. H 159 (11.3) b bestimmen, d.h. wir wollen Wir wollen die Eigenwerte und Eigenfunktionen von H b 0 + λH b 1 )φn = En φn (H (11.4) lösen. Wir betrachten nun das ungestörte System und die entsprechenden stationären Zustände betrachten, (0) (0) b 0 φ(0) (11.5) H n = En φn . (0) (0) Die Eigenwerte En und Eigenvektoren φn sind die Lösung des Problems zur nullten (0) (0) Ordnung. Wir nehmen nun an, dass wir En und φn kennen. Nun wollen wir damit En und φn bestimmen. (0) Wir betrachten ein ungestörte, diskreten und nicht-entarteten Energieeigenwert En . Der Fall von Eigenwerten im kontinuierlichen Spektrum kann auf ähnliche Art und Weise behandelt werden (und wird in QM2 behandelt). Im entarteten Fall sind zusätzliche Vorkehrungen notwendig. Wir nehmen an, dass En und φn in einer Reihe entwickelt werden können, (1) 2 (2) φn = φ(0) n + λφn + λ φn + . . . , (0) En = En + λEn(1) 2 +λ En(2) (11.6) + ... (11.7) und setzen Glgn. (11.6) und (11.7) in Glg. (11.4) ein, b 0 + λH b 1 ) φ(0) + λφ(1) + λ2 φ(2) + . . . (H n n n (0) (0) (1) 2 (2) (1) 2 (2) = En + λEn + λ En + . . . φn + λφn + λ φn + . . . (11.8) Dann sortieren wir nach Potenzen von λ und erhalten λ0 : b 0 φ(0) = E (0) φ(0) , H n n n (1) (0) (0) (1) b b H0 φn + H1 φn = En φn + En(1) φ(0) n , (0) (0) (1) (1) (2) (0) b 0 φ(2) b (1) H n + H1 φn = En φn + En φn = En φn , λ1 : λ2 : (11.9) (11.10) (11.11) (0) usw. usf. Da wir angenommen haben, dass En nicht entartet ist, fixiert Glg. (11.9) den (0) (0) (0) Zustand φn eindeutig. Wie bereits erwähnt nehmen wir an, dass wir En und φn in Glg. (11.9) berechnen können. Dann erinnern wir uns, um Glg. (11.10) zu lösen, dass die (0) (1) φn eine Orthonormalbasis darstellen und zerlegen nach dieser φn , d.h. wir schreiben φ(1) n = ∞ X (0) a(1) nr φn . (11.12) r=1 (0) Indem wir Glg. (11.12) in Glg. (11.10) einsetzen und das Skalarprodukt mit φk bilden, finden wir ∞ X (0) b (0) b (0) (0) (0) a(1) nr hφk | H0 |φr i + hφk | H1 |φn i = En {z } | r=1 (0) ∞ X (0) (0) (0) (1) (0) a(1) nr hφk |φr i +En hφk |φn i . | | {z } {z } r=1 =δk,r =Ek δk,r =δk,r (11.13) b 0 und ausführen der Skalarprodukte ergibt sich Nach Auswertung der von H (0) (1) (0) (0) (1) (1) b 1 |φ(0) Ek ank δk n + hφk | H n i = Ek ank + En δk n , 160 (11.14) (1) was schließlich nach En aufgelöst werden kann, (1) (0) b 1 )k n En(1) δk n = ank (Ek − En(0) ) + (H (11.15) wobei das Matrixelement durch (0) b 1 )k n = hφ | H b 1 |φ(0) i (H n k (11.16) definiert ist. Aus Glg. (11.15) folgt dann für k = n b 1 )n n . En(1) = (H (11.17) WIr haben daher als erstes Ergebnis, dass die Störung des n-ten Energieeigenwerts in b 1 im unerster Ordnung Störungstheorie durch den Erwartungswert des Störoperators H gestörten Zustand gegeben ist. Wenn stattdessen k 6= n ist, dann folgt aus Glg. (11.15) wegen δk n = 0, dass b 1 )k n (H (1) ank = (0) . (11.18) (0) En − Ek (1) Daher müssen wir, um die vollständige gestörte Wellenfunktion φn zu finden zusätzlich (1) noch ann bestimmen, dass nicht durch Glg. (11.18) direkt festgelegt ist. Aber an n(1) muss, um die Normierungsbedingung zu gewährleisten, mit (0) (0) (1) (1) (0) 1 = hφn |ψ † ni = hφ(0) n |φn i + λ(hφn |φn i + hφn |φn i) + . . . (11.19) verträglich sein. Daraus folgt, dass (1) † a(1) nn + (ann ) = 0 (11.20) erfüllt und daher rein imaginär ist. Somit kann ann als zu Null identisch angenommen werden. Mit dieser Wahl ist die erste Näherung der gestörten φn durch φn = φ(0) n +λ b 1 )k n (H X (0) k6=n En − (0) Ek (0) φk (11.21) gegeben. Aufgrund von Glg. (11.21) können wir sagen, dass der Effekt der Störung auf die (0) (0) b 1 )k n 6= 0 Eigenfunktionen ist, dass zu der Eigenfunktion φn alle möglichen φk , für die (H (0) (0) beigemischt werden. Die Mischung verstärkt sich, wenn die Energieniveaus Ek und En näher beieinander sind. Auf gleiche Art und Weise kann man die Korrekturen bei höheren Ordnungen berechnen. Beispielsweise können wir in Glg. (11.11) φ(2) n = ∞ X (0) a(2) ns φs (11.22) s=1 ansetzen. Dann finden wir mit der gleichen Prozedur das folgende Ergebnis für die Eigenwerte und Eigenfunktionen in zweiter Ordnung der Störungstheorie: 2 b ( H ) X (H b 1 )n s (H b 1 )s n X 1 n s (2) En = = , (11.23) (0) (0) (0) (0) s6=n En − Es s6=n En − Es 2 b (H1 )s n X b 1 )k s (H b 1 )s n b 1 )n n (H b 1 )k n X 1 (H (H (2) ank = − − δk,n 2 . (0) (0) (0) (0) (0) (0) (0) (0) (En − Ek )2 s6=k 2 s6=n (En − Ek )(En − Es ) E − E n s (11.24) 161 11.1.2 Anwendungen der Störungstheorie Wir werden hier einige Anwendungen der Störungstheorie betrachten. Wir wollen zunächst die Energieniveaus eines Teilchens in einem anharmonischen Potential in einer Dimension bestimmen. Das Potential ist also 1 2 V (b x) = kb x + ab x3 + bb x4 . (11.25) 2 Störungstheorie kann verwendet werden, falls die Korrekturen deutlich kleiner sind als der harmonische Term, d.h. 1 2 kρ aρ3 + bρ4 , (11.26) 2 wobei ρ ein Parameter mit Dimension einer Länge ist, der für den Bereich einer nichtverschwindenden Wellenfunktion charakteristisch ist. Zur nullten Ordnung (a = b = 0) reduziert sich das System auf den harmonischen Oszillator und wir wissen, wie wir dieses Problem exakt lösen, vgl. Kapitel 7. Wir erhalten die ungestörten Energieniveaus r 1 1 k En(0) = ~ωc (n + ) = hνc (n + ), ωc = 2πνc = (11.27) 2 2 m und die entsprechenden Eigenfunktionen r 2 ξ ~ φn (x) = Nn Hn (ξ) exp − , mit x0 = 2 mωc 1 (πx0 )− 4 , Nn = √ 2n n! ξ= x . (11.28) x0 Dann schreiben wir b 1 = ab H x3 + bb x4 (11.29) und berechnen die erste Korrektur der Eigenwerte, En(1) b 1 )nn = (H Z+∞ 3 4 (0) = dx φ(0)∗ n (x)[ax + bx ]φn (x) −∞ Z+∞ 2 3 dx φ(0) n (x) x +b =a −∞ | Z+∞ 2 4 dx φ(0) n (x) x . (11.30) −∞ {z } =0 Der Beitrag des ersten Terms zu den Energieniveaus verschwindet in ersten Ordnung Störungstheorie, da x3 eine ungerade Funktion ist. Für den zweiten Term verwenden wir hier Rekursionsrelationen der Hermite-Polynome90 . Wir reskalieren die Ortsvariable x = x0 ξ und das Maß dx = x0 dξ und erhalten En(1) Z+∞ 2 = bNn2 x50 dξ e−ξ Hn (ξ)2 ξ 4 , (11.31) −∞ was sich mittels der Rekursionsrelation 1 ξHn (ξ) = Hn+1 (ξ) + nHn−1 (ξ) 2 90 (11.32) Wir empfehlen Ihnen, die Ortsoperatoren durch Leiteroperatoren auszudrücken, um damit die Rechnungen in einer stillen Stunde selbst auszuführen. Sie werden erkennen, wie einfach diese dann sind. 162 vereinfachen lässt. Durch zweifache Anwendung finden wir 1 1 ξ 2 Hn (ξ) = Hn+2 (ξ) + (n + )Hn (ξ) + n(n − 1)Hn−2 (ξ). 4 2 (11.33) Das Quadrat dieses Ausdrucks kann im Integral eingesetzt werden. Anschließend verwenden wir die Orthogonalitätsrelation der Hermite Polynome, Z+∞ √ 2 dξ e−ξ Hn (ξ)Hm (ξ) = 2n n! πδm n , (11.34) −∞ um die Mischterme zu beseitigen. Am Ende finden wir √ 1 n+2 1 2 n (1) 2 5 2 2 n−2 En = bNn x0 π 2 (n + 2)! + (n + ) 2 n! + n (n − 1) 2 (n − 2)! 16 2 3 = bx40 {2n2 + 2n + 1}. (11.35) 4 Daher sind die Energieniveaus des anharmonischen Oszillators in erster Ordnung der Störungstheorie durch 1 3 En = En(0) + En(1) = ~ωc (n + ) + bx40 (2n2 + 2n + 1) 2 4 (11.36) gegeben. 11.1.3 Relativistische Korrekturen beim Wasserstoff Die Klassische Hamiltonfunktion für ein geladenes Teilchen (Ladung −e0 ) in einem von einer Punktladung Ze0 erzeugten elektromagnetischen Feld lautet p Ze20 p2 (p2 )2 Ze20 H = c m2e c2 + p2 − = m e c2 + − + . . . − . r 2me 8m3e c2 r (11.37) Wenn wir die Klassischen Variablen durch die entsprechenden quantenmechanischen Operatoren ersetzen, die Ruheenergie me c2 weglassen und nur die führende Korrektur behalten, lautet der Hamiltonoperator 2 2 2 2 b0 + H b1 b = p − Ze0 − (p ) = H H 2me r 8m3e c2 2 2 b 0 = p − Ze0 , mit H 2me r (11.38) d.h. der ungestörte Hamiltonoperator ist einfach der bereits verwendete Hamiltonoperator des Coulomb Problems. Wir fanden dabei, dass die Energieniveaus durch b 0 φn,` m = E (0) φn,` m , H n En(0) = − Z 2 e40 me 1 RyZ 2 = − 2~2 n2 n2 (11.39) b 1 induzierte Korrektur der Energieniveaus bestimmt sind. Wir wollen nun die durch H (0) bestimmen. Wir wissen, dass für das reine Coulomb Problem das Energieniveaus En n2 -fach entartet ist. Daher kann die bisher entwickelte Theorie hierfür nicht verwendet b 2 und L bz ist, und diese werden. Wir bemerken aber, dass φn ` m auch Eignevektor von L 163 b 1 kommutieren. Die Unterräume, die von φn ` m für verschiedene beiden Operatoren mit H b 1 . Dann Werte von ` und m aufgespannt werden, sind invariant unter der Wirkung von H b 0 nicht entartet ist und können wir uns auf einen Unterraum beschränken, auf dem H 2 2 pb pb (pb2 )2 1 (1) φn ` m φn ` m (11.40) En ` = − hφn ` m | |φn ` m i = − 8m3e c2 2me c2 2me 2me Wegene Glg. (11.39) erhalten wir pb2 φn ` m = 2me Ze20 (0) En + φn ` m , r (11.41) was sich wiederum in Glg. (11.40) verwenden lässt. Wir finden 1 1 1 (1) (0) 2 2 (0) 2 4 En ` = − (En ) + 2Ze0 En hφn ` m | |φn ` m i + Z e0 hφn ` m | 2 |φn ` m i . 2me c2 r r (11.42) Wir haben in bisherigen Übungen bereits hφn ` m | Z 1 |φn ` m i = , r a0 n2 hφn ` m | 1 Z2 |φ i = n ` m r2 a20 n3 (` + 12 ) (11.43) ausgerechnet, was wir nun einsetzen können, um die Energieniveaus des Coulomb Problems inklusive Korrekturen erster Ordnung zu erhalten. Wir finden 1 RyZ 2 α2 Z 2 3 , (11.44) En ` = − 2 1+ − n n 4n ` + 21 wobei α = e20 /(~c) ∼ 1/137 die Sommerfeld’sche Feinstrukturkonstante ist. Die relativistische Korrektur der Energieniveaus ist wegen α2 um einen Faktor ∼ 10−4 gegenüber dem nicht-relativisitischen Wert unterdrückt. Im Bereich des sichtbaren Spektrum entspricht 1 Å. Der wichtigste dies einer Verschiebung der Spektrallinien von der Größenordnung 10 Effekte der relativistischen Korrektur ist die Erzeugung einer Abhängigkeit der Energieniveaus von der Quantenzahl `. Daher spaltet sich das n-te Energieniveau in n einzelne Niveaus auf, die sehr dicht beieinander liegen und die Spektrallinien erhalten eine Substruktur, die man als Feinstruktur bezeichnet. Zwar wird dieser Effekt beobachtet, aber um eine Beschreibung der realen Daten zu erhalten, muss man den hier noch nicht berücksichtigten Effekt des Elektronenspins mit einbeziehen. 11.2 Variationsmethode Die Variationsmethode erlaubt uns eine obere Grenze für die Energie E0 des Grundzustands eines Systems zu bestimmen. Sie beruht darauf, dass der Erwartungswert des Hamiltonoperators fur einen beliebigen (normierten, d.h. kϕk = 1) Zustand ϕ durch b |ϕi E[ϕ] = hϕ| H (11.45) grundsätzlich mindestens so großwie die Grundzustandsenergie E0 ist, und mit dieser nur im Grundzustand übereinstimmt. Dies bedeutet, dass nur falls ϕ mit dem Grundzustand b übereinstimmt, die Energie E[ϕ] mit der Grundzustandsenergie übereinstimmen φ0 von H 164 b ein diskretes Spektrum E0 , E1 ,. . . , En besitzt und kann. Wir wollen annehmen, dass H möglicherweise zusätzlich noch ein kontinuierliches Spektrum σc hat. Wir schreiben b n = En φn Hφ und b E = EφE Hφ (11.46) und entwickeln ϕ nach dieser Basis, ϕ= X Z cn φn 0 dE c(E)φE . (11.47) σc n Dann gilt 2 kϕk = X 2 Z dE |c(E)|2 , |cn | + n σc b |ϕi = E[ϕ] = hϕ| H X 2 (11.48) Z En |cn | + dE E |c(E)|2 . (11.49) σc n Wir nehmen nun an, dass σc > E0 , d.h. dass der Grundzustand eine niedrigere Energie als alle Zustände des diskreten Spektrums hat. WIr subtrahieren E0 und erhalten Z X 2 dE (E − E0 ) |c(E)|2 ≥ 0, (11.50) E[ϕ] − E0 = (En − E0 ) |cn | + σc n wobei E[ϕ] = E0 nur gilt, falls c0 = 1 sowie cn = 0 für alle n > 0 und ebenso c(E) = 0 erfüllt sind. Auf Grundlage dieser Ergebnisse können wir die Variationsmethode benutzen, um dei Grundzustandsenergie und -wellenfunktion zu bestimmen. Wir betrachten eine Klasse von Zuständen, dere Elemente ϕ(a1 , . . . , an ) (Testfunktionen) durch eine endliche Anzahl von Parameters a1 , . . . , an bestimmt sind. Dann bilden wir den Erwartungswert b |ϕ(a1 , . . . , an )i E(a1 , . . . , an ) = hϕ(a1 , . . . , an )| H (11.51) und wir bestimmen durch Variation jene Werte ā1 , . . . , ān von a1 , . . . , an , für welche Glg. (11.51) minimal wird. Sie sind durch ∂E =0 r = 1, . . . , n (11.52) ∂ar ār bestimmt. In diesem Fall ist E(ā1 , . . . , ān ) = Ē eine Obergrenze für die Grundzustandsenergie E0 und der Vektor ϕ(ā1 , . . . , ān ) = ϕ̄ ist eine Näherung für die Grundzustandswellenfunktion φ0 innerhalb der Klasse der Testfunktionen, d.h. es gilt E0 ≤ Ē = b |ϕ̄i hϕ̄| H . hϕ̄|ϕ̄i (11.53) Ob Ē ein guter oder schlechter Schätzwert für die Grundzustandsenergie ist hängt wesentlich von der Wahl der Klasse der Testfunktionen ab. Dafür ist es wichtig, Informationen bzgl. der Struktur von φ0 zu haben und diese in die Klasse der Testfunktionen einfließen zu lassen. In jedem Fall muss sich das Ergebnis verbessern91 , wenn wir die Klasse der Testfunktionen erweitern. 91 Es sei denn, wir haben unwissentlich schon einen exakten Wert gefunden. Dieser Fall ist praktisch auszuschließen für realistische Probleme. 165 Wir wollen ein Beispiel betrachten und die Variationsmethode zur Berechnung der Grundzustandsenergie des harmonischen Oszillators verwenden. Dann haben wir 2 2 b = − ~ d + 1 mω 2 x2 . H 2m dx2 2 (11.54) Wir wissen, dass die Eigenfunktion des Grundzustands keinerlei Nullstellen haben darf. Eine einfache Wahl einer normierten Testfunktion die mit dieser Information verträglich ist, ist 14 2a 2 ϕ(a, x) = e−ax mit a > 0. (11.55) π Wir finden dann Z+∞ ~2 d2 ~2 a mω 2 1 ∗ 2 2 E(a) = dx ϕ (a, x) − ϕ(a, x) = mω x + . + 2m dx2 2 2m 8a (11.56) −∞ Dann erhalten wir für a > 0 die Lösung a= mω . 2~ (11.57) Indem wir dies in Glg. (11.56) einsetzen, finden wir für die Grundzustandsenergie 1 E = ~ω = E0 , 2 (11.58) und die Testfunktion stimmt mit der Grundzustandswellenfunktion φ0 tatsächlich überein. Die Tatsache, dass wir sogar das exakte Ergebnis erhalten können, erklärt sich daraus, dass die Grundzustandswellenfunktion in der linearen Hülle der Testfunktionen liegt. Diese Methode kann ebenfalls für angeregte Zustände erweitert werden, indem man sich klar macht, dass E[ϕ] nahe bei einem allgemeinen Eigenwert zwar kein Minimum hat, aber nichtsdestotrotz stationär ist. Dann sind die Eigenzustände Lösungen von δE[ϕ] = E[ϕ + δϕ] − E[ϕ] = 0 mit kϕ + δϕk2 = 1. (11.59) Die Testfunktionen für angeregte Zustände müssen mit deutlich komplizierteren Strukturen gebildet werden und müssen ausnahmslos orthogonal zur Eigenfunktion des Grundzustands sein. Außerdem sind die erhaltenen Eigenwerte nicht mehr zwangsläufig obere Schranken. 166 Anhänge A Notation und Konventionen Die innerhalb der Vorlesung und des Skriptes verwendeten Konventionen und Notationen werden in diesem Anhang zusammengefasst. A.1 Einheiten und Werte von Naturkonstanten In dieser Vorlesung wird das Gauß’sche Einheitensystem (cgs System) statt des Internationalen Systems (SI System, MKSA System) verwendet. Das Gauß’sche System ist ein metrisches, kohärentes Maßsystem, dessen fundamentale Einheiten für Länge, Masse und Zeit der Zentimeter cm, das Gramm g und die Sekunde s sind. Die wichtigsten davon abgeleiteten mechanischen Einheiten sind jene der Kraft, dyn, und der Energie, erg. Seit 1967 ist die Sekunde als das 9 192 631 770-fache der Periodendauer des Übergangs zwischen den beiden Hyperfeinstrukturniveaus des Grundzustands des Nuklids 133 Cs definiert. Der Meter wird daraufhin als die Distanz definiert, welche sich aus dem Produkt von der Vakuumlichtgeschwindigkeit c = 299 792 458 m/s und einer Sekunde nach Division durch 299 792 458 ergibt. Das Kilogramm ist definiert als die Masse des Internationalen Kilogrammprotoyps, der sich im Internationalen Büro für Maß und Gewicht in Sèvres bei Paris befindet. Die Beziehung zwischen den Basisgrößen cm und m sowie zwischen g und kg ist offensichtlich, daher ist die Umrechnung rein mechanischer Größen zwischen Gauß’schen und SI Einheiten trivial. Die im Internationalen System übliche makroskopische Einheit der Energie ist das Joule, 1 J = 1 kgm2 /s2 = 107 erg = 107 gcm2 /s. Eine Besonderheit der Bezeichnungen in der subatomaren Physik ist, dass der Femtometer fm = 1−15 m aus Hochachtung vor Enrico Fermi (und aus Bequemlichkeit) als ein Fermi bezeichnet wird. Der Gegensatz zwischen beiden Maßsystemen tritt bei elektromagnetischen Einheiten auf. Während im SI System elektromagnetische Einheiten durch das Ampère’sche Kraftgesetz für zwei parallele stromdurchflossene Leiter definiert werden, ist der Ausgangspunkt des Gauß’schen Systems das Coulomb’sche Kraftgesetz für die Kraft zwischen zwei elektrischer Ladungen. Im Gauß’schen System ist die Coulomb-Kraft zwischen zwei Ladungen Q1 und Q2 durch F = Q1 Q2 /r2 gegeben. Im Gegensatz dazu ist die Coulomb Kraft im SI System F = 1/(4πε0 )Q1 Q2 /r2 , wobei ε0 die Permittivitität des Vakuums ist. Daher ergeben sich folgende Umrechnungen (E, D, B, H, ρ, j im Gauß’schen System, E 0 , D 0 , B 0 , H 0 , ρ0 , j 0 im Internationalen System: elektrische Flussdichte magnetische Flussdichte magnetische Feldstärke Raumladungsdichte 167 √ 4πε0 E 0 , p D = 4π/ε0 D 0 , p B = 4π/µ0 B 0 , p H = 4πµ0 H 0 , 1 ρ= √ ρ0 , 4πε0 elektrische Feldstärke E = (A.1) (A.2) (A.3) (A.4) (A.5) elektrische Stromdichte j = √ und 1 j 0, 4πε0 1 = ε0 µ 0 . c2 (A.6) (A.7) Da im SI System ε0 = 8.854187817620 F/m mit 1 F/m = 1 A2 s4 /(kg m3 ) ist, gilt klarerweise, dass die elektrische Ladung in beiden Maßsystemen unterschiedliche Einheiten und auch andere physikalische Dimensionen hat. Die Erklärung hierfür ist, dass im Internationalen System die Einheit der Stromstärke, das Ampère A, als Basiseinheit aufgefasst wird, und damit die Einheit der Ladung als 1 C = 1 As definiert wird. Wann immer in einer Gleichung im Internationalen Maßsystem auf nur einer der beiden Seiten elektromagnetische Einheiten (Ampère oder Coulomb) auftreten, tritt in diesen Gleichungen ebenso eine Konstante ε0 oder µ0 auf, welche die Einheiten aneinander anpasst. Die im SI System benötigten Konstanten ε0 und µ0 (elektrische und magnetische Feldkonstanten) werden im Gauß’schen System nicht benötigt. Die Einheit der Ladung ist im Gegensatz zum Internationalen System im Gauß’schen Sysq p tem durch [Ladung] = [Energie] × [Länge] = [Masse] × [Länge]3 /[Zeit] definiert. Das heißt, man System die elektrostatische Ladungseinheit [Ladung] = p erhält im Gauß’schen √ 2 1 esu = dyn × cm = erg × cm. Wie man leicht erkennt, treten bei Verwendung dieser Einheiten keine Feldkonstanten auf. In beiden Maßsystemen verwendet man auf (sub-)atomaren Skalen gerne das Elektronenvolt als Energieeinheit. Es gilt im SI System 1 eV = 1.6021766208(98)×10−19 J. Hierbei ist e die (positive) Elementarladung mit Wert e = 1.6021766208(98)×10−19 C. Im Gauß’schen System ist die (positive) Elementarladung e = 4.80320425(10) × 10−10 esu. Da typische Energien von (sub-)atomaren Systeme von der Größenordnung meV (kondensierte Materie) bis TeV (LHC) sind, sind die Einheiten eV, keV, MeV und GeV mehr als nur gebräuchlich. Das Gauß’sche Maßsystem bietet sich außerdem für eine weitere Vereinfachung zu natürlichen Einheiten an, indem man die abstrakten Werte für die Lichtgeschwindigkeit im Vakuum, c = 299 792 458 m/s, und für die Planck’sche Konstante (dividiert durch 2π), ~ = 1.054571800(13) × 10−34 Js = 6.582119514(40) × 10−16 eVs, beide zugleich auf eins setzt. Das Produkt dieser beiden Konstanten ist ~c = 197.3269788(12) MeV fm und eignet sich hervorragend für Überschlagsrechnungen und ist in natürlichen Einheiten gleich eins. Daher sieht man leicht, dass in natürlichen Einheiten Längen, Zeiten sowie die Kehrwerte von Energien, Impulsen und Massen alle die gleiche Einheit 1fm = 1/MeV haben. Darüber hinaus√ist die elektrische Ladung in natürlichen Einheiten dimensionslos und kann mit e = 1.4399764 MeV fm einfach in andere Maßsysteme übertragen werden. Selbstverständlich muss man vor jedem Vergleich mit experimentellen Werten wieder alle Größen zu Gauß’schen oder Internationalen Einheiten konvertieren. Tabellen der wesentliche Konstanten und der physikalischen Einheiten finden Sie im Tabellenteil des Anhangs, vgl. Tabn. 4 und 5. 168 A.2 Vektoren und Metrik Vektoren im Raum R3 oder im Minkowskiraum werden im Allgemeinen durch kleingeschriebene lateinische Buchstaben bezeichnet. Dreiervektoren werden durch Fettdruck hervorgehoben, Vierervektoren sind nicht fett gedruckt. Lateinische Buchstaben als Indizes mit Wertebereich 1, 2 und 3 bezeichnen räumliche Komponenten, griechische Buchstaben als Indizes mit Wertebereich 0, 1, 2 und 3 bezeichnen Komponenten von Vierervektoren. Der Index 0 ist der Zeitkomponente zugeordnet, die Indizes 1, 2 und 3 den drei räumlichen Komponenten. Kontravariaten Vierervektoren sind definiert als xµ ≡ (x0 , +x), die dazu dualen kovarianten Vierervektoren als xµ ≡ (x0 , −x). Die Komponenten des metrischen Tensors gµν sind durch g00 = +1 und g11 = g22 = g33 = −1 gegeben (Westküstenmetrik). Doppelt auftretenden Indizes werden im Allgemeinen über ihren Wertebereich summiert (Einstein’sche Summenkonvention) sofern dies nicht explizit anders angegeben ist. Daher gilt xµ = gµν xν und gµν g νρ = δµρ . Einheitsvektoren werden durch x̂ bzw. x̂µ oder x̂µ bezeichnet. Im Besonderen werden die kartesischen Einheitsvektoren durch µ̂ ≡ êµ (oder µ̂) bezeichnet. Skalarprodukte zwischen Dreiervektoren werden durch x · p bezeichnet, Beträge reeller Dreiervektoren auch schlicht durch x2 = |x|2 = x2 ≡ x·x. Vektorprodukte von Dreiervektoren werden durch x × y = ijk xi yj êk bezeichet. Das Vorzeichen des vierdimensionalen Epsilon Tensors wird auf 0123 = +1 festgelegt. Spinoren werden durch griechische Großbuchstaben bezeichnet und ihre Komponenten mittels griechischer Buchstaben indiziert. Der Wertebereich der Spinor-Indizes ist 1 und 2 für Zweier-Spinoren und 1, 2, 3 und 4 für Vierer-Spinoren. Das zum komplexen Vektor oder Spinor Ψ hermitesche konjugierte Objekt wird durch Ψ † bezeichnet, das komplex konjugierte Objekt durch Ψ ∗ . Beträge komplexer Vektoren oder Spinoren werden durch |Ψ |2 ≡ Ψ † Ψ = Ψα∗ Ψα bezeichet und als Summe aller Komponenten verstanden. Die Pauli Matrizen sind definiert als 0 1 0 −i σ1 = , σ2 = , 1 0 i 0 σ3 = 1 0 0 −1 (A.8) und werden im Dreiervektor σ = (σ1 , σ2 , σ3 )T zusammengefasst. A.3 Wellenfunktionen und Zustandsvektoren Innerhalb der Vorlesung werden zeitabhängige Wellenfunktionen bzw. Zustandsvektoren immer mit dem Symbol ψ(x, t) bezeichnet. Zeitunabhängige Wellenfunktionen, die stationären Zustanden (d.h Energieeigenzuständen) entsprechen, werden immer mit φ(x) bezeichnet. Andere Arten von L2 (R3 ) Funktionen bzw. Hilbertraumvektoren werden generisch mit χ oder ξ bezeichnet. Objekte von jedem dieser drei Typen werden darüber hinaus (z.B. bzgl. ihrer Quantenzahlen) durch untere Indizes gekennzeichnet, z.B. χm , φm (x) oder ψnlm (x, t). 169 A.4 Fourier-Transformation Die Definitionen und Konventionen zur Fourier-Transformation in der Vorlesung stimmen mit jenen aus den Übungen überein. Sei R ∞f eine komplexwertige Funktion einer reellen Variablen, die absolut integrierbar ( −∞ dx|f (x)| < ∞) und stetig differenzierbar ist. Ihre Fourier-Transformation ist gegeben durch Z ∞ 1 dxe−ikx f (x). (A.9) f˜(k) = F[f (x); k] = √ 2π −∞ Die Rücktransformation ist dann Z ∞ 1 dk eikx f˜(k). (A.10) f (x) = √ 2π −∞ Sei g eine weitere komplexwertige Funktion einer reellen Variablen, die absolut integrierbar und stetig differenzierbar ist. Für α, β ∈ C, a ∈ R gilt: F[αf (x) + βg(x); k] = αF[f (x); k] + βF[g(x); k], F[f (x − a); k] = e−ika F[f (x); k], 1 k F[f (ax); k] = F f (x); für a > 0, a a F[f (−x); k] = F[f (x); −k], df (x) ; k = ikF[f (x); k], F dx d F[xf (x); k] = i F[f (x); k]. dk (A.11) (A.12) (A.13) (A.14) (A.15) (A.16) Man kann die Fourier-Transformationen auf natürliche Weise auf Funktionen auf Rn erweitern. Die Faltung f ∗ g zweier Funktionen ist definiert durch Z (f ∗ g)(x) = dyf (y)g(x − y). (A.17) Das Faltungstheorem für die Fourier-Tranformation lautet F[f ∗ g] = √ 2πF[f ] · F[g], 1 F[f · g] = √ F[f ] ∗ F[g]. 2π A.5 (A.18) (A.19) Delta-Distribution Dieser Abschnitt des Anhangs fasst noch einmal kompakt den Inhalt der Übungen zusammen. 170 A.5.1 Eigenschaften der δ- und θ-Funktion δ-Funktionen sind Distributionen. Ihre Wirkung auf Testfunktionen h(x) ist durch Z ∞ dx δ(x − x0 )h(x) = h(x0 ) (A.20) −∞ gegeben. Seien f (x) und g(x) zwei einfach differenzierbare Funktionen, wobei g(x) über n einfache Nullstellen xi verfügt, mit der Eigenschaft g 0 (xi ) 6= 0. Dann sind folgende Eigenschaften der δ-Funktion (für a 6= 0) leicht zu zeigen: δ(ax) = Z δ(x) , |a| (A.21) ∞ −∞ dx f (x)δ 0 (x) = −f 0 (x)x=0 , (A.22) xδ 0 (x) = −δ(x), n X 1 δ(g(x)) = δ(x − xi ), 0 |g (xi )| i=1 δ(x2 − a2 ) = 1 (δ(x − a) + δ(x + a)) 2|a| Die Heaviside-Funktion, auch θ-Funktion genannt, ist definiert durch 0 für x < 0 θ(x) = . 1 für x ≥ 0 (A.23) (A.24) (A.25) (A.26) Man sieht, dass deren Ableitung die δ-Funktion ist: d θ(x) = δ(x). dx A.5.2 (A.27) Darstellungen der Dirac’schen Delta-Distribution Unter einer Darstellung der δ-Distribution versteht man eine reguläre Funktion δ (x) (d.h. keine Distribution), die außer von x auch von einem Parameter abhängt und für geeignete Testfunktionen h(x) folgende Eigenschaft hat: Z ∞ lim dx h(x) δ (x) = h(0) . (A.28) →0 −∞ Z ∞ f (x/) −∞ eine Darstellung der δ-Distribution. Dabei sind folgenden Funktionen als Darstellungen der δ-Distribution besonders relevant: Für eine beliebige normierte Funktion f (x), d.h. 1 2 2 √ e−x / , π 1 , 2 π x + 2 dx f (x) = 1 erhält man durch 1 sin(x/) , π x sin2 (x/) . π x2 (A.29) Die anschauliche Interpretation der Delta-Distribution als “Funktion” mit δ(0) = ∞ und δ(x 6= 0) = 0 gilt nur für einen Teil der Darstellungen lim δ (x), wie Sie in den Übungen →0 gesehen haben. 171 B B.1 Zusammenfassung des Formalismus Hilbertraum, Operatoren und Skalarprodukt Ein Hilbertraum ist ein komplexer Vektorraum mit Skalarprodukt (Skalarproduktraum), daher ist auf jedem Hilbertraum auch eine Norm definiert. Man spricht daher auch von einem normierten komplexen Vektorraum. B.1.1 Allgemeine Eigenschaften von Vektorräumen Wir betrachten nun einen allgemeinen Vektorraum V (K) über dem Körper K. Beispiele für K sind Rn (Körper der reellen Zahlen in n Dimensionen) oder Cm (Körper der komplexen Zahlen in m Dimensionen). Der Vektorraum V (K) kann komplex sein, auch falls der Körper K reell ist, das Gegenteil ist nicht möglich. Im Allgemeinen sind auf Vektorräumen grundsätzlich Addition und Skalarmultiplikation definiert. Beide Operationen sind assoziativ, Addition ist auch kommutativ und Skalarmultiplikation ist auch distributiv, d.h. für drei Vektoren χ ≡ χ1 , χ2 und χ3 und zwei Skalare α ≡ α1 und α2 aus dem Körper K 0 gilt χ1 + (χ2 + χ3 ) =(χ1 + χ2 ) + χ3 , χ1 + χ2 =χ2 + χ1 , (B.1) (B.2) α1 (α2 χ) =(α1 α2 )χ, α(χ1 + χ2 ) =αχ1 + αχ2 , (α1 + α2 )χ =α1 χ + α2 χ. (B.3) (B.4) (B.5) sowie Daher sind Linearkombinationen erlaubt und liegen ebenfalls im Vektorraum: χ1 , χ2 ∈ V (K) ⇒ α1 χ1 + α2 χ2 ∈ V (K) ∀α1 , α2 ∈ K 0 . (B.6) Selbstverständlich dürfen die Skalare α1 und α2 komplex sein (K 0 = C) sofern der Vektorraum V (K) komplex ist, ansonsten müssen sie reell sein (K 0 = R). Es existiert ein Nullvektor unter Addition, so dass + χ = χ, B.1.2 0χ = , α = ∀χ ∈ V (K), ∀α ∈ K 0 . (B.7) Operatoren und ihre Wirkung auf Elemente von Vektorräumen An dieser Stelle wollen wir uns auf die Definition von linearen Operatoren besinnen und uns b : V (K) → V 0 (K) dederen Eigenschaften in Erinnerung rufen. Ein linearer Operator O finiert eine lineare, strukturerhaltende Abbildung (Homomorphismus) zwischen zwei Vektorräumen V (K) und V 0 (K) über einem gemeinsamen Körper K. Im Folgenden betrachen wir Vektoren χ ≡ χ1 , χ2 ∈ V (K) und einen Skalar α, der je nach Eigenschaften von V (K) reell oder komplexwertig ist. In diesem Fall gilt: 172 1. Lineare Operatoren sind homogen, d.h. b b O(αχ) = αOχ. (B.8) 2. Lineare Operatoren sind additiv, d.h. b 1 + χ2 ) = Oχ b 1 + Oχ b 2. O(χ (B.9) b Oχ b 1 , Oχ b 2 Elemente von V 0 (K). Alle durch OV b (K) darHierbei sind die Vektoren Oχ, stellbaren Elemente von V 0 (K) sind das Bild von V (K). Alle Elemente von V (K), die b auf V 0 (K) abgebildet werden, bilden zusammen das Urbild von durch Anwendung von O 0 b−1 : V 0 (K) → V (K) wird als inverser V (K). Der durch das Urbild definierte Operator O Operator bezeichnet. Alle Elemente von V (K), die auf den Nullvektor in V 0 (K) abgebildet b werden, liegen im Kern des Operators, ker O. b sowie der Nulloperator 0, b deren defiZwei spezielle Operatoren sind der Einsoperator 1 b b nierende Eigenschaften (für beliebiges χ ∈ V (K)) durch 1χ = χ und 0χ = gegeben b das Urbild des Bilds von V (K) wieder gleich V (K) ist, sind. Wenn für den Operator O b zugeordnete Abbildung bijektiv, d.h. das Urbild jedes einzelnen ist die dem Operator O 0 Elements von V (K) ist genau einelementig. Insbesondere kann dies nur erfüllt sein, wenn b (und des inversen Operators O b−1 ) lediglich aus dem Nullvektor der Kern des Operators O besteht. Nicht alle Operatoren sind linear, z.B. ist leicht zu sehen, dass auf dem Raum L2 (R3 ) der b Operator Oχ(x) = χ2 (x) nicht linear ist. Ein spezielle Typ von nicht-linearen Operatoren b sind antilineare Operatoren. Diese sind antihomogen, d.h ein antilinearer Operator A erfüllt anstelle von Glg. (B.8) b b A(αχ) = α∗ Aχ. (B.10) Für lineare Operatoren sind Addition, Skalarmultiplikation und Verknüpfung (Operatorb≡O b1 , O b2 : V1 (K) → V2 (K) sowie O b3 : V2 (K) → produkt) definiert. Für die Operatoren O V3 (K) gilt b1 + O b2 )χ = O b1 χ + O b2 χ, (O b = α(Oχ), b (αO)χ (B.11) b3 O b2 )χ = O b3 (O b2 χ), (O (B.13) (B.12) wobei der Vektor χ ∈ V (K) und der Skalar α in den dem Problem entsprechenden Räumen liegen. b1 , O b2 : V (K) → V (K) gilt nicht zwangsläufig, dass diese kommuFür zwei Operatoren O tieren, d.h. der Kommutator b1 , O b2 ] = O b1 O b2 − O b2 O b1 [O (B.14) ist nicht notwendigerweise für beliebige Vektoren von Null (bzw. vom Nulloperator) verschieden. 173 B.1.3 Skalarprodukt und Norm Ein Vektorraum V (K), auf dem für zwei beliebige Vektoren χ1 und χ2 ein Skalarprodukt definiert ist, heißt auch Skalarproduktraum und ist normiert, d.h. eine Norm ist definiert. Je nachdem ob der Vektorraum reell oder komplex ist, ist das Skalarprodukt eine Abbildung auf den Körper der reellen oder komplexen Zahlen, welche folgende drei Bedingungen erfüllt: 1. Das Skalarprodukt von χ1 und χ2 ist die komplex konjugierte Zahl zum Skalarprodukt von χ2 und χ1 . Zum klareren Verständnis in Formeln: hχ1 |χ2 i = hχ2 |χ1 i∗ . (B.15) 2. Das Skalarprodukt von χ1 und χ2 ist linear im zweiten Faktor, d.h. in χ2 . Zum klareren Verständnis mit Vektoren χ1 , χ2 und χ3 and Skalaren α1 und α2 : hχ3 |α1 χ1 + α2 χ2 i = α1 hχ3 |χ1 i + α2 hχ3 |χ2 i . (B.16) 3. Das Skalarprodukt eines Vektors χ mit sich selbst ist eine relle, nicht-negative Zahl (Positivität): hχ|χi ≥ 0, (B.17) und falls hχ|χi = 0, gilt notwendigerweise χ = . Aufgrund seiner Positivität definiert Glg. (B.17) die Norm des Vektors χ: Nχ ≡ kχk2 ≡ hχ|χi ≥ 0. (B.18) Mittels Glg. (B.15) und Glg. (B.16) findet man leicht, dass das Skalarprodukt hχ1 , χ2 i nicht linear sondern anti-linear im ersten Faktor χ1 ist: hα1 χ1 + α2 χ2 , χ3 i = α1∗ hχ1 , χ3 i + α2∗ hχ2 , χ3 i . (B.19) Aus diesen drei Eigenschaften lässt sich eine sehr wichtige Eigenschaft des Skalarprodukts herleiten, die Scharz’sche Ungleichung (auch: Cauchy-Schwarz’sche Ungleichung oder Dreiecksungleichung): p (B.20) |hχ1 , χ2 i| ≤ hχ1 , χ1 i hχ2 , χ2 i. Gleichheit gilt dann und nur dann wenn χ1 und χ2 Vielfache voneinander sind. B.1.4 Weitere Eigenschaften: Operatornorm, Beschränktheit b : V (K) → V 0 (K), der von einem normierten Vektorraum Für einen linearen Operator O auf einen anderen (nicht notwendigerweise verschiedenen) normierten Vektorraum abbildet, kann man eine Operatornorm definieren: b Oχ 0 b b V ≡ sup Oχ (B.21) O ≡ sup 0. V χ∈V,χ6= kχkV kχkV =1 Hierbei sind V und V 0 selbstverständlich als V (K) und V 0 (K) zu verstehen. Ein Operator, dessen Operatornorm endlich ist heißt beschränkt. 174 B.1.5 Lineare Abhängigkeit, Orthogonalität, Vollständigkeit, Basis, Dimensionalität Man nennt eine Satz von Vektoren χ1 , χ2 , . . . , χN dann und nur dann linear unabhängig, sofern keine Linearkombination existiert, die N X αn χ n = (B.22) n=1 erfüllt, außer der trivialen Linearkombination, d.h. jener, für welche alle Koeffizienten einzeln verschwinden, d.h. αn = 0 ∀n ∈ {1, . . . , N }. In diesem Fall kann keiner dieser Vektoren als eine Linearkombination der anderen geschrieben werden. Andernfalls nennt man den Satz der Vektoren χ1 , χ2 , . . . , χN linear abhängig. Man nennt zwei Vektoren zueinander orthogonal, wenn ihr Skalarprodukt verschwindet: hχ1 | χ2 i = 0 ⇔ χ1 ⊥ χ2 . (B.23) In diesem Fall sind diese Vektoren auch voneinander linear unabhängig. Ein Satz paarweise zueinander orthogonaler Vektoren ist automatisch linear unabhängig, der Umkehrschluss gilt aber nicht. Man kann aber immer einen Satz von N Linearkombinationen der N linear unabhängigen Vektoren bilden, so dass diese N Linearkombinationen paarweise zueinander orthogonal sind. Dieses Verfahren nennt man auch Orthogonalisierung. Falls jeder Vektor χ eines Vektorraums als eine Linearkombination der Vektoren χ1 , χ2 , . . . χN dargestellt werden kann, so nennt man den Satz der Vektoren χ1 , χ2 , . . . χN vollständig. Die Vektoren eines vollständigen Satzes müssen nicht zwangsläufig linear unabhängig sein. Indem man solange Vektoren aus dem vollständigen Satz entfernt bis der verbleibendende Satz linear unabhängig ist, erhält man einen maximalen Satz linear unabhängiger Vektoren (der selbstverständlich immer noch vollständig ist). Nachdem man diesen maximalen Satz linear unabhängiger Vektoren orthogonalisiert hat, erhält man eine sogenannte Basis des Vektorraums. Nachdem man diese Basisvektoren alle normiert hat, so dass ihre Norm gleich eins ist, spricht man von einer Orthonormalbasis (ONB). Im Fall normierter orthogonaler Vektoren spricht man auch von Orthonormalität. Die Dimension d eines Vektorraums V ist die maximale Zahl linear unabhängiger Vektoren. Ein Hilbertraum H ist ein solcher Vektorraum mit allen zuvor in diesem Abschnitt genannten Eigenschaften sowie der zusätzlichen Eigenschaft, dass dieser entweder endliche Dimensionalität hat (d < ∞), oder, dass einen unendlichen, vollständigen Satz von paarweise zueinander orthogonalen Vektoren χ1 , χ2 , . . . , χn , . . . ∈ H gibt, dass man für jeden Pso ∞ einzelnen Vektor χ Zahlen α1 , α2 , . . . , αn , . . . finden kann, so dass i=1 αi χi zu χ konvergiert.PDies bedeutet, dass für ausreichend großes N die Norm der Differenz der Vektoren χ− N i=1 αi χi verschwindet N X lim χ − αi χi = 0. (B.24) N →∞ i=1 175 B.2 Eigenschaften von Hilberträumen Der Funktionenraum der quadrat-integrablen Funktionen (L2 Funktionen) besitzt die Eigenschaften eines (komplexen) Hilbertraums. Dies werden wir im folgenden zeigen. Zunächst handelt es sich um einen linearen Raum, d.h. wenn χ1 (x) und χ2 (x) zwei quadratintegrable Funktionen sind, dann sind auch ihre Summe sowie das Produkt jeder einzelnen mit einer beliebigen komplexen Zahl und folglich auch jegliche Linearkombination quadratintegrable Funktionen, z.B. α1 χ1 (x) + α2 χ2 (x), (B.25) wobei α1 und α2 beliebig wählbare komplexe Zahlen sind. Desweiteren kann man auf diesem Hilbertraum ein Skalarprodukt definieren. Dieses Skalarprodukt ist eine komplexe Zahl. Gemäß seiner Definition ist das Skalarprodukt der Funktion χ1 (x) mit der Funktion χ2 (x) Z hχ1 |χ2 i = d3 x1 . . . d3 xn χ∗1 (x1 , . . . , xn )χ2 (x1 , . . . , xn ). (B.26) Dieses L2 Skalarprodukt hat die drei fundamentalen Eigenschaften aus den Glgn. (B.15), (B.16) und (B.17), wie man mittels seiner Definition, vgl. Glg. (B.26), leicht beweisen kann. Falls das Skalarprodukt der Funktionen χ1 (x) und χ2 (x) verschwindet, nennt man diese zueinander orthogonal. Die Norm Nχ einer Funktion χ ist als Skalarprodukt dieser Funktion mit sich selbst definiert, vgl. Glg. (B.18), d.h. Nχ = kχk2 = hχ|χi . (B.27) Die Schwarz’sche Ungleichung gilt selbstverständlich auch für das durch Glg. (B.26) definierte Skalarprodukt und garantiert, dass das Integral in vgl. Glg. (B.26) konvergiert, wenn χ1 und χ2 beide quadrat-integrable Funktionen sind. Zusätzlich zur Linearität und zur Möglichkeit ein Skalarprodukt zu definieren besitzt der Raum der quadrat-integrablen (L2 ) Funktionen eine Eigenschaft namens Vollständigkeit. Erst diese Eigenschaft ermöglicht die Identifikation des L2 Raums mit dem Hilbertraum. Vollständigkeit bedeuted, dass jeder Satz von quadrat-integrablen Funktionen, die das Cauchy-Kriterium erfüllen, im quadratischen Mittel zu einer quadrat-integrablen Funktion konvergiert. Im Gegenzug bedeutet dies, dass jede quadrat-integrable Funktion als der Grenzwert (im quadratischen Mittel) einer konvergenten Reihe (im Sinne von Cauchy) von quadrat-integrablen Funktionen aufgefasst werden kann (lineare Separierbarkeit). 176 C Dirac Notation Da wir in der QM im Allgemeinen mit einem abstrakten Hilbertraum H hantieren, empfiehlt es sich eine Darstellung zu wählen, welche in möglichst transparenter Art und Weise die physikalische Observablen, zu denen ein gegebener Zustand ein Eigenvektor ist, in den Vordergrund zu stellen. Die Dirac Notation (oder auch Braket Notation) ist die Umsetzung dieses Gedankens. In Dirac Notation wird das Symbol hχ1 | χ2 i , (C.1) welches bisher zur Kennzeichnung eines Skalarprodukts zwischen zwei beliebigen Elementen (bzw. Vektoren) des Hilbertraums H verwendet wurde, in zwei Teile aufgespalten, die man als Bra: hχ1 | und Ket: |χ2 i (C.2) bezeichnet. Das Ket |χ2 i wird einfach anstelle des Symbols χ2 verwendet, um ein generisches Element des Hilbertraums H zu indizieren. Das Bra hχ1 | wird verwendet um die Wirkung des Skalarprodukts auf irgendein Element des Hilbertraums H anzuzeigen, d.h. das Bra hχ1 | ist ein Element des Dualraums zu H, dessen Partner in H durch |χ1 i gegeben ist. Aufgrund der komplexen Natur des Skalarprodukts, hχ1 |χ2 i = hχ2 |χ1 i∗ (C.3) und dessen Linearität im zweiten Faktor folgt offensichtlich aus |χi = α |χ1 i + β |χ2 i (C.4) hχ| = α∗ hχ1 | + β ∗ |χ2 i . (C.5) die Beziehung b auf den Zustansvektor χ wird durch Die Anwendung eines Operators A b |χi = |Aχi b A (C.6) b auf das Bra hχ1 | als das Funktional bezeichnet. Man kann genauso die Wirkung von A b auf den über H definieren, das aus der Verknüpfung der Anwendung des Operators A Hilbertraumvektor |χ2 i und dem anschließenden Skalarprodukt mit dem Dualraumvektor hχ1 | besteht, b |χ2 i ≡ hχ1 | A b |χ2 i = hχ1 |Aχ b 2 i ≡ hχ1 | A b |χ2 i . hχ1 | A (C.7) b |χi entsprechende Bra der Dualraumvektor hχ| A b† WIr merken an, dass das dem Vektor A ist. Wir schreiben daher b |χi † = hχ| A b† A (C.8) und b† A b |χ2 i = hAχ b 1 |Aχ b 2i , hχ1 | A 2 b† A b |χi = hAχ| b Aχi b = b hχ| A | Aχi . Die Dirac Notation ist Ihnen bereits in den Abschnitten 7.3 und 10 begegnet. 177 (C.9) D D.1 Abbildungen und Tabellen Abbildungen Abbildung D.1: Energiedichte u(ω(λ), T ) der Schwarzkörperstrahlung als Funktion der Temperatur (Abb. aus Wikipedia). Als Abszisse ist die Wellenlänge λ aufgetragen. Abbildung D.2: Schematisch: mit Strahlung gefüllter Hohlraum (Abb. aus [7]). Abbildung D.3: Schematisch: Energiedichte u(ω, T ) der Schwarzkörperstrahlung mit Grenzfällen: Rayleigh-Jeans und Wien’sches Verschiebungsgesetz (Abb. aus [7]). Als Abzisse ist die Frequenz ω aufgetragen. 178 Abbildung D.4: Schematisch: Experimenteller Aufbau zur Messung des photoelektrischen Effekts (Abb. aus Wikipedia). Abbildung D.5: Photoelektrischer Effekt. Einfallende Lichtquanten ausreichend hoher Frequenz streuen an gebundenen Elektronen. Sofern die Auslösearbeit W überschritten wird, wird ein Elektron mit Energie E = ~ω − W emittiert. Abbildung D.6: Schematisch: Experimenteller Aufbau zur Messung von Compton-Streuung: (Abb. aus dem Web: Serlo). Abbildung D.7: Typische Intensitätsverteilung für Compton-Streuung an Elektronen im Kohlenstoff: gestreute Photonen (λ = 0.731 Å) haben im Vergleich zu ungestreuten Photonen (λ = 0.707 Å) Energie verloren (Abb. aus [7]). 179 Abbildung D.8: Schematisch: ein Photon streut an einem ruhenden Elektron. Die Wellenlängenänderung ist eine Funktion des Streuwinkels ϕ (Abb. aus Wikipedia). 180 Abbildung D.9: Beispiele: Emissionsspektrum von Quecksilber (links, Abb. aus Wikipedia). Im zugehörigen Termschema (rechts, Abb. von www.licht-im-terrarium.de) sind die Linien mit aufsteigender Wellenlänge den Übergangen 3 S1 → 3 P0 (h Linie), 3 S1 → 3 P1 (g Linie), 3 S1 → 3 P2 (e Linie) sowie 3 D2 → 1 P1 (orange Doppellinie, nicht eingezeichnet) zugeordnet, vgl. z.B. NIST Handbuch. Abbildung D.10: Beispiele: Emissionsspektrum (links) und Termschema (rechts) von Wasserstoff, (beide Abb. aus Wikipedia). Abbildung D.11: Franck-Hertz Versuch: Schaltbild(rechts) und gemessener Strom bei Messungen mit Quecksilber(links), (beide Abb. aus Wikipedia). Die Beschleunigungsspannung Ub ist wesentlich größer als die Gegenspannung Ug . 181 Abbildung D.12: Schematisch: der Stern-Gerlach Versuch mit Silber-Atomen. 4 zeigt die klassisch erwartete und 5 die real beobachtete Verteilung (Abb. aus Wikipedia). Abbildung D.13: Schematisch: die Experimente von Davisson und Germer (links) und von Thomson (rechts), Abb. aus [5]. Die Beschreibung ist im Abschnitt 3.4 zu finden. Abbildung D.14: Beugungsbilder in den Experimenten von Davisson und Germer (links) und von Thomson (rechts). Beugungsbilder von 50 keV Elektronen auf einen Cu3 Au Schirm der Dicke 400 Å (rechts) und von 330 eV Elektronen an der (1, 1, 0) Ebene eines Wolfram-Einkristalls, Abb. aus [5]. 182 Abbildung D.15: Abhängigkeit der Interferenzmaxima von der Wellenlänge der Elektronen bei Beugung an einem Nickel-Einkristall, Abb. aus [5]. Abbildung D.16: Aufbau eines Interferenzmusters aus Einschlägen einzelner Elektronen (Simulation), von links nach rechts 28, 1000 sowie 10000 Elektronen, Abb. aus [5]. Abbildung D.17: Schematisch: Aufbau des Doppelspalt-(Gedanken-)experiments, Abb. aus [5]. Die Beschreibung ist im Abschnitt 3.6 zu finden. (d) (a) (b) (c) Abbildung D.18: Wahrscheinlichkeitsverteilung beim Doppelspaltexperiment, Abb. von Wikipedia (K.D. Keller). Die Beschreibung ist im Abschnitt 3.6 zu finden. Abbildung D.19: Schematisch: Gedankenexperiment zur Unschärfe am Spalt, Abb. aus [5]. 183 Abbildung D.20: Schematisch: Gedankenexperiment zur Unschärfe beim Mikroskop, Abb. aus [5]. 184 Abbildung D.21: Schematisch: ein Potential, das im Unendlichen ausreichend schnell zu Null abfällt, Abb. aus [5]. W < 0 entspricht der Energie E eines Bindungszustands, U ist das Potential. Abbildung D.22: Schematisch: geladene Teilchen auf Kreisbahnen im Magnetfeld für verschiedene Energien, Abb. aus [5]. W (j) sind die Grenzen der verschiedenen Energieintervalle. Abbildung D.23: Schematisch: unendlich tiefer Potentialtopf (Abb. aus [1]). 185 Abbildung D.24: Schematisch: gerade und ungerade Lösungen zum unendlich tiefen Potentialtopf (Abb. aus [1]). Abbildung D.25: Schematisch: Grundzustand beim dreidimensionalen Potentialtopf (Abb. aus [1]). Abbildung D.26: Schematisch: Potentialtopf als Modell für Metallische Leiter (Abb. aus [1]). W entspricht der Austrittsarbeit. 186 Abbildung D.27: Schematisch: Streuung am eindimensionalen Potentialtopf (Abb. aus [1]). Das einfallende Teilchen kommt von links. Abbildung D.28: Schematisch: Resonanz beim eindimensionalen Potentialtopf (Abb. aus [1]). Abbildung D.29: Schematisch: Tunneleffekt (Abb. aus [1]). Das einfallende Teilchen kommt von links. 187 Abbildung D.30: Schematisch: Gamow Faktor (Abb. aus [1]). Ein beliebiges Potential wird durch eine Reihe infinitesimal breiter Potentialstufen genähert, über die integriert wird. Abbildung D.31: Schematisch: Alphazerfall (Abb. aus [1]). Abbildung D.32: Schematisch: Niedrig liegende Zustände des harmonischen Oszillators (Abb. aus [1]). 188 Abbildung D.33: Schematisch: Vergleich der Wahrscheinlichkeitsdichten eines hoch liegenden Zustands (n = 100) des quantenmechanischen Oszillators und des Klassischen Oszillators (Abb. aus [1]). 189 Abbildung D.34: Kartesische Koordinaten und Kugelkoordinaten (Abb. von Wikipedia). 0.8 n=0 n=1 n=2 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 0 5 10 15 20 25 Abbildung D.35: Typische radiale Wellenfunktionen (hier für Wasserstoff). 190 0.06 φ100(r) |φ100(r)|2 |y10(r)|2 0.05 a.u. 0.04 0.03 0.02 0.01 0 0 1 2 3 4 5 r/a0 Abbildung D.36: Radialteil der Grundzustandswellenfunktion, Wahrscheinlichkeitsdichte und reduzierte Wahrscheinlichkeitsdichte (hier für Wasserstoff). Abbildung D.37: Radialteil der Wahrscheinlichkeitsdichten für Grundzustand und angeregte Zustände (hier für Wasserstoff, Abb. aus [7]). Abbildung D.38: Normaler Zeeman Effekt: Aufspaltung der Energieniveaus durch ein äußerse Magnetfeld. D.2 Tabellen 191 Größe Länge l Masse m Zeit t Internat. System (SI) Meter [m] Kilogramm [kg] Sekunde [s] h i Energie E Newton [N] = ms2kg h 2 i Joule [J] = ms2kg Stromstärke I Ampère [A] Ladung Q Coulomb [C] = [As] h i Volt [V] = mAskg 3 Kraft F Spannung U Gauß’sches System Zentimeter [cm] = 10−2 [m] Gramm [g] = 10−3 [kg] Sekunde [s] g Dyn [dyn] = cm = 10−5 [N] 2 h s2 i Erg [erg] = cms2 g = 10−7 [J] q m 1 s cm3 g = 10c [A] (StatA) esu = s s4 q m 1 s cm3 g ESU [esu] = = 10c [C] s2 m 6 erg p cm g 10 s (StatV) esu = = c [V] s2 Tabelle 4: Eine unvollständige Liste einiger physikalischer Größen in verschiedenen Einheitensystemen. Die Einheiten sind derart ausgewählt, dass sie für die Vorlesung relevant sind. Basiseinheiten der jeweiligen Maßsysteme sind fettgedruckt. In den Umrechnungen werden die Naturkonstanten c und kB aus Tabelle Tab. 5 verwendet. Konstante Lichtgeschwindigkeit Elementarladung Boltzmann-Konstante Planck’sche Konstante Elektronenruhemasse Symbol c e kB h ~ me Protonenruhemasse mp Rydberg-Konstante R∞ Internat. System 299792458 ms 1.6021766208(98) × 10−19 C J 1.38064852(79) × 10−23 K −34 6.626070040(81) × 10 J s 1.054571800(13) × 10−34 J s 9.10938215(45) × 10−31 kg 0.510998910(13) MeV c2 1.672621898(21) × 10−27 kg 938.2720813(58) MeV c2 10973731.568508(65)m Gauß’sches System 29979245800 cm s 4.80320425(10) × 10−10 esu 1.38064852(79) × 10−16 erg K 6.626070040(81) × 10−27 erg s 1.054571800(13) × 10−27 erg s 9.10938215(45) × 10−28 g 1.672621898(21) × 10−24 g 1836.15267389(17) me 1097373156.8508(65)cm Tabelle 5: Eine unvollständige Liste einiger Naturkonstanten. Wellenlänge λ [cm] 3 × 104 (Radiowellen) 1 (Mikrowellen) 4 − 8 × 10−5 (sichtbares Licht) 10−8 (Röntgenstrahlung) 10−11 (Gammastrahlung) Frequenz ν [Hz] 106 3 × 101 0 7.5 − 3.7 × 101 4 3 × 1018 3 × 1021 Energie hν [eV ] 4.1 × 10−9 1.2 × 10−4 3 − 1.5 1.2 × 104 1.2 × 107 Tabelle 6: Typische Wellenlängen, Frequenzen und Energien zu den verschiedenen Spektralbereichen des Lichts [1 eV = 1.602 × 10−19 J] (Tab. aus [5]). Element W W [eV] 4.5 Ta 4.2 Ni 4.6 Ag 4.8 Cs 1.8 Pt 5.3 Tabelle 7: Gemessene Werte für Austrittsarbeiten W einiger Metalle [1 eV = 1.602 × 10−19 J] (Tab. aus [7]). 192 Teilchen λ [Å] Wasserstoffatom 1.46 Wasserstoffmolekül 1.03 Heliumatom 0.72 Quecksilberatom 0.10 Tabelle 8: Mittlere thermische Wellenlängen einiger Atome und Moleküle bei Raumtemperatur (Tab. aus [5]). Schale (n) Orbital (`) K (1) s (0) L (2) s (0) L (2) p (1) L (2) p (1) m Wellenfunktion φn ` m 32 Zr − 0 φ1 0 0 = √1π aZ0 e a0 32 Zr − Z Z 1 √ 2 − a0 r e 2a0 0 φ2 0 0 = 4 2π a0 23 − Zr Z 0 φ2 1 0 = 4√12π aZ0 re 2a0 cos ϑ a0 32 Zr − 2a Z ∓iϕ 0 sin ϑe ±1 φ2 1 ±1 = 8√1 π aZ0 re a0 Tabelle 9: Einige Wellenfunktionen zu Wasserstoff-artigen Atomen (Tab. aus [5]). Die Größe a0 stimmt mit dem Bohr’schen Radius überein. Z ist die Kernladungszahl. 193 Literatur [1] R. Bertlmann, N. Friis, “Theoretical Physics T2 Quantum Mechanics” http://homepage.univie.ac.at/Reinhold.Bertlmann/ [2] R.P. Feynman, R.B. Leighton, M. Sands, “The Feynman Lectures on Physics (vol III),” Reading Massachusetts, US: Addison-Wesley (1963) 338 p. [3] A. Messiah, “Quantum Mechanics, Volume I”, Amsterdam, Netherlands: North-Holland Publishing Company (1958) 504 p. [4] A. Messiah, “Quantum Mechanics, Volume II”, Amsterdam, Netherlands: North-Holland Publishing Company (1958) 632 p. [5] G.M. Prosperi, P. Caldirola et al., “Introduzione alla fisica teorica” (Introduction to Theoretical Physics), UTET 1982, 965 p. [6] J.J. Sakurai, J. Napolitano, “Modern Quantum Mechcnics (2nd Ed.),” Reading Massachusetts , US: Addison-Weslay (2003) 550 p. [7] F. Schwabl, “Quantenmechanik (QM I),” Berlin, Germany: Springer (2007) 430 p. [8] S. Weinberg, “Lectures on Quantum Mechanics”, Cambridge, UK: Cambridge University Press, (2013) 358 p. 194