T30f Theoretische Teilchen- und Kernphysik Prof. Dr. Nora

T30f
Theoretische Teilchen- und
Kernphysik
Prof. Dr. Nora Brambilla
Quantenmechanik I
Vorlesung Sommersemester 2016 TUM
Prof. Dr. Nora Brambilla
Dr. Johannes Heinrich Weber
Technische Universität
München
Physik
Department
Inhaltsverzeichnis
1 Einleitung
6
2 Ursprünge der Quantenmechanik
8
2.1
Klassische Physik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.2
Photonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
2.2.1
Strahlung eines Schwarzen Körpers (Hohlraumstrahlung) . . . . . .
9
2.2.2
Photoelektrischer Effekt . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.3
Compton Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3
2.4
Atomare Spektren und Quantisierung von Materie . . . . . . . . . . . . . . 15
2.3.1
Atomare Spektren
. . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.2
Diskrete Energieniveaus . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.3
Experimentelle Bestätigung der Existenz der Energieniveaus: der
Franck-Hertz Versuch . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.4
Andere Beispiele der Quantisierung: Raumquantisierung . . . . . . 21
Erfolge und Grenzen der alten Quantentheorie . . . . . . . . . . . . . . . . 22
3 Wellenfunktion und Schrödingergleichung
25
3.1
Wellen- und Teilchenaspekte von Strahlung . . . . . . . . . . . . . . . . . . 25
3.2
Teilchencharakter von Materie und de Broglie’sche Hypothese . . . . . . . 25
3.3
Die Schrödinger Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4
Experimentelle Bestätigung der Welleneigenschaften von
Materieteilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.5
Kontinuitätsgleichung und statistische Interpretation der
Wellenfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.6
Die statistische Interpretation und die Beschreibung mittels Welle-TeilchenDualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.7
Heisenberg’sches Unschärfeprinzip und Unschärferelationen . . . . . . . . . 36
3.7.1
Beugung an einem Spalt . . . . . . . . . . . . . . . . . . . . . . . . 37
3.7.2
Lokalisation mit einem Mikroskop . . . . . . . . . . . . . . . . . . . 38
3.7.3
Energie-Zeit-Unschärfe . . . . . . . . . . . . . . . . . . . . . . . . . 38
1
4 Die Schrödingergleichungen
4.1
40
Mathematische Eigenschaften der Schrödingergleichung
und des Hamiltonoperators . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.1.1
Schrödingergleichung . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.2
Operatoren und ihre Wirkung auf Elemente des Hilbertraums . . . . . . . 41
4.3
b . . . . . . . . . . 43
Eigenwerte und Eigenvektoren des Hamiltonoperators H
4.4
Entwicklung der Wellenfunktion nach einer Basis von orthonormalen Eigenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5
Allgemeine Lösung der Schrödingergleichung . . . . . . . . . . . . . . . . . 49
4.6
Physikalische Interpretation der Schrödingergleichung . . . . . . . . . . . . 51
5 Allgemeine Prinzipien der Quantenmechanik und Formalismen
56
5.1
Allgemeine Postulate der Quantenmechanik . . . . . . . . . . . . . . . . . 56
5.2
Orts- und Impulsobservablen: Größen mit klassischen Analoga . . . . . . . 64
5.2.1
Ort als Observable . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2.2
Impuls als Observable . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.3
Unschärferelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.2.4
Allgemeinere Observablen . . . . . . . . . . . . . . . . . . . . . . . 68
5.3
Kommutatoren und Unbestimmtheitsrelationen . . . . . . . . . . . . . . . 71
5.4
Zeitabhängigkeit des Mittelwerts einer Observablen und
Ehrenfest’sches Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.5
Konstanten der Bewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.6
Drehimpuls eines Teilchens . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.7
Parität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6 Anwendungen der Schrödingergleichung:
eindimensionale Probleme
80
6.1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6.2
Freies Teilchen
6.3
Potentialtopf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.3.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Allgemeine Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . 83
2
6.3.2
6.4
6.5
Unendlich tiefer Potentialtopf . . . . . . . . . . . . . . . . . . . . . 84
Endlicher Potenialtopf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
6.4.1
Bindungszustände (diskretes Spektrum, −V0 < E < 0) . . . . . . . 87
6.4.2
Streuzustände (Kontinuierliches Spektrum, E > 0)
Tunneleffekt an der Potentialschwelle . . . . . . . . . . . . . . . . . . . . . 92
6.5.1
Endliche Potentialbarriere (V0 > E) . . . . . . . . . . . . . . . . . . 92
6.5.2
Transmissionskoeffizient beim Tunneleffekt . . . . . . . . . . . . . . 92
6.5.3
Physikalische Beispiele für den Tunneleffekt . . . . . . . . . . . . . 93
7 Harmonischer Oszillator
7.1
. . . . . . . . . 90
95
Algebraische Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.1.1
Leiteroperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.1.2
Spektrum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.1.3
Nullpunktsenergie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7.2
Vergleich zum Klassischen Oszillator . . . . . . . . . . . . . . . . . . . . . 101
7.3
Besetzungszahldarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.4
Analytische Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
7.5
Kohärente Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8 Anwendungen der Schrödingergleichung mit Separation der Variablen:
Teilchen im Zentralpotential
109
8.1
Schrödinger Gleichung in drei Dimensionen . . . . . . . . . . . . . . . . . . 109
8.2
Zentralpotential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8.2.1
Multiplikativer Separationsansatz . . . . . . . . . . . . . . . . . . . 111
8.2.2
Die Azimuthalgleichung . . . . . . . . . . . . . . . . . . . . . . . . 112
8.2.3
Die Polargleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.2.4
Die Radialgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.2.5
Parität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
8.3
Freies Teilchen in sphärischen Koordinaten . . . . . . . . . . . . . . . . . . 121
8.4
Coulomb Potential und Wasserstoff Atom . . . . . . . . . . . . . . . . . . . 123
3
8.4.1
Exkurs: Relativ- und Schwerpunktskoordinaten . . . . . . . . . . . 126
8.4.2
Termschema und Quantenzahlen . . . . . . . . . . . . . . . . . . . 127
8.4.3
Struktur der eigentlichen Eigenfunktionen . . . . . . . . . . . . . . 128
9 Geladene Teilchen im elektromagentischen Feld
132
9.1
Bewegung im konstanten elektromagnetischen Feld . . . . . . . . . . . . . 134
9.2
Normaler Zeeman Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
10 Spin und Drehimpuls
138
10.1 Herleitung der Quantisierung . . . . . . . . . . . . . . . . . . . . . . . . . 139
10.1.1 Normierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
10.2 Bezug zum Bahndrehimpuls . . . . . . . . . . . . . . . . . . . . . . . . . . 143
10.3 Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
10.3.1 Historische Perspektive . . . . . . . . . . . . . . . . . . . . . . . . . 144
10.3.2 Das Stern-Gerlach Experiment . . . . . . . . . . . . . . . . . . . . . 144
10.3.3 Vektormodell für Atome, Drehimpuls-Kopplung, Spin-Anomalie . . 144
10.3.4 Formalismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
10.4 Teilchen mit Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
10.4.1 Schrödinger-Darstellung für ein Teilchen mit Spin . . . . . . . . . . 146
10.4.2 Zustände und Spinoren . . . . . . . . . . . . . . . . . . . . . . . . . 148
10.4.3 Schrödingergleichung für ein Teilchen mit Spin . . . . . . . . . . . . 150
10.5 Kopplung von Drehimpulsen & Clebsch-Gordan Koeffizienten . . . . . . . 152
10.5.1 Addition von Spin 1/2 Operatoren . . . . . . . . . . . . . . . . . . 156
10.5.2 Addition von Bahndrehimpuls und Spin 1/2 Operatoren . . . . . . 158
11 Näherungsmethoden zur Lösung der Schrödingergleichung
159
11.1 Störungstheorie (Perturbative Methode) . . . . . . . . . . . . . . . . . . . 159
11.1.1 Zeitunabhängige Störungstheorie (nicht-entarteter Fall) . . . . . . . 159
11.1.2 Anwendungen der Störungstheorie . . . . . . . . . . . . . . . . . . . 162
11.1.3 Relativistische Korrekturen beim Wasserstoff . . . . . . . . . . . . . 163
4
11.2 Variationsmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
Anhänge
167
A Notation und Konventionen
167
A.1 Einheiten und Werte von Naturkonstanten . . . . . . . . . . . . . . . . . . 167
A.2 Vektoren und Metrik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
A.3 Wellenfunktionen und Zustandsvektoren . . . . . . . . . . . . . . . . . . . 169
A.4 Fourier-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
A.5 Delta-Distribution
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
A.5.1 Eigenschaften der δ- und θ-Funktion . . . . . . . . . . . . . . . . . 171
A.5.2 Darstellungen der Dirac’schen Delta-Distribution . . . . . . . . . . 171
B Zusammenfassung des Formalismus
B.1
172
Hilbertraum, Operatoren und Skalarprodukt . . . . . . . . . . . . . . . . . 172
B.1.1 Allgemeine Eigenschaften von Vektorräumen . . . . . . . . . . . . . 172
B.1.2 Operatoren und ihre Wirkung auf Elemente von Vektorräumen . . . 172
B.1.3 Skalarprodukt und Norm . . . . . . . . . . . . . . . . . . . . . . . . 174
B.1.4 Weitere Eigenschaften: Operatornorm, Beschränktheit . . . . . . . . 174
B.1.5 Lineare Abhängigkeit, Orthogonalität, Vollständigkeit, Basis, Dimensionalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
B.2
Eigenschaften von Hilberträumen . . . . . . . . . . . . . . . . . . . . . . . 176
C Dirac Notation
177
D Abbildungen und Tabellen
178
D.1 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
D.2 Tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
Bibliographie
194
5
1
Einleitung
“Quantenmechanik” (QM) ist die genaue Beschreibung des Verhaltens von Materie und
Licht und – im Speziellen – von Prozessen auf atomaren Skalen. QM ist einer der Grundpfeiler der Physik. Sie ist essentiell sowohl für moderne Atom-, Molekül-, Kern- und Elementarteilchenphysik als auch für große Teile der Chemie und Physik der Kondensierten
Materie. Im Besonderen ist die Kombination aus QM und spezieller Relativitätstheorie der Ursprung von Quantenfeldtheorie (QFT), welche das theoretische Fundament des
Standardmodells der Teilchenphysik bildet: dieses beschreibt derzeit unser fundamentalstes Wissen über die Natur.
QM hat unser Verständnis von Systemen auf Längenskalen weniger Nanometer beeinflusst, welche für Chemie, Materialwissenschaften, Optik und Elektronik eine wesentliche
Rolle spielen. Die Existenz von Orbitalen und Energieniveaus ist ausschließlich durch
QM erklärbar. Sie erklärt damit das Verhalten von Isolatoren, Leitern und Halbleitern
sowie Riesenmagnetowiderstand. Sie erklärt die Existenz von “Löchern” und den Transport von Löchern und Elektronen in elektronischen Geräten. QM spielt eine wesentliche
Rolle in Photonik, Quantenelektronik, Mikroelektronik und vielen neuen und zukünftigen
Technologien. Ein solcher Bereich ist die Nanotechnik, ermöglicht durch Aufkommen der
Nano-Fabrikation in der jüngsten Vergangenheit. Während Transistoren in der Elektronik immer kleiner werden, ändert sich die Art und Weise wie Elektronen sich durch die
Bauteile bewegen: nano-elektronischer Transport unterscheidet sich deutlich von mikroelektronischem Transport.
Die Quantisierung des elektromagnetischen Feldes ist wesentlich für die Forschunsbereiche der Nano- und Quantenoptik. Sie erklärt wie Photonen mit atomaren Systemen und
sonstiger Materie wechselwirken, insbesondere erklärt QM die Strahlung eines heißen
Körpers und seine Farbveränderung mit der Temperatur. Sie erlaubt die Verwendung von
elektromagnetischen oder optischen Feldern um Quanteninformation zu tragen. Außerdem wird QM benötigt um die Wechselwirkung von Photonen in Solarzellen zu verstehen, wie auch in vielen anderen Bereichen der Materialwissenschaften. Wenn zwei Objekte auf sehr geringen Abstand zusammengeführt werden, erfahren sie eine Kraft – die
sogenannte Casimir-Kraft – die lediglich mit den Mitteln der QM verstanden werden
kann. Dies ist wichtig für unser Verständnis von mikro-/nano-elektromechanischen Sensorsystemen. Darüber hinaus ist das Verständnis von Spins für Spintronik unverzichtbar,
eine weitere aufkommende Technologie in der Riesenmagentowiderstand, magnetischer
Tunnelwiderstand sowie Spintransfer verwendet werden. QM ermöglicht ebenso die Forschungsbereiche Quanteninformation, Quantenkryptographie und Quantencomputer. Es
ist offenkundig dass die reichhaltige Welt der Quantenphysik auf viele Aspekte zukünftiger
Technologien einen großen Einfluss haben wird.
Das Verhalten physikalischer Objekte auf kleinen Skalen ist im Widerspruch zu Ihrer
direkten Erfahrung. Physikalische Objekte verhalten sich weder wie Wellen noch wie Teilchen noch wie irgendetwas anderes, das Sie jemals gesehen haben. Wir haben keine direkte Erfahrung in dieser Domäne der Physik und daher keinerlei Intuition wie sich diese
mikroskopischen Systeme verhalten. Das Verhalten von Quantensystemen unterscheidet
sich wesentlich vom Verhalten makroskopischer Systeme in der “Klassischen Mechanik”.
Quantenmechanische Gleichungen wurden postuliert um experimentelle Beobachtungen
zu erklären, aber die Interpretation der tieferen Bedeutung der Gleichungen erwies sich
6
als schwierig, da atomares Verhalten von unserer Alltagserfahrung grundverschieden ist.
Die Prinzipien der Quantenmechanik sind derart inkompatibel zu unserer alltäglichen
Intuition, dass sie am ehesten durch einen Blick auf ihre Vorgeschichte motiviert werden
können. Im nächsten Kapitel werden wir einige Probleme betrachten mit denen Physiker
zu Beginn des zwanzigsten Jahrhunderts konfrontiert waren und die letzten Endes zur
modernen Quantenmechanik führten.
Literaturempfehlung:
R.P. Feynman
Lectures of Physics, Volume 3, Sections 1.1 – 1.7
7
2
Ursprünge der Quantenmechanik
Newtonsche Mechanik und Maxwells Theorie des elektromagnetischen Felds waren die
Grundpfeiler der Physik bis zum Ende des neunzehnten Jahrhunderts. Anschließend wurde
jedoch eine Reihe von Phänomenen entdeckt, welche im Zusammenhang dieser Theorien
völlig unverständlich waren. Deren Erklärung führte zu einer Kombination neuer Hypothesen, aus welchen sich über die Jahre die heutige Form der Quantenmechanik (QM)
heraus kristallisierte.
2.1
Klassische Physik
Bis zum Beginn des zwanzigsten Jahrhunderts konnten physikalische Phänomene unter
Verwendung der Klassischen Physik erklärt werden. In der Klassischen Physik ordnet
man dem betrachteten physikalischen System eine gewisse Zahl von dynamischen Variablen zu; jede dieser Variablen hat zu jedem Zeitpunkt einen wohldefinierten Wert und
der vollständige Satz dieser Werte definiert den dynamischen Zustand des Systems zu
diesem Zeitpunkt. Die Zeitentwicklung eines solchen Systems ist vollständig festgelegt,
sofern man seinen Zustand zu einem gegebenen Ausgangszeitpunkt kennt. Daher besteht
die Vorgehensweise der klassischen theoretischen Physik darin, zunächst die dynamischen
Variablen des betrachteten Systems zu erkennen und hiernach die Bewegungsgleichungen
(Equations of Motion, EOM) zu bestimmen, welche die Zeitentwicklung im Einklang mit
experimentellen Beobachtungen beschreiben.
Seit der Formulierung der Newtonschen Mechanik bis zum Ende des neunzehnten Jahrhunderts war diese Vorgehensweise erfolgreich und erlaubte, neu beobachtete Phänomene
in das allgemeine Schema einzubinden. Innerhalb dieses Schemas wurde im Besonderen
zwischen zwei Kategorien von Objekten unterschieden: Materie und Strahlung. Materie
wurde als aus exakt lokalisierbaren Korpuskeln (Massenpunkte) bestehend betrachtet,
welche sich gemäß der Gesetze der Newtonsche Mechanik verhalten; der Zustand eines
jeden Korpuskels wurde zu jedem Zeitpunkt durch seinen Ort und seine Geschwindigkeit
vollständig beschrieben. Strahlung hingegen gehorchte Maxwells Gesetzen des Elektromagnetismus; die dynamischen Variablen waren die Komponenten der elektrischen und
magnetischen Felder an sämtlichen Punkten des Raumes. Als bekannt galt, dass Strahlung – im Gegensatz zur Materie – wellenartiges Verhalten zeigt; typische Beispiele sind
Phänomene wie Interferenz und Beugung.
Als jedoch unsere Kenntnisse der Phänomene auf mikroskopischen Skalen (d.h. auf atomaren Skalen, welchen Längenskalen von bis zu einigen Ångström entsprechen) präziser
wurden, geriet die Klassische Physik in eine schwere Krise. Es wurde offenkundig, dass
Phänomene auf atomaren und subatomaren Skalen nicht in die klassischen Schemata
passen und deren Erklärung auf grundlegend neuen Prinzipien gegründet sein muss. Die
Enthüllung dieser neuen Prinzipien erfolgte schrittweise und erst um etwa 1925 ergab sich
mit der Formulierung der Quantenmechanik eine in sich schlüssige Theorie der mikroskopischen Phänomene.
Um 1900 konzentrierten sich die Bemühungen der Experimentatoren auf zwei eng zusammenhängede Bereiche: eine präzise Analyse der mikroskopischen Struktur von Materie
8
und die Bestimmung der gegenseitigen Wechselwirkung zwischen materiellen Korpuskeln
sowie deren Wechselwirkung mit dem elektromagnetischen Feld.
Die ersten Beiträge zum korrekten Verständnis der Struktur von Materie wurden durch
Beobachtungen von Strahlung in Gasentladungen in verdünnten Gasen, Kathodenstrahlung sowie Kanalstrahlung gewonnen, welche richtigerweise als Strahlen von elektrisch
geladenen Teilchen interpretiert wurden. Auf diese Art und Weise wurde 1897 das Elektron durch J.J. Thomson als das Teilchen der Kathodenstrahlung entdeckt. Sein Verhalten
im elektromagnetischen Feld wurde beobachtet und durch die Theorie von H.A. Lorentz
beschrieben. Sukzessive wurde man sich der Existenz von Atomen und Molekülen bewusst.
Den überzeugendsten Befund lieferte die Beobachtung der Brownschen Molekularbewegung, die eine ungeordnete Zitterbewegung winziger Teilchen in Flüssigkeiten oder Gasen
beschreibt. Diese Bewegung der Partikel wird auf häufige Kollisionen mit den Molekülen
des umgebenden Mediums zurückgeführt. Später erlaubten bessere experimentelle Techniken die Beobachtung einzelner mikroskopischer Phänomene oder die Zählung einzelner
mikroskopischer Teilchen (z.B. Messung der elektrischen Ladung durch R.A. Millikan in
1910, erste Beobachtung von Trajektorien geladener Teilchen in der (Wilsonschen) Nebelkammer durch C.T.R. Wilson in 1912, erstes Geiger-Müller-Zählrohr durch H. Geiger in
1913).
Überdies wurde 1896 ein neues Kapitel der Physik durch die Entdeckung der Radioaktivität begonnen. Zusätzlich eröffnete diese Entdeckung eine leistungsfähige Methode
zur experimentellen Untersuchung der atomaren Struktur – die Alpha-Strahlung, d.h.
Helium-Kerne mit hohen Geschwindigkeiten. Indem er verschiedene Targets der AlphaStrahlung aussetzte, konnte E. Rutherford 1911 die Struktur von Atomen durch Streuung
von Alpha-Teilchen vermessen. Es stellte sich heraus, dass Atome von einem zentralen
Kern sehr kleiner Größe (10−15 − 10−14 m) und in dessen Umfeld befindlichen Elektronen gebildet werden. In der Zwischenzeit wurde der Kenntnisstand bezüglich elektromagnetischer Wellen, vgl. Tab. 6, zu kurzen Wellenlängen hin durch die Entdeckung von
Röntgenstrahlung (W.C. Röntgen, 1895) erweitert, deren Wellennatur durch Beugungsexperimente an Kristallen in 1912 durch M.v. Laue etabliert wurde. Die Spektralanalyse
von Strahlung wurde immer präziser und erlaubte die Ansammlung eines großen Wissensschatzes über die Wechselwirkung von Materie und Strahlung auf mikroskopischen
Skalen. Die Lorentz’sche Theorie der Elektronen machte eindeutige Vorhersagen über all
diese Phänomene. Im Vergleich der Vorhersagen dieser Theorie mit der neu gewonnenen
Fülle experimenteller Ergebnisse zeigte sich der erste Widerspruch zwischen der klassischen Theorie und dem Experiment überdeutlich.
2.2
2.2.1
Photonen
Strahlung eines Schwarzen Körpers (Hohlraumstrahlung)
Die ersten Schwierigkeiten traten in der Untersuchung der Spektralverteilung elektromagnetischer Strahlung im thermodynamischen Gleichgewicht mit Materie auf. Der typische
Fall ist der eines schwarzen Körpers (auch: Schwarzer Strahler), d.h. eines Körpers der
sämtliche einfallende Strahlung absorbiert. Sehr allgemeine thermodynamische Betrachtungen zeigen, dass die Strahlung eines Schwarzen Körpers lediglich von dessen Tem9
peratur abhängt. Die Spektralverteilung der Intensität dieser Schwarzkörperstrahlung ist
daher eine fundamentale Größe, die mittels Methoden der statistischen Thermodynamik
aus den allgemeinen Gesetzmäßigkeiten der Wechselwirkung von Materie und Strahlung
herleitbar sein müsste. Die in der klassischen Theorie hergeleitete Formel steht im eklatanten Widerspruch zum Experiment. Im Jahr 1900 gelang es M. Planck diese Schwierigkeit
durch Abkehr von den klassischen Gesetzen zur Wechselwirkung von Materie und Strahlung zu beheben. Stattdessen postulierte er, dass Energieaustausch zwischen Materie und
Strahlung nicht auf kontinuierliche Art und Weise geschieht, sondern in diskreten und
unteilbaren Mengen bzw. Quanten von Energie. Im Folgenden betrachten wir kurz die
klassische Vorhersage sowie den experimentellen Kenntnisstand zur Zeit Plancks.
Wie bereits erwähnt, bezeichnet Schwarzkörperstrahlung jene Art von elektromagnetischer Strahlung, welche von einem Schwarzen Körper (ein opaker, nicht-reflektierender
Körper) abgegeben wird. Hierbei wird die Temperatur über das gesamte Volumen einheitlich und konstant gehalten. Schwarzkörperstrahlung hat daher ein charakteristisches
Spektrum und eine charakteristische Intensitätsverteilung, welche lediglich von der Temperatur des Körpers abhängt, vgl. Abb. D.1. Wärmestrahlung der Art, wie sie spontan von
vielen gewöhnlichen Objekten emittiert wird, kann approximativ als Schwarzkörperstrahlung behandelt werden. Ein vollständig isolierter Hohlraum, in dessen Innern thermisches
Gleichgewicht herrscht, enthält Schwarzkörperstrahlung. Durch ein Loch in einer Wand
des Hohlraums wird diese Hohlraumstrahlung emittiert. Die Hohlraumstrahlung hat die
Charakteristika derSchwarzkörperstrahlung, sofern das Loch klein genug ist und lediglich
einen vernachlässigbaren Einfluß auf das thermische Gleichgewicht hat.
Als Schematisierung betrachten wir nun elektromagnetische Strahlung innerhalb eines
kubischen Hohlraums mit Volumen V = L3 und Temperatur T , die sich im thermischen Gleichgewicht befinde, vgl. Abb. D.2. Die darin enthaltene Energiedichte (Energie/Volumen) u(ω, T ) ist eine Funktion von der Frequenz ω und der Temperatur T . Die
Energidichte u(ω, T ) wird klassisch durch das Rayleigh-Jeans-Gesetz (J.W. Strutt, 1900;
J. Jeans, 1905) bestimmt,
kB T 2
ω ,
(2.1)
π 2 c3
wobei kB = 1.3806 × 10−23 J/K die Boltzmann-Konstante und c = 2.998 × 108 m/s die
Lichtgeschwindigkeit im Vakuum ist.
u(ω, T ) =
Um dieses Ergebnis zu erhalten kann man folgendermaßen vorgehen: wir beschreiben
das Strahlungsfeld innerhalb des kubischen Hohlraums als Summe der Normalmoden im
Fourier-Raum. Die Randbedingungen auf gegenüberliegenden Seiten des Hohlraums sind
gleich, so dass sich die Phase des Strahlungsfelds über die Länge L um ein ganzzahliges
Vielfaches von 2π ändert. Somit ist das Strahlungsfeld durch eine Summe von Termen
proportional zu ebenen Wellen exp (ir · k) gegeben. Wegen der Randbedingungen sind
die hierbei beitragenden Wellenzahlen k = 2πn/L und werden durch den Vektor n festgelegt, welcher ausschließlich ganzzahlige Komponenten n1 , n2 , n3 besitzt. Daher ist jeder
einzelne Normalmode ein Tupel n1 , n2 , n3 sowie einer von zwei Polarisationszuständen zugeordnet. Jedes dieser Tupel nimmt genau eine Volumeneinheit im Vektorraum von n ein.
Für jedes Tupel n1 , n2 , n3 im Fourier-Raum sind zwei Polarisationszustände – links- oder
rechtshändig zirkulare Polarisation – möglich, welche durch einen zusätzlichen Faktor 2
10
berücksichtigt werden.
Da die Wellenzahl k = |k| (vgl. Anhang A) mit der Frequenz durch die Dispersionsrelaton ω = ck zusammenhängt, kann eine Integration über das sphärische Volumenelement
d3 n in ein Integral über die Frequenz ω überführt werden. Wir erhalten für die Zahl der
Normalmoden im Frequenzintervall [ω, ω + dω] unter Berücksichtigung beider Polarisationsrichtungen
3
L
2
3
ω 2 dω,
(2.2)
dN = N (ω)dω = 2 × d n = 2 × dΩ |n| d|n| = 2 × 4π
2πc
wobei wir die Winkelintegration trivial ausühren konnten. Jede einzelne Normalmode mit
Frequenz ω kann als ein harmonischer Oszillator mit der gleichen Frequenz ω beschrieben
werden (vgl. Übung 2.1, wo Sie dies explizit nachvollziehen). Da jeder Oszillator in der
Klassischen statistischen Mechanik die thermische Energie kB T beiträgt1 , ist die gesamte
Energiedichte in der Klassischen Physik durch
1 L3 2
kB T
u(ω, T )dω = kB T 3 2 3 ω dω = 2 3 ω 2 dω
L π c
π c
(2.3)
gegeben. Hierbei wurde die Energie durch das Volumen V = L3 geteilt. Obwohl Glg. (2.3)
für niedrige Frequenzen experimentelle Befunde
R ∞ sehr gut beschreibt, müsste der Energieinhalt des Hohlraums unendlich sein wegen 0 dωu(ω) = ∞ im Widerspruch zu experimentellen Tatsachen (Ultraviolettkatastrophe). Stattdessen wurde in 1896 von W. Wien
als empirischer Befund für hohe Frequenzen exponentiell gedämpftes Verhalten gemäß
ω→∞
u(ω, T ) −→ Aω 3 exp (−gω/T );
A, g = const
(2.4)
beobachtet. Das scheinbar unverträgliche Verhalten der Energiedichte für hohe und niedrige Frequenzen konnte erst 1900 durch Planck in einer einzigen Formel beschrieben
1
Dieser Sachverhalt lässt sich per Gleichverteilungssatz zeigen. Wir betrachten ein physikalisches System, dessen Hamiltonfunktion H(q, p) quadratisch in den kanonischen Variablen qi und in den kanonisch
konjugierten Impulsen pi ist, d.h. qi ∂H/∂qj = 2Eqi δij und pi ∂H/∂pj = 2Epi δij erfüllt, wobei Eqi bzw.
Epi die innere Energien sind, welche in dem Freiheitsgraden qi bzw. pi gespeichert sind. Dann gilt für
∂H
den thermischen Erwartungswert hqi ∂q
i:
j
Z
∂H −βH
1
∂ −βH
dΓ qi
dΓ qi
e
=−
e
∂qj
βZ
∂qj
Z
Z
∂qi
δij 1
1
dΓ
e−βH = +
dΓ e−βH = δij kB T.
=+
βZ
∂qj
β Z
|
{z
}
| {z }
1
∂H
hqi
i=
∂qj
Z
Z
=1
=δij
Hierbei wurde die kanonische Gesamtheit verwendet (System in Kontakt mit Wärmebad, d.h. bei fester
Temperatur T ). Eine genauere Einführung der kanonische Gesamtheit geht über eine kurze Fußnote
hinaus; schlagen Sie dazu bitte in einem Lehrbuch Ihres Vertrauens
nach. Für die kanonische Gesamtheit
R
R
sind thermische Erwartungswerte allgemein durch hOi = 1/Z dΓ Oe−βH gegeben, wobei Z = dΓ e−βH
und dΓ das Integralmaß des gesamten Phasenraums ist, d.h. für ein dreidimensionales N -Teilchen-System
gilt dΓ = d3N q d3N p. Ferner wird hier die Abkürzung β = 1/(kB T ) verwendet und beim Übergang von
der ersten zur zweiten Zeile einmal unter Vernachlässigung der Randterme partiell intergriert.
Unter Verwendung der inneren Energien Eqi der Orts-Freiheitsgrade sehen wir also h2Eqi i = kB T
bzw. hEqi i = kB T /2. Der Beweis für die thermischen Erwartungswerte der inneren Energien Epi der
Impuls-Freiheitsgrade ist identisch und führt ebenfalls zu hEpi i = kB T /2. Da man für den harmonischen
Oszillator sowohl kinetische Epi als auch potentielle Energie EqI hat, ergibt sich für jede Raumrichtung
in der Summe hEpi + Eqi i = kB T .
11
werden, die er zur Interpolation zwischen beiden experimentellen Befunden postulierte,
vgl. Abb. D.3. Diese Planck’sche Strahlungsformel
u(ω, T )dω =
ω 3 dω
~
π 2 c3 exp ~ω − 1
bzw. u(ν, T )dν =
kB T
8πh
ν 3 dν
c3 exp hν − 1
(2.5)
kB T
erforderte die Einführung einer neuen Naturkonstante – das Planck’sche Wirkungsquantum – ~ = 1.0546 × 10−34 J. Dieses tritt in zwei verschiedenen Normierungen (h und ~) in
der Literatur auf:
~ω = hν
2πν = ω
⇔
(2.6)
~=
h
2π
(2.7)
Unter seiner revolutionären Hypothese, dass Energieaustausch zwischen Wand2 und Strahlungsfeld der Frequenz ω nur für ganzzahlige Vielfache von ~ω möglich sei, gelang Planck
eine Herleitung seines Strahlungsgesetzes – ein unmissverständlicher erster Hinweis auf
die Quantisierung des elektromagnetischen Felds, vgl. Tab. 6.
Sie werden diese Herleitungen (Rayleigh-Jeans’sches und Plack’sches Gesetz) in den Übungen (Übung 2.1) nachvollziehen und werden insbesondere sehen, dass die verschiedenen
Moden des Strahlungsfeld in einem Hohlraum sich wie harmonische Oszillatoren verhalten. Diese Übung wird ihnen von großem Nutzen sein, da Sie in der Quantenmechnanik
zahllosen Problemen begegnen werden, für deren Lösung das Auffinden und Berechnen
der stationären Moden essentiell ist. Außerdem wiederholt sich der konzeptionelle Schritt
des Übergangs von stationären Moden zu harmonischen Oszillatoren in der Quantenfeldtheorie.
2.2.2
Photoelektrischer Effekt
Im Jahr 1905 entwickelte A. Einstein Plancks Quantenhypothese weiter und konnte damit schließlich den Photoelektrischen Effekt erklären. Bereits am Ende des neunzehnten
Jahrhunderts war bei Bestrahlung mit elektromagnetischer Strahlung ausreichend hoher
Frequenz Emission von Elektronen an Metalloberflächen im Vakuum beobachtet worden,
vgl. Abb. D.4. Dieses Phänomen hatte folgende Charakteristika:
1. Der Effekt tritt nur auf, falls die Frequenz der einfallenden Strahlung einen für das
jeweilige Metall spezifischen Mindestwert ω0 überschreitet.
2. Die aus dem Metall austretenden Elektronen haben unterschiedliche Geschwindigkeiten im Intervall zwischen Null und einer maximalen Geschwindigkeit. Die der
maximalen Geschwindigkeit entsprechende Energie ist eine lineare Funktion der Frequenz.
2
Die Wand ist hier stellvertretend für irgendeine nicht weiter spezifizierte Form von Materie, d.h.
Plancks Hypothese gilt für jegliche Wechselwirkung zwischen dem Strahlungsfeld und Materie im Allgemeinen.
12
3. Die Rate der pro Flächeneinheit emittierten Elektronen ist für feste Frequenz proportional zur Intensität der Strahlung, aber die Geschwindigkeit der Elektronen ist
unabhängig von der Intensität.
Versuche diese Beobachtungen mittels Klassischer Elektrodynamik zu erklären waren erfolglos, und die drei primären Charakteristika blieben unverständlich. Insbesondere konnte
man unter der Annahme, dass die Energie der Strahlung gleichmäßig über die bestrahlte
Oberfläche verteilt wird, nicht verstehen, weshalb die Emission selbst bei sehr niedrigen
Intensitäten sofort einsetzt. Man erwartete stattdessen, dass eine gewisse Zeit benötigt
würde, bis ausreichend Energie angesammelt wäre, um das Elektron aus dem Metall heraus zu lösen. Diese Beobachtung führte Einstein 1905 zur Hypothese, dass Licht aus
Quanten der Energie ~ω bestehe, und, dass Elektronen nur herausgelöst werden könnten,
sofern die Energie der Photonen die Austrittsarbeit W0 nicht unterschreite, ~ω > W0 ,
vgl. Abb. D.5.
Einstein zeigte, dass das Phänomen auf Grundlage von Plancks Hypothese erklärbar ist. Er
nahm an, dass die Energie des Strahlungsfelds nicht nur während Absorption und Emission
sondern auch während der Ausbreitung im Raum in Form von Strahlungsquanten mit
Energie ~ω quantisiert ist. Hiermit kann der Photoelektrische Effekt als ein Streuprozess
zwischen einfallenden Strahlungsquanten (Photonen3 ) und den in Atomen gebundenen
Elektronen des Metalls verstanden werden. In dieser Vorstellung erhält das von einem
Photon getroffene Atom sofort dessen volle Energie ~ω. Ein Elektron kann nur emittiert
werden, falls diese Energie größer ist als die Austrittsarbeit W0 , welche zu seiner Ablösung
vom Atom benötigt wird; der Effekt tritt folglich nur im Fall ~ω > W0 auf. Somit kann
das erste Charakteristikum verstanden werden, indem man ω0 = W0 /~ definiert. Sofern
die Bedingung ω > ω0 erfüllt ist, tritt aus dem Metall ein Elektron mit maximaler Energie
E = ~ω − W0 aus. Man findet
Emax = ~(ω − ω0 )
(2.8)
in Übereinstimmung mit dem zweiten Charakteristikum. Schlußendlich versteht man auch
das dritte Charakteristikum, da bei Variation der Intensität die Rate der Photonen pro
Flächeneinheit geändert wird aber nicht deren Energie. Zur Zeit von Einsteins Hypothese
waren experimentelle Daten nicht präzise genug, um Glg. (2.8) zu bestätigen. Eine präzise
Verifikation wurde später durch R.A. Millikan durchgeführt, der damit eine unabhängige
Bestimmung von ~ erreichte.
Aufgrund der Beobachtung, dass eine Gruppe elektromagnetischer Wellen nicht nur Energie E sondern auch einen Impuls p = E/c trägt, wies Einstein den Photonen einen Impuls
mit Betrag p = ~ω/c = h/λ entlang deren Ausbreitungsrichtung
zu. Wegen des relativisp
2
2
tischen Ausdrucks für die Energie eines Teilchens, E = c m c + p2 sehen wir, dass das
Photon formell als Teilchen mit verschwindender Ruhemasse betrachtet werden kann.
2.2.3
Compton Effekt
Einige Jahre später (1923) entdeckte A.H. Compton ein Phänomen (Compton Effekt), in
dem die Existenz von Photonen besonders offenkundig wurde. Der Compton Effekt tritt als
Streuung von Röntgen - und Gammastrahlung in Gasen, Flüssigkeiten und Festkörpern
3
Die Bezeichnung Photon zur Beschreibung der Strahlungsquanten kam erst 1927 auf.
13
auf. Wenn ein dünnes Strahlenbündel aus Röntgenstrahlung mit Wellenlänge λ eine Substanz (am Besten mit geringem Atomgewicht, z.B. Kohlenstoff) durchdringt, werden
Röntgenstrahlen in alle Richtungen gestreut. Wenn man die gestreute Strahlung in einer
Richtung, welche mit der Einfallsrichtung den Winkel ϕ bildet, mit einem Kristallspektrographen analysiert, misst man eine Wellenlänge λ0 . Diese ist gegenüber der Wellenlänge
λ der einfallenden Strahlung geringfügig erhöht. Zusätzlich zu dieser gestreuten Strahlung mit Wellenlänge λ0 findet man ebenso gestreute Strahlung mit Wellenlänge λ, d.h.
ohne Änderung der Wellenlänge. Daher enthält das Spektrum der gestreuten Strahlung
zwei sehr nahe beieinander liegende Linien, eine bei der ursprünglichen Wellenlänge λ
und eine bei der anderen, leicht erhöhten Wellenlänge λ0 , vgl. Abb. D.7. Diese Variation
der Wellenlänge λ0 − λ ist unabhängig von der Substanz, welche die Streuung verursacht. Stattdessen hängt sie gemäß λ0 − λ = 0.024(1 − cos ϕ) Å vom Winkel zwischen
der Streurichtung und der Richtung des einfallenden Strahls ab (vgl. Abb. D.8); daher ist
die Änderung der Wellenlänge maximal im Fall von Rückstreuung. Die klassische Theorie
des Elektromagnetismus kann das Vorhandensein einer zweiten Linie bei verschiedener
Wellenlänge nicht erklären.
Stattdessen versteht man mit der Theorie der Strahlungsquanten diese Streuung als Streuung eines Photons der einfallenden Strahlung an einem der Elektronen in der Substanz, in
welcher die Streuung stattfindet. Durch die Streuung werden die Photonen in verschiedene,
durch den Winkel ϕ spezifizierte Richtungen abgelenkt. Wir beschreiben diese Streuung
mittels Energie- und Impulserhaltung, mit Hilfe der relativistischen Energie-Impuls Beziehung sowie mit der im vorigen Abschnitt eingeführten Ausdrücke für Impuls und Energie
der Photonen, (p = ~k bzw. p = ~k = h/λ = hν/c = ~ω/c sowie E = hν = ~ω). Dann
erhalten wir
me c2
+ ~ω 0 ,
me c2 + ~ω = q
2
1 − vc2
(2.9)
me v
~ω 0 0
~ω
k̂ = q
k̂ .
+
2
c
c
1 − vc2
(2.10)
Hierbei ist me = 511.0 keV/c2 die Elektronenmasse und v ist die Geschwindigkeit des
Elektrons nach der Streuung. Wir nehmen hierbei an, dass das Elektron vor der Streuung
frei (nicht in einem Potential) und in Ruhe ist. Ferner gilt ω = 2πc/λ sowie ω 0 = 2πc/λ0
und k̂ sowie k̂0 sind die Einheitsvektoren, welche die Richtung der einfallenden und gestreuten Röntgenstrahlung repräsentieren. Aufgrund der Definition des Winkels ϕ als der
Winkel, in den das Photon gestreut wird, gilt k̂ · k̂0 = cos ϕ. Die Wellenzahlen hängen mit
den Wellenlängen über k = 2π/λ sowie k 0 = 2π/λ0 zusammen. Aus Glg. (2.10) erhalten
wir
m2e v 2
~ω ~ω 0
~2 ω 2 ~2 ω 0 2
=
+
−
2
cos ϕ.
(2.11)
2
c2
c2
c c
1 − vc2
Mittels Einsetzen von Glg. (2.9) eliminieren wir v und erhalten
ω − ω0 =
~
c
c
2π~
ωω 0 (1 − cos ϕ) bzw. λ0 − λ = 0 − =
(1 − cos ϕ).
me c
ω
ω
me c
(2.12)
Nach Einsetzen der numerischen Werte für 2π~/(me c) findet man in der Tat 0.024 Å.
14
In dieser Herleitung wurde das Elektron als freies Teilchen betrachtet. Diese Art der Beschreibung kann für weiter außen im Atom befindliche Elektronen verwendet werden. Falls
das Photon an einem im Atom weiter innen befindlichen (stärker gebundenen) Elektron
streut, findet Impulsaustausch nicht nur mit dem Elektron sondern mit dem gesamten
Atom statt. In diesem Fall muss man in den Formeln die Masse des Elektrons durch die
Masse des Atoms austauschen, welche um ein Tausendfaches größer ist. Daher findet man
dann beide Linien bei nicht unterscheidbaren Wellenlängen.
2.3
2.3.1
Atomare Spektren und Quantisierung von Materie
Atomare Spektren
Seit dem frühen neunzehnten Jahrhundert war Physikern bekannt, dass atomare Gase
Licht nur bei bestimmten Frequenzen absorbieren und emittieren. Diese festen Frequenzen
wurden zwar erfolgreich als Charakteristika zur Identifikation bekannter oder Entdeckung
neuer Atome (z.B. unabhängige Entdeckung des Heliums mittels seiner Spektrallinien im
Sonnenlicht durch J. Jansen und N. Lockyer, beide 1868) verwendet, aber in keinster
Weise verstanden. Fortschritt im Verständnis atomarer Spektren war nicht möglich, ohne
etwas über die Struktur der Atome zu wissen.
Die Entdeckung der Kathodenstrahlung (J. Plücker 1858, W. Hittorf 1869, J.J. Thomson
1894), des Elektrons (J.J. Thomson, 1897) sowie der radioaktiven Stoffe (A.H. Becquerel 1896, M. und P. Curie 1898, E. Rutherford und F. Soddy, 1902) führten zu Beginn
des zwanzigsten Jahrhunderts zur Beschreibung der elektrisch neutralen Atome mit dem
Thomson’schen Atommodell (Rosinenkuchenmodell). Hier nahm man an, dass die Elektronen wie Rosinen in einem Kuchen in einer kontinuierlichen positiven Ladungsverteilung
säßen. Aufgrund von Werten für mittlere freie Weglängen in molekularen Gasen und für
Dichten von Festkörpern mit bekannter chemischer Zusammensetzung ordnete man Atomen Radien in der Größenordnung von 10−10 m zu. Streuexperimente von P. Lenard in
Jahr 1903 zeigten, dass Atome für schnelle Elektronen beinahe transparent waren. Daher bestand die Herausforderung, die Verteilung der Bestandteile eines Atoms in dessen
Innern zu verstehen.
Um diese räumliche Struktur genauer zu verstehen, führten E. Rutherford, H. Geiger und
E. Marsden im Jahr 1911 Streuversuche an einer dünnen Goldfolie mit Alpha-Teilchen
(ein 42 He Nukleus) aus dem radioaktiven Zerfall einer Radiumquelle durch. Die gestreuten
Alpha-Teilchen wurden durch Lichtblitze beim Auftreffen auf einer Folie aus Zinksulfid
detektiert. Während man in Vorwärtsrichtung erwartungsgemäß eine geringe Strahlaufweitung beobachtete, wurde auch Rückstreuung gemessen. Dieser Befund stand in völligem Widerspruch zu Thomsons Atommodell. Im folgenden betrachten wir die Kinematik
dieses Streuprozesses.
Ein Alpha-Teilchen der Masse M streue an einem Target der Masse m und alle Geschwindigkeiten seien klein genug, dass eine nicht-relativistische Näherung ausreiche. Das Problem werde hier nur in einer Dimension betrachtet (eine positive Geschwindigkeit ist eine
Geschwindigkeit entlang der Flugrichtung des einfallenden Alpha-Teilchens, während eine negative Geschwindigkeit eine Geschwindigkeit in entgegengesetzter Richtung ist). Aus
15
Energie- und Impulserhaltung folgt
1
1
1
M v 2 = mu2 + M v 0 2 .
(2.13)
2
2
2
Nach Eliminieren der Geschwindigkeit u erhält man
02
M
v
M v0
M
m−M
0
0= 1+
−2
−1+
⇔ v = v 1, −
. (2.14)
m
v2
m v
m
m+M
M v = mu + M v 0 ,
Die erste Lösung entspricht einem ungestreuten Teilchen, die zweite Lösung hingegen
kommt durch die eigentliche Streuung zustande. Diese Lösung kann nur negativ werden
(Rückstreuung), sofern m > M ist. Da Alpha-Teilchen circa 7300 mal schwerer sind als
Elektronen, ist diese Rückstreuung an einem Elektron als Streuzentrum nicht möglich.
Rückstreuung erfordert die Existenz eines ausreichend schweren und kleinen Streuzentrums, in welches das Projektil nicht eindringt.
Wir schätzen nun den Radius dieses massereichen Streuzentrums ab und betrachten das
Coulomb-Potential eines ausreichend schweren, positiv geladenen Teilchens mit Ladung
+Ze. Der Umkehrpunkt für ein Alpha-Teilchen wird in diesem Potential bei einer Distanz
r erreicht, bei welcher die kinetische Energie vollständig in potentielle Energie umgewandelt wird, das heißt, wenn 1/2M v 2 = (2e)(Ze)/r. Daraus ergibt sich r = 4Ze2 /(M v 2 )
als maximale Größe des Streuzentrums. Ein kurzer Überschlag mit Geschwindigkeit v =
2.09 × 107 m/s des einfallenden Alpha-Teilchens und Ordungszahl Z = 79 für Gold ergibt
einen maximalen Radius des Streuzentrums von circa r ∼ 2.5 × 10−4 Å. Dies ist wesentlich kleiner als typische atomare Skalen und nicht mit der Thomson’schen Vorstellung
vereinbar.
Rutherford zog hieraus den Schluss (Kern-Hülle Modell), dass Atome einen sehr kleinen
positiv geladenen Kern besitzen, welcher nahezu die komplette Masse trägt. Die Elektronen müssten sich auf Bahnen um diesen Kern bewegen wie Planeten um die Sonne.
Da jedoch eine derartige Bahn im Zentralkraftpotential (vgl. Kepler-Problem) eine beschleunigte Bewegung ist und beschleunigte Ladungen Energie in Form von Strahlung
emittieren (vgl. Hertz’scher Dipol4 ), müssten diese Elektronen kontinuierlich auf immer
kleinere Bahnen wechseln und schlussendlich in den Kern stürzen. Eine solche kontinuierliche Emission (und der Kollaps der Atome) wird nicht beobachtet. Darüber hinaus könnte
man die mittlere Lebensdauer eines Atoms in dieser Beschreibung als 10−8 s abschätzen.
Daher wären Atome in diesem Bild nicht stabil und würden Strahlung mit einem kontinuierlichen Spektrum emittieren. Dies widerspricht der Beobachtung von stabilen Atomen
mit diskreten Absorptions- und Emissionsspektren, welche aus schmalen und isolierten
Linien bestehen, vgl. Abb. D.9.
Das Spektrum von atomarem Wasserstoff war bekannt: es besteht aus Linien im sichtbaren, infraroten und ultravioletten Wellenlängenbereich. Dieses Spektrum war das erste,
für dessen Verteilung von Spektrallinien eine einfache empirische Regel gefunden wurde,
nämlich zunächst die Balmer Formel (J.J. Balmer, 1885) und drei Jahre später deren
Verallgemeinerung, die Rydberg Formel (J. Rydberg, 1888),
1
1
1
, m > n > 0,
(2.15)
−
ν̃ = = RH
λ
n2 m2
4
Die abgestrahlte Energie einer beschleunigten Ladung ist in Dipolnäherung dE/dt =
ist e die Ladung des Teilchens, a dessen Beschleunigung und c die Lichtgeschwindigkeit.
16
2 e2 2
3 c3 a .
Hierbei
wobei m, n ganzzahlige Werte annehmen und RH = 109678 cm−1 eine numerische Konstante (die Rydbergkonstante) ist. Die Linien treten in Serien auf. Die ersten vier beobachteten Serien sind:
n=1
n=2
n=3
n=4
m=2,3,4,. . .
m=3,4,5,. . .
m=4,5,6,. . .
m=5,6,7,. . .
Lyman Serie (ultraviolett),
Balmer Serie
(sichtbar),
Paschen Serie
(infrarot),
Bracket Serie
(infrarot).
Jede Serie strebt für steigendes m gegen den Grenzwert RH /n2 , d.h. die Linien werden
dicht um einen Grenzwert, vgl. Abb. D.10. Nahe dieses Grenzwerts sind die Linien derart
dicht, dass sie nicht aufgelöst werden können.
Ein charakteristische Eigenschaft von Glg. (2.15) ist, dass Wellenzahlen von mehreren
Linien durch Differenzen zweier Terme von der Form Tn = RH /n2 (Spektralterme) ausgedrückt werden können. Zwar sind für kompliziertere Atome die Spektralterme nicht so
einfach wie für Wasserstoff, aber man kann für jedes Element verschiedene Reihen von
verallgemeinerten Spektraltermen einführen und die Wellenzahlen der Linien aus Differenzen einiger Spektralterme bestimmen (Rydberg-Ritz’sches Kombinationsprinzip, W. Ritz,
1905). Man kann für jedes Element eine Reihe von Spektraltermen Tns bestimmen, so dass
sich alle Linien der jeweiligen Spektren durch Beziehungen zwischen diesen Spektraltermen ausdrücken lassen, z.B.
0
ν̃n0 s0 ,ns = Tns0 − Tns .
(2.16)
Jedoch sind nicht alle möglichen Kombinationen in der Natur realisiert (es gibt Auswahlregeln).
2.3.2
Diskrete Energieniveaus
Um diese Schwierigkeiten zu überwinden und die Charakteristika der Absorptions- und
Emissionsspektren zu erklären, führte N. Bohr 1913 folgende Hypothese ein:
1. Für die Elektronen eines Atoms existieren einige ausgezeichnete Bahnen. Sofern sich
das Elektron entlang dieser Bahnen bewegt, emittiert es keine Strahlung. Diese Bahnen sind diskret und deshalb sind die Energiewerte ebenso diskret (Energieniveaus).
In anderen Worten, das Atom existiert nur in einem diskreten Satz von Zuständen
mit Energien (in aufsteigender Abfolge) E1 , E2 , . . .
2. Absorption oder Emission von Strahlung findet statt, wenn das Elektron zwischen
einem niedrigeren und höheren Energieniveau wechselt. In Übereinstimmung mit
Plancks Hypothese findet in diesen Prozessen Absorption oder Emission eines einzelnen Strahlungsquants statt. Wenn En und Em die Energien der zwei Bahnen
(mit m > n) sind, zwischen denen der Übergang stattfindet, und ω die Frequenz des
emittierten (bzw. absorbierten) Strahlungsquants ist, gilt aufgrund der Energieerhaltung
Em − En = ~ω.
(2.17)
Diese Formel ist die Kernaussage des Bohr’schen Atommodells. Setzt man
Tn = −En /hc,
17
(2.18)
so kann man die Energieniveaus zu den Spektraltermen aus Glg. (2.16) in Beziehung
setzen und einen Rahmen schaffen, um das Rydberg-Ritz’sche Kombinationsprinzip
zu verstehen.
Diese zwei Hypothesen sind allgemein und sollten auch für komplexere Atome und Moleküle gültig sein. Im Fall von Wasserstoff gab Bohr auch eine quantitative Regel zur
Bestimmung der erlaubten Bahnen und zur Berechnung der Energieniveaus an. Genauer gesagt nahm Bohr an, dass lediglich Kreisbahnen möglich seien und, dass gemäß der
Beobachtung, dass der Drehimpuls die gleiche Dimension wie die Wirkung besitzt,
2
Länge
Länge
[Länge] = [Masse]
[Zeit] = [Energie][Zeit],
[Drehimpuls] = [Masse]
Zeit
Zeit
(2.19)
der Drehimpuls lediglich ganzzahlige Vielfache von ~ = h/(2π) annehmen könne. Damit
erhalten wir die Bohr’sche Quantisierungsregel
me vr = n~,
n = 1, 2, . . . ,
(2.20)
und für Kreisbahnen in Coulombpotential5
me v 2 = e2 /r.
(2.21)
Durch Eliminieren von v zwischen beiden Gleichungen erhalten wir für den Radius der
n-ten Bahn
~2
(2.22)
r ≡ rn = n2 2 .
e me
Daher finden wir unter Verwendung von Glg. (2.21) für die Energie eines Elektrons auf
der n-ten Bahn
me v 2 e2
1 e2
En =
−
=−
.
(2.23)
2
rn
2 rn
Dieses Ergebnis6 kann man mittels Glg. (2.22) als
En = −hcR
1
n2
(2.24)
formulieren, wobei R = 2π 2 e4 me /(h3 c). Hierdurch erhält man die Balmer Formel wenn
man R = RH identifiziert. Durch Einsetzen der fundamentalen Konstanten h, c, e und
me erhält man
R = 109700 cm−1
(2.25)
5
In dieser Vorlesung wird das Gauß’sche Einheitensystem (cgs System) verwendet, vgl. Anhang A,
in welchem die Coulomb-Kraft zwischen zwei Ladungen Q1 und Q2 durch F = Q1 Q2 /r2 gegeben ist. Im
Gegensatz dazu ist die Coulomb Kraft im SI System (MKSA System) F = 1/(4πε0 )Q1 Q2 /r2 , wobei ε0
die Permittivitität des Vakuums ist.
6
Hinweis: Obgleich die Ausdrücke Glg. (2.24) und Glg. (2.28) in der üblichen Formulierung von QM
weiterhin für ganzzahliges n gültig sind, wird dieses n als Hauptquantenzahl bezeichnet und hat nichts
mit dem Bahndrehimpuls zu tun. Genau genommen kann in QM eine Zustand mit Hauptquantenzahl n
den Betrag des quantisierten Bahndrehimpulses L2 = ~2 l(l + 1) haben. Hierbei ist l = 0, 1, 2, . . . , n − 1.
18
in Übereinstimmung mit experimentellen Werten7 . Die Energieniveaus von Wasserstoff
sind in Abb. D.10 gezeigt. Von besonderer Wichtigkeit sind die Energie des Grundzustands,
E1 = −hcR = −13.6 eV,
(2.26)
sowie der Radius der ersten Bahn,
r1 =
~2
= 0.529 Å.
e2 me
(2.27)
Dieser wird auch als Bohr’scher Radius bezeichnet, typischerweise durch das Symbol a0 .
Wir führen hier zwei weitere Beobachtungen an. Die Ionen He+ und Li++ sind ähnlich
wie Wasserstoff und unterscheiden sich von diesem lediglich durch die Kernladungszahl.
In diesen Fällen kann man das vorige Prozedere modifizieren und erhält
En = −hcR
Z2
,
n2
(2.28)
wobei Z die Ordnungszahl des jeweiligen Elements ist (Z = 2 für Helium, Z = 3 für
Lithium). Die Position der Spektrallinien die man mittels Glg. (2.28) bestimmt ist in
guter Übereinstimmung mit experimentellen Daten. In der vorigen Rechnung wurde der
Atomkern als räumlich fest betrachtet. Dies entspricht der Annahme, die Masse des Kerns
sei sehr viel größer als die des Elektrons. Der Wert von R in Glg. (2.25) wird daher
allgemein als R∞ bezeichnet. Aufgrund der präzisen spektroskopischen Messungen ist die
Bewegung des Nukleus jedoch eine nicht völlig vernachlässigbare Korrektur. Man kann
diese einfach berücksichtigen indem man in den vorigen Formeln die Elektronenmasse
me durch die reduzierte Masse µ = (mN me )/(mN + me ) des Elektron-Nukleus-Systems
ersetzt. Wenn man dies durchführt, erhält man den Ausdruck
RN =
R∞
me .
1+ m
N
(2.29)
Diese Formel konnte durch Vergleich der Linienspektren von He+ und Wasserstoff verifiziert werden. Setzt man Z = 2 in Glg. (2.28) ein, sollten die Linien für 2n → 2m mit jenen
für n → m für Wasserstoff übereinstimmen. Sie weichen jedoch in der Natur geringfügig
voneinander ab und sind um ca. 1 Å verschoben. Diese Verschiebung kann man messen.
Wir machen hier die folgenden zwei Anmerkungen: In seiner Herleitung verließ sich Bohr
auf die alte Idee der klassischen Theorie des Strahlungfelds, dass die Frequenz der Spektrallinien mit der Frequenz der Bahnbewegung des Elektrons übereinstimmt, aber er nahm
dies nur für die äußersten Bahnen8 (große Werte von n) an. Diese Idee entspricht dem
Korrespondenzprinzip, und obwohl dieses von Bohr bis 1923 nicht klar formuliert worden
7
Tatsächlich ist R in dieser naı̈ven Rechnung die Rydberg-Konstante R∞ die am genauesten gemessene
Naturkonstante überhaupt. Ihr aktueller Wert ist R∞ = 109737, 31568508(65) cm−1 und gilt in der Näherung eines unendlich schweren Kerns, siehe auch Glg. (2.29) und die zugehörige Diskussion im Text. Aus
experimentellen Beobachtungen kann erhält man einen Wert RN der durch Glg. (2.29) mit R∞ verknüpft
ist.
8
Beispielsweise gibt das Bohr’sche Modell einen inkorrekten Wert L = ~ für den Drehimpuls im
Grundzustand an. Aus dem Experiment ist jedoch bekannt, dass der Drehimpuls des echten Grundzustands verschwindet.
19
war, inspirierte es doch all seine vorherige Arbeiten. Die Aussage des Korrespondenzprinzips ist, dass die Klassische Theorie makroskopisch korrekt ist, d.h. sie beschreibt
Phänomene im Limes, dass Quanteneffekte (Diskontinuitäten) als unendlich klein angesehen werden können: in diesem Limes müssen die Vorhersagen der exakten Theorie mit den
Vorhersagen der Klassischen Theorie übereinstimmen. Das Korrespondenzprinzip besagt,
dass die Quantentheorie sich asymptotisch der Klassischen Theorie annähert im Limes
großer Quantenzahlen. Damit diese Bedingung erfüllt ist, legt man fest, dass eine formelle
Analogie zwischen Quantentheorie und Klassischer Theorie besteht: diese Korrespondenz
zwischen den zwei Theorien besteht bis hinab zu den kleinsten Details und muss als Leitlinie zur Interpretation der Ergebnisse der neuen Theorie gelten.
Die Bohr’sche Theorie ist nur für Kreisbahnen anwendbar, aber wie im Fall des Sonnensystems ist die allgemeinste Bahn eines gebundenen Teilchens in einem Coulomb Feld nicht
ein Kreis sondern eine Ellipse. Eine Verallgemeinerung der Bohr’schen Quantisierungsbedingung, Glg. (2.20), wurde von P. Ehrenfest 1914 vorgeschlagen. Diese wurde anschließend von A. Sommerfeld 1916 verfeinert und zur Berechnung der Energien von Elektronen
auf elliptischen Bahnen verwendet. Sommerfelds Quantisierungsbedingung war für ein System formuliert, das durch die Hamiltonfunktion H(q, p) beschrieben wird, mit mehreren
Koordinaten qi und kanonisch konjugierten Impulsen pi , welche die Hamilton’schen Gleichungen erfüllen. In dem Fall, dass alle qi und pi eine periodische Zeitabhängigkeit haben,
gilt für jedes i
I
dqi pi = ni h
(2.30)
mit ganzzahligen Werten ni . Das Integral wird über eine volle Periode der Bewegung
ausgewertet. In Bezug auf das Wasserstoffatom lieferten die Sommerfeld’sche und die
Bohr’sche Quantisierungsbedingung die gleichen Ergebnisse, wie Sie in Übung 2.2 selbst
sehen werden. Aber die Sommerfeld’sche Quantisierungsbedingung ließ sich auch für Alkaliatome, die Feinstruktur des Atoms in Bezug zu relativistischen Korrekturen zur Elektronenbewegung sowie für die Spektren von zweiatomigen Molekülen anwenden. Mittels des
Korrespondenzprinzips konnte man Auswahlregeln für die Emission von Strahlung und
Intensitäten der Spektrallinien berechnen. Zusätzlich ergibt die Sommerfeld’sche Quantisierungsbedingung angewandt auf den harmonischen Oszillator den Ausdruck En = n~ω
in Übereinstimmung mit der Planck’schen Hypothese.
Die Bohr-Sommerfeld’schen Quantisierungsregeln haben aber mehrere Einschränkungen:
sie können nicht für Systeme verwendet werden, die nicht multi-periodisch sind, sie benötigen ad-hoc Korrekturen um quantitative Ergebnisse zu erhalten, und sie liefern in manchen Fällen komplett falsche Ergebnisse.
2.3.3
Experimentelle Bestätigung der Existenz der Energieniveaus: der
Franck-Hertz Versuch
Das von Bohr postulierte, zugrunde liegende Konzept der quantisierten Energieniveaus
fand eine direkte experimentelle Bestätigung in einer Reihe von Experimenten von J.
Franck und G. Hertz. Der experimentelle Aufbau ist als Schaltbild in Abb. D.11 skizziert. Er besteht aus einer Glasröhre, welche eine Substanz enthält, deren Energieniveaus
man untersuchen möchte. Innerhalb dieser Röhre befindet sich eine Glühkathode K, aus
welcher per thermoelektrischem Effekt Elektronen austreten, und ein Gitter G, welches
20
sich auf einem positiven Potential gegenüber K befindet. Das elektrische Feld zwischen
K und G beschleunigt die Elektronen, die daher zum Gitter wandern und es teilweise
durchqueren. Hinter G befindet sich eine Absorberplatte A, die sich auf einem niedrigeren
Potential als G befindet, so dass Elektronen auf dem Weg von G nach A gebremst werden.
Die Elektronen, die A erreichen, werden durch ein Galvanometer zu K zurückgeführt. Dabei wird die Stromstärke gemessen. Falls die Elektronen keine inelastischen Streuungen
(Streuungen mit Verlust von Energie zur Anregung der Atome) erlitten haben, bewegen
sie sich mit beschleunigter Bewegung zu G, wo sie ihre maximale kinetische Energie errei2
chen gemäß Tmax = 1/2me vmax
= eUb , wobei Ub die Beschleunigungsspannung zwischen
Kathode K und Gitter G ist. Die angesammelte kinetische Energie ist ausreichend groß
um die Gegenspannung Ug zwischen dem Gitter G und dem Absorber A zu überwinden,
so dass jene Teilchen, die G durchqueren, bei A ankommen und vom Galvanometer registriert werden. Erhöht man die Beschleunigungsspannung Ub so weit, dass eUb geringfügig
über der Energiedifferenz E2 − E1 zwischen dem ersten angeregten Zustand und dem
Grundzustand der Substanz liegt, können die Elektronen, sobald sie in die Nähe von G
gekommen sind und die Potentialdifferenz eUb (größtenteils) durchlaufen haben, inelastisch an den Atomen in der Röhre streuen. Auf diese Art und Weise verlieren sie fast ihre
komplette kinetische Energie und können daher die Gegenspannung zwischen G und A
nicht mehr überwinden, d.h. sie erreichen A nicht mehr. Deshalb zeigt das Galvanometer
einen starken Abfall des Stroms an, vgl. Abb. D.11. Daher kann die Energiedifferenz zum
ersten angeregten Zustand aus
E2 − E1 = eUb0
(2.31)
bestimmt werden, wobei Ub0 die Beschleunigungsspannung beim ersten Stromabfall ist.
Wenn man die Beschleunigungsspannung Ub weiter erhöht als Ub0 , findet die inelastische
Streuung in einer Region näher bei K statt und die Elektronen, welche Energie in der
inelastischen Streuung verloren haben, können später wieder beschleunigt werden und so
A erreichen. Wenn eUb den Wert 2(E2 − E1 ) erreicht, können die Elektronen zweimal
inelastisch streuen, einmal vorher (auf halber Strecke) und einmal nahe beim Gitter,
und daher fällt der Strom erneut stark ab. Das gleiche Verhalten wiederholt sich für
eUB = 3(E2 − E1 ) und so fort, aber auch für eUb = (E3 − E1 ) und so weiter. Differenzen
zwischen Energieniveaus, die im Franck-Hertz Versuch bestimmt werden können, sind
typischerweise von der Größenordnung einiger eV bis zu ca. 20 eV.
2.3.4
Andere Beispiele der Quantisierung: Raumquantisierung
Ein anderer Typ von experimentell beobachteter Quantisierung ist jene der Richtungsquantisierung oder Raumquantisierung von atomaren Systemen. Man beobachtet diese
immer wenn ein Atom sich in einem äußeren Feld mit einer bevorzugten Orientierung
befindet. Die relative Orientierung des atomaren Systems ist dabei nicht beliebig sondern
auf bestimmte diskrete Werte beschränkt. Die direkteste Bestätigung dieses Typs von
Quantisierung tritt im Stern-Gerlach Versuch (O. Stern, W. Gerlach, 1922) auf, als Abweichung von paramagnetischen Atomstrahlen in einem stark inhomogenen Magnetfeld.
Paramagnetische Atome haben eine permanentes magnetisches Moment µ und können
als kleine, elementare Kreisel mit Drehimpuls L angesehen werden. µ ist dabei proportional und parallel zu L. In einem Magnetfeld B präzediert der Drehimpuls um B (Larmor
Präzession). Wenn B konstant ist, bleibt die magnetische Energie −µ·B konstant und unabhängig von der Position des Massenschwerpunkts des Atoms, der sich in einem Zustand
21
geradlinig gleichförmiger Bewegung befindet. Falls jedoch B nicht konstant ist, erfährt
der Massenschwerpunkt des Atoms eine Kraft F = ∇(µ · B) und eine entsprechende Ablenkung. Dies beobachtet man im Stern-Gerlach Versuch wie in Abb. D.12 schematisch
gezeigt wird. Nimmt man an, dass Bz Bx und By ist, so dass die anderen Kompoz
ẑ. Die Ablenkung ist
nenten vernachlässigt werden können, dann erhält man F = µz ∂B
∂z
daher proportional zur z Komponente des magnetischen Moments. Wenn man, nachdem
der Strahl eine feste Strecke innerhalb des Magnetfelds durchquert hat, den Einschlag
der Atome auf einem Schirm misst, würde man in der klassischen Physik aufgrund der
kontinuierlichen Variation von µz erwarten, dass der Strahl über einen großen Bereich
aufgefächert ist, welcher allen Werten von µz zwischen +µ und −µ entspricht. Im Experiment hingegen beobachtet man eine Reihe kleiner Punkte bei gleichen Abständen, welche
parallel zu ẑ ausgerichtet sind. Wenn man das magnetische Feld variiert, ändern sich
die Abstände zwischen den Punkten entsprechend ohne weitere Veränderung des Musters. Insbesondere bleibt die Anzahl der Punkte konstant. Jeder dieser Punkte entspricht
einem spezifischen Wert von µz . Dementsprechend ist µz eine quantisierte Größe die λ
verschiedene Werte annimmt. Neben dem Stern-Gerlach Versuch gibt es weitere direkte
Manifestationen der Raumquantisierung. Im Speziellen sei hier der Effekt eines konstanten magnetischen Felds auf die Struktur der Spektren – der Zeeman Effekt – erwähnt,
welchen wir später besprechen werden. Alle diese Phänomene haben einen gemeinsamen
Ursprung: die Quantisierung des Drehimpulses.
2.4
Erfolge und Grenzen der alten Quantentheorie
Die Bohr-Sommerfeld’sche Theorie war bis 1926/27 das einzige theoretische Gefüge um
die vielen in der Atomphysik auftretenden experimentellen Befunde zu erklären. Ihr großer
Verdienst ist die Einführung des Konzepts von Energieniveaus, die durch Quantenzahlen
beschrieben werden, ein noch immer gültiges fundamentales Konzept für die mikroskopische Welt. Nichtsdestotrotz war selbst in der Zeit ihrer größten Erfolge klar, dass es sich
nicht um eine endgültige physikalische Theorie handelt sondern nur um eine teilweise und
provisorische Ansammlung von Korrekturen, um eine Anwendung von Klassischer Mechanik und Klassischer Elektrodynamik auf die atomare Welt zu ermöglichen. Nicht nur,
dass die Bohr-Sommerfeld’sche Theorie nicht dazu in der Lage war, verschiedene experimentelle Fakten zu erklären, sie war auch auf multi-periodische Systeme beschränkt und
konnte nicht für Stöße zwischen Systemen verwendet werden. Ihr fehlten zu einer echten
Theorie gehörende Eigenschaften wie Kohärenz, Vollständigkeit und Exaktheit. Einerseits verwendete man die Gesetze der Klassischen Mechanik um Bahnen der Elektronen
zu berechnen oder die Ausbreitung elektromagnetischer Wellen zu untersuchen, andererseits führte man Quantisierungsregeln und Hypothesen zur Absorption und Emission ein,
welche in völligem Widerspruch zu den klassischen Gesetzen stehen
Die vollwertige und kohärente Theorie, die quantenmechanische Theorie, wurde auf zweierlei unabhängige Arten in der Zeit von 1924 bis 1927 erlangt. Einerseits hatte L. de Broglie
bereits 1924 vorgeschlagen, dass Teilchen (wie bereits für elektromagnetische Strahlung
geschehen) eine zweifache Beschaffenheit haben, also sowohl teilchen- als auch wellenartige
Attribute tragen. E. Schrödinger formulierte mittels einer Wellengleichung für Teilchen die
Wellenmechanik (1926). Andererseits erlangten W. Heisenberg, M. Born und P. Jordan
ausgehend vom Korrespondenzprinzip ein Formulierung der Matrizenmechanik (1925).
22
Anschließend zeigte Schrödinger die mathematische Äquivalenz der beiden Theorien und
Born, Jordan und P. Dirac konstruierten die axiomatische Formulierung der QM. Dies
wird Thema des nächsten Kapitels sein.
23
Tabellarischer Überblick der Frühgeschichte der Quantenmechanik:
1827
1868
1868
1895
1896
1897
1898
1900
1905
1910
1911
1912
1913
1914
1919
1922
1923
1925
1927
1925-28
1932
R. Brown
Beobachtung der Brown’schen Bewegung
J. Jansen, N. Lockyer
Endeckung des Heliums via Spektrallinien
J. J. Balmer
Balmer Formel für Wasserstoff
W.C. Röntgen
Entdeckung der Röntgenstrahlung
A.H. Becquerel
Entdeckung der Radioaktivität
J.J. Thomson
Entdeckung des Elektrons
M. & P. Curie
Entdeckung von Polonium & Radium
M. Planck
Schwarzkörperstrahlung
A. Einstein
Photoelektrischer Effekt, Brown’sche Bewegung
R.A. Millikan
Messung der Elektronenladung
E. Rutherford
Streuung von α-Teilchen & Kern-Hülle Modell
M.v. Laue
Röntgenbeugung an Kristallen
C. Wilson
Trajektorien in der Nebelkammer
H. Geiger
Geiger-Müller-Zählrohr
N. Bohr
Bohr’sches Atommodell
H.G. Moseley
Messung der Kernladungszahl
J. Franck, G. Hertz
Elektronenstreuung an Atomen
A. Sommerfeld
Atombau & Spektrallinien
E. Rutherford
Entdeckung des Protons
O. Stern, W. Gerlach
Raumquantisierung
L. de Broglie
Materiewellen & Welle-Teilchen-Dualismus
A.H. Compton
Compton-Streuung
S. Goudsmith, G. Uhlenbeck
Elektronenspin
C. Davisson, L. Germer
Elektronenbeugung an Kristallen
M. Born, P. Jordan,
W. Heisenberg
Göttinger Matrizenmechanik
E. Schrödinger
Wellenmechanik (Wien)
J. Chadwick
Entdeckung des Neutrons
Literaturempfehlung:
A. Messiah
F. Schwabl
S. Weinberg
Quantum Mechanics, Volume 1
Quantenmechanik (QM I)
Lectures on Quantum Mechanics
24
Sections 1.1 – 1.5
Kapitel 1
Sections 1.1 – 1.2
3
Wellenfunktion und Schrödingergleichung
3.1
Wellen- und Teilchenaspekte von Strahlung
Im achtzehnten Jahrhundert wurden zwei verschiedene Theorie vorgeschlagen um die
Ausbreitung von Licht zu beschreiben: eine korpuskulare Theorie von I. Newton und eine
Wellentheorie von C. Huygens. Die Theorie Newtons wurde verworfen, als Interferenzund Beugungsphänomene entdeckt wurden. Diese zeigten nicht nur die Wellennatur des
Lichts sondern gestatteten auch dessen Wellenlänge zu messen. Rufen Sie sich in diesem
Zusammenhang die Ihnen bekannten Experimente von T. Young und A. Fresnel und die
Beugungsexperimente an einem Spalt in Erinnerung!
Auch für Röntgenstrahlung konnte man nachweisen, dass es sich um elektromagnetische
Wellen mit Wellenlängen zwischen 0.5 und 500 Å handelt. Dies wurde durch Untersuchungen von Röntgenbeugung an Kristallen nachgewiesen – im Wesentlichen natürliche
dreidimensionale Gitter mit Gitterkonstanten in der Größenordnung eines Ångström. Zwei
verschiedene Arten von Experimenten wurden an den Kristallen durchgeführt: Beugung
durch Transparenz (M. von Laue, 1912) und Beugung durch Reflexion (W.L. und W.H.
Bragg, 1913).
Alle diese Phänomene bestätigen die Wellennatur der elektromagnetischen Strahlung.
Nichtsdestotrotz zeigt die Planck’sche Hypothese sowie alle anderen im vorigen Kapitel besprochenen Phänomene, dass man in gewisser Art und Weise elektromagnetischer
Strahlung einen Teilchencharakter zuordnen kann.
In der Tat können der Photoelektrische Effekt und der Compton Effekt als Ergebnis von
Stößen zwischen Photonen und Elektronen beschrieben werden. In diesen Stößen verhalten
sich die Photonen in gewisser Weise ähnlich wie Materieteilchen. Wir werden später sehen,
wie diese zwei Charakteristika miteinander in Einklang gebracht werden können.
3.2
Teilchencharakter von Materie und de Broglie’sche Hypothese
Was Materie angeht erschien es schon immer natürlich, anzunehmen, dass kleinere Teile
makroskopischer Materie materielle Korpuskel seien, welche den Bewegungsgleichungen
der Klassischen Mechanik gehorchen. Dies wurde auch durch die Chemie sowie die kinetische Theorie bestätigt. Als Beispiele seien hier die Thomson’sche Methode zur Bestimmung des Verhältnisses von Ladung zu Masse beim Elektron, welche auf Parabelbahnen
des Elektrons in einem magnetischen Feld basiert, und die Millikan’sche Methode zur Messung der Elementarladung angeführt. Innerhalb der Wilson’schen Kammer (auch: Blasenkammer) konnte man die Trajektorien der Elementarteilchen sichtbar machen. Insbesondere war es möglich, die Stöße zwischen Teilchen sichtbar zu machen und zu bestätigen,
dass Energie- und Impulserhaltungssätze erüllt sind. Trotz dieser experimentellen Beweise schlug L. de Broglie im Jahr 19239 vor, dass Materieteilchen eine Welle-Teilchen
Doppelnatur zuzuordnen sei. Er nahm an, dass auf diese Art und Weise die Existenz der
9
De Broglie war zu dieser Zeit Doktorand in Paris.
25
Energieniveaus im Atom zu erklären sei.
Wie wir im vorigen Kapitel gesehen haben, muss gemäß Planck und Einstein dem Quant
der elektromagnetischen Strahlung – dem Photon – mit Frequenz ν und Wellenlänge λ
eine Energie E = hν und ein Impuls p = h/λ zugeordnet werden. Im Umkehrschluss
schlug de Broglie vor, einem Teilchen in Bewegung mit Impuls p eine ebene Welle
i
ψ(x, t) = A exp { (p · x − Et)}
~
(3.1)
mit Ausbreitungsrichtung in Richtung des Impulses p zuzuordnen, deren Frequenz und
Wellenlänge wiederum zu Energie und Impuls durch E = hν und p = h/λ in Beziehung
stehen. In einer relativistischen Betrachtung wird verlangt, dass (p, E) und (k, ω) als
Vierervektoren transformieren.
Wir merken an, dass die Phasengeschwindigkeit (z.B. die Ausbreitungsgeschwindigkeit
von ebenen Wellen gleicher Phase) der ebenen Welle in Glg. (3.1) durch
vph =
E
p
(3.2)
gegeben ist. Wenn man stattdessen ein Wellenpaket betrachtet (z.B. die Superposition
von ebenen Wellen mit benachbarten Impulsen oder Wellenzahlen),
Z
i
ψ(x, t) = d3 p c(p) exp { (p · x − Et)},
(3.3)
~
dann ist die Gruppengeschwindigkeit vg durch
vg =
dE
dp
(3.4)
definiert und daher gleich der Geschwindigkeit des Teilchens sowohl in relativistischen als
auch nicht-relativistischen Behandlungen.
De Broglies Gedanke war, dass die Existenz der Energieniveaus innerhalb des Atoms dem
Phänomen der charakteristischen Frequenzen entspricht, das auftritt, wenn eine Welle
innerhalb eines gegebenen Raumbereiches eingesperrt ist (vgl. Übung 1 auf Blatt 2 als
Beispiel für derartiges Verhalten). Eine Rechtfertigung für diese Idee findet man bereits
mittels folgender einfacher Betrachtung: Nehmen wir an, dass innerhalb eines Wasserstoffatoms das Elektron sich auf einer kreisförmigen Bahn r befinde. Wenn p sein Impuls ist,
beträgt die zugehörige Wellenlänge auf Basis der de Broglie Beziehung λ = h/p. Die
Bedingung für stationäre Wellen ist, dass die Länge der Trajektorie des Elektrons ein
ganzzahliges Vielfaches n der Wellenlänge λ sei,
2πr = nλ = nh/p,
(3.5)
was mit der Bohr’schen Quantisierungsbedingung übereinstimmt, vgl. Glg. (2.20). Allgemeiner kann man die Sommerfeld’sche Quantisierungsbedingung, vgl. Glg. (2.30), als
die Forderung verstehen, dass die Phase der Welle sich über eine volle Periode um ein
ganzzahliges Vielfaches von 2π ändert.
26
3.3
Die Schrödinger Gleichung
De Broglie hatte die Eingebung, dass ein Teilchen mit einer Welle verbunden sein müsse,
doch es gelang ihm nicht, eine präzise mathematische Formulierung für seine Idee zu finden. An seiner statt gelang es E. Schrödinger im Jahre 1926 eine Wellengleichung für die
Ausbreitung dieser Welle niederzuschreiben. Die ursprünglichen Überlegungen10 Schödingers, um diese Schrödingergleichung zu erhalten, beruhten auf der Hamilton-Jacobi Formulierung der Klassischen Mechanik. Wir werden diese Herleitung hier nicht nachvollziehen
und uns auf sehr viel einfachere Argumente beschränken.
Wie wir gesehen haben, sollte man einem freien Teichen mit Impuls p und Energie E eine
ebene Welle gemäß Glg. (3.1) zuordnen. Dann erfüllt diese die Gleichungen
~
b
∇x ψ(x, t) = pψ(x,
t),
i
∂
i~ ψ(x, t) =Eψ(x, t)
∂t
(3.6)
(3.7)
Dann erhält man für jeden Zustand der Energie E
i
ψ(x, t) = e− ~ Et φ(x),
(3.8)
wobei für ein freies Teilchen im nicht-relativistischen Fall E = p2 /2m gilt. Der Wechsel
der Notation wird im Anhang erläutert. Daher ist in diesem Fall φ(x) eine Lösung der
Gleichung (mit Laplace Operator ∆x = ∇2x )
1
Eφ(x) =
2m
~
∇x
i
2
φ(x) = −
pb2
~2
∆x φ(x) =
φ(x),
2m
2m
(3.9)
wie sich nach zweifacher Anwendung von Glg. (3.6) ergibt.
Da die Energie eines Teilchens in einem Potential V (x) allgemeiner durch E = p2 /2m +
V (x) gegeben ist, ist es eine naheliegende Vermutung, dass man für ein solches Teilchen
nach wie vor Glg. (3.8) verwenden kann, aber nun
~2
(3.10)
Eφ(x) = −
∆x + V (x) φ(x)
2m
bzw.
∂
i~ ψ(x, t) =
∂t
~2
−
∆x + V (x) ψ(x, t)
2m
(3.11)
b auf die
gilt. Wenn man die Wirkung des Hamilton-Operators (auch: Hamiltonian) H
Wellenfunktion als
~
b
b
Hψ(x,
t) = H(b
x, p)ψ(x,
t) = H(x, ∇x )ψ(x, t)
i
10
E. Schrödinger, Ann. Phys. 79, 361 (1926).
27
(3.12)
identifiziert, kann man Glg. (3.11) umschreiben als
i~
~
∂
b
b
ψ(x, t) = Hψ(x,
t) = H(b
x, p)ψ(x,
t) = H(x, ∇x )ψ(x, t).
∂t
i
(3.13)
Dies ist die zeitabhängige Schrödingergleichung für die Wellenfunktion ψ(x, t). Wir nehmen an, dass jedem Teilchen eine komplexe Wellenfunktion ψ(x, t) zugeordnet ist, welche der Schrödingergleichung Glg. (3.13) genügt, wobei h (bzw. ~ = h/2π) gleich der
Plank’schen Konstanten h = 6.626 × 10−34 Js ist. Dies gilt in voller Allgemeinheit und
unabhängig davon, wie wir diese Gleichung erhalten haben.
Wir bemerken, dass Glg. (3.13) eine Differentialgleichung erster Ordnung in der Zeit ist
und daher ψ(x, t) durch die anfängliche Verteilung ψ(x, 0) festgelegt ist. Da Glg. (3.13)
eine lineare Gleichung in ψ(x, t) ist, gilt das Superpositionsprinzip, d.h. Linearkombinationen von Lösungen sind ebenfalls Lösungen und Interferenzeffekte treten auf, wie sie aus
der Optik bekannt sind. Wie die Gleichungen für transversale Schwingungen einer Saite
eines Musikinstruments, hat auch diese Gleichung nur für bestimmte Werte der Energie
Lösungen. In diesen Fällen ist die Randbedingung, dass φ(x) eine einwertige Funktion die
für |x| → ∞ verschwindet. Wie Schrödinger in seinem ersten Papier zur Wellenmechanik
bemerkte:
“ Als das Wesentliche erscheint mir, daßin der Quantenvorschrift nicht mehr die
geheimnisvolle “Ganzzahligkeitsforderung” auftritt, sondern diese ist sozusagen einen
Schritt weiter zurückverfolgt: sie hat ihren Grund in der Endlichkeit und Eindeutigkeit
einer gewissen Raumfunktion.” [E. Schrödinger, Annalen der Physik (1926)]
Darüber hinaus besitzt die Schrödingergleichung eine offensichtliche Verallgemeinerung für
Mehrteilchensysteme. Wenn ein System durch einen Hamilton-Operator H(b
x1 , . . . ; pb1 , . . .)
(die Punkte . . . repräsentieren die Ortskoordinaten und Impulse weiterer Teilchen) gegeben ist, dann nimmt die Schrödingergleichung die Form
∂
~
(3.14)
H(x1 , . . . ; ∇x1 , . . .)ψn (x1 , . . .) = i~ ψn (x1 , . . .) = En ψn (x1 , . . .)
i
∂t
an. Der Hamilton-Operator für N Teilchen der Massen mi mit i = 1, . . . , N mit dem
allgemeinen Potential V (x1 , . . . , xN ) ist beispielsweise durch
X pb2
i
b
bN )
H=
+ V (b
x1 , . . . , x
(3.15)
2m
i
i
gegeben, und die erlaubten Energien sind jene, für welche es eine eindeutige Lösung
ψ(x1 , . . . , xN ) gibt, die für jegliches |xi | → ∞11 verschwindet. Die Schödingergleichung
lautet in diesem Fall
!
X ~2
i
Eφ(x1 , . . . , xN ) =
−
∆x + V (x1 , x2 , . . . , xN ) φ(x1 , . . . , xN ).
(3.16)
2mi i
i
Ausgestattet mit dieser Gleichung war es nun – zumindest im Prinzip – möglich, die
Spektren nicht nur von Wasserstoff sondern ebenso von allen anderen Atomen sowie von
jeglichem anderen nicht-relativistischen System mit bekanntem Potential auszurechnen.
11
Diese Bedingungen werden später in Kapitel XXX en détail besprochen.
28
3.4
Experimentelle Bestätigung der Welleneigenschaften von
Materieteilchen
Die Schrödingergleichung, Glg. (3.13), ist Grundlage der Erklärungen aller Eigenschaften
von Atomen und Molekülen. In sämtlichen Fällen, in denen es möglich ist, die Gleichung
zu lösen oder effektive Näherungsmethoden zu verwenden, stimmen die Ergebnisse mit
experimentellen Daten überein. Nichtsdestotrotz ist auch eine direkte Bestätigung der
Welleneigenschaften von Materieteilchen wichtig. Diese Bestätigung wurde 1927 zum ersten Mal durch C. Davisson und L. Germer sowie unabhängig davon durch G.P. Thomson
erbracht.
Zunächst bemerken wir, dass die typische Größenordnung der de Broglie Wellenlänge
so ist, dass kein Widerspruch zu makroskopischen Erfahrungen auftritt. Hat beispielsweise ein Körper eine Masse 10−5 g (klein auf einer makroskopischen Skala) und eine
Geschwindigkeit von einigen cm/s, so hat er eine de Broglie Wellenlänge von 10−24 m,
welche sicherlich nicht direkt beobachtbar ist. Bedingungen, die sehr viel günstiger zur
Beobachtung der Welleneigenschaften von Teilchen sind, liegen für leichte Teilchen wie
Elektronen√vor. Die einem Elektron
mit kinetischer Energie T zugeordnete Wellenlänge
p
ist λ = h/ 2me T = 12.25 Å/ T /eV . Für T von der Größenordnung 100 eV ist λ von der
Größenordnung 1 Å, ähnlich zur Wellenlänge von Röntgenstrahlung. Daher könnte man
die Beugung von Elektronen an Kristallen nutzen, um die Wellenlänge der Elektronen
nachzuweisen. Das Experiment von Davisson und Germer basiert auf Reflexion ähnlich
wie die Beugungsexperimente von Bragg mit Röntgenstrahlen. Die Elektronen werden von
einer Glühkathode F emittiert und durch eine Spannung zwischen F und einer Blende
D beschleunigt. Durch Variation der Spannung zwischen D und F kann die Geschwindigkeit der Elektronen variiert werden. Ein dünner Strahl von Elektronen geht durch ein
Loch in der Blende und trifft auf einen Nickel-Einkristall R. Die Elektronen werden am
Kristall gestreut und in einem beweglichen Detektor P gesammelt, vgl. Abb. D.13. Der
gesamte Aufbau befindet sich in einem Hochvakuum. Auf diese Weise kann man die gesamte Winkelverteilung der gestreuten Elektronen messen. Das Experiment von Thomson
wurde mittels eines Aufbaus realisiert, der dem Aufbau Laues zuw Messung der Beugung
von Röntgenstrahlung mittels Transparenz von Kristallen ähnelt. In diesem Aufbau emittiert ein Glühdraht im Hochvakuum Elektronen durch den thermoelektrischen Effekt. Die
Elektronen werden zur Blende D durch eine Spannung U = V /e beschleunigt. Danach
werden sie nicht mehr durch Kräfte beeinflusst. Die zweite Lochblende D0 erzeugt einen
dünnen Strahl der auf eine photographische Platte L aufschlägt und einen hellen, runden
Fleck erzeugt. Wenn man nun in die Flugbahn der Elektronen eine dünne Kristallschicht
einsetzt, treten auf der Photoplatte Leuchtpunkte in einer regelmäßigen Anordnung um
den zentralen Punkt auf, wie es für ein Beugungsphänomen, dessen Symmetrie von der
Symmetrie der Kristallgitter abhängt, charakteristisch ist. Die Ergebnisse, die man in
diesen beiden Experimenten erhält, sind sehr ähnlich zu jenen der Experimente mit Röntgenstrahlung. Die Beobachtungen beider Experimente sind in Abb. D.14 gezeigt. Indem
man die Beugungsbilder betrachtet, kann man die Wellenlänge des Elektrons bestimmen,
und findet, dass die de Broglie Beziehung vollständig bestätigt wird. Nach diesen Experimenten mit Elektronen wurden ähnliche Experimente mit Atomen und leichten Molekülen
durchgeführt (I. Estermann, O. Stern, 1929). Es ist hier von Interesse, die Werte von λ für
einige Atome und Moleküle mit mittlerer thermischer Geschwidigkeiten bei Raumtemperatur anzugeben, vgl. Tab. 8.
29
Später wurden Beugungsexperimente mit Neutronen, Protonen und anderen bekannten
Teilchen ausgeführt. Unter den Experimenten mit Neutronen führen wir insbesondere jene
von E. Fermi und L. Woods Marshall in Jahr 1947 an, in welchen ein monoenergetischer
Neutronenstrahl mit Impuls p sich wie ein Strahl monochromatischer Strahlung mit λ =
h/p verhält. Diese Experimente brachten ähnlich wie Experimente mit Röntgenstrahlung
eine ganze Klasse von Phänomenen wie Streuung, Reflexion und so weiter hervor. Heute
verwenden wir die Welleneigenschaften von Neutronen in der Erforschung der Struktur
von Kristallen.
Sie selbst werden zur de Broglie Wellenlänge einige Betrachtungen in Übungsaufgabe 3.1
anstellen.
3.5
Kontinuitätsgleichung und statistische Interpretation der
Wellenfunktion
Wir wollen nun die physikalische Bedeutung der Wellenfunktion ψ(x, t) verstehen, welche
die Schrödingergleichung, Glg. (3.13), erfüllt. Zunächst schlug Schrödinger die Größe
P (x, t) = ψ ∗ (x, t)ψ(x, t)
(3.17)
als Ladungsdichte am Punkt x zur Zeit t vor12 . Dann sollte eine Kontinuitätsgleichung
der Form (die Beziehung zwischen ρ und P wird später genauer diskutiert)
∂
ρ + ∇x · j = 0
∂t
(3.18)
gelten, wobei ρ die Dichte und j der zugehörige Strom ist, j = ρv. Unter Verwendung der
Schrödingergleichung, Glg. (3.13) und der komplex konjugierten Schrödingergleichung ist
es möglich, eine Kontinuitätsgleichung für P zu erhalten. Wir erhalten durch Umstellen
aus den beiden äquivalenten Formen der Schrödingergleichung
i ∂
2m
V (x)ψ(x, t) + 2m
ψ(x, t) = 0,
2
~
~ ∂t
i ∂ ∗
2m
ψ (x, t) = 0,
∆x ψ ∗ (x, t) − 2 V (x)ψ ∗ (x, t) − 2m
~
~ ∂t
∆x ψ(x, t) −
(3.19)
(3.20)
und multiplizieren die beiden Gleichungen mit ψ ∗ (x, t) bzw. ψ(x, t), um die zweite danach
von der ersten zu subtrahieren. Damit erhalten wir
ψ ∗ (x, t)∆x ψ(x, t) − ψ(x, t)∆x ψ ∗ (x, t) + 2m
i ∂ ∗
[ψ (x, t)ψ(x, t)] = 0,
~ ∂t
(3.21)
was in die Form von
∂P
=0
∂t
gebracht werden kann. Hierbei ist die Stromdichte
∇x · S +
S(x, t) =
12
~
(ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t)) .
2im
Das erste neutrale Teilchen – das Neutron – wurde erst 1932 entdeckt.
30
(3.22)
(3.23)
Glg. (3.22) hat die Form einer Kontinuitätsgleichung. Nun integrieren wir Glg. (3.22) über
das Volumen V und wenden für das Integral den Gauß’schen Integralsatz13 an, um
Z
Z
d
∂ψ ∗ (x, t)
~
∂ψ(x, t)
3
∗
∗
− ψ(x, t)
(3.24)
d x ψ (x, t)ψ(x, t) = −
dσ ψ (x, t)
dt V
2im σ
∂n
∂n
zu erhalten. Hierbei bezeichnet σ die Oberfläche des Volumens V und sowohl ∂ψ(x, t)/∂n
als auch ∂ψ ∗ (x, t)/∂n bezeichnen Normalenableitungen von ψ(x, t) bzw. ψ ∗ (x, t) auf der
Oberfläche. Wenn wir annehmen, dass ψ(x, t) und ψ ∗ (x, t) und ihre Ableitungen schnell
genug für |x| → ∞ abfallen, und V über den kompletten Raum R3 ausdehnen, verschwindet das Integral über die Oberfläche auf der rechten Seite. Wir erhalten damit
Z
d
d3 xψ ∗ (x, t)ψ(x, t) = 0,
(3.25)
dt
R
das wichtige Ergebnis, dass d3 x ψ ∗ (x, t)ψ(x, t) zeitunabhängig ist. Da es sich bei der
Schrödingergleichung um eine homogene Gleichung handelt, kann man ψ(x, t) mit einer
geeigneten Konstante multiplizieren, so dass
Z
d3 x ψ ∗ (x, t)ψ(x, t) = 1
(3.26)
R 3
grundsätzlich
gilt.
Falls
d x ψ ∗ (x, t)ψ(x, t) = C gilt, ist es ausreichend, ψ(x, t) durch
√
1/ Cψ(x, t) zu ersetzen, damit die neue Wellenfunktion “normiert” ist, d.h. dass die
“Norm”
Z
Z
2
2
3
kψ(x, t)k ≡ d x |ψ(x, t)| = d3 x ψ ∗ (x, t)ψ(x, t)
(3.27)
gleich eins ist. Glg. (3.27) wird als “Normierungsbedingung” bezeichntet und der Faktor
mit dem man ψ(x, t) multiplizieren muss als “Normierungskonstante”. Diese Normierungskonstante kann immer bis auf einen konstanten Phasenfaktor eiα bestimmt werden,
dessen Wahl keinerlei Einfluss auf die Ausdrücke für S und P hat. Auf jeden Fall kann
man, falls Glg. (3.25) erfüllt ist, die Ausdrücke
ρ(x, t) =eψ ∗ (x, t)ψ(x, t),
e~
j(x, t) =
(ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t))
2im
(3.28)
(3.29)
als Ladungdichte bzw. Stromdichte interpretieren, wobei e die dem Teilchen zugeordnete Ladung ist. Nichtsdestotrotz bringt diese Interpretation große Probleme mit sich.
Zunächst einmal kann sich die Welle ψ(x, t) während ihrer Ausbreitung beträchtlich ausdehnen, und die entsprechende Ausdehnung müsste ebenso mit der vom Teilchen getragenen elektrischen Ladung geschehen. Insbesondere müsste in den Fällen von Beugung
und Interferenz, die in den vorigen Abschnitten besprochen wurden, das Elektron über
die gesamte Region verteilt sein, in welcher das Interferenzmuster beobachtet wird. Dies
steht jedoch in direktem Widerspruch zur experimentellen Tatsache, dass sich das Elektron zu jedem Zeitpunkt, an dem man es beobachtet, als unteilbare Einheit und als im
Wesentlichen punktförmiges Objekt erweist. Darüber hinaus sollte ein Elektron in einem
13
R
R
Der Gauß’sche Satz besagt V dn x∇x · A = dσn−1 A · n̂, wobei n̂ der nach außen orientierte
Normaleneinheitsvektor des n − 1 dimensionalen Oberflächenelements dσn−1 ist, welches das Volumen V
begrenzt.
31
Atom nicht nur von der vom Kern ausgeübten Kraft und der von anderen Elektronen ausgeübten Kraft beeinflusst werden sondern auch von jener Kraft, die von seinem eigenen
geladenen “Fluid” ausgeht. Für dieses Beispiel sollte also das in der Schrödingergleichung
für das Wasserstoffatom zu verwendende Potential
Z
ψ ∗ (x0 , t)ψ(x, t)
e2
2
d 3 x0
(3.30)
V (x) = − + e
r
|x0 − x|
lauten und die Korrektur wäre nicht-linear in ψ(x, t). Wie wir im Kapitel XXX sehen
werden, sind die korrekten Energieniveaus des Wasserstoffatoms jene, die man für das
Potential V (x) = −e2 / |x| erhält. Um zu verstehen, wie diese Interpretation modifiziert
werden sollte, könnte man zu den Interferenz- und Beugungsexperimenten zurückkehren, wie zum Beispiel zu dem von Davisson und Germer. In dem originalen Experiment,
vgl. Abb. D.15, werden die vom Galvanometer G als Funktion des Winkels θ angezeigten
Minima und Maxima als Krönchen bezeichnet, zu dem sehr viele Elektronen beitragen.
Wenn man sich vorstellen würde, den Detektor P durch ein Instrument zu ersetzen, das
jedes Elektron für sich einzeln zählen würde, dann könnte man das vollständige Beugungsmuster rekonstruieren, und zwar, als das Resultat der statistischen Verteilung der
Elektronen, die in verschiedene Richtungen gestreut wurden, vgl. Abb. D.16. All dies motiviert uns, eine statistische Interpretation des Wellenobjekts ψ(x, t) in Erwägung zu
ziehen. Der erste, der zu dieser Interpretation gelangte, war M. Born (1926).
Auf diese Art und Weise interpretieren wir
P (x, t)d3 x = ψ ∗ (x, t)ψ(x, t)d3 x
(3.31)
als die Wahrscheinlichkeit, das Teilchen zur Zeit t in dem Volumenelement d3 x um den
Ort x herum zu beobachten. Indem wir mit dσ ein allgemeines Oberflächenelement eines
den Ort x beinhaltenden Volumens und mit n̂ den senkrecht zu dieser Oberfläche nach
außen weisenden Einheitsvektor bezeichnen, identifizieren wir auf gleiche Art und Weise
S(x, t) · n̂dσdt =
~
(ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t)) · n̂dσdt
2im
(3.32)
als die Wahrscheinlichkeit, dass ein Teilchen das Flächenelement dσ im Zeitintervall dt
in Richtung des Vektors n̂ durchquert. Hierbei ist dσ = dσ n̂ der Normalenvektor des
Flächenelements, der orthogonal auf dieser Fläche steht und nach außen weist, sowie n̂
der zugehörige Einheitsvektor.
Nun wollen wir besprechen, was in den vorigen Behauptungen postuliert worden ist. Das
Konzept der Wahrscheinlichkeit hat für ein Einzelereignis keinerlei Bedeutung, und daher
macht das, was wir postuliert haben, keinerlei Aussage über das Verhalten eines einzelnen
Teilchens. Sobald wir jedoch mehrere gleiche Teilchen betrachten, die alle den gleichen
physikalischen Anfangszustand haben (im konkreten Fall ein Strahl von Teilchen) und in
ausreichend großer Zahl vorliegen, dass statistische Schwankungen vernachlässigt werden
können, dann liefert Glg. (3.31) den Anteil der Teilchen, die tatsächlich in dem Volumen
d3 x beobachtet werden, und der Ausdruck Glg. (3.32) gibt den Anteil der Teilchen an,
welche durch die Oberfläche dσ in der Zeit dt gegangen sind. Entsprechend gilt für den
Fall der geladenen Teilchen, dass Glgn. (3.28) und (3.29) nach Multiplikation mit der
32
Gesamtzahl der Teilchen N die makroskopische Ladungs- und Stromverteilung des Strahls
beschreiben. Die Interpretation, mit der wir Glgn. (3.31) und (3.32) versehen haben, gilt
gleichermaßen für geladene und neutrale Teilchen.
3.6
Die statistische Interpretation und die Beschreibung mittels
Welle-Teilchen-Dualität
Wir haben am Anfang des Kapitels angesprochen, dass Materieteilchen zwei Merkmale haben, die widersprüchlich erscheinen: Welleneigenschaften und Teilcheneigenschaften. Der
Wellencharakter tritt in Interferenz- und Beugungsphänomenen in Erscheinung, während
der Teilchencharakter sich in der Tatsache zeigt, dass die Teilchen, wann immer sie individuell beobachtet werden, sich als unteilbare Einheit zeigen. Die statistische Interpretation,
die wir im vorigen Abschnitt erläutert haben, vereinbart diese beiden Aspekte. Das Objekt, das wir ein Teilchen nennen, sollte man sich weder als Korpuskel noch als Welle
mit der üblichen Bedeutung dieser zwei Konzepte vorstellen, die auf unserer Erfahrung
mit makroskopischen Objekten beruhen. Es gibt solche Situationen, in denen das Verhalten der Teilchen als Ausbreitung von Wellen beschreibbar ist, und andere Situationen, in
welchen es als Bewegung eines kleinen Körpers beschreibbar ist. Von keinem der beiden
Konzepte sollte man auf allgemeingültiges Verhalten schließen. Stattdessen sollten wir den
Versuch einer Beschreibung von Teilchen auf Grundlage unserer gewöhnlichen Erfahrung
aufgeben.
Eine sehr klare Darstellung dieser Situation erhält man in der Diskussion des Doppelspaltexperiments, vgl. Abb. D.17. Wir wollen das Experiment – soweit möglich – rein schematisch beschreiben. Ein Strahl von Elektronen bei fester Energie tritt aus einer Quelle
aus und trifft auf eine Oberfläche Σ1 , welche zwei Löcher (Spalte) 1 und 2 hat. Dann
wird jedes Elektron durch eine monochromatische Welle beschrieben, die zum Teil an
Σ1 reflektiert wird, und deren anderer Anteil beim Durchgang durch die beiden Spalte
gebeugt wird. Wir nennen die beiden gebeugten Wellen ψ1 (x, t) und ψ2 (x, t). Dann ist
die gesamte Welle nahe beim Schirm Σ2 durch ψ(x, t) = ψ1 (x, t) + ψ2 (x, t) gegeben, so
dass die Wahrscheinlichkeit, dass ein Detektor M an irgendeiner Position x entlang des
Schirms Σ2 zum Zeitpunkt t den Aufschlag des Elektrons misst, durch
S(x, t) · n̂dσ =
~ n ∗
[ψ1 (x, t) + ψ2∗ (x, t)] ∇x [ψ1 (x, t) + ψ2 (x, t)]
2im
o
− [ψ1 (x, t) + ψ2 (x, t)] ∇x [ψ1∗ (x, t) + ψ2∗ (x, t)] · n̂dσ
(3.33)
gegeben ist, wobei n̂ der Normaleneinheitsvektor zu Σ2 ist und dσ das dem Detektor
M entsprechende Oberflächenelement ist. Da alle Elektronen die gleichen Anfangsbedingungen haben, gibt der zeitliche Mittelwert von Glg. (3.33) aufgrund des Gesetzes der
großen Zahlen den Fluss der Elektronen in M pro Zeiteinheit an. Wenn man die Position
von M entlang des Schirms verschiebt, sollte der beobachtete Fluss Minima und Maxima
aufweisen, wie man sie von typischen Interferenzmustern kennt.
Nun wollen wir vor den beiden Spalten 1 und 2 die zwei Detektoren C1 und C2 aufstellen.
Von den Teilchen, die M erreichen, wird ein Anteil von dem Detektor C1 gemessen –
wir sagen, sie sind durch den Spalt 1 gegangen – und der andere Anteil wird von dem
33
Detektor C2 gemessen – wir sagen, sie sind durch den Spalt 2 gegangen. Der Fluss des
ersten Anteils ist proportional zu
S1 (x, t) · n̂dσ =
~
{ψ1∗ (x, t)∇x ψ1 (x, t) − ψ1 (x, t)∇x ψ1∗ (x, t)} · n̂dσ,
2im
(3.34)
der Fluss des zweiten Anteils ist
S2 (x, t) · n̂dσ =
~
{ψ ∗ (x, t)∇x ψ2 (x, t) − ψ2 (x, t)∇x ψ2∗ (x, t)} · n̂dσ.
2im 2
(3.35)
Daher ist der gesamte Fluss durch die Summe der einzelnen Flüsse gegeben,
S1 (x, t) · n̂dσ + S2 (x, t) · n̂dσ,
(3.36)
und wir sehen, dass S1 (x, t) + S2 (x, t) 6= S(x, t). Die Verteilungen von S(x, t) · n̂,
S1 (x, t) · n̂, S2 (x, t) · n̂, [S1 (x, t) + S2 (x, t)] · n̂ sind durch die Kurven (a), (b), (c) und
(d) in Abb. D.18 gezeigt. Die unterschiedlichen Charakteristika der Kurven (a) und (d)
sind offenkundig, insbesondere hat die Kurve (d) keine Minima und Maxima des Interferenzmusters der Kurve (a) mehr. Wir müssen daraus schlussfolgern, dass die Anwesenheit
der Detektoren C1 und C2 das Phänomen beinflusst und die Interferenz komplett zerstört
hat.
Kehren wir nun zur Idee eines Teilchens zurück. Falls wir uns das Elektron als Korpuskel
vorstellen, sagt uns die gewöhnliche Intuition, dass es notwendigerweise, um den Detektor
M zu erreichen, entweder durch den Spalt 1 oder durch den Spalt 2 gegangen sein muss.
Wenn dem so wäre, müsste man erwarten, dass die Verteilung von Elektronen auf dem
Schirm Σ2 von der Form (d) ist. Dies müsste sowohl in Anwesenheit wie in Abwesenheit
der Detektoren C1 und C2 gelten. Jedoch widerspricht dies der Vorhersage der Schödingergleichung und den Ergebnissen der Interferenz- und Beugungsexperimente mit Elektronen,
die in den vorigen Abschnitten besprochen wurden. Nur falls wir die Detektoren vor den
Spalten platziert haben, können wir sagen, dass das Elektron mit Sicherheit durch einen
bestimmten Spalt gegangen ist. Daher können wir die Beschreibung als Korpuskel nicht
im Allgemeinen ohne Einschränkung verwenden. Andererseits ist die Wellenbeschreibung
nicht kompatibel mit der Beobachtung des Durchgangs eines einzelnen Elektrons durch
den Detektor. Zu jeder Zeit beobachtet jeweils nur einer der beiden Detektoren vor den
Spalten den Durchgang des Elektrons. Wenn der Detektor M aus einem System von Einzeldetektoren aufgebaut ist, die über den Schirm Σ2 verteilt sind, und die Intensität des
Elektronenstroms ausreichend gering ist, beobachten diese die einzelnen Elektronen jedes
für sich und nur die statistische Verteilung der Zählraten wird in Übereinstimmung mit
der Schrödingergleichung sein, vgl. Abb. D.16. Das hier beschriebene Experiment ist zu
einem Gutteil ein idealisiertes Experiment, ein Gedankenexperiment. In Wirklichkeit wäre
es schwierig ob der Größe der Spalte Detektoren zu realisieren, die zwischen Teilchen unterscheiden können, welche durch die Spalte 1 und 2 gehen. Aber es zeigt charakteristische
Eigenschaften, die in real durchgeführten Experimenten tatsächlich zu beobachten sind.
Insbesondere stimmen die Kurven (a), (b) und (c) vollständig mit den Beobachtungen in
Beugungsexperimenten mit Elektronen an ein oder zwei Spalten überein, wie sie in dem
vorigen Abschnitt beschrieben werden.
Daher sehen wir, dass wir eine intuitive Beschreibung elementarer Objekte aufgeben
müssen, und, dass dies eine inhärente Eigenschaft der QM ist (der Theorie des Verhaltens
34
elementarer Objekte), die diese Objekte in rein probabilistischen (d.h wahrscheinlichkeitstheoretischen) Begriffen beschreibt. Auf Grundlage von Informationen, die wir bezüglich
eines Quantensystems haben, können wir nicht allgemein vorhersagen, welche Ergebnisse man bei einer einzelnen Beobachtung des Systems erhalten wird. Stattdessen können
wir nur Wahrscheinlichkeiten für verschiedene Ergebnisse vorhersagen. In dem Doppelspaltexperiment erlaubt uns die Kenntnis der anfänglichen Energie des Elektrons nicht,
vorherzusagen, an welchen Punkt des Schirms Σ2 dieses einzelne Elektron beobachtet
werden wird, sondern sie erlaubt uns nur, die statistische Verteilung vieler Elektronen mit
exakt gleichen Anfangsbedingungen vorherzusagen.
Wie Sie vielleicht im Bezug zur Thermodynamik bereits in den Experimentalphysikvorlesungen gesehen oder in Lehrbüchern zur Experimentalphysik gelesen haben, taucht der
Begriff der Wahrscheinlichkeit bereits in der klassischen Physik für die Theorie der Zusammensetzung von Körpern aus atomaren oder molekularen Bestandteilen auf. Ihnen
sollten bereits einige Beispiele aus der kinetischen Gastheorie (z.B. Maxwell-Boltzmann
Verteilung, barometrische Höhenformel, etc.) bekannt sein. Die gleichen Methoden finden
ganz allgemein in der statistische Mechanik Anwendung. Diese Theorien haben das Ziel,
das mittlere Verhalten von Systemen zu beschreiben, die aus einer Vielzahl von Teilchen
bestehen. In diesen Theorien wurde die Verwendung von probabilistischen Rechnungen
auf Grundlage praktischer Überlegungen vorgeschlagen. Dabei bezog man sich auf den
Mangel an detailliertem Wissen bezüglich des genauen Zustands des Systems. In solchen
Fällen wäre das Verhalten des Systems im Prinzip exakt vorhersagbar, falls man über
ausreichend Information bezüglich des Zustands des Systems verfügte. In der Quantenmechanik hingegen hat die probabilistische Beschreibung einen fundamentalen Charakter
und ist nicht – in einer naı̈ven Art und Weise – auf einen (behebbaren) Mangel an Wissen
zurückzuführen. Zusammenfassend und in anderen Worten (R.P. Feynman, [2]):
35
a) Die Wahrscheinlichkeitsdichte eines Ereignisses in einem idealen Experiment ist
durch den Absolutbetrag der komplexen Zahl ψ gegeben, welche wir die Wahrscheinlichkeitsamplitude nennen:
P (x, t) =Wahrscheinlichkeitsdichte,
ψ(x, t) =Wahrscheinlichkeitsamplitude,
(3.37)
(3.38)
P (x, t) = |ψ(x, t)|2 .
(3.39)
b) Wenn ein Ereignis auf verschiedene, alternative Wege zustande kommen kann, so
ist die Wahrscheinlichkeitsamplitude des Ereignisses gleich der Summe der separaten Wahrscheinlichkeitsamplituden für jeden einzelnen Weg. Insbesondere
tritt Interferenz auf:
ψ(x, t) =ψ1 (x, t) + ψ2 (x, t),
(3.40)
2
P (x, t) = |ψ1 (x, t) + ψ2 (x, t)| .
(3.41)
c) Wenn ein Experiment so durchgeführt wird, dass bestimmt werden kann, welche
der verschiedenen Alternativen tatsächlich gewählt wurde, so ist die Wahrscheinlichkeitsdichte des Ereignisses die Summe der Wahrscheinlichkeitsdichten für
jede einzelne Alternative. Insbesondere tritt keine Interferenz auf:
P (x, t) = P1 (x, t) + P2 (x, t).
3.7
(3.42)
Heisenberg’sches Unschärfeprinzip und Unschärferelationen
In der Diskussion des Doppelspaltexperiments in dem vorigen Abschnitt haben wir gesehen, dass es unmöglich ist, zu beobachten, durch welchen Spalt das Elektron gegangen ist
(beispielsweise, indem man das Elektron mittels einer Lichtquelle oder Photon-ElektronStreuung detektiert), ohne zur gleichen Zeit auch das Interferenzmuster zu zerstören. W.
Heisenberg schlug im Jahre 1927 vor, dass die damals neuen Naturgesetze nur dann konsistent sein könnten, falls eine bisher nicht erkannte, grundlegende Beschränkung unserer
experimentellen Möglichkeiten bestehe. Er schlug sein Unschärfeprinzip als allgemeines
Prinzip vor, das wir bezüglich unseres Experiments folgendermaßen formulieren können:
“Es ist unmöglich einen Mechanismus zu entwickeln, der zwar ermittelt, durch welchen
Spalt das Elektron geht, der aber nicht zur gleichen Zeit die Elektronen stört und das Interferenzmuster zerstört.” Wenn ein Vorgang die Möglichkeit bietet, zu bestimmen, durch
welchen Spalt das Elektron geht, dann kann er nicht so behutsam sein, dass er nicht das
Muster auf wesentliche Art und Weise stört. Niemand hat jemals eine Methode gefunden
(oder auch nur erdacht), um das Unschärfeprinzip zu umgehen. Daher müssen wir davon
ausgehen, dass es sich um eine fundamentale Eigenschaft der Natur handelt.
Die vollständige Theorie der QM, die wir inzwischen verwenden um Atome und – streng
genommen – sämtliche Materie zu beschreiben, hängt von der Richtigkeit des Unschärfeprinzips ab. Heisenbergs ursprüngliche Formulierung des Unschärfeprinzips lautet: Wenn
man eine Messung an einem Objekt durchführt und die x-Komponente seines Impulses
36
mit der Unsicherheit ∆p kennt, kann man nicht zur gleichen Zeit seinen x-Ort genauer als
∆x ≥ h/∆p kennen. Zu jedem Zeitpunkt muss das Produkt der Unsicherheiten des Orts
und des Impulses eines Teilchens größer oder gleich der Planck’schen Konstanten sein.
Dies bedeutet, dass eine intrinsische Grenze besteht, jenseits derer eine Verbesserung der
Genauigkeit der Messung des Orts eines Teilchens zu Lasten der Genauigkeit der Bestimmung seines Impulses geht. Wir werden weiter im Kapitel 5 sehen, dass die Genauigkeit
um einen Faktor 4π gesteigert werden kann, und, dass die obige Relation für ein Teilchen
in drei Dimensionen zu folgender Aussage verallgemeinert werden kann:
∆x∆px ≥ ~/2,
∆y∆py ≥ ~/2,
∆z∆pz ≥ ~/2.
(3.43)
In dieser Gleichung repräsentieren ∆x, ∆y und ∆z die Unsicherheit, mit der die Koordinaten x, y und z bestimmt sind, und ∆px , ∆py und ∆pz beschreiben die Unbestimmtheit,
mit der die Komponenten des Impulses festliegen. Dieser Satz von Ungleichungen wird als
Heisenberg’sche Unschärferelation bezeichnet. Im Hinblick auf Glg. (3.43) ist es klar, dass
man sich ein Teilchen nicht als ein Korpuskel vorstellen kann. Es handelt sich um ein fundamentales Prinzip, das nichts mit technischen Unzulänglichkeiten eines Messapparates
zu tun hat. Wir können das Unschärfeprinzip auch in folgender Weise formulieren: Wann
immer die Ortsmessung genau ist (z.B. genaue Information über die derzeitige Position
des Teilchens), ist die Information über den Impuls ungenau oder unsicher und umgekehrt.
Wir wollen einige Gedankenexperimente besprechen, die Heisenberg analysiert hatte, um
sein Unschärfeprinzip zu erhalten.
3.7.1
Beugung an einem Spalt
Wir wollen annehmen, dass eine Strahl von Teilchen senkrecht auf einen Schirm AB mit
einem Loch der Länge d fällt, vgl. Abb. D.19. Die Koordinate y eines Teilchens, das durch
den Spalt geht, ist mit einer Unschärfe
∆y = d
(3.44)
bestimmt. Andererseits ist einem Teilchen mit Impuls p eine Wellenlänge λ = h/p zugeordnet. Beim Durchgang durch den Spalt, wird die Welle um einen Winkel α0 gebeugt,
der durch sin α0 ∼ λ/d14 gegeben ist. Dies bedeutet, dass das Teilchen beim Durchgang
durch den Spalt von seiner ursprüngliche Bewegungsrichtung innerhalb einers Winkels α
zwischen +α0 und −α0 abweichen kann. Daher hat die Impulskomponente py = p sin α,
die zu Beginn gleich Null war, nun einen Wert zwischen ±p sin α0 und ist nur mit der
Unsicherheit
h
(3.45)
∆py ∼ p sin α0 =
d
bestimmt. Wenn wir dies mit Glg. (3.44) zusammenfügen, erhalten wir ∆y∆py ∼ h.
14
Die Beugungsbedingung lautet für das ersten Intensitätsminimum d sin θ = λ.
37
3.7.2
Lokalisation mit einem Mikroskop
Wir versuchen mit einer Linse den Ort P eines Elektrons mit Impuls p zu bestimmen,
vgl. Abb. D.20, indem wir es mit einem kleinen Strahl monochromatischen Lichts beleuchten, (die Ausbreitungsrichtung des Lichts ist in der Abbildung gezeigt). Ein an dem
Elektron gestreutes Photon erzeugt ein Bild P 0 auf dem Schirm S 0 . Unter den optimalen
Bedingungen wird man – wie aus der Optik bekannt – in P 0 ein Beugungsmuster sehen,
das folgende Genauigkeit bei der Messung der Orts P erlaubt:
∆x =
λ
.
sin (3.46)
Hierbei ist λ die Wellenlänge des Lichts und ist die Hälfte des Winkels, unter dem von
P aus die Linse zu sehen ist. Da die Linse eine endliche Größe hat, ist es nicht möglich,
die Richtung genau zu kennen, entlang derer das Photon gestreut worden ist, welches
das Bild in P 0 erzeugt. Das Photon mit Wellenlänge λ hat den Impuls p = h/λ und
daher wird die Unbestimmtheit von px ungefähr h/λ sin sein. Da in dem Experiment
der Impuls des Gesamtsystems (Teilchen, Photon und Mikroskop) erhalten sein muss,
wird die Unbestimmtheit der Komponente px des Teilchenimpulses nach der Streuung des
Photons gleich der entsprechenden Unbestimmtheit für das Photon sein. Daher erhalten
wir die Unbestimmtheit
∆px ' h/λ sin .
(3.47)
Wir kombinieren diese mit Glg. (3.46) und erhalten schließlich
∆x∆px ∼ h.
3.7.3
(3.48)
Energie-Zeit-Unschärfe
Eine Gleichung analog zu Glg. (3.43) existiert auch, wenn man zugleich die Bestimmung
sowohl der Energie E eines Teilchens als auch der Zeit t betrachtet, zu der ein bestimmtes
Ereignis stattfindet, welches ebendieses Teilchen betrifft. Wenn ∆E die Unbestimmtheit
der Energie und ∆t die Unbestimmtheit der Zeit ist, erhalten wir die Relation
∆E∆t ∼ h.
(3.49)
Typische Beispiele der Anwendung von Glg. (3.49) sind Zerfälle von instabilen Systemen,
wie es beispielsweise radioaktive Kerne, Atome oder instabile Teilchen sind. Die solchen
Systemen zugeordnete Welle kann keine einzelne monochromatische stationäre Welle sein,
da das System nicht stabil ist. Es muss sich um eine Superposition verschiedener monochromatischer Komponenten handeln, die einem kleinen Frequenzintervall ∆ν entspricht.
Entsprechend ist die Energie des Systems lediglich mit Unschärfe
∆E = h∆ν
(3.50)
bestimmt. Dann bezeichnen wir die mittlere Lebensdauer des Systems mit τ und stellen fest, dass τ die Unbestimmtheit der Zeit ist, zu welcher der Übergang von dem ursprünglichen instabilen System zu einem stabilen System stattfindet (z.B. der Zerfall eines
Teilchens). Wir erhalten
τ ∼ h/∆E,
(3.51)
38
eine Relation, die verwendet werden kann, um die Größenordnung von τ zu bestimmen,
falls ∆E bekannt ist, oder umgekehrt.
Literaturempfehlung:
R.P. Feynman
A. Messiah
S. Weinberg
Lectures of Physics, Volume 3
Quantum Mechanics, Volume 1
Lectures on Quantum Mechanics
39
Sections 1 – 3
Sections 2.I – II, 4.I – III
Sections 1.3, 1.5
4
Die Schrödingergleichungen
4.1
Mathematische Eigenschaften der Schrödingergleichung
und des Hamiltonoperators
In Übereinstimmung mit der im vorherigen Kapitel besprochenen statistischen Interpretation muss die Untersuchung der Schrödingergleichung im Hilbertraum L2 (R3 ) durchgeführt
werden. Mit L2 (R3 ) bezeichnen wir den Raum von reellen oder komplexwertigen messbaren Funktionen, welche auf R3 quadrat-integrabel sind, d.h. die Funktionen χ(x), für
welche
Z
d3 x |χ(x)|2 < ∞
(4.1)
R3
15
gilt . Dieser Raum hat die Struktur eines Hilbertraums16 da er mit dem Skalarprodukt17
Z
hχ1 | χ2 i ≡ d3 x χ∗1 (x)χ2 (x)
(4.3)
ausgestattet ist. Eine genaue Definition und weitere mathematische Details bezüglich
Hilbertraum und Skalarprodukt finden Sie im Anhang B.1.
4.1.1
Schrödingergleichung
Wir betrachten nun die Schrödingergleichung
~2
∂ψ(x, t)
−
∆x + V (x, t) ψ(x, t) = i~
2m
∂t
(4.4)
und formulieren diese in Operatorschreibweise,
∂ψ(x, t)
b
Hψ(x,
t) = i~
,
∂t
(4.5)
15
Die Definition kann auf beliebige Körper erweitert werden, insbesondere auch auf deren Unterräume.
Beispielsweise bezeichnen mit L2 (T ) den Raum von reellen oder komplexwertigen messbaren Funktionen,
welche auf einer Untermenge T des R3 quadrat-integrabel sind, d.h. die Funktionen χ(x), für welche gilt:
Z
2
d3 x |χ(x)| < ∞.
(4.2)
T
16
Das mathematische Konzept eines Hilbertraums (benannt nach David Hilbert) verallgemeinert das
Konzept eines Euklidischen Raums. Dabei werden die Methoden der Vektoralgebra und der Analysis von
der zweidimensionalen Euklidischen Ebene und vom dreidimensionalen Vektorraum auf Räume mit der
Struktur eines inneren Produkts (Skalarprodukt) erweitert, welches die Messung von Längen und Winkeln
gestattet. Desweiteren sind Hilberträume vollständig: es existieren ausreichend Grenzwerte im Hilbertraum
um die Anwendung der Techniken der Analysis zu erlauben. Betrachten Sie hierzu Anhang B.1 bezüglich
weiterer Information zu Hilbertraum und Skalarprodukt.
17
Das Punktprodukt oder Skalarprodukt (teilweise auch inneres Produkt im Kontext Euklidischer
Räume) ist eine algebraische Operation die aus zwei Reihen von Zahlen (üblicherweise die Koordinaten
von Vektoren) als Argument eine einzelne Zahl erhält. Das Skalarprodukt zweier Vektoren kann basisunabhängig konstruiert werden, indem man die Komponente eines Vektors in Richtung des anderen mit
dem Betrag des anderen Vektors multipliziert.
40
wobei wir mit ψ(x, t) ein Element von L2 (R3 ) bezeichnen, das eine Funktion der Zeit ist,
und wir den sogenannten Hamiltonoperator als
2
~2
pb
b
+ V (b
x, t) = −
∆x + V (x, t)
(4.6)
H=
2m
2m
schreiben. Da die Energie reell ist, muss dieser Operator hermitesch (selbstadjungiert)
b =H
b †18 Wir werden sehen, dass man das Problem, die Schrödingergleichung
sein, d.h. H
zu lösen, auch als das Problem, die Eigenwerte und Eigenvektoren des Hamiltonoperators
b zu finden, formulieren kann. Als Konsequenz können wir wieder ohne Einschränkung
H
das Ergebnis von Glg. (3.25) erhalten. Wir definieren
kψ(x, t)k2 ≡ hψ(x, t) | ψ(x, t)i
(4.8)
und erhalten
dψ(x, t)
dψ(x, t) ψ(x, t) + ψ(x, t) dt
dt
D
E
D
E
i
i b
b
Hψ(x, t) ψ(x, t) −
ψ(x, t) Hψ(x, t) = 0.
=
~
~
d
kψ(x, t)k2 =
dt
(4.9)
Darüber hinaus ist Glg. (4.4) von erster Ordnung in der Zeitableitung. Dies legt den
Schluss nahe, dass es eine eindeutige Lösung ψ(x, t) gibt, welche die Anfangsbedingung
ψ(x, 0) = χ0 (x)
(4.10)
erfüllt. Es ist offensichtlich, dass eine derartige Lösung eindeutig ist. Tatsächlich müsste,
falls ψ1 (x, t) und ψ2 (x, t) zwei verschiedene Lösungen zur gleichen Anfangsbedingung
ψ1 (x, 0) = ψ2 (x, 0) = χ0 (x) wären,
kψ1 (x, t) − ψ2 (x, t)k = kψ1 (x, 0) − ψ2 (x, 0)k = 0
(4.11)
gelten und dann wäre ψ1 (x, t) = ψ2 (x, t) für beliebige Werte von t. Dies erkennt man
daran, dass gemäß Glg. (4.9) die Norm eines jeden Vektors und daher auch die Norm von
ψ1 (x, t) − ψ2 (x, t) zeitunabhängig sein muss.
4.2
Operatoren und ihre Wirkung auf Elemente des Hilbertraums
Wir erinnern uns hier an die Definitionen und Eigenschaften linearer Operatoren auf
Vektorräumen. Die grundlegenden Begrifflichkeiten dazu finden Sie im Anhang B.1. In
der QM spielen lineare Operatoren auf dem Hilbertraum L2 (R3 ) eine besondere Rolle,
18
b adjungierte Operator wird auch hermitesch adjungiert, hermitesch konjugiert oder hermiDer zu A
b† bezeichnet. In einem Hilbertraum ist A
b folgendermatesch transponiert genannt und mit dem Symbol A
ßen definiert: für beliebige Vektoren χ1 und χ2 gilt:
E D D
E
b† χ1 χ2 = χ1 Aχ
b 2 .
A
(4.7)
41
daher spezialisieren wir die folgenden Betrachtungen auf den Hilbertraum L2 (R3 ). Für
Vektoren χ1 (x) ∈ L2 (R3 ) definiert die Vorschrift
b 1 (x) = χ2 (x) ∈ L2 (R3 ),
Aχ
(4.12)
b auf den Vektor χ1 (x). Dies bedeutet, dass ein
die Wirkung des linearen Operators A
linearer Operator eine lineare Abbildung von L2 (R3 ) auf L2 (R3 ) ist. Die Eigenschaft der
Homogenität ist hierbei wesentlich,
b 1 χ1 (x) + α2 χ2 (x)) = α1 Aχ
b 1 (x) + α2 Aχ
b 2 (x),
A(α
(4.13)
da diese Operatoren bei Anwendung auf Linearkombinationen von Vektoren einem Distributivgesetz genügen. Für den weiteren Verlauf besonders relevante Beispiele sind folgende
Operatoren:
∂
∂
, ∇2x ,
oder f (x, t) als Multiplikator.
(4.14)
xi ,
∂xi
∂t
Mit Hilfe dieser Operatoren kann der Hamiltonoperator bzw. die Schrödingergleichung,
vgl. Glg. (4.4), geschrieben werden.
Wie man an der Liste dieser Operatoren bereits sieht, kommutieren Operatoren im Allb und B
b das
gemeinen nicht. Wir definieren für den Kommutator zweier Operatoren A
Symbol
b B]
b =A
bB
b−B
b A.
b
[A,
(4.15)
Zwei essentielle Beispiele linearer Operatoren in der QM sind der Impulsoperator pb und
b. Wie Glg. (3.6) nahelegt, sind die Wirkung des Impulsoperators auf
der Ortsoperator x
eine L2 (R3 ) Funktion ganz allgemein durch
~
b
(4.16)
pχ(x)
= ∇x χ(x)
i
und die Wirkung des Ortsoperators auf eine L2 (R3 ) Funktion ganz allgemein durch
bχ(x) = xχ(x)
x
(4.17)
gegeben. Wir betrachten nun den Kommutator der räumlichen i und j Komponenten
dieser beiden fundamentalen Operatoren. Die Auswertung dieses Kommutators lässt sich
am leichtesten bewerkstelligen, indem man die Operatoren innerhalb des Kommutators
auf einen beliebigen Vektor χ(x) betrachtet. Wir finden für diese Kommutatorrelation
~
∂χ(x) ∂{xi χ(x)}
~ ∂
χ(x) =
xi
−
[b
xi , pbj ] χ(x) = xi ,
i ∂xj
i
∂xj
∂xj


∂xi 
~
∂χ(x)
 ∂χ(x)

−χ(x)
=  xi
− xi
 = i~δi j χ(x),
i  ∂xj
∂xj
∂xj 
|
{z
}
|{z}
=0
(4.18)
=δi j
wobei man nun den beliebigen Vektor χ(x) entfernen kann. Daher kann man diesen sogenannten Heisenberg Kommutator auch verkürzt schreiben:
[b
xi , pbj ] = i~δi j .
(4.19)
Im Verlauf der Vorlesung werden Sie Stück für Stück verstehen, warum Glg. (4.19) der
Inbegriff der Quantenmechanik ist und die zentralen Wesenszüge der Quantenwelt Konsequenzen dieser Gleichung sind.
42
4.3
b
Eigenwerte und Eigenvektoren des Hamiltonoperators H
Wie wir sehen werden, ist eine der grundlegenden Problemstellungen in der QM die Betrachtung der Eigenvektoren (bzw. Eigenfunktionen) und Eigenwerte eines hermiteschen
b auf einem gegebenen Hilbertraum (H). Insbesondere ist diese Betrachtung
Operators A
b wesentlich, um Lösungen der Schrödingergleichung
für den Fall des Hamiltonoperators H
zu konstruieren, welche Glg. (4.9) erfüllen. Den gesamten Satz der Eigenwerte eines Operators bezeichnet man als dessen “Spektrum”. Die Ursache für das besondere Interesse an
den Eigenvektoren eines hermiteschen Operators liegt darin, dass diese ein vollständiges
System bilden in einem Sinne, den wir noch definieren werden19 . Wir wiederholen hier einige wohlbekannte Definitionen und Eigenschaften der (eigentlichen) Eigenvektoren. Für
b erfüllt dessen Eigenvektor die Gleichung
einen Operator A
b α = αχα ,
Aχ
(4.20)
wobei α eine komplexe Zahl ist. Der Wert von α, für den Glg. (4.20) erfüllt ist, heißt
der zu χα zugehörige Eigenwert. Die Eigenwerte und Eigenvektoren hermitescher Operatoren haben einige wichtige und einfache Eigenschaften. Wenn wir mit χα0 einen zweiten
Eigenvektor zum zugehörigen Eigenwert α0 bezeichnen, erhalten wir
b α0 = α0 χα0
Aχ
(4.21)
b
und nach Verwendung der Hermitezität von A
b α i − hAχ
b α0 |χα i = (α − α0 ∗ ) hχα0 |χα i .
0 = hχα0 |Aχ
(4.22)
Im Fall gleicher Eigenvektoren (χα0 = χα ) und daher auch gleicher Eigenwerte (α = α0 )
führt dies zu
α∗ = α.
(4.23)
Dies bedeutet, dass die Eigenwerte hermitescher Operatoren reell sind. Für unterschiedliche Werte von α und α0 (d.h. α 6= α0 ) erhält man
hχα0 |χα i = 0,
(4.24)
was bedeutet, dass verschiedenen Eigenwerten zugeordnete Eigenvektoren zueinander orthogonal sind. Darüber hinaus gilt für α = α0 , dass auch jede Linearkombination a χα +
b χα0 (mit beliebigen komplexen Zahlen a und b) ein Eigenvektor ist. Die Menge aller Eigenvektoren zu einem bestimmten Eigenwert α bildet einen Unterraum Hα von H, der als
Eigenraum (zum Eigenwert α) bezeichnet wird. Falls Hα die Dimension eins hat, d.h. falls
der Eigenvektor zu α bis auf einen konstanten Faktor eindeutig bestimmt ist, so nennt
man den Eigenwert einfach. Andernfalls nennen wir diesen entartet und die Dimension
von Hα den Entartungsgrad von α. Offensichtlich sind zwei zu verschiedenen Eigenwerten
α und α0 gehörende Eigenräume Hα und Hα0 zueinander orthogonal. Da in einem separierbaren Hilbertraum eine Menge von Eigenräumen, die jeweils zueinander orthogonal sind,
19
Genau genommen müsste man, um Vollständigkeit zu realisieren, die eigentlichen Eigenfunktionen,
deren Eigenwerte zum diskreten Spektrum gehören, mit den uneigentlichen Eigenfunktionen kombinieren,
deren Eigenwerte zum kontinuierlichen (Streuungs-) Spektrum gehören. Die uneigentlichen Eigenfunktionen gehören zu einem linearen Raum, der größer ist als der ursprüngliche Hilbertraum H.
43
höchstens abzählbar ist, können die eigentlichen Eigenwerte mit ganzen Zahlen20 indiziert
werden, d.h. sie können als
α1 , α 2 , . . . , α n , . . .
(4.25)
b
geschrieben werden und ihre Menge ist das diskrete Spektrum von A.
Falls alle Eigenwerte einfach sind, können die Eigenvektoren mit den gleichen ganzen
Zahlen wie die entsprechenden Eigenwerte indiziert werden, so dass der dem Eigenwert
αn entsprechende Eigenvektor als χn (d.h. χαn ≡ χn ) bezeichnet werden kann21 . Dann
sind zwei verschiedene Eigenvektoren immer zueinander orthogonal, und man kann
hχm |χn i = kχn k2 δm n
(4.26)
schreiben, wobei δm n das Kroneckersymbol ist. Wenn wir darüber hinaus die multiplikative
Konstante derart wählen, dass χn normiert ist, d.h. dass
kχn k = 1
(4.27)
gilt, so erhalten wir aus Glg. (4.26) die Orthonormalitätsrelation
hχm |χn i = δm n .
(4.28)
Wenn stattdessen einige oder alle Eigenwerte entartet sind, so können wir in jedem Eigenraum Hαn (bzw. Hn ) eine vollständige Orthonormalbasis χn 1 , χn 2 , . . . wählen. Dann
finden wir als Verallgemeinerung von Glg. (4.28) die Beziehung
hχn0 s0 |χn s i = δn0 n δs0 s .
(4.29)
b kann
Ein maximales System unabhängiger Eigenvektoren eines hermiteschen Operators A
immer als orthonormal gewählt werden. Im Folgenden werden wir den Entartungsindex s
nicht immer explizit zeigen.
b und spezifizieren drüber hinWir betrachten nun als Spezialfall den Hamiltonoperator H
aus, dass das Potential zeitunabhängig ist, d.h. Vb ≡ V (b
x). In Bezug auf den Hamiltonb schreiben wir die Eigenwertgleichung als
operator H
b = Eφ
Hφ
(4.30)
oder explizit
~2
∆x + V (x) φ(x) = Eφ(x).
−
2m
(4.31)
Dies ist eine gewöhnliche Differentialgleichung im Raum C 2 (R3 )22 und wird als formale
Eigenwertgleichung bezeichnet. Falls V (x) überall stetig ist (z.B. ohne singuläre Punkte
oder singuläre Oberflächen), erlaubt diese Gleichung unendlich viele Lösungen. Indessen
20
Es ist eine willkürliche und keine zwangsläufige Wahl, dass die Indizierung in diesem Beispiel mit
1 beginnt. Insbesondere gibt es verschiedene quantenmechanische Systeme, für die eine Bezeichnung des
Zustands mit dem niedrigsten Eigenwert mit dem Index 0 (oder mit bestimmten negativen ganzen Zahlen)
geradezu natürlich erscheint.
21
Im gleichen Sinne kann man den betreffenden Eigenraum ebenso als Hn bezeichnen. Letzteres gilt
auch im Fall von Entartung.
22
Der Raum C 2 (R3 ) bezeichnet alle Funktionen, die auf dem R3 mindestens zweimal stetig differenzierbar sind.
44
suchen wir in der QM nach Lösungen im Raum L2 (R3 ). In diesem Fall wird die Gleichung
Glg. (4.30) nur für einige spezielle Werte von E gelöst, welche reell und diskret23 sind:
E1 , E2 , . . . , En , . . . .
(4.32)
Falls V (x) Singularitäten hat, erlaubt Glg. (4.31) keine Lösungen im Raum C 2 (R3 ). Man
kann Lösungen in den Regionen definieren, welche die Singularitäten ausschließen. Diese
Lösungen haben im Allgemeinen zumindest eine unstetige zweite Ableitung, falls sie zu
b
singulären Punkten fortgesetzt werden. In diesem Fall werden die Eigenfunktionen von H
2
3
mit den verallgemeinerten Lösungen im Raum L (R ) identifiziert und genügen folgenden
Eigenschaften:
1. Außerhalb der Singularitäten von V (x) sind diese Lösungen C 2 (R3 )-Funktionen und
erfüllen Glg. (4.31) im üblichen Sinne.
2. Auf den Oberflächen σi der Singularitäten sind die Normalenableitungen der Lösungen stetig. Wenn wir mit φ+ (x) und ∂φ+ (x)/∂n sowie φ− (x) und ∂φ− (x)/∂n die
Grenzewerte von φ(x) und ∂φ(x)/∂n auf beiden Seiten der Oberflächen σi der Singularitäten bezeichnen, gilt
φ+ (x) = φ− (x),
∂φ− (x)
∂φ+ (x)
=
∂n
∂n
∀x ∈ σi
(4.33)
und in einzelnen singulären Punkten xj gilt
lim φ(x) = endliche Größe.
x→xj
(4.34)
Im allgemeinen Fall, wenn in V (x) mehrere Singularitäten vorliegen24 , wird der Raum
durch die Oberflächen der Diskontinuitäten in verschiedene nicht überlappende Bereiche
geteilt, und Glg. (4.31) wird in jeder dieser Regionen einzeln gelöst. Anschließend wird
Glg. (4.33) genutzt, um die Lösung in einem Bereich eindeutig mit den Lösungen in anderen Regionen zu verbinden. Dann identifiziert die Bedingung, dass die Lösung in L2 (R3 )
liegt, lediglich einige reelle und diskrete Werte von E.
4.4
Entwicklung der Wellenfunktion nach einer Basis von orthonormalen Eigenfunktionen
b mit Eigenvektoren χn , welche einen
Nun betrachten wir einen hermiteschen Operator A
abzählbaren und vollständigen Satz von Basisvektoren des Hilbertraums bilden (Orthonormalbasis). Dies wäre beispielsweise der Fall, wenn wir den Hamiltonoperator eines Systems
mit einem diskreten Spektrum betrachteten. Dann kann man einen beliebigen Vektor χ
innerhalb des Hilbertraums H durch
X
χ(x) =
an s χn s (x),
(4.35)
n,s
23
Diskrete Werte von E gelten für das diskrete Spektrum und die eigentlichen Eigenwerte.
Wir werden dazu einige Beispiele in der Vorlesung sehen, unter anderem das Beispiel des Potentialtopfs oder die Lösung des Wasserstoffatoms.
24
45
darstellen, wobei die Koeffizienten an s durch
an s = hχn s | χi
(4.36)
gegeben sind. Indem wir uns eine gleichartige Zerlegung für einen beliebigen zweiten
Vektor ξ hinzunehmen,
X
ξ(x) =
bn s χn s (x),
(4.37)
n,s
können wir das Skalarprodukt von χ mit ξ bzw. mit sich selbst mittels der Basisvektoren
χn s vereinfachen zu
+
*
X
XX
X
X
bn0 s0 χn0 s0 =
a∗n s bn0 s0 hχn s | χn0 s0 i =
hχ | ξi =
an s χ n s a∗n s bn s ,
|
{z
}
0 0
n,s 0 0
n,s
n,s
n ,s
kχk2 =
*
X
n,s
n ,s
=δn n0 δs s0
(4.38)
+
X
XX
X
an0 s0 χn0 s0 =
a∗n s an0 s0 hχn s | χn0 s0 i =
an s χ n s |an s |2 .
0 0
|
{z
}
0 0
n,s n ,s
n ,s
=δn n0 δs s0
n,s
(4.39)
b auf den Vektor χ:
Darüber hinaus finden wir für die Wirkung des Operators A
X
X
X
b
b
b χn s (x) =
Aχ(x)
=A
an s χn s (x) =
an s A
an s αn χn s (x).
n,s
n,s
(4.40)
n,s
Diese einfachen Ergebnisse müssen modifiziert werden, wenn wir ein System betrachten,
dessen vollständiger Satz orthogonaler Zustände25 ein Kontinuum bildet (bzw. beinhaltet). Wie wir später in diesem Abschnitt sehen werden, ist dies der Fall, wenn wir ein
System mit einem freien Teilchen und dem zugehörigen Hamiltonoperator betrachten. Im
Fall eines Kontinuums benötigen wir eine allgemeinere Art von Eigenfunktionen – sogenannte uneigentliche Eigenfunktionen oder uneigentliche Eigenvektoren. Diese haben eine
unendliche Norm und gehören daher nicht direkt zum Hilbertraum H, aber man kann in
diesem Fall die Konzepte von Orthogonalität und Normierung erweitern. Den Hamiltonoperator auf dem erweiterten Funktionenraum bezeichnen wir ebenfalls mit dem Symbol
b Wir betrachten eine Menge von uneigentlichen Eigenfunktionen φE (x), die, für eine
H.
b welche durch E ∈ R+
Teilmenge σc des kontinuierlichen Spektrums von H,
0 (E ist die
Energie) festgelegt wird, eine kontinuierliche Funktionsschar des Parameters E bilden.
Diese sind verallgemeinerte Lösungen von Glg. (4.31), so dass
E+∆E
Z
dE 0 φE 0 (x)
(4.41)
E
eine L2 (R3 ) Funktion und von Null verschieden ist. φE s (x) und φE 0 s0 (x) seien zwei uneigentliche Eigenfunktionen zu den uneigentlichen Eigenwerten E und E 0 des kontinuierlichen Spektrums (und den Entartungsindizes s und s0 ). Wir definieren dann
hφE s | φE 0 s0 i = δ(E − E 0 ) δs s0
25
(4.42)
Die genaue Beziehung zwischen den Begriffen der Zustände und denen der Wellefunktionen bzw. der
Vektoren wird an späterer Stelle noch detailliert erklärt.
46
und verallgemeinern damit die Orthonormalitätsrelation, vgl. Glg. (4.28). Hierbei ist δ(x)
die Dirac’sche Deltafunktion (siehe Anhang A OR SOMEWHERE ELSE).
An dieser Stelle können wir die vorherige Zerlegung eines Vektors χ im Hilbertraum
L2 (R3 ), vgl. Glg. (4.35), verallgemeinern und auf ein vollständiges Orthonormalsystem
bestehend aus eigentlichen Eigenfunktionen φn s und uneigentlichen Eigenfunktionen φE 1 ,
φE 2 , . . . ausdehnen:
X
XZ
χ(x) =
an s φn s (x) +
dE as (E) φE s (x).
(4.43)
n,s
s σ
cs
Dabei haben wir sowohl Glgn. (4.29) und (4.42) vorausgesetzt, als auch Orthogonalität
zwischen eigentlichen und uneigentlichen Eigenfunktionen26 angenommen, welche dann in
Form von
Z
an s = hφn s | χi = d3 x φ∗ns χ(x) (x),
(4.47)
Z
(4.48)
as (E) = hφE s | χi = d3 x φ∗Es χ(x) (x).
die Berechnung der Koeffizienten an s bzw. Koeffizienten(-funktionen) as (E) gestattet.
Ferner betrachten wir einen zweiten Vektor ξ im Hilbertraum L2 (R3 ), der ebenso in eine
Form
X
XZ
dE bs (E) φE s (x)
(4.49)
ξ(x) =
bn s φn s (x) +
n,s
s σ
cs
zerlegt werden kann. Unter Verwendung von Glgn. (4.29), (4.45) und (4.46) erhalten wir
XZ
X
∗
dE a∗s (E) bs (E)
(4.50)
an s b n s +
hχ | ξi =
s σ
cs
n,s
und
2
kχk = hχ | χi =
X
2
|an s | +
n,s
XZ
dE |as (E)|2 .
Daher ist die Bedingung für die Konvergenz dieser Art von Ausdrücken
X
XZ
2
|an s | +
dE |as (E)|2 < ∞,
n,s
(4.51)
s σ
cs
(4.52)
s σ
cs
26
Dieses Konzept muss entsprechend definiert sein, d.h. für zwei Mengen {φE a (x)} und {φE b (x)} von
uneigentlichen Eigenfunktionen können wir zwei L2 (R3 ) Funktionen ηa (x) und ηb (x) definieren,
Z
Z
ηa (x) =
dE b(E) φE b (x),
(4.44)
dE a(E) φE a (x),
ηb (x) =
σc a
σc b
so dass
hφn s | ηa i = hφn s | ηb i = 0
sowie
Z
dE a∗ (E) b(E)
hηa | ηb i =
σc a ∩σc b
gilt.
47
(4.45)
(4.46)
und man den Begriff der Normierung verallgemeinern:
X
XZ
2
2
kχk =
|an s | +
dE |as (E)|2 = 1.
n,s
(4.53)
s σ
cs
b auf einen solchen Vektor χ erhalten wir
Durch Anwenden des Hamiltonoperators H
X
XZ
b
Hχ(x) =
an s En φn s (x) +
dE as (E)EφE s (x),
(4.54)
n,s
s σ
cs
indem wir für χ die Zerlegung in das vollständige Orthonormalsystem der Energieeigenfunktionen (Energiebasis), vgl. Glg. (4.43), sowie die Beziehungen
E
D
E D
D
E
b
b
b
φn s Hχ = Hφn s χ = En hφn s | χi ,
φE s Hχ = E hφE s | χi .
(4.55)
b
verwenden. Insbesondere ergibt sich dann bei Bildung des Skalarprodukts von χ und Hχ
b
unter Verwendung der Energiebasis für die Zerlegung von sowohl χ als auch Hχ
Z
E X
D X
b
=
|an s |2 En +
dE |as (E)|2 E,
(4.56)
χ Hχ
n,s
s σ
cs
indem man die entsprechenden Orthonormalitätsrelationen der eigentlichen Eigenvektoren
φn s und uneigentlichen Eigenvektoren φE s , vgl. Glgn. (4.29), (4.45) und (4.46) benutzt.
Im Verlauf der Vorlesung werden wir viele und unterschiedliche Beispiele und Realisierungen dieser Formeln sehen. Wir wollen mit einem einfachen Beispiel zum kontinuierlichen
Spektrum und den uneigentlichen Eigenfunktionen beginnen und betrachten dabei im
Raum L2 (R) den Ortsoperator x
b, der durch die Beziehung
x
bχ(x) = xχ(x)
(4.57)
definiert wird. Die Eigenwertgleichung lautet
x
bχξ (x) = ξχξ (x)
(4.58)
oder nach Kombination von Glgn. (4.57) und (4.58)
(x − ξ)χξ (x) = 0.
(4.59)
χξ (x) = δ(x − ξ),
(4.60)
Eine zugehörige Lösung ist
wie man leicht sieht, da Glg. (4.59) offenkundig ein spezielles Beispiel der allgemeinen
Eigenschaft der Delta-Distribution,
f (x)δ(x − ξ) = f (ξ)δ(x − ξ),
(4.61)
darstellt. In diesem Fall kann χξ (x) als uneigentliche Eigenfunktion von x
b interpretiert
werden und wir sehen, dass x
b ein rein kontinuierliches Spektrum entlang der gesamten
reellen Achse hat. Dann erhalten wir für jede Funktion χ(x) in L2 (R) die Identität
Z+∞
χ(x) =
dξ χ(ξ)δ(x − ξ),
−∞
48
(4.62)
was man als eine Entwicklung von χ nach dem vollständigen Orthonormalsystem χξ betrachten kann. Im Einklang mit dieser Interpretation können wir
Z+∞
hχξ0 | χξ i =
dx δ(x − ξ 0 )δ(x − ξ) = δ(ξ 0 − ξ)
(4.63)
−∞
schreiben, so dass die χξ ein vollständiges Orthonormalsystem bilden. Darüber hinaus
kann man χ als
Z+∞
χ(x) =
dξ c(ξ)χξ (x)
(4.64)
−∞
schreiben, so dass man die Entwicklungskoeffizienten c(ξ) als
Z+∞
c(ξ) = hχξ | χi =
dx δ(x − ξ)χ(x) = χ(ξ),
(4.65)
−∞
identifiziert. Schließlich ist – gemäß der vorangegangen Diskussion – die Wahrscheinlichkeit das Teilchen zur Zeit t im Intervall (ξ, ξ + ∆ξ) zu messen durch
P (ξ < x < ξ + ∆ξ, t) = |ψ(ξ, t)|2 ∆ξ = |χ(ξ)|2 ∆ξ
(4.66)
gegeben.
4.5
Allgemeine Lösung der Schrödingergleichung
Wir konstruieren nun für den Fall eines zeitunabhängigen Potentials die allgemeine Lösung
der zeitabhängigen Schrödingergleichung, vgl. Glg. (4.4), welche die Anfangsbedingung
ψ(x, 0) = χ0 (x) erfüllt. Wir schreiben die zeitabhängige Schrödingergleichung als
~2
∂ψ(x, t)
∆x + V (x) ψ(x, t) = i~
(4.67)
−
2m
∂t
und suchen nach einer partikulären Lösung der Form (multiplikativer Separationsansatz)
ψ(x, t) = φ(x)ξ(t),
(4.68)
die das Produkt zweier Faktoren ist, deren erster nur vom Ort x und deren zweiter nur
von der Zeit t abhängig ist. Indem man den Separationsansatz einsetzt, erhält man
1
~2
1 ∂ξ(t)
−
∆x + V (x) φ(x) = i~
(4.69)
φ(x)
2m
ξ(t) ∂t
und erkennt direkt, dass beide Seiten der Gleichung unabhängig sind (d.h. entweder nur
von x oder nur von t abhängen). Deren Gleichheit kann nur gelten, falls beide konstant
sind und denselben Wert annehmen, den wir mit E bezeichnen wollen. Dann spaltet sich
die Gleichung in zwei verschiedene Gleichungen auf:
i~
49
∂ξ(t)
=Eξ(t),
∂t
(4.70)
~2
−
∆x + V (x) φ(x) =Eφ(x),
2m
(4.71)
wobei E a priori beliebig ist. Glg. (4.70) kann direkt integriert werden und wir erhalten
i
ξ(t) = A exp [− Et].
~
(4.72)
Was Glg. (4.71) betrifft, handelt es sich um eine Eigenwertgleichung vom Typ, der im
vorigen Abschnitt besprochen wurde. Wenn wir mit En die eigentlichen Eigenwerte von
b bezeichnen und mit φn s (x) die zugehörigen eigentlichen Eigenfunktionen, von denen wir
H
annehmen, dass sie gemäß Glg. (4.29) normiert sind, dann ist eine Klasse von Lösungen
durch
i
(4.73)
ψn s (x, t) = φn s (x) exp [− En t]
~
gegeben. Jede dieser Lösungen entspricht einem scharf definierten Wert der Frequenz
νn = |En | /h. Diese Lösungen sind analog zu den stationären Wellen in einem Medium
innerhalb eines Hohlraums und werden daher auch stationäre Lösungen oder stationäre
Zustände genannt. Diese haben die bemerkenswerte Eigenschaft, dass sie eine zeitunabhängige Wahrscheinlichkeitsverteilung des Ortes ergeben. Tatsächlich findet man
|ψn s (x, t)|2 = |φn s (x)|2 .
(4.74)
In diesem Rahmen bezeichnet man Glg. (4.71) als Schrödingergleichung für stationäre
Zustände. Unter formalen Gesichtspunkten gibt es eine zweite Klasse von Lösungen, welche
durch
i
(4.75)
ψE s (x, t) = φE s (x) exp [− Et]
~
b gehört und φE s (x) eine
gegeben sind, wobei E nun zum kontinuierlichen Spektrum von H
uneigentliche Eigenfunktion ist. Natürlich gehört φE s (x) nicht zu L2 (R3 ) und kann daher
für sich allein keinerlei physikalische Bedeutung haben. Nichtsdestotrotz suggeriert die
Linearität von Glg. (4.67), dass man allgemeinere Lösungen vom Typ
XZ
X
cn s ψn s (x, t) +
dEcs (E)ψE s (x, t)
ψ(x, t) =
s σ
cs
n,s
=
X
n,s
X
i
cn s φn s (x) exp [− En t] +
~
s
Z
σc s
i
dEcs (E)φE s (x) exp [− Et]
~
(4.76)
in Betracht zieht. Falls Glg. (4.76) eine Lösung von Glg. (4.67) ist, muss diese Lösung zu
L2 (R3 ) gehören und
X
XZ
2 2
dE |cs (E)|2 E 2 < ∞
(4.77)
|cn s | En +
n,s
s σ
cs
b
erfüllen. Wenn Glg. (4.77) gilt, können wir für Hψ(x,
t) mittels Glg. (4.54)
X
XZ
i
i
b
Hψ(x,
t) =
cn s En φn s (x) exp [− En t] +
dEcs (E)EφE s (x) exp [− Et] (4.78)
~
~
n,s
s
σc s
50
2
b
schreiben27 und Hψ(x,
t) ist gleich der linken Seite von Glg. (4.77). Dann können wir
ebenso Glg. (4.76) nach der Zeit ableiten28 , um
XZ
∂ψ(x, t) X
i
i
i~
=
cn s En φn s (x) exp [− En t] +
dEcs (E)EφE s (x) exp [− Et]
∂t
~
~
n,s
s
σc s
(4.79)
zu erhalten. Wenn wir nun Glgn. (4.78) und (4.79) vergleichen, zeigen wir, dass unter
der Bedingung Glg. (4.77) ψ(x, t) eine Lösung von Glg. (4.67) ist. Ein wesentlicher Fakt
ist, dass es immer möglich ist, die Koeffizienten(-funktionen) cn s und cs (E) in Glg. (4.76)
derart zu wählen, dass eine Anfangsbedingung
ψ(x, 0) = χ0 (x)
(4.80)
für beliebiges χ0 erfüllt ist. Indem wir Glg. (4.76) in Glg. (4.80) einsetzen, erhalten wir
X
XZ
cn s φn s (x) +
dEcs (E)φE s (x) = χ0 (x),
(4.81)
n,s
s σ
cs
welches immer eine Lösung hat, da der gemeinsame Satz von eigentlichen und uneigentb eine Orthonormalbasis (vollständiges Orthonormalsystem)
lichen Eigenfunktionen von H
ist. Aufgrund von Glgn. (4.47) und (4.48) finden wir
cn s = hφn s | χ0 i ,
cs (E) = hφE s | χ0 i .
(4.82)
(4.83)
Die Koeffizienten cn s und cs (E) spielen eine Rolle, die analog zu jener der unbestimmten
Konstanten im allgemeinen Integral einer Differentialgleichung ist, und aus diesem Grund
heißt Glg. (4.76) allgemeine Lösung der Schrödingergleichung.
4.6
Physikalische Interpretation der Schrödingergleichung
Wir wollen nun die im vorangegangenen Abschnitt konstruierte allgemeine Lösung der
Schrödingergleichung,
XZ
X
i
i
dEcs (E)φE s (x) exp [− Et]
ψ(x, t) =
cn s φn s (x) exp [− En t] +
(4.84)
~
~
s
n,s
σc s
betrachten und annehmen, φn s (x) und φE s (x) seien orthonormiert gemäß
hφn0 s0 | φn s i = δs0 s δn0 n ,
hφn0 s0 | φE s i = 0,
hφE 0 s0 | φE s i = δs0 s δ(E 0 − E).
27
(4.85)
b in die Summe bzw. in das Integral hineinziehen.
[. . . ], beispielsweise, indem wir H
Dieser Schritt ist legitim sofern die rechte Seite von Glg. (4.78) in t gleichförmig konvergiert, und
dies is klar, da die Konvergenzbedingung für diesen Ausdruck erneut aus Glg. (4.77) folgt, welche nicht
von der Zeit abhängt.
28
51
Wir bemerken, dass ψ(x, t) in Glg. (4.84) eine Superposition von verschiededenen diskreten monochromatischen Komponenten mit Frequenzen νn = |En | /(2π~) = |En | /h
und von verschiedenen kontinuierlichen monochromatischen Komponenten mit Frequenzen ν = |E| /(2π~) = |E| /h ist. Das Auftreten von einem diskreten Frequenzspektrum
zusammen mit einem kontinuierlichen Frequenzspektrum ist die wesentliche Neuerung gegenüber den Phänomenen bei der Ausbreitung von Wellen in einem dispersiven Medium
von unendlicher Ausdehnung. Um den Ursprung dieser Neuerung und die Bedeutung der
Terme in Glg. (4.84) zu verstehen, nehmen wir an, dass das Potential V (x) für |x| → ∞
zu Null abfällt und ein einfaches Verhalten zeigt wie in Abb. D.21.
Unter dieser Annahme ist die Phasengeschwindigkeit für E < 0, vgl. Glg. (3.2), durch
vph (x, ν) = p
|E|
2m(E − V (x))
(4.86)
gegeben. Daher sieht man, dass die Phasengeschwindigkeit vph (x, ν) innerhalb des Raumbereichs Λ(E) = {x |V (x) ≤ E} rein reell und außerhalb dieser Region rein imaginär
ist. In der Theorie der Wellenausbreitung entspricht eine komplexe Phasengeschwindigkeit einem absorbierenden Medium. Somit liegt in diesem Fall eine in einem begrenzten
Raumbereich “eingesperrte” Welle vor und daher treten die diskreten stationären Frequenzen auf. Um genau zu sein, divergieren die Lösungen von Glg. (4.71) mit E < 0 für
|x| → ∞ sehr stark (typischerweise exponentiell). Lediglich für einen Satz von speziellen
Werten E1 , E2 , . . . für E zwischen −V0 und 0 gibt es Lösungen φ1 (x), φ2 (x), . . . die sehr
schnell außerhalb von Λ(E) zu Null abfallen. Diese Lösungen entsprechen den eigentlib und sind mit dem diskreten Anteil des Spektrums verknüpft.
chen Eigenfunktionen von H
Für E > 0 ist die Phasengeschwindigkeit vph (x, ν) immer reell und daher gibt es keine
“Einschränkung” der Lösung auf einen bestimmten Raumbereich. Diese Lösungen von
Glg. (4.71) sind endlich im gesamten Raum für beliebige Werte von E. Sie entsprechen
den uneigentlichen Eigenfunktionen und sind mit dem kontinuierlichen Anteil der Entwicklung von Glg. (4.84) verbunden. Insbesondere beinhaltet das kontinuierliche Spektrum die
gesamte positive relle Achse σc = (0, +∞).
Wir wollen nun den Fall betrachten, dass ψ(x, t) aus lediglich einer einzigen diskreten
Komponente besteht, z.B. wenn ψ(x, t) von der Form
i
ψ(x, t) = ψn s (x, t) = φn s (x) exp [− En t]
~
(4.87)
ist. Entsprechend der statistischen Interpretation ist
|ψn s (x, t)|2 d3 x = |φn s (x)|2 d3 x
(4.88)
die Wahrscheinlichkeit, das Teilchen im Volumenelement d3 x zu finden. Dann implizieren
die gerade besprochenen Eigenschaften von φn s (x) den Fakt, dass die Wahrscheinlichkeit,
das Teilchen außerhalb des Raumbereichs Λ(En ) zu finden, verschwindend gering ist. Die
Wellenfunktion von Glg. (4.87) beschreibt eine Situation in welcher das Teilchen auf eine
Region, in der das Potential V (x) deutlich von Null verschieden ist, beschränkt ist: sie
beschreibt einen Bindungszustand des Teilchens. Dann wird mit Bezugnahme auf die
allgemeinen Ideen von de Broglie die Energie −En = hνn als die Bindungsenergie des
Teilchens interpretiert. In Übereinstimmung mit der klassischen Mechanik ist Λ(En ) der
52
Raumbereich, in welchem das Teilchen eingesperrt ist, und die Werte E1 , E2 , . . . sind die
Energieniveaus des betrachteten Potentials.
Wir wollen nun eine Wellenfunktion der Form
∞
XZ
i
0
ψ (x, t) =
dEcs (E)φE s (x) exp [− Et]
~
s
(4.89)
0
betrachten, die durch die Superposition mehrerer kontinuierlicher Komponenten gebildet
wird, und wir wollen annehmen, dass die Koeffizienten cs (E) nur in einer gewissen Umgebung eines Wertes E 0 wesentlich von Null verschieden sind. Dann stellt Glg. (4.89) ein
Wellenpaket mit mittlerer Frequenz ν 0 = E 0 /h dar. Wenn das Potential
p V (x) ausreichend
langsam
als
Funktion
von
x
im
Vergleich
zur
Wellenlänge
λ
=
h/
2m(hν − V (x)) =
p
h/ 2m(E − V (x)) variiert, verhält sich das Wellenpaket wie ein klassisches Teilchen der
Energie E 0 . Wir können dann generell sagen, dass das Wellenpaket ein Teilchen der Energie E 0 beschreibt.
Wenn man den Ausdruck |ψ 0 (x, t)|2 für das in Glg. (4.89) definierte Wellenpaket auswertet, ist dieser ebenfalls für eine bestimmte Wahl der Zeit t nur in einem bestimmten
Raumbereich deutlich von Null verschieden, da ψ 0 (x, t) ebenso eine L2 (R3 ) Funktion ist.
Im Unterschied zum Ergebnis für |ψn s (x, t)|2 jedoch ändert sich der Raumbereich mit
von Null verschiedenem |ψ 0 (x, t)|2 mit der Zeit t und bewegt sich mit der Zeit weg von
der Region in der V (x) von Null verschieden ist. Daher werden Lösungen des Typs von
Glg. (4.89) typischerweise zur Beschreibung von Streuprozessen verwendet (Streulösungen). Wir merken an, dass im Fall eines Coulomb-Potentials die Lösungen des Typs von
Glg. (4.87) elliptischen Bahnen der Klassischen Mechanik und die Lösungen des Typs von
Glg. (4.89) hyperbolischen Bahnen der Klassischen Mechanik entsprechen. Wir bemerken
darüber hinaus, dass die Tatsache, dass für Bindungszustände die Energie nur einige diskrete Werte annehmen kann, während sie sich für Streulösungen des Typs von Glg. (4.89)
kontinuierlich verändern kann, eine einfache physikalische Bedeutung hat. Im zweiten Fall
nämlich kann die Energie durch den Experimentator gewählt werden.
Wir wollen nun noch die Bedeutung von Glg. (4.89) für jenen Fall besprechen, dass die
Koeffizienten cs (E) in einem beliebig großen Intervall von Null verschieden sind. Als ein
konkretes Beispiel betrachten wir den Fall eines geladenen Teilchens in einer Wilson’schen
Blasenkammer. Die Energie des Teilchens kann mittels der Krümmung seiner Spur innerhalb eines konstanten, homogenen Magnetfelds B gemessen werden. Nehmen wir an, B
sei orthogonal zur anfänglichen Richtung des Teilchens. Dann gilt gemäß der Klassischen
Mechanik, dass das Teilchen eine Kreisbahn beschreibt, deren Radius r sich aus der Beziehung
v
mv 2
=e B
(4.90)
r
c
ergibt. Dann erhält man die Energie des Teilchens29 aus dem Krümmungsradius als
e2
E=
B 2 r2 .
2
2mc
(4.91)
Im Fall, dass ein Feld (wie hier das B Feld) mit makroskopischen Mitteln erzeugt wird,
werden die Bedingungen für die Anwendbarkeit der Klassischen Mechanik selbst für sehr
29
Glg. (4.91) gilt offensichtlich nur für den nicht-relativistischen Grenzfall.
53
kleine Energien (große Wellenlängen) bestätigt. Dann beschreibt ein Wellenpaket vom
Typ, den wir beschrieben haben, ein Teilchen der Energie E 0 auf einer Trajektorie, welche identisch zu jener eines klassischen Teilchens mit Energie E 0 ist, und der Radius der
Trajektorie wird nach wie vor durch Glg. (4.91) (hierbei ist selbstverständlich E = E 0 )
beschrieben. Daher kann die Krümmung der Spur in der Wilson’schen Kammer vorhergesagt werden, falls die dem Teilchen zugeordnete Wellenfunktion ein Wellenpaket ist.
Wir wollen nun diskutieren, welche Ergebnisse für die allgemeinere Lösung möglich sind.
Wir unterteilen das Intervall (0, +∞) in hinreichend kleine Teilintervalle (E j , E j+1 ). Dann
können wir die Wellenfunktion als eine Superposition von Teilwellenfunktion
X
ψ 0 (x, t) =
ψ j (x, t)
(4.92)
j
schreiben, wobei die Teilwellenfunktionen auf jeweils ein Teilintervall beschränkt sind,
E j+1
X Z
i
dEcs (E)φE s (x) exp [− Et].
ψ j (x, t) =
~
s
(4.93)
Ej
Wir betrachten alle Trajektorien, die für eine gegebene anfängliche Bewegungsrichtung
des Teilchens den Energien . . . , E j , E j+1 , . . . entsprechen, vgl. Abb. D.22. Die durch
das Magnetfeld B erfolgende Projektion dieser Trajektorien auf Kreisbahnen teilt die
Kammer in viele Bereiche ω j auf, welche den Teilintervallen E j < E < E j+1 entsprechen.
Dann ordnen wir einem Teilchen die Energie zwischen E j und E j+1 zu, wenn die von ihm
hinterlassene Spur sich im Bereich ωj befindet. Die Wahrscheinlichkeit, das Teilchen mit
der Energie in einem solchen Intervall ω j zu beobachten, ist
Z
j
j+1
P (E < E < E ) = d3 x |ψ(x, t)|2 .
(4.94)
ωj
Andererseits bewegt sich jede der Wellengruppen ψ j (x, t) auf einer anderen Trajektorie,
und wird daher im Bereich ω j bleiben und nach kurzer Zeit nicht mehr mit den anderen
Gruppen überlagert sein. Dann können wir
P (E j < E < E j+1 ) =
Z
2 X
d3 x ψ j (x, t) =
s
E
Zj+1
dE |cs (E)|2
(4.95)
Ej
schreiben. Falls wir eine Wellenfunktion der allgemeinen Form betrachten, vgl. Glg. (4.84),
bemerken wir dass
+∞
X
n,s
2
|cn s | +
XZ
s
2
Z
dE |cs (E)| =
d3 x |ψ(x, t)|2 = 1.
(4.96)
0
Dann können wir auf Grundlage der Diskussion, die uns zu Glg. (4.95) geführt hat, schlussfolgern, dass wir den Ausdruck
X
P (E < E < E + ∆E) =
|cs (E|2 ∆E
(4.97)
s
54
als die Wahrscheinlichkeit der Messung einer Energie des Teilchens im Intervall (E, E +
∆E) des kontinuierlichen Spektrums und den Ausdruck
X
P (E = En ) =
|cn s |2
(4.98)
s
als die Wahrscheinlichkeit für eine Messung der Energie des Teilchens beim Wert En
aus dem diskreten Spektrum interpretieren können. Wir bemerken, dass die Ausdrücke
in Glgn. (4.97) und (4.98) unabhängig von der Zeit sind, was mit der Tatsache in der
Klassischen Mechanik übereinstimmt, dass es sich bei der Energie um eine Konstante
der Bewegung handelt. Wir sehen, dass die Glg. (4.98) eine Bedeutung hat, die nicht so
offensichtlich ist wie jene von Glg. (4.97). Wie wir sehen werden wird Glg. (4.98) bei Betrachtungen von Absorption und Emission von Strahlung in einem Atom genutzt sowie
in allen Prozessen, in denen Anregung und Abregung von Atomen, Molekülen und Kernen eine Rolle spielen. Die Interpretation der stationären Zustände und Wellenpakete als
Zustände mit gegebener Energie muss als die Definition dessen, was die Existenz eines
Teilchens mit einer gegebenen Energie in der QM bedeutet, verstanden werden. Die klassische Definition der Energie als Summe von kinetischer und potentieller Energie verliert
ihre Bedeutung aufgrund der Heisenberg’schen Unschärferelation, da man den Teilchen
keinen definitiven Ort oder Impuls zuweisen kann.
Wir erinnern uns, dass in der Klassischen Mechanik zwei Eigenschaften das Konzept der
Energie besonders nützlich machen, nämlich die Energieerhaltung und jene Tatsache, dass
für ein System von Teilchen, die ausreichend weit voneinander entfernt sind, die Gesamtenergie gleich der Summe der Einzelenergien der Teilchen ist. Beide Eigenschaften bleiben
in der QM bestehen. Daher kann in einem Streuprozess die Energie in der QM so wie
in der Klassischen Mechanik behandelt werden: die Summe der Energien der Teilchen des
Systems vor der Streuung muss gleich der Summe der Energien der Teilchen des Systems
nach der Streuung sein, und dies ist unabhängig davon, welche Phänomene während der
Streuung stattfinden (An- oder Abregung von Atomen, Kernreaktionen, Erzeugung und
Vernichtung von Teilchen). Insbesondere bedeutet dies, dass, falls ein Elektron innerhalb
eines Atoms sich in einem Bindungszustand mit Energie En befindet, und dieses später
einen Übergang zu einem Zustand Em unter Emission eines Lichtquants vollzieht, die
Energie des anfänglichen und finalen Zustands gleich sein müssen und man
En = Em + hν
(4.99)
erhält, und daher die Frequenz des emittierten Lichts durch
ν=
En − Em
h
(4.100)
b mit den von
gegeben sein muss. Daher sehen wir, dass die eigentlichen Eigenwerte von H
Bohr eingeführten Energieniveaus identifiziert werden müssen.
Literaturempfehlung:
F. Schwabl
A. Messiah
S. Weinberg
Quantenmechanik, Bd. 1
Quantum Mechanics, Volume 1
Lectures on Quantum Mechanics
55
Kapitel 2.8 – 2.10
Section 5
Section 3.1 – 3.3
5
Allgemeine Prinzipien der Quantenmechanik und
Formalismen
In den vorherigen Kapiteln wurde die Wellenmechanik eines einzelnen Teilchens eingeführt. Beginnend mit der Schrödingergleichung,
∂ψ(x, t)
~2
∆x + V (x) ψ(x, t) = i~
,
(5.1)
−
2m
∂t
haben wir eine statistische Interpretation von ψ(x, t) gefunden. Daher haben wir Lösungen
von Glg. (5.1) im Hilbertraum L2 (R3 ) betrachtet, welche die Normierungsbedingung
Z
d3 x |ψ(x, t)|2 = 1
(5.2)
erfüllen, so dass die Wahrscheinlichkeit zur Zeit t innerhalb des Volumenelements d3 x das
Teilchen zu finden durch |ψ(x, t)|2 d3 x gegeben ist. Wir haben Glg. (5.1) in Operatorschreibweise geschrieben,
∂ψ(x, t)
b
(5.3)
Hψ(x,
t) = i~
∂t
und wir haben beobachtet, dass eine Lösung, welche die Anfangsbedingung
ψ(x, 0) = ψ0 (x)
erfüllt, immer in Form von
X
XZ
i
i
dEcs (E)φE s (x) exp [− Et]
ψ(x, t) =
cn s φn s (x) exp [− En t] +
~
~
n,s
s
(5.4)
(5.5)
σc s
geschrieben werden kann, wobei die Koeffizienten cn s und cs (E) durch
cn s = hφn s | ψ0 i
und cs (E) = hφE s | ψ0 i
(5.6)
gegeben sind und φn s (x) und φE s (x) die eigentlichen und uneigentlichen Eigenfunktionen des Hamiltonoperators sind. Wir haben die Mengen der diskreten Eigenwerte
b und das kontinuierliche Spektrum σc (H)
b mit den möglichen Werten der
{En } = σd (H)
Energie des Teilchens identifiziert und die Ausdrücke |cns |2 und |cs (E)|2 ∆E für die Wahrscheinlichkeiten des Wertes En bzw. eines Wertes im Intervall (E, E+∆E) bei der Messung
der Energie erhalten.
Bevor wir zu Anwendungen des Formalismus der QM weitergehen, wollen wir in diesem Kapitel eine allgemeinere Formulierung der QM präsentieren, die sich auf beliebige
Systeme anwenden lässt und die auf einer Reihe von Postulaten basiert.
5.1
Allgemeine Postulate der Quantenmechanik
Zunächst stellen wir fest, dass eine offensichtliche Verallgemeinerung der Schrödingergleichung für den Fall von N Teilchen durch
!
N
2
X
~
∂ψ(x1 , . . . , xN , t)
∆xj + V (x1 , . . . , xN ) ψ(x1 , . . . , xN , t) = i~
(5.7)
−
2mj
∂t
j=1
56
gegeben ist, wobei der Laplace-Operator als
∆xj =
∂2
∂2
∂2
+
+
∂x2j
∂yj2 ∂zj2
(5.8)
definiert ist und V (x1 , . . . , xN ) das Potential ist, welches die Kräfte beschreibt, die auf die
N Teilchen wirken. Wir könnne für Glg. (5.7) die Überlegungen zu Glg. (5.1) erweitern.
Insbesondere können wir fordern, dass die Wellenfunktionen ψ(x1 , . . . , xn , t) für beliebige
Werte von t zu L2 (R3N ) gehören und die Normierungsbedingung
Z
d3 x1 . . . d3 xN |ψ(x1 , . . . , xN , t)|2 = 1
(5.9)
erfüllen. Wir können daher dem Ausdruck
|ψ(x1 , . . . , xN , t)|2 d3 x1 . . . d3 xN
(5.10)
die Bedeutung der Wahrscheinlichkeit geben, zur Zeit t das Teilchen 1 im Volumenelement
d3 x1 , das Teilchen 2 im Volumenelement d3 x2 , . . . sowie das Teilchen N im Volumenelement d3 xN zu finden.
Im Allgemeneinen sind daher folgende Postulate gültig:
• Postulat 1:
Jedem physikalischen System C ist ein entsprechender Hilbertraum HC zugeordnet. Jeder mögliche Zustand des Systems C kann durch ein Element ψ von HC
dargestellt werden, welches eine Norm kψk = 1 hat. Solch ein Element wird als
Zustandsvektor bezeichnet und enthält sämtliche Informationen über das System.
Die Zeitentwicklung des Zustandsvektors wird durch die Gleichung
i~
dψ(t)
b
= Hψ(t)
dt
(5.11)
b ein hermitescher Operator ist.
beschrieben, wobei der Hamiltonoperator H
Glg. (5.11) wird auch hier als Schrödingergleichung bezeichnet und spielt in der allgemeinen Quantenmechanik die im Spezialfall der Wellenmechanik von Glg. (3.13) eingenomme
Rolle. Das Wesen der von ψ(t) beinhalteten Information sowie die Art und Weise, wie diese
darin enthalten ist, wird im zweiten Postulat definiert.
Gemäß der statistischen Interpretation der Quantenmechanik können wir im Bezug auf die
Entwicklung des mikrophysikalischen Systems nur über solche Größen sprechen, für die ein
wohldefinierter Messprozess existiert. Unser zweites Postulat muss die Wahrscheinlichkeit
berücksichtigen, dass man in einem solchen Messprozess zu irgendeinem Zeitpunkt einen
bestimmten Wert aus der Klasse der möglichen Ergebnisse erhält. Aus diesem Grund
werden diese Größen als Observablen30 bezeichnet.
30
Die Observablen sind die zu den klassischen dynamischen Variablen analogen Größen. Größen, die
feststehenden Eigenschaften des Systems entsprechen, wie etwa die Masse oder Ladung eines Teilchens,
b
fallen nicht in diese Kategorie. Sie treten stattdessen in der spezifischen Form des Hamiltonoperators H
auf.
57
• Postulat 2a:
b auf dem Hilbertraum
a) Jeder Observablen A ist ein hermitescher Operator A
des jeweiligen physikalischen Systems HC zugeordnet.
b und das kontinuierliche Spektrum σc (A)
b bilden
b) Das diskrete Spektrum σd (A)
zusammen die Menge der möglichen Messwerte der Observablen A.
c) Unter Verwendung der Eigenwertgleichungen
b r u =αr χr u ,
Aχ
b α u =αχα u
Aχ
(5.12)
(5.13)
(wobei wir mit χr u und χα u die eigentlichen und uneigentlichen orthonormierten Eigenvektoren bezeichnen) und der Entwicklung des Zustandsvekb in der Form
tors ψ(x, t) nach den betreffenden Eigenfunktionen von A
X
X Z
ψ(t) =
cru (t)χr u +
dα cu (α, t)χα u
(5.14)
r,u
u
b
σc (A)
ergibt sich die Wahrscheinlichkeit, bei Messung der Observablen A zur Zeit
b oder einen Wert im Intervall (α, α + dα) ∈ σc (A)
b zu
t den Wert αr ∈ σd (A)
messen, als
X
X
|hχr u | ψ(t)i|2 ,
(5.15)
|cru (t)|2 =
P (A = αr , t) =
u
u
P (α ≤ A ≤ α + dα, t) =
X
2
|cu (α, t)| dα =
X
|hχα u | ψ(t)i|2 dα. (5.16)
u
u
Das zweite Postulat (2a) ist für beliebige Observablen31 eine Verallgemeinerung dessen,
was bereits im vorigen Kapitel für die Energie festgestellt wurde. Wir bemerken, dass die
Normierungsbedingung die Form
X
X Z
2
|cru (t)| +
dα |cu (α, t)|2 = kψ(t)k2 = 1
(5.17)
r,u
u
b
σc (A)
annimmt. Falls zu einer bestimmten Zeit t0 der Zustandsvektor des Systems mit einem
b zum Eigenwert αr übereinstimmt, z.B.
eigentlichen Eigenvektor von A
X
ψ(t0 ) =
cu χ r u
(5.18)
u
die Anfangsbedingung zur Zeit t0 ist, dann ist die Wahrscheinlichkeit bei Messung der
Observablen A durch
P (A = αr , t0 ) = 1
(5.19)
31
Der Begriff Observable wird auch oft zur Bezeichnung des zugehörigen Operators verwendet. Man
b zur Observablen A auf verschiedenen physollte sich dabei trotzdem bewusst sein, dass der Operator A
sikalischen Systemen unterschiedlich definiert ist. Ein offensichtliches Beispiel ist die Gesamtenergie des
Systems, gemessen durch den Hamiltonoperator, der offensichtlich von der Anzahl der Teilchen abhängt.
58
gegeben, d.h. in diesem Fall ergibt eine Messung von A zur Zeit t0 mit Sicherheit das
b auch als EigenErgebnis A = αr . Aus diesem Grund werden die Eigenvektoren von A
b bezeichnet. Das zweite Postulat (2a) bezieht sich lediglich
zustände (des Operators A)
auf eine Observable. Es ist daher notwendig, das zweite Postulat (2a) auf die simultane
Messung von zwei oder mehr Observablen zu verallgemeinern.
Wir haben in Kapitel 3 besprochen, dass eine Einschränkung bei der gleichzeitigen Messung von Ort und Impuls (Heisenberg’sche Unschärferelation) besteht. Im Allgemeinen
ist es nicht möglich, gleichzeitig zwei beliebige Observablen zu messen. Wir unterscheiden
zwischen kompatiblen (gleichzeitig scharf messbar) und inkompatiblen (nicht gleichzeitig
scharf messbar) Observablen. Im ersten Fall ist es möglich, das Ergebnis eines bestimmten Experiments mittels Zuweisung von wohldefinierten Werten für beide Observablen zu
beschreiben. Im zweiten Fall ist dies nicht möglich. Wir wollen nun zwei kompatible Observablen A und B betrachten. Dann gilt gemäß des zweiten Postulats (2a), dass mögliche
Ergebnisse der simultanen Messung von A und B in der Menge der Eigenwerte liegen,
A = αr ,
B = βs .
(5.20)
b und B
b ein gemeinsames vollständiges
Nun wollen wir annehmen, dass die Operatoren A
Orthonormalsystem von Eigenfunktionen (orthonormale Eigenbasis, ONEB) haben, z.B.,
dass eine ONEB χr s u existiert, so dass
b r s u = αr χr s u ,
Aχ
b r s u = βs χr s u ,
Bχ
(5.21)
wobei u den Entartungsindex darstellt. Wir wollen nur rein diskrete Spektren betrachten
(der Einfachheit halber, die Verallgemeinerung auf kontinuierliche Spektren ist offensichtlich). In diesem Fall kann man
X
cr s u (t)χr s u
(5.22)
ψ(t) =
r,s,u
schreiben und annehmen, dass die Wahrscheinlichkeit, bei Messung der Observablen A
und B die Eigenwerte αr und βs zu beobachten, durch den Ausdruck
X
P (A = αr , B = βs , t) =
|hχr s u | ψ(t)i|2
(5.23)
u
gegeben ist. Daher können wir das zweite Postulat (2a) auf folgende Art und Weise verallgemeinern:
• Postulat 2b:
b
Zwei oder mehr kompatible Observablen A, B, . . . werden durch Operatoren A,
b
B, . . . dargestellt, die ein gemeinsames vollständiges Orthonormalsystem von
Eigenvektoren besitzen. Die Wahrscheinlichkeit bei der gleichzeitigen Messung
der Observablen A und B die Ergebnisse A = αr und B = βs zu erhalten, ist
durch Glg. (5.23) (bzw. die offensichtliche Verallgemeinerung auf mehr als zwei
Variablen) gegeben.
Wir weisen auf die Beziehungen
59
P (A = αr , t) =
X
P (A = αr , B = βs , t) =
X
s
P (B = βs , t) =
|cr s u (t)|2 ,
(5.24)
s,u
X
P (A = αr , B = βs , t) =
r
X
|cr s u (t)|2
(5.25)
r,u
hin. Unter Bezugnahme auf Glg. (5.21) weisen wir darauf hin, dass zwei Vektoren der
Form
X
X
as u χr s u bzw.
br u χ r s u
(5.26)
s,u
r,u
b bzw. B
b sind. Dann drückt Glg. (5.21) die Tatsache
Eigenvektoren zu nur dem Operator A
b so zu wählen, dass diese ebenfalls eine ONEB
aus, dass es möglich ist, eine ONEB von A
b ist (die umgekehrte Schlussrichtung gilt natürlich auch), aber nicht, dass jeder
von B
b automatisch auch ein Eigenvektor von B
b ist. Letzteres könnte aufgrund
Eigenvektor von A
b einfach sind.
von Glg. (5.21) nur für den Fall zutreffen, dass alle Eigenwerte von A
Aus praktischen Gründen ist es von wesentlicher Bedeutung, eine Bedingung zu finden,
welche die Beurteilung erlaubt, ob die Observablen A und B kompatibel sind oder nicht,
ohne dass die explizite Konstruktion der gemeinsamen ONEB erforderlich ist. Zu diesem
Zweck betrachten wir zunächst
bBχ
b r s u = α r βs χ r s u ,
A
b Aχ
b r s u = βs αr χr s u ,
B
(5.27)
und schließen daraus, dass
bBχ
b rsu = B
b Aχ
b rsu
A
(5.28)
gilt. Da das System χr s u gemäß als vollstn̈dig angenommen wurde, vgl. Glg. (5.22), gilt
Glg. (5.28) für beliebige Vektoren ψ(t) und daher gilt die Operatoridentität
bB
b=B
bA
b
A
(5.29)
b B]
b = 0,
[A,
(5.30)
b B]
b =A
bB
b−B
bA
b
[A,
(5.31)
bzw.
wobei wir den Kommutator
definiert haben. Man kann nun folgendes Theorem zeigen:
Eine notwendige und hinreichende Bedingung für die Existenz einer gemeinsamen
b und B
b ist, dass diese vertauschen,
vollständigen Orthonormalbasis zweier Operatoren A
b
b
d.h. dass [A, B] = 0 gilt. Daher gilt für untereinander kompatible Observablen, dass jegliche ihnen zugeordnete Operatoren untereinander kommutieren.
Nun kann man für ein System von kompatiblen Observablen das Konzept der maximalen
Beobachtung einführen. Der Index u in Glg. (5.21) zeigt an, dass χr s u bei Eigenwerten αr
b und B
b für weitere Operatoren ein Eigenvektor sein kann.
und βs für die Operatoren A
b B
b und C,
b die alle kommutieren (d.h. [A,
b B]
b =
Wenn ein System von Operatoren A,
60
b C]
b = [C,
b A]
b = 0), die Eigenschaft hat, dass es jeweils nur genau einen Eigenvektor
[B,
χr s t für jedes Tupel (αr , βs , γt ) von Eigenwerten gibt, d.h. dass
b r s t = αr χr s t ,
Aχ
b r s t = βs χr s t ,
Bχ
b r s t = γt χr s t
Cχ
(5.32)
gilt, so wird dieses als vollständiges System von kommutierenden Operatoren (vSkO) bezeichnet. Wir nennen ein solches System von Operatoren ein kommutierendes System.
Systeme von Observablen, die einem vSkO zugeordnet werden, sind von besonderer Bedeutung in QM und müssen en detail besprochen werden.
Zunächst wollen wir den Begriff einer Funktion mehrerer kommutierender Operatoren
einführen. Gegeben sei eine Funktion f (x, y, z), die durch eine Potenzreihe
X
f (x, y, z) =
f l m n xl y m z n
(5.33)
l,m,n
dargestellt werden kann. Auf gleiche Art und Weise kann eine Funktion von Operatoren
durch eine Potenzreihe von Operatoren32
X
bl B
bmC
bn
b B,
b C)
b =
fl m n A
(5.34)
f (A,
l,m,n
ausgedrückt werden. Ausgehend von Glg. (5.32) erhält man
bl B
bmC
bn χr s t = αrl βsm γtn χr s t ,
A
(5.35)
b B,
b C)χ
b r s t = f (αr , βs , γt )χr s t
f (A,
(5.36)
was schließlich auf
b
führt. Man kann daher aufgrund von Glg. (5.36) schlussfolgern, dass ein Operator G,
der mit allen Operatoren aus einem vSkO kommutiert, zwangsläufig eine Funktion dieser
b mit einem Satz miteinander kommutierenOperatoren ist. Tatsächlich gilt, dass, falls G
b B
b und C
b kommutiert, G
b mit diesen Operatoren ein gemeinsames,
der Operatoren A,
b B
b und C
b ein vSko
vollständiges System von Eigenvektoren besitzt. Wenn zusätzlich A,
bilden, dann sind alle gemeinsamen Eigenvektoren der drei zugleich Eigenvektoren von
b Unter dieser Bedingung können wir
G.
b r s t = ηr s t χ r s t
Gχ
(5.37)
b = f (A,
b B,
b C)
b
schreiben und dann gilt aufgrund der Definition f (αr , βs , γt ) ≡ ηr s t , dass G
b B
b und C
b zu
ist. Dieses Ergebnis ist wichtig, denn es besagt, dass, falls die Operatoren A,
den Observablen A, B und C ein vSkO bilden, durch gleichzeitige Messung einer Größe G,
b mit A,
b B
b und C
b kommutiert, keine weitere Information erlangt werden
deren Operator G
kann, da der Wert von G a priori auf Grundlage der beobachteten Werte für A, B und C
berechnet werden kann. Aus diesem Grund bezeichnet man die Messung aller Operatoren
eines vSkO mit dem Begriff der maximalen Beobachtung.
Wir wollen uns nun erneut den zuvor eingeführten ersten beiden Postulaten zuwenden.
Das erste Postulat erlaubt uns, den Zustandsvektor ψ(t) zu einer beliebigen Zeit t > t0
zu berechnen, sofern der Anfangszustand ψ(t0 ) gegeben ist. Das zweite Postulat erlaubt
32
Hinweis: Operatoren vertauschen im Allgemeinen nicht!
61
uns, Vorhersagen bezüglich der möglichen Ergebnisse einer Messung einer Observablen zur
Zeit t zu machen, wenn wir den Zustandsvektor ψ(t) kennen. An diesem Punkt benötigen
wir ein Kriterium, dass die Konstruktion eines Zustandsvektors ψ(t0 ) für den Anfangszeitpunkt gestattet. Diese Präparation des Systems besteht in idealisierter Form aus einer
ersten Beobachtung (Messung) des Systems und einer danach erfolgenden vorhersagbaren Veränderung der experimentellen Apparatur. Man sollte daraus ψ(t0 ) konstruieren
können. Um dieses Ziel zu erreichen, muss man sich zunächst darüber klar werden, dass
nicht jede Beobachtung, die man an dem System vornehmen kann, nützlich sein kann, um
dessen darauf folgende Zeitentwicklung vorherzusagen.
Mittels einer Terminologie, die auf Wolfgang Pauli zurückgeht, ordnen wir Messungen
in zwei Kategorien ein: Messungen der ersten Art und Messungen der zweiten Art. Eine
Messung der ersten Art ist eine Beobachtung, bei welcher die beobachtete Observable
nicht auf eine merkliche Art und Weise gestört wird, oder aber auf eine bekannte Art
gestört wird, in dem Sinne, dass eine direkte Wiederholung der gleichen Beobachtung das
gleiche oder ein vorhersagbares Ergebnis ergibt. Eine Messung der zweiten Art ist eine
Beobachtung, die auf wesentliche und nicht vorhersagbare Art und Weise die untersuchte
Observable stört.
Ein Beispiel einer Messung der ersten Art ist die Messung der Energie eines Teilchens
(mit bekannter Masse und Ladung), welche man mittels der Bestimmung der Krümmung
jener Bahn erhält, die von diesem Teilchen beim Durchgang durch ein Magnetfeld in
einer Wilson’schen Blasenkammer hinterlassen wird. Eine Bestimmung der Krümmung
der Bahn auf dem als Nächstes angrenzenden Linienelement wird das gleiche Ergebnis
haben. Ein typisches Beispiel einer Messung der zweiten Art ist die Beobachtung eines
Photons mittels eines Photomultipliers. Während seiner Beobachtung wird das Photon
vollständig absorbiert, so dass man nicht mehr von anschließenden Beobachtungen des
Photons sprechen kann. Damit erreichen wir das dritte Postulat.
• Postulat 3:
Wir wollen annehmen, dass wir zu einer Zeit t0 eine Messung der ersten Art an
einem System vorgenommen haben. Die Beobachtung besteht aus der Messung
eines Satzes von kommutierenden Observablen, die im Folgenden mit A und B
bezeichnet werden. Wir wollen annehmen, dass wir die Messwerte A = αr und
B = βs erhalten haben. Wenn der Zustandsvektor direkt vor der Beobachtung
durch ψ(t0 ) gegeben ist, dann ist der Zustandsvektor ψ(t0 + τ ) direkt nach der
Beobachtung (bis auf die Normierung) durch die Projektion von ψ(t0 ) auf den
Unterraum, der den Eigenwerten αr und βs entspricht, gegeben.
Im konkreten Fall bedeutet dies, dass falls der Zustandsvektor ψ(t0 ) vor der Messung
durch (vgl. Glg. (5.22))
X
ψ(t0 ) =
cr s u χ r s u
(5.38)
r,s,u
gegeben ist, der Zustandsvektor ψ(t0 + τ ) nach der Messung durch
ψ(t0 + τ ) = rP
1
|cr s u |2
u
62
X
u
cr s u χ r s u
(5.39)
gegeben ist. Wenn die betrachtete Messung eine maximale Beobachtung ist, hier A = αr ,
B = βs und C = γt , dann gilt im Speziellen (vgl. Glg. (5.32))
ψ(t0 + τ ) = χr s t .
(5.40)
Wir merken an, dass uns Glg. (5.40) erlaubt, den Zustand ψ(t0 + τ ) zu präparieren ohne
irgendeine weitere Information über das System zu haben. Glg. (5.39) ist stattdessen
nur nützlich, falls man zusätzlich über weitere Informationen über ψ(t0 ) verfügt. Diese
Vorschrift gilt im Allgemeinen sowohl für das diskrete wie auch für das kontinuierliche
Spektrum33 .
Eine Konsequenz all dessen ist, dass der Zustandsvektor zur Zeit des Messvorgangs eine diskontinuierliche und irreversible Veränderung erfährt, die sich von der durch die
Schrödingergleichung, Glg. (5.11), beschriebenen ungestörten Zeitentwicklung drastisch
unterscheidet. Dies ist kein Problem, da der Zustandsvektor ein reines Hilfsmittel zur Formulierung der statistischen Vorhersagen ist und für sich genommen keinerlei Signifikanz
besitzt.
Wir erinnern uns, dass in der Wahrscheinlichkeitsrechnung die Konzepte des Erwartungswerts (oder Mittelwerts) und der Varianz (oder quadratischen Standardabweichung) von
wesentlicher Bedeutung sind und wichtige Informationen bezüglich einer jeweils vorliegenden statistischen Verteilung beinhalten. Wir wollen diese Konzepte nun für die Wahrscheinlichkeitsverteilung spezifizieren, welche im zweiten Postulat einer generischen Observablen A und einerD bestimmten
Lösung ψ(t) der Schrödingergleichung zugeordnet ist.
E
b
Der Erwartungswert A von A bezüglich des Zustandsvektors ψ(t) ist durch
t
D E
X
X
b ≡
αr |cr u (t)|2
(5.41)
αr P (A = αr , t) =
A
t
r,u
r
gegeben, wobei die erste Gleichheit eine Definition ist und die zweite Gleichheit sich durch
Verwendung von Glgn. (5.12), (5.14) und (5.15) ergibt. Der Einfachheit halber behandeln
wir hier nur den Fall eines rein diskreten Spektrums. Für die Wurzel der Varianz bzw. für
die Standardabweichung erhalten wir
rD
D E E sX D E 2
D
E
2
b
b
b
b
(A − A )
=
αr − A
P (A = αr , t)
∆A =
t
t
t
t
r
s
=
X
D E 2
b
αr − A
|cr u (t)|2 .
(5.42)
t
r,u
D
E
b ist ein Maß für die Unbestimmtheit, mit der A für ein System im ZuDie Größe ∆A
t
stand ψ(t) bekannt ist34 . Die Gültigkeit der Glgn. (5.41) und (5.42) kann man in wenigen
33
Genau genommen erfordert Glg. (5.40) offensichtlich, dass der Zustand χr s t ein eigentlicher Eigenvektor ist. Eine Messung, die Werte im kontinuierlichen Spektrum ergibt, hat immer eine gewisse
Ungenauigkeit, die man zwar verringern aber nicht zu Null reduzieren kann. Daher gehört diese Messung
selbst bei einer maximalen Beobachtung zum Fall von Glg. (5.39). Nichtsdestotrotz könnte man bei einer
direkten Wiederholung der Messung eine nahezu vollständige Bestimmung des Zustands erreichen. Dieser
Fall gilt zum Beispiel bei der Bestimmung der Spur eines Teilchens in einer Wilson’schen Blasenkammer,
welche eine wohlbestimmte Zuordnung eines Wellenpakets
D
E zu dem Teilchen erlaubt.
34
b und verschweigt damit implizit die AbhängigMan schreibt oft auch einfach ∆A anstelle von ∆A
t
keit der Varianz von der Wahl des Zustands ψ(t). Wir versuchen dies im Folgenden zu vermeiden und
die Abhängigkeit vom Zustand ψ(t) explizit zu zeigen.
63
Zeilen zeigen:
D E
D
E
D
E
X
b
b
∗
b
A = ψ(t) Aψ(t) =
cr u (t)cs v (t) χr u Aχs v
t
r,s,u,v
=
X
c∗r u (t)cs v (t)αs δr s δu v =
r,s,u,v
X
αr |cr u (t)|2 ,
(5.43)
r,u
2
D
E2 D E 2
D E
b
b = ψ(t) A
b− A
b
b
∆A
ψ(t)
=
A
−
A
ψ(t)
t
t
t
D E 2
X
∗
b
b
=
cr u (t)cs v (t) χr u A − A
χs v
t
r,s,u,v
D E 2
X
∗
b
=
cr u (t)cs v (t) χr u αr − A
χs v
t
r,s,u,v
=
X
r,u
D E 2
b
αr − A
|cr u (t)|2 .
(5.44)
t
Diese Gleichungen finden zahllose praktische Anwendungen.
5.2
Orts- und Impulsobservablen: Größen mit klassischen Analoga
Wie wir gesehen haben, kann jeder physikalischen Größe ein hermitescher Operator zugeordnet werden. Das zweite Postulat, welches diese Zuordnung herstellt, verallgemeinert
die Rechenregeln und interpretativen Beschreibungen, die für den Spezialfall der Energie
im vorherigen Kapitel besprochen wurden, für beliebige physikalische Messgrößen. Nun
wollen wir untersuchen, auf welche Art und Weise sich die bereits für ein einzelnes Teilchen in einer Dimension gewonnenen Erkenntnisse in das Schema für N Teilchen (in drei
Dimensionen) einfügen. Insbesondere wollen wir die Bestimmung der Wahrscheinlichkeit
verallgemeinern, ein Teilchen in einem bestimmten Raumbereich oder Impulsbereich zu
finden. Wir müssen nun ebensolche Regeln wie für die allgemeine Konstruktion des Hamiltonoperators angeben und die genaue analytische Form der Operatoren bestimmen, die
den Observablen entsprechen. Insbesondere ist es von Bedeutung, präzise Regeln für die
Konstruktion der Operatoren jener Größen zu haben, die eindeutige klassische Analoga
besitzen. Aus diesem Grund führen wir das vierte Postulat ein.
• Postulat 4:
Der Hilbertraum eines Systems von N Teilchen ist der Raum L2 (R3N ) von Funktionen des Typs χ(x1 , . . . , xN ). Den kartesischen Koordinaten (xi , yi , zi ) des iten
Teilchens werden die Operatoren (b
xi , ybi , zbi ) zugeordnet, die durch
(b
xi χ)(x1 , . . . , xN ) = xi χ(x1 , . . . , xN ),
(b
yi χ)(x1 , . . . , xN ) = yi χ(x1 , . . . , xN ),
(b
zi χ)(x1 , . . . , xN ) = zi χ(x1 , . . . , xN ).
(5.45)
definiert werden.
64
Wie wir sehen werden, gestattet uns dieses Postulat, die Born’sche Wahrscheinlichkeitsinterpretation zu erhalten, die bereits in einem vorherigen Kapitel (vgl. Kapitel 3) besprochen wurde. Die Definition eines (linearen) Impulses35 , die zunächst in Bezug auf ein freies
Teilchen angegeben wurde, kann zu einer neuen, allgemeineren Definition in Beziehung
gesetzt werden, wie wir im Folgenden zeigen werden.
Definition: Für ein System von N Teilchen nennen wir die vektorielle Größe mit kartesischen Komponenten
(b
pi x χ)(x1 , . . . , xN ) =
(b
pi y χ)(x1 , . . . , xN ) =
(b
pi z χ)(x1 , . . . , xN ) =
~ ∂χ(x1 ,...,xN )
,
i
∂xi
∂χ(x
,...,x
)
~
1
N
,
i
∂yi
~ ∂χ(x1 ,...,xN )
.
i
∂zi
(5.46)
den (linearen) Impuls des iten Teilchens.
Wir können hiermit die folgenden Observablen definieren.
5.2.1
Ort als Observable
Wir haben bereits im Kapitel 3 den eindimensionalen Fall besprochen. Nun wollen wir
den Ort eines Teilchens im dreidimensionalen Raum betrachten. Die Operatoren x
b, yb und
zb kommutieren miteinander und haben eine gemeinsame ONEB,
x
bχ(x, y, z) = xχ(x, y, z) = ξχ(x, y, z),
ybχ(x, y, z) = yχ(x, y, z) = ηχ(x, y, z),
zbχ(x, y, z) = zχ(x, y, z) = ζχ(x, y, z).
(5.47)
Die erste dieser Gleichungen wird für χ(x, y, z) = A(y, z)δ(x − ξ) gelöst. Die Lösung der
zweiten ist χ(x, y, z) = B(x, z)δ(y − η) und der dritten ist χ(x, y, z) = C(x, y)δ(z − ζ).
Daher werden die drei Gleichungen simultan durch
χξ (x) = δ(x − ξ)δ(y − η)δ(z − ζ) = δ 3 (x − ξ)
(5.48)
gelöst, wobei wir ξ = (ξ, η, ζ) definiert haben. Hierbei handelt es sich um eine uneib ist von rein
gentliche Eigenfunktion für beliebige Werte von ξ und das Spektrum von x
kontinuierlicher Natur. Die beliebige multiplikative Konstante wurde in Glg. (5.48) auf
eins gesetzt. Auf diese Art und Weise sind die χξ (x) normiert und man erhält die Orthonormalitätsrelation
Z
hχξ0 | χξ i = d3 x δ 3 (x − ξ 0 )δ 3 (x − ξ) = δ 3 (ξ − ξ 0 )
(5.49)
sowie die Zerlegung beliebiger Wellenfunktionen nach der Ortsbasis,
Z
Z
3
3
ψ(x, t) = d ξ ψ(ξ, t)δ (x − ξ) = d3 ξ ψ(ξ, t)χξ (x),
(5.50)
womit sich die statistische Interpretation gemäß
P (ξ ≤ x ≤ ξ + dξ, t) = |ψ(ξ, t)|2 d3 ξ
35
(5.51)
Wir sprechen hier von einem linearen Impuls um hervorzuheben, dass es sich nicht um einen Drehimpuls handelt. Drehimpulse in der Quantenmechanik werden an späterer Stelle (Abschnitt 5.6) behandelt.
65
ergibt36 . Die Verallgemeinerung auf ein System von N Teilchen ist offensichtlich.
5.2.2
Impuls als Observable
Für ein Teilchen in einer Dimension lautet die Eigenwertgleichung für pb
pbϕ(x) =
~ ∂ϕ(x)
= pϕ(x)
i ∂x
(5.53)
und deren Lösung ist eine ebene Welle,
i
ϕ(x) = A exp [ px].
~
(5.54)
Hierbei handelt es sich um eine uneigentliche Eigenfunktion für beliebige Werte von p und
das Spektrum von pb ist von rein kontinuierlicher Natur. Die normierten Eigenfunktionen
lauten
i
1
exp [ px]
(5.55)
ϕp (x) = √
~
2π~
und erfüllen die Orthonormalitätsrelation
Z+∞
i
i
dx exp [− p0 x] exp [+ px] = δ(p0 − p).
~
~
1
hϕp0 | ϕp i =
2π~
(5.56)
−∞
Wir merken an, dass die Impulseigenfunktionen für ein freies Teilchen mit den Eigenfunkb zusammenfallen. Auch sonst kann eine Wellenfunktion ψ(x, t) stets nach
tionen von H
Impulseigenfunktionen entwickelt werden,
1
ψ(x, t) =
2π~
Z+∞
Z+∞
i
i
dp
dx0 ψ(x0 , t) exp [− px0 ] exp [+ px]
~
~
−∞
1
= √
2π~
−∞
Z+∞
−∞
i
dp c(p, t) exp [ px].
~
(5.57)
Dann können wir die Koeffizienten c(p, t) durch
1
c(p, t) = hϕp | ψ(t)i = √
2π~
Z+∞
i
dx exp [− px]ψ(x, t)
~
(5.58)
−∞
erhalten und wir finden für das zweite Postulat
2
P (p0 ≤ p ≤ p0 + dp0 , t) = |c(p0 , t)| dp0 .
36
(5.59)
Die Bedeutung von ξ ≤ x ≤ ξ + dξ ist als
ξ ≤ x ≤ ξ + dξ,
η ≤ y ≤ η + dη,
p
oder auch als |ξ − x| = (ξ − x)2 ≤ |dξ| zu verstehen.
66
ζ ≤ z ≤ ζ + dζ,
(5.52)
Die Lösung der Schrödingergleichung für ein freies Teilchen ist von der Form
1
ψ(x, t) = √
2π~
so dass wir
Z+∞
i
p2
dp c0 (p) exp
px −
t ,
~
2m
(5.60)
−∞
i p2
c(p, t) = c0 (p) exp −
t
~ 2m
(5.61)
finden. Die Tatsache, dass die Wahrscheinlichkeit P (p0 ≤ p ≤ p0 + dp, t) für ein freies
Teilchen zeitunabhängig ist,
2
2
P (p0 ≤ p ≤ p0 + dp0 , t) = |c(p0 , t)| dp0 = |c0 (p0 )| dp0 = P (p0 ≤ p ≤ p0 + dp0 ).
(5.62)
stimmt mit der Tatsache überein, dass der Impuls (eines freien Teilchens) in der Klassischen Physik eine Konstante der Bewegung ist.
Wir wollen nun ein Teilchen in drei Dimensionen betrachten. Die Operatoren pbx , pby und
pbz vertauschen und die entsprechenden Observablen sind kompatibel. Die simultane Eigenwertgleichung lautet
pbx ϕ(x, y, z) =
pby ϕ(x, y, z) =
pbz ϕ(x, y, z) =
~ ∂ϕ(x,y,z)
i
∂x
~ ∂ϕ(x,y,z)
i
∂y
~ ∂ϕ(x,y,z)
i
∂z
= px ϕ(x, y, z),
= py ϕ(x, y, z),
= pz ϕ(x, y, z).
(5.63)
Die Lösungen der ersten, zweiten und dritten Gleichung sind entsprechend
i
A(y, z) exp [ px x],
~
i
i
B(x, z) exp [ py y] und C(x, y) exp [ pz z].
~
~
(5.64)
Darum ist eine gleichzeitige Lösung durch
i
i
i
ϕ(x, y, z) = K exp [ px x] exp [ py y] exp [ pz z]
~
~
~
(5.65)
gegeben und die normierten Eigenfunktionen sind
ϕp (x) =
1
i
1
i
exp [ (px x + py y + pz z)] =
3 exp [ p · x]
~
~
(2π~)
(2π~) 2
3
2
(5.66)
und erfüllen die Orthonormalitätsrelation
hϕp0 | ϕp i = δ 3 (p0 − p).
(5.67)
Wir können damit das Wellenpaket als Superposition dieser Lösungen schreiben, d.h. die
Wellenfunktion ψ(x, t) nach den Impulseigenfunktionen entwickeln,
Z
Z
1
i
3
ψ(x, t) = d p c(p, t)ϕp (x) =
d3 p c(p, t) exp [ p · x],
(5.68)
3
~
(2π~) 2
wobei im Allgemeinen die Beziehungen
c(p, t) = hϕp | ψ(t)i =
Z
1
(2π~)
3
2
67
i
d3 x exp [− p · x]ψ(x, t),
~
(5.69)
2
P (p0 ≤ p ≤ p0 + dp0 , t) = |c(p0 , t)| d3 p0 ,
gelten. Für das freie Teilchen reduziert sich Glg. (5.69) zu
i p2
c(p, t) = hϕp | ψ(t)i = c0 (p) exp −
t ,
~ 2m
(5.70)
(5.71)
wie bereits im eindimensionalen Fall. Eine Verallgemeinerung dieser Betrachtungen zu
Systemen mit N Teilchen ist offensichtlich.
5.2.3
Unschärferelation
Wie wir gesehen haben, vertauschen Ortsoperatoren untereinander, und das Gleiche gilt
auch für Impulsoperatoren. Dies kann jedoch nicht für beliebige Kombinationen von Ortsund Impulsoperatoren gültig sein. Wenn wir die kte Koordinate des jten Teilchens mit
xj k und die k 0 te Impulskomponente des j 0 ten Teilchens mit pj 0 k0 bezeichnen, erhalten wir
∂χ(x1 , . . . , xN )
~
,
(b
xj k pbj 0 k0 χ)(x1 , . . . , xN ) = xj k
i
∂xj 0 k0
~ ∂xj k χ(x1 , . . . , xN )
(b
pj 0 k 0 x
bj k χ)(x1 , . . . , xN ) =
,
i
∂xj 0 k0
~
∂χ(x1 , . . . , xN ) ~
= xj k
+ δj j 0 δk k0 χ(x1 , . . . , xN )
i
∂xj 0 k0
i
(5.72)
(5.73)
und darum
([b
xj k pbj 0 k0 − pbj 0 k0 x
bj k ]χ)(x1 , . . . , xN ) = i~δj j 0 δk k0 χ(x1 , . . . , xN ).
(5.74)
Da χ(x1 , . . . , xN ) eine beliebige Wellenfunktion ist, gilt somit
[b
xj k , x
bj 0 k0 ] = [b
pj k , pbj 0 k0 ] = 0,
[b
xj k , pbj 0 k0 ] = i~δj j 0 δk k0 .
(5.75)
Somit sehen wir in Übereinstimmung mit dem Heisenberg’schen Unschärfeprinzip, dass
eine Ortskoordinate niemals mit dem zu ihr kanonisch konjugierten Impuls kompatibel
sein kann.
5.2.4
Allgemeinere Observablen
Nun müssen wir über die analytische Form von Operatoren nachdenken, die allgemeineren
Observablen entsprechen. In der Klassischen Mechanik wird eine dynamische Variable
für ein System von N Teilchen immer durch eine Funktion der kanonischen Variablen
dargestellt, F = F (x1 , y1 , z1 , . . . , pN x , pN y , pN z ). Dies legt nahe, dass eine gleichartige
Konstruktion in der Quantenmechanik auftritt. Daher formulieren wir das fünfte Postulat.
68
• Postulat 5:
Die den Observablen eines Systems von N Teilchen entsprechenden Operatoren
sind von der Form
Fb = F (b
x1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z ),
(5.76)
d.h. sie sind Funktionen der fundamentalen Operatoren
x
b1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z .
(5.77)
Wir merken zunächst an, dass wir Ausdrücken vom Typ F (b
x1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z )
durch die Substitution
x1 → x
b1 , y1 → yb1 , . . . , pN z → pbN z
(5.78)
eine Bedeutung geben können, falls die Funktion F (x1 , y1 , z1 , . . . , pN x , pN y , pN z ) in einer
Potenzreihe entwickelt werden kann. Aber im Gegensatz zu den Verhältnissen für kompatible Operatoren führt die Substitution, Glg. (5.78), nicht zu einer eindeutigen Form,
da die verschiedenen Terme der Potenzreihe aus im Allgemeinen nicht kommutierenden
Operatoren bestehen, für welche die Reihenfolge daher relevant ist. Darüber hinaus ist,
falls wir keine angemessene Vorschrift für die Ordnung der nicht kommutierenden Operatoren verwenden, der für Fb erhaltene Operator nicht hermitesch. Um einen hermiteschen
Operator zu erhalten ist es wesentlich, jeden einzelnen Term der Potenzreihe in geeigneter
Art und Weise zu symmetrisieren. Beispielsweise37 könnten wir
X
Fb =
am n (b
xm pbn )sym
(5.79)
m,n
schreiben, wobei wir mit der Notation (. . .)sym beispielsweise
(b
xpb)sym =
1
(b
xpb + pbx
b)
2
(5.80)
meinen. Man sieht durch explizite Rechnung leicht, dass
(b
xpb)sym † =
1
1
1 † †
(b
xpb + pbx
b) † =
pb x
b +x
b† pb† = (b
px
b+x
bpb) = (b
xpb)sym .
2
2
2
(5.81)
Da derartige Symmetrisierungsvorschriften für komplizierte Operatoren zu länglichen
Ausdrücken ohne signifikanten Lerneffekt für Sie führen, werden wir darauf im Folgenden
nicht weiter eingehen.
Nun betrachten wir die Beziehung zwischen einer quantenmechanischen Observablen F
mit dem zugehörigen Operator Fb und der Klassischen Bewegungsgröße F , auf deren
Grundlage der Operator Fb definiert ist.
37
Es existieren keine zwangsläufigen allgemeinen Vorschriften zur Symmetrisierung. Daher ist die
Zuordnung ausgehend von einer Klassischen Bewegungsgröße zu einem bestimmten quantenmechanischen
Operator nicht eindeutig. Der Umkehrschluss gilt jedoch, so dass die Zuordnung ausgehend von einem
quantenmechanischen Operator zu einer Klassischen Bewegungsgröße eindeutig ist (sofern möglich).
69
Wenn wir den Zustandsvektor ψ(t) des gegebenen Quantensystems zur Zeit t betrachten,
sind hb
x1 it , . . . , hb
pN z it sowie h∆b
x1 it , . . . , h∆b
pN z it die Erwartungswerte und Standardabweichungen der fundamentalen Observablen bezüglich des Zustands ψ(t). Falls die Standardabweichungen h∆b
x1 it , . . . , h∆b
pN z it auf der Skala der Beobachtung vernachlässigbar
klein sind und falls die Klassische Größe F (x1 , . . . , pN z ) nur unwesentlich bei Schwankungen der x1 , . . . , pN z von der Ordnung h∆b
x1 it , . . . , h∆b
pN z it um die Werte hb
x1 it , . . . , hb
pN z it
fluktuiert, ist die dem Operator Fb zugeordnete quantenmechanische Observable praktisch
identisch zu F (hb
x1 it , . . . , hb
pN z it ). Wir werden dies in einer Übung zeigen. In diesem
Grenzfall kann die dem Operator Fb zugeordnete Observable mit der Klassischen Größe
F (x1 , . . . , pN z ) identifiziert werden. Es gibt jedoch auch quantenmechanische Observable,
die keine klassischen Analoga besitzen, wie beispielsweise der Spin eines Teilchens. Außerdem können a priori mehrere verschiedene quantenmechanische Größen der gleichen
Klassischen Größe entsprechen.
Wir wollen nun den Drehimpuls als ein konkretes Beispiel einer solchen allgemeineren
Observablen betrachten. Klassisch ist diese Größe durch
L = x × p = ijk xi pj êk
(5.82)
oder äquivalent
Lx = ypz − zpy ,
Ly = zpx − xpz ,
Lz = xpy − ypx
(5.83)
definiert. In diesem Fall bestehen keinerlei Probleme mit der Ordnung in der Substitution in Glg. (5.78). Die Lx , Ly und Lz entsprechenden Quantenoperatoren sind eindeutig
definiert und sie sind durch
~
∂
∂
b
−z
y
,
(5.84)
Lx = ybpbz − zbpby =
i
∂z
∂y
~
∂
∂
by = zbpbx − x
L
bpbz =
−x
z
,
(5.85)
i
∂x
∂z
∂
∂
~
bz = x
x
−y
(5.86)
L
bpby − ybpbx =
i
∂y
∂x
gegeben. Wir bezeichnen diese hermiteschen Operatoren als die Komponenten des Drehimpulsoperators und nennen die zugeordnete Observable den quantenmechanischen oder
quantisierten Drehimpuls. Wir bemerken hier, dass die Komponenten des Drehimpulsoperators nicht miteinander vertauschen,
bx , L
by ] 6= 0,
[L
by , L
bz ] 6= 0,
[L
bz , L
bx ] 6= 0.
[L
(5.87)
bx , L
by und L
bz –
Daher sind die Komponenten des quantenmechanischen Drehimpulses – L
keine kompatiblen Observablen und es ist nicht möglich dem Vektor L in der Quantenmechanik einen wohldefinierten Wert zuzuweisen.
Wir betrachten nun die Klassische Hamiltonfunktion eines Systems von N Teilchen,
N
X
p2j
H(x1 , . . . , pN ) =
+ V (x1 , . . . , xN ).
2mj
j=1
70
(5.88)
b lautet
Der zugehörige Hamiltonoperator H
b = H(b
H
x1 , . . . , pbN ) =
N
X
pb2j
bN )
+ V (b
x1 , . . . , x
2m
j
j=1
(5.89)
bzw. explizit in Ortsdarstellung
b =−
H
N
X
~2
∆x + V (x1 , . . . , xN ).
2mj j
j=1
(5.90)
Dieser Operator stimmt mit jenem in Glg. (5.7) als Verallgemeinerung von Glg. (5.1) auf
N -Teilchensysteme definierten Operator überein. Wir führen nun das sechste Postulat ein.
• Postulat 6:
Für ein System von N Teilchen ist der Operator, der in der Schrödingergleichung,
vgl. Glg. (5.7), auftritt, von der Form von Glg. (5.89).
Die Form des Potentials V (x1 , . . . , xN ) kann in manchen Fällen wie beispielsweise für
elektrostatische Kräfte mit dem entsprechenden Klassischen Potential identifiziert werden.
In anderen Fällen, wie beispielsweise für Kernkräfte, muss das Potential direkt aus den
Daten erhalten werden. In den häufigsten Fällen liegt eine Zweikörper-Wechselwirkung
vor und das Potential ist von der Form
V (x1 , . . . , xN ) =
N
X
Vj (xj ) +
j=1
X
Vi j (|xi − xj |),
(5.91)
i<j
wobei der Term Vj (xj ) die Wirkung äußerer Kräfte auf das jte Teilchen darstellt, während
der Beitrag Vi j (|xi − xj |) die Wechselwirkungsenergie zwischen den Teilchen i und j beschreibt (diese Energie sollte unter Rotationen und Translationen invariant sein). Somit
kann der Hamiltonoperator eines Atoms mit Z Elektronen (und Kernladungszahl Z) als
Z
Z
X
X
X
pb2j
Ze2
e2
pb20
b
+
−
+
H=
2M0 j=1 2me j=1 |x0 − xj | i<j |xi − xj |
(5.92)
geschrieben werden, wobei sich der Index 0 auf den Atomkern und die übrigen Indizes
i, j = 1, 2, . . . , Z auf die Elektronen beziehen.
5.3
Kommutatoren und Unbestimmtheitsrelationen
Der Ausdruck
b B]
b =A
bB
b−B
b A,
b
[A,
(5.93)
der bereits in Glg. (5.31) eingeführt wurde, wird als Kommutator bezeichnet. Der Kommutator besitzt die folgenden wesentlichen Eigenschaften,
b =0,
[c, A]
(5.94)
71
b B]
b = − [B,
b A],
b
[A,
b B]
b =c[A,
b B],
b
[cA,
(5.95)
(5.96)
b + B,
b C]
b =[A,
b C]
b + [B,
b C],
b
[A
bB,
b C]
b =A[
b B,
b C]
b + [A,
b C]
b B,
b
[A
b B],
b C]
b + [[B,
b C],
b A]
b + [[C,
b A],
b B],
b
0 =[[A,
(5.97)
(5.98)
(5.99)
die Sie in Übungsaufgabe 5.4 untersucht haben. Glg. (5.99) ist als Jacobi Identität bekannt.
Wir betrachten nun ein System von N Teilchen und schreiben die Kommutatoren von
Glg. (5.75) erneut,
[b
xj k , x
bj 0 k0 ] = [b
pj k , pbj 0 k0 ] = 0,
[b
xj k , pbj 0 k0 ] = i~δj j 0 δk k0 .
(5.100)
Diese Gleichungen stimmen bis auf den Faktor i~ mit den Ausdrücken für Poissonklammern38 überein, wie sie für die entsprechenden Klassischen Observablen auftreten. Insbesondere gibt es eine Korrespondenz
i b b
{A, B} → − [A,
B],
~
(5.102)
b und B
b quantenmechanische Operatoren
wobei A und B Klassische Variablen sind und A
zu den entsprechenden quantenmechanischen Observablen.
Wenn wir den Drehimpulsoperator eines einzelnen Teilchens betrachten, finden wir unter
Verwendung der Eigenschaften des Kommutators
bx , L
by ] =[b
[L
y pbz − zbpby , zbpbx − x
bpbz ] = [b
y pbz , zbpbx ] + [b
z pby , x
bpbz ]
bz
=b
y [b
pz , zb]b
px + x
b[b
z , pbz ]b
py = −i~b
y pbx + i~b
xpby = i~L
(5.103)
bx , L
by ] = i~L
bz
[L
(5.104)
bi , L
bj ] = i~ijk L
bk .
[L
(5.105)
[b
xn , pbx ] = i~nb
xn−1
(5.106)
und daher
bzw. im Allgemeinen
Wir können ebenso
erhalten, was sich mit Leichtigkeit (durch vollständige Induktion) zeigen lässt:
[b
xn , pbx ] =[b
xx
bn−1 , pbx ] = [b
x, pbx ]b
xn−1 + x
b[b
xn−1 , pbx ]
=i~b
xn−1 + x
bi~(n − 1)b
xn−2 = i~nb
xn−1 .
(5.107)
Damit finden wir Kommutatoren für Funktionen der Operatoren,
38
Die Poissonklammer ist für ein System mit M Freiheitsgraden durch
M X
∂A ∂B
∂B ∂A
{A, B} =
−
∂xi ∂pi
∂xi ∂pi
i=1
gegeben.
72
(5.101)
∂F (b
x, yb, zb)
,
∂x
∂G(b
px , pby , pbz )
[b
x, G(b
px , pby , pbz )] =i~
,
∂px
[F (b
x, yb, zb), pbx ] =i~
(5.108)
(5.109)
indem wir diese in Potenzreihen entwickeln. Die Verallgemeinerung dieser Gleichungen zu
anderen Komponenten ist offensichtlich.
Wie wir bereits gesehen haben, gilt für zwei kompatible Observablen A und B, dass die
entsprechenden Operatoren kommutieren,
b B]
b = 0.
[A,
(5.110)
Falls die Observablen inkompatibel sind, gilt stattdessen
b B]
b 6= 0.
[A,
(5.111)
In einem solchen Fall gilt außerdem
D
E
D
E
b b
b h∆Bi
b ≥ 1
[
A,
B]ψ(t)
ψ(t)
∆A
,
t
2
t
t
(5.112)
wobei ψ(t) ein beliebiger Zustandsvektor ist. Sie werden diese Identität auf Übungsblatt 7 überprüfen. Wenn wir A mit einer kartesischen Koordinate des Teilchens und
B mit der entsprechenden Impulskomponente identifizieren, ergibt Glg. (5.112) die Heisenberg’sche Unschärferelation als Konsequenz des Heisenberg Kommutators [b
x, pbx ] = i~,
vgl. Glg. (5.75). Man erhält daher
h∆b
xit h∆b
pit ≥
~
.
2
(5.113)
Glg. (5.112) stellt eine Verallgemeinerung der Heisenberg’schen Unbestimmtheitsregeln
dar, vgl. Glg. (3.43). Für das Beispiel des Drehimpulses, vgl. Glg. (5.104), erhalten wir
D
E D
E
~ Db E
b
b
Lz .
(5.114)
∆Lx
∆Ly ≥
2
t
t
t
Sie werden auf Übungsblatt 7 zeigen, dass man einen Zustandsvektor konstruieren kann,
für den die Unbestimmtheit minimal ist. Für den Fall eines freien Teilchens in einer
Dimension entspricht dieser Zustand dem Gauß’schen Wellenpaket.
5.4
Zeitabhängigkeit des Mittelwerts einer Observablen und
Ehrenfest’sches Theorem
Für eine allgemeine Observable F können wir den Erwartungswert konstruieren,
D
E
D E
b
F = ψ(t) Fbψ(t) ,
(5.115)
t
welcher zu einer gegebenen Lösung ψ(t) der Schrödingergleichung gehört. Dann gilt
*
+
d hF it
∂ Fb
i b b
=
− [F , H] .
(5.116)
dt
∂t
~
t
73
Glg. (5.116) kann unmittelbar aus Glg. (5.115) erhalten werden, indem man deren Zeitableitung bildet, die Schrödingergleichung verwendet und die Hermitezität des Hamiltonoperators verwendet:
*
+ ∂ Fb
E
dψ(t)
dψ(t) b
d D
b
b
ψ(t) F ψ(t) = ψ(t) ψ(t) +
F ψ(t) + ψ(t) F
∂t
dt
dt dt
*
+
∂ Fb
i b
i b
b
b
=
+ − Hψ(t) F ψ(t) + ψ(t) F (− H)ψ(t)
∂t
~
~
+t
*
+
*
E
iD
∂ Fb
i b b
∂ Fb
b b
−
ψ(t) [F , H]ψ(t) =
− [F , H] . (5.117)
=
∂t
~
∂t
~
t
t
Dabei wurde in Glg. (5.116) eine explizite Zeitabhängigkeit des Operators Fb mitberücksichtigt. Wir bemerken, dass Glg. (5.116) analog zur Klassischen Beziehung
dF
∂F
=
+ {F, H}
dt
∂t
(5.118)
ist (hierbei ist {., .} die Poissonklammer).
Wir wollen nun ein System von N Teilchen betrachten, deren Hamiltonoperator durch
Glg. (5.89) gegeben ist. Ausgehend von Glg. (5.116) sowie Glgn. (5.108) and (5.109) erhalten wir
E
X [b
xj , pb2j 0 ] t
bj
∂x
i
d
iD
b
hb
xj it =
[b
xj , H]
=0−
−
dt
∂t t ~
~ j0
2mj
t
2 hpbj 0 it
i X
1
δj j 0
= − i~
=
hpbj it ,
~
2m
m
j
j
0
j
*
+
E
b
iD
∂ pbj
i
~
∂
H
d
b
−
hpbj it =
[pbj , H]
=0−
dt
∂t t ~
~ i ∂xj
t
t
bN )
∂V (b
x1 , . . . , x
=−
.
∂xj
t
(5.119)
(5.120)
Diese Gleichungen werden als das Ehrenfest’sche Theorem39 bezeichnet. Falls die Unbestimmtheit von Ort und Impuls des Teilchens hinreichned klein (bezüglich der Beobachtungsskala) sind und die Ableitungen des Potentials langsam mit dessen Argumenten
variieren, können wir
∂V (hx1 it , . . . , hxN it )
∂V (x1 , . . . , xN )
'
(5.121)
∂xj
∂ hxj it
t
schreiben. Dann kann Glg. (5.120) mit den Klassischen Hamilton’schen Gleichungen identifiziert werden. Wir werden ein Anwendungsbeispiel dieses Theorems auf Übungsblatt 8
sehen.
39
In der Literatur ist die Bezeichnung Ehrenfest’sches Theorem auch für Glg. (5.116) gebräuchlich.
74
5.5
Konstanten der Bewegung
In der Klassischen Mechanik haben wir Konstanten der Bewegung als jene dynamischen
Variablen F (q, p, t) definiert (wobei wir mit q und p die die verschiedenen Orts- und Impulsvariablen zusammenfassen), deren Werte sich mit der Zeitentwicklung des Systems
nicht ändern, d.h. d/dtF (q(t), p(t), t) = 0 für jegliche Lösungen der Hamilton’schen Gleichungen. Da man in der QM nicht zu jedem Zeitpunkt einer beliebigen Größe einen
wohldefinierten Wert zuweisen kann, muss diese Definition modifiziert werden. In der
QM definieren wir eine Konstante der Bewegung als eine Größe, deren Erwartungswert
für jede beliebige Lösung ψ(t) der Schrödingergleichung zeitunabhängig ist:
E
d D
d D bE
ψ(t) Fbψ(t) = 0.
F =
dt
dt
t
(5.122)
Dann folgt aufgrund von Glg. (5.116) als notwendige und hinreichende Bedingung, dass
F eine Konstante der Bewegung ist, dass
∂ Fb
i
b =0
− [Fb, H]
∂t
~
(5.123)
erfüllt ist.
b
Tatsächlich ist eine hinreichende und notwendige Bedingung, dass hψ(t)|Aψ(t)i
= 0 mit
†
b=A
b erfüllt ist, dass A
b = 0 ist. Daher gilt, falls F nicht explizit zeitabhängig ist, und
A
b =0
[Fb, H]
(5.124)
gilt, dass F eine Konstante der Bewegung ist, falls der entsprechende Operator Fb mit dem
b kommutiert. Das erste Beispiel einer Konstanten der Bewegung ist
Hamiltonoperator H
die Energie eines Systems, dessen Hamiltonoperator nicht explizit von der Zeit abhängt:
in der Tat kommutiert der Hamiltonoperator mit sich selbst. Man kann zeigen (siehe
Übungsblatt 7), dass für ein freies Teilchen die drei Komponenten des (linearen) Impulses
und des Drehimpulses Konstanten der Bewegung sind. Im Falle eines Teilchens im Zentralpotential sind die drei Komponenten des Drehimpulses Erhaltungsgrößen. Für einen
Hamiltonoperator vom Typ
b=
H
N
X
X
pb2j
bj 0 |)
+
Vj j 0 (|b
xj − x
2mj j<j 0
j=1
(5.125)
sind sowohl die drei Komponenten der linearen Gesamtimpulses,
Pb =
N
X
pbj ,
(5.126)
j=1
als auch die drei Komponenten des Gesamt-Bahndrehimpulses,
b=
L
N
X
bj × pbj ,
x
j=1
Konstanten der Bewegung.
75
(5.127)
Ein weiteres typisches Problem ist es, den maximalen Satz von kompatiblen Konstanten
der Bewegung zu finden. Diese sind Observable, welche durch Operatoren repräsentiert
werden, die untereinander und mit dem Hamiltonoperator kommutieren. Beispielsweise
gilt im Fall des Teilchens im Zentralpotential, dass die drei Komponenten des Bahndrehimpulses zwar erhalten aber nicht zueinander kompatibel sind. Man kann stattdessen als
vollständigen Satz kompatibler Erhaltungsgrößen beispielsweise die Energie, das Betragsquadrat des Drehimpulses sowie eine einzelne Komponente des Drehimpulses annehmen
(vgl. Übungsblatt 6). Mittels dieses Satzes kann man eine maximale Beobachtung des
Systems definieren.
Wir betonen, dass Glgn. (5.123) und (5.124) Konsequenzen haben, die über die Erhaltung des Mittelwerts von F hinaus gehen. Wir wollen nun annehmen, dass F nicht explizit
b eine gemeinzeitabhängig ist. Dann folgt aus Glg. (5.124), dass die Operatoren Fb und H
same ONEB beistzen,
b r s = Er φr s ,
Hφ
Fbφr s = λs φr s .
(5.128)
Eine allgemeine Lösung der Schrödingergleichung kann in der Form
ψ(t) =
X
r,s
i
cr s φr s exp [− Er t]
~
geschrieben werden und wir erhalten für das zweite Postulat
2
X
X
i
cr s exp [− Er t] =
|cr s |2 .
P (F = λs , t) =
~
r
r
(5.129)
(5.130)
Daher sehen wir, dass im Fall einer Konstanten der Bewegung, die nicht explizit zeitabhängig ist, nicht nur der Mittelwert, sondern auch die Wahrscheinlichkeitsverteilung
der Observable zeitunabhängig ist. Einige Beispiele dieser Eigenschaft haben wir bereits
gesehen, unter anderem die Wahrscheinlichkeitsverteilung der Energie für beliebige zeitunabhängige Hamiltonoperatoren sowie die Wahrscheinlichkeitsverteilung des Impulses
eines freien Teilchens. Dieses Ergebnis kann auch auf explizit zeitabhängige Konstanten
der Bewegung erweitert werden. Tatsächlich kann man folgendes Theorem zeigen. Wenn
F Glg. (5.123) erfüllt gilt:
1. Die Eigenwerte von F sind zeitunabhängig (die Eigenvektoren hängen im Allgemeinen von der Zeit ab).
2. Die Wahrscheinlichkeitsverteilung von F ist zeitunabhängig.
Schließlich bemerken wir, dass die Bestimmung der Konstanten der Bewegung wie schon in
der Klassischen Physik auch in der Quantenmechanik sehr nützlich ist, um die Eigenschaften der Lösungen der Bewegungsgleichungen (Schrödingergleichung in QM) zu untersuchen und diese Lösungen ganz konkret zu konstruieren. Insbesondere kann Glg. (5.128)
auf den Fall mehrerer zeitunabhängiger, kompatibler Konstanten der Bewegung verallgemeinert werden. Die Kenntnis des Systems dieser Konstanten der Bewegung gewährt uns
a priori Wissen bezüglich des Wesens der Energie-Eigenfunktionen.
76
5.6
Drehimpuls eines Teilchens
Wir haben gesehen, dass die drei Komponenten des Bahndrehimpulses in der QM durch
die drei Operatoren
bx = ybpbz − zbpby ,
L
by = zbpbx − x
L
bpbz ,
bz = x
L
bpby − ybpbx ,
(5.131)
oder
∂
∂
~
b
y
−z
,
Lx =
i
∂z
∂y
∂
∂
~
b
z
−x
,
Ly =
i
∂x
∂z
~
∂
∂
bz =
L
x
−y
i
∂y
∂x
(5.132)
(5.133)
(5.134)
gegeben sind. Ferner haben wir gesehen (vgl. Übungsblatt 4), dass die Vertauschungsrebx , L
by und L
bz durch
lationen zwischen L
bi , L
bj ] = i~ijk L
bk
[L
(5.135)
gegeben sind. An Glg. (5.135) sehen wir, dass die Observablen Lx , Ly und Lz nicht kompabx , L
by und L
bz (oder auch nur zwei von diesen Operatoren)
tibel sind und die Operatoren L
nicht gestatten, ein vollständiges System von gemeinsamen Eigenvektoren zu bilden. Wenn
wir das Betragsquadrat des Drehimpulses bilden,
b2 = L
b2 + L
b2 + L
b2 ,
L
x
y
z
(5.136)
b 2 mit den drei Komponenten kommutiert,
können wir (vgl. Übungsblatt 6) zeigen, dass L
b 2, L
b 2, L
b 2, L
b x ] = [L
b y ] = [L
bz ] = 0.
[L
(5.137)
b 2 und
Daher ist es möglich ein gemeinsames Orthonormalsystem von Eigenvektoren zu L
bz , zu finden. Insbesondere können wir, nach
einer der drei Drehimpulskomponenten, z.B. L
Übergang zu Kugelkoordinaten (sphärische Polarkoordinaten),
x = r cos ϕ sin ϑ,
y = r sin ϕ sin ϑ,
z = r cos ϑ,
(5.138)
herleiten, dass
~
∂
cos
ϕ
∂
bx = −
L
sin ϕ
+
,
i
∂ϑ tan ϑ ∂ϕ
~
∂
sin
ϕ
∂
by = −
L
− cos ϕ
+
,
i
∂ϑ tan ϑ ∂ϕ
bz = ~ ∂
L
i ∂ϕ
und
b2
2
L = −~
1 ∂
sin ϑ ∂ϑ
∂
1 ∂2
sin ϑ
+
∂ϑ
sin2 ϑ ∂ϕ2
gelten.
77
(5.139)
(5.140)
(5.141)
(5.142)
5.7
Parität
Bisher haben wir verschiedene Beispiele von Observablen betrachtet, die recht eindeutige
Klassische Analoga haben, beispielsweise den Ort, den (linearen) Impuls, den Drehimpuls
und die Energie. Es gibt aber auch Größen, die kein wesentliches Klassisches Analogon
besitzen. Unter diesen ist die Parität von besonderem Interesse. Wir wollen den Fall eines
einzelnen Teilchens betrachten. Der Paritätsoperator ist durch die Beziehung
Pbχ(x) = χ(−x)
(5.143)
definiert. Der Operator Pb ist hermitesch und kann einer beobachtbaren Größe zugeordnet
werden. Die Eigenwertgleichung kann als
Pbχ(x) = εχ(x)
(5.144)
geschrieben werden, was so viel heißt wie
χ(−x) = εχ(x)
(5.145)
oder (durch Ersetzung von x durch −x)
χ(x) = εχ(−x).
(5.146)
Indem wir Glg. (5.145) in Glg. (5.146) einsetzen, erhalten wir
χ(x) = ε2 χ(x),
ε2 = 1
(5.147)
und damit
ε = ±1.
(5.148)
Einerseits werden die zu ε = +1 gehörenden Eigenfunktionen durch
χ(−x) = χ(x)
(5.149)
charakterisiert, d.h. sie sind gerade Funktionen. Andererseits werden die zu ε = −1
gehörenden Eigenfunktionen durch
χ(−x) = −χ(x)
(5.150)
charakterisiert und sind daher ungerade Funktionen. Da der Paritätsoperator Pb hermitesch ist, ist das System seiner Eigenfunktionen vollständig und jeder Zustandsvektor
χ(x) kann als Summe einer geraden und einer ungeraden Funktion geschrieben werden.
Dies kann durch die Zerlegung
χ(x) =
1
1
[χ(x) + χ(−x)] + [χ(x) − χ(−x)]
2
2
(5.151)
erreicht werden. Wir bemerken, dass
Pbx
b = −b
xPb,
Pbyb = −b
y Pb, Pbzb = −b
z Pb,
Pbpbx = −b
px Pb, Pbpby = −b
py Pb, Pbpbz = −b
pz Pb
(5.152)
gilt. Aus diesen Beziehungen folgt Pbpb2 /(2m) = pb2 /2mPb. Nun können wir ein allgemeines
Potential PbV (b
x) = V (−b
x)Pb betrachten. Falls V (b
x) eine gerade Funktion ist, kommutiert
78
b und Parität ist eine Konstante der Bewegung. In diesem Fall haben H
b und
Pb mit H
Pb einen vollständigen Satz gemeinsamer Eigenfunktionen und daher ist es möglich, die
b so zu wählen, dass diese gerade oder ungerade sind. Wir werden
Eigenfunktionen von H
Beispiele hierfür sehen, wenn wir ein Teilchen im Zentralpotential betrachten.
Der Paritätsoperator kann ohne Komplikationen auf Mehrteilchensysteme erweitert werden. Für eine beliebige Wellenfunktion eines N Teilchensystems gilt
Pbχ(x1 , . . . , xN ) = χ(−x1 , . . . , −xN ),
(5.153)
für eine beliebige Mehrteilcheneigenfunktion des Paritätsoperators gilt
Pbχ(x1 , . . . , xN ) = εχ(−x1 , . . . , −xN ),
(5.154)
und der Hamiltonoperator erfüllt
b 1 , . . . , pN ) = H(−x
b
b
PbH(x
1 , . . . , −pN )P .
(5.155)
Weitere Verallgemeinerungen sind offensichtlich und werden daher Ihnen selbst überlassen.
Literaturempfehlung:
F. Schwabl
A. Messiah
S. Weinberg
Quantenmechanik, Bd. 1
Quantum Mechanics, Volume 1
Lectures on Quantum Mechanics
79
Kapitel 8
Sections 5, 8.1
Section 3
6
6.1
Anwendungen der Schrödingergleichung:
eindimensionale Probleme
Einleitung
Um ein ausreichendes Maß an praktischer Erfahrung im Umgang mit der Schrödingergleichung zu erlangen, werden wir im Folgenden die Wellenmechanik einiger eindimensionaler Systeme betrachten. Einerseits sind eindimensionale Systeme als einfache Modelle
von Interesse, da sie uns erlauben, bestimmte Eigenschaften, die auch bei komplexeren
Quantensystemen auftreten, in einem einfacheren Rahmen zu untersuchen. Andererseits
sind eindimensionale Systeme ebenfalls von Interesse, da man bei einer ganzen Reihe von
mehrdimensionalen Problemen nach Sequenzen von geeigneten Manipulationen diese Gleichungen auf den gleichen Typus wie die eindimensionale Schrödingergleichung reduzieren
kann.
Wir wollen ein Teilchen der Masse m betrachten, welches auf Bewegung entlang der x
Achse innerhalb eines Potenzials V (x) beschränkt ist. Die zugehörige Schrödingergleichung
lautet
~2 ∂ 2
∂
+ V (x) ψ(x, t).
(6.1)
i~ ψ(x, t) = −
∂t
2m ∂x2
Wir interessieren uns insbesondere für die Suche nach den stationären Zuständen, cf. Abschnitt 4.5. Falls E die Energie eines stationären Zustands ist, kann die Zeitabhängigkeit
separiert werden,
i
ψ(x, t) = φ(x)e− ~ Et ,
(6.2)
und die Funktion φ(x) ist eine Lösung der zeitunabhängigen Schrödingergleichung
~2 ∂ 2
−
+ V (x) φ(x) = Eφ(x).
(6.3)
2m ∂x2
Innerhalb dieses Abschnitts werden wir die Notation
V (x) =
~2
~2
U (x), E =
ε
2m
2m
(6.4)
verwenden, die uns erlaubt, die vorige Gleichung als
φ00 (x) + [ε − U (x)]φ(x) = 0
(6.5)
zu schreiben. Glg. (6.5) ist eine Differenzialgleichung vom Sturm-Liouville Typ, für die
wir Lösungen finden wollen, welche endlich, stetig und im gesamten Intervall (−∞, +∞)
differenzierbar sind.
Falls solch eine Lösung existiert, sind alle Vielfachen dieser Lösung ebenso Lösungen.
Wir werden keine zwei Lösungen als verschieden betrachten, sofern sie sich nur um einen
konstanten multiplikativen Faktor unterscheiden. Falls zwei linear unabhängige Lösungen
(zum gleichen Eigenwert ε) akzeptable Lösungen sind, ist ebenso jedwede Linearkombination der beiden eine Lösung. Ein solcher Eigenwert wird als entartet bezeichnet. Der
Entartungsgrad ist als die Anzahl der linear unabhängigen Eigenfunktionen zum gleichen
Eigenwert definiert.
80
Glg. (6.5) ist reell (sofern U (x) eine reelle Funktion von x ist). Falls φ(x) eine Eigenfunktion ist, gilt in diesem Fall, dass auch deren Real- und Imaginärteil Eigenfunktionen sind
(die beiden sind notwendigerweise Vielfache voneinander, falls die Eigenfunktion nicht
entartet ist). Daher ist es ausreichend, die reellen Eigenfunktionen zu bestimmen, um alle
Eigenfunktionen zu einem bestimmten Eigenwert konstruieren zu können. Dieser Umstand
vereinfacht die Rechnungen deutlich.
6.2
Freies Teilchen
Wir wollen zunächst den Fall eines freien Teilchens betrachten, für das V (x) = 0 gilt.
Dann lautet die Schrödingergleichung (ε = 2mE/~2 wie in Glg. (6.4) definiert)
φ00 (x) + εφ(x) = 0.
(6.6)
Wir haben diesen Fall bereits auf Übungsblatt 5 betrachtet und gelöst. Die Glg. (6.6) hat
zwei linear unabhängige Lösungen,
√ √ φE− (x) = B exp −i εx .
(6.7)
φE+ (x) = A exp +i εx ,
Für E < 0 (daher auch ε < 0) divergieren beide Lösungen exponentiell – die erste (φE+ (x))
für x → −∞ und die zweite (φE− (x)) für x → +∞ und können daher weder eigentliche
b keine Punkte
noch uneigentliche Eigenfunktionen sein. Daher gibt es im Spektrum von H
auf der negativen reellen Achse. Für E > 0 ist es praktisch
r
r
p
√
2mE
2m p2
=
±~
=
±
p2
(6.8)
p = ±~ ε = ±~
~2
~2 2m
zu definieren und φE+ (x) sowie φE− (x) können zusammen als
i
ϕp (x) = Ap exp
px ,
~
(6.9)
wobei −∞ < p < +∞ ist. Die Funktion ϕp (x) gehört nicht zu L2 (R) und stellt für jedes
p ∈ (−∞, +∞) eine uneigentliche Eigenfunktion des Impulsoperators dar. Das Spektrum
b ist rein kontinuierlich und stimmt mit dem Intervall 0 < E < +∞ überein. Es ist
von H
leicht zu sehen, dass die Energieeigenwerte zweifach entartet sind, d.h. dass es zwei Werte
+p und −p für jeden Wert E gibt.
Eine normierte Eigenfunktion ist durch
1
exp
ϕp (x) = √
2π~
i
px
~
(6.10)
definiert. Wir bestätigen dafür die Orthonormalitätsrelation (vgl. Übung 4.2):
0 p−p
Z+l
i 0
i
1 sin ~ l
1
hϕp0 | ϕp i =
lim dx exp − p x exp
px = lim
= δ(p − p0 ).
l→∞ π
2π~ l→∞
~
~
p − p0
−l
(6.11)
81
Wie wir bereits in den Abschnitten 3.3 und 4.6 gesehen haben, ist die allgemeine Lösung
der Schrödingergleichung in Glg. (6.6) ein Wellenpaket,
1
ψ(x, t) = √
2π~
Z+∞
i
~2 ε
dp c(p) exp
px −
t ,
~
2m
(6.12)
−∞
dessen Koeffizienten c(p) durch die Anfangsbedingung
ψ(x, 0) = ψ0 (x)
(6.13)
so bestimmt werden, dass für c(p)
1
c(p) = hϕp | ψ0 i = √
2π~
Z+∞
i
dx exp − px ψ0 (x)
~
(6.14)
−∞
gilt. In Übung 3.2 haben wir bereits Glg. (6.12) mit der Gauß’schen Anfangsbedingung
2
r
a
a
i
2
ψ0 (x) = √ exp − (x − x0 ) + p0 (x − x0 )
(6.15)
2
~
π
betrachtet. Wir haben für das Gauß’sche Wellenpaket die Varianz zur Anfangszeit,
v
v
u Z+∞
u
Z+∞
u
u
a
u
u
2
h∆b
xi0 = t dx (x − x0 )2 |ψ0 (x)| = t √
dx (x − x0 )2 exp [−a2 (x − x0 )2 ]
π
−∞
−∞
v
u
Z+∞
u
1
∂
u 1
dx exp [−a2 (x − x0 )2 ] = √ ,
= t √ (− )
2 π ∂a
a 2
(6.16)
−∞
und den Koeffizienten c(p),
s
c(p) =
1
i
1
2
√ exp − 2 2 (p − p0 ) − px0 ,
2~ a
~
~a π
(6.17)
berechnet. Wir haben den Mittelwert von x zur Zeit t bestimmt, hb
xit = x0 + (p0 /m) t,
und die Varianz des Orts h∆b
xit zur gegebenen Zeit t,
v
u Z+∞
r
u
1
~ 2 a4
u
2
h∆b
xit = t dx (x − hb
xit )2 |ψ(x, t)| = √
1 + 2 t2
(6.18)
m
a 2
−∞
berechnet. Wir haben auch die Varianz des Impulses berechnet,
v
u Z+∞
u
a~
u
h∆b
pit = t dp (p − p0 )2 |ψ(x, t)|2 = √
2
−∞
82
(6.19)
und die Beziehung
~
h∆b
xit h∆b
pit =
2
bewiesen, so dass in der Tat
r
1+
~2 a4 2 ~
t ≥
m2
2
(6.20)
~
(6.21)
2
gilt. Wir haben ebenso in einer anderen Übungsaufgabe gezeigt, dass das Gleichheitszeichen in Glg. (6.21) nur dann gilt, falls das Wellenpaket zur Zeit t von der Form Glg. (6.15)
ist, d.h. Gauß’sch ist. Daher haben Gauß’sche Wellenpakete minimale Unschärfe. In der
Tat gilt exakt
~
h∆b
xi0 h∆b
pi0 = ,
(6.22)
2
da ψ0 (x) ein Gauß’sches Wellenpaket ist.
h∆b
xit h∆b
pit ≥
Schließlich bemerken wir, dass das Teilchen als Klassisches Teilchen beschrieben werden
kann, falls unter den gegebenen experimentellen Bedingungen h∆xit klein gegenüber der
Genauigkeit der Ortsmessung ist. Insbesondere muss h∆xit klein bleiben im Vergleich zu
der Distanz, die das Teilchen zurücklegt, d.h. es sollte
h∆b
xit p0
t
m
(6.23)
gelten. Unter Verwendung der Varianz bzw. von h∆b
xit finden wir für große Werte von t
s
2
h∆b
pit
pit
t→∞ h∆b
2
t2 →
h∆b
xit = h∆b
xi0 +
t.
(6.24)
m
m
Darum ist Glg. (6.23) äquivalent zu h∆b
pit p0 und es gilt
h∆b
xi t ≥
1
1 ~
1~
=
λde Broglie .
2 h∆b
pit
2 p 0 4π
(6.25)
Wir sehen daher, dass die Bedingung für die Klassische Beschreibung eines Teilchens ist,
dass die Genauigkeit von dessen Ortsmessung deutlich geringer ist als dessen de Broglie
Wellenlänge λde Broglie .
6.3
6.3.1
Potentialtopf
Allgemeine Bemerkungen
Damit typische Quanteneffekte auftreten können, muss das Potential auf Distanzen von
der Größenordnung der Wellenlänge eine ausreichend starke relative Veränderung zeigen.
Der einfachste Typ von Potential, das diese Bedingungen erfüllt, ist das Kastenpotential: dieses Potential besitzt Diskontinuitäten erster Art (d.h. endliche Sprungstellen) an
bestimmten Punkten und ist überall sonst konstant. Die Existenz von Diskontinuitäten
der ersten Art im Potential U (x) ändert die an φ(x) gestellten Regularitätsbedingungen
nicht. In der Tat gilt, aufgrund der Schrödingergleichung,
φ00 (x) = (U (x) − ε)φ(x),
83
(6.26)
dass bei jeder Diskontinuität des Potentials U (x) die zweite Ableitung der Wellenfunktion,
φ00 (x), einen Sprung um einen endlichen Wert haben muss, aber das Integral von φ00 (x) an
diesen Punkten kontinuierlich bleibt: daher sind φ0 (x) und erst recht φ(x) überall stetige
Funktionen.
Nun wollen wir annehmen, Ui sei der konstante Wert von U (x) im iten Intervall (i =
1, 2, . . . , n). Die allgemeine Lösung in dieser Region ist eine Linearkombination von Exponentialfunktionen, und ihr Verhalten ist tatsächlich sehr unterschiedlich, je nachdem, ob
ε−Ui positiv oder negativ ist. Einerseits gilt für ε > Ui , dass es sich um eine Kombination
von komplexen Exponentialfunktionen handelt,
p
(6.27)
eiki x
und
e−iki x
(ki = ε − Ui ),
oder – in einer anderen Darstellung – um eine Kombination von Sinus- und Cosinusfunktionen: diese Lösung besitzt ein oszillatorisches Verhalten. Andererseits gilt für ε < Ui ,
dass es sich um eine Kombination von reellen Exponentialfunktionen handelt,
p
(6.28)
e+κi x
und
e−κi x
(κi = Ui − ε).
In diesem Fall sagen wir, dass die Lösung exponentielles Verhalten besitzt.
Um eine allgemeine Lösung der DGL zu erhalten, schreibt man diese in Form einer Linearkombination von (komplexen oder reellen) Exponentialfunktionen für jedes einzelne der
n Intervalle in denen das Potential konstant ist. Die Parameter dieser Kombinationen (2n
Parameter) werden durch Stetigkeitsbedingungen an die Funktion und an deren (erste)
Ableitung fixiert. Diese Prozedur liefert 2(n − 1) Bedingungen, da n − 1 Diskontinuitäten
vorliegen. Daher besitzt die derart erhaltene allgemeine Lösung zwei freie Parameter, wie
zu erwarten war. Die Lösung muss, um eine geeignete Eigenfunktion zu sein, überall begrenzt sein, d.h. für die Grenzfälle x → ±∞ beschränkt sein. Wir merken an, dass, falls die
Energie kleiner als das Potential über das gesamte Intervall (∞, +∞) ist, die allgemeine
Lösung überall exponentielles Verhalten zeigen muss, und die zweite Ableitung immer das
gleiche Vorzeichen wie die Funktion selbst hat. Daher kann man schließen, dass eine solche
Funktion bei einem oder auch beiden Grenzfällen x → ±∞ exponentiell anwächst. Daher
hat das Eigenwertproblem in diesem Fall keine Lösung. Ebenso ist in der Klassischen
Mechanik keine Bewegung möglich, wenn die Energie das Potential nicht in irgendeinem
Teil des Intervalls überschreitet.
Wenn ε zumindest eine der Größen Ui überschreitet, hängt die Existenz und Anzahl
der Eigenfunktionen wesentlich vom exponentiellen oder oszillatorischen Verhalten der
allgemeinen Lösung an den zwei Extremwerten der x Achse (±∞) ab.
6.3.2
Unendlich tiefer Potentialtopf
Wir beginnen die konkreten Betrachtungen mit einem unendlich tiefen Potentialtopf, dargestellt durch ein Potential V (x), vgl. Abb. D.23, so dass
0 für x ∈ [0, L]
.
(6.29)
V (x) =
∞
sonst
Dies bedeutet, dass das Teilchen auf eine bestimmte Region zwischen x = 0 und x = L
beschränkt ist. Innerhalb dieser erlaubten Region kann es sich zwar frei bewegen, aber
84
diese kann nicht verlassen werden. Daher muss die Wellenfunktion außerhalb der erlaubten
Region verschwinden,
φ(x) = 0 für x 6∈ [0, L].
(6.30)
Aufgrund der Stetigkeit der Wellenfunktion muss diese an den Randpunkten des erlaubten
Intervalls verschwinden,
φ(0) = φ(L) = 0.
(6.31)
Die einzige Region, in der das Teilchen sein kann, ist innerhalb des Potentialtopfs, wo es
sich wie ein freies Teilchen verhält, d.h. es spürt keinerlei Potential. Daher müssen wir die
zeitunabhängige Schrödingergleichung,
φ00 (x) = −εφ(x)
(6.32)
mit den Randbedingungen von Glg. (6.31) lösen. Unter Verwendung der Abkürzung
k=
√
ε=
1√
2mE
~
(6.33)
vgl. Glg. (6.27), schreiben wir als allgemeine Lösung dieser Gleichung
φ(x) = a sin(kx) + b cos(kx).
(6.34)
Hierbei sind a und b zwei Konstanten, die durch die Randbedingungen bestimmt werden.
Ausgehend von der Randbedingung φ(0) = 0 gilt
0 = φ(0) = a sin(0) + b cos(0) = b
⇒
b=0
(6.35)
und ausgehend von der Randbedingung φ(L) = 0 gilt
0 = φ(L) = a sin(kL)
⇒
kL = nπ
⇔
k=
nπ
,
L
(6.36)
wobei n = 1, 2, 3, . . . eine beliebige natürliche Zahl ist. Durch Einsetzen der Randbedingung in Glg. (6.33) finden wir die Quantisierung der Energieniveaus. Wenn wir die
verschiedenen Energieniveaus mit n indizieren, finden wir
nπ 2
εn =
L
bzw. En =
n2 π 2 ~2
.
2mL2
(6.37)
Schließlich bestimmen wir die Konstante a aus der Normierungsbedingung der Wellenfunktion,
!
ZL
2
2
ZL
dx |φ(x)| = |a|
1=
0
x
L
sin2 nπ
= |a|2
L
2
⇒
|a|2 =
2
.
L
(6.38)
0
Daher sind die Bindungszustände des unendlich tiefen Potentialtopfs durch
r
nπ 2
φn (x) =
sin
x
L
L
(6.39)
gegeben, und diese stellen eine ONEB dar. Den niedrigsten Bindungszustand, n = 1,
bezeichnen wir als den Grundzustand, die Zustände zu n > 1 als angeregte Zustände.
85
6.4
Endlicher Potenialtopf
Wir betrachten nun ein ähnliches Problem wie im vorigen Abschnitt, aber mit der Änderung, dass die Wände des Potentialtopfs nicht mehr unendlich hoch sind, d.h. ein Potential
wie in Abb. D.27.
In der Klassischen Mechanik ist ein Teilchen der Energie E 40 mit −V0 < E < 0 in
diesem Potentialtopf eingeschlossen
und kann
p diesen nicht verlassen. Sein Impuls in diesem
√
Bindungszustand ist p = ± 2mEkin = ± 2m(V0 + E). Für größere Energien, d.h. E >
0 kann sich das Teilchen
zunächst außerhalb des Potentialtops befinden und hat einen
√
eindringt, wächst
Impuls von p = ± p2mE. Wenn das Teilchen in den Potentialtopf
√
dessen Impuls auf ± 2m(V0 + E) an und fällt wieder zu p = ± 2mE ab, wenn es den
Potentialtopf verlässt. Eine Klassische Lösung zu E < −V0 existiert nicht.
b im Bereich (−∞, −V0 )
In der QM gibt es ebenso keinerlei Punkte im Spektrum von H
in Übereinstimmung mit der Klassischen Erwartung. Im Intervall (−V0 , 0) findet man bei
diskreten Energien nur eine endliche Zahl eigentlicher Eigenwerte, deren Eigenfunktionen
außerhalb des Klassisch erlaubten Bereichs rasch zu Null abfallen. Schließlich gibt es im
Intervall (0, +∞) das kontinuierliche Spektrum, dass aufgrund der Symmetrie zweifach
entartet ist (beide Vorzeichen des Impulses). Dass die Energie dabei jeden möglichen
Wert annehmen kann, spiegelt die offensichtliche Tatsache wider, dass ein Experimentator
die Energie bzw. den Impuls eines eingeschossenen Teilchen beliebig wählen kann. Im
Gegensatz zum Klassischen Fall erlaubt die QM aber auch in diesem Fall eine Reflexion
des Teilchens am Potentialtopf.
Klassisch ist das Teilchen nach wie vor in der Box eingesperrt, falls seine
kinetische Energie geringer ist als die Höhe der Potentialwände, d.h. die
Wahrscheinlichkeit, es außerhalb der Box zu finden, ist Null.
Wir werden nun explizit berechnen, inwiefern es sich in der QM damit anders verhält.
Auch hier ist unser Ausgangspunkt wieder die zeitunabhängige Schrödingergleichung,
vgl. Glg. (6.5), wobei wir nun das folgende Potential V (x) im Hamiltonoperator verwenden,
−V0 for |x| ≤ L
V (x) =
.
(6.41)
0
for |x| > L
Wir betrachten nun Energieeigenwerte in zwei Intervallen, 0 > E > −V0 und E > 0,
wobei erstere den Bindungszuständen und letztere den Streuzuständen entsprechen. Wir
teilen das Problem in drei verschiedene Regionen I, II und III entlang der x Achse auf.
40
Die Wahl des Energienullpunktes ist beliebig, (d.h. V0 + E > 0) beschreibt ein Teilchen mit der
kinetischen Energie
D
E pb2 b
Ekin =
= V0 + E ≥ 0.
(6.40)
2m
Die Notation mit negativen Energien ist zugegebenermaßen nicht sehr intuitiv, aber in hohem Maße
verbreitet.
86
6.4.1
Bindungszustände (diskretes Spektrum, −V0 < E < 0)
Region I: x < −L, V (x) = 0
Hier gilt die freie Schrödingergleichung,
φ00 (x) = −εφ(x),
was wir durch Substitution κ =
ist, gilt κ > 0 und wir finden
√
(6.42)
−ε umschreiben, vgl. Glg. (6.28). Da E < 0 (und ε < 0)
φ00 (x) = κ2 φ(x).
(6.43)
Wie zuvor besprochen, vgl. Glg. (6.28), ist die zugehörige Lösung
φI (x) = Ae−κx + Be+κx ,
(6.44)
wobei A und B noch zu bestimmende Konstanten sind. Da wir in der Region x < −L < 0
sind, würde der Exponent des ersten Terms für x → −∞ unbegrenzt anwachsen. Um die
Normierbarkeit der Wellenfunktion zu gewährleisten, müssen wir fordern, dass A identisch
zu Null ist. Daher lautet die Lösung in der Region I
φI (x) = Beκx .
(6.45)
Region II: −L ≤ x ≤ +L, V (x) = −V0
In dieser Region wirkt das Potential, und die Schrödingergleichung lautet
φII 00 (x) = (U (x) − ε)φII (x),
(6.46)
p
p
was wiederum durch Substitution k = ε − U (x) = ~−1 2m(V0 + E) umgeschrieben
wird, vgl. Glg. (6.27). Da E > −V0 (d.h. V0 + E > 0) ist k > 0 und wir finden
φII 00 (x) = −k 2 φII (x)
(6.47)
φII (x) = C̄e−ikx + D̄e+ikx = C sin(kx) + D cos(kx).
(6.48)
mit der allgemeinen Lösung
Auch in diesem Fall sind C = i(D̄ − C̄) und D = C̄ + D̄ später noch zu bestimmende
Konstanten.
Region III: x > L, V (x) = 0
Hier liegt ein zu Region I gleich gelagerter Fall vor, d.h. es gilt Glg. (6.43) und die Lösung
lautet
φIII (x) = F e−κx + Ge+κx .
(6.49)
Nun müssen wir aber, um die Normierbarkeit der Wellenfunktion zu gewährleisten, G = 0
fordern, da ansonsten der entsprechende Exponent für x → ∞ unbegrenzt anwachsen
würde. Wir erhalten daher die Lösung
φIII (x) = F e−κx .
87
(6.50)
Zusammenfassung
Die Lösung für 0 > E > −V0 über alle Regionen lautet

Be+κx
in Region I

C sin(kx) + D cos(kx) in Region II
φ(x) =

F e−κx
in Region III.
(6.51)
Die Konstanten B, C, D und F müssen nun noch durch Stetigkeitsbedigungen für φ(±L)
und φ0 (±L) verknüpft werden.
Wir bemerken, dass die Bewegung eines Klassischen Teilchens mit Energie 0 > E > −V0
strikt auf die Region II beschränkt ist.
Nichtsdestotrotz kann ein quantenmechanisches Teilchen in die Klassisch
verbotenen Bereiche I und III eindringen, d.h. die Wahrscheinlichkeitsdichte
verschwindet nicht, |φ(x)|2 6= 0.
Wie weit ein Teilchen in diese Regionen eindringen kann, hängt von dessen Energie ab.
Das Teilchen kann eine Eindringtiefe von ca.
δx ∝
~
~
1
=p
=p
κ
2m |−E|
2m |V0 − hEkin i|
(6.52)
erreichen. Diese ist nimmt mit größeren Werten von hEkin i zu. Entsprechend gibt es eine
Impuls-Unschärfe, welche ein Klassisches Teilchen benötigen würde, um die Potentialbarriere zu überwinden,
p
~
= 2m |−E|.
(6.53)
∆p ∝
∆x
An dieser Stelle könnte man nun die Randbedingungen aufstellen,
φI (−L) =φII (−L),
φ0I (−L) =φ0II (−L),
φII (+L) =φIII (+L),
φ0II (+L) =φ0III (+L)
(6.54)
(6.55)
und die Stetigkeitsbedingungen in Matrixnotation schreiben, z.B. an der Grenze I zu II
−ikL
0 e−κL
A
e
e+ikL
C̄
.
(6.56)
=
i −ikL −i +ikL
0 κ1 e−κL
D̄
B
e
e
k
k
Man vereinfacht zu einer einzelnen Matrix und kann so schließlich mehrere Randbedingungen koppeln, indem man die Koeffizienten der dazwischenliegenden Intervalle eliminiert.
Wir wollen hier jedoch eine einfachere Methode verwenden, und die Symmetrie des Problems ausnutzen.
Indem wir uns an Glg. (5.151) erinnern, sehen wir, dass der Hamiltonoperator für das
vorliegende symmetrische Potential V (x), vgl. Glg. (6.41) mit dem Paritätsoperator vertauscht. Daher können die Basiszustände derart gewählt werden, dass sie entweder nur aus
geraden oder ungerade Funktionen bestehen. Diese Familien von geraden und ungeraden
Lösungen bestimmen bezeichnen wir als φ(+) (x) und φ(−) (x). Diese sind durch


I
 Be+κx
 −Be+κx I
D cos(kx) II
C sin(kx) II
φ(+) (x) =
φ(−) (x) =
(6.57)


−κx
−κx
Be
III
Be
III
88
gegeben und in Abb. D.24 skizziert. An den Rändern des Potentialtopfs müssen die unterschiedlichen Lösungen in den verschiedenen Regionen kontinuierlich ineinander übergehen.
Mathematisch bedeutet dies, dass die Wellenfunktion überall stetig differenzierbar sein
muss, d.h., dass die Wellenfunktion und deren erste Ableitung an den Grenzen des Potentialtopfs x = ±L übereinstimmen müssen41 . Wir können diese beiden Forderungen in
eine Aussage über die logarithmische Ableitung zusammenfassen:
φ0 (x) !
d
log φ(x) =
=
dx
φ(x)
Für gerade Lösungen bedeutet dies
φ(+)0 (x) !
= stetig
(+)
φ (x) x→L
stetig.
−Bκe−κL
−Dk sin(kL)
=
,
D cos(kL)
Be−κL
⇔
(6.58)
(6.59)
was nach Vereinfachung
k tan(kL) = κ
(6.60)
ergibt. Nachdem man Glg. (6.60) einen Moment auf sich wirken lässt, erkennt man, dass
dies eine transzendente Gleichung ist, d.h. nicht analytisch lösbar ist. Da κ und k von der
Energie via
1p
1p
2m |−E|,
k=
2m(V0 + E)
(6.61)
κ=
~
~
abhängen, ist Glg. (6.60) eine Formel für die erlaubten Energieeigenwerte, und daher
deren Quantisierungsbedingung. Die analoge Rechnung für ungerade Lösungen ergibt
k cot(kL) = −κ.
(6.62)
Sie werden die graphische Lösung dieser Gleichungen sowie einige analytische Näherungen,
die für bestimmte Grenzfälle erhalten werden können, auf Übungsblatt 8 untersuchen.
Wir merken an, dass der eindimensionale Potentialtopf immer einen Bindungszustand
hat. Dies ist für beliebige Dimensionen nicht automatisch der Fall. Insbesondere erlaubt
die dreidimensionale Schrödingergleichung nicht automatisch einen Bindungszustand für
ein solches Problem. Zwar kann man, wie Sie in späteren Kapiteln sehen werden, die dreidimensionale Schrödingergleichung durch Einführung von Kugelkoordinaten mittels eines
Radius r umschreiben und damit auf ein eindimensionales Problem reduzieren, wobei der
Radius r auf R+
0 definiert ist im Gegensatz zu x ∈ R im eindimensionalen Fall. Weil
man bei Separation des Radialteils einen zusätzlich Faktor 1/r erhält, muss die Wellenfunktion am Ursprung verschwinden sofern kein Delta-Potential vorliegt. Lösungen dieser
Art können nur mit ungeraden Funktionen realisiert werden. Die Details hierzu werden
Sie später noch sehen. Daher ist der Grundzustand des dreidimensionalen Potentialtopfs
eine ungerade Wellenfunktion, vgl. Abb. D.25, welche dem ersten angeregten Zustand in
unserem eindimensionalen Problem entspricht, und daher für zu kleine Werte der Energie
nicht erzeugt werden kann.
Wir wenden uns jetzt erneut den geraden und ungeraden Lösungen zu, vgl. Glg. (6.57),
wo wir immer noch die Konstanten B, C und D bestimmen müssen. Wir verwenden
zunächst Kontinuität bei x = L um die Anschlussbedingungen für den nten Zustand
φ(+) (x) :
Dn cos(kn L) = Bn e−κn L ,
φ(−) (x) :
41
Cn sin(kn L) = Bn e−κn L
(6.63)
Aufgrund der Symmetrie des Potentials sind die Intervallgrenzen bei x = +L und x = −L, d.h.
zwischen den Regionen I und II bzw. II und III gleichwertig. Die Betrachtung einer Diskontinuität ist
daher ausreichend.
89
zu erhalten. Inden wir die Normierungsbedingung einfordern, fixieren wir Bn als
√
√
κn cos(kn L) +κn L
κn sin(kn L) +κn L
(+)
(−)
φ (x) : Bn = √
e
, φ (x) : Bn = √
e
,
1 + κn L
1 + κn L
und damit dann letzten Endes die anderen beiden Koeffizienten,
√
κn
Cn = Dn = √
.
1 + κn L
(6.64)
(6.65)
Physikalische Interpretation des endlichen Potentialtopfs
Der endliche Potentialtopf findet Anwendung als Modell für freie Elektronen in Metallen
und wird in der Festkörperphysik verwendet. Dort ist die Aufenthaltswahrscheinlichkeit
der Elektronen über die Atome des metallischen Kristalls verteilt. Die Elektronen können
sich innerhalb des Kristalls quasi-frei bewegen, aber sind durch eine Potentialbarriere
gezwungen, darin zu bleiben. Daher ist in erster Näherung das endliche Kastenpotential
ein gutes Modell für diese Situation. Diese Situation ist in Abb. D.26 skizziert. Dabei
entspricht W der Austrittsarbeit, vgl. hierzu Abschnitt 2.2.2.
6.4.2
Streuzustände (Kontinuierliches Spektrum, E > 0)
Wir werden nun die Schrödingergleichung mit dem Potential von Glg. (6.41) für positive
Energien E > 0 betrachten. Wir nehmen an, dass eine anfängliche ebene Welle von
x = −∞ auf des Potential zuläuft, und betrachten die möglichen Zustände, die nicht
gebunden sind, sondern gestreut werden, d.h. durch das Potential transmittiert oder an
dem Potential reflektiert werden, vgl. Abb. D.27.
Sie werden die zugehörigen Koeffizienten A, B, C, D und F auf Übungsblatt 8 berechnen
und mit diesen die Lösung

Ae+ikx + Be−ikx
in Region I

C sin(qx) + D cos(qx) in Region II
φ(x) =
(6.66)

+ikx
Fe
in Region III.
finden. In der beschriebenen Situation stellt Ae+ikx eine einlaufende Welle und Be−ikx eine
auslaufende (d.h. reflektierte) Welle in der Region I dar. In der Region IIIpwird F e+ikx als
eine auslaufende
(d.h. transmittierte) Welle verstanden. Hierbei ist ~q = 2m(E + V0 ) >
√
~k = 2mE > 0. Damit können wir die Reflexions- und Transmissionskoeffizienten
bestimmen. Diese geben die Wahrscheinlichkeiten an, dass ein Teilchen, welches auf den
Potentialtopf trifft, an dieser reflektiert oder durch diese transmittiert wird.
Die Verhältnisse der Koeffizienten B und A bzw. F und A werden als Transmissions- und
Reflexionsamplituden bezeichnet und sind ein Maß für die reflektierten und transmittierten Anteile der Welle. Nach einigen Umformungen finden wir
τ=
F
e−2ikL
=
q
i
k
A
cos(2qL) − 2 q + k sin(2qL)
90
(6.67)
ρ=
e−2ikL 2i
q
k
k
q
−
sin(2qL)
B
=
A
cos(2qL) − 2i kq + kq sin(2qL)
(6.68)
und bestimmen damit den Transmissionskoeffizienten T (E),
1
T (E) = |τ |2 =
1+
V02 sin2 (2qL)
4E(E+V0 )
(6.69)
und den Reflexionskoeffizienten R(E)
R(E) = |ρ|2 =
V02 sin2 (2qL)
4E(E+V0 )
1+
V02 sin2 (2qL)
4E(E+V0 )
6= 0.
(6.70)
Da alle nicht reflektierten Teilchen offensichtlich transmittiert werden müssen, ergibt sich
zwangsläufig
R(E) + T (E) = 1,
(6.71)
was sich nach Einsetzen der vorigen Ergebnisse in der Tat zeigt.
Bei Betrachtung des Reflexions- oder Transmissionskoeffizienten sieht man leicht, dass
die Sinusfunktion für bestimmte Argumente verschwindet und daher die Transmissionswahrscheinlichkeit für bestimmte Energien En gleich eins ist, T (En ) = 1, vgl. Abb. D.28.
Eine derartige Beobachtung wurde bereits im Jahre 1920 vor der Formulierung der Quantenmechanik gemacht. C. Ramsauer beobachtete, dass Edelgase für niederenergetische
Elektronen eine unerwartet hohe Durchlässigkeit besitzen. Der Streuwirkungsquerschnit
hängt auf höchst nicht-klassische Weise von der kinetischen Energie ab und zeigt ausgeprägte Minima, die teilweise deutlich unterhalb des Klassisch berechneten gaskinetischen
Wirkungsquerschnitts liegen. Dieser Effekt wird nach seine Entdeckern als RamsauerTownsend Effekt bezeichnet.
Um die entsprechenden Energien En zu finden, betrachten wir die Nullstellen des Sinus
und finden die folgende Bedingung,
⇒
sin(2qn L) = 0
2L p
2m(En + V0 ) = nπ,
~
(6.72)
wobei n ∈ N die Energien En bezeichnet. Diese Streuzustände werden als Resonanzen
bezeichnet. Wir erhalten daher für die Positionen der Resonanzen eines endlichen Potentialtopfs innerhalb des kontinuierlichen Spektrums die diskreten Werte
En =
n2 π 2 ~2
− V0 .
2m(2L)2
(6.73)
Für diese Energien ist das Potential transparent. Diese Resonanzbedingungen stimmen
interessanterweise genau mit den erlaubten Energiewerten eines unendlich tiefen Potentialtopfs überein (bis auf die additive Konstante −V0 ). Entsprechend findet man Minima
der Transmission unter der Bedingung
sin(2qn L) = ±1
⇒
2L p
π
2m(En + V0 ) = (2n + 1) .
~
2
91
(6.74)
6.5
6.5.1
Tunneleffekt an der Potentialschwelle
Endliche Potentialbarriere (V0 > E)
Der sogenannte Tunneleffekt in der QM kann vom Spezialfall eines Potentialtopfs abgeleitet werden, indem man −V0 zu +V0 ändert und damit eine Potentialbarriere erzeugt,
+V0 for |x| ≤ L
V (x) =
.
(6.75)
0
for |x| > L
vgl. Abb. D.29. Klassisch könnte ein Teilchen mit niedrigerer Energie als die Potentialbarriere diese niemals durchqueren und würde immer reflektiert. Da jedoch in der QM
die Wellenfunktion aufgrund der Stetigkeitsbedingungen in der Klassisch verbotenen Region II exponentiell abfällt, verschwindet die Wahrscheinlichkeitsdichte in der Region III
nicht. Dies erlaubt dem Teilchen, die Barriere zu passieren. In Analogie zu einen Tunnel durch einen Berg spricht man daher vom Tunneleffekt. Mathematisch können wir die
Streulösungen des endlichen Potentialtopfs, vgl. Glg. (6.66), verwenden, wenn wir dabei
−V0 durch +V0 in der Region II ersetzen,

 Ae+ikx + Be−ikx in Region I
Ce−qx + De+qx in Region II ,
φ(x) =
(6.76)

+ikx
Fe
in Region III
wobei die “Impulse” durch
k=
1√
2mE
~
und
q=
1p
2m(V0 − E)
~
(6.77)
gegeben sind. Da die Lösung in der Region II nicht mehr komplex ist, können wir die
Sinus- und Cosinusfunktionen des vorigen Abschnitts durch ihre hyperbolischen Gegenparts ersetzen42 ,
sin[2qL] → sinh[2qL],
cos[2qL] → cosh[2qL]
und
(6.78)
und anschließend die fehlenden Konstanten mittels der Anschlussbedingungen fixieren.
Diese Rechnung wird hier nicht wiederholt.
6.5.2
Transmissionskoeffizient beim Tunneleffekt
Wir erhalten für die Transmissionsamplitude
τ=
e−2ikL
2
(6.79)
2
−k
cosh[2qL] − i q 2kq
sinh[2qL]
bzw. unter Verwendung von cosh2 [x] − sinh2 [x] = 1, den Transmissionskoeffizienten
T (E) = τ 2 =
1
1+
(k2 +q 2 )2
4k2 q 2
2
sinh [2qL]
42
1
=
1+
sinh2 [2qL]
4E(V0 −E)
V02
6= 0.
(6.80)
Ganz nonchalant übergehen wir hier das Auftreten des Faktors i. Es ist einfach, dies in einem stillen
Moment selbst auszuarbeiten.
92
Unter der Bedingung qL 1, die zumeist eine gute Näherung ist43 , gilt approximativ
2 sinh[2qL] ≈ exp [2qL] und wir nähern den Bruch durch
T (E) ≈
16E(V0 − E)
1
≈
exp [−4qL].
4qL
2
V02
e
V0
1+
4E(V0 − E) 4
|
{z
}
(6.81)
1
Wir exponenzieren den Vorfaktor mittels x = exp [log x] und erhalten den gesamten Transmissionskoeffizient als Exponentialfunktion,
Lp
16E(V0 − E)
.
(6.82)
T (E) ≈ exp −4
2m(V0 − E) + log
~
V02
Da wir vorausgesetzt haben, dass qL wesentlich größer als eins ist und der Logarithmus nur
sehr langsam wächst, schlussfolgern wir, dass der erste Term im Exponenten ein deutlich
größeres Gewicht hat als der zweite, welchen wir daraufhin vernachlässigen. Wir erhalten
Lp
T (E) ≈ exp −4
2m(V0 − E) .
(6.83)
~
was eine gute Näherung für die Transmissionswahrscheinlichkeit einer einzelnen Potentialschwelle ist, die in einem bestimmten Intervall konstant ist und außerhalb verschwindet.
Dieses Potential ist eine recht krude Näherung von realen Potentialen, die im Allgemeinen
wesentlich komplizierter sind. Um diese Bedenken zu berücksichtigen, verallgemeinern wir
den Transmissionskoeffizienten zu dem sogenannten Gamow Faktor, indem wir ein gegebenes Potential in infinitesimal breite Potentialstufen mit konstanten Werten unterteilen,
und diese über ein sinnvolles Intervall [x1 , x2 ] integrieren, innerhalb dessen das Potential
überhalb eines bestimmten Wertes liegt, vgl. Abb. D.30 Damit erhalten wir


Zx2
p
2
dx 2m(V (x) − E), .
(6.84)
T (E) ≈ exp −
~
x1
6.5.3
Physikalische Beispiele für den Tunneleffekt
Hier sprechen wir kurz einige physikalisch besonders relevante Beispiele für den Tunneleffekt an.
α-Zerfall
In der Kernphysik spielt der Tunneleffekt eine wesentliche Rolle beim α-Zerfall. Innerhalb
des Kerns können zwei Protonen und zwei Neutronen sich zu einem α-Teilchen (einem
4
He Kern) formieren, welcher dank der bei der Bindung gewonnene Energie durch die
Coulomb-Barriere tunneln kann, vgl. Abb. D.31. Beispielsweise lautet die Reaktionsgleichung für den α Zerfall für das Polonium-Isotop 212 Po
212
Po → 208 Pb + α,
43
(6.85)
Die zugrunde liegende Tatsache ist, dass Potentialbarrieren üblicherweise (am höchsten Punkt) sehr
viel höher als die Energie sind. Daher ist q sehr groß.
93
d.h. dabei entsteht das Blei-Isotop
208
Pb und ein freier 4 He Kern.
Kernfusion
Kernfusion ist im Wesentlichen die Umkehr eines Kernzerfalls, vgl. Abb. D.31. Hierbei
werden im allgemeinen Kerne mit positiver Kernladung fusioniert, so dass diese die gegenseitige Coulomb-Abstoßung überwinden müssen. Zwar könnte man diese CoulombBarriere nun einfach durch höhere Einschussenergie überwinden, aber dann wäre der neu
gebildete, gebundene Zustand hoch angeregt und nur von kurzer Lebensdauer. Daher
schießt man Kerne bei Energien unterhalb der Potentialbarriere ein und lässt diese durch
den Tunneleffekt in den Targetkern eindringen. Die Überwindung der Coulomb-Barriere
ist natürlich stark unterdrückt und findet nur bei sehr hohen Teilchendichten und Temperaturen mit einer signifikanten Rate statt. Diese Unterdrückung ist von essentieller
Bedeutung für die lange Lebensdauer von Sternen.
Kalte Emission
Elektronen können bei sehr niedrigen Temperaturen selbst ohne einfallendes Licht aus
Metallen emittiert werden, falls ein äußeres elektrisches Feld anliegt. Unter der Annahme,
dass die Elektronen eine sehr niedrige Energie im Vergleich zur Potentialbarriere haben,
ist es nicht sehr wahrscheinlich, dass ein Elektron durch die Barriere tunneln kann. Indem man die externe elektrische Feldstärke erhöht, wächst die verfügbare Energie des
Elektrons, der Transmissionskoeffizient nimmt zu und Emission von Elektronen kann beobachtet werden.
Tunneln zwischen Leitern
Wenn zwei elektrische Leiter durch eine dünne Schicht eines Isolators getrennt sind, gestattet der Tunneleffekt den Elektronen durch diese Barriere zu tunneln und auf diese Art
und Weise einen Strom zu erzeugen. Dieser Effekt wir auch bei supraleitenden Materialien
beobachtet und dort als Josephson Effekt bezeichnet.
94
7
Harmonischer Oszillator
In diesem Kapitel werden wir den harmonischen Oszillator betrachten. Das Potential des
harmonischen Oszillators lautet
mω 2 2
V (x) =
x,
(7.1)
2
d.h. es ist das einfachste mögliche Potential, das ein isoliertes Minimum und keinerlei
Unstetigkeiten besitzt. Beim harmonischen Oszillator sind die Korrespondenzen zwischen
Klassischer und quantenmechanischer Beschreibung besonders transparent.
Der harmonische Oszillator ist eines der wichtigsten Probleme in der Physik, da sich
viele kompliziertere Probleme in diversen Grenzfällen durch einen harmonischen Oszillator
approximieren lassen. Beispielsweise kann jede Funktion, die ein Minimum besitzt und in
dessen Umgebung stetig ist, für kleine Abweichungen von diesem Minimum durch eine
Parabel angenähert werden. Darüber hinaus ist ein Verständnis der quantenmechanischen
Eigenschaften der Oszillatormoden eine wesentliche Grundlage der zweiten Quantisierung
und der Quantenfeldtheorie (QFT).
Eine wesentliche Besonderheit des harmonischen Oszillators in der QM ist, dass er mittels zweier verschiedener Methoden exakt lösbar ist. Jede einzelne dieser Methoden findet
auch in anderen, schwierigeren Problemen Anwendung. Die erste dieser Methoden – die
algebraische Methode – wird uns zum Konzept der Leiteroperatoren und zu den Besetzungszahlen führen. Später werden wir ein konzeptionell sehr ähnliches Vorgehen für den
Drehimpuls in der QM verwenden. Die zweite dieser Methoden – die analytische Methode – wird uns explizit das System der Eigenfunktionen liefern, die wir mit einer Potenzreihenentwicklung mit Abbruchbedingung erhalten. Letztere Methode wird Ihnen beim
Wasserstoffatom erneut begegnen. Desweiteren können wir am harmonischen Oszillator
einen ersten Blick auf die Konzepte des Fock-Raums und der Besetzungszahldarstellung
werfen. Dieser Abschnitt wird durch einen knappen Exkurs zu kohärenten Zuständen beendet, bei denen sich die Korrespondenz zwischen Klassischer und quantenmechanischer
Beschreibung besonders schön zeigen lässt.
7.1
7.1.1
Algebraische Methode
Leiteroperatoren
Wir beginnen mit der eindimensionalen zeitunabhängigen Schrödingergleichung, in welcher wir den Hamiltonoperator des harmonischen Oszillators
mω 2 2
~2 d2
2
b
Hφ(x) = pb + V (b
x) φ(x) = −
+
x φ(x) = Eφ(x)
(7.2)
2m dx2
2
einsetzen. Wir erkennen, dass es sich bei der Kombination der Konstanten
r
~
x0 =
mω
95
(7.3)
um eine für den harmonischen Oszillator natürliche Längenskala44 handelt und schreiben
damit die Schrödingergleichung als
2 2 !
~ω
d
x
b
Hφ(x)
=
ix0
+
φ(x) = Eφ(x)
(7.4)
2
dx
x0
um. Der Ausdruck in Klammern ist eine Summe von inkompatiblen Operatoren, die wir
nun vereinfachen wollen. Es gilt
2 2 d
x
d
d
x
x
− x0
+ x0
+ 1.
(7.5)
ix0
+
=
dx
x0
x0
dx
x0
dx
Darum bietet es sich an, zwei sogenannte Leiteroperatoren b
a und b
a† einzuführen:
b
a :=
b
a† :=
√1
2
√1
2
x
x0
x
x0
d
+ x0 dx
=
d
− x0 dx
=
√ 1
2mω~
√ 1
2mω~
(mωb
x + ib
p)
Vernichter
(mωb
x − ib
p)
Erzeuger.
(7.6)
Diese Operatoren werden auch als Aufsteigeoperatoren (Erzeuger) und Absteigeoperatoren
(Vernichter) bezeichnet. Die Begriffsbildung wird im Folgenden klar werden.
Man sieht leicht, dass sich Orts- und Impulsoperatoren durch die Erzeuger und Vernichter
ausdrücken lassen,
√
√
−i~
2mω~
2mω~
x0
†
†
†
b
a+b
a , pb = √
b
a−b
a† .
x
b= √ b
a+b
a =
b
a−b
a = −i
2mω
2
2
2x0
(7.7)
Wir bestimmen die Vertauschungsrelationen der Leiteroperatoren. Zunächst berechnen wir
!
2 2
x
d
1
− x0
+1
(7.8)
b
ab
a† =
2
x0
dx
!
2 2
1
x
d
b
a† b
a=
− x0
−1
(7.9)
2
x0
dx
und finden daher die Vertauschungsrelationen
[b
a, b
a] = [b
a† , b
a† ] = 0,
[b
a, b
a† ] = 1.
(7.10)
Nun können wir mittels der Leiteroperatoren den Hamiltonoperator vereinfachen,
2 2 !
~ω
d
x
~ω
1
†
†
b
ix0
+
=
2b
ab
a + 1 = ~ω b
ab
a+
,
(7.11)
H=
2
dx
x0
2
2
wie man unter Verwendung von Glgn. (7.5) und (7.6) leicht sieht. Daher lässt sich die
Schrödingergleichung als
E
1
†
−
φ(x)
(7.12)
b
ab
aφ(x) =
~ω 2
44
Die Bedeutung der natürlichen Längenskala wird im Folgenden noch klar werden.
96
schreiben. Wir wollen nun dem Operator b
a†b
a eine Interpretation als Besetzungszahloperator geben,
b =b
N
a†b
a
Besetzungszahloperator.
(7.13)
b die Vertauschungsrelationen
Es ist einfach zu zeigen, dass N
b, b
[N
a† ] = b
a† ,
b, b
[N
a] = −b
a,
(7.14)
b auch als den Anzahloperator.
erfüllt. Man bezeichnet N
7.1.2
Spektrum
b (und damit auch von H)
b mit dem Index n und
Wir bezeichnen die Eigenwerte von N
werden nun die zugehörigen Eigenfunktionen φn (x) bestimmen,
b φn (x) = nφn (x).
N
(7.15)
Wir bilden dazu ein Skalarprodukt und schreiben dies als Norm um,
D E b
φn = φn b
a† b
aφn = hb
n kφn k2 = n hφn | φn i = φn N
aφn | b
aφn i = kb
aφn k2 ≥ 0. (7.16)
| {z }
>0
Zunächst einmal verstehen wir, dass die Eigenwerte n nicht-negativ sind, d.h. es gilt n ≥ 0.
Selbstverständlich gilt Gleichheit nur, falls der Vektor b
aφn der Nullvektor ist. Dann muss
der Eigenwert n ebenfalls verschwinden.
Also ist n = 0 der niedrigste mögliche Eigenwert (Grundzustand, Vakuum):
n=0
⇒
b
aφ0 = 0.
(7.17)
Der Grundzustand (n = 0) wird also durch den Operator b
a vernichtet.
Durch Einsetzen von Glg. (7.6) in Glg. (7.17) finden wir
x
d
1
+ x0
0=b
aφ0 (x) = √
φ0 (x),
dx
2 x0
(7.18)
was sich durch Separation der Variablen lösen lässt,
Z
Z
dφ0
1
x2
= − 2 dx x ⇒ ln φ0 (x) = −
+ ln N ,
φ0
x0
2x0 2
(7.19)
wobei N eine noch zu bestimmende Normierungskonstante ist. Die Grundzustandwellenfunktion lautet also
x2
(7.20)
⇔ φ0 (x) = N exp −
2x0 2
und ist eine Gauß-Funktion, deren Normierung offensichtlich durch
N2 = √
1
πx0 2
bzw.
97
1
N = (πx0 2 )− 4
(7.21)
√
gegeben ist. Daher verstehen wir direkt, dass x0 / 2 die Standardabweichung des Teilchenorts im Grundzustand ist45 . Wir bemerken, dass die Unschärferelation die Ursache
für die nicht-verschwindende Standardabweichung des Ortes vom Minimum des Potentials
ist. Wir werden im nächsten Abschnitt den Grundzustand noch detailliert betrachten und
dieses Argument genauer verstehen.
Wir wollen nun zeigen, dass Folgendes gilt:
b zum Eigenwert n ist, so ist durch b
• Falls φn eine Eigenfunktion von N
a† φn eine
b gegeben, die dem Eigenwert n + 1 zugeordnet ist.
weitere Eigenfunktion von N
b zum Eigenwert n ist, so ist durch b
• Falls φn eine Eigenfunktion von N
aφn eine
b gegeben, die dem Eigenwert n − 1 zugeordnet ist.
weitere Eigenfunktion von N
Wir verwenden nun Glg. (7.14) um diese Behauptungen zu zeigen:
b + 1)φn = b
b a† φ n = b
b +b
a† ( N
a† (n + 1)φn = (n + 1)b
a† φn ,
Nb
a† N
a† φn = b
(7.22)
womit die erste Behauptung bewiesen ist. Die Norm des Zustands b
a† φn ergibt
* +
D E
† † b
†
b
a φn b
a φn = φn |{z}
b
ab
a φn = φn (N
+1)φn = (n + 1) hφn | φn i = (n + 1), (7.23)
| {z }
=ba† ba+1
=1
womit wir für einen normierten Zustand φn+1
√
b
a† φn = n + 1 φn+1
(7.24)
erhalten. Wir zeigen die zweite Behauptung,
b aφn = b
b −b
b − 1)φn = b
Nb
aN
a φn = b
a(N
a(n − 1)φn = (n − 1)b
a† φn ,
(7.25)
und bestimmen die Norm von b
aφn durch
E
†
D b
hb
aφn | b
aφn i = φn b
ab
aφn = φn N φn = n hφn | φn i = n,
| {z }
(7.26)
=1
so dass wir
b
aφn =
√
n φn−1
(7.27)
erhalten. Damit sind beide Behauptungen gezeigt.
Wir sehen, dass man mittels der beiden Leiteroperatoren b
a† und b
a den Eigenwert n des
Besetzungszahloperators in Schritten von ±1 ändern kann. Wir wissen auch, dass der Eigenwert des Grundzustands durch n = 0 gegeben ist. Daher gilt, dass n nur ganzzahlige,
positive Werte annimmt. Von nicht ganzzahligen Werten könnte man zu n < 0 hin absteigen, was aufgrund von Widerspruch zu Glg. (7.16) verboten sein muss. Wir bemerken
hier, dass die Ganzzahligkeit von n eine Quantisierungsbedingung für die Energie darstellt,
45
2
Machen Sie sich bewusst, dass die Wahrscheinlichkeitsdichte |φ0 (x)| ist, dann leuchtet es sofort ein.
98
vgl. Glg. (7.12). Daher können sämtliche möglichen Eigenzustände φm des harmonischen
Oszillators durch sukzessive Anwendung der Leiteroperatoren b
a und b
a† auf einen beliebigen
Eigenzustand φn erhalten werden.
Zusammenfassung
Die zeitunabhängige Schrödingergleichung für den harmonischen Oszillator führt zur Eigenwertgleichung
1
1
b n (x) = ~ω N
b+
φn (x) = ~ω n +
φn (x).
(7.28)
En φn (x) = Hφ
2
2
Die Energieeigenwerte sind äquidistant und durch die Quantenzahl n ∈ N0 bestimmt,
1
En = ~ω n +
,
(7.29)
2
und können durch Anwendung der Leiteroperatoren b
a† und b
a in Schritten von ±~ω erhöht
oder abgesenkt werden46 . Insbesondere ist E0 = ~ω/2, d.h. die Energie des Grundzustands
ist von Null verschieden. Die Energieeigenfunktionen sind durch
1
x2
1
2 − 41
† n
† n
a ) φ0 (x) = √ (πx0 ) (b
a ) exp −
(7.30)
φn (x) = √ (b
2x0 2
n!
n!
p
gegeben, wobei x0 = ~/(mω) die natürliche Längenskala des harmonischen Oszillators
ist. Die Grundzustandswellenfunktion ist eine Gauß-Funktion
x2
2 − 41
.
(7.31)
φ0 (x) = (πx0 ) exp −
2x0 2
Wir werden später sehen, dass die Energieeigenfunktionen als Produkt von der Grundzustandsfunktion und von den sogenannten Hermite Polynomen geschrieben werden können.
Wie man in Abb. D.32 erkennen kann, sind die Eigenfunktionen zu (un-)geraden Werten
von n (un-)gerade Funktionen.
7.1.3
Nullpunktsenergie
Wie wir bereits gesehen haben, ist die Nullpunktsenergie (d.h. die Energie des Grundzustands) nicht Null, sondern E0 = ~ω/2. Wir wollen nun diese Grundzustandsenergie auf
Basis der Unschärferelation verstehen.
Während die potentielle Energie V (x) in der näheren Umgebung des Punktes x = 0
abnimmt, d.h. V (x → 0) → 0, muss die kinetische Energie durch die Impulsunschärfe im
gleichen Maße zunehmen. Daher nimmt die Impulsunschärfe zu, bis sich die Gesamtenergie
stabilisiert. Wir wollen dies nun mittels expliziter Rechnung zeigen.
Wir berechnen nun die Erwartungswerte hb
xi und hb
x2 i. Zunächst sehen wir, dass hb
xi = 0:
hb
xi = hφn | x
bφn i ∝ φn (b
a+b
a† )φn ∝ hφn | φn−1 i + hφn | φn+1 i = 0.
(7.32)
46
Aus diesem Bild ergibt sich die Bezeichnung als Leiteroperatoren. Skizzieren Sie einfach das Spektrum!
99
Außerdem finden wir
E
2
2 x0 2 x0 2 D 2
† 2
†2
†
†
x
b = φn x
b φn =
φn (b
a+b
a ) φn =
φn (b
a +b
a +b
ab
a +b
ab
a)φn
2
2
(7.33)
D E
1
1
2
2
2
2
b
a +b
a† )φn = (n + )x0 2 .
= x0 φn (N + )φn + x0 φn (b
2
2
|
{z
}
(7.34)
=0
p
Da x0 = ~/(mω), verschwindet die Ortsunschärfe in den Grenzfällen ~ → 0 oder m →
∞. Für den Impulserwartungswert gilt hb
pi = 0 mit im Wesentlichen gleicher Rechnung
wie für hb
xi. Wir berechnen zu guter Letzt noch hb
p2 i und finden
E
2 2
~2 ~2 D 2
† 2
†2
†
†
φn (b
a−b
a ) φn = −
φn (b
a +b
a −b
ab
a −b
ab
a)φn
pb = φn pb φn = −
2x0 2
2x0 2
(7.35)
=
~2
2x0 2
E
1
~2 D 2
1 ~2
†2
b
φ
(b
a
+
b
a
)φ
)
.
φn (N + )φn −
=
(n
+
n
n
2
2x0 2 |
2 x0 2
{z
}
(7.36)
=0
Wir sehen also für beide Observablen, dass die Varianz und der Erwartungswert des
Quadrats des Operators jeweils gleich sind. Nun können wir die Standardabweichungen
bestimmen und finden
r
r
1
~
1
h∆xi = x0 n + ,
h∆pi =
n+ ,
(7.37)
2
x0
2
bzw. für das Produkt die Unschärferelation
1
h∆xi h∆pi = ~ n +
2
.
(7.38)
Im Grundzustand ist die Unschärferelation mit Gleichheit erfüllt, wie es für eine Gauß’sche
Wellenfunktion zu erwarten ist.
Wir können nun die Unschärferelation in den Erwartungswert des Hamiltonoperators
einsetzen47 . Es gilt also
D E
~2 2 1 2
1 2 ~4 1
1 2
b
pb + 4 x
b
=
pb + (n + ) 4 2 ,
(7.39)
En = H =
2m
x0
2m
2 x0 hb
pi
wobei wir im letzten Schritt die Unschärferelation, Glg. (7.38), eingesetzt haben und
h∆b
xi2 = hb
x2 i sowie die analoge Beziehung für pb benutzt haben. Wir bestimmen das
Minimum von E durch Variation von hb
p2 i,
1 ~4 1
0 = 1 − (n + )2 4
2 x0 hb
p2 i2
47
⇒
2
~2
1
pb = 2 (n + ),
x0
2
(7.40)
Vergleichen Sie hierzu übungsaufgabe 4.1, bei der Sie ein ähnliches Prozedere angewandt haben.
100
und setzen dies wiederum in Glg. (7.39) ein. Dann erhalten wir
1
En = ~ω n +
2
(7.41)
und sehen, dass die Energie des harmonischen Oszillators, vgl. Glg. (7.29), exakt mit der
minimalen mit der Unschärferelation verträglichen Energie übereinstimmt. Daher ist die
Grundzustandsenergie des harmonischen Oszillators durch die Unschärferelation vorgegeben.
Man bezeichnet im Allgemeinen die kleinstmögliche Energie, die mit der Unschärferelation für ein bestimmtes physikalisches System vereinbar ist, als dessen Nullpunktsenergie. Die Energie des Grundzustands entspricht der Nullpunktsenergie.
7.2
Vergleich zum Klassischen Oszillator
Hier wollen wir den quantenmechanischen Oszillator mit einem Klassischen Oszillator bei
gleicher Frequenz vergleichen. Die Klassischen Bewegunsgleichungen werden durch die
Ortsraumfunktion
x(t) = q0 sin(ωt)
(7.42)
gelöst und die Gesamtenergie ist durch
E=
mω 2 2
q
2 0
(7.43)
gegeben, wobei die Frequenz ω ein fester Wert ist und q0 durch die Anfangsbedingung
festgelegt wird. Um mit der QM zu vergleichen, definieren wir eine Klassische Wahrscheinlichkeitsdichte
dt
,
(7.44)
P klass (x)dx =
T /2
wobei dt das Zeitintervall ist, in dem der Massenpunkt des Klassischen Oszillators im Volumenelement dx gefunden werden kann und T = 2π/ω die volle Periodendauer des Oszillators ist48 . Wir bestimmen das Volumenelement dx durch Differentiation von Glg. (7.42),
s
q
x2
dx = q0 ω cos(ωt)dt = q0 ω 1 − sin2 (ωt) dt = q0 ω 1 − 2 dt.
(7.45)
q0
Daher ist die Klassische Wahrscheinlichkeitsdichte durch
s
!
2
πq
x
0
P klass (x) =
1 − 2 −1
2
q0
(7.46)
gegeben, wie sich durch Koeffizientenvergleich ergibt. Wir fixieren die Anfangsbedingung
q0 durch Vergleich der quantenmechanischen und Klassischen Energien,
En =
2n + 1
~ω
2
↔
48
E klass =
mω 2 2
q ,
2 0
(7.47)
Innerhalb jeder Periode wird jeder Ort (bis auf die Endpunkte) genau zweimal erreicht. Daher
müssten wir für eine volle Periode dx halbieren oder dt verdoppelt.
101
womit sich eine Beziehung zwischen dem Klassischen Parameter q0 und der charakteristischen Längenskala x0 des quantenmechanischen Oszillators ergibt,
√
q0 = 2n + 1 x0 .
(7.48)
Für niedrige Zustände findet man selbsverständlich beträchliche Unterschiede zwischen
den Klassischen und quantenmechanischen Wahrscheinlichkeitsdichten, aber für hochangeregte Zustände ist eine geglättete49 quantenmechanische Wahrscheinlichkeitsdichte der
Klassischen Wahrscheinlichkeitsdichte in hohem Maße ähnlich, vgl. Abb. D.33 für den
Zustand mit n = 100.
7.3
Besetzungszahldarstellung
In diesem Abschnitt wollen wir skizzieren, wie der harmonische Oszillator in der sogenannten Besetzungszahldarstellung behandelt wird. Hierbei führen wir das Konzept des
Fock-Raums ein. Eine solche Darstellung ist für die relativistische Quantenmechanik angemessen, d.h. für QFT.
Wir schreiben die normierte Eigenbasis des harmonischen Oszillators als Spaltenvektoren
mit unendlich vielen Komponenten50 , wobei alle Komponenten bis auf jeweils eine verschwinden. Diese eine nicht-verschwindende Komponente ist die (n + 1) te Komponente
für den n ten Eigenzustand, d.h. für den Zustand der den Eigenwert n bei Anwendung
des Besetzungszahloperators ergibt:
 . 
 
 
..
0
1
 
 0 
 1 
 0 
 
 
 
φn =  1  = |ni .
φ1 =  0  = |1i ,
(7.49)
φ0 =  0  = |0i ,
 
 
 
0
 
..
..
.
.
..
.
Diese Vektoren (wie beispielsweise |ni) bilden ein vollständiges Orthonormalsystem des
sogenannten Fock-Raums51 . Die Leiteroperatoren b
a und b
a† erhalten damit eine Darstellung
als Matrizen, die auf den Fock-Raum Zuständen wirken. Die wichtigsten Relationen beim
harmonischen Oszillator lauten in dieser Darstellung:
hn | mi = δn,m
1
a† )n |0i
|ni = √ (b
n!
√
†
b
a |ni = n + 1 |n + 1i
√
b
a |ni = n |n − 1i
49
(7.50)
(7.51)
(7.52)
(7.53)
Mit Glättung ist hier gemeint, dass eine Mittelung über die hochfrequenten Oszillationen notwendig
ist, beispielweise Mittelung des Wertes von einem lokalen Maximum bis zum nächsten.
50
Aufgrund der unendlich vielen Komponenten ist die Notation mit Spaltenvektoren natürlich nicht
angemessen. Nichtsdestotrotz ist sie nützlich, um sich die Bedeutung der Fock-Raum Zustände (z.B. |ni)
bewusst zu machen.
51
In der Vielteilchentheorie und in der QFT wird der Fock-Raum Zustand |ni tatsächlich als Zustand
mit n (reellen) Teilchen verstanden.
102
b |ni = b
N
a† b
a |ni = n |ni
1
1
b |ni = ~ω N
b+
|ni = ~ω n +
|ni .
H
2
2
(7.54)
(7.55)
Wir können die einzelnen Matrixelemente als Übergangsamplituden zwischen verschiedenen Zuständen verstehen, beispielweise wird Glg. (7.50) in Matrixnotation durch


1 0 ...
 0 1

hm | ni = δn,m
←→
(7.56)


..
...
.
dargestellt. Analog dazu ist die Darstellung der Leiteroperatoren durch


0
0
.
.
.
√
 1 0
0 ... 


√
† √
 0

2
0
0
←→
m b
a n = n + 1 hm | n + 1i


√
 0

| {z }
0
3
0


=δm,n+1
..
...
.
0
0
√

0
1 √0
0 ...

0
0
2
0
0
√

√
←→
hm | b
a | ni = n hm | n − 1i
 ..
3 0
0
| {z }
 . 0
=δm,n−1
..
...
.
0
0
(7.57)





(7.58)
b und der Hamiltonoperator H
b sind im Fock-Raum
gegeben. Der Besetzungszahloperator N
diagonal,


0 0 ...
 0 1 0 ...



D E
 0 0 2 0 0 
b
m N n = nδn,m hm | ni
←→
(7.59)
 .

 .

| {z }
.
0
0
3
0


=δm,n
..
..
.
. 0 0
 1

0 ...
2
 0 23 0 . . .



D E
5
1
b

0 0 
mH
←→
~ω  0 0 2
n = ~ω(n + )δn,m hm | ni
 . (7.60)
 ..

| {z }
2
7
0 
 . 0 0
=δm,n
2
..
..
.
. 0 0
In dieser Darstellung erkennen Sie deutlich die Dirac Notation, vgl. Anhang C.
7.4
Analytische Methode
In diesem Abschnitt betrachten wir die analytische Methode zur Lösung des harmonischen Oszillators. Wir definieren ξ = x/x0 und = 2E/(~ω) um dimensionslose Größen
einzuführen. Anschließend multiplizieren wir die Schrödingergleichung auf beiden Seiten
mit ~ω/2 um
d2
φ(ξ) = ξ 2 − φ(ξ)
(7.61)
2
dξ
103
zu erhalten. Um sicherzustellen, dass die Lösungen L2 (R) Funktionen sind, bestimmen
wir zunächst das erforderliche asymptotische Verhalten der Lösungen für große Werte
von ξ und vernachlässigen daher (gegenüber ξ 2 ). Die Schrödingergleichung vereinfacht
sich daher zu
d2
φ(ξ) = ξ 2 φ(ξ).
(7.62)
2
dξ
Wir verlangen, um Normierbarkeit zu gewährleisten, dass die Wellenfunktion hinreichend
schnell (d.h. wie eine Gauß-Funktion) abfällt und dass das Verhalten der am schnellsten
wachsenden Terme reproduziert wird. Daher machen wir einen Ansatz mit einer GaußFunktion φ(ξ) = exp [−ξ 2 /2]. Dann finden wir für die Ableitungen
d
ξ2
ξ2
exp [− ] = −ξ exp [− ],
dξ
2
2
d2
ξ2
ξ2
2
]
=
(ξ
−
1)
exp
[−
],
exp
[−
dξ 2
2
2
(7.63)
wobei der zweite Term in der Klammer vom Typus des vernachlässigten ist. Wir schließen daraus, dass eine Gauß-Funktion das asymptotische Verhalten korrekt beschreibt und
konkretisieren den Ansatz, indem wir die Gauß-Funktion mit einer Funktion52 h(ξ) multiplizieren, d.h. der Ansatz lautet
2
ξ
(7.64)
φ(ξ) = h(ξ) exp −
2
und dessen Ableitungen sind
2
d
dh(ξ)
ξ
φ(ξ) =
− ξh(ξ) exp −
dξ
dξ
2
2
2
2
d h(ξ)
dh(ξ)
ξ
d
2
φ(ξ)
=
−
2ξ
+
(ξ
−
1)h(ξ)
exp
−
.
dξ 2
dξ 2
dξ
2
(7.65)
(7.66)
Nun setzen wir Glg. (7.66) in Glg. (7.61) ein und entfernen die Gauß-Funktion (diese
ist immer von Null verschieden). Daher erhalten wir eine DGL zweiter Ordnung für die
Funktion h(ξ),
h00 (ξ) − 2ξh0 (ξ) + ( − 1)h(ξ) = 0,
(7.67)
die sich mit einem Potenzreihenansatz lösen lässt. Wir setzen also
h(ξ) =
∞
X
aj ξ j
(7.68)
j=0
ein und erhalten
∞
X
j=2
(j)(j − 1)aj ξ
j−2
−2
∞
X
j
(j)aj ξ + ( − 1)
j=1
52
∞
X
aj ξ j = 0.
(7.69)
j=0
Wir sollten hier zunächst von einer beliebigen Funktion sprechen, die wir dann in einer Potenzreihe
in ξ entwickeln. Wenn wir dann die Koeffizienten dieser Potenzreihe bestimmen, ist es erforderlich eine
Abbruchbedingung zu finden. Ansonsten erhält man fast unweigerlich eine Funktion, die exponentielles
Wachstum aufweist. Dabei ginge die Normierbarkeit verloren. Daher bekommen wir zwar am Ende immer
ein Polynom, aber wir machen einen allgemeinen Ansatz.
104
Bei diesem Ansatz suchen wir Rekursionsrelationen der Koeffizienten der Potenzreihe,
d.h. wir sortieren die verschiedenen Summen nach gemeinsamen Potenzen von ξ 53 und
erhalten
∞
X
{(j + 2)(j + 1)aj+2 − 2jaj + ( − 1)aj } ξ j = 0.
(7.70)
j=0
Offensichtlich gilt dies für beliebige Werte von ξ und damit für jeden einzelnen Term. Die
gesuchte Rekursionsrelation lautet also
2j + 1 − aj+2
=
.
aj
(j + 2)(j + 1)
(7.71)
Im Fall des harmonischen Oszillators lässt sich diese DGL bzw. die Rekursionsrelation
(durch Nachschlagen in mathematischer Literatur oder schlichte Erfahrung) als Hermite’sche DGL identifizieren, sofern die Energie die Abbruchbedingung (der Potenzreihe)
2E
= = 2j + 1
~ω
(7.72)
erfüllt. Ansonsten wüchse die Funktion h(ξ) exponentiell an und die Wellenfunktion wäre
nicht normierbar54 . Die Quantisierungsbedingungen haben also in der analytischen Methode den Charakter von Abbruchbedingungen der Potenzreihen.
Wir merken an, dass die DGL für h(ξ) von zweiter Ordnung ist und daher zwei frei wählbare Konstanten vorliegen. Diese entsprechen den Koeffizienten a0 und a1 . Sowohl für
gerade als auch für ungerade j ergibt sich die gleiche Rekursionsformel. Da die Abbruchbedingung aber nur für einen der beiden Fälle zugleich erfüllbar ist, erfordert Konvergenz
der Reihe, dass entweder a1 = 0 oder a0 = 0. Ersteres entspricht den geraden Funktionen
(d.h. positive Parität), letzteres den ungeraden Funktionen (d.h. negative Parität). Die
letzte freie Konstante, d.h. a0 bzw. a1 wird anschließend durch die Normierungsbedingung
fixiert.
Die Lösungen der Hermite’schen DGL sind die sogenannten Hermite Polynome Hn (ξ),
eine Familie von Polynomen (benannt nach C. Hermite), so dass wir
h(ξ) → Hn (ξ),
n ∈ N0
finden. Diese Identifikation definiert die Quantisierungsbedingung
1
.
E = ~ω n +
2
(7.74)
(7.75)
53
Wir benennen den Index der ersten Summe um und verschieben diesen dann so, dass diese Summe
ebenfalls bei Null anfängt. Bei der zweiten Summe kann man den Term zu j = 0 einfach addieren, da
dieser verschwindet. Wenn sich für einige der ersten Terme weitere Beiträge ergeben, die nicht in der
Rekursionsrelation berücksichtigt werden, verwendet man diese, um (üblicherweise eine der) Integrationskonstanten der Lösung zu fixieren.
54
Um das asymptotische Verhalten der nicht-abbrechenden, Potenzreihe zu untersuchen betrachtet
man beispielsweise
2
aj+2
= lim .
(7.73)
lim
j→∞ j
j→∞ aj
Dies ist das gleiche asymptotische Verhalten, das von der Potenzreihe der Exponentialfunktion exp [ξ 2 ]
an den Tag gelegt würde. Daher divergiert h(ξ) exponentiell (und zwar sogar schneller als die Exponentialfunktion im Ansatz der Glg. (7.64) konvergiert).
105
Mithilfe der Hermite Polynome können alle Eigenfunktionen in geschlossener Form angegeben werden,
x2
1
x
2 − 41
(πx0 ) Hn
exp − 2 .
(7.76)
φn (x) = p
x0
2x0
2n (n!)
Die einfachste Methode, um die Hermite Polynome zu bestimmen, ist die Formel von
Rodrigues,
n
d −ξ2
n ξ2
Hn (ξ) = (−1) e
e
.
(7.77)
dξ n
Die niedrigsten Hermite Polynome sind
H0 (ξ) = 1,
H1 (ξ) = 2ξ,
H2 (ξ) = 4ξ 2 − 2,
H3 (ξ) = 8ξ 3 − 12ξ,
H4 (ξ) = 16ξ 4 − 48ξ 2 + 12.
(7.78)
Wir merken noch an, dass Hermite Polynome eine Orthogonalitätsrelation erfüllen,
Z+∞
√
2
dξ Hm (ξ)Hn (ξ)e−ξ = π2n (n!)δm,n .
(7.79)
−∞
Dies spiegelt sich natürlich in der Orthonormalität der Eigenfunktionen wider.
Zusammenfassung
Hier fassen wir noch einmal das allgemeine “Kochrezept” zusammen. Zunächst schreiben
wir die Schrödingergleichung auf eine dimensionslose DGL zweiter Ordnung um. Dieser
Schritt ist nicht notwendig, aber grundsätzlich hilfreich.
Danach untersuchen wir das asymptotische Verhalten und machen einen Ansatz mit einer
Exponentialfunktion, welcher die Normierbarkeit garantiert und die asymptotisch anwachsenden Koeffizienten der DGL reproduziert.
Diese Exponentialfunktion wird mit einer weiteren Funktion multipliziert, welche wir in
einer Potenzreihe entwickeln. Diese Potenzreihe muss im Allgemeinen abbrechen, um Normierbarkeit zu gewährleisten. Daher bilden wir Rekursionrelationen für deren Koeffizienten und suchen eine Abbruchbedingung, die dann die Rolle einer Quantisierungsbedingung
spielt.
Die verbleibende DGL für die nun abbrechende Potenzreihe lässt sich bei exakt lösbaren
Problemen immer auf ein aus der Mathematik bekanntes orthogonales Funktionensystem
zurückführen.
Da die Schrödingergleichung eine DGL zweiter Ordnung ist, gibt es zwei beliebige Konstanten, die durch Anfangsbedingungen fixiert werden. Eine davon wird in jedem Fall durch
die Normierungsbedingung fixiert. Wenn Parität eine Symmetrie der DGL ist, kann jeweils
eine der beiden Konstanten auf Null gesetzt werden, um gerade oder ungerade Lösungen
zu erhalten.
106
7.5
Kohärente Zustände
Als kurzen Exkurs greifen wir hier kohärente Zustände auf, ohne auch nur zu versuchen,
diese umfassend und systematisch einzuführen. Wir verweisen hierbei auf die weiter unten
genannte originale Literatur. Kohärente Zustände sind Eigenzustände des Vernichters b
a,
d.h. es gilt
b
aφα = αφα .
(7.80)
Da b
a nicht hermitesch ist, ist α = |α| eiϕ offensichtlich komplex. Bis auf den Grundzustand φ0 , der trivialerweise ein kohärenter Zustand ist, sind diese im Allgemeinen Superpositionen von Fock-Raum Zuständen zu unendlich vielen verschiedenen Eigenwerten des
b . Eine wesentliche Eigenschaft der kohärenten Zustände ist,
Besetzungszahloperators N
dass zwischen allen diesen Fock-Raum Zuständen eine präzise definierte komplexe Phasenbeziehung besteht55 . Daher sind kohärente Zustände beispielsweise eine angemessene
Form der Beschreibung von Laserstrahlen, deren Eigenschaften sich nicht ändern, wenn
man einzelne Photonen aus dem Strahl heraus nimmt.
Man kann nun jeden kohärenten Zustand als Superposition von unendlich vielen FockRaum Zuständen schreiben und findet damit die kohärente Wellenfunktion,
φα (x) = hχx | φα i =
∞
X
hχx | φn i hφn | φα i
n=0
∞
∞
1 2 X αn
1 2 X αn
√ hχx | φn i = exp − |α|
√ φn (x).
= exp − |α|
2
2
n!
n!
n=0
n=0
(7.81)
Die zeitabhängigen kohärenten Zustände werden dann aus den zeitabhängigen Fock-Raum
Zuständen gewonnen,
∞
∞
1 2 −i ωt X (αe−iωt )n
1 2 X αn
√ ψn (x, t) = exp − |α| e 2
√
φn (x),
ψα (x, t) = exp − |α|
2
2
n!
n!
n=0
n=0
(7.82)
bzw. nach Definition des zeitabhängigen α(t) = αe−iωt
ωt
ψα (x, t) = φα(t) (x)e−i 2 .
(7.83)
Wenn man nun den Ortserwartungswert für den kohärenten Zustand |αi bestimmt, findet
man nach kurzer Rechnung
hb
xit,α = hψα (t) | x
bψα (t)i = φα(t) x
bφα(t)


†

x0  x0 φα(t) + φα(t) b

a +b
a)φα(t) = √ 
b
a
φ
a
φ
= √ φα(t) (b
α(t)
α(t)
{z
} |
{z
}
2
2 |
α∗ (t)hφα(t) | φα(t) i
α(t)hφα(t) | φα(t) i
√
√
x0
= √ (α∗ (t) + α(t)) = 2x0 Re (αe−iωt ) = 2x0 |α| cos (ωt − ϕ).
(7.84)
2
Daher kann man sagen, dass kohärente Zustände eine Oszillation zeigen, die der Lösung
der Klassischen Bewegungsgleichungen sehr ähnlich ist.
55
Im Gegensatz ist bei einem Fock-Raum die Phase völlig beliebig.
107
Zur weiteren Vertiefung empfehlen wir die TUM Physik Zentralübungen sowie als Literatur typische Lehrbücher aus der Literatursammlung und natürlich die originalen Publikationen von E. Schrödinger56 und R.J. Glauber57 . Gerade die Publikation von Schrödinger
aus der Frühzeit der Quantenmechanik ist recht kurz und mit ihrem bisherigen physikalischen Wissen gut nachvollziehbar, so dass wir Ihnen diese zur entspannten Lektüre
wärmstens empfehlen.
Literaturempfehlung:
A. Messiah
J.J. Sakurai
F. Schwabl
S. Weinberg
Quantum Mechanics, Volume 1
Section 12
Modern Quantum Mechanics, 2nd Ed. Kapitel 2.3
Quantenmechanik, Bd. 1
Kapitel 3.1
Lectures on Quantum Mechanics
Section 2.5
56
E. Schrödinger, Die Naturwissenschaften 14, 664 (1926) “Der stetige Übergang von der Mikro- zur
Makromechanik”.
57
Roy J. Glauber, Phys. Rev. 130, 2529, (1963) “The Quantum Theory of Optical Coherence”.
108
8
Anwendungen der Schrödingergleichung mit Separation der Variablen:
Teilchen im Zentralpotential
Wie wir gesehen haben, ist ein wesentlicher Bestandteil der Untersuchung eines physikalischen Systems in der QM die Lösung der zeitunabhängigen Schrödingergleichung. Insbesondere tritt diese Eigenwertgleichung bei den zwei in der Quantenphysik am häufigsten
anzutreffenden Problemen auf, nämlich:
• die Bestimmung der Energieniveaus von Bindungszuständen – diese sind Eigenwerte
des diskreten Spektrums des Hamiltonoperators,
• die Bestimmung der Streuwirkungsquerschnitte.
Die Schrödingergleichung in der Wellenmechanik ist eine partielle DGL zweiter Ordnung.
Für ein eindimensionales System reduziert sich diese auf eine gewöhnliche DGL. Wir haben
Eigenwertprobleme dieser Art in einer Dimension in den Kapiteln 6 und 7 betrachtet.
Im Allgemeinen ist das Problem schwieriger, wenn eine größere Zahl von Dimensionen
vorliegt.
8.1
Schrödinger Gleichung in drei Dimensionen
Im dreidimensionalen Fall hat die stationäre Schrödingergleichung,
~2
∆x + V (x) φ(x) = Eφ(x)
−
2m
(8.1)
für einen gegebenen Wert von E unendlich viele linear unabhängige Lösungen. Die einzige bekannte allgemeine Lösungsmethode ist die Methode der Trennung der Variablen
(multiplikativer Separationsansatz), welche jedoch nur anwendbar ist, falls das Potential
einige spezielle Symmetrieeigenschaften besitzt.
Symmetrieeigenschaften des Hamiltonoperators können im Allgemeinen das Finden der
Lösung erleichtern. Insbesondere kann in manchen Fällen eine passende Variablensubstitution dazu führen, dass die partielle DGL in den neuen Variablen separabel ist. Das
Eigenwertproblem wird in mehrere einfachere Eigenwertprobleme aufgespalten, die eine
jeweils geringere Zahl an Dimensionen betreffen.
Ein solcher Fall tritt beim Teilchen im Zentralpotential auf, d.h. bei einem Potential,
das lediglich vom Abstand r des Teilchens zum Kraftzentrum, aber nicht von der Richtung des Vektors r (vom Kraftzentrum zum Teilchen) abhängt. Da der Hamiltonoperator
sphärische Symmetrie besitzt, entkoppeln die Variablen vollständig, wenn man das Problem mittels sphärischer Polarkoordinaten (Kugelkoordinaten) löst. Nach Separation der
Winkelvariablen reduziert sich die Lösung der Schrödingergleichung auf die Lösung einer
gewöhnlichen DGL ausschließlich in der radialen Variable. Eine solche Gleichung kann
immer numerisch integriert werden. Für den Fall eines freien Teilchens, für das CoulombPotential und für den harmonischen Oszillator kann die separierte Schrödingergleichung
analytisch gelöst werden.
109
Der einfachste Fall eines Potentials, dessen Lösung durch Separation der Variablen erhalten werden kann, ist
V (x) = V1 (x) + V2 (y) + V3 (z).
(8.2)
Sie werden dieses Problem auf dem Übungsblatt 10 betrachten. Dieses Problem beinhaltet
bereits den Fall V = 0, d.h. ein freies Teilchen, für welches das Problem mittels Trennung der Variablen lösbar ist (für verschiedene Wahlmöglichkeiten der Koordinaten – auf
Blatt 10 werden Sie die Lösung in kartesischen Koordinaten betrachten, in der Vorlesung
verwenden wir Kugelkoordinaten).
8.2
Zentralpotential
Wir betrachten ein Zentralpotential
V ≡ V (r),
r=
p
x2 + y 2 + z 2 = |x| , x = (x, y, z),
(8.3)
für das auch als Bezeichnung “Potential mit sphärischer Symmetrie” gebräuchlich ist. Wir
müssen nun
2
~
b
Hφ(x)
= −
∆x + V (r) φ(x) = Eφ(x)
(8.4)
2m
lösen. Da das Problem sphärische
gelkoordinaten zu formulieren,

 x=
y=

z=
Symmetrie aufweist, ist es günstig, dieses mittels Kur cos ϕ sin ϑ 0 ≤ r < ∞
r sin ϕ sin ϑ 0 ≤ ϑ < π ,
r cos ϑ
0 ≤ ϕ < 2π
(8.5)
vgl. Abb. D.34. Wir haben die Variablensubstitution von kartesischen zu sphärischen Polarkoordinaten bereits in Übungsaufgabe 6.1 durchgeführt. Dabei fanden wir für den
Laplace-Operator
∆x =
∂2
∂2
1 ∂ 2∂
1
∂
1
∂
∂2
∂2
+
+
=
r
+
sin
ϑ
+
.
∂x2 ∂y 2 ∂z 2
r2 ∂r ∂r r2 sin ϑ ∂ϑ
∂ϑ r2 sin2 ϑ ∂ϕ2
(8.6)
Wir haben ebenso gezeigt, dass dieser Ausdruck mit
∆x =
1 ∂ 2∂
1 b2
r
− 2 2L
2
r ∂r ∂r ~ r
b 2 als
übereinstimmt, wobei das Quadrat des Drehimpulsoperators L
2
1
∂
∂
1
∂
2
2
b = −~
L
sin ϑ
+
sin ϑ ∂ϑ
∂ϑ sin2 ϑ ∂ϕ2
(8.7)
(8.8)
identifiziert wird und der quantenmechanische Drehimpulsoperator durch
b = x × p = ~ (x × ∇x )
L
i
(8.9)
definiert ist, vgl. Glgn. (5.142) und (5.82). Damit können wir Glg. (8.4) in Kugelkoordinaten umschreiben,
110
1 ∂
1
∂
∂
1
∂2
2 ∂
r
φ(r, ϑ, ϕ) + 2
sin ϑ φ(r, ϑ, ϕ) + 2 2
φ(r, ϑ, ϕ)
r2 ∂r
∂r
r sin ϑ ∂ϑ
∂ϑ
r sin ϑ ∂ϕ2
2m
+ 2 [E − V (r)] φ(r, ϑ, ϕ) = 0.
(8.10)
~
Wir bemerken, dass die Abbildung auf Kugelkoordinaten auf der z-Achse nicht bijektiv
ist, insbesondere im Punkt r = 0. Die Punkte auf der z-Achse und der Ursprung r = 0
sind singuläre Punkte der Transformation. Dies spiegelt sich in den Singularitäten der Koeffizienten von Glg. (8.10) für r = 0 und ϑ = 0, π wider, welche in der kartesischen Form
der Gleichung nicht auftreten. Insbesondere besitzt eine Lösung von Glg. (8.10) Singularitäten in diesen Punkten unabhängig davon, ob V (r) Singularitäten besitzt oder nicht.
Daher müssen wir Lösungen derart auswählen, dass sie auch an diesen Punkten endlich
(für x → xj muss gelten: limx→xj φ(x) = endlich) und stetig sind, vgl. Abschnitt 4. Eine
ähnliche Komplikation tritt auch bezüglich ϕ auf. Eine Lösung von Glg. (8.10) könnte für
gegebene Werte von r und ϑ verschiedene Werte für ϕ = 0 und ϕ = 2π annehmen, so dass
die Funktion und ihre Ableitungen nicht automatisch stetig in ϕ = 0 wären. Wir müssen
daher die Stetigkeit der Lösung für ϕ = 0 explizit fordern.
8.2.1
Multiplikativer Separationsansatz
Nun wollen wir Glg. (8.10) lösen und beginnen mit einem multiplikativen Separationsansatz für ϑ und ϕ,
φ(r, ϑ, ϕ) = R(r)Y (ϑ, ϕ).
(8.11)
Wir setzen Glg. (8.11) in Glg. (8.10) ein, multiplizieren mit r2 /(RY ) und erhalten
1
∂ 2Y
2m
∂
∂Y
1
1 ∂
2
2 ∂R
= 0. (8.12)
r
+ 2 [E − V (r)] r +
sin ϑ
+
R ∂r
∂r
~
Y sin ϑ ∂ϑ
∂ϑ
Y sin2 ϑ ∂ϕ2
Dies zerfällt in zwei separate Gleichungen,
1
∂
∂Y
1
∂ 2Y
= − λ,
sin ϑ
+
Y sin ϑ ∂ϑ
∂ϑ
Y sin2 ϑ ∂ϕ2
1 d 2 dR
2m
r
+ 2 [E − V (r)] r2 = λ.
R dr
dr
~
(8.13)
(8.14)
Die erste dieser Gleichungen ist unabhängig von V (r) und damit allgemeingültig für ein
Teilchen in einem beliebigen Zentralpotential. Wir können zusätzlich noch in Y (ϑ, ϕ) die
Abhängigkeit von ϑ und ϕ separieren, indem wir den Ansatz
Y (ϑ, ϕ) = Θ(ϑ)Φ(ϕ)
(8.15)
verwenden. Dann finden wir
d2 Φ
+ µΦ =0,
dϕ2
h
1 d
dΘ
µ i
sin ϑ
+ λ−
Θ =0.
sin ϑ dϑ
dϑ
sin2 ϑ
111
(8.16)
(8.17)
Daher ist das Problem, die Eigenwerte und Eigenvektoren des Hamiltonoperators mit V (r)
zu finden auf die Suche nach Lösungen zu Glgn. (8.14), (8.16) und (8.17) reduziert, welche
quadratintegrabel und inklusive ihrer ersten Ableitungen stetig in den Diskontinuitäten
sind.
8.2.2
Die Azimuthalgleichung
Die Lösung von Glg. (8.16) ist einfach. Wir müssen
Φ0 (0 = Φ0 (2π),
Φ(0) = Φ(2π),
Φ00 (0) = Φ00 (2π)
(8.18)
fordern und finden für µ = 0
Φ = A + Bϕ.
(8.19)
Aus Glg. (8.18) folgt B = 0. Für µ 6= 0 finden wir
Φ = Aei
√
µϕ
+ Be−i
√
µϕ
.
(8.20)
Aus Glg. (8.18) folgt wiederum
A + B = Aei
√
µ 2π
+ Be−i
√
µ 2π
A − B = Aei
,
√
µ 2π
− Be−i
√
µ 2π
.
(8.21)
Die Bedingung für welche dieses System eine nicht-triviale Lösung hat ist
√
√
1 − ei µ 2π
√
1 − e−i √µ 2π !
√
(8.22)
1 − ei µ 2π −(1 − e−i µ 2π ) = 4(cos(2π µ) − 1) = 0,
√
was nur eine Lösung hat, falls µ eine ganze Zahl ist. In diesem Fall werden automatisch
alle Stetigkeitsbedingungen in Glg. (8.18) erfüllt.
Eine mögliche Wahl von unabhängigen Eigenfunktionen ist durch
Φm (ϕ) = Am eimϕ ,
m = 0, ±1, ±2, . . .
(8.23)
gegeben, wobei die Eigenwerte
µm = m2
(8.24)
sind. Der Koeffizient Am wird aus der Normierungsbedingung bestimmt,
Z2π
Z2π
2
dϕ |Φm |
1=
⇒1=
0
1
⇒ Am = √ ,
2π
dϕ |Am |2
(8.25)
0
0
und wir finden Orthogonalität für m 6= m ,
Z2π
dϕ
Φ∗m (ϕ)Φm0 (ϕ)
Z2π
=
0
0
dϕ ei(m −m)ϕ = 0.
(8.26)
0
Mit beiden Gleichungen zusammen können wir also
Z2π
dϕ Φ∗m (ϕ)Φm0 (ϕ) = δm m0
(8.27)
0
schreiben. Wir bemerken, dass {Φm (ϕ)} die Fourier-Basis von L2 (0, 2π) ist und in diesem
Raum vollständig ist.
112
8.2.3
Die Polargleichung
Wir setzen in Glg. (8.17) µ = m2 ein und transformieren die Variable zu q = cos ϑ58 .
Somit lautet die Polargleichung
m2
d
2 dΘ
(1 − q )
+ λ−
Θ = 0,
(8.29)
dq
dq
1 − q2
bzw.
d2 Θ
λ
2q dΘ
m2
+
Θ = 0,
−
−
dq 2
1 − q 2 dq
1 − q 2 (1 − q 2 )2
(8.30)
wobei der Definitionsbereich von Θ(q) durch ϑ ∈ (0, π) ⇒ q ∈ (−1, +1) gegeben ist.
Hierbei kann Glg. (8.30) als die verallgemeinerte Legendre’sche DGL erkannt werden.
Indem wir aus den Lösungen von Glg. (8.30) jene auswählen, die an den Intervallgrenzen
(des Definitionsbereiches) – d.h. q → ±1 – endlich sind, beschränken wir den Wert von λ
auf die Form
λ = (ν + |m|)(ν + |m| + 1),
ν = 0, 1, 2, . . . .
(8.31)
Wir können dann ` = ν + |m| definieren und die Eigenwerte als
` = |m| , |m| + 1, . . .
λ = `(` + 1),
(8.32)
schreiben. Die Eigenfunktionen sind durch
|m|
|m|
|m|
|m|
Θ` (q) = C` P` (q) = C` (−1)|m| (1 − q 2 )
|m|
2
d|m|
P` (q)
dq |m|
(8.33)
|m|
gegeben und daher assoziierte Legendre-Polynome P` , die ausgehend von gewöhnlichen
Legendre-Polynomen59 P` berechnet werden können. Die P` erfüllen die Rodrigues-Formel
1 d`
P` (q) = (−1) `
(1 − q 2 )` .
`
2 `! dq
`
(8.34)
Die ersten Legendre-Polynome lauten
P0 (q) = 1,
P1 (q) = q,
1
P2 (q) = (3q 2 − 1),
2
1
P3 (q) = (5q 3 − 3q),
2
(8.35)
und die ersten assoziierten Legendre-Polynome60 sind (siehe auch Wikipedia)
P11 (q) = −
p
1 − q2,
p
15q 2 − 3 p
1 − q 2 , P31 (q) = −
1 − q2,
2
P22 (q) = 3(1 − q 2 ), P32 (q) = +15q(1 − q 2 ),
P21 (q) = −3q
3
P33 (q) = −15(1 − q 2 ) 2 .
58
Wegen dq = − sin ϑdϑ gilt
d
d
= − sin ϑ .
dϑ
dq
59
60
(8.36)
Sie finden dazu mehr Details in mathematischer Standardliteratur oder auch auf Wikipedia.
Es gilt offensichtlich Pn0 (q) = Pn (q).
113
(8.28)
Die assoziierten Legendre-Polynome erfüllen die Orthogonalitätsrelationen (d.h. Orthogonalität für unterschiedliche ` 6= `0 )
Z+1
|m|
|m|
dq P`0 (q)P` (q) =
2 (` + |m|)!
δ`0 ` ,
2` + 1 (` − |m|)!
(8.37)
−1
aber sind für unterschiedliche m 6= m0 nicht orthogonal,
Z+1
|m0 |
|m|
dq P`0 (q)P` (q) 6= 0.
(8.38)
−1
Aus Glg. (8.37) folgt für die Normierung der Wellenfunktion
s
2` + 1 (` − |m|)!
|m|
C` =
.
4π (` + |m|)!
(8.39)
Zusammenfassung des Winkelanteils
Die Wellenfunktion wird mit Separationsanatz in der Form
φ(r, ϑ, ϕ) = R(r)Y` m (ϑ, ϕ)
(8.40)
geschrieben, wobei die Kugelflächenfunktionen (“spherical harmonics”) Y` m durch
s
|m|−m
2` + 1 (` − |m|)! |m|
Y` m (ϑ, ϕ) = (−1) 2
P (cos ϑ)eimϕ
(8.41)
4π (` + |m|)! `
gegeben sind. Dabei sind die Werte der Konstanten m und ` auf
m = 0, ±1, ±2, . . . ,
` = 0, 1, 2, . . .
` = |m| , |m| + 1, . . .
m = −`, −` + 1, . . . , ` − 1, `
bzw.
(8.42)
(8.43)
beschränkt. Die Kugelflächenfunktionen Y` m bilden ein vollständiges Orthonormalsystem
auf L2 (Ω), d.h. alle quadratintegrablen Funktionen auf der Sphäre lassen sich nach den
Y` m zerlegen. Die Orthonormalitätsrelation lautet
Z2π
Zπ
dϕ
0
dϑ sin ϑY`∗0 m0 (ϑ, ϕ)Y` m (ϑ, ϕ) = δm0 m δ`0 ` .
(8.44)
0
Für das Raumwinkelelement schreiben wir auch
dΩ = sin ϑdϑdϕ = d cos ϑ dϕ.
(8.45)
Die Y` m sind tabelliert, z.B. auf Wikipedia. Einige der ersten Lösungen werden hier gezeigt,
r
1
Y0 0 (ϑ, ϕ) =
,
4π
114
r
Y1 0 (ϑ, ϕ) =
Y1 ±1 (ϑ, ϕ) =
Y2 0 (ϑ, ϕ) =
Y2 ±1 (ϑ, ϕ) =
Y2 ±2 (ϑ, ϕ) =
3
cos ϑ,
4π
r
3
∓
sin ϑe±iϕ ,
8π
r
45
1
2
cos ϑ −
,
16π
3
r
15
sin 2ϑe±iϕ ,
∓
32π
r
15
sin2 ϑe±2iϕ .
32π
(8.46)
b 2,
Wie wir bereits angemerkt haben, entspricht Glg. (8.13) der Eigenwertgleichung von L
b 2 Y` m = λY` m
L
b 2 Y` m = `(` + 1)~2 Y` m .
L
→
(8.47)
Darüber hinaus gilt
~ ∂
bz = x
L
bpby − ybpbx =
i ∂ϕ
(8.48)
bz Y` m = m~Y` m ,
L
(8.49)
und
wobei die Eigenwerte auf ` = 0, 1, . . . , ∞ und m = −`, −` + 1, . . . , ` beschränkt sind. Wir
werden diese Gleichungen auch mit der algebraischen Methode (in einer gewissen Analogie
zum harmonischen Oszillator) im Kapitel zum Drehimpuls erhalten. Wir können daher
b 2 und L
b L
bz betrachten.
sagen, dass wir gemeinsame Eigenfunktionen von H,
8.2.4
Die Radialgleichung
Wir wollen nun die Radialwellenfunktion R(r) betrachten, welche eine Lösung von
1 d 2 dR
2m
`(` + 1)
r
+ 2 E − V (r) −
R=0
(8.50)
r2 dr
dr
~
r2
sein muss. Die Bedingung, dass φ(x) quadratintegrabel ist, lautet
Z∞
dr r2
0
Zπ
Z2π
dϑ sin ϑ
0
dϕ |φ(r, ϑ, ϕ)|2 < ∞.
(8.51)
0
Daraus folgt für den Radialteil der eigentlichen Eigenfunktionen
Z∞
dr r2 |R(r)|2 < ∞.
(8.52)
0
Für die uneigentlichen Eigenfunktionen ergibt sich
E+∆E
2
Z
Z∞
2
0
dr r dE RE 0 (r) < ∞.
0
E
115
(8.53)
Wir verwenden die Identität
1 d 2 dR
1 d2
r
=
[rR]
r2 dr
dr
r dr2
(8.54)
um Glg. (8.50) zu vereinfachen. Wir definieren
R(r) =
y(r)
r
und setzen dies in Glg. (8.50) ein,
~2 d2
~2 `(` + 1)
−
y(r) = Ey(r),
+ V (r) +
2m dr2
2m r2
(8.55)
(8.56)
und verlangen für die eigentlichen Eigenfunktionen
Z∞
dr |y(r)|2 < ∞
(8.57)
0
bzw. für die uneigentlichen Eigenfunktionen
E+∆E
2
Z
Z∞
dr dE 0 yE 0 (r) < ∞.
0
(8.58)
E
Die Regularitätsanforderungen an R(r) übertragen sich also in Regularitätsanforderungen
an y(r) für r > 0 und in die Forderung, dass y(0) → 0. Damit R endlich bleibt heißt dies
y(r)
7−→
r r→0
endlich.
(8.59)
Man kann für ein Potential der Form V (r) = f /r + V1 (r)61 zeigen, dass zwei Lösungen
y(r) existieren, deren Verhalten bei r → 0 durch
r`+1
r−`
y(r)
(8.60)
beschrieben wird. Nur die erste dieser Lösungen genügt der Regularitätsbedingung in
Glg. (8.59), während die zweite verworfen werden muss. Daher sehen wir, dass das Problem der Bestimmung der Eigenwerte und der eigentlichen und uneigentlichen Eigenfunktionen des Hamiltonoperators für ein Teilchen im Zentralpotential auf das entsprechende
eindimensionale Problem eines Teilchens auf einer Achse im effektiven Potential
V eff (r) ≡ V (r) +
~2 `(` + 1)
2m r2
für r > 0 und V = ∞ für r ≤ 0
(8.61)
reduziert worden ist. Wir sehen, dass V eff von ` abhängt. Wir können den aufgrund
des Bahndrehimpulses des Teilchens auftretenden Term ~2 `(` + 1) als die Stärke eines
Zentrifugalpotentials interpretieren.
61
Hierbei nehmen wir an, dass V1 (r) eine reguläre Funktion ist, also insbesondere keinerlei Singularität
bei r → 0 besitzt.
116
Nun wollen wir die Lösungen von Glg. (8.56) besprechen. Wir können für Glg. (8.56)
ähnliche Betrachtungen wie für die eindimensionale Schrödingergleichung anstellen. Wir
nehmen an, dass V (r) für r → ∞ gegen Null strebt,
lim V (r) = 0,
(8.62)
r→∞
und von kurzer Reichweite ist, wobei ebenfalls
Z∞
dr |V (r)| < ∞
(8.63)
a
für ein beliebiges a > 0 gelten muss. Dann ist für jedes gegebene ` das asymptotische
Verhalten der Lösungen für E < 0 von der Form
√
√
+ ~1 2m|E|r
− ~1 2m|E|r
+ B` (E)e
E<0
(8.64)
y` (r) 7−→ A` (E)e
r→∞
und für E > 0 von der Form
i
y` (r) 7−→ C` (E)e− ~
r→∞
√
2mEr
i
+ D` (E)e+ ~
√
2mEr
,
E > 0.
(8.65)
Nachdem wir die Regularität am Ursprung einfordern, vgl. Glg. (8.59), sind die Koeffizienten A` (E), B` (E), C` (E) und D` (E) bis auf eine multiplikative Konstante vollständig
bestimmt62 .
Im Fall E < 0 ist es klar, dass wir in Glg. (8.64) um eine L2 (R3 )Funktion zu erhalten
B` = 0
(8.66)
fordern müssen. In diesem Fall erhalten wir eigentliche Eigenfunktionen, d.h. Glg. (8.57)
ist erfüllt. Die Eigenwerte zu diesen Eigenfunktionen sind E0` , E1` , . . . und wir stellen
fest, dass grundsätzlich E0` > min[V eff (r)] gilt (für r ∈ (0, ∞)). Wir werden mit nr den
ganzzahligen Index der Energieeigenwerte (Enr ` ) bezeichnen.
√
Im Fall E > 0 sind die Eigenfunktionen yp` , wobei p = 2mE der Impuls ist, keine
eigentlichen Eigenfunktionen und genügen
E+∆E
2
Z
Z∞
√
0
(8.67)
dr dE yp` (r) < ∞,
wobei p = 2mE 0 .
0
E
Damit verfügen wir über einen vollständigen Satz von eigentlichen {ynr ` (r)} und uneigentlichen {yp` } Eigenfunktionen, so dass
Z∞
dr yn∗ 0r ` (r)ynr ` (r) = δn0r nr
(8.68)
0
Z∞
∗
dr yp`
(r)ynr ` (r) = 0
0
62
Die Begründung hierfür werden Sie später in der Herleitung von Glg. (8.86) verstehen.
117
(8.69)
Z∞
dr yp∗0 ` (r)yp` (r) = δ(p0 − p)
(8.70)
0
gilt. Wir bemerken, dass im Allgemeinen
Z∞
dr yn∗ 0r `0 (r)ynr ` (r) 6= 0,
(8.71)
0
gilt, da yn0r `0 und ynr ` Eigenfunktionen zu zwei unterschiedlichen Operatoren sind. Wir
bilden damit die gesamte Wellenfunktion,
1
φnr `m (r, ϑ, ϕ) = Rnr ` (r)Y` m (ϑ, ϕ) = ynr ` (r)Y` m (ϑ, ϕ),
(8.72)
r
1
φp`m (r, ϑ, ϕ) = Rp` (r)Y` m (ϑ, ϕ) = yp` (r)Y` m (ϑ, ϕ),
(8.73)
r
wobei als Indizes die Quantenzahlen nr = 0, 1, . . ., ` = 0, 1, . . . und m = −`, −` + 1, . . . , `
sowie der Impuls p ∈ (0, ∞) auftreten. Glgn. (8.72) und (8.73) bilden eine vollständige
b Das Spektrum von H
b besteht aus einem System diskreter Eigenwerte im
ONEB von H.
Intervall zwischen dem Minimum von V (r) und Null (die zu den eigentlichen Eigenfunktionen gehören) und aus einem kontinuierlichen Spektrum, das sich von Null bis +∞
ausdehnt (und den uneigentlichen Eigenfunktionen entspricht). Die Orthogonalität und
Normierung der φnr `m und φp`m sind direkte Konsequenzen der Glgn. (8.68) - (8.70) und
Glg. (8.44). Tatsächlich erhalten wir aus diesen Gleichungen
Z
3
dr
φ∗n0r `0 m0 (x)φnr ` m (x)
Z∞
=
dr
yn∗ 0r `0 (r)ynr ` (r)
Z
dΩ Y`∗0 m0 (ϑ, ϕ)Y` m (ϑ, ϕ)
0
Z∞
dr yn∗ 0r `0 (r)ynr ` (r) δ`0 ` δm0 m = δn0r nr δ`0 ` δm0 m
(8.74)
und auf gleiche Art und Weise
Z
d3 r φ∗p`0 m0 (x)φnr `m (x) = 0
Z
d3 r φ∗p0 `0 m0 (x)φp`m (x) = δ(p0 − p)δ`0 ` δm0 m .
(8.75)
=
0
(8.76)
Die Vollständigkeit dieser Basis kann gezeigt werden. Diese ist klar verständlich, wenn
man sich bewusst macht, dass L2 (R3 ) in das Tensorprodukt von L2 ((0, ∞), r2 dr)63 und
L2 (Ω) zerlegt werden kann.
b werden durch die Quantenzahlen
Die Eigenfunktionen von H
nr , `, m
p, `, m
63
diskretes Spektrum
kontinuierliches Spektrum
(8.78)
L2 ((0, ∞), r2 dr) ist so definiert, dass
Z∞
2
dr r2 |R(r)| < ∞.
0
118
(8.77)
bestimmt, wobei
nr
`
m
radiale Quantenzahl
azimutale Quantenzahl
magnetische Quantenzahl
(8.79)
genannt werden64 . nr ist dabei die Anzahl der Nullstellen (mit r > 0, d.h. außerhalb des
Ursprungs) der Funktion ynr ` (r). Sie sehen in Abb. D.35 das charakteristische Verhal~2 `(`+1)
für
ten der radialen Wellenfunktion für nr = 0, 1, 2. Da das Zentrifugalpotential 2m
r2
größere Werte von ` stark zunimmt, wachsen die Eigenwerte Enr ` für festes nr mit steigendem ` deutlich an. Es gilt Enr ` < Enr `0 falls ` < `0 . Wir bemerken ebenfalls, dass die
eigentlichen Eigenwerte (Energieniveaus) Enr ` nicht von der Quantenzahl m abhängen.
Daher ist m von seinem Wesen her ein Entartungsindex und der Eigenwert Enr ` hat mindestens den Entartungsgrad 2` + 1. Im Allgemeinen entsprechen verschiedene Werte der
Quantenzahlen (nr , `) verschiedenen Werten der Energieeigenwerte. Das Auftreten zweier gleicher Energieeigenwerte En0r `0 = Enr ` für verschiedene (n0r , `0 ) 6= (nr `) nennt man
zufällige Entartung (accidental degeneracy). Ein wesentliches Beispiel dafür tritt beim
Coulomb-Potential auf. Die Anzahl der gebundenen Zustände kann – abhängig von der
Form des Potentials V (r) – endlich oder auch (abzählbar) unendlich sein. Eine hinreichende Bedingung für eine endliche Zahl der Bindungszustände ist, dass für große Abstände
das Potential V (r) schneller als 1/r2 zu Null abfällt.
Die Eigenwerte
des kontinuierlichen Spektrums werden vollständig durch den Parameter
√
p = 2mE bestimmt. In diesem Fall sind sowohl ` als auch m Entartungsindizes und
der Entartungsgrad ist unendlich. Wir betrachten nun Glg. (8.65) und verwenden die
Beziehung65
Zr
dyp` (r) dyp∗0 ` (r)
∗
= ~ yp0 ` (r)
−
yp` (r)
(p − p ) dr
dr
dr
0
nh
h
i
i
i
2
∗ 0 − ~i p0 r
∗ 0 ~i p0 r i
pr
− ~i pr
~
7−→ ~
C` (p )e
p C` (p)e − D` (p)e
+ D` (p )e
r→∞
~
h
ih
io
i
i 0 ∗ 0 − i p0 r
∗ 0 ~i p0 r
pr
− ~i pr
~
~
− D` (p )e
C` (p)e + D` (p)e
+ p C` (p )e
h ~
i
i
i
0
0
= C`∗ (p0 )C` (p)e ~ (p−p )r − D`∗ (p0 )D` (p)e ~ (p −p)r i~(p0 + p) + . . . ,
02
2
yp∗0 ` (r0 )yp` (r0 )
2
(8.80)
wobei . . . für verschiedene Terme steht, die im Fall gleicher Impulse verschwinden66 .
Dann gilt für p0 = p, dass die linke Seite verschwindet. Daher gilt aufgrund der rechten
Seite
|C` (p)|2 = |D` (p)|2 ,
(8.82)
64
Die Bezeichnung von ` als azimutale Quantenzahl, wie sie teilweise in der Literatur gebräuchlich
ist, mutet befremdlich an, wenn man bedenkt, dass die entsprechende Quantisierungsbedingung aus der
Polargleichung folgt. Von daher ist die Bezeichung als Drehimpulsquantenzahl sehr viel eingängiger. Namen
sind Schall und Rauch, merken Sie sich einfach “`”!
65
Diese Beziehung ist leicht aus der Schrödingergleichung zu erhalten.
66
Diese Terme sind die folgenden Kombinationen von C` und D` :
i
h
0
0
i
i
C`∗ (p0 )D` (p)e− ~ (p +p)r − D`∗ (p0 )C` (p)e ~ (p+p )r i~(p0 − p).
(8.81)
119
so dass sich C` (p) und D` (P ) nur durch eine Phase unterscheiden können. Dann gilt
(p−p0 )r
Zr
sin
~
dr0 yp∗0 ` (r0 )yp` (r0 ) 7−→ 2~ |C` (p)|2
7−→ 2π~ |C` (p)|2 δ(p − p0 ),
(8.83)
0
r→∞
r→∞
p −p
0
so dass die Normierungsbedingung
|C` (p)| = √
1
2π~
(8.84)
erfordert. Unter diesen Umständen können wir die Phasenfaktoren so wählen, dass
C` (p) = √
1
eiα` (p) ,
2π~
1
e−iα` (p) ,
2π~
(8.85)
2
pr
cos [ + α` (p)]
π~
~
(8.86)
D` (p) = √
so dass die uneigentliche Eigenfunktion die Form
i
i
1 h i pr+iα` (p)
yp` (r) 7−→ √
e~
+ e− ~ pr−iα` (p) =
r→∞
2π~
r
annimmt. Wir bemerken dass die Art des Potentials sich in dieser Betrachtung nur in
Form von α` (p), also der relativen Phase zwischen C` und D` , zeigt.
8.2.5
Parität
Ein Zentralpotential ist grundsätzlich invariant unter Parität, d.h. V (x) = V (−x), da
V (x) = V (r). Dann können die Eigenfunktionen als gerade oder ungerade Funktionen
geschrieben werden. Die Eigenfunktionen, die wir bereits gefunden haben, besitzen eine
wohldefinierte Parität. Tatsächlich gilt
φnr `m (−x) = (−1)` φnr `m (x),
φp`m (−x) = (−1)` φp`m (x).
(8.87)
Daher sind diese Eigenfunktionen gerade für gerades ` und ungerade für ungerades `.
Glg. (8.87) ist eine Konsequenz der Symmetrie der Kugelflächenfunktionen,
Y` m (π − ϑ, π + ϕ) = (−1)` Y` m (ϑ, ϕ),
(8.88)
und der Tatsache, dass x → −x in Polarkoordinaten der Transformation der Winkel
ϑ → π − ϑ,
ϕ→π+ϕ
(8.89)
entspricht. Die Symmetrie der Kugelflächenfunktionen in Glg. (8.88) ergibt sich wiederum
aus den Symmetrien ihrer Faktoren,
|m|
|m|
P` (−q) = (−1)`−|m| P` (q),
120
eim(ϕ+π) = (−1)m eimϕ .
(8.90)
8.3
Freies Teilchen in sphärischen Koordinaten
Ein spezieller Fall eines Potentials mit sphärischer Symmetrie ist der Fall von V = 0,
d.h. wir können den bereits entwickelten Formalismus anwenden, um die Lösung für ein
freies Teilchen in Kugelkoordinaten zu erhalten. Diese Lösung ist besonders nützlich für
Streuprozesse.√Wir verwenden die reduzierte Radialgleichung, Glg. (8.56), und setzen V =
0 (daher k = 2mE/~), um
d2 y
`(` + 1)
2
y=0
(8.91)
+ k −
dr2
r2
zu erhalten. Wir suchen Lösungen dieser Gleichung, und beginnen mit ` = 0. Dafür finden
wir zwei linear unabhängige Lösungen sin(kr) und cos(kr), von denen aber nur die erste
der Regularitätsbedingung am Ursrprung,
y(r) 7−→ O(r),
(8.92)
r→0
genügt und damit als Lösung akzeptabel ist. Für r → ∞ zeigt diese Lösung ein Verhalten
vom Typ der Glg. (8.65) und ist eine uneigentliche Eigenfunktion für E > 0. Für E < 0
divergiert die Lösung immer exponentiell, so dass keine Lösungen für E < 0 akzeptabel
sind. Die Normierung ergibt sich durch Vergleich mit Glg. (8.86),
r
pr
2
y0 (p, r) =
sin ,
(8.93)
π~
~
wobei der Impuls p = ~k ist. In diesem Fall haben wir bezüglich Glg. (8.86) die Phase
α0 (p) = −π/2.
Wir wollen nun ` 6= 0 betrachten. In diesen Fällen ist Glg. (8.91) nicht so einfach lösbar.
Wir führen zunächst die dimensionslose Variable ρ = kr ein, so dass Glg. (8.91) zu
d2 y` (ρ)
`(` + 1)
+ 1−
y` (ρ) = 0
(8.94)
dρ2
ρ2
wird. Wir haben bereits gesehen, dass eine Gleichung wie Glg. (8.94) im Allgemeinen zwei
unabhängige Lösungen hat, die sich für ρ → 0 wie ρ`+1 oder wie ρ−` verhalten. Man kann
zeigen, dass die akzeptablen Lösungen von der Form
` 1 d
sin ρ
`+1
y` (ρ) = N` ρ
(8.95)
ρ dρ
ρ
sind und für große ρ finden wir
d`
`π
`
y` (ρ) 7−→ N` ` sin ρ = N` (−1) sin ρ −
.
ρ→∞
dρ
2
(8.96)
Daher sind diese Lösungen für E > 0 uneigentliche Eigenfunktionen, die zum kontinuierlib in diesem Fall nur das kontinuierliche Spektrum,
chen Spektrum gehören. Daher besitzt H
das mit dem Intervall (0, ∞) identifiziert werden kann. Der vollständige Satz der Eigenfunktionen ist
r "
` #
2
1
d
sin
ρ
yp` (r) = (−1)`
ρ`+1
(8.97)
π~
ρ dρ
ρ
pr
ρ=
121
~
und in diesem Fall gilt
π
α` (p) = −(` + 1) .
2
Aus Glg. (8.97) erhalten wir die unreduzierten Radialfunktionen
r " ` #
2
yp` (r)
1 d
sin ρ
` 1
`
Rp` (r) =
= (−1) 3
p ρ
r
ρ dρ
ρ
~2 π
(8.98)
.
(8.99)
ρ= pr
~
Der in Glg. (8.99) auftretende Ausdruck
` `
j` (ρ) = (−1) ρ
1 d
ρ dρ
` sin ρ
ρ
(8.100)
ist eine “klassische” Funktion der mathematischen Physik und wird als sphärische Besselfunktion der ersten Art bezeichnet67 . Für diese gilt
ρ`
,
ρ→0 (2` + 1)!!
1
π
j` (ρ) 7−→ cos ρ − (` + 1) .
ρ→∞ ρ
2
j` (ρ) 7−→
(8.101)
Die ersten Besselfunktionen sind
sin ρ
,
ρ
3
j2 (ρ) =
−
ρ2
j0 (ρ) =
sin ρ cos ρ
j1 (ρ) = 2 −
,
ρ
ρ
1
3
sin ρ − 2 cos ρ, . . . .
ρ
ρ
(8.102)
Zusammenfassend können wir die Eigenfunktionen für ein freies Teilchen in Kugelkoordinaten als
r
pr
1
2
φp`m (r, ϑ, ϕ) = 3
pj` ( )Y` m (ϑ, ϕ)
(8.103)
~
~2 π
schreiben. Man kann eine nützliche Beziehung zwischen den durch Separation der Variablen in Kugelkoordinaten, Glg. (8.103), und in kartesischen Koordinaten erhaltenen
Eigenfunktionen,
i
1
p·x
~
(8.104)
ϕp (x) =
3 e
(2π~) 2
finden. Man findet
ϕp (x) =
X i`
`,m
p
Y`∗m (α, β)φp`m (r, ϑ, ϕ),
(8.105)
wobei α und β die Winkel sind, welche die Richtung von p bzgl. der kartesischen Achsen beschreiben. Wir verweisen hierbei auf das Streuproblem in Kugelkoordinaten auf
Übungsblatt 11.
67
Sie finden dazu mehr Details in mathematischer Standardliteratur oder auch auf Wikipedia.
122
8.4
Coulomb Potential und Wasserstoff Atom
Ein weiterer sehr wichtiger Typ von Zentralpotential ist das Coulomb Potential, welches
in der Untersuchung der Struktur des Wasserstoffatoms auftritt. Diese Betrachtung ist wesentlich für die Quantenphysik und die Grundlage für Diskussionen komplexerer Atome.
Wir werden die Bewegung eines Teilchens der Ladung −e0 und der Masse me (das Elektron) in einem Coulomb-Feld eines raumfesten Kerns der Ladung Ze0 (Wasserstoff-artiges
Atom) betrachten, d.h. das Potential ist
Ze20
.
V (r)) −
r
(8.106)
Dann lautet die Radialgleichung, Glg. (8.56):
d2 y
Ze20
`(` + 1)
2me
E+
−
y = 0.
+
dr2
~2
r
r2
Wir definieren
p
2m |E|
,
K=
~
a0 =
~2
,
e20 me
ζ=
Z
,
Ka0
(8.107)
(8.108)
wobei a0 der Bohr’sche Radius ist, vgl. Glg. (2.27).
Wir betrachten den Fall E < 0 (diskretes Spektrum) und führen einen dimensionslosen
Radius ein, ρ = 2Kr. Dann erhält Glg. (8.107) die vereinfachte Form
1 ζ `(` + 1)
d2 y
+ − + −
y=0
(8.109)
dρ2
4 ρ
ρ2
als DGL zweiter Ordnung in y(ρ). Wir wir bereits besprochen haben, kann man zeigen,
dass Glg. (8.109) zwei Lösungen hat,
ρ`+1
ρ−`
y(ρ)
(8.110)
und wir hatten auch bereits gesehen, dass lediglich die zweite Lösung akzeptabel ist (bei
ρ → 0). WIr haben ebenso bereits angesprochen, dass für ρ → ∞ der Teil ζ/ρ−`(`+1)/ρ2
zu Null abfällt und die Lösung sich asymptotisch wie
1
e2ρ
bzw.
1
e− 2 ρ
(8.111)
verhält, wobei hier nur das zweite Verhalten akzeptabel ist. Unter diesen Bedingungen
empfiehlt sich ein Ansatz
ρ
y` (ρ) = ρ`+1 e− 2 v` (ρ).
(8.112)
Wir setzen den Ansatz aus Glg. (8.112) in die Radialgleichung, Glg. (8.109), ein und
erhalten
d2 v`
dv`
ρ dρ2 + (2` + 2 − ρ)
− (` + 1 − ζ) v` = 0.
(8.113)
dρ
Glg. (8.113) ist ein Spezialfall der Gleichung
x
d2 η
dη
+ (c − x) − aη = 0
2
dx
dx
123
(8.114)
für die Funktion η(x). Diese wird als “konfluente” hypergeometrische Gleichung bezeichnet
und hat bekannte Lösungen. In den Fällen mit c 6= 0, −1, −2, . . . hat sie immer eine
Lösung, die mittels Potenzreihenansatzes bestimmt werden kann. Diese Lösung wird als
“konfluente” hypergeometrische Funktion bezeichnet und hat die allgemeine Form
Φ(a; c; x) ≡ 1 +
∞
X
a(a + 1) . . . (a + n − 1) xn
n=0
für c 6= 0, −1, −2, . . .
c(c + 1) . . . (c + n − 1) n!
(8.115)
wobei eine zweite linear unabhängige Lösung exisitiert,
η(x) = x1−c Φ(a − c + 1; 2 − c; x)
für c 6= 1, 2.
(8.116)
Falls c stattdessen eine positive ganze Zahl ist, z.B. c = n + 1 mit n = 0, 1, . . ., so ist die
zweite Linear unabhängige Lösung durch ΨI (a; n + 1; x) gegeben, wo ΨI (a; n + 1; x) die
logarithmische Ableitung der Gamma Funktion
Z∞
Γ (x) =
dt tx−1 e−t
(8.117)
0
ist. Für große Werte von x verhält sich ΨI (a; n + 1; x) wie
ΨI (a; n + 1; x) 7−→ log x.
(8.118)
ρ→∞
In unserem Fall ist
a = ` + 1 + ζ,
c = 2` + 2
` ∈ N0 .
(8.119)
Die zweite Lösung ist wegen ihres Verhaltens bei r → 0 nicht akzeptabel. Zusammenfassend finden wir also, dass die Lösung durch
ρ
y` (ρ) = Aρ`+1 e 2 Φ(` + 1 − ζ; 2` + 2; ρ)
(8.120)
gegeben ist und man kann zeigen, dass für
` + 1 − ζ 6= −nr ,
nr ∈ N0
(8.121)
y` (ρ) ein inakzeptables Verhalten bei ρ → ∞ aufweist und daher keine quadratintegrable
Lösung darstellt. Darum müssen wir
` + 1 − ζ = −nr
(8.122)
fixieren. In diesem Fall reduziert sich Φ(` + 1 − ζ; 2` + 2; ρ) auf ein Polynom vom Grad nr
und y` ist eine eigentliche Eigenfunktion. Da wir aufgrund von Glg. (8.108) wissen, dass
ζ = Z/(Ka0 ) und K 2 = 2m |E| /~2 gilt, finden wir
(` + 1 + nr )2 = ζ 2 =
Z 2 ~2
a20 2me |E|
(8.123)
und daher die Energieeigenwerte
Enr `
Z 2 ~2
1
Z 2 e40 me
1
=− 2
.
2 = −
2
a0 2me (` + 1nr )
2~ (` + 1nr )2
124
(8.124)
nr muss mit der radialen Quantenzahl identifiziert werden, die wir in Glg. (8.79) eingeführt
haben. Aufgrund der speziellen Abhängigkeit der Enr ` von nr und ` ist es praktisch, die
Hauptquantenzahl
n = nr + ` + 1
(8.125)
einzuführen, so dass wir Glg. (8.124) als
Z 2 e40 me 1
,
n ∈ N = 1, 2, . . .
2~2 n2
schreiben können. Die entsprechende Eigenfunktion lautet
En = −
yn ` (r) = An ` (2Kn r)`+1 Φ(−n + ` + 1; 2` + 2; 2Kn r)e−Kn r ,
worin wir
(8.126)
(8.127)
p
2m |E|n
Z
=
(8.128)
~
na0
verwendet haben. Im Fall E > 0 (Streuung) erhält man die Lösung aus Glg. (8.127) indem
man Kn → iK ersetzt und sich im Speziellen für das asymptotische Verhalten interessiert.
Kn =
Um die Struktur und damit die chemischen und physikalischen Eigenschaften des Wasserstoffatoms zu beschreiben, benötigen wir die Eigenfunktionen und Eigenwerte des diskreten Spektrums, welche wir im Folgenden detailliert besprechen wollen. Wenn wir
R=
2π 2 me e40
me e40
=
4π~3 c
h3 c
(8.129)
schreiben, können wir Glg. (8.126) in die Form
1
(8.130)
n2
bringen, d.h. der Ausdruck für En is identisch zum Ausdruck für die Bindungsenergien
in der Bohr’schen Theorie. Während die Eigenfunktionen von n, `, m abhängen, sind die
entsprechenden Energieeigenwerte nur von der Hauptquantenzahl n = nr +`+1 abhängig.
En = −RZ 2 hc
Wie wir bereits gesehen haben, findet man perfekte Übereinstimmung68 mit experimentell
gemessenen Werten, wenn man die Elektronenmasse durch die reduzierte Masse
µ=
me M
me + M
(8.131)
68
Es sollte eigentlich klar sein, dass echte Atome etwas komplizierter sind. Über die vom hier behandelten Coulomb-Problem vorgegebene Struktur hinaus besitzen reale Atome eine sogenannte Feinstruktur
und auch eine Hyperfeinstruktur. Die zugehörigen Änderungen der Energieniveaus sind aber sehr klein, im
Wesentlichen um eine Potenz von α (definiert in Glg. (8.146)) bei der Feinstruktur und zusätzlich um eine
Potenz me /M für die Hyperfeinstruktur unterdrückt. Die Feinstruktur resultiert unter Anderem aus einer
korrekten quantenmechanischen Behandlung der Photonen des Coulomb-Feldes (Vakuum-Polarisation),
aus der Berücksichtigung relativistischer Korrekturen für das Elektron und aus einer Kopplung des Bahndrehimpulses mit dem inhärenten Drehimpuls (Spin) des Elektrons. Diese Korrekturen sind bei einer von
vorne herein relativistischen Behandlung alle bereits erhalten und heben die Entartung der Energieniveaus mit unterschiedlicher Quantenzahl ` auf. Die Hyperfeinstruktur ist schließlich auf die Wechselwirkung
des Kernspins mit dem durch das Elektron erzeugten Magnetfeld zurück zu führen. Weitere Details dazu
gehen über die Vorlesung deutlich hinaus, aber werden Ihnen in Vorlesungen zur höheren Quantenmechanik oder Atomphysik sicher noch begegnen. Die perfekte Übereinstimmung ist hier folgendermaßen
zu verstehen. Wenn man aus den experimentell gemessen Spektren die theoretisch berechneten Beiträge
von Feinstruktur und Hyperfeinstruktur entfernt, dann erhält man ein Spektrum, dass perfekt mit dem
Coulomb-Problem übereinstimmt.
125
des Elektron-Nukleus Systems ersetzt. Tatsächlich haben wir bisher die Elektronen so
behandelt als bewegten sie sich im Coulomb Feld eines unendlich schweren Nukleus.
Wenn wir berücksichtigen, dass der Nukleus eine endliche Masse besitzt, müssen wir
die Schrödingergleichung für ein System von zwei Körpern lösen (Zweikörperproblem).
Dazu separieren wir wie in der klassischen Mechanik die Bewegung des Schwerpunkts und
erhalten eine Schrödingergleichung für die Relativkoordinaten die bis auf die Ersetzung
von me durch die reduzierte Masse µ von der gleichen Form wie im Fall des als unendlich
schwer angenommenen Kerns ist.
8.4.1
Exkurs: Relativ- und Schwerpunktskoordinaten
Der Hamiltonoperator eines allgemeinen Zwei-Teilchensystems ist
pb22
pb21
b
b2 ).
+
+ V (b
x1 , x
H=
2m1 2m2
(8.132)
Wenn das Potential ausschließlich aus deren Wechselwirkung besteht, d.h. keine äußere
Kraft vorliegt, kann diese Kraft nur vom Relativvektor der beiden Teilchen abhängen, d.h.
b2 ) = V (b
V (b
x1 , x
x1 −b
x2 ). Wir führen nun die Gesamtmasse M und reduzierte Masse µ sowie
die Schwerpunktskoordinate R und den Gesamtimpuls P sowie die Relativkoordinate r
und den Relativimpuls p ein,
M = m1 + m2 ,
µ=
m1 m2
,
m1 + m2
b 1 + m2 x
b2
b = m1 x
R
,
m1 + m2
Pb = pb1 + pb2 ,
b=x
b1 − x
b2 ,
x
pb =
m2 pb1 − m1 pb2
,
m1 + m2
(8.133)
(8.134)
und übertragen damit die Bewegung zweier realer Teilchen auf eine Beschreibung der
Bewegung zweier fiktiver Teilchen. Eines davon hat die Gesamtmasse M , befindet sich
b und hat dem Gesamtimpuls Pb , während auf dieses keinerlei
am Ort des Schwerpunkts R
äußere Kraft wirkt – es ist ein freies Teilchen. Das andere hat die Masse µ, befindet sich
b, hat den Impuls pb und erfährt das Potential V (b
am Ort x
x). Die Geschwindigkeit des
b = pb1 /m1 − pb2 /m2 gemessen. Es
zweiten fiktiven Teilchens wird durch den Operator p/µ
gilt offensichtlich für die Impulse
pb2
pb2
Pb 2
pb21
+ 2 =
+
2m1 2m2
2µ 2M
(8.135)
und für die Drehimpulse
b1 × pb1 + x
b2 × pb2 = x
b × pb + R × Pb
x
bzw.
b
`b1 + `b2 = `b + L.
(8.136)
Die Vertauschungsrelationen lassen sich auf die Relativ- und Schwerpunktskoordinaten
übertragen, so dass lediglich die Kombinationen
[b
xi , pbj ] = i~δi j ,
b i , Pbj ] = i~δi j ,
[R
(8.137)
nicht-trivial sind, während die anderen Kommutatoren verschwinden. Der Hamiltonoperator zerfällt in
2
b2
b = P + pb + V (x)
H
(8.138)
2M
2µ
126
und die Eigenvektoren können als Tensorprodukt von Eigenvektoren zum Hamiltonopeb r der Relativkoordinaten und der Eigenvektoren zum Hamiltonoperator H
b R der
rator H
Schwerpunktskoordinaten geschrieben werden, vgl. hierzu unter formalen Gesichtspunkten die Diskussion zu Glg. (8.2). Jeder Eigenvektoren bildet jeweils ein vollständiges System, so dass Relativ- und Schwerpunktsbewegung entkoppeln. Die Schrödingergleichung
in diesen Koordinaten lautet dann
~2
~2
∆R −
∆x + V (x) Φ(R, x) = EΦ(R, x)
(8.139)
−
2M
2µ
und der Separationsansatz lautet
Φ(R, x) = φ̄(R)φ(x).
(8.140)
Die separierten Gleichungen sind
2
b R φ̄(R) = − ~ ∆R φ̄(R) = ER φ̄(R),
H
2M2
~
b
Hr φ(x) = − ∆x + V (x) φ(x) = Er φ(x)
2µ
(8.141)
(8.142)
und die Energie werden einfach addiert,
E = ER + Er .
(8.143)
Die anfängliche Wellenfunktion ist das Produkt der zwei Faktoren φ̄(R) und φ(x). Diese
Eigenschaft bleibt beim Übergand zum Schwerpunktsystem unverändert. Da die Schwerpunktsbewegung sich als Bewegung eines freien Teilchens gestaltet, erfordert die Lösung
des Zweiteilchen-Problems lediglich die Lösung eines Einteilchen-Problems in einem externen Potential V (x).
8.4.2
Termschema und Quantenzahlen
Das Schema der Energieniveaus ist in Abb. D.10 gezeigt. Außer n = 1 sind alle anderen
Energieniveaus entartet. Wir finden
~
λe /(2π)
~2
=
=
= 0.529 × 10−10 m
Bohr’scher Radius,
(8.144)
2
me e 0
me cα
α
E1 = − 13.6 eV = −1 Ry
für Z = 1 (Wasserstoff), (8.145)
e2
1
α= 0 =
Sommerfeld’sche Feinstrukturkonstante. (8.146)
~c
137.037
a0 =
Atomare Spektren entstehen durch Übergänge zwischen den diskreten Energieniveaus. Im
Wasserstoffatom ist die Energieänderung beim Übergang von einem Anfangszustand m
zu einem Endzustand n durch
1
1
~ωm n = Em − En = 1 Ry − 2 + 2
(8.147)
m
n
gegeben. Daher finden wir das Ritz’sche Kombinationsprinzip.
127
Die Eigenfunktionen des diskreten Spektrums sind
φn ` m (r, ϑ, ϕ) =
yn ` (r)
Y` m (ϑ, ϕ),
r
(8.148)
wo yn ` durch Glg. (8.127) definiert sind. Der Wertebereich der Quantenzahlen ist
m = 0, ±1, ±2, . . . ,
` = 0, 1, 2, . . .
n = ` + 1, ` + 2, ` + 3, . . .
n = 1, 2, 3, . . .
` = |m| , |m| + 1, . . .
m = −`, −` + 1, . . . , ` − 1, `
bzw.
(8.149)
(8.150)
(8.151)
Wir finden daher 2` + 1 unabhängige Eigenfunktionen für einen gegebenes Wertepaar
(n, `) und
n−1
X
(2` + 1) = n2
(8.152)
`=0
unabhängige Eigenfunktionen für den gleichen Wert n. Da die Energie eines Zustands
lediglich von n abhängt, haben jeweils n2 Zustände die gleiche Energie. Wenn wir berücksichtigen, dass das Elektron einen intrinsischen Drehimpuls besitzt, der als Spin bezeichnet
wird mit S = 1/2, kann jeder Zustand doppelt besetzt werden (mit zwei Elektronen von
unterschiedlicher Spin Projektion). Daher ist für gegebenes n die tatsächliche Entartung
2n2 . Wir sehen, dass Eigenfunktionen zum gleichen n aber verschiedenen ` und m zwar
zur gleichen Energie gehören aber physikalisch unterschiedliche Zustände des Atoms beschreiben.
8.4.3
Struktur der eigentlichen Eigenfunktionen
In der Spektroskopie werden sind für Zustände69 mit bestimmtem ` folgende Bezeichnungen üblich:
`=0
s Zustände
`=1
p Zustände
(8.153)
`=2
d Zustände
`=3
f Zustände
Wir charakterisieren einen Zustand indem wir das Symbol s, p, d hinter die Hauptquantenzahl n stellen, z.B. 3p ist ein Zustand mit n = 3 und ` = 1. Dies charakterisiert den
Zustand noch nicht vollständig, da es drei (zu m = 0, ±1 zugehörige) 3p Zustände gibt.
Die Menge aller Zustände mit gleichem n wird als eine Schale bezeichnet, wobei hierbei
die Begriffe K-Schale für n = 1, L-Schale für n = 2, M -Schale für n = 3, usw. usf. üblich
sind.
Wir haben einen Ausdruck für die yn ` unter Verwendung der “ konfluenten” hypergeometrischen Funktionen angegeben. Wir können diese Funktionen durch die assoziierten
Laguerre Polynome ausdrücken. Diese sind durch
n
ds
ρ d
n −ρ
s
ρ e
n = 0, 1, 2, . . . , s = 0, 1, . . . , n
(8.154)
Ln (ρ) ≡ s e
dρ
dρn
69
Man spricht hierbei auch von Orbitalen.
128
definiert, wobei
L0n (ρ)
Lsn (ρ)
= Ln (ρ),
= 0 ∀s > n,
Lsn (0)
s
= (−1) n!
n
s
(8.155)
gilt. Die ersten assoziierten Laguerre Polynome sind
L11 (ρ) = −1,
L13 (ρ) = −3ρ2 + 18ρ − 18,
L12 (ρ) = 2ρ − 4,
L23 (ρ) = −6ρ + 18,
L22 (ρ) = 2
L33 (ρ) = −6, . . . .
(8.156)
Die assoziierten Laguerre Polynome haben eine Beziehung zu den “konfluenten” hypergeometrischen Funktionen:
n
s
s
Φ(−n + s; 1 + s; ρ),
(8.157)
Ln (ρ) = (−1) n!
s
so dass wir für die Radialwellenfunktion auch
−Kn r
Rn ` (r) = Cn ` (2Kn r)` L2`+1
n+` (2Kn r)e
(8.158)
schreiben können. Hierbei ist Kn durch Glg. (8.128) definiert. Indem wir die Beziehung
Z∞
3
2`+1 2
= 2n [(n + `)!]
dρ ρ2`+2 e−ρ Ln+`
(n − ` + 1)!
(8.159)
0
verwenden, finden wir für die Normierungskonstante
s
(n − ` − 1)!
Cn ` = (2Kn )3
,
2n[(n + `)!]3
(8.160)
so dass letzten Endes die Eigenfunktionen des Wasserstoffatoms als
s
`
3
Zr
2Z
(n − ` − 1)! − na
2Z
2Z
2`+1
e 0
r Ln+`
r Y` m (ϑ, ϕ)
φn ` m (r, ϑ, ϕ) = −
na0
2n[(n + `)!]3
na0
na0
(8.161)
geschrieben werden können. Die ersten Wellenfunktionen sind in der Tab. 9 gegeben.
Die Eigenfunktionen in Glg. (8.161) bestimmen die geometrische Form und Ausdehnung
des Wasserstoffatoms. Wir wollen nun deren allgemeine Charakteristika betrachten und
beginnen mit dem niedrigsten Zustand 1s (n = 1, ` = 0, m = 0) mit der Eigenfunktion
1
− r
φ1 0 0 = p 3 e a0 .
πa0
(8.162)
Die Wahrscheinlichkeitsverteilung des Elektrons im Atom ist durch
|φ1 0 0 |2 =
1 − a2r
e 0.
πa30
(8.163)
gegeben. Sie besitzt offensichtlich sphärische Symmetrie und fällt exponentiell zu Null ab
für r → ∞. Das Atom besitzt keine wohldefinierte Grenze, innerhalb derer sich das Elektron befindet, sondern ist in gewisser Weise über den gesamten dreidimensionalen Raum
129
ausgedehnt, da die Wahrscheinlichkeit das Elektron bei einer beliebigen Distanz zu beobachten niemals vollständig verschwindet. Sie wird jedoch sehr klein, sofern der Abstand
groß ist, z.B. r ≥ 2-3a0 . In diesem Sinne kann man also doch sagen, dass die Ausdehnung
eines Wasserstoffatoms in seinem Grundzustand von der gleichen Größenordnung wie der
Bohr’sche Radius ist. Wir wollen insbesondere die Wahrscheinlichkeit betrachten, dass
das Elektron sich innerhalb eine Kugelschale mit Radius r und Dicke dr befindet, Es gilt
2
Zπ
D(r)dr = r dr
Z2π
dϑ
0
|φ1 0 0 (r, ϑ, ϕ)|2 = |y1 0 (r)|2 dr =
0
4 2 − a2r
r e 0 dr,
a30
(8.164)
und wir sehen, dass diese Funktion ihr Maximum bei r = a0 = 0.529 Å annimmt und
dann schnell abfällt, vgl. Abb. D.36.
Die angeregten Zustände n > 0 haben in vieler Hinsicht ähnliche charakteristische Eigenschaften. Ein wesentlicher Unterschied der Zustände mit ` > 0 ist, dass diese nicht
mehr sphärisch symmetrisch sind. Um diese angeregten Zustände besser zu verstehen, ist
es sinnvoll sich die über die Kugelschale integrierte Wahrscheinlichkeitsverteilung in r,
d.h. D(r) anzusehen. Mit Blick auf Abb. D.37 sehen wir, dass es für n > 1 bestimmte
Werte von r gibt, bei denen die Radialwellenfunktion auf Null abfällt, d.h. Rn ` (r) = 0.
Diese Werte entsprechen Kugelschalen, auf denen die Wahrscheinlichkeitsdichte verschwindet. Um eine intuitive Vorstellung von der Wahrscheinlichkeitsdichte |φn ` m |2 zu erhalten,
könnte man lokale Kurven in den jeweiligen Ebenen, z.B. in der xy Ebene zeichnen. Diese Abbildungen finden sich in vielen Büchern oder auch auf Wikipedia70 . Die genauere
Struktur der Abhängigkeit der Eigenfunktionen von den Winkeln ϑ und ϕ kann zur physikalischen Bedeutung der Quantenzahlen ` und m in Beziehung gesetzt und verstanden
werden. Wie wir bereits besprochen haben, kann `(` + 1)~2 als der Erwartungswert des
b 2 des Elektrons im Zustand φn ` m verstanden werden,
Quadrats des Drehimpulsoperators L
und die Größe m~ kann als der Erwartungswert der z Komponente des Drehimpulsopebz , verstanden werden. In diesem Sinne entsprechen die Eigenfunktionen zu den
rators, L
gleichen Werten n und ` aber unterschiedlichen Werten von m (in passenden Linearkombinationen) lediglich verschiedenen Orientierungen der gleichen geometrischen Struktur
im dreidimensionalen Raum. Betrachten Sie hierzu im Anhang.
b 2 und L
bz wohldeWir merken hier zwei Beobachtungen an. Zunächst sehen wir, dass L
b
b
finierte Werte im Zustand φn ` m annehmen.
Dies
D
E giltD jedoch
E nicht für Lx und Ly . Wir
bx und ∆L
by beide von Null verschieden
werden auf Übungsblatt 12 sehen, dass ∆L
sind. Man kann zeigen (Übungsblatt 11), dass
hrin `
Z+∞
1 a0
3n2 − `(` + 1)
=
dx φ∗n ` m (x)rφn ` m (x) =
2Z
(8.165)
−∞
und insbesondere
hrin `
a0
=
Z
1
n(n + )
2
70
(8.166)
Behalten Sie hierbei im Hinterkopf, dass die Wellenfunktion immer zur Darstellung auf eine Ebene
projiziert werden muss. Insbesondere sind die Orbitale px und py Linerarkombinationen der Orbitale zu
` = 1 und m = ±1.
130
gilt. Man kann ebenso
2
a2
1
r n n−1 = 02 n2 (n + 1)(n + )
Z
2
zeigen, so dass für φn n−1 m die radiale Unschärfe durch
r
q
1
na0 1
2
2
(n + )
h∆b
rin n−1 = hb
r in n−1 − hb
rin n−1 =
Z
2
2
(8.167)
(8.168)
gegeben ist. Somit ist die relative Fluktuation des Radius durch
h∆b
rin n−1
1
=√
7−→ 0
hb
rin n−1
2n + 1 n→∞
(8.169)
gegeben. Wir sehen also, dass für große Energien die XXXX wohldefiniert sind, wie man
es nach dem Korrespondenzprinzip erwarte würde. Zu den Radien merken wir als Letztes
an, dass für eine gegebene Energie die Klassischen Bahnen mit maximalem Drehimpuls
Kreisbahnen sind. Durch Superposition von Zuständen φn n−1 n−1 für große n könnte man
Wellenpakete kanstruieren, die genau die Klassischen Kreisbahnen darstellen und das dritte Kepler’sche Gesetz erfüllen. Als allerletzten Punkt merken wir hier an, dass die Energie
und der mittlere Radius (bzw. Bohr’sche Radius) unterschiedliches Skalenverhalten aufweisen,
mα2
hri ∼ mαn2 .
(8.170)
En ∼ − 2 ,
n
Damit hat man bereits eine recht klare Vorstellung, wie sich beispielsweise muonische
Atome mµ = 106 MeV/c2 im Vergleich zu den üblichen elektronischen Atomen verhalten.
Außerdem bekommt man ein intuitives Bild von der Größe eines zum Wasserstoff (oder
Positronium, d.h. Wasserstoff mit einem Positron als Kern) analogen System der starken
Wechselwirkung, einem sogenannten Quarkonium71 72 .
71
Beispielweise ist die starke Ladung für die Bindung eines Charm-Anticharm Quarkoniums (Charmonium) ungefähr αs ∼ 0.3 und die Masse des Charm Quarks ist ca. mc ∼ 1.27 GeV. Damit können Sie
bereits die Größenordnung der Bindungsenergien dieser Zustände abschätzen. Die reale Bindungszustände
der Quarkonia sind deutlich komplizierter, da aufgrund Feinstruktur und Hyperfeinstruktur deutlich relevanter sind als beim elektromagnetischen Systemen. Beide Punkte können Sie durch Überlegungen bzgl.
des Abstands zwischen beiden Teilchen bereits verstehen.
72
Die Untersuchung von Quarkonia ist ein sehr aktives experimentelles und theoretisches Feld. Unter
anderem ist die genaue Untersuchung von Quarkonia ein wesentlicher Schwerpunkt der Experimente
P̄ANDA, BES III, Belle, BaBar, LHCb untersucht. Bei Collider Experimenten mit Schwerionen dienen
die dabei produzierten Quarkonia als Testteilchen für die thermischen Eigenschaften des entstehenden
Quark-Gluon-Plasmas (“The hottest stuff in the universe”), z.B. bei ALICE, CMS am LHC oder PHENIX
und STAR am RHIC (BNL). Viele Aktivitäten der Forschungsgruppe T30f von Prof. Brambilla tragen
zu diesem Feld mit Methoden der Effektiven Feldtheorie sowie mit numerischen Simulationen der Gitter
Eichtheorie bei. Falls Sie daran Interesse haben, kommen Sie auf uns oder Ihre Tutoren zu!
131
9
Geladene Teilchen im elektromagentischen Feld
Das interessanteste Charakteristikum des Wasserstoffatoms ist dessen Absorptions- bzw.
Emissionsspektrum. Um dieses zu verstehen, müssen wir das Verhalten eines geladenen
Teilchens (das Elektron im Atom) in einem externen elektromagnetischen Feld untersuchen und die Störungstheorie als Methode einführen.
Im Rahmen dieser Methode diskutieren wir dann die Schrödingergleichung für eine geladenes Teilchen im elektromagnetischen Feld. Bisher haben wir das Verhalten eines Teilchens
in einem Kraftfeld, das durch ein Potential beschrieben werden kann, betrachtet. Das Verhalten des Teilchens im elektromagnetischen Feld ist nicht von diesem Typ. Wir wollen
nun die Verallgemeinerung der Schrödingergleichung für diesen Fall betrachten.
Wir betrachten ein Teilchen mit Ladung e, das sich mit Geschwindigkeit v innerhalb
eines elektrischen Felds E und eines magnetischen Felds B bewegt. Klassisch wirkt auf
ein solches Teilchen die Lorentz-Kraft
1
(9.1)
F =e E+ v×B .
c
Wir wissen aus der Elektrodynamik, dass wir die Felder E und B mittels elektromagnetischer Potentiale U (skalares Potential) und A (Vektorpotential) definieren können,
1∂
A,
B)∇ × A.
(9.2)
c ∂t
Für gegebenes E und B sind die Potentiale V und A nicht unzweideutig durch Glg. (9.2)
festgelegt. Tatsächlich können wir immer eine Eichtransformation durchführen,
E = −∇U −
U →U−
1∂
Λ,
c ∂t
A → A + ∇Λ,
(9.3)
so dass E und B invariant bleiben.
Der erste Schritt an dieser Stelle ist sich nun zu erinnern, welche Größen dem Klassische
Drehimpuls L und der Klassische Hamiltonfunktion H für ein geladenes Teilchen der Ladung e entsprechen, wenn sich dieses durch die Felder E und B bewegt. In der Klassischen
Mechanik finden wir die folgende Verallgemeinerung der Lagrangefunktion für den Fall
geschwindigkeitsabhängiger Kräfte:
1
1
2
ẋ = v.
(9.4)
L(x, ẋ, t) = mẋ − e U (x, t) − ẋ × A ,
2
c
Um den Übergang zur Hamilton’schen Formulierung zu vollziehen, führen wir den kanonisch konjugierte Impuls ein,
pi =
∂L
e
= mxi + Ai ,
∂ ẋi
c
d.h.
e
p = mx = A,
c
(9.5)
wobei wir mx als kinetischen Impuls73 bezeichnen. Wir sehen, dass p nicht mehr mit der
rein kinetischen Größe übereinstimmt. Indem wir Glg. (9.5) invertieren, finden wir
1 e ẋ ≡ ẋ(p) =
p− A
(9.6)
m
c
73
Der kinetische Impuls ist als Ableitung der kinetischen Energie T definiert, mxi = ∂T /∂xi 6= ∂L/∂xi .
132
und die Hamiltonfunktion
H(x, p, t) = [p · ẋ(p) − L(x, ẋ(p), t)] =
1 e 2
p − A + eU (x, t) = T + V.
2m
c
(9.7)
2
1
p − ec A die kinetische Energie und eV die potentielle Energie. Wenn
Hierbei ist T = 2m
das elektromagnetische Feld zeitunabhängig ist, gilt
∂A
∂U
=
=0
∂t
∂t
−→
∂H
=0
∂t
−→
dH
= 0,
dt
(9.8)
so dass die Energie in diesem Fall erhalten ist. In diesem Fall können wir Glg. (9.7)
inklusive eines beliebigen zusätzlichen Potentials V (x) als quantenmechanischen Hamiltonoperator annehmen und die Schrödingergleichung als
i~
∂
b
ψ(x, t) = Hψ(x,
t)
∂t
(9.9)
schreiben, wobei der Hamiltonoperator die (symmetrisierte) Form74
pb2
e e2 b2
b
b
b
b + Vb
H=
−
pb · A + A · pb +
A + eU
2m 2mc
2mc2
(9.12)
annimmt. Dann folgt aus Glg. (5.108)
b=A
b · pb − i~∇ · A
b
pb · A
(9.13)
2
2
b · pb + i~ e ∇ · A
b+ e A
b2 + eU
b = pb − e A
b + Vb
H
2m mc
2mc
2mc2
(9.14)
und wir finden
Glg. (9.14) ist zur Anwendung besonders günstig. In Ortsdarstellung (indem wir pbx =
−i~∂/∂x (usw.) schreiben) lautet der Hamiltonoperator
2
2
b = − ~ ∆x + i~ e A(x) · ∇ + i~ e ∇ · A(x) + e A2 (x) + eU (x) + V (x) (9.15)
H
2m
mc
2mc
2mc2
und die Schrödingergleichung kann als
e
e
e2
~2
2
A (x) + eU (x) + V (x) ψ(x, t)
−
∆x + i~ A(x) · ∇ + i~
∇ · A(x) +
2m
mc
2mc
2mc2
∂
= i~ ψ(x, t)
(9.16)
∂t
geschrieben werden.
74
Es gehört zu den nicht-trivialen Quantisierungsregeln, dass der kanonisch konjugierte Impulsoperator
die Vertauschungsrelationen erfüllt. Es gelten die kanonischen Vertauschungsrelationen,
[b
xi , pbj ] = i~δi j ,
[b
xi , x
bj ] = [b
pi , pbj ] = 0,
(9.10)
ḃj ] = i~δi j ,
[b
xi , x
ḃi , x
ḃj ] = i~ e ijk Bk .
[x
c
(9.11)
aber es gilt auch
133
9.1
Bewegung im konstanten elektromagnetischen Feld
Wir wollen nun ein (zeitlich wie räumlich) konstantes magnetisches Feld B betrachten.
Es kann mittels eines Vektorpotentials A als
1
A(x) = − x × B
2
(9.17)
geschrieben werden75 . Für diese Feldkonfiguration können wir die verschiedenen Terme in
Glg. (9.15) berechnen76 . Mittels (a × b) · c = (b × c) · a = (c × a) · b = −(a × c) · b finden
wir
i~
e
e
A · ∇ψ(x, t) = −i~
(x × B) · ∇ψ(x, t)
mc
2mc
e
e
= +i~
(x × ∇) · Bψ(x, t) = −
L · Bψ(x, t),
2mc
2mc
(9.19)
b = x
b × p,
b benutzt
wobei wir die Impuls- und Drehimpuloperatoren, pb = −i~∇ und L
haben. Wir erhalten ebenso
e2
e2
e2
2
2
A
ψ(x,
t)
=
(x
×
B)
ψ(x,
t)
=
(ijk xj Bk ilm xl Bm )ψ(x, t)
2mc2
8mc2
8mc2
e2
e2 B 2 2
2 2
2
=
(x
B
−
(x
·
B)
)ψ(x,
t)
=
(x + y 2 )ψ(x, t),
8mc2
8mc2
(9.20)
wo wir im letzten Schritt angenommen haben, dass das Magnetfeld entlang der z-Achse
ausgerichtet ist, B = B ẑ.
Der sogenannte Pauli Term in Glg. (9.19) trägt zum Paramagnetismus bei, während der
Term in Glg. (9.20) zum Diamagnetismus beiträgt. Nun wollen wir die Größe der beiden
Terme abschätzen und betrachten die Beträge. Wir sehen
e2 B 2
(x2
8mc
2D
e
2mc
+ y2)
e a20 B
e2 B
−10 B
E ∼
=
∼
1.1
×
10
,
2
4c
~B
4~c
e/a
1
Gs
b
0
Lz B (9.21)
D E
bz ∼ ~ abgeschätzt haben. Wir erkennen, dass der quawobei wir x2 + y 2 ∼ a20 und L
dratische Term grundsätzlich vernachlässigbar ist sofern hLz i =
6 0 gilt. Unter Laborbedingungen (B . 105 Gs) sind diamagnetische Effekte immer kleiner als paramagnetische
Effekte für in Atomen gebundenen Elektronen. Es gibt jedoch auch physikalische Situationen, in denen diamagnetische und paramagnetische Effekte vergleichbar stark sind. Ein
solcher Fall tritt beispielsweise bei freien Elektronen auf. Diamagnetismus ist wichtig bei
der Behandlung von Materie unter extremen Bedingungen, wie sie auf der Oberfläche von
Neutronensternen auftreten. Dort erreichen Magnetfelder Stärken von bis zu 1022 Gs, was
75
Es gilt offensichtlich
1
1
(∇ × A)i = ijk ∂j Ak = ijk (− klm xl Bm ) = − (δi l δjm − δi m δjl )δj l Bm
2
2
1
1
1
= (+δi m δjj − δi l δj m δj l )Bm = (+δjj − 1)Bi = (3 − 1)Bi . = Bi
2
2
2
76
Ohne Rechnung erkennt man, dass in diesem Fall ∇ · A = 0 gilt.
134
(9.18)
gravierende Änderungen der atomaren Struktur zur Folge hat. Wir können den paramagnetischen Term ebenso mit der Coulomb Energie vergleichen,
e
hLz i B a0 mc
a20 α
−10 B
2mc
∼
~B
=
B
∼
2
×
10
.
(9.22)
2
e
2
|e|
2
|e|
1
Gs
r
Auch hier sind paramagnetische Effekte bei typischen Laborfeldern als sehr klein anzusehen.
9.2
Normaler Zeeman Effekt
Wie wir im vorigen Abschnitt gesehen haben, ist der Hamiltonoperator für das Wasserstoffatom77 im konstanten, äußeren Magnetfeld entlang der z-Achse durch
2
e0
bz = H
b 0 + e0 B L
bz
b = pb + V (b
r) +
BL
H
2me
2me c
2me c
(9.23)
gegeben, wobei H0 der Hamiltonoperator ohne äußeres Magnetfeld ist und V (r) = −e20 /r
b 0 die Vertauschungsrelationen
das übliche Coulomb Potential ist. Wir bemerken, dass für H
b0, L
bi ] = 0
[H
für i = 1, 2, 3
(9.24)
b stattdessen
gelten, aber für H
b L
bz ] = 0,
[H,
b L
bx ] 6= 0,
[H,
b L
by ] 6= 0
[H,
(9.25)
gilt. Nach wie vor gilt
b 2 ] = 0.
b L
[H,
(9.26)
b2
b0, L
Glg. (9.25) bedeutet, dass Lx und Ly keine Erhaltungsgrößen mehr sind. Aber H
bz vertauschen und haben ein vollständiges System gemeinsamer Eigenfunktionen,
und L
b 0 φn ` m = E (0) φn ` m
H
n`
2
2
b
L φn ` m = ~ `(` + 1)φn ` m
bz φn ` m = ~mφn ` m .
L
(9.27)
(9.28)
(9.29)
Dann ergibt sich, dass die Energieeigenwerte des vollen Hamiltonoperators durch
(0)
b
Hφn ` m = En ` + mµB B φn ` m ,
µB =
e~
2me c
(9.30)
gegeben sind. In dieser Näherung, in der Terme der Ordnung B 2 vernachlässigt wurden,
ändert die Wirkung des äußeren Magnetfelds die Eigenfunktionen nicht, sondern modifiziert nur die Eigenwerte, die sich zu
(0)
En ` m = En ` + mµB B
77
(9.31)
Beim Wasserstoffatom gilt e = −e0 , daher ist das Vorzeichen des Pauli Terms gegenüber Glg. (9.19)
nur scheinbar gedreht.
135
ändern. Das Magnetfeld bricht die Rotationssymmetrie und führt eine privilegierte Richtung ẑ – die Richtung des Magnetfelds – ein. Daher wird die Entartung in m aufge(0)
hoben und jedes Energieniveau En ` in 2` + 1 äquidistante Komponenten aufgespalten,
vgl. Abb. D.38. Die Größe µB wird auch als Bohr’sches Magneton bezeichnet,
µB = 0.9274 × 10−20 erg/Gs = 0.5788 × 10−8 eV/Gs.
(9.32)
Man kann für diese Ergebnisse eine intuitive Erklärung finden. Die Größe
µ=−
e0
L
2me c
(9.33)
kann als das aufgrund seiner Bahnbewegung dem Elektron zugeordnete magnetische Moment verstanden werden. Der im Hamiltonoperator auftretende Term
−µ·B =
e0
L·B
2me c
(9.34)
ist die Energie eines magnetischen Dipols µ im Feld B. Das gyromagnetische Verhältnis
(auch gyromagnetischer Faktor) g = |µ| / |L| ist das Gleiche, das man in einer Klassischen
Rechnung erhalten würde, wenn man das Elektron auf seiner Bahn als eine Kreisförmige
Stromschleife behandeln würde. Aber man würde Klassisch für ein festes |L| alle Werte
von Lz zwischen − |L| und |L| finden können, während in der QM lediglich Werte m~
auftreten. Daher gibt es nur eine diskrete Anzahl von zulässigen Orientierungen für L
und µ.
Glg. (9.16) hat Konsequenzen für die Struktur von Absorptions- und Emissionsspektren in
einem externen Magnetfeld. Die Frequenz der Linie zum Übergang (n, `, m) → (n0 , `0 , m0 )
ist durch
(0)
νn `→n0 `0
(0)
E − En0 `0
µB B
µB B
En ` m − En0 `0 m0
(0)
= n`
+(m−m0 )
= νn `→n0 `0 +∆m
, (9.35)
=
h
h
h
h
(0)
wobei νn `→n0 `0 die Frequenz der ohne äußeres Magnetfeld emittierten Strahlung ist. Man
kann zeigen, dass die Theorie eine Reihe von Auswahlregeln liefert. Nicht alle denkbaren
Übergänge sind tatsächlich möglich78 . Wir finden die Auswahlregeln
∆` = ±1,
∆m = 0, ±1.
(9.36)
(0)
Dann sollte sich die Linie zu νn `→n0 `0 innerhalb des Magentfelds B in drei äquidistante
Linien mit Frequenzen
(0)
νn `→n0 `0 −
µB B
,
h
(0)
νn `→n0 `0 ,
(0)
νn `→n0 `0 +
µB B
h
(9.37)
aufspalten. Dieses Ergebnis stimmt aber nicht mit experimentellen Beobachtungen überein. Insbesondere findet man, wenn man aus der Analyse der Spektrallinien die ursprünglichen Energieniveaus rekonstruiert, dass jedes Energieniveau sich in 2(2` + 1) Linien aufspaltet anstelle der 2` + 1 vorhergesagten Linien. Wie wir sehen werden, wird uns dies zur
78
Diese Auswahlregeln werden detailliert in QM II behandelt. Dazu benötigt man noch die Quantisierung des Strahlungsfelds und zerlegt dann den zugehörigen Wechselwirkungsoperator nach (verallgemeinerten) Drehimpulsoperatoren. Diese Drehimpulsoperatoren zwischen atomaren Wasserstoffzuständen
bestimmen die Auswahlregeln. Die Auswahlregeln sind also Konsequenzen der Drehimpulserhaltung.
136
Einführung des Spins im nächsten Kapitel führen. Wenn man hingegen starke Magnetfelder verwendet, so dass µB B/h groß wird (im Vergleich zur Aufspaltung der Energieniveaus
durch die Feinstruktur), nehmen die Linien die vorhergesagte Form an.
Dieses Phänomen wird als Zeeman Effekt bzw. in diesem Fall als “normaler Zeeman
Effekt” bezeichnet, da man die Anzahl der Linien N (bis auf die Quantisierung) auch aus
Klassischen Modellen als Konsequenz der Präzessionsbewegung findet. Der Zeeman Effekt
für schwache Magnetfelder mit einer Aufspaltung in 2(2` + 1) Linien wird als “anomaler
Zeeman Effekt” bezeichnet und erfordert die Einführung des Spins. Der Wechsel vom
anomalen zum normalen Zeeman Effekt bei steigendem Magnetfeld wird als PaschenBack Effekt bezeichnet. Eine schöne graphische Darstellung dieser Aufspaltungen ist auf
Wikipedia zu finden.
137
10
Spin und Drehimpuls
In QM wie auch in der Klassischen Physik kommt durch die Rotation eines Systems der
Drehimpuls ins Spiel und Rotationsinvarianz der Bewegungsgleichungen spiegelt sich in
der Erhaltung des Drehimpulses wider. Dies ist ein Beispiel für die fundamentale Verbindung zwischen Symmetrien und Erhaltungsgrößen, welche außerordentlich bedeutend
für die QM und QFT sind. Die Unterschiede zwischen QM und Klassischer Mechanik
bestehen darin, dass der Drehimpuls in der QM kein gewöhnlicher Vektor sondern ein
Vektoroperator ist, dessen drei Komponenten nicht miteinander kommutieren. Wir haben
bereits die Vertauschungsrelationen für die Drehimpulskomponenten ausgearbeitet,
bh , L
bk ] = i~hkl Ll ,
[L
b 2, L
bh ] = 0
[L
(10.1)
und wir haben bereits die Eigenwertgleichungen definiert,
b 2 Y` m = ~2 `(` + 1)Y` m ,
L
bz Y` m = ~mY` m .
L
(10.2)
Wir verwenden nun die Dirac Notation, vgl. Anhang C, die Sie bereits als die Besetzungszahlnotation, vgl. Abschnitt 7.3, im Einsatz gesehen haben. Wir definieren die Vektoren
|`, mi durch
h`, m | xi = R∗ (r)Y`∗m (ϑ, ϕ),
hx | `, mi = R(r)Y` m (ϑ, ϕ),
(10.3)
wobei R(r) der Radialteil der Wellenfunktion ist. Damit ist der Vektor |`, mi als Verallgemeinerung von Glg. (7.49) zu verstehen. Die Wirkung von Operatoren auf dem Raum
dieser Vektoren kann völlig analog zum Fall von Abschnitt 7.3 durch Matrizen dargestellt
werden. Wir schreiben damit die Eigenwertgleichungen als
b 2 |`, mi = ~2 `(` + 1) |`, mi ,
L
bz |`, mi = ~m |`, mi .
L
(10.4)
Diese Vektoren sind also durch die explizite Darstellung in Kugelkoordinaten definiert.
Nun wollen wir die gleichen Ergebnisse nur mittels Vertauschungsrelationen und allgemeinen Eigenschaften erhalten. Wir verwenden im Folgenden eine algebraische Methode,
wie sie bereits beim harmonischen Oszillator benutzt wurde, vgl. Abschnitt 7.1. Dazu
definieren wir auch hier Erzeugungs- und Vernichtungsoperatoren. Wir betrachten auf
einem gegebenen Hilbertraum H drei hermitesche Operatoren Jbx , Jby und Jbz . Wir werden
diese später mit den drei Komponenten des Spins eines Teilchens, mit den drei Komponenten seines Bahndrehimpulses oder mit den drei Komponenten des Drehimpulses eines
komplizierteren Systems identifizieren. Wir wissen, dass
Jb2 = Jbx2 + Jby2 + Jbz2 ,
[Jbi , Jbj ] = i~ijk Jbk
und
[Jb2 , Jbi ] = 0 für i = x, y, z (10.5)
gelten. Wir können nun das vollständige Orthonormalsystem der gemeinsamen Eigenvektoren von Jb2 und Jbz betrachten. Im Allgemeinen bilden diese in H kein vSkO. Wir wollen
b einen Operator bezeichnen, der mit Jb2 , Jbz sowie Jbx und Jby vertauscht. Dann kann
mit A
b so gewählt werden, dass A
b zusammen mit Jb2 und Jbz ein vSkO bilden.
A
138
10.1
Herleitung der Quantisierung
Wir betrachten nun einen gegebenen Eigenwert ~2 λ von Jb2 und einen gegebenen Eigenb und bezeichnen den von den entsprechenden Eigenvektoren aufgespannten
wert α von A
Unterraum mit Hαλ . Dann wissen wir, dass Hαλ invariant unter der Anwendung der
Operatoren Jbx , Jby und Jbz ist und dass innerhalb dieses Unterraum die Operatoren Jb2
b beide Vielfache der Identität (des Einsoperators) sind (Lemma von Schur). Wir
und A
wählen nun die Eigenwerte α und λ fest und beschränken uns auf den Unterraum Hαλ .
Wir bezeichnen einen generischen Eigenvektor zu Jbz in Hαλ mit |mi und mit ~m den
entsprechenden Eigenwert,
Jb2 |mi = ~2 λ |mi ,
Jbz |mi = ~m |mi .
(10.6)
Nun führen wir Leiteroperatoren als Linearkombinationen inkompatibler Operatoren ein,
Jb± = Jbx ± iJby .
(10.7)
Wir können zeigen79 , dass
[Jbz , Jb± ] = ±~Jb± ,
[Jb± , Jb∓ ] = ±2~Jbz
und
Jb∓ = (Jb± )† .
(10.9)
Außerdem findet man nach kurzer Rechnung
Jb∓ Jb± = (Jbx ∓ iJby )(Jbx ± iJby ) = Jbx2 + Jby2 ± i[Jbx , Jby ] = Jb2 − Jbz2 ∓ ~Jbz
(10.10)
und natürlich
1 b b
J+ J− + Jb− Jb+ + Jbz2 .
Jb2 =
2
Daher gilt aufgrund von Glgn. (10.6) und (10.10)
Jb∓ Jb± |mi = ~2 [λ − m(m ± 1)] |mi
und wir finden mittels Glg. (10.9)
h
i
Jbz Jb± |mi = Jb± Jbz ± ~J+ |mi = ~(m ± 1)Jb± |mi .
(10.11)
(10.12)
(10.13)
Glg. (10.13) sagt aus, dass für jeden Eigenvektor |mi mit Eigenwert ~m (für Jbz ) ebenso die
Vektoren Jb± |mi Eigenvektoren mit den Eigenwerten ~(m±1) (für Jbz ) sind. Dies bedeutet
noch keine Quantisierung der Eigenwerte ~m, da im Prinzip beliebig nahe beieinander
liegende Werte von m noch nicht ausgeschlossen sind. Dies nehmen wir als nächstes in
Angriff.
Wir betrachten nun den Eigenwert ~m0 . Dann erhalten wir durch iterative Anwendung
von Glg. (10.13)
Jbz Jb±p |m0 i = ~(m0 ± p)Jb±p |m0 i .
(10.14)
79
Beides ist durch Einsetzen von Glg. (10.7) zu zeigen, denn
[Jbz , Jb± ] = [Jbz , Jbx ] ± i[Jbz , Jby ] = i~Jby ± i2 ~(−Jbx ) = ±~(Jbx ± iJby ) = ±~Jb± .
139
(10.8)
Daher können wir ausgehend von |m0 i die komplette Reihe von Zuständen
Jb−q |m0 i , . . . , Jb−1 |m0 i , |m0 i , Jb+ |m0 i , . . . , Jb+p |m0 i
(10.15)
erzeugen, die den Eigenwerten
~(m0 − q), . . . , ~(m0 − 1), ~m0 , ~(m0 + 1), . . . , ~(m0 + p)
(10.16)
entsprechen. Diese Reihe sollte aber sowohl im oberen als auch im unteren Teil abbrechen.
Das heißt, es sollte zwei Werte p0 und q0 geben, so dass
Jb+p0 |m0 i =
6 0 und Jb+p0 +1 |m0 i = 0
Jb−q0 |m0 i =
6 0 und Jb−q0 +1 |m0 i = 0
(10.17)
gilt. Nun wollen wir die Existenz minimaler und maximaler Werte von p0 und q0 bzw.
minimaler und maximaler Eigenwerte ~m begründen. Wegen Glg. (10.12) gilt also
Jb− Jb+ Jb+p |m0 i = ~2 [λ − (m0 + p)(m0 + p + 1)] Jb+p |m0 i ,
(10.18)
Jb+ Jb− Jb−q |m0 i = ~2 [λ − (m0 − q)(m0 − q − 1)] Jb−q |m0 i ,
(10.19)
sowie
so dass für beliebig große Werte von p bzw. q die Eigenwerte von Jb∓ Jb± nicht mehr
zwangsläufig positiv wären. Nun gilt aber aufgrund von Glg. (10.9), dass Jb∓ Jb± = (Jb± )† Jb±
ein positiver Operator ist80 und daher
2
E D
b
b
b
b
b
(10.21)
hm| J∓ J± |mi = J± m J± m = |J± mi ≥ 0
gelten muss. Dem widerspräche die Existenz negativer Eigenwerte, so dass diese verboten
sein müssen. Wir müssen daher fordern, dass ein p0 bzw. q0 existiert, so dass
Jb− Jb+ Jb+p0 |m0 i = ~2 [λ − (m0 + p0 )(m0 + p0 + 1)] Jb+p0 |m0 i = 0,
(10.22)
Jb+ Jb− Jb−q0 |m0 i = ~2 [λ − (m0 − q0 )(m0 − q0 − 1)] Jb−q0 |m0 i = 0.
(10.23)
Damit diese Gleichungen für einen beliebigen Eigenvektor |m0 i gelten, muss
λ = (m0 + p0 )(m0 + p0 + 1)
λ = (m0 − q0 )(m0 − q0 − 1)
bzw.
(10.24)
realisiert sein und daher
q0 − p 0
.
(10.25)
2
Da p0 und q0 ganzzahlig sind, ist m0 ganz- oder halbzahlig. Wir definieren dann
m0 =
j = m0 + p0 =
p0 + q0
2
und
λ = j(j + 1),
(10.26)
so dass j ebenfalls notwendigerweise ganz- oder halbzahlig ist. Daher sind die erlaubten
Eigenwerte von Jb2 von der Form ~2 j(j + 1) mit j ∈ {0, 12 , 1, 23 , 2, . . .}. Darüber hinaus
80
b ist durch
Ein positiver Operator A
b |χi ≥ 0
hχ| A
∀χ
(10.20)
definiert, d.h. er hat ausschließlich positive Eigenwerte. Wenn der Eigenwert Null ebenfalls auftritt, ist
ein Operator strenggenommen positiv semidefinit.
140
bemerken wir mit Blick auf Glg. (10.16), dass die minimalen und maximalen Werte von
m durch
q0 + p0
q0 + p0
= −j
und
m ≤ m 0 + p0 = +
= +j (10.27)
m ≥ m0 − q0 = −
2
2
gegeben sind, so dass zu jedem j ein Satz von 2j + 1 Eigenwerten m gehört,
m = j, j − 1, . . . , −j + 1, −j,
(10.28)
wobei dies unabhängig davon gilt, ob j ganz- oder halbzahlig ist. Die Eigenschaften der Eigenvektoren |mi hängen vom Wert j ab, so dass wir von jetzt ab den gegebenen Unterraum
durch Hαj bezeichnen und die normierten Eigenvektoren von Jbz mit |j, mi bezeichnen,
Jb2 |j, mi = ~2 j(j + 1) |j, mi ,
10.1.1
Jbz |j, mi = ~m |j, mi .
(10.29)
Normierung
Auf Grundlage der vorigen Diskussion können wir dann alle Zustände zu gegebenem j
durch
|j, mi = Cj−m Jb−j−m |j, ji ,
|j, mi = Cj+m Jb+j+m |j, −ji ,
(10.30)
erzeugen. Dabei sind Cj±m Normierungskonstanten, welche bis auf einen Phasenfaktor
eindeutig festgelegt sind. Mit dieser neu gewonnenen Einsicht können wir Glg. (10.19) als
Jb− Jb+ Jb+p |m0 i = const Jb+p |m0 i ,
(10.31)
Jb+ Jb− Jb−q |m0 i = const Jb−q |m0 i
(10.32)
schreiben oder auch als
Jb− |j, mi = Kj−m |j, m − 1i ,
Jb+ |j, mi = Kj+m |j, m + 1i .
(10.33)
Bis auf die besagte Phase können die Koeffizienten Kj±m aus der Normierungsbedingung
2
1
1
hj, m − 1|j, m − 1i = − 2 Jb− |j, mi = − 2 hj, m| Jb+ Jb− |j, mi
K K jm
jm
=
~2 (j(j + 1) − m(m − 1))
~2 (j + m)(j − m + 1)
=
− 2
− 2
K K jm
(10.34)
jm
bestimmt werden. Im letzten Schritt haben wir dabei Glg. (10.12) verwendet und finden
damit also
p
− K = ~ (j + m)(j − m + 1).
(10.35)
jm
Genauso erhält man das wenig überraschende Ergebnis
p
+ K = ~ (j − m)(j + m + 1).
jm
(10.36)
Die Phasenfaktoren der Kj±m hängen von der Konvention81 zu den Phasenfaktoren ab, die
den Vektoren |j, mi zugewiesen werden. Wenn man diese so wählt, dass alle Kj−m reell
81
Die weiter unten beschriebene Konvention mit reellen Koeffizienten ist die Phasenkonvention von
Condon und Shortley, kurz die Condon-Shortley Konvention. Diese ist am weitesten verbreitet.
141
und positiv sind, sind auch alle Kj+m reell und positiv, so dass wir
p
Jb− |j, mi = ~ (j + m)(j − m + 1) |j, m − 1i ,
(10.37)
p
Jb+ |j, mi = ~ (j − m)(j + m + 1) |j, m + 1i
erhalten. Durch iterative Anwendung ergeben sich alle Zustände als
q
(j+m)! bj−m
1 √1
|j, mi = ~j−m
J
|j, ji ,
(j−m)! −
(2j)!
q
(j−m)! bj+m
1 √1
|j, mi = ~j+m
J
|j, −ji .
(j+m)! +
(10.38)
(2j)!
Mittels Glg. (10.37) finden wir die Matrixelemente der Leiteroperatoren Jb+ und Jb−
p
hj, m0 | Jb∓ |j, mi = ~ (j ± m)(j ∓ m + 1)δm0 ,m∓1 .
(10.39)
Dann rekonstruieren wir Jbx und Jby aus den Leiteroperatoren und finden mittels
1
Jby = (Jb+ − Jb− )
2i
1
Jbx = (Jb+ + Jb− ),
2
(10.40)
die Matrixelemente
p
~ p
(j − m)(j + m + 1)δm0 ,m+1 + (j + m)(j − m + 1)δm0 ,m−1 ,
2
(10.41)
p
~ p
(j − m)(j + m + 1)δm0 ,m+1 − (j + m)(j − m + 1)δm0 ,m−1 ,
hj, m0 | Jby |j, mi =
2i
(10.42)
hj, m0 | Jbz |j, mi = ~mδm0 ,m .
(10.43)
hj, m0 | Jbx |j, mi =
Wir geben die Matrizen zu Jbx , Jby und Jbz für j = 21 und j = 1 in expliziter Form an. Bei
j = 12
~
~
~
0
1
0
−i
1
0
j = 12
Jbx =
Jby =
Jbz =
(10.44)
i 0
2 1 0
2
2 0 −1
erkennen wir die Pauli-Matrizen
0 1
σ1 =
1 0
σ2 =
0 −i
i 0
d.h. es gilt Jbx = ~2 σ1 , Jby = ~2 σ2 und Jbz = ~2 σ3 . Für



0 1 0
0
~ 
~ 
b
b

1 0 1
i
j = 1 Jx = √
Jy = √
2
2
0 1 0
0
Schlussfolgerung:
142
σ3 =
1 0
0 −1
,
(10.45)
j = 1 erhalten wir



−i 0
1 0 0
0 −i  Jbz = ~  0 0 0  .
i
0
0 0 −1
(10.46)
Alleine die Vertauschungsrelationen der Komponenten des Drehimpulsoperators sind ausreichend, um a priori die erlaubten Eigenwerte von Jb2 festzulegen und in einem beliebigen
Unterraum Hαj die Eigenwerte und Eigenvektoren zu Jbz zu bestimmen und die Wirkung
von Jbx und Jby auf diese zu berechnen. Dies sagt uns aber nicht, welche Eigenwerte von Jb2
für ein bestimmtes physikalisches System auftreten, d.h. welche Unterräume Hαj diesem
zuzuordnen sind. Ferner sind die Operatoren Jbx , Jby und Jbz lediglich bis auf eine unitäre
Transformation bestimmt.
10.2
Bezug zum Bahndrehimpuls
Es ist nun interessant zu sehen, wie diese allgemeine Behandlung sich im Fall des Bahnb=x
b 2, L
bx , L
by
b × pb manifestiert. Hier haben wir bereits die Operatoren L
drehimpulses L
2
b und L
bz besprochen und die gemeinsamen Eigenvektoren zu A,
b L
bz konstruiert,
und L
φnr ` m = Rnr ` (r)Y` m (ϑ, ϕ)
(10.47)
wobei die Quantenzahlen durch nr = 0, 1, 2, 3, . . ., ` = 0, 1, 2, . . . und m = −`, . . . , +`
gegeben sind. Die Eigenwertgleichungen sind
b nr ` m = αnr ` φnr ` m ,
Aφ
b 2 φnr ` m = ~2 `(` + 1)φnr ` m ,
L
bz φnr ` m = ~mφnr ` m .
L
(10.48)
(10.49)
(10.50)
b der Hamiltonoperator H
b gewählt werden kann sofern
In diesem Fall sahen wir, dass für A
b2
das Potential einer Zentralkraft zugeordnet ist. Wir sehen, dass die Eigenwerte von L
2
bz genau von der allgemeinen Form für die Eigenwerte von Jb und Jbz sind, wenn man
und L
j durch ` ersetzt. Aber ` ist ganzzahlig und nimmt alle möglichen ganzzahligen Werte an.
b 2 vollständig bestimmt sind, bedeutet, dass die
Die Tatsache, dass die Eigenwerte von L
Beziehung
b=x
b × pb
L
(10.51)
eine physikalische Bedeutung hat die über die bloße Existenz der durch Glg. (10.51) erfüllten Vertauschungsrelation
bx , L
by ] = i~L
bz
[L
und zyklische Permutationen
(10.52)
hinaus geht.
10.3
Spin
Wir haben im vorigen Kapitel gesehen, dass man bei der Untersuchung der Feinstruktur
von Alkaliatomen (Alkalimetalle wie etwa Natrium sind Elemente mit einem einzigen
Elektron im s-Orbital der äußersten Schale) eine höhere Anzahl von Energieniveaus findet
als man aufgrund der bisherigen Theorie erwarten würde. Insbesondere zeigt der “anomale
Zeeman Effekt”, dass die Zahl der Energieniveaus doppelt so groß wie erwartet ist.
143
10.3.1
Historische Perspektive
Die quantenmechanischen Postulate, die wir besprochen haben, übertragen das idealisierte Konzept eines materiellen Punktteilchens – d.h. eines massiven Objekts mit drei
Translationsfreiheitsgraden – in den Formalismus der Quantenmechanik. Die Konfigurationen dieses Teilchens sind also durch drei Koordinaten gegeben. Wenn wir das Elektron
stattdessen als einen starren Körper betrachten würden (wie in einigen Modellen des
Elektrons von Lorentz), dann sollte dieses drei zusätzliche Freiheitsgrade der Rotation
besitzen, beispielsweise die drei Euler Winkel. In einem solchen Falle könnte das Elektron
nicht Energie in Form der Translationsbewegung aufnehmen, sondern auch in Form Rotationsbewegung, einer inneren Bewegung also. Durch diese “interne Bewegung” hätte das
Elektron einen intrinsischen Drehimpuls und ein intrinsisches magnetisches Moment.
Zwar sind sämtliche Modelle eines ausgedehnten Elektrons gescheitert, aber im Jahr 1925
schlugen Goudsmit und Uhlenbeck auf Grundlage dieser Ideen vor, dem Elektron einen
intrinsischen Drehimpuls oder Spin S zuzuweisen. Das zugehörige magnetische Moment
ist durch
e0
S
(10.53)
µS = −gS
2me c
gegeben, wobei gS ein zu bestimmender Proportionalitätsfaktor ist. Wie man sich mit
Blick auf die Jahreszahl denken kann, arbeiteten Goudsmit und Uhlenbeck hierbei im
Kontext einer auf den Bohr-Sommerfeld’schen Quantisierungsregeln beruhenden Theorie.
Diese Theorie ergab Quantisierungsregeln für den Bahndrehimpuls:
|L| ist auf Werte ~`
p
mit ` = 0, 1, 2, . . . beschränkt – unvereinbar mit ~ `(` + 1) wie wir in der echten QM
gesehen haben – und Lz konnte 2` + 1 Werte annehmen (−~`,. . . +~`).
10.3.2
Das Stern-Gerlach Experiment
In Abschnitt 2.3.4 und Abb. D.12 haben wir bereits das Stern-Gerlach Experiment als
Nachweis der Raumquantisierung angesprochen. Dieses Experiment wurde im Jahr 1922
mit Silberatomen durchgeführt. Silberatome haben eine sphärisch symmetrische Ladungsverteilung plus ein weiteres 5s Elektron. Daher ist der gesamte Bahndrehimpuls des Silberatoms Null, ` = 0. Daher sollte keinerlei Aufspaltung auftreten. Wenn die Elektronen
auf der äußersten Schale in einem 5p Zustand wären, würde man eine Aufspaltung in drei
Linien erwarten. Stattdessen sieht man eine Aufspaltung in zwei Linien. Dies lässt sich
dadurch erklären, dass der Spin des Elektrons den Wert 12 besitzt.
10.3.3
Vektormodell für Atome, Drehimpuls-Kopplung, Spin-Anomalie
Dann nahmen sie an, dass ähnliche Quantisierungsregeln auch für den Spin S des Elektrons gelten sollten. Dann würden S die Werte s und ms (entsprechend zu ` und m)
zugewiesen. Damit könnte jedes Energieniveau für das Elektron in einem magnetischen
Feld in 2s + 1 verschiedene Niveaus aufgespalten werden. Die charakteristischen Eigenschaften des anomalen Zeeman Effekts erfordern 2S + 1 = 2 und daher s = 12 .
Die Zuweisung des Spins s = 21 für das Elektron führte zum sogenannten “Vektormodell”
des Atoms. In diesem Modell ist der Gesamtdrehimpuls J des Elektrons mit wohldefinier144
ten Regeln aus dem Bahndrehimpuls L und dem Spin S zusammengesetzt,
J = L + S,
(10.54)
und das magnetische Moment aufgrund des Bahndrehimpulses,
cL = −
µ
e0 b
L,
2me c
(10.55)
wird mit dem magnetischen Moment aufgrund des Spins,
cS = −gS
µ
e0 b
S,
2me c
(10.56)
kombiniert um das gesamte magnetische Moment zu erhalten,
b=µ
cL + µ
cS .
µ
(10.57)
Das Vektormodell des Atoms erklärt die Charakteristika der Feinstruktur und des anomalen Zeeman Effekts, wenn wir
gS 6= 1
(10.58)
annehmen, d.h. wenn wir für das Elektron ein (im Vergleich zum Bahndrehimpuls) “anomales intrinsisches gyromagnetisches Verhältnis annehmen (Spin Anomalie). Man erhält
eine gute Übereinstimmung mit experimentellen Daten (bis auf kleine Korrekturen, die
man (im Wesentlichen) im Rahmen der QFT versteht), indem man
gS = 2
(10.59)
setzt.
10.3.4
Formalismus
Die Konzept des Spins hat sich bei der Interpretation der Eigenschaften von Atomen
und Molekülen als außerordentlich nützlich erwiesen. Insbesondere erlaubt der Spin eine
präzise Formulierung des Pauli-Verbots und daher umfassendes Verständnis der Struktur
des Periodensystems der Elemente. Heutzutage weisen wir allen Elementarteilchen einen
intrinsischen Drehimpuls – den Spin – zu und betrachten diesen als ein charakteristisches,
fundamentales Merkmal des Teilchens auf der gleichen konzeptionellen Ebene wie dessen Masse. Beispielsweise ordnen wir Spin 21 den Teilchen wie e± , µ± , p, n, ν, Λ, Σ, Ξ, . . .
zu. Wir ordnen anderen Teilchen ganzzahlige Spins zu, beispielsweise Spin 0 für manche
Mesonen – z.B. π und K Mesonen – und für das Higgs Teilchen, aber auch den Spin
1 für das Photon sowie diverse Mesonen – z.B. ρ und ω Mesonen – usw.82 In der QM
wird ein Teilchen mit Spin als ein System beschrieben, das als fundamentale Observablen
neben den drei Komponenten des Ortes x
b, yb und zb und des (linearen) Impulses über drei
b aufgeb
b
b
weitere Observablen Sx , Sy und Sz verfügt, die als Komponenten eines Vektors S
fasst werden. Diesen Observablen sind hermitesche Operatoren zugeordnet, die folgende
Vertauschungsrelationen erfüllen:
Es gibt auch Teilchen mit intrinsischem Spin 32 – z.B. das ∆ und das Ω Baryon – und schließlich
weist man dem Graviton – sofern man es berücksichtigt – einen Spin von 2 zu.
82
145
[b
xi , x
bj ] = [b
pi , pbj ] = 0,
[b
xi , pbj ] = i~δi j ,
[Sbi , Sbj ] = i~ijk Sbk .
(10.60)
(10.61)
(10.62)
b=x
b × pb konstruieren und wir erhalten
Aus x
b und pb lässt sich der Bahndrehimpuls L
bi , L
bj ] = i~ijk L
bk .
[L
(10.63)
b sich auf eine intrinsische Eigenschaft des Teilchens bezieht und nicht von dessen
Da S
Bewegungszustand abhängen sollte, fordern wir
bi , Sbj ] = 0.
[b
xi , Sbj ] = [b
pi , Sbj ] = [L
(10.64)
b bilden zusammen in einem dem Teilchen zugeordnetem Hilb, pb und S
Die Operatoren x
bertraum ein irreduzibles System83 , d.h. jede andere Observable kann als Funktion dieser
b2 , Sbz ] = 0 können wir ein gemeinfundamentalen Operatoren geschrieben werden. Da [S
b2 und Sbz finden. Wie wir gesehen haben, sind die a
sames System von Eigenvektoren zu S
b2 von der Form ~2 s(s + 1) mit s = 0, 1 , 1, 3 , 2, . . . und
priori möglichen Eigenwerte von S
2
2
im zu einem festen s gehörenden Unterraum gibt es zu Sbz die Eigenwerte ~s, . . . , −~s. Da
b2 mit x
b und pb kommutiert, folgt aus der Irreduzibilitätsbedingung, dass dieser Operator
S
zu 1 proportional ist. Nur ein einziger der möglichen Werte für s sollte für ein bestimmtes
Teilchen realisiert werden.
10.4
Teilchen mit Spin
10.4.1
Schrödinger-Darstellung für ein Teilchen mit Spin
Wir beginnen mit
b2 = ~2 s(s + 1)1.
S
(10.65)
Da s eine charakteristische Eigenschaft des betrachteten Teilchens ist, ist es ein gegebener, fester Wert. x
b, yb, zb und Sbz bilden ein vSkO und wir bezeichnen mit |x, ms i dessen
normierte Eigenvektoren,
x
b |x, ms i = x |x, ms i , yb |x, ms i = y |x, ms i ,
zb |x, ms i = z |x, ms i , Sbz |x, ms i = ~ms |x, ms i
(10.66)
mit ms = +s, +s − 1, . . . , −s. Die Orthonormalitätsrelation lautet
hx0 , m0s |x, ms i = δm0s ms δ 3 (x0 − x).
83
(10.67)
b B,
b . . .} in einen Hilbertraum wird als irreduzibles System bezeichnet,
Eine Menge von Operatoren {A,
wenn es keinen Unterraum von eigentlichen Vektoren gibt, der unter allen Operatoren dieser Menge
b invarianter Unterraum
invariant ist. Ein Unterraum eines Hilbertraums wird als unter dem Operator A
bezeichnet, wenn alle Vektoren aus diesem Unterraum durch diesen Operator auf Vektoren im selben
b ∈ H̄ bzw. A(
b H̄) ⊂ H̄.
Unterraum abgebildet werden, d.h. χ ∈ H̄ ⇒ Aχ
146
Wir zerlegen einen allgemeinen Vektor χ in dem diesem Teilchen zugeordneten Hilbertraum nach den Basisvektoren,
XZ
XZ
3
|χi =
d x |x, ms i hx, ms |χi =
d3 x |x, ms i χms (x),
(10.68)
ms
ms
und finden
hχ|ξi =
XZ
3
dx
2
χ∗ms (x)ξms (x),
kχk =
ms
XZ
d3 x |χms (x)|2 .
(10.69)
ms
Unser Hilbertraum kann ganz konkret mit einem System von 2s + 1 Kopien von L2 (R3 )
(des spinlosen Hilbertraums) identifiziert werden,
2s+1
H = L2 (R3 ) ⊗ . . . ⊗ L2 (R3 ) = L2 (R3 )
= L2 (R3 ) × C2s+1 ,
|
{z
}
(10.70)
2s+1 Kopien
wobei C2s+1 der Raum der komplexen Zahlen in 2s + 1 Dimensionen ist. In diesem Sinne
würde man Vektoren als direktes Produkt schreiben,
|x, ms i = |xi ⊗ |ms i .
(10.71)
Es ist auch hilfreich, den Wert von ms beginnend bei eins zu zählen, d.h.
ω = s − ms + 1 ∈ {1, 2, . . . , 2s + 1}
(10.72)
und damit χms (x) → χω (x) zu schreiben. Dann können wir die Spinkomponenten über
einen Spaltenvektor – einen sogenannten Spinor – verteilen,


χ1 (x)
 χ2 (x) 


χ(x) = 
(10.73)

..


.
χ2s+1 (x)
und für das Skalarprodukt

Z
hχ, ξi =

d3 x χ1 (x) . . . χ2s+1 (x) 
ξ1 (x)
..
.



(10.74)
ξ2s+1 (x)
schreiben. Dann können wir auf Grundlage unserer vorangegangenen Definitionen und
der uns inzwischen vertrauten Notation
hx, ms | x
bk |x0 , m0s i = xk δms m0s δ 3 (x − x0 ),
hx, ms | pbk |x0 , m0s i =
~ ∂
δm m0 δ 3 (x − x0 ),
i ∂xk s s
hx, ms | Sbk |x0 , m0s i = δ 3 (x − x0 ) hms | Sbk |m0s i
schreiben und mittels der Spinor Notation
147
(10.75)


x
bk 
χ1 (x)
..
.


 
=
χ2s+1 (x)


pbk 
χ1 (x)
..
.

Sbk 
χ1 (x)
..
.



 
=


 
=
χ2s+1 (x)
xk χ1 (x)
..
.
 
=
x
bk χ2s+1 (x)

χ2s+1 (x)

x
bk χ1 (x)
..
.




 = xk 
χ1 (x)
..
.


 (10.76)
xk χ2s+1 (x)
χ2s+1 (x)


~ ∂
χ (x)
χ1 (x)
pbk χ1 (x)
i ∂xk 1
 ~ ∂ 

 
..
..
..
=


=
.
.
.
i ∂xk
~ ∂
χ2s+1 (x)
pbk χ2s+1 (x)
χ
(x)
i ∂xk 2s+1
(10.77)


(SK )1,1 . . . (SK )1,2s+1
χ1 (x)


..
..
..
(10.78)

,
.
...
.
.
(SK )2s+1,1 . . . (SK )2s+1,2s+1
χ2s+1 (x)



wobei (SK )ω,ω0 = hms | Sbk |m0s i ein Matrixelement des Spinoperators ist. Die hier eingeführte Darstellung wird als Schrödinger Darstellung für ein Teilchen mit Spin s bezeichnet.
Dann kann des Zustandsvektor als


ψ1 (x, t)


..
ψ(x, t) = 
(10.79)

.
ψ2s+1 (x, t)
dargestellt werden und der Ausdruck |ψω (x, t)|2 d3 x gibt die Wahrscheinlichkeit zur Zeit
t an, im Volumen d3 x um den Punkt x den Wert Sz = ~(s − ω + 1) zu messen. Im Fall
eines Teilchens mit Spin 21 und insbesondere im Fall eines Elektrons ist der Hilbertraum
ein Raum von “Paaren” und das allgemeine Element hat die Form
χ1 (x)
χ(x) =
.
(10.80)
χ2 (x)
10.4.2
Zustände und Spinoren
b2 und Sbz betrachten. Da zu Sbz die Eigenwerte ± ~
Wir wollen nun die Operatoren S
2
gehören, verwendet man oft die Notation
1
|ms = + i = |+i ,
2
1
|ms = − i = |−i ,
2
(10.81)
und stellt diese in einem Spaltenvektor
|+i
|−i
(10.82)
dar. Damit schreibt man
~
Sbz |±i = ± |±i ,
2
b2 |±i = ~2 1 ( 1 + 1) |±i
S
2 2
(10.83)
und
h+|+i = h−|−i = 1,
h+|−i = h−|+i = 0.
148
(10.84)
Wir können ebenso Leiteroperatoren definieren,
Sb± = Sbx ± iSby
1
Sby = (Sb+ − Sb− ).
2i
1
Sbx = (Sb+ + Sb− ),
2
(10.85)
Aus der vorangegangenen Diskussion ergibt sich
Sb+ |+i = 0
Sb+ |−i = ~ |+i
Sb− |+i = ~ |−i
,
Sb− |−i = 0
(10.86)
so dass wir den Spinoperator mittels der Spinmatrizen in der Basis der |±i Zustände
schreiben können,
!
bi |+i h+| Sbi |−i
h+|
S
Sbi =
.
(10.87)
h−| Sbi |+i h−| Sbi |−i
Aus Glgn. (10.86) und (10.87) folgt damit
0
1
0
0
Sb+ = ~
,
Sb− = ~
,
0 0
1 0
~
Sbz =
2
1 0
0 −1
,
(10.88)
so dass wir
b = ~σ
S
(10.89)
2
schreiben können, wobei σ der Vektor der drei Pauli-Matrizen ist,
0 1
0 −i
1 0
σx = σ1 =
,
σy = σ 2 =
,
σz = σ3 =
. (10.90)
1 0
i 0
0 −1
In diesem Fall
ist diagonal in
in der Sbx oder
haben wir ein Beispiel für einen endlich-dimensionalen Zustandsraum. Sbz
der Basis der |±i, aber wir hätten auch eine andere Basis wählen können,
Sby diagonal wären.
Pauli-Matrizen haben eine Reihe wichtiger Eigenschaften, die wir hier aufzählen:
σ12 = σ22 = σ32 = 1 (1 = 2 × 2 Einheitsmatrix),
[σx , σy ] = 2iσz bzw. [σi , σj ] = 2iijk σk ,
{σi , σj } = σi σj + σj σi = 2δi j 1,
σi σj = δij 1 + iijk σk ,
Tr σi = 0 für i = {1, 2, 3},
det σi = −1 für i = {1, 2, 3}.
(10.91)
(10.92)
(10.93)
(10.94)
(10.95)
(10.96)
Diese Beziehungen gelten unabhängig von der Darstellung und es gilt
(a · σ)(b · σ) = 1 (a · b) + iσ · (a × b)
(10.97)
für beliebige Vektoren a und b, wenn diese mit σ kommutieren.
In dieser Darstellung kann eine beliebiger Spin-Zustand mittels der Basis |±i als
|χi = α+ |+i + α− |−i
149
(10.98)
geschrieben werden, wobei α± komplexe Koeffizienten sind. Die Normierung erfordert
1 = hχ|χi = |α+ |2 + |α− |2 .
(10.99)
Der Zustand kann auch als Spinor (d.h. als Spaltenvektor) geschrieben werden,
α+
χ=
,
α+ = h+|χi ,
α− = h−|χi .
(10.100)
α−
Die Vollständigkeitsrelation der Spin
1
2
Basis kann auch als
(|+i h+|) + (|−i h−|) = 1
(10.101)
oder in Matrixnotation
1
0
1 0
0 0
1 0
(1 0)
+ (0 1)
=
+
=
= 1.
0
1
0 0
0 1
0 1
10.4.3
(10.102)
Schrödingergleichung für ein Teilchen mit Spin
Wir wollen nun die Schrödingergleichung für ein gebundenes Elektron im Potential V (x)
beschreiben, welches sich innerhalb eines externen elektromagnetischen Felds befindet.
Die Klassische Hamiltonfunktion ist
1 e0
e 0 2
H=
p + A − e0 U +
(g − 1)S · E × p − µS · B
(10.103)
2 2 S
c{z
} |2me c
|2m
{z
}
wobei der erste Teil die Hamiltonfunktion eines geladenen Teilchens im elektromagnetischen Feld ist und der zweite Teil die Wechselwirkung des intrinsischen magnetischen
Moments mit dem Feld darstellt. −µS · B ist die statische Energie eines magnetischen
Dipols in einem äußeren Magnetfeld. Der Term 2me20 c2 (gS −1)S ·E ×p ist das Drehmoment,
e
das auf einen magnetischen Dipol wirkt, wenn sich dieser durch ein externes elektrisches
Feld bewegt. Wir erhalten den quantenmechanischen Hamiltonoperator, indem wir
b,
x→x
b
p → p,
µS → −
e0 gS b
S
2me c
(10.104)
ersetzen84 Darüber hinaus gilt für ein statisches Feld (d.h. für ein zeitunabhängiges Feld)
E = −∇U (x),
d.h. wir können
bk , pbl ] =
[E
~ ∂2
U,
i ∂xl ∂xk
(10.106)
(10.107)
so dass
2
b · (E
b × p)
b · (pb × E).
b (10.108)
bk pbl = ~ mkl Sbm ∂
bk = −S
b = mkl Sbm E
S
U + mkl Sbm pbl E
i
∂xl ∂xk
84
Wir bemerken, dass hier die Operatorordnung kein Problem darstellt, da die Operatoren vertauschen:
b·B
b =B
b ·S
b
S
und
b · (E
b × p)
b × p)
b
b = (E
b · S.
S
150
(10.105)
Insbesondere ist die Form des Hamiltonoperators für ein Elektron in einem Alkaliatom85
bei Anwesenheit eines konstanten äußeren Magnetfelds von Interesse. Bei einem derart
symmetrischen System besitzt das auf das Elektron wirkende elektrostatische Feld sphärische Symmetrie und es gilt
1 ∂U b b
b·E
b × pb = −S
b · ( 1 ∂U x
b × p)
b =−
S
S · L,
r ∂r
r ∂r
(10.109)
wobei wir
∂U (r)
∂U (r) x
∇r = −
∂r
∂r r
verwendet haben. In Abwesenheit eines magnetischen Felds finden wir
− ∇U (r) = −
2
b · L.
b
b = pb + V (r) + q(r)S
H
2m
(10.110)
(10.111)
Hierbei ist der letzte Term die sogenannte Spin-Bahn-Wechselwirkung und es gilt
V (r) = −e0 U (r),
q(r) =
(gS − 1) 1 ∂V (r)
.
2m2e c2 r ∂r
(10.112)
In Anwesenheit eines konstanten Magnetfelds und unter Vernachlässigung der Terme proportional zu B 2 erhalten wir – unter Verwendung der bereits für den Fall eines (spinlosen)
geladenen Teilchens im externen Magnetfeld gefundenen Ergebnisse, vgl. Kapitel 9 – den
Hamiltonoperator
2
b·L
b + e0 B · ( L
b +g S
b ).
b = pb + V (r) + q(r)S
H
| {z S }
2m
2me c
(10.113)
b
b
=J+(g
S −1)S
Diese Gleichungen sind die Grundlage zur Erklärung der Multiplett-Struktur in den Spektren der Alkalimetalle und von Wasserstoff und zur Erklärung des anomalen Zeeman Efb·L
b vertauscht nicht mit dem Drehimpuls L,
b so dass die
fekts. Der Spin-Bahn Term q(r)S
b in einem System mit Spin nicht mehr die Rolle als Konstanten der
Komponenten von L
Bewegung haben. Stattdessen können wir
b · L]
b = [Jbk , Sbl ]L
bl + Sbl [Jbk , L
bl ] = i~ klm (Sbm L
bl + Sbl L
bm ) = 0.
[Jbk , S
|{z} |
{z
}
antisym.
(10.114)
symmetrisch
Damit sehen wir, dass ohne äußeres Magnetfeld die Komponenten von Jb Konstanten
b 2 nach wie vor eine Konstante der Bewegung, so
der Bewegung sind. Außerdem ist L
b 2 , Jb2
b L
dass eine möglich Wahl der kompatiblen Konstanten der Bewegung durch H,
2
2
b
b
b
und Jz gegeben ist. Auch in Anwesenheit eines Magnetfelds sind L und J immer noch
Konstanten der Bewegung, während Jbz lediglich unter der Annahme B k ẑ tatsächlich
noch eine Konstante der Bewegung ist.
85
Die allgemeinen Eigenschaften der Spektren von Alkalimetallen können durch eine Behandlung
dieser Elemente als Atome mit einem einzigen Elektron erklärt werden, d.h. indem man das Verhalten
des optischen Elektrons in einem mittleren Feld betrachtet, welches vom Kern und den Elektronen auf
den weiter innen liegenden Schalen ausgeht. Das mittlere Feld, das auf das optische Elektron wirkt, kann
als sphärisch symmetrisches Potential V (r) aufgefasst werden.
151
Der Spin-Bahn Wechselwirkungsterm ist ein Term, der von der Ordnung (v/c)2 ist, d.h.
b Wir haben bisher ausschließvon der selben Ordnung wie relativistische Korrekturen zu H.
lich nicht-relativistische QM betrachtet. Relativistische Korrekturen zur Schrödingergleichung können aus dem nicht-relativistischen Grenzfall der Diracgleichung erhalten werden.
In Anwesenheit von einem elektrostatischen Zentralfeld und eines konstanten magnetischen Felds ist der zur Diracgleichung gehörige Hamiltonoperator in nicht-relativistischer
Näherung (Entwicklung in (v/c)2 und in der inversen Masse des Teilchens, d.h. in 1/me )
durch
2
b + gS S)
b
b 0 = pb + V (r) + e0 B · (L
H
2m
2me c
2
2
2 2
b ·S
b + ~ ∆x V (r) + e0 (B × x
b 1 = − (pb ) + q(r) L
b )2
H
8m2e c2
8m2e c2
8me c2
{z
}
{z
} |
| {z } | {z } |
I
II
III
(10.115)
(10.116)
IV
gegeben.
pDer Term I ist die erste relativistische Korrektur aus der kinetischen Energie,
Ep =
p2 c2 + m2e c4 und der Term II ist der Spin-Bahn Term. Der Term III ist der
sogenannte Darwin-Term, welcher kein Klassisches Analogon besitzt. Der letzte Term IV
schließlich wird ohne tieferen Sinn als B 2 Term bezeichnet und hat – wie wir bereits
festgestellt haben – einen Bezug zum Diamagnetismus.
Alle diese Terme sind von der gleichen Größenordnung, aber den Spin-Bahn Term ist im
b und L
b verAllgemeinen am wichtigsten. Da dieser nicht mit den einzelnen Operatoren S
tauscht, ist der Spin-Bahn Term für die Verdopplung der Energieniveaus verantwortlich.
Die anderen Terme verschieben die Energieniveaus lediglich, aber verändern nicht deren
Multiplizitäten. Eine Vorhersage der Diracgleichung ist der Wert gS = 2, welcher bis auf
prinzipiell verstandene quantenfeldtheoretische Korrekturen sehr gut mit dem experimentellen Wert übereinstimmt86 . Man kann die Beiträge aller dieser Terme im Rahmen der
Störungstheorie bestimmen.
10.5
Kopplung von Drehimpulsen & Clebsch-Gordan Koeffizienten
Die vorherige Beobachtung, dass in Anwesenheit des Spin-Bahn Terms der Gesamtdreb+S
b erhalten ist, während L
b und S
b beide einzeln nicht erhalten sind,
himpuls Jb = L
führt uns dazu, die Kopplung zweier Drehimpulse im Allgemeinen zu behandeln. Wir
betrachten zwei Drehimpulse Jb1 und Jb2 , die miteinander vertauschen, d.h.
[Jb1 k , Jb2 l ] = 0
∀ k, l ∈ {1, 2, 3}.
86
(10.117)
Die Bestimmung dieser Korrekturen, die im Allgemeinen unter dem Rahmenbegriff g − 2 firmiert, ist
eines der aktivsten Forschungsgebiete zur Suche nach “neuer Physik” jenseits des Standardmodells (der
Elementarteilchenphysik). Tatsächlich findet man nach derzeitigem Stand der Forschung eine Diskrepanz
von ca. fünf Standardabweichungen zwischen dem experimentell gemessenen und dem theoretisch berechneten Wert für g − 2 beim Muon und beide Werte sind mit über zehn Stellen Genauigkeit bekannt. Beim
Elektron ist die Übereinstimmung wesentlich besser, was wahrscheinlich daran liegt, dass das ca. 200 mal
schwerere Muon im Mittel deutlich näher am Kern ist (der Bohrradius skaliert mit der inversen Masse).
Daher ist es plausibel, dass Muon und Elektron verschieden große Empfindlichkeiten für diverse physikalische Effekte haben. Die entsprechenden Messungen und Rechnungen erfordern Beiträge aus allen
denkbaren Bereichen der Teilchenphysik und bilden eine der großen physikalischen Herausforderungen
der ersten Hälfte des 21. Jahrhunderts.
152
Wir definieren den Gesamtdrehimpuls
Jb = Jb1 + Jb2
(10.118)
[Jb, Jb12 ] = [Jb, Jb22 ] = [Jb, Jb1 · Jb2 ] = 0.
(10.120)
und finden87 damit
Wir betrachten Eigenfunktionen zum Satz der Drehimpulsoperatoren Jb12 , Jb22 , Jb1 z und
Jb2 z ,
Jb12 |j1 , m1 ; j2 , m2 i = ~2 j1 (j1 + 1) |j1 , m1 ; j2 , m2 i ,
Jb2 |j1 , m1 ; j2 , m2 i = ~2 j2 (j2 + 1) |j1 , m1 ; j2 , m2 i ,
(10.121)
Jb1 z |j1 , m1 ; j2 , m2 i = ~m1 |j1 , m1 ; j2 , m2 i ,
Jb2 z |j1 , m1 ; j2 , m2 i = ~m2 |j1 , m1 ; j2 , m2 i ,
(10.123)
2
(10.122)
(10.124)
und wollen diese durch Eigenfunktionen zum Satz der Drehimpulsoperatoren der gekoppelten Basis88 , Jb12 , Jb22 , Jb2 und Jbz ,
Jb12 |j, mi0 = ~2 j1 (j1 + 1) |j, mi0 ,
Jb22 |j, mi0 = ~2 j2 (j2 + 1) |j, mi0 ,
Jb2 |j, mi0 = ~2 j(j + 1) |j, mi0 ,
0
0
Jbz |j, mi = ~m |j, mi ,
(10.125)
(10.126)
(10.127)
(10.128)
ausdrücken. Da Jb12 und Jb22 mit Jb kommutieren, folgt dass der Unterraum der Vektoren
|j1 , m1 ; j2 , m2 i zu festen Werten j1 und j2 invariant unter der Anwendung der Operatoren
Jbx , Jby und Jbz ist. Daher müssen die Vektoren |j, mi0 innerhalb desselben Unterraums
liegen. Da Jbz = Jb1 z + Jb2 z ist, gilt
Jbz |j1 , m1 ; j2 , m2 i = ~(m1 + m2 ) |j1 , m1 ; j2 , m2 i .
(10.129)
Daher müssen wir Linearkombinationen der Vektoren |j1 , m1 ; j2 , m2 i konstruieren, die zu
einem gegebenen Wert von m1 + m2 gehören und ebenfalls Eigenvektoren zu Jb2 sind. Um
die Struktur zu verdeutlichen, bilden wir eine Tabelle. Wir verlangen hierbei j2 ≤ j1 , um
die Diskussion überschaubarer zu halten.
In der Tabelle sind die zum gleichen Wert von m1 + m2 gehörenden Vektoren in der
gleichen Zeile aufgeführt, wobei der Wert von m1 von links nach rechts abnimmt. Nur ein
einziger Vektor tritt in der ersten Zeile zu m1 + m2 = j1 + j2 auf. In den anderen Zeilen bis
zur Mitte bei m1 + m2 = j1 − j2 hin nimmt die Zahl der Vektoren in Schritten von Eins
zu, d.h. die mittlere Zeile beinhaltet 2j2 + 1 Vektoren. Von dieser Zeile an bis zur Zeile zu
m1 + m2 = −(j1 − j2 ) bleibt die Zahl der Vektoren unverändert. Anschließend nimmt die
87
Der letzte Ausdruck der folgenden Gleichung folgt offensichtlich aus [Jb, Jb2 ] = 0 durch Ausmultiplizieren:
2Jb1 · Jb2 = Jb2 − (Jb12 + Jb22 ).
(10.119)
88
Für die Schreibweise dieser Eigenfunktionen gibt es unterschiedliche Konventionen in der Literatur.
Man schreibt für die Zustände typischerweise |j1 , j2 ; j, mi oder |j, mi und mit oder ohne ‘0 ’. Wir verwenden
0
hier die Konvention |j, mi .
153
m1 + m2
j1 + j2
j1 + j2 − 1
..
.
j1 − j2
j1 − j2 − 1
..
.
−(j1 + j2 ) + 1
−(j1 + j2 )
beitragende Zustände
|j1 , j1 ; j2 , j2 i
|j1 , j1 ; j2 , j2 − 1i
|j1 , j1 − 1; j2 , j2 i
..
.
|j1 , j1 ; j2 , −j2 i
|j1 , j1 − 1; j2 , −j2 i
...
...
|j1 , −j1 ; j2 , −j2 + 1i
|j1 , −j1 ; j2 , −j2 i
|j1 , j1 − 2j2 ; j2 , j2 i
|j1 , j1 − 2j2 − 1; j2 , j2 i
..
.
|j1 , −j1 + 1; j2 , −j2 i
Tabelle 1: Kopplung von Drehimpulsen.
Zahl der Vektoren wieder mit jeder Zeile um Eins ab, um bei m1 + m2 = −(j1 + j2 ) erneut
nur einen einzigen Vektor zuzulassen. Der von den Vektoren in einer Zeile aufgespannte
Unterraum entspricht einem bestimmten Eigenwert von Jbz und wir sollten daher daraus
die gemeinsamen Eigenvektoren von Jb2 und Jbz konstruieren. Da der zu m1 + m2 = j1 + j2
gehörende Unterraum aus nur einem Eigenvektor besteht, muss dieser automatisch ein
Eigenvektor von Jb2 sein. Da m1 + m2 = j1 + j2 einem maximalen Eigenwert von Jbz
entspricht, muss der entsprechende Wert von j daher
j = j1 + j2
(10.130)
|j1 + j2 , j1 + j2 i0 = |j1 , j1 ; j2 , j2 i
(10.131)
sein. Daher können wir
schreiben. Nach dem was wir vorher bezüglich der allgemeinen Theorie des Drehimpulses
besprochen haben, gibt es zu jedem j entsprechend 2j + 1 Eigenvektoren von Jbz mit
Eigenwerten ~j, ~(j − 1), . . . , −~j. Diese Eigenvektoren können mittels Leiteroperatoren
konstruiert werden, indem man beim Eigenvektor zum maximalen Eigenwert, m = j
beginnt, d.h. von
|j1 + j2 , j1 + j2 i0 = |j1 , j1 ; j2 , j2 i .
(10.132)
und dann durch Absteigen mittels
p
Jb∓ |j, mi = ~ (j ± m)(j ∓ m + 1) |j, m ∓ 1i
(10.133)
den nächsten Eigenvektor erhält,
p
Jb− |j1 + j2 , j1 + j2 i0 = ~ (j1 + j2 + j1 + j2 )(j1 + j2 − j1 − j2 + 1)
× |j1 + j2 , j1 + j2 − 1i0
p
= ~ 2(j1 + j2 ) |j1 + j2 , j1 + j2 − 1i0 .
Wir fordern die Normierung und erhalten
|j1 + j2 , j1 + j2 − 1i0
1
= p
Jb− |j1 + j2 , j1 + j2 i0
~ 2(j1 + j2 )
1
= p
(Jb1 − + Jb2 − ) |j1 , j1 ; j2 , j2 i
~ 2(j1 + j2 )
154
(10.134)
p
p
1
= p
~ 2j1 |j1 , j1 − 1; j2 , j2 i + ~ 2j2 |j1 , j1 ; j2 , j2 − 1i ,
~ 2(j1 + j2 )
(10.135)
so dass wir schließlich
s
|j1 +j2 , j1 +j2 − 1i0 =
j1
|j1 , j1 − 1; j2 , j2 i +
j1 +j2
s
j2
|j1 , j1 ; j2 , j2 − 1i
j1 +j2
(10.136)
erhalten. Auf gleiche Art und Weise können wir weiter absteigen und finden
|j1 + j2 , j1 + j2 − 2i0 =
1
p
(Jb1 − + Jb2 − )2 |j1 , j1 ; j2 , j2 i
(j1 + j2 )[2(j1 + j2 ) − 1]
~2 2
s
j1 (2j1 − 1)
|j1 , j1 − 2; j2 , j2 i
(j1 +j2 )[2(j1 +j2 ) − 1]
s
j1 j2
|j1 , j1 − 1; j2 , j2 − 1i
+2
(j1 +j2 )[2(j1 +j2 ) − 1]
s
j2 (2j2 − 1)
|j1 , j1 ; j2 , j2 − 2i
+
(j1 +j2 )[2(j1 +j2 ) − 1]
=
(10.137)
usw. usf. Insbesondere finden wir (nicht unerwartet)
|j1 + j2 , −(j1 + j2 )i0 = |j1 , −j1 ; j2 , −j2 i
(10.138)
und erhalten so alle möglichen Eigenvektoren |j1 +j2 , mi0 . Dann haben wir in dem Unterraum, welcher der zweiten Zeile der Tabelle entspricht, noch den Vektor
s
s
j2
j1
|j1 , j1 − 1; j2 , j2 i +
|j1 , j1 ; j2 , j2 − 1i
(10.139)
−
j1 +j2
j1 +j2
als zu |j1 +j2 , j1 +j2 − 1i0 orthogonalen Vektor. Es muss sich dabei ebenso um einen
Eigenvektor von Jb2 handeln. Wenn wir nun alle Eigenvektoren von Jb2 mit Eigenwert
~2 (j1 +j2 )(j1 +j2 + 1) auschließen, dann muss dieser Vektor ebenfalls ein Eigenvektor mit
maximalem Eigenwert zu Jbz sein, aber zu j = j1 +j2 − 1, so dass dieser mit dem Vektor
|j1 +j2 −1, j1 +j2 −1i0
(10.140)
identifiziert werden kann. Durch sukzessive Anwendung von Jb− erhalten wir dann alle Eigenvektoren des Typs |j1 +j2 −1, mi0 . Diese Prozedur kann iteriert werden bis alle
Eigenvektoren von Jb2 und Jbz bestimmt worden sind.
Zusammenfassung:
Im Unterraum für gegebene Werte von j1 und j2 nimmt der Operator Jb2 die Eigenwerte
j = {j1 +j2 , j1 +j2 − 1, . . . , j1 −j2 }
(10.141)
oder (nach Streichung der Annahme j1 ≥ j2 )
j = {j1 +j2 , j1 +j2 − 1, . . . , |j1 −j2 |}
155
(10.142)
an. Wir bemerken, dass die Zahl der Eigenvektoren durch
j1 +j2
X
(2j + 1) = (2j1 + 1)(2j2 + 1)
(10.143)
j=|j1 −j2 |
sich dabei nicht ändert. Man kann im Allgemeinen für die Drehimpulskopplung
X
|j, mi0 =
|j1 , m1 ; j2 , m2 i hj1 , m1 ; j2 , m2 |j, mi
(10.144)
m1 ,m2
schreiben. Hierbei sind die Koeffizienten89
hj1 , m1 ; j2 , m2 |j, mi
(10.145)
die sogenannten Clebsch-Gordan Koeffizienten (CG Koeffizienten). Diese sind nur dann
von Null verschieden, falls j einen der Werte in Glg. (10.142) annimmt und m = m1 + m2 .
Die Clebsch-Gordan Koeffizienten sind tabelliert und in den meisten Computer-Algebra
Systemen bereits implementiert. Mit unseren Konventionen (Condon-Shortley) sind alle
CG Koeffizienten reell.
Die inverse Relation zu Glg. (10.144) ist
X
|j1 , m1 ; j2 , m2 i =
|j, mi0 hj, m|j1 , m1 ; j2 , m2 i
(10.146)
j,m
und aufgrund der Realiät der CG Koeffizienten gilt natürlich
hj, m|j1 , m1 ; j2 , m2 i = hj1 , m1 ; j2 , m2 |j, mi .
10.5.1
(10.147)
Addition von Spin 1/2 Operatoren
b=S
b1 + S
b2 . Die
Wir betrachten als konkretes Beispiel die Addition von zwei Spins, d.h. S
2 b2 b
b
b
Eigenzustände von S1 , S2 , S1 z und S2 z sind
|++i = |+i |+i ,
|−−i = |−i |−i ,
|+−i = |+i |−i ,
beziehungsweise in der | 12 , ms1 ; 12 , ms2 i Notation
 1 1 1 1
| 12 , + 21 ; 12 , − 21 i = |+−i ,
 | 2 , + 2 ; 2 , + 2 i = |++i ,

| 21 , − 12 ; 21 , + 21 i
= |−+i ,
| 12 , − 21 ; 21 , − 12 i
|−+i = |−i |+i ,
(10.148)
(10.149)
= |−−i .
b2 , Sbz , S
b2 und S
b2 bestimmen. Aufgrund dessen, was
Wir wollen nun die Eigenwerte von S
1
2
wir im allgemeinen Fall gesehen haben, wissen wir, dass
s = (s1 + s2 ), . . . , |s1 − s2 | = 1, 0
0
89
(10.150)
Diese Koeffizienten sind in der Tat das Skalarprodukt von |j, mi und |j1 , m1 ; j2 , m2 i, wie es die
Schreibweise schon andeutet, allerdings lassen wir den 0 hier weg. Dadurch lassen sich die Koeffizienten
der inversen Relation etwas einfacher schreiben.
156
und außerdem
→
→
für s = 1 :
für s = 0 :
ms = −1, 0, 1,
ms = 0.
(10.151)
b2 durch die beiden Spins aus und finden
Wir drücken S
b2 = S
b2 + S
b2 + 2S
b1 · S
b2 = 3 ~2 + 2Sb1 z Sb2 z + Sb1 + Sb2 − + Sb1 − Sb2 + .
S
1
2
2
(10.152)
Nun verwenden wir Glg. (10.144) um die CG Koeffizienten zu erhalten. Die Ergebnisse
für allgemeines j1 und für j1 = 1/2 sind in Tabn. 2 und 3 zu finden
j
j1 +
j1 −
1
2
1
2
m2 = − 12
q
1
m2 = + 21
q
1
j1 +m+ 2
−
q 2j1 +1
j1 −m+ 12
2j1 +1
q
j1 −m+ 2
2j1 +1
j1 +m+ 12
2j1 +1
Tabelle 2: Clebsch-Gordan Koeffizienten für j1 ⊗ 1/2.
j
1
0
1
mq
2 = +2
1+m
2
−
q
1−m
2
1
mq
2 = −2
1−m
2
q
1+m
2
Tabelle 3: Clebsch-Gordan Koeffizienten für 1/2 ⊗ 1/2.
Wir erhalten aus Tab. 3 den Singulett-Zustand
1 1 1 1 1
1 1 1 1 1
|+−i − |−+i
√
|0, 0i0 = − √ | , − ; , + i + √ | , + ; , − i =
2 2 2 2 2
2 2 2 2 2
2
und die Triplett-Zustände
r
1+1 1 1 1 1
0
|1, 1i =
| , + ; , + i = |++i ,
2 2 2 2 2
r
r
1 1 1 1 1
1 1 1 1 1
|+−i + |−+i
0
√
|1, 0i =
| ,+ ; ,− i +
| ,− ; ,+ i =
,
2 2 2 2 2
2 2 2 2 2
2
r
1 − (−1) 1 1 1 1
0
|1, −1i =
| , − ; , − i = |−−i .
2
2 2 2 2
(10.153)
(10.154)
(10.155)
(10.156)
Damit haben wir (2j1 + 1)(2j2 + 1) = 4 Eigenvektoren von Jb2 und Jbz gefunden. Insbesondere gilt für die Triplett-Zustände in der Tat
b2 |1, ms i0 = ~2 s(s + 1) |1, ms i0 = 2~2 |1, ms i0 ,
S
Sbz |1, ms i0 = ~ms |1, ms i0 mit ms = −1, 0, +1
(10.157)
(10.158)
und für den Singulett-Zustand
b2 |0, 0i0 = 0,
S
Sbz |0, 0i0 = 0.
157
(10.159)
(10.160)
10.5.2
Addition von Bahndrehimpuls und Spin 1/2 Operatoren
Auf gleiche Art und Weise können wir
b +S
b
Jb = L
(10.161)
ausrechnen. Wir erhalten Tab. 2 mit der Ersetzung j1 → `, d.h. ` − 12 ≤ j ≤ ` + 12 .
Die Anzahl der gemeinsamen Eigenvektoren von Jb2 und Jbz ist durch (2` + 1)(2 12 + 1) =
4` + 2 gegeben. Beispielsweise gilt für ` = 1 und s = 12 : j = { 32 , 21 }. Die Zustände in der
gekoppelten Basis sind
r
r
1 1 0
1
1 1
2
1 1
| ,+ i = −
|1, 0; , + i +
|1, +1; , − i
(10.162)
2 2
3
2 2
3
2 2
r
r
2
1
1 1 0
1 1
1 1
| ,− i = −
|1, −1; , + i +
|1, 0; , − i
(10.163)
2 2
3
2 2
3
2 2
3 3 0
1 1
| , + i = |1, +1; , + i
(10.164)
2 2
r 2 2
r
1 1
1 1
3 1 0
2
1
|1, 0; , + i +
|1, +1; , − i
(10.165)
| ,+ i = +
2 2
3
2 2
3
2 2
r
r
3 1 0
1 1
1 1
1
2
| ,− i = +
|1, −1; , + i +
|1, 0; , − i
(10.166)
2 2
3
2 2
3
2 2
3 3 0
1 1
| , − i = |1, −1; , − i .
(10.167)
2 2
2 2
158
11
Näherungsmethoden zur Lösung der Schrödingergleichung
Es gibt nur wenige Fälle, in denen wir die Schrödingergleichung exakt lösen können: das
freie Teilchen, der harmonische Oszillator, das Coulomb-Potential. In vielen Fällen ist
das Potential derart beschaffen, dass es unmöglich ist eine exakte Lösung der Schrödingergleichung zu finden. Man verwendet dann Näherungsmethoden. Darunter sind die
Störungstheorie (perturbative Methode), die Variantionsmethode und die WKB (WentzelKramers-Brillouin) Näherung. Schließlich kann man – wenn nichts anderes mehr hilft –
die Schrödingergleichung schlicht und einfach nuemrisch lösen. Im Folgenden wollen wir
die Störungstheorie in ihrer einfachsten Form und die Variationsmethode besprechen.
11.1
Störungstheorie (Perturbative Methode)
Diese Methode wird zur Lösung der Schrödingergleichung verwendet, wenn der Hamiltonoperator in eine Summe von Termen zerlegt werden kann, unter welchen einige sehr viel
größer sind als die anderen und wenn man die Schrödingergleichung für die großen Terme
gut lösen kann, d.h. falls
b =H
b 0 + λH
b1
H
und falls
i~
b1 H
b0,
mit λH
und λ 1
∂
b 0 ψ(x, t)
ψ(x, t) = H
∂t
(11.1)
(11.2)
b 0 um Eigut lösbar ist. In diesem Fall löst man zunächst die Schrödingergleichung für H
genvektoren und Eigenwerte zu erhalten. Dies ist die ungestörte Lösung, bzw. die nullte
Ordnung der Störungsreihe. Dann rechnet man mit der perturbativen Methode aus, wie
b 1 modiEigenwerte und Eigenfunktionen durch die Anwesenheit der kleineren Terms λH
fiziert werden.
Es gibt zwei Varianten der Störungstheorie. Die erste, genannt statische Störungstheorie
b 1 nicht von der Zeit
oder zeitunabhängige Störungstheorie, ist nur anwendbar, falls λH
abhängt und liefert gestörte Eigenvektoren und gestörte Eigenwerte. Die zweite Variante, genannt zeitabhängige Störungstheorie, liefert direkt eine approximative Lösung der
b1
zeitabhängigen Schrödingergleichung und kann sowohl für Fälle mit zeitabhängigem λH
b
wie auch für Fälle mit zeitunabhängigem λH1 verwendet werden. Die zweite Methode ist
besonders nützlich, um übergangswahrscheinlichkeiten von einem ungestörten Zustand
zu einem anderen ungestörten Zustand zu berechnen (notwendig, um Absorptions- und
Emissionsspektren zu berechnen). Die zweite Methode wird erst in QM2 besprochen. Hier
beschränken wir uns auf zeitunabhängige Störungstheorie.
11.1.1
Zeitunabhängige Störungstheorie (nicht-entarteter Fall)
Wir wollen ein System betrachten, dass durch den Hamiltonoperator
b =H
b 0 + λH
b1.
H
159
(11.3)
b bestimmen, d.h. wir wollen
Wir wollen die Eigenwerte und Eigenfunktionen von H
b 0 + λH
b 1 )φn = En φn
(H
(11.4)
lösen. Wir betrachten nun das ungestörte System und die entsprechenden stationären
Zustände betrachten,
(0) (0)
b 0 φ(0)
(11.5)
H
n = En φn .
(0)
(0)
Die Eigenwerte En und Eigenvektoren φn sind die Lösung des Problems zur nullten
(0)
(0)
Ordnung. Wir nehmen nun an, dass wir En und φn kennen. Nun wollen wir damit En
und φn bestimmen.
(0)
Wir betrachten ein ungestörte, diskreten und nicht-entarteten Energieeigenwert En . Der
Fall von Eigenwerten im kontinuierlichen Spektrum kann auf ähnliche Art und Weise
behandelt werden (und wird in QM2 behandelt). Im entarteten Fall sind zusätzliche
Vorkehrungen notwendig. Wir nehmen an, dass En und φn in einer Reihe entwickelt
werden können,
(1)
2 (2)
φn = φ(0)
n + λφn + λ φn + . . . ,
(0)
En = En
+
λEn(1)
2
+λ
En(2)
(11.6)
+ ...
(11.7)
und setzen Glgn. (11.6) und (11.7) in Glg. (11.4) ein,
b 0 + λH
b 1 ) φ(0) + λφ(1) + λ2 φ(2) + . . .
(H
n
n
n
(0)
(0)
(1)
2 (2)
(1)
2 (2)
= En + λEn + λ En + . . . φn + λφn + λ φn + . . .
(11.8)
Dann sortieren wir nach Potenzen von λ und erhalten
λ0 :
b 0 φ(0) = E (0) φ(0) ,
H
n
n
n
(1)
(0)
(0) (1)
b
b
H0 φn + H1 φn = En φn + En(1) φ(0)
n ,
(0) (0)
(1) (1)
(2) (0)
b 0 φ(2)
b (1)
H
n + H1 φn = En φn + En φn = En φn ,
λ1 :
λ2 :
(11.9)
(11.10)
(11.11)
(0)
usw. usf. Da wir angenommen haben, dass En nicht entartet ist, fixiert Glg. (11.9) den
(0)
(0)
(0)
Zustand φn eindeutig. Wie bereits erwähnt nehmen wir an, dass wir En und φn in
Glg. (11.9) berechnen können. Dann erinnern wir uns, um Glg. (11.10) zu lösen, dass die
(0)
(1)
φn eine Orthonormalbasis darstellen und zerlegen nach dieser φn , d.h. wir schreiben
φ(1)
n
=
∞
X
(0)
a(1)
nr φn .
(11.12)
r=1
(0)
Indem wir Glg. (11.12) in Glg. (11.10) einsetzen und das Skalarprodukt mit φk bilden,
finden wir
∞
X
(0) b
(0) b
(0)
(0)
(0)
a(1)
nr hφk | H0 |φr i + hφk | H1 |φn i = En
{z
}
|
r=1
(0)
∞
X
(0)
(0)
(0)
(1)
(0)
a(1)
nr hφk |φr i +En hφk |φn i .
|
|
{z
}
{z
}
r=1
=δk,r
=Ek δk,r
=δk,r
(11.13)
b 0 und ausführen der Skalarprodukte ergibt sich
Nach Auswertung der von H
(0) (1)
(0)
(0) (1)
(1)
b 1 |φ(0)
Ek ank δk n + hφk | H
n i = Ek ank + En δk n ,
160
(11.14)
(1)
was schließlich nach En aufgelöst werden kann,
(1)
(0)
b 1 )k n
En(1) δk n = ank (Ek − En(0) ) + (H
(11.15)
wobei das Matrixelement durch
(0)
b 1 )k n = hφ | H
b 1 |φ(0) i
(H
n
k
(11.16)
definiert ist. Aus Glg. (11.15) folgt dann für k = n
b 1 )n n .
En(1) = (H
(11.17)
WIr haben daher als erstes Ergebnis, dass die Störung des n-ten Energieeigenwerts in
b 1 im unerster Ordnung Störungstheorie durch den Erwartungswert des Störoperators H
gestörten Zustand gegeben ist. Wenn stattdessen k 6= n ist, dann folgt aus Glg. (11.15)
wegen δk n = 0, dass
b 1 )k n
(H
(1)
ank = (0)
.
(11.18)
(0)
En − Ek
(1)
Daher müssen wir, um die vollständige gestörte Wellenfunktion φn zu finden zusätzlich
(1)
noch ann bestimmen, dass nicht durch Glg. (11.18) direkt festgelegt ist. Aber an n(1) muss,
um die Normierungsbedingung zu gewährleisten, mit
(0)
(0) (1)
(1) (0)
1 = hφn |ψ † ni = hφ(0)
n |φn i + λ(hφn |φn i + hφn |φn i) + . . .
(11.19)
verträglich sein. Daraus folgt, dass
(1) †
a(1)
nn + (ann ) = 0
(11.20)
erfüllt und daher rein imaginär ist. Somit kann ann als zu Null identisch angenommen
werden. Mit dieser Wahl ist die erste Näherung der gestörten φn durch
φn = φ(0)
n +λ
b 1 )k n
(H
X
(0)
k6=n En
−
(0)
Ek
(0)
φk
(11.21)
gegeben. Aufgrund von Glg. (11.21) können wir sagen, dass der Effekt der Störung auf die
(0)
(0)
b 1 )k n 6= 0
Eigenfunktionen ist, dass zu der Eigenfunktion φn alle möglichen φk , für die (H
(0)
(0)
beigemischt werden. Die Mischung verstärkt sich, wenn die Energieniveaus Ek und En
näher beieinander sind. Auf gleiche Art und Weise kann man die Korrekturen bei höheren
Ordnungen berechnen. Beispielsweise können wir in Glg. (11.11)
φ(2)
n
=
∞
X
(0)
a(2)
ns φs
(11.22)
s=1
ansetzen. Dann finden wir mit der gleichen Prozedur das folgende Ergebnis für die Eigenwerte und Eigenfunktionen in zweiter Ordnung der Störungstheorie:
2
b
(
H
)
X (H
b 1 )n s (H
b 1 )s n X 1 n s (2)
En =
=
,
(11.23)
(0)
(0)
(0)
(0)
s6=n En − Es
s6=n En − Es
2
b
(H1 )s n X
b 1 )k s (H
b 1 )s n
b 1 )n n (H
b 1 )k n X 1
(H
(H
(2)
ank =
−
−
δk,n 2 .
(0)
(0)
(0)
(0)
(0)
(0)
(0)
(0) (En − Ek )2 s6=k 2
s6=n (En − Ek )(En − Es )
E
−
E
n
s (11.24)
161
11.1.2
Anwendungen der Störungstheorie
Wir werden hier einige Anwendungen der Störungstheorie betrachten. Wir wollen zunächst
die Energieniveaus eines Teilchens in einem anharmonischen Potential in einer Dimension
bestimmen. Das Potential ist also
1 2
V (b
x) = kb
x + ab
x3 + bb
x4 .
(11.25)
2
Störungstheorie kann verwendet werden, falls die Korrekturen deutlich kleiner sind als
der harmonische Term, d.h.
1 2
kρ aρ3 + bρ4 ,
(11.26)
2
wobei ρ ein Parameter mit Dimension einer Länge ist, der für den Bereich einer nichtverschwindenden Wellenfunktion charakteristisch ist. Zur nullten Ordnung (a = b = 0)
reduziert sich das System auf den harmonischen Oszillator und wir wissen, wie wir dieses
Problem exakt lösen, vgl. Kapitel 7. Wir erhalten die ungestörten Energieniveaus
r
1
1
k
En(0) = ~ωc (n + ) = hνc (n + ),
ωc = 2πνc =
(11.27)
2
2
m
und die entsprechenden Eigenfunktionen
r
2
ξ
~
φn (x) = Nn Hn (ξ) exp −
,
mit x0 =
2
mωc
1
(πx0 )− 4
,
Nn = √
2n n!
ξ=
x
. (11.28)
x0
Dann schreiben wir
b 1 = ab
H
x3 + bb
x4
(11.29)
und berechnen die erste Korrektur der Eigenwerte,
En(1)
b 1 )nn
= (H
Z+∞
3
4 (0)
=
dx φ(0)∗
n (x)[ax + bx ]φn (x)
−∞
Z+∞
2 3
dx φ(0)
n (x) x +b
=a
−∞
|
Z+∞
2 4
dx φ(0)
n (x) x .
(11.30)
−∞
{z
}
=0
Der Beitrag des ersten Terms zu den Energieniveaus verschwindet in ersten Ordnung
Störungstheorie, da x3 eine ungerade Funktion ist. Für den zweiten Term verwenden
wir hier Rekursionsrelationen der Hermite-Polynome90 . Wir reskalieren die Ortsvariable
x = x0 ξ und das Maß dx = x0 dξ und erhalten
En(1)
Z+∞
2
= bNn2 x50
dξ e−ξ Hn (ξ)2 ξ 4 ,
(11.31)
−∞
was sich mittels der Rekursionsrelation
1
ξHn (ξ) = Hn+1 (ξ) + nHn−1 (ξ)
2
90
(11.32)
Wir empfehlen Ihnen, die Ortsoperatoren durch Leiteroperatoren auszudrücken, um damit die Rechnungen in einer stillen Stunde selbst auszuführen. Sie werden erkennen, wie einfach diese dann sind.
162
vereinfachen lässt. Durch zweifache Anwendung finden wir
1
1
ξ 2 Hn (ξ) = Hn+2 (ξ) + (n + )Hn (ξ) + n(n − 1)Hn−2 (ξ).
4
2
(11.33)
Das Quadrat dieses Ausdrucks kann im Integral eingesetzt werden. Anschließend verwenden wir die Orthogonalitätsrelation der Hermite Polynome,
Z+∞
√
2
dξ e−ξ Hn (ξ)Hm (ξ) = 2n n! πδm n ,
(11.34)
−∞
um die Mischterme zu beseitigen. Am Ende finden wir
√
1 n+2
1 2 n
(1)
2 5
2
2 n−2
En = bNn x0 π
2 (n + 2)! + (n + ) 2 n! + n (n − 1) 2 (n − 2)!
16
2
3
= bx40 {2n2 + 2n + 1}.
(11.35)
4
Daher sind die Energieniveaus des anharmonischen Oszillators in erster Ordnung der
Störungstheorie durch
1
3
En = En(0) + En(1) = ~ωc (n + ) + bx40 (2n2 + 2n + 1)
2
4
(11.36)
gegeben.
11.1.3
Relativistische Korrekturen beim Wasserstoff
Die Klassische Hamiltonfunktion für ein geladenes Teilchen (Ladung −e0 ) in einem von
einer Punktladung Ze0 erzeugten elektromagnetischen Feld lautet
p
Ze20
p2
(p2 )2
Ze20
H = c m2e c2 + p2 −
= m e c2 +
−
+
.
.
.
−
.
r
2me 8m3e c2
r
(11.37)
Wenn wir die Klassischen Variablen durch die entsprechenden quantenmechanischen Operatoren ersetzen, die Ruheenergie me c2 weglassen und nur die führende Korrektur behalten, lautet der Hamiltonoperator
2
2 2
2
b0 + H
b1
b = p − Ze0 − (p ) = H
H
2me
r
8m3e c2
2
2
b 0 = p − Ze0 ,
mit H
2me
r
(11.38)
d.h. der ungestörte Hamiltonoperator ist einfach der bereits verwendete Hamiltonoperator
des Coulomb Problems. Wir fanden dabei, dass die Energieniveaus durch
b 0 φn,` m = E (0) φn,` m ,
H
n
En(0) = −
Z 2 e40 me 1
RyZ 2
=
−
2~2 n2
n2
(11.39)
b 1 induzierte Korrektur der Energieniveaus
bestimmt sind. Wir wollen nun die durch H
(0)
bestimmen. Wir wissen, dass für das reine Coulomb Problem das Energieniveaus En
n2 -fach entartet ist. Daher kann die bisher entwickelte Theorie hierfür nicht verwendet
b 2 und L
bz ist, und diese
werden. Wir bemerken aber, dass φn ` m auch Eignevektor von L
163
b 1 kommutieren. Die Unterräume, die von φn ` m für verschiedene
beiden Operatoren mit H
b 1 . Dann
Werte von ` und m aufgespannt werden, sind invariant unter der Wirkung von H
b 0 nicht entartet ist und
können wir uns auf einen Unterraum beschränken, auf dem H
2
2
pb
pb
(pb2 )2
1
(1)
φn ` m φn ` m
(11.40)
En ` = − hφn ` m |
|φn ` m i = −
8m3e c2
2me c2 2me
2me
Wegene Glg. (11.39) erhalten wir
pb2
φn ` m =
2me
Ze20
(0)
En +
φn ` m ,
r
(11.41)
was sich wiederum in Glg. (11.40) verwenden lässt. Wir finden
1
1
1
(1)
(0) 2
2 (0)
2 4
En ` = −
(En ) + 2Ze0 En hφn ` m | |φn ` m i + Z e0 hφn ` m | 2 |φn ` m i .
2me c2
r
r
(11.42)
Wir haben in bisherigen Übungen bereits
hφn ` m |
Z
1
|φn ` m i =
,
r
a0 n2
hφn ` m |
1
Z2
|φ
i
=
n
`
m
r2
a20 n3 (` + 12 )
(11.43)
ausgerechnet, was wir nun einsetzen können, um die Energieniveaus des Coulomb Problems inklusive Korrekturen erster Ordnung zu erhalten. Wir finden
1
RyZ 2
α2 Z 2
3
,
(11.44)
En ` = − 2
1+
−
n
n
4n
` + 21
wobei α = e20 /(~c) ∼ 1/137 die Sommerfeld’sche Feinstrukturkonstante ist. Die relativistische Korrektur der Energieniveaus ist wegen α2 um einen Faktor ∼ 10−4 gegenüber dem
nicht-relativisitischen Wert unterdrückt. Im Bereich des sichtbaren Spektrum entspricht
1
Å. Der wichtigste
dies einer Verschiebung der Spektrallinien von der Größenordnung 10
Effekte der relativistischen Korrektur ist die Erzeugung einer Abhängigkeit der Energieniveaus von der Quantenzahl `. Daher spaltet sich das n-te Energieniveau in n einzelne
Niveaus auf, die sehr dicht beieinander liegen und die Spektrallinien erhalten eine Substruktur, die man als Feinstruktur bezeichnet. Zwar wird dieser Effekt beobachtet, aber
um eine Beschreibung der realen Daten zu erhalten, muss man den hier noch nicht berücksichtigten Effekt des Elektronenspins mit einbeziehen.
11.2
Variationsmethode
Die Variationsmethode erlaubt uns eine obere Grenze für die Energie E0 des Grundzustands eines Systems zu bestimmen. Sie beruht darauf, dass der Erwartungswert des
Hamiltonoperators fur einen beliebigen (normierten, d.h. kϕk = 1) Zustand ϕ durch
b |ϕi
E[ϕ] = hϕ| H
(11.45)
grundsätzlich mindestens so großwie die Grundzustandsenergie E0 ist, und mit dieser nur
im Grundzustand übereinstimmt. Dies bedeutet, dass nur falls ϕ mit dem Grundzustand
b übereinstimmt, die Energie E[ϕ] mit der Grundzustandsenergie übereinstimmen
φ0 von H
164
b ein diskretes Spektrum E0 , E1 ,. . . , En besitzt und
kann. Wir wollen annehmen, dass H
möglicherweise zusätzlich noch ein kontinuierliches Spektrum σc hat. Wir schreiben
b n = En φn
Hφ
und
b E = EφE
Hφ
(11.46)
und entwickeln ϕ nach dieser Basis,
ϕ=
X
Z
cn φn 0
dE c(E)φE .
(11.47)
σc
n
Dann gilt
2
kϕk =
X
2
Z
dE |c(E)|2 ,
|cn | +
n
σc
b |ϕi =
E[ϕ] = hϕ| H
X
2
(11.48)
Z
En |cn | +
dE E |c(E)|2 .
(11.49)
σc
n
Wir nehmen nun an, dass σc > E0 , d.h. dass der Grundzustand eine niedrigere Energie
als alle Zustände des diskreten Spektrums hat. WIr subtrahieren E0 und erhalten
Z
X
2
dE (E − E0 ) |c(E)|2 ≥ 0,
(11.50)
E[ϕ] − E0 =
(En − E0 ) |cn | +
σc
n
wobei E[ϕ] = E0 nur gilt, falls c0 = 1 sowie cn = 0 für alle n > 0 und ebenso c(E) = 0
erfüllt sind. Auf Grundlage dieser Ergebnisse können wir die Variationsmethode benutzen,
um dei Grundzustandsenergie und -wellenfunktion zu bestimmen. Wir betrachten eine
Klasse von Zuständen, dere Elemente ϕ(a1 , . . . , an ) (Testfunktionen) durch eine endliche
Anzahl von Parameters a1 , . . . , an bestimmt sind. Dann bilden wir den Erwartungswert
b |ϕ(a1 , . . . , an )i
E(a1 , . . . , an ) = hϕ(a1 , . . . , an )| H
(11.51)
und wir bestimmen durch Variation jene Werte ā1 , . . . , ān von a1 , . . . , an , für welche
Glg. (11.51) minimal wird. Sie sind durch
∂E =0
r = 1, . . . , n
(11.52)
∂ar ār
bestimmt. In diesem Fall ist E(ā1 , . . . , ān ) = Ē eine Obergrenze für die Grundzustandsenergie E0 und der Vektor ϕ(ā1 , . . . , ān ) = ϕ̄ ist eine Näherung für die Grundzustandswellenfunktion φ0 innerhalb der Klasse der Testfunktionen, d.h. es gilt
E0 ≤ Ē =
b |ϕ̄i
hϕ̄| H
.
hϕ̄|ϕ̄i
(11.53)
Ob Ē ein guter oder schlechter Schätzwert für die Grundzustandsenergie ist hängt wesentlich von der Wahl der Klasse der Testfunktionen ab. Dafür ist es wichtig, Informationen
bzgl. der Struktur von φ0 zu haben und diese in die Klasse der Testfunktionen einfließen
zu lassen. In jedem Fall muss sich das Ergebnis verbessern91 , wenn wir die Klasse der
Testfunktionen erweitern.
91
Es sei denn, wir haben unwissentlich schon einen exakten Wert gefunden. Dieser Fall ist praktisch
auszuschließen für realistische Probleme.
165
Wir wollen ein Beispiel betrachten und die Variationsmethode zur Berechnung der Grundzustandsenergie des harmonischen Oszillators verwenden. Dann haben wir
2
2
b = − ~ d + 1 mω 2 x2 .
H
2m dx2 2
(11.54)
Wir wissen, dass die Eigenfunktion des Grundzustands keinerlei Nullstellen haben darf.
Eine einfache Wahl einer normierten Testfunktion die mit dieser Information verträglich
ist, ist
14
2a
2
ϕ(a, x) =
e−ax
mit
a > 0.
(11.55)
π
Wir finden dann
Z+∞
~2 d2
~2 a mω 2
1
∗
2 2
E(a) =
dx ϕ (a, x) −
ϕ(a,
x)
=
mω
x
+
.
+
2m dx2 2
2m
8a
(11.56)
−∞
Dann erhalten wir für a > 0 die Lösung
a=
mω
.
2~
(11.57)
Indem wir dies in Glg. (11.56) einsetzen, finden wir für die Grundzustandsenergie
1
E = ~ω = E0 ,
2
(11.58)
und die Testfunktion stimmt mit der Grundzustandswellenfunktion φ0 tatsächlich überein.
Die Tatsache, dass wir sogar das exakte Ergebnis erhalten können, erklärt sich daraus,
dass die Grundzustandswellenfunktion in der linearen Hülle der Testfunktionen liegt.
Diese Methode kann ebenfalls für angeregte Zustände erweitert werden, indem man sich
klar macht, dass E[ϕ] nahe bei einem allgemeinen Eigenwert zwar kein Minimum hat,
aber nichtsdestotrotz stationär ist. Dann sind die Eigenzustände Lösungen von
δE[ϕ] = E[ϕ + δϕ] − E[ϕ] = 0
mit
kϕ + δϕk2 = 1.
(11.59)
Die Testfunktionen für angeregte Zustände müssen mit deutlich komplizierteren Strukturen gebildet werden und müssen ausnahmslos orthogonal zur Eigenfunktion des Grundzustands sein. Außerdem sind die erhaltenen Eigenwerte nicht mehr zwangsläufig obere
Schranken.
166
Anhänge
A
Notation und Konventionen
Die innerhalb der Vorlesung und des Skriptes verwendeten Konventionen und Notationen
werden in diesem Anhang zusammengefasst.
A.1
Einheiten und Werte von Naturkonstanten
In dieser Vorlesung wird das Gauß’sche Einheitensystem (cgs System) statt des Internationalen Systems (SI System, MKSA System) verwendet. Das Gauß’sche System ist ein
metrisches, kohärentes Maßsystem, dessen fundamentale Einheiten für Länge, Masse und
Zeit der Zentimeter cm, das Gramm g und die Sekunde s sind. Die wichtigsten davon
abgeleiteten mechanischen Einheiten sind jene der Kraft, dyn, und der Energie, erg. Seit
1967 ist die Sekunde als das 9 192 631 770-fache der Periodendauer des Übergangs zwischen
den beiden Hyperfeinstrukturniveaus des Grundzustands des Nuklids 133 Cs definiert. Der
Meter wird daraufhin als die Distanz definiert, welche sich aus dem Produkt von der
Vakuumlichtgeschwindigkeit c = 299 792 458 m/s und einer Sekunde nach Division durch
299 792 458 ergibt. Das Kilogramm ist definiert als die Masse des Internationalen Kilogrammprotoyps, der sich im Internationalen Büro für Maß und Gewicht in Sèvres bei Paris
befindet. Die Beziehung zwischen den Basisgrößen cm und m sowie zwischen g und kg ist
offensichtlich, daher ist die Umrechnung rein mechanischer Größen zwischen Gauß’schen
und SI Einheiten trivial. Die im Internationalen System übliche makroskopische Einheit
der Energie ist das Joule, 1 J = 1 kgm2 /s2 = 107 erg = 107 gcm2 /s. Eine Besonderheit
der Bezeichnungen in der subatomaren Physik ist, dass der Femtometer fm = 1−15 m aus
Hochachtung vor Enrico Fermi (und aus Bequemlichkeit) als ein Fermi bezeichnet wird.
Der Gegensatz zwischen beiden Maßsystemen tritt bei elektromagnetischen Einheiten auf.
Während im SI System elektromagnetische Einheiten durch das Ampère’sche Kraftgesetz
für zwei parallele stromdurchflossene Leiter definiert werden, ist der Ausgangspunkt des
Gauß’schen Systems das Coulomb’sche Kraftgesetz für die Kraft zwischen zwei elektrischer
Ladungen. Im Gauß’schen System ist die Coulomb-Kraft zwischen zwei Ladungen Q1 und
Q2 durch F = Q1 Q2 /r2 gegeben. Im Gegensatz dazu ist die Coulomb Kraft im SI System
F = 1/(4πε0 )Q1 Q2 /r2 , wobei ε0 die Permittivitität des Vakuums ist. Daher ergeben sich
folgende Umrechnungen (E, D, B, H, ρ, j im Gauß’schen System, E 0 , D 0 , B 0 , H 0 , ρ0 ,
j 0 im Internationalen System:
elektrische Flussdichte
magnetische Flussdichte
magnetische Feldstärke
Raumladungsdichte
167
√
4πε0 E 0 ,
p
D = 4π/ε0 D 0 ,
p
B = 4π/µ0 B 0 ,
p
H = 4πµ0 H 0 ,
1
ρ= √
ρ0 ,
4πε0
elektrische Feldstärke E =
(A.1)
(A.2)
(A.3)
(A.4)
(A.5)
elektrische Stromdichte j = √
und
1
j 0,
4πε0
1
= ε0 µ 0 .
c2
(A.6)
(A.7)
Da im SI System ε0 = 8.854187817620 F/m mit 1 F/m = 1 A2 s4 /(kg m3 ) ist, gilt klarerweise, dass die elektrische Ladung in beiden Maßsystemen unterschiedliche Einheiten und
auch andere physikalische Dimensionen hat. Die Erklärung hierfür ist, dass im Internationalen System die Einheit der Stromstärke, das Ampère A, als Basiseinheit aufgefasst
wird, und damit die Einheit der Ladung als 1 C = 1 As definiert wird. Wann immer in
einer Gleichung im Internationalen Maßsystem auf nur einer der beiden Seiten elektromagnetische Einheiten (Ampère oder Coulomb) auftreten, tritt in diesen Gleichungen ebenso
eine Konstante ε0 oder µ0 auf, welche die Einheiten aneinander anpasst. Die im SI System
benötigten Konstanten ε0 und µ0 (elektrische und magnetische Feldkonstanten) werden
im Gauß’schen System nicht benötigt.
Die Einheit der Ladung ist im Gegensatz zum Internationalen
System im Gauß’schen Sysq
p
tem durch [Ladung] = [Energie] × [Länge] = [Masse] × [Länge]3 /[Zeit] definiert. Das
heißt, man
System die elektrostatische Ladungseinheit [Ladung] =
p erhält im Gauß’schen
√
2
1 esu = dyn × cm = erg × cm. Wie man leicht erkennt, treten bei Verwendung dieser
Einheiten keine Feldkonstanten auf.
In beiden Maßsystemen verwendet man auf (sub-)atomaren Skalen gerne das Elektronenvolt als Energieeinheit. Es gilt im SI System 1 eV = 1.6021766208(98)×10−19 J. Hierbei ist
e die (positive) Elementarladung mit Wert e = 1.6021766208(98)×10−19 C. Im Gauß’schen
System ist die (positive) Elementarladung e = 4.80320425(10) × 10−10 esu. Da typische
Energien von (sub-)atomaren Systeme von der Größenordnung meV (kondensierte Materie) bis TeV (LHC) sind, sind die Einheiten eV, keV, MeV und GeV mehr als nur
gebräuchlich.
Das Gauß’sche Maßsystem bietet sich außerdem für eine weitere Vereinfachung zu natürlichen Einheiten an, indem man die abstrakten Werte für die Lichtgeschwindigkeit im
Vakuum, c = 299 792 458 m/s, und für die Planck’sche Konstante (dividiert durch 2π),
~ = 1.054571800(13) × 10−34 Js = 6.582119514(40) × 10−16 eVs, beide zugleich auf eins
setzt. Das Produkt dieser beiden Konstanten ist ~c = 197.3269788(12) MeV fm und eignet sich hervorragend für Überschlagsrechnungen und ist in natürlichen Einheiten gleich
eins. Daher sieht man leicht, dass in natürlichen Einheiten Längen, Zeiten sowie die Kehrwerte von Energien, Impulsen und Massen alle die gleiche Einheit 1fm = 1/MeV haben.
Darüber hinaus√ist die elektrische Ladung in natürlichen Einheiten dimensionslos und
kann mit e = 1.4399764 MeV fm einfach in andere Maßsysteme übertragen werden.
Selbstverständlich muss man vor jedem Vergleich mit experimentellen Werten wieder alle
Größen zu Gauß’schen oder Internationalen Einheiten konvertieren.
Tabellen der wesentliche Konstanten und der physikalischen Einheiten finden Sie im Tabellenteil des Anhangs, vgl. Tabn. 4 und 5.
168
A.2
Vektoren und Metrik
Vektoren im Raum R3 oder im Minkowskiraum werden im Allgemeinen durch kleingeschriebene lateinische Buchstaben bezeichnet. Dreiervektoren werden durch Fettdruck hervorgehoben, Vierervektoren sind nicht fett gedruckt. Lateinische Buchstaben als Indizes
mit Wertebereich 1, 2 und 3 bezeichnen räumliche Komponenten, griechische Buchstaben
als Indizes mit Wertebereich 0, 1, 2 und 3 bezeichnen Komponenten von Vierervektoren.
Der Index 0 ist der Zeitkomponente zugeordnet, die Indizes 1, 2 und 3 den drei räumlichen
Komponenten.
Kontravariaten Vierervektoren sind definiert als xµ ≡ (x0 , +x), die dazu dualen kovarianten Vierervektoren als xµ ≡ (x0 , −x). Die Komponenten des metrischen Tensors gµν sind
durch g00 = +1 und g11 = g22 = g33 = −1 gegeben (Westküstenmetrik). Doppelt auftretenden Indizes werden im Allgemeinen über ihren Wertebereich summiert (Einstein’sche
Summenkonvention) sofern dies nicht explizit anders angegeben ist. Daher gilt xµ = gµν xν
und gµν g νρ = δµρ . Einheitsvektoren werden durch x̂ bzw. x̂µ oder x̂µ bezeichnet. Im Besonderen werden die kartesischen Einheitsvektoren durch µ̂ ≡ êµ (oder µ̂) bezeichnet.
Skalarprodukte zwischen Dreiervektoren werden durch x · p bezeichnet, Beträge reeller
Dreiervektoren auch schlicht durch x2 = |x|2 = x2 ≡ x·x. Vektorprodukte von Dreiervektoren werden durch x × y = ijk xi yj êk bezeichet. Das Vorzeichen des vierdimensionalen
Epsilon Tensors wird auf 0123 = +1 festgelegt.
Spinoren werden durch griechische Großbuchstaben bezeichnet und ihre Komponenten
mittels griechischer Buchstaben indiziert. Der Wertebereich der Spinor-Indizes ist 1 und
2 für Zweier-Spinoren und 1, 2, 3 und 4 für Vierer-Spinoren. Das zum komplexen Vektor
oder Spinor Ψ hermitesche konjugierte Objekt wird durch Ψ † bezeichnet, das komplex
konjugierte Objekt durch Ψ ∗ . Beträge komplexer Vektoren oder Spinoren werden durch
|Ψ |2 ≡ Ψ † Ψ = Ψα∗ Ψα bezeichet und als Summe aller Komponenten verstanden.
Die Pauli Matrizen sind definiert als
0 1
0 −i
σ1 =
,
σ2 =
,
1 0
i 0
σ3 =
1 0
0 −1
(A.8)
und werden im Dreiervektor σ = (σ1 , σ2 , σ3 )T zusammengefasst.
A.3
Wellenfunktionen und Zustandsvektoren
Innerhalb der Vorlesung werden zeitabhängige Wellenfunktionen bzw. Zustandsvektoren
immer mit dem Symbol ψ(x, t) bezeichnet. Zeitunabhängige Wellenfunktionen, die stationären Zustanden (d.h Energieeigenzuständen) entsprechen, werden immer mit φ(x)
bezeichnet. Andere Arten von L2 (R3 ) Funktionen bzw. Hilbertraumvektoren werden generisch mit χ oder ξ bezeichnet. Objekte von jedem dieser drei Typen werden darüber
hinaus (z.B. bzgl. ihrer Quantenzahlen) durch untere Indizes gekennzeichnet, z.B. χm ,
φm (x) oder ψnlm (x, t).
169
A.4
Fourier-Transformation
Die Definitionen und Konventionen zur Fourier-Transformation in der Vorlesung stimmen
mit jenen aus den Übungen überein.
Sei
R ∞f eine komplexwertige Funktion einer reellen Variablen, die absolut integrierbar
( −∞ dx|f (x)| < ∞) und stetig differenzierbar ist. Ihre Fourier-Transformation ist gegeben
durch
Z ∞
1
dxe−ikx f (x).
(A.9)
f˜(k) = F[f (x); k] = √
2π −∞
Die Rücktransformation ist dann
Z ∞
1
dk eikx f˜(k).
(A.10)
f (x) = √
2π −∞
Sei g eine weitere komplexwertige Funktion einer reellen Variablen, die absolut integrierbar
und stetig differenzierbar ist.
Für α, β ∈ C, a ∈ R gilt:
F[αf (x) + βg(x); k] = αF[f (x); k] + βF[g(x); k],
F[f (x − a); k] = e−ika F[f (x); k],
1
k
F[f (ax); k] = F f (x);
für a > 0,
a
a
F[f (−x); k] = F[f (x); −k],
df (x)
; k = ikF[f (x); k],
F
dx
d
F[xf (x); k] = i F[f (x); k].
dk
(A.11)
(A.12)
(A.13)
(A.14)
(A.15)
(A.16)
Man kann die Fourier-Transformationen auf natürliche Weise auf Funktionen auf Rn erweitern. Die Faltung f ∗ g zweier Funktionen ist definiert durch
Z
(f ∗ g)(x) = dyf (y)g(x − y).
(A.17)
Das Faltungstheorem für die Fourier-Tranformation lautet
F[f ∗ g] =
√
2πF[f ] · F[g],
1
F[f · g] = √ F[f ] ∗ F[g].
2π
A.5
(A.18)
(A.19)
Delta-Distribution
Dieser Abschnitt des Anhangs fasst noch einmal kompakt den Inhalt der Übungen zusammen.
170
A.5.1
Eigenschaften der δ- und θ-Funktion
δ-Funktionen sind Distributionen. Ihre Wirkung auf Testfunktionen h(x) ist durch
Z ∞
dx δ(x − x0 )h(x) = h(x0 )
(A.20)
−∞
gegeben. Seien f (x) und g(x) zwei einfach differenzierbare Funktionen, wobei g(x) über
n einfache Nullstellen xi verfügt, mit der Eigenschaft g 0 (xi ) 6= 0. Dann sind folgende
Eigenschaften der δ-Funktion (für a 6= 0) leicht zu zeigen:
δ(ax) =
Z
δ(x)
,
|a|
(A.21)
∞
−∞
dx f (x)δ 0 (x) = −f 0 (x)x=0 ,
(A.22)
xδ 0 (x) = −δ(x),
n
X
1
δ(g(x)) =
δ(x − xi ),
0
|g (xi )|
i=1
δ(x2 − a2 ) =
1
(δ(x − a) + δ(x + a))
2|a|
Die Heaviside-Funktion, auch θ-Funktion genannt, ist definiert durch
0 für x < 0
θ(x) =
.
1 für x ≥ 0
(A.23)
(A.24)
(A.25)
(A.26)
Man sieht, dass deren Ableitung die δ-Funktion ist:
d
θ(x) = δ(x).
dx
A.5.2
(A.27)
Darstellungen der Dirac’schen Delta-Distribution
Unter einer Darstellung der δ-Distribution versteht man eine reguläre Funktion δ (x)
(d.h. keine Distribution), die außer von x auch von einem Parameter abhängt und für
geeignete Testfunktionen h(x) folgende Eigenschaft hat:
Z ∞
lim
dx h(x) δ (x) = h(0) .
(A.28)
→0
−∞
Z
∞
f (x/)
−∞
eine Darstellung der δ-Distribution. Dabei sind folgenden Funktionen als Darstellungen
der δ-Distribution besonders relevant:
Für eine beliebige normierte Funktion f (x), d.h.
1
2 2
√ e−x / ,
π
1
,
2
π x + 2
dx f (x) = 1 erhält man durch
1 sin(x/)
,
π
x
sin2 (x/)
.
π
x2
(A.29)
Die anschauliche Interpretation der Delta-Distribution als “Funktion” mit δ(0) = ∞ und
δ(x 6= 0) = 0 gilt nur für einen Teil der Darstellungen lim δ (x), wie Sie in den Übungen
→0
gesehen haben.
171
B
B.1
Zusammenfassung des Formalismus
Hilbertraum, Operatoren und Skalarprodukt
Ein Hilbertraum ist ein komplexer Vektorraum mit Skalarprodukt (Skalarproduktraum),
daher ist auf jedem Hilbertraum auch eine Norm definiert. Man spricht daher auch von
einem normierten komplexen Vektorraum.
B.1.1
Allgemeine Eigenschaften von Vektorräumen
Wir betrachten nun einen allgemeinen Vektorraum V (K) über dem Körper K. Beispiele
für K sind Rn (Körper der reellen Zahlen in n Dimensionen) oder Cm (Körper der komplexen Zahlen in m Dimensionen). Der Vektorraum V (K) kann komplex sein, auch falls
der Körper K reell ist, das Gegenteil ist nicht möglich. Im Allgemeinen sind auf Vektorräumen grundsätzlich Addition und Skalarmultiplikation definiert. Beide Operationen
sind assoziativ, Addition ist auch kommutativ und Skalarmultiplikation ist auch distributiv, d.h. für drei Vektoren χ ≡ χ1 , χ2 und χ3 und zwei Skalare α ≡ α1 und α2 aus dem
Körper K 0 gilt
χ1 + (χ2 + χ3 ) =(χ1 + χ2 ) + χ3 ,
χ1 + χ2 =χ2 + χ1 ,
(B.1)
(B.2)
α1 (α2 χ) =(α1 α2 )χ,
α(χ1 + χ2 ) =αχ1 + αχ2 ,
(α1 + α2 )χ =α1 χ + α2 χ.
(B.3)
(B.4)
(B.5)
sowie
Daher sind Linearkombinationen erlaubt und liegen ebenfalls im Vektorraum:
χ1 , χ2 ∈ V (K)
⇒ α1 χ1 + α2 χ2 ∈ V (K) ∀α1 , α2 ∈ K 0 .
(B.6)
Selbstverständlich dürfen die Skalare α1 und α2 komplex sein (K 0 = C) sofern der Vektorraum V (K) komplex ist, ansonsten müssen sie reell sein (K 0 = R).
Es existiert ein Nullvektor  unter Addition, so dass
 + χ = χ,
B.1.2
0χ = ,
α = 
∀χ ∈ V (K),
∀α ∈ K 0 .
(B.7)
Operatoren und ihre Wirkung auf Elemente von Vektorräumen
An dieser Stelle wollen wir uns auf die Definition von linearen Operatoren besinnen und uns
b : V (K) → V 0 (K) dederen Eigenschaften in Erinnerung rufen. Ein linearer Operator O
finiert eine lineare, strukturerhaltende Abbildung (Homomorphismus) zwischen zwei Vektorräumen V (K) und V 0 (K) über einem gemeinsamen Körper K. Im Folgenden betrachen
wir Vektoren χ ≡ χ1 , χ2 ∈ V (K) und einen Skalar α, der je nach Eigenschaften von V (K)
reell oder komplexwertig ist. In diesem Fall gilt:
172
1. Lineare Operatoren sind homogen, d.h.
b
b
O(αχ)
= αOχ.
(B.8)
2. Lineare Operatoren sind additiv, d.h.
b 1 + χ2 ) = Oχ
b 1 + Oχ
b 2.
O(χ
(B.9)
b Oχ
b 1 , Oχ
b 2 Elemente von V 0 (K). Alle durch OV
b (K) darHierbei sind die Vektoren Oχ,
stellbaren Elemente von V 0 (K) sind das Bild von V (K). Alle Elemente von V (K), die
b auf V 0 (K) abgebildet werden, bilden zusammen das Urbild von
durch Anwendung von O
0
b−1 : V 0 (K) → V (K) wird als inverser
V (K). Der durch das Urbild definierte Operator O
Operator bezeichnet. Alle Elemente von V (K), die auf den Nullvektor in V 0 (K) abgebildet
b
werden, liegen im Kern des Operators, ker O.
b sowie der Nulloperator 0,
b deren defiZwei spezielle Operatoren sind der Einsoperator 1
b
b
nierende Eigenschaften (für beliebiges χ ∈ V (K)) durch 1χ = χ und 0χ =  gegeben
b das Urbild des Bilds von V (K) wieder gleich V (K) ist,
sind. Wenn für den Operator O
b zugeordnete Abbildung bijektiv, d.h. das Urbild jedes einzelnen
ist die dem Operator O
0
Elements von V (K) ist genau einelementig. Insbesondere kann dies nur erfüllt sein, wenn
b (und des inversen Operators O
b−1 ) lediglich aus dem Nullvektor
der Kern des Operators O
 besteht.
Nicht alle Operatoren sind linear, z.B. ist leicht zu sehen, dass auf dem Raum L2 (R3 ) der
b
Operator Oχ(x)
= χ2 (x) nicht linear ist. Ein spezielle Typ von nicht-linearen Operatoren
b
sind antilineare Operatoren. Diese sind antihomogen, d.h ein antilinearer Operator A
erfüllt anstelle von Glg. (B.8)
b
b
A(αχ)
= α∗ Aχ.
(B.10)
Für lineare Operatoren sind Addition, Skalarmultiplikation und Verknüpfung (Operatorb≡O
b1 , O
b2 : V1 (K) → V2 (K) sowie O
b3 : V2 (K) →
produkt) definiert. Für die Operatoren O
V3 (K) gilt
b1 + O
b2 )χ = O
b1 χ + O
b2 χ,
(O
b = α(Oχ),
b
(αO)χ
(B.11)
b3 O
b2 )χ = O
b3 (O
b2 χ),
(O
(B.13)
(B.12)
wobei der Vektor χ ∈ V (K) und der Skalar α in den dem Problem entsprechenden Räumen
liegen.
b1 , O
b2 : V (K) → V (K) gilt nicht zwangsläufig, dass diese kommuFür zwei Operatoren O
tieren, d.h. der Kommutator
b1 , O
b2 ] = O
b1 O
b2 − O
b2 O
b1
[O
(B.14)
ist nicht notwendigerweise für beliebige Vektoren von Null (bzw. vom Nulloperator) verschieden.
173
B.1.3
Skalarprodukt und Norm
Ein Vektorraum V (K), auf dem für zwei beliebige Vektoren χ1 und χ2 ein Skalarprodukt
definiert ist, heißt auch Skalarproduktraum und ist normiert, d.h. eine Norm ist definiert.
Je nachdem ob der Vektorraum reell oder komplex ist, ist das Skalarprodukt eine Abbildung auf den Körper der reellen oder komplexen Zahlen, welche folgende drei Bedingungen
erfüllt:
1. Das Skalarprodukt von χ1 und χ2 ist die komplex konjugierte Zahl zum Skalarprodukt von χ2 und χ1 . Zum klareren Verständnis in Formeln:
hχ1 |χ2 i = hχ2 |χ1 i∗ .
(B.15)
2. Das Skalarprodukt von χ1 und χ2 ist linear im zweiten Faktor, d.h. in χ2 . Zum
klareren Verständnis mit Vektoren χ1 , χ2 und χ3 and Skalaren α1 und α2 :
hχ3 |α1 χ1 + α2 χ2 i = α1 hχ3 |χ1 i + α2 hχ3 |χ2 i .
(B.16)
3. Das Skalarprodukt eines Vektors χ mit sich selbst ist eine relle, nicht-negative Zahl
(Positivität):
hχ|χi ≥ 0,
(B.17)
und falls hχ|χi = 0, gilt notwendigerweise χ = .
Aufgrund seiner Positivität definiert Glg. (B.17) die Norm des Vektors χ:
Nχ ≡ kχk2 ≡ hχ|χi ≥ 0.
(B.18)
Mittels Glg. (B.15) und Glg. (B.16) findet man leicht, dass das Skalarprodukt hχ1 , χ2 i
nicht linear sondern anti-linear im ersten Faktor χ1 ist:
hα1 χ1 + α2 χ2 , χ3 i = α1∗ hχ1 , χ3 i + α2∗ hχ2 , χ3 i .
(B.19)
Aus diesen drei Eigenschaften lässt sich eine sehr wichtige Eigenschaft des Skalarprodukts herleiten, die Scharz’sche Ungleichung (auch: Cauchy-Schwarz’sche Ungleichung
oder Dreiecksungleichung):
p
(B.20)
|hχ1 , χ2 i| ≤ hχ1 , χ1 i hχ2 , χ2 i.
Gleichheit gilt dann und nur dann wenn χ1 und χ2 Vielfache voneinander sind.
B.1.4
Weitere Eigenschaften: Operatornorm, Beschränktheit
b : V (K) → V 0 (K), der von einem normierten Vektorraum
Für einen linearen Operator O
auf einen anderen (nicht notwendigerweise verschiedenen) normierten Vektorraum abbildet, kann man eine Operatornorm definieren:
b Oχ 0
b
b V
≡ sup Oχ
(B.21)
O ≡ sup
0.
V
χ∈V,χ6= kχkV
kχkV =1
Hierbei sind V und V 0 selbstverständlich als V (K) und V 0 (K) zu verstehen. Ein Operator,
dessen Operatornorm endlich ist heißt beschränkt.
174
B.1.5
Lineare Abhängigkeit, Orthogonalität, Vollständigkeit, Basis, Dimensionalität
Man nennt eine Satz von Vektoren χ1 , χ2 , . . . , χN dann und nur dann linear unabhängig,
sofern keine Linearkombination existiert, die
N
X
αn χ n = 
(B.22)
n=1
erfüllt, außer der trivialen Linearkombination, d.h. jener, für welche alle Koeffizienten
einzeln verschwinden, d.h. αn = 0 ∀n ∈ {1, . . . , N }. In diesem Fall kann keiner dieser
Vektoren als eine Linearkombination der anderen geschrieben werden. Andernfalls nennt
man den Satz der Vektoren χ1 , χ2 , . . . , χN linear abhängig.
Man nennt zwei Vektoren zueinander orthogonal, wenn ihr Skalarprodukt verschwindet:
hχ1 | χ2 i = 0
⇔
χ1 ⊥ χ2 .
(B.23)
In diesem Fall sind diese Vektoren auch voneinander linear unabhängig. Ein Satz paarweise
zueinander orthogonaler Vektoren ist automatisch linear unabhängig, der Umkehrschluss
gilt aber nicht. Man kann aber immer einen Satz von N Linearkombinationen der N linear
unabhängigen Vektoren bilden, so dass diese N Linearkombinationen paarweise zueinander
orthogonal sind. Dieses Verfahren nennt man auch Orthogonalisierung.
Falls jeder Vektor χ eines Vektorraums als eine Linearkombination der Vektoren χ1 ,
χ2 , . . . χN dargestellt werden kann, so nennt man den Satz der Vektoren χ1 , χ2 , . . . χN
vollständig. Die Vektoren eines vollständigen Satzes müssen nicht zwangsläufig linear unabhängig sein. Indem man solange Vektoren aus dem vollständigen Satz entfernt bis der
verbleibendende Satz linear unabhängig ist, erhält man einen maximalen Satz linear unabhängiger Vektoren (der selbstverständlich immer noch vollständig ist). Nachdem man
diesen maximalen Satz linear unabhängiger Vektoren orthogonalisiert hat, erhält man eine
sogenannte Basis des Vektorraums. Nachdem man diese Basisvektoren alle normiert hat,
so dass ihre Norm gleich eins ist, spricht man von einer Orthonormalbasis (ONB). Im Fall
normierter orthogonaler Vektoren spricht man auch von Orthonormalität. Die Dimension
d eines Vektorraums V ist die maximale Zahl linear unabhängiger Vektoren.
Ein Hilbertraum H ist ein solcher Vektorraum mit allen zuvor in diesem Abschnitt genannten Eigenschaften sowie der zusätzlichen Eigenschaft, dass dieser entweder endliche
Dimensionalität hat (d < ∞), oder, dass einen unendlichen, vollständigen Satz von paarweise zueinander orthogonalen Vektoren χ1 , χ2 , . . . , χn , . . . ∈ H gibt,
dass man für jeden
Pso
∞
einzelnen Vektor χ Zahlen α1 , α2 , . . . , αn , . . . finden kann, so dass i=1 αi χi zu χ konvergiert.PDies bedeutet, dass für ausreichend großes N die Norm der Differenz der Vektoren
χ− N
i=1 αi χi verschwindet
N
X
lim χ −
αi χi = 0.
(B.24)
N →∞ i=1
175
B.2
Eigenschaften von Hilberträumen
Der Funktionenraum der quadrat-integrablen Funktionen (L2 Funktionen) besitzt die Eigenschaften eines (komplexen) Hilbertraums. Dies werden wir im folgenden zeigen. Zunächst handelt es sich um einen linearen Raum, d.h. wenn χ1 (x) und χ2 (x) zwei quadratintegrable Funktionen sind, dann sind auch ihre Summe sowie das Produkt jeder einzelnen
mit einer beliebigen komplexen Zahl und folglich auch jegliche Linearkombination quadratintegrable Funktionen, z.B.
α1 χ1 (x) + α2 χ2 (x),
(B.25)
wobei α1 und α2 beliebig wählbare komplexe Zahlen sind. Desweiteren kann man auf
diesem Hilbertraum ein Skalarprodukt definieren. Dieses Skalarprodukt ist eine komplexe
Zahl. Gemäß seiner Definition ist das Skalarprodukt der Funktion χ1 (x) mit der Funktion
χ2 (x)
Z
hχ1 |χ2 i =
d3 x1 . . . d3 xn χ∗1 (x1 , . . . , xn )χ2 (x1 , . . . , xn ).
(B.26)
Dieses L2 Skalarprodukt hat die drei fundamentalen Eigenschaften aus den Glgn. (B.15),
(B.16) und (B.17), wie man mittels seiner Definition, vgl. Glg. (B.26), leicht beweisen
kann. Falls das Skalarprodukt der Funktionen χ1 (x) und χ2 (x) verschwindet, nennt man
diese zueinander orthogonal. Die Norm Nχ einer Funktion χ ist als Skalarprodukt dieser
Funktion mit sich selbst definiert, vgl. Glg. (B.18), d.h.
Nχ = kχk2 = hχ|χi .
(B.27)
Die Schwarz’sche Ungleichung gilt selbstverständlich auch für das durch Glg. (B.26) definierte Skalarprodukt und garantiert, dass das Integral in vgl. Glg. (B.26) konvergiert,
wenn χ1 und χ2 beide quadrat-integrable Funktionen sind.
Zusätzlich zur Linearität und zur Möglichkeit ein Skalarprodukt zu definieren besitzt der
Raum der quadrat-integrablen (L2 ) Funktionen eine Eigenschaft namens Vollständigkeit.
Erst diese Eigenschaft ermöglicht die Identifikation des L2 Raums mit dem Hilbertraum.
Vollständigkeit bedeuted, dass jeder Satz von quadrat-integrablen Funktionen, die das
Cauchy-Kriterium erfüllen, im quadratischen Mittel zu einer quadrat-integrablen Funktion
konvergiert. Im Gegenzug bedeutet dies, dass jede quadrat-integrable Funktion als der
Grenzwert (im quadratischen Mittel) einer konvergenten Reihe (im Sinne von Cauchy)
von quadrat-integrablen Funktionen aufgefasst werden kann (lineare Separierbarkeit).
176
C
Dirac Notation
Da wir in der QM im Allgemeinen mit einem abstrakten Hilbertraum H hantieren, empfiehlt es sich eine Darstellung zu wählen, welche in möglichst transparenter Art und Weise
die physikalische Observablen, zu denen ein gegebener Zustand ein Eigenvektor ist, in den
Vordergrund zu stellen. Die Dirac Notation (oder auch Braket Notation) ist die Umsetzung dieses Gedankens. In Dirac Notation wird das Symbol
hχ1 | χ2 i ,
(C.1)
welches bisher zur Kennzeichnung eines Skalarprodukts zwischen zwei beliebigen Elementen (bzw. Vektoren) des Hilbertraums H verwendet wurde, in zwei Teile aufgespalten, die
man als
Bra: hχ1 |
und
Ket: |χ2 i
(C.2)
bezeichnet. Das Ket |χ2 i wird einfach anstelle des Symbols χ2 verwendet, um ein generisches Element des Hilbertraums H zu indizieren. Das Bra hχ1 | wird verwendet um die
Wirkung des Skalarprodukts auf irgendein Element des Hilbertraums H anzuzeigen, d.h.
das Bra hχ1 | ist ein Element des Dualraums zu H, dessen Partner in H durch |χ1 i gegeben
ist. Aufgrund der komplexen Natur des Skalarprodukts,
hχ1 |χ2 i = hχ2 |χ1 i∗
(C.3)
und dessen Linearität im zweiten Faktor folgt offensichtlich aus
|χi = α |χ1 i + β |χ2 i
(C.4)
hχ| = α∗ hχ1 | + β ∗ |χ2 i .
(C.5)
die Beziehung
b auf den Zustansvektor χ wird durch
Die Anwendung eines Operators A
b |χi = |Aχi
b
A
(C.6)
b auf das Bra hχ1 | als das Funktional
bezeichnet. Man kann genauso die Wirkung von A
b auf den
über H definieren, das aus der Verknüpfung der Anwendung des Operators A
Hilbertraumvektor |χ2 i und dem anschließenden Skalarprodukt mit dem Dualraumvektor
hχ1 | besteht,
b |χ2 i ≡ hχ1 | A
b |χ2 i = hχ1 |Aχ
b 2 i ≡ hχ1 | A
b |χ2 i .
hχ1 | A
(C.7)
b |χi entsprechende Bra der Dualraumvektor hχ| A
b†
WIr merken an, dass das dem Vektor A
ist. Wir schreiben daher
b |χi † = hχ| A
b†
A
(C.8)
und
b† A
b |χ2 i = hAχ
b 1 |Aχ
b 2i ,
hχ1 | A
2
b† A
b |χi = hAχ|
b Aχi
b =
b
hχ| A
|
Aχi
.
Die Dirac Notation ist Ihnen bereits in den Abschnitten 7.3 und 10 begegnet.
177
(C.9)
D
D.1
Abbildungen und Tabellen
Abbildungen
Abbildung D.1: Energiedichte u(ω(λ), T ) der Schwarzkörperstrahlung als Funktion der Temperatur (Abb. aus Wikipedia). Als Abszisse ist die Wellenlänge λ aufgetragen.
Abbildung D.2: Schematisch: mit Strahlung gefüllter Hohlraum (Abb. aus [7]).
Abbildung D.3:
Schematisch: Energiedichte u(ω, T ) der Schwarzkörperstrahlung mit
Grenzfällen: Rayleigh-Jeans und Wien’sches Verschiebungsgesetz (Abb. aus
[7]). Als Abzisse ist die Frequenz ω aufgetragen.
178
Abbildung D.4: Schematisch: Experimenteller Aufbau zur Messung des photoelektrischen
Effekts (Abb. aus Wikipedia).
Abbildung D.5: Photoelektrischer Effekt. Einfallende Lichtquanten ausreichend hoher Frequenz streuen an gebundenen Elektronen. Sofern die Auslösearbeit W überschritten wird, wird ein Elektron mit Energie E = ~ω − W emittiert.
Abbildung D.6: Schematisch: Experimenteller Aufbau zur Messung von Compton-Streuung:
(Abb. aus dem Web: Serlo).
Abbildung D.7: Typische Intensitätsverteilung für Compton-Streuung an Elektronen im Kohlenstoff: gestreute Photonen (λ = 0.731 Å) haben im Vergleich zu ungestreuten Photonen (λ = 0.707 Å) Energie verloren (Abb. aus [7]).
179
Abbildung D.8: Schematisch: ein Photon streut an einem ruhenden Elektron. Die Wellenlängenänderung ist eine Funktion des Streuwinkels ϕ (Abb. aus Wikipedia).
180
Abbildung D.9: Beispiele: Emissionsspektrum von Quecksilber (links, Abb. aus Wikipedia).
Im zugehörigen Termschema (rechts, Abb. von www.licht-im-terrarium.de)
sind die Linien mit aufsteigender Wellenlänge den Übergangen 3 S1 → 3 P0 (h
Linie), 3 S1 → 3 P1 (g Linie), 3 S1 → 3 P2 (e Linie) sowie 3 D2 → 1 P1 (orange
Doppellinie, nicht eingezeichnet) zugeordnet, vgl. z.B. NIST Handbuch.
Abbildung D.10: Beispiele: Emissionsspektrum (links) und Termschema (rechts) von Wasserstoff, (beide Abb. aus Wikipedia).
Abbildung D.11: Franck-Hertz Versuch: Schaltbild(rechts) und gemessener Strom bei Messungen mit Quecksilber(links), (beide Abb. aus Wikipedia). Die Beschleunigungsspannung Ub ist wesentlich größer als die Gegenspannung Ug .
181
Abbildung D.12: Schematisch: der Stern-Gerlach Versuch mit Silber-Atomen. 4 zeigt die klassisch erwartete und 5 die real beobachtete Verteilung (Abb. aus Wikipedia).
Abbildung D.13: Schematisch: die Experimente von Davisson und Germer (links) und von
Thomson (rechts), Abb. aus [5]. Die Beschreibung ist im Abschnitt 3.4 zu
finden.
Abbildung D.14: Beugungsbilder in den Experimenten von Davisson und Germer (links)
und von Thomson (rechts). Beugungsbilder von 50 keV Elektronen auf einen
Cu3 Au Schirm der Dicke 400 Å (rechts) und von 330 eV Elektronen an der
(1, 1, 0) Ebene eines Wolfram-Einkristalls, Abb. aus [5].
182
Abbildung D.15: Abhängigkeit der Interferenzmaxima von der Wellenlänge der Elektronen
bei Beugung an einem Nickel-Einkristall, Abb. aus [5].
Abbildung D.16: Aufbau eines Interferenzmusters aus Einschlägen einzelner Elektronen (Simulation), von links nach rechts 28, 1000 sowie 10000 Elektronen, Abb. aus
[5].
Abbildung D.17: Schematisch: Aufbau des Doppelspalt-(Gedanken-)experiments, Abb. aus
[5]. Die Beschreibung ist im Abschnitt 3.6 zu finden.
(d)
(a)
(b)
(c)
Abbildung D.18: Wahrscheinlichkeitsverteilung beim Doppelspaltexperiment, Abb. von Wikipedia (K.D. Keller). Die Beschreibung ist im Abschnitt 3.6 zu finden.
Abbildung D.19: Schematisch: Gedankenexperiment zur Unschärfe am Spalt, Abb. aus [5].
183
Abbildung D.20: Schematisch: Gedankenexperiment zur Unschärfe beim Mikroskop, Abb.
aus [5].
184
Abbildung D.21: Schematisch: ein Potential, das im Unendlichen ausreichend schnell zu Null
abfällt, Abb. aus [5]. W < 0 entspricht der Energie E eines Bindungszustands, U ist das Potential.
Abbildung D.22: Schematisch: geladene Teilchen auf Kreisbahnen im Magnetfeld für verschiedene Energien, Abb. aus [5]. W (j) sind die Grenzen der verschiedenen
Energieintervalle.
Abbildung D.23: Schematisch: unendlich tiefer Potentialtopf (Abb. aus [1]).
185
Abbildung D.24: Schematisch: gerade und ungerade Lösungen zum unendlich tiefen Potentialtopf (Abb. aus [1]).
Abbildung D.25: Schematisch: Grundzustand beim dreidimensionalen Potentialtopf (Abb.
aus [1]).
Abbildung D.26: Schematisch: Potentialtopf als Modell für Metallische Leiter (Abb. aus [1]).
W entspricht der Austrittsarbeit.
186
Abbildung D.27: Schematisch: Streuung am eindimensionalen Potentialtopf (Abb. aus [1]).
Das einfallende Teilchen kommt von links.
Abbildung D.28: Schematisch: Resonanz beim eindimensionalen Potentialtopf (Abb. aus [1]).
Abbildung D.29: Schematisch: Tunneleffekt (Abb. aus [1]). Das einfallende Teilchen kommt
von links.
187
Abbildung D.30: Schematisch: Gamow Faktor (Abb. aus [1]). Ein beliebiges Potential wird
durch eine Reihe infinitesimal breiter Potentialstufen genähert, über die integriert wird.
Abbildung D.31: Schematisch: Alphazerfall (Abb. aus [1]).
Abbildung D.32: Schematisch: Niedrig liegende Zustände des harmonischen Oszillators (Abb.
aus [1]).
188
Abbildung D.33: Schematisch: Vergleich der Wahrscheinlichkeitsdichten eines hoch liegenden
Zustands (n = 100) des quantenmechanischen Oszillators und des Klassischen Oszillators (Abb. aus [1]).
189
Abbildung D.34: Kartesische Koordinaten und Kugelkoordinaten (Abb. von Wikipedia).
0.8
n=0
n=1
n=2
0.6
0.4
0.2
0
-0.2
-0.4
-0.6
0
5
10
15
20
25
Abbildung D.35: Typische radiale Wellenfunktionen (hier für Wasserstoff).
190
0.06
φ100(r)
|φ100(r)|2
|y10(r)|2
0.05
a.u.
0.04
0.03
0.02
0.01
0
0
1
2
3
4
5
r/a0
Abbildung D.36: Radialteil der Grundzustandswellenfunktion, Wahrscheinlichkeitsdichte und
reduzierte Wahrscheinlichkeitsdichte (hier für Wasserstoff).
Abbildung D.37: Radialteil der Wahrscheinlichkeitsdichten für Grundzustand und angeregte
Zustände (hier für Wasserstoff, Abb. aus [7]).
Abbildung D.38: Normaler Zeeman Effekt: Aufspaltung der Energieniveaus durch ein äußerse
Magnetfeld.
D.2
Tabellen
191
Größe
Länge l
Masse m
Zeit t
Internat. System (SI)
Meter [m]
Kilogramm [kg]
Sekunde [s]
h
i
Energie E
Newton [N] = ms2kg
h 2 i
Joule [J] = ms2kg
Stromstärke I
Ampère [A]
Ladung Q
Coulomb [C] = [As]
h
i
Volt [V] = mAskg
3
Kraft F
Spannung U
Gauß’sches System
Zentimeter [cm] = 10−2 [m]
Gramm [g] = 10−3 [kg]
Sekunde [s]
g
Dyn [dyn] = cm
= 10−5 [N]
2
h s2 i
Erg [erg] = cms2 g = 10−7 [J]
q
m
1 s
cm3 g
= 10c
[A]
(StatA) esu
=
s
s4
q
m
1 s
cm3 g
ESU [esu] =
= 10c
[C]
s2
m
6
erg p cm g 10 s
(StatV) esu
=
= c [V]
s2
Tabelle 4: Eine unvollständige Liste einiger physikalischer Größen in verschiedenen Einheitensystemen. Die Einheiten sind derart ausgewählt, dass sie für die Vorlesung relevant
sind. Basiseinheiten der jeweiligen Maßsysteme sind fettgedruckt. In den Umrechnungen werden die Naturkonstanten c und kB aus Tabelle Tab. 5 verwendet.
Konstante
Lichtgeschwindigkeit
Elementarladung
Boltzmann-Konstante
Planck’sche Konstante
Elektronenruhemasse
Symbol
c
e
kB
h
~
me
Protonenruhemasse
mp
Rydberg-Konstante
R∞
Internat. System
299792458 ms
1.6021766208(98) × 10−19 C
J
1.38064852(79) × 10−23 K
−34
6.626070040(81) × 10 J s
1.054571800(13) × 10−34 J s
9.10938215(45) × 10−31 kg
0.510998910(13) MeV
c2
1.672621898(21) × 10−27 kg
938.2720813(58) MeV
c2
10973731.568508(65)m
Gauß’sches System
29979245800 cm
s
4.80320425(10) × 10−10 esu
1.38064852(79) × 10−16 erg
K
6.626070040(81) × 10−27 erg s
1.054571800(13) × 10−27 erg s
9.10938215(45) × 10−28 g
1.672621898(21) × 10−24 g
1836.15267389(17) me
1097373156.8508(65)cm
Tabelle 5: Eine unvollständige Liste einiger Naturkonstanten.
Wellenlänge λ [cm]
3 × 104 (Radiowellen)
1 (Mikrowellen)
4 − 8 × 10−5 (sichtbares Licht)
10−8 (Röntgenstrahlung)
10−11 (Gammastrahlung)
Frequenz ν [Hz]
106
3 × 101 0
7.5 − 3.7 × 101 4
3 × 1018
3 × 1021
Energie hν [eV ]
4.1 × 10−9
1.2 × 10−4
3 − 1.5
1.2 × 104
1.2 × 107
Tabelle 6: Typische Wellenlängen, Frequenzen und Energien zu den verschiedenen Spektralbereichen des Lichts [1 eV = 1.602 × 10−19 J] (Tab. aus [5]).
Element W
W [eV] 4.5
Ta
4.2
Ni
4.6
Ag
4.8
Cs
1.8
Pt
5.3
Tabelle 7: Gemessene Werte für Austrittsarbeiten W einiger Metalle [1 eV = 1.602 × 10−19 J]
(Tab. aus [7]).
192
Teilchen
λ [Å]
Wasserstoffatom
1.46
Wasserstoffmolekül 1.03
Heliumatom
0.72
Quecksilberatom
0.10
Tabelle 8: Mittlere thermische Wellenlängen einiger Atome und Moleküle bei Raumtemperatur
(Tab. aus [5]).
Schale (n) Orbital (`)
K (1)
s (0)
L (2)
s (0)
L (2)
p (1)
L (2)
p (1)
m
Wellenfunktion φn ` m
32 Zr
−
0
φ1 0 0 = √1π aZ0 e a0
32 Zr
−
Z
Z
1
√
2 − a0 r e 2a0
0
φ2 0 0 = 4 2π a0
23
− Zr
Z
0
φ2 1 0 = 4√12π aZ0
re 2a0 cos ϑ
a0
32
Zr
− 2a
Z
∓iϕ
0 sin ϑe
±1 φ2 1 ±1 = 8√1 π aZ0
re
a0
Tabelle 9: Einige Wellenfunktionen zu Wasserstoff-artigen Atomen (Tab. aus [5]). Die Größe
a0 stimmt mit dem Bohr’schen Radius überein. Z ist die Kernladungszahl.
193
Literatur
[1] R. Bertlmann, N. Friis, “Theoretical Physics T2 Quantum Mechanics”
http://homepage.univie.ac.at/Reinhold.Bertlmann/
[2] R.P. Feynman, R.B. Leighton, M. Sands, “The Feynman Lectures on Physics (vol
III),” Reading Massachusetts, US: Addison-Wesley (1963) 338 p.
[3] A. Messiah, “Quantum Mechanics, Volume I”, Amsterdam, Netherlands:
North-Holland Publishing Company (1958) 504 p.
[4] A. Messiah, “Quantum Mechanics, Volume II”, Amsterdam, Netherlands:
North-Holland Publishing Company (1958) 632 p.
[5] G.M. Prosperi, P. Caldirola et al., “Introduzione alla fisica teorica” (Introduction to
Theoretical Physics), UTET 1982, 965 p.
[6] J.J. Sakurai, J. Napolitano, “Modern Quantum Mechcnics (2nd Ed.),” Reading
Massachusetts , US: Addison-Weslay (2003) 550 p.
[7] F. Schwabl, “Quantenmechanik (QM I),” Berlin, Germany: Springer (2007) 430 p.
[8] S. Weinberg, “Lectures on Quantum Mechanics”, Cambridge, UK: Cambridge
University Press, (2013) 358 p.
194

Zugehörige Unterlagen

Übungsblatt 2 - Institut für Theoretische Physik

ihr bauvorhaben beginnt zu wachsen

T30f Theoretische Teilchen- und Kernphysik Prof. Dr. Nora

Zugehörige Unterlagen

Produkte

Unterstützung

T30f Theoretische Teilchen- und Kernphysik Prof. Dr. Nora

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können