T30f Theoretische Teilchen- und Kernphysik Prof. Dr. Nora

Werbung
T30f
Theoretische Teilchen- und
Kernphysik
Prof. Dr. Nora Brambilla
Quantenmechanik I
Vorlesung Sommersemester 2016 TUM
Prof. Dr. Nora Brambilla
Dr. Johannes Heinrich Weber
Technische Universität
München
Physik
Department
Inhaltsverzeichnis
1 Einleitung
4
2 Ursprünge der Quantenmechanik
6
2.1
Klassische Physik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
2.2
Photonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.2.1
Strahlung eines Schwarzen Körpers (Hohlraumstrahlung) . . . . . .
7
2.2.2
Photoelektrischer Effekt . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.3
Compton Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3
2.4
Atomare Spektren und Quantisierung von Materie . . . . . . . . . . . . . . 13
2.3.1
Atomare Spektren
. . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.2
Diskrete Energieniveaus . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.3
Experimentelle Bestätigung der Existenz der Energieniveaus: der
Franck-Hertz Versuch . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.4
Andere Beispiele der Quantisierung: Raumquantisierung . . . . . . 19
Erfolge und Grenzen der alten Quantentheorie . . . . . . . . . . . . . . . . 20
3 Wellenfunktion und Schrödingergleichung
23
3.1
Wellen- und Teilchenaspekte von Strahlung . . . . . . . . . . . . . . . . . . 23
3.2
Teilchencharakter von Materie und de Broglie’sche Hypothese . . . . . . . 23
3.3
Die Schrödinger Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4
Experimentelle Bestätigung der Welleneigenschaften von
Materieteilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.5
Kontinuitätsgleichung und statistische Interpretation der
Wellenfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.6
Die statistische Interpretation und die Beschreibung mittels Welle-TeilchenDualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.7
Heisenberg’sches Unschärfeprinzip und Unschärferelationen . . . . . . . . . 34
3.7.1
Beugung an einem Spalt . . . . . . . . . . . . . . . . . . . . . . . . 35
3.7.2
Lokalisation mit einem Mikroskop . . . . . . . . . . . . . . . . . . . 36
3.7.3
Energie-Zeit-Unschärfe . . . . . . . . . . . . . . . . . . . . . . . . . 36
1
4 Die Schrödingergleichungen
4.1
38
Mathematische Eigenschaften der Schrödingergleichung
und des Hamiltonoperators . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.1.1
Schrödingergleichung . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2
Operatoren und ihre Wirkung auf Elemente des Hilbertraums . . . . . . . 39
4.3
b . . . . . . . . . . 41
Eigenwerte und Eigenvektoren des Hamiltonoperators H
4.4
Entwicklung der Wellenfunktion nach einer Basis von orthonormalen Eigenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.5
Allgemeine Lösung der Schrödingergleichung . . . . . . . . . . . . . . . . . 47
4.6
Physikalische Interpretation der Schrödingergleichung . . . . . . . . . . . . 49
5 Allgemeine Prinzipien der Quantenmechanik und Formalismen
54
5.1
Allgemeine Postulate der Quantenmechanik . . . . . . . . . . . . . . . . . 54
5.2
Orts- und Impulsobservablen: Größen mit klassischen Analoga . . . . . . . 62
5.2.1
Ort als Observable . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.2.2
Impuls als Observable . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.2.3
Unschärferelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.4
Allgemeinere Observablen . . . . . . . . . . . . . . . . . . . . . . . 66
5.3
Kommutatoren und Unbestimmtheitsrelationen . . . . . . . . . . . . . . . 69
5.4
Zeitabhängigkeit des Mittelwerts einer Observable und
Ehrenfest’sches Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.5
Konstanten der Bewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.6
Drehimpuls eines Teilchens . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.7
Parität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Anhänge
77
A Notation und Konventionen
77
A.1 Einheiten und Werte von Naturkonstanten . . . . . . . . . . . . . . . . . . 77
A.2 Vektoren und Metrik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
A.3 Wellenfunktionen und Zustandsvektoren . . . . . . . . . . . . . . . . . . . 79
2
B Drehimpuls
80
C Zusammenfassung des Formalismus
80
C.1
Hilbertraum, Operatoren und Skalarprodukt . . . . . . . . . . . . . . . . . 80
C.1.1 Allgemeine Eigenschaften von Vektorräumen . . . . . . . . . . . . . 80
C.1.2 Operatoren und ihre Wirkung auf Elemente von Vektorräumen . . . 80
C.1.3 Skalarprodukt und Norm . . . . . . . . . . . . . . . . . . . . . . . . 82
C.1.4 Weitere Eigenschaften: Operatornorm, Beschränktheit . . . . . . . . 82
C.1.5 Lineare Abhängigkeit, Orthogonalität, Vollständigkeit, Basis, Dimensionalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
C.2
Eigenschaften von Hilberträumen . . . . . . . . . . . . . . . . . . . . . . . 84
D Abbildungen und Tabellen
85
D.1 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
D.2 Tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Bibliographie
96
3
1
Einleitung
“Quantenmechanik” (QM) ist die genaue Beschreibung des Verhaltens von Materie und
Licht und – im Speziellen – von Prozessen auf atomaren Skalen. QM ist einer der Grundpfeiler der Physik. Sie ist essentiell sowohl für moderne Atom-, Molekül-, Kern- und Elementarteilchenphysik als auch für große Teile der Chemie und Physik der Kondensierten
Materie. Im Besonderen ist die Kombination aus QM und spezieller Relativitätstheorie der Ursprung von Quantenfeldtheorie (QFT), welche das theoretische Fundament des
Standardmodells der Teilchenphysik bildet: dieses beschreibt derzeit unser fundamentalstes Wissen über die Natur.
QM hat unser Verständnis von Systemen auf Längenskalen weniger Nanometer beeinflusst, welche für Chemie, Materialwissenschaften, Optik und Elektronik eine wesentliche
Rolle spielen. Die Existenz von Orbitalen und Energieniveaus ist ausschließlich durch
QM erklärbar. Sie erklärt damit das Verhalten von Isolatoren, Leitern und Halbleitern
sowie Riesenmagnetowiderstand. Sie erklärt die Existenz von “Löchern” und den Transport von Löchern und Elektronen in elektronischen Geräten. QM spielt eine wesentliche
Rolle in Photonik, Quantenelektronik, Mikroelektronik und vielen neuen und zukünftigen
Technologien. Ein solcher Bereich ist die Nanotechnik, ermöglicht durch Aufkommen der
Nano-Fabrikation in der jüngsten Vergangenheit. Während Transistoren in der Elektronik immer kleiner werden, ändert sich die Art und Weise wie Elektronen sich durch die
Bauteile bewegen: nano-elektronischer Transport unterscheidet sich deutlich von mikroelektronischem Transport.
Die Quantisierung des elektromagnetischen Feldes ist wesentlich für die Forschunsbereiche der Nano- und Quantenoptik. Sie erklärt wie Photonen mit atomaren Systemen und
sonstiger Materie wechselwirken, insbesondere erklärt QM die Strahlung eines heißen
Körpers und seine Farbveränderung mit der Temperatur. Sie erlaubt die Verwendung von
elektromagnetischen oder optischen Feldern um Quanteninformation zu tragen. Außerdem wird QM benötigt um die Wechselwirkung von Photonen in Solarzellen zu verstehen, wie auch in vielen anderen Bereichen der Materialwissenschaften. Wenn zwei Objekte auf sehr geringen Abstand zusammengeführt werden, erfahren sie eine Kraft – die
sogenannte Casimir-Kraft – die lediglich mit den Mitteln der QM verstanden werden
kann. Dies ist wichtig für unser Verständnis von mikro-/nano-elektromechanischen Sensorsystemen. Darüber hinaus ist das Verständnis von Spins für Spintronik unverzichtbar,
eine weitere aufkommende Technologie in der Riesenmagentowiderstand, magnetischer
Tunnelwiderstand sowie Spintransfer verwendet werden. QM ermöglicht ebenso die Forschungsbereiche Quanteninformation, Quantenkryptographie und Quantencomputer. Es
ist offenkundig dass die reichhaltige Welt der Quantenphysik auf viele Aspekte zukünftiger
Technologien einen großen Einfluss haben wird.
Das Verhalten physikalischer Objekte auf kleinen Skalen ist im Widerspruch zu Ihrer
direkten Erfahrung. Physikalische Objekte verhalten sich weder wie Wellen noch wie Teilchen noch wie irgendetwas anderes, das Sie jemals gesehen haben. Wir haben keine direkte Erfahrung in dieser Domäne der Physik und daher keinerlei Intuition wie sich diese
mikroskopischen Systeme verhalten. Das Verhalten von Quantensystemen unterscheidet
sich wesentlich vom Verhalten makroskopischer Systeme in der “Klassischen Mechanik”.
Quantenmechanische Gleichungen wurden postuliert um experimentelle Beobachtungen
zu erklären, aber die Interpretation der tieferen Bedeutung der Gleichungen erwies sich
4
als schwierig, da atomares Verhalten von unserer Alltagserfahrung grundverschieden ist.
Die Prinzipien der Quantenmechanik sind derart inkompatibel zu unserer alltäglichen
Intuition, dass sie am ehesten durch einen Blick auf ihre Vorgeschichte motiviert werden
können. Im nächsten Kapitel werden wir einige Probleme betrachten mit denen Physiker
zu Beginn des zwanzigsten Jahrhunderts konfrontiert waren und die letzten Endes zur
modernen Quantenmechanik führten.
Literaturempfehlung:
R.P. Feynman
Lectures of Physics, Volume 3, Sections 1.1 – 1.7
5
2
Ursprünge der Quantenmechanik
Newtonsche Mechanik und Maxwells Theorie des elektromagnetischen Felds waren die
Grundpfeiler der Physik bis zum Ende des neunzehnten Jahrhunderts. Anschließend wurde
jedoch eine Reihe von Phänomenen entdeckt, welche im Zusammenhang dieser Theorien
völlig unverständlich waren. Deren Erklärung führte zu einer Kombination neuer Hypothesen, aus welchen sich über die Jahre die heutige Form der Quantenmechanik (QM)
heraus kristallisierte.
2.1
Klassische Physik
Bis zum Beginn des zwanzigsten Jahrhunderts konnten physikalische Phänomene unter
Verwendung der Klassischen Physik erklärt werden. In der Klassischen Physik ordnet
man dem betrachteten physikalischen System eine gewisse Zahl von dynamischen Variablen zu; jede dieser Variablen hat zu jedem Zeitpunkt einen wohldefinierten Wert und
der vollständige Satz dieser Werte definiert den dynamischen Zustand des Systems zu
diesem Zeitpunkt. Die Zeitentwicklung eines solchen Systems ist vollständig festgelegt,
sofern man seinen Zustand zu einem gegebenen Ausgangszeitpunkt kennt. Daher besteht
die Vorgehensweise der klassischen theoretischen Physik darin, zunächst die dynamischen
Variablen des betrachteten Systems zu erkennen und hiernach die Bewegungsgleichungen
(Equations of Motion, EOM) zu bestimmen, welche die Zeitentwicklung im Einklang mit
experimentellen Beobachtungen beschreiben.
Seit der Formulierung der Newtonschen Mechanik bis zum Ende des neunzehnten Jahrhunderts war diese Vorgehensweise erfolgreich und erlaubte, neu beobachtete Phänomene
in das allgemeine Schema einzubinden. Innerhalb dieses Schemas wurde im Besonderen
zwischen zwei Kategorien von Objekten unterschieden: Materie und Strahlung. Materie
wurde als aus exakt lokalisierbaren Korpuskeln (Massenpunkte) bestehend betrachtet,
welche sich gemäß der Gesetze der Newtonsche Mechanik verhalten; der Zustand eines
jeden Korpuskels wurde zu jedem Zeitpunkt durch seinen Ort und seine Geschwindigkeit
vollständig beschrieben. Strahlung hingegen gehorchte Maxwells Gesetzen des Elektromagnetismus; die dynamischen Variablen waren die Komponenten der elektrischen und
magnetischen Felder an sämtlichen Punkten des Raumes. Als bekannt galt, dass Strahlung – im Gegensatz zur Materie – wellenartiges Verhalten zeigt; typische Beispiele sind
Phänomene wie Interferenz und Beugung.
Als jedoch unsere Kenntnisse der Phänomene auf mikroskopischen Skalen (d.h. auf atomaren Skalen, welchen Längenskalen von bis zu einigen Ångström entsprechen) präziser
wurden, geriet die Klassische Physik in eine schwere Krise. Es wurde offenkundig, dass
Phänomene auf atomaren und subatomaren Skalen nicht in die klassischen Schemata
passen und deren Erklärung auf grundlegend neuen Prinzipien gegründet sein muss. Die
Enthüllung dieser neuen Prinzipien erfolgte schrittweise und erst um etwa 1925 ergab sich
mit der Formulierung der Quantenmechanik eine in sich schlüssige Theorie der mikroskopischen Phänomene.
Um 1900 konzentrierten sich die Bemühungen der Experimentatoren auf zwei eng zusammenhängede Bereiche: eine präzise Analyse der mikroskopischen Struktur von Materie
6
und die Bestimmung der gegenseitigen Wechselwirkung zwischen materiellen Korpuskeln
sowie deren Wechselwirkung mit dem elektromagnetischen Feld.
Die ersten Beiträge zum korrekten Verständnis der Struktur von Materie wurden durch
Beobachtungen von Strahlung in Gasentladungen in verdünnten Gasen, Kathodenstrahlung sowie Kanalstrahlung gewonnen, welche richtigerweise als Strahlen von elektrisch
geladenen Teilchen interpretiert wurden. Auf diese Art und Weise wurde 1897 das Elektron durch J.J. Thomson als das Teilchen der Kathodenstrahlung entdeckt. Sein Verhalten
im elektromagnetischen Feld wurde beobachtet und durch die Theorie von H.A. Lorentz
beschrieben. Sukzessive wurde man sich der Existenz von Atomen und Molekülen bewusst.
Den überzeugendsten Befund lieferte die Beobachtung der Brownschen Molekularbewegung, die eine ungeordnete Zitterbewegung winziger Teilchen in Flüssigkeiten oder Gasen
beschreibt. Diese Bewegung der Partikel wird auf häufige Kollisionen mit den Molekülen
des umgebenden Mediums zurückgeführt. Später erlaubten bessere experimentelle Techniken die Beobachtung einzelner mikroskopischer Phänomene oder die Zählung einzelner
mikroskopischer Teilchen (z.B. Messung der elektrischen Ladung durch R.A. Millikan in
1910, erste Beobachtung von Trajektorien geladener Teilchen in der (Wilsonschen) Nebelkammer durch C.T.R. Wilson in 1912, erstes Geiger-Müller-Zählrohr durch H. Geiger in
1913).
Überdies wurde 1896 ein neues Kapitel der Physik durch die Entdeckung der Radioaktivität begonnen. Zusätzlich eröffnete diese Entdeckung eine leistungsfähige Methode
zur experimentellen Untersuchung der atomaren Struktur – die Alpha-Strahlung, d.h.
Helium-Kerne mit hohen Geschwindigkeiten. Indem er verschiedene Targets der AlphaStrahlung aussetzte, konnte E. Rutherford 1911 die Struktur von Atomen durch Streuung
von Alpha-Teilchen vermessen. Es stellte sich heraus, dass Atome von einem zentralen
Kern sehr kleiner Größe (10−15 − 10−14 m) und in dessen Umfeld befindlichen Elektronen gebildet werden. In der Zwischenzeit wurde der Kenntnisstand bezüglich elektromagnetischer Wellen, vgl. Tab. (3), zu kurzen Wellenlängen hin durch die Entdeckung von
Röntgenstrahlung (W.C. Röntgen, 1895) erweitert, deren Wellennatur durch Beugungsexperimente an Kristallen in 1912 durch M.v. Laue etabliert wurde. Die Spektralanalyse
von Strahlung wurde immer präziser und erlaubte die Ansammlung eines großen Wissensschatzes über die Wechselwirkung von Materie und Strahlung auf mikroskopischen
Skalen. Die Lorentz’sche Theorie der Elektronen machte eindeutige Vorhersagen über all
diese Phänomene. Im Vergleich der Vorhersagen dieser Theorie mit der neu gewonnenen
Fülle experimenteller Ergebnisse zeigte sich der erste Widerspruch zwischen der klassischen Theorie und dem Experiment überdeutlich.
2.2
2.2.1
Photonen
Strahlung eines Schwarzen Körpers (Hohlraumstrahlung)
Die ersten Schwierigkeiten traten in der Untersuchung der Spektralverteilung elektromagnetischer Strahlung im thermodynamischen Gleichgewicht mit Materie auf. Der typische
Fall ist der eines schwarzen Körpers (auch: Schwarzer Strahler), d.h. eines Körpers der
sämtliche einfallende Strahlung absorbiert. Sehr allgemeine thermodynamische Betrachtungen zeigen, dass die Strahlung eines Schwarzen Körpers lediglich von dessen Tem7
peratur abhängt. Die Spektralverteilung der Intensität dieser Schwarzkörperstrahlung ist
daher eine fundamentale Größe, die mittels Methoden der statistischen Thermodynamik
aus den allgemeinen Gesetzmäßigkeiten der Wechselwirkung von Materie und Strahlung
herleitbar sein müsste. Die in der klassischen Theorie hergeleitete Formel steht im eklatanten Widerspruch zum Experiment. Im Jahr 1900 gelang es M. Planck diese Schwierigkeit
durch Abkehr von den klassischen Gesetzen zur Wechselwirkung von Materie und Strahlung zu beheben. Stattdessen postulierte er, dass Energieaustausch zwischen Materie und
Strahlung nicht auf kontinuierliche Art und Weise geschieht, sondern in diskreten und
unteilbaren Mengen bzw. Quanten von Energie. Im Folgenden betrachten wir kurz die
klassische Vorhersage sowie den experimentellen Kenntnisstand zur Zeit Plancks.
Wie bereits erwähnt, bezeichnet Schwarzkörperstrahlung jene Art von elektromagnetischer Strahlung, welche von einem Schwarzen Körper (ein opaker, nicht-reflektierender
Körper) abgegeben wird. Hierbei wird die Temperatur über das gesamte Volumen einheitlich und konstant gehalten. Schwarzkörperstrahlung hat daher ein charakteristisches
Spektrum und eine charakteristische Intensitätsverteilung, welche lediglich von der Temperatur des Körpers abhängt, vgl. Abb. (D.1). Wärmestrahlung der Art, wie sie spontan
von vielen gewöhnlichen Objekten emittiert wird, kann approximativ als Schwarzkörperstrahlung behandelt werden. Ein vollständig isolierter Hohlraum, in dessen Innern thermisches Gleichgewicht herrscht, enthält Schwarzkörperstrahlung. Durch ein Loch in einer
Wand des Hohlraums wird diese Hohlraumstrahlung emittiert. Die Hohlraumstrahlung hat
die Charakteristika derSchwarzkörperstrahlung, sofern das Loch klein genug ist und lediglich einen vernachlässigbaren Einfluß auf das thermische Gleichgewicht hat.
Als Schematisierung betrachten wir nun elektromagnetische Strahlung innerhalb eines
kubischen Hohlraums mit Volumen V = L3 und Temperatur T , die sich im thermischen Gleichgewicht befinde, vgl. Abb. (D.2). Die darin enthaltene Energiedichte (Energie/Volumen) u(ω, T ) ist eine Funktion von der Frequenz ω und der Temperatur T . Die
Energidichte u(ω, T ) wird klassisch durch das Rayleigh-Jeans-Gesetz (J.W. Strutt, 1900;
J. Jeans, 1905) bestimmt,
kB T 2
ω ,
(2.1)
π 2 c3
wobei kB = 1.3806 × 10−23 J/K die Boltzmann-Konstante und c = 2.998 × 108 m/s die
Lichtgeschwindigkeit im Vakuum ist.
u(ω, T ) =
Um dieses Ergebnis zu erhalten kann man folgendermaßen vorgehen: wir beschreiben
das Strahlungsfeld innerhalb des kubischen Hohlraums als Summe der Normalmoden im
Fourier-Raum. Die Randbedingungen auf gegenüberliegenden Seiten des Hohlraums sind
gleich, so dass sich die Phase des Strahlungsfelds über die Länge L um ein ganzzahliges
Vielfaches von 2π ändert. Somit ist das Strahlungsfeld durch eine Summe von Termen
proportional zu ebenen Wellen exp (ir · k) gegeben. Wegen der Randbedingungen sind
die hierbei beitragenden Wellenzahlen k = 2πn/L und werden durch den Vektor n festgelegt, welcher ausschließlich ganzzahlige Komponenten n1 , n2 , n3 besitzt. Daher ist jeder
einzelne Normalmode ein Tupel n1 , n2 , n3 sowie einer von zwei Polarisationszuständen zugeordnet. Jedes dieser Tupel nimmt genau eine Volumeneinheit im Vektorraum von n ein.
Für jedes Tupel n1 , n2 , n3 im Fourier-Raum sind zwei Polarisationszustände – links- oder
rechtshändig zirkulare Polarisation – möglich, welche durch einen zusätzlichen Faktor 2
8
berücksichtigt werden.
Da die Wellenzahl k = |k| (vgl. Anhang A) mit der Frequenz durch die Dispersionsrelaton ω = ck zusammenhängt, kann eine Integration über das sphärische Volumenelement
d3 n in ein Integral über die Frequenz ω überführt werden. Wir erhalten für die Zahl der
Normalmoden im Frequenzintervall [ω, ω + dω] unter Berücksichtigung beider Polarisationsrichtungen
3
L
2
3
ω 2 dω,
(2.2)
dN = N (ω)dω = 2 × d n = 2 × dΩ |n| d|n| = 2 × 4π
2πc
wobei wir die Winkelintegration trivial ausühren konnten. Jede einzelne Normalmode mit
Frequenz ω kann als ein harmonischer Oszillator mit der gleichen Frequenz ω beschrieben
werden (vgl. Übung 2.1, wo Sie dies explizit nachvollziehen). Da jeder Oszillator in der
Klassischen statistischen Mechanik die thermische Energie kB T beiträgt1 , ist die gesamte
Energiedichte in der Klassischen Physik durch
1 L3 2
kB T
u(ω, T )dω = kB T 3 2 3 ω dω = 2 3 ω 2 dω
L π c
π c
(2.3)
gegeben. Hierbei wurde die Energie durch das Volumen V = L3 geteilt. Obwohl Glg. (2.3)
für niedrige Frequenzen experimentelle Befunde
R ∞ sehr gut beschreibt, müsste der Energieinhalt des Hohlraums unendlich sein wegen 0 dωu(ω) = ∞ im Widerspruch zu experimentellen Tatsachen (Ultraviolettkatastrophe). Stattdessen wurde in 1896 von W. Wien
als empirischer Befund für hohe Frequenzen exponentiell gedämpftes Verhalten gemäß
ω→∞
u(ω, T ) −→ Aω 3 exp (−gω/T );
A, g = const
(2.4)
beobachtet. Das scheinbar unverträgliche Verhalten der Energiedichte für hohe und niedrige Frequenzen konnte erst 1900 durch Planck in einer einzigen Formel beschrieben
1
Dieser Sachverhalt lässt sich per Gleichverteilungssatz zeigen. Wir betrachten ein physikalisches System, dessen Hamiltonfunktion H(q, p) quadratisch in den kanonischen Variablen qi und in den kanonisch
konjugierten Impulsen pi ist, d.h. qi ∂H/∂qj = 2Eqi δij und pi ∂H/∂pj = 2Epi δij erfüllt, wobei Eqi bzw.
Epi die innere Energien sind, welche in dem Freiheitsgraden qi bzw. pi gespeichert sind. Dann gilt für
∂H
den thermischen Erwartungswert hqi ∂q
i:
j
Z
∂H −βH
1
∂ −βH
dΓ qi
dΓ qi
e
=−
e
∂qj
βZ
∂qj
Z
Z
∂qi
δij 1
1
dΓ
e−βH = +
dΓ e−βH = δij kB T.
=+
βZ
∂qj
β Z
|
{z
}
| {z }
1
∂H
hqi
i=
∂qj
Z
Z
=1
=δij
Hierbei wurde die kanonische Gesamtheit verwendet (System in Kontakt mit Wärmebad, d.h. bei fester
Temperatur T ). Eine genauere Einführung der kanonische Gesamtheit geht über eine kurze Fußnote
hinaus; schlagen Sie dazu bitte in einem Lehrbuch Ihres Vertrauens
nach. Für die kanonische Gesamtheit
R
R
sind thermische Erwartungswerte allgemein durch hOi = 1/Z dΓ Oe−βH gegeben, wobei Z = dΓ e−βH
und dΓ das Integralmaß des gesamten Phasenraums ist, d.h. für ein dreidimensionales N -Teilchen-System
gilt dΓ = d3N q d3N p. Ferner wird hier die Abkürzung β = 1/(kB T ) verwendet und beim Übergang von
der ersten zur zweiten Zeile einmal unter Vernachlässigung der Randterme partiell intergriert.
Unter Verwendung der inneren Energien Eqi der Orts-Freiheitsgrade sehen wir also h2Eqi i = kB T
bzw. hEqi i = kB T /2. Der Beweis für die thermischen Erwartungswerte der inneren Energien Epi der
Impuls-Freiheitsgrade ist identisch und führt ebenfalls zu hEpi i = kB T /2. Da man für den harmonischen
Oszillator sowohl kinetische Epi als auch potentielle Energie EqI hat, ergibt sich für jede Raumrichtung
in der Summe hEpi + Eqi i = kB T .
9
werden, die er zur Interpolation zwischen beiden experimentellen Befunden postulierte,
vgl. Abb. (D.3). Diese Planck’sche Strahlungsformel
u(ω, T )dω =
ω 3 dω
~
π 2 c3 exp ~ω − 1
bzw. u(ν, T )dν =
kB T
8πh
ν 3 dν
c3 exp hν − 1
(2.5)
kB T
erforderte die Einführung einer neuen Naturkonstante – das Planck’sche Wirkungsquantum – ~ = 1.0546 × 10−34 J. Dieses tritt in zwei verschiedenen Normierungen (h und ~) in
der Literatur auf:
~ω = hν
2πν = ω
⇔
(2.6)
~=
h
2π
(2.7)
Unter seiner revolutionären Hypothese, dass Energieaustausch zwischen Wand2 und Strahlungsfeld der Frequenz ω nur für ganzzahlige Vielfache von ~ω möglich sei, gelang Planck
eine Herleitung seines Strahlungsgesetzes – ein unmissverständlicher erster Hinweis auf
die Quantisierung des elektromagnetischen Felds, vgl. Tab. (3).
Sie werden diese Herleitungen (Rayleigh-Jeans’sches und Plack’sches Gesetz) in den Übungen (Übung 2.1) nachvollziehen und werden insbesondere sehen, dass die verschiedenen
Moden des Strahlungsfeld in einem Hohlraum sich wie harmonische Oszillatoren verhalten. Diese Übung wird ihnen von großem Nutzen sein, da Sie in der Quantenmechnanik
zahllosen Problemen begegnen werden, für deren Lösung das Auffinden und Berechnen
der stationären Moden essentiell ist. Außerdem wiederholt sich der konzeptionelle Schritt
des Übergangs von stationären Moden zu harmonischen Oszillatoren in der Quantenfeldtheorie.
2.2.2
Photoelektrischer Effekt
Im Jahr 1905 entwickelte A. Einstein Plancks Quantenhypothese weiter und konnte damit schließlich den Photoelektrischen Effekt erklären. Bereits am Ende des neunzehnten
Jahrhunderts war bei Bestrahlung mit elektromagnetischer Strahlung ausreichend hoher
Frequenz Emission von Elektronen an Metalloberflächen im Vakuum beobachtet worden,
vgl. Abb. (D.4). Dieses Phänomen hatte folgende Charakteristika:
1. Der Effekt tritt nur auf, falls die Frequenz der einfallenden Strahlung einen für das
jeweilige Metall spezifischen Mindestwert ω0 überschreitet.
2. Die aus dem Metall austretenden Elektronen haben unterschiedliche Geschwindigkeiten im Intervall zwischen Null und einer maximalen Geschwindigkeit. Die der
maximalen Geschwindigkeit entsprechende Energie ist eine lineare Funktion der Frequenz.
2
Die Wand ist hier stellvertretend für irgendeine nicht weiter spezifizierte Form von Materie, d.h.
Plancks Hypothese gilt für jegliche Wechselwirkung zwischen dem Strahlungsfeld und Materie im Allgemeinen.
10
3. Die Rate der pro Flächeneinheit emittierten Elektronen ist für feste Frequenz proportional zur Intensität der Strahlung, aber die Geschwindigkeit der Elektronen ist
unabhängig von der Intensität.
Versuche diese Beobachtungen mittels Klassischer Elektrodynamik zu erklären waren erfolglos, und die drei primären Charakteristika blieben unverständlich. Insbesondere konnte
man unter der Annahme, dass die Energie der Strahlung gleichmäßig über die bestrahlte
Oberfläche verteilt wird, nicht verstehen, weshalb die Emission selbst bei sehr niedrigen
Intensitäten sofort einsetzt. Man erwartete stattdessen, dass eine gewisse Zeit benötigt
würde, bis ausreichend Energie angesammelt wäre, um das Elektron aus dem Metall heraus zu lösen. Diese Beobachtung führte Einstein 1905 zur Hypothese, dass Licht aus
Quanten der Energie ~ω bestehe, und, dass Elektronen nur herausgelöst werden könnten,
sofern die Energie der Photonen die Austrittsarbeit W0 nicht unterschreite, ~ω > W0 ,
vgl. Abb. (D.5).
Einstein zeigte, dass das Phänomen auf Grundlage von Plancks Hypothese erklärbar ist. Er
nahm an, dass die Energie des Strahlungsfelds nicht nur während Absorption und Emission
sondern auch während der Ausbreitung im Raum in Form von Strahlungsquanten mit
Energie ~ω quantisiert ist. Hiermit kann der Photoelektrische Effekt als ein Streuprozess
zwischen einfallenden Strahlungsquanten (Photonen3 ) und den in Atomen gebundenen
Elektronen des Metalls verstanden werden. In dieser Vorstellung erhält das von einem
Photon getroffene Atom sofort dessen volle Energie ~ω. Ein Elektron kann nur emittiert
werden, falls diese Energie größer ist als die Austrittsarbeit W0 , welche zu seiner Ablösung
vom Atom benötigt wird; der Effekt tritt folglich nur im Fall ~ω > W0 auf. Somit kann
das erste Charakteristikum verstanden werden, indem man ω0 = W0 /~ definiert. Sofern
die Bedingung ω > ω0 erfüllt ist, tritt aus dem Metall ein Elektron mit maximaler Energie
E = ~ω − W0 aus. Man findet
Emax = ~(ω − ω0 )
(2.8)
in Übereinstimmung mit dem zweiten Charakteristikum. Schlußendlich versteht man auch
das dritte Charakteristikum, da bei Variation der Intensität die Rate der Photonen pro
Flächeneinheit geändert wird aber nicht deren Energie. Zur Zeit von Einsteins Hypothese
waren experimentelle Daten nicht präzise genug, um Glg. (2.8) zu bestätigen. Eine präzise
Verifikation wurde später durch R.A. Millikan durchgeführt, der damit eine unabhängige
Bestimmung von ~ erreichte.
Aufgrund der Beobachtung, dass eine Gruppe elektromagnetischer Wellen nicht nur Energie E sondern auch einen Impuls p = E/c trägt, wies Einstein den Photonen einen Impuls
mit Betrag p = ~ω/c = h/λ entlang deren Ausbreitungsrichtung
zu. Wegen des relativisp
2
2
tischen Ausdrucks für die Energie eines Teilchens, E = c m c + p2 sehen wir, dass das
Photon formell als Teilchen mit verschwindender Ruhemasse betrachtet werden kann.
2.2.3
Compton Effekt
Einige Jahre später (1923) entdeckte A.H. Compton ein Phänomen (Compton Effekt), in
dem die Existenz von Photonen besonders offenkundig wurde. Der Compton Effekt tritt als
Streuung von Röntgen - und Gammastrahlung in Gasen, Flüssigkeiten und Festkörpern
3
Die Bezeichnung Photon zur Beschreibung der Strahlungsquanten kam erst 1927 auf.
11
auf. Wenn ein dünnes Strahlenbündel aus Röntgenstrahlung mit Wellenlänge λ eine Substanz (am Besten mit geringem Atomgewicht, z.B. Kohlenstoff) durchdringt, werden
Röntgenstrahlen in alle Richtungen gestreut. Wenn man die gestreute Strahlung in einer
Richtung, welche mit der Einfallsrichtung den Winkel ϕ bildet, mit einem Kristallspektrographen analysiert, misst man eine Wellenlänge λ0 . Diese ist gegenüber der Wellenlänge
λ der einfallenden Strahlung geringfügig erhöht. Zusätzlich zu dieser gestreuten Strahlung mit Wellenlänge λ0 findet man ebenso gestreute Strahlung mit Wellenlänge λ, d.h.
ohne Änderung der Wellenlänge. Daher enthält das Spektrum der gestreuten Strahlung
zwei sehr nahe beieinander liegende Linien, eine bei der ursprünglichen Wellenlänge λ
und eine bei der anderen, leicht erhöhten Wellenlänge λ0 , vgl. Abb. (D.7). Diese Variation
der Wellenlänge λ0 − λ ist unabhängig von der Substanz, welche die Streuung verursacht.
Stattdessen hängt sie gemäß λ0 − λ = 0.024(1 − cos ϕ) Å vom Winkel zwischen der Streurichtung und der Richtung des einfallenden Strahls ab (vgl. Abb. (D.8)); daher ist die
Änderung der Wellenlänge maximal im Fall von Rückstreuung. Die klassische Theorie
des Elektromagnetismus kann das Vorhandensein einer zweiten Linie bei verschiedener
Wellenlänge nicht erklären.
Stattdessen versteht man mit der Theorie der Strahlungsquanten diese Streuung als Streuung eines Photons der einfallenden Strahlung an einem der Elektronen in der Substanz, in
welcher die Streuung stattfindet. Durch die Streuung werden die Photonen in verschiedene,
durch den Winkel ϕ spezifizierte Richtungen abgelenkt. Wir beschreiben diese Streuung
mittels Energie- und Impulserhaltung, mit Hilfe der relativistischen Energie-Impuls Beziehung sowie mit der im vorigen Abschnitt eingeführten Ausdrücke für Impuls und Energie
der Photonen, (p = ~k bzw. p = ~k = h/λ = hν/c = ~ω/c sowie E = hν = ~ω). Dann
erhalten wir
me c2
+ ~ω 0 ,
me c2 + ~ω = q
2
1 − vc2
(2.9)
me v
~ω 0 0
~ω
k̂ = q
k̂ .
+
2
c
c
1 − vc2
(2.10)
Hierbei ist me = 511.0 keV/c2 die Elektronenmasse und v ist die Geschwindigkeit des
Elektrons nach der Streuung. Wir nehmen hierbei an, dass das Elektron vor der Streuung
frei (nicht in einem Potential) und in Ruhe ist. Ferner gilt ω = 2πc/λ sowie ω 0 = 2πc/λ0
und k̂ sowie k̂ 0 sind die Einheitsvektoren, welche die Richtung der einfallenden und gestreuten Röntgenstrahlung repräsentieren. Aufgrund der Definition des Winkels ϕ als der
Winkel, in den das Photon gestreut wird, gilt k̂ · k̂ 0 = cos ϕ. Die Wellenzahlen hängen mit
den Wellenlängen über k = 2π/λ sowie k 0 = 2π/λ0 zusammen. Aus Glg. (2.10) erhalten
wir
m2e v 2
~ω ~ω 0
~2 ω 2 ~2 ω 0 2
=
+
−
2
cos ϕ.
(2.11)
2
c2
c2
c c
1 − vc2
Mittels Einsetzen von Glg. (2.9) eliminieren wir v und erhalten
ω − ω0 =
~
c
c
2π~
ωω 0 (1 − cos ϕ) bzw. λ0 − λ = 0 − =
(1 − cos ϕ).
me c
ω
ω
me c
(2.12)
Nach Einsetzen der numerischen Werte für 2π~/(me c) findet man in der Tat 0.024 Å.
12
In dieser Herleitung wurde das Elektron als freies Teilchen betrachtet. Diese Art der Beschreibung kann für weiter außen im Atom befindliche Elektronen verwendet werden. Falls
das Photon an einem im Atom weiter innen befindlichen (stärker gebundenen) Elektron
streut, findet Impulsaustausch nicht nur mit dem Elektron sondern mit dem gesamten
Atom statt. In diesem Fall muss man in den Formeln die Masse des Elektrons durch die
Masse des Atoms austauschen, welche um ein Tausendfaches größer ist. Daher findet man
dann beide Linien bei nicht unterscheidbaren Wellenlängen.
2.3
2.3.1
Atomare Spektren und Quantisierung von Materie
Atomare Spektren
Seit dem frühen neunzehnten Jahrhundert war Physikern bekannt, dass atomare Gase
Licht nur bei bestimmten Frequenzen absorbieren und emittieren. Diese festen Frequenzen
wurden zwar erfolgreich als Charakteristika zur Identifikation bekannter oder Entdeckung
neuer Atome (z.B. unabhängige Entdeckung des Heliums mittels seiner Spektrallinien im
Sonnenlicht durch J. Jansen und N. Lockyer, beide 1868) verwendet, aber in keinster
Weise verstanden. Fortschritt im Verständnis atomarer Spektren war nicht möglich, ohne
etwas über die Struktur der Atome zu wissen.
Die Entdeckung der Kathodenstrahlung (J. Plücker 1858, W. Hittorf 1869, J.J. Thomson
1894), des Elektrons (J.J. Thomson, 1897) sowie der radioaktiven Stoffe (A.H. Becquerel 1896, M. und P. Curie 1898, E. Rutherford und F. Soddy, 1902) führten zu Beginn
des zwanzigsten Jahrhunderts zur Beschreibung der elektrisch neutralen Atome mit dem
Thomson’schen Atommodell (Rosinenkuchenmodell). Hier nahm man an, dass die Elektronen wie Rosinen in einem Kuchen in einer kontinuierlichen positiven Ladungsverteilung
säßen. Aufgrund von Werten für mittlere freie Weglängen in molekularen Gasen und für
Dichten von Festkörpern mit bekannter chemischer Zusammensetzung ordnete man Atomen Radien in der Größenordnung von 10−10 m zu. Streuexperimente von P. Lenard in
Jahr 1903 zeigten, dass Atome für schnelle Elektronen beinahe transparent waren. Daher bestand die Herausforderung, die Verteilung der Bestandteile eines Atoms in dessen
Innern zu verstehen.
Um diese räumliche Struktur genauer zu verstehen, führten E. Rutherford, H. Geiger und
E. Marsden im Jahr 1911 Streuversuche an einer dünnen Goldfolie mit Alpha-Teilchen
(ein 42 He Nukleus) aus dem radioaktiven Zerfall einer Radiumquelle durch. Die gestreuten
Alpha-Teilchen wurden durch Lichtblitze beim Auftreffen auf einer Folie aus Zinksulfid
detektiert. Während man in Vorwärtsrichtung erwartungsgemäß eine geringe Strahlaufweitung beobachtete, wurde auch Rückstreuung gemessen. Dieser Befund stand in völligem Widerspruch zu Thomsons Atommodell. Im folgenden betrachten wir die Kinematik
dieses Streuprozesses.
Ein Alpha-Teilchen der Masse M streue an einem Target der Masse m und alle Geschwindigkeiten seien klein genug, dass eine nicht-relativistische Näherung ausreiche. Das Problem werde hier nur in einer Dimension betrachtet (eine positive Geschwindigkeit ist eine
Geschwindigkeit entlang der Flugrichtung des einfallenden Alpha-Teilchens, während eine negative Geschwindigkeit eine Geschwindigkeit in entgegengesetzter Richtung ist). Aus
13
Energie- und Impulserhaltung folgt
1
1
1
M v 2 = mu2 + M v 0 2 .
(2.13)
2
2
2
Nach Eliminieren der Geschwindigkeit u erhält man
02
M
v
M v0
M
m−M
0
0= 1+
−2
−1+
⇔ v = v 1, −
. (2.14)
m
v2
m v
m
m+M
M v = mu + M v 0 ,
Die erste Lösung entspricht einem ungestreuten Teilchen, die zweite Lösung hingegen
kommt durch die eigentliche Streuung zustande. Diese Lösung kann nur negativ werden
(Rückstreuung), sofern m > M ist. Da Alpha-Teilchen circa 7300 mal schwerer sind als
Elektronen, ist diese Rückstreuung an einem Elektron als Streuzentrum nicht möglich.
Rückstreuung erfordert die Existenz eines ausreichend schweren und kleinen Streuzentrums, in welches das Projektil nicht eindringt.
Wir schätzen nun den Radius dieses massereichen Streuzentrums ab und betrachten das
Coulomb-Potential eines ausreichend schweren, positiv geladenen Teilchens mit Ladung
+Ze. Der Umkehrpunkt für ein Alpha-Teilchen wird in diesem Potential bei einer Distanz
r erreicht, bei welcher die kinetische Energie vollständig in potentielle Energie umgewandelt wird, das heißt, wenn 1/2M v 2 = (2e)(Ze)/r. Daraus ergibt sich r = 4Ze2 /(M v 2 )
als maximale Größe des Streuzentrums. Ein kurzer Überschlag mit Geschwindigkeit v =
2.09 × 107 m/s des einfallenden Alpha-Teilchens und Ordungszahl Z = 79 für Gold ergibt
einen maximalen Radius des Streuzentrums von circa r ∼ 2.5 × 10−4 Å. Dies ist wesentlich kleiner als typische atomare Skalen und nicht mit der Thomson’schen Vorstellung
vereinbar.
Rutherford zog hieraus den Schluss (Kern-Hülle Modell), dass Atome einen sehr kleinen
positiv geladenen Kern besitzen, welcher nahezu die komplette Masse trägt. Die Elektronen müssten sich auf Bahnen um diesen Kern bewegen wie Planeten um die Sonne.
Da jedoch eine derartige Bahn im Zentralkraftpotential (vgl. Kepler-Problem) eine beschleunigte Bewegung ist und beschleunigte Ladungen Energie in Form von Strahlung
emittieren (vgl. Hertz’scher Dipol4 ), müssten diese Elektronen kontinuierlich auf immer
kleinere Bahnen wechseln und schlussendlich in den Kern stürzen. Eine solche kontinuierliche Emission (und der Kollaps der Atome) wird nicht beobachtet. Darüber hinaus könnte
man die mittlere Lebensdauer eines Atoms in dieser Beschreibung als 10−8 s abschätzen.
Daher wären Atome in diesem Bild nicht stabil und würden Strahlung mit einem kontinuierlichen Spektrum emittieren. Dies widerspricht der Beobachtung von stabilen Atomen
mit diskreten Absorptions- und Emissionsspektren, welche aus schmalen und isolierten
Linien bestehen, vgl. Abb. (D.9).
Das Spektrum von atomarem Wasserstoff war bekannt: es besteht aus Linien im sichtbaren, infraroten und ultravioletten Wellenlängenbereich. Dieses Spektrum war das erste,
für dessen Verteilung von Spektrallinien eine einfache empirische Regel gefunden wurde,
nämlich zunächst die Balmer Formel (J.J. Balmer, 1885) und drei Jahre später deren
Verallgemeinerung, die Rydberg Formel (J. Rydberg, 1888),
1
1
1
, m > n > 0,
(2.15)
−
ν̃ = = RH
λ
n2 m2
4
Die abgestrahlte Energie einer beschleunigten Ladung ist in Dipolnäherung dE/dt =
ist e die Ladung des Teilchens, a dessen Beschleunigung und c die Lichtgeschwindigkeit.
14
2 e2 2
3 c3 a .
Hierbei
wobei m, n ganzzahlige Werte annehmen und RH = 109678 cm−1 eine numerische Konstante (die Rydbergkonstante) ist. Die Linien treten in Serien auf. Die ersten vier beobachteten Serien sind:
n=1
n=2
n=3
n=4
m=2,3,4,. . .
m=3,4,5,. . .
m=4,5,6,. . .
m=5,6,7,. . .
Lyman Serie (ultraviolett),
Balmer Serie
(sichtbar),
Paschen Serie
(infrarot),
Bracket Serie
(infrarot).
Jede Serie strebt für steigendes m gegen den Grenzwert RH /n2 , d.h. die Linien werden
dicht um einen Grenzwert, vgl. Abb. (D.10). Nahe dieses Grenzwerts sind die Linien derart
dicht, dass sie nicht aufgelöst werden können.
Ein charakteristische Eigenschaft von Glg. (2.15) ist, dass Wellenzahlen von mehreren
Linien durch Differenzen zweier Terme von der Form Tn = RH /n2 (Spektralterme) ausgedrückt werden können. Zwar sind für kompliziertere Atome die Spektralterme nicht so
einfach wie für Wasserstoff, aber man kann für jedes Element verschiedene Reihen von
verallgemeinerten Spektraltermen einführen und die Wellenzahlen der Linien aus Differenzen einiger Spektralterme bestimmen (Rydberg-Ritz’sches Kombinationsprinzip, W. Ritz,
1905). Man kann für jedes Element eine Reihe von Spektraltermen Tns bestimmen, so dass
sich alle Linien der jeweiligen Spektren durch Beziehungen zwischen diesen Spektraltermen ausdrücken lassen, z.B.
0
ν̃n0 s0 ,ns = Tns0 − Tns .
(2.16)
Jedoch sind nicht alle möglichen Kombinationen in der Natur realisiert (es gibt Auswahlregeln).
2.3.2
Diskrete Energieniveaus
Um diese Schwierigkeiten zu überwinden und die Charakteristika der Absorptions- und
Emissionsspektren zu erklären, führte N. Bohr 1913 folgende Hypothese ein:
1. Für die Elektronen eines Atoms existieren einige ausgezeichnete Bahnen. Sofern sich
das Elektron entlang dieser Bahnen bewegt, emittiert es keine Strahlung. Diese Bahnen sind diskret und deshalb sind die Energiewerte ebenso diskret (Energieniveaus).
In anderen Worten, das Atom existiert nur in einem diskreten Satz von Zuständen
mit Energien (in aufsteigender Abfolge) E1 , E2 , . . .
2. Absorption oder Emission von Strahlung findet statt, wenn das Elektron zwischen
einem niedrigeren und höheren Energieniveau wechselt. In Übereinstimmung mit
Plancks Hypothese findet in diesen Prozessen Absorption oder Emission eines einzelnen Strahlungsquants statt. Wenn En und Em die Energien der zwei Bahnen
(mit m > n) sind, zwischen denen der Übergang stattfindet, und ω die Frequenz des
emittierten (bzw. absorbierten) Strahlungsquants ist, gilt aufgrund der Energieerhaltung
Em − En = ~ω.
(2.17)
Diese Formel ist die Kernaussage des Bohr’schen Atommodells. Setzt man
Tn = −En /hc,
15
(2.18)
so kann man die Energieniveaus zu den Spektraltermen aus Glg. (2.16) in Beziehung
setzen und einen Rahmen schaffen, um das Rydberg-Ritz’sche Kombinationsprinzip
zu verstehen.
Diese zwei Hypothesen sind allgemein und sollten auch für komplexere Atome und Moleküle gültig sein. Im Fall von Wasserstoff gab Bohr auch eine quantitative Regel zur
Bestimmung der erlaubten Bahnen und zur Berechnung der Energieniveaus an. Genauer gesagt nahm Bohr an, dass lediglich Kreisbahnen möglich seien und, dass gemäß der
Beobachtung, dass der Drehimpuls die gleiche Dimension wie die Wirkung besitzt,
2
Länge
Länge
[Länge] = [Masse]
[Zeit] = [Energie][Zeit],
[Drehimpuls] = [Masse]
Zeit
Zeit
(2.19)
der Drehimpuls lediglich ganzzahlige Vielfache von ~ = h/(2π) annehmen könne. Damit
erhalten wir die Bohr’sche Quantisierungsregel
me vr = n~,
n = 1, 2, . . . ,
(2.20)
und für Kreisbahnen in Coulombpotential5
me v 2 = e2 /r.
(2.21)
Durch Eliminieren von v zwischen beiden Gleichungen erhalten wir für den Radius der
n-ten Bahn
~2
(2.22)
r ≡ rn = n2 2 .
e me
Daher finden wir unter Verwendung von Glg. (2.21) für die Energie eines Elektrons auf
der n-ten Bahn
me v 2 e2
1 e2
En =
−
=−
.
(2.23)
2
rn
2 rn
Dieses Ergebnis6 kann man mittels Glg. (2.22) als
En = −hcR
1
n2
(2.24)
formulieren, wobei R = 2π 2 e4 me /(h3 c). Hierdurch erhält man die Balmer Formel wenn
man R = RH identifiziert. Durch Einsetzen der fundamentalen Konstanten h, c, e und
me erhält man
R = 109700 cm−1
(2.25)
5
In dieser Vorlesung wird das Gauß’sche Einheitensystem (cgs System) verwendet, vgl. Anhang A,
in welchem die Coulomb-Kraft zwischen zwei Ladungen Q1 und Q2 durch F = Q1 Q2 /r2 gegeben ist. Im
Gegensatz dazu ist die Coulomb Kraft im SI System (MKSA System) F = 1/(4πε0 )Q1 Q2 /r2 , wobei ε0
die Permittivitität des Vakuums ist.
6
Hinweis: Obgleich die Ausdrücke Glg. (2.24) und Glg. (2.28) in der üblichen Formulierung von QM
weiterhin für ganzzahliges n gültig sind, wird dieses n als Hauptquantenzahl bezeichnet und hat nichts
mit dem Bahndrehimpuls zu tun. Genau genommen kann in QM eine Zustand mit Hauptquantenzahl n
den Betrag des quantisierten Bahndrehimpulses L2 = ~2 l(l + 1) haben. Hierbei ist l = 0, 1, 2, . . . , n − 1.
16
in Übereinstimmung mit experimentellen Werten7 . Die Energieniveaus von Wasserstoff
sind in Abb. (D.10) gezeigt. Von besonderer Wichtigkeit sind die Energie des Grundzustands,
E1 = −hcR = −13.6 eV,
(2.26)
sowie der Radius der ersten Bahn,
r1 =
~2
= 0.529 Å.
e2 me
(2.27)
Dieser wird auch als Bohr’scher Radius bezeichnet, typischerweise durch das Symbol a0 .
Wir führen hier zwei weitere Beobachtungen an. Die Ionen He+ und Li++ sind ähnlich
wie Wasserstoff und unterscheiden sich von diesem lediglich durch die Kernladungszahl.
In diesen Fällen kann man das vorige Prozedere modifizieren und erhält
En = −hcR
Z2
,
n2
(2.28)
wobei Z die Ordnungszahl des jeweiligen Elements ist (Z = 2 für Helium, Z = 3 für
Lithium). Die Position der Spektrallinien die man mittels Glg. (2.28) bestimmt ist in
guter Übereinstimmung mit experimentellen Daten. In der vorigen Rechnung wurde der
Atomkern als räumlich fest betrachtet. Dies entspricht der Annahme, die Masse des Kerns
sei sehr viel größer als die des Elektrons. Der Wert von R in Glg. (2.25) wird daher
allgemein als R∞ bezeichnet. Aufgrund der präzisen spektroskopischen Messungen ist die
Bewegung des Nukleus jedoch eine nicht völlig vernachlässigbare Korrektur. Man kann
diese einfach berücksichtigen indem man in den vorigen Formeln die Elektronenmasse
me durch die reduzierte Masse µ = (mN me )/(mN + me ) des Elektron-Nukleus-Systems
ersetzt. Wenn man dies durchführt, erhält man den Ausdruck
RN =
R∞
me .
1+ m
N
(2.29)
Diese Formel konnte durch Vergleich der Linienspektren von He+ und Wasserstoff verifiziert werden. Setzt man Z = 2 in Glg. (2.28) ein, sollten die Linien für 2n → 2m mit jenen
für n → m für Wasserstoff übereinstimmen. Sie weichen jedoch in der Natur geringfügig
voneinander ab und sind um ca. 1 Å verschoben. Diese Verschiebung kann man messen.
Wir machen hier die folgenden zwei Anmerkungen: In seiner Herleitung verließ sich Bohr
auf die alte Idee der klassischen Theorie des Strahlungfelds, dass die Frequenz der Spektrallinien mit der Frequenz der Bahnbewegung des Elektrons übereinstimmt, aber er nahm
dies nur für die äußersten Bahnen8 (große Werte von n) an. Diese Idee entspricht dem
Korrespondenzprinzip, und obwohl dieses von Bohr bis 1923 nicht klar formuliert worden
7
Tatsächlich ist R in dieser naı̈ven Rechnung die Rydberg-Konstante R∞ die am genauesten gemessene
Naturkonstante überhaupt. Ihr aktueller Wert ist R∞ = 109737, 31568508(65) cm−1 und gilt in der Näherung eines unendlich schweren Kerns, siehe auch Glg. (2.29) und die zugehörige Diskussion im Text. Aus
experimentellen Beobachtungen kann erhält man einen Wert RN der durch Glg. (2.29) mit R∞ verknüpft
ist.
8
Beispielsweise gibt das Bohr’sche Modell einen inkorrekten Wert L = ~ für den Drehimpuls im
Grundzustand an. Aus dem Experiment ist jedoch bekannt, dass der Drehimpuls des echten Grundzustands verschwindet.
17
war, inspirierte es doch all seine vorherige Arbeiten. Die Aussage des Korrespondenzprinzips ist, dass die Klassische Theorie makroskopisch korrekt ist, d.h. sie beschreibt
Phänomene im Limes, dass Quanteneffekte (Diskontinuitäten) als unendlich klein angesehen werden können: in diesem Limes müssen die Vorhersagen der exakten Theorie mit den
Vorhersagen der Klassischen Theorie übereinstimmen. Das Korrespondenzprinzip besagt,
dass die Quantentheorie sich asymptotisch der Klassischen Theorie annähert im Limes
großer Quantenzahlen. Damit diese Bedingung erfüllt ist, legt man fest, dass eine formelle
Analogie zwischen Quantentheorie und Klassischer Theorie besteht: diese Korrespondenz
zwischen den zwei Theorien besteht bis hinab zu den kleinsten Details und muss als Leitlinie zur Interpretation der Ergebnisse der neuen Theorie gelten.
Die Bohr’sche Theorie ist nur für Kreisbahnen anwendbar, aber wie im Fall des Sonnensystems ist die allgemeinste Bahn eines gebundenen Teilchens in einem Coulomb Feld nicht
ein Kreis sondern eine Ellipse. Eine Verallgemeinerung der Bohr’schen Quantisierungsbedingung, Glg. (2.20), wurde von P. Ehrenfest 1914 vorgeschlagen. Diese wurde anschließend von A. Sommerfeld 1916 verfeinert und zur Berechnung der Energien von Elektronen
auf elliptischen Bahnen verwendet. Sommerfelds Quantisierungsbedingung war für ein System formuliert, das durch die Hamiltonfunktion H(q, p) beschrieben wird, mit mehreren
Koordinaten qi und kanonisch konjugierten Impulsen pi , welche die Hamilton’schen Gleichungen erfüllen. In dem Fall, dass alle qi und pi eine periodische Zeitabhängigkeit haben,
gilt für jedes i
I
dqi pi = ni h
(2.30)
mit ganzzahligen Werten ni . Das Integral wird über eine volle Periode der Bewegung
ausgewertet. In Bezug auf das Wasserstoffatom lieferten die Sommerfeld’sche und die
Bohr’sche Quantisierungsbedingung die gleichen Ergebnisse, wie Sie in Übung 2.2 selbst
sehen werden. Aber die Sommerfeld’sche Quantisierungsbedingung ließ sich auch für Alkaliatome, die Feinstruktur des Atoms in Bezug zu relativistischen Korrekturen zur Elektronenbewegung sowie für die Spektren von zweiatomigen Molekülen anwenden. Mittels des
Korrespondenzprinzips konnte man Auswahlregeln für die Emission von Strahlung und
Intensitäten der Spektrallinien berechnen. Zusätzlich ergibt die Sommerfeld’sche Quantisierungsbedingung angewandt auf den harmonischen Oszillator den Ausdruck En = n~ω
in Übereinstimmung mit der Planck’schen Hypothese.
Die Bohr-Sommerfeld’schen Quantisierungsregeln haben aber mehrere Einschränkungen:
sie können nicht für Systeme verwendet werden, die nicht multi-periodisch sind, sie benötigen ad-hoc Korrekturen um quantitative Ergebnisse zu erhalten, und sie liefern in manchen Fällen komplett falsche Ergebnisse.
2.3.3
Experimentelle Bestätigung der Existenz der Energieniveaus: der
Franck-Hertz Versuch
Das von Bohr postulierte, zugrunde liegende Konzept der quantisierten Energieniveaus
fand eine direkte experimentelle Bestätigung in einer Reihe von Experimenten von J.
Franck und G. Hertz. Der experimentelle Aufbau ist als Schaltbild in Abb. (D.11) skizziert. Er besteht aus einer Glasröhre, welche eine Substanz enthält, deren Energieniveaus
man untersuchen möchte. Innerhalb dieser Röhre befindet sich eine Glühkathode K, aus
welcher per thermoelektrischem Effekt Elektronen austreten, und ein Gitter G, welches
18
sich auf einem positiven Potential gegenüber K befindet. Das elektrische Feld zwischen
K und G beschleunigt die Elektronen, die daher zum Gitter wandern und es teilweise
durchqueren. Hinter G befindet sich eine Absorberplatte A, die sich auf einem niedrigeren Potential als G befindet, so dass Elektronen auf dem Weg von G nach A gebremst
werden. Die Elektronen, die A erreichen, werden durch ein Galvanometer zu K zurückgeführt. Dabei wird die Stromstärke gemessen. Falls die Elektronen keine inelastischen
Streuungen (Streuungen mit Verlust von Energie zur Anregung der Atome) erlitten haben, bewegen sie sich mit beschleunigter Bewegung zu G, wo sie ihre maximale kinetische
2
Energie erreichen gemäß Tmax = 1/2me vmax
= eUb , wobei Ub die Beschleunigungsspannung zwischen Kathode K und Gitter G ist. Die angesammelte kinetische Energie ist
ausreichend groß um die Gegenspannung Ug zwischen dem Gitter G und dem Absorber
A zu überwinden, so dass jene Teilchen, die G durchqueren, bei A ankommen und vom
Galvanometer registriert werden. Erhöht man die Beschleunigungsspannung Ub so weit,
dass eUb geringfügig über der Energiedifferenz E2 − E1 zwischen dem ersten angeregten
Zustand und dem Grundzustand der Substanz liegt, können die Elektronen, sobald sie
in die Nähe von G gekommen sind und die Potentialdifferenz eUb (größtenteils) durchlaufen haben, inelastisch an den Atomen in der Röhre streuen. Auf diese Art und Weise
verlieren sie fast ihre komplette kinetische Energie und können daher die Gegenspannung
zwischen G und A nicht mehr überwinden, d.h. sie erreichen A nicht mehr. Deshalb zeigt
das Galvanometer einen starken Abfall des Stroms an, vgl. Abb. (D.11). Daher kann die
Energiedifferenz zum ersten angeregten Zustand aus
E2 − E1 = eUb0
(2.31)
bestimmt werden, wobei Ub0 die Beschleunigungsspannung beim ersten Stromabfall ist.
Wenn man die Beschleunigungsspannung Ub weiter erhöht als Ub0 , findet die inelastische
Streuung in einer Region näher bei K statt und die Elektronen, welche Energie in der
inelastischen Streuung verloren haben, können später wieder beschleunigt werden und so
A erreichen. Wenn eUb den Wert 2(E2 − E1 ) erreicht, können die Elektronen zweimal
inelastisch streuen, einmal vorher (auf halber Strecke) und einmal nahe beim Gitter,
und daher fällt der Strom erneut stark ab. Das gleiche Verhalten wiederholt sich für
eUB = 3(E2 − E1 ) und so fort, aber auch für eUb = (E3 − E1 ) und so weiter. Differenzen
zwischen Energieniveaus, die im Franck-Hertz Versuch bestimmt werden können, sind
typischerweise von der Größenordnung einiger eV bis zu ca. 20 eV.
2.3.4
Andere Beispiele der Quantisierung: Raumquantisierung
Ein anderer Typ von experimentell beobachteter Quantisierung ist jene der Richtungsquantisierung oder Raumquantisierung von atomaren Systemen. Man beobachtet diese
immer wenn ein Atom sich in einem äußeren Feld mit einer bevorzugten Orientierung
befindet. Die relative Orientierung des atomaren Systems ist dabei nicht beliebig sondern
auf bestimmte diskrete Werte beschränkt. Die direkteste Bestätigung dieses Typs von
Quantisierung tritt im Stern-Gerlach Versuch (O. Stern, W. Gerlach, 1922) auf, als Abweichung von paramagnetischen Atomstrahlen in einem stark inhomogenen Magnetfeld.
Paramagnetische Atome haben eine permanentes magnetisches Moment µ und können als
kleine, elementare Kreisel mit Drehimpuls L angesehen werden. µ ist dabei proportional
und parallel zu L. In einem Magnetfeld B präzediert der Drehimpuls um B (Larmor
Präzession). Wenn B konstant ist, bleibt die magnetische Energie −µ · B konstant und
19
unabhängig von der Position des Massenschwerpunkts des Atoms, der sich in einem Zustand geradlinig gleichförmiger Bewegung befindet. Falls jedoch B nicht konstant ist,
erfährt der Massenschwerpunkt des Atoms eine Kraft F = ∇(µ · B) und eine entsprechende Ablenkung. Dies beobachtet man im Stern-Gerlach Versuch wie in Abb. (D.12)
schematisch gezeigt wird. Nimmt man an, dass Bz Bx und By ist, so dass die anderen
z
ẑ. Die AblenKomponenten vernachlässigt werden können, dann erhält man F = µz ∂B
∂z
kung ist daher proportional zur z Komponente des magnetischen Moments. Wenn man,
nachdem der Strahl eine feste Strecke innerhalb des Magnetfelds durchquert hat, den
Einschlag der Atome auf einem Schirm misst, würde man in der klassischen Physik aufgrund der kontinuierlichen Variation von µz erwarten, dass der Strahl über einen großen
Bereich aufgefächert ist, welcher allen Werten von µz zwischen +µ und −µ entspricht. Im
Experiment hingegen beobachtet man eine Reihe kleiner Punkte bei gleichen Abständen,
welche parallel zu ẑ ausgerichtet sind. Wenn man das magnetische Feld variiert, ändern
sich die Abstände zwischen den Punkten entsprechend ohne weitere Veränderung des Musters. Insbesondere bleibt die Anzahl der Punkte konstant. Jeder dieser Punkte entspricht
einem spezifischen Wert von µz . Dementsprechend ist µz eine quantisierte Größe die λ
verschiedene Werte annimmt. Neben dem Stern-Gerlach Versuch gibt es weitere direkte
Manifestationen der Raumquantisierung. Im Speziellen sei hier der Effekt eines konstanten magnetischen Felds auf die Struktur der Spektren – der Zeeman Effekt – erwähnt,
welchen wir später besprechen werden. Alle diese Phänomene haben einen gemeinsamen
Ursprung: die Quantisierung des Drehimpulses.
2.4
Erfolge und Grenzen der alten Quantentheorie
Die Bohr-Sommerfeld’sche Theorie war bis 1926/27 das einzige theoretische Gefüge um
die vielen in der Atomphysik auftretenden experimentellen Befunde zu erklären. Ihr großer
Verdienst ist die Einführung des Konzepts von Energieniveaus, die durch Quantenzahlen
beschrieben werden, ein noch immer gültiges fundamentales Konzept für die mikroskopische Welt. Nichtsdestotrotz war selbst in der Zeit ihrer größten Erfolge klar, dass es sich
nicht um eine endgültige physikalische Theorie handelt sondern nur um eine teilweise und
provisorische Ansammlung von Korrekturen, um eine Anwendung von Klassischer Mechanik und Klassischer Elektrodynamik auf die atomare Welt zu ermöglichen. Nicht nur,
dass die Bohr-Sommerfeld’sche Theorie nicht dazu in der Lage war, verschiedene experimentelle Fakten zu erklären, sie war auch auf multi-periodische Systeme beschränkt und
konnte nicht für Stöße zwischen Systemen verwendet werden. Ihr fehlten zu einer echten
Theorie gehörende Eigenschaften wie Kohärenz, Vollständigkeit und Exaktheit. Einerseits verwendete man die Gesetze der Klassischen Mechanik um Bahnen der Elektronen
zu berechnen oder die Ausbreitung elektromagnetischer Wellen zu untersuchen, andererseits führte man Quantisierungsregeln und Hypothesen zur Absorption und Emission ein,
welche in völligem Widerspruch zu den klassischen Gesetzen stehen
Die vollwertige und kohärente Theorie, die quantenmechanische Theorie, wurde auf zweierlei unabhängige Arten in der Zeit von 1924 bis 1927 erlangt. Einerseits hatte L. de Broglie
bereits 1924 vorgeschlagen, dass Teilchen (wie bereits für elektromagnetische Strahlung
geschehen) eine zweifache Beschaffenheit haben, also sowohl teilchen- als auch wellenartige
Attribute tragen. E. Schrödinger formulierte mittels einer Wellengleichung für Teilchen die
Wellenmechanik (1926). Andererseits erlangten W. Heisenberg, M. Born und P. Jordan
20
ausgehend vom Korrespondenzprinzip ein Formulierung der Matrizenmechanik (1925).
Anschließend zeigte Schrödinger die mathematische Äquivalenz der beiden Theorien und
Born, Jordan und P. Dirac konstruierten die axiomatische Formulierung der QM. Dies
wird Thema des nächsten Kapitels sein.
21
Tabellarischer Überblick der Frühgeschichte der Quantenmechanik:
1827
1868
1868
1895
1896
1897
1898
1900
1905
1910
1911
1912
1913
1914
1919
1922
1923
1925
1927
1925-28
1932
R. Brown
Beobachtung der Brown’schen Bewegung
J. Jansen, N. Lockyer
Endeckung des Heliums via Spektrallinien
J. J. Balmer
Balmer Formel für Wasserstoff
W.C. Röntgen
Entdeckung der Röntgenstrahlung
A.H. Becquerel
Entdeckung der Radioaktivität
J.J. Thomson
Entdeckung des Elektrons
M. & P. Curie
Entdeckung von Polonium & Radium
M. Planck
Schwarzkörperstrahlung
A. Einstein
Photoelektrischer Effekt, Brown’sche Bewegung
R.A. Millikan
Messung der Elektronenladung
E. Rutherford
Streuung von α-Teilchen & Kern-Hülle Modell
M.v. Laue
Röntgenbeugung an Kristallen
C. Wilson
Trajektorien in der Nebelkammer
H. Geiger
Geiger-Müller-Zählrohr
N. Bohr
Bohr’sches Atommodell
H.G. Moseley
Messung der Kernladungszahl
J. Franck, G. Hertz
Elektronenstreuung an Atomen
A. Sommerfeld
Atombau & Spektrallinien
E. Rutherford
Entdeckung des Protons
O. Stern, W. Gerlach
Raumquantisierung
L. de Broglie
Materiewellen & Welle-Teilchen-Dualismus
A.H. Compton
Compton-Streuung
S. Goudsmith, G. Uhlenbeck
Elektronenspin
C. Davisson, L. Germer
Elektronenbeugung an Kristallen
M. Born, P. Jordan,
W. Heisenberg
Göttinger Matrizenmechanik
E. Schrödinger
Wellenmechanik (Wien)
J. Chadwick
Entdeckung des Neutrons
Literaturempfehlung:
A. Messiah
F. Schwabl
S. Weinberg
Quantum Mechanics, Volume 1
Quantenmechanik (QM I)
Lectures on Quantum Mechanics
22
Sections 1.1 – 1.5
Kapitel 1
Sections 1.1 – 1.2
3
Wellenfunktion und Schrödingergleichung
3.1
Wellen- und Teilchenaspekte von Strahlung
Im achtzehnten Jahrhundert wurden zwei verschiedene Theorie vorgeschlagen um die
Ausbreitung von Licht zu beschreiben: eine korpuskulare Theorie von I. Newton und eine
Wellentheorie von C. Huygens. Die Theorie Newtons wurde verworfen, als Interferenzund Beugungsphänomene entdeckt wurden. Diese zeigten nicht nur die Wellennatur des
Lichts sondern gestatteten auch dessen Wellenlänge zu messen. Rufen Sie sich in diesem
Zusammenhang die Ihnen bekannten Experimente von T. Young und A. Fresnel und die
Beugungsexperimente an einem Spalt in Erinnerung!
Auch für Röntgenstrahlung konnte man nachweisen, dass es sich um elektromagnetische
Wellen mit Wellenlängen zwischen 0.5 und 500 Å handelt. Dies wurde durch Untersuchungen von Röntgenbeugung an Kristallen nachgewiesen – im Wesentlichen natürliche
dreidimensionale Gitter mit Gitterkonstanten in der Größenordnung eines Ångström. Zwei
verschiedene Arten von Experimenten wurden an den Kristallen durchgeführt: Beugung
durch Transparenz (M. von Laue, 1912) und Beugung durch Reflexion (W.L. und W.H.
Bragg, 1913).
Alle diese Phänomene bestätigen die Wellennatur der elektromagnetischen Strahlung.
Nichtsdestotrotz zeigt die Planck’sche Hypothese sowie alle anderen im vorigen Kapitel besprochenen Phänomene, dass man in gewisser Art und Weise elektromagnetischer
Strahlung einen Teilchencharakter zuordnen kann.
In der Tat können der Photoelektrische Effekt und der Compton Effekt als Ergebnis von
Stößen zwischen Photonen und Elektronen beschrieben werden. In diesen Stößen verhalten
sich die Photonen in gewisser Weise ähnlich wie Materieteilchen. Wir werden später sehen,
wie diese zwei Charakteristika miteinander in Einklang gebracht werden können.
3.2
Teilchencharakter von Materie und de Broglie’sche Hypothese
Was Materie angeht erschien es schon immer natürlich, anzunehmen, dass kleinere Teile
makroskopischer Materie materielle Korpuskel seien, welche den Bewegungsgleichungen
der Klassischen Mechanik gehorchen. Dies wurde auch durch die Chemie sowie die kinetische Theorie bestätigt. Als Beispiele seien hier die Thomson’sche Methode zur Bestimmung des Verhältnisses von Ladung zu Masse beim Elektron, welche auf Parabelbahnen
des Elektrons in einem magnetischen Feld basiert, und die Millikan’sche Methode zur Messung der Elementarladung angeführt. Innerhalb der Wilson’schen Kammer (auch: Blasenkammer) konnte man die Trajektorien der Elementarteilchen sichtbar machen. Insbesondere war es möglich, die Stöße zwischen Teilchen sichtbar zu machen und zu bestätigen,
dass Energie- und Impulserhaltungssätze erüllt sind. Trotz dieser experimentellen Beweise schlug L. de Broglie im Jahr 19239 vor, dass Materieteilchen eine Welle-Teilchen
Doppelnatur zuzuordnen sei. Er nahm an, dass auf diese Art und Weise die Existenz der
9
De Broglie war zu dieser Zeit Doktorand in Paris.
23
Energieniveaus im Atom zu erklären sei.
Wie wir im vorigen Kapitel gesehen haben, muss gemäß Planck und Einstein dem Quant
der elektromagnetischen Strahlung – dem Photon – mit Frequenz ν und Wellenlänge λ
eine Energie E = hν und ein Impuls p = h/λ zugeordnet werden. Im Umkehrschluss
schlug de Broglie vor, einem Teilchen in Bewegung mit Impuls p eine ebene Welle
i
ψ(x, t) = A exp { (p · x − Et)}
~
(3.1)
mit Ausbreitungsrichtung in Richtung des Impulses p zuzuordnen, deren Frequenz und
Wellenlänge wiederum zu Energie und Impuls durch E = hν und p = h/λ in Beziehung
stehen. In einer relativistischen Betrachtung wird verlangt, dass (p, E) und (k, ω) als
Vierervektoren transformieren.
Wir merken an, dass die Phasengeschwindigkeit (z.B. die Ausbreitungsgeschwindigkeit
von ebenen Wellen gleicher Phase) der ebenen Welle in Glg. (3.1) durch
vph =
E
p
(3.2)
gegeben ist. Wenn man stattdessen ein Wellenpaket betrachtet (z.B. die Superposition
von ebenen Wellen mit benachbarten Impulsen oder Wellenzahlen),
Z
i
ψ(x, t) = d3 p c(p) exp { (p · x − Et)},
(3.3)
~
dann ist die Gruppengeschwindigkeit vg durch
vg =
dE
dp
(3.4)
definiert und daher gleich der Geschwindigkeit des Teilchens sowohl in relativistischen als
auch nicht-relativistischen Behandlungen.
De Broglies Gedanke war, dass die Existenz der Energieniveaus innerhalb des Atoms dem
Phänomen der charakteristischen Frequenzen entspricht, das auftritt, wenn eine Welle
innerhalb eines gegebenen Raumbereiches eingesperrt ist (vgl. Übung 1 auf Blatt 2 als
Beispiel für derartiges Verhalten). Eine Rechtfertigung für diese Idee findet man bereits
mittels folgender einfacher Betrachtung: Nehmen wir an, dass innerhalb eines Wasserstoffatoms das Elektron sich auf einer kreisförmigen Bahn r befinde. Wenn p sein Impuls ist,
beträgt die zugehörige Wellenlänge auf Basis der de Broglie Beziehung λ = h/p. Die
Bedingung für stationäre Wellen ist, dass die Länge der Trajektorie des Elektrons ein
ganzzahliges Vielfaches n der Wellenlänge λ sei,
2πr = nλ = nh/p,
(3.5)
was mit der Bohr’schen Quantisierungsbedingung übereinstimmt, vgl. Glg. (2.20). Allgemeiner kann man die Sommerfeld’sche Quantisierungsbedingung, vgl. Glg. (2.30), als
die Forderung verstehen, dass die Phase der Welle sich über eine volle Periode um ein
ganzzahliges Vielfaches von 2π ändert.
24
3.3
Die Schrödinger Gleichung
De Broglie hatte die Eingebung, dass ein Teilchen mit einer Welle verbunden sein müsse,
doch es gelang ihm nicht, eine präzise mathematische Formulierung für seine Idee zu finden. An seiner statt gelang es E. Schrödinger im Jahre 1926 eine Wellengleichung für die
Ausbreitung dieser Welle niederzuschreiben. Die ursprünglichen Überlegungen10 Schödingers, um diese Schrödingergleichung zu erhalten, beruhten auf der Hamilton-Jacobi Formulierung der Klassischen Mechanik. Wir werden diese Herleitung hier nicht nachvollziehen
und uns auf sehr viel einfachere Argumente beschränken.
Wie wir gesehen haben, sollte man einem freien Teichen mit Impuls p und Energie E eine
ebene Welle gemäß Glg. (3.1) zuordnen. Dann erfüllt diese die Gleichungen
~
b
∇x ψ(x, t) = pψ(x,
t),
i
∂
i~ ψ(x, t) =Eψ(x, t)
∂t
(3.6)
(3.7)
Dann erhält man für jeden Zustand der Energie E
i
ψ(x, t) = e− ~ Et φ(x),
(3.8)
wobei für ein freies Teilchen im nicht-relativistischen Fall E = p2 /2m gilt. Der Wechsel
der Notation wird im Anhang erläutert. Daher ist in diesem Fall φ(x) eine Lösung der
Gleichung (mit Laplace Operator ∆x = ∇2x )
1
Eφ(x) =
2m
~
∇x
i
2
φ(x) = −
pb2
~2
∆x φ(x) =
φ(x),
2m
2m
(3.9)
wie sich nach zweifacher Anwendung von Glg. (3.6) ergibt.
Da die Energie eines Teilchens in einem Potential V (x) allgemeiner durch E = p2 /2m +
V (x) gegeben ist, ist es eine naheliegende Vermutung, dass man für ein solches Teilchen
nach wie vor Glg. (3.8) verwenden kann, aber nun
~2
(3.10)
Eφ(x) = −
∆x + V (x) φ(x)
2m
bzw.
∂
i~ ψ(x, t) =
∂t
~2
−
∆x + V (x) ψ(x, t)
2m
(3.11)
b auf die
gilt. Wenn man die Wirkung des Hamilton-Operators (auch: Hamiltonian) H
Wellenfunktion als
~
b
b
Hψ(x,
t) = H(b
x, p)ψ(x,
t) = H(x, ∇x )ψ(x, t)
i
10
E. Schrödinger, Ann. Phys. 79, 361 (1926).
25
(3.12)
identifiziert, kann man Glg. (3.11) umschreiben als
i~
~
∂
b
b
ψ(x, t) = Hψ(x,
t) = H(b
x, p)ψ(x,
t) = H(x, ∇x )ψ(x, t).
∂t
i
(3.13)
Dies ist die zeitabhängige Schrödingergleichung für die Wellenfunktion ψ(x, t). Wir nehmen an, dass jedem Teilchen eine komplexe Wellenfunktion ψ(x, t) zugeordnet ist, welche der Schrödingergleichung Glg. (3.13) genügt, wobei h (bzw. ~ = h/2π) gleich der
Plank’schen Konstanten h = 6.626 × 10−34 Js ist. Dies gilt in voller Allgemeinheit und
unabhängig davon, wie wir diese Gleichung erhalten haben.
Wir bemerken, dass Glg. (3.13) eine Differentialgleichung erster Ordnung in der Zeit ist
und daher ψ(x, t) durch die anfängliche Verteilung ψ(x, 0) festgelegt ist. Da Glg. (3.13)
eine lineare Gleichung in ψ(x, t) ist, gilt das Superpositionsprinzip, d.h. Linearkombinationen von Lösungen sind ebenfalls Lösungen und Interferenzeffekte treten auf, wie sie aus
der Optik bekannt sind. Wie die Gleichungen für transversale Schwingungen einer Saite
eines Musikinstruments, hat auch diese Gleichung nur für bestimmte Werte der Energie
Lösungen. In diesen Fällen ist die Randbedingung, dass φ(x) eine einwertige Funktion die
für |x| → ∞ verschwindet. Wie Schrödinger in seinem ersten Papier zur Wellenmechanik
bemerkte:
“ Als das Wesentliche erscheint mir, daßin der Quantenvorschrift nicht mehr die
geheimnisvolle “Ganzzahligkeitsforderung” auftritt, sondern diese ist sozusagen einen
Schritt weiter zurückverfolgt: sie hat ihren Grund in der Endlichkeit und Eindeutigkeit
einer gewissen Raumfunktion.” [E. Schrödinger, Annalen der Physik (1926)]
Darüber hinaus besitzt die Schrödingergleichung eine offensichtliche Verallgemeinerung für
Mehrteilchensysteme. Wenn ein System durch einen Hamilton-Operator H(b
x1 , . . . ; pb1 , . . .)
(die Punkte . . . repräsentieren die Ortskoordinaten und Impulse weiterer Teilchen) gegeben ist, dann nimmt die Schrödingergleichung die Form
∂
~
(3.14)
H(x1 , . . . ; ∇x1 , . . .)ψn (x1 , . . .) = i~ ψn (x1 , . . .) = En ψn (x1 , . . .)
i
∂t
an. Der Hamilton-Operator für N Teilchen der Massen mi mit i = 1, . . . , N mit dem
allgemeinen Potential V (x1 , . . . , xN ) ist beispielsweise durch
X pb2
i
b
bN )
H=
+ V (b
x1 , . . . , x
(3.15)
2m
i
i
gegeben, und die erlaubten Energien sind jene, für welche es eine eindeutige Lösung
ψ(x1 , . . . , xN ) gibt, die für jegliches |xi | → ∞11 verschwindet. Die Schödingergleichung
lautet in diesem Fall
!
X ~2
i
Eφ(x1 , . . . , xN ) =
−
∆x + V (x1 , x2 , . . . , xN ) φ(x1 , . . . , xN ).
(3.16)
2mi i
i
Ausgestattet mit dieser Gleichung war es nun – zumindest im Prinzip – möglich, die
Spektren nicht nur von Wasserstoff sondern ebenso von allen anderen Atomen sowie von
jeglichem anderen nicht-relativistischen System mit bekanntem Potential auszurechnen.
11
Diese Bedingungen werden später in Kapitel XXX en détail besprochen.
26
3.4
Experimentelle Bestätigung der Welleneigenschaften von
Materieteilchen
Die Schrödingergleichung, Glg. (3.13), ist Grundlage der Erklärungen aller Eigenschaften
von Atomen und Molekülen. In sämtlichen Fällen, in denen es möglich ist, die Gleichung
zu lösen oder effektive Näherungsmethoden zu verwenden, stimmen die Ergebnisse mit
experimentellen Daten überein. Nichtsdestotrotz ist auch eine direkte Bestätigung der
Welleneigenschaften von Materieteilchen wichtig. Diese Bestätigung wurde 1927 zum ersten Mal durch C. Davisson und L. Germer sowie unabhängig davon durch G.P. Thomson
erbracht.
Zunächst bemerken wir, dass die typische Größenordnung der de Broglie Wellenlänge
so ist, dass kein Widerspruch zu makroskopischen Erfahrungen auftritt. Hat beispielsweise ein Körper eine Masse 10−5 g (klein auf einer makroskopischen Skala) und eine
Geschwindigkeit von einigen cm/s, so hat er eine de Broglie Wellenlänge von 10−24 m,
welche sicherlich nicht direkt beobachtbar ist. Bedingungen, die sehr viel günstiger zur
Beobachtung der Welleneigenschaften von Teilchen sind, liegen für leichte Teilchen wie
Elektronen√vor. Die einem Elektron
mit kinetischer Energie T zugeordnete Wellenlänge
p
ist λ = h/ 2me T = 12.25 Å/ T /eV . Für T von der Größenordnung 100 eV ist λ von der
Größenordnung 1 Å, ähnlich zur Wellenlänge von Röntgenstrahlung. Daher könnte man
die Beugung von Elektronen an Kristallen nutzen, um die Wellenlänge der Elektronen
nachzuweisen. Das Experiment von Davisson und Germer basiert auf Reflexion ähnlich
wie die Beugungsexperimente von Bragg mit Röntgenstrahlen. Die Elektronen werden von
einer Glühkathode F emittiert und durch eine Spannung zwischen F und einer Blende
D beschleunigt. Durch Variation der Spannung zwischen D und F kann die Geschwindigkeit der Elektronen variiert werden. Ein dünner Strahl von Elektronen geht durch ein
Loch in der Blende und trifft auf einen Nickel-Einkristall R. Die Elektronen werden am
Kristall gestreut und in einem beweglichen Detektor P gesammelt, vgl. Abb. (D.13). Der
gesamte Aufbau befindet sich in einem Hochvakuum. Auf diese Weise kann man die gesamte Winkelverteilung der gestreuten Elektronen messen. Das Experiment von Thomson
wurde mittels eines Aufbaus realisiert, der dem Aufbau Laues zuw Messung der Beugung
von Röntgenstrahlung mittels Transparenz von Kristallen ähnelt. In diesem Aufbau emittiert ein Glühdraht im Hochvakuum Elektronen durch den thermoelektrischen Effekt. Die
Elektronen werden zur Blende D durch eine Spannung U = V /e beschleunigt. Danach
werden sie nicht mehr durch Kräfte beeinflusst. Die zweite Lochblende D0 erzeugt einen
dünnen Strahl der auf eine photographische Platte L aufschlägt und einen hellen, runden
Fleck erzeugt. Wenn man nun in die Flugbahn der Elektronen eine dünne Kristallschicht
einsetzt, treten auf der Photoplatte Leuchtpunkte in einer regelmäßigen Anordnung um
den zentralen Punkt auf, wie es für ein Beugungsphänomen, dessen Symmetrie von der
Symmetrie der Kristallgitter abhängt, charakteristisch ist. Die Ergebnisse, die man in
diesen beiden Experimenten erhält, sind sehr ähnlich zu jenen der Experimente mit Röntgenstrahlung. Die Beobachtungen beider Experimente sind in Abb. (D.14) gezeigt. Indem
man die Beugungsbilder betrachtet, kann man die Wellenlänge des Elektrons bestimmen,
und findet, dass die de Broglie Beziehung vollständig bestätigt wird. Nach diesen Experimenten mit Elektronen wurden ähnliche Experimente mit Atomen und leichten Molekülen
durchgeführt (I. Estermann, O. Stern, 1929). Es ist hier von Interesse, die Werte von λ für
einige Atome und Moleküle mit mittlerer thermischer Geschwidigkeiten bei Raumtemperatur anzugeben, vgl. Tab. (5).
27
Später wurden Beugungsexperimente mit Neutronen, Protonen und anderen bekannten
Teilchen ausgeführt. Unter den Experimenten mit Neutronen führen wir insbesondere jene
von E. Fermi und L. Woods Marshall in Jahr 1947 an, in welchen ein monoenergetischer
Neutronenstrahl mit Impuls p sich wie ein Strahl monochromatischer Strahlung mit λ =
h/p verhält. Diese Experimente brachten ähnlich wie Experimente mit Röntgenstrahlung
eine ganze Klasse von Phänomenen wie Streuung, Reflexion und so weiter hervor. Heute
verwenden wir die Welleneigenschaften von Neutronen in der Erforschung der Struktur
von Kristallen.
Sie selbst werden zur de Broglie Wellenlänge einige Betrachtungen in Übungsaufgabe 3.1
anstellen.
3.5
Kontinuitätsgleichung und statistische Interpretation der
Wellenfunktion
Wir wollen nun die physikalische Bedeutung der Wellenfunktion ψ(x, t) verstehen, welche
die Schrödingergleichung, Glg. (3.13), erfüllt. Zunächst schlug Schrödinger die Größe
P (x, t) = ψ ∗ (x, t)ψ(x, t)
(3.17)
als Ladungsdichte am Punkt x zur Zeit t vor12 . Dann sollte eine Kontinuitätsgleichung
der Form (die Beziehung zwischen ρ und P wird später genauer diskutiert)
∂
ρ + ∇x · j = 0
∂t
(3.18)
gelten, wobei ρ die Dichte und j der zugehörige Strom ist, j = ρv. Unter Verwendung der
Schrödingergleichung, Glg. (3.13) und der komplex konjugierten Schrödingergleichung ist
es möglich, eine Kontinuitätsgleichung für P zu erhalten. Wir erhalten durch Umstellen
aus den beiden äquivalenten Formen der Schrödingergleichung
i ∂
2m
V (x)ψ(x, t) + 2m
ψ(x, t) = 0,
2
~
~ ∂t
i ∂ ∗
2m
ψ (x, t) = 0,
∆x ψ ∗ (x, t) − 2 V (x)ψ ∗ (x, t) − 2m
~
~ ∂t
∆x ψ(x, t) −
(3.19)
(3.20)
und multiplizieren die beiden Gleichungen mit ψ ∗ (x, t) bzw. ψ(x, t), um die zweite danach
von der ersten zu subtrahieren. Damit erhalten wir
ψ ∗ (x, t)∆x ψ(x, t) − ψ(x, t)∆x ψ ∗ (x, t) + 2m
i ∂ ∗
[ψ (x, t)ψ(x, t)] = 0,
~ ∂t
(3.21)
was in die Form von
∂P
=0
∂t
gebracht werden kann. Hierbei ist die Stromdichte
∇x · S +
S(x, t) =
12
~
(ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t)) .
2im
Das erste neutrale Teilchen – das Neutron – wurde erst 1932 entdeckt.
28
(3.22)
(3.23)
Glg. (3.22) hat die Form einer Kontinuitätsgleichung. Nun integrieren wir Glg. (3.22) über
das Volumen V und wenden für das Integral den Gauß’schen Integralsatz13 an, um
Z
Z
d
∂ψ ∗ (x, t)
~
∂ψ(x, t)
3
∗
∗
− ψ(x, t)
(3.24)
d x ψ (x, t)ψ(x, t) = −
dσ ψ (x, t)
dt V
2im σ
∂n
∂n
zu erhalten. Hierbei bezeichnet σ die Oberfläche des Volumens V und sowohl ∂ψ(x, t)/∂n
als auch ∂ψ ∗ (x, t)/∂n bezeichnen Normalenableitungen von ψ(x, t) bzw. ψ ∗ (x, t) auf der
Oberfläche. Wenn wir annehmen, dass ψ(x, t) und ψ ∗ (x, t) und ihre Ableitungen schnell
genug für |x| → ∞ abfallen, und V über den kompletten Raum R3 ausdehnen, verschwindet das Integral über die Oberfläche auf der rechten Seite. Wir erhalten damit
Z
d
d3 xψ ∗ (x, t)ψ(x, t) = 0,
(3.25)
dt
R
das wichtige Ergebnis, dass d3 x ψ ∗ (x, t)ψ(x, t) zeitunabhängig ist. Da es sich bei der
Schrödingergleichung um eine homogene Gleichung handelt, kann man ψ(x, t) mit einer
geeigneten Konstante multiplizieren, so dass
Z
d3 x ψ ∗ (x, t)ψ(x, t) = 1
(3.26)
R 3
grundsätzlich
gilt.
Falls
d x ψ ∗ (x, t)ψ(x, t) = C gilt, ist es ausreichend, ψ(x, t) durch
√
1/ Cψ(x, t) zu ersetzen, damit die neue Wellenfunktion “normiert” ist, d.h. dass die
“Norm”
Z
Z
2
2
3
kψ(x, t)k ≡ d x |ψ(x, t)| = d3 x ψ ∗ (x, t)ψ(x, t)
(3.27)
gleich eins ist. Glg. (3.27) wird als “Normierungsbedingung” bezeichntet und der Faktor
mit dem man ψ(x, t) multiplizieren muss als “Normierungskonstante”. Diese Normierungskonstante kann immer bis auf einen konstanten Phasenfaktor eiα bestimmt werden,
dessen Wahl keinerlei Einfluss auf die Ausdrücke für S und P hat. Auf jeden Fall kann
man, falls Glg. (3.25) erfüllt ist, die Ausdrücke
ρ(x, t) =eψ ∗ (x, t)ψ(x, t),
e~
j(x, t) =
(ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t))
2im
(3.28)
(3.29)
als Ladungdichte bzw. Stromdichte interpretieren, wobei e die dem Teilchen zugeordnete Ladung ist. Nichtsdestotrotz bringt diese Interpretation große Probleme mit sich.
Zunächst einmal kann sich die Welle ψ(x, t) während ihrer Ausbreitung beträchtlich ausdehnen, und die entsprechende Ausdehnung müsste ebenso mit der vom Teilchen getragenen elektrischen Ladung geschehen. Insbesondere müsste in den Fällen von Beugung
und Interferenz, die in den vorigen Abschnitten besprochen wurden, das Elektron über
die gesamte Region verteilt sein, in welcher das Interferenzmuster beobachtet wird. Dies
steht jedoch in direktem Widerspruch zur experimentellen Tatsache, dass sich das Elektron zu jedem Zeitpunkt, an dem man es beobachtet, als unteilbare Einheit und als im
Wesentlichen punktförmiges Objekt erweist. Darüber hinaus sollte ein Elektron in einem
13
R
R
Der Gauß’sche Satz besagt V dn x∇x · A = dσn−1 A · n̂, wobei n̂ der nach außen orientierte
Normaleneinheitsvektor des n − 1 dimensionalen Oberflächenelements dσn−1 ist, welches das Volumen V
begrenzt.
29
Atom nicht nur von der vom Kern ausgeübten Kraft und der von anderen Elektronen ausgeübten Kraft beeinflusst werden sondern auch von jener Kraft, die von seinem eigenen
geladenen “Fluid” ausgeht. Für dieses Beispiel sollte also das in der Schrödingergleichung
für das Wasserstoffatom zu verwendende Potential
Z
ψ ∗ (x0 , t)ψ(x, t)
e2
2
d 3 x0
(3.30)
V (x) = − + e
r
|x0 − x|
lauten und die Korrektur wäre nicht-linear in ψ(x, t). Wie wir im Kapitel XXX sehen
werden, sind die korrekten Energieniveaus des Wasserstoffatoms jene, die man für das
Potential V (x) = −e2 / |x| erhält. Um zu verstehen, wie diese Interpretation modifiziert
werden sollte, könnte man zu den Interferenz- und Beugungsexperimenten zurückkehren, wie zum Beispiel zu dem von Davisson und Germer. In dem originalen Experiment,
vgl. Abb. (D.15), werden die vom Galvanometer G als Funktion des Winkels θ angezeigten
Minima und Maxima als Krönchen bezeichnet, zu dem sehr viele Elektronen beitragen.
Wenn man sich vorstellen würde, den Detektor P durch ein Instrument zu ersetzen, das
jedes Elektron für sich einzeln zählen würde, dann könnte man das vollständige Beugungsmuster rekonstruieren, und zwar, als das Resultat der statistischen Verteilung der
Elektronen, die in verschiedene Richtungen gestreut wurden, vgl. Abb. (D.16). All dies
motiviert uns, eine statistische Interpretation des Wellenobjekts ψ(x, t) in Erwägung zu
ziehen. Der erste, der zu dieser Interpretation gelangte, war M. Born (1926).
Auf diese Art und Weise interpretieren wir
P (x, t)d3 x = ψ ∗ (x, t)ψ(x, t)d3 x
(3.31)
als die Wahrscheinlichkeit, das Teilchen zur Zeit t in dem Volumenelement d3 x um den
Ort x herum zu beobachten. Indem wir mit dσ ein allgemeines Oberflächenelement eines
den Ort x beinhaltenden Volumens und mit n̂ den senkrecht zu dieser Oberfläche nach
außen weisenden Einheitsvektor bezeichnen, identifizieren wir auf gleiche Art und Weise
S(x, t) · n̂dσdt =
~
(ψ ∗ (x, t)∇x ψ(x, t) − ψ(x, t)∇x ψ ∗ (x, t)) · n̂dσdt
2im
(3.32)
als die Wahrscheinlichkeit, dass ein Teilchen das Flächenelement dσ im Zeitintervall dt
in Richtung des Vektors n̂ durchquert. Hierbei ist dσ = dσn̂ der Normalenvektor des
Flächenelements, der orthogonal auf dieser Fläche steht und nach außen weist, sowie n̂
der zugehörige Einheitsvektor.
Nun wollen wir besprechen, was in den vorigen Behauptungen postuliert worden ist. Das
Konzept der Wahrscheinlichkeit hat für ein Einzelereignis keinerlei Bedeutung, und daher
macht das, was wir postuliert haben, keinerlei Aussage über das Verhalten eines einzelnen
Teilchens. Sobald wir jedoch mehrere gleiche Teilchen betrachten, die alle den gleichen
physikalischen Anfangszustand haben (im konkreten Fall ein Strahl von Teilchen) und in
ausreichend großer Zahl vorliegen, dass statistische Schwankungen vernachlässigt werden
können, dann liefert Glg. (3.31) den Anteil der Teilchen, die tatsächlich in dem Volumen
d3 x beobachtet werden, und der Ausdruck Glg. (3.32) gibt den Anteil der Teilchen an,
welche durch die Oberfläche dσ in der Zeit dt gegangen sind. Entsprechend gilt für den
Fall der geladenen Teilchen, dass Glgn. (3.28) und (3.29) nach Multiplikation mit der
30
Gesamtzahl der Teilchen N die makroskopische Ladungs- und Stromverteilung des Strahls
beschreiben. Die Interpretation, mit der wir Glgn. (3.31) und (3.32) versehen haben, gilt
gleichermaßen für geladene und neutrale Teilchen.
3.6
Die statistische Interpretation und die Beschreibung mittels
Welle-Teilchen-Dualität
Wir haben am Anfang des Kapitels angesprochen, dass Materieteilchen zwei Merkmale haben, die widersprüchlich erscheinen: Welleneigenschaften und Teilcheneigenschaften. Der
Wellencharakter tritt in Interferenz- und Beugungsphänomenen in Erscheinung, während
der Teilchencharakter sich in der Tatsache zeigt, dass die Teilchen, wann immer sie individuell beobachtet werden, sich als unteilbare Einheit zeigen. Die statistische Interpretation,
die wir im vorigen Abschnitt erläutert haben, vereinbart diese beiden Aspekte. Das Objekt, das wir ein Teilchen nennen, sollte man sich weder als Korpuskel noch als Welle
mit der üblichen Bedeutung dieser zwei Konzepte vorstellen, die auf unserer Erfahrung
mit makroskopischen Objekten beruhen. Es gibt solche Situationen, in denen das Verhalten der Teilchen als Ausbreitung von Wellen beschreibbar ist, und andere Situationen, in
welchen es als Bewegung eines kleinen Körpers beschreibbar ist. Von keinem der beiden
Konzepte sollte man auf allgemeingültiges Verhalten schließen. Stattdessen sollten wir den
Versuch einer Beschreibung von Teilchen auf Grundlage unserer gewöhnlichen Erfahrung
aufgeben.
Eine sehr klare Darstellung dieser Situation erhält man in der Diskussion des Doppelspaltexperiments, vgl. Abb. (D.17). Wir wollen das Experiment – soweit möglich – rein
schematisch beschreiben. Ein Strahl von Elektronen bei fester Energie tritt aus einer
Quelle aus und trifft auf eine Oberfläche Σ1 , welche zwei Löcher (Spalte) 1 und 2 hat.
Dann wird jedes Elektron durch eine monochromatische Welle beschrieben, die zum Teil
an Σ1 reflektiert wird, und deren anderer Anteil beim Durchgang durch die beiden Spalte
gebeugt wird. Wir nennen die beiden gebeugten Wellen ψ1 (x, t) und ψ2 (x, t). Dann ist
die gesamte Welle nahe beim Schirm Σ2 durch ψ(x, t) = ψ1 (x, t) + ψ2 (x, t) gegeben, so
dass die Wahrscheinlichkeit, dass ein Detektor M an irgendeiner Position x entlang des
Schirms Σ2 zum Zeitpunkt t den Aufschlag des Elektrons misst, durch
S(x, t) · n̂dσ =
~ n ∗
[ψ1 (x, t) + ψ2∗ (x, t)] ∇x [ψ1 (x, t) + ψ2 (x, t)]
2im
o
− [ψ1 (x, t) + ψ2 (x, t)] ∇x [ψ1∗ (x, t) + ψ2∗ (x, t)] · n̂dσ
(3.33)
gegeben ist, wobei n̂ der Normaleneinheitsvektor zu Σ2 ist und dσ das dem Detektor
M entsprechende Oberflächenelement ist. Da alle Elektronen die gleichen Anfangsbedingungen haben, gibt der zeitliche Mittelwert von Glg. (3.33) aufgrund des Gesetzes der
großen Zahlen den Fluss der Elektronen in M pro Zeiteinheit an. Wenn man die Position
von M entlang des Schirms verschiebt, sollte der beobachtete Fluss Minima und Maxima
aufweisen, wie man sie von typischen Interferenzmustern kennt.
Nun wollen wir vor den beiden Spalten 1 und 2 die zwei Detektoren C1 und C2 aufstellen.
Von den Teilchen, die M erreichen, wird ein Anteil von dem Detektor C1 gemessen –
wir sagen, sie sind durch den Spalt 1 gegangen – und der andere Anteil wird von dem
31
Detektor C2 gemessen – wir sagen, sie sind durch den Spalt 2 gegangen. Der Fluss des
ersten Anteils ist proportional zu
S1 (x, t) · n̂dσ =
~
{ψ1∗ (x, t)∇x ψ1 (x, t) − ψ1 (x, t)∇x ψ1∗ (x, t)} · n̂dσ,
2im
(3.34)
der Fluss des zweiten Anteils ist
S2 (x, t) · n̂dσ =
~
{ψ ∗ (x, t)∇x ψ2 (x, t) − ψ2 (x, t)∇x ψ2∗ (x, t)} · n̂dσ.
2im 2
(3.35)
Daher ist der gesamte Fluss durch die Summe der einzelnen Flüsse gegeben,
S1 (x, t) · n̂dσ + S2 (x, t) · n̂dσ,
(3.36)
und wir sehen, dass S1 (x, t) + S2 (x, t) 6= S(x, t). Die Verteilungen von S(x, t) · n̂,
S1 (x, t) · n̂, S2 (x, t) · n̂, [S1 (x, t) + S2 (x, t)] · n̂ sind durch die Kurven (a), (b), (c) und
(d) in Abb. (D.18) gezeigt. Die unterschiedlichen Charakteristika der Kurven (a) und (d)
sind offenkundig, insbesondere hat die Kurve (d) keine Minima und Maxima des Interferenzmusters der Kurve (a) mehr. Wir müssen daraus schlussfolgern, dass die Anwesenheit
der Detektoren C1 und C2 das Phänomen beinflusst und die Interferenz komplett zerstört
hat.
Kehren wir nun zur Idee eines Teilchens zurück. Falls wir uns das Elektron als Korpuskel
vorstellen, sagt uns die gewöhnliche Intuition, dass es notwendigerweise, um den Detektor
M zu erreichen, entweder durch den Spalt 1 oder durch den Spalt 2 gegangen sein muss.
Wenn dem so wäre, müsste man erwarten, dass die Verteilung von Elektronen auf dem
Schirm Σ2 von der Form (d) ist. Dies müsste sowohl in Anwesenheit wie in Abwesenheit
der Detektoren C1 und C2 gelten. Jedoch widerspricht dies der Vorhersage der Schödingergleichung und den Ergebnissen der Interferenz- und Beugungsexperimente mit Elektronen,
die in den vorigen Abschnitten besprochen wurden. Nur falls wir die Detektoren vor den
Spalten platziert haben, können wir sagen, dass das Elektron mit Sicherheit durch einen
bestimmten Spalt gegangen ist. Daher können wir die Beschreibung als Korpuskel nicht
im Allgemeinen ohne Einschränkung verwenden. Andererseits ist die Wellenbeschreibung
nicht kompatibel mit der Beobachtung des Durchgangs eines einzelnen Elektrons durch
den Detektor. Zu jeder Zeit beobachtet jeweils nur einer der beiden Detektoren vor den
Spalten den Durchgang des Elektrons. Wenn der Detektor M aus einem System von Einzeldetektoren aufgebaut ist, die über den Schirm Σ2 verteilt sind, und die Intensität des
Elektronenstroms ausreichend gering ist, beobachten diese die einzelnen Elektronen jedes
für sich und nur die statistische Verteilung der Zählraten wird in Übereinstimmung mit
der Schrödingergleichung sein, vgl. Abb. (D.16). Das hier beschriebene Experiment ist zu
einem Gutteil ein idealisiertes Experiment, ein Gedankenexperiment. In Wirklichkeit wäre
es schwierig ob der Größe der Spalte Detektoren zu realisieren, die zwischen Teilchen unterscheiden können, welche durch die Spalte 1 und 2 gehen. Aber es zeigt charakteristische
Eigenschaften, die in real durchgeführten Experimenten tatsächlich zu beobachten sind.
Insbesondere stimmen die Kurven (a), (b) und (c) vollständig mit den Beobachtungen in
Beugungsexperimenten mit Elektronen an ein oder zwei Spalten überein, wie sie in dem
vorigen Abschnitt beschrieben werden.
Daher sehen wir, dass wir eine intuitive Beschreibung elementarer Objekte aufgeben
müssen, und, dass dies eine inhärente Eigenschaft der QM ist (der Theorie des Verhaltens
32
elementarer Objekte), die diese Objekte in rein probabilistischen (d.h wahrscheinlichkeitstheoretischen) Begriffen beschreibt. Auf Grundlage von Informationen, die wir bezüglich
eines Quantensystems haben, können wir nicht allgemein vorhersagen, welche Ergebnisse man bei einer einzelnen Beobachtung des Systems erhalten wird. Stattdessen können
wir nur Wahrscheinlichkeiten für verschiedene Ergebnisse vorhersagen. In dem Doppelspaltexperiment erlaubt uns die Kenntnis der anfänglichen Energie des Elektrons nicht,
vorherzusagen, an welchen Punkt des Schirms Σ2 dieses einzelne Elektron beobachtet
werden wird, sondern sie erlaubt uns nur, die statistische Verteilung vieler Elektronen mit
exakt gleichen Anfangsbedingungen vorherzusagen.
Wie Sie vielleicht im Bezug zur Thermodynamik bereits in den Experimentalphysikvorlesungen gesehen oder in Lehrbüchern zur Experimentalphysik gelesen haben, taucht der
Begriff der Wahrscheinlichkeit bereits in der klassischen Physik für die Theorie der Zusammensetzung von Körpern aus atomaren oder molekularen Bestandteilen auf. Ihnen
sollten bereits einige Beispiele aus der kinetischen Gastheorie (z.B. Maxwell-Boltzmann
Verteilung, barometrische Höhenformel, etc.) bekannt sein. Die gleichen Methoden finden
ganz allgemein in der statistische Mechanik Anwendung. Diese Theorien haben das Ziel,
das mittlere Verhalten von Systemen zu beschreiben, die aus einer Vielzahl von Teilchen
bestehen. In diesen Theorien wurde die Verwendung von probabilistischen Rechnungen
auf Grundlage praktischer Überlegungen vorgeschlagen. Dabei bezog man sich auf den
Mangel an detailliertem Wissen bezüglich des genauen Zustands des Systems. In solchen
Fällen wäre das Verhalten des Systems im Prinzip exakt vorhersagbar, falls man über
ausreichend Information bezüglich des Zustands des Systems verfügte. In der Quantenmechanik hingegen hat die probabilistische Beschreibung einen fundamentalen Charakter
und ist nicht – in einer naı̈ven Art und Weise – auf einen (behebbaren) Mangel an Wissen
zurückzuführen. Zusammenfassend und in anderen Worten (R.P. Feynman, [2]):
33
a) Die Wahrscheinlichkeitsdichte eines Ereignisses in einem idealen Experiment ist
durch den Absolutbetrag der komplexen Zahl ψ gegeben, welche wir die Wahrscheinlichkeitsamplitude nennen:
P (x, t) =Wahrscheinlichkeitsdichte,
ψ(x, t) =Wahrscheinlichkeitsamplitude,
(3.37)
(3.38)
P (x, t) = |ψ(x, t)|2 .
(3.39)
b) Wenn ein Ereignis auf verschiedene, alternative Wege zustande kommen kann, so
ist die Wahrscheinlichkeitsamplitude des Ereignisses gleich der Summe der separaten Wahrscheinlichkeitsamplituden für jeden einzelnen Weg. Insbesondere
tritt Interferenz auf:
ψ(x, t) =ψ1 (x, t) + ψ2 (x, t),
(3.40)
2
P (x, t) = |ψ1 (x, t) + ψ2 (x, t)| .
(3.41)
c) Wenn ein Experiment so durchgeführt wird, dass bestimmt werden kann, welche
der verschiedenen Alternativen tatsächlich gewählt wurde, so ist die Wahrscheinlichkeitsdichte des Ereignisses die Summe der Wahrscheinlichkeitsdichten für
jede einzelne Alternative. Insbesondere tritt keine Interferenz auf:
P (x, t) = P1 (x, t) + P2 (x, t).
3.7
(3.42)
Heisenberg’sches Unschärfeprinzip und Unschärferelationen
In der Diskussion des Doppelspaltexperiments in dem vorigen Abschnitt haben wir gesehen, dass es unmöglich ist, zu beobachten, durch welchen Spalt das Elektron gegangen ist
(beispielsweise, indem man das Elektron mittels einer Lichtquelle oder Photon-ElektronStreuung detektiert), ohne zur gleichen Zeit auch das Interferenzmuster zu zerstören. W.
Heisenberg schlug im Jahre 1927 vor, dass die damals neuen Naturgesetze nur dann konsistent sein könnten, falls eine bisher nicht erkannte, grundlegende Beschränkung unserer
experimentellen Möglichkeiten bestehe. Er schlug sein Unschärfeprinzip als allgemeines
Prinzip vor, das wir bezüglich unseres Experiments folgendermaßen formulieren können:
“Es ist unmöglich einen Mechanismus zu entwickeln, der zwar ermittelt, durch welchen
Spalt das Elektron geht, der aber nicht zur gleichen Zeit die Elektronen stört und das Interferenzmuster zerstört.” Wenn ein Vorgang die Möglichkeit bietet, zu bestimmen, durch
welchen Spalt das Elektron geht, dann kann er nicht so behutsam sein, dass er nicht das
Muster auf wesentliche Art und Weise stört. Niemand hat jemals eine Methode gefunden
(oder auch nur erdacht), um das Unschärfeprinzip zu umgehen. Daher müssen wir davon
ausgehen, dass es sich um eine fundamentale Eigenschaft der Natur handelt.
Die vollständige Theorie der QM, die wir inzwischen verwenden um Atome und – streng
genommen – sämtliche Materie zu beschreiben, hängt von der Richtigkeit des Unschärfeprinzips ab. Heisenbergs ursprüngliche Formulierung des Unschärfeprinzips lautet: Wenn
man eine Messung an einem Objekt durchführt und die x-Komponente seines Impulses
34
mit der Unsicherheit ∆p kennt, kann man nicht zur gleichen Zeit seinen x-Ort genauer als
∆x ≥ h/∆p kennen. Zu jedem Zeitpunkt muss das Produkt der Unsicherheiten des Orts
und des Impulses eines Teilchens größer oder gleich der Planck’schen Konstanten sein.
Dies bedeutet, dass eine intrinsische Grenze besteht, jenseits derer eine Verbesserung der
Genauigkeit der Messung des Orts eines Teilchens zu Lasten der Genauigkeit der Bestimmung seines Impulses geht. Wir werden weiter im Kapitel 5 sehen, dass die Genauigkeit
um einen Faktor 4π gesteigert werden kann, und, dass die obige Relation für ein Teilchen
in drei Dimensionen zu folgender Aussage verallgemeinert werden kann:
∆x∆px ≥ ~/2,
∆y∆py ≥ ~/2,
∆z∆pz ≥ ~/2.
(3.43)
In dieser Gleichung repräsentieren ∆x, ∆y und ∆z die Unsicherheit, mit der die Koordinaten x, y und z bestimmt sind, und ∆px , ∆py und ∆pz beschreiben die Unbestimmtheit,
mit der die Komponenten des Impulses festliegen. Dieser Satz von Ungleichungen wird als
Heisenberg’sche Unschärferelation bezeichnet. Im Hinblick auf Glg. (3.43) ist es klar, dass
man sich ein Teilchen nicht als ein Korpuskel vorstellen kann. Es handelt sich um ein fundamentales Prinzip, das nichts mit technischen Unzulänglichkeiten eines Messapparates
zu tun hat. Wir können das Unschärfeprinzip auch in folgender Weise formulieren: Wann
immer die Ortsmessung genau ist (z.B. genaue Information über die derzeitige Position
des Teilchens), ist die Information über den Impuls ungenau oder unsicher und umgekehrt.
Wir wollen einige Gedankenexperimente besprechen, die Heisenberg analysiert hatte, um
sein Unschärfeprinzip zu erhalten.
3.7.1
Beugung an einem Spalt
Wir wollen annehmen, dass eine Strahl von Teilchen senkrecht auf einen Schirm AB mit
einem Loch der Länge d fällt, vgl. Abb. (D.19). Die Koordinate y eines Teilchens, das
durch den Spalt geht, ist mit einer Unschärfe
∆y = d
(3.44)
bestimmt. Andererseits ist einem Teilchen mit Impuls p eine Wellenlänge λ = h/p zugeordnet. Beim Durchgang durch den Spalt, wird die Welle um einen Winkel α0 gebeugt,
der durch sin α0 ∼ λ/d14 gegeben ist. Dies bedeutet, dass das Teilchen beim Durchgang
durch den Spalt von seiner ursprüngliche Bewegungsrichtung innerhalb einers Winkels α
zwischen +α0 und −α0 abweichen kann. Daher hat die Impulskomponente py = p sin α,
die zu Beginn gleich Null war, nun einen Wert zwischen ±p sin α0 und ist nur mit der
Unsicherheit
h
(3.45)
∆py ∼ p sin α0 =
d
bestimmt. Wenn wir dies mit Glg. (3.44) zusammenfügen, erhalten wir ∆y∆py ∼ h.
14
Die Beugungsbedingung lautet für das ersten Intensitätsminimum d sin θ = λ.
35
3.7.2
Lokalisation mit einem Mikroskop
Wir versuchen mit einer Linse den Ort P eines Elektrons mit Impuls p zu bestimmen,
vgl. Abb. (D.20), indem wir es mit einem kleinen Strahl monochromatischen Lichts beleuchten, (die Ausbreitungsrichtung des Lichts ist in der Abbildung gezeigt). Ein an dem
Elektron gestreutes Photon erzeugt ein Bild P 0 auf dem Schirm S 0 . Unter den optimalen
Bedingungen wird man – wie aus der Optik bekannt – in P 0 ein Beugungsmuster sehen,
das folgende Genauigkeit bei der Messung der Orts P erlaubt:
∆x =
λ
.
sin (3.46)
Hierbei ist λ die Wellenlänge des Lichts und ist die Hälfte des Winkels, unter dem von
P aus die Linse zu sehen ist. Da die Linse eine endliche Größe hat, ist es nicht möglich,
die Richtung genau zu kennen, entlang derer das Photon gestreut worden ist, welches
das Bild in P 0 erzeugt. Das Photon mit Wellenlänge λ hat den Impuls p = h/λ und
daher wird die Unbestimmtheit von px ungefähr h/λ sin sein. Da in dem Experiment
der Impuls des Gesamtsystems (Teilchen, Photon und Mikroskop) erhalten sein muss,
wird die Unbestimmtheit der Komponente px des Teilchenimpulses nach der Streuung des
Photons gleich der entsprechenden Unbestimmtheit für das Photon sein. Daher erhalten
wir die Unbestimmtheit
∆px ' h/λ sin .
(3.47)
Wir kombinieren diese mit Glg. (3.46) und erhalten schließlich
∆x∆px ∼ h.
3.7.3
(3.48)
Energie-Zeit-Unschärfe
Eine Gleichung analog zu Glg. (3.43) existiert auch, wenn man zugleich die Bestimmung
sowohl der Energie E eines Teilchens als auch der Zeit t betrachtet, zu der ein bestimmtes
Ereignis stattfindet, welches ebendieses Teilchen betrifft. Wenn ∆E die Unbestimmtheit
der Energie und ∆t die Unbestimmtheit der Zeit ist, erhalten wir die Relation
∆E∆t ∼ h.
(3.49)
Typische Beispiele der Anwendung von Glg. (3.49) sind Zerfälle von instabilen Systemen,
wie es beispielsweise radioaktive Kerne, Atome oder instabile Teilchen sind. Die solchen
Systemen zugeordnete Welle kann keine einzelne monochromatische stationäre Welle sein,
da das System nicht stabil ist. Es muss sich um eine Superposition verschiedener monochromatischer Komponenten handeln, die einem kleinen Frequenzintervall ∆ν entspricht.
Entsprechend ist die Energie des Systems lediglich mit Unschärfe
∆E = h∆ν
(3.50)
bestimmt. Dann bezeichnen wir die mittlere Lebensdauer des Systems mit τ und stellen fest, dass τ die Unbestimmtheit der Zeit ist, zu welcher der Übergang von dem ursprünglichen instabilen System zu einem stabilen System stattfindet (z.B. der Zerfall eines
Teilchens). Wir erhalten
τ ∼ h/∆E,
(3.51)
36
eine Relation, die verwendet werden kann, um die Größenordnung von τ zu bestimmen,
falls ∆E bekannt ist, oder umgekehrt.
Literaturempfehlung:
R.P. Feynman
A. Messiah
S. Weinberg
Lectures of Physics, Volume 3
Quantum Mechanics, Volume 1
Lectures on Quantum Mechanics
37
Sections 1 – 3
Sections 2.I – II, 4.I – III
Sections 1.3, 1.5
4
Die Schrödingergleichungen
4.1
Mathematische Eigenschaften der Schrödingergleichung
und des Hamiltonoperators
In Übereinstimmung mit der im vorherigen Kapitel besprochenen statistischen Interpretation muss die Untersuchung der Schrödingergleichung im Hilbertraum L2 (R3 ) durchgeführt
werden. Mit L2 (R3 ) bezeichnen wir den Raum von reellen oder komplexwertigen messbaren Funktionen, welche auf R3 quadrat-integrabel sind, d.h. die Funktionen χ(x), für
welche
Z
d3 x |χ(x)|2 < ∞
(4.1)
R3
15
gilt . Dieser Raum hat die Struktur eines Hilbertraums16 da er mit dem Skalarprodukt17
Z
hχ1 | χ2 i ≡ d3 x χ∗1 (x)χ2 (x)
(4.3)
ausgestattet ist. Eine genaue Definition und weitere mathematische Details bezüglich
Hilbertraum und Skalarprodukt finden Sie im Anhang C.1.
4.1.1
Schrödingergleichung
Wir betrachten nun die Schrödingergleichung
~2
∂ψ(x, t)
−
∆x + V (x, t) ψ(x, t) = i~
2m
∂t
(4.4)
und formulieren diese in Operatorschreibweise,
∂ψ(x, t)
b
Hψ(x,
t) = i~
,
∂t
(4.5)
15
Die Definition kann auf beliebige Körper erweitert werden, insbesondere auch auf deren Unterräume.
Beispielsweise bezeichnen mit L2 (T ) den Raum von reellen oder komplexwertigen messbaren Funktionen,
welche auf einer Untermenge T des R3 quadrat-integrabel sind, d.h. die Funktionen χ(x), für welche gilt:
Z
2
d3 x |χ(x)| < ∞.
(4.2)
T
16
Das mathematische Konzept eines Hilbertraums (benannt nach David Hilbert) verallgemeinert das
Konzept eines Euklidischen Raums. Dabei werden die Methoden der Vektoralgebra und der Analysis von
der zweidimensionalen Euklidischen Ebene und vom dreidimensionalen Vektorraum auf Räume mit der
Struktur eines inneren Produkts (Skalarprodukt) erweitert, welches die Messung von Längen und Winkeln
gestattet. Desweiteren sind Hilberträume vollständig: es existieren ausreichend Grenzwerte im Hilbertraum
um die Anwendung der Techniken der Analysis zu erlauben. Betrachten Sie hierzu Anhang C.1 bezüglich
weiterer Information zu Hilbertraum und Skalarprodukt.
17
Das Punktprodukt oder Skalarprodukt (teilweise auch inneres Produkt im Kontext Euklidischer
Räume) ist eine algebraische Operation die aus zwei Reihen von Zahlen (üblicherweise die Koordinaten
von Vektoren) als Argument eine einzelne Zahl erhält. Das Skalarprodukt zweier Vektoren kann basisunabhängig konstruiert werden, indem man die Komponente eines Vektors in Richtung des anderen mit
dem Betrag des anderen Vektors multipliziert.
38
wobei wir mit ψ(x, t) ein Element von L2 (R3 ) bezeichnen, das eine Funktion der Zeit ist,
und wir den sogenannten Hamiltonoperator als
2
~2
pb
b
+ V (b
x, t) = −
∆x + V (x, t)
(4.6)
H=
2m
2m
schreiben. Da die Energie reell ist, muss dieser Operator hermitesch (selbstadjungiert)
b =H
b †18 Wir werden sehen, dass man das Problem, die Schrödingergleichung
sein, d.h. H
zu lösen, auch als das Problem, die Eigenwerte und Eigenvektoren des Hamiltonoperators
b zu finden, formulieren kann. Als Konsequenz können wir wieder ohne Einschränkung
H
das Ergebnis von Glg. (3.25) erhalten. Wir definieren
kψ(x, t)k2 ≡ hψ(x, t) | ψ(x, t)i
(4.8)
und erhalten
dψ(x, t)
dψ(x, t) ψ(x, t) + ψ(x, t) dt
dt
D
E
D
E
i
i b
b
Hψ(x, t) ψ(x, t) −
ψ(x, t) Hψ(x, t) = 0.
=
~
~
d
kψ(x, t)k2 =
dt
(4.9)
Darüber hinaus ist Glg. (4.4) von erster Ordnung in der Zeitableitung. Dies legt den
Schluss nahe, dass es eine eindeutige Lösung ψ(x, t) gibt, welche die Anfangsbedingung
ψ(x, 0) = χ0 (x)
(4.10)
erfüllt. Es ist offensichtlich, dass eine derartige Lösung eindeutig ist. Tatsächlich müsste,
falls ψ1 (x, t) und ψ2 (x, t) zwei verschiedene Lösungen zur gleichen Anfangsbedingung
ψ1 (x, 0) = ψ2 (x, 0) = χ0 (x) wären,
kψ1 (x, t) − ψ2 (x, t)k = kψ1 (x, 0) − ψ2 (x, 0)k = 0
(4.11)
gelten und dann wäre ψ1 (x, t) = ψ2 (x, t) für beliebige Werte von t. Dies erkennt man
daran, dass gemäß Glg. (4.9) die Norm eines jeden Vektors und daher auch die Norm von
ψ1 (x, t) − ψ2 (x, t) zeitunabhängig sein muss.
4.2
Operatoren und ihre Wirkung auf Elemente des Hilbertraums
Wir erinnern uns hier an die Definitionen und Eigenschaften linearer Operatoren auf
Vektorräumen. Die grundlegenden Begrifflichkeiten dazu finden Sie im Anhang C.1. In
der QM spielen lineare Operatoren auf dem Hilbertraum L2 (R3 ) eine besondere Rolle,
18
b adjungierte Operator wird auch hermitesch adjungiert, hermitesch konjugiert oder hermiDer zu A
b† bezeichnet. In einem Hilbertraum ist A
b folgendermatesch transponiert genannt und mit dem Symbol A
ßen definiert: für beliebige Vektoren χ1 und χ2 gilt:
E D D
E
b† χ1 χ2 = χ1 Aχ
b 2 .
A
(4.7)
39
daher spezialisieren wir die folgenden Betrachtungen auf den Hilbertraum L2 (R3 ). Für
Vektoren χ1 (x) ∈ L2 (R3 ) definiert die Vorschrift
b 1 (x) = χ2 (x) ∈ L2 (R3 ),
Aχ
(4.12)
b auf den Vektor χ1 (x). Dies bedeutet, dass ein
die Wirkung des linearen Operators A
linearer Operator eine lineare Abbildung von L2 (R3 ) auf L2 (R3 ) ist. Die Eigenschaft der
Homogenität ist hierbei wesentlich,
b 1 χ1 (x) + α2 χ2 (x)) = α1 Aχ
b 1 (x) + α2 Aχ
b 2 (x),
A(α
(4.13)
da diese Operatoren bei Anwendung auf Linearkombinationen von Vektoren einem Distributivgesetz genügen. Für den weiteren Verlauf besonders relevante Beispiele sind folgende
Operatoren:
∂
∂
, ∇2x ,
oder f (x, t) als Multiplikator.
(4.14)
xi ,
∂xi
∂t
Mit Hilfe dieser Operatoren kann der Hamiltonoperator bzw. die Schrödingergleichung,
vgl. Glg. (4.4), geschrieben werden.
Wie man an der Liste dieser Operatoren bereits sieht, kommutieren Operatoren im Allb und B
b das
gemeinen nicht. Wir definieren für den Kommutator zweier Operatoren A
Symbol
b B]
b =A
bB
b−B
b A.
b
[A,
(4.15)
Zwei essentielle Beispiele linearer Operatoren in der QM sind der Impulsoperator pb und
b. Wie Glg. (3.6) nahelegt, sind die Wirkung des Impulsoperators auf
der Ortsoperator x
eine L2 (R3 ) Funktion ganz allgemein durch
~
b
(4.16)
pχ(x)
= ∇x χ(x)
i
und die Wirkung des Ortsoperators auf eine L2 (R3 ) Funktion ganz allgemein durch
bχ(x) = xχ(x)
x
(4.17)
gegeben. Wir betrachten nun den Kommutator der räumlichen i und j Komponenten
dieser beiden fundamentalen Operatoren. Die Auswertung dieses Kommutators lässt sich
am leichtesten bewerkstelligen, indem man die Operatoren innerhalb des Kommutators
auf einen beliebigen Vektor χ(x) betrachtet. Wir finden für diese Kommutatorrelation
~
∂χ(x) ∂{xi χ(x)}
~ ∂
χ(x) =
xi
−
[b
xi , pbj ] χ(x) = xi ,
i ∂xj
i
∂xj
∂xj


∂xi 
~
∂χ(x)
 ∂χ(x)

−χ(x)
=  xi
− xi
 = i~δi j χ(x),
i  ∂xj
∂xj
∂xj 
|
{z
}
|{z}
=0
(4.18)
=δi j
wobei man nun den beliebigen Vektor χ(x) entfernen kann. Daher kann man diesen sogenannten Heisenberg Kommutator auch verkürzt schreiben:
[b
xi , pbj ] = i~δi j .
(4.19)
Im Verlauf der Vorlesung werden Sie Stück für Stück verstehen, warum Glg. (4.19) der
Inbegriff der Quantenmechanik ist und die zentralen Wesenszüge der Quantenwelt Konsequenzen dieser Gleichung sind.
40
4.3
b
Eigenwerte und Eigenvektoren des Hamiltonoperators H
Wie wir sehen werden, ist eine der grundlegenden Problemstellungen in der QM die Betrachtung der Eigenvektoren (bzw. Eigenfunktionen) und Eigenwerte eines hermiteschen
b auf einem gegebenen Hilbertraum (H). Insbesondere ist diese Betrachtung
Operators A
b wesentlich, um Lösungen der Schrödingergleichung
für den Fall des Hamiltonoperators H
zu konstruieren, welche Glg. (4.9) erfüllen. Den gesamten Satz der Eigenwerte eines Operators bezeichnet man als dessen “Spektrum”. Die Ursache für das besondere Interesse an
den Eigenvektoren eines hermiteschen Operators liegt darin, dass diese ein vollständiges
System bilden in einem Sinne, den wir noch definieren werden19 . Wir wiederholen hier einige wohlbekannte Definitionen und Eigenschaften der (eigentlichen) Eigenvektoren. Für
b erfüllt dessen Eigenvektor die Gleichung
einen Operator A
b α = αχα ,
Aχ
(4.20)
wobei α eine komplexe Zahl ist. Der Wert von α, für den Glg. (4.20) erfüllt ist, heißt
der zu χα zugehörige Eigenwert. Die Eigenwerte und Eigenvektoren hermitescher Operatoren haben einige wichtige und einfache Eigenschaften. Wenn wir mit χα0 einen zweiten
Eigenvektor zum zugehörigen Eigenwert α0 bezeichnen, erhalten wir
b α0 = α0 χα0
Aχ
(4.21)
b
und nach Verwendung der Hermitezität von A
b α i − hAχ
b α0 |χα i = (α − α0 ∗ ) hχα0 |χα i .
0 = hχα0 |Aχ
(4.22)
Im Fall gleicher Eigenvektoren (χα0 = χα ) und daher auch gleicher Eigenwerte (α = α0 )
führt dies zu
α∗ = α.
(4.23)
Dies bedeutet, dass die Eigenwerte hermitescher Operatoren reell sind. Für unterschiedliche Werte von α und α0 (d.h. α 6= α0 ) erhält man
hχα0 |χα i = 0,
(4.24)
was bedeutet, dass verschiedenen Eigenwerten zugeordnete Eigenvektoren zueinander orthogonal sind. Darüber hinaus gilt für α = α0 , dass auch jede Linearkombination a χα +
b χα0 (mit beliebigen komplexen Zahlen a und b) ein Eigenvektor ist. Die Menge aller Eigenvektoren zu einem bestimmten Eigenwert α bildet einen Unterraum Hα von H, der als
Eigenraum (zum Eigenwert α) bezeichnet wird. Falls Hα die Dimension eins hat, d.h. falls
der Eigenvektor zu α bis auf einen konstanten Faktor eindeutig bestimmt ist, so nennt
man den Eigenwert einfach. Andernfalls nennen wir diesen entartet und die Dimension
von Hα den Entartungsgrad von α. Offensichtlich sind zwei zu verschiedenen Eigenwerten
α und α0 gehörende Eigenräume Hα und Hα0 zueinander orthogonal. Da in einem separierbaren Hilbertraum eine Menge von Eigenräumen, die jeweils zueinander orthogonal sind,
19
Genau genommen müsste man, um Vollständigkeit zu realisieren, die eigentlichen Eigenfunktionen,
deren Eigenwerte zum diskreten Spektrum gehören, mit den uneigentlichen Eigenfunktionen kombinieren,
deren Eigenwerte zum kontinuierlichen (Streuungs-) Spektrum gehören. Die uneigentlichen Eigenfunktionen gehören zu einem linearen Raum, der größer ist als der ursprüngliche Hilbertraum H.
41
höchstens abzählbar ist, können die eigentlichen Eigenwerte mit ganzen Zahlen20 indiziert
werden, d.h. sie können als
α1 , α 2 , . . . , α n , . . .
(4.25)
b
geschrieben werden und ihre Menge ist das diskrete Spektrum von A.
Falls alle Eigenwerte einfach sind, können die Eigenvektoren mit den gleichen ganzen
Zahlen wie die entsprechenden Eigenwerte indiziert werden, so dass der dem Eigenwert
αn entsprechende Eigenvektor als χn (d.h. χαn ≡ χn ) bezeichnet werden kann21 . Dann
sind zwei verschiedene Eigenvektoren immer zueinander orthogonal, und man kann
hχm |χn i = kχn k2 δm n
(4.26)
schreiben, wobei δm n das Kroneckersymbol ist. Wenn wir darüber hinaus die multiplikative
Konstante derart wählen, dass χn normiert ist, d.h. dass
kχn k = 1
(4.27)
gilt, so erhalten wir aus Glg. (4.26) die Orthonormalitätsrelation
hχm |χn i = δm n .
(4.28)
Wenn stattdessen einige oder alle Eigenwerte entartet sind, so können wir in jedem Eigenraum Hαn (bzw. Hn ) eine vollständige Orthonormalbasis χn 1 , χn 2 , . . . wählen. Dann
finden wir als Verallgemeinerung von Glg. (4.28) die Beziehung
hχn0 s0 |χn s i = δn0 n δs0 s .
(4.29)
b kann
Ein maximales System unabhängiger Eigenvektoren eines hermiteschen Operators A
immer als orthonormal gewählt werden. Im Folgenden werden wir den Entartungsindex s
nicht immer explizit zeigen.
b und spezifizieren drüber hinWir betrachten nun als Spezialfall den Hamiltonoperator H
aus, dass das Potential zeitunabhängig ist, d.h. Vb ≡ V (b
x). In Bezug auf den Hamiltonb schreiben wir die Eigenwertgleichung als
operator H
b = Eφ
Hφ
(4.30)
oder explizit
~2
∆x + V (x) φ(x) = Eφ(x).
−
2m
(4.31)
Dies ist eine gewöhnliche Differentialgleichung im Raum C 2 (R3 )22 und wird als formale
Eigenwertgleichung bezeichnet. Falls V (x) überall stetig ist (z.B. ohne singuläre Punkte
oder singuläre Oberflächen), erlaubt diese Gleichung unendlich viele Lösungen. Indessen
20
Es ist eine willkürliche und keine zwangsläufige Wahl, dass die Indizierung in diesem Beispiel mit
1 beginnt. Insbesondere gibt es verschiedene quantenmechanische Systeme, für die eine Bezeichnung des
Zustands mit dem niedrigsten Eigenwert mit dem Index 0 (oder mit bestimmten negativen ganzen Zahlen)
geradezu natürlich erscheint.
21
Im gleichen Sinne kann man den betreffenden Eigenraum ebenso als Hn bezeichnen. Letzteres gilt
auch im Fall von Entartung.
22
Der Raum C 2 (R3 ) bezeichnet alle Funktionen, die auf dem R3 mindestens zweimal stetig differenzierbar sind.
42
suchen wir in der QM nach Lösungen im Raum L2 (R3 ). In diesem Fall wird die Gleichung
Glg. (4.30) nur für einige spezielle Werte von E gelöst, welche reell und diskret23 sind:
E1 , E2 , . . . , En , . . . .
(4.32)
Falls V (x) Singularitäten hat, erlaubt Glg. (4.31) keine Lösungen im Raum C 2 (R3 ). Man
kann Lösungen in den Regionen definieren, welche die Singularitäten ausschließen. Diese
Lösungen haben im Allgemeinen zumindest eine unstetige zweite Ableitung, falls sie zu
b
singulären Punkten fortgesetzt werden. In diesem Fall werden die Eigenfunktionen von H
2
3
mit den verallgemeinerten Lösungen im Raum L (R ) identifiziert und genügen folgenden
Eigenschaften:
1. Außerhalb der Singularitäten von V (x) sind diese Lösungen C 2 (R3 )-Funktionen und
erfüllen Glg. (4.31) im üblichen Sinne.
2. Auf den Oberflächen σi der Singularitäten sind die Normalenableitungen der Lösungen stetig. Wenn wir mit φ+ (x) und ∂φ+ (x)/∂n sowie φ− (x) und ∂φ− (x)/∂n die
Grenzewerte von φ(x) und ∂φ(x)/∂n auf beiden Seiten der Oberflächen σi der Singularitäten bezeichnen, gilt
φ+ (x) = φ− (x),
∂φ− (x)
∂φ+ (x)
=
∂n
∂n
∀x ∈ σi
(4.33)
und in einzelnen singulären Punkten xj gilt
lim φ(x) = endliche Größe.
x→xj
(4.34)
Im allgemeinen Fall, wenn in V (x) mehrere Singularitäten vorliegen24 , wird der Raum
durch die Oberflächen der Diskontinuitäten in verschiedene nicht überlappende Bereiche
geteilt, und Glg. (4.31) wird in jeder dieser Regionen einzeln gelöst. Anschließend wird
Glg. (4.33) genutzt, um die Lösung in einem Bereich eindeutig mit den Lösungen in anderen Regionen zu verbinden. Dann identifiziert die Bedingung, dass die Lösung in L2 (R3 )
liegt, lediglich einige reelle und diskrete Werte von E.
4.4
Entwicklung der Wellenfunktion nach einer Basis von orthonormalen Eigenfunktionen
b mit Eigenvektoren χn , welche einen
Nun betrachten wir einen hermiteschen Operator A
abzählbaren und vollständigen Satz von Basisvektoren des Hilbertraums bilden (Orthonormalbasis). Dies wäre beispielsweise der Fall, wenn wir den Hamiltonoperator eines Systems
mit einem diskreten Spektrum betrachteten. Dann kann man einen beliebigen Vektor χ
innerhalb des Hilbertraums H durch
X
χ(x) =
an s χn s (x),
(4.35)
n,s
23
Diskrete Werte von E gelten für das diskrete Spektrum und die eigentlichen Eigenwerte.
Wir werden dazu einige Beispiele in der Vorlesung sehen, unter anderem das Beispiel des Potentialtopfs oder die Lösung des Wasserstoffatoms.
24
43
darstellen, wobei die Koeffizienten an s durch
an s = hχn s | χi
(4.36)
gegeben sind. Indem wir uns eine gleichartige Zerlegung für einen beliebigen zweiten
Vektor ξ hinzunehmen,
X
ξ(x) =
bn s χn s (x),
(4.37)
n,s
können wir das Skalarprodukt von χ mit ξ bzw. mit sich selbst mittels der Basisvektoren
χn s vereinfachen zu
+
*
X
XX
X
X
bn0 s0 χn0 s0 =
a∗n s bn0 s0 hχn s | χn0 s0 i =
hχ | ξi =
an s χ n s a∗n s bn s ,
|
{z
}
0 0
n,s 0 0
n,s
n,s
n ,s
kχk2 =
*
X
n,s
n ,s
=δn n0 δs s0
(4.38)
+
X
XX
X
an0 s0 χn0 s0 =
a∗n s an0 s0 hχn s | χn0 s0 i =
an s χ n s |an s |2 .
0 0
|
{z
}
0 0
n,s n ,s
n ,s
=δn n0 δs s0
n,s
(4.39)
b auf den Vektor χ:
Darüber hinaus finden wir für die Wirkung des Operators A
X
X
X
b
b
b χn s (x) =
Aχ(x)
=A
an s χn s (x) =
an s A
an s αn χn s (x).
n,s
n,s
(4.40)
n,s
Diese einfachen Ergebnisse müssen modifiziert werden, wenn wir ein System betrachten,
dessen vollständiger Satz orthogonaler Zustände25 ein Kontinuum bildet (bzw. beinhaltet). Wie wir später in diesem Abschnitt sehen werden, ist dies der Fall, wenn wir ein
System mit einem freien Teilchen und dem zugehörigen Hamiltonoperator betrachten. Im
Fall eines Kontinuums benötigen wir eine allgemeinere Art von Eigenfunktionen – sogenannte uneigentliche Eigenfunktionen oder uneigentliche Eigenvektoren. Diese haben eine
unendliche Norm und gehören daher nicht direkt zum Hilbertraum H, aber man kann in
diesem Fall die Konzepte von Orthogonalität und Normierung erweitern. Den Hamiltonoperator auf dem erweiterten Funktionenraum bezeichnen wir ebenfalls mit dem Symbol
b Wir betrachten eine Menge von uneigentlichen Eigenfunktionen φE (x), die, für eine
H.
b welche durch E ∈ R+
Teilmenge σc des kontinuierlichen Spektrums von H,
0 (E ist die
Energie) festgelegt wird, eine kontinuierliche Funktionsschar des Parameters E bilden.
Diese sind verallgemeinerte Lösungen von Glg. (4.31), so dass
E+∆E
Z
dE 0 φE 0 (x)
(4.41)
E
eine L2 (R3 ) Funktion und von Null verschieden ist. φE s (x) und φE 0 s0 (x) seien zwei uneigentliche Eigenfunktionen zu den uneigentlichen Eigenwerten E und E 0 des kontinuierlichen Spektrums (und den Entartungsindizes s und s0 ). Wir definieren dann
hφE s | φE 0 s0 i = δ(E − E 0 ) δs s0
25
(4.42)
Die genaue Beziehung zwischen den Begriffen der Zustände und denen der Wellefunktionen bzw. der
Vektoren wird an späterer Stelle noch detailliert erklärt.
44
und verallgemeinern damit die Orthonormalitätsrelation, vgl. Glg. (4.28). Hierbei ist δ(x)
die Dirac’sche Deltafunktion (siehe Anhang A OR SOMEWHERE ELSE).
An dieser Stelle können wir die vorherige Zerlegung eines Vektors χ im Hilbertraum
L2 (R3 ), vgl. Glg. (4.35), verallgemeinern und auf ein vollständiges Orthonormalsystem
bestehend aus eigentlichen Eigenfunktionen φn s und uneigentlichen Eigenfunktionen φE 1 ,
φE 2 , . . . ausdehnen:
X
XZ
χ(x) =
an s φn s (x) +
dE as (E) φE s (x).
(4.43)
n,s
s σ
cs
Dabei haben wir sowohl Glgn. (4.29) und (4.42) vorausgesetzt, als auch Orthogonalität
zwischen eigentlichen und uneigentlichen Eigenfunktionen26 angenommen, welche dann in
Form von
Z
an s = hφn s | χi = d3 x φ∗ns χ(x) (x),
(4.47)
Z
(4.48)
as (E) = hφE s | χi = d3 x φ∗Es χ(x) (x).
die Berechnung der Koeffizienten an s bzw. Koeffizienten(-funktionen) as (E) gestattet.
Ferner betrachten wir einen zweiten Vektor ξ im Hilbertraum L2 (R3 ), der ebenso in eine
Form
X
XZ
dE bs (E) φE s (x)
(4.49)
ξ(x) =
bn s φn s (x) +
n,s
s σ
cs
zerlegt werden kann. Unter Verwendung von Glgn. (4.29), (4.45) und (4.46) erhalten wir
XZ
X
∗
dE a∗s (E) bs (E)
(4.50)
an s b n s +
hχ | ξi =
s σ
cs
n,s
und
2
kχk = hχ | χi =
X
2
|an s | +
n,s
XZ
dE |as (E)|2 .
Daher ist die Bedingung für die Konvergenz dieser Art von Ausdrücken
X
XZ
2
|an s | +
dE |as (E)|2 < ∞,
n,s
(4.51)
s σ
cs
(4.52)
s σ
cs
26
Dieses Konzept muss entsprechend definiert sein, d.h. für zwei Mengen {φE a (x)} und {φE b (x)} von
uneigentlichen Eigenfunktionen können wir zwei L2 (R3 ) Funktionen ηa (x) und ηb (x) definieren,
Z
Z
ηa (x) =
dE b(E) φE b (x),
(4.44)
dE a(E) φE a (x),
ηb (x) =
σc a
σc b
so dass
hφn s | ηa i = hφn s | ηb i = 0
sowie
Z
dE a∗ (E) b(E)
hηa | ηb i =
σc a ∩σc b
gilt.
45
(4.45)
(4.46)
und man den Begriff der Normierung verallgemeinern:
X
XZ
2
2
kχk =
|an s | +
dE |as (E)|2 = 1.
n,s
(4.53)
s σ
cs
b auf einen solchen Vektor χ erhalten wir
Durch Anwenden des Hamiltonoperators H
X
XZ
b
Hχ(x) =
an s En φn s (x) +
dE as (E)EφE s (x),
(4.54)
n,s
s σ
cs
indem wir für χ die Zerlegung in das vollständige Orthonormalsystem der Energieeigenfunktionen (Energiebasis), vgl. Glg. (4.43), sowie die Beziehungen
E
D
E D
D
E
b
b
b
φn s Hχ = Hφn s χ = En hφn s | χi ,
φE s Hχ = E hφE s | χi .
(4.55)
b
verwenden. Insbesondere ergibt sich dann bei Bildung des Skalarprodukts von χ und Hχ
b
unter Verwendung der Energiebasis für die Zerlegung von sowohl χ als auch Hχ
Z
E X
D X
b
=
|an s |2 En +
dE |as (E)|2 E,
(4.56)
χ Hχ
n,s
s σ
cs
indem man die entsprechenden Orthonormalitätsrelationen der eigentlichen Eigenvektoren
φn s und uneigentlichen Eigenvektoren φE s , vgl. Glgn. (4.29), (4.45) und (4.46) benutzt.
Im Verlauf der Vorlesung werden wir viele und unterschiedliche Beispiele und Realisierungen dieser Formeln sehen. Wir wollen mit einem einfachen Beispiel zum kontinuierlichen
Spektrum und den uneigentlichen Eigenfunktionen beginnen und betrachten dabei im
Raum L2 (R) den Ortsoperator x
b, der durch die Beziehung
x
bχ(x) = xχ(x)
(4.57)
definiert wird. Die Eigenwertgleichung lautet
x
bχξ (x) = ξχξ (x)
(4.58)
oder nach Kombination von Glgn. (4.57) und (4.58)
(x − ξ)χξ (x) = 0.
(4.59)
χξ (x) = δ(x − ξ),
(4.60)
Eine zugehörige Lösung ist
wie man leicht sieht, da Glg. (4.59) offenkundig ein spezielles Beispiel der allgemeinen
Eigenschaft der Delta-Distribution,
f (x)δ(x − ξ) = f (ξ)δ(x − ξ),
(4.61)
darstellt. In diesem Fall kann χξ (x) als uneigentliche Eigenfunktion von x
b interpretiert
werden und wir sehen, dass x
b ein rein kontinuierliches Spektrum entlang der gesamten
reellen Achse hat. Dann erhalten wir für jede Funktion χ(x) in L2 (R) die Identität
Z+∞
χ(x) =
dξ χ(ξ)δ(x − ξ),
−∞
46
(4.62)
was man als eine Entwicklung von χ nach dem vollständigen Orthonormalsystem χξ betrachten kann. Im Einklang mit dieser Interpretation können wir
Z+∞
hχξ0 | χξ i =
dx δ(x − ξ 0 )δ(x − ξ) = δ(ξ 0 − ξ)
(4.63)
−∞
schreiben, so dass die χξ ein vollständiges Orthonormalsystem bilden. Darüber hinaus
kann man χ als
Z+∞
χ(x) =
dξ c(ξ)χξ (x)
(4.64)
−∞
schreiben, so dass man die Entwicklungskoeffizienten c(ξ) als
Z+∞
c(ξ) = hχξ | χi =
dx δ(x − ξ)χ(x) = χ(ξ),
(4.65)
−∞
identifiziert. Schließlich ist – gemäß der vorangegangen Diskussion – die Wahrscheinlichkeit das Teilchen zur Zeit t im Intervall (ξ, ξ + ∆ξ) zu messen durch
P (ξ < x < ξ + ∆ξ, t) = |ψ(ξ, t)|2 ∆ξ = |χ(ξ)|2 ∆ξ
(4.66)
gegeben.
4.5
Allgemeine Lösung der Schrödingergleichung
Wir konstruieren nun für den Fall eines zeitunabhängigen Potentials die allgemeine Lösung
der zeitabhängigen Schrödingergleichung, vgl. Glg. (4.4), welche die Anfangsbedingung
ψ(x, 0) = χ0 (x) erfüllt. Wir schreiben die zeitabhängige Schrödingergleichung als
~2
∂ψ(x, t)
∆x + V (x) ψ(x, t) = i~
(4.67)
−
2m
∂t
und suchen nach einer partikulären Lösung der Form (multiplikativer Separationsansatz)
ψ(x, t) = φ(x)ξ(t),
(4.68)
die das Produkt zweier Faktoren ist, deren erster nur vom Ort x und deren zweiter nur
von der Zeit t abhängig ist. Indem man den Separationsansatz einsetzt, erhält man
1
~2
1 ∂ξ(t)
−
∆x + V (x) φ(x) = i~
(4.69)
φ(x)
2m
ξ(t) ∂t
und erkennt direkt, dass beide Seiten der Gleichung unabhängig sind (d.h. entweder nur
von x oder nur von t abhängen). Deren Gleichheit kann nur gelten, falls beide konstant
sind und denselben Wert annehmen, den wir mit E bezeichnen wollen. Dann spaltet sich
die Gleichung in zwei verschiedene Gleichungen auf:
i~
47
∂ξ(t)
=Eξ(t),
∂t
(4.70)
~2
−
∆x + V (x) φ(x) =Eφ(x),
2m
(4.71)
wobei E a priori beliebig ist. Glg. (4.70) kann direkt integriert werden und wir erhalten
i
ξ(t) = A exp [− Et].
~
(4.72)
Was Glg. (4.71) betrifft, handelt es sich um eine Eigenwertgleichung vom Typ, der im
vorigen Abschnitt besprochen wurde. Wenn wir mit En die eigentlichen Eigenwerte von
b bezeichnen und mit φn s (x) die zugehörigen eigentlichen Eigenfunktionen, von denen wir
H
annehmen, dass sie gemäß Glg. (4.29) normiert sind, dann ist eine Klasse von Lösungen
durch
i
(4.73)
ψn s (x, t) = φn s (x) exp [− En t]
~
gegeben. Jede dieser Lösungen entspricht einem scharf definierten Wert der Frequenz
νn = |En | /h. Diese Lösungen sind analog zu den stationären Wellen in einem Medium
innerhalb eines Hohlraums und werden daher auch stationäre Lösungen oder stationäre
Zustände genannt. Diese haben die bemerkenswerte Eigenschaft, dass sie eine zeitunabhängige Wahrscheinlichkeitsverteilung des Ortes ergeben. Tatsächlich findet man
|ψn s (x, t)|2 = |φn s (x)|2 .
(4.74)
In diesem Rahmen bezeichnet man Glg. (4.71) als Schrödingergleichung für stationäre
Zustände. Unter formalen Gesichtspunkten gibt es eine zweite Klasse von Lösungen, welche
durch
i
(4.75)
ψE s (x, t) = φE s (x) exp [− Et]
~
b gehört und φE s (x) eine
gegeben sind, wobei E nun zum kontinuierlichen Spektrum von H
uneigentliche Eigenfunktion ist. Natürlich gehört φE s (x) nicht zu L2 (R3 ) und kann daher
für sich allein keinerlei physikalische Bedeutung haben. Nichtsdestotrotz suggeriert die
Linearität von Glg. (4.67), dass man allgemeinere Lösungen vom Typ
XZ
X
cn s ψn s (x, t) +
dEcs (E)ψE s (x, t)
ψ(x, t) =
s σ
cs
n,s
=
X
n,s
X
i
cn s φn s (x) exp [− En t] +
~
s
Z
σc s
i
dEcs (E)φE s (x) exp [− Et]
~
(4.76)
in Betracht zieht. Falls Glg. (4.76) eine Lösung von Glg. (4.67) ist, muss diese Lösung zu
L2 (R3 ) gehören und
X
XZ
2 2
dE |cs (E)|2 E 2 < ∞
(4.77)
|cn s | En +
n,s
s σ
cs
b
erfüllen. Wenn Glg. (4.77) gilt, können wir für Hψ(x,
t) mittels Glg. (4.54)
X
XZ
i
i
b
Hψ(x,
t) =
cn s En φn s (x) exp [− En t] +
dEcs (E)EφE s (x) exp [− Et] (4.78)
~
~
n,s
s
σc s
48
2
b
schreiben27 und Hψ(x,
t) ist gleich der linken Seite von Glg. (4.77). Dann können wir
ebenso Glg. (4.76) nach der Zeit ableiten28 , um
XZ
∂ψ(x, t) X
i
i
i~
=
cn s En φn s (x) exp [− En t] +
dEcs (E)EφE s (x) exp [− Et]
∂t
~
~
n,s
s
σc s
(4.79)
zu erhalten. Wenn wir nun Glgn. (4.78) und (4.79) vergleichen, zeigen wir, dass unter
der Bedingung Glg. (4.77) ψ(x, t) eine Lösung von Glg. (4.67) ist. Ein wesentlicher Fakt
ist, dass es immer möglich ist, die Koeffizienten(-funktionen) cn s und cs (E) in Glg. (4.76)
derart zu wählen, dass eine Anfangsbedingung
ψ(x, 0) = χ0 (x)
(4.80)
für beliebiges χ0 erfüllt ist. Indem wir Glg. (4.76) in Glg. (4.80) einsetzen, erhalten wir
X
XZ
cn s φn s (x) +
dEcs (E)φE s (x) = χ0 (x),
(4.81)
n,s
s σ
cs
welches immer eine Lösung hat, da der gemeinsame Satz von eigentlichen und uneigentb eine Orthonormalbasis (vollständiges Orthonormalsystem)
lichen Eigenfunktionen von H
ist. Aufgrund von Glgn. (4.47) und (4.48) finden wir
cn s = hφn s | χ0 i ,
cs (E) = hφE s | χ0 i .
(4.82)
(4.83)
Die Koeffizienten cn s und cs (E) spielen eine Rolle, die analog zu jener der unbestimmten
Konstanten im allgemeinen Integral einer Differentialgleichung ist, und aus diesem Grund
heißt Glg. (4.76) allgemeine Lösung der Schrödingergleichung.
4.6
Physikalische Interpretation der Schrödingergleichung
Wir wollen nun die im vorangegangenen Abschnitt konstruierte allgemeine Lösung der
Schrödingergleichung,
XZ
X
i
i
dEcs (E)φE s (x) exp [− Et]
ψ(x, t) =
cn s φn s (x) exp [− En t] +
(4.84)
~
~
s
n,s
σc s
betrachten und annehmen, φn s (x) und φE s (x) seien orthonormiert gemäß
hφn0 s0 | φn s i = δs0 s δn0 n ,
hφn0 s0 | φE s i = 0,
hφE 0 s0 | φE s i = δs0 s δ(E 0 − E).
27
(4.85)
b in die Summe bzw. in das Integral hineinziehen.
[. . . ], beispielsweise, indem wir H
Dieser Schritt ist legitim sofern die rechte Seite von Glg. (4.78) in t gleichförmig konvergiert, und
dies is klar, da die Konvergenzbedingung für diesen Ausdruck erneut aus Glg. (4.77) folgt, welche nicht
von der Zeit abhängt.
28
49
Wir bemerken, dass ψ(x, t) in Glg. (4.84) eine Superposition von verschiededenen diskreten monochromatischen Komponenten mit Frequenzen νn = |En | /(2π~) = |En | /h
und von verschiedenen kontinuierlichen monochromatischen Komponenten mit Frequenzen ν = |E| /(2π~) = |E| /h ist. Das Auftreten von einem diskreten Frequenzspektrum
zusammen mit einem kontinuierlichen Frequenzspektrum ist die wesentliche Neuerung gegenüber den Phänomenen bei der Ausbreitung von Wellen in einem dispersiven Medium
von unendlicher Ausdehnung. Um den Ursprung dieser Neuerung und die Bedeutung der
Terme in Glg. (4.84) zu verstehen, nehmen wir an, dass das Potential V (x) für |x| → ∞
zu Null abfällt und ein einfaches Verhalten zeigt wie in Abb. (D.21).
Unter dieser Annahme ist die Phasengeschwindigkeit für E < 0, vgl. Glg. (3.2), durch
vph (x, ν) = p
|E|
2m(E − V (x))
(4.86)
gegeben. Daher sieht man, dass die Phasengeschwindigkeit vph (x, ν) innerhalb des Raumbereichs Λ(E) = {x |V (x) ≤ E} rein reell und außerhalb dieser Region rein imaginär
ist. In der Theorie der Wellenausbreitung entspricht eine komplexe Phasengeschwindigkeit einem absorbierenden Medium. Somit liegt in diesem Fall eine in einem begrenzten
Raumbereich “eingesperrte” Welle vor und daher treten die diskreten stationären Frequenzen auf. Um genau zu sein, divergieren die Lösungen von Glg. (4.71) mit E < 0 für
|x| → ∞ sehr stark (typischerweise exponentiell). Lediglich für einen Satz von speziellen
Werten E1 , E2 , . . . für E zwischen −V0 und 0 gibt es Lösungen φ1 (x), φ2 (x), . . . die sehr
schnell außerhalb von Λ(E) zu Null abfallen. Diese Lösungen entsprechen den eigentlib und sind mit dem diskreten Anteil des Spektrums verknüpft.
chen Eigenfunktionen von H
Für E > 0 ist die Phasengeschwindigkeit vph (x, ν) immer reell und daher gibt es keine
“Einschränkung” der Lösung auf einen bestimmten Raumbereich. Diese Lösungen von
Glg. (4.71) sind endlich im gesamten Raum für beliebige Werte von E. Sie entsprechen
den uneigentlichen Eigenfunktionen und sind mit dem kontinuierlichen Anteil der Entwicklung von Glg. (4.84) verbunden. Insbesondere beinhaltet das kontinuierliche Spektrum die
gesamte positive relle Achse σc = (0, +∞).
Wir wollen nun den Fall betrachten, dass ψ(x, t) aus lediglich einer einzigen diskreten
Komponente besteht, z.B. wenn ψ(x, t) von der Form
i
ψ(x, t) = ψn s (x, t) = φn s (x) exp [− En t]
~
(4.87)
ist. Entsprechend der statistischen Interpretation ist
|ψn s (x, t)|2 d3 x = |φn s (x)|2 d3 x
(4.88)
die Wahrscheinlichkeit, das Teilchen im Volumenelement d3 x zu finden. Dann implizieren
die gerade besprochenen Eigenschaften von φn s (x) den Fakt, dass die Wahrscheinlichkeit,
das Teilchen außerhalb des Raumbereichs Λ(En ) zu finden, verschwindend gering ist. Die
Wellenfunktion von Glg. (4.87) beschreibt eine Situation in welcher das Teilchen auf eine
Region, in der das Potential V (x) deutlich von Null verschieden ist, beschränkt ist: sie
beschreibt einen Bindungszustand des Teilchens. Dann wird mit Bezugnahme auf die
allgemeinen Ideen von de Broglie die Energie −En = hνn als die Bindungsenergie des
Teilchens interpretiert. In Übereinstimmung mit der klassischen Mechanik ist Λ(En ) der
50
Raumbereich, in welchem das Teilchen eingesperrt ist, und die Werte E1 , E2 , . . . sind die
Energieniveaus des betrachteten Potentials.
Wir wollen nun eine Wellenfunktion der Form
∞
XZ
i
0
ψ (x, t) =
dEcs (E)φE s (x) exp [− Et]
~
s
(4.89)
0
betrachten, die durch die Superposition mehrerer kontinuierlicher Komponenten gebildet
wird, und wir wollen annehmen, dass die Koeffizienten cs (E) nur in einer gewissen Umgebung eines Wertes E 0 wesentlich von Null verschieden sind. Dann stellt Glg. (4.89) ein
Wellenpaket mit mittlerer Frequenz ν 0 = E 0 /h dar. Wenn das Potential
p V (x) ausreichend
langsam
als
Funktion
von
x
im
Vergleich
zur
Wellenlänge
λ
=
h/
2m(hν − V (x)) =
p
h/ 2m(E − V (x)) variiert, verhält sich das Wellenpaket wie ein klassisches Teilchen der
Energie E 0 . Wir können dann generell sagen, dass das Wellenpaket ein Teilchen der Energie E 0 beschreibt.
Wenn man den Ausdruck |ψ 0 (x, t)|2 für das in Glg. (4.89) definierte Wellenpaket auswertet, ist dieser ebenfalls für eine bestimmte Wahl der Zeit t nur in einem bestimmten
Raumbereich deutlich von Null verschieden, da ψ 0 (x, t) ebenso eine L2 (R3 ) Funktion ist.
Im Unterschied zum Ergebnis für |ψn s (x, t)|2 jedoch ändert sich der Raumbereich mit
von Null verschiedenem |ψ 0 (x, t)|2 mit der Zeit t und bewegt sich mit der Zeit weg von
der Region in der V (x) von Null verschieden ist. Daher werden Lösungen des Typs von
Glg. (4.89) typischerweise zur Beschreibung von Streuprozessen verwendet (Streulösungen). Wir merken an, dass im Fall eines Coulomb-Potentials die Lösungen des Typs von
Glg. (4.87) elliptischen Bahnen der Klassischen Mechanik und die Lösungen des Typs von
Glg. (4.89) hyperbolischen Bahnen der Klassischen Mechanik entsprechen. Wir bemerken
darüber hinaus, dass die Tatsache, dass für Bindungszustände die Energie nur einige diskrete Werte annehmen kann, während sie sich für Streulösungen des Typs von Glg. (4.89)
kontinuierlich verändern kann, eine einfache physikalische Bedeutung hat. Im zweiten Fall
nämlich kann die Energie durch den Experimentator gewählt werden.
Wir wollen nun noch die Bedeutung von Glg. (4.89) für jenen Fall besprechen, dass die
Koeffizienten cs (E) in einem beliebig großen Intervall von Null verschieden sind. Als ein
konkretes Beispiel betrachten wir den Fall eines geladenen Teilchens in einer Wilson’schen
Blasenkammer. Die Energie des Teilchens kann mittels der Krümmung seiner Spur innerhalb eines konstanten, homogenen Magnetfelds B gemessen werden. Nehmen wir an, B
sei orthogonal zur anfänglichen Richtung des Teilchens. Dann gilt gemäß der Klassischen
Mechanik, dass das Teilchen eine Kreisbahn beschreibt, deren Radius r sich aus der Beziehung
v
mv 2
=e B
(4.90)
r
c
ergibt. Dann erhält man die Energie des Teilchens29 aus dem Krümmungsradius als
e2
E=
B 2 r2 .
2
2mc
(4.91)
Im Fall, dass ein Feld (wie hier das B Feld) mit makroskopischen Mitteln erzeugt wird,
werden die Bedingungen für die Anwendbarkeit der Klassischen Mechanik selbst für sehr
29
Glg. (4.91) gilt offensichtlich nur für den nicht-relativistischen Grenzfall.
51
kleine Energien (große Wellenlängen) bestätigt. Dann beschreibt ein Wellenpaket vom
Typ, den wir beschrieben haben, ein Teilchen der Energie E 0 auf einer Trajektorie, welche identisch zu jener eines klassischen Teilchens mit Energie E 0 ist, und der Radius der
Trajektorie wird nach wie vor durch Glg. (4.91) (hierbei ist selbstverständlich E = E 0 )
beschrieben. Daher kann die Krümmung der Spur in der Wilson’schen Kammer vorhergesagt werden, falls die dem Teilchen zugeordnete Wellenfunktion ein Wellenpaket ist.
Wir wollen nun diskutieren, welche Ergebnisse für die allgemeinere Lösung möglich sind.
Wir unterteilen das Intervall (0, +∞) in hinreichend kleine Teilintervalle (E j , E j+1 ). Dann
können wir die Wellenfunktion als eine Superposition von Teilwellenfunktion
X
ψ 0 (x, t) =
ψ j (x, t)
(4.92)
j
schreiben, wobei die Teilwellenfunktionen auf jeweils ein Teilintervall beschränkt sind,
E j+1
X Z
i
dEcs (E)φE s (x) exp [− Et].
ψ j (x, t) =
~
s
(4.93)
Ej
Wir betrachten alle Trajektorien, die für eine gegebene anfängliche Bewegungsrichtung
des Teilchens den Energien . . . , E j , E j+1 , . . . entsprechen, vgl. Abb. (D.22). Die durch
das Magnetfeld B erfolgende Projektion dieser Trajektorien auf Kreisbahnen teilt die
Kammer in viele Bereiche ω j auf, welche den Teilintervallen E j < E < E j+1 entsprechen.
Dann ordnen wir einem Teilchen die Energie zwischen E j und E j+1 zu, wenn die von ihm
hinterlassene Spur sich im Bereich ωj befindet. Die Wahrscheinlichkeit, das Teilchen mit
der Energie in einem solchen Intervall ω j zu beobachten, ist
Z
j
j+1
P (E < E < E ) = d3 x |ψ(x, t)|2 .
(4.94)
ωj
Andererseits bewegt sich jede der Wellengruppen ψ j (x, t) auf einer anderen Trajektorie,
und wird daher im Bereich ω j bleiben und nach kurzer Zeit nicht mehr mit den anderen
Gruppen überlagert sein. Dann können wir
P (E j < E < E j+1 ) =
Z
2 X
d3 x ψ j (x, t) =
s
E
Zj+1
dE |cs (E)|2
(4.95)
Ej
schreiben. Falls wir eine Wellenfunktion der allgemeinen Form betrachten, vgl. Glg. (4.84),
bemerken wir dass
+∞
X
n,s
2
|cn s | +
XZ
s
2
Z
dE |cs (E)| =
d3 x |ψ(x, t)|2 = 1.
(4.96)
0
Dann können wir auf Grundlage der Diskussion, die uns zu Glg. (4.95) geführt hat, schlussfolgern, dass wir den Ausdruck
X
P (E < E < E + ∆E) =
|cs (E|2 ∆E
(4.97)
s
52
als die Wahrscheinlichkeit der Messung einer Energie des Teilchens im Intervall (E, E +
∆E) des kontinuierlichen Spektrums und den Ausdruck
X
P (E = En ) =
|cn s |2
(4.98)
s
als die Wahrscheinlichkeit für eine Messung der Energie des Teilchens beim Wert En
aus dem diskreten Spektrum interpretieren können. Wir bemerken, dass die Ausdrücke
in Glgn. (4.97) und (4.98) unabhängig von der Zeit sind, was mit der Tatsache in der
Klassischen Mechanik übereinstimmt, dass es sich bei der Energie um eine Konstante
der Bewegung handelt. Wir sehen, dass die Glg. (4.98) eine Bedeutung hat, die nicht so
offensichtlich ist wie jene von Glg. (4.97). Wie wir sehen werden wird Glg. (4.98) bei Betrachtungen von Absorption und Emission von Strahlung in einem Atom genutzt sowie
in allen Prozessen, in denen Anregung und Abregung von Atomen, Molekülen und Kernen eine Rolle spielen. Die Interpretation der stationären Zustände und Wellenpakete als
Zustände mit gegebener Energie muss als die Definition dessen, was die Existenz eines
Teilchens mit einer gegebenen Energie in der QM bedeutet, verstanden werden. Die klassische Definition der Energie als Summe von kinetischer und potentieller Energie verliert
ihre Bedeutung aufgrund der Heisenberg’schen Unschärferelation, da man den Teilchen
keinen definitiven Ort oder Impuls zuweisen kann.
Wir erinnern uns, dass in der Klassischen Mechanik zwei Eigenschaften das Konzept der
Energie besonders nützlich machen, nämlich die Energieerhaltung und jene Tatsache, dass
für ein System von Teilchen, die ausreichend weit voneinander entfernt sind, die Gesamtenergie gleich der Summe der Einzelenergien der Teilchen ist. Beide Eigenschaften bleiben
in der QM bestehen. Daher kann in einem Streuprozess die Energie in der QM so wie
in der Klassischen Mechanik behandelt werden: die Summe der Energien der Teilchen des
Systems vor der Streuung muss gleich der Summe der Energien der Teilchen des Systems
nach der Streuung sein, und dies ist unabhängig davon, welche Phänomene während der
Streuung stattfinden (An- oder Abregung von Atomen, Kernreaktionen, Erzeugung und
Vernichtung von Teilchen). Insbesondere bedeutet dies, dass, falls ein Elektron innerhalb
eines Atoms sich in einem Bindungszustand mit Energie En befindet, und dieses später
einen Übergang zu einem Zustand Em unter Emission eines Lichtquants vollzieht, die
Energie des anfänglichen und finalen Zustands gleich sein müssen und man
En = Em + hν
(4.99)
erhält, und daher die Frequenz des emittierten Lichts durch
ν=
En − Em
h
(4.100)
b mit den von
gegeben sein muss. Daher sehen wir, dass die eigentlichen Eigenwerte von H
Bohr eingeführten Energieniveaus identifiziert werden müssen.
Literaturempfehlung:
F. Schwabl
A. Messiah
S. Weinberg
Quantenmechanik, Bd. 1
Quantum Mechanics, Volume 1
Lectures on Quantum Mechanics
53
Kapitel 2.8 – 2.10
Section 5
Section 3.1 – 3.3
5
Allgemeine Prinzipien der Quantenmechanik und
Formalismen
In den vorherigen Kapiteln wurde die Wellenmechanik eines einzelnen Teilchens eingeführt. Beginnend mit der Schrödingergleichung,
∂ψ(x, t)
~2
∆x + V (x) ψ(x, t) = i~
,
(5.1)
−
2m
∂t
haben wir eine statistische Interpretation von ψ(x, t) gefunden. Daher haben wir Lösungen
von Glg. (5.1) im Hilbertaum L2 (R3 ) betrachtet, welche die Normierungsbedigung
Z
d3 x |ψ(x, t)|2 = 1
(5.2)
erfüllen, so dass die Wahrscheinlichkeit zur Zeit t innerhalb des Volumenelements d3 x das
Teilchen zu finden durch |ψ(x, t)|2 d3 x gegeben ist. Wir haben Glg. (5.1) in Operatorschreibweise geschrieben,
∂ψ(x, t)
b
(5.3)
Hψ(x,
t) = i~
∂t
und wir haben beobachtet, dass eine Lösung, welche die Anfangsbedingung
ψ(x, 0) = ψ0 (x)
erfüllt, immer in Form von
X
XZ
i
i
dEcs (E)φE s (x) exp [− Et]
ψ(x, t) =
cn s φn s (x) exp [− En t] +
~
~
n,s
s
(5.4)
(5.5)
σc s
geschrieben werden kann, wobei die Koeffizienten cn s und cs (E) durch
cn s = hφn s | ψ(t)i
und cs (E) = hφE s | ψ(t)i
(5.6)
gegeben sind und φn s (x) und φE s (x) die eigentlichen und uneigentlichen Eigenfunktionen des Hamiltonoperators sind. Wir haben die Mengen der diskreten Eigenwerte
b und das kontinuierliche Spektrum σc (H)
b mit den möglichen Werten der
{En } = σd (H)
Energie des Teilchens identifiziert und die Ausdrücke |cns |2 und |cs (E)|2 ∆E für die Wahrscheinlichkeiten des Wertes En bzw. eines Wertes im Intervall (E, E+∆E) bei der Messung
der Energie erhalten.
Bevor wir zu Anwendungen des Formalismus der QM weitergehen, wollen wir in diesem Kapitel eine allgemeinere Formulierung der QM präsentieren, die sich auf beliebige
Systeme anwenden lässt und die auf einer Reihe von Postulaten basiert.
5.1
Allgemeine Postulate der Quantenmechanik
Zunächst stellen wir fest, dass die offensichtlichste Verallgemeinerung der Schrödingergleichung für den Fall von N Teilchen durch
!
N
2
X
~
∂ψ(x1 , . . . , xN , t)
∆xj + V (x1 , . . . , xN ) ψ(x1 , . . . , xN , t) = i~
(5.7)
−
2mj
∂t
j=1
54
gegeben ist, wobei der Laplace-Operator als
∆xj =
∂2
∂2
∂2
+
+
∂x2j
∂yj2 ∂zj2
(5.8)
definiert ist und V (x1 , . . . , xN ) das Potential ist, welches die Kräfte beschreibt, die auf die
N Teilchen wirken. Wir könnne für Glg. (5.7) die Überlegungen zu Glg. (5.1) erweitern.
Insbesondere können wir fordern, dass die Wellenfunktionen ψ(x1 , . . . , xn , t) für beliebige
Werte von t zu L2 (R3N ) gehören und die Normierungsbedingung
Z
d3 x1 . . . d3 xN |ψ(x1 , . . . , xN , t)|2 = 1
(5.9)
erfüllen. Wir können daher dem Ausdruck
|ψ(x1 , . . . , xN , t)|2 d3 x1 . . . d3 xN
(5.10)
die Bedeutung der Wahrscheinlichkeit geben, zur Zeit t das Teilchen 1 im Volumenelement
d3 x1 , das Teilchen 2 im Volumenelement d3 x2 , . . . sowie das Teilchen N im Volumenelement d3 xN zu finden.
Im Allgemeneinen sind daher folgende Postulate gültig:
• Postulat 1:
Jedem physikalischen System C ist ein entsprechender Hilbertraum HC zugeordnet. Jeder mögliche Zustand des Systems C kann durch ein Element ψ von HC
dargestellt werden, welches eine Norm kψk = 1 hat. Solch eine Element wird als
Zustandsvektor bezeichnet und enthält sämtliche Information über das System.
Die Zeitentwicklung des Zustandsvektors wird durch die Gleichung
i~
dψ(t)
b
= Hψ(t)
dt
(5.11)
b ein hermitescher Operator ist.
beschrieben, wobei der Hamiltonoperator H
Glg. (5.11) wird auch hier als Schrödingergleichung bezeichnet und spielt in der allgemeinen Quantenmechanik die im Spezialfall der Wellenmechanik von Glg. (3.13) eingenomme
Rolle. Das Wesen der von ψ(t) beinhalteten Information sowie die Art und Weise, wie diese
darin enthalten ist, wird im zweiten Postulat definiert.
Gemäß der statistischen Interpretation der Quantenmechanik können wir im Bezug auf die
Entwicklung des mikrophysikalischen Systems nur über solche Größen sprechen, für die ein
wohldefinierter Messprozess existiert. Unser zweites Postulat muss die Wahrscheinlichkeit
berücksichtigen, dass man in einem solchen Messprozess zu irgendeinem Zeitpunkt einen
bestimmten Wert aus der Klasse der möglichen Ergebnisse erhält. Aus diesem Grund
werden diese Größen als Observable30 bezeichnet.
30
Die Observablen sind die zu den klassischen dynamischen Variablen analogen Größen. Größen, die
feststehenden Eigenschaften des Systems entsprechen, wie etwa die Masse oder Ladung eines Teilchens,
b
fallen nicht in diese Kategorie. Sie treten stattdessen in der spezifischen Form des Hamiltonoperators H
auf.
55
• Postulat 2a:
b auf dem Hilbertraum
a) Jeder Observable A ist ein hermitescher Operator A
des jeweiligen physikalischen Systems HC zugeordnet.
b und das kontinuierliche Spektrum σc (A)
b bilden
b) Das diskrete Spektrum σd (A)
zusammen die Menge der möglichen Messwerte der Observable A.
c) Unter Verwendung der Eigenwertgleichungen
b r u =αr χr u ,
Aχ
b α u =αχα u
Aχ
(5.12)
(5.13)
(wobei wir mit χr u und χα u die eigentlichen und uneigentlichen orthonormierten Eigenvektoren bezeichnen) und der Entwicklung des Zustandsvekb in der Form
tors ψ(x, t) nach den betreffenden Eigenfunktionen von A
X
X Z
ψ(t) =
cru (t)χr u +
dα cu (α, t)χα u
(5.14)
r,u
u
b
σc (A)
ergibt sich die Wahrscheinlichkeit, bei Messung der Observable A zur Zeit t
b oder einen Wert im Intervall (α, α + dα) ∈ σc (A)
b zu
den Wert αr ∈ σd (A)
messen, als
X
X
|hχr u | ψ(t)i|2 ,
(5.15)
|cru (t)|2 =
P (A = αr , t) =
u
u
P (α ≤ A ≤ α + dα, t) =
X
2
|cu (α, t)| dα =
X
|hχα u | ψ(t)i|2 dα. (5.16)
u
u
Das zweite Postulat (2a) ist für beliebige Observable31 eine Verallgemeinerung dessen,
was bereits im vorigen Kapitel für die Energie festgestellt wurde. Wir bemerken, dass die
Normierungsbedingung die Form
X
X Z
2
|cru (t)| +
dα |cu (α, t)|2 = kψ(t)k2 = 1
(5.17)
r,u
u
b
σc (A)
annimmt, und, dass, falls zu einer bestimmten Zeit t0 der Zustandsvektor des Systems
b zum Eigenwert αr übereinstimmt, z.B. falls
mit einem eigentlichen Eigenvektor von A
X
ψ(t0 ) =
cu χ r u
(5.18)
u
die Anfangsbedingung zur Zeit t0 ist, dann ist die Wahrscheinlichkeit bei Messung der
Observable A durch
P (A = αr , t0 ) = 1
(5.19)
31
Der Begriff Observable wird auch oft zur Bezeichnung des zugehörigen Operators verwendet. Man
b zur Observable A auf verschiedenen physollte sich dabei trotzdem bewusst sein, dass der Operator A
sikalischen Systemen unterschiedlich definiert ist. Ein offensichtliches Beispiel ist die Gesamtenergie des
Systems, gemessen durch den Hamiltonoperator, der offensichtlich von der Anzahl der Teilchen abhängt.
56
gegeben, d.h. in diesem Fall ergibt eine Messung von A zur Zeit t0 mit Sicherheit das
b auch als EigenErgebnis A = αr . Aus diesem Grund werden die Eigenvektoren von A
b bezeichnet. Das zweite Postulat (2a) bezieht sich lediglich auf
zustände (des Operators A)
eine Observable. Es ist daher notwendig, das zweite Postulat (2a) auf simultane Messung
von zwei oder mehr Observablen zu verallgemeinern.
Wir haben in Kapitel 3 besprochen, dass eine Einschränkung bei der gleichzeitigen Messung von Ort und Impuls (Heisenbergsche Unschärferelation) besteht. Im Allgemeinen ist
es nicht möglich, gleichzeitig zwei beliebige Observablen zu messen. Wir unterscheiden
zwischen kompatiblen (gleichzeitig scharf messbar) und inkompatiblen (nicht gleichzeitig
scharf messbar) Observablen. Im ersten Fall ist es möglich, das Ergebnis eines bestimmten Experiments mittels Zuweisung von wohldefinierten Werten für beide Observablen zu
beschreiben. Im zweiten Fall ist dies nicht möglich. Wir wollen nun zwei kompatible Observablen A und B betrachten. Dann gilt gemäß des zweiten Postulats (2a), dass mögliche
Ergebnisse der simultanen Messung von A und B in der Menge der Eigenwerte liegen,
A = αr ,
B = βs .
(5.20)
b und B
b ein gemeinsames vollständiges
Nun wollen wir annehmen, dass die Operatoren A
Orthonormalsystem von Eigenfunktionen (orthonormale Eigenbasis, ONEB) haben, z.B.,
dass eine ONEB χr s u existiert, so dass
b r s u = αr χr s u ,
Aχ
b r s u = βs χr s u ,
Bχ
(5.21)
wobei u den Entartungsindex darstellt. Wir wollen nur rein diskrete Spektren betrachten
(der Einfachheit halber, die Verallgemeinerung auf kontinuierliche Spektren ist offensichtlich). In diesem Fall kann man
X
cr s u (t)χr s u
(5.22)
ψ(t) =
r,s,u
schreiben und annehmen, dass die Wahrscheinlichkeit, bei Messung der Observable A und
B die Eigenwerte αr und βs zu beobachten, durch den Ausdruck
X
P (A = αr , B = βs , t) =
|hχr s u | ψ(t)i|2
(5.23)
u
gegeben ist. Daher können wir das zweite Postulat (2a) auf folgende Art und Weise verallgemeinern:
• Postulat 2b:
b
Zwei oder mehr kompatible Observable A, B, . . . werden durch Operatoren A,
b
B, . . . dargestellt, die ein gemeinsames vollständiges Orthonormalsystem von
Eigenvektoren besitzen. Die Wahrscheinlichkeit bei der gleichzeitigen Messung
der Observable A und B die Ergebnisse A = αr und B = βs zu erhalten, ist
durch Glg. (5.23) (bzw. die offensichtliche Verallgemeinerung auf mehr als zwei
Variablen) gegeben.
Wir weisen auf die Beziehungen
57
P (A = αr , t) =
X
P (A = αr , B = βs , t) =
X
s
P (A = βs , t) =
|cr s u (t)|2 ,
(5.24)
s,u
X
P (A = αr , B = βs , t) =
r
X
|cr s u (t)|2
(5.25)
r,u
hin. Unter Bezugnahme auf Glg. (5.21) weisen wir darauf hin, dass zwei Vektoren der
Form
X
X
as u χr s u bzw.
br u χ r s u
(5.26)
s,u
r,u
b bzw. B
b sind. Dann drückt Glg. (5.21) den Fakt
Eigenvektoren zu nur dem Operator A
b so zu wählen, dass diese ebenfalls eine ONEB
aus, dass es möglich ist, eine ONEB von A
b ist (die umgekehrte Schlussrichtung gilt natürlich auch), aber nicht, dass jeder
von B
b automatisch auch ein Eigenvektor von B
b ist. Letzteres könnte aufgrund
Eigenvektor von A
b einfach sind.
von Glg. (5.21) nur für den Fall zutreffen, dass alle Eigenwerte von A
Aus praktischen Gründen ist es von wesentlicher Bedeutung, eine Bedingung zu finden,
welche die Beurteilung erlaubt, ob die Observablen A und B kompatibel sind oder nicht,
ohne dass die explizite Konstruktion der gemeinsamen ONEB erforderlich ist. Zu diesem
Zweck betrachten wir zunächst
bBχ
b r s u = α r βs χ r s u ,
A
b Aχ
b r s u = βs αr χr s u ,
B
(5.27)
und schließen daraus, dass
bBχ
b rsu = B
b Aχ
b rsu
A
(5.28)
gilt. Da das System χr s u gemäß der Hypothese in Glg. (5.28) vollständig ist, folgt
bB
b=B
bA
b
A
(5.29)
b B]
b = 0,
[A,
(5.30)
b B]
b =A
bB
b−B
bA
b
[A,
(5.31)
bzw.
wobei wir den Kommutator
definiert haben. Man kann nun folgendes Theorem zeigen:
Eine notwendige und hinreichende Bedingung für die Existenz einer gemeinsamen
b und B
b ist, dass diese vertauschen,
vollständigen Orthonormalbasis zweier Operatoren A
b B]
b = 0 gilt. Daher gilt für untereinander kompatible Observablen, dass jegd.h. dass [A,
liche ihnen zugeordneten Operatoren untereinander kommutieren.
Nun kann man für ein System von kompatiblen Observablen das Konzept der maximalen
Beobachtung einführen. Der Index u in Glg. (5.21) zeigt an, dass χr s u bei Eigenwerten αr
b und B
b für weitere Operatoren ein Eigenvektor sein kann.
und βs für die Operatoren A
b B
b und C,
b die alle kommutieren (d.h. [A,
b B]
b =
Wenn ein System von Operatoren A,
58
b C]
b = [C,
b A]
b = 0), die Eigenschaft hat, dass es jeweils nur genau einen Eigenvektor
[B,
χr s t für jedes Tupel (αr , βs , γt ) von Eigenwerten gibt, d.h. dass
b r s t = αr χr s t ,
Aχ
b r s t = βs χr s t ,
Bχ
b r s t = γt χr s t
Cχ
(5.32)
gilt, so wird dieses als vollständiges System von kommutierenden Operatoren (vSkO) bezeichnet. Wir nennen ein solches System von Operatoren ein kommutierendes System.
Systeme von Observablen, die einem vSkO zugeordnet werden, sind von besonderer Bedeutung in QM und müssen en detail besprochen werden.
Zunächst wollen wir den Begriff einer Funktion mehrerer kommutierender Operatoren
einführen. Gegeben sei eine Funktion f (x, y, z), die durch eine Potenzreihe
X
f (x, y, z) =
f l m n xl y m z n
(5.33)
l,m,n
dargestellt werden kann. Auf gleiche Art und Weise kann eine Funktion von Operatoren
durch eine Potenzreihe von Operatoren32
X
bl B
bmC
bn
b B,
b C)
b =
fl m n A
(5.34)
f (A,
l,m,n
ausgedrückt werden. Ausgehend von Glg. (5.32) erhält man
bl B
bmC
bn χr s t = αrl βsm γtn χr s t ,
A
(5.35)
b B,
b C)χ
b r s t = f (αr , βs , γt )χr s t
f (A,
(5.36)
was schließlich auf
b
führt. Man kann daher aufgrund von Glg. (5.36) schlussfolgern, dass ein Operator G,
der mit allen Operatoren aus einem vSkO kommutiert, zwangsläufig eine Funktion dieser
b mit einem Satz miteinander kommutierenOperatoren ist. Tatsächlich gilt, dass, falls G
b B
b und C
b kommutiert, G
b mit diesen Operatoren ein gemeinsames,
der Operatoren A,
b B
b und C
b ein vSko
vollständiges System von Eigenvektoren besitzt. Wenn zusätzlich A,
bilden, dann sind alle gemeinsamen Eigenvektoren der drei zugleich Eigenvektoren von
b Unter dieser Bedingung können wir
G.
b r s t = ηr s t χ r s t
Gχ
(5.37)
b = f (A,
b B,
b C)
b
schreiben und dann gilt aufgrund der Definition f (αr , βs , γt ) ≡ ηr s t , dass G
b B
b und C
b zu
ist. Dieses Ergebnis ist wichtig, denn es besagt, dass, falls die Operatoren A,
den Observablen A, B und C ein vSkO bilden, durch gleichzeitige Messung einer Größe G,
b mit A,
b B
b und C
b kommutiert, keine weitere Information erlangt werden
deren Operator G
kann, da der Wert von G a priori auf Grundlage der beobachteten Werte für A, B und C
berechnet werden kann. Aus diesem Grund bezeichnet man die Messung aller Operatoren
eines vSkO mit dem Begriff der maximalen Beobachtung.
Wir wollen uns nun erneut den zuvor eingeführten ersten beiden Postulaten zuwenden.
Das erste Postulat erlaubt uns, den Zustandsvektor ψ(t) zu einer beliebigen Zeit t > t0
zu berechnen, sofern der Anfangszustand ψ(t0 ) gegeben ist. Das zweite Postulat erlaubt
32
Hinweis: Operatoren vertauschen im Allgemeinen nicht!
59
uns, Vorhersagen bezüglich der möglichen Ergebnisse einer Messung einer Observable zur
Zeit t zu machen, wenn wir den Zustandsvektor ψ(t) kennen. An diesem Punkt benötigen
wir ein Kriterium, dass die Konstruktion eines Zustandsvektors ψ(t0 ) für den Anfangszeitpunkt gestattet. Diese Präparation des Systems besteht in idealisierter Form in einer
ersten Beobachtung (Messung) des Systems und einer danach erfolgenden vorhersagbaren Veränderung der experimentellen Apparatur. Man sollte daraus ψ(t0 ) konstruieren
können. Um dieses Ziel zu erreichen, muss man sich zunächst darüber klar werden, dass
nicht jede Beobachtung, die man an dem System vornehmen kann, nützlich sein kann, um
dessen darauf folgende Zeitentwicklung vorherzusagen.
Mittels einer Terminologie, die auf Wolfgang Pauli zurückgeht, ordnen wir Messungen
in zwei Kategorien ein: Messungen der ersten Art und Messungen der zweiten Art. Eine
Messung der ersten Art ist eine Beobachtung, bei welcher die beobachtete Observable
nicht auf eine merkliche Art und Weise gestört wird, oder aber auf eine bekannte Art
gestört wird, in dem Sinne, dass eine direkte Wiederholung der gleichen Beobachtung das
gleiche oder ein vorhersagbares Ergebnis ergibt. Eine Messung der zweiten Art ist eine
Beobachtung, die auf wesentliche und nicht vorhersagbare Art und Weise die untersuchte
Observable stört.
Ein Beispiel einer Messung der ersten Art ist die Messung der Energie eines Teilchens
(mit bekannter Masse und Ladung), welche man mittels der Bestimmung der Krümmung
jener Bahn erhält, die von diesem Teilchen beim Durchgang durch ein Magnetfeld in
einer Wilson’schen Blasenkammer hinterlassen wird. Eine Bestimmung der Krümmung
der Bahn auf dem als Nächstes angrenzenden Linienelement wird das gleiche Ergebnis
haben. Ein typisches Beispiel einer Messung der zweiten Art ist die Beobachtung eines
Photons mittels eines Photomultipliers. Während seiner Beobachtung wird das Photon
vollständig absorbiert, so dass man nicht mehr von anschließenden Beobachtungen des
Photons sprechen kann. Damit erreichen wir das dritte Postulat.
• Postulat 3:
Wir wollen annehmen, dass wir zu einer Zeit t0 eine Messung der ersten Art an
einem System vorgenommen haben. Die Beobachtung besteht aus der Messung
eines Satzes von kommutierenden Observablen, die im Folgenden mit A und B
bezeichnet werden. Wir wollen annehmen, dass wir die Messwerte A = αr und
B = βs erhalten haben. Wenn der Zustandsvektor direkt vor der Beobachtung
durch ψ(t0 ) gegeben ist, dann ist der Zustandsvektor ψ(t0 + τ ) direkt nach der
Beobachtung (bis auf die Normierung) durch die Projektion von ψ(t0 ) auf den
Unterraum, der den Eigenwerten αr und βs entspricht, gegeben.
ψ(t0 ) =
X
cr s u χ r s u
(5.38)
r,s,u
gegeben ist, der Zustandsvektor ψ(t0 + τ ) nach der Messung durch
ψ(t0 + τ ) = rP
1
X
2
|cr s u |
cr s u χ r s u
(5.39)
u
u
gegeben ist. Wenn die betrachtete Messung eine maximale Beobachtung ist, hier A = αr ,
60
B = βs und C = γt , dann gilt im Speziellen (vgl. Glg. (5.32))
ψ(t0 + τ ) = χr s t .
(5.40)
Wir merken an, dass uns Glg. (5.40) erlaubt, den Zustand ψ(t0 + τ ) zu präparieren ohne
irgendeine weitere Information über das System zu haben. Glg. (5.39) ist stattdessen
nur nützlich, falls man zusätzlich über weitere Informationen über ψ(t0 ) verfügt. Diese
Vorschrift gilt im Allgemeinen sowohl für das diskrete wie auch für das kontinuierliche
Spektrum33 .
Eine Konsequenz all dessen ist, dass der Zustandsvektor zur Zeit des Messvorgangs eine diskontinuierliche und irreversible Veränderung erfährt, die sich von der durch die
Schrödingergleichung, Glg. (5.11), beschriebenen ungestörten Zeitentwicklung drastisch
unterscheidet. Dies ist kein Problem, da der Zustandsvektor ein reines Hilfsmittel zur Formulierung der statistischen Vorhersagen ist und für sich genommen keinerlei Signifikanz
besitzt.
Wir erinnern uns, dass in der Wahrscheinlichkeitsrechnung die Konzepte des Erwartungswerts (oder Mittelwerts) und der Varianz (oder quadratischen Standardabweichung) von
wesentlicher Bedeutung sind und wichtige Informationen bezüglich einer jeweils vorliegenden statistischen Verteilung beinhalten. Wir wollen diese Konzepte nun für die Wahrscheinlichkeitsverteilung spezifizieren, welche im zweiten Postulat einer generischen Observable A und einer Dbestimmten
Lösung ψ(t) der Schrödingergleichung zugeordnet ist.
E
b von A bezüglich des Zustandsvektors ψ(t) ist durch
Der Erwartungswert A
t
D E
X
X
b ≡
A
αr P (A = αr , t) =
αr |cr u (t)|2
(5.41)
t
r
r,u
gegeben, wobei die erste Gleichheit eine Definition ist und die zweite Gleichheit sich durch
Verwendung von Glgn. (5.12), (5.14) und (5.15) ergibt. Der Einfachheit halber behandeln
wir hier nur den Fall eines rein diskreten Spektrums. Für die Wurzel der Varianz bzw. für
die Standardabweichung erhalten wir
rD
D E E sX D E 2
D
E
b− A
b )2 =
b
b =
(A
αr − A
P (A = αr , t)
∆A
t
t
t
t
r
s
=
X
D
(5.42)
t
r,u
Die Größe
D E 2
b
αr − A
|cr u (t)|2 .
E
b ist ein Maß für die Unbestimmtheit, mit der A für ein System im
∆A
t
Zustand ψ(t) bekannt ist34 . Dann kann man unmittelbar aus Glgn. (5.41) und (5.42) die
folgenden Beziehungen erhalten:
33
Genau genommen erfordert Glg. (5.40) offensichtlich, dass der Zustand χr s t ein eigentlicher Eigenvektor ist. Eine Messung, die Werte im kontinuierlichen Spektrum ergibt, hat immer eine gewisse
Ungenauigkeit, die man zwar verringern aber nicht zu Null reduzieren kann. Daher gehört diese Messung
selbst bei einer maximalen Beobachtung zum Fall von Glg. (5.39). Nichtsdestotrotz könnte man bei einer
direkten Wiederholung der Messung eine nahezu vollständige Bestimmung des Zustands erreichen. Dieser
Fall gilt zum Beispiel bei der Bestimmung der Spur eines Teilchens in einer Wilson’schen Blasenkammer,
welche eine wohlbestimmte Zuordnung eines Wellenpakets
D
E zu dem Teilchen erlaubt.
34
b und verschweigt damit implizit die AbhängigMan schreibt oft auch einfach ∆A anstelle von ∆A
t
keit der Varianz von der Wahl des Zustands ψ(t). Wir versuchen dies im Folgenden zu vermeiden und
die Abhängigkeit vom Zustand ψ(t) explizit zu zeigen.
61
D E
D
E
D
E
X
b
b
∗
b
A = ψ(t) Aψ(t) =
cr u (t)cs v (t) χr u Aχs v
t
r,s,u,v
=
X
c∗r u (t)cs v (t)αs δr s δu v =
r,s,u,v
D
X
αr |cr u (t)|2 ,
(5.43)
r,u
2
E2 D E 2
D E
b
b
b
b
b
∆A = ψ(t) A − A
ψ(t) = A − A
ψ(t)
t
t
t
D E 2
X
b− A
b
=
c∗r u (t)cs v (t) χr u A
χs v
t
r,s,u,v
D E 2
X
∗
b
=
cr u (t)cs v (t) χr u αr − A
χs v
t
r,s,u,v
=
X
r,u
D E 2
b
αr − A
|cr u (t)|2 .
(5.44)
t
Diese Gleichungen finden zahllose praktische Anwendungen.
5.2
Orts- und Impulsobservablen: Größen mit klassischen Analoga
Wie wir gesehen haben, kann jeder physikalischen Größe ein hermitescher Operator zugeordnet werden. Das zweite Postulat, welches diese Zuordnung herstellt, verallgemeinert
die Rechenregeln und interpretativen Beschreibungen, die für den Spezialfall der Energie
im vorherigen Kapitel besprochen wurden, für beliebige physikalische Messgrößen. Nun
wollen wir untersuchen, auf welche Art und Weise sich die bereits für ein einzelnes Teilchen in einer Dimension gewonnenen Erkenntnisse in das Schema für N Teilchen (in drei
Dimensionen) einfügen. Insbesondere wollen wir die Bestimmung der Wahrscheinlichkeit
verallgemeinern, ein Teilchen in einem bestimmten Raumbereich oder Impulsbereich zu
finden. Wir müssen nun ebensolche Regeln wie für die allgemeine Konstruktion des Hamiltonoperators angeben und die genaue analytische Form der Operatoren bestimmen, die
den Observablen entsprechen. Insbesondere ist es von Bedeutung, präzise Regeln für die
Konstruktion der Operatoren jener Größen zu haben, die eindeutige klassische Analoga
besitzen. Aus diesem Grund führen wir das vierte Postulat ein.
• Postulat 4:
Der Hilbertraum eines Systems von N Teilchen ist der Raum L2 (R3N ) von Funktionen des Typs χ(x1 , . . . , xN ). Den kartesischen Koordinaten (xi , yi , zi ) des iten
Teilchens werden die Operatoren (b
xi , ybi , zbi ) zugeordnet, die durch
(b
xi χ)(x1 , . . . , xN ) = xi χ(x1 , . . . , xN ),
(b
yi χ)(x1 , . . . , xN ) = yi χ(x1 , . . . , xN ),
(b
zi χ)(x1 , . . . , xN ) = zi χ(x1 , . . . , xN ).
(5.45)
definiert werden.
62
Wie wir sehen werden, gestattet uns dieses Postulat, die Born’sche Wahrscheinlichkeitsinterpretation zu erhalten, die bereits in einem vorherigen Kapitel (vgl. Kapitel 3) besprochen wurde. Die Definition eines (linearen) Impulses35 , die zunächst im Bezug auf
ein freies Teilchen angegeben wurde, kann zu einer neuen, allgemeineren Definition in
Beziehung gesetzt werden, wie wir im Folgenden zeigen werden.
Definition: Für ein System von N Teilchen nennen wir die vektorielle Größe mit kartesischen Komponenten
(b
pi x χ)(x1 , . . . , xN ) =
(b
pi y χ)(x1 , . . . , xN ) =
(b
pi z χ)(x1 , . . . , xN ) =
~ ∂χ(x1 ,...,xN )
,
i
∂xi
~ ∂χ(x1 ,...,xN )
,
i
∂yi
∂χ(x
,...,x
)
~
1
N
.
i
∂zi
(5.46)
den (linearen) Impuls des iten Teilchens.
Wir können hiermit die folgenden Observablen definieren.
5.2.1
Ort als Observable
Wir haben bereits im Kapitel 3 den eindimensionalen Fall besprochen. Nun wollen wir
den Ort eines Teilchens im dreidimensionalen Raum betrachten. Die Operatoren x
b, yb und
zb kommutieren miteinander und haben ein gemeinsame ONEB,
x
bχ(x, y, z) = xχ(x, y, z) = ξχ(x, y, z),
ybχ(x, y, z) = yχ(x, y, z) = ηχ(x, y, z),
zbχ(x, y, z) = zχ(x, y, z) = ζχ(x, y, z).
(5.47)
Die erste dieser Gleichungen wird für χ(x, y, z) = A(y, z)δ(x − ξ) gelöst. Die Lösung der
zweiten ist χ(x, y, z) = B(x, z)δ(y − η) und der dritten ist χ(x, y, z) = C(x, y)δ(z − ζ).
Daher werden die drei Gleichungen simultan durch
χξ (x) = δ(x − ξ)δ(y − η)δ(z − ζ) = δ 3 (x − ξ)
(5.48)
gelöst, wobei wir ξ = (ξ, η, ζ) definiert haben. Hierbei handelt es sich um eine uneib ist von rein
gentliche Eigenfunktion für beliebige Werte von ξ und das Spektrum von x
kontinuierlicher Natur. Die beliebige multiplikative Konstante wurde in Glg. (5.48) auf
eins gesetzt. Auf diese Art und Weise sind die χξ (x) normiert und man erhält die Orthonormalitätsrelation
Z
0
hχξ | χξ i = d3 x δ 3 (x − ξ 0 )δ 3 (x − ξ) = δ 3 (ξ − ξ 0 )
(5.49)
sowie die Zerlegung beliebiger Wellenfunktionen nach der Ortsbasis,
Z
Z
3
3
ψ(x, t) = d ξ ψ(ξ, t)δ (x − ξ) = d3 ξ ψ(ξ, t)χξ (x),
35
(5.50)
Wir sprechen hier von einem linearen Impuls zur Hervorhebung dessen, dass es sich nicht um einen
Drehimpuls handelt. Drehimpulse in der Quantenmechanik werden an späterer Stelle (Abschnitt 5.6)
behandelt.
63
womit sich die statistische Interpretation gemäß
P (ξ ≤ x ≤ ξ + dξ, t) = |ψ(ξ, t)|2 d3 ξ
(5.51)
ergibt36 . Die Verallgemeinerung auf ein System von N Teilchen ist offensichtlich.
5.2.2
Impuls als Observable
Für ein Teilchen in einer Dimension lautet die Eigenwertgleichung für pb
pbϕ(x) =
~ ∂ϕ(x)
= pϕ(x)
i ∂x
(5.53)
und deren Lösung ist eine ebene Welle,
i
ϕ(x) = A exp [ px].
~
(5.54)
Hierbei handelt es sich um eine uneigentliche Eigenfunktion für beliebige Werte von p und
das Spektrum von pb ist von rein kontinuierlicher Natur. Die normierten Eigenfunktionen
lauten
1
i
(5.55)
ϕp (x) = √
exp [ px]
~
2π~
und erfüllen die Orthonormalitätsrelation
Z+∞
i
i
dx exp [− p0 x] exp [+ px] = δ(p0 − p).
~
~
1
hϕp0 | ϕp i =
2π~
(5.56)
−∞
Wir merken an, dass die Impulseigenfunktionen für ein freies Teilchen mit den Eigenfunkb zusammenfallen. Auch sonst kann eine Wellenfunktion ψ(x, t) stets nach
tionen von H
Impulseigenfunktionen entwickelt werden,
1
ψ(x, t) =
2π~
Z+∞
Z+∞
i
i
dp
dx0 ψ(x0 , t) exp [− px0 ] exp [+ px]
~
~
−∞
1
= √
2π~
−∞
Z+∞
−∞
i
dp c(p, t) exp [ px].
~
(5.57)
Dann können wir die Koeffizienten c(p, t) durch
Z+∞
i
c(p, t) = hϕp | ψ(t)i =
dx exp [− px]ψ(x, t)
~
(5.58)
−∞
36
Die Bedeutung von ξ ≤ x ≤ ξ + dξ ist als
ξ ≤ x ≤ ξ + dξ,
η ≤ y ≤ η + dη,
p
oder auch als |ξ − x| = (ξ − x)2 ≤ |dξ| zu verstehen.
64
ζ ≤ z ≤ ζ + dζ,
(5.52)
erhalten und wir finden für das zweite Postulat
2
P (p0 ≤ p ≤ p0 + dp, t) = |c(p0 , t)| dp0 .
(5.59)
Die Lösung der Schrödingergleichung für ein freies Teilchen ist von der Form
1
ψ(x, t) = √
2π~
so dass wir
Z+∞
i
p2
dp c0 (p) exp
px −
t ,
~
2m
(5.60)
−∞
i p2
c(p, t) = c0 (p) exp −
t
~ 2m
(5.61)
finden. Der Fakt, dass die Wahrscheinlichkeit P (p0 ≤ p ≤ p0 + dp, t) für ein freies Teilchen
zeitunabhängig ist,
2
2
P (p0 ≤ p ≤ p0 + dp, t) = |c(p0 )| dp0 = |c0 (p0 )| dp0 = P (p0 ≤ p ≤ p0 + dp).
(5.62)
stimmt mit der Tatsache überein, dass der Impuls (eines freien Teilchens) in der Klassischen Physik eine Konstante der Bewegung ist.
Wir wollen nun ein Teilchen in drei Dimensionen betrachten. Die Operatoren pbx , pby und
pbz vertauschen und die entsprechenden Observablen sind kompatibel. Die simultane Eigenwertgleichung lautet
pbx ϕ(x, y, z) =
pby ϕ(x, y, z) =
pbz ϕ(x, y, z) =
~ ∂ϕ(x,y,z)
i
∂x
~ ∂ϕ(x,y,z)
i
∂y
~ ∂ϕ(x,y,z)
i
∂z
= px ϕ(x, y, z),
= py ϕ(x, y, z),
= pz ϕ(x, y, z).
(5.63)
Die Lösungen der ersten, zweiten und dritten Gleichungen sind entsprechend
i
i
B(x, z) exp [ py y] und C(x, y) exp [ pz z].
~
~
i
A(y, z) exp [ px x],
~
(5.64)
Darum ist eine gleichzeitige Lösung durch
i
i
i
ϕ(x, y, z) = K exp [ px x] exp [ py y] exp [ pz z]
~
~
~
(5.65)
gegeben und die normierten Eigenfunktionen sind
ϕp (x) =
1
i
1
i
exp [ (px x + py y + pz z)] =
3 exp [ p · x]
~
~
(2π~)
(2π~) 2
3
2
(5.66)
und erfüllen die Orthonormalitätsrelation
hϕp0 | ϕp i = δ 3 (p0 − p).
(5.67)
Wir können damit das Wellenpaket als Superposition dieser Lösungen schreiben, d.h. die
Wellenfunktion ψ(x, t) nach den Impulseigenfunktionen entwickeln,
Z
Z
1
i
3
ψ(x, t) = d p c(p, t)ϕp (x) =
d3 p c(p, t) exp [ p · x],
(5.68)
3
~
(2π~) 2
65
wobei
Z
i
d3 x exp [− p · x]ψ(x, t),
~
2 3
0
0
P (p ≤ p ≤ p + dp, t) = |c(p, t)| d p,
i p2
c(p, t) = hϕp | ψ(t)i =c0 (p) exp −
t
~ 2m
c(p, t) = hϕp | ψ(t)i =
(5.69)
(5.70)
(5.71)
gelten. Eine Verallgemeinerung dieser Betrachtungen zu Systemen mit N Teilchen ist
offensichtlich.
5.2.3
Unschärferelation
Wie wir gesehen haben, vertauschen Ortsoperatoren untereinander, und das Gleiche gilt
auch für Impulsoperatoren. Dies kann jedoch nicht für beliebige Kombinationen von Ortsund Impulsoperatoren gültig sein. Wenn wir die kte Koordinate des jten Teilchens mit
xj k und die k 0 te Impulskomponente des j 0 ten Teilchens mit pj 0 k0 bezeichnen, erhalten wir
∂χ(x1 , . . . , xN )
~
,
(b
xj k pbj 0 k0 χ)(x1 , . . . , xN ) = xj k
i
∂xj 0 k0
~ ∂xj k χ(x1 , . . . , xN )
,
(b
pj 0 k 0 x
bj k χ)(x1 , . . . , xN ) =
i
∂xj 0 k0
~
∂χ(x1 , . . . , xN ) ~
= xj k
+ δj j 0 δk k0 χ(x1 , . . . , xN )
i
∂xj 0 k0
i
(5.72)
(5.73)
und darum
([b
xj k pbj 0 k0 − pbj 0 k0 x
bj k ]χ)(x1 , . . . , xN ) = i~δj j 0 δk k0 χ(x1 , . . . , xN ).
(5.74)
Da f (x1 , . . . , xN ) eine beliebige Wellenfunktion ist, gilt somit
[b
xj k , x
bj 0 k0 ] = [b
pj k , pbj 0 k0 ] = 0,
[b
xj k , pbj 0 k0 ] = i~δj j 0 δk k0 .
(5.75)
Somit sehen wir in Übereinstimmung mit dem Heisenberg’schen Unschärfeprinzip, dass
eine Ortskoordinate niemals mit dem zu ihr kanonisch konjugierten Impuls kompatibel
sein kann.
5.2.4
Allgemeinere Observablen
Nun müssen wir über die analytische Form von Operatoren nachdenken, die allgemeineren
Observablen entsprechen. In der Klassischen Mechanik wird eine dynamische Variable
für ein System von N Teilchen immer durch eine Funktion der kanonischen Variablen
dargestellt, F = F (x1 , y1 , z1 , . . . , pN x , pN y , pN z ). Dies legt nahe, dass eine gleichartige
Konstruktion in der Quantenmechanik auftrit. Daher formulieren wir das fünfte Postulat.
66
• Postulat 5:
Die den Observablen eines Systems von N Teilchen entsprechenden Operatoren
sind von der Form
Fb = F (b
x1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z ),
(5.76)
d.h. sie sind Funktionen der fundamentalen Operatoren
x
b1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z .
(5.77)
Wir merken zunächst an, dass wir Ausdrücken vom Typ F (b
x1 , yb1 , zb1 , . . . , pbN x , pbN y , pbN z )
durch die Substitution
x1 → x
b1 , yi → ybi , . . . pN z → pbN z
(5.78)
eine Bedeutung geben können, falls die Funktion F (x1 , y1 , z1 , . . . , pN x , pN y , pN z ) in einer
Potenzreihe entwickelt werden kann. Aber im Gegensatz zu den Verhältnissen für kompatible Operatoren führt die Substitution, Glg. (5.78), nicht zu einer eindeutigen Form,
da die verschiedenen Terme der Potenzreihe aus im Allgemeinen nicht kommutierenden
Operatoren bestehen, für welche die Reihenfolge daher relevant ist. Darüber hinaus ist,
falls wir keine angemessene Vorschrift für die Ordnung der nicht kommutierenden Operatoren verwenden, der für Fb erhaltene Operator nicht hermitesch. Um einen hermiteschen
Operator zu erhalten ist es wesentlich, jeden einzelnen Term der Potenzreihe in geeigneter
Art und Weise zu symmetrisieren. Beispielsweise37 könnten wir
X
Fb =
am n (b
xm pbn )sym
(5.79)
m,n
schreiben, wobei wir mit der Notation (. . .)sym beispielsweise
1
(b
xpb + pbx
b)
(5.80)
2
meinen. Man sieht durch explizite Rechnung leicht, dass
1
1 † †
1
(b
xpb)sym † = (b
xpb + pbx
b) † =
pb x
b +x
b† pb† = (b
px
b+x
bpb) = (b
xpb)sym .
(5.81)
2
2
2
Da derartige Symmetrisierungsvorschriften für komplizierte Operatoren zu länglichen
Ausdrücken ohne signifikanten Lerneffekt für Sie führen, werden wir darauf im Folgenden
nicht weiter eingehen.
(b
xpb)sym =
Nun betrachten wir die Beziehung zwischen einer quantenmechanischen Observablen F
mit dem zugehörigen Operator Fb und der Klassischen Bewegungsgröße F , auf deren
Grundlage der Operator Fb definiert ist.
Wenn wir den Zustandsvektor ψ(t) des gegebenen Quantensystems zur Zeit t betrachten,
sind hb
x1 it , . . . , hb
pN z it sowie h∆b
x1 it , . . . , h∆b
pN z it die Erwartungswerte und Standardabweichungen der fundamentalen Observablen bezüglich des Zustands ψ(t). Falls die Standardabweichungen h∆b
x1 it , . . . , h∆b
pN z it auf der Skala der Beobachtung vernachlässigbar
37
Es existieren keine zwangsläufigen allgemeinen Vorschriften zur Symmetrisierung. Daher ist die
Zuordnung ausgehend von einer Klassischen Bewegungsgröße zu einem bestimmten quantenmechanischen
Operator nicht eindeutig. Der Umkehrschluss gilt jedoch, so dass die Zuordnung ausgehend von einem
quantenmechanischem Operator zu einer Klassischen Bewegungsgröße eindeutig ist (sofern möglich).
67
klein sind und falls die Klassische Größe F (x1 , . . . , pN z ) nur unwesentlich bei Schwankungen der x1 , . . . , pN z von der Ordnung h∆b
x1 it , . . . , h∆b
pN z it um die Werte hb
x1 it , . . . , hb
pN z it
b
fluktuiert, ist die dem Operator F zugeordnete quantenmechanische Observable praktisch
identisch zu F (hb
x1 it , . . . , hb
pN z it ). Wir werden dies in einer Übung zeigen. In diesem
Grenzfall kann die dem Operator Fb zugeordnete Observable mit der Klassischen Größe
F (x1 , . . . , pN z ) identifiziert werden. Es gibt jedoch auch quantenmechanische Observable,
die keine klassischen Analoga besitzen, wie beispielsweise der Spin eines Teilchens. Außerdem können a priori mehrere verschiedene quantenmechanische Größen der gleichen
Klassischen Größe entsprechen.
Wir wollen nun den Drehimpuls als ein konkretes Beispiel einer solchen allgemeineren
Observable betrachten. Klassisch ist diese Größe durch
L = x × p = ijk xi pj k̂
(5.82)
oder äquivalent
Lx = ypz − zpy ,
Ly = zpx − xpz ,
Lz = xpy − ypx
(5.83)
definiert. In diesem Fall bestehen keinerlei Probleme mit der Ordnung in der Substitution in Glg. (5.78). Die Lx , Ly und Lz entsprechenden Quantenoperatoren sind eindeutig
definiert und sie sind durch
∂
∂
~
bx = ybpbz − zbpby =
y
−z
,
(5.84)
L
i
∂z
∂y
∂
∂
~
by = zbpbx − x
z
−x
,
(5.85)
L
bpbz =
i
∂x
∂z
~
∂
∂
bz = x
L
bpby − ybpbx =
−y
x
(5.86)
i
∂y
∂x
gegeben. Wir bezeichnen diese hermiteschen Operatoren als die Komponenten des Drehimpulsoperators und nennen die zugeordnete Observable den quantenmechanischen oder
quantisierten Drehimpuls. Wir bemerken hier, dass die Komponenten des Drehimpulsoperators nicht miteinander vertauschen,
bx , L
by ] 6= 0,
[L
by , L
bz ] 6= 0,
[L
bz , L
bx ] 6= 0.
[L
(5.87)
bx , L
by und L
bz –
Daher sind die Komponenten des quantenmechanischen Drehimpulses – L
keine kompatiblen Observablen und es ist nicht möglich dem Vektor L in der Quantenmechanik einen wohldefinierten Wert zuzuweisen.
Wir betrachten nun die Klassische Hamiltonfunktion eines Systems von N Teilchen,
N
X
p2j
H(x1 , . . . , pN ) =
+ V (x1 , . . . , xN ).
2mj
j=1
(5.88)
b lautet
Der zugehörige Hamiltonoperator H
b = H(b
H
x1 , . . . , pbN ) =
N
X
pb2j
bN )
+ V (b
x1 , . . . , x
2mj
j=1
68
(5.89)
bzw. explizit in Ortsdarstellung
b =−
H
N
X
~2
∆xj + V (x1 , . . . , xN ).
2m
j
j=1
(5.90)
Dieser Operator stimmt mit jenem in Glg. (5.7) als Verallgemeinerung von Glg. (5.1) auf
N -Teilchensysteme definierten Operator überein. Wir führen nun das sechste Postulat ein.
• Postulat 6:
Für ein System von N Teilchen ist der Operator, der in der Schrödingergleichung,
vgl. Glg. (5.7), auftritt, von der Form von Glg. (5.89).
Die Form des Potentials V (x1 , . . . , xN ) kann in manchen Fällen wie beispielsweise für
elektrostatische Kräfte mit dem entsprechenden Klassischen Potential identifiziert werden.
In anderen Fällen, wie beispielsweise für Kernkräfte, muss das Potential direkt aus den
Daten erhalten werden. In den häufigsten Fällen liegt eine Zweikörper-Wechselwirkung
vor und das Potential ist von der Form
V (x1 , . . . , xN ) =
N
X
Vj (xj ) +
j=1
X
Vi j (|xi − xj |),
(5.91)
i<j
wobei der Term Vj (xj ) die Wirkung äußerer Kräfte auf das jte Teilchen darstellt, während
der Beitrag Vi j (|xi − xj |) die Wechselwirkungsenergie zwischen den Teilchen i und j beschreibt (diese Energie sollte unter Rotationen und Translationen invariant sein). Somit
kann der Hamiltonoperator eines Atoms mit Z Elektronen (und Kernladungszahl Z) als
Z
Z
X
X
X
pb2j
Ze2
pb20
e2
b
+
−
+
H=
2M0 j=1 2me j=1 |x0 − xj | i<j |xi − xj |
(5.92)
geschrieben werden, wobei sich der Index 0 auf den Atomkern und die übrigen Indizes
i, j = 1, 2, . . . , Z auf die Elektronen beziehen.
5.3
Kommutatoren und Unbestimmtheitsrelationen
Der Ausdruck
b B]
b =A
bB
b−B
b A,
b
[A,
(5.93)
der bereits in Glg. (5.31) eingeführt wurde, wird als Kommutator bezeichnet. Der Kommutator besitzt die folgenden wesentlichen Eigenschaften,
b =0,
[c, A]
b B]
b = − [B,
b A],
b
[A,
(5.94)
(5.95)
b B]
b =c[A,
b B],
b
[cA,
b + B,
b C]
b =[A,
b C]
b + [B,
b C],
b
[A
bB,
b C]
b =A[
b B,
b C]
b + [A,
b C]
b B,
b
[A
69
(5.96)
(5.97)
(5.98)
b B],
b C]
b + [[B,
b C],
b A]
b + [[C,
b A],
b B],
b
0 =[[A,
(5.99)
die Sie in Übungsaufgabe 5.4 untersucht haben. Glg. (5.99) ist als Jacobi Identität bekannt.
Wir betrachten nun ein System von N Teilchen und schreiben die Kommutatoren von
Glg. (5.75) erneut,
[b
xj k , x
bj 0 k0 ] = [b
pj k , pbj 0 k0 ] = 0,
[b
xj k , pbj 0 k0 ] = i~δj j 0 δk k0 .
(5.100)
Diese Gleichungen stimmen bis auf den Faktor i~ mit den Ausdrücken für Poissonklammern38 überein, wie sie für die entsprechenden Klassischen Observablen auftreten. Insbesondere gibt es eine Korrespondenz
i b b
{A, B} → − [A,
B],
~
(5.102)
b und B
b quantenmechanische Operatoren
wobei A und B Klassische Variablen sind und A
zu den entsprechenden quantenmechanischen Observablen.
Wenn wir den Drehimpulsoperator eines einzelnen Teilchens betrachten, finden wir unter
Verwendung der Eigenschaften des Kommutators
bx , L
by ] =[b
[L
y pbz − zbpby , zbpbx − x
bpbz ] = [b
y pbz , zbpbx ] + [b
z pby , x
bpbz ]
bz
=b
y [b
pz , zb]b
px + x
b[b
z , pbz ]b
py = −i~b
y pbx + i~b
xpby = i~L
(5.103)
bx , L
by ] = i~L
bz
[L
(5.104)
bi , L
bj ] = i~ijk L
bk .
[L
(5.105)
[b
xn , pbx ] = i~nb
xn−1
(5.106)
und daher
bzw. im Allgemeinen
Wir können ebenso
erhalten, was sich mit Leichtigkeit (durch vollständige Induktion) zeigen lässt:
[b
xn , pbx ] =[b
xx
bn−1 , pbx ] = [b
x, pbx ]b
xn−1 + x
b[b
xn−1 , pbx ]
=i~b
xn−1 + x
bi~(n − 1)b
xn−2 = i~nb
xn−1 .
(5.107)
Damit finden wir Kommutatoren für Funktionen der Operatoren,
∂F (b
x, yb, zb)
,
∂x
∂G(b
px , pby , pbz )
[b
x, G(b
px , pby , pbz )] =i~
,
∂px
[F (b
x, yb, zb), pbx ] =i~
38
(5.108)
(5.109)
Die Poissonklammer ist für ein System mit M Freiheitsgraden durch
M X
∂A ∂B
∂B ∂A
{A, B} =
−
∂xi ∂pi
∂xi ∂pi
i=1
gegeben.
70
(5.101)
indem wir diese in Potenzreihen entwickeln. Die Verallgemeinerung dieser Gleichungen zu
anderen Komponenten ist offensichtlich.
Wie wir bereits gesehen haben, gilt für zwei kompatible Observablen A und B, dass die
entsprechenden Operatoren kommutieren,
b B]
b = 0.
[A,
(5.110)
Falls die Observablen inkompatibel sind, gilt stattdessen
b B]
b 6= 0.
[A,
(5.111)
In einem solchen Fall gilt außerdem
D
E
D
E
b b
b h∆Bi
b ≥ 1
ψ(t)
[
A,
B]ψ(t)
∆A
,
t
2
t
t
(5.112)
wobei ψ(t) ein beliebiger Zustandsvektor ist. Sie werden diese Identität auf ??bungsblatt 7 ??berpr??fen. Wenn wir A mit einer kartesischen Koordinate des Teilchens und B
mit der entsprechenden Impulskomponente identifizieren, ergibt Glg. (5.112) die Heisenbergsch’sche Unschärferelation als Konsequenz des Heisenberg Kommutators [b
x, pbx ] = i~,
vgl. Glg. (5.75). Man erhält daher
h∆xit h∆pit ≥
~
.
2
(5.113)
Glg. (5.112) stellt eine Verallgemeinerung der Heisenberg’schen Unbestimmtheitsregeln
dar, vgl. Glg. (3.43). Für das Beispiel des Drehimpulses, vgl. Glg. (5.104), erhalten wir
h∆Mx it h∆My it ≥
~
hLz it .
2
(5.114)
Sie werden auf Übungsblatt 7 zeigen, dass man einen Zustandsvektor konstruieren kann,
für den die Unbestimmtheit minimal ist. Für den Fall eines freien Teilchens in einer
Dimension entspricht dieser Zustand dem Gauß’schen Wellenpaket.
5.4
Zeitabhängigkeit des Mittelwerts einer Observable und
Ehrenfest’sches Theorem
Für eine allgemeine Observable F können wir den Erwartungswert konstruieren,
D E
D
E
b
b
F = ψ(t) F ψ(t) ,
(5.115)
t
welcher zu einer gegebenen Lösung ψ(t) der Schrödingergleichung gehört. Dann gilt
*
+
d hF it
∂ Fb
i b b
=
− [F , H] .
(5.116)
dt
∂t
~
t
Glg. (5.116) kann unmittelbar aus Glg. (5.115) erhalten werden, indem man deren Zeitableitung bildet, die Schrödingergleichung verwendet und die Hermitezität des Hamiltonoperators verwendet:
71
*
+ D
E
b
dψ(t)
d
dψ(t) b
b
∂F
ψ(t) F ψ(t) = ψ(t) ψ(t) +
F ψ(t) + ψ(t) Fb
∂t
dt
dt dt
*
+
∂ Fb
i b
i
b
=
+ − Hψ(t) Fbψ(t) + ψ(t) Fb(− H)ψ(t)
∂t
~
~
+t
*
+
*
E
iD
∂ Fb
i b b
∂ Fb
b b
−
ψ(t) [F , H]ψ(t) =
− [F , H] . (5.117)
=
∂t
~
∂t
~
t
t
Dabei wurde in Glg. (5.116) eine explizite Zeitabhängigkeit des Operators Fb mitberücksichtigt. Wir bemerken, dass Glg. (5.116) analog zur Klassischen Beziehung
dF
∂F
=
+ {F, H}
dt
∂t
ist (hierbei ist {., .} die Poissonklammer).
(5.118)
Wir wollen nun ein System von N Teilchen betrachten, deren Hamiltonoperator durch
Glg. (5.89) gegeben ist. Ausgehend von Glg. (5.116) sowie Glgn. (5.108) and (5.109) erhalten wir
E
X [b
xj , pb2j 0 ] t
iD
∂xj
i
d
b
−
hxj it =
[b
xj , H]
=0−
dt
∂t t ~
~ j0
2mj
t
hb
pj 0 it
i X
1
= − i~
δj j 0
=
hpj it ,
~
2mj
mj
j0
*
+
E
b
d
∂pj
i
~
∂
H
iD
b
hpj it =
[b
pj , H]
=0−
−
dt
∂t t ~
~ i ∂xj
t
t
∂V (x1 , . . . , xN )
=−
.
∂xj
t
(5.119)
(5.120)
Diese Gleichungen werden als das Ehrenfest’sche Theorem39 bezeichnet. Falls die Unbestimmtheit von Ort und Impuls des Teilchens hinreichned klein (bezüglich der Beobachtungsskala) sind und die Ableitungen des Potentials langsam mit dessen Argumenten
variieren, können wir
∂V (hx1 it , . . . , hxN it )
∂V (x1 , . . . , xN )
'
(5.121)
∂xj
∂ hxj it
t
schreiben. Dann kann Glg. (5.120) mit den Klassischen Hamilton’schen Gleichungen identifiziert werden. Wir werden ein Anwendungsbeispiel dieses Theorems auf Übungsblatt 8
sehen.
5.5
Konstanten der Bewegung
In der Klassischen Mechanik haben wir Konstanten den Bewegung als jene dynamischen
Variablen F (q, p, t) definiert (wobei wir mit q und p die die verschiedenen Orts- und
39
In der Literatur ist die Bezeichnung Ehrenfest’sches Theorem auch für Glg. (5.116) gebräuchlich.
72
Impulsvariablen zusammenfassen), deren Werte sich mit der Zeitentwicklung des Systems nicht ändern, d.h. d/dtF (q(t), p(t), t) = 0 für jegliche Lösungen der Hamilton’schen
Gleichungen. Da man in der QM nicht zu jedem Zeitpunkt einer beliebigen Größe eine
wohldefinierten Wert zuweisen kann, muss diese Definition modifiziert werden. In der QM
definieren wir eine Konstante der Bewegung als eine Größe, deren Erwartungswert für jede
beliebige Lösung ψ(t) der Schrödingergleichung zeitunabhängig ist:
E
d D
d
hF it =
ψ(t) Fbψ(t) = 0.
dt
dt
(5.122)
Dann folgt aufgrund von Glg. (5.116) als notwendige und hinreichende Bedingung, dass
F eine Konstante der Bewegung ist, dass
i
∂ Fb
b =0
− [Fb, H]
∂t
~
(5.123)
erfüllt ist.
b
Tatsächlich ist eine hinreichende und notwendige Bedingung, dass hψ(t)|Aψ(t)i
= 0 mit
†
b
b
b
A = A erfüllt ist, dass A = 0 ist. Daher gilt, falls F nicht explizit zeitabhängig ist, und
b =0
[Fb, H]
(5.124)
gilt, dass F eine Konstante der Bewegung ist, falls der entsprechende Operator Fb mit dem
b kommutiert. Das erste Beispiel einer Konstanten der Bewegung ist
Hamiltonoperator H
die Energie eines Systems, dessen Hamiltonoperator nicht explizit von der Zeit abhängt:
in der Tat kommutiert der Hamiltonoperator mit sich selbst. Man kann zeigen (siehe
Übungsblatt 7), dass für ein freies Teilchen die drei Komponenten des (linearen Impulses)
und des Drehimpulses Konstanten der Bewegung sind. Im Falle eines Teilchens im Zentralpotential sind die drei Komponenten des Drehimpulses Erhaltungsgrößen. Für einen
Hamiltonoperator vom Typ
b=
H
N
X
X
pb2j
bj 0 |)
+
Vj j 0 (|b
xj − x
2m
j
j=1
j<j 0
(5.125)
sind sowohl die drei Komponenten der linearen Gesamtimpulses,
Pb =
N
X
pbj ,
(5.126)
j=1
als auch die drei Komponenten des Gesamt-Bahndrehimpulses,
b=
L
N
X
bj × pbj ,
x
(5.127)
j=1
Konstanten der Bewegung.
Ein weiteres typisches Problem ist es, den maximalen Satz von kompatiblen Konstanten
der Bewegung zu finden. Diese sind Observable, welche durch Operatoren repräsentiert
werden, die untereinander und mit dem Hamiltonoperator kommutieren. Beispielsweise
73
gilt im Fall des Teilchens im Zentralpotential, dass die drei Komponenten des Bahndrehimpulses zwar erhalten aber nicht zueinander kompatibel sind. Man kann stattdessen als
vollständigen Satz kompatibler Erhaltungsgrößen beispielsweise die Energie, das Betragsquadrat des Drehimpulses sowie eine einzelne Komponente des Drehimpulses annehmen
(vgl. Übungsblatt 7). Mittels dieses Satzes kann man eine maximale Beobachtung des
Systems definieren.
Wir betonen, dass Glgn. (5.123) und (5.124) Konsequenzen haben, die über die Erhaltung des Mittelwerts von F hinaus gehen. Wir wollen nun annehmen, dass F nicht explizit
b eine gemeinzeitabhängig ist. Dann folgt aus Glg. (5.124), dass die Operatoren Fb und H
same ONEB beistzen,
b r s = Er φr s ,
Hφ
Fbφr s = λs φr s .
(5.128)
Eine allgemeine Lösung der Schrödingergleichung kann in der Form
X
i
ψ(t) =
cr s φr s exp [− Er t]
~
r,s
geschrieben werden und wir erhalten für das zweite Postulat
2
X
X
i
cr s exp [− Er t] =
|cr s |2 .
P (F = λs , t) =
~
r
r
(5.129)
(5.130)
Daher sehen wir, dass im Fall einer Konstanten der Bewegung, die nicht explizit zeitabhängig ist, nicht nur der Mittelwert, sondern auch die Wahrscheinlichkeitsverteilung
der Observable zeitunabhängig ist. Einige Beispiele dieser Eigenschaft haben wir bereits
gesehen, unter anderem die Wahrscheinlichkeitsverteilung der Energie für beliebige zeitunabhängige Hamiltonoperatoren sowie die Wahrscheinlichkeitsverteilung des Impulses
eines freien Teilchens. Dieses Ergebnis kann auch auf explizit zeitabhänige Konstanten
der Bewegung erweitert werden. Tatsächlich kann man folgendes Theorem zeigen. Wenn
F Glg. (5.123) erfüllt gilt:
1. Die Eigenwerte von F sind zeitunabhängig (die Eigenvektoren hängen im Allgemeinen von der Zeit ab).
2. Die Wahrscheinlichkeitsverteilung von F ist zeitunabhängig.
Schließlich bemerken wir, dass die Bestimmung der Konstanten der Bewegung wie schon in
der Klassischen Physik auch in der Quantenmechanik sehr nützlich ist, um die Eigenschaften der Lösungen der Bewegungsgleichungen (Schrödingergleichung in QM) zu untersuchen und diese Lösungen ganz konkret zu konstruieren. Insbesondere kann Glg. (5.128)
auf den Fall mehrerer zeitunabhängiger, kompatibler Konstanten der Bewegung verallgemeinert werden. Die Kenntnis des Systems dieser Konstanten der Bewegung gewährt uns
a priori Wissen bezüglich des Wesens der Energie-Eigenfunktionen.
5.6
Drehimpuls eines Teilchens
Wir haben gesehen, dass die drei Komponenten des Bahndrehimpulses in der QM durch
die drei Operatoren
bx = ybpbz − zbpby ,
L
by = zbpbx − x
L
bpbz ,
74
bz = x
L
bpby − ybpbx ,
(5.131)
oder
~
∂
∂
bx =
L
y
−z
,
i
∂z
∂y
~
∂
∂
by =
L
z
−x
,
i
∂x
∂z
∂
∂
~
bz =
x
−y
L
i
∂y
∂x
(5.132)
(5.133)
(5.134)
gegeben sind. Ferner haben wir gesehen (vgl. Übungsblatt 7), dass die Vertauschungsrebx , L
by und L
bz durch
lationen zwischen L
bi , L
bj ] = i~ijk L
bk
[L
(5.135)
gegeben sind. An Glg. (5.135) sehen wir, dass die Observablen Lx , Ly und Lz nicht kompabx , L
by und L
bz (oder auch nur zwei von diesen Operatoren)
tibel sind und die Operatoren L
nicht gestatten, ein vollständiges System von gemeinsamen Eigenvektoren zu bilden. Wenn
wir das Betragsquadrat des Drehimpulses bilden,
b2 = L
b2 + L
b2 + L
b2 ,
L
x
y
z
(5.136)
b 2 mit den drei Komponenten kommutiert,
können wir (vgl. Übungsblatt 7) zeigen, dass L
b 2, L
b 2, L
b 2, L
b x ] = [L
b y ] = [L
bz ] = 0.
[L
(5.137)
b 2 und
Daher ist es möglich ein gemeinsames Orthonormalsystem von Eigenvektoren zu L
bz , zu finden. Insbesondere können wir, nach
einer der drei Drehimpulskomponenten, z.B. L
Übergang zu sphärischen Polarkoordinaten,
x = r cos ϕ sin ϑ,
y = r sin ϕ sin ϑ,
z = r cos ϑ,
(5.138)
herleiten, dass
~
cos
ϕ
∂
∂
bx = −
L
+
sin ϕ
,
i
∂ϑ tan ϑ ∂ϕ
~
∂
sin ϕ ∂
b
Ly = −
+
− cos ϕ
,
i
∂ϑ tan ϑ ∂ϕ
bz = ~ ∂
L
i ∂ϕ
und
b 2 = −~2
L
1 ∂
sin ϑ ∂ϑ
∂
1 ∂2
sin ϑ
+
∂ϑ
sin2 ϑ ∂ϕ2
(5.139)
(5.140)
(5.141)
(5.142)
gelten.
5.7
Parität
Bisher haben wir verschiedene Beispiele von Observablen betrachtet, die recht eindeutige
Klassische Analoga haben, beispielsweise den Ort, den (linearen) Impuls, den Drehimpuls
75
und die Energie. Es gibt aber auch Größen, die kein wesentliches Klassisches Analogon
besitzen. Unter diesen ist die Parität von besonderem Interesse. Wir wollen den Fall eines
einzelnen Teilchens betrachten. Der Paritätsoperator ist durch die Beziehung
Pbχ(x) = χ(−x)
(5.143)
definiert. Der Operator Pb ist hermitesch und kann einer beobachtbaren Größe zugeordnet
werden. Die Eigenwertgleichung kann als
Pbχ(x) = εχ(x)
(5.144)
geschrieben werden, was so viel heißt wie
χ(−x) = εχ(x)
(5.145)
oder (durch Ersetzung von x durch −x)
χ(x) = εχ(−x).
(5.146)
Indem wir Glg. (5.145) in Glg. (5.146) einsetzen, erhalten wir
χ(x) = ε2 χ(x),
ε2 = 1
(5.147)
und damit
ε = ±1.
(5.148)
Einerseits werden die zu ε = +1 gehörenden Eigenfunktionen durch
χ(−x) = χ(x)
(5.149)
charakterisiert, d.h. sie sind gerade Funktionen. Andererseits werden die zu ε = −1
gehörenden Eigenfunktionen durch
χ(−x) = −χ(x)
(5.150)
charakterisiert und sind daher ungerade Funktionen. Da der Paritätsoperator Pb hermitesch ist, ist das System seiner Eigenfunktionen vollständig und jeder Zustandsvektor
χ(x) kann als Summe einer geraden und einer ungeraden Funktion geschrieben werden.
Dies kann durch die Zerlegung
1
1
(5.151)
χ(x) = [χ(x) + χ(−x)] + [χ(x) − χ(−x)]
2
2
erreicht werden. Wir bemerken, dass
Pbx
b = −b
xPb,
Pbyb = −b
y Pb, Pbzb = −b
z Pb,
Pbpbx = −b
px Pb, Pbpby = −b
py Pb, Pbpbz = −b
pz Pb
(5.152)
gilt. Aus diesen Beziehungen folgt Pbpb2 /(2m) = pb2 /2mPb. Nun können wir ein allgemeines
Potential PbV (b
x) = V (−b
x)Pb betrachten. Falls V (b
x) eine gerade Funktion ist, kommutiert
b
b
b und
P mit H und Parität ist eine Konstante der Bewegung. In diesem Fall haben H
Pb einen vollständigen Satz gemeinsamer Eigenfunktionen und daher ist es möglich, die
b so zu wählen, dass diese gerade oder ungerade sind. Wir werden
Eigenfunktionen von H
Beispiele hierfür sehen, wenn wir ein Teilchen im Zentralpotential betrachten.
Literaturempfehlung:
F. Schwabl
A. Messiah
S. Weinberg
Quantenmechanik, Bd. 1
Quantum Mechanics, Volume 1
Lectures on Quantum Mechanics
76
Kapitel 8
Sections 5, 8.1
Section 3
Anhänge
A
Notation und Konventionen
Die innerhalb der Vorlesung und des Skriptes verwendeten Konventionen und Notationen
werden in diesem Anhang zusammengefasst.
A.1
Einheiten und Werte von Naturkonstanten
In dieser Vorlesung wird das Gauß’sche Einheitensystem (cgs System) statt des Internationalen Systems (SI System, MKSA System) verwendet. Das Gauß’sche System ist ein
metrisches, kohärentes Maßsystem, dessen fundamentale Einheiten für Länge, Masse und
Zeit der Zentimeter cm, das Gramm g und die Sekunde s sind. Die wichtigsten davon
abgeleiteten mechanischen Einheiten sind jene der Kraft, dyn, und der Energie, erg. Seit
1967 ist die Sekunde als das 9 192 631 770-fache der Periodendauer des Übergangs zwischen
den beiden Hyperfeinstrukturniveaus des Grundzustands des Nuklids 133 Cs definiert. Der
Meter wird daraufhin als die Distanz definiert, welche sich aus dem Produkt von der
Vakuumlichtgeschwindigkeit c = 299 792 458 m/s und einer Sekunde nach Division durch
299 792 458 ergibt. Das Kilogramm ist definiert als die Masse des Internationalen Kilogrammprotoyps, der sich im Internationalen Büro für Maß und Gewicht in Sèvres bei Paris
befindet. Die Beziehung zwischen den Basisgrößen cm und m sowie zwischen g und kg ist
offensichtlich, daher ist die Umrechnung rein mechanischer Größen zwischen Gauß’schen
und SI Einheiten trivial. Die im Internationalen System übliche makroskopische Einheit
der Energie ist das Joule, 1 J = 1 kgm2 /s2 = 107 erg = 107 gcm2 /s. Eine Besonderheit
der Bezeichnungen in der subatomaren Physik ist, dass der Femtometer fm = 1−15 m aus
Hochachtung vor Enrico Fermi (und aus Bequemlichkeit) als ein Fermi bezeichnet wird.
Der Gegensatz zwischen beiden Maßsystemen tritt bei elektromagnetischen Einheiten auf.
Während im SI System elektromagnetische Einheiten durch das Ampère’sche Kraftgesetz
für zwei parallele stromdurchflossene Leiter definiert werden, ist der Ausgangspunkt des
Gauß’schen Systems das Coulomb’sche Kraftgesetz für die Kraft zwischen zwei elektrischer
Ladungen. Im Gauß’schen System ist die Coulomb-Kraft zwischen zwei Ladungen Q1 und
Q2 durch F = Q1 Q2 /r2 gegeben. Im Gegensatz dazu ist die Coulomb Kraft im SI System
F = 1/(4πε0 )Q1 Q2 /r2 , wobei ε0 die Permittivitität des Vakuums ist. Daher ergeben sich
folgende Umrechnungen (E, D, B, H, ρ, j im Gauß’schen System, E 0 , D 0 , B 0 , H 0 , ρ0 ,
j 0 im Internationalen System:
elektrische Flussdichte
magnetische Flussdichte
magnetische Feldstärke
Raumladungsdichte
77
√
4πε0 E 0 ,
p
D = 4π/ε0 D 0 ,
p
B = 4π/µ0 B 0 ,
p
H = 4πµ0 H 0 ,
1
ρ= √
ρ0 ,
4πε0
elektrische Feldstärke E =
(A.1)
(A.2)
(A.3)
(A.4)
(A.5)
elektrische Stromdichte j = √
und
1
j 0,
4πε0
1
= ε0 µ 0 .
c2
(A.6)
(A.7)
Da im SI System ε0 = 8.854187817620 F/m mit 1 F/m = 1 A2 s4 /(kg m3 ) ist, gilt klarerweise, dass die elektrische Ladung in beiden Maßsystemen unterschiedliche Einheiten und
auch andere physikalische Dimensionen hat. Die Erklärung hierfür ist, dass im Internationalen System die Einheit der Stromstärke, das Ampère A, als Basiseinheit aufgefasst
wird, und damit die Einheit der Ladung als 1 C = 1 As definiert wird. Wann immer in
einer Gleichung im Internationalen Maßsystem auf nur einer der beiden Seiten elektromagnetische Einheiten (Ampère oder Coulomb) auftreten, tritt in diesen Gleichungen ebenso
eine Konstante ε0 oder µ0 auf, welche die Einheiten aneinander anpasst. Die im SI System
benötigten Konstanten ε0 und µ0 (elektrische und magnetische Feldkonstanten) werden
im Gauß’schen System nicht benötigt.
Die Einheit der Ladung ist im Gegensatz zum Internationalen
System im Gauß’schen Sysq
p
tem durch [Ladung] = [Energie] × [Länge] = [Masse] × [Länge]3 /[Zeit] definiert. Das
heißt, man
System die elektrostatische Ladungseinheit [Ladung] =
p erhält im Gauß’schen
√
2
1 esu = dyn × cm = erg × cm. Wie man leicht erkennt, treten bei Verwendung dieser
Einheiten keine Feldkonstanten auf.
In beiden Maßsystemen verwendet man auf (sub-)atomaren Skalen gerne das Elektronenvolt als Energieeinheit. Es gilt im SI System 1 eV = 1.6021766208(98)×10−19 J. Hierbei ist
e die (positive) Elementarladung mit Wert e = 1.6021766208(98)×10−19 C. Im Gauß’schen
System ist die (positive) Elementarladung e = 4.80320425(10) × 10−10 esu. Da typische
Energien von (sub-)atomaren Systeme von der Größenordnung meV (kondensierte Materie) bis TeV (LHC) sind, sind die Einheiten eV, keV, MeV und GeV mehr als nur
gebräuchlich.
Das Gauß’sche Maßsystem bietet sich außerdem für eine weitere Vereinfachung zu natürlichen Einheiten an, indem man die abstrakten Werte für die Lichtgeschwindigkeit im
Vakuum, c = 299 792 458 m/s, und für die Planck’sche Konstante (dividiert durch 2π),
~ = 1.054571800(13) × 10−34 Js = 6.582119514(40) × 10−16 eVs, beide zugleich auf eins
setzt. Das Produkt dieser beiden Konstanten ist ~c = 197.3269788(12) MeV fm und eignet sich hervorragend für Überschlagsrechnungen und ist in natürlichen Einheiten gleich
eins. Daher sieht man leicht, dass in natürlichen Einheiten Längen, Zeiten sowie die Kehrwerte von Energien, Impulsen und Massen alle die gleiche Einheit 1fm = 1/MeV haben.
Darüber hinaus√ist die elektrische Ladung in natürlichen Einheiten dimensionslos und
kann mit e = 1.4399764 MeV fm einfach in andere Maßsysteme übertragen werden.
Selbstverständlich muss man vor jedem Vergleich mit experimentellen Werten wieder alle
Größen zu Gauß’schen oder Internationalen Einheiten konvertieren.
Tabellen der wesentliche Konstanten und der physikalischen Einheiten finden Sie im Tabellenteil des Anhangs, vgl. Tabn. 1 und 2.
78
A.2
Vektoren und Metrik
Vektoren im Raum R3 oder im Minkowskiraum werden im Allgemeinen durch kleingeschriebene lateinische Buchstaben bezeichnet. Dreiervektoren werden durch Fettdruck hervorgehoben, Vierervektoren sind nicht fett gedruckt. Lateinische Buchstaben als Indizes
mit Wertebereich 1, 2 und 3 bezeichnen räumliche Komponenten, griechische Buchstaben
als Indizes mit Wertebereich 0, 1, 2 und 3 bezeichnen Komponenten von Vierervektoren.
Der Index 0 ist der Zeitkomponente zugeordnet, die Indizes 1, 2 und 3 den drei räumlichen
Komponenten.
Kontravariaten Vierervektoren sind definiert als xµ ≡ (x0 , +x), die dazu dualen kovarianten Vierervektoren als xµ ≡ (x0 , −x). Die Komponenten des metrischen Tensors gµν sind
durch g00 = +1 und g11 = g22 = g33 = −1 gegeben (Westküstenmetrik). Doppelt auftretenden Indizes werden im Allgemeinen über ihren Wertebereich summiert (Einstein’sche
Summenkonvention) sofern dies nicht explizit anders angegeben ist. Daher gilt xµ = gµν xν
und gµν g νρ = δµρ . Einheitsvektoren werden durch x̂ bzw. x̂µ oder x̂µ bezeichnet. Im Besonderen werden die kartesischen Einheitsvektoren durch µ̂ ≡ êµ bezeichnet.
Skalarprodukte zwischen Dreiervektoren werden durch x · p bezeichnet, Beträge reeller
Dreiervektoren auch schlicht durch x2 = |x|2 = x2 ≡ x·x. Vektorprodukte von Dreiervektoren werden durch x × y = ijk xi yj êk bezeichet. Das Vorzeichen des vierdimensionalen
Epsilon Tensors wird auf 0123 = +1 festgelegt.
Spinoren werden durch griechische Großbuchstaben bezeichnet und ihre Komponenten
mittels griechischer Buchstaben indiziert. Der Wertebereich der Spinor-Indizes ist 1 und
2 für Zweier-Spinoren und 1, 2, 3 und 4 für Vierer-Spinoren. Das zum komplexen Vektor
oder Spinor Ψ hermitesche konjugierte Objekt wird durch Ψ † bezeichnet, das komplex
konjugierte Objekt durch Ψ ∗ . Beträge komplexer Vektoren oder Spinoren werden durch
|Ψ |2 ≡ Ψ † Ψ = Ψα∗ Ψα bezeichet und als Summe aller Komponenten verstanden.
Die Pauli Matrizen sind definiert als
0 1
0 −i
σ1 =
,
σ2 =
,
1 0
i 0
σ3 =
1 0
0 −1
(A.8)
und werden im Dreiervektor σ = (σ1 , σ2 , σ3 )T zusammengefasst.
A.3
Wellenfunktionen und Zustandsvektoren
Innerhalb der Vorlesung werden zeitabhängige Wellenfunktionen bzw. Zustandsvektoren
immer mit dem Symbol ψ(x, t) bezeichnet. Zeitunabhängige Wellenfunktionen, die stationären Zustanden (d.h Energieeigenzuständen) entsprechen, werden immer mit φ(x)
bezeichnet. Andere Arten von L2 (R3 ) Funktionen bzw. Hilbertraumvektoren werden generisch mit χ oder ξ bezeichnet. Objekte von jedem dieser drei Typen werden darüber
hinaus (z.B. bzgl. ihrer Quantenzahlen) durch untere Indizes gekennzeichnet, z.B. χm ,
φm (x) oder ψnlm (x, t).
79
B
Drehimpuls
C
Zusammenfassung des Formalismus
C.1
Hilbertraum, Operatoren und Skalarprodukt
Ein Hilbertraum ist ein komplexer Vektorraum mit Skalarprodukt (Skalarproduktraum),
daher ist auf jedem Hilbertraum auch eine Norm definiert. Man spricht daher auch von
einem normierten komplexen Vektorraum.
C.1.1
Allgemeine Eigenschaften von Vektorräumen
Wir betrachten nun einen allgemeinen Vektorraum V (K) über dem Körper K. Beispiele
für K sind Rn (Körper der reellen Zahlen in n Dimensionen) oder Cm (Körper der komplexen Zahlen in m Dimensionen). Der Vektorraum V (K) kann komplex sein, auch falls
der Körper K reell ist, das Gegenteil ist nicht möglich. Im Allgemeinen sind auf Vektorräumen grundsätzlich Addition und Skalarmultiplikation definiert. Beide Operationen
sind assoziativ, Addition ist auch kommutativ und Skalarmultiplikation ist auch distributiv, d.h. für drei Vektoren χ ≡ χ1 , χ2 und χ3 und zwei Skalare α ≡ α1 und α2 aus dem
Körper K 0 gilt
χ1 + (χ2 + χ3 ) =(χ1 + χ2 ) + χ3 ,
χ1 + χ2 =χ2 + χ1 ,
(C.1)
(C.2)
α1 (α2 χ) =(α1 α2 )χ,
α(χ1 + χ2 ) =αχ1 + αχ2 ,
(α1 + α2 )χ =α1 χ + α2 χ.
(C.3)
(C.4)
(C.5)
sowie
Daher sind Linearkombinationen erlaubt und liegen ebenfalls im Vektorraum:
χ1 , χ2 ∈ V (K)
⇒ α1 χ1 + α2 χ2 ∈ V (K) ∀α1 , α2 ∈ K 0 .
(C.6)
Selbstverständlich dürfen die Skalare α1 und α2 komplex sein (K 0 = C) sofern der Vektorraum V (K) komplex ist, ansonsten müssen sie reell sein (K 0 = R).
Es existiert ein Nullvektor  unter Addition, so dass
 + χ = χ,
C.1.2
0χ = ,
α = 
∀χ ∈ V (K),
∀α ∈ K 0 .
(C.7)
Operatoren und ihre Wirkung auf Elemente von Vektorräumen
An dieser Stelle wollen wir uns auf die Definition von linearen Operatoren besinnen und uns
b : V (K) → V 0 (K) dederen Eigenschaften in Erinnerung rufen. Ein linearer Operator O
finiert eine lineare, strukturerhaltende Abbildung (Homomorphismus) zwischen zwei Vektorräumen V (K) und V 0 (K) über einem gemeinsamen Körper K. Im Folgenden betrachen
80
wir Vektoren χ ≡ χ1 , χ2 ∈ V (K) und einen Skalar α, der je nach Eigenschaften von V (K)
reell oder komplexwertig ist. In diesem Fall gilt:
1. Lineare Operatoren sind homogen, d.h.
b
b
O(αχ)
= αOχ.
(C.8)
2. Lineare Operatoren sind additiv, d.h.
b 1 + χ2 ) = Oχ
b 1 + Oχ
b 2.
O(χ
(C.9)
b Oχ
b 1 , Oχ
b 2 Elemente von V 0 (K). Alle durch OV
b (K) darHierbei sind die Vektoren Oχ,
0
stellbaren Elemente von V (K) sind das Bild von V (K). Alle Elemente von V (K), die
b auf V 0 (K) abgebildet werden, bilden zusammen das Urbild von
durch Anwendung von O
b−1 : V 0 (K) → V (K) wird als inverser
V 0 (K). Der durch das Urbild definierte Operator O
Operator bezeichnet. Alle Elemente von V (K), die auf den Nullvektor in V 0 (K) abgebildet
b
werden, liegen im Kern des Operators, ker O.
b sowie der Nulloperator 0,
b deren defiZwei spezielle Operatoren sind der Einsoperator 1
b = χ und 0χ
b =  gegeben
nierende Eigenschaften (für beliebiges χ ∈ V (K)) durch 1χ
b das Urbild des Bilds von V (K) wieder gleich V (K) ist,
sind. Wenn für den Operator O
b zugeordnete Abbildung bijektiv, d.h. das Urbild jedes einzelnen
ist die dem Operator O
0
Elements von V (K) ist genau einelementig. Insbesondere kann dies nur erfüllt sein, wenn
b (und des inversen Operators O
b−1 ) lediglich aus dem Nullvektor
der Kern des Operators O
 besteht.
Nicht alle Operatoren sind linear, z.B. ist leicht zu sehen, dass auf dem Raum L2 (R3 ) der
b
Operator Oχ(x)
= χ2 (x) nicht linear ist. Ein spezielle Typ von nicht-linearen Operatoren
b
sind antilineare Operatoren. Diese sind antihomogen, d.h ein antilinearer Operator A
erfüllt anstelle von Glg. (C.8)
b
b
A(αχ)
= α∗ Aχ.
(C.10)
Für lineare Operatoren sind Addition, Skalarmultiplikation und Verknüpfung (Operatorb≡O
b1 , O
b2 : V1 (K) → V2 (K) sowie O
b3 : V2 (K) →
produkt) definiert. Für die Operatoren O
V3 (K) gilt
b1 + O
b2 )χ = O
b1 χ + O
b2 χ,
(O
b = α(Oχ),
b
(αO)χ
(C.11)
b3 O
b2 )χ = O
b3 (O
b2 χ),
(O
(C.13)
(C.12)
wobei der Vektor χ ∈ V (K) und der Skalar α in den dem Problem entsprechenden Räumen
liegen.
b1 , O
b2 : V (K) → V (K) gilt nicht zwangsläufig, dass diese kommuFür zwei Operatoren O
tieren, d.h. der Kommutator
b1 , O
b2 ] = O
b1 O
b2 − O
b2 O
b1
[O
(C.14)
ist nicht notwendigerweise für beliebige Vektoren von Null (bzw. vom Nulloperator) verschieden.
81
C.1.3
Skalarprodukt und Norm
Ein Vektorraum V (K), auf dem für zwei beliebige Vektoren χ1 und χ2 ein Skalarprodukt
definiert ist, heißt auch Skalarproduktraum und ist normiert, d.h. eine Norm ist definiert.
Je nachdem ob der Vektorraum reell oder komplex ist, ist das Skalarprodukt eine Abbildung auf den Körper der reellen oder komplexen Zahlen, welche folgende drei Bedingungen
erfüllt:
1. Das Skalarprodukt von χ1 und χ2 ist die komplex konjugierte Zahl zum Skalarprodukt von χ2 und χ1 . Zum klareren Verständnis in Formeln:
hχ1 |χ2 i = hχ2 |χ1 i∗ .
(C.15)
2. Das Skalarprodukt von χ1 und χ2 ist linear im zweiten Faktor, d.h. in χ2 . Zum
klareren Verständnis mit Vektoren χ1 , χ2 und χ3 and Skalaren α1 und α2 :
hχ3 |α1 χ1 + α2 χ2 i = α1 hχ3 |χ1 i + α2 hχ3 |χ2 i .
(C.16)
3. Das Skalarprodukt eines Vektors χ mit sich selbst ist eine relle, nicht-negative Zahl
(Positivität):
hχ|χi ≥ 0,
(C.17)
und falls hχ|χi = 0, gilt notwendigerweise χ = .
Aufgrund seiner Positivität definiert Glg. (C.17) die Norm des Vektors χ:
Nχ ≡ kχk2 ≡ hχ|χi ≥ 0.
(C.18)
Mittels Glg. (C.15) und Glg. (C.16) findet man leicht, dass das Skalarprodukt hχ1 , χ2 i
nicht linear sondern anti-linear im ersten Faktor χ1 ist:
hα1 χ1 + α2 χ2 , χ3 i = α1∗ hχ1 , χ3 i + α2∗ hχ2 , χ3 i .
(C.19)
Aus diesen drei Eigenschaften lässt sich eine sehr wichtige Eigenschaft des Skalarprodukts herleiten, die Scharz’sche Ungleichung (auch: Cauchy-Schwarz’sche Ungleichung
oder Dreiecksungleichung):
p
(C.20)
|hχ1 , χ2 i| ≤ hχ1 , χ1 i hχ2 , χ2 i.
Gleichheit gilt dann und nur dann wenn χ1 und χ2 Vielfache voneinander sind.
C.1.4
Weitere Eigenschaften: Operatornorm, Beschränktheit
b : V (K) → V 0 (K), der von einem normierten Vektorraum
Für einen linearen Operator O
auf einen anderen (nicht notwendigerweise verschiedenen) normierten Vektorraum abbildet, kann man eine Operatornorm definieren:
b Oχ 0
b
b V
≡ sup Oχ
(C.21)
O ≡ sup
0.
V
χ∈V,χ6= kχkV
kχkV =1
Hierbei sind V und V 0 selbstverständlich als V (K) und V 0 (K) zu verstehen. Ein Operator,
dessen Operatornorm endlich ist heißt beschränkt.
82
C.1.5
Lineare Abhängigkeit, Orthogonalität, Vollständigkeit, Basis, Dimensionalität
Man nennt eine Satz von Vektoren χ1 , χ2 , . . . , χN dann und nur dann linear unabhängig,
sofern keine Linearkombination existiert, die
N
X
αn χ n = 
(C.22)
n=1
erfüllt, außer der trivialen Linearkombination, d.h. jener, für welche alle Koeffizienten
einzeln verschwinden, d.h. αn = 0 ∀n ∈ {1, . . . , N }. In diesem Fall kann keiner dieser
Vektoren als eine Linearkombination der anderen geschrieben werden. Andernfalls nennt
man den Satz der Vektoren χ1 , χ2 , . . . , χN linear abhängig.
Man nennt zwei Vektoren zueinander orthogonal, wenn ihr Skalarprodukt verschwindet:
hχ1 | χ2 i = 0
⇔
χ1 ⊥ χ2 .
(C.23)
In diesem Fall sind diese Vektoren auch voneinander linear unabhängig. Ein Satz paarweise
zueinander orthogonaler Vektoren ist automatisch linear unabhängig, der Umkehrschluss
gilt aber nicht. Man kann aber immer einen Satz von N Linearkombinationen der N linear
unabhängigen Vektoren bilden, so dass diese N Linearkombinationen paarweise zueinander
orthogonal sind. Dieses Verfahren nennt man auch Orthogonalisierung.
Falls jeder Vektor χ eines Vektorraums als eine Linearkombination der Vektoren χ1 ,
χ2 , . . . χN dargestellt werden kann, so nennt man den Satz der Vektoren χ1 , χ2 , . . . χN
vollständig. Die Vektoren eines vollständigen Satzes müssen nicht zwangsläufig linear unabhängig sein. Indem man solange Vektoren aus dem vollständigen Satz entfernt bis der
verbleibendende Satz linear unabhängig ist, erhält man einen maximalen Satz linear unabhängiger Vektoren (der selbstverständlich immer noch vollständig ist). Nachdem man
diesen maximalen Satz linear unabhängiger Vektoren orthogonalisiert hat, erhält man eine
sogenannte Basis des Vektorraums. Nachdem man diese Basisvektoren alle normiert hat,
so dass ihre Norm gleich eins ist, spricht man von einer Orthonormalbasis (ONB). Im Fall
normierter orthogonaler Vektoren spricht man auch von Orthonormalität. Die Dimension
d eines Vektorraums V ist die maximale Zahl linear unabhängiger Vektoren.
Ein Hilbertraum H ist ein solcher Vektorraum mit allen zuvor in diesem Abschnitt genannten Eigenschaften sowie der zusätzlichen Eigenschaft, dass dieser entweder endliche
Dimensionalität hat (d < ∞), oder, dass einen unendlichen, vollständigen Satz von paarweise zueinander orthogonalen Vektoren χ1 , χ2 , . . . , χn , . . . ∈ H gibt,
dass man für jeden
Pso
∞
einzelnen Vektor χ Zahlen α1 , α2 , . . . , αn , . . . finden kann, so dass i=1 αi χi zu χ konvergiert.PDies bedeutet, dass für ausreichend großes N die Norm der Differenz der Vektoren
χ− N
i=1 αi χi verschwindet
N
X
lim χ −
αi χi = 0.
(C.24)
N →∞ i=1
83
C.2
Eigenschaften von Hilberträumen
Der Funktionenraum der quadrat-integrablen Funktionen (L2 Funktionen) besitzt die Eigenschaften eines (komplexen) Hilbertraums. Dies werden wir im folgenden zeigen. Zunächst handelt es sich um einen linearen Raum, d.h. wenn χ1 (x) und χ2 (x) zwei quadratintegrable Funktionen sind, dann sind auch ihre Summe sowie das Produkt jeder einzelnen
mit einer beliebigen komplexen Zahl und folglich auch jegliche Linearkombination quadratintegrable Funktionen, z.B.
α1 χ1 (x) + α2 χ2 (x),
(C.25)
wobei α1 und α2 beliebig wählbare komplexe Zahlen sind. Desweiteren kann man auf
diesem Hilbertraum ein Skalarprodukt definieren. Dieses Skalarprodukt ist eine komplexe
Zahl. Gemäß seiner Definition ist das Skalarprodukt der Funktion χ1 (x) mit der Funktion
χ2 (x)
Z
hχ1 |χ2 i =
d3 x1 . . . d3 xn χ∗1 (x1 , . . . , xn )χ2 (x1 , . . . , xn ).
(C.26)
Dieses L2 Skalarprodukt hat die drei fundamentalen Eigenschaften aus den Glgn. (C.15),
(C.16) und (C.17), wie man mittels seiner Definition, vgl. Glg. (C.26), leicht beweisen
kann. Falls das Skalarprodukt der Funktionen χ1 (x) und χ2 (x) verschwindet, nennt man
diese zueinander orthogonal. Die Norm Nχ einer Funktion χ ist als Skalarprodukt dieser
Funktion mit sich selbst definiert, vgl. Glg. (C.18), d.h.
Nχ = kχk2 = hχ|χi .
(C.27)
Die Schwarz’sche Ungleichung gilt selbstverständlich auch für das durch Glg. (C.26) definierte Skalarprodukt und garantiert, dass das Integral in vgl. Glg. (C.26) konvergiert,
wenn χ1 und χ2 beide quadrat-integrable Funktionen sind.
Zusätzlich zur Linearität und zur Möglichkeit ein Skalarprodukt zu definieren besitzt der
Raum der quadrat-integrablen (L2 ) Funktionen eine Eigenschaft namens Vollständigkeit.
Erst diese Eigenschaft ermöglicht die Identifikation des L2 Raums mit dem Hilbertraum.
Vollständigkeit bedeuted, dass jeder Satz von quadrat-integrablen Funktionen, die das
Cauchy-Kriterium erfüllen, im quadratischen Mittel zu einer quadrat-integrablen Funktion
konvergiert. Im Gegenzug bedeutet dies, dass jede quadrat-integrable Funktion als der
Grenzwert (im quadratischen Mittel) einer konvergenten Reihe (im Sinne von Cauchy)
von quadrat-integrablen Funktionen aufgefasst werden kann (lineare Separierbarkeit).
84
D
D.1
Abbildungen und Tabellen
Abbildungen
Abbildung D.1: Energiedichte u(ω(λ), T ) der Schwarzkörperstrahlung als Funktion der Temperatur (Abb. aus Wikipedia). Als Abzisse ist die Wellenlänge λ aufgetragen.
Abbildung D.2: Schematisch: mit Strahlung gefüllter Hohlraum (Abb. aus [6]).
Abbildung D.3:
Schematisch: Energiedichte u(ω, T ) der Schwarzkörperstrahlung mit
Grenzfällen: Rayleigh-Jeans und Wien’sches Verschiebungsgesetz (Abb. aus
[6]). Als Abzisse ist die Frequenz ω aufgetragen.
85
Abbildung D.4: Schematisch: Experimenteller Aufbau zur Messung des photoelektrischen
Effekts (Abb. aus Wikipedia).
Abbildung D.5: Photoelektrischer Effekt. Einfallende Lichtquanten ausreichend hoher Frequenz streuen an gebundenen Elektronen. Sofern die Auslösearbeit W überschritten wird, wird ein Elektron mit Energie E = ~ω − W emittiert.
Abbildung D.6: Schematisch: Experimenteller Aufbau zur Messung von Compton-Streuung:
(Abb. aus dem Web: Serlo).
Abbildung D.7: Typische Intensitätsverteilung für Compton-Streuung and Elektronen im
Kohlenstoff: gestreute Photonen (λ = 0.731 Å) haben im Vergleich zu ungestreuten Photonen (λ = 0.707 Å) Energie verloren (Abb. aus [6]).
86
Abbildung D.8: Schematisch: ein Photon streut an einem ruhenden Elektron. Die Wellenlängenänderung ist eine Funktion des Streuwinkels ϕ (Abb. aus Wikipedia).
87
Abbildung D.9: Beispiele: Emissionsspektrum von Quecksilber (links, Abb. aus Wikipedia).
Im zugehörigen Termschema (rechts, Abb. von www.licht-im-terrarium.de)
sind die Linien mit aufsteigender Wellenlänge den übergangen 3 S1 → 3 P0 (h
Linie), 3 S1 → 3 P1 (g Linie), 3 S1 → 3 P2 (e Linie) sowie 3 D2 → 1 P1 (orange
Doppellinie, nicht eingezeichnet) zugeordnet, vgl. z.B. NIST Handbuch.
Abbildung D.10: Beispiele: Emissionsspektrum (links) und Termschema (rechts) von Wasserstoff, (beide Abb. aus Wikipedia).
Abbildung D.11: Franck-Hertz Versuch: Schaltbild(rechts) und gemessener Strom bei Messungen mit Quecksilber(links), (beide Abb. aus Wikipedia). Die Beschleunigungsspannung Ub ist wesentlich größer als die Gegenspannung Ug .
88
Abbildung D.12: Schematisch: der Stern-Gerlach Versuch mit Silber-Atomen. 4 zeigt die klassisch erwartete und 5 die real beobachtete Verteilung (Abb. aus Wikipedia).
Abbildung D.13: Schematisch: die Experimente von Davisson und Germer (links) und von
Thomson (rechts), Abb. aus [5]. Die Beschreibung ist im vgl. Abschnitt 3.4
zu finden.
Abbildung D.14: Beugungsbilder in den Experimenten von Davisson und Germer (links)
und von Thomson (rechts). Beugungsbilder von 50 keV Elektronen auf einen
Cu3 Au Schirm der Dicke 400 Å (rechts) und von 330 eV Elektronen an der
(1, 1, 0) Ebene eines Wolfram-Einkristalls, Abb. aus [5].
89
Abbildung D.15: Abhängigkeit der Interferenzmaxima von der Wellenlänge der Elektronen
bei Beugung an einem Nickel-Einkristall, Abb. aus [5].
Abbildung D.16: Aufbau eine Interferenzmusters aus Einschlägen einzelner Elektronen (Simulation), von links nach rechts 28, 1000 sowie 10000 Elektronen, Abb. aus
[5].
Abbildung D.17: Schematisch: Aufbau des Doppelspalt-(Gedanken-)experiments, Abb. aus
[5]. Die Beschreibung ist im vgl. Abschnitt 3.6 zu finden.
(d)
(a)
(b)
(c)
Abbildung D.18: Wahrscheinlichkeitsverteilung beim Doppelspaltexperiment, Abb. von Wikipedia (K.D. Keller). Die Beschreibung ist im vgl. Abschnitt 3.6 zu finden.
Abbildung D.19: Schematisch: Gedankenexperiment zur Unschärfe am Spalt, Abb. aus [5].
90
Abbildung D.20: Schematisch: Gedankenexperiment zur Unschärfe beim Mikroskop, Abb.
aus [5].
Abbildung D.21: Schematisch: ein Potential, dass im Unendlichen ausreichend schnell zu
Null abfällt, Abb. aus [5]. W < 0 entspricht der Energie E eines Bindungszustands, U ist das Potential.
Abbildung D.22: Schematisch: geladene Teilchen auf Kreisbahnen im Magentfeld für verschiedene Energien, Abb. aus [5]. W (j) sind die Grenzen der verschiedenen
Energieintervalle.
Abbildung D.23: Schematisch: unendlich tiefer Potentialtopf (Abb. aus [1]).
91
Abbildung D.24: Schematisch: gerade und ungerade Lösungen zum unendlich tiefen Potentialtopf (Abb. aus [1]).
Abbildung D.25: Schematisch: Grundzustand beim dreidimensionalen Potentialtopf (Abb.
aus [1]).
Abbildung D.26: Schematisch: Streuung am eindimensionalen Potentialtopf (Abb. aus [1]).
Das einfallende Teilchen kommt von links.
92
Abbildung D.27: Schematisch: Resonanz beim eindimensionalen Potentialtopf (Abb. aus [1]).
Abbildung D.28: Schematisch: Tunneleffekt (Abb. aus [1]). Das einfallende Teilchen kommt
von links.
Abbildung D.29: Schematisch: Gamow Faktor (Abb. aus [1]). Ein beliebiges Potential wird
durch eine Reihe infinitesimal breiter Potentialstufen genähert, über die integriert wird.
93
Abbildung D.30: Schematisch: Alphazerfall (Abb. aus [1]).
94
D.2
Tabellen
Größe
Länge l
Masse m
Zeit t
Internat. System (SI)
Meter [m]
Kilogramm [kg]
Sekunde [s]
i
h
Energie E
Newton [N] = ms2kg
h 2 i
Joule [J] = ms2kg
Stromstärke I
Ampère [A]
Ladung Q
Coulomb [C] = [As]
i
h
Volt [V] = mAskg
3
Kraft F
Spannung U
Gauß’sches System
Zentimeter [cm] = 10−2 [m]
Gramm [g] = 10−3 [kg]
Sekunde [s]
g
= 10−5 [N]
Dyn [dyn] = cm
2
h s2 i
Erg [erg] = cms2 g = 10−7 [J]
q
m
1 s
cm3 g
(StatA) esu
=
= 10c
[A]
s
s4
q
m
1 s
cm3 g
= 10c
[C]
ESU [esu] =
s2
m
erg p cm g 106
= c s [V]
(StatV) esu
=
s2
Tabelle 1: Eine unvollständige Liste einiger physikalische Größen in verschiedenen Einheitensystemen. Die Einheiten sind derart ausgewählt, dass sie für die Vorlesung relevant
sind. Basiseinheiten der jeweiligen Maßsysteme sind fettgedruckt. in den Umrechnungen werden die Naturkonstanten c und kB aus Tabelle Tab. (2) verwendet.
Konstante
Lichtgeschwindigkeit
Elementarladung
Boltzmann-Konstante
Planck’sche Konstante
Elektronenruhemasse
Symbol
c
e
kB
h
~
me
Protonenruhemasse
mp
Rydberg-Konstante
R∞
Internat. System
299792458 ms
1.6021766208(98) × 10−19 C
J
1.38064852(79) × 10−23 K
−34
6.626070040(81) × 10 J s
1.054571800(13) × 10−34 J s
9.10938215(45) × 10−31 kg
0.510998910(13) MeV
c2
1.672621898(21) × 10−27 kg
938.2720813(58) MeV
c2
10973731.568508(65)m
Gauß’sches System
29979245800 cm
s
4.80320425(10) × 10−10 esu
1.38064852(79) × 10−16 erg
K
6.626070040(81) × 10−27 erg s
1.054571800(13) × 10−27 erg s
9.10938215(45) × 10−28 g
1.672621898(21) × 10−24 g
1836.15267389(17) me
1097373156.8508(65)cm
Tabelle 2: Eine unvollständige Liste einiger Naturkonstanten.
Wellenlänge λ [cm]
3 × 104 (Radiowellen)
1 (Mikrowellen)
4 − 8 × 10−5 (sichtbares Licht)
10−8 (Röntgenstrahlung)
10−11 (Gammastrahlung)
Frequenz ν [Hz]
106
3 × 101 0
7.5 − 3.7 × 101 4
3 × 1018
3 × 1021
Energie hν [eV ]
4.1 × 10−9
1.2 × 10−4
3 − 1.5
1.2 × 104
1.2 × 107
Tabelle 3: Typische Wellenlängen, Frequenzen und Energie zu den verschiedenen Spektralbereichen des Lichts [1 eV = 1.602 × 10−19 J] (Tab. aus [5]).
Element W
W [eV] 4.5
Ta
4.2
Ni
4.6
Ag
4.8
Cs
1.8
Pt
5.3
Tabelle 4: Gemessene Werte für Austrittsarbeiten W einiger Metalle [1 eV = 1.602 × 10−19 J]
(Tab. aus [6]).
95
Teilchen
λ [Å]
Wasserstoffatom
1.46
Wasserstoffmolekül 1.03
Heliumatom
0.72
Quecksilberatom
0.10
Tabelle 5: Mittlere thermische Wellenlängen einiger Atome und Moleküle bei Raumtemperatur
(Tab. aus [5]).
Literatur
[1] R. Bertlmann, N. Friis, “Theoretical Physics T2 Quantum Mechanics”
http://homepage.univie.ac.at/Reinhold.Bertlmann/
[2] R.P. Feynman, R.B. Leighton, M. Sands, “The Feynman Lectures on Physics (vol
III),” Reading Massachusetts, US: Addison-Wesley (1963) 338 p
[3] A. Messiah, “Quantum Mechanics, Volume I”, Amsterdam, Netherlands:
North-Holland Publishing Company (1958) 504 p
[4] A. Messiah, “Quantum Mechanics, Volume II”, Amsterdam, Netherlands:
North-Holland Publishing Company (1958) 632 p
[5] G.M. Prosperi, . . .
[6] F. Schwabl, “Quantenmechanik (QM I),” Berlin, Germany: Springer (2007) 430 p
[7] S. Weinberg, “Lectures on Quantum Mechanics”, Cambridge, UK: Cambridge
University Press, (2013) 358 p
96
Herunterladen
Explore flashcards