Grundlagen der Quantenmechanik und Statistik

Werbung
Grundlagen der
Quantenmechanik und Statistik
Teil I: Quantenmechanik
Vorlesungen an der Ruhruniversität Bochum
K.–U. Riemann
Inhaltsverzeichnis
1. Einführung
1.1 Historische Ausgangssituation
Lord Kelvins dunkle Wolken
1
1.2 Korpuskeleigenschaft des Lichts
2
1.3 Welleneigenschaften der Materie
3
1.4 Welle–Teilchen–Dualismus und Komplementarität
Positivismus und Realismus
4
1.5 Grundbegriffe der Wellenbeschreibung
Dispersionsgleichung
Phasen– und Gruppengeschwindigkeit
Unschärfeprodukt
6
1.6 Grundbegriffe der Wahrscheinlichkeitsrechnung
Kolmogorovsches Axiomensystem
Diskrete und kontinuierliche Zufallsvariablen
Mittelwerte, Momente, Varianz
9
2. Die Schrödingergleichung
2.1 Entwicklung der Wellengleichung
Das Korrespondenzprinzip
12
2.2 Formale Eigenschaften der Schrödingergleichung
14
2.3 Die Kontinuitätsgleichung
Die Teilchen–Stromdichte
15
2.4 Erwartungswerte und Operatoren
Der Impulsoperator
Der Hamiltonoperator
Der Drehimpulsoperator
Hermitesche Operatoren
Hilbertraum und Dualraum, bra– und ket–Vektoren
18
2.5 Das Theorem von Ehrenfest
22
i
2.6 Die Heisenbergsche Unschärferelation
Die Orts–Impuls–Unschärfe
Die allgemeine Unschärferelation
Die Drehimpuls–Unschärfe
Heisenbergs Gedankenexperiment
Die Energie–Zeit–Unschärfe
25
3. Spezielle Lösungen der Schrödingergleichung
3.1 Entwicklung nach Eigenfunktionen des Hamiltonoperators
Die stationäre Schrödingergleichung
Das Eigenwertproblen Hermitescher Operatoren
Vollständigkeit
Diskretes und kontinuierliches Spektrum
33
3.2 Der harmonische Oszillator
Konstruktion der Eigenwerte und Eigenfunktionen
Interpretation und Vergleich mit der klassischen Mechanik
Auswahlregeln
37
3.3 Die Potentialmulde: Diskretes und kontinuierliches Spektrum
Durchlässikeit und Reflexion
Ausstrahlungsbedingung
48
3.4 Das eindimensionale Kastenpotential
52
3.5 Potentialbarriere und Tunneleffekt
58
3.6 Kugelsymmetrische Potentiale im dreidimensionalen Raum
Separation der Schrödingergleichung
Kugelflächenfunktionen und Drehimpuls–Eigenfunktionen
Die Quantenzahlen l und m, Richtungsquantelung
Effektives Potential und radiale Schrödingergleichung
59
3.7 Das Wasserstoffatom
Haupt– und Neben–Quantenzahlen, Entartung
Interpretation und Vergleich mit der klassischen Mechanik
Selbskonsistenz, das Problem der Selbstenergie
67
4. Mehrteilchensysteme
4.1 Die Schrödingergleichung
74
ii
4.2 Identische Teilchen und Spin
Die Ununterscheidbarkeit identischer Teilchen
Symmetrische und antisymmetrische Wellenfunktionen
Bosonen und Fermionen, Pauliprinzip
75
4.3 Atombau und periodisches System der Elemente
Das Schalenmodell, s–, p–, d– und f –Zustände
Hauptgruppen, Nebengruppen, Lanthanoide und Aktinoide
78
4.4 Die Bildung von Molekülen
Heteropolare und homöopolare Bindung
Das Wasserstoffmolekül, Austauschkraft
81
5. Die Interpretation der Quantenmechanik
5.1 Der Formalismus
Zustandsvektoren und Operatoren, Kommutatoren
Darstellungen und Bilder
Heisenbergbild und Heisenberggleichung
Eigenwerte und Eigenvektoren, Spektrum
Entwicklung nach Eigenvektoren
Bornsche Interpretation
84
5.2 Meßprozeß und Zustandsvektor
Die Reproduzierbarkeit der Messung
Meßwerte und Eigenwerte
Das Problem der Entartung
Kommensurable und inkommensurable Observable
Die Reduktion des Zustandsvektors
87
5.3 Das Einstein-Podolsky-Rosen (EPR)–Paradoxon
Vollständigkeit einer Theorie
Physikalische Realität
Die störungsfreie Messung
Bohms Version des EPR–Experiments
Die Originalversion des EPR–Experiments
Positivismus und Realismus
90
5.4 Schrödinger und seine Katze
Korrespondenz zur klassischen Mechanik
Erwartungskatalog und Ensembleinterpretation
Empirischer Standpunkt und Vollständigkeitspostulat
Der berühmte “burleske Fall”
94
iii
5.5 Verborgene Parameter und Bohms Interpretation
Vergleich mit der Hamilton–Jakobi–Theorie
Das Quantenpotential
de Broglies Führungswellen
Quantenpotential und Kenntnisstand
95
5.6 Lokalität und Bellsche Ungleichung
Das Problem der Lokalität und Separabilität
Konsequenzen des EPR–Experiments
Die Bellsche Ungleichung
Quantenmechanik und Verschränkung
97
100
Literaturhinweise
iv
1
Einführung
1.1
Historische Ausgangssituation
Nach
• Kepler, Galilei und Newton... (Materie)
• Huygens... (Licht)
• Faraday, Maxwell (Feldbegriff, Elektrodynamik)
• Boltzmann...(Brücke von der mikroskopischen zur makroskopischen Physik)
hielt man gegen Ende des 19. Jahrhunderts die Physik im wesentlichen für abgeschlossen: künftige Probleme sah man nur noch in der Auswertung bekannter
Grundgesetze unter komplexen Bedingungen.
Allerdings sah Lord Kelvin (* William Thomson 1824) “Zwei kleine dunkle
Wolken” am Horizont.
– Das negative Ergebnis des Versuches von Michelson und Morley und
– die “Ultraviolettkatastrophe” des Rayleigh–Jeansschen Strahlungsgesetzes
u(ν, T ) ∼ ν 2 T.
Diese kleinen dunklen Wolken am Horizont lösten sich nicht auf, sondern führten
zu heftigen Gewittern, die die Grundpfosten der klassischen Physik erschütterten.
Der negative Ausgang des Michelson–Morley–Experiments führte zur Relativitätstheorie, die unsere angeborene Anschauung von Raum und Zeit ad absurdum führt (vgl. Raum und Zeit bei Newton!).
Noch tiefgreifender erwies sich die Umwälzung durch die zweite dunkle Wolke, die
zur Quantentheorie führte. Die Diskussion um ihre erkenntnistheoretische und
naturphilosophische Implikation ist bis heute nicht abgeschlossen, die Grundproblematik ist ungeklärt.
Neben der erwähnten Ultraviolettkatastrophe gab es weitere experimentelle Erfahrungen, die zu Grundpfeilern der Quantentheorie wurden:
1
• Die spezifische Wärme fester Körper cv ist nach der klassischen Theorie
konstant (Dulong–Petitsches Gesetz). Experimentell findet man jedoch,
daß cv für T → 0 gegen 0 geht.
• Beim Photoeffekt lassen sich auch bei (fast) beliebig gesteigerter Intensität
nur oberhalb einer Grenzfrequenz Elektronen aus einem Metall auslösen.
• Im Gegensatz zur klassischen Erwartung aus dem Rutherfordschen Atommodell sind Atome im Grundzustand stabil. “Angeregte” Atome senden
kein kontinuierliches Spektrum, sondern diskrete Linienstrahlung aus. Sie
können Energie nur in diskreten “Quanten” aufnehmen (Franck – Hertz).
1.2
Korpuskeleigenschaft des Lichts
Ein Teil dieser seltsamen Resultate (Photoeffekt [Einstein] und Hohlraumstrahlung [Planck]), ließ sich nur verstehen und dann sogar quantitativ richtig beschreiben, wenn man Huygens Erkenntnis der Wellennatur des Lichts zumindest
teilweise wieder aufgab und durch ein Konzept von Teilchen, sogenannten Photonen (Einstein 1905), mit einer Energie
E = hν = h̄ω
(1)
ersetzte. Dabei ist
h = 6.626 · 10−34 Js bzw. h̄ =
h
= 1.055 · 10−34 Js
2π
(2)
die selbe Konstante, die Planck 1900 für sein halbempirisches Strahlungsgesetz1
u(ν, T ) =
8πν 2 hν
hν
c2 e kT
−1
(3)
eingeführt hatte. Durch die Verbindung einer Welleneigenschaft, der Frequenz ν,
mit einer Teilchenenergie E trägt (1) bereits den Keim des berühmten “Welle–
Teilchen–Dualismus” in sich. Über E = mc2 können wir dem Photon eine
Masse m = hν/c2 zuordnen. Damit erhält das Photon einen Teilchen–Impuls
p = mc =
h
hν
= = h̄k
c
λ
,
(4)
der mit der anderen Welleneigenschaft, der Wellenlänge λ bzw. der Wellenzahl
2
Beachte, daß (3) für kleine ν in das Rayleigh–Jeansschen Strahlungsgesetz u → 8πk
c2 ν T
3
hν
− kT
übergeht. Statt der UV–Katastrophe erhält man für große ν die Formel u → 8πhν
, deren
c2 e
Form bereits Wien (1896) angegeben hatte!
1
2
k=
2π
λ
(5)
verknüpft ist. Die Verknüpfung erfolgt in beiden Formeln (1) und (4) durch das
Plancksche Wirkungsquantum h (bzw. h̄). Die experimentelle Bestätigung
von Gleichung (4) ergibt sich aus der Streuung von Photonen (Röntgenstrahlen)
an Elektronen (Compton–Effekt, 1923).
1.3
Welleneigenschaften der Materie
Nicht alle unverstandenen Erfahrungen ließen sich auf Photonen zurückführen.
Zur Erklärung der Atomspektren führten Bohr (1913) und Sommerfeld (1916)
die Quantenbedingung
I
pdq = nh
(6)
für periodische Systeme ein. Hierauf fußt die “alte Quantentheorie”, auf die wir
hier nicht näher eingehen. Mit der Bedingung (6) ist im “Bohrschen Atommodell” nur ein diskreter Satz von Elektronenbahnen mit “Energieniveaus” En
erlaubt. Die Spektren erklären sich dann aus der Frequenzbedingung
En − Em = hνnm .
(7)
Einen wesentlich radikaleren Schritt vollzog de Broglie (Dissertation 1923/24),
indem er die Beziehungen
ν = E/h bzw. E = h̄ω
(8)
λ = h/p bzw. p = h̄k,
(9)
und
die Einstein für Photonen postuliert hatte, auf materielle Teilchen wie Elektronen und Protonen übertrug und die Vorstellung von Materiewellen entwickelte.
Im Rahmen dieses Wellenbildes läßt sich die Quantenbedingung (6) anschaulich
über stehende Elektronenwellen deuten:
n=
I
dx
1I
pdq
=
λ
h
−
3
+
Der Nachweis der Wellennatur von Materie gelang Davisson und Germer (1927)
durch Interferenzerscheinungen bei der Reflexion von Elektronen an Kristallen.
Die Tatsache, daß die Wellennatur der Materie länger verborgen blieb als die
des Lichts, liegt an der kleinen Wellenlänge, die dem großen Impuls materieller
Teilchen (m0 6= 0) entspricht.
1.4
Welle–Teilchen–Dualismus und Komplementarität
Sowohl die Materie als auch das Licht zeigen also je nach den experimentellen
Bedingungen entweder Teilchen– oder Wellencharakter. Diese komplementären
Beschreibungen sind weder in unserer Anschauung noch im Experiment simultan
realisierbar: Jeder Versuch, den einen Aspekt deutlich herauszuarbeiten, zerstört
den anderen und umgekehrt. Wir wollen das kurz an einem Doppelspaltexperiment
erläutern: Ein Licht– oder Materiestrom falle auf eine Blende B mit Doppelspalt
D1 , D 2
S
B
D1
D2
Auf einem Schirm S hinter der Blende beobachten wir die Intensität als Interferenzmuster. Dieses Interferenzmuster spiegelt die Wellennatur unseres einfallenden Stromes wieder.
Vom Teilchenbild her geht ein Teil der Partikel durch D1 und ein anderer Teil
durch D2 . Das Interferenzmuster wird auch dann beobachtet, wenn der Teilchenstrom so reduziert wird, daß nur “selten” jeweils ein Teilchen auf den Schirm
trifft. Eine Wechselwirkung verschiedener Teilchen ist dann ausgeschlossen und
es liegt nahe, jeweils zu untersuchen, durch welchen der beiden Spalte D1 oder D2
die Teilchen gehen. Aber jeder Versuch, eine Entscheidung zwischen D1 oder D2
zu treffen zerstört das Interferenzmuster! Beobachte ich also den Teilchenaspekt,
verliert sich der Wellenaspekt und umgekehrt (Komplementaritätsprinzip).
Ein ganz wichtiger Punkt dabei ist, daß diese Komplementarität nicht auf einer
speziellen Struktur bestimmter Elementarteilchen wie Elektronen oder Photonen
beruht, sondern ein allgemeines Prinzip darstellt, dem jede physikalische Beobachtung unterliegt. Mit der Betonung des Wortes “Beobachtung” deuten wir bereits
4
hier das (scheinbar) subjektive Element an, das die Quantentheorie in die Physik gebracht hat: Wir begnügen uns mit der mathematischen Beschreibung von
Phänomenen, die wir bei bestimmten Experimenten mit Elektronen oder Photonen beobachten, müssen aber auf Aussagen über das Elektron oder Photon (oder
Stück Kreide?!) an sich verzichten! Genau hier liegt der Kern des immer noch
nicht ganz ausgeräumten Gegensatzes zwischen
– POSITIVISMUS (Kopenhagener Schule, Bohr, Heisenberg) und
– REALISMUS (de Broglie, Schrödinger, Einstein: Ändert sich das Weltall,
wenn eine Maus es anschaut?)
Das Komplementaritätsprinzip, das die simultane Bestimmung von Wellen– und
Teilchenaspekten verbietet, ist eng mit der berühmten Unschärferelation verknüpft: Ich kann nicht gleichzeitig den Teilchenort x und die Wellenlänge λ (genau) messen. Wegen der de Broglieschen Beziehung (9) heißt das aber, daß
nicht gleichzeitig der Ort und der Impuls eines Teilchens genau angegeben werden können. Genau die werden aber als Anfangsbedingungen in der klassischen
Mechanik benötigt. Damit bricht also das deterministische Weltbild der klassischen Mechanik grundsätzlich zusammen!
Was bleibt im Teilchenbild, wenn wir den Ort eines Teilchens nicht mehr genau
angeben können? Eine mehr oder weniger diffuse Information über die Aufenthaltswahrscheinlichkeit des Teilchens. [Ebenso entspricht der Unkenntnis über den
genauen Impuls eine Wahrscheinlichkeitsverteilung aller möglichen Impulse.]
Wenn wir ins Wellenbild wechseln, so liegt es nahe, die Aufenthaltswahrscheinlichkeit eines Teilchens mit der Intensität, also dem Amplitudenquadrat der entsprechenden Welle zu identifizieren. Die Wahrscheinlichkeitsinterpretation der Wellenamplitude löst auch den Widerspruch zwischen kontinuierlichem Welleneinfall
und diskreter Registrierung von Ereignissen auf dem Schirm bei geringer Intensität.
In dieser Wahrscheinlichkeitsinterpretation selbst sind sich zwar die Positivisten
(Kopenhagen) und Realisten einig, ihr Hintergrund ist aber umstritten: Ist es
wirklich sinnlos nach dem Ort und dem Impuls eines Teilchens zu fragen oder ist
die Natur nur zu “schamhaft”, uns beide Größen preiszugeben? Sind wir vielleicht
beim Experimentieren (notwendigerweise) so grob, daß wir die komplementäre
Information zerstören? Natürlich kennen wir auch sonst die Störung eines Systems
durch eine Messung, aber innerhalb der Gültigkeit der klassischen Physik läßt sich
diese Störung im Prinzip beliebig klein machen (oder sogar wegrechnen).
In der Quantenmechanik müssen wir uns dagegen prinzipiell mit einer gewissen
Unkenntnis und entsprechenden Wahrscheinlichkeiten begnügen. Für die Positivisten ist die Physik mit diesen Wahrscheinlichkeiten vollständig beschrieben.
Die Realisten möchten dagegen an einer an sich deterministischen Welt festhalten
(Einstein: Gott würfelt nicht!), akzeptieren dabei aber, daß diese deterministi5
sche Welt für uns nicht vollständig erfaßbar ist.
Wir werden auf diese und ähnliche Fragen noch verschiedentlich zurückkommen,
wenn wir uns in diesem Semester mit Quantenmechanik befassen. Damit meinen
wir konkret, daß wir dem Teilchenbild der klassischen Mechanik ein Wellenbild
der Materie gegenüberstellen, das im Rahmen eines Wahrscheinlichkeitskonzeptes
zu interpretieren ist.
Bevor wir im nächsten Kapitel dieses Programms konkretisieren, stellen wir zunächst
elementares Rüstzeug zur Beschreibung von Wellen und zur Beschreibung von
Wahrscheinlichkeiten zusammen.
1.5
Grundbegriffe der Wellenbeschreibung
Wir betrachten ebene harmonische Wellen der Form
(a) ψ = cos ϕ,
(b) ψ = sin ϕ
(10)
bzw.
(a) ψ = eiϕ ,
(b) ψ = e−iϕ
(11)
oder einer Linearkombination von (a) und (b). (Auf die formal oder inhaltlich
begründete komplexe Schreibweise wollen wir hier nicht elaborieren.) Über die
Phase
ϕ = kx − ωt bzw. ϕ = k · r − ωt
(12)
hängt ψ periodisch von der Zeit t und vom Ort x (eindimensional) bzw. r (dreidimensional) ab. ω = 2πν ist die Frequenz und k = 2π/λ die Wellenzahl (bzw. k
der Wellenvektor) der Welle. Punkte x = (ϕ0 + ωt)/k konstanter Phase ϕ0 (z. B.
Wellenberge) bewegen sich mit der Phasengeschwindigkeit
vp = ω/k.
(13)
Für Licht im Vakuum haben wir bekanntlich vp = c. Licht in Materie hat eine
andere Phasengeschwindigkeit, das Verhältnis c/vp = n wird Brechungsindex
genannt. (Beachte: n < 1 ist nicht verboten!) Ändert sich der Berechnungindex
bzw. die Phasengeschwindigkeit mit der Frequenz bzw. der Wellenlänge, spricht
man von Dispersion. Die Beziehung
ω = ω(k),
6
(14)
welche die Ausbreitung der Welle kontrolliert, wird daher allgemein Dispersionsgleichung genannt. Sind k oder ω dabei komplex, so sind die Wellen räumlich
oder zeitlich gedämpft.
Für die konkrete Anschrift einer ebenen Welle bevorzugen wir die Form (11a).
Der Einfachheit halber beschränkten wir uns außerdem soweit als möglich auf
den eindimensionalen Fall (12a). Mit einer (komplexen) Amplitude A schreiben
wir also eine ebene Welle in der Form
ψ(x, t) = Aei(kx−ωt)
(15)
an. Eine solche ebene Welle ist zeitlich wie räumlich unendlich ausgedehnt, ein
langweiliges, strukturloses Phänomen ohne jeden Informationsfluß. Um interessantere Phänomene wie Licht-Bilder, Geräusche und Musik darzustellen, benötigen wir Wellenpakete, die durch Überlagerung verschiedener ebener Wellen entstehen:
ψ(x, t) =
Z
A(k)ei[kx−ω(k)t] dk.
(16)
Daß wir mit solchen Überlagerungen räumlich und/oder zeitlich eng begrenzte
Strukturen erzeugen können (Lichtblitz, Knall), wissen wir aus zahlreichen Erfahrungen. Wir wollen uns dazu aber auch rechnerisch ein konkretes Beispiel ansehen
und betrachten eine Gaußverteilung
A(k) = e−
k 2 l2
2
der Amplituden mit einer Breite ∆k ∼ 1/l um k = 0. Dann hat die Welle zur
Zeit t = 0 die räumliche Struktur
ψ(x, 0) =
Z
2
2 2
e
− k 2l +ikx
=e
2
− x2
2l
2
=e
− x2
2l
Z
dk = e
Z
e
−
− x2
2l
e
e
dk =
−
2
kl
√
−i √x
2
2l
2 2
− k 2l
Z
2
k 2 l2
−ikx− x 2
2
2l
dk
dk
√
2π − x22
e 2l
l
Dies ist wieder eine Gaußverteilung, und zwar um x = 0 mit einer Breite ∆x ∼ l.
Je schmaler wir also die k-Verteilung wählen, um so breiter wird die x-Verteilung
und umgekehrt; und daß das Produkt
7
∆k · ∆x ∼ 1
(17)
an die Unschärferelation erinnert, ist gewiß kein Zufall: Man kann nicht gleichzeitig den Ort und die Wellenlänge eines Wellenpakets scharf angeben. (Für andere
Verteilungen als Gaußglocken wird das Unschärfeprodukt sogar noch größer.)
Ebensowenig läßt sich die Zeit und die Frequenz eines Wellenpakets simultan
angeben, denn wir erhalten ein entsprechendes Unschärfeprodukt
∆ω∆t ∼ 1
(18)
(oder noch größer): Ein Ton mit sauber definierter Tonhöhe muß lange andauern,
ein Ton zu kurzer Dauer ist kein Ton mehr, sondern ein Knall.
Wenn das Medium dispersionsfrei ist, wenn also die Phasengeschwindigkeit vp =
ω/k konstant ist, breitet sich unser Wellenpaket (16) unverzerrt mit konstanter
Geschwindigkeit vp aus. Denn wir erhalten mit ξ = x − vp t aus (16)
ψ(x, t) =
Z
A(k)eikξ dk = ψ(ξ, 0) = ψ(x − vp t, 0).
In einem Medium mit Dispersion dagegen breiten sich die verschiedenen Komponenten des Wellenpakets verschieden schnell aus und das Paket “zerläuft”
allmählich. Wenn jedoch die k–Verteilung hinreichend eng um die Wellenzahl
k0 liegt, erfolgt dieses Zerlaufen sehr langsam und wir können vorher noch sinnvoll nach der Ausbreitung des Wellenpakets fragen. Nehmen wir also an, daß
A(k0 + κ) = a(κ) nur für kleine κ von Null verschieden ist. Dann folgt aus (16)
ψ(x, t) = e
i(k0 x−ω0 t)
Z
a(κ)e
= ei(k0 x−ω0 t) f x −
iκ x− ∂ω
∂k |
∂ω ∂k t
k0
!
Die Welle läßt sich also als ebene Trägerwelle
ei(k0 x−ω0 t)
mit einem Modulations–Faktor
beschreiben:
∂ω f x−
t
∂k k0
8
k0
!
t
dκ
mit ω0 = ω(k0 ).
1.0
i(k0x−ωt)
f
0.5
e
0.0
x
−0.5
−1.0
−3.0
−2.0
−1.0
0.0
1.0
2.0
3.0
Während die Trägerwelle die Phasengeschwindigkeit ω0 /k0 aufweist, bewegt sich
der Modulationsfaktor — also der Bereich, in dem die Welle eine merkliche Amplitude aufweist — mit der Gruppengeschwindigkeit
vg =
∂ω
∂k
(19)
durch den Raum. Im Gegensatz zu der strukturlosen, langweiligen Trägerwelle
beinhaltet der Modulationsfaktor f die gesamte interessante Information oder das
Signal. vg wird daher auch Signalgeschwindigkeit genannt. Sie ist eine physikalisch
signifikante Größe und kann — im Gegensatz zu vp — nie die Lichtgeschwindigkeit
überschreiten.
1.6
Grundbegriffe der Wahrscheinlichkeitsrechnung
Wir ordnen irgendwelchen möglichen Ereignissen A Wahrscheinlichkeiten p(A) zu
und verstehen darunter die relative Häufigkeit
p(A) = n→∞
lim
nA
,
n
(20)
mit der das Ereignis A bei vielen (n → ∞) unabhängigen Versuchen unter gleichen Bedingungen auftritt (Beispiel: p (3 Augen) = 1/6 beim Würfeln). Die intuitive Anschauung faßt man mathematisch im Kolmogorovschen Axiomensystem2 zusammen, aus dem man Rechenregeln wie
2
p(A ∨ B) = p(A) + p(B) − p(A ∧ B)
(21)
p(¬A) = 1 − p(A)
(22)
Ereignisse A ⊂ Ω, p(A) : P(Ω) → R
p(B) und (iii) p(Ω) = 1.
mit (i) p(A) ≥ 0, (ii) p(A ∪
· B) = p(A) +
9
ableitet. Solche Rechenregeln benutzt man auch, um Wahrscheinlichkeiten für
Ereignisse zu formulieren, die man nicht durch die relative Häufigkeit bei vielen
Versuchen ermitteln kann. (Beispiel: p für den GAU eines Atomkraftwerkes).
Ereignisse A und B sind nicht notwendigerweise unabhängig voneinander. Man
nennt
p(A ∧ B)
p(A|B) :=
(23)
p(B)
die “bedingte Wahrscheinlichkeit für A, wenn B vorliegt”. Sind A und B unabhängig, ist p(A|B) = p(A), also gilt
p(A ∧ B) = p(A)p(B).
(24)
Bestehen die (Elementar–)Ereignisse Ai darin, daß eine Variable x die Werte
xi annimmt, nennt man x eine Zufallsvariable. Ist der Satz xi möglicher Werte
abzählbar, sprechen wir von einer diskreten Zufallsvariable. Dafür gilt
X
p(xi ) = 1.
(25)
i
Ist die Zufallsvariable kontinuierlich, müssen wir differentielle Wahrscheinlichkeiten p(x)dx mit
Z
p(x)dx = 1
(26)
betrachten. Abweichend von der Bezeichnung in der Mathematik ist es in der
Physik üblich, p(x) als Verteilungsfunktion zu bezeichnen. Wir werden nicht immer sauber zwischen der Anschrift (25) und (26) unterscheiden und daher beide
Ausdrücke ggf. sinngemäß umdeuten. Das gilt insbesondere für den Mischfall,
in dem eine Zufallsvariable bestimmte diskrete und bestimmte kontinuierliche
Werte annehmen kann (Beispiel: Energie eines Atoms). Wollen wir die jeweils
sinngemäße Interpretation betonen, schreiben wir auch
Z
X
p(x)dx = 1.
(27)
Natürlich kann eine Zufallsvariable auch mehrdimensional sein. Dabei denken wir
z. B. an den Ort r und verstehen (25)–(27) dann entsprechend als
Z
p(r)d3 r = 1
usw.
Mit der Verteilungfunktion definieren wir Mittelwerte
10
(28)
f¯ = hf (x)i =
Z
X
f (x)p(x)dx.
(29)
Die speziellen Mittelwerte
n
hx i =
Z
X
xn p(x)dx
(30)
heißen auch “Momente” der Verteilungsfunktion. Neben dem ersten Moment –
hxi, das den Mittelwert der Zufallsvariable angibt, ist insbesondere das zweite
Moment hx2 i von Bedeutung. Mit ihm erhält man die Varianz
(∆x)2 = h(x − hxi)2 i = hx2 i − hxi2 ,
(31)
welche die “Breite” der Verteilung repräsentiert.
Wie im Abschnitt 1.4 andiskutiert, wollen wir im folgenden das Amplitudenquadrat von Materiewellen als Aufenthaltswahrscheinlichkeit eines Teilchens interpretieren. Da wir unsere Wellen komplex ausschreiben wollen und p ≥ 0 gelten
muß, heißt das präzise, daß wir eine Wahrscheinlichkeitsverteilung
p(r, t) = ψ ∗ (r, t)ψ(r, t)
(32)
postulieren. Gemäß (28) muß die Wellenamplitude also die Nebenbedingung
Z
ψ ∗ (r, t)ψ(r, t)d3 r = 1
(33)
erfüllen. Irgendwelche Ortsfunktionen f (r) haben dann nach (29) den Mittelwert
f¯(t) =
Z
ψ ∗ (r, t)f (r)ψ(r, t)d3 r.
11
(34)
2
Die Schrödingergleichung
2.1
Entwicklung der Wellengleichung
Gemäß unserer Vorbesprechung möchten wir nun eine Wellengleichung aufstellen, welche die Ausbreitung der Materiewellen beschreibt. Dabei sollten wir uns
von vornherein klar darüber sein, daß wir die Wellengleichung nicht “herleiten” können – ebensowenig wie irgendeine andere Grundgleichung der Physik.
Vielmehr geht es darum, die Grundpostulate durch mehr oder weniger plausible
Ansätze zu erfüllen. Diese Ansätze werden dann im Laufe der Zeit durch Vergleich
von Theorie und Experiment erhärtet oder widerlegt.
Bezüglich der Grundgleichung für Materiewellen tappen wir besonders im Dunkeln, da wir der Wellenfunktion selbst keine direkte physikalische Bedeutung zumessen3 . Wir wissen lediglich, daß Interferenz auftreten kann. Darum schließen
wir auf ein Superpositionsprinzip und fordern eine lineare Gleichung.
Weiter wollen wir uns vom Korrespondenzprinzip (Bohr 1923) leiten lassen, nach
dem zwischen klassischen und quantenmechanischen Größen eine enge Entsprechung mit mehr oder weniger analogen Beziehungen besteht. (Eine solche Korrespondenz wird sich allerdings weitgehend erst nachträglich überprüfen lassen).
Schließlich müssen wir bei der Formulierung einer Wellengleichung natürlich die
grundlegenden Beziehungen (8),(9)
E = h̄ω
und
p = h̄k
im Auge behalten.
Die uns am meisten vertraute Wellengleichung der Form
∂2ψ
∂2ψ
=
γ
∂t2
∂x2
mit konstantem γ ist nicht geeignet:
– im Gegensatz zur klassischen Mechanik kann die Lösung nicht durch Anfangsbedingungen festgelegt werden, da die Gleichung zweiter Ordnung in
der Zeit ist
– Der Lösungsansatz ei(kx−ωt) führt auf die Dispersionsgleichung
3
Darum lassen wir auch von vornherein komplexe Wellenfunktionen zu!
12
γ = ω 2 /k 2 = E 2 /p2
√
eines dispersionsfreien Mediums mit einer Wellengeschwindigkeit γ = E/p, die
von den Anfangsbedingungen abhängt und nicht mit der Teilchengeschwindigkeit
übereinstimmt.
Nach dem Korrespondenzprinzip erwarten wir, daß die Gruppengeschwindigkeit
vg der klassischen Teilchengeschwindigkeit entspricht. Für ein kräftefreies Teilchen
im konstanten Potential V0 gilt E = p2 /2m + V0 . Das entspricht einer Dispersionsbeziehung
h̄2 2
h̄ω =
k + h̄ω0
2m
mit ω0 =
V0
.
h̄
(35)
Die Gruppengeschwindigkeit
vg =
h̄
p
∂ω
= k=
∂k
m
m
(36)
stimmt damit tatsächlich mit der Teilchengeschwindigkeit überein. Eine entsprechende Differentialgleichung, die mit dem Ansatz ψ ∼ ei(kx−ωt) übereinstimmt,
erhalten wir durch die Übersetzung
k→
1 ∂
i ∂x
p→
h̄ ∂
i ∂x
und ω → i
∂
∂t
und E → ih̄
oder
(37)
∂
∂t
(38)
h̄2 ∂ 2 ψ
∂ψ
=−
+ V0 ψ
ih̄
∂t
2m ∂x2
(39)
Diese Gleichung ist — wie gewünscht — erster Ordnung und führt für freie Teilchen auf die erwartete Gruppengeschwindigkeit. Es erhebt sich allerdings die Frage, wie man sie auf Teilchen in einem konservativem Kraftfeld überträgt. Wenn
wir V0 durch V (x) ersetzen, können wir (35) nicht mehr als Dispersionsgleichung
interpretieren. Tatsächlich können wir ja im Kraftfeld auch keine ebenen Wellen
ψ ∼ ei(kx−ωt) mehr als Lösung erwarten, denn festes k entspricht einem konstanten Impuls p = h̄k. Aber auch wenn k keine direkte Bedeutung als Wellenzahl
mehr hat, können wir versuchen, an der Übersetzungsvorschrift (38) festzuhalten.
Korrespondierend zu der klassischen Beziehung
E = H(p, x) =
13
p2
+ V (x)
2m
verallgemeinern wir daher (39) zur eindimensionalen Schrödingergleichung
h̄2 ∂ 2 ψ
∂ψ
=−
+ V (x).
ih̄
∂t
2m ∂x2
(40)
Die weitere Verallgemeinerung auf drei Raumdimensionen ist fast trivial: Statt
(40) gehen wir von der Übersetzungsvorschrift
p→
h̄
∂
∇ und E → ih̄
i
∂t
(41)
aus, wobei der Nabla–Operator ∇ die Gradientenbildung bezeichnet. Mit dem
Laplace–Operator ∆ = ∇2 erhalten wir dann die dreidimensionale Schrödingergleichung
ih̄
h̄2
∂ψ
=−
∆ψ + V (r)ψ .
∂t
2m
(42)
Dies ist die gesuchte Wellengleichung, die Schrödinger 1926 vorgeschlagen und
die sich in jahrzehntelanger Erfahrung bewährt hat. Bevor wir uns mit dieser
Feststellung zufrieden geben dürfen, müssen wir aber noch zwei wichtige Postulate
nachweisen:
1. Die Erhaltung der Nebenbedingung (33) und
2. der Bezug zur klassischen Bewegungsgleichung.
Diese Nachweise werden wir in den Abschnitten 2.3 und 2.5 führen. Zuvor wollen
wir uns noch mit einigen formalen Aspekten befassen.
2.2
Formale Eigenschaften der Schrödingergleichung
Im Gegensatz zu den Grundgleichungen der klassischen Physik ist die Schrödingergleichung (42) und damit die ψ–Funktion wesentlich komplex. Bisher kannten
wir komplexe Anschriften (wie etwa eiϕ = cos ϕ + i sin ϕ oder Z = R + iωL)
lediglich als bequeme Zusammenfassung von Beziehungen, in denen Real– und
Imaginärteil ihre eigene physikalische Bedeutung haben. Die Wellenfunktion ist
dagegen von vornherein komplex, ohne daß Re(ψ) oder Im(ψ) eine selbständige Bedeutung hätten: Eine physikalische Bedeutung hat erst die reelle Größe
p = ψ ∗ ψ.
In der Theorie kann ψ auch völlig äquivalent durch ψ ∗ ersetzt werden. ψ ∗ aber
erfüllt nicht die Schrödingergleichung (42), sondern die natürlich ebenso äquivalente konjugiert–komplexe Schrödingergleichung
14
ih̄
h̄2
∂ψ ∗
=+
∆ψ ∗ − V (r)ψ ∗ .
∂t
2m
(43)
Anders als wir es sonst von Wellengleichungen gewöhnt sind, sind (mit ϕ =
k · r−ωt) also nicht die vier Funktionen (10a,b) und (11a,b) Lösungen der kräftefreien Schrödingergleichung, sondern allein der Ansatz (11a), von dem wir bei der
Konstruktion ausgegangen sind. (Der äquivalente Ansatz (11b) führt eben zur
konjugiert–komplexen Schrödingergleichung).
Ohne die imaginäre Einheit i vor der Zeitableitung wäre die Schrödingergleichung
als “parabolische Differentialgleichung” ja auch keine Wellengleichung, sondern
eine Diffusionsgleichung, deren Typ vielleicht von der Wärmeleitungsgleichung
∂T
= κ∆T + f (T )
∂t
am ehesten vertraut ist. Mit der Diffusionsgleichung hat die Schrödingergleichung
daher gemein, daß ihre Lösung durch Anfangsbedingungen zur Zeit t = 0 festgelegt ist. Während jedoch die Diffusionsgleichungen zu exponentiell abklingenden
Lösungen ∼ e−t/τ “neigen”, sind für die Schrödingergleichung (wegen des i vor
der Zeitableitung) oszillierende Lösungen ∼ e−iωt typisch.
Diese Oszillationen von ψ darf man sich freilich ebensowenig als physikalische
Realität vorstellen wie ψ selbst. Hängt ihre Frequenz ω doch von der willkürlichen
Wahl des Potential–Nullpunkts ab. In Übereinstimmung damit ist der gesamte
Phasenfaktor e−iωt der Beobachtung nicht zugänglich, er fällt ja bei der Bildung
von ψ ∗ ψ auch heraus! [Beobachtbar sind einzig Phasendifferenzen (Interferenz!);
diese hängen allerdings auch nicht vom Potential–Nullpunkt ab.]
Ebenso wenig — und das ist vielen Leuten nicht hinreichend bewußt! — besitzt
die Wellenlänge λ = 2πh̄/p eine Bedeutung, die man dem Teilchen selbst zuordnen kann. Denn der Impuls hängt ja wesentlich von der speziellen Wahl des
Bezugssystems ab. Wenn wir in Interferenzexperimenten eine bestimmte Wellenlänge beobachten, so bezieht sich diese Beobachtung auf ein System, in dem
das Beugungsgitter und der Schirm ruhen. In diesem System (und erst hier!) sind
Impuls und Wellenlänge eindeutig festgelegt. Wir nutzen diese Überlegung, um
erneut darauf hinzuweisen, daß wir mit der Quantenmechanik nicht ein Teilchen,
sondern die mögliche Beobachtung eines Teilchens beschreiben. Diese hängt z. B.
vom Teilchen und vom Beugungsgitter ab.
2.3
Die Kontinuitätsgleichung
Wir hatten bereits darauf hingewiesen, daß die Wahrscheinlichkeitsinterpretation
(32)
15
p(r, t) = ψ ∗ (r, t)ψ(r, t)
der Wellenamplitude verlangt, daß die Normierung (33)
Z
p(r, t)d3 r =
Z
ψ ∗ (r, t)ψ(r, t)d2 r = 1
im Laufe der Zeit erhalten bleibt. Dazu rechnen wir unter Verwendung der Schrödingergleichungen (42) und (43)
∂ψ
∂ψ ∗
∂p
= ψ∗
+ψ
∂t
∂t
∂t
(
)
2
1
h̄ ∗
h̄2
∗
∗
∗
=
−
ψ ∆ψ + V ψψ +
ψ∆ψ − V ψψ
ih̄
2m
2m
ih̄
{ψ ∗ ∇ · ∇ψ − ψ∇ · ∇ψ ∗ }
=
2m
ih̄
ih̄
∇ · {ψ ∗ ∇ψ − ψ∇ψ ∗ } −
{∇ψ ∗ · ∇ψ − ∇ψ · ∇ψ ∗ } .
=
2m
2m
Die letzte Klammer verschwindet und wir erhalten die Kontinuitätsgleichung
∂p
+ div S = 0
∂t
p(r, t) = ψ ∗ ψ
und S(r, t) =
mit
(44)
h̄
{ψ ∗ ∇ψ − ψ∇ψ ∗ } .
2im
Die Form der Kontinuitätsgleichung stellt die postulierte Erhaltung der Normierung sofort sicher. Denn nach dem Gaußschen Satz gilt
Z
Z
I
∂p 3
d Z
3
3
pd r =
d r = − div Sd r = − S · do = 0.
dt
∂t
Das Oberflächenintegral verschwindet, da ψ für r → ∞ hinreichend stark gegen
Null gehen muss, damit die Normierung überhaupt existiert.
Aus der Kontinuitätsgleichung folgern wir weiter, daß S(r, t) eine Wahrscheinlichkeitsstrom-Dichte beschreibt. Dabei überzeugt man sich leicht, daß S(r, t) —
wie es für physikalisch interpretierbare Größen sein muss — tatsächlich reell ist,
denn es gilt nach (44)
S(r, t) = Re[
16
h̄ ∗
ψ ∇ψ].
im
(45)
Wir können uns die zeitliche Entwicklung der Wahrscheinlichkeitsverteilung also
bildhaft als Strömung einer Flüssigkeit vorstellen. Diese Strömung besitzt weder
Quellen noch Senken, und das garantiert die Erhaltung der Normierung.
Wenn wir unsere Beobachtung an hinreichend vielen (N → ∞) unabhängigen
Teilchen durchführen, erwarten wir aufgrund der Definition der Wahrscheinlichkeit im Abschnitt 1.6 (vgl. Gleichung (20)) im Volumenelement d3 r
n(r, t) d3 r = N p(r, t) d3 r = N ψ ∗ (r, t)ψ(r, t) d3 r
(46)
Teilchen anzutreffen. n(r, t) wird dabei als Teilchendichte bezeichnet. Entsprechend wird dann
h̄N ∗
{ψ ∇ψ − ψ∇ψ ∗ }
2im
j(r, t) = N S(r, t) =
(47)
die Teilchenstrom–Dichte und die Kontinuitätsgleichung erhält die vertraute
Form
∂n
+ div j = 0.
(48)
∂t
Ebenso kann man durch
%m = mn(r, t) und %e = en(r, t)
(49)
eine Massendichte %m und eine elektrische Ladungsdichte %e einführen. Diesen Dichten entspricht dann die Massenstromdichte bzw. elektrische Stromdichte
jm = mj bzw. je = ej,
(50)
und es gelten entsprechende Kontinuitätsgleichungen
∂%m,e
+ div jm,e = 0.
∂t
(51)
Um die Anschrift solcher Größen noch bequemer zu gestalten, kann man die
entsprechenden Faktoren N, m bzw. e natürlich auch direkt in die Wellenfunktion
aufnehmen. So ist es insbesondere weit verbreitet, statt mit ψ direkt mit
Ψ(r, t) =
√
mit der Normierung
17
N ψ(r, t)
(52)
Z
ΨΨ∗ d3 r = N
(53)
zu arbeiten. Dann erhält man die Teilchendichte
n(r, t) = Ψ∗ Ψ
(54)
h̄
{Ψ∗ ∇Ψ − Ψ∇Ψ∗ } .
2im
(55)
und die Teilchenstrom–Dichte
j(r, t) =
Wegen dieser trivialen Umrechnungen werden wir uns — wie viele Lehrbücher —
im folgenden auch gelegentlich einer bequemen, weniger präzisen Ausdrucksweise
h̄
bedienen und ψ ∗ ψ kurz als Teilchendichte und S = 2im
(ψ ∗ ∇ψ − ψ∇ψ ∗ ) kurz als
Stromdichte bezeichnen.
Wichtig ist dabei lediglich, daß wir uns der präzisen Bedeutung bewußt bleiben:
Die Interpretation einer Teilchen– und einer Stromdichte setzt viele unabhängige
Teilchen voraus. Wir sollten uns daher hüten, uns ein einzelnes Teilchen – etwa
das Elektron im H–Atom – als ausgeschmierte Wolke mit einer Dichteverteilung,
die durch ψ ∗ ψ beschrieben wird, vorzustellen. Diese grundfalsche Vorstellung wird
leider in manchen Schulbüchern der Physik durch entsprechende Bilder suggestiv
unterstützt.
2.4
Erwartungswerte und Operatoren
Während wir die Dynamik klassischer Systeme deterministisch beschreiben, müssen
wir uns in der Quantenmechanik mit einer Angabe der Wahrscheinlichkeitsverteilung begnügen. Wir können daher nicht mehr den Zahlwert dynamischer Variablen präzise angeben. Um trotzdem die Terminologie und anschauliche Vorstellung soweit wie möglich beibehalten zu können, vergleichen wir den klassischen
Wert einer Variablen f mit ihrem quantenmechanischen Erwartungswert f¯ oder
hf i. Darunter verstehen wir den in Gl. (34) definierten Mittelwert
f¯ = hf i =
Z
ψ ∗ (r, t)f (r)ψ(r, t)d3r.
Nun sind dynamische Variable aber im allgemeinem nicht allein Funktionen des
Ortes, sondern Funktionen von Ort und Impuls (Beispiel: E = p2 /2m + V (r)).
Wie definieren oder berechnen wir sinnvoll den Erwartungswert des Impulses?
Für freie Teilchen mit vorgegebenem Impuls p hatten wir den Zusammenhang
p = h̄k zwischen Impuls und Wellenzahl postuliert. Aus der Anschrift
18
ei(k·r−ωt)
einer ebenen Welle erhalten wir die Wellenzahl durch Gradientenbildung, −i∇ →
k. Dem entspricht das (rückwärts gelesene) Ersetzungsschema
h̄
∇→p
i
(56)
von Gl. (41). Wir können die beiden Pfeilrichtungen in (41) und (56) zu einer
Äquivalenz zusammenfassen, indem wir den Impulsoperator
p̂ =
h̄
∇
i
(57)
einführen. Damit liegt es nahe, den Erwartungswert des Impulses durch
p̄ = hp̂i =
Z
h̄ Z ∗
ψ ∇ψd3 r
ψ p̂ψd r =
i
∗
3
(58)
anzugeben. Für eine ebene Welle4 ∼ ei(k·r−ωt) mit scharf definiertem Impuls
p = h̄k stimmt dieser Erwartungswert nach Konstruktion mit dem Impuls überein. Allgemein stellen wir uns vor, daß wir durch die Differentiation in (58) die
Impulse bilden, die bestimmten Anteilen der Wellenfunktion entsprechen, und
anschließend durch die Integration entsprechend gewichten5 . Zur Stützung dieser
Argumentation zeigen wir, daß Gl. (58) tatsächlich eine reelle Größe definiert.
Mit
p̄∗ = −
h̄ Z
ψ∇ψ ∗ d3 r
i
(59)
(ψ ∗ ∇ψ + ψ∇ψ ∗ )d3 r
(60)
folgt nämlich
∗
p̄ − p̄ = ih̄
= ih̄
Z
Z
∇(ψ ∗ ψ)d3 r = 0.
Ausgehend von (57) können wir auch einen Operator
p̂2 = −h̄2 ∇2 = −h̄2 ∆
4
Auf die Frage der Normierung ebener Wellen gehen wir später ein. Im Augenblick denken
wir an fast unendlich ausgedehnte Wellenpakete mit fast scharf definiertem Impuls.
5
Eine saubere Begründung läßt sich über eine Fouriertransformation der Wellenfunktion
gewinnen. Wir verzichten jedoch darauf.
19
bilden. Auch er führt zu reellen Erwartungswerten, denn es gilt
∗
p¯2 − p¯2 = −h̄2
= −h̄
2
Z
Z
(ψ ∗ ∆ψ − ψ∆ψ ∗ )d3 r
∇ · {ψ ∗ ∇ψ − ψ∇ψ ∗ }d3 r = 0
(vgl. Rechnung zu Gl.(44) oder den Greenschen Satz6 ). Damit können wir insbesondere den Hamiltonoperator
Ĥ =
p̂2
h̄2 ∆
+ V (r) = −
+ V (r)
2m
2m
(61)
bilden.
Allgemeiner läßt sich zeigen, daß nicht nur p̂ und p̂2 sondern alle Potenzen p̂n zu
reellen Erwartungswerten führen. Das ist kein Zufall, sondern es beruht darauf,
daß der Operator p̂ selbstadjungiert oder hermitesch ist7 . Über die Potenzreihe läßt sich diese Eigenschaft schließlich auf alle analytischen Funktionen g(p̂)
übertragen.
Generell verstehen wir unter einem Operator  eine mathematische Vorschrift,
die aus einer (Wellen–)Funktion ψ eine andere Funktion ϕ erzeugt:
ϕ(r, t) = Âψ(r, t).
Eine triviale Operation in diesem Sinne ist die Multiplikation mit einer Funktion
f (r). Ist f (r) reell, so erhalten wir reelle Erwartungswerte f¯, und f repräsentiert
einen hermiteschen Operator fˆ. Insbesondere der Ortsoperator r̂ = r selbst ist
hermitesch. Korrespondierend zu irgendwelchen dynamischen Variablen A(r, p)
der klassischen Mechanik können wir nun quantenmechanische Operatoren
 = A(r, p̂)
(62)
bilden, die nach den selben Rechenregeln gebildet werden (Korrespondenzprinzip). Als Beispiel erwähnen wir den Drehimpulsoperator
l̂ = r × p̂ =
h̄
r × ∇.
i
Den quantenmechanischen Operatoren ordnen wir Erwartungswerte
6
H
(u∆v − v∆u)d3 r = ∂V (u∇v − v∇u)d2 S
7
Man beachte, daß ∇ ohne den Vorfaktor i (vgl. (57)) diese Eigenschaft nicht besitzt!
R
V
20
(63)
Ā = hÂi =
Z
ψ ∗ Âψd3 r
(64)
zu, die in gewisser Weise den Zahlwert der klassischen Variable A repräsentieren.
Dieses allgemeine Konzept macht allerdings nur Sinn, wenn Ā immer reell ist.
Und Operatoren, die diese Bedingung für alle Wellenfunktionen ψ erfüllen, heißen
hermitesch. Diese Eigenschaft besitzen zwar alle reellen fˆ = f (r) und ĝ = g(p̂),
aber leider nicht beliebige Funktionen8 der Form (62). Ob das nach (61) gebildete
 hermitesch wird, kann darüber hinaus von der Koordinatenwahl abhängen.
Hier liegt der tiefere Grund dafür, daß wir beim Übergang zur Quantemechanik
im allgemeinen keinen Gebrauch von generalisierte Koordinaten machen.
Wir schränken unser Konzept der Operatoren also wie folgt ein: Ausgehend von
dynamischen Variablen A(r, p) oder Observablen der klassischen Mechanik bilden wir korrespondierende quantenmechanische Operatoren  nach Gl.(62), sofern diese Operatoren zu reellen Erwartungswerten (64) führen (also sofern die
Operatoren hermitesch sind). Das ist insbesondere für
– alle reellen Funktionen f (r)
– alle reellen Funktionen g(p̂)
– den Hamiltonoperator H = p̂2 /2m + V (r) (vgl. (61)) und
– den Drehimpulsoperator l̂ = r × p̂ (vgl. (63)) erfüllt.
Nachdem wir hiermit grundsätzlich (und vorläufig) erklärt haben, was wir unter
Operatoren und ihren Erwartungswerten verstehen, werden wir im folgenden auch
die Kennzeichnung von Operatoren durch das Dach ˆ weglassen und beispielsweise
unter p = −ih̄∇ einen Operator und unter p̄ = hpi seinen Erwartungswert
verstehen.
Um die Anschrift noch bequemer zu gestalten, führen wir die abkürzende Schreibweise
Z
ϕ∗ (r, t)χ(r, t)d3 r = hϕ|χi
(65)
ein. Offenbar gilt dann
hχ|ϕi = hϕ|χi∗ .
8
(66)
Es gilt beispielsweise für das äußere Produkt (63), nicht aber für das innere Produkt
r · p. Das innere Produkt hermitescher Operatoren ist nur hermitesch, wenn die Operatoren
vertauschbar sind.
21
Die Schreibweise soll einmal an die Verwendung von eckigen Klammern zur Kennzeichnung von Mittelwerten erinnern. Gleichzeitig aber lehnt sie sich an die (veraltete) Schreibweise (a, b) für das innere Produkt a · b von Vektoren an. Die
(quadratintegrablen) Funktionen |ϕi = ϕ(r, t) spannen nämlich in der Tat einen
linearen Raum H, den Hilbertraum, auf, in dem durch (65) ein Skalarprodukt
definiert werden kann. Die Dimension von H ist abzählbar unendlich.
Die Schreibweise (65) geht auf Dirac zurück. Er prägte – ausgehend von einer
Aufspaltung des Wortes “bracket” – auch die Bezeichnungen bra–Vektor für hϕ|
und ket–Vektor für |χi. Damit unterscheidet er den Hilbertraum H von seinem
Dualraum H+ , der von den bra–Vektoren aufgespannt wird.
Mit der neuen Schreibweise erhalten Erwartungswerte die suggestive Form
hAi = hψ|A|ψi oder hψ|Aψi
(67)
Repräsentiert A eine physikalische Observable, so muß hAi immer reell oder A
hermitesch sein. Setzt man ψ = χ + λϕ, so folgt aus (67)
hAi = hχ|A|χi + λhχ|Aϕi + λ∗ hϕ|Aχi + |λ|2 hϕ|A|ϕi
Ist A hermitesch, so sind die linke Seite sowie der erste und letzte Term der
rechten Seite reell. Also muß auch
λhχ|Aϕi + λ∗ hϕ|Aχi = λhχ|Aϕi + λ∗ hAχ|ϕi∗
reell sein. Das kann aber nur für beliebige λ stimmen, wenn
hχ|Aϕi = hAχ|ϕi
(68)
gilt. Umgekehrt garantiert (68) wegen (66) auch sofort reelle Erwartungswerte.
Es ist daher üblich, hermitesche Operatoren durch die Beziehung (68) zu definieren. Wir erwähnen dies nicht allein der Vollständigkeit halber, sondern weil wir
gelegentlich von der bequemen “Schieberegel” (68) für hermitesche Operatoren
Gebrauch machen möchten.
2.5
Das Theorem von Ehrenfest
Wir fragen nach der Bewegung des Schwerpunkts eines Wellenpaketes (Vorsicht!)
oder präziser nach der zeitlichen Entwicklung des Erwartungwertes r̄(t) bzw.
seiner x–Komponente
22
x̄ = hψ|x|ψi =
Z
ψ ∗ xψd3 r
Unter Benutzung der Schrödingergleichung erhalten wir
dx̄
=
dt
Z
1 −h̄2
∂ψ ∂ψ ∗
+
xψ d3 r =
ψ x
∂t
∂t
ih̄ 2m
!
∗
Z
(ψ ∗ x∆ψ − ∆ψ ∗ xψ) d3 r
h̄ Z
−h̄ Z
∗
∗
3
=
∇ · {ψ x∇ψ − ∇ψ xψ}d r +
{∇(ψ ∗ x) · ∇ψ − ∇ψ ∗ · ∇(xψ)}d3 r
2im
2im
Das erste Integral verschwindet nach dem Gaußschen Satz, im zweiten Integral
differenzieren wir die Klammern ( ) aus. Mit (58)–(60) folgt dann
Z
h̄
dx̄
=
ex · (ψ ∗ ∇ψ − ψ∇ψ ∗ )d3 r
dt
2im
=
1
p̄x
1
ex · (p̄ + p̄∗ ) = ex · p̄ = .
2m
m
m
Eine entsprechende Beziehung erhält man natürlich auch für die übrigen Komponenten, es gilt also
1
d
hri = hpi.
dt
m
(69)
Diese “klassische” Beziehung zwischen den Erwartungswerten r und p bestätigt
eindrucksvoll das Konzept des Impulsoperators aus dem vorigen Abschnitt. Die
entsprechende Beziehung für dp̄/dt, die wir nun schon ahnen, ergibt sich fast noch
einfacher: Aus [vgl. (58)]
p̄x = hψ|px |ψi =
h̄ Z ∗ ∂ψ 3
ψ
dr
i
∂x
berechnen wir mit der Schrödingergleichung [vgl. (42) und (43)]
h̄
dp̄x
=
dt
i
h̄ 1
h̄2 Z
=
−
i ih̄
2m
(
Z
∂ ∂ψ ∂ψ ∗ ∂ψ 3
dr
+
ψ
∂x ∂t
∂t ∂x
!
∗
!
Z
∂ψ
∗ ∂ψ
3
− ∆ψ
ψ ∆
d r+
∂x
∂x
∗
23
!
∂ψ 3
∂
V ψ − ψ∗V
ψ
dr
∂x
∂x
∗
)
.
Das erste Integral verschwindet nach dem Greenschen Satz [vgl. die ähnliche
Rechnung vor (61)], im zweiten differenzieren wir aus und erhalten
1
dp̄x
= 2
dt
i
Z
ψ∗
∂V
∂V
ψd3 r = −
∂x
∂x
oder verallgemeinert auf alle Impulskomponenten
d
hpi = −h∇V (r)i.
dt
(70)
Damit lassen sich die klassischen Beziehungen
ṙ = p/m und ṗ = −∇V
für ein Teilchen im konservativem Kraftfeld also in eindrucksvoll enger Analogie
auf die quantenmechanischen Erwartungswerte übertragen. Diese Form der Korrespondenz zwischen klassischer– und Quantenmechanik wird als Theorem von
Ehrenfest (1927) bezeichnet.
Trotz der engen Analogie besteht ein wichtiger Unterschied zur klassischen Bewegungsgleichung eines Teilchens. Wenn wir nämlich versuchsweise hri mit dem
Teilchenort r identifizieren, erhalten wir klassisch
mhr̈i = −∇V (hri).
Dies ist aber im allgemeinem verschieden von der quantenmechanischen Beziehung
mhr̈i = −h∇V (r)i,
(71)
die aus (69) und (70) folgt. Im Gegensatz zum klassischen Teilchen tastet das
“quantenmechanische Teilchen” also das Potential der gesamten Nachbarschaft
ab (Feynman).
Auf der anderen Seite ist (71) aber identisch mit der Newtonschen Bewegungsgleichung für den Schwerpunkt eines klassischen Viel–Teilchen–Systems, wenn man
unter h i die gewichtete Summation über alle Massenpunkte versteht. Hierdurch
erhält das anschauliche Bild einer ausgeschmierten Wolke der Dichte ψ ∗ ψ, die
ein “quantenmechanisches Teilchen” repräsentiert, eine wesentliche Stütze. (Wir
halten trotzdem an der Ablehnung dieses Bildes fest, da es in anderen Punkten
völlig versagt!)
24
Abschließend sei darauf hingewiesen, daß — abgesehen von einfachen Spezialfällen
— auch in der klassischen Mechanik der Schwerpunktsatz nicht ausreicht, um die
Bewegung des Schwerpunkts eines Systems zu berechnen.
2.6
Die Heisenbergsche Unschärferelation
Wir haben bereits mehrfach erwähnt, daß die Quantenmechanik es prinzipiell
nicht erlaubt, die nötigen Anfangsbedingungen für eine klassische Beschreibung
präzise anzugeben. Dies folgt mathematisch aus der berühmten Unschärferelation,
die wir nun herleiten und diskutieren wollen.
Wir beginnen mit einer “elementaren” Herleitung für ein eindimensionales Wellenpaket ψ(x). In Anlehnung an das klassische Lehrbuch von Messiah9 bilden wir
für λ ∈ R die Hilfsfunktion
I(λ) =
und rechnen
I(λ) =
Z
2
∗
x ψ ψdx + λ
Z
Z xψ
2
∂ψ + λ dx ≥ 0
∂x
∂ψ ∗
x ψ
dx + λ2
+ψ
∂x
∂x
!
∗ ∂ψ
(72)
Z
∂ψ ∗ ∂ψ
dx.
∂x ∂x
Wenn wir (. . .) = ∂[ψ ∗ ψ]/∂x beachten und die beiden letzten Integrale partiell
integrieren, folgt
I(λ) =
Z
ψ ∗ x2 ψdx − λ
Z
ψ ∗ ψdx − λ2
Z
ψ∗
∂2
ψdx = hx2 i − λ + λ2 hk 2 i,
∂x2
wobei wir den Operator
k=
1 ∂
i ∂x
(73)
eingeführt haben. I(λ) beschreibt eine nach oben geöffnete Parabel, I(λ) ≥ 0
muß insbesondere für den Scheitelpunkt λs gelten. Aus dI/dλ = 0 erhalten wir
λs =
1
2hk 2 i
und
I(λs ) = hx2 i −
also
9
A. Messiah, Quantenmechanik, Bd. I, Abschnitt 4.2.2
25
1
1
+
≥ 0,
2
2hk i 4hk 2 i
hx2 ihk 2 i ≥
1
.
4
(74)
Damit haben wir die Beziehung (17), die wir an einem Beispiel abgelesen haben,
verallgemeinert und präzisiert10 . Das Gleichheitszeichen gilt genau dann, wenn
der Integrand in Gl. (72) identisch verschwindet, also für Gaußsche Wellenfunktionen
ψ ∼ exp
−x2
.
2λ
Mit px = h̄k geht (74) in
hx2 ihp2x i ≥
h̄2
4
über. Ein Teilchen kann also nicht exakt am Ort x = 0 ruhen (px = 0). Dieser
Widerspruch ergibt sich aber auch für jede andere exakt formulierte Anfangsbedingung, denn wir brauchen ja nur x durch ∆x = x − x0 und p durch ∆p = p − p0
zu ersetzen (Wechsel des Bezugssystems). So erhalten wir endlich die Heisenbergsche Unschärferelation
h∆x2 ih∆p2x i ≥
h̄2
.
4
(75)
Bevor wir die Unschärferelation weiter diskutieren, wollen wir unsere Herleitung
auf beliebige Observable A und B verallgemeinern. Das wird uns zugleich einen
völlig neuen Geschichtspunkt liefern. In Anlehnung an Gl. (72) bilden wir dazu
die Hilfsfunktion
I(λ) =
Z
|Aψ − iλBψ|2 dτ ≥ 0,
(76)
wobei A und B hermitesche Operatoren repräsentiern und dτ für dx oder d3 r
steht. Wenn wir nun dem Rechengang auf der vorigen Seite folgen, haben wir
lediglich zu beachten, daß wir die partiellen Integrationen in die Verschiebung
hermitescher Operatoren übersetzen müssen. Damit erhalten wir
I(λ) =
10
Z
ψ ∗ (A + iλB)(A − iλB)ψdτ = hA2 i + λ2 hB 2 i − iλh(AB − BA)i .
Der Faktor 1/4 gegenüber Gl.(17) kommt daher, daß wir mit ψ ∗ ψ und nicht mit ψ gewich-
ten.
26
Wir bestimmen wieder den Scheitelpunkt
λs = i
hAB − BAi
hB 2 i
der Parabel I(λ) und folgern aus I(λs ) ≥ 0
2
2
hA ihB i ≥
2
AB − BA
2i
.
Hiermit ist die formale Rechnung schon abgeschlossen. Wie oben können wir A
durch ∆A = A − Ā und B durch ∆B = B − B̄ ersetzen und erhalten mit dem
Kommutator
[A, B] = AB − BA
(77)
die allgemeine Unschärferelation
2
2
h(∆A) ih(∆B) i ≥
*
[A, B]
2i
+2
.
(78)
Sie sagt also beispielsweise aus, daß zwischen x und px deshalb eine Unschärferelation besteht, weil x und px nicht vertauschbar sind. Es gilt nämlich
∂ψ
∂
(xψ) − x
=ψ
∂x
∂x
"
oder
#
∂
∂
∂
,x =
x−x
=1
∂x
∂x
∂x
[px , x] = px x − xpx =
also
h̄
.
i
(79)
Neben dieser neuen Interpretation haben wir damit eine wesentliche Verallgemeinerung der Unschärferelation erhalten: Eine Unschärferelation besteht zwischen
allen Observablen, deren Operatoren nicht vertauschbar sind, und Gl. (78) sagt
uns, wie die Unschärferelation in jedem Fall genau aussieht.
Ein wichtiges Beispiel hierzu ist die Unschärferelation zwischen den verschiedenen
Komponenten des Drehimpulses (vgl. (63)) l = r × p. Mit
lx = ypz − zpy
27
und
ly = zpx − xpz
folgt nämlich
[lx , ly ] = lx ly − ly lx
= (ypz − zpy )(zpx − xpz ) − (zpx − xpz )(ypz − zpy )
= ypx [pz , z] + xpy [z, pz ] = − (xpy − ypx )[pz , z].
Wegen
lz = xpy − ypx
und
[pz , z] = −ih̄
[vgl. (79)] folgt daraus die wichtige Vertauschungsrelation
[lx , ly ] = ih̄lz
(80)
und natürlich die entsprechenden durch zyklische Vertauschung gewonnenen Relationen. Gemäß Gl.(78) bedeutet das aber, daß die drei Komponenten des Drehimpulses nicht präzise angegeben werden können, denn es besteht die Unschärferelation
h∆lx2 ih∆ly2 i ≥
h̄2
hlz i2 ,
4
(81)
oder — wie wir etwas weniger präzise schreiben können —
δlx · δly ≥
h̄
|hlz i|.
2
(82)
Wir führen die “unscharfen Werte” eines Observablenpaares also darauf zurück,
daß ihre Operatoren “nicht vertauschbar” sind. Das typische Beispiel – und den
Ausgangspunkt aller weiterer Rechnungen – liefern die Operatoren x und ∂/∂x
mit dem Kommutator
"
#
∂
, x = 1.
∂x
Die entsprechende Unschärfe können wir uns direkt an der Wahrscheinlichkeitsdichte p(x) veranschaulichen: Eine gut lokalisierbare Verteilung (Skizza a) entspricht einem steilen Peak mit großen Gradienten ∂/∂x, während eine flache Verteilung mit kleinen Gradienten (Skizze b) den Ort nur sehr ungenau festlegt:
28
p(x)
p(x)
b)
a)
δx
δx
x
x
Die Orts–Impuls–Unschärfe ist also die natürlichste Sache der Welt, wenn man
akzeptiert, daß der Impuls durch den Gradienten repräsentiert wird. Das aber
entspricht gerade der Wellenbeschreibung, die uns von den Interferenzbeobachtungen aufgedrängt wurde. Die Rückführung der Unschärferelation auf die Nicht–
Vertauschbarkeit von Operatoren ist damit nur eine abstrakte Formulierung der
Unvereinbarkeit von Begriffen, die dem Teilchenbild (Ort) und dem Wellenbild
(Wellenzahl) entlehnt sind.
Für die physikalische Interpretation ist ein Gedankenexperiment wichtig, das Heisenberg (mit Hilfestellung Bohrs) 1927 angegeben hat: Wir wollen die Ortsbestimmung eines Teilchens (z. B. Elektrons) konkret mit einem Mikroskop durchführen. Dann erhalten wir eine minimale Ortsunschärfe
δx ∼
λ
,
sin ε
ε
die dem Auflösungsvermögen des Mikroskops entspricht. Dabei ist λ die Wellenlänge des verwendeten Lichts und sin ε die numerische Apertur (d. h. der Sinus des halben Öffnungswinkels). Nun besteht aber das Licht aus Photonen mit
einem Impuls
p = h̄k = h/λ.
Wenn ein Photon von Teilchen gestreut wird — und nur dadurch entsteht ja das
29
Bild im Mikroskop — überträgt es einen Teil seines Impulses (Compton–Effekt).
Aufgrund der Streuung erhält das Teilchen nun eine Impulsunschärfe
δpx ∼ p sin ε =
h
sin ε.
λ
Unsere Kenntnis über das Teilchen ist also durch ein minimales Unschärfeprodukt
δx · δpx ∼ h
eingeschränkt.
Mit diesem Gedankenexperiment lieferte der Positivist Heisenberg im Grunde
seinen dem Realismus verschworenen Gegnern hervorragende Munition: Ist es
nicht doch so, daß das Teilchen “eigentlich” einen scharfen Ort und scharfen
Impuls hat, und daß die Unschärfe “nur” auf der Störung durch die Beobachtung
beruht?
Diese “Störung” läßt sich allerdings nicht durch eine Re–Interpretation der Meßresultate “wegrechnen”: δpx ist eine wirkliche “Unschärfe”, der übertragene Impuls läßt sich nicht angeben, da die Abbildung im Mikroskop tatsächlich ein
divergentes Lichtbündel voraussetzt (worauf Bohr hingewiesen hat). Und da der
Impulsübertrag prinzipiell nicht berechenbar ist, ist es für den Physiker wieder
prinzipiell unentscheidbar, ob die Positivisten oder die Realisten recht haben: Wir
können nur unsere Beobachtung beschreiben.
Mir scheint noch ein anderer Aspekt der mikroskopischen Ortsbestimmung wichtig: Wir hatten die Unschärferelation in den bisherigen Diskussionen auf den
Welle–Teilchen–Dualismus zurückgeführt. In Heisenbergs Gedankenexperiment
spielt der Wellenaspekt des beobachteten Teilchens jedoch nirgendwo eine Rolle.
Der Welle–Teilchen–Dualismus wird hier auf das Photon verlagert (Auflösungsvermögen und Wellenlänge einerseits, Comptoneffekt anderseits). Darin liegt
erneut eine Bestätigung der Aussage, daß die Quantemechanik nicht ein Teilchen an sich sondern die prinzipielle Möglichkeit seiner Beobachtung beschreibt.
Später (im Abschnitt 5.6) werden wir sogar sehen, daß die Unschärfe auch bei
einer völlig störungsfreien Messung unvermeidlich ist.
Wenn wir noch einmal auf die Begründung der Unschärfe durch den Welle–
Teilchen–Dualismus zurückkommen, so gilt in völliger Analogie zur Unschärfe
δx · δk ≥ 1/2 eine Unschärfe δt · δω ≥ 1/2. Mit h̄ω = E folgt daraus die Energie–
Zeit–Unschärfe
δE · δt ≥
30
h̄
.
2
(83)
Wir wollen uns das direkt an der Wellenfunktion veranschaulichen: Ist die Energie
E und damit ω = E/h̄ präzise vorgegeben, haben wir eine Wellenfunktion
ψ(r, t) = ϕ(r)e−iωt .
Ihre ”Zeitabhängigkeit” e−iωt ist nicht beobachtbar, denn die Aufenthaltswahrscheinlichkeit
ψ ∗ (r, t)ψ(r, t) = |ϕ(r)|2
hängt gar nicht von der Zeit ab. Die Wellenfunktion, die der präzisen Vorgabe
der Energie (δE = 0) entspricht, beschreibt also einen stationären Zustand, der
unendlich lange dauert (δt = ∞).
Zur Zeitabhängigkeit eines Zustandes mit unscharfer Energie betrachten wir eine
Wellenfunktion
ψ(r, t) = ϕ1 (r)e−iω1 t + ϕ2 (r)e−iω2 t
und rechnen
n
ψ ∗ ψ = |ϕ1 |2 + |ϕ2 |2 + 2Re ϕ∗1 ϕ2 ei(ω1 −ω2 )t
o
Der letzte Term zeigt also eine zeitliche Schwebung mit der Periodendauer
τ =
2π
h
=
.
|ω1 − ω2 |
|E1 − E2 |
Um die Energiedifferenz ∆E = |E1 − E2 | aufzulösen (d. h. um die Schwebung zu
beobchten), muß man also die Messung mindestens über Zeiten ∆t ∼ τ = h/∆E
ausdehnen.
Alternativ können wir die Energie–Zeit–Unschärfe erhalten, indem wir die Ortsunschärfe mit Hilfe der Geschwindigkeit auf den Zeitpunkt der Beobachtungung
übertragen: Wir fragen etwa, wann ein Teilchen die Marke x = x0 passiert und
schätzen ab
δt =
δt
m
δx
= δx
v
p
=⇒
h̄
p
δp = δxδp ≥ .
m
2
Mit pδp/m = δ(p2 /2m) = δE folgt daraus (83).
31
Wenn diese Diskussion auch die völlige Analogie der Energie–Zeit– und Orts–
Impuls–Unschärferelation deutlich gemacht hat, so kommt diesen Relationen doch
eine ganz unterschiedliche Rolle im Rahmen der formalen Theorie zu:
Ort x und Impuls p sind (gleichberechtigte11 ) Observable, die in der Theorie durch
Operatoren repräsentiert werden. Die Unschärfe beruht darauf, daß der Orts– und
der Impulsoperator nicht vertauschbar sind.
Dagegen wird die Zeit t in der Quantenmechanik nicht durch einen Operator
repräsentiert sondern spielt die Rolle eines Parameters. Diese Unsymmetrie, die
auch vom Gesichtspunkt der Relativität als Defizit erscheint, hat Schrödinger bei
der Aufstellung der Wellengleichung vergeblich zu vermeiden versucht.
11
Auch das “Ungleichgewicht” p ∼ d/dx läßt sich durch einen Wechsel der “Darstellung”
beseitigen: In der “Impulsdarstellung” (Fouriertransformation) gilt x ∼ d/dp.
32
3
Spezielle Lösungen der Schrödingergleichung
Die Schrödingergleichung ist eine partielle Differentialgleichung, die nicht allgemein in geschlossener Form gelöst werden kann. Wenn wir uns in diesem Kapitel
mit ihrer Lösung für einige ausgewählte Probleme befassen, so wollen wir damit
in erster Linie generelle Zusammenhänge aufzeigen oder verdeutlichen. Gleichzeitig lernen wir so einige Lösungsmethoden und wichtige “Schulbeispiele” kennen,
ohne dabei jedoch “Vollständigkeit” anzustreben.
3.1
Entwicklung nach Eigenfunktionen des Hamiltonoperators
Wir setzen voraus, daß die Hamiltonfunktion nicht explizit von der Zeit abhängt,
so daß klassisch der Energiesatz H(x, p) = E gilt. Dann können wir nach partikulären Lösungen der Schrödingergleichung fragen, die dem Separationsansatz
ψ(r, t) = g(t)ϕ(r)
(84)
genügen. Mit
h̄2
∂ψ
= Hψ = −
∆ψ + V (r)ψ
ih̄
∂t
2m
folgt
ih̄ϕ(r)
dg
= g(t)Hϕ(r)
dt
oder
ih̄ dg
1
= Hϕ.
g dt
ϕ
Nun hängt die linke Seite nur von t, die rechte nur von r ab. Also sind beide gleich
einer Konstanten Eν . Dabei soll der Index ν andeuten, daß wir im allgemeinen nur
für bestimmte Werte von E sinnvolle Lösungen finden werden. Die Abhängigkeit
der Lösung von dieser Konstanten kennzeichnen wir ebenfalls durch den Index ν
und erhalten dgν /dt = −iEν /h̄gν oder
gν (t) = e−i
33
Eν
h̄
t
.
(85)
gν ist also — wie nicht anders zu erwarten — der zeitabhängige Phasenfaktor,
der im Wellenbild die vorgegebene Energie Eν repräsentiert. Die zugehörige Ortsfunktion ϕν (r) ist Lösung der stationären Schrödingergleichung
"
h̄2
−
∆ + V (r) ϕν (r) = Eν ϕν (r)
2m
#
oder H|ϕν i = Eν |ϕν i.
(86)
Gl. (86) ist vom Typ eines Eigenwertproblems, wir nennen Eν einen Eigenwert und
ϕν (r) eine Eigenfunktion (bzw. |ϕν i einen Eigenvektor) des Hamiltonoperators.
Im Hinblick auf eine mögliche Entwicklung der allgemeinen Lösung nach solchen
Eigenfunktionen wollen wir zeigen, daß die Eigenfunktionen zu verschiedenen
Eigenwerten orthogonal sind. Dazu gehen wir von der Schrödingergleichung
h̄
∆ϕ = [V (r) − E]ϕ
2m
aus und bilden12 unter Verwendung des Greenschen Satzes [vgl. die Rechnung zu
Gl. (61)]
0 =
=
h̄2 Z
(ϕν ∆ϕµ − ϕµ ∆ϕν )d3 r
2m
Z
Z
(ϕν V ϕµ − ϕµ V ϕν )d3 r −
= (Eν − Eµ )
Z
ϕν (Eµ − Eν )ϕν d3 r
ϕν ϕµ d3 r = (Eν − Eµ )hϕν |ϕµ i,
also
hϕν |ϕµ i = 0 f ür Eν 6= Eµ .
(87)
Der Greensche Satz (die partielle Integration), auf dem unser Beweis beruht,
drückt im Grunde nur aus, daß der Hamiltonoperator hermitesch ist. Tatsächlich
erhalten wir direkt aus der Eigenwertgleichung (86) eines beliebigen hermiteschen
Operators H unter Ausnutzung der “Schieberegel” (68)
0 = hHϕν |ϕµ i − hϕν |Hϕµ i = (Eν∗ − Eµ )hϕν |ϕµ i.
Diese kurze, elegante Rechnung zeigt
12
Im Gegensatz zur zeitabhängigen Schrödingergleichung ist die stationäre Schrödingergleichung nicht komplex und wir können reelle Eigenfunktionen wählen.
34
1. für ν = µ, daß alle Eigenwerte hermitescher Operatoren reell sind und
2. für ν 6= µ, daß Eigenfunktionen zu verschiedenen Eigenwerten hermitescher
Operatoren orthogonal sind.
Die Entwicklung nach den Eigenfunktionen des Hamiltonoperators, die wir hier
besprechen wollen, stellt tatsächlich nur einen Spezialfall der allgemeineren Entwicklung nach den Eigenfunktionen irgendeines hermiteschen Operators dar. Wir
werden hierauf bei Bedarf zurückkommen, gehen aber nun nicht weiter darauf
ein.
Wegen der Linearität der Schrödingergleichung sind beliebige Linearkombinationen unserer partikulären Lösungen gν (t)ϕν (r) ebenfalls Lösungen. Wir können
nun umgekehrt fragen, ob jede Lösung ψ(r, t) der Schrödingergleichung in der
Form
ψ(r, t) =
X
cν e−i
Eν
h̄
t
ϕν (r)
(88)
ν
nach den Eigenfunktionen ϕν (r) des Hamiltonoperators entwickelt werden kann.
Dies ist die Frage nach der Vollständigkeit13 des Funktionssystems {ϕν }. Die
Vollständigkeit ist mathematisch meistens schwierig nachzuweisen, tatsächlich
aber nur in “pathologischen” Fällen verletzt — vorausgesetzt, man hat tatsächlich
alle Eigenwerte und die entsprechenden Eigenfunktionen gefunden. Wir werden
daher die Vollständigkeit stets voraussetzen und davon ausgehen, daß die Entwicklung (88) immer möglich ist.
Aus der Orthogonalität folgt darüber hinaus, daß die Entwicklung sogar eindeutig
und sehr einfach zu berechnen ist. Wir können die Eigenfunktionen nämlich so
normieren, daß
hϕν |ϕµ i = δνµ
(89)
gilt. Schreiben wir (88) nun in der Form
|ψt=0 i =
X
µ
cµ |ϕµ i
und multiplizieren mit hϕν |, so folgt wegen (89)
13
Zur Veranschaulichung nicht vollständiger Systeme denke man an eine “Basis” aus m Vektoren im n-dimensionalen Vektorraum (m < n) oder an Potenzreihen, in denen bestimmte
Potenzen nicht erlaubt sind.
35
cν = hϕν |ψt=0 i
=
Z
(90)
ϕ∗ν (r)ψ(r, 0)d3 r.
Wir wollen diesen formalen Abschnitt mit dem Hinweis auf zwei Schwierigkeiten
abschließen:
Wir haben bisher stillschweigend vorausgesetzt, daß die Eigenwerte Eν und Eµ
für ν 6= µ tatsächlich verschieden sind, oder anders ausgedrückt, daß zu einem Eigenwert nicht mehrere linear unabhängige Eigenfunktionen existieren. Wenn das
nicht erfüllt ist, spricht man von Entartung: Der Eigenwert Eν heißt k–fach entartet, wenn k linear unabhängige Eigenfunktionen zu Eν existieren. Die formale
Schwierigkeit der Entartung liegt darin, daß entartete Eigenfunktionen nicht mehr
automatisch orthogonal untereinander sind. Man kann jedoch stets orthogonale
Eigenfunktionen finden und damit die Gültigkeit von (89) und (90) sicherstellen.
Eine zweite stillschweigende Voraussetzung ging davon aus, daß wir nur diskrete Eigenwerte Eν haben. Auch das ist nicht immer erfüllt, im Gegenteil, das
“Spektrum” möglicher Eigenwerte weist typischerweise einen diskreten und einen
kontinuierlichen Anteil auf. Die entsprechende Interpretation von Gl. (88) liegt
auf der Hand: Wir ersetzen die Summation im kontinuierlichen Anteil durch eine
Integration:
ψ(r, t) =
Z
X
cν e−
Eν t
h̄
ϕν (r)dν.
(91)
Was aber sollen wir in Gl. (89) unter dem Kroneckersymbol δνµ im kontinuierlichen Teil des Spektrums verstehen? Durch geeignete Grenzübergänge läßt sich
erreichen, daß man die kontinuierlichen Eigenfunktionen durch
hϕν |ϕµ i = δ(ν − µ)
(92)
“normieren” kann. Die Singularität der δ–Funktion für ν = µ deutet aber schon
an, daß wir hier eigentlich vor einer ernsteren Schwierigkeit stehen: Unsere Eigenfunktionen sind nicht mehr im üblichen Sinn normierbar und wir verlassen den
Hilbertraum.
Wir werden diese Schwierigkeit nicht systematisch mit mathematischen Mitteln
beheben. Wir werden aber notgedrungen bei kontinuierlichen Spektren mit ihr
konfrontiert und werden sie dort intuitiv durch die physikalische Interpretation
entschärfen.
36
3.2
Der harmonische Oszillator
Wir beginnen mit einem einfachen, wegen seiner grundlegenden Bedeutung für
zahlreiche physikalische Modelle aber besonders wichtigen Schulbeispiel und untersuchen den eindimensionalen harmonischen Oszillator mit der Hamiltonfunktion
H=
kF 2
p2
mω 2 2
p2
+
x =
+
x ,
2m
2
2m
2
(93)
wobei kF die Federkonstante und ω = (kF /m)1/2 die klassische Frequenz bezeichnet. Die stationäre Schrödingergleichung Hϕ = Eϕ lautet dann
mω 2 2
h̄2 d2 ϕ
+
x − E ϕ = 0.
−
2m dx2
2
!
(94)
Die lästigen Vorfaktoren können wir durch eine Transformation
x = x0 ξ
(95)
auf eine dimensionslose Ortskoordinate ξ wegschaffen:
h̄2 d2 ϕ
mω 2 x20 2
ξ ϕ = 0.
+
Eϕ
−
2mx20 dξ 2
2
Wählen wir nun
h̄2
= mω 2 x20
mx20
oder x20 =
h̄
,
mω
(96)
so folgt
h̄ω d2 ϕ
h̄ω 2
+ E−
ξ ϕ = 0.
2
2 dξ
2
!
Gehen wir schließlich noch durch
E=λ
h̄ω
2
(97)
zu einem dimensionslosen Energiewert λ über, so erhält die Schrödingergleichung
des harmonischen Oszillators die übersichtliche Gestalt
37
d2
hϕ = ξ − 2 ϕ = λϕ.
dξ
!
2
(98)
Bevor wir dieses Eigenwertproblem explizit lösen, merken wir an, daß alle Eigenwerte positiv sind. Für λ ≤ 0 wäre nämlich ϕ00 immer ≥ 0, ϕ also konvex zur
x–Achse:
ϕ
ϕ
ϕ
ξ
ξ
ξ
Eine solche Wellenfunktion ist aber sicher nicht normierbar. Der formale Beweis
folgt aus der kleinen Rechnung
Z
2
2
(λ − ξ )ϕ dξ = −
Z
00
ϕϕ dξ = +
Z
ϕ02 dξ > 0,
die zeigt, daß der Integrand links nicht negativ definit sein kann.
Daß negative λ ausgeschlossen sind, entspricht auch unserer klassischen Erwartung. Denn E = p2 /2m+kx2 /2 ist nach Konstruktion immer ≥ 0. Darüber hinaus
verbietet die Quantenmechanik aber auch E = 0 (warum?).
Für λ > 0 erhalten wir ein Intervall ξ 2 < λ, in dem ϕ(ξ) konkav zur Achse
ist. Damit können wir uns normierbare Wellenfunktionen für bestimmte Werte
von λ vorstellen. Dies wird durch die numerischen Ergebnisse auf der folgenden
Seite bestätigt: Integrieren wir Gl. (98) für wachsende λ > 0, so erhalten wir für
λ = 1 genau den zentralen konkaven Bogen, der notwendig ist, um die konvexen
Flanken zu verbinden. Für größere λ finden wir weitere akzeptable Lösungen mit
Nullstellen im konkaven Bereich.
Aus der Diskussion dieser Ergebnisse erwarten wir im Einklang mit systematischen Überlegung ein diskretes Spektrum
0 < λ 0 < λ1 < λ2 < . . . ,
wobei die Eigenfunktion ϕn (ξ) zu λn genau n Nullstellen hat.
38
Numerische Lösungen von Gl. (98) für verschiedene λ. Im Bereich ξ 2 < λ ist y konkav zur
Achse, außerhalb konvex. Die Rechnungen gehen von der Randbedingung ϕ(−∞) = 0 aus.
Wenn auch ϕ(+∞) = 0 wird, ist λ Eigenwert.
Nach diesen Vorüberlegungen wollen die Eigenwerte und Eigenfunktionen systematisch konstruieren. Dazu nehmen wir an, die Funktion y(ξ) erfülle bereits die
Gleichung (98)
y 00 = (ξ 2 − λ)y
mit den erforderlichen Randbedingungen y(−∞) = y(∞) = 0, sei also (nicht
normierte) Eigenfunktion zum Eigenwert λ. Dann bilden wir die Hilfsfunktion
!
d
y = ξy − y 0 .
ŷ = ξ −
dξ
Offenbar “erbt” ŷ die Randbedingungen von y. Um zu sehen, welche Differentialgleichung ŷ erfüllt, rechnen wir
39
ŷ 0 = y + ξy 0 − y 00 = ξy 0 + (λ + 1 − ξ 2 )y und
ŷ 00 = ξy 00 + y 0 + (λ + 1 − ξ 2 )y 0 − 2ξy
= (λ + 2 − ξ 2 )y 0 − 2ξy + ξ(ξ 2 − λ)y
= (λ + 2 − ξ 2 )(y 0 − ξy) = (ξ 2 − λ − 2)ŷ.
Ist also y(ξ) Eigenfunktion zum Eigenwert λ, so ist ŷ(ξ) Eigenfunktion zum Eigenwert λ + 2.
Mit dem Operator
A− = ξ −
d
dξ
(99)
können wir uns also ausgehend von einer Eigenfunktion ym (ξ) zum Eigenwertλm
durch die Rekursion
0
yn+1 = A− yn = ξyn − yn ,
λn+1 = λn + 2
(100)
eine unendliche Folge von Eigenfunktionen yn und Eigenwerten λn mit n > m
konstruieren. Die definitive Übersicht über alle Eigenfunktionen und insbesondere
die Startlösung y0 erhalten wir, wenn wir neben A− auch den “adjungierten”
Operator (vgl. S. 41)
d
A+ = ξ +
(101)
dξ
definieren. Er führt — bis auf einen unwesentlichen Faktor (s. u.) — von yn auf
yn−1 , also von λn auf λn −2. Um das zu sehen, kann man die obige Rechnung mit
geändertem Vorzeichen wiederholen. Eleganter und wesentlich informativer ist es
jedoch, das Produkt
A+ A− = ξ 2 + 1 −
d2
=1+h
dξ 2
(102)
zu bilden. Wenden wir diese Operatorgleichung auf yn an und berücksichtigen
A− yn = yn+1 , λn+1 = λn + 2 sowie hyn = λn yn , so folgt
A+ yn+1 = A+ A− yn = (1 + h)yn = (λn + 1)yn
yn−1 =
1
λn−1 + 1
A+ yn =
40
1
A+ yn .
λn − 1
oder
(103)
Und nun kommt der entscheidende Punkt: Mit Gl. (103) können wir uns ausgehend von einem beliebigen Eigenwert auf unserer “Leiter” “herunterhangeln”
und immer kleinere Eigenwerte erzeugen. Da aber alle Eigenwerte positiv sein
müssen, muß die Leiter (103) auf einer “untersten Sprosse” y0 enden — oder anders ausgedrückt: A+ y0 muß verschwinden. Daraus folgt die Differentialgleichung
y00 = −ξy0
mit der (abgesehen von der Normierung) eindeutigen Lösung
y0 = e−ξ
2 /2
.
Durch Einsetzen in (98) erhalten wir den zugehörigen Eigenwert λ0 = 1. Damit
können wir alle Eigenfunktionen und Eigenwerte explizit angeben:
λn = 2n + 1
oder
1
En = (n + )h̄ω
2
(104)
und
2
y0 = e−ξ /2
2
y1 = ξy0 − y00 = 2ξe−ξ /2
y2 = ξy1 − y10 = (4ξ 2 − 2)e−ξ
..
.
yn+1 = ξyn − yn0 .
2 /2
(105)
Durch Induktion verifiziert man leicht, daß alle Eigenfunktionen die Form
yn (ξ) = Hn (ξ)e−ξ
2 /2
(106)
haben, wobei Hn (ξ) ein Polynom n-ten Grades in ξ (das Hermitesche Polynom)
ist. yn hat entsprechend unserer Vorüberlegung genau n Nullstellen.
Um nach den yn entwickeln zu können, müssen wir noch ihre Normierung berechnen. Die nötige Vorarbeit dazu haben wir bereits geleistet, es ist nämlich
hyn |yn i = hA− yn−1 |A− yn−1 i = hyn−1 |A+ A− |yn−1 i.
Der letzte Schritt besagt, daß A+ zu A− “adjungiert” ist und folgt aus der partiellen Integration
Z
Z
dyn−1
dyn
yn dξ = − yn−1
dξ.
dξ
dξ
41
Berücksichtigen wir nun noch A+ A− = 1+h (vgl. (102)) und hyn−1 = λn−1 yn−1 =
(2n − 1)yn−1 , so erhalten wir
hyn |yn i = 2nhyn−1 |yn−1 i oder hyn |yn i = 2n n!hy0 |y0 i.
Mit dem Grundintegral
hy0 |y0 i =
Z
2
e−ξ dξ =
√
π
folgt schließlich explizit
√
hyn |yn i = 2n n! π.
(107)
Wenn wir es wünschen, können wir damit auch normierte Eigenfunktionen
ϕn (ξ) = √
1
2n n!π 1/2
yn (ξ)
(108)
bilden, für die hϕn |ϕm i = δnm gilt.
Die Eigenwerte und Eigenfunktionen sind in der folgenden Abbildung wiedergegeben.
Eigenwerte und Eigenfunktionen des eindimensionalen harmonischen Oszillators. Die Parabel
kennzeichnet das Potential u(ξ) = ξ 2 , das “Innere” der Parabel repräsentiert den klassisch erlaubten Bereich E ≥ V bzw. λ > ξ 2 . Die Eigenlösungen ϕn konzentrieren sich wesentlich
auf diesen erlaubten Bereich, dringen aber etwas in den “verbotenen” Bereich ein und klingen dort exponentiell ab. Genau auf der Grenze
V = E bzw. u = λ haben sie einen Wendepunkt.
Wie sind diese Eigenfunktionen physikalisch zu interpretieren? Auf den allerersten
flüchtigen Blick scheinen die entsprechenden Wellenfunktionen
42
ψn (ξ, t) = ϕn (ξ)e−iωn t
eine Zeitabhängigkeit zu zeigen, die der Frequenz
ωn =
En
1
= (n + )ω
h̄
2
entspricht. Aber das ist natürlich nicht richtig, unsere Eigenfunktionen beschreiben ja nach Konstruktion(!) stationäre Zustände, bei denen
|ψn (ξ, t)|2 = ϕ2n (ξ)
gar nicht von der Zeit abhängt.
Die erste Eigenfunktion
ψ0 (x, t) = ϕ0 (x)e−iω0 t = π −1/4 e−ξ
2 /2
i
e− 2 ωt
entspricht gerade einem Gaussschen Wellenpaket mit minimalem Unschärfeprodukt [vgl.(74)], und wir können diese Lösung tatsächlich “verstehen”, wenn wir
von der klassischen Vorstellung eines Teilchens ausgehen, das “unten im Potentialtopf” ruht: x = 0, p = 0, E = p2 /2m + kF x2 /2 = 0. Nun wissen wir ja bereits,
daß sich diese klassische Vorstellung nicht mit der Unschärferelation
hx2 ihp2 i ≥
h̄2
4
verträgt. “Bestenfalls” können wir – eben mit einem Gaussschen Paket – ein
Gleichheitszeichen erreichen und erhalten damit eine Energie
E=
kF 2
1 2
kF 2
h̄2 1
hx i +
hp i =
hx i +
.
2
2m
2
8m hx2 i
Diese Energie wird sowohl für große als auch für kleine hx2 i groß. Für das Minimum rechnen wir
kF
h̄2 1
dE
=
−
=0
dhx2 i
2
8m hx2 i2
Damit folgt
43
oder
h̄
hx2 i = √ .
2 mk
h̄
E=
4
s
h̄
kF
+
m
4
s
h̄ω
kF
=
= E0 .
m
2
Der Zustand |ψ0 i mit der Energie E0 stellt also die “beste” mit der Quantenmechanik verträgliche Annäherung an den klassischen harmonischen Oszillator dar,
der nicht schwingt. Wir erhalten ein anschauliches Bild dieses Zustandes, wenn
wir das im Potentialtopf ruhende Teilchen durch ein ausgeschmiertes Wellenpaket
ersetzen.
Die Vorsicht, mit der wir diesem Bild begegnen müssen, wird aber schon durch die
“höheren” Eigenfunktionen deutlich. Hier ist nämlich der harmonische Oszillator
mit einer höheren Energie En = (n+ 21 )h̄ω “angeregt”, sollte also schwingen. Aber
hψn |ψn i hängt gar nicht von der Zeit ab; was ist eine “stationäre Oszillation”?
In der Abbildung auf der folgenden Seite ist die Aufenthaltswahrscheinlichkeit
wn (ξ) = ψn∗ ψn = ϕ2n für verschiedene n aufgetragen.
Wir vergleichen wn (ξ) mit der mittleren Aufenthaltswahrscheinlichkeit w kl eines
klassischen Teilchens der selben Energie im Potentialtopf des harmonischen Oszillators. Da jede Phase während einer Schwingung zweimal durchlaufen wird,
gilt offenbar
w kl (x)dx = 2
dt
ω
= dt
T
π
oder wegen dx/dt = v
w kl (x) =
ω
ω
= q
.
2
πv
π m (E − V )
Übersetzen wir dies in unsere dimensionslose Darstellung [vgl. die Gleichungen
(95) bis 97)], so erhalten erhalten wir die mittlere Aufenthaltswahrscheinlichkeit
1
,
wnkl (ξ) = √
π λn − ξ 2
(109)
eines klassischen Oszillators der Energie En = λnh̄ω/2 = (n + 21 h̄ω.
Diese Aufenthaltswahrscheinlichkeit ist in der Figur auf der folgenden Seite ebenfalls eingezeichnet. Für n = 0 und n = 1 zeigen die klassischen und quantenmechanischen Erwartungen noch wenig Ähnlichkeit. Mit wachsendem n fällt jedoch
eine eigentümliche Entsprechung ins Auge: Offenbar oszilliert (nicht zeitlich, sondern örtlich!) die quantenmechanische Wahrscheinlichkeit wn um den klassischen
Mittelwert wnkl . Für diese Oszillationen gibt es keine klassische Erklärung. Sie
repräsentieren gerade die wellenmechanische Besonderheit und entsprechen dem
Interferenzmuster hinter einem Doppelspalt.
44
Aufenthaltswahrscheinlichkeit w n (ξ) des harmonischen Oszillators für verschiedene Energieeigenzustände n. Die konvexen Bögen repräsentieren die mittlere Aufenthaltswahrscheinlichkeit wnkl (ξ) [vgl. Gl. (109)] klassischer Oszillatoren der selben Energie.
45
Ist also der quantenmechanische Erwartungswert generell ein Zeitmittel? Nein,
das ist er keineswegs, aber die Energieeigenfunktionen haben schon etwas mit
einem Zeitmittel zu tun. Wenn wir nämlich die Energie eines Oszillators exakt
kennen, wissen wir wegen der Energie–Zeit–Unschärfe gar nichts mehr über den
Zeitpunkt des Nulldurchgangs, also die Phase. Die Wahrscheinlichkeitsverteilung
ψn∗ ψn entspricht klassisch also der Aufenthaltswahrscheinlichkeit von isoenergetischen Oszillatoren beliebiger Phase, oder eben dem Zeitmittel.
Kann unser quantenmechanischer Formalismus denn vielleicht die Dynamik, also
die harmonische Schwingung, des harmonischen Oszillators gar nicht beschreiben?
Zunächst einmal sehen wir an der Ehrenfest–Beziehung
mhẍi = −h
dV
i = kF hxi ,
dx
(110)
daß der Erwartungswert hxi des harmonischen Oszillators exakt die klassische
Beziehung
hxi = a cos ωt + b sin ωt, ω =
q
kF /m
(111)
erfüllt. [Das ist kein Widerspruch zu den stationären Zuständen |ψn i, denn für
die gilt
hxin = hψn |x|ψn i = 0
(also a = b = 0), da alle ϕ2n symmetrische Funktionen von x sind.]
Also oszilliert der Oszillator auch quantenmechanisch genau mit der Frequenz
ω. Eine solche Oszillation wird aber von den einzelnen Energieeigenfunktionen
nicht beschrieben. Wir erhalten sie vielmehr erst dann, wenn wir verschiedene
Eigenfunktionen gemäß
ψ(ξ, t) =
X
cn ϕn (ξ)e−iωn t ,
1
ωn = (n + )ω
2
(112)
überlagern. Dann sieht man sofort, daß die Wahrscheinlichkeitsdichte
ψ∗ψ =
X
c∗n cm ϕn (ξ)ϕm (ξ)ei(n−m)ωt
n,m
und mit ihr alle Erwartungswerte
hAi =
X
n,m
c∗n cm hϕn |A|ϕm iei(n−m)ωt
46
(113)
periodische Funktionen der Zeit mit der Periodendauer T = 2π/ω sind. Speziell
zum Mittelwert hξi berechnen wir die “Matrixelemente”
!
1
d
d
|ϕm i
hϕn | ξ +
+ξ−
2
dξ
dξ
1
hϕn |(A+ + A− )|ϕm i
2
αn hϕn |ϕm−1 i + βn hϕn |ϕm+1 i
αn δn,m−1 + βn δn,m+1
hϕn |ξ|ϕm i =
=
=
=
(114)
(die Berechnung von αn und βn schenken wir uns) und erhalten
hξi =
=
X
n,m
X
n
c∗n cm (αn δn,m−1 + βn δn,m+1 )ei(n−m)ωt
c∗n αn cn+1 eiωt + βn cm−1 e−iωt .
hξi wird also in Übereinstimmung mit (111) immer eine rein harmonische Funktion von ωt. Wenn wir also irgendein Wellenpaket im Potentialtopf des harmonischen Oszillators betrachten, so wird dessen “Schwerpunkt” — der Erwartungswert hξi — rein harmonisch oszillieren, während sich die Form periodisch mit
2π/ω — aber nicht rein harmonisch — verändert. Lediglich das spezielle Gaußsche Wellenpaket, das ϕ0 entspricht, kann ohne Formveränderung im Potentialtopf oszillieren (Übungen). Diese spezielle Lösung hat es vielen Physikern schwer
gemacht, sich von der Vorstellung zu lösen, daß das Minimalpaket “wirklich” das
Teilchen repräsentiert.
Eine zeitlich oszillierende Wahrscheinlichkeitsdichte ψ ∗ ψ entspricht aber keiner
exakt vorgegebenen Energie. Zu einer Beobachtung der Oszillation gehört nämlich
eine Meßzeit δt < 1/ω, und die ist mit einer Energieunschärfe ∆E ∼ h̄/δt > h̄ω
verbunden. Zur Darstellung eines solchen Energiebereiches brauchen wir aber
mehrere Energieeigenfunktionen. Eine scharfe Messung der Energie mit ∆E h̄ω
erfordert dagegen eine Meßzeit ∆t ≥ h̄/∆E = 1/ω, also eine Beobachtung über
viele Perioden. Und bei dieser Beobachtung sehen wir eben nur noch die über alle
Phasen gemittelte Aufenthaltswahrscheinlichkeit des harmonischen Oszillators.
Wir sind es aus der Atomphysik gewohnt, nur die stationären Zustände als relevante Lösungen der Schrödingergleichung zu betrachten: Nicht stationäre Lösungen sind viel zu “kurzlebig“, um uns genauer zu interessieren. Da es sich dabei meist um geladene Teilchen handelt, wird in nicht stationären Zuständen
tatsächlich Energie abgestrahlt. Nichtstationarität wird daher als Übergang von
einem stationären Zustand in einen anderen stationären Zustand beschrieben.
47
Wenden wir diese Begriffe auf den harmonischen Oszillator an, beschreiben wir
also die Schwingung durch Übergänge zwischen benachbarten Energieniveaus.
Gl.(114) wird dann in der Sprechweise der Atomphysik als Auswahlregel ∆n = ±1
interpretiert. Trägt der Oszillator eine elektrische Ladung, so strahlt er elektromagnetische Wellen der Frequenz ω ab. Die Auswahlregel ∆n = ±1 oder ∆E = ±h̄ω
läßt sich dann in die Aussage übersetzen, daß die ausgesandte (oder absorbierte)
Strahlung in Photonen der Energie h̄ω gequantelt ist.
3.3
Die Potentialmulde: Diskretes und kontinuierliches
Spektrum
Der harmonische Oszillator ist ein Modell für viele physikalische Systeme, in einer
Hinsicht ist er aber immer unrealistisch: Bei hinreichend großem Abstand vom
“Zentrum” wird schließlich jede Kraft verschwinden. Ein anziehendes Kraftzentrum wird daher i. a. durch eine Potentialmulde (Potentialtopf) mit V (±∞) = 0
beschrieben:
V(x)
a
b
x
E<0
Ein klassisches Teilchen mit einer Energie E < 0 wird sich dann zwischen zwei
Umkehrpunkten a und b bewegen und sich dabei qualitativ ähnlich wie der harmonische Oszillator verhalten. Eine entsprechende Analogie erwarten wir auch
quantenmechanisch: Die stationäre Schrödingergleichung
h̄2 d2 ϕ
−
+ V (x)ϕ = Eϕ
2m dx2
(115)
wird diskrete Energiewerte E0 < E1 < . . . 0 besitzen — vorausgesetzt, die Potentialmulde ist hinreichend tief und breit.
Die zugehörigen Eigenfunktionen ϕn haben in den klassischen Umkehrpunkten
Wendepunkte und sind im erlaubten Bereich konkav, außerhalb konvex zur Achse.
Dabei hat ϕn innerhalb der Potentialmulde n Nullstellen. Außerhalb der Potentialmulde klingen die Eigenfunktionen exponentiell ab, wir erhalten insbesondere
für x → ±∞
48
ϕn → Cn± e
−κn |x|
mit κn =
s
−2mEn
.
h̄2
(116)
Für endlich tiefe Potentialtöpfe erwarten wir nun höchstens endlich viele Eigenwerte14 (siehe Skizze).
ϕ
E
x
E2
E1
E0
Ein entscheidender Unterschied zum harmonischen Oszillator liegt darin, daß wir
uns mit dieser Analogie auf gebundene Zustände mit E < 0 beschränken müssen.
Dem entsprechen klassisch oszillatorische Bahnen, die nicht aus der Potentialmulde herausführen. Für E ≥ 0 können jedoch die Teilchen über die Potentialmulde
“hinweglaufen”. Die “stationäre” — was heißt das in dem Fall? — Schrödingergleichung (115) besitzt dann Lösungen, die statt (116) das asymptotische Verhalten
ϕE>0 → αe
ikx
+ βe
−ikx
,
k=
s
2mE
h̄2
(117)
für x → ±∞ zeigen. Das sind natürlich genau die ebenen Wellen, die uns zur
kräftefreien Schrödingergleichung geführt hatten und die ausdrücken, daß der
Impuls p = h̄k konstant bleibt.
Dieser im Grunde nicht unerwarteter Sachverhalt führt zu einer unangenehmen
mathematischen Schwierigkeit: Funktionen mit dem asymptotischen Verhalten
(117) sind nicht normierbar und damit keine Eigenfunktionen im bisherigen strengen Sinn. Wir benötigen sie aber, um allgemeinere Lösungen der Schrödingergleichung — z. B. Wellenpakete — darzustellen: Der diskrete Satz normierbarer
Eigenfunktionen ist nicht vollständig!
Mathematisch kann man nun die “Eigenfunktionen” für E > 0 durch geeignete
Grenzprozesse aus normierbaren Eigenfunktionen darstellen. Beispielsweise kann
man das Potential V (x) durch
14
Wir entnehmen alle diese Aussagen der elementaren Anschauung und verzichten auf die
mathematischen Beweise.
49
V
VA (x) =
(
V (x)
∞
f ür
f ür
|x| < A
|x| > A
−A
A
x
ersetzen und den Grenzübergang A → ∞ betrachten. Für jedes endliche A erhält
man dann ein vollständiges diskretes Spektrum. Mit wachsendem A rücken die
Eigenwerte Eν > 0 jedoch immer dichter zusammen und in der Grenze A = ∞
erhalten wir ein kontinuierliches Spektrum: Alle Energiewerte E ≥ 0 werden
Eigenwerte.
Mathematisch benötigt man nun das Konzept der “Distributionen”, um den Hilbertraum für solche Grenzprozesse zu vervollständigen. Wir verzichten auf die
mathematische Rechtfertigung und interpretieren die freien Zustände E ≥ 0 physikalisch: Wenn ein Teilchen nicht mehr gebunden ist, so kann es sich irgendwo im
gesamten Raum aufhalten, die Aufenthaltswahrscheinlichkeit in jedem endlichen
Teilinterval und damit die Wahrscheinlichkeitsdichte wird also Null. Wir können
aber immer noch nach einer ortsabhängigen Intensität ψ ∗ ψ fragen, wenn wir nicht
von einem Teilchen, sondern von einem Strom von Teilchen bestimmter Energie,
welcher den ganzen Raum erfüllt, ausgehen. Dies entspricht genau der experimentellen Situation bei den Interferenzexperimenten und führt uns zur Einführung
einer nicht normierbaren Wellenfunktion
Φk (x) =
√ ikx
ne
(118)
freier Teilchen. Nach Gl. (55) gehört zu dieser Wellenfunktion eine Stromdichte
(
d
d
h̄
j=
Φ∗k Φk − Φk Φ∗k
2im
dx
dx
j=
)
= h̄
2ik
n
2im
h̄k
p
n = n = nvkl .
m
m
oder
(119)
Gl. (118) beschreibt also einen Strom von Teilchen der Dichte n, die mit der
Geschwindigkeit vkl = p/m strömen. Entsprechend beschreibt
Φ−k (x) =
√
ne−ikx
(120)
eine Welle oder einen Teilchenstrom in negativer x–Richtung oder allgemeiner
50
Φk (r) =
√
neik·r
(121)
eine Welle oder einen Strom in k–Richtung.
Mit Φ∗k Φk = n = const. verstehen wir auch sofort, warum Φk nicht normierbar sein
kann: ein unendlich ausgedehnter Strom von Teilchen konstanter Dichte enthält
nun einmal unendlich viele Teilchen! Abschließend bleibt lediglich zu erwähnen,
daß wir bei einer präzisen Diskussion — wie bereits früher betont — die Begriffe
“Teilchendichte” und “Stromdichte” genauer durch “Wahrscheinlichkeits–Dichte”
und “Wahrscheinlichkeits–Stromdichte” ersetzen sollten.
Nach dieser physikalischen Erklärung können wir nun also Funktionen, die sich
im Unendlichen wie
ϕk (x) = eikx
(122)
verhalten, als Eigenfunktionen15 zulassen: sie beschreiben uns einen Teilchenstrom der Dichte 1 und der Geschwindigkeit vkl = p/m = h̄k/m.
Wenn wir nun auf die asymptotische Form (117) der Energie–Eigenfunktionen
zurückkommen, so haben wir die Freiheit, zwei willkürliche Konstanten α und
β festzulegen. Diese Konstanten bestimmen die Intensität einer vor– und einer
rücklaufenden Welle. Um hier Eindeutigkeit zu erzielen, wollen wir grundsätzlich
die folgende Verfügung treffen. (Dabei denken wir nicht nur an Potentialmulden,
sondern auch an Berge und allgemeine Störungen.)
Wir nehmen an, daß von links (x = −∞) eine ebene Welle ϕe = exp(ikx) einläuft
(“Ursache”). Diese Welle repräsentiert einen Teilchenstrom der Dichte 1 und der
Stromdichte je = h̄k/m in positiver x–Richtung. Als “Wirkung” erscheint weit
hinter der Potentialstörung (x → +∞) eine auslaufende Welle ϕa = d exp(ikx).
Aus der Analogie zur Optik, wo das veränderliche Potential einem veränderlichen
Brechungsindex entspricht, schließen wir, daß wir links (x → −∞) außerdem eine
reflektierte Welle ϕr = r exp(−ikx) zulassen müssen — auch wenn dies im klaren
Widerspruch zur klassischen Mechanik steht. Wir suchen also für E > 0 diejenige Lösung der stationären Schrödingergleichung (115), welche die asymptotische
Darstellung
ϕ → eikx + re−ikx
ϕ → deikx
(x → −∞)
(x → +∞),
15
k=
s
2mE
h̄2
(123)
Für freie Teilchen sind dies gemeinsame Eigenfunktionen des Impuls– und Hamiltonoperators.
51
besitzt. Gl. (123) wird auch als Ausstrahlungsbedingung bezeichnet. (Die Bedeutung dieser Bedingung wird in der dreidimensionalen Verallgemeinerung noch
transparenter.) Aus den Stromdichten ja = d∗ dh̄k/m und jr = −r ∗ rh̄k/m der
auslaufenden und der reflektierten Teilchen ergeben sich dann die Koeffizienten
D(E) =
ja
|jr |
= d∗ d und R(E) =
= r∗r
je
je
(124)
der Durchlässigkeit und der Reflexion.
3.4
Das eindimensionale Kastenpotential
Wir wollen das allgemeine Konzept des vorigen Abschnitts an einem Beispiel
verdeutlichen und wählen dazu — da die Fälle, in denen die Schrödingergleichung
elementar lösbar ist, rar sind — das einfache Kastenpotential
V (x) =
(
V0 f ür
0 f ür
|x| ≤ a
|x| > a .
(125)
V
−a
a
x
V0
In klassischer Beschreibung ist das Teilchen also für |x| 6= a überall kräftefrei und
erfährt nur bei x = ±a eine (unendlich) starke Kraft.
Mit
=
2mE
h̄2
und u(x) =
lautet die stationäre Schrödingergleichung
52
2m
V (x)
h̄2
d2 ϕ
+ [ − u(x)]ϕ = 0.
dx2
(126)
Wir setzen (bis auf weiteres) u0 = 2mV0 /h̄2 < 0 voraus und interessieren uns
zunächst für die diskreten Eigenwerte n < 0 mit normierbaren Eigenfunktionen
ϕn .
Aus Gl. (126) entnehmen wir nun die allgemeine Lösung
ϕ =
(
αeκx (x < −a)
βe−κx (x > a)
)
mit κ =
√
−
(127)
außerhalb und
ϕ = γ cos(kx) + δ sin(kx) (|x| ≤ a) mit k =
√
− u0
(128)
innerhalb des Potentialtopfes. Zur Bestimmung der vier Unbekannten α, β, γ, δ
haben wir nun fünf Bedingungen, nämlich
– die Stetigkeit16 von ϕ bei x = ±a
– die Stetigkeit von ϕ0 bei x = ±a
und
– die (willkürliche) Normierung von ϕ.
Dies ist i. a. eine Bedingung zuviel; daher werden wir nur für bestimmte Werte
von E — eben die Eigenwerte En — Lösungen finden.
Die eigentliche Rechnung können wir durch folgende Überlegung abkürzen: Aufgrund der Symmetrie des Problems erwarten wir, daß die Aufenthaltswahrscheinlichkeit ϕ2 nur von |x| abhängt. Das bedeutet aber, daß wir entweder symmetrische Eigenfunktionen
ϕ = e−κ|x| f ür |x| > a und ϕ = γ cos(kx) f ür |x| ≤ a
(129)
oder antisymmetrische Eigenfunktionen
ϕ = sign(x)e−κ|x| f ür |x| ≥ a und ϕ = δ sin(kx) f ür |x| ≤ a
16
(130)
Die Stetigkeit von ϕ und ϕ0 läßt sich ebensowenig wie ϕ selbst physikalisch interpretieren
und begründen. Wir folgern sie mathematisch aus der Beschränkheit von ϕ00 .
53
erhalten. Über die Normierung haben wir mit dem Vorfaktor 1 vor der Exponentialfunktion bereits verfügt. Daher stehen uns zur Bestimmung der einen Konstante
γ bzw. δ nun die zwei Stetigkeitsbedingungen bei x = +a zur Verfügung.
Betrachten wir zunächst die symmetrischen Eigenfunktionen. Für sie erhalten wir
e−κa = γ cos(ka) und
− κe−κa = −kγ sin(ka).
Diese beiden Gleichungen können im allgemeinen nur für bestimmte Werte von
κ() und k() erfüllt sein. Eliminieren wir nämlich γ, so erhalten wir (nach Erweiterung mit a) die Bedingung
ka tan(ka) = κa.
(131)
Entsprechend erhalten wir für die antisymmetrischen Eigenfunktionen die beiden
Gleichungen
e−κa = δ sin(ka) und − κe−κa = kδ cos(ka),
die auf die Bedingung
−ka cot(ka) = κa
(132)
führen.
Wir können die Auswertung der verschiedenen Bedingungen (131) und (132) zusammenfassen, wenn wir berücksichtigen,
– daß tan x und cot x mit π periodisch sind und
– daß tan(x − π/2) = − cot x gilt.
Damit lassen sich sowohl (131) als auch (132) in der Form
π
κa = ka tan ka − m
,
2
m = 0, 1, 2, . . .
(133)
schreiben, wobei m alle natürlichen Zahlen einschlielich 0 durchläuft, wenn wir
das Argument des Tangens auf das Intervall [0, π/2] beschränken. Die Eigenwerte
erhalten wir graphisch, indem wir (133) mit dem Kreisbogen
κ2 + k 2 = −u0
oder a2 κ2 + a2 k 2 = R2
vergleichen (siehe die folgende Abbildung).
54
mit R2 = a2 |u0 | =
2ma2
|V0 |
h̄2
Graphische Lösung der Eigenwertgleichung (133): κa als Funktion
von ka wird mit dem Kreisbogen
a2 κ2 +a2 k 2 = R2 = −a2 u0 verglichen. (Die Abbildung bezieht sich
speziell auf R = 5, also a2 u0 =
−25.)
Für kleine Werte von R erhalten wir genau einen Eigenwert. Lassen wir R nun
anwachsen, so entsteht jeweils ein zusätzlicher Eigenwert, wenn R die Grenze
mπ/2 überschreitet. Wir erhalten so eine endliche Anzahl
 s
2R
2
= 1+
N =1+
π
π

2ma2
|V0 |
h̄2
(134)
von Eigenwerten, die von V0 a2 abhängt. Diese Zahl können wir aus der wellenmechanischen Anschauung “verstehen”: Teilchen im Potentialtopf haben einen
maximalen Impuls
p0 =
q
2m|V0 |.
Dem entspricht eine minimale Wellenlänge
λ0 =
2πh̄
2πh̄
=q
.
p0
2m|V0 |
Damit können wir (134) auch in der Form
4a
N =1+
λ0
(135)
schreiben: Die Zahl der Eigenwerte ist gleich eins plus die Anzahl der Halbwellen (λ0 /2), die in der Topfbreite (2a) “passen”. Die “zusätzliche” eins ergibt sich
daraus, daß die Welle noch ein Stück (mit exponentieller Dämpfung) in den “verbotenen” Bereich außerhalb des Potentialtopfes eindringt (vgl. die Figur auf der
nächsten Seite).
55
Eigenwerte und –funktionen im Kastenpotential für a2 u0 = −20 und a2 u0 = −25.
Bei festem a erhalten wir nur für V0 → −∞ (unendlich tiefer Potentialtopf)
unendlich viele Eigenwerte
π
akn = n
2
nπ
oder n − u0 =
2a
2
,
n = 1, 2, 3, . . .
(136)
Hierzu gehören die Eigenfunktionen
ϕ2m = sin(k2m x) bzw. ϕ2m+1 = cos(k2m+1 x)
(137)
mit Nullstellen am Rand des Potentialtopfes: Mit −V0 gehen auch −E und κ
gegen ∞, die Welle kann dann nicht mehr in die unendlich hohe Potentialwand
eindringen.
Kehren wir nun zu endlichen Potentialwerten V0 zurück und betrachten die freien
Teilchen mit E > 0. Entsprechend Gl. (123) setzen wir nun17
ϕ =
(
eikx + re−ikx (x < −a)
deikx (x > a)
)
mit k =
√
(138)
für das Potential außerhalb des Potentialtopfes an. Im Potentialtopf (|x| ≤ a) gilt
dagegen
ϕ = ãeik0 x + b̃e−ik0 x
mit k0 =
17
√
− u0 .
(139)
Zur anschaulichen Interpretation ist es nützlich, das entsprechende optische Problem zu
diskutieren. Der Bereich |x| < a entspricht dann einem Bereich mit verändertem Brechungsindex.
56
Die vier unbekannten Koeffizienten r, d, ã, b̃ müssen wir nun aus der Stetigkeit
von ϕ und ϕ0 bei x = a und x = −a bestimmen, also aus18
ãeik0 a + b̃e−ik0 a
k0 (ãeik0 a − b̃e−ik0 a )
ãe−ik0 a + b̃eik0 a
k0 (ãe−ik0 a − b̃eik0 a )
=
=
=
=
deika
kdeika
e−ika + reika
k(e−ika − reika ).
(140)
Wir schenken uns nicht nur die langwierige Lösung dieser Gleichungen, sondern
verzichten auch auf die wenig erhellende Anschrift der Ergebnisse (vgl. Süßmann
S. 50/51, Gleichungen (28, 29) mit L = 2a und kK = k0 ). Wichtig sind uns nur
die folgenden beiden Feststellungen:
1. Wir haben vier lineare Gleichungen zur Bestimmung der vier Koeffizienten
r, d, a und b. Im Gegensatz zum Fall E < 0 ist unser Gleichungssystem für
E > 0 also nicht überbestimmt. Darum gibt es nicht nur für bestimmte E
Lösungen, sondern wir erhalten ein kontinuierliches Spektrum.
2. Nach der klassischen Mechanik sollten alle Teilchen über die Potentialmulde
weglaufen. Dem entspricht D = d∗ d = 1 und R = r ∗ r = 0. Setzen wir jedoch
r = 0, so folgt mit z = eik0 a aus den beiden letzten Gleichungen (140)
ã
k0
+ b̃z =
z
k
ã
− b̃z .
z
Nach den ersten beiden Gleichungen (140) gilt außerdem
!
k0
b̃
b̃
ãz + =
ãz −
.
z
k
z
Diese beiden linearen homogenen Gleichungen besitzen aber nur für z 2 =
1/z 2 oder z 4 = 1 nicht–triviale Lösungen ã und b̃. Wir schließen daraus,
daß — abgesehen von “Resonanzen” eik0 a = ±1 und ±i oder k0 a = nπ/2
— immer ein gewisser Bruchteil von Teilchen an der Potentialmulde reflektiert wird. [Ist die Resonanzbedingung erfüllt, so entspricht die Breite des
Potentialtopfes gerade einer ganzen Zahl von halben Wellenlängen. Dabei
löschen sich die bei x = +a und bei x = −a reflektierten Wellen durch
Interferenz.]
18
Da das Problem durch die Randbedingungen nicht mehr symmetrisch ist, ist es rechnerisch
günstiger, den Potentialtopf in den Bereich (0, 2a) zu legen.
57
3.5
Potentialbarriere und Tunneleffekt
Wir haben bisher von einer Potentialmulde gesprochen, unsere Diskussion der
“Streuung” (E > 0) gilt aber ohne jede Änderung genauso für einen Potentialberg
V0 > 0 — vorausgesetzt, es gilt E > V0 , so daß k0 in Gl. (139) reell ist. Noch
viel interessanter ist jedoch der Fall E < V0 , der klassisch eine undurchdringliche
Potentialbarriere darstellt, an der alle Teilchen reflektiert werden.
V
E
−a
0
a
x
Statt der Gl. (139) erhalten wir nun im “verbotenem” Bereich |x| < a
ϕ = ãe−κ0 x + b̃eκ0 x
mit κ0 =
√
u0 − .
(141)
Aber auch nun können wir auf dieselbe Rechnung zurückgreifen, wenn wir nur
k0 durch iκ0 ersetzen (k0 und κ0 sind jeweils reell). Auch in diesem Fall erhalten
wir also eine endliche Wahrscheinlichkeit D = d∗ d dafür, daß das Teilchen die
Barriere durchdringt: Das Teilchen gräbt sich bildlich durch den Potentialberg,
man spricht vom Tunnel–Effekt. Führt man die Rechnung explizit aus, so erhält
man den Durchlaßkoeffizienten
V02 g(E)
D(E) = d∗ d = 1 +
4E|V0 − E|
"
g(E) =
(
#−1
mit
(142)
sin2 (2k0 a) (E > V0 )
sinh2 (2κ0 a) (E < V0 ) .
Für hohe und breite Potentialbarrieren, die schwer zu durchtunneln sind, gilt
g(E) ≈ 14 e4κ0 a , und die Tunnelwahrscheinlichkeit wird
D(E) =
16E(V0 − E) −4κ0 a
e
V02
58
mit κ20 =
2m
(V0 − E).
h̄2
(143)
Der bestimmende Exponent geht also mit der Breite des Potentialberges und der
Wurzel aus der “Fehlenergie” V0 − E. Den Exponentialfaktor verstehen wir aus
der Struktur von Gl. (141): Wir erwarten eine Lösung, die im verbotenem Bereich
von links nach rechts exponentiell abklingt, d. h. es muß
ϕ(a) ∼ e−2κ0 a ϕ(−a)
gelten. Da die Aufenthaltswahrscheinlichkeit und der Strom mit ϕ∗ ϕ geht, folgt
hierfür der Faktor exp(−4κ0 a).
Wir erwähnen abschließend, daß der dominierende Exponentialfaktor für ortsabhängige Potentiale annähernd (“WBK–Näherung”) in
−2
D(E) ∼ e
Rx1
x0
κ(x)dx
mit κ(x) =
s
2m
(V (x) − E)
h̄2
(144)
übergeht. Dabei sind x0 und x1 die Grenzen des klassisch verbotenen Bereichs.
Als Beispiele für Phänomene, die auf dem Tunnel–Effekt beruhen, nennen wir den
α–Zerfall und die Elektronen–Feldemission aus Metallen. Ein optisches Analogon
läßt sich bei der Totalreflexion an Schichten endlicher Dicke finden.
3.6
Kugelsymmetrische Potentiale im dreidimensionalen
Raum
Bisher haben wir nur eindimensionale Lösungen der Schrödingergleichung diskutiert. Wir befassen uns nun mit der dreidimensionalen stationären Schrödingengleichung mit isotropem Hamiltonoperator
p2
H=
+ V (r).
2m
(145)
Dabei beschränken wir uns auf die Diskussion gebundener Zustände19 E < 0. Dies
setzt natürlich attraktive Potentiale V (r) voraus. Wir nehmen darüber hinaus an,
daß das Potential für r → ∞ verschwindet und gehen von
V (r) < V (∞) = 0
aus.
19
Die freien Zustände E > 0 werden in der Streutheorie behandelt. Diese sprengt schon allein
wegen ihres Umfangs den Rahmen unserer Darstellung.
59
Das kugelsymmetrische Potential legt es nun nahe, die stationäre Schrödingergleichung
−
h̄2
∆χ + V (r)χ = Eχ
2m
(146)
in sphärischen Polarkoordinaten r, ϑ, ϕ anzuschreiben. Dazu benötigen wir die
Darstellung
∆=
∂
∂2
1 ∂2
1
∂
1
r
+
sin
ϑ
+
r ∂r 2
r 2 sin ϑ ∂ϑ
∂ϑ r 2 sin2 ϑ ∂ϕ2
des Laplaceoperators, die wir einer Formelsammlung entnehmen. Wenn wir zur
bequemen Anschrift noch
µ = cos ϑ
einführen, erhalten wir so die Schrödingergleichung
∂
h̄2 1 ∂ 2
h̄2
1 ∂2χ
2 ∂χ
−
rχ
−
(1
−
µ
)
+
+
2m r ∂r 2
2mr 2 ∂µ
∂µ 1 − µ2 ∂ϕ2
"
#
(147)
[V (r) − E]χ = 0.
Zur Lösung versuchen wir einen Separationsansatz
rχ(r, ϑ, ϕ) = u(r)Y (ϑ, ϕ)
(148)
und erhalten
∂Y
1 ∂2Y
2m
∂
(1 − µ2 )
+
= r 2 Y u00 + 2 (E − V )u .
−u
2
2
∂µ
∂µ
1 − µ ∂ϕ
h̄
#
"
Nach Division durch uY hängt die linke Seite nur von den Winkeln und die
rechte nur von r ab. Beide sind also gleich einer Konstante λ. Damit zerfällt die
Schrödingergleichung in eine radiale Gleichung
d2 u 2m
λ
+ 2 (E − V )u − 2 u = 0
2
dr
r
h̄
und eine Gleichung
60
(149)
∂Y
1 ∂2Y
∂
(1 − µ2 )
+
+ λY = 0.
∂µ
∂µ
1 − µ2 ∂ϕ2
(150)
Wir stellen die radiale Gleichung zunächst zurück. Gl.(150) läßt sich durch eine
weitere Separation
Y (ϑ, ϕ) = P (µ)Φ(ϕ)
behandeln:
d
dP
d2 Φ
Φ(1 − µ )
(1 − µ2 )
+ λP = −P 2 .
dµ
dµ
dϕ
2
"
#
Nach Division durch P Φ hängt nun die linke Seite nur von µ, die rechte nur von
ϕ ab. Beide sind also konstant, die Konstante nennen wir m2 :
dP
m2
d
P =0
(1 − µ2 )
+ λ−
dµ
dµ
1 − µ2
(151)
d2 Φ
+ m2 Φ = 0.
2
dϕ
(152)
!
Gleichung (152) können wir sogleich lösen:
Φm (ϕ) = eimϕ .
(153)
Dabei verlangt die Eindeutigkeit Φ(ϕ + 2π) = Φ(ϕ), daß m ganzzahlig ist: m =
0, ±1, ±2 . . .
Die Untersuchung der Gl. (151) ist wesentlich aufwendiger. Es stellt sich heraus,
daß reguläre Lösungen nur für
λ = l(l + 1)
(154)
existieren, wobei l eine ganze Zahl ≥ |m| ist. Die regulären Lösungen Plm (µ)
heißen Legendre– oder Kugel–Funktionen. Zusammengefaßt erhalten wir also
Winkelfunktionen
Ylm (ϑ, ϕ) = clm Plm (cos ϑ)eimϕ
mit l = 0, 1, 2, 3 . . .
und m = −l, −l+1, . . . , l−1, l.
61
(155)
Dabei sind clm geeignete Normierungsfaktoren, die durch
Z
∗
Ylm
Yl0 m0 sin ϑdϑdϕ = δll0 δmm0
definiert sind. Die Ylm sind als Kugelflächen–Funktionen bekannt, in niedrigster
Ordnung erhält man
Y0 0 = (4π)
−1/2
, Y1 0
3
=
4π
1/2
cos ϑ, Y1 ±1
3
=
8π
1/2
sin ϑ e±iϕ .
Bevor wir uns nun die radiale Gleichung (149) ansehen, wollen wir versuchen,
den Winkelanteil physikalisch zu interpretieren. Dazu gehen wir noch einmal zur
Problemstellung mit dem Hamiltonoperator (145) zurück und erinnern uns an
das Zentralkraftproblem der klassischen Mechanik.
Dort hatten wir ausgenutzt, daß der Drehimpuls
L=r×p
konstant ist und hatten die Bewegung in der Ebene senkrecht zu L untersucht.
Dabei erhielten wir radial ein eindimensionales Bewegungsproblem mit einem
effektiven Potential Ṽ = V +L2 /2mr 2 . Wir erkennen dies koordinatenunabhängig
aus
L2 = L · (r × p) = r · (p × L) = r · [p × (r × p]
= r · [p2 r − p · r p] = p2 r 2 − (p · r)2 .
Es gilt also p2 = L2 /r 2 + p2r und
H=
L2
p2r
+
+ V (r).
2m 2mr 2
(156)
Das liefert in radialer Richtung eine eindimensionale Bewegungsgleichung, mit
einem “zusätzlichen Potential” L2 /2mr 2 für die Fliehkraft.
Quantenmechanisch ist die obige Rechnung nun nicht ohne weiteres gültig, weil
die Reihenfolge der Operatoren r, p und L beachtet werden muß. Unter sorgfältiger Beachtung der entsprechenden Vertauschungsrelationen (s. Messiah Bd. I,
Abschn. 9.1.1) oder durch direktes Ausmultiplizieren von L2 = L2x + L2y + L2z läßt
sich aber zeigen, daß Gl. (156) als quantenmechanische Operatorgleichung mit
dem Drehimpuls [vgl. (63)]
62
L=r×p=
h̄
r×∇
i
(157)
gilt, wenn man den “radialen Impuls” durch den Operator
pr =
h̄ 1 ∂
r
i r ∂r
(158)
definiert20 . In dem Term
p2r
h̄2 1 ∂ 2
=−
r
2m
2m r ∂r 2
erkennen wir nun in der Tat den ersten Term von Gl. (147). Durch Vergleich des
zweiten Terms folgern wir dann
2
L = −h̄
2
"
∂
1
∂
∂2
,
(1 − µ2 )
+
∂µ
∂µ 1 − µ2 ∂ϕ2
#
(159)
ein Ergebnis, das man auch direkt aus Gl. (157) durch Einführung von Polarkoordinaten und Ausmultiplizieren (siehe Schiff S. 74/75) erhalten kann. Die Kugelflächenfunktionen Ylm sind also Eigenfunktionen des Drehimpuls–Quadrats [vgl.
Gln. (150, 154)]:
L2 Ylm (ϑ, ϕ) = l(l + 1)h̄2 Ylm (ϑ, ϕ).
(160)
Um die Eigenwerte l(l + 1)h̄2 besser zu verstehen, gehen wir nun vom Drehimpuls
L selbst aus und betrachten seine z–Komponente
!
h̄
∂
∂
Lz = xpy − ypx =
−y
x
.
i
∂y
∂x
Führen wir nun ebene Polarkoordinaten
∂x
= −ρ sin ϕ = −y
∂ϕ
∂y
= ρ cos ϕ = x
y = ρ sin ϕ =⇒
∂ϕ
x = ρ cos ϕ =⇒
20
Messiah (Bd. I, Abschn. 9.1.1, Fußnote 2) weist darauf hin, daß pr hermitesch ist, aber
aufgrund Normierungsschwierigkeiten keine Observable repräsentiert. Wir schließen uns diesem
formalen Argument nicht an, da auch der kartesische Impuls entsprechende Schwierigkeiten mit
sich bringt (vgl. Übungen SS 2006, Blatt 6, Aufg. 2).
63
ein, so folgt
h̄
Lz =
i
∂y ∂
∂x ∂
+
∂ϕ ∂y ∂ϕ ∂x
!
=
h̄ ∂
.
i ∂ϕ
(161)
Beim Eigenwertproblem von Lz
Lz Φ =
h̄ ∂Φ
= mh̄Φ
i ∂ϕ
werden wir nun genau auf die Separationslösungen (153)
Φm (ϕ) = eimϕ
(m = 0, ±1, ±2 . . .)
geführt. Die Kugelflächenfunktionen Ylm sind also auch Eigenfunktionen der z–
Komponente Lz des Drehimpulses:
Lz Ylm (ϑ, ϕ) = mh̄Ylm (ϑ, ϕ).
(162)
L2 und Lz besitzen also ein gemeinsames System von Eigenfunktionen. In diesen
Eigenfunktionen tritt der Drehimpuls Lz gequantelt in Vielfachen von h̄ auf. Dabei
ist zu beachten, daß diese Quantelung für jede beliebige Richtung der z–Achse gilt.
Wir können uns L also nicht mehr als festen “Pfeil” der Länge L, und Lz nicht
mehr als seine Projektion L cos ϑ vorstellen.
In der klassischen Mechanik hatten wir die z–Achse in die Richtung des konstanten Drehimpulses gelegt, d. h. wir hatten Lx = 0, Ly = 0, Lz = L. Wenn wir
dieses Konzept so gut wie möglich zu übernehmen versuchen, gehen wir von
hLz i = lh̄
(163)
aus. Die entsprechende klassische Festlegung Lx = Ly = 0 können wir nun
aber nicht erfüllen, denn zwischen den Drehimpulskomponenten besteht eine
Unschärferelation [vgl. Gl. (81)]
hL2x ihL2y i
h̄2
≥ hLz i2 .
4
Nehmen wir nun aus Symmetriegründen hL2x i = hL2y i an und rechnen mit der
minimalen Unschärfe, so folgt
hL2x = hL2y i =
l
h̄
hLz i = h̄2 .
2
2
64
Damit erhalten wir für das Drehimpulsquadrat den Erwartungswert
hL2 i = hL2x i + hL2y i + hL2z i = lh̄2 + l2 h̄2
oder
hL2 i = l(l + 1)h̄2 .
(164)
Das macht uns den Eigenwert l(l + 1)h̄2 des Operators L2 verständlich: In den
Eigenfunktionen erscheint die z–Komponente des Drehimpulses in Vielfachen von
h̄ gequantelt. Versuchen wir, die z–Achse in die Richtung des Drehimpulses zu
legen (Lz → lh̄), so können Lx und Ly aufgrund der Unschärferelation doch nicht
exakt verschwinden. Die minimale Unschärfe führt dann dazu, daß L2 nicht den
Eigenwert l2h̄2 , sondern den größeren Eigenwert l(l + 1)h̄2 erhält.
Wählen wir bei festem L eine andere Richtung als z–Achse, so werden wir bei
einer Messung wieder nur gequantelte Werte mh̄ für Lz finden. Hieraus wird die
Einschränkung −l ≤ m ≤ l unmittelbar verständlich. Wir dürfen uns damit den
Drehimpuls nicht mehr als Vektorpfeil, sondern als Kegelmantel veranschaulichen:
z
mh
l(l+1)h
Die (2l + 1) “Einstellmöglichkeiten” m = −l, . . . , m = +l des Drehimpulses bei
festem L werden auch als “Richtungsquantelung” bezeichnet.
Fassen wir also zusammen: Die Separationslösung der Schrödingergleichung hat
uns auf Winkelfunktionen (Kugelflächenfunktionen) Ylm (ϑ, ϕ) geführt, die sich als
Drehimpuls–Eigenfunktionen — genauer: als gemeinsame Eigenfunktionen der
Operatoren Lz (Eigenwert mh̄) und L2 (Eigenwert l(l + 1)h̄2 ) — herausstellen.
Damit kommen wir nun zur radialen Gleichung (vgl. (149))
l(l + 1)h̄2
h̄2 d2 u
+
V
(r)
+
u = Eu.
−
2m dr 2
2mr 2
"
#
65
(165)
Diese Gleichung können wir als eindimensionale Schrödingergleichung mit dem
effektiven Potential
Ṽ (r) = V (r) +
l(l + 1)h̄2
2mr 2
interpretieren — in völliger Analogie zur klassischen Mechanik. Das Fliehkraftpotential l(l + 1)h̄2 /2mr 2 hängt von der Quantenzahl l, die den Betrag des Drehimpulses angibt, nicht aber von der Quantenzahl m, die seine Richtung angibt,
ab21 . Dementsprechend sind alle Eigenwerte von Gl. (165) (2l + 1)– fach entartet.
Hierin zeigt sich die Isotropie des Problems. Stört man diese Isotropie, indem
man z. B. ein Magnetfeld anlegt, das eine Raumrichtung auszeichnet, wird diese
Entartung aufgehoben. m heißt darum auch magnetische Quantenzahl.
In allen praktisch interessanten Fällen dominiert das Fliehkraftpotential für l 6= 0
und r → 0 gegenüber V (r):
V
∼
V(r)
r
V(r)
Das resultierende Minimum des Potentials ermöglicht klassische Bahnen, die den
Planetenbahnen entsprechen. Solche klassischen Bahnen sind natürlich für alle
E < 0 möglich. Quantenmechanisch finden wir dagegen nur für bestimmte Energien Eνl stationäre Zustände. Das ergibt sich in Analogie zum eindimensionalen
Fall aus folgender Überlegung:
Da das Fliehkraftpotential für kleine Abstände dominiert, erhalten wir für r → 0
die Differentialgleichung
u00 =
l(l + 1)
u
r2
mit der allgemeinen Lösung
21
Man vermeide Verwechselungen der Masse m und der Quantenzahl m!
66
u → al r l+1 + Al r −l
(r → 0).
(166)
Für r → ∞ dominiert dagegen der Term Eu und wir haben
u00 = κ2 u mit κ2 = −
2mE
> 0,
h̄2
also
u → bl e−κr + Bl e+κr
(r → ∞).
(167)
Die Normierung22
Z
2 3
χ d r = 4π
Z∞ 2
0
u
r
2
r dr = 4π
Z∞
u2 dr = 1
(168)
0
verlangt nun, daß Al und Bl verschwinden. Diese Konstanten sind aber nicht
unabhängig wählbar. Starte ich z. B. eine numerische Integration mit al 6= 0 und
Al = 0, so werden sich bl und Bl aus der Rechnung ergeben. Nur für bestimmte
Werte Enl der Energie wird dabei Bl = 0 werden. Wir erwarten also radiale
Eigenfunktionen unl (r), die von zwei diskreten Quantenzahlen l und n abhängen.
Insgesamt sind die stationären Wellenfunktionen
1
χnlm (r, ϑ, ϕ) = unl (r)Ylm (ϑ, ϕ)
r
des Separationsansatzes (148) also durch die drei Quantenzahlen n, l und m charakterisiert. Diese Anzahl ist auch aus den drei Raumrichtungen zu erwarten.
3.7
Das Wasserstoffatom
Als spezielles Beispiel eines kugelsymmetrischen Potentials betrachten wir nun
das Coulombpotential
V (r) = −
22
e2
4πε0 r
Beachte, daß damit nicht χ, sondern u = χr der eindimensionalen Wellenfunktion entspricht. Damit wird die Interpretation von Gl. (165) als eindimensionale Schrödingergleichung
perfekt.
67
und kommen damit zur Theorie des Elektronenzustandes im Wasserstoffatom23 .
Zur bequemen Rechnung machen wir die Schrödingergleichung [vgl. Gl. (165)]
2m
d2 u
me2 2 l(l + 1)
E
+
+
−
u=0
dr 2
r2
h̄2
4πε0h̄2 r
"
#
durch
r = a0 x und E = −Rκ2
(169)
mit dem Bohrschen Radius
4πε0h̄2
= 5.29 · 10−11 m
a0 =
2
me
(170)
und der Rydberg–Energie
h̄2
1 2
e2
R=
=
mc
2ma20
2
4πε0h̄c
!2
= 13.6 eV
(171)
dimensionslos und erhalten
l(l + 1)
2
d2 u
+
− κ2 −
u = 0.
2
dx
x
x2
"
#
(172)
Nun wissen wir bereits aus der allgemeinen Diskussion, daß u für kleine x wie
xl+1 , für große x wie e−κx gehen muß. Die spezielle Struktur von Gl. (172) legt es
nun nahe, direkt durch den Produktansatz
u = xl+1 e−κx
(173)
nach den einfachsten Eigenfunktionen zu suchen. Bilden wir nämlich
u00 = xl+1
00
=
e−κx + 2 xl+1
0 e−κx
0
0
+ xl+1 e−κx
2(l + 1)
l(l + 1)
κu + κ2 u,
u
−
x2
x
00
so heben sich die Terme mit l(l + 1)/x2 und mit κ2 in Gl. (172) sofort weg. Durch
die spezielle Wahl (l +1)κ = 1 bilanziert sich aber auch der 2/x–Term. Wir finden
mit dem Ansatz (173) also tatsächlich Eigenfunktionen zu den Eigenwerten
23
Wir vernachlässigen das Massenverhältnis m/mp und betrachten den Kern als ortsfest bei
r = 0.
68
κl1 =
1
l+1
oder El1 = −
R
.
(l + 1)2
(174)
Nun existiert zu gegebenem l aber nicht nur ein Eigenwert κl1 . Man kann durch
den Ansatz
u = %xl+1 e−κx
systematisch nach weiteren Eigenfunktionen suchen und findet für bestimmte κlν
Polynome %lν (Laguerresche Polynome) (ν − 1)–ten Grades. Diese Polynome werden aber zunehmend komplizierter und sollen hier nicht mehr untersucht werden.
Wir notieren nur noch das Ergebnis
κlν =
1
l+ν
oder Elν = −
R
(l + ν)2
mit ν = 1, 2, 3, . . .
für sämtliche Energie–Eigenwerte Elν zu gegebenem Drehimpuls l. Alle Eigenwerte
sind also von der Form
κn =
1
n
oder En = −
R
,
n2
(175)
wobei n eine natürliche Zahl ist. Es ist üblich, von Gl. (175) auszugehen und
n als Hauptquantenzahl zu bezeichnen. Läßt man dann n die Werte 1, 2, 3, . . .
durchlaufen, so trägt man der Bedingung n = l + ν (l = 0, 1, 2, . . . und ν =
1, 2, 3, . . .) durch die Bedingung
l = 0, 1, . . . , n − 1
Rechnung. Zu jeder Hauptquantenzahl n gibt es also n Drehimpulsquantenzahlen
l. Berücksichtigt man weiter, daß zu jedem l die (2l + 1) magnetischen Quantenzahlen
m = −l, −l + 1, . . . , l − 1, l
gehören, so findet man, daß der Eigenwert En
n−1
X
l=0
(2l + 1) = n
1 + [2(n−1)+1]
= n2
2
(176)
–fach entartet ist. In der Atomphysik ist es (aus historischen Gründen) üblich, den
Wert der Drehimpulsquantenzahl durch kleine lateinische Buchstaben s, p, d, f, . . .
zu kennzeichnen und hinter die Hauptquantenzahl zu stellen. Damit ergibt sich
das folgende Termschema des Wasserstoffs:
69
Termschema des Wasserstoffs
Nach dieser allgemeinen Übersicht kehren wir zu den speziellen Eigenfunktionen
(173) zurück. Wenn wir von der Hauptquantenzahl n — also von einer vorgegebenen Energie — ausgehen, repräsentieren diese Eigenfunktionen die Zustände mit
maximalen Drehimpuls l = n − 1. Die klassische Entsprechung dieser Zustände
sind Kreisbahnen mit
pr = 0 und T =
L2
.
2mr 2
Wir wollen das durch eine kleine Rechnung bestätigen und schreiben Gl. (173)
wegen l = n−1 in der Form
x
ũn n−1 = xn e− n .
(177)
Diese Eigenfunktionen haben ein Maximum bei
xn = n 2
bzw. rn = n2 a0
(178)
und repräsentieren Wahrscheinlichkeitsdichten wn ∼ ũ2n n−1 , die sich mit wachsendem n immer enger um xn bzw. rn konzentrieren. In der folgenden Figur zeigen
wir das für die relativen Wahrscheinlichkeiten wn rel (x) = wn (x)/wn (xn ):
70
Relative radiale
verteilungen22
Wahrscheinlichkeits-
wn rel (x) =
ũ2n n−1 (x)
ũ2n n−1 (xn )
des Wasserstoff–Elektrons in den
Zuständen unl mit maximalem Drehimpuls l = n−1.
(x = r/a0 , xn = n2 ).
Wir können diese Aussage präzisieren, indem wir von der Formel
Z∞
m −αx
x e
dx =
0
1
αm+1
Z∞
y m e−y dy =
0
m!
αm+1
ausgehen und (mit der Abkürzung ũ = ũn n−1 ) die Normierung
hũ|ũi =
Z∞
2
x2n e− n x dx =
0
2n+1
n
2
(2n)!
sowie die Momente
k
hũ|x |ũi =
Z∞
x
2
2n+k − n
x
e
dx =
0
2n+k+1
n
2
(2n + k)!
berechnen. Daraus folgen die Erwartungswerte24
n
hũ|xk |ũi
=
hx i =
hũ|ũi
2
k
k
(2n + k)!
.
(2n)!
(179)
Speziell für k = 1 erhalten wir
hxi = n n +
1
2
oder hri = n n +
1
a0 ,
2
also einen “mittleren” Radius, der knapp über dem Maximum xn = n2 bzw.
rn = n2 a0 (vgl. (178) liegt. Aus dem quadratischen Mittel
24
Vgl. Gl. (168) und die Fußnote 20. Man beachte, daß in der Definition der radialen Wahrscheinlichkeit bereits die Kugeloberfläche berücksictigt ist.
71
hx2 i = n2 (n + 1) n +
1
2
berechnen wir
∆x2 = hx2 i − hxi2 = n2 n +
hxi2
1 1
=
.
2 2
2n + 1
Die Streuung
∆r
∆x
1
=
=√
hri
hxi
2n + 1
fällt also mit wachsender Quantenzahl n. Für sehr große n (große Energie) wird
man das Elektron daher nur in der engsten Nachbarschaft einer Kugelschale von
Radius rn = n2 a0 antreffen. Daß es sich darüber hinaus um die engste Nachbarschaft von Kreisbahnen handelt, erkennt man erst an den zugehörigen Kugelfunktionen Ylm (ϑ, ϕ). Wenn wir — für große n und damit für große l = n − 1 — die
Polarachse unseres Koordinatensystems “so gut wie möglich” in Drehimpulsrichtung legen wollen, müssen wir l = m wählen und finden tatsächlich Winkelanteile
Yll ∼ sinl ϑ
der Eigenfunktion, die die Konzentration um einen Kreisring in der Äquatorialebene bestätigen. Andere magnetische Quantenzahlen m beschreiben lediglich
andere Orientierungen der Polarachse.
Wir folgern weiter (ohne das explizit zu beweisen), daß kleinere Drehimpulse
l < n − 1 schließlich den Elipsenbahnen des Keplerproblems entsprechen.
Kein klassisches Analogon besitzt der Grundzustand
u1 0 (r) ∼ re−r/a0
bzw. χ1 0 0 (r) ∼ e−r/a0
(180)
des Elektrons im Wasserstoffatom mit der “Nullpunktsenergie” E1 = −R =
−13.6 eV. Er entspricht einem Elektron ohne Drehimpuls, das sich aufgrund der
Coulombattraktion im Kern aufhalten “möchte”, daran aber durch die Orts–
Impuls–Unschärfe gehindert wird. Tatsächlich wird die Wahrscheinlichkeitsdichte
w1 (r) ∼ χ21 0 0 = e−2r/a0
am Kernort r = 0 am größten. Der Grundzustand des Wasserstoffatoms entspricht also ganz dem klassisch ebenfalls nicht verständlichen Grundzustand des
harmonischen Oszillators.
72
Wir schließen die Behandlung des Wasserstoffatoms mit einem neuen Gesichtspunkt zur korrekten Interpretation der Wellenfunktionen. Es liegt ja so nahe (wie
das in vielen Büchern durch Abbildungen implizit suggeriert wird), ψ ∗ ψ bzw.
χ∗ χ als Dichteverteilung eines ausgeschmierten Elektrons zu interpretieren. Diese
Interpretation hat darüber hinaus zunächst den Vorteil, daß sie erklärt, warum
stationäre Zustände nicht strahlen. Nimmt man diese Interpretation aber ernst,so
muß man im Potential die Raumladungsdichte %e = −e|χ|2 berücksichtigen und
erhält
e2
e2
+
V (r) = −
4πε0 r 4π
Z
|χ(r0 )|2 3 0
d r.
|r − r0 |
Die stationäre Schrödingergleichung
e2
h̄2
∆χ +
2m
4πε0
|χ(r0 )|2 3
1
χ = Eχ
d r−
0
|r − r |
r
(Z
)
wird damit eine sehr verwickelte nicht–lineare Integro–Differentialgleichung. Sie
ist aber nicht nur schwierig zu lösen, sondern nach Ausweis der Erfahrung falsch!
Der Term
e2
4πε0
Z
|χ(r0 )|2 3
d r,
|r − r0 |
der eine “Selbst–Wechselwirkung” des Elektrons darstellt, würde eine innere elektrostatische Abstoßung der ausgeschmierten “Elektronenwolke” bewirken, die weder im Wasserstoffatom noch in irgendeinem anderen Experiment beobachtet
wird. Wir hüten uns also davor, das Elektron im Wasserstoffatom (und anderswo)
als Ladungswolke mit einer charakteristischen Ausdehnung a0 zu beschreiben.
73
4
4.1
Mehrteilchensysteme
Die Schrödingergleichung
Wir haben bisher nur die Quantenmechanik eines Teilchens mit einer Hamiltonfunktion H(r1 , p1 ) betrachtet. Diesem Teilchen hatten wir eine Wellenfunktion
|1i = ψ(r1 , t)
zugeordnet, deren Absolutquadrat ψ ∗ ψ die Wahrscheinlichkeitsdichte angab, das
Teilchen 1 am Ort r1 zu finden. ψ genügte der Schrödingergleichung
H(r1 , p1 )ψ = ih̄
∂ψ
,
∂t
wobei H den Hamiltonoperator bezeichnet, der aus der Hamiltonfunktion hervorgeht, indem der Impuls durch den Impulsoperator
p1 =
h̄
h̄ d
∇1 =
i
i dr1
ersetzt wird.
Es liegt nahe und hat sich bewährt, dieses Konzept wie folgt auf Systeme von n
Teilchen zu übertragen:
Wir führen eine Wellenfunktion
|1, . . . , ni = ψ(r1 , . . . , rn , t)
(181)
ein, deren Absolutquadrat ψ ∗ ψ die Wahrscheinlichkeitsdichte angibt, Teilchen 1
bei r1 , Teilchen 2 bei r2 , . . . und Teilchen n bei rn zu finden. Das heißt genauer:
dW = |ψ(r1 , . . . , rn , t)|2 d3 r1 . . . d3 rn
(182)
ist die Wahrscheinlichkeit, das System der Teilchen 1, . . . , n im Volumenelement
d3 r1 . . . d3 rn des 3n–dimensionalen Konfigurationsraums anzutreffen.
Aus der klassischen Hamiltonfunktion
H(r1 , . . . , rn , p1 , . . . , pn ) =
n
X
p2ν
+ V (r1 , . . . , rn )
ν=1 2mν
(183)
bilden wir den Hamiltonoperator H, indem wir die Impulse durch die Impulsoperatoren
74
pν =
h̄ d
h̄
∇ν =
i
i drν
(184)
ersetzen. Dann genügt die Wellenfunktion der Schrödingergleichung
∂
|1, . . . ni = H|1, . . . , ni,
∂t
(185)
n
X
h̄2
∂ψ
=−
∆ν ψ + V (r1 , . . . , rn )ψ.
∂t
ν=1 2mν
(186)
ih̄
oder explizit
ih̄
Wie bisher können wir durch den Separationsansatz
E
ψ(r1 , . . . , rn , t) = ϕ(r1 , . . . , rn )e−i h̄ t
(187)
zu stationären Zuständen ϕ übergehen, die der stationären Schrödingergleichung
−
h̄2
∆ν ϕ + V (r1 , . . . , rn )ϕ = Eϕ.
ν=1 2mν
n
X
(188)
genügen. Im Gegensatz zum Einteilchenproblem wollen wir dieses Konzept aber
nicht mehr durch explizite Lösungsbeispiele illustrieren, da schon das klassische
Mehrteilchenproblem nicht mehr analytisch lösbar ist25 . Stattdessen wollen wir
einige prinzipielle Aspekte ansprechen, die kein klassisches Analogon besitzen und
für die Atomphysik bedeutsam sind.
4.2
Identische Teilchen und Spin
Wir betrachten zwei identische Teilchen 1,2 mit dem symmetrischen Hamiltonoperator
H=
1
(p2 + p22 ) + V (r1 ) + V (r2 ) + U (|r1 − r2 |).
2m 1
(189)
Eine Lösung der Schrödingergleichung, die etwa aus der Anfangsbedingung
ψ12 (t = 0) = ψa (r1 , 0)ψb (r2 , 0)
25
Eine Separation in Relativ– und Schwerpunktskoordinaten ist auch quantenmechanisch
möglich. Dementspreched ist auch das quantenmechanische Zweiteilchenproblem ohne äußere
Kräfte auf das Einteilchenproblem zurückzuführen.
75
(unkorrelierte Anfangszustände) hervorgehe, sei
ψ12 = ψab (r1 , r2 , t).
Wollen wir |ψ12 |2 nach Gl.(182) als Wahrscheinlichkeitsdichte interpretieren, so
müssen wir uns fragen, wie wir die Teilchen 1 und 2 unterscheiden wollen. Denn
die Quantenmechanik beschreibt nicht die Dinge an sich, sondern unsere Beobachtung. In der klassischen Physik ist dies kein Problem, denn wir können die
Teilchen einfach unterscheiden, indem wir
a) die Teilchen durch Marken (z. B. Farbe, Zeichen), welche die Dynamik nicht
beeinflussen, kennzeichnen oder
b) die Teilchen identifizieren, indem wir ihre Bahn verfolgen.
Für identische mikroskopische Objekte kennen wir keine Marken, die eine solche
Kennzeichnung erlauben. In der Quantenmechanik gibt es auch keine wohldefinierten Bahnen, die wir verfolgen können, insbesondere dann nicht, wenn sich
die Wellenfunktionen der Teilchen überlappen. Wir können die Wahrscheinlichkeit, am Ort r1 Teilchen 1 und am Ort r2 Teilchen 2 anzutreffen also gar nicht
im Experiment überprüfen, da die Unterscheidung der Teilchen 1 und 2 nicht der
Beobachtung zugänglich ist: Wir können nur die Wahrscheinlichkeit angeben, daß
sowohl bei r1 als auch bei r2 ein Teilchendetektor anspricht.
Da also die Quantenmechanik grundsätzlich nur die (potentielle) Beobachtung
beschreibt, müssen wir neben ψ12 auch
ψ21 = ψab (r2 , r1 , t)
als gleichberechtigte Wellenfunktion zulassen. Aus der Symmetrie von H folgt,
daß ψ21 auch der selben Schrödingergleichung genügt26 .
Darüber hinaus müssen wir dann auch Linearkombinationen
ψ(r1 , r2 , t) = αψ12 + βψ21
in Betracht ziehen. Verlangen wir nun, daß sich die Wahrscheinlichkeitsdichte ψ ∗ ψ
bei einer Vertauschung nicht ändert, so folgt
|ψ(r1 , r2 , t)|2 = |ψ(r2 , r1 , t)|2 ,
also
ψ(r1 , r2 , t) = cψ(r2 , r1 , t)
26
Entsprechend existieren auch alle Eigenfunktionen doppelt: Man spricht von Austauschentartung.
76
mit c∗ c = 1. Bei zwei Vertauschungen ändert sich natürlich gar nichts, also gilt
c2 = 1 oder c = ±1. Den beiden möglichen Vorzeichen entsprechen die beiden
einzigen Möglichkeiten
ψsym ∼ ψ12 + ψ21
ψasy ∼ ψ12 − ψ21 .
und
(190)
Wellenfunktionen identischer Teilchen sind also entweder symmetrisch oder antisymmetrisch.
An dieser Stelle müssen wir auf den Spin eines Teilchens zu sprechen kommen,
den die relativistische Diracgleichung postuliert und der beispielsweise durch
ein Magnetfeld beobachtbar ist. Der Spin s ist eine vektorielle Observable ohne
klassisches Analogon, die quantenmechanisch den selben Rechenregeln folgt wie
Drehimpulse27 (Übungen). Auch der Spin ist gequantelt, kann im Gegensatz zu
Bahndrehimpulsen aber nicht nur ganzzahlige, sondern auch halbzahlige Vielfache
von h̄ annehmen.
Es hat sich nun als wichtig erwiesen, zwei Gruppen von Teilchen grundsätzlich
zu unterscheiden, nämlich
• Fermionen mit halbzahligem Spin und
• Bosonen mit ganz zahligem Spin.
Zu den Fermionen zählen insbesondere Elektronen, Protonen, Neutronen (Spin
1
) sowie alle Atomkerne, Atome und Moleküle, die aus einer ungeraden Anzahl
2
(z. B. He3 ) elementarer Fermionen zusammengesetzt sind.
Dagegen gehören bestimmte Elementarteilchen wie Pionen und Photonen sowie
alle zusammengesetzten Teilchen mit gerader Fermionenanzahl (z. B. He4 ) zu den
Bosonen.
Für spinbehaftete Teilchen stellt die Richtung von s nun eine Observable dar, die
in der ψ–Funktion durch eine zusätzliche (diskrete) Variable berücksichtigt werden muß. Statt ψ(r1 , r2 , t) müssen wir also Zustandsfunktionen ψ̂(r1 , s1 , r2 , s2 , t)
betrachten. Für die so komplettierten Wellenfunktionen gilt nun nach Ausweis
der Erfahrung
• Fermionen werden durch antisymmetrische Wellenfunktionen ψ̂ und
27
Man stellt sich den Spin daher auch gern als inneren Drehimpuls durch eine Rotation
des Teilchens vor. Diese Vorstellung kann allerdings das Wesen des Spins nicht erfassen (siehe
Übungen).
77
• Bosonen werden durch symmetrische Wellenfunktionen ψ̂ beschrieben.
Läßt man den Spin in der Anschrift der ψ–Funktion weg, muß man Fallunterscheidungen je nach Ausrichtung der Spins treffen. Insbesondere gilt für die “elementaren” Fermionen mit Spin 21 :
Spin 21 –Teilchen mit paralellem Spin haben anti symmetrische und Spin 12 –Teilchen
mit anti paralellem Spin haben symmetrische Wellenfunktionen ψ.
Aus der (Anti–)Symmetrie ergibt sich für Fermionen eine Folgerung großer Tragweite: Haben zwei gleiche Fermionen den selben Spin s und werden sie durch die
selbe Wellenfunktion ψ0 beschrieben, so wird
ψ(r1 , r2 , t) = ψ0 (r1 , t)ψ0 (r2 , t) − ψ0 (r2 , t)ψ0 (r1 , t) = 0.
Für die stationären Zustände folgt daraus das Pauli–Prinzip
• Zwei gleiche Fermionen können nicht in allen Quantenzahlen übereinstimmen und den selben Spin haben.
Anders ausgedrückt: Charakterisieren wir die stationären Zustände, die ein Fermion annehmen kann, durch einen Satz von Quantenzahlen (etwa n, l, m und
sz ), so können diese Zustände nur die Besetzungszahlen 0 oder 1 aufweisen.
Ein analoges Prinzip für Bosonen gibt es nicht, Bosonenzustände können beliebige
Besetzungszahlen 0, 1, 2, . . . annehmen.
4.3
Atombau und periodisches System der Elemente
Wir betrachten nun Atomkerne höherer Ladungszahl, die zur Neutralisation mehrere Hüllenelektronen benötigen. Um ein Ordnungsschema in dieses komplexe
Problem zu bringen, denken wir uns solche Atome (im Grundzustand) schrittweise aufgebaut: Wir denken uns k − 1 Elektronen bereits mehr oder weniger kugelsymmetrisch um den Kern verteilt und fragen nach den möglichen Zuständen des
k–ten Elektrons. Damit können wir an die generelle Diskussion des kugelsymmetrischen Potentials (Abschnitt 3.5) anknüpfen und führen die Quantenzahlen n, l
und m ein. Außerdem müssen wir für die Elektronen mit dem Spin 21 noch die
beiden Spinrichtungen sz = 21 und sz = − 21 unterscheiden (Richtungquantelung
der Drehimpulse).
Entsprechend der Hauptquantenzahl n denken wir uns die Atomelektronen in
Schalen angeordnet. Innerhalb jeder Schale stehen uns dann die Quantenzahlen
l = 0, . . . , n − 1 ,
m = −l, . . . , l und sz = ±
78
1
2
zur Verfügung.
Für die erste Schale n = 1 liegen l = 0 und m = 0 fest, es gibt also für n = 1
genau zwei verschiedene Elektronenzustände mit sz = +1/2 und sz = −1/2.
Da nach dem Pauliprinzip jeder Zustand höchstens einfach besetzt ist, kann die
erste Schale höchstens zwei Elektronen “aufnehmen”: Sie ist beim Element 2He
abgeschlossen.
Benötigen wir also mehr als zwei Elektronen, um die Kernladung zu kompensieren, müssen wir die zweite Schale auffüllen. Hier können (l, m) die Dupel (1,1),
(1,0), (1,–1) und (0,0) annehmen. Mit den beiden Spinrichtungen gibt das 8 mögliche Zustände in der zweiten Schale, die nach dem Pauliprinzip wieder höchsten
einfach besetzt werden können. Beim Element 10Ne ist neben der ersten also auch
die zweite Schale abgeschlossen.
Generell hatten wir beim Wasserstoff ausgerechnet, daß es zu jeder Hauptquantenzahl n einen Satz von n2 verschiedenen Nebenquantenzahlen gibt. Unter Berücksichtigung der beiden Spinrichtungen kann die n–te Schale also maximal 2n2 Elektronen aufnehmen. Die dritte Schale kann demnach 18 Elektronen aufnehmen und
wäre beim Element 28Ni abgeschlossen.
Tatsächlich bleibt aber nicht alles so schön wasserstoffähnlich, weil die Elektronen
untereinander wechselwirken. Dadurch wird nicht nur die Entartung des Wasserstoffs (Enl hängt hier nicht von l ab) aufgehoben, sondern es kann sogar
Enl > En+1 0
werden. Das Atom zieht es dann vor, eine “neue” Schale (n+1) zu beginnen, ehe
die “alte” (n) abgeschlossen ist.
Der Grund hierfür ist sogar aus der klassischen Mechanik verständlich: Bei niedrigem Drehimpuls hält sich das Elektron weitgehend in Kernnähe auf (vgl. den
Grundzustand des Wassestoffs) und “sieht” die übrigen Elektronen nicht. Elektronen mit großem l dagegen halten sich überwiegend in großer Entfernung (vgl.
die “Kreisbahnen” beim Wasserstoff für l = n − 1) auf, wo der Kern durch die
übrigen Elektronen weitgehend abgeschirmt ist.
Darum werden in der Schale n = 3 zunächst nur die acht s– (l = 0) und p–
Zustände (l = 1) aufgefüllt, und das ist beim Element 18Ar erreicht. Danach
werden zunächst die beiden s–Zustände der vierten Schale besetzt (19K und 20Ca)
und dann erst die zehn d–Zustände (l = 2) der dritten Schale aufgefüllt.
Das Element 30Zn hat also eine voll besetzte dritte Schale und — wie 20Ca —
zwei s–Elektronen in der vierten Schale. Bei 31Ga wird nun ein drittes Elektron
in die vierte Schale aufgenommen, und bei 36Kr sind die energetisch günstigen
s– und p–Zustände der vierten Schale besetzt. In ähnlicher Weise geht es weiter,
79
die Details sind in der folgenden Tabelle zusammengefaßt, die angibt, in welchem
Zustand das letzte (oder vorletzte28 ) Elektron eingebaut wird.
s
p
d
f
1
1H
2He
2
3Li
5B
7N
9F
4Be
6C
8O
10Ne
3
11Na
13Al
15P
17Cl
21Sc
23V
25Mn
27Co
29Cu
12Mg
14Si
16S
18A
22Ti
24Cr
26Fe
28Ni
30Zn
4
19K
31Ga
33As
35Br
39Y
41Nb
43Tc
45Rh
47Ag
58Ce
60Nd
62Sm
64Gd
66Dy
68Er
70Y
20Ca
32Ge
34Se
36Kr
40Zr
42Mo
44Ru
46Pd
48Cd
59Pr
61Pm
63Eu
65Tb
67Ho
69Tm
71Lu
5
37Rb
49In
51Sb
53J
57La
73Ta
75Re
77Ir
79Au
90Th
92U
94Pu
96Cm
98Cf
100
102
38Sr
50Sn
52Te
54Xe
72Hf
74W
76Os
78Pt
80Hg
91Pa
93Np
95Am
97Bk
99E
101
103
6
55Cs
81Tl
83Bi
85At
89Ac
...
56Ba
82Pb
84Po
86Rn
104
7
87Fr
Da die chemischen Eigenschaften eines Elements wesentlich durch die Elektronen
der äußersten Schale bestimmt sind, kommt man so zu einer gewissen Periodizität
der chemischen Eigenschaften, z. B.:
- Ist die äußerste Schale — oder ihre energetisch besonders günstigen s– und
p–Zustände — gerade abgeschlossen, ist das Atom besonders stabil, d. h.
chemisch träge: Wir haben Edelgase (2He, 10Ne, 18A, 36Kr, . . . ).
- Fehlen nur wenige Elektronen an einer solchen Edelgaskonfiguration, nimmt
das Atom bei Reaktionen “gern” Elektronen auf (Halogene und Chalkogene).
- Ist dagegen die äußerste Schale nur mit wenigen Elektronen besetzt, werden
diese in Reaktionen leicht abgegeben (Alkali– und Erdalkali–Metalle).
Die Quasi–Periodizität demonstriert man im Periodischen System der Elemente
mit
- Hauptgruppen, in denen nur s– und p–Zustände eine Rolle spielen
- Nebengruppen, in denen die d–Zustände aufgefüllt werden und
- den Lanthanoiden und Aktinoiden, in denen schließlich die f–Zustände aufgefüllt werden.
28
Bei konkurrierenden Zuständen kommt es gelegentlich zu kleinen Verschiebungen. Beispielsweise besitzen Cu, Ag und Au nur ein s–Elektron in der äußersten Schale, so daß bei Zn, Cd
und Hg nicht ein d– sondern das fehlende s–Elektron eingebaut wird.
80
88Ra
4.4
Die Bildung von Molekülen
Ein 17Cl–Atom hat gerade noch Platz für ein Elektron frei, um die energetisch
günstige 18A–Konfiguration auszunutzen. Ein 19K–Atom dagegen hat für diese
Konfiguration gerade ein Elektron zuviel und muß eine neue — energetisch viel
ungünstigere — Schale “anbrechen”. Bringt man daher ein K– und ein Cl–Atom
zusammen, so ist es energetisch günstig, wenn das K–Atom ein Elektron an das Cl
abgibt. Freilich bleiben die Atome dabei nicht elektrisch neutral, sondern werden
zu K+ – und Cl− –Ionen. Aufgrund der elektrostatischen Anziehung werden diese
Ionen also aneinander “gekettet”: K und Cl gehen eine heteropolare oder Ionen–
Bindung ein und bilden ein KCl–Molekül — oder genauer: Viele K+ – und Cl− –
Ionen bilden ein Ionengitter.
Diese einfache Ionenbindung ist jedoch nicht der Regelfall. Schließen sich insbesondere zwei gleiche Atome zu einem Molekül (Beispielsweise H2 ) zusammen, so
erwarten wir schon aus Symmetriegründen keine elektrische Aufladung der beiden Reaktionspartner: Die Bindung ist nun homöopolar29 (man spricht auch von
Atombindung).
Die homöopolare Bindung ist rein klassisch nicht zu verstehen und quantenmechanisch schwierig zu beschreiben. Wir begnügen uns daher mit einer skizzenhaften
Erläuterung der Bildung des H2 –Moleküls. Dazu betrachten wir zwei räumlich
fixierte Wasserstoffkerne (A) und (B) im Abstand a und notieren den Hamiltonoperator
e2
h̄2
(∆1 + ∆2 ) −
H=−
2m
4πε0
1
1
1
1
1
1
+
+
+
−
−
r1A r2B r1B r2A r12 a
(191)
des Systems der beiden Elektronen (1) und (2) (siehe Skizze).
1
r12
2
r1A
r2B
r2A
r1B
A
B
a
Bei hinreichend großem Abstand (a a0 ) der Kerne sind die vier letzten Terme
zu vernachlässigen und H ist die Hamiltonfunktion zweier ungestörter H–Atome.
Der Grundzustand des Systems ist dann durch
29
In der Chemie gibt es stufenlose Übergänge zwischen diesen Haupt–Bindungsarten.
81
ϕ1 (r1 , r2 ) = χA (r1 )χB (r2 )
(192)
gegeben, wobei χA (r1 ) = χ1 0 0 (r1A ) und χB (r2 ) = χ1 0 0 (r2B ) den jeweiligen
Grundzustand der beiden Wasserstoffatome bezeichnen. Machen wir a kleiner,
kommen die “Störglieder” allmählich ins Spiel. Dabei wird (192) aber zunächst
noch eine brauchbare Näherung bleiben. Allerdings müssen wir wegen der Ununterscheidbarkeit der Elektronen und der Symmetrie des Hamiltonoperators
ϕ2 (r1 , r2 ) = χA (r2 )χB (r1 )
(193)
als gleichwertige Näherung betrachten. Da die Elektronen Fermionen mit Spin
1
sind, müssen wir aus (192) und (193) symmetrische oder antisymmetrische
2
Wellenfunktionen
ϕ± = ϕ 1 ± ϕ 2
(194)
bilden, je nachdem der Spin antiparallel oder parallel ausgerichtet ist. Mit dieser —
allein aus dem Grundzustand des Wasserstoff–Atoms konstruierten — Näherung
für die Wellenfunktion berechnen wir die Näherung
E± =
hϕ± |H|ϕ± i
hϕ± |ϕ± i
für die Energie des Systems der beiden Elektronen und erhalten unter Ausnutzung
der Symmetrie
E± =
hϕ1 |H|ϕ1 i ± hϕ1 |H|ϕ2 i
.
1 + hϕ1 |ϕ2 i
(195)
Dabei geht hϕ1 |H|ϕ1 i für große Abstände a in die Energie E1 = −2R der Grundzustände der Wasserstoffatome über. Den entscheidenden Beitrag der Wechselwirkung beschreibt das Austauschintegral hϕ1 |H|ϕ2 i.
Mit der Näherung (195) kann man E± in Abhängigkeit von a explizit berechnen
und findet E± → ∞ für a → 0 und E± → −2R für a → ∞. Aber während E− (antisymmetrische Wellenfunktion, paralleler Spin) dabei monoton fällt, durchläuft
E+ (symmetrische Wellenfunktion, antiparalleler Spin) dabei ein Minimum bei
am ≈ 8 · 10−11 m:
82
E
−2R
E−(↑↑)
a
am
E+(↑↓)
Da −dE/da als Kraft auf die beiden Atome30 wirkt, bleiben die beiden Atome bei
antiparallelem Elektronenspin im Abstand am stabil beieinander: Ein H2 –Molekül
ist gebildet.
Die Bindung ist nur bei antiparallelem Spin möglich, da hier die beiden Elektronen einen gemeinsamen Ortszustand besetzen und sich in der Mitte der Kerne
“konzentrieren” können. Dabei überwiegt die Anziehung zwischen Elektronen
und Kernen die gegenseitige Abstoßung der Elektronen und hält das Molekül
zusammen.
Da die effektive Kraft, die die beiden Atome bindet, entscheidend auf dem Elektronenaustausch beruht, wird sie auch Austauschkraft genannt. Dieser gebräuchliche Name führt allerdings leicht zu einem Mißverständnis. Die Austauschkraft
beruht nämlich keineswegs auf einer neuen mystischen “Quantenkraft”, die wir
klassisch nicht verstehen, sondern einzig auf der wohlvertrauten Coulombwechselwirkung. Diese Wechselwirkung wird allerdings – und hier kommt die Quantenmechanik ins Spiel – durch den Austauscheffekt bzw. das Pauliprinzip so modifiziert, daß sie ein Potentialminimum bildet und so die Bindung der beiden Atome
ermöglicht.
30
Wegen der großen Massen brauchen wir diese nicht quantenmechanisch zu beschreiben.
83
5
Die Interpretation der Quantenmechanik
Wir beenden die Analyse spezieller Probleme und wenden uns wieder der allgemeinen Diskussion der Interpretation der Quantenmechanik zu. Dazu stellen wir
zunächst noch einmal die Grundzüge des Formalismus zusammen und bringen
einige Ergänzungen an.
5.1
Der Formalismus
Die quantenmechanischen Systeme – oder besser: Unsere Erwartungen bei ihrer
Beobachtung – werden durch Zustandsvektoren (Zustandsfunktionen)
|ψi = ψ(r, t),
(196)
beschrieben. Das Absolutquadrat ψ ∗ ψ gibt nach Born die Wahrscheinlichkeitsdichte an, das System bei r zu finden. Dynamische Variable A(r, p) und sonstige
Observable (z. B. Spin) werden durch quantenmechanische Operatoren, die auf
|ψi wirken, repräsentiert. Speziell dem Impuls eines Teilchens ist der Operator
p=
h̄
∇
i
(197)
zugeordnet.
In der klassischen Mechanik läßt sich der Wert A(t) = A(r(t), p(t)) einer dynamischen Variablen im Prinzip präzise berechnen. Dagegen lassen sich zu den
quantenmechanischen Observablen A im allgemeinen “nur” Erwartungswerte
hAi = hψ|A|ψi
(198)
angeben. Die Forderung reeller Erwartungswerte wird durch hermitesche Operatoren sichergestellt. Der entscheidende Unterschied zur klassischen Mechanik ist
darin begründet, daß Operatoren im allgemeinen nicht vertauschbar sind, daß
also der Kommutator
[A, B] = AB − BA
(199)
nicht verschwindet. Aus Gl.(197) folgen die speziellen Kommutatoren
[pi , xj ] =
h̄
h̄ ∂xj
= δij .
i ∂xi
i
84
(200)
Man kann statt von Gl.(197) direkt von den Vertauschungsrelationen (200) ausgehen und die ganze Quantenmechanik algebraisch aufbauen. Gl.(197) ist dann nur
eine spezielle Darstellung, die Ortsdarstellung. Statt r kann man beispielsweise
auch p als Variable benutzen und eine Zustandsfunktion ψ̃(p, t) definieren. Den
Vertauschungsregeln (200) entsprechend wird dann der Ort durch den Operator
r = ih̄
d
dp
repräsentiert. Diese äquivalente Darstellung wird Impulsdarstellung31 genannt.
Die zeitliche Entwicklung des Zustandsvektors folgt der Schrödingergleichung
ih̄
∂
|ψi = H|ψi ,
∂t
(201)
wobei H den Hamiltonoperator bezeichnet. (Diese Gleichung gilt in jeder Darstellung, aber nicht in jedem Bild, s. u.). Für den Erwartungswert hAi erhält man
damit
d
hAi = hψ|A|ψ̇i + hψ̇|A|ψi
dt
1
1
=
hψ|AH|ψi − hψ|HA|ψi
ih̄
ih̄
1
hψ|(AH − HA)|ψi
=
ih̄
oder – in Verallgemeinerung der Ehrenfest-Beziehungen (69, 70) –
d
1
hAi = h[A, H]i.
dt
ih̄
(202)
Dieses Ergebnis läßt sich auch anders interpretieren: Statt die Zustände als Funktionen der Zeit zu betrachten (Schrödingerbild) und mit der Schrödingergleichung zu berechnen, können wir die Zustände festhalten und den Operatoren eine eigene Zeitabhängigkeit zubilligen (Heisenbergbild). Dieses alternative Bild
lehnt sich also im Grunde noch enger an die klassische Mechanik an. Die Operatoren AH des Heisenbergbildes genügen dann der Heisenberggleichung
1
d
AH = [AH , H] .
dt
ih̄
31
(203)
Orts– und Impulsdarstellung gehen durch eine Fouriertransformation auseinander hervor.
85
Man beachte, daß die Gl. (201) und (203) zu verschiedenen Bildern gehören und
nicht nebeneinander benutzt werden dürfen. Um daran zu erinnern, haben wir
die Operatoren AH des Heisenbergbildes durch den Index H gekennzeichnet32 .
Erfüllt der Zustandsvektor |ui die Gleichung
A|ui = a|ui,
(204)
so heißt |ui Eigenvektor (Eigenfunktion) und a Eigenwert des Operators A. Die
Eigenwerte hermitescher Operatoren sind reell und die Eigenfunktionen zu verschiedenen Eigenwerten sind orthogonal. Die Gesamtheit {aν } der Eigenwerte
nennt man das Spektrum des Operators A. Wir übergehen hier die formalen
Schwierigkeiten, die mit kontinuierlichen Spektren verbunden sind und und setzen
voraus, daß A ein diskretes Spektrum und ein vollständiges System normierter
Eigenvektoren mit
huν |uµ i = δνµ
(205)
besitzt. Dann läßt sich jeder beliebige Zustandsvektor in der Form
|ψi =
X
ν
cν |uν i
(206)
nach den Eigenvektoren von A entwickeln. (Als Beispiel hatten wir die Entwicklung nach den Eigenfunktionen des Hamiltonoperators kennengelernt.) Damit
erhält man den Erwartungswert
hAi = hψ|A|ψi =
X
ν,µ
c∗ν cµ huν |A|uµ i
oder wegen (204) und (205)
hAi =
X
ν,µ
c∗ν cµ aµ huν |uµ i =
X
c∗ν cν aν .
ν
Entsprechende Beziehungen
hAn i =
X
c∗ν cν anν
und
ν
hf (A)i =
X
c∗ν cν f (aν )
(207)
ν
gelten dann auch für alle Potenzen von A und schließlich für alle hinreichend
gutartigen Funktionen f (A). Daraus läßt sich zeigen33 :
32
33
Der Hamiltonoperator stimmt in beiden Bildern überein.
siehe z.B. Messiah, Bd. 1, Abschnitt 5.2.3.
86
- Die einzigen Werte, die eine Observable A annehmen kann, sind die Eigenwerte aν des Operators A.
- Die Wahrscheinlichkeit w(aν ), daß die Observable A den Wert aν annimmt,
ist durch
w(aν ) = c∗ν cν
(208)
gegeben.
Die Interpretation des Absolutquadrats der Entwicklungskoeffizienten cν als Wahrscheinlichkeit für die Realisierung des speziellen Wertes aν der Observablen A geht
ebenfalls auf Born zurück.
5.2
Meßprozeß und Zustandsvektor
Der soweit skizzierte Formalismus und seine Interpretation weisen noch einen
entscheidenden Mangel auf: Um zu unseren Erwartungswerten und Wahrscheinlichkeiten zu kommen, müssen wir den Zustandsvektor kennen. Der aber läßt
sich nur dann aus der Schrödingergleichung34 berechnen, wenn wir den Anfangszustand |ψit=0 spezifizieren können. Wie aber sollen wir einen Zustandsvektor
festlegen, dem wir gar keine unmittelbare physikalische Bedeutung zubilligen?
Jede physikalische Information muß natürlich letztlich aus Messungen gewonnen
werden, und wir beantworten die oben gestellte Frage aus einer Grundannahme
über ideale Messungen:
• Wird eine ideale Messung “unmittelbar” wiederholt, so liefert sie mit Sicherheit das selbe Resultat.
Diese Grundannahme ist es wert, ein wenig darüber nachzudenken. Die Quantenmechanik liefert uns ja häufig nur Wahrscheinlichkeitsaussagen. Im allgemeinen können wir ein Meßergebnis also nicht präzise vorhersagen. Ein Meßprozeß
ist aber kein Würfelspiel mit unverbindlichem Ergebnis: Habe ich drei Augen
gewürfelt, ist das für das Ergebnis einer Wiederholung des Wurfs ohne jeden Belang. Das Ergebnis einer Messung soll dagegen reproduzierbar sein, ein Vergleich
mit dem Würfelspiel würde der Experimentalphysik – und letztlich der gesamten
Naturwissenschaft – den Boden entziehen. Habe ich also den Wert a einer Observablen A gemessen, so soll dieser Wert verbindlich sein. Ich sage, die Observable
A hat den Wert a, und das heißt: Für eine erneute Messung von A läßt sich
der Wert a vorhersagen. Die erneute Messung muß natürlich so “unmittelbar”
erfolgen, daß die Dynamik des Systems den Zustand noch nicht verändert hat.
34
Wir bleiben wie wir es gewohnt sind im Schrödingerbild.
87
Wir kommen damit zur Ermittlung des Zustandsvektors |uit=0 aus einer Messung:
Habe ich zur Zeit t = 0 den Wert ak einer Observablen A gemessen, so weiß ich,
daß eine unmittelbar folgende identische Messung mit der Wahrscheinlichkeit 1
wieder ak liefern würde. Aus Gl.(208) folgern wir w(ak ) = c∗k ck = 1 und w(aν ) =
c∗ν cν = 0 für ν 6= k oder – abgesehen von einem belanglosen Phasenfaktor –
|ψit=0 = |uk i.
(209)
Diesen Schluß können wir natürlich nur ziehen, wenn der Meßwert ak tatsächlich
nur mit einem Eigenvektor |uik verträglich ist, wenn also der Eigenwert ak einfach
ist. Das Problem der Entartung wird damit zu einem physikalischen Problem.
Wenn wir etwa beim Wasserstoffatom die Energie En messen, so können wir
noch nicht auf den Zustand schließen, da n2 verschiedene Eigenfunktionen χnlm
zum Eigenwert En gehören. An diesem Beispiel wird aber auch schon deutlich,
wie diese Schwierigkeit zu beheben ist: Außer der Energie E müssen wir auch das
Drehimpulsquadrat L2 und die Drehimpulskomponente Lz bestimmen.
Voraussetzung dafür, daß zwei Operatoren A und B (etwa E und L2 im obigen
Beispiel) gemeinsame Eigenvektoren |ui besitzen, ist, daß A und B vertauschbar
sind. Denn aus
A|ui = a|ui und B|ui = b|ui
folgt ja sofort
AB|ui = ab|ui = BA|ui .
Umgekehrt können Observable, deren Operatoren vertauschbar sind, gleichzeitig scharf gemessen werden, sie sind kommensurabel. Darüber hinaus kann man
zeigen, daß sich aus den Eigenvektoren vertauschbarer Operatoren immer eine
gemeinsame Basis auswählen läßt.
Damit ist auch das Problem der Entartung gelöst: Ich muß so viele kommensurable Observablen A, B, . . . messen, bis der Zustand (der gemeinsame Eigenvektor)
|ui eindeutig festliegt, die Entartung also aufgehoben ist. Wir halten also fest:
• Der Anfangszustand |ψit=0 läßt sich durch eine geeignete Folge von Messungen kommensurabler Observablen eindeutig festlegen.
Messungen kommensurabler Observablen heißen auch verträglich. Dagegen sind
Messungen von Observablen A und B nicht verträglich, wenn die Operatoren A
und B nicht vertauschbar sind. Zwischen A und B besteht nämlich dann eine
Unschärfebeziehung [vgl. Gl. (78)]
88
2
2
h∆A ih∆B i ≥
1
[A, B]
2i
2
,
die es verbietet, A und B gleichzeitig scharf zu messen.
Und wenn ich trotzdem messe? Darf ich dann die Meßwerte nicht mehr ernst
nehmen? Nehmen wir an, ich habe zuerst A (Ergebnis a) und dann B (Ergebnis
b) gemessen. Nach unserer Grundannahme über (ideale) Messungen müssen wir
dann auf jeden Fall das Ergebnis b als verbindlich ansehen. Nach der Unschärfebeziehung muß dann aber der Wert der Observablen A wieder gänzlich unbestimmt
sein: Das Meßergebnis a der ersten Messung wird also durch eine nicht verträgliche zweite Messung bedeutungslos – so bedeutungslos wie die Augenzahl beim
Würfeln!
In den meisten Fällen können wir uns diese befremdliche Tatsache mit der Störung
durch den Meßprozeß erklären. Bringen wir beispielsweise im Heisenbergschen
Gedankenexperiment der optischen Ortsbestimmung (vgl. Abschnitt 2.6) ein ruhendes Teilchen unter das Mikroskop, so kennen wir dessen Impuls p = 0 (1.
Messung). Zur genauen Ortsbestimmung (2. Messung) müssen wir anschließend
das Teilchen aber mit hochenergetischen Photonen beschießen, und dieser Beschuß macht das Ergebnis der vorherigen Impulsmessung bedeutungslos (Comptoneffekt). Allerding gibt es auch Fälle, in denen nicht so einfach zu verstehen
ist, warum eine unverträgliche zweite Messung die erste Messung ungültig macht
(siehe Abschnitt 5.3).
Die Bestimmung des Zustandsvektors durch Messungen hat eine bedeutsame
Konsequenz: Der Zustandsvektor wird durch den Meßprozeß im allgemeinen geändert. Normalerweise wird |ψi nämlich keineswegs als Eigenfunktion |uk i vorliegen.
Vielmehr wird sich |ψi nach der Festlegung der Anfangsbedingungen durch frühere Messungen gemäß der Schrödingergleichung entwickeln und zum Meßzeitpunkt
t0 − 0 in der allgemeinen Form (vgl. (206))
|ψit=t0 −0 =
X
ν
cν |uν i
vorliegen. Messe ich also zum Zeitpunkt t = t0 die Observable A, so ist das Ergebnis nicht von vornherein determiniert, sondern kann mit der Wahrscheinlichkeit
c∗ν cν jeden Wert aν annehmen. Nach der Messung (t = t0 + 0) steht das Ergebnis
ar aber fest und soll verbindlich, also reproduzierbar sein. Daraus folgt wie oben,
daß nach der Messung der Zustandsvektor
|ψit=t0 +0 = |ur i.
vorliegt.
Mit dem Meßprozeß ist also notwendigerweise eine spontane Änderung
89
|ψit=t0 −0 =
X
ν
cν |uν i
−→
|ψit=t0 +0 = |ur i
(210)
des Zustandsvektors verbunden. Diese Änderung wird als Reduktion des Zustandsvektors bezeichnet. Da hierbei aus der Summe der |uν i ein Eigenvektor |ur i “herausgefiltert” wird, spricht man auch von einem Filterprozeß.
Dieser Filterprozeß wird keineswegs durch die Schrödingergleichung beschrieben,
er wird vielmehr ad hoc durchgeführt, sobald das Ergebnis ar der Messung feststeht. Natürlich liegt es wieder nahe, diese unberechenbare Zustandsänderung auf
die Wechselwirkung mit dem Meßgerät zurückzuführen. Wir werden jedoch sehen,
daß eine solche Interpretation in manchen Fällen problematisch ist.
Wir können dem Problem ausweichen, wenn wir uns konsequent auf unsere Interpretation der Quantenmechanik beziehen: |ψi beschreibt nicht ein physikalisches
System an sich, sondern unsere Information über das System. Und diese Information ändert sich spontan durch einen Meßprozeß, genauer: durch die Kenntnisnahme des Meßresultats. Natürlich bringen wir genau damit den philosophischen Streit zwischen Positivisten und Realisten auf den Punkt: “Ändert sich das
Weltall, wenn eine Maus es anschaut?” (Einstein).
Nebenbei sei bemerkt, daß die Zustandsreduktion auch ein zweites Problem der
modernen Naturphilosophie tangiert: Sie ist nicht zeitumkehrinvariant.
5.3
Das Einstein-Podolsky-Rosen–Paradoxon
Die positivistische Interpretation der Kopenhagener Schule ist letztlich unangreifbar, da sie sich von vornherein auf Aussagen über die Beobachtung beschränkt.
Und die Aussagen der Quantenmechanik über die Beobachtung sind nach unserem heutigen Wissenstand uneingeschränkt richtig. Trotzdem ist diese Interpretation unbefriedigend: Die Beobachtung hängt eben doch davon ab, ob eine Maus
die Welt anschaut oder nicht. Dabei sind die meisten Menschen einschließlich
der Theoretiker, solange sie nicht gerade die Grundlagen der Quantenmechanik
diskutieren, überzeugt, daß es unabhängig von der Beobachtung eine objektive
Realität gibt.
Einstein, der sich nie mit dem Kopenhagener Positivismus anfreunden konnte, war deshalb überzeugt, daß die Quantenmechanik zwar richtig aber nicht
vollständig ist. Unmittelbar nach seiner Emigration veröffentlichte er zusammen
mit seinen Mitarbeitern Podolsky und Rosen eine Arbeit35 unter dem Titel
“Can Quantum–Mechanical Description of Physical Reality Be Considered Complete?”, in der er seine Überzeugung an einem berühmt gewordenen Paradoxon
demonstrierte.
35
A. Einstein, B. Podolsky and N. Rosen, Phys. Rev. 47, 777 (1935)
90
Die Arbeit tangiert natürlich die Grenzen zur Philosophie und beginnt deshalb
mit begrifflichen Klarstellungen. Einstein, Podolsky und Rosen – im folgenden
kurz EPR genannt – widerstehen dabei der gefährlichen Versuchung, den Begriff der Vollständigkeit definieren zu wollen. Vielmehr begnügen sie sich mit der
Formulierung einer notwendigen Bedingung für die Vollständigkeit einer physikalischen Theorie:
• Every element of the physical reality must have a counterpart in the physical
theory.
Akzeptiert man diese Bedingung, bleibt zu klären, was unter einem Element der
physikalischen Realität zu verstehen ist. Auch hier verzichten ERP auf eine umfassende Definition und begnügen sich mit einem konstruktiven Kriterium:
• If, without in any way disturbing a system, we can predict with certainty (i.e.
with probability equal to unity) the value of a physical quantity, then there
exists an element of physical reality corresponding to this physical quantity.
Man beachte, daß dieses Kriterium gezielt bei der Interpretation der Unschärfe
durch die Störung bei einer Messung ansetzt! Und genau in der Konstruktion
einer strungsfreien Messung inkommensurabler Größen liegt auch der Kern des
EPR Gedankenexperiments (s.u.).
Angewendet auf physikalische Observable, deren Operatoren nicht vertauschen,
folgern EPR:
entweder: ”The quantum–mechanical desription of reality given by the wave
function is not complete”
oder: ”When the operators corresponding to two physical quantities do not commute the two quantities cannot have simultaneous reality,”
also kurz: Entweder ist die Quantenmechanik unvollständig oder konjugierte Observable wie x und p besitzen keine simultane Realität.
Das konkrete Gedankenexperiment von EPR ist in dem Kasten auf der folgenden
Seite dargestellt. Wir beziehen uns hier auf eine einfachere Variante, die auf Bohm
zurückgeht36 . Bohm betrachtet zwei Spin 21 –Teilchen, die aus dem Zerfall eines
Teilchens mit Spin 0 hervorgehen. Da der Gesamtspin 0 erhalten bleibt, ist der
Spin der Teilchen 1 und 2 immer antiparallel. Messe ich also am Teilchen 1 die
Spinkomponente s1ν und finde aν (= ±h̄/2), so weiß ich mit Sicherheit, daß ich
bei Teilchen 2 die Spinkomponente s2ν = −aν finden werde.
36
D. Bohm, Quantum Theory (Sec. 22.16), Prantice–Hall Inc., Englewood Cliffs (N.J.) 1951.
91
Die Originalversion des EPR–Gedankenexperiments
Allerdings sind sie nicht – weder direkt
noch auf dem Umweg über Teilchen 1 –
simultan meßbar. Daraus schließen EPR,
daß die Quantenmechanik unvollständig
ist.
Zur Bestätigung der entscheidenden Arbeitshypothese, daß ϕk (x2 ) und χr (x2 )
tatsächlich Eigenfunktionen nicht vertauschbarer Operatoren sein können, gehen EPR von der speziellen Wellenfunktion
Zwei (eindimensionale) Teilchen wechselwirken im Zeitintervall [0, T ] und werden zu einem späteren Zeitpunkt t > T
durch eine Wellenfunktion ψ(x1 , x2 ) beschrieben. Diese Wellenfunktion können
wir in der Form
ψ(x1 , x2 ) =
X
ϕν (x2 )uν (x1 )
bzw.
ν
ψ(x1 , x2 ) =
X
χµ (x2 )vµ (x1 )
µ
ψ(x1 , x2 ) = 2πh̄δ(x1 − x2 + x0 ) =
Z ∞
i
e h̄ (x1 −x2 +x0 )p dp .
nach den Eigenfunktionen uν eines Operators A bzw. vµ eines Operators B des
Teilchens 1 entwickeln. Die Entwicklungen
sind verschieden, wenn A und B nicht vertauschen. Und nun führen wir eine Messung am Teilchen 1 durch, ohne das Teilchen 2 auf irgendeine Weise zu stören; die
Teilchen stehen ja nicht mehr miteinander
in Wechselwirkung! Für die daraus folgende Reduktion der Wellenfunktion können
wir zwei Fälle unterscheiden:
−∞
aus. Sie beschreibt ein System von zwei
Teilchen mit scharfer Relativkoordinate
x2 −x1 = x0 . Dementsprechend ist der Relativimpuls völlig unbestimmt, während
der Gesamtimpuls (= 0, s. u.) wieder bekannt ist.
Ist nun A der Impuls des Teilchens 1, so
erhält man die Eigenfunktionen up (x1 ) =
i
e h̄ x1 p zum Eigenwert p. Das liefert die
Entwicklung
Z
ψ(x1 , x2 ) = ϕp (x2 )up (x1 )dp mit
1. Wir messen die Observable A, finden
das Resultat ak und erhalten die neue
Wellenfunktion ϕk (x2 )uk (x1 ).
2. Wir messen die Observable B, finden
das Resultat br und erhalten die neue Wellenfunktion χr (x2 )vr (x1 ).
i
ϕp (x2 ) = e− h̄ (x2 −x0 )p .
Die Entwicklungskoeffizienten ϕp (x2 ) sind
aber gerade die Eigenfunktionen des Impulsoperators P = −ih̄∂/∂x2 des Teilchens 2 zum Eigenwert −p. Daher haben wir einen scharfen Gesamtimpuls p +
(−p) = 0.
Ist andererseit B der Ort des Teilchens
1, so erhält man die Eigenfunktionen
vx (x1 ) = δ(x1 − x) zum Eigenwert x. Daraus folgt die Entwicklung
Z
ψ(x1 , x2 ) = χx (x2 )vx (x1 )dx
mit
Wir müssen dem Teilchen 2 für sich allein
betrachtet also je nach der Messung am
Teilchen 1 zwei verschiedene Wellenfunktionen
ϕk (x2 ) und
χr (x2 )
zubilligen. Das Paradoxon wird komplett,
wenn man annimmt (s. u.), daß ϕk (x2 )
und χr (x2 ) Eigenfunktionen nicht vertauschbarer Operatoren P und Q des
Teilchens 2 sind. Dann können wir uns
nämlich durch eine Messung am Teilchen
1, also ohne das Teilchen 2 auf irgendeine Weise zu stören, entweder den scharfen Wert p von P oder den scharfen Wert
q von Q beschaffen. P und Q sollten also
nach dem EPR–Realitätskriterium simultane Elemente der Realität sein.
χx (x2 ) = 2πh̄δ(x − x2 + x0 ).
Die Entwicklungskoeffizienten χx (x2 ) sind
also die Eigenfunktionen des Ortsoperators Q = x2 des Teilchens 2 zum Eigenwert x + x0 .
92
Da sich der Experimentator nach dem Zerfall, also zu einer Zeit, wo er das Teilchen 2 in keiner Weise stört, frei entscheiden kann, welche Spinkomponente des
Teilchens 1 er mißt, schließt er mit EPR, daß sämtliche Spinkomponenten des
Teilchens 2 wohldefiniert vorliegen müssen: Die Information darüber ist ja offenbar in dem separierten Teilchen 1 “gespeichert”. Alle Spinkomponenten des
Teilchens 2 sind also Elemente der physikalischen Realität im Sinne des oben
formulierten EPR–Kriteriums.
Da der Spin den Rechenregeln des Drehimpulses folgt, gestattet die Quantenmechanik aber jeweils nur die Festlegung einer Spinkomponente, und EPR schließen
folglich, daß die Quantenmechanik nicht vollständig ist. Dieses Paradoxon wirft
bis heute ernsthafte Probleme auf, und B. d’ Espagnat bemerkt: “Kein Theoretiker, für den die Physik mehr ist als der Vorwand zu einem schönen Formalismus,
kann sich unserer Ansicht nach nicht davon betroffen fühlen.”
Bohrs Antwort zu EPR erschien postwendend unter dem selben Titel37 . Im Gegensatz zu der kompakten und einleuchtend erscheinenden Darstellung von EPR
macht Bohr es dem Leser jedoch nicht ganz leicht, die klare Entgegnung zum
Kern des Paradoxons zu erkennen. Er wiederholt die Kopenhagener Positionen
und versucht, diese Interpretation durch eine detaillierte und spitzfindige Diskussion verschiedener Experimente zu verdeutlichen.
Die eigentliche Kritik Bohrs setzt beim EPR–Kriterium für physikalische Realität ein. Bohr billigt nämlich inkommensurablen Observablen keine simultane
Realität zu, da sie nicht simultan beobachtbar sind (Positivismus!).
Es ist also nicht nur überflüssig (Feynman) nach dem Ort und dem Impuls eines
Teilchens zu fragen, sondern sinnlos, da Ort und Impuls keine a priori Realität zukommt. Sie werden vielmehr erst durch den Meßprozeß realisiert, und die Aussage
“Der Experimentator hätte ja auch die komplementäre Variable messen können”,
ist eben kein Meßprozeß. (Daß einem präzise vorhersagbaren Phänomen nicht
notwendigerweise eine von den Beobachtungsbedingungen unabhängige a priori–
Existenz zukommt, mag man sich am Schatten klarmachen!)
Ein Gedicht ist lediglich eine mehr oder weniger unregelmäßige Verteilung von
Druckerschwärze auf weißem Papier, solange kein Bewußtsein das Zeichenmuster
aufnimmt, interpretiert und damit zum Gedicht macht. Und ebenso wird eine
Meßgröße erst durch den Meßvorgang (einschließlich der Kenntnisnahme des Resultats) “verwirklicht”. Da es aber keinen Meßvorgang gibt, der x und p (oder
sämtliche Spinkomponenten) simultan “verwirklicht”, kommt ihnen auch keine
simultane Realität zu. Diese positivistische Geisteshaltung, die zu Beginn des
zwanzigsten Jahrhunderts “in Mode kam”, wird schön durch ein Gedicht Christian Morgensterns38 dokumentiert:
37
38
N. Bohr, Phys. Rev. 48, 696 (1935)
1867–1914; aus Palma Kunkel (1916).
93
Der Meilenstein
Tief im dunklen Walde steht er,
und auf ihm mit schwarzer Farbe,
daß des Wandrers Geist nicht darbe:
Dreiundzwanzig Kilometer.
Seltsam ist und schier zum Lachen,
daß es diesen Text nicht gibt,
wenn es keinem Blick beliebt,
ihn durch sich zu Text zu machen.
Ja, noch weiter vorgestellt:
Was wohl ist er ungesehen?
ein uns völlig fremd Geschehen.
Erst das Auge schafft die Welt.
5.4
Schrödinger und seine Katze
Auch Schrödinger war Anhänger des Realismus. Ihm hatte anfänglich eine
reine Wellentheorie der Materie vorgeschwebt, in der Teilchen durch Wellenpakete repräsentiert sind. Von dieser Lieblingsvorstellung mußte er jedoch abrücken,
da außer beim harmonischen Oszillator alle Wellenpakete im Laufe der Zeit auseinanderlaufen. Im Jahr 1935 – kurz nach EPR – publizierte er einen Aufsatz39
“Über die gegenwärtige Situation in der Quantenmechanik”, in dem die gesamte
Problematik scharfsinnig analysiert und ausgezeichnet dargestellt ist.
Schrödinger weist zunächst darauf hin, daß die Quantenmechanik mit Begriffen
arbeitet, die dem klassischen Modell (Ort, Impuls, . . . ; Bohrs Korrespondenzprinzip!) ohne Modifikation entnommen sind. Sie verwendet aber stets nur genau
eine Hälfte des klassischen Variablensatzes40 und bringt so statistische Aussagen
ins Spiel. Die ψ–Funktion repräsentiert daher einen Erwartungskatalog. Dabei
kann die Quantenmechanik aber nicht einfach als Theorie eines klassischen Ensembles verstanden werden. Denn damit ließe sich weder verstehen, warum etwa
der Drehimpuls von jedem Koordinatenursprung aus gequantelt erscheint noch
ließe sich eine Aufenthaltswahrscheinlichkeit im klassisch verbotenen Bereich erklären.
Einen empirischen Standpunkt lehnt Schrödinger nicht grundsätzlich ab, verwahrt sich aber dagegen, ihn “als Diktator zur Hilfe zu rufen in den Nöten physikalischer Methodik”. Damit ist der Vollständigkeitsanspruch Kopenhagens angesprochen. Er geht auch bereits auf EPR ein und bettet die Diskussion in eine
sorgfältige Analyse von Meßprozeß und maximaler Kenntnis. Die Zustandsreduktion – nach Schrödinger der interessanteste Punkt der Theorie – wird als
geänderter Erwartungskatalog interpretiert.
Was die Arbeit jedoch berühmt gemacht hat, ist die Konstruktion eines “burlesken Falles”, der ein neues Paradoxon aufzeigt: Schrödingers Katze.
39
40
E.Schrödinger, Die Naturwissenschaften 23, 807 und 844 (1935).
Man beachte dabei die Analogie und den Unterschied zur Hamilton–Jakobi–Theorie.
94
Eine Katze wird in einen undurchsichtigen Kasten gesperrt, in dem ein radioaktives Präparat über einen Geigerzähler einen Hammermechanismus auslösen kann,
der eine Ampulle mit Blausäure zerschlägt. Nach einer Stunde sei die Katze mit
der Wahrscheinlichkeit 21 vergiftet.
Die Quantenmechanik beschreibt das System mit einem Zustandsvektor, der die
Wahrscheinlichkeit 12 korrekt angibt. Erst nach Öffnen des Deckels (Messung!)
wird der Zustand reduziert und beschreibt die lebendige oder die tote Katze.
Kann diese Beschreibung vollständig sein? Ist die Katze nicht auch vor dem Öffnen des Deckels entweder lebendig oder tot? Ein ganz konsequenter Kopenhagener muß diese Frage als sinnlos ablehnen. Allen weniger konsequenten Menschen
bleibt nur der Ausweg über eine Ensemble–Interpretation. Die aber ist (s. o.) für
die mikroskopischen Quantensysteme zumindest zweifelhaft.
5.5
Verborgene Parameter und Bohms Interpretation
Die statistische Interpretation der Quantenmechanik ist mit einem deterministischen Weltbild vereinbar, wenn man annimmt, daß alle “Zufälligkeiten” auf
den zufälligen Konstellationen verborgener Parameter beruhen. Solche verborgenen Parameter benutzt ja auch die klassische Statistik, etwa die Koordinaten
und Impulse sämtlicher Moleküle in der kinetischen Gastheorie. Entsprechende
Bestrebungen in der Quantenmechanik wurden jedoch zunächst aufgegeben, als
von Neumann 1932 bewiesen hatte41 , daß eine deterministische Beschreibung
mit irgendwie gearteten verborgenen Parametern grundsätzlich mit der Quantenmechanik unvereinbar ist. Interessanterweise wird dieser Beweis weder von EPR
und Schrödinger noch von Bohr erwähnt. Aus heutiger Sicht ist der Beweis
nicht zwingend, da die Voraussetzungen zu eng gefaßt sind (Bell 1966).
Auch Bohm ging nicht auf von Neumanns Satz ein, als er 1952 unter dem Titel
”A suggested interpretation of the quantum theory in terms of hidden variables”
eine deterministische Interpretation der Quantenmechanik entwarf42 . Dazu ging
er von der Schrödingergleichung
ih̄
∂ψ
h̄2
=−
∆ψ + V (x)ψ
∂t
2m
(211)
aus und formte sie über den Phasenansatz
i
ψ(x, t) = ρ (x, t) exp S(x, t)
h̄
1
2
41
42
(212)
J. von Neumann, Mathematische Grundlagen der Quantenmechanik, Springer, Berlin 1932
D. Bohm, Phys. Rev. 85, 166 (1952).
95
in das gekoppelte Gleichungssystem
∇S
∂ρ
+∇· ρ
= 0
∂t
m
∂S (∇S)2
h̄2
1
2
= 0
+
+V −
ρ∆ρ − (∇ρ)
∂t
2m
4mρ2
2
(213)
(214)
für die beiden reellen Funktionen S und ρ um. Dabei ist ρ = ψ ∗ ψ die quantenmechanische Wahrscheinlichkeitsdichte.
Für h̄ → 0 geht Gl.(214) in die Hamiltonsche
partielle Differentialgleichung43 der
R
klassischen Mechanik über, wobei S = Ldt die Wirkungsfunktion ist. Mit
p = ∇S
bzw. v =
∇S
m
erkennt man dazu in Gl.(213) die Kontinuitätsgleichung.
Bohms Idee bestand nun darin, diese klassische Beschreibung auch für h̄ 6= 0
beizubehalten. Dazu ergänzte er das klassische Potential V (x) durch das “Quantenpotential”
h̄2
1
U (x, t) = −
ρ∆ρ − (∇ρ)2 .
2
4mρ
2
(215)
Dieses Quantenpotential ist im allgemeinen eine rasch veränderliche Funktion
des Ortes und der Zeit. Daraus resultieren starke, schwer überschaubare “Quantenkräfte”, die für sämtliche Quanteneffekte verantwortlich sind. ρ oder die ψ–
Funktion wirkt also wie ein Feld der klassischen Physik, welches das Teilchen
“führt”. Eine ähnliche Idee hatte de Broglie bereits 1928 entwickelt, sie aber
nach anfänglichen Schwierigkeiten nicht weiter verfolgt.
In dieser Interpretation wird mit jedem quantenmechanischen Teilchen ein klassisches Teilchen assoziiert, das exakt definierte und kontinuierlich variierende Ortsund Impulswerte besitzt, die uns nur nicht bekannt sind (verborgene Parameter!).
Die ψ–Funktion spielt eine doppelte Rolle: Sie wirkt einerseits auf dieses Teilchen
wie ein Feld der klassischen Physik. Andererseits repräsentiert sie ein statistisches
Ensemble mit der Wahrscheinlichkeitsdichte ρ = |ψ|2 , das unsere Unkenntnis widerspiegelt. Die Statistik ist also nicht a priori inhärent, sondern stellt nur eine
praktische Notwendigkeit dar, da wir die Anfangsorte und Anfangsgeschwindigkeiten nicht kennen.
43
Dieser Zusammenhang ist nicht neu und wurde verschiedentlich genutzt, um die klassische
Mechanik mit der geometrischen Optik zu vergleichen.
96
Bohm diskutiert eine Reihe von Beispielen, an denen er seine Interpretation illustriert. So ist in stationären Zuständen das Teilchen tatsächlich in Ruhe, da sich
die klassische Kraft und die Quantenkraft gegenseitig aufheben. Beim Tunneleffekt ermöglichen die starken Schwankungen des Quantenpotentials, das Barriere–
“Gebirge” in engen “Schluchten” und “Kanälen” zu durchqueren. Diese Beispiele
machen deutlich, daß alle Quanteneffekte mit Bohms Interpretation verträglich
sind. Das ist auch nicht verwunderlich, da die Interpretation ja auf der Schrödingergleichung basiert. Gerade hier liegt aber auch ihre Schwäche: Diese Interpretation ist prinzipiell nicht beweisbar und damit aus Kopenhagener Sicht überflüssig:
Liefert sie doch kein Ergebnis, das von der üblichen Quantenmechanik abweicht.
Immerhin zeigt sie – und allein das ist verdienstvoll genug – daß entgegen dem
Kopenhagener Verbot deterministische Interpretationen möglich sind. Aus diesem Grunde wurde sie auch in den 1990er Jahren neu aufgegriffen und erlebte
eine kleine Renaissance.
Wer aber in Bohms Interpretation die wahre realistische Lösung der quantenmechanischen Grundprobleme sehen möchte, dem sei doch ein bitterer Wermutstropfen in den süßen Wein gegossen: Man kommt ja nicht umhin, in der ψ–
Funktion auch den Erwartungskatalog Schrödingers zu sehen, der den subjektiven Kenntnisstand widerspiegelt: Daß dieser Kenntnisstand nun das Kraftfeld
modifizieren soll, dem das Teilchen ausgesetzt ist, scheint doch wieder ins Reich
der Magie zu führen.
5.6
Lokalität und Bellsche Ungleichung
Daß im EPR–Experiment die Messung am Teilchen 1 das Teilchen 2 in keiner
Weise stört, wird aus der räumlichen Trennung gefolgert. Die anhaltende Diskussion des EPR-Paradoxons brachte daher in den folgenden Jahrzehnten die
Gesichtspunkte der“Lokalität” und “Separabilität” ins Spiel: Sind räumlich getrennte,“nicht mehr wechselwirkende” Systeme wirklich völlig unabhängig voneinander und können separat betrachtet werden?
Einstein wies mit Recht darauf hin, daß die Annahme der Separabilität räumlich getrennter Systeme eine notwendige Voraussetzung ist, überhaupt Physik zu
betreiben und Naturgesetze zu formulieren. Andererseits ist die deterministische
Bohmsche Interpretation sicherlich nicht lokal (Bell 1966): Die ψ–Funktion als
“Feld” der Quantenkraft verschwindet nicht, wenn der Abstand der Teilchen groß
wird. Und auch der Doppelspaltversuch, bei dem das Elektron “weiß”, ob der “andere” Spalt geöffnet ist, legt eine Nicht–Lokalität physikalischer Erscheinungen
nahe.
Bell44 entwickelte nun einen Gedanken, der die Frage nach der Lokalität und/oder
Separabilität experimentell entscheidbar macht. Dieser Gedanke geht von der
44
J. Bell, Physics 1,195 (1965)
97
Bohmschen Version des EPR–Versuchs (Abschnitt 5.3) aus: Die beiden EPR–
Teilchen seien Spin 12 –Teilchen, die aus dem Zerfall eines Teilchens mit Spin 0
hervorgehen. Wie im Abschnitt 5.3 besprochen, kann der Experimentator nach
dem Zerfall, also zu einer Zeit, wo er das Teilchen 2 in keiner Weise stört, durch
eine entsprechende Messung am Teilchen 1 frei entscheiden, welche Spinkomponente des Teilchens 2 er bestimmen möchte. Er schließt also mit EPR, daß
sämtliche Spinkomponenten des Teilchens 2 wohldefiniert vorliegen müssen.
Wir nehmen daher an, daß beide Teilchen einen wohldefinierten vektoriellen
Spin45 besitzen und untersuchen die x–y–Komponenten des Spins von Teilchen
1 mit einem Analysator A1 . Der Analysator wird in der Stellung α das Teilchen
1 nur durchlassen, wenn s1α = +h̄/2 ist. Wir fragen nun mit Bell nach den
Wahrscheinlichkeiten
w(α1 , α2 , . . . |γ1 , γ2 , . . .)
(216)
dafür, daß Teilchen 1 bei den Stellungen α1 , α2 , . . . von A1 durchgelassen wird,
bei den Stellungen γ1 , γ2 , . . . dagegen nicht. Offenbar gilt für jedes β
w(α|γ) = w(α|β, γ) + w(α, β|γ) ,
denn in der Stellung β wird das Teilchen entweder durchgelassen oder nicht.
Außerdem gilt selbstverständlich
w(α|β, γ) ≤ w(α|β) und w(α, β|γ) ≤ w(β|γ) .
Daraus folgt bereits die berühmte Bellsche Ungleichung
w(α|γ) ≤ w(α|β) + w(β|γ) .
(217)
Diese Ungleichung basiert wohlgemerkt auf der Annahme, daß die Teilchen einen
wohldefinierten Spin besitzen, der unabhängig vom Experimentator und vom Rest
der Welt festliegt. Vom empiristischen Standpunkt der Quantentheorie macht es
nämlich überhaupt keinen Sinn, nach den Wahrscheinlichkeiten (216) zu fragen,
da nur eine Messung mit genau einer Stellung des Analysators wirklich ausgeführt
werden kann – mit einer entscheidenden Ausnahme:
Die zwei–argumentigen Wahrscheinlichkeiten der Bellschen Ungleichung (217)
lassen sich auch quantenmechanisch definieren. w(α|β) ist nämlich wegen der
antiparallelen Spins die Wahrscheinlichkeit dafür, daß
45
Dabei muß ich allerdings zugeben, daß ich mir einen Vektor, dessen Komponenten in jedem
Koordinatensystem nur zwei diskrete Werte annehmen können, schwer vorstellen kann.
98
- bei der Stellung α des Analysators A1 für Teilchen 1 und
- bei der Stellung β des Analysators A2 für Teilchen 2
(siehe Skizze) beide Detektoren D1 und D2 ansprechen.
α
β
1
D1
2
A2
A1
D2
Diese Wahrscheinlichkeit läßt sich quantenmechanisch berechnen und wird
w(α|β) =
1 2 α−β
sin
.
2
2
(218)
Wählt man speziell α = 0, β = π/4 und γ = π/2, so wird
w(α|γ) =
1 2π
sin
= 0.25
2
4
und
w(α|β) + w(β|γ) = 2 ·
1 2π
sin
= 0.146 . . . .
2
8
• Die Quantenmechanik verletzt also die Bellsche Ungleichung!
Damit wird die EPR–Behauptung wohldefinierter Eigenschaften der separierten
Teilchen nicht mehr lediglich ein Argument gegen die Vollständigkeit der Quantenmechanik, sondern ein Argument gegen ihre Gültigkeit!
Die Frage Quantenmechanik oder EPR–Aussage ist damit zu einer experimentell
prüfbaren Frage geworden. Entsprechende Experimente sind in den vergangenen
Jahrzehnten mehrfach durchgeführt worden und haben die Gültigkeit von (218)
bestätigt und (217) widerlegt. Die EPR-Teilchen 1 und 2 können also trotz ihrer räumlichen Trennung nicht separiert geshen werden, ihre Zustände bleiben
“verschränkt”.
99
Literaturhinweise
1. Quantenmechanik allgemein
Bei der Ausarbeitung dieser Vorlesung habe ich insbesondere folgende Lehrbücher
benutzt:
a) A. Messiah: Quantenmechanik, Bd. 1, Walter de Gruyter, Berlin und
New York 1976
b) L. Schiff: Quantum Mechanics, 3. Aufl., McGraw–Hill, New York 1968
c) E. Fick: Einführung in die Grundlagen der Quantentheorie, 2. Aufl.,
AVG, Frankfurt 1972
d) S.A. Davydov: Quantenmechanik, VEB Deutscher Verlag der Wissenschaften, Berlin 1978
e) G. Süssmann: Einführung in die Quantenmechanik, Grundlagen I, BI
Mannheim Band 9/9a
Diese Aufstellung der Quellen ist nicht als spezielle Empfehlung zu verstehen. Je nach persönlichem Geschmack eignen sich alle üblichen Lehrbücher
der Quantenmechanik, in Ergänzung zum Skriptum einzelne Probleme nachzulesen oder zu vertiefen. Erwähnen möchte ich speziell
f) Th. Fließbach: Lehrbuch zur Theoretische Physik III, Spektrum Akad.
Verlag, Heidelberg-Berlin 2000 (4. Auflage 2005)
g) Gernot Münster: Quantentheorie, Walter de Gruyter Berlin - New York
2006
All diese Lehrbcher gehen natürlich im Umfang wesentlich über den Inhalt
dieser Grundlagen-Vorlesung hinaus.
2. Zur Interpretation der Quantentheorie
a) F. Selleri: Die Debatte um die Quantentheorie, Vieweg 1983
b) K. Baumann & R. U. Sexl: Die Deutungen der Quantentheorie, Vieweg
1984 (Nach einer knappen Darstellung der Problematik enthält dieses
Buch 12 historisch wie inhaltlich bedeutsame Originalarbeiten.)
3. Ergänzende Literatur
Daneben empfehle ich, zum besseren Verständnis des physikalischen Hintergrunds einzelne Kapitel in den ausgezeichneten Feynman Lectures nachzulesen:
100
Feynman/Leighton/Sands: Vorlesungen über Physik, Bd. 1 und 2, R. Oldenbourg Verlag München
Schließlich sei noch auf ein popularwissenschaftliches Buch hingewiesen, das
ein leidenschaftliches Plädoyer gegen die übliche Kopenhagener Deutung
darstellt und eine Fundgrube historischer Anmerkungen enthält:
J. A. e Silva & G. Lochak: Wellen und Teilchen – Einführung in die Quantenmechanik, Fischer 6239 (1974)
101
Herunterladen