Grundlagen der Quantenmechanik und Statistik Teil I: Quantenmechanik Vorlesungen an der Ruhruniversität Bochum K.–U. Riemann Inhaltsverzeichnis 1. Einführung 1.1 Historische Ausgangssituation Lord Kelvins dunkle Wolken 1 1.2 Korpuskeleigenschaft des Lichts 2 1.3 Welleneigenschaften der Materie 3 1.4 Welle–Teilchen–Dualismus und Komplementarität Positivismus und Realismus 4 1.5 Grundbegriffe der Wellenbeschreibung Dispersionsgleichung Phasen– und Gruppengeschwindigkeit Unschärfeprodukt 6 1.6 Grundbegriffe der Wahrscheinlichkeitsrechnung Kolmogorovsches Axiomensystem Diskrete und kontinuierliche Zufallsvariablen Mittelwerte, Momente, Varianz 9 2. Die Schrödingergleichung 2.1 Entwicklung der Wellengleichung Das Korrespondenzprinzip 12 2.2 Formale Eigenschaften der Schrödingergleichung 14 2.3 Die Kontinuitätsgleichung Die Teilchen–Stromdichte 15 2.4 Erwartungswerte und Operatoren Der Impulsoperator Der Hamiltonoperator Der Drehimpulsoperator Hermitesche Operatoren Hilbertraum und Dualraum, bra– und ket–Vektoren 18 2.5 Das Theorem von Ehrenfest 22 i 2.6 Die Heisenbergsche Unschärferelation Die Orts–Impuls–Unschärfe Die allgemeine Unschärferelation Die Drehimpuls–Unschärfe Heisenbergs Gedankenexperiment Die Energie–Zeit–Unschärfe 25 3. Spezielle Lösungen der Schrödingergleichung 3.1 Entwicklung nach Eigenfunktionen des Hamiltonoperators Die stationäre Schrödingergleichung Das Eigenwertproblen Hermitescher Operatoren Vollständigkeit Diskretes und kontinuierliches Spektrum 33 3.2 Der harmonische Oszillator Konstruktion der Eigenwerte und Eigenfunktionen Interpretation und Vergleich mit der klassischen Mechanik Auswahlregeln 37 3.3 Die Potentialmulde: Diskretes und kontinuierliches Spektrum Durchlässikeit und Reflexion Ausstrahlungsbedingung 48 3.4 Das eindimensionale Kastenpotential 52 3.5 Potentialbarriere und Tunneleffekt 58 3.6 Kugelsymmetrische Potentiale im dreidimensionalen Raum Separation der Schrödingergleichung Kugelflächenfunktionen und Drehimpuls–Eigenfunktionen Die Quantenzahlen l und m, Richtungsquantelung Effektives Potential und radiale Schrödingergleichung 59 3.7 Das Wasserstoffatom Haupt– und Neben–Quantenzahlen, Entartung Interpretation und Vergleich mit der klassischen Mechanik Selbskonsistenz, das Problem der Selbstenergie 67 4. Mehrteilchensysteme 4.1 Die Schrödingergleichung 74 ii 4.2 Identische Teilchen und Spin Die Ununterscheidbarkeit identischer Teilchen Symmetrische und antisymmetrische Wellenfunktionen Bosonen und Fermionen, Pauliprinzip 75 4.3 Atombau und periodisches System der Elemente Das Schalenmodell, s–, p–, d– und f –Zustände Hauptgruppen, Nebengruppen, Lanthanoide und Aktinoide 78 4.4 Die Bildung von Molekülen Heteropolare und homöopolare Bindung Das Wasserstoffmolekül, Austauschkraft 81 5. Die Interpretation der Quantenmechanik 5.1 Der Formalismus Zustandsvektoren und Operatoren, Kommutatoren Darstellungen und Bilder Heisenbergbild und Heisenberggleichung Eigenwerte und Eigenvektoren, Spektrum Entwicklung nach Eigenvektoren Bornsche Interpretation 84 5.2 Meßprozeß und Zustandsvektor Die Reproduzierbarkeit der Messung Meßwerte und Eigenwerte Das Problem der Entartung Kommensurable und inkommensurable Observable Die Reduktion des Zustandsvektors 87 5.3 Das Einstein-Podolsky-Rosen (EPR)–Paradoxon Vollständigkeit einer Theorie Physikalische Realität Die störungsfreie Messung Bohms Version des EPR–Experiments Die Originalversion des EPR–Experiments Positivismus und Realismus 90 5.4 Schrödinger und seine Katze Korrespondenz zur klassischen Mechanik Erwartungskatalog und Ensembleinterpretation Empirischer Standpunkt und Vollständigkeitspostulat Der berühmte “burleske Fall” 94 iii 5.5 Verborgene Parameter und Bohms Interpretation Vergleich mit der Hamilton–Jakobi–Theorie Das Quantenpotential de Broglies Führungswellen Quantenpotential und Kenntnisstand 95 5.6 Lokalität und Bellsche Ungleichung Das Problem der Lokalität und Separabilität Konsequenzen des EPR–Experiments Die Bellsche Ungleichung Quantenmechanik und Verschränkung 97 100 Literaturhinweise iv 1 Einführung 1.1 Historische Ausgangssituation Nach • Kepler, Galilei und Newton... (Materie) • Huygens... (Licht) • Faraday, Maxwell (Feldbegriff, Elektrodynamik) • Boltzmann...(Brücke von der mikroskopischen zur makroskopischen Physik) hielt man gegen Ende des 19. Jahrhunderts die Physik im wesentlichen für abgeschlossen: künftige Probleme sah man nur noch in der Auswertung bekannter Grundgesetze unter komplexen Bedingungen. Allerdings sah Lord Kelvin (* William Thomson 1824) “Zwei kleine dunkle Wolken” am Horizont. – Das negative Ergebnis des Versuches von Michelson und Morley und – die “Ultraviolettkatastrophe” des Rayleigh–Jeansschen Strahlungsgesetzes u(ν, T ) ∼ ν 2 T. Diese kleinen dunklen Wolken am Horizont lösten sich nicht auf, sondern führten zu heftigen Gewittern, die die Grundpfosten der klassischen Physik erschütterten. Der negative Ausgang des Michelson–Morley–Experiments führte zur Relativitätstheorie, die unsere angeborene Anschauung von Raum und Zeit ad absurdum führt (vgl. Raum und Zeit bei Newton!). Noch tiefgreifender erwies sich die Umwälzung durch die zweite dunkle Wolke, die zur Quantentheorie führte. Die Diskussion um ihre erkenntnistheoretische und naturphilosophische Implikation ist bis heute nicht abgeschlossen, die Grundproblematik ist ungeklärt. Neben der erwähnten Ultraviolettkatastrophe gab es weitere experimentelle Erfahrungen, die zu Grundpfeilern der Quantentheorie wurden: 1 • Die spezifische Wärme fester Körper cv ist nach der klassischen Theorie konstant (Dulong–Petitsches Gesetz). Experimentell findet man jedoch, daß cv für T → 0 gegen 0 geht. • Beim Photoeffekt lassen sich auch bei (fast) beliebig gesteigerter Intensität nur oberhalb einer Grenzfrequenz Elektronen aus einem Metall auslösen. • Im Gegensatz zur klassischen Erwartung aus dem Rutherfordschen Atommodell sind Atome im Grundzustand stabil. “Angeregte” Atome senden kein kontinuierliches Spektrum, sondern diskrete Linienstrahlung aus. Sie können Energie nur in diskreten “Quanten” aufnehmen (Franck – Hertz). 1.2 Korpuskeleigenschaft des Lichts Ein Teil dieser seltsamen Resultate (Photoeffekt [Einstein] und Hohlraumstrahlung [Planck]), ließ sich nur verstehen und dann sogar quantitativ richtig beschreiben, wenn man Huygens Erkenntnis der Wellennatur des Lichts zumindest teilweise wieder aufgab und durch ein Konzept von Teilchen, sogenannten Photonen (Einstein 1905), mit einer Energie E = hν = h̄ω (1) ersetzte. Dabei ist h = 6.626 · 10−34 Js bzw. h̄ = h = 1.055 · 10−34 Js 2π (2) die selbe Konstante, die Planck 1900 für sein halbempirisches Strahlungsgesetz1 u(ν, T ) = 8πν 2 hν hν c2 e kT −1 (3) eingeführt hatte. Durch die Verbindung einer Welleneigenschaft, der Frequenz ν, mit einer Teilchenenergie E trägt (1) bereits den Keim des berühmten “Welle– Teilchen–Dualismus” in sich. Über E = mc2 können wir dem Photon eine Masse m = hν/c2 zuordnen. Damit erhält das Photon einen Teilchen–Impuls p = mc = h hν = = h̄k c λ , (4) der mit der anderen Welleneigenschaft, der Wellenlänge λ bzw. der Wellenzahl 2 Beachte, daß (3) für kleine ν in das Rayleigh–Jeansschen Strahlungsgesetz u → 8πk c2 ν T 3 hν − kT übergeht. Statt der UV–Katastrophe erhält man für große ν die Formel u → 8πhν , deren c2 e Form bereits Wien (1896) angegeben hatte! 1 2 k= 2π λ (5) verknüpft ist. Die Verknüpfung erfolgt in beiden Formeln (1) und (4) durch das Plancksche Wirkungsquantum h (bzw. h̄). Die experimentelle Bestätigung von Gleichung (4) ergibt sich aus der Streuung von Photonen (Röntgenstrahlen) an Elektronen (Compton–Effekt, 1923). 1.3 Welleneigenschaften der Materie Nicht alle unverstandenen Erfahrungen ließen sich auf Photonen zurückführen. Zur Erklärung der Atomspektren führten Bohr (1913) und Sommerfeld (1916) die Quantenbedingung I pdq = nh (6) für periodische Systeme ein. Hierauf fußt die “alte Quantentheorie”, auf die wir hier nicht näher eingehen. Mit der Bedingung (6) ist im “Bohrschen Atommodell” nur ein diskreter Satz von Elektronenbahnen mit “Energieniveaus” En erlaubt. Die Spektren erklären sich dann aus der Frequenzbedingung En − Em = hνnm . (7) Einen wesentlich radikaleren Schritt vollzog de Broglie (Dissertation 1923/24), indem er die Beziehungen ν = E/h bzw. E = h̄ω (8) λ = h/p bzw. p = h̄k, (9) und die Einstein für Photonen postuliert hatte, auf materielle Teilchen wie Elektronen und Protonen übertrug und die Vorstellung von Materiewellen entwickelte. Im Rahmen dieses Wellenbildes läßt sich die Quantenbedingung (6) anschaulich über stehende Elektronenwellen deuten: n= I dx 1I pdq = λ h − 3 + Der Nachweis der Wellennatur von Materie gelang Davisson und Germer (1927) durch Interferenzerscheinungen bei der Reflexion von Elektronen an Kristallen. Die Tatsache, daß die Wellennatur der Materie länger verborgen blieb als die des Lichts, liegt an der kleinen Wellenlänge, die dem großen Impuls materieller Teilchen (m0 6= 0) entspricht. 1.4 Welle–Teilchen–Dualismus und Komplementarität Sowohl die Materie als auch das Licht zeigen also je nach den experimentellen Bedingungen entweder Teilchen– oder Wellencharakter. Diese komplementären Beschreibungen sind weder in unserer Anschauung noch im Experiment simultan realisierbar: Jeder Versuch, den einen Aspekt deutlich herauszuarbeiten, zerstört den anderen und umgekehrt. Wir wollen das kurz an einem Doppelspaltexperiment erläutern: Ein Licht– oder Materiestrom falle auf eine Blende B mit Doppelspalt D1 , D 2 S B D1 D2 Auf einem Schirm S hinter der Blende beobachten wir die Intensität als Interferenzmuster. Dieses Interferenzmuster spiegelt die Wellennatur unseres einfallenden Stromes wieder. Vom Teilchenbild her geht ein Teil der Partikel durch D1 und ein anderer Teil durch D2 . Das Interferenzmuster wird auch dann beobachtet, wenn der Teilchenstrom so reduziert wird, daß nur “selten” jeweils ein Teilchen auf den Schirm trifft. Eine Wechselwirkung verschiedener Teilchen ist dann ausgeschlossen und es liegt nahe, jeweils zu untersuchen, durch welchen der beiden Spalte D1 oder D2 die Teilchen gehen. Aber jeder Versuch, eine Entscheidung zwischen D1 oder D2 zu treffen zerstört das Interferenzmuster! Beobachte ich also den Teilchenaspekt, verliert sich der Wellenaspekt und umgekehrt (Komplementaritätsprinzip). Ein ganz wichtiger Punkt dabei ist, daß diese Komplementarität nicht auf einer speziellen Struktur bestimmter Elementarteilchen wie Elektronen oder Photonen beruht, sondern ein allgemeines Prinzip darstellt, dem jede physikalische Beobachtung unterliegt. Mit der Betonung des Wortes “Beobachtung” deuten wir bereits 4 hier das (scheinbar) subjektive Element an, das die Quantentheorie in die Physik gebracht hat: Wir begnügen uns mit der mathematischen Beschreibung von Phänomenen, die wir bei bestimmten Experimenten mit Elektronen oder Photonen beobachten, müssen aber auf Aussagen über das Elektron oder Photon (oder Stück Kreide?!) an sich verzichten! Genau hier liegt der Kern des immer noch nicht ganz ausgeräumten Gegensatzes zwischen – POSITIVISMUS (Kopenhagener Schule, Bohr, Heisenberg) und – REALISMUS (de Broglie, Schrödinger, Einstein: Ändert sich das Weltall, wenn eine Maus es anschaut?) Das Komplementaritätsprinzip, das die simultane Bestimmung von Wellen– und Teilchenaspekten verbietet, ist eng mit der berühmten Unschärferelation verknüpft: Ich kann nicht gleichzeitig den Teilchenort x und die Wellenlänge λ (genau) messen. Wegen der de Broglieschen Beziehung (9) heißt das aber, daß nicht gleichzeitig der Ort und der Impuls eines Teilchens genau angegeben werden können. Genau die werden aber als Anfangsbedingungen in der klassischen Mechanik benötigt. Damit bricht also das deterministische Weltbild der klassischen Mechanik grundsätzlich zusammen! Was bleibt im Teilchenbild, wenn wir den Ort eines Teilchens nicht mehr genau angeben können? Eine mehr oder weniger diffuse Information über die Aufenthaltswahrscheinlichkeit des Teilchens. [Ebenso entspricht der Unkenntnis über den genauen Impuls eine Wahrscheinlichkeitsverteilung aller möglichen Impulse.] Wenn wir ins Wellenbild wechseln, so liegt es nahe, die Aufenthaltswahrscheinlichkeit eines Teilchens mit der Intensität, also dem Amplitudenquadrat der entsprechenden Welle zu identifizieren. Die Wahrscheinlichkeitsinterpretation der Wellenamplitude löst auch den Widerspruch zwischen kontinuierlichem Welleneinfall und diskreter Registrierung von Ereignissen auf dem Schirm bei geringer Intensität. In dieser Wahrscheinlichkeitsinterpretation selbst sind sich zwar die Positivisten (Kopenhagen) und Realisten einig, ihr Hintergrund ist aber umstritten: Ist es wirklich sinnlos nach dem Ort und dem Impuls eines Teilchens zu fragen oder ist die Natur nur zu “schamhaft”, uns beide Größen preiszugeben? Sind wir vielleicht beim Experimentieren (notwendigerweise) so grob, daß wir die komplementäre Information zerstören? Natürlich kennen wir auch sonst die Störung eines Systems durch eine Messung, aber innerhalb der Gültigkeit der klassischen Physik läßt sich diese Störung im Prinzip beliebig klein machen (oder sogar wegrechnen). In der Quantenmechanik müssen wir uns dagegen prinzipiell mit einer gewissen Unkenntnis und entsprechenden Wahrscheinlichkeiten begnügen. Für die Positivisten ist die Physik mit diesen Wahrscheinlichkeiten vollständig beschrieben. Die Realisten möchten dagegen an einer an sich deterministischen Welt festhalten (Einstein: Gott würfelt nicht!), akzeptieren dabei aber, daß diese deterministi5 sche Welt für uns nicht vollständig erfaßbar ist. Wir werden auf diese und ähnliche Fragen noch verschiedentlich zurückkommen, wenn wir uns in diesem Semester mit Quantenmechanik befassen. Damit meinen wir konkret, daß wir dem Teilchenbild der klassischen Mechanik ein Wellenbild der Materie gegenüberstellen, das im Rahmen eines Wahrscheinlichkeitskonzeptes zu interpretieren ist. Bevor wir im nächsten Kapitel dieses Programms konkretisieren, stellen wir zunächst elementares Rüstzeug zur Beschreibung von Wellen und zur Beschreibung von Wahrscheinlichkeiten zusammen. 1.5 Grundbegriffe der Wellenbeschreibung Wir betrachten ebene harmonische Wellen der Form (a) ψ = cos ϕ, (b) ψ = sin ϕ (10) bzw. (a) ψ = eiϕ , (b) ψ = e−iϕ (11) oder einer Linearkombination von (a) und (b). (Auf die formal oder inhaltlich begründete komplexe Schreibweise wollen wir hier nicht elaborieren.) Über die Phase ϕ = kx − ωt bzw. ϕ = k · r − ωt (12) hängt ψ periodisch von der Zeit t und vom Ort x (eindimensional) bzw. r (dreidimensional) ab. ω = 2πν ist die Frequenz und k = 2π/λ die Wellenzahl (bzw. k der Wellenvektor) der Welle. Punkte x = (ϕ0 + ωt)/k konstanter Phase ϕ0 (z. B. Wellenberge) bewegen sich mit der Phasengeschwindigkeit vp = ω/k. (13) Für Licht im Vakuum haben wir bekanntlich vp = c. Licht in Materie hat eine andere Phasengeschwindigkeit, das Verhältnis c/vp = n wird Brechungsindex genannt. (Beachte: n < 1 ist nicht verboten!) Ändert sich der Berechnungindex bzw. die Phasengeschwindigkeit mit der Frequenz bzw. der Wellenlänge, spricht man von Dispersion. Die Beziehung ω = ω(k), 6 (14) welche die Ausbreitung der Welle kontrolliert, wird daher allgemein Dispersionsgleichung genannt. Sind k oder ω dabei komplex, so sind die Wellen räumlich oder zeitlich gedämpft. Für die konkrete Anschrift einer ebenen Welle bevorzugen wir die Form (11a). Der Einfachheit halber beschränkten wir uns außerdem soweit als möglich auf den eindimensionalen Fall (12a). Mit einer (komplexen) Amplitude A schreiben wir also eine ebene Welle in der Form ψ(x, t) = Aei(kx−ωt) (15) an. Eine solche ebene Welle ist zeitlich wie räumlich unendlich ausgedehnt, ein langweiliges, strukturloses Phänomen ohne jeden Informationsfluß. Um interessantere Phänomene wie Licht-Bilder, Geräusche und Musik darzustellen, benötigen wir Wellenpakete, die durch Überlagerung verschiedener ebener Wellen entstehen: ψ(x, t) = Z A(k)ei[kx−ω(k)t] dk. (16) Daß wir mit solchen Überlagerungen räumlich und/oder zeitlich eng begrenzte Strukturen erzeugen können (Lichtblitz, Knall), wissen wir aus zahlreichen Erfahrungen. Wir wollen uns dazu aber auch rechnerisch ein konkretes Beispiel ansehen und betrachten eine Gaußverteilung A(k) = e− k 2 l2 2 der Amplituden mit einer Breite ∆k ∼ 1/l um k = 0. Dann hat die Welle zur Zeit t = 0 die räumliche Struktur ψ(x, 0) = Z 2 2 2 e − k 2l +ikx =e 2 − x2 2l 2 =e − x2 2l Z dk = e Z e − − x2 2l e e dk = − 2 kl √ −i √x 2 2l 2 2 − k 2l Z 2 k 2 l2 −ikx− x 2 2 2l dk dk √ 2π − x22 e 2l l Dies ist wieder eine Gaußverteilung, und zwar um x = 0 mit einer Breite ∆x ∼ l. Je schmaler wir also die k-Verteilung wählen, um so breiter wird die x-Verteilung und umgekehrt; und daß das Produkt 7 ∆k · ∆x ∼ 1 (17) an die Unschärferelation erinnert, ist gewiß kein Zufall: Man kann nicht gleichzeitig den Ort und die Wellenlänge eines Wellenpakets scharf angeben. (Für andere Verteilungen als Gaußglocken wird das Unschärfeprodukt sogar noch größer.) Ebensowenig läßt sich die Zeit und die Frequenz eines Wellenpakets simultan angeben, denn wir erhalten ein entsprechendes Unschärfeprodukt ∆ω∆t ∼ 1 (18) (oder noch größer): Ein Ton mit sauber definierter Tonhöhe muß lange andauern, ein Ton zu kurzer Dauer ist kein Ton mehr, sondern ein Knall. Wenn das Medium dispersionsfrei ist, wenn also die Phasengeschwindigkeit vp = ω/k konstant ist, breitet sich unser Wellenpaket (16) unverzerrt mit konstanter Geschwindigkeit vp aus. Denn wir erhalten mit ξ = x − vp t aus (16) ψ(x, t) = Z A(k)eikξ dk = ψ(ξ, 0) = ψ(x − vp t, 0). In einem Medium mit Dispersion dagegen breiten sich die verschiedenen Komponenten des Wellenpakets verschieden schnell aus und das Paket “zerläuft” allmählich. Wenn jedoch die k–Verteilung hinreichend eng um die Wellenzahl k0 liegt, erfolgt dieses Zerlaufen sehr langsam und wir können vorher noch sinnvoll nach der Ausbreitung des Wellenpakets fragen. Nehmen wir also an, daß A(k0 + κ) = a(κ) nur für kleine κ von Null verschieden ist. Dann folgt aus (16) ψ(x, t) = e i(k0 x−ω0 t) Z a(κ)e = ei(k0 x−ω0 t) f x − iκ x− ∂ω ∂k | ∂ω ∂k t k0 ! Die Welle läßt sich also als ebene Trägerwelle ei(k0 x−ω0 t) mit einem Modulations–Faktor beschreiben: ∂ω f x− t ∂k k0 8 k0 ! t dκ mit ω0 = ω(k0 ). 1.0 i(k0x−ωt) f 0.5 e 0.0 x −0.5 −1.0 −3.0 −2.0 −1.0 0.0 1.0 2.0 3.0 Während die Trägerwelle die Phasengeschwindigkeit ω0 /k0 aufweist, bewegt sich der Modulationsfaktor — also der Bereich, in dem die Welle eine merkliche Amplitude aufweist — mit der Gruppengeschwindigkeit vg = ∂ω ∂k (19) durch den Raum. Im Gegensatz zu der strukturlosen, langweiligen Trägerwelle beinhaltet der Modulationsfaktor f die gesamte interessante Information oder das Signal. vg wird daher auch Signalgeschwindigkeit genannt. Sie ist eine physikalisch signifikante Größe und kann — im Gegensatz zu vp — nie die Lichtgeschwindigkeit überschreiten. 1.6 Grundbegriffe der Wahrscheinlichkeitsrechnung Wir ordnen irgendwelchen möglichen Ereignissen A Wahrscheinlichkeiten p(A) zu und verstehen darunter die relative Häufigkeit p(A) = n→∞ lim nA , n (20) mit der das Ereignis A bei vielen (n → ∞) unabhängigen Versuchen unter gleichen Bedingungen auftritt (Beispiel: p (3 Augen) = 1/6 beim Würfeln). Die intuitive Anschauung faßt man mathematisch im Kolmogorovschen Axiomensystem2 zusammen, aus dem man Rechenregeln wie 2 p(A ∨ B) = p(A) + p(B) − p(A ∧ B) (21) p(¬A) = 1 − p(A) (22) Ereignisse A ⊂ Ω, p(A) : P(Ω) → R p(B) und (iii) p(Ω) = 1. mit (i) p(A) ≥ 0, (ii) p(A ∪ · B) = p(A) + 9 ableitet. Solche Rechenregeln benutzt man auch, um Wahrscheinlichkeiten für Ereignisse zu formulieren, die man nicht durch die relative Häufigkeit bei vielen Versuchen ermitteln kann. (Beispiel: p für den GAU eines Atomkraftwerkes). Ereignisse A und B sind nicht notwendigerweise unabhängig voneinander. Man nennt p(A ∧ B) p(A|B) := (23) p(B) die “bedingte Wahrscheinlichkeit für A, wenn B vorliegt”. Sind A und B unabhängig, ist p(A|B) = p(A), also gilt p(A ∧ B) = p(A)p(B). (24) Bestehen die (Elementar–)Ereignisse Ai darin, daß eine Variable x die Werte xi annimmt, nennt man x eine Zufallsvariable. Ist der Satz xi möglicher Werte abzählbar, sprechen wir von einer diskreten Zufallsvariable. Dafür gilt X p(xi ) = 1. (25) i Ist die Zufallsvariable kontinuierlich, müssen wir differentielle Wahrscheinlichkeiten p(x)dx mit Z p(x)dx = 1 (26) betrachten. Abweichend von der Bezeichnung in der Mathematik ist es in der Physik üblich, p(x) als Verteilungsfunktion zu bezeichnen. Wir werden nicht immer sauber zwischen der Anschrift (25) und (26) unterscheiden und daher beide Ausdrücke ggf. sinngemäß umdeuten. Das gilt insbesondere für den Mischfall, in dem eine Zufallsvariable bestimmte diskrete und bestimmte kontinuierliche Werte annehmen kann (Beispiel: Energie eines Atoms). Wollen wir die jeweils sinngemäße Interpretation betonen, schreiben wir auch Z X p(x)dx = 1. (27) Natürlich kann eine Zufallsvariable auch mehrdimensional sein. Dabei denken wir z. B. an den Ort r und verstehen (25)–(27) dann entsprechend als Z p(r)d3 r = 1 usw. Mit der Verteilungfunktion definieren wir Mittelwerte 10 (28) f¯ = hf (x)i = Z X f (x)p(x)dx. (29) Die speziellen Mittelwerte n hx i = Z X xn p(x)dx (30) heißen auch “Momente” der Verteilungsfunktion. Neben dem ersten Moment – hxi, das den Mittelwert der Zufallsvariable angibt, ist insbesondere das zweite Moment hx2 i von Bedeutung. Mit ihm erhält man die Varianz (∆x)2 = h(x − hxi)2 i = hx2 i − hxi2 , (31) welche die “Breite” der Verteilung repräsentiert. Wie im Abschnitt 1.4 andiskutiert, wollen wir im folgenden das Amplitudenquadrat von Materiewellen als Aufenthaltswahrscheinlichkeit eines Teilchens interpretieren. Da wir unsere Wellen komplex ausschreiben wollen und p ≥ 0 gelten muß, heißt das präzise, daß wir eine Wahrscheinlichkeitsverteilung p(r, t) = ψ ∗ (r, t)ψ(r, t) (32) postulieren. Gemäß (28) muß die Wellenamplitude also die Nebenbedingung Z ψ ∗ (r, t)ψ(r, t)d3 r = 1 (33) erfüllen. Irgendwelche Ortsfunktionen f (r) haben dann nach (29) den Mittelwert f¯(t) = Z ψ ∗ (r, t)f (r)ψ(r, t)d3 r. 11 (34) 2 Die Schrödingergleichung 2.1 Entwicklung der Wellengleichung Gemäß unserer Vorbesprechung möchten wir nun eine Wellengleichung aufstellen, welche die Ausbreitung der Materiewellen beschreibt. Dabei sollten wir uns von vornherein klar darüber sein, daß wir die Wellengleichung nicht “herleiten” können – ebensowenig wie irgendeine andere Grundgleichung der Physik. Vielmehr geht es darum, die Grundpostulate durch mehr oder weniger plausible Ansätze zu erfüllen. Diese Ansätze werden dann im Laufe der Zeit durch Vergleich von Theorie und Experiment erhärtet oder widerlegt. Bezüglich der Grundgleichung für Materiewellen tappen wir besonders im Dunkeln, da wir der Wellenfunktion selbst keine direkte physikalische Bedeutung zumessen3 . Wir wissen lediglich, daß Interferenz auftreten kann. Darum schließen wir auf ein Superpositionsprinzip und fordern eine lineare Gleichung. Weiter wollen wir uns vom Korrespondenzprinzip (Bohr 1923) leiten lassen, nach dem zwischen klassischen und quantenmechanischen Größen eine enge Entsprechung mit mehr oder weniger analogen Beziehungen besteht. (Eine solche Korrespondenz wird sich allerdings weitgehend erst nachträglich überprüfen lassen). Schließlich müssen wir bei der Formulierung einer Wellengleichung natürlich die grundlegenden Beziehungen (8),(9) E = h̄ω und p = h̄k im Auge behalten. Die uns am meisten vertraute Wellengleichung der Form ∂2ψ ∂2ψ = γ ∂t2 ∂x2 mit konstantem γ ist nicht geeignet: – im Gegensatz zur klassischen Mechanik kann die Lösung nicht durch Anfangsbedingungen festgelegt werden, da die Gleichung zweiter Ordnung in der Zeit ist – Der Lösungsansatz ei(kx−ωt) führt auf die Dispersionsgleichung 3 Darum lassen wir auch von vornherein komplexe Wellenfunktionen zu! 12 γ = ω 2 /k 2 = E 2 /p2 √ eines dispersionsfreien Mediums mit einer Wellengeschwindigkeit γ = E/p, die von den Anfangsbedingungen abhängt und nicht mit der Teilchengeschwindigkeit übereinstimmt. Nach dem Korrespondenzprinzip erwarten wir, daß die Gruppengeschwindigkeit vg der klassischen Teilchengeschwindigkeit entspricht. Für ein kräftefreies Teilchen im konstanten Potential V0 gilt E = p2 /2m + V0 . Das entspricht einer Dispersionsbeziehung h̄2 2 h̄ω = k + h̄ω0 2m mit ω0 = V0 . h̄ (35) Die Gruppengeschwindigkeit vg = h̄ p ∂ω = k= ∂k m m (36) stimmt damit tatsächlich mit der Teilchengeschwindigkeit überein. Eine entsprechende Differentialgleichung, die mit dem Ansatz ψ ∼ ei(kx−ωt) übereinstimmt, erhalten wir durch die Übersetzung k→ 1 ∂ i ∂x p→ h̄ ∂ i ∂x und ω → i ∂ ∂t und E → ih̄ oder (37) ∂ ∂t (38) h̄2 ∂ 2 ψ ∂ψ =− + V0 ψ ih̄ ∂t 2m ∂x2 (39) Diese Gleichung ist — wie gewünscht — erster Ordnung und führt für freie Teilchen auf die erwartete Gruppengeschwindigkeit. Es erhebt sich allerdings die Frage, wie man sie auf Teilchen in einem konservativem Kraftfeld überträgt. Wenn wir V0 durch V (x) ersetzen, können wir (35) nicht mehr als Dispersionsgleichung interpretieren. Tatsächlich können wir ja im Kraftfeld auch keine ebenen Wellen ψ ∼ ei(kx−ωt) mehr als Lösung erwarten, denn festes k entspricht einem konstanten Impuls p = h̄k. Aber auch wenn k keine direkte Bedeutung als Wellenzahl mehr hat, können wir versuchen, an der Übersetzungsvorschrift (38) festzuhalten. Korrespondierend zu der klassischen Beziehung E = H(p, x) = 13 p2 + V (x) 2m verallgemeinern wir daher (39) zur eindimensionalen Schrödingergleichung h̄2 ∂ 2 ψ ∂ψ =− + V (x). ih̄ ∂t 2m ∂x2 (40) Die weitere Verallgemeinerung auf drei Raumdimensionen ist fast trivial: Statt (40) gehen wir von der Übersetzungsvorschrift p→ h̄ ∂ ∇ und E → ih̄ i ∂t (41) aus, wobei der Nabla–Operator ∇ die Gradientenbildung bezeichnet. Mit dem Laplace–Operator ∆ = ∇2 erhalten wir dann die dreidimensionale Schrödingergleichung ih̄ h̄2 ∂ψ =− ∆ψ + V (r)ψ . ∂t 2m (42) Dies ist die gesuchte Wellengleichung, die Schrödinger 1926 vorgeschlagen und die sich in jahrzehntelanger Erfahrung bewährt hat. Bevor wir uns mit dieser Feststellung zufrieden geben dürfen, müssen wir aber noch zwei wichtige Postulate nachweisen: 1. Die Erhaltung der Nebenbedingung (33) und 2. der Bezug zur klassischen Bewegungsgleichung. Diese Nachweise werden wir in den Abschnitten 2.3 und 2.5 führen. Zuvor wollen wir uns noch mit einigen formalen Aspekten befassen. 2.2 Formale Eigenschaften der Schrödingergleichung Im Gegensatz zu den Grundgleichungen der klassischen Physik ist die Schrödingergleichung (42) und damit die ψ–Funktion wesentlich komplex. Bisher kannten wir komplexe Anschriften (wie etwa eiϕ = cos ϕ + i sin ϕ oder Z = R + iωL) lediglich als bequeme Zusammenfassung von Beziehungen, in denen Real– und Imaginärteil ihre eigene physikalische Bedeutung haben. Die Wellenfunktion ist dagegen von vornherein komplex, ohne daß Re(ψ) oder Im(ψ) eine selbständige Bedeutung hätten: Eine physikalische Bedeutung hat erst die reelle Größe p = ψ ∗ ψ. In der Theorie kann ψ auch völlig äquivalent durch ψ ∗ ersetzt werden. ψ ∗ aber erfüllt nicht die Schrödingergleichung (42), sondern die natürlich ebenso äquivalente konjugiert–komplexe Schrödingergleichung 14 ih̄ h̄2 ∂ψ ∗ =+ ∆ψ ∗ − V (r)ψ ∗ . ∂t 2m (43) Anders als wir es sonst von Wellengleichungen gewöhnt sind, sind (mit ϕ = k · r−ωt) also nicht die vier Funktionen (10a,b) und (11a,b) Lösungen der kräftefreien Schrödingergleichung, sondern allein der Ansatz (11a), von dem wir bei der Konstruktion ausgegangen sind. (Der äquivalente Ansatz (11b) führt eben zur konjugiert–komplexen Schrödingergleichung). Ohne die imaginäre Einheit i vor der Zeitableitung wäre die Schrödingergleichung als “parabolische Differentialgleichung” ja auch keine Wellengleichung, sondern eine Diffusionsgleichung, deren Typ vielleicht von der Wärmeleitungsgleichung ∂T = κ∆T + f (T ) ∂t am ehesten vertraut ist. Mit der Diffusionsgleichung hat die Schrödingergleichung daher gemein, daß ihre Lösung durch Anfangsbedingungen zur Zeit t = 0 festgelegt ist. Während jedoch die Diffusionsgleichungen zu exponentiell abklingenden Lösungen ∼ e−t/τ “neigen”, sind für die Schrödingergleichung (wegen des i vor der Zeitableitung) oszillierende Lösungen ∼ e−iωt typisch. Diese Oszillationen von ψ darf man sich freilich ebensowenig als physikalische Realität vorstellen wie ψ selbst. Hängt ihre Frequenz ω doch von der willkürlichen Wahl des Potential–Nullpunkts ab. In Übereinstimmung damit ist der gesamte Phasenfaktor e−iωt der Beobachtung nicht zugänglich, er fällt ja bei der Bildung von ψ ∗ ψ auch heraus! [Beobachtbar sind einzig Phasendifferenzen (Interferenz!); diese hängen allerdings auch nicht vom Potential–Nullpunkt ab.] Ebenso wenig — und das ist vielen Leuten nicht hinreichend bewußt! — besitzt die Wellenlänge λ = 2πh̄/p eine Bedeutung, die man dem Teilchen selbst zuordnen kann. Denn der Impuls hängt ja wesentlich von der speziellen Wahl des Bezugssystems ab. Wenn wir in Interferenzexperimenten eine bestimmte Wellenlänge beobachten, so bezieht sich diese Beobachtung auf ein System, in dem das Beugungsgitter und der Schirm ruhen. In diesem System (und erst hier!) sind Impuls und Wellenlänge eindeutig festgelegt. Wir nutzen diese Überlegung, um erneut darauf hinzuweisen, daß wir mit der Quantenmechanik nicht ein Teilchen, sondern die mögliche Beobachtung eines Teilchens beschreiben. Diese hängt z. B. vom Teilchen und vom Beugungsgitter ab. 2.3 Die Kontinuitätsgleichung Wir hatten bereits darauf hingewiesen, daß die Wahrscheinlichkeitsinterpretation (32) 15 p(r, t) = ψ ∗ (r, t)ψ(r, t) der Wellenamplitude verlangt, daß die Normierung (33) Z p(r, t)d3 r = Z ψ ∗ (r, t)ψ(r, t)d2 r = 1 im Laufe der Zeit erhalten bleibt. Dazu rechnen wir unter Verwendung der Schrödingergleichungen (42) und (43) ∂ψ ∂ψ ∗ ∂p = ψ∗ +ψ ∂t ∂t ∂t ( ) 2 1 h̄ ∗ h̄2 ∗ ∗ ∗ = − ψ ∆ψ + V ψψ + ψ∆ψ − V ψψ ih̄ 2m 2m ih̄ {ψ ∗ ∇ · ∇ψ − ψ∇ · ∇ψ ∗ } = 2m ih̄ ih̄ ∇ · {ψ ∗ ∇ψ − ψ∇ψ ∗ } − {∇ψ ∗ · ∇ψ − ∇ψ · ∇ψ ∗ } . = 2m 2m Die letzte Klammer verschwindet und wir erhalten die Kontinuitätsgleichung ∂p + div S = 0 ∂t p(r, t) = ψ ∗ ψ und S(r, t) = mit (44) h̄ {ψ ∗ ∇ψ − ψ∇ψ ∗ } . 2im Die Form der Kontinuitätsgleichung stellt die postulierte Erhaltung der Normierung sofort sicher. Denn nach dem Gaußschen Satz gilt Z Z I ∂p 3 d Z 3 3 pd r = d r = − div Sd r = − S · do = 0. dt ∂t Das Oberflächenintegral verschwindet, da ψ für r → ∞ hinreichend stark gegen Null gehen muss, damit die Normierung überhaupt existiert. Aus der Kontinuitätsgleichung folgern wir weiter, daß S(r, t) eine Wahrscheinlichkeitsstrom-Dichte beschreibt. Dabei überzeugt man sich leicht, daß S(r, t) — wie es für physikalisch interpretierbare Größen sein muss — tatsächlich reell ist, denn es gilt nach (44) S(r, t) = Re[ 16 h̄ ∗ ψ ∇ψ]. im (45) Wir können uns die zeitliche Entwicklung der Wahrscheinlichkeitsverteilung also bildhaft als Strömung einer Flüssigkeit vorstellen. Diese Strömung besitzt weder Quellen noch Senken, und das garantiert die Erhaltung der Normierung. Wenn wir unsere Beobachtung an hinreichend vielen (N → ∞) unabhängigen Teilchen durchführen, erwarten wir aufgrund der Definition der Wahrscheinlichkeit im Abschnitt 1.6 (vgl. Gleichung (20)) im Volumenelement d3 r n(r, t) d3 r = N p(r, t) d3 r = N ψ ∗ (r, t)ψ(r, t) d3 r (46) Teilchen anzutreffen. n(r, t) wird dabei als Teilchendichte bezeichnet. Entsprechend wird dann h̄N ∗ {ψ ∇ψ − ψ∇ψ ∗ } 2im j(r, t) = N S(r, t) = (47) die Teilchenstrom–Dichte und die Kontinuitätsgleichung erhält die vertraute Form ∂n + div j = 0. (48) ∂t Ebenso kann man durch %m = mn(r, t) und %e = en(r, t) (49) eine Massendichte %m und eine elektrische Ladungsdichte %e einführen. Diesen Dichten entspricht dann die Massenstromdichte bzw. elektrische Stromdichte jm = mj bzw. je = ej, (50) und es gelten entsprechende Kontinuitätsgleichungen ∂%m,e + div jm,e = 0. ∂t (51) Um die Anschrift solcher Größen noch bequemer zu gestalten, kann man die entsprechenden Faktoren N, m bzw. e natürlich auch direkt in die Wellenfunktion aufnehmen. So ist es insbesondere weit verbreitet, statt mit ψ direkt mit Ψ(r, t) = √ mit der Normierung 17 N ψ(r, t) (52) Z ΨΨ∗ d3 r = N (53) zu arbeiten. Dann erhält man die Teilchendichte n(r, t) = Ψ∗ Ψ (54) h̄ {Ψ∗ ∇Ψ − Ψ∇Ψ∗ } . 2im (55) und die Teilchenstrom–Dichte j(r, t) = Wegen dieser trivialen Umrechnungen werden wir uns — wie viele Lehrbücher — im folgenden auch gelegentlich einer bequemen, weniger präzisen Ausdrucksweise h̄ bedienen und ψ ∗ ψ kurz als Teilchendichte und S = 2im (ψ ∗ ∇ψ − ψ∇ψ ∗ ) kurz als Stromdichte bezeichnen. Wichtig ist dabei lediglich, daß wir uns der präzisen Bedeutung bewußt bleiben: Die Interpretation einer Teilchen– und einer Stromdichte setzt viele unabhängige Teilchen voraus. Wir sollten uns daher hüten, uns ein einzelnes Teilchen – etwa das Elektron im H–Atom – als ausgeschmierte Wolke mit einer Dichteverteilung, die durch ψ ∗ ψ beschrieben wird, vorzustellen. Diese grundfalsche Vorstellung wird leider in manchen Schulbüchern der Physik durch entsprechende Bilder suggestiv unterstützt. 2.4 Erwartungswerte und Operatoren Während wir die Dynamik klassischer Systeme deterministisch beschreiben, müssen wir uns in der Quantenmechanik mit einer Angabe der Wahrscheinlichkeitsverteilung begnügen. Wir können daher nicht mehr den Zahlwert dynamischer Variablen präzise angeben. Um trotzdem die Terminologie und anschauliche Vorstellung soweit wie möglich beibehalten zu können, vergleichen wir den klassischen Wert einer Variablen f mit ihrem quantenmechanischen Erwartungswert f¯ oder hf i. Darunter verstehen wir den in Gl. (34) definierten Mittelwert f¯ = hf i = Z ψ ∗ (r, t)f (r)ψ(r, t)d3r. Nun sind dynamische Variable aber im allgemeinem nicht allein Funktionen des Ortes, sondern Funktionen von Ort und Impuls (Beispiel: E = p2 /2m + V (r)). Wie definieren oder berechnen wir sinnvoll den Erwartungswert des Impulses? Für freie Teilchen mit vorgegebenem Impuls p hatten wir den Zusammenhang p = h̄k zwischen Impuls und Wellenzahl postuliert. Aus der Anschrift 18 ei(k·r−ωt) einer ebenen Welle erhalten wir die Wellenzahl durch Gradientenbildung, −i∇ → k. Dem entspricht das (rückwärts gelesene) Ersetzungsschema h̄ ∇→p i (56) von Gl. (41). Wir können die beiden Pfeilrichtungen in (41) und (56) zu einer Äquivalenz zusammenfassen, indem wir den Impulsoperator p̂ = h̄ ∇ i (57) einführen. Damit liegt es nahe, den Erwartungswert des Impulses durch p̄ = hp̂i = Z h̄ Z ∗ ψ ∇ψd3 r ψ p̂ψd r = i ∗ 3 (58) anzugeben. Für eine ebene Welle4 ∼ ei(k·r−ωt) mit scharf definiertem Impuls p = h̄k stimmt dieser Erwartungswert nach Konstruktion mit dem Impuls überein. Allgemein stellen wir uns vor, daß wir durch die Differentiation in (58) die Impulse bilden, die bestimmten Anteilen der Wellenfunktion entsprechen, und anschließend durch die Integration entsprechend gewichten5 . Zur Stützung dieser Argumentation zeigen wir, daß Gl. (58) tatsächlich eine reelle Größe definiert. Mit p̄∗ = − h̄ Z ψ∇ψ ∗ d3 r i (59) (ψ ∗ ∇ψ + ψ∇ψ ∗ )d3 r (60) folgt nämlich ∗ p̄ − p̄ = ih̄ = ih̄ Z Z ∇(ψ ∗ ψ)d3 r = 0. Ausgehend von (57) können wir auch einen Operator p̂2 = −h̄2 ∇2 = −h̄2 ∆ 4 Auf die Frage der Normierung ebener Wellen gehen wir später ein. Im Augenblick denken wir an fast unendlich ausgedehnte Wellenpakete mit fast scharf definiertem Impuls. 5 Eine saubere Begründung läßt sich über eine Fouriertransformation der Wellenfunktion gewinnen. Wir verzichten jedoch darauf. 19 bilden. Auch er führt zu reellen Erwartungswerten, denn es gilt ∗ p¯2 − p¯2 = −h̄2 = −h̄ 2 Z Z (ψ ∗ ∆ψ − ψ∆ψ ∗ )d3 r ∇ · {ψ ∗ ∇ψ − ψ∇ψ ∗ }d3 r = 0 (vgl. Rechnung zu Gl.(44) oder den Greenschen Satz6 ). Damit können wir insbesondere den Hamiltonoperator Ĥ = p̂2 h̄2 ∆ + V (r) = − + V (r) 2m 2m (61) bilden. Allgemeiner läßt sich zeigen, daß nicht nur p̂ und p̂2 sondern alle Potenzen p̂n zu reellen Erwartungswerten führen. Das ist kein Zufall, sondern es beruht darauf, daß der Operator p̂ selbstadjungiert oder hermitesch ist7 . Über die Potenzreihe läßt sich diese Eigenschaft schließlich auf alle analytischen Funktionen g(p̂) übertragen. Generell verstehen wir unter einem Operator  eine mathematische Vorschrift, die aus einer (Wellen–)Funktion ψ eine andere Funktion ϕ erzeugt: ϕ(r, t) = Âψ(r, t). Eine triviale Operation in diesem Sinne ist die Multiplikation mit einer Funktion f (r). Ist f (r) reell, so erhalten wir reelle Erwartungswerte f¯, und f repräsentiert einen hermiteschen Operator fˆ. Insbesondere der Ortsoperator r̂ = r selbst ist hermitesch. Korrespondierend zu irgendwelchen dynamischen Variablen A(r, p) der klassischen Mechanik können wir nun quantenmechanische Operatoren  = A(r, p̂) (62) bilden, die nach den selben Rechenregeln gebildet werden (Korrespondenzprinzip). Als Beispiel erwähnen wir den Drehimpulsoperator l̂ = r × p̂ = h̄ r × ∇. i Den quantenmechanischen Operatoren ordnen wir Erwartungswerte 6 H (u∆v − v∆u)d3 r = ∂V (u∇v − v∇u)d2 S 7 Man beachte, daß ∇ ohne den Vorfaktor i (vgl. (57)) diese Eigenschaft nicht besitzt! R V 20 (63) Ā = hÂi = Z ψ ∗ Âψd3 r (64) zu, die in gewisser Weise den Zahlwert der klassischen Variable A repräsentieren. Dieses allgemeine Konzept macht allerdings nur Sinn, wenn Ā immer reell ist. Und Operatoren, die diese Bedingung für alle Wellenfunktionen ψ erfüllen, heißen hermitesch. Diese Eigenschaft besitzen zwar alle reellen fˆ = f (r) und ĝ = g(p̂), aber leider nicht beliebige Funktionen8 der Form (62). Ob das nach (61) gebildete  hermitesch wird, kann darüber hinaus von der Koordinatenwahl abhängen. Hier liegt der tiefere Grund dafür, daß wir beim Übergang zur Quantemechanik im allgemeinen keinen Gebrauch von generalisierte Koordinaten machen. Wir schränken unser Konzept der Operatoren also wie folgt ein: Ausgehend von dynamischen Variablen A(r, p) oder Observablen der klassischen Mechanik bilden wir korrespondierende quantenmechanische Operatoren  nach Gl.(62), sofern diese Operatoren zu reellen Erwartungswerten (64) führen (also sofern die Operatoren hermitesch sind). Das ist insbesondere für – alle reellen Funktionen f (r) – alle reellen Funktionen g(p̂) – den Hamiltonoperator H = p̂2 /2m + V (r) (vgl. (61)) und – den Drehimpulsoperator l̂ = r × p̂ (vgl. (63)) erfüllt. Nachdem wir hiermit grundsätzlich (und vorläufig) erklärt haben, was wir unter Operatoren und ihren Erwartungswerten verstehen, werden wir im folgenden auch die Kennzeichnung von Operatoren durch das Dach ˆ weglassen und beispielsweise unter p = −ih̄∇ einen Operator und unter p̄ = hpi seinen Erwartungswert verstehen. Um die Anschrift noch bequemer zu gestalten, führen wir die abkürzende Schreibweise Z ϕ∗ (r, t)χ(r, t)d3 r = hϕ|χi (65) ein. Offenbar gilt dann hχ|ϕi = hϕ|χi∗ . 8 (66) Es gilt beispielsweise für das äußere Produkt (63), nicht aber für das innere Produkt r · p. Das innere Produkt hermitescher Operatoren ist nur hermitesch, wenn die Operatoren vertauschbar sind. 21 Die Schreibweise soll einmal an die Verwendung von eckigen Klammern zur Kennzeichnung von Mittelwerten erinnern. Gleichzeitig aber lehnt sie sich an die (veraltete) Schreibweise (a, b) für das innere Produkt a · b von Vektoren an. Die (quadratintegrablen) Funktionen |ϕi = ϕ(r, t) spannen nämlich in der Tat einen linearen Raum H, den Hilbertraum, auf, in dem durch (65) ein Skalarprodukt definiert werden kann. Die Dimension von H ist abzählbar unendlich. Die Schreibweise (65) geht auf Dirac zurück. Er prägte – ausgehend von einer Aufspaltung des Wortes “bracket” – auch die Bezeichnungen bra–Vektor für hϕ| und ket–Vektor für |χi. Damit unterscheidet er den Hilbertraum H von seinem Dualraum H+ , der von den bra–Vektoren aufgespannt wird. Mit der neuen Schreibweise erhalten Erwartungswerte die suggestive Form hAi = hψ|A|ψi oder hψ|Aψi (67) Repräsentiert A eine physikalische Observable, so muß hAi immer reell oder A hermitesch sein. Setzt man ψ = χ + λϕ, so folgt aus (67) hAi = hχ|A|χi + λhχ|Aϕi + λ∗ hϕ|Aχi + |λ|2 hϕ|A|ϕi Ist A hermitesch, so sind die linke Seite sowie der erste und letzte Term der rechten Seite reell. Also muß auch λhχ|Aϕi + λ∗ hϕ|Aχi = λhχ|Aϕi + λ∗ hAχ|ϕi∗ reell sein. Das kann aber nur für beliebige λ stimmen, wenn hχ|Aϕi = hAχ|ϕi (68) gilt. Umgekehrt garantiert (68) wegen (66) auch sofort reelle Erwartungswerte. Es ist daher üblich, hermitesche Operatoren durch die Beziehung (68) zu definieren. Wir erwähnen dies nicht allein der Vollständigkeit halber, sondern weil wir gelegentlich von der bequemen “Schieberegel” (68) für hermitesche Operatoren Gebrauch machen möchten. 2.5 Das Theorem von Ehrenfest Wir fragen nach der Bewegung des Schwerpunkts eines Wellenpaketes (Vorsicht!) oder präziser nach der zeitlichen Entwicklung des Erwartungwertes r̄(t) bzw. seiner x–Komponente 22 x̄ = hψ|x|ψi = Z ψ ∗ xψd3 r Unter Benutzung der Schrödingergleichung erhalten wir dx̄ = dt Z 1 −h̄2 ∂ψ ∂ψ ∗ + xψ d3 r = ψ x ∂t ∂t ih̄ 2m ! ∗ Z (ψ ∗ x∆ψ − ∆ψ ∗ xψ) d3 r h̄ Z −h̄ Z ∗ ∗ 3 = ∇ · {ψ x∇ψ − ∇ψ xψ}d r + {∇(ψ ∗ x) · ∇ψ − ∇ψ ∗ · ∇(xψ)}d3 r 2im 2im Das erste Integral verschwindet nach dem Gaußschen Satz, im zweiten Integral differenzieren wir die Klammern ( ) aus. Mit (58)–(60) folgt dann Z h̄ dx̄ = ex · (ψ ∗ ∇ψ − ψ∇ψ ∗ )d3 r dt 2im = 1 p̄x 1 ex · (p̄ + p̄∗ ) = ex · p̄ = . 2m m m Eine entsprechende Beziehung erhält man natürlich auch für die übrigen Komponenten, es gilt also 1 d hri = hpi. dt m (69) Diese “klassische” Beziehung zwischen den Erwartungswerten r und p bestätigt eindrucksvoll das Konzept des Impulsoperators aus dem vorigen Abschnitt. Die entsprechende Beziehung für dp̄/dt, die wir nun schon ahnen, ergibt sich fast noch einfacher: Aus [vgl. (58)] p̄x = hψ|px |ψi = h̄ Z ∗ ∂ψ 3 ψ dr i ∂x berechnen wir mit der Schrödingergleichung [vgl. (42) und (43)] h̄ dp̄x = dt i h̄ 1 h̄2 Z = − i ih̄ 2m ( Z ∂ ∂ψ ∂ψ ∗ ∂ψ 3 dr + ψ ∂x ∂t ∂t ∂x ! ∗ ! Z ∂ψ ∗ ∂ψ 3 − ∆ψ ψ ∆ d r+ ∂x ∂x ∗ 23 ! ∂ψ 3 ∂ V ψ − ψ∗V ψ dr ∂x ∂x ∗ ) . Das erste Integral verschwindet nach dem Greenschen Satz [vgl. die ähnliche Rechnung vor (61)], im zweiten differenzieren wir aus und erhalten 1 dp̄x = 2 dt i Z ψ∗ ∂V ∂V ψd3 r = − ∂x ∂x oder verallgemeinert auf alle Impulskomponenten d hpi = −h∇V (r)i. dt (70) Damit lassen sich die klassischen Beziehungen ṙ = p/m und ṗ = −∇V für ein Teilchen im konservativem Kraftfeld also in eindrucksvoll enger Analogie auf die quantenmechanischen Erwartungswerte übertragen. Diese Form der Korrespondenz zwischen klassischer– und Quantenmechanik wird als Theorem von Ehrenfest (1927) bezeichnet. Trotz der engen Analogie besteht ein wichtiger Unterschied zur klassischen Bewegungsgleichung eines Teilchens. Wenn wir nämlich versuchsweise hri mit dem Teilchenort r identifizieren, erhalten wir klassisch mhr̈i = −∇V (hri). Dies ist aber im allgemeinem verschieden von der quantenmechanischen Beziehung mhr̈i = −h∇V (r)i, (71) die aus (69) und (70) folgt. Im Gegensatz zum klassischen Teilchen tastet das “quantenmechanische Teilchen” also das Potential der gesamten Nachbarschaft ab (Feynman). Auf der anderen Seite ist (71) aber identisch mit der Newtonschen Bewegungsgleichung für den Schwerpunkt eines klassischen Viel–Teilchen–Systems, wenn man unter h i die gewichtete Summation über alle Massenpunkte versteht. Hierdurch erhält das anschauliche Bild einer ausgeschmierten Wolke der Dichte ψ ∗ ψ, die ein “quantenmechanisches Teilchen” repräsentiert, eine wesentliche Stütze. (Wir halten trotzdem an der Ablehnung dieses Bildes fest, da es in anderen Punkten völlig versagt!) 24 Abschließend sei darauf hingewiesen, daß — abgesehen von einfachen Spezialfällen — auch in der klassischen Mechanik der Schwerpunktsatz nicht ausreicht, um die Bewegung des Schwerpunkts eines Systems zu berechnen. 2.6 Die Heisenbergsche Unschärferelation Wir haben bereits mehrfach erwähnt, daß die Quantenmechanik es prinzipiell nicht erlaubt, die nötigen Anfangsbedingungen für eine klassische Beschreibung präzise anzugeben. Dies folgt mathematisch aus der berühmten Unschärferelation, die wir nun herleiten und diskutieren wollen. Wir beginnen mit einer “elementaren” Herleitung für ein eindimensionales Wellenpaket ψ(x). In Anlehnung an das klassische Lehrbuch von Messiah9 bilden wir für λ ∈ R die Hilfsfunktion I(λ) = und rechnen I(λ) = Z 2 ∗ x ψ ψdx + λ Z Z xψ 2 ∂ψ + λ dx ≥ 0 ∂x ∂ψ ∗ x ψ dx + λ2 +ψ ∂x ∂x ! ∗ ∂ψ (72) Z ∂ψ ∗ ∂ψ dx. ∂x ∂x Wenn wir (. . .) = ∂[ψ ∗ ψ]/∂x beachten und die beiden letzten Integrale partiell integrieren, folgt I(λ) = Z ψ ∗ x2 ψdx − λ Z ψ ∗ ψdx − λ2 Z ψ∗ ∂2 ψdx = hx2 i − λ + λ2 hk 2 i, ∂x2 wobei wir den Operator k= 1 ∂ i ∂x (73) eingeführt haben. I(λ) beschreibt eine nach oben geöffnete Parabel, I(λ) ≥ 0 muß insbesondere für den Scheitelpunkt λs gelten. Aus dI/dλ = 0 erhalten wir λs = 1 2hk 2 i und I(λs ) = hx2 i − also 9 A. Messiah, Quantenmechanik, Bd. I, Abschnitt 4.2.2 25 1 1 + ≥ 0, 2 2hk i 4hk 2 i hx2 ihk 2 i ≥ 1 . 4 (74) Damit haben wir die Beziehung (17), die wir an einem Beispiel abgelesen haben, verallgemeinert und präzisiert10 . Das Gleichheitszeichen gilt genau dann, wenn der Integrand in Gl. (72) identisch verschwindet, also für Gaußsche Wellenfunktionen ψ ∼ exp −x2 . 2λ Mit px = h̄k geht (74) in hx2 ihp2x i ≥ h̄2 4 über. Ein Teilchen kann also nicht exakt am Ort x = 0 ruhen (px = 0). Dieser Widerspruch ergibt sich aber auch für jede andere exakt formulierte Anfangsbedingung, denn wir brauchen ja nur x durch ∆x = x − x0 und p durch ∆p = p − p0 zu ersetzen (Wechsel des Bezugssystems). So erhalten wir endlich die Heisenbergsche Unschärferelation h∆x2 ih∆p2x i ≥ h̄2 . 4 (75) Bevor wir die Unschärferelation weiter diskutieren, wollen wir unsere Herleitung auf beliebige Observable A und B verallgemeinern. Das wird uns zugleich einen völlig neuen Geschichtspunkt liefern. In Anlehnung an Gl. (72) bilden wir dazu die Hilfsfunktion I(λ) = Z |Aψ − iλBψ|2 dτ ≥ 0, (76) wobei A und B hermitesche Operatoren repräsentiern und dτ für dx oder d3 r steht. Wenn wir nun dem Rechengang auf der vorigen Seite folgen, haben wir lediglich zu beachten, daß wir die partiellen Integrationen in die Verschiebung hermitescher Operatoren übersetzen müssen. Damit erhalten wir I(λ) = 10 Z ψ ∗ (A + iλB)(A − iλB)ψdτ = hA2 i + λ2 hB 2 i − iλh(AB − BA)i . Der Faktor 1/4 gegenüber Gl.(17) kommt daher, daß wir mit ψ ∗ ψ und nicht mit ψ gewich- ten. 26 Wir bestimmen wieder den Scheitelpunkt λs = i hAB − BAi hB 2 i der Parabel I(λ) und folgern aus I(λs ) ≥ 0 2 2 hA ihB i ≥ 2 AB − BA 2i . Hiermit ist die formale Rechnung schon abgeschlossen. Wie oben können wir A durch ∆A = A − Ā und B durch ∆B = B − B̄ ersetzen und erhalten mit dem Kommutator [A, B] = AB − BA (77) die allgemeine Unschärferelation 2 2 h(∆A) ih(∆B) i ≥ * [A, B] 2i +2 . (78) Sie sagt also beispielsweise aus, daß zwischen x und px deshalb eine Unschärferelation besteht, weil x und px nicht vertauschbar sind. Es gilt nämlich ∂ψ ∂ (xψ) − x =ψ ∂x ∂x " oder # ∂ ∂ ∂ ,x = x−x =1 ∂x ∂x ∂x [px , x] = px x − xpx = also h̄ . i (79) Neben dieser neuen Interpretation haben wir damit eine wesentliche Verallgemeinerung der Unschärferelation erhalten: Eine Unschärferelation besteht zwischen allen Observablen, deren Operatoren nicht vertauschbar sind, und Gl. (78) sagt uns, wie die Unschärferelation in jedem Fall genau aussieht. Ein wichtiges Beispiel hierzu ist die Unschärferelation zwischen den verschiedenen Komponenten des Drehimpulses (vgl. (63)) l = r × p. Mit lx = ypz − zpy 27 und ly = zpx − xpz folgt nämlich [lx , ly ] = lx ly − ly lx = (ypz − zpy )(zpx − xpz ) − (zpx − xpz )(ypz − zpy ) = ypx [pz , z] + xpy [z, pz ] = − (xpy − ypx )[pz , z]. Wegen lz = xpy − ypx und [pz , z] = −ih̄ [vgl. (79)] folgt daraus die wichtige Vertauschungsrelation [lx , ly ] = ih̄lz (80) und natürlich die entsprechenden durch zyklische Vertauschung gewonnenen Relationen. Gemäß Gl.(78) bedeutet das aber, daß die drei Komponenten des Drehimpulses nicht präzise angegeben werden können, denn es besteht die Unschärferelation h∆lx2 ih∆ly2 i ≥ h̄2 hlz i2 , 4 (81) oder — wie wir etwas weniger präzise schreiben können — δlx · δly ≥ h̄ |hlz i|. 2 (82) Wir führen die “unscharfen Werte” eines Observablenpaares also darauf zurück, daß ihre Operatoren “nicht vertauschbar” sind. Das typische Beispiel – und den Ausgangspunkt aller weiterer Rechnungen – liefern die Operatoren x und ∂/∂x mit dem Kommutator " # ∂ , x = 1. ∂x Die entsprechende Unschärfe können wir uns direkt an der Wahrscheinlichkeitsdichte p(x) veranschaulichen: Eine gut lokalisierbare Verteilung (Skizza a) entspricht einem steilen Peak mit großen Gradienten ∂/∂x, während eine flache Verteilung mit kleinen Gradienten (Skizze b) den Ort nur sehr ungenau festlegt: 28 p(x) p(x) b) a) δx δx x x Die Orts–Impuls–Unschärfe ist also die natürlichste Sache der Welt, wenn man akzeptiert, daß der Impuls durch den Gradienten repräsentiert wird. Das aber entspricht gerade der Wellenbeschreibung, die uns von den Interferenzbeobachtungen aufgedrängt wurde. Die Rückführung der Unschärferelation auf die Nicht– Vertauschbarkeit von Operatoren ist damit nur eine abstrakte Formulierung der Unvereinbarkeit von Begriffen, die dem Teilchenbild (Ort) und dem Wellenbild (Wellenzahl) entlehnt sind. Für die physikalische Interpretation ist ein Gedankenexperiment wichtig, das Heisenberg (mit Hilfestellung Bohrs) 1927 angegeben hat: Wir wollen die Ortsbestimmung eines Teilchens (z. B. Elektrons) konkret mit einem Mikroskop durchführen. Dann erhalten wir eine minimale Ortsunschärfe δx ∼ λ , sin ε ε die dem Auflösungsvermögen des Mikroskops entspricht. Dabei ist λ die Wellenlänge des verwendeten Lichts und sin ε die numerische Apertur (d. h. der Sinus des halben Öffnungswinkels). Nun besteht aber das Licht aus Photonen mit einem Impuls p = h̄k = h/λ. Wenn ein Photon von Teilchen gestreut wird — und nur dadurch entsteht ja das 29 Bild im Mikroskop — überträgt es einen Teil seines Impulses (Compton–Effekt). Aufgrund der Streuung erhält das Teilchen nun eine Impulsunschärfe δpx ∼ p sin ε = h sin ε. λ Unsere Kenntnis über das Teilchen ist also durch ein minimales Unschärfeprodukt δx · δpx ∼ h eingeschränkt. Mit diesem Gedankenexperiment lieferte der Positivist Heisenberg im Grunde seinen dem Realismus verschworenen Gegnern hervorragende Munition: Ist es nicht doch so, daß das Teilchen “eigentlich” einen scharfen Ort und scharfen Impuls hat, und daß die Unschärfe “nur” auf der Störung durch die Beobachtung beruht? Diese “Störung” läßt sich allerdings nicht durch eine Re–Interpretation der Meßresultate “wegrechnen”: δpx ist eine wirkliche “Unschärfe”, der übertragene Impuls läßt sich nicht angeben, da die Abbildung im Mikroskop tatsächlich ein divergentes Lichtbündel voraussetzt (worauf Bohr hingewiesen hat). Und da der Impulsübertrag prinzipiell nicht berechenbar ist, ist es für den Physiker wieder prinzipiell unentscheidbar, ob die Positivisten oder die Realisten recht haben: Wir können nur unsere Beobachtung beschreiben. Mir scheint noch ein anderer Aspekt der mikroskopischen Ortsbestimmung wichtig: Wir hatten die Unschärferelation in den bisherigen Diskussionen auf den Welle–Teilchen–Dualismus zurückgeführt. In Heisenbergs Gedankenexperiment spielt der Wellenaspekt des beobachteten Teilchens jedoch nirgendwo eine Rolle. Der Welle–Teilchen–Dualismus wird hier auf das Photon verlagert (Auflösungsvermögen und Wellenlänge einerseits, Comptoneffekt anderseits). Darin liegt erneut eine Bestätigung der Aussage, daß die Quantemechanik nicht ein Teilchen an sich sondern die prinzipielle Möglichkeit seiner Beobachtung beschreibt. Später (im Abschnitt 5.6) werden wir sogar sehen, daß die Unschärfe auch bei einer völlig störungsfreien Messung unvermeidlich ist. Wenn wir noch einmal auf die Begründung der Unschärfe durch den Welle– Teilchen–Dualismus zurückkommen, so gilt in völliger Analogie zur Unschärfe δx · δk ≥ 1/2 eine Unschärfe δt · δω ≥ 1/2. Mit h̄ω = E folgt daraus die Energie– Zeit–Unschärfe δE · δt ≥ 30 h̄ . 2 (83) Wir wollen uns das direkt an der Wellenfunktion veranschaulichen: Ist die Energie E und damit ω = E/h̄ präzise vorgegeben, haben wir eine Wellenfunktion ψ(r, t) = ϕ(r)e−iωt . Ihre ”Zeitabhängigkeit” e−iωt ist nicht beobachtbar, denn die Aufenthaltswahrscheinlichkeit ψ ∗ (r, t)ψ(r, t) = |ϕ(r)|2 hängt gar nicht von der Zeit ab. Die Wellenfunktion, die der präzisen Vorgabe der Energie (δE = 0) entspricht, beschreibt also einen stationären Zustand, der unendlich lange dauert (δt = ∞). Zur Zeitabhängigkeit eines Zustandes mit unscharfer Energie betrachten wir eine Wellenfunktion ψ(r, t) = ϕ1 (r)e−iω1 t + ϕ2 (r)e−iω2 t und rechnen n ψ ∗ ψ = |ϕ1 |2 + |ϕ2 |2 + 2Re ϕ∗1 ϕ2 ei(ω1 −ω2 )t o Der letzte Term zeigt also eine zeitliche Schwebung mit der Periodendauer τ = 2π h = . |ω1 − ω2 | |E1 − E2 | Um die Energiedifferenz ∆E = |E1 − E2 | aufzulösen (d. h. um die Schwebung zu beobchten), muß man also die Messung mindestens über Zeiten ∆t ∼ τ = h/∆E ausdehnen. Alternativ können wir die Energie–Zeit–Unschärfe erhalten, indem wir die Ortsunschärfe mit Hilfe der Geschwindigkeit auf den Zeitpunkt der Beobachtungung übertragen: Wir fragen etwa, wann ein Teilchen die Marke x = x0 passiert und schätzen ab δt = δt m δx = δx v p =⇒ h̄ p δp = δxδp ≥ . m 2 Mit pδp/m = δ(p2 /2m) = δE folgt daraus (83). 31 Wenn diese Diskussion auch die völlige Analogie der Energie–Zeit– und Orts– Impuls–Unschärferelation deutlich gemacht hat, so kommt diesen Relationen doch eine ganz unterschiedliche Rolle im Rahmen der formalen Theorie zu: Ort x und Impuls p sind (gleichberechtigte11 ) Observable, die in der Theorie durch Operatoren repräsentiert werden. Die Unschärfe beruht darauf, daß der Orts– und der Impulsoperator nicht vertauschbar sind. Dagegen wird die Zeit t in der Quantenmechanik nicht durch einen Operator repräsentiert sondern spielt die Rolle eines Parameters. Diese Unsymmetrie, die auch vom Gesichtspunkt der Relativität als Defizit erscheint, hat Schrödinger bei der Aufstellung der Wellengleichung vergeblich zu vermeiden versucht. 11 Auch das “Ungleichgewicht” p ∼ d/dx läßt sich durch einen Wechsel der “Darstellung” beseitigen: In der “Impulsdarstellung” (Fouriertransformation) gilt x ∼ d/dp. 32 3 Spezielle Lösungen der Schrödingergleichung Die Schrödingergleichung ist eine partielle Differentialgleichung, die nicht allgemein in geschlossener Form gelöst werden kann. Wenn wir uns in diesem Kapitel mit ihrer Lösung für einige ausgewählte Probleme befassen, so wollen wir damit in erster Linie generelle Zusammenhänge aufzeigen oder verdeutlichen. Gleichzeitig lernen wir so einige Lösungsmethoden und wichtige “Schulbeispiele” kennen, ohne dabei jedoch “Vollständigkeit” anzustreben. 3.1 Entwicklung nach Eigenfunktionen des Hamiltonoperators Wir setzen voraus, daß die Hamiltonfunktion nicht explizit von der Zeit abhängt, so daß klassisch der Energiesatz H(x, p) = E gilt. Dann können wir nach partikulären Lösungen der Schrödingergleichung fragen, die dem Separationsansatz ψ(r, t) = g(t)ϕ(r) (84) genügen. Mit h̄2 ∂ψ = Hψ = − ∆ψ + V (r)ψ ih̄ ∂t 2m folgt ih̄ϕ(r) dg = g(t)Hϕ(r) dt oder ih̄ dg 1 = Hϕ. g dt ϕ Nun hängt die linke Seite nur von t, die rechte nur von r ab. Also sind beide gleich einer Konstanten Eν . Dabei soll der Index ν andeuten, daß wir im allgemeinen nur für bestimmte Werte von E sinnvolle Lösungen finden werden. Die Abhängigkeit der Lösung von dieser Konstanten kennzeichnen wir ebenfalls durch den Index ν und erhalten dgν /dt = −iEν /h̄gν oder gν (t) = e−i 33 Eν h̄ t . (85) gν ist also — wie nicht anders zu erwarten — der zeitabhängige Phasenfaktor, der im Wellenbild die vorgegebene Energie Eν repräsentiert. Die zugehörige Ortsfunktion ϕν (r) ist Lösung der stationären Schrödingergleichung " h̄2 − ∆ + V (r) ϕν (r) = Eν ϕν (r) 2m # oder H|ϕν i = Eν |ϕν i. (86) Gl. (86) ist vom Typ eines Eigenwertproblems, wir nennen Eν einen Eigenwert und ϕν (r) eine Eigenfunktion (bzw. |ϕν i einen Eigenvektor) des Hamiltonoperators. Im Hinblick auf eine mögliche Entwicklung der allgemeinen Lösung nach solchen Eigenfunktionen wollen wir zeigen, daß die Eigenfunktionen zu verschiedenen Eigenwerten orthogonal sind. Dazu gehen wir von der Schrödingergleichung h̄ ∆ϕ = [V (r) − E]ϕ 2m aus und bilden12 unter Verwendung des Greenschen Satzes [vgl. die Rechnung zu Gl. (61)] 0 = = h̄2 Z (ϕν ∆ϕµ − ϕµ ∆ϕν )d3 r 2m Z Z (ϕν V ϕµ − ϕµ V ϕν )d3 r − = (Eν − Eµ ) Z ϕν (Eµ − Eν )ϕν d3 r ϕν ϕµ d3 r = (Eν − Eµ )hϕν |ϕµ i, also hϕν |ϕµ i = 0 f ür Eν 6= Eµ . (87) Der Greensche Satz (die partielle Integration), auf dem unser Beweis beruht, drückt im Grunde nur aus, daß der Hamiltonoperator hermitesch ist. Tatsächlich erhalten wir direkt aus der Eigenwertgleichung (86) eines beliebigen hermiteschen Operators H unter Ausnutzung der “Schieberegel” (68) 0 = hHϕν |ϕµ i − hϕν |Hϕµ i = (Eν∗ − Eµ )hϕν |ϕµ i. Diese kurze, elegante Rechnung zeigt 12 Im Gegensatz zur zeitabhängigen Schrödingergleichung ist die stationäre Schrödingergleichung nicht komplex und wir können reelle Eigenfunktionen wählen. 34 1. für ν = µ, daß alle Eigenwerte hermitescher Operatoren reell sind und 2. für ν 6= µ, daß Eigenfunktionen zu verschiedenen Eigenwerten hermitescher Operatoren orthogonal sind. Die Entwicklung nach den Eigenfunktionen des Hamiltonoperators, die wir hier besprechen wollen, stellt tatsächlich nur einen Spezialfall der allgemeineren Entwicklung nach den Eigenfunktionen irgendeines hermiteschen Operators dar. Wir werden hierauf bei Bedarf zurückkommen, gehen aber nun nicht weiter darauf ein. Wegen der Linearität der Schrödingergleichung sind beliebige Linearkombinationen unserer partikulären Lösungen gν (t)ϕν (r) ebenfalls Lösungen. Wir können nun umgekehrt fragen, ob jede Lösung ψ(r, t) der Schrödingergleichung in der Form ψ(r, t) = X cν e−i Eν h̄ t ϕν (r) (88) ν nach den Eigenfunktionen ϕν (r) des Hamiltonoperators entwickelt werden kann. Dies ist die Frage nach der Vollständigkeit13 des Funktionssystems {ϕν }. Die Vollständigkeit ist mathematisch meistens schwierig nachzuweisen, tatsächlich aber nur in “pathologischen” Fällen verletzt — vorausgesetzt, man hat tatsächlich alle Eigenwerte und die entsprechenden Eigenfunktionen gefunden. Wir werden daher die Vollständigkeit stets voraussetzen und davon ausgehen, daß die Entwicklung (88) immer möglich ist. Aus der Orthogonalität folgt darüber hinaus, daß die Entwicklung sogar eindeutig und sehr einfach zu berechnen ist. Wir können die Eigenfunktionen nämlich so normieren, daß hϕν |ϕµ i = δνµ (89) gilt. Schreiben wir (88) nun in der Form |ψt=0 i = X µ cµ |ϕµ i und multiplizieren mit hϕν |, so folgt wegen (89) 13 Zur Veranschaulichung nicht vollständiger Systeme denke man an eine “Basis” aus m Vektoren im n-dimensionalen Vektorraum (m < n) oder an Potenzreihen, in denen bestimmte Potenzen nicht erlaubt sind. 35 cν = hϕν |ψt=0 i = Z (90) ϕ∗ν (r)ψ(r, 0)d3 r. Wir wollen diesen formalen Abschnitt mit dem Hinweis auf zwei Schwierigkeiten abschließen: Wir haben bisher stillschweigend vorausgesetzt, daß die Eigenwerte Eν und Eµ für ν 6= µ tatsächlich verschieden sind, oder anders ausgedrückt, daß zu einem Eigenwert nicht mehrere linear unabhängige Eigenfunktionen existieren. Wenn das nicht erfüllt ist, spricht man von Entartung: Der Eigenwert Eν heißt k–fach entartet, wenn k linear unabhängige Eigenfunktionen zu Eν existieren. Die formale Schwierigkeit der Entartung liegt darin, daß entartete Eigenfunktionen nicht mehr automatisch orthogonal untereinander sind. Man kann jedoch stets orthogonale Eigenfunktionen finden und damit die Gültigkeit von (89) und (90) sicherstellen. Eine zweite stillschweigende Voraussetzung ging davon aus, daß wir nur diskrete Eigenwerte Eν haben. Auch das ist nicht immer erfüllt, im Gegenteil, das “Spektrum” möglicher Eigenwerte weist typischerweise einen diskreten und einen kontinuierlichen Anteil auf. Die entsprechende Interpretation von Gl. (88) liegt auf der Hand: Wir ersetzen die Summation im kontinuierlichen Anteil durch eine Integration: ψ(r, t) = Z X cν e− Eν t h̄ ϕν (r)dν. (91) Was aber sollen wir in Gl. (89) unter dem Kroneckersymbol δνµ im kontinuierlichen Teil des Spektrums verstehen? Durch geeignete Grenzübergänge läßt sich erreichen, daß man die kontinuierlichen Eigenfunktionen durch hϕν |ϕµ i = δ(ν − µ) (92) “normieren” kann. Die Singularität der δ–Funktion für ν = µ deutet aber schon an, daß wir hier eigentlich vor einer ernsteren Schwierigkeit stehen: Unsere Eigenfunktionen sind nicht mehr im üblichen Sinn normierbar und wir verlassen den Hilbertraum. Wir werden diese Schwierigkeit nicht systematisch mit mathematischen Mitteln beheben. Wir werden aber notgedrungen bei kontinuierlichen Spektren mit ihr konfrontiert und werden sie dort intuitiv durch die physikalische Interpretation entschärfen. 36 3.2 Der harmonische Oszillator Wir beginnen mit einem einfachen, wegen seiner grundlegenden Bedeutung für zahlreiche physikalische Modelle aber besonders wichtigen Schulbeispiel und untersuchen den eindimensionalen harmonischen Oszillator mit der Hamiltonfunktion H= kF 2 p2 mω 2 2 p2 + x = + x , 2m 2 2m 2 (93) wobei kF die Federkonstante und ω = (kF /m)1/2 die klassische Frequenz bezeichnet. Die stationäre Schrödingergleichung Hϕ = Eϕ lautet dann mω 2 2 h̄2 d2 ϕ + x − E ϕ = 0. − 2m dx2 2 ! (94) Die lästigen Vorfaktoren können wir durch eine Transformation x = x0 ξ (95) auf eine dimensionslose Ortskoordinate ξ wegschaffen: h̄2 d2 ϕ mω 2 x20 2 ξ ϕ = 0. + Eϕ − 2mx20 dξ 2 2 Wählen wir nun h̄2 = mω 2 x20 mx20 oder x20 = h̄ , mω (96) so folgt h̄ω d2 ϕ h̄ω 2 + E− ξ ϕ = 0. 2 2 dξ 2 ! Gehen wir schließlich noch durch E=λ h̄ω 2 (97) zu einem dimensionslosen Energiewert λ über, so erhält die Schrödingergleichung des harmonischen Oszillators die übersichtliche Gestalt 37 d2 hϕ = ξ − 2 ϕ = λϕ. dξ ! 2 (98) Bevor wir dieses Eigenwertproblem explizit lösen, merken wir an, daß alle Eigenwerte positiv sind. Für λ ≤ 0 wäre nämlich ϕ00 immer ≥ 0, ϕ also konvex zur x–Achse: ϕ ϕ ϕ ξ ξ ξ Eine solche Wellenfunktion ist aber sicher nicht normierbar. Der formale Beweis folgt aus der kleinen Rechnung Z 2 2 (λ − ξ )ϕ dξ = − Z 00 ϕϕ dξ = + Z ϕ02 dξ > 0, die zeigt, daß der Integrand links nicht negativ definit sein kann. Daß negative λ ausgeschlossen sind, entspricht auch unserer klassischen Erwartung. Denn E = p2 /2m+kx2 /2 ist nach Konstruktion immer ≥ 0. Darüber hinaus verbietet die Quantenmechanik aber auch E = 0 (warum?). Für λ > 0 erhalten wir ein Intervall ξ 2 < λ, in dem ϕ(ξ) konkav zur Achse ist. Damit können wir uns normierbare Wellenfunktionen für bestimmte Werte von λ vorstellen. Dies wird durch die numerischen Ergebnisse auf der folgenden Seite bestätigt: Integrieren wir Gl. (98) für wachsende λ > 0, so erhalten wir für λ = 1 genau den zentralen konkaven Bogen, der notwendig ist, um die konvexen Flanken zu verbinden. Für größere λ finden wir weitere akzeptable Lösungen mit Nullstellen im konkaven Bereich. Aus der Diskussion dieser Ergebnisse erwarten wir im Einklang mit systematischen Überlegung ein diskretes Spektrum 0 < λ 0 < λ1 < λ2 < . . . , wobei die Eigenfunktion ϕn (ξ) zu λn genau n Nullstellen hat. 38 Numerische Lösungen von Gl. (98) für verschiedene λ. Im Bereich ξ 2 < λ ist y konkav zur Achse, außerhalb konvex. Die Rechnungen gehen von der Randbedingung ϕ(−∞) = 0 aus. Wenn auch ϕ(+∞) = 0 wird, ist λ Eigenwert. Nach diesen Vorüberlegungen wollen die Eigenwerte und Eigenfunktionen systematisch konstruieren. Dazu nehmen wir an, die Funktion y(ξ) erfülle bereits die Gleichung (98) y 00 = (ξ 2 − λ)y mit den erforderlichen Randbedingungen y(−∞) = y(∞) = 0, sei also (nicht normierte) Eigenfunktion zum Eigenwert λ. Dann bilden wir die Hilfsfunktion ! d y = ξy − y 0 . ŷ = ξ − dξ Offenbar “erbt” ŷ die Randbedingungen von y. Um zu sehen, welche Differentialgleichung ŷ erfüllt, rechnen wir 39 ŷ 0 = y + ξy 0 − y 00 = ξy 0 + (λ + 1 − ξ 2 )y und ŷ 00 = ξy 00 + y 0 + (λ + 1 − ξ 2 )y 0 − 2ξy = (λ + 2 − ξ 2 )y 0 − 2ξy + ξ(ξ 2 − λ)y = (λ + 2 − ξ 2 )(y 0 − ξy) = (ξ 2 − λ − 2)ŷ. Ist also y(ξ) Eigenfunktion zum Eigenwert λ, so ist ŷ(ξ) Eigenfunktion zum Eigenwert λ + 2. Mit dem Operator A− = ξ − d dξ (99) können wir uns also ausgehend von einer Eigenfunktion ym (ξ) zum Eigenwertλm durch die Rekursion 0 yn+1 = A− yn = ξyn − yn , λn+1 = λn + 2 (100) eine unendliche Folge von Eigenfunktionen yn und Eigenwerten λn mit n > m konstruieren. Die definitive Übersicht über alle Eigenfunktionen und insbesondere die Startlösung y0 erhalten wir, wenn wir neben A− auch den “adjungierten” Operator (vgl. S. 41) d A+ = ξ + (101) dξ definieren. Er führt — bis auf einen unwesentlichen Faktor (s. u.) — von yn auf yn−1 , also von λn auf λn −2. Um das zu sehen, kann man die obige Rechnung mit geändertem Vorzeichen wiederholen. Eleganter und wesentlich informativer ist es jedoch, das Produkt A+ A− = ξ 2 + 1 − d2 =1+h dξ 2 (102) zu bilden. Wenden wir diese Operatorgleichung auf yn an und berücksichtigen A− yn = yn+1 , λn+1 = λn + 2 sowie hyn = λn yn , so folgt A+ yn+1 = A+ A− yn = (1 + h)yn = (λn + 1)yn yn−1 = 1 λn−1 + 1 A+ yn = 40 1 A+ yn . λn − 1 oder (103) Und nun kommt der entscheidende Punkt: Mit Gl. (103) können wir uns ausgehend von einem beliebigen Eigenwert auf unserer “Leiter” “herunterhangeln” und immer kleinere Eigenwerte erzeugen. Da aber alle Eigenwerte positiv sein müssen, muß die Leiter (103) auf einer “untersten Sprosse” y0 enden — oder anders ausgedrückt: A+ y0 muß verschwinden. Daraus folgt die Differentialgleichung y00 = −ξy0 mit der (abgesehen von der Normierung) eindeutigen Lösung y0 = e−ξ 2 /2 . Durch Einsetzen in (98) erhalten wir den zugehörigen Eigenwert λ0 = 1. Damit können wir alle Eigenfunktionen und Eigenwerte explizit angeben: λn = 2n + 1 oder 1 En = (n + )h̄ω 2 (104) und 2 y0 = e−ξ /2 2 y1 = ξy0 − y00 = 2ξe−ξ /2 y2 = ξy1 − y10 = (4ξ 2 − 2)e−ξ .. . yn+1 = ξyn − yn0 . 2 /2 (105) Durch Induktion verifiziert man leicht, daß alle Eigenfunktionen die Form yn (ξ) = Hn (ξ)e−ξ 2 /2 (106) haben, wobei Hn (ξ) ein Polynom n-ten Grades in ξ (das Hermitesche Polynom) ist. yn hat entsprechend unserer Vorüberlegung genau n Nullstellen. Um nach den yn entwickeln zu können, müssen wir noch ihre Normierung berechnen. Die nötige Vorarbeit dazu haben wir bereits geleistet, es ist nämlich hyn |yn i = hA− yn−1 |A− yn−1 i = hyn−1 |A+ A− |yn−1 i. Der letzte Schritt besagt, daß A+ zu A− “adjungiert” ist und folgt aus der partiellen Integration Z Z dyn−1 dyn yn dξ = − yn−1 dξ. dξ dξ 41 Berücksichtigen wir nun noch A+ A− = 1+h (vgl. (102)) und hyn−1 = λn−1 yn−1 = (2n − 1)yn−1 , so erhalten wir hyn |yn i = 2nhyn−1 |yn−1 i oder hyn |yn i = 2n n!hy0 |y0 i. Mit dem Grundintegral hy0 |y0 i = Z 2 e−ξ dξ = √ π folgt schließlich explizit √ hyn |yn i = 2n n! π. (107) Wenn wir es wünschen, können wir damit auch normierte Eigenfunktionen ϕn (ξ) = √ 1 2n n!π 1/2 yn (ξ) (108) bilden, für die hϕn |ϕm i = δnm gilt. Die Eigenwerte und Eigenfunktionen sind in der folgenden Abbildung wiedergegeben. Eigenwerte und Eigenfunktionen des eindimensionalen harmonischen Oszillators. Die Parabel kennzeichnet das Potential u(ξ) = ξ 2 , das “Innere” der Parabel repräsentiert den klassisch erlaubten Bereich E ≥ V bzw. λ > ξ 2 . Die Eigenlösungen ϕn konzentrieren sich wesentlich auf diesen erlaubten Bereich, dringen aber etwas in den “verbotenen” Bereich ein und klingen dort exponentiell ab. Genau auf der Grenze V = E bzw. u = λ haben sie einen Wendepunkt. Wie sind diese Eigenfunktionen physikalisch zu interpretieren? Auf den allerersten flüchtigen Blick scheinen die entsprechenden Wellenfunktionen 42 ψn (ξ, t) = ϕn (ξ)e−iωn t eine Zeitabhängigkeit zu zeigen, die der Frequenz ωn = En 1 = (n + )ω h̄ 2 entspricht. Aber das ist natürlich nicht richtig, unsere Eigenfunktionen beschreiben ja nach Konstruktion(!) stationäre Zustände, bei denen |ψn (ξ, t)|2 = ϕ2n (ξ) gar nicht von der Zeit abhängt. Die erste Eigenfunktion ψ0 (x, t) = ϕ0 (x)e−iω0 t = π −1/4 e−ξ 2 /2 i e− 2 ωt entspricht gerade einem Gaussschen Wellenpaket mit minimalem Unschärfeprodukt [vgl.(74)], und wir können diese Lösung tatsächlich “verstehen”, wenn wir von der klassischen Vorstellung eines Teilchens ausgehen, das “unten im Potentialtopf” ruht: x = 0, p = 0, E = p2 /2m + kF x2 /2 = 0. Nun wissen wir ja bereits, daß sich diese klassische Vorstellung nicht mit der Unschärferelation hx2 ihp2 i ≥ h̄2 4 verträgt. “Bestenfalls” können wir – eben mit einem Gaussschen Paket – ein Gleichheitszeichen erreichen und erhalten damit eine Energie E= kF 2 1 2 kF 2 h̄2 1 hx i + hp i = hx i + . 2 2m 2 8m hx2 i Diese Energie wird sowohl für große als auch für kleine hx2 i groß. Für das Minimum rechnen wir kF h̄2 1 dE = − =0 dhx2 i 2 8m hx2 i2 Damit folgt 43 oder h̄ hx2 i = √ . 2 mk h̄ E= 4 s h̄ kF + m 4 s h̄ω kF = = E0 . m 2 Der Zustand |ψ0 i mit der Energie E0 stellt also die “beste” mit der Quantenmechanik verträgliche Annäherung an den klassischen harmonischen Oszillator dar, der nicht schwingt. Wir erhalten ein anschauliches Bild dieses Zustandes, wenn wir das im Potentialtopf ruhende Teilchen durch ein ausgeschmiertes Wellenpaket ersetzen. Die Vorsicht, mit der wir diesem Bild begegnen müssen, wird aber schon durch die “höheren” Eigenfunktionen deutlich. Hier ist nämlich der harmonische Oszillator mit einer höheren Energie En = (n+ 21 )h̄ω “angeregt”, sollte also schwingen. Aber hψn |ψn i hängt gar nicht von der Zeit ab; was ist eine “stationäre Oszillation”? In der Abbildung auf der folgenden Seite ist die Aufenthaltswahrscheinlichkeit wn (ξ) = ψn∗ ψn = ϕ2n für verschiedene n aufgetragen. Wir vergleichen wn (ξ) mit der mittleren Aufenthaltswahrscheinlichkeit w kl eines klassischen Teilchens der selben Energie im Potentialtopf des harmonischen Oszillators. Da jede Phase während einer Schwingung zweimal durchlaufen wird, gilt offenbar w kl (x)dx = 2 dt ω = dt T π oder wegen dx/dt = v w kl (x) = ω ω = q . 2 πv π m (E − V ) Übersetzen wir dies in unsere dimensionslose Darstellung [vgl. die Gleichungen (95) bis 97)], so erhalten erhalten wir die mittlere Aufenthaltswahrscheinlichkeit 1 , wnkl (ξ) = √ π λn − ξ 2 (109) eines klassischen Oszillators der Energie En = λnh̄ω/2 = (n + 21 h̄ω. Diese Aufenthaltswahrscheinlichkeit ist in der Figur auf der folgenden Seite ebenfalls eingezeichnet. Für n = 0 und n = 1 zeigen die klassischen und quantenmechanischen Erwartungen noch wenig Ähnlichkeit. Mit wachsendem n fällt jedoch eine eigentümliche Entsprechung ins Auge: Offenbar oszilliert (nicht zeitlich, sondern örtlich!) die quantenmechanische Wahrscheinlichkeit wn um den klassischen Mittelwert wnkl . Für diese Oszillationen gibt es keine klassische Erklärung. Sie repräsentieren gerade die wellenmechanische Besonderheit und entsprechen dem Interferenzmuster hinter einem Doppelspalt. 44 Aufenthaltswahrscheinlichkeit w n (ξ) des harmonischen Oszillators für verschiedene Energieeigenzustände n. Die konvexen Bögen repräsentieren die mittlere Aufenthaltswahrscheinlichkeit wnkl (ξ) [vgl. Gl. (109)] klassischer Oszillatoren der selben Energie. 45 Ist also der quantenmechanische Erwartungswert generell ein Zeitmittel? Nein, das ist er keineswegs, aber die Energieeigenfunktionen haben schon etwas mit einem Zeitmittel zu tun. Wenn wir nämlich die Energie eines Oszillators exakt kennen, wissen wir wegen der Energie–Zeit–Unschärfe gar nichts mehr über den Zeitpunkt des Nulldurchgangs, also die Phase. Die Wahrscheinlichkeitsverteilung ψn∗ ψn entspricht klassisch also der Aufenthaltswahrscheinlichkeit von isoenergetischen Oszillatoren beliebiger Phase, oder eben dem Zeitmittel. Kann unser quantenmechanischer Formalismus denn vielleicht die Dynamik, also die harmonische Schwingung, des harmonischen Oszillators gar nicht beschreiben? Zunächst einmal sehen wir an der Ehrenfest–Beziehung mhẍi = −h dV i = kF hxi , dx (110) daß der Erwartungswert hxi des harmonischen Oszillators exakt die klassische Beziehung hxi = a cos ωt + b sin ωt, ω = q kF /m (111) erfüllt. [Das ist kein Widerspruch zu den stationären Zuständen |ψn i, denn für die gilt hxin = hψn |x|ψn i = 0 (also a = b = 0), da alle ϕ2n symmetrische Funktionen von x sind.] Also oszilliert der Oszillator auch quantenmechanisch genau mit der Frequenz ω. Eine solche Oszillation wird aber von den einzelnen Energieeigenfunktionen nicht beschrieben. Wir erhalten sie vielmehr erst dann, wenn wir verschiedene Eigenfunktionen gemäß ψ(ξ, t) = X cn ϕn (ξ)e−iωn t , 1 ωn = (n + )ω 2 (112) überlagern. Dann sieht man sofort, daß die Wahrscheinlichkeitsdichte ψ∗ψ = X c∗n cm ϕn (ξ)ϕm (ξ)ei(n−m)ωt n,m und mit ihr alle Erwartungswerte hAi = X n,m c∗n cm hϕn |A|ϕm iei(n−m)ωt 46 (113) periodische Funktionen der Zeit mit der Periodendauer T = 2π/ω sind. Speziell zum Mittelwert hξi berechnen wir die “Matrixelemente” ! 1 d d |ϕm i hϕn | ξ + +ξ− 2 dξ dξ 1 hϕn |(A+ + A− )|ϕm i 2 αn hϕn |ϕm−1 i + βn hϕn |ϕm+1 i αn δn,m−1 + βn δn,m+1 hϕn |ξ|ϕm i = = = = (114) (die Berechnung von αn und βn schenken wir uns) und erhalten hξi = = X n,m X n c∗n cm (αn δn,m−1 + βn δn,m+1 )ei(n−m)ωt c∗n αn cn+1 eiωt + βn cm−1 e−iωt . hξi wird also in Übereinstimmung mit (111) immer eine rein harmonische Funktion von ωt. Wenn wir also irgendein Wellenpaket im Potentialtopf des harmonischen Oszillators betrachten, so wird dessen “Schwerpunkt” — der Erwartungswert hξi — rein harmonisch oszillieren, während sich die Form periodisch mit 2π/ω — aber nicht rein harmonisch — verändert. Lediglich das spezielle Gaußsche Wellenpaket, das ϕ0 entspricht, kann ohne Formveränderung im Potentialtopf oszillieren (Übungen). Diese spezielle Lösung hat es vielen Physikern schwer gemacht, sich von der Vorstellung zu lösen, daß das Minimalpaket “wirklich” das Teilchen repräsentiert. Eine zeitlich oszillierende Wahrscheinlichkeitsdichte ψ ∗ ψ entspricht aber keiner exakt vorgegebenen Energie. Zu einer Beobachtung der Oszillation gehört nämlich eine Meßzeit δt < 1/ω, und die ist mit einer Energieunschärfe ∆E ∼ h̄/δt > h̄ω verbunden. Zur Darstellung eines solchen Energiebereiches brauchen wir aber mehrere Energieeigenfunktionen. Eine scharfe Messung der Energie mit ∆E h̄ω erfordert dagegen eine Meßzeit ∆t ≥ h̄/∆E = 1/ω, also eine Beobachtung über viele Perioden. Und bei dieser Beobachtung sehen wir eben nur noch die über alle Phasen gemittelte Aufenthaltswahrscheinlichkeit des harmonischen Oszillators. Wir sind es aus der Atomphysik gewohnt, nur die stationären Zustände als relevante Lösungen der Schrödingergleichung zu betrachten: Nicht stationäre Lösungen sind viel zu “kurzlebig“, um uns genauer zu interessieren. Da es sich dabei meist um geladene Teilchen handelt, wird in nicht stationären Zuständen tatsächlich Energie abgestrahlt. Nichtstationarität wird daher als Übergang von einem stationären Zustand in einen anderen stationären Zustand beschrieben. 47 Wenden wir diese Begriffe auf den harmonischen Oszillator an, beschreiben wir also die Schwingung durch Übergänge zwischen benachbarten Energieniveaus. Gl.(114) wird dann in der Sprechweise der Atomphysik als Auswahlregel ∆n = ±1 interpretiert. Trägt der Oszillator eine elektrische Ladung, so strahlt er elektromagnetische Wellen der Frequenz ω ab. Die Auswahlregel ∆n = ±1 oder ∆E = ±h̄ω läßt sich dann in die Aussage übersetzen, daß die ausgesandte (oder absorbierte) Strahlung in Photonen der Energie h̄ω gequantelt ist. 3.3 Die Potentialmulde: Diskretes und kontinuierliches Spektrum Der harmonische Oszillator ist ein Modell für viele physikalische Systeme, in einer Hinsicht ist er aber immer unrealistisch: Bei hinreichend großem Abstand vom “Zentrum” wird schließlich jede Kraft verschwinden. Ein anziehendes Kraftzentrum wird daher i. a. durch eine Potentialmulde (Potentialtopf) mit V (±∞) = 0 beschrieben: V(x) a b x E<0 Ein klassisches Teilchen mit einer Energie E < 0 wird sich dann zwischen zwei Umkehrpunkten a und b bewegen und sich dabei qualitativ ähnlich wie der harmonische Oszillator verhalten. Eine entsprechende Analogie erwarten wir auch quantenmechanisch: Die stationäre Schrödingergleichung h̄2 d2 ϕ − + V (x)ϕ = Eϕ 2m dx2 (115) wird diskrete Energiewerte E0 < E1 < . . . 0 besitzen — vorausgesetzt, die Potentialmulde ist hinreichend tief und breit. Die zugehörigen Eigenfunktionen ϕn haben in den klassischen Umkehrpunkten Wendepunkte und sind im erlaubten Bereich konkav, außerhalb konvex zur Achse. Dabei hat ϕn innerhalb der Potentialmulde n Nullstellen. Außerhalb der Potentialmulde klingen die Eigenfunktionen exponentiell ab, wir erhalten insbesondere für x → ±∞ 48 ϕn → Cn± e −κn |x| mit κn = s −2mEn . h̄2 (116) Für endlich tiefe Potentialtöpfe erwarten wir nun höchstens endlich viele Eigenwerte14 (siehe Skizze). ϕ E x E2 E1 E0 Ein entscheidender Unterschied zum harmonischen Oszillator liegt darin, daß wir uns mit dieser Analogie auf gebundene Zustände mit E < 0 beschränken müssen. Dem entsprechen klassisch oszillatorische Bahnen, die nicht aus der Potentialmulde herausführen. Für E ≥ 0 können jedoch die Teilchen über die Potentialmulde “hinweglaufen”. Die “stationäre” — was heißt das in dem Fall? — Schrödingergleichung (115) besitzt dann Lösungen, die statt (116) das asymptotische Verhalten ϕE>0 → αe ikx + βe −ikx , k= s 2mE h̄2 (117) für x → ±∞ zeigen. Das sind natürlich genau die ebenen Wellen, die uns zur kräftefreien Schrödingergleichung geführt hatten und die ausdrücken, daß der Impuls p = h̄k konstant bleibt. Dieser im Grunde nicht unerwarteter Sachverhalt führt zu einer unangenehmen mathematischen Schwierigkeit: Funktionen mit dem asymptotischen Verhalten (117) sind nicht normierbar und damit keine Eigenfunktionen im bisherigen strengen Sinn. Wir benötigen sie aber, um allgemeinere Lösungen der Schrödingergleichung — z. B. Wellenpakete — darzustellen: Der diskrete Satz normierbarer Eigenfunktionen ist nicht vollständig! Mathematisch kann man nun die “Eigenfunktionen” für E > 0 durch geeignete Grenzprozesse aus normierbaren Eigenfunktionen darstellen. Beispielsweise kann man das Potential V (x) durch 14 Wir entnehmen alle diese Aussagen der elementaren Anschauung und verzichten auf die mathematischen Beweise. 49 V VA (x) = ( V (x) ∞ f ür f ür |x| < A |x| > A −A A x ersetzen und den Grenzübergang A → ∞ betrachten. Für jedes endliche A erhält man dann ein vollständiges diskretes Spektrum. Mit wachsendem A rücken die Eigenwerte Eν > 0 jedoch immer dichter zusammen und in der Grenze A = ∞ erhalten wir ein kontinuierliches Spektrum: Alle Energiewerte E ≥ 0 werden Eigenwerte. Mathematisch benötigt man nun das Konzept der “Distributionen”, um den Hilbertraum für solche Grenzprozesse zu vervollständigen. Wir verzichten auf die mathematische Rechtfertigung und interpretieren die freien Zustände E ≥ 0 physikalisch: Wenn ein Teilchen nicht mehr gebunden ist, so kann es sich irgendwo im gesamten Raum aufhalten, die Aufenthaltswahrscheinlichkeit in jedem endlichen Teilinterval und damit die Wahrscheinlichkeitsdichte wird also Null. Wir können aber immer noch nach einer ortsabhängigen Intensität ψ ∗ ψ fragen, wenn wir nicht von einem Teilchen, sondern von einem Strom von Teilchen bestimmter Energie, welcher den ganzen Raum erfüllt, ausgehen. Dies entspricht genau der experimentellen Situation bei den Interferenzexperimenten und führt uns zur Einführung einer nicht normierbaren Wellenfunktion Φk (x) = √ ikx ne (118) freier Teilchen. Nach Gl. (55) gehört zu dieser Wellenfunktion eine Stromdichte ( d d h̄ j= Φ∗k Φk − Φk Φ∗k 2im dx dx j= ) = h̄ 2ik n 2im h̄k p n = n = nvkl . m m oder (119) Gl. (118) beschreibt also einen Strom von Teilchen der Dichte n, die mit der Geschwindigkeit vkl = p/m strömen. Entsprechend beschreibt Φ−k (x) = √ ne−ikx (120) eine Welle oder einen Teilchenstrom in negativer x–Richtung oder allgemeiner 50 Φk (r) = √ neik·r (121) eine Welle oder einen Strom in k–Richtung. Mit Φ∗k Φk = n = const. verstehen wir auch sofort, warum Φk nicht normierbar sein kann: ein unendlich ausgedehnter Strom von Teilchen konstanter Dichte enthält nun einmal unendlich viele Teilchen! Abschließend bleibt lediglich zu erwähnen, daß wir bei einer präzisen Diskussion — wie bereits früher betont — die Begriffe “Teilchendichte” und “Stromdichte” genauer durch “Wahrscheinlichkeits–Dichte” und “Wahrscheinlichkeits–Stromdichte” ersetzen sollten. Nach dieser physikalischen Erklärung können wir nun also Funktionen, die sich im Unendlichen wie ϕk (x) = eikx (122) verhalten, als Eigenfunktionen15 zulassen: sie beschreiben uns einen Teilchenstrom der Dichte 1 und der Geschwindigkeit vkl = p/m = h̄k/m. Wenn wir nun auf die asymptotische Form (117) der Energie–Eigenfunktionen zurückkommen, so haben wir die Freiheit, zwei willkürliche Konstanten α und β festzulegen. Diese Konstanten bestimmen die Intensität einer vor– und einer rücklaufenden Welle. Um hier Eindeutigkeit zu erzielen, wollen wir grundsätzlich die folgende Verfügung treffen. (Dabei denken wir nicht nur an Potentialmulden, sondern auch an Berge und allgemeine Störungen.) Wir nehmen an, daß von links (x = −∞) eine ebene Welle ϕe = exp(ikx) einläuft (“Ursache”). Diese Welle repräsentiert einen Teilchenstrom der Dichte 1 und der Stromdichte je = h̄k/m in positiver x–Richtung. Als “Wirkung” erscheint weit hinter der Potentialstörung (x → +∞) eine auslaufende Welle ϕa = d exp(ikx). Aus der Analogie zur Optik, wo das veränderliche Potential einem veränderlichen Brechungsindex entspricht, schließen wir, daß wir links (x → −∞) außerdem eine reflektierte Welle ϕr = r exp(−ikx) zulassen müssen — auch wenn dies im klaren Widerspruch zur klassischen Mechanik steht. Wir suchen also für E > 0 diejenige Lösung der stationären Schrödingergleichung (115), welche die asymptotische Darstellung ϕ → eikx + re−ikx ϕ → deikx (x → −∞) (x → +∞), 15 k= s 2mE h̄2 (123) Für freie Teilchen sind dies gemeinsame Eigenfunktionen des Impuls– und Hamiltonoperators. 51 besitzt. Gl. (123) wird auch als Ausstrahlungsbedingung bezeichnet. (Die Bedeutung dieser Bedingung wird in der dreidimensionalen Verallgemeinerung noch transparenter.) Aus den Stromdichten ja = d∗ dh̄k/m und jr = −r ∗ rh̄k/m der auslaufenden und der reflektierten Teilchen ergeben sich dann die Koeffizienten D(E) = ja |jr | = d∗ d und R(E) = = r∗r je je (124) der Durchlässigkeit und der Reflexion. 3.4 Das eindimensionale Kastenpotential Wir wollen das allgemeine Konzept des vorigen Abschnitts an einem Beispiel verdeutlichen und wählen dazu — da die Fälle, in denen die Schrödingergleichung elementar lösbar ist, rar sind — das einfache Kastenpotential V (x) = ( V0 f ür 0 f ür |x| ≤ a |x| > a . (125) V −a a x V0 In klassischer Beschreibung ist das Teilchen also für |x| 6= a überall kräftefrei und erfährt nur bei x = ±a eine (unendlich) starke Kraft. Mit = 2mE h̄2 und u(x) = lautet die stationäre Schrödingergleichung 52 2m V (x) h̄2 d2 ϕ + [ − u(x)]ϕ = 0. dx2 (126) Wir setzen (bis auf weiteres) u0 = 2mV0 /h̄2 < 0 voraus und interessieren uns zunächst für die diskreten Eigenwerte n < 0 mit normierbaren Eigenfunktionen ϕn . Aus Gl. (126) entnehmen wir nun die allgemeine Lösung ϕ = ( αeκx (x < −a) βe−κx (x > a) ) mit κ = √ − (127) außerhalb und ϕ = γ cos(kx) + δ sin(kx) (|x| ≤ a) mit k = √ − u0 (128) innerhalb des Potentialtopfes. Zur Bestimmung der vier Unbekannten α, β, γ, δ haben wir nun fünf Bedingungen, nämlich – die Stetigkeit16 von ϕ bei x = ±a – die Stetigkeit von ϕ0 bei x = ±a und – die (willkürliche) Normierung von ϕ. Dies ist i. a. eine Bedingung zuviel; daher werden wir nur für bestimmte Werte von E — eben die Eigenwerte En — Lösungen finden. Die eigentliche Rechnung können wir durch folgende Überlegung abkürzen: Aufgrund der Symmetrie des Problems erwarten wir, daß die Aufenthaltswahrscheinlichkeit ϕ2 nur von |x| abhängt. Das bedeutet aber, daß wir entweder symmetrische Eigenfunktionen ϕ = e−κ|x| f ür |x| > a und ϕ = γ cos(kx) f ür |x| ≤ a (129) oder antisymmetrische Eigenfunktionen ϕ = sign(x)e−κ|x| f ür |x| ≥ a und ϕ = δ sin(kx) f ür |x| ≤ a 16 (130) Die Stetigkeit von ϕ und ϕ0 läßt sich ebensowenig wie ϕ selbst physikalisch interpretieren und begründen. Wir folgern sie mathematisch aus der Beschränkheit von ϕ00 . 53 erhalten. Über die Normierung haben wir mit dem Vorfaktor 1 vor der Exponentialfunktion bereits verfügt. Daher stehen uns zur Bestimmung der einen Konstante γ bzw. δ nun die zwei Stetigkeitsbedingungen bei x = +a zur Verfügung. Betrachten wir zunächst die symmetrischen Eigenfunktionen. Für sie erhalten wir e−κa = γ cos(ka) und − κe−κa = −kγ sin(ka). Diese beiden Gleichungen können im allgemeinen nur für bestimmte Werte von κ() und k() erfüllt sein. Eliminieren wir nämlich γ, so erhalten wir (nach Erweiterung mit a) die Bedingung ka tan(ka) = κa. (131) Entsprechend erhalten wir für die antisymmetrischen Eigenfunktionen die beiden Gleichungen e−κa = δ sin(ka) und − κe−κa = kδ cos(ka), die auf die Bedingung −ka cot(ka) = κa (132) führen. Wir können die Auswertung der verschiedenen Bedingungen (131) und (132) zusammenfassen, wenn wir berücksichtigen, – daß tan x und cot x mit π periodisch sind und – daß tan(x − π/2) = − cot x gilt. Damit lassen sich sowohl (131) als auch (132) in der Form π κa = ka tan ka − m , 2 m = 0, 1, 2, . . . (133) schreiben, wobei m alle natürlichen Zahlen einschlielich 0 durchläuft, wenn wir das Argument des Tangens auf das Intervall [0, π/2] beschränken. Die Eigenwerte erhalten wir graphisch, indem wir (133) mit dem Kreisbogen κ2 + k 2 = −u0 oder a2 κ2 + a2 k 2 = R2 vergleichen (siehe die folgende Abbildung). 54 mit R2 = a2 |u0 | = 2ma2 |V0 | h̄2 Graphische Lösung der Eigenwertgleichung (133): κa als Funktion von ka wird mit dem Kreisbogen a2 κ2 +a2 k 2 = R2 = −a2 u0 verglichen. (Die Abbildung bezieht sich speziell auf R = 5, also a2 u0 = −25.) Für kleine Werte von R erhalten wir genau einen Eigenwert. Lassen wir R nun anwachsen, so entsteht jeweils ein zusätzlicher Eigenwert, wenn R die Grenze mπ/2 überschreitet. Wir erhalten so eine endliche Anzahl s 2R 2 = 1+ N =1+ π π 2ma2 |V0 | h̄2 (134) von Eigenwerten, die von V0 a2 abhängt. Diese Zahl können wir aus der wellenmechanischen Anschauung “verstehen”: Teilchen im Potentialtopf haben einen maximalen Impuls p0 = q 2m|V0 |. Dem entspricht eine minimale Wellenlänge λ0 = 2πh̄ 2πh̄ =q . p0 2m|V0 | Damit können wir (134) auch in der Form 4a N =1+ λ0 (135) schreiben: Die Zahl der Eigenwerte ist gleich eins plus die Anzahl der Halbwellen (λ0 /2), die in der Topfbreite (2a) “passen”. Die “zusätzliche” eins ergibt sich daraus, daß die Welle noch ein Stück (mit exponentieller Dämpfung) in den “verbotenen” Bereich außerhalb des Potentialtopfes eindringt (vgl. die Figur auf der nächsten Seite). 55 Eigenwerte und –funktionen im Kastenpotential für a2 u0 = −20 und a2 u0 = −25. Bei festem a erhalten wir nur für V0 → −∞ (unendlich tiefer Potentialtopf) unendlich viele Eigenwerte π akn = n 2 nπ oder n − u0 = 2a 2 , n = 1, 2, 3, . . . (136) Hierzu gehören die Eigenfunktionen ϕ2m = sin(k2m x) bzw. ϕ2m+1 = cos(k2m+1 x) (137) mit Nullstellen am Rand des Potentialtopfes: Mit −V0 gehen auch −E und κ gegen ∞, die Welle kann dann nicht mehr in die unendlich hohe Potentialwand eindringen. Kehren wir nun zu endlichen Potentialwerten V0 zurück und betrachten die freien Teilchen mit E > 0. Entsprechend Gl. (123) setzen wir nun17 ϕ = ( eikx + re−ikx (x < −a) deikx (x > a) ) mit k = √ (138) für das Potential außerhalb des Potentialtopfes an. Im Potentialtopf (|x| ≤ a) gilt dagegen ϕ = ãeik0 x + b̃e−ik0 x mit k0 = 17 √ − u0 . (139) Zur anschaulichen Interpretation ist es nützlich, das entsprechende optische Problem zu diskutieren. Der Bereich |x| < a entspricht dann einem Bereich mit verändertem Brechungsindex. 56 Die vier unbekannten Koeffizienten r, d, ã, b̃ müssen wir nun aus der Stetigkeit von ϕ und ϕ0 bei x = a und x = −a bestimmen, also aus18 ãeik0 a + b̃e−ik0 a k0 (ãeik0 a − b̃e−ik0 a ) ãe−ik0 a + b̃eik0 a k0 (ãe−ik0 a − b̃eik0 a ) = = = = deika kdeika e−ika + reika k(e−ika − reika ). (140) Wir schenken uns nicht nur die langwierige Lösung dieser Gleichungen, sondern verzichten auch auf die wenig erhellende Anschrift der Ergebnisse (vgl. Süßmann S. 50/51, Gleichungen (28, 29) mit L = 2a und kK = k0 ). Wichtig sind uns nur die folgenden beiden Feststellungen: 1. Wir haben vier lineare Gleichungen zur Bestimmung der vier Koeffizienten r, d, a und b. Im Gegensatz zum Fall E < 0 ist unser Gleichungssystem für E > 0 also nicht überbestimmt. Darum gibt es nicht nur für bestimmte E Lösungen, sondern wir erhalten ein kontinuierliches Spektrum. 2. Nach der klassischen Mechanik sollten alle Teilchen über die Potentialmulde weglaufen. Dem entspricht D = d∗ d = 1 und R = r ∗ r = 0. Setzen wir jedoch r = 0, so folgt mit z = eik0 a aus den beiden letzten Gleichungen (140) ã k0 + b̃z = z k ã − b̃z . z Nach den ersten beiden Gleichungen (140) gilt außerdem ! k0 b̃ b̃ ãz + = ãz − . z k z Diese beiden linearen homogenen Gleichungen besitzen aber nur für z 2 = 1/z 2 oder z 4 = 1 nicht–triviale Lösungen ã und b̃. Wir schließen daraus, daß — abgesehen von “Resonanzen” eik0 a = ±1 und ±i oder k0 a = nπ/2 — immer ein gewisser Bruchteil von Teilchen an der Potentialmulde reflektiert wird. [Ist die Resonanzbedingung erfüllt, so entspricht die Breite des Potentialtopfes gerade einer ganzen Zahl von halben Wellenlängen. Dabei löschen sich die bei x = +a und bei x = −a reflektierten Wellen durch Interferenz.] 18 Da das Problem durch die Randbedingungen nicht mehr symmetrisch ist, ist es rechnerisch günstiger, den Potentialtopf in den Bereich (0, 2a) zu legen. 57 3.5 Potentialbarriere und Tunneleffekt Wir haben bisher von einer Potentialmulde gesprochen, unsere Diskussion der “Streuung” (E > 0) gilt aber ohne jede Änderung genauso für einen Potentialberg V0 > 0 — vorausgesetzt, es gilt E > V0 , so daß k0 in Gl. (139) reell ist. Noch viel interessanter ist jedoch der Fall E < V0 , der klassisch eine undurchdringliche Potentialbarriere darstellt, an der alle Teilchen reflektiert werden. V E −a 0 a x Statt der Gl. (139) erhalten wir nun im “verbotenem” Bereich |x| < a ϕ = ãe−κ0 x + b̃eκ0 x mit κ0 = √ u0 − . (141) Aber auch nun können wir auf dieselbe Rechnung zurückgreifen, wenn wir nur k0 durch iκ0 ersetzen (k0 und κ0 sind jeweils reell). Auch in diesem Fall erhalten wir also eine endliche Wahrscheinlichkeit D = d∗ d dafür, daß das Teilchen die Barriere durchdringt: Das Teilchen gräbt sich bildlich durch den Potentialberg, man spricht vom Tunnel–Effekt. Führt man die Rechnung explizit aus, so erhält man den Durchlaßkoeffizienten V02 g(E) D(E) = d∗ d = 1 + 4E|V0 − E| " g(E) = ( #−1 mit (142) sin2 (2k0 a) (E > V0 ) sinh2 (2κ0 a) (E < V0 ) . Für hohe und breite Potentialbarrieren, die schwer zu durchtunneln sind, gilt g(E) ≈ 14 e4κ0 a , und die Tunnelwahrscheinlichkeit wird D(E) = 16E(V0 − E) −4κ0 a e V02 58 mit κ20 = 2m (V0 − E). h̄2 (143) Der bestimmende Exponent geht also mit der Breite des Potentialberges und der Wurzel aus der “Fehlenergie” V0 − E. Den Exponentialfaktor verstehen wir aus der Struktur von Gl. (141): Wir erwarten eine Lösung, die im verbotenem Bereich von links nach rechts exponentiell abklingt, d. h. es muß ϕ(a) ∼ e−2κ0 a ϕ(−a) gelten. Da die Aufenthaltswahrscheinlichkeit und der Strom mit ϕ∗ ϕ geht, folgt hierfür der Faktor exp(−4κ0 a). Wir erwähnen abschließend, daß der dominierende Exponentialfaktor für ortsabhängige Potentiale annähernd (“WBK–Näherung”) in −2 D(E) ∼ e Rx1 x0 κ(x)dx mit κ(x) = s 2m (V (x) − E) h̄2 (144) übergeht. Dabei sind x0 und x1 die Grenzen des klassisch verbotenen Bereichs. Als Beispiele für Phänomene, die auf dem Tunnel–Effekt beruhen, nennen wir den α–Zerfall und die Elektronen–Feldemission aus Metallen. Ein optisches Analogon läßt sich bei der Totalreflexion an Schichten endlicher Dicke finden. 3.6 Kugelsymmetrische Potentiale im dreidimensionalen Raum Bisher haben wir nur eindimensionale Lösungen der Schrödingergleichung diskutiert. Wir befassen uns nun mit der dreidimensionalen stationären Schrödingengleichung mit isotropem Hamiltonoperator p2 H= + V (r). 2m (145) Dabei beschränken wir uns auf die Diskussion gebundener Zustände19 E < 0. Dies setzt natürlich attraktive Potentiale V (r) voraus. Wir nehmen darüber hinaus an, daß das Potential für r → ∞ verschwindet und gehen von V (r) < V (∞) = 0 aus. 19 Die freien Zustände E > 0 werden in der Streutheorie behandelt. Diese sprengt schon allein wegen ihres Umfangs den Rahmen unserer Darstellung. 59 Das kugelsymmetrische Potential legt es nun nahe, die stationäre Schrödingergleichung − h̄2 ∆χ + V (r)χ = Eχ 2m (146) in sphärischen Polarkoordinaten r, ϑ, ϕ anzuschreiben. Dazu benötigen wir die Darstellung ∆= ∂ ∂2 1 ∂2 1 ∂ 1 r + sin ϑ + r ∂r 2 r 2 sin ϑ ∂ϑ ∂ϑ r 2 sin2 ϑ ∂ϕ2 des Laplaceoperators, die wir einer Formelsammlung entnehmen. Wenn wir zur bequemen Anschrift noch µ = cos ϑ einführen, erhalten wir so die Schrödingergleichung ∂ h̄2 1 ∂ 2 h̄2 1 ∂2χ 2 ∂χ − rχ − (1 − µ ) + + 2m r ∂r 2 2mr 2 ∂µ ∂µ 1 − µ2 ∂ϕ2 " # (147) [V (r) − E]χ = 0. Zur Lösung versuchen wir einen Separationsansatz rχ(r, ϑ, ϕ) = u(r)Y (ϑ, ϕ) (148) und erhalten ∂Y 1 ∂2Y 2m ∂ (1 − µ2 ) + = r 2 Y u00 + 2 (E − V )u . −u 2 2 ∂µ ∂µ 1 − µ ∂ϕ h̄ # " Nach Division durch uY hängt die linke Seite nur von den Winkeln und die rechte nur von r ab. Beide sind also gleich einer Konstante λ. Damit zerfällt die Schrödingergleichung in eine radiale Gleichung d2 u 2m λ + 2 (E − V )u − 2 u = 0 2 dr r h̄ und eine Gleichung 60 (149) ∂Y 1 ∂2Y ∂ (1 − µ2 ) + + λY = 0. ∂µ ∂µ 1 − µ2 ∂ϕ2 (150) Wir stellen die radiale Gleichung zunächst zurück. Gl.(150) läßt sich durch eine weitere Separation Y (ϑ, ϕ) = P (µ)Φ(ϕ) behandeln: d dP d2 Φ Φ(1 − µ ) (1 − µ2 ) + λP = −P 2 . dµ dµ dϕ 2 " # Nach Division durch P Φ hängt nun die linke Seite nur von µ, die rechte nur von ϕ ab. Beide sind also konstant, die Konstante nennen wir m2 : dP m2 d P =0 (1 − µ2 ) + λ− dµ dµ 1 − µ2 (151) d2 Φ + m2 Φ = 0. 2 dϕ (152) ! Gleichung (152) können wir sogleich lösen: Φm (ϕ) = eimϕ . (153) Dabei verlangt die Eindeutigkeit Φ(ϕ + 2π) = Φ(ϕ), daß m ganzzahlig ist: m = 0, ±1, ±2 . . . Die Untersuchung der Gl. (151) ist wesentlich aufwendiger. Es stellt sich heraus, daß reguläre Lösungen nur für λ = l(l + 1) (154) existieren, wobei l eine ganze Zahl ≥ |m| ist. Die regulären Lösungen Plm (µ) heißen Legendre– oder Kugel–Funktionen. Zusammengefaßt erhalten wir also Winkelfunktionen Ylm (ϑ, ϕ) = clm Plm (cos ϑ)eimϕ mit l = 0, 1, 2, 3 . . . und m = −l, −l+1, . . . , l−1, l. 61 (155) Dabei sind clm geeignete Normierungsfaktoren, die durch Z ∗ Ylm Yl0 m0 sin ϑdϑdϕ = δll0 δmm0 definiert sind. Die Ylm sind als Kugelflächen–Funktionen bekannt, in niedrigster Ordnung erhält man Y0 0 = (4π) −1/2 , Y1 0 3 = 4π 1/2 cos ϑ, Y1 ±1 3 = 8π 1/2 sin ϑ e±iϕ . Bevor wir uns nun die radiale Gleichung (149) ansehen, wollen wir versuchen, den Winkelanteil physikalisch zu interpretieren. Dazu gehen wir noch einmal zur Problemstellung mit dem Hamiltonoperator (145) zurück und erinnern uns an das Zentralkraftproblem der klassischen Mechanik. Dort hatten wir ausgenutzt, daß der Drehimpuls L=r×p konstant ist und hatten die Bewegung in der Ebene senkrecht zu L untersucht. Dabei erhielten wir radial ein eindimensionales Bewegungsproblem mit einem effektiven Potential Ṽ = V +L2 /2mr 2 . Wir erkennen dies koordinatenunabhängig aus L2 = L · (r × p) = r · (p × L) = r · [p × (r × p] = r · [p2 r − p · r p] = p2 r 2 − (p · r)2 . Es gilt also p2 = L2 /r 2 + p2r und H= L2 p2r + + V (r). 2m 2mr 2 (156) Das liefert in radialer Richtung eine eindimensionale Bewegungsgleichung, mit einem “zusätzlichen Potential” L2 /2mr 2 für die Fliehkraft. Quantenmechanisch ist die obige Rechnung nun nicht ohne weiteres gültig, weil die Reihenfolge der Operatoren r, p und L beachtet werden muß. Unter sorgfältiger Beachtung der entsprechenden Vertauschungsrelationen (s. Messiah Bd. I, Abschn. 9.1.1) oder durch direktes Ausmultiplizieren von L2 = L2x + L2y + L2z läßt sich aber zeigen, daß Gl. (156) als quantenmechanische Operatorgleichung mit dem Drehimpuls [vgl. (63)] 62 L=r×p= h̄ r×∇ i (157) gilt, wenn man den “radialen Impuls” durch den Operator pr = h̄ 1 ∂ r i r ∂r (158) definiert20 . In dem Term p2r h̄2 1 ∂ 2 =− r 2m 2m r ∂r 2 erkennen wir nun in der Tat den ersten Term von Gl. (147). Durch Vergleich des zweiten Terms folgern wir dann 2 L = −h̄ 2 " ∂ 1 ∂ ∂2 , (1 − µ2 ) + ∂µ ∂µ 1 − µ2 ∂ϕ2 # (159) ein Ergebnis, das man auch direkt aus Gl. (157) durch Einführung von Polarkoordinaten und Ausmultiplizieren (siehe Schiff S. 74/75) erhalten kann. Die Kugelflächenfunktionen Ylm sind also Eigenfunktionen des Drehimpuls–Quadrats [vgl. Gln. (150, 154)]: L2 Ylm (ϑ, ϕ) = l(l + 1)h̄2 Ylm (ϑ, ϕ). (160) Um die Eigenwerte l(l + 1)h̄2 besser zu verstehen, gehen wir nun vom Drehimpuls L selbst aus und betrachten seine z–Komponente ! h̄ ∂ ∂ Lz = xpy − ypx = −y x . i ∂y ∂x Führen wir nun ebene Polarkoordinaten ∂x = −ρ sin ϕ = −y ∂ϕ ∂y = ρ cos ϕ = x y = ρ sin ϕ =⇒ ∂ϕ x = ρ cos ϕ =⇒ 20 Messiah (Bd. I, Abschn. 9.1.1, Fußnote 2) weist darauf hin, daß pr hermitesch ist, aber aufgrund Normierungsschwierigkeiten keine Observable repräsentiert. Wir schließen uns diesem formalen Argument nicht an, da auch der kartesische Impuls entsprechende Schwierigkeiten mit sich bringt (vgl. Übungen SS 2006, Blatt 6, Aufg. 2). 63 ein, so folgt h̄ Lz = i ∂y ∂ ∂x ∂ + ∂ϕ ∂y ∂ϕ ∂x ! = h̄ ∂ . i ∂ϕ (161) Beim Eigenwertproblem von Lz Lz Φ = h̄ ∂Φ = mh̄Φ i ∂ϕ werden wir nun genau auf die Separationslösungen (153) Φm (ϕ) = eimϕ (m = 0, ±1, ±2 . . .) geführt. Die Kugelflächenfunktionen Ylm sind also auch Eigenfunktionen der z– Komponente Lz des Drehimpulses: Lz Ylm (ϑ, ϕ) = mh̄Ylm (ϑ, ϕ). (162) L2 und Lz besitzen also ein gemeinsames System von Eigenfunktionen. In diesen Eigenfunktionen tritt der Drehimpuls Lz gequantelt in Vielfachen von h̄ auf. Dabei ist zu beachten, daß diese Quantelung für jede beliebige Richtung der z–Achse gilt. Wir können uns L also nicht mehr als festen “Pfeil” der Länge L, und Lz nicht mehr als seine Projektion L cos ϑ vorstellen. In der klassischen Mechanik hatten wir die z–Achse in die Richtung des konstanten Drehimpulses gelegt, d. h. wir hatten Lx = 0, Ly = 0, Lz = L. Wenn wir dieses Konzept so gut wie möglich zu übernehmen versuchen, gehen wir von hLz i = lh̄ (163) aus. Die entsprechende klassische Festlegung Lx = Ly = 0 können wir nun aber nicht erfüllen, denn zwischen den Drehimpulskomponenten besteht eine Unschärferelation [vgl. Gl. (81)] hL2x ihL2y i h̄2 ≥ hLz i2 . 4 Nehmen wir nun aus Symmetriegründen hL2x i = hL2y i an und rechnen mit der minimalen Unschärfe, so folgt hL2x = hL2y i = l h̄ hLz i = h̄2 . 2 2 64 Damit erhalten wir für das Drehimpulsquadrat den Erwartungswert hL2 i = hL2x i + hL2y i + hL2z i = lh̄2 + l2 h̄2 oder hL2 i = l(l + 1)h̄2 . (164) Das macht uns den Eigenwert l(l + 1)h̄2 des Operators L2 verständlich: In den Eigenfunktionen erscheint die z–Komponente des Drehimpulses in Vielfachen von h̄ gequantelt. Versuchen wir, die z–Achse in die Richtung des Drehimpulses zu legen (Lz → lh̄), so können Lx und Ly aufgrund der Unschärferelation doch nicht exakt verschwinden. Die minimale Unschärfe führt dann dazu, daß L2 nicht den Eigenwert l2h̄2 , sondern den größeren Eigenwert l(l + 1)h̄2 erhält. Wählen wir bei festem L eine andere Richtung als z–Achse, so werden wir bei einer Messung wieder nur gequantelte Werte mh̄ für Lz finden. Hieraus wird die Einschränkung −l ≤ m ≤ l unmittelbar verständlich. Wir dürfen uns damit den Drehimpuls nicht mehr als Vektorpfeil, sondern als Kegelmantel veranschaulichen: z mh l(l+1)h Die (2l + 1) “Einstellmöglichkeiten” m = −l, . . . , m = +l des Drehimpulses bei festem L werden auch als “Richtungsquantelung” bezeichnet. Fassen wir also zusammen: Die Separationslösung der Schrödingergleichung hat uns auf Winkelfunktionen (Kugelflächenfunktionen) Ylm (ϑ, ϕ) geführt, die sich als Drehimpuls–Eigenfunktionen — genauer: als gemeinsame Eigenfunktionen der Operatoren Lz (Eigenwert mh̄) und L2 (Eigenwert l(l + 1)h̄2 ) — herausstellen. Damit kommen wir nun zur radialen Gleichung (vgl. (149)) l(l + 1)h̄2 h̄2 d2 u + V (r) + u = Eu. − 2m dr 2 2mr 2 " # 65 (165) Diese Gleichung können wir als eindimensionale Schrödingergleichung mit dem effektiven Potential Ṽ (r) = V (r) + l(l + 1)h̄2 2mr 2 interpretieren — in völliger Analogie zur klassischen Mechanik. Das Fliehkraftpotential l(l + 1)h̄2 /2mr 2 hängt von der Quantenzahl l, die den Betrag des Drehimpulses angibt, nicht aber von der Quantenzahl m, die seine Richtung angibt, ab21 . Dementsprechend sind alle Eigenwerte von Gl. (165) (2l + 1)– fach entartet. Hierin zeigt sich die Isotropie des Problems. Stört man diese Isotropie, indem man z. B. ein Magnetfeld anlegt, das eine Raumrichtung auszeichnet, wird diese Entartung aufgehoben. m heißt darum auch magnetische Quantenzahl. In allen praktisch interessanten Fällen dominiert das Fliehkraftpotential für l 6= 0 und r → 0 gegenüber V (r): V ∼ V(r) r V(r) Das resultierende Minimum des Potentials ermöglicht klassische Bahnen, die den Planetenbahnen entsprechen. Solche klassischen Bahnen sind natürlich für alle E < 0 möglich. Quantenmechanisch finden wir dagegen nur für bestimmte Energien Eνl stationäre Zustände. Das ergibt sich in Analogie zum eindimensionalen Fall aus folgender Überlegung: Da das Fliehkraftpotential für kleine Abstände dominiert, erhalten wir für r → 0 die Differentialgleichung u00 = l(l + 1) u r2 mit der allgemeinen Lösung 21 Man vermeide Verwechselungen der Masse m und der Quantenzahl m! 66 u → al r l+1 + Al r −l (r → 0). (166) Für r → ∞ dominiert dagegen der Term Eu und wir haben u00 = κ2 u mit κ2 = − 2mE > 0, h̄2 also u → bl e−κr + Bl e+κr (r → ∞). (167) Die Normierung22 Z 2 3 χ d r = 4π Z∞ 2 0 u r 2 r dr = 4π Z∞ u2 dr = 1 (168) 0 verlangt nun, daß Al und Bl verschwinden. Diese Konstanten sind aber nicht unabhängig wählbar. Starte ich z. B. eine numerische Integration mit al 6= 0 und Al = 0, so werden sich bl und Bl aus der Rechnung ergeben. Nur für bestimmte Werte Enl der Energie wird dabei Bl = 0 werden. Wir erwarten also radiale Eigenfunktionen unl (r), die von zwei diskreten Quantenzahlen l und n abhängen. Insgesamt sind die stationären Wellenfunktionen 1 χnlm (r, ϑ, ϕ) = unl (r)Ylm (ϑ, ϕ) r des Separationsansatzes (148) also durch die drei Quantenzahlen n, l und m charakterisiert. Diese Anzahl ist auch aus den drei Raumrichtungen zu erwarten. 3.7 Das Wasserstoffatom Als spezielles Beispiel eines kugelsymmetrischen Potentials betrachten wir nun das Coulombpotential V (r) = − 22 e2 4πε0 r Beachte, daß damit nicht χ, sondern u = χr der eindimensionalen Wellenfunktion entspricht. Damit wird die Interpretation von Gl. (165) als eindimensionale Schrödingergleichung perfekt. 67 und kommen damit zur Theorie des Elektronenzustandes im Wasserstoffatom23 . Zur bequemen Rechnung machen wir die Schrödingergleichung [vgl. Gl. (165)] 2m d2 u me2 2 l(l + 1) E + + − u=0 dr 2 r2 h̄2 4πε0h̄2 r " # durch r = a0 x und E = −Rκ2 (169) mit dem Bohrschen Radius 4πε0h̄2 = 5.29 · 10−11 m a0 = 2 me (170) und der Rydberg–Energie h̄2 1 2 e2 R= = mc 2ma20 2 4πε0h̄c !2 = 13.6 eV (171) dimensionslos und erhalten l(l + 1) 2 d2 u + − κ2 − u = 0. 2 dx x x2 " # (172) Nun wissen wir bereits aus der allgemeinen Diskussion, daß u für kleine x wie xl+1 , für große x wie e−κx gehen muß. Die spezielle Struktur von Gl. (172) legt es nun nahe, direkt durch den Produktansatz u = xl+1 e−κx (173) nach den einfachsten Eigenfunktionen zu suchen. Bilden wir nämlich u00 = xl+1 00 = e−κx + 2 xl+1 0 e−κx 0 0 + xl+1 e−κx 2(l + 1) l(l + 1) κu + κ2 u, u − x2 x 00 so heben sich die Terme mit l(l + 1)/x2 und mit κ2 in Gl. (172) sofort weg. Durch die spezielle Wahl (l +1)κ = 1 bilanziert sich aber auch der 2/x–Term. Wir finden mit dem Ansatz (173) also tatsächlich Eigenfunktionen zu den Eigenwerten 23 Wir vernachlässigen das Massenverhältnis m/mp und betrachten den Kern als ortsfest bei r = 0. 68 κl1 = 1 l+1 oder El1 = − R . (l + 1)2 (174) Nun existiert zu gegebenem l aber nicht nur ein Eigenwert κl1 . Man kann durch den Ansatz u = %xl+1 e−κx systematisch nach weiteren Eigenfunktionen suchen und findet für bestimmte κlν Polynome %lν (Laguerresche Polynome) (ν − 1)–ten Grades. Diese Polynome werden aber zunehmend komplizierter und sollen hier nicht mehr untersucht werden. Wir notieren nur noch das Ergebnis κlν = 1 l+ν oder Elν = − R (l + ν)2 mit ν = 1, 2, 3, . . . für sämtliche Energie–Eigenwerte Elν zu gegebenem Drehimpuls l. Alle Eigenwerte sind also von der Form κn = 1 n oder En = − R , n2 (175) wobei n eine natürliche Zahl ist. Es ist üblich, von Gl. (175) auszugehen und n als Hauptquantenzahl zu bezeichnen. Läßt man dann n die Werte 1, 2, 3, . . . durchlaufen, so trägt man der Bedingung n = l + ν (l = 0, 1, 2, . . . und ν = 1, 2, 3, . . .) durch die Bedingung l = 0, 1, . . . , n − 1 Rechnung. Zu jeder Hauptquantenzahl n gibt es also n Drehimpulsquantenzahlen l. Berücksichtigt man weiter, daß zu jedem l die (2l + 1) magnetischen Quantenzahlen m = −l, −l + 1, . . . , l − 1, l gehören, so findet man, daß der Eigenwert En n−1 X l=0 (2l + 1) = n 1 + [2(n−1)+1] = n2 2 (176) –fach entartet ist. In der Atomphysik ist es (aus historischen Gründen) üblich, den Wert der Drehimpulsquantenzahl durch kleine lateinische Buchstaben s, p, d, f, . . . zu kennzeichnen und hinter die Hauptquantenzahl zu stellen. Damit ergibt sich das folgende Termschema des Wasserstoffs: 69 Termschema des Wasserstoffs Nach dieser allgemeinen Übersicht kehren wir zu den speziellen Eigenfunktionen (173) zurück. Wenn wir von der Hauptquantenzahl n — also von einer vorgegebenen Energie — ausgehen, repräsentieren diese Eigenfunktionen die Zustände mit maximalen Drehimpuls l = n − 1. Die klassische Entsprechung dieser Zustände sind Kreisbahnen mit pr = 0 und T = L2 . 2mr 2 Wir wollen das durch eine kleine Rechnung bestätigen und schreiben Gl. (173) wegen l = n−1 in der Form x ũn n−1 = xn e− n . (177) Diese Eigenfunktionen haben ein Maximum bei xn = n 2 bzw. rn = n2 a0 (178) und repräsentieren Wahrscheinlichkeitsdichten wn ∼ ũ2n n−1 , die sich mit wachsendem n immer enger um xn bzw. rn konzentrieren. In der folgenden Figur zeigen wir das für die relativen Wahrscheinlichkeiten wn rel (x) = wn (x)/wn (xn ): 70 Relative radiale verteilungen22 Wahrscheinlichkeits- wn rel (x) = ũ2n n−1 (x) ũ2n n−1 (xn ) des Wasserstoff–Elektrons in den Zuständen unl mit maximalem Drehimpuls l = n−1. (x = r/a0 , xn = n2 ). Wir können diese Aussage präzisieren, indem wir von der Formel Z∞ m −αx x e dx = 0 1 αm+1 Z∞ y m e−y dy = 0 m! αm+1 ausgehen und (mit der Abkürzung ũ = ũn n−1 ) die Normierung hũ|ũi = Z∞ 2 x2n e− n x dx = 0 2n+1 n 2 (2n)! sowie die Momente k hũ|x |ũi = Z∞ x 2 2n+k − n x e dx = 0 2n+k+1 n 2 (2n + k)! berechnen. Daraus folgen die Erwartungswerte24 n hũ|xk |ũi = hx i = hũ|ũi 2 k k (2n + k)! . (2n)! (179) Speziell für k = 1 erhalten wir hxi = n n + 1 2 oder hri = n n + 1 a0 , 2 also einen “mittleren” Radius, der knapp über dem Maximum xn = n2 bzw. rn = n2 a0 (vgl. (178) liegt. Aus dem quadratischen Mittel 24 Vgl. Gl. (168) und die Fußnote 20. Man beachte, daß in der Definition der radialen Wahrscheinlichkeit bereits die Kugeloberfläche berücksictigt ist. 71 hx2 i = n2 (n + 1) n + 1 2 berechnen wir ∆x2 = hx2 i − hxi2 = n2 n + hxi2 1 1 = . 2 2 2n + 1 Die Streuung ∆r ∆x 1 = =√ hri hxi 2n + 1 fällt also mit wachsender Quantenzahl n. Für sehr große n (große Energie) wird man das Elektron daher nur in der engsten Nachbarschaft einer Kugelschale von Radius rn = n2 a0 antreffen. Daß es sich darüber hinaus um die engste Nachbarschaft von Kreisbahnen handelt, erkennt man erst an den zugehörigen Kugelfunktionen Ylm (ϑ, ϕ). Wenn wir — für große n und damit für große l = n − 1 — die Polarachse unseres Koordinatensystems “so gut wie möglich” in Drehimpulsrichtung legen wollen, müssen wir l = m wählen und finden tatsächlich Winkelanteile Yll ∼ sinl ϑ der Eigenfunktion, die die Konzentration um einen Kreisring in der Äquatorialebene bestätigen. Andere magnetische Quantenzahlen m beschreiben lediglich andere Orientierungen der Polarachse. Wir folgern weiter (ohne das explizit zu beweisen), daß kleinere Drehimpulse l < n − 1 schließlich den Elipsenbahnen des Keplerproblems entsprechen. Kein klassisches Analogon besitzt der Grundzustand u1 0 (r) ∼ re−r/a0 bzw. χ1 0 0 (r) ∼ e−r/a0 (180) des Elektrons im Wasserstoffatom mit der “Nullpunktsenergie” E1 = −R = −13.6 eV. Er entspricht einem Elektron ohne Drehimpuls, das sich aufgrund der Coulombattraktion im Kern aufhalten “möchte”, daran aber durch die Orts– Impuls–Unschärfe gehindert wird. Tatsächlich wird die Wahrscheinlichkeitsdichte w1 (r) ∼ χ21 0 0 = e−2r/a0 am Kernort r = 0 am größten. Der Grundzustand des Wasserstoffatoms entspricht also ganz dem klassisch ebenfalls nicht verständlichen Grundzustand des harmonischen Oszillators. 72 Wir schließen die Behandlung des Wasserstoffatoms mit einem neuen Gesichtspunkt zur korrekten Interpretation der Wellenfunktionen. Es liegt ja so nahe (wie das in vielen Büchern durch Abbildungen implizit suggeriert wird), ψ ∗ ψ bzw. χ∗ χ als Dichteverteilung eines ausgeschmierten Elektrons zu interpretieren. Diese Interpretation hat darüber hinaus zunächst den Vorteil, daß sie erklärt, warum stationäre Zustände nicht strahlen. Nimmt man diese Interpretation aber ernst,so muß man im Potential die Raumladungsdichte %e = −e|χ|2 berücksichtigen und erhält e2 e2 + V (r) = − 4πε0 r 4π Z |χ(r0 )|2 3 0 d r. |r − r0 | Die stationäre Schrödingergleichung e2 h̄2 ∆χ + 2m 4πε0 |χ(r0 )|2 3 1 χ = Eχ d r− 0 |r − r | r (Z ) wird damit eine sehr verwickelte nicht–lineare Integro–Differentialgleichung. Sie ist aber nicht nur schwierig zu lösen, sondern nach Ausweis der Erfahrung falsch! Der Term e2 4πε0 Z |χ(r0 )|2 3 d r, |r − r0 | der eine “Selbst–Wechselwirkung” des Elektrons darstellt, würde eine innere elektrostatische Abstoßung der ausgeschmierten “Elektronenwolke” bewirken, die weder im Wasserstoffatom noch in irgendeinem anderen Experiment beobachtet wird. Wir hüten uns also davor, das Elektron im Wasserstoffatom (und anderswo) als Ladungswolke mit einer charakteristischen Ausdehnung a0 zu beschreiben. 73 4 4.1 Mehrteilchensysteme Die Schrödingergleichung Wir haben bisher nur die Quantenmechanik eines Teilchens mit einer Hamiltonfunktion H(r1 , p1 ) betrachtet. Diesem Teilchen hatten wir eine Wellenfunktion |1i = ψ(r1 , t) zugeordnet, deren Absolutquadrat ψ ∗ ψ die Wahrscheinlichkeitsdichte angab, das Teilchen 1 am Ort r1 zu finden. ψ genügte der Schrödingergleichung H(r1 , p1 )ψ = ih̄ ∂ψ , ∂t wobei H den Hamiltonoperator bezeichnet, der aus der Hamiltonfunktion hervorgeht, indem der Impuls durch den Impulsoperator p1 = h̄ h̄ d ∇1 = i i dr1 ersetzt wird. Es liegt nahe und hat sich bewährt, dieses Konzept wie folgt auf Systeme von n Teilchen zu übertragen: Wir führen eine Wellenfunktion |1, . . . , ni = ψ(r1 , . . . , rn , t) (181) ein, deren Absolutquadrat ψ ∗ ψ die Wahrscheinlichkeitsdichte angibt, Teilchen 1 bei r1 , Teilchen 2 bei r2 , . . . und Teilchen n bei rn zu finden. Das heißt genauer: dW = |ψ(r1 , . . . , rn , t)|2 d3 r1 . . . d3 rn (182) ist die Wahrscheinlichkeit, das System der Teilchen 1, . . . , n im Volumenelement d3 r1 . . . d3 rn des 3n–dimensionalen Konfigurationsraums anzutreffen. Aus der klassischen Hamiltonfunktion H(r1 , . . . , rn , p1 , . . . , pn ) = n X p2ν + V (r1 , . . . , rn ) ν=1 2mν (183) bilden wir den Hamiltonoperator H, indem wir die Impulse durch die Impulsoperatoren 74 pν = h̄ d h̄ ∇ν = i i drν (184) ersetzen. Dann genügt die Wellenfunktion der Schrödingergleichung ∂ |1, . . . ni = H|1, . . . , ni, ∂t (185) n X h̄2 ∂ψ =− ∆ν ψ + V (r1 , . . . , rn )ψ. ∂t ν=1 2mν (186) ih̄ oder explizit ih̄ Wie bisher können wir durch den Separationsansatz E ψ(r1 , . . . , rn , t) = ϕ(r1 , . . . , rn )e−i h̄ t (187) zu stationären Zuständen ϕ übergehen, die der stationären Schrödingergleichung − h̄2 ∆ν ϕ + V (r1 , . . . , rn )ϕ = Eϕ. ν=1 2mν n X (188) genügen. Im Gegensatz zum Einteilchenproblem wollen wir dieses Konzept aber nicht mehr durch explizite Lösungsbeispiele illustrieren, da schon das klassische Mehrteilchenproblem nicht mehr analytisch lösbar ist25 . Stattdessen wollen wir einige prinzipielle Aspekte ansprechen, die kein klassisches Analogon besitzen und für die Atomphysik bedeutsam sind. 4.2 Identische Teilchen und Spin Wir betrachten zwei identische Teilchen 1,2 mit dem symmetrischen Hamiltonoperator H= 1 (p2 + p22 ) + V (r1 ) + V (r2 ) + U (|r1 − r2 |). 2m 1 (189) Eine Lösung der Schrödingergleichung, die etwa aus der Anfangsbedingung ψ12 (t = 0) = ψa (r1 , 0)ψb (r2 , 0) 25 Eine Separation in Relativ– und Schwerpunktskoordinaten ist auch quantenmechanisch möglich. Dementspreched ist auch das quantenmechanische Zweiteilchenproblem ohne äußere Kräfte auf das Einteilchenproblem zurückzuführen. 75 (unkorrelierte Anfangszustände) hervorgehe, sei ψ12 = ψab (r1 , r2 , t). Wollen wir |ψ12 |2 nach Gl.(182) als Wahrscheinlichkeitsdichte interpretieren, so müssen wir uns fragen, wie wir die Teilchen 1 und 2 unterscheiden wollen. Denn die Quantenmechanik beschreibt nicht die Dinge an sich, sondern unsere Beobachtung. In der klassischen Physik ist dies kein Problem, denn wir können die Teilchen einfach unterscheiden, indem wir a) die Teilchen durch Marken (z. B. Farbe, Zeichen), welche die Dynamik nicht beeinflussen, kennzeichnen oder b) die Teilchen identifizieren, indem wir ihre Bahn verfolgen. Für identische mikroskopische Objekte kennen wir keine Marken, die eine solche Kennzeichnung erlauben. In der Quantenmechanik gibt es auch keine wohldefinierten Bahnen, die wir verfolgen können, insbesondere dann nicht, wenn sich die Wellenfunktionen der Teilchen überlappen. Wir können die Wahrscheinlichkeit, am Ort r1 Teilchen 1 und am Ort r2 Teilchen 2 anzutreffen also gar nicht im Experiment überprüfen, da die Unterscheidung der Teilchen 1 und 2 nicht der Beobachtung zugänglich ist: Wir können nur die Wahrscheinlichkeit angeben, daß sowohl bei r1 als auch bei r2 ein Teilchendetektor anspricht. Da also die Quantenmechanik grundsätzlich nur die (potentielle) Beobachtung beschreibt, müssen wir neben ψ12 auch ψ21 = ψab (r2 , r1 , t) als gleichberechtigte Wellenfunktion zulassen. Aus der Symmetrie von H folgt, daß ψ21 auch der selben Schrödingergleichung genügt26 . Darüber hinaus müssen wir dann auch Linearkombinationen ψ(r1 , r2 , t) = αψ12 + βψ21 in Betracht ziehen. Verlangen wir nun, daß sich die Wahrscheinlichkeitsdichte ψ ∗ ψ bei einer Vertauschung nicht ändert, so folgt |ψ(r1 , r2 , t)|2 = |ψ(r2 , r1 , t)|2 , also ψ(r1 , r2 , t) = cψ(r2 , r1 , t) 26 Entsprechend existieren auch alle Eigenfunktionen doppelt: Man spricht von Austauschentartung. 76 mit c∗ c = 1. Bei zwei Vertauschungen ändert sich natürlich gar nichts, also gilt c2 = 1 oder c = ±1. Den beiden möglichen Vorzeichen entsprechen die beiden einzigen Möglichkeiten ψsym ∼ ψ12 + ψ21 ψasy ∼ ψ12 − ψ21 . und (190) Wellenfunktionen identischer Teilchen sind also entweder symmetrisch oder antisymmetrisch. An dieser Stelle müssen wir auf den Spin eines Teilchens zu sprechen kommen, den die relativistische Diracgleichung postuliert und der beispielsweise durch ein Magnetfeld beobachtbar ist. Der Spin s ist eine vektorielle Observable ohne klassisches Analogon, die quantenmechanisch den selben Rechenregeln folgt wie Drehimpulse27 (Übungen). Auch der Spin ist gequantelt, kann im Gegensatz zu Bahndrehimpulsen aber nicht nur ganzzahlige, sondern auch halbzahlige Vielfache von h̄ annehmen. Es hat sich nun als wichtig erwiesen, zwei Gruppen von Teilchen grundsätzlich zu unterscheiden, nämlich • Fermionen mit halbzahligem Spin und • Bosonen mit ganz zahligem Spin. Zu den Fermionen zählen insbesondere Elektronen, Protonen, Neutronen (Spin 1 ) sowie alle Atomkerne, Atome und Moleküle, die aus einer ungeraden Anzahl 2 (z. B. He3 ) elementarer Fermionen zusammengesetzt sind. Dagegen gehören bestimmte Elementarteilchen wie Pionen und Photonen sowie alle zusammengesetzten Teilchen mit gerader Fermionenanzahl (z. B. He4 ) zu den Bosonen. Für spinbehaftete Teilchen stellt die Richtung von s nun eine Observable dar, die in der ψ–Funktion durch eine zusätzliche (diskrete) Variable berücksichtigt werden muß. Statt ψ(r1 , r2 , t) müssen wir also Zustandsfunktionen ψ̂(r1 , s1 , r2 , s2 , t) betrachten. Für die so komplettierten Wellenfunktionen gilt nun nach Ausweis der Erfahrung • Fermionen werden durch antisymmetrische Wellenfunktionen ψ̂ und 27 Man stellt sich den Spin daher auch gern als inneren Drehimpuls durch eine Rotation des Teilchens vor. Diese Vorstellung kann allerdings das Wesen des Spins nicht erfassen (siehe Übungen). 77 • Bosonen werden durch symmetrische Wellenfunktionen ψ̂ beschrieben. Läßt man den Spin in der Anschrift der ψ–Funktion weg, muß man Fallunterscheidungen je nach Ausrichtung der Spins treffen. Insbesondere gilt für die “elementaren” Fermionen mit Spin 21 : Spin 21 –Teilchen mit paralellem Spin haben anti symmetrische und Spin 12 –Teilchen mit anti paralellem Spin haben symmetrische Wellenfunktionen ψ. Aus der (Anti–)Symmetrie ergibt sich für Fermionen eine Folgerung großer Tragweite: Haben zwei gleiche Fermionen den selben Spin s und werden sie durch die selbe Wellenfunktion ψ0 beschrieben, so wird ψ(r1 , r2 , t) = ψ0 (r1 , t)ψ0 (r2 , t) − ψ0 (r2 , t)ψ0 (r1 , t) = 0. Für die stationären Zustände folgt daraus das Pauli–Prinzip • Zwei gleiche Fermionen können nicht in allen Quantenzahlen übereinstimmen und den selben Spin haben. Anders ausgedrückt: Charakterisieren wir die stationären Zustände, die ein Fermion annehmen kann, durch einen Satz von Quantenzahlen (etwa n, l, m und sz ), so können diese Zustände nur die Besetzungszahlen 0 oder 1 aufweisen. Ein analoges Prinzip für Bosonen gibt es nicht, Bosonenzustände können beliebige Besetzungszahlen 0, 1, 2, . . . annehmen. 4.3 Atombau und periodisches System der Elemente Wir betrachten nun Atomkerne höherer Ladungszahl, die zur Neutralisation mehrere Hüllenelektronen benötigen. Um ein Ordnungsschema in dieses komplexe Problem zu bringen, denken wir uns solche Atome (im Grundzustand) schrittweise aufgebaut: Wir denken uns k − 1 Elektronen bereits mehr oder weniger kugelsymmetrisch um den Kern verteilt und fragen nach den möglichen Zuständen des k–ten Elektrons. Damit können wir an die generelle Diskussion des kugelsymmetrischen Potentials (Abschnitt 3.5) anknüpfen und führen die Quantenzahlen n, l und m ein. Außerdem müssen wir für die Elektronen mit dem Spin 21 noch die beiden Spinrichtungen sz = 21 und sz = − 21 unterscheiden (Richtungquantelung der Drehimpulse). Entsprechend der Hauptquantenzahl n denken wir uns die Atomelektronen in Schalen angeordnet. Innerhalb jeder Schale stehen uns dann die Quantenzahlen l = 0, . . . , n − 1 , m = −l, . . . , l und sz = ± 78 1 2 zur Verfügung. Für die erste Schale n = 1 liegen l = 0 und m = 0 fest, es gibt also für n = 1 genau zwei verschiedene Elektronenzustände mit sz = +1/2 und sz = −1/2. Da nach dem Pauliprinzip jeder Zustand höchstens einfach besetzt ist, kann die erste Schale höchstens zwei Elektronen “aufnehmen”: Sie ist beim Element 2He abgeschlossen. Benötigen wir also mehr als zwei Elektronen, um die Kernladung zu kompensieren, müssen wir die zweite Schale auffüllen. Hier können (l, m) die Dupel (1,1), (1,0), (1,–1) und (0,0) annehmen. Mit den beiden Spinrichtungen gibt das 8 mögliche Zustände in der zweiten Schale, die nach dem Pauliprinzip wieder höchsten einfach besetzt werden können. Beim Element 10Ne ist neben der ersten also auch die zweite Schale abgeschlossen. Generell hatten wir beim Wasserstoff ausgerechnet, daß es zu jeder Hauptquantenzahl n einen Satz von n2 verschiedenen Nebenquantenzahlen gibt. Unter Berücksichtigung der beiden Spinrichtungen kann die n–te Schale also maximal 2n2 Elektronen aufnehmen. Die dritte Schale kann demnach 18 Elektronen aufnehmen und wäre beim Element 28Ni abgeschlossen. Tatsächlich bleibt aber nicht alles so schön wasserstoffähnlich, weil die Elektronen untereinander wechselwirken. Dadurch wird nicht nur die Entartung des Wasserstoffs (Enl hängt hier nicht von l ab) aufgehoben, sondern es kann sogar Enl > En+1 0 werden. Das Atom zieht es dann vor, eine “neue” Schale (n+1) zu beginnen, ehe die “alte” (n) abgeschlossen ist. Der Grund hierfür ist sogar aus der klassischen Mechanik verständlich: Bei niedrigem Drehimpuls hält sich das Elektron weitgehend in Kernnähe auf (vgl. den Grundzustand des Wassestoffs) und “sieht” die übrigen Elektronen nicht. Elektronen mit großem l dagegen halten sich überwiegend in großer Entfernung (vgl. die “Kreisbahnen” beim Wasserstoff für l = n − 1) auf, wo der Kern durch die übrigen Elektronen weitgehend abgeschirmt ist. Darum werden in der Schale n = 3 zunächst nur die acht s– (l = 0) und p– Zustände (l = 1) aufgefüllt, und das ist beim Element 18Ar erreicht. Danach werden zunächst die beiden s–Zustände der vierten Schale besetzt (19K und 20Ca) und dann erst die zehn d–Zustände (l = 2) der dritten Schale aufgefüllt. Das Element 30Zn hat also eine voll besetzte dritte Schale und — wie 20Ca — zwei s–Elektronen in der vierten Schale. Bei 31Ga wird nun ein drittes Elektron in die vierte Schale aufgenommen, und bei 36Kr sind die energetisch günstigen s– und p–Zustände der vierten Schale besetzt. In ähnlicher Weise geht es weiter, 79 die Details sind in der folgenden Tabelle zusammengefaßt, die angibt, in welchem Zustand das letzte (oder vorletzte28 ) Elektron eingebaut wird. s p d f 1 1H 2He 2 3Li 5B 7N 9F 4Be 6C 8O 10Ne 3 11Na 13Al 15P 17Cl 21Sc 23V 25Mn 27Co 29Cu 12Mg 14Si 16S 18A 22Ti 24Cr 26Fe 28Ni 30Zn 4 19K 31Ga 33As 35Br 39Y 41Nb 43Tc 45Rh 47Ag 58Ce 60Nd 62Sm 64Gd 66Dy 68Er 70Y 20Ca 32Ge 34Se 36Kr 40Zr 42Mo 44Ru 46Pd 48Cd 59Pr 61Pm 63Eu 65Tb 67Ho 69Tm 71Lu 5 37Rb 49In 51Sb 53J 57La 73Ta 75Re 77Ir 79Au 90Th 92U 94Pu 96Cm 98Cf 100 102 38Sr 50Sn 52Te 54Xe 72Hf 74W 76Os 78Pt 80Hg 91Pa 93Np 95Am 97Bk 99E 101 103 6 55Cs 81Tl 83Bi 85At 89Ac ... 56Ba 82Pb 84Po 86Rn 104 7 87Fr Da die chemischen Eigenschaften eines Elements wesentlich durch die Elektronen der äußersten Schale bestimmt sind, kommt man so zu einer gewissen Periodizität der chemischen Eigenschaften, z. B.: - Ist die äußerste Schale — oder ihre energetisch besonders günstigen s– und p–Zustände — gerade abgeschlossen, ist das Atom besonders stabil, d. h. chemisch träge: Wir haben Edelgase (2He, 10Ne, 18A, 36Kr, . . . ). - Fehlen nur wenige Elektronen an einer solchen Edelgaskonfiguration, nimmt das Atom bei Reaktionen “gern” Elektronen auf (Halogene und Chalkogene). - Ist dagegen die äußerste Schale nur mit wenigen Elektronen besetzt, werden diese in Reaktionen leicht abgegeben (Alkali– und Erdalkali–Metalle). Die Quasi–Periodizität demonstriert man im Periodischen System der Elemente mit - Hauptgruppen, in denen nur s– und p–Zustände eine Rolle spielen - Nebengruppen, in denen die d–Zustände aufgefüllt werden und - den Lanthanoiden und Aktinoiden, in denen schließlich die f–Zustände aufgefüllt werden. 28 Bei konkurrierenden Zuständen kommt es gelegentlich zu kleinen Verschiebungen. Beispielsweise besitzen Cu, Ag und Au nur ein s–Elektron in der äußersten Schale, so daß bei Zn, Cd und Hg nicht ein d– sondern das fehlende s–Elektron eingebaut wird. 80 88Ra 4.4 Die Bildung von Molekülen Ein 17Cl–Atom hat gerade noch Platz für ein Elektron frei, um die energetisch günstige 18A–Konfiguration auszunutzen. Ein 19K–Atom dagegen hat für diese Konfiguration gerade ein Elektron zuviel und muß eine neue — energetisch viel ungünstigere — Schale “anbrechen”. Bringt man daher ein K– und ein Cl–Atom zusammen, so ist es energetisch günstig, wenn das K–Atom ein Elektron an das Cl abgibt. Freilich bleiben die Atome dabei nicht elektrisch neutral, sondern werden zu K+ – und Cl− –Ionen. Aufgrund der elektrostatischen Anziehung werden diese Ionen also aneinander “gekettet”: K und Cl gehen eine heteropolare oder Ionen– Bindung ein und bilden ein KCl–Molekül — oder genauer: Viele K+ – und Cl− – Ionen bilden ein Ionengitter. Diese einfache Ionenbindung ist jedoch nicht der Regelfall. Schließen sich insbesondere zwei gleiche Atome zu einem Molekül (Beispielsweise H2 ) zusammen, so erwarten wir schon aus Symmetriegründen keine elektrische Aufladung der beiden Reaktionspartner: Die Bindung ist nun homöopolar29 (man spricht auch von Atombindung). Die homöopolare Bindung ist rein klassisch nicht zu verstehen und quantenmechanisch schwierig zu beschreiben. Wir begnügen uns daher mit einer skizzenhaften Erläuterung der Bildung des H2 –Moleküls. Dazu betrachten wir zwei räumlich fixierte Wasserstoffkerne (A) und (B) im Abstand a und notieren den Hamiltonoperator e2 h̄2 (∆1 + ∆2 ) − H=− 2m 4πε0 1 1 1 1 1 1 + + + − − r1A r2B r1B r2A r12 a (191) des Systems der beiden Elektronen (1) und (2) (siehe Skizze). 1 r12 2 r1A r2B r2A r1B A B a Bei hinreichend großem Abstand (a a0 ) der Kerne sind die vier letzten Terme zu vernachlässigen und H ist die Hamiltonfunktion zweier ungestörter H–Atome. Der Grundzustand des Systems ist dann durch 29 In der Chemie gibt es stufenlose Übergänge zwischen diesen Haupt–Bindungsarten. 81 ϕ1 (r1 , r2 ) = χA (r1 )χB (r2 ) (192) gegeben, wobei χA (r1 ) = χ1 0 0 (r1A ) und χB (r2 ) = χ1 0 0 (r2B ) den jeweiligen Grundzustand der beiden Wasserstoffatome bezeichnen. Machen wir a kleiner, kommen die “Störglieder” allmählich ins Spiel. Dabei wird (192) aber zunächst noch eine brauchbare Näherung bleiben. Allerdings müssen wir wegen der Ununterscheidbarkeit der Elektronen und der Symmetrie des Hamiltonoperators ϕ2 (r1 , r2 ) = χA (r2 )χB (r1 ) (193) als gleichwertige Näherung betrachten. Da die Elektronen Fermionen mit Spin 1 sind, müssen wir aus (192) und (193) symmetrische oder antisymmetrische 2 Wellenfunktionen ϕ± = ϕ 1 ± ϕ 2 (194) bilden, je nachdem der Spin antiparallel oder parallel ausgerichtet ist. Mit dieser — allein aus dem Grundzustand des Wasserstoff–Atoms konstruierten — Näherung für die Wellenfunktion berechnen wir die Näherung E± = hϕ± |H|ϕ± i hϕ± |ϕ± i für die Energie des Systems der beiden Elektronen und erhalten unter Ausnutzung der Symmetrie E± = hϕ1 |H|ϕ1 i ± hϕ1 |H|ϕ2 i . 1 + hϕ1 |ϕ2 i (195) Dabei geht hϕ1 |H|ϕ1 i für große Abstände a in die Energie E1 = −2R der Grundzustände der Wasserstoffatome über. Den entscheidenden Beitrag der Wechselwirkung beschreibt das Austauschintegral hϕ1 |H|ϕ2 i. Mit der Näherung (195) kann man E± in Abhängigkeit von a explizit berechnen und findet E± → ∞ für a → 0 und E± → −2R für a → ∞. Aber während E− (antisymmetrische Wellenfunktion, paralleler Spin) dabei monoton fällt, durchläuft E+ (symmetrische Wellenfunktion, antiparalleler Spin) dabei ein Minimum bei am ≈ 8 · 10−11 m: 82 E −2R E−(↑↑) a am E+(↑↓) Da −dE/da als Kraft auf die beiden Atome30 wirkt, bleiben die beiden Atome bei antiparallelem Elektronenspin im Abstand am stabil beieinander: Ein H2 –Molekül ist gebildet. Die Bindung ist nur bei antiparallelem Spin möglich, da hier die beiden Elektronen einen gemeinsamen Ortszustand besetzen und sich in der Mitte der Kerne “konzentrieren” können. Dabei überwiegt die Anziehung zwischen Elektronen und Kernen die gegenseitige Abstoßung der Elektronen und hält das Molekül zusammen. Da die effektive Kraft, die die beiden Atome bindet, entscheidend auf dem Elektronenaustausch beruht, wird sie auch Austauschkraft genannt. Dieser gebräuchliche Name führt allerdings leicht zu einem Mißverständnis. Die Austauschkraft beruht nämlich keineswegs auf einer neuen mystischen “Quantenkraft”, die wir klassisch nicht verstehen, sondern einzig auf der wohlvertrauten Coulombwechselwirkung. Diese Wechselwirkung wird allerdings – und hier kommt die Quantenmechanik ins Spiel – durch den Austauscheffekt bzw. das Pauliprinzip so modifiziert, daß sie ein Potentialminimum bildet und so die Bindung der beiden Atome ermöglicht. 30 Wegen der großen Massen brauchen wir diese nicht quantenmechanisch zu beschreiben. 83 5 Die Interpretation der Quantenmechanik Wir beenden die Analyse spezieller Probleme und wenden uns wieder der allgemeinen Diskussion der Interpretation der Quantenmechanik zu. Dazu stellen wir zunächst noch einmal die Grundzüge des Formalismus zusammen und bringen einige Ergänzungen an. 5.1 Der Formalismus Die quantenmechanischen Systeme – oder besser: Unsere Erwartungen bei ihrer Beobachtung – werden durch Zustandsvektoren (Zustandsfunktionen) |ψi = ψ(r, t), (196) beschrieben. Das Absolutquadrat ψ ∗ ψ gibt nach Born die Wahrscheinlichkeitsdichte an, das System bei r zu finden. Dynamische Variable A(r, p) und sonstige Observable (z. B. Spin) werden durch quantenmechanische Operatoren, die auf |ψi wirken, repräsentiert. Speziell dem Impuls eines Teilchens ist der Operator p= h̄ ∇ i (197) zugeordnet. In der klassischen Mechanik läßt sich der Wert A(t) = A(r(t), p(t)) einer dynamischen Variablen im Prinzip präzise berechnen. Dagegen lassen sich zu den quantenmechanischen Observablen A im allgemeinen “nur” Erwartungswerte hAi = hψ|A|ψi (198) angeben. Die Forderung reeller Erwartungswerte wird durch hermitesche Operatoren sichergestellt. Der entscheidende Unterschied zur klassischen Mechanik ist darin begründet, daß Operatoren im allgemeinen nicht vertauschbar sind, daß also der Kommutator [A, B] = AB − BA (199) nicht verschwindet. Aus Gl.(197) folgen die speziellen Kommutatoren [pi , xj ] = h̄ h̄ ∂xj = δij . i ∂xi i 84 (200) Man kann statt von Gl.(197) direkt von den Vertauschungsrelationen (200) ausgehen und die ganze Quantenmechanik algebraisch aufbauen. Gl.(197) ist dann nur eine spezielle Darstellung, die Ortsdarstellung. Statt r kann man beispielsweise auch p als Variable benutzen und eine Zustandsfunktion ψ̃(p, t) definieren. Den Vertauschungsregeln (200) entsprechend wird dann der Ort durch den Operator r = ih̄ d dp repräsentiert. Diese äquivalente Darstellung wird Impulsdarstellung31 genannt. Die zeitliche Entwicklung des Zustandsvektors folgt der Schrödingergleichung ih̄ ∂ |ψi = H|ψi , ∂t (201) wobei H den Hamiltonoperator bezeichnet. (Diese Gleichung gilt in jeder Darstellung, aber nicht in jedem Bild, s. u.). Für den Erwartungswert hAi erhält man damit d hAi = hψ|A|ψ̇i + hψ̇|A|ψi dt 1 1 = hψ|AH|ψi − hψ|HA|ψi ih̄ ih̄ 1 hψ|(AH − HA)|ψi = ih̄ oder – in Verallgemeinerung der Ehrenfest-Beziehungen (69, 70) – d 1 hAi = h[A, H]i. dt ih̄ (202) Dieses Ergebnis läßt sich auch anders interpretieren: Statt die Zustände als Funktionen der Zeit zu betrachten (Schrödingerbild) und mit der Schrödingergleichung zu berechnen, können wir die Zustände festhalten und den Operatoren eine eigene Zeitabhängigkeit zubilligen (Heisenbergbild). Dieses alternative Bild lehnt sich also im Grunde noch enger an die klassische Mechanik an. Die Operatoren AH des Heisenbergbildes genügen dann der Heisenberggleichung 1 d AH = [AH , H] . dt ih̄ 31 (203) Orts– und Impulsdarstellung gehen durch eine Fouriertransformation auseinander hervor. 85 Man beachte, daß die Gl. (201) und (203) zu verschiedenen Bildern gehören und nicht nebeneinander benutzt werden dürfen. Um daran zu erinnern, haben wir die Operatoren AH des Heisenbergbildes durch den Index H gekennzeichnet32 . Erfüllt der Zustandsvektor |ui die Gleichung A|ui = a|ui, (204) so heißt |ui Eigenvektor (Eigenfunktion) und a Eigenwert des Operators A. Die Eigenwerte hermitescher Operatoren sind reell und die Eigenfunktionen zu verschiedenen Eigenwerten sind orthogonal. Die Gesamtheit {aν } der Eigenwerte nennt man das Spektrum des Operators A. Wir übergehen hier die formalen Schwierigkeiten, die mit kontinuierlichen Spektren verbunden sind und und setzen voraus, daß A ein diskretes Spektrum und ein vollständiges System normierter Eigenvektoren mit huν |uµ i = δνµ (205) besitzt. Dann läßt sich jeder beliebige Zustandsvektor in der Form |ψi = X ν cν |uν i (206) nach den Eigenvektoren von A entwickeln. (Als Beispiel hatten wir die Entwicklung nach den Eigenfunktionen des Hamiltonoperators kennengelernt.) Damit erhält man den Erwartungswert hAi = hψ|A|ψi = X ν,µ c∗ν cµ huν |A|uµ i oder wegen (204) und (205) hAi = X ν,µ c∗ν cµ aµ huν |uµ i = X c∗ν cν aν . ν Entsprechende Beziehungen hAn i = X c∗ν cν anν und ν hf (A)i = X c∗ν cν f (aν ) (207) ν gelten dann auch für alle Potenzen von A und schließlich für alle hinreichend gutartigen Funktionen f (A). Daraus läßt sich zeigen33 : 32 33 Der Hamiltonoperator stimmt in beiden Bildern überein. siehe z.B. Messiah, Bd. 1, Abschnitt 5.2.3. 86 - Die einzigen Werte, die eine Observable A annehmen kann, sind die Eigenwerte aν des Operators A. - Die Wahrscheinlichkeit w(aν ), daß die Observable A den Wert aν annimmt, ist durch w(aν ) = c∗ν cν (208) gegeben. Die Interpretation des Absolutquadrats der Entwicklungskoeffizienten cν als Wahrscheinlichkeit für die Realisierung des speziellen Wertes aν der Observablen A geht ebenfalls auf Born zurück. 5.2 Meßprozeß und Zustandsvektor Der soweit skizzierte Formalismus und seine Interpretation weisen noch einen entscheidenden Mangel auf: Um zu unseren Erwartungswerten und Wahrscheinlichkeiten zu kommen, müssen wir den Zustandsvektor kennen. Der aber läßt sich nur dann aus der Schrödingergleichung34 berechnen, wenn wir den Anfangszustand |ψit=0 spezifizieren können. Wie aber sollen wir einen Zustandsvektor festlegen, dem wir gar keine unmittelbare physikalische Bedeutung zubilligen? Jede physikalische Information muß natürlich letztlich aus Messungen gewonnen werden, und wir beantworten die oben gestellte Frage aus einer Grundannahme über ideale Messungen: • Wird eine ideale Messung “unmittelbar” wiederholt, so liefert sie mit Sicherheit das selbe Resultat. Diese Grundannahme ist es wert, ein wenig darüber nachzudenken. Die Quantenmechanik liefert uns ja häufig nur Wahrscheinlichkeitsaussagen. Im allgemeinen können wir ein Meßergebnis also nicht präzise vorhersagen. Ein Meßprozeß ist aber kein Würfelspiel mit unverbindlichem Ergebnis: Habe ich drei Augen gewürfelt, ist das für das Ergebnis einer Wiederholung des Wurfs ohne jeden Belang. Das Ergebnis einer Messung soll dagegen reproduzierbar sein, ein Vergleich mit dem Würfelspiel würde der Experimentalphysik – und letztlich der gesamten Naturwissenschaft – den Boden entziehen. Habe ich also den Wert a einer Observablen A gemessen, so soll dieser Wert verbindlich sein. Ich sage, die Observable A hat den Wert a, und das heißt: Für eine erneute Messung von A läßt sich der Wert a vorhersagen. Die erneute Messung muß natürlich so “unmittelbar” erfolgen, daß die Dynamik des Systems den Zustand noch nicht verändert hat. 34 Wir bleiben wie wir es gewohnt sind im Schrödingerbild. 87 Wir kommen damit zur Ermittlung des Zustandsvektors |uit=0 aus einer Messung: Habe ich zur Zeit t = 0 den Wert ak einer Observablen A gemessen, so weiß ich, daß eine unmittelbar folgende identische Messung mit der Wahrscheinlichkeit 1 wieder ak liefern würde. Aus Gl.(208) folgern wir w(ak ) = c∗k ck = 1 und w(aν ) = c∗ν cν = 0 für ν 6= k oder – abgesehen von einem belanglosen Phasenfaktor – |ψit=0 = |uk i. (209) Diesen Schluß können wir natürlich nur ziehen, wenn der Meßwert ak tatsächlich nur mit einem Eigenvektor |uik verträglich ist, wenn also der Eigenwert ak einfach ist. Das Problem der Entartung wird damit zu einem physikalischen Problem. Wenn wir etwa beim Wasserstoffatom die Energie En messen, so können wir noch nicht auf den Zustand schließen, da n2 verschiedene Eigenfunktionen χnlm zum Eigenwert En gehören. An diesem Beispiel wird aber auch schon deutlich, wie diese Schwierigkeit zu beheben ist: Außer der Energie E müssen wir auch das Drehimpulsquadrat L2 und die Drehimpulskomponente Lz bestimmen. Voraussetzung dafür, daß zwei Operatoren A und B (etwa E und L2 im obigen Beispiel) gemeinsame Eigenvektoren |ui besitzen, ist, daß A und B vertauschbar sind. Denn aus A|ui = a|ui und B|ui = b|ui folgt ja sofort AB|ui = ab|ui = BA|ui . Umgekehrt können Observable, deren Operatoren vertauschbar sind, gleichzeitig scharf gemessen werden, sie sind kommensurabel. Darüber hinaus kann man zeigen, daß sich aus den Eigenvektoren vertauschbarer Operatoren immer eine gemeinsame Basis auswählen läßt. Damit ist auch das Problem der Entartung gelöst: Ich muß so viele kommensurable Observablen A, B, . . . messen, bis der Zustand (der gemeinsame Eigenvektor) |ui eindeutig festliegt, die Entartung also aufgehoben ist. Wir halten also fest: • Der Anfangszustand |ψit=0 läßt sich durch eine geeignete Folge von Messungen kommensurabler Observablen eindeutig festlegen. Messungen kommensurabler Observablen heißen auch verträglich. Dagegen sind Messungen von Observablen A und B nicht verträglich, wenn die Operatoren A und B nicht vertauschbar sind. Zwischen A und B besteht nämlich dann eine Unschärfebeziehung [vgl. Gl. (78)] 88 2 2 h∆A ih∆B i ≥ 1 [A, B] 2i 2 , die es verbietet, A und B gleichzeitig scharf zu messen. Und wenn ich trotzdem messe? Darf ich dann die Meßwerte nicht mehr ernst nehmen? Nehmen wir an, ich habe zuerst A (Ergebnis a) und dann B (Ergebnis b) gemessen. Nach unserer Grundannahme über (ideale) Messungen müssen wir dann auf jeden Fall das Ergebnis b als verbindlich ansehen. Nach der Unschärfebeziehung muß dann aber der Wert der Observablen A wieder gänzlich unbestimmt sein: Das Meßergebnis a der ersten Messung wird also durch eine nicht verträgliche zweite Messung bedeutungslos – so bedeutungslos wie die Augenzahl beim Würfeln! In den meisten Fällen können wir uns diese befremdliche Tatsache mit der Störung durch den Meßprozeß erklären. Bringen wir beispielsweise im Heisenbergschen Gedankenexperiment der optischen Ortsbestimmung (vgl. Abschnitt 2.6) ein ruhendes Teilchen unter das Mikroskop, so kennen wir dessen Impuls p = 0 (1. Messung). Zur genauen Ortsbestimmung (2. Messung) müssen wir anschließend das Teilchen aber mit hochenergetischen Photonen beschießen, und dieser Beschuß macht das Ergebnis der vorherigen Impulsmessung bedeutungslos (Comptoneffekt). Allerding gibt es auch Fälle, in denen nicht so einfach zu verstehen ist, warum eine unverträgliche zweite Messung die erste Messung ungültig macht (siehe Abschnitt 5.3). Die Bestimmung des Zustandsvektors durch Messungen hat eine bedeutsame Konsequenz: Der Zustandsvektor wird durch den Meßprozeß im allgemeinen geändert. Normalerweise wird |ψi nämlich keineswegs als Eigenfunktion |uk i vorliegen. Vielmehr wird sich |ψi nach der Festlegung der Anfangsbedingungen durch frühere Messungen gemäß der Schrödingergleichung entwickeln und zum Meßzeitpunkt t0 − 0 in der allgemeinen Form (vgl. (206)) |ψit=t0 −0 = X ν cν |uν i vorliegen. Messe ich also zum Zeitpunkt t = t0 die Observable A, so ist das Ergebnis nicht von vornherein determiniert, sondern kann mit der Wahrscheinlichkeit c∗ν cν jeden Wert aν annehmen. Nach der Messung (t = t0 + 0) steht das Ergebnis ar aber fest und soll verbindlich, also reproduzierbar sein. Daraus folgt wie oben, daß nach der Messung der Zustandsvektor |ψit=t0 +0 = |ur i. vorliegt. Mit dem Meßprozeß ist also notwendigerweise eine spontane Änderung 89 |ψit=t0 −0 = X ν cν |uν i −→ |ψit=t0 +0 = |ur i (210) des Zustandsvektors verbunden. Diese Änderung wird als Reduktion des Zustandsvektors bezeichnet. Da hierbei aus der Summe der |uν i ein Eigenvektor |ur i “herausgefiltert” wird, spricht man auch von einem Filterprozeß. Dieser Filterprozeß wird keineswegs durch die Schrödingergleichung beschrieben, er wird vielmehr ad hoc durchgeführt, sobald das Ergebnis ar der Messung feststeht. Natürlich liegt es wieder nahe, diese unberechenbare Zustandsänderung auf die Wechselwirkung mit dem Meßgerät zurückzuführen. Wir werden jedoch sehen, daß eine solche Interpretation in manchen Fällen problematisch ist. Wir können dem Problem ausweichen, wenn wir uns konsequent auf unsere Interpretation der Quantenmechanik beziehen: |ψi beschreibt nicht ein physikalisches System an sich, sondern unsere Information über das System. Und diese Information ändert sich spontan durch einen Meßprozeß, genauer: durch die Kenntnisnahme des Meßresultats. Natürlich bringen wir genau damit den philosophischen Streit zwischen Positivisten und Realisten auf den Punkt: “Ändert sich das Weltall, wenn eine Maus es anschaut?” (Einstein). Nebenbei sei bemerkt, daß die Zustandsreduktion auch ein zweites Problem der modernen Naturphilosophie tangiert: Sie ist nicht zeitumkehrinvariant. 5.3 Das Einstein-Podolsky-Rosen–Paradoxon Die positivistische Interpretation der Kopenhagener Schule ist letztlich unangreifbar, da sie sich von vornherein auf Aussagen über die Beobachtung beschränkt. Und die Aussagen der Quantenmechanik über die Beobachtung sind nach unserem heutigen Wissenstand uneingeschränkt richtig. Trotzdem ist diese Interpretation unbefriedigend: Die Beobachtung hängt eben doch davon ab, ob eine Maus die Welt anschaut oder nicht. Dabei sind die meisten Menschen einschließlich der Theoretiker, solange sie nicht gerade die Grundlagen der Quantenmechanik diskutieren, überzeugt, daß es unabhängig von der Beobachtung eine objektive Realität gibt. Einstein, der sich nie mit dem Kopenhagener Positivismus anfreunden konnte, war deshalb überzeugt, daß die Quantenmechanik zwar richtig aber nicht vollständig ist. Unmittelbar nach seiner Emigration veröffentlichte er zusammen mit seinen Mitarbeitern Podolsky und Rosen eine Arbeit35 unter dem Titel “Can Quantum–Mechanical Description of Physical Reality Be Considered Complete?”, in der er seine Überzeugung an einem berühmt gewordenen Paradoxon demonstrierte. 35 A. Einstein, B. Podolsky and N. Rosen, Phys. Rev. 47, 777 (1935) 90 Die Arbeit tangiert natürlich die Grenzen zur Philosophie und beginnt deshalb mit begrifflichen Klarstellungen. Einstein, Podolsky und Rosen – im folgenden kurz EPR genannt – widerstehen dabei der gefährlichen Versuchung, den Begriff der Vollständigkeit definieren zu wollen. Vielmehr begnügen sie sich mit der Formulierung einer notwendigen Bedingung für die Vollständigkeit einer physikalischen Theorie: • Every element of the physical reality must have a counterpart in the physical theory. Akzeptiert man diese Bedingung, bleibt zu klären, was unter einem Element der physikalischen Realität zu verstehen ist. Auch hier verzichten ERP auf eine umfassende Definition und begnügen sich mit einem konstruktiven Kriterium: • If, without in any way disturbing a system, we can predict with certainty (i.e. with probability equal to unity) the value of a physical quantity, then there exists an element of physical reality corresponding to this physical quantity. Man beachte, daß dieses Kriterium gezielt bei der Interpretation der Unschärfe durch die Störung bei einer Messung ansetzt! Und genau in der Konstruktion einer strungsfreien Messung inkommensurabler Größen liegt auch der Kern des EPR Gedankenexperiments (s.u.). Angewendet auf physikalische Observable, deren Operatoren nicht vertauschen, folgern EPR: entweder: ”The quantum–mechanical desription of reality given by the wave function is not complete” oder: ”When the operators corresponding to two physical quantities do not commute the two quantities cannot have simultaneous reality,” also kurz: Entweder ist die Quantenmechanik unvollständig oder konjugierte Observable wie x und p besitzen keine simultane Realität. Das konkrete Gedankenexperiment von EPR ist in dem Kasten auf der folgenden Seite dargestellt. Wir beziehen uns hier auf eine einfachere Variante, die auf Bohm zurückgeht36 . Bohm betrachtet zwei Spin 21 –Teilchen, die aus dem Zerfall eines Teilchens mit Spin 0 hervorgehen. Da der Gesamtspin 0 erhalten bleibt, ist der Spin der Teilchen 1 und 2 immer antiparallel. Messe ich also am Teilchen 1 die Spinkomponente s1ν und finde aν (= ±h̄/2), so weiß ich mit Sicherheit, daß ich bei Teilchen 2 die Spinkomponente s2ν = −aν finden werde. 36 D. Bohm, Quantum Theory (Sec. 22.16), Prantice–Hall Inc., Englewood Cliffs (N.J.) 1951. 91 Die Originalversion des EPR–Gedankenexperiments Allerdings sind sie nicht – weder direkt noch auf dem Umweg über Teilchen 1 – simultan meßbar. Daraus schließen EPR, daß die Quantenmechanik unvollständig ist. Zur Bestätigung der entscheidenden Arbeitshypothese, daß ϕk (x2 ) und χr (x2 ) tatsächlich Eigenfunktionen nicht vertauschbarer Operatoren sein können, gehen EPR von der speziellen Wellenfunktion Zwei (eindimensionale) Teilchen wechselwirken im Zeitintervall [0, T ] und werden zu einem späteren Zeitpunkt t > T durch eine Wellenfunktion ψ(x1 , x2 ) beschrieben. Diese Wellenfunktion können wir in der Form ψ(x1 , x2 ) = X ϕν (x2 )uν (x1 ) bzw. ν ψ(x1 , x2 ) = X χµ (x2 )vµ (x1 ) µ ψ(x1 , x2 ) = 2πh̄δ(x1 − x2 + x0 ) = Z ∞ i e h̄ (x1 −x2 +x0 )p dp . nach den Eigenfunktionen uν eines Operators A bzw. vµ eines Operators B des Teilchens 1 entwickeln. Die Entwicklungen sind verschieden, wenn A und B nicht vertauschen. Und nun führen wir eine Messung am Teilchen 1 durch, ohne das Teilchen 2 auf irgendeine Weise zu stören; die Teilchen stehen ja nicht mehr miteinander in Wechselwirkung! Für die daraus folgende Reduktion der Wellenfunktion können wir zwei Fälle unterscheiden: −∞ aus. Sie beschreibt ein System von zwei Teilchen mit scharfer Relativkoordinate x2 −x1 = x0 . Dementsprechend ist der Relativimpuls völlig unbestimmt, während der Gesamtimpuls (= 0, s. u.) wieder bekannt ist. Ist nun A der Impuls des Teilchens 1, so erhält man die Eigenfunktionen up (x1 ) = i e h̄ x1 p zum Eigenwert p. Das liefert die Entwicklung Z ψ(x1 , x2 ) = ϕp (x2 )up (x1 )dp mit 1. Wir messen die Observable A, finden das Resultat ak und erhalten die neue Wellenfunktion ϕk (x2 )uk (x1 ). 2. Wir messen die Observable B, finden das Resultat br und erhalten die neue Wellenfunktion χr (x2 )vr (x1 ). i ϕp (x2 ) = e− h̄ (x2 −x0 )p . Die Entwicklungskoeffizienten ϕp (x2 ) sind aber gerade die Eigenfunktionen des Impulsoperators P = −ih̄∂/∂x2 des Teilchens 2 zum Eigenwert −p. Daher haben wir einen scharfen Gesamtimpuls p + (−p) = 0. Ist andererseit B der Ort des Teilchens 1, so erhält man die Eigenfunktionen vx (x1 ) = δ(x1 − x) zum Eigenwert x. Daraus folgt die Entwicklung Z ψ(x1 , x2 ) = χx (x2 )vx (x1 )dx mit Wir müssen dem Teilchen 2 für sich allein betrachtet also je nach der Messung am Teilchen 1 zwei verschiedene Wellenfunktionen ϕk (x2 ) und χr (x2 ) zubilligen. Das Paradoxon wird komplett, wenn man annimmt (s. u.), daß ϕk (x2 ) und χr (x2 ) Eigenfunktionen nicht vertauschbarer Operatoren P und Q des Teilchens 2 sind. Dann können wir uns nämlich durch eine Messung am Teilchen 1, also ohne das Teilchen 2 auf irgendeine Weise zu stören, entweder den scharfen Wert p von P oder den scharfen Wert q von Q beschaffen. P und Q sollten also nach dem EPR–Realitätskriterium simultane Elemente der Realität sein. χx (x2 ) = 2πh̄δ(x − x2 + x0 ). Die Entwicklungskoeffizienten χx (x2 ) sind also die Eigenfunktionen des Ortsoperators Q = x2 des Teilchens 2 zum Eigenwert x + x0 . 92 Da sich der Experimentator nach dem Zerfall, also zu einer Zeit, wo er das Teilchen 2 in keiner Weise stört, frei entscheiden kann, welche Spinkomponente des Teilchens 1 er mißt, schließt er mit EPR, daß sämtliche Spinkomponenten des Teilchens 2 wohldefiniert vorliegen müssen: Die Information darüber ist ja offenbar in dem separierten Teilchen 1 “gespeichert”. Alle Spinkomponenten des Teilchens 2 sind also Elemente der physikalischen Realität im Sinne des oben formulierten EPR–Kriteriums. Da der Spin den Rechenregeln des Drehimpulses folgt, gestattet die Quantenmechanik aber jeweils nur die Festlegung einer Spinkomponente, und EPR schließen folglich, daß die Quantenmechanik nicht vollständig ist. Dieses Paradoxon wirft bis heute ernsthafte Probleme auf, und B. d’ Espagnat bemerkt: “Kein Theoretiker, für den die Physik mehr ist als der Vorwand zu einem schönen Formalismus, kann sich unserer Ansicht nach nicht davon betroffen fühlen.” Bohrs Antwort zu EPR erschien postwendend unter dem selben Titel37 . Im Gegensatz zu der kompakten und einleuchtend erscheinenden Darstellung von EPR macht Bohr es dem Leser jedoch nicht ganz leicht, die klare Entgegnung zum Kern des Paradoxons zu erkennen. Er wiederholt die Kopenhagener Positionen und versucht, diese Interpretation durch eine detaillierte und spitzfindige Diskussion verschiedener Experimente zu verdeutlichen. Die eigentliche Kritik Bohrs setzt beim EPR–Kriterium für physikalische Realität ein. Bohr billigt nämlich inkommensurablen Observablen keine simultane Realität zu, da sie nicht simultan beobachtbar sind (Positivismus!). Es ist also nicht nur überflüssig (Feynman) nach dem Ort und dem Impuls eines Teilchens zu fragen, sondern sinnlos, da Ort und Impuls keine a priori Realität zukommt. Sie werden vielmehr erst durch den Meßprozeß realisiert, und die Aussage “Der Experimentator hätte ja auch die komplementäre Variable messen können”, ist eben kein Meßprozeß. (Daß einem präzise vorhersagbaren Phänomen nicht notwendigerweise eine von den Beobachtungsbedingungen unabhängige a priori– Existenz zukommt, mag man sich am Schatten klarmachen!) Ein Gedicht ist lediglich eine mehr oder weniger unregelmäßige Verteilung von Druckerschwärze auf weißem Papier, solange kein Bewußtsein das Zeichenmuster aufnimmt, interpretiert und damit zum Gedicht macht. Und ebenso wird eine Meßgröße erst durch den Meßvorgang (einschließlich der Kenntnisnahme des Resultats) “verwirklicht”. Da es aber keinen Meßvorgang gibt, der x und p (oder sämtliche Spinkomponenten) simultan “verwirklicht”, kommt ihnen auch keine simultane Realität zu. Diese positivistische Geisteshaltung, die zu Beginn des zwanzigsten Jahrhunderts “in Mode kam”, wird schön durch ein Gedicht Christian Morgensterns38 dokumentiert: 37 38 N. Bohr, Phys. Rev. 48, 696 (1935) 1867–1914; aus Palma Kunkel (1916). 93 Der Meilenstein Tief im dunklen Walde steht er, und auf ihm mit schwarzer Farbe, daß des Wandrers Geist nicht darbe: Dreiundzwanzig Kilometer. Seltsam ist und schier zum Lachen, daß es diesen Text nicht gibt, wenn es keinem Blick beliebt, ihn durch sich zu Text zu machen. Ja, noch weiter vorgestellt: Was wohl ist er ungesehen? ein uns völlig fremd Geschehen. Erst das Auge schafft die Welt. 5.4 Schrödinger und seine Katze Auch Schrödinger war Anhänger des Realismus. Ihm hatte anfänglich eine reine Wellentheorie der Materie vorgeschwebt, in der Teilchen durch Wellenpakete repräsentiert sind. Von dieser Lieblingsvorstellung mußte er jedoch abrücken, da außer beim harmonischen Oszillator alle Wellenpakete im Laufe der Zeit auseinanderlaufen. Im Jahr 1935 – kurz nach EPR – publizierte er einen Aufsatz39 “Über die gegenwärtige Situation in der Quantenmechanik”, in dem die gesamte Problematik scharfsinnig analysiert und ausgezeichnet dargestellt ist. Schrödinger weist zunächst darauf hin, daß die Quantenmechanik mit Begriffen arbeitet, die dem klassischen Modell (Ort, Impuls, . . . ; Bohrs Korrespondenzprinzip!) ohne Modifikation entnommen sind. Sie verwendet aber stets nur genau eine Hälfte des klassischen Variablensatzes40 und bringt so statistische Aussagen ins Spiel. Die ψ–Funktion repräsentiert daher einen Erwartungskatalog. Dabei kann die Quantenmechanik aber nicht einfach als Theorie eines klassischen Ensembles verstanden werden. Denn damit ließe sich weder verstehen, warum etwa der Drehimpuls von jedem Koordinatenursprung aus gequantelt erscheint noch ließe sich eine Aufenthaltswahrscheinlichkeit im klassisch verbotenen Bereich erklären. Einen empirischen Standpunkt lehnt Schrödinger nicht grundsätzlich ab, verwahrt sich aber dagegen, ihn “als Diktator zur Hilfe zu rufen in den Nöten physikalischer Methodik”. Damit ist der Vollständigkeitsanspruch Kopenhagens angesprochen. Er geht auch bereits auf EPR ein und bettet die Diskussion in eine sorgfältige Analyse von Meßprozeß und maximaler Kenntnis. Die Zustandsreduktion – nach Schrödinger der interessanteste Punkt der Theorie – wird als geänderter Erwartungskatalog interpretiert. Was die Arbeit jedoch berühmt gemacht hat, ist die Konstruktion eines “burlesken Falles”, der ein neues Paradoxon aufzeigt: Schrödingers Katze. 39 40 E.Schrödinger, Die Naturwissenschaften 23, 807 und 844 (1935). Man beachte dabei die Analogie und den Unterschied zur Hamilton–Jakobi–Theorie. 94 Eine Katze wird in einen undurchsichtigen Kasten gesperrt, in dem ein radioaktives Präparat über einen Geigerzähler einen Hammermechanismus auslösen kann, der eine Ampulle mit Blausäure zerschlägt. Nach einer Stunde sei die Katze mit der Wahrscheinlichkeit 21 vergiftet. Die Quantenmechanik beschreibt das System mit einem Zustandsvektor, der die Wahrscheinlichkeit 12 korrekt angibt. Erst nach Öffnen des Deckels (Messung!) wird der Zustand reduziert und beschreibt die lebendige oder die tote Katze. Kann diese Beschreibung vollständig sein? Ist die Katze nicht auch vor dem Öffnen des Deckels entweder lebendig oder tot? Ein ganz konsequenter Kopenhagener muß diese Frage als sinnlos ablehnen. Allen weniger konsequenten Menschen bleibt nur der Ausweg über eine Ensemble–Interpretation. Die aber ist (s. o.) für die mikroskopischen Quantensysteme zumindest zweifelhaft. 5.5 Verborgene Parameter und Bohms Interpretation Die statistische Interpretation der Quantenmechanik ist mit einem deterministischen Weltbild vereinbar, wenn man annimmt, daß alle “Zufälligkeiten” auf den zufälligen Konstellationen verborgener Parameter beruhen. Solche verborgenen Parameter benutzt ja auch die klassische Statistik, etwa die Koordinaten und Impulse sämtlicher Moleküle in der kinetischen Gastheorie. Entsprechende Bestrebungen in der Quantenmechanik wurden jedoch zunächst aufgegeben, als von Neumann 1932 bewiesen hatte41 , daß eine deterministische Beschreibung mit irgendwie gearteten verborgenen Parametern grundsätzlich mit der Quantenmechanik unvereinbar ist. Interessanterweise wird dieser Beweis weder von EPR und Schrödinger noch von Bohr erwähnt. Aus heutiger Sicht ist der Beweis nicht zwingend, da die Voraussetzungen zu eng gefaßt sind (Bell 1966). Auch Bohm ging nicht auf von Neumanns Satz ein, als er 1952 unter dem Titel ”A suggested interpretation of the quantum theory in terms of hidden variables” eine deterministische Interpretation der Quantenmechanik entwarf42 . Dazu ging er von der Schrödingergleichung ih̄ ∂ψ h̄2 =− ∆ψ + V (x)ψ ∂t 2m (211) aus und formte sie über den Phasenansatz i ψ(x, t) = ρ (x, t) exp S(x, t) h̄ 1 2 41 42 (212) J. von Neumann, Mathematische Grundlagen der Quantenmechanik, Springer, Berlin 1932 D. Bohm, Phys. Rev. 85, 166 (1952). 95 in das gekoppelte Gleichungssystem ∇S ∂ρ +∇· ρ = 0 ∂t m ∂S (∇S)2 h̄2 1 2 = 0 + +V − ρ∆ρ − (∇ρ) ∂t 2m 4mρ2 2 (213) (214) für die beiden reellen Funktionen S und ρ um. Dabei ist ρ = ψ ∗ ψ die quantenmechanische Wahrscheinlichkeitsdichte. Für h̄ → 0 geht Gl.(214) in die Hamiltonsche partielle Differentialgleichung43 der R klassischen Mechanik über, wobei S = Ldt die Wirkungsfunktion ist. Mit p = ∇S bzw. v = ∇S m erkennt man dazu in Gl.(213) die Kontinuitätsgleichung. Bohms Idee bestand nun darin, diese klassische Beschreibung auch für h̄ 6= 0 beizubehalten. Dazu ergänzte er das klassische Potential V (x) durch das “Quantenpotential” h̄2 1 U (x, t) = − ρ∆ρ − (∇ρ)2 . 2 4mρ 2 (215) Dieses Quantenpotential ist im allgemeinen eine rasch veränderliche Funktion des Ortes und der Zeit. Daraus resultieren starke, schwer überschaubare “Quantenkräfte”, die für sämtliche Quanteneffekte verantwortlich sind. ρ oder die ψ– Funktion wirkt also wie ein Feld der klassischen Physik, welches das Teilchen “führt”. Eine ähnliche Idee hatte de Broglie bereits 1928 entwickelt, sie aber nach anfänglichen Schwierigkeiten nicht weiter verfolgt. In dieser Interpretation wird mit jedem quantenmechanischen Teilchen ein klassisches Teilchen assoziiert, das exakt definierte und kontinuierlich variierende Ortsund Impulswerte besitzt, die uns nur nicht bekannt sind (verborgene Parameter!). Die ψ–Funktion spielt eine doppelte Rolle: Sie wirkt einerseits auf dieses Teilchen wie ein Feld der klassischen Physik. Andererseits repräsentiert sie ein statistisches Ensemble mit der Wahrscheinlichkeitsdichte ρ = |ψ|2 , das unsere Unkenntnis widerspiegelt. Die Statistik ist also nicht a priori inhärent, sondern stellt nur eine praktische Notwendigkeit dar, da wir die Anfangsorte und Anfangsgeschwindigkeiten nicht kennen. 43 Dieser Zusammenhang ist nicht neu und wurde verschiedentlich genutzt, um die klassische Mechanik mit der geometrischen Optik zu vergleichen. 96 Bohm diskutiert eine Reihe von Beispielen, an denen er seine Interpretation illustriert. So ist in stationären Zuständen das Teilchen tatsächlich in Ruhe, da sich die klassische Kraft und die Quantenkraft gegenseitig aufheben. Beim Tunneleffekt ermöglichen die starken Schwankungen des Quantenpotentials, das Barriere– “Gebirge” in engen “Schluchten” und “Kanälen” zu durchqueren. Diese Beispiele machen deutlich, daß alle Quanteneffekte mit Bohms Interpretation verträglich sind. Das ist auch nicht verwunderlich, da die Interpretation ja auf der Schrödingergleichung basiert. Gerade hier liegt aber auch ihre Schwäche: Diese Interpretation ist prinzipiell nicht beweisbar und damit aus Kopenhagener Sicht überflüssig: Liefert sie doch kein Ergebnis, das von der üblichen Quantenmechanik abweicht. Immerhin zeigt sie – und allein das ist verdienstvoll genug – daß entgegen dem Kopenhagener Verbot deterministische Interpretationen möglich sind. Aus diesem Grunde wurde sie auch in den 1990er Jahren neu aufgegriffen und erlebte eine kleine Renaissance. Wer aber in Bohms Interpretation die wahre realistische Lösung der quantenmechanischen Grundprobleme sehen möchte, dem sei doch ein bitterer Wermutstropfen in den süßen Wein gegossen: Man kommt ja nicht umhin, in der ψ– Funktion auch den Erwartungskatalog Schrödingers zu sehen, der den subjektiven Kenntnisstand widerspiegelt: Daß dieser Kenntnisstand nun das Kraftfeld modifizieren soll, dem das Teilchen ausgesetzt ist, scheint doch wieder ins Reich der Magie zu führen. 5.6 Lokalität und Bellsche Ungleichung Daß im EPR–Experiment die Messung am Teilchen 1 das Teilchen 2 in keiner Weise stört, wird aus der räumlichen Trennung gefolgert. Die anhaltende Diskussion des EPR-Paradoxons brachte daher in den folgenden Jahrzehnten die Gesichtspunkte der“Lokalität” und “Separabilität” ins Spiel: Sind räumlich getrennte,“nicht mehr wechselwirkende” Systeme wirklich völlig unabhängig voneinander und können separat betrachtet werden? Einstein wies mit Recht darauf hin, daß die Annahme der Separabilität räumlich getrennter Systeme eine notwendige Voraussetzung ist, überhaupt Physik zu betreiben und Naturgesetze zu formulieren. Andererseits ist die deterministische Bohmsche Interpretation sicherlich nicht lokal (Bell 1966): Die ψ–Funktion als “Feld” der Quantenkraft verschwindet nicht, wenn der Abstand der Teilchen groß wird. Und auch der Doppelspaltversuch, bei dem das Elektron “weiß”, ob der “andere” Spalt geöffnet ist, legt eine Nicht–Lokalität physikalischer Erscheinungen nahe. Bell44 entwickelte nun einen Gedanken, der die Frage nach der Lokalität und/oder Separabilität experimentell entscheidbar macht. Dieser Gedanke geht von der 44 J. Bell, Physics 1,195 (1965) 97 Bohmschen Version des EPR–Versuchs (Abschnitt 5.3) aus: Die beiden EPR– Teilchen seien Spin 12 –Teilchen, die aus dem Zerfall eines Teilchens mit Spin 0 hervorgehen. Wie im Abschnitt 5.3 besprochen, kann der Experimentator nach dem Zerfall, also zu einer Zeit, wo er das Teilchen 2 in keiner Weise stört, durch eine entsprechende Messung am Teilchen 1 frei entscheiden, welche Spinkomponente des Teilchens 2 er bestimmen möchte. Er schließt also mit EPR, daß sämtliche Spinkomponenten des Teilchens 2 wohldefiniert vorliegen müssen. Wir nehmen daher an, daß beide Teilchen einen wohldefinierten vektoriellen Spin45 besitzen und untersuchen die x–y–Komponenten des Spins von Teilchen 1 mit einem Analysator A1 . Der Analysator wird in der Stellung α das Teilchen 1 nur durchlassen, wenn s1α = +h̄/2 ist. Wir fragen nun mit Bell nach den Wahrscheinlichkeiten w(α1 , α2 , . . . |γ1 , γ2 , . . .) (216) dafür, daß Teilchen 1 bei den Stellungen α1 , α2 , . . . von A1 durchgelassen wird, bei den Stellungen γ1 , γ2 , . . . dagegen nicht. Offenbar gilt für jedes β w(α|γ) = w(α|β, γ) + w(α, β|γ) , denn in der Stellung β wird das Teilchen entweder durchgelassen oder nicht. Außerdem gilt selbstverständlich w(α|β, γ) ≤ w(α|β) und w(α, β|γ) ≤ w(β|γ) . Daraus folgt bereits die berühmte Bellsche Ungleichung w(α|γ) ≤ w(α|β) + w(β|γ) . (217) Diese Ungleichung basiert wohlgemerkt auf der Annahme, daß die Teilchen einen wohldefinierten Spin besitzen, der unabhängig vom Experimentator und vom Rest der Welt festliegt. Vom empiristischen Standpunkt der Quantentheorie macht es nämlich überhaupt keinen Sinn, nach den Wahrscheinlichkeiten (216) zu fragen, da nur eine Messung mit genau einer Stellung des Analysators wirklich ausgeführt werden kann – mit einer entscheidenden Ausnahme: Die zwei–argumentigen Wahrscheinlichkeiten der Bellschen Ungleichung (217) lassen sich auch quantenmechanisch definieren. w(α|β) ist nämlich wegen der antiparallelen Spins die Wahrscheinlichkeit dafür, daß 45 Dabei muß ich allerdings zugeben, daß ich mir einen Vektor, dessen Komponenten in jedem Koordinatensystem nur zwei diskrete Werte annehmen können, schwer vorstellen kann. 98 - bei der Stellung α des Analysators A1 für Teilchen 1 und - bei der Stellung β des Analysators A2 für Teilchen 2 (siehe Skizze) beide Detektoren D1 und D2 ansprechen. α β 1 D1 2 A2 A1 D2 Diese Wahrscheinlichkeit läßt sich quantenmechanisch berechnen und wird w(α|β) = 1 2 α−β sin . 2 2 (218) Wählt man speziell α = 0, β = π/4 und γ = π/2, so wird w(α|γ) = 1 2π sin = 0.25 2 4 und w(α|β) + w(β|γ) = 2 · 1 2π sin = 0.146 . . . . 2 8 • Die Quantenmechanik verletzt also die Bellsche Ungleichung! Damit wird die EPR–Behauptung wohldefinierter Eigenschaften der separierten Teilchen nicht mehr lediglich ein Argument gegen die Vollständigkeit der Quantenmechanik, sondern ein Argument gegen ihre Gültigkeit! Die Frage Quantenmechanik oder EPR–Aussage ist damit zu einer experimentell prüfbaren Frage geworden. Entsprechende Experimente sind in den vergangenen Jahrzehnten mehrfach durchgeführt worden und haben die Gültigkeit von (218) bestätigt und (217) widerlegt. Die EPR-Teilchen 1 und 2 können also trotz ihrer räumlichen Trennung nicht separiert geshen werden, ihre Zustände bleiben “verschränkt”. 99 Literaturhinweise 1. Quantenmechanik allgemein Bei der Ausarbeitung dieser Vorlesung habe ich insbesondere folgende Lehrbücher benutzt: a) A. Messiah: Quantenmechanik, Bd. 1, Walter de Gruyter, Berlin und New York 1976 b) L. Schiff: Quantum Mechanics, 3. Aufl., McGraw–Hill, New York 1968 c) E. Fick: Einführung in die Grundlagen der Quantentheorie, 2. Aufl., AVG, Frankfurt 1972 d) S.A. Davydov: Quantenmechanik, VEB Deutscher Verlag der Wissenschaften, Berlin 1978 e) G. Süssmann: Einführung in die Quantenmechanik, Grundlagen I, BI Mannheim Band 9/9a Diese Aufstellung der Quellen ist nicht als spezielle Empfehlung zu verstehen. Je nach persönlichem Geschmack eignen sich alle üblichen Lehrbücher der Quantenmechanik, in Ergänzung zum Skriptum einzelne Probleme nachzulesen oder zu vertiefen. Erwähnen möchte ich speziell f) Th. Fließbach: Lehrbuch zur Theoretische Physik III, Spektrum Akad. Verlag, Heidelberg-Berlin 2000 (4. Auflage 2005) g) Gernot Münster: Quantentheorie, Walter de Gruyter Berlin - New York 2006 All diese Lehrbcher gehen natürlich im Umfang wesentlich über den Inhalt dieser Grundlagen-Vorlesung hinaus. 2. Zur Interpretation der Quantentheorie a) F. Selleri: Die Debatte um die Quantentheorie, Vieweg 1983 b) K. Baumann & R. U. Sexl: Die Deutungen der Quantentheorie, Vieweg 1984 (Nach einer knappen Darstellung der Problematik enthält dieses Buch 12 historisch wie inhaltlich bedeutsame Originalarbeiten.) 3. Ergänzende Literatur Daneben empfehle ich, zum besseren Verständnis des physikalischen Hintergrunds einzelne Kapitel in den ausgezeichneten Feynman Lectures nachzulesen: 100 Feynman/Leighton/Sands: Vorlesungen über Physik, Bd. 1 und 2, R. Oldenbourg Verlag München Schließlich sei noch auf ein popularwissenschaftliches Buch hingewiesen, das ein leidenschaftliches Plädoyer gegen die übliche Kopenhagener Deutung darstellt und eine Fundgrube historischer Anmerkungen enthält: J. A. e Silva & G. Lochak: Wellen und Teilchen – Einführung in die Quantenmechanik, Fischer 6239 (1974) 101