Skript zur Vorlesung Theoretische Physik III (Quantenmechanik) von Volker Meden Sommersemester 2016 RWTH Aachen 2. August 2016 2 Inhaltsverzeichnis 1 Zwei (Gedanken-) Experimente 1.1 Doppelspaltexperimente mit Licht und Elektronen . . . . . . . . . 1.2 Der Stern-Gerlach Versuch . . . . . . . . . . . . . . . . . . . . . . 5 6 13 2 Der N -dimensionale unitäre Raum 2.1 Grundlagen und die Dirac-Notation . . . . . . . . . . . . . . . . . 2.2 Fortgeschrittene Konzepte . . . . . . . . . . . . . . . . . . . . . . 19 19 28 3 Nochmal die (Gedanken-)Experimente 3.1 Wahrscheinlichkeiten, Messwerte und Operatoren . . . . . . . . . 3.2 Weitere Konzepte der Statistik . . . . . . . . . . . . . . . . . . . . 33 33 42 4 Wellenpakete und Schrödingergleichung 4.1 Wellenpakete in der Elektrodynamik . . . . . . . . . . . . . . . . 4.2 Wellenpakete in der Quantenmechanik . . . . . . . . . . . . . . . 47 49 52 5 Der Hilbertraum 61 6 Die Postulate der Quantenmechanik 73 7 Schrödingergleichung in einer Dimension 7.1 Allgemeine Konzepte . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Stationäre Schrödingergleichung mit Potenzial . . . . . . . . . . . 77 79 85 8 Der harmonische Oszillator 101 9 Die Dynamik von Quantensystemen 109 9.1 Das Schrödingerbild . . . . . . . . . . . . . . . . . . . . . . . . . . 109 9.2 Das Heisenbergbild . . . . . . . . . . . . . . . . . . . . . . . . . . 112 10 Elektromagnetische Felder 10.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Der Aharonov-Bohm-Effekt . . . . . . . . . . . . . . . . . . . . . 10.3 Weiteres Postulat: Komposition von Quantensystemen . . . . . . 3 117 117 122 128 4 INHALTSVERZEICHNIS 10.4 Die Pauligleichung: Spin- und Bahnfreiheitsgrade . . . . . . . . . 129 11 Der 11.1 11.2 11.3 Drehimpuls in der Quantenmechanik 133 Drehimpulsoperatoren . . . . . . . . . . . . . . . . . . . . . . . . 133 Rotationen und Translationen . . . . . . . . . . . . . . . . . . . . 144 Die Addition von Drehimpulsen . . . . . . . . . . . . . . . . . . . 147 12 Ein Teilchen im Zentralpotenzial 155 13 Das Wasserstoffatom 165 14 Näherungsmethoden 14.1 Das Variationsprinzip . . . . . . . . . . . . . . . . . . . . . . . . . 14.2 Zeitunabhängige Störungstheorie . . . . . . . . . . . . . . . . . . 14.3 Zeitabhängige Störungstheorie . . . . . . . . . . . . . . . . . . . . 167 167 170 179 15 Ununterscheidbare Teilchen 15.1 Allgemeine Prinzipien . . . . . . . . . . . . . . . . . . . . . . . . . 15.2 Zwei Elektronen im äußeren Potenzial . . . . . . . . . . . . . . . . 15.3 Das Periodensystem der Elemente . . . . . . . . . . . . . . . . . . 187 187 191 194 16 Verschränkung und lokaler Realismus 197 16.1 Zwei-Photonen-Zustände . . . . . . . . . . . . . . . . . . . . . . . 197 16.2 Verschränkte-Zustände . . . . . . . . . . . . . . . . . . . . . . . . 199 16.3 Ein Test für den lokalen Realismus . . . . . . . . . . . . . . . . . 202 Kapitel 1 Zwei (Gedanken-) Experimente Als Einstieg in die QM Vorlesung, deren Gegenstand die Theorie der Bewegungsgesetze nichtrelativistischer Mikroobjekte (m 6= 0, v c) ist, werden wir zwei (Gedanken-) Experimente diskutieren, deren jeweiliger Ausgang sich nicht mit Hilfe der Methoden der klassischen Mechanik erklären lässt. Allgemeiner gilt, dass sich viele Experimente in der “Mikrowelt” nicht mit Hilfe der an Hand unserer alltäglichen Erfahrung gewonnenen Erkenntnisse verstehen lassen. Wir werden auch einige Betrachtungen zu Photonen (mit Ruhemasse m = 0) anstellen, soweit sich ihr Verhalten ähnlich behandeln lässt, wie das von Mikroteilchen mit endlicher Ruhemasse. Die beiden hier vorgestellten (Gedanken-) Experimente führen uns bereits darauf, dass in der “Mikrowelt” nur statistische Aussagen über physikalische Messgrößen (Ort, Impuls,. . . eines Teilchens) möglich sind. Im Gegensatz zur klassischen Mechanik, in der die Bewegung eines makroskopischen Teilchens durch die Bahnkurve gegeben ist, und damit der Ort zu einer gegeben Zeit eindeutig festliegt, ist der Ort eines sich bewegenden Elektrons zu einer Zeit t “nur” durch eine Wahrscheinlichkeitsverteilung bestimmt. Letztere kann aber eindeutig festgelegt werden. Um uns nicht gleich am Anfang der Vorlesung in philosophischen Exkursen zu verlieren, werden wir diese Ihnen sicherlich eigenartig erscheinende allgemeine Diskussion zunächst abbrechen und zu gegebener Zeit fortsetzen. Ähnlich zur klassischen Mechanik, die sich mit der Bewegung makroskopischer Körper beschäftigt, ohne sich um ihre innere Struktur zu kümmern, wird auch in der Quantenmechanik nicht die Frage untersucht, was ein Elektron oder Proton “ist” und aus welchen Konstituenten diese Teilchen womöglich aufgebaut sind. Die Diskussion der beiden (Gedanken-) Experimente soll zusätzlich den ersten mathematischen Einschub Kapitel 2 motivieren. Um die Quantenmechanik “zu verstehen” benötigt man Konzepte, die Ihnen zum Teil aus den Mathematikvorlesungen bekannt sein sollten, die aber zum Teil über die Standardvorlesungen hinaus gehen und daher im Rahmen der QMI eingeführt werden müssen. Wir bezeichnen die Experimente als “(Gedanken-) Experimente” da sie zwar einerseits tatsächlich ausgeführt worden sind (und noch ausgeführt werden), wir 5 6 KAPITEL 1. ZWEI (GEDANKEN-) EXPERIMENTE aber andererseits idealisierte, zum Teil auf dem Computer ausgeführte Experimente beschreiben und dabei auch über die experimentellen Grenzen hinausgehen werden. Wir werden aber auch “reale” Messergebnisse betrachten. Unser Einstieg in die Quantenmechanik folgt nicht der historischen Abfolge, die zu ihrer Entwicklung geführt hat. 1.1 Doppelspaltexperimente mit Licht und Elektronen Das man Licht als elektromagnetische Welle beschreiben kann, wissen Sie bereits aus der Schule. Andererseits haben Sie sicherlich schon vom Photoeffekt gehört, den Einstein 1905 durch seine “Lichtquantenhypothese” erklären konnte. Im Gegensatz zu Beugungsexperimenten (z.B. Beugung am Doppelspalt oder Gitter), die den Wellencharakter von Licht zeigen, ist es zum Verständnis des Photoeffekts wichtig, dass die Energie in diskreten Einheiten (Quanten) eintrifft. Die sich mit der Lichtgeschwindigkeit c bewegenden Quanten nennt man Photonen. Sie sollten sich darüber wundern, dass man zum Verständnis von Experimenten mit Licht mal das Wellen- und mal das Teilchenbild heranziehen muss. Am Ende dieser Vorlesung werden Sie jedoch einen Formalismus gelernt haben, der eine gewisse “Vereinheitlichung” beider Bilder mit sich bringt. Dabei möchte ich nicht behaupten, dass man den Welle-Teilchen-Dualismus im Sinne unserer Alltagserfahrung “verstehen” kann - was eine Aussage darstellt, die bereits wieder eher philosophischer Natur ist. Einen Erklärungsansatz für unser “nicht-Verstehen” liefert die evolutionäre Erkenntnistheorie, nach der der Intellekt an unserer Alltagswelt selektiert wurde, die keine offensichtlichen “statistischen” Quanteneffekte beinhaltet. Wir wollen jetzt demonstrieren, dass sich im Doppelspaltexperiment mit Licht, welches Sie auch aus dem Praktikum kennen, sowohl der Wellen- als auch der Teilchencharakter von Licht untersuchen lässt. Wie in der Abbildung 1.1 dargestellt soll das Licht der Wellenlänge λ aus einem Laser auf einen Doppelspalt (technische Details wie Blenden usw. interessieren uns hier nicht) mit Spaltabstand d und Spaltweite s fallen. Wir “beobachten” das sich ergebende “Bild” der Spalte in einem Abstand L d hinter dem Doppelspalt. Nach einer zeitlichen Mittelung über eine Periode und für1 λ d2 /L ergibt sich als Funktion des Beugungswinkels θ gemäß dem Wellenbild die in Abbildung 1.2 dargestellte Intensitätsverteilung (bis auf einen hier unwichtigen Vorfaktor) 2 I(θ) ∼ [cos(θ)] {cos [kd sin(θ)/2]} 1 2 sin [ks sin(θ)/2] ks sin(θ)/2 2 (1.1) Unter den Annahmen L d und λ d2 /L lässt sich die zeitlich gemittelte Intensitätsverteilung recht einfach herleiten; siehe Übungen. 1.1. DOPPELSPALTEXPERIMENTE MIT LICHT UND ELEKTRONEN 7 Abbildung 1.1: Skizze des Doppelspaltversuchs. mit den bekannten Intensitätsminima und -maxima. Dabei bezeichnet k = 2π/λ die Komponente des Wellenvektors, die senkrecht zur Doppelspaltebene steht. Sie wird auch als Wellenzahl bezeichnet. Das Interferenzbild lässt sich mit Hilfe des Huygensschen Prinzips verstehen, nach dem von jedem Punkt in den Öffnungen eine “Elementarwelle” ausläuft. Die Interferenz dieser Wellen führt dann zu dem Beugungsmuster. In der Übung werden Sie die Intensitätsverteilung I(θ) “zur Erinnerung” nocheinmal herleiten. Ist nur einer der beiden Spalte geöffnet, so ergibt sich eine Intensitätsverteilung die aus Gl. (1.1) durch weglassen des zweiten Faktors folgt und in Abbildung 1.3 dargestellt ist. Reduzieren wir jetzt die Intensität der Lasers bei nur einem geöffneten Spalt, so wird das Bild Abbildung 1.3 auf dem Detektorschirm immer blasser. Um es weiterhin beobachten zu können, verwenden wir als Detektorfläche eine Matrix von einzelnen Detektoren, die in der Lage sind die pro Zeiteinheit eingetroffene Energie zu messen. Ist die Intensität nun hinreichend gering, so zeigen für ein kurzes Zeitintervall nach Anschalten des Lasers nur einige wenige, scheinbar zufällig in der Matrix verteilte Detektoren, an, dass ein bei allen anzeigenden Detektoren gleicher Energiebetrag eingetroffen ist. Diese Beobachtung lässt sich nur mit Hilfe der “Lichtquantenhypothese” erklären. Jedes einzelne Signal entspricht dem 8 KAPITEL 1. ZWEI (GEDANKEN-) EXPERIMENTE 1 I/Imax 0.8 0.6 0.4 0.2 0 -0.06 -0.04 -0.02 0 θ 0.02 0.04 0.06 Abbildung 1.2: Beugungsbild im Doppelspaltversuch mit ks = 100 und kd = 1000. 1 I/Imax 0.8 0.6 0.4 0.2 0 -0.06 -0.04 -0.02 0 θ 0.02 0.04 0.06 Abbildung 1.3: Beugungsbild wenn nur einer der Spalten geöffnet ist (ks = 100). Eintreffen eines Lichtquantums, d.h. eines Photons. Licht hat damit (auch) Teilcheneigenschaften. Variiert man die Frequenz ν des Lasers, so stellt man fest, dass die Photonen eine Energie E = hν = ~ω, mit der Kreisfrequenz ω = 2πν haben. Dabei bezeichnet h = 6.6262 · 10−34 Js das Plancksche Wirkungsquantum und ~ die in der Quantenmechanik häufig auftretende Größe ~ = h/(2π). Der Impuls der Photonen beträgt p = ~k = h/λ. Warten wir nun eine längere Zeit und messen kumulativ die an den Detektoren eintreffende Energie, so ergibt sich aus dem zunächst zufällig erscheinenden Muster, langsam wieder die Intensitätsverteilung Abbildung 1.3. Diese könnte man dann im Rahmen der klassischen Mechanik als Ergebnis der Streuung von Teilchen mit unterschiedlichem Anfangsort und eventuell leicht variierendem Anfangsimpuls am Rand des Spalts zu erklären versuchen. In einem nächsten Schritt öffnen wir wieder beiden Spalte und reduzieren 1.1. DOPPELSPALTEXPERIMENTE MIT LICHT UND ELEKTRONEN 9 die Intensität des Lasers soweit, dass sich immer nur ein Photon in der Apparatur befindet. Klassisch kann jedes Photon nur eine Trajektorie besitzen, die entweder durch den einen oder den anderen Spalt führt. Da sich immer nur ein Photon in der Apparatur befindet, kann es zu keinen Photon-Photon Stößen kommen. Damit erwarten wir im Teilchenbild, dass sich nach langer Zeit ein Intensitätsmuster ergibt, welches durch I1 + I2 gegeben ist, wobei Ij das Muster ist, was sich ergibt, wenn nur der Spalt j geöffnet ist. Auf der Detektormatrix beobachten wir zunächst wieder ein räumlich scheinbar zufälliges Eintreffen einzelner Photonen. Warten wir aber lange genug und messen die Energie kumulativ, so ergibt sich immer schärfer, dass Interferenzmuster Abbildung 1.2. Das zeigt deutlich, dass das Beugungsbild nicht als Ergebnis von klassischen Mehr-Photonen-Streuprozessen erklärt werden kann - was bei hoher Laserintensität eine mögliche alternative Erklärung (neben der obigen auf der Welleneigenschaft des Lichts beruhenden Erklärung) für das Auftreten des Interferenzbildes darstellen könnte. Die Beobachtung des “Wellen-Interferenzbildes” Abbildung 1.2 ist unvereinbar damit, dass die Photonen wohldefinierten klassischen Trajektorien folgen. Das oben beschriebene sich langsame Aufbauen des Beugungsbildes ist in der ersten in der Vorlesung gezeigten Computersimulation verdeutlicht. Abbildung 1.4: Elektronenbeugungsbild bei der Beugung an einem und zwei Spalten (aus C. Jönsson, Zeitschrift für Physik 161, 454 (1961)). Wenn nun Licht sowohl Teilchen- als auch Wellencharakter besitzt, zeigen dann Elektronen, Protonen, Atome und Moleküle, also Objekte die man allgemeinhin als Teilchen bezeichnen würde2 auch Welleneigenschaften? L. de Broglie (Nature 112, 540 (1923)) schlug 1923 vor, einem Teilchen mit Impuls p = |~p| eine Wellenzahl k = p/~ und damit eine Wellenlänge λ = 2π/k (de BrogliWellenlänge) zu zuordnen. Entsprechend sollte sich in einem Doppelspaltexperiment ein Interferenzbild wie für Licht ergeben. Ersetzen wir in dem obigen Experiment den Laser durch eine Elektronenkanone, den Doppelspaltschirm durch 2 Das Elektronen Teilcheneigenschaften haben, sieht man z.B. in der Ihnen bekannten Braunschen Röhre oder dem oft schon in der Schule ausgeführten Millikanschen Öltröpfchenversuch. 10 KAPITEL 1. ZWEI (GEDANKEN-) EXPERIMENTE einen elektronenundurchlässigen Schirm und die Detektoren durch solche, die in der Lage sind Elektronen nachzuweisen, so ergeben sich exakt die gleichen Beobachtungen wie für Licht.3 Erneut benötigen wir zur Beschreibung der einzeln eintreffenden Elektronen das Teilchenbild, zum Verständnis des nach längerem Warten sich ergebenden Beugungsbildes jedoch das Wellenbild. Auch können wir das gezeigte Computerexperiment als eines für Elektronen auffassen. Die zweite Simulation zeigt den dynamischen Vorgang des Durchtreten eines durch ein Wellenpaket beschriebenen Elektrons4 durch einen Doppelspalt. Das Interferenzmuster ist dabei hinter dem Doppelspalt deutlich erkennbar.5 Abbildung 1.5: Zeitliche Abfolge von Intensitätsbildern beim Doppelspaltexperiment mit einem verdünnten Heliumstrahl (λ = (4.6 ± 0.5) · 10−11 m). Abbildung 1.4 zeigt das Doppelspaltbeugungsbild eines Elektronenstrahls von C. Jönsson (Zeitschrift für Physik 161, 454 (1961)). Interferenzexperimente wurden inzwischen auch mit Neutronen und kleinen Atomen wie z.B. Helium ausgeführt. Die Abbildung 1.5 zeigt eine zeitliche Abfolge von Intensitätsbildern die bei der Beugung eines sehr dünnen Heliumstrahls in der Gruppe von Mlynek 3 Experimentell wurde der Wellencharakter von “Teilchen” erstmals in einem Beugungsexperiment mit Elektronen an einem Kristallgitter von Davisson und Germer gefunden. 4 Sollten Ihnen nicht klar sein, was ein Wellenpaket ist, so müssen Sie nur noch einige Vorlesungsstunden abwarten, bis der Begriff in dieser Vorlesung genau besprochen wird. 5 Bis auf das erkennbare Auseinanderlaufen des Wellenpaketes, würde die Beugung für ein Lichtwellenpaket analog ablaufen. 1.1. DOPPELSPALTEXPERIMENTE MIT LICHT UND ELEKTRONEN 11 gemessen worden sind. Die Neutronenbeugung dient heute als ein nicht mehr wegzudenkendes Werkzeug zur Untersuchung der Struktur von Festkörpern, Flüssigkeiten und (biologischen) Makromolekülen. Die schwersten Teilchen für die Welleneigenschaften in einem Experiment mit vielen Spalten (Gitter) nachgewiesen werden konnten, sind die “fußballartigen” (siehe Abbildung 1.6) C60 - und C70 Moleküle (M. Arndt et al., Nature 401, 680 (1999)). Ein experimentelles Interferenzbild ist in Abbildung 1.7 gezeigt. Abbildung 1.6: Struktur des C60 -Moleküls. Der Durchmesser eines C60 -Moleküls beträgt ca. 7 · 10−10 m. Abbildung 1.7: Interferenzbild von C60 -Molekülen (aus O. Nairz, M. Arndt und A. Zeilinger, Am. J. Phys. 71, 319 (2003)) bei der Beugung an einem Gitter. Die durchgezogene Linie zeigt die theoretische Vorhersage. Die relevanten Parameter sind: m = 1.2 · 10−24 kg, mittlere Geschwindigkeit v̄ = 117 m/s, L = 1.2 m, d = 1 · 10−7 m, s = (5.5 ± 0.5) · 10−8 m. Um Interferenzexperimente mit immer schwereren Teilchen durchführen zu können, gilt es einige experimentelle Probleme zu überwinden. Hier soll nur das 12 KAPITEL 1. ZWEI (GEDANKEN-) EXPERIMENTE offensichtlichste genannt werden: Wie man Gl. (1.1) entnimmt, rücken die Minima des Interferenzbildes für kleiner werdende Wellenlänge λ immer näher zusammen (siehe Übung). Da nun λ = h/p gilt, nimmt die Wellenlänge proportional zur Masse (und der Geschwindigkeit) der Teilchen ab. Die C60 -Moleküle aus dem obigen Experiment hatten z.B. eine (mittlere) de Broglie-Wellenlänge von ca. 5 · 10−12 m. Um die Minima für schwere Teilchen weiterhin auflösen zu können, benötigt man daher Detektoren mit einer extrem hohen räumlichen Auflösung. Auch wenn ein C60 -Molekül Größenordnungen schwerer ist als ein Elektron, ist es sicherlich noch kein makroskopisches Teilchen. Um Ihnen ein Gefühl dafür zu geben, wie klein die de Brogli-Wellenlänge eines makroskopischen Teilchens ist, betrachten wir als Beispiel ein 10−3 kg schweres Teilchen, welches sich mit 10−2 m/s bewegt. Die Wellenlänge ist dann 10−29 m!! Für jede vernünftige Kombination der Spaltparameter s und d liegen die Minima im Interferenzbild so dicht, dass sie mit keinem Detektor aufgelöst werden können. Wir stellen somit fest, dass (zumindest) Photonen, Elektronen, Neutronen, Helium und C60 -Moleküle weder klassische Teilchen noch klassische Wellen sind, da ihre Bewegung und ihre Wechselwirkung mit Detektoren mit beiden Bildern unvereinbar ist. In dieser Hinsicht sind sie physikalische Objekte, die in der uns gewohnten Umwelt keine Analogien besitzen. Aus dem Doppelspaltexperiment lässt sich bereits eine zentrale Eigenschaft der Theorie der Bewegung von Mikroobjekten erkennen. Trotz gleicher Anfangsbedingung für alle Elektronen bzw. Photonen und identischer Versuchsbedingungen beobachtet man (bei einem verdünnten Strahl) mal hier das Auftreffen eines Elektrons auf dem Schirm und mal dort. Bei genügend langer Versuchsdauer (hinreichend vielen Einzelereignissen) stellt man aber fest, dass auf jeder Teilfläche des Beobachtungsschirms im Mittel ein durch das Interferenzbild bestimmter Anteil an Elektronen bzw. Photonen aus der Gesamtzahl der auf dem Schirm auftreffenden Teilchen eintrifft. Anders gesagt: Wir können eine Wahrscheinlichkeit dafür angeben, dass dieser oder jener Detektor bei der Wiederholung des Versuchs unter gleichen Bedingungen ein Teilchen anzeigen wird. Wir können aber nicht mit Sicherheit voraussagen, welcher Detektor es im nächsten Augenblick tatsächlich sein wird. Die erste in der Vorlesung gezeigte Simulation beruht exakt auf diesem Wahrscheinlichkeitsprinzip. Das Interferenzmuster Gl. (1.1) ist die Wahrscheinlichkeitsverteilung gemäß der der Computer “auswürfelt” wo auf dem Beobachtungsschirm das nächste Teilchen auftreffen wird. Damit stellt sich sofort die Frage, ob wir “nur” eine Wahrscheinlichkeitsaussage treffen können, weil wir bestimmte Bedingungen der “Mikrowelt” (noch) nicht aufgedeckt haben. Die meisten Theoretiker betrachten heute in den Aussagen der Quantenmechanik die Wahrscheinlichkeit als unmittelbar gegeben. Sie wird nicht durch die unvollständige Kenntnis objektiv vorhandener Informationen eingeführt. Der Wahrscheinlichkeitsbegriff könnte nicht durch die Zunahme oder Präzisierung unseres Wissens aus der Theorie eliminiert werden. Unabhängig davon, ob dieser Standpunkt gerechtfertigt ist oder nicht, können wir die Dynamik der Mikroobjekte mit Hilfe 1.2. DER STERN-GERLACH VERSUCH 13 der zu entwickelnden “statistischen” Theorie im Vergleich mit Experimenten extrem erfolgreich beschreiben. Man könnte soweit gehen, die Quantenmechanik als die erfolgreichste aller Theorien der Physik zu bezeichnen. Die Quantenmechanik hat damit die Aufgabe, die für jedes Experiment streng bestimmten Wahrscheinlichkeiten aus vorgegebenen Bedingungen zu berechnen. Wir werden parallel zum Formalismus die so genannte Kopenhagener Deutung der Quantenmechanik verwenden. Sie fasst die statistischen Aussagen der Quantenmechanik zusammen. Als letzten Aspekt des Doppelspaltexperimentes betrachten wir die Frage was mit dem Interferenzmuster passiert, wenn man versucht mit einer zusätzlichen “Vorrichtung” zu bestimmen, durch welchen Spalt ein Elektron bzw. Photon hindurch getreten ist. Wie wir später genauer untersuchen werden, führt eine solche “Lokalisierung” der Elektronen immer zum verschwinden des Interferenzbildes. Um Informationen über das Verhalten von Mikroobjekten zu erhalten, muss man ihren Zustand zwangsläufig stören. Die in der klassischen Physik übliche Idealisierung, den Einfluss von Messapparaten beliebig klein machen zu können, erweist sich in der “Mikrowelt” als unhaltbar. 1.2 Der Stern-Gerlach Versuch Das Stern-Gerlach Experiment wurde zum ersten Mal 1921 ausgeführt. Wie in Abbildung 1.8 dargestellt, treten aus einem Ofen durch eine kleine Öffnung (ungeladene) Atome (im ursprünglichen Experiment Silberatome) in ein angrenzendes Vakuum aus. Durch eine Blende tritt der Atomstrahl in ein in der Querrichtung (in der Skizze die z-Richtung; die Ausbreitungsrichtung des Strahls wird als die y-Richtung festgelegt) inhomogenes Magnetfeld ein, welches von geeigneten Polschuhen erzeugt wird. Man beobachtet nun folgendes: Wird das Magnetfeld eingeschaltet, so spaltet der Strahl (von Silberatomen) in zwei Strahlen (in etwa) gleicher Intensität auf, die in entgegengesetzte Richtungen (entlang der z-Achse) abgelenkt werden, und die mit einem geeigneten Detektor nachgewiesen werden können. In Abbildung 1.9 ist das Ergebnis eines entsprechenden Experimentes dargestellt. Können wir dieses Ergebnis mit Hilfe klassischer Methoden verstehen? Der klassischen Elektrodynamik folgend, hat ein Teilchen mit magnetischem Moment ~ mit einem Magnetfeld B. ~ Die resultierende µ ~ eine Wechselwirkungsenergie −~µ · B Kraft in z-Richtung beträgt damit ∂Bz ∂ ~ µ ~ · B ≈ µz , (1.2) Fz = ∂z ∂z wobei wir die Terme proportional zu ∂Bx(y) /∂z vernachlässigt haben.6 In der klassischen Beschreibung gehen wir davon aus, dass die Atome einer Trajektorie z Diese Näherung rechtfertigt sich wie folgt: Bis auf Randeffekte gilt ∂B ∂y = 0 (die Form der ~ ×B ~ = 0 auch ∂By = 0. Aufgrund der Polschuhe hängt nicht von y ab) und damit wegen ∇ ∂z 6 14 KAPITEL 1. ZWEI (GEDANKEN-) EXPERIMENTE Abbildung 1.8: Schematischer Aufbau des Stern-Gerlach Versuchs. folgen. Später werden wir mit Hilfe der Heisenbergschen Unschärferelation verstehen können, dass für das vorliegende Experiment auch unter Berücksichtigung der Quantenmechanik die “Näherung” einer klassischen Trajektorie zulässig ist. Um die Ablenkung im Magnetfeld zu verstehen, nehmen wir an, dass die aus dem Ofen austretenden (Silber-) Atome ein magnetisches Moment µ ~ haben. Im Ofen sind die magnetischen Momente der einzelnen Atome statistisch verteilt, wobei hier statistisch im klassischen Sinne gemeint ist: Jedes Atom hat sein festes magnetisches Moment. Aufgrund unzureichender Information kennen wir dieses jedoch nicht. Also sollten im Strahl Atome mit µz > 0 und µz < 0 vorkommen und zwar mit einer kontinuierlichen Verteilung7 zwischen −|~µ| und |~µ|. Wir erwarten daher klassisch einen breiten Fleck und nicht zwei wie im Experiment. Unsere “klassische” Erwartung und die ihr widersprechende experimentelle Beobachtung sind noch einmal schematisch in Abbildung 1.10 dargestellt. Die Aufspaltung erfolgt symmetrisch um die Null herum, die durch die Position der Strahlmitte gegeben ist, d.h. µz = ±µ0 . Aus dem Abstand der beiden Flecken kann µ0 bestimmt werden, da die Magnetfeldstärke bekannt ist. Auch wenn wir bisher nicht verstehen können, welche quantenmechanische Eigenschaft zur “Quantisierung” des magnetischen Moments, bzw. zu der Aufspaltung des Strahls führt, werden wir jetzt einige Gedankenexperimente mit Stern-Gerlach Apparaturen (SG-Apparaturen) ausführen. Wir werden dabei “lernen” welche mathematischen Methoden wir zur Beschreibung des Experimentes und damit der noch unbekannten Eigenschaft des Atoms benötigen. Schematisch ist die Aufspaltung in zwei Strahlen in Abbildung 1.11 dargestellt. Bei der Spezifikation der SG-Apparatur ist dabei zusätzlich angegeben, dass die Polschuhe des Magneten so ausgerichtet sind, dass die Ablenkung in ±~e3 -Richtung stattfindet. Wir werden folgend auch rotierte SG-Apparaturen betrachten, die entlang einer beliebigen Richtung gegeben durch den EinheitsGeometrie der Polschuhe hängt Bz in dem Bereich, in dem die Teilchen durch das Magnetfeld x treten, nur schwach von der x-Koordinate ab und damit folgt analog wie oben ∂B ∂z ≈ 0. 7 Es gibt keinen “klassischen” Grund, warum die Verteilung aus zwei Maxima bestehen sollte. 1.2. DER STERN-GERLACH VERSUCH 15 Abbildung 1.9: Intensitätsverteilung in einem Stern-Gerlach Experiment (aus H. Kopfermann, Kernmomente). Die auf der durchgezogenen Linie liegenden Messpunkte sind ohne das Magnetfeld aufgenommen worden. vektor ~n = sin θ cos ϕ ~e1 + sin θ sin ϕ ~e2 + cos θ ~e3 aufspalten. Dabei bezeichnet θ den Winkel zwischen ~n und ~e3 , sowie ϕ den in der ~e1 -~e2 -Ebene gelegenen Winkel zwischen ~n und ~e1 . 0 klassische Erwartung exp. Ergebnis Abbildung 1.10: Idealisierter Ausgang eines Stern-Gerlach Versuchs. Ofen SG, e3 e 3 ,+ e 3 ,− Abbildung 1.11: Schema eines Stern-Gerlach Experiments. Zunächst stellen wir uns die Frage was passiert, wenn man zwei gleichartige SG-Apparaturen hintereinander aufstellt, wobei aber der “-” Strahl hinter der ersten blockiert wird (siehe Abbildung 1.12). Hinter der zweiten zeigt sich in diesem Fall nur ein Fleck (bzw. ein Strahl). Die gesamte Intensität bleibt im oberen Strahl. Verwenden wir statt der zwei ~e3 SG-Apparate zwei ~n Apparate erhalten wir ein analoges Ergebnis mit einer Ablenkung in ~n-Richtung. Interessanter ist das in Abbildung 1.13 dargestellte Experiment, in dem der Atomstrahl zuerst auf einen ~e3 SG-Apparat trifft, hinter dem der ~e3 , − Strahl ab- 16 KAPITEL 1. ZWEI (GEDANKEN-) EXPERIMENTE Ofen SG, e3 SG, e3 e 3 ,+ kein e 3,− Abbildung 1.12: Schema zweier hintereinander ausgeführter Stern-Gerlach Experimente. Ofen SG, e3 e 1 ,+ SG, e1 e 1 ,− Abbildung 1.13: Analog zu Abbildung 1.12 aber mit einer verdrehten zweiten SG-Apparatur. sorbiert wird. Der verbleibende ~e3 , + Strahl trifft dann auf einen ~e1 SG-Apparat. Aus diesem treten dann zwei ~e1 , ± Strahlen gleicher Intensität aus. Bedeutet das, dass der ~e3 , + Strahl aus Atomen besteht, die zu 50% durch ~e1 , + und zu 50% durch ~e1 , − charakterisiert werden können? Es wird sich herausstellen, dass diese Vorstellung in die Irre führt. Wir gehen einen Schritt weiter und betrachten den in Abbildung 1.14 skizzierten Aufbau. Er macht eine der überraschenden Eigenschaften der Quantenmechanik auf eindringliche Weise klar.8 Im Anschluss an den ~e1 SG-Apparat, wird der ~e1 , − Strahl absorbiert und der ~e1 , + Strahl durch einen ~e3 SG-Apparat geschickt. Experimentell beobachten wir hinter dem ~e3 SGApparat wieder zwei (!!) Strahlen mit jeweils halber Intensität des ~e1 , + Strahls. Das ist eine große Überraschung, falls wir unserem klassischen Konzept folgend annehmen würden, dass die Atome des ~e1 , + Strahls durch die Eigenschaft ~e3 , + und ~e1 , + charakterisiert sind. Aus einem nachfolgenden ~e3 SG-Apparat sollte also nur ein ~e3 , + Strahl austreten. Wie kommt es zur “Wiederbelebung” der ~e3 , − Komponente? Damit erweist sich das Modell nach dem die Atome, die in den dritten SG-Apparat eintreten durch die Eigenschaft ~e3 , + und ~e1 , + charakterisiert werden als unzulänglich. Ofen SG, e3 SG, e1 SG, e3 e 3 ,+ e 3 ,− Abbildung 1.14: Analog zu Abbildung 1.13 aber mit einer dritten SG-Apparatur. Da Ihnen die gerade diskutierte Situation wahrscheinlich neu erscheint, ist es sinnvoll die Ihnen “bekanntere” Polarisation von Licht zu untersuchen. Beim 8 Diese Eigenschaft ist überraschend oder vielleicht sogar eigenartig, wenn man sie aus der Perspektive der klassischen Mechanik betrachtet. Am Ende dieser Vorlesung werde Effekte der hier diskutierten Art Sie nicht mehr überraschen. 1.2. DER STERN-GERLACH VERSUCH 17 Durchtritt von Licht durch eine Reihe von zu spezifizierenden Polarisatoren kommt es zu einem völlig analogen Effekt. Für diesen Fall sind wir in der Lage den beobachteten Effekt durch eine kleine Rechnung zu bestätigen. Wir betrachten dazu eine sich in y-Richtung ausbreitende, monochromatische, ebene Lichtwelle (alternativ ausgedrückt: einen Strahl von Photonen), die durch den Vektor des elektrischen Feldes9 ~ r, t) = E1 cos (ky − ωt + α1 ) ~e1 + E3 cos (ky − ωt + α3 ) ~e3 E(~ (1.3) gegeben ist. Komplex geschrieben ergibt sich ~ r, t) = (E1~e1 + E3~e3 ) ei(ky−ωt) , E(~ (1.4) ~ r, t) ist dabei als der Realteil von mit E1 , E3 ∈ C.10 Das physikalische Feld E(~ ~ E(~r, t) gegeben. Die Polarisation der Lichtwelle (die Polarisation der Photonen) wird durch E1 und E3 festgelegt und kann durch einen Vektor in einem zweidimensionalen, komplexen Vektorraum beschrieben werden. Neben den reinen x- und z-polarisierten Wellen, sind Wellen mit beliebiger Linearkombination E1~e1 + E3~e3 möglich (z.B. “45 grad” Polarisation, rechts- und links-zirkulare Polarisation). Wir haben dabei zur Charakterisierung der Polarisation die {~e1 , ~e3 } Basis in der Ebene senkrecht zur Ausbreitungrichtung verwendet, könnten die Polarisation aber auch in jeder beliebigen anderen (orthonormalen) Basis der x-z-Ebene ausdrücken (siehe unten). Tritt eine durch E1~e1 +E3~e3 beschriebene Welle durch einen x-Polarisator, so ist das Feld nach dem Polarisator durch E1~e1 gegeben. Schicken wir es anschließend durch einen z-Polarisator, so tritt kein Licht aus diesem aus. Betrachten wir nun zusätzlich einen Polarisator, der in die x0 -Richtung polari0 siert, wobei ~e1 und ~e1 innerhalb der x-z-Ebene um den Winkel ϕ gegeneinander verdreht sind. Es gilt dann für die entsprechenden Basisvektoren (Basiswechsel) 0 ~e1 = cos ϕ ~e1 + sin ϕ ~e3 0 ~e3 = − sin ϕ ~e1 + cos ϕ ~e3 (1.5) bzw. 0 0 ~e1 = cos ϕ ~e1 − sin ϕ ~e3 0 0 ~e3 = sin ϕ ~e1 + cos ϕ ~e3 . (1.6) Wir führen nun das folgende Experiment aus. Wir schicken die durch E1~e1 + E3~e3 charakterisierte Welle zunächst auf einen x-Polarisator. Die durchtretende Welle 0 0 ist durch E1~e1 = E1 cos ϕ ~e1 − E1 sin ϕ ~e3 beschrieben und besitzt keine Komponenten in z-Richtung. Wir schicken sie dann auf einen x0 -Polarisator. Nach diesem ~ 2ψ = Die Komponenten des Feldvektors erfüllen die freie Wellengleichung ∇ ω = ck. 10 Da Ej = Ej eiαj haben die Ej eine Phase und einen Betrag. 9 2 1 ∂ ψ c2 ∂t2 , mit 18 KAPITEL 1. ZWEI (GEDANKEN-) EXPERIMENTE 0 erhalten wir eine durch E1 cos ϕ ~e1 = E1 cos2 ϕ ~e1 + E1 sin ϕ cos ϕ ~e3 beschriebene Welle, die für ϕ 6= nπ/2 mit n ∈ Z, wieder eine z-Komponente besitzt. Diese Beobachtung ist völlig analog zu der aus der SG-Apparatur Abbildung 1.14,11 wobei sie Ihnen im Fall der hintereinandergeschalteten Polarisatoren vielleicht weniger eigenartig erscheint. Um die Analogie klar herauszustellen identifizieren wir ~e3 , ± Atom ↔ x, z polarisiertes Licht ~e1 , ± Atom ↔ x0 , z 0 polarisiertes Licht (mit ϕ = π/4) . Entsprechend der gerade geführten Diskussion vermittelt ein Polarisator eine lineare Abbildung in einem zweidimensionalen komplexen Vektorraum. Die Analogie verdeutlicht, dass es sinnvoll erscheint auch dem Atom im SternGerlach Experiment eine durch einen zweidimensionalen komplexen Vektor beschriebene Eigenschaft (analog der Polarisation des Photons) zu zusprechen, deren physikalischer Ursprung uns aber zunächst weiter unklar bleibt. Bezüglich der uns unbekannten Eigenschaft des Atoms ist dieses dann durch einen Vektor |ψi = a |~e3 , +i+b |~e3 , −i = ã |~n, +i+ b̃ |~n, −i charakterisiert.12 Die SG-Apparatur mit einem geblockten Strahl vermittelt analog zum Polarisator eine lineare Abbildung in diesem Vektorraum. Komplexe Vektorräume endlicher (und später auch unendlicher) Dimension spielen in der Quantenmechanik eine wichtige Rolle. Bevor wir daher nocheinmal auf das Stern-Gerlach bzw. Polarisations-Experiment zurückkommen werden, wollen wir im folgenden Kapitel “zur Erinnerung” und um die gerade verwendete Ihnen wahrscheinlich unbekannte Notation (|. . .i) einzuführen einige wichtige Eigenschaften komplexer endlichdimensionaler Vektorräume rekapitulieren. 11 Die dort betrachtete Konstellation entspricht ϕ = π/4. Dieser Vektor beschreibt nur die uns bisher unbekannte physikalische Eigenschaft des Atoms, jedoch nicht den “Ort” und den “Impuls” des Atoms. 12 Kapitel 2 Der N -dimensionale unitäre Raum Aus Ihren Mathematik Vorlesungen sollten Ihnen die Begriffe reeller und komplexer, N -dimensionaler Vektorraum und Skalarprodukt bekannt sein. Daher werden wir uns hier nicht noch einmal mit der vollständigen Axiomatik der Begriffe beschäftigen. Wir wollen nur einige wichtige Eigenschaften rekapitulieren und werden dabei die Ihnen wahrscheinlich unbekannte, in der Quantenmechanik häufig genutzte Dirac-Schreibweise verwenden. Da in der Quantenmechanik komplexe Vektorräume wichtig sind, werden wir uns mit diesen auseinandersetzen. 2.1 Grundlagen und die Dirac-Notation Wir gehen davon aus, dass Ihnen die einen komplexer Vektorraum H definierenden Eigenschaften bekannt sind. Die Elemente des Vektorraums bezeichnen wir mit |ai, |bi, . . .. Verglichen mit der Ihnen aus der Mechanik bekannten Notation identifizieren wir also: |ai ↔ ~a, |bi ↔ ~b, . . . und “nennen” |ai einen “ket”-Vektor. Einen komplexen Vektorraum mit einem Skalarprodukt nennt man unitär. Das Skalarprodukt muss die folgenden Eigenschaften erfüllen: (1) ha |ai ≥ 0; Gleichheit, wenn |ai der Nullvektor ist (2) ha |bi = hb |ai∗ (3) sei |bi = λ |b1 i + µ |b2 i; λ, µ ∈ C; so folgt ha |bi = λ ha |b1 i + µ ha |b2 i (Linearität im zweiten Argument) Die mehr traditionelle Schreibweise für das Skalarprodukt ist ~a, ~b . Statt der runden Klammern verwenden wir spitze und statt des Kommas einen senkrechten Strich. Aus (2) und (3) folgt, dass das Skalarprodukt “antilinear” im ersten 19 20 KAPITEL 2. DER N -DIMENSIONALE UNITÄRE RAUM Argument ist: hb |ai = ha |bi∗ = (λ ha |b1 i + µ ha |b2 i)∗ = λ∗ hb1 |ai + µ∗ hb2 |ai . Zwei Vektoren heißenporthogonal falls ha |bi = 0. Wegen (1) gilt ha |ai ∈ R und man kann || |ai || := ha |ai als die Norm (Länge) des Vektors definieren. Die Dimension des Vektorraums ist durch die maximale Zahl linearunabhängiger Vektoren gegeben. Einen Satz von N Basisvektoren {|e1 i , |e2 i , . . . , |eN i} bezeichnet man als Orthonormalbasis falls hei |ej i = δi,j . Bezüglich einer gegebenen Basis, kann man jedes Element aus H als Linearkombination |ai = N X aj |ej i , aj ∈ C j=1 schreiben. Aus dieser Zerlegung folgt ha |bi = N X a∗i bj hei |ej i = i,j=1 N X a∗j bj . j=1 Bisher haben wir dem zu |ai “umgekehrten” Objekt ha| noch keine eigene Bedeutung zugeschrieben, was wir in einem nächsten Schritt nachholen wollen. Dazu betrachten wir lineare Funktionen1 der Vektoren aus H. Wird durch ϕ jedem |ai ∈ H eindeutig eine Zahl ϕ (|ai) ∈ C zugeordnet, so heißt die Funktion ϕ linear, falls für beliebige |ai , |bi ∈ H und λ, µ ∈ C gilt ϕ (λ |ai + µ |bi) = λϕ (|ai) + µϕ (|bi) . Die Funktion ϕ ist aufgrund der Linearität durch Angabe ihrer Wirkung auf alle Basisvektoren {|e1 i , |e2 i , . . . , |eN i} eindeutig festgelegt. Sei ϕ (|ej i) = fj , PN PN fj ∈ C, so ergibt sich für |ai = j=1 aj |ej i, ϕ (|ai) = j=1 aj fj . Wir betrachten als nächstes ein Beispiel für lineare Funktionen. Sei eine orthonormaP le Basis {|e1 i , |e2 i , . . . , |eN i} gegeben und |ai = N a |e j=1 j j i dann ist für jedes j = 1, 2, . . . , N durch {|ei i} ϕj 1 (|ai) := aj Für unendlich dimensionale Vektorräume, die wir später benötigen werden, bezeichnet man die analogen “Funktionen” als Funktionale und verwendet daher allgemein beide Begriffe synonym. 2.1. GRUNDLAGEN UND DIE DIRAC-NOTATION 21 {|e i} eine lineare Funktion auf H definiert. Es gilt ϕj i (|ek i) = δj,k . Seien ϕ und ψ zwei lineare Funktionen, so ist auch λϕ + µψ (λ, µ ∈ C) eine lineare Funktion. Damit wird die Gesamtheit aller linearen Funktionen auf H selbst zu einem Vek{|e i} torraum, den man den dualen Raum nennt und mit H∗ bezeichnet. Die ϕj i aus dem Beispiel bilden einen Basis in H∗ : Sei eine beliebige lineare Funktion ϕ, mit ϕ (|ej i) = fj gegeben. Es ist dann klar, dass die lineare Funktion PN {|ei i} dieselbe Wirkung auf alle Basisvektoren |ek i hat wie ϕ. Damit gilt j=1 fj ϕj PN {|ei i} ϕ = j=1 fj ϕj . Wir können somit jede lineare Funktion aus H∗ eindeutig als {|e i} {|e i} Linearkombination der ϕj i , j = 1, 2, . . . , N , schreiben und die ϕj i bilden eine Basis in H∗ . Da die Basis N Elemente hat, hat der duale Raum H∗ dieselbe Dimension wie H. In einem nächsten Schritt wollen wir zeigen, wie man mit Hilfe des Skalarprodukts jedem ϕ ∈ H∗ eineindeutig ein Element aus H zuordnen kann. Wir betrachten dazu ! N X hej |ai = hej | ai |ei i i=1 = N X ai hej |ei i i=1 = aj . (2.1) Das Skalarprodukt von |ej i mit |ai hat somit dieselbe Wirkung wie das Anwenden {|e i} von ϕj i auf |ai. Mit den obigen Resultaten lässt sich die Wirkung jedes ϕ = P PN {|ei i} ∗ auf ein beliebiges |ai mit Hilfe des Vektors |ϕi := N j=1 fj |ej i als j=1 fj ϕj Skalarprodukt schreiben ϕ (|ai) = hϕ |ai . Dabei treten in der Definition von |ϕi komplexkonjugierte Koeffizienten fj∗ auf, da das Skalarprodukt antilinear im ersten Argument ist. Wir schreiben nun die Vektoren aus H∗ , als hϕ| und bezeichnen sie als “bra”-Vektoren. Jede lineare Funktion lässt sich als Skalarprodukt mit einem geeigneten “bra”-Vektor schreiben. Zusammen mit dem “ket”-Vektor |ai (unter Weglassen eines der senkrechten Striche, was man immer dann macht, wenn zwei solcher Striche aufeinander treffen) ergibt sich so eine “bracket” hϕ |ai, was das englische Wort für Klammer ist. Das erklärt die Bezeichnung der beiden Vektor-Typen. Die linearen Funk{|e i} tion ϕj i aus unserem Beispiel ist durch den “bra”-Vektor hej | gegeben. Die {he1 | , he2 | , . . . , heN |} bilden eine Basis in H∗ . Wir ordnen jetzt also jedem Vektor |ai aus H über das Skalarprodukt ein Element ha| aus H∗ zu. Da das Skalarprodukt antilinear im ersten Argument ist, ist diese Zuordnung ebenfalls antilinear. Es gilt also X X |ai = λi |ai i ↔ ha| = λ∗i hai | . (2.2) i i 22 KAPITEL 2. DER N -DIMENSIONALE UNITÄRE RAUM Wir betrachten in einem nächsten Schritt lineare Abbildungen A von H nach H. Eine lineare Selbstabbildung ist durch die Eigenschaft (|ai, |bi ∈ H; λ, µ ∈ C) A (λ |ai + µ |bi) = λA |ai + µA |bi definiert. Sei eine (nicht unbedingt orthonormale) Basis {|g1 i , |g2 i , . . . , |gN i} vorgegeben, dann ist der Operator A vollständig durch die Angabe aller Koeffizienten von A |gj i, j = 1, 2, . . . , N festgelegt. Als Koeffizienten bezeichnen wir dabei die komplexen Zahlen, die sich aus dem Anwenden der zu |gi i, i = 1, 2, . . . , N gehörenden linearen Funktion ergeben: hgi | A |gj i. Man bezeichnet diese Größen auch als Matrixelemente bezüglich der Basis {|g1 i , |g2 i , . . . , |gN i}. Mit Hilfe der Rechenregeln für das Skalarprodukt und der Linearität von A zeigt man leicht, dass ha| A |bi linear im ket |bi ist. Damit kann man hc| := ha| A als Vektor in H∗ auffassen. Um festzustellen, welcher ket |ci ∈ H dem bra hc| ∈ H∗ zugeordnet ist, definieren wir den zu A adjungierten Operator A† durch hb| A† |ai := ha| A |bi∗ (2.3) für alle |ai, |bi ∈ H. Es gilt hb| A† † |ai = ha| A† |bi∗ = hb| A |ai † und damit A† = A, da für jede komplexe Zahl z = (z ∗ )∗ . Mit hc| := ha| A und der Eigenschaft (2) des Skalarprodukts ergibt sich hb| A† |ai = ha| A |bi∗ = hc| bi∗ = hb| ci und damit hc| = ha| A ↔ |ci = A† |ai , (2.4) oder auch hc| = ha| A† ↔ |ci = A |ai . In Worten heißt das: Ein adjungierter Operator wirkt nach links (auf den braVektor) so wie der Operator selbst nach rechts. Betrachten wir ein einfaches Beispiel zur Definition des adjungierten Operators. A sei der Operator, der jedes |bi ∈ H auf A |bi = α |bi abbildet (α ∈ C). Gemäß Gl. (2.3) gilt dann hb| A† |ai = ha| A |bi∗ = (α ha| bi)∗ = α∗ hb| ai = hb| (α∗ |ai) und damit A† |ai = α∗ |ai, da |bi ein beliebiger Vektor aus H ist. Wir werden später auf den Begriff des adjungierten Operators zurückkommen und ihn mit mehr Leben füllen. 2.1. GRUNDLAGEN UND DIE DIRAC-NOTATION 23 In konkreten Rechnungen, wird ein Vektor |ai meist bezüglich einer orthonormalen Basis {|e1 i , |e2 i , . . . , |eN i} als (aj ∈ C) |ai = N X aj |ej i j=1 ausgedrückt. Um Schreibarbeit zu sparen, bezeichnen wir die |ej i im Folgenden einfach als |ji. Nach Gl. (2.1) gilt aj = hj |ai und damit |ai = N X hj |ai |ji = j=1 N X |ji hj |ai . j=1 P Aus dieser Beziehung lesen wir ab, dass N j=1 |ji hj| wie der Identitätsoperator 1 (der |ai auf |ai abbildet) wirkt. Wir finden also2 1= N X |ji hj| . (2.5) j=1 Man bezeichnet diese Relation als Vollständigkeitsrelation3 bzw. Zerlegung der Eins. Sie wird sich als extrem nützlich herausstellen. Ein einzelner Term Pj := |ji hj| aus der Summe Gl. (2.5) ist ein Beispiel für einen Projektionsoperator. Angewandt auf ein |ai ∈ H liefert er die Projektion von |ai auf |ji4 Pj |ai = |ji hj |ai = aj |ji . Ausgedrückt durch die Pj lautet die Vollständigkeitsrelation 1= N X Pj . j=1 Für das Produkt zweier solcher Operatoren folgt Pi Pj = |ii hi| ji hj| = δi,j Pi . Für das Adjungierte von Pj ergibt sich gemäß Gl. (2.3) hb| P†j |ai = ha| Pj |bi∗ = (ha| ji hj |bi)∗ = ha| ji∗ hj |bi∗ = hj| ai hb |ji = hb |ji hj| ai = hb| Pj |ai , 2 Beim Auseinanderziehen, ersetzen wir | → ||. Die Bedeutung dieses Begriffs wird erst im Fall unendlichdimensionaler Vektorräume vollständig klar werden. 4 Wir ersetzen dabei wieder zwei aufeinandertreffende | durch einen. 3 24 KAPITEL 2. DER N -DIMENSIONALE UNITÄRE RAUM also P†j = Pj . Die Eigenschaft A† = A definiert eine Klasse von Operatoren, die man selbstadjungierte Operatoren nennt. Die obigen Projektionsoperatoren sind also selbstadjungiert. Selbstadjungierte Operatoren sind in der Quantenmechanik von zentraler Bedeutung und wir werden noch in diesem Kapitel genauer auf ihre Eigenschaften eingehen. Die Vollständigkeitsrelation Gl. (2.5) ist hilfreich um zu sehen, wie der abstrakte Operator A bezüglich einer festen Orthonormalbasis durch seine Matrixelemente festgelegt ist (bzw. dargestellt wird) A = 1A1 = N X |ii hi| A |ji hj| . i,j=1 Je nach Wahl der Basis, wird der Operator A durch eine andere N × N -Matrix A mit Matrixelementen Ai,j := hi| A |ji dargestellt. Bezüglich einer festen Basis schreiben wir . A= h1| A |1i h1| A |2i h2| A |1i h2| A |2i ... ... · · · · · · ... ... hN | A |1i hN | A |2i . . . h1| A |N i . . . h2| A |N i ... ... · · · · · · ... ... . . . hN | A |N i , . wobei das Symbol = als “wird dargestellt durch” zu lesen ist. Um deutlich zu machen, dass die Matrixdarstellung von der gewählten Basis abhängt, betrachten wir als Beispiel den Projektionsoperator P1 = |1i h1|. Bezüglich der Orthonormalbasis {|ji} gilt . P1 = 1 0 ... 0 0 0 ... 0 ... ... ... ... · · · · . · · · · · · · · ... ... ... ... 0 0 ... 0 2.1. GRUNDLAGEN UND DIE DIRAC-NOTATION In einer anderen Orthonormalbasis j̃ gilt dagegen h1̃|1ih1|1̃i h1̃|1ih1|2̃i . . . h1̃|1ih1|Ñ i h2̃|1ih1|1̃i h2̃|1ih1|2̃i . . . h2̃|1ih1|Ñ i ... ... ... ... · · · · . P1 = · · · · · · · · ... ... ... ... hÑ |1ih1|1̃i hÑ |1ih1|2̃i . . . hÑ |1ih1|Ñ i 25 . Beide Matrizen unterscheiden sich offensichtlicherweise. Die Komponente des Vektors A |ai in die “Richtung” von |ii lässt sich mit Hilfe von Gl. (2.5) durch hi| A |ai = hi| A1 |ai = N X hi| A |ji hj| ai j=1 ausdrücken. Stellen wir nun die Komponenten hj| ai bezüglich der Basis {|ji} als Spaltenvektor dar h1 |ai h2 |ai ... · . , |ai = · · ... hN |ai so ergibt sich die übliche Rechenregel zur Multiplikation eines Vektors mit einer Matrix. Für die Matrixelemente des Produktes zweier Operatoren A und B folgt analog die übliche Rechenregel der Matrizenrechnung hi| AB |ji = hi| A1B |ji = N X hi| A |ki hk| B |ji . k=1 Nach Einschieben einer 1 folgt für das Skalarprodukt hb| ai = N X hb| ji hj| ai , j=1 woraus man sofort erkennt, dass ein bra-Vektor hb| im “Matrixformalismus” durch einen Zeilenvektor . hb| = (hb| 1i , hb| 1i , . . . , hb| N i) 26 KAPITEL 2. DER N -DIMENSIONALE UNITÄRE RAUM dargestellt wird. So ergeben sich die ihnen bekannten Rechenregeln des Skalarprodukts. Wir betrachten als nächstes die Matrixelemente eines selbstadjungierten Operators A† = A . (2.6) Nach Gl. (2.3) gilt für solche (|ai, |bi ∈ H) hb| A |ai = hb| A† |ai = ha| A |bi∗ und damit bezüglich einer Orthonormalbasis {|ji} Ai,j = hi| A |ji = hj| A |ii∗ = A∗j,i , d.h. selbstadjungierte Operatoren werden durch hermitesche Matrizen dargestellt. In der Quantenmechanik sind selbstadjungierte Operatoren von zentraler Bedeutung, da physikalische Observable (Energie, Ort, Impuls, Drehimpuls,. . . ) durch solche Operatoren beschrieben werden. Mögliche experimentelle Messgrößen sind die Eigenwerte dieser Operatoren. Wir betrachten daher das Eigenwertproblem eines zunächst nicht notwendigerweise selbstadjungierten Operators A. Der Vektor |aν i ∈ H, wobei |aν i ungleich dem Nullvektor ist, heißt Eigenvektor (auch Eigenzustand) zu A mit Eigenwert λν ∈ C falls5 A |aν i = λν |aν i . (2.7) Zur Berechnung der |aν i und λν wählt man eine spezielle Orthonormalbasis {|ji}. Für alle hi| muss dann gelten hi| (A − λν 1) |aν i = 0 und damit nach Einschieben einer 1 N X (hi| A |ji − δi,j λν ) hj| aν i = 0 . j=1 Die Eigenwerte λν folgen daher, wie Ihnen bekannt sein sollte, aus der Gleichung det (A − λν 1) = 0 , wobei die Matrix A die Darstellung des Operators A bezüglich der vorgegebenen Basis ist und 1 die Einheitsmatrix (die zum Operator 1 gehört). Da PN (λ) = det (A − λ 1) ein Polynom N -ten Grades ist, hat es N Nullstellen, d.h. es gibt N Eigenwerte (M -fache Nullstellen, werden M -fach gezählt). Man nennt PN (λ) das charakteristische Polynom. 5 Ist |aν i Eigenvektor zum Eigenwert λν , so ist auch |ãν i := µ |aν i, mit µ ∈ C Eigenvektor zum Eigenwert λν : A |ãν i = Aµ |aν i = µA |aν i = λν µ |aν i = λν |ãν i. 2.1. GRUNDLAGEN UND DIE DIRAC-NOTATION 27 Sei nun A wieder ein selbstadjungierter Operator. Aus A |aν i = λν |aν i folgt dann mit Gln. (2.2) und (2.4), dass haν | A = λ∗ν haν | = haν | λ∗ν . Multiplizieren wir diese Gleichung von rechts mit dem Eigenvektor |aµ i zum Eigenwert λµ und beachten, dass haν | A |aµ i = λµ haν | aµ i, so folgt (λµ − λ∗ν ) haν | aµ i = 0 . Für µ = ν ergibt sich wegen haν | aν i > 0 λν = λ∗ν , d.h. die Eigenwerte eines selbstadjungierten Operators sind reell. Für λµ 6= λν folgt haν | aµ i = 0 . Eigenvektoren zu verschiedenen Eigenwerten sind orthogonal. Betrachten wir jetzt zunächst den Fall, dass alle N Eigenwerte verschieden sind, d.h. keiner der Eigenwerte entartet ist. Wir können die zugehörigen paarweise orthogonalen Eigenvektoren dann normieren, so dass die normierten |aν i eine orthonormale Basis bilden. Damit gilt dann die Zerlegung der Eins 1= N X |aν i haν | . ν=1 Durch Anwenden von A auf beiden Seiten der Gleichung folgt A= N X ν=1 A |aν i haν | = N X λν |aν i haν | . (2.8) ν=1 Ein selbstadjungierter Operator mit N verschiedenen Eigenwerten lässt sich als Summe von mit dem Eigenwert multiplizierten Projektoren auf die Eigenvektoren schreiben. Man nennt diese Schreibweise die Spektraldarstellung des Operators. Wie wir folgend sehen werden, gilt sie auch im Fall entarteter Eigenwerte. Bezüglich der {|aν i} Basis, wird A durch die Matrix λ1 0 . . . 0 0 λ2 . . . 0 ... ... ... ... · · · · . A= · · · · · · · · ... ... ... ... 0 0 . . . λN 28 KAPITEL 2. DER N -DIMENSIONALE UNITÄRE RAUM dargestellt. Analysieren wir jetzt die Situation, in der entartete Eigenwerte vorliegen. Sei also z.B. |a1 i Eigenvektor zum M > 1-fach entarteten Eigenwert λ1 , d.h. das charakteristische Polynom PN (λ) hat eine M -fache Nullstelle λ1 . Das orthogonal Komplement H1 zu |a1 i, d.h. die Menge der Vektoren |bi mit ha1 |bi = 0 bildet einen N − 1-dimensionalen Unterraum zu H. Für Vektoren aus H1 gilt ha1 | A |bi = λ∗1 ha1 | bi = 0. Damit ist A |bi ∈ H1 und A bildet einen selbstadjungierten Operator auf H1 . A eingeschränkt auf H1 bezeichnen wir mit A1 . Nach Voraussetzung hat nun auch A1 mindestens einen Eigenwert λ1 . Daher gibt es einen zu |a1 i orthogonalen Eigenvektor |a2 i zum Eigenwert λ1 . Diese Konstruktion kann man nun beliebig fortsetzen. Es zeigt sich also, dass sowohl die Spektraldarstellung Gl. (2.8) als auch die Zerlegung der Eins für alle selbstadjungierten Operatoren möglich sind. Als letzten speziellen Typ von Operatoren betrachten wir hier noch unitäre Operatoren U. Für diese gilt, dass sie das Skalarprodukt erhalten (|ai, |bi ∈ H) ha| U† U |bi = ha| bi , d.h., dass das adjungierte des Operators mit dem Inversen U−1 übereinstimmt U† U = 1 = U−1 U . 2.2 (2.9) Fortgeschrittene Konzepte Nach dieser mathematischen Auffrischung und der Einführung der Dirac-Notation, wollen wir, bevor wir zur Physik zurückkehren, noch vier für Sie wahrscheinlich neue mathematische Konzepte diskutieren. Den Begriff des Kommutators zweier Operatoren (zweier Matrizen) haben Sie bereits in den Übungen kennengelernt. Allgemein ist der Kommutator zweier Operatoren A und B durch [A, B] := AB − BA (2.10) gegeben und bildet daher selbst einen Operator. Kommutatoren spielen in der Quantenmechanik eine zentrale Rolle, z.B. in der Heisenbergschen Unschärferelation, die wir im nächsten Kapitel ableiten werden, und von der Sie sicherlich schon einmal gehört haben. Mit Funktionen von Operatoren sind Sie in den Übungsaufgaben in Kontakt gekommen. Wir wollen dieses Konzept etwas allgemeiner untersuchen. Betrachten wir dazu eine Funktion f einer komplexen Variablen z. Wir werden uns dabei auf Funktionen beschränken, die in einer Potenzreihe entwickelbar sind6 f (z) = ∞ X an z n . n=0 6 Über Konvergenzradien machen wir uns zunächst keine Gedanken. 2.2. FORTGESCHRITTENE KONZEPTE 29 Sein A nun ein Operator auf einem N -dimensionalen unitären Raum. Die operatorwertige Funktion f (A) definieren wir dann als f (A) := ∞ X an A n , n=0 wobei An das n-fache Hintereinanderausführen des Operators A bezeichnet und A0 = 1 gilt. Wie im Fall der Funktionen von komplexen Zahlen, verwenden wir P∞ fürn die “bekannten” zPotenzreihen, wie z.B. die Exponentialreihe f (z) = n=0 z /n! = exp (z) = e , die “bekannten” Bezeichnungen. Wie schreiben also z.B. f (A) = ∞ X An n=0 n! = exp (A) = eA . Wie Sie in einer Übungsaufgabe bereits exemplarisch gesehen haben, gilt es beim Umgang mit solchen operatorwertigen Potenzreihen zu beachten, dass zwei Operatoren, im Gegensatz zu komplexen Zahlen, im Allgemeinen nicht kommutieren. Nehmen wir an, dass der Operator A von einem Parameter p abhängt. Wir definieren dann die Differentation des Operators nach diesem Parameter durch dA(p) A(p + ∆p) − A(p) := lim . ∆p→0 dp ∆p Wir betrachten das wichtige Beispiel, dass A(p) := epB , mit einem Operator B gegeben ist. Über die Potenzreihendarstellung von A(p) ist es leicht zu sehen, dass dA(p) = BepB = epB B = BA(p) = A(p)B dp gilt. Wir wollen nun die Frage stellen, ob man für zwei kommutierende, selbstadjungierte Operatoren A und B mit [A, B] = 0 immer ein System von gemeinsamen Eigenvektoren finden kann.7 Betrachten wir dazu zunächst das Problem, dass zumindest einer der Operatoren keine entarteten Eigenwerte besitzt. Nehmen wir an, es sei der Operator A. Wir können dann die Eigenvektoren zu A eindeutig durch |aj i mit dem Eigenwert aj bezeichnen.8 Wir betrachten dann BA |aj i = Baj |aj i = aj B |aj i . 7 Beachten Sie die etwas unsaubere Schreibweise, in der 0 den Nulloperator, der alle Elemente des Vektorraums auf den Nullvektor abbildet, bezeichnet 8 Beachten Sie, dass das im Fall von Entartung nicht geht. Sei der Eigenwert aj M > 1-fach entartet, dann bilden die möglichen Eigenvektoren zu aj einen M -dimensionalen Unterraum. 30 KAPITEL 2. DER N -DIMENSIONALE UNITÄRE RAUM Da [A, B] = 0 ergibt sich aus dieser Gleichung AB |aj i = aj B |aj i . Damit ist B |aj i ein Eigenvektor von A zum Eigenwert aj . Da der Eigenvektor zu aj aber nach Voraussetzung bis auf einen immer freien Vorfaktor eindeutig ist, folgt B |aj i = bj |aj i , so dass |aj i auch Eigenvektor zu B ist. Den Eigenwert bezeichnen wir mit bj .9 Da diese Überlegung für jedes j = 1, 2, . . . , N gilt, bilden die |aj i ein System von gemeinsamen Eigenvektoren. Wir können also A = N X aj |aj i haj | , j=1 B = N X bj |aj i haj | , j=1 1 = N X |aj i haj | j=1 schreiben. Analysieren wir als nächstes den Fall, dass beide Operatoren entartete Eigenwerte haben. Wir betrachten zunächst wieder das Eigenwertproblem des Operators A. Sei Mj ∈ N der Entartungsgrad des Eigenwertes aj . Zu jedem der n < N verschiedenen Eigenwerte aj , j = 1, 2, . . . , n, gibt es einen Mj dimensionalen Unterraum Hj , der aus Eigenvektoren zum Eigenwert aj besteht. Wie wir in der Diskussion im Anschluss an Gl. (2.8) gelernt haben, können wir eine orthonormale Basis von Eigenvektoren konstruieren. Diese bezeichnen wir mit |aj , mj i, wobei mj = 1, 2, . . . , Mj gilt. Es gilt dann die Spektraldarstellung A= Mj n X X aj |aj , mj i haj , mj | . j=1 mj =1 9 Nur wenn auch die Eigenwerte von B nicht entartet sind, sind alle bj verschieden. 2.2. FORTGESCHRITTENE KONZEPTE In der {|aj , mj i} Basis ergibt sich die a1 0 0 . . . 0 a1 . . . . . . 0 ... ... ... ... ... ... ... . . . . . . . . . a1 . A= ... ... ... ... · · · · · · · · · · · · 0 0 0 ... 31 Matrixdarstellung ... ... ... ... ... a2 · · · ... ... ... ... ... ... ... · · · ... ... ... ... ... ... ... · · · ... ... ... ... ... ... ... · · · ... 0 0 0 ... ... ... · · · an . Wir wollen nun die Wirkung von B auf die |aj , mj i untersuchen. Dazu betrachten wir AB |aj , mj i = BA |aj , mj i = aj B |aj , mj i . Damit liegt B |aj , mj i im Unterraum Hj zum Eigenwert aj . Da Vektoren aus Unterräumen zu unterschiedlichen Eigenwerten orthogonal sind, folgt für j 6= k hak , mk | B |aj , mj i = 0 . In der {|aj , mj i} Basis hat B somit eine blockdiagonale Struktur B1 0 . . . 0 . 0 B2 . . . 0 , B= · · · · 0 0 . . . Bn mit Mj × Mj -Matrizen Bj . Da B selbstadjungiert ist, stellt Bj in jedem der n Unterräume Hj einen selbstadjungierten Operator Bj dar. Damit gibt es eine neue Basis in Hj die aus Eigenvektoren zu Bj gebildet wird. Gehen wir für jedes j = 1, 2, . . . , n von der Basis {|aj , 1i , |aj , 2i , . . . , |aj , Mj i} von Hj zu dieser neuen Basis über, so sind die Darstellungen von A und B in dieser Basis Diagonalmatrizen. Es ist wichtig zu beachten, dass die Darstellungen von A in der neuen Basis eine Diagonalmatrix bleibt, da die diagonale Struktur unabhängig von der Wahl der Basis im Unterraum Hj ist. Hat Bj im Unterraum Hj keine entarteten Eigenwerte, so ist die neue Basis eindeutig gegeben. Man kann die neue Basis dann eindeutig durch die Angabe der Eigenwerte aj zu A und bk zu B als |aj , bk i bezeichnen. In diesem Fall ergeben sich die Spektraldarstellungen XX A = aj |aj , bk i haj , bk | , j B = k XX j k bk |aj , bk i haj , bk | 32 KAPITEL 2. DER N -DIMENSIONALE UNITÄRE RAUM und die Zerlegung der Eins 1 = XX j |aj , bk i haj , bk | . k Hat Bj im Unterraum Hj dagegen entartete Eigenwerte, so ergibt sich ein zumindest zweidimensionaler Unterraum Hj,k von Vektoren, die gleichzeitig Eigenvektoren zu A mit Eigenwert aj und B mit Eigenwert bk sind. In diesem Fall ziehen wir einen dritten selbstadjungierten Operator C hinzu, der [A, C] = [B, C] = 0 erfüllt. Wir konstruieren dann wie oben eine Basis in Hj,k aus Eigenvektoren zu C mit Eigenwerten cl . Sind diese in Hj,k nicht entartet, so beschreibt {|aj , bk , cl i} eindeutig eine Basis aus Eigenvektoren zu allen drei Operatoren und es gilt XXX A = aj |aj , bk , cl i haj , bk , cl | , j B = j C = l k k k cl |aj , bk , cl i haj , bk , cl | , l XXX j bk |aj , bk , cl i haj , bk , cl | , l XXX j 1 = k XXX |aj , bk , cl i haj , bk , cl | . l Reicht auch der dritte selbstadjungierte Operator zur eindeutigen Charakterisierung der Basis aus Eigenvektoren nicht aus, so ziehen wir entsprechend weitere selbstadjungierte Operatoren hinzu. Ein Satz von selbstadjungierten, paarweise kommutierenden Operatoren {A, B, C, . . .}, der eine gemeinsame Basis aus Eigenvektoren {|aj , bk , cl , . . .i} eindeutig festlegt, heißt “vollständiger Satz vertauschbarer (kommutierender) Operatoren”. Solche Systeme von Operatoren spielen in der Quantenmechanik eine wichtige Rolle. Mit ihrer Hilfe gelingt es physikalische Systeme eindeutig zu charakterisieren. In einer der in den Übungen diskutierten Situationen sind die Eigenwerte der Matrix A für t 6= 0 nicht entartet. Da A und B hermitesche Matrizen sind und [A, B] = 0, sind die Eigenvektoren von A (für t 6= 0) auch Eigenvektoren von B. Kapitel 3 Nochmal die (Gedanken-)Experimente Wir wollen nun den gerade rekapitulierten Formalismus dazu nutzen, die Durchgangswahrscheinlichkeiten von Photonen durch Polarisatoren bzw. von (Silber-) Atomen durch SG-Apparaturen auf elegante Weise zu berechnen. 3.1 Wahrscheinlichkeiten, Messwerte und Operatoren Betrachten wir dazu zunächst nocheinmal die Polarisatoren aus Kapitel 1.2. Bisher haben wir bei der Beschreibung primär die “Wellensprache” benutzt. Gehen wir nun zu der “Photonensprache” über, so beschreiben wir den Polarisationszustand eines Photons durch einen ket |ψi in einem zweidimensionalen unitären Raum. Die einfallende ebene Welle entspricht einem Strahl identisch präparierter Photonen (alle sind im Zustand |ψi). Die Basisvektoren des “Wellenbildes” ~e1 und ~e3 ersetzen wir durch ket’s |1i bzw. |3i mit h1 |1i = h3 |3i = 1 h1 |3i = 0 . Ein x- bzw. z-polarisiertes Photon ist dann durch den auf 1 normierten1 Vektor |ψi = |1i bzw. |ψi = |3i beschrieben. Ein beliebig polarisiertes Photon beschreiben wir durch den ebenfalls normierten Zustand |ψi = ψ1 |1i + ψ3 |3i, mit ψ1 , ψ3 ∈ C und |hψ |ψi|2 = 1, d.h. |ψ1 |2 +|ψ3 |2 = 1. Da, wie im Kapitel 1.2 diskutiert, die Welle durch E1~e1 + E3~e3 beschrieben wird, muss ψi = cEi , i = 1, 3; c ∈ C −1/2 gelten. Die Normiertheit bedingt dann |c| = (|E1 |2 + |E3 |2 ) . Bis auf einem Faktor eiφ mit der Phase φ ∈ R ist c damit eindeutig festgelegt. Der Wert der 1 Im Folgenden werden wir mit “normiert” immer auf 1 normiert meinen. 33 34 KAPITEL 3. NOCHMAL DIE (GEDANKEN-)EXPERIMENTE Phase spielt hier keine Rolle und wir wählen daher φ = 0.2 Damit gilt E1 E3 |ψi = ψ1 |1i + ψ3 |3i = p |1i + p |3i 2 2 |E1 | + |E3 | |E1 |2 + |E3 |2 Aus Überlegungen zur Energiedichte ergibt sich für eine durch E1~e1 + E3~e3 beschriebene Lichtwelle nach einem x- bzw. z-Polarisator, dass der Bruchteil |E1/3 |2 /(|E1 |2 + |E3 |2 ) der Energie wieder austritt. Im Photonenbild lässt sich diese Beobachtung wie folgt interpretieren: Die Wahrscheinlichkeit wx (|ψi) bzw. wz (|ψi), dass ein durch den Vektor (Zustand) |ψi beschriebenes Photon durch den x- bzw. z-Polarisator durchtritt, ist durch |ψ1/3 |2 = |E1/3 |2 /(|E1 |2 + |E3 |2 ) gegeben. Die Wahrscheinlichkeit ist hier über die relative Häufigkeit bei wiederholter Ausführung desselben Durchgangsexperiment im Limes “unendlicher Wiederholung” definiert. Für einen Strahl von sehr vielen identisch präparierten Photonen (jedes für sich durch den Vektor |ψi beschrieben) heißt das, dass ein Bruchteil |ψ1/3 |2 einen x- bzw. z-Polarisator durchtritt. Formal lässt sich die Durchgangswahrscheinlichkeit durch wx (|ψi) = |h1 |ψi|2 , wz (|ψi) = |h3 |ψi|2 bestimmen. Das Skalarprodukt hi |ψi, i = 1, 3 bezeichnet man als Wahrscheinlichkeitsamplitude. Betrachten wir zu diesem Formalismus ein Beispiel. Wie groß ist die Wahrscheinlichkeit, dass ein in x0 -Richtung (die durch Gl. (1.5) festgelegt wird) linear polarisiertes Photon durch einen x-Polarisator tritt? Der Zustand des x0 polarisierten Photons ist nach Gl. (1.5) durch3 |ψi = |10 i = cos ϕ |1i + sin ϕ |3i gegeben. Für die Durchgangswahrscheinlichkeit ergibt sich somit 2 wx (|10 i) = |h1 |10 i| = cos2 ϕ . In den Übungen werden Sie weitere Beispiele dieser Art rechnen. Wir können mit Hilfe dieses Formalismus die Wahrscheinlichkeit |hP |ψi|2 angeben, dass ein sich im normierten Polarisationszustand |ψi befindliches Photon4 einen durch die Angabe des normierten Zustandes |P i festgelegten Polarisator durchtritt.5 Hinter dem Polarisator befindet sich das Photon dann (wenn 2 Eine analoge Freiheit der Phase wird uns noch häufiger begegnen. Neben |1i und |3i bilden z.B. auch die Vektoren |10 i und |30 i, die linear in x0 bzw. z 0 polarisierten Photonen entsprechen eine Orthonormalbasis. 4 Zur Erinnerung: Wir konzentrieren uns bei der Beschreibung des Photons immer noch ausschließlich auf die Polarisation. Andere Eigenschaften des Teilchens (Ort, Impuls, . . . ) werden nicht mit angegeben. 5 Die Charakterisierung des Polarisators durch |P i bedeutet, dass im Zustand |ψi = |P i präparierte Photonen den Polarisator mit Wahrscheinlichkeit 1 durchlaufen. 3 3.1. WAHRSCHEINLICHKEITEN, MESSWERTE UND OPERATOREN 35 es durchgegangen ist) im (normierten) Zustand |ψ 0 i = |P i, denn wir wissen ja, dass es einen nachfolgenden durch das gleiche |P i beschriebenen Polarisator mit Wahrscheinlichkeit 1 durchlaufen würde.6 Der Ausdruck für die “Übergangswahrscheinlichkeit” |h. . . |. . .i|2 wird sich als eines der zentralen Postulate der Quantenmechanik herausstellen. Wie im Fall der Beugung am Doppelspalt können wir erneut nur eine Wahrscheinlichkeitsaussage über den Ausgang eines Experimentes treffen und das, obwohl uns der Anfangspolarisationszustand |ψi des Photons bekannt war. Wir können hier bereits verstehen, welche Eigenschaft im Fall der Polarisation von Photonen (der Polarisation einer Lichtwelle) zu diesem statistischen Verhalten führt. Die Lichtwelle wird durch einen zweidimensionalen Polarisationsvektor beschrieben. Das heißt, dass die Welle sich allgemein in einem Polarisationszustand befindet, der durch eine Linearkombination der zwei Basisvektoren beschrieben wird. In der “Teilchensprache” wird eine Lichtwelle durch einen Strahl identisch präparierter Photonen gebildet. Um die Polarisationsexperimente in der “Teilchensprache” erklären zu können, muss sich somit jedes individuelle Photon in einem Zustand befinden, der eine Linearkombination ist.7 In der {|1i , |3i} Basis heißt das, dass ein durch den eindeutig festgelegten Zustand8 |ψi = ψ1 |1i + ψ3 |3i beschriebenes Photon weder x noch z polarisiert ist. Diese Eigenschaft läuft unserer Erfahrung mit klassischen Teilchen völlig zuwider. Wir kommen nun auf das Stern-Gerlach Experiment zurück. Unserer Einsicht aus Kapitel 1.2 folgend, ordnen wir dem (Silber-)Atom eine innere Eigenschaft zu (analog der Polarisation), die durch einen zweidimensionalen Vektor beschrieben wird und ein magnetisches Moment µ ~ bedingt. Wir ersetzen also |1i → |~e3 , +i und |3i → |~e3 , −i, bzw. allgemein |10 i → |~n, +i und |30 i → |~n, −i, mit einem Einheitsvektor ~n, der die Richtung der Strahlaufspaltung im Stern-Gerlach Experiment festlegt. Bezüglich der uns unbekannten Eigenschaft wird das Atom dann durch einen normierten Zustand |ψi = ψ+ |~n, +i + ψ− |~n, −i mit ψ± ∈ C ~ und |ψ+ |2 + |ψ− |2 = 1 beschrieben. Das Experiment zeigt, dass die Energie −~µ · B ~ = B~n nur zwei diskrete Werte ∓µ0 B annehmen kann. Wir werim Magnetfeld B den jetzt versuchen, die Energieaufspaltung mit Hilfe eines linearen Operators auf dem zweidimensionalen unitären Raum zu beschreiben, der auf |ψi wirkt. Da ~ weiterhin klassisch beschrieben werden soll, muss das, dabei das Magnetfeld B das Atom charakterisierende magnetische Moment µ ~ zu einem Operator werden. 6 Beachten Sie, dass es sich bei den Apparaturen in einigen der Übungsaufgaben nicht um Polarisatoren in diesem Sinne handelt. Durch Polarisatoren im obigen Sinne wird eine spezifische Polarisation gemessen, was in den Apparaturen aus gewissen Übungsaufgaben nicht geschieht. 7 Wir haben hier natürlich nicht “bewiesen”, dass es zur Erklärung der Polarisationsexperimente in der “Teilchensprache” “nur” diese Möglichkeit der Beschreibung gibt. 8 Wir wollen nocheinmal betonen, dass die Tatsache, dass wir nur Wahrscheinlichkeitsaussagen treffen können, nichts damit zu tun hat, dass wir, wie in der statistischen Mechanik, die relevante Eigenschaft des Teilchens aufgrund ungenügender Informationen nicht genau kennen. Durch die Angabe von |ψi sind die im betrachteten Experiment relevanten Eigenschaften des Photons eindeutig festgelegt. 36 KAPITEL 3. NOCHMAL DIE (GEDANKEN-)EXPERIMENTE Genauer heißt das, dass die Komponenten µi des dreidimensionalen Vektors µ ~ zu 9 Operatoren werden müssen. Bevor wir diese Operatoren explizit konstruieren, spalten wir den Faktor µ0 ab: µ ~ = µ0~σ . Die Energie im Stern-Gerlach Experiment wird damit durch den Operator H := −µ0 B(σ1 n1 + σ2 n2 + σ3 n3 ) =: −µ0 Bσ~n (3.1) beschrieben. In Anlehnung an die, die Energie eines klassischen Teilchens beschreibende Hamiltonfunktion nennt man diesen Operator den Hamiltonoperator H. Die Operatoren σi auf dem zweidimensionalen Zustandsraum müssen wir noch genauer spezifizieren. Als einen Schritt hin zu einer Charakterisierung fordern wir, dass die Basiszustände |~n, ±i Eigenzustände zu σ~n = σ1 n1 +σ2 n2 +σ3 n3 mit Eigenwert ±1 sind σ~n |~n, ±i = ± |~n, ±i . Speziell gilt σi |~ei , ±i = ± |~ei , ±i. Damit folgt H |~n, ±i = ∓µ0 B |~n, ±i und es ergibt sich die “Quantisierung” der Energie, wie sie sich in der Aufspaltung des Atomstrahls manifestiert. Die möglichen Messwerte der Energie ∓µ0 B im Stern-Gerlach Experiment sind durch die Eigenwerte des Hamiltonoperators gegeben. Messen wir für ein Atom (in einem stark verdünnten Strahl) die Energie −µ0 B, d.h. befindet sich das Atom hinter der SG-Apparatur im oberen Strahl, so ist es nach der Energiemessung (dem Durchgang durch die Apparatur) durch den Zustand |ψi = |~n, +i beschrieben. Letzteres wird dadurch offensichtlich, dass wir bei einer sofort nach der ersten Energiemessung erfolgenden zweiten Messung mit Sicherheit −µ0 B messen. Gleiches gilt bei der Messung von µ0 B für den Zustand |~n, −i. Die Spektraldarstellung des Operators σ~n ergibt sich zu σ~n = |~n, +i h~n, +| − |~n, −i h~n, −| , (3.2) woraus für den Hamiltonoperator H = −µ0 B (|~n, +i h~n, +| − |~n, −i h~n, −|) (3.3) folgt. Mit Hilfe von Gl. (3.2) sieht man leicht, dass σ~n† = σ~n , σ~n also selbstadjungiert ist. Aus Gl. (3.1) folgt das auch der Hamiltonoperator H selbstadjungiert ist. 9 In der folgenden Konstruktion, dürfen die Vektoren im dreidimensionalen euklidischen ~ ~n und µ Raum B, ~ , nicht mit den zweidimensionalen Vektoren in dem die Eigenschaft des Atoms beschreibenden Zustandsraum verwechselt werden. Die Gefahr der Verwechslung wird dadurch gesteigert, dass die Komponenten µi des dreidimensionalen Vektors µ ~ zu Operatoren werden, die auf dem zweidimensionalen Zustandsraum operieren. µ ~ ist ein operatorwertiger Vektor (oder Vektoroperator). 3.1. WAHRSCHEINLICHKEITEN, MESSWERTE UND OPERATOREN 37 Die gerade gemachten Beobachtungen sind allgemeingültige Prinzipien der Quantenmechanik. Die möglichen Messwerte der Energie eines Quantensystems sind die Eigenwerte eines selbstadjungierten Hamiltonoperators, den man nach einer noch zu diskutierenden Vorschrift aus der Hamiltonfunktion des äquivalenten klassischen Problems gewinnt. Einen ersten Eindruck von dieser Konstruktionsvorschrift liefert das Beispiel des Stern-Gerlach Experiments. Nach einer Energiemessung, die den Energieeigenwert En geliefert hat, befindet sich das Quantensystem im normierten Eigenzustand |En i zu diesem Eigenwert.10 m m x1 x2 Abbildung 3.1: Ein Beispiel aus der klassischen Mechanik: Das Problem gekoppelter Massen. Der Hamiltonoperator H legt über seine Eigenwerte nicht nur die möglichen Messwerte der Energie fest, sondern bestimmt - ähnlich wie die Hamiltonfunktion in der klassischen Mechanik (Hamiltonsche Gleichungen) - auch die Dynamik des mit dem magnetischen Moment verbundenen (uns bisher unbekannten) Freiheitsgrad des (Silber-)Atoms.11 Von dieser Dynamik, d.h. der von einem Anfangszustand ausgehenden zeitlichen Entwicklung, haben wir bisher noch nicht gesprochen, da sie zum Verständnis des Ausgangs des Stern-Gerlach Experiments nicht relevant ist. In ihm messen wir nur die möglichen Energieeigenwerte. Wir wollen die Form der Bewegungsgleichung der Quantenmechanik durch ein Beispiel aus der klassischen Mechanik motivieren. Betrachten wir das in Abbildung 3.1 dargestellte mechanische System. Zwei Körper gleicher Masse m sind über Federn gleicher Federkonstante k gekoppelt und mit den Wänden verbunden. Die Auslenkung aus der Ruhelage ist durch x1 und x2 bezeichnet. Die Bewegungsgleichungen für die xj ergeben sich zu 2k k d2 x1 (t) = − x1 (t) + x2 (t) 2 dt m m 2 d k 2k x2 (t) = x1 (t) − x2 (t) 2 dt m m 10 Ist der Eigenwert entartet, so liegt der Zustand nach der Messung im Unterraum zum Eigenwert En . 11 Wie gerade beim Photon, konzentrieren wir uns bisher bei der Beschreibung der Eigenschaften des (Silber-)Atoms auf den in einem zweidimensionalen Vektorraum beschreibbaren Freiheitsgrad. Über andere das Atom beschreibende Eigenschaften, wie den Ort oder den Impuls machen wir hier (noch) keine Aussagen. 38 KAPITEL 3. NOCHMAL DIE (GEDANKEN-)EXPERIMENTE bzw. in Matrixschreibweise 2k k d2 x1 (t) −m x1 (t) m = . k x2 (t) − 2k dt2 x2 (t) m m Die Matrix auf der rechten Seite ist hermitesch, stellt also einen selbstadjungierten Operator auf einem zweidimensionalen Vektorraum dar und der Lösungsvektor ist ein Element dieses Raums.12 In der Mechanik Vorlesung haben Sie gelernt, wie Sie Probleme dieser Art lösen. Ein sehr wichtiger Schritt dabei, ist Berechnung der Eigenwerte und Eigenvektoren der Matrix auf der rechten Seite, die zu einer Bestimmung der Eigenmoden führt. Mit Hilfe der Eigenmoden lässt sich das Differentialgleichungssytem unter Berücksichtigung der Anfangsbedingungen einfach lösen. In Analogie zu dieser Bewegungsgleichung, ist die Dynamik eines zur Zeit t durch den Zustand |ψ(t)i beschriebenen Quantensystems durch die Differentialgleichung i~ d |ψ(t)i = H |ψ(t)i dt (3.4) bestimmt. Das Problem besteht also darin mit Hilfe von Gl. (3.4) |ψ(t)i aus einem vorgegebenen |ψ(0)i zu bestimmen. Legt man eine Basis fest, in unserem Beispiel z.B. die {|~e3 , ±i} Basis, gilt es die zeitabhängigen Koeffizienten ψ± (t) der Entwicklung |ψ(t)i = ψ+ (t) |~e3 , +i + ψ− (t) |~e3 , −i aus den ψ± (0) zu berechnen. Wie im obigen Beispiel der klassischen Mechanik, ist die Zeit t bezüglich der Vektoreigenschaften von |ψ(t)i ein Parameter, im Allgemeinen gilt also für t1 6= t2 , dass |ψ(t1 )i 6= |ψ(t2 )i. Ein entscheidender Unterschied zwischen der obigen Newtongleichung und der Schrödingergleichung (3.4) besteht darin, dass man in letzterer den Vektor auf der linken Seite nur einmal nach der Zeit differenziert. Daher besteht die Anfangsbedingung auch nur aus den vorgegeben ψ± (0). Im obigen klassischen Problem müssen neben den Anfangsauslenkungen auch die Geschwindigkeiten vorgegeben werden, da es sich um ein Differentialgleichungssystem zweiter Ordnung handelt. Bei der Lösung der Differentialgleichung (3.4) spielt die Bestimmung der Eigenwerte und Eigenvektoren eine ähnlich wichtige Rolle, wie im obigen klassischen Beispiel. Die Gültigkeit der die Dynamik beschreibenden Schrödingergleichung (3.4) ist nicht auf unser Beispiel des magnetischen Moments in einem inhomogenen Magnetfeld beschränkt. Die Dynamik jedes Quantensystems wird durch die Schrödingergleichung gegeben, wobei der Hamiltonoperator, wie oben angedeutet, durch eine Konstruktionsvorschrift aus der Hamiltonfunktion des äquivalenten klassischen Problems bestimmt wird. Es ist verständlich, wenn Ihnen die Schrödingergleichung etwas “vom Himmel zu fallen” scheint. Dieser Eindruck lässt sich jedoch in keinem mir bekannten Beispiel zur Motivation der Gleichung vermeiden. Nach diesem Ausflug in die Dynamik von Quantensystemen, kehren wir zu 12 Der Vektorraum ist hier ein reeller. 3.1. WAHRSCHEINLICHKEITEN, MESSWERTE UND OPERATOREN 39 unserem eigentlich Problem zurück, den Ausgang des Stern-Gerlach Experiments zu beschreiben bzw. “zu verstehen”. Wir verwenden als nächstes die Spektraldarstellung Gl. (3.2) um σ~n2 zu berechnen σ~n2 = (|~n, +i h~n, +| − |~n, −i h~n, −|) (|~n, +i h~n, +| − |~n, −i h~n, −|) = |~n, +i h~n, +| + |~n, −i h~n, −| = 1. Bestimmt man dagegen σ~n2 mit Hilfe von σ~n = σ1 n1 + σ2 n2 + σ3 n3 so ergibt sich13 σ~n2 = σ12 n21 + σ22 n22 + σ32 n23 + (σ1 σ2 + σ2 σ1 ) n1 n2 + (σ1 σ3 + σ3 σ1 ) n1 n3 + (σ2 σ3 + σ3 σ2 ) n2 n3 . Damit die rechte Seite dieser Gleichung für jeden beliebigen Einheitsvektor ~n gleich 1 ist, muss σi σj + σj σi = 2δi,j 1 (3.5) gelten. Da die Eigenwerte der σi für i = 1, 2, 3 gleich ±1 sind, folgt Sp σi = 0 . (3.6) Mit Hilfe der gerade gewonnenen Eigenschaften werden wir nun eine Matrixdarstellung der σi konstruieren. Wir wählen dabei die Darstellung bezüglich der {|~e3 , +i , |~e3 , −i} Basis. Damit ergibt sich sofort 1 0 . σ3 = . 0 −1 Aus σj† = σj und Sp σj = 0 ergibt sich für j = 1, 2 die Darstellung aj b j . σj = , b∗j −aj mit aj , bj ∈ C. Benutzen wir zusätzlich, dass σj σ3 + σ3 σj = 0, d.h. aj bj aj b j 1 0 1 0 2aj 0 + = b∗j −aj b∗j −aj 0 −1 0 −1 0 2aj 0 0 = 0 0 so folgt aj = 0. Analog folgt aus σj2 = 1 0 bj 0 bj |bj |2 0 1 0 = = b∗j 0 b∗j 0 0 |bj |2 0 1 13 Da die σi Operatoren sind, müssen wir davon ausgehen, dass σi σj 6= σj σi gilt. 40 KAPITEL 3. NOCHMAL DIE (GEDANKEN-)EXPERIMENTE und damit |bj |2 = 1, also bj = eiαj mit αj ∈ R. Verwenden wir abschließend noch σ1 σ2 + σ2 σ1 = 0, d.h. 0 eiα2 0 eiα1 0 eiα2 0 eiα1 + e−iα2 0 e−iα2 0 e−iα1 0 e−iα1 0 2 cos (α1 − α2 ) 0 0 0 = = , 0 2 cos (α1 − α2 ) 0 0 so ergibt sich α1 − α2 = π/2 + nπ, n ∈ Z. Damit ist auch die Phasendifferenz α1 − α2 festgelegt. Wir wählen dann α1 = 0, so dass eiα2 = ∓i folgt. In einem letzten Schritt legen wir eiα2 = −i fest. Für die {|~e3 , +i , |~e3 , −i} Darstellung der σj ergibt sich so 0 1 0 −i 1 0 . . . σ1 = , σ2 = , σ3 = . (3.7) 1 0 i 0 0 −1 Man nennt diese Matrizen die Pauli-Spinmatrizen.14 Für ein allgemeines ~n = sin θ cos ϕ ~e1 + sin θ sin ϕ ~e2 + cos θ ~e3 ergibt sich cos θ e−iϕ sin θ . σ~n = ~σ · ~n = . (3.8) eiϕ sin θ − cos θ In den Übungen haben Sie die Darstellung der Eigenvektoren |~n, ±i zu σ~n in der {|~e3 , +i , |~e3 , −i} Basis cos (θ/2) − sin (θ/2) . . |~n, +i = , |~n, −i = (3.9) eiϕ cos (θ/2) eiϕ sin (θ/2) bestimmt. Basisunabhängig gilt |~n, +i = cos (θ/2) |~e3 , +i + eiϕ sin (θ/2) |~e3 , −i |~n, −i = − sin (θ/2) |~e3 , +i + eiϕ cos (θ/2) |~e3 , −i , (3.10) σ1 = |~e3 , +i h~e3 , −| + |~e3 , −i h~e3 , +| σ2 = −i |~e3 , +i h~e3 , −| + i |~e3 , −i h~e3 , +| σ3 = |~e3 , +i h~e3 , +| − |~e3 , −i h~e3 , −| . (3.11) sowie Analog zum Experiment mit polarisiertem Licht können wir nun die Durchgangswahrscheinlichkeit w~n,± (|ψi) = |h~n, ± |ψi|2 (3.12) 14 Die Bedeutung des Wortes “Spin” wird später klar werden. 3.1. WAHRSCHEINLICHKEITEN, MESSWERTE UND OPERATOREN 41 eines durch einen normierten Vektor |ψi = ψ+ |~e3 , +i + ψ− |~e3 , −i, mit ψ+ , ψ− ∈ C beschriebenen (Silber-)Atoms durch eine durch |~n, ±i charakterisierte SGApparatur berechnen.15 Betrachten wir dazu ein Beispiel. Wir schicken die Atome erst durch einen durch |~e3 , +i charakterisierten SG-Apparat. Hinter diesem sind alle Atome des Strahls im Zustand |~e3 , +i. Wir schicken sie dann auf einen Apparat der in ~n-Richtung aufspaltet und fragen, wie groß die Wahrscheinlichkeit ist, ein Atom im ~n, + bzw. ~n, − Strahl zu finden. Nach unserer Rechenvorschrift ergibt sich w~n,+ (|~e3 , +i) = |h~n, + |~e3 , +i|2 2 = cos (θ/2) h~e3 , +| + e−iϕ sin (θ/2) h~e3 , −| |~e3 , +i = cos2 (θ/2) , bzw. w~n,− (|~e3 , +i) = |h~n, − |~e3 , +i|2 2 = − sin (θ/2) h~e3 , +| + e−iϕ cos (θ/2) h~e3 , −| |~e3 , +i = sin2 (θ/2) . Wie zu fordern ist, ergibt sich w~n,+ (|~e3 , +i) + w~n,− (|~e3 , +i) = 1, da das Atom in einem der beiden Strahlen sein muss. Nach dem Durchgang befindet sich das Atom dann im Zustand |~n, +i, wenn es in +~n-Richtung abgelenkt wurde und im Zustand |n, −i im Fall der Ablenkung in −~n-Richtung. In den Übungen werden Sie als weiteres Beispiel die Durchgangswahrscheinlichkeiten der Abfolge von SGApparaturen aus Abbildung 1.14 berechnen. Für uns bleibt immer noch unklar, welche physikalischen Eigenschaft des Silberatoms wir mit Hilfe der Vektoren in einem zweidimensionalen unitären Raum beschreiben. Um dieses zu ergründen betrachten wir den Kommutator der Operatoren σj . In der Matrixdarstellung bezüglich der {|~e3 , +i , |~e3 , −i} Basis haben Sie die Kommutatoren der σj bereits in den Übungen bestimmt. Wir werden daher hier darstellungsunabhängig rechnen. Als Beispiel betrachten wir [σ1 , σ2 ] = (|~e3 , +i h~e3 , −| + |~e3 , −i h~e3 , +|) (−i |~e3 , +i h~e3 , −| + i |~e3 , −i h~e3 , +|) − (−i |~e3 , +i h~e3 , −| + i |~e3 , −i h~e3 , +|) (|~e3 , +i h~e3 , −| + |~e3 , −i h~e3 , +|) = 2i (|~e3 , +i h~e3 , +| − |~e3 , −i h~e3 , −|) = 2iσ3 . Völlig analog finden wir [σ1 , σ3 ] = −2iσ2 , [σ2 , σ3 ] = 2iσ1 . 15 |~n, +i bedeutet, dass der Strahl in die ~n-Richtung aufgespalten wird und der ~n, − Strahl nach der SG-Apparatur blockiert wird. Analog für |~n, −i. 42 KAPITEL 3. NOCHMAL DIE (GEDANKEN-)EXPERIMENTE Diese Kommutatorrelationen lassen sich mit Hilfe des totalantisymmetrischen εSymbols εi,j,k , mit ε1,2,3 = ε2,3,1 = ε3,1,2 = 1, ε3,2,1 = ε2,1,3 = ε1,3,2 = −1 und für alle anderen Kombinationen von i, j, k ∈ {1, 2, 3}, εi,j,k = 0, kompakt schreiben [σi , σj ] = 2 i εi,j,k σk , (3.13) wobei zusätzlich die Einsteinsche Summationskonvention benutzt wird. Diese Relation sollte Sie an die Poissonklammern von Komponenten des Drehimpulsvektors in der klassischen Mechanik erinnern. Definieren wir den operatorwertigen Vektor (Vektoroperator) ~ ~s := ~σ , 2 (3.14) [si , sj ] = i ~ εi,j,k sk . (3.15) so ergibt sich aus Gl. (3.13) Bis auf den Faktor i~ entspricht diese Relation exakt den Poissonklammern von Komponenten des klassischen Drehimpulsvektors. Diese Beobachtung suggeriert, dass es sich bei der uns noch unbekannten Eigenschaft des Silberatoms um eine “drehimpulsähnliche” Größe handelt, die das entsprechende magnetische Moment nach sich zieht. Sie hängt mit der Summe der Spins (oder Eigendrehimpulse) der Elektronen des Atoms zusammen.16 Der Name Eigendrehimpuls stammt vom klassischen Bild, dass ein magnetisches Moment durch eine rotierende Ladungsverteilung zustande kommt. Diese Bild ist jedoch inkorrekt, da auch ungeladene Teilchen einen Spin besitzen können. Strikt gesprochen besitzt der quantenmechanische Spinfreiheitsgrad kein klassisches Analogon. Wir werden lernen, dass der Spin des Silberatoms tatsächlich vom Spin eines der 47 Elektronen stammt. Daher bezeichnet man den soeben konstruierten Operator ~s auch als Spinoperator des Elektrons. Wie die σi sind die si selbstadjungiert. Die möglichen Messwerte der Komponenten des Elektronenspinoperators sind wie beim Hamiltonoperator die zugehörigen Eigenwerte, die sich hier zu ±~/2 ergeben. Es ist kein Zufall, dass sowohl Poissonklammern der klassischen Mechanik als auch Kommutatoren der Quantenmechanik oft mit [. . . , . . .] bezeichnet werden. Auf die gerade benutzte Korrespondenz von Poissonklammern der klassischen Mechanik und Kommutatorrelationen der Quantenmechanik werden wir noch häufiger zurück kommen. 3.2 Weitere Konzepte der Statistik Anhand des Stern-Gerlach Versuchs wollen wir noch weitere grundlegende Konzepte der Quantenmechanik erläutern. Wir haben bereits gesehen, dass die möglichen Messwerte der Energie durch die Eigenwerte ∓µ0 B des Hamiltonoperators 16 Der Spin des Atomkerns kann hier vernachlässigt werden, da grob gesprochen ∼ mKern /mElek. . µElek. /µKern 0 0 3.2. WEITERE KONZEPTE DER STATISTIK 43 gegeben sind. Schicken wir also einzelne Atome (verdünnter Strahl) die durch den normierten Zustand |ψi 6= |~n, ±i charakterisiert sind durch einen durch ~n beschriebenen SG-Apparat, so messen wir beide möglichen Eigenwerte - anders ausgedrückt, es wird sowohl Atome geben, die in ~n-Richtung abgelenkt werden als auch welche, die nach −~n gehen. Wir können dann den Erwartungswert oder Mittelwert einer Messreihe definieren. Der Erwartungswert der Energie in einem Experiment mit einem ~n SG-Apparat und identisch präparierten Atomen, die durch den normierten Zustand |ψi beschrieben werden, ist hHi|ψi := −µ0 B w~n,+ (|ψi) + µ0 B w~n,− (|ψi) = −µ0 B (hψ| ~n, +i h~n, +| ψi − hψ| ~n, −i h~n, −| ψi) = hψ| H |ψi , (3.16) wobei wir im Übergang von der ersten auf die zweite Zeile Gl. (3.12) und im Übergang von der zweite auf die dritte Gl. (3.3) verwendet haben. Die Varianz (im Zustand |ψi) ist definiert als der Erwartungswert der quadratischen Abweichung vom Mittelwert 2 2 Var |ψi (H) := −µ0 B − hHi|ψi w~n,+ (|ψi) + µ0 B − hHi|ψi w~n,− (|ψi) = H 2 |ψi − hHi2|ψi = hψ| H 2 |ψi − hψ| H |ψi2 = hψ| (H − hψ| H |ψi)2 |ψi . (3.17) Die Wurzel der Varianz bezeichnet man als Standardabweichung oder Unschärfe q (3.18) ∆|ψi (H) := Var |ψi (H) . Beispiele zum Erwartungswert, der Varianz und der Unschärfe werden sie in den Übungen rechnen. In der Quantenmechanik wird jede physikalische Observable (Messgröße) durch einen selbstadjungierten Operator A beschrieben. Der Erwartungswert, die Varianz und die Unschärfe in einem das betrachtete System beschreibenden Zustand (Vektor) |ψi sind dann analog definiert wenn H durch den allgemeinen selbstadjungierten Operator A ersetzt wird.17 Um möglichen Missverständnissen vorzubeugen, wollen wir nocheinmal betonen, dass in einem Experiment an einem einzelnen quantenmechanischen Teilchen (System) das durch den Zustand |ψi beschrieben wird, bei einer Messung immer ein eindeutiger Wert gemessen wird. Der statistisch Aspekt wird erst bei wiederholter Ausführung des selben Experimentes mit identisch präparierten Teilchen (Systemen) offensichtlich. Selbstverständlich werden wir im Laufe der Vorlesung auf diesen Aspekt noch sehr viel genauer eingehen. 17 Im Allgemeinen hat der dieser Beschreibung zugrunde liegende Vektorraum eine Dimension größer als zwei. 44 KAPITEL 3. NOCHMAL DIE (GEDANKEN-)EXPERIMENTE Die Heisenbergsche Unschärferelation ist eine Konsequenz des Formalismus der Quantenmechanik von der Sie sicherlich schon einmal gehört haben. Im Fall eines endlichdimensionalen unitären Raums können wir sie bereits jetzt herleiten und verstehen. Wir werden im ersten Schritt (zur Auffrischung) die Schwarzsche Ungleichung beweisen. Betrachten wir dazu zwei Zustände |ψi und |ϕi die nicht gleich dem Nullvektor sind. Den Zustand |χi definieren wir als |χi := |ψi − hϕ |ψi |ϕi / hϕ |ϕi. Damit gilt hϕ |χi = 0, so dass |hψ |ϕi|2 |hψ |ϕi|2 hϕ |ϕi + hχ |χi ≥ . hψ |ψi = hϕ |ϕi |hϕ |ϕi|2 Die Schwarze Ungleichung hψ |ψi hϕ |ϕi ≥ |hψ |ϕi|2 (3.19) folgt durch einfaches Umformen. Gleichheit gilt offensichtlich für hχ |χi = 0, d.h. wenn |χi der Nullvektor ist. Damit sind dann aber |ψi und |ϕi linear abhängig. Um mit Hilfe der Schwarzen Ungleichung die Heisenbergsche Unschärferelation (in ihrer endlichdimensionalen Variante) zu beweisen, betrachten wir zwei selbstadjungierte Operatoren A und B auf einem N -dimensionalen unitären Raum. Wir nehmen an, dass A und B nicht kommutieren (vertauschen), d.h. [A, B] 6= 0. Wir definieren18 |ϕA i := (A − hϕ| A |ϕi) |ϕi =: δA |ϕi |ϕB i := (B − hϕ| B |ϕi) |ϕi =: δB |ϕi . Nach Gl. (3.17) gilt hϕA |ϕA i = Var |ϕi (A) und analog für B. Es gilt |hϕA |ϕB i|2 = (Re hϕA |ϕB i)2 + (Im hϕA |ϕB i)2 , sowie Im hϕA |ϕB i = = = = = = 18 1 (hϕ| δAδB |ϕi − hϕ| δAδB |ϕi∗ ) 2i 1 † hϕ| δAδB |ϕi − hϕ| (δAδB) |ϕi 2i 1 hϕ| δAδB |ϕi − hϕ| δB† δA† |ϕi 2i 1 (hϕ| δAδB |ϕi − hϕ| (δBδA) |ϕi) 2i 1 hϕ| [δA, δB] |ϕi 2i 1 hϕ| [A, B] |ϕi 2i In der Definition müssten wir eigentlich A − hϕ| A |ϕi 1 schreiben, damit auch der zweite Summand als Operator zu erkennen ist. Wir werden jedoch im Folgenden den 1-Operator weglassen, wenn aus dem Kontext klar wird, dass es sich bei dem betrachteten Ausdruck um eine komplexe Zahl mal dem 1-Operator handelt. 3.2. WEITERE KONZEPTE DER STATISTIK 45 und 1 (hϕ| δAδB |ϕi + hϕ| δAδB |ϕi∗ ) 2 1h = hϕ| A − hAi|ϕi B − hBi|ϕi 2 i + B − hBi|ϕi A − hAi|ϕi |ϕi Re hϕA |ϕB i = = 1 hϕ| {A, B} |ϕi − hAi|ϕi hBi|ϕi . 2 Dabei haben wir den Antikommutator {A, B} := AB + BA (3.20) eingeführt. Mit Hilfe von Gl. (3.19) ergibt sich dann 1 Var |ϕi (A) Var |ϕi (B) ≥ |hϕ| [A, B] |ϕi|2 + 4 1 hϕ| {A, B} |ϕi − hAi|ϕi hBi|ϕi 2 2 und nach weglassen des zweiten Terms und Wurzelziehen folgt die Heisenbergsche Unschärferelation ∆|ϕi (A) ∆|ϕi (B) ≥ 1 |hϕ| [A, B] |ϕi| . 2 (3.21) Um Gl. (3.21) einen physikalischen Sinn zu geben, nehmen wir an, dass A und B zwei Observable beschreibende Operatoren sind, die nicht kommutieren, also z.B. die x- und die y-Komponenten des Elektronenspins (siehe Gl. (3.15)). Messen wir nun an vielen identischen, durch |ϕi beschriebenen Systemen, jeweils die zu A und B gehörenden Observablen, so ist das Produkt der Unschärfen in diesen Messungen größer gleich der Hälfte des Erwartungswertes des Kommutators im Zustand |ϕi.19 Da der Kommutator nicht verschwindet, heißt das, dass die zu A und B gehörenden Observablen im Zustand |ϕi nicht gleichzeitig (d.h. im gleichen Zustand) scharf20 gemessen werden können. Für unser Beispiel bedeutet das im Fall |ϕi = |~n, +i ∆|~n,+i (s1 )∆|~n,+i (s2 ) ≥ ~2 ~2 ~ |h~n, +| s3 |~n, +i| = |h~n, +| σ3 |~n, +i| = |cos θ| , 2 4 4 wobei wir im letzten Schritt Gln. (3.10) und (3.11) verwendet haben. Um in diesem Beispiel für den speziellen Fall θ = π/2 eine nicht-triviale Aussage zu bekommen, darf man den zweiten Term (siehe die Gleichung vor Gl. (3.21)) bei der 19 Damit Gl. (3.21) angewandt werden kann, muss die Messung der zu A und B gehörenden Observablen im gleichen Zustand |ϕi vorgenommen werden. 20 “Scharf” heißt hier, dass ∆|ϕi (A) = 0 und analog für B. 46 KAPITEL 3. NOCHMAL DIE (GEDANKEN-)EXPERIMENTE Herleitung nicht vernachlässigen. Werden die zu A und B gehörenden Observablen kurz hintereinander am selben System gemessen, so ergibt sich eine andere Situation, da sich das System vor der ersten Messung im Zustand |ϕi befindet nach dieser jedoch in einem der normierten Eigenzustände |aν i von A.21 Das Produkt der Unschärfen ist bei hintereinander folgender Messungen nicht bezüglich des gleichen Zustandes zu bilden. Fassen wir kurz zusammen, was wir bereits über die Quantenmechanik gelernt haben: • Ein Teilchen, oder allgemeiner ein System, wird durch einen normierten Vektor bzw. Zustand |ψi in einem komplexen Vektorraum H (bisher, einem endlichdimensionalen Vektorraum) beschrieben. • Observable werden durch lineare, selbstadjungierte Operatoren A auf H beschrieben. Die möglichen Messwerte sind die (reellen) Eigenwerte λν . Nach der Messung befindet sich das Teilchen, bzw. das System, im normierten Zustand |ψi = |aν i, wobei |aν i der Eigenzustand zum Messwert λν ist. • Die Wahrscheinlichkeit wλν (|ψi) im Zustand |ψi bei einer Messung der zu A gehörenden Observablen den Eigenwert λν zu messen ist durch |haν |ψi|2 gegeben. • Der Erwartungswert bei wiederholter Ausführung der Messung an identisch präparierten Teilchen, bzw. Systemen, (d.h. alle befinden sich im Zustand |ψi) ist durch hAi|ψi = hψ| A |ψi bestimmt. Die Unschärfe durch ∆|ψi (A) = q hψ| A2 |ψi − hψ| A |ψi2 . • Bei wiederholter Messung der zu A und B gehörenden Observablen im Zustand |ψi gilt die Heisenbergsche Unschärferelation ∆|ψi (A) ∆|ψi (B) ≥ 1 |hψ| [A, B] |ψi|. 2 • Der zur Energie gehörende Operator ist der Hamiltonoperator H, der sich aus der Hamiltonfunktion des äquivalenten klassischen Problems ergibt. • Die Dynamik eines Quantensystems ergibt sich aus der Schrödingergleichung i~ dtd |ψ(t)i = H |ψ(t)i unter Berücksichtigung der vorgegebenen Anfangsbedingung |ψ(0)i 21 In dem Eigenzustand zu dem gemessenen Eigenwert λν . Kapitel 4 Wellenpakete und Schrödingergleichung Um die im Kapitel 1.1 diskutierten experimentell beobachteten Interferenzeffekte bei Experimenten mit Objekten, die man gemeinhin als Teilchen auffasst, also Elektronen, Neutronen, Atomen und Molekülen besser zu verstehen, wollen wir uns zunächst nocheinmal mit der Beschreibung von Licht bzw. Photonen beschäftigen. Wie bereits angesprochen hat ein Photon die Energie E = ~ω (Photoeffekt), wenn die Kreisfrequenz (die man oft auch einfach als Frequenz bezeichnet) ω des (monochromatischen) Lichts vorgegeben ist. Der Betrag des Impulses des Photons ist durch p = ~k = h/λ mit der Wellenlänge λ > 0 bzw. der Wellenzahl k > 0 verknüpft. Der Impuls eines Photons zeigt sich z.B. im Comptoneffekt (siehe z.B. Haken und Wolf, Atom- und Quantenphysik, Springer-Verlag). Um die Impulsbilanz bei der Streuung von Licht (Photonen) an Elektronen zu verstehen, muss man dem Photon einen entsprechenden Impuls zu schreiben. Da die Bewegungsrichtung des Photons der Ausbreitungsrichtung der Lichtwelle entspricht, können wir zusätzlich die Vektorrelation p~ = ~~k, mit dem Wellenvektor ~k (es gilt k = |~k|) angeben. Für eine (monochromatische) Lichtwelle im Vakuum1 gilt die Ihnen bekannte Beziehung λν = c, mit der Lichtgeschwindigkeit c und der Frequenz ν. Aus ihr ergibt sich ω = ck. Damit können wir die Energie ~ω = Ep~ als Funktion des Impulses auffassen: Ep~ = ~ck = cp. Wir können so eine sich in ~k/k-Richtung ausbreitende monochromatische, ebene Welle2 ~ r, t) = Ee ~ i(~k·~r−ωt) E(~ auch als ~ r, t) = Ee ~ i(~p·~r−Ep~ t)/~ E(~ 1 2 (4.1) Wir gehen also davon aus, dass sich das Licht in einem materiefreien Volumen ausbreitet. Wir schreiben sie wie in der Gl. (1.4) gleich komplex. 47 48 KAPITEL 4. WELLENPAKETE UND SCHRÖDINGERGLEICHUNG schreiben.3 In der Elektrodynamik stellen ebene Wellen eine Idealisierung dar. Eine ebene Welle fällt weder in die drei Raumrichtungen (bei fester Zeit t) noch in der Zeit (bei festem Ort ~r) ab. Sie führt zu einer unendlichen Feldenergie,4 was unphysikalisch ist. Das eine “mathematische” ebene Welle keine vollständige Beschreibung von sich ausbreitendem Licht darstellt, jedoch im Hinblick auf die Erklärung von experimentellen Beobachtungen eine sehr gute Idealisierung darstellen kann, sehen Sie z.B. im Doppelspaltexperiment mit Laserlicht. Es ist offensichtlich, dass der Laserstrahl bei Ausbreitung in die y-Richtung, in die xund z-Richtung räumlich lokalisiert ist. Da der Laser zu einer Zeit t0 angeschaltet und bei t1 > t0 ausgeschaltet wird, ist der Strahl zu einer festen Zeit t auch in die y-Richtung räumlich lokalisiert. Betrachten wir aber eine Zeit t die t0 t t1 erfüllt und nehmen an, dass die Abmessungen der Löcher und des Lochabstandes im Doppelspaltschirm so klein sind, dass man die sich aus der Beschränkung in der x-z-Ebene ergebende räumliche Variation des elektrischen Feldes über diesen Bereich vernachlässigen kann, so gelingt es, das Interferenzmuster mit Hilfe der Idealisierung einer ebenen Welle zu beschreiben. 4 f(k) 3 2 1 0 -1 0 1 2 k 3 4 5 Abbildung 4.1: Die Funktion f (k) aus Gl. (4.3). Zur Vereinfachung vernachlässigen wir physikalische Einheiten. Die Parameter der durchgezogenen Kurve sind k0 = 3, σ = 1, die der gestrichelten k0 = 1, σ = 0.1. 3 Im Gegensatz zum Polarisationsexperiment, geht es uns jetzt nicht um den die Polarisation ~ sondern um die Orts- und Zeitabhängigfestlegenden komplexen zweidimensionalen Vektor E, keit der Welle. 4 ~ 2 gegeben. Die Feldenergie ist als das räumliche Integral (über den ganzen R3 ) von E~2 + B 4.1. WELLENPAKETE IN DER ELEKTRODYNAMIK 4.1 49 Wellenpakete in der Elektrodynamik Experimentell präparieren lassen sich nur so genannte Wellenpakete. Betrachten wir hier exemplarisch nur die räumliche Lokalisierung in die Ausbreitungsrichtung (hier die +y-Richtung). Wie man die Welle in die beiden orthogonalen Richtungen räumlich beschränkt, sollte nach dieser Diskussion klar sein. Um ein zu fester Zeit in der y-Richtung beschränktes Wellenpaket zu erhalten, bilden wir eine kontinuierliche Überlagerung ebener Wellen gleicher Richtung, aber unterschiedlichen Impulses5 Z ∞ ~ − ct) , ~ ~ f (k)eik(y−ct) dk = E(y (4.2) E(y, t) = E −∞ wobei die (i.A. komplexwertige) Funktion f (k) sinnvollerweise in der Nähe einer “mittleren Wellenzahl” k0 > 0 groß ist und von dieser aus “relativ schnell” abfällt.6 Es ist offensichtlich, dass das elektrische Feld nur eine Funktion von ~ − ct) zur Zeit t = 0, so folgt das Feld zu anderen y − ct ist. Kennen wir also E(y Zeiten durch Verschiebung. Das Wellenpaket ist somit forminvariant und bewegt sich mit Lichtgeschwindigkeit c nach rechts. Ein häufig diskutiertes Beispiel ist das Gaußsche Wellenpaket mit 1 2 2 e−(k−k0 ) /(2σ ) , f (k) = √ 2πσ (4.3) wobei σ > 0 die Breite der Gaußkurve um die Wellenzahl k0 beschreibt.7 In Abbildung 4.1 ist f (k) für zwei verschiedene Parametersätze dargestellt. Mit dieser Form von f (k) lässt sich das Integral in Gl. (4.2) leicht ausführen. Es ist allgemein proportional zur Fourierrücktransformierten der Funktion f (k) an der Stelle y − ct. Die Fouriertranformierte g̃(k) einer Funktion g(x) definieren wir als8 Z ∞ 1 g(x)e−ikx dx (4.4) g̃(k) := √ 2π −∞ und die Rücktransformierte entsprechend als Z ∞ 1 g(x) = √ g̃(k)eikx dk . 2π −∞ 5 (4.5) Wir vernachlässigen hier, dass ω = Ep~ /~ = ck immer positiv ist. Solange f (k) nur signifikante Beiträge für k >R 0 aufweißt, ist diese Vernachlässigung zulässig. Allgemeiner müssten R ~ ~ ∞ f (k)eik(y−ct) dk + E ~ 0 f (k)eik(y+ct) dk schreiben. In diesem Fall wir jedoch E(y, t) = E 0 −∞ handelt es sich bei dem auszuführenden Integral nicht mehr um eine Fourierrücktransformation (siehe unten). In den hier betrachteten Beispielen ist die obige Bedingung an f (k) erfüllt. 6 Da k die Einheit “1/Länge” hat, hat f (k) die Einheit “Länge”. 7 Damit das Argument der Exponentialfunktion dimensionslos ist, hat σ die Einheit “1/Länge”. Daraus ergibt sich ebenfalls, dass f (k) die geforderte Einheit “Länge” hat. 8 Wir gehen dabei davon aus, dass g(x) hinreichend “harmlos” ist, so dass das Integral existiert. 50 KAPITEL 4. WELLENPAKETE UND SCHRÖDINGERGLEICHUNG Wichtige Eigenschaften der Fouriertransformation werden Sie in den Übungen kennenlernen. Die konkrete Berechnung des Integrals Gl. (4.2) mit f (k) aus Gl. (4.3) verschieben wir ebenfalls auf die Übungen. Das Ergebnis lautet ~ t) = Ee ~ −σ2 (y−ct)2 /2 eik0 (y−ct) = E(y ~ − ct) . E(y, (4.6) Beschränken wir uns auf den Fall einer linear in x-Richtung polarisierten Welle, so ergibt sich für das physikalische elektrische Feld durch bilden des Realteils ~ t) = E1 e−σ2 (y−ct)2 /2 cos (k0 y − ω0 t + α1 )~e1 , E(y, (4.7) mit ω0 = ck0 . Die Form des elektrischen Feldes ist für die beiden Parametersätze der Abbildung 4.1 in den Abbildungen 4.2 und 4.3 für verschiedene Zeiten dargestellt. Wir beobachten, dass ein kleines σ zu einem ausgedehnten Wellenpaket führt und umgekehrt ein großes σ zu einem lokalisierten Wellenpaket.9 Diese Beobachtung gibt eine allgemeine Beziehung zwischen Paaren von Fouriertransformierten wieder. Grob gesprochen gilt: Je ausgedehnter g(x), desto lokalisierter ist g̃(k) und umgekehrt. Gl. (4.7) entnehmen wir zusätzlich, dass eine größere “mittlere Wellenzahl” k0 (kleinere “mittlere Wellenlänge” λ0 = 2π/k0 ), zu einer schnelleren räumliche Oszillation des Feldes führt. R ∞ Wir haben das f (k) in Gl. (4.3) so gewählt, dass −∞ f (k)dk = 1 gilt. Damit können wir f (k) in diesem Beispiel als eine Wahrscheinlichkeitsdichte der zum Wellenpaket beitragenden Impulse (bis auf den Faktor ~) interpretieren. Um diese Interpretation auch für andere Wellepakete zur Verfügung zu haben, werden R∞ wir −∞ f (k)dk = 1 zur Forderung an die zulässigen Gewichtsfunktionen f (k) erheben. So gesehen ergibt sich für den Erwartungswert im Beispiel des Gaußschen Wellenpakets Z ∞ kf (k)dk = k0 hki := −∞ und für die Unschärfe Z ∞ 2 (k − hki) f (k)dk ∆k := 1/2 =σ. −∞ Analog sind der Erwartungswert und die Unschärfe für andere f (k) definiert. Um ein in alle Raumrichtungen lokalisiertes Wellenpaket zu erhalten, welches eine endliche Feldenergie hat, müssen wir auch die anderen beiden Komponenten von ~k “verschmieren” Z ~ ~k)ei(~k·~r−ckt) d3 k , ~ E(~r, t) = Ẽ( R3 ~ ~k) = 0 gilt und über den ganzen R3 integriert wird. wobei ~k · Ẽ( Nach dieser Einführung des Begriffs des Wellenpakets anhand der Ihnen bekannten Lichtwelle, wollen wir ihn jetzt auf “Materiewellen” anwenden. 9 Im Limes σ → 0 ergibt sich aus Gln. (4.2) und (4.3) eine ebene Welle mit Wellenzahl k0 , da f (k) zur Diracschen δ-Funktion (Distribution) δ(k − k0 ) wird (siehe Übungen). x-Komponente des elektr. Feldes 4.1. WELLENPAKETE IN DER ELEKTRODYNAMIK 51 1 0.5 0 -0.5 1 0.5 0 -0.5 -5 0 y 5 -5 0 y 5 x-Komponente des elektr. Feldes Abbildung 4.2: Das sich für k0 = 3, σ = 1, α1 = 0 ergebende elektrische Feld als Funktion des Ortes y für verschiedene t. Links unten ist ct = 0 und im Gegenuhrzeigersinn folgen ct = 2, ct = 4 und ct = 6. 1 0.5 0 -0.5 1 0.5 0 -0.5 -50 0 y 50 -50 0 y 50 Abbildung 4.3: Das sich für k0 = 1, σ = 0.1, α1 = 0 ergebende elektrische Feld als Funktion des Ortes y für verschiedene ct. Links unten ist ct = 0 und im Gegenuhrzeigersinn folgen ct = 10, ct = 20 und ct = 30. 52 KAPITEL 4. WELLENPAKETE UND SCHRÖDINGERGLEICHUNG 4.2 Wellenpakete in der Quantenmechanik De Broglies Vorschlag folgend ordnen wir einem “Punktteilchen” mit Impulsbetrag p = |~p| eine Wellenzahl k = p/~ zu. Da auch hier die Ausbreitungsrichtung der Welle und des Teilchens gleich sein sollen, können wir dem Teilchen auch einen Wellenvektor ~k = p~/~ zuordnen. Wir benutzen nun den Ausdruck Gl. (4.1) für eine ebene, monochromatische Lichtwelle und verallgemeinern ihn auf ein kräftefreies Teilchen (ohne innere Freiheitsgrade) endlicher Ruhemasse mit nichtrelativistischer Energie Ep~ = p~ 2 /(2m). Dabei gilt es zu beachten, dass es sich bei einer ebenen “Materiewelle” nicht um ein Vektorfeld sondern ein skalares Feld handelt ψp~ (~r, t) := c ei(~p·~r−Ep~ t)/~ p~ 2 t /~ . = c exp i p~ · ~r − 2m (4.8) Die Zahl c bezeichnet eine Konstante, die wir (zunächst willkürlich erscheinend √ - was es aber, wie sich später herausstellen wird, nicht ist) gleich (1/ 2π~)3 wählen.10 Max Born (1926) folgend interpretiert man allgemein w(~r, t) := |ψ(~r, t)|2 [=: ρ(~r, t)] als die Wahrscheinlichkeitsdichte des Teilchens und bezeichnet ψ(~r, t) als die Wellenfunktion oder Wahrscheinlichkeitsamplitude. Für ein vorgegebenes ψ(~r, t) beschreibt somit |ψ(~r, t)|2 d3 r die Wahrscheinlichkeit das Teilchen zur Zeit t im Volumenelement d3 r um den Punkt ~r herum anzutreffen. Damit muss aber Z |ψ(~r, t)|2 d3 r = 1 (4.9) R3 gelten, denn die Wahrscheinlichkeit das Teilchen “irgendwo” anzutreffen muss gleich 1 sein. Dieser Interpretation folgend ist Z h~r it := ~r |ψ(~r, t)|2 d3 r (4.10) R3 der Mittelwert (Erwartungswert) des Ortes des beschriebenen Teilchens und Z (∆~r )t := R3 2 2 3 (~r − h~r it ) |ψ(~r, t)| d r 1/2 (4.11) die Unschärfe des Ortes. Da die Bedingung Gl. (4.9) mit der ebenen Materiewelle Gl. (4.8) nicht erfüllbar ist, bekommen wir mit dieser ein zu der ebenen Lichtwelle analoges Problem. 10 √ In d Dimensionen wählen wir c = (1/ 2π~)d . 4.2. WELLENPAKETE IN DER QUANTENMECHANIK 53 Wir müssen also wie bei letzterer zu Wellenpaketen übergehen. Wir betrachten vereinfachend zunächst den Fall der eindimensionalen Bewegung (in x-Richtung) und bilden11 Z ∞ ψ̃(p)ψp (x, t)dp ψ(x, t) = −∞ Z ∞ 1 p2 = √ ψ̃(p) exp i px − t /~ dp , (4.12) 2m 2π~ −∞ mit der komplexwertigen Funktion ψ̃(p).12 Zur Zeit t = 0 haben wir Z ∞ 1 ψ(x, 0) = √ ψ̃(p)eipx/~ dp 2π~ −∞ und bis auf Faktoren ~ ist ψ(x, 0) die Fouriertransformierte der Gewichtsfunktion ψ̃(p).13 Wir wollen als nächstes untersuchen, welche Eigenschaften ψ̃(p) haben muss, damit Gl. (4.9) erfüllt ist Z ∞ Z ∞ Z ∞ 1 p2 2 ∗ |ψ(x, t)| dx = ψ̃ (p) exp −i px − t /~ dp 2π~ −∞ 2m −∞ −∞ Z ∞ p02 0 0 × ψ̃(p ) exp i p x − t /~ dp0 dx 2m −∞ 2 Z ∞Z ∞ 1 p p02 ∗ 0 = ψ̃ (p)ψ̃(p ) exp i t− t /~ 2π~ −∞ −∞ 2m 2m Z ∞ 0 × e−ix(p−p )/~ dx dp dp0 } | −∞ {z Z = 2πδ([p−p0 ]/~)=2π~δ(p−p0 ) ∞ 2 |ψ̃(p)| dp −∞ = 1. (4.13) Wir haben somit gezeigt, dass das Integral über alle Orte x der Wahrscheinlichkeitsdichte des Ortes |ψ(x, t)|2 gleich dem Integral über alle Impulse p von |ψ̃(p)|2 ist (und beide gleich 1 sind).14 Dabei haben wir benutzt, dass man die Diracsche 11 Die Energie Ep ist aufgrund der quadratischen Impulsabhängigkeit immer positiv, so dass wir hier keine Probleme mit negativen p haben (siehe die Diskussion für die Lichtwellenpakete). 12 Es ist plausibel anzunehmen, dass sich der Beitrag den verschiedene Impulse zum Wellenpaket liefern zeitlich nicht ändert, also ψ̃(p) nicht von der Zeit abhängt. Würde ψ̃(p) von der Zeit abhängen, würde sich im Allgemeinen die Energie im Wellenpaket im Laufe der Zeit ändern, was unphysikalisch wäre. 13 Wir werden nicht immer mathematisch genau bestimmen, welche Eigenschaften eine Gewichtsfunktion ψ̃(p) haben muss. Wir gehen stillschweigend davon aus, dass die Funktion so “vernünftig” ist, dass alle “Operationen” die wir mit ihr ausführen wollen auch zulässig sind. 14 ψ(x, 0) und ψ̃(p) ein Paar von Fouriertransformierten. Die obige Beziehung R Für2t = 0 bilden R |g(x)| dx = |g̃(k)|2 dk gilt allgemein für Paare von Fouriertransformierten. Man nennt sie das Parseval Theorem. 54 KAPITEL 4. WELLENPAKETE UND SCHRÖDINGERGLEICHUNG δ-Funktion (Distribution) als Fourierintegral schreiben kann. Diese Relation und wichtige Eigenschaften der δ-Funktion werden Sie in den Übungen kennenlernen. Hier wollen wir daher nur die grundlegende Eigenschaft der δ-Funktion Z ∞ f (x)δ(x − x0 )dx = f (x0 ) , −∞ mit einer hinreichend “harmlosen”, komplexwertigen Funktion f (x), erwähnen. Da Z ∞ |ψ̃(p)|2 dp = 1 −∞ können wir |ψ̃(p)|2 als Wahrscheinlichkeitsverteilung der im Wellenpaket auftretenden Impulse interpretieren. Betrachten wir nun wieder das Beispiel des Gaußschen Wellenpakets mit ψ̃(p) = 1 √ 2πσ̃ 1/2 2 /(4σ̃ 2 ) e−(p−p0 ) e−i(p−p0 )x0 /~ . Die Form von ψ̃(p) ist so gewählt, dass |ψ̃(p)|2 eine Gaußverteilung mit Mittelwert p0 und Unschärfe σ̃ darstellt. Die Rolle des bei der Betragsbildung wegfallenden Faktors e−i(p−p0 )x0 /~ wird erst weiter unten klar werden. Mit Hilfe von Gl. (4.12) ergibt sich dann mit15 v0 := p0 /m 1/2 1 p20 1 √ exp i p0 x − t /~ ψ(x, t) = √ 2m 2πσ̃ 2π~ Z ∞ 1 it 2 + exp [ip̃ (x − v0 t − x0 ) /~] dp̃ exp −p̃ × 4σ̃ 2 2m~ −∞ 1/2 √ π 1 1 p20 √ √ = q exp i p0 x − t /~ 2m it 1 2πσ̃ 2π~ + 4σ̃ 2 2m~ 2 σ̃ 2itσ̃ 2 2 × exp − 2 (x − v0 t − x0 ) / 1 + . ~ m~ Das explizite Ausführen der Integrale verschieben wir erneut auf die Übungen. Betrachten wir jetzt |ψ(x, t)|2 , so vereinfacht sich das Resultat |ψ(x, t)|2 = √ 15 1 2 2 e−(x−v0 t−x0 ) /[2σ (t)] 2πσ(t) Diese Größe würde man intuitiv als mittlere Geschwindigkeit bezeichnen. Weiter unten wird sich herausstellen, dass diese Sichtweise richtig ist. 4.2. WELLENPAKETE IN DER QUANTENMECHANIK 55 mit s 2 2tσ̃ 2 1+ ~m s 2 ~t = σ(0) 1 + . 2mσ 2 (0) ~ σ(t) := 2σ̃ Aus der gaußförmigen Wahrscheinlichkeitsdichte des Impulses |ψ̃(p)|2 ergibt sich somit auch eine gaußförmige Wahrscheinlichkeitsdichte des Ortes |ψ(x, t)|2 . Der Mittelwert zur Zeit t liegt bei v0 t + x0 . Diese Beobachtung rechtfertigt die Sichtweise v0 als die mittlere Geschwindigkeit zu bezeichnen. Sie klärt zusätzlich die Funktion des Faktors e−i(p−p0 )x0 /~ in ψ̃(p). Der Erwartungswert des Ortes wächst (für positives p0 ), wie man es für ein kräftefreies Teilchen (klassisch) erwartet, linear mit der Zeit an. Der Erwartungswert des Ortes für das Gaußsche Wellenpaket erfüllt die Differentialgleichung d hxit p0 = . dt m Da zusätzlich16 p0 = hpi gilt, ergibt sich die Relation d hxit hpi = . dt m Wie Sie in einer Übungsaufgabe zeigen werden, gilt diese Beziehung für allgemeine Wellenpakete.17 Ort und Impuls erfüllen also die klassische Differentialgleichungsrelation, wenn man sie durch ihre jeweiligen quantenmechanischen Erwartungswerte ersetzt. Die Unschärfe des Ortes σ(t) hängt im Gegensatz zu der Unschärfe von |ψ̃(p)|2 von der Zeit ab. Zur Zeit t = 0 wird die minimale Unschärfe σ(0) = ~/(2σ̃) angenommen. Diese ist, wie im Fall des Gaußpakets aus ebenen Lichtwellen, umgekehrt proportional zur Breite der Impulsverteilung σ̃. Für betragsmäßig ansteigende Zeiten nimmt die Unschärfe im Ort zu. Der Wahrscheinlichkeitsinterpretation folgend ist das Teilchen für betragsmäßig wachsende Zeiten also auf einen immer größeren Raumbereich um v0 t + x0 herum “verschmiert”. Diese Beobachtung widerspricht jeder klassischen Intuition zum Verhalten von Teilchen. Sie ist jedoch verständlich, wenn man bedenkt, dass das Wellenpaket aus verschiedenen Impulskomponenten p, mit verschiedenen klassischen Geschwindigkeiten p/m zusammengesetzt ist. Im Fall der Lichtwelle führen alle Impulskomponenten 2 Zur Erinnerung: ψ̃(p) kann als die Wahrscheinlichkeitsdichte des Impulses interpretiert werden. 17 Wir gehen dabei davon aus, dass ψ̃(p) so “harmlos” ist, dass hpi existiert. 16 56 KAPITEL 4. WELLENPAKETE UND SCHRÖDINGERGLEICHUNG 4 σ(t)/σ(0) 3 2 1 0 -3 -2 -1 0 t/t0 1 2 3 Abbildung 4.4: Unschärfe des Ortes (∆x)t = σ(t) des Gaußschen Wellenpakets als Funktion der Zeit t. zu einer Geschwindigkeit c, so dass das Wellenpaket nicht auseinander läuft (genauer forminvariant bleibt). Die funktionale Abhängigkeit von (∆x)t = σ(t) ist in Abbildung 4.4 dargestellt. t0 := 2mσ 2 (0)/~ = m~/(2σ̃ 2 ) bezeichnet eine charakteristische Zeit ab der das Wellenpaket zu “zerfließen” beginnt. Für |t| t0 wächst σ(t) linear mit dem Betrag der Zeit an. Je kleiner also die Masse des durch das Wellenpaket beschriebenen Teilchens und je kleiner die Unschärfe zur Zeit t = 0 (je größer die Unschärfe σ̃ im Impuls), desto schneller “zerfließt” das Teilchen. Das lineare Verhalten der Unschärfe (∆x)t ∼ tσ̃/m für t t0 kann man anschaulich wie folgt verstehen: Teilchen der Masse m mit Impulsen p0 ± σ̃/2, sind nach einer Zeit t um tσ̃/m verschieden weit gelaufen. Wir betrachten nun, analog zur Heisenbergschen Unschärferelation Gl. (3.21), das Produkt der Orts- und Impulsunschärfen für das Gaußsche Wellenpaket. Zur Zeit t = 0 gilt (∆x)t=0 (∆p) = ~ ~ σ̃ = . 2σ̃ 2 Für beliebige Zeiten gilt entsprechend (∆x)t (∆p) ≥ ~ . 2 (4.14) Wie wir sehr bald sehen werden, ergibt sich diese Ungleichung aus der Heisenbergschen Unschärferelation Gl. (3.21), auch wenn der Zusammenhang noch sehr unklar erscheint. Fragen wie - Was sind in diesem Beispiel die Operatoren A und B? Auf was für einem Vektorraum operieren diese Operatoren? - sind noch völlig 4.2. WELLENPAKETE IN DER QUANTENMECHANIK 57 offen. Da die Ungleichung auf der allgemeinen Heisenbergschen Unschärferelation beruht, gilt sie für alle Wellenpakete und nicht nur für Gaußsche (siehe später). Anschaulich bedeutet sie, dass man zu einer genauen räumlichen Lokalisierung eines Teilchens zu einer Zeit t0 eine breite Impulsverteilung benötigt. Diese bedingt dann aber, wie oben exemplarisch gesehen, dass das Teilchen ausgehend von t0 zeitlich sehr schnell zerfließt. Für ein gegebenes Wellenpaket können der Ort und der Impuls nicht beliebig genau “lokalisiert” werden. Die in der Vorlesung gezeigten Simulationen zeigen das Absolutbetragsquadrat und die Phase von ψ(x, t) für eindimensionale Gaußsche Wellenpakete mit verschiedenen Parametersätzen. |ψ(x, t)|2 ist dabei als der Funktionswert gegeben und die Phase in der Färbung unter den Kurven kodiert. Abbildung 4.5 zeigt die Funktion exp (ix), x ∈ R, gemäß dieser Kodierung. Aus ihr wird klar, welche Farbe zu welcher Phase x gehört. Abbildung 4.6 zeigt ein Gaußsches Wellenpaket zu vier verschiedenen Zeiten. Zwei weitere Simulationen zeigen ψ(~r, t) in der gleichen Kodierung aber für zweidimensionale Gaußsche Wellenpakete. Wie man ein zweidimensionales Gaußsches Wellenpaket erhält sollte aus der Diskussion des eindimensionalen Falls klar sein. Abbildung 4.5: Die Funktion exp (ix), x ∈ R, in der in den Simulationen und der Abbildung 4.6 verwendeten Kodierung von Absolutbetragsquadrat (als Funktionswert, hier immer gleich 1) und Phase (als Färbung unter der Kurve). Wir kehren nun nocheinmal zum allgemeinen Wellenpaket Gl. (4.12) Z ∞ 1 p2 ψ(x, t) = √ ψ̃(p) exp i px − t /~ dp 2m 2π~ −∞ zurück. Differenzieren wir diese Gleichung nach der Zeit (und multiplizieren mit i~), so ergibt sich Z ∞ 1 p2 p2 ∂ i~ ψ(x, t) = √ ψ̃(p) exp i px − t /~ dp . ∂t 2m 2m 2π~ −∞ Zweifache Differentation nach dem Ort und Multiplikation mit −~2 /(2m) liefert die selbe rechte Seite Z ∞ ~2 ∂ 2 1 p2 p2 − ψ(x, t) = √ ψ̃(p) exp i px − t /~ dp . 2m ∂x2 2m 2m 2π~ −∞ 58 KAPITEL 4. WELLENPAKETE UND SCHRÖDINGERGLEICHUNG Abbildung 4.6: Ein eindimensionales Gaußsches Wellenpaket zu vier verschiedenen Zeiten. Physikalische Einheiten sind vernachlässigt. Die Mittlere Geschwindigkeit beträgt 2. Die Kodierung von Absolutbetragsquadrat und Phase erfolgen wie im Text und in Abbildung 4.5 beschrieben. Ein allgemeines Wellenpaket zur Beschreibung der Dynamik eines freien Teilchens ψ(x, t) ist daher Lösung der partielle Differentialgleichung i~ ~2 ∂ 2 ∂ ψ(x, t) = − ψ(x, t) . ∂t 2m ∂x2 (4.15) Die linke Seite dieser Gleichung erinnert uns an die Schrödingergleichung (3.4). Vergleichen wir Gln. (3.4) und (4.15) so müssen wir den abstrakten Vektor (Zu~2 ∂ 2 stand) |ψ(t)i mit ψ(x, t) identifizieren und den Hamiltonoperator mit − 2m . ∂x2 Das diese Identifikation tatsächlich richtig ist, untersuchen wir im nächsten Kapitel. Zuvor wollen wir noch heuristisch eine zu Gl. (4.15) analoge partielle Differentialgleichung für die eindimensionale Bewegung eines quantenmechanischen Teilchens in einem (zeitabhängigen) Potenzial V (x, t) “herleiten”. Wie die obige ∂ Ableitung von Gl. (4.15) zeigt, liefert das Anwenden von i~ ∂t auf die Wellenfunktion einen Ausdruck, “der etwas mit der kinetischen Energie des Teilchens ~2 ∂ 2 p2 /(2m) zu tun hat.” Diesen kann man andererseits durch Anwenden von − 2m ∂x2 auf ψ(x, t) erhalten. Müssen wir nun neben der kinetischen Energie auch die potenzielle Energie berücksichtigen, so lautet die entsprechende partielle Differentialgleichung ∂ ~2 ∂ 2 i~ ψ(x, t) = − ψ(x, t) + V (x, t)ψ(x, t) . ∂t 2m ∂x2 (4.16) 4.2. WELLENPAKETE IN DER QUANTENMECHANIK 59 Wie bereits angedeutet, handelt es sich bei dieser Gleichung um eine konkrete Form der allgemeinen Schrödingergleichung (3.4). Auch hier ist das Gefühl, dass die Gleichung “vom Himmel fällt” nicht vollständig zu vermeiden. Wir werden die Schrödingergleichung zur Beschreibung der Dynamik von Quantensystemen daher später als eines der Postulate der Quantenmechanik formulieren. Der überwältigende Erfolg der Schrödingergleichung bei der Erklärung von Experimenten rechtfertigt dieses Vorgehen. Die dreidimensionale Verallgemeinerung der partielle Differentialgleichung lautet ~2 ~2 ∂ ∆ψ(~r, t) + V (~r, t)ψ(~r, t) = − ∆ + V (~r, t) ψ(~r, t) ,(4.17) i~ ψ(~r, t) = − ∂t 2m 2m ~ ·∇ ~ = mit ∆ = ∇ ∂2 ∂x2 + ∂2 ∂y 2 + ∂2 . ∂z 2 60 KAPITEL 4. WELLENPAKETE UND SCHRÖDINGERGLEICHUNG Kapitel 5 Der Hilbertraum Die “Ähnlichkeit” der Gl. (4.14) mit der allgemeinen Heisenbergschen Unschärferelation Gl. (3.21) und der Schrödingergleichung (3.4) mit Gl. (4.17) führt uns dazu nach einer gemeinsamen Sprache für die Resultate der Kapitel 3 und 4 zu suchen. Wie bereits angedeutet, müssen wir dazu einen Weg finden, die komplexwertige Wellenfunktion ψ(~x, t), als Element eines Vektorraums auffassen zu können.1 Die sichR aus der Wahrscheinlichkeitsinterpretation ergebende Normierungsbedingung R3 |ψ(~x, t)|2 d3 x = 1, führt uns darauf, dass die Norm in dem Vektorraum etwas mit dem Integral über den ganzen Raum (bzw. einen Raumbereich U ⊂ R3 ) zu tun haben sollte. Betrachten wir Reine komplexwertige, auf U ⊂ Rd definierte2 Funktion ϕ. Existiert das Integral U |ϕ(~x, t)|2 dd x über U, so bezeichnet man ϕ als quadratintegrabel (über U).3 Wir haben leider keine Zeit auf mathematische Feinheiten einzugehen, wollen aber kurz erwähnen, dass es sich bei dem Integral um das so genannte Lebesgueintegral handelt (siehe z.B. S. Großmann, Funktionalanalysis, Aula-Verlag), dass sich in einigen Details, was z.B. die Existenzvorraussetzungen angeht, vom “gewöhnlichen” Riemanintegral unterscheidet. In der konkreten Berechnung von Integralen, ergeben sich jedoch keine (relevanten) Unterschiede. Man kann sich nun leicht davon überzeugen, dass die Summe aψ + bϕ, a, b ∈ C, zweier quadratintegrabler Funktionen ψ und ϕ wieder quadratintegrabel ist. Auch die Definitionen eines neutralen Elements und eines Inversen machen keine Probleme. Damit bilden die Funktionen einen Vektorrraum.4 Wir bezeichnen daher 1 Wie in vielen Quantenmechanikbüchern üblich, bezeichnen wir den Ortsvektor ab jetzt mir ~x statt ~r und die Komponenten mit xj , j = 1, 2, . . . , d. 2 In Kapitel 4 haben wir nur Teilchen betrachtet, die sich im ganzen Rd aufhalten konnten. Später werden wir jedoch auch Beispiele betrachten, in denen das Teilchen aufgrund eines äußeren Potenzials auf einen endlichen Raumbereich eingeschränkt ist. 3 Wir gehen im Folgenden davon aus, dass sich der Begriff quadratintegrabel immer auf einen vorgegebenen Raumbereich U ⊂ Rd bezieht. 4 Genauer gesagt besteht der Vektorraum aus Klassen äquivalenter Funktionen. Zwei quadratintegrable Funktionen ψ und ϕ heißen äquivalent falls sich die Funktionswerte ψ(~x) und ϕ(~x) nur auf einer Menge von Punkten ~x vom Maß Null unterscheiden (siehe z.B. S. Großmann, 61 62 KAPITEL 5. DER HILBERTRAUM die quadratintegrablen Funktionen ψ wieder mit ket-Vektoren |ψi. Als Skalarprodukt definieren wir das Integral Z ϕ∗ (~x)ψ(~x)dd x . (5.1) hϕ |ψi := U Man überzeugt sich leicht davon, dass das Integral für quadartintegrable Funktionen existiert und das so definierte Skalarprodukt alle Eigenschaften eines Skalarprodukts (siehe Kapitel 2) erfüllt.5 Mit dieser Definition wird Z 1/2 p 2 d || |ψi || := hψ |ψi = |ψ(~x)| d x (5.2) U zur Norm auf dem Vektorraum. Daher ist eine quantenmechanische Wellenfunktion ψ(~x, t) ein auf Eins normiertes Elemente des Vektorraums. Die Zeit bildet dabei einen Parameter, d.h. für jede Zeit t wird ein Element des Vektorraums |ψ(t)i festgelegt. Es ist nicht möglich eine endliche Zahl von quadratintegrablen Funktionen |ϕ1 i , |ϕ2 i , . . . , |ϕN i vorzugeben und jede quadratintegrable Funktion |ψi als Linearkombination dieser Funktionen zu schreiben. Eine analoge Situation sollten Sie von der Fourierreihe einer auf dem Intervall [a, b] definierten und periodisch fortgesetzten Funktion kennen. Beschränken wir uns hier auf den Fall a = 0 und b = 2π. Funktionen dieses Typs kann man als Linearkombination der Funktionen cos (nx) und sin (nx), mit n ∈ N0 , schreiben. Man benötigt also abzählbar unendlich viele “Basiselemente”. Eine analoge Aussage gilt auch für die quadratintegrablen Funktionen. Wir müssen daher den Begriff des unitären Raums auf unendlichdimensionale Vektorräume erweitern. In einem unendlichdimensionalen Vektorraum gibt es mehr Möglichkeiten was das Konvergenzverhalten von Folgen von Vektoren {|ϕn i} angeht als in endlichdimensionalen Vektorräumen. In letzteren ergibt sich das Konvergenzverhalten unmittelbar aus dem der komplexen Zahlen (über die Koeffizienten der Vektoren). Wir definieren daher den Begriff der Vollständigkeit: Ein unitärer Raum H heißt vollständig, wenn jede Cauchyfolge {|ϕn i} aus H gegen ein Element |ϕi ∈ H konvergiert. Zur Erinnerung: Unter einer Cauchyfolge versteht man eine Folge von Vektoren |ϕn i ∈ H, für die es für jedes ε > 0 ein N (ε) ∈ N gibt, so dass p || |ϕn i − |ϕm i || = (hϕn | − hϕm |) (|ϕn i − |ϕm i) < ε , für alle m, n ≥ N (ε).6 Einen vollständigen, unitären Raum H bezeichnet man als Hilbertraum.7 Wir spezifizieren weiter und bezeichnen einen Hilbertraum H in Funktionalanalysis, Aula-Verlag). 5 Hierbei muss man beachten, dass die Funktionen Repräsentanten einer Äquivalenzklasse von Funktionen sind (siehe oben)! 6 Jeder endlichdimensionale unitäre Raum ist vollständig. Der Beweis lässt sich sofort auf die Vollständigkeit der komplexen Zahlen zurückführen. 7 Jeder endlichdimensionale unitäre Raum ist ein Hilbertraum. 63 dem es eine abzählbare Folge von Vektoren {|ϕn i} gibt, so dass sich jedes |ψi ∈ H als Linearkombination |ψi = ∞ X cn |ϕn i n=1 schreiben lässt, als separablen Hilbertraum. Wir können die Folge {|ϕn i} so modifizieren, dass sich eine Orthonormalbasis hϕn |ϕm i = δn,m ergibt. Die Entwicklungskoeffizienten ergeben sich dann aus cn = hϕn |ψi. Wie man in der Literatur über Funktionalanalysis nachlesen kann, ist der Raum der über U quadratintegrablen Funktionen (genauer der Äquivalenzklassen quadratintegrabler Funktionen), der häufig mit L2 (U) bezeichnet wird, ein separabler Hilbertraum. Nicht jedes Element aus L2 (U) entspricht einer physikalischen Wellenfunktion. Quantensysteme beschreibende Wellenfunktionen sind auf Eins normiert, zumindest stetig und im Allgemeinen auch differenzierbar. Für große |~x| fallen sie weiterhin “schnell genug” ab.8 Völlig analog zum endlichdimensionalen Fall sind lineare Operatoren auf einem Hilbertraum definiert. Dabei muss man allerdings mit dem Definitionsbereich DA ⊂ H des Operators A aufpassen. Im L2 (R) kann z.B. die lineare Operation ϕ(x) → xϕ(x) auf Funktionen führen, die nicht mehr im L2 (R) liegen. Der kanonische Definitionsbereich des zugehörigen Operators ist somit D = {ϕ(x) ∈ L2 (R)|xϕ(x) ∈ L2 (R)}.9 Wir definieren den adjungierten Operator A† zu einem Operator A wie gehabt durch hψ| A† |ϕi = hϕ| A |ψi∗ . Ein Operator, der A = A† erfüllt heißt hermitesch. Gilt auch noch DA = DA† , so bezeichnet man A als selbstadjungiert. Im folgenden werden wir meist nicht auf Definitionsbereiche eingehen. Wir gehen dann stillschweigend davon aus, dass der Definitionsbereich eines hermiteschen Operators soweit erweitert wurde, dass er auch selbstadjungiert ist. In allen hier relevanten praktischen Anwendungen des Formalismus gelingt das. Daher werden wir im Folgenden immer von selbstadjungierten Operatoren sprechen. Wir haben hier leider keine Zeit auf die mathematischen Feinheiten im Zusammenhang mit linearen Operatoren auf Hilberträumen einzugehen - was insofern kein sehr großes Problem darstellt, als dass sie für die meisten Anwendungen des 8 Für physikalische Betrachtungen kann man sich meist auf den Schwarzschen Raum (der temperierten Funktionen) beschränken. Eine Funktion f aus diesem Raum ist unendlich oft stetig differenzierbar und fällt so stark ab, dass das Produkt jedes Polynoms mit f immer noch abfällt. Leider sind jedoch weder der Schwarzsche Funktionenraum noch der Raum der stetigen, quadratintegrablen Funktionen vollständig (im Sinne der durch das Skalarprodukt Gl. (5.1) gegebenen Norm Gl. (5.2)). 9 Gut als Definitionsbereich eignet sich auch der Schwarzsche Funktionenraum. 64 KAPITEL 5. DER HILBERTRAUM Formalismus keine Rolle spielen - und verweisen daher auf die Literatur über Funktionalanalysis (z.B. S. Großmann, Funktionalanalysis, Aula-Verlag)).10 In einem nächsten Schritt betrachten wir die stetigen linearen Funktionen (Funktionale) auf einem Hilbertraum H. Sie sind völlig analog zum endlichdimensionalen Fall definiert und bilden einen Vektorraum, den Dualraum H∗ . Nach dem Rieszschen Darstellungssatz kann man, wie im endlichdimensionalen Fall, die Wirkung jedes stetigen, linearen Funktionals ϕ, mit Hilfe des Skalarprodukts und eines |ϕi ∈ H schreiben: ϕ(|ψi) = hϕ |ψi. Wie im endlichdimensionalen Fall führen wir bra-Vektoren hϕ| ein. Sei nun {|ϕn i} eine orthonormale Basis in H. Wir erhalten dann wieder die Vollständigkeitsrelation (Zerlegung der Eins) 1= ∞ X |ϕn i hϕn | . n=1 Bevor wir weitere Betrachtungen zu linearen Funktionalen anstellen werden, wollen wir jetzt, da wir bra- und ket-Vektoren zur Verfügung haben, nocheinmal kurz zu den allgemeinen linearen Operatoren zurückkehren. Betrachten wir den Fall eines linearen Operators A auf einem separablen Hilbertraums mit einer orthonormalen Basis {|ϕn i}. Durch Einschieben zweier 1 Operatoren, erhalten wir A= ∞ X |ϕn i hϕn | A |ϕm i hϕm | , n,m=1 mit den Matrixelementen An,m := hϕn | A |ϕm i. Dabei muss allerdings sichergestellt werden, dass alle Matrixelemente existieren, was wieder eine Frage im Zusammenhang mit dem Definitionsbereich des Operators ist. Bezüglich der Basis wird der Operator durch eine “unendlichdimensionale” Matrix dargestellt. Die Definition des adjungierten Operators hat für die Matrixelemente eines selbstadjungierten Operators die gleichen Auswirkungen wie im endlichdimensionalen Fall: An,m = A∗m,n . Im Zusammenhang mit den Matrixelementen bezüglich einer Basis wird auch klar, dass man die Spur nicht für jeden linearen Operator auf dem separablen Hilbertraum definieren kann. Selbst wenn alle Matrixelemente hϕn | A |ϕm i eines Operators existieren heißt das noch nicht, dass auch Sp A = ∞ X hϕn | A |ϕn i n=1 konvergiert. Die im Kapitel 2 diskutierten Beweise dazu, dass (1) Eigenwerte reell sind, dass (2) Eigenvektoren zu verschiedenen Eigenwerten orthogonal sind und (3) dass es in einem Unterraum zu einem entarteten Eigenwert möglich ist eine 10 Eine schöne Einführung in diese Feinheiten liefert auch der Artikel von F. Gieres, den Sie unter der zusätzlichen Literatur finden. 65 orthonormale Basis von Eigenvektoren zu konstruieren, lassen sich auf selbstadjungierte Operatoren auf separablen Hilberträumen verallgemeinern. Wie dort, erhalten wir eine Zerlegung der Eins aus Eigenvektoren |aν i zu A 1= ∞ X |aν i haν | . ν=1 Aus der Zerlegung der Eins folgt sofort die Spektraldarstellung A= ∞ X ν=1 A |aν i haν | = ∞ X λν |aν i haν | , ν=1 mit den Eigenwerten λν . Später werden wir sehen, dass für gewisse selbstadjungierte Operatoren, die (uneigentlichen) Eigenvektoren von einem kontinuierlichen Index abhängen und wir die Summe in der Zerlegung der Eins und der Spektraldarstellung durch ein Integral ersetzen müssen. Wir werden im konkreten Kontext auf Spektraldarstellung wichtiger Operatoren des Quantenmechanik zurückkommen. Auch die Konstruktion eines vollständigen Systems vertauschbarer (selbstadjungierter) Operatoren, das Konzept der Differentation eines Operators nach einem Parameter und der Begriff von Funktionen von Operatoren (definiert über eine Potenzreihe) lassen sich auf den Hilbertraum verallgemeinern. Kehren wir nun zu den linearen Funktionalen zurück und betrachten explizit H = L2 (U). Beschränken wir uns hier auf den Unterraum der stetige quadratintegrablen Funktionen11 L̃2 (U) ⊂ L2 (U) so können wir auch stetige, lineare Funtionale angeben, die nicht durch Elemente von L2 (U) ausgedrückt werden können.12 Als erstes wichtiges Beispiel sei das als δ~x0 bezeichnete (~x0 ∈ U) und durch δ~x0 (|ψi) := ψ(~x0 ) , für alle |ψi ∈ L̃2 (U), definierte Funktional erwähnt. Das Funktional ordnet also jeder (stetigen) Wellenfunktion seinen Funktionswert am festen Ort ~x0 zu. Wie Sie in den Übungen gelernt haben,13 kann man dieses Funktional als Z Z d δ~x0 (|ψi) = δ(~x − ~x0 )ψ(~x)d x = δ ∗ (~x − ~x0 )ψ(~x)dd x = ψ(~x0 ) , U 11 U Dieser Unterraum ist nicht vollständig und damit kein Hilbertraum. Es gilt L̃2 (U) ⊂ L2 (U) ⊂ L̃∗2 (U), wobei L̃∗2 (U) den Dualraum zu L̃2 (U) bezeichnet. Dabei gilt es Fragen der Norm zu beachten (siehe Literatur). Man bezeichnet diese drei Räume auch als Gelfandsches Raumtripel. 13 Die Verallgemeinerung des dort gelernten auf den d-dimensionalen Fall sollte kein größeres Problem darstellen. 12 66 KAPITEL 5. DER HILBERTRAUM mit der Diracschen δ-Funktion schreiben. Wir bezeichnen dieses Funktional im folgenden als δ~x0 (|ψi) =: h~x0 |ψi , mit einem bra-Vektor h~x0 |. Streng genommen entspricht diesem, nur auf einem Unterraum des Hilbertraums definierten, bra-Vektor kein ket-Vektor |~x0 i, da die Diracsche δ-Funktion (die, wie gerade gesehen, das Funktional erzeugt) nicht quadratintegrabel ist (das Quadrat der “Funktion” ist nichteinmal definiert). Es ist aber praktisch sehr nützlich den Hilbertraum um solche “uneigentlichen” ketVektoren zu erweitern. Für den Umgang mit diesen Vektoren soll die allgemeine Regel (|ψi ∈ L̃2 (U)) h~x0 |ψi∗ = ψ ∗ (~x0 ) =: hψ |~x0 i weiterhin gelten. Damit kann man für beliebige |ψi , |ϕi ∈ L̃2 (U) Z Z ∗ d hϕ |~x i h~x |ψi dd x ϕ (~x)ψ(~x)d x = hϕ |ψi = U U schreiben und erhält eine Zerlegung der Eins Z |~x i h~x | dd x = 1 . (5.3) U Da die uneigentlichen Vektoren |~xi durch einen kontinuierlichen “Index” charakterisiert sind, tritt dabei statt der Summe ein Integral auf (vergleiche mit Gl. (2.5)). Man nennt die uneigentlichen ket-Vektoren |~xi auch Ortszustände. Durch Einschieben einer Eins in Form von Gl. (5.3) Z Z 0 0 d 0 ψ(~x) = h~x |ψi = h~x |~x i h~x |ψi d x = h~x |~x 0 i ψ(~x0 )dd x0 U U erhält man die “Orthogonalitätsrelation” h~x |~x 0 i = δ(~x − ~x 0 ) . (5.4) Im Gegensatz zu der gewöhnlichen Orthogonalitätsrelation von Elementen des Hilbertraums steht auf der rechten Seite der Gleichung die δ-Funktion und nicht das Kronecker δ. Man kann die Menge {|~xi} der uneigentlichen ket-Vektoren damit auch als “orthonormale” Basis auffassen.14 Bezüglicher dieser Basis wird der abstrakte Vektor |ψi durch die Wellenfunktion ψ(~x) = h~x |ψi dargestellt.15 Man spricht daher in diesem Zusammenhang auch von der Ortsdarstellung. 14 Da der zugrundeliegende Hilbertraum ein separabler ist, muss diese Basis übervollständig sein. 15 So, wie ein endlichdimensionaler Vektor |ϕi bezüglich einer Basis {|ej i} durch die Einträge hej |ϕi eines Spaltenvektors dargestellt wird (siehe Kapitel 2), wird das obige |ψi durch die Funktion ψ(~x) = h~x |ψi dargestellt. Die ψ(~x) bilden also die “Einträge” eines “kontinuierlichen Spaltenvektors”. 67 Mit Hilfe der uneigentlichen ket-Vektoren |~x i und der bra-Vektoren h~x | wollen wir nun einen Ortsoperator definieren. Dazu betrachten wir die auf Eins normierte Wellenfunktion ψ(~x) (|ψ(~x)|2 ist die Wahrscheinlichkeitsdichte eines Teilchens zu einer festen Zeit t, die wir nicht mitschreiben). Der Erwartungswert des Ortes ist durch16 Z h~x i = ~x |ψ(~x)|2 dd x ZU = hψ |~x i ~x h~x |ψi dd x U D E = hψ| ~xˆ |ψi = ~xˆ |ψi gegeben. Dabei haben wir den Ortsoperator17 Z ˆ ~x := |~x i ~x h~x | dd x (5.5) U über seine Spektraldarstellung in den (uneigentlichen) Ortszuständen definiert. Analog zur Zerlegung der Eins tritt wieder ein Integral statt der Summe (vergleiche mit Gl. (2.8)) auf. Aus der Spektraldarstellung folgt sofort, dass ~xˆ† = ~xˆ , der Ortsoperator also selbstadjungiert ist. Die Ortszustände |~x i sind die (uneigentlichen) Eigenzustände zu ~xˆ, da Z Z 0 d 0 ˆ |~x i ~xδ(~x − ~x 0 )dd x = ~x 0 |~x 0 i . |~x i ~x h~x | ~x i d x = ~x |~x i = U U Da h~x| ~xˆ = ~x h~x| wirkt der Ortsoperator in der Ortsdarstellung wie die Multiplikation mit dem Ortsvektor ~x h~x| ~xˆ |ψi = ~x h~x |ψi = ~xψ(~x) . Die Komponenten des Ortsoperators x̂j , j = 1, 2, . . . , d, vertauschen da Z Z d [x̂i , x̂j ] = xi |~x i h~x | d x x0j |~x 0 i h~x 0 | dd x0 UZ U Z 0 0 0 d 0 xi |~x i h~x | dd x − xj |~x i h~x | d x U Z U = (xi xj − xi xj ) |~x i h~x | dd x = 0 , (5.6) U 16 In der letzten Zeile gehen wir dabei von der “Wellenpaketnotation” D Efür den Erwartungswert ˆ des Ortes h~x i von Kapitel 4 zu der abstrakten “Operatornotation” ~x von Kapitel 3 über. |ψi 17 Der Hut auf dem Vektor ~x ist notwendig, um den Ortsoperator vom Ortsvektor zu unterscheiden. 68 KAPITEL 5. DER HILBERTRAUM wobei wir Gl. (5.4) verwendet haben. Ein weiteres wichtiges Beispiel von stetigen linearen Funktionalen die nicht durch Zustände des L2 (Rd ) ausgedrückt werden können bilden die so genannten “Impulszustände”.18 Wir definieren d Z 1 h~p | ψi := ψ̃(~p ) = √ e−i~p·~x/~ ψ(~x)dd x , (5.7) d 2π~ R so dass |h~p | ψi|2 die Wahrscheinlichkeitsdichte des Impulses ist. Analog zum Begriff der Ortsdarstellung spricht man hier von der Impulsdarstellung. Die Funkti√ d on e−i~p·~x/~ / 2π~ die das Funktional erzeugt ist nicht quadratintegrable, gehört also nicht zum Hilbertraum. Wie für die Ortszustände definieren wir dennoch einen uneigentlichen ket-Vektor |~p i gemäß h~p |ψi∗ = ψ̃ ∗ (~p) =: hψ |~pi . Analog zur Rechnung Gl. (4.13) kann man zeigen, dass Z Z ∗ d hϕ |ψi = ϕ (~x)ψ(~x)d x = ϕ̃∗ (~p)ψ̃(~p)dd p d d R ZR hϕ |~p i h~p |ψi dd p = Rd gilt. Wir erhalten damit wieder eine Zerlegung der Eins Z |~p i h~p | dd p = 1 . (5.8) Rd Aus ihr ergibt sich wie oben h~p |~p 0 i = δ(~p − p~ 0 ) . (5.9) In Analogie zum Ortsoperator definieren wir den Impulsoperator Z ˆ p~ := |~p i p~ h~p | dd p (5.10) Rd und erhalten den Erwartungswert Z p~ |ψ̃(~p )|2 dd p Rd D E ˆ = hψ| p~ |ψi = p~ˆ h~p i = |ψi 18 , Wir betrachten hier gleich U = Rd , da die Fouriertransformation für Funktionen definiert ist, die auf dem ganzen Rd gegeben sind. Eine Funktion auf U kann man durch geeignetes Fortsetzen auf den ganzen Rd erweitern. 69 die Selbstadjungiertheit p~ˆ † = p~ˆ , die Eigenvektorrelation p~ˆ |~p 0 i = p~ 0 |~p 0 i , sowie die Kommutatorrelation [p̂i , p̂j ] = 0 . (5.11) Ein Vergleich von Z Z d h~p |~xi h~x |ψi d x = h~p |ψi = h~p |~xi ψ(~x)dd x Rd Rd mit der Definitionsgleichung (5.7) zeigt, dass h~p |~xi = 1 √ 2π~ d e−i~p·~x/~ , bzw. h~x |~pi = 1 √ 2π~ d ei~p·~x/~ , (5.12) gilt. Aus der letzten Gleichung folgt19 ~ ∂ h~x |~pi = p~ h~x |~pi . i ∂~x Mit Hilfe dieser Relation kann man die Wirkung von p~ˆ in der Ortsdarstellung bestimmen Z ˆ h~x| p~ |ψi = h~x |~p i p~ h~p |ψi dd p d R Z ~ ∂ = h~x |~p i h~p |ψi dd p i ∂~x Rd ~ ∂ = h~x |ψi . i ∂~x In der Ortsdarstellung wird der Impulsoperator p~ˆ also durch den Differentations∂ operator ~i ∂~ dargestellt. x 19 ∂ ∂~ x ~ ~x . ist eine häufig benutzte, alternative Schreibweise für den Gradienten ∇ 70 KAPITEL 5. DER HILBERTRAUM Mit dieser Einsicht lässt sich der wichtige Kommutator [x̂i , p̂j ] berechnen. Wir betrachten dazu h~x| [x̂i , p̂j ] |ψi = h~x| (x̂i p̂j − p̂j x̂i ) |ψi ~ ∂ ∂ = xi h~x |ψi − xi h~x |ψi i ∂xj ∂xj = i~ δi,j h~x |ψi . Da |ψi ein beliebiges Element ist20 folgt nach Multiplikation mit |~xi von links, R Integration über alle ~x und weglassen einer 1 = |~xi h~x| dd x, die Heisenbergsche Vertauschungsrelation [x̂i , p̂j ] = i~ δi,j 1 . (5.13) Zusammen mit den Kommutatoren Gln. (5.6) und (5.11), bildet Gl. (5.13) die so genannten kanonischen Kommutatorrelationen. Wir wollen an dieser Stelle nocheinmal auf die bereits im Zusammenhang mit Gl. (3.15) angesprochene Beziehung klassischer Poissonklammern und der Kommutatorrelationen hinweisen.21 Bis auf den Faktor i~ entspricht Gl. (5.13) den Poissonklammern von Koordinaten und Impulsen in der klassischen Mechanik.22 Wir können jetzt einen Zusammenhang zwischen der allgemeinen Heisenbergschen Unschärferelation Gl. (3.21) und der Gl. (4.14) herstellen. Wählen wir in Gl. (3.21) A = x̂i und B = p̂i so folgt ∆|ψi (x̂i ) ∆|ψi (p̂i ) ≥ ~ 1 |hψ| [x̂i , p̂i ] |ψi| = , 2 2 d.h. Gl. (4.14).23 Zusätzlich können wir jetzt bereits die Beziehung von Gl. (4.15) zur Beschreibung der Dynamik eines kräftefreien Teilchens (bzw. die offensichtliche dreidimensionale Verallgemeinerung dieser Gleichung; siehe Gl. (4.17)) mit der allgemeinen Schrödingergleichung (3.4) verstehen. Dazu betrachten wir Z 2 h~x| p~ˆ |ψi = h~x |~p i p~ 2 h~p |ψi dd p Rd 2 Z ~ ∂ = h~x |~p i h~p |ψi dd p i ∂~x d R = −~2 ∆ h~x |ψi . ˆ Genauer ist |ψi ein beliebiges Element aus der Schnittmenge der Definitionsbereiche von ~x ˆ und p~. Auf dieser Schnittmenge gilt dann die Kommutatorrelation. 21 Den “tiefen” Grund für die Gleichheit (bis auf den Faktor i~) von Poissonklammern in der klassischen Mechanik und den Kommutatoren in der Quantenmechanik werden Sie erst in der Quantenmechanik II kennenlernen. Er hängt mit Symmetrietransformationen wie z.B. der Translation und der Rotation zusammen. 22 Gleiches gilt für die Gln. (5.6) und (5.11). 23 Wie für die Erwartungswerte von Ort und Impuls, haben wir im Kapitel 4 auch für die Unschärfen bewusst eine andere Notation gewählt, als im Kapitel 3. 20 71 Wir haben dabei benutzt, dass für einen selbstadjungierten Operator A mit Spektraldarstellung X A= λν |aν i haν | , ν f (A), mit einer hinreichend “harmlosen” Funktion f : R → C, die Spektraldarstellung24 X f (A) := f (λν ) |aν i haν | (5.14) ν hat.25 Gleiches gilt, wenn die diskrete Summe durch ein Integral ersetzt wird (wie p ~ˆ 2 in bei den Orts- und Impulszuständen). Wir erkennen somit, dass der Operator 2m ~2 der Ortsdarstellung durch − 2m ∆ gegeben ist. Wählen wir also in der allgemeinen Schrödingergleichung (3.4) H = i~ p ~ˆ 2 2m so folgt ∂ ∂ ∂ ψ(~x, t) = i~ h~x |ψ(t)i = h~x| i~ |ψ(t)i = h~x| H |ψ(t)i ∂t ∂t ∂t 2 2 p~ˆ ~ ~2 = h~x| |ψ(t)i = − ∆ h~x |ψ(t)i = − ∆ψ(~x, t) , 2m 2m 2m d.h. Gl. (4.15). Um also von der klassischen Hamiltonfunktion eines kräftefreien p ~2 zum Hamiltonoperator zu gelangen, ersetzen wir den Impuls durch Teilchens 2m den Impulsoperator. Gl. (4.15) ist die Schrödingergleichung für solch ein Teilchen in der Ortsdarstellung. Der Idee der Ersetzung einer Variablen durch den zugehörigen Operator folgend, ersetzen wir jetzt ein (hinreichend vernünftiges) Potenzial26 V (~x) durch Z ˆ V (~x) |~xi h~x| d3 x , V (~x) = R3 mit h~x| V (~xˆ) |ψi = V (~x) h~x| ψi = V (~x)ψ(~x) . Damit ergibt sich Gl. (4.17) als Ortsdarstellung der Schrödingergleichung i~ 24 ∂ |ψ(t)i = H |ψ(t)i , ∂t Im Gegensatz zur allgemeinen Definition der Funktion eines Operators über die Potenzreihe, muss f nicht unbedingt in eine Potenzreihe entwickelbar sein. 25 2 Das diese R Definitiond sinnvoll ist, sieht man exemplarisch, wenn man f (y) = y , y ∈ R, und A = x̂j = |~xi xj h~x| d x betrachtet. Explizites berechnen von AA liefert dann dasselbe, wie A2 nach der Definition. 26 Eine mögliche Zeitabhängigkeit des Potenzials schreiben wir hier nicht mit. 72 KAPITEL 5. DER HILBERTRAUM mit dem spezifischen Hamiltonoperator H= p~ˆ 2 + V (~xˆ) . 2m (5.15) Er beschreibt die Dynamik eines Teilchens der Masse m im externen Potenzial V (~x) und man gewinnt ihn aus der Hamiltonfunktion des äquivalenten klassischen Problems durch ersetzen der Koordinaten und Impulse durch die entsprechenden Operatoren. Man nennt diese Ersetzungsvorschrift das Korrespondenzprinzip. Da p~ˆ und ~xˆ selbstadjungiert sind, ist auch H selbstadjungiert.27 Wir wollen die obige Aussage nocheinmal durch eine explizite Rechnung bestätigen. Starten wir dazu mit Gl. (4.17): ~2 ∂ ∆ψ(~x, t) + V (~x)ψ(~x, t) i~ ψ(~x, t) = − ∂t 2m ~2 ∂ ∆ h~x |ψ(t)i + V (~x) h~x |ψ(t)i ⇔ i~ h~x |ψ(t)i = − ∂t 2m ∂ p~ˆ 2 ⇔ h~x| i~ |ψ(t)i = h~x| |ψ(t)i + h~x| V (~xˆ) |ψ(t)i . ∂t 2m Multiplikation von links mit dem uneigentlichen ket-Vektor |~xi, Integration über R ~x und das “Weglassen” einer 1 = |~xi h~x| d3 x liefert dann die Behauptung. Wir haben damit, wie angestrebt, eine gemeinsame Sprache für die in den Kapiteln 3 und 4 beschriebene Physik gefunden. 27 Da im obigen Hamiltonoperator keine Produkte von p̂i und x̂j vorkommen, ist der Beweis dieser Aussage trivial. Da p̂i und x̂i nicht vertauschen (siehe Gl. (5.13)) muss man beim Beweis der Selbstadjungiertheit etwas vorsichtiger sein, wenn solche Produkte auftreten. In diesem Fall stellt aber das Korrespondenzprinzip sicher, dass man bei der “Quantisierung” einer Hamiltonfunktion die Reihenfolge der Faktoren von p̂i und x̂i so wählt, dass der resultierende Hamiltonoperator selbstadjungiert ist. Wir werden entsprechende Beispiele kennen lernen. Kapitel 6 Die Postulate der Quantenmechanik Wir werden jetzt die fundamentalen physikalischen Einsichten, die wir in den vorangegangenen Kapitel gewonnen haben zu Postulaten erheben. Da wir sie hinreichend motiviert haben sollten, werden wir hier nicht nocheinmal im Detail auf ihre Interpretation eingehen. Konsequenzen der Postulate werden Sie im Rest dieser Vorlesung kennen lernen. Postulat 1: Jedem abgeschlossenen Quantensystem ist ein Hilbertraum H zugeordnet. Der Zustand des Systems zu einer festen Zeit t0 wird durch ein Element |ψ(t0 )i ∈ H beschrieben. |ψ(t0 )i ist auf Eins normiert, d.h. hψ(t0 ) |ψ(t0 )i = 1. Postulat 2: Jede messbare physikalische Größe A wird durch einen linearen, selbstadjungierten Operator A auf H beschrieben. A hat ein vollständiges System von Eigenvektoren (es gibt eine Zerlegung der Eins und eine Spektraldarstellung des Operators aus Eigenvektoren). Man nennt A eine Observable. Postulat 3: Die möglichen Messwerte von A sind die Eigenwerte von A. Postulat 4: Misst man die Observable A an einem System im Zustand |ψi, so ist die Wahrscheinlichkeit den Eigenwert i) an zu messen, wenn an nicht-entarteter und diskreter Eigenwert zum Eigenvektor |an i ist, durch wan (|ψi) = | han |ψi |2 gegeben.1 1 Dieses Postulat impliziert, dass wenn ein gegebener Zustand |ψi orthogonal zu einem oder mehreren der Eigenvektoren zu A ist, die Wahrscheinlichkeit die zugehörigen Eigenwerte zu 73 74 KAPITEL 6. DIE POSTULATE DER QUANTENMECHANIK ii) an zu messen, wenn an entarteter und diskreter Eigenwert zum Eigenvektor |an , νi ist, durch Z X wan (|ψi) = | han , ν |ψi |2 ν gegeben. Dabei bezeichnet ν einen zusätzlichen diskreten (Summenzeichen) bzw. kontinuierlichen (Integralzeichen) Parameter.2 Ist der Eigenwert a Teil eines Kontinuums von Eigenwerten, so liefert3 X Z 2 wa,a+da (|ψi) = | ha, ν |ψi | da ν die Wahrscheinlichkeit einen Wert aus dem Intervall [a, a + da] zu messen.4 Dabei fällt die Summe bzw. das Integral (über ν) weg, wenn der Eigenzustand durch die Angabe von a bereits eindeutig charakterisiert ist. Aus Postulat 4 folgt der wichtige Zusammenhang zwischen dem Erwartungswert bzw. Mittelwert (bei wiederholter Messung an identisch präparierten Quantensystemen) in einem Zustand |ψi und dem Matrixelement hψ| A |ψi. Wir wollen ihn für den Fall von diskreten aber möglicherweise entarteten Eigenwerten beweisen: Z X X X | han , ν |ψi |2 hAi|ψi := an wan (|ψi) = an = n Z XX n n ν hψ |an , νi an han , ν |ψi = hψ| A |ψi , ν wobei wir die Spektraldarstellung Z XX an |an , νi han , ν| A= n ν messen Null ist. Gleiches gilt, wenn der Eigenwert an entartet ist und |ψi orthogonal zu allen |an , νi ist, wobei ν die erlaubten Werte durchläuft. Aus ihm folgt weiterhin, dass die Zustände |ψi und eiα |ψi, mit α ∈ R dieselben möglichen Messwerte mit denselben Wahrscheinlichkeiten liefern (für alle Observable). Physikalisch spielt eine globale Phase damit keine Rolle. Relative Phasen in Linearkombinationen von Zuständen sind dagegen sehr wichtig. 2 Das es eine kontinuierliche Parametrisierung geben kann, haben wir in den Beispielen der Orts- und Impulszustände kennengelernt. Wir werden im Folgenden häufiger das aus dem Integral- und dem Summenzeichen zusammengesetze Symbol verwenden, wenn wir Fälle von diskreter und kontinuierlicher Parameterabhängigkeit gleichzeitig diskutieren wollen. 3 Achtung! Hier gehen die Summe bzw. das Integral über ν. Das da hängt also nicht mit der Summe bzw. dem Integral zusammen. 4 Als Beispiel betrachten wir hier A = x̂ (in einer Raumdimension). Dann gilt für die Wahrscheinlichkeit bei einer Ortsmessung das durch |ψi beschriebene Teilchen im Intervall [x, x+dx] zu finden wx,x+dx (|ψi) = | hx |ψi |2 dx = |ψ(x)|2 dx. Dies entspricht der in Kapitel 4 diskutierten Bornschen Interpretation. 75 verwendet haben. Ein analoges Resultat für den Fall, dass es auch Eigenwerte a gibt, die in einem Kontinuum liegen, kann man leicht herleiten. Postulat 5: Ergibt die Messung einer Observablen A den Eigenwert5 an , so befindet sich das System nach der Messung in einem Zustand, der durch die normierte Projektion auf den entsprechenden Unterraum (zu an ) gegeben ist6 |ψi → Pn |ψi hψ| Pn |ψi1/2 . Dabei gilt Pn := Z X |an , νi han , ν| . ν Postulat 6: Die zeitliche Entwicklung eines abgeschlossenen Quantensystems ist durch die Schrödingergleichung i~ d |ψ(t)i = H |ψ(t)i dt gegeben, wobei H die Observable ist, die mit der Gesamtenergie des Systems verknüpft ist. Um Observable aus ihrem klassischen Analogon zu konstruieren benötigen wir das schon erwähnte Korrespondenzprinzip. Diesem folgend ersetzt man in einer klassischen physikalischen Messgröße A(~x, p~) die Koordinaten und Impulse durch die entsprechenden Operatoren ~xˆ und p~ˆ. Dabei wählt man die Reihenfolge der x̂i und p̂j so, dass der resultierende Operator A(~xˆ, p~ˆ) selbstadjungiert ist. Formal ist diese Konstruktionsvorschrift nicht eindeutig. Trotzdem lassen sich die praktisch wichtigen Fälle eindeutig übersetzen (für Beispiele, siehe später). Anhand des Spinfreiheitsgrads des Elektrons haben wir bereits gesehen, dass es in der Quantenmechanik auch Freiheitsgrade gibt, die kein klassisches Analogon haben. In diesem Fall gibt es weder zur Konstruktion des Hilbertraums noch des Hamiltonoperators (bzw. weiterer mit diesem Freiheitsgrad zusammenhängender Operatoren) eine allgemeingültige Vorgehensweise. Der Theoretiker muss sich daher vom experimentellen Beobachtungen und allgemeinen Konzepten (wie Symmetrien und Einfachheitsargumenten) leiten lassen. Ein Beispiel dazu haben wir bei der Analyse des Stern-Gerlach Experiments kennen gelernt. 5 Der Einfachheit halber beschreiben wir nur den Fall eines diskreten Eigenwertes. Die Verallgemeinerung folgt jedoch unmittelbar. 6 Ist an nicht entartet, so vereinfacht sich der Ausdruck zu |ψi → |an i. Der Zustand auf der rechten Seite des Pfeils ist nur bis auf eine Phase eindeutig bestimmt. 76 KAPITEL 6. DIE POSTULATE DER QUANTENMECHANIK Kapitel 7 Die Schrödingergleichung in einer Dimension Um simultan ein besseres Verständnis von “Quanteneffekten” bei der “Bewegung”1 eines Teilchens und des Formalismus der Quantenmechanik zu gewinnen, betrachten wir hier vereinfachend die Situation, in der das Teilchen sich nur entlang einer Raumrichtung “bewegen” kann und einem zeitunabhängigen Potenzial V (x) ausgesetzt ist. Ausgehend von einem z.B. durch die experimentelle Präparation festgelegten2 Anfangszustand zur Zeit t = 0,3 |ψ(0)i, ist die zeitliche Entwicklung des Zustandes |ψ(t)i durch die Schrödingergleichung i~ d |ψ(t)i = H |ψ(t)i dt gegeben. In der Ortsdarstellung ergibt sich, wie wir bereits gesehen haben, eine partielle Differentialgleichung i~ ∂ ~2 ∂ 2 ψ(x, t) = − ψ(x, t) + V (x)ψ(x, t) . ∂t 2m ∂x2 (7.1) Für allgemeine Potenziale V (x) kann diese Differentialgleichung ausgehend von ψ(x, 0) (selbst in einer Dimension!) meist nur numerisch gelöst werden. Für den Fall der eindimensionalen Bewegung ist es relativ einfach einen numerisch einigermaßen genauen und stabilen Algorithmus anzugeben mit deren Hilfe die 1 Wir wollen hier die Orts- und Impulsfreiheitsgrade eines Teilchens untersuchen. Diese fassen wir mit dem Begriff “Bewegung” zusammen. Wie Sie sehen werden, diskutieren wir auch Lösungen der Schrödingergleichung, bei denen die Zeitabhängigkeit nur durch eine Phase gegeben ist, so dass die Wahscheinlichkeitsdichte des Ortes zeitlich konstant ist, also keine wirkliche Bewegung stattfindet. 2 Als Theoretiker kann man den Anfangszustand, unter Berücksichtigung möglicher, sich aus der konkreten Modellsituation ergebender, Einschränkungen, oft geeignet wählen. 3 Allgemeiner könnte man zur Zeit t0 starten. Der Anfangszustand wäre dann durch ein vorgegebenes |ψ(t0 )i beschrieben. Wie wählen meist zur Vereinfachung und o.B.d.A. t0 = 0. 77 78 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION Differentialgleichung numerisch direkt gelöst werden kann. Unter der zusätzlichen Literatur finden Sie einige Seiten aus dem Buch Visual Quantum Mechanics von B. Thaller anhand derer es Ihnen leicht fallen sollte, ein entsprechendes Programm zu schreiben. Ein Teil der in der Vorlesung gezeigten “Filme” beruht auf der numerischen Lösung der Schrödingergleichung in der Ortsdarstellung. Da dies aber keine Vorlesung über “Computational Physics”, sondern über theoretische Physik ist, möchten wir auch ein analytisches Verständnis von physikalisch relevanten Situationen gewinnen. Dazu stellen wir zwei zum Verständnis der Physik und des Formalismus wichtige Fragen: (1) Können wir den Ablauf von Streuexperimenten analytisch verstehen, in denen ein, durch ein (geeignet gewähltes) Wellenpaket4 beschriebenes Teilchen auf ein räumlich lokalisiertes, externes Potenzials V (x) trifft? Ein Beispiel dazu ist in der gezeigten Simulation dargestellt. Ein Wellenpaket trifft auf einen lokalisierten “Potenzialberg”. Klassisch erwarten wir, dass das Teilchen den Potenzialberg durchtritt (Transmission), wenn die kinetische Energie E = p2 /(2m) > 0 des Teilchens außerhalb des Einflussbereichs des Potenzials größer ist, als die maximale Potenzialhöhe Vmax = maxx∈R V (x). Gilt dagegen E < Vmax , so erwarten wir, dass das Teilchen reflektiert wir. Wie Sie in der numerischen Lösung der Schrödingergleichung sehen, ergibt sich in der Quantenmechanik eine andere Situation. Ein Teil des mit mittlerem Impuls p0 einfallenden Wellenpakets wird reflektiert, ein anderer durchtritt jedoch den Potenzialberg. In der Wahrscheinlichkeitsdichte des Impulses gibt es entsprechend nach der Streuung, d.h. wenn die beiden Teilwellenpakete außerhalb des Einflussbereichs des Potenzials sind, zwei scharfe Strukturen: Eine um p0 herum, die andere um −p0 . Dieses Verhalten werden wir analytisch verstehen können. Es führt uns unter anderem auf den so genannten Tunneleffekt, von dem Sie sicherlich schoneinmal gehört haben. Ein analoges Verhalten in dem ein Wellenpaket auf eine Potenzialstufe trifft ist in Abbildung 7.1 dargestellt. Ein Verständnis von Streuexperimenten der geschilderten Art ist im Zusammenhang mit Experimenten sehr wichtig. Allgemeine quantenmechanische Streutheorie (in drei Raumdimensionen) ist Gegenstand der Quantenmechanik II Vorlesung. (2) Gibt es quadratintegrable Lösungen5 der Schrödingergleichung |ψ(t)i in einem gegebenen Potenzial in denen sich die Wahrscheinlichkeitsdichte des Ortes |hx |ψ(t)i|2 = |ψ(x, t)|2 zeitlich nicht ändert? Mit dieser Forderung lassen 4 Mit dem Begriff Wellenpaket bezeichnen wir hier ganz allgemein eine quadratintegrable, “vernünftige” Wellenfunktion, die hinreichend gut lokalisiert ist, aber in Abwesenheit eines Potenzials nicht allzuschnell zerfließt. Wenn das Teilchen auf das lokalisierte Potenzial trifft, sollte das Wellenpaket noch einigermaßen lokalisiert sein. 5 Das wir die Quadratintegrabilität fordern hat einen Grund! Wie Sie später sehen werden, gibt es oft Lösungen der Schrödingergleichung, deren Zeitabhängigkeit eine reine Phase ist, die aber nicht quadratintegrabel sind (siehe z.B. die ebenen Wellen aus Gl. (4.12)). Die quadratintegrablen Funktionen haben jedoch eine besondere Bedeutung als so genannte gebundene Zustände. 7.1. ALLGEMEINE KONZEPTE 79 Abbildung 7.1: Die Streuung eines Wellenpakets an einer Potenzialstufe. Die obere Reihe zeigt |ψ(x, t)|2 und die untere |ψ̃(p, t)|2 , jeweils zu drei verschiedenen Zeiten. wir nur eine zeitabhängige Phase zu. Starten wir bei t = 0 in solch einem Zustand, so wären sowohl der Erwartungswert des Ortes als auch die Unschärfe zeitunabhängig. Auch bei jeder anderen Messung von Observablen, wären die Erwartungswerte (und Unschärfen) zeitunabhängig.6 Die Beantwortung beider Fragen ist sehr wichtig zum Verständnis einer Vielzahl von Experimenten. Wir werden uns ihr in mehreren Schritten nähern. Es sollte dabei klar werden, dass einige der wichtigen Schritte auch bei der Lösung allgemeinerer Probleme von großer Bedeutung sind. 7.1 Allgemeine Konzepte Die Wahrscheinlichkeitsstromdichte: Die Interpretation von ρ(x, t) = |ψ(x, t)|2 als Wahrscheinlichkeitsdichte des Ortes,7 wird durch den Begriff der Wahrscheinlichkeitsstromdichte komplettiert. Um dieses Konzept einzuführen betrachten wir die zeitliche Änderung von ρ(x, t). Unter der Annahme, dass V (x) reell ist, bilden wir das komplexkonjugierte der Schrödingergleichung (7.1) in der Ortsdarstellung −i~ ∂ ∗ ~2 ∂ 2 ∗ ψ (x, t) = − ψ (x, t) + V (x)ψ ∗ (x, t) . ∂t 2m ∂x2 (7.2) Multiplizieren wir jetzt Gl. (7.1) mit ψ ∗ (x, t) und Gl. (7.2) mit ψ(x, t) und sub6 7 Siehe eine der Fußnoten im Postulat 4. ψ(x, t) ist eine auf Eins normierte Wellenfunktion. 80 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION trahieren die beiden resultierenden Gleichungen voneinander, so folgt ∂ ∂ ∗ ∂ ∗ i~ ψ (x, t) ψ(x, t) + ψ(x, t) ψ (x, t) = i~ ρ(x, t) ∂t ∂t ∂t 2 2 2 ~ ∂ ∂ ∗ ∗ =− ψ (x, t) 2 ψ(x, t) − ψ(x, t) 2 ψ (x, t) + V (x)ρ(x, t) − V (x)ρ(x, t) 2m ∂x ∂x 2 2 ∂ ~ ∂2 ∗ ∗ ψ (x, t) 2 ψ(x, t) − ψ(x, t) 2 ψ (x, t) . =− 2m ∂x ∂x Mit der Definition ∂ ∂ ∗ ~ ∗ ψ (x, t) ψ(x, t) − ψ(x, t) ψ (x, t) j(x, t) := 2mi ∂x ∂x (7.3) für die Wahrscheinlichkeitsstromdichte8 j(x, t) ergibt sich aus dieser Gleichung die Kontinuitätsgleichung9 ∂ ∂ ρ(x, t) + j(x, t) = 0 . ∂t ∂x (7.4) Das der Name “Wahrscheinlichkeitsstromdichte” gerechtfertigt ist, sehen wir an folgender Überlegung. Die Wahrscheinlichkeit das Teilchen zur Zeit t im Intervall Rb [a, b] anzutreffen ist durch W[a,b] (t) = a ρ(x, t)dx gegeben. Eingesetzt in Gl. (7.4) erhalten wir ∂ W[a,b] (t) = j(a, t) − j(b, t) . ∂t Die Wahrscheinlichkeit W[a,b] (t) ändert sich also dadurch, dass bei a “Wahrscheinlichkeit” in das Intervall hineinfließt10 und bei b hinaus. Mit der Zerlegung p ψ(x, t) = ρ(x, t)eiP (x,t)/~ erhält man aus Gl. (7.3) j(x, t) = ρ(x, t) 1 ∂ P (x, t) . m ∂x (7.5) Dieser Ausdruck11 zeigt, dass die Wahrscheinlichkeitsstromdichte für reelle Wellenfunktionen ψ(x, t) mit P (x, t) = 0, für alle x und t, gleich Null ist. Aus der 8 Die Definitionsgleichung der Wahrscheinlichkeitsstromdichte zeigt, dass j(x, t) reell ist. Eine Gleichung dieses Typs sollten Sie aus der Elektrodynamik kennen. Dort steht ρ(x, t) für die Ladungsdichte und j(x, t) für die Stromdichte. 10 Das “Hineinfließen” kann auch negativ sein. Dann nimmt W[a,b] (t) entsprechend ab. Analoges gilt für ein “negatives” Hinausfließen bei b. In diesem Fall nimmt W[a,b] (t) zu. 1 ∂ 11 Man kann m ∂x P (x, t) als die Geschwindigkeit des Wahrscheinlichkeitsstroms interpretieren. Der Wahrscheinlichkeitsstrom ergibt sich dann als “Dichte×Geschwindigkeit”. 9 7.1. ALLGEMEINE KONZEPTE 81 Kontinuitätsgleichung (7.4) folgt für diesen Fall eine zeitunabhängige Wahrscheinlichkeitsdichte (siehe unsere obige Frage (2)). Anhand dieser Überlegung erkennen wir die Wichtigkeit der komplexen Zahlen in der Quantenmechanik.12 Gl. (7.5) zeigt zusätzlich, dass die Wahrscheinlichkeit für eine allgemeine Wellenfunktion von Gebieten kleinerer Phase zu Gebieten größerer Phase “fließt”. In der Kodierung von Abbildung 4.5 heißt das z.B., dass die Wahrscheinlichkeitsdichte in gelben Gebieten zunimmt und in roten Gebieten abnimmt. Eine solche Situation ist in der gezeigten Simulation und für zwei feste Zeiten in Abbildung 7.2 dargestellt. Die Wahrscheinlichkeitsstromdichte und die Kontinuitätsgleichung sind formal wichtige Konzepte. Zusätzlich können sie oft dazu verwendet werden ein besseres anschauliches Verständnis der in Rechnungen gewonnenen Ergebnisse zu gewinnen und qualitative Vorhersagen der Zeitentwicklung einer Wellenfunktion zu machen ohne die Schrödingergleichung vollständig zu lösen. Abbildung 7.2: Zeitliche Entwicklung einer Wellenfunktion. Der Fluss der Wahrscheinlichkeit ist in Richtung der ansteigenden Phase. Die verwendete Kodierung der Wahrscheinlichkeitsdichte (als Funktionswert) und Phase (als Färbung unter der Kurve) ist in Abbildung 4.5 erklärt. Eine formale Lösung der Schrödingergleichung: Ist das betrachtete Potenzial V (x) zeitunabhängig, so ist der Hamiltonoperator zeitunabhängig. In diesem Fall lässt sich die Schrödingergleichung sofort formal lösen d |ψ(t)i = H |ψ(t)i dt ⇒ |ψ(t)i = e−iHt/~ |ψ(0)i . i~ Differenzieren entsprechend der Regeln für die Differentation eines parameterabhängigen Operators (hier exp (−iHt/~)) nach dem Parameter (hier t) zeigt, dass die rechte Seite der zweiten Zeile tatsächlich eine Lösung der Schrödingergleichung mit der durch |ψ(0)i gegebenen Anfangsbedingung ist. Allgemein gilt, dass für jedes zeitunabhängige H der obige Ausdruck eine formale Lösung liefert. 12 Ohne diese hätte man nur eine “Quantenstatik”. 82 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION Wir bezeichnen die Lösung als formal, da wir im Allgemeinen nicht in der Lage sein werden den Ausdruck |ψ(t)i = e−iHt/~ |ψ(0)i =: U (t) |ψ(0)i . (7.6) explizit auszuwerten. Dazu müssten wir alle Zustände |ϕn i := H n |ψ(0)i, n ∈ N0 , bestimmen können, die sich durch n-faches Anwenden des Hamiltonoperators auf den Anfangszustand ergeben.13 Wir werden gleich sehen, wie uns in diesem Zusammenhang die Spektraldarstellung des Hamiltonoperators weiterhelfen kann. In Gl. (7.6) haben wir den Zeitentwicklungsoperator U (t) definiert. Da H selbstadjungiert ist, ist U (t), wie man leicht nachrechnet, unitär:14 U † (t) = U −1 (t). Aus der Unitarität des Zeitentwicklungsoperators folgt sofort, dass ein zur Zeit t = 0 auf Eins normierter Zustand hψ(0) |ψ(0)i = 1 (Wahrscheinlichkeitsinterpretation!) auch zu Zeiten t 6= 0 auf Eins normiert ist15 hψ(t) |ψ(t)i = hψ(0)| eiHt/~ e−iHt/~ |ψ(0)i = hψ(0) |ψ(0)i = 1 . Im Kapitel 4 über Wellenpakete hatten wir diese Eigenschaft die Normiertheit der Wellenfunktion für alle Zeiten explizit gefordert und daraus etwas über die Fouriertransformierte der Wellenfunktion gelernt. Eine alternative Formulierung der Gl. (7.6) erhalten wir, wenn wir die Spektraldarstellung des Hamiltonoperators verwenden. Die Spektraldarstellung des Zeitentwicklungsoperators: Die Eigenzustände zum Hamiltonoperator H seien mit |E, νi bezeichnet. Wie lassen dabei sowohl kontinuierliche als auch diskrete Eigenwerte E,16 und Entartung zu. Wir nehmen an, dass der zusätzliche Index ν zusammen mit E die Eigenvektoren eindeutig charakterisiert, d.h. die |E, νi eine Basis eindeutig festlegen. Reicht dazu ein zusätzlicher diskreter oder kontinuierlicher Index ν nicht aus, so steht ν für einen Multiindex. Die Spektraldarstellung des selbstadjungierten Hamiltonoperators lautet dann Z Z X X E |E, νi hE, ν| . H= E ν Mit Gl. (5.14) ergibt sich daraus die Spektraldarstellung des Zeitentwicklungsoperators17 zu Z X Z X U (t) = e−iEt/~ |E, νi hE, ν| . E 13 ν P∞ Zur Erinnerung: exp (−iHt/~) = n=0 H n (−it/~)n /n!. Bei der Definition der Unitarität eines Operators auf einem unendlichdimensionalen Vektorraum muss man wie im Fall selbstadjungierter Operatoren auf den Definitionsbereich achten. Für Details verweisen wir auf die Literatur über Funktionalanalysis. 15 Ohne diese Eigenschaft, würde unsere Wahrscheinlichkeitsinterpretation wenig sinnvoll sein! 16 Womöglich sind sie sogar zum Teil diskret und zum Teil kontinuierlich. 17 Man kann sich sehr leicht davon überzeugen, dass für einen selbstadjungierten Operator A und eine Funktion f : R → C, die in einer Taylorreihe entwickelbar ist, die Definitionen der Funktion des Operators f (A) über die Spektraldarstellung Gl. (5.14) und die Taylorreihe äquivalent sind. 14 7.1. ALLGEMEINE KONZEPTE 83 Kennen wir alle Eigenvektoren |E, νi und Eigenwerte E von H, so ergibt sich |ψ(t)i als eine Linearkombination der Basisvektoren |E, νi mit Koeffizienten, die sich aus den Entwicklungskoeffizienten von |ψ(0)i nach der {|E, νi} Basis und Phasenfaktoren18 e−iEt/~ zusammensetzen Z X Z X |ψ(t)i = U (t) |ψ(0)i = e−iEt/~ hE, ν |ψ(0)i |E, νi . (7.7) E ν Es stellt sich also heraus, dass die Kenntnis aller Eigenwerte und Eigenvektoren des Hamiltonoperators bei der Bestimmung der Zeitentwicklung eines Quantensystems, d.h. der Lösung der zugehörigen Schrödingergleichung, extrem hilfreich sein kann. Kennen wir alle Eigenwerte und Eigenvektoren des Hamiltonoperators, so benötigen wir zur Bestimmung von |ψ(t)i nur noch alle Einträge hE, ν |ψ(0)i des Spaltenvektors, der |ψ(0)i in der {|E, νi} Basis darstellt. Die zeitunabhängige Schrödingergleichung: Starten wir bei t = 0 in einem der Eigenzustände des Hamiltonoperators |ψ(0)i = |E, νi, so ergibt sich aus Gl. (7.7) Z X Z X 0 e−iE t/~ hE 0 , ν 0 |E, νi |E 0 , ν 0 i = e−iEt/~ |E, νi , |ψ(t)i = E0 ν0 da die Eigenzustände |E, νi paarweise orthogonal sind.19 Die Zeitabhängigkeit von Eigenzuständen reduziert sich somit auf eine reine Phase. Die Eigenwertgleichung des Hamiltonoperators lautet H |E, νi = E |E, νi . (7.8) Sie ergibt sich aus der allgemeinen Schrödingergleichung i~ d |ψ(t)i = H |ψ(t)i dt durch Einsetzen der obigen Lösung |ψ(t)i = e−iEt/~ |E, νi, bei der das System so präpariert wird, dass es sich zur Zeit t = 0 in einem Eigenzustand zu H befindet. Man spricht im Zusammenhang mit der Eigenwertgleichung (7.8) für den Hamiltonoperator daher auch von der zeitunabhängigen (oder stationären) Schrödingergleichung. Gl. (7.7) verschiebt das Problem der Lösung einer partiellen Differentialgleichung auf die Bestimmung aller Eigenwerte und Eigenvektoren von H. Für ein gegebenes Potenzial V (x) lassen sich auch diese im Allgemeinen nicht vollständig analytisch (sondern “nur” numerisch) angeben. Ein Beispiel: Das kräftefreie Teilchen. Der Hamiltonoperator für das p̂2 kräftefreie Teilchen ist durch 2m gegeben. Aus der Spektraldarstellung des Impulsoperators Gl. (5.10) kennen wir alle Eigenzustände dieses Operators. Es sind 18 Hier bekommt jeder Summand eine unterschiedliche Phase. Im Gegensatz zu einer globalen Phase, die keinen Einfluss auf Messwerte hat, sind solche relativen Phasen extrem wichtig! 19 Im diskreten Fall mit einem Kronecker-δ, im kontinuierlichen Fall mit einer δ-Funktion. 84 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION die uneigentlichen Impulszustände |pi, p ∈ R H |pi = p̂2 p2 |pi = |pi . 2m 2m Die Eigenwerte p2 /(2m) sind alle positiv, kontinuierlich (da p ∈ R) und zweifach entartet (±p liefern identische Eigenwerte zu H). Keiner der Eigenvektoren ist quadratintegrabel.20 Wir haben hier somit die Situation eines rein kontinuierlichen Spektrums.21 Als zusätzlichen Index ν können wir die des Richtung E p √ Impulses ν = ± wählen. Wir definieren dann |E, +i := m/pE pE = + 2mE E p √ und |E, −i := m/pE pE = − 2mE . Die Spektraldarstellung des Hamiltonoperators lautet Z H= 0 ∞ X Z ∞ E |E, νi hE, ν| dE = −∞ ν=± p2 |pi hp| dp 2m und die des Zeitentwicklungsoperators Z U (t) = 0 ∞ X −iEt/~ e ν=± ∞ p2 exp −i |E, νi hE, ν| dE = t/~ |pi hp| dp . 2m −∞ Z Starten wir jetzt bei t = 0 mit einem quadratintegrablen, auf Eins normierten Anfangszustand |ψ(0)i, so ergibt sich in der Ortsdarstellung ψ(x, t) = hx |ψ(t)i = hx| U (t) |ψ(0)i Z ∞X = e−iEt/~ hE, ν |ψ(0)i hx |E, νi dE 0 ν=± ∞ p2 = exp −i t/~ hp| ψ(0)i hx |pi dp 2m −∞ Z ∞ 1 p2 = √ exp −i t/~ ψ̃(p) exp (ipx/~) dp , 2m 2π~ −∞ Z wobei wir Gln. (5.7) und (5.12) verwendet haben und ψ̃(p) die Fouriertransformierte der Wellenfunktion zur Zeit t = 0 bezeichnet. Wir reproduzieren somit vollständig unseren “Wellenpaketansatz” aus Gl. (4.12). 20 Es handelt sich also nicht um die speziellen Lösungen der Schrödingergleichung, nach denen wir im Punkt (2) oben gefragt haben. 21 Wir bezeichnen die Menge der Eigenwerte als das Spektrum, auch wenn zu ihnen uneigentliche (nicht-quadratintegrable) Eigenvektoren gehören. Das ist mathematisch nicht sehr präzise, wie Sie der Literatur über Funktionalanalysis entnehmen können. 7.2. STATIONÄRE SCHRÖDINGERGLEICHUNG MIT POTENZIAL 7.2 85 Stationäre Schrödingergleichung mit Potenzial Die zeitunabhängige Schrödingergleichung mit beschränktem V (x): Die zeitunabhängige Schrödingergleichung (d.h. das Eigenwertproblem) in Ortsdard2 00 stellung (ψE,ν (x) = dx 2 ψE,ν (x)) − ~2 00 ψ (x) + V (x)ψE,ν (x) = EψE,ν (x) , 2m E,ν mit ψE,ν (x) := hx |E, νi ist eine gewöhnliche lineare Differentialgleichung 2. Ordnung. Betrachten wir hier nur beschränkte Potenziale V (x), bei denen |V (x)| ≤ C, für alle x ∈ R, die bis auf endlich viele Stellen (an denen ein Sprung endlicher Höhe vorliegen kann, wie z.B. bei einem Kastenpotenzial) stetig sind und einen kompakten Träger haben. Aus der Theorie der gewöhnlichen Differentialgleichungen folgt, dass es für jedes E zwei linearunabhängige Lösungen ψE,ν (x), ν = 1, 2, gibt. Sie sind stetig und besitzen eine stetige Ableitung. Letzteres gilt auch an Punkten, an denen V (x) einen endlichen Sprung macht. Um dieses zu zeigen, integrieren wir die Differentialgleichung formal um eine Sprungstelle x0 von V (x) Z x0 +ε 00 0 0 ψE,ν (x)dx = ψE,ν (x0 + ε) − ψE,ν (x0 − ε) x0 −ε Z 2m x0 +ε [V (x) − E] ψE,ν (x)dx . = ~2 x0 −ε Da V (x) als beschränkt angenommen wurde, verschwindet die zweite Zeile der 0 0 (x0 − 0), also die (x0 + 0) = ψE,ν Gleichung im Limes ε → 0 und wir finden ψE,ν Stetigkeit der Ableitung selbst an Sprungstellen des Potenzials. Um zu zeigen, dass nicht jede mathematische Lösung der Differentialgleichung eine physikalisch sinnvolle Wellenfunktion liefert (nach Multiplikation mit exp (−iEt/~)) betrachten wir nocheinmal das Beispiel eines kräftefreien Teilchens mit V (x) = 0, für alle x ∈ R. Wie man sehr leicht durch p Einsetzen zeigt, bilden die Funktionen ψE,± (x) = c± exp (±αE x), mit αE := 2m(−E)/~, für E < 0 die linearunabhängigen Lösungen. c± ∈ C bezeichnet eine freie Konstante. Beide Lösungen sind aufgrund ihres exponentiellen Anwachsens in x → ±∞ Richtung nicht quadratintegrabel.22 Da sie für betragsmäßig große Argumente noch nichteinmal beschränkt sind, bilden sie auch keine uneigentlichen Zustände (wie die Ortsund Impulszustände), um die wir den Hilbertraum L2 (R) ja bereits erweitert haben. Die beiden Lösungen stellen also keine physikalisch sinnvollen Lösungen dar. Solche gibt es, wie wir bereits aus der obigen Diskussion des Beispiels wissen, nur für √ positive Energien. Für E > 0 bilden ψE,± (x) = c± exp (±ikE x), mit kE := 2mE/~ > 0, zwei linearunabhängige Lösungen. Dieses sind die uns 22 Die noch zu berücksichtigende reine Phase exp (−iEt/~) ändert daran natürlich nichts! 86 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION bereits bekannten uneigentlichen Impulszustände in der Ortsdarstellung (wenn √ wir c± = 1/ 2π~ wählen). Alternativ hätten wir auch die beiden reellen, linearunabhängigen Lösungen ψE,1 (x) = c1 cos (kE x) und ψE,2 (x) = c2 sin (kE x) wählen können. Für reelle Potenziale V (x) gilt, dass mit ψE (x) auch ψE∗ (x) eine Lösung zur selben Energie ist. Damit sind, wie oben beispielhaft gesehen, wegen der Linearität der zeitunabhängigen Schrödingergleichung auch Re[ψE (x)] und Im[ψE (x)] Lösungen zur Energie E. Wir können uns daher immer auf reelle Lösungen beschränken, es ist aber oft praktisch mit den komplexen ebenen Wellen exp (±ikE x) zu rechnen. V(x) Vmax 1 2 3 a b x Vmin <0 Abbildung 7.3: Ein beschränktes Potenzial V (x) mit kompaktem Träger, das bis auf endlich viele Sprungstellen stetig ist. Es bietet sich dabei an, die drei Bereiche 1,2, und 3 zu unterscheiden. Betrachten wir jetzt das Eigenwertproblem in einem Potenzial V (x) wie in Abbildung 7.3 skizziert. In den mit 1 und 3 bezeichneten Bereichen, soll das Potenzial verschwinden. (1) E < 0: Analysieren wir zunächst den Fall E < 0. Wir werden dabei wie folgt vorgehen: Für ein vorgegebenes E < 0 werden wir physikalische Lösungen der zeitunabhängigen Schrödingergleichung in den drei Teilbereichen bestimmen.23 Aus der Theorie der gewöhnlichen Differentialgleichungen wissen wir, dass die aus den Lösungen in den drei Teilgebieten zusammengesetzte Gesamtlösung stetig ist und eine stetige Ableitung besitzt. Dies gilt auch an den Anschlusspunkten bei x = a und x = b. Mit Hilfe der an diesen Punkten resultierenden Anschlussbedingungen, werden wir dann zeigen können, dass es nicht für jedes E < 0 eine physikalische Lösung der zeitunabhängigen Schrödingergleichung im ganzen 23 Aus der Theorie der gewöhnlichen Differentialgleichungen folgt, dass es auch in den Teilbereichen jeweils zwei linearunabhängige stetige Lösungen, mit stetiger Ableitung gibt. Erneut kommen nicht unbedingt beide Lösungen als physikalische Lösungen in Frage. 7.2. STATIONÄRE SCHRÖDINGERGLEICHUNG MIT POTENZIAL 87 R gibt. Im Bereich 1 kommt aus physikalischen Gründen (siehe p oben) nur die (1) (1) (1) Lösung ψE (x) = c̃ exp (αE x) = c exp (αE [x − a]), mit αE := 2m(−E)/~, in Frage. O.b.d.A. wählen wir c(1) > 0 und verwenden c(1) später zur Normierung der Gesamtwellenfunktion.24 Im Gebiet 2 existieren zwei linearunabhängige (2) (2) (2) Lösungen ψE,± (x). Die beiden freien Konstanten c+ und c− in (2) (2) (2) (2) (2) ψE (x) = c+ ψE,+ (x) + c− ψE,− (x) wählen wir so, dass die Gesamtwellenfunktion ψE (x) und ihre Ableitung ψE0 (x) bei x = a stetig sind (1) (2) : c(1) = c+ ψE,+ (a) + c− ψE,− (a) (1)0 (2)0 : c(1) αE = c+ ψE,+ (a) + c− ψE,− (a) . ψE (a) = ψE (a) ψE (a) = ψE (a) (2) (2) (2) (2) (2)0 (2) (2) (2)0 (2) (2) Aus diesen Forderungen ergeben sich zwei lineare Gleichungen für c+ und c− . In Matrixschreibweise gilt ! ! (1) (2) (2) (2) ψE,+ (a) ψE,− (a) c c+ = . (2) (2)0 (2)0 αE c(1) c− ψE,+ (a) ψE,− (a) Dieses Gleichungssystem ist genau dann eindeutig lösbar, wenn die Determinante der Matrix auf der rechten Seite nicht verschwindet. Dieses wird durch einen Satz der allgemeinen Theorie linearer Differentialgleichungen sichergestellt. Nach ihm ist die Wronskideterminante ψ+ (x) ψ− (x) , W (x) := det 0 0 (x) (x) ψ− ψ+ die aus zwei linearunabhängigen Lösungen ψ± (x) einer allgemeinen linearen, homogenen Differentialgleichung zweiter Ordnung ohne Summanden, die die ers0 (x) enthalten, gebildet wird, von x unabhängig und von Null te Ableitung ψ± (2) (2) 25 verschieden. Somit liegen die beiden Konstanten c+ und c− eindeutig fest. (2) (2)0 Als Konsequenz liegen auch die Werte von ψE (x) und ψE (x) bei x = b eindeutig fest. Im Gebiet 3 gibt es wieder nur eine physikalisch sinnvolle Lösung (3) ψE (x) = c̃(3) exp (−αE x) = c(3) exp (−αE [x − b]). Um einen stetigen Anschluss (3) (3)0 von ψE (x) und ψE (x) zu ermöglichen haben wir somit nur noch eine freie Konstante c(3) zur Verfügung. Daher wird der stetige Anschluss (2) (3) : c+ ψE,+ (b) + c− ψE,− (b) = c(3) (2)0 (3)0 : c+ ψE,+ (b) + c− ψE,− (b) = −αE c(3) ψE (b) = ψE (b) ψE (b) = ψE (b) 24 (2) (2) (2) (2) (2) (2)0 (2) (2)0 Damit ist c(1) nicht mehr frei wählbar! Das zeigt man in unserem Fall sehr leicht, in dem man die Determinante explizit durch die ψE,± (x) ausdrückt, nach x differenziert und die zeitunabhängige Schrödingergleichung verwendet. 25 88 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION für beliebige Energien E < 0 nicht möglich sein. Die Energien E0 < E1 < . . . < EM < 0 für die der stetige Anschluss gelingt, sind dann die diskreten Eigenwerte des Hamiltonoperators. Die dazugehörigen Wellenfunktionen sind die Eigenvektoren in der Ortsdarstellung. Diese Funktionen bezeichnet man auch als Eigenfunktionen. Da die Wellenfunktionen in den Gebieten 1 und 3 exponentiell abfallen, sind sie im Wesentlichen auf das Potenzialgebiet 2 beschränkt und quadratintegrabel. Man spricht daher auch von gebundenen Zuständen. Im Beispiel eines beschränkten Potenzials mit kompaktem Träger ist die Zahl der gebundenen Zustände (diskreten Eigenwerte) endlich. Für allgemeine Potenziale ist die Menge der gebundenen Zustände zumindest abzählbar (siehe das Beispiel des harmonischen Oszillators weiter unten bzw. in den Übungen). Aus der Konstruktion des Eigenvektors folgt, dass alle Ej nicht entartet sind. Den Eigenzustand zur kleinsten Energie E0 bezeichnet man als Grundzustand, die zugehörige Energie als Grundzustandsenergie. Der Eigenzustand zur Energie E1 heißt erster angeregter Zustand. Entsprechend setzt sich die Namensgebung für die höheren Ej fort. Ein klassisches Teilchen, welches sich in dem hier diskutierten Potenzial befindet, hat die minimale Gesamtenergie Vmin . Die quantenmechanische Grundzustandsenergie ist größer als die minimale klassische Energie. Anschaulich lässt sich das durch die nicht verschwindenden Wahrscheinlichkeiten erklären, das Teilchen in den klassisch energetisch verbotenen Bereichen zu finden. Die Energiedifferenz E0 − Vmin > 0 bezeichnet man als Nullpunktsenergie. Um zu zeigen, dass E0 > Vmin gilt betrachten wir nocheinmal die Eigenwertgleichung ψE00 (x) = 2m [V (x) − E] ψE (x) . ~2 Da ψE (a) = c(1) > 0 gilt, ist für E ≤ Vmin die zweite Ableitung von ψE (x) im Gebiet 2 überall positiv oder Null. Ausgehend von x = a wird die Funktion nach rechts also immer steiler bzw. bleibt gleich steil. Die resultierende Gesamtfunktion kann dann keine überall stetige Ableitung haben, da sie im Gebiet 3 exponentiell abfällt.26 Damit kann es keine physikalisch sinnvolle Lösung für E ≤ Vmin geben. Allgemein gilt der so genannte Knotensatz: Die n-te Eigenfunktion ψEn (x) hat n Nullstellen, wobei die beiden “Nullstellen” bei x → ±∞ nicht mitgezählt werden. Wir werden diesen Satz hier nicht beweisen. Es gilt weiterhin die Aussage, dass es im hier betrachteten eindimensionalen Fall bereits für ein beliebig schwaches (anziehendes) Potenzial mit Vmin < 0 mindestens einen gebundenen Zustand gibt. Den Beweis dieser Aussage verschieben wir auf die Übungen. 26 Anders ausgedrückt: Da ψE (a) = c(1) > 0 gilt, ist für E ≤ Vmin die zweite Ableitung von ψE (x) im Gebiet 2 überall positiv oder Null. Um bei x = b einen stetigen Anschluss der Ableitung von ψE (x) hinzubekommen, müsste die Krümmung von ψE (x) aber irgendwo in [a, b] zur x-Achse hin erfolgen. 7.2. STATIONÄRE SCHRÖDINGERGLEICHUNG MIT POTENZIAL 89 V(x) 1 2 3 b x −V0 <0 Abbildung 7.4: Der Potenzialtopf endlicher Tiefe. Die Beobachtung, dass es in Potenzialen quadratintegrable Eigenzustände zu H mit diskreten Eigenwerten (man nennt sie auch Eigenenergien) gibt, ist extrem wichtig zum Verständnis einer Vielzahl experimenteller Beobachtungen.27 Zum Beispiel kann man die Spektren von Atomen und Molekülen durch “von Außen” induzierte Übergänge28 zwischen diskreten Energieeigenwerten erklären. Am Beispiel des Wasserstoffatoms werden wir dieses später im Detail erläutern. Als Anwendung des gerade entwickelten Formalismus zur Bestimmung der gebundenen Zustände in einem beschränkten, bis auf endlich viele Sprungstellen stetigen Potenzial V (x) mit kompaktem Träger, betrachten wir hier das Standartbeispiel des in Abbildung 7.4 dargestellten “Potenzialtopfs” endlicher Tiefe −V0 < 0 für 0 < x < b V (x) = 0 sonst . In den Gebieten 1 und 3 können wir die oben gegebenen exponentiell abfallenden (1) (3) Lösungen ψE (x) = c(1) exp (αE x) und ψE (x) = c(3) exp (−αE [x − b]) verwenden. Im Gebiet 2 lautet die zeitunabhängige Schrödingergleichung − ~2 (2)00 (2) ψE,ν (x) = (E + V0 )ψE,ν (x) , 2m (2) (2) mit den Lösungen ψE,+ (x) = cos (k̃E x) und ψE,− (x) = sin (k̃E x), mit k̃E := p 2m(E + V0 )/~, für E > −V0 . Die Gleichung für die Anschlussbedingungen bei x = 0 lautet damit ! (2) 1 0 c+ 1 (1) =c . (2) αE 0 k̃E c− 27 Auch in drei Raumdimensionen gibt es solche gebundenen Zustände mit diskreten Eigenwerten. 28 Wie werden später genauer spezifizieren, was wir mit “von Außen” meinen. 90 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION Als Lösung ergibt sich (2) c+ (2) c− ! =c (1) 1 αE /k̃E . Die Anschlussbedingungen bei x = b ergeben sich zu (2) ! 1 =c −αE 1 1 cos (k̃E b) sin (k̃E b) (3) (1) =c c ⇒ −αE αE /k̃E −k̃E sin (k̃E b) k̃E cos (k̃E b) ! cos (k̃E b) + αk̃ E sin (k̃E b) −1 0 c(1) E ⇔ = . (3) 0 c −k̃E sin (k̃E b) + αE cos (k̃E b) αE cos (k̃E b) sin (k̃E b) −k̃E sin (k̃E b) k̃E cos (k̃E b) c+ (2) c− (3) Eine Lösung mit nicht verschwindenden c(1) und c(3) gibt es nur, wenn die Determinante der Matrix auf der linken Seite der letzten Zeile verschwindet, also h i αE cos (k̃E b) + sin (k̃E b) αE + −k̃E sin (k̃E b) + αE cos (k̃E b) = 0 k̃E 2 ⇔ k̃E2 − αE sin (k̃E b) − 2αE k̃E cos (k̃E b) = 0 gilt. Es sollte klar sein, dass diese Gleichung nicht für jedes E < 0 erfüllt ist. Sie bildet vielmehr eine (nichtlineare) Bestimmungsgleichung für die diskreten Eigenwerte En < 0, n = 0, 1, . . . , M . In den Übungen werden Sie diese Gleichung weiter analysieren und die En < 0 näherungsweise bestimmen. (2) E > 0: Wir betrachten nocheinmal die Situation mit einem allgemeinen beschränkten, bis auf endlich viele Sprungstellen stetigen Potenzial V (x) mit kompaktem Träger (siehe z.B. Abbildung 7.3) konzentrieren uns jetzt jedoch auf E > 0. Wie gehabt konstruieren wir die Lösung in dem wir die zeitunabhängige Schrödingergleichung in den drei Teilgebieten betrachten. In jedem der drei Gebiete kann die allgemeine Lösung als Linearkombination zweier linearunabhängiger reeller Funktionen geschrieben werden. In den Gebieten 1 und 3 gilt (1/3) ψE mit kE = wie oben (1/3) (x) = c+ (1/3) cos (kE x) + c− sin (kE x) , (7.9) √ (1/3) 2mE/~. Dabei können die cν komplex sein. Im Gebiet 2 setzen wir (2) (2) (2) (2) (2) ψE (x) = c+ ψE,+ (x) + c− ψE,− (x) , 7.2. STATIONÄRE SCHRÖDINGERGLEICHUNG MIT POTENZIAL (2) (2) 91 (2) mit c+ , c− ∈ C und den reellen linear unabhängigen Lösungen ψE,± (x) an. Die Anschlussbedingung bei x = a ergibt sich zu ! ! ! (2) (2) (1) (2) ψE,+ (a) ψE,− (a) cos (kE a) sin (kE a) c+ c+ = (1) (2) (2)0 (2)0 −kE sin (kE a) kE cos (kE a) c− c− ψE,+ (a) ψE,− (a) ⇔ F (a)~c (1) = G(a)~c (2) ⇔ ~c (2) = G−1 (a)F (a)~c (1) , (7.10) wobei wir von der ersten zur zweiten Zeile die reellen Matrizen F und G und die Vektoren ~c (1) und ~c (2) eingeführt haben. Es ist offensichtlich, wie sie definiert sind. Wir haben dabei angenommen, dass die Matrix G(x) bei x = a invertierbar ist. Die Existenz der Inversen von G(a) wird dadurch sichergestellt, dass die Wronskideterminante (siehe oben) von Null verschieden ist. Aufgrund der Unabhängigkeit der Wronskideterminanten von x sind die Matrizen F (x) und G(x) für alle x ∈ R invertierbar. Bei x = b lautet die Anschlussbedingung ! ! ! (2) (2) (3) (2) ψE,+ (b) ψE,− (b) cos (kE b) sin (kE b) c+ c+ = (3) (2) (2)0 (2)0 −kE sin (kE b) kE cos (kE b) c− c− ψE,+ (b) ψE,− (b) ⇔ F (b)~c (3) = G(b)~c (2) . Setzen wir jetzt in die Gleichung der letzten Zeile ~c (2) aus Gl. (7.10) ein und lösen (1) (3) nach ~c (3) auf, so folgt eine Beziehung zwischen den cν und den cν ~c (3) = F −1 (b)G(b)G−1 (a)F (a)~c (1) =: M~c (1) . (7.11) Aus den Regeln im Umgang mit der Determinanten von Produkten von Matrizen und der Unabhängigkeit der Wronskideterminanten von x folgt det M = det G(b) det F (a) =1. det G(a) det F (b) Damit gibt es für jedes E > 0 und vorgegebene ~c (1) einen eindeutigen Vektor ~c (3) . Das Spektrum für positive E ist also kontinuierlich. Bereits das Verhalten der allgemeinen Lösung ψE (x) in den Gebieten 1 und 3 Gl. (7.9) zeigt, dass die zugehörigen Eigenfunktionen des Hamiltonoperators nicht normierbar sind (ähnlich wie die Impulszustände - die ebenen Wellen). Wie bei der Konstruktion normierbarer Lösungen der kräftefreien Schrödingergleichung, kann man sie jedoch dazu verwenden normierbare Wellenpakete zu bilden, die die Schrödingergleichung lösen.29 29 Zur Erinnerung: Da die Schrödingergleichung linear ist, bildet jede Linearkombination von Lösungen ebenfalls eine Lösung. 92 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION Um die Streuung eines einfallenden Wellenpakets am Potenzialbereich zu beschreiben ist es günstiger die Lösungen in den Gebieten 1 und 3 etwas anders als in Gl. (7.9) anzusetzen30 (A, B ∈ C) (1) ψE (x) = eikE x + Ae−ikE x = (1 + A) cos (kE x) + i(1 − A) sin (kE x) (3) ψE (x) = BeikE x = B cos (kE x) + iB sin (kE x) . Dieser Ansatz ist an der Idee orientiert, dass eine Welle (ein Wellenpaket) von links einfällt (exp [ikE x], kE > 0) und dann zum Teil reflektiert (A exp [−ikE x]) und zum Teil transmittiert (B exp [ikE x]) wird. O.B.d.A. haben wir den Vorfaktor der einfallenden Welle auf Eins gesetzt. Damit sind A und B automatisch im Verhältnis zum Vorfaktor der einfallenden Welle gemessen.31 Gl. (7.11) lautet damit B M1,1 M1,2 1+A = iB M2,1 M2,2 i(1 − A) M2,2 −M1,2 1 (1 + A)/B ⇔ = . −M2,1 M1,1 i i(1 − A)/B Bei der Invertierung von M haben wir dabei det M = 1 verwendet. Ausgeschrieben liefert diese Matrixrelation zwei Gleichungen. Addiert und subtrahiert man diese, so folgen die Relationen 1 1 = [M1,1 + M2,2 + i(M2,1 − M1,2 )] B 2 A 1 = [M2,2 − M1,1 − i(M1,2 + M2,1 )] . B 2 Damit sind A und B durch die (unbekannten, vom Potenzial im Gebiet 2 abhängenden) reellen Matrixelemente Mi,j bestimmt.32 Aus det M = 1 folgt 2 2 1 − A = 1 . B B Bezeichnet man R := |A|2 und T := |B|2 , so folgt R+T =1. 30 (7.12) Ein Vergleich mit Gl. (7.9) zeigt, dass es sich bei diesem Ansatz nicht um den allgemeinst möglichen handelt. Dieser würde erst dadurch zustandekommen, dass man gleichzeitig eine von rechts einfallenden Welle und ihre Streuwellen betrachtet. 31 D.h. |A| und |B| sind im Verhältnis zur Amplitude der einfallenden Welle gemessen und die Phasen von A und B als Differenz zur Phase der einfallenden Welle. 32 Beispiele dazu, wie A und B über die Matrixelemente Mi,j von den Potenzialparametern abhängen, werden Sie in den Übungen kennen lernen. 7.2. STATIONÄRE SCHRÖDINGERGLEICHUNG MIT POTENZIAL 93 Die Amplituden A und B hängen von der jeweils gewählten Energie E bzw. kE ab.33 Daher schreiben wir besser R = R(kE ) und T = T (kE ). R(kE ) bezeichnet man als den Reflexionskoeffizienten und T (kE ) als den Transmissionskoeffizienten (zu gegebener Wellenzahl kE ). Wir können bereits erahnen, dass diese Nomenklatur sinnvoll ist, werden es aber noch genauer verstehen können, wenn wir Wellenpakete aus den “Streufunktionen” ikE x + A(kE )e−ikE x x<a e (l) (2) ψE (x) = ψE (x) a≤x≤b B(kE )eikE x x>b bilden.34 Den oberen Index l haben wir dabei eingeführt, um uns daran zu erinnern, dass wir eine von links einfallende Welle betrachten. Völlig analog kann man Wellenpakete aus von rechts einfallenden Wellen bilden. Wir bilden ein Wellenpaket Z ∞ ~k 2 (l) (l) t dk , f (k)ψE(k) (x) exp −i ψ (x, t) := 2m 0 2 2 k . Die Funktion f (k) bezeichnet die Gewichtsfunktion. Sie muss mit E(k) = ~2m eine Normierungsbedingung erfüllen (siehe auch Kapitel 4), die wir weiter unten bestimmen werden. Das Wellenpaket ist Lösung der zeitabhängigen Schrödinger2 (l) t) Lösungen sind. Wir nehmen wieder an, gleichung, da die ψE(k) (x) exp (−i ~k 2m dass die Gewichtsfunktion f (k) um einen Wert k0 > 0 herum konzentriert ist. Der mittlere Impuls des einfallenden Wellenpakets ergibt sich dann erneut zu p0 = ~k0 (siehe Kapitel 4 und unten). Für k < 0 soll f (k) so klein sein, dass der Fehler den wir machen wenn wir das k-Integral bis −∞ ausdehnen vernachlässigbar ist. Betrachten wir die resultierende Wellenfunktion zunächst links vom Potenzial, d.h. für x < a Z ∞ ikx ~k 2 (l) −ikx ψ (x, t) = Θ(a − x) f (k) e + A(k)e exp −i t dk 2m −∞ = Θ(a − x) [ψ1 (x, t) + ψ2 (x, t)] . (7.13) Θ(x) bezeichnet die Stufenfunktion 0 für x < 0 Θ(x) := 1 für x ≥ 0 33 Da jedes E > 0 eine Lösung liefert, liefert auch jedes kE > 0 eine Lösung. Dabei betrachten wir hier nur kE > 0, da die Welle von links einfallen soll. Wir können daher statt kE auch einfach k schreiben. 34 Genau genommen können wir noch nicht von Transmission und Reflexion sprechen, da die bisher bestimmten nicht normierbaren Lösungen der Schrödingergleichung nur eine bei der Erwartungswertbildung irrelevante Zeitabhängigkeit exp (−iEt/~) haben. Sie sind völlig äquivalent zu den ebenen Wellen des kräftefreien Teilchens. 94 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION und35 ∞ ~k 2 f (k)e exp −i ψ1 (x, t) := t dk 2m −∞ ! Z ∞ 2 ~k02 ~ k̃ = exp i k0 x − t f (k̃ + k0 )eik̃(x−v0 t) exp −i t dk̃ , 2m 2m −∞ | {z } Z ikx =:φt (x−v0 t) Z ∞ ψ2 (x, t) := −ikx f (k)A(k)e −∞ ~k 2 exp −i t dk 2m ! Z ∞ 2 k̃ ~ ~k02 t f (k̃ + k0 )A(k̃ + k0 )eik̃(−x−v0 t) exp −i t dk̃ = exp i −k0 x − 2m 2m −∞ ! Z ∞ 2 ~k02 ~ k̃ ≈ exp i −k0 x − t A(k0 ) f (k̃ + k0 )eik̃(−x−v0 t) exp −i t dk̃ . 2m 2m −∞ Dabei gilt wieder v0 = ~k0 /m, mit der mittleren Geschwindigkeit v0 (siehe Kapitel 4 und unten) und wir haben die Funktion φt (y) definiert. Von der vorletzten zur letzten Zeile haben wir angenommen, dass A(k) sich über das k-Intervall, in dem f (k) nicht verschwindet nur sehr schwach verändert. Allgemeiner kann man A(k) in einer Taylorreihe um k0 herum entwickeln und weitere Terme der Entwicklung mitnehmen.36 Mit dieser Näherung erhalten wir ~k02 t φt (x − v0 t) ψ1 (x, t) = exp i k0 x − 2m ~k02 ψ2 (x, t) ≈ A(k0 ) exp i −k0 x − t φt (−x − v0 t) . 2m Wählt man die Funktion f (k) reell, so ist φt (y) um y = 0 herum lokalisiert.37 Für hinreichend negative Zeiten t 0, sind somit ψ1 um x ≈ v0 t 0 und ψ2 um x ≈ −v0 t 0 herum lokalisiert. Für die Wahrscheinlichkeitsdichte ergibt sich für x < a38 |ψ (l) (x, t)|2 = Θ(a − x) |ψ1 (x, t)|2 + |ψ2 (x, t)|2 + ψ1∗ (x, t)ψ2 (x, t) + c.c. . Aufgrund der Θ-Funktion trägt ψ2 (x, t) für t 0 praktisch nicht bei und die Wahrscheinlichkeitsdichte ist durch |ψ1 (x, t)|2 gegeben. Es ergibt sich das von 35 Damit beim Übergang vom Integral über k, zum Integral über k̃ keine Änderung der unteren Integrationsgrenze auftritt, benötigen wir −∞ als untere Grenze. 36 Hier berücksichtigen wir nur den führenden Term dieser Entwicklung. 37 Siehe das Beispiel des Gaußschen Wellenpakets mit x0 = 0. 38 Wir führen dabei die Bezeichnung “c.c.” ein, die für “complex conjugate”, also das Konjugiertkomplexe, steht. 7.2. STATIONÄRE SCHRÖDINGERGLEICHUNG MIT POTENZIAL 95 links mit mittlerem Impuls ~k0 und mittlerer Geschwindigkeit v0 einlaufende Wellenpaket. Wenn das Wellenpaket den Potenzialbereich erreicht, beginnt auch ψ2 (x, t) einen signifikanten Beitrag für x < a zu haben. Die Interferenzterme ψ1∗ (x, t)ψ2 (x, t) und ψ1 (x, t)ψ2∗ (x, t) führen dann zu den in Abbildung 7.1 und der gezeigten Simulation sichtbaren starken Oszillationen in der Wahrscheinlichkeitsdichte. Für sehr große Zeiten t 0 ist ψ1 (x, t) rechts vom Potenzialbereich lokalisiert und ψ2 (x, t) links. In diesem Fall trägt praktisch nur ψ2 (x, t) bei und die Wahrscheinlichkeitsdichte für x < a ist durch das reflektierte Wellenpaket beschrieben. Eine völlig analoge Überlegung können wir für x > b anstellen Z ∞ ~k 2 ikx (l) t dk f (k)B(k)e exp −i ψ (x, t) = Θ(x − b) 2m −∞ ≈ Θ(x − b)B(k0 )ψ1 (x, t) . Für t 0 ist |ψ (l) (x, t)|2 für x > b praktisch Null. Für t 0 ist die Wahrscheinlichkeitsdichte rechts vom Potenzialbereich durch das ungestreute Wellenpaket |ψ1 (x, t)|2 mit einer um |B(k0 )|2 = T (k0 ) reduzierten Amplitude gegeben. Da es rechts vom Potenzialbereich auch direkt bei der Streuung keine Interferenzterme gibt, treten für x > b keine Oszillationen in der Wahrscheinlichkeitsdichte auf. Für t 0 ist die gesamte Wahrscheinlichkeitsdichte |ψ (l) (x, t)|2 durch das von links einfallende um x ≈ v0 t zentrierte Wellenpaket mit Wahrscheinlichkeitsdichte |ψ1 (x, t)|2 gegeben. Da ψ (l) (x, t) zu allen Zeiten auf Eins normiert ist (Wahrscheinlichkeitsinterpretation), folgt für t 0 Z ∞ Z 2 ∞ |φt (x − v0 t)|2 dx |ψ1 (x, t)| dx = −∞ Z−∞ ∞ = |φt (y)|2 dy = 1 , −∞ was eine Forderung an f (k) darstellt (siehe Kapitel 4) da ! 2 ~ k̃ t dk̃ . φt (y) = f (k̃ + k0 )eik̃y exp −i 2m −∞ Z ∞ In völliger Analogie zu Gl. (4.13) muss gelten Z ∞ |f (k)|2 dk = −∞ 1 . 2π Ist diese Bedingung erfüllt, so gilt Z ∞ |φt (y)|2 dy = 1 −∞ 96 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION für alle t ∈ R und nicht nur im Limes t → −∞. Diese Eigenschaft werden wir im Folgenden benutzen. Die Wahrscheinlichkeit für Reflexion ist durch Ra R∞ limt→∞ −∞ |ψ (l) (x, t)|2 dx limt→∞ −∞ |ψ2 (x, t)|2 dx Ra R∞ wR := = limt→−∞ −∞ |ψ (l) (x, t)|2 dx limt→−∞ −∞ |ψ1 (x, t)|2 dx R∞ limt→∞ −∞ |φt (−x − v0 t)|2 dx 2 R∞ ≈ |A(k0 )| limt→−∞ −∞ |φt (x − v0 t)|2 dx R∞ lim |φt (y)|2 dy t→∞ −∞ 2 R∞ = |A(k0 )| limt→−∞ −∞ |φt (y)|2 dy = |A(k0 )|2 = R(k0 ) gegeben. Diese Überlegung rechtfertigt nun vollständig den Begriff Reflexionskoeffizient für R(k). Die Transmissionswahrscheinlichkeit ist entsprechend R∞ R∞ limt→∞ −∞ |ψ1 (x, t)|2 dx limt→∞ b |ψ (l) (x, t)|2 dx 2 Ra R∞ ≈ |B(k0 )| wT := limt→−∞ −∞ |ψ (l) (x, t)|2 dx limt→−∞ −∞ |ψ1 (x, t)|2 dx R∞ lim |φt (x − v0 t)|2 dx t→∞ −∞ 2 R∞ = |B(k0 )| limt→−∞ −∞ |φt (x − v0 t)|2 dx R∞ lim |φt (y)|2 dy t→∞ R−∞ = |B(k0 )|2 ∞ limt→−∞ −∞ |φt (y)|2 dy = |B(k0 )|2 = T (k0 ) , d.h. durch den Transmissionskoeffizienten gegeben. Gl. (7.12) ist dann ein Ausdruck für die Erhaltung der Gesamtwahrscheinlichkeit. Da T (kE ) für ein allgemeines V (x) auch für Energien E < Vmax nicht exakt Null ist, gibt es eine nichtverschwindende Wahrscheinlichkeit, dass ein quantenmechanisches Teilchen mit mittlerer kinetischer Energie E < Vmax einen klassisch verbotenen Potenzialbereich durchtritt. Man spricht in diesem Fall vom Tunneleffekt. Das Teilchen “durchtunnelt” den Potenzialberg. Analog gibt es auch für E > Vmax eine nichtverschwindende Wahrscheinlichkeit, dass das Teilchen reflektiert wird. Interessant sind so genannte Resonanzen: Für von den Potenzialparametern (z.B. der Breite und der Höhe eines Kastenpotenzials) abhängige Energien ist die Transmissionswahrscheinlichkeit gleich Eins. In den Übungen werden Sie T (kE ) und R(kE ) für einen Potenzialtopf (mit V0 > 0 und V0 < 0) wie in Abbildung 7.4 dargestellt (dort nur für V0 > 0) bestimmen und damit die Streuung an diesem Potenzial genauer untersuchen. Dabei werden Sie die beschriebenen Effekte explizit bestätigen. Zusammenfassend halten wir fest, dass das Spektrum des Hamiltonoperators für ein eindimensionales, beschränktes, bis auf endlich viele Sprungstellen stetiges Potenzial V (x) mit kompaktem Träger (siehe z.B. Abbildung 7.3) im Allgemeinen aus einem diskreten (E < 0) und einem kontinuierlichen (E > 0) Teil besteht. 7.2. STATIONÄRE SCHRÖDINGERGLEICHUNG MIT POTENZIAL 97 Die Eigenvektoren zu ersterem sind die normierbaren gebundenen Zustände, die Eigenvektoren zu letzterem die uneigentlichen Streuzustände, aus denen sich normierbare Wellenpakete konstruieren lassen. Die zeitunabhängige Schrödingergleichung mit V (x) = V0 δ(x − x0 ): Als nächstes wollen wir Lösungen der zeitunabhängige Schrödingergleichung in einem Potenzial betrachten, welches nicht beschränkt ist. Ein Beispiel das sich vollständig analytisch untersuchen lässt ist das δ-Potenzial V (x) = V0 δ(x − x0 ). Man kann sich vorstellen, dass es aus einem beschränkten um x0 zentrierten Kastenpotenzial (siehe Abbildung 7.4) endlicher Tiefe und endlicher Breite im Limes Tiefe → ∞ und Breite → 0 mit Tiefe×Breite = const. entstanden ist.39 Bei diesem Grenzprozess geht die Stetigkeit der Ableitung ψE0 (x) bei x = x0 verloren (für x 6= x0 bleibt die Stetigkeit der Ableitung jedoch erhalten; siehe unten). Wir können das einfach verstehen, indem wir die zeitunabhängige Schrödingergleichung von x0 − ε bis x0 + ε, mit ε > 0, integrieren Z x0 +ε ~2 00 ψ (x) + V0 δ(x − x0 )ψE (x) dx = E ψE (x) dx − 2m E x0 −ε x0 −ε Z x0 +ε ~2 0 0 [ψ (x0 + ε) − ψE (x0 − ε)] + V0 ψE (x0 ) = E ⇒ − ψE (x) dx . 2m E x0 −ε Z x0 +ε Aus diesem Ausdruck ergibt sich für ε → 0 und unter der Annahme, dass ψE (x) bei x0 beschränkt bleibt (diese Annahme wird sich als konsistent herausstellen, was sie nachträglich rechtfertigen wird; siehe unten) lim [ψE0 (x0 + ε) − ψE0 (x0 − ε)] = ε→0 2mV0 ψE (x0 ) . ~2 (7.14) Die erste Ableitung der Lösungsfunktion springt somit bei x0 . Bei der Lösung der zeitunabhängige Schrödingergleichung fordern wir also, dass ψE (x) für alle x ∈ R stetig ist, die Ableitung ψE0 (x) für alle x 6= x0 stetig ist und bei x0 gemäß Gl. (7.14) springt. Damit bietet es sich an, die Lösung für die zwei Teilgebiete (Gebiete 1 und 2) x < x0 und x > x0 zu betrachten und bei x = x0 die Stetigkeit von ψE (x) und die Sprungbedingung Gl. (7.14) von ψE0 (x) zu fordern. Betrachten wir zunächst wieder den Fall E < 0. In den Gebieten 1 und 2 müssen wir die freie stationäre Schrödingergleichung lösen. Die physikalischen Lösungen lauten p (1/2) dann wie gehabt ψE (x) = c(1/2) exp (±αE [x − x0 ]), mit αE = 2m(−E)/~, wobei das obere Vorzeichen im Gebiet 1 und das untere in 2 zu wählen ist. Aus der Stetigkeit der Gesamtlösung ψE (x) bei x0 folgt sofort c(1) = c(2) = c. Die (1/2)0 Ableitungen ergeben sich zu ψE (x) = ±αE c exp (±αE [x − x0 ]). Bei x = x0 39 Allgemeiner ist die δ-Funktion das Limeselement einer δ-Folge, wie Sie sie beispielhaft in den Übungen kennen gelernt haben. 98 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION folgt somit (2)0 (1)0 limε→0 [ψE0 (x0 + ε) − ψE0 (x0 − ε)] ψE (x0 ) − ψE (x0 ) = ψE (x0 ) ψE (x0 ) p = −2αE = −2 2m(−E)/~ . Aus der Sprungbedingung Gl. (7.14) ergibt sich dann die Forderung p mV0 = − 2m(−E)/~ . ~2 (7.15) Sie legt die Energie E < 0 für die es bei einer gegebenen Potenzialstärke V0 < 0 (anziehendes Potenzial) eine Lösung gibt eindeutig zu E0 = − mV02 2~2 fest. Wir finden somit für V0 < 0 genau einen gebundenen Zustand mit Energie E0 < 0. Es gibt keine weiteren gebundenen Zustände. Mit dem so bestimmten E0 und dem obigen allgemeinen Ansatz für die Lösung der stationäre Schrödingergleichung in den Bereichen 1 und 2 folgt m|V0 | ψE0 (x) = c exp − 2 |x − x0 | . ~ Wir müssen dann noch die Normierungskonstante c bestimmen. Dazu betrachten wir Z ∞ Z ∞ m|V0 | 2 2 |ψE0 (x)| dx = |c| exp −2 2 |x − x0 | dx ~ −∞ −∞ Z ∞ m|V0 | 0 2 = |c| exp −2 2 |x | dx0 ~ Z−∞∞ m|V0 | 2 exp −2 2 x dx = 2|c| ~ 0 −1 m|V0 | = −2|c|2 −2 2 ~ 2 ~ = |c|2 m|V0 | = 1. p Damit ergibt sich, bis auf die wie üblich freie Phase, c = m|V0 |/~ und p m|V0 | m|V0 | exp − 2 |x − x0 | . ψE0 (x) = ~ ~ 7.2. STATIONÄRE SCHRÖDINGERGLEICHUNG MIT POTENZIAL 99 Für V0 > 0 ist Gl. (7.15) nicht erfüllbar und es gibt keinen gebundenen Zustand mit E < 0. Mit Hilfe der Sprungbedingung Gl. (7.14) lassen sich auch die Streuzustände ψE (x) der Streuung an V (x) = V0 δ(x − x0 ) mit E > 0 bestimmen. Wie bei der Streuung an einem beschränkten Potenzial gibt es zu jedem E > 0 eine Lösung der stationären Schrödingergleichung (dies gilt für V0 < 0 und V0 > 0). Damit besteht das vollständige Spektrum des Hamiltonoperators für V0 < 0 aus einem diskreten Eigenwert E0 < 0 und einem Kontinuum von (uneigentlichen) Eigenwerten für E > 0 und für V0 > 0 aus einem Kontinuum von (uneigentlichen) Eigenwerten für E > 0. In einer Übungsaufgabe werden Sie die TransmissionsT (kE ) und Reflexionskoeffizienten R(kE ) für dieses Problem bestimmen und damit das Streuproblem lösen. Für das Beispiel des δ-Potenzials lässt sich recht einfach explizit die Vollständigkeit der Eigenvektoren zum Hamiltonoperator zeigen.40 Dies ist in einem pädagogischen Artikel diskutiert, den Sie unter der zusätzlichen Literatur finden. In zwei Übungsaufgaben haben Sie zusätzlich die stationäre Schrödingergleichung in den unbeschränkten Potenzialen des harmonischen Oszillators und des Kasten mit unendlich hohen Wänden gelöst. Das Spektrum des Hamiltonoperators ist in beiden Fällen rein diskret und abzählbar41 und die zugehörigen Eigenfunktionen sind quadratintegrabel (normierbar). Auf das Problem des harmonischen Oszillators werden wir nocheinmal ausführlich im folgenden Kapitel zurückkommen. 40 Dabei müssen sowohl der mögliche (V0 < 0) gebundene Zustand mit E0 < 0, als auch die Streuzustände mit E > 0 berücksichtigt werden. 41 Wählen wir, wie in den Übungsaufgaben, als minimalen Wert der Potenziale jeweils Null, so gilt für die Eigenwerte Ej > 0. 100 KAPITEL 7. SCHRÖDINGERGLEICHUNG IN EINER DIMENSION Kapitel 8 Der harmonische Oszillator In einer Übungsaufgabe haben Sie die Energieeigenwerte und die zugehörigen Eigenfunktionen (die Eigenvektoren in Ortsdarstellung) des eindimensionalen harmonischen Oszillators mit dem Potenzial V (x) = 12 mω 2 x2 bestimmt, indem Sie die stationäre Schrödingergleichung mit Hilfe eines Potenzreihenansatzes gelöst haben. Wir werden hier auf das Problem der Bestimmung der Eigenwerte und Eigenvektoren von H zurückkommen, jedoch eine elegantere Methode verwenden, die auf das allgemeine Konzept von so genannten Leiteroperatoren führt. Bevor wir dazu kommen, wollen wir jedoch begründen, warum das harmonische Oszillator-Problem nicht nur von pädagogischem Interesse ist,1 sondern sehr oft zum (zumindest) qualitativen Verständnis von dynamischen Problemen herangezogen werden kann. Wir werden hier zunächst im Rahmen der klassischen Mechanik argumentieren. Betrachten wir ein Teilchen, welches einem allgemeinen Potenzial V (x) ausgesetzt ist. Das Potenzial habe lokale Minima, von denen eines bei x0 liege. Wir nehmen nun an, dass wir die Bewegung eines Teilchens beschreiben möchten, welches ein wenig aus der Gleichgewichtsposition x0 ausgelenkt wurde. Dazu entwickeln wir das allgemeine Potenzial V (x) um x0 in eine Taylorreihe und erhalten 1 V (x) = V (x0 ) + (x − x0 )V 0 (x0 ) + (x − x0 )2 V 00 (x0 ) + O [x − x0 ]3 . 2 Da es sich bei x0 um ein lokales Minimum handelt gilt V 0 (x0 ) = 0 und V 00 (x0 ) > 0. Verschieben wir nun zusätzlich unseren Nullpunkt der Energie um V (x0 ), so ergibt sich 1 V (x) = (x − x0 )2 V 00 (x0 ) + O [x − x0 ]3 . 2 1 Im Laufe Ihres Physikstudiums sollten Sie bereits gemerkt haben, dass das harmonische Oszillator-Problem ein oft herangezogenes pädagogisches Beispiel zur Verdeutlichung allgemeiner Zusammenhänge ist. In der klassischen Mechanik ist es z.B. wichtig bei der Beschreibung der Dynamik eines Pendels mit kleiner Auslenkung und der Hookschen Feder mit Masse. 101 102 KAPITEL 8. DER HARMONISCHE OSZILLATOR Ist die Auslenkung aus der Ruhelage x − x0 klein, so können wir die Terme der Ordnung [x − x0 ]3 und höher vernachlässigen und das zu untersuchende Problem reduziert p sich auf ein (um x0 verschobenes) harmonischer Oszillator-Problem mit ω = V 00 (x0 )/m. Auf diese Weise gelingt es viele Aspekte der Bewegung um eine Ruhelage mit kleiner Auslenkung mit Hilfe des zugehörigen harmonischer Oszillator-Problems zu untersuchen. Ähnlich lässt sich auch die dreidimensionale Bewegung um ein lokales Potenzialminimum mit kleiner Auslenkung auf das Problem des dreidimensionalen harmonischen Oszillators abbilden. Analoge Überlegungen kann man für ein durch ein Wellenpaket beschriebenes quantenmechanisches Teilchen anstellen. Dabei gilt es zusätzlich zu beachten, dass aufgrund des Tunneleffekts ein Teil der Wahrscheinlichkeitsdichte aus dem Gebiet um x0 “entweicht”. Der Hamiltonoperator des eindimensionalen harmonischen Oszillators lautet H= 1 p̂2 + mω 2 x̂2 . 2m 2 Wir definieren einen Operator r mω i p̂ . a := x̂ + √ 2~ 2m~ω Der dazu adjungierte Operator a† ergibt sich zu r mω i a† = p̂ . x̂ − √ 2~ 2m~ω (8.1) (8.2) Weiterhin definieren wir den selbstadjungierten Operator N̂ := a† a r r mω i mω i = x̂ − √ x̂ + √ p̂ p̂ 2~ 2~ 2m~ω 2m~ω mω 2 1 i = x̂ + p̂2 + [x̂, p̂] 2~ 2m~ω 2~ 1 1 = H− 1. ~ω 2 Damit können wir den Hamiltonoperator wie folgt schreiben2 1 1 † H = ~ω N̂ + = ~ω a a + . 2 2 (8.3) Mit Hilfe der Heisenbergschen Vertauschungsrelation Gl. (5.13) können wir den Kommutator † 1 a, a = (−i [x̂, p̂] + i [p̂, x̂]) = 1 (8.4) 2~ 2 Im zweiten Summanden lassen wir entsprechend unserer Gewohnheit wieder den Einsoperator weg. 103 bestimmen. In einer Übungsaufgabe haben Sie gezeigt, dass für allgemeine Operatoren A, B und C die Relation [A, BC] = ABC − BAC + BAC − BCA = [A, B] C + B [A, C] gilt. Verwenden wir diese, so ergeben sich h i a, N̂ = a, a† a = a, a† a + a† [a, a] = a und h i a† , N̂ = a† , a† a = a† , a† a + a† a† , a = −a† . Um das Eigenwertproblem des Hamiltonoperators zu lösen, untersuchen wir das Eigenwertproblem von N̂ = N̂ † . Dazu nehmen wir an, dass N̂ einen normierten Eigenvektor |ϕν i zum Eigenwert ν ∈ R hat3 N̂ |ϕν i = ν |ϕν i . Betrachten wir nun zusätzlich die (nicht normierten) Zustände + ϕν := a† |ϕν i und − ϕν := a |ϕν i . Wir beweisen zunächst, dass ν ≥ 0 gilt: − ν = ν hϕν |ϕν i = hϕν | N̂ |ϕν i = hϕν | a† a |ϕν i = ϕ− ν ϕν ≥ 0 . (8.5) Dabei gilt die Gleichheit, wenn |ϕ− ν i der Nullvektor ist. Als nächstes zeigen wir, + dass |ϕν i nicht der Nullvektor sein kann: + + ϕν ϕν = hϕν | aa† |ϕν i = hϕν | N̂ + a, a† |ϕν i = hϕν | N̂ + 1 |ϕν i = ν + 1 . Der Vektor |ϕ+ ν i ist ebenfalls Eigenvektor zu N̂ mit Eigenwert ν + 1: h i † † † † = N̂ a |ϕ i = a N̂ − a , N̂ |ϕ i = a N̂ + 1 |ϕν i = (ν + 1) ϕ+ . N̂ ϕ+ ν ν ν ν Aufgrund dieser Eigenschaft nennt man a† einen Aufsteigeoperator. Den Vektor |ϕ+ ν i können wir nun normieren und nennen den normierten Eigenvektor zum Eigenwert ν + 1, |ϕν+1 i. Mit diesem verfahren wir analog wie für |ϕν i und erhalten so die unendliche Folge von Eigenwerten ν, ν + 1, ν + 2, . . .. Mit ν > 0 ist 3 Da N̂ ein selbstadjungierter Operator ist, gibt es so einen Vektor. 104 KAPITEL 8. DER HARMONISCHE OSZILLATOR − − hϕ− ν |ϕν i > 0, was nach unser obigen Überlegung Gl. (8.5) bedeutet, dass |ϕν i nicht der Nullvektor ist. In diesem Fall gilt h i − ϕν . N̂ ϕ− = N̂ a |ϕ i = a N̂ − a, N̂ |ϕ i = a N̂ − 1 |ϕ i = (ν − 1) ν ν ν ν Nach Gl. (8.5) sind die Eigenwerte von N̂ größer oder gleich Null, so dass |ϕ− ν i für ν ≥ 1 ein Eigenvektor zu N̂ mit Eigenwert ν − 1 ist. Den normierten Eigenvektor bezeichnen wir mit |ϕν−1 i. Durch Anwenden von a wird der Eigenwert somit um Eins reduziert, weshalb a als Absteigeoperator bezeichnet wird. a† und a zusammen bezeichnet man als Leiteroperatoren. Da die Eigenwerte von N̂ größer oder gleich Null sind, lässt sich die Absteigeprozedur im Gegensatz zur Aufsteigeprozedur nicht unendlich oft wiederholen. Unser ursprüngliches ν kann immer als ν = M + λ, mit M ∈ N0 und 0 ≤ λ < 1 geschrieben werden. Wenden wir a M -mal an, so erhalten wir die Eigenwerte ν −1, ν − 2, . . . , ν − M = λ. Der Eigenwert λ zum (nicht normierten) Eigenvektor ϕM := aM |ϕν i liegt in [0, 1). ν M Die erneute a muss M daher den Nullvektor liefern a ϕν = 0, von † Anwendung M M M ϕ = 0. Da ϕ nicht der Nullvektor ist, folgt a a ϕ = λ ϕ d.h. ϕM ν ν ν ν M νM ϕν ϕν > 0 und wir können λ = 0 folgern. Damit sind die Eigenwerte zu N̂ alle Zahlen n aus N0 .4 Die normierten Eigenvektoren bezeichnen wir von nun an mit |n, ii, wobei wir einen zusätzlichen Index i hinzunehmen müssen, da wir noch nicht sicher sein können, dass die Eigenvektoren nicht entartet sind. Es gilt somit N̂ |n, ii = n |n, ii und damit auch 1 1 H |n, ii = ~ω N̂ + |n, ii = ~ω n + |n, ii . 2 2 Die Eigenzustände zu H sind identisch zu denen zu N̂ mit Energieeigenwer 1 ten ~ω n + 2 . Das Spektrum ist damit rein diskret und äquidistant. Die Nullpunktsenergie beträgt ~ω/2. Wir wollen nun explizit den Grundzustand (bzw. die Grundzustände im Fall von Entartung), d.h. den Eigenvektor zum niedrigsten Eigenwert von H bestimmen. Nach der obigen Konstruktion muss für ihn gelten r mω i a |n = 0, ii = x̂ + √ p̂ |n = 0, ii = 0 . 2~ 2m~ω In Ortsdarstellung ergibt sich somit die lineare Differentialgleichung erster Ordnung r mω i ~ d 0 = hx| a |n = 0, ii = x+ √ hx |n = 0, ii . {z } 2~ 2m~ω i dx | =:ϕi0 (x) 4 Über die Vollständigkeit des Systems von zu diesen Eigenwerten gehörenden Eigenvektoren können wir später sehen, dass es keine weiteren Eigenwerte gibt. 105 Nach der allgemeinen Theorie linearer Differentialgleichungen besitzt sie genau eine (linearunabhängige) normierte Lösung ϕ0 (x). Wie man leicht nachrechnet ergibt sie sich zu mω 1/4 mω x2 . hx |n = 0i = ϕ0 (x) = exp − π~ 2~ Der Grundzustand ist somit nicht entartet. Darauf aufbauend werden wir jetzt induktiv zeigen, dass alle Eigenzustände nicht entartet sind. Wir nehmen also an, dass es genau einen Zustand |ni mit N̂ |ni = n |ni, bzw. H |ni = ~ω (n + 1/2) |ni gibt. Betrachten wir dann den Eigenvektor |n + 1, ii zum Eigenwert n + 1 (bzw. ~ω(n+3/2)). Wie wir wissen, bildet a |n + 1, ii einen Eigenvektor mit Eigenwert n (bzw. ~ω(n+1/2)). Da dieser Eigenvektor aber nach Voraussetzung nicht entartet ist, muss a |n + 1, ii = ci |ni mit Konstanten ci ∈ C gelten. Wenden wir nun a† an, so folgt a† a |n + 1, ii = ci a† |ni = N̂ |n + 1, ii = (n + 1) |n + 1, ii ci † a |ni . ⇒ |n + 1, ii = n+1 Damit sind jedoch alle Eigenvektoren zum Eigenwert n + 1 (bzw. ~ω(n + 3/2)) proportional zum Vektor a† |ni und damit nicht linearunabhängig. Es folgt, dass alle Eigenvektoren nicht entartet sind. Die normierten Eigenzustände |ni konstruiert man ausgehend vom Grundzustand |0i durch wiederholtes Anwenden von a† n−1 n cn † 1 cn−1 a† a |n − 1i . |0i = |ni = cn a† |0i = cn a† cn−1 cn−1 Damit ergibt sich 1 = hn |ni = |cn |2 |cn |2 † hn − 1| aa |n − 1i = hn − 1| N̂ + 1 |n − 1i |cn−1 |2 |cn−1 |2 |cn |2 = n, |cn−1 |2 d.h. die Rekursionsgleichung |cn |2 = |cn−1 |2 /n. Mit |c0 |2 = 1 folgt sofort |cn |2 = Wählen wir cn als positiv und reell, so ergibt sich n 1 |ni = √ a† |0i . n! Für den n-ten Eigenvektor gilt damit in der Ortsdarstellung 1 . n! ϕn (x) := hx |ni !n mω mω 1/4 1 1 n r mω 1 d √ √ = x− p exp − x2 π~ ~ 2~ 2 n! mω/~ dx n mω 1/4 1 d 1 √ = q− exp − q 2 , n π~ dq 2 n! 2 106 KAPITEL 8. DER HARMONISCHE OSZILLATOR wobei wir die Variable r q := mω x ~ eingeführt haben. In der Mathematik werden die so genannten Hermitepolynome Hn , mit n ∈ N0 , gemäß n d 2 q 2 /2 q− e−q /2 Hn (q) := e dq definiert.5 Mit dieser Definition ergibt sich ϕn (x) = mω 1/4 π~ √ 1 2 e−q /2 Hn (q) . n! 2n Für die vier niedrigsten Hermitepolynome ergibt sich H0 (q) = 1 , H1 (q) = 2q , H2 (q) = 4q 2 − 2 , H3 (q) = 8q 3 − 12q . Die Ortsdarstellung einiger niedrigliegender Eigenzustände zu H und die zugehörigen Wahrscheinlichkeitsdichten sind in Abbildung 8.1 dargestellt. Da die Menge der |ni, mit n ∈ N0 , die Eigenvektoren eines selbstadjungierten Operators sind, bilden sie ein vollständiges System. Wir haben also die Zerlegung der Eins auf dem L2 (R) 1= ∞ X |ni hn| . n=0 Unter Verwendung der Eigenschaften der Hermitepolynome lässt sich die Vollständigkeit in diesem Beispiel auch explizit zeigen. Die Spektraldarstellung des Hamiltonoperators lautet ∞ X 1 |ni hn| . H = ~ω n+ 2 n=0 Im Allgemeinen benötigt man zur Berechnung von Erwartungswerten in den Eigenzuständen des harmonischen Oszillators nicht die explizite Form der Hermitepolynome. Exemplarisch wollen wir das für die Erwartungswerte hm| x̂ |ni und hm| p̂ |ni, mit m, n ∈ N0 , zeigen. Wir drücken dazu x̂ und p̂ mit Hilfe der Gln. (8.1) und (8.2) durch a und a† aus r r ~ m~ω x̂ = a + a† , p̂ = i −a + a† . 2mω 2 5 Man überzeugt sich leicht davon, dass Hn ein Polynom n-ten Grades ist. 107 Abbildung 8.1: Ortsdarstellung niedrigliegender Eigenzustände des eindimensionalen harmonischen Oszillators (a) und die zugehörigen Wahrscheinlichkeitsdichten (b). Die in der Abbildung angegebenen n ergeben sich aus den n des Textes durch addieren von 1, d.h. n = 1 in der Abbildung indiziert den Grundzustand, n = 2 den ersten angeregten Zustand usw.. Aufgrund von a† |ni = √ n + 1 |n + 1i und a |ni = √ hm| a |ni = n δm,n−1 √ n |n − 1i gilt und hm| a† |ni = √ n + 1 δm,n+1 . Damit ergibt sich r hm| x̂ |ni = √ ~ √ n δm,n−1 + n + 1 δm,n+1 2mω und r hm| p̂ |ni = i √ m~ω √ − n δm,n−1 + n + 1 δm,n+1 . 2 108 KAPITEL 8. DER HARMONISCHE OSZILLATOR Die zu x̂ und p̂ gehörenden unendlichdimensionalen Matrizen haben Tridiagonalgestalt, mit verschwindender Hauptdiagonale. D.h. die Matrixelemente hn| x̂ |ni und hn| p̂ |ni sind Null. In Übungsaufgaben haben Sie bereits einige dynamische Probleme im Potenzial des harmonischen Oszillators gelöst. In den in der Vorlesung gezeigten Simulationen werden weitere Beispiele veranschaulicht. Speziell wird auch die zeitliche Entwicklung so genannter kohärenter Zustände dargestellt, die Sie in einer weiteren Übungsaufgabe analytisch genauer untersuchen werden. Kapitel 9 Die Dynamik von Quantensystemen 9.1 Das Schrödingerbild Bereits in Kapitel 7 haben wir einige allgemeine Konsequenzen des Postulat 6 (die Dynamik eines Quantensystems ist durch die Schrödingergleichung gegeben) diskutiert. Wir haben den Zeitentwicklungsoperator U (t) eingeführt, gezeigt, dass er für einen zeitunabhängigen Hamiltonoperator H durch U (t) = exp (−iHt/~) gegeben ist und diskutiert, wie wir in diesem Fall die Spektraldarstellung von H dazu verwenden können, den Zustand |ψ(t)i zu bestimmen, der sich aus dem vorgegebenen Anfangszustand |ψ(0)i gemäß |ψ(t)i = U (t) |ψ(0)i ergibt. Es gilt |ψ(t)i = U (t) |ψ(0)i = Z Z X X E e−iEt/~ hE, ν |ψ(0)i |E, νi , ν mit den Eigenzuständen |E, νi und den Eigenwerten E zu H. Wir wollen hier diese allgemeine Vorgehensweise nocheinmal anhand eines Beispiels zur Dynamik des Spinfreiheitsgrades eines Elektrons in einem zeitlich ~ verdeutlichen.1 Den Hamiltonoperator zu konstanten, homogenen Magnetfeld B diesem Problem haben wir bereits in Kapitel 3 Gl. (3.1) konstruiert. Er lautet H = −µ0 B(σ1 n1 + σ2 n2 + σ3 n3 ) = −µ0 Bσ~n , ~ zeigt. Der zugrundeliegende mit dem Einheitsvektor ~n der in die Richtung von B 2 Hilbertraum ist der C . Die Eigenzustände zu diesem Hamiltonoperator bei fest vorgegebenem ~n sind die |~n, ±i aus Kapitel 3 H |~n, ±i = ± (−µ0 B) |~n, ±i . 1 Wir vernachlässigen dabei die Bahnfreiheitsgrade des Elektrons. 109 110 KAPITEL 9. DIE DYNAMIK VON QUANTENSYSTEMEN Starten wir zur Zeit t = 0 in einem allgemeinen normierten Zustand |ψ(0)i, den wir immer als |ψ(0)i = ψ+ |~n, +i + ψ− |~n, −i, mit ψ± ∈ C schreiben können, so folgt |ψ(t)i = e−iω0 t h~n, + |ψ(0)i |~n, +i + eiω0 t h~n, − |ψ(0)i |~n, −i = e−iω0 t ψ+ |~n, +i + eiω0 t ψ− |~n, −i , (9.1) mit ω0 := −µ0 B/~. In diesem Beispiel gelingt es auch, U (t) direkt, d.h. ohne Zuhilfenahme der Spektraldarstellung des Hamiltonoperators, zu berechnen. Dazu erinnern wir uns, an die Matrixdarstellung (die Matrix sei mit A bezeichnet; siehe Übungen) des Operators σ~n in der {|~e3 , ±i} Basis, die wir in Gl. (3.8) angegeben haben. In einer Übungsaufgabe haben Sie exp (iαA) bestimmt. Das dort gewonnene Ergebnis exp (iαA) = cos (α) 1 + i sin (α) A können wir verwenden und erhalten darstellungsunabhängig U (t) = e−iHt/~ = e−iω0 σ~n t = cos (ω0 t) 1 − i sin (ω0 t) σ~n . (9.2) Auch mit Hilfe dieses Ausdrucks können wir Gl. (9.1) gewinnen. Um Gl. (9.2) physikalisch interpretieren zu können, betrachten wir die Wirkung eines Operators exp (−iασ~n /2) auf einen gegebenen Zustand |ψi ∈ C2 . Betrachten wir dazu zunächst ~n = ~e2 . Wir benötigen dann σ~n = σ2 = −i |~e3 , +i h~e3 , −|+i |~e3 , −i h~e3 , +| (siehe Gl. (3.11)). Damit folgt e−iθσ2 /2 = cos (θ/2) 1 − i sin (θ/2) (−i |~e3 , +i h~e3 , −| + i |~e3 , −i h~e3 , +|) . Angewandt auf den Zustand |~e3 , +i ergibt sich e−iθσ2 /2 |~e3 , +i = cos (θ/2) |~e3 , +i + sin (θ/2) |~e3 , −i = |~n(θ, 0), +i gemäß Gl. (3.10). Dabei haben wir die beiden Winkel θ und ϕ des Normalenvektors ~n = ~n(θ, ϕ) mit angegeben. Den Vektor ~n(θ, 0) erhält man aus ~e3 durch eine Drehung um den Winkel θ um die ~e2 Achse. Der Operator e−iθσ2 /2 vermittelt also eine spezielle Drehung: Aus einem Spinzustand, der mit Wahrscheinlichkeit Eins beim Durchlaufen einer in ~e3 -Richtung ausgerichtete Stern-Gerlach Apparatur im oberen Strahl liegt, wird einer für den selbiges beim Durchlaufen einer in die ~n(θ, 0)-Richtung rotierten Stern-Gerlach Apparatur gilt. Das legt die Vermutung nahe, dass man eine allgemeine Drehung durch den “Drehoperator” exp (−i Drehwinkel ~σ · ~eDrehachse /2) (9.3) generiert. Nach diesem Rezept sollten wir den allgemeinen Zustand |~n(θ, ϕ), +i durch Anwenden von e−iϕσ3 /2 auf |~n(θ, 0), +i erhalten. Um dieses zu zeigen betrachten wir e−iϕσ3 /2 = cos (ϕ/2) 1 − i sin (ϕ/2) (|~e3 , +i h~e3 , +| − |~e3 , −i h~e3 , −|) = e−iϕ/2 |~e3 , +i h~e3 , +| + eiϕ/2 |~e3 , −i h~e3 , −| . 9.1. DAS SCHRÖDINGERBILD 111 Damit folgt e−iϕσ3 /2 |~n(θ, 0), +i = e−iϕ/2 |~e3 , +i h~e3 , +| + eiϕ/2 |~e3 , −i h~e3 , −| (cos (θ/2) |~e3 , +i + sin (θ/2) |~e3 , −i) = e−iϕ/2 cos (θ/2) |~e3 , +i + eiϕ/2 sin (θ/2) |~e3 , −i = e−iϕ/2 |~n(θ, ϕ), +i , wobei wir von der vorletzten zur letzten Zeile wieder Gl. (3.10) verwendet haben. Bis auf die Phase e−iϕ/2 hat sich somit unsere Erwartung bestätigt. Aufgrund der Isotropie des Raumes können wir das für die speziellen Drehachse gewonnene Ergebnis auf beliebige Achsen erweitern und Gl. (9.3) gilt allgemein. Ausgedrückt durch den Vektoroperator ~s Gl. (3.14) gilt exp (−i Drehwinkel ~s · ~eDrehachse /~) . (9.4) Im Kapitel über Drehimpulsoperatoren werden wir nocheinmal auf den Zusammenhang zwischen Rotationen und Drehimpulsoperatoren zurückkommen. In diesem Kapitel werden wir zusätzlich kurz diskutieren, wie sich räumliche Translationen mit Hilfe des Impulsoperators generieren lassen. Gemäß dem gerade gelernten beschreibt der obige Zeitentwicklungsoperator Gl. (9.2) eine Rotation mit Winkel 2ω0 t um die ~n-Achse. |ψ(t)i vollführt somit eine Präzessionsbewegung mit der Frequenz 2ω0 um das Magnetfeld (genauer die Richtung des Magnetfeldes) in weitgehender Analogie zum Verhalten eines klassischen magnetischen Moments in einem zeitunabhängigen, homogenen Magnetfeld. Für allgemeine zeitabhängige Hamiltonoperatoren Ht ist die Lösung der Schrödingergleichung i~ d |ψ(t)i = Ht |ψ(t)i dt i.A. viel komplizierter.2 Für einen Spezialfall kann U (t) angegeben werden. Gilt [Ht , Ht0 ] = 0 für alle t, t0 , so folgt Z t 0 |ψ(t)i = exp −i Ht0 dt /~ |ψ(0)i , 0 {z } | =U (t) wie man durch Differenzieren explizit nachrechnet. Ein Beispiel dafür, welches Sie ausführlicher in einer Übungsaufgabe untersuchen werden, ist der Spinfrei~ heitsgrad eines Elektrons in einem homogenen Magnetfeld B(t) = B(t)~n, dessen Stärke von der Zeit abhängt, dessen Richtung jedoch zeitlich konstant ist. Der 2 H wird zeitabhängig, wenn z.B. bei der Diskussion der Bahnfreiheitsgrade das Potenzial V (~x, t) zeitabhängig ist, oder bei der Untersuchung der Dynamik der Spinfreiheitsgrades das ~ Magnetfeld B(t) von t abhängt. 112 KAPITEL 9. DIE DYNAMIK VON QUANTENSYSTEMEN Hamiltonoperator lautet in diesem Fall Ht = −µ0 B(t)σ~n , so dass aus [σ~n , σ~n ] = 0, offensichtlich [Ht , Ht0 ] = 0 für alle t, t0 folgt. Auch wenn [Ht , Ht0 ] 6= 0 gibt es einen unitären Zeitentwicklungsoperator U (t) mit3 |ψ(t)i = U (t) |ψ(0)i . (9.5) Die Unitarität folgt aus der weiterhin gültigen Erhaltung der Wahrscheinlichkeit d d d hψ(t) |ψ(t)i = hψ(t)| |ψ(t)i + hψ(t)| |ψ(t)i dt dt dt 1 = hψ(t)| Ht |ψ(t)i − hψ(t)| Ht† |ψ(t)i i~ = 0, die sich aus der Selbstadjungiertheit des Hamiltonoperators ergibt. Das Skalarprodukt hψ(t) |ψ(t)i ist zeitlich konstant und gleich 1, da für t = 0, hψ(0) |ψ(0)i = 1 gilt. Für alle t ∈ R folgt so hψ(t) |ψ(t)i = 1 = hψ(0)| U † (t)U (t) |ψ(0)i und damit U † (t) = U −1 (t), da der Anfangszustand |ψ(0)i beliebig gewählt werden kann. Wir verwenden nun Gl. (9.5) als Ansatz zur Lösung der Schrödingergleichung und erhalten i~ d U (t) |ψ(0)i = Ht U (t) |ψ(0)i . dt Da der Anfangszustand |ψ(0)i ein beliebiger Zustand aus dem Hilbertraum H ist, gilt die Operatorgleichung i~ d U (t) = Ht U (t) , dt (9.6) die zusammen mit U (0) = 1 den Zeitentwicklungsoperator eindeutig festlegt. Nur für sehr wenige Probleme mit zeitabhängigem Ht lässt sich die Schrödingergleichung analytisch lösen. Ein Beispiel in dem dieses gelingt, ist das einfache Modell zur Spinresonanz, welches Sie in den Übungen behandeln werden. 9.2 Das Heisenbergbild Im Folgenden werden wir in der Frage der Zeitentwicklung eine neue Sichtweise einführen. Statt wie bisher den Vektoren aus H eine zeitliche Entwicklung 3 Durch die Angabe einer Differentialgleichung, die U (t) eindeutig festlegt, werden wir gleich zeigen, dass es zu jedem Ht ein U (t) gibt. 9.2. DAS HEISENBERGBILD 113 zu zusprechen, werden sich die Operatoren zeitlich entwickeln.4 Die physikalisch wichtigen Größen sind die Erwartungswerte von Observablen (hier der Observablen A) im Zustand |ψ(t)i hAi|ψ(t)i = hψ(t)| A |ψ(t)i = hψ(0)| U † (t)AU (t) |ψ(0)i . Definiert man für einen allgemeinen Operator A auf H (nicht nur für Observable) AH (t) := U † (t)AU (t) so entspricht die obige Relation hAi|ψ(0)i := hAi|ψ(t)i t = hψ(0)| AH (t) |ψ(0)i . Wir haben die Zeitabhängigkeit so vom Zustand auf den Operator geschoben. Man nennt diese Beschreibungsweise das Heisenbergbild, was den Index H an AH (t) erklärt. Die bisherige Beschreibung der Dynamik nennt man im Gegensatz dazu das Schrödingerbild.5 Mit Hilfe des Zeitentwicklungsoperators werden wir jetzt eine Bewegungsgleichung für AH (t) herleiten. Wir beschränken uns dabei zunächst auf den Fall, das sowohl A als auch H zeitunabhängig sind.6 Dann gilt U (t) = exp (−iHt/~) und wir erhalten AH (t) = eiHt/~ Ae−iHt/~ . Differenzieren wir diesen Ausdruck nach der Zeit und multiplizieren mit i~, so folgt d iHt/~ d −iHt/~ d −iHt/~ iHt/~ e e Ae + i~e A i~ AH (t) = i~ dt dt dt = AH (t)H − HAH (t) = [AH (t), H] . Die Anfangsbedingung bei t = 0 lautet AH (0) = A. Man spricht in diesem Zusammenhang von der Heisenbergschen Bewegungsgleichung. Wegen [AH (t), H] = = = = 4 eiHt/~ Ae−iHt/~ H − HeiHt/~ Ae−iHt/~ eiHt/~ AHe−iHt/~ − eiHt/~ HAe−iHt/~ eiHt/~ [A, H] e−iHt/~ ([A, H])H (t) , Man muss dabei zwischen einer möglichen expliziten Zeitabhängigkeit von Operatoren und der durch den Hamiltonoperator generierten Dynamik unterscheiden. 5 Auch im Schrödingerbild besitzen Operatoren ihre mögliche explizite Zeitabhängigkeit, nicht jedoch die durch den Hamiltonoperator generierte. 6 Neben der durch das Heisenbergbild induzierten Zeitabhängigkeit, kann A i.A. auch explizit zeitabhängig sein. 114 KAPITEL 9. DIE DYNAMIK VON QUANTENSYSTEMEN gilt auch d AH (t) = ([A, H])H (t) dt was wichtig für die praktische Berechnung des Kommutators ist. Gemäß dieser Gleichung sind (explizit zeitunabhängige) Observable A, die mit H vertauschen zeitunabhängig, d.h. sie sind Erhaltungsgrößen. Nach den obigen Überlegungen ist dann auch der Erwartungswert hAi|ψ(t)i , unabhängig vom Anfangszustand, zeitunabhängig. Zum Beispiel ist der (zeitunabhängige) Hamiltonoperator selbst eine Erhaltungsgröße, was bedeutet, dass der Erwartungswert der Energie zeitlich konstant ist. Wir werden später weitere Erhaltungsgrößen kennenlernen. Betrachten wir als Beispiel die Bewegung eines Teilchens der Masse m im ˆ2 ~p + V (~xˆ). zeitunabhängigen Potenzial V (~x), mit dem Hamiltonoperator H = 2m Wir wollen dabei Bewegungsgleichungen für ~xˆH (t) und ~ˆpH (t) herleiten. Es gilt h i dˆ iHt/~ ˆ i~ ~xH (t) = e ~x, H e−iHt/~ dt # " ˆp2 ~ + V (~xˆ) e−iHt/~ = eiHt/~ ~xˆ, 2m # " ˆp2 ~ e−iHt/~ = eiHt/~ ~xˆ, 2m 3 X p̂j h ˆ i h ˆ i p̂j iHt/~ = e ~x, p̂j + ~x, p̂j e−iHt/~ 2m 2m j=1 i~ = i~ 1 ˆ p~H (t) . m und damit 1 dˆ ~xH (t) = p~ˆH (t) . dt m (9.7) der Bewegungsgleichung für p̂H (t) tritt der Kommutator hBei der Bestimmung i p̂i , V (~xˆ) auf. In den Übungen haben Sie gezeigt, dass für diesen h i ~ ∂V p̂i , V (~xˆ) = (~xˆ) i ∂xi gilt. Mit Hilfe dieser Relation erhalten wir i~ h i dˆ p~H (t) = eiHt/~ p~ˆ, H e−iHt/~ dt h i iHt/~ ˆ ˆ = e p~, V (~x) e−iHt/~ = −i~ ∂V ˆ (~xH (t)) ∂~x 9.2. DAS HEISENBERGBILD 115 und damit dˆ ∂V ˆ (~xH (t)) . p~H (t) = − dt ∂~x (9.8) Wir finden somit, dass die Bewegungsgleichungen für ~xˆH (t) und ~ˆpH (t) die gleiche Form haben, wie die für ~x(t) und p~(t) in der klassischen Mechanik.7 Wie man leicht nachrechnet, erfüllen ~xˆH (t) und ~ˆpH (t) für alle t ∈ R die Heisenbergsche Vertauschungsrelation, was wir hier gleich für ein allgemeines U (t) zeigen wollen [x̂i,H (t), p̂j,H (t)] = U † (t)x̂i U (t)U † (t) p̂j U (t) − U † (t)p̂j U (t)U † (t) x̂i U (t) | {z } | {z } =1 =1 † = U (t) [x̂i , p̂j ] U (t) | {z } =i~δi,j 1 = i~δi,j 1 . Bildet man den Erwartungswert der Gln. (9.7) und (9.8) in einem beliebigen Anfangszustand |ψ(0)i, so folgt d D ˆE ~x = dt |ψ(t)i d D ˆE p~ = dt |ψ(t)i d D ˆE|ψ(0)i 1 D ˆE|ψ(0)i 1 D ˆE ~x = p~ = p~ dt m m t t |ψ(t)i d D ˆE|ψ(0)i ∂V ˆ p~ = − hψ(t)| (~x) |ψ(t)i . dt ∂~x t (9.9) (9.10) Man nennt diese Bewegungsgleichungen für die Erwartungswerte von Ort und Impuls die Ehrenfestgleichungen. Für den Fall, dass V (~x) nur lineare und quadratische Terme in ~x hat,8 lässt sich Gl. (9.10) weiter umformen9 ∂V d D ˆE|ψ(0)i ∂V ˆ d D ˆE (~x) |ψ(t)i = − hψ(t)| ~xˆ |ψ(t)i . p~ = p~ = − hψ(t)| dt dt ∂~x ∂~x |ψ(t)i t In diesem Spezialfall reduzieren sich die beiden Ehrenfestgleichungen zu einer d2 D ˆ E ∂V D ˆE m 2 ~x =− ~x . dt ∂~x |ψ(t)i |ψ(t)i Sie ist völlig analog zu der Bewegungsgleichung für ~x(t) in der klassischen Mechanik. Wir schließen somit, dass für diese speziellen Potenziale der Mittelwert des Ortes der klassischen Trajektorie folgt. Für allgemeine Potenziale gilt diese 7 Man bezeichnet diese Beobachtung als das Ehrenfestsche Theorem. Dieses gilt für den harmonischen Oszillator und die Bewegung in einem räumlich homogenen Kraftfeld. ∂V ˆ 9 6 Es ist wichtig zu beachten, dass für ein allgemeines V (~x), hψ(t)| ∂~x (~x) |ψ(t)i = ∂V 4 ˆ hψ(t)| ~x |ψ(t)i gilt. Dies sieht man z.B. leicht für V (x) = x , da für ein allgemeines 8 ∂~ x 3 |ψ(t)i ∈ H, hψ(t)| x̂3 |ψ(t)i = 6 hψ(t)| x̂ |ψ(t)i gilt. 116 KAPITEL 9. DIE DYNAMIK VON QUANTENSYSTEMEN Aussage jedoch nicht, wie wir explizit im Beispiel des Tunnelprozesses gesehen haben. Sind im allgemeinen Fall der Hamiltonoperator Ht und der betrachtete Operator At (spezieller die betrachtete Observable At ) explizit zeitabhängig, so ergibt sich die Bewegungsgleichung d † d ∂At d † U (t) At U (t) + i~U (t)At U (t) + i~U † (t) U (t) i~ AH (t) = i~ dt dt dt ∂t ∂At = −U † (t)Ht At U (t) + U † (t)At Ht U (t) + i~U † (t) U (t) ∂t ∂At = U † (t) [At , Ht ] + i~ U (t) ∂t ∂At (t) , = [At , Ht ] + i~ ∂t H mit der Anfangsbedingung AH (0) = At=0 . In den Übungen werden Sie das Beispiel des eindimensionalen harmonischen Oszillators in einem zusätzlichen räumlich homogenen, zeitabhängigen Kraftfeld untersuchen, in dem der Hamiltonoperator zeitabhängig ist. Auch wenn es Ihnen auf den ersten Blick fremdartig erscheinen mag, dass im Heisenbergbild der Operator zeitabhängig ist und der Zustand dagegen zeitunabhängig, so ist dieses Vorgehen verglichen mit dem der klassischen Mechanik “natürlicher”. Wie dort, ist im Heisenbergbild die Observable, die ein klassisches Analogon besitzt (z.B. der Ort und der Impuls), zeitabhängig und gehorcht einer Bewegungsgleichung. Nach der obigen Diskussion sollte klar sein, dass beide Bilder äquivalent sind. Neben dem Schrödinger- und dem Heisenbergbild, ist für praktische Rechnungen oft das Diracbild (auch Wechselwirkungsbild genannt) sehr nützlich.10 Es wird speziell dann eingesetzt, wenn man den zu einem Hamiltonoperartor gehörenden Zeitentwicklungsoperator nicht analytisch angeben kann und bei der analytischen Diskussion auf Näherungsmethoden angewiesen ist (Störungstheorie). Wir werden darauf zurück kommen. 10 In gewissem Sinne kann man das Diracbild als Mischung aus dem Schrödinger- und dem Heisenbergbild ansehen. Kapitel 10 Elektromagnetische Felder Bisher haben wir noch nicht davon gesprochen, dass viele der Teilchen (Elektronen, Protonen, Ionen, . . . ), deren Dynamik durch die Quantenmechanik beschrieben wird, geladen sind. Unsere bisherigen Überlegungen zur Bewegung eines Teilchens in einem externen (möglicherweise zeitabhängigen) Potenzial V (~x, t) können wir sofort auf geladene Teilchen anwenden, solange das Vektorpotenzial A(~x, t) verschwindet. In diesem Fall gilt V (~x, t) = qφ(~x, t), wobei q die Ladung des betrachteten Teilchens bezeichnet und φ(~x, t) das skalare Potenzial. 10.1 Grundlagen In diesem Kapitel wollen wir die Dynamik in allgemeinen externen elektromagnetischen Feldern untersuchen. Wir rekapitulieren dazu zunächst die wichtigsten Gleichungen der Elektrodynamik. Die Kraft die auf ein klassisches Teilchen der Ladung q wirkt ist die Lorentzkraft 1˙ ~ ~ ~ F (~x, t) = q E(~x, t) + ~x(t) × B(~x, t) , c ~ dem Magnetfeld B ~ und der Lichtgeschwindigkeit c. mit dem elektrischen Feld E, ~ x, t) Diese Felder erhält man in der Elektrodynamik aus dem Vektorpotenzial A(~ und dem skalaren Potenzial φ(~x, t) gemäß ~ ~ x, t) = − 1 ∂ A (~x, t) − ∂φ (~x, t) E(~ c ∂t ∂~x ∂ ~ x, t) = ~ x, t) . B(~ × A(~ ∂~x Wie Sie wissen, ist die klassische, die Energie beschreibende, Hamiltonfunktion Hklass für die Bewegung eines Teilchens der Masse m und Ladung q in einem elektromagnetischen Feld durch 2 1 q~ Hklass (~x, p~; t) = p~ − A(~x, t) + qφ(~x, t) 2m c 117 118 KAPITEL 10. ELEKTROMAGNETISCHE FELDER gegeben. Aus ihr konstruieren wir den quantenmechanischen Hamiltonoperator durch Anwenden des Korrespondenzprinzips (siehe die Diskussion in Anschluss an ~ und φ nicht vom Impuls p~, sondern nur vom Ort ~x abhängen, Postulat 6).1 Da A müssen wir bei der Anwendung des Korrespondenzprinzips nicht auf die Reihenfolge von Operatoren achten. Wir ersetzen also einfach ~x → ~xˆ und p~ → p~ˆ und erhalten den (möglicherweise explizit zeitabhängigen) Hamiltonoperator 1 ˆ q ~ ˆ 2 p~ − A(~x, t) + qφ(~xˆ, t) 2m c 1 ˆ2 ~π + qφ(~xˆ, t) . = 2m t Ht = Beim Übergang von der ersten zur zweiten Zeile haben wir den kinematischen Impulsoperator ˆt := p~ˆ − q A( ~ ~xˆ, t) ~π c eingeführt. Wie wir weiter unten sehen werden ist es - wie der Name nahelegt der für die Kinematik relevante Impulsoperator. In diesem Zusammenhang bezeichnet man p~ˆ auch als den kanonischen Impulsoperator, da seine Komponenten untereinander die kanonischen Vertauschungsrelationen erfüllen. Bei der Konstruktion des obigen Hamiltonoperators sind wir davon ausgegangen, dass das zu beschreibende Teilchen keinen Spinfreiheitsgrad besitzt. Andernfalls müssten wir die bereits mehrfach diskutierte Kopplung des Spinfreiheitsgrades an das externe Magnetfeld berücksichtigen. Wir werden weiter unten auf dieses Problem zurückkommen, wenn wir untersuchen, wie man die Bahnfreiheitsgrade und den Spin eines Teilchens gleichzeitig beschreibt. Zunächst werden wir aber weiter nur spinlose Teilchen untersuchen. Im Gegensatz zu den Komponenten des kanonischen Impulsoperators, vertauschen die des kinematischen Impulsoperators i.A. nicht. Es gilt z.B. [π̂t,1 , π̂t,2 ] = = = = 1 i q q ˆ ˆ p̂1 − A1 (~x, t), p̂2 − A2 (~x, t) c i hc i q h ˆ − p̂1 , A2 (~x, t) − p̂2 , A1 (~xˆ, t) c i~q ∂A2 ˆ ∂A1 ˆ (~x, t) − (~x, t) c ∂x1 ∂x2 i~q B3 (~xˆ, t) , c h Es ist zu beachten, dass das elektromagnetisch Feld weiterhin klassisch behandelt wird. Für alle hier behandelten Probleme ist die Annahme eines klassischen Feldes zulässig. Im Rahmen der Quantenoptik und der Quantenfeldtheorie, muss man auch das elektromagnetische Feld quantisieren. 10.1. GRUNDLAGEN 119 wobei wir ein Ergebnis aus den Übungen verwendet haben. Allgemein gilt 3 i~q X [π̂t,i , π̂t,j ] = εi,j,k Bk (~xˆ, t) . c k=1 Weitere wichtige Kommutatoren sind [x̂i , π̂t,j ] = [x̂i , p̂j ] = i~δi,j 1 und h i h i ~ ∂f π̂t,i , f (~xˆ) = p̂i , f (~xˆ) = (~xˆ) . i ∂xi ˆH (t) herleiten. Es gilt Wir wollen nun Bewegungsgleichungen für ~xˆH (t) und ~π h i d i~ ~xˆH (t) = U † (t) ~xˆ, Ht U (t) dt 3 1 † X hˆ 2 i U (t) ~x, π̂t,j U (t) = 2m j=1 3 h i h i 1 † X ˆ ˆ = π̂t,j ~x, π̂t,j + ~x, π̂t,j π̂t,j U (t) U (t) 2m j=1 = i~ † ˆ U (t)~πt U (t) m und damit 1ˆ dˆ ~xH (t) = ~π H (t) . dt m Diese Gleichung zeigt, dass der “Geschwindigkeitsoperator” für das Teilchen in ˆH (t)/m gegeben einem elektromagnetischen Feld nicht durch p~ˆH (t)/m, sondern ~π ˆH (t) benötigen wir ist. Zur Bestimmung der Bewegungsgleichung für ~π 3 h i 1 X 2 π̂t,i , π̂t,j + q π̂t,i , φ(~xˆ, t) [π̂t,i , Ht ] = 2m j=1 3 1 X ~ ∂φ ˆ = (π̂t,j [π̂t,i , π̂t,j ] + [π̂t,i , π̂t,j ] π̂t,j ) + q (~x, t) 2m j=1 i ∂xi 3 3 3 3 i~q X X ~ ∂φ ˆ = π̂t,j εi,j,k Bk (~xˆ, t) + εi,j,k Bk (~xˆ, t)π̂t,j + q (~x, t) 2mc j=1 k=1 i ∂xi = i~q X X ~ ∂φ ˆ εi,j,k π̂t,j Bk (~xˆ, t) − εi,k,j Bk (~xˆ, t)π̂t,j + q (~x, t) . 2mc j=1 k=1 i ∂xi 120 KAPITEL 10. ELEKTROMAGNETISCHE FELDER Damit ergibt sich ! h i ˆ dˆ † ˆt , Ht + i~ ∂~πt U (t) i~ ~π ~π H (t) = U (t) dt ∂t i~q ˆ † ˆ ˆ ˆ ~ ~ = U (t) ~πt × B(~x, t) − B(~x, t) × ~πt 2mc !) ~ ∂φ 1 ∂A (~xˆ, t) − (~xˆ, t) U (t) +i~q − c ∂t ∂~x bzw. dˆ 1 ˆH (t) × B( ˆH (t) ~ ~xˆH (t), t) − B( ~ ~xˆH (t), t) × ~π ~ ~xˆH (t), t) + ~πH (t) = q E( ~π . dt 2mc ˆH (t) lassen sich zu einer DifferentialDie Bewegungsgleichungen für ~xˆH (t) und ~π gleichung zweiter Ordnung für ~xˆH (t) zusammenfassen 1 dˆ d2 ˆ q ~ ˆ ~ ~xˆH (t), t) E(~xH (t), t) + ~xH (t) × B( ~xH (t) = dt2 m 2c dt dˆ ˆ ~ −B(~xH (t), t) × ~xH (t) . dt Diese Gleichung besitzt nahezu2 die klassische Form 1˙ ¨ ~ ~ ~ m~x = F (~x, t) = q E(~x, t) + ~x(t) × B(~x, t) c und stellt eine Verallgemeinerung des Ehrenfestschen Theorems dar. Für räumlich homogene Felder vereinfacht sich die Operatorgleichung zu 1 dˆ d2 ˆ ~ ~ m 2 ~xH (t) = q E(t)1 + ~xH (t) × B(t) . dt c dt In diesem Fall folgt der Erwartungswert des Ortes wieder der klassischen Trajektorie. Wie im klassischen Fall treten in den Bewegungsgleichungen nur die Felder ~ ~ nicht jedoch die Potenziale φ und A ~ auf. Die Dynamik ist damit unE und B, ~ verwendeten Eichung. Wie Sie wissen sollten, kann abhängig von der für φ und A ~ x, t) imman in der (klassischen) Elektrodynamik von Potenzialen φ(~x, t) und A(~ mer zu anderen Potenzialen (man nennt den Vorgang eine Eichtransformation) 1 ∂χ (~x, t) c ∂t ~ x, t) → A ~ 0 (~x, t) = A(~ ~ x, t) + ∂χ (~x, t) , A(~ ∂~x φ(~x, t) → φ0 (~x, t) = φ(~x, t) − 2 (10.1) (10.2) ˆH (t) und B( ˆH (t), t) i.A. nicht vertauschen. ~ ~x Sie besitzt nur nahezu die klassische Form, da ~π 10.1. GRUNDLAGEN 121 mit einer (hinreichend vernünftigen) Funktion χ(~x, t) übergehen, wobei die Dynamik des Problems invariant bleibt. Letzteres liegt daran, dass die in der klas~ und B ~ invariant unter der sischen Bewegungsgleichung auftretenden Felder E 3 Eichtransformation sind. Im Gegensatz dazu hängt der Hamiltonoperator, ana~ und damit von der log zur Hamiltonfunktion im klassischen Fall, von φ und A gewählten Eichung ab. Damit hängen auch die Lösungen der zeitabhängigen Schrödingergleichung von der Eichung ab. Wie Sie in einer Übungsaufgabe zeigen werden, löst q h~x |ψ 0 (t)i = ψ 0 (~x, t) = exp i χ(~x, t) ψ(~x, t) ~c die Schrödingergleichung zum Hamiltonoperator Ht0 1 ˆ q ~ 0 ˆ 2 p~ − A (~x, t) + qφ0 (~xˆ, t) = 2m c wenn h~x |ψ(t)i = ψ(~x, t) eine Lösung zu Ht = 1 ˆ q ~ ˆ 2 p~ − A(~x, t) + qφ(~xˆ, t) 2m c ist. Die physikalisch relevante Wahrscheinlichkeitsdichte 2 q 2 0 |ψ (~x, t)| = exp i χ(~x, t) ψ(~x, t) = |ψ(~x, t)|2 ~c ist daher invariant unter der Eichtransformation. Der beim Übergang von ψ nach ψ 0 auftretende Phasenfaktor hängt i.A. explizit vom Ort und von der Zeit ab und ist kein globaler Phasenfaktor (deren Bedeutung - oder genauer Unwichtigkeit - wir bereits kennen gelernt haben). Man spricht daher auch von einer lokalen Symmetrie. In der Vorlesung Quantenmechanik II werden Sie mehr über den Zusammenhang zwischen Symmetrien und Invarianzen lernen.4 Die ~x- und t-Abhängigkeit des Phasenfaktors macht es auch etwas komplizierter einzusehen, dass alle physikalischen Vorhersagen (kurz: die Physik) von der Eichung unabhängig sind (im Fall einer globalen Phase ist das evident). Wir wollen das hier nicht im Detail weiterverfolgen und verweisen an dieser Stelle auf die Literatur. An Beispielen werden wir die Eichinvarianz im folgenden explizit sehen. Die Wahrscheinlichkeitsstromdichte, die die dreidimensionale Verallgemeinerung ∂ ∂ ~ ρ(~x, t) + · j(~x, t) = 0 ∂t ∂~x 3 Sie sollten die Invarianz der Felder nocheinmal explizit nachrechnen! Man kann aus der Forderung der lokalen Symmetrie der Quantenmechanik die Existenz der elektromagnetischen Felder “vorhersagen”. 4 122 KAPITEL 10. ELEKTROMAGNETISCHE FELDER der Kontiunitätsgleichung (7.4) erfüllt, ist in Gegenwart eines elektromagnetischen Feldes durch ~ x, t) ψ(~x, t) + c.c. ~j(x, t) := 1 ψ ∗ (~x, t) ~ ∂ − q A(~ 2m i ∂~x c gegeben. Dieses Ergebnis ergibt sich aus einer Verallgemeinerung der Schritte, die uns auf Gl. (7.3) geführt haben. Sie ist, wie physikalisch zu erwarten, durch den kinematischen und nicht den kanonischen Impulsoperator bestimmt. Schreiben wir die Wellenfunktion wieder in der Form p ψ(~x, t) = ρ(~x, t)eiP (~x,t)/~ p (mit reellen Funktionen ρ(~x, t) und P (~x, t)), so folgt ~ x, t) . ~j(~x, t) = ρ(~x, t) ∂P (~x, t) − q A(~ m ∂~x c ~ → A+∂χ/∂~ ~ Umeichung A x liefert für die Phase P → P +qχ/c. Damit hat ~j(x, t) eine eichinvariante Form. In einer Übungsaufgabe werden Sie die Eigenzustände des physikalisch wichtigen Problems eines Teilchens der Ladung q und Masse m in einem räumlich homogenen, zeitlich konstanten Magnetfeld in ~e3 -Richtung bestimmen. Man nennt sie die Landauniveaus. Sie spielen eine wichtige Rolle bei der Erklärung des ganzzahligen und fraktionalen Quanten-Hall-Effekts. 10.2 Der Aharonov-Bohm-Effekt ~ kann man die Eichtransformation (10.1) Für zeitunabhängige Potenziale φ und A und (10.2) auch für die zeitunabhängige Schrödingergleichung betrachten. Ist ~ (mit Eigenwert dann ψE,ν (~x) Eigenfunktion (in Ortsdarstellung) zu H = H(φ, A) E und zusätzlichen Quantenzahlen ν), so ist i h q 0 ψE,ν (~x) = exp i χ(~x) ψE,ν (~x) ~c ~ + ∂χ/∂~x) mit Eigenwert E. Die Eigenwerte E Eigenfunktion zu H 0 = H(φ, A hängen nicht von der gewählten Eichung ab was erneut illustriert, dass alle physikalisch relevanten Größen (d.h. die Physik) unabhängig von der gewählten Eichung sind. Es ist wichtig anzumerken, dass der Hamiltonoperator für verschiedene Wahlen der Eichung verschiedene Symmetrien aufweisen wird. Entsprechend sind die “natürlichen” zusätzlichen q Quantenzahlen von der Eichung 0abhängig und die Eigenfunktion exp i ~c χ(~x) ψE,ν (~x) (in Ortsdarstellung) von H (die sich direkt aus der Eigenfunktion von H ergibt) wird i.A. eine komplizierte Überlagerung der Eigenzustände von H 0 zu den “natürlichen” zusätzlichen Quantenzahlen sein. 10.2. DER AHARONOV-BOHM-EFFEKT 123 Wie die klassische Mechnanik ist die Quantenmechanik wie oben angedeutet unempfindlich gegenüber Eichtransformationen, jedoch spielen die elektromagnetischen Potenziale in letzterer eine andere Rolle als in der klassischen Mechanik. Dieses lässt sich sehr schön anhand des Aharonov-Bohm Effekts illustrieren, der ein reiner Quanteneffekt ist. Er dient gleichzeitig dazu das Konzept der Eichinvarianz (im zeitunabhängigen Fall) in einer Anwedung besser zu verstehen. Wir betrachten ein Teilchen mit Ladung q welches sich nur in einem Raum~ x) = 0 gelten soll. Außerhalb von G soll es bereich G aufhalten kann in dem B(~ Bereiche mit nichtverschwindendem stationären Magnetfeld geben. Dabei kann die Grenze zu G durch “unendlich hohe” Potenzialbarrieren realisiert werden. Unter diesen Voraussetzungen gilt in G zwar ~ x) = 0 , ~ x) = ∂ × A(~ B(~ ∂~x ~ x) = 0 und ein A ~ 6= 0 tritt in der zu lösenden Schrödingergleiaber i.A. nicht A(~ ~ in G verschwindet ist es natürlich nach einer von A ~ unabhängigen chung auf. Da B Lösung der Schrödingergleichung zu suchen. Wir stellen also die Frage, ob man ~ 0 (~x) = 0 in G gilt. Man kann sie eine Eichtransformation finden kann, so dass A mathematisch als Differentialgleichung formulieren. Gesucht ist χ(~x), so dass ~ 0 (~x) = A(~ ~ x) + ∂χ (~x) = 0 A ∂~x (10.3) in G gilt. Die Antwort auf diese Frage von der Topologie von G ab. (a) (b) G x B C G x0 Abbildung 10.1: Skizze für den Fall, dass das Gebiet G in dem wir das Vektor~ “weg-eichen” wollen einfach zusammenhängend ist. potential A In einfach zusammenhängenden Gebieten, wie z.B. in Abbildung 10.1(a), kann die Differentialgleichung (10.3) nach dem Stokesschen Satz (Vektoranalysis) durch eine vom Weg C unabhängige Stammfunktion (siehe Abbildung 10.1(b)) gelöst 124 KAPITEL 10. ELEKTROMAGNETISCHE FELDER ~ in G verschwindet. Für die Funktion χ(~x) folgt werden, da die Rotation von A somit Z ~x ~ y ) · d~y . χ(~x) = − A(~ ~ x0 ~ (A) Damit folgt für die Eigenfunktion ψE,ν (~x) (in Ortsdarstellung) mit einer Eichung, ~ in G nicht verschwindet bei der A Z ~x ~ q (A) 0 ~ ψE,ν (~x) = exp i A(~y ) · d~y ψE,ν (~x) , ~c ~x0 0 mit der Eigenfunktion ψE,ν (~x) (in Ortsdarstellung) zur neuen Eichung, bei der 0 ~ = 0 in G. Dieses Ergebnis zeigt zusätzlich, dass die Energieeigenwerte E nicht A ~ außerhalb von G abhängen, da ja die stationäre Schrödinvon der Feldstärke B ~ 0 = 0 für ψ 0 in G keine Information über das Magnetfeld gergleichung mit A E,ν enthält und die Energieeigenwerte unabhängig von der Eichung sind. (a) G (b) G B x 0− x +0 Abbildung 10.2: Skizze für den Fall, dass das Gebiet G in dem wir das Vektor~ “weg-eichen” wollen nicht mehr einfach zusammenhängend ist. potential A Betrachten wir nun ein Gebiet G welches nicht mehr einfach zusammenhängend ist, wie z.B. in Abbildung 10.2 skizziert (da ein Weg, welcher das Magnetfeld umschließt, nicht mehr kontinuierlich auf einen Punkt zusammengezogen werden kann). Für einen geschlossenen Integrationsweg wie in Abbildung 10.2(b) (dort blau) gilt nach dem Satz von Stokes I ZZ ZZ ∂ ~ ~ ~ ~ · df~ =: φ(B) ~ , A(~y ) · d~y = × A(~y ) · df = B ∂~y 10.2. DER AHARONOV-BOHM-EFFEKT 125 ~ durch die Querschnittsfläche. Führt man nun mit dem magnetischen Fluss φ(B) eine Trennwand in den G beschreibenden Zylinder ein (rot in Abbildung 10.2(b)), so erhält man wieder ein einfach zusammenhängendes Gebiet G̃. Wählen wir als Startpunkt unseres Wegintegrals einen Ort ~x+ 0 infinitesimal rechts von der − Trennwand und als Endpunkt einen Ort ~x0 infinitesimal links von der Wand, so gelten die folgenden zwei Relationen ~ (A) 0 x+ ψE,ν (~x+ 0) , 0 ) = ψE,ν (~ ( ) Z ~x−0 ~ q (A) ~ y ) · d~y ψ 0 (~x− ) , ψE,ν (~x− A(~ 0 ) = exp i E,ν 0 ~c ~x+0 0 mit der Eigenfunktion ψE,ν (~x) (in Ortsdarstellung), ~x ∈ G̃, bei verschwindendem Vektorpotential (aber mit Trennwand). Im Gebiet G ohne Trennwand ist die ~ ~ 6= 0) ψ (A) Wellenfunktion (bestimmt in Gegenwart von A x) eindeutig, so dass E,ν (~ + − im Limes ~x0 → ~x0 ~ (A) ~ (A) ψE,ν (~x+ x− 0 ) − ψE,ν (~ 0) = 0 ~ gilt. Für das A-Feld freie System mit Trennwand folgt dann nach den obigen Gleichungen die Randbedingung ) ( Z ~x−0 q 0 0 ~ y ) · d~y ψE,ν A(~ (~x− 0 = ψE,ν (~x+ 0) 0 ) − exp i ~c ~x+0 o n q 0 0 ~ φ( B) ψE,ν (~x− (10.4) = ψE,ν (~x+ ) − exp i 0) 0 ~c auf der Trennwand. Betrachten wir nun den Fall eines Elektrons mit q = −e. Dann gilt ~ 0 −i2πφ(B)/φ0 0 ψE,ν (~x+ ψE,ν (~x− 0) = e 0) , mit dem magnetischen Flussquantum φ0 := hc ≈ 1.24 × 10−6 Tesla m2 e ~ modulo dem Flussquantum φ0 – Somit folgt, dass der magnetische Fluss φ(B) ~ – in die Randbedingung der Eigenfunktionen (in und damit das Magnetfeld B Ortsdarstellung) eingeht. Bevor wir die Konsequenzen unser obigen Überlegungen diskutieren, wollen wir unser bisheriges Vorgehen für nicht einfach zusammenhängende Gebiete ~ 6= 0 ohne Trennnocheinmal zusammenfassen: Wir haben das System mit A 0 ~ = 0 und der Randbedingung Gl. (10.4) wand auf ein System mit Trennwand, A abgebildet. 126 KAPITEL 10. ELEKTROMAGNETISCHE FELDER ~ Es ergeben sich die folgenden Konsequenzen: Da in die Randbedingung B ~ und nicht A eingeht, sind die Eigenwerte eichinvariant. Weiterhin folgt das Theorem von Byers und Young, das besagt, dass die Eigenwerte in der betrachteten ~ Geometrie periodische Funktionen von φ(B)/φ 0 sind. Auf den ersten Blick mag es verwundern, dass die Energieeigenwerte über~ abhängen (da ja B ~ = 0 in G). Diese Tatsache wird haupt von φ und damit B jedoch plausibel, wenn man sich überlegt, was passiert, wenn man die Magnetfeldstärke ändert. In diesem Fall wird aufgrund des Faradayschen Gesetzes in G eine elektrische Ringspannung induziert, die die Energie der Elektronen verändert. Eine beeindruckende Manifestation dieser Überlegungen ist der AharonovBohm Effekt (1959) – der eigentlich Ehrenberg-Siday Effekt heißen müßte, da er erstmals von Ehrenberg und Siday 1949 vorhergesagt wurde. Eine Realisation dieses Effekts, die von Aharonov und Bohm diskutiert wurde, ergibt sich im uns bereits bekannten Doppelspaltexperiment mit Elektronen. Eine Skizze des Aufbaus ist in Abbildung 10.3 gezeigt. Im Unterschied zum bisher beschriebene Doppelspaltexperiment umschließt die Vereinigung der beiden “Elektonenpfade” eine Spule mit deren Hilfe ein (veränderliches) Magnetfeld erzeugt wird. Die Spule ist durch eine “unendlich” hohe Potenzialwand abgeschirmt, so dass die Elektronen sich nur im magnetfeldfreien Raum aufhalten können. Nach Aharonov und Bohm erwartet man nun, dass sich das Interferenzbild auf dem Schirm periodisch ~ mit φ(B)/φ 0 verändert. Diese Erwartung wurde, wie in Abbildung 10.4 gezeigt, experimentell bestätigt. Abbildung 10.3: Skizze zum Aharonov-Bohm Effekt im Doppelspalt Experiment Aufgrund der komplexen Geometrie ist eine genaue Beschreibung des Experimentes recht aufwendig. Wir wollen uns daher hier auf eine näherunsweise Beschreibung beschränken, die die Beobachtung plausibel macht. Sei zunächst der zweite Spalt geschlossen, so ist das feldfreie Gebiet einfach zusammenhängend. Dann gilt Z ~ e (A) ~ ψ1 (~x) = exp −i A(~y ) · d~y ψ10 (~x) , ~c Pfad1 10.2. DER AHARONOV-BOHM-EFFEKT 127 Abbildung 10.4: Interferenzmuster im Dopplespalt mit eingeschlossenem magnetischem Fluss. ~ 0 = 0 bestimmt ist. Analog folgt im Fall eines geschlossenen ersten wobei ψ10 für A Spalts Z ~ e (A) ~ A(~y ) · d~y ψ20 (~x) . ψ2 (~x) = exp −i ~c Pfad2 Sind beide Spalte geöffnet so setzten wie näherungsweise für die Gesamtwellenfunktion ~ (A) ~ (A) ~ (A) ψtot (~x) ≈ ψ1 (~x) + ψ2 (~x) Z 0 e −i2πφ/φ0 0 ~ = ψ1 (~x) + e ψ2 (~x) exp −i A(~y ) · d~y . ~c Pfad1 Für die Wahrscheinlichkeitsdichte gilt dann ~ 2 (A) 2 0 ψtot (~x) ≈ ψ1 (~x) + e−i2πφ/φ0 ψ20 (~x) . ~ 0 = 0 bestimmten Wellenfunktionen ψ 0 Die Phasenrelation zwischen den für A 1/2 wird somit periodisch mit φ/φ0 geändert, was zu einer periodischen Verschiebung des Interferenzmusters führt. Heutzutage ist der Aharonov-Bohm Effekt von großem Interesse in der mesoskopischen Physik. Mesoskopische Systeme sind dadurch charakterisiert, dass ihre räumliche Ausdehnung kleiner ist als die typische Längenskala, auf der durch die Wechselwirkung mit der “Umgebung”, die Phase einer Wellenfunktion zerstört 128 KAPITEL 10. ELEKTROMAGNETISCHE FELDER wird. Das verdeutlicht, dass den Phasen im Elektronentransport durch mesoskopische Systeme eine wichtige Rolle zukommt. Ein typischer Aufbau zur Untersuchung des Aharonov-Bohm Effekts in mesoskopischen Systemen ist in Abbildung 10.5 gezeigt. Zu sehen ist ein kontaktierter Goldring mit einem Durchmesser von ca. 800 nm. Abbildung 10.5: Goldring zur Realisierung des Aharonov-Bohm Effekts in einem mesoskopischen System. 10.3 Weiteres Postulat: Komposition von Quantensystemen Wir wollen nun untersuchen, wie sich die Spin- und Bahnfreiheitsgrade eines quantenmechanischen Teilchens gleichzeitig beschreiben lassen. Dabei beschränken wir uns auf den Fall des Elektrons, dessen Spinfreiheitsgrad wir in Kapitel 3 untersucht haben.5 Von einer allgemeineren Warte aus betrachtet sind wir daran interessiert zwei kinematisch getrennte Quantensysteme mit Hilberträumen H1 und H2 zu einem zusammenzufassen. Eine Vorschrift dafür legen wir in einem weiteren Postulat fest: Postulat 7: Der Hilbertraum des Gesamtsystems ist durch das Tensorprodukt6 der Hilberträume Hi gegeben H = H1 ⊗ H2 . 5 Zur Erinnerung: Unser Startpunkt in Kapitel 3 waren experimentelle Untersuchungen an Silberatomen. Wie am Ende des Kapitels erwähnt, stammt der Spinfreiheitsgrad des Silberatoms jedoch von dem Spinfreiheitsgrad eines der 47 Elektronen des Silberatoms. 6 Wenn Sie das Tensorprodukt nicht kennen, so sollten Sie etwas weiter unten in der Lage sein, zu verstehen, wie der Tensorproduktraum durch die Basen von H1 und H2 aufgespannt wird. 10.4. DIE PAULIGLEICHUNG: SPIN- UND BAHNFREIHEITSGRADE 129 Die Konsequenzen dieses Postulats und die Wirkung von Operatoren auf dem Tensorproduktraum, wollen wir uns gleich für das uns aktuell interessierende Problem der Komposition der Spin- und Bahnfreiheitsgrade überlegen. 10.4 Die Pauligleichung: Spin- und Bahnfreiheitsgrade Im konkreten Beispiel gilt für den Hilbertraum des Gesamtsystems H = HBahn ⊗ HSpin , also für die Bewegung eines Elektrons im dreidimensionalen Raum H = L2 (R3 ) ⊗ C2 . Bezeichnen wir die Eigenzustände zu einem Hamiltonoperator, der nur die Bahnfreiheitsgrade berücksichtigt, wie gehabt mit |E, νi, so bilden die Zustände {|E, νi} eine Basis in HBahn .7 Als eine der möglichen Basen in HSpin = C2 wählen wir die Zustände {|~e3 , ±i}.8 Die Tensorproduktzustände |E, ν; ±i := |E, νi ⊗ |~e3 , ±i bilden eine Basis in H = HBahn ⊗ HSpin . Ein beliebiger Zustand |ψi ∈ H kann damit immer als Z X Z X Z X Z X X X cE,ν,µ |E, νi ⊗ |~e3 , µi , cE,ν,µ |E, ν; µi = |ψi = E ν E µ=± ν µ=± mit cE,ν,µ ∈ C, geschrieben werden. Über die Skalarprodukte in HBahn und HSpin ist eindeutig ein Skalarprodukt auf H = HBahn ⊗ HSpin festgelegt. Betrachten wir neben |ψi den Zustand |ϕi mit (aE,ν,µ ∈ C) Z X Z X Z X Z X X X aE,ν,µ |E, νi ⊗ |~e3 , µi , aE,ν,µ |E, ν; µi = |ϕi = E ν E µ=± ν µ=± so gilt hϕ |ψi = Z X Z X ν,ν 0 E,E 0 = Z X Z X E,E 0 = ν,ν 0 Z X Z X X E ν X a∗E,ν,µ cE 0 ,ν 0 ,µ0 (hE, ν| ⊗ h~e3 , µ|) (|E 0 , ν 0 i ⊗ |~e3 , µ0 i) µ,µ0 =± X a∗E,ν,µ cE 0 ,ν 0 ,µ0 hE, ν |E 0 , ν 0 i h~e3 , µ |~e3 , µ0 i µ,µ0 =± a∗E,ν,µ cE,ν,µ , µ=± wobei wir ausgenutzt haben, dass für Tensorproduktvektoren E E (i) (i) |χi i = χBahn ⊗ χSpin , 7 8 Für das Folgende könnten wir auch jede beliebige andere Basis in HBahn wählen. Für das Folgende könnten wir auch jede beliebige andere Basis {|~n, ±i} in HSpin wählen. 130 KAPITEL 10. ELEKTROMAGNETISCHE FELDER mit E E (i) (i) χBahn ∈ HBahn , χSpin ∈ HSpin , D E E (2) (2) (1) (1) χBahn ⊗ χSpin χBahn ⊗ χSpin D ED E (2) (1) (1) (2) = χBahn χBahn χSpin χSpin hχ1 | χ2 i = D gilt. Es ist wichtig zu beachten, dass nicht jedes Element aus H als solch ein Tensorproduktvektor schreibbar ist. Wir betrachten nun lineare Operatoren A auf HBahn und B auf HSpin . Wir wollen beide Operatoren auf H = HBahn ⊗ HSpin erweitern. Dazu definieren wir à := A ⊗ 1Spin und B̃ := 1Bahn ⊗ B. Um die Wirkung von à und B̃ festzulegen, reicht es anzugeben, wie die beiden Operatoren auf einen beliebigen Tensorproduktzustand |χi = |χBahn i ⊗ |χSpin i ∈ H wirken à |χi = A |χBahn i ⊗ |χSpin i B̃ |χi = |χBahn i ⊗ B |χSpin i . Die Wirkung auf einen beliebigen Zustand aus H ergibt sich durch Anwenden dieser Regel auf die Zerlegung des Zustandes in der obigen Basis die aus Tensorproduktzuständen besteht. Oft schreibt man für die Operatoren A ⊗ 1Spin bzw. 1Bahn ⊗B auf H kurz A bzw. B. Man unterdrückt also den jeweiligen 1 Operator. Neben den Operatoren auf H die durch die Erweiterung von Operatoren auf HBahn bzw. HSpin entstehen, kann es solche geben, die eine Wechselwirkung zwischen den Bahn- und Spinfreiheitsgraden beschreiben und die Form A = ABahn ⊗ ASpin haben. Ihre Wirkung auf einen Tensorproduktzustand ist durch A |χi = ABahn |χBahn i ⊗ ASpin |χSpin i gegeben. Eine völlig analoge Tensorproduktkonstruktion benötigt man, wenn man mehrere quantenmechanische Teilchen gleichzeitig betrachtet. Für zwei Teilchen könnten dies z.B. das Elektron und das Proton eines Wasserstoffatoms sein. In diesem Fall ersetzen wir in unseren obigen Überlegungen die Indizes “Bahn” und “Spin” durch “Elektron” und “Proton”. Eine Basis in H = HElektron ⊗ HProton ergibt sich wie oben durch das Bilden aller Tensorproduktvektoren aus Basisvektoren aus HElektron und HProton . Wir werden weiter unten auf das Wasserstoffatom zurückkommen. ~ verschwindet. Betrachten wir zunächst den Fall, dass das äußere Magnetfeld B 9 Damit ist die Energie unabhängig von der Richtung des Spins. Der Hamiltonoperator für ein Elektron mit Ladung q = −e, wobei e die Elementarladung 9 Wir vernachlässigen hier die Spin-Bahn-Kopplung zwischen dem Spinoperator und dem Operator des Bahndrehimpulses (siehe unten). 10.4. DIE PAULIGLEICHUNG: SPIN- UND BAHNFREIHEITSGRADE 131 bezeichnet, ergibt sich zu 1 ˆ2 p~ ⊗ 1Spin − eφ(~xˆ, t) ⊗ 1Spin . 2m Die zeitabhängige Schrödingergleichung lautet 1 ˆ2 d ˆ p~ ⊗ 1Spin − eφ(~x, t) ⊗ 1Spin |ψ(t)i . i~ |ψ(t)i = dt 2m Ht = In der Orts-Spin-Darstellung mit Basisvektoren |~x, ±i := |~xi ⊗ |~e3 , ±i lässt sich die Schrödingergleichung in die Matrixform ~2 ∂ ψ+ (~x, t) − 2m ∆ − eφ(~x, t) ψ+ (~x, t) 0 = , i~ ~2 ψ− (~x, t) ∂t ψ− (~x, t) ∆ − eφ(~x, t) 0 − 2m mit ψ± (~x, t) := h~x, ± |ψ(t)i , ~ = 0 erhalten wir zwei unabhängige, identische Schrödingergleibringen. Für B chungen, jeweils eine für die beiden möglichen Spinstellungen des Elektrons. In diesem Fall können wir somit bei der Diskussion des Bahnfreiheitsgrads zunächst den Spinfreiheitsgrad vernachlässigen und ihn am Ende leicht hinzufügen. Das bisher zur quantenmechanischen Beschreibung von Bahnfreiheitsgraden gelernte lässt sich somit leicht auf den Fall des Elektrons mit Spinfreiheitsgrad verallge~ = 0 zu einer zusätzlichen zweifachen meinern.10 Der Spinfreiheitsgrad führt bei B Entartung der Eigenwerte E (diskret oder kontinuierlich) des Hamiltonoperators mit den Eigenvektoren |E, ν, +i und |E, ν, −i.11 Zur Beschreibung eines Elektrons in einem externen Magnetfeld muss man neben der Kopplung des Bahnfreiheitsgrades an das Magnetfeld auch die bereits ~ x, t) · ~σ zwischen dem Spin und dem in Kapitel 3 untersuchte Kopplung −µ0 B(~ Magnetfeld berücksichtigen. Der Hamiltonoperator auf H = HBahn ⊗ HSpin lautet daher 2 e~ ˆ 1 ˆ p~ ⊗ 1Spin + A( ~x, t) ⊗ 1Spin − eφ(~xˆ, t) ⊗ 1Spin Ht = 2m c 3 X −µ0 Bj (~xˆ, t) ⊗ σj . j=1 10 Für andere Teilchen mit einem Spinfreiheitsgrad kann man analog verfahren. Das Elektron ist ein so genanntes Spin-1/2 Teilchen. Sein Spinfreiheitsgrad lässt sich durch Vektoren aus C2 beschreiben. Auch andere quantenmechanische Teilchen haben Spinfreiheitsgrade von diesem Typ. Es gibt jedoch auch Teilchen mit Spinfreiheitsgraden, die eine Beschreibung in einem höherdimensionalen Raum erfordert. Sie werden in der Vorlesung Quantenmechanik II auf dieses Thema zurückkommen. 11 132 KAPITEL 10. ELEKTROMAGNETISCHE FELDER In der Vorlesung Quantenmechanik II werden Sie lernen, wie man µ0 durch die Ladung −e, die Masse m, die Lichtgeschwindigkeit c und den so genannten gFaktor ausdrückt. In dieser Vorlesung werden Sie auch die Spin-Bahn-Kopplung zwischen dem Spin und dem Bahndrehimpuls diskutieren, die einen Zusatzterm zu diesem Hamiltonoperator darstellt. Die zeitabhängige Schrödingergleichung in der Orts-Spin-Darstellung ergibt sich zu ! 2 1 ~ ∂ e~ ∂ ψ+ (~x, t) 1 0 ψ+ (~x, t) = + A(~x, t) − eφ(~x, t) i~ 0 1 ψ− (~x, t) ∂t ψ− (~x, t) 2m i ∂~x c B3 (~x, t) B1 (~x, t) − iB2 (~x, t) ψ+ (~x, t) −µ0 . B1 (~x, t) + iB2 (~x, t) −B3 (~x, t) ψ− (~x, t) Man nennt sie die Pauligleichung. Dabei haben wir die Darstellung der σj , j = 1, 2, 3, in der |~e3 , ±i Basis, d.h. die Pauli-Spinmatrizen, Gl. (3.7) verwendet. Die ~ Gleichungen für ψ± (~x, t) sind durch das B-Feld gekoppelt. Kapitel 11 Der Drehimpuls in der Quantenmechanik 11.1 Drehimpulsoperatoren Der Bahndrehimpuls eines Punktteilchens ist in der klassischen Mechanik durch ~l = ~x × p~ gegeben. Dem Korrespondenzprinzip folgend definieren wir den quantenmechanischen Bahndrehimpulsoperator ~ˆl = ~xˆ × p~ˆ . Für die z-Komponente ergibt sich beispielsweise ˆl3 = x̂1 p̂2 − x̂2 p̂1 . Da die verschiedenen in ˆlj auftretenden Komponenten von ~xˆ und p~ˆ vertauschen, sieht man ˆ sofort, dass ~l selbstadjungiert ist. Wir wollen das Eigenwertspektrum der ˆlj bestimmen. Da der Raum isotrop ist, reicht es das Spektrum von ˆl3 zu berechnen. Der Drehimpuls hat die Dimension einer Wirkung und wir geben die Eigenwerte als Vielfache von ~ an ˆl3 |m, νi = ~m |m, νi , mit m ∈ R und den zusätzlichen “Quantenzahlen” ν, die die Entartung der Eigenzustände charakterisieren.1 Das Entartung vorliegt, sieht man explizit in der Ortsdarstellung2 ∂ ∂ ~ ˆ h~x| l3 |ψi = x1 − x2 h~x |ψi . i ∂x2 ∂x1 Die Zahl m bezeichnet hier nicht die Masse des Teilchens. Da die Eigenwerte zu ˆl3 aber meist mit m~ bezeichnet werden, wollen wir dieser Konvention hier folgen. Aus dem Kontext sollte stets klar werden, ob mit m die Masse oder der (durch ~ dividierte) Eigenwert zu ˆl3 gemeint ist. 2 Wir vernachlässigen jetzt wieder den möglichen Spinfreiheitsgrad. 1 133 134 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK Die Funktion h~x |ψG i := c exp (−α [x21 + x22 + x23 ]), mit α > 0, liefert ~ ∂ ∂ 2 2 2 h~x| ˆl3 |ψG i = x1 − x2 ce−α[x1 +x2 +x3 ] i ∂x2 ∂x1 ~ (−2α) (x1 x2 − x2 x1 ) h~x |ψi = i = 0. Damit gilt ˆl3 |ψG i = 0 und |ψG i ist Eigenvektor zum Eigenwert m = 0.3 Der Eigenwert m = 0 ist unendlichfach entartet, da jede Funktion vom Typ h~x |ψi = f (x21 + x22 , x3 ) einen Eigenvektor |ψi zu ˆl3 mit Eigenwert 0 liefert. Ähnlich wie beim Hamiltonoperator des harmonischen Oszillator gibt es ein rein algebraisches Verfahren die Eigenwerte zu bestimmen auf das wir später zurückkommen werden. Zunächsteinmal werden wir expliziten gebrauch von der Differentialgleichung in der Ortsdarstellung machen. Dazu gehen wir auf Kugelkoordinaten x1 = r sin θ cos ϕ x2 = r sin θ sin ϕ x3 = r cos θ bzw. Zylinderkoordinaten x1 = ρ cos ϕ x2 = ρ sin ϕ x3 = z über. Es gilt h~x |ψi = ψ(x1 , x2 , x3 ) = ψ̃(r, θ, ϕ) = ψ̄(ρ, ϕ, z) . Differentiation nach ϕ liefert ∂ ∂ h~x |ψi ∂x1 ∂ h~x |ψi ∂x2 h~x |ψi = + ∂ϕ ∂x1 ∂ϕ ∂x ∂ϕ 2 ∂ ∂ = x1 − x2 h~x |ψi ∂x2 ∂x1 und damit h~x| ˆl3 |ψi = ~ ∂ h~x |ψi . i ∂ϕ (11.1) Wir werden auch m als den Eigenwert von ˆl3 bezeichnen, obwohl es natürlich korrekt ~m heißen müsste. 3 11.1. DREHIMPULSOPERATOREN 135 In Kugelkoordinaten lautet das Eigenwertproblem dann ∂ ψ̃(r, θ, ϕ) = im ψ̃(r, θ, ϕ) . ∂ϕ Die Eigenfunktionen h~x |m, νi = ψ̃m,ν (r, θ, ϕ) haben damit die Form ψ̃m,ν (r, θ, ϕ) = eimϕ fm,ν (r, θ) . Da die Eigenfunktion wohldefiniert und stetig sein muss folgt ψ̃(r, θ, ϕ + 2π) = ψ̃(r, θ, ϕ) (11.2) und damit m ∈ Z. Das Spektrum ist weder nach oben noch nach unten beschränkt. Um die Eigenvektoren |m, νi weiter zu charakterisieren, wollen wir selbstadjungierte Operatoren finden, die mit ˆl3 vertauschen und damit einen gemeinsamen Satz von Eigenvektoren mit ˆl3 haben (siehe das Ende von Kapitel 2). Wie man unter der Verwendung von [A, BC] = [A, B] C + B [A, C] leicht nachrechnet, gilt (Einsteinsche Summationskonvention) i h ˆli , ˆlj = i~ εi,j,k ˆlk . Völlig analoge Vertauschungsregeln haben wir für die Komponenten des Spinoperators in Gl. (3.15) hergeleitet. Bereits in diesem Zusammenhang hatten wir auf die strukturelle Ähnlichkeit zu den Poissonklammern von Drehimpulskomponenten in der klassischen Mechanik hingewiesen. Allgemein nennt man einen ˆ Vektoroperator ~j mit Vertauschungsrelationen h i ĵi , ĵj = i~ εi,j,k ĵk (11.3) einen Drehimpulsoperator. Wir werden die Diskussion mit solch einem allgemeinen Drehimpulsoperator, der nur über die Vertauschungsrelationen seiner Komponenten festgelegt ist, fortsetzen. Dabei gilt es zu beachten, dass wir für ein ˆ allgemeines ~j noch keine Information über die Eigenwerte zu ĵ3 haben, was ja für ˆl3 bereits der Fall ist. Da die verschiedenen Komponenten von ~ˆj nicht miteinander vertauschen, können ĵ1 und ĵ2 nicht zur eindeutigen Charakterisierung der Eigenvektoren von ĵ3 verwendet werden (man kann die ĵi nicht simultan “diagoˆ nalisieren”). Für den Operator ~j 2 = ĵ12 + ĵ22 + ĵ32 erhalten wir h i h i h i ˆ ĵ3 , ~j 2 = ĵ3 , ĵ12 + ĵ3 , ĵ22 h i h i h i h i = ĵ1 ĵ3 , ĵ1 + ĵ3 , ĵ1 ĵ1 + ĵ2 ĵ3 , ĵ2 + ĵ3 , ĵ2 ĵ2 = i~ ĵ1 ĵ2 + ĵ2 ĵ1 − ĵ2 ĵ1 − ĵ1 ĵ2 = 0 136 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK und analog für i = 1, 2, h i ˆ2 ~ ĵi , j = 0 . Man kann somit gemeinsame Eigenzustände zu einer Komponente ĵi (also z.B. ˆ ˆ ĵ3 ) und ~j 2 finden. ~j 2 ist ein (so genannter) positiver Operator, d.h. es gilt ˆ ˆ hψ| ~j 2 |ψi ≥ 0 für alle |ψi ∈ H. Damit sind die Eigenwerte von ~j 2 größer oder gleich Null. Sie haben die Dimension Wirkung2 . Aufgrund dieser beiden Beobˆ achtungen können wir für die Eigenwerte von ~j 2 , ~2 j(j + 1), mit j ∈ R und ˆ j ≥ 0, schreiben. Die gemeinsamen Eigenvektoren zu ~j 2 und ĵ3 bezeichnen wir mit |j, m, νi. Es gilt (m ∈ R) ~ˆj 2 |j, m, νi = ~2 j(j + 1) |j, m, νi ĵ3 |j, m, νi = ~m |j, m, νi . ˆ Da auch ~j 2 − ĵ32 = ĵ12 + ĵ22 ein positiver Operator ist, gilt für die zugehörigen Eigenwerte ~2 [j(j + 1) − m2 ] ≥ 0 und damit m2 ≤ j(j + 1) . Wir definieren Auf- und Absteigeoperatoren4 ĵ+ := ĵ1 + iĵ2 ĵ− := ĵ1 − iĵ2 , mit j+† = ĵ− . Sie erfüllen die Vertauschungsrelationen i i h h ĵ3 , ĵ± = ĵ3 , ĵ1 ± iĵ2 = i~ĵ2 ± i(−i~)ĵ1 = ±~ĵ± und h i h i h i h i ~ˆj 2 , ĵ± = ĵ12 , ĵ1 ± iĵ2 + ĵ22 , ĵ1 ± iĵ2 + ĵ32 , ĵ1 ± iĵ2 h i h i h i h i = ±iĵ1 ĵ1 , ĵ2 ± i ĵ1 , ĵ2 ĵ1 + ĵ2 ĵ2 , ĵ1 + ĵ2 , ĵ1 ĵ2 h i h i h i h i +ĵ3 ĵ3 , ĵ1 ± iĵ3 ĵ3 , ĵ2 + ĵ3 , ĵ1 ĵ3 ± i ĵ3 , ĵ2 ĵ3 = ∓~ĵ1 ĵ3 ∓ ~ĵ3 ĵ1 − i~ĵ2 ĵ3 − i~ĵ3 ĵ2 + i~ĵ3 ĵ2 + i~ĵ2 ĵ3 ± ~ĵ3 ĵ1 ± ~ĵ1 ĵ3 = 0, 4 Wir werden sehr bald sehen, dass diese Namensgebung gerechtfertigt ist. 11.1. DREHIMPULSOPERATOREN 137 sowie die Gleichung ĵ± ĵ∓ = ĵ12 + ĵ22 ˆ ∓ i ĵ1 , ĵ2 = ~j 2 − ĵ32 ± ~ĵ3 . h i Falls es sich bei ĵ± |j, m, νi nicht um den Nullvektor handelt, dann sind diese ˆ Zustände ebenfalls Eigenvektoren zu ~j 2 und ĵ3 ~ˆj 2 ĵ± |j, m, νi = ĵ±~ˆj 2 |j, m, νi = ~2 j(j + 1)ĵ± |j, m, νi ĵ3 ĵ± |j, m, νi = ĵ± ĵ3 ± ~1 |j, m, νi = ~(m ± 1)ĵ± |j, m, νi , ˆ wobei sich der Eigenwert von ~j 2 nicht ändert und der von ĵ3 um ~ erhöht bzw. erniedrigt wird. Da m2 ≤ j(j + 1) gilt, gibt es zu einem vorgegebenem j ein minimales mmin und ein maximales mmax . Für m = mmax muss ĵ+ |j, mmax , νi = 0 gelten. Aus dieser Forderung folgt ˆ ĵ− ĵ+ |j, mmax , νi = ~j 2 − ĵ32 − ~ĵ3 |j, mmax , νi = ~2 [j(j + 1) − mmax (mmax + 1)] |j, mmax , νi = 0 und damit mmax = j. Analog gilt ˆ ĵ+ ĵ− |j, mmin , νi = ~j 2 − ĵ32 + ~ĵ3 |j, mmin , νi = ~2 [j(j + 1) − (−mmin )(−mmin + 1)] |j, mmin , νi = 0 also mmin = −j. Für ein fest vorgegebenes j ergibt sich damit die Folge m = −j, −j + 1, −j + 2, . . . , j − 1, j von möglichen Eigenwerten von ĵ3 . In ganzzahligen Schritten gelangt man von −j nach j nur dann, wenn j ganz- oder halbzahlig ist, also j = 0, 1/2, 1, 3/2, 2, . . .. Für die möglichen Werte von m und j ergibt sich das in Abbildung 11.1 dargestellte Diagramm. Um zu sehen, welche Werte von j für einen Drehimpulsoperator angenommen werden, benötigt man über die allgemeinen Vertauschungsregeln Gl. (11.3) hinausgehende Informationen. Aus ˆ unserer Diskussion des Bahndrehimpulses ~l = ~xˆ × p~ˆ wissen wir, dass in diesem Fall die Werte von m ganzzahlig sind und j ∈ N0 gilt. Da wir weiterhin m ∈ Z gefunden haben, m jedoch nur in [−j, −j + 1, . . . , j − 1, j] liegen kann, muss j beliebig groß werden können. Für den Spin des Elektrons gilt m = ±1/2 und damit j = s = 1/2. Letzteres kann man auch direkt folgern, da nach Gl. (3.5), 2 2 21 1 ~σ = 3 1, und damit nach der Definition von ~s Gl. (3.14) ~s = ~ 2 2 + 1 1 gilt. 138 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK j 3 2 1 −3 −2 −1 0 1 2 3 m Abbildung 11.1: Die sich aus der Kommutatorrelation für einen allgemeinen Drehimpulsoperator ergebenden möglichen Werte von j und m. In der Natur sind auch andere j Werte für den Spin von “Elementarteilchen” verwirklicht. Aufgrund der Orthogonalität der |j, m, νi gilt 1 hj, m, ν| ĵ1 |j, m, νi = hj, m, ν| ĵ+ + ĵ− |j, m, νi = 0 2 i hj, m, ν| ĵ2 |j, m, νi = − hj, m, ν| ĵ+ − ĵ− |j, m, νi = 0 . 2 ˆ Die Eigenzustände |j, m, νi zu ĵ3 und ~j 2 sind keine Eigenzustände zu ĵ12 und ĵ22 , d.h. die Quadrate der x- und y-Komponenten des Drehimpulses können in diesen Zuständen nicht scharf gemessen werden. Im Gegensatz dazu sind die |j, m, νi Eiˆ genzustände des Operators ĵ12 + ĵ22 = ~j 2 − ĵ32 mit Eigenwert ~2 [j(j + 1) − m2 ] und die Summe der Quadrate der x- und y-Komponenten des Drehimpulses nimmt in diesen Zuständen einen scharfen Wert an. Diese Beobachtungen führen auf das anschauliche Bild Abbildung 11.2, welches in vielen Büchern der Experimentalphysik zu finden ist, aber mit großer Vorsicht zu gebrauchen ist. Es suggeriert einerseits, dass die x- und y-Komponenten des Drehimpulses gleichzeitig scharfe Werte annehmen können, was nicht der Fall ist, da ĵ1 und ĵ2 nicht vertauschen. Außerdem ignoriert diese Darstellung, dass auch die Eigenwerte von ĵ1 und ĵ2 quantisiert sind und eine Messung von ĵ1 bzw. ĵ2 in dem Zustand |j, m, νi einen Wert ~m mit m ∈ [−j, −j + 1, . . . , j − 1, j] ergibt. Eine detailliertere Diskussion dazu finden Sie in einem pädagogischen Artikel von Herrn Schönhammer, den Sie unter der ergänzenden Literatur finden. Solange m < mmax (bzw. m > mmin ) liefert die Anwendung von ĵ+ (bzw. ĵ− ) auf |j, m, νi wieder einen Eigenzustand ĵ± |j, m, νi = c±j,m |j, m ± 1, νi . 11.1. DREHIMPULSOPERATOREN 139 1/2 h[j(j+1)−m2 ] 1/2 hm h[j(j+1)] j e3 Abbildung 11.2: Anschauliche Darstellung des Drehimpulses wie man sie in vielen Büchern der Experimentalphysik findet. Sie ist jedoch in zweierlei Hinsicht irreführend (siehe Text). Es gilt j,m 2 c+ = hj, m, ν| ĵ+† ĵ+ |j, m, νi = hj, m, ν| ĵ− ĵ+ |j, m, νi ˆ = hj, m, ν| ~j 2 − ĵ32 − ~ĵ3 |j, m, νi = ~2 [j(j + 1) − m(m + 1)] und damit p c+j,m = ~ j(j + 1) − m(m + 1) . Analog folgt c−j,m = ~ p j(j + 1) − m(m − 1) . Die Proportionalitätskonstanten c±j,m liefern dann (wie beim harmonischen Oszillator) ĵ+ |j, mmax , νi = 0 ĵ− |j, mmin , νi = 0 . 140 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK ˆ Wir kehren nun zum Bahndrehimpulsoperator ~l = ~xˆ × p~ˆ zurück. Die Eigenvektoren bezeichnen wir in diesem Fall mit |l, m, νi. Zur Bestimmung der Eigenfunkˆ tionen von ~l2 und ˆl3 verwendet man vorteilhafterweise Kugelkoordinaten. Für sie gilt 1 ∂ ∂ = ~x · ∂r r ∂~x ∂ ∂ ∂ ∂ = x3 cos ϕ + x3 sin ϕ − r sin θ ∂θ ∂x1 ∂x2 ∂x3 ∂ ∂ ∂ = x1 − x2 . ∂ϕ ∂x2 ∂x1 Die dritte dieser Relationen haben wir bereits verwendet um in Gl. (11.1) ˆl3 in der Ortsdarstellung durch die partielle Ableitung nach ϕ auszudrücken. Um auch ˆl1 und ˆl2 durch partielle Ableitungen nach r, θ und ϕ auszudrücken, müssen wir die obigen Relationen nach den ∂/∂xi auflösen. Damit erhalten wir ∂ ~ ∂ ∂ ∂ ˆ x2 h~x |ψi − x3 ± i x3 − x1 h~x| l± |ψi = i ∂x3 ∂x2 ∂x1 ∂x3 ∂ ∂ ±iϕ = ~e ± + i cot θ h~x |ψi . ∂θ ∂ϕ ˆ Mit ~l 2 = ˆl32 + ˆl+ ˆl− + ˆl− ˆl+ /2 folgt daraus ˆ h~x| ~l 2 |ψi = −~2 1 ∂ ∂ 1 ∂2 sin θ + sin θ ∂θ ∂θ sin2 θ ∂ϕ2 h~x |ψi . (11.4) ˆ In h~x| ~l 2 |ψi treten nur Ableitungen nach den Winkeln θ und ϕ auf. Die Eigenwertgleichung ~ˆl 2 |l, m, νi = ~2 l(l + 1) |l, m, νi kann somit in der Ortsdarstellung mit Hilfe eines Separationsansatzes h~x |l, m, νi = Yl,m (θ, ϕ) Rl,m,ν (r) (11.5) gelöst werden. Die Yl,m (θ, ϕ) sind Lösungen der Differentialgleichung ∂ 1 ∂2 1 ∂ Yl,m (θ, ϕ) = l(l + 1)Yl,m (θ, ϕ) . − sin θ + sin θ ∂θ ∂θ sin2 θ ∂ϕ2 Man nennt sie die Kugelflächenfunktionen. Nach Konstruktion sind sie ebenfalls Eigenfunktionen zu ˆl3 , so dass nach unseren obigen Überlegungen ihre ϕAbhängigkeit durch exp (imϕ), mit m ∈ Z, gegeben ist. In Analogie zum Vorgehen beim harmonischen Oszillator bestimmt man die Yl,l (θ, ϕ) am einfachsten 11.1. DREHIMPULSOPERATOREN 141 aus den Abbruchbedingungen ˆl+ |l, l, νi = 0, d.h. aus ∂ ∂ ∂ ∂ + i cot θ Yl,l (θ, ϕ) = + i cot θ eilϕ Ỹl,l (θ) = 0 . ∂θ ∂ϕ ∂θ ∂ϕ Aus dieser Beziehung erhält man die Differentialgleichung ∂ − l cot θ Ỹl,l (θ) = 0 . ∂θ für Ỹl,l (θ) mit der Lösung Ỹl,l (θ) = cl sinl θ . Damit gilt Yl,l (θ, ϕ) = cl eilϕ sinl θ . Die Normierungskonstante wir im Allgemeinen so gewählt, dass der hier betrachtete Winkelanteil für sich normiert ist, also gemäß der Forderung Z 2π Z π Yl,l∗ (θ, ϕ)Yl,l (θ, ϕ) sin θ dθ dϕ 1 = 0 0 Z 2π Z π 2 sin2l θ sin θ dθ dϕ . = |cl | 0 0 Integration liefert cl bis auf einen Phasenfaktor, den wir hier so wählen, dass r (−1)l (2l + 1)! . cl = l 2 l! 4π Die weiteren Yl,m erhält man durch sukzessives Anwenden des Absteigeoperators ˆl− , d.h. unter Verwendung von p ˆl− |l, m, νi = ~ l(l + 1) − m(m − 1) |l, m − 1, νi . Diese Relation liefert die Rekursionsgleichung Yl,m−1 (θ, ϕ) = p = p 1 (l − m + 1)(l + m) 1 e −iϕ ∂ − − m cot θ Yl,m (θ, ϕ) ∂θ e−iϕ ∂ [sinm θ Yl,m (θ, ϕ)] . m−1 ∂ (cos θ) θ (l − m + 1)(l + m) sin Aus diesen Überlegungen ergibt sich s r l−m (−1)l 2l + 1 (l + m)! eimϕ d Yl,m (θ, ϕ) = l sin2l θ . 2 l! 4π (l − m)! sinm θ d cos θ 142 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK Man bezeichnet die Kugelflächenfunktionen mit l = 0, 1, 2, 3, 4, . . . der Reihe nach als s-, p-, d-, f -, g-,. . . Funktionen. Bei festem l kann m jeweils 2l + 1 Werte annehmen, so dass es eine s-Funktion, drei p-Funktionen, fünf d-Funktionen, sieben f -Funktionen,. . . gibt. Für bis zu l = 2 lauten sie explizit r 1 , Y0,0 (θ, ϕ) = 4π r 3 cos θ 4π r 3 ±iϕ Y1,±1 (θ, ϕ) = ∓ e sin θ , 8π Y1,0 (θ, ϕ) = r 5 3 cos2 θ − 1 16π r 15 ±iϕ e sin θ cos θ Y2,±1 (θ, ϕ) = ∓ 8π r 15 ±2iϕ 2 Y2,±2 (θ, ϕ) = e sin θ . 32π Y2,0 (θ, ϕ) = Da die ϕ-Abhängigkeit nur durch die exp (imϕ) gegeben ist hängt |Yl,m (θ, ϕ)|2 nicht von ϕ ab. Weiterhin gilt |Yl,m (θ, ϕ)|2 = |Yl,−m (θ, ϕ)|2 . Das Betragsquadrat von Kugelflächenfunktionen niedriger Ordnung ist in Abbildung 11.3 dargestellt. Ohne Beweise5 wollen wir zwei wichtige Eigenschaften der Kugelflächenfunktionen angeben. Sie erfüllen die Orthogonalitätsrelation Z 2π Z π ∗ Yl,m (θ, ϕ)Yl0 ,m0 (θ, ϕ) sin θ dθ dϕ = δl,l0 δm,m0 . (11.6) 0 0 Diese ist Ausdruck von hl, m, ν |l0 , m0 , ν 0 i = δl,l0 δm,m0 δ(ν, ν 0 ), wobei δ(ν, ν 0 ) die δ-Funktion δ(ν − ν 0 ) bezeichnet, wenn ν kontinuierlich ist und das Kronecker-δ δν,ν 0 , falls ν diskret ist.6 5 Sie finden diese in vielen Büchern zur Quantenmechanik. Wir werden sehen, dass in den hier untersuchten Problemen ν immer nur für eine weitere Quantenzahl steht. 6 11.1. DREHIMPULSOPERATOREN Abbildung 11.3: Darstellung von |Yl,m (θ, ϕ)|2 . 143 144 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK Zusätzlich gilt die Vollständigkeitsrelation ∞ X l X ∗ Yl,m (θ, ϕ)Yl,m (θ0 , ϕ0 ) = δ(ϕ − ϕ0 )δ(θ − θ0 ) l=0 m=−l 1 . sin θ Sie ergibt sich aus Z X ∞ X l X ν |l, m, νi hl, m, ν| = 1 , l=0 m=−l dem Separationsansatz für h~x |l, m, νi und δ(~x − ~x 0 ) = r2 1 δ(r − r0 ) δ(ϕ − ϕ0 ) δ(θ − θ0 ) . sin θ Gemäß der Vollständigkeitsrelation lässt sich jede hinreichend vernünftige Funktion f (θ, ϕ) nach den Kugelflächenfunktionen entwickeln f (θ, ϕ) = l ∞ X X fl,m Y (θ, ϕ) , l=0 m=−l mit Koeffizienten Z 2π π Z ∗ Yl,m (θ, ϕ)f (θ, ϕ) sin θ dθ dϕ . fl,m = 0 11.2 0 Rotationen und Translationen Bevor wir im übernächsten Kapitel das über den Bahndrehimpuls gelernte dazu einsetzen werden das Problem eines quantenmechanischen Teilchens in einem Zentralpotenzial zu behandeln (und darauf aufbauend das Spektrum des Wasserstoffatoms bestimmen werden), wollen wir, wie angekündigt, nocheinmal auf den Zusammenhang zwischen Rotationen und dem Drehimpulsoperator, bzw. Translationen und dem Impulsoperator eingehen. Beginnen wir mit dem Letzteren. Wir definieren einen Operator T~a über seine Wirkung auf den uneigentlichen Ortzustand T~a |~xi := |~x + ~ai . 11.2. ROTATIONEN UND TRANSLATIONEN 145 Aus dieser Definitionsgleichung erhalten wir durch Multiplikation mit 1 von links T~a |~xi = 1 |~x + ~ai Z = |~p i h~p |~x + ~ai dd p d R d Z 1 √ = |~p i e−i~p·(~x+~a)/~ dd p 2π~ Rd Z = |~p i e−i~p·~a/~ h~p |~xi dd p Rd Z −ip ~ˆ·~a/~ |~p i h~p |~xi dd p = e Rd = e −ip ~ˆ·~a/~ |~xi . Da die |~xi (über-)vollständig sind und eine Basis bilden, können wir allgemein folgern, dass ˆ T~a = e−ip~·~a/~ gilt. Um zu bestimmen, wie T~a auf einen allgemeinen Zustand |ψi ∈ H, mit Ortsdarstellung h~x |ψi = ψ(~x), wirkt, betrachten wir |ψ~a i := T~a |ψi und erhalten in der Ortsdarstellung h~x |ψ~a i = h~x| T~a |ψi ˆ = h~x| exp −ip~ · ~a/~ |ψi = h~x − ~a |ψi = ψ(~x − ~a) . T~a |ψi ist der um ~a verschobene Zustand. Wir haben damit gefunden, dass der Operator exp −ip~ˆ · Translationsvektor/~ . eine allgemeine Translation generiert. Es besteht eine strukturelle Ähnlichkeit zur Rotation im Spinraum Gl. (9.4). Völlig analog können wir nun einen Operator T~e3 ,α definieren, der eine Rotation (mathematisch positiv) um die ~e3 -Achse mit Winkel α vermittelt |ψ~e3 ,α i := T~e3 ,α |ψi , 146 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK mit ψ̃~e3 ,α (r, θ, ϕ) = h~x| T~e3 ,α |ψi := ψ̃(r, θ, ϕ − α) . Um T~e3 ,α explizit zu bestimmen, könnte man, wie im Fall der Translation, eine 1 einschieben, die hier aus den Zuständen |l, m, νi besteht. Wir werden aber anders verfahren. Differentiation der obigen Gleichung nach α liefert h~x| d ∂ T~e3 ,α |ψi = − ψ̃(r, θ, ϕ − α) dα ∂ϕ ∂ = − h~x| T~e3 ,α |ψi ∂ϕ i = − h~x| ˆl3 T~e3 ,α |ψi . ~ Da die Zustände |ψi und |~xi beliebig sind, folgt die Operatorgleichung d i T~e3 ,α = − ˆl3 T~e3 ,α . dα ~ Die Anfangsbedingung lautet T~e3 ,α=0 = 1. Die Lösung der Differentialgleichung ist T~e3 ,α = exp −i α ˆl3 /~ . Aufgrund der Isotropie des Raumes erhalten wir für eine allgemeine Rotation um die Achse ~n mit Winkel α ˆ ~ T~n,α = exp −i α l · ~n/~ , bzw. erneut die Struktur (siehe Gl. (9.4)) ˆ exp −i Drehwinkel ~l · ~eDrehachse /~ . Wir wollen nun kurz den Zusammenhang zwischen Operatoren dieser Art (Rotationen sowohl des Bahnfreiheitsgrads als auch des Spins und Translationen), also Symmetrietransformationen und Erhaltungsgrößen beleuchten. Mehr dazu lernt man in der Quantenmechanik II Vorlesung. Wie man leicht zeigt, sind die obigen Operatoren unitär und haben die Form T (ν) = e−iĜν/~ mit einem selbstadjungierten Operator Ĝ (hier Impuls- bzw. Drehimpulsoperator) den man in diesem Kontext auch als den Generator bezeichnet. Es ist physikalisch plausibel die Invarianz eines durch den Hamiltonoperator H beschriebenen Systems unter einer Translation oder Rotation über die Gleichung hψ| H |ψi = hψν | H |ψν i (11.7) 11.3. DIE ADDITION VON DREHIMPULSEN 147 mit |ψν i = T (ν) |ψi für alle |ψi aus dem zugrundeliegenden Hilbertraum zu definieren. Äquivalent gilt H = T † (ν)HT (ν) . Betrachten wir nun infinitesimale Translationen oder Rotationen so können wir den Operator T (ν) in führender Ordnung in ν entwickeln i T (ν) = 1 − ν Ĝ + O(ν 2 ) . ~ Eingesetzt in Gl. (11.7) liefert das hψ| H |ψi = hψν | H |ψν i = hψ| T † (ν)HT (ν) |ψi = hψ| (1 + iν Ĝ/~)H(1 − iν Ĝ/~) |ψi + O(ν 2 ) iν = hψ| H |ψi + hψ| [Ĝ, H] |ψi + O(ν 2 ) . ~ Da der Zustand |ψi beliebig ist, bedeutet das [Ĝ, H] = 0 . Wir können somit schließen, dass ein System invariant unter einer Symmetrietransformation (hier Translation und Rotation) ist, wenn der zugehörige Generator (hier Impuls- und Drehimpulsoperator) eine Erhaltungsgröße ist. Ein analoger Zusammenhang zwischen Erhaltungsgrößen und Symmetrietransformationen sollte ihnen aus der klassischen Mechanik bekannt sein. Genauer bedeutet das, dass ein System translationsinvariant in eine spezifische (alle) Richtung(en) des euklidischen Raums ist, wenn der Impulsoperator in diese (alle) Richtung(en) eine Erhaltungsgröße ist (Beispiel: freies Teilchen). Rotationsinvarianz bezüglich einer gewählten Achse (z.B. der z-Richtung) ergibt sich, wenn die Komponente des Drehimpulsoperators in diese Richtung (z.B. ˆl3 ) mit dem Hamiltonoperator vertauscht. 11.3 Die Addition von Drehimpulsen Zum Einstieg in dieses Kapitel betrachten wir das einfache Beispiel zweier Spin1/2 Teilchen, deren orbitale Freiheitsgrade wir vernachlässigen. Dem Postulat 7 148 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK folgend ist der Hilbertraum des zusammengesetzten Systems durch das Tensorprodukt der Einteilchen-Hilberträume gegeben, also H = H1 ⊗ H2 . Er wird durch die Zustände |s1 , m1 ; s2 , m2 i := |s1 , m1 i ⊗ |s1 , m2 i aufgespannt, wobei die |si , mi i, mit i = 1, 2, die Drehimpulseigenzustände für jeweils einen der Spins sind und si = 1/2, mi = ±1/2 gilt. Für die Tensorproduktzustände folgt somit ~sˆi 2 |s1 , m1 ; s2 , m2 i = ~2 si (si + 1) |s1 , m1 ; s2 , m2 i , ŝi,3 |s1 , m1 ; s2 , m2 i = ~mi |s1 , m1 ; s2 , m2 i , (1) (1) wobei wir ŝ1,k = ŝ1,k ⊗ 1(2) , mit k = 1, 2, 3 und dem Operator ŝ1,k der auf den Einteilchen-Raum des ersten Teilchens wirkt, definiert haben (und analog für i = 2; siehe Kapitel 10.4). Da si = 1/2 gilt, können wir die Tensorproduktzustände etwas einfacher schreiben: |+, +i, |+, −i, |−, +i und |−, −i. Die neue Notation ergibt sich aus |s1 = 1/2, m1 = 1/2; s2 = 1/2, m2 = −1/2i = |+, −i usw.. Diese Produktzustände formen eine Basis von Vektoren mit definierten Längen und definierten z-Komponenten der individuellen Spins (Eigenzustände zu den entsprechenden Spinoperatoren). Wir stellen nun die Frage, ob wir nicht auch Zustände in H finden können, die Eigenzustände zum Quadrat des totalen Spin-(Drehimpuls-)operators sind. Wenn ja, welches sind die sich ergebenden Werte für die Länge des totalen Spins und seiner z-Komponente? Dazu betrachten wir den Operator (2) (2) ~ˆ := ~sˆ1 + ~sˆ2 := ~sˆ(1) S + 1(1) ⊗ ~sˆ2 , 1 ⊗1 den wir den totalen Spin-(Drehimpuls-)operator nennen. Wir können mehrere Gründe angeben, warum der so definierte Operator tatsächlich den totalen Spin des zusammengesetzten Systems beschreibt. Zunächsteinmal wird die Konstruktion durch unsere Intuition suggeriert. Zweitens kann man sich überlegen, dass man mit Hilfe dieses Operators die Rotationen der Produktzustände (und damit des ganzen Systems) generieren kann (siehe das letzte Kapitel). Drittens erfüllen die Komponenten die Kommutatorrelation Gl. (11.3). Unser Ziel ist es nun die ~ˆ 2 und Ŝ3 zu bestimmen. Eigenwerte und die (gemeinsamen) Eigenvektoren zu S Wir beginnen mit der z-Komponente Ŝ3 = ŝ1,3 + ŝ2,3 . Man sieht sofort, dass Ŝ3 |+, +i Ŝ3 |+, −i Ŝ3 |−, +i Ŝ3 |−, −i = = = = (~/2 + ~/2) |+, +i = ~ |+, +i , 0 |+, −i 0 |−, +i −~ |−, −i 11.3. DIE ADDITION VON DREHIMPULSEN 149 gilt. Die erlaubten Werte der z-Komponente des totalen Drehimpulses sind somit ~, 0 und −~. Durch Ausnutzen der Orthonormaltät der Tensorproduktzustände ergibt sich dann leicht die Matrixdarstellung des Operators Ŝ3 in der Produktbasis 1 0 0 0 . 0 0 0 0 Ŝ3 = ~ 0 0 0 0 . 0 0 0 −1 Der Eigenraum zum Eigenwert 0 ist zweifach entartet und wird durch die Vektoren |+, −i und |−, +i aufgespannt. Innerhalb dieses Unterraums können wir nun Linearkombinationen bilden, die weiterhin Eigenzustände zu Ŝ3 aber nicht mehr zu den z-Komponenten der individuellen Spins sind. Wir betrachten im nächsten Schritt die Länge des totalen Spins, d.h. den ~ˆ 2 . Diesen schreiben wir wie folgt um Operator S 2 ~ˆ 2 = ~sˆ1 + ~sˆ2 = ~sˆ1 2 + ~sˆ2 2 + 2~sˆ1 · ~sˆ2 . S Dabei haben wir ausgenutzt, dass die Operatoren ~sˆ1 und ~sˆ2 vertauschen (da ~sˆi Tensorprduktoperatoren sind, dessen nicht trivialer Teil nur auf das Teilchen i ~ˆ2 vertauscht mit den ~sˆi 2 , wegen des ~sˆ1 · ~sˆ2 Terms (der wirkt). Der Operator S die ŝi,1/2 enthält) jedoch nicht mit den ŝi,3 . Wie man leicht nachrechnet ist die ~ˆ2 in der Produktbasis durch Matrixdarstellung von S 2 . 2 0 ~ˆ 2 = S ~ 0 0 0 1 1 0 0 1 1 0 0 0 0 2 gegeben. Wir sehen somit, dass die Zustände |++i und |−−i Eigenzustände von ~ˆ 2 , mit Eigenwert ~2 s(s + 1) = ~2 1(1 + 1) = 2~2 , sind, nicht jedoch die beiden S Produktzustände |±, ∓i mit Eigenwert Null zu Ŝ3 . In diesem Unterraum lassen ~ˆ2 angeben. Sie haben die Form sich sehr einfach Eigenvektoren zu S 1 √ (|+−i + |−+i) , 2 1 √ (|+−i − |−+i) 2 und die Eigenwerte ~2 s(s+1) = ~2 1(1+1) = 2~2 bzw. ~2 s(s+1) = ~2 0(0+1) = 0. Damit haben wir unsere anfangs gestellte Frage beantwortet. Die Erlaubten Werte ~ˆ 2 sind s = 0 und 1, während die Eigenwerte von Ŝ3 durch für den totalen Spin S 150 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK ~, 0 und −~ für s = 1 bzw. 0 für s = 0 gegeben sind. In der Produktbasis geschrieben ergibt sich für die Eigenvektoren |s = 1, m = 1, s1 = 1/2, s2 = 1/2i = |++i , 1 |s = 1, m = 0, s1 = 1/2, s2 = 1/2i = √ (|+−i + |−+i) , 2 |s = 1, m = −1, s1 = 1/2, s2 = 1/2i = |−−i , 1 |s = 0, m = 0, s1 = 1/2, s2 = 1/2i = √ (|+−i − |−+i) . 2 (11.8) Die drei Zustände mit Spin s = 1 bezeichnet man als Triplettzustände während man den s = 0 Zustand ein Singulett nennt. Das Addieren von Drehimpulsen ist somit das Problem eines Basiswechsels von einer, in der die Operatoren (~sˆ1 2 , ~sˆ2 2 , ŝ1,3 , ŝ1,3 ) diagonal sind, zu einer in ~ˆ 2 , Ŝ3 , ~sˆ1 2 , ~sˆ2 2 ) diagonal sind. Symbolisch geschrieben haben wir somit das der (S Resultat 1/2 ⊗ 1/2 = 1 ⊕ 0 erhalten, was bedeutet, dass man das Tensorprodukt zweier Spin-1/2 Hilberträume als direkte Summe eines Spin-1 und eines Spin-0 Raumes schreiben kann. Die Eigenzustände zum totalen Spin haben eine Eigenschaft, die für unsere späteren Überlegungen zu Systemen mehrere ununterscheidbarer Teilchen essentiell sein werden. Vertauscht man in den Triplettzuständen die beiden Teilchen, so ist der Zustand symmetrisch, d.h. der Zustand reproduziert sich. Der Singulettzustand ist dagegen antisymmetrisch unter der Vertauschung der beiden Teilchen, d.h. der Zustand reproduziert sich bis auf ein Minuszeichen. Da wir nun zwei mögliche Basen für das Problem zweier Spin-1/2 Teilchen konstruiert haben, stellt sich die Frage welche der beiden wir verwenden sollten. Die Antwort hängt vom zu untersuchenden Problem ab. Befinden sich die beiden Spins ausschließlich in einem äußeren Magnetfeld (z.B. in z-Richtung), d.h. ist der Hamiltonoperator durch ~ = −B (γ1 ŝ1,3 + γ2 ŝ2,3 ) H = − γ1~sˆ1 + γ2~sˆ2 · B gegeben, so ist die offensichtliche Wahl, die H diagonalisiert, die Produktbasis. Gilt jedoch γ1 = γ2 , so folgt H ∝ Ŝ3 und wir hätten ebenfalls die SingulettTriplett-Basis wählen können. Wenn die beiden Spins dagegen über ihre magnetischen Momente wechselwirken (und kein äußeres Magnetfeld vorliegt), ist der Hamiltonoperator durch ~ˆ 2 − ~sˆ1 2 − ~sˆ2 2 /2 H = γ~sˆ1 · ~sˆ2 = γ S gegeben, der durch die Singulett-Triplett-Basis diagonalisiert wird. 11.3. DIE ADDITION VON DREHIMPULSEN 151 Nach diesem einführenden Beispiel wollen wir das allgemeine Problem der ˆ ˆ Addition zweier Drehimpulse ~j1 und ~j2 betrachten. Die Frage ist, welches die ˆ Eigenwerte und Eigenvektoren zu J~ 2 und Jˆ3 mit ˆ ˆ ˆ ˆ(1) ˆ(2) J~ := ~j1 + ~j2 := ~j1 ⊗ 1(2) + 1(1) ⊗ ~j2 sind (diese Operatoren erfüllen die üblichen Drehimpulsvertauschungsrelationen), wobei wir letztere in der Produktbasis mit Zuständen |j1 , m1 ; j2 , m2 i ausdrücken wollen. Um sie zu beantworten könnten wir dem einführenden Beispiel folgend ˆ die (2j1 + 1)(2j2 + 1)-dimensionalen Matrizendarstellungen der Operatoren J~ 2 und Jˆ3 bezüglich der Produktbasis konstruieren und diese diagonalisieren. Der Operator Jˆ3 ist in dieser Basis bereits diagonal da Jˆ3 |j1 , m1 ; j2 , m2 i = ~(m1 + m2 ) |j1 , m1 ; j2 , m2 i . Der Unterraum zum Eigenwert ~m := ~(m1 +m2 ) wird dabei im Allgemeinen eine Dimension größer als 1 aufweisen, da es mehrere Möglichkeiten gibt, m in zwei Zahlen mi zu zerlegen. Ausnahmen bilden dabei die Fälle m = ±(j1 + j2 ) wenn beide Impulse eine maximale Projektion in die z-Richtung haben. Da die explizite ˆ Diagonalisierung von J~ 2 in den Unterräumen mit Eigenvektoren zu Jˆ3 mühsam sein kann, werden wir diesen Gedanken hier nicht weiterverfolgen. Stattdessen beschränken wir uns zunächst darauf nur zu untersuchen, was die erlaubten Werte j sind. Unsere Erfahrung aus dem Beispiel zweier Spin-1/2 Teilchen und zusätzlich unsere Intuition sagt uns, dass j die Werte j1 +j2 , j1 +j2 −1, . . . , |j1 −j2 | annehmen kann. Wir können zunächst überprüfen, dass die Zahl der neuen Basiszustände gleich der in der Produktbasis (2j1 + 1)(2j2 + 1) ist. Es gilt (o.B.d.A nehmen wir an, dass j1 ≥ j2 ) j1 +j2 j1 +j2 X X j=j1 −j2 (2j + 1) = j1 −j2 −1 (2j + 1) − j=0 X (2j + 1) = (2j1 + 1)(2j2 + 1) , j=0 wobei wir N X n=0 n= N (N + 1) 2 benutzt haben. Aus Zeitgründen sind wir an dieser Stelle lax und nehmen dieses bereits als den Beweis unserer Vermutung zu den möglichen Werten von j. Es gilt also j1 ⊗ j2 = (j1 + j2 ) ⊕ (j1 + j2 − 1) ⊕ . . . ⊕ |j1 − j2 | . 152 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK ˆ Damit sind die Eigenzustände zu J~ 2 und Jˆ3 durch |j, m, j1 , j2 i mit j1 + j2 ≥ j ≥ |j1 − j2 | und j ≥ m ≥ −j gegeben. Um sie zu bestimmen ordnen wir diese in einer Matrixstruktur so an, dass die Spalten durch von j1 + j2 nach |j1 − j2 | absteigende j-Werte und die Zeilen durch von j nach −j absteigende m-Werte indiziert sind. Der Zustand in der linken oberen Ecke |j = j1 + j2 , m = j1 + j2 , j1 , j2 i ist aufgrund des maximalen Wertes der z-Komponente des Drehimpulses proportional zum Produktzustand |j1 , j1 ; j2 , j2 i (siehe das Beispiel zweier Spin-1/2 Teilchen). Den wegen der Normierung nur noch freien Phasenfaktor wählen wir zu 1. Damit gilt |j1 + j2 , j1 + j2 , j1 , j2 i = |j1 , j1 ; j2 , j2 i . Zum Zustand in der zweiten Zeile der ersten Spalte mit m = j1 + j2 − 1 gelangen wir durch Anwenden des Absteigeoperators Jˆ− := ĵ1,− + ĵ2,− : Jˆ− |j1 + j2 , j1 + j2 , j1 , j2 i = = = = ~ [2(j1 + j2 )]1/2 |j1 + j2 , j1 + j2 − 1, j1 , j2 i (ĵ1,− + ĵ2,− ) |j1 + j2 , j1 + j2 , j1 , j2 i (ĵ1,− + ĵ2,− ) |j1 , j1 ; j2 , j2 i ~[2j1 ]1/2 |j1 , j1 − 1; j2 , j2 i +~[2j2 ]1/2 |j1 , j1 ; j2 , j2 − 1i oder nach |j1 + j2 , j1 + j2 − 1, j1 , j2 i aufgelöst 1/2 j1 |j1 , j1 − 1; j2 , j2 i |j1 + j2 , j1 + j2 − 1, j1 , j2 i = j1 + j2 1/2 j2 + |j1 , j1 ; j2 , j2 − 1i . (11.9) j1 + j2 Diesem Schema folgend können wir uns bis zum Element in der letzte Zeile der ersten Spalte vorarbeiten. Im nächsten Schritt betrachten wir das Element in der ersten Zeile der zweiten Spalte mit j = j1 + j2 − 1 und m = j1 + j2 − 1. Dieser Zustand kann durch eine Linearkombination der beiden Produktzustände |j1 , j1 ; j2 , j2 − 1i und |j1 , j1 − 1; j2 , j2 i gebildet werden (siehe das Beispiel der zwei Spin-1/2 Teilchen). Er muss auf 1 normiert sein und senkrecht auf der anderen durch diese beiden Produktzustände gebildeten Linearkombination Gl. (11.9) |j1 + j2 , j1 + j2 − 1, j1 , j2 i stehen. Man zeigt leicht, dass der Zustand 1/2 j2 |j1 , j1 − 1; j2 , j2 i |j1 + j2 − 1, j1 + j2 − 1, j1 , j2 i = j1 + j2 1/2 j1 |j1 , j1 ; j2 , j2 − 1i − j1 + j2 11.3. DIE ADDITION VON DREHIMPULSEN 153 diese Eigenschaften hat. Die anderen Elemente der zweiten Spalte mit m = j1 + j2 − 2, . . . , −(j1 + j2 − 1) folgen dann erneut durch wiederholtes Anwenden des Absteigeoperators Jˆ− . Das erste Element der dritten Spalte mit j = j1 +j2 −2 und m = j1 + j2 − 2 ist eine Linearkombination von drei Produktzuständen. Die drei Entwicklungskoeffizienten folgen aus den drei Bedingungen der Orthogonalität zu ˆ den zwei (bereits konstruierten) Eigenzuständen zu J~ 2 mit gleichem m und der Normiertheit. Aus diesen Überlegungen sollte klar sein, dass es immer genügend Bedingungen gibt den jeweils ersten Zustand einer Spalte zu bestimmen und zu den anderen Elementen dieser Spalte durch Anwenden des Absteigeoperators zu gelangen. Aufgrund der Vollständigkeit der beiden Basen kann man die Eigenzustände ˆ ˆ ˆ ˆ zu J~ 2 und Jˆ3 bei festem j1 und j2 (genauer zu J~ 2 , Jˆ3 und ~j12 , ~j12 ) als Linearkombination |j, m, j1 , j2 i = j1 X j2 X hj1 , m1 ; j2 , m2 | j, m, j1 , j2 i |j1 , m1 ; j2 , m2 i m1 =−j1 m2 =−j2 schreiben. Die Entwicklungskoeffizienten hj1 , m1 ; j2 , m2 | j, m, j1 , j2 i bezeichnet man als Clebsch-Gordon-Koeffizienten. Sie haben Eigenschaften, die sich direkt aus den Eigenschaften von Drehimpulseigenzuständen ergeben (siehe z.B. R. Shankar, Principles of Quantum Mechanics). Als ein weiteres wichtiges Beispiel werden sie in den Übungen das Beispiel der Addition des Spins eines Spin-1/2 Teilchens (z.B. eines Elektrons) mit dem zugehörigen Bahndrehimpuls untersuchen. In Analogie zum Beispiel der Addition von zwei Spin-1/2 Freiheitsgraden mit einer ~sˆ1 · ~sˆ2 -Kopplung, ist die sich ergebene Basis von besonderem Nutzen wenn man die so genannte Spin-Bahn-Kopplung, die durch den Hamiltonoperator ˆ ˆ ˆ H = γ ~l · ~sˆ = γ J~ 2 − ~l 2 − ~sˆ 2 /2 (11.10) gegeben ist, betrachtet. Sie ist eine relativistische Korrektur zur Quantenmechanik, die von Bedeutung für den Aufbau von Atomen ist (siehe Vorlesungen zur Quantenfeldtheorie und zur Atomphysik). 154 KAPITEL 11. DER DREHIMPULS IN DER QUANTENMECHANIK Kapitel 12 Ein Teilchen im Zentralpotenzial Wir wollen nun das wichtige Problem des Teilchens in einem Zentralpotenzial V (~x) = V (|~x|) mit dem Hamiltonoperator p~ˆ 2 H= + V (|~xˆ|) 2m untersuchen. Da das Potenzial nur vom Abstand zum Ursprung abhängt, ist das Problem invariant unter einer beliebigen Rotation, deren Achse durch den Ursprung geht.1 Aus diesem allgemeine Argument ergibt sich, dass die Komponenten des Bahndrehimpulsoperators ˆli mit H vertauschen, was wir aber nocheinmal exemplarisch für ˆl3 nachrechnen wollen. Es gilt # " h i ˆ2 p ~ ˆl3 , H = x̂1 p̂2 − x̂2 p̂2 , + V (|~xˆ|) 2m " # " # h i h i ˆ2 ˆ2 p ~ p ~ = x̂1 p̂2 , V (|~xˆ|) + x̂1 , p̂2 − x̂2 p̂1 , V (|~xˆ|) − x̂2 , p̂1 2m 2m ~ ∂V ˆ ~ ∂V ˆ 1 1 = x̂1 (|~x|) − x̂2 (|~x|) + x̂1 , p̂21 p̂2 − x̂2 , p̂22 p̂1 i ∂x2 i ∂x1 2m 2m ~ ∂V ˆ i~ i~ ~ ∂V ˆ (|~x|) − x̂2 (|~x|) + p̂1 p̂2 − p̂2 p̂1 = x̂1 i ∂x2 i ∂x1 m 2m ~ ∂V ˆ ~ ∂V ˆ = x̂1 (|~x|) − x̂2 (|~x|) i ∂x2 i ∂x1 = 0, da V nur eine Funktion von |~x| ist. Analog lassen sich leicht auch die Kommutatoren von H mit den anderen Komponenten des Bahndrehimpulsoperators berechnen. Man findet h i ˆli , H = 0 1 Letzteres stellt keine Einschränkung dar, da auch der Drehimpuls Bezug auf den Koordinatenursprung nimmt. 155 156 KAPITEL 12. EIN TEILCHEN IM ZENTRALPOTENZIAL und damit auch h i ~ˆl 2 , H = 0 . Aufgrund dieser Kommutatorrelationen kann man gemeinsame Eigenvektoren zu ˆ ~l 2 , ˆl3 und H konstruieren, die wir mit |l, m, Ei bezeichnen.2 Die Bezeichnung suggeriert bereits, das keine weiteren Quantenzahlen zur eindeutigen Charakterisierung der Eigenzustände nötig sind, was wir später explizit sehen werden. Die ˆ Operatoren ~l 2 , ˆl3 und H bilden daher ein vollständiges System kommutierender Operatoren (siehe das Ende von Kapitel 2). Die drei Eigenwertgleichungen ergeben sich zu ~ˆl 2 |l, m, Ei = ~2 l(l + 1) |l, m, Ei ˆl3 |l, m, Ei = ~m |l, m, Ei H |l, m, Ei = E |l, m, Ei . i h Da H, ˆl± = 0 folgt H ˆl± |l, m, Ei = ˆl± H |l, m, Ei = E ˆl± |l, m, Ei . Somit ist neben |l, m, Ei auch |l, m ± 1, Ei Eigenvektor von H zum gleichen Eigenwert E. Für festes l haben die 2l + 1 Eigenzustände zu verschiedenen m alle den gleichen Energieeigenwert, d.h. der Energieeigenwert E ist mindestens 2l + 1-fach entartet. In Ortsdarstellung lautet die zeitunabhängige Schrödingergleichung ~2 ∆ + V (|~x|) h~x |l, m, Ei = E h~x |l, m, Ei . − 2m Aufgrund der Symmetrie des Problems bietet es sich an Kugelkoordinaten zu verwenden. Der Laplaceoperator ∆ ergibt sich in diesen zu3 1 1 ∂ ∂ 1 ∂2 1 ∂2 r+ 2 . ∆= sin θ + r ∂r2 r sin θ ∂θ ∂θ sin2 θ ∂ϕ2 ˆ Der Winkelanteil [. . .] hat bis auf den Vorfaktor dieselbe Form wie h~x| ~l 2 |ψi in ˆ Gl. (11.4). Verwenden wir ~l 2 |l, m, Ei = ~2 l(l + 1) |l, m, Ei, so ergibt sich ~2 1 ∂ 2 ~2 l(l + 1) − r+ + V (r) h~x |l, m, Ei = E h~x |l, m, Ei . 2m r ∂r2 2mr2 ˆ 2 Wir spezifizieren also die im letzten Kapitel eingeführten Eigenzustände |l, m, νi zu ~l 2 und ˆl3 durch hinzufügen der Quantenzahl E. 3 Aus Zeitgründen verzichten wir auf eine Herleitung. Sie finden diese in Büchern der Mechanik, Elektrodynamik oder Quantenmechanik. 157 Setzen wir für h~x |l, m, Ei den Separationsansatz Gl. (11.5) ein, so erhalten wir eine Gleichung für den Radialanteil der Wellenfunktion Rl,m,E (r) ~2 l(l + 1) ~2 1 d2 − r+ + V (r) Rl,m,E (r) = E Rl,m,E (r) . 2m r dr2 2mr2 Gemäß dieser Gleichung ist Rl,m,E (r) unabhängig von m (m kommt in ihr nicht vor) und wir schreiben von nun an Rl,E (r). Mit ul,E (r) := rRl,E (r) folgt ~2 d2 l − + Veff (r) ul,E (r) = E ul,E (r) , 2m dr2 (12.1) mit l Veff (r) := V (r) + ~2 l(l + 1) 2mr2 d.h. ul,E (r) erfüllt eine eindimensionale Schrödingergleichung auf dem halbunendlichen Intervall r ≥ 0. Wie im klassischen Fall besteht das effektive Potenzial ~2 l(l+1) l Veff (r) aus der Summe von V (r) und der Drehimpulsbarriere 2mr2 . Für l = 0, 1, 2 ist das effektive Potenzial für das Coulombpotenzial V (r) = −e2 /r in Abbildung 12.1 dargestellt. Wir werden uns nun daran machen, die Differentialgleichung für ul,E (r) zu lösen. Dies wird uns die für E erlaubten Werte liefern. Die Ortsdarstellung der ˆ Eigenfunktionen zu ~l 2 , ˆl3 und H ergibt sich dann gemäß h~x |l, m, Ei = Yl,m (θ, ϕ) ul,E (r) . r Wir beschränken uns hier auf Potenziale V (r) die für r → 0 schwächer als die 2 l(l+1) divergieren. Das physikalisch wichtige CoulombpotenDrehimpulsbarriere ~ 2mr 2 zial V (r) ∼ 1/r ist damit nicht ausgeschlossen. In diesem Fall kann man für l ≥ 1 und r → 0 den Term [V (r) − E]r2 in der Differentialgleichung vernachlässigen.4 Sie vereinfacht sich somit zu 2 2 d l ≥ 1, r → 0 : −r + l(l + 1) ul,E (r) = 0 . dr2 Machen wir für r → 0 den Ansatz ul,E (r) ∼ rβ , so folgt β(β − 1) = l(l + 1) und damit β1 = l + 1 und β2 = −l. Die Lösung mit β2 ist aus physikalischen 4 Die folgende Diskussion ist mathematisch nicht ganz sauber, da man den Limes r → 0 nicht in der Differentialgleichung, sondern der Lösung ul,E (r) diskutieren sollte. 158 KAPITEL 12. EIN TEILCHEN IM ZENTRALPOTENZIAL Abbildung 12.1: Das effektive Potenzial für V (r) = −e2 /r und l = 0, 1, 2. Es gilt ~2 a0 := me 2 (siehe unten). Gründen auszuschließen da |Rl,E (r)|2 = |ul,E (r)|2 /r2 ∼ r−2(l+1) für r → 0 nicht integrierbar ist (man beachte, dass l ≥ 1).5 Damit folgt l ≥ 1, r → 0 : Rl,E (r) ∼ rl . (12.2) ˆ Je größer der Eigenwert des Drehimpulsoperators ~l 2 ist (d.h. je größer l ist), desto 2 schneller verschwindet |Rl,E (r)| für r → 0 und damit die Wahrscheinlichkeit das Teilchen in der Nähe des Ursprungs zu finden. Dies entspricht der klassischen Erwartung. Für den bisher ausgeschlossenen Fall l = 0 müssen wir l=0: lim ul=0,E (r) = 0 r→0 (12.3) fordern, da sonst Rl=0,E (r) ∼ 1/r was keine Lösung der Schrödingergleichung ist.6 5 Das gilt auch nach Multiplikation mit dem Faktor r2 , der beim Übergang in Kugelkoordinaten auftritt. 6 Da ∆ 1r = −4πδ(r), kann Rl=0,E (r) ∼ 1/r nur dann eine Lösung sein, wenn die Schrödingergleichung ein δ-Potenzial enthält, was nicht der Fall ist. 159 Es gilt somit ul,E (0) = 0 für alle l ∈ N0 und man kann die Gleichung für ul,E (r) l (r) + V∞ (r) als eine eindimensionale Schrödingergleichung in dem Potenzial Veff mit V∞ (r) = ∞, für r < 0 und V∞ (r) = 0, sonst, auffassen. Die Funktion ul,E (r) gehorcht einer Differentialgleichung zweiter Ordnung. Durch die Forderung ul,E (0) = 0 reduziert man die Zahl der linearunabhängigen Lösungen von zweien auf eine. Damit benötigt man, wie oben bereits angekündigt, zur eindeutigen Charakterisierung der Eigenvektoren |l, m, Ei keine zusätzlichen ˆ Quantenzahlen. Diese Überlegung zeigt, dass die Operatoren ~l 2 , ˆl3 und H ein vollständiges System vom kommutierenden Operatoren bilden. Aus der Diskussion in Kapitel 7 wissen wir bereits, dass die eindimensionale Schrödingergleichung (12.1), für Potenziale die einen anziehenden Bereich l mit Veff (r) < 0 haben7 und für r → ∞ verschwinden, kontinuierliche Eigenwerte für E > 0 hat und diskrete Eigenwerten En für E < 0 (gebundene Zustände) aufweist.8 Im Gegensatz zum echt eindimensionalen Fall ist hier jedoch die Bedinl gung Veff (r) < 0 in einem endlichen r-Intervall nicht hinreichend, um die Existenz zumindest eines gebundenen Zustandes zu garantieren. In der echt eindimensionalen Situation ist unter obiger Bedingung nur die Existenz eines gebundenen Zustandes gesichert der keine Knoten hat (siehe Übungen). Aufgrund der Bedingung ul,E (0) = 0 für die Lösung der hier vorliegenden effektiven eindimensionalen Schrödingergleichung (12.1) hat ul,E (r) für E < 0 jedoch mindestens einen Knoten. Die Funktion entspricht einer Lösung auf dem Intervall (−∞, ∞) mit ungerader Parität. Die Existenz gebundener Zustände dieser Art ist jedoch durch das in einer Übungsaufgabe bewiesene Theorem nicht gesichert, sie existieren nur unter Zusatzbedingungen (siehe Übungen). Im Folgenden werden wir die Situation E > 0, d.h. die Streuzustände, nicht weiter betrachten. Sie werden sie in dem Kapitel über Streutheorie der Quantenmechanik II Vorlesung im Detail diskutieren. Dabei wird sich herausstellen, dass die Beschreibung der Streuung am physikalisch besonders relevanten Coulombpotenzial V (r) ∼ 1/r spezielle Komplikationen mit sich bringt. l Unter der Annahme, dass Veff (r) für r → ∞ verschwindet, was für das hier interessierende Coulombpotenzial V (r) ∼ 1/r der Fall ist, lautet Gl. (12.1) für r→∞ r→∞: d2 ul,En (r) − αn2 ul,En (r) = 0 , 2 dr p mit αn = 2m(−En )/~. Die Lösungen ∼ exp (±αn r) dieser Differentialgleichung sind uns bereits mehrfach begegnet. Nur die exponentiell abfallende Lösung führt 7 l Es ist zu beachten, dass Veff (r) aus der Summe der Potenziale V (r) und der repulsiven (positiven) Drehimpulsbarriere besteht. Für l ≥ 1 folgt somit aus V (r) < 0 nicht unbedingt l Veff (r) < 0. 8 Wir bezeichnen die Funktion ul,En (r) später auch mit ul,n (r). 160 KAPITEL 12. EIN TEILCHEN IM ZENTRALPOTENZIAL auf normierbare Eigenfunktionen, so dass9 r→∞: ⇒ ul,n (r) → cl,n e−αn r Rl,n (r) → cl,n e−αn r . (12.4) Mit den Gln. (12.2), (12.3) und (12.4) haben wir das Verhalten der Funktionen Rl,n (r) in den Limites r → 0 und r → ∞ für eine große Klasse von Potenzialen bestimmt. Wir wollen nun die gebundenen Zustände für das physikalisch wichtige Coulombpotenzial V (r) = −e2 /r bestimmen,10 d.h. die Energieeigenwerte En < 0 und den zugehörigen Radialanteil Rl,n (r) der Eigenfunktionen angeben (der Winkelanteil Yl,m (θ, ϕ) ist uns bereits bekannt). Dazu ist es nützlich r und E durch dimensionslose Größen ρ := r/a0 und ε := E/ER , mit dem Bohrradius a0 := ~2 me2 ER := e2 , 2a0 und der Rydbergenergie zu ersetzen. Die Gleichung für ul,E (r) = ũl,ε (ρ) lautet dann 2 l(l + 1) d2 ũl,ε (ρ) + ε+ − ũl,ε (ρ) = 0 . dρ2 ρ ρ2 (12.5) Zur Lösung dieser Differentialgleichung machen wir einen Potenzreihenansatz, wobei wir das in den Gln. (12.2), (12.3) und (12.4) bestimmte Verhalten für r → 0 und r → ∞ abspalten ! ∞ X l+1 (l,ε) ν ũl,ε (ρ) = ρ cν ρ e−λρ , ν=0 √ mit λ := −ε. Mit diesem Ansatz geht man in Gl. (12.5) und gewinnt durch Koeffizientenvergleich wie bei der analytischen Lösung des eindimensionalen harmonischer Oszillatorproblems (siehe Übungen) nach einiger Rechnung eine Re(l,ε) kursionsgleichung für die cν (l,ε) cν+1 = 2 9 λ(ν + l + 1) − 1 c(l,ε) . (ν + l + 2)(ν + l + 1) − l(l + 1) ν (12.6) Faktoren, die für große r schwächer als exponentiell abfallen sind subdominant und werden daher unterdrückt. 10 Es ergibt sich z.B. in der Situation, in der sich ein negativ geladenes Elektron (mit Ladung −e) im Feld einer positiven, elementaren Punktladung (später ein Proton mit Ladung e) die im Ursprung festsitzt befindet. 161 (l,ε) (l,ε) Damit können alle cν aus c0 bestimmt werden, welches wiederum durch die Normierungsbedingung der Eigenfunktion festgelegt ist. Wie beim harmonischen Oszillator gibt es die beiden Möglichkeiten, dass die Potenzreihe entweder abbricht oder nicht abbricht. Betrachten wir zunächst den letzteren Fall. Für festes l und λ gilt im Limes großer ν ν→∞: (l,ε) cν+1 ≈ 2λ (l,ε) c ν+1 ν und damit ρ→∞: ∞ X ν 2λρ c(l,ε) , ν ρ ∼ e ν=0 so dass ũl,ε (ρ) für ρ → ∞ wie exp (λρ) geht und nicht normierbar (quadratintegrabel) ist. Damit liefert nur der Fall in dem die Potenzreihe abbricht eine physikalische Lösung der Differentialgleichung. Gilt λ= 1 , k+l+1 (l,ε) mit k ∈ N0 , so folgt cν = 0 für ν ≥ k + 1 und die Potenzreihe bricht ab.11 Für festes l gibt es somit die Energieeigenwerte εl,k 1 mit k = 0, 1, 2, . . . (l + k + 1)2 1 =: − 2 mit n = l + 1, l + 2, l + 3. . . . . n = − In der letzten Zeile haben wir die so genannte Hauptquantenzahl n definiert. Da in εl,k nur die Summe l + k eingeht, treten für verschiedene l dieselben Energieeigenwerte auf. Die El,n hängen daher nur von n ab und es gilt En = − ER e2 1 = − mit n ∈ N und n ≥ l + 1 . n2 2a0 n2 Die Energieeigenwerte En < 0 sind für bis zu n = 4 und l = 3 in Abbildung 12.2 dargestellt. Die Unabhängigkeit der En von l ist eine Spezialität des Coulombpotenzial und gilt nicht für allgemeine Zentralpotenziale. Sie ergibt sich aus einer speziellen Symmetrie (die es auch in der klassischen Mechanik gibt) des Problems. Aus Zeitgründen können wir nicht weiter auf diese Problematik eingehen. Die l Entartung wird aufgehoben, wenn im Hamiltonoperator zusätzliche “Störterme” berücksichtigt werden. Um einen quantitativen Vergleich mit Experimenten (z.B. 11 Das sieht man leicht durch Einsetzen von λ = 1/(k + l + 1) in Gl. (12.6). Die rechte Seite dieser Gleichung verschwindet dann für (ν + l + 1)/(k + l + 1) = 1, was die Bedingung ν ≥ k + 1 liefert. 162 KAPITEL 12. EIN TEILCHEN IM ZENTRALPOTENZIAL am Wasserstoffatom) anstellen zu können, müssen zusätzliche Wechselwirkungsterme, z.B. die bereits erwähnte Spin-Bahn-Kopplung, berücksichtigt werden. Ohne solche Zusatzterme beträgt die Entartung gn des Eigenwertes En gn = n−1 X (2l + 1) = n2 , l=0 wobei wir die 2l + 1-fache m Entartung berücksichtigt haben. Man bezeichnet die Energieniveaus mit 1s, 2s, 3s, 4s . . . ; 2p, 3p, 4p. . . ; 3d, 4d, . . . ; usw.. Abbildung 12.2: Energieeigenwerte En , n = 1, 2, 3, 4 für das Teilchen im Coulombpotenzial. Nachdem wir die Energieeigenwerte bestimmt haben, wollen wir nun die siˆ multanen Eigenfunktionen zu den Operatoren ~l 2 , ˆl3 und H herleiten. In der Bezeichnung ersetzen wir dabei die Energie E durch die Hauptquantenzahl n: |l, m, ni. Die im Radialanteil der Eigenfunktionen auftretenden Polynome sind die so genannten zugeordneten Laguerrepolynome Lqp (ρ) Lqp (ρ) := dq Lp (ρ) dρq 163 mit den Laguerrepolynomen Lp (ρ) Lp (ρ) := eρ dp ρp e−ρ . p dρ Die gemäß ∞ Z |Rl,n (r)|2 r2 dr = 1 (12.7) 0 normierten Radialfunktionen ergeben sich zu s 3 l 2 (n − l − 1)! −r/(na0 ) 2r 2r 2l+1 Rl,n (r) = − , e Ln+l na0 na0 na0 2n [(n + l)!]3 mit L2l+1 n+l (ρ) =− n−l−1 X k=0 (−1)k [(n + l)!]2 ρk . (n − l − 1 − k)!(2l + 1 + k)! Für n = 1 und l = 0 gilt R0,1 (r) = 2 3/2 a0 e−r/a0 und für n = 2 und l = 0, 1 1 r R0,2 (r) = 2− e−r/(2a0 ) (2a0 )3/2 a0 1 r √ e−r/(2a0 ) . R1,2 (r) = 3/2 (2a0 ) a0 3 Nachdem wir nun die Rl,n (r) bestimmt haben, sind uns auch die Eigenfunktionen ˆ ψl,m,n (~x) := h~x |l, m, ni = Yl,m (θ, ϕ)Rl,n (r) zu ~l 2 , ˆl3 und H bekannt. Da sowohl die Yl,m (θ, ϕ) gemäß Gl. (11.6) als auch die Rl,n (r) gemäß Gl. (12.7) normiert sind, folgt Z Z 2π Z π Z ∞ 2 3 2 |ψl,m,n (~x)| d x = |Yl,m (θ, ϕ)| sin θ dθ dϕ |Rl,n (r)|2 r2 dr R3 0 0 0 = 1 Die Wahrscheinlichkeitsdichte für den Ort des Teilchens ist in den gebundenen Zuständen wie üblich durch |ψl,m,n (~x)|2 gegeben. Aus diesen Überlegungen folgt, dass |Rl,n (r)|2 r2 dr die Wahrscheinlichkeit dafür ist, das Teilchen in einer Kugelschale mit Abstand r vom Ursprung und Dicke dr zu finden. Die zugehörige Wahrscheinlichkeitsdichte wl,n (r) := |Rl,n (r)|2 r2 ist für n = 1, 2, 3 in Abbildung 164 KAPITEL 12. EIN TEILCHEN IM ZENTRALPOTENZIAL 12.3 dargestellt. Die absoluten Maxima dieser Funktionen rücken für zunehmendes n immer weiter nach außen. Besonders einfach ist die Situation für l = n − 1. In diesem Fall gilt n−1 r e−r/(na0 ) Rn−1,n (r) ∼ a0 2n r wn−1,n (r) = ∼ e−2r/(na0 ) . a0 Die Funktion wn−1,n (r) hat nur ein Maximum und dieses bei rmax = n2 a0 . Für große n ist die relative Breite des Maximums (Breite/Position) klein. Wie man der Abbildung 11.3 für Yl,m (θ, ϕ) entnimmt, liegt Yl,l (θ, ϕ) für große l nahezu in der x-y-Ebene. Daher sind die Zustände |l = n − 1, m = n − 1, ni für n 1 (Rydbergzustände) den Bohrschen Kreisbahnen, die Sie wahrscheinlich aus der Experimentalphysik kennen, sehr ähnlich.12 0.6 1s wl,n 0.4 0.2 2p 2s 3d 0 0 5 10 r/a0 3p 3s 15 20 Abbildung 12.3: Radiale Wahrscheinlichkeitsdichte der gebundenen Zustände im Coulombpotenzial. 12 Dabei gilt es zu beachten, dass ein klassisches Teilchen mit Drehimpuls l3 6= 0 und l1 = l2 = 0 eine Bewegung in der x-y-Ebene ausführt. Kapitel 13 Das Wasserstoffatom Wir betrachten nun das Problem zweier unterscheidbaren1 Teilchen, also z.B. des Elektrons und des Protons im Wasserstoffatom, mit den Massen m1 und m2 , die über ein Zweiteilchenpotenzial V (|~x1 − ~x2 |) wechselwirken. Der Hamiltonoperator lautet im Tensorproduktraum H = H1 ⊗ H2 p~ˆ1 2 p~ˆ2 2 ˆ ˆ H= ⊗ 12 + 11 ⊗ + V ~x1 ⊗ 12 − 11 ⊗ ~x2 . 2m1 2m2 Die zeitunabhängige Schrödingergleichung in der Ortsdarstellung ψE (~x1 , ~x2 ) = h~x1 , ~x2 |ψE i, mit |~x1 , ~x2 i = |~x1 i ⊗ |~x2 i, lautet ~2 ~2 ∆1 − ∆2 + V (|~x1 − ~x2 |) ψE (~x1 , ~x2 ) = E ψE (~x1 , ~x2 ) . − 2m1 2m2 Wie in der klassischen Mechanik führen wir Schwerpunkts- und Relativkoordinaten ~ := m1~x1 + m2~x2 R M ~x := ~x1 − ~x2 , und die Massen M := m1 + m2 und 1/µ := 1/m1 + 1/m2 (reduzierte Masse) ein. Unter Verwendung der Kettenregel folgt ∂ ∂ m1 ∂ = + ~ ∂~x1 ∂~x M ∂R ∂ ∂ m2 ∂ = − + . ~ ∂~x2 ∂~x M ∂R 1 Es wird Ihnen wahrscheinlich komisch vorkommen, dass wir hier betonen, dass die Teilchen unterscheidbar sein müssen. Sehr bald werden Sie lernen, dass man bei der Behandlung ununterscheidbarer Teilchen, also z.B. zweier Elektronen, anders vorgehen muss. 165 166 KAPITEL 13. DAS WASSERSTOFFATOM ~ = ψE (~x1 , ~x2 ) ergibt sich für die Schrödingergleichung Mit ψ̃E (~x, R) 2 ~ ∂ ∂ ~2 ∂ ∂ ~ = E ψ̃E (~x, R) ~ . − · − · + V (|~x|) ψ̃E (~x, R) ~ ∂R ~ 2µ ∂~x ∂~x 2M ∂ R Sie lässt sich mit dem Separationsansatz ~ =: ψ̃E (~x, R) 1 ~ ~ eiP ·R/~ ψẼ (~x) 3/2 (2π~) lösen. Eingesetzt liefert das eine Gleichung für ψẼ (~x) 2 ~ − ∆ + V (|~x|) ψẼ (~x) = Ẽ ψẼ (~x) , 2µ ~2 P mit der Energie Ẽ = E − 2M . Damit haben wir das Problem auf die Bewegung eines fiktiven Teilchens der Masse µ in einem Zentralpotenzial V (|~x|) = V (r) zurückgeführt, welches wir mit den Methoden des vorhergehenden Kapitels lösen können. Die Gesamtenergie E setzt sich aus der “relativen” Energie Ẽ und der ~2 P kinetischen Energie der Schwerpunktbewegung 2M zusammen. Für das Problem des Wasserstoffatoms folgt im Speziellen V (r) = −e2 /r, so dass wir für die Energien Ẽn der gebundenen Zustände das Ergebnis des letzten Kapitels verwenden können. Dabei müssen wir in a0 für m die reduzierte Masse µ = mElek. mProt. /(mElek. + mProt. ) einsetzen und erhalten a0 = ~2 /(µe2 ) ≈ ~2 /(mElek. e2 ). Letzteres gilt, da die Protonenmasse mProt. ungefähr einen Faktor 1000 größer ist, als die Elektronenmasse mElek. . Die Zahlenwerte für a0 und die Rydbergenergie ER betragen dann a0 ≈ 0.53 Å= 5.3 · 10−11 m und ER ≈ 13.6eV. Bis auf Feinstrukturen, die man nur durch Hinzufügen weiterer Terme (z.B. die schon öfter erwähnte Spin-Bahn-Kopplung) zum Hamiltonoperator erklären kann, ergeben sich die experimentellen Spektrallinien des Wasserstoffatoms aus den Energieunterschieden Ẽn − Ẽn0 .2 Im letzten Kapitel dieser Vorlesung werden wir uns mit komplizierteren Atomen und damit dem Problem ununterscheidbarer Teilchen beschäftigen. In diesem werden wir weitere Grundprinzipien des Aufbaus der Atome und des Periodensystems der Elemente kennen lernen. Zuvor wollen wir jedoch wichtige Näherungsverfahren einführen. Für n0 = 1 erhält man die so genannte Lymanreihe, für n0 = 2 die Balmerreihe und für n = 3 die Paschenreihe. 2 0 Kapitel 14 Näherungsmethoden Die wenigsten physikalischen Probleme von praktischem Interesse lassen sich exakt lösen. Dieses gilt speziell in der Quantenmechanik, so dass man nahezu immer auf die Verwendung von Näherungsmethoden angewiesen ist. Bei der Behandlung realistischer Probleme (insbesondere, wenn es um Vielteilchenprobleme geht) erfordern selbst solche meist einen grossen Computeraufwand, jedenfalls dann, wenn man an quantitativen Ergebnissen interessiert ist. Die wesentlichen Ideen der Näherungsverfahren kann man jedoch bereits in ihrer Anwendung auf einfache quantenmechanische Probleme klar machen. In einer großen Klasse von Problemen gibt es einen kleinen Parameter λ, wobei das Problem für λ = 0 exakt lösbar sein soll. Solche Systeme können dann störungstheoretisch behandelt werden, in dem man Observable und Zustände nach λ entwickelt und die Potenzreihe bei einer kleinen Ordnung abbricht. Es soll bereits jetzt erwähnt werden, dass die Konvergenz der Potenzreihe in λ keinesfalls sichergestellt ist. Konvergenz ist jedoch von einem praktischen Standpunkt aus auch betrachtet nicht das entscheidende Kriterium für eine erfolgreiche störungstheoretische Behandlung eines Problems, da man meist sowieso nur die Terme niedrigster Ordnung bestimmen kann. Wir werden auf diesen Aspekt zurückkommen. Ein weitere, häufig mit großem Erfolg eingesetzte Methode, ist ein Variationsansatz bei dem Eigenenergien durch die Minimierung nach Parametern eines Ansatzes für die Eigenfunktionen bestimmt werden. Unsere Diskussion von Näherungsverfahren werden wir mit dieser Methode beginnen. 14.1 Das Variationsprinzip Die Grundlage für die Berechnung der Grundzustandsenergie in diesem Näherungszugang ist das Rayleigh-Ritzsche-Variationsprinzip. Es besagt, dass der Erwartungswert des Hamiltonoperators H in jedem Zustand |ψi 6= 0 größer oder 167 168 KAPITEL 14. NÄHERUNGSMETHODEN gleich der Grundzustandsenergie E0 ist, also hψ| H |ψi ≥ E0 . hψ| ψi (14.1) Gleichheit gilt nur, wenn |ψi der Grundzustand (oder ein Element des Unterraums der Grundzustände im Fall von Entartung) zu H ist. Durch Bestimmen von hψ| H |ψi / hψ| ψi kann man somit eine obere Schranke für die Grundzustandsenergie angeben. Wie gut diese ist, hängt vom gewählten Zustand |ψi ab. Es ist i.A. sehr viel schwieriger eine gute untere Schranke anzugeben. Der Beweis des Variationsprinzips ist sehr einfach. Dazu schreiben wir H in seiner Spektraldarstellung Z X hψ| H |ψi (E0 + E − E0 ) hψ| E, νi hE, ν| ψi / hψ| ψi = hψ| ψi E,ν Z X (E − E0 ) |hψ| E, νi|2 / hψ| ψi = E0 + E,ν ≥ E0 , da alle Terme in der Summe (bzw. dem Integral) auf der rechten Seite der zweiten Zeile größer oder gleich Null sind (bis auf den Nenner, der für |ψi 6= 0 echt größer Null ist). Gleichheit, gilt falls hψ| E, νi = 0 für alle Zustände |E, νi die nicht zur Grundzustandsmanigfaltigkeit gehören. Aufgrund der Vollständigkeit der Eigenzustände und der Orthogonalität, liegt |ψi dann im Unterraum von Grundzuständen. Liegen Symmetrien vor, z.B. im Fall eines Teilchens im Zentralpotential, so lässt sich das Verfahren auf energetisch höherliegende Zustände erweitern. So kann man z.B. im Zentralpotential für jeweils den niedrigsten Energieeigenwert bei gegebenem Wert von l eine analoge Ungleichung angeben. Der praktische Erfolg des auf dem Variantionsprinzip beruhenden Verfahren hängt bei gegebenem Hamiltonoperator sehr stark von der physikalischen Intuition ab. Praktisch geht man wie folgt vor. Man wählt einen Zustand |ψα i, der von einem oder mehreren Parametern αi abhängt, und von dem man vermutet, dass er wesentliche Züge des exakten Grundzustandes trägt. Man berechnet dann E({αi }) := hψα | H |ψα i hψα | ψα i und wählt die αi so, dass E({αi }) minimal wird. Der resultierende minimale Wert E({αi0 }) stellt dann eine mehr oder weniger gute Näherung für E0 dar. Hat der exakte Grundzustand zufälligerweise die in |ψα i zugelassene Form, so erhält man auf diese Weise die exakte Grundzustandsenergie. Im Allgemeinen ist es so, dass selbst für eine guten Näherung von E0 der Zustand |ψα0 i eine nicht besonders gute Näherung für den exakten Grundzustand darstellt (wobei letzterer nicht entartet 14.1. DAS VARIATIONSPRINZIP 169 sei). Dies impliziert oft, dass die Berechnung von hψα0 | O |ψα0 i eine schlechte Näherung für den Grundzustandserwartungswert anderer Observablen O liefert. Wir wollen zum Variationsprinzip zwei Beispiele betrachten. Der eindimensionale harmonische Oszillator: In diesem Beispiel sind uns die Grundzustandswellenfunktion und die zugehörige Energie natürlich bereits bekannt. Wir werden sehen, wie in diesem Fall für einen Ansatz, der die richtige Form hat aus dem Variationsverfahren die exakte Lösung folgt. Wir setzen also an α 1/4 2 e−α x /2 , α > 0 . hx| ψα i = ψα (x) = π Für diesen Ansatz gilt hψα | ψα i = 1. Damit folgt Z ∞ ~2 d2 1 ∗ 2 2 ψα (x) − E(α) = + mω x ψα (x) dx . 2m dx2 2 −∞ Einfache Differentiation und Integration liefert ~2 α 1 1 E(α) = + mω 2 . 2m 2 2 2α Um das Minimum dieser Funktion bezüglich α zu bestimmen differenzieren wir nach α und setzen das Ergebnis gleich Null d E(α) = 0 , dα α0 was α0 = mω/~ und E(α0 ) = ~ω/2 liefert – also, dass exakte Ergebnis für die Grundzustandsenergie und -wellenfunktion. Als eine zweite Variationswellenfunktion für den eindimensionalen harmonischen Oszillator verwenden wir statt einer Gaußkurve eine Lorentzkurve hx| ψα i = ψα (x) = x2 1 . + α2 Diesmal ist ψα (x) nicht normiert. Es gilt Z ∞ 1 π hψα | ψα i = . 2 dx = 2 2 2α3/2 −∞ (x + α ) Das führt dann auf E(α) = ~2 1 1 + mω 2 α . 4m α 2 √ Das Minimum dieser Funktion liegt bei α0 = ~/(mω 2) mit √ 1 1 1 1 E(α0 ) = √ ~ω = 2 ~ω = 1.4142 . . . ~ω > ~ω . 2 2 2 2 170 KAPITEL 14. NÄHERUNGSMETHODEN Wir machen somit einen recht großen Fehler von ca. 40 %. Das Coulombpotential mit gaußschem Variationsansatz: Für den Grundzustand im Coulombpotential V (r) = −e2 /r verwenden wir zur Illustration einen Ansatz mit falscher Form α 3/4 2 2 2 h~x| ψα i = ψα (~x) = e−α (x1 +x2 +x3 )/2 , α > 0 , π der erneut bereits normiert ist: hψα | ψα i = 1. Die kinetische Energie in diesem Zustand ist das Dreifache der kinetischen Energie aus dem ersten Beispiel hHkin iα = 3 ~2 α . 2m 2 Für die potentielle Energie ergibt sich Z 3/2 Z ∞ 1 2 2 2 3 2 α hHpot iα = −e ψα (~x)d x = −4πe re−αr dr π R3 r 0 2 2e 1/2 = −√ α π und zusammengenommen E(α) = 3 ~2 α 2e2 1/2 −√ α . 2m 2 π Differentiation und Nullsetzen liefert α0 = 16m2 e4 9π~4 und E(α0 ) = − 4e4 m 8 = (−ER ) = 0.8488 . . . (−ER ) > (−ER ) , 2 3π~ 3π mit der exakten Grundzustandsenergie −ER . Für die Grundzustandsenergie machen wir mit diesem Ansatz also einen Fehler von ca. 15%. Da man die Erwartungswerte von kinetischer und potentieller Energie in gaußschen Variationswellenfunktionen recht leicht bestimmen kann, werden in der Quantenchemie häufig Linearkombinationen von Gaußorbitalen als Variationsansatz verwendet. 14.2 Zeitunabhängige Störungstheorie Als nächstes wollen wir das Konzept der Störungstheorie im Fall eines zeitunabhängigen Hamiltonoperators H einführen (stationäre Störungstheorie). Wir gehen dabei davon aus, dass H in der Form H(λ) = H0 + λW , 14.2. ZEITUNABHÄNGIGE STÖRUNGSTHEORIE 171 mit λ ≥ 0, geschrieben werden kann. Wir nehmen an, dass wir das Eigenwertproblem zum “ungestörten” Hamiltonoperator H0 exakt gelöst haben und die Eigenν werte diskret sind. Die Eigenvektoren bezeichnen wir mit ϕp und die Energien mit Ep0 . Dabei ist ν der mögliche Entartungsindex. Wir haben also H0 ϕνp = Ep0 ϕνp , mit D 0 ϕνp0 ϕνp = δp,p0 δν,ν 0 , XX ϕνp ϕνp = 1 . p ν Wir sind daran interessiert, wie die “Störung” λW die Eigenwerte und Eigenfunktionen verändert wenn λ klein ist. Das soll heißen, dass die Matrixelemente von λW sehr viel kleiner als die von H0 sind.1 Das typische Verhalten der Eigenwerte E(λ) von H(λ) ist in Abbildung 14.1 dargestellt. Die Eigenzustände zu H(λ) bezeichnen wir mit |ψ(λ)i. 0 E4 0 E3 0 E2 0 E1 0 0.1 0.2 0.3 0.4 0.5 λ Abbildung 14.1: Typische λ-Abhängigkeit der Eigenwerte von H(λ). Wir werden nun wie folgt vorgehen. In der Gleichung H(λ) |ψ(λ)i = E(λ) |ψ(λ)i 1 Genauer wird sich nachher herausstellen, dass die Matrixelemente von λW sehr viel kleiner als die Differenz der Energieeigenwerte von H0 sein müssen. 172 KAPITEL 14. NÄHERUNGSMETHODEN entwickeln wir sowohl E(λ) als auch |ψ(λ)i in einer Potenzreihe nach λ E(λ) = ε0 + λε1 + λ2 ε2 + . . . , |ψ(λ)i = |0i + λ |1i + λ2 |2i + . . . . Von einem mathematischen Standpunkt aus betrachtet ist es alles andere als offensichtlich, dass diese Potenzreihen konvergieren – generisch ist der Konvergenzradius der Reihen tatsächlich Null. Dies interessiert uns hier aber nicht, da i.A. sowieso nur die ersten paar Koeffizienten bzw. Zustände berechnet werden können. Zum Verständnis der Reihenentwicklung ist das mathematische Konzept der asymptotischen Reihe wichtig (siehe die mathematische Literatur). Die entwickelte Eigenwertgleichung ergibt sich zu "∞ # "∞ #"∞ # X X 0 X (H0 + λW ) λq |qi = λq εq0 λq |qi . q=0 q 0 =0 q=0 Wir vergleichen nun Potenzen von λ auf der linken und der rechten Seite dieser Gleichung, was (H0 − ε0 ) |0i = 0 (H0 − ε0 ) |1i + (W − ε1 ) |0i = 0 (H0 − ε0 ) |2i + (W − ε1 ) |1i − ε2 |0i = 0 (14.2) (14.3) (14.4) usw. liefert. O.B.d.A. können wir annehmen, dass |ψ(λ)i normiert ist und h0 |ψ(λ)i reell ist (letzteres durch Wahl der Phase von |ψ(λ)i. Für λ = 0 (mit |ψ(λ = 0)i = |0i) folgt so h0 |0i = 1 , wobei jedoch die Phase von |0i unbestimmt bleibt. In erster Ordnung in λ ergibt sich das Quadrat der Norm von |ψ(λ)i zu hψ(λ) |ψ(λ)i = [h0| + λ h1|] [|0i + λ |1i] + O λ2 = h0 |0i + λ [h1 |0i + h0 |1i] + O λ2 . Dieser Ausdruck ist 1 falls der Term proportional zu λ verschwindet. Da nun h0 |ψ(λ)i reell ist, muss auch h0 |1i reell sein und wir können h0 |1i = h1 |0i = 0 folgern. Wenn man analog bis zur Ordnung λ2 entwickelt ergibt sich h0 |2i = h2 |0i = − 1 h1 |1i , 2 (14.5) 14.2. ZEITUNABHÄNGIGE STÖRUNGSTHEORIE 173 was jedoch für höhere Ordnungen in Störungstheorie wichtig wird, die wir hier nicht betrachten werden. Nach Gl. (14.2) ist ε0 einer der Eigenwerte von H0 und |0i ein zugehöriger Eigenzustand. Wir legen nun ε0 als einen spezifischen Eigenwert Ep0 fest und nehmen zunächst an, dass Ep0 nicht entartet ist. Damit entfällt im zugehörigen Eigenzustand |ϕp i zu H0 der Entartungsindex ν. Stationäre Störungstheorie für nicht-entartete Zustände Wir haben damit ε0 = Ep0 und wählen die Phase von |0i so, dass |0i = |ϕp i . Da wir das Spektrum von H0 als diskret angenommen haben, folgt, das für hinreichend kleines λ auch der zu Ep0 gehörende “gestörte” Zustand |ψ(λ)i nicht entartet ist. Die Korrektur erster Ordnung in λ zur Energie ergibt sich durch Multiplikation von links von |ϕp i auf beiden Seiten von Gl. (14.3) hϕp | (H0 − ε0 ) |1i + hϕp | (W − ε1 ) |0i = 0 zu ε1 = hϕp | W |ϕp i , wobei wir im ersten Summanden H0 nach links angewandt haben und im zweiten Term |0i = |ϕp i eingesetzt haben. Damit gilt in erster Ordnung in λ für den Eigenwert Ep (λ) zu H(λ) Ep (λ) = Ep0 + λ hϕp | W |ϕp i + O λ2 oder in Worten: Die Korrektur zur Energie Ep0 zu erster Ordnung in λ ist durch den Erwartungswert der Störung im ungestörten Zustand |ϕp i gegeben. Gl. (14.3) können wir weitere Informationen entlocken, in dem wir jetzt mit den Zustände |ϕνn i mit n 6= p von links multiplizieren hϕνn | (H0 − ε0 ) |1i + hϕνn | (W − ε1 ) |0i = 0 . Mit der Orthogonalität der Eigenvektoren von H0 liefert das En0 − Ep0 hϕνn |1i + hϕνn | W |ϕp i = 0 , 174 KAPITEL 14. NÄHERUNGSMETHODEN was uns alle bis auf einen Entwicklungkoeffizienten von |1i in der Basis der Eigenzustände zu H0 liefert hϕνn | W |ϕp i , n 6= p. Ep0 − En0 Der noch fehlende Entwicklungskoeffizient ϕνp |1i = h0 |1i ist aufgrund von Gl. (14.5) Null. Damit ergibt sich hϕνn |1i = |1i = X X hϕν | W |ϕp i n |ϕνn i 0 − E0 E p n n6=p ν und X X hϕν | W |ϕp i n ν 2 |ψp (λ)i = |ϕp i + λ |ϕ i + O λ . n Ep0 − En0 n6=p ν Um ε2 zu bestimmen multiplizieren wir |ϕp i von links an Gl. (14.4) hϕp | (H0 − ε0 ) |2i + hϕp | (W − ε1 ) |1i − ε2 hϕp |0i = 0 ⇒ hϕp | (H0 − Ep0 ) |2i − ε1 h0 |1i + hϕp | W |1i − ε2 hϕp |ϕp i = 0 ⇒ ε2 = hϕp | W |1i ⇒ ε2 = X X |hϕν | W |ϕp i|2 n . 0 − E0 E p n ν n6=p Wir können damit Ep (λ) bis zur zweiten Ordnung in λ angeben Ep (λ) = Ep0 + λ hϕp | W |ϕp i + λ2 X X |hϕν | W |ϕp i|2 n + O λ3 . 0 0 Ep − En n6=p ν Für den Zustand verzichten wir hier darauf den Ausdruck in zweiter Ordnung herzuleiten. Ziehen wir nun den Parameter λ in λW mit in den Operator, d.h. definieren wir V := λW so folgt Ep (λ) = Ep0 X X |hϕν | V |ϕp i|2 n 3 + hϕp | V |ϕp i + + O λ Ep0 − En0 n6=p ν (14.6) und |ψp (λ)i = |ϕp i + X X hϕν | V |ϕp i n ν 2 i + O λ . |ϕ n 0 − E0 E p n n6=p ν (14.7) 14.2. ZEITUNABHÄNGIGE STÖRUNGSTHEORIE 175 Diese beiden Ausdrücke sind “natürlicher” da H normalerweise in der Form H0 + V und nicht H0 + λW gegeben ist. An beiden Ausdrücken erkennt man, dass die Korrekturen klein sind, wenn die Matrixelemente der Störung in den ungestörten Eigenzuständen klein gegenüber den ungestörten Energieunterschieden sind (wie oben angedeutet). Bevor wir zwei Beispiele zur stationären nichtentarteten Störungstheorie betrachten, wollen wir eine weitere Sprechweise einführen. Aufgrund der Gl. (14.7) spricht man davon, dass die Störung dem ungestörten Eigenzustand |ϕp i andere Eigenzustände von H0 beimischt. Als erstes Beispiel betrachten wir eine kubische Anharmonizität V = λ~ω mω 3/2 x̂3 ~ zum eindimensionalen harmonischen Oszillator H0 = p̂2 1 + mω 2 x̂2 . 2m 2 Alle Eigenzustände |ni zu H0 sind nicht-entartet, so dass wir die gerade hergeleiteten Ausdrücke verwenden können. Um die relevanten Matrixelemente der Störung V einfach bestimmen zu können, drücken wir diese durch die Leiteroperatoren und den Operator N̂ = a† a aus. Eine einfache Rechnung gibt V = λ~ω †3 3 † a + a + 3 N̂ a + 3[ N̂ + 1]a . 23/2 Die einzigen nicht-verschwindenden Matrixelemente sind damit 1/2 (n + 3)(n + 2)(n + 1) λ ~ω , 8 1/2 n(n − 1)(n − 2) λ ~ω , 8 3/2 n+1 3λ ~ω , 2 h n i3/2 3λ ~ω , 2 hn + 3| V |ni = hn − 3| V |ni = hn + 1| V |ni = hn − 1| V |ni = wobei wir intensiv die Resultate aus Kapitel 8 verwendet haben. Setzen wir diese Ergebnisse in Gln. (14.6) und (14.7) ein, so fällt zunächst auf, dass es keine Korrektur erster Ordnung zur Energie En0 = ~ω(n + 1/2) gibt. Bis zur zweiten Ordnung ergibt sich 2 1 15 2 1 7 En = ~ω n + − λ ~ω n + − λ2 ~ω + O λ3 . 2 4 2 16 176 KAPITEL 14. NÄHERUNGSMETHODEN Die kubische Anharmonizität führt damit zu einer Absenkung aller Eigenenergien. Für die Differenz zweier aufeinander folgenden Energien ergibt sich 15 2 En − En−1 = ~ω 1 − λ n + O λ3 , 2 so dass das Spektrum nicht mehr länger äquidistant ist. Für den gestörten Eigenzustand ergibt sich in erster Ordnung in λ 3/2 h n i3/2 n+1 |n + 1i + 3λ |n − 1i |ψn i = |ni − 3λ 2 2 1/2 λ (n + 3)(n + 2)(n + 1) − |n + 3i 3 8 1/2 λ n(n − 1)(n − 2) + |n − 3i + O λ2 , 3 8 d.h. die Störung mischt die Zustände |n ± 1i und |n ± 3i bei. In vielen physikalischen Probleme gibt es Abweichungen von der rein quadratischen Abhängigkeit des Potentials vom Ort. Daher spielt die gerade betrachtete quartische Störung eine wichtige Rolle in einer Vielzahl von physikalischen Anwendungen. Als zweites Beispiel betrachten wir den Starkeffekt eines Wasserstoffatoms im 1s Zustand (n = 1, l = 0 und m = 0) in einem homogenen elektrischen Feld ~ = E~e3 ) (E H= e2 p~ˆ2 − + eE x̂3 = H0 + VE . 2m |~xˆ| Der 1s Zustand ist nicht entartet, so dass wir die obigen Ausdrücke verwenden können. Nachdem wir weiter unten entartete Störungstheorie betrachtet haben werden wir auch den Fall n = 2 mit vierfacher Entartung diskutieren. Da h~x |l = 0, m = 0, n = 1i eine gerade Funktion bezüglich aller xi ist, folgt, dass hl = 0, m = 0, n = 1| x̂3 |l = 0, m = 0, n = 1i = 0 und die Korrektur erster Ordnung zur Energie E0 verschwindet. Da wir die Streuzustände (mit kontinuierlichem Spektrum) zum Wasserstoffproblem nicht untersucht haben, können wir die Korrektur zweiter Ordnung nicht angeben. Es ist jedoch klar, dass sie einen negativen Vorfaktor hat, da für alle n der Energienenner in Gl. (14.6) negativ ist. Wir haben somit E0 − E00 ∼ −E 2 . Wir wollen nun den Fall betrachten, dass der Eigenwert Ep0 zu H0 dessen Korrekturen wir bestimmen wollen gp -fach entartet ist. 14.2. ZEITUNABHÄNGIGE STÖRUNGSTHEORIE 177 Stationäre Störungstheorie für entartete Zustände In diesem Fall legt die Wahl ε0 = Ep0 den Vektor |0i in Gl. (14.2) nicht eindeutig fest, da jede Linearkombination der gp Vektoren aus dem Unterraum Hp0 (des zugrundeliegenden Hilbertraums H) von Eigenzuständen von H0 mit Eigenwert Ep0 diese Relation erfüllt. Wir wissen damit nur, dass |0i ∈ Hp0 . Wir beschränken uns hier auf die erste Ordnung für die Energie und nullte Ordnung für den Zustand. Wie wir sehen werden, führt die Störung generischerweise dazu, dass die gp -fache Entartung in fp Subniveaus aufgehoben wird. Sollte fp < gp gelten, so ist eines oder sind mehrere der Subniveaus weiterhin entartet. projizieren wir Gl. (14.3) auf die gp Vektoren ν Um ε1 und |0i zu bestimmen ϕp des Eigenraums Hp0 ν ϕp (H0 − ε0 ) |1i + ϕνp (W − ε1 ) |0i = 0 ⇒ ϕνp W |0i = ε1 ϕνp 0i . Auf der linken Seite dieser Gleichung schieben wir nun den Identitätsoperator in der {|ϕνn i} Basis ein X X 0 E D 0 ϕνn 0i = ε1 hϕνn | 0i . ϕνp W ϕνn ν0 n 0 Da der Vektor |0i zum Eigenraum des Eigenwerts Ep0 gehört, ist ϕνn 0i = 0 für alle n 6= p. Damit folgt X 0 E D 0 ϕνp W ϕνp ϕνp 0i = ε1 ϕνp 0i . ν0 Diese Gleichung stellt ein Matrixeigenwertproblem im gp -dimensionalen Unterraum Hp0 dar, welches wir lösen müssen um die verschiedenen ε1 und zugehörigen Vektoren |0i zu bestimmen. Letztere bekommen wir in ihrer Darstellung bezüglich der Basis von Hp0 . Es gibt keine Komponenten von |0i die außerhalb dieses Unterraums liegen. Im Fall von gp -facher Entartung gehen wir also wie folgt vor. Wir bestimmen alle Matrixelemente der Störung Unterraum der ν W (bzw. V ) im gp -dimensionalen 0 durch die Eigenzustände ϕp zu H0 mit Eigenwert Ep aufgespannt wird. Im Anschluss lösen wir das gp -dimensionale Martrixeigenwertproblem. Wir bestimmen so die verschiedenen Eigenwerte εj1 mit j = 1, 2, . . . , fp ≤ gp und Eigenvektoren. Die Energien bis lineare Ordnung in λ sind dann durch Ep,j (λ) = Ep0 + λεj1 + O λ2 178 KAPITEL 14. NÄHERUNGSMETHODEN gegeben. Die Eigenvektoren bis in nullter Ordnung in λ sind X |ψp,j (λ)i = aνp,j ϕνp ν mit den Koeffizienten aνp,j = ϕνp 0i zum Matrixeigenwert εj1 . Wir wollen das gerade gelernte für den Fall des Starkeffekts in den n = 2 Zuständen des Wasserstoffproblems bestimmen. Für n = 2 sind l = 0 bzw. 1 zugelassen und damit m = 0 bzw. m = −1, 0, 1. Der Eigenwert ist somit vierfach entartet. Um die 4 × 4-Matrix der Störung im Unterraum zu E2 zu bestimmen ordnen wir die Zustände wie folgt an: |l = 0, m = 0, n = 2i, |l = 1, m = 0, n = 2i, |l = 1, m = 1, n = 2i, |l = 1, m = −1, n = 2i. Wir müssen nun die Matrixelemente dieser Zustände mit dem Operator x̂3 berechnen. Da alle |h~x |l, m, ni|2 gerade Funktionen sind folgt hl, m, n| x̂3 |l, m, ni = 0 für die diagonalen Matrixelemente. Wir können weiterhin verwenden, dass der i h ˆ Kommutator l3 , x̂3 = 0 und somit hl, m, n| x̂3 |l0 , m0 , n0 i = δm,m0 hl, m, n| x̂3 |l0 , m, n0 i . Dies folgt aus hl, m, n| ˆl3 x̂3 |l0 , m0 , n0 i = ~m hl, m, n| x̂3 |l0 , m0 , n0 i = hl, m, n| x̂3 ˆl3 |l0 , m0 , n0 i = ~m0 hl, m, n| x̂3 |l0 , m0 , n0 i und damit hl, m, n| x̂3 |l0 , m0 , n0 i = 0 für m 6= m0 . Damit hat die zu bestimmende Matrix V die folgende Form 0 h0, 0, 2| x̂3 |1, 0, 2i 0 0 h1, 0, 2| x̂3 |0, 0, 2i 0 0 0 . V = eE 0 0 0 0 0 0 0 0 Die beiden nichtverschwindenden Matrixelemente ergeben sich wie man leicht nachrechnet zu h0, 0, 2| x̂3 |1, 0, 2i = h1, 0, 2| x̂3 |0, 0, 2i = −3a0 . Die 4 × 4-Matrix hat die vier Eigenwerte V1,2 = ±3eEa0 , V3,4 = 0 . 14.3. ZEITABHÄNGIGE STÖRUNGSTHEORIE 179 Somit ergibt sich das folgende Bild. Aus dem vierfach entarteten Zustand ergeben sich zwei nicht-entartete Zustände mit Energiekorrekturen ±3eEa0 und ein zweifach entarteter Eigenwert der keine Korrektur zur Ordnung E aufweist. Die Zugehörigen Zustände im Unterraum zu E2 sind 1 √ (|0, 0, 2i ± |1, 0, 2i) , |1, 1, 2i , |1, −1, 2i . 2 Der Starkeffekt für die Eigenwerte E1 und E2 ist in Abbildung 14.2 zusammengefasst. Wir müssen allerdings auf ein grundsätzliches Problem hinweisen. Aufgrund des linear anwachsenden elektrischen Feldes gibt es strikt genommen keine gebundenen Zustände mehr, da das Elektron das Atom durch Tunneln verlassen kann. Wenn das Feld hinreichend klein ist, ist jedoch die Wahrscheinlichkeit des Tunnelns sehr klein, so dass unsere Überlegungen durchaus sinnvoll waren. -ER/4 -ER elektrisches Feld Abbildung 14.2: Der Starkeffekt für die ersten beiden Eigenenergien im Wasserstoffproblem. 14.3 Zeitabhängige Störungstheorie Zum Abschluss wollen wir den Fall untersuchen, dass eine zeitabhängige Störung vorliegt. Dafür führen wir zunächst ein weiteres “Bild” für die Zeitentwicklung (neben dem Schrödinger- und dem Heisenbergbild aus Kapitel 9) ein. Man bezeichnet es als das Wechselwirkungs- oder Diracbild. Dazu betrachten wir den 180 KAPITEL 14. NÄHERUNGSMETHODEN Hamiltonoperator Ht = H0 + Vt mit einem zeitunabhängigen Term H0 und einer möglicherweise zeitabhängigen Störung Vt . Die Schrödingergleichung lautet dann i~ d |ψ(t)i = (H0 + Vt ) |ψ(t)i . dt Von der Zeitabhängigkeit des Zustandes |ψ(t)i spalten wir den Teil ab der von H0 stammt |ψ(t)i =: e−iH0 t/~ |ψt i , |ψt i = eiH0 t/~ |ψ(t)i . was den Zustand |ψt i definiert. Zur (willkürlichen) Zeit t = 0 gilt |ψt=0 i = |ψ(t = 0)i. Der Zustand |ψt i im Wechselwirkungsbild gehorcht einer modifizierten Schrödingergleichung i~ d |ψt i = −H0 |ψt i + eiH0 t/~ (H0 + Vt ) |ψ(t)i dt = eiH0 t/~ Vt e−iH0 t/~ |ψt i . Definiert man nun allgemein zu jedem Operator Ot im Schrödingerbild einen Operator OD (t) := eiH0 t/~ Ot e−iH0 t/~ , so folgt i~ d |ψt i = VD (t) |ψt i . dt Definiert man über |ψt i =: UD (t, t0 ) |ψt0 i den unitären Zeitentwicklungsoperator im Wechselwirkungsbild, so ergibt sich aus diesem mit Hilfe der Schrödingergleichung i~ d UD (t, t0 ) = VD (t)UD (t, t0 ) , dt mit der Anfangsbedingung UD (t0 , t0 ) = 1. Durch Integration überführen wir diese Differentialgleichung in eine Integralgleichung Z i t 0 UD (t, t ) = 1 − VD (t1 )UD (t1 , t0 ) dt1 . ~ t0 14.3. ZEITABHÄNGIGE STÖRUNGSTHEORIE 181 Iteration dieser Gleichung liefert die sehr wichtige Dyson-Reihe 2 Z t Z t1 Z i i t 0 VD (t1 )VD (t2 ) dt2 dt1 + . . . . VD (t1 ) dt1 + UD (t, t ) = 1 − ~ t0 ~ t0 t0 Wir betrachten nun das folgende Anfangswertproblem. Zur Zeit t0 befinde sich das System (Teilchen) im Eigenzustand |mi zu H0 , d.h. H0 |mi = Em |mi und damit |ψ(t0 )i = |mi bzw. |ψt0 i = exp (iEm t0 /~) |mi. Wir sind daran interessiert die Wahrscheinlichkeit Pm→n (t, t0 ) zu bestimmen, dass sich das System (Teilchen) zur Zeit t im Eigenzustand |ni von H0 befindet Pm→n (t, t0 ) = |hn| ψ(t)i|2 2 = hn| e−iH0 t/~ |ψt i 2 = e−iEn t/~ hn| UD (t, t0 ) |mi eiEm t0 /~ = |hn| UD (t, t0 ) |mi|2 , wobei wir ausgenutzt haben, dass auch |ni Eigenvektor zu H0 ist. Um diesen Ausdruck weiter auszuwerten verwenden wir die Dyson-Reihe für UD (t, t0 ). Für n 6= m erhalten wir Z i t hn| VD (t0 ) |mi dt0 + . . . hn| UD (t, t0 ) |mi = − ~ t0 Z i t 0 0 = − hn| eiH0 t ~ Vt0 e−iH0 t /~ |mi dt0 + . . . ~ t0 Z i t i(En −Em )t0 /~ e hn| Vt0 |mi dt0 + . . . . = − ~ t0 In führender Ordnung (d.h. zur Ordnung V 2 ) gilt damit Z 2 1 t i(En −Em )t0 /~ 0 dt . Pm→n (t, t0 ) = 2 hn| Vt0 |mi e ~ t0 (14.8) Um auch Pm→m (t, t0 ) bis zur Ordnung V 2 zu bestimmen, muss man den quadratischen Term in der Dyson-Reihe auswerten. Das Ergebnis erhält man viel einfacher aus der Erhaltung der Wahrscheinlichkeit X Pm→n (t, t0 ) = 1 n und damit Pm→m (t, t0 ) = 1 − X Pm→n (t, t0 ) (14.9) n6=m 2 X 1 Z t 0 /~ i(E −E )t 0 n m hn| Vt0 |mi e . = 1− dt 2 ~ t 0 n6=m (14.10) 182 KAPITEL 14. NÄHERUNGSMETHODEN Die Gln. (14.8) und (14.9) sind gute Näherungen, solange 1 − Pm→m (t, t0 ) 1 gilt, da wir nur die Terme niedrigster Ordnung berücksichtigt haben. Als sehr wichtiges Beispiel betrachten wir die Situation, dass Vt periodisch von der Zeit abhängt 1 Vt = V cos (ωt) = V eiωt + e−iωt . 2 In diesem Fall lässt sich die Zeitintegration in Gl. (14.8) leicht ausführen. Wir definieren die Übergangsfrequenz ωn,m := (En − Em )/~. Damit ergibt sich i(ωn,m −ω)t 1 − ei(ωn,m −ω)t0 2 e Pm→n (t, t0 ) = 2 |hn| V |mi| 4~ ωn,m − ω 2 i(ωn,m +ω)t e − ei(ωn,m +ω)t0 + . ωn,m + ω Für den Fall einer statischen Störung, d.h. für ω → 0, folgt mit t̃ = t − t0 2 1 sin (ωn,m t̃/2) 2 Pm→n (t̃) = 2 |hn| V |mi| . ~ ωn,m /2 Diese Funktion ist in Abbildung 14.3 dargestellt. Für t̃ → ∞ ergibt sich lim Pm→n (t̃) = t̃→∞ 2π t̃ |hn| V |mi|2 δ(En − Em ) . ~ Man nennt diesen Ausdruck “Fermis Goldene Regel”. Wir sehen dabei, dass die Näherung für große Zeiten t̃ zusammenbricht, da die Übergangswahrscheinlichkeit linear mit t̃ anwächst. Für große t̃ ergibt sich im allgemeinen Fall mit endlicher Frequenz lim Pm→n (t̃) = t̃→∞ 2π t̃ |hn| V |mi|2 [δ(En − Em − ~ω) + δ(En − Em + ~ω)] . 4~ Eine weiter Vereinfachung ergibt sich im Fall der Resonanz ω ≈ ωn,m 1 Pm→n (t̃) = 2 |hn| V |mi|2 4~ sin [(ωn,m − ω)t̃/2] (ωn,m − ω)/2 2 da man nur den ersten Term im obigen allgemeinen Ausdruck mitzunehmen braucht. Trägt man ωn,m − ω statt ωn,m auf so ergibt sich eine zu Abbildung 14.3 analoge Skizze wobei jedoch die Höhe um einen Faktor 1/4 reduziert ist. Als Beispiel zur Anwendung der zeitabhängigen Störungstheorie betrachten wir das Wasserstoffatom in einem Strahlungsfeld. Ziel ist es die Absorbtion und 14.3. ZEITABHÄNGIGE STÖRUNGSTHEORIE 183 2 ~2 - 2 |Vn,m| t /h ωn,m 4π/t~ Abbildung 14.3: Übergangswahrscheinlichkeit im statischen Limes. die induzierte Emission zu verstehen. Die Kopplung des Elektronenspins vernachlässigen wir da sie für die interessierenden Wellenlängen nur eine kleine Korrektur darstellt. Das äußere Strahlungsfeld habe die Form einer ebenen Welle in x2 -Richtung. Wir verwenden die Coulombeichung mit ∂ ~ · A(~x, t) = 0 , ∂~x φ(~x, t) = 0 . Dann gilt ~ x, t) = A0 ei(kx2 −ωk t) + A∗ e−i(kx2 −ωk t) ~e3 , A(~ 0 ~ und B-Felder ~ mit ωk = ck. Die Eergeben sich zu ~ ~ x, t) = − 1 ∂ A = k iA0 ei(kx2 −ωk t) − iA∗0 e−i(kx2 −ωk t) ~e3 , E(~ c ∂t ∂ ~ x, t) = ~ = k iA0 ei(kx2 −ωk t) − iA∗ e−i(kx2 −ωk t) ~e1 . B(~ ×A 0 ∂~x Der Hamiltonoperator des “spinlosen” Elektrons im Zentralpotential und im Strahlungsfeld lautet dann 1 h ˆ e ~ ˆ i2 H = p~ + A(~x, t) + V (|~xˆ|) 2m c 2 ˆ p~ e ˆ ~ ˆ ≈ + V (|~xˆ|) + p~ · A(~x, t) 2m mc = H0 + Vt , 184 KAPITEL 14. NÄHERUNGSMETHODEN ~ vernachlässigt haben, da das Vektorpotenwobei wir den Term quadratisch in A ~ = A ~ · p~ˆ verwendet haben (wegen tial als “klein” angenommen wird, und p~ˆ · A ∂ ~ = 0). Der zeitabhängige Störhamiltonoperator lautet damit ·A ∂~ x Vt = e p̂3 A0 ei(kx̂2 −ωk t) + A∗0 e−i(kx̂2 −ωk t) . mc Für sichtbares Licht gilt ka0 1, mit dem Bohrradius a0 , und man kann die Exponentialfunktion entwickeln (Multipolentwicklung) 1 e±ikx̂2 = 1 ± ikx̂2 − k 2 x̂22 + . . . . 2 Nimmt man nur den ersten Term mit, so spricht man von der Dipolnäherung. Für reelle A0 folgt für den Störhamiltonoperator in der Dipolnäherung Vt = eE0 p̂3 cos (ωk t) , mω wobei E0 := 2kA0 . Zur Berechnung der Übergangswahrscheinlichkeiten zwischen den Eigenzuständen des Wasserstoffatoms benötigen wir also Matrixelemente der Form hl0 , m0 , n0 | p̂3 |l, m, ni . Aus [x̂3 , H0 ] = i~p̂3 /m und hl0 , m0 , n0 | [x̂3 , H0 ] |l, m, ni = −(En0 − En ) hl0 , m0 , n0 | x̂3 |l, m, ni folgt, dass man die gesuchten Matrixelemente durch solche des Ortsoperators (genauer der x3 -Komponente) ausdrücken kann. Es gilt (Achtung! Man beachte das m sowohl die Masse wie auch die Drehimpulsquantenzahl bezeichnet!!) hl0 , m0 , n0 | p̂3 |l, m, ni = imωn0 ,n hl0 , m0 , n0 | x̂3 |l, m, ni . Matrixelemente dieser Form haben wir bereits weiter oben diskutiert. Dort haben wir gezeigt, dass m = m0 gelten muss. Eine weiter “Auswahlregel” ergibt sich zu l0 − l = ±1. Dieses sieht man wie folgt. Es gilt x3 = r cos θ ∼ Y1,0 (θ, ϕ) und Y1,0 (θ, ϕ) Yl,m (θ, ϕ) = aYl+1,m (θ, ϕ) + bYl−1,m (θ, ϕ) . Aus der Orthogonalitätsrelation der Kugelflächenfunktionen folgt dann sofort ~ ∆l := l0 − l = ±1. Damit sind im betrachteten Fall eines E-Feldes in die ~e3 Richtung und in der Dipolnäherung nur Matrixelemente von Zustände die m = m0 und l0 − l = ±1 erfüllen nicht Null. D.h. ein solches Strahlungfeld kann nur Übergänge (in Diplonäherung) zwischen Eigenzuständen des ungestörten Wasser~ stoffatoms induzieren, die diese Bedingungen erfüllen. Für ein E-Feld in ~e1 - oder ~e2 -Richtung muss ∆m = ±1 gelten. 14.3. ZEITABHÄNGIGE STÖRUNGSTHEORIE 185 Mit den gerade angestellten Betrachtungen beschreiben wir die Absorption (En − Em > 0) und die induzierte Emission (En − Em < 0) eines Wasserstoffatoms in einem elektro-magnetischen Wechselfeld. Wir stellen fest, dass wegen |hn| V |mi| = |hm| V |ni| die Wahrscheinlichkeiten für beide Prozesse gleich groß ist. Die ebenfalls wichtige (und Ihnen sicherlich bekannte) spontane Emission eines angeregten Atoms, kann man mit unseren bisherigen Überlegungen nicht verstehen, da die Zustände für V = 0 stabil sind. Um diese zu beschreiben muss man das Strahlungsfeld quantisieren, was in der Vorlesung Quantenmechanik II diskutiert wird. 186 KAPITEL 14. NÄHERUNGSMETHODEN Kapitel 15 Ununterscheidbare Teilchen 15.1 Allgemeine Prinzipien Im Alltag können wir zwei Objekte entweder dadurch unterscheiden, dass sie sich in einer “unveränderbaren” (im entsprechenden Kontext unveränderbar reicht dabei) Eigenschaft unterscheiden, oder in dem wir identische Objekte—d.h. Objekte die in allen ihren Eigenschaften übereinstimmen—bei ihrer Bewegung “mit den Augen verfolgen”. Die klassische Hamiltonfunktion zweier identischer (Masse m), geladener (Ladung q) Teilchen (spinlos) in einem äußeren Potenzial φ ist durch q2 p~1 2 p~2 2 + + + qφ(~x1 ) + qφ(~x2 ) 2m 2m |~x1 − ~x2 | = H(~x2 , p~2 ; ~x1 , p~1 ) H(~x1 , p~1 ; ~x2 , p~2 ) = (15.1) gegeben. Wie oben angedeutet, können wir die klassischen Punktteilchen trotz identischer Eigenschaften zu allen Zeiten t unterscheiden, in dem wir zur beliebigen Zeit t0 ihre Koordinaten notieren. Wenn wir nun die Bahnen der zwei Teilchen im Raum verfolgen, oder zusätzlich die Anfangsgeschwindigkeiten (-impulse) messen und die Bahnen berechnen, so können wir sicher sein, das Teilchen n = 1, 2 (und nicht n̄ = 2, 1) zur Zeit t an einem bestimmten Ort anzutreffen. In der Quantenmechanik ist der Bahnbegriff durch die Unschärferelation eingeschränkt, wodurch sich bei der Beschreibung von Teilchen mit identischen Eigenschaften (Masse, Ladung, Spin) völlig neue Effekte ergeben. Dabei muss festgehalten werden, dass es in der Mikrowelt im Gegensatz zur Makrowelt prinzipiell nicht möglich ist “Markierungen” an die Teilchen anzubringen ohne den Charakter der Teilchen zu ändern. So haben z.B. verschiedene Isotope eines Atoms unterschiedliche Eigenschaften, wie Masse und Spin. Wir diskutieren zunächst den Fall von N = 2 identischen quantenmechanischen Teilchen. Wie im Fall zweier verschiedener Teilchen (z.B. Elektron und Proton eines Wasserstoffatoms) führen wir den Produktraum H12 := H1 ⊗ H2 187 188 KAPITEL 15. UNUNTERSCHEIDBARE TEILCHEN ein. Sei {|ii} eine Orthonormalbasis für ein Teilchen der betrachteten Sorte, so kann man jeden Zustand |ψi ∈ H12 in der Form X |ψi = cij |ii(1) ⊗ |ji(2) i,j schreiben. Das Korrespondenzprinzip liefert uns aus Gl. (15.1) den Hamiltonoperator H = p~ˆ2 2 q2 p~ˆ1 2 ⊗ 12 + 11 ⊗ + 2m 2m |~xˆ1 ⊗ 12 − 11 ⊗ ~xˆ2 | +qφ(~xˆ1 ) ⊗ 12 + 11 ⊗ qφ(~xˆ2 ) , (15.2) bzw. nach Weglassen der 1-Operatoren (meist verwendete kürzere Schreibweise) H q2 p~ˆ1 2 p~ˆ2 2 + qφ(~xˆ1 ) + + qφ(~xˆ2 ) + 2m 2m |~xˆ1 − ~xˆ2 | =: h1 + h2 + v12 . = (15.3) Durch seine Wirkung auf beliebige Zustände |ψi ∈ H12 definieren wir den Permutationsoperator P12 , der die Zustände von Teilchen 1 und 2 vertauscht X P12 |ψi = P12 cij |ii(1) ⊗ |ji(2) i,j = X cij |ji(1) ⊗ |ii(2) . i,j 2 Es ist offensichtlich, dass P12 = 1 gilt. Da weiterhin die Norm unter der Wirkung † von P12 erhalten bleibt, gilt P12 P12 = 1 (Unitarität). Die Multiplikation von rechts † mit P12 liefert dann die Selbstadjungiertheit P12 = P12 . Als selbstadjungierter, unitärer Operator hat P12 die Eigenwerte ±1. Für die Wellenfunktion (Zustand im Produkt-Ortsraum) erhält man durch Anwenden von P12 nach links h~x1 , σ1 ; ~x2 , σ2 | P12 |ψi = h~x2 , σ2 ; ~x1 , σ1 | ψi = ψ(~x2 , σ2 ; ~x1 , σ1 ) falls h~x1 , σ1 ; ~x2 , σ2 | ψi = ψ(~x1 , σ1 ; ~x2 , σ2 ) . Wir untersuchen nun, wie der Permutationoperator Observable transformiert. Eine beliebige Observable auf H12 lässt sich als Summe (oder Integral) von Produkten der Form A ⊗ B schreiben für die (A ⊗ B)(|ii(1) ⊗ |ji(2) ) = A |ii(1) ⊗ B |ji(2) =: |iA i(1) ⊗ |jB i(2) 15.1. ALLGEMEINE PRINZIPIEN 189 † gilt. Wir berechnen darauf aufbauend P12 (A ⊗ B)P12 † P12 (A ⊗ B)P12 (|ii(1) ⊗ |ji(2) ) = P12 (A ⊗ B)(|ji(1) ⊗ |ii(2) ) = P12 (|jA i(1) ⊗ |iB i(2) ) = |iB i(1) ⊗ |jA i(2) = (B ⊗ A)(|ii(1) ⊗ |ji(2) ) . Da die Zustände |ii und |ji beliebig sind, folgt die Operatoridentität † P12 (A ⊗ B)P12 =B⊗A. Der Permutationsoperator vertauscht somit die Teilchen 1 und 2 und allgemein gilt † P12 Ô(1, 2)P12 = Ô(2, 1) . (15.4) Für den Hamiltonoperator Gl. (15.2) gilt H(1, 2) = H(2, 1) und mit Gl. (15.4) folgt [P12 , H] = 0 . Somit ist P12 eine Erhaltungsgröße (Konstante der Bewegung) und gleichzeitig mit H diagonalisierbar. Aus einem beliebigen Zustand |ψi ∈ H12 erhält man Eigenzustände zu P12 durch Anwenden der Projektionsoperatoren 1 (1 + P12 ) . 2 1 := (1 − P12 ) . 2 S2 := A2 Die Bezeichnungen S2 und A2 stehen dabei für symmetrisch und antisymmetrisch (und die Tatsache, dass wir zurzeit mit nur zwei Teilchen arbeiten). Die resultierenden Zustände haben die Eigenschaft |ψs i := S2 |ψi → P12 |ψs i = |ψs i und |ψa i := A2 |ψi → P12 |ψa i = − |ψa i . Dabei gilt es zu beachten, dass die Zustände selbst wenn |ψi normiert war, nicht notwendigerweise normiert sind. Für die Wellenfunktionen gilt 1 [ψ(~x1 , σ1 ; ~x2 , σ2 ) + ψ(~x2 , σ2 ; ~x1 , σ1 )] , 2 1 h~x1 , σ1 ; ~x2 , σ2 | ψa i = [ψ(~x1 , σ1 ; ~x2 , σ2 ) − ψ(~x2 , σ2 ; ~x1 , σ1 )] . 2 h~x1 , σ1 ; ~x2 , σ2 | ψs i = 190 KAPITEL 15. UNUNTERSCHEIDBARE TEILCHEN Misst man experimentelle Konsequenzen der Symmetrie der Wellenfunktion so stellt man fest, dass ununterscheidbare Teilchen immer nur in Zuständen vorkommen, die Eigenzustände zu P12 sind, wobei der Eigenwert (±1) nur von der Teilchensorte abhängt (experimentelle Tatsache). Die Wellenfunktion zweier Elektronen ist z.B. immer antisymmetrisch. Teilchen mit symmetrischen Wellenfunktionen nennt man Bosonen, Teilchen mit antisymmetrischen Wellenfunktionen Fermionen. Die Erfahrung zeigt, dass Bosonen Teilchen mit ganzzahligem Spin sind, während Fermionen einen halbzahligen Spin haben. Diesen Zusammenhang zwischen “Spin und Statistik” konnte Wolfgang Pauli 1940 im Rahmen der relativistischen Quantenfeldtheorie theoretisch begründen. Da die Symmetrie der Wellenfunktion durch keinen Apparat geändert werden kann, sind nur Observable zugelassen, die (wie der Hamiltonoperator) beide Teilchen symmetrisch beschreiben, d.h. für die Ô(1, 2) = Ô(2, 1) und damit P12 Ô ψs/a = ±Ô ψs/a gilt. Beispiele sind der Gesamtimpuls p~ˆ := p~ˆ1 ⊗ 12 + 11 ⊗ p~ˆ2 und der Operator der Teilchendichte ρ̂(~x) := δ(~x − ~xˆ1 ) ⊗ 12 + 11 ⊗ δ(~x − ~xˆ2 ) . In einer verkürzenden Schreibweise (siehe oben) lässt man die Identitätsoperatoren 1 in Ausdrücken dieser Art häufig einfach weg. Für Fermionen gilt wegen der Antisymmetrie das Pauliprinzip: Zwei ununterscheidbare Fermionen können sich nicht im selben Einteilchenzustand befinden. Mit |b, bi := |bi ⊗ |bi gilt für jeden antisymmetrischen Zustand |ψa i 1 hb, b| (1 − P12 ) |ψi 2 1 = (hb, b |ψi − hb, b |ψi) 2 = 0 hb, b |ψa i = und damit ist die Wahrscheinlichkiet in dem antisymmetrischen Zustand |ψa i einen Anteil in Richtung |b, bi für beliebige b zu finden gleich Null. Eine Besonderheit des bisher diskutierten Falls zweier ununterscheidbarer Teilchen N = 2 ist, dass der gesamte Hilbertraum H12 in den symmetrischen Teil Hs und den antisymmetrischen Teil Ha zerfällt, da S2 + A2 = 1 15.2. ZWEI ELEKTRONEN IM ÄUSSEREN POTENZIAL 191 gilt. Im Fall N ≥ 3 ergibt die Summe einer analogen Zerlegung des Produkthilbertraums H12...N = H1 ⊗H2 ⊗. . .⊗HN in die Teilräume der totalsymmetrischen und der totalantisymmetrischen Zustände (Definition siehe gleich) nicht den ganzen Raum. Definiert man analog zum Fall N = 2 allgemeine Permutationsoperatoren Pmn mit der Eigenschaft den Zustand des m-ten und des n-ten Teilchens zu vertauschen Pmn |i1 i(1) ⊗ . . . ⊗ |im i(m) ⊗ . . . ⊗ |in i(n) ⊗ . . . ⊗ |iN i(N ) = |i1 i(1) ⊗ . . . ⊗ |in i(m) ⊗ . . . ⊗ |im i(n) ⊗ . . . ⊗ |iN i(N ) , so nennt man einen Zustand |ψs i totalsymmetrisch falls für alle Paare (m, n) Pmn |ψs i = |ψs i gilt. Analog nennt man einen Zustand totalantisymmetrisch falls für alle Paare (m, n) Pmn |ψa i = − |ψa i gilt. Für die Wellenfunktionen (im Ortsraum) gilt entsprechend (der Spin ist mit in ~x enthalten) ψs (~x1 , . . . , ~xm , . . . , ~xn , . . . , ~xN ) = ψs (~x1 , . . . , ~xn , . . . , ~xm , . . . , ~xN ) , ψa (~x1 , . . . , ~xm , . . . , ~xn , . . . , ~xN ) = −ψa (~x1 , . . . , ~xn , . . . , ~xm , . . . , ~xN ) . Die Verallgemeinerung der oben zitierten experimentellen Tatsache zur Symmetrie von Wellenfunktionen unter Zustandsvertauschung fassen wir in einem weiteren Postulat zusammen: Postulat 8: Mikroobjekte mit identischen Eigenschaften (wie Masse, Ladung, Spin,. . . ) werden entweder durch totalsymmetrische (Bosonen) oder total antisymmetrische (Fermionen) Zustandsvektoren beschrieben. Fermionen haben halbzahligen und Bosonen ganzzahligen Spin. Eine allgemeine Diskussion des Falls von mehr als zwei ununterscheidbaren Teilchen wird in der Vorlesung Quantenmechanik II gegeben. Wir wollen uns hier in einem nächsten Schritt die Situation zweier Elektronen in einem vorgegebenen äußeren Potential genauer anschauen. Er ist von Relevanz bei der Beschreibung des Helium Atoms und des Wasserstoff Moleküls H2 . 15.2 Zwei Elektronen im äußeren Potenzial Aufgrund der repulsiven Coulombwechselwirkung e2 /|~xˆ1 − ~xˆ2 | ist bereits dieses recht einfache “Viel”teilchenproblem nicht mehr exakt lösbar. In nullter Näherung 192 KAPITEL 15. UNUNTERSCHEIDBARE TEILCHEN vernachlässigen wir zunächst die Elektron-Elektron-Wechselwirkung und bestimmen die (gebundenen) Eigenzustände |ϕ0 i, |ϕ1 i, . . . eines Elektrons im gegebenen äußeren Potenzial mit Energie ε0 , ε1 , . . .. Nach dem Pauliprinzip kann man die beiden Elektronen nur dann im Zustand |ϕ0 i vorfinden, wenn sie unterschiedlichen Spin haben. Der Produktzustand |ϕ0 i(1) ⊗ |σi(1) ⊗ |ϕ0 i(2) ⊗ |−σi(2) ist bei Vernachlässigung der Elektron-Elektron-Wechselwirkung somit Eigenzustand zum Hamiltonoperator mit Energie 2ε0 . Er hat aber noch nicht die geforderte Antisymmetrie. Anwenden des Antisymmetrisierungsoperators A2 = (1 − P12 )/2 auf den Produktzustand liefert (0) (1) (1) (2) (2) |ψ0 i := A2 |ϕ0 i ⊗ |σi ⊗ |ϕ0 i ⊗ |−σi 1 (2) 1 (1) (1) (2) (1) (2) √ √ |ϕ0 i |ϕ0 i |σi |−σi − |−σi |σi . = 2 2 Der Ortsanteil des resultierenden Zustandes ist symmetrisch, während der Spinanteil antisymmetrisch ist. Ein Vergleich mit Gl. (11.8) zeigt, dass der Spinanteil das Singulett mit s = 0 und m = 0 darstellt, also Eigenvektor zum Gesamtspin und zur z-Komponente des Gesamtspins ist. Um den Bahnanteil des Grundzustandes eines Heliumatoms |ϕ0 i(n) , n = 1, 2 näherungsweise zu bestimmen verwenden wir den Variationszustand 3/2 h~x |ϕ0 i = Zeff 3/2 πa0 e−Zeff r/a0 , mit der zu bestimmenden “effektiven” auf ein Elektron wirkenden Kernladung Zeff (die echte Kernladung wird durch das andere Elektron abgeschirmt). Eine längliche Variationsrechnung (unter Berücksichtigung der Elektron-Elektron0 Wechselwirkung) zeigt, dass Zeff = 2 − 5/16 ≈ 1.69 woraus die Grundzustands0 energie E0 (Zeff ) ≈ −77.5eV folgt. Der experimentelle Wert ist E0exp ≈ −78.8eV. Für die Wahl Zeff = 2, was der exakten Lösung für das He+ -Atom entspricht, ergibt sich E0 (Zeff = 2) ≈ −74.8eV. Wir sehen also, dass die Variationsrechnung, welche die Abschirmung berücksichtigt, zu einem deutlich besseren Wert für die Grundzustandsenergie führt. Zur Bestimmung des Bahnanteils des Grundzustandes des H2 -Moleküls kann man den Variationsansatz ~ 1 |/a0 ~ 2 |/a0 −Zeff |~ x−R −Zeff |~ x−R h~x |ϕ0 i = c e +e ~ 1/2 die Koordinaten der festgehaltenen (Born-Oppenheimermachen, wobei R Näherung) Protonen sind. Dies ist das einfachste Beispiel der in der Quantenchemie häufig benutzten LCAO-Methode (linear combination of atomic orbitals) die von Hund und Mullikan entwickelt wurde. Wir wollen hiermit die Versuche der näherungsweisen Bestimmung des Grundzustandes eines zwei-Elektronensystems im äußeren Potenzial abschließen und 15.2. ZWEI ELEKTRONEN IM ÄUSSEREN POTENZIAL 193 uns den angeregten Zuständen zuwenden. Wir starten wieder mit Überlegungen zum Helium Atom. Befinden sich die Elektronen in verschiedenen Ortszuständen |ϕ0 i und |ϕ1 i (z.B. in den 1s und 2s Zuständen), so darf der Spinzustand beider Elektronen gleich sein. Der entsprechende antisymmetrische Zustand lautet 1 (1) (2) (1) (2) √ |ϕ0 i |ϕ1 i − |ϕ1 i |ϕ0 i |σi(1) |σi(2) . |ψ10,σσ i = 2 Er ist ein Spin-Triplett Zustand (Eigenzustand zum Gesamtspin) mit s = 1 und m = ±1. Der Erwartungswert des spinunabhängigen Hamiltonoperators Gl. (15.3) in diesem Zustand lautet 1 [hϕ0 , ϕ1 | H |ϕ0 , ϕ1 i + hϕ1 , ϕ0 | H |ϕ1 , ϕ0 i 2 − hϕ0 , ϕ1 | H |ϕ1 , ϕ0 i − hϕ1 , ϕ0 | H |ϕ0 , ϕ1 i] = hϕ0 | h |ϕ0 i + hϕ1 | h |ϕ1 i + hϕ0 , ϕ1 | v12 |ϕ0 , ϕ1 i − hϕ0 , ϕ1 | v12 |ϕ1 , ϕ0 i . | {z } | {z } hψ10,σσ | H |ψ10,σσ i = =:I =:J Dabei haben wir die Orthogonalität der Einteilcheneigenzustände, h1 = h2 =: h und v12 = v21 ausgenutzt. Sind die |ϕj i die Eigenzustände zu h, so ergeben die ersten beiden Terme die Summe der zugehörigen Einteilcheneigenwerte ε0 + ε0 . Die beiden auftretenden Matrixelemente der Elektron-Elektron(-Coulomb)Wechselwirkung bezeichnet man als Coulombintegral I und Austauschintegral J. Deren physikalische Bedeutung erfasst man am leichtesten in der Ortsdarstellung Z Z 1 2 |ϕ1 (~x2 )|2 d3 x1 d3 x2 I = e |ϕ0 (~x1 )|2 |~x1 − ~x2 | Z Z 1 J = e2 ϕ1 (~x1 )ϕ0 (~x2 ) d3 x1 d3 x2 . ϕ∗0 (~x1 )ϕ∗1 (~x2 ) |~x1 − ~x2 | Das Integral I ist die elektrostatische Energie der beiden Ladungsdichten e |ϕj (~x)|2 . Das Austauschintegral J hat kein direktes klassisches Analogon. Das Minuszeichen vor dem J ergibt sich aufgrund der Antisymmetrie des Bahnanteils des Zustandes. Ein entsprechender Zustand zweier Bosonen hätte an dieser Stelle ein Pluszeichen. Der antisymmetrische Zustand zum Gesamtspin s = 0 in dem die Einteilchenzustände |ϕ0 i und |ϕ1 i besetzt sind hat einen symmetrischen Bahnanteil und einen antisymmetrischen Spinanteil und lautet 1 1 |ψ10,s=0 i = √ |ϕ0 i(1) |ϕ1 i(2) + |ϕ1 i(1) |ϕ0 i(2) √ (|↑, ↓i − |↓, ↑i) . 2 2 Der Erwartungswert von H in diesem Zustand ergibt sich damit zu hψ10,s=0 | H |ψ10,s=0 i = hϕ0 | h |ϕ0 i + hϕ1 | h |ϕ1 i + I + J . 194 KAPITEL 15. UNUNTERSCHEIDBARE TEILCHEN Man kann zeigen, dass I und J positiv sind und daher hat der Zustand zum Gesamtspin s = 1 eine niedrigere Gesamtenergie. Anschaulich lässt sich diese Beobachtung wie folgt verstehen. Der Zustand mit s = 1 hat eine antisymmetrische Ortswellenfunktion, die für ~x1 = ~x2 verschwindet. Im s = 0 Zustand dagegen können sich die beiden Elektronen beliebig nahe kommen, was zu einer erhöhten Elektron-Elektron-Wechselwirkung führt. Obwohl der Hamiltonoperator spinunabhängig ist, führt die Elektron-Elektron-Wechselwirkung zusammen mit der Antisymmetrie zu einer Spinabhängigkeit der Energie. 15.3 Das Periodensystem der Elemente Das Pauliprinzip bildet die Grundlage zum Verständnis des Periodensystems der Elemente. Zwar sind die im letzten Kapitel verwendeten antisymmetrisierten Produktzustände nicht gut genug zur quantitativen Berechnung der Energieeigenwerte des Hamiltonoperators ! Z 2 2 ˆ X eZ 1X e2 p~i − + , H= 2m 2 i6=j |~xˆi − ~xˆj | |~xˆi | i=1 man kann aber den Vielteilchengrundzustand und die angeregten Zustände durch Angabe der besetzten Einteilchenzustände klassifizieren. Der Grundzustand des Kohlenstoffs wird dann z.B. durch die Angabe (1s)2 ,(2s)2 ,(2p)2 charakterisiert. Ein Anregungszustand ist z.B. durch (1s)2 ,(2s)2 ,(2p),(3s) gegeben. Aufgrund der Elektron-Elektron-Wechselwirkung und anderer bisher nicht berücksichtigter Terme (z.B. der Spin-Bahn-Kopplung Gl. (11.10)) spalten die Zustände 1s, 2s, 2p, . . . energetisch auf. Sie bilden Multipletts. Die Energieabstände zwischen den verschiedenen Multipletts sind groß verglichen mit den Energieabständen innerhalb der Multipletts. Die Aufspaltungsenergien hängen von den Werten des Gesamtdrehimpulses L und des Gesamtspins S ab. Den Grundzustand findet man über die empirischen Hundschen Regeln: 1) Das LS-Multiplett mit maximalem S hat die niedrigste Energie. 2) Sind bei maximalem S mehrere L-Werte möglich, so führt der größte LWert zur niedrigsten Energie. ˆ ~ˆ ~ˆ Bildet man den Gesamtdrehimpuls J~ = L + S, so hängt die Grundzustandenergie auch noch von J ab, falls die Spin-Bahn-Kopplung berücksichtigt wird. Es ergibt sich die dritte Regel: 3) Eine nicht mehr als halbgefüllte Schale hat den kleinsten möglichen Wert J = |L − S|. Eine mehr als halb gefüllte Schale hat den größten möglichen Wert J = L + S. 15.3. DAS PERIODENSYSTEM DER ELEMENTE 195 Für das Beispiel des Kohlenstoffatom ergibt sich nach diesen Regeln, dass im Grundzustand die 1s und 2s Niveaus mit jeweils einem “spinrauf” und einem “spinrunter” Elektron vollständig besetzt sind und vom 2p Niveau die Zustände mit m = 1 und m = 0 mit jeweils einem “spinrauf” Elektron besetzt sind. Das liefert S = 1, L = 1 und J = 0 (weniger als halbgefüllte Schale). Aus Zeitgründen werden wir es bei diesen recht groben Betrachtungen zum Periodensystem der Elemente belassen und verweisen auf die Atomphysik Vorlesung in der experimentellen Physik. 196 KAPITEL 15. UNUNTERSCHEIDBARE TEILCHEN Kapitel 16 Verschränkung und lokaler Realismus 16.1 Zwei-Photonen-Zustände In den letzten Kapiteln haben wir wiederholt diskutiert, wie man Mehrteilchensysteme beschreibt. Hier wollen wir den Themenkreis dieser Vorlesung schließen und zu der quantenmechanischen Beschreibung der Polarisation von Photonen aus Kapitel 1.2 zurückkehren; diesmal jedoch mit dem Ziel die Quantenmechanik von Zwei-Photonen-Zuständen zu verstehen. Wir werden sehen, dass solche Zustände das Potenzial einer quantenmechanischen Eigenschaft in sich tragen, die wir bisher nicht ausführlich untersucht haben: Verschränkung (oder englisch “entanglement”). Schon jetzt soll betont werden, dass diese kein klassisches Analogon besitzt und überraschende Konsequenzen nach sich zieht. Wie zu Beginn der Vorlesung beziehen wir unsere Überlegungen auf Gedanken-Experimente. In weniger idealer Form sind diese aber auch ausführbar. In einem Experiment fällt ein einzelnes Photon eines Pumplasers auf einen speziellen Kristall. In diesem werden durch den Prozess der spontanen, parameterischen “downconversion” zwei Photonen erzeugt, die zur gleichen Zeit den Kristall verlassen. Die Frequenzen und Impulse des “signal” and “idler” Photons sind korreliert. In dem Typ des “downconversion” Prozesses auf den wir uns beschränken, sind die Polarisationen des Photonenpaars gleich und senkrecht zu der des Pump-Photons. Wenn das Pump-Photon also bezüglich seiner Polarisation im Zustand |1i (zur Notation siehe Kapitel 3.1) ist, ist das Photonenpaar im Zustand |3, 3i = |3is ⊗ |3ii . Wir werden im Folgenden 1 → V (vertikale Polarisation) und 3 → H (horizontale Polarisation) ersetzen. Wie Sie in den Übungen kennengelernt haben, gibt es optische Elemente, die die Polarisationsebene drehen können. Wir betrachten hier eine Rotation um π/4 (mathematisch positiv). Bringen wir ein solches Element in den optischen Pfad des Signal-Photons – das Photonenpaar ist nach der “downconversion” räumlich getrennt – so ist das System im Zustand 197 198 KAPITEL 16. VERSCHRÄNKUNG UND LOKALER REALISMUS (in selbsterklärender Notation) |+π/4, Hi = |+π/4is ⊗ |Hii 1 = √ (|His + |V is ) ⊗ |Hii 2 1 = √ (|His ⊗ |Hii + |V is ⊗ |Hii ) 2 1 = √ (|H, Hi + |V, Hi) . 2 Wenn wir zusätzlich ein optisches Element in der Pfad des “idler”-Photons bringen, welches |Hii → |Rii überführt (rechts-zirkular), so ergibt sich |+π/4, Ri = |+π/4is ⊗ |Rii 1 1 = √ (|His + |V is ) ⊗ √ (|Hii − i |V ii ) 2 2 1 = (|H, Hi − i |H, V i + |V, Hi − i |V, V i) . 2 Dieser Zustand ist eine Linearkombination aller vier Produktbasiszustände. Wir wollen nun berechnen, wie groß die Wahrscheinlichkeit ist zu messen, dass im Zustand |+π/4, Ri, dass Signal-Photon vertikal und dass “idler”-Photon horizontal polarisiert sind1 |hV, H |+π/4, Ri|2 h+π/4, R |V, Hi hV, H |+π/4, Ri h+π/4, R| (|V, Hi hV, H|) |+π/4, Ri h+π/4, R| (|V is s hV | ⊗ |Hii i hH|) |+π/4, Ri |s hV |+π/4is i hH |Rii |2 1 . = 4 w(Vs , Hi ) = = = = = Man kann für den Zwei-Photonen-Zustand natürlich auch die altenative Frage stellen, wie große die Wahrscheinlichkeit ist, bei einer Messung das “idler”Photon horizontal polarisiert vorzufinden, ohne überhaupt nach dem Polarisationszustand des Signal-Photons zu fragen (ohne diesen zu messen) w(Hi ) = h+π/4, R| (1s ⊗ |Hii i hH|) |+π/4, Ri = |i hR |Hii |2 s h+π/4 |+π/4is 1 = . 2 1 Im Gegensatz zu der Notation die wir zuvor häufig verwendet haben, kommt der Zustand im Symbol für die Wahrscheinlichkeit nicht vor. Die Wahrscheinlichkeit hängt aber selbstverständlich vom Zustand ab! 16.2. VERSCHRÄNKTE-ZUSTÄNDE 199 Eine weitere Frage die man stellen kann ist, wie groß ist die Wahrscheinlichkeit, dass das Signal-Photon vertikal polarisiert gemessen wird unter der Bedingung, dass das “idler”-Photon horizontal Polarisiert gemessen wird. Es handelt sich hierbei um eine bedingte Wahrscheinlichkeit. Die “Wahrscheinlichkeitslogik” sagt einem, dass die bedingte Wahrscheinlichkeit w(Vs | Hi ) durch w(Vs , Hi ) = w(Vs | Hi )w(Hi ) ⇒ w(Vs | Hi ) = w(Vs , Hi ) w(Hi ) von den bereits berechneten Wahrscheinlichkeiten festgelegt wird. Es gilt also im Beispiel w(Vs | Hi ) = 16.2 1/4 1 w(Vs , Hi ) = = . w(Hi ) 1/2 2 Verschränkte-Zustände Wir betrachten nun einen “downconversion”-Prozess, bei dem ein Photonen auf einen Doppelkristall trifft, wobei die beiden Kristallachsen um π/2 gegeneinander rotiert sind. Damit konvertiert das eine Kristall ein vertikal polarisiertes PumpPhoton in ein Paar von Signal- und “idler”-Photonen die jeweils horizontal polarisiert sind und das andere Kristall ein horizontal polarisiertes Pump-Photon in ein vertikal polarisiertes Paar. Wenn die Kristalle idealisiert unendlich dünn sind und das Pump-Photon eine +π/4-Polarisation hat, kann man keine Information darüber gewinnen, in welchem der beiden Kristalle das Photonen-Paar erzeugt wurde. Der Zustand ist daher durch + φ = √1 (|H, Hi + |V, V i) , 2 also eine Linearkombination, beschrieben.2 In Worten bedeutet das, dass das Photonen-Paar in beiden (Basis-)Zuständen “zur gleichen Zeit” ist, nicht, dass es entweder in dem einen oder dem anderen (Basis-)Zustand ist. Mathematisch gesprochen, ist dieses der Unterschied zwischen einer Linearkombination und einem sogenannten gemischten Zustand. In letzterem ist das Photonen-Paar mit einer klassischen Wahrscheinlichkeit zu 50% im Zustand |H, Hi und zu 50% in |V, V i. Sie werden das Konzept der gemischten Zustände und der zugehörigen Dichtematrix (dem statistischen Operator) im Kapitel über Quantenstatistik in der Vorlesung Theoretische Physik IV genauer kennenlernen. Wir betonen 2 Ob dieses Gedanken-Experiment jenseits des Limits verschwindender Dicke besonders geeignet ist zu illustrieren, wie ein Zwei-Photonen-System in einer entsprechende Linearkombination präpariert werden kann, möchte ich dahingestellt lassen. Wichtig für unseren Zweck ist nur, dass man durch geeignete Manipulationen solche Linearkombinationen experimentell “herstellen” kann. 200 KAPITEL 16. VERSCHRÄNKUNG UND LOKALER REALISMUS nocheinmal (zum Schluss der Vorlesung), dass die mathematische Formulierung deutlich präziser ist, als die (Alltags-)Sprache. Die (alltags-)sprachliche Formulierung quantenmechanischer Phänomene erscheint ja z.B. im Fall des DoppelspaltExperiments mit “Teilchen”, wo jedes, um die Interferenz zu erklären, sowohl durch den oberen, wie durch den unteren Spalt “gehen” muss, nahezu “absurd”. Der obige Zustand |φ+ i kann nicht als Produktzustand geschrieben werden. Damit macht es keinen Sinn mehr davon zu sprechen, dass das Signal- oder das “idler”-Photon für sich genommen in einem bestimmten Zustand sind. Man nennt solche Zustände verschränkt. Sie sind inhärent Zustände des Gesamtsystems. Wir haben ohne explizit darauf hinzuweisen bereits zuvor mit solchen Zuständen zu tun gehabt. Am Besten versteht man die Eigenschaften von |φ+ i in dem man sich Gedanken über die Messwahrscheinlichkeiten macht. Zunächst wollen wir die Wahrscheinlichkeit bestimmen, das Signal-Photon horizontal polarisiert vorzufinden w(Hs ) = φ+ (|His s hH| ⊗ 1i ) φ+ 1 1 = √ (hH, H| + hV, V |) (|His s hH| ⊗ 1i ) √ (|H, Hi + |V, V i) 2 2 1 (hH, H| + hV, V |) |H, Hi = 2 1 = . (16.1) 2 Im nächsten Schritt berechnen wir die (bedingte) Wahrscheinlickeit, dass SignalPhoton horizontal polarisiert vorzufinden, unter der Bedingung, dass das “idler”Photon ebenfalls diese Polarisation hat w(Hs | Hi ) = w(Hs , Hi ) . w(Hi ) Völlig analog zur Rechnung Gl. (16.1) gilt w(Hi ) = 1/2. Mit w(Hs , Hi ) = φ+ (|H, Hi hH, H|) φ+ 1 = 2 ergibt sich w(Hs | Hi ) = w(Hs , Hi ) 1/2 = =1. w(Hi ) 1/2 Die Ergebniss w(Hs ) = 1/2 und damit w(Vs ) = 1/2 sagt uns, dass die Messung der Polarisation des Signal-Photon vollständig “zufällige” Ergebnisse liefert: Bei einer Hälfte der Messungen wird man es horizontal Polarisiert vorfinden, bei der anderen vertikal. Wenn jedoch das “idler”-Photon horizontal gemessen wird, 16.2. VERSCHRÄNKTE-ZUSTÄNDE 201 dann wird in 100% der Fälle wegen w(Hs | Hi ) = 1 das Signal-Photon ebenfalls horizontal gemessen. Wir haben diese Art von “Zufälligkeit” und Korrelation in |φ+ i bisher nur bei der Messung von V - und H-Polarisation gezeigt. Sie ist aber auch bei anderen Polarisationsmessungen gegeben. Um sich davon zu überzeugen sollten Sie z.B. w(+π/4s ) = w(+π/4i ) = 1/2 und w(+π/4s | + π/4i ) = 1 in |φ+ i zeigen. Schon jetzt wollen wir festhalten, dass die klassische Physik die beobachtete starke Korrelation nicht erklären kann. Ein “scharfer Blick” auf den Zustand kann einen zu den obigen Wahrscheinlichkeiten führen, es ist aber ratsam, dieses explizit durch die hier angestellten Rechnungen zu bestätigen. Wir lernen aus diesen Rechnungen, dass die individuellen Polarisierungen vollständig zufällig sind, die Ergebnisse der Messungen aber vollständig korreliert sind. Keines der Photonen hat eine wohldefinierte Polarisation, wenn jedoch die Polarisation des einen Partners bekannt ist (gemessen wurde), ist die des anderen Photons eindeutig festgelegt. Wie wollen nun nocheinmal den Unterschied zwischen einer Linearkombination und einem gemischten Zustand, der Elemente klassischer, aus mangelnder Information resultierender, Wahrscheinlichkeit enthält beleuchten. Betrachten wir dazu die Situation, dass das Pump-Photon vor der “downconversion” an einem einfachen (!!) Kristall einen Polarisator durchläuft, der (klassisch) zufällig auf V oder H-Durchlass gestellt wird (z.B. durch Auswürfeln). Entsprechend ist das Paar (klassisch) zufällig in |H, Hi oder |V, V i. Die (klassische) Wahrscheinlichkeit, dass |H, Hi vorliegt, bezeichnen wir mit w (|H, Hi) und analog für |V, V i. Die (quantenmechanische) Wahrscheinlichkeit die Polarisation as und bi bei vorliegendem |H, Hi zu messen, bezeichnen wir mit w(as , bi | |H, Hi) (bedingt!!) und analog für |V, V i. Wir wollen nun zeigen, dass im gemischten Zustand mit w (|H, Hi) = 1/2 = w (|V, V i) die Korrelation anders als im verschränkten Zustand sind. Dazu berechnen wir zunächst w(+π/4s , +π/4i ) = w(+π/4s , +π/4i | |H, Hi)w (|H, Hi) +w(+π/4s , +π/4i | |V, V i)w (|V, V i) 1 hH, H| +π/4, +π/4i h+π/4, +π/4| H, Hi = 2 1 + hV, V | +π/4, +π/4i h+π/4, +π/4| V, V i 2 1 1 1 1 1 1 1 1 1 √ √ √ √ +√ √ √ √ = 2 2 2 2 2 2 2 2 2 1 = . 4 202 KAPITEL 16. VERSCHRÄNKUNG UND LOKALER REALISMUS Wir betrachten dann w(+π/4i ) = w(+π/4i | |H, Hi)w (|H, Hi) + w(+π/4i | |V, V i)w (|V, V i) 1 1 = ihH| +π/4ii i h+π/4| Hii + ihV | +π/4ii i h+π/4| V ii 2 2 1 1 1 1 1 √ √ +√ √ = 2 2 2 2 2 1 = . 2 Damit folgt w(+π/4s |+π/4i ) = 1/4 1 = 1/2 2 was offensichtlich verschieden ist vom Ergebnis für den verschränkten Zustand (wo die bedingte Wahrscheinlichkeit 1, d.h. die Korrelation “perfekt” ist!). Es ist wichtig festzuhalten, dass die bedingte Wahrscheinlichkeit w(Hs |Hi ) im gemischten Zustand 1 ist (rechnen Sie das nach!) und sich damit der verschränkte und der gemischte Zustand nicht bei jedem Typ von Messung unterscheiden lassen. Es gibt aber immer Messungen, bei denen der Unterschied offensichtlich wird. 16.3 Ein Test für den lokalen Realismus Wir betrachten einen experimentellen Aufbau ähnlich zu dem, den wir beschrieben habe um verschränkte Photonenpaare “zu erzeugen”. Die notwendigen Unterschiede zu diesem, werden wir weiter unten erwähnen. Die Signal-Photonen werden zu Alice gesandt, die “idler”-Photonen zu Bob. Alice und Bob sind räumlich weit voneinader getrennt und führen unabhängig voneinander (ohne miteinander zu kommunizieren) Messungen an ihren Photonen durch. Die Quelle der Photonen-Paare ist in der Mitte zwischen beiden, so dass die Photonen gleichzeitig bei Alice und Bob eintreffen. Alice Photonen gehen durch einen Polarisationsanalysator in Richtung ΘA . Sie findet ihr Photon mit Wahrscheinlichkeit w(ΘA ) paralllel zu ΘA polarisiert und mit Wahrscheinlichkeit w(Θ⊥ A ) senkrecht zu ΘA . Bob geht analog vor mit dem Winkel ΘB . Alice und Bob können ihre Polarisationsanalysatoren jeweils rotieren. Alice misst also entweder bezüglich ΘA1 oder ΘA2 wobei ΘA1 oder ΘA2 jeweils zufällig gewählt wird. Bob geht analog vor, wobei die Wahl der Winkel zwischen Alice und Bob nicht abgesprochen wird. Für jedes Photon notieren Alice und Bob die Ankunftzeit, den gewählten Winkel und die gemessene Polarisation. Nach dem Abschluss aller Messungen treffen sich Alice und Bob und vergleichen für jedes Photonen-Paar (eindeutig durch die Ankuftzeit zu identifizieren) die Ergebnisse. Dabei bestimmen sie Wahrscheinlichkeiten wie z.B. w(ΘA1 , ΘB2 ). Sie stellen folgendes fest: 16.3. EIN TEST FÜR DEN LOKALEN REALISMUS 203 1. Wenn Alice ΘA1 wählt und Bob ΘB1 , messen sie die Polarization in dieses Richtungen in 9% aller Fälle: w(ΘA1 , ΘB1 ) = 0.09. 2. In den Versuchen, in denen Alice ΘA1 wählt und Bob ΘB2 , misst Bob unter der Bedingung, dass Alice die Polarisation in Richtung ΘA1 misst, immer die Polarisation in Richtung ΘB2 : w(ΘB2 |ΘA1 ) = 1. 3. In den Versuchen, in denen Alice ΘA2 wählt und Bob ΘB1 , misst Alice unter der Bedingung, dass Bob die Polarisation in Richtung ΘB1 misst, immer die Polarisation in Richtung ΘA2 : w(ΘA2 |ΘB1 ) = 1. Neben den jetzt diskutierten drei Wahlen der Winkel, gibt es eine vierte. Wir wollen nun versuchen, aus den obigen drei Beobachtungen Rückschlüsse auf Ergebnisse bei der vierten Winkelwahl zu ziehen. Wir betrachten die Versuche aus Beobachtung 1. Was passiert, wenn Bob seine Meinung ändert und die Polarisation in Richtung ΘB2 misst? Da Alice ja die Polarization ΘA1 misst, sagt uns die Beobachtung 2., dass Bob immer die Polarisation ΘB2 vorfindet. Augfrund der Beobachtung 3. gilt eine analoge Überlegung, wenn Bob weiterhin in Richtung ΘB1 misst, aber Alice ihre Meinung ändert und den Polarisationsmesser auf ΘA2 stellt. Sie wird mit Wahrscheinlichkeit 1 die Polarisation in Richtung ΘA2 messen (und mit Wahrscheinlichkeit 0 in Richtung Θ⊥ A2 ). Was passiert nun, wenn beide ihre Meinung ändern und die Polarisatoren auf ΘA2 und ΘB2 drehen? In diesem Fall wird Alice ihr Photon in Richtung ΘA2 polarisiert messen und Bob seins in Richtung ΘB2 . Damit gilt w(ΘA2 , ΘB2 ) ≥ w(ΘA1 , ΘB1 ) = 0.09 . (16.2) Die Messung ergibt aber w(ΘA2 , ΘB2 ) = 0! Bevor wir uns über diesen Widerspruch wundern, müssen wir natürlich sicherstellen, dass es einen Zustand gibt, der die obigen Wahrscheinlichkeiten inklusive w(ΘA2 , ΘB2 ) = 0 liefert. Sie können √ √ nachrechnen, dass |ψi = 0.2 |H, Hi + 0.8 |V, V i diese liefert, falls ΘA1 = 19o , ΘA2 = −35o , ΘB1 = −19o und ΘB2 = 35o . Mit entsprechenden Modifikationen an der Photon-Paar-Quelle, läßt sich dieser Zustand tatsächlich realisieren. Was kann sonst nicht stimmen? Es sind zwei Annahmen in die obigen Überlegungen eingeflossen, die womöglich falsch sind. 1. Lokalität: Wir sind in unseren Überlegungen davon ausgegangen, dass eine Messung an einem Ort (bei Alice) diejenige am anderen (bei Bob) nicht beeinflussen kann. 2. Realität: Wir sind ebenfalls davon ausgegangen, dass die physikalisch messbaren Größen definierte Werte haben bevor sie überhaupt gemessen werden. In der Tat verletzt die Quantenmechanik diese beiden Annahmen.3 Aus Zeitgründen können wir nicht weiter auf diese Fragen eingehen. Ungleichungen von 3 Die geführte Diskussion zeigt natürlich nur, dass zumindest eine der Annahmen falsch sein muss. Es gibt andere Experimente, die dieses getrennt belegen. 204 KAPITEL 16. VERSCHRÄNKUNG UND LOKALER REALISMUS dem Typ Gl. (16.2) bezeichnet man als Bellsche Ungleichungen. Es wurden mehrere experimentelle Nachweise der Ungültigkeit von Ungleichungen dieses Typs erbracht.