Theoretische Physik für Studierende des Lehramts Teil A: Quantenmechanik Department Physik der Universität Hamburg Vorläufige und unvollständige Version, noch nicht auf Fehler korrigiert Die Vorlesungen Theoretische Physik A, B für Studierende des Lehramts haben zum Ziel, zukünftigen Physiklehrern/innen die Grundlagen der theoretischen Physik zu vermitteln und dabei besonders die Gebiete zu betonen, die für den Unterricht in der Oberstufe des Gymnasiums und in den Physikleistungskursen von besonderem Wert sind. Da die moderne Physik im Curriculum der Oberstufe eine herausragende Rolle spielt, sollten in der Theorieausbildung die Quantenmechanik und die Relativitätstheorie einen zentralen Platz einnehmen. Dazu kommt die Elektrodynamik, die die theoretische Grundlage elektrischer Maschinen sowie der Radiotechnik und Optik ist. Die Vorlesungen bauen auf dem Physik-Kurs des Grundstudiums auf. In Physik I und II werden die Mechanik, Wärmelehre, Elektrizität, Magnetismus und Optik behandelt. Physik III ist eine Einführung in die Quanten- und Atomphysik. Die Veranstaltung Theoretische Physik A hat eine gewisse überlappung mit der Physik III. Ihr Hauptziel ist eine systematische Darstellung der Quantentheorie auf der Basis der Schrödinger-Gleichung. Abstraktere Formulierungen der Quantenmechanik (z.B. Hilbertraum) werden nur kurz gestreift. In der Vorlesung Theoretische Physik B werden die wichtigen Erscheinungen und Begriffe von Elektrizität, Magnetismus wiederholt und auf eine gemeinsame theoretische Basis gestellt. Die Maxwellschen Gleichungen der Elektrodynamik spielen dabei eine zentrale Rolle. Es wird die enge Verknüpfung der elektromagnetischen Erscheinungen mit der Relativitätstheorie diskutiert. Die Skripten zur Theoretischen Physik A und B sind folgerdermaßen aufgebaut: in den Hauptkapiteln wird der für das Examen relevante Stoff in möglichst einfacher und klarer Form dargestellt. Die didaktischen Anmerkungen am Ende der Kapitel haben das Ziel, den zukünftigen Lehrern/innen Hilfen zu geben, wie sie die physikalischen Konzepte in der Schule vermitteln können. Mathematische Ergänzungen und kompliziertere theoretische Herleitungen sind in den Anhängen zu finden. Diese Anhänge sollen interessierten Studierenden helfen, die Theorie besser zu verstehen und Rechnungen selbst durchführen zu können. Das dort präsentierte Material gehört aber nicht zum Examensstoff. Die Erarbeitung der Skripten erfolgt im Rahmen einer Seniorprofessur der Wilhelm und Else Heraeus-Stiftung. Das Department Physik der Universität Hamburg und der federführende Autor Peter Schmüser danken der WE Heraeus-Stiftung sehr herzlich für die großzügige Förderung. Prof. Klaus Fredenhagen, Prof. Erich Lohrmann und Dr. Paul-Dieter Gall haben das Manuskript sorgfältig gelesen und viele hilfreiche Anmerkungen gemacht. Ihnen gebührt besonderer Dank. 1 Kapitel 1 Einleitung 1.1 Ein Jahrhundert Quantenphysik Zwischen dem Allerkleinsten und dem Allergrößten liegen ungefähr sechzig Größenordnungen, und überall wird die Quantentheorie gebraucht, um die Phänomene zu beschreiben, von den geheimnisvollen Vibrationen der superstrings oder supermembranes, die die ultimativen Konstituenten der Natur sein mögen, bis hin zur kosmischen Mikrowellenstrahlung vom Rand des Universums1 . Addiert man zwanzig Nullen zur Dimension der superstrings, kommt man in den Bereich der Atomkerne, der Quelle der Radioaktivität und Kernenergie. Fünf Größenordnungen mehr, und man ist bei Atomen und einfachen Molekülen angelangt. Zehn weitere Größenordnungen bringen uns zu der Skala von Metern mit Objekten und Lebewesen, die aus einer riesigen Zahl von Atomen aufgebaut sind. Von unserer Skala zu einer astronomischen Skala, der Größe der Sterne, wo die Gravitation dominant wird, sind es weitere 7-9 Größenordnungen. Und schließlich braucht man noch 18 Größenordnungen, um zum Horizont des heute bekannten Universums zu kommen. Die Physik muss entlang dieser riesigen Spanne Erklärungen für zahllose verschiedene Phänomene finden. In den meisten Fällen ist zumindest teilweise die Quantentheorie dafür nötig, deren Erfolg überwältigend gewesen ist. Als Beispiel kann die Quantenelektrodynamik (QED) dienen, die Theorie der Wechselwirkungen zwischen Elektronen und Photonen, die Vorhersagen von außerordentlicher Präzision erlaubt. Das in einer Teilchenfalle gemessene magnetische Moment des Elektrons beträgt µe = 1.00115965218073 µB (µB ist das Bohrsche Magneton), und dieser Wert stimmt innerhalb von 4 ppb (parts per billion, 1 ppb=10−9 ) mit der Theorie überein. Die QED ist die genaueste heute bekannte physikalische Theorie. Den Beginn des Quantenzeitalters markieren die Strahlungsformel von Max Planck (1900), die Erklärung des photoelektrischen Effekts durch Albert Einstein (1905) und das Atommodell von Niels Bohr (1913). In den Jahren um 1925 wurde dann die formale Quantentheorie entwickelt durch Werner Heisenberg, Erwin Schrödinger, Max Born, Wolfgang Pauli, Pascual Jordan, Paul Dirac und viele andere, wobei auch hier Niels Bohr entscheidende Anteile hatte. In jüngeren Jahren erzielte die Quantentheorie einen weiteren Durchbruch mit der Vereinheitlichung der elektromagnetischen, schwachen und starken Wechselwirkungen im Standard-Modell der elektroschwachen Wechselwirkung und der Quantenchromodynamik. Die Versuche, auch die vierte fundamentale Wechselwirkung, die Gravitation, mit einzubeziehen, sind allerdings noch nicht erfolgreich gewesen. 1 In Kap. 1.1 folgen wir der Einleitung des hervorragend geschriebenen, aber anspruchsvollen Buches Exploring the Quantum von Serge Haroche und Jean-Michel Raimond (Oxford Graduate Texts 2008), in dem ein modernes Teilgebiet der Quantentheorie, die Cavity Quantum Electrodynamics, behandelt wird. 2 Die Quantentheorie ist nicht nur aus wissenschaftlicher Hinsicht von fundamentaler Bedeutung, sie spielt auch im praktischen Leben eine herausragende Rolle. Wer auf dem Rechner im Internet surft, mit seinem Handy telefoniert, mit einem modernen Auto fährt, Musik von einer CD hört oder mit seiner Digitalkamera Aufnahmen macht, nutzt dabei (meist unbewusst) Quantentechnologien. Ein Physiker oder Ingenieur, der im Bereich der Elektronik oder Optronik neue Erfindungen machen möchte, kommt ohne Quantentheorie nicht weiter. Aus diesem Grunde halten wir es für unerlässlich, dass zukünftigen Physiklehrern/innen gründliche Kenntnisse in der Quantentheorie vermittelt werden und dass die Quantenphysik auch in der Schule einen gebührenden Raum einnimmt. 1.1.1 Der Transistor und die Computer-Revolution Die ersten elektronischen Rechner wurden während des Zweiten Weltkriegs gebaut und bestanden aus einer Unzahl von Elektronenröhren und Magnetkernspeichern. Sie waren sehr groß, wartungsanfällig und hatten einen hohen Energieverbrauch. Verglichen mit einem modernen Notebook war ihre Leistungsfähigkeit jedoch sehr gering. Erst die Erfindung des Transistors Ende 1950 und die Integration von einer riesigen Zahl dieser Transistoren auf einem Chip von der Größe einer Briefmarke ermöglichte die rasante Entwicklung der modernen Computertechnologie. Der Transistor ist ein typisch quantentheoretisches Bauelement und nicht auf der Basis der klassischen Physik zu verstehen. Die moderne Elektronik und die Opto-Elektronik sind weitgehend angewandte Quantentheorie. 1.1.2 Der Laser Das Licht einer Glühlampe ist nicht monochromatisch, sondern überdeckt ein breites Spektrum, vom kurzwelligen blauen Licht bis hin zum langwelligen infraroten Licht. Außerdem wird das Licht in alle Richtungen emittiert. Spektroskopie mit solchen Lichtquellen ist mühsam, sie erfordert die Selektion eines schmalen Bandes mithilfe eines Monochromators, wobei der größte Teil der Intensität verloren geht. Interferenzexperimente sind ebenfalls schwierig wegen der geringen spektralen Intensität und der sehr kurzen Kohärenzlänge. Die Erfindung des Lasers hat dies in dramatischer Weise geändert. Laser erzeugen kohärente monochromatische Strahlung, die scharf gebündelt ist und eine hohe Leuchtdichte aufweist. Viele der früher aufwändigen und lichtschwachen Interferenzexperimente lassen sich heute in trivialer Weise mit Lasern vorführen. Das ist für den Physikunterricht sehr hilfreich. Laser haben darüber hinaus eine Unzahl von Experimenten ermöglicht, die mit konventionellen Lichtquellen undenkbar wären. Man kann mit Recht sagen, dass mit dem Laser ein Quantensprung in der Optik eingeleitet wurde. Gleichzeitig ist der Laser ein zutiefst quantenphysikalisches Gerät; er basiert letztendlich auf der Symmetrie der Wellenfunktion für Teilchen mit Spin 1, die zur Folge hat, dass alle Photonen im Laser den gleichen Quantenzustand einnehmen müssen und daher die gleiche Wellenlänge, Phase, Richtung und Polarisation besitzen. Das Wort Laser ist eine Abkürzung für Light Amplification by Stimulated Emission of Radiation. Der Begriff “stimulierte Emission” wurde von Albert Einstein im Jahr 1917 geprägt, beim Anbruch der Quantenära (s. Kap. 8.38), doch erst 40 Jahre später wurden die ersten praktischen Geräte gebaut. Heute gibt es eine unglaubliche Fülle von Anwendungen in Wissenschaft, Medizin und Technik. Laserstrahlen erlauben hochauflösende Spektroskopie von Atomen und Molekülen, man kann mit ihnen große Datenmengen durch Glasfibern übertragen oder auf Compact Disks speichern, Laserdrucker erzeugen Farbbilder hoher Qualität, Laserscanner werden an den Kassen eines Supermarkts verwendet, feine Laserstrahlen werden bei Augenoperationen eingesetzt, hochintensive Laserstrahlen benutzt man zum Schweissen und Schneiden 3 von Metallplatten. 1.1.3 Kernspin-Tomografie Die magnetische Kernresonanz (Nuclear Magnetic Resonance NMR) ist eine Quantentechnologie, die eine große Rolle in der wissenschaftlichen Forschung und der medizinischen Diagnose spielt. Protonen und Neutronen besitzen magnetische Dipolmomente, die an den Spin gekoppelt sind und deren Existenz und Größe sich aus der relativistischen Quantentheorie in Kombination mit dem Quarkmodell ergeben. In einem Magnetfeld führen die Momente eine Präzessionsbewegung durch, deren Frequenz, “Lamorfrequenz” genannt, proportional zum Magnetfeld ist. In die Larmorfrequenz geht aber nicht nur das von außen angelegte Feld ein, sondern auch innere Magnetfelder aufgrund der chemischen Bindungen. Man kann daher in Wasser gebundene Protonen von denen in Fett oder Eiweiss unterscheiden. Indem man mit Feldgradienten arbeitet und auch noch die sog. Relaxationszeiten in gepulsten Feldern ausnutzt, lässt sich die räumliche Verteilung von Wasser, Fett oder Eiweiss in biologischem Gewebe ortsaufgelöst ermitteln. Die Kernspin-Tomografie hat im Vergleich zu Röntgenaufnahmen den großen Vorteil, dass Knochen kaum abschatten, weil sie keinen Wasserstoff, sondern nur schwere Kerne mit anderen Larmorfrequenzen enthalten. Das ermöglicht detaillierte Bilder des Gehirns ohne Beeinträchtigung durch den Schädelknochen. Die hohen Magnetfelder in Kernspin-Tomografen werden mit supraleitenden Spulen erzeugt. Hier kommt die Quantenphysik ein zweites Mal zum Tragen. Die Supraleitung ist nicht im Rahmen der klassischen Elektrodynamik, sondern nur mithilfe der Quantentheorie zu verstehen; allerdings braucht man eine recht komplizierte Variante der Quantentheorie. Erst 30 Jahre nach Aufstellung der Schrödingergleichung gelang es Bardeen, Cooper und Schrieffer, die mikroskopische Theorie der Supraleitung (die BCS-Theorie) zu formulieren. 1.1.4 Die Atomuhr und die Messung der Zeit Die ultrapräzise Zeitmessung ist eine weitere Illustration für die Bedeutung von Quantenprozessen in Wissenschaft und Gesellschaft. Atome emitteren oder absorbieren ihre Strahlung bei wohl-definierten und unveränderlichen Frequenzen, die charakteristisch für jedes Element sind. Dies hat Physiker veranlasst, Zeitmessungen nicht länger an die störungsanfälligen Schwingungen von Pendeln zu koppeln, sondern an die unbeeinflussbaren atomaren Frequenzen. In einer Atomuhr koppelt man eine Radioquelle an den Hyperfeinübergang von Cäsium-Atomen, die in einem Atomstrahl fliegen. Die atomare Resonanz wird mit interferometrischen Methoden beobachtet. Kürzlich sind die thermischen Atomstrahlen durch Laser-gekühlte Strahlen ersetzt worden. Die Atomuhr erreicht damit eine Ganggenauigkeit von 0.3 Sekunden in 1 Million Jahren. Die außerordentliche Präzision der Atomuhren ist für das Globale Positionierungs-System GPS von entscheidender Bedeutung. 1.2 Teilchen und Wellen 1.2.1 Das Doppelspaltexperiment Die Quantentheorie beschreibt das Verhalten von Teilchen und Licht auf einer atomaren Größenskala. Dabei treten Phänomene auf, die unserer täglichen Anschauung widersprechen: Lichtwellen verhalten sich so, als ob sie aus Teilchen aufgebaut seien, und Teilchen zeigen Welleneigenschaften. Dies Grundprinzip der Quantenphysik soll an einem Experiment erläutert werden, für das es im Rahmen der klassischen Physik keine befriedigende Erklärung gibt, es ist das 4 Doppelspaltexperiment. Richard Feynman sagt in seinen berühmten Vorlesungen über Physik, dass im Doppelspaltexperiment das eigentliche Geheimnis der Quantentheorie liege. In den letzten Jahrzehnten hat sich durch enorme Fortschritte in der Experimentiertechnik herausgestellt, dass die Quantenphysik noch eine weitere verstörende Eigenheit besitzt. Die Beobachtung, dass eine Wellenfunktion über viele Kilometer ausgedehnt sein kann, strapaziert unser Vorstellungsvermögen in noch stärkerem Maße als die Teilchen-Welle-Komplementarität. Die nichtlokale Natur der Quantentheorie ist Thematik unseres letzten Kapitels. Das Doppelspaltexperiment mit Kugeln und Wellen a) Kugeln werden auf eine Wand mit zwei Spalten oder Löchern geschossen. Sie verlassen die Quelle mit einer breiten Winkelverteilung und werden auch noch an den Rändern der Spalte gestreut. Daher beobachtet man auf einem Auffängerschirm eine ausgedehnte Verteilung. Mit P (x) bezeichnen wir die Wahrscheinlichkeit (probability), eine Kugel im Abstand x vom Zentrum des Schirms zu finden. Wenn nur Spalt 1 offen ist, gilt P (x) = P1 (x), wenn nur Spalt 2 offen ist, ergibt sich P (x) = P2 (x). Öffnet man beide Spalte, so addieren sich die Wahrscheinlichkeiten, und man erhält eine verbreiterte, aber strukturlose Verteilung, die in Abb. 1.1a dargestellt ist. P12 (x) = P1 (x) + P2 (x) (1.1) Abbildung 1.1: Schema des Doppelspaltexperiments (a) mit Kugeln, (b) mit Wellen. Jede Kugel kommt als untrennbare Einheit am Schirm an und ergibt nur einen einzelnen Treffer bei einem bestimmten x-Wert. Die gesamte Wahrscheinlichkeitsverteilung baut sich erst allmählich durch Aufsummation über viele Kugeln auf. b) Wasser- oder Lichtwellen aus einer Quelle (periodisch bewegter Tupfer in der Wellenwanne oder Laser) treffen auf die Wand. Jeder Spalt wird Zentrum einer auslaufenden Kreiswelle. Die 5 Intensität I(x) auf dem Schirm ist durch das Absolutquadrat der Amplitude der Welle gegeben. Wenn nur ein Spalt geöffnet ist, ergeben sich ähnliche Verteilungen wie oben (wir ignorieren hier die Beugungseffekte am Einzelspalt): I1 (x) = |A1 (x)|2 nur Spalt 1 offen : (1.2) 2 I2 (x) = |A2 (x)| nur Spalt 2 offen : Sind aber beide Spalte geöffnet, so erhält man etwas ganz Neues: Es bildet sich ein Interferenzmuster mit Auslöschungen und Verstärkungen (Abb. 1.1b). I(x) = |A1 (x) + A2 (x)|2 = I1 (x) + I2 (x) + 2 p I1 (x)I2 (x) cos[δ(x)] (1.3) Der wichtigste Unterschied zum Kugelexperiment ist, dass nicht Wahrscheinlichkeiten addiert werden, sondern die Amplituden unter Berücksichtigung der Phasendifferenzen δ(x). Der zweite wichtige Unterschied ist die Art, wie die Verteilung entsteht. Die Kugeln treffen als lokalisierte Klumpen (“Quanten”) auf den Schirm, Kugel 1 ergibt einen Treffer am Ort x1 , Kugel 2 am Ort x2 etc. Erst nach dem Auftreffen sehr vieler Kugeln kann man die Verteilung P (x) erkennen. Ganz anders ist dies bei einer klassischen Welle: die gesamte Verteilung ist “sofort” da, sie wächst nur in ihrer Stärke im Laufe der Belichtungszeit an. Wir werden sehen, dass diese klare Fallunterscheidung im atomaren Bereich nicht möglich ist, sondern dass beide Aspekte eine Rolle spielen: Interferenz, d.h. Addition von Amplituden, und der sukzessive Aufbau der Verteilung durch “Quanten”. Das Doppelspaltexperiment mit Elektronen Doppelspaltexperimente mit Elektronen sind heute keine “Gedankenexperimente” mehr, sondern können tatsächlich durchgeführt werden, wobei allerdings sehr präzise Aufbauten und großes experimentelles Geschick erforderlich sind. Der Nachweis der Elektronen kann mit einem Film oder einem CCD-Chip (charge coupled device) erfolgen. Was beobachtet man, wenn viele monoenergetische Elektronen die Doppelspaltapparatur durchlaufen? Überraschenderweise findet man ein Interferenzbild mit hellen und dunklen Streifen genau wie beim Doppelspaltexperiment mit Licht (“hell” bedeutet, dass viele Elektronen auftreffen). Es folgt daraus: Elektronen haben Welleneigenschaften. Doppelspaltinterferenzen mit Licht und Elektronen werden in Abb. 1.2 verglichen. Abbildung 1.2: Doppelspalt-Interferenzen mit Licht (links) und Elektronen (rechts). 6 Die Wellenfunktion Die Welleneigenschaften des Elektrons beschreiben wir mit Hilfe einer Wellenfunktion ψ(x). Dies ist eine komplexwertige Funktion, die in etwa der Amplitude einer klassischen Welle entspricht (komplexe Zahlen werden in Anhang A erläutert). Ihr Absolutquadrat |ψ(x)|2 = ψ(x)ψ ? (x) ist aber keineswegs identisch mit der beobachteten Intensitätsverteilung. Das ist schon aus dem Grund nicht möglich, weil Interferenzen auch dann auftreten, wenn sich immer nur ein Elektron zur Zeit im Apparat befindet. Das bedeutet, dass jedes Elektron mit sich selbst interferiert und nicht mit anderen Elektronen. Was ist die Bedeutung der Wellenfunktion in der Quantenmechanik? Wir folgen hier der allgemein akzeptierten Wahrscheinlichkeitsinterpretation, die von Max Born eingeführt und insbesondere von Niels Bohr mit großer Überzeugung vertreten wurde (man spricht daher auch von der Kopenhagener Deutung der Quantentheorie). Die Wahrscheinlichkeit, das Elektron zwischen x und x + dx auf dem Schirm zu finden, ist P (x)dx = |ψ(x)|2 dx (1.4) Da das Elektron an irgend einer Stelle auftreffen wird, muss die Integration über den gesamten Bereich den Wert 1 ergeben. Die Wellenfunktion ist in der Kopenhagener Deutung eine Wahrscheinlichkeitsamplitude. Wie wird das Interferenzmuster aufgebaut? Wir wählen den Teilchenstrom aus der Quelle so niedrig, dass sich zu jedem Zeitpunkt maximal nur ein Elektron in der Apparatur befindet. Das Auftreffen des Elektrons auf dem Schirm werde - wie beim altmodischen Geigerzähler - durch einen “Klick” in einem Lautsprecher angezeigt. Es gibt dann zwei wichtige Befunde: • Jedes Elektron macht den gleichen Klick, es gibt keine halben oder drittel Klicks. • Ein einzelnes Elektron erzeugt genau einen Punkt auf dem Schirm. Das Interferenzmuster wird erst mit sehr vielen Elektronen sichtbar. Das bedeutet: wie die Kugeln treffen die Elektronen als ganze, unteilbare Quanten auf den Schirm und bauen die Verteilung sukzessive auf. Schematisch ist dieser Vorgang in Abb. 1.3a dargestellt, während Abb. 1.3b ein experimenteller Beleg dafür ist, dass es in der Tat so abläuft. 1.2.2 Wellen- und Quantennatur des Lichts Wie steht es nun mit Licht? Auch hier kann man bei niedriger Beleuchtungsstärke die Granularität der Strahlung erkennen. Eine schöne Demonstration dafür ist die Abb. 1.4, in der Fotos einer Frau bei sehr unterschiedlichen Belichtungsstärken gezeigt werden. Wenn nur wenige Photonen die lichtempfindliche Schicht treffen, sieht man ein unregelmäßiges Muster heller Punkte auf dunklem Hintergrund. Mit wachsender Photonenzahl arbeitet sich das Bild allmählich heraus, aber man braucht viele Millionen Lichtquanten, um es gut erkennen zu können. Die Sequenz von Fotos ist ein Beleg für beide Aspekte des Lichts: Die Wellennatur zeigt sich darin, dass mit Hilfe von Glaslinsen eine Abbildung gemacht werden kann, die Quantennatur wird durch die granulare Struktur in den schwach belichteten Bildern offensichtlich. Licht ist also beides: Welle und Teilchen. Die duale Natur des Lichts wird beim photoelektrischen Effekt deutlich, aber noch besser beim Comptoneffekt. In Abb. 1.4 werden Daten zur Streuung von Röntgenstrahlung an Graphit 7 Abbildung 1.3: Entstehung des Interferenzmusters beim Doppelspaltexperiment mit Elektronen. (a) Schematische Darstellung: jedes Elektron macht genau einen “Eintrag” im Interferenzdiagramm, wobei die Wahrscheinlichkeit durch das Absolutquadrat der Wellenfunktion gegeben ist. (b) Beobachtung von Elektroneninterferenzen mit wenigen und mit vielen Elektronen. (Aus P. Tipler, Physik, Spektrum-Verlag 1994). gezeigt. Die Wellenlänge der einlaufenden Strahlung beträgt 71 pm=71·10−12 m, die der um 90◦ gestreuten Strahlung ist 73,4 pm. Dies kann man quantitativ erklären, wenn man den Vorgang als Streuprozess eines Lichtquants an einem lose gebundenen atomaren Elektron deutet. Bei dieser Streuung überträgt das Photon Energie auf das Elektron. Nach dem Stoss ist daher sein Impuls kleiner und die Wellenlänge grösser. Als Funktion des Streuwinkels ist sie gegeben durch die Comptonsche Streuformel 2π~ λ0 = λ + (1 − cos θ) , (1.5) me c die in Anhang B hergeleitet wird. In der klassischen Elektrodynamik hingegen würde das atomare Elektron eine erzwungene Schwingung im Feld der elektromagnetischen Welle ausführen und Strahlung mit genau der Frequenz und Wellenlänge dieser Welle emittieren. Mit anderen Worten: die um 90◦ gestreute Strahlung müsste ebenfalls λ = 71 pm haben. 1.2.3 Durch welchen Spalt fliegt das Elektron? Die Elektron kommen am Detektor (fotografische Schicht oder CCD-Chip) als praktisch punktförmige Teilchen an. Demnach erscheint es vernünftig, sie generell als punktförmig anzusehen und folgende Behauptung aufzustellen: Jedes Elektron fliegt entweder durch Spalt 1 oder durch Spalt 2, aber nicht gleichzeitig durch beide Spalte. 8 Abbildung 1.4: Experimentelle Beweise für die duale Natur des sichtbaren Lichts und der Röntgenstrahlung. Links: Fotografie als Quantenprozess. Die Aufnahmen eines Frauenkopfes wurden mit sehr unterschiedlichen Belichtungszeiten gemacht, zwischen 3000 und 30.000.000 Photonen. Die granulare Natur des Lichtes ist bei schwach belichteten Bildern deutlich zu erkennen. (Aus T. Hey, P. Walters, Das Quantenuniversum, Spektrum-Verlag 1998). Rechts: Streuung von Röntgenstrahlung an Graphit. Die Wellennatur der Strahlung wird zweimal ausgenutzt: mit Hilfe von Bragg-Reflektion an einem Kristallgitter wird eine bestimmte Wellenlänge der einfallenden Strahlung selektiert (hier λ = 71 pm), und die Wellenlänge der gestreuten Strahlung wird wiederum über Bragg-Reflektion gemessen. Die Quantennatur der Strahlung ist nötig, um den Prozess mathematisch zu beschreiben, siehe Text. Anmerkung: bei großen Streuwinkeln beobachtet man zwei Intensitätsmaxima. Das Maximum bei der unverschobenen Wellenlänge von 71 pm ist auf Comptonstreuung am gesamten Atom zurückzuführen. Diese einleuchtende Behauptung erweist sich als nicht haltbar. Sobald man sich ein Experiment ausdenkt, mit dem geprüft werden kann, ob ein Elektron durch Spalt 1 oder Spalt 2 fliegt, verschwindet das Interferenzmuster. Eine wichtige Konsequenz dieser Erkenntnis ist: Es ist nicht sinnvoll, von einer Bahnkurve des Elektrons in atomaren Dimensionen zu sprechen. Die begrifflichen Schwierigkeiten des Teichen-Welle-Dualismus werden in Abb. 1.5 veranschaulicht. 9 Abbildung 1.5: Das Doppelspaltexperiment als Cartoon (Grafik von R.J. Buchelt). (Aus H. Rauch, Physik in unserer Zeit, 29. Jahrg. 1998, Nr. 2). Werner Heisenberg hat ein Gedankenexperiment konstruiert, in dem festgestellt werden könnte, durch welchen Spalt das Elektron geht. Die Idee ist, kurzwelliges Licht zur Beobachtung zu benutzen. Der Haken ist jedoch, dass das Elektron bei der Streuung des Photons eine Richtungsänderung erleidet, die das Interferenzmuster stört, wobei die Stärke der Störung von der Wellenlänge des Photons abhängt. (a) Bei sehr kleiner Wellenlänge λ d (d ist der Spaltabstand) kann man eindeutig den richtigen Spalt erkennen, und es ergibt sich eine Addition der Wahrscheinlichkeiten ohne Interferenz P12 (x) = P1 (x) + P2 (x) = |ψ1 (x)|2 + |ψ2 (x)|2 (1.6) (b) Bei großer Wellenlänge (λ d) kann man die beiden Spalte nicht mehr optisch auflösen und beobachtet das voll ausgeprägte Interferenzmuster P12 (x) = |ψ1 (x) + ψ2 (x)|2 (1.7) Ein interessanter neuer Gesichtspunkt ist nun aber (und dies wird schon in den FeynmanVorlesungen diskutiert), dass es einen gleitenden Übergang zwischen diesen beiden Extremen gibt. Wenn nämlich die Wellenlänge des Photons und der Spaltabstand etwa gleich groß sind, kann man nur ungefähre Aussagen machen, wie dies auch in der Fuzzy-Logik der Fall ist. Nehmen wir an, die Wahrscheinlichkeit für die richtige Zuordnung des Spaltes sei w, die für die falsche Zuordnung (1 − w), so ergibt sich eine Verteilung der Form (siehe Feynman, Band 3) √ 2 √ 2 √ √ P12 (x) = w · ψ1 (x) + 1 − w · ψ2 (x) + w · ψ2 (x) + 1 − w · ψ1 (x) (1.8) und damit ein Interferenzmuster mit reduziertem Kontrast. Für w = 1 tritt der obige Fall (a) ein, für w = 0.5 der Fall (b). Dieser Übergangsbereich zwischen der makroskopischen Physik (gar keine Interferenz bei Teilchen) und der mikroskopischen Physik (voll ausgeprägte Teilcheninterferenz) war den Gründungsvätern der Quantentheorie nicht bekannt. Hier liegt das Gebiet der heute viel untersuchten mesoskopischen Physik. 10 Der Übergangsbereich ist in einem Experiment2 von S. Haroche und anderen erforscht worden, das wir aus Platzgründen nur sehr schematisch beschreiben können (siehe Abb. 1.6). Die Teilchen sind hier Rubidium-Atome in einem hochangeregten Zustand, die Hauptquantenzahl beträgt n = 51 (man nennt diese hochangeregten Atome Rydberg-Atome). Diese Atome durchlaufen zwei hintereinander angeordnete Hochfrequenz-Resonatoren R1 und R2 , in denen die Atome durch Einstrahlung einer Frequenz von f0 = 51.099 GHz vom Zustand (n = 51) in den Zustand (n = 50) überführt werden können. Am Detektor wird die Rate der Atome im Zustand (n = 50) gemessen. Dies ist eine moderne Variante des Doppelspaltexperiments, denn man kann nicht entscheiden, ob der Übergang (n = 51) → (n = 50) in R1 oder R2 erfolgt. Daher sind auch die typischen Interferenzen messbar, wenn man die eingestrahlte Hochfrequenz f ein wenig um f0 moduliert. Das Besondere an dem Aufbau ist nun ein supraleitender Mikrowellenresonator C zwischen R1 und R2 , der als Messinstrument wirkt und die Rydberg-Atome mit (n = 50) von denen mit (n = 51) unterscheiden kann. Die Rydberg-Atome sind riesig verglichen mit Atomen im Grundzustand (der Radius der n-ten Bohr’schen Bahn ist rn = n2 r1 ≈ 125 nm für n = 50) und besitzen ein sehr großes Dipolmoment. Schon ein einzelnes Rydberg-Atom kann den supraleitenden Mikrowellenresonator verstimmen und die Phase des Hochfrequenzwelle verschieben. Die Frequenz des Resonators fC = f0 + ∆f wird so eingestellt, dass die Phase ϕ der Mikrowellenschwingung in C durch die hochangeregten Rb-Atome um +δϕ für die (n = 51)-Atome und um −δϕ für die (n = 50)-Atome verschoben wird (siehe Abb. 1.6.) Der Grad der Verschiebung kann variiert werden, indem man ∆f verändert. Damit erhält man ein einstellbares Messgerät zur mehr oder weniger deutlichen Unterscheidung der Zustände (n = 51) und (n = 50). Übertragen auf unser Doppelspaltexperiment heißt das: Man kann die Wahrscheinlichkeit w in Gleichung (1.8) kontinuierlich zwischen w = 0.5 (keine Unterscheidungsmöglichkeit der beiden Spalte) und w = 1 (genaue Kenntnis des richtigen Spalts) variieren. Das Ergebnis des Haroche-Experiments ist in Abb. 1.7 gezeigt. Man kann sehr deutlich die Veränderungen des Kontrasts im Interferenzmuster erkennen: in der Tat findet man maximalen Kontrast für w = 0.5 (keine Entscheidungsmöglichkeit), verminderten Kontrast für 0.5 < w < 1 und Verschwinden des Musters für w = 1 (genaue Kenntnis des Spalts). Ein hochinteressanter Aspekt dieses Experiments ist, dass es gar nicht darauf ankommt, die Phasenverschiebung im Mikrowellenresonator tatsächlich zu messen. Allein die Tatsache, dass dies im Prinzip möglich wäre, reicht aus, das Interferenzmuster zu beeinflussen. 1.3 Interferenzexperimente mit schweren Teilchen Mit Neutronen sind viele verschiedene Interferenzexperimente durchgeführt worden. Eine schöne Übersicht findet man in dem Artikel von Helmut Rauch, Neutronen-Interferometrie: Schlüssel zur Quantenmechanik, Physik in unserer Zeit, 29. Jahrg. 1998, Nr. 2. Zur Beobachtung von Neutronen-Interferenzen wurde aus einem Silizium-Einkristall ein sog. PerfektkristallInterferometer hergestellt, siehe Abb. 1.8. Es funktioniert ähnlich wie ein Michelson-Interferometer in der Optik. Bragg-Reflektion wird benutzt, um die Teilchenwelle in zwei Teilwellen aufzuspalten, die auf zwei getrennten Pfaden durch das Interferometer geführt und wieder rekombiniert werden. Bringt man in einen Strahlengang eine dünne Aluminiumplatte, so wirkt diese ähnlich wie ein Glasplatte im Michelson-Interferometer. Die Neutronen haben eine andere Wellenlänge im Aluminium als in Luft, und daher ergibt sich ein Interferenzmuster, bei dem die Intensität periodisch von der Dicke der Alu-Platte abhängt (Abb. 1.8). In diesem Experiment entstehen die Neutronen durch Kernspaltung in einem Reaktor. Die Strahlintensität ist 2 Physical Review Letters 77, 4887 (1996). 11 Abbildung 1.6: (a) Prinzipskizze des Aufbaus von S. Haroche und anderen zur Untersuchung des Grenzbereichs zwischen der Mikrowelt mit voll ausgeprägten Teilcheninterferenzen und der Makrowelt, in der es keine Teilcheninterferenzen gibt ( Erläuterungen dazu im Text). (b) Phasenverschiebungen ±δϕ im Mikrowellenresonator C durch die Rydberg-Atome mit (n = 51) oder (n = 50). so niedrig, dass sich immer nur ein Neutron zur Zeit in der Apparatur befindet und das nachfolgende Neutron noch gar nicht entstanden ist. Wie bei den Elektronen beobachten wir also die Interferenz der Teilchen mit sich selbst und nicht mit anderen Teilchen. Auch viel schwerere Systeme wie die C60-Fullerene sind interferenzfähig. Messungen werden in Abb. 1.9 gezeigt. 1.4 Bose-Einstein-Kondensation und kohärente Materiewellen Mit dem Laser lassen sich Interferenzen sehr einfach demonstrieren. Es handelt sich dabei um die Überlagerung von makroskopischen Wellen, bestehend aus Millionen von Photonen, die alle den gleichen Quantenzustand einnehmen und kohärent sind. Im Bereich der Teilcheninterferenzen ist dies bis vor kurzem nicht möglich gewesen. Wie wir oben gesehen haben, sind die Elektroneninterferenzen an Doppelspalten, aber auch die Neutroneninterferenzen in Kristallen grundsätzlich als Interferenz jedes einzelnen Teilchens mit sich selber zu deuten. Kohärenz zwischen verschiedenen Elektronen kann man aufgrund des Pauli-Ausschließungsprinzips auch nicht erwarten. Anders kann dies bei Atomen mit ganzzahligem Gesamtdrehimpuls sein, die Bose-Teilchen sind und sehr wohl den gleichen Quantenzustand einnehmen dürfen und dies bei sehr tiefen Temperaturen auch bevorzugt tun. Seit langer Zeit ist ein solches System bekannt: Es ist die supraflüssige Phase des Heliums, die bei Temperaturen unter 2.17 K auftritt. In den letzen Jahren ist es gelungen, in Teilchenfallen bei sehr tiefen Temperaturen sehr viele Alkali-Atome in einem einzigen Quantenzustand zu kondensieren. Diese Bose-Einstein-Kondensate haben ungewöhnliche Eigenschaften. Wolfgang Ketterle und Mitarbeitern gelang es 1996, ein solches Kondensat in zwei Teile aufzuteilen und die beiden Atomwolken zur Überlappung zu bringen (Abb. 1.10). Dabei sind erstmals makroskopische Materiewellen-Interferenzen beobachtet worden. 12 Neutroneninterferornetrie 57 ksam zu machen. ie sich unbeobachin einem Superpotze gleichzeitig leund erst durch das Kiste - entscheidet lebendig ist. Aber an sich unteilbares wei weit voneinankann - wie in Absich an zwei raumfinden kann, geht erstandnis deutlich t es diese Phanon sehen werden. absurden" Vorstelen in den letzten Abbildung 1.7: Die beobachteten Interferenzmuster für verschieden präzise Identifikation des eutronen durchgeHochfrequenz-Resonators R1 oder R2 , in dem der Übergang (n = 51) → (n = 50) erfolgt. Bild I: lsohne als massive gar keine Identifikation ergibt maximalen Kontrast; Bilder II und III: teilweise Identifikation ergibt In. Sic haben eine terferenzen reduziertem Kontrast; Bild IV: 100% sichere Identifikation lässt die Interferenzen Abb. 2.mit Perfektkristall-Neutroneninterferometer, mit dem an sich unteilbare Neutronen völlig nd besitzen auch verschwinden. aften, die sic als auf getrennten Wegen durch das Interferometer gefuhrt werden. ei3lich besteht die Materie zu fast Neutroneninterferornetrie 57 n den Atomkernen Die Intensitat hinter dem Interferometer setzt nspaltung oder an- sich aus Anteilen zusammen, die uber die rden etliche davon Strahlwege I und I1 dorthin gelangt sind nuantenmechanik damit experimenaufmerksam zu machen. mnach ist eine Katze, die sich unbeobachmechanik relevanin einer Kiste befindet, in einem Superpoionszustand, der die Katze gleichzeitig ledieund tot Situation ndig sein lafit, und erstdes durch das obachten - Offnen der Kiste - entscheidet 1974 haben h, ob die Katze totwir oder lebendig ist. Aber wobei man fur die Vorwartsrichtung (0) aus ch die Tatsache, dai3 ein an sich unteilbares ch-osterreichischen bjekt gleichzeitig uber zwei weit voneinan- Symmetriegriinden leicht erkennt, da8 die r getrennte Wege gehen kann - wie in AbTRIGA-Reaktor inraum- Anteile aus beiden Strahlwegen gleich sein dung 1 dargestellt - oder sich an zwei h getrennten Orten befinden kann, geht ieunserin,,klassisches" Abbildung 2 mussen, weil sie transmittiert-reflektiert-reer Verstandnis deutlich naus, und dennoch gibt es diese Phanoronenstrahl durch flektiert und reflektiert-reflektiert-transmitene, wie wir im folgenden sehen werden. perfekten Siliziumperimente, die diese ,,absurden" Vorstel- tiert sind. Durch das Einbringen einer Wechngen bestatigen, konnten in den letzten voneinander entiden Jahrzehnten mit Neutronen durchge- selwirkung in einen Teilstrahl in Form eines hrt werden, die zweifelsohne als massive len geteilt und anilchen anzusehen sind. Sic haben eine beliebigen Materials, eines Magnetfeldes oder ohldefinierte Masse und besitzen auch Abb. 2. Perfektkristall-Neutroneninterferometer,mit dem an sich unteilbare Neutronen Teilstrahlen wieder Beriicksichtigung des GravitationsfelAbb. 3. Typisches Interferenzbild hinter auf getrennten Wegen durch das Interferometer gefuhrt werden. iche weitere Eigenschaften, die sic als durch ilchen ausweisen. Schliei3lich besteht die 1ai3t sich zeigen, eidem Interferometer, wenn in einem als Teilsamte uns umgebende Materie zu fast des ergibt sich eine Phasenverschiebung Abbildung 1.8: Links: Perfektkristall-Neutroninterferometer. Rechts: Interferenzstreifen Funktion % aus Neutronen, die in den Atomkernen Die Intensitat hinter dem Interferometer setzt gegeniiber ometer aussieht strahl der Phasenschub Dicke des Alumibunden sind. Beiso der Kernspaltung oder an- ner sich Teilwelle aus Anteilen zusammen, die uber die der anderen, die ahnder Dicke der Aluminiumplatten in einem Strahlweg. ren Kernreaktionen werden etliche davon Strahlwege I und I1 dorthin gelangt sind nformationen iiber nium-Phasenschiebers - geandert wird. igesetzt, und wir konnen damit experimen- lich wie fur Licht durch einen Brechungsinren. Ein fur die Quantenmechanik relevanes als ElementarExperiment, welches die Situation des dex n und eine raumliche Verschiebung A des ifahrers nachempfindet, haben wir 1974 wobei man fur die Vorwartsrichtung (0) aus eRahmen Dichte der Neu- Wellenzuges beschrieben Symmetriegriinden leicht erkennt, da8 die werden kann einer deutsch-osterreichischen ooperation am 250 kW TRIGA-Reaktor in Anteile aus beiden Strahlwegen gleich sein 13 [l]. Wie in Abbildung 2 mussen, weil sie transmittiert-reflektiert-reg,en durchgefiihrt dai3 sich jeweils rgestellt, wird ein Neutronenstrahl durch flektiert I1 - und Ireflektiert-reflektiert-transmitix tiert sind. ugung einem vollig perfekten Silizium- w im anInterferometer - wDurch e das Einbringen einer Wech(3) wobei I a ( Z ) 1 = g ( R ) die Impulsverteilung nkristall in zwei weit voneinander ent- selwirkung in einen Teilstrahl in Form eines nte koharente geteilt und an- beliebigen Materials, eines Magnetfeldes oder noch imTeilstrahlen Urankern des Strahls angibt, deren Breite wir mit hliei3end werden diese Teilstrahlen wieder durch Beriicksichtigung des Gravitationsfel- Abb. 3. Typisches Interferenzbild hinter sammengefiihrt. 1ai3t sich zeigen, des ergibt sich *eine ei- dem Interferometer, nden ist. Dabei Beschried?Phasenverschiebung = (n- 1)xkD =d . & wenn in einem Teil- & bezeichnen. Damit ergibt sich als endgiil=Teilwelle $ gegeniiber der anderen, die ahn- strahl der Phasenschub - Dicke des Alumi3 es hinter dem Interferometer so aussieht ner hatte jedes n i Neutron t derInformationen Schro- iiber lich wie fur Licht durch einen Brechungsin- nium-Phasenschiebers - geandert wird. tige Intensititsformel ang x x uople. nort ernce ncaum ed leher ed ere 3), by B0 20 he he ned of ve denm m, was to mm Fullerene Interference Fig. 1. (A) Phase-contrast images of a single Bose condensate (left) and double Bose condensates, taken in the trap. The distance between the two condensates was varied by changing the power of the argon ion laser-light sheet from 7 to 43 mW. (B) Phase-contrast image of an originally double condensate, with the lower condensate eliminated. varying between 20 and 40%. When the imaging system was calibrated with a standard optical test pattern, we found ;40% contrast at the same spatial frequency. B Hence, the contrast of the atomic interference was between 50 and 100%. Because the condensates are much larger than the observed fringe spacing, they must have a high degree of spatial coherence. A Fig. 2. Interference pattern of two expanding condensates observed after 40 ms time-of-flight, for two different powers of the argon ion laser-light sheet (raw-data images). The fringe periods were 20 and 15 mm, the powers were 3 and 5 mW, and the maximum absorptions were 90 and 50%, respectively, for the left and right images. The fields of view are 1.1 mm horizontally by 0.5 mm vertically. The horizontal widths are compressed fourfold, which enhances the effect of fringe curvature. For the determination of fringe spacing, the dark central fringe on the left was excluded. 0% 50 mm 100% Intensity (arbitrary units) SCIENCE z z Abbildung 1.10: 1997Linke VOL. 275 31 JANUARY pared it with the pattern from a single condensate (this is equivalent to performing a double-slit experiment and covering one of the slits). One condensate was illuminated with a focused beam of weak resonant light 20 ms before release, causing it to disappear almost completely as a result of optical pumping to untrapped states and evaporation after heating by photon recoil (Fig. 1B). Fig. 3. (A) Fringe period versus power in the argon ion laser-light sheet. (B) Fringe period versus observed spacing between the density maxima of the two condensates. The solid line is the dependence given by Eq. 1, and the dashed line is the theoretical prediction of (26) incorporating a constant center-of-mass separation of 96 mm, neglecting the small variation (610%) with laser power. Fig. 4. Comparison between time-of-flight images for a single and double condensate, showing vertical profiles through time-of-flight pictures similar to Fig. 2. The solid line is a profile of two interfering condensates, and the dotted line is the profile of a single condensate, both released from the same double-well potential (argon ion laser power, 14 mW; fringe period, 13 mm; time of flight, 40 ms). The profiles were horizontally integrated over 450 mm. The dashed profile was multiplied by a factor of 1.5 to account for fewer atoms in the single condensate, most likely the result of loss during elimination of the second half. Seite: Phasenkontrast-Aufnahmen von getrennten Bose-EinsteinSCIENCE z VOL. 275 zzwei 31 JANUARY 1997 Kondensaten, bestehend aus Natrium-Atomen. Die Breite der Kondensate beträgt etwa 20 µm. Rechte Seite: beobachtete Interferenzen bei der Überlappung der beiden Kondensate. (M.R. Andrews et al., SCIENCE 275, 637 (1997)). 14 639 Downloaded from www.sciencemag.org on June 4, 2009 ed 2). en tly be nng ed he ole of by 67 mm (1/e2 radii), with its long axis camera by retarding the transmitted probe perpendicular to the long axes of the con- beam by a quarter-wave with a phase plate densates. The argon ion laser beam propa- in the Fourier plane. Previously, the transgated nearly collinearly with the vertical mitted probe beam was blocked by a thin probe beam. We aligned the light sheet by wire (dark-ground imaging). Interference between the condensates imaging the focused argon ion laser beam with the same camera used to image the was observed by simultaneously switching off the magnetic trap and the argon ion condensates. Die RInterferenz ist nun ESEARCH ARTICLE Evaporative cooling was extended well laser-light sheet. The two expanding condeutlich ausgeprägter densates overlapped and bywere observed by below the transition temperature to obtain probe time-of-flight image did not We observed that the fringe period be- The resulting light was only absorbed a thin slice came smaller for larger powers of the argon exhibit interference, and the profile of a the cloud where the atoms were40optically imaging. After ms time-ofcondensates without a discernible normal ofabsorption bis hincondensate zum dritten matched one ion laser-light sheet (Fig. 3A). Larger power single expanded spatialbeam resolution flight, anBecause opticalhigh pumping transferred fraction. Condensates containing 5 3 106 pumped. the profile of a double condensate increased the distance between the two side of Maximum. of atomsstate therequired atoms from fromonly the the F 5fraction 1 hyperfine to sodium atoms in the F 5 1, mF 5 –1 ground was residing in the slice, a good signal-to-noise condensates (Fig. 1A). From phase-contrast (Fig. 4). The profile of a single expanded the required F 5 2 condensates state. Withwith a 10-ms delay, the state were produced within 30 s. The pres- ratio millions of images, we determined the distance d be- condensate showed some coarse structure, atoms were exposed to a short (50 tween ms) the density maxima of the two con- which most likely resulted from the nonparaence of the laser-light sheet neither changed atoms. polarized beam resonant the number of condensed atoms from our circularly densates versus360 argonNeutronen, ion laser power.360 The bolic shape of the confining potential. We Interference between probe two Bose conden360 Protonen, general, pattern of interference withInthe F 5 the 23 F9 5 3 transition fringe and period versus maxima separation (Fig. found that the structure became more proprevious work (3) nor required a modifica- sates. Elektronen einen Fulleren-Ball 3B) is inbilden reasonable agreement with the nounced when the focus of the argon ion differs for photons continuous and Under pulsed absorbed ;20 each. these tion of the evaporation path; hence, prob- fringes prediction of Eq. 1, although this equation laser had some weak secondary intensity Two the point-like monochromatic conditions, atoms moved ;5 mm horilems with heating encountered earlier with sources. strictly hat applies to two 90 point sources. maxima. In addition, the interference besources would produce curved 60only Ecken, Kanten zontally during the exposure. Der „Ball“ an optically plugged magnetic trap (2) were continuous (hyperbolic) interference fringes. In con- Wallis et al. (26) calculated the interfer- tween two condensates disappeared when (gleicher Länge) undextended 32 Flächen, imaging usually show integrates purely technical. In the present application, trast,Absorption ence pattern for two condensatesvonthe argon ion laser-light sheet was left on for two point-like pulsed sources along interference the line offringes; sight ifand therefore has the argon ion laser beam was not needed to straight a harmonic potentialund with12 a Gaussian d is the sep- in denen 20 Sechsecke Fünfecke only two-dimensional spatial resolution. avoid a loss process, and thus we had com- aration barrier. They concluded that Eq. 1 remains between two point-like condensind. valid for the central fringes if d is replaced sates, then their relative speed at any point plete freedom in the choice of laser power Because the depth of field for 15-mm fringes by the geometric mean of the separation of inis space is d/t, where is the delay comparable to tthe size of between an expanded and focal parameters. the centers of mass and the distance besourcethe (switching off in thegeneral cloud, on andthe because fringes are The double condensate was directly ob- pulsing „C60 is almost a classical trap) and observation. The fringe period is tween the density maxima of the two connotdeparallel to the axis of the probe served by nondestructive phase-contrast the body, of ist many densates. because This prediction is also shown in Broglie wavelength l associated with light, line-of-sight integration would cause imaging (Fig. 1A). This technique is an the Fig. 3B. The agreement is satisfactory given relative motion of atoms with mass m, conexited internal degrees of We avoided this problem extension of our previous work on disper- siderable blurring. ht our experimental uncertainties in the deterfreedom and their possible resolution sive imaging (4) and greatly improved the and achieved lthree-dimensional 5 (1) mination of the maxima separations (;3 md mm) andcoupling of the center-of-mass of the probe light signal-to-noise ratio. The probe light fre- by restricting absorption to the separations (;20%). We conclude that the numerical h is Planck’s constant. to a thin horizontal slice ofThe theamplicloud. The quency was far detuned from a resonant where environement“ simulations for extended interacting and Fulleren contrast of the interference pat-oben: 1.9: Das C60. mit C60.con-Rechts unten: ohne optical pumping beam wasRechts focused into a Interferenzen transition (1.77 Abbildung GHz to the red), and Links: thus tude tern depends on the overlap between the densates (26) are consistent with the oblight sheet of adjustable thickness (typically absorption wasBeugungsgitter negligible. Images(nach were O. Nairz, M. Arnd und A. Zeilinger, Univ. Wien). served fringe periods. two condensates. and a width fewcondenmillimeters; formed by photons scattered coherently in 100 We performed a series of tests to support Themm) interference patternofofatwo this after pumping propagated perpendicuthe forward direction. The phase modula- sates 40 ms beam time-of-flight is shown in our interpretation of matter-wave interfer2. A of measurements fringe to ence. larly toseries the probe light andwith parallel the To demonstrate that the fringe pattern tion caused by the condensate was trans- Fig. of of ;15 a contrast long axis themm trapshowed (39). As a result, was the caused by two condensates, we comformed into an intensity modulation at the spacings Downloaded from www.sciencemag.org on June 4, 2009 nt 7). ernlly its pic he till te” 5, ge ber to nt, ed wa nd ey 1.5 Didaktische Anmerkungen Die Unanschaulichkeit der Quantentheorie Einer der Väter der Quantenelektrodynamik, Richard Feynman, hat den Aphorismus geprägt “Nobody really understands quantum physics”. Dieser Satz klingt fast so provokativ wie der berühmte Ausspruch von Albert Einstein “Gott würfelt nicht”, man muss ihn aber wie diesen mit einiger Vorsicht anwenden. Feynman selbst wusste sehr genau, wie man in der Quantentheorie Berechnungen durchführt, er war geradezu ein Meister darin und hat mit seiner Erfindung der Feynman-Graphen viel zur Vereinfachung der Quantenelektrodynamik beigetragen. Was er meinte ist, dass die anschauliche Vorstellung uns Schwierigkeiten macht. “Anschauen” mit bloßen Augen können wir nur die hinreichend großen Dinge, und bei diesen gibt es keine WelleTeilchen-Komplementarität. Eine Glasmurmel wird entweder durch Spalt 1 rollen oder durch Spalt 2, aber nicht durch beide “gleichzeitig”. Die de Broglie-Wellenlänge einer Glasmurmel ist selbst bei winzigen Geschwindigkeiten viel geringer als der Durchmesser eines Protons und somit extrem viel kleiner als die Größe der Murmel. Daher ist undenkbar, dass diese Kugel Interferenzmuster erzeugen könnte. Ebenso ist es undenkbar, dass die Murmel durch eine dünne Folie tunneln könnte, ohne die Folie zu verletzen. Das Quantenverhalten erscheint uns aus dem Grunde “unanschaulich”, weil wir es im normalen Leben nicht anschauen können. George Gamov hat im Scherz eine Welt vorgeschlagen, in der die Plancksche Konstante um viele viele Zehnerpotenzen größer ist, so dass die Welleneigenschaften von Tigern merkbar würden. Lebten wir in einer solchen Welt, so wäre für uns selbstverständlich, dass ein im Zoo eingesperrter Tiger durch die Käfigwand nach draussen schlüpfen könnte und man ihm nicht die Tür öffnen müsste. Wenn wir diese seltsamen Phänomene täglich sehen könnten, würden wir sie nicht mehr als fremd empfinden, sondern sie wären für uns “anschaulich”. Diese Überlegungen zeigen, dass “Anschaulichkeit” kein absoluter Begriff ist, sondern von den bisher gemachten Erfahrungen abhängt. Wenn man als Physiker genügend viele Aufgaben mit der Schrödingergleichung gelöst hat, wird man allmählich ein gewisses intuitives Verständnis für diejenigen Aspekte der Theorie entwickeln, die einem Anfänger rätselhaft erscheinen. Warum ist es wichtig, diese höhere Art von Anschauung zu gewinnen oder zumindest die innere Abwehr gegen die Quantenphysik abzubauen? Uns liegt sehr daran zu vermitteln, dass man aus den Seltsamkeiten der Quantentheorie keineswegs die Schluss ziehen darf, diese Theorie sei als solche skurril und ihren Aussagen sei nicht zu trauen. Die Vorhersagen der Theorie stimmen in allen untersuchten Fällen mit dem Experiment überein, was man von kaum einer anderen physikalischen Theorie behaupten kann. Dies bedeutet, dass die Quantentheorie extrem leistungsfähig ist. Die Erweiterung unserer Anschauung durch neue Instrumente Mit einem Lichtmikroskop kann man Pantoffeltierchen und andere Kleinstlebewesen beobachten, die er mit bloßem Auge unsichtbar sind. Schauen wir durch ein Mikroskop, so werden wir dies in unmmittelbarer Weise als Erweiterung unseres Erkennungsvermögens wahrnehmen: die winzigen Objekte werden “anschaulich” für uns, weil wir sie sehen können, wenn auch nur mit Hilfsmitteln. In den letzten Jahrzehnten sind neue, extrem hochauflösende Mikroskope entwickelt worden, die selbst einzelne Atome “sichtbar” machen können, das Rastertunnelmikroskop und das Rasterkraftmikroskop. Abbildung 1.11 zeigt zwei Beispiele. Links sieht man die Oberfläche eines Nickel-Einkristalls, die mit einem Rastertunnelmikroskop abgetastet wurde. Die einzelnen Atome und ihre regelmäßige Anordnung sind fantastischer Schärfe zu erkennen. Noch eindrucksvoller ist das rechte Bild. Hier wurden Eisenatome mithilfe eines Rasterkraftmikroskops auf einer Kupferoberfläche verschoben und zu einem Ring angeordnet. Ein Bild dieses 15 Ringes erhält man durch Abtastung mit einem Rastertunnelmikroskop. Die Elektronen, die sich auf der Kupferoberfläche im Innern diese ringförmigen Käfigs befinden, bilden eine zweidimensionale stehende Elektronenwelle, und diese Welle kann man ebenfalls abtasten. Dies ist der direkte, visuelle Beweis für die Wellennatur der Elektronen. Abbildung 1.11: Links: die Oberfläche eines Nickel-Einkristalls, abgetastet mit einem Rastertunnelmikroskop. Rechts: eine stehende Elektronenwelle innerhalb eines Ringes von 48 Eisenatomen auf einer Kupferoberfläche. (Don Eigler, IBM-Forschungslabor Almaden.) 16 Kapitel 2 Die Schrödingergleichung 2.1 Die Beziehungen von Max Planck und Louis de Broglie Der photoelektrische Effekt und die Comptonstreuung (siehe Abb. 1.4) sind Belege dafür, dass Licht nicht nur eine Wellenerscheinung ist, sondern auch eine Teilchennatur besitzt. Die Energie eines Lichtquants (Photons) ist über die Plancksche Beziehung E = ~ω (2.1) mit seiner Kreisfrequenz ω = 2πf verknüpft. Die Plancksche Konstante1 , auch Wirkungsquantum genannt, hat den Wert h = 1.05 · 10−34 Js = 6.682 · 10−16 eVs (2.2) 2π Andererseits können mit Elementarteilchen oder gebundenen Systemen von Teilchen (Elektronen, Neutronen, Atomen) Interferenzexperimente durchgeführt werden, die den Interferenzen mit Licht gleichen (Abb. 1.2). Diese Erscheinungen lassen sich nur im Wellenbild deuten. Die einem Teilchen zugeordnete Wellenlünge ist durch die de Broglie-Beziehung gegeben: ~= λ= 2π~ , p (2.3) wobei p = mv der Impuls des Teilchens ist. Wenn man die Wellenzahl k = 2π/λ einführt, lässt sich die de Broglie-Gleichung auch in der Form p = ~k oder als Vektorgleichung p = ~k schreiben. Die beiden Beziehungen E = ~ω und p = ~k (2.4) sind die Grundgleichungen der Quantentheorie. Sie gelten in der nichtrelativistischen Quantenmechanik und auch in der relativistischen Quantenelektrodynamik und den anderen relativistischen Quantenfeldtheorien (Standard-Modell der vereinheitlichten elektro-schwachen Wechselwirkung, Quantenchromodynamik). Man kann diese Relationen sowohl für Teilchen mit Masse m > 0 (Elektronen, Neutronen, Atome) als auch für die masselosen Photonen anwenden, bei denen allerdings der Impuls in der Form p = E/c geschrieben werden muss, wobei c die Lichtgeschwindigkeit im Vakuum ist. Wir werden uns im Weiteren vorwiegend mit Elektronen und anderen massiven Teilchen beschüftigen und voraussetzen, dass die Geschwindigkeiten viel kleiner als c sind, so dass die nichtrelativistische Beziehungen zwischen Energie und Impuls verwendet werden dürfen. Zur korrekten Beschreibung von Photonen und ihrer Wechselwirkung mit geladenen Teilchen benötigt man eine relativistische Theorie. 1 Wir verwenden in dieser Vorlesung immer ~ = h/(2π) (gesprochen h-quer) und nennen dies die Plancksche Konstante. Die Kreisfrequenz ω = 2πf wird zur Vereinfachung oft “Frequenz” genannt. 17 2.2 Energie- und Impulsoperator Teilchen mit wohldefiniertem Impuls haben alle dieselbe Wellenlünge und können, was Interferenzmuster angeht, durch harmonische Wellen beschrieben werden. Es erweist sich in der Quantenmechanik als notwendig, nicht mit Sinus- oder Cosinuswellen zu rechnen, sondern die komplexe Exponentialfunktion zu benutzen. Die Welleneigenschaften von Elektronen, die sich in einem kräftefreien Bereich bewegen, beschreiben wir durch eine Wellenfunktion Ψ, die die Form einer ebenen Welle hat2 Ψ(x, t) = Aei(k x−ωt) (2.5) Die Grösse A ist ein Normierungsfaktor. Ein Grundprinzip der Quantentheorie ist, dass die physikalischen Messgrößen eines Teilchens wie Energie und Impuls durch Operatoren beschrieben werden. Anwendung eines Operators auf die Wellenfunktion ergibt den Messwert der entsprechenden physikalischen Größe. Dies Prinzip soll nun angewandt werden, um die Form des b und des Impulsoperators pbx plausibel zu machen. Energieoperators E b EΨ(x, t) = EΨ(x, t) , pbx Ψ(x, t) = px Ψ(x, t) (2.6) Benutzen wir E = ~ω und px = ~k so ergibt sich die folgende Form der Operatoren b = i~ ∂ , E ∂t pbx = −i~ ∂ . ∂x (2.7) Zur Illustration wenden wir den Energieoperator auf eine ebene Welle an ∂Ψ b EΨ(x, t) = i~ = i~(−iω)Ψ(x, t) = ~ωΨ(x, t) ∂t Partielle Ableitungen werden in Anhang A erklärt. Dreidimensional gilt ∂x ∂ ∂ ∂ , ∂y = , ∂z = . pb = −i~∇ ≡ −i~ ∂y mit ∂x = ∂x ∂y ∂z ∂z (2.8) Die Gestalt der Energie- und Impulsoperatoren ist mithilfe der ebenen Wellen plausibel gemacht worden. In der Quantentheorie wird postuliert, dass diese Operatoren ganz generell die Form (2.7, 2.8) haben. 2.3 Die Form der Schrödingergleichung In der klassischen Physik werden ebene elektromagnetische Wellen in der Form f (x, t) = a cos(k x − ωt) oder f (x, t) = a sin(k x − ωt) mit k = 2π λ dargestellt. Die Beziehung zwischen Wellenvektor und Kreisfrequenz lautet ω = c k ⇒ ω 2 = c2 k 2 (2.9) Genau diese Relation ergibt sich, wenn man die harmonischen Wellen in die folgende Differentialgleichung einsetzt 2 ∂2f 2∂ f = c (2.10) ∂t2 ∂x2 2 Eine bessere Beschreibung wird durch ein Wellenpaket geliefert, s. Kap. 3.4.2. 18 Dies ist die Wellengleichung für eine der Komponenten des elektrischen oder magnetischen Feldes. Im Vakuum und bei Abwesenheit von Ladungen und Strömen sind ebene harmonische Wellen spezielle Lösungen dieser Gleichung. Man darf allerdings nicht behaupten, durch diese Betrachtungen die Wellengleichung aus der Gestalt der ebenen Wellen und der Gleichung (2.9) hergeleitet zu haben. Die Wellengleichung elektromagnetischer Felder kann aus den MaxwellGleichungen hergeleitet werden (siehe Theorie B), und sie gilt sehr allgemein, z.B. auch in inhomogenen Medien mit räumlich veränderlichem Brechungsindex, wobei die Lösungen dann allerdings keine ebenen harmonischen Wellen mehr sind. Wir sind jetzt in der Lage, uns die Form der Schrödingergleichung plausibel zu machen. Für ein freies Teilchen lautet die Beziehung zwischen Energie und Impuls E= p2 2m (2.11) Einsetzen von (2.4) ergibt ~2 k 2 (2.12) 2m Eine Differentialgleichung, die bei Anwendung auf eine harmonische ebene Welle diese Relation ergibt, lautet ~2 ∂ 2 Ψ ∂Ψ =− (2.13) i~ ∂t 2m ∂x2 Dies ist die eindimensionale Schrödingergleichung eines freien Teilchens. Alternativ kommt man zu dieser Gleichung durch Einsetzen der Energie- und Impulsoperatoren in (2.11). Wie schon bei der Wellengleichung betont wurde, handelt es sich hier nicht um eine Herleitung der Schrödingergleichung im mathematischen Sinn, sondern es geht nur darum, die Gestalt dieser Differentialgleichung verständlich zu machen. “Beweisen” kann man diese Gleichung nicht, denn sie geht eindeutig über den Rahmen der klassischen Physik hinaus. Die Schrödingergleichung unterscheidet sich ganz erheblich von der klassischen Wellengleichung ~ω = • sie ist von der ersten Ordnung in der Zeit √ • es tritt der Faktor i = −1 auf • die Wellenfunktion Ψ ist eine komplexwertige Funktion. In der klassischen Physik und der Elektrotechnik sind die komplexen Zahlen sehr nützlich, um die Rechnungen einfacher und eleganter zu machen, wirklich notwendig sind sie nicht. In der Quantentheorie ist das anders: die Zeitabhängigkeit der Wellenfunktion ist grundsätzlich von der Art exp(−iωt) und keineswegs cos(ωt) oder sin(ωt). In den meisten Fällen von praktischem Belang befindet sich das Teilchen in einem Kraftfeld, von dem wir voraussetzen, dass es konservativ ist und durch ein Potential V (x, t) beschrieben werden kann. Die allgemeine Form der zeitabhängigen Schrödingergleichung lautet ∂Ψ ~2 ∂ 2 Ψ =− + V (x, t) Ψ(x, t) . (2.14) ∂t 2m ∂x2 In Analogie zur Hamiltonfunktion der analytischen Mechanik, die die Summe der kinetischen und potentiellen Energie ist, führt man den Hamilton-Operator ein i~ 2 2 b = − ~ ∂ + V (x, t) . H 2m ∂x2 19 (2.15) Damit kann man die zeitabhängige Schrödingergleichung in kompakter Form schreiben ∂Ψ b Ψ(x, t) . i~ =H ∂t Die Verallgemeinerung auf drei Dimensionen ergibt ~2 ∂ 2 Ψ ∂ 2 Ψ ∂ 2 Ψ ∂Ψ + + + V (r, t) Ψ(r, t) = − i~ ∂t 2m ∂x2 ∂y 2 ∂z 2 ~2 2 = − ∇ Ψ(r, t) + V (r, t) Ψ(r, t) . 2m Mit dem Hamilton-Operator lautet die Gleichung i~ ∂Ψ b Ψ(r, t) =H ∂t 2 b = − ~ ∇2 + V (r, t) mit H 2m (2.16) (2.17) (2.18) Diese Gleichung wird als Grundgleichung der nichtrelativistischen Quantenmechanik postuliert. Die zeitunabhängige Schrödingergleichung Sehr wichtig sind die Spezialfälle, bei denen das Potential nicht von der Zeit abhängt. Man kann dann die Wellenfunktion als Produkt einer orts- und einer zeitabhängigen Funktion ansetzen: Ψ(x, t) = ψ(x) · f (t) (2.19) Wenn wir dies in (2.14) einsetzen so folgt ~2 d2 ψ df + V (x)ψ(x) i~ · ψ(x) = f (t) · − dt 2m dx2 Dividieren wir die Gleichung durch f (t) · ψ(x) so folgt3 2 2 i~ df 1 ~ d ψ =− + V (x)ψ(x) . f (t) dt ψ(x) 2m dx2 Links steht eine Funktion, die nur von der Zeit abhängt und nicht vom Ort, rechts ist es umgekehrt. Diese Gleichung kann nur dann für alle Werte von x und t gelten, wenn beide Seiten gleich einer Konstanten sind. Diese Konstante nennen wir E. Daraus ergeben sich getrennte Differentialgleichungen für f (t) und ψ(x). Die erste lautet i~ df = Ef (t) dt (2.20) und hat die Lösung E . (2.21) ~ Offensichtlich hat E die Dimension einer Energie, es handelt sich in der Tat hier um die Gesamtenergie des Teilchens, die Summe aus der kinetischen und der potentiellen Energie. Die zweite Gleichung ist die zeitunabhängige Schrödingergleichung f (t) = e−iωt mit ω= ~2 d2 ψ + V (x)ψ(x) = E ψ(x) 2m dx2 Die dreidimensionale zeitunabhängige Schrödingergleichung lautet entsprechend ~2 ∂ 2 ψ ∂ 2 ψ ∂ 2 ψ − + + + V (r)ψ(r) = E ψ(r) 2m ∂x2 ∂y 2 ∂z 2 − 3 (2.22) (2.23) Diese Division ist zulässig, da die Wellenfunktion eines Teilchens nicht identisch null sein darf. Die Funktion f (t) ist immer ungleich null, die Funktion ψ(x) ist in weiten Bereichen ungleich null. Da f (t) und ψ(x) jeweils von nur einer Variablen abhängen, werden die partiellen Ableitungen durch normale Ableitungen ersetzt. 20 Eigenfunktionen und Eigenwerte Diese Differentialgleichungen sind Eigenwertgleichungen: b =Eψ , Hψ (2.24) wobei die Randbedingungen zu berücksichtigen sind, die eine sehr wichtige Rolle spielen, s. die Beispiele in Kap. 3. Die Lösungen der Gl. (2.24), die die Randbedingungen erfüllen, nennt man die Eigenfunktionen, sie existieren in vielen Fällen nur für gewisse diskrete Werte der Energie E, die dann Eigenwerte heissen. Für den Eigenwert En hat die Gesamtwellenfunktion die Gestalt Ψn (x, t) = ψn (x) exp(−iωn t) 2.4 mit ωn = En ~ (2.25) Die Wahrscheinlichkeitsinterpretation Die Wellenfunktion ψ soll die Welleneigenschaften eines Elektrons oder eines anderen Teilchens mathematisch erfassen. Wir werden später sehen, dass ψ alle messbaren Eigenschaften des Teilchen beschreibt. Auch wenn es bei quantenmechanischen Rechnungen oft gewisse formale Analogien zur Theorie der mechanischen oder elektromagnetischen Wellen gibt, so muss man sich doch vor Augen führen, dass ganz gravierende Unterschiede bestehen. Die Amplitude einer klassischen Welle ist kontinuierlich veränderbar, und die Intensität wächst quadratisch mit der Amplitude an. Die Amplitude einer Einteilchen-Wellenfunktion hingegen hat nichts mit der Stärke dieser “Materiewelle” zu tun, sie ist vielmehr durch eine Normierungsbedingung festgelegt (s. unten) und kann in keiner Weise variiert werden. Seit der Begründung der Quantentheorie hat es kontroverse Diskussionen über die physikalische Bedeutung der Wellenfunktion gegeben. In Einklang mit den meisten Physikern bevorzugen wir die Wahrscheinlichkeitsinterpretation, die von Max Born vorgeschlagen und besonders von Niels Bohr propagiert wurde. Auch die neuesten experimentellen Tests der Quantenmechanik sind mit dieser Kopenhagener Deutung der Quantentheorie in Einklang, während andere Deutungen dadurch in große Schwierigkeiten kommen. Viele Jahre lang wurde die Frage diskutiert, ob es “verborgene Variable” (hidden variables) geben könnte, die weitere, nicht bereits von der Wellenfunktion abgedeckte Informationen enthalten. Die modernen Experimente ergaben die eindeutige Antwort, dass solche verborgene Variablen nicht existieren, und dass alles, was man über ein Quantensystem aussagen kann, in der Wellenfunktion enthalten ist. Wir wollen die Wahrscheinlichkeitsinterpretation zuerst für eine Raumdimension betrachten. Sei ψ(x) die Wellenfunktion eines Teilchens. Dann ist die Wahrscheinlichkeit, das Teilchen im Intervall [x, x + dx] zu finden, gegeben durch den Ausdruck |ψ(x)|2 dx . Wir nennen ρ(x) = |ψ(x)|2 (2.26) die Wahrscheinlichkeitsdichte. Da die Funktion ψ(x) genau ein Teilchen repräsentieren soll, muss man bei der Aufsummation der differentiellen Wahrscheinlichkeiten den Wert 1 erhalten Z +∞ |ψ(x)|2 dx = 1 . (2.27) −∞ Man nennt diese Gleichung die Normierungsbedingung. 21 Die Verallgemeinerung auf drei Dimensionen ist naheliegend: die Wahrscheinlichkeit, das Teilchen im Bereich [x, x + dx], [y, y + dy], [z, z + dz] zu finden, ist gegeben durch den Ausdruck |ψ(x, y, z)|2 dxdydz . Das Normierungsintegral lautet Z +∞ Z +∞ Z +∞ −∞ −∞ −∞ |ψ(x, y, z)|2 dxdydz = 1 . (2.28) Man kann in der Quantenmechanik eine Kontinuitätsgleichung herleiten, die der Kontinuitätsgleichung der Elektrodynamik entspricht, siehe Anhang B. 2.5 Das Unschärfeprinzip Die Wellennatur des Elektrons (oder anderer Teilchen) hat eine wichtige Konsequenz: man kann den Ort und den Impuls des Teilchens nicht gleichzeitig exakt festlegen. Es gilt die berühmte Unschärferelation von Werner Heisenberg ∆x∆p ≥ ~/2 (2.29) Die genaue Definition der Unschärfen wird in Kap. 4 gebracht. Will man den Impuls eines Teilchens sehr präzise festlegen, so muss wegen p = 2π~/λ auch die de Broglie-Wellenlänge λ entsprechend präzise sein. Damit dies gewährleistet ist, muss die Wellenfunktion die Form eines sehr langen harmonischen Wellenzuges haben, siehe Abb. 2.1. Ein solcher Wellenzug bestimmt den Ort des Teilchens aber nur mit einer großen Unsicherheit. Im umgekehrten Fall, dass man den Ort genau definieren möchte, muss man als Wellenfunktion einen sehr schmalen Wellenpuls wählen. Es erscheint fragwürdig, einem solchen Puls überhaupt eine Wellenlänge zuzuordnen. Die Fourieranalyse ermöglicht jedoch, auch kurze Pulse durch Superposition harmonischer Wellen darzustellen, aber das Spektrum ist umso breiter, je schmaler der Puls ist. Quantenmechanisch bedeutet dies: die Unsicherheit im Impuls des Teilchens ist umso größer, je besser man seinen Ort festlegt. Eine genauere Betrachtung unter Benutzung von Wellenpaketen bringen wir in Kap. 3. 2.6 Didaktische Anmerkungen Die klassische Mechanik ist eine deterministische Theorie. Wenn ich einen Puck über eine spiegelglatte, reibungsfreie Eisfläche schieße und die Anfangsbedingungen (Ort und Impuls zum Zeitpunkt t = 0) kenne, kann ich exakt berechnen, welche Entfernung der Puck in 2 Sekunden zurückgelegen wird. In der Quantentheorie wird das sofort kompliziert: wegen der Unschärferelation ist es gar nicht möglich, die Anfangsbedingungen exakt zu definieren. Die unvermeidliche Unsicherheit im Impuls bedeutet, dass die Anfangsgeschwindigkeit nicht genau bekannt ist. Deshalb kann man auch nicht exakt voraussagen, welche Strecke das Objekt in 2 Sekunden zurücklegen wird. Die Quantentheorie ist präzise bei der Berechnung von statischen Eigenschaften; dies sind z.B. die Energieniveaus in einem Atom, das magnetische Moment des Elektrons etc. Bei zeitabhängigen Prozessen, etwa atomaren Übergängen, radioaktiven Zerfällen oder Streuung von Teilchen an Atomkernen, erlaubt die Theorie die präzise Berechnung der Übergangswahrscheinlichkeiten (oder Wirkungsquerschnitte). Sobald es aber darum geht, den Zeitpunkt eines 22 Abbildung 2.1: Die Wellenfunktion ψ(x) (rote Kurven) und die Wahrscheinlichkeitsdichte ρ(x) = |ψ(x)|2 (blaue Kurven) eines freien Teilchens. Oberes Bild: ein langer harmonischer Wellenzug legt den Impuls eines Teilchen relativ genau fest, beispielsweise ist ∆p/p = 1% für einen Wellenzug, der 100 Wellenlängen lang ist. Der Ort des Teilchens ist sehr ungenau bestimmt. Unteres Bild: ein kurzer Wellenpuls legt den Ort des Teilchens genau fest, aber seine Wellenlänge und sein Impuls sind sehr unscharf. atomaren Übergangs oder eines radioaktiven Zerfalls vorherzusagen, versagt die Quantentheorie. Dies wird bei radioaktiven Zerfällen besonders deutlich. Niemand kann vorausberechnen, zu welchem Zeitpunkt sich ein Poloniumkern durch α-Zerfall in einen Bleikern umwandeln wird. Die Halbwertszeit T1/2 gibt an, wann von sehr vielen Po-Kernen die Hälfte zerfallen ist. Bei einer großen Anzahl kann man recht genaue Vorhersagen machen, wobei allerdings statistische Schwankungen auftreten. Haben wir am Anfang 20000 Kerne, so wissen wir, dass nach Ablauf einer Halbwertszeit 10000 ± 100 zerfallen sind. Bei individuellen Poloniumkernen ist unsere Vorhersagekraft praktisch null, und man kommt zu absurd scheinenden Aussagen. Vergleichen wir zwei Po-Kerne, von denen der erste sehr “alt” ist und bereits 5 Halbwertszeiten überlebt hat (was unwahrscheinlich aber nicht unmöglich ist), während der zweite gerade frisch “erzeugt” wurde. Gemäss der Quantentheorie haben beide Kerne exakt die gleiche Wahrscheinlichkeit von 50%, in der folgenden Halbwertszeit zu zerfallen. Die “Sterblichkeit” ist also unabhängig vom Alter des individuellen Kerns. Das ist offenbar nicht auf Menschen übertragbar, Lebensversicherungen würden sich schwer damit tun. Die Erkenntnis, dass exakte Vorhersagen bei Quantenübergängen unmöglich sind, hat vielen Physikern des 20. Jahrhunderts großes Unbehagen bereitet, der berühmteste war Albert Einstein. Die Quantenmechanik in der hier diskutierten Form und die Wahrscheinlichkeitsinterpretation haben sich jedoch als äußerst erfolgreich erwiesen und alle bisherigen experimentellen Tests bestanden. Daher ist es angebracht, die unanschaulichen Aspekte dieser Theorie (TeilchenWelle-Dualismus) und den Indeterminismus zu akzeptieren. Es gibt keine bessere Theorie! Der pragmatische Ansatz besteht darin, die Schrödingergleichung zu lösen und mit Hilfe der Wellenfunktion die Wahrscheinlichkeitsverteilung zu berechnen, und dann im zweiten Schritt diese Verteilung sukzessive mit Teilchen zu füllen (vgl. Abb. 1.3). 23 Kapitel 3 Einfache Anwendungen der Schrödingergleichung In diesem Kapitel wenden wir die Schrödingergleichung auf einfache eindimensionale Beispiele an, die zum Teil bereits in Physik III behandelt werden. Man gewinnt daraus wesentliche Einsichten in die Prinzipien und Methoden der Quantentheorie und legt das Fundament für eine abstrakt-theoretische Formulierung. 3.1 3.1.1 Der Potentialtopf mit unendlich hohen Wänden Eigenfunktionen Wir wollen die eindimensionale Schrödingergleichung für ein Teilchen in einem Potentialtopf mit unendlich hohen Wänden lösen und das Ergebnis mit stehenden Wellen auf einer Saite vergleichen. Das Potential habe die Form V (x) = 0 V (x) → ∞ 0≤x≤a für für x < 0 , x>a Die Schrödingergleichung im Bereich 0 ≤ x ≤ a lautet − ~2 d2 ψ · = E ψ(x) . 2m dx2 (3.1) In den übrigen Bereichen muss ψ(x) verschwinden, da dort das Potential unendlich groß ist. Wir erhalten somit die Randbedingungen ψ(0) = 0 , ψ(a) = 0 . (3.2) Die allgemeine Lösung ist ψ(x) = A sin kx + B cos kx mit k= √ 2mE/~ . (3.3) Aus der ersten Randbedingung ψ(0) = 0 folgt sofort B = 0, es bleiben also nur die Sinusfunktionen. Die zweite Randbedingung ψ(a) = 0 hat eine interessante physikalische Konsequenz: die Wellenzahl k darf nicht beliebige Werte annehmen, sondern nur die quantisierten Werte k = kn = n π a n = 1, 2, 3, . . . 24 (3.4) Die Wellenlänge λ = 2π/k ist auch quantisiert 2a n = 1, 2, 3, . . . (3.5) n Die Länge des Topfes ist ein ganzzahliges Vielfaches der halben Wellenlänge. Abbildung 3.1 zeigt, dass eine große Ähnlichkeit mit einer eingespannten schwingenden Saite vorliegt. Die zugrundeliegenden Differentialgleichungen (eindimensionale Wellen- bzw. Schödingergleichung) und die Randbedingungen sind in der Tat mathematisch identisch. Die physikalische Interpretation ergibt Gemeinsamkeiten, aber auch fundamentale Unterschiede. Gemeinsam ist die Quantisierungsbedingung (3.5) der Wellenlänge. Für die Saite folgt daraus die Quantisierung der Frequenzen. Die Grundfrequenz ist f1 = v/λ1 , wobei v die Schallgeschwindigkeit in der Saite ist, die Obertöne haben ganzzahlige Vielfache der Grundfrequenz fn = nf1 . Nun die Verschiedenheiten: Eine stehende mechanische Welle kann in der Form geschrieben werden F (x, t) = A sin(kn x) cos(ωn t) , ωn = 2πfn (3.6) λn = Wahlweise kann die Zeitabhängigkeit auch durch sin(ωn t) dargestellt werden. Die Amplitude A ist frei wählbar (sie darf nur nicht so gross sein, dass die Saite zerreißt). Die Energie Es der Schwingung ist proportional zu A2 und ist kontinuierlich variierbar zwischen Es → 0 (sehr leiser Ton) und großen Es -Werten (laute Töne). Die Wellenfunktion des Teilchens hat nach Gl. (2.25) die Gestalt Ψn (x, t) = An sin(kn x) exp(−i ωn t) . Aus der Normierungsbedingung berechnen wir den Amplitudenfaktor r Z a 2 |ψn (x)|2 dx = 1 ⇒ An = für alle n a 0 (3.7) (3.8) Für die Energiewerte gilt ~2 kn2 ~2 π 2 = · n2 . 2m 2ma2 Die Besonderheiten des Quantensystems sind En = (3.9) • Die Zeitabhängigkeit ist immer durch die komplexe Exponentialfunktion gegeben • Die Amplitude ist nicht frei wählbar, sondern durch die Normierungsbedingung festgelegt • Die Energie ist quantisiert. Die Energieniveaus eines eindimensionalen Potentialtopf sind in Abb. 3.1 skizziert. Die Wellenfunktion ψn hat (n − 1) Nullstellen (Knoten) im Intervall 0 < x < a. Generell kann man feststellen, dass die Energie umso höher ist, je mehr Knoten die Wellenfunktion hat. Besonders wichtig ist die Beobachtung, dass der tiefste Energiewert nicht null ist. Aus E = p2x /(2m) = 0 würde ∆px = 0 folgen, d.h. die Unschärferelation (2.29) wäre verletzt. 3.2 Der Potentialtopf mit endlicher Tiefe In diesem Fall ist es zweckmäßig, das Potential symmmetrisch zu x = 0 anzuordnen, weil dann die Eigenfunktionen entweder gerade oder ungerade Funktionen von x sind. Auf diese Weise braucht man nur eine Randbedingung zu betrachten. Wir wählen also V (x) = −V0 V (x) = 0 für − b ≤ x ≤ b (b = a/2) für |x| > b . 25 (3.10) ψ1( x ) ρ1( x ) E1 4 E1 E1 ψ2( x ) ρ2( x ) E2 E2 ψ3( x ) E1 4 E2 E2 2 2 ρ3( x ) E3 E3 E3 E3 0 0 0.5 1 0 0 0.5 1 x a x a Abbildung 3.1: Links: Die ersten drei Energieniveaus (in eV) und Wellenfunktionen eines Elektrons in einem Potentialtopf der Breite a = 1 nm mit unendlich hohen Wänden. Rechts: Die Wahrscheinlichkeitsdichten. Innerhalb des Topfes erhalten wir eine Cosinusfunktion (gerade) oder Sinusfunktion (ungerade). Die Schrödingergleichung wird in Anhang C gelöst. Es gibt nur endlich viele Energieniveaus gebundener Zustände. Für einen Topf der Tiefe −V0 = −10 eV und Breite a = 1 nm sind die Wellenfunktionen und die zugehörigen Energieniveaus eines Elektrons in Abb. 3.2 skizziert. Die Wellenfunktionen dringen mit exponentieller Abschwächung in den Bereich |x| > b ein. Das bedeutet, dass das Elektron mit einer gewissen Wahrscheinlichkeit in einem Gebiet gefunden wird, wo seine Gesamtenergie kleiner als die potentielle Energie ist. Das bedeutet keine Verletzung des Energiesatzes, denn das Elektron ist nicht frei, sondern bleibt an den Potentialtopf gebunden. In der klassischen Physik ist das Eindringen in solche “verbotenen” Bereiche nicht möglich. Zwei Grenzfälle sind interessant: (1) Breiter und tiefer Topf. In dem Fall sind die Energie-Eigenwerte ~2 π 2 En + V0 = n2 · 2m a (3.11) Wenn man bedenkt, dass En + V0 = V0 − |En | die Höhe des Energieniveaus über dem Boden des Topfes ist, entspricht dies genau den Energieniveaus im Potentialtopf mit unendlich hohen Wänden. (2) Schmaler und flacher Potentialtopf. Wenn die Breite oder Tiefe des Topfes kleiner wird, gibt es immer weniger gebundene Zustände. Es ist interessant zu beobachten, dass selbst 26 E5 0 0 1 1 2 2 3 3 4 4 5 E3 E4 5 6 6 7 7 8 8 E2 9 E1 10 9 10 2 1 0 1 2 2 x/b 1 0 1 x/b Abbildung 3.2: Links: Die symmetrischen Wellenfunktionen eines Elektrons in einem Potentialtopf endlicher Tiefe mit den zugehörigen Energieniveaus. Rechts: die antisymmetrischen Wellenfunktionen. Parameter: −V0 = −10 eV, a = 2b = 1 nm. bei einem beliebig schmalen und flachen Potential (a → 0, V0 → 0) immer noch ein gebundener Zustand existiert, der eine gerade Wellenfunktion hat. Diese Wellenfunktion erstreckt sich weit über den Rand des Topfes hinaus, siehe Abb. 3.3. Der flache Topf ist ein vereinfachtes Modell eines Donatoratoms in einem Halbleiter. Eine geringe thermische Energie reicht aus, das Elektron aus seiner Bindung zu lösen. Daher gibt es in Arsen-dotierten Siliziumkristallen freie Elektronen, die einen elektrischen Strom transportieren können (siehe die Vorlesung Struktur der Materie). 3.3 Der harmonische Oszillator Annähernd parabolische Potentiale kommen sehr häufig in der klassischen und Quanten-Physik vor, und entsprechend wichtig ist es, den harmonischen Oszillator genau zu verstehen. Das Potential schreiben wir in der Form V (x) = C2 x2 , dabei entspricht C der klassischen Federkonstanten (wir nennen sie nicht k, q um eine Verwechslung mit der Wellenzahl zu vermeiden). Die klassische Kreisfrequenz ist ω = − C m. Die Schrödingergleichung lautet ~2 d2 ψ C 2 + x ψ(x) = Eψ(x) . 2m dx2 2 27 (3.12) 2 1 ψ(x) 0 1 10 0 x/b 10 Abbildung 3.3: Ein flacher Potentialtopf mit nur einem gebundenen Zustand. Der Topf ist blau gezeichnet, die Wellenfunktion rot. Die Tiefe des Topfes beträgt −V0 = −0.8 eV, die Breite a = 2b = 0.3 nm. Die Energie des Elektrons ist E1 = −0.2 eV. Es ist zweckmäßig, eine neue Variable u = ax einzuführen und die Konstante a so zu wählen, dass die Schrödingergleichung einfacher aussieht. Setzen wir r ωm 2E a= , b= , ~ ~ω so ergibt sich die Gleichung ψ 00 (u) − u2 ψ(u) + b ψ(u) = 0 . (3.13) Die Lösungen werden durch eine Kombination von Raten und Konstruieren gefunden, siehe Anhang C. Die diskreten Energie-Eigenwerte lauten En = (n + 1/2) ~ω n = 0, 1, 2, 3, . . . (3.14) Die Wellenfunktionen und die Energieniveaus sind in Abb. 3.4 dargestellt. Der harmonische Oszillator hat äqidistante Energieniveaus, wie sie von Max Planck im Jahr 1900 postuliert wurden. Im Unterschied zur Planckschen Hypothese ist das tiefste Niveau aber nicht null: die sog. Nullpunktsenergie beträgt E0 = 12 ~ω. Selbst für Temperaturen T → 0 sind harmonische Oszillatoren nicht in Ruhe, sondern führen “Nullpunktsschwingungen” aus, die experimentell nachweisbar sind. Die normierten Wellenfunktionen des harmonischen Oszillators lauten r m ω 1/4 1 mω 2 ψn (x) = ·√ · Hn (u) · exp(−u /2) , u = x (3.15) n π~ ~ 2 n! mit H0 (u) = 1 H1 (u) = u 2 H3 (u) = 8u3 − 12u H2 (u) = 4u − 2 ... Bis auf Normierungsfaktoren sind die H(u) mit den Hermite-Polynomen identisch. Die Grundzustandswellenfunktion und alle anderen Wellenfunktionen haben eine endliche Ausdehnung. Dies bedeutet, dass das Teilchen nicht scharf lokalisiert ist. Wir kommen darauf bei der Diskussion der Unschärferelation zurück. Eine weitere interessante Beobachtung ist, dass alle Wellenfunktionen kleine Ausläufer in die Gebiete haben, in denen die Gesamtenergie des Teilches kleiner als die potentielle Energie ist. In der klassischen Mechanik ist so etwas verboten, weil dies eine negative kinetische Energie bedeuten würde. In der Quantenmechanik darf das Teilchen ein bißchen in solche verbotenen Bereiche eindringen, wobei die Wahrscheinlichkeit exponentiell mit wachsender Eindringtiefe abnimmt. 28 3 2 1 0 4 2 0 2 4 u Abbildung 3.4: Die ersten drei Energieniveaus und Wellenfunktionen des harmonischen Oszillators. 3.4 3.4.1 Freie Teilchen, Wellenpakete Ebene Wellen Das einfachste denkbare Potential ist V (x) ≡ 0. Es ist eine der Merkwürdigkeiten der Quantenmechanik, dass dieses scheinbar so einfache Problem zu großen begrifflichen Schwierigkeiten führt. Die Schrödingergleichung eines ungebundenen Teilchens i~ ∂Ψ ~2 ∂ 2 Ψ =− ∂t 2m ∂x2 (3.16) hat die Lösung Ψ(x, t) = A ei(kx−ωt) , ω= ~k 2 E = . ~ 2m (3.17) Je nach Vorzeichen von k ist dies eine nach rechts oder links laufende ebene Welle. Die Energie darf jeden positiven Wert annehmen, es gibt keine Quantisierung. Der Impuls p = ~k ist durch E festgelegt. Für die ebene Wellen hat die Wahrscheinlichkeitsdichte überall im Raum den gleichen Wert ρ = |A|2 . Die Wellenfunktion (3.17) ist daher denkbar ungeeignet, ein lokalisiertes Teilchen wie ein Elektron zu beschreiben. Die Welle hat außerdem die falsche Ausbreitungsgeschwindigkeit, die Phasengeschwindigkeit ist gleich der halben Teilchengeschwindigkeit. vph = ω ~k p v = = = k 2m 2m 2 29 Drittens hat die ebene Welle den gravierenden Nachteil, nicht normierbar zu sein1 . Das Integral Z +∞ 2 −∞ 2 |ψ(x)| dx = |A| Z +∞ dx −∞ ist keineswegs gleich 1, sondern es divergiert für A 6= 0 und ist null für A = 0. 3.4.2 Wellenpakete Wie gelingt es, lokalisierte Teilchen zu beschreiben? Die grundlegende Idee ist, viele dieser ebenen Wellen in geschickter Weise zu überlagern. Man kommt damit zu den sogenannten Wellenpaketen. Z Ψ(x, t) = A(k)eikx−iω(k)t dk . (3.18) Dabei ist A(k) eine von der Wellenzahl abhängige Amplitudenfunktion, und es gilt ω(k) = ~ 2 k . 2m (3.19) Als erstes, einfaches Beispiel wählen wir eine Amplitudenfunktion, die eine schmale um k0 = p0 /~ zentrierte Rechteckfunktion ist: A0 für k0 − ∆k ≤ k ≤ k0 + ∆k (3.20) A(k) = 0 sonst Bei der Berechnung der Wellenfunktion ist zu bedenken, dass ω(k) quadratisch von k abhängt. In der Nähe von k0 kann man dies linearisieren dω ω(k) ≈ ω0 + vg (k − k0 ) mit vg = . (3.21) dk k=k0 Die Grösse vg = dω dk = k=k0 ~k0 = v0 m (3.22) nennt man die Gruppengeschwindigkeit. Sie entspricht der Geschwindigkeit eines Teilchens mit dem Impuls p0 = ~k0 . Das Integral (3.18) kann nun berechnet werden. Ψ(x, t) = A0 e i(k0 x−ω0 )t Z +∆k 0 eik (x−v0 t) dk 0 −∆k mit k 0 = k − k0 Es folgt Ψ(x, t) = 2 A0 ∆k ei(k0 x−ω0 )t sin u u mit u = ∆k(x − v0 t) . (3.23) Die Funktion sin u/u hat ihr Maximum bei u = 0, d.h. bei x = v0 t. Das Wellenpaket wird in Abb. 3.5 gezeigt. Das Maximum wandert mit der Gruppengeschwindigkeit (3.22) nach rechts. Diese ist identisch mit der Teilchengeschwindigkeit v0 , die zum mittleren Impuls p0 gehört. 1 Man kann dies Problem vermeiden, indem man der Wellenfunktion periodische Randbedingungen in einem sehr großen Intervall auferlegt. Dies wird in der quantenmechanischen Beschreibung von Metallen und Halbleitern und bei der Behandlung von Streuprozessen gemacht. 30 6 4 2 0 2 4 6 8 6 4 2 0 2 4 6 8 Abbildung 3.5: Ein Wellenpaket, das einer Rechteckfunktion A(k) entspricht. Gezeigt sind Ψ(x, t) (rot) und ±|Ψ(x, t)| (blau) zum Zeitpunkt t = 0. 3.4.3 Gaussförmiges Wellenpaket Das obige Wellenpaket ergibt schon eine gewisse Lokalisierung des Teilchens, entspricht aber immer noch nicht dem Bild eines wenig ausgedehnten Elektrons. Wir betrachten nun ein Beispiel, das hierfür besser geeignet ist. Der mathematische Aufwand ist größer, der physikalische Gehalt aber ebenfalls. Die räumliche Wahrscheinlichkeitsverteilung werde durch eine Gaussfunktion beschrieben. Wir betrachten zunächst den Zeitpunkt t = 0. Es sei 1 x2 2 ρ(x, 0) = |Ψ(x, 0)| = √ exp − 2 2σx 2π σx Die Wellenfunktion Ψ ist nun wirklich respektabel: sie ist normiert Z +∞ |Ψ(x, 0)|2 dx = 1 −∞ und beschreibt ein Teilchen mit der Ortsunschärfe ∆x = σx . Als weitere Vereinfachung nehmen wir zunächst an, dass das Teilchen ruht, genauer gesagt, dass der mittlere Impuls p0 = ~k0 = 0 ist. Die Amplitudenfunktion A(k) wird in Anhang Anhang C berechnet. Sie ist ebenfalls eine Gaussfunktion. k2 2 2 2 |A(k)| ∝ exp(−k · 2σx ) ≡ exp − 2 , (3.24) 2σk wobei die folgende wichtige Beziehung zwischen den Varianzen besteht 2σk2 = 1 2σx2 ⇒ σx σk = 1 . 2 (3.25) Die Ortsunschärfe des Teilchens ist ∆x = σx , die Impulsunschärfe ∆px = ~σk . Daraus folgt die fundamentale Beziehung ~ (3.26) ∆x · ∆px = 2 31 Dies ist ein Spezialfall der Heisenbergschen Unschärferelation (2.29). Im vorliegenden Fall gilt die Unschärferelation sogar mit dem Gleichheitszeichen: für ein gaussförmiges Wellenpaket erhält man zum Zeitpunkt t = 0 die minimal mögliche Unschärfe zwischen Ort und Impuls. Wenn man jetzt auch noch zulässt, dass k0 6= 0 ist und somit das Wellenpaket ein Teilchen repräsentiert, das sich mit der Geschwindigleit v0 = ~k0 /m bewegt, so folgt aus einer aufwändigen Rechnung, dass das Wellenpaket sich wie gewünscht mit der Geschwindigkeit v0 in x-Richtung bewegt. Es hat aber eine sehr unerfreuliche Eigenschaft: seine Breite nimmt im Laufe der Zeit zu und gleichzeitig sinkt die Höhe ab. Man sagt, das Wellenpaket “zerfließt”, siehe Abb. 3.6. Das Integral, die Fläche unter der Kurve, bleibt invariant. t=0 20 fs 40 fs 60 fs 20 0 20 40 60 80 100 x [nm] Abbildung 3.6: Darstellung eines freien Elektrons mit E = Ekin = 4 eV durch ein gaussförmiges Wellenpaket. Aufgetragen ist die Wahrscheinlichkeitsdichte ρ(x, t) für verschiedene Zeiten (t=0, 20 fs, 40 fs, 60 fs). Das “Zerfließen” des Wellenpakets ist deutlich erkennbar. Das Zerfließen des Wellenpakets bedeutet natürlich nicht, dass auch das Teilchen zerfließt. Vielmehr wird unsere Kenntnis über seine Position im Laufe der Zeit immer ungenauer. Dies Ergebnis kann man anschaulich deuten. Der Impuls des Teilchens ist uns nur mit einer Unschärfe bekannt, und das Gleiche gilt für die Geschwindigkeit. ∆p = ~σk = ~ 2σx ⇒ ∆v = ~ 2mσx Die in der Zeit t zurückgelegte Strecke x(t) = v0 t ± ∆v t hat eine Ungenauigkeit, die linear mit der Zeit anwächst. Das Zerfließen des Wellenpakets ist eine Folge der nichtrelativistischen Mechanik, in der die Geschwindigkeit proportional zum Impuls ist. Bei relativistischen Teilchen ist v ≈ c und nahezu unabhängig vom Impuls. In diesem Fall zerfließt das Wellenpaket nicht. Entsprechendes gilt für elektromagnetische Wellen im Vakuum oder in Kabeln, die wir natürlich nicht mit den Methoden der Quantenmechanik, sondern der Elektrodynamik berechnen (siehe Theorie B). Man kann sehr kurze Wellenpulse durch viele Kilometer lange Koaxialkabel schicken, ohne dass sie sich merklich verbreitern. Die optische Datenübertragung durch Glasfasern beruht wesentlich darauf, dass die Phasengeschwindigkeit bei der für optische Signalübertragung benutzten Wellenlänge 32 von 1550 nm nahezu unabhängig von der Wellenlänge ist und deswegen die kurzen infraroten Lichtpulse nicht zerfließen. 3.5 Potentialschwelle Das Potential sei V (x) = 0 für x < 0 und V (x) = V0 > 0 für x ≥ 0. Das Teilchen soll von links einlaufen mit der Gesamtenergie E > 0. Wir rechnen zur Vereinfachung mit ebenen Wellen und betrachten zunächst den Fall E < V0 . Ein klassisches Teilchen würde bei x = 0 reflektiert werden. Die Lösung der Schrödingergleichung lautet für x < 0 √ 2mE ikx −ikx ψ1 (x) = Ae + Be mit k = ~ Im Bereich x > 0 kann man die Schrödingergleichung − ~2 · ψ 00 + V0 ψ = E ψ 2m umschreiben in 00 2 ψ −α ψ =0 mit p 2m(V0 − E) α= ~ Die Lösung ist ψ2 (x) = C e−αx + D e+αx Die Wellenfunktion muss für x → ∞ verschwinden, daraus folgt D = 0. Am Ort x = 0 müssen ψ und ψ 0 stetig sein: ψ1 (0) = ψ2 (0) ψ10 (0) = ψ20 (0) ⇒ ⇒ A+B =C ik(A − B) = −αC Man kann die Koeffizienten B und C durch A ausdrücken: B= ik + α A, ik − α C= 2ik A. ik − α Das wichtige, vom klassischen Teilchenverhalten abweichende Ergebnis ist: Die Welle dringt mit exponentieller Abschwächung in den “verbotenen” Bereich x > 0 ein. Die Wellenfunktion ist in Abb. 3.7 dargestellt. Wie gross ist die Eindringtiefe δ = 1/α ? Als realistisches Beispiel wählen wir V0 = 5 eV, E = 3 eV und setzen m = me . Dann ergibt sich δ ≈ 0.13 nm, das ist etwa ein Atomdurchmesser. Die de-Broglie-Wellenlänge des Elektrons beträgt hier rund das Fünffache dieses Wertes. Die reflektierte Welle hat die gleiche Amplitude wie die einlaufende Welle, |B| = |A|. Interessant wird der Fall E > V0 . In dem Fall lautet die Wellenfunktion für x > 0 p 0 ψ2 (x) = C eik x mit k 0 = 2m(E − V0 )/~ (wenn die Welle von links einläuft, gibt es im Bereich x > 0 nur eine auslaufende Welle). Aus der Stetigkeit von ψ und ψ 0 bei x = 0 folgt B= k − k0 A, k + k0 C= 33 2k A. k + k0 6 4 2 0 1 0.5 0 0.5 1 x [nm] Abbildung 3.7: Die Wellenfunktion eines Elektrons der Energie E = 3 eV bei der Reflexion an einer Potentialstufe der Höhe V0 = 5 eV. Der wichtige Unterschied zum klassischen Teilchen ist, dass trotz E > V0 ein Teil der Welle reflektiert wird. Der Reflexionskoeffizient (Wahrscheinlichkeit für Reflexion) ist |B|2 k − k0 2 R= = . (3.27) |A|2 k + k0 Zur Berechnung der Transmission müssen wir bedenken, dass die Welle links und rechts eine andere Phasengeschwindigkeit hat: v = ~k/m, v 0 = ~k 0 /m. Die Transmissionswahrscheinlichkeit wird v 0 |C|2 4kk 0 T = = . (3.28) v |A|2 (k + k 0 )2 Es gilt R + T = 1, dies drückt die Erhaltung der Wahrscheinlichkeit aus. Die identischen Formeln erhält man für die Reflexion und Transmission von Licht an der Grenzfläche zwischen zwei Medien mit verschiedenen Brechungsindizes, man muss nur k und k 0 durch n1 und n2 ersetzen. Für senkrechte Inzidenz des Lichts findet man n1 − n2 2 4n1 n2 , T = . R= n1 + n2 (n1 + n2 )2 3.6 Der Tunneleffekt Das Eindringen der Welle in den Bereich E < V (x) eröffnet die Möglichkeit, eine hinreichend dünne Potentialbarriere zu durchtunneln. Wir betrachten den in Abb. 3.8 skizzierten Potentialverlauf und nehmen E < V0 an. Die Wellenfunktionen lauten für die drei Bereiche ψ1 (x) = A eikx + B e−ikx ψ2 (x) = C e +αx ikx ψ3 (x) = F e +De für x < 0 −αx für x > d 34 für 0<x<d Anmerkung: das Teilchen soll von links einlaufen, daher gibt es bei x > d nur eine auslaufende Welle. Allerdings muss man im Zwischenbereich sowohl e+αx wie e−αx zulassen. Die Randbedingung bei x = d ergibt C= α + ik −2αd e D, α − ik F = 2α −αd−ikd e D. α − ik Aus der Randbedingung bei x = 0 folgt A+B = C +D, ik(A − B) = α(C − D) . In den meisten Anwendungen des Tunneleffekts ist e−αd 1. Wegen |C| = e−2αd |D| kann man deswegen C vernachlässigen und erhält D≈ 2ik A. ik − α Die Wellenfunktionen sind in Abb. 3.8 gezeigt. Die Transmissionswahrscheinlichkeit wird 6 4 2 0 1 0.5 0 0.5 1 x [nm] Abbildung 3.8: Demonstration des Tunneleffekts: Die Wellenfunktion eines Elektrons der Energie E = 3 eV vor und hinter einer Potentialschwelle der Höhe V0 = 5 eV und der Dicke d = 0.2 nm. T = |F |2 E E −2αd e . = 16 1 − |A|2 V0 V0 (3.29) Der wesentliche Faktor ist 2p G = exp(−2αd) = exp − 2m(V0 − E) d . ~ Die Tunnelwahrscheinlichkeit hängt exponentiell von der Breite d der Schwelle und dem Energieabstand V0 − E ab. 35 Der Tunneleffekt hat viele Anwendungen in Physik und Technik. Er ist Grundlage des Rastertunnelmikroskops und des SQUID (Superconducting Quantum Interference Device), mit dem kleinste Magnetfelder gemessen werden können und das in der medizinischen Diagnostik eine wichtige Rolle spielt. Die fantastische Auflösung des Rastertunnelmikroskops ist in Abb. 3.9 zu erkennen, in der das Bild der Oberfläche eines Silizium-Einkristalls gezeigt wird. Die einzelnen Si-Atome sind deutlich sichtbar. Abbildung 3.9: Abtastung der Oberfläche eines Silizium-Einkristalls mit einem Rastertunnelmikroskop. Nur mit dem Tunneleffekt kann man verstehen, dass beim radioaktiven α-Zerfall von Atomkernen die Halbwertszeiten ganz extrem von der Energie der α-Teilchen abhängen. Die Zerfallswahrscheinlichkeit eines α-aktiven Kerns ist proportional zum Gamov-Faktor Z 2 r2 p (3.30) G = exp − 2m(V (r) − Eα ) dr ~ r1 Die exponentielle Abhängigkeit der Zerfallswahrscheinlichkeiten von der Energie der α-Teilchen wird in Abb. 3.10 gezeigt, sie lässt sich mit Hilfe der Formel (3.30) verstehen. 3.7 3.7.1 Didaktische Anmerkungen Quantisierung der Energie Ein hervorstechendes Merkmal der Quantenmechanik ist die Quantisierung der Energie. Diskrete Energieniveaus treten immer dann auf, wenn ein Teilchen auf einen endlichen Raumbereich eingeschränkt wird. In der klassischen Mechanik ist die Energie dagegen eine kontinuierliche Variable. Dennoch gibt es auch dort Quantisierungen. Ein wichtiges Beispiel sind Eigenschwingungen. Wir betrachten eine eingespannte Gitarrensaite der Länge a. Die möglichen harmonischen Schwingungsformen sehen genau wie die Wellenfunktion des Teilchens im Potentialtopf aus (Abb. 3.1). Wie schon gesagt, sind die zugrunde liegenden Differentialgleichungen (die Wellengleichung bzw. die Schödingergleichung) und die Randbedingungen mathematisch identisch. Die Quantisierungsbedingung (3.5) der Wellenlänge tritt in beiden Fällen auf. Für die Saite folgt daraus die Quantisierung der Frequenz: die Grundfrequenz ist f1 = v/λ1 , wobei v die Schallgeschwindigkeit in der Saite ist. Die Frequenzen der Obertöne sind fn = nf1 . Die 36 1 Zerfallswahrscheinlichkeit 0.1 0.01 1 . 10 3 1 . 10 4 1 . 10 5 1 . 10 6 1 . 10 7 1 . 10 8 5 5.1 5.2 5.3 5.4 5.5 5.6 Energie in MeV Abbildung 3.10: Experimentelle Daten zum α-Zerfall von Plutonium (Pu238 ) in den Grundzustand und verschiedene angeregte Zustände von Uran (U234 ). Aufgetragen (auf einer logarithmischen Skala) ist die relative Zerfallswahrscheinlichkeit als Funktion der α-Energie in MeV. Die exponentielle Abhängigkeit ist deutlich erkennbar. Amplitude der Saitenschwingung ist kontinuierlich einstellbar, und die Energie der Schwingung ist proportional zum Quadrat der Amplitude. Eine ruhende Saite hat die Schwingungsenergie null. Das Teilchen im Potentialtopf hat immer eine von null verschiedene Minimalenergie, die Nullpunktsenergie. Freie Teilchen, die sich bis ins Unendliche entfernen können, haben auch in der Quantenmechanik eine kontinuierlich veränderbare Energie. Dies betrifft beispielsweise Elektronen, die durch Ionisation von Atomen getrennt werden. Stellt man die Bedingung auf, dass die Teilchen sich nicht bis ins Unendliche, sondern nur bis zu einer extrem großen Entfernung frei bewegen können, so ist ihre Energie im Prinzip zwar quantisiert, aber die Niveaus liegen so dicht, dass sie quasi-kontinuierlich erscheinen. 3.7.2 Der Tunneleffekt in der Schule Abbildung 3.11: Demonstration des Tunneleffekts. Mikrowellen mit einer Wellenlänge λ von etwa 3 cm werden in einem Paraffin-Prisma durch Totalreflexion um 90◦ abgelenkt. Nähert man ein zweites Prisma bis zu einem Abstand d λ, so läuft die Mikrowellenstrahlung geradeaus. Mit Mikrowellen kann der Tunneleffekt sehr schön demonstriert werden. Dazu wählen wir einen Aufbau, bei dem die Mikrowellen in einem Paraffinprisma total reflektiert und um 90◦ 37 abgelenkt werden (Abb. 3.11). Bringt man ein zweites Prisma bis auf wenige Millimeter an die Grenzfläche heran, an der die Totalreflexion stattfindet, so läuft die Mikrowellenstrahlung einfach geradeaus, die um 90◦ abgelenkte Welle wird stark unterdrückt. Die Erklärung ist, dass die elektromagnetische Welle ein wenig in den “verbotenen” Bereich jenseits der Paraffin-LuftGrenze eindringt und dort eine exponentielle Abschwächung erleidet. Ist diese verbotene Zone wesentlich schmaler als die Wellenlänge, so merkt die Mikrowelle kaum etwas von dieser Zone und geht praktisch ungehindert in das zweite Paraffinprisma über. Mit wachsender Breite des Luftspalts wächst der total reflektierte Anteil auf Kosten des transmittierten Anteils rasch an. 38 Kapitel 4 Grundlegende Konzepte der Quantenmechanik In diesem Kapitel betrachten wir zur Vereinfachung der Schreibweise nur die eindimensionale Schrödingergleichung, um daran die grundlegenden Konzepte der Quantenmechanik zu erklären. Ein Grundprinzip der Quantentheorie ist, dass alle physikalischen Messgrößen, auch “Observable” genannt, durch Operatoren repräsentiert werden. Die möglichen Messwerte sind genau die Eigenwerte dieser Operatoren. Dies soll am Beispiel des Hamilton-Operators sowie des Ortsund Impuls-Operators verdeutlicht werden. Im Anhang D wird der Begriff des Operators näher erklärt. 4.1 Hamilton-Operator Die eindimensionale Schrödingergleichung schreiben wir in der Form ~2 d2 − + V (x) ψ(x) = E ψ(x) . 2m dx2 (4.1) Die Grösse in der eckigen Klammer ist nicht ein multiplikativer Faktor, sondern ein Operator, also eine Rechenvorschrift, die auf die Wellenfunktion angewandt wird. Dieser Operator wird Hamilton-Operator genannt und ist der wichtigste Operator der Quantenmechanik 2 2 b = − ~ d + V (x) . H 2m dx2 (4.2) Die Schrödingergleichung lautet dann b Hψ(x) = Eψ(x) . (4.3) b n (x) = En ψn (x) . Hψ (4.4) Die Anwendung eines Operators auf eine Funktion liefert in der Regel eine andere Funktion, siehe Anhang D. Eine Gleichung, bei der links ein Operator auf eine Funktion angewandt wird und rechts dieselbe Funktion steht, multipliziert mit einer Konstanten, nennen wir eine Eigenwertgleichung. Die Funktionen, die die Gleichung erfüllen, heissen die Eigenfunktionen des Operators, die rechts stehenden Konstanten sind die Eigenwerte. Die Lösung der Schrödingergleichung ist gleichbedeutend damit, die Eigenfunktionen ψn des Hamiltonoperators und die zugehörigen Eigenwerte En zu bestimmen. 39 Die Festlegung der Randbedingungen, beispielsweise das Verschwinden der Wellenfunktion außerhalb eines Potentialtopfs, ist Teil der Definition des Hamiltonoperators. Ein grundlegendes Postulat der Quantenmechanik lautet: Die möglichen Energiewerte eines Systems sind genau die Eigenwerte En des Hamiltonoperators dieses Systems, die zugehörigen Wellenfunktionen sind genau die Eigenfunktionen ψn . Nicht nur die Energie, sondern auch alle anderen physikalischen Messgrößen werden durch Operatoren repräsentiert. Was ist die Motivation dafür? Die gesamte Information, die uns über ein Teilchen oder ein System von Teilchen zur Verfügung steht, steckt in der Wellenfunktion ψ. Die Operatoren holen gewissermaßen die physikalischen Messgrößen aus der Wellenfunktion heraus. Der Impuls- und Ortsoperator werden im nächsten Abschnitt besprochen, die Diskussion der Operatoren von Bahndrehimpuls und Spin verschieben wir auf Kap. 5. 4.2 4.2.1 Impuls- und Orts-Operator Impuls-Operator Ein Teilchen mit wohldefiniertem Impuls hat eine präzise festgelegte Wellenlänge λ = 2π~/p. Es muss daher durch eine ebene Welle beschrieben werden Ψ(x, t) = Aei(kx−ωt) . Die Anwendung des Impuls-Operators muss den Messwert p = ~k ergeben. Daraus folgt für die x-Komponente des Operators ∂ pbx = −i~ (4.5) ∂x Die Eigenfunktionen von pbx sind die ebenen Wellen exp(i(kx − ωt)), die Eigenwerte sind ~k. Sie sind nicht quantisiert, es sei denn, man schreibt gewisse Randbedingungen vor wie z.B. eine räumliche Periodizität der Wellenfunktion. In dem Fall lassen sich Funktionen auch normieren. Dreidimensional gilt ∂x ∂ b = −i~∇ = −i~ ∂y mit ∂x ≡ p etc (4.6) ∂x ∂z b Hier haben wir den Nabla-Operator ∇ eingeführt. Die Eigenfunktionen und Eigenwerte von p sind exp(i(k · r − ωt)) und p = ~k . 4.2.2 Orts-Operator Wenn schon die Impuls-Eigenfunktionen problematisch sind, so trifft das in noch stärkerem Maße auf die Eigenfunktionen des Ortsoperators zu. Dieser Operator soll bei Anwendung auf die Wellenfunktion den Ort des Teilchens ergeben. Bei keiner der bisher betrachteten Wellenfunktionen (Potentialtopf, Oszillator, Wellenpaket) ist dies der Fall, denn sie haben alle eine endliche räumliche Ausdehnung. Überall dort, wo |ψ(x)|2 6= 0 ist, darf sich das Teilchen aufhalten. Man kann nur eine Wahrscheinlichkeit angeben, das Teilchen an einem bestimmten Ort zu finden, aber nicht mit Sicherheit diesen Ort vorhersagen. Damit ein scharfer Orts-Eigenwert herauskommt, muss die Wellenfunktion offensichtlich auf einen infinitesimalen Ortsbereich eingeschränkt sein. Keine “normale” Funktion erfüllt diese Bedingung, sondern nur die Dirac-Delta-Funktion, die im mathematischen Sinn eine verallgemeinerte Funktion (Distribution) ist. 40 Um eine Funktion zu konstruieren, die den Ort eines Teilchens sehr genau festlegt, beginnen wir mit einem gaussförmigen Wellenpaket bei x = x0 , dessen Breite wir dann gegen null gehen lassen. Als Wahrscheinlichkeitsdichte nehmen wir also 1 (x − x0 )2 √ ρ(x) = exp − 2σ 2 2π σ und betrachten anschliessend den Limes σ → 0. Mit abnehmender Breite wächst die Höhe an, so dass das Integral unter der Kurve immer den Wert 1 hat (s. Kap. 3.4.3). Eine mögliche Definition der Dirac-Deltafunktion ist 1 (x − x0 )2 (4.7) δ(x − x0 ) = lim √ exp − σ→0 2σ 2 2π σ Für hinreichend kleines σ ist die zu ρ(x) gehörige Wellenfunktion näherungsweise eine Eigenfunktion des Ortsoperators mit dem Eigenwert x0 , nämlich genau dem Ort, an dem ψ(x) 6= 0 ist x b ψ(x) ≈ x0 ψ(x0 ) . (4.8) 4.3 Dirac-Notation und Skalarprodukt Von Paul Dirac stammt eine sehr nützliche Notation zur Charakterisierung quantenmechanischer Zustände. Jeder Wellenfunktion ψ wird ein Vektor |ψi zugeordnet, der “ket”-Vektor genannt wird. Einer konjugiert komplexen Wellenfunktion φ∗ wird ein Vektor hφ| zugeordnet, den man “bra”-Vektor nennt. Wenn wir an normale Vektoren denken, so ist der ket ein Spalten- und der bra ein Zeilenvektor. Es wird ein Skalarprodukt definiert durch Z +∞ hφ | ψi = φ∗ (x)ψ(x) dx . (4.9) −∞ Dies Skalarprodukt hat das Aussehen einer Klammer (“bracket”), der bra-Vektor bildet die linke Seite, der ket-Vektor die rechte Seite der Klammer. Das Skalarprodukt ist im Allgemeinen eine komplexe Zahl. Es gilt Z +∞ hψ | φi = −∞ ψ ∗ (x)φ(x) dx = hφ | ψi∗ . (4.10) Setzen wir speziell φ = ψ, so erhalten wir die Norm, die natürlich eine reelle Zahl ist und bei korrekter Normierung der Wellenfunktion den Wert 1 hat. Z +∞ hψ | ψi = ψ ∗ (x)ψ(x) dx = 1 . (4.11) −∞ Wichtig sind die Skalarprodukte der Eigenfunktionen des Hamiltonoperators: Z +∞ ∗ hψm | ψn i = ψm (x)ψn (x) dx = δmn . (4.12) −∞ Dabei ist δmn das Kroneckersymbol: δmn = 1 für m = n und δmn = 0 für m 6= n. Die Eigenfunktionen sind auf eins normiert und paarweise orthogonal. Wir wollen an dieser Stelle anmerken, dass die Dirac-Notation besonders gut für die HilbertraumFormulierung der Quantenmechanik geeignet ist, die in vielen Standard-Lehrbüchern zu finden ist, die wir aber aus Gründen der mathematischen Komplexität in diesem Manuskript nicht diskutieren können. 41 4.4 Das Superpositionsprinzip Eine beliebige Linearkombination der Eigenfunktionen der Hamiltonoperators X X En Ψ(x, t) = cn Ψn (x, t) = cn ψn (x) exp(−i ωn t) mit ωn = ~ n n (4.13) ist eine Lösung der zeitabhängigen Schrödingergleichung, wie man aus folgender Rechnung sieht, bei der Gl. (4.4) benutzt wird: ∂Ψ X ∂Ψn X b b Ψ(x, t) i~ = cn i ~ = cn H Ψn (x, t) = H ∂t ∂t n n Umgekehrt kann man zeigen, dass jede beliebige Lösung der zeitabhängigen Schrödingergleichung sich als Linearkombination (4.13) schreiben lässt. Das Superpositionsprinzip besagt, dass als Wellenfunktionen eines Teilchen nicht nur die Eigenfunktionen in Frage kommen, sondern dass auch alle Linearkombinationen der Form (4.13) zulässig sind. Wie berechnet man die Koeffizienten cn ? Zur Vereinfachung wählen wir den Zeitpunkt t = 0, dann werden alle Faktoren exp(−i ωn t) = 1 und wir erhalten X Ψ(x, 0) ≡ ψ(x) = cn ψn (x) . (4.14) n Zur Berechnung der Koeffizienten nutzen wir aus, dass die ψn (x) als paarweise orthogonale Einheitsvektoren in einem unendlich-dimensionalen Vektorraum aufgefasst werden können. Bilden wir das Skalarprodukt von ψ mit einer speziellen Eigenfunktion ψm , so folgt X X hψm | ψi = cn hψm | ψn i = cn δmn = cm n Also gilt für jeden Wert von m cm = n Z ∗ ψm (x) ψ(x) dx . Berechnen wir die Norm von ψ, so ergibt sich Z a X ψ ∗ (x) ψ(x) dx = |cn |2 = 1 0 (4.15) (4.16) n Daraus wird ersichtlich, dass ein durch die Wellenfunktion ψ(x) beschriebenes Teilchen mit der Wahrscheinlichkeit |cn |2 im Zustand ψn (x) gefunden wird und dass dementprechend bei einer Messung der Energie mit der Wahrscheinlichkeit |cn |2 der Wert En herauskommt. Der Mittelwert der Energie ist X hEi = |cn |2 En . (4.17) n Das Superpositionsprinzip ist die tiefere Ursache für die Verschränkung von Zuständen und die Nichtlokalität der Quantentheorie, auf die in Kap. 9 eingegangen wird. 4.5 4.5.1 Erwartungswerte Erwartungswerte als gewichtetes Mittel der Eigenwerte Das Konzept, Observable durch Operatoren darzustellen, deren Eigenwerte die einzig möglichen Messwerte der physikalischen Grösse sind, erweist sich als nicht hinreichend, alle denkbaren physikalischen Fragestellungen zu beantworten. Die Zustände mit wohldefinierter Energie werden 42 durch die Eigenfunktionen des Hamilton-Operators beschrieben, die aber in den meisten Fällen nicht gleichzeitig Impuls- oder Orts-Eigenfunktionen sind. Wir haben oben gesehen, dass die Eigenfunktionen des Impuls- und Ortsoperators etwas pathologische Funktionen sind: die ersteren sind unendlich ausgedehnte ebene Wellen, die zweiten sind extrem schmale und entsprechend sehr hohe Funktionen, die im Limes verschwindender Breite gegen die Deltafunktion streben. Diese Eigenfunktionen unterscheiden sich stark von der Wellenfunktion eines Teilchens im Potentialtopf oder im Oszillatorpotential. Was tut man nun, wenn man theoretisch vorhersagen möchte, was bei der Messung des Ortes oder Impulses eines Teilchens herauskommt? Es erweist sich als zweckmäßig, den Begriff des Eigenwertes zu verallgemeinern. Man kommt damit zum Erwartungswert. Die Wellenfunktion des Teilchens sei ψ(x). Wir definieren den Erwartungswert eines Operab im Zustand ψ durch das Integral tors A Z +∞ b ψ(x) dx . b b ψ ∗ (x)A (4.18) hAi ≡ hψ|A|ψi = −∞ Wir wenden diese Beziehung zunächst auf den Hamilton-Operator an und wählen für ψ eine Eigenfunktion ψn . Z +∞ Z +∞ ∗ b b hψn |H|ψn i = ψn (x)H ψ(x)n dx = ψn∗ (x)En ψ(x)n dx = En . (4.19) −∞ −∞ Wenn ein Eigenzustand vorliegt, ist der Erwartungswert somit identisch mit dem Eigenwert. b an Im zweiten Beispiel setzen wir ψ als Linearkombination von zwei Eigenfunktionen von H ψ(x) = c1 ψ1 (x) + c2 ψ2 (x) |c1 |2 + |c1 |2 = 1 . mit Diese Wellenfunktion ist auf 1 normiert, und man erhält b b 1 i + |c2 |2 hψ2 |H|ψ b 2i hψ|H|ψi = |c1 |2 hψ1 |H|ψ b 2 i + c∗ c1 hψ2 |H|ψ b 1i + c∗ c2 hψ1 |H|ψ 1 2 = |c1 |2 E1 + |c2 |2 E2 . (4.20) Hier haben wir die Gleichung (4.19) und die Orthogonalität von ψ1 und ψ2 ausgenutzt. Die Gleichung (4.20) besagt, dass bei einer Messung der Energie entweder der Eigenwert E1 gefunden wird (mit der Wahrscheinlichkeit |c1 |2 ) oder der Eigenwert E2 mit der Wahrscheinlichkeit |c2 |2 . Der Erwartungswert ist das mit den relativen Wahrscheinlichkeiten gewichtete Mittel der Eigenwerte. 4.5.2 Erwartungswerte des Orts- und Impuls-Operators Wenden wir (4.18) auf den Ortsoperator an, so ergibt sich hb xi = Z +∞ ∗ ψ (x)b x ψ(x) dx = −∞ Z +∞ −∞ x |ψ(x)|2 dx . (4.21) Das Ergebnis ist der mit der Wahrscheinlichkeitsdichte gewichtete Mittelwert des Teilchenortes. Für den Impulsoperator folgt entsprechend Z +∞ ∂ψ(x) hb px i = ψ ∗ (x)(−i~) dx . (4.22) ∂x −∞ 43 Setzt man die Fourierdarstellung für ψ(x) ein, so folgt Z +∞ Z +∞ ∂(exp(ipx x/~)) i~ ∗ ψ (x) φ(px ) hb px i = − √ dpx dx ∂x 2π~ −∞ −∞ Z +∞ Z +∞ 1 ∗ ψ (x) exp(ipx x/~) dx px φ(px ) dpx = √ 2π~ −∞ −∞ Z +∞ px |φ(px )|2 dpx . = −∞ Diese letzte Umrechnung zeigt, dass man den Mittelwert des Impulses erhält, gewichtet mit der Wahrscheinlichkeitsdichte im Impulsraum (der Impulsraum wird in Anhang D eingeführt). Aus dieser Umrechnung lernen wir außerdem, dass der Impulsoperator zwei verschiedene Darstellungen hat: ∂ pbx ∼ = −i~ ∂x pbx ∼ = px Differentiation im Ortsraum (4.23) Multiplikation mit px im Impulsraum Analog dazu hat auch der Ortsoperator zwei Darstellungen: x b ∼ = x 4.6 Multiplikation mit x im Ortsraum ∂ x b ∼ = i~ ∂px (4.24) Differentiation im Impulsraum Nicht vertauschbare Operatoren, Unschärferelation 4.6.1 Definition des Kommutators Die Multiplikation von Zahlen genügt dem Kommutativgesetz: a · b = b · a. Bei Matrizen ist das anders, das Ergebnis hängt von der Reihenfolge der Faktoren ab. Ein Beispiel 0 1 0 1 1 0 = · −1 0 1 0 0 −1 0 1 1 0 0 −1 · = 1 0 0 −1 1 0 Die Nichtvertauschbarkeit gilt auch für viele Operatoren der Quantentheorie. Besonders wichtig ist die Nichtvertauschbarkeit des Orts- und Impuls-Operators. ∂ψ ∂x ∂(x · ψ(x)) ∂ψ pbx (b xψ(x)) = −i~ = −i~ x · − i~ ψ(x) ∂x ∂x x b (b px ψ(x)) = −i~ x · Es folgt (b x pbx − pbx x b)ψ(x) = i~ ψ(x) (4.25) [b x, pbx ] = x b pbx − pbx x b = i~ (4.26) Man definiert den Kommutator der beiden Operatoren durch Der Kommutator ist selbst ein Operator, in diesem Fall der Einheitsoperator, multipliziert mit i~. Die beiden nicht vertauschbaren Operatoren haben sehr verschiedene Eigenfunktionen: die infinitesimal schmalen Deltafunktionen und die unendlich ausgedehnten ebenen Wellen. 44 4.6.2 Vertauschbare Operatoren und gleichzeitige Messbarkeit Wie wir gerade gesehen haben, sind der Orts- und Impulsoperator sind nicht vertauschbar. Ort und Impuls können nicht gleichzeitig präzise Werte annehmen, man nennt sie inkompatible Observable. Wie steht es nun mit Messgrößen, deren Operatoren vertauschbar sind? Ein grundlegendes Theorem der Quantenmechanik lautet: Zwei Observable sind genau dann kompatibel (d.h. sie können gleichzeitig präzise Werte annehmen), wenn die zugehörigen Operatoren vertauschbar sind. Das wiederum ist gleichbedeutend damit, dass die beiden Operatoren einen vollständigen Satz gemeinsamer Eigenfunktionen besitzen. Auf den Beweis gehen wir in Anhang D ein. 4.6.3 Die Unschärferelation Die Unschärfe einer Observablen (Messgröße) A im Quantenzustand |ψi soll jetzt präzise defib und seines niert werden. Dazu berechnen wir die Erwartungswerte des zugehörigen Operators A 2 b =A b·A b (zweimalige Anwendung des Operators): Quadrates A b ≡ hψ|A|ψi b hAi = b2 i ≡ hψ|A b2 |ψi = hA Z +∞ −∞ Z b ψ ∗ (x)Aψ(x) dx +∞ −∞ b2 ψ(x) dx ψ ∗ (x)A Die Unschärfe ist dann wie folgt definiert r q 2 b − hAi b b2 i − hAi b2. ∆A = h A i = hA (4.27) b und B. b Man kann Gegeben seien nun zwei nicht vertauschbare selbstadjungierte Operatoren A dann generell beweisen, dass das Produkt der Unschärfen dieser Operatoren die folgende Ungleichung erfüllt 1 b B b ]i| . ∆A · ∆B ≥ |h[ A, (4.28) 2 Dies ist die Unschärferelation von Werner Heisenberg in ihrer allgemeinsten Form. Hat speziell der Kommutator die Form b B b] = i~, [ A, so folgt ∆A · ∆B ≥ ~ . 2 Die Anwendung auf die Orts-und Impulsoperatoren ergibt ∆x · ∆px ≥ ~ , 2 ∆y · ∆py ≥ ~ , 2 ∆z · ∆pz ≥ ~ . 2 (4.29) Wir werden später sehen, dass die Komponenten des Drehimpuls-Operators nicht kommutieren und die Unschärferelation (4.28) erfüllen. Zu beachten ist, dass verschiedene Komponenten des Orts- und Impulsoperators, beispielsweise x b und pby , vertauschbar sind, so dass im Prinzip die x-Koordinate eines Teilchens und die y-Komponente seines Impulses gleichzeitig präzise messbar sind. 45 4.6.4 Energie-Zeit-Unschärfe Es gibt noch eine weitere Unschärfebeziehung, die aber in den Standard-Werken der Quantenmechanik nicht mit Hilfe eines Kommutators hergeleitet wird1 . Dies ist die Energie-Zeit-Unschärfe: ∆E · ∆t ≥ ~ . (4.30) Man kann sich diese Beziehung mit Hilfe der Fouriertransformation zwischen Frequenz und Zeit plausibel machen. Wir betrachten als Beispiel einen elektrischen Spannungsimpuls U (t), der eine kurze zeitliche Dauer ∆t hat. Die Fouriertransformierte ist Z +∞ 1 Ũ (ω) = √ U (t) exp(−iωt) dt . 2π −∞ Die Frequenzbandbreite ∆ω ist umgekehrt proportional zur Zeitdauer ∆t. Wählen wir für U (t) eine Gaussfunktion der Varianz σt2 , so ist Ũ (ω) ebenfalls eine Gaussfunktion (siehe Anhang A.4), und für die Varianz gilt σω2 = 1/σt2 . Benutzen wir E = ~ω, so folgt für dieses Beispiel ∆E ∆t = ~ . Anwendung auf stationäre Zustände In einem stationären Zustand hat die Energie einen wohldefinierten Wert, und die Wellenfunktion ist Eigenfunktion des Hamiltonoperators. E b = Eψ. Ψ(x, t) = ψ(x) exp −i t , Hψ ~ Die Enegieunschärfe ist null. Das Teilchen wird, sofern keine Störung eintritt, für immer in diesem Zustand bleiben. Die “Lebensdauer” ist also unendlich gross. Die stationären Zustände sind demnach gekennzeichnet durch ∆E → 0 und ∆t → ∞ und sind mit der Energie-Zeit-Unschärferelation in Einklang. Lebensdauer und Energiebreite von instabilen Zuständen Interessant wird die Energie-Zeit-Unschärferelation für Zustände, die sich zeitlich ändern. Besondere Bedeutung haben die radioaktiven Zerfälle instabiler Atomkerne und Elementarteilchen sowie die Zerfälle angeregter Atomniveaus. Die Behandlung dieser Vorgänge geht im Prinzip über den Rahmen der nichtrelativistischen Quantenmechanik hinaus und erfordert eine Quantentheorie des Strahlungsfeldes. Der radioaktive Zerfall ist dadurch gekennzeichnet, dass die Anzahl der noch nicht zerfallenen Kerne exponentiell abnimmt N (t) = N0 exp(−t/τ ) . 1 (4.31) In neueren Arbeiten wird die Energie-Zeit-Unschärferelation hergeleitet, siehe z.B. R. Brunetti und K. Fredenhagen, Remarks on time-energy uncertainty relations, Rev. Math. Phys. 14, 897 (2002). 46 Die mittlere Lebensdauer τ ist die Zeit, in der die Zahl von N0 auf N0 /e = 0.37 N0 abgesunken ist. Ein zeitlich zerfallendes System hat automatisch eine Energieunschärfe, die man bei Elementarteilchen mit Γ bezeichnet. Es gilt die wichtige Gleichung Γ·τ =~. (4.32) Angeregte atomare Niveaus weisen ebenfalls diese Unschärfe auf, während der Grundzustand stabil und energetisch scharf ist. Eine Konsequenz der Gleichung (4.32) ist, dass die Spektrallinien der Atome alle eine endliche Breite haben. 4.7 Korrespondenzprinzip und Ehrenfest-Theorem Die relativistische Mechanik geht im Grenzfall kleiner Geschwindigkeiten in die klassische Newtonsche Mechanik über. Bei der Entwicklung der Quantentheorie vom Bohrschen Atommodell bis hin zur Schrödingergleichung war den Theoretikern bewusst, dass die neue Theorie in analoger Weise in die klassische Physik übergehen sollte, wenn man sie auf makroskopische Körper anwendet. Das Korrespondenzprinzip und das Ehrenfest-Theorem waren wichtige Leitlinien bei der Entwicklung der Quantentheorie. Der Inhalt des Korrespondenzprinzips ist, dass die Quantenmechanik im Limes großer Quantenzahlen in die klassische Physik übergeht. Dies Prinzip hat bei der Entwicklung eines quantentheoretischen Atommodells eine wichtige Rolle gespielt. Wir kommen in Kap. 6 darauf zurück. Das Ehrenfest-Theorem besagt, dass die Erwartungswerte den klassischen Bewegungsgleichungen genügen. Als Beispiel für das Ehrenfest-Theorem betrachten wir ein bewegtes Teilchen, beschrieben durch ein Wellenpaket. Die Wahrscheinlichkeitsdichte wird zeitabhängig und auch die Erwartungswerte haben eine Zeitabhängigkeit. Der Erwartungswert des Ortes ist hb xi = Z +∞ ∗ Ψ (x, t)b x Ψ(x, t) dx = −∞ Z +∞ x ρ(x, t) dx . (4.33) −∞ Wir bilden jetzt die zeitliche Ableitung dhb xi = dt Z +∞ x −∞ ∂ρ dx ∂t und setzen die Kontinuitätsgleichung (B.5) ein: dhb xi i~ = dt 2m Z +∞ −∞ ∂ x ∂x ∂Ψ∗ ∂Ψ Ψ − Ψ∗ ∂x ∂x dx . Partielle Integration ergibt dhb xi i~ = dt 2m Z +∞ −∞ ∂Ψ∗ ∂Ψ Ψ − Ψ∗ ∂x ∂x dx . Hierbei haben wir ausgenutzt, dass die Wellenfunktion an den Integrationsgrenzen ±∞ verschwindet. Wenn man den ersten Term noch einmal partiell integriert und die ganze Gleichung mit der Masse m multipliziert, folgt die wichtige Beziehung dhb xi = m dt Z +∞ −∞ ∂Ψ Ψ (−i~) dx = ∂x ∗ 47 Z +∞ −∞ Ψ∗ pbx Ψ dx ≡ hb px i . (4.34) Für die Erwartungswerte gilt daher die klassische Beziehung mvx = px . Die Zeitabhängigkeit des Erwartungswertes des Impulses wird analog berechnet mit dem Ergebnis dhb px i ∂V =− ≡ Fx , dt ∂x (4.35) d.h. die zeitliche Änderung des Impulses ist gleich der wirkenden Kraft, genau wie in der klassischen Mechanik. 4.8 Berechnung von Erwartungswerten 4.8.1 Potentialtopf Der Grundzustand eines Teilchens im Potentialtopf mit unendlich hohen Wänden hat die Wellenfunktion r π x 2 Ψ1 (x, t) = sin exp(−iωt) . a a Dies ist eine Eigenfunktion des Hamilton-Operators, die Energie hat den scharfen Wert E1 = ~2 π 2 2m a2 Die Lebensdauer τ ist unendlich. Der Erwartungswert der Energie stimmt mit dem Eigenwert überein, die Energieunschärfe ist ∆E1 = 0. Wie steht es mit anderen Messgrössen? Die Funktion Ψ(x, t) ist sicherlich keine Eigenfunktion des Orts- oder Impuls-Operators. Der Erwartungswert des Ortsoperators ist Z 2 a hb xi = x sin2 (π x/a) dx = a/2 . a 0 Der Mittelwert des Teilchenortes ist also x = a/2, genau die Mitte des Potentialtopfs. Der Erwartungswert von x b2 ist Z 2 a 2 2 hb x i= x sin2 (π x/a) dx = 0.283 a2 . a 0 Es folgt ∆x = p hb x2 i − hb xi2 = 0.18 a Der Erwartungswert der x-Komponente des Impulses ist null Z 2 a ∂ sin(π x/a) hb px i = −i~ sin(π x/a) dx = 0 , a 0 ∂x denn die Funktion sin(kx) = (exp(ikx) − exp(−ikx))/(2i) ist die Linearkombination von zwei Eigenfunktionen des Impulsoperators. Die Eigenwerte sind ±~k, der Mittelwert ist also null. Der Erwartungswert von pb2x ist Z 2 Z a 2 a ∂ 2 sin(π x/a) ~2 π 2 2 2π 2 hb p2x i = −~2 sin(π x/a) dx = ~ sin (π x/a) dx = . a 0 ∂x2 a3 0 a2 p Wir erhalten ∆px = hb p2x i = ~π/a und ∆px ∆x = 0.57~ > ~/2 . 48 4.8.2 Der harmonische Oszillator 2 Auch in diesem Fall soll der p Grundzustand ψ0 näher analysiert werden. Die Funktion exp(−u /2) ist symmetrisch zu u = mω/~ · x = 0. Daher ist anschaulich klar, dass der Erwartungswert von x b null sein muss. Mathematisch folgt das aus der Beobachtung, dass x |ψ(x)|2 eine ungerade Funktion von x ist: Z +∞ hxi = x |ψ0 (x)|2 dx = 0 . Den Erwartungswert von hx2 i x b2 −∞ findet man durch partielle Integration Z +∞ x2 |ψ0 (x)|2 dx = −∞ mω 1/2 ~ 3/2 Z +∞ = u2 exp(−u2 ) du π~ mω −∞ Z +∞ d ~ u· = − √ exp(−u2 ) du . du 2 πmω −∞ Wegen Z +∞ exp(−u2 ) du = √ π −∞ folgt ~ . (4.36) 2mω Der Erwartungswert des Impulsoperators pbx ist null, weil - anschaulich gesprochen - das Teilchen gleich häufig nach rechts wie nach links schwingt. Mathematisch: Z +∞ d hb px i = ψ0∗ (x)(−i~) ψ0 (x) dx = 0 . dx −∞ hx2 i = Wieder ist der Integrand eine ungerade Funktion von x. Der Erwartungswert von pb2x wird Z +∞ d2 2 hb px i = − ψ0∗ (x)~2 2 ψ0 (x) dx . dx −∞ Auswertung des Integrals ergibt m~ω . 2 Das Produkt der Unschärfen von Ort und Impuls wird hb p2x i = ∆x · ∆px = √ x b2 · (4.37) p ~ hb p2x i = . 2 (4.38) Im Grundzustand des harmonischen Oszillators hat das Produkt den minimal möglichen, mit der Unschärferelation verträglichen Wert. Für die angeregten Zustände ψn mit n > 0 ergeben sich grössere Unschärfen. Physikalisch interessant sind die Erwartungswerte der kinetischen und potentiellen Energie: hEkin i = hb p2x i ~ω = , 2m 4 hEpot i = hV (x)i = Chb x2 i ~ω = . 2 4 (4.39) Wie beim klassischen Oszillator haben die kinetische und die potentielle Energie im zeitlichen Mittel den gleichen Wert. Diese Relation ist auch für die angeregten Zustände erfüllt. Wie man sieht, ist das Ehrenfest-Theorem auch beim harmonischen Oszillator erfüllt. 49 4.9 Der Messprozess in der Quantenmechanik Die Frage, was bei einer Messung mit der Wellenfunktion eines Teilchens passiert, hat die theoretischen Physiker über Jahrzehnte beschäftigt und zu vielen Kontroversen geführt. Besonders umstritten war, ob die Messapparatur als klassisches Nachweisgerät angesehen werden darf oder ob sie auch quantenmechanisch, also mit Hilfe einer Wellenfunktion behandelt werden sollte. Die meisten Physiker haben in der Vergangenheit dazu geneigt, die Messapparatur als klassisches Nachweisgerät anzusehen (vermutlich weil keine adäquate quantentheoretische Behandlung bekannt ist), aber heute besteht kein Zeifel daran, dass auch Messgeräte den Gesetzen der Quantenmechanik unterliegen. Für eine weiterführende Diskussion dieser sehr komplexen Fragestellung verweisen wir auf Kap. 9. An dieser Stelle wollen wir uns auf die traditionelle Betrachtungsweise beschränken. Ein gutes Beispiel ist das Doppelspaltexperiment: die Wellenfunktion (genauer ihr Absolutquadrat) bestimmt das Interferenzmuster, aber ein einzelnes Quant (Elektron oder Photon) macht nur einen punktförmigen Eintrag in diesem Muster. Nachdem wir das Quant in einem definierten Element unseres Pixeldetektors nachgewiesen haben, hat sich seine Wellenfunktion geändert, denn wir wissen jetzt, dass es sich an einer wohldefinierten Stelle des Interferenzmusters befand. Ein anderes Beispiel: ein Teilchen werde durch die Superposition von drei Eigenfunktionen des Hamilton-Operators beschrieben: ψ(x, t) = c1 ψ1 (x, t) + c2 ψ2 (x, t) + c3 ψ3 (x, t) Die Messung der Energie wird entweder E1 , E2 oder E3 ergeben. Nun machen wir eine Messung und stellen fest, dass E = E2 ist. Dann wissen wir, dass die Wellenfunktion nach der Messung ψ2 sein muss. Diese Änderung der Wellenfunktion als Konsequenz der Messung wird manchmal etwas hochtrabend “Kollaps” der Wellenfunktion genannt. So geheimnisvoll ist das Ganze aber nicht: nach der Messung wissen wir einfach besser Bescheid über das Teilchen. 4.10 Anwendungsbeispiele und didaktische Anmerkungen 4.10.1 Polarisiertes Licht im Quantenbild Die statistische Natur der Quantentheorie tritt auch in der Optik zutage, sobald man sich in das Photonenbild begibt. Licht kann linear polarisiert werden, das bedeutet, der elektrische Vektor schwingt in einer Ebene. Eine horizontal bzw. vertikal polarisierte Welle schreiben wir in der Form E hor (z, t) = E0 cos(kz − ωt)ex , E vert (z, t) = E0 cos(kz − ωt)ey (4.40) Dabei ist k = ω/c = 2π/λ und ex bzw. ey sind die Einheitsvektoren in x- bzw. y-Richtung. Die Ausbreitung des Lichts erfolgt in z-Richtung. Wenn wir horizontal polarisiertes Licht durch eine Polarisationsfolie senden, deren optische Achse um einen Winkel α gegen die horizontale Ebene gedreht ist, so ist die Intensität hinter dem Polarisator I(α) = I0 cos2 α Die Schwingungsebene des Lichts hat sich ebenfalls um diesen Winkel gedreht. Wie interpretieren wir diesen Vorgang im Lichtquantenbild? Die Wahrscheinlichkeitsinterpretation der Quantenmechanik ist auch hier anwendbar. Die Wahrscheinlichkeit, dass ein einlaufendes horizontal polarisiertes Photon die Polarisationfolie passiert, ist w = cos2 α. Wählen wir beispielsweise einen Winkel von 30◦ , so hat jedes Photon eine Chance von 75%, den Polarisator zu durchqueren, und eine Chance von 25%, an der Polarisationsfolie reflektiert zu werden (sofern man 50 Absorption vernachlässigen darf). Mehr als diese Wahrscheinlichkeitsaussagen können wir nicht machen; für ein individuelles Photon ist es unmöglich vorherzusagen, ob es die Polarisationsfolie durchqueren wird oder nicht. Wenn man die beiden orthogonal polarisierten Wellen (4.40) mit einer Phasenverschiebung von ±π/2 vektoriell addiert (dies geht mit einer λ/4-Platte), so erhält man zirkular polarisiertes Licht, bei dem der E-Vektor auf einer Schraubenlinie (Rechts- oder Linksschraube) umläuft. Die Superposition von zwei orthogonalen, linear polarisierten Lichtwellen mit ±π/2-Phasendifferenz führt somit zu rechts- oder linkszirkular polarisierten Wellen, die durch folgende Ausdrücke gegeben sind √ E rechts (z, t) = E0 / 2 [cos(kz − ωt)ex − sin(kz − ωt)ey ] (4.41) √ E links (z, t) = E0 / 2 [cos(kz − ωt)ex + sin(kz − ωt)ey ] In der Sprache der Teilchenphysik werden die zugehörigen Photonen rechtshändig oder linkshändig genannt. Ihre Spinkomponente in Richtung des Impulses ist +~ bzw. −~. Wir haben eine typische Anwendung des Superpositionsprinzips. Umgekehrt ergibt die Superposition einer rechts- und einer linkszirkularen Welle je nach Phasendifferenz eine horizonatel oder vertikal linear polarisierte Welle. Auch diese Vorgänge kann man sich im Quantenbild ansehen. Wenn ein linear polarisiertes Photon auf eine λ/4-Platte trifft, deren optische Achse um 45◦ gegen die Schwingungsebene des einlaufenden Photons gedreht ist, so wandelt sich dieses Photon in ein zirkular polarisiertes Photon um. Schickt man dies zirkulare Photon nun durch eine Polarisationsfolie, so wird daraus wieder ein linear polarisiertes Photon, dessen E-Vektor parallel zur optischen Achse der Folie schwingt. 4.10.2 Das Superpositionsprinzip bei einer Gitarrensaite Abbildung 4.1: Links: dreieckförmiges Zupfen einer Gitarrensaite (rote Kurve). Die harmonische Grundschwingung (blaue Punkte) ist deutlich davon verschieden. Rechts: Approximation durch eine Fourierreihe bis zur Ordnung 7. Die rote Kurve wäre auch eine erlaubte Wellenfunktion eines Teilchens im Potentialtopf. Wir haben schon mehrfach die Analogien zwischen einem quantenmechanischen Potentialtopf und einer schwingenden Saite angesprochen. Das in der Quantenmechanik wichtige Superpositionsprinzip spielt auch bei Musikinstrumenten eine große Rolle. Wenn man eine Gitarrensaite zupft, so wird die Verformung der Saite nicht sinusförmig sein. Beispielsweise können wir uns vorstellen, dass die Saite dreieckförmig gezupft wird, wie in Abb. 4.1 skizziert. Man kann diese Dreieckskurve periodisch fortsetzen und durch eine Fourierreihe darstellen (s. Anhang A.4) 1 1 1 1 4 f (x) = − 2 cos(πx) + 2 cos(3πx) + 2 cos(5πx) + 2 cos(7πx)..... mit k = 2π/λ (4.42) 2 π 3 5 7 Es tritt also nicht nur die Grundfrequenz f1 auf, sondern auch die höheren Harmonischen f3 = 3f1 , f5 = 5f1 usw. Hinzu kommen die Eigenschwingungen des Gitarrenkastens, die den 51 charakteristischen Klang des Instruments ausmachen. In die mathematische Formulierung der Quantenmechanik übersetzt wird durch Gl. (4.42) eine Superpositionswellenfunktion beschrieben. 52 Kapitel 5 Die Drehimpuls-Operatoren Die dreidimensionale Schrödinger-Gleichung spielt eine große Rolle in der Atomphysik. Wir beschränken uns in dieser Vorlesung auf den Spezialfall, p dass ein Zentralpotential vorliegt: V = V (r) hängt nur vom Betrag des Ortsvektors |r| = r = x2 + y 2 + z 2 und nicht von der Richtung im Raum ab. Der Hamilton-Operator 2 2 2 2 ~ ∂ ∂ ∂ b =− H · + + + V (r) (5.1) 2m ∂x2 ∂y 2 ∂z 2 ist dann rotationsinvariant. Dies wird in Anhang E bewiesen. 5.1 Der Operator des Bahndrehimpulses In der klassischen Physik definiert man den Bahndrehimpuls als Vektorprodukt des Orts- und Impulsvektors L=r×p. (5.2) Übertragen auf die Quantentheorie erhalten wir b = rb × pb = −i~ rb × ∇ . L Die drei Komponenten sind ∂ ∂ y −z ∂z ∂y ∂ ∂ = −i~ z −x ∂x ∂z ∂ ∂ = −i~ x −y . ∂y ∂x b x = −i~ L by L bz L (5.3) (5.4) Wir betrachten eine infinitesimale Drehung um die z-Achse um den Winkel ∆ϕ 1 (sin ∆ϕ ≈ ∆ϕ, cos ∆ϕ ≈ 1). Die Koordinaten werden wie folgt transformiert: x0 = x cos ∆ϕ + y sin ∆ϕ ≈ x + y∆ϕ y 0 = −x sin ∆ϕ + y cos ∆ϕ ≈ y − x∆ϕ z0 = z Um die Änderung der Wellenfunktion zu berechnen, verwenden wir die Taylor-Entwicklung: ∂ψ ∂ψ 0 0 0 ψ(x , y , z ) ≈ ψ(x + y ∆ϕ, y − x ∆ϕ, z) ≈ ψ(x, y, z) − x −y · ∆ϕ ∂y ∂x 53 Man kann die Transformation der Wellenfunktion mit Hilfe des Drehimpuls-Operators auch in folgender Form schreiben ψ(x0 , y 0 , z 0 ) = ψ(x, y, z) − i ∆ϕ b Lz ψ(x, y, z) . ~ (5.5) b z der erzeugende Operator für eine infinitesimale Rotation um die z-Achse ist. Man sagt, dass L b x und L b y infinitesimale Rotationen um die x- bzw. y-Achse. Analog erzeugen L 5.2 5.2.1 Drehimpuls-Vertauschungsregeln b Vertauschbarkeit mit H Bei einem Zentralpotential ist der Hamilton-Operator rotationsinvariant, man sollte daher verb kommutiert. Dies ist in der Tat der Fall, es gilt b mit L muten, dass H b L b x ] = [ H, b L b y ] = [ H, b L bz ] = 0 . [ H, (5.6) b L b z ] = 0 wird in Anhang E gebracht. Da H b und Der Beweis der Vertauschungsrelation [ H, b z kommutieren, kann man gemeinsame Eigenfunktionen finden. Aus Symmetriegründen verL b x und L b y mit H. b Man könnte auf die Idee kommen, dass es gemeinsame tauschen auch L b und alle Komponenten des Drehimpuls-Operators gibt. Dies ist jedoch Eigenfunktionen für H nicht der Fall, da diese Komponenten nicht miteinander kommutieren. 5.2.2 Nichtvertauschbarkeit der Drehimpulskomponenten Räumliche Drehungen um orthogonale Achsen sind nicht kommutativ. Dies wird in Abb. 5.1 demonstriert. Daher ist nicht verwunderlich, dass auch die Komponenten des Drehimpulsoperators Abbildung 5.1: Nichtvertauschbarkeit räumlicher Drehungen. Links ist ein Buntstift entlang der xAchse orientiert. Das mittlere Bild zeigt die Lage des Buntstifts, wenn erst eine 90◦ -Drehung um die x-Achse und danach eine 90◦ -Drehung um die y-Achse ausgeführt wird. Das rechte Bild zeigt die Lage bei umgekehrter Reihenfolge der Drehungen. nicht kommutieren. Es gelten die Vertauschungsregeln bx , L b y ] = i~L bz , [L by , L b z ] = i~L bx , [L 54 bz , L b x ] = i~L by . [L (5.7) Wir beweisen die erste Regel: bx , L b y ]ψ(x, y, z) [L ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ 2 = −~ y z − z y ψ(x, y, z) −z −x −x −z ∂z ∂y ∂x ∂z ∂x ∂z ∂z ∂y ∂ψ ∂ψ bz ψ . = i~(−i~) y = i~L −x ∂x ∂y b2 = Es sind aber alle Komponenten mit dem Quadrat des vektoriellen Drehimpuls-Operators L b 2x + L b 2y + L b 2z vertauschbar, wie man aus folgender Rechnung erkennt: L bx L by L by = L by L bx L b y + i~L bz L by = L by L by L b x + i~(L bz L by + L by L bz ) L (5.8) bx L bz L bz = L bz L bx L b z − i~L by L bz = L bz L bz L b x − i~(L by L bz + L bz L by ) . L b 2 und einer Komponente gibt. Die Konsequenz ist, dass es gemeinsame Eigenfunktionen von L Traditionell wählt man dafür die z-Komponente. Diese Funktionen sind dann keine Eigenfunkb x und L by . tionen von L 5.3 5.3.1 Der Drehimpuls in Kugelkoordinaten, Kugelfunktionen Kugelkoordinaten Die Kugelkoordinaten (r, θ, ϕ) sind mit den kartesischen Koordinaten (x, y, z) durch folgende Beziehungen verknüpft (siehe auch Anhang A): x = r sin θ cos ϕ y = r sin θ sin ϕ (5.9) z = r cos θ . Die Umrechnung des Drehimpulses auf Kugelkoordinaten ist aufwändig, siehe Anhang E. Der b z hat eine besonders einfache Form, was damit zusammenhängt, dass bei den KuOperator L gelkoordinaten die z-Achse eine Sonderrolle einnimmt: Der Polarwinkel θ wird zwischen dem Ortsvektor r und der z-Achse gemessen, und bei einer Rotation um die z-Achse ändert sich nur der Azimutalwinkel ϕ. b z = −i~ ∂ (5.10) L ∂ϕ Der Operator des Quadrats des Drehimpulsoperators lautet in Kugelkoordinaten b 2 = −~2 L 1 ∂ sin θ ∂θ sin θ ∂ ∂θ + 1 ∂2 sin2 θ ∂ϕ2 (5.11) Bemerkenswert ist die Tatsache, dass bei den Drehimpuls-Operatoren nur die Winkel-Ableitungen vorkommen und nicht die radiale Ableitung. Es gibt dafür einen einfachen Grund: Die DrehimpulsOperatoren erzeugen räumliche Drehungen, aber keine Radiusänderungen. 55 5.3.2 Die Bahndrehimpuls-Eigenfunktionen b 2 und L b z sind die Kugelfunktionen Yl,m (θ, ϕ). Die Die gemeinsamen Eigenfunktionen von L Eigenwertgleichungen lauten b 2 Yl,m (θ, ϕ) = l(l + 1)~2 Yl,m (θ, ϕ) , L b z Yl,m (θ, ϕ) = m ~Yl,m (θ, ϕ) L (5.12) Die Bahndrehimpulsquantenzahl l kann die ganzzahligen Werte l = 0, 1, 2, 3, .. annehmen, die magnetische Quantenzahl m ist ebenfalls ganzzahlig, und es gilt −l ≤ m ≤ +l. Für l = 0, 1, 2 haben Kugelfunktionen die Gestalt Y0, 0 = Y1, ±1 Y2, ±2 Y2, 0 1 √ 4π r r 3 3 = ∓ sin θ exp(±iϕ) , Y1, 0 = cos θ 8π 4π r r 15 15 2 = sin θ exp(±2iϕ) , Y2, ±1 = ∓ sin θ cos θ exp(±iϕ) 32π 8π r 5 (3 cos2 θ − 1) = 16π Die Kugelfunktionen sind auf 1 normiert: Z 2π Z π ∗ Yl,m (θ, ϕ)Yl,m (θ, ϕ) sin θdθ dϕ = 1 . 0 (5.13) (5.14) 0 Die Quantenzahl m der z-Komponente des Drehimpulses wird magnetische Quantenzahl genannt, weil in vielen atomphysikalischen Experimenten die z-Achse durch die Richtung eines externen Magnetfeldes definiert wird. 5.4 Algebraische Behandlung des Drehimpulses In diesem Abschnitt sollen die wichtigsten Eigenschaften von Drehimpulsen in der Quantenmechanik allein aus den Vertauschungsregeln (5.7) hergeleitet werden. Wir werden dabei entdecken, dass es neben dem Bahndrehimpuls noch eine andere Kategorie von Drehimpuls gibt, den Eigendrehimpuls oder Spin. Diverse Rechenschritte werden an dieser Stelle übergangen, sie sind in Anhang E zu finden. Die algebraische Methode wird in der Kern- und Elementarteilchenphysik verallgemeinert, um den Isospin und das Quark-Modell zu beschreiben. bx , L by , L b z , die den Vertauschungsregeln Betrachtet werden drei Operatoren L bx , L b y ] = i~L bz , [L by , L b z ] = i~L bx , [L bz , L b x ] = i~L by [L (5.15) gehorchen, von denen wir aber nicht voraussetzen, dass sie die spezielle Form (5.4) haben. Dann b 2 kommutieren. kann man leicht nachweisen (s. Gl. (5.8)), dass alle drei Komponenten mit L b 2 und L b z zu finden. Diese Es ist daher möglich, gemeinsame Eigenzustände der Operatoren L Eigenzustände bezeichnen wir mit Dirac-Ket-Vektoren | l, mi, wobei l und m die Quantenzahlen angeben: b 2 | l, mi = l(l + 1)~2 | l, mi , L b z | l, mi = m~| l, mi . L (5.16) Diese Eigenzustände sind Eigenfunktionen (die Kugelfunktionen) im Fall des Bahndrehimpulses und Eigenvektoren im Fall des Spins (s. unten). Im Augenblick wird über die Quantenzahlen 56 l, m keine Voraussetzung gemacht, es können beliebige reelle Zahlen sein, wobei allerdings l ≥ 0 b 2 nicht negativ sein können. sein muss, da die Eigenwerte von L b + und der AbsteigeEs werden nun zwei Leiter-Operatoren definiert: der Aufsteige-Operator L b Operator L− b+ = L b x + iL by , b− = L b x − iL by . L L (5.17) b + genügt den Vertauschungsregeln Der Operator L b z = i~L b+ , b+ − L b+ L bz L L b2 − L b 2L b+ L b+ = 0 L Wenden wir die erste Regel auf eine Eigenfunktion | l, mi an, so ergibt sich folgender Ausdruck: b + | l, mi = L b + (L b z | l, mi + ~| l, mi) = (m + 1)~ L b + | l, mi bz L L b + | l, mi ist eine Eigenfunktion von L b z mit dem Eigenwert (m + 1)~, falls Das bedeutet: L b L+ | l, mi = 6 0 ist: b + | l, mi = C+ (l, m)| l, m + 1i . L (5.18) b + erhöht also die z-Komponente um ∆m = 1. Diese Beobachtung rechtfertigt Der Operator L den Namen Aufsteigeoperator. Allerdings kann das Aufsteigen nicht unbegrenzt weitergehen, denn es gilt m2 ≤ l(l + 1), siehe Anhang E. Daher gibt es ein maximales m = mmax . Wendet b + auf den Zustand | l, mmax i an, so kommt null heraus. man L Für den Absteigeoperator zeigt man entsprechend, dass b − | l, mi = C− (l, m)| l, m − 1i L (5.19) b − | l, mi 6= 0 ist. Die Koeffizienten C+ (l, m), C− (l, m) werden in Anhang E berechgilt, sofern L net. Die Wirkung der Leiteroperatoren ist in Abb. 5.2 dargestellt. √ b + | 1, −1i = ~ 2| 1, 0i, Abbildung 5.2: Wirkung der Leiteroperatoren. Für den Aufsteigeoperator gilt L √ √ b + | 1, 0i = ~ 2| 1, +1i und L b + | 1, +1i = 0. Für den Absteigeoperator finden wir L b − | 1, +1i = ~ 2| 1, 0i, L √ b b L− | 1, 0i = ~ 2| 1, −1i und L− | 1, −1i = 0. Die maximalen und minimalen Werte von m sind mmax = +l und mmin = −l (Anhang E). Die Quantenzahl m nimmt folgende Werte an: m = −l, −l + 1, . . . + l . 57 (5.20) Abbildung 5.3: Links und Mitte: Richtungsquantelung des Drehimpulses. Gezeigt werden die Drehimpulsmultipletts für l = 1 und l = 2. Rechts: Die Lage des Vektors L auf einem Kegelmantel um die z-Achse für l = 1, ml = 1. Dies sind 2l + 1 Werte, d.h. 2l + 1 ist eine positive ganze Zahl. Es gibt zwei Möglichkeiten: a) l ist ganzzahlig, l = 0, 1, 2, . . .. b) l ist halbzahlig, l = 1/2, 3/2, 5/2, . . .. Die ganzzahligen l-Werte gehören zum Bahndrehimpuls (oder auch zum Spin, z.B. bei Photonen), die halbzahligen zum Spin oder Gesamtdrehimpuls. Die Richtungsquantelung des Bahndrehimpulses wird in Abb. 5.3 gezeigt. Die x- und yKomponenten des Drehimpulsvektors sind unbestimmt. Wir können nur sagen, dass der Vektor L irgendwo auf einem Kegelmantel um die z-Achse liegen muss. Das wird für l = 1, m = 1 in Abb. 5.3 gezeigt. 5.5 Der Spin-Operator Die Erde hat zwei Arten von Drehimpuls: den Bahndrehimpuls infolge der Bewegung um die Sonne und den Eigendrehimpuls, der mit der Rotation um die Achse verbunden ist. Elektronen, Protonen und Neutronen besitzen ebenfalls einen Eigendrehimpuls, den man Spin nennt und der im Unterschied zum Bahndrehimpuls durch eine halbzahlige Quantenzahl s = 1/2 beschrieben wird. Es gibt einen wichtigen Unterschied zwischen dem Eigendrehimpuls der Erde und dem Spin eines Elementarteilchens. Denkt man sich die Erdkugel in kleine Massenelemente aufgeteilt, so ist der Eigendrehimpuls die Summe der Bahndrehimpulse dieser Massenelemente bei der Rotation um die Erdachse. Man darf sich aber das Elektron nicht als rotierende Kugel vorstellen, denn das führt auf ernsthafte Widersprüche. Nach heutigem Wissen ist das Elektron ein praktisch punktförmiges Teilchen, die Messungen am Elektron-Positron-Speicherring PETRA ergaben eine obere Grenze für den Radius von 10−18 m. Um einen Drehimpuls der Grösse ~/2 aufzubringen, müsste eine Kugel mit r = 10−18 m so schnell rotieren, dass am Äquator die Lichtgeschwindigkeit um ein Vielfaches überschritten würde. Der Spin ist ein relativistischer Effekt (siehe Theorie B). Trotz der Schwierigkeiten mit der Veranschaulichung besteht kein Zweifel daran, dass auch der Spin gewisse Eigenschaften eines 58 mechanischen Drehimpulses aufweist. Der experimentelle Beweis wurde durch ein von Einstein vorgeschlagenes und von de Haas ausgeführtes Experiment erbracht. Ein an einem dünnen Torsionsfaden hängender magnetisierter Eisenstab konnte durch Ummagnetisieren (gekoppelt mit Umklappen der Spins) in Rotation versetzt werden. Für den Spin-Operator kann man die Vertauschungsregeln des Drehimpulses nicht beweisen, vielmehr werden die Regeln postuliert [Sbx , Sby ] = i~Sbz , [Sby , Sbz ] = i~Sbx , [Sbz , Sbx ] = i~Sby . (5.21) Diese Regeln sind hinreichend um zu beweisen, dass jede Komponente mit dem Quadrat des Spin-Operators vertauscht, die Rechnung verläuft genau wir bei Eq.(5.8). b2 ] = [Sby , S b2 ] = [Sbz , S b2 ] = 0 . [Sbx , S (5.22) b 2 und Sbz bezeichnen wir mit |s, ms i. Die gemeinsamen Eigenzustände von S b2 |s, ms i = s(s + 1)~2 |s, ms i , S Sbz |s, ms i = ms ~ |s, ms i . (5.23) Im Folgenden beschränken wir uns auf die Spinquantenzahl s = 1/2, da die elementaren Bausteine der Materie, Elektronen, Protonen und Neutronen, sowie die Bausteine der Nukleonen, die Quarks, alle den Spin 1/2 haben. Für diesen Spezialfall schreiben wir die Eigenzustände auch in der Form von Spaltenvektoren 1 0 |1/2, 1/2i = |1/2, −1/2i = . (5.24) 0 1 Es ist leicht zu sehen, dass die Operatoren dann durch Matrizen repräsentiert werden können: 2 3~2 ~ 1 0 1 0 b b S = , Sz = . (5.25) 0 1 0 −1 4 2 Die Matrixform des Aufsteige-Operators erhalten wir aus den Relationen 1 1 1 0 b b , S+ =0 =~ = C+ (1/2, −1/2) S+ 0 0 0 1 und entsprechend für den Absteige-Operator 0 1 0 b = C− (1/2, 1/2) =~ , S− 1 0 1 Es folgt Damit wird Sb+ = ~ 1 ~ Sbx = (Sb+ + Sb− ) = 2 2 0 1 1 0 Die Pauli-Spin-Matrizen lauten 0 1 σx = , 1 0 0 1 0 0 0 0 1 0 0 −i i 0 , σz = 0 1 =0 . 1 b ~ Sby = (S+ − Sb− ) = 2i 2 , σy = Sb− = ~ , Sb− (5.26) 0 −i i 0 1 0 0 −1 . . (5.27) (5.28) Die Komponenten des Spin-Operators sind dann ~ Sbj = σj . 2 59 (5.29) 5.6 5.6.1 Addition von Drehimpulsen Addition von zwei Spins 1/2 Im Helium-Atom (s. Kap. 7) können die Spins der beiden Elektronen zu einem Gesamtspin kombiniert werden1 . Dies wird in den Abbildungen 5.4 und 5.5 gezeigt, die Rechnungen bringen wir in Anhang E. Wir schreiben b=S b1 + S b2 S (5.30) und setzen einen Produktzustand an |s, ms i = |s1 , ms1 i · |s2 , ms2 i , b1 nur auf |s1 , ms1 i und S b2 nur auf |s2 , ms2 i wirkt. Es ist leicht zu sehen, dass die wobei S z-Komponente additiv ist: ms = ms1 + ms2 . Der Maximalwert ist ms = 1, daher existieren die sogenannten “Triplettzustände” mit der Spinquantenzahl s = 1. |1, +1i = |1/2, +1/2i · |1/2, +1/2i 1 |1, 0i = √ (|1/2, +1/2i · |1/2, −1/2i + |1/2, −1/2i · |1/2, +1/2i) 2 |1, −1i = |1/2, −1/2i · |1/2, −1/2i (5.31) Der Singulettzustand s = 0 ist orthogonal dazu 1 |0, 0i = √ (|1/2, +1/2i · |1/2, −1/2i − |1/2, −1/2i · |1/2, +1/2i) . 2 (5.32) Bildlich kann man die Triplettzustände wie folgt darstellen |1, +1i |1, 0i |1, −1i = | ⇑i1 | ⇑i2 1 = √ ( | ⇑i1 | ⇓i2 + | ⇓i1 | ⇑i2 ) 2 = | ⇓i1 | ⇓i2 (5.33) und den Singulettzustand 1 |0, 0i = √ ( | ⇑i1 | ⇓i2 − | ⇓i1 | ⇑i2 ) 2 (5.34) Die Addition von zwei Spins 1/2 ist schematisch in den Abb. 5.4 und 5.5 zu sehen. 5.6.2 Addition von Bahndrehimpluls und Spin Der Gesamtdrehimpuls eines atomaren Elektrons ist die vektorielle Summe von Bahndrehimpuls und Spin: J = L+S. (5.35) 1 Bei der Addition zweier Spins werden zwei unabhängige Quantensysteme zusammengesetzt, wobei man das sog. Tensorprodukt von Vektoren bildet. Die mathematische Behandlung geht über den Rahmen dieses Manuskripts hinaus. 60 Abbildung 5.4: Die Addition von zwei Spins 1/2 zum Gesamtspin s = 0 (Singulett). Abbildung 5.5: Die Addition von zwei Spins 1/2 zum Gesamtspin s = 1 (Triplett). In der nichtrelativistischen Quantenmechanik ist es zulässig, die Gesamtwellenfunktion näherungsweise als Produkt der Bahnwellenfunktion ψn l ml (r, θ, ϕ) und der Spinfunktion |s, ms i zu schreiben2 , da Spinumklapp-Prozesse nur eine sehr kleine Wahrscheinlichkeit haben Ψges = ψn l ml (r, θ, ϕ) · |s, ms i . (5.36) Gemäß dem Superpositionsprinzip können auch Linearkombinationen dieser Produktfunktionen auftreten, dies ist bei verschränkten Zuständen von besonderer Bedeutung (s. Kap. 9). In Gl. (5.36) wird zur Vereinfachung die Zeitabhängigkeit, beschrieben durch den Faktor exp(−iωt), weggelassen. Die magnetische Quantenzahl des Bahndrehimpulses wird an dieser Stelle ml genannt, um sie von der magnetischen Quantenzahl ms des Spins zu unterscheiden. Wie wird nun der Operator des Gesamtdrehimpulses definiert? Gleichung (5.35) legt nahe, ihn als vektorielle Summe der Bahndrehimpuls- und Spin-Operatoren zu schreiben b+S b, Jb = L (5.37) b nur auf die Ortswellenfunktion ψn l m (r, θ, ϕ) wirkt und wobei die Rechenvorschrift gilt, dass L l b S nur auf die Spinfunktion |s, ms i. Dies ist leicht einzusehen, denn für den Differential-Operator b ist der Spaltenvektor |s, ms i eine Konstante, und für den Matrix-Operator S b ist die Funktion L ψn l ml (r, θ, ϕ) eine Konstante. Daher sind auch beliebige Komponenten der beiden Operatoren b und S b untereinander vertauschbar: L 2 b j , Sbk ] = 0 . [L Im relativistischen Fall ist diese Produktschreibweise nicht mehr erlaubt, die Lösungen der Dirac-Gleichung sind vierkomponentige Spinor-Wellenfunktionen, die die Ortsabhängigkeit und die Spineinstellung der Elektronen umfassen und gleichzeitig noch die Anti-Teilchen beschreiben. 61 Unter Benutzung dieser Beziehung ist leicht zu beweisen, dass der Operator des Gesamtdrehimpulses den Drehimpuls-Vertauschungsregeln der Quantenmechanik genügt: bx , L b y ] + [Sbx , Sby ] [Jbx , Jby ] = [L b z + Sbz ) = i~Jbz . = i~(L (5.38) 2 Die Konsequenz ist, dass gemeinsame Eigenzustände von Jb und Jbz existieren 2 Jb |j, mj i = j(j + 1)~2 |j, mj i , Jbz |j, mj i = mj ~ |j, mj i . Was passiert, wenn wir Jbz auf Ψges anwenden? (5.39) b z ψn l m (r, θ, ϕ)] · |s, ms i + ψn l m (r, θ, ϕ) · [Sbz |s, ms i] Jbz Ψges = [L l l = (ml + ms )~Ψges = mj ~Ψges . Daraus folgt für die Quantenzahlen mj = ml + ms . (5.40) Wegen ms = ±1/2 wird mj und damit auch j halbzahlig. Der Maximalwert von mj ist offensichtlich (mj )max = l + 1/2. Das bedeutet, dass auch der maximale j-Wert l + 1/2 ist. Wir werden sehen, dass ausserdem noch der j-Wert l − 1/2 vorkommt. Um ein definiertes Beispiel vor Augen zu haben, betrachten wir den Fall l = 1. In Abb. 5.6 ist die Addition von Bahndrehimpuls und Spin vektoriell dargestellt. Die beiden Zustände mit |mj | = 3/2 sind einfach besetzt, die Zustände mit |mj | = 1/2 dagegen doppelt. Es gibt die beiden Gesamtdrehimpuls-Multipletts |j, mj i |j, mj i = |3/2, +3/2i , = |1/2, +1/2i , |3/2, +1/2i , |1/2, −1/2i |3/2, −1/2i , |3/2, −3/2i (5.41) Die formale Behandlung ist in Anhang E zu finden. 5.7 5.7.1 Magnetische Momente Bohrsches Atommodell Im Bohrschen Atommodell bewegt sich das Elektron auf einer Kreisbahn um den Kern. Ein Kreisstrom I wirkt wie ein magnetischer Dipol. Sein magnetisches Moment ist µ = Iπr2 , die Richtung ergibt sich aus der Rechtsschraubenregel. In einem externen Magnetfeld hat ein magnetisches Moment eine potentielle Energie, und es wirkt ein Drehmoment Epot = −µ · B , M =µ×B. Im Bohr-Atom ist I = −e v/(2πr) und L = me rv, daraus folgt e µ=− L. 2me (5.42) (5.43) Der Minimalwert von L ist ~, dafür wird |µ| = µB = e~ = 5.79 · 10−5 eV/T . 2me Die Grösse µB nennt man das Bohrsche Magneton. 62 (5.44) Abbildung 5.6: (a) Die vektorielle Addition von Bahndrehimpuls 1 (blaue Pfeile) und Spin 1/2 (rote Pfeile). Die Darstellung ist etwas vereinfacht, die Vektoren liegen in Wahrheit nicht alle in der Zeichenebene. Man erkennt, dass die Zustände mit mj = ±3/2 einfach besetzt sind und Zustände mit mj = ±1/2 doppelt. (b) Die beiden Einstellungen des magnetischen Eigenmoments des Elektrons in einem Magnetfeld. Die z-Komponenten sind ± µB , die potentiellen Energien im Feld sind Epot = −µe · B = ∓ µB B. 5.7.2 Magnetische Momente in der Quantentheorie Die Beziehung (5.43) bleibt in der Quantentheorie erhalten, muss aber als Operatorgleichung interpretiert werden. e b b=− µ L. (5.45) 2me Der magnetische Momentenvektor ist antiparallel zum Drehimpulsvektor (da die Ladung des Eletrons negativ ist) und zeigt die gleiche Quantisierung: nur der Betrag und die z-Komponente sind messbar. Offensichtlich gilt µz = −ml · e~ = −ml · µB . 2me (5.46) Für den minimalen von null verschiedenen Wert |ml | = 1 hat das Bahnmoment den Wert µB . Das magnetische Eigenmoment des Elektrons hat überraschenderweise den gleichen Wert, obwohl |ms | nur 1/2 ist. Schreibt man analog zu (5.45) b e = −g · µ e b S, 2me (5.47) so muss man dem g-Faktor den Wert g = 2 zuordnen. Die Richtungsquantisierung des Spinvektors wurde erstmals im Stern-Gerlach-Experiment sichtbar gemacht (siehe Physik III). Die Modellvorstellung, das Elektron sei eine geladene Kugel, die um die eigene Achse rotiert, ist falsch: Wie wir bereits gesehen haben, würde die Rotationsgeschwindigkeit am Äquator die Lichtgeschwindigkeit weit übertreffen, und zweitens wäre das magnetische Eigenmoment dann µB /2. Die Dirac-Gleichung als relativistische Verallgemeinerung der Schrödinger-Gleichung löst die Problematik auf: sie sagt sowohl den Spin 1/2 als auch den g-Faktor 2 voraus. Allerdings gibt es auch hier noch Korrekturen durch die Quantenelektrodynamik (QED), der experimentell bestimmte g-Faktor des Elektrons ist geringfügig größer als 2. Die sog. (g minus 2)-Experimente, bei denen die Abweichung des g-Faktors von 2 bestimmt wird, zählen zu den genauesten Tests der QED. 63 Eine wichtige Konsequenz dieser Betrachtungen ist, dass es zwei verschiedene Quellen für den Magnetismus gibt: Ströme und die magnetischen Eigenmomente der Elementarteilchen, vorwiegend der Elektronen. Die Magnetisierung von Eisen wird ausschließlich durch die ausgerichteten magnetischen Momente der Elektronen in der nur teilweise gefüllten 3d-Schale des Fe-Atoms hervorgerufen. Nach heutigem Wissen ist es nicht legitim, die magnetischen Eigenmomente auf Kreisströme zurückzuführen. 5.7.3 Magnetische Momente von Protonen und Neutronen Protonen und Neutronen haben den Spin 1/2. Gemäß der Dirac-Gleichung erwartet man für die magnetischen Momente e~ µp = + , µn = 0 . 2mp Experimentell findet man ganz andere Werte, vor allem ist das Moment des Neutrons ungleich null, obwohl es elektrisch neutral ist: µp = +2.79 · e~ , 2mp µn = −1.91 · e~ . 2mn (5.48) Hieraus kann man erkennen, dass die Nukleonen keine strukturlosen elementaren Teilchen sind, sondern aus kleineren Bausteinen bestehen. Das Quark-Modell kann die “anomalen” magnetischen Momente der Nukleonen erklären3 . 5.8 Didaktische Anmerkungen Drehungen im Raum und die damit verbundenen Erscheinungen bereiten häufig große Verständnisschwierigkeiten. Der Kreisel ist eines der kompliziertesten Systeme der klassischen Mechanik. In der Quantenmechanik ist dies nicht besser. Wir haben in diesem Kapitel Vektordiagramme benutzt, um die Drehimpulsquantisierung sowie die Addition von Bahndrehimpuls und Spin oder die Addition zweier Spins zu veranschaulichen. Die nötigen mathematischen Rechnungen sind in Anhang E zusammengestellt. Wichtig ist die Erkenntnis, dass die Drehimpulsquantisierung allein aus den Vertauschungsregeln folgt und dass nur ganzzahlige oder halbzahlige Quantenzahlen für das Quadrat des Drehimpulsoperators in Frage kommen. Die Auf- und Absteigeoperatoren liefern wegen ihrer sehr anschaulichen Bedeutung den einfachsten Zugang zur Theorie des Drehimpulses. Diese Operatoren ändern die Quantenzahl der z-Komponente um ±1, woraus die Struktur der Drehimpulsmultipletts verständlich wird. 3 Dies gilt für das sog. naive Quark-Modell, in dem nur die “Valenzquarks” (uud) des Protons und (udd) des Neutrons berücksichtigt werden und nicht die Gluonen und Quark-Antiquark-Paare. 64 Kapitel 6 Das Wasserstoff-Atom 6.1 Die Schrödinger-Gleichung für das H-Atom Die Schrödinger-Gleichung für das H-Atom lautet − ~2 2 ∇ ψ + V (r) ψ = E ψ 2me mit V (r) = − e2 . 4πε0 r (6.1) Die Elektronenmasse wird hier mit me bezeichnet, um eine Verwechslung mit der magnetischen Quantenzahl m zu vermeiden. Das Proton wird als raumfest angesehen1 . Wegen der sphärischen Symmetrie des Hamilton-Operators muss der Laplace-Operator in Kugelkoordinaten ausgedrückt werden (siehe Anhang A): 1 ∂ ∇ ψ= 2 r ∂r 2 1 ∂ ∂ψ 1 ∂2ψ 2 ∂ψ r + 2 sin θ + 2 2 . ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2 (6.2) Für die Wellenfunktion machen wir den Lösungsansatz ψ(r, θ, ϕ) = R(r) · Y (θ, ϕ) (6.3) und setzen dies ist Gl. (6.1) ein: − ~2 2me Y ∂ r2 ∂r ∂R R ∂ ∂Y R ∂2Y r2 + 2 sin θ + 2 2 + V (r)R · Y = E R · Y . ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2 2 Dividiert man die Gleichung durch − 2m~e r2 R(r) · Y (θ, ϕ) so folgt 1 d R dr dR 2me r2 1 ∂ ∂Y 1 ∂2Y r2 − (V (r) − E) = − sin θ − 2 dr ~2 Y sin θ ∂θ ∂θ Y sin θ ∂ϕ2 (6.4) Die linke Seite der Gleichung hängt nur von r ab, die rechte nur von θ und ϕ. Daher müssen beide Seiten gleich einer reellen Konstanten sein, die wir als l(l + 1) schreiben2 . 1 Wenn man sehr genau rechnen will, ersetzt man me durch die reduzierte Masse des Elektron-Proton-Systems mred = (me mp )/(me + mp ), die sich von me um 0.05% unterscheidet. 2 Jede reelle Zahl lässt sich so schreiben, wenn wir zulassen, dass l eine komplexe Zahl ist. Hier benutzen wir aber schon unsere Kenntnisse über den Bahndrehimpuls und werden zeigen, dass l nur die Werte 0, 1, 2,... annehmen kann. 65 6.1.1 Die Winkelgleichungen Die Differentialgleichung für die Winkelfunktion Y (θ, ϕ) lautet ∂ sin θ ∂θ ∂Y ∂2Y sin θ + + l(l + 1) sin2 θ Y = 0 . ∂θ ∂ϕ2 Jetzt wird ein weiterer Separationsansatz gemacht: Y (θ, ϕ) = f (θ) · g(ϕ) . Nach Einsetzen und Division durch f · g ergibt sich 1 d sin θ f dθ df sin θ dθ + l(l + 1) sin2 θ = − 1 d2 g = m2 . g dϕ2 (6.5) Hier ist wieder benutzt worden, dass die linke und rechte Seite der Gleichung von verschiedenen Variablen abhängen und daher beide konstant sein müssen. Die Konstante wird m2 genannt. Die sich ergebende Differentialgleichung für g(ϕ) hat die Lösung g(ϕ) = exp(imϕ) . (6.6) Da g(ϕ + 2π) = g(ϕ) sein muss, folgt dass m eine ganze Zahl ist: m = 0, ±1, ±2, ±3, . . . Die Gleichung für f (θ) lautet d sin θ dθ df sin θ dθ + l(l + 1) sin2 θ − m2 f (θ) = 0 . (6.7) Diese Differentialgleichung ist analytisch lösbar, der mathematische Aufwand ist allerdings beträchtlich. Wir geben die Lösungen hier nur an, es sind die Legendre-Funktionen Pl,m . Für l = 0, 1, 2 lauten sie P0,0 = 1 P1,1 = sin θ , P1,0 = cos θ P2,2 = 3 sin2 θ , (6.8) P2,1 = 3 sin θ cos θ , 1 P2,0 = (3 cos2 θ − 1) 2 Die Kugelfunktionen Yl,m (θ, ϕ), siehe Gl. (5.14), lassen sich Produkt der Legendre-Funktionen und der g(ϕ)-Funktionen schreiben. Sie sind auf 1 normiert: Z 0 2π Z π ∗ Yl,m (θ, ϕ)Yl,m (θ, ϕ) sin θdθ 0 dϕ = 1 . (6.9) In diesem Kapitel bezeichnen wir die magnetische Quantenzahl des Bahndrehimpulses wieder mit m statt ml . 66 6.1.2 Die Radialgleichung Die Differentialgleichung für die Radialfunktion R(r) lautet d dr 2me r2 2 dR r − [V (r) − E] R − l(l + 1)R = 0 . dr ~2 (6.10) Für den Spezialfall l = 0 wollen wir eine Lösung suchen. Dazu schreiben wir die Differentialgleichung in der Form R00 + 2 0 c1 R + R + c2 R = 0 r r mit c1 = 2me 2me e2 , c2 = 2 E ~2 4πε0 ~ (6.11) Als einfachste Lösung versuchen wir eine Exponentialfunktion R(r) = exp(−r/a0 ) (6.12) mit einer noch zu bestimmenden Konstanten a0 . Die Funktion R(r) = exp(+r/a0 ) wäre im Prinzip auch eine Lösung, sie ist aber nicht zulässig, da wir die Bedingung R(r) → 0 für r → ∞ erfüllen müssen. Einsetzen in (6.11) und Multiplikation mit exp(+r/a0 ) ergibt 1 2 1 =0 + c2 + c1 − 2 a0 r a0 Diese Gleichung muss für alle Werte von r gelten, daher müssen die beiden Klammern verschwinden. Es folgt 2 1 a0 = , c2 = − 2 c1 a0 Setzen wir die Ausdrücke für c1 und c2 ein, so erhalten wir a0 = 4πε0 ~2 , me e2 1 e2 E=− · 2 4πε0 a0 (6.13) Die Größe a0 nennt man den Bohrschen Radius (s. Kap. 6.3), und E erweist sich als die Energie des Grundzustands des H-Atoms, vgl. Gl. (6.14). Bis auf eine Normierungskonstante ist die Funktion (6.12) identisch mit der Wellenfunktion des H-Atoms im Grundzustand. Die allgemeinen Lösungen der Differentialgleichung (6.10) werden in Anhang F konstruiert. Die Energiewerte ergeben sich zu E = En = − ~2 1 e2 1 = − · · 2 2 2 2 4πε0 a0 n 2 me a0 n mit n = 1, 2, 3, . . . . (6.14) Wir haben das fundamentale Resultat, dass die Schrödinger-Gleichung genau die Energieniveaus des Bohrschen Atommodells wiedergibt. Eine Besonderheit der nichtrelativistischen Quantenmechanik ist, dass die Energieniveaus des H-Atoms nur von der Hauptquantenzahl n abhängen und nicht von l und m. Für festes n kann l die Werte l = 0, 1, (n − 1) annehmen (dies erkennt man leicht aus Gl. (F.9)) und m die Werte −l ≤ m ≤ +l. Daher gibt es n−1 X (2l + 1) = n2 l=0 67 (6.15) verschiedene Eigenfunktionen zum gleichen Energiewert En . Bei Berücksichtigung der zwei Spineinstellungen des Elektrons sind es 2n2 . Die Tatsache, dass mehrere Eigenzustände die gleiche Energie haben, nennt man - reichlich unpassend - Entartung. In einem externen Magnetfeld wird die Drehimpuls-Entartung aufgehoben. Die Richtungsquantelung des Drehimpulses kann “sichtbar” gemacht werden, da die verschiedenen Einstellungen des mit der Bahnbewegung verknüpften magnetischen Moments zu einer Energieaufspaltung der Niveaus führen. Die potentielle Energie ist Epot = −µe · B = m µB B (6.16) Man nennt dies den (normalen) Zeeman-Effekt. Die Energieaufspaltungen sind in Abb. 6.1 skizziert. Anzumerken ist, dass der normale Zeeman-Effekt eigentlich der Ausnahmefall ist, weil Abbildung 6.1: Der normale Zeeman-Effekt für die Niveaus 1s (n = 1, l = 0), 2p (n = 2, l = 1) und 3d (n = 3, l = 2) und die erlaubten optischen Übergänge, die der Auswahlregel ∆m = 0, ±1 gehorchen, s. Kap. 8. Es wird hier die spektroskopische Notation benutzt: die Buchstaben s, p, d, f ... bedeuten l = 0, 1, 2, 3... der Spin und das magnetische Eigenmoment des Elektrons die Aufspaltungen im H-Atom und den meisten anderen Atomen komplizierter machen. Der Regelfall ist der “anomale” ZeemanEffekt, auf den wir hier nicht eingehen wollen. Bei Berücksichtigung relativistischer Korrekturen sowie interner Magnetfelder wird die Entartung auch ohne externe Felder weitgehend aufgehoben, die Energieniveaus hängen dann auch von den anderen Quantenzahlen ab. In “wasserstoffähnlichen” Atomen wie Lithium und Natrium hängen die Energiewerte ohnehin stark von der Bahndrehimpuls-Quantenzahl l ab. 6.2 Die Wellenfunktionen des H-Atoms Die Wellenfunktionen des H-Atoms lauten ψnlm (r, θ, ϕ) = Rnl (r) Ylm (θ, ϕ) (6.17) Die Radialfunktionen hängen nur von der Hauptquantenzahl n und der Bahndrehimpuls-Quantenzahl l ab, während m nicht eingeht. Die Funktion Rnl (r) ist das Produkt der Exponentialfunktion exp(−r/(n a0 )) mit einem Polynom des Grades n − 1 in der Variablen r/(n a0 ). Die Radialfunktionen sind - ebenso wie die Kugelfunktionen - auf 1 normiert: Z ∞ Rnl (r)Rnl (r)r2 dr = 1 . (6.18) 0 68 Für n = 1 und n = 2 haben sie die Gestalt R1 0 = R2 0 = R2 1 = r exp − 3/2 a0 a0 r 1 r exp − √ 3/2 1 − 2a0 2a0 2 a0 1 r r exp − √ 3/2 2a 2a 0 0 6 a0 2 (6.19) Sie sind in den Abbildungen 6.2 und 6.3 als Funktion des normierten Radius r/a0 aufgetragen. Das bemerkenswerte Resultat ist, dass die Funktionen R10 (r) und R20 (r) ihr Maximum bei r = 0 haben. Das Elektron hält sich also mit großer Wahrscheinlichkeit direkt am Ort des Atomkerns auf. Dies ist völlig anders als im Bohrschen Atommodel (s. Kap. 6.3). Oft ist es von Interesse zu wissen, mit welcher Wahrscheinlichkeit sich das Elektron zwischen zwei Kugelflächen der Radien r und r + dr befindet. Dazu integriert man |ψnlm (r, θ, ϕ)|2 über den Raumwinkel dΩ und erhält damit die radiale Aufenthaltswahrscheinlichkeit Pnl (r) = Nnl r2 |Rnl (r)|2 (6.20) mit einem Normierungsfaktor Nnl , der für l = 0 den Wert 4π hat. Es ist interessant anzumerken, 0 5 10 0 5 10 r / a0 r / a0 Abbildung 6.2: Links ist die Radialfunktion R10 (r) als Funktion von r/a0 aufgetragen, rechts die radiale 2 Aufenthaltswahrscheinlichkeit P10 (r) = 4πr2 |R10 (r)| . dass das Maximum der radialen Aufenthaltswahrscheinlichkeit in der Nähe der Bohrschen Bahn für die jeweilige Quantenzahl n liegt (im Bohr-Modell gilt rn = n2 a0 , d.h. r1 = a0 , r2 = 4a0 ). 0 5 10 0 5 10 r / a0 r / a0 Abbildung 6.3: Links: die Radialfunktionen R20 (r) (rot) und R21 (r) (blau) als Funktion von r/a0 . Rechts die zugehörigen radialen Aufenthaltswahrscheinlichkeiten P20 (r) und P21 (r). 69 Ein zweidimensionales Bild des H-Atoms gewinnt man, wenn man die Wahrscheinlichkeitsdichte |ψnlm (x, y = 0, z)|2 über der xz-Ebene aufträgt. Dies wird in Abb. 6.4 für den Grundzustand 1s (n = 1, l = 0) gezeigt. Interessante Muster ergeben sich für größere Werte von n und M10 M10 Abbildung 6.4: Das linke Bild zeigt die Wahrscheinlichkeitsdichte |ψnlm (x, y = 0, z)|2 für den 1s-Zustand M10 2 (n = 1, l = 0) als Funktion von x und z. Rechts ist |ψnlm (x, y = 0, z)| in einer Farbcodierung aufgetragen. l, siehe Abb. 6.5. Kern 6.3 Didaktische Anmerkungen Die Sonne oder eine Glühlampe senden ein kontinuierliches Spektrum aus, aber einzelne Atome emittieren diskrete Spektrallinien. Die von Balmer, Rydberg und anderen gefundene Formel für die reziproken Wellenlängen im Linienspektrums des Wasserstoffatoms lautet 1 1 1 = RH − λ n2 n02 Für die teilweise im Sichtbaren liegende Balmerserie ist n = 2 und n0 = 3, 4, 5..... Die Größe RH nennt man die Rydbergkonstante. Die Linienspektren stellten die klassische Physik des 19. Jahrhunderts vor unlösbare Probleme. Wir diskutieren einige Schritte auf dem Weg zu einer Theorie, die imstande ist, die Spektrallinien der Atome zu erklären. 6.3.1 Das Atommodell von Rutherford Die von Geiger und Marsden durchgeführten Streuexperimente von α-Strahlung an dünnen Goldfolien und ihre Deutung durch Lord Rutherford führten zum Rutherford-Modell des Atoms: die positive Ladung und fast die gesamte Masse befinden sich in einem winzigen Kern (diese Aussage ist auch heute noch gültig), die leichten negativ geladenen Elektronen bewegen sich auf Kreisbahnen um den Kern (diese Aussage ist aus heutiger Sicht nicht mehr gültig). Das Atom ähnelt somit dem System Sonne-Erde. Auf das Elektron im H-Atom wirkt das CoulombPotential e2 V (r) = − (6.21) 4πε0 r 70 M211 M210 M320 M321 M322 Abbildung 6.5: Die Wahrscheinlichkeitsdichten |ψnlm (x, y = 0, z)|2 für die Quantenzahlen (n, l, m) = (2, 1, 0), (2, 1, 1) (obere Reihe) und für (n, l, m) = (3, 2, 0), (3, 2, 1), (3, 2, 2) (untere Reihe). Die x-Achse verläuft horizontal, die z-Achse vertikal. Bei diesen Bildern ist y = 0 gewählt. Die Wahrscheinlichkeitsdichten sind rotationssymmetrisch um die z-Achse. Eine zweidimensionale Repräsentation −100 wird in Abb. 6.6 gezeigt. Aus der Gleichsetzung von M := i, j Coulombkraft und Zentripetalkraft kann man2 die Umlauffrequenz des Elektrons in Abhängigkeit 2 ( i − 50.1) + ( j − 50.1) + 40 vom Bahnradius berechnen und zeigen, dass sie mit kleiner werdendem Radius rasch anwächst. Die Kreis- oder Ellipsenbahnen der Planeten um die Sonne sind stabil. Die Kreisbahnen der Abbildung 6.6: Zweidimensionale Repräsentation des Coulombpotentials im Rutherford-Atom. Das Gravitationspotential hat auch diese Trichterform. Aus Metall oder Kunststoff hergestellte Modelle sind oft zu sehen. Lässt man eine Münze parallel zu den Kreisen loslaufen, so spiralt diese nach innen, wird dabei immer schneller Mund verschwindet schliesslich im zentralen Loch. Entsprechend muss man sich die Bewegung des Elektrons im Rutherford-Atom vorstellen. 71 Elektronen im Atom dagegen sind instabil: nach den Gesetzen der Elektrodynamik sollte eine radial beschleunigte Ladung ständig elektromagnetische Strahlung aussenden. Wegen des damit verbundenen Energieverlustes müsste sich das Elektron immer mehr dem Atomkern annähern und nach ca. 10−12 s im Kern verschwinden. Das Problem ist dann: warum gibt es überhaupt stabile Atome? Dieses Problem erwies sich als unlösbar im Rahmen der klassischen Physik. 6.3.2 Das Atommodell von Bohr Im Jahr 1913 schlug Niels Bohr sein berühmtes Atommodell vor, das so konstruiert war, dass es die von Balmer und anderen gefundenen Formeln der Spektralserien des Wasserstoffs erklären konnte. Ausgehend von dem Befund, dass das Rutherford-Atom sich als instabil erwiesen hatte, machte Bohr die für seine Zeitgenossen befremdliche Annahme, dass die Gesetze der klassischen Physik nicht notwendigerweise auch im atomaren Bereich gelten. Er stellte drei Postulate auf, die in der klassischen Physik nicht gültig sind: (1) Die Elektronen bewegen sich auf Kreisbahnen um den Kern, aber es gibt stationäre Bahnen, auf denen die Teilchen nicht strahlen. (2) Strahlung wird emittiert, wenn ein Elektron von einer Bahn höherer Energie auf eine Bahn geringerer Energie überwechselt. Die (Kreis)frequenz der Strahlung ist gegeben durch die Energiedifferenz zwischen Anfangs- und Endbahn: ~ω = Eanf − Eend . (3) Auf einer stationären Bahn hat der Bahndrehimpuls den Wert L = n ~, wobei n = 1, 2, 3... ist. Die natürliche Zahl n wird zur Kennzeichnung der jeweiligen Bahn benutzt. Abgesehen von diesen Postulaten wird im Bohr-Modell die klassische Physik benutzt. Aus der Gleichsetzung von Coulombkraft und Zentripetalkraft e2 me v 2 = 4πε0 r2 r findet man für die kinetische Energie als Funktion des Bahnradius 1 1 e2 me v 2 = 2 2 4πε0 r (6.22) Mit Hilfe von Postulat (3) wird die Geschwindigkeit v eliminiert L = me rn vn = n ~ ⇒ vn = n~ me rn Mit (6.22) folgt daraus für den Radius der Bahn n rn = 4πε0 ~2 2 · n ≡ a0 · n2 me e2 (6.23) und die Energie des Elektrons auf dieser Bahn En = 1 e2 1 e2 1 13, 6 eV me vn2 − =− =− 2 2 4πε0 rn 2 4πε0 a0 n n2 (6.24) Die charakteristische Größe a0 nennt man den Bohrschen Radius a0 = 4πε0 ~2 = 0.53 · 10−10 m me e2 Das Niveauschema von Wasserstoff ist in Abb. 6.7 skizziert. 72 (6.25) Abbildung 6.7: Die Energieniveaus des H-Atoms nach dem Bohrschen Atommodel. Eingezeichnet sind auch die Spektralserien (Lyman-Serie, Balmer-Serie, Paschen-Serie). Leistungen und Grenzen des Bohrschen Atommodells Niels Bohr hat zwei wesentliche neue Aspekte in die Physik eingebracht, die - in leicht abgewandelter Form - auch heute noch Gültigkeit haben: (1) es gibt stationäre Zustände im Atom, in denen das Elektron keine Strahlung emittiert; (2) Strahlung wird genau dann emittiert oder absorbiert, wenn das Elektron von einem stationären Zustand auf einen anderen übergeht. Die dritte Neuerung im Vergleich zur klassischen Physik ist die Quantisierung des Bahndrehimpulses, die allerdings - wie wir aus Kap. 5 wissen - in der Quantenmechanik komplizierter ist als im Bohr-Modell. Insbesondere haben der Grundzustand 1s und die angeregten Zustände 2s, 3s, 4s,... einen Bahndrehimpuls null, was im Planetenmodell des H-Atoms unmöglich ist. Die großen Unterschiede zwischen dem Schrödinger-Bild des Atoms und dem Bohrschen Atommodell erkennt man in Abb. 6.8. Im Schrödinger-Bild besteht für das Elektron eine große Wahrscheinlichkeit, direkt am Ort des Atomkerns gefunden zu werden, während es im Bohrschen Atommodell immer einen relativ großen Abstand a0 vom Kern hat. Es gibt überzeugende experimentelle Beweise, dass das Schrödinger-Bild korrekt ist. Wie kann man die befremdliche Vorhersage der Quantentheorie prüfen, dass das Elektron mit großer Wahrscheinlichkeit direkt am Ort des Atomkerns gefunden werden kann? Dafür sind zwei Systeme geeignet, die dem Wasserstoffatom ähneln: man kann den Kern durch ein Positron ersetzen, oder man kann das Elektron durch ein Antiproton ersetzen. Diese aus Teilchen und Antiteilchen bestehenden gebundenen Systeme, Positronium und Antiprotonium, besitzen praktisch die gleichen Wellenfunktionen und Energieniveaus wie das H-Atoms, man muss nur in den jeweiligen Gleichungen die Elektronenmasse me durch die reduzierte Masse mred ersetzen. Im Fall des Positroniums e+ e− ist mred = me /2, die Energie des Grundzustands ist daher −13.6/2 = −6.8 eV. Teilchen und Antiteilchen können sich gegenseitig annihilieren, wenn sie einander sehr nahe kommen. Bei der Elektron-Positron-Annihilation entstehen, je nach Spineinstellung, 2 oder drei γ-Quanten, bei der Proton-Antiproton-Annihilation entstehen mehrere π-Mesonen. Experimentell wird beobachtet, dass Positronium und Antiprotonium beide nur begrenzte Lebensdauer haben und durch Annihilation verschwinden. Die Annihilation kann nur bei extrem kleinen Abständen eintreten. Im Bohrschen Atommodell sind die Abstände viel zu groß dafür. 73 hhhh IψI2 Bohrsche Bahn Kern 1.5 1 0.5 0 0.5 1 1.5 x / a0 M10 Abbildung 6.8: Links: Bild des kkk Wasserstoffatoms im Grundzustand in der Schrödingertheorie. Die 2 Wahrscheinlichkeitsdichte |ψ100 (x, y, z)| wird für y = 0 als Funktion von x und z gezeigt(die Farbcodierung ist so gewählt, dass rot hohe Werte, blau-violett niedrige Werte bedeuten). Das Maximum liegt bei x, y, z = 0, also genau im Atomkern. Mitte: die (n = 1)-Kreisbahn im Bohrschen Atommodell. Das Elektron hat immer einen relativ großen Abstand a0 vom Kern. Rechts: Schnitt durch das H-Atom 2 entlang der x-Achse. Aufgetragen ist die Wahrscheinlichkeitsdichte |ψ100 (x, 0, 0)| als Funktion von x/a0 für y = z = 0. Gezeigt wird auch die Lage der Kreisbahn im Bohrschen Atommodell. Ein weiterer, unabhängiger Beweis für die Richtigkeit des Schrödingerbildes des Atoms ist der sog. K-Einfang (electron capture). Atomkerne mit einem überzähligen Proton können sich entweder durch den β + -Zerfall oder durch K-Einfang in einen stabilen Kern umwandeln. Bei dem Einfangprozess reagiert ein Elektron aus der K-Schale (n = 1, l = 0) mit einem Proton im Kern und wandelt dieses in ein Neutron um: p + e− → n + N eutrino Das ist nur möglich, weil sich das 1s-Elektron mit großer Wahrscheinlichkeit im Kern aufhalten kann. Die Begrenzungen des Bohrschen Atommodells zeigen sich an vielen anderen Stellen. Mit diesem Modell können Mehrelektronen-Atome überhaupt nicht beschrieben werden, aber auch die Feinstruktur im Wasserstoff bleibt unverständlich. Die von Werner Heisenberg, Erwin Schrödinger und vielen anderen entwickelte Quantenmechanik hat sich als die umfassende Theorie erwiesen. Niels Bohr selbst hat bei der Entwicklung dieser Theorie eine herausragende Rolle gespielt. In den Jahren um 1925 waren Göttingen und Kopenhagen die Zentren der theoretischen Physik. Optische Übergänge, Korrespondenzprinzip Bei dem Übergang des Elektrons von einem Energieniveau En auf ein Niveau En0 (n0 < n) wird ein Photon der Frequenz 1 e2 1 1 ωn,n0 = − 2~ 4πε0 a0 n02 n2 emittiert. Nun betrachten wir den Fall, dass die Hauptquantenzahl n sehr groß ist und wählen n0 = n − 1. Dann wird näherungsweise ωn,n−1 ≈ e2 4πε0 a0 n3 ~ für n 1 Dies ist identisch mit der Umlauffrequenz des Elektrons auf der Kreisbahn mit Radius rn : ωn = vn e2 = rn 4πε0 a0 n3 ~ 74 Die Frequenz der ausgesandten Strahlung stimmt daher mit der Umlauffrequenz des Elektrons überein, wie man aufgrund der klassischen Elektrodynamik erwarten würde. Dies ist ein wichtiges Beipiel für das Korrespondenzprinzip: im Limes großer Quantenzahlen gehen die Aussagen der Quantentheorie in die der klassischen Physik über. Bei kleinen Quantenzahlen erhält man dagegen völlig verschiedene Resultate. 75 Kapitel 7 Atome mit vielen Elektronen 7.1 Ausschließungsprinzip, identische Teilchen Um Regelmäßigkeiten in den Eigenschaften der Atome und insbesondere auch das Periodische System der Elemente zu erklären, schlug Wolfgang Pauli 1925 das Ausschließungsprinzip vor: Zwei Elektronen in einem Atom dürfen nicht in allen vier Quantenzahlen n, l, ml , ms übereinstimmen, sondern müssen sich in mindestens einer dieser Quantenzahlen unterscheiden. Eine wichtige Konsequenz des Ausschließungsprinzips (oder Pauli-Prinzips) ist die Schalenstruktur der Atome, auf die wir später noch eingehen. Die allgemeinere Form des Ausschließungsprinzips lautet: Die Gesamtwellenfunktion eines Mehrelektronensystems muss antisymmetrisch gegenüber der Vertauschung irgend zweier Elektronen sein. In dieser Form ist das Ausschließungsprinzip auch auf Elektronen in Metallen und andere Vielteilchensysteme anwendbar. In der Quantentheorie sind identische Teilchen grundsätzlich ununterscheidbar, ganz anders als in der klassischen Physik oder im täglichen Leben. Zwei exakt baugleiche Autos sind leicht unterscheidbar, wenn man einem von ihnen einen Farbfleck auf die Motorhaube malt, eineiigige Zwillinge sind unterscheidbar, wenn einer von ihnen sich die Haare abschneidet. Die Elektronen in einem Eisenatom sind dagegen nicht unterscheidbar. Wir können sie nicht durch Farbflecke markieren, noch durch irgend etwas anderes. Auch die Protonen im Eisenkern sind nicht voneinander zu unterscheiden. Diese grundsätzliche Ununterscheidbarkeit elementarer Teilchen hat weitreichende Konsequenzen für Vielteilchen-Wellenfunktionen: die Wahrscheinlichkeitsdichte muss invariant sein gegenüber der Vertauschung irgend zweier Teilchen. Mit Hilfe der Quantenfeldtheorie kann nun ganz allgemein bewiesen werden, dass Teilchen mit halbzahligem Spin (Fermionen) eine antisymmetrische Gesamtwellenfunktion (Produkt von Orts- und Spinwellenfunktion) haben müssen und Teilchen mit ganzzahligem Spin (Bosonen) eine symmetrische Gesamtwellenfunktion. Eine anschauliche, auf der täglichen Erfahrung oder der klassischen Physik beruhende Erklärung des Pauli-Prinzips ist nicht bekannt. Versuche, eine solche Erklärung zu finden, sind vermutlich auch zwecklos, weil andere identische Teilchen wie etwa Helium-Atome sich konträr dazu verhalten: bei diesen Bose-Teilchen ist die Gesamtwellenfunktion symmetrisch gegenüber der Vertauschung irgend zweier Teilchen, und diese Teilchen neigen dazu, sich bei hinreichend tiefen Temperaturen alle in den gleichen Quantenzustand zu begeben. Dies ist die supraflüssige Phase von Helium, die bei Temperaturen unterhalb von 2,17 Kelvin beobachtet wird. Die Bose76 Einstein-Kondensation (s. Kap. 1) setzt eine total symmetrische Wellenfunktion voraus. 7.2 Das Helium-Atom Das Helium-Atom besteht aus einem Kern der Ladung +2e, der zwei Protonen und zwei Neutronen enthält, sowie zwei Elektronen. Zur Vereinfachung wird der Kern als ortsfest angenommen und in den Nullpunkt des Koordinatensystems gelegt. Die potentielle Energie des Atoms enthält drei Terme: die negative potentielle Energie von Elektron 1 im Feld des Kerns, die negative potentielle Energie von Elektron 2 im Feld des Kerns und die positive potentielle Energie von Elektron 1 im Feld von Elektron 2: V (r 1 , r 2 ) = V1 (r 1 ) + V2 (r 2 ) + V12 (r 1 , r 2 ) mit Vj (r j ) = − 2e2 4πε0 |r j | (j = 1, 2) und V12 (r 1 , r 2 ) = + (7.1) e2 4πε0 |r 1 − r 2 | Anmerkung: im Augenblick tun wir so, als ob wir die beiden Elektronen durch eine Nummer kennzeichnen könnten. Ihre Ununterscheidbarkeit wird später berücksichtigt. Die zeitunabhängige Schrödigergleichung ist eine partielle Differentialgleichung in den sechs Variablen (x1 , y1 , z1 , x2 , y2 , z2 ). Sie lautet − ~2 ∇21 + ∇22 ψ(r 1 , r 2 ) + V (r 1 , r 2 )ψ(r 1 , r 2 ) = Eψ(r 1 , r 2 ) 2me (7.2) Es ist eine große Enttäuschung, dass bereits die Schrödigergleichung des zweiteinfachsten Atoms nicht mehr analytisch lösbar ist. Daher muss man Näherungen anwenden. 7.2.1 Modell der unabhängigen Elektronen Die Komplikation der Gleichung (7.2) liegt in dem Term V12 (r 1 , r 2 ), der bewirkt, dass die Bewegung des einen Elektrons die des anderen beeinflusst. Wenn man dieses Wechselwirkungspotential weglässt, kann man die Zweiteilchen-Wellenfunktion als Produkt von zwei EinteilchenWellenfunktionen ansetzen ψ(r 1 , r 2 ) = ψ1 (r 1 ) · ψ2 (r 2 ) und bekommt zwei entkoppelte Einteilchen-Schrödigergleichungen − ~2 2e2 ∇2j ψj (r j ) − ψj (r j ) = Eψj (r j ) 2me 4πε0 |r j | (j = 1, 2) (7.3) Eine Gleichung dieser Art gilt exakt für das Helium-Ion He+ , bei dem sich ein einzelnes Elektron im Feld eines Kerns der Ladung +Ze = +2e bewegt. Wir können die Energieniveaus direkt von der Berechnung des Wasserstoff-Atoms übertragen (siehe die Gleichungen (6.14) und (6.24)) En = − Z 2 · 13, 6 54, 4 eV = − 2 eV 2 n n (7.4) Die Grundzustandsenergie des He+ -Ions hat in der Tat den Wert E1 = −54.4 eV, aber im Heliumatom misst man für den tiefsten Energiezustand der beiden Elektronen nicht −2 · 54, 4 = −108, 8 eV, sondern nur -79 eV. Die abstoßende Wechselwirkung der Elektronen hat, wie man erwarten würde, einen merklichen Einfluss auf die Energieniveaus. 77 Wie kann man trotz der Elektron-Elektron-Wechselwirkung weiterhin mit einem EinelektronModell des Atoms rechnen? Die Idee ist, sich eines der Elektronen auszuwählen und die Wirkung des anderen durch eine negative Ladungswolke zu beschreiben, die eine gewisse Abschirmung der Kernladung bewirkt. Pauschal kann man auf diese Weise die positive Wechselwirkungsenergie der Elektronen durch Einführung einer “effektiven” Kernladungszahl Zef f erfassen. Damit wird die Energie des Grundzustands 2 E1He = 2(−13, 6 eV) · Zef f (7.5) Empirisch findet man für den Grundzustand Zef f = 1, 7. In dieser Näherung erfüllt jedes der beiden Elektronen die Einteilchen-Schrödingergleichung − Zef f e2 ~2 ∇j 2 ψj (r) − ψj (r j ) = Eψj (r j ) 2me 4πε0 |r j | (j = 1, 2) (7.6) Die Lösungen sind von der Gestalt der Wasserstoff-Eigenfunktionen: ψ(r, θ, ϕ) = Rnl (r)Ylm (θ, ϕ) In dem Modell der quasi-unabhängigen Teilchen kann man die Gesamtwellenfunktion als Produkt von Einteilchen-Wellenfunktionen schreiben: ψ(1, 2) = ψa (1)ψb (2) (7.7) Hier verwenden wir eine abkürzende Schreibweise und schreiben ψ(1, 2) anstatt ψ(r 1 , r 2 ). Die Quantenzahlen werden pauschal durch a ' (n, l, m) und b ' (n0 , l0 , m0 ) gekennzeichnet. 7.2.2 Anwendung des Pauli-Prinzips Die Wellenfunktion (7.7) genügt nicht einem fundamentalen Prinzip der Quantentheorie: die beiden Elektron im He-Atom sind identische Teilchen und nicht unterscheidbar. Ob sich Elektron 1 im Quantenzustand a ' (n, l, m) befindet und Elektron 2 im Quantenzustand b ' (n0 , l0 , m0 ) oder umgekehrt, ist physikalisch dasselbe. Die Wahrscheinlichkeitsdichte muss demnach invariant gegenüber Vertauschung der beiden Teilchen sein: |ψ(1, 2)|2 = |ψ(2, 1)|2 (7.8) Diese fundamentale Bedingung wird von der Funktion (7.7) verletzt. Es gibt zwei Möglichkeiten, eine gegenüber Teilchenvertauschung invariante Wahrscheinlichkeitsdichte zu realisieren: wir können eine symmetrische und eine antisymmetrische Kombination der Produkte von Einteilchen-Wellenfunktionen bilden ψS (1, 2) = ψA (1, 2) = 1 √ (ψa (1)ψb (2) + ψa (2)ψb (1)) 2 1 √ (ψa (1)ψb (2) − ψa (2)ψb (1)) 2 (7.9) Für die symmetrische Kombination gilt ψS (2, 1) = +ψS (1, 2) und für die antisymmetrische ψA (2, 1) = −ψA (1, 2). Nun ist zu beachten, dass die Wellenfunktionen ψS (r 1 , r 2 ) und ψA (r 1 , r 2 ) nur die räumliche Verteilung der Elektronen beschreiben. Die Spinfunktionen müssen auch noch erfasst werden. 78 In diesem Abschnitt bezeichnen wir die Spinfunktionen mit χ, wobei folgende Konvention gilt (vgl. Kap. 5) 1 0 χ+ ≡ |1/2, 1/2i = , χ− ≡ |1/2, −1/2i = (7.10) 0 1 In Kap. 5 haben wir die Addition zweier Spins 1/2 zu einem Gesamtspin s = 1 (Triplett) oder s = 0 (Singulett) studiert. Die Triplett-Spinfunktion ist symmetrisch gegenüber Teilchenvertauschung: ms = +1 χ+ (1)χ + (2) √1 χ+ (1)χ− (2) + χ− (1)χ+ (2) ms = 0 χtrip (1, 2) = (7.11) 2 χ− (1)χ− (2) ms = −1 Die Singulett-Spinfunktion ist antisymmetrisch 1 χ+ (1)χ− (2) − χ− (1)χ+ (2) χsing (1, 2) = √ 2 ms = 0 (7.12) Die Gesamtwellenfunktion des Helium-Atoms erhalten wir durch Kombination von Orts- und Spinfunktion. Aufgrund des Pauli-Prinzips sind zwei Kombinationen zugelassen: das Produkt der symmetrischen Orts-Wellenfunktion und der antisymmetrischen Spinfunktion (Spinsingulett) Ψsing (1, 2) = ψS (1, 2) χsing (1, 2) (7.13) oder das Produkt der antisymmetrischen Orts-Wellenfunktion und der symmetrischen Spinfunktion (Spintriplett) Ψtrip (1, 2) = ψA (1, 2) χtrip (1, 2) (7.14) Beide sind antisymmetrisch gegenüber Teilchenvertauschung. 7.2.3 Energieniveaus und Spektren von Helium Das Pauli-Prinzip hat bemerkenswerte Konsequenzen für die Energieniveaus und Spektrallinien von Helium: es sieht so aus, als ob es zwei Sorten von Helium-Atomen gäbe, die verschiedene Energieniveau-Schemata haben. Der absolute Grundzustand, in dem sich beide Elektronen auf dem tiefstmöglichen Energieniveau befinden, dem 1s-Niveau mit n = 1, l = 0, ml = 0, ist nur mit der Singulett-Wellenfunktion (7.13) möglich. Bei der Triplett-Funktion (7.14) muss der Ortsanteil antisymmetrisch sein, d.h. wenn ein Elektron im 1s-Zustand ist, muss sich das zweite Elektronen auf einem angeregten Niveau befinden. Der energetisch tiefste Zustand des Triplett-Helium ergibt sich, wenn ein Elektron im 1s-Zustand ist und das zweite im 2s-Zustand. Die Energie des Triplett-Grundzustands liegt um fast 20 eV über dem Singulett-Grundzustand. Die Lage der Energieniveaus wird durch die Orts-Wellenfunktionen bestimmt, während die Spinfunktionen nur einen geringfügigen Einfluss haben (sie tragen zur sog. Feinstruktur bei, auf die wir in Kap. 8 eingehen). Jetzt kommt eine wesentliche Erkenntnis: die symmetrische Ortsfunktion ψS (1, 2) führt, bei gleichen Quantenzahlen n und l, zu höheren Energiewerten als die antisymmetrische Ortsfunktion ψA (1, 2). Das kann man wie folgt verstehen. Nähert man die Elektronen einander an (r 1 → r 2 ), so wird |ψA (r 1 , r 2 )|2 |ψS (r 1 , r 2 )|2 . Im antisymmetrischen Zustand sind daher die Elektronen im Mittel weiter voneinander entfernt als im symmetrischen Zustand und erfahren dadurch weniger elektrostatische Abstoßung, d.h. die positive potentielle Energie zwischen den Elektronen wird kleiner. Daraus folgt EA < ES . In Abb. 7.1 sind die beiden Energieniveauschemata von Helium dargestellt. Dabei befindet sich ein Elektron im 1s-Grundzustand, das andere im Grundzustand oder auf einem angeregten 79 Abbildung 7.1: Links: Energieniveauschema von Helium im Spinsingulett-Zustand mit einer symmetrischen Ortsfunktion ψS . Rechts: Energieniveauschema im Spintriplett-Zustand mit einer antisymmetrischen Ortsfunktion ψA . Einige der erlaubten optischen Übergänge sind eingezeichnet. (Bitte beachten: die Energieskala ist zwischen 0 und 20 eV unterbrochen). Niveau. Wie erwartet liegen die 2s- und 2p-Niveaus bei der symmetrischen Ortsfunktion ψS deutlich höher als bei der antisymmetrischen Ortsfunktion ψA . Zwischen den Termschemata finden keine optischen Übergänge statt, weil diese ein Spinumklappen erfordern würden. Dies ist ein äußerst seltener Prozess. Eine weitere Beobachtung: Im Unterschied zum Wasserstoff ist beim Helium die “DrehimpulsEntartung” aufgehoben. Das 2s-Niveau liegt tiefer als das 2p-Niveau. Der Grund ist die stärkere Abschirmung der Kernladung bei l = 1 im Vergleich zu l = 0. Das s-Elektron ist somit stärker gebunden und hat eine tiefere potentielle Energie. Dieser Effekt wird bei allen MehrelektronenAtomen beobachtet. In Anhang G wird skizziert, wie man die Energieniveaus des He-Atoms im Prinzip berechnen könnte. 7.3 Schalenstruktur der Atome Das Pauli-Prinzip verbietet, dass alle Elektronen in den tiefsten Zustand n = 1 gehen. Ohne dieses Verbot wären die Atome viel kleiner und Materie sehr viel dichter. Die Elektronen in einem Atom müssen sich in mindestens einer der vier Quantenzahlen n, l, ml , ms unterscheiden. Daraus resultiert die Schalenstruktur der Atome, die in der Physik III ausführlich diskutiert wird. Wir bringen eine kurze Zusammenfassung. K-Schale n = 1 ⇒ l = 0, ml = 0. Zwei Spineinstellungen sind möglich: ms = ±1/2. Die beiden Elemente, die Elektronen nur in der K-Schale haben, sind Wasserstoff und Helium. H: 1s He: 1s2 (Spins ⇑⇓) 80 L-Schale n = 2, l = 0 (2s) oder l = 1 (2p) mit ml = 0, ±1 sowie ms = ±1/2 Es gibt acht Elemente mit vollständig besetzter K-Schale und teilweise besetzter L-Schale: Lithium, Beryllium, Bor, Kohlenstoff, Stickstoff, Sauerstoff, Fluor, Neon. Li: 1s2 2s1 N: 1s2 2s2 2p3 2 2 Be: 1s 2s O: 1s2 2s2 2p4 B: 1s2 2s2 2p1 F: 1s2 2s2 2p5 2 2 2 C: 1s 2s 2p Ne: 1s2 2s2 2p6 Beim Neon sind die K- und L-Schalen voll gefüllt. Die Elektronenverteilung ist kugelsymmetrisch. Das Element Ne ist ein Edelgas und geht keine chemischen Bindungen ein. Die K-Schale enthält alle Elektronen mit Hauptquantenzahl n = 1, die L-Schale enthält alle Elektronen mit n = 2. Bei höheren Werten der Hauptquantenzahl gibt es Überkreuzungen. So liegt in schweren Atomen das 4s-Niveau energetisch unter dem 3d-Niveau und wird deswegen früher besetzt. Die M-Schale umfasst nur die 3s- und 3p-Unterschalen mit insgesamt 8 Elektronen, während die 3d-Unterschale zur N-Schale gehört. Die energetische Lage der Atomschalen wird schematisch in Abb. 7.2 gezeigt. Abbildung 7.2: Energetische Lage der K-, L-, M-,N- und O-Schalen im Periodensystem der Elemente. 7.4 Atomorbitale, Hybridwellenfunktionen Wir werden jetzt eine interessante Anwendung des Superpositionsprinzips kennenlernen: sie betrifft die Atomorbitale und Hybridwellenfunktionen, die in der organischen Chemie und der Festkörperphysik eine wichtige Rolle spielen. Wir gehen wieder von den Wellenfunktionen des Wasserstoffatoms aus, obwohl diese nur eine grobe Näherung der Wellenfunktionen eines Mehrelektronen-Atoms darstellen. Gemäß Gl. (6.17) haben sie die Gestalt ψnlm (r, θ, ϕ) = Rnl (r) Ylm (θ, ϕ) (7.15) mit der Radialfunktion Rnl (r), die die Dichte der Elektronenwolke in Abhängigkeit vom Kernabstand r beschreibt, und der Kugelfunktion Ylm (θ, ϕ), die die Verteilung der Elektronenwolke in Abhängigkeit vom Polarwinkel θ und Azimutwinkel ϕ beschreibt. Um die kovalente Bindung und die räumliche Struktur mehratomiger Moleküle zu erklären, erweist es sich als zweckmäßig, Linearkombinationen der Kugelfunktionen zu bilden. 81 Atomorbitale Zunächst definieren wir die sog. Atomorbitale für die beiden Werte l = 0 und l = 1 der Bahndrehimpulsquantenzahl. Diese werden mit den Buchstaben s bzw. p gekennzeichnet. 1 s(θ, ϕ) = Y00 (θ, ϕ) = √ 4π r 1 3 px (θ, ϕ) = √ [Y1,1 (θ, ϕ) + Y1,−1 (θ, ϕ)] = sin θ cos ϕ 4π 2 r 3 1 √ [Y1,1 (θ, ϕ) − Y1,−1 (θ, ϕ)] = py (θ, ϕ) = sin θ sin ϕ 4π i 2 r 3 cos θ pz (θ, ϕ) = Y10 (θ, ϕ) = 4π (7.16a) (7.16b) (7.16c) (7.16d) Die s-Funktion ist unabhängig von den Winkeln und somit kugelsymmetrisch, während die drei p-Funktionen Elektronendichteverteilungen ergeben, die längs der Koordinatenachsen x, y, z ausgerichtet sind. Die räumliche Orientierung der Atomorbitale wird in Abb. 7.3 gezeigt. Aufgetragen wird das Absolutquadrat der Wellenfunktion in einem Polardiagramm; dies wird in Abb. 7.4 für die Funktion pz (θ) gezeigt. Abbildung 7.3: Die Atomorbitale s, px , py und pz . Die Plus- und Minuszeichen geben die Vorzeichen der Wellenfunktionen an. Abbildung 7.4: Polardiagramm des Atomorbitals pz (θ). Aufgetragen ist |pz (θ)|2 als Funktion des Winkels θ. Das Diagramm ist rotationssymmetrisch um die z-Achse. 82 Hybridfunktionen Die organische Chemie ist die Chemie der Kohlenwasserstoffe. Das C-Atom hat eine mit zwei Elektronen besetzte K-Schale (n = 1), die fest an den C-Kern gebunden sind und nicht an chemischen Bindungen teilhaben. In der L-Schale (n = 2) befinden sich vier Elektronen, bei einem freien C-Atom ist die Struktur 2s2 und 2p2 . Die Energiewerte der 2s- und der 2p-Niveaus sind zwar unterschiedlich (die beim Wasserstoff beobachtete Entartung ist hier aufgehoben), sie liegen aber nah beieinander. In chemischen Verbindungen gibt es Verschiebungen der atomaren Energieniveaus, so dass Superpositionen der 2s- und 2p-Wellenfunktionen möglich werden. Diese nennt man Hybridfunktionen. Davon gibt es drei wichtige Typen: die sp-, sp2 und sp3 -Hybridfunktionen. Diese Funktionen und ihre Bedeutung für die räumliche Struktur mehratomiger Moleküle werden in der Vorlesung Struktur der Materie genauer diskutiert. Hier wollen wir uns auf die sp3 -Hybridisierung beschränken. Mit dem s-Orbital und den px -, py - und pz Orbitalen werden vier unabhängige Hybridfunktionen gebildet: Molekülphysik 1 ( s + px (θ, ϕ) + py (θ, ϕ) + pz (θ) ) sp 312-Orbitale ψ2 (θ, ϕ) = ( s + px (θ, ϕ) − py (θ, ϕ) − pz (θ) ) 2 1 ( s − px (θ, ϕ) + py (θ, ϕ) − pz (θ) ) ψ3 (θ, ϕ) = Tetraederstruktur 2 1 Beispiel CH4 (Methan) ( s − px (θ, ϕ) − py (θ, ϕ) + pz (θ) ) ψ4 (θ, ϕ) = 2 1 C 1s 2 2s 2 2p 2 + 4 H 1s Mehratomige Moleküle ψ1 (θ, ϕ) = Ψ1 = Ψ2 = Ψ3 = Ψ4 = (7.17a) (7.17b) (7.17c) (7.17d) √ 1 s + 3pz 2 ! r 1 8 1 px − √ pz s+ 2 3 3 r √ 1 2 s− px + 2py − 2 3 r √ 1 2 s− px − 2py − 2 3 Einführung in die Struktur der Materie Abbildung 7.5: Die vier sp3 -Hybridfunktionen. Diese Funktionen sind räumlich ausgerichtet und weisen von der Mitte einer aus vier gleichseitigen Dreiecken gebildeten Pyramide zu den vier Eckpunkten. Setzt man an jeden dieser Bindungsarme ein H-Atom, so bekommt man die Struktur des CH4 -Moleküls (Methan), siehe Abb. 7.6. Auch in Germanium- und Siliziumkristallen spielen die sp3 -Hybridfunktionen eine wichtige Rolle. 7.5 Didaktische Anmerkungen: wie sähe die Welt ohne das Pauliprinzip aus? Text fehlt noch 83 1 √ pz 3 1 √ pz 3 ! ! Molekülphysik Mehratomige Moleküle sp 3 Festkörper sp 3 Hybridorbitale sind in einigen weiteren Elementen wie z.B. Si für die kovalente Bindung verantwortlich 4 e− pro Si Atom in sp 3 Orbital Si Nachbaratom gibt auch 1 e− pro sp 3 Orbital ⇒ alle Orbitale besetzt ⇒ C Isolator; Si, Ge Halbleiter Si Energie pro Bindung C-C Si-Si Ge-Ge 3.6 eV 1.8 eV 1.6 eV Si Si Abbildung 7.6: Links: die Struktur des Methanmoleküls CH4 . Rechts: ein Si-Atom in einem Einführung in die Struktur der Materie 123 SiliziumEinkristall und seine vier nächsten Nachbarn. 84 Kapitel 8 Feinstruktur und optische Übergänge Nur für sehr wenige Fälle von praktischer Bedeutung ist die Schrödinger-Gleichung analytisch lösbar. Aus diesem Grund ist es wichtig, dass ausgefeilte Näherungsmethoden existieren. Die Störungsrechnung beruht auf der Annahme, dass der Hamilton-Operator des gegebenen Systems sich von dem Operator eines analytisch lösbaren Systems nur um eine kleine Störung unterscheidet: b =H b (0) + H b (1) . H (8.1) b (1) zeitlich konstant. Diese Bei der zeitunabhängigen Störungsrechnung ist der Zusatzterm H Methode wird angewandt, um die Änderung der Energieniveaus und Wellenfunktionen von stationären Zuständen zu berechnen. Wir werden die zeitunabhängige Störungsrechnung zur Berechnung der Feinstruktur im Wasserstoffatom benutzen. Die zeitabhängige Störungsrechnung ist geeignet für Probleme, bei denen das System von einem stationären Zustand in einen anderen übergeht. Insbesondere sind dies optische Übergänge in Atomen. Auch die Streuung von α-Teilchen oder Elektronen an Atomkernen lässt sich damit berechnen. 8.1 Zeitunabhängige Störungsrechnung Wir diskutieren hier nur die erste Ordnung der Störungsrechnung. In der ersten Ordnung bleiben die Eigenfunktionen gleich, aber die Eigenwerte ändern sich. In der zweiten Ordnung ändern sich auch die Eigenfunktionen, doch das soll hier nicht behandelt werden; wir verweisen auf Standard-Lehrbücher der theoretischen Physik, z.B. W. Greiner, Quantenmechanik. 8.1.1 Näherungsweise Lösung der Schrödingergleichung Die Eigenfunktionen des ungestörten Hamilton-Operators seien bekannt b (0) ψn(0) = En(0) ψn(0) . H (8.2) b n = En ψn Hψ (8.3) In den folgenden Rechnungen wird vorausgesetzt, dass die Energiewerte nicht entartet sind (d.h. verschiedene Eigenfunktionen haben auch verschiedene Eigenwerte). Um die Gleichung näherungsweise zu lösen, machen wir den Ansatz b = H b (0) + H b (1) H ψn = ψn(0) + ψn(1) + ψn(2) + . . . En = En(0) + En(1) 85 + En(2) + ... , (8.4) b (j) , ψn(j) , En(j) , proportional zu wobei angenommen wird, dass die Terme der Ordnung j, also H εj sind, wobei 0 < ε 1 eine kleine Zahl ist. Dies bedeutet, dass die Terme mit j > 0 nur kleine Korrekturen der Grundterme j = 0 darstellen. Einsetzen in Gl. (8.3) und Sortieren nach Potenzen von ε ergibt: Nullte Ordnung: b (0) ψn(0) = En(0) ψn(0) . H (8.5) Dies ist die Eigenwertgleichung des ungestörten Hamilton-Operators. Erste Ordnung: b (0) ψn(1) + H b (1) ψn(0) = En(0) ψn(1) + En(1) ψn(0) . H (8.6) Die zweite Ordnung wird hier nicht betrachtet. 8.1.2 Energieverschiebung in der 1. Ordnung Wir schreiben die Gl. (8.6) in Dirac-Notation b (0) |ψ (1) i + H b (1) |ψ (0) i = E (0) |ψ (1) i + E (1) |ψ (0) i H n n n n n n (0) und bilden das Skalarprodukt mit dem “bra”-Vektor hψn | : b (0) |ψn(1) i + hψn(0) |H b (1) |ψn(0) i = En(0) hψn(0) |ψn(1) i + En(1) hψn(0) |ψn(0) i . hψn(0) |H (8.7) b (0) hermitesch ist (siehe Anhang D) , gilt Da H b (0) |ψ (1) i = hH b (0) ψ (0) |ψ (1) i = E (0) hψ (0) |ψ (1) i . hψn(0) |H n n n n n n (0) (0) Wenn man dies in (8.7) einsetzt und hψn |ψn i = 1 benutzt, folgt für die Energieverschiebung in der 1. Ordnung (1) (0) b (1) (0) δEn ≡ En = hψn |H |ψn i (8.8) Dies ist eine der wichtigsten Gleichungen der quantenmechanischen Störungsrechnung: In der 1. Ordnung ist die Energieverschiebung der Niveaus gleich dem Erwartungswert des Störoperators, gebildet mit der Wellenfunktion der 0. Ordnung, also der ungestörten Wellenfunktion. 8.2 Feinstruktur im H-Atom In Kapitel 6 haben wir gezeigt, dass im Rahmen der nichtrelativistischen Quantenmechanik die Energieniveaus im H-Atom nur von der Hauptquantenzahl n abhängen. Um die mit hochauflösender Spektroskopie beobachtete Feinstruktur zu erklären, muss man relativistische Korrekturen und die sog. Spin-Bahnkopplung berücksichtigen. Beide Effekte lassen sich mit der Störungstheorie behandeln. 8.2.1 Die relativistische Massenänderung Die kinetische Energie eines relativistischen Elektrons mit Impuls p ist p Ekin = p2 c2 + m2e c4 − me c2 (8.9) Im H-Atom ist die kinetische Energie maximal 13.6 eV und damit sehr klein im Vergleich zur Ruheenergie me c2 = 0.511 · 106 eV. Man kann die Wurzel hier in eine Taylorreihe entwickeln: p √ p2 c2 + m2e c4 = me c2 1 + x mit x= = me c2 (1 + x/2 − x2 /8 . . .) 86 p2 c2 1 m2e c4 Bis zur 2. Ordnung der Taylorreihe erhalten wir Ekin = p4 p2 − , 2me 8m3e c2 (8.10) wobei der erste Term die nichtrelativistische kinetische Energie ist und der zweite Term als kleine Störung angesehen werden kann. Der Hamilton-Operator wird b =H b (0) + H b (1) H mit 2 2 b (0) = pb − e H , 2me 4πε0 r 4 b (1) = − pb H 8m3e c2 (8.11) Gemäß Gl. (8.8) ist die Verschiebung der Energieniveaus in 1. Ordnung der Störungsrechnung b (1) |ψ (0) i . En(1) = hψn(0) |H n Wie in Anhang H gezeigt wird, ist die Energieverschiebung aufgrund der relativistischen Massenänderung me c2 α4 1 3 δEnM asse = − − . (8.12) 2n3 l + 1/2 4n Dabei ist α= 1 e2 ≈ 4πε0 ~c 137 (8.13) die dimensionslose Feinstrukturkonstante. 8.2.2 Spin-Bahn-Kopplung Für Bahndrehimpulse l > 0 ruft die Bahnbewegung ein Magnetfeld hervor, in dem das magnetische Eigenmoment des Elektrons zwei Einstellungen hat, die sich energetisch unterscheiden. Die daraus resultierende Energie-Aufspaltung der Niveaus im H-Atom soll nun berechnet werden. Klassische Berechnung des Magnetfeldes der Bahnbewegung Wir benutzen das Bohrsche Atommodel und betrachten ein Koordinatensystem, in dem das Elektron ruht und vom Proton umkreist wird. Nach dem Biot-Savart-Gesetz (s. Theorie B) ist das vom Proton erzeugte Magnetfeld B= µ0 e r × v 4π r3 Dabei ist r der Radiusvektor vom Elektron zum Proton und v die Geschwindigkeit des Protons. Die Rücktransformation in das Laborsystem ist kompliziert und ergibt einen Faktor 1/2 (es tritt dabei sie sog. Thomas-Präzession auf, s. Eisberg-Resnick Quantum Physics, App. J). Das Magnetfeld der Bahnbewegung am Ort des Elektrons wird damit B= µ0 e r × v µ0 e = L 3 8π r 8πme r3 (8.14) Berechnung der Energieaufspaltung Die potentuelle Energie des magnetischen Moments µe des Elektrons in diesem Feld ist Epot = −µe · B = 87 µ0 e 2 L·S 8πme r3 (8.15) Dieser Energieterm wird als Störung in den Hamiltonoperator aufgenommen. Wir schreiben also b =H b (0) + H b (1) H mit 2 2 b (0) = pb − e H , 2me 4πε0 r b (1) = H µ0 e 2 b b L·S 8πme r3 (8.16) b (1) gemäss Gl. (8.8) ist aufwändig und wird in Die Berechnung des Erwartungswerts von H Anhang H durchgeführt. Die Energieverschiebung aufgrund der Spin-Bahn-Kopplung ergibt sich zu me c2 α4 l für j = l + 1/2 SB δEn = 3 · (8.17) (−l − 1) für j = l − 1/2 4n l(l + 1/2)(l + 1) Auch diese Energieverschiebung ist ein relativistischer Effekt, da Magnetfelder und magnetische Momente relativistische Effekte sind. Addiert man die beiden Energieverschiebungen, so findet man ein bemerkenswertes Resultat: die Feinstruktur ist nur von n und j abhängig, aber nicht von l: me c2 α4 1 3 M asse SB δEn = δEn + δEn = − · (8.18) − 2n3 j + 1/2 4n Dies ist ein sehr befriedigendes Resultat aus theroretischer Sicht, denn der gestörte Hamilb·S b nicht mehr mit L b vertauschbar. Das bedeutet, die tonoperator ist aufgrund des Terms L Quantenzahl l des Bahndrehimpulses ist nicht mehr wohldefiniert. Der gestörte Hamiltonopeb+S b vertauschbar, so dass j gemessen werden rator ist aber mit dem Gesamtdrehimpuls Jb = L kann. Die Feinstruktur des 1s-Niveaus und der 2s-, 2p-Niveaus von Wasserstoff wird in Abb. 8.1 gezeigt. Sie liegt in der Größenordnung von 10−4 eV. Abbildung 8.1: Feinstruktur der 1s-, 2s- und 2p-Niveaus im H-Atom. Die Diracgleichung ist die relativistische Verallgemeinerung der Schrödingergleichung. Sie hat eine große Vorhersagekraft. Die relativistische Massenänderung des Elektrons wird automatisch berücksicht, aber darüber hinaus sagt die Diracgleichung auch den Spin 1/2 des Elektrons und sein korrektes magnetisches Moment voraus. Formel (8.18) ist in Übereinstimmung mit der Ergebnis der Diracgleichung. Die Energiewerte des H-Atoms gemäss der Diracgleichung (DG) können aus den Energiewerten der Schrödingergleichung (SG) wie folgt berechnet werden 1 3 α2 DG SG − (8.19) En,j = En · 1 + n j + 1/2 4n 88 Wir weisen darauf hin, dass es noch wesentlich feinere Strukturen in Atomen gibt: die Hyperfeinstruktur, hervorgerufen durch Wechselwirkung des Elektrons mit dem magnetischen Moment des Atomkerns, und die Korrekturen durch die Quantenelektrodynamik (Vakuum-Polarisation, Lamb-Verschiebung). 8.3 Emission und Absorption von Strahlung In diesem Abschnitt gehen wir auf ein zentrales Thema der Quantentheorie ein, den Übergang eines Elektrons von einem Energieniveau auf ein anderes unter dem Einfluss elektromagnetischer Strahlung. Die korrekte Behandlung ist überaus kompliziert, man muss dafür auch das Strahlungsfeld quantisieren und kommt damit zur Quantenelektrodynamik (QED), der Quantentheorie des elektromagnetischen Feldes und seiner Wechselwirkungen mit geladenen Teilchen. Die QED enthält auch die Dirac-Gleichung als relativistisch korrekte Verallgemeinerung der Schrödinger-Gleichung. 8.3.1 Absorption, stimulierte und spontane Emission Als einfaches Beispiel betrachten wir Atome, die nur zwei Energieniveaus E1 und E2 haben. Wenn sich bei einem Atom das Elektron im angeregten Zustand E2 befindet, so gibt es eine gewisse Wahrscheinlichkeit pro Zeiteinheit A dafür, dass es von selbst (spontan) nach E1 übergeht und dabei ein Photon der Energie ~ω = E2 − E1 emittiert wird. Diesen Vorgang nennt man spontane Emission. Die Zahl der angeregten Atome erniedrigt sich in der Zeit dt durch spontane Emission um dN2 = −N2 A dt . Daraus folgt das auch für die radioaktiven Kernzerfälle typische exponentielle Zerfallsgesetz N2 (t) = N2 (0) e−At = N2 (0) e−t/τ . (8.20) Die charakteristische Zeitkonstante τ nennt man die mittlere Lebensdauer; es ist die Zeit, in der die Zahl der angeregten Atome durch spontane Übergänge auf 1/e = 37% der Anfangszahl abgesunken ist. Für “erlaubte optische Übergänge” (siehe unten) ist typischerweise τ ≈ 10−8 s. Wenn bereits Strahlung der Frequenz ω vorhanden ist, kann ein Elektron auch unter dem Einfluss des Strahlungsfeldes von E2 nach E1 übergehen. Dies ist die stimulierte (oder induzierte) Emission. Befindet sich das Elektron im Grundzustand, so kann es durch die Strahlung in den angeregten Zustand gehoben werden, wobei ein Photon absorbiert wird (Absorption). In Abb. 8.2 sind die drei mit Photon-Emission oder -Absorption verknüpften Prozesse schematisch dargestellt. Beim Gamma-Zerfall der Atomkerne spielen nur die spontanen Übergänge eine Rolle. Im optischen und erst recht im Infrarot- und Mikrowellen-Bereich werden die stimulierten Emissionsprozesse zunehmend wichtig. Wir werden im Folgenden sehen, dass die elementaren Wahrscheinlichkeiten für Absorption und stimulierte Emission gleich sind. Es ist aber nicht so einfach, einen generell gültigen Zusammenhang zwischen der spontanen und der stimulierten Emission herzustellen. 8.3.2 Optische Übergänge in der Schrödinger-Quantenmechanik Im Rahmen der Schrödinger-Quantenmechanik werden optische Übergänge durch eine “semiklassische” Methode erfasst: die Elektronen im Atom werden quantentheoretisch durch die 89 Abbildung 8.2: Absorption, induzierte (stimulierte) Emission und spontane Emission eines Photons. In allen drei Fällen ist ~ω = E2 − E1 . Wellenfunktionen ψ beschrieben, während das elektromagnetische Strahlungsfeld als klassisches oszillierendes Feld behandelt wird. Das elektrische Feld der Welle hat die Form E(t) = E 0 cos ω0 t = E 0 iω0 t (e + e−iω0 t ) . 2 (8.21) Die Frequenz muss eine Resonanzbedingung erfüllen ~ω0 ≈ |Ef − Ei | , (8.22) wobei eine gewisse Unschärfe zugelassen ist in Einklang mit der Unschärferelation. Die Indizes i, f kennzeichnen den Anfangs- und Endzustand (initial state, final state) des atomaren Elektrons. Ein wesentliches Ergebnis der halbklassischen Methode ist, dass zwei der oben eingeführten Prozesse möglich sind: die stimulierte Emission und die Absorption. Wir werden zeigen, dass beide Prozesse die gleiche Wahrscheinlichkeit haben. Bemerkenswert ist, dass die spontane Emission, bei der ein angeregtes Atom “von selbst” in einen tiefer liegenden Zustand oder den Grundzustand übergeht unter Emission eines Photons, nicht mit der im nächsten Anschnitt präsentierten Störungsrechnung beschrieben werden kann. Die korrekte Erklärung der spontanen Emission ist nur mit Hilfe der QED möglich, wir werden in Kap. 8.6 eine vereinfachte Darstellung bringen. 8.4 Anwendung der zeitabhängigen Störungsrechnung Die Eigenlösungen der Schrödinger-Gleichung des H-Atoms oder anderer gebundener Systeme beschreiben stationäre Zustände: Wenn sich das Elektron zum Zeitpunkt t = 0 im Zustand Ψn,l,ml (r, t) = ψn,l,ml (r, θ, ϕ) · e−iωn t befindet, wird es zu beliebigen späteren Zeiten auch genau in diesem Zustand sein. Der Grund ist, dass die Wahrscheinlichkeitsdichte ρ(r) = |Ψ|2 unabhängig von der Zeit ist, ein Übergang in einen anderen Zustand kann nicht vorkommen1 . Damit ist ein zentrales Postulat des Bohrschen Atommodells in Frage gestellt, nämlich die Emission oder Absorption von Strahlung bei dem Übergang von einem stationären Zustand zu einem anderen. Übergänge können durch ein elektromagnetisches Wechselfeld der Form (8.21) induziert werden. Im optischen Bereich kann 1 Wenn sich das Elektron anfangs in einem Superpositionszustand befindet, z.b. Ψ(r, t) = ca Ψa (r, t) + cb Ψb (r, t), wobei a, b die Quantenzahlen der Eigenzustände kennzeichnen, so wird das Teilchen periodisch zwischen den Zuständen Ψa und Ψb hin- und herwandern. 90 dieses Feld als räumlich homogen angesehen werden, da die optische Wellenlänge fast einen Faktor 1000 größer als der Atomradius ist. In einem räumlich homogenen elektrischen Wechselfeld ist die potentielle Energie des Elektrons durch den einfachen Ausdruck V 0 (t) = e E(t) · r = e (E0 · r) (eiω0 t + e−iω0 t ) 2 (8.23) gegeben, so dass der Hamilton-Operator nun lautet b b (0) + H b (1) (t) H(t) =H mit 2 2 b (0) = − ~ ∇2 − e b (1) (t) = V 0 (t) . H , H 2me 4πε0 r (8.24) Wir lassen das Feld nur für eine kurze Zeit 0 < t < T einwirken. Wie wir in Anhang A.4.2 zeigen, bewirkt diese Begrenzung auf ein endliches Zeitintervall, dass die elektromagnetische Strahlung nicht mehr exakt monochromatisch ist, sondern ein endliches Frequenzband ω0 ± ∆ω überstreicht mit ∆ω ≈ π/T . Zum Zeitpunkt t = 0 sei das Elektron im Zustand Ψi (initial state, i ≡ (n, l, ml )i ). Im Zeitbereich 0 < t < T muss die Wellenfunktion die Schrödinger-Gleichung i~ ∂Ψ b (0) + V 0 (t))Ψ = (H ∂t (8.25) b (0) . Wir können sie aber (bei einer “kleinen” erfüllen und ist daher keine Eigenfunktion von H Störung) als Linearkombination der Eigenfunktionen mit zeitabhängigen Koeffizienten ansetzen, da die Eigenfunktionen ein vollständiges Orthonormalsystem bilden: X Ψ(r, t) = ci (t)Ψi (r, t) + cj (t)Ψj (r, t) (8.26) j6=i mit der Anfangsbedingung ci (0) = 1, cj (0) = 0. Der gewünschte Endzustand (final state) Ψf befindet sich unter den Ψj . Die weiteren Rechnungsschritte sind in Anhang H zu finden. Für den Koeffizienten des gewünschten Endzustands Ψf findet man den Ausdruck " # e ei(ωf i +ω0 )T − 1) ei(ωf i −ω0 )T − 1 i~cf (T ) = (E0 · r f i ) · + 2 i(ωf i + ω0 ) i(ωf i − ω0 ) Dabei ist rf i = ZZZ mit ωf i = ψf∗ (r)rψi (r)d3 r Ef − Ei ~ (8.27) (8.28) das sog. “Matrixelement” des elektrischen Dipolmoments. An dieser Stelle ist es zweckmässig, die beiden Fälle Ef > Ei und Ef < Ei getrennt zu behandeln. 8.4.1 Absorption Es sei Ef > Ei ⇒ ωf i > 0 . Der zweite Term in der eckigen Klammer von Gl. (8.27) hat einen Resonanznenner bei ω0 = ωf i und dominiert bei dieser Frequenz. Mit der Hilfsvariablen u = (ωf i − ω0 )T /2 wird e sin u . i~cf (T ) = (E0 · r f i ) · T · eiu · 2 u 91 (8.29) Die Wahrscheinlichkeit, das Elektron am Ende der Wechselwirkung im Endzustand Ψf zu finden, ist e2 sin2 u |cf (T )|2 = 2 |(E0 · r f i )|2 · T 2 . (8.30) 4~ u2 Die Funktion sin2 u/u2 hat ihr Maximum bei u = 0, also bei ω0 = ωf i . Das Ergebnis der Störungsrechnung ist: Damit der Absorptionsvorgang auftreten kann, muss die mittlere Quantenenergie ~ω0 der Strahlung näherungsweise gleich der Energiedifferenz der Ef − Ei der atomaren Niveaus sein: ~ω0 ≈ ~ωf i = Ef − Ei (8.31) Die endliche Breite der Kurve sin2 u/u2 hat aber zur Folge, dass ω0 sich ein wenig von der Übergangsfrequenz ωf i unterscheiden darf. Die Frequenzunschärfe ist ∆ω ≈ π/T , und die Unsicherheit in der Zeit ist ∆t ≈ T /2. Daraus folgt π ∆Ephot · ∆t ≈ ~ , 2 in Einklang mit der Energie-Zeit-Unschärferelation. Wir erkennen an diesem Beispiel, dass bei strahlungsinduzierten atomaren Übergängen die Energie nur näherungsweise erhalten ist, sofern man für die Quantenenergie der Strahlung den mittleren Wert ~ω0 einsetzt. Experimentell wird man den Absorptionsvorgang mit Laserstrahlung untersuchen, die natürlich immer auf ein endliches Zeitintervall T eingeschränkt ist. Man kennt die mittlere Frequenz ω0 der Strahlung genau, aber die Frequenz ω eines Photons, welches den atomaren Übergang auslöst, ist nur mit einer Unschärfe von ∆ω ≈ π/T bekannt. Eine weitere Energieunschärfe folgt aus der endlichen Lebensdauer angeregter Atomniveaus, die eine gewisse Unschärfe der Energie Ef zur Folge hat. Ähnliche Energieunschärfen findet man bei 1 sin( u ) u 2 0.5 0 2 1 0 1 2 u π Abbildung 8.3: Die Funktion (sin u/u)2 . Streuprozessen. 8.4.2 Stimulierte Emission Für den Fall Ef < Ei ⇒ ωf i < 0 dominiert der erste Term in der eckigen Klammer von Gl. (8.27) und hat einen Resonanznenner bei ω0 = |ωf i | (die Frequenz des eingestrahlten Feldes ist natürlich immer positiv). Mit der neuen Hilfsvariablen u0 = (ωf i + ω0 )T /2 wird |cf (T )|2 = e2 sin2 u0 |(E0 · r f i )|2 · T 2 . 2 4~ u02 92 (8.32) Die stimulierte Emission erfordert also genau wie die Absorption die ungefähre Erhaltung der Energie im Rahmen der Unschärferelation Ei + ~ω0 ≈ Ef + 2~ω0 , wenn man für die Photonen-Energie den mittleren Wert ~ω0 einsetzt. Was lernen wir aus diesen Rechnungen? • Eine periodische Störung kann nur dann zu einem Übergang Ei → Ef führen, wenn die Resonanzbedingung erfüllt ist ~ω0 ≈ |Ef − Ei | . • Es gibt eine Energieunschärfe in Einklang mit der Unschärferelation ∆E · ∆t ≥ ~ . • Es gibt den Vorgang der Absorption (für Ei < Ef ) und der stimulierten Emisson (für Ei > Ef ), beide haben die gleiche Wahrscheinlichkeit. • Die Übergangsamplitude ist proportional zum Übergangsmatrixelement (8.28) des elektrischen Dipolmoments ZZZ ψf∗ (r) r ψi (r)d3 r . e rf i = e Die hier betrachteten Strahlungsübergänge nennt man elektrische Dipolübergänge, weil das Matrixelement e r f i des elektrischen Dipolmoments eingeht. Der mathematische Grund ist, dass wir das elektrische Feld als räumlich konstant angenommen haben. Für optische Übergänge in Atomen ist dies gerechtfertigt, denn die typischen Lichtwellenlängen sind sehr viel grösser als der Atomradius. Die γ-Strahlung der Atomkerne wird jedoch nicht durch Dipolübergänge verursacht, da im Kern nur positiv geladene und neutrale Teilchen existieren und daher das elektrische Dipolmoment identisch null ist. Die dominanten γ-Übergänge sind elektrische Quadrupol- und magnetische Dipol-Übergänge. 8.5 Auswahlregeln für optische Übergänge Ein elektrischer Dipolübergang kann nur dann auftreten, wenn das Matrixelement e r f i 6= 0 ist. Man kann generell beweisen, dass sich hieraus folgende Regeln für die Änderung der Bahndrehimpulsquantenzahl l und der magnetischen Quantenzahl m = ml ergeben ∆l = lf − li = ±1 ∆m = mf − mi = 0, ±1 . (8.33) (Zur Vereinfachung schreiben wir hier m statt ml , um zu viele Indizes zu vermeiden). Ein sehr wichtiges Resultat, das aber merkwürdigerweise in kaum einem Lehrbuch hervorgehoben wird, ist der Befund, dass die Hauptquantenzahl keiner Einschränkung unterliegt: ∆n = 0, ±1, ±2, . . . . (8.34) Dies ist die wesentliche Voraussetzung für die Existenz der Spektralserien, etwa der Balmerserie im Wasserstoff, die den Übergängen En → E2 mit n = 3, 4, 5, 6, . . . entspricht. Die Übergangsmatrixelemente werden in Anhang H berechnet. 93 8.6 Die Einstein-Koeffizienten Von Albert Einstein wurde schon im Jahr 1917, lange vor Entstehung der Quantenmechanik, ein Zusammenhang zwischen Emissions- und Absorptionsvorgängen im thermodynamischen Gleichgewicht gefunden. Um konsistente Resultate zu erhalten, musste Einstein dabei den Prozess der stimulierten (induzierten) Emission “erfinden”, der zu dieser Zeit unbekannt war. Wir betrachten elektromagnetische Strahlung im thermodynamischen Gleichgewicht mit erhitzter Materie der absoluten Temperatur T (Beisp. Sonne, das Innere eines Hochofens, näherungsweise eine Glühlampe). Es wird dann ein kontinuierliches Frequenzspektrum emittiert, dessen spektrale Energiedichte durch die Plancksche Strahlungsformel gegeben ist: ρ(ω) = ω2 ~ω · . 2 3 π c exp ~ω − 1 kB T (8.35) Die Photonen können beliebige Frequenzen, Richtungen und Polarisation haben. Es gibt daher ausserordentlich viele verschiedene Zustände für die Photonen. Nehmen wir an, wir hätten Atome mit zwei Niveaus E1 und E2 , die sich zusammen mit der Strahlung in einem Kasten befinden. Die Wahrscheinlichkeit für Absorption E1 → E2 ist proportional zur Energiedichte ρ(ω) der Strahlung bei der Frequenz ω = (E2 − E1 )/~ Wabs = B12 ρ(ω) . (8.36) Die Emission hat zwei Anteile: Die stimulierte Emission ist proportional zu ρ(ω), die spontane Emission ist unabhängig von der vorhandenen Strahlungsdichte Wem = Wstim + Wspont = B21 ρ(ω) + A21 . (8.37) Die Zahl N2 der Atome im oberen Niveau erhöht sich durch Absorption und vermindert sich durch Emission von Photonen: dN2 = Wabs N1 − Wem N2 = B12 ρ(ω) N1 − (B21 ρ(ω) + A21 ) N2 . dt (8.38) Im thermodynamischen Gleichgewicht ist dN2 /dt = 0, und gemäß der Boltzmannverteilung gilt N1 ~ω E2 − E1 = exp = exp . N2 kB T kB T Setzen wir dies in (8.38) ein, so folgt B12 ρ(ω) exp[~ω/(kB T )] = A21 + B21 ρ(ω) und daher ρ(ω) = A21 /B12 . exp[~ω/(kB T )] − B21 /B12 (8.39) Durch Vergleich mit der Planck-Strahlungsformel (8.35) finden wir: B21 = B12 und A21 = ~ω 3 B21 . π 2 c3 (8.40) Die erste Gleichung besagt, dass die Wahrscheinlichkeiten für Absorption und stimulierte Emission gleich sind. Wir wissen dies bereits aus der störungstheoretischen Behandlung. Die zweite Gleichung stellt einen Zusammenhang zwischen der stimulierten und spontanen Emission im thermodynamischen Gleichgewicht her: Wstim B21 ρ(ω) 1 = = . Wspont A21 exp[~ω/(kB T )] − 1 94 (8.41) Die Lichtwellen im Kasten werden durch optische Eigenschwingungen dargestellt. Jede Eigenschwingung verhält sich wie ein harmonischer Oszillator, dessen Energie den Wert (n + 1/2)~ω hat, wobei n die Zahl der Photonen in dieser Eigenschwingung ist. Im thermodynamischen Gleichgewicht ist die mittlere Zahl dieser Photonen n= 1 exp[~ω/(kB T )] − 1 (8.42) und die mittlere Energie eines harmonischen Oszillators (abzüglich der Nullpunktsenergie ~ω/2) E= ~ω ≡ n ~ω . exp[~ω/(kB T )] − 1 (8.43) Damit können wir schreiben Wstim = n Wspont . (8.44) Zwei Fälle sollen betrachtet werden. (a) Hohe Frequenzen: ~ω kB T bei Raumtemperatur, T = 293 K. Dies gilt für sichtbares Licht und Röntgen/γ-Strahlung. Die mittlere Zahl der Photonen in einem definierten Quantenzustand ist im thermodynamischen Gleichgewicht sehr klein, n 1. Die spontane Emission ist viel wahrscheinlicher als die stimulierte Emission, was auch sofort aus Gl. (8.41) folgt. Der Laser ist ein Gegenbeispiel, dort ist n 1. Man muss sich aber klarmachen, dass der Laser ein System darstellt, welches extrem weit vom thermodynamischen Gleichgewicht entfernt ist, da eine Besetzungsinversion vorliegt. Die Gleichung (8.44) ist daher nicht auf Laser anwendbar. (b) Niedrige Frequenzen, ~ω kB T . Das gilt im Mikrowellengebiet. Dann ist n 1, und die stimulierte Emission dominiert völlig. Ein wichtiges Beispiel mit praktischer Bedeutung ist die magnetische Kernresonanz, die genaueste Methode zur Messung von Magnetfeldern und die Grundlage der Kernspintomographie. Ein Proton hat in einem Magnetfeld B zwei Energieniveaus E1 = −µB und E2 = +µB. Durch Einstrahlen von Hochfrequenz mit ~ω = 2µB kann man Umklappen der Spins erreichen. Für B = 1 Tesla erhält man eine Frequenz f = ω/(2π) = 40 MHz. Bei Raumtemperatur ist ~ω/(kB T ) ≈ 10−5 , d.h. die spontane Emission ist im Vergleich zur stimulierten Emission völlig vernachlässigbar. 95 Kapitel 9 Die nichtlokale Natur der Quantentheorie Entwurf. Hinweise und Verbesserungsvorschläge werden dankbar entgegen genommen. 9.1 Das Einstein-Podolsky-Rosen-Paradoxon Die unanschaulichen Aspekte der Quantenphysik lassen sich zum großen Teil auf den TeilchenWelle-Dualismus zurückführen. In diesem Kapitel werden wir auf eine weitere Absonderlichkeit eingehen, die Verschränkung (engl. entanglement), die zur Folge hat, dass die Quantenmechanik eine nichtlokale Theorie ist. Im Jahr 1935 wurde von Albert Einstein, Boris Podolski und Nathan Rosen (EPR) eine berühmt gewordene Arbeit publiziert mit dem Titel Can Quantum-Mechanical Description of Physical Reality Be Considered Complete? (Physical Review 47, p. 777, 1935), in der sie zu der Aussage kommen, dass die Beschreibung der Wirklichkeit durch eine Wellenfunktion unvollständig sei. Wir wollen ihre Argumentation hier nur kurz andeuten und im nächsten Abschnitt eine Variante des EPR-Gedankenexperiments diskutieren. Die Autoren betrachten zwei Systeme 1 und 2, die nur für einen begrenzten Zeitraum 0 < t < T miteinander wechselwirken und danach vollständig entkoppelt sind. Man kann dabei an zwei Atome denken, die zunächst eng benachbart sind und dann sich weit voneinander entfernen. EPR argumentieren, dass es möglich sein sollte, die Heisenbergsche Unschärferelation im System 2 zu umgehen, indem man ausschliesslich Messungen komplementärer Größen im System 1 vornimmt. Da nach Voraussetzung zum Zeitpunkt der Messungen keinerlei Wechselwirkung zwischen den Systemen existiert, dürfte in System 2 auch keine Veränderung eintreten als Konsequenz einer Messung, die am System 1 vorgenommen wird. Die Schlussfolgerung von Einstein, Podolsky und Rosen ist, dass die Quantenmechanik unvollständig sei. Sie äußern ihre Überzeugung, dass eine umfassendere Theorie existieren sollte. Niels Bohr hat der EPR-Argumentation widersprochen (Physical Review 48, p. 696, 1935) und insbesondere darauf hingewiesen, dass eine Messung am System 1 doch einen Einfluss auf System 2 hat, sofern man die Quantentheorie konsequent anwendet. Später ist das EPRParadoxon von David Bohm näher untersucht worden, wir besprechen seine Abwandlung des EPR-Gedankenexperiments weiter unten. John Bell hat analysiert, ob es “verborgene Variable” geben könnte, die zusätzliche Informationen enthalten, die nicht bereits in der Wellenfunktion stecken. In diesem Fall müssten die sog. Bellschen Ungleichungen erfüllt sein. Neue experimentelle Resultate zeigen, dass die Bellschen Ungleichungen verletzt sind und dass es keine hidden variables in der Quantentheorie gibt. Auf diese Aspekte wollen wir nicht näher eingehen. 96 9.2 Verschränkung Wir diskutieren ein Gedankenexperiment zum EPR-Paradoxon, das auf D. Bohm und Y. Aharonov (Phys. Rev. 108, 1070 (1957)) zurückgeht. Betrachtet wird ein neutrales Molekül mit Spin 0, das aus zwei Atomen mit Spin 1/2 aufgebaut ist1 . Ein Beispiel ist das Wasserstoffmolekül H2 , in dem die Spins der beiden bindenden Elektronen antiparallel ausgerichtet sind. Genauer gesagt befindet sich das Molekül im Spinsingulett-Zustand (5.34) 1 |0, 0i = √ { | ⇑i1 | ⇓i2 − | ⇓i1 | ⇑i2 } 2 (9.1) Hierbei bedeutet der erste Term | ⇑i1 | ⇓i2 , dass Elektron 1 die Spinkomponente +~/2 in zRichtung hat und Elektron 2 die Spinkomponente −~/2. Im zweiten Term | ⇓i1 | ⇑i2 ist es umgekehrt. Die Atome werden dann durch eine Methode getrennt, die den Spin nicht beeinflusst. Nachdem sie sich so weit voneinander entfernt haben, so dass sie nicht mehr wechselwirken, wird die z-Komponente des Spins von Atom 1 gemessen, der Messwert sei beispielsweise +~/2. Da der totale Spin 0 ist, kann man unmittelbar schließen, dass die z-Komponente des Spins von Atom 2 den entgegengesetzten Wert −~/2 haben muss. Wenn dies ein klassisches System wäre, so würde die Antiparallelität auch für die x- und y-Komponenten der beiden Spinvektoren gelten, da alle Komponenten des Spins zu jedem Zeitpunkt wohldefiniert sind. Im Molekül hat nämlich jede Komponente des Spinvektors von Teilchen 2 den entgegengesetzten Wert derselben Komponente des Spinvektors von Teilchen 1, und diese Relation ändert sich nicht bei der Aufspaltung des Moleküls. Mit anderen Worten, die beiden Spinvektoren sind korreliert. Auch bei großen Abständen kann der Spin von Atom 2 indirekt durch Messung des Spins von Atom 1 bestimmt werden, ohne dass das Atom 2 eine Messapparatur durchläuft und ohne dass eine Wechselwirkung zwischen den beiden Atomen vorhanden ist. In der Quantentheorie wird das komplizierter, weil nur eine Komponente des Spinvektors einen definierten Wert haben kann und die beiden anderen Komponenten unbestimmt sind. Wir betrachten zunächst den Fall, dass die beiden Atome noch so nahe beieinander sind, dass sich ihre Ortswellenfunktionen überlappen, was nach quantenmechanischem Verständnis eine Wechselwirkung zwischen den Atomen impliziert. Könnten wir die Spinausrichtung von Atom 1 messen und würden finden, dass sein Spin nach “oben” zeigt (Zustand | ⇑i1 ), so wäre aufgrund der Spinfunktion (9.1) klar, dass der Spin von Atom 2 nach “unten” zeigen muss (Zustand | ⇓i2 ). In Matrixdarstellung gilt ~ Sbz = 2 1 0 0 −1 , | ⇑i = 1 0 , | ⇓i = 0 1 Wie sieht es mit den anderen Komponenten aus? Man kann leicht zeigen, dass (9.1) auch ein Singulettzustand bezüglich einer anderen Komponente des Spinoperators ist. Wir wählen die x-Komponente ~ 0 1 Sbx = 1 0 2 1 Es wird hier nur der Elektronen-Spin betrachtet. Die Spinausrichtung der beiden Atomkerne spielt für die molekulare Bindung praktisch keine Rolle, und zur Vereinfachung ignorieren wir die Kern-Spins. Das ist üblich in der Molekülphysik. 97 Die Eigenzustände von Sbx sind | ⇒i ≡ | ⇐i ≡ 1 √ 2 1 √ 2 1 = √ ( | ⇑i + | ⇓i ) 2 1 1 = √ ( | ⇑i − | ⇓i ) −1 2 1 1 (9.2) Der Singulettzustand bezüglich der x-Komponente lautet 1 |0, 0i(x) = √ { | ⇒i1 | ⇐i2 − | ⇐i1 | ⇒i2 } 2 (9.3) Durch eine einfache algebraische Rechnung kann man sich davon überzeugen, dass |0, 0i(x) = −|0, 0i gilt. Wenn man also statt der z-Komponente die x-Komponente des Spins von Atom 1 misst und findet, dass der Spin nach “rechts” zeigt, entsprechend dem Zustand | ⇒i1 , so zeigt der Spin von Atom 2 automatisch nach “links” (Zustand | ⇐i2 ). Die Messung könnte aber genauso gut ergeben, dass Atom im Zustand | ⇐i1 ist und Atom 2 im Zustand | ⇒i2 . Die Spin-Singuletts (9.1) und (9.3) sind verschränkte Zustände (der Begriff der Verschränkung wurde 1935 von Schrödinger geprägt). Die Spinausrichtung eines Atoms ist nicht definitiv festgelegt, sie ist aber mit der des anderen Atoms korreliert. Wie wir gerade gesehen haben, gilt diese Korrelation für jede beliebige Komponente des Spins. Die entscheidende Frage ist, über welche Entfernung diese Korrelation bestehen bleibt. (a) Kurzreichweitige Korrelation EPR machen die Annahme, dass es nur einen begrenzten Wechselwirkungsbereich gibt und dass außerhalb dieses Bereichs die beiden Atome nichts mehr miteinander zu tun haben. Diese Sichtweise erscheint sehr vernünftig und wurde über viele Jahrzehnte von den meisten Physikern geteilt. Spätestens am Rande dieses Wechselwirkungsbereichs müssten die Atome sich dann entscheiden, welche Spineinstellung sie einnehmen wollen. Entscheidet sich Atom 1 für den Zustand | ⇑i, so nimmt automatisch Atom 2 den Zustand | ⇓i ein. Jetzt fliegen die Atome zu ihren weit entfernten Detektoren. Die Spinfunktion des Gesamtsystems ist | ⇑i1 | ⇓i2 (9.4) Diese Produktfunktion ist keine verschränkte Zustandsfunktion mehr, die Spinausrichtungen der beiden Atome sind wohldefiniert. Wenn die Stern-Gerlach-Anordungen in vertikaler Richtung orientiert sind, wird man - wie erwartet - Atom 1 mit Spin nach oben und Atom 2 mit Spin nach unten messen. Jetzt tut der Experimentator etwas Schreckliches: er dreht die Stern-GerlachAnordungen um 90◦ , so dass sie die Spinausrichtung in x-Richtung messen. Was kommt dabei heraus? Wir können die Produkt-Spinfunktion (9.5) wie folgt umschreiben | ⇑i1 | ⇓i2 = = 1 {| ⇒i1 + | ⇐i1 } {| ⇒i2 − | ⇐i2 } 2 1 {| ⇒i1 | ⇒i2 − | ⇒i1 | ⇐i2 + | ⇐i1 | ⇒i2 − | ⇐i1 | ⇐i2 } 2 (9.5) Aus dieser Wellenfunktion ergibt sich, dass alle vier Spinkombinationen: rechts-rechts, rechtslinks, links-rechts und links-links mit einer Wahrscheinlichkeit von jeweils 25% auftreten sollten. 98 (b) Langreichweitige Korrelation Die Quantentheorie enthält keine Einschränkung hinsichtlich der Reichweite der Korrelation. Wenn man die Quantentheorie ernst nimmt, muss man die verschränkte Spinfunktion 1 |0, 0i ≡ |0, 0i(z) = √ { | ⇑i1 | ⇓i2 − | ⇓i1 | ⇑i2 } 2 auch bei beliebig großen Abständen der beiden Atome verwenden. Gleichwertig damit ist die verschränkte Singulett-Funktion bezüglich der x-Komponente des Spins 1 |0, 0i(x) = √ { | ⇒i1 | ⇐i2 − | ⇐i1 | ⇒i2 } 2 sowie eine analoge Funktion bezüglich der y-Komponente. In diesem Fall wird man auch bei großen Abständen eine strikte Korrelation der Spins messen: (oben-unten, unten-oben) oder (rechts-links, links-rechts). Der Experimentator darf sogar während der Flugzeit der Atome die Orientierung seines Spindetektors ändern. Eine Kombination, die einen Gesamtspin ungleich null ergibt (oben-oben, unten-unten, rechts-rechts, links-links) wird nie beobachtet werden, ebenso wenig wie eine Kombination der Art oben-rechts, oben-links etc. Experimentelles Resultat: die Verschränkung hat eine lange Reichweite Die Frage, ob die Korrelation durch verschränkte Wellenfunktionen eine kurze oder lange Reichweite hat, lässt sich nicht mit theoretischen Argumenten beantworten (die großen Gelehrten Albert Einstein und Niels Bohr sind zu konträren Aussagen gelangt), sie muss vielmehr experimentell entschieden werden. Die Experimente mit verschränkten Photonen (siehe unten), die insbesondere von Anton Zeilinger und Mitarbeitern durchgeführt worden sind, geben eine klare Antwort: die Verschränkung kann sich über viele Kilometer erstrecken. Die Quantentheorie ist damit eine nichtlokale Theorie. Dies ist ein sehr erstaunliches Resultat. Wenn Beobachter A die Spinausrichtung von Atom 1 misst, weiss er mit Sicherheit, dass Beobachter B in exakt demselben Moment die entgegengesetzte Spinausrichtung bei Atom 2 messen würde. Die Gesetze der Relativitätstheorie scheinen außer Kraft gesetzt, denn wenn A und B viele Kilometer voneinander entfernt sind, würde ein Licht- oder Radiosignal von A nach B eine “lange” Zeit von vielen Mikrosekunden brauchen. Es ist nicht verwunderlich, dass gleich nach der experimentellen Verifikation der langreichweitigen Zustandsverschränkung Spekulationen aufkamen, ob man nicht doch die Relativitätstheorie austricksen könnte, um Signale mit Überlichtgeschwindigkeit zu übermitteln. Die generelle Meinung ist, dass dies nicht funktionieren kann. Beobachter A weiss zwar, was Beobachter B exakt in dem Moment messen würde, in dem er seine eigene Messung durchführt, aber damit hat er dem Beobachter B noch keine Information übermittelt, denn dieser kennt ja nicht das Ergebnis der Messung von A. Um ihm dies mitzuteilen, braucht Beobachter A ein Standard-Signal mit der endlichen Ausbreitungsgeschwindigkeit c = 3 · 108 m/s, z.B. einen Laserpuls. Es ist allerdings zu vermuten, dass ausgeklügelte Anordnungen erfunden werden mit dem Ziel, diese Begrenzung zu umgehen. Wir wagen die Prognose, dass diese Ansätze ebenso im Sande verlaufen werden wie die Suche nach einem Perpetuum Mobile im 19. Jahrhundert. Um die Unmöglichkeit eines Perpetuum Mobile zu beweisen, braucht man nicht auf den möglicherweise komplizierten und schwer durchschaubaren Mechanismus einer speziellen Apparatur einzugehen: der Energieerhaltungssatz allein ist hinreichend dafür. In ähnlicher Weise kann man Informationsübertragung mit Überlichtgeschwindigkeit ausschliessen: die Übermittlung von Information ist gekoppelt mit 99 einem Transport von Energie (das ist offensichtlich bei Radiowellen oder Laserstrahlen), und Energietransport kann maximal mit der Geschwindigkeit c erfolgen. Wir danken Prof. Erich Lohrmann für dies Argument. Albert Einstein war sich bewusst, dass die Quantentheorie diese spukhafte Fernwirkung impliziert, wie er sie nannte. Er hielt das jedoch für absurd und war deshalb der Meinung, dass die Quantentheorie nicht die letztgültige Theorie sein könne. Alle experimentellen Daten deuten aber darauf hin, dass nicht Albert Einstein recht hatte, sondern Niels Bohr. Die Quantentheorie ist wirklich so merkwürdig, Wellenfunktionen können sich über viele Kilometer erstrecken. Die von EPR gemachte Annahme, dass die betrachteten Systeme 1 und 2 nach Ablauf ihrer Wechselwirkungszeit T (also bei großer räumlicher Trennung) nichts mehr miteinander zu tun haben und sich nicht gegenseitig beeinflussen können, äußert sich mathematisch darin, dass die Gesamtwellenfunktion als Produkt der Einzelwellenfunktionen geschrieben wird wie in Gl. (9.4). Bei einer Produktwellenfunktion kann man eine Messung am System 1 machen, ohne den Zustand von System 2 zu ändern. Bei einer verschränkten Wellenfunktion wie in Gl. (9.1) führt dagegen eine Messung am System 1 zu einer massiven Änderung der Wellenfunktion von System 2: je nach Ausgang der Messung ist die Spinwellenfunktion entweder | ⇓i2 oder | ⇑i2 . Es fällt schwer, dafür eine anschauliche Vorzustellung zu entwickeln. Verschränkte Photonen Wenn ultraviolettes Laserlicht einen nichtlinearen Kristall durchläuft, entstehen im Kristall Lichtfelder bei niedrigeren Frequenzen2 . Im Quantenbild bedeutet dies, dass sich ein UV-Photon in zwei rote Photonen umwandelt, wobei Energie-Erhaltung gilt: ~ω0 = ~ω1 +~ω2 . Die Photonen werden auf zwei Kegelmänteln emittiert (s. Abb. 9.1) und sind orthogonal zueinander polarisiert. Die auf den Schnittlinien der Kegel emittierten Photonen haben die gleiche Energie und sind in ihrer Polarisation verschränkt. Zur Messung der Polarisation werden zwei Analysatoren Abbildung 9.1: Die Erzeugung verschränkter Photonen. Im Bild entsteht ein vertikal polarisiertes Photon auf dem oberen Kegel und ein horizontal polarisiertes Photon auf dem unteren Kegel. Die auf den hellblau gezeichneten Schnittlinien emittierten Photonen haben die gleiche Energie und sind in ihrer Polarisation verschränkt. verwendet, die um die jeweilige Strahlachse drehbar sind. Sind beide orthogonal zueinander ori2 Wir folgen hier einem Artikel von Anton Zeilinger in Spektrum der Wissenschaft, Dossier 2/10 (2010). 100 entiert, z.B. horizontal/vertikal oder vertikal/horizontal, so findet man, dass die Photonen die genau diese Polarisationsrichtungen aufweisen. Aber auch wenn beide Analysatoren synchron um einen beliebigen (aber gleichen) Winkel verdreht werden, misst man die zwei Photonen genau mit diesen gedrehten Polarisationen. Aus klassischer Sicht ist dies ein höchst befremdliches Resultat. Es bedeutet, dass die Polarisationsebenen der Photonen vor ihrem Nachweis beliebig sind und erst in dem Moment festgelegt werden, wenn eines der Photonen seinen Analysator durchläuft. Das zweite Photon ist dann automatisch senkrecht zum ersten polarisiert. Um die Seltsamkeit dieses Verhaltens zu illustrieren, diskutiert Zeilinger ein Gedankenexperiment mit zwei verschränkten Würfeln. Bei jedem Wurf zeigen die Würfel eine zufällige Augenzahl, aber wenn sie verschränkt sind, zeigen die beiden Würfel immer dieselbe Zahl. Durch Verwendung elektro-optischer Modulatoren kann die Drehung der Polarisationsebenen sehr schnell erfolgen, und zwar innerhalb der Flugzeit der Photonen von ihrer Quelle bis zu den Analysatoren. Zum Zeitpunkt der Erzeugung der Photonen haben die Analysatoren eine andere Orientierung als zum Zeitpunkt des Nachweises. Die perfekte Korrelation der Photonen wird auch dann beobachtet, wenn der Verdrehwinkel rein zufällig eingestellt wird. Die Verschränkung der Photonen ist über eine Strecke von 140 km experimentell nachgewiesen worden (zwischen La Palma und Teneriffa). 9.3 Schrödingers Katze Angeregt durch den EPR-Artikel hat Erwin Schrödinger im Jahr 1935 ein Gedankenexperiment vorgeschlagen, dass zeigen sollte, wie im Prinzip eine mikroskopische quantenmechanische Superposition auf ein makroskopisches Objekt übertragen werden könnte. Schrödinger wollte an diesem absurd wirkenden Beispiel die Unvollständigkeit und Unglaubwürdigkeit der Quantenmechanik demonstrieren. Das Gedankenexperiment besagt: In einem geschlossenen Kasten befinden sich eine Katze und ein instabiler Atomkern, der mit einer gewissen Wahrscheinlichkeit pro Zeiteinheit zerfällt. Der Zerfall des Atomkerns werde von einem Geigerzähler detektiert. Im Falle einer Detektierung werde Giftgas freigesetzt, welches die Katze tötet. Gemäß der Quantenmechanik befindet sich der Atomkern in einer Superposition des angeregten und des Grundzustands. Demnach sollte sich auch die Katze in einem Superpositionszustand befinden, lebendig und tot. In der weiteren Diskussion halten wir uns eng an einen hervorragend geschriebenen Artikel von Serge Haroche (Physics Today, July 1998): Entanglement, Decoherence and the Quantum/Classical Boundary Wie Haroche treffend bemerkt, ist die Quantenmechanik sehr verwirrend. Ein Teilchen kann delokalisiert sein, es kann sich gleichzeitig in verschiedenen Energiezuständen befinden und es kann sogar verschiedene Identitäten auf einmal haben. Dieses schizophrene Verhalten ist in der Wellenfunktion codiert, die immer als Superposition von Quantenzuständen geschrieben werden kann, von denen jeder durch eine komplexe Wahrscheinlichkeitsamplitude charakterisiert ist. Interferenzen zwischen diesen Amplituden treten auf, wenn das Teilchen verschiedenen, nicht unterscheidbaren Pfaden folgen kann. Jeder Versuch zu entscheiden, welcher Trajektorie das Teilchen folgt, zerstört diese Interferenzen. Dies ist eine Manifestation der Welle-TeilchenKomplementarität. Die Nichtlokalität ist sogar noch verwirrender. In den letzten Jahrzehnten sind viele “EPRExperimente” durchgeführt worden, um zu testen, ob die Natur diese unplausible Nichtlokalität zeigt. In diesen Experimenten ist die Wellenfunktion eines Paars von auseinander fliegenden Teilchen durch eine untrennbare Superposition von Zuständen verschränkt. Der Quantenformalismus sorgt dafür, dass der Nachweis eines der Teilchen einen sofortigen Einfluss auf das andere 101 Teilchen hat, selbst wenn dieses sehr weit entfernt ist. Der Experimentator darf sogar seine Entscheidung über die Art der Messung verzögern, bis die Teilchen ihren Wechselwirkungsbereich verlassen haben. Die Experimente demonstrieren in klarer Weise, dass der Zustand eines Teilchens immer mit dem Ergebnis der Messung an dem anderen Teilchen korreliert ist, und zwar in der seltsamen, von der Quantentheorie vorhergesagten Weise. Die Resultate dieser Experimente widersprechen unserer Anschauung. Solche Vorgänge werden in unserer makroskopischen Welt niemals beobachtet. Eine Billardkugel geht nicht gleichzeitig durch zwei Löcher. Wenn zwei Kugeln zusammenstoßen und sich danach weit voneinander entfernen, wird eine Messung an Kugel 1 keinerlei Einfluss auf Kugel 2 haben. Ist die Quantenmechanik auf Schrödingers Katze anwendbar? Nun sind aber makroskopische Objekte aus Atomen aufgebaut, die jedes für sich der Quantenmechanik gehorchen. Hier liegt das Paradox, das Erwin Schrödinger mit seinem provokativen Gedankenexperiment illustrierte. Er beschrieb eine diabolische Situation, in der eine Katze mit einem einzelnen Atom verschränkt ist. Das System würde durch eine Wellenfunktion beschrieben werden, die gleichzeitig die lebendige Katze zusammen mit dem angeregten Atom repräsentiert und die tote Katze zusammen mit dem Atom im Grundzustand, nachdem das emittierte Quant die tödliche Giftdosis ausgelöst hat. Quantenexperten werden einwenden, dass eine Katze ein komplexes und offenes System ist, welches nicht einmal zu Beginn dieses grausamen Experiments durch eine Wellenfunktion beschrieben werden kann. Es bleibt dennoch die wichtige Frage: warum und auf welche Weise verschwinden die Skurrilitäten der Quantenmechanik in großen Systemen? Dekohärenz in großen Systemen In den letzten 25 Jahren sind große Fortschritte im theoretischen Verständnis großer Systeme gemacht worden. Dort tritt eine Dekohärenz auf, die die quantenmechanischen Superpositionseffekte sehr rasch zum Verschwinden bringt. Die “Umgebung” hat einen signifikanten Einfluss auf die Dekohärenzzeit (d.h. die Zeitspanne, innerhalb derer die quantenmechanische Kohärenz verschwindet). Man kann eine Katze nicht von völlig von ihrer Umgebung isolieren und beispielsweise in einen Vakuumbehälter stecken, denn dann würde sie auch ohne die Giftkapsel sterben. Daher treffen die Moleküle der Luft auf die Katze und reduzieren die Interferenzeffekte. Man kann die Katze auch nicht in einen Flüssig-Helium-Kryostaten sperren, um die thermische 300Kelvin-Strahlung zu unterdrücken, und so treffen die zahlreichen Photonen dieser Strahlung auf das Tier. Durch die unvermeidliche Wechselwirkung mit der Umgebung sickert unweigerlich Information über das Quantensystem in die Umgebung mit der Konsequenz, dass die Quantenkohärenz beeinträchtigt wird. Genauere Analysen zeigen, dass die Dekohärenzzeit ganz rapide mit wachsender Systemgröße abnimmt. In makroskopischen Systemen sind die störenden Prozesse so effektiv, dass die Quantenkohärenz in unmessbar kurzer Zeit verschwindet. Was ist die Konsequenz? Eine Katze kann nicht in einem verschränkten Zustand existieren, vielmehr ist sie - genau wie in der klassischen Physik - entweder lebendig oder tot, aber nicht beides gleichzeitig. Wir können feststellen, dass die Quantenmechanik nach heutigen Erkenntnissen das Schrödingersche Gedankenexperiment unbeschadet “überstanden” hat. 102 Messung einer Dekohärenzzeit In dem oben genannten Artikel von Haroche wird ein Experiment zur Dekohärenz in einem mesoskopischen System beschrieben (mesoskopische Systeme liegen in ihrer Größe zwischen mikroskopischen Systemen (Atomen) und makroskopischen Systemen (Katzen)). Es wird eine Art von “Mini-Schrödinger-Katze” realisiert, die aus wenigen verschränkten Mikrowellenphotonen in einem supraleitenden Mikrowellenresonator besteht. Das Experiment ist sehr anspruchsvoll, sowohl im theoretischen Hintergrund als auch in der praktischen Realisierung, so dass wir nur sehr pauschal darauf eingehen können. Eine detaillierte Darstellung würde weit über den Rahmen dieses Skriptums hinausgehen. Die benutzte Apparatur haben wir bereits schematisch in Abb. 1.6 gezeigt, siehe auch die Diskussion in Kap. 1.2.3. Ein erstes Rubidium-Atom erzeugt einen verschränkten “Schrödinger-Katzen-Zustand” in dem supraleitenden Resonator, ein zweites, mit zeitlicher Verzögerung folgendes Atom tastet ab, ob die Verschränkung noch vorhanden ist oder ob inzwischen ein Übergang in ein inkohärentes Gemisch von Zuständen eingetreten ist. Durch Variation der Verzögerung kann die Dekohärenzzeit werden, der VOLUME 77, NUMBER 24 P H Ygemessen SICAL R E V I E WsieLliegt E T T genügt ERS 9 DECEM Formel We thank P. Goy for assistance with m tdecoh = τ /n̄ technology and AB Millimetre for the loan This was supported in part by E wobei τ = 160 µs die Dämpfungszeitkonstante der Resonatorschwingung ment. ist und n̄ work die mittlere No. ERBCHRXCT930114). Zahl der Mikrowellenphotonen. Eine Messung wird in Abb. 9.2 gezeigt. Für n̄ = 3 ergibt sich eine Dekohärenzzeit von etwa 50 µs. Im makroskopischen Fall n̄ 1 wird die Dekohärenzzeit unmessbar klein: die Dekohärenz einer realen Katze ist instantan. *Laboratoire de l’Université Pierre et Marie C l’ENS, associé au CNRS (URA18). [1] J. A. Wheeler and W. H. Zurek, Quantum Theo surement (Princeton Univ. Press, Princeton, NJ [2] E. Schrödinger, Naturwissenschaften 23, 807 (1935); reprinted in English in [1]. [3] J. von Neumann, in Matematische Grundlagen tenmechanik (Springer, Berlin, 1932); reprinted in [1]. [4] W. H. Zurek, Phys. Today 44, No. 10, 36 (199 [5] W. H. Zurek, Phys. Rev. D 24, 1516 (1981) (1982); A. O. Caldeira and A. J. Leggett, Physi dam) 121A, 587 (1983); E. Joos and H. D. Ze B 59, 223 (1985); R. Omnès, The Interpretatio tum Mechanics (Princeton University Press, Pri 1994). [6] R. J. Glauber, Phys. Rev. 131, 2766 (1963). [7] D. F. Waals and G. J. Milburn, Phys. Rev. A FIG. 5. (a) Two-atom correlation signal h versus n for n ­ (1985). 3.3, dy2p ­ 70 kHz, and t ­ 40 ms. (b) n-averaged h val[8] M. Brune et al., Phys. Rev. A 45, 5193 (1992) ues versus tyTr for dy2p ­ 170 kHz (circles) and dy2p ­ Abbildung 9.2: Gemessene70zeitliche Abnahme der in theoretical. dem “Schrödinger-Katzen-Experiment” [9] C. Monroe et al., Science 272, 1131 (1996). kHz (triangles). Dashed andKohärenz solid lines are In[10] B. Yurke and D. Stoler, Phys. Rev. Lett. 57, sets: pictorial representations of corresponding field compovon Brune et al., Observing the Progressive Decoherence of the “Meter” in a Quantum Measurement, nents separated by 2f. B. Yurke et al., Phys. Rev. A 42, 1703 (1990); Physical Review Letters 77, 4887 (1996). Die Dekohärenzzeit beträgt etwa 50 µs. Die wird ibid. Abbildung 33, 674 (1986); V. Buzek et al., Phys. 8190 (1992). in dem oben genannten Physics-Today-Artikel von S. Haroche diskutiert. Most strikingly, we observe that decoherence proceeds [11] C. N. Savage et al., Opt. Lett. 15, 628 (1990). at a faster rate when the distance between the two state [12] R. G. Hulet and D. Kleppner, Phys. Rev. Let components is increased. An effective decoherence time (1983). of 0.24Tr , much shorter than the photon decay time, [13] S. Haroche and J. M. Raimond, in Cavity is found for d ­ 70 kHz. A similar agreement with Electrodynamics, edited by P. Berman (Acad theory is obtained when comparing for the same dy2p New York, 1994), p. 123. value (70 kHz) the correlations signals corresponding to [14] M. Brune et al., Phys. Rev. Lett. 76, 1800 (19 different n values (5.1 and 3.3). We thus demonstrate the [15] P. Nussenzveig et al., Phys. Rev. A 48, 3991 ( basic features of the decoherence theory on this simple [16] N. F. Ramsey, Molecular Beams (Oxford U model, namely, the fast evolution in a measurement New York, 1985). [17] M. O. Scully et al., Nature (London) 351, 1 process of the “atom 1 meter” state towards a statistical S. Haroche et al., Appl. Phys. B 54, 355 (1992 mixture and the increasing difficulty to maintain quantum [18] T. Pfau et al., Phys. Rev. Lett. 73, 1223 (1 coherence when the distance between the components Chapman et al., Phys. Rev. Lett. 75, 3783 (199 of the mesoscopic superposition is increased. Using [19] M. Brune et al., Phys. Rev. Lett. 72, 3339 (19 higher Q cavities, we intend to increase n further and [20] L. Davidovich et al., Phys. Rev. A 53, 1295 (1 to study decoherence processes occurring even faster on [21] The calculation — to be published — generali now continuously vary, from the scale of Tr . We can 103 trary f values the derivation of [20], which wa microscopic to macroscopic, the size of the meter in to f ­ py2. It describes independently atom an ideal measurement process, allowing us to explore action and relaxation and neglects fluctuation the elusive boundary between the quantum and classical velocity as well as of atom number (possibi worlds. atoms in each preparation pulse). Anhang A Mathematische Hilfsmittel In diesem Anhang werden wichtige mathematische Begriffe und Beziehungen zusammengestellt und Rechenmethoden erläutert. Wir verzichten auf formale Definitionen und Beweise und bringen stattdessen viele Beispiele. A.1 Reelle und komplexe Zahlen Die natürlichen Zahlen 1, 2, 3, 4, 5, ... sind jedem Kind geläufig und brauchen hier nicht weiter erklärt zu werden. Die erste Abstraktion sind die ganzen Zahlen: 0, ±1, ±2, ±3, ..., die sich ergeben, wenn man zwei beliebige natürliche Zahlen voneinander subtrahiert. Die Division von ganzen Zahlen führt zu den rationalen Zahlen, die man alle in der Form r= m n schreiben kann, wobei m, n ganze Zahlen sind und n 6= 0 sein muss. Die natürlichen und die ganzen Zahlen sind Teilmengen der rationalen Zahlen. Eine wichtige Beobachtung ist, dass die rationalen Zahlen nicht ausreichen. Man kann beweisen, dass die Quadratwurzel aus 2 nicht als rationale Zahl dargestellt werden kann. Auch die wichtige Zahl π, das Verhältnis zwischen Umfang und Durchmesser eines Kreises, ist keine rationale Zahl. Als reelle Zahlen bezeichnet man die Gesamtmenge der rationalen Zahlen und der irrationalen Zahlen (das sind solche, die sich nicht als Bruch schreiben lassen). Die reellen Zahlen haben die Eigenschaft, dass ihr Quadrat immer positiv ist r2 ≥ 0 und nur null wird, wenn r = 0 ist. In der Mathematik und Physik erweist es sich als zweckmässig, noch einen Schritt weiter zu gehen und Zahlen zu definieren, deren Quadrat auch negativ werden kann. Dies sind die komplexen Zahlen die man in der Form schreiben kann z = x + iy mit reellen Zahlen x und y. Die imaginäre Einheit ist definiert durch √ i2 = −1 ⇒ i = −1 104 ÁmHzL ÁmHzL y z= x+ä y z=ãä Α sinHΑL -y Α cosHΑL ÂeHzL x ÂeHzL z*= x-ä y Abbildung A.1: Links: Darstellung der komplexen Zahlen z = x + iy und z ∗ = x − iy als Vektoren in der komplexen Zahlenebene. Rechts: Zusammenhang zwischen der komplexen Exponentialfunktion und den Cosinus- und Sinusfunktionen. Der Name imaginäre Einheit macht schon deutlich, dass man bei der Einführung dieser Größe einige Fantasie brauchte. x ist der Realteil der komplexen Zahl z und y der Imaginärteil: x = Re(z) , y = Im(z) , z = Re(z) + iIm(z) Die zu z konjugiert komplexe Zahl ist definiert durch z ∗ = x − iy Man kann die komplexen Zahlen als Vektoren in der sog. komplexen Ebene darstellen (Fig. A.1). Die Länge p des Vektors z = x + iy ist offensichtlich nach dem Satz von Pythagoras gegeben durch x2 + y 2 . Dies legt es nahe, den Absolutbetrag der Zahl z wie folgt zu definieren p p √ |z| = zz ∗ = (x + iy)(x − iy) = x2 + y 2 Aus der Abb. A.1 ersieht man, dass gilt x = |z| cos α , y = |z| sin α und daher z = |z| (cos α + i sin α) ≡ |z| eiα Hier benutzen wir den fundamentalen Zusammenhang zwischen der komplexen Exponentialfunktion und den Cosinus- und Sinusfunktionen eiα = cos α + i sin α , e−iα = cos α − i sin α Man erkennt sofort, dass eiα den Betrag 1 hat: p iα p e = (cos α + i sin α)(cos α − i sin α) = cos2 α + sin2 α = 1 Um das Argument der Exponentialfunktion besser lesbar zu machen, schreiben wir sie häufig in der Form exp(iα). 105 A.2 Zeigerdarstellung des komplexen Phasenfaktors In vielen Schulbüchern wird die komplexe Exponentialfunktion umgangen und eine Zeigerdarstellung zur Ermittlung von Interferenzmustern verwendet. Dies geht auf die Pfadintegralmethode von Richard Feynman zurück. Der Phasenfaktor wird durch den Zeiger einer Messuhr dargestellt. Eine Beschreibung ohne jede Formel findet man in dem Buch von Feynman “Quantenelektrodynamik - Die seltsame Theorie des Lichts und der Materie”, Piper-Verlag. Wir betrachten Abbildung A.2: Oben: Zeigerdarstellung des Phasenfaktors exp(i kx) = exp(i 2π x/λ) als Funktion von x/λ. Der Zeiger der Messuhr dreht sich im Anti-Uhrzeigersinn. Unten: Anwendung der Zeigerdarstellung auf den Doppelspalt. Zur Berechnung der Lichtwellenamplitude im Punkt P werden die beiden Pfeile vektoriell addiert: A = A1 + A2 . einen undurchsichtigen Schirm, in dem sich zwei schmale Spalte S1 und S2 mit einem Abstand a befinden. Der Schirm wird mit Licht der Wellenlänge λ beleuchtet, die Lichtquelle sei sehr weit entfernt, so dass das einfallende Licht als ebene Welle behandelt werden darf (in der Praxis kann man Laserlicht benutzen). Hinter den Spalten breitet sich das Licht als Zylinderwelle aus. Wir interessieren uns für das Interferenzmuster auf einem weit entfernten Beobachtungsschirm. Dazu wählen wir einen beliebigen Punkt P auf dem Schirm und vergleichen die beiden Lichtstrahlen, die von S1 und S2 nach P laufen. Die Strecken S1 P und S2 P haben verschiedene Längen L1 und L2 . Der Phasenfaktor der Lichtwelle ändert sich längs der Strecke S1 P um exp i 2π Lλ1 und längs der Strecke S2 P um exp i 2π Lλ2 . Jetzt wollen wir die komplexe e-Funktion vermeiden und messen die Längen L1 und L2 in Einheiten der Lichtwellenlänge. Dazu verwenden wir Messuhren, deren Zeiger genau eine Umdrehung pro Lichtwellenlänge machen. Längs der Strecke 106 S1 P wird die Messuhr U1 sehr viele Umdrehungen machen, da die Länge L1 viel größer als die Lichtwellenlänge ist. Entscheidend ist, dass im allgemeinen eine nicht vollständige Umdrehung übrig bleibt, und auf die kommt es an. Ganz entsprechend wird auch längs der Strecke S2 P eine Messuhr U2 sehr viele Umdrehungen machen. Um die Lichtamplitude im Punkt P zu bestimmen, müssen wir die Pfeile A1 und A2 der beiden Messuhren vektoriell addieren. Weisen sie in die gleiche Richtung, gibt es maximale Lichtintensität. Das ist offensichtlich im Symmetriepunkt O der Fall. Im Punkt P ist es der Fall, wenn die Uhren U1 und U2 sich um eine ganze Zahl von Umdrehungen unterscheiden. Das führt zu der Bedingung ∆L = L2 − L1 = nλ Aus der Abb. ?? sieht man leicht, dass ∆L = a sin θ ist. Wir erhalten damit die bekannte Formel für die Lage der Maxima in Doppelspaltinterferenzen a sin θ = nλ Interferenzminima ergeben sich wenn die Zeiger der Uhren in die entgegengesetzte Richtung weisen, d.h. für ∆L = 1/2 λ, 3/2 λ, ..... A.3 A.3.1 Grundregeln der Differential- und Integralrechnung Differentialrechnung Wir betrachten Funktionen f (x), die von einer reellen Variablen abhängen. Diese Variable wird hier mit x bezeichnet, aber anders als in der Physik verstehen wir darunter keine Ortskoordinate, sondern eine reelle Zahl ohne Dimension. Ein Beispiel ist die Funktion f (x) = 1 + 0.3x2 , die in Abb. A.3 skizziert ist. Um die Steigung der Kurve bei einem Punkt x = x0 zu ermitteln, bilden wir den Differenzenquotienten f (x0 + ∆x) − f (x0 ) ∆x wobei ∆x klein ist. Führt man den Grenzübergang (Limes) ∆x → 0 aus, erhalten wir den Differentialquotienten, der die Steigung der Tangente im Punkt x0 angibt. Die Funktion wird diffenzierbar genannt, wenn dieser Limes für alle Werte von x0 gebildet werden kann. Den Index “0llassen wir im Folgenden weg. Die Ableitung der Funktion am Ort x ist definiert durch f 0 (x) = df f (x + ∆x) − f (x) = lim dx ∆x→0 ∆x (A.1) Die meisten der in der Physik gebrauchten Funktionen sind differenzierbar. Ein Beispiel für eine nicht überall differenzierbare Funktion ist f (x) = |x|. Die Ableitung ist f 0 (x) = +1 für x > 0 und f 0 (x) = −1 für x < 0. Diese Funktion ist nicht differenzierbar bei x = 0. Einige wichtige Funktionen und ihre Ableitungen sind in Tabelle A.1 aufgelistet. Die Exponentialfunktion hat eine besondere Bedeutung in der Physik. Sie ist die einzige Funktion, die identisch mit ihrer Ableitung ist: f (x) = ex f 0 (x) = ex . Sie hat die Reihenentwicklung ex = 1 + x + ∞ X xn x2 x3 + + ... = 3 6 n! n=0 mit n! = n(n − 1)(n − 2)...1, also 4! = 4 · 3 · 2 · 1 = 24 (gesprochen n-Fakultät). Definitionsgemäss setzt man 0! = 1. Die Umkehrfunktion ist der natürliche Logarithmus, der nur für x > 0 definiert ist (im Limes x → 0 gilt ln x → −∞). Exponentialfunktion und Logarithmusfunktion werden in Abb. A.4 gezeigt. 107 4 3 2 1 0 0 1 2 3 Abbildung A.3: Kurvenverlauf der Funktion f (x) = 1 + 0.3x2 und Ermittlung der Steigung im Punkt x0 = 1. Hier hat ∆x den großen Wert ∆x = 1. Lässt man ∆x → 0 gehen, so wird aus der blau gezeichneten Geraden die Tangente im Punkt x0 . Tabelle A.1: Wichtige Funktionen und ihre Ableitungen Funktion f (x) Ableitung f 0 (x) xn nxn−1 sin x cos x cos x − sin x ex ex ln x √ x x := −2 , −1.95 .. 2 1/x √ 1/(2 x) x := 0.02 , 0.04 .. 2 8 2 f(x) = ln(x) 6 f(x) = exp(x) 0 4 2 2 0 2 0 4 2 0 1 2 Abbildung A.4: Kurvenverlauf der Exponentialfunktion und der Logarithmusfunktion. 108 Differentiationsregeln Summenregel (f + g)0 = f 0 + g 0 Produktregel (f g)0 = f 0 g + f g 0 , Beispiel (x3 sin x)0 = 3x2 sin x + x3 cos x Quotientenregel 0 f f 0g − f g0 = , g g2 Beispiel x2 sin x 0 = 2x sin x − x2 cos x sin2 x Kettenregel (f [g(x)])0 = f 0 [g] · g 0 (x) , Beispiel (sin[x3 ])0 = cos[x3 ] · 3x2 Taylorentwicklung Eine differenzierbare Funktion kann in einer kleinen Umgebung eines Punktes x0 in eine Taylorreihe entwickelt werden. Dadurch ist es in vielen Fällen möglich, die Funktion in der Nähe von x0 zu linearisieren. f (x) ≈ f (x0 ) + f 0 (x0 )(x − x0 ) für |x − x0 | 1 Dies folgt sofort aus der Definition des Differentialquotienten in Gl. (A.1). Beispiele f (x) = √ 1 + x oder f (x) = ln(1 + x). Wir wählen x0 = 0. √ 1 + x ≈ 1 + x/2 für |x| 1 ln(1 + x) ≈ x für |x| 1 Eine bessere Genauigkeit bietet die Taylorentwicklung bis zur 2. Ordnung, bei der man außer der Steigung der Kurve auch noch ihre Krümmung berücksichtigt: f (x) ≈ f (x0 ) + f 0 (x0 )(x − x0 ) + A.3.2 f 00 (x0 ) (x − x0 )2 2 für |x − x0 | 1 (A.2) Integralrechnung Die Fläche zwischen einer Kurve f (x) und der x-Achse in einem Intervall a ≤ x ≤ b bestimmen wir näherungsweise, indem wir das Intervall in n Abschnitte der Länge ∆x = b−a n unterteilen und die Summe S= n X f (xi )∆x i=1 mit xi = a + (i − 1)∆x berechnen (siehe Abb. A.5). Im Limes n → ∞ wird daraus das bestimmte Integral Z b n X f (x)dx = lim f (xi )∆x a n→∞ (A.3) (A.4) i=1 Unter einer Stammfunktion F (x) der Funktion f (x) versteht man eine Funktion, deren Ableitung gleich f (x) ist: F 0 (x) = f (x) 109 u := j 1 + ( j − 0.4) ⋅ 0.2 ( j) pexp := f u j 6 4 2 0 0 1 2 3 Abbildung A.5: Approximation des bestimmten Integrals Funktion ist f (x) = 1 + 0.3x2 . R3 1 4 f (x)dx durch die Summe (A.3). Die Hauptsatz der Differential- und Integralrechnung Sei F (x) eine Stammfunktion von f (x). Dann gilt Z a b f (x)dx = F (b) − F (a) (A.5) Stammfunktionen sind nicht eindeutig, man kann eine beliebige Konstante hinzuaddieren. Häufig schreibt man eine Stammfunktion in Form eines unbestimmten Integrals (es werden keine Integrationsgrenzen angegeben) Z F (x) = f (x)dx Das Differenzieren einer vorgegebenen Funktion macht in den meisten Fällen keine Schwierigkeiten, aber beim Integrieren ist dies anders. Für sehr viele Funktionen sind die Stammfunktionen nicht bekannt (im Programm Mathematica findet man praktisch alle bekannten unbestimmten Integrale). Manchmal helfen Integrationsregeln weiter. Besonders häufig verwendet man die partielle Integration: Z a b 0 f (x)g (x)dx = [f (b)g(b) − f (a)g(a)] − Z b f 0 (x)g(x)dx (A.6) a Auch wenn keine Stammfunktion bekannt ist, wird durch das unbestimmte Integral eine Funktion F (x) definiert, die man leicht auf dem Computer auswerten kann. A.4 A.4.1 Fourier-Reihe und Fourier-Integral Fourier-Reihe Die Sinus- und Cosinusfunktionen sind periodisch mit der Periode 2π: sin(x + 2π) = sin(x). Von Fourier wurde bewiesen, dass sich jede periodische Funktion, die beschränkt und stückweise stetig ist, als Linearkombination von Sinus- und Cosinusfunktionen darstellen lässt. Eine Funktion f (x) wird periodisch genannt, wenn es eine Zahl L > 0 gibt, so dass für alle x gilt f (x + L) = f (x) 110 Die Fourierreihe von f (x) lautet f (x) = ∞ ∞ n=1 n=1 X a0 X + an cos(nkx) + bn sin(nkx) 2 Die Koeffizienten werden wie folgt berechnet: Z L 2 f (x) cos(nkx)dx , an = L 0 2 bn = L Z 2π L (A.7) f (x) sin(nkx)dx (A.8) mit k = L 0 Als Beispiel betrachten wir die in Abb. A.6 gezeigte Dreieckskurve. Sie ist eine gerade Funktion (f (−x) = f (x)) und hat deswegen nur Cosinusterme sowie einen konstanten Term in der Fourierreihe 1 1 4 1 f (x) = − 2 cos(πx) + 2 cos(3πx) + 2 cos(5πx) + ..... 2 π 3 5 f(x) 1 0.5 3 2 1 0 1 2 3 x Abbildung A.6: Eine Dreieckkurve (blau) und die Summe der Terme der Fourierreihe mit n = 0, 1, 3 (rote Kurve). Gestrichelte rote Linie: der Term a0 /2 = 1/2. In der Elektrotechnik kommen häufig Funktionen vor, die periodisch in der Zeit sind f (t + T ) = f (t) Die Fourierreihe lautet analog zu Gl. (A.7) ∞ ∞ n=1 n=1 X a0 X f (t) = + an cos(nωt) + bn sin(nωt) 2 2π T (A.9) f (t) sin(nωt)dt (A.10) mit ω = Die Koeffizienten sind 2 an = T Z T f (t) cos(nωt)dt , 0 2 bn = T Z T 0 Mit Pulsgeneratoren kann man Rechteck-Pulsketten erzeugen, wie in Abb. A.7 gezeigt. Die hier dargestellte Funktion hat die Periode T = 2 und ist eine ungerade Funktion (f (−t) = −f (t)). Daher gibt es in der Fourierreihe nur Sinusterme. Unter Benutzung von Gl. (A.10) finden wir 4 1 1 f (t) = sin(πt) + sin(3πt) + sin(5πt) + ..... π 3 5 111 f(t) 1.5 2 1 0 1 2 t 1.5 Abbildung A.7: Eine periodische Folge von Rechteckpulsen (blau) und die Approximation durch eine Fourierreihe. Grüne Kurve: nur die 1. Ordnung n = 5. 4 π sin(πt), rote Kurve: alle Terme bis zur Ordnung Die Rechteckfunktion ist unstetig an den Stellen t = 0, ±T, ±2T..., d.h. dort macht die Funktion Sprünge und ist unendlich steil. Bei unstetigen Funktionen muss man die Fouriersumme bis zu sehr hohen Ordnungen n erstrecken, um die Sprünge einigermaßen zu reproduzieren. Die Fourierkoeffizienten sind proportional zu 1/n, die Konvergenz der Reihe ist schwach. Bei stetigen Funktionen wie bei der Dreieckskurve in Abb. A.6 konvergiert die Fourierreihe wesentlich schneller (in diesem Fall sind die Fourierkoeffizienten proportional zu 1/n2 ), und die Summe der Terme mit n = 0, 1, 3 liefert bereits eine gute Approximation. A.4.2 Fourier-Integral Auch nichtperiodische Funktionen lassen sich durch Überlagerung harmonischer Funktionen darstellen, wobei die Fouriersumme durch das Fourierintegral ersetzt wird. Die Voraussetzung ist, dass die Funktion quadratisch integrierbar ist, d.h. es muss gelten Z ∞ |f (x)|2 dx < ∞ −∞ Wir benutzen hier an Stelle der Sinus- und Cosinusfunktionen die komplexe Exponentialfunktion, die die Schreibweise wesentlich vereinfacht. Die Fourierdarstellung einer Funktion f (x) lautet Z ∞ 1 f (x) = √ f˜(k) exp(ikx)dk (A.11) 2π −∞ mit der Fouriertransformierten 1 f˜(k) = √ 2π Z ∞ f (x) exp(−ikx)dx (A.12) −∞ Es gilt das Parseval-Theorem Z ∞ −∞ |f (x)|2 dx = Z ∞ −∞ |f˜(k)|2 dk Für Funktionen der Zeit schreibt man analog Z ∞ Z ∞ 1 1 f (t) = √ f˜(ω) exp(iωt)dω , f˜(ω) = √ f (t) exp(−iωt)dt 2π −∞ 2π −∞ 112 (A.13) (A.14) Fourier-Transformation einer Gaussfunktion Eine Gaussfunktion im Zeitbereich wird durch das Fourierintegral in eine Gaussfunktion im Frequenzbereich überführt. 1 1 t2 1 ω2 ˜ mit σω = (A.15) f (t) = √ exp − 2 ⇒ f (ω) = √ exp − 2 2σω σt 2σt 2πσt 2π Die Breite der Frequenzfunktion ist umso größer, je schmaler die Zeitfunktion ist, s. Abb. A.8. Das Produkt der Unschärfen ist 1: σt · σω = 1 (A.16) Durch Multiplikation mit ~ folgt daraus die Energie-Zeit-Unschärferelation, siehe Kap. 4.6.4. 1 0.5 0 0 0 Zeit Frequenz Abbildung A.8: Zwei Gaussfunktionen f (t) verschiedener Breite und ihre Fouriertransformierten. Fourier-Transformation eines zeitlich begrenzten harmonischen Wellenzugs Das elektrische Feld einer Lichtwelle sei gegeben durch E0 exp(−i ω0 t) für − T /2 < t < T /2 E(t) = E 0 0 sonst (A.17) Die Zahl der Oszillationen ist N = ω0 T /(2π). Wegen seiner endlichen Länge ist der Wellenzug I(ω) / I(ω1) 1 0.5 0 time 0.8 0.9 1 ∆ω / ω1 1.1 Abbildung A.9: Ein Wellenzug mit 10 Oszillationen und die Intensität als Funktion der Frequenz. nicht monochromatisch, sondern enthält ein Frequenzspektrum, das wir mithilfe der Fouriertransformation berechnen Z +∞ Z +T /2 1 E0 2E 0 sin((ω0 − ω)T /2) Ẽ(ω) = √ E(t)eiωt dt = √ e−i(ω0 −ω)t dt = √ . ω0 − ω 2π −∞ 2π −T /2 2π 113 Die spektrale Intensität ist 2 2 2 sin u I(ω) ∝ Ẽ(ω) ∝ N u mit u= (ω0 − ω)T ω0 − ω . = πN 2 ω0 (A.18) Sie hat ihr Maximum bei ω = ω0 und eine Halbwertsbreite ∆ω ≈ ω0 2π = . N T (A.19) Ein sehr kurzer Wellenzug mit nur 10 Oszillationen und seine spektrale Intensität werden in Abb. A.9 gezeigt. A.5 Funktionen von mehreren Variablen A.5.1 Partielle Ableitungen Funktionen von mehreren Variablen kommen sehr häufig in der Physik vor, und wir müssen die 2 2 Regeln f( x , yder ) := ( y Differential− 10) − ( x − 10) + und 100 Integralrechnung erweitern, um diese Funktionen zu erfassen. Als Beispiel betrachten wir die Funktion j := M 0 .. 20 k := 0 .. 20 f (x, y) = (x − 10)2 − (y − 10)2 + 100 := f( j , k ) j, k der beiden reellen Variablen x und y. Diese Funktion kann man graphisch darstellen, es ergibt sich die sattelförmige Fläche in Abb. A.10. Die partiellen Ableitungen sind die Verallgemeinerung x := 0 , 0.1 .. 20 y := 0 , 0.1 .. 20 200 g(x) 150 100 50 0 h(y) 0 5 10 15 20 Abbildung A.10: Links: Graphische Darstellung der Funktion f (x, y) = (x − 10)2 − (y − 10)2 + 100. Rechts: die Kurven g(x) = f (x, 10) und h(y) = f (10, y) auf der Sattelfläche. der normalen Ableitung einer Funktion mit einer Variablen. Sie sind definiert durch f (x + ∆x, y) − f (x, y) ∂f = lim , ∂x ∆x→0 ∆x ∂f f (x, y + ∆y) − f (x, y) = lim ∆y→0 ∂y ∆y 114 (A.20) Dabei wird jeweils die andere Variable konstant gehalten. Man bestimmt also die normalen Ableitungen der Funktionen g(x) = f (x, y0 ) und h(y) = f (x0 , y). Die partiellen Ableitungen der Funktion f (x, y) = (x − 10)2 − (y − 10)2 + 100 sind ∂f = 2 (x − 10) , ∂x ∂f = −2 (y − 10) ∂y Die Kurven g(x) = f (x, 10) und h(y) = f (10, y) sind in Abb. A.10 skizziert. Funktionen mit drei oder mehr Variablen lassen sich nicht mehr graphisch darstellen. Die partiellen Ableitungen sind gemäss (A.20) zu berechnen. Im Dreidimensionalen definiert man den Nabla-Operator. Nabla ist ein Vektoroperator, der als Komponenten die partiellen Ableitungen nach x, y und z enthält: ∂x ∂ ∇ = ∂y mit ∂x ≡ etc (A.21) ∂x ∂z Angewandt auf eine Funktion f (x, y, z) ergibt sich eine Vektorfunktion, die man oft auch den Gradienten nennt: ∂x f ∂f etc (A.22) grad f ≡ ∇f = ∂y f mit ∂x f ≡ ∂x ∂z f Der Laplace-Operator ist die Summe der zweiten Ableitungen ∆ = ∇2 = A.5.2 ∂2 ∂2 ∂2 + + ∂x2 ∂y 2 ∂z 2 (A.23) Mehrfachintegrale Das Doppelintegral über eine Funktion f (x, y) ist als Grenzwert einer Doppelsumme definiert Z c dZ b f (x, y)dxdy = lim n→∞ a n X n X f (xi , yj )∆x∆y (A.24) i=1 j=1 Für unsere Sattelflächenfunktion in Abb. A.10 ergibt Z 0 20 Z 20 f (x, y)dxdy 0 das Volumen unterhalb der Sattelfläche. Doppel- oder Dreifachintegrale sind oft schwer zu berechnen. A.6 A.6.1 Kugelkoordinaten Kugelkoordinaten Die Kugelkoordinaten (r, θ, ϕ) eines Punktes P = (x, y, z) werden in Abb. A.11 definiert. Ihre Verknüpfungen mit kartesischen Koordinaten lauten x = r sin θ cos ϕ , y = r sin θ sin ϕ , 115 z = r cos θ (A.25) Abbildung A.11: Definition der Kugelkoordinaten. Die Richtungen der Einheitsvektoren r̂, θ̂, ϕ̂ hängen vom Polarwinkel θ und vom Azimutalwinkel ϕ ab. und r= p x2 + y 2 + z 2 , θ = arccos(z/r) , ϕ = arctan(y/x) (A.26) Man definiert drei Einheitsvektoren r̂, θ̂, ϕ̂, die jeweils in die Richtung zeigen, in der sich die betreffende Koordinate vergrößert. Ihr Zusammenhang mit den kartesischen Einheitsvektoren ist r̂ = sin θ cos ϕ x̂ + sin θ sin ϕ ŷ + cos θ ẑ (A.27a) θ̂ = cos θ cos ϕ x̂ + cos θ sin ϕ ŷ − sin θ ẑ (A.27b) ϕ̂ = − sin ϕ x̂ + cos ϕ ŷ (A.27c) Eine infinitesimale Verschiebung im Raum kann man schreiben ds = dx x̂ + dy ŷ + dz ẑ = dr r̂ + r dθ θ̂ + r sin θdϕ ϕ̂ (A.28) Das infinitesimale Volumenelement ist d3 r = dx dy dz in kartesischen Koordinaten. In Kugelkoordinaten lautet es d3 r = r2 sin θ dr dθ dϕ (A.29) Der Nabla-Operator in Kugelkoordinaten Der Gradient einer skalaren Funktion ist ∇f = ∂f 1 ∂f 1 ∂f r̂ + θ̂ + ϕ̂ ∂r r ∂θ r sin θ ∂ϕ (A.30) Die Divergenz einer Vektorfunktion ist ∇·g= 1 ∂(r2 gr ) 1 ∂(sin θ gθ ) 1 ∂gϕ + + 2 r ∂r r sin θ ∂θ r sin θ ∂ϕ (A.31) Die Rotation einer Vektorfunktion ist ∂(sin θ gϕ ) ∂gθ ∂(rgϕ ) 1 1 1 ∂gr 1 ∂(rgθ ) ∂gr ∇×g= − r̂ + − θ̂ + − ϕ̂ r sin θ ∂θ ∂ϕ r sin θ ∂ϕ ∂r r ∂r ∂θ (A.32) 116 Der Laplace-Operator angewandt auf eine skalare Funktion lautet 1 ∂ ∂f 1 ∂2f 1 ∂ 2 ∂f 2 r + 2 sin θ + 2 2 ∇ f= 2 r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2 117 (A.33) Anhang B Ergänzungen zu Kap. 1 und 2 B.1 Kinematik der Compton-Streuung Die Streuung eines Röntgenquants an einem ruhenden Elektron wird in Abb. B.1 gezeigt. Vor Abbildung B.1: Impulsbilanz bei der Compton-Streuung. dem Stoss hat das Photon die Energie ~ω und den Impuls ~k mit |k| = k = ω/c, nach dem Stoss hat es die Energie ~ω 0 und den Impuls ~k0 . Die Geschwindigkeit v des Elektrons nach dem Stoss ist bei der Compton-Streuung von Röntgenquanten wesentlich kleiner als die Lichtgeschwindigkeit c, wir dürfen daher mit den nichtrelativistischen Formeln für Energie und Impuls des Elektrons rechnen: p2 Ekin = , p = me v 2me Der Energie- und Impulssatz lauten p2 2me 0 ~k = ~k + p ~ω = ~ω 0 + Das Elektron wird bei der Compton-Streuung meistens nicht nachgewiesen, daher versuchen wir, seinen Impuls zu eliminieren. Die Komponenten des Impulses p parallel und senkrecht zur Einfallsrichtung sind p cos φ = ~k − ~k 0 cos θ p sin φ = ~k 0 sin θ Die beiden Gleichungen werden quadriert und danach addiert: p2 = ~2 (k 2 − 2kk 0 cos θ + k 02 ) 118 Nun wird der Energiesatz benutzt, um p2 zu eliminieren p2 = 2me ~(ω − ω 0 ) = 2me c~(k − k 0 ) Einsetzen in die vorige Gleichung ergibt ∆k = k − k 0 = ~ (k 2 − 2kk 0 cos θ + k 02 ) me c In den meisten Fällen ist ∆k k und man kann auf der rechten Seite k 0 durch k ersetzen, woraus folgt ~k 2 ∆k = (1 − cos θ) 2me c Nun benutzen wir λ = 2π/k und λ0 = 2π/k 0 . Die Wellenlänge als Funktion des Streuwinkels ist gegeben durch die Comptonsche Streuformel λ0 = λ + 2π~ (1 − cos θ) me c (B.1) Genau die gleiche Formel findet man bei Anwendung der relativistischen Mechanik. B.2 Die Kontinuitätsgleichung Wenn ein Teilchen eine scharf definierte Energie hat, kann man die Gesamtwellenfunktion in der Form Ψ(x, t) = ψ(x) exp(−iωt) schreiben. In diesem Fall ist die Wahrscheinlichkeitsdichte unabhängig von der Zeit ρ(x) = Ψ∗ (x, t)Ψ(x, t) = ψ ∗ (x)ψ(x) . (B.2) Im Allgemeinen ist jedoch ρ = ρ(x, t) eine Funktion der Zeit, also ∂Ψ∗ ∂Ψ ∂ρ = Ψ + Ψ∗ 6= 0 . ∂t ∂t ∂t (B.3) Aber auch in diesem Fall hat das Integral über die Wahrscheinlichkeitsdichte immer den Wert 1, da im Rahmen der nichtrelativistischen Quantenmechanik eine Teilchenerzeugung oder vernichtung unmöglich ist1 . Daher muss die Wahrscheinlichkeit, das Elektron irgendwo im Raum zu finden, immer 1 bleiben. Um das mathematisch zu beweisen, benutzen wir die Schrödingergleichung und die konjugiert komplexe Gleichung. ∂Ψ ∂t ∂Ψ∗ −i ~ ∂t i~ ~2 ∂ 2 Ψ + V (x, t) Ψ(x, t) 2m ∂x2 ~2 ∂ 2 Ψ∗ = − + V (x, t) Ψ∗ (x, t) . 2m ∂x2 = − Die erste Gleichung wird von links mit Ψ∗ (x, t) multipliziert, die zweite von rechts mit Ψ(x, t) und dann werden die Gleichungen subtrahiert. Das Resultat ist ∗ 2 ~2 ∂ 2 Ψ∗ ∂Ψ ∗ ∂Ψ ∗ ∂ Ψ i~ Ψ+Ψ =− Ψ−Ψ . ∂t ∂t 2m ∂x2 ∂x2 1 Die relativistischen Verallgemeinerungen der Schödingergleichung, die Klein-Gordon- und die Dirac-Gleichung, können Erzeugungs- und Vernichtungsprozesse beschreiben. 119 Durch Kombination mit (B.3) erhalten wir i~ ∂ ∂ρ = ∂t 2m ∂x ∂Ψ∗ ∂Ψ Ψ − Ψ∗ ∂x ∂x . Die Wahrscheinlichkeits-Stromdichte wird definiert durch i~ ∂Ψ∗ ∗ ∂Ψ j(x, t) = − . Ψ−Ψ 2m ∂x ∂x (B.4) Es ergibt sich die Kontinuitätsgleichung ∂ρ ∂j + =0. ∂t ∂x (B.5) Diese Gleichung ist Ausdruck für einen Erhaltungssatz: wenn sich die Wahrscheinlichkeitsdichte in einem Bereich [x, x + dx] ändert, so ist das nur über einen Teilchenstrom möglich. Für eine ebene Welle Ψ(x, t) = A exp(ikx − iωt) wird ρ = |A|2 und j = ρ~k/m = ρv; beide sind unabhängig von x und t. Wir können jetzt beweisen, dass die Gesamtwahrscheinlichkeit konstant ist. Wenn man die Kontinuitätsgleichung über den ganzen Raum integriert, so folgt Z +∞ Z +∞ ∂ ∂j ρ(x, t)dx = − dx = j(−∞) − j(+∞) . ∂t −∞ −∞ ∂x Wegen Ψ(x, t) → 0 und ∂Ψ/∂x → 0 für x → ±∞ gilt j(±∞) = 0. Also ist die zeitliche Ableitung des Integrals null, und es gilt Z +∞ Z +∞ ρ(x, t) dx = ρ(x, 0) dx = 1 −∞ −∞ für jeden Wert von t. 120 Anhang C Ergänzungen zu Kap. 3 C.1 Ergänzung zum Potentialtopf mit unendlich hohen Wänden Die Eigenfunktionen ψn (x) = r n π x 2 sin a a (C.1) bilden ein orthonormiertes (d.h. orthogonales und normiertes) Funktionensystem. Z 0 a ∗ ψm (x) ψn (x) dx Z m π x n π x 2 a = sin sin dx a 0 a a Z (m − n) π x (m + n) π x 1 a cos − cos dx = a 0 a a = δmn . (C.2) Jede Funktion, die mit den Randbedingungen ψ(0) = ψ(a) = 0 verträglich ist, kann als Linearkombination der Eigenfunktionen dargestellt werden ψ(x) = X cn ψn (x) . (C.3) n Im vorliegenden Fall ist dies die Fourierreihe. Die Koeffizienten werden wie folgt berechnet Z a cn = ψn∗ (x) ψ(x) dx . (C.4) 0 Man kann die ψn (x) als paarweise orthogonale Einheitsvektoren in einem unendlich-dimensionalen Vektorraum auffassen. Berechnen wir die Norm von ψ, so ergibt sich Z a X ψ ∗ (x) ψ(x) dx = |cn |2 = 1 (C.5) 0 n Daraus wird ersichtlich, dass ein durch die Wellenfunktion ψ(x) beschriebenes Teilchen mit der Wahrscheinlichkeit |cn |2 im Zustand ψn (x) gefunden wird und dass dementsprechend bei einer Messung der Energie mit der Wahrscheinlichkeit |cn |2 der Wert En herauskommt. Der Mittelwert der Energie ist X < E >= |cn |2 En . (C.6) n 121 C.2 Der Potentialtopf mit endlicher Tiefe In diesem Fall ist es zweckmäßig, das Potential symmmetrisch zu x = 0 anzuordnen, weil dann die Eigenfunktionen entweder gerade oder ungerade Funktionen von x sind. Auf diese Weise braucht man nur eine Randbedingung zu betrachten. Wir wählen also V (x) = −V0 V (x) = 0 −b<x<b für (b = a/2) für |x| > b . (C.7) Innerhalb des Topfes erhalten wir eine Cosinusfunktion (gerade) oder Sinusfunktion (ungerade). Ich betrachte zunächst nur die geraden Lösungen. Das Teilchen soll sich im Potentialtopf befinden, die Energie ist also negativ (−V0 < E < 0). Die Schrödingergleichung lautet für |x| < b = a/2 : p 2m(E + V0 ) d2 ψ1 2 + k ψ1 = 0 mit k = . 2 dx ~ Wir machen den Lösungsansatz: ψ1 (x) = A cos(kx) . (C.8) Außerhalb des Topfes (x > b) lautet die Schrödingergleichung p 2m|E| d2 ψ2 2 − α ψ2 = 0 mit α = 2 dx ~ mit der allgemeinen Lösung ψ2 (x) = Be−αx + Ce+αx . Für x → ∞ muss ψ gegen null gehen, daher ist C = 0. Die Stetigkeit von ψ und führt zu den Gleichungen (C.9) ψ0 bei x = b A cos(kb) = Be−αb −A k sin(kb) = −B αe−αb . Dividieren wir die zweite Gleichung durch die erste, so folgt tan(kb) = α . k (C.10) Dies ist eine Bestimmungsgleichung für die Energie, denn k und α sind beide Funktionen der Energie. Zur Lösung erweist es sich als zweckmäßig, zwei neue Größen einzuführen: √ b 2mV0 u = kb , u0 = . ~ Damit wird aus (C.10) tan u = p (u0 /u)2 − 1 . Man kann diese Gleichung noch umschreiben in | cos u| = u/u0 , (C.11) wobei die Nebenbedingung tan(u) > 0 einzuhalten ist. Für die ungeraden Wellenfunktionen (ψ1 (x) = A sin(kx)) findet man analog p 1 = − (u0 /u)2 − 1 tan u 122 1 c( u ) s( u ) 0.5 u u0 0 0 2 4 6 8 u Abbildung C.1: Graphische Lösung der Gleichungen c(u) = | cos u| = u/u0 (mit der Nebenbedingung tan u > 0) und s(u) = |sin(u)| = u/u0 (Nebenbedingung tan u < 0) zur Bestimmung der Energieniveaus. Rote Kurven: Funktion c(u), grüne Kurven: Funktion s(u). und daraus ergibt sich | sin u| = u/u0 (C.12) mit der Nebenbedingung tan u < 0. Die Lösungen der Gleichungen (C.11) und (C.12) bestimmt man numerisch oder graphisch (siehe Abb. C.1). Wie man sieht, gibt es endlich viele Schnittpunkte der Kurven, also endlich viele Energieniveaus. Für einen Topf der Tiefe −V0 = −10 eV und Breite a = 1 nm sind die Wellenfunktionen und die zugehörigen Energieniveaus eines Elektrons in Abb. 3.2 skizziert. C.3 Der zweidimensionale Potentialtopf Um die Lösung der Schrödingergleichung in mehr als einer Raumdimension zu demonstrieren, betrachten wir als einfachstes Beispiel einen zweidimensionalen Potentialtopf mit unendlich hohen Wänden und quadratischer Grundfläche. Das Potential habe die Form V (x, y) = 0 V (x, y) → ∞ für 0 < x < a, 0 < y < a für x < 0 , x > a oder für y < 0 , y > a Die Schrödingergleichung im Bereich 0 < x < a, 0 < y < a lautet ~2 ∂ 2 ψ ∂ 2 ψ − + = E ψ(x, y) . 2m ∂x2 ∂y 2 (C.13) In den übrigen Bereichen muss ψ(x, y) verschwinden, da dort das Potential unendlich groß ist. Wir erhalten somit die Randbedingungen ψ(0, y) = 0 , ψ(a, y) = 0 , ψ(x, 0) = 0 , ψ(x, a) = 0 (C.14) Eine mit den Randbedingungen bei x = 0 oder y = 0 verträgliche Lösung setzen wir als Produkt von zwei Sinusfunktionen an ψ(x, y) = A sin(k1 x) sin(k2 y) (C.15) 123 Damit ψ(x, y) auch bei x = a oder y = a verschwindet, muss für die Wellenzahlen gelten k1 = n1 π π k 2 = n2 n1 , n2 = 1, 2, 3.... a a (C.16) Andererseits folgt aus der Schrödingergleichung für die Energiewerte E(n1,n2) = ~2 2 ~2 π 2 2 (n + n22 ) (k1 + k22 ) = 2m 2ma2 1 Dies ist die Verallgemeinerung der Formel (3.9). Einige der Wellenfunktionen werden in Abb. C.2 gezeigt. Sie gleichen den Eigenschwingungen einer quadratischen Membran. M11 M32 M21 Abbildung C.2: Konturdarstellung der Wellenfunktionen eines zweidimensionalen Potentialtopfs für die folgenden Kombinationen der Quantenzahlen: (n1 = 1, n2 = 1), (n1 = 2, n2 = 1)und (n1 = 3, n2 = 2). C.4 Schrödingergleichung des harmonischen Oszillators Es ist zweckmäßig, eine neue Variable u = ax einzuführen und die Konstante a so zu wählen, dass die Schrödingergleichung (3.12) einfacher aussieht. Setzen wir r ωm 2E a= , b= , (C.17) ~ ~ω so ergibt sich die Gleichung ψ 00 (u) − u2 ψ(u) + b ψ(u) = 0 . (C.18) Die Lösungen werden durch eine Kombination von Raten und Konstruieren gefunden. Im Grenzfall u → ∞ kann man den Term bψ(u) im Vergleich zu u2 ψ(u) ignorieren und findet als ungefähre Lösung ψ0 (u) ≈ exp(−u2 /2) . Dies erweist sich sogar als eine exakte Lösung, aber nur für einen ganz bestimmten Wert des Parameters b. Einsetzen in (C.18) ergibt ψ000 − u2 ψ0 = −ψ0 = −bψ0 . Damit Gleichung (C.18) erfüllt ist, muss der Parameter b den Wert b = 1 haben. Mit (C.17) folgt daraus für die Energie ~ω . E0 = 2 124 Um die allgemeine Lösung von (C.18) zu konstruieren, machen wir den Ansatz ψ(u) = H(u) exp(−u2 /2) , wobei H(u) = a0 + a1 u + a2 u2 + . . . eine Potenzreihe ist. Dies ist erlaubt, weil jede Lösung der Schrödingergleichung als Potenzreihe dargestellt werden kann. Durch Einsetzen in (C.18) erhält man die Differentialgleichung H 00 − 2uH 0 + (b − 1)H = 0 . Einsetzen der Potenzreihe und Sortieren nach Potenzen von u führt auf die Formeln 2a2 + (b − 1) a0 = 0 6a3 + (b − 3) a1 = 0 12a4 + (b − 5) a2 = 0 20a5 + (b − 7) a3 = 0 ... (C.19) ... Zwei der Koeffizienten (etwa a0 und a1 ) sind frei wählbar, da eine Differentialgleichung zweiter Ordnung zwei linear unabhängige Lösungen hat. Die anderen Koeffizienten ergeben sich dann aus obigen Bedingungen, die man allgemein schreiben kann als a`+2 = − (b − 1 − 2`) a` , (` + 1) (` + 2) ` = 0, 1, 2, 3, . . . (C.20) Wir wollen zeigen, dass diese Reihe aus physikalischen Gründen abbrechen muss, mit anderen Worten, dass die Funktionen H(u) Polynome sind. Wenn nämlich die Reihe nicht abbricht, ergibt sich asymptotisch folgendes Verhältnis der Koeffizienten a`+2 2 → a` ` für ` → ∞ . Ein solche Verhältnis hat die Potenzreihenentwicklung der Funktion exp(+u2 ). Die Wellenfunktion H(u) exp(−u2 /2) wäre dann proportional zu exp(+u2 /2) und würde für |u| → ∞ divergieren, was physikalisch unakzeptabel ist. Die Reihe bricht genau dann bei einer bestimmten Potenz ab, wenn der Parameter b gleich einer ungeraden natürlichen Zahl ist: b = 2n + 1 n = 0, 1, 2, 3, . . . Die Serie der Koeffizienten a` endet dann bei ` = n. Bei geradem n kann man durch Wahl von a1 = 0 alle Koeffizienten mit ungeradem Index zu null machen, bei ungeradem n werden durch die Wahl a0 = 0 alle Koeffizienten mit geradem Index zu Null gemacht. Dies ist eine interessante Beobachtung: die Polynome H(u) enthalten entweder immer nur gerade Potenzen von u oder immer nur ungerade Potenzen. Der physikalische Grund dafür ist die Symmetrie des Potentials V (x) = C2 x2 zu x = 0, die Wellenfunktionen sind deswegen entweder gerade oder ungerade Funktionen von x : ψ(−x) = ±ψ(x) . Die Bedingung b = 2n + 1 führt zu den diskreten Energie-Eigenwerten En = (n + 1/2) ~ω 125 n = 0, 1, 2, 3, . . . (C.21) Die normierten Wellenfunktionen des harmonischen Oszillators lauten r m ω 1/4 1 mω 2 ψn (x) = ·√ · Hn (u) · exp(−u /2) , u = x n π~ ~ 2 n! (C.22) mit H0 (u) = 1 H1 (u) = u 2 H3 (u) = 8u3 − 12u H2 (u) = 4u − 2 ... Bis auf Normierungsfaktoren sind die H(u) mit den Hermite’schen Polynomen identisch. C.5 Gaussförmiges Wellenpaket Die räumliche Wahrscheinlichkeitsverteilung werde durch eine Gaussfunktion beschrieben (Kap. 3.4.3). Wir betrachten zunächst den Zeitpunkt t = 0. Es sei 1 x2 2 ρ(x, 0) = |Ψ(x, 0)| = √ exp − 2 2σx 2π σx Die Wellenfunktion Ψ ist nun wirklich respektabel: sie ist normiert Z +∞ |Ψ(x, 0)|2 dx = 1 −∞ und beschreibt ein Teilchen mit der Ortsunschärfe ∆x = σx . Als weitere Vereinfachung nehmen wir zunächst an, dass das Teilchen ruht, genauer gesagt, dass der mittlere Impuls p0 = ~k0 = 0 ist. Die AmplitudenfunktionpA(k) berechnen wir durch Fouriertransformation. Die Fouriertransformierte von Ψ(x, 0) = ρ(x, 0) ergibt sich zu A(k) ∝ exp(−k 2 σx2 ) . Die Wahrscheinlichkeitsdichte im k-Raum ist auch eine Gaussfunktion. k2 2 2 2 |A(k)| ∝ exp(−k · 2σx ) ≡ exp − 2 , 2σk (C.23) wobei die folgende wichtige Beziehung zwischen den Varianzen besteht 2σk2 = 1 2σx2 ⇒ σx σk = 1 . 2 (C.24) Die Ortsunschärfe des Teilchens ist ∆x = σx , die Impulsunschärfe ∆px = ~σk . Daraus folgt die fundamentale Beziehung ~ ∆x · ∆px = (C.25) 2 Wenn man jetzt auch noch zulässt, dass k0 6= 0 ist und somit das Wellenpaket ein Teilchen repräsentiert, das sich mit der Geschwindigleit v0 = ~k0 /m bewegt, so ergibt eine aufwändige Rechnung [?] für die zeitabhängige Wahrscheinlichkeitsdichte (x − v0 t)2 1 ρ(x, t) = √ exp − (C.26) 2(σ(t))2 2π σ(t) 126 Das Wellenpaket bewegt sich wie gewünscht mit der Geschwindigkeit v0 in x-Richtung. Es hat aber eine sehr unerfreuliche Eigenschaft: seine Breite nimmt im Laufe der Zeit zu s ~2 σ(t) = σx2 + · t2 , (C.27) 4m2 σx2 und gleichzeitig sinkt die Höhe ab. Man sagt, das Wellenpaket “zerfließt”, siehe Abb. 3.6. Das Integral, die Fläche unter der Kurve, bleibt invariant. 127 Anhang D Ergänzungen zu Kap. 4 D.1 Der Begriff des Operators Alle physikalischen Messgrößen werden in der Quantentheorie durch Operatoren repräsentiert. Ein Operator ist eine Rechenvorschrift, die auf die Wellenfunktion angewandt wird. Die Anwendung eines Operators auf eine Funktion liefert in der Regel eine andere Funktion. Wir d betrachten als Beispiel den Differentialoperator dx . Wenden wir ihn auf die quadratische Funk2 tion x an, so ergibt sich die lineare Funktion 2x. Eine Gleichung, bei der links ein Operator auf eine Funktion angewandt wird und rechts dieselbe Funktion steht, multipliziert mit einer Konstanten, nennen wir eine Eigenwertgleichung. Die Funktionen, die die Gleichung erfüllen, heissen die Eigenfunktionen des Operators, die rechts stehenden Konstanten sind die Eigenwerte. d Die Eigenfunktionen des Differentialoperators dx sind die Exponentialfunktionen eax mit einer beliebigen reellen Zahl a, denn es gilt d ax e = aeax dx Der Eigenwerte sind die Zahlen a. D.2 Selbstadjungierte Operatoren b definiert man den adjungierten Operator A b† durch die Gleichung Zu einem Operator A Z +∞ Z +∞ ∗ b b† φ(x))∗ ψ(x) dx . φ (x)(Aψ(x)) dx = (A −∞ (D.1) −∞ b† = A b gilt. Die Eigen- und ErwarEin Operator heißt selbstadjungiert oder hermitesch, wenn A b tungswerte eines selbstadjungierten Operators A sind reell. Es gilt nämlich b = hAφ|ψi b hφ| Aψi oder mit Integralen geschrieben Z +∞ Z ∗ b φ (x)(Aψ(x)) dx = −∞ +∞ −∞ ∗ b (Aφ(x)) ψ(x) dx . (D.2) (D.3) Setzt man in diese Beziehung φ = ψ ein, so erkennt man sofort, dass die Eigen- und Erwartungswerte reell sind. Da Observable grundsätzlich reelle Messwerte haben müssen, stellt man das Postulat auf, dass alle Operatoren der Quantenmechanik selbstadjungiert sind. 128 Der Hamilton- und Ortsoperator sind beide reell und daher auch selbstadjungiert. Um diese Eigenschaft für den Impulsoperator nachzuweisen, muss man Gleichung (4.22) partiell integrieren Z +∞ Z +∞ ∂ψ(x) ∂ψ(x) ∗ +∞ ∗ ∗ ψ (x)(−i~) dx = [−i~ψ (x) ψ(x)]−∞ + −i~ ψ(x) dx . ∂x ∂x −∞ −∞ Der erste Term auf der rechten Seite verschwindet wegen ψ(x) → 0 für |x| → ∞. Somit ist Gleichung (D.1) erfüllt. D.3 Gleichzeitige Messbarkeit Ein grundlegendes Theorem der Quantenmechanik lautet: Zwei physikalische Größen (Observable) können genau dann gleichzeitig präzise Werte annehmen, wenn die zugehörigen Operatoren vertauschbar sind, und das wiederum ist gleichbedeutend damit, dass die beiden Operatoren einen vollständigen Satz gemeinsamer Eigenfunktionen haben. b und B, b die einen Um dies Theorem zu beweisen, betrachten wir zuerst zwei Operatoren A vollständigen Satz gemeinsamer Eigenfunktionen ψn besitzen. Wir wollen zeigen, dass diese Operatoren dann notwendigerweise kommutieren. Es gelte also b n = an ψn , Aψ b n = bn ψn Bψ für alle n . Eine beliebige Funktion ψ(x) können wir nach dem vollständigen System entwickeln X ψ(x) = cn ψn (x) . n Anwenden der Operatoren ergibt: b ( Bψ) b b A = A und entsprechend b = A X n X b n cn Bψ cn bn ψn = n b ( Aψ) b = B X cn (bn an )ψn n X cn (an bn )ψn . n Für eine beliebige Funktion ψ(x) gilt demnach bB b−B b A)ψ b =0 (A ⇒ b B b] = 0, [ A, d.h. die Operatoren sind vertauschbar. Damit ist natürlich auch bewiesen, dass nicht vertauschbare Operatoren keinen vollständigen Satz gemeinsamer Eigenfunktionen besitzen1 . Im zweiten Schritt muss die Umkehrung gezeigt werden, dass nämlich vertauschbare Operatoren einen vollständigen Satz gemeinsamer Eigenfunktionen besitzen. Seien die ψn die Eigenb funktionen des Operators A b ψn = an ψn . A 1 Die Betonung liegt hier auf dem Wort vollständig. Es kann durchaus vorkommen, dass gewisse Funktionen gemeinsame Eigenfunktionen nicht vertauschbarer Operatoren sind. Als Beispiel betrachten wir die Eigenfunktionen ψn,l,m (r, θ, φ) des Wasserstoffatoms, siehe Kap. 6. Für l = 0 und m = 0 sind sie sowohl Eigenfunktionen von b z als auch von L b x und L b y , obwohl die Komponenten des Drehimpulsoperators nicht untereinander vertauschbar L bz . sind. Allerdings sind die ψn,l,m mit l 6= 0 nur noch Eigenfunktionen von L 129 Zur Vereinfachung nehmen wir hier an, dass die Eigenwerte an alle verschieden sind (keine b auf eine beliebige dieser Eigenfunktionen angewandt: Entartung). Jetzt wird der Operator B b ψn . φn = B b ist: Es ist nun leicht zu sehen, dass φn ebenfalls eine Eigenfunktion von A b n = A bBψ b n=B b Aψ b n Aφ b n = an φn . = an Bψ b n = Hier ist die Vertauschbarkeit der Operatoren benutzt worden. Es gilt also in der Tat: Aφ an φn . Da wir vorausgesetzt haben, dass alle Eigenwerte verschieden sind, darf sich φn nur durch einen konstanten Faktor von ψn unterscheiden: φn = bn ψn . Daraus sehen wir b n = bn ψn Bψ b sind auch Eigenfunktionen von für alle n, mit anderen Worten, alle Eigenfunktionen ψn von A b B. Im Fall der Entartung wird der Beweis komplizierter, es ist aber möglich, einen gemeinsamen Satz von Eigenfunktionen zu konstruieren (siehe etwa W. Greiner, Quantenmechanik). D.4 Orts- und Impulsraum Wir haben schon bei der Diskussion der Wellenpakete gesehen, dass das Fourierintegral eine zentrale Rolle in der Quantenmechanik spielt. Das soll jetzt noch weiter analysiert werden. Die Fouriertransformierte existiert für jede Funktion f (x), die quadrat-integrabel ist, d. h. für die das Integral Z +∞ −∞ |f (x)|2 dx einen endlichen Wert hat. Gemäß Anhang A.4.2 lautet die Fourierdarstellung einer Funktion f (x) und ihre Umkehrung Z ∞ Z ∞ 1 1 ˜ ˜ f (x) = √ f (k) exp(ikx)dk , f (k) = √ f (x) exp(−ikx)dx 2π −∞ 2π −∞ √ In der Quantentheorie gilt k = p/~. Setzen wir f (x) = ψ(x) und f˜(k) = ~ φ(p), so ergibt sich Z +∞ Z +∞ 1 ipx 1 ipx ψ(x) = √ φ(p) exp dp , φ(p) = √ ψ(x) exp − dx . (D.4) ~ ~ 2π~ −∞ 2π~ −∞ Wir nennen φ(p) die Impulsraum-Wellenfunktion. Wenn man die Ortsraum-Wellenfunktion ψ(x) kennt, kann man die Impulsraum-Wellenfunktion φ(p) mit Hilfe des Fourierintegrals berechnen und umgekehrt. Beide Funktionen sind auf 1 normiert: Z +∞ Z +∞ 2 |ψ(x)| dx = |φ(p)|2 dp = 1 . (D.5) −∞ −∞ Die Wahrscheinlichkeitsinterpretation kann auch auf den Impulsraum angewandt werden. Die Wahrscheinlichkeit, das Teilchen mit einem Impuls zwischen p und p + dp zu finden, ist |φ(p)|2 dp . 130 Anhang E Ergänzungen zu Kap. 5 E.1 b in einem Zentralpotential Rotationsinvarianz von H In einem Zentralpotential V = V (r) ist der Hamilton-Operator 2 2 2 2 b =−~ · ∂ + ∂ + ∂ H + V (r) 2m ∂x2 ∂y 2 ∂z 2 (E.1) rotationsinvariant. Um dies nachzuweisen, betrachten wir eine Rotation um die z-Achse. x0 = x cos ϕ + y sin ϕ y 0 = −x sin ϕ + y cos ϕ z 0 x = x0 cos ϕ − y 0 sin ϕ y = x0 sin ϕ + y 0 cos ϕ (E.2) = z. Es ist leicht zu sehen, dass die Länge des Ortsvektors in beiden Koordinatensystemen gleich ist (anschaulich ist das evident): r0 2 = (x cos ϕ + y sin ϕ)2 + (−x sin ϕ + y cos ϕ)2 + z 2 = x2 (cos2 ϕ + sin2 ϕ) + y 2 (cos2 ϕ + sin2 ϕ) + z 2 = r2 . Im rotierten System lautet der Hamilton-Operator 2 ~2 ∂ ∂2 ∂2 0 b H =− · + + + V (r0 ) 2m ∂x02 ∂y 02 ∂z 02 (E.3) Das Potential V (r) = V (r0 ) ist offensichtlich rotationsinvariant. Die Ableitung der Wellenfunktion nach den neuen Koordinaten wird mit Hilfe der Kettenregel berechnet ∂ψ ∂ψ ∂x ∂ψ ∂y ∂ψ ∂ψ = + = cos ϕ + sin ϕ . 0 0 0 ∂x ∂x ∂x ∂y ∂x ∂x ∂y Daraus folgt ∂2ψ ∂2ψ ∂2ψ + + ∂x02 ∂y 02 ∂z 02 ∂ψ ∂ψ ∂ψ 2 ∂ψ 2 ∂ 2 ψ = cos ϕ + sin ϕ + − sin ϕ + cos ϕ + ∂x ∂y ∂x ∂y ∂z 2 ∂2ψ ∂2ψ ∂2ψ = + + . (E.4) ∂x2 ∂y 2 ∂z 2 b0 = H b bewiesen. Damit ist H 131 E.2 Vertauschbarkeit von Hamilton- und Drehimpulsoperator Bei einem Zentralpotential ist der Hamilton-Operator rotationsinvariant, man sollte daher verb kommutiert. Dies ist in der Tat der Fall, es gilt b mit L muten, dass H b L b x ] = [ H, b L b y ] = [ H, b L bz ] = 0 . [ H, (E.5) Wir beweisen diese Relation für die z-Komponente und betrachten zuerst den V (r)-Term. ∂V ∂V b b Lz V (r)ψ − V (r)Lz ψ = −i~ x ψ −y ∂y ∂x Wegen ∂V ∂V y ∂V ∂V x = , = ∂y ∂r r ∂x ∂r r ist die eckige Klammer null. Für den kinetischen Energie-Term folgt 2 2 ∂ ∂ ∂ ∂ ∂ ∂2 ∂2 ∂ x ψ− x ψ −y + + −y ∂y ∂x ∂x2 ∂y 2 ∂x2 ∂y 2 ∂y ∂x ∂ ∂ψ ∂ ∂ψ − =0. = ∂x ∂y ∂y ∂x b und L b z kommutieren, kann man gemeinsame Eigenfunktionen finden. Da H b x und L b y mit H. b Aus Symmetriegründen vertauschen auch L E.3 Der Drehimpuls in Kugelkoordinaten Die Kugelkoordinaten (r, θ, ϕ) sind mit den kartesischen Koordinaten (x, y, z) durch folgende Beziehungen verknüpft: x = r sin θ cos ϕ y = r sin θ sin ϕ (E.6) z = r cos θ . Für die Differentiale ergibt sich dx = sin θ cos ϕ dr + r cos θ cos ϕ dθ − r sin θ sin ϕ dϕ dy = sin θ sin ϕ dr + r cos θ sin ϕ dθ + r sin θ cos ϕ dϕ (E.7) dz = cos θ dr − r sin θ dθ . Man kann daraus die Differentiale der Kugelkoordinaten berechnen: dr = sin θ cos ϕ dx + sin θ sin ϕ dy + cos θ dz 1 dθ = (cos θ cos ϕ dx + cos θ sin ϕ dy − sin θ dz r 1 dϕ = (− sin ϕ dx + cos ϕ dy) . r sin θ Die partiellen Ableitungen werden wie folgt umgerechnet: ∂ ∂r ∂ ∂θ ∂ ∂ϕ ∂ = + + . ∂x ∂x ∂r ∂x ∂θ ∂x ∂ϕ 132 (E.8) Das Ergebnis ist ∂ ∂x ∂ ∂y ∂ ∂z ∂ cos θ cos ϕ ∂ sin ϕ ∂ + − ∂r r ∂θ r sin θ ∂ϕ ∂ cos θ sin ϕ ∂ cos ϕ ∂ = sin θ sin ϕ + + ∂r r ∂θ r sin θ ∂ϕ ∂ sin θ ∂ = cos θ − . ∂r r ∂θ = sin θ cos ϕ (E.9) Mit den Formeln (E.9) kann man die Drehimpuls-Operatoren in Kugelkoordinaten umrechnen. b z vorgeführt. Schreiben wir diesen Operator in der Form Das wird für L ∂ ∂ ∂ ∂ ∂ b Lz = −i~ x = −i~ cr , −y + cθ + cϕ ∂y ∂x ∂r ∂θ ∂ϕ so ergibt sich für die Koeffizienten cr = r sin θ cos ϕ sin θ sin ϕ − r sin θ sin ϕ sin θ cos ϕ = 0 cθ = r sin θ cos ϕ cos θ sin ϕ/r − r sin θ sin ϕ cos θ cos ϕ/r = 0 cϕ = r sin θ cos ϕ cos ϕ/(r sin θ) − r sin θ sin ϕ (− sin ϕ/(r sin θ)) = cos2 ϕ + sin2 ϕ = 1 . b 2 berechnet man entsprechend. Das Resultat ist Die x- und y-Komponenten und L ∂ ∂ b Lx = −i~ − sin ϕ − cos ϕ cot θ ∂θ ∂ϕ ∂ ∂ b Ly = −i~ cos ϕ − sin ϕ cot θ ∂θ ∂ϕ b z = −i~ ∂ L ∂ϕ 2 1 ∂2 1 ∂ ∂ 2 b L = −~ + sin θ ∂θ sin2 θ ∂ϕ2 sin θ ∂θ E.4 (E.10) Algebraische Behandlung des Drehimpulses In diesem Abschnitt sollen die wichtigsten Eigenschaften von Drehimpulsen in der Quantenmechanik allein aus den Vertauschungsregeln (5.7) hergeleitet werden. Die in diesem Kapitel benutzte algebraische Methode wird in der Kern- und Elementarteilchenphysik verallgemeinert, um den Isospin und das Quark-Modell zu beschreiben. bx , L by , L b z , die den Vertauschungsregeln Betrachtet werden nun drei Operatoren L bz , bx , L b y ] = i~L [L by , L b z ] = i~L bx , [L bz , L b x ] = i~L by [L (E.11) gehorchen. Dann kann man leicht nachweisen (s. Gl. (5.8)), dass alle drei Komponenten mit b 2 kommutieren: L b 2 ] = 0 , [L b 2 ] = 0 , [L b2 ] = 0 . bx , L by , L bz , L [L (E.12) b 2 und L b z zu finden. Diese Es ist daher möglich, gemeinsame Eigenzustände der Operatoren L Eigenzustände bezeichnen wir mit Dirac-Ket-Vektoren | l, mi, wobei l und m die Quantenzahlen angeben: b 2 | l, mi = l(l + 1)~2 | l, mi , L b z | l, mi = m~| l, mi . L (E.13) 133 Diese Eigenzustände sind Eigenfunktionen (die Kugelfunktionen) im Fall des Bahndrehimpulses und Eigenvektoren im Fall des Spins (s. Kap. 5). Im Augenblick wird über die Quantenzahlen l, m keine Voraussetzung gemacht, es können beliebige reelle Zahlen sein, wobei allerdings l ≥ 0 b 2 nicht negativ sein können. sein muss, da die Eigenwerte von L Es werden nun zwei Leiter-Operatoren definiert: der Aufsteige-Operator ist (E.14) der Absteige-Operator b+ = L b x + iL by , L (E.15) Das Produkt dieser Operatoren ist b− = L b x − iL by . L b2 − L b+ L b− = L b2 + L b 2 − i[L bx , L by ] = L b 2 + ~L bz L x y z b2 − L b− L b+ = L b2 + L b 2 + i[L bx , L by ] = L b 2 − ~L bz . L x y z (E.16) b + genügt folgenden Vertauschungsregeln Der Operator L bz , L b + ] = +~L b+ , [L b 2, L b+ ] = 0 . [L (E.17) b + auf eine EigenfunkDie Gleichungen (E.17) haben eine wichtige Konsequenz: wenden wir L tion | l, mi an, so kommt entweder null heraus, oder wir erhalten eine Eigenfunktion zu den Eigenwerten l, (m + 1). b 2 (L b 2 | l, mi = l(l + 1)~2 (L b + | l, mi) = L b+ L b + | l, mi) L b z (L b + | l, mi) = L b+ L b z | l, mi + ~L b + | l, mi = (m + 1)~(L b + | l, mi) . L b + | l, mi = Wenn L 6 0 ist, folgt daher b + | l, mi = C+ (l, m)| l, m + 1i . L (E.18) Diese Gleichung rechtfertigt den Namen Aufsteigeoperator. Die Schrittweite ist ∆m = 1. Entsprechend zeigt man, dass b − | l, mi = C− (l, m)| l, m − 1i L (E.19) b − | l, mi 6= 0 ist. gilt, sofern L Wie gross bzw. wie klein kann m werden? Wir behaupten, dass mmax = +l und mmin = −l ist. Zuerst wird gezeigt, dass m2 ≤ l(l + 1) sein muss. Dazu berechnet man den Erwartungswert b 2 auf zwei Weisen: von L 2 b | l, mi = l(l + 1)~2 hl, m|L b 2 | l, mi + hl, m|L b 2 | l, mi + hl, m|L b 2 | l, mi = hl, m|L x y z 2 2 ≥ m ~ . b 2 i ≥ 0 und hL b 2 i ≥ 0 sind. Es gibt daher ein Die Ungleichung folgt, weil die Erwartungswerte hL x y maximales m : b + | l, mmax i = 0 . m = mmax ⇒ L 134 Wendet man den Aufsteigeoperator auf | l, mmax i an, so kommt null heraus, da andernfalls ein Zustand mit m > mmax existieren würde. Um zu zeigen, dass mmax = l ist, berechnen wir den b + im Zustand | l, mmax i: b− L Erwartungswert von L b + | l, mmax i = 0 b− L hl, mmax |L b2 − L b 2 − ~L b z | l, mmax i = hl, mmax |L z = [l(l + 1) − mmax (mmax + 1)]~2 ⇒ mmax = l . (E.20) Entsprechend kann bewiesen werden, dass für das minimale m gilt mmin = −l . Die Quantenzahl m nimmt folgende Werte an: m = −l, −l + 1, . . . + l . (E.21) Dies sind 2l + 1 Werte, d.h. 2l + 1 ist eine positive ganze Zahl. Es gibt zwei Möglichkeiten: a) l ist ganzzahlig, l = 0, 1, 2, . . .. b) l ist halbzahlig, l = 1/2, 3/2, 5/2, . . .. Die ganzzahligen l-Werte gehören zum Bahndrehimpuls (oder auch zum Spin, z.B. bei Photonen), die halbzahligen ausschliesslich zum Spin. E.4.1 Berechnung der Faktoren C± (l, m) Die Anwendung eines Aufsteige-Operators auf einen Zustand | l, mi erhöht die Quantenzahl m um 1. b + | l, mi = C+ (l, m)| l, m + 1i . L (E.22) b + | l, mi auf zwei Weisen, Um die Koeffizienten zu bestimmen, berechnen wir die Norm von ϕ = L † b =L b − ist. wobei berücksichtigt wird, dass L + Daraus folgt hϕ| ϕi = |C+ (l, m)|2 hl, m| l, mi = |C+ (l, m)|2 b− L b + | l, mi = [l(l + 1) − m(m + 1)]~2 . = hl, m|L C+ (l, m) = ~ Für den Absteige-Operator gilt analog b − | l, mi = C− (l, m)| l, m − 1i , L p l(l + 1) − m(m + 1) . C− (l, m) = ~ p l(l + 1) − m(m − 1) . (E.23) (E.24) Man erkennt, dass C+ (l, mmax ) = 0 und C− (l, mmin ) = 0 gilt, so dass in der Tat +l der maximale m-Wert ist und −l der minimale. E.5 Addition von Bahndrehimpuls und Spin Es wird das Beispiel l = 1 betrachtet. Wir beginnen mit dem Zustand |j, mj i = |3/2, −3/2i, der eine eindeutige Darstellung durch die Eigenzustände der Bahndrehimpuls- und Spin-Operatoren hat (vgl. Abb. 5.6) |3/2, −3/2i = |1, −1i · |1/2, −1/2i ≡ Y1,−1 · χ− . 135 Nun wird der Aufsteigeoperator angewandt b |1, −1i) · |1/2, −1/2i + |1, −1i · (Sb+ |1/2, −1/2i) Jb+ |3/2, −3/2i = (L √ √+ 3 |3/2, −1/2i = 2 |1, 0i · |1/2, −1/2i + |1, −1i · |1/2, +1/2i . Daraus folgt |3/2, −1/2i = r 2 |1, 0i|1/2, −1/2i + 3 r 1 |1, −1i)|1/2, +1/2i . 3 Wendet man Jb+ noch einmal an, so ergibt sich r r 1 2 |3/2, +1/2i = |1, 1i · |1/2, −1/2i + |1, 0i · |1/2, +1/2i 3 3 (E.25) (E.26) und schliesslich Jb+ |3/2, +1/2i = √ 3 |3/2, +3/2i = √ 3 |1, +1i · |1/2, +1/2i . Die beiden Zustände mit j = 1/2 sind orthogonal zu den Zuständen |3/2, +1/2i und |3/2, −1/2i: r r 2 1 |1/2, +1/2i = |1, 1i · |1/2, −1/2i − |1, 0i · |1/2, +1/2i 3 3 r r 1 2 |1, 0i · |1/2, −1/2i − |1, −1i · |1/2, +1/2i . (E.27) |1/2, −1/2i = 3 3 E.6 Addition von zwei Spins 1/2 Im Helium-Atom können die Spins der beiden Elektronen zu einem Gesamtspin kombiniert werden. Dies wird in den Abbildungen 5.4 und 5.5 gezeigt. Wir schreiben und setzen einen Produktzustand an b=S b1 + S b2 S (E.28) |s, ms i = |s1 , ms1 i · |s2 , ms2 i , b1 nur auf |s1 , ms1 i und S b2 nur auf |s2 , ms2 i wirkt. Die z-Komponente ist additiv: wobei S ms = ms1 + ms2 . Der Maximalwert ist ms = 1, daher existieren die sogenannten “Triplettzustände” mit der Spinquantenzahl s = 1. Wir beginnen mit |s, ms i = |1, −1i = |1, −1/2i |1, −1/2i und wenden den Aufsteigeoperator an Sb+ |1, −1i = (Sb1+ |1/2, −1/2i) · |1/2, −1/2i + |1/2, −1/2i · (Sb2+ |1/2, −1/2i) √ 2 |1, 0i = |1/2, +1/2i · |1/2, −1/2i + |1/2, −1/2i · |1/2, +1/2i . Somit folgt 1 |1, 0i = √ (|1/2, +1/2i · |1/2, −1/2i + |1/2, −1/2i · |1/2, +1/2i) . 2 136 (E.29) Der Singulettzustand s = 0 ist orthogonal dazu 1 |0, 0i = √ (|1/2, +1/2i · |1/2, −1/2i − |1/2, −1/2i · |1/2, +1/2i) . 2 (E.30) Bildlich kann man die Triplettzustände wie folgt darstellen |1, +1i |1, 0i |1, −1i = ⇑⇑ 1 = √ (⇑ ⇓ + ⇓ ⇑) 2 = ⇓⇓ (E.31) und den Singulettzustand 1 |0, 0i = √ (⇑ ⇓ − ⇓ ⇑) . 2 b2 mit Eigenwert 2~2 sind. Wir zeigen jetzt, dass die Triplettzustände Eigenzustände von S b1 · S b2 ? Was ist 2 S b2 = (S b1 + S b2 )2 = S b2 + S b2 + 2S b1 · S b2 . S 1 2 b1 · S b2 = 2 (Sb1x Sb2x + Sb1y Sb2y + Sb1z Sb2z ) = Sb1+ Sb2− + Sb1− Sb2+ + 2Sb1z Sb2z . 2S b2 auf |1, 1i =⇑ ⇑ angewandt. Wegen Sb1+ Sb2− ⇑ ⇑= Sb1− Sb2+ ⇑ ⇑= 0 folgt Jetzt wird S b2 ⇑ ⇑= [S b2 + S b2 + 2Sb1z Sb2z ] ⇑ ⇑= 2~2 ⇑ ⇑ . S 1 2 Interessant wird der Zustand |1, 0i. Unter Benutzung der Regeln folgt und insgesamt Sb1+ Sb2− ⇑ ⇓= 0 Sb1− Sb2+ ⇓ ⇑= 0 Sb1+ Sb2− ⇓ ⇑= ~2 ⇑ ⇓ Sb1− Sb2+ ⇑ ⇓= ~2 ⇓ ⇑ [Sb1+ Sb2− + Sb1− Sb2+ ](⇑ ⇓ + ⇓ ⇑) = ~2 (⇑ ⇓ + ⇓ ⇑) b2 (⇑ ⇓ + ⇓ ⇑) = (3/2 + 1 − 1/2)~2 (⇑ ⇓ + ⇓ ⇑) = 2~2 (⇑ ⇓ + ⇓ ⇑) . S Für den Singulettzustand |0, 0i gilt hingegen und daher [Sb1+ Sb2− + Sb1− Sb2+ ](⇑ ⇓ − ⇓ ⇑) = −~2 (⇑ ⇓ − ⇓ ⇑) b2 (⇑ ⇓ − ⇓ ⇑) = (3/2 − 1 − 1/2)~2 (⇑ ⇓ − ⇓ ⇑) = 0 . S 137 Anhang F Ergänzungen zu Kap. 6 F.1 Die Radialgleichung des H-Atoms Die Differentialgleichung für die Radialfunktion R(r) des H-Atoms lautet d dr 2me r2 2 dR r − [V (r) − E] R − l(l + 1)R = 0 . dr ~2 (F.1) Wir führen eine Hilfsfunktion u(r) = rR(r) ein. Es gilt dann d dr d2 u 2 dR r =r 2 , dr dr und daher wird die Differentialgleichung für u(r) − ~2 d2 u ~2 l(l + 1) + V (r) + u=Eu. 2me dr2 2me r2 (F.2) Dies entspricht der eindimensionalen Schrödinger-Gleichung mit einem effektiven Potential Vef f (r) = V (r) + ~2 l(l + 1) . 2me r2 (F.3) Der zweite Term ist eine Rotationsenergie und wird, etwas unpräzise, “Zentrifugalterm” genannt. Im H-Atom gilt e2 V (r) = − , 4πε0 r und die Gleichung (F.2) wird ~2 d2 u e2 ~2 l(l + 1) − + − + u=Eu. 2me dr2 4πε0 r 2me r2 (F.4) Das effektive Potential für l = 1 wird in Abb. F.1 mit dem Coulomb-Potential verglichen. Für grosse Abstände gilt: Vef f (r) → 0. Gebundene Zustände sind gekennzeichnet durch eine Energie E < V (∞) = 0, ungebundene (freie) Zustände haben E > 0. Das ist ähnlich wie im Sonnensytem: die Planeten sind an die Sonne gebunden und durchlaufen Ellipsenbahnen, ein Meteor, der mit hoher Geschwindigkeit aus dem Weltall kommt, ist nicht gebunden. Er durchläuft eine Hyperbelbahn im Gravitationsfeld der Sonne und entweicht wieder in das Weltall. 138 20 Veff( r ) 0 VCoul( r ) 20 0 5 10 15 20 25 r a0 Abbildung F.1: Das Coulomb-Potential und das effektive Potential für l = 1. Wir sind an gebundenen Zuständen interessiert und setzen also E < 0 voraus. Zur Vereinfachung der Gl. (F.4) ist es zweckmässig, folgende Grössen einzuführen p 2me |E| me e2 κ= , ρ = κ r , ρ0 = . (F.5) ~ 2πε0 ~2 κ Damit wird aus der Radialgleichung d2 u ρ0 l(l + 1) − 1 − + u=0. dρ2 ρ ρ2 (F.6) Um die Lösungen zu finden, betrachten wir zunächst die Grenzfälle sehr grosser und sehr kleiner Abstände. Im Limes ρ → ∞ wird aus (F.6) d2 u =u dρ2 ⇒ u ∝ exp(±ρ) . Wegen der Bedingung u(∞) = 0 ist die asymptotische Lösung u(ρ) = exp(−ρ) Im Limes ρ → 0 dominiert der Term l(l+1) ρ2 für ρ 1 . (wir setzen hier l > 0 voraus), die Gleichung ist dann d2 u l(l + 1) = u 2 dρ ρ2 ⇒ u ∝ ρl+1 . Die beiden asymptotischen Formen werden jetzt kombiniert in dem folgenden Lösungsansatz der kompletten Differentialgleichung (F.6) l+1 u(ρ) = ρ exp(−ρ) v(ρ) mit v(ρ) = ∞ X cj ρj . (F.7) j=0 Jede Lösung der Gl. (F.6) lässt sich als Potenzreihe darstellen, daher bedeutet die Form (F.7) keine Einschränkung der Allgemeinheit. Der Vorteil der Abspaltung der Faktoren ρl+1 und 139 exp(−ρ) liegt darin, dass dadurch die Bedingungen für die Koeffizienten cj der Potenzreihe einfacher werden. Durch Einsetzen in Gl. (F.6) bekommt man eine Differentialgleichung für die Potenzreihe v(ρ): d2 v dv ρ 2 + 2(l + 1 − ρ) + [ρ0 − 2(l + 1)] v = 0 . dρ dρ Einsetzen der Reihe liefert die folgende Rekursionsformel für die Koeffizienten cj+1 = 2(j + l + 1) − ρ0 cj . (j + 1)(j + 2l + 2) (F.8) Ähnlich wie beim harmonischen Oszillator wollen wir nun zeigen, dass die Potenzreihe abbrechen muss, damit die Wellenfunktion nicht divergiert für ρ → ∞. Für grosse j-Werte ist das Verhältnis aufeinanderfolgender Koeffizienten cj+1 2j 2 ≈ 2 ≈ . cj j j+1 2 tritt auch bei der Potenzreihenentwicklung der Funktion exp(2ρ) Das Koeffizientenverhältnis j+1 auf. Wenn also die Reihe nicht abbricht, verhält sich die Funktion u(ρ) asymptotisch wie exp(−ρ) · exp(2ρ) = exp(ρ) und divergiert für ρ → ∞. Um dies zu vermeiden, müssen wir fordern, dass die Reihe bei einem maximalen j = jmax aufhört, d.h. dass cj = 0 ist für j > jmax . Es wird jetzt die wichtige Hauptquantenzahl n eingeführt durch die Gleichung n = jmax + l + 1 . (F.9) Aus c(jmax +1) = 0 folgt dann ρ0 = 2n . Dies ist eine Bestimmungsgleichung für die Energie. Benutzen wir Gl. (F.5) und den BohrRadius 4πε0 ~2 a0 = , me e2 so wird κ= 1 , n a0 und die Energie ergibt sich zu E = En = − ~2 1 e2 1 = − · · 2 2 2 2 4πε0 a0 n 2 me a0 n mit n = 1, 2, 3, . . . . (F.10) Wir haben das fundamentale Resultat, dass die Schrödinger-Gleichung genau die Energieniveaus des Bohrschen Atommodells wiedergibt. Aus der Rekursionsformel (F.8) und Gl. (F.9) wird klar, dass die Radialfunktionen von der Hauptquantenzahl n und der Bahndrehimpuls-Quantenzahl l abhängen, während m nicht eingeht. Die Funktion Rnl (r) ist das Produkt der Exponentialfunktion exp(−r/(n a0 )) mit einem Polynom des Grades n − 1 in der Variablen r/(n a0 ), dessen Koeffizienten mit der Rekursionsformel (F.8) berechnet werden. Die Radialfunktionen sind - ebenso wie die Kugelfunktionen auf 1 normiert und für gleiches l aber verschiedenes n orthogonal: Z ∞ Rnl (r)Rn0 l (r)r2 dr = δnn0 . (F.11) 0 140 Sie haben die Gestalt R1 0 = R2 0 = R2 1 = R3 0 = R3 1 = R3 2 = 2 exp(−r/a0 ) 3/2 a0 r r exp − √ 3/2 1 − 2a0 2a0 2 a0 r 1 r exp − √ 3/2 2a0 6 a0 2a0 ! 2 r 2 r 2 r 1 − 2 + exp − √ 3/2 3a0 3 3a0 3a0 27 a0 ! r 1 r 2 8 r − exp − √ 3/2 3a0 2 3a0 3a0 9 6 a0 4 r r 2 exp − . √ 3/2 3a0 3a0 9 30 a0 1 (F.12) Die Wellenfunktionen des H-Atoms ψnlm (r, θ, ϕ) = Rnl (r) Ylm (θ, ϕ) (F.13) bilden ein vollständiges System von normierten und paarweise orthogonalen Eigenfunktionen b des Wasserstoffatoms. des Hamiltons-Operators H Z 2π Z π Z ∞ 2 ∗ Rnl (r)Rn0 l0 (r)r dr hψnlm |ψn0 l0 m0 i = Ylm θ, ϕ)Yl0 m0 θ, ϕ) sin θdθ dϕ 0 0 0 = δnn0 δll0 δmm0 . (F.14) Die Vollständigkeit bedeutet, dass man jede Lösung der zeitabhängigen Schrödingergleichung des H-Atoms als Superposition der Eigenfunktionen darstellen kann. Wenn Ψ(r, θ, ϕ, t) eine Lösung der Differentialgleichung ∂Ψ b i~ = HΨ (F.15) ∂t ist, gibt es eindeutig bestimmte komplexe Koeffizienten cnlm , so dass folgende Darstellung gilt: Ψ(r, θ, ϕ, t) = ∞ n−1 +l X X X cnlm ψnlm (r, θ, ϕ) exp(−iωn t) . (F.16) n=1 l=0 m=−l Dabei gilt für die Eigenfunktionen b nlm = En ψnlm Hψ und ωn = En /~ . (F.17) Die Koeffizienten werden mit Hilfe der Skalarprodukte berechnet: cnlm = hψnlm |Ψi , (F.18) wobei die Funktion Ψ zum Zeitpunkt t = 0 einzusetzen ist, so dass alle Faktoren exp(−iωn t) = 1 sind. Gleichung (F.18) folgt aus der Orthogonalität der Eigenfunktionen. 141 Anhang G Ergänzungen zu Kapitel 7 G.1 Energieniveaus im Helium-Atom Zur Berechnung der Energieniveaus im Helium-Atom schreiben wir den Hamiltonoperator in der Form b =H b1 + H b 2 + V12 H mit den Einteilchen-Hamiltonoperatoren 2 2 b 1 = − ~ ∇2 ψj (r j ) − 2e H j 2me 4πε0 |r j | (j = 1, 2) und dem Wechselwirkungspotential V12 (r 1 , r 2 ) = + e2 4πε0 r12 mit r12 = |r 1 − r 2 | b im Zustand ψ (1, 2) oder ψ (1, 2). Das Ergebnis Jetzt berechnen wir den Erwartungswert von H S A ist D E b ψS (1, 2) H ψ (1, 2) = Ea + Eb + C + A (G.1) S D E b ψA (1, 2) H (G.2) ψA (1, 2) = Ea + Eb + C − A Dabei treten zwei Integrale auf: das Coulomb-Integral e2 C= 4πε0 ZZ |ψa (1)|2 |ψb (2)|2 dV1 dV2 r12 (G.3) ψa∗ (1)ψb (1)ψb∗ (2)ψa (2) dV1 dV2 r12 (G.4) und das Austausch-Integral e2 A= 4πε0 ZZ Die Integrale können exakt berechnet werden. 142 Anhang H Ergänzungen zu Kapitel 8 H.1 Korrektur aufgrund der relativistischen Massenzunahme Die kinetische Energie eines Elektrons ist Ekin = p p2 c2 + m2e c4 − me c2 ≈ p2 p4 − , 2me 8m3e c2 (H.1) wobei der erste Term die nichtrelativistische kinetische Energie ist und der zweite Term als kleine Störung angesehen werden kann. Der Hamilton-Operator wird b =H b (0) + H b (1) H mit 2 2 b (0) = pb − e H , 2me 4πε0 r 4 b (1) = − pb H 8m3e c2 (H.2) Gemäß Gl. (8.8) ist die Verschiebung der Energieniveaus in 1. Ordnung der Störungsrechnung b (1) |ψn(0) i . En(1) = hψn(0) |H Wir müssen daher den Erwartungswert von pb4 = pb2 · pb2 berechnen. Es gilt woraus folgt b (0) − V )|ψn(0) i = 2me (En(0) − V )|ψn(0) i , pb2 |ψn(0) i = 2me (H hψn(0) |pb2 · pb2 |ψn(0) i = 4m2e h (En(0) − V )2 i En(1) = − 1 [(En(0) )2 − 2En(0) hV i + hV 2 i] . 2me c2 Wegen V (r) = − e2 4πε0 r (0) treten die Erwartungswerte von 1/r und 1/r2 auf, die für ψn = ψn l m folgende Werte haben: 1 1 h i= 2 , r n a0 h 1 1 i= 3 . r2 n (l + 1/2)a20 (H.3) Setzt man dies ein, so ergibt sich die Energieverschiebung in 1. Ordnung zu δEn = En(1) (0) 2(En )2 n 3 =− − . me c2 l + 1/2 4 143 (H.4) Die dimensionslose Feinstrukturkonstante ist definiert durch α= e2 1 ≈ 4πε0 ~c 137 (H.5) Damit lässt sich die Energieverschiebung aufgrund der relativistischen Massenänderung schreiben 1 me c2 α4 3 M asse . (H.6) δEn =− − 2n3 l + 1/2 4n H.2 Energieaufspaltung bei der Spin-Bahn-Kopplung Der Hamiltonoperator ist b =H b (0) + H b (1) H mit Zur Vereinfachung schreiben wir 2 2 b (0) = pb − e H , 2me 4πε0 r b (1) = H µ0 e2 b b L·S 8πme r3 (H.7) µ0 e2 8πme r3 Die Lösungen der Schrödingergleichung können näherungsweise als Produkt von Ortswellenfuntion und Spinfunktion geschrieben werden. f (r) = ψnlml (r) · χ Dabei gilt b (0) ψnlm (r) · χ = En ψnlm (r) · χ H l l Gemäss Gl. (8.8) ist die Energieverschiebung b · Si b b (1) |ψnlm (r) χi = hf (r)i · hL δEn = hψnlml (r) χ|H l b · Si b ist leicht zu berechnen. Aus Der Erwartungswert hL folgt Also b+S b Jb = L i ~2 2 2 1 h b2 b b b b hL · Si = hJ i − h L i − h S i = [j(j + 1) − l(l + 1) − s(s + 1)] 2 2 b · Si b = hL ~2 · 2 l (−l − 1) für j = l + 1/2 für j = l − 1/2 Jetzt muss noch der Erwartungswert von f (r) berechnet werden. Z ∞ µ 0 e2 1 µ0 e2 1 ∗ ∗ hf (r)i = h 3 i= Rnl (r) 3 Rnl (r)r2 dr 8πme r 8πme 0 r Beispielrechnung für n = 2, l = 1: R21 (r) = √ 1 1 h 3 i= r 24a50 Z 1 3/2 6 a0 0 ∞ r r exp − 2a0 2a0 r 1 r exp − dr = a0 24a30 144 (H.8) Die allgemeine Formel lautet für n ≥ 2, l ≥ 1 h 1 1 i= 3 3 3 r a0 n l(l + 1/2)(l + 1) Die Energieverschiebung ergibt sich zu b (1) | ψnlm (r) χ i δEn = h ψnlml (r) χ |H l me c2 α4 l für j = l + 1/2 = · (−l − 1) für j = l − 1/2 4n3 l(l + 1/2)(l + 1) H.3 (H.9) Zeitabhängige Störungsrechnung In Kap. 8.4 haben wir die zeitabhängige Störungsrechnung benutzt, um die Gleichung (8.26) herzuleiten: X Ψ(r, t) = ci (t)Ψi (r, t) + cj (t)Ψj (r, t) j6=i mit der Anfangsbedingung ci (0) = 1, cj (0) = 0. Der gewünschte Endzustand (final state) Ψf befindet sich unter den Ψj . Wir nehmen jetzt an, dass die Frequenz des elektrischen Feldes die “Resonanzbedingung” ω ≈ |ωf i | = |Ef − Ei | ~ erfüllt. Dann dominiert in der obigen Summe der Term j = f so stark, dass man die übrigen Terme weglassen kann (dies folgt aus dem Resonanzverhalten der weiter unten stehenden Gleichung (H.18)). Unsere vereinfachte Wellenfunktion lautet für t > 0 Ψ(r, t) = ci (t)Ψi (r, t) + cf (t)Ψf (r, t) . (H.10) Einsetzen in die Schrödinger-Gleichung (8.25) ergibt unter Benutzung der Gleichungen i~ ∂Ψi b (0) Ψi =H ∂t i~ ∂Ψf b (0) Ψf =H ∂t die folgende Differentialgleichung für die Koeffizienten ci und cf i~ċi |Ψi i + i~ċf |Ψf i = ci (t)V 0 |Ψi i + cf (t)V 0 |Ψf i . (H.11) Hier wird die Dirac-Schreibweise benutzt. Um die zeitliche Entwicklung der Amplitude cf (t) des Endzustands zu ermitteln, wird die Gleichung skalar mit hΨf | multipliziert und die Orthogonalität und Normierung der Ψj ausgenutzt i~ċf = ci (t)hΨf |V 0 |Ψi i + cf (t)hΨf |V 0 |Ψf i . (H.12) Nun gilt für dies spezielle Potential 0 hΨf |V |Ψf i ∝ ZZZ |ψf (r)|2 rd3 r = 0 , da der Integrand eine ungerade Funktion ist. Daher folgt i~ċf = ci (t)hΨf |V 0 |Ψi i . 145 (H.13) Eine entsprechende Differentialgleichung ergibt sich für ci (t): i~ċi = cf (t)hΨi |V 0 |Ψf i . (H.14) Dies System von gekoppelten Differentialgleichungen kann man generell lösen, wir möchten hier aber nur den Spezialfall betrachten, dass die Störung V 0 schwach ist und nur für kurze Zeit 0 < t < T wirkt. Dann gilt |ci (t)| ≈ 1 und |cf (t)| 1 im Intervall 0 < t < T , und wir erhalten die vereinfachte Gleichung i~ċf = ci (0)hΨf |V 0 |Ψi i = hΨf |V 0 |Ψi i . (H.15) Wir schreiben das Übergangs-Matrixelement von V 0 explizit hin e (E0 · r f i ) · [ei(ωf i +ω)t + ei(ωf i −ω)t ] 2 hΨf |V 0 |Ψi i = mit rf i = ZZZ ψf∗ (r)rψi (r)d3 r und ωf i = (H.16) Ef − Ei . ~ (H.17) Integration über das Zeitintervall 0 < t < T ergibt " # ei(ωf i +ω)T − 1) ei(ωf i −ω)T − 1 e + . i~cf (T ) = (E0 · r f i ) · 2 i(ωf i + ω) i(ωf i − ω) H.4 (H.18) Berechnung der Dipol-Übergangsmatrixelemente In den folgenden Rechnungen ist es zweckmässig, die Matrixelemente von x±iy = r sin θ exp(±iϕ) und z = r cos θ getrennt auszuwerten. Mit Z ∞ rf i = Rnf ,lf r Rni ,li r2 dr 0 erhalten wir (x ± iy)f i = rf i zf i = rf i Z 0 Z 0 H.4.1 π Z 2π 0 π Z 0 2π Yl∗f ,mf (θ, ϕ) sin θe±iϕ Yli ,mi (θ, ϕ)dϕ Yl∗f ,mf (θ, ϕ) cos θ Yli ,mi (θ, ϕ)dϕ sin θdθ sin θdθ Magnetische Quantenzahl Das Integral über den Azimuthwinkel ist leicht auszuwerten. (x ± iy)f i ∝ Z 2π 0 Yl∗f ,mf e±iϕ Yli ,mi dϕ ∝ Z 0 2π exp[i(mi − mf ± 1)ϕ]dϕ Dies ist nur dann ungleich null, wenn mi − mf ± 1 = 0, also |∆m| = 1 ist. zf i ∝ Z 0 2π Yl∗f ,mf Yli ,mi dϕ ∝ Hier muss ∆m = 0 sein. 146 Z 0 2π exp[i(mi − mf )ϕ]dϕ (H.19) H.4.2 Bahndrehimpuls-Quantenzahl Die Regel ∆l = ±1 ist mühsam zu beweisen, wir beschränken uns daher auf einige Beispiele und betrachten zuerst zf i . Der Anfangszustand sei Y2,0 . Wir benutzen die Abkürzung u = cos θ, du = − sin θdθ. Z 1 Z π ∗ u(3u2 − 1)du = 0 ∆l = 2 Y0,0 cos θ Y2,0 sin θdθ ∝ 0 Z π 0 ∗ Y1,0 cos θ Y2,0 sin θdθ ∝ −1 1 Z −1 u2 (3u2 − 1)du 6= 0 |∆l| = 1 Hier ist von vornherein die zf i -Regel ∆m = 0 vorausgesetzt worden. Bei (x ± iy)f i erhalten wir mit dem Anfangszustand Y2,1 ∝ sin θ cos θ und den Endzuständen Y1,0 und Y0,0 Z π ∗ Y0,0 sin θ Y2,1 sin θdθ 0 Z 0 H.4.3 π ∝ ∗ Y1,0 sin θ Y2,1 sin θdθ ∝ Z 1 −1 Z 1 −1 u(1 − u2 )du = 0 ∆l = 2 u2 (1 − u2 )du 6= 0 |∆l| = 1 Hauptquantenzahl n Im Dipolmatrixelement gibt es den Radialanteil Z ∞ rf i = Rnf ,lf r Rni ,li r2 dr . (H.20) 0 Dieser Ausdruck ist für ∆l = ±1 immer ungleich null, daher darf ∆n eine beliebige ganze Zahl sein. 147