pdf 11MB - Schul

Theoretische Physik für Studierende des Lehramts
Teil A: Quantenmechanik
Department Physik der Universität Hamburg
Vorläufige und unvollständige Version, noch nicht auf Fehler korrigiert
Die Vorlesungen Theoretische Physik A, B für Studierende des Lehramts haben zum Ziel,
zukünftigen Physiklehrern/innen die Grundlagen der theoretischen Physik zu vermitteln und
dabei besonders die Gebiete zu betonen, die für den Unterricht in der Oberstufe des Gymnasiums und in den Physikleistungskursen von besonderem Wert sind. Da die moderne Physik im
Curriculum der Oberstufe eine herausragende Rolle spielt, sollten in der Theorieausbildung die
Quantenmechanik und die Relativitätstheorie einen zentralen Platz einnehmen. Dazu kommt
die Elektrodynamik, die die theoretische Grundlage elektrischer Maschinen sowie der Radiotechnik und Optik ist. Die Vorlesungen bauen auf dem Physik-Kurs des Grundstudiums auf.
In Physik I und II werden die Mechanik, Wärmelehre, Elektrizität, Magnetismus und Optik
behandelt. Physik III ist eine Einführung in die Quanten- und Atomphysik. Die Veranstaltung
Theoretische Physik A hat eine gewisse überlappung mit der Physik III. Ihr Hauptziel ist eine
systematische Darstellung der Quantentheorie auf der Basis der Schrödinger-Gleichung. Abstraktere Formulierungen der Quantenmechanik (z.B. Hilbertraum) werden nur kurz gestreift.
In der Vorlesung Theoretische Physik B werden die wichtigen Erscheinungen und Begriffe von
Elektrizität, Magnetismus wiederholt und auf eine gemeinsame theoretische Basis gestellt. Die
Maxwellschen Gleichungen der Elektrodynamik spielen dabei eine zentrale Rolle. Es wird die
enge Verknüpfung der elektromagnetischen Erscheinungen mit der Relativitätstheorie diskutiert.
Die Skripten zur Theoretischen Physik A und B sind folgerdermaßen aufgebaut: in den
Hauptkapiteln wird der für das Examen relevante Stoff in möglichst einfacher und klarer Form
dargestellt. Die didaktischen Anmerkungen am Ende der Kapitel haben das Ziel, den zukünftigen Lehrern/innen Hilfen zu geben, wie sie die physikalischen Konzepte in der Schule vermitteln
können. Mathematische Ergänzungen und kompliziertere theoretische Herleitungen sind in den
Anhängen zu finden. Diese Anhänge sollen interessierten Studierenden helfen, die Theorie besser zu verstehen und Rechnungen selbst durchführen zu können. Das dort präsentierte Material
gehört aber nicht zum Examensstoff.
Die Erarbeitung der Skripten erfolgt im Rahmen einer Seniorprofessur der Wilhelm und Else
Heraeus-Stiftung. Das Department Physik der Universität Hamburg und der federführende Autor Peter Schmüser danken der WE Heraeus-Stiftung sehr herzlich für die großzügige Förderung.
Prof. Klaus Fredenhagen, Prof. Erich Lohrmann und Dr. Paul-Dieter Gall haben das Manuskript sorgfältig gelesen und viele hilfreiche Anmerkungen gemacht. Ihnen gebührt besonderer
Dank.
1
Kapitel 1
Einleitung
1.1
Ein Jahrhundert Quantenphysik
Zwischen dem Allerkleinsten und dem Allergrößten liegen ungefähr sechzig Größenordnungen,
und überall wird die Quantentheorie gebraucht, um die Phänomene zu beschreiben, von den
geheimnisvollen Vibrationen der superstrings oder supermembranes, die die ultimativen Konstituenten der Natur sein mögen, bis hin zur kosmischen Mikrowellenstrahlung vom Rand des
Universums1 . Addiert man zwanzig Nullen zur Dimension der superstrings, kommt man in den
Bereich der Atomkerne, der Quelle der Radioaktivität und Kernenergie. Fünf Größenordnungen
mehr, und man ist bei Atomen und einfachen Molekülen angelangt. Zehn weitere Größenordnungen bringen uns zu der Skala von Metern mit Objekten und Lebewesen, die aus einer
riesigen Zahl von Atomen aufgebaut sind. Von unserer Skala zu einer astronomischen Skala,
der Größe der Sterne, wo die Gravitation dominant wird, sind es weitere 7-9 Größenordnungen.
Und schließlich braucht man noch 18 Größenordnungen, um zum Horizont des heute bekannten
Universums zu kommen.
Die Physik muss entlang dieser riesigen Spanne Erklärungen für zahllose verschiedene Phänomene finden. In den meisten Fällen ist zumindest teilweise die Quantentheorie dafür nötig, deren
Erfolg überwältigend gewesen ist. Als Beispiel kann die Quantenelektrodynamik (QED) dienen,
die Theorie der Wechselwirkungen zwischen Elektronen und Photonen, die Vorhersagen von außerordentlicher Präzision erlaubt. Das in einer Teilchenfalle gemessene magnetische Moment des
Elektrons beträgt µe = 1.00115965218073 µB (µB ist das Bohrsche Magneton), und dieser Wert
stimmt innerhalb von 4 ppb (parts per billion, 1 ppb=10−9 ) mit der Theorie überein. Die QED
ist die genaueste heute bekannte physikalische Theorie.
Den Beginn des Quantenzeitalters markieren die Strahlungsformel von Max Planck (1900),
die Erklärung des photoelektrischen Effekts durch Albert Einstein (1905) und das Atommodell
von Niels Bohr (1913). In den Jahren um 1925 wurde dann die formale Quantentheorie entwickelt
durch Werner Heisenberg, Erwin Schrödinger, Max Born, Wolfgang Pauli, Pascual Jordan, Paul
Dirac und viele andere, wobei auch hier Niels Bohr entscheidende Anteile hatte. In jüngeren
Jahren erzielte die Quantentheorie einen weiteren Durchbruch mit der Vereinheitlichung der
elektromagnetischen, schwachen und starken Wechselwirkungen im Standard-Modell der elektroschwachen Wechselwirkung und der Quantenchromodynamik. Die Versuche, auch die vierte
fundamentale Wechselwirkung, die Gravitation, mit einzubeziehen, sind allerdings noch nicht
erfolgreich gewesen.
1
In Kap. 1.1 folgen wir der Einleitung des hervorragend geschriebenen, aber anspruchsvollen Buches Exploring
the Quantum von Serge Haroche und Jean-Michel Raimond (Oxford Graduate Texts 2008), in dem ein modernes
Teilgebiet der Quantentheorie, die Cavity Quantum Electrodynamics, behandelt wird.
2
Die Quantentheorie ist nicht nur aus wissenschaftlicher Hinsicht von fundamentaler Bedeutung, sie spielt auch im praktischen Leben eine herausragende Rolle. Wer auf dem Rechner
im Internet surft, mit seinem Handy telefoniert, mit einem modernen Auto fährt, Musik von
einer CD hört oder mit seiner Digitalkamera Aufnahmen macht, nutzt dabei (meist unbewusst)
Quantentechnologien. Ein Physiker oder Ingenieur, der im Bereich der Elektronik oder Optronik neue Erfindungen machen möchte, kommt ohne Quantentheorie nicht weiter. Aus diesem
Grunde halten wir es für unerlässlich, dass zukünftigen Physiklehrern/innen gründliche Kenntnisse in der Quantentheorie vermittelt werden und dass die Quantenphysik auch in der Schule
einen gebührenden Raum einnimmt.
1.1.1
Der Transistor und die Computer-Revolution
Die ersten elektronischen Rechner wurden während des Zweiten Weltkriegs gebaut und bestanden aus einer Unzahl von Elektronenröhren und Magnetkernspeichern. Sie waren sehr groß,
wartungsanfällig und hatten einen hohen Energieverbrauch. Verglichen mit einem modernen
Notebook war ihre Leistungsfähigkeit jedoch sehr gering. Erst die Erfindung des Transistors
Ende 1950 und die Integration von einer riesigen Zahl dieser Transistoren auf einem Chip von
der Größe einer Briefmarke ermöglichte die rasante Entwicklung der modernen Computertechnologie. Der Transistor ist ein typisch quantentheoretisches Bauelement und nicht auf der Basis
der klassischen Physik zu verstehen. Die moderne Elektronik und die Opto-Elektronik sind
weitgehend angewandte Quantentheorie.
1.1.2
Der Laser
Das Licht einer Glühlampe ist nicht monochromatisch, sondern überdeckt ein breites Spektrum,
vom kurzwelligen blauen Licht bis hin zum langwelligen infraroten Licht. Außerdem wird das
Licht in alle Richtungen emittiert. Spektroskopie mit solchen Lichtquellen ist mühsam, sie
erfordert die Selektion eines schmalen Bandes mithilfe eines Monochromators, wobei der größte
Teil der Intensität verloren geht. Interferenzexperimente sind ebenfalls schwierig wegen der
geringen spektralen Intensität und der sehr kurzen Kohärenzlänge. Die Erfindung des Lasers hat
dies in dramatischer Weise geändert. Laser erzeugen kohärente monochromatische Strahlung,
die scharf gebündelt ist und eine hohe Leuchtdichte aufweist. Viele der früher aufwändigen und
lichtschwachen Interferenzexperimente lassen sich heute in trivialer Weise mit Lasern vorführen.
Das ist für den Physikunterricht sehr hilfreich. Laser haben darüber hinaus eine Unzahl von
Experimenten ermöglicht, die mit konventionellen Lichtquellen undenkbar wären. Man kann mit
Recht sagen, dass mit dem Laser ein Quantensprung in der Optik eingeleitet wurde. Gleichzeitig
ist der Laser ein zutiefst quantenphysikalisches Gerät; er basiert letztendlich auf der Symmetrie
der Wellenfunktion für Teilchen mit Spin 1, die zur Folge hat, dass alle Photonen im Laser den
gleichen Quantenzustand einnehmen müssen und daher die gleiche Wellenlänge, Phase, Richtung
und Polarisation besitzen.
Das Wort Laser ist eine Abkürzung für Light Amplification by Stimulated Emission of Radiation. Der Begriff “stimulierte Emission” wurde von Albert Einstein im Jahr 1917 geprägt,
beim Anbruch der Quantenära (s. Kap. 8.38), doch erst 40 Jahre später wurden die ersten
praktischen Geräte gebaut. Heute gibt es eine unglaubliche Fülle von Anwendungen in Wissenschaft, Medizin und Technik. Laserstrahlen erlauben hochauflösende Spektroskopie von Atomen
und Molekülen, man kann mit ihnen große Datenmengen durch Glasfibern übertragen oder
auf Compact Disks speichern, Laserdrucker erzeugen Farbbilder hoher Qualität, Laserscanner
werden an den Kassen eines Supermarkts verwendet, feine Laserstrahlen werden bei Augenoperationen eingesetzt, hochintensive Laserstrahlen benutzt man zum Schweissen und Schneiden
3
von Metallplatten.
1.1.3
Kernspin-Tomografie
Die magnetische Kernresonanz (Nuclear Magnetic Resonance NMR) ist eine Quantentechnologie, die eine große Rolle in der wissenschaftlichen Forschung und der medizinischen Diagnose
spielt. Protonen und Neutronen besitzen magnetische Dipolmomente, die an den Spin gekoppelt
sind und deren Existenz und Größe sich aus der relativistischen Quantentheorie in Kombination
mit dem Quarkmodell ergeben. In einem Magnetfeld führen die Momente eine Präzessionsbewegung durch, deren Frequenz, “Lamorfrequenz” genannt, proportional zum Magnetfeld ist. In
die Larmorfrequenz geht aber nicht nur das von außen angelegte Feld ein, sondern auch innere
Magnetfelder aufgrund der chemischen Bindungen. Man kann daher in Wasser gebundene Protonen von denen in Fett oder Eiweiss unterscheiden. Indem man mit Feldgradienten arbeitet
und auch noch die sog. Relaxationszeiten in gepulsten Feldern ausnutzt, lässt sich die räumliche
Verteilung von Wasser, Fett oder Eiweiss in biologischem Gewebe ortsaufgelöst ermitteln. Die
Kernspin-Tomografie hat im Vergleich zu Röntgenaufnahmen den großen Vorteil, dass Knochen
kaum abschatten, weil sie keinen Wasserstoff, sondern nur schwere Kerne mit anderen Larmorfrequenzen enthalten. Das ermöglicht detaillierte Bilder des Gehirns ohne Beeinträchtigung durch
den Schädelknochen.
Die hohen Magnetfelder in Kernspin-Tomografen werden mit supraleitenden Spulen erzeugt.
Hier kommt die Quantenphysik ein zweites Mal zum Tragen. Die Supraleitung ist nicht im Rahmen der klassischen Elektrodynamik, sondern nur mithilfe der Quantentheorie zu verstehen;
allerdings braucht man eine recht komplizierte Variante der Quantentheorie. Erst 30 Jahre nach
Aufstellung der Schrödingergleichung gelang es Bardeen, Cooper und Schrieffer, die mikroskopische Theorie der Supraleitung (die BCS-Theorie) zu formulieren.
1.1.4
Die Atomuhr und die Messung der Zeit
Die ultrapräzise Zeitmessung ist eine weitere Illustration für die Bedeutung von Quantenprozessen in Wissenschaft und Gesellschaft. Atome emitteren oder absorbieren ihre Strahlung bei
wohl-definierten und unveränderlichen Frequenzen, die charakteristisch für jedes Element sind.
Dies hat Physiker veranlasst, Zeitmessungen nicht länger an die störungsanfälligen Schwingungen von Pendeln zu koppeln, sondern an die unbeeinflussbaren atomaren Frequenzen. In einer
Atomuhr koppelt man eine Radioquelle an den Hyperfeinübergang von Cäsium-Atomen, die
in einem Atomstrahl fliegen. Die atomare Resonanz wird mit interferometrischen Methoden
beobachtet. Kürzlich sind die thermischen Atomstrahlen durch Laser-gekühlte Strahlen ersetzt
worden. Die Atomuhr erreicht damit eine Ganggenauigkeit von 0.3 Sekunden in 1 Million Jahren.
Die außerordentliche Präzision der Atomuhren ist für das Globale Positionierungs-System
GPS von entscheidender Bedeutung.
1.2
Teilchen und Wellen
1.2.1
Das Doppelspaltexperiment
Die Quantentheorie beschreibt das Verhalten von Teilchen und Licht auf einer atomaren Größenskala. Dabei treten Phänomene auf, die unserer täglichen Anschauung widersprechen: Lichtwellen verhalten sich so, als ob sie aus Teilchen aufgebaut seien, und Teilchen zeigen Welleneigenschaften. Dies Grundprinzip der Quantenphysik soll an einem Experiment erläutert werden,
für das es im Rahmen der klassischen Physik keine befriedigende Erklärung gibt, es ist das
4
Doppelspaltexperiment. Richard Feynman sagt in seinen berühmten Vorlesungen über Physik,
dass im Doppelspaltexperiment das eigentliche Geheimnis der Quantentheorie liege. In den letzten Jahrzehnten hat sich durch enorme Fortschritte in der Experimentiertechnik herausgestellt,
dass die Quantenphysik noch eine weitere verstörende Eigenheit besitzt. Die Beobachtung, dass
eine Wellenfunktion über viele Kilometer ausgedehnt sein kann, strapaziert unser Vorstellungsvermögen in noch stärkerem Maße als die Teilchen-Welle-Komplementarität. Die nichtlokale
Natur der Quantentheorie ist Thematik unseres letzten Kapitels.
Das Doppelspaltexperiment mit Kugeln und Wellen
a) Kugeln werden auf eine Wand mit zwei Spalten oder Löchern geschossen. Sie verlassen die
Quelle mit einer breiten Winkelverteilung und werden auch noch an den Rändern der Spalte
gestreut. Daher beobachtet man auf einem Auffängerschirm eine ausgedehnte Verteilung. Mit
P (x) bezeichnen wir die Wahrscheinlichkeit (probability), eine Kugel im Abstand x vom Zentrum
des Schirms zu finden. Wenn nur Spalt 1 offen ist, gilt P (x) = P1 (x), wenn nur Spalt 2 offen ist,
ergibt sich P (x) = P2 (x). Öffnet man beide Spalte, so addieren sich die Wahrscheinlichkeiten,
und man erhält eine verbreiterte, aber strukturlose Verteilung, die in Abb. 1.1a dargestellt ist.
P12 (x) = P1 (x) + P2 (x)
(1.1)
Abbildung 1.1: Schema des Doppelspaltexperiments (a) mit Kugeln, (b) mit Wellen.
Jede Kugel kommt als untrennbare Einheit am Schirm an und ergibt nur einen einzelnen
Treffer bei einem bestimmten x-Wert. Die gesamte Wahrscheinlichkeitsverteilung baut sich erst
allmählich durch Aufsummation über viele Kugeln auf.
b) Wasser- oder Lichtwellen aus einer Quelle (periodisch bewegter Tupfer in der Wellenwanne
oder Laser) treffen auf die Wand. Jeder Spalt wird Zentrum einer auslaufenden Kreiswelle. Die
5
Intensität I(x) auf dem Schirm ist durch das Absolutquadrat der Amplitude der Welle gegeben.
Wenn nur ein Spalt geöffnet ist, ergeben sich ähnliche Verteilungen wie oben (wir ignorieren hier
die Beugungseffekte am Einzelspalt):
I1 (x) = |A1 (x)|2
nur Spalt 1 offen :
(1.2)
2
I2 (x) = |A2 (x)|
nur Spalt 2 offen :
Sind aber beide Spalte geöffnet, so erhält man etwas ganz Neues: Es bildet sich ein Interferenzmuster mit Auslöschungen und Verstärkungen (Abb. 1.1b).
I(x) = |A1 (x) + A2 (x)|2 = I1 (x) + I2 (x) + 2
p
I1 (x)I2 (x) cos[δ(x)]
(1.3)
Der wichtigste Unterschied zum Kugelexperiment ist, dass nicht Wahrscheinlichkeiten addiert
werden, sondern die Amplituden unter Berücksichtigung der Phasendifferenzen δ(x). Der zweite
wichtige Unterschied ist die Art, wie die Verteilung entsteht. Die Kugeln treffen als lokalisierte
Klumpen (“Quanten”) auf den Schirm, Kugel 1 ergibt einen Treffer am Ort x1 , Kugel 2 am Ort
x2 etc. Erst nach dem Auftreffen sehr vieler Kugeln kann man die Verteilung P (x) erkennen.
Ganz anders ist dies bei einer klassischen Welle: die gesamte Verteilung ist “sofort” da, sie
wächst nur in ihrer Stärke im Laufe der Belichtungszeit an.
Wir werden sehen, dass diese klare Fallunterscheidung im atomaren Bereich nicht möglich
ist, sondern dass beide Aspekte eine Rolle spielen: Interferenz, d.h. Addition von Amplituden,
und der sukzessive Aufbau der Verteilung durch “Quanten”.
Das Doppelspaltexperiment mit Elektronen
Doppelspaltexperimente mit Elektronen sind heute keine “Gedankenexperimente” mehr, sondern
können tatsächlich durchgeführt werden, wobei allerdings sehr präzise Aufbauten und großes experimentelles Geschick erforderlich sind. Der Nachweis der Elektronen kann mit einem Film oder
einem CCD-Chip (charge coupled device) erfolgen. Was beobachtet man, wenn viele monoenergetische Elektronen die Doppelspaltapparatur durchlaufen? Überraschenderweise findet man
ein Interferenzbild mit hellen und dunklen Streifen genau wie beim Doppelspaltexperiment mit
Licht (“hell” bedeutet, dass viele Elektronen auftreffen). Es folgt daraus: Elektronen haben
Welleneigenschaften. Doppelspaltinterferenzen mit Licht und Elektronen werden in Abb. 1.2
verglichen.
Abbildung 1.2: Doppelspalt-Interferenzen mit Licht (links) und Elektronen (rechts).
6
Die Wellenfunktion
Die Welleneigenschaften des Elektrons beschreiben wir mit Hilfe einer Wellenfunktion ψ(x). Dies
ist eine komplexwertige Funktion, die in etwa der Amplitude einer klassischen Welle entspricht
(komplexe Zahlen werden in Anhang A erläutert). Ihr Absolutquadrat |ψ(x)|2 = ψ(x)ψ ? (x) ist
aber keineswegs identisch mit der beobachteten Intensitätsverteilung. Das ist schon aus dem
Grund nicht möglich, weil Interferenzen auch dann auftreten, wenn sich immer nur ein Elektron
zur Zeit im Apparat befindet. Das bedeutet, dass jedes Elektron mit sich selbst interferiert und
nicht mit anderen Elektronen.
Was ist die Bedeutung der Wellenfunktion in der Quantenmechanik? Wir folgen hier der
allgemein akzeptierten Wahrscheinlichkeitsinterpretation, die von Max Born eingeführt und insbesondere von Niels Bohr mit großer Überzeugung vertreten wurde (man spricht daher auch von
der Kopenhagener Deutung der Quantentheorie). Die Wahrscheinlichkeit, das Elektron zwischen
x und x + dx auf dem Schirm zu finden, ist
P (x)dx = |ψ(x)|2 dx
(1.4)
Da das Elektron an irgend einer Stelle auftreffen wird, muss die Integration über den gesamten Bereich den Wert 1 ergeben. Die Wellenfunktion ist in der Kopenhagener Deutung eine
Wahrscheinlichkeitsamplitude.
Wie wird das Interferenzmuster aufgebaut?
Wir wählen den Teilchenstrom aus der Quelle so niedrig, dass sich zu jedem Zeitpunkt maximal
nur ein Elektron in der Apparatur befindet. Das Auftreffen des Elektrons auf dem Schirm werde
- wie beim altmodischen Geigerzähler - durch einen “Klick” in einem Lautsprecher angezeigt.
Es gibt dann zwei wichtige Befunde:
• Jedes Elektron macht den gleichen Klick, es gibt keine halben oder drittel Klicks.
• Ein einzelnes Elektron erzeugt genau einen Punkt auf dem Schirm. Das Interferenzmuster
wird erst mit sehr vielen Elektronen sichtbar.
Das bedeutet: wie die Kugeln treffen die Elektronen als ganze, unteilbare Quanten auf den
Schirm und bauen die Verteilung sukzessive auf. Schematisch ist dieser Vorgang in Abb. 1.3a
dargestellt, während Abb. 1.3b ein experimenteller Beleg dafür ist, dass es in der Tat so abläuft.
1.2.2
Wellen- und Quantennatur des Lichts
Wie steht es nun mit Licht? Auch hier kann man bei niedriger Beleuchtungsstärke die Granularität der Strahlung erkennen. Eine schöne Demonstration dafür ist die Abb. 1.4, in der Fotos
einer Frau bei sehr unterschiedlichen Belichtungsstärken gezeigt werden. Wenn nur wenige Photonen die lichtempfindliche Schicht treffen, sieht man ein unregelmäßiges Muster heller Punkte
auf dunklem Hintergrund. Mit wachsender Photonenzahl arbeitet sich das Bild allmählich heraus, aber man braucht viele Millionen Lichtquanten, um es gut erkennen zu können.
Die Sequenz von Fotos ist ein Beleg für beide Aspekte des Lichts: Die Wellennatur zeigt sich
darin, dass mit Hilfe von Glaslinsen eine Abbildung gemacht werden kann, die Quantennatur
wird durch die granulare Struktur in den schwach belichteten Bildern offensichtlich. Licht ist
also beides: Welle und Teilchen.
Die duale Natur des Lichts wird beim photoelektrischen Effekt deutlich, aber noch besser
beim Comptoneffekt. In Abb. 1.4 werden Daten zur Streuung von Röntgenstrahlung an Graphit
7
Abbildung 1.3: Entstehung des Interferenzmusters beim Doppelspaltexperiment mit Elektronen. (a)
Schematische Darstellung: jedes Elektron macht genau einen “Eintrag” im Interferenzdiagramm, wobei
die Wahrscheinlichkeit durch das Absolutquadrat der Wellenfunktion gegeben ist. (b) Beobachtung von
Elektroneninterferenzen mit wenigen und mit vielen Elektronen. (Aus P. Tipler, Physik, Spektrum-Verlag
1994).
gezeigt. Die Wellenlänge der einlaufenden Strahlung beträgt 71 pm=71·10−12 m, die der um 90◦
gestreuten Strahlung ist 73,4 pm. Dies kann man quantitativ erklären, wenn man den Vorgang
als Streuprozess eines Lichtquants an einem lose gebundenen atomaren Elektron deutet. Bei
dieser Streuung überträgt das Photon Energie auf das Elektron. Nach dem Stoss ist daher sein
Impuls kleiner und die Wellenlänge grösser. Als Funktion des Streuwinkels ist sie gegeben durch
die Comptonsche Streuformel
2π~
λ0 = λ +
(1 − cos θ) ,
(1.5)
me c
die in Anhang B hergeleitet wird. In der klassischen Elektrodynamik hingegen würde das atomare Elektron eine erzwungene Schwingung im Feld der elektromagnetischen Welle ausführen
und Strahlung mit genau der Frequenz und Wellenlänge dieser Welle emittieren. Mit anderen
Worten: die um 90◦ gestreute Strahlung müsste ebenfalls λ = 71 pm haben.
1.2.3
Durch welchen Spalt fliegt das Elektron?
Die Elektron kommen am Detektor (fotografische Schicht oder CCD-Chip) als praktisch punktförmige Teilchen an. Demnach erscheint es vernünftig, sie generell als punktförmig anzusehen
und folgende Behauptung aufzustellen: Jedes Elektron fliegt entweder durch Spalt 1 oder durch
Spalt 2, aber nicht gleichzeitig durch beide Spalte.
8
Abbildung 1.4: Experimentelle Beweise für die duale Natur des sichtbaren Lichts und der Röntgenstrahlung. Links: Fotografie als Quantenprozess. Die Aufnahmen eines Frauenkopfes wurden mit sehr
unterschiedlichen Belichtungszeiten gemacht, zwischen 3000 und 30.000.000 Photonen. Die granulare
Natur des Lichtes ist bei schwach belichteten Bildern deutlich zu erkennen. (Aus T. Hey, P. Walters, Das
Quantenuniversum, Spektrum-Verlag 1998). Rechts: Streuung von Röntgenstrahlung an Graphit. Die
Wellennatur der Strahlung wird zweimal ausgenutzt: mit Hilfe von Bragg-Reflektion an einem Kristallgitter wird eine bestimmte Wellenlänge der einfallenden Strahlung selektiert (hier λ = 71 pm), und die
Wellenlänge der gestreuten Strahlung wird wiederum über Bragg-Reflektion gemessen. Die Quantennatur der Strahlung ist nötig, um den Prozess mathematisch zu beschreiben, siehe Text. Anmerkung: bei
großen Streuwinkeln beobachtet man zwei Intensitätsmaxima. Das Maximum bei der unverschobenen
Wellenlänge von 71 pm ist auf Comptonstreuung am gesamten Atom zurückzuführen.
Diese einleuchtende Behauptung erweist sich als nicht haltbar. Sobald man sich ein Experiment ausdenkt, mit dem geprüft werden kann, ob ein Elektron durch Spalt 1 oder Spalt 2
fliegt, verschwindet das Interferenzmuster. Eine wichtige Konsequenz dieser Erkenntnis ist: Es
ist nicht sinnvoll, von einer Bahnkurve des Elektrons in atomaren Dimensionen zu sprechen. Die
begrifflichen Schwierigkeiten des Teichen-Welle-Dualismus werden in Abb. 1.5 veranschaulicht.
9
Abbildung 1.5: Das Doppelspaltexperiment als Cartoon (Grafik von R.J. Buchelt). (Aus H. Rauch,
Physik in unserer Zeit, 29. Jahrg. 1998, Nr. 2).
Werner Heisenberg hat ein Gedankenexperiment konstruiert, in dem festgestellt werden
könnte, durch welchen Spalt das Elektron geht. Die Idee ist, kurzwelliges Licht zur Beobachtung zu benutzen. Der Haken ist jedoch, dass das Elektron bei der Streuung des Photons
eine Richtungsänderung erleidet, die das Interferenzmuster stört, wobei die Stärke der Störung
von der Wellenlänge des Photons abhängt.
(a) Bei sehr kleiner Wellenlänge λ d (d ist der Spaltabstand) kann man eindeutig den richtigen
Spalt erkennen, und es ergibt sich eine Addition der Wahrscheinlichkeiten ohne Interferenz
P12 (x) = P1 (x) + P2 (x) = |ψ1 (x)|2 + |ψ2 (x)|2
(1.6)
(b) Bei großer Wellenlänge (λ d) kann man die beiden Spalte nicht mehr optisch auflösen und
beobachtet das voll ausgeprägte Interferenzmuster
P12 (x) = |ψ1 (x) + ψ2 (x)|2
(1.7)
Ein interessanter neuer Gesichtspunkt ist nun aber (und dies wird schon in den FeynmanVorlesungen diskutiert), dass es einen gleitenden Übergang zwischen diesen beiden Extremen
gibt. Wenn nämlich die Wellenlänge des Photons und der Spaltabstand etwa gleich groß sind,
kann man nur ungefähre Aussagen machen, wie dies auch in der Fuzzy-Logik der Fall ist. Nehmen
wir an, die Wahrscheinlichkeit für die richtige Zuordnung des Spaltes sei w, die für die falsche
Zuordnung (1 − w), so ergibt sich eine Verteilung der Form (siehe Feynman, Band 3)
√
2 √
2
√
√
P12 (x) = w · ψ1 (x) + 1 − w · ψ2 (x) + w · ψ2 (x) + 1 − w · ψ1 (x)
(1.8)
und damit ein Interferenzmuster mit reduziertem Kontrast. Für w = 1 tritt der obige Fall
(a) ein, für w = 0.5 der Fall (b). Dieser Übergangsbereich zwischen der makroskopischen
Physik (gar keine Interferenz bei Teilchen) und der mikroskopischen Physik (voll ausgeprägte
Teilcheninterferenz) war den Gründungsvätern der Quantentheorie nicht bekannt. Hier liegt das
Gebiet der heute viel untersuchten mesoskopischen Physik.
10
Der Übergangsbereich ist in einem Experiment2 von S. Haroche und anderen erforscht worden, das wir aus Platzgründen nur sehr schematisch beschreiben können (siehe Abb. 1.6). Die
Teilchen sind hier Rubidium-Atome in einem hochangeregten Zustand, die Hauptquantenzahl
beträgt n = 51 (man nennt diese hochangeregten Atome Rydberg-Atome). Diese Atome durchlaufen zwei hintereinander angeordnete Hochfrequenz-Resonatoren R1 und R2 , in denen die
Atome durch Einstrahlung einer Frequenz von f0 = 51.099 GHz vom Zustand (n = 51) in den
Zustand (n = 50) überführt werden können. Am Detektor wird die Rate der Atome im Zustand
(n = 50) gemessen. Dies ist eine moderne Variante des Doppelspaltexperiments, denn man kann
nicht entscheiden, ob der Übergang (n = 51) → (n = 50) in R1 oder R2 erfolgt. Daher sind auch
die typischen Interferenzen messbar, wenn man die eingestrahlte Hochfrequenz f ein wenig um
f0 moduliert.
Das Besondere an dem Aufbau ist nun ein supraleitender Mikrowellenresonator C zwischen
R1 und R2 , der als Messinstrument wirkt und die Rydberg-Atome mit (n = 50) von denen mit
(n = 51) unterscheiden kann. Die Rydberg-Atome sind riesig verglichen mit Atomen im Grundzustand (der Radius der n-ten Bohr’schen Bahn ist rn = n2 r1 ≈ 125 nm für n = 50) und besitzen
ein sehr großes Dipolmoment. Schon ein einzelnes Rydberg-Atom kann den supraleitenden Mikrowellenresonator verstimmen und die Phase des Hochfrequenzwelle verschieben. Die Frequenz
des Resonators fC = f0 + ∆f wird so eingestellt, dass die Phase ϕ der Mikrowellenschwingung
in C durch die hochangeregten Rb-Atome um +δϕ für die (n = 51)-Atome und um −δϕ für die
(n = 50)-Atome verschoben wird (siehe Abb. 1.6.) Der Grad der Verschiebung kann variiert
werden, indem man ∆f verändert. Damit erhält man ein einstellbares Messgerät zur mehr oder
weniger deutlichen Unterscheidung der Zustände (n = 51) und (n = 50). Übertragen auf unser
Doppelspaltexperiment heißt das: Man kann die Wahrscheinlichkeit w in Gleichung (1.8) kontinuierlich zwischen w = 0.5 (keine Unterscheidungsmöglichkeit der beiden Spalte) und w = 1
(genaue Kenntnis des richtigen Spalts) variieren. Das Ergebnis des Haroche-Experiments ist in
Abb. 1.7 gezeigt. Man kann sehr deutlich die Veränderungen des Kontrasts im Interferenzmuster
erkennen: in der Tat findet man maximalen Kontrast für w = 0.5 (keine Entscheidungsmöglichkeit), verminderten Kontrast für 0.5 < w < 1 und Verschwinden des Musters für w = 1 (genaue
Kenntnis des Spalts).
Ein hochinteressanter Aspekt dieses Experiments ist, dass es gar nicht darauf ankommt, die
Phasenverschiebung im Mikrowellenresonator tatsächlich zu messen. Allein die Tatsache, dass
dies im Prinzip möglich wäre, reicht aus, das Interferenzmuster zu beeinflussen.
1.3
Interferenzexperimente mit schweren Teilchen
Mit Neutronen sind viele verschiedene Interferenzexperimente durchgeführt worden. Eine schöne
Übersicht findet man in dem Artikel von Helmut Rauch, Neutronen-Interferometrie: Schlüssel
zur Quantenmechanik, Physik in unserer Zeit, 29. Jahrg. 1998, Nr. 2. Zur Beobachtung
von Neutronen-Interferenzen wurde aus einem Silizium-Einkristall ein sog. PerfektkristallInterferometer hergestellt, siehe Abb. 1.8. Es funktioniert ähnlich wie ein Michelson-Interferometer in der Optik. Bragg-Reflektion wird benutzt, um die Teilchenwelle in zwei Teilwellen
aufzuspalten, die auf zwei getrennten Pfaden durch das Interferometer geführt und wieder rekombiniert werden. Bringt man in einen Strahlengang eine dünne Aluminiumplatte, so wirkt
diese ähnlich wie ein Glasplatte im Michelson-Interferometer. Die Neutronen haben eine andere
Wellenlänge im Aluminium als in Luft, und daher ergibt sich ein Interferenzmuster, bei dem
die Intensität periodisch von der Dicke der Alu-Platte abhängt (Abb. 1.8). In diesem Experiment entstehen die Neutronen durch Kernspaltung in einem Reaktor. Die Strahlintensität ist
2
Physical Review Letters 77, 4887 (1996).
11
Abbildung 1.6: (a) Prinzipskizze des Aufbaus von S. Haroche und anderen zur Untersuchung des Grenzbereichs zwischen der Mikrowelt mit voll ausgeprägten Teilcheninterferenzen und der Makrowelt, in der
es keine Teilcheninterferenzen gibt ( Erläuterungen dazu im Text). (b) Phasenverschiebungen ±δϕ im
Mikrowellenresonator C durch die Rydberg-Atome mit (n = 51) oder (n = 50).
so niedrig, dass sich immer nur ein Neutron zur Zeit in der Apparatur befindet und das nachfolgende Neutron noch gar nicht entstanden ist. Wie bei den Elektronen beobachten wir also die
Interferenz der Teilchen mit sich selbst und nicht mit anderen Teilchen.
Auch viel schwerere Systeme wie die C60-Fullerene sind interferenzfähig. Messungen werden
in Abb. 1.9 gezeigt.
1.4
Bose-Einstein-Kondensation und kohärente Materiewellen
Mit dem Laser lassen sich Interferenzen sehr einfach demonstrieren. Es handelt sich dabei um
die Überlagerung von makroskopischen Wellen, bestehend aus Millionen von Photonen, die alle
den gleichen Quantenzustand einnehmen und kohärent sind. Im Bereich der Teilcheninterferenzen ist dies bis vor kurzem nicht möglich gewesen. Wie wir oben gesehen haben, sind die
Elektroneninterferenzen an Doppelspalten, aber auch die Neutroneninterferenzen in Kristallen
grundsätzlich als Interferenz jedes einzelnen Teilchens mit sich selber zu deuten. Kohärenz zwischen verschiedenen Elektronen kann man aufgrund des Pauli-Ausschließungsprinzips auch nicht
erwarten.
Anders kann dies bei Atomen mit ganzzahligem Gesamtdrehimpuls sein, die Bose-Teilchen
sind und sehr wohl den gleichen Quantenzustand einnehmen dürfen und dies bei sehr tiefen
Temperaturen auch bevorzugt tun. Seit langer Zeit ist ein solches System bekannt: Es ist die
supraflüssige Phase des Heliums, die bei Temperaturen unter 2.17 K auftritt. In den letzen
Jahren ist es gelungen, in Teilchenfallen bei sehr tiefen Temperaturen sehr viele Alkali-Atome
in einem einzigen Quantenzustand zu kondensieren. Diese Bose-Einstein-Kondensate haben ungewöhnliche Eigenschaften. Wolfgang Ketterle und Mitarbeitern gelang es 1996, ein solches
Kondensat in zwei Teile aufzuteilen und die beiden Atomwolken zur Überlappung zu bringen
(Abb. 1.10). Dabei sind erstmals makroskopische Materiewellen-Interferenzen beobachtet worden.
12
Neutroneninterferornetrie
57
ksam zu machen.
ie sich unbeobachin einem Superpotze gleichzeitig leund erst durch das
Kiste - entscheidet
lebendig ist. Aber
an sich unteilbares
wei weit voneinankann - wie in Absich an zwei raumfinden kann, geht
erstandnis deutlich
t es diese Phanon sehen werden.
absurden" Vorstelen in den letzten
Abbildung 1.7: Die beobachteten Interferenzmuster für verschieden präzise Identifikation des
eutronen durchgeHochfrequenz-Resonators R1 oder R2 , in dem der Übergang (n = 51) → (n = 50) erfolgt. Bild I:
lsohne als massive
gar keine Identifikation ergibt maximalen Kontrast; Bilder II und III: teilweise Identifikation ergibt In. Sic haben eine
terferenzen
reduziertem Kontrast; Bild IV: 100% sichere
Identifikation
lässt die Interferenzen
Abb. 2.mit
Perfektkristall-Neutroneninterferometer,
mit dem
an sich unteilbare
Neutronen völlig
nd besitzen auch
verschwinden.
aften, die sic als auf getrennten Wegen durch das Interferometer gefuhrt werden.
ei3lich besteht die
Materie zu fast
Neutroneninterferornetrie
57
n den Atomkernen Die Intensitat hinter dem Interferometer setzt
nspaltung oder an- sich aus Anteilen zusammen, die uber die
rden etliche davon Strahlwege I und I1 dorthin gelangt sind
nuantenmechanik
damit experimenaufmerksam zu machen.
mnach ist eine Katze, die sich unbeobachmechanik
relevanin einer Kiste befindet,
in einem Superpoionszustand, der die Katze gleichzeitig ledieund tot
Situation
ndig
sein lafit, und erstdes
durch das
obachten - Offnen der Kiste - entscheidet
1974
haben
h, ob
die Katze totwir
oder lebendig
ist. Aber wobei man fur die Vorwartsrichtung (0) aus
ch die Tatsache, dai3 ein an sich unteilbares
ch-osterreichischen
bjekt gleichzeitig uber zwei weit voneinan- Symmetriegriinden leicht erkennt, da8 die
r getrennte Wege gehen kann - wie in AbTRIGA-Reaktor
inraum- Anteile aus beiden Strahlwegen gleich sein
dung 1 dargestellt - oder sich an zwei
h getrennten Orten befinden kann, geht
ieunserin,,klassisches"
Abbildung
2 mussen, weil sie transmittiert-reflektiert-reer
Verstandnis deutlich
naus, und dennoch gibt es diese Phanoronenstrahl
durch
flektiert und reflektiert-reflektiert-transmitene,
wie wir im folgenden sehen
werden.
perfekten
Siliziumperimente, die diese
,,absurden" Vorstel- tiert sind. Durch das Einbringen einer Wechngen bestatigen, konnten in den letzten
voneinander
entiden
Jahrzehnten mit Neutronen
durchge- selwirkung in einen Teilstrahl in Form eines
hrt werden, die zweifelsohne als massive
len
geteilt
und
anilchen anzusehen sind. Sic haben eine beliebigen Materials, eines Magnetfeldes oder
ohldefinierte Masse und besitzen auch Abb. 2. Perfektkristall-Neutroneninterferometer,mit dem an sich unteilbare Neutronen
Teilstrahlen
wieder
Beriicksichtigung
des
GravitationsfelAbb. 3. Typisches Interferenzbild hinter
auf getrennten
Wegen durch das Interferometer
gefuhrt
werden.
iche weitere Eigenschaften,
die sic als durch
ilchen ausweisen. Schliei3lich besteht die
1ai3t
sich zeigen,
eidem Interferometer,
wenn in einem als
Teilsamte
uns umgebende
Materie zu fast des ergibt sich eine Phasenverschiebung
Abbildung 1.8: Links: Perfektkristall-Neutroninterferometer.
Rechts: Interferenzstreifen
Funktion
% aus Neutronen, die in den Atomkernen Die Intensitat hinter dem Interferometer setzt
gegeniiber
ometer
aussieht
strahl
der
Phasenschub
Dicke
des
Alumibunden sind. Beiso
der Kernspaltung
oder an- ner
sich Teilwelle
aus Anteilen zusammen,
die uber die der anderen, die ahnder
Dicke
der
Aluminiumplatten
in
einem
Strahlweg.
ren Kernreaktionen werden etliche davon Strahlwege I und I1 dorthin gelangt sind
nformationen
iiber
nium-Phasenschiebers - geandert wird.
igesetzt, und wir konnen damit
experimen- lich wie fur Licht durch einen Brechungsinren. Ein fur die Quantenmechanik relevanes als ElementarExperiment,
welches die Situation des dex n und eine raumliche Verschiebung A des
ifahrers nachempfindet, haben wir 1974 wobei man fur die Vorwartsrichtung (0) aus
eRahmen
Dichte
der Neu- Wellenzuges
beschrieben
Symmetriegriinden leicht
erkennt, da8 die werden kann
einer deutsch-osterreichischen
ooperation am 250 kW TRIGA-Reaktor in Anteile aus beiden Strahlwegen gleich sein
13
[l]. Wie
in Abbildung 2 mussen, weil sie transmittiert-reflektiert-reg,en durchgefiihrt
dai3 sich
jeweils
rgestellt, wird ein Neutronenstrahl durch flektiert
I1 - und Ireflektiert-reflektiert-transmitix
tiert sind.
ugung
einem vollig perfekten Silizium- w
im anInterferometer
- wDurch
e das Einbringen einer Wech(3) wobei I a ( Z ) 1 = g ( R ) die Impulsverteilung
nkristall in zwei weit voneinander ent- selwirkung in einen Teilstrahl in Form eines
nte koharente
geteilt und an- beliebigen Materials, eines Magnetfeldes oder
noch
imTeilstrahlen
Urankern
des Strahls angibt, deren Breite wir mit
hliei3end werden diese Teilstrahlen wieder durch Beriicksichtigung des Gravitationsfel- Abb. 3. Typisches Interferenzbild hinter
sammengefiihrt.
1ai3t sich zeigen, des ergibt sich *eine
ei- dem
Interferometer,
nden
ist. Dabei
Beschried?Phasenverschiebung
= (n- 1)xkD
=d
. & wenn in einem Teil- & bezeichnen. Damit ergibt sich als endgiil=Teilwelle
$ gegeniiber
der anderen, die ahn- strahl der Phasenschub - Dicke des Alumi3 es hinter dem Interferometer so aussieht ner
hatte jedes
n i Neutron
t derInformationen
Schro- iiber lich wie fur Licht durch einen Brechungsin- nium-Phasenschiebers - geandert wird. tige Intensititsformel
ang
x
x
uople.
nort
ernce
ncaum
ed
leher
ed
ere
3),
by
B0
20
he
he
ned
of
ve
denm
m,
was
to
mm
Fullerene Interference
Fig. 1. (A) Phase-contrast images of a single
Bose condensate (left)
and double Bose condensates, taken in the
trap. The distance between the two condensates was varied by
changing the power of
the argon ion laser-light
sheet from 7 to 43 mW.
(B) Phase-contrast image of an originally double condensate, with
the lower condensate
eliminated.
varying between 20 and 40%. When the
imaging system was calibrated with a standard optical test pattern, we found ;40%
contrast at the same spatial frequency.
B
Hence, the contrast of the atomic interference was between 50 and 100%. Because
the condensates are much larger than the
observed fringe spacing, they must have a
high degree of spatial coherence.
A
Fig. 2. Interference pattern of two
expanding condensates observed
after 40 ms time-of-flight, for two
different powers of the argon ion
laser-light sheet (raw-data images).
The fringe periods were 20 and 15
mm, the powers were 3 and 5 mW,
and the maximum absorptions
were 90 and 50%, respectively, for
the left and right images. The fields
of view are 1.1 mm horizontally by
0.5 mm vertically. The horizontal
widths are compressed fourfold,
which enhances the effect of fringe
curvature. For the determination of
fringe spacing, the dark central
fringe on the left was excluded.
0%
50 mm
100%
Intensity (arbitrary units)
SCIENCE
z
z
Abbildung
1.10: 1997Linke
VOL.
275
31 JANUARY
pared it with the pattern from a single condensate (this is equivalent to performing a
double-slit experiment and covering one of
the slits). One condensate was illuminated
with a focused beam of weak resonant light
20 ms before release, causing it to disappear
almost completely as a result of optical
pumping to untrapped states and evaporation after heating by photon recoil (Fig. 1B).
Fig. 3. (A) Fringe period versus power in the argon
ion laser-light sheet. (B) Fringe period versus observed spacing between the density maxima of
the two condensates. The solid line is the dependence given by Eq. 1, and the dashed line is the
theoretical prediction of (26) incorporating a constant center-of-mass separation of 96 mm, neglecting the small variation (610%) with laser
power.
Fig. 4. Comparison between time-of-flight images
for a single and double condensate, showing vertical profiles through time-of-flight pictures similar
to Fig. 2. The solid line is a profile of two interfering
condensates, and the dotted line is the profile of a
single condensate, both released from the same
double-well potential (argon ion laser power, 14
mW; fringe period, 13 mm; time of flight, 40 ms).
The profiles were horizontally integrated over 450
mm. The dashed profile was multiplied by a factor
of 1.5 to account for fewer atoms in the single
condensate, most likely the result of loss during
elimination of the second half.
Seite: Phasenkontrast-Aufnahmen
von
getrennten
Bose-EinsteinSCIENCE z VOL.
275 zzwei
31 JANUARY
1997
Kondensaten, bestehend aus Natrium-Atomen. Die Breite der Kondensate beträgt etwa 20 µm. Rechte
Seite: beobachtete Interferenzen bei der Überlappung der beiden Kondensate. (M.R. Andrews et al.,
SCIENCE 275, 637 (1997)).
14
639
Downloaded from www.sciencemag.org on June 4, 2009
ed
2).
en
tly
be
nng
ed
he
ole
of
by 67 mm (1/e2 radii), with its long axis camera by retarding the transmitted probe
perpendicular to the long axes of the con- beam by a quarter-wave with a phase plate
densates. The argon ion laser beam propa- in the Fourier plane. Previously, the transgated nearly collinearly with the vertical mitted probe beam was blocked by a thin
probe beam. We aligned the light sheet by wire (dark-ground imaging).
Interference between the condensates
imaging the focused argon ion laser beam
with the same camera used to image the was observed by simultaneously switching
off the magnetic trap and the argon ion
condensates.
Die RInterferenz
ist nun
ESEARCH ARTICLE
Evaporative cooling was extended well laser-light sheet. The two expanding condeutlich
ausgeprägter
densates
overlapped
and bywere
observed
by
below the transition temperature to obtain probe
time-of-flight
image did not
We observed that the fringe period be- The resulting
light was
only absorbed
a thin
slice
came smaller for larger powers of the argon exhibit interference, and the profile of a
the cloud where
the atoms
were40optically
imaging.
After
ms time-ofcondensates without a discernible normal ofabsorption
bis hincondensate
zum dritten
matched one
ion laser-light sheet (Fig. 3A). Larger power single expanded
spatialbeam
resolution
flight, anBecause
opticalhigh
pumping
transferred
fraction. Condensates containing 5 3 106 pumped.
the profile of a double condensate
increased
the distance between the two side of Maximum.
of atomsstate
therequired
atoms from
fromonly
the the
F 5fraction
1 hyperfine
to
sodium atoms in the F 5 1, mF 5 –1 ground was
residing in the slice, a good signal-to-noise condensates (Fig. 1A). From phase-contrast (Fig. 4). The profile of a single expanded
the required
F 5 2 condensates
state. Withwith
a 10-ms
delay, the
state were produced within 30 s. The pres- ratio
millions of images, we determined the distance d be- condensate showed some coarse structure,
atoms were exposed to a short (50 tween
ms) the density maxima of the two con- which most likely resulted from the nonparaence of the laser-light sheet neither changed atoms.
polarized
beam
resonant
the number of condensed atoms from our circularly
densates versus360
argonNeutronen,
ion laser power.360
The bolic shape of the confining potential. We
Interference
between probe
two Bose
conden360
Protonen,
general,
pattern
of interference
withInthe
F 5 the
23
F9 5
3 transition fringe
and period versus maxima separation (Fig. found that the structure became more proprevious work (3) nor required a modifica- sates.
Elektronen
einen
Fulleren-Ball
3B) is inbilden
reasonable
agreement
with the nounced when the focus of the argon ion
differs
for photons
continuous
and Under
pulsed
absorbed
;20
each.
these
tion of the evaporation path; hence, prob- fringes
prediction of Eq. 1, although this equation laser had some weak secondary intensity
Two the
point-like
monochromatic
conditions,
atoms moved
;5 mm horilems with heating encountered earlier with sources.
strictly hat
applies
to two 90
point
sources. maxima. In addition, the interference besources would produce curved
60only
Ecken,
Kanten
zontally during
the exposure. Der „Ball“
an optically plugged magnetic trap (2) were continuous
(hyperbolic) interference fringes. In con- Wallis et al. (26) calculated the interfer- tween two condensates disappeared when
(gleicher
Länge)
undextended
32 Flächen,
imaging
usually show
integrates
purely technical. In the present application, trast,Absorption
ence pattern
for two
condensatesvonthe argon ion laser-light sheet was left on for
two point-like
pulsed sources
along interference
the line offringes;
sight ifand
therefore
has
the argon ion laser beam was not needed to straight
a harmonic
potentialund
with12
a Gaussian
d is the
sep- in
denen
20
Sechsecke
Fünfecke
only two-dimensional
spatial
resolution.
avoid a loss process, and thus we had com- aration
barrier. They concluded that Eq. 1 remains
between two point-like
condensind.
valid
for
the
central
fringes
if
d
is
replaced
sates,
then
their
relative
speed
at
any
point
plete freedom in the choice of laser power Because the depth of field for 15-mm fringes
by the geometric mean of the separation of
inis space
is d/t, where
is the
delay
comparable
to tthe
size
of between
an expanded
and focal parameters.
the centers of mass and the distance besourcethe
(switching
off in
thegeneral
cloud, on
andthe
because
fringes are
The double condensate was directly ob- pulsing
„C60
is almost a classical
trap) and observation. The fringe period is tween the density maxima of the two connotdeparallel
to the axis
of the probe
served by nondestructive phase-contrast the
body,
of ist
many
densates. because
This prediction
is also
shown in
Broglie wavelength
l associated
with light,
line-of-sight
integration
would
cause
imaging (Fig. 1A). This technique is an the
Fig. 3B. The agreement is satisfactory given
relative motion
of atoms with
mass
m, conexited
internal
degrees
of
We avoided this problem
extension of our previous work on disper- siderable blurring. ht
our experimental uncertainties in the deterfreedom
and
their
possible
resolution
sive imaging (4) and greatly improved the and achieved lthree-dimensional
5
(1) mination of the maxima separations (;3
md
mm) andcoupling
of the center-of-mass
of the probe light
signal-to-noise ratio. The probe light fre- by restricting absorption
to the separations
(;20%). We conclude that the numerical
h is Planck’s
constant.
to a thin
horizontal
slice ofThe
theamplicloud. The
quency was far detuned from a resonant where
environement“
simulations
for extended interacting
and Fulleren
contrast of the
interference
pat-oben:
1.9:
Das
C60.
mit C60.con-Rechts unten: ohne
optical
pumping beam
wasRechts
focused
into
a Interferenzen
transition (1.77 Abbildung
GHz to the red),
and Links:
thus tude
tern depends on the overlap between the densates (26) are consistent with the oblight
sheet
of
adjustable
thickness
(typically
absorption wasBeugungsgitter
negligible. Images(nach
were O.
Nairz,
M.
Arnd
und
A.
Zeilinger,
Univ.
Wien).
served fringe periods.
two condensates.
and a width
fewcondenmillimeters;
formed by photons scattered coherently in 100
We performed a series of tests to support
Themm)
interference
patternofofatwo
this after
pumping
propagated
perpendicuthe forward direction. The phase modula- sates
40 ms beam
time-of-flight
is shown
in our interpretation of matter-wave interfer2. A
of measurements
fringe to ence.
larly
toseries
the probe
light andwith
parallel
the To demonstrate that the fringe pattern
tion caused by the condensate was trans- Fig.
of of
;15
a contrast
long axis
themm
trapshowed
(39). As
a result, was
the caused by two condensates, we comformed into an intensity modulation at the spacings
Downloaded from www.sciencemag.org on June 4, 2009
nt
7).
ernlly
its
pic
he
till
te”
5,
ge
ber
to
nt,
ed
wa
nd
ey
1.5
Didaktische Anmerkungen
Die Unanschaulichkeit der Quantentheorie
Einer der Väter der Quantenelektrodynamik, Richard Feynman, hat den Aphorismus geprägt
“Nobody really understands quantum physics”. Dieser Satz klingt fast so provokativ wie der
berühmte Ausspruch von Albert Einstein “Gott würfelt nicht”, man muss ihn aber wie diesen mit
einiger Vorsicht anwenden. Feynman selbst wusste sehr genau, wie man in der Quantentheorie
Berechnungen durchführt, er war geradezu ein Meister darin und hat mit seiner Erfindung
der Feynman-Graphen viel zur Vereinfachung der Quantenelektrodynamik beigetragen. Was
er meinte ist, dass die anschauliche Vorstellung uns Schwierigkeiten macht. “Anschauen” mit
bloßen Augen können wir nur die hinreichend großen Dinge, und bei diesen gibt es keine WelleTeilchen-Komplementarität. Eine Glasmurmel wird entweder durch Spalt 1 rollen oder durch
Spalt 2, aber nicht durch beide “gleichzeitig”. Die de Broglie-Wellenlänge einer Glasmurmel
ist selbst bei winzigen Geschwindigkeiten viel geringer als der Durchmesser eines Protons und
somit extrem viel kleiner als die Größe der Murmel. Daher ist undenkbar, dass diese Kugel
Interferenzmuster erzeugen könnte. Ebenso ist es undenkbar, dass die Murmel durch eine dünne
Folie tunneln könnte, ohne die Folie zu verletzen. Das Quantenverhalten erscheint uns aus dem
Grunde “unanschaulich”, weil wir es im normalen Leben nicht anschauen können.
George Gamov hat im Scherz eine Welt vorgeschlagen, in der die Plancksche Konstante
um viele viele Zehnerpotenzen größer ist, so dass die Welleneigenschaften von Tigern merkbar
würden. Lebten wir in einer solchen Welt, so wäre für uns selbstverständlich, dass ein im Zoo
eingesperrter Tiger durch die Käfigwand nach draussen schlüpfen könnte und man ihm nicht die
Tür öffnen müsste. Wenn wir diese seltsamen Phänomene täglich sehen könnten, würden wir
sie nicht mehr als fremd empfinden, sondern sie wären für uns “anschaulich”.
Diese Überlegungen zeigen, dass “Anschaulichkeit” kein absoluter Begriff ist, sondern von
den bisher gemachten Erfahrungen abhängt. Wenn man als Physiker genügend viele Aufgaben
mit der Schrödingergleichung gelöst hat, wird man allmählich ein gewisses intuitives Verständnis für diejenigen Aspekte der Theorie entwickeln, die einem Anfänger rätselhaft erscheinen.
Warum ist es wichtig, diese höhere Art von Anschauung zu gewinnen oder zumindest die innere
Abwehr gegen die Quantenphysik abzubauen? Uns liegt sehr daran zu vermitteln, dass man aus
den Seltsamkeiten der Quantentheorie keineswegs die Schluss ziehen darf, diese Theorie sei als
solche skurril und ihren Aussagen sei nicht zu trauen. Die Vorhersagen der Theorie stimmen in
allen untersuchten Fällen mit dem Experiment überein, was man von kaum einer anderen physikalischen Theorie behaupten kann. Dies bedeutet, dass die Quantentheorie extrem leistungsfähig
ist.
Die Erweiterung unserer Anschauung durch neue Instrumente
Mit einem Lichtmikroskop kann man Pantoffeltierchen und andere Kleinstlebewesen beobachten, die er mit bloßem Auge unsichtbar sind. Schauen wir durch ein Mikroskop, so werden
wir dies in unmmittelbarer Weise als Erweiterung unseres Erkennungsvermögens wahrnehmen:
die winzigen Objekte werden “anschaulich” für uns, weil wir sie sehen können, wenn auch nur
mit Hilfsmitteln. In den letzten Jahrzehnten sind neue, extrem hochauflösende Mikroskope
entwickelt worden, die selbst einzelne Atome “sichtbar” machen können, das Rastertunnelmikroskop und das Rasterkraftmikroskop. Abbildung 1.11 zeigt zwei Beispiele. Links sieht man
die Oberfläche eines Nickel-Einkristalls, die mit einem Rastertunnelmikroskop abgetastet wurde.
Die einzelnen Atome und ihre regelmäßige Anordnung sind fantastischer Schärfe zu erkennen.
Noch eindrucksvoller ist das rechte Bild. Hier wurden Eisenatome mithilfe eines Rasterkraftmikroskops auf einer Kupferoberfläche verschoben und zu einem Ring angeordnet. Ein Bild dieses
15
Ringes erhält man durch Abtastung mit einem Rastertunnelmikroskop. Die Elektronen, die sich
auf der Kupferoberfläche im Innern diese ringförmigen Käfigs befinden, bilden eine zweidimensionale stehende Elektronenwelle, und diese Welle kann man ebenfalls abtasten. Dies ist der
direkte, visuelle Beweis für die Wellennatur der Elektronen.
Abbildung 1.11: Links: die Oberfläche eines Nickel-Einkristalls, abgetastet mit einem Rastertunnelmikroskop. Rechts: eine stehende Elektronenwelle innerhalb eines Ringes von 48 Eisenatomen auf einer
Kupferoberfläche. (Don Eigler, IBM-Forschungslabor Almaden.)
16
Kapitel 2
Die Schrödingergleichung
2.1
Die Beziehungen von Max Planck und Louis de Broglie
Der photoelektrische Effekt und die Comptonstreuung (siehe Abb. 1.4) sind Belege dafür, dass
Licht nicht nur eine Wellenerscheinung ist, sondern auch eine Teilchennatur besitzt. Die Energie
eines Lichtquants (Photons) ist über die Plancksche Beziehung
E = ~ω
(2.1)
mit seiner Kreisfrequenz ω = 2πf verknüpft. Die Plancksche Konstante1 , auch Wirkungsquantum genannt, hat den Wert
h
= 1.05 · 10−34 Js = 6.682 · 10−16 eVs
(2.2)
2π
Andererseits können mit Elementarteilchen oder gebundenen Systemen von Teilchen (Elektronen, Neutronen, Atomen) Interferenzexperimente durchgeführt werden, die den Interferenzen
mit Licht gleichen (Abb. 1.2). Diese Erscheinungen lassen sich nur im Wellenbild deuten. Die
einem Teilchen zugeordnete Wellenlünge ist durch die de Broglie-Beziehung gegeben:
~=
λ=
2π~
,
p
(2.3)
wobei p = mv der Impuls des Teilchens ist. Wenn man die Wellenzahl k = 2π/λ einführt,
lässt sich die de Broglie-Gleichung auch in der Form p = ~k oder als Vektorgleichung p = ~k
schreiben. Die beiden Beziehungen
E = ~ω
und p = ~k
(2.4)
sind die Grundgleichungen der Quantentheorie. Sie gelten in der nichtrelativistischen Quantenmechanik und auch in der relativistischen Quantenelektrodynamik und den anderen relativistischen Quantenfeldtheorien (Standard-Modell der vereinheitlichten elektro-schwachen Wechselwirkung, Quantenchromodynamik). Man kann diese Relationen sowohl für Teilchen mit Masse
m > 0 (Elektronen, Neutronen, Atome) als auch für die masselosen Photonen anwenden, bei
denen allerdings der Impuls in der Form p = E/c geschrieben werden muss, wobei c die Lichtgeschwindigkeit im Vakuum ist. Wir werden uns im Weiteren vorwiegend mit Elektronen und
anderen massiven Teilchen beschüftigen und voraussetzen, dass die Geschwindigkeiten viel kleiner als c sind, so dass die nichtrelativistische Beziehungen zwischen Energie und Impuls verwendet werden dürfen. Zur korrekten Beschreibung von Photonen und ihrer Wechselwirkung mit
geladenen Teilchen benötigt man eine relativistische Theorie.
1
Wir verwenden in dieser Vorlesung immer ~ = h/(2π) (gesprochen h-quer) und nennen dies die Plancksche
Konstante. Die Kreisfrequenz ω = 2πf wird zur Vereinfachung oft “Frequenz” genannt.
17
2.2
Energie- und Impulsoperator
Teilchen mit wohldefiniertem Impuls haben alle dieselbe Wellenlünge und können, was Interferenzmuster angeht, durch harmonische Wellen beschrieben werden. Es erweist sich in der
Quantenmechanik als notwendig, nicht mit Sinus- oder Cosinuswellen zu rechnen, sondern die
komplexe Exponentialfunktion zu benutzen. Die Welleneigenschaften von Elektronen, die sich
in einem kräftefreien Bereich bewegen, beschreiben wir durch eine Wellenfunktion Ψ, die die
Form einer ebenen Welle hat2
Ψ(x, t) = Aei(k x−ωt)
(2.5)
Die Grösse A ist ein Normierungsfaktor. Ein Grundprinzip der Quantentheorie ist, dass die physikalischen Messgrößen eines Teilchens wie Energie und Impuls durch Operatoren beschrieben
werden. Anwendung eines Operators auf die Wellenfunktion ergibt den Messwert der entsprechenden physikalischen Größe. Dies Prinzip soll nun angewandt werden, um die Form des
b und des Impulsoperators pbx plausibel zu machen.
Energieoperators E
b
EΨ(x,
t) = EΨ(x, t) ,
pbx Ψ(x, t) = px Ψ(x, t)
(2.6)
Benutzen wir E = ~ω und px = ~k so ergibt sich die folgende Form der Operatoren
b = i~ ∂ ,
E
∂t
pbx = −i~
∂
.
∂x
(2.7)
Zur Illustration wenden wir den Energieoperator auf eine ebene Welle an
∂Ψ
b
EΨ(x,
t) = i~
= i~(−iω)Ψ(x, t) = ~ωΨ(x, t)
∂t
Partielle Ableitungen werden in Anhang A erklärt. Dreidimensional gilt


∂x
∂
∂
∂
, ∂y =
, ∂z =
.
pb = −i~∇ ≡ −i~  ∂y  mit ∂x =
∂x
∂y
∂z
∂z
(2.8)
Die Gestalt der Energie- und Impulsoperatoren ist mithilfe der ebenen Wellen plausibel gemacht
worden. In der Quantentheorie wird postuliert, dass diese Operatoren ganz generell die Form
(2.7, 2.8) haben.
2.3
Die Form der Schrödingergleichung
In der klassischen Physik werden ebene elektromagnetische Wellen in der Form
f (x, t) = a cos(k x − ωt) oder f (x, t) = a sin(k x − ωt)
mit k =
2π
λ
dargestellt. Die Beziehung zwischen Wellenvektor und Kreisfrequenz lautet
ω = c k ⇒ ω 2 = c2 k 2
(2.9)
Genau diese Relation ergibt sich, wenn man die harmonischen Wellen in die folgende Differentialgleichung einsetzt
2
∂2f
2∂ f
=
c
(2.10)
∂t2
∂x2
2
Eine bessere Beschreibung wird durch ein Wellenpaket geliefert, s. Kap. 3.4.2.
18
Dies ist die Wellengleichung für eine der Komponenten des elektrischen oder magnetischen Feldes. Im Vakuum und bei Abwesenheit von Ladungen und Strömen sind ebene harmonische
Wellen spezielle Lösungen dieser Gleichung. Man darf allerdings nicht behaupten, durch diese
Betrachtungen die Wellengleichung aus der Gestalt der ebenen Wellen und der Gleichung (2.9)
hergeleitet zu haben. Die Wellengleichung elektromagnetischer Felder kann aus den MaxwellGleichungen hergeleitet werden (siehe Theorie B), und sie gilt sehr allgemein, z.B. auch in
inhomogenen Medien mit räumlich veränderlichem Brechungsindex, wobei die Lösungen dann
allerdings keine ebenen harmonischen Wellen mehr sind.
Wir sind jetzt in der Lage, uns die Form der Schrödingergleichung plausibel zu machen. Für
ein freies Teilchen lautet die Beziehung zwischen Energie und Impuls
E=
p2
2m
(2.11)
Einsetzen von (2.4) ergibt
~2 k 2
(2.12)
2m
Eine Differentialgleichung, die bei Anwendung auf eine harmonische ebene Welle diese Relation
ergibt, lautet
~2 ∂ 2 Ψ
∂Ψ
=−
(2.13)
i~
∂t
2m ∂x2
Dies ist die eindimensionale Schrödingergleichung eines freien Teilchens. Alternativ kommt
man zu dieser Gleichung durch Einsetzen der Energie- und Impulsoperatoren in (2.11). Wie
schon bei der Wellengleichung betont wurde, handelt es sich hier nicht um eine Herleitung der
Schrödingergleichung im mathematischen Sinn, sondern es geht nur darum, die Gestalt dieser
Differentialgleichung verständlich zu machen. “Beweisen” kann man diese Gleichung nicht, denn
sie geht eindeutig über den Rahmen der klassischen Physik hinaus.
Die Schrödingergleichung unterscheidet sich ganz erheblich von der klassischen Wellengleichung
~ω =
• sie ist von der ersten Ordnung in der Zeit
√
• es tritt der Faktor i = −1 auf
• die Wellenfunktion Ψ ist eine komplexwertige Funktion.
In der klassischen Physik und der Elektrotechnik sind die komplexen Zahlen sehr nützlich, um
die Rechnungen einfacher und eleganter zu machen, wirklich notwendig sind sie nicht. In der
Quantentheorie ist das anders: die Zeitabhängigkeit der Wellenfunktion ist grundsätzlich von
der Art exp(−iωt) und keineswegs cos(ωt) oder sin(ωt).
In den meisten Fällen von praktischem Belang befindet sich das Teilchen in einem Kraftfeld,
von dem wir voraussetzen, dass es konservativ ist und durch ein Potential V (x, t) beschrieben
werden kann. Die allgemeine Form der zeitabhängigen Schrödingergleichung lautet
∂Ψ
~2 ∂ 2 Ψ
=−
+ V (x, t) Ψ(x, t) .
(2.14)
∂t
2m ∂x2
In Analogie zur Hamiltonfunktion der analytischen Mechanik, die die Summe der kinetischen
und potentiellen Energie ist, führt man den Hamilton-Operator ein
i~
2
2
b = − ~ ∂ + V (x, t) .
H
2m ∂x2
19
(2.15)
Damit kann man die zeitabhängige Schrödingergleichung in kompakter Form schreiben
∂Ψ
b Ψ(x, t) .
i~
=H
∂t
Die Verallgemeinerung auf drei Dimensionen ergibt
~2 ∂ 2 Ψ ∂ 2 Ψ ∂ 2 Ψ
∂Ψ
+
+
+ V (r, t) Ψ(r, t)
= −
i~
∂t
2m ∂x2
∂y 2
∂z 2
~2 2
= −
∇ Ψ(r, t) + V (r, t) Ψ(r, t) .
2m
Mit dem Hamilton-Operator lautet die Gleichung
i~
∂Ψ
b Ψ(r, t)
=H
∂t
2
b = − ~ ∇2 + V (r, t)
mit H
2m
(2.16)
(2.17)
(2.18)
Diese Gleichung wird als Grundgleichung der nichtrelativistischen Quantenmechanik postuliert.
Die zeitunabhängige Schrödingergleichung
Sehr wichtig sind die Spezialfälle, bei denen das Potential nicht von der Zeit abhängt. Man kann
dann die Wellenfunktion als Produkt einer orts- und einer zeitabhängigen Funktion ansetzen:
Ψ(x, t) = ψ(x) · f (t)
(2.19)
Wenn wir dies in (2.14) einsetzen so folgt
~2 d2 ψ
df
+ V (x)ψ(x)
i~ · ψ(x) = f (t) · −
dt
2m dx2
Dividieren wir die Gleichung durch f (t) · ψ(x) so folgt3
2 2
i~ df
1
~ d ψ
=−
+ V (x)ψ(x) .
f (t) dt
ψ(x) 2m dx2
Links steht eine Funktion, die nur von der Zeit abhängt und nicht vom Ort, rechts ist es umgekehrt. Diese Gleichung kann nur dann für alle Werte von x und t gelten, wenn beide Seiten
gleich einer Konstanten sind. Diese Konstante nennen wir E. Daraus ergeben sich getrennte
Differentialgleichungen für f (t) und ψ(x). Die erste lautet
i~
df
= Ef (t)
dt
(2.20)
und hat die Lösung
E
.
(2.21)
~
Offensichtlich hat E die Dimension einer Energie, es handelt sich in der Tat hier um die Gesamtenergie des Teilchens, die Summe aus der kinetischen und der potentiellen Energie. Die zweite
Gleichung ist die zeitunabhängige Schrödingergleichung
f (t) = e−iωt
mit
ω=
~2 d2 ψ
+ V (x)ψ(x) = E ψ(x)
2m dx2
Die dreidimensionale zeitunabhängige Schrödingergleichung lautet entsprechend
~2 ∂ 2 ψ ∂ 2 ψ ∂ 2 ψ
−
+
+
+ V (r)ψ(r) = E ψ(r)
2m ∂x2
∂y 2
∂z 2
−
3
(2.22)
(2.23)
Diese Division ist zulässig, da die Wellenfunktion eines Teilchens nicht identisch null sein darf. Die Funktion
f (t) ist immer ungleich null, die Funktion ψ(x) ist in weiten Bereichen ungleich null. Da f (t) und ψ(x) jeweils
von nur einer Variablen abhängen, werden die partiellen Ableitungen durch normale Ableitungen ersetzt.
20
Eigenfunktionen und Eigenwerte
Diese Differentialgleichungen sind Eigenwertgleichungen:
b =Eψ ,
Hψ
(2.24)
wobei die Randbedingungen zu berücksichtigen sind, die eine sehr wichtige Rolle spielen, s. die
Beispiele in Kap. 3. Die Lösungen der Gl. (2.24), die die Randbedingungen erfüllen, nennt man
die Eigenfunktionen, sie existieren in vielen Fällen nur für gewisse diskrete Werte der Energie E,
die dann Eigenwerte heissen. Für den Eigenwert En hat die Gesamtwellenfunktion die Gestalt
Ψn (x, t) = ψn (x) exp(−iωn t)
2.4
mit ωn =
En
~
(2.25)
Die Wahrscheinlichkeitsinterpretation
Die Wellenfunktion ψ soll die Welleneigenschaften eines Elektrons oder eines anderen Teilchens
mathematisch erfassen. Wir werden später sehen, dass ψ alle messbaren Eigenschaften des
Teilchen beschreibt. Auch wenn es bei quantenmechanischen Rechnungen oft gewisse formale
Analogien zur Theorie der mechanischen oder elektromagnetischen Wellen gibt, so muss man
sich doch vor Augen führen, dass ganz gravierende Unterschiede bestehen. Die Amplitude
einer klassischen Welle ist kontinuierlich veränderbar, und die Intensität wächst quadratisch
mit der Amplitude an. Die Amplitude einer Einteilchen-Wellenfunktion hingegen hat nichts
mit der Stärke dieser “Materiewelle” zu tun, sie ist vielmehr durch eine Normierungsbedingung
festgelegt (s. unten) und kann in keiner Weise variiert werden.
Seit der Begründung der Quantentheorie hat es kontroverse Diskussionen über die physikalische Bedeutung der Wellenfunktion gegeben. In Einklang mit den meisten Physikern bevorzugen
wir die Wahrscheinlichkeitsinterpretation, die von Max Born vorgeschlagen und besonders von
Niels Bohr propagiert wurde. Auch die neuesten experimentellen Tests der Quantenmechanik
sind mit dieser Kopenhagener Deutung der Quantentheorie in Einklang, während andere Deutungen dadurch in große Schwierigkeiten kommen. Viele Jahre lang wurde die Frage diskutiert,
ob es “verborgene Variable” (hidden variables) geben könnte, die weitere, nicht bereits von der
Wellenfunktion abgedeckte Informationen enthalten. Die modernen Experimente ergaben die
eindeutige Antwort, dass solche verborgene Variablen nicht existieren, und dass alles, was man
über ein Quantensystem aussagen kann, in der Wellenfunktion enthalten ist.
Wir wollen die Wahrscheinlichkeitsinterpretation zuerst für eine Raumdimension betrachten.
Sei ψ(x) die Wellenfunktion eines Teilchens. Dann ist die Wahrscheinlichkeit, das Teilchen im
Intervall [x, x + dx] zu finden, gegeben durch den Ausdruck
|ψ(x)|2 dx .
Wir nennen
ρ(x) = |ψ(x)|2
(2.26)
die Wahrscheinlichkeitsdichte. Da die Funktion ψ(x) genau ein Teilchen repräsentieren soll,
muss man bei der Aufsummation der differentiellen Wahrscheinlichkeiten den Wert 1 erhalten
Z +∞
|ψ(x)|2 dx = 1 .
(2.27)
−∞
Man nennt diese Gleichung die Normierungsbedingung.
21
Die Verallgemeinerung auf drei Dimensionen ist naheliegend: die Wahrscheinlichkeit, das
Teilchen im Bereich [x, x + dx], [y, y + dy], [z, z + dz] zu finden, ist gegeben durch den Ausdruck
|ψ(x, y, z)|2 dxdydz .
Das Normierungsintegral lautet
Z
+∞ Z +∞ Z +∞
−∞
−∞
−∞
|ψ(x, y, z)|2 dxdydz = 1 .
(2.28)
Man kann in der Quantenmechanik eine Kontinuitätsgleichung herleiten, die der Kontinuitätsgleichung der Elektrodynamik entspricht, siehe Anhang B.
2.5
Das Unschärfeprinzip
Die Wellennatur des Elektrons (oder anderer Teilchen) hat eine wichtige Konsequenz: man kann
den Ort und den Impuls des Teilchens nicht gleichzeitig exakt festlegen. Es gilt die berühmte
Unschärferelation von Werner Heisenberg
∆x∆p ≥ ~/2
(2.29)
Die genaue Definition der Unschärfen wird in Kap. 4 gebracht. Will man den Impuls eines
Teilchens sehr präzise festlegen, so muss wegen p = 2π~/λ auch die de Broglie-Wellenlänge
λ entsprechend präzise sein. Damit dies gewährleistet ist, muss die Wellenfunktion die Form
eines sehr langen harmonischen Wellenzuges haben, siehe Abb. 2.1. Ein solcher Wellenzug bestimmt den Ort des Teilchens aber nur mit einer großen Unsicherheit. Im umgekehrten Fall,
dass man den Ort genau definieren möchte, muss man als Wellenfunktion einen sehr schmalen
Wellenpuls wählen. Es erscheint fragwürdig, einem solchen Puls überhaupt eine Wellenlänge
zuzuordnen. Die Fourieranalyse ermöglicht jedoch, auch kurze Pulse durch Superposition harmonischer Wellen darzustellen, aber das Spektrum ist umso breiter, je schmaler der Puls ist.
Quantenmechanisch bedeutet dies: die Unsicherheit im Impuls des Teilchens ist umso größer, je
besser man seinen Ort festlegt. Eine genauere Betrachtung unter Benutzung von Wellenpaketen
bringen wir in Kap. 3.
2.6
Didaktische Anmerkungen
Die klassische Mechanik ist eine deterministische Theorie. Wenn ich einen Puck über eine spiegelglatte, reibungsfreie Eisfläche schieße und die Anfangsbedingungen (Ort und Impuls zum
Zeitpunkt t = 0) kenne, kann ich exakt berechnen, welche Entfernung der Puck in 2 Sekunden
zurückgelegen wird. In der Quantentheorie wird das sofort kompliziert: wegen der Unschärferelation ist es gar nicht möglich, die Anfangsbedingungen exakt zu definieren. Die unvermeidliche
Unsicherheit im Impuls bedeutet, dass die Anfangsgeschwindigkeit nicht genau bekannt ist.
Deshalb kann man auch nicht exakt voraussagen, welche Strecke das Objekt in 2 Sekunden
zurücklegen wird.
Die Quantentheorie ist präzise bei der Berechnung von statischen Eigenschaften; dies sind
z.B. die Energieniveaus in einem Atom, das magnetische Moment des Elektrons etc. Bei
zeitabhängigen Prozessen, etwa atomaren Übergängen, radioaktiven Zerfällen oder Streuung
von Teilchen an Atomkernen, erlaubt die Theorie die präzise Berechnung der Übergangswahrscheinlichkeiten (oder Wirkungsquerschnitte). Sobald es aber darum geht, den Zeitpunkt eines
22
Abbildung 2.1: Die Wellenfunktion ψ(x) (rote Kurven) und die Wahrscheinlichkeitsdichte ρ(x) = |ψ(x)|2
(blaue Kurven) eines freien Teilchens. Oberes Bild: ein langer harmonischer Wellenzug legt den Impuls
eines Teilchen relativ genau fest, beispielsweise ist ∆p/p = 1% für einen Wellenzug, der 100 Wellenlängen
lang ist. Der Ort des Teilchens ist sehr ungenau bestimmt. Unteres Bild: ein kurzer Wellenpuls legt den
Ort des Teilchens genau fest, aber seine Wellenlänge und sein Impuls sind sehr unscharf.
atomaren Übergangs oder eines radioaktiven Zerfalls vorherzusagen, versagt die Quantentheorie. Dies wird bei radioaktiven Zerfällen besonders deutlich. Niemand kann vorausberechnen,
zu welchem Zeitpunkt sich ein Poloniumkern durch α-Zerfall in einen Bleikern umwandeln wird.
Die Halbwertszeit T1/2 gibt an, wann von sehr vielen Po-Kernen die Hälfte zerfallen ist. Bei
einer großen Anzahl kann man recht genaue Vorhersagen machen, wobei allerdings statistische
Schwankungen auftreten. Haben wir am Anfang 20000 Kerne, so wissen wir, dass nach Ablauf
einer Halbwertszeit 10000 ± 100 zerfallen sind.
Bei individuellen Poloniumkernen ist unsere Vorhersagekraft praktisch null, und man kommt
zu absurd scheinenden Aussagen. Vergleichen wir zwei Po-Kerne, von denen der erste sehr “alt”
ist und bereits 5 Halbwertszeiten überlebt hat (was unwahrscheinlich aber nicht unmöglich ist),
während der zweite gerade frisch “erzeugt” wurde. Gemäss der Quantentheorie haben beide
Kerne exakt die gleiche Wahrscheinlichkeit von 50%, in der folgenden Halbwertszeit zu zerfallen.
Die “Sterblichkeit” ist also unabhängig vom Alter des individuellen Kerns. Das ist offenbar nicht
auf Menschen übertragbar, Lebensversicherungen würden sich schwer damit tun.
Die Erkenntnis, dass exakte Vorhersagen bei Quantenübergängen unmöglich sind, hat vielen Physikern des 20. Jahrhunderts großes Unbehagen bereitet, der berühmteste war Albert
Einstein. Die Quantenmechanik in der hier diskutierten Form und die Wahrscheinlichkeitsinterpretation haben sich jedoch als äußerst erfolgreich erwiesen und alle bisherigen experimentellen
Tests bestanden. Daher ist es angebracht, die unanschaulichen Aspekte dieser Theorie (TeilchenWelle-Dualismus) und den Indeterminismus zu akzeptieren. Es gibt keine bessere Theorie! Der
pragmatische Ansatz besteht darin, die Schrödingergleichung zu lösen und mit Hilfe der Wellenfunktion die Wahrscheinlichkeitsverteilung zu berechnen, und dann im zweiten Schritt diese
Verteilung sukzessive mit Teilchen zu füllen (vgl. Abb. 1.3).
23
Kapitel 3
Einfache Anwendungen der
Schrödingergleichung
In diesem Kapitel wenden wir die Schrödingergleichung auf einfache eindimensionale Beispiele
an, die zum Teil bereits in Physik III behandelt werden. Man gewinnt daraus wesentliche
Einsichten in die Prinzipien und Methoden der Quantentheorie und legt das Fundament für eine
abstrakt-theoretische Formulierung.
3.1
3.1.1
Der Potentialtopf mit unendlich hohen Wänden
Eigenfunktionen
Wir wollen die eindimensionale Schrödingergleichung für ein Teilchen in einem Potentialtopf
mit unendlich hohen Wänden lösen und das Ergebnis mit stehenden Wellen auf einer Saite
vergleichen. Das Potential habe die Form
V (x)
=
0
V (x) → ∞
0≤x≤a
für
für x < 0 ,
x>a
Die Schrödingergleichung im Bereich 0 ≤ x ≤ a lautet
−
~2 d2 ψ
·
= E ψ(x) .
2m dx2
(3.1)
In den übrigen Bereichen muss ψ(x) verschwinden, da dort das Potential unendlich groß ist.
Wir erhalten somit die Randbedingungen
ψ(0) = 0 , ψ(a) = 0 .
(3.2)
Die allgemeine Lösung ist
ψ(x) = A sin kx + B cos kx
mit
k=
√
2mE/~ .
(3.3)
Aus der ersten Randbedingung ψ(0) = 0 folgt sofort B = 0, es bleiben also nur die Sinusfunktionen. Die zweite Randbedingung ψ(a) = 0 hat eine interessante physikalische Konsequenz: die
Wellenzahl k darf nicht beliebige Werte annehmen, sondern nur die quantisierten Werte
k = kn = n
π
a
n = 1, 2, 3, . . .
24
(3.4)
Die Wellenlänge λ = 2π/k ist auch quantisiert
2a
n = 1, 2, 3, . . .
(3.5)
n
Die Länge des Topfes ist ein ganzzahliges Vielfaches der halben Wellenlänge. Abbildung 3.1
zeigt, dass eine große Ähnlichkeit mit einer eingespannten schwingenden Saite vorliegt. Die
zugrundeliegenden Differentialgleichungen (eindimensionale Wellen- bzw. Schödingergleichung)
und die Randbedingungen sind in der Tat mathematisch identisch. Die physikalische Interpretation ergibt Gemeinsamkeiten, aber auch fundamentale Unterschiede. Gemeinsam ist die
Quantisierungsbedingung (3.5) der Wellenlänge. Für die Saite folgt daraus die Quantisierung
der Frequenzen. Die Grundfrequenz ist f1 = v/λ1 , wobei v die Schallgeschwindigkeit in der
Saite ist, die Obertöne haben ganzzahlige Vielfache der Grundfrequenz fn = nf1 .
Nun die Verschiedenheiten: Eine stehende mechanische Welle kann in der Form geschrieben
werden
F (x, t) = A sin(kn x) cos(ωn t) , ωn = 2πfn
(3.6)
λn =
Wahlweise kann die Zeitabhängigkeit auch durch sin(ωn t) dargestellt werden. Die Amplitude A
ist frei wählbar (sie darf nur nicht so gross sein, dass die Saite zerreißt). Die Energie Es der
Schwingung ist proportional zu A2 und ist kontinuierlich variierbar zwischen Es → 0 (sehr leiser
Ton) und großen Es -Werten (laute Töne).
Die Wellenfunktion des Teilchens hat nach Gl. (2.25) die Gestalt
Ψn (x, t) = An sin(kn x) exp(−i ωn t) .
Aus der Normierungsbedingung berechnen wir den Amplitudenfaktor
r
Z a
2
|ψn (x)|2 dx = 1 ⇒ An =
für alle n
a
0
(3.7)
(3.8)
Für die Energiewerte gilt
~2 kn2
~2 π 2
=
· n2 .
2m
2ma2
Die Besonderheiten des Quantensystems sind
En =
(3.9)
• Die Zeitabhängigkeit ist immer durch die komplexe Exponentialfunktion gegeben
• Die Amplitude ist nicht frei wählbar, sondern durch die Normierungsbedingung festgelegt
• Die Energie ist quantisiert.
Die Energieniveaus eines eindimensionalen Potentialtopf sind in Abb. 3.1 skizziert. Die
Wellenfunktion ψn hat (n − 1) Nullstellen (Knoten) im Intervall 0 < x < a. Generell kann man
feststellen, dass die Energie umso höher ist, je mehr Knoten die Wellenfunktion hat.
Besonders wichtig ist die Beobachtung, dass der tiefste Energiewert nicht null ist. Aus
E = p2x /(2m) = 0 würde ∆px = 0 folgen, d.h. die Unschärferelation (2.29) wäre verletzt.
3.2
Der Potentialtopf mit endlicher Tiefe
In diesem Fall ist es zweckmäßig, das Potential symmmetrisch zu x = 0 anzuordnen, weil dann
die Eigenfunktionen entweder gerade oder ungerade Funktionen von x sind. Auf diese Weise
braucht man nur eine Randbedingung zu betrachten. Wir wählen also
V (x) = −V0
V (x) = 0
für
− b ≤ x ≤ b (b = a/2)
für |x| > b .
25
(3.10)
ψ1( x )
ρ1( x )
E1 4
E1
E1
ψ2( x )
ρ2( x )
E2
E2
ψ3( x )
E1 4
E2
E2
2
2
ρ3( x )
E3
E3
E3
E3
0
0
0.5
1
0
0
0.5
1
x
a
x
a
Abbildung 3.1: Links: Die ersten drei Energieniveaus (in eV) und Wellenfunktionen eines Elektrons in
einem Potentialtopf der Breite a = 1 nm mit unendlich hohen Wänden. Rechts: Die Wahrscheinlichkeitsdichten.
Innerhalb des Topfes erhalten wir eine Cosinusfunktion (gerade) oder Sinusfunktion (ungerade).
Die Schrödingergleichung wird in Anhang C gelöst.
Es gibt nur endlich viele Energieniveaus gebundener Zustände. Für einen Topf der Tiefe
−V0 = −10 eV und Breite a = 1 nm sind die Wellenfunktionen und die zugehörigen Energieniveaus eines Elektrons in Abb. 3.2 skizziert. Die Wellenfunktionen dringen mit exponentieller
Abschwächung in den Bereich |x| > b ein. Das bedeutet, dass das Elektron mit einer gewissen Wahrscheinlichkeit in einem Gebiet gefunden wird, wo seine Gesamtenergie kleiner als die
potentielle Energie ist. Das bedeutet keine Verletzung des Energiesatzes, denn das Elektron
ist nicht frei, sondern bleibt an den Potentialtopf gebunden. In der klassischen Physik ist das
Eindringen in solche “verbotenen” Bereiche nicht möglich.
Zwei Grenzfälle sind interessant:
(1) Breiter und tiefer Topf. In dem Fall sind die Energie-Eigenwerte
~2 π 2
En + V0 = n2 ·
2m a
(3.11)
Wenn man bedenkt, dass En + V0 = V0 − |En | die Höhe des Energieniveaus über dem Boden
des Topfes ist, entspricht dies genau den Energieniveaus im Potentialtopf mit unendlich hohen
Wänden.
(2) Schmaler und flacher Potentialtopf. Wenn die Breite oder Tiefe des Topfes kleiner
wird, gibt es immer weniger gebundene Zustände. Es ist interessant zu beobachten, dass selbst
26
E5
0
0
1
1
2
2
3
3
4
4
5
E3
E4
5
6
6
7
7
8
8
E2
9
E1
10
9
10
2
1
0
1
2
2
x/b
1
0
1
x/b
Abbildung 3.2: Links: Die symmetrischen Wellenfunktionen eines Elektrons in einem Potentialtopf
endlicher Tiefe mit den zugehörigen Energieniveaus. Rechts: die antisymmetrischen Wellenfunktionen.
Parameter: −V0 = −10 eV, a = 2b = 1 nm.
bei einem beliebig schmalen und flachen Potential (a → 0, V0 → 0) immer noch ein gebundener
Zustand existiert, der eine gerade Wellenfunktion hat. Diese Wellenfunktion erstreckt sich weit
über den Rand des Topfes hinaus, siehe Abb. 3.3. Der flache Topf ist ein vereinfachtes Modell eines Donatoratoms in einem Halbleiter. Eine geringe thermische Energie reicht aus, das
Elektron aus seiner Bindung zu lösen. Daher gibt es in Arsen-dotierten Siliziumkristallen freie
Elektronen, die einen elektrischen Strom transportieren können (siehe die Vorlesung Struktur
der Materie).
3.3
Der harmonische Oszillator
Annähernd parabolische Potentiale kommen sehr häufig in der klassischen und Quanten-Physik
vor, und entsprechend wichtig ist es, den harmonischen Oszillator genau zu verstehen. Das
Potential schreiben wir in der Form V (x) = C2 x2 , dabei entspricht C der klassischen Federkonstanten (wir nennen sie nicht k, q
um eine Verwechslung mit der Wellenzahl zu vermeiden). Die
klassische Kreisfrequenz ist ω =
−
C
m.
Die Schrödingergleichung lautet
~2 d2 ψ C 2
+ x ψ(x) = Eψ(x) .
2m dx2
2
27
(3.12)
2
1
ψ(x)
0
1
10
0
x/b
10
Abbildung 3.3: Ein flacher Potentialtopf mit nur einem gebundenen Zustand. Der Topf ist blau gezeichnet, die Wellenfunktion rot. Die Tiefe des Topfes beträgt −V0 = −0.8 eV, die Breite a = 2b = 0.3 nm.
Die Energie des Elektrons ist E1 = −0.2 eV.
Es ist zweckmäßig, eine neue Variable u = ax einzuführen und die Konstante a so zu wählen,
dass die Schrödingergleichung einfacher aussieht. Setzen wir
r
ωm
2E
a=
, b=
,
~
~ω
so ergibt sich die Gleichung
ψ 00 (u) − u2 ψ(u) + b ψ(u) = 0 .
(3.13)
Die Lösungen werden durch eine Kombination von Raten und Konstruieren gefunden, siehe
Anhang C. Die diskreten Energie-Eigenwerte lauten
En = (n + 1/2) ~ω
n = 0, 1, 2, 3, . . .
(3.14)
Die Wellenfunktionen und die Energieniveaus sind in Abb. 3.4 dargestellt. Der harmonische
Oszillator hat äqidistante Energieniveaus, wie sie von Max Planck im Jahr 1900 postuliert
wurden. Im Unterschied zur Planckschen Hypothese ist das tiefste Niveau aber nicht null: die
sog. Nullpunktsenergie beträgt E0 = 12 ~ω. Selbst für Temperaturen T → 0 sind harmonische
Oszillatoren nicht in Ruhe, sondern führen “Nullpunktsschwingungen” aus, die experimentell
nachweisbar sind. Die normierten Wellenfunktionen des harmonischen Oszillators lauten
r
m ω 1/4
1
mω
2
ψn (x) =
·√
· Hn (u) · exp(−u /2) , u =
x
(3.15)
n
π~
~
2 n!
mit
H0 (u) = 1
H1 (u) = u
2
H3 (u) = 8u3 − 12u
H2 (u) = 4u − 2
...
Bis auf Normierungsfaktoren sind die H(u) mit den Hermite-Polynomen identisch.
Die Grundzustandswellenfunktion und alle anderen Wellenfunktionen haben eine endliche
Ausdehnung. Dies bedeutet, dass das Teilchen nicht scharf lokalisiert ist. Wir kommen darauf
bei der Diskussion der Unschärferelation zurück. Eine weitere interessante Beobachtung ist, dass
alle Wellenfunktionen kleine Ausläufer in die Gebiete haben, in denen die Gesamtenergie des
Teilches kleiner als die potentielle Energie ist. In der klassischen Mechanik ist so etwas verboten,
weil dies eine negative kinetische Energie bedeuten würde. In der Quantenmechanik darf das
Teilchen ein bißchen in solche verbotenen Bereiche eindringen, wobei die Wahrscheinlichkeit
exponentiell mit wachsender Eindringtiefe abnimmt.
28
3
2
1
0
4
2
0
2
4
u
Abbildung 3.4: Die ersten drei Energieniveaus und Wellenfunktionen des harmonischen Oszillators.
3.4
3.4.1
Freie Teilchen, Wellenpakete
Ebene Wellen
Das einfachste denkbare Potential ist V (x) ≡ 0. Es ist eine der Merkwürdigkeiten der Quantenmechanik, dass dieses scheinbar so einfache Problem zu großen begrifflichen Schwierigkeiten
führt. Die Schrödingergleichung eines ungebundenen Teilchens
i~
∂Ψ
~2 ∂ 2 Ψ
=−
∂t
2m ∂x2
(3.16)
hat die Lösung
Ψ(x, t) = A ei(kx−ωt) ,
ω=
~k 2
E
=
.
~
2m
(3.17)
Je nach Vorzeichen von k ist dies eine nach rechts oder links laufende ebene Welle. Die Energie
darf jeden positiven Wert annehmen, es gibt keine Quantisierung. Der Impuls p = ~k ist durch
E festgelegt. Für die ebene Wellen hat die Wahrscheinlichkeitsdichte überall im Raum den gleichen Wert ρ = |A|2 . Die Wellenfunktion (3.17) ist daher denkbar ungeeignet, ein lokalisiertes
Teilchen wie ein Elektron zu beschreiben. Die Welle hat außerdem die falsche Ausbreitungsgeschwindigkeit, die Phasengeschwindigkeit ist gleich der halben Teilchengeschwindigkeit.
vph =
ω
~k
p
v
=
=
=
k
2m
2m
2
29
Drittens hat die ebene Welle den gravierenden Nachteil, nicht normierbar zu sein1 . Das Integral
Z
+∞
2
−∞
2
|ψ(x)| dx = |A|
Z
+∞
dx
−∞
ist keineswegs gleich 1, sondern es divergiert für A 6= 0 und ist null für A = 0.
3.4.2
Wellenpakete
Wie gelingt es, lokalisierte Teilchen zu beschreiben? Die grundlegende Idee ist, viele dieser
ebenen Wellen in geschickter Weise zu überlagern. Man kommt damit zu den sogenannten
Wellenpaketen.
Z
Ψ(x, t) = A(k)eikx−iω(k)t dk .
(3.18)
Dabei ist A(k) eine von der Wellenzahl abhängige Amplitudenfunktion, und es gilt
ω(k) =
~ 2
k .
2m
(3.19)
Als erstes, einfaches Beispiel wählen wir eine Amplitudenfunktion, die eine schmale um k0 = p0 /~
zentrierte Rechteckfunktion ist:
A0 für k0 − ∆k ≤ k ≤ k0 + ∆k
(3.20)
A(k) =
0
sonst
Bei der Berechnung der Wellenfunktion ist zu bedenken, dass ω(k) quadratisch von k abhängt.
In der Nähe von k0 kann man dies linearisieren
dω
ω(k) ≈ ω0 + vg (k − k0 ) mit vg =
.
(3.21)
dk k=k0
Die Grösse
vg =
dω
dk
=
k=k0
~k0
= v0
m
(3.22)
nennt man die Gruppengeschwindigkeit. Sie entspricht der Geschwindigkeit eines Teilchens mit
dem Impuls p0 = ~k0 . Das Integral (3.18) kann nun berechnet werden.
Ψ(x, t) = A0 e
i(k0 x−ω0 )t
Z
+∆k
0
eik (x−v0 t) dk 0
−∆k
mit k 0 = k − k0
Es folgt
Ψ(x, t) = 2 A0 ∆k ei(k0 x−ω0 )t
sin u
u
mit
u = ∆k(x − v0 t) .
(3.23)
Die Funktion sin u/u hat ihr Maximum bei u = 0, d.h. bei x = v0 t. Das Wellenpaket wird in
Abb. 3.5 gezeigt. Das Maximum wandert mit der Gruppengeschwindigkeit (3.22) nach rechts.
Diese ist identisch mit der Teilchengeschwindigkeit v0 , die zum mittleren Impuls p0 gehört.
1
Man kann dies Problem vermeiden, indem man der Wellenfunktion periodische Randbedingungen in einem
sehr großen Intervall auferlegt. Dies wird in der quantenmechanischen Beschreibung von Metallen und Halbleitern
und bei der Behandlung von Streuprozessen gemacht.
30
6
4
2
0
2
4
6
8
6
4
2
0
2
4
6
8
Abbildung 3.5: Ein Wellenpaket, das einer Rechteckfunktion A(k) entspricht. Gezeigt sind Ψ(x, t) (rot)
und ±|Ψ(x, t)| (blau) zum Zeitpunkt t = 0.
3.4.3
Gaussförmiges Wellenpaket
Das obige Wellenpaket ergibt schon eine gewisse Lokalisierung des Teilchens, entspricht aber
immer noch nicht dem Bild eines wenig ausgedehnten Elektrons. Wir betrachten nun ein Beispiel,
das hierfür besser geeignet ist. Der mathematische Aufwand ist größer, der physikalische Gehalt
aber ebenfalls.
Die räumliche Wahrscheinlichkeitsverteilung werde durch eine Gaussfunktion beschrieben.
Wir betrachten zunächst den Zeitpunkt t = 0. Es sei
1
x2
2
ρ(x, 0) = |Ψ(x, 0)| = √
exp − 2
2σx
2π σx
Die Wellenfunktion Ψ ist nun wirklich respektabel: sie ist normiert
Z +∞
|Ψ(x, 0)|2 dx = 1
−∞
und beschreibt ein Teilchen mit der Ortsunschärfe ∆x = σx . Als weitere Vereinfachung nehmen
wir zunächst an, dass das Teilchen ruht, genauer gesagt, dass der mittlere Impuls p0 = ~k0 = 0
ist. Die Amplitudenfunktion A(k) wird in Anhang Anhang C berechnet. Sie ist ebenfalls eine
Gaussfunktion.
k2
2
2
2
|A(k)| ∝ exp(−k · 2σx ) ≡ exp − 2 ,
(3.24)
2σk
wobei die folgende wichtige Beziehung zwischen den Varianzen besteht
2σk2 =
1
2σx2
⇒
σx σk =
1
.
2
(3.25)
Die Ortsunschärfe des Teilchens ist ∆x = σx , die Impulsunschärfe ∆px = ~σk . Daraus folgt die
fundamentale Beziehung
~
(3.26)
∆x · ∆px =
2
31
Dies ist ein Spezialfall der Heisenbergschen Unschärferelation (2.29). Im vorliegenden Fall gilt die
Unschärferelation sogar mit dem Gleichheitszeichen: für ein gaussförmiges Wellenpaket erhält
man zum Zeitpunkt t = 0 die minimal mögliche Unschärfe zwischen Ort und Impuls.
Wenn man jetzt auch noch zulässt, dass k0 6= 0 ist und somit das Wellenpaket ein Teilchen repräsentiert, das sich mit der Geschwindigleit v0 = ~k0 /m bewegt, so folgt aus einer
aufwändigen Rechnung, dass das Wellenpaket sich wie gewünscht mit der Geschwindigkeit v0
in x-Richtung bewegt. Es hat aber eine sehr unerfreuliche Eigenschaft: seine Breite nimmt im
Laufe der Zeit zu und gleichzeitig sinkt die Höhe ab. Man sagt, das Wellenpaket “zerfließt”,
siehe Abb. 3.6. Das Integral, die Fläche unter der Kurve, bleibt invariant.
t=0
20 fs
40 fs
60 fs
20
0
20
40
60
80
100
x [nm]
Abbildung 3.6: Darstellung eines freien Elektrons mit E = Ekin = 4 eV durch ein gaussförmiges
Wellenpaket. Aufgetragen ist die Wahrscheinlichkeitsdichte ρ(x, t) für verschiedene Zeiten (t=0, 20 fs,
40 fs, 60 fs). Das “Zerfließen” des Wellenpakets ist deutlich erkennbar.
Das Zerfließen des Wellenpakets bedeutet natürlich nicht, dass auch das Teilchen zerfließt.
Vielmehr wird unsere Kenntnis über seine Position im Laufe der Zeit immer ungenauer. Dies
Ergebnis kann man anschaulich deuten. Der Impuls des Teilchens ist uns nur mit einer Unschärfe
bekannt, und das Gleiche gilt für die Geschwindigkeit.
∆p = ~σk =
~
2σx
⇒ ∆v =
~
2mσx
Die in der Zeit t zurückgelegte Strecke
x(t) = v0 t ± ∆v t
hat eine Ungenauigkeit, die linear mit der Zeit anwächst.
Das Zerfließen des Wellenpakets ist eine Folge der nichtrelativistischen Mechanik, in der die
Geschwindigkeit proportional zum Impuls ist. Bei relativistischen Teilchen ist v ≈ c und nahezu
unabhängig vom Impuls. In diesem Fall zerfließt das Wellenpaket nicht. Entsprechendes gilt für
elektromagnetische Wellen im Vakuum oder in Kabeln, die wir natürlich nicht mit den Methoden
der Quantenmechanik, sondern der Elektrodynamik berechnen (siehe Theorie B). Man kann
sehr kurze Wellenpulse durch viele Kilometer lange Koaxialkabel schicken, ohne dass sie sich
merklich verbreitern. Die optische Datenübertragung durch Glasfasern beruht wesentlich darauf,
dass die Phasengeschwindigkeit bei der für optische Signalübertragung benutzten Wellenlänge
32
von 1550 nm nahezu unabhängig von der Wellenlänge ist und deswegen die kurzen infraroten
Lichtpulse nicht zerfließen.
3.5
Potentialschwelle
Das Potential sei V (x) = 0 für x < 0 und V (x) = V0 > 0 für x ≥ 0. Das Teilchen soll von links
einlaufen mit der Gesamtenergie E > 0. Wir rechnen zur Vereinfachung mit ebenen Wellen
und betrachten zunächst den Fall E < V0 . Ein klassisches Teilchen würde bei x = 0 reflektiert
werden. Die Lösung der Schrödingergleichung lautet für x < 0
√
2mE
ikx
−ikx
ψ1 (x) = Ae + Be
mit k =
~
Im Bereich x > 0 kann man die Schrödingergleichung
−
~2
· ψ 00 + V0 ψ = E ψ
2m
umschreiben in
00
2
ψ −α ψ =0
mit
p
2m(V0 − E)
α=
~
Die Lösung ist
ψ2 (x) = C e−αx + D e+αx
Die Wellenfunktion muss für x → ∞ verschwinden, daraus folgt D = 0. Am Ort x = 0 müssen
ψ und ψ 0 stetig sein:
ψ1 (0) = ψ2 (0)
ψ10 (0)
=
ψ20 (0)
⇒
⇒
A+B =C
ik(A − B) = −αC
Man kann die Koeffizienten B und C durch A ausdrücken:
B=
ik + α
A,
ik − α
C=
2ik
A.
ik − α
Das wichtige, vom klassischen Teilchenverhalten abweichende Ergebnis ist: Die Welle dringt mit
exponentieller Abschwächung in den “verbotenen” Bereich x > 0 ein. Die Wellenfunktion ist
in Abb. 3.7 dargestellt. Wie gross ist die Eindringtiefe δ = 1/α ? Als realistisches Beispiel
wählen wir V0 = 5 eV, E = 3 eV und setzen m = me . Dann ergibt sich δ ≈ 0.13 nm, das
ist etwa ein Atomdurchmesser. Die de-Broglie-Wellenlänge des Elektrons beträgt hier rund das
Fünffache dieses Wertes. Die reflektierte Welle hat die gleiche Amplitude wie die einlaufende
Welle, |B| = |A|.
Interessant wird der Fall E > V0 . In dem Fall lautet die Wellenfunktion für x > 0
p
0
ψ2 (x) = C eik x mit k 0 = 2m(E − V0 )/~
(wenn die Welle von links einläuft, gibt es im Bereich x > 0 nur eine auslaufende Welle). Aus
der Stetigkeit von ψ und ψ 0 bei x = 0 folgt
B=
k − k0
A,
k + k0
C=
33
2k
A.
k + k0
6
4
2
0
1
0.5
0
0.5
1
x [nm]
Abbildung 3.7: Die Wellenfunktion eines Elektrons der Energie E = 3 eV bei der Reflexion an einer
Potentialstufe der Höhe V0 = 5 eV.
Der wichtige Unterschied zum klassischen Teilchen ist, dass trotz E > V0 ein Teil der Welle
reflektiert wird. Der Reflexionskoeffizient (Wahrscheinlichkeit für Reflexion) ist
|B|2
k − k0 2
R=
=
.
(3.27)
|A|2
k + k0
Zur Berechnung der Transmission müssen wir bedenken, dass die Welle links und rechts eine
andere Phasengeschwindigkeit hat: v = ~k/m, v 0 = ~k 0 /m. Die Transmissionswahrscheinlichkeit
wird
v 0 |C|2
4kk 0
T =
=
.
(3.28)
v |A|2
(k + k 0 )2
Es gilt R + T = 1, dies drückt die Erhaltung der Wahrscheinlichkeit aus. Die identischen
Formeln erhält man für die Reflexion und Transmission von Licht an der Grenzfläche zwischen
zwei Medien mit verschiedenen Brechungsindizes, man muss nur k und k 0 durch n1 und n2
ersetzen. Für senkrechte Inzidenz des Lichts findet man
n1 − n2 2
4n1 n2
,
T =
.
R=
n1 + n2
(n1 + n2 )2
3.6
Der Tunneleffekt
Das Eindringen der Welle in den Bereich E < V (x) eröffnet die Möglichkeit, eine hinreichend
dünne Potentialbarriere zu durchtunneln. Wir betrachten den in Abb. 3.8 skizzierten Potentialverlauf und nehmen E < V0 an. Die Wellenfunktionen lauten für die drei Bereiche
ψ1 (x) = A eikx + B e−ikx
ψ2 (x) = C e
+αx
ikx
ψ3 (x) = F e
+De
für x < 0
−αx
für x > d
34
für
0<x<d
Anmerkung: das Teilchen soll von links einlaufen, daher gibt es bei x > d nur eine auslaufende Welle. Allerdings muss man im Zwischenbereich sowohl e+αx wie e−αx zulassen. Die
Randbedingung bei x = d ergibt
C=
α + ik −2αd
e
D,
α − ik
F =
2α −αd−ikd
e
D.
α − ik
Aus der Randbedingung bei x = 0 folgt
A+B = C +D,
ik(A − B) = α(C − D) .
In den meisten Anwendungen des Tunneleffekts ist e−αd 1. Wegen |C| = e−2αd |D| kann man
deswegen C vernachlässigen und erhält
D≈
2ik
A.
ik − α
Die Wellenfunktionen sind in Abb. 3.8 gezeigt. Die Transmissionswahrscheinlichkeit wird
6
4
2
0
1
0.5
0
0.5
1
x [nm]
Abbildung 3.8: Demonstration des Tunneleffekts: Die Wellenfunktion eines Elektrons der Energie E =
3 eV vor und hinter einer Potentialschwelle der Höhe V0 = 5 eV und der Dicke d = 0.2 nm.
T =
|F |2
E
E −2αd
e
.
=
16
1
−
|A|2
V0 V0
(3.29)
Der wesentliche Faktor ist
2p
G = exp(−2αd) = exp −
2m(V0 − E) d .
~
Die Tunnelwahrscheinlichkeit hängt exponentiell von der Breite d der Schwelle und dem Energieabstand V0 − E ab.
35
Der Tunneleffekt hat viele Anwendungen in Physik und Technik. Er ist Grundlage des
Rastertunnelmikroskops und des SQUID (Superconducting Quantum Interference Device), mit
dem kleinste Magnetfelder gemessen werden können und das in der medizinischen Diagnostik
eine wichtige Rolle spielt. Die fantastische Auflösung des Rastertunnelmikroskops ist in Abb.
3.9 zu erkennen, in der das Bild der Oberfläche eines Silizium-Einkristalls gezeigt wird. Die
einzelnen Si-Atome sind deutlich sichtbar.
Abbildung 3.9: Abtastung der Oberfläche eines Silizium-Einkristalls mit einem Rastertunnelmikroskop.
Nur mit dem Tunneleffekt kann man verstehen, dass beim radioaktiven α-Zerfall von Atomkernen die Halbwertszeiten ganz extrem von der Energie der α-Teilchen abhängen. Die Zerfallswahrscheinlichkeit eines α-aktiven Kerns ist proportional zum Gamov-Faktor
Z
2 r2 p
(3.30)
G = exp −
2m(V (r) − Eα ) dr
~ r1
Die exponentielle Abhängigkeit der Zerfallswahrscheinlichkeiten von der Energie der α-Teilchen
wird in Abb. 3.10 gezeigt, sie lässt sich mit Hilfe der Formel (3.30) verstehen.
3.7
3.7.1
Didaktische Anmerkungen
Quantisierung der Energie
Ein hervorstechendes Merkmal der Quantenmechanik ist die Quantisierung der Energie. Diskrete Energieniveaus treten immer dann auf, wenn ein Teilchen auf einen endlichen Raumbereich
eingeschränkt wird. In der klassischen Mechanik ist die Energie dagegen eine kontinuierliche
Variable. Dennoch gibt es auch dort Quantisierungen. Ein wichtiges Beispiel sind Eigenschwingungen. Wir betrachten eine eingespannte Gitarrensaite der Länge a. Die möglichen harmonischen Schwingungsformen sehen genau wie die Wellenfunktion des Teilchens im Potentialtopf
aus (Abb. 3.1). Wie schon gesagt, sind die zugrunde liegenden Differentialgleichungen (die
Wellengleichung bzw. die Schödingergleichung) und die Randbedingungen mathematisch identisch. Die Quantisierungsbedingung (3.5) der Wellenlänge tritt in beiden Fällen auf. Für die
Saite folgt daraus die Quantisierung der Frequenz: die Grundfrequenz ist f1 = v/λ1 , wobei v
die Schallgeschwindigkeit in der Saite ist. Die Frequenzen der Obertöne sind fn = nf1 . Die
36
1
Zerfallswahrscheinlichkeit
0.1
0.01
1 . 10
3
1 . 10
4
1 . 10
5
1 . 10
6
1 . 10
7
1 . 10
8
5
5.1
5.2
5.3
5.4
5.5
5.6
Energie in MeV
Abbildung 3.10: Experimentelle Daten zum α-Zerfall von Plutonium (Pu238 ) in den Grundzustand und
verschiedene angeregte Zustände von Uran (U234 ). Aufgetragen (auf einer logarithmischen Skala) ist die
relative Zerfallswahrscheinlichkeit als Funktion der α-Energie in MeV. Die exponentielle Abhängigkeit ist
deutlich erkennbar.
Amplitude der Saitenschwingung ist kontinuierlich einstellbar, und die Energie der Schwingung
ist proportional zum Quadrat der Amplitude. Eine ruhende Saite hat die Schwingungsenergie
null. Das Teilchen im Potentialtopf hat immer eine von null verschiedene Minimalenergie, die
Nullpunktsenergie.
Freie Teilchen, die sich bis ins Unendliche entfernen können, haben auch in der Quantenmechanik eine kontinuierlich veränderbare Energie. Dies betrifft beispielsweise Elektronen, die
durch Ionisation von Atomen getrennt werden. Stellt man die Bedingung auf, dass die Teilchen
sich nicht bis ins Unendliche, sondern nur bis zu einer extrem großen Entfernung frei bewegen
können, so ist ihre Energie im Prinzip zwar quantisiert, aber die Niveaus liegen so dicht, dass
sie quasi-kontinuierlich erscheinen.
3.7.2
Der Tunneleffekt in der Schule
Abbildung 3.11: Demonstration des Tunneleffekts. Mikrowellen mit einer Wellenlänge λ von etwa 3 cm
werden in einem Paraffin-Prisma durch Totalreflexion um 90◦ abgelenkt. Nähert man ein zweites Prisma
bis zu einem Abstand d λ, so läuft die Mikrowellenstrahlung geradeaus.
Mit Mikrowellen kann der Tunneleffekt sehr schön demonstriert werden. Dazu wählen wir
einen Aufbau, bei dem die Mikrowellen in einem Paraffinprisma total reflektiert und um 90◦
37
abgelenkt werden (Abb. 3.11). Bringt man ein zweites Prisma bis auf wenige Millimeter an
die Grenzfläche heran, an der die Totalreflexion stattfindet, so läuft die Mikrowellenstrahlung
einfach geradeaus, die um 90◦ abgelenkte Welle wird stark unterdrückt. Die Erklärung ist, dass
die elektromagnetische Welle ein wenig in den “verbotenen” Bereich jenseits der Paraffin-LuftGrenze eindringt und dort eine exponentielle Abschwächung erleidet. Ist diese verbotene Zone
wesentlich schmaler als die Wellenlänge, so merkt die Mikrowelle kaum etwas von dieser Zone
und geht praktisch ungehindert in das zweite Paraffinprisma über. Mit wachsender Breite des
Luftspalts wächst der total reflektierte Anteil auf Kosten des transmittierten Anteils rasch an.
38
Kapitel 4
Grundlegende Konzepte der
Quantenmechanik
In diesem Kapitel betrachten wir zur Vereinfachung der Schreibweise nur die eindimensionale
Schrödingergleichung, um daran die grundlegenden Konzepte der Quantenmechanik zu erklären.
Ein Grundprinzip der Quantentheorie ist, dass alle physikalischen Messgrößen, auch “Observable” genannt, durch Operatoren repräsentiert werden. Die möglichen Messwerte sind genau die
Eigenwerte dieser Operatoren. Dies soll am Beispiel des Hamilton-Operators sowie des Ortsund Impuls-Operators verdeutlicht werden. Im Anhang D wird der Begriff des Operators näher
erklärt.
4.1
Hamilton-Operator
Die eindimensionale Schrödingergleichung schreiben wir in der Form
~2 d2
−
+
V
(x)
ψ(x) = E ψ(x) .
2m dx2
(4.1)
Die Grösse in der eckigen Klammer ist nicht ein multiplikativer Faktor, sondern ein Operator,
also eine Rechenvorschrift, die auf die Wellenfunktion angewandt wird. Dieser Operator wird
Hamilton-Operator genannt und ist der wichtigste Operator der Quantenmechanik
2
2
b = − ~ d + V (x) .
H
2m dx2
(4.2)
Die Schrödingergleichung lautet dann
b
Hψ(x)
= Eψ(x) .
(4.3)
b n (x) = En ψn (x) .
Hψ
(4.4)
Die Anwendung eines Operators auf eine Funktion liefert in der Regel eine andere Funktion,
siehe Anhang D. Eine Gleichung, bei der links ein Operator auf eine Funktion angewandt
wird und rechts dieselbe Funktion steht, multipliziert mit einer Konstanten, nennen wir eine
Eigenwertgleichung. Die Funktionen, die die Gleichung erfüllen, heissen die Eigenfunktionen des
Operators, die rechts stehenden Konstanten sind die Eigenwerte.
Die Lösung der Schrödingergleichung ist gleichbedeutend damit, die Eigenfunktionen ψn des
Hamiltonoperators und die zugehörigen Eigenwerte En zu bestimmen.
39
Die Festlegung der Randbedingungen, beispielsweise das Verschwinden der Wellenfunktion außerhalb eines Potentialtopfs, ist Teil der Definition des Hamiltonoperators. Ein grundlegendes
Postulat der Quantenmechanik lautet: Die möglichen Energiewerte eines Systems sind genau
die Eigenwerte En des Hamiltonoperators dieses Systems, die zugehörigen Wellenfunktionen sind
genau die Eigenfunktionen ψn .
Nicht nur die Energie, sondern auch alle anderen physikalischen Messgrößen werden durch
Operatoren repräsentiert. Was ist die Motivation dafür? Die gesamte Information, die uns über
ein Teilchen oder ein System von Teilchen zur Verfügung steht, steckt in der Wellenfunktion
ψ. Die Operatoren holen gewissermaßen die physikalischen Messgrößen aus der Wellenfunktion
heraus. Der Impuls- und Ortsoperator werden im nächsten Abschnitt besprochen, die Diskussion
der Operatoren von Bahndrehimpuls und Spin verschieben wir auf Kap. 5.
4.2
4.2.1
Impuls- und Orts-Operator
Impuls-Operator
Ein Teilchen mit wohldefiniertem Impuls hat eine präzise festgelegte Wellenlänge λ = 2π~/p.
Es muss daher durch eine ebene Welle beschrieben werden
Ψ(x, t) = Aei(kx−ωt) .
Die Anwendung des Impuls-Operators muss den Messwert p = ~k ergeben. Daraus folgt für die
x-Komponente des Operators
∂
pbx = −i~
(4.5)
∂x
Die Eigenfunktionen von pbx sind die ebenen Wellen exp(i(kx − ωt)), die Eigenwerte sind ~k.
Sie sind nicht quantisiert, es sei denn, man schreibt gewisse Randbedingungen vor wie z.B. eine
räumliche Periodizität der Wellenfunktion. In dem Fall lassen sich Funktionen auch normieren.
Dreidimensional gilt


∂x
∂
b = −i~∇ = −i~  ∂y  mit ∂x ≡
p
etc
(4.6)
∂x
∂z
b
Hier haben wir den Nabla-Operator ∇ eingeführt. Die Eigenfunktionen und Eigenwerte von p
sind
exp(i(k · r − ωt)) und p = ~k .
4.2.2
Orts-Operator
Wenn schon die Impuls-Eigenfunktionen problematisch sind, so trifft das in noch stärkerem Maße
auf die Eigenfunktionen des Ortsoperators zu. Dieser Operator soll bei Anwendung auf die Wellenfunktion den Ort des Teilchens ergeben. Bei keiner der bisher betrachteten Wellenfunktionen
(Potentialtopf, Oszillator, Wellenpaket) ist dies der Fall, denn sie haben alle eine endliche räumliche Ausdehnung. Überall dort, wo |ψ(x)|2 6= 0 ist, darf sich das Teilchen aufhalten. Man kann
nur eine Wahrscheinlichkeit angeben, das Teilchen an einem bestimmten Ort zu finden, aber
nicht mit Sicherheit diesen Ort vorhersagen. Damit ein scharfer Orts-Eigenwert herauskommt,
muss die Wellenfunktion offensichtlich auf einen infinitesimalen Ortsbereich eingeschränkt sein.
Keine “normale” Funktion erfüllt diese Bedingung, sondern nur die Dirac-Delta-Funktion, die
im mathematischen Sinn eine verallgemeinerte Funktion (Distribution) ist.
40
Um eine Funktion zu konstruieren, die den Ort eines Teilchens sehr genau festlegt, beginnen
wir mit einem gaussförmigen Wellenpaket bei x = x0 , dessen Breite wir dann gegen null gehen
lassen. Als Wahrscheinlichkeitsdichte nehmen wir also
1
(x − x0 )2
√
ρ(x) =
exp −
2σ 2
2π σ
und betrachten anschliessend den Limes σ → 0. Mit abnehmender Breite wächst die Höhe an,
so dass das Integral unter der Kurve immer den Wert 1 hat (s. Kap. 3.4.3). Eine mögliche
Definition der Dirac-Deltafunktion ist
1
(x − x0 )2
(4.7)
δ(x − x0 ) = lim √
exp −
σ→0
2σ 2
2π σ
Für hinreichend kleines σ ist die zu ρ(x) gehörige Wellenfunktion näherungsweise eine Eigenfunktion des Ortsoperators mit dem Eigenwert x0 , nämlich genau dem Ort, an dem ψ(x) 6= 0
ist
x
b ψ(x) ≈ x0 ψ(x0 ) .
(4.8)
4.3
Dirac-Notation und Skalarprodukt
Von Paul Dirac stammt eine sehr nützliche Notation zur Charakterisierung quantenmechanischer
Zustände. Jeder Wellenfunktion ψ wird ein Vektor |ψi zugeordnet, der “ket”-Vektor genannt
wird. Einer konjugiert komplexen Wellenfunktion φ∗ wird ein Vektor hφ| zugeordnet, den man
“bra”-Vektor nennt. Wenn wir an normale Vektoren denken, so ist der ket ein Spalten- und der
bra ein Zeilenvektor. Es wird ein Skalarprodukt definiert durch
Z +∞
hφ | ψi =
φ∗ (x)ψ(x) dx .
(4.9)
−∞
Dies Skalarprodukt hat das Aussehen einer Klammer (“bracket”), der bra-Vektor bildet die linke
Seite, der ket-Vektor die rechte Seite der Klammer. Das Skalarprodukt ist im Allgemeinen eine
komplexe Zahl. Es gilt
Z
+∞
hψ | φi =
−∞
ψ ∗ (x)φ(x) dx = hφ | ψi∗ .
(4.10)
Setzen wir speziell φ = ψ, so erhalten wir die Norm, die natürlich eine reelle Zahl ist und bei
korrekter Normierung der Wellenfunktion den Wert 1 hat.
Z +∞
hψ | ψi =
ψ ∗ (x)ψ(x) dx = 1 .
(4.11)
−∞
Wichtig sind die Skalarprodukte der Eigenfunktionen des Hamiltonoperators:
Z +∞
∗
hψm | ψn i =
ψm
(x)ψn (x) dx = δmn .
(4.12)
−∞
Dabei ist δmn das Kroneckersymbol: δmn = 1 für m = n und δmn = 0 für m 6= n. Die
Eigenfunktionen sind auf eins normiert und paarweise orthogonal.
Wir wollen an dieser Stelle anmerken, dass die Dirac-Notation besonders gut für die HilbertraumFormulierung der Quantenmechanik geeignet ist, die in vielen Standard-Lehrbüchern zu finden
ist, die wir aber aus Gründen der mathematischen Komplexität in diesem Manuskript nicht
diskutieren können.
41
4.4
Das Superpositionsprinzip
Eine beliebige Linearkombination der Eigenfunktionen der Hamiltonoperators
X
X
En
Ψ(x, t) =
cn Ψn (x, t) =
cn ψn (x) exp(−i ωn t) mit ωn =
~
n
n
(4.13)
ist eine Lösung der zeitabhängigen Schrödingergleichung, wie man aus folgender Rechnung sieht,
bei der Gl. (4.4) benutzt wird:
∂Ψ X
∂Ψn X b
b Ψ(x, t)
i~
=
cn i ~
=
cn H Ψn (x, t) = H
∂t
∂t
n
n
Umgekehrt kann man zeigen, dass jede beliebige Lösung der zeitabhängigen Schrödingergleichung sich als Linearkombination (4.13) schreiben lässt. Das Superpositionsprinzip besagt, dass
als Wellenfunktionen eines Teilchen nicht nur die Eigenfunktionen in Frage kommen, sondern
dass auch alle Linearkombinationen der Form (4.13) zulässig sind.
Wie berechnet man die Koeffizienten cn ? Zur Vereinfachung wählen wir den Zeitpunkt t = 0,
dann werden alle Faktoren exp(−i ωn t) = 1 und wir erhalten
X
Ψ(x, 0) ≡ ψ(x) =
cn ψn (x) .
(4.14)
n
Zur Berechnung der Koeffizienten nutzen wir aus, dass die ψn (x) als paarweise orthogonale Einheitsvektoren in einem unendlich-dimensionalen Vektorraum aufgefasst werden können. Bilden
wir das Skalarprodukt von ψ mit einer speziellen Eigenfunktion ψm , so folgt
X
X
hψm | ψi =
cn hψm | ψn i =
cn δmn = cm
n
Also gilt für jeden Wert von m
cm =
n
Z
∗
ψm
(x) ψ(x) dx .
Berechnen wir die Norm von ψ, so ergibt sich
Z a
X
ψ ∗ (x) ψ(x) dx =
|cn |2 = 1
0
(4.15)
(4.16)
n
Daraus wird ersichtlich, dass ein durch die Wellenfunktion ψ(x) beschriebenes Teilchen mit der
Wahrscheinlichkeit |cn |2 im Zustand ψn (x) gefunden wird und dass dementprechend bei einer
Messung der Energie mit der Wahrscheinlichkeit |cn |2 der Wert En herauskommt. Der Mittelwert
der Energie ist
X
hEi =
|cn |2 En .
(4.17)
n
Das Superpositionsprinzip ist die tiefere Ursache für die Verschränkung von Zuständen und
die Nichtlokalität der Quantentheorie, auf die in Kap. 9 eingegangen wird.
4.5
4.5.1
Erwartungswerte
Erwartungswerte als gewichtetes Mittel der Eigenwerte
Das Konzept, Observable durch Operatoren darzustellen, deren Eigenwerte die einzig möglichen
Messwerte der physikalischen Grösse sind, erweist sich als nicht hinreichend, alle denkbaren physikalischen Fragestellungen zu beantworten. Die Zustände mit wohldefinierter Energie werden
42
durch die Eigenfunktionen des Hamilton-Operators beschrieben, die aber in den meisten Fällen
nicht gleichzeitig Impuls- oder Orts-Eigenfunktionen sind. Wir haben oben gesehen, dass die Eigenfunktionen des Impuls- und Ortsoperators etwas pathologische Funktionen sind: die ersteren
sind unendlich ausgedehnte ebene Wellen, die zweiten sind extrem schmale und entsprechend
sehr hohe Funktionen, die im Limes verschwindender Breite gegen die Deltafunktion streben.
Diese Eigenfunktionen unterscheiden sich stark von der Wellenfunktion eines Teilchens im Potentialtopf oder im Oszillatorpotential. Was tut man nun, wenn man theoretisch vorhersagen
möchte, was bei der Messung des Ortes oder Impulses eines Teilchens herauskommt? Es erweist
sich als zweckmäßig, den Begriff des Eigenwertes zu verallgemeinern. Man kommt damit zum
Erwartungswert.
Die Wellenfunktion des Teilchens sei ψ(x). Wir definieren den Erwartungswert eines Operab im Zustand ψ durch das Integral
tors A
Z +∞
b ψ(x) dx .
b
b
ψ ∗ (x)A
(4.18)
hAi ≡ hψ|A|ψi =
−∞
Wir wenden diese Beziehung zunächst auf den Hamilton-Operator an und wählen für ψ eine
Eigenfunktion ψn .
Z +∞
Z +∞
∗
b
b
hψn |H|ψn i =
ψn (x)H ψ(x)n dx =
ψn∗ (x)En ψ(x)n dx = En .
(4.19)
−∞
−∞
Wenn ein Eigenzustand vorliegt, ist der Erwartungswert somit identisch mit dem Eigenwert.
b an
Im zweiten Beispiel setzen wir ψ als Linearkombination von zwei Eigenfunktionen von H
ψ(x) = c1 ψ1 (x) + c2 ψ2 (x)
|c1 |2 + |c1 |2 = 1 .
mit
Diese Wellenfunktion ist auf 1 normiert, und man erhält
b
b 1 i + |c2 |2 hψ2 |H|ψ
b 2i
hψ|H|ψi
= |c1 |2 hψ1 |H|ψ
b 2 i + c∗ c1 hψ2 |H|ψ
b 1i
+ c∗ c2 hψ1 |H|ψ
1
2
= |c1 |2 E1 + |c2 |2 E2 .
(4.20)
Hier haben wir die Gleichung (4.19) und die Orthogonalität von ψ1 und ψ2 ausgenutzt. Die
Gleichung (4.20) besagt, dass bei einer Messung der Energie entweder der Eigenwert E1 gefunden wird (mit der Wahrscheinlichkeit |c1 |2 ) oder der Eigenwert E2 mit der Wahrscheinlichkeit
|c2 |2 . Der Erwartungswert ist das mit den relativen Wahrscheinlichkeiten gewichtete Mittel der
Eigenwerte.
4.5.2
Erwartungswerte des Orts- und Impuls-Operators
Wenden wir (4.18) auf den Ortsoperator an, so ergibt sich
hb
xi =
Z
+∞
∗
ψ (x)b
x ψ(x) dx =
−∞
Z
+∞
−∞
x |ψ(x)|2 dx .
(4.21)
Das Ergebnis ist der mit der Wahrscheinlichkeitsdichte gewichtete Mittelwert des Teilchenortes.
Für den Impulsoperator folgt entsprechend
Z +∞
∂ψ(x)
hb
px i =
ψ ∗ (x)(−i~)
dx .
(4.22)
∂x
−∞
43
Setzt man die Fourierdarstellung für ψ(x) ein, so folgt
Z +∞
Z +∞
∂(exp(ipx x/~))
i~
∗
ψ (x)
φ(px )
hb
px i = − √
dpx dx
∂x
2π~ −∞
−∞
Z +∞ Z +∞
1
∗
ψ (x) exp(ipx x/~) dx px φ(px ) dpx
= √
2π~ −∞
−∞
Z +∞
px |φ(px )|2 dpx .
=
−∞
Diese letzte Umrechnung zeigt, dass man den Mittelwert des Impulses erhält, gewichtet mit der
Wahrscheinlichkeitsdichte im Impulsraum (der Impulsraum wird in Anhang D eingeführt). Aus
dieser Umrechnung lernen wir außerdem, dass der Impulsoperator zwei verschiedene Darstellungen hat:
∂
pbx ∼
= −i~
∂x
pbx ∼
= px
Differentiation im Ortsraum
(4.23)
Multiplikation mit px im Impulsraum
Analog dazu hat auch der Ortsoperator zwei Darstellungen:
x
b ∼
= x
4.6
Multiplikation mit x im Ortsraum
∂
x
b ∼
= i~
∂px
(4.24)
Differentiation im Impulsraum
Nicht vertauschbare Operatoren, Unschärferelation
4.6.1
Definition des Kommutators
Die Multiplikation von Zahlen genügt dem Kommutativgesetz: a · b = b · a. Bei Matrizen ist das
anders, das Ergebnis hängt von der Reihenfolge der Faktoren ab. Ein Beispiel
0 1
0 1
1 0
=
·
−1 0
1 0
0 −1
0 1
1 0
0 −1
·
=
1 0
0 −1
1 0
Die Nichtvertauschbarkeit gilt auch für viele Operatoren der Quantentheorie. Besonders wichtig
ist die Nichtvertauschbarkeit des Orts- und Impuls-Operators.
∂ψ
∂x
∂(x · ψ(x))
∂ψ
pbx (b
xψ(x)) = −i~
= −i~ x ·
− i~ ψ(x)
∂x
∂x
x
b (b
px ψ(x)) = −i~ x ·
Es folgt
(b
x pbx − pbx x
b)ψ(x) = i~ ψ(x)
(4.25)
[b
x, pbx ] = x
b pbx − pbx x
b = i~
(4.26)
Man definiert den Kommutator der beiden Operatoren durch
Der Kommutator ist selbst ein Operator, in diesem Fall der Einheitsoperator, multipliziert mit
i~. Die beiden nicht vertauschbaren Operatoren haben sehr verschiedene Eigenfunktionen: die
infinitesimal schmalen Deltafunktionen und die unendlich ausgedehnten ebenen Wellen.
44
4.6.2
Vertauschbare Operatoren und gleichzeitige Messbarkeit
Wie wir gerade gesehen haben, sind der Orts- und Impulsoperator sind nicht vertauschbar.
Ort und Impuls können nicht gleichzeitig präzise Werte annehmen, man nennt sie inkompatible
Observable.
Wie steht es nun mit Messgrößen, deren Operatoren vertauschbar sind? Ein grundlegendes
Theorem der Quantenmechanik lautet:
Zwei Observable sind genau dann kompatibel (d.h. sie können gleichzeitig präzise Werte annehmen), wenn die zugehörigen Operatoren vertauschbar sind. Das wiederum ist gleichbedeutend
damit, dass die beiden Operatoren einen vollständigen Satz gemeinsamer Eigenfunktionen besitzen. Auf den Beweis gehen wir in Anhang D ein.
4.6.3
Die Unschärferelation
Die Unschärfe einer Observablen (Messgröße) A im Quantenzustand |ψi soll jetzt präzise defib und seines
niert werden. Dazu berechnen wir die Erwartungswerte des zugehörigen Operators A
2
b =A
b·A
b (zweimalige Anwendung des Operators):
Quadrates A
b ≡ hψ|A|ψi
b
hAi
=
b2 i ≡ hψ|A
b2 |ψi =
hA
Z
+∞
−∞
Z
b
ψ ∗ (x)Aψ(x)
dx
+∞
−∞
b2 ψ(x) dx
ψ ∗ (x)A
Die Unschärfe ist dann wie folgt definiert
r q
2
b − hAi
b
b2 i − hAi
b2.
∆A = h A
i = hA
(4.27)
b und B.
b Man kann
Gegeben seien nun zwei nicht vertauschbare selbstadjungierte Operatoren A
dann generell beweisen, dass das Produkt der Unschärfen dieser Operatoren die folgende Ungleichung erfüllt
1
b B
b ]i| .
∆A · ∆B ≥ |h[ A,
(4.28)
2
Dies ist die Unschärferelation von Werner Heisenberg in ihrer allgemeinsten Form. Hat speziell
der Kommutator die Form
b B
b] = i~,
[ A,
so folgt
∆A · ∆B ≥
~
.
2
Die Anwendung auf die Orts-und Impulsoperatoren ergibt
∆x · ∆px ≥
~
,
2
∆y · ∆py ≥
~
,
2
∆z · ∆pz ≥
~
.
2
(4.29)
Wir werden später sehen, dass die Komponenten des Drehimpuls-Operators nicht kommutieren
und die Unschärferelation (4.28) erfüllen. Zu beachten ist, dass verschiedene Komponenten des
Orts- und Impulsoperators, beispielsweise x
b und pby , vertauschbar sind, so dass im Prinzip die
x-Koordinate eines Teilchens und die y-Komponente seines Impulses gleichzeitig präzise messbar
sind.
45
4.6.4
Energie-Zeit-Unschärfe
Es gibt noch eine weitere Unschärfebeziehung, die aber in den Standard-Werken der Quantenmechanik nicht mit Hilfe eines Kommutators hergeleitet wird1 . Dies ist die Energie-Zeit-Unschärfe:
∆E · ∆t ≥ ~ .
(4.30)
Man kann sich diese Beziehung mit Hilfe der Fouriertransformation zwischen Frequenz und Zeit
plausibel machen. Wir betrachten als Beispiel einen elektrischen Spannungsimpuls U (t), der
eine kurze zeitliche Dauer ∆t hat. Die Fouriertransformierte ist
Z +∞
1
Ũ (ω) = √
U (t) exp(−iωt) dt .
2π −∞
Die Frequenzbandbreite ∆ω ist umgekehrt proportional zur Zeitdauer ∆t. Wählen wir für U (t)
eine Gaussfunktion der Varianz σt2 , so ist Ũ (ω) ebenfalls eine Gaussfunktion (siehe Anhang A.4),
und für die Varianz gilt
σω2 = 1/σt2 .
Benutzen wir E = ~ω, so folgt für dieses Beispiel
∆E ∆t = ~ .
Anwendung auf stationäre Zustände
In einem stationären Zustand hat die Energie einen wohldefinierten Wert, und die Wellenfunktion
ist Eigenfunktion des Hamiltonoperators.
E
b = Eψ.
Ψ(x, t) = ψ(x) exp −i t , Hψ
~
Die Enegieunschärfe ist null. Das Teilchen wird, sofern keine Störung eintritt, für immer in
diesem Zustand bleiben. Die “Lebensdauer” ist also unendlich gross. Die stationären Zustände
sind demnach gekennzeichnet durch
∆E → 0
und
∆t → ∞
und sind mit der Energie-Zeit-Unschärferelation in Einklang.
Lebensdauer und Energiebreite von instabilen Zuständen
Interessant wird die Energie-Zeit-Unschärferelation für Zustände, die sich zeitlich ändern. Besondere Bedeutung haben die radioaktiven Zerfälle instabiler Atomkerne und Elementarteilchen
sowie die Zerfälle angeregter Atomniveaus. Die Behandlung dieser Vorgänge geht im Prinzip
über den Rahmen der nichtrelativistischen Quantenmechanik hinaus und erfordert eine Quantentheorie des Strahlungsfeldes. Der radioaktive Zerfall ist dadurch gekennzeichnet, dass die
Anzahl der noch nicht zerfallenen Kerne exponentiell abnimmt
N (t) = N0 exp(−t/τ ) .
1
(4.31)
In neueren Arbeiten wird die Energie-Zeit-Unschärferelation hergeleitet, siehe z.B. R. Brunetti und K. Fredenhagen, Remarks on time-energy uncertainty relations, Rev. Math. Phys. 14, 897 (2002).
46
Die mittlere Lebensdauer τ ist die Zeit, in der die Zahl von N0 auf N0 /e = 0.37 N0 abgesunken ist. Ein zeitlich zerfallendes System hat automatisch eine Energieunschärfe, die man bei
Elementarteilchen mit Γ bezeichnet. Es gilt die wichtige Gleichung
Γ·τ =~.
(4.32)
Angeregte atomare Niveaus weisen ebenfalls diese Unschärfe auf, während der Grundzustand
stabil und energetisch scharf ist. Eine Konsequenz der Gleichung (4.32) ist, dass die Spektrallinien der Atome alle eine endliche Breite haben.
4.7
Korrespondenzprinzip und Ehrenfest-Theorem
Die relativistische Mechanik geht im Grenzfall kleiner Geschwindigkeiten in die klassische Newtonsche Mechanik über. Bei der Entwicklung der Quantentheorie vom Bohrschen Atommodell
bis hin zur Schrödingergleichung war den Theoretikern bewusst, dass die neue Theorie in analoger Weise in die klassische Physik übergehen sollte, wenn man sie auf makroskopische Körper
anwendet. Das Korrespondenzprinzip und das Ehrenfest-Theorem waren wichtige Leitlinien bei
der Entwicklung der Quantentheorie. Der Inhalt des Korrespondenzprinzips ist, dass die Quantenmechanik im Limes großer Quantenzahlen in die klassische Physik übergeht. Dies Prinzip hat
bei der Entwicklung eines quantentheoretischen Atommodells eine wichtige Rolle gespielt. Wir
kommen in Kap. 6 darauf zurück. Das Ehrenfest-Theorem besagt, dass die Erwartungswerte
den klassischen Bewegungsgleichungen genügen.
Als Beispiel für das Ehrenfest-Theorem betrachten wir ein bewegtes Teilchen, beschrieben
durch ein Wellenpaket. Die Wahrscheinlichkeitsdichte wird zeitabhängig und auch die Erwartungswerte haben eine Zeitabhängigkeit. Der Erwartungswert des Ortes ist
hb
xi =
Z
+∞
∗
Ψ (x, t)b
x Ψ(x, t) dx =
−∞
Z
+∞
x ρ(x, t) dx .
(4.33)
−∞
Wir bilden jetzt die zeitliche Ableitung
dhb
xi
=
dt
Z
+∞
x
−∞
∂ρ
dx
∂t
und setzen die Kontinuitätsgleichung (B.5) ein:
dhb
xi
i~
=
dt
2m
Z
+∞
−∞
∂
x
∂x
∂Ψ∗
∂Ψ
Ψ − Ψ∗
∂x
∂x
dx .
Partielle Integration ergibt
dhb
xi
i~
=
dt
2m
Z
+∞ −∞
∂Ψ∗
∂Ψ
Ψ − Ψ∗
∂x
∂x
dx .
Hierbei haben wir ausgenutzt, dass die Wellenfunktion an den Integrationsgrenzen ±∞ verschwindet. Wenn man den ersten Term noch einmal partiell integriert und die ganze Gleichung
mit der Masse m multipliziert, folgt die wichtige Beziehung
dhb
xi
=
m
dt
Z
+∞
−∞
∂Ψ
Ψ (−i~)
dx =
∂x
∗
47
Z
+∞
−∞
Ψ∗ pbx Ψ dx ≡ hb
px i .
(4.34)
Für die Erwartungswerte gilt daher die klassische Beziehung mvx = px . Die Zeitabhängigkeit
des Erwartungswertes des Impulses wird analog berechnet mit dem Ergebnis
dhb
px i
∂V
=−
≡ Fx ,
dt
∂x
(4.35)
d.h. die zeitliche Änderung des Impulses ist gleich der wirkenden Kraft, genau wie in der
klassischen Mechanik.
4.8
Berechnung von Erwartungswerten
4.8.1
Potentialtopf
Der Grundzustand eines Teilchens im Potentialtopf mit unendlich hohen Wänden hat die Wellenfunktion
r
π x
2
Ψ1 (x, t) =
sin
exp(−iωt) .
a
a
Dies ist eine Eigenfunktion des Hamilton-Operators, die Energie hat den scharfen Wert
E1 =
~2 π 2
2m a2
Die Lebensdauer τ ist unendlich. Der Erwartungswert der Energie stimmt mit dem Eigenwert
überein, die Energieunschärfe ist ∆E1 = 0.
Wie steht es mit anderen Messgrössen? Die Funktion Ψ(x, t) ist sicherlich keine Eigenfunktion des Orts- oder Impuls-Operators. Der Erwartungswert des Ortsoperators ist
Z
2 a
hb
xi =
x sin2 (π x/a) dx = a/2 .
a 0
Der Mittelwert des Teilchenortes ist also x = a/2, genau die Mitte des Potentialtopfs. Der
Erwartungswert von x
b2 ist
Z
2 a 2
2
hb
x i=
x sin2 (π x/a) dx = 0.283 a2 .
a 0
Es folgt
∆x =
p
hb
x2 i − hb
xi2 = 0.18 a
Der Erwartungswert der x-Komponente des Impulses ist null
Z
2 a
∂ sin(π x/a)
hb
px i = −i~
sin(π x/a)
dx = 0 ,
a 0
∂x
denn die Funktion sin(kx) = (exp(ikx) − exp(−ikx))/(2i) ist die Linearkombination von zwei
Eigenfunktionen des Impulsoperators. Die Eigenwerte sind ±~k, der Mittelwert ist also null.
Der Erwartungswert von pb2x ist
Z
2 Z a
2 a
∂ 2 sin(π x/a)
~2 π 2
2 2π
2
hb
p2x i = −~2
sin(π x/a)
dx
=
~
sin
(π
x/a)
dx
=
.
a 0
∂x2
a3 0
a2
p
Wir erhalten ∆px = hb
p2x i = ~π/a und
∆px ∆x = 0.57~ > ~/2 .
48
4.8.2
Der harmonische Oszillator
2
Auch in diesem Fall soll der
p Grundzustand ψ0 näher analysiert werden. Die Funktion exp(−u /2)
ist symmetrisch zu u = mω/~ · x = 0. Daher ist anschaulich klar, dass der Erwartungswert
von x
b null sein muss. Mathematisch folgt das aus der Beobachtung, dass x |ψ(x)|2 eine ungerade
Funktion von x ist:
Z +∞
hxi =
x |ψ0 (x)|2 dx = 0 .
Den Erwartungswert von
hx2 i
x
b2
−∞
findet man durch partielle Integration
Z +∞
x2 |ψ0 (x)|2 dx
=
−∞
mω 1/2 ~ 3/2 Z +∞
=
u2 exp(−u2 ) du
π~
mω
−∞
Z +∞
d
~
u·
= − √
exp(−u2 ) du .
du
2 πmω −∞
Wegen
Z
+∞
exp(−u2 ) du =
√
π
−∞
folgt
~
.
(4.36)
2mω
Der Erwartungswert des Impulsoperators pbx ist null, weil - anschaulich gesprochen - das Teilchen
gleich häufig nach rechts wie nach links schwingt. Mathematisch:
Z +∞
d
hb
px i =
ψ0∗ (x)(−i~) ψ0 (x) dx = 0 .
dx
−∞
hx2 i =
Wieder ist der Integrand eine ungerade Funktion von x. Der Erwartungswert von pb2x wird
Z +∞
d2
2
hb
px i = −
ψ0∗ (x)~2 2 ψ0 (x) dx .
dx
−∞
Auswertung des Integrals ergibt
m~ω
.
2
Das Produkt der Unschärfen von Ort und Impuls wird
hb
p2x i =
∆x · ∆px =
√
x
b2 ·
(4.37)
p
~
hb
p2x i = .
2
(4.38)
Im Grundzustand des harmonischen Oszillators hat das Produkt den minimal möglichen, mit
der Unschärferelation verträglichen Wert. Für die angeregten Zustände ψn mit n > 0 ergeben
sich grössere Unschärfen.
Physikalisch interessant sind die Erwartungswerte der kinetischen und potentiellen Energie:
hEkin i =
hb
p2x i
~ω
=
,
2m
4
hEpot i = hV (x)i =
Chb
x2 i
~ω
=
.
2
4
(4.39)
Wie beim klassischen Oszillator haben die kinetische und die potentielle Energie im zeitlichen
Mittel den gleichen Wert. Diese Relation ist auch für die angeregten Zustände erfüllt. Wie man
sieht, ist das Ehrenfest-Theorem auch beim harmonischen Oszillator erfüllt.
49
4.9
Der Messprozess in der Quantenmechanik
Die Frage, was bei einer Messung mit der Wellenfunktion eines Teilchens passiert, hat die theoretischen Physiker über Jahrzehnte beschäftigt und zu vielen Kontroversen geführt. Besonders
umstritten war, ob die Messapparatur als klassisches Nachweisgerät angesehen werden darf oder
ob sie auch quantenmechanisch, also mit Hilfe einer Wellenfunktion behandelt werden sollte.
Die meisten Physiker haben in der Vergangenheit dazu geneigt, die Messapparatur als klassisches Nachweisgerät anzusehen (vermutlich weil keine adäquate quantentheoretische Behandlung bekannt ist), aber heute besteht kein Zeifel daran, dass auch Messgeräte den Gesetzen
der Quantenmechanik unterliegen. Für eine weiterführende Diskussion dieser sehr komplexen
Fragestellung verweisen wir auf Kap. 9.
An dieser Stelle wollen wir uns auf die traditionelle Betrachtungsweise beschränken. Ein
gutes Beispiel ist das Doppelspaltexperiment: die Wellenfunktion (genauer ihr Absolutquadrat)
bestimmt das Interferenzmuster, aber ein einzelnes Quant (Elektron oder Photon) macht nur
einen punktförmigen Eintrag in diesem Muster. Nachdem wir das Quant in einem definierten
Element unseres Pixeldetektors nachgewiesen haben, hat sich seine Wellenfunktion geändert,
denn wir wissen jetzt, dass es sich an einer wohldefinierten Stelle des Interferenzmusters befand.
Ein anderes Beispiel: ein Teilchen werde durch die Superposition von drei Eigenfunktionen
des Hamilton-Operators beschrieben:
ψ(x, t) = c1 ψ1 (x, t) + c2 ψ2 (x, t) + c3 ψ3 (x, t)
Die Messung der Energie wird entweder E1 , E2 oder E3 ergeben. Nun machen wir eine Messung
und stellen fest, dass E = E2 ist. Dann wissen wir, dass die Wellenfunktion nach der Messung
ψ2 sein muss. Diese Änderung der Wellenfunktion als Konsequenz der Messung wird manchmal
etwas hochtrabend “Kollaps” der Wellenfunktion genannt. So geheimnisvoll ist das Ganze aber
nicht: nach der Messung wissen wir einfach besser Bescheid über das Teilchen.
4.10
Anwendungsbeispiele und didaktische Anmerkungen
4.10.1
Polarisiertes Licht im Quantenbild
Die statistische Natur der Quantentheorie tritt auch in der Optik zutage, sobald man sich in das
Photonenbild begibt. Licht kann linear polarisiert werden, das bedeutet, der elektrische Vektor
schwingt in einer Ebene. Eine horizontal bzw. vertikal polarisierte Welle schreiben wir in der
Form
E hor (z, t) = E0 cos(kz − ωt)ex , E vert (z, t) = E0 cos(kz − ωt)ey
(4.40)
Dabei ist k = ω/c = 2π/λ und ex bzw. ey sind die Einheitsvektoren in x- bzw. y-Richtung.
Die Ausbreitung des Lichts erfolgt in z-Richtung. Wenn wir horizontal polarisiertes Licht durch
eine Polarisationsfolie senden, deren optische Achse um einen Winkel α gegen die horizontale
Ebene gedreht ist, so ist die Intensität hinter dem Polarisator
I(α) = I0 cos2 α
Die Schwingungsebene des Lichts hat sich ebenfalls um diesen Winkel gedreht. Wie interpretieren wir diesen Vorgang im Lichtquantenbild? Die Wahrscheinlichkeitsinterpretation der Quantenmechanik ist auch hier anwendbar. Die Wahrscheinlichkeit, dass ein einlaufendes horizontal
polarisiertes Photon die Polarisationfolie passiert, ist w = cos2 α. Wählen wir beispielsweise
einen Winkel von 30◦ , so hat jedes Photon eine Chance von 75%, den Polarisator zu durchqueren, und eine Chance von 25%, an der Polarisationsfolie reflektiert zu werden (sofern man
50
Absorption vernachlässigen darf). Mehr als diese Wahrscheinlichkeitsaussagen können wir nicht
machen; für ein individuelles Photon ist es unmöglich vorherzusagen, ob es die Polarisationsfolie
durchqueren wird oder nicht.
Wenn man die beiden orthogonal polarisierten Wellen (4.40) mit einer Phasenverschiebung
von ±π/2 vektoriell addiert (dies geht mit einer λ/4-Platte), so erhält man zirkular polarisiertes
Licht, bei dem der E-Vektor auf einer Schraubenlinie (Rechts- oder Linksschraube) umläuft. Die
Superposition von zwei orthogonalen, linear polarisierten Lichtwellen mit ±π/2-Phasendifferenz
führt somit zu rechts- oder linkszirkular polarisierten Wellen, die durch folgende Ausdrücke
gegeben sind
√
E rechts (z, t) = E0 / 2 [cos(kz − ωt)ex − sin(kz − ωt)ey ]
(4.41)
√
E links (z, t) = E0 / 2 [cos(kz − ωt)ex + sin(kz − ωt)ey ]
In der Sprache der Teilchenphysik werden die zugehörigen Photonen rechtshändig oder linkshändig
genannt. Ihre Spinkomponente in Richtung des Impulses ist +~ bzw. −~.
Wir haben eine typische Anwendung des Superpositionsprinzips. Umgekehrt ergibt die Superposition einer rechts- und einer linkszirkularen Welle je nach Phasendifferenz eine horizonatel
oder vertikal linear polarisierte Welle. Auch diese Vorgänge kann man sich im Quantenbild ansehen. Wenn ein linear polarisiertes Photon auf eine λ/4-Platte trifft, deren optische Achse um
45◦ gegen die Schwingungsebene des einlaufenden Photons gedreht ist, so wandelt sich dieses
Photon in ein zirkular polarisiertes Photon um. Schickt man dies zirkulare Photon nun durch
eine Polarisationsfolie, so wird daraus wieder ein linear polarisiertes Photon, dessen E-Vektor
parallel zur optischen Achse der Folie schwingt.
4.10.2
Das Superpositionsprinzip bei einer Gitarrensaite
Abbildung 4.1: Links: dreieckförmiges Zupfen einer Gitarrensaite (rote Kurve). Die harmonische
Grundschwingung (blaue Punkte) ist deutlich davon verschieden. Rechts: Approximation durch eine
Fourierreihe bis zur Ordnung 7. Die rote Kurve wäre auch eine erlaubte Wellenfunktion eines Teilchens
im Potentialtopf.
Wir haben schon mehrfach die Analogien zwischen einem quantenmechanischen Potentialtopf
und einer schwingenden Saite angesprochen. Das in der Quantenmechanik wichtige Superpositionsprinzip spielt auch bei Musikinstrumenten eine große Rolle. Wenn man eine Gitarrensaite
zupft, so wird die Verformung der Saite nicht sinusförmig sein. Beispielsweise können wir uns
vorstellen, dass die Saite dreieckförmig gezupft wird, wie in Abb. 4.1 skizziert. Man kann diese
Dreieckskurve periodisch fortsetzen und durch eine Fourierreihe darstellen (s. Anhang A.4)
1
1
1
1 4
f (x) = − 2 cos(πx) + 2 cos(3πx) + 2 cos(5πx) + 2 cos(7πx)..... mit k = 2π/λ (4.42)
2 π
3
5
7
Es tritt also nicht nur die Grundfrequenz f1 auf, sondern auch die höheren Harmonischen
f3 = 3f1 , f5 = 5f1 usw. Hinzu kommen die Eigenschwingungen des Gitarrenkastens, die den
51
charakteristischen Klang des Instruments ausmachen. In die mathematische Formulierung der
Quantenmechanik übersetzt wird durch Gl. (4.42) eine Superpositionswellenfunktion beschrieben.
52
Kapitel 5
Die Drehimpuls-Operatoren
Die dreidimensionale Schrödinger-Gleichung spielt eine große Rolle in der Atomphysik. Wir
beschränken uns in dieser Vorlesung auf den Spezialfall,
p dass ein Zentralpotential vorliegt: V =
V (r) hängt nur vom Betrag des Ortsvektors |r| = r = x2 + y 2 + z 2 und nicht von der Richtung
im Raum ab. Der Hamilton-Operator
2
2
2
2
~
∂
∂
∂
b =−
H
·
+
+
+ V (r)
(5.1)
2m
∂x2 ∂y 2 ∂z 2
ist dann rotationsinvariant. Dies wird in Anhang E bewiesen.
5.1
Der Operator des Bahndrehimpulses
In der klassischen Physik definiert man den Bahndrehimpuls als Vektorprodukt des Orts- und
Impulsvektors
L=r×p.
(5.2)
Übertragen auf die Quantentheorie erhalten wir
b = rb × pb = −i~ rb × ∇ .
L
Die drei Komponenten sind
∂
∂
y
−z
∂z
∂y
∂
∂
= −i~ z
−x
∂x
∂z
∂
∂
= −i~ x
−y
.
∂y
∂x
b x = −i~
L
by
L
bz
L
(5.3)
(5.4)
Wir betrachten eine infinitesimale Drehung um die z-Achse um den Winkel ∆ϕ 1 (sin ∆ϕ ≈
∆ϕ, cos ∆ϕ ≈ 1). Die Koordinaten werden wie folgt transformiert:
x0 = x cos ∆ϕ + y sin ∆ϕ ≈ x + y∆ϕ
y 0 = −x sin ∆ϕ + y cos ∆ϕ ≈ y − x∆ϕ
z0 = z
Um die Änderung der Wellenfunktion zu berechnen, verwenden wir die Taylor-Entwicklung:
∂ψ
∂ψ
0 0 0
ψ(x , y , z ) ≈ ψ(x + y ∆ϕ, y − x ∆ϕ, z) ≈ ψ(x, y, z) − x
−y
· ∆ϕ
∂y
∂x
53
Man kann die Transformation der Wellenfunktion mit Hilfe des Drehimpuls-Operators auch in
folgender Form schreiben
ψ(x0 , y 0 , z 0 ) = ψ(x, y, z) −
i ∆ϕ b
Lz ψ(x, y, z) .
~
(5.5)
b z der erzeugende Operator für eine infinitesimale Rotation um die z-Achse ist.
Man sagt, dass L
b x und L
b y infinitesimale Rotationen um die x- bzw. y-Achse.
Analog erzeugen L
5.2
5.2.1
Drehimpuls-Vertauschungsregeln
b
Vertauschbarkeit mit H
Bei einem Zentralpotential ist der Hamilton-Operator rotationsinvariant, man sollte daher verb kommutiert. Dies ist in der Tat der Fall, es gilt
b mit L
muten, dass H
b L
b x ] = [ H,
b L
b y ] = [ H,
b L
bz ] = 0 .
[ H,
(5.6)
b L
b z ] = 0 wird in Anhang E gebracht. Da H
b und
Der Beweis der Vertauschungsrelation [ H,
b z kommutieren, kann man gemeinsame Eigenfunktionen finden. Aus Symmetriegründen verL
b x und L
b y mit H.
b Man könnte auf die Idee kommen, dass es gemeinsame
tauschen auch L
b und alle Komponenten des Drehimpuls-Operators gibt. Dies ist jedoch
Eigenfunktionen für H
nicht der Fall, da diese Komponenten nicht miteinander kommutieren.
5.2.2
Nichtvertauschbarkeit der Drehimpulskomponenten
Räumliche Drehungen um orthogonale Achsen sind nicht kommutativ. Dies wird in Abb. 5.1 demonstriert. Daher ist nicht verwunderlich, dass auch die Komponenten des Drehimpulsoperators
Abbildung 5.1: Nichtvertauschbarkeit räumlicher Drehungen. Links ist ein Buntstift entlang der xAchse orientiert. Das mittlere Bild zeigt die Lage des Buntstifts, wenn erst eine 90◦ -Drehung um die
x-Achse und danach eine 90◦ -Drehung um die y-Achse ausgeführt wird. Das rechte Bild zeigt die Lage
bei umgekehrter Reihenfolge der Drehungen.
nicht kommutieren. Es gelten die Vertauschungsregeln
bx , L
b y ] = i~L
bz ,
[L
by , L
b z ] = i~L
bx ,
[L
54
bz , L
b x ] = i~L
by .
[L
(5.7)
Wir beweisen die erste Regel:
bx , L
b y ]ψ(x, y, z)
[L
∂
∂
∂
∂
∂
∂
∂
∂
2
= −~
y
z
− z
y
ψ(x, y, z)
−z
−x
−x
−z
∂z
∂y
∂x
∂z
∂x
∂z
∂z
∂y
∂ψ
∂ψ
bz ψ .
= i~(−i~) y
= i~L
−x
∂x
∂y
b2 =
Es sind aber alle Komponenten mit dem Quadrat des vektoriellen Drehimpuls-Operators L
b 2x + L
b 2y + L
b 2z vertauschbar, wie man aus folgender Rechnung erkennt:
L
bx L
by L
by = L
by L
bx L
b y + i~L
bz L
by = L
by L
by L
b x + i~(L
bz L
by + L
by L
bz )
L
(5.8)
bx L
bz L
bz = L
bz L
bx L
b z − i~L
by L
bz = L
bz L
bz L
b x − i~(L
by L
bz + L
bz L
by ) .
L
b 2 und einer Komponente gibt.
Die Konsequenz ist, dass es gemeinsame Eigenfunktionen von L
Traditionell wählt man dafür die z-Komponente. Diese Funktionen sind dann keine Eigenfunkb x und L
by .
tionen von L
5.3
5.3.1
Der Drehimpuls in Kugelkoordinaten, Kugelfunktionen
Kugelkoordinaten
Die Kugelkoordinaten (r, θ, ϕ) sind mit den kartesischen Koordinaten (x, y, z) durch folgende
Beziehungen verknüpft (siehe auch Anhang A):
x = r sin θ cos ϕ
y = r sin θ sin ϕ
(5.9)
z = r cos θ .
Die Umrechnung des Drehimpulses auf Kugelkoordinaten ist aufwändig, siehe Anhang E. Der
b z hat eine besonders einfache Form, was damit zusammenhängt, dass bei den KuOperator L
gelkoordinaten die z-Achse eine Sonderrolle einnimmt: Der Polarwinkel θ wird zwischen dem
Ortsvektor r und der z-Achse gemessen, und bei einer Rotation um die z-Achse ändert sich nur
der Azimutalwinkel ϕ.
b z = −i~ ∂
(5.10)
L
∂ϕ
Der Operator des Quadrats des Drehimpulsoperators lautet in Kugelkoordinaten
b 2 = −~2
L
1 ∂
sin θ ∂θ
sin θ
∂
∂θ
+
1 ∂2
sin2 θ ∂ϕ2
(5.11)
Bemerkenswert ist die Tatsache, dass bei den Drehimpuls-Operatoren nur die Winkel-Ableitungen
vorkommen und nicht die radiale Ableitung. Es gibt dafür einen einfachen Grund: Die DrehimpulsOperatoren erzeugen räumliche Drehungen, aber keine Radiusänderungen.
55
5.3.2
Die Bahndrehimpuls-Eigenfunktionen
b 2 und L
b z sind die Kugelfunktionen Yl,m (θ, ϕ). Die
Die gemeinsamen Eigenfunktionen von L
Eigenwertgleichungen lauten
b 2 Yl,m (θ, ϕ) = l(l + 1)~2 Yl,m (θ, ϕ) , L
b z Yl,m (θ, ϕ) = m ~Yl,m (θ, ϕ)
L
(5.12)
Die Bahndrehimpulsquantenzahl l kann die ganzzahligen Werte l = 0, 1, 2, 3, .. annehmen, die
magnetische Quantenzahl m ist ebenfalls ganzzahlig, und es gilt −l ≤ m ≤ +l. Für l = 0, 1, 2
haben Kugelfunktionen die Gestalt
Y0, 0 =
Y1, ±1
Y2, ±2
Y2, 0
1
√
4π
r
r
3
3
= ∓
sin θ exp(±iϕ) , Y1, 0 =
cos θ
8π
4π
r
r
15
15
2
=
sin θ exp(±2iϕ) , Y2, ±1 = ∓
sin θ cos θ exp(±iϕ)
32π
8π
r
5
(3 cos2 θ − 1)
=
16π
Die Kugelfunktionen sind auf 1 normiert:
Z 2π Z π
∗
Yl,m (θ, ϕ)Yl,m (θ, ϕ) sin θdθ dϕ = 1 .
0
(5.13)
(5.14)
0
Die Quantenzahl m der z-Komponente des Drehimpulses wird magnetische Quantenzahl genannt, weil in vielen atomphysikalischen Experimenten die z-Achse durch die Richtung eines
externen Magnetfeldes definiert wird.
5.4
Algebraische Behandlung des Drehimpulses
In diesem Abschnitt sollen die wichtigsten Eigenschaften von Drehimpulsen in der Quantenmechanik allein aus den Vertauschungsregeln (5.7) hergeleitet werden. Wir werden dabei entdecken,
dass es neben dem Bahndrehimpuls noch eine andere Kategorie von Drehimpuls gibt, den Eigendrehimpuls oder Spin. Diverse Rechenschritte werden an dieser Stelle übergangen, sie sind in
Anhang E zu finden. Die algebraische Methode wird in der Kern- und Elementarteilchenphysik
verallgemeinert, um den Isospin und das Quark-Modell zu beschreiben.
bx , L
by , L
b z , die den Vertauschungsregeln
Betrachtet werden drei Operatoren L
bx , L
b y ] = i~L
bz ,
[L
by , L
b z ] = i~L
bx ,
[L
bz , L
b x ] = i~L
by
[L
(5.15)
gehorchen, von denen wir aber nicht voraussetzen, dass sie die spezielle Form (5.4) haben. Dann
b 2 kommutieren.
kann man leicht nachweisen (s. Gl. (5.8)), dass alle drei Komponenten mit L
b 2 und L
b z zu finden. Diese
Es ist daher möglich, gemeinsame Eigenzustände der Operatoren L
Eigenzustände bezeichnen wir mit Dirac-Ket-Vektoren | l, mi, wobei l und m die Quantenzahlen
angeben:
b 2 | l, mi = l(l + 1)~2 | l, mi , L
b z | l, mi = m~| l, mi .
L
(5.16)
Diese Eigenzustände sind Eigenfunktionen (die Kugelfunktionen) im Fall des Bahndrehimpulses
und Eigenvektoren im Fall des Spins (s. unten). Im Augenblick wird über die Quantenzahlen
56
l, m keine Voraussetzung gemacht, es können beliebige reelle Zahlen sein, wobei allerdings l ≥ 0
b 2 nicht negativ sein können.
sein muss, da die Eigenwerte von L
b + und der AbsteigeEs werden nun zwei Leiter-Operatoren definiert: der Aufsteige-Operator L
b
Operator L−
b+ = L
b x + iL
by ,
b− = L
b x − iL
by .
L
L
(5.17)
b + genügt den Vertauschungsregeln
Der Operator L
b z = i~L
b+ ,
b+ − L
b+ L
bz L
L
b2 − L
b 2L
b+ L
b+ = 0
L
Wenden wir die erste Regel auf eine Eigenfunktion | l, mi an, so ergibt sich folgender Ausdruck:
b + | l, mi = L
b + (L
b z | l, mi + ~| l, mi) = (m + 1)~ L
b + | l, mi
bz L
L
b + | l, mi ist eine Eigenfunktion von L
b z mit dem Eigenwert (m + 1)~, falls
Das bedeutet: L
b
L+ | l, mi =
6 0 ist:
b + | l, mi = C+ (l, m)| l, m + 1i .
L
(5.18)
b + erhöht also die z-Komponente um ∆m = 1. Diese Beobachtung rechtfertigt
Der Operator L
den Namen Aufsteigeoperator. Allerdings kann das Aufsteigen nicht unbegrenzt weitergehen,
denn es gilt m2 ≤ l(l + 1), siehe Anhang E. Daher gibt es ein maximales m = mmax . Wendet
b + auf den Zustand | l, mmax i an, so kommt null heraus.
man L
Für den Absteigeoperator zeigt man entsprechend, dass
b − | l, mi = C− (l, m)| l, m − 1i
L
(5.19)
b − | l, mi 6= 0 ist. Die Koeffizienten C+ (l, m), C− (l, m) werden in Anhang E berechgilt, sofern L
net. Die Wirkung der Leiteroperatoren ist in Abb. 5.2 dargestellt.
√
b + | 1, −1i = ~ 2| 1, 0i,
Abbildung 5.2:
Wirkung der Leiteroperatoren. Für den Aufsteigeoperator gilt L
√
√
b + | 1, 0i = ~ 2| 1, +1i und L
b + | 1, +1i = 0. Für den Absteigeoperator finden wir L
b − | 1, +1i = ~ 2| 1, 0i,
L
√
b
b
L− | 1, 0i = ~ 2| 1, −1i und L− | 1, −1i = 0.
Die maximalen und minimalen Werte von m sind mmax = +l und mmin = −l (Anhang E). Die
Quantenzahl m nimmt folgende Werte an:
m = −l, −l + 1, . . . + l .
57
(5.20)
Abbildung 5.3: Links und Mitte: Richtungsquantelung des Drehimpulses. Gezeigt werden die Drehimpulsmultipletts für l = 1 und l = 2. Rechts: Die Lage des Vektors L auf einem Kegelmantel um die
z-Achse für l = 1, ml = 1.
Dies sind 2l + 1 Werte, d.h. 2l + 1 ist eine positive ganze Zahl. Es gibt zwei Möglichkeiten:
a) l ist ganzzahlig, l = 0, 1, 2, . . ..
b) l ist halbzahlig, l = 1/2, 3/2, 5/2, . . ..
Die ganzzahligen l-Werte gehören zum Bahndrehimpuls (oder auch zum Spin, z.B. bei Photonen), die halbzahligen zum Spin oder Gesamtdrehimpuls.
Die Richtungsquantelung des Bahndrehimpulses wird in Abb. 5.3 gezeigt. Die x- und yKomponenten des Drehimpulsvektors sind unbestimmt. Wir können nur sagen, dass der Vektor
L irgendwo auf einem Kegelmantel um die z-Achse liegen muss. Das wird für l = 1, m = 1 in
Abb. 5.3 gezeigt.
5.5
Der Spin-Operator
Die Erde hat zwei Arten von Drehimpuls: den Bahndrehimpuls infolge der Bewegung um die
Sonne und den Eigendrehimpuls, der mit der Rotation um die Achse verbunden ist. Elektronen,
Protonen und Neutronen besitzen ebenfalls einen Eigendrehimpuls, den man Spin nennt und der
im Unterschied zum Bahndrehimpuls durch eine halbzahlige Quantenzahl s = 1/2 beschrieben
wird. Es gibt einen wichtigen Unterschied zwischen dem Eigendrehimpuls der Erde und dem
Spin eines Elementarteilchens. Denkt man sich die Erdkugel in kleine Massenelemente aufgeteilt, so ist der Eigendrehimpuls die Summe der Bahndrehimpulse dieser Massenelemente bei
der Rotation um die Erdachse. Man darf sich aber das Elektron nicht als rotierende Kugel vorstellen, denn das führt auf ernsthafte Widersprüche. Nach heutigem Wissen ist das Elektron ein
praktisch punktförmiges Teilchen, die Messungen am Elektron-Positron-Speicherring PETRA
ergaben eine obere Grenze für den Radius von 10−18 m. Um einen Drehimpuls der Grösse ~/2
aufzubringen, müsste eine Kugel mit r = 10−18 m so schnell rotieren, dass am Äquator die
Lichtgeschwindigkeit um ein Vielfaches überschritten würde.
Der Spin ist ein relativistischer Effekt (siehe Theorie B). Trotz der Schwierigkeiten mit der
Veranschaulichung besteht kein Zweifel daran, dass auch der Spin gewisse Eigenschaften eines
58
mechanischen Drehimpulses aufweist. Der experimentelle Beweis wurde durch ein von Einstein
vorgeschlagenes und von de Haas ausgeführtes Experiment erbracht. Ein an einem dünnen
Torsionsfaden hängender magnetisierter Eisenstab konnte durch Ummagnetisieren (gekoppelt
mit Umklappen der Spins) in Rotation versetzt werden.
Für den Spin-Operator kann man die Vertauschungsregeln des Drehimpulses nicht beweisen,
vielmehr werden die Regeln postuliert
[Sbx , Sby ] = i~Sbz ,
[Sby , Sbz ] = i~Sbx ,
[Sbz , Sbx ] = i~Sby .
(5.21)
Diese Regeln sind hinreichend um zu beweisen, dass jede Komponente mit dem Quadrat des
Spin-Operators vertauscht, die Rechnung verläuft genau wir bei Eq.(5.8).
b2 ] = [Sby , S
b2 ] = [Sbz , S
b2 ] = 0 .
[Sbx , S
(5.22)
b 2 und Sbz bezeichnen wir mit |s, ms i.
Die gemeinsamen Eigenzustände von S
b2 |s, ms i = s(s + 1)~2 |s, ms i ,
S
Sbz |s, ms i = ms ~ |s, ms i .
(5.23)
Im Folgenden beschränken wir uns auf die Spinquantenzahl s = 1/2, da die elementaren
Bausteine der Materie, Elektronen, Protonen und Neutronen, sowie die Bausteine der Nukleonen,
die Quarks, alle den Spin 1/2 haben. Für diesen Spezialfall schreiben wir die Eigenzustände
auch in der Form von Spaltenvektoren
1
0
|1/2, 1/2i =
|1/2, −1/2i =
.
(5.24)
0
1
Es ist leicht zu sehen, dass die Operatoren dann durch Matrizen repräsentiert werden können:
2
3~2
~
1 0
1 0
b
b
S =
, Sz =
.
(5.25)
0 1
0 −1
4
2
Die Matrixform des Aufsteige-Operators erhalten wir aus den Relationen
1
1
1
0
b
b
, S+
=0
=~
= C+ (1/2, −1/2)
S+
0
0
0
1
und entsprechend für den Absteige-Operator
0
1
0
b
= C− (1/2, 1/2)
=~
,
S−
1
0
1
Es folgt
Damit wird
Sb+ = ~
1
~
Sbx = (Sb+ + Sb− ) =
2
2
0 1
1 0
Die Pauli-Spin-Matrizen lauten
0 1
σx =
,
1 0
0 1
0 0
0 0
1 0
0 −i
i 0
,
σz =
0
1
=0
.
1 b
~
Sby =
(S+ − Sb− ) =
2i
2
,
σy =
Sb− = ~
,
Sb−
(5.26)
0 −i
i 0
1 0
0 −1
.
.
(5.27)
(5.28)
Die Komponenten des Spin-Operators sind dann
~
Sbj = σj .
2
59
(5.29)
5.6
5.6.1
Addition von Drehimpulsen
Addition von zwei Spins 1/2
Im Helium-Atom (s. Kap. 7) können die Spins der beiden Elektronen zu einem Gesamtspin
kombiniert werden1 . Dies wird in den Abbildungen 5.4 und 5.5 gezeigt, die Rechnungen bringen
wir in Anhang E. Wir schreiben
b=S
b1 + S
b2
S
(5.30)
und setzen einen Produktzustand an
|s, ms i = |s1 , ms1 i · |s2 , ms2 i ,
b1 nur auf |s1 , ms1 i und S
b2 nur auf |s2 , ms2 i wirkt. Es ist leicht zu sehen, dass die
wobei S
z-Komponente additiv ist:
ms = ms1 + ms2 .
Der Maximalwert ist ms = 1, daher existieren die sogenannten “Triplettzustände” mit der
Spinquantenzahl s = 1.
|1, +1i = |1/2, +1/2i · |1/2, +1/2i
1
|1, 0i = √ (|1/2, +1/2i · |1/2, −1/2i + |1/2, −1/2i · |1/2, +1/2i)
2
|1, −1i = |1/2, −1/2i · |1/2, −1/2i
(5.31)
Der Singulettzustand s = 0 ist orthogonal dazu
1
|0, 0i = √ (|1/2, +1/2i · |1/2, −1/2i − |1/2, −1/2i · |1/2, +1/2i) .
2
(5.32)
Bildlich kann man die Triplettzustände wie folgt darstellen
|1, +1i
|1, 0i
|1, −1i
= | ⇑i1 | ⇑i2
1
= √ ( | ⇑i1 | ⇓i2 + | ⇓i1 | ⇑i2 )
2
= | ⇓i1 | ⇓i2
(5.33)
und den Singulettzustand
1
|0, 0i = √ ( | ⇑i1 | ⇓i2 − | ⇓i1 | ⇑i2 )
2
(5.34)
Die Addition von zwei Spins 1/2 ist schematisch in den Abb. 5.4 und 5.5 zu sehen.
5.6.2
Addition von Bahndrehimpluls und Spin
Der Gesamtdrehimpuls eines atomaren Elektrons ist die vektorielle Summe von Bahndrehimpuls
und Spin:
J = L+S.
(5.35)
1
Bei der Addition zweier Spins werden zwei unabhängige Quantensysteme zusammengesetzt, wobei man das
sog. Tensorprodukt von Vektoren bildet. Die mathematische Behandlung geht über den Rahmen dieses Manuskripts hinaus.
60
Abbildung 5.4: Die Addition von zwei Spins 1/2 zum Gesamtspin s = 0 (Singulett).
Abbildung 5.5: Die Addition von zwei Spins 1/2 zum Gesamtspin s = 1 (Triplett).
In der nichtrelativistischen Quantenmechanik ist es zulässig, die Gesamtwellenfunktion näherungsweise als Produkt der Bahnwellenfunktion ψn l ml (r, θ, ϕ) und der Spinfunktion |s, ms i zu schreiben2 , da Spinumklapp-Prozesse nur eine sehr kleine Wahrscheinlichkeit haben
Ψges = ψn l ml (r, θ, ϕ) · |s, ms i .
(5.36)
Gemäß dem Superpositionsprinzip können auch Linearkombinationen dieser Produktfunktionen
auftreten, dies ist bei verschränkten Zuständen von besonderer Bedeutung (s. Kap. 9). In Gl.
(5.36) wird zur Vereinfachung die Zeitabhängigkeit, beschrieben durch den Faktor exp(−iωt),
weggelassen. Die magnetische Quantenzahl des Bahndrehimpulses wird an dieser Stelle ml
genannt, um sie von der magnetischen Quantenzahl ms des Spins zu unterscheiden.
Wie wird nun der Operator des Gesamtdrehimpulses definiert? Gleichung (5.35) legt nahe,
ihn als vektorielle Summe der Bahndrehimpuls- und Spin-Operatoren zu schreiben
b+S
b,
Jb = L
(5.37)
b nur auf die Ortswellenfunktion ψn l m (r, θ, ϕ) wirkt und
wobei die Rechenvorschrift gilt, dass L
l
b
S nur auf die Spinfunktion |s, ms i. Dies ist leicht einzusehen, denn für den Differential-Operator
b ist der Spaltenvektor |s, ms i eine Konstante, und für den Matrix-Operator S
b ist die Funktion
L
ψn l ml (r, θ, ϕ) eine Konstante. Daher sind auch beliebige Komponenten der beiden Operatoren
b und S
b untereinander vertauschbar:
L
2
b j , Sbk ] = 0 .
[L
Im relativistischen Fall ist diese Produktschreibweise nicht mehr erlaubt, die Lösungen der Dirac-Gleichung
sind vierkomponentige Spinor-Wellenfunktionen, die die Ortsabhängigkeit und die Spineinstellung der Elektronen
umfassen und gleichzeitig noch die Anti-Teilchen beschreiben.
61
Unter Benutzung dieser Beziehung ist leicht zu beweisen, dass der Operator des Gesamtdrehimpulses den Drehimpuls-Vertauschungsregeln der Quantenmechanik genügt:
bx , L
b y ] + [Sbx , Sby ]
[Jbx , Jby ] = [L
b z + Sbz ) = i~Jbz .
= i~(L
(5.38)
2
Die Konsequenz ist, dass gemeinsame Eigenzustände von Jb und Jbz existieren
2
Jb |j, mj i = j(j + 1)~2 |j, mj i ,
Jbz |j, mj i = mj ~ |j, mj i .
Was passiert, wenn wir Jbz auf Ψges anwenden?
(5.39)
b z ψn l m (r, θ, ϕ)] · |s, ms i + ψn l m (r, θ, ϕ) · [Sbz |s, ms i]
Jbz Ψges = [L
l
l
= (ml + ms )~Ψges = mj ~Ψges .
Daraus folgt für die Quantenzahlen
mj = ml + ms .
(5.40)
Wegen ms = ±1/2 wird mj und damit auch j halbzahlig. Der Maximalwert von mj ist offensichtlich (mj )max = l + 1/2. Das bedeutet, dass auch der maximale j-Wert l + 1/2 ist. Wir
werden sehen, dass ausserdem noch der j-Wert l − 1/2 vorkommt.
Um ein definiertes Beispiel vor Augen zu haben, betrachten wir den Fall l = 1. In Abb.
5.6 ist die Addition von Bahndrehimpuls und Spin vektoriell dargestellt. Die beiden Zustände
mit |mj | = 3/2 sind einfach besetzt, die Zustände mit |mj | = 1/2 dagegen doppelt. Es gibt die
beiden Gesamtdrehimpuls-Multipletts
|j, mj i
|j, mj i
= |3/2, +3/2i ,
= |1/2, +1/2i ,
|3/2, +1/2i ,
|1/2, −1/2i
|3/2, −1/2i ,
|3/2, −3/2i
(5.41)
Die formale Behandlung ist in Anhang E zu finden.
5.7
5.7.1
Magnetische Momente
Bohrsches Atommodell
Im Bohrschen Atommodell bewegt sich das Elektron auf einer Kreisbahn um den Kern. Ein
Kreisstrom I wirkt wie ein magnetischer Dipol. Sein magnetisches Moment ist
µ = Iπr2 ,
die Richtung ergibt sich aus der Rechtsschraubenregel. In einem externen Magnetfeld hat ein
magnetisches Moment eine potentielle Energie, und es wirkt ein Drehmoment
Epot = −µ · B ,
M =µ×B.
Im Bohr-Atom ist I = −e v/(2πr) und L = me rv, daraus folgt
e
µ=−
L.
2me
(5.42)
(5.43)
Der Minimalwert von L ist ~, dafür wird
|µ| = µB =
e~
= 5.79 · 10−5 eV/T .
2me
Die Grösse µB nennt man das Bohrsche Magneton.
62
(5.44)
Abbildung 5.6: (a) Die vektorielle Addition von Bahndrehimpuls 1 (blaue Pfeile) und Spin 1/2 (rote
Pfeile). Die Darstellung ist etwas vereinfacht, die Vektoren liegen in Wahrheit nicht alle in der Zeichenebene. Man erkennt, dass die Zustände mit mj = ±3/2 einfach besetzt sind und Zustände mit mj = ±1/2
doppelt. (b) Die beiden Einstellungen des magnetischen Eigenmoments des Elektrons in einem Magnetfeld. Die z-Komponenten sind ± µB , die potentiellen Energien im Feld sind Epot = −µe · B = ∓ µB B.
5.7.2
Magnetische Momente in der Quantentheorie
Die Beziehung (5.43) bleibt in der Quantentheorie erhalten, muss aber als Operatorgleichung
interpretiert werden.
e b
b=−
µ
L.
(5.45)
2me
Der magnetische Momentenvektor ist antiparallel zum Drehimpulsvektor (da die Ladung des
Eletrons negativ ist) und zeigt die gleiche Quantisierung: nur der Betrag und die z-Komponente
sind messbar. Offensichtlich gilt
µz = −ml ·
e~
= −ml · µB .
2me
(5.46)
Für den minimalen von null verschiedenen Wert |ml | = 1 hat das Bahnmoment den Wert
µB . Das magnetische Eigenmoment des Elektrons hat überraschenderweise den gleichen Wert,
obwohl |ms | nur 1/2 ist. Schreibt man analog zu (5.45)
b e = −g ·
µ
e b
S,
2me
(5.47)
so muss man dem g-Faktor den Wert g = 2 zuordnen. Die Richtungsquantisierung des Spinvektors wurde erstmals im Stern-Gerlach-Experiment sichtbar gemacht (siehe Physik III).
Die Modellvorstellung, das Elektron sei eine geladene Kugel, die um die eigene Achse rotiert,
ist falsch: Wie wir bereits gesehen haben, würde die Rotationsgeschwindigkeit am Äquator die
Lichtgeschwindigkeit weit übertreffen, und zweitens wäre das magnetische Eigenmoment dann
µB /2. Die Dirac-Gleichung als relativistische Verallgemeinerung der Schrödinger-Gleichung löst
die Problematik auf: sie sagt sowohl den Spin 1/2 als auch den g-Faktor 2 voraus. Allerdings
gibt es auch hier noch Korrekturen durch die Quantenelektrodynamik (QED), der experimentell
bestimmte g-Faktor des Elektrons ist geringfügig größer als 2. Die sog. (g minus 2)-Experimente,
bei denen die Abweichung des g-Faktors von 2 bestimmt wird, zählen zu den genauesten Tests
der QED.
63
Eine wichtige Konsequenz dieser Betrachtungen ist, dass es zwei verschiedene Quellen für den
Magnetismus gibt: Ströme und die magnetischen Eigenmomente der Elementarteilchen, vorwiegend der Elektronen. Die Magnetisierung von Eisen wird ausschließlich durch die ausgerichteten
magnetischen Momente der Elektronen in der nur teilweise gefüllten 3d-Schale des Fe-Atoms
hervorgerufen. Nach heutigem Wissen ist es nicht legitim, die magnetischen Eigenmomente auf
Kreisströme zurückzuführen.
5.7.3
Magnetische Momente von Protonen und Neutronen
Protonen und Neutronen haben den Spin 1/2. Gemäß der Dirac-Gleichung erwartet man für
die magnetischen Momente
e~
µp = +
, µn = 0 .
2mp
Experimentell findet man ganz andere Werte, vor allem ist das Moment des Neutrons ungleich
null, obwohl es elektrisch neutral ist:
µp = +2.79 ·
e~
,
2mp
µn = −1.91 ·
e~
.
2mn
(5.48)
Hieraus kann man erkennen, dass die Nukleonen keine strukturlosen elementaren Teilchen sind,
sondern aus kleineren Bausteinen bestehen. Das Quark-Modell kann die “anomalen” magnetischen Momente der Nukleonen erklären3 .
5.8
Didaktische Anmerkungen
Drehungen im Raum und die damit verbundenen Erscheinungen bereiten häufig große Verständnisschwierigkeiten. Der Kreisel ist eines der kompliziertesten Systeme der klassischen Mechanik.
In der Quantenmechanik ist dies nicht besser. Wir haben in diesem Kapitel Vektordiagramme
benutzt, um die Drehimpulsquantisierung sowie die Addition von Bahndrehimpuls und Spin
oder die Addition zweier Spins zu veranschaulichen. Die nötigen mathematischen Rechnungen
sind in Anhang E zusammengestellt. Wichtig ist die Erkenntnis, dass die Drehimpulsquantisierung allein aus den Vertauschungsregeln folgt und dass nur ganzzahlige oder halbzahlige
Quantenzahlen für das Quadrat des Drehimpulsoperators in Frage kommen. Die Auf- und Absteigeoperatoren liefern wegen ihrer sehr anschaulichen Bedeutung den einfachsten Zugang zur
Theorie des Drehimpulses. Diese Operatoren ändern die Quantenzahl der z-Komponente um
±1, woraus die Struktur der Drehimpulsmultipletts verständlich wird.
3
Dies gilt für das sog. naive Quark-Modell, in dem nur die “Valenzquarks” (uud) des Protons und (udd) des
Neutrons berücksichtigt werden und nicht die Gluonen und Quark-Antiquark-Paare.
64
Kapitel 6
Das Wasserstoff-Atom
6.1
Die Schrödinger-Gleichung für das H-Atom
Die Schrödinger-Gleichung für das H-Atom lautet
−
~2 2
∇ ψ + V (r) ψ = E ψ
2me
mit V (r) = −
e2
.
4πε0 r
(6.1)
Die Elektronenmasse wird hier mit me bezeichnet, um eine Verwechslung mit der magnetischen Quantenzahl m zu vermeiden. Das Proton wird als raumfest angesehen1 . Wegen der
sphärischen Symmetrie des Hamilton-Operators muss der Laplace-Operator in Kugelkoordinaten ausgedrückt werden (siehe Anhang A):
1 ∂
∇ ψ= 2
r ∂r
2
1
∂
∂ψ
1
∂2ψ
2 ∂ψ
r
+ 2
sin θ
+ 2 2
.
∂r
r sin θ ∂θ
∂θ
r sin θ ∂ϕ2
(6.2)
Für die Wellenfunktion machen wir den Lösungsansatz
ψ(r, θ, ϕ) = R(r) · Y (θ, ϕ)
(6.3)
und setzen dies ist Gl. (6.1) ein:
−
~2
2me
Y ∂
r2 ∂r
∂R
R
∂
∂Y
R
∂2Y
r2
+ 2
sin θ
+ 2 2
+ V (r)R · Y = E R · Y .
∂r
r sin θ ∂θ
∂θ
r sin θ ∂ϕ2
2
Dividiert man die Gleichung durch − 2m~e r2 R(r) · Y (θ, ϕ) so folgt
1 d
R dr
dR
2me r2
1
∂
∂Y
1
∂2Y
r2
−
(V
(r)
−
E)
=
−
sin
θ
−
2
dr
~2
Y sin θ ∂θ
∂θ
Y sin θ ∂ϕ2
(6.4)
Die linke Seite der Gleichung hängt nur von r ab, die rechte nur von θ und ϕ. Daher müssen
beide Seiten gleich einer reellen Konstanten sein, die wir als l(l + 1) schreiben2 .
1
Wenn man sehr genau rechnen will, ersetzt man me durch die reduzierte Masse des Elektron-Proton-Systems
mred = (me mp )/(me + mp ), die sich von me um 0.05% unterscheidet.
2
Jede reelle Zahl lässt sich so schreiben, wenn wir zulassen, dass l eine komplexe Zahl ist. Hier benutzen
wir aber schon unsere Kenntnisse über den Bahndrehimpuls und werden zeigen, dass l nur die Werte 0, 1, 2,...
annehmen kann.
65
6.1.1
Die Winkelgleichungen
Die Differentialgleichung für die Winkelfunktion Y (θ, ϕ) lautet
∂
sin θ
∂θ
∂Y
∂2Y
sin θ
+
+ l(l + 1) sin2 θ Y = 0 .
∂θ
∂ϕ2
Jetzt wird ein weiterer Separationsansatz gemacht:
Y (θ, ϕ) = f (θ) · g(ϕ) .
Nach Einsetzen und Division durch f · g ergibt sich
1
d
sin θ
f
dθ
df
sin θ
dθ
+ l(l + 1) sin2 θ = −
1 d2 g
= m2 .
g dϕ2
(6.5)
Hier ist wieder benutzt worden, dass die linke und rechte Seite der Gleichung von verschiedenen
Variablen abhängen und daher beide konstant sein müssen. Die Konstante wird m2 genannt.
Die sich ergebende Differentialgleichung für g(ϕ) hat die Lösung
g(ϕ) = exp(imϕ) .
(6.6)
Da g(ϕ + 2π) = g(ϕ) sein muss, folgt dass m eine ganze Zahl ist:
m = 0, ±1, ±2, ±3, . . .
Die Gleichung für f (θ) lautet
d
sin θ
dθ
df
sin θ
dθ
+ l(l + 1) sin2 θ − m2 f (θ) = 0 .
(6.7)
Diese Differentialgleichung ist analytisch lösbar, der mathematische Aufwand ist allerdings
beträchtlich. Wir geben die Lösungen hier nur an, es sind die Legendre-Funktionen Pl,m . Für
l = 0, 1, 2 lauten sie
P0,0 = 1
P1,1 = sin θ ,
P1,0 = cos θ
P2,2 = 3 sin2 θ ,
(6.8)
P2,1 = 3 sin θ cos θ ,
1
P2,0 = (3 cos2 θ − 1)
2
Die Kugelfunktionen Yl,m (θ, ϕ), siehe Gl. (5.14), lassen sich Produkt der Legendre-Funktionen
und der g(ϕ)-Funktionen schreiben. Sie sind auf 1 normiert:
Z
0
2π
Z
π
∗
Yl,m
(θ, ϕ)Yl,m (θ, ϕ) sin θdθ
0
dϕ = 1 .
(6.9)
In diesem Kapitel bezeichnen wir die magnetische Quantenzahl des Bahndrehimpulses wieder
mit m statt ml .
66
6.1.2
Die Radialgleichung
Die Differentialgleichung für die Radialfunktion R(r) lautet
d
dr
2me r2
2 dR
r
−
[V (r) − E] R − l(l + 1)R = 0 .
dr
~2
(6.10)
Für den Spezialfall l = 0 wollen wir eine Lösung suchen. Dazu schreiben wir die Differentialgleichung in der Form
R00 +
2 0 c1
R + R + c2 R = 0
r
r
mit c1 =
2me
2me e2
, c2 = 2 E
~2 4πε0
~
(6.11)
Als einfachste Lösung versuchen wir eine Exponentialfunktion
R(r) = exp(−r/a0 )
(6.12)
mit einer noch zu bestimmenden Konstanten a0 . Die Funktion R(r) = exp(+r/a0 ) wäre im
Prinzip auch eine Lösung, sie ist aber nicht zulässig, da wir die Bedingung R(r) → 0 für r → ∞
erfüllen müssen. Einsetzen in (6.11) und Multiplikation mit exp(+r/a0 ) ergibt
1
2
1
=0
+ c2 + c1 −
2
a0 r
a0
Diese Gleichung muss für alle Werte von r gelten, daher müssen die beiden Klammern verschwinden. Es folgt
2
1
a0 =
, c2 = − 2
c1
a0
Setzen wir die Ausdrücke für c1 und c2 ein, so erhalten wir
a0 =
4πε0 ~2
,
me e2
1
e2
E=− ·
2 4πε0 a0
(6.13)
Die Größe a0 nennt man den Bohrschen Radius (s. Kap. 6.3), und E erweist sich als die Energie
des Grundzustands des H-Atoms, vgl. Gl. (6.14). Bis auf eine Normierungskonstante ist die
Funktion (6.12) identisch mit der Wellenfunktion des H-Atoms im Grundzustand.
Die allgemeinen Lösungen der Differentialgleichung (6.10) werden in Anhang F konstruiert.
Die Energiewerte ergeben sich zu
E = En = −
~2
1
e2
1
=
−
·
· 2
2
2
2 4πε0 a0 n
2 me a0 n
mit
n = 1, 2, 3, . . . .
(6.14)
Wir haben das fundamentale Resultat, dass die Schrödinger-Gleichung genau die Energieniveaus
des Bohrschen Atommodells wiedergibt.
Eine Besonderheit der nichtrelativistischen Quantenmechanik ist, dass die Energieniveaus
des H-Atoms nur von der Hauptquantenzahl n abhängen und nicht von l und m. Für festes n
kann l die Werte l = 0, 1, (n − 1) annehmen (dies erkennt man leicht aus Gl. (F.9)) und m die
Werte −l ≤ m ≤ +l. Daher gibt es
n−1
X
(2l + 1) = n2
l=0
67
(6.15)
verschiedene Eigenfunktionen zum gleichen Energiewert En . Bei Berücksichtigung der zwei
Spineinstellungen des Elektrons sind es 2n2 . Die Tatsache, dass mehrere Eigenzustände die
gleiche Energie haben, nennt man - reichlich unpassend - Entartung.
In einem externen Magnetfeld wird die Drehimpuls-Entartung aufgehoben. Die Richtungsquantelung des Drehimpulses kann “sichtbar” gemacht werden, da die verschiedenen Einstellungen des mit der Bahnbewegung verknüpften magnetischen Moments zu einer Energieaufspaltung
der Niveaus führen. Die potentielle Energie ist
Epot = −µe · B = m µB B
(6.16)
Man nennt dies den (normalen) Zeeman-Effekt. Die Energieaufspaltungen sind in Abb. 6.1
skizziert. Anzumerken ist, dass der normale Zeeman-Effekt eigentlich der Ausnahmefall ist, weil
Abbildung 6.1: Der normale Zeeman-Effekt für die Niveaus 1s (n = 1, l = 0), 2p (n = 2, l = 1) und
3d (n = 3, l = 2) und die erlaubten optischen Übergänge, die der Auswahlregel ∆m = 0, ±1 gehorchen,
s. Kap. 8. Es wird hier die spektroskopische Notation benutzt: die Buchstaben s, p, d, f ... bedeuten
l = 0, 1, 2, 3...
der Spin und das magnetische Eigenmoment des Elektrons die Aufspaltungen im H-Atom und
den meisten anderen Atomen komplizierter machen. Der Regelfall ist der “anomale” ZeemanEffekt, auf den wir hier nicht eingehen wollen.
Bei Berücksichtigung relativistischer Korrekturen sowie interner Magnetfelder wird die Entartung auch ohne externe Felder weitgehend aufgehoben, die Energieniveaus hängen dann auch
von den anderen Quantenzahlen ab. In “wasserstoffähnlichen” Atomen wie Lithium und Natrium hängen die Energiewerte ohnehin stark von der Bahndrehimpuls-Quantenzahl l ab.
6.2
Die Wellenfunktionen des H-Atoms
Die Wellenfunktionen des H-Atoms lauten
ψnlm (r, θ, ϕ) = Rnl (r) Ylm (θ, ϕ)
(6.17)
Die Radialfunktionen hängen nur von der Hauptquantenzahl n und der Bahndrehimpuls-Quantenzahl l ab, während m nicht eingeht. Die Funktion Rnl (r) ist das Produkt der Exponentialfunktion exp(−r/(n a0 )) mit einem Polynom des Grades n − 1 in der Variablen r/(n a0 ). Die
Radialfunktionen sind - ebenso wie die Kugelfunktionen - auf 1 normiert:
Z ∞
Rnl (r)Rnl (r)r2 dr = 1 .
(6.18)
0
68
Für n = 1 und n = 2 haben sie die Gestalt
R1 0 =
R2 0 =
R2 1 =
r
exp −
3/2
a0
a0
r
1
r
exp −
√ 3/2 1 −
2a0
2a0
2 a0
1
r
r
exp −
√ 3/2
2a
2a
0
0
6 a0
2
(6.19)
Sie sind in den Abbildungen 6.2 und 6.3 als Funktion des normierten Radius r/a0 aufgetragen.
Das bemerkenswerte Resultat ist, dass die Funktionen R10 (r) und R20 (r) ihr Maximum bei r = 0
haben. Das Elektron hält sich also mit großer Wahrscheinlichkeit direkt am Ort des Atomkerns
auf. Dies ist völlig anders als im Bohrschen Atommodel (s. Kap. 6.3).
Oft ist es von Interesse zu wissen, mit welcher Wahrscheinlichkeit sich das Elektron zwischen
zwei Kugelflächen der Radien r und r + dr befindet. Dazu integriert man |ψnlm (r, θ, ϕ)|2 über
den Raumwinkel dΩ und erhält damit die radiale Aufenthaltswahrscheinlichkeit
Pnl (r) = Nnl r2 |Rnl (r)|2
(6.20)
mit einem Normierungsfaktor Nnl , der für l = 0 den Wert 4π hat. Es ist interessant anzumerken,
0
5
10
0
5
10
r / a0
r / a0
Abbildung 6.2: Links ist die Radialfunktion R10 (r) als Funktion von r/a0 aufgetragen, rechts die radiale
2
Aufenthaltswahrscheinlichkeit P10 (r) = 4πr2 |R10 (r)| .
dass das Maximum der radialen Aufenthaltswahrscheinlichkeit in der Nähe der Bohrschen Bahn
für die jeweilige Quantenzahl n liegt (im Bohr-Modell gilt rn = n2 a0 , d.h. r1 = a0 , r2 = 4a0 ).
0
5
10
0
5
10
r / a0
r / a0
Abbildung 6.3: Links: die Radialfunktionen R20 (r) (rot) und R21 (r) (blau) als Funktion von r/a0 .
Rechts die zugehörigen radialen Aufenthaltswahrscheinlichkeiten P20 (r) und P21 (r).
69
Ein zweidimensionales Bild des H-Atoms gewinnt man, wenn man die Wahrscheinlichkeitsdichte |ψnlm (x, y = 0, z)|2 über der xz-Ebene aufträgt. Dies wird in Abb. 6.4 für den Grundzustand 1s (n = 1, l = 0) gezeigt. Interessante Muster ergeben sich für größere Werte von n und
M10
M10
Abbildung
6.4: Das linke Bild zeigt die Wahrscheinlichkeitsdichte |ψnlm (x, y = 0, z)|2 für den 1s-Zustand
M10
2
(n = 1, l = 0) als Funktion von x und z. Rechts ist |ψnlm (x, y = 0, z)| in einer Farbcodierung aufgetragen.
l, siehe Abb. 6.5.
Kern
6.3
Didaktische Anmerkungen
Die Sonne oder eine Glühlampe senden ein kontinuierliches Spektrum aus, aber einzelne Atome
emittieren diskrete Spektrallinien. Die von Balmer, Rydberg und anderen gefundene Formel für
die reziproken Wellenlängen im Linienspektrums des Wasserstoffatoms lautet
1
1
1
= RH
−
λ
n2 n02
Für die teilweise im Sichtbaren liegende Balmerserie ist n = 2 und n0 = 3, 4, 5..... Die Größe
RH nennt man die Rydbergkonstante. Die Linienspektren stellten die klassische Physik des 19.
Jahrhunderts vor unlösbare Probleme. Wir diskutieren einige Schritte auf dem Weg zu einer
Theorie, die imstande ist, die Spektrallinien der Atome zu erklären.
6.3.1
Das Atommodell von Rutherford
Die von Geiger und Marsden durchgeführten Streuexperimente von α-Strahlung an dünnen
Goldfolien und ihre Deutung durch Lord Rutherford führten zum Rutherford-Modell des Atoms:
die positive Ladung und fast die gesamte Masse befinden sich in einem winzigen Kern (diese
Aussage ist auch heute noch gültig), die leichten negativ geladenen Elektronen bewegen sich
auf Kreisbahnen um den Kern (diese Aussage ist aus heutiger Sicht nicht mehr gültig). Das
Atom ähnelt somit dem System Sonne-Erde. Auf das Elektron im H-Atom wirkt das CoulombPotential
e2
V (r) = −
(6.21)
4πε0 r
70
M211
M210
M320
M321
M322
Abbildung 6.5: Die Wahrscheinlichkeitsdichten |ψnlm (x, y = 0, z)|2 für die Quantenzahlen (n, l, m) =
(2, 1, 0), (2, 1, 1) (obere Reihe) und für (n, l, m) = (3, 2, 0), (3, 2, 1), (3, 2, 2) (untere Reihe). Die x-Achse
verläuft horizontal, die z-Achse vertikal. Bei diesen Bildern ist y = 0 gewählt. Die Wahrscheinlichkeitsdichten sind rotationssymmetrisch um die z-Achse.
Eine zweidimensionale Repräsentation
−100 wird in Abb. 6.6 gezeigt. Aus der Gleichsetzung von
M :=
i, j
Coulombkraft und Zentripetalkraft
kann
man2 die Umlauffrequenz des Elektrons in Abhängigkeit
2
( i − 50.1) + ( j − 50.1) + 40
vom Bahnradius berechnen und zeigen, dass sie mit kleiner werdendem Radius rasch anwächst.
Die Kreis- oder Ellipsenbahnen der Planeten um die Sonne sind stabil. Die Kreisbahnen der
Abbildung 6.6:
Zweidimensionale Repräsentation des Coulombpotentials im Rutherford-Atom. Das
Gravitationspotential hat auch diese Trichterform. Aus Metall oder Kunststoff hergestellte Modelle sind
oft zu sehen. Lässt man eine Münze parallel zu den Kreisen loslaufen, so spiralt diese nach innen, wird
dabei immer schneller Mund verschwindet schliesslich im zentralen Loch. Entsprechend muss man sich die
Bewegung des Elektrons im Rutherford-Atom vorstellen.
71
Elektronen im Atom dagegen sind instabil: nach den Gesetzen der Elektrodynamik sollte eine
radial beschleunigte Ladung ständig elektromagnetische Strahlung aussenden. Wegen des damit
verbundenen Energieverlustes müsste sich das Elektron immer mehr dem Atomkern annähern
und nach ca. 10−12 s im Kern verschwinden. Das Problem ist dann: warum gibt es überhaupt
stabile Atome? Dieses Problem erwies sich als unlösbar im Rahmen der klassischen Physik.
6.3.2
Das Atommodell von Bohr
Im Jahr 1913 schlug Niels Bohr sein berühmtes Atommodell vor, das so konstruiert war, dass es
die von Balmer und anderen gefundenen Formeln der Spektralserien des Wasserstoffs erklären
konnte. Ausgehend von dem Befund, dass das Rutherford-Atom sich als instabil erwiesen hatte,
machte Bohr die für seine Zeitgenossen befremdliche Annahme, dass die Gesetze der klassischen
Physik nicht notwendigerweise auch im atomaren Bereich gelten. Er stellte drei Postulate auf,
die in der klassischen Physik nicht gültig sind:
(1) Die Elektronen bewegen sich auf Kreisbahnen um den Kern, aber es gibt stationäre Bahnen,
auf denen die Teilchen nicht strahlen.
(2) Strahlung wird emittiert, wenn ein Elektron von einer Bahn höherer Energie auf eine Bahn
geringerer Energie überwechselt. Die (Kreis)frequenz der Strahlung ist gegeben durch die Energiedifferenz zwischen Anfangs- und Endbahn: ~ω = Eanf − Eend .
(3) Auf einer stationären Bahn hat der Bahndrehimpuls den Wert L = n ~, wobei n = 1, 2, 3...
ist. Die natürliche Zahl n wird zur Kennzeichnung der jeweiligen Bahn benutzt.
Abgesehen von diesen Postulaten wird im Bohr-Modell die klassische Physik benutzt. Aus
der Gleichsetzung von Coulombkraft und Zentripetalkraft
e2
me v 2
=
4πε0 r2
r
findet man für die kinetische Energie als Funktion des Bahnradius
1
1 e2
me v 2 =
2
2 4πε0 r
(6.22)
Mit Hilfe von Postulat (3) wird die Geschwindigkeit v eliminiert
L = me rn vn = n ~
⇒
vn =
n~
me rn
Mit (6.22) folgt daraus für den Radius der Bahn n
rn =
4πε0 ~2 2
· n ≡ a0 · n2
me e2
(6.23)
und die Energie des Elektrons auf dieser Bahn
En =
1
e2
1 e2
1
13, 6 eV
me vn2 −
=−
=−
2
2
4πε0 rn
2 4πε0 a0 n
n2
(6.24)
Die charakteristische Größe a0 nennt man den Bohrschen Radius
a0 =
4πε0 ~2
= 0.53 · 10−10 m
me e2
Das Niveauschema von Wasserstoff ist in Abb. 6.7 skizziert.
72
(6.25)
Abbildung 6.7: Die Energieniveaus des H-Atoms nach dem Bohrschen Atommodel. Eingezeichnet sind
auch die Spektralserien (Lyman-Serie, Balmer-Serie, Paschen-Serie).
Leistungen und Grenzen des Bohrschen Atommodells
Niels Bohr hat zwei wesentliche neue Aspekte in die Physik eingebracht, die - in leicht abgewandelter Form - auch heute noch Gültigkeit haben:
(1) es gibt stationäre Zustände im Atom, in denen das Elektron keine Strahlung emittiert;
(2) Strahlung wird genau dann emittiert oder absorbiert, wenn das Elektron von einem stationären Zustand auf einen anderen übergeht.
Die dritte Neuerung im Vergleich zur klassischen Physik ist die Quantisierung des Bahndrehimpulses, die allerdings - wie wir aus Kap. 5 wissen - in der Quantenmechanik komplizierter ist als
im Bohr-Modell. Insbesondere haben der Grundzustand 1s und die angeregten Zustände 2s, 3s,
4s,... einen Bahndrehimpuls null, was im Planetenmodell des H-Atoms unmöglich ist.
Die großen Unterschiede zwischen dem Schrödinger-Bild des Atoms und dem Bohrschen
Atommodell erkennt man in Abb. 6.8. Im Schrödinger-Bild besteht für das Elektron eine große
Wahrscheinlichkeit, direkt am Ort des Atomkerns gefunden zu werden, während es im Bohrschen
Atommodell immer einen relativ großen Abstand a0 vom Kern hat. Es gibt überzeugende
experimentelle Beweise, dass das Schrödinger-Bild korrekt ist.
Wie kann man die befremdliche Vorhersage der Quantentheorie prüfen, dass das Elektron
mit großer Wahrscheinlichkeit direkt am Ort des Atomkerns gefunden werden kann? Dafür sind
zwei Systeme geeignet, die dem Wasserstoffatom ähneln: man kann den Kern durch ein Positron ersetzen, oder man kann das Elektron durch ein Antiproton ersetzen. Diese aus Teilchen
und Antiteilchen bestehenden gebundenen Systeme, Positronium und Antiprotonium, besitzen
praktisch die gleichen Wellenfunktionen und Energieniveaus wie das H-Atoms, man muss nur
in den jeweiligen Gleichungen die Elektronenmasse me durch die reduzierte Masse mred ersetzen. Im Fall des Positroniums e+ e− ist mred = me /2, die Energie des Grundzustands ist daher
−13.6/2 = −6.8 eV. Teilchen und Antiteilchen können sich gegenseitig annihilieren, wenn sie
einander sehr nahe kommen. Bei der Elektron-Positron-Annihilation entstehen, je nach Spineinstellung, 2 oder drei γ-Quanten, bei der Proton-Antiproton-Annihilation entstehen mehrere
π-Mesonen. Experimentell wird beobachtet, dass Positronium und Antiprotonium beide nur
begrenzte Lebensdauer haben und durch Annihilation verschwinden. Die Annihilation kann nur
bei extrem kleinen Abständen eintreten. Im Bohrschen Atommodell sind die Abstände viel zu
groß dafür.
73
hhhh
IψI2
Bohrsche
Bahn
Kern
1.5
1
0.5
0
0.5
1
1.5
x / a0
M10
Abbildung 6.8: Links: Bild des
kkk Wasserstoffatoms im Grundzustand in der Schrödingertheorie. Die
2
Wahrscheinlichkeitsdichte |ψ100 (x, y, z)| wird für y = 0 als Funktion von x und z gezeigt(die Farbcodierung ist so gewählt, dass rot hohe Werte, blau-violett niedrige Werte bedeuten). Das Maximum liegt
bei x, y, z = 0, also genau im Atomkern. Mitte: die (n = 1)-Kreisbahn im Bohrschen Atommodell. Das
Elektron hat immer einen relativ großen Abstand a0 vom Kern. Rechts: Schnitt durch das H-Atom
2
entlang der x-Achse. Aufgetragen ist die Wahrscheinlichkeitsdichte |ψ100 (x, 0, 0)| als Funktion von x/a0
für y = z = 0. Gezeigt wird auch die Lage der Kreisbahn im Bohrschen Atommodell.
Ein weiterer, unabhängiger Beweis für die Richtigkeit des Schrödingerbildes des Atoms ist
der sog. K-Einfang (electron capture). Atomkerne mit einem überzähligen Proton können sich
entweder durch den β + -Zerfall oder durch K-Einfang in einen stabilen Kern umwandeln. Bei
dem Einfangprozess reagiert ein Elektron aus der K-Schale (n = 1, l = 0) mit einem Proton im
Kern und wandelt dieses in ein Neutron um:
p + e− → n + N eutrino
Das ist nur möglich, weil sich das 1s-Elektron mit großer Wahrscheinlichkeit im Kern aufhalten
kann.
Die Begrenzungen des Bohrschen Atommodells zeigen sich an vielen anderen Stellen. Mit diesem Modell können Mehrelektronen-Atome überhaupt nicht beschrieben werden, aber auch die
Feinstruktur im Wasserstoff bleibt unverständlich. Die von Werner Heisenberg, Erwin Schrödinger und vielen anderen entwickelte Quantenmechanik hat sich als die umfassende Theorie erwiesen. Niels Bohr selbst hat bei der Entwicklung dieser Theorie eine herausragende Rolle gespielt.
In den Jahren um 1925 waren Göttingen und Kopenhagen die Zentren der theoretischen Physik.
Optische Übergänge, Korrespondenzprinzip
Bei dem Übergang des Elektrons von einem Energieniveau En auf ein Niveau En0 (n0 < n) wird
ein Photon der Frequenz
1
e2
1
1
ωn,n0 =
−
2~ 4πε0 a0 n02 n2
emittiert. Nun betrachten wir den Fall, dass die Hauptquantenzahl n sehr groß ist und wählen
n0 = n − 1. Dann wird näherungsweise
ωn,n−1 ≈
e2
4πε0 a0 n3 ~
für n 1
Dies ist identisch mit der Umlauffrequenz des Elektrons auf der Kreisbahn mit Radius rn :
ωn =
vn
e2
=
rn
4πε0 a0 n3 ~
74
Die Frequenz der ausgesandten Strahlung stimmt daher mit der Umlauffrequenz des Elektrons
überein, wie man aufgrund der klassischen Elektrodynamik erwarten würde. Dies ist ein wichtiges Beipiel für das Korrespondenzprinzip: im Limes großer Quantenzahlen gehen die Aussagen
der Quantentheorie in die der klassischen Physik über. Bei kleinen Quantenzahlen erhält man
dagegen völlig verschiedene Resultate.
75
Kapitel 7
Atome mit vielen Elektronen
7.1
Ausschließungsprinzip, identische Teilchen
Um Regelmäßigkeiten in den Eigenschaften der Atome und insbesondere auch das Periodische
System der Elemente zu erklären, schlug Wolfgang Pauli 1925 das Ausschließungsprinzip vor:
Zwei Elektronen in einem Atom dürfen nicht in allen vier Quantenzahlen n, l, ml , ms übereinstimmen, sondern müssen sich in mindestens einer dieser Quantenzahlen unterscheiden.
Eine wichtige Konsequenz des Ausschließungsprinzips (oder Pauli-Prinzips) ist die Schalenstruktur der Atome, auf die wir später noch eingehen. Die allgemeinere Form des Ausschließungsprinzips lautet:
Die Gesamtwellenfunktion eines Mehrelektronensystems muss antisymmetrisch gegenüber der
Vertauschung irgend zweier Elektronen sein.
In dieser Form ist das Ausschließungsprinzip auch auf Elektronen in Metallen und andere Vielteilchensysteme anwendbar.
In der Quantentheorie sind identische Teilchen grundsätzlich ununterscheidbar, ganz anders
als in der klassischen Physik oder im täglichen Leben. Zwei exakt baugleiche Autos sind leicht
unterscheidbar, wenn man einem von ihnen einen Farbfleck auf die Motorhaube malt, eineiigige
Zwillinge sind unterscheidbar, wenn einer von ihnen sich die Haare abschneidet. Die Elektronen
in einem Eisenatom sind dagegen nicht unterscheidbar. Wir können sie nicht durch Farbflecke
markieren, noch durch irgend etwas anderes. Auch die Protonen im Eisenkern sind nicht voneinander zu unterscheiden. Diese grundsätzliche Ununterscheidbarkeit elementarer Teilchen hat
weitreichende Konsequenzen für Vielteilchen-Wellenfunktionen: die Wahrscheinlichkeitsdichte
muss invariant sein gegenüber der Vertauschung irgend zweier Teilchen. Mit Hilfe der Quantenfeldtheorie kann nun ganz allgemein bewiesen werden, dass Teilchen mit halbzahligem Spin
(Fermionen) eine antisymmetrische Gesamtwellenfunktion (Produkt von Orts- und Spinwellenfunktion) haben müssen und Teilchen mit ganzzahligem Spin (Bosonen) eine symmetrische Gesamtwellenfunktion.
Eine anschauliche, auf der täglichen Erfahrung oder der klassischen Physik beruhende Erklärung
des Pauli-Prinzips ist nicht bekannt. Versuche, eine solche Erklärung zu finden, sind vermutlich auch zwecklos, weil andere identische Teilchen wie etwa Helium-Atome sich konträr dazu
verhalten: bei diesen Bose-Teilchen ist die Gesamtwellenfunktion symmetrisch gegenüber der
Vertauschung irgend zweier Teilchen, und diese Teilchen neigen dazu, sich bei hinreichend tiefen Temperaturen alle in den gleichen Quantenzustand zu begeben. Dies ist die supraflüssige
Phase von Helium, die bei Temperaturen unterhalb von 2,17 Kelvin beobachtet wird. Die Bose76
Einstein-Kondensation (s. Kap. 1) setzt eine total symmetrische Wellenfunktion voraus.
7.2
Das Helium-Atom
Das Helium-Atom besteht aus einem Kern der Ladung +2e, der zwei Protonen und zwei Neutronen enthält, sowie zwei Elektronen. Zur Vereinfachung wird der Kern als ortsfest angenommen
und in den Nullpunkt des Koordinatensystems gelegt. Die potentielle Energie des Atoms enthält
drei Terme: die negative potentielle Energie von Elektron 1 im Feld des Kerns, die negative potentielle Energie von Elektron 2 im Feld des Kerns und die positive potentielle Energie von
Elektron 1 im Feld von Elektron 2:
V (r 1 , r 2 ) = V1 (r 1 ) + V2 (r 2 ) + V12 (r 1 , r 2 )
mit
Vj (r j ) = −
2e2
4πε0 |r j |
(j = 1, 2)
und V12 (r 1 , r 2 ) = +
(7.1)
e2
4πε0 |r 1 − r 2 |
Anmerkung: im Augenblick tun wir so, als ob wir die beiden Elektronen durch eine Nummer kennzeichnen
könnten. Ihre Ununterscheidbarkeit wird später berücksichtigt.
Die zeitunabhängige Schrödigergleichung ist eine partielle Differentialgleichung in den sechs
Variablen (x1 , y1 , z1 , x2 , y2 , z2 ). Sie lautet
−
~2
∇21 + ∇22 ψ(r 1 , r 2 ) + V (r 1 , r 2 )ψ(r 1 , r 2 ) = Eψ(r 1 , r 2 )
2me
(7.2)
Es ist eine große Enttäuschung, dass bereits die Schrödigergleichung des zweiteinfachsten Atoms
nicht mehr analytisch lösbar ist. Daher muss man Näherungen anwenden.
7.2.1
Modell der unabhängigen Elektronen
Die Komplikation der Gleichung (7.2) liegt in dem Term V12 (r 1 , r 2 ), der bewirkt, dass die
Bewegung des einen Elektrons die des anderen beeinflusst. Wenn man dieses Wechselwirkungspotential weglässt, kann man die Zweiteilchen-Wellenfunktion als Produkt von zwei EinteilchenWellenfunktionen ansetzen
ψ(r 1 , r 2 ) = ψ1 (r 1 ) · ψ2 (r 2 )
und bekommt zwei entkoppelte Einteilchen-Schrödigergleichungen
−
~2
2e2
∇2j ψj (r j ) −
ψj (r j ) = Eψj (r j )
2me
4πε0 |r j |
(j = 1, 2)
(7.3)
Eine Gleichung dieser Art gilt exakt für das Helium-Ion He+ , bei dem sich ein einzelnes Elektron
im Feld eines Kerns der Ladung +Ze = +2e bewegt. Wir können die Energieniveaus direkt von
der Berechnung des Wasserstoff-Atoms übertragen (siehe die Gleichungen (6.14) und (6.24))
En = −
Z 2 · 13, 6
54, 4
eV = − 2 eV
2
n
n
(7.4)
Die Grundzustandsenergie des He+ -Ions hat in der Tat den Wert E1 = −54.4 eV, aber im
Heliumatom misst man für den tiefsten Energiezustand der beiden Elektronen nicht −2 · 54, 4 =
−108, 8 eV, sondern nur -79 eV. Die abstoßende Wechselwirkung der Elektronen hat, wie man
erwarten würde, einen merklichen Einfluss auf die Energieniveaus.
77
Wie kann man trotz der Elektron-Elektron-Wechselwirkung weiterhin mit einem EinelektronModell des Atoms rechnen? Die Idee ist, sich eines der Elektronen auszuwählen und die Wirkung
des anderen durch eine negative Ladungswolke zu beschreiben, die eine gewisse Abschirmung der
Kernladung bewirkt. Pauschal kann man auf diese Weise die positive Wechselwirkungsenergie
der Elektronen durch Einführung einer “effektiven” Kernladungszahl Zef f erfassen. Damit wird
die Energie des Grundzustands
2
E1He = 2(−13, 6 eV) · Zef
f
(7.5)
Empirisch findet man für den Grundzustand Zef f = 1, 7. In dieser Näherung erfüllt jedes der
beiden Elektronen die Einteilchen-Schrödingergleichung
−
Zef f e2
~2
∇j 2 ψj (r) −
ψj (r j ) = Eψj (r j )
2me
4πε0 |r j |
(j = 1, 2)
(7.6)
Die Lösungen sind von der Gestalt der Wasserstoff-Eigenfunktionen:
ψ(r, θ, ϕ) = Rnl (r)Ylm (θ, ϕ)
In dem Modell der quasi-unabhängigen Teilchen kann man die Gesamtwellenfunktion als Produkt
von Einteilchen-Wellenfunktionen schreiben:
ψ(1, 2) = ψa (1)ψb (2)
(7.7)
Hier verwenden wir eine abkürzende Schreibweise und schreiben ψ(1, 2) anstatt ψ(r 1 , r 2 ). Die
Quantenzahlen werden pauschal durch a ' (n, l, m) und b ' (n0 , l0 , m0 ) gekennzeichnet.
7.2.2
Anwendung des Pauli-Prinzips
Die Wellenfunktion (7.7) genügt nicht einem fundamentalen Prinzip der Quantentheorie: die beiden Elektron im He-Atom sind identische Teilchen und nicht unterscheidbar. Ob sich Elektron
1 im Quantenzustand a ' (n, l, m) befindet und Elektron 2 im Quantenzustand b ' (n0 , l0 , m0 )
oder umgekehrt, ist physikalisch dasselbe. Die Wahrscheinlichkeitsdichte muss demnach invariant gegenüber Vertauschung der beiden Teilchen sein:
|ψ(1, 2)|2 = |ψ(2, 1)|2
(7.8)
Diese fundamentale Bedingung wird von der Funktion (7.7) verletzt. Es gibt zwei Möglichkeiten, eine gegenüber Teilchenvertauschung invariante Wahrscheinlichkeitsdichte zu realisieren: wir können eine symmetrische und eine antisymmetrische Kombination der Produkte von
Einteilchen-Wellenfunktionen bilden
ψS (1, 2) =
ψA (1, 2) =
1
√ (ψa (1)ψb (2) + ψa (2)ψb (1))
2
1
√ (ψa (1)ψb (2) − ψa (2)ψb (1))
2
(7.9)
Für die symmetrische Kombination gilt ψS (2, 1) = +ψS (1, 2) und für die antisymmetrische
ψA (2, 1) = −ψA (1, 2).
Nun ist zu beachten, dass die Wellenfunktionen ψS (r 1 , r 2 ) und ψA (r 1 , r 2 ) nur die räumliche
Verteilung der Elektronen beschreiben. Die Spinfunktionen müssen auch noch erfasst werden.
78
In diesem Abschnitt bezeichnen wir die Spinfunktionen mit χ, wobei folgende Konvention gilt
(vgl. Kap. 5)
1
0
χ+ ≡ |1/2, 1/2i =
,
χ− ≡ |1/2, −1/2i =
(7.10)
0
1
In Kap. 5 haben wir die Addition zweier Spins 1/2 zu einem Gesamtspin s = 1 (Triplett) oder
s = 0 (Singulett) studiert. Die Triplett-Spinfunktion ist symmetrisch gegenüber Teilchenvertauschung:


ms = +1
 χ+ (1)χ
+ (2)
√1
χ+ (1)χ− (2) + χ− (1)χ+ (2)
ms = 0 
χtrip (1, 2) =
(7.11)
 2
χ− (1)χ− (2)
ms = −1
Die Singulett-Spinfunktion ist antisymmetrisch
1 χ+ (1)χ− (2) − χ− (1)χ+ (2)
χsing (1, 2) = √
2
ms = 0
(7.12)
Die Gesamtwellenfunktion des Helium-Atoms erhalten wir durch Kombination von Orts- und
Spinfunktion. Aufgrund des Pauli-Prinzips sind zwei Kombinationen zugelassen: das Produkt
der symmetrischen Orts-Wellenfunktion und der antisymmetrischen Spinfunktion (Spinsingulett)
Ψsing (1, 2) = ψS (1, 2) χsing (1, 2)
(7.13)
oder das Produkt der antisymmetrischen Orts-Wellenfunktion und der symmetrischen Spinfunktion (Spintriplett)
Ψtrip (1, 2) = ψA (1, 2) χtrip (1, 2)
(7.14)
Beide sind antisymmetrisch gegenüber Teilchenvertauschung.
7.2.3
Energieniveaus und Spektren von Helium
Das Pauli-Prinzip hat bemerkenswerte Konsequenzen für die Energieniveaus und Spektrallinien
von Helium: es sieht so aus, als ob es zwei Sorten von Helium-Atomen gäbe, die verschiedene
Energieniveau-Schemata haben. Der absolute Grundzustand, in dem sich beide Elektronen auf
dem tiefstmöglichen Energieniveau befinden, dem 1s-Niveau mit n = 1, l = 0, ml = 0, ist
nur mit der Singulett-Wellenfunktion (7.13) möglich. Bei der Triplett-Funktion (7.14) muss
der Ortsanteil antisymmetrisch sein, d.h. wenn ein Elektron im 1s-Zustand ist, muss sich das
zweite Elektronen auf einem angeregten Niveau befinden. Der energetisch tiefste Zustand des
Triplett-Helium ergibt sich, wenn ein Elektron im 1s-Zustand ist und das zweite im 2s-Zustand.
Die Energie des Triplett-Grundzustands liegt um fast 20 eV über dem Singulett-Grundzustand.
Die Lage der Energieniveaus wird durch die Orts-Wellenfunktionen bestimmt, während die
Spinfunktionen nur einen geringfügigen Einfluss haben (sie tragen zur sog. Feinstruktur bei,
auf die wir in Kap. 8 eingehen). Jetzt kommt eine wesentliche Erkenntnis: die symmetrische
Ortsfunktion ψS (1, 2) führt, bei gleichen Quantenzahlen n und l, zu höheren Energiewerten als
die antisymmetrische Ortsfunktion ψA (1, 2). Das kann man wie folgt verstehen. Nähert man die
Elektronen einander an (r 1 → r 2 ), so wird |ψA (r 1 , r 2 )|2 |ψS (r 1 , r 2 )|2 . Im antisymmetrischen
Zustand sind daher die Elektronen im Mittel weiter voneinander entfernt als im symmetrischen
Zustand und erfahren dadurch weniger elektrostatische Abstoßung, d.h. die positive potentielle
Energie zwischen den Elektronen wird kleiner. Daraus folgt EA < ES .
In Abb. 7.1 sind die beiden Energieniveauschemata von Helium dargestellt. Dabei befindet
sich ein Elektron im 1s-Grundzustand, das andere im Grundzustand oder auf einem angeregten
79
Abbildung 7.1: Links: Energieniveauschema von Helium im Spinsingulett-Zustand mit einer symmetrischen Ortsfunktion ψS . Rechts: Energieniveauschema im Spintriplett-Zustand mit einer antisymmetrischen Ortsfunktion ψA . Einige der erlaubten optischen Übergänge sind eingezeichnet. (Bitte beachten:
die Energieskala ist zwischen 0 und 20 eV unterbrochen).
Niveau. Wie erwartet liegen die 2s- und 2p-Niveaus bei der symmetrischen Ortsfunktion ψS
deutlich höher als bei der antisymmetrischen Ortsfunktion ψA . Zwischen den Termschemata
finden keine optischen Übergänge statt, weil diese ein Spinumklappen erfordern würden. Dies
ist ein äußerst seltener Prozess.
Eine weitere Beobachtung: Im Unterschied zum Wasserstoff ist beim Helium die “DrehimpulsEntartung” aufgehoben. Das 2s-Niveau liegt tiefer als das 2p-Niveau. Der Grund ist die stärkere
Abschirmung der Kernladung bei l = 1 im Vergleich zu l = 0. Das s-Elektron ist somit stärker
gebunden und hat eine tiefere potentielle Energie. Dieser Effekt wird bei allen MehrelektronenAtomen beobachtet.
In Anhang G wird skizziert, wie man die Energieniveaus des He-Atoms im Prinzip berechnen
könnte.
7.3
Schalenstruktur der Atome
Das Pauli-Prinzip verbietet, dass alle Elektronen in den tiefsten Zustand n = 1 gehen. Ohne
dieses Verbot wären die Atome viel kleiner und Materie sehr viel dichter. Die Elektronen in einem Atom müssen sich in mindestens einer der vier Quantenzahlen n, l, ml , ms unterscheiden.
Daraus resultiert die Schalenstruktur der Atome, die in der Physik III ausführlich diskutiert
wird. Wir bringen eine kurze Zusammenfassung.
K-Schale n = 1 ⇒ l = 0, ml = 0. Zwei Spineinstellungen sind möglich: ms = ±1/2. Die
beiden Elemente, die Elektronen nur in der K-Schale haben, sind Wasserstoff und Helium.
H: 1s
He: 1s2 (Spins ⇑⇓)
80
L-Schale n = 2, l = 0 (2s) oder l = 1 (2p) mit ml = 0, ±1 sowie ms = ±1/2
Es gibt acht Elemente mit vollständig besetzter K-Schale und teilweise besetzter L-Schale: Lithium, Beryllium, Bor, Kohlenstoff, Stickstoff, Sauerstoff, Fluor, Neon.
Li: 1s2 2s1
N: 1s2 2s2 2p3
2
2
Be: 1s 2s
O: 1s2 2s2 2p4
B: 1s2 2s2 2p1
F: 1s2 2s2 2p5
2
2
2
C: 1s 2s 2p
Ne: 1s2 2s2 2p6
Beim Neon sind die K- und L-Schalen voll gefüllt. Die Elektronenverteilung ist kugelsymmetrisch. Das Element Ne ist ein Edelgas und geht keine chemischen Bindungen ein.
Die K-Schale enthält alle Elektronen mit Hauptquantenzahl n = 1, die L-Schale enthält alle
Elektronen mit n = 2. Bei höheren Werten der Hauptquantenzahl gibt es Überkreuzungen. So
liegt in schweren Atomen das 4s-Niveau energetisch unter dem 3d-Niveau und wird deswegen
früher besetzt. Die M-Schale umfasst nur die 3s- und 3p-Unterschalen mit insgesamt 8 Elektronen, während die 3d-Unterschale zur N-Schale gehört. Die energetische Lage der Atomschalen
wird schematisch in Abb. 7.2 gezeigt.
Abbildung 7.2: Energetische Lage der K-, L-, M-,N- und O-Schalen im Periodensystem der Elemente.
7.4
Atomorbitale, Hybridwellenfunktionen
Wir werden jetzt eine interessante Anwendung des Superpositionsprinzips kennenlernen: sie betrifft die Atomorbitale und Hybridwellenfunktionen, die in der organischen Chemie und der
Festkörperphysik eine wichtige Rolle spielen. Wir gehen wieder von den Wellenfunktionen
des Wasserstoffatoms aus, obwohl diese nur eine grobe Näherung der Wellenfunktionen eines
Mehrelektronen-Atoms darstellen. Gemäß Gl. (6.17) haben sie die Gestalt
ψnlm (r, θ, ϕ) = Rnl (r) Ylm (θ, ϕ)
(7.15)
mit der Radialfunktion Rnl (r), die die Dichte der Elektronenwolke in Abhängigkeit vom Kernabstand r beschreibt, und der Kugelfunktion Ylm (θ, ϕ), die die Verteilung der Elektronenwolke
in Abhängigkeit vom Polarwinkel θ und Azimutwinkel ϕ beschreibt. Um die kovalente Bindung
und die räumliche Struktur mehratomiger Moleküle zu erklären, erweist es sich als zweckmäßig,
Linearkombinationen der Kugelfunktionen zu bilden.
81
Atomorbitale
Zunächst definieren wir die sog. Atomorbitale für die beiden Werte l = 0 und l = 1 der
Bahndrehimpulsquantenzahl. Diese werden mit den Buchstaben s bzw. p gekennzeichnet.
1
s(θ, ϕ) = Y00 (θ, ϕ) = √
4π
r
1
3
px (θ, ϕ) = √ [Y1,1 (θ, ϕ) + Y1,−1 (θ, ϕ)] =
sin θ cos ϕ
4π
2
r
3
1
√ [Y1,1 (θ, ϕ) − Y1,−1 (θ, ϕ)] =
py (θ, ϕ) =
sin θ sin ϕ
4π
i 2
r
3
cos θ
pz (θ, ϕ) = Y10 (θ, ϕ) =
4π
(7.16a)
(7.16b)
(7.16c)
(7.16d)
Die s-Funktion ist unabhängig von den Winkeln und somit kugelsymmetrisch, während die
drei p-Funktionen Elektronendichteverteilungen ergeben, die längs der Koordinatenachsen x, y,
z ausgerichtet sind. Die räumliche Orientierung der Atomorbitale wird in Abb. 7.3 gezeigt.
Aufgetragen wird das Absolutquadrat der Wellenfunktion in einem Polardiagramm; dies wird
in Abb. 7.4 für die Funktion pz (θ) gezeigt.
Abbildung 7.3: Die Atomorbitale s, px , py und pz . Die Plus- und Minuszeichen geben die Vorzeichen
der Wellenfunktionen an.
Abbildung 7.4: Polardiagramm des Atomorbitals pz (θ). Aufgetragen ist |pz (θ)|2 als Funktion des
Winkels θ. Das Diagramm ist rotationssymmetrisch um die z-Achse.
82
Hybridfunktionen
Die organische Chemie ist die Chemie der Kohlenwasserstoffe. Das C-Atom hat eine mit zwei
Elektronen besetzte K-Schale (n = 1), die fest an den C-Kern gebunden sind und nicht an
chemischen Bindungen teilhaben. In der L-Schale (n = 2) befinden sich vier Elektronen, bei
einem freien C-Atom ist die Struktur 2s2 und 2p2 . Die Energiewerte der 2s- und der 2p-Niveaus
sind zwar unterschiedlich (die beim Wasserstoff beobachtete Entartung ist hier aufgehoben),
sie liegen aber nah beieinander. In chemischen Verbindungen gibt es Verschiebungen der atomaren Energieniveaus, so dass Superpositionen der 2s- und 2p-Wellenfunktionen möglich werden. Diese nennt man Hybridfunktionen. Davon gibt es drei wichtige Typen: die sp-, sp2 und sp3 -Hybridfunktionen. Diese Funktionen und ihre Bedeutung für die räumliche Struktur
mehratomiger Moleküle werden in der Vorlesung Struktur der Materie genauer diskutiert. Hier
wollen wir uns auf die sp3 -Hybridisierung beschränken. Mit dem s-Orbital und den px -, py - und
pz Orbitalen werden vier unabhängige Hybridfunktionen gebildet:
Molekülphysik
1
( s + px (θ, ϕ) + py (θ, ϕ) + pz (θ) )
sp 312-Orbitale
ψ2 (θ, ϕ) =
( s + px (θ, ϕ) − py (θ, ϕ) − pz (θ) )
2
1
( s − px (θ, ϕ) + py (θ, ϕ) − pz (θ) )
ψ3 (θ, ϕ) =
Tetraederstruktur
2
1 Beispiel CH4 (Methan)
( s − px (θ, ϕ) − py (θ, ϕ) + pz (θ) )
ψ4 (θ, ϕ) =
2 1 C 1s 2 2s 2 2p 2 + 4 H 1s
Mehratomige Moleküle
ψ1 (θ, ϕ) =
Ψ1 =
Ψ2 =
Ψ3 =
Ψ4 =
(7.17a)
(7.17b)
(7.17c)
(7.17d)
√ 1
s + 3pz
2
!
r
1
8
1
px − √ pz
s+
2
3
3
r
√
1
2
s−
px + 2py −
2
3
r
√
1
2
s−
px − 2py −
2
3
Einführung
in die Struktur der Materie
Abbildung 7.5: Die vier
sp3 -Hybridfunktionen.
Diese Funktionen sind räumlich ausgerichtet und weisen von der Mitte einer aus vier gleichseitigen Dreiecken gebildeten Pyramide zu den vier Eckpunkten. Setzt man an jeden dieser
Bindungsarme ein H-Atom, so bekommt man die Struktur des CH4 -Moleküls (Methan), siehe
Abb. 7.6. Auch in Germanium- und Siliziumkristallen spielen die sp3 -Hybridfunktionen eine
wichtige Rolle.
7.5
Didaktische Anmerkungen:
wie sähe die Welt ohne das Pauliprinzip aus?
Text fehlt noch
83
1
√ pz
3
1
√ pz
3
!
!
Molekülphysik
Mehratomige Moleküle
sp 3 Festkörper
sp 3 Hybridorbitale sind in einigen weiteren Elementen wie z.B. Si für
die kovalente Bindung verantwortlich
4 e− pro Si Atom in sp 3 Orbital
Si
Nachbaratom gibt auch 1 e−
pro sp 3 Orbital
⇒ alle Orbitale besetzt ⇒ C
Isolator; Si, Ge Halbleiter
Si
Energie pro Bindung
C-C
Si-Si
Ge-Ge
3.6 eV
1.8 eV
1.6 eV
Si
Si
Abbildung 7.6: Links: die
Struktur
des Methanmoleküls
CH4 . Rechts: ein Si-Atom in einem
Einführung
in die Struktur
der Materie
123 SiliziumEinkristall und seine vier nächsten Nachbarn.
84
Kapitel 8
Feinstruktur und optische Übergänge
Nur für sehr wenige Fälle von praktischer Bedeutung ist die Schrödinger-Gleichung analytisch
lösbar. Aus diesem Grund ist es wichtig, dass ausgefeilte Näherungsmethoden existieren. Die
Störungsrechnung beruht auf der Annahme, dass der Hamilton-Operator des gegebenen Systems
sich von dem Operator eines analytisch lösbaren Systems nur um eine kleine Störung unterscheidet:
b =H
b (0) + H
b (1) .
H
(8.1)
b (1) zeitlich konstant. Diese
Bei der zeitunabhängigen Störungsrechnung ist der Zusatzterm H
Methode wird angewandt, um die Änderung der Energieniveaus und Wellenfunktionen von stationären Zuständen zu berechnen. Wir werden die zeitunabhängige Störungsrechnung zur Berechnung der Feinstruktur im Wasserstoffatom benutzen. Die zeitabhängige Störungsrechnung
ist geeignet für Probleme, bei denen das System von einem stationären Zustand in einen anderen übergeht. Insbesondere sind dies optische Übergänge in Atomen. Auch die Streuung von
α-Teilchen oder Elektronen an Atomkernen lässt sich damit berechnen.
8.1
Zeitunabhängige Störungsrechnung
Wir diskutieren hier nur die erste Ordnung der Störungsrechnung. In der ersten Ordnung bleiben
die Eigenfunktionen gleich, aber die Eigenwerte ändern sich. In der zweiten Ordnung ändern
sich auch die Eigenfunktionen, doch das soll hier nicht behandelt werden; wir verweisen auf
Standard-Lehrbücher der theoretischen Physik, z.B. W. Greiner, Quantenmechanik.
8.1.1
Näherungsweise Lösung der Schrödingergleichung
Die Eigenfunktionen des ungestörten Hamilton-Operators seien bekannt
b (0) ψn(0) = En(0) ψn(0) .
H
(8.2)
b n = En ψn
Hψ
(8.3)
In den folgenden Rechnungen wird vorausgesetzt, dass die Energiewerte nicht entartet sind (d.h.
verschiedene Eigenfunktionen haben auch verschiedene Eigenwerte). Um die Gleichung
näherungsweise zu lösen, machen wir den Ansatz
b = H
b (0) + H
b (1)
H
ψn = ψn(0) + ψn(1) + ψn(2) + . . .
En =
En(0)
+
En(1)
85
+
En(2)
+ ... ,
(8.4)
b (j) , ψn(j) , En(j) , proportional zu
wobei angenommen wird, dass die Terme der Ordnung j, also H
εj sind, wobei 0 < ε 1 eine kleine Zahl ist. Dies bedeutet, dass die Terme mit j > 0 nur
kleine Korrekturen der Grundterme j = 0 darstellen. Einsetzen in Gl. (8.3) und Sortieren nach
Potenzen von ε ergibt:
Nullte Ordnung:
b (0) ψn(0) = En(0) ψn(0) .
H
(8.5)
Dies ist die Eigenwertgleichung des ungestörten Hamilton-Operators.
Erste Ordnung:
b (0) ψn(1) + H
b (1) ψn(0) = En(0) ψn(1) + En(1) ψn(0) .
H
(8.6)
Die zweite Ordnung wird hier nicht betrachtet.
8.1.2
Energieverschiebung in der 1. Ordnung
Wir schreiben die Gl. (8.6) in Dirac-Notation
b (0) |ψ (1) i + H
b (1) |ψ (0) i = E (0) |ψ (1) i + E (1) |ψ (0) i
H
n
n
n
n
n
n
(0)
und bilden das Skalarprodukt mit dem “bra”-Vektor hψn | :
b (0) |ψn(1) i + hψn(0) |H
b (1) |ψn(0) i = En(0) hψn(0) |ψn(1) i + En(1) hψn(0) |ψn(0) i .
hψn(0) |H
(8.7)
b (0) hermitesch ist (siehe Anhang D) , gilt
Da H
b (0) |ψ (1) i = hH
b (0) ψ (0) |ψ (1) i = E (0) hψ (0) |ψ (1) i .
hψn(0) |H
n
n
n
n
n
n
(0)
(0)
Wenn man dies in (8.7) einsetzt und hψn |ψn i = 1 benutzt, folgt für die Energieverschiebung
in der 1. Ordnung
(1)
(0) b (1) (0)
δEn ≡ En = hψn |H
|ψn i
(8.8)
Dies ist eine der wichtigsten Gleichungen der quantenmechanischen Störungsrechnung: In der 1.
Ordnung ist die Energieverschiebung der Niveaus gleich dem Erwartungswert des Störoperators,
gebildet mit der Wellenfunktion der 0. Ordnung, also der ungestörten Wellenfunktion.
8.2
Feinstruktur im H-Atom
In Kapitel 6 haben wir gezeigt, dass im Rahmen der nichtrelativistischen Quantenmechanik
die Energieniveaus im H-Atom nur von der Hauptquantenzahl n abhängen. Um die mit hochauflösender Spektroskopie beobachtete Feinstruktur zu erklären, muss man relativistische Korrekturen und die sog. Spin-Bahnkopplung berücksichtigen. Beide Effekte lassen sich mit der
Störungstheorie behandeln.
8.2.1
Die relativistische Massenänderung
Die kinetische Energie eines relativistischen Elektrons mit Impuls p ist
p
Ekin = p2 c2 + m2e c4 − me c2
(8.9)
Im H-Atom ist die kinetische Energie maximal 13.6 eV und damit sehr klein im Vergleich zur
Ruheenergie me c2 = 0.511 · 106 eV. Man kann die Wurzel hier in eine Taylorreihe entwickeln:
p
√
p2 c2 + m2e c4 = me c2 1 + x
mit
x=
= me c2 (1 + x/2 − x2 /8 . . .)
86
p2 c2
1
m2e c4
Bis zur 2. Ordnung der Taylorreihe erhalten wir
Ekin =
p4
p2
−
,
2me 8m3e c2
(8.10)
wobei der erste Term die nichtrelativistische kinetische Energie ist und der zweite Term als kleine
Störung angesehen werden kann. Der Hamilton-Operator wird
b =H
b (0) + H
b (1)
H
mit
2
2
b (0) = pb − e
H
,
2me 4πε0 r
4
b (1) = − pb
H
8m3e c2
(8.11)
Gemäß Gl. (8.8) ist die Verschiebung der Energieniveaus in 1. Ordnung der Störungsrechnung
b (1) |ψ (0) i .
En(1) = hψn(0) |H
n
Wie in Anhang H gezeigt wird, ist die Energieverschiebung aufgrund der relativistischen Massenänderung
me c2 α4
1
3
δEnM asse = −
−
.
(8.12)
2n3
l + 1/2 4n
Dabei ist
α=
1
e2
≈
4πε0 ~c
137
(8.13)
die dimensionslose Feinstrukturkonstante.
8.2.2
Spin-Bahn-Kopplung
Für Bahndrehimpulse l > 0 ruft die Bahnbewegung ein Magnetfeld hervor, in dem das magnetische Eigenmoment des Elektrons zwei Einstellungen hat, die sich energetisch unterscheiden. Die
daraus resultierende Energie-Aufspaltung der Niveaus im H-Atom soll nun berechnet werden.
Klassische Berechnung des Magnetfeldes der Bahnbewegung
Wir benutzen das Bohrsche Atommodel und betrachten ein Koordinatensystem, in dem das
Elektron ruht und vom Proton umkreist wird. Nach dem Biot-Savart-Gesetz (s. Theorie B) ist
das vom Proton erzeugte Magnetfeld
B=
µ0 e r × v
4π r3
Dabei ist r der Radiusvektor vom Elektron zum Proton und v die Geschwindigkeit des Protons.
Die Rücktransformation in das Laborsystem ist kompliziert und ergibt einen Faktor 1/2 (es
tritt dabei sie sog. Thomas-Präzession auf, s. Eisberg-Resnick Quantum Physics, App. J). Das
Magnetfeld der Bahnbewegung am Ort des Elektrons wird damit
B=
µ0 e r × v
µ0 e
=
L
3
8π r
8πme r3
(8.14)
Berechnung der Energieaufspaltung
Die potentuelle Energie des magnetischen Moments µe des Elektrons in diesem Feld ist
Epot = −µe · B =
87
µ0 e 2
L·S
8πme r3
(8.15)
Dieser Energieterm wird als Störung in den Hamiltonoperator aufgenommen. Wir schreiben
also
b =H
b (0) + H
b (1)
H
mit
2
2
b (0) = pb − e
H
,
2me 4πε0 r
b (1) =
H
µ0 e 2 b b
L·S
8πme r3
(8.16)
b (1) gemäss Gl. (8.8) ist aufwändig und wird in
Die Berechnung des Erwartungswerts von H
Anhang H durchgeführt. Die Energieverschiebung aufgrund der Spin-Bahn-Kopplung ergibt
sich zu
me c2 α4
l
für j = l + 1/2
SB
δEn = 3
·
(8.17)
(−l − 1) für j = l − 1/2
4n l(l + 1/2)(l + 1)
Auch diese Energieverschiebung ist ein relativistischer Effekt, da Magnetfelder und magnetische
Momente relativistische Effekte sind. Addiert man die beiden Energieverschiebungen, so findet
man ein bemerkenswertes Resultat: die Feinstruktur ist nur von n und j abhängig, aber nicht
von l:
me c2 α4
1
3
M asse
SB
δEn = δEn
+ δEn = −
·
(8.18)
−
2n3
j + 1/2 4n
Dies ist ein sehr befriedigendes Resultat aus theroretischer Sicht, denn der gestörte Hamilb·S
b nicht mehr mit L
b vertauschbar. Das bedeutet, die
tonoperator ist aufgrund des Terms L
Quantenzahl l des Bahndrehimpulses ist nicht mehr wohldefiniert. Der gestörte Hamiltonopeb+S
b vertauschbar, so dass j gemessen werden
rator ist aber mit dem Gesamtdrehimpuls Jb = L
kann. Die Feinstruktur des 1s-Niveaus und der 2s-, 2p-Niveaus von Wasserstoff wird in Abb. 8.1
gezeigt. Sie liegt in der Größenordnung von 10−4 eV.
Abbildung 8.1: Feinstruktur der 1s-, 2s- und 2p-Niveaus im H-Atom.
Die Diracgleichung ist die relativistische Verallgemeinerung der Schrödingergleichung. Sie
hat eine große Vorhersagekraft. Die relativistische Massenänderung des Elektrons wird automatisch berücksicht, aber darüber hinaus sagt die Diracgleichung auch den Spin 1/2 des Elektrons
und sein korrektes magnetisches Moment voraus. Formel (8.18) ist in Übereinstimmung mit der
Ergebnis der Diracgleichung. Die Energiewerte des H-Atoms gemäss der Diracgleichung (DG)
können aus den Energiewerten der Schrödingergleichung (SG) wie folgt berechnet werden
1
3
α2
DG
SG
−
(8.19)
En,j = En · 1 +
n
j + 1/2 4n
88
Wir weisen darauf hin, dass es noch wesentlich feinere Strukturen in Atomen gibt: die Hyperfeinstruktur, hervorgerufen durch Wechselwirkung des Elektrons mit dem magnetischen Moment
des Atomkerns, und die Korrekturen durch die Quantenelektrodynamik (Vakuum-Polarisation,
Lamb-Verschiebung).
8.3
Emission und Absorption von Strahlung
In diesem Abschnitt gehen wir auf ein zentrales Thema der Quantentheorie ein, den Übergang
eines Elektrons von einem Energieniveau auf ein anderes unter dem Einfluss elektromagnetischer Strahlung. Die korrekte Behandlung ist überaus kompliziert, man muss dafür auch das
Strahlungsfeld quantisieren und kommt damit zur Quantenelektrodynamik (QED), der Quantentheorie des elektromagnetischen Feldes und seiner Wechselwirkungen mit geladenen Teilchen.
Die QED enthält auch die Dirac-Gleichung als relativistisch korrekte Verallgemeinerung der
Schrödinger-Gleichung.
8.3.1
Absorption, stimulierte und spontane Emission
Als einfaches Beispiel betrachten wir Atome, die nur zwei Energieniveaus E1 und E2 haben.
Wenn sich bei einem Atom das Elektron im angeregten Zustand E2 befindet, so gibt es eine gewisse Wahrscheinlichkeit pro Zeiteinheit A dafür, dass es von selbst (spontan) nach E1 übergeht
und dabei ein Photon der Energie ~ω = E2 − E1 emittiert wird. Diesen Vorgang nennt man
spontane Emission.
Die Zahl der angeregten Atome erniedrigt sich in der Zeit dt durch spontane Emission um
dN2 = −N2 A dt .
Daraus folgt das auch für die radioaktiven Kernzerfälle typische exponentielle Zerfallsgesetz
N2 (t) = N2 (0) e−At = N2 (0) e−t/τ .
(8.20)
Die charakteristische Zeitkonstante τ nennt man die mittlere Lebensdauer; es ist die Zeit, in
der die Zahl der angeregten Atome durch spontane Übergänge auf 1/e = 37% der Anfangszahl
abgesunken ist. Für “erlaubte optische Übergänge” (siehe unten) ist typischerweise τ ≈ 10−8 s.
Wenn bereits Strahlung der Frequenz ω vorhanden ist, kann ein Elektron auch unter dem
Einfluss des Strahlungsfeldes von E2 nach E1 übergehen. Dies ist die stimulierte (oder induzierte)
Emission. Befindet sich das Elektron im Grundzustand, so kann es durch die Strahlung in
den angeregten Zustand gehoben werden, wobei ein Photon absorbiert wird (Absorption). In
Abb. 8.2 sind die drei mit Photon-Emission oder -Absorption verknüpften Prozesse schematisch
dargestellt.
Beim Gamma-Zerfall der Atomkerne spielen nur die spontanen Übergänge eine Rolle. Im optischen und erst recht im Infrarot- und Mikrowellen-Bereich werden die stimulierten Emissionsprozesse zunehmend wichtig.
Wir werden im Folgenden sehen, dass die elementaren Wahrscheinlichkeiten für Absorption und stimulierte Emission gleich sind. Es ist aber nicht so einfach, einen generell gültigen
Zusammenhang zwischen der spontanen und der stimulierten Emission herzustellen.
8.3.2
Optische Übergänge in der Schrödinger-Quantenmechanik
Im Rahmen der Schrödinger-Quantenmechanik werden optische Übergänge durch eine “semiklassische” Methode erfasst: die Elektronen im Atom werden quantentheoretisch durch die
89
Abbildung 8.2: Absorption, induzierte (stimulierte) Emission und spontane Emission eines Photons. In
allen drei Fällen ist ~ω = E2 − E1 .
Wellenfunktionen ψ beschrieben, während das elektromagnetische Strahlungsfeld als klassisches
oszillierendes Feld behandelt wird. Das elektrische Feld der Welle hat die Form
E(t) = E 0 cos ω0 t =
E 0 iω0 t
(e
+ e−iω0 t ) .
2
(8.21)
Die Frequenz muss eine Resonanzbedingung erfüllen
~ω0 ≈ |Ef − Ei | ,
(8.22)
wobei eine gewisse Unschärfe zugelassen ist in Einklang mit der Unschärferelation. Die Indizes i, f kennzeichnen den Anfangs- und Endzustand (initial state, final state) des atomaren
Elektrons. Ein wesentliches Ergebnis der halbklassischen Methode ist, dass zwei der oben eingeführten Prozesse möglich sind: die stimulierte Emission und die Absorption. Wir werden
zeigen, dass beide Prozesse die gleiche Wahrscheinlichkeit haben. Bemerkenswert ist, dass die
spontane Emission, bei der ein angeregtes Atom “von selbst” in einen tiefer liegenden Zustand
oder den Grundzustand übergeht unter Emission eines Photons, nicht mit der im nächsten Anschnitt präsentierten Störungsrechnung beschrieben werden kann. Die korrekte Erklärung der
spontanen Emission ist nur mit Hilfe der QED möglich, wir werden in Kap. 8.6 eine vereinfachte
Darstellung bringen.
8.4
Anwendung der zeitabhängigen Störungsrechnung
Die Eigenlösungen der Schrödinger-Gleichung des H-Atoms oder anderer gebundener Systeme
beschreiben stationäre Zustände: Wenn sich das Elektron zum Zeitpunkt t = 0 im Zustand
Ψn,l,ml (r, t) = ψn,l,ml (r, θ, ϕ) · e−iωn t
befindet, wird es zu beliebigen späteren Zeiten auch genau in diesem Zustand sein. Der Grund
ist, dass die Wahrscheinlichkeitsdichte ρ(r) = |Ψ|2 unabhängig von der Zeit ist, ein Übergang
in einen anderen Zustand kann nicht vorkommen1 . Damit ist ein zentrales Postulat des Bohrschen Atommodells in Frage gestellt, nämlich die Emission oder Absorption von Strahlung bei
dem Übergang von einem stationären Zustand zu einem anderen. Übergänge können durch ein
elektromagnetisches Wechselfeld der Form (8.21) induziert werden. Im optischen Bereich kann
1
Wenn sich das Elektron anfangs in einem Superpositionszustand befindet, z.b. Ψ(r, t) = ca Ψa (r, t) +
cb Ψb (r, t), wobei a, b die Quantenzahlen der Eigenzustände kennzeichnen, so wird das Teilchen periodisch zwischen
den Zuständen Ψa und Ψb hin- und herwandern.
90
dieses Feld als räumlich homogen angesehen werden, da die optische Wellenlänge fast einen Faktor 1000 größer als der Atomradius ist. In einem räumlich homogenen elektrischen Wechselfeld
ist die potentielle Energie des Elektrons durch den einfachen Ausdruck
V 0 (t) = e E(t) · r =
e
(E0 · r) (eiω0 t + e−iω0 t )
2
(8.23)
gegeben, so dass der Hamilton-Operator nun lautet
b
b (0) + H
b (1) (t)
H(t)
=H
mit
2
2
b (0) = − ~ ∇2 − e
b (1) (t) = V 0 (t) .
H
, H
2me
4πε0 r
(8.24)
Wir lassen das Feld nur für eine kurze Zeit 0 < t < T einwirken. Wie wir in Anhang A.4.2
zeigen, bewirkt diese Begrenzung auf ein endliches Zeitintervall, dass die elektromagnetische
Strahlung nicht mehr exakt monochromatisch ist, sondern ein endliches Frequenzband ω0 ± ∆ω
überstreicht mit ∆ω ≈ π/T . Zum Zeitpunkt t = 0 sei das Elektron im Zustand Ψi (initial state,
i ≡ (n, l, ml )i ). Im Zeitbereich 0 < t < T muss die Wellenfunktion die Schrödinger-Gleichung
i~
∂Ψ
b (0) + V 0 (t))Ψ
= (H
∂t
(8.25)
b (0) . Wir können sie aber (bei einer “kleinen”
erfüllen und ist daher keine Eigenfunktion von H
Störung) als Linearkombination der Eigenfunktionen mit zeitabhängigen Koeffizienten ansetzen,
da die Eigenfunktionen ein vollständiges Orthonormalsystem bilden:
X
Ψ(r, t) = ci (t)Ψi (r, t) +
cj (t)Ψj (r, t)
(8.26)
j6=i
mit der Anfangsbedingung ci (0) = 1, cj (0) = 0. Der gewünschte Endzustand (final state) Ψf
befindet sich unter den Ψj .
Die weiteren Rechnungsschritte sind in Anhang H zu finden. Für den Koeffizienten des
gewünschten Endzustands Ψf findet man den Ausdruck
"
#
e
ei(ωf i +ω0 )T − 1) ei(ωf i −ω0 )T − 1
i~cf (T ) = (E0 · r f i ) ·
+
2
i(ωf i + ω0 )
i(ωf i − ω0 )
Dabei ist
rf i =
ZZZ
mit ωf i =
ψf∗ (r)rψi (r)d3 r
Ef − Ei
~
(8.27)
(8.28)
das sog. “Matrixelement” des elektrischen Dipolmoments. An dieser Stelle ist es zweckmässig,
die beiden Fälle Ef > Ei und Ef < Ei getrennt zu behandeln.
8.4.1
Absorption
Es sei
Ef > Ei
⇒
ωf i > 0 .
Der zweite Term in der eckigen Klammer von Gl. (8.27) hat einen Resonanznenner bei ω0 = ωf i
und dominiert bei dieser Frequenz. Mit der Hilfsvariablen u = (ωf i − ω0 )T /2 wird
e
sin u
.
i~cf (T ) = (E0 · r f i ) · T · eiu ·
2
u
91
(8.29)
Die Wahrscheinlichkeit, das Elektron am Ende der Wechselwirkung im Endzustand Ψf zu finden,
ist
e2
sin2 u
|cf (T )|2 = 2 |(E0 · r f i )|2 · T 2
.
(8.30)
4~
u2
Die Funktion sin2 u/u2 hat ihr Maximum bei u = 0, also bei ω0 = ωf i .
Das Ergebnis der Störungsrechnung ist: Damit der Absorptionsvorgang auftreten kann, muss
die mittlere Quantenenergie ~ω0 der Strahlung näherungsweise gleich der Energiedifferenz der
Ef − Ei der atomaren Niveaus sein:
~ω0 ≈ ~ωf i = Ef − Ei
(8.31)
Die endliche Breite der Kurve sin2 u/u2 hat aber zur Folge, dass ω0 sich ein wenig von der
Übergangsfrequenz ωf i unterscheiden darf. Die Frequenzunschärfe ist ∆ω ≈ π/T , und die
Unsicherheit in der Zeit ist ∆t ≈ T /2. Daraus folgt
π
∆Ephot · ∆t ≈ ~ ,
2
in Einklang mit der Energie-Zeit-Unschärferelation.
Wir erkennen an diesem Beispiel, dass bei strahlungsinduzierten atomaren Übergängen die
Energie nur näherungsweise erhalten ist, sofern man für die Quantenenergie der Strahlung den
mittleren Wert ~ω0 einsetzt. Experimentell wird man den Absorptionsvorgang mit Laserstrahlung untersuchen, die natürlich immer auf ein endliches Zeitintervall T eingeschränkt ist. Man
kennt die mittlere Frequenz ω0 der Strahlung genau, aber die Frequenz ω eines Photons, welches
den atomaren Übergang auslöst, ist nur mit einer Unschärfe von ∆ω ≈ π/T bekannt. Eine
weitere Energieunschärfe folgt aus der endlichen Lebensdauer angeregter Atomniveaus, die eine
gewisse Unschärfe der Energie Ef zur Folge hat. Ähnliche Energieunschärfen findet man bei
1
sin( u )
u
2
0.5
0
2
1
0
1
2
u
π
Abbildung 8.3: Die Funktion (sin u/u)2 .
Streuprozessen.
8.4.2
Stimulierte Emission
Für den Fall
Ef < Ei
⇒
ωf i < 0
dominiert der erste Term in der eckigen Klammer von Gl. (8.27) und hat einen Resonanznenner
bei ω0 = |ωf i | (die Frequenz des eingestrahlten Feldes ist natürlich immer positiv). Mit der
neuen Hilfsvariablen u0 = (ωf i + ω0 )T /2 wird
|cf (T )|2 =
e2
sin2 u0
|(E0 · r f i )|2 · T 2
.
2
4~
u02
92
(8.32)
Die stimulierte Emission erfordert also genau wie die Absorption die ungefähre Erhaltung der
Energie im Rahmen der Unschärferelation
Ei + ~ω0 ≈ Ef + 2~ω0 ,
wenn man für die Photonen-Energie den mittleren Wert ~ω0 einsetzt.
Was lernen wir aus diesen Rechnungen?
• Eine periodische Störung kann nur dann zu einem Übergang Ei → Ef führen, wenn die
Resonanzbedingung erfüllt ist
~ω0 ≈ |Ef − Ei | .
• Es gibt eine Energieunschärfe in Einklang mit der Unschärferelation
∆E · ∆t ≥ ~ .
• Es gibt den Vorgang der Absorption (für Ei < Ef ) und der stimulierten Emisson (für
Ei > Ef ), beide haben die gleiche Wahrscheinlichkeit.
• Die Übergangsamplitude ist proportional zum Übergangsmatrixelement (8.28) des elektrischen Dipolmoments
ZZZ
ψf∗ (r) r ψi (r)d3 r .
e rf i = e
Die hier betrachteten Strahlungsübergänge nennt man elektrische Dipolübergänge, weil das Matrixelement e r f i des elektrischen Dipolmoments eingeht. Der mathematische Grund ist, dass
wir das elektrische Feld als räumlich konstant angenommen haben. Für optische Übergänge in
Atomen ist dies gerechtfertigt, denn die typischen Lichtwellenlängen sind sehr viel grösser als
der Atomradius. Die γ-Strahlung der Atomkerne wird jedoch nicht durch Dipolübergänge verursacht, da im Kern nur positiv geladene und neutrale Teilchen existieren und daher das elektrische
Dipolmoment identisch null ist. Die dominanten γ-Übergänge sind elektrische Quadrupol- und
magnetische Dipol-Übergänge.
8.5
Auswahlregeln für optische Übergänge
Ein elektrischer Dipolübergang kann nur dann auftreten, wenn das Matrixelement e r f i 6= 0 ist.
Man kann generell beweisen, dass sich hieraus folgende Regeln für die Änderung der Bahndrehimpulsquantenzahl l und der magnetischen Quantenzahl m = ml ergeben
∆l = lf − li = ±1
∆m = mf − mi = 0, ±1 .
(8.33)
(Zur Vereinfachung schreiben wir hier m statt ml , um zu viele Indizes zu vermeiden). Ein sehr
wichtiges Resultat, das aber merkwürdigerweise in kaum einem Lehrbuch hervorgehoben wird,
ist der Befund, dass die Hauptquantenzahl keiner Einschränkung unterliegt:
∆n = 0, ±1, ±2, . . . .
(8.34)
Dies ist die wesentliche Voraussetzung für die Existenz der Spektralserien, etwa der Balmerserie
im Wasserstoff, die den Übergängen En → E2 mit n = 3, 4, 5, 6, . . . entspricht. Die Übergangsmatrixelemente werden in Anhang H berechnet.
93
8.6
Die Einstein-Koeffizienten
Von Albert Einstein wurde schon im Jahr 1917, lange vor Entstehung der Quantenmechanik, ein
Zusammenhang zwischen Emissions- und Absorptionsvorgängen im thermodynamischen Gleichgewicht gefunden. Um konsistente Resultate zu erhalten, musste Einstein dabei den Prozess der
stimulierten (induzierten) Emission “erfinden”, der zu dieser Zeit unbekannt war. Wir betrachten elektromagnetische Strahlung im thermodynamischen Gleichgewicht mit erhitzter Materie
der absoluten Temperatur T (Beisp. Sonne, das Innere eines Hochofens, näherungsweise eine
Glühlampe). Es wird dann ein kontinuierliches Frequenzspektrum emittiert, dessen spektrale
Energiedichte durch die Plancksche Strahlungsformel gegeben ist:
ρ(ω) =
ω2
~ω
·
.
2
3
π c exp ~ω − 1
kB T
(8.35)
Die Photonen können beliebige Frequenzen, Richtungen und Polarisation haben. Es gibt daher
ausserordentlich viele verschiedene Zustände für die Photonen. Nehmen wir an, wir hätten
Atome mit zwei Niveaus E1 und E2 , die sich zusammen mit der Strahlung in einem Kasten
befinden. Die Wahrscheinlichkeit für Absorption E1 → E2 ist proportional zur Energiedichte
ρ(ω) der Strahlung bei der Frequenz ω = (E2 − E1 )/~
Wabs = B12 ρ(ω) .
(8.36)
Die Emission hat zwei Anteile: Die stimulierte Emission ist proportional zu ρ(ω), die spontane
Emission ist unabhängig von der vorhandenen Strahlungsdichte
Wem = Wstim + Wspont = B21 ρ(ω) + A21 .
(8.37)
Die Zahl N2 der Atome im oberen Niveau erhöht sich durch Absorption und vermindert sich
durch Emission von Photonen:
dN2
= Wabs N1 − Wem N2 = B12 ρ(ω) N1 − (B21 ρ(ω) + A21 ) N2 .
dt
(8.38)
Im thermodynamischen Gleichgewicht ist dN2 /dt = 0, und gemäß der Boltzmannverteilung gilt
N1
~ω
E2 − E1
= exp
= exp
.
N2
kB T
kB T
Setzen wir dies in (8.38) ein, so folgt B12 ρ(ω) exp[~ω/(kB T )] = A21 + B21 ρ(ω) und daher
ρ(ω) =
A21 /B12
.
exp[~ω/(kB T )] − B21 /B12
(8.39)
Durch Vergleich mit der Planck-Strahlungsformel (8.35) finden wir:
B21 = B12
und A21 =
~ω 3
B21 .
π 2 c3
(8.40)
Die erste Gleichung besagt, dass die Wahrscheinlichkeiten für Absorption und stimulierte Emission gleich sind. Wir wissen dies bereits aus der störungstheoretischen Behandlung. Die zweite
Gleichung stellt einen Zusammenhang zwischen der stimulierten und spontanen Emission im
thermodynamischen Gleichgewicht her:
Wstim
B21 ρ(ω)
1
=
=
.
Wspont
A21
exp[~ω/(kB T )] − 1
94
(8.41)
Die Lichtwellen im Kasten werden durch optische Eigenschwingungen dargestellt. Jede Eigenschwingung verhält sich wie ein harmonischer Oszillator, dessen Energie den Wert (n + 1/2)~ω
hat, wobei n die Zahl der Photonen in dieser Eigenschwingung ist. Im thermodynamischen
Gleichgewicht ist die mittlere Zahl dieser Photonen
n=
1
exp[~ω/(kB T )] − 1
(8.42)
und die mittlere Energie eines harmonischen Oszillators (abzüglich der Nullpunktsenergie ~ω/2)
E=
~ω
≡ n ~ω .
exp[~ω/(kB T )] − 1
(8.43)
Damit können wir schreiben
Wstim = n Wspont .
(8.44)
Zwei Fälle sollen betrachtet werden.
(a) Hohe Frequenzen: ~ω kB T bei Raumtemperatur, T = 293 K. Dies gilt für sichtbares
Licht und Röntgen/γ-Strahlung. Die mittlere Zahl der Photonen in einem definierten Quantenzustand ist im thermodynamischen Gleichgewicht sehr klein, n 1. Die spontane Emission ist
viel wahrscheinlicher als die stimulierte Emission, was auch sofort aus Gl. (8.41) folgt.
Der Laser ist ein Gegenbeispiel, dort ist n 1. Man muss sich aber klarmachen, dass der
Laser ein System darstellt, welches extrem weit vom thermodynamischen Gleichgewicht entfernt
ist, da eine Besetzungsinversion vorliegt. Die Gleichung (8.44) ist daher nicht auf Laser anwendbar.
(b) Niedrige Frequenzen, ~ω kB T . Das gilt im Mikrowellengebiet. Dann ist n 1,
und die stimulierte Emission dominiert völlig. Ein wichtiges Beispiel mit praktischer Bedeutung ist die magnetische Kernresonanz, die genaueste Methode zur Messung von Magnetfeldern und die Grundlage der Kernspintomographie. Ein Proton hat in einem Magnetfeld B
zwei Energieniveaus E1 = −µB und E2 = +µB. Durch Einstrahlen von Hochfrequenz mit
~ω = 2µB kann man Umklappen der Spins erreichen. Für B = 1 Tesla erhält man eine Frequenz f = ω/(2π) = 40 MHz. Bei Raumtemperatur ist ~ω/(kB T ) ≈ 10−5 , d.h. die spontane
Emission ist im Vergleich zur stimulierten Emission völlig vernachlässigbar.
95
Kapitel 9
Die nichtlokale Natur der Quantentheorie
Entwurf. Hinweise und Verbesserungsvorschläge werden dankbar entgegen genommen.
9.1
Das Einstein-Podolsky-Rosen-Paradoxon
Die unanschaulichen Aspekte der Quantenphysik lassen sich zum großen Teil auf den TeilchenWelle-Dualismus zurückführen. In diesem Kapitel werden wir auf eine weitere Absonderlichkeit
eingehen, die Verschränkung (engl. entanglement), die zur Folge hat, dass die Quantenmechanik
eine nichtlokale Theorie ist.
Im Jahr 1935 wurde von Albert Einstein, Boris Podolski und Nathan Rosen (EPR) eine
berühmt gewordene Arbeit publiziert mit dem Titel Can Quantum-Mechanical Description of
Physical Reality Be Considered Complete? (Physical Review 47, p. 777, 1935), in der sie
zu der Aussage kommen, dass die Beschreibung der Wirklichkeit durch eine Wellenfunktion
unvollständig sei. Wir wollen ihre Argumentation hier nur kurz andeuten und im nächsten Abschnitt eine Variante des EPR-Gedankenexperiments diskutieren. Die Autoren betrachten zwei
Systeme 1 und 2, die nur für einen begrenzten Zeitraum 0 < t < T miteinander wechselwirken
und danach vollständig entkoppelt sind. Man kann dabei an zwei Atome denken, die zunächst
eng benachbart sind und dann sich weit voneinander entfernen. EPR argumentieren, dass es
möglich sein sollte, die Heisenbergsche Unschärferelation im System 2 zu umgehen, indem man
ausschliesslich Messungen komplementärer Größen im System 1 vornimmt. Da nach Voraussetzung zum Zeitpunkt der Messungen keinerlei Wechselwirkung zwischen den Systemen existiert,
dürfte in System 2 auch keine Veränderung eintreten als Konsequenz einer Messung, die am
System 1 vorgenommen wird. Die Schlussfolgerung von Einstein, Podolsky und Rosen ist, dass
die Quantenmechanik unvollständig sei. Sie äußern ihre Überzeugung, dass eine umfassendere
Theorie existieren sollte.
Niels Bohr hat der EPR-Argumentation widersprochen (Physical Review 48, p. 696, 1935)
und insbesondere darauf hingewiesen, dass eine Messung am System 1 doch einen Einfluss
auf System 2 hat, sofern man die Quantentheorie konsequent anwendet. Später ist das EPRParadoxon von David Bohm näher untersucht worden, wir besprechen seine Abwandlung des
EPR-Gedankenexperiments weiter unten. John Bell hat analysiert, ob es “verborgene Variable”
geben könnte, die zusätzliche Informationen enthalten, die nicht bereits in der Wellenfunktion
stecken. In diesem Fall müssten die sog. Bellschen Ungleichungen erfüllt sein. Neue experimentelle Resultate zeigen, dass die Bellschen Ungleichungen verletzt sind und dass es keine hidden
variables in der Quantentheorie gibt. Auf diese Aspekte wollen wir nicht näher eingehen.
96
9.2
Verschränkung
Wir diskutieren ein Gedankenexperiment zum EPR-Paradoxon, das auf D. Bohm und Y. Aharonov (Phys. Rev. 108, 1070 (1957)) zurückgeht. Betrachtet wird ein neutrales Molekül mit
Spin 0, das aus zwei Atomen mit Spin 1/2 aufgebaut ist1 . Ein Beispiel ist das Wasserstoffmolekül
H2 , in dem die Spins der beiden bindenden Elektronen antiparallel ausgerichtet sind. Genauer
gesagt befindet sich das Molekül im Spinsingulett-Zustand (5.34)
1
|0, 0i = √ { | ⇑i1 | ⇓i2 − | ⇓i1 | ⇑i2 }
2
(9.1)
Hierbei bedeutet der erste Term | ⇑i1 | ⇓i2 , dass Elektron 1 die Spinkomponente +~/2 in zRichtung hat und Elektron 2 die Spinkomponente −~/2. Im zweiten Term | ⇓i1 | ⇑i2 ist es
umgekehrt. Die Atome werden dann durch eine Methode getrennt, die den Spin nicht beeinflusst.
Nachdem sie sich so weit voneinander entfernt haben, so dass sie nicht mehr wechselwirken, wird
die z-Komponente des Spins von Atom 1 gemessen, der Messwert sei beispielsweise +~/2. Da
der totale Spin 0 ist, kann man unmittelbar schließen, dass die z-Komponente des Spins von
Atom 2 den entgegengesetzten Wert −~/2 haben muss.
Wenn dies ein klassisches System wäre, so würde die Antiparallelität auch für die x- und
y-Komponenten der beiden Spinvektoren gelten, da alle Komponenten des Spins zu jedem Zeitpunkt wohldefiniert sind. Im Molekül hat nämlich jede Komponente des Spinvektors von Teilchen 2 den entgegengesetzten Wert derselben Komponente des Spinvektors von Teilchen 1, und
diese Relation ändert sich nicht bei der Aufspaltung des Moleküls. Mit anderen Worten, die
beiden Spinvektoren sind korreliert. Auch bei großen Abständen kann der Spin von Atom 2
indirekt durch Messung des Spins von Atom 1 bestimmt werden, ohne dass das Atom 2 eine
Messapparatur durchläuft und ohne dass eine Wechselwirkung zwischen den beiden Atomen
vorhanden ist.
In der Quantentheorie wird das komplizierter, weil nur eine Komponente des Spinvektors
einen definierten Wert haben kann und die beiden anderen Komponenten unbestimmt sind.
Wir betrachten zunächst den Fall, dass die beiden Atome noch so nahe beieinander sind, dass
sich ihre Ortswellenfunktionen überlappen, was nach quantenmechanischem Verständnis eine
Wechselwirkung zwischen den Atomen impliziert. Könnten wir die Spinausrichtung von Atom 1
messen und würden finden, dass sein Spin nach “oben” zeigt (Zustand | ⇑i1 ), so wäre aufgrund
der Spinfunktion (9.1) klar, dass der Spin von Atom 2 nach “unten” zeigen muss (Zustand | ⇓i2 ).
In Matrixdarstellung gilt
~
Sbz =
2
1 0
0 −1
,
| ⇑i =
1
0
, | ⇓i =
0
1
Wie sieht es mit den anderen Komponenten aus? Man kann leicht zeigen, dass (9.1) auch ein
Singulettzustand bezüglich einer anderen Komponente des Spinoperators ist. Wir wählen die
x-Komponente
~
0 1
Sbx =
1 0
2
1
Es wird hier nur der Elektronen-Spin betrachtet. Die Spinausrichtung der beiden Atomkerne spielt für die
molekulare Bindung praktisch keine Rolle, und zur Vereinfachung ignorieren wir die Kern-Spins. Das ist üblich
in der Molekülphysik.
97
Die Eigenzustände von Sbx sind
| ⇒i ≡
| ⇐i ≡
1
√
2
1
√
2
1
= √ ( | ⇑i + | ⇓i )
2
1
1
= √ ( | ⇑i − | ⇓i )
−1
2
1
1
(9.2)
Der Singulettzustand bezüglich der x-Komponente lautet
1
|0, 0i(x) = √ { | ⇒i1 | ⇐i2 − | ⇐i1 | ⇒i2 }
2
(9.3)
Durch eine einfache algebraische Rechnung kann man sich davon überzeugen, dass
|0, 0i(x) = −|0, 0i
gilt. Wenn man also statt der z-Komponente die x-Komponente des Spins von Atom 1 misst
und findet, dass der Spin nach “rechts” zeigt, entsprechend dem Zustand | ⇒i1 , so zeigt der
Spin von Atom 2 automatisch nach “links” (Zustand | ⇐i2 ). Die Messung könnte aber genauso
gut ergeben, dass Atom im Zustand | ⇐i1 ist und Atom 2 im Zustand | ⇒i2 .
Die Spin-Singuletts (9.1) und (9.3) sind verschränkte Zustände (der Begriff der Verschränkung
wurde 1935 von Schrödinger geprägt). Die Spinausrichtung eines Atoms ist nicht definitiv festgelegt, sie ist aber mit der des anderen Atoms korreliert. Wie wir gerade gesehen haben, gilt
diese Korrelation für jede beliebige Komponente des Spins. Die entscheidende Frage ist, über
welche Entfernung diese Korrelation bestehen bleibt.
(a) Kurzreichweitige Korrelation
EPR machen die Annahme, dass es nur einen begrenzten Wechselwirkungsbereich gibt und
dass außerhalb dieses Bereichs die beiden Atome nichts mehr miteinander zu tun haben. Diese
Sichtweise erscheint sehr vernünftig und wurde über viele Jahrzehnte von den meisten Physikern
geteilt. Spätestens am Rande dieses Wechselwirkungsbereichs müssten die Atome sich dann
entscheiden, welche Spineinstellung sie einnehmen wollen. Entscheidet sich Atom 1 für den
Zustand | ⇑i, so nimmt automatisch Atom 2 den Zustand | ⇓i ein. Jetzt fliegen die Atome zu
ihren weit entfernten Detektoren. Die Spinfunktion des Gesamtsystems ist
| ⇑i1 | ⇓i2
(9.4)
Diese Produktfunktion ist keine verschränkte Zustandsfunktion mehr, die Spinausrichtungen der
beiden Atome sind wohldefiniert. Wenn die Stern-Gerlach-Anordungen in vertikaler Richtung
orientiert sind, wird man - wie erwartet - Atom 1 mit Spin nach oben und Atom 2 mit Spin nach
unten messen. Jetzt tut der Experimentator etwas Schreckliches: er dreht die Stern-GerlachAnordungen um 90◦ , so dass sie die Spinausrichtung in x-Richtung messen. Was kommt dabei
heraus? Wir können die Produkt-Spinfunktion (9.5) wie folgt umschreiben
| ⇑i1 | ⇓i2 =
=
1
{| ⇒i1 + | ⇐i1 } {| ⇒i2 − | ⇐i2 }
2
1
{| ⇒i1 | ⇒i2 − | ⇒i1 | ⇐i2 + | ⇐i1 | ⇒i2 − | ⇐i1 | ⇐i2 }
2
(9.5)
Aus dieser Wellenfunktion ergibt sich, dass alle vier Spinkombinationen: rechts-rechts, rechtslinks, links-rechts und links-links mit einer Wahrscheinlichkeit von jeweils 25% auftreten sollten.
98
(b) Langreichweitige Korrelation
Die Quantentheorie enthält keine Einschränkung hinsichtlich der Reichweite der Korrelation.
Wenn man die Quantentheorie ernst nimmt, muss man die verschränkte Spinfunktion
1
|0, 0i ≡ |0, 0i(z) = √ { | ⇑i1 | ⇓i2 − | ⇓i1 | ⇑i2 }
2
auch bei beliebig großen Abständen der beiden Atome verwenden. Gleichwertig damit ist die
verschränkte Singulett-Funktion bezüglich der x-Komponente des Spins
1
|0, 0i(x) = √ { | ⇒i1 | ⇐i2 − | ⇐i1 | ⇒i2 }
2
sowie eine analoge Funktion bezüglich der y-Komponente. In diesem Fall wird man auch bei
großen Abständen eine strikte Korrelation der Spins messen:
(oben-unten, unten-oben) oder (rechts-links, links-rechts).
Der Experimentator darf sogar während der Flugzeit der Atome die Orientierung seines Spindetektors ändern. Eine Kombination, die einen Gesamtspin ungleich null ergibt (oben-oben,
unten-unten, rechts-rechts, links-links) wird nie beobachtet werden, ebenso wenig wie eine Kombination der Art oben-rechts, oben-links etc.
Experimentelles Resultat: die Verschränkung hat eine lange Reichweite
Die Frage, ob die Korrelation durch verschränkte Wellenfunktionen eine kurze oder lange Reichweite hat, lässt sich nicht mit theoretischen Argumenten beantworten (die großen Gelehrten
Albert Einstein und Niels Bohr sind zu konträren Aussagen gelangt), sie muss vielmehr experimentell entschieden werden. Die Experimente mit verschränkten Photonen (siehe unten), die
insbesondere von Anton Zeilinger und Mitarbeitern durchgeführt worden sind, geben eine klare
Antwort: die Verschränkung kann sich über viele Kilometer erstrecken. Die Quantentheorie ist
damit eine nichtlokale Theorie.
Dies ist ein sehr erstaunliches Resultat. Wenn Beobachter A die Spinausrichtung von Atom 1
misst, weiss er mit Sicherheit, dass Beobachter B in exakt demselben Moment die entgegengesetzte Spinausrichtung bei Atom 2 messen würde. Die Gesetze der Relativitätstheorie scheinen
außer Kraft gesetzt, denn wenn A und B viele Kilometer voneinander entfernt sind, würde ein
Licht- oder Radiosignal von A nach B eine “lange” Zeit von vielen Mikrosekunden brauchen.
Es ist nicht verwunderlich, dass gleich nach der experimentellen Verifikation der langreichweitigen Zustandsverschränkung Spekulationen aufkamen, ob man nicht doch die Relativitätstheorie
austricksen könnte, um Signale mit Überlichtgeschwindigkeit zu übermitteln. Die generelle Meinung ist, dass dies nicht funktionieren kann. Beobachter A weiss zwar, was Beobachter B exakt
in dem Moment messen würde, in dem er seine eigene Messung durchführt, aber damit hat er
dem Beobachter B noch keine Information übermittelt, denn dieser kennt ja nicht das Ergebnis
der Messung von A. Um ihm dies mitzuteilen, braucht Beobachter A ein Standard-Signal mit der
endlichen Ausbreitungsgeschwindigkeit c = 3 · 108 m/s, z.B. einen Laserpuls. Es ist allerdings
zu vermuten, dass ausgeklügelte Anordnungen erfunden werden mit dem Ziel, diese Begrenzung
zu umgehen. Wir wagen die Prognose, dass diese Ansätze ebenso im Sande verlaufen werden
wie die Suche nach einem Perpetuum Mobile im 19. Jahrhundert. Um die Unmöglichkeit eines
Perpetuum Mobile zu beweisen, braucht man nicht auf den möglicherweise komplizierten und
schwer durchschaubaren Mechanismus einer speziellen Apparatur einzugehen: der Energieerhaltungssatz allein ist hinreichend dafür. In ähnlicher Weise kann man Informationsübertragung
mit Überlichtgeschwindigkeit ausschliessen: die Übermittlung von Information ist gekoppelt mit
99
einem Transport von Energie (das ist offensichtlich bei Radiowellen oder Laserstrahlen), und
Energietransport kann maximal mit der Geschwindigkeit c erfolgen. Wir danken Prof. Erich
Lohrmann für dies Argument.
Albert Einstein war sich bewusst, dass die Quantentheorie diese spukhafte Fernwirkung impliziert, wie er sie nannte. Er hielt das jedoch für absurd und war deshalb der Meinung, dass die
Quantentheorie nicht die letztgültige Theorie sein könne. Alle experimentellen Daten deuten
aber darauf hin, dass nicht Albert Einstein recht hatte, sondern Niels Bohr. Die Quantentheorie
ist wirklich so merkwürdig, Wellenfunktionen können sich über viele Kilometer erstrecken.
Die von EPR gemachte Annahme, dass die betrachteten Systeme 1 und 2 nach Ablauf
ihrer Wechselwirkungszeit T (also bei großer räumlicher Trennung) nichts mehr miteinander
zu tun haben und sich nicht gegenseitig beeinflussen können, äußert sich mathematisch darin,
dass die Gesamtwellenfunktion als Produkt der Einzelwellenfunktionen geschrieben wird wie in
Gl. (9.4). Bei einer Produktwellenfunktion kann man eine Messung am System 1 machen, ohne
den Zustand von System 2 zu ändern. Bei einer verschränkten Wellenfunktion wie in Gl. (9.1)
führt dagegen eine Messung am System 1 zu einer massiven Änderung der Wellenfunktion von
System 2: je nach Ausgang der Messung ist die Spinwellenfunktion entweder | ⇓i2 oder | ⇑i2 .
Es fällt schwer, dafür eine anschauliche Vorzustellung zu entwickeln.
Verschränkte Photonen
Wenn ultraviolettes Laserlicht einen nichtlinearen Kristall durchläuft, entstehen im Kristall
Lichtfelder bei niedrigeren Frequenzen2 . Im Quantenbild bedeutet dies, dass sich ein UV-Photon
in zwei rote Photonen umwandelt, wobei Energie-Erhaltung gilt: ~ω0 = ~ω1 +~ω2 . Die Photonen
werden auf zwei Kegelmänteln emittiert (s. Abb. 9.1) und sind orthogonal zueinander polarisiert. Die auf den Schnittlinien der Kegel emittierten Photonen haben die gleiche Energie und
sind in ihrer Polarisation verschränkt. Zur Messung der Polarisation werden zwei Analysatoren
Abbildung 9.1: Die Erzeugung verschränkter Photonen. Im Bild entsteht ein vertikal polarisiertes
Photon auf dem oberen Kegel und ein horizontal polarisiertes Photon auf dem unteren Kegel. Die auf
den hellblau gezeichneten Schnittlinien emittierten Photonen haben die gleiche Energie und sind in ihrer
Polarisation verschränkt.
verwendet, die um die jeweilige Strahlachse drehbar sind. Sind beide orthogonal zueinander ori2
Wir folgen hier einem Artikel von Anton Zeilinger in Spektrum der Wissenschaft, Dossier 2/10 (2010).
100
entiert, z.B. horizontal/vertikal oder vertikal/horizontal, so findet man, dass die Photonen die
genau diese Polarisationsrichtungen aufweisen. Aber auch wenn beide Analysatoren synchron
um einen beliebigen (aber gleichen) Winkel verdreht werden, misst man die zwei Photonen genau mit diesen gedrehten Polarisationen. Aus klassischer Sicht ist dies ein höchst befremdliches
Resultat. Es bedeutet, dass die Polarisationsebenen der Photonen vor ihrem Nachweis beliebig
sind und erst in dem Moment festgelegt werden, wenn eines der Photonen seinen Analysator
durchläuft. Das zweite Photon ist dann automatisch senkrecht zum ersten polarisiert. Um die
Seltsamkeit dieses Verhaltens zu illustrieren, diskutiert Zeilinger ein Gedankenexperiment mit
zwei verschränkten Würfeln. Bei jedem Wurf zeigen die Würfel eine zufällige Augenzahl, aber
wenn sie verschränkt sind, zeigen die beiden Würfel immer dieselbe Zahl.
Durch Verwendung elektro-optischer Modulatoren kann die Drehung der Polarisationsebenen
sehr schnell erfolgen, und zwar innerhalb der Flugzeit der Photonen von ihrer Quelle bis zu den
Analysatoren. Zum Zeitpunkt der Erzeugung der Photonen haben die Analysatoren eine andere
Orientierung als zum Zeitpunkt des Nachweises. Die perfekte Korrelation der Photonen wird
auch dann beobachtet, wenn der Verdrehwinkel rein zufällig eingestellt wird. Die Verschränkung
der Photonen ist über eine Strecke von 140 km experimentell nachgewiesen worden (zwischen
La Palma und Teneriffa).
9.3
Schrödingers Katze
Angeregt durch den EPR-Artikel hat Erwin Schrödinger im Jahr 1935 ein Gedankenexperiment
vorgeschlagen, dass zeigen sollte, wie im Prinzip eine mikroskopische quantenmechanische Superposition auf ein makroskopisches Objekt übertragen werden könnte. Schrödinger wollte an
diesem absurd wirkenden Beispiel die Unvollständigkeit und Unglaubwürdigkeit der Quantenmechanik demonstrieren.
Das Gedankenexperiment besagt: In einem geschlossenen Kasten befinden sich eine Katze
und ein instabiler Atomkern, der mit einer gewissen Wahrscheinlichkeit pro Zeiteinheit zerfällt.
Der Zerfall des Atomkerns werde von einem Geigerzähler detektiert. Im Falle einer Detektierung
werde Giftgas freigesetzt, welches die Katze tötet. Gemäß der Quantenmechanik befindet sich
der Atomkern in einer Superposition des angeregten und des Grundzustands. Demnach sollte
sich auch die Katze in einem Superpositionszustand befinden, lebendig und tot.
In der weiteren Diskussion halten wir uns eng an einen hervorragend geschriebenen Artikel
von Serge Haroche (Physics Today, July 1998):
Entanglement, Decoherence and the Quantum/Classical Boundary
Wie Haroche treffend bemerkt, ist die Quantenmechanik sehr verwirrend. Ein Teilchen kann
delokalisiert sein, es kann sich gleichzeitig in verschiedenen Energiezuständen befinden und es
kann sogar verschiedene Identitäten auf einmal haben. Dieses schizophrene Verhalten ist in
der Wellenfunktion codiert, die immer als Superposition von Quantenzuständen geschrieben
werden kann, von denen jeder durch eine komplexe Wahrscheinlichkeitsamplitude charakterisiert
ist. Interferenzen zwischen diesen Amplituden treten auf, wenn das Teilchen verschiedenen,
nicht unterscheidbaren Pfaden folgen kann. Jeder Versuch zu entscheiden, welcher Trajektorie
das Teilchen folgt, zerstört diese Interferenzen. Dies ist eine Manifestation der Welle-TeilchenKomplementarität.
Die Nichtlokalität ist sogar noch verwirrender. In den letzten Jahrzehnten sind viele “EPRExperimente” durchgeführt worden, um zu testen, ob die Natur diese unplausible Nichtlokalität
zeigt. In diesen Experimenten ist die Wellenfunktion eines Paars von auseinander fliegenden
Teilchen durch eine untrennbare Superposition von Zuständen verschränkt. Der Quantenformalismus sorgt dafür, dass der Nachweis eines der Teilchen einen sofortigen Einfluss auf das andere
101
Teilchen hat, selbst wenn dieses sehr weit entfernt ist. Der Experimentator darf sogar seine
Entscheidung über die Art der Messung verzögern, bis die Teilchen ihren Wechselwirkungsbereich verlassen haben. Die Experimente demonstrieren in klarer Weise, dass der Zustand eines
Teilchens immer mit dem Ergebnis der Messung an dem anderen Teilchen korreliert ist, und
zwar in der seltsamen, von der Quantentheorie vorhergesagten Weise.
Die Resultate dieser Experimente widersprechen unserer Anschauung. Solche Vorgänge werden in unserer makroskopischen Welt niemals beobachtet. Eine Billardkugel geht nicht gleichzeitig durch zwei Löcher. Wenn zwei Kugeln zusammenstoßen und sich danach weit voneinander
entfernen, wird eine Messung an Kugel 1 keinerlei Einfluss auf Kugel 2 haben.
Ist die Quantenmechanik auf Schrödingers Katze anwendbar?
Nun sind aber makroskopische Objekte aus Atomen aufgebaut, die jedes für sich der Quantenmechanik gehorchen. Hier liegt das Paradox, das Erwin Schrödinger mit seinem provokativen
Gedankenexperiment illustrierte. Er beschrieb eine diabolische Situation, in der eine Katze mit
einem einzelnen Atom verschränkt ist. Das System würde durch eine Wellenfunktion beschrieben
werden, die gleichzeitig die lebendige Katze zusammen mit dem angeregten Atom repräsentiert
und die tote Katze zusammen mit dem Atom im Grundzustand, nachdem das emittierte Quant
die tödliche Giftdosis ausgelöst hat. Quantenexperten werden einwenden, dass eine Katze ein
komplexes und offenes System ist, welches nicht einmal zu Beginn dieses grausamen Experiments durch eine Wellenfunktion beschrieben werden kann. Es bleibt dennoch die wichtige
Frage: warum und auf welche Weise verschwinden die Skurrilitäten der Quantenmechanik in
großen Systemen?
Dekohärenz in großen Systemen
In den letzten 25 Jahren sind große Fortschritte im theoretischen Verständnis großer Systeme
gemacht worden. Dort tritt eine Dekohärenz auf, die die quantenmechanischen Superpositionseffekte sehr rasch zum Verschwinden bringt. Die “Umgebung” hat einen signifikanten Einfluss
auf die Dekohärenzzeit (d.h. die Zeitspanne, innerhalb derer die quantenmechanische Kohärenz
verschwindet). Man kann eine Katze nicht von völlig von ihrer Umgebung isolieren und beispielsweise in einen Vakuumbehälter stecken, denn dann würde sie auch ohne die Giftkapsel sterben.
Daher treffen die Moleküle der Luft auf die Katze und reduzieren die Interferenzeffekte. Man
kann die Katze auch nicht in einen Flüssig-Helium-Kryostaten sperren, um die thermische 300Kelvin-Strahlung zu unterdrücken, und so treffen die zahlreichen Photonen dieser Strahlung auf
das Tier. Durch die unvermeidliche Wechselwirkung mit der Umgebung sickert unweigerlich
Information über das Quantensystem in die Umgebung mit der Konsequenz, dass die Quantenkohärenz beeinträchtigt wird. Genauere Analysen zeigen, dass die Dekohärenzzeit ganz rapide
mit wachsender Systemgröße abnimmt. In makroskopischen Systemen sind die störenden Prozesse so effektiv, dass die Quantenkohärenz in unmessbar kurzer Zeit verschwindet. Was ist die
Konsequenz?
Eine Katze kann nicht in einem verschränkten Zustand existieren, vielmehr ist sie - genau
wie in der klassischen Physik - entweder lebendig oder tot, aber nicht beides gleichzeitig.
Wir können feststellen, dass die Quantenmechanik nach heutigen Erkenntnissen das Schrödingersche Gedankenexperiment unbeschadet “überstanden” hat.
102
Messung einer Dekohärenzzeit
In dem oben genannten Artikel von Haroche wird ein Experiment zur Dekohärenz in einem
mesoskopischen System beschrieben (mesoskopische Systeme liegen in ihrer Größe zwischen mikroskopischen Systemen (Atomen) und makroskopischen Systemen (Katzen)). Es wird eine Art
von “Mini-Schrödinger-Katze” realisiert, die aus wenigen verschränkten Mikrowellenphotonen
in einem supraleitenden Mikrowellenresonator besteht. Das Experiment ist sehr anspruchsvoll,
sowohl im theoretischen Hintergrund als auch in der praktischen Realisierung, so dass wir nur
sehr pauschal darauf eingehen können. Eine detaillierte Darstellung würde weit über den Rahmen dieses Skriptums hinausgehen. Die benutzte Apparatur haben wir bereits schematisch in
Abb. 1.6 gezeigt, siehe auch die Diskussion in Kap. 1.2.3. Ein erstes Rubidium-Atom erzeugt
einen verschränkten “Schrödinger-Katzen-Zustand” in dem supraleitenden Resonator, ein zweites, mit zeitlicher Verzögerung folgendes Atom tastet ab, ob die Verschränkung noch vorhanden
ist oder ob inzwischen ein Übergang in ein inkohärentes Gemisch von Zuständen eingetreten ist.
Durch Variation der Verzögerung
kann
die Dekohärenzzeit
werden,
der
VOLUME 77,
NUMBER
24
P H Ygemessen
SICAL R
E V I E WsieLliegt
E T T genügt
ERS
9 DECEM
Formel
We thank P. Goy for assistance with m
tdecoh = τ /n̄
technology and AB Millimetre for the loan
This
was supported in part by E
wobei τ = 160 µs die Dämpfungszeitkonstante der Resonatorschwingung ment.
ist und
n̄ work
die mittlere
No. ERBCHRXCT930114).
Zahl der Mikrowellenphotonen. Eine Messung wird in Abb. 9.2 gezeigt. Für n̄ = 3 ergibt sich
eine Dekohärenzzeit von etwa 50 µs. Im makroskopischen Fall n̄ 1 wird die Dekohärenzzeit
unmessbar klein: die Dekohärenz einer realen Katze ist instantan.
*Laboratoire de l’Université Pierre et Marie C
l’ENS, associé au CNRS (URA18).
[1] J. A. Wheeler and W. H. Zurek, Quantum Theo
surement (Princeton Univ. Press, Princeton, NJ
[2] E. Schrödinger, Naturwissenschaften 23, 807
(1935); reprinted in English in [1].
[3] J. von Neumann, in Matematische Grundlagen
tenmechanik (Springer, Berlin, 1932); reprinted
in [1].
[4] W. H. Zurek, Phys. Today 44, No. 10, 36 (199
[5] W. H. Zurek, Phys. Rev. D 24, 1516 (1981)
(1982); A. O. Caldeira and A. J. Leggett, Physi
dam) 121A, 587 (1983); E. Joos and H. D. Ze
B 59, 223 (1985); R. Omnès, The Interpretatio
tum Mechanics (Princeton University Press, Pri
1994).
[6] R. J. Glauber, Phys. Rev. 131, 2766 (1963).
[7] D. F. Waals and G. J. Milburn, Phys. Rev. A
FIG. 5. (a) Two-atom correlation signal h versus n for n 
(1985).
3.3, dy2p  70 kHz, and t  40 ms. (b) n-averaged h val[8] M. Brune et al., Phys. Rev. A 45, 5193 (1992)
ues versus tyTr for dy2p  170 kHz (circles) and dy2p 
Abbildung 9.2: Gemessene70zeitliche
Abnahme
der
in theoretical.
dem “Schrödinger-Katzen-Experiment”
[9] C. Monroe et al., Science 272, 1131 (1996).
kHz (triangles).
Dashed
andKohärenz
solid lines are
In[10] B. Yurke
and D. Stoler, Phys. Rev. Lett. 57,
sets:
pictorial
representations
of
corresponding
field compovon Brune et al., Observing the Progressive Decoherence of the “Meter”
in a Quantum
Measurement,
nents separated by 2f.
B. Yurke et al., Phys. Rev. A 42, 1703 (1990);
Physical Review Letters 77, 4887 (1996). Die Dekohärenzzeit beträgt etwa 50 µs. Die
wird
ibid. Abbildung
33, 674 (1986);
V. Buzek et al., Phys.
8190
(1992).
in dem oben genannten Physics-Today-Artikel
von
S.
Haroche
diskutiert.
Most strikingly, we observe that decoherence proceeds
[11] C. N. Savage et al., Opt. Lett. 15, 628 (1990).
at a faster rate when the distance between the two state
[12] R. G. Hulet and D. Kleppner, Phys. Rev. Let
components is increased. An effective decoherence time
(1983).
of 0.24Tr , much shorter than the photon decay time,
[13] S. Haroche and J. M. Raimond, in Cavity
is found for d  70 kHz. A similar agreement with
Electrodynamics, edited by P. Berman (Acad
theory is obtained when comparing for the same dy2p
New York, 1994), p. 123.
value (70 kHz) the correlations signals corresponding to
[14] M. Brune et al., Phys. Rev. Lett. 76, 1800 (19
different n values (5.1 and 3.3). We thus demonstrate the
[15] P. Nussenzveig et al., Phys. Rev. A 48, 3991 (
basic features of the decoherence theory on this simple
[16] N. F. Ramsey, Molecular Beams (Oxford U
model, namely, the fast evolution in a measurement
New York, 1985).
[17] M. O. Scully et al., Nature (London) 351, 1
process of the “atom 1 meter” state towards a statistical
S. Haroche et al., Appl. Phys. B 54, 355 (1992
mixture and the increasing difficulty to maintain quantum
[18] T. Pfau et al., Phys. Rev. Lett. 73, 1223 (1
coherence when the distance between the components
Chapman et al., Phys. Rev. Lett. 75, 3783 (199
of the mesoscopic superposition is increased. Using
[19] M. Brune et al., Phys. Rev. Lett. 72, 3339 (19
higher Q cavities, we intend to increase n further and
[20] L. Davidovich et al., Phys. Rev. A 53, 1295 (1
to study decoherence processes occurring even faster on
[21] The calculation — to be published — generali
now continuously vary, from
the scale of Tr . We can 103
trary f values the derivation of [20], which wa
microscopic to macroscopic, the size of the meter in
to f  py2. It describes independently atom
an ideal measurement process, allowing us to explore
action and relaxation and neglects fluctuation
the elusive boundary between the quantum and classical
velocity as well as of atom number (possibi
worlds.
atoms in each preparation pulse).
Anhang A
Mathematische Hilfsmittel
In diesem Anhang werden wichtige mathematische Begriffe und Beziehungen zusammengestellt
und Rechenmethoden erläutert. Wir verzichten auf formale Definitionen und Beweise und bringen stattdessen viele Beispiele.
A.1
Reelle und komplexe Zahlen
Die natürlichen Zahlen
1, 2, 3, 4, 5, ...
sind jedem Kind geläufig und brauchen hier nicht weiter erklärt zu werden. Die erste Abstraktion
sind die ganzen Zahlen:
0, ±1, ±2, ±3, ...,
die sich ergeben, wenn man zwei beliebige natürliche Zahlen voneinander subtrahiert. Die Division von ganzen Zahlen führt zu den rationalen Zahlen, die man alle in der Form
r=
m
n
schreiben kann, wobei m, n ganze Zahlen sind und n 6= 0 sein muss. Die natürlichen und die
ganzen Zahlen sind Teilmengen der rationalen Zahlen.
Eine wichtige Beobachtung ist, dass die rationalen Zahlen nicht ausreichen. Man kann beweisen, dass die Quadratwurzel aus 2 nicht als rationale Zahl dargestellt werden kann. Auch
die wichtige Zahl π, das Verhältnis zwischen Umfang und Durchmesser eines Kreises, ist keine
rationale Zahl. Als reelle Zahlen bezeichnet man die Gesamtmenge der rationalen Zahlen und
der irrationalen Zahlen (das sind solche, die sich nicht als Bruch schreiben lassen).
Die reellen Zahlen haben die Eigenschaft, dass ihr Quadrat immer positiv ist
r2 ≥ 0
und nur null wird, wenn r = 0 ist. In der Mathematik und Physik erweist es sich als zweckmässig,
noch einen Schritt weiter zu gehen und Zahlen zu definieren, deren Quadrat auch negativ werden
kann. Dies sind die komplexen Zahlen die man in der Form schreiben kann
z = x + iy
mit reellen Zahlen x und y. Die imaginäre Einheit ist definiert durch
√
i2 = −1 ⇒ i = −1
104
ÁmHzL
ÁmHzL
y
z= x+ä y
z=ãä Α
sinHΑL
-y
Α
cosHΑL
ÂeHzL
x
ÂeHzL
z*= x-ä y
Abbildung A.1: Links: Darstellung der komplexen Zahlen z = x + iy und z ∗ = x − iy als Vektoren in
der komplexen Zahlenebene. Rechts: Zusammenhang zwischen der komplexen Exponentialfunktion und
den Cosinus- und Sinusfunktionen.
Der Name imaginäre Einheit macht schon deutlich, dass man bei der Einführung dieser Größe
einige Fantasie brauchte.
x ist der Realteil der komplexen Zahl z und y der Imaginärteil:
x = Re(z) , y = Im(z) ,
z = Re(z) + iIm(z)
Die zu z konjugiert komplexe Zahl ist definiert durch
z ∗ = x − iy
Man kann die komplexen Zahlen als Vektoren in der sog. komplexen Ebene darstellen
(Fig. A.1). Die Länge
p des Vektors z = x + iy ist offensichtlich nach dem Satz von Pythagoras gegeben durch x2 + y 2 . Dies legt es nahe, den Absolutbetrag der Zahl z wie folgt zu
definieren
p
p
√
|z| = zz ∗ = (x + iy)(x − iy) = x2 + y 2
Aus der Abb. A.1 ersieht man, dass gilt
x = |z| cos α ,
y = |z| sin α
und daher
z = |z| (cos α + i sin α) ≡ |z| eiα
Hier benutzen wir den fundamentalen Zusammenhang zwischen der komplexen Exponentialfunktion und den Cosinus- und Sinusfunktionen
eiα = cos α + i sin α ,
e−iα = cos α − i sin α
Man erkennt sofort, dass eiα den Betrag 1 hat:
p
iα p
e = (cos α + i sin α)(cos α − i sin α) = cos2 α + sin2 α = 1
Um das Argument der Exponentialfunktion besser lesbar zu machen, schreiben wir sie häufig in
der Form exp(iα).
105
A.2
Zeigerdarstellung des komplexen Phasenfaktors
In vielen Schulbüchern wird die komplexe Exponentialfunktion umgangen und eine Zeigerdarstellung zur Ermittlung von Interferenzmustern verwendet. Dies geht auf die Pfadintegralmethode
von Richard Feynman zurück. Der Phasenfaktor wird durch den Zeiger einer Messuhr dargestellt. Eine Beschreibung ohne jede Formel findet man in dem Buch von Feynman “Quantenelektrodynamik - Die seltsame Theorie des Lichts und der Materie”, Piper-Verlag. Wir betrachten
Abbildung A.2: Oben: Zeigerdarstellung des Phasenfaktors exp(i kx) = exp(i 2π x/λ) als Funktion von
x/λ. Der Zeiger der Messuhr dreht sich im Anti-Uhrzeigersinn. Unten: Anwendung der Zeigerdarstellung
auf den Doppelspalt. Zur Berechnung der Lichtwellenamplitude im Punkt P werden die beiden Pfeile
vektoriell addiert: A = A1 + A2 .
einen undurchsichtigen Schirm, in dem sich zwei schmale Spalte S1 und S2 mit einem Abstand a
befinden. Der Schirm wird mit Licht der Wellenlänge λ beleuchtet, die Lichtquelle sei sehr weit
entfernt, so dass das einfallende Licht als ebene Welle behandelt werden darf (in der Praxis kann
man Laserlicht benutzen). Hinter den Spalten breitet sich das Licht als Zylinderwelle aus. Wir
interessieren uns für das Interferenzmuster auf einem weit entfernten Beobachtungsschirm. Dazu
wählen wir einen beliebigen Punkt P auf dem Schirm und vergleichen die beiden Lichtstrahlen,
die von S1 und S2 nach P laufen. Die Strecken S1 P und S2 P haben verschiedene Längen
L1
und L2 . Der Phasenfaktor der Lichtwelle ändert sich längs der Strecke S1 P um exp i 2π Lλ1 und
längs der Strecke S2 P um exp i 2π Lλ2 . Jetzt wollen wir die komplexe e-Funktion vermeiden
und messen die Längen L1 und L2 in Einheiten der Lichtwellenlänge. Dazu verwenden wir Messuhren, deren Zeiger genau eine Umdrehung pro Lichtwellenlänge machen. Längs der Strecke
106
S1 P wird die Messuhr U1 sehr viele Umdrehungen machen, da die Länge L1 viel größer als die
Lichtwellenlänge ist. Entscheidend ist, dass im allgemeinen eine nicht vollständige Umdrehung
übrig bleibt, und auf die kommt es an. Ganz entsprechend wird auch längs der Strecke S2 P eine
Messuhr U2 sehr viele Umdrehungen machen. Um die Lichtamplitude im Punkt P zu bestimmen,
müssen wir die Pfeile A1 und A2 der beiden Messuhren vektoriell addieren. Weisen sie in die
gleiche Richtung, gibt es maximale Lichtintensität. Das ist offensichtlich im Symmetriepunkt O
der Fall. Im Punkt P ist es der Fall, wenn die Uhren U1 und U2 sich um eine ganze Zahl von
Umdrehungen unterscheiden. Das führt zu der Bedingung
∆L = L2 − L1 = nλ
Aus der Abb. ?? sieht man leicht, dass ∆L = a sin θ ist. Wir erhalten damit die bekannte Formel
für die Lage der Maxima in Doppelspaltinterferenzen
a sin θ = nλ
Interferenzminima ergeben sich wenn die Zeiger der Uhren in die entgegengesetzte Richtung
weisen, d.h. für ∆L = 1/2 λ, 3/2 λ, .....
A.3
A.3.1
Grundregeln der Differential- und Integralrechnung
Differentialrechnung
Wir betrachten Funktionen f (x), die von einer reellen Variablen abhängen. Diese Variable wird
hier mit x bezeichnet, aber anders als in der Physik verstehen wir darunter keine Ortskoordinate,
sondern eine reelle Zahl ohne Dimension. Ein Beispiel ist die Funktion f (x) = 1 + 0.3x2 , die in
Abb. A.3 skizziert ist. Um die Steigung der Kurve bei einem Punkt x = x0 zu ermitteln, bilden
wir den Differenzenquotienten
f (x0 + ∆x) − f (x0 )
∆x
wobei ∆x klein ist. Führt man den Grenzübergang (Limes) ∆x → 0 aus, erhalten wir den
Differentialquotienten, der die Steigung der Tangente im Punkt x0 angibt. Die Funktion wird
diffenzierbar genannt, wenn dieser Limes für alle Werte von x0 gebildet werden kann. Den Index
“0llassen wir im Folgenden weg.
Die Ableitung der Funktion am Ort x ist definiert durch
f 0 (x) =
df
f (x + ∆x) − f (x)
= lim
dx ∆x→0
∆x
(A.1)
Die meisten der in der Physik gebrauchten Funktionen sind differenzierbar. Ein Beispiel für eine
nicht überall differenzierbare Funktion ist f (x) = |x|. Die Ableitung ist f 0 (x) = +1 für x > 0
und f 0 (x) = −1 für x < 0. Diese Funktion ist nicht differenzierbar bei x = 0.
Einige wichtige Funktionen und ihre Ableitungen sind in Tabelle A.1 aufgelistet. Die Exponentialfunktion hat eine besondere Bedeutung in der Physik. Sie ist die einzige Funktion, die
identisch mit ihrer Ableitung ist: f (x) = ex f 0 (x) = ex . Sie hat die Reihenentwicklung
ex = 1 + x +
∞
X xn
x2 x3
+
+ ... =
3
6
n!
n=0
mit n! = n(n − 1)(n − 2)...1, also 4! = 4 · 3 · 2 · 1 = 24 (gesprochen n-Fakultät). Definitionsgemäss
setzt man 0! = 1. Die Umkehrfunktion ist der natürliche Logarithmus, der nur für x > 0 definiert
ist (im Limes x → 0 gilt ln x → −∞). Exponentialfunktion und Logarithmusfunktion werden
in Abb. A.4 gezeigt.
107
4
3
2
1
0
0
1
2
3
Abbildung A.3: Kurvenverlauf der Funktion f (x) = 1 + 0.3x2 und Ermittlung der Steigung im Punkt
x0 = 1. Hier hat ∆x den großen Wert ∆x = 1. Lässt man ∆x → 0 gehen, so wird aus der blau
gezeichneten Geraden die Tangente im Punkt x0 .
Tabelle A.1: Wichtige Funktionen und ihre Ableitungen
Funktion f (x)
Ableitung f 0 (x)
xn
nxn−1
sin x
cos x
cos x
− sin x
ex
ex
ln x
√
x
x := −2 , −1.95 .. 2
1/x
√
1/(2 x)
x :=
0.02 , 0.04 .. 2
8
2
f(x) = ln(x)
6
f(x) = exp(x)
0
4
2
2
0
2
0
4
2
0
1
2
Abbildung A.4: Kurvenverlauf der Exponentialfunktion und der Logarithmusfunktion.
108
Differentiationsregeln
Summenregel
(f + g)0 = f 0 + g 0
Produktregel
(f g)0 = f 0 g + f g 0 ,
Beispiel (x3 sin x)0 = 3x2 sin x + x3 cos x
Quotientenregel
0
f
f 0g − f g0
=
,
g
g2
Beispiel
x2
sin x
0
=
2x sin x − x2 cos x
sin2 x
Kettenregel
(f [g(x)])0 = f 0 [g] · g 0 (x) ,
Beispiel (sin[x3 ])0 = cos[x3 ] · 3x2
Taylorentwicklung
Eine differenzierbare Funktion kann in einer kleinen Umgebung eines Punktes x0 in eine Taylorreihe entwickelt werden. Dadurch ist es in vielen Fällen möglich, die Funktion in der Nähe
von x0 zu linearisieren.
f (x) ≈ f (x0 ) + f 0 (x0 )(x − x0 )
für |x − x0 | 1
Dies folgt sofort aus der Definition des Differentialquotienten in Gl. (A.1). Beispiele f (x) =
√
1 + x oder f (x) = ln(1 + x). Wir wählen x0 = 0.
√
1 + x ≈ 1 + x/2 für |x| 1
ln(1 + x) ≈ x
für |x| 1
Eine bessere Genauigkeit bietet die Taylorentwicklung bis zur 2. Ordnung, bei der man außer
der Steigung der Kurve auch noch ihre Krümmung berücksichtigt:
f (x) ≈ f (x0 ) + f 0 (x0 )(x − x0 ) +
A.3.2
f 00 (x0 )
(x − x0 )2
2
für |x − x0 | 1
(A.2)
Integralrechnung
Die Fläche zwischen einer Kurve f (x) und der x-Achse in einem Intervall a ≤ x ≤ b bestimmen
wir näherungsweise, indem wir das Intervall in n Abschnitte der Länge
∆x =
b−a
n
unterteilen und die Summe
S=
n
X
f (xi )∆x
i=1
mit xi = a + (i − 1)∆x
berechnen (siehe Abb. A.5). Im Limes n → ∞ wird daraus das bestimmte Integral
Z b
n
X
f (x)dx = lim
f (xi )∆x
a
n→∞
(A.3)
(A.4)
i=1
Unter einer Stammfunktion F (x) der Funktion f (x) versteht man eine Funktion, deren
Ableitung gleich f (x) ist:
F 0 (x) = f (x)
109
u :=
j
1 + ( j − 0.4) ⋅ 0.2
( j)
pexp := f u
j
6
4
2
0
0
1
2
3
Abbildung A.5: Approximation des bestimmten Integrals
Funktion ist f (x) = 1 + 0.3x2 .
R3
1
4
f (x)dx durch die Summe (A.3). Die
Hauptsatz der Differential- und Integralrechnung
Sei F (x) eine Stammfunktion von f (x). Dann gilt
Z
a
b
f (x)dx = F (b) − F (a)
(A.5)
Stammfunktionen sind nicht eindeutig, man kann eine beliebige Konstante hinzuaddieren. Häufig
schreibt man eine Stammfunktion in Form eines unbestimmten Integrals (es werden keine Integrationsgrenzen angegeben)
Z
F (x) =
f (x)dx
Das Differenzieren einer vorgegebenen Funktion macht in den meisten Fällen keine Schwierigkeiten, aber beim Integrieren ist dies anders. Für sehr viele Funktionen sind die Stammfunktionen nicht bekannt (im Programm Mathematica findet man praktisch alle bekannten unbestimmten Integrale). Manchmal helfen Integrationsregeln weiter. Besonders häufig verwendet
man die partielle Integration:
Z
a
b
0
f (x)g (x)dx = [f (b)g(b) − f (a)g(a)] −
Z
b
f 0 (x)g(x)dx
(A.6)
a
Auch wenn keine Stammfunktion bekannt ist, wird durch das unbestimmte Integral eine Funktion F (x) definiert, die man leicht auf dem Computer auswerten kann.
A.4
A.4.1
Fourier-Reihe und Fourier-Integral
Fourier-Reihe
Die Sinus- und Cosinusfunktionen sind periodisch mit der Periode 2π: sin(x + 2π) = sin(x). Von
Fourier wurde bewiesen, dass sich jede periodische Funktion, die beschränkt und stückweise stetig ist, als Linearkombination von Sinus- und Cosinusfunktionen darstellen lässt. Eine Funktion
f (x) wird periodisch genannt, wenn es eine Zahl L > 0 gibt, so dass für alle x gilt
f (x + L) = f (x)
110
Die Fourierreihe von f (x) lautet
f (x) =
∞
∞
n=1
n=1
X
a0 X
+
an cos(nkx) +
bn sin(nkx)
2
Die Koeffizienten werden wie folgt berechnet:
Z L
2
f (x) cos(nkx)dx ,
an =
L 0
2
bn =
L
Z
2π
L
(A.7)
f (x) sin(nkx)dx
(A.8)
mit k =
L
0
Als Beispiel betrachten wir die in Abb. A.6 gezeigte Dreieckskurve. Sie ist eine gerade Funktion (f (−x) = f (x)) und hat deswegen nur Cosinusterme sowie einen konstanten Term in der
Fourierreihe
1
1
4
1
f (x) = − 2 cos(πx) + 2 cos(3πx) + 2 cos(5πx) + .....
2 π
3
5
f(x)
1
0.5
3
2
1
0
1
2
3
x
Abbildung A.6: Eine Dreieckkurve (blau) und die Summe der Terme der Fourierreihe mit n = 0, 1, 3
(rote Kurve). Gestrichelte rote Linie: der Term a0 /2 = 1/2.
In der Elektrotechnik kommen häufig Funktionen vor, die periodisch in der Zeit sind
f (t + T ) = f (t)
Die Fourierreihe lautet analog zu Gl. (A.7)
∞
∞
n=1
n=1
X
a0 X
f (t) =
+
an cos(nωt) +
bn sin(nωt)
2
2π
T
(A.9)
f (t) sin(nωt)dt
(A.10)
mit ω =
Die Koeffizienten sind
2
an =
T
Z
T
f (t) cos(nωt)dt ,
0
2
bn =
T
Z
T
0
Mit Pulsgeneratoren kann man Rechteck-Pulsketten erzeugen, wie in Abb. A.7 gezeigt. Die hier
dargestellte Funktion hat die Periode T = 2 und ist eine ungerade Funktion (f (−t) = −f (t)).
Daher gibt es in der Fourierreihe nur Sinusterme. Unter Benutzung von Gl. (A.10) finden wir
4
1
1
f (t) =
sin(πt) + sin(3πt) + sin(5πt) + .....
π
3
5
111
f(t)
1.5
2
1
0
1
2
t
1.5
Abbildung A.7: Eine periodische Folge von Rechteckpulsen (blau) und die Approximation durch eine
Fourierreihe. Grüne Kurve: nur die 1. Ordnung
n = 5.
4
π
sin(πt), rote Kurve: alle Terme bis zur Ordnung
Die Rechteckfunktion ist unstetig an den Stellen t = 0, ±T, ±2T..., d.h. dort macht die Funktion
Sprünge und ist unendlich steil. Bei unstetigen Funktionen muss man die Fouriersumme bis
zu sehr hohen Ordnungen n erstrecken, um die Sprünge einigermaßen zu reproduzieren. Die
Fourierkoeffizienten sind proportional zu 1/n, die Konvergenz der Reihe ist schwach.
Bei stetigen Funktionen wie bei der Dreieckskurve in Abb. A.6 konvergiert die Fourierreihe
wesentlich schneller (in diesem Fall sind die Fourierkoeffizienten proportional zu 1/n2 ), und die
Summe der Terme mit n = 0, 1, 3 liefert bereits eine gute Approximation.
A.4.2
Fourier-Integral
Auch nichtperiodische Funktionen lassen sich durch Überlagerung harmonischer Funktionen
darstellen, wobei die Fouriersumme durch das Fourierintegral ersetzt wird. Die Voraussetzung
ist, dass die Funktion quadratisch integrierbar ist, d.h. es muss gelten
Z ∞
|f (x)|2 dx < ∞
−∞
Wir benutzen hier an Stelle der Sinus- und Cosinusfunktionen die komplexe Exponentialfunktion,
die die Schreibweise wesentlich vereinfacht. Die Fourierdarstellung einer Funktion f (x) lautet
Z ∞
1
f (x) = √
f˜(k) exp(ikx)dk
(A.11)
2π −∞
mit der Fouriertransformierten
1
f˜(k) = √
2π
Z
∞
f (x) exp(−ikx)dx
(A.12)
−∞
Es gilt das Parseval-Theorem
Z
∞
−∞
|f (x)|2 dx =
Z
∞
−∞
|f˜(k)|2 dk
Für Funktionen der Zeit schreibt man analog
Z ∞
Z ∞
1
1
f (t) = √
f˜(ω) exp(iωt)dω ,
f˜(ω) = √
f (t) exp(−iωt)dt
2π −∞
2π −∞
112
(A.13)
(A.14)
Fourier-Transformation einer Gaussfunktion
Eine Gaussfunktion im Zeitbereich wird durch das Fourierintegral in eine Gaussfunktion im
Frequenzbereich überführt.
1
1
t2
1
ω2
˜
mit σω =
(A.15)
f (t) = √
exp − 2
⇒ f (ω) = √
exp − 2
2σω
σt
2σt
2πσt
2π
Die Breite der Frequenzfunktion ist umso größer, je schmaler die Zeitfunktion ist, s. Abb. A.8.
Das Produkt der Unschärfen ist 1:
σt · σω = 1
(A.16)
Durch Multiplikation mit ~ folgt daraus die Energie-Zeit-Unschärferelation, siehe Kap. 4.6.4.
1
0.5
0
0
0
Zeit
Frequenz
Abbildung A.8: Zwei Gaussfunktionen f (t) verschiedener Breite und ihre Fouriertransformierten.
Fourier-Transformation eines zeitlich begrenzten harmonischen Wellenzugs
Das elektrische Feld einer Lichtwelle sei gegeben durch
E0 exp(−i ω0 t)
für − T /2 < t < T /2
E(t) = E 0
0
sonst
(A.17)
Die Zahl der Oszillationen ist N = ω0 T /(2π). Wegen seiner endlichen Länge ist der Wellenzug
I(ω) / I(ω1)
1
0.5
0
time
0.8
0.9
1
∆ω / ω1
1.1
Abbildung A.9: Ein Wellenzug mit 10 Oszillationen und die Intensität als Funktion der Frequenz.
nicht monochromatisch, sondern enthält ein Frequenzspektrum, das wir mithilfe der Fouriertransformation berechnen
Z +∞
Z +T /2
1
E0
2E 0 sin((ω0 − ω)T /2)
Ẽ(ω) = √
E(t)eiωt dt = √
e−i(ω0 −ω)t dt = √
.
ω0 − ω
2π −∞
2π −T /2
2π
113
Die spektrale Intensität ist
2
2
2 sin u
I(ω) ∝ Ẽ(ω) ∝ N
u
mit
u=
(ω0 − ω)T
ω0 − ω
.
= πN
2
ω0
(A.18)
Sie hat ihr Maximum bei ω = ω0 und eine Halbwertsbreite
∆ω ≈
ω0
2π
=
.
N
T
(A.19)
Ein sehr kurzer Wellenzug mit nur 10 Oszillationen und seine spektrale Intensität werden in
Abb. A.9 gezeigt.
A.5
Funktionen von mehreren Variablen
A.5.1
Partielle Ableitungen
Funktionen von mehreren Variablen kommen sehr häufig in der Physik vor, und wir müssen die
2
2
Regeln
f( x , yder
) := ( y Differential− 10) − ( x − 10) + und
100 Integralrechnung erweitern, um diese Funktionen zu erfassen. Als
Beispiel betrachten wir die Funktion
j :=
M
0 .. 20
k :=
0 .. 20
f (x, y) = (x − 10)2 − (y − 10)2 + 100
:= f( j , k )
j, k
der beiden
reellen Variablen x und y. Diese Funktion kann man graphisch darstellen, es ergibt
sich die sattelförmige Fläche in Abb. A.10. Die partiellen Ableitungen sind die Verallgemeinerung
x :=
0 , 0.1 .. 20
y :=
0 , 0.1 .. 20
200
g(x)
150
100
50
0
h(y)
0
5
10
15
20
Abbildung A.10: Links: Graphische Darstellung der Funktion f (x, y) = (x − 10)2 − (y − 10)2 + 100.
Rechts: die Kurven g(x) = f (x, 10) und h(y) = f (10, y) auf der Sattelfläche.
der normalen Ableitung einer Funktion mit einer Variablen. Sie sind definiert durch
f (x + ∆x, y) − f (x, y)
∂f
= lim
,
∂x ∆x→0
∆x
∂f
f (x, y + ∆y) − f (x, y)
= lim
∆y→0
∂y
∆y
114
(A.20)
Dabei wird jeweils die andere Variable konstant gehalten. Man bestimmt also die normalen
Ableitungen der Funktionen g(x) = f (x, y0 ) und h(y) = f (x0 , y). Die partiellen Ableitungen
der Funktion f (x, y) = (x − 10)2 − (y − 10)2 + 100 sind
∂f
= 2 (x − 10) ,
∂x
∂f
= −2 (y − 10)
∂y
Die Kurven g(x) = f (x, 10) und h(y) = f (10, y) sind in Abb. A.10 skizziert.
Funktionen mit drei oder mehr Variablen lassen sich nicht mehr graphisch darstellen. Die
partiellen Ableitungen sind gemäss (A.20) zu berechnen.
Im Dreidimensionalen definiert man den Nabla-Operator. Nabla ist ein Vektoroperator, der
als Komponenten die partiellen Ableitungen nach x, y und z enthält:


∂x
∂
∇ =  ∂y  mit ∂x ≡
etc
(A.21)
∂x
∂z
Angewandt auf eine Funktion f (x, y, z) ergibt sich eine Vektorfunktion, die man oft auch den
Gradienten nennt:


∂x f
∂f
etc
(A.22)
grad f ≡ ∇f =  ∂y f  mit ∂x f ≡
∂x
∂z f
Der Laplace-Operator ist die Summe der zweiten Ableitungen
∆ = ∇2 =
A.5.2
∂2
∂2
∂2
+
+
∂x2 ∂y 2 ∂z 2
(A.23)
Mehrfachintegrale
Das Doppelintegral über eine Funktion f (x, y) ist als Grenzwert einer Doppelsumme definiert
Z
c
dZ b
f (x, y)dxdy = lim
n→∞
a
n X
n
X
f (xi , yj )∆x∆y
(A.24)
i=1 j=1
Für unsere Sattelflächenfunktion in Abb. A.10 ergibt
Z
0
20 Z 20
f (x, y)dxdy
0
das Volumen unterhalb der Sattelfläche. Doppel- oder Dreifachintegrale sind oft schwer zu
berechnen.
A.6
A.6.1
Kugelkoordinaten
Kugelkoordinaten
Die Kugelkoordinaten (r, θ, ϕ) eines Punktes P = (x, y, z) werden in Abb. A.11 definiert. Ihre
Verknüpfungen mit kartesischen Koordinaten lauten
x = r sin θ cos ϕ ,
y = r sin θ sin ϕ ,
115
z = r cos θ
(A.25)
Abbildung A.11: Definition der Kugelkoordinaten. Die Richtungen der Einheitsvektoren r̂, θ̂, ϕ̂ hängen
vom Polarwinkel θ und vom Azimutalwinkel ϕ ab.
und
r=
p
x2 + y 2 + z 2 ,
θ = arccos(z/r) ,
ϕ = arctan(y/x)
(A.26)
Man definiert drei Einheitsvektoren r̂, θ̂, ϕ̂, die jeweils in die Richtung zeigen, in der sich die
betreffende Koordinate vergrößert. Ihr Zusammenhang mit den kartesischen Einheitsvektoren
ist
r̂ = sin θ cos ϕ x̂ + sin θ sin ϕ ŷ + cos θ ẑ
(A.27a)
θ̂ = cos θ cos ϕ x̂ + cos θ sin ϕ ŷ − sin θ ẑ
(A.27b)
ϕ̂ = − sin ϕ x̂ + cos ϕ ŷ
(A.27c)
Eine infinitesimale Verschiebung im Raum kann man schreiben
ds = dx x̂ + dy ŷ + dz ẑ = dr r̂ + r dθ θ̂ + r sin θdϕ ϕ̂
(A.28)
Das infinitesimale Volumenelement ist d3 r = dx dy dz in kartesischen Koordinaten. In Kugelkoordinaten lautet es
d3 r = r2 sin θ dr dθ dϕ
(A.29)
Der Nabla-Operator in Kugelkoordinaten
Der Gradient einer skalaren Funktion ist
∇f =
∂f
1 ∂f
1 ∂f
r̂ +
θ̂ +
ϕ̂
∂r
r ∂θ
r sin θ ∂ϕ
(A.30)
Die Divergenz einer Vektorfunktion ist
∇·g=
1 ∂(r2 gr )
1 ∂(sin θ gθ )
1 ∂gϕ
+
+
2
r
∂r
r sin θ
∂θ
r sin θ ∂ϕ
(A.31)
Die Rotation einer Vektorfunktion ist
∂(sin θ gϕ ) ∂gθ
∂(rgϕ )
1
1
1 ∂gr
1 ∂(rgθ ) ∂gr
∇×g=
−
r̂ +
−
θ̂ +
−
ϕ̂
r sin θ
∂θ
∂ϕ
r sin θ ∂ϕ
∂r
r
∂r
∂θ
(A.32)
116
Der Laplace-Operator angewandt auf eine skalare Funktion lautet
1
∂
∂f
1
∂2f
1 ∂
2 ∂f
2
r
+ 2
sin θ
+ 2 2
∇ f= 2
r ∂r
∂r
r sin θ ∂θ
∂θ
r sin θ ∂ϕ2
117
(A.33)
Anhang B
Ergänzungen zu Kap. 1 und 2
B.1
Kinematik der Compton-Streuung
Die Streuung eines Röntgenquants an einem ruhenden Elektron wird in Abb. B.1 gezeigt. Vor
Abbildung B.1: Impulsbilanz bei der Compton-Streuung.
dem Stoss hat das Photon die Energie ~ω und den Impuls ~k mit |k| = k = ω/c, nach dem
Stoss hat es die Energie ~ω 0 und den Impuls ~k0 . Die Geschwindigkeit v des Elektrons nach
dem Stoss ist bei der Compton-Streuung von Röntgenquanten wesentlich kleiner als die Lichtgeschwindigkeit c, wir dürfen daher mit den nichtrelativistischen Formeln für Energie und Impuls
des Elektrons rechnen:
p2
Ekin =
,
p = me v
2me
Der Energie- und Impulssatz lauten
p2
2me
0
~k = ~k + p
~ω = ~ω 0 +
Das Elektron wird bei der Compton-Streuung meistens nicht nachgewiesen, daher versuchen
wir, seinen Impuls zu eliminieren. Die Komponenten des Impulses p parallel und senkrecht zur
Einfallsrichtung sind
p cos φ = ~k − ~k 0 cos θ
p sin φ = ~k 0 sin θ
Die beiden Gleichungen werden quadriert und danach addiert:
p2 = ~2 (k 2 − 2kk 0 cos θ + k 02 )
118
Nun wird der Energiesatz benutzt, um p2 zu eliminieren
p2 = 2me ~(ω − ω 0 ) = 2me c~(k − k 0 )
Einsetzen in die vorige Gleichung ergibt
∆k = k − k 0 =
~
(k 2 − 2kk 0 cos θ + k 02 )
me c
In den meisten Fällen ist ∆k k und man kann auf der rechten Seite k 0 durch k ersetzen,
woraus folgt
~k 2
∆k =
(1 − cos θ)
2me c
Nun benutzen wir λ = 2π/k und λ0 = 2π/k 0 . Die Wellenlänge als Funktion des Streuwinkels ist
gegeben durch die Comptonsche Streuformel
λ0 = λ +
2π~
(1 − cos θ)
me c
(B.1)
Genau die gleiche Formel findet man bei Anwendung der relativistischen Mechanik.
B.2
Die Kontinuitätsgleichung
Wenn ein Teilchen eine scharf definierte Energie hat, kann man die Gesamtwellenfunktion in der
Form
Ψ(x, t) = ψ(x) exp(−iωt)
schreiben. In diesem Fall ist die Wahrscheinlichkeitsdichte unabhängig von der Zeit
ρ(x) = Ψ∗ (x, t)Ψ(x, t) = ψ ∗ (x)ψ(x) .
(B.2)
Im Allgemeinen ist jedoch ρ = ρ(x, t) eine Funktion der Zeit, also
∂Ψ∗
∂Ψ
∂ρ
=
Ψ + Ψ∗
6= 0 .
∂t
∂t
∂t
(B.3)
Aber auch in diesem Fall hat das Integral über die Wahrscheinlichkeitsdichte immer den Wert
1, da im Rahmen der nichtrelativistischen Quantenmechanik eine Teilchenerzeugung oder vernichtung unmöglich ist1 . Daher muss die Wahrscheinlichkeit, das Elektron irgendwo im Raum
zu finden, immer 1 bleiben. Um das mathematisch zu beweisen, benutzen wir die Schrödingergleichung und die konjugiert komplexe Gleichung.
∂Ψ
∂t
∂Ψ∗
−i ~
∂t
i~
~2 ∂ 2 Ψ
+ V (x, t) Ψ(x, t)
2m ∂x2
~2 ∂ 2 Ψ∗
= −
+ V (x, t) Ψ∗ (x, t) .
2m ∂x2
= −
Die erste Gleichung wird von links mit Ψ∗ (x, t) multipliziert, die zweite von rechts mit Ψ(x, t)
und dann werden die Gleichungen subtrahiert. Das Resultat ist
∗
2
~2 ∂ 2 Ψ∗
∂Ψ
∗ ∂Ψ
∗ ∂ Ψ
i~
Ψ+Ψ
=−
Ψ−Ψ
.
∂t
∂t
2m ∂x2
∂x2
1
Die relativistischen Verallgemeinerungen der Schödingergleichung, die Klein-Gordon- und die Dirac-Gleichung,
können Erzeugungs- und Vernichtungsprozesse beschreiben.
119
Durch Kombination mit (B.3) erhalten wir
i~ ∂
∂ρ
=
∂t
2m ∂x
∂Ψ∗
∂Ψ
Ψ − Ψ∗
∂x
∂x
.
Die Wahrscheinlichkeits-Stromdichte wird definiert durch
i~ ∂Ψ∗
∗ ∂Ψ
j(x, t) = −
.
Ψ−Ψ
2m ∂x
∂x
(B.4)
Es ergibt sich die Kontinuitätsgleichung
∂ρ ∂j
+
=0.
∂t
∂x
(B.5)
Diese Gleichung ist Ausdruck für einen Erhaltungssatz: wenn sich die Wahrscheinlichkeitsdichte
in einem Bereich [x, x + dx] ändert, so ist das nur über einen Teilchenstrom möglich. Für
eine ebene Welle Ψ(x, t) = A exp(ikx − iωt) wird ρ = |A|2 und j = ρ~k/m = ρv; beide sind
unabhängig von x und t.
Wir können jetzt beweisen, dass die Gesamtwahrscheinlichkeit konstant ist. Wenn man die
Kontinuitätsgleichung über den ganzen Raum integriert, so folgt
Z +∞
Z +∞
∂
∂j
ρ(x, t)dx = −
dx = j(−∞) − j(+∞) .
∂t −∞
−∞ ∂x
Wegen Ψ(x, t) → 0 und ∂Ψ/∂x → 0 für x → ±∞ gilt j(±∞) = 0. Also ist die zeitliche Ableitung
des Integrals null, und es gilt
Z +∞
Z +∞
ρ(x, t) dx =
ρ(x, 0) dx = 1
−∞
−∞
für jeden Wert von t.
120
Anhang C
Ergänzungen zu Kap. 3
C.1
Ergänzung zum Potentialtopf mit unendlich hohen Wänden
Die Eigenfunktionen
ψn (x) =
r
n π x
2
sin
a
a
(C.1)
bilden ein orthonormiertes (d.h. orthogonales und normiertes) Funktionensystem.
Z
0
a
∗
ψm
(x) ψn (x) dx
Z
m π x
n π x
2 a
=
sin
sin
dx
a 0
a
a
Z (m − n) π x
(m + n) π x
1 a
cos
− cos
dx
=
a 0
a
a
= δmn .
(C.2)
Jede Funktion, die mit den Randbedingungen ψ(0) = ψ(a) = 0 verträglich ist, kann als Linearkombination der Eigenfunktionen dargestellt werden
ψ(x) =
X
cn ψn (x) .
(C.3)
n
Im vorliegenden Fall ist dies die Fourierreihe. Die Koeffizienten werden wie folgt berechnet
Z a
cn =
ψn∗ (x) ψ(x) dx .
(C.4)
0
Man kann die ψn (x) als paarweise orthogonale Einheitsvektoren in einem unendlich-dimensionalen
Vektorraum auffassen. Berechnen wir die Norm von ψ, so ergibt sich
Z a
X
ψ ∗ (x) ψ(x) dx =
|cn |2 = 1
(C.5)
0
n
Daraus wird ersichtlich, dass ein durch die Wellenfunktion ψ(x) beschriebenes Teilchen mit
der Wahrscheinlichkeit |cn |2 im Zustand ψn (x) gefunden wird und dass dementsprechend bei
einer Messung der Energie mit der Wahrscheinlichkeit |cn |2 der Wert En herauskommt. Der
Mittelwert der Energie ist
X
< E >=
|cn |2 En .
(C.6)
n
121
C.2
Der Potentialtopf mit endlicher Tiefe
In diesem Fall ist es zweckmäßig, das Potential symmmetrisch zu x = 0 anzuordnen, weil dann
die Eigenfunktionen entweder gerade oder ungerade Funktionen von x sind. Auf diese Weise
braucht man nur eine Randbedingung zu betrachten. Wir wählen also
V (x) = −V0
V (x) = 0
−b<x<b
für
(b = a/2)
für |x| > b .
(C.7)
Innerhalb des Topfes erhalten wir eine Cosinusfunktion (gerade) oder Sinusfunktion (ungerade).
Ich betrachte zunächst nur die geraden Lösungen. Das Teilchen soll sich im Potentialtopf befinden, die Energie ist also negativ (−V0 < E < 0).
Die Schrödingergleichung lautet für |x| < b = a/2 :
p
2m(E + V0 )
d2 ψ1
2
+ k ψ1 = 0 mit k =
.
2
dx
~
Wir machen den Lösungsansatz:
ψ1 (x) = A cos(kx) .
(C.8)
Außerhalb des Topfes (x > b) lautet die Schrödingergleichung
p
2m|E|
d2 ψ2
2
− α ψ2 = 0 mit α =
2
dx
~
mit der allgemeinen Lösung
ψ2 (x) = Be−αx + Ce+αx .
Für x → ∞ muss ψ gegen null gehen, daher ist C = 0. Die Stetigkeit von ψ und
führt zu den Gleichungen
(C.9)
ψ0
bei x = b
A cos(kb) = Be−αb
−A k sin(kb) = −B αe−αb .
Dividieren wir die zweite Gleichung durch die erste, so folgt
tan(kb) =
α
.
k
(C.10)
Dies ist eine Bestimmungsgleichung für die Energie, denn k und α sind beide Funktionen der
Energie. Zur Lösung erweist es sich als zweckmäßig, zwei neue Größen einzuführen:
√
b 2mV0
u = kb , u0 =
.
~
Damit wird aus (C.10)
tan u =
p
(u0 /u)2 − 1 .
Man kann diese Gleichung noch umschreiben in
| cos u| = u/u0 ,
(C.11)
wobei die Nebenbedingung tan(u) > 0 einzuhalten ist. Für die ungeraden Wellenfunktionen
(ψ1 (x) = A sin(kx)) findet man analog
p
1
= − (u0 /u)2 − 1
tan u
122
1
c( u )
s( u )
0.5
u
u0
0
0
2
4
6
8
u
Abbildung C.1: Graphische Lösung der Gleichungen c(u) = | cos u| = u/u0 (mit der Nebenbedingung
tan u > 0) und s(u) = |sin(u)| = u/u0 (Nebenbedingung tan u < 0) zur Bestimmung der Energieniveaus.
Rote Kurven: Funktion c(u), grüne Kurven: Funktion s(u).
und daraus ergibt sich
| sin u| = u/u0
(C.12)
mit der Nebenbedingung tan u < 0.
Die Lösungen der Gleichungen (C.11) und (C.12) bestimmt man numerisch oder graphisch (siehe
Abb. C.1). Wie man sieht, gibt es endlich viele Schnittpunkte der Kurven, also endlich viele
Energieniveaus. Für einen Topf der Tiefe −V0 = −10 eV und Breite a = 1 nm sind die Wellenfunktionen und die zugehörigen Energieniveaus eines Elektrons in Abb. 3.2 skizziert.
C.3
Der zweidimensionale Potentialtopf
Um die Lösung der Schrödingergleichung in mehr als einer Raumdimension zu demonstrieren,
betrachten wir als einfachstes Beispiel einen zweidimensionalen Potentialtopf mit unendlich hohen Wänden und quadratischer Grundfläche. Das Potential habe die Form
V (x, y)
=
0
V (x, y) → ∞
für
0 < x < a, 0 < y < a
für x < 0 , x > a oder für y < 0 , y > a
Die Schrödingergleichung im Bereich 0 < x < a, 0 < y < a lautet
~2 ∂ 2 ψ ∂ 2 ψ
−
+
= E ψ(x, y) .
2m ∂x2
∂y 2
(C.13)
In den übrigen Bereichen muss ψ(x, y) verschwinden, da dort das Potential unendlich groß ist.
Wir erhalten somit die Randbedingungen
ψ(0, y) = 0 , ψ(a, y) = 0 , ψ(x, 0) = 0 , ψ(x, a) = 0
(C.14)
Eine mit den Randbedingungen bei x = 0 oder y = 0 verträgliche Lösung setzen wir als Produkt
von zwei Sinusfunktionen an
ψ(x, y) = A sin(k1 x) sin(k2 y)
(C.15)
123
Damit ψ(x, y) auch bei x = a oder y = a verschwindet, muss für die Wellenzahlen gelten
k1 = n1
π
π
k 2 = n2
n1 , n2 = 1, 2, 3....
a
a
(C.16)
Andererseits folgt aus der Schrödingergleichung für die Energiewerte
E(n1,n2) =
~2 2
~2 π 2 2
(n + n22 )
(k1 + k22 ) =
2m
2ma2 1
Dies ist die Verallgemeinerung der Formel (3.9). Einige der Wellenfunktionen werden in Abb. C.2
gezeigt. Sie gleichen den Eigenschwingungen einer quadratischen Membran.
M11
M32
M21
Abbildung C.2: Konturdarstellung der Wellenfunktionen eines zweidimensionalen Potentialtopfs für die
folgenden Kombinationen der Quantenzahlen: (n1 = 1, n2 = 1), (n1 = 2, n2 = 1)und (n1 = 3, n2 = 2).
C.4
Schrödingergleichung des harmonischen Oszillators
Es ist zweckmäßig, eine neue Variable u = ax einzuführen und die Konstante a so zu wählen,
dass die Schrödingergleichung (3.12) einfacher aussieht. Setzen wir
r
ωm
2E
a=
, b=
,
(C.17)
~
~ω
so ergibt sich die Gleichung
ψ 00 (u) − u2 ψ(u) + b ψ(u) = 0 .
(C.18)
Die Lösungen werden durch eine Kombination von Raten und Konstruieren gefunden. Im Grenzfall u → ∞ kann man den Term bψ(u) im Vergleich zu u2 ψ(u) ignorieren und findet als ungefähre
Lösung
ψ0 (u) ≈ exp(−u2 /2) .
Dies erweist sich sogar als eine exakte Lösung, aber nur für einen ganz bestimmten Wert des
Parameters b. Einsetzen in (C.18) ergibt
ψ000 − u2 ψ0 = −ψ0 = −bψ0 .
Damit Gleichung (C.18) erfüllt ist, muss der Parameter b den Wert b = 1 haben. Mit (C.17)
folgt daraus für die Energie
~ω
.
E0 =
2
124
Um die allgemeine Lösung von (C.18) zu konstruieren, machen wir den Ansatz
ψ(u) = H(u) exp(−u2 /2) ,
wobei
H(u) = a0 + a1 u + a2 u2 + . . .
eine Potenzreihe ist. Dies ist erlaubt, weil jede Lösung der Schrödingergleichung als Potenzreihe
dargestellt werden kann. Durch Einsetzen in (C.18) erhält man die Differentialgleichung
H 00 − 2uH 0 + (b − 1)H = 0 .
Einsetzen der Potenzreihe und Sortieren nach Potenzen von u führt auf die Formeln
2a2 + (b − 1) a0 = 0
6a3 + (b − 3) a1 = 0
12a4 + (b − 5) a2 = 0
20a5 + (b − 7) a3 = 0
...
(C.19)
...
Zwei der Koeffizienten (etwa a0 und a1 ) sind frei wählbar, da eine Differentialgleichung zweiter
Ordnung zwei linear unabhängige Lösungen hat. Die anderen Koeffizienten ergeben sich dann
aus obigen Bedingungen, die man allgemein schreiben kann als
a`+2 =
− (b − 1 − 2`)
a` ,
(` + 1) (` + 2)
` = 0, 1, 2, 3, . . .
(C.20)
Wir wollen zeigen, dass diese Reihe aus physikalischen Gründen abbrechen muss, mit anderen
Worten, dass die Funktionen H(u) Polynome sind. Wenn nämlich die Reihe nicht abbricht,
ergibt sich asymptotisch folgendes Verhältnis der Koeffizienten
a`+2
2
→
a`
`
für ` → ∞ .
Ein solche Verhältnis hat die Potenzreihenentwicklung der Funktion exp(+u2 ). Die Wellenfunktion H(u) exp(−u2 /2) wäre dann proportional zu exp(+u2 /2) und würde für |u| → ∞
divergieren, was physikalisch unakzeptabel ist.
Die Reihe bricht genau dann bei einer bestimmten Potenz ab, wenn der Parameter b gleich einer
ungeraden natürlichen Zahl ist:
b = 2n + 1
n = 0, 1, 2, 3, . . .
Die Serie der Koeffizienten a` endet dann bei ` = n.
Bei geradem n kann man durch Wahl von a1 = 0 alle Koeffizienten mit ungeradem Index zu null
machen, bei ungeradem n werden durch die Wahl a0 = 0 alle Koeffizienten mit geradem Index zu
Null gemacht. Dies ist eine interessante Beobachtung: die Polynome H(u) enthalten entweder
immer nur gerade Potenzen von u oder immer nur ungerade Potenzen. Der physikalische Grund
dafür ist die Symmetrie des Potentials V (x) = C2 x2 zu x = 0, die Wellenfunktionen sind
deswegen entweder gerade oder ungerade Funktionen von x :
ψ(−x) = ±ψ(x) .
Die Bedingung b = 2n + 1 führt zu den diskreten Energie-Eigenwerten
En = (n + 1/2) ~ω
125
n = 0, 1, 2, 3, . . .
(C.21)
Die normierten Wellenfunktionen des harmonischen Oszillators lauten
r
m ω 1/4
1
mω
2
ψn (x) =
·√
· Hn (u) · exp(−u /2) , u =
x
n
π~
~
2 n!
(C.22)
mit
H0 (u) = 1
H1 (u) = u
2
H3 (u) = 8u3 − 12u
H2 (u) = 4u − 2
...
Bis auf Normierungsfaktoren sind die H(u) mit den Hermite’schen Polynomen identisch.
C.5
Gaussförmiges Wellenpaket
Die räumliche Wahrscheinlichkeitsverteilung werde durch eine Gaussfunktion beschrieben (Kap.
3.4.3). Wir betrachten zunächst den Zeitpunkt t = 0. Es sei
1
x2
2
ρ(x, 0) = |Ψ(x, 0)| = √
exp − 2
2σx
2π σx
Die Wellenfunktion Ψ ist nun wirklich respektabel: sie ist normiert
Z +∞
|Ψ(x, 0)|2 dx = 1
−∞
und beschreibt ein Teilchen mit der Ortsunschärfe ∆x = σx . Als weitere Vereinfachung nehmen
wir zunächst an, dass das Teilchen ruht, genauer gesagt, dass der mittlere Impuls p0 = ~k0 = 0
ist. Die AmplitudenfunktionpA(k) berechnen wir durch Fouriertransformation. Die Fouriertransformierte von Ψ(x, 0) = ρ(x, 0) ergibt sich zu
A(k) ∝ exp(−k 2 σx2 ) .
Die Wahrscheinlichkeitsdichte im k-Raum ist auch eine Gaussfunktion.
k2
2
2
2
|A(k)| ∝ exp(−k · 2σx ) ≡ exp − 2 ,
2σk
(C.23)
wobei die folgende wichtige Beziehung zwischen den Varianzen besteht
2σk2 =
1
2σx2
⇒
σx σk =
1
.
2
(C.24)
Die Ortsunschärfe des Teilchens ist ∆x = σx , die Impulsunschärfe ∆px = ~σk . Daraus folgt die
fundamentale Beziehung
~
∆x · ∆px =
(C.25)
2
Wenn man jetzt auch noch zulässt, dass k0 6= 0 ist und somit das Wellenpaket ein Teilchen
repräsentiert, das sich mit der Geschwindigleit v0 = ~k0 /m bewegt, so ergibt eine aufwändige
Rechnung [?] für die zeitabhängige Wahrscheinlichkeitsdichte
(x − v0 t)2
1
ρ(x, t) = √
exp −
(C.26)
2(σ(t))2
2π σ(t)
126
Das Wellenpaket bewegt sich wie gewünscht mit der Geschwindigkeit v0 in x-Richtung. Es hat
aber eine sehr unerfreuliche Eigenschaft: seine Breite nimmt im Laufe der Zeit zu
s
~2
σ(t) = σx2 +
· t2 ,
(C.27)
4m2 σx2
und gleichzeitig sinkt die Höhe ab. Man sagt, das Wellenpaket “zerfließt”, siehe Abb. 3.6. Das
Integral, die Fläche unter der Kurve, bleibt invariant.
127
Anhang D
Ergänzungen zu Kap. 4
D.1
Der Begriff des Operators
Alle physikalischen Messgrößen werden in der Quantentheorie durch Operatoren repräsentiert.
Ein Operator ist eine Rechenvorschrift, die auf die Wellenfunktion angewandt wird. Die Anwendung eines Operators auf eine Funktion liefert in der Regel eine andere Funktion. Wir
d
betrachten als Beispiel den Differentialoperator dx
. Wenden wir ihn auf die quadratische Funk2
tion x an, so ergibt sich die lineare Funktion 2x. Eine Gleichung, bei der links ein Operator
auf eine Funktion angewandt wird und rechts dieselbe Funktion steht, multipliziert mit einer
Konstanten, nennen wir eine Eigenwertgleichung. Die Funktionen, die die Gleichung erfüllen,
heissen die Eigenfunktionen des Operators, die rechts stehenden Konstanten sind die Eigenwerte.
d
Die Eigenfunktionen des Differentialoperators dx
sind die Exponentialfunktionen eax mit einer
beliebigen reellen Zahl a, denn es gilt
d ax
e = aeax
dx
Der Eigenwerte sind die Zahlen a.
D.2
Selbstadjungierte Operatoren
b definiert man den adjungierten Operator A
b† durch die Gleichung
Zu einem Operator A
Z +∞
Z +∞
∗
b
b† φ(x))∗ ψ(x) dx .
φ (x)(Aψ(x)) dx =
(A
−∞
(D.1)
−∞
b† = A
b gilt. Die Eigen- und ErwarEin Operator heißt selbstadjungiert oder hermitesch, wenn A
b
tungswerte eines selbstadjungierten Operators A sind reell. Es gilt nämlich
b = hAφ|ψi
b
hφ| Aψi
oder mit Integralen geschrieben
Z +∞
Z
∗
b
φ (x)(Aψ(x)) dx =
−∞
+∞
−∞
∗
b
(Aφ(x))
ψ(x) dx .
(D.2)
(D.3)
Setzt man in diese Beziehung φ = ψ ein, so erkennt man sofort, dass die Eigen- und Erwartungswerte reell sind. Da Observable grundsätzlich reelle Messwerte haben müssen, stellt man
das Postulat auf, dass alle Operatoren der Quantenmechanik selbstadjungiert sind.
128
Der Hamilton- und Ortsoperator sind beide reell und daher auch selbstadjungiert. Um diese
Eigenschaft für den Impulsoperator nachzuweisen, muss man Gleichung (4.22) partiell integrieren
Z +∞
Z +∞ ∂ψ(x)
∂ψ(x) ∗
+∞
∗
∗
ψ (x)(−i~)
dx = [−i~ψ (x) ψ(x)]−∞ +
−i~
ψ(x) dx .
∂x
∂x
−∞
−∞
Der erste Term auf der rechten Seite verschwindet wegen ψ(x) → 0 für |x| → ∞. Somit ist
Gleichung (D.1) erfüllt.
D.3
Gleichzeitige Messbarkeit
Ein grundlegendes Theorem der Quantenmechanik lautet:
Zwei physikalische Größen (Observable) können genau dann gleichzeitig präzise Werte annehmen, wenn die zugehörigen Operatoren vertauschbar sind, und das wiederum ist gleichbedeutend
damit, dass die beiden Operatoren einen vollständigen Satz gemeinsamer Eigenfunktionen haben.
b und B,
b die einen
Um dies Theorem zu beweisen, betrachten wir zuerst zwei Operatoren A
vollständigen Satz gemeinsamer Eigenfunktionen ψn besitzen. Wir wollen zeigen, dass diese
Operatoren dann notwendigerweise kommutieren. Es gelte also
b n = an ψn ,
Aψ
b n = bn ψn
Bψ
für alle n .
Eine beliebige Funktion ψ(x) können wir nach dem vollständigen System entwickeln
X
ψ(x) =
cn ψn (x) .
n
Anwenden der Operatoren ergibt:
b ( Bψ)
b
b
A
= A
und entsprechend
b
= A
X
n
X
b n
cn Bψ
cn bn ψn =
n
b ( Aψ)
b =
B
X
cn (bn an )ψn
n
X
cn (an bn )ψn .
n
Für eine beliebige Funktion ψ(x) gilt demnach
bB
b−B
b A)ψ
b =0
(A
⇒
b B
b] = 0,
[ A,
d.h. die Operatoren sind vertauschbar. Damit ist natürlich auch bewiesen, dass nicht vertauschbare Operatoren keinen vollständigen Satz gemeinsamer Eigenfunktionen besitzen1 .
Im zweiten Schritt muss die Umkehrung gezeigt werden, dass nämlich vertauschbare Operatoren einen vollständigen Satz gemeinsamer Eigenfunktionen besitzen. Seien die ψn die Eigenb
funktionen des Operators A
b ψn = an ψn .
A
1
Die Betonung liegt hier auf dem Wort vollständig. Es kann durchaus vorkommen, dass gewisse Funktionen
gemeinsame Eigenfunktionen nicht vertauschbarer Operatoren sind. Als Beispiel betrachten wir die Eigenfunktionen ψn,l,m (r, θ, φ) des Wasserstoffatoms, siehe Kap. 6. Für l = 0 und m = 0 sind sie sowohl Eigenfunktionen von
b z als auch von L
b x und L
b y , obwohl die Komponenten des Drehimpulsoperators nicht untereinander vertauschbar
L
bz .
sind. Allerdings sind die ψn,l,m mit l 6= 0 nur noch Eigenfunktionen von L
129
Zur Vereinfachung nehmen wir hier an, dass die Eigenwerte an alle verschieden sind (keine
b auf eine beliebige dieser Eigenfunktionen angewandt:
Entartung). Jetzt wird der Operator B
b ψn .
φn = B
b ist:
Es ist nun leicht zu sehen, dass φn ebenfalls eine Eigenfunktion von A
b n = A
bBψ
b n=B
b Aψ
b n
Aφ
b n = an φn .
= an Bψ
b n =
Hier ist die Vertauschbarkeit der Operatoren benutzt worden. Es gilt also in der Tat: Aφ
an φn . Da wir vorausgesetzt haben, dass alle Eigenwerte verschieden sind, darf sich φn nur durch
einen konstanten Faktor von ψn unterscheiden: φn = bn ψn . Daraus sehen wir
b n = bn ψn
Bψ
b sind auch Eigenfunktionen von
für alle n, mit anderen Worten, alle Eigenfunktionen ψn von A
b
B.
Im Fall der Entartung wird der Beweis komplizierter, es ist aber möglich, einen gemeinsamen
Satz von Eigenfunktionen zu konstruieren (siehe etwa W. Greiner, Quantenmechanik).
D.4
Orts- und Impulsraum
Wir haben schon bei der Diskussion der Wellenpakete gesehen, dass das Fourierintegral eine
zentrale Rolle in der Quantenmechanik spielt. Das soll jetzt noch weiter analysiert werden. Die
Fouriertransformierte existiert für jede Funktion f (x), die quadrat-integrabel ist, d. h. für die
das Integral
Z
+∞
−∞
|f (x)|2 dx
einen endlichen Wert hat. Gemäß Anhang A.4.2 lautet die Fourierdarstellung einer Funktion
f (x) und ihre Umkehrung
Z ∞
Z ∞
1
1
˜
˜
f (x) = √
f (k) exp(ikx)dk ,
f (k) = √
f (x) exp(−ikx)dx
2π −∞
2π −∞
√
In der Quantentheorie gilt k = p/~. Setzen wir f (x) = ψ(x) und f˜(k) = ~ φ(p), so ergibt sich
Z +∞
Z +∞
1
ipx
1
ipx
ψ(x) = √
φ(p) exp
dp ,
φ(p) = √
ψ(x) exp −
dx . (D.4)
~
~
2π~ −∞
2π~ −∞
Wir nennen φ(p) die Impulsraum-Wellenfunktion. Wenn man die Ortsraum-Wellenfunktion ψ(x)
kennt, kann man die Impulsraum-Wellenfunktion φ(p) mit Hilfe des Fourierintegrals berechnen
und umgekehrt. Beide Funktionen sind auf 1 normiert:
Z +∞
Z +∞
2
|ψ(x)| dx =
|φ(p)|2 dp = 1 .
(D.5)
−∞
−∞
Die Wahrscheinlichkeitsinterpretation kann auch auf den Impulsraum angewandt werden. Die
Wahrscheinlichkeit, das Teilchen mit einem Impuls zwischen p und p + dp zu finden, ist
|φ(p)|2 dp .
130
Anhang E
Ergänzungen zu Kap. 5
E.1
b in einem Zentralpotential
Rotationsinvarianz von H
In einem Zentralpotential V = V (r) ist der Hamilton-Operator
2
2
2
2
b =−~ · ∂ + ∂ + ∂
H
+ V (r)
2m
∂x2 ∂y 2 ∂z 2
(E.1)
rotationsinvariant. Um dies nachzuweisen, betrachten wir eine Rotation um die z-Achse.
x0 = x cos ϕ + y sin ϕ
y 0 = −x sin ϕ + y cos ϕ
z
0
x = x0 cos ϕ − y 0 sin ϕ
y = x0 sin ϕ + y 0 cos ϕ
(E.2)
= z.
Es ist leicht zu sehen, dass die Länge des Ortsvektors in beiden Koordinatensystemen gleich ist
(anschaulich ist das evident):
r0
2
= (x cos ϕ + y sin ϕ)2 + (−x sin ϕ + y cos ϕ)2 + z 2
= x2 (cos2 ϕ + sin2 ϕ) + y 2 (cos2 ϕ + sin2 ϕ) + z 2 = r2 .
Im rotierten System lautet der Hamilton-Operator
2
~2
∂
∂2
∂2
0
b
H =−
·
+
+
+ V (r0 )
2m
∂x02 ∂y 02 ∂z 02
(E.3)
Das Potential V (r) = V (r0 ) ist offensichtlich rotationsinvariant. Die Ableitung der Wellenfunktion nach den neuen Koordinaten wird mit Hilfe der Kettenregel berechnet
∂ψ
∂ψ ∂x
∂ψ ∂y
∂ψ
∂ψ
=
+
= cos ϕ
+ sin ϕ
.
0
0
0
∂x
∂x ∂x
∂y ∂x
∂x
∂y
Daraus folgt
∂2ψ
∂2ψ
∂2ψ
+
+
∂x02 ∂y 02 ∂z 02
∂ψ
∂ψ
∂ψ 2
∂ψ 2 ∂ 2 ψ
=
cos ϕ
+ sin ϕ
+ − sin ϕ
+ cos ϕ
+
∂x
∂y
∂x
∂y
∂z 2
∂2ψ ∂2ψ ∂2ψ
=
+
+
.
(E.4)
∂x2
∂y 2
∂z 2
b0 = H
b bewiesen.
Damit ist H
131
E.2
Vertauschbarkeit von Hamilton- und Drehimpulsoperator
Bei einem Zentralpotential ist der Hamilton-Operator rotationsinvariant, man sollte daher verb kommutiert. Dies ist in der Tat der Fall, es gilt
b mit L
muten, dass H
b L
b x ] = [ H,
b L
b y ] = [ H,
b L
bz ] = 0 .
[ H,
(E.5)
Wir beweisen diese Relation für die z-Komponente und betrachten zuerst den V (r)-Term.
∂V
∂V
b
b
Lz V (r)ψ − V (r)Lz ψ = −i~ x
ψ
−y
∂y
∂x
Wegen
∂V
∂V y ∂V
∂V x
=
,
=
∂y
∂r r ∂x
∂r r
ist die eckige Klammer null. Für den kinetischen Energie-Term folgt
2
2
∂
∂
∂
∂
∂
∂2
∂2
∂
x
ψ−
x
ψ
−y
+
+
−y
∂y
∂x
∂x2 ∂y 2
∂x2 ∂y 2
∂y
∂x
∂ ∂ψ
∂ ∂ψ
−
=0.
=
∂x ∂y
∂y ∂x
b und L
b z kommutieren, kann man gemeinsame Eigenfunktionen finden.
Da H
b x und L
b y mit H.
b
Aus Symmetriegründen vertauschen auch L
E.3
Der Drehimpuls in Kugelkoordinaten
Die Kugelkoordinaten (r, θ, ϕ) sind mit den kartesischen Koordinaten (x, y, z) durch folgende
Beziehungen verknüpft:
x = r sin θ cos ϕ
y = r sin θ sin ϕ
(E.6)
z = r cos θ .
Für die Differentiale ergibt sich
dx = sin θ cos ϕ dr + r cos θ cos ϕ dθ − r sin θ sin ϕ dϕ
dy = sin θ sin ϕ dr + r cos θ sin ϕ dθ + r sin θ cos ϕ dϕ
(E.7)
dz = cos θ dr − r sin θ dθ .
Man kann daraus die Differentiale der Kugelkoordinaten berechnen:
dr = sin θ cos ϕ dx + sin θ sin ϕ dy + cos θ dz
1
dθ =
(cos θ cos ϕ dx + cos θ sin ϕ dy − sin θ dz
r
1
dϕ =
(− sin ϕ dx + cos ϕ dy) .
r sin θ
Die partiellen Ableitungen werden wie folgt umgerechnet:
∂
∂r ∂
∂θ ∂
∂ϕ ∂
=
+
+
.
∂x
∂x ∂r ∂x ∂θ
∂x ∂ϕ
132
(E.8)
Das Ergebnis ist
∂
∂x
∂
∂y
∂
∂z
∂
cos θ cos ϕ ∂
sin ϕ ∂
+
−
∂r
r
∂θ r sin θ ∂ϕ
∂
cos θ sin ϕ ∂
cos ϕ ∂
= sin θ sin ϕ
+
+
∂r
r
∂θ r sin θ ∂ϕ
∂
sin θ ∂
= cos θ
−
.
∂r
r ∂θ
= sin θ cos ϕ
(E.9)
Mit den Formeln (E.9) kann man die Drehimpuls-Operatoren in Kugelkoordinaten umrechnen.
b z vorgeführt. Schreiben wir diesen Operator in der Form
Das wird für L
∂
∂
∂
∂
∂
b
Lz = −i~ x
= −i~ cr
,
−y
+ cθ
+ cϕ
∂y
∂x
∂r
∂θ
∂ϕ
so ergibt sich für die Koeffizienten
cr = r sin θ cos ϕ sin θ sin ϕ − r sin θ sin ϕ sin θ cos ϕ = 0
cθ = r sin θ cos ϕ cos θ sin ϕ/r − r sin θ sin ϕ cos θ cos ϕ/r = 0
cϕ = r sin θ cos ϕ cos ϕ/(r sin θ) − r sin θ sin ϕ (− sin ϕ/(r sin θ)) = cos2 ϕ + sin2 ϕ = 1 .
b 2 berechnet man entsprechend. Das Resultat ist
Die x- und y-Komponenten und L
∂
∂
b
Lx = −i~ − sin ϕ
− cos ϕ cot θ
∂θ
∂ϕ
∂
∂
b
Ly = −i~ cos ϕ
− sin ϕ cot θ
∂θ
∂ϕ
b z = −i~ ∂
L
∂ϕ
2
1
∂2
1 ∂
∂
2
b
L = −~
+
sin θ
∂θ
sin2 θ ∂ϕ2 sin θ ∂θ
E.4
(E.10)
Algebraische Behandlung des Drehimpulses
In diesem Abschnitt sollen die wichtigsten Eigenschaften von Drehimpulsen in der Quantenmechanik allein aus den Vertauschungsregeln (5.7) hergeleitet werden. Die in diesem Kapitel
benutzte algebraische Methode wird in der Kern- und Elementarteilchenphysik verallgemeinert,
um den Isospin und das Quark-Modell zu beschreiben.
bx , L
by , L
b z , die den Vertauschungsregeln
Betrachtet werden nun drei Operatoren L
bz ,
bx , L
b y ] = i~L
[L
by , L
b z ] = i~L
bx ,
[L
bz , L
b x ] = i~L
by
[L
(E.11)
gehorchen. Dann kann man leicht nachweisen (s. Gl. (5.8)), dass alle drei Komponenten mit
b 2 kommutieren:
L
b 2 ] = 0 , [L
b 2 ] = 0 , [L
b2 ] = 0 .
bx , L
by , L
bz , L
[L
(E.12)
b 2 und L
b z zu finden. Diese
Es ist daher möglich, gemeinsame Eigenzustände der Operatoren L
Eigenzustände bezeichnen wir mit Dirac-Ket-Vektoren | l, mi, wobei l und m die Quantenzahlen
angeben:
b 2 | l, mi = l(l + 1)~2 | l, mi , L
b z | l, mi = m~| l, mi .
L
(E.13)
133
Diese Eigenzustände sind Eigenfunktionen (die Kugelfunktionen) im Fall des Bahndrehimpulses
und Eigenvektoren im Fall des Spins (s. Kap. 5). Im Augenblick wird über die Quantenzahlen
l, m keine Voraussetzung gemacht, es können beliebige reelle Zahlen sein, wobei allerdings l ≥ 0
b 2 nicht negativ sein können.
sein muss, da die Eigenwerte von L
Es werden nun zwei Leiter-Operatoren definiert: der Aufsteige-Operator ist
(E.14)
der Absteige-Operator
b+ = L
b x + iL
by ,
L
(E.15)
Das Produkt dieser Operatoren ist
b− = L
b x − iL
by .
L
b2 − L
b+ L
b− = L
b2 + L
b 2 − i[L
bx , L
by ] = L
b 2 + ~L
bz
L
x
y
z
b2 − L
b− L
b+ = L
b2 + L
b 2 + i[L
bx , L
by ] = L
b 2 − ~L
bz .
L
x
y
z
(E.16)
b + genügt folgenden Vertauschungsregeln
Der Operator L
bz , L
b + ] = +~L
b+ ,
[L
b 2, L
b+ ] = 0 .
[L
(E.17)
b + auf eine EigenfunkDie Gleichungen (E.17) haben eine wichtige Konsequenz: wenden wir L
tion | l, mi an, so kommt entweder null heraus, oder wir erhalten eine Eigenfunktion zu den
Eigenwerten l, (m + 1).
b 2 (L
b 2 | l, mi = l(l + 1)~2 (L
b + | l, mi) = L
b+ L
b + | l, mi)
L
b z (L
b + | l, mi) = L
b+ L
b z | l, mi + ~L
b + | l, mi = (m + 1)~(L
b + | l, mi) .
L
b + | l, mi =
Wenn L
6 0 ist, folgt daher
b + | l, mi = C+ (l, m)| l, m + 1i .
L
(E.18)
Diese Gleichung rechtfertigt den Namen Aufsteigeoperator. Die Schrittweite ist ∆m = 1. Entsprechend zeigt man, dass
b − | l, mi = C− (l, m)| l, m − 1i
L
(E.19)
b − | l, mi 6= 0 ist.
gilt, sofern L
Wie gross bzw. wie klein kann m werden? Wir behaupten, dass mmax = +l und mmin = −l
ist. Zuerst wird gezeigt, dass m2 ≤ l(l + 1) sein muss. Dazu berechnet man den Erwartungswert
b 2 auf zwei Weisen:
von L
2
b | l, mi = l(l + 1)~2
hl, m|L
b 2 | l, mi + hl, m|L
b 2 | l, mi + hl, m|L
b 2 | l, mi
= hl, m|L
x
y
z
2 2
≥ m ~ .
b 2 i ≥ 0 und hL
b 2 i ≥ 0 sind. Es gibt daher ein
Die Ungleichung folgt, weil die Erwartungswerte hL
x
y
maximales m :
b + | l, mmax i = 0 .
m = mmax ⇒ L
134
Wendet man den Aufsteigeoperator auf | l, mmax i an, so kommt null heraus, da andernfalls ein
Zustand mit m > mmax existieren würde. Um zu zeigen, dass mmax = l ist, berechnen wir den
b + im Zustand | l, mmax i:
b− L
Erwartungswert von L
b + | l, mmax i = 0
b− L
hl, mmax |L
b2 − L
b 2 − ~L
b z | l, mmax i
= hl, mmax |L
z
= [l(l + 1) − mmax (mmax + 1)]~2
⇒
mmax = l .
(E.20)
Entsprechend kann bewiesen werden, dass für das minimale m gilt
mmin = −l .
Die Quantenzahl m nimmt folgende Werte an:
m = −l, −l + 1, . . . + l .
(E.21)
Dies sind 2l + 1 Werte, d.h. 2l + 1 ist eine positive ganze Zahl. Es gibt zwei Möglichkeiten:
a) l ist ganzzahlig, l = 0, 1, 2, . . ..
b) l ist halbzahlig, l = 1/2, 3/2, 5/2, . . ..
Die ganzzahligen l-Werte gehören zum Bahndrehimpuls (oder auch zum Spin, z.B. bei Photonen), die halbzahligen ausschliesslich zum Spin.
E.4.1
Berechnung der Faktoren C± (l, m)
Die Anwendung eines Aufsteige-Operators auf einen Zustand | l, mi erhöht die Quantenzahl m
um 1.
b + | l, mi = C+ (l, m)| l, m + 1i .
L
(E.22)
b + | l, mi auf zwei Weisen,
Um die Koeffizienten zu bestimmen, berechnen wir die Norm von ϕ = L
†
b =L
b − ist.
wobei berücksichtigt wird, dass L
+
Daraus folgt
hϕ| ϕi = |C+ (l, m)|2 hl, m| l, mi = |C+ (l, m)|2
b− L
b + | l, mi = [l(l + 1) − m(m + 1)]~2 .
= hl, m|L
C+ (l, m) = ~
Für den Absteige-Operator gilt analog
b − | l, mi = C− (l, m)| l, m − 1i ,
L
p
l(l + 1) − m(m + 1) .
C− (l, m) = ~
p
l(l + 1) − m(m − 1) .
(E.23)
(E.24)
Man erkennt, dass C+ (l, mmax ) = 0 und C− (l, mmin ) = 0 gilt, so dass in der Tat +l der maximale
m-Wert ist und −l der minimale.
E.5
Addition von Bahndrehimpuls und Spin
Es wird das Beispiel l = 1 betrachtet. Wir beginnen mit dem Zustand |j, mj i = |3/2, −3/2i, der
eine eindeutige Darstellung durch die Eigenzustände der Bahndrehimpuls- und Spin-Operatoren
hat (vgl. Abb. 5.6)
|3/2, −3/2i = |1, −1i · |1/2, −1/2i ≡ Y1,−1 · χ− .
135
Nun wird der Aufsteigeoperator angewandt
b |1, −1i) · |1/2, −1/2i + |1, −1i · (Sb+ |1/2, −1/2i)
Jb+ |3/2, −3/2i = (L
√
√+
3 |3/2, −1/2i =
2 |1, 0i · |1/2, −1/2i + |1, −1i · |1/2, +1/2i .
Daraus folgt
|3/2, −1/2i =
r
2
|1, 0i|1/2, −1/2i +
3
r
1
|1, −1i)|1/2, +1/2i .
3
Wendet man Jb+ noch einmal an, so ergibt sich
r
r
1
2
|3/2, +1/2i =
|1, 1i · |1/2, −1/2i +
|1, 0i · |1/2, +1/2i
3
3
(E.25)
(E.26)
und schliesslich
Jb+ |3/2, +1/2i =
√
3 |3/2, +3/2i =
√
3 |1, +1i · |1/2, +1/2i .
Die beiden Zustände mit j = 1/2 sind orthogonal zu den Zuständen |3/2, +1/2i und |3/2, −1/2i:
r
r
2
1
|1/2, +1/2i =
|1, 1i · |1/2, −1/2i −
|1, 0i · |1/2, +1/2i
3
3
r
r
1
2
|1, 0i · |1/2, −1/2i −
|1, −1i · |1/2, +1/2i .
(E.27)
|1/2, −1/2i =
3
3
E.6
Addition von zwei Spins 1/2
Im Helium-Atom können die Spins der beiden Elektronen zu einem Gesamtspin kombiniert
werden. Dies wird in den Abbildungen 5.4 und 5.5 gezeigt. Wir schreiben
und setzen einen Produktzustand an
b=S
b1 + S
b2
S
(E.28)
|s, ms i = |s1 , ms1 i · |s2 , ms2 i ,
b1 nur auf |s1 , ms1 i und S
b2 nur auf |s2 , ms2 i wirkt. Die z-Komponente ist additiv:
wobei S
ms = ms1 + ms2 .
Der Maximalwert ist ms = 1, daher existieren die sogenannten “Triplettzustände” mit der
Spinquantenzahl s = 1. Wir beginnen mit |s, ms i = |1, −1i = |1, −1/2i |1, −1/2i und wenden
den Aufsteigeoperator an
Sb+ |1, −1i = (Sb1+ |1/2, −1/2i) · |1/2, −1/2i + |1/2, −1/2i · (Sb2+ |1/2, −1/2i)
√
2 |1, 0i = |1/2, +1/2i · |1/2, −1/2i + |1/2, −1/2i · |1/2, +1/2i .
Somit folgt
1
|1, 0i = √ (|1/2, +1/2i · |1/2, −1/2i + |1/2, −1/2i · |1/2, +1/2i) .
2
136
(E.29)
Der Singulettzustand s = 0 ist orthogonal dazu
1
|0, 0i = √ (|1/2, +1/2i · |1/2, −1/2i − |1/2, −1/2i · |1/2, +1/2i) .
2
(E.30)
Bildlich kann man die Triplettzustände wie folgt darstellen
|1, +1i
|1, 0i
|1, −1i
= ⇑⇑
1
= √ (⇑ ⇓ + ⇓ ⇑)
2
= ⇓⇓
(E.31)
und den Singulettzustand
1
|0, 0i = √ (⇑ ⇓ − ⇓ ⇑) .
2
b2 mit Eigenwert 2~2 sind.
Wir zeigen jetzt, dass die Triplettzustände Eigenzustände von S
b1 · S
b2 ?
Was ist 2 S
b2 = (S
b1 + S
b2 )2 = S
b2 + S
b2 + 2S
b1 · S
b2 .
S
1
2
b1 · S
b2 = 2 (Sb1x Sb2x + Sb1y Sb2y + Sb1z Sb2z ) = Sb1+ Sb2− + Sb1− Sb2+ + 2Sb1z Sb2z .
2S
b2 auf |1, 1i =⇑ ⇑ angewandt. Wegen Sb1+ Sb2− ⇑ ⇑= Sb1− Sb2+ ⇑ ⇑= 0 folgt
Jetzt wird S
b2 ⇑ ⇑= [S
b2 + S
b2 + 2Sb1z Sb2z ] ⇑ ⇑= 2~2 ⇑ ⇑ .
S
1
2
Interessant wird der Zustand |1, 0i. Unter Benutzung der Regeln
folgt
und insgesamt
Sb1+ Sb2− ⇑ ⇓= 0
Sb1− Sb2+ ⇓ ⇑= 0
Sb1+ Sb2− ⇓ ⇑= ~2 ⇑ ⇓
Sb1− Sb2+ ⇑ ⇓= ~2 ⇓ ⇑
[Sb1+ Sb2− + Sb1− Sb2+ ](⇑ ⇓ + ⇓ ⇑) = ~2 (⇑ ⇓ + ⇓ ⇑)
b2 (⇑ ⇓ + ⇓ ⇑) = (3/2 + 1 − 1/2)~2 (⇑ ⇓ + ⇓ ⇑) = 2~2 (⇑ ⇓ + ⇓ ⇑) .
S
Für den Singulettzustand |0, 0i gilt hingegen
und daher
[Sb1+ Sb2− + Sb1− Sb2+ ](⇑ ⇓ − ⇓ ⇑) = −~2 (⇑ ⇓ − ⇓ ⇑)
b2 (⇑ ⇓ − ⇓ ⇑) = (3/2 − 1 − 1/2)~2 (⇑ ⇓ − ⇓ ⇑) = 0 .
S
137
Anhang F
Ergänzungen zu Kap. 6
F.1
Die Radialgleichung des H-Atoms
Die Differentialgleichung für die Radialfunktion R(r) des H-Atoms lautet
d
dr
2me r2
2 dR
r
−
[V (r) − E] R − l(l + 1)R = 0 .
dr
~2
(F.1)
Wir führen eine Hilfsfunktion u(r) = rR(r) ein. Es gilt dann
d
dr
d2 u
2 dR
r
=r 2 ,
dr
dr
und daher wird die Differentialgleichung für u(r)
−
~2 d2 u
~2 l(l + 1)
+
V
(r)
+
u=Eu.
2me dr2
2me r2
(F.2)
Dies entspricht der eindimensionalen Schrödinger-Gleichung mit einem effektiven Potential
Vef f (r) = V (r) +
~2 l(l + 1)
.
2me r2
(F.3)
Der zweite Term ist eine Rotationsenergie und wird, etwas unpräzise, “Zentrifugalterm” genannt.
Im H-Atom gilt
e2
V (r) = −
,
4πε0 r
und die Gleichung (F.2) wird
~2 d2 u
e2
~2 l(l + 1)
−
+ −
+
u=Eu.
2me dr2
4πε0 r
2me r2
(F.4)
Das effektive Potential für l = 1 wird in Abb. F.1 mit dem Coulomb-Potential verglichen.
Für grosse Abstände gilt: Vef f (r) → 0. Gebundene Zustände sind gekennzeichnet durch eine
Energie E < V (∞) = 0, ungebundene (freie) Zustände haben E > 0. Das ist ähnlich wie
im Sonnensytem: die Planeten sind an die Sonne gebunden und durchlaufen Ellipsenbahnen,
ein Meteor, der mit hoher Geschwindigkeit aus dem Weltall kommt, ist nicht gebunden. Er
durchläuft eine Hyperbelbahn im Gravitationsfeld der Sonne und entweicht wieder in das Weltall.
138
20
Veff( r )
0
VCoul( r )
20
0
5
10
15
20
25
r
a0
Abbildung F.1: Das Coulomb-Potential und das effektive Potential für l = 1.
Wir sind an gebundenen Zuständen interessiert und setzen also E < 0 voraus. Zur Vereinfachung der Gl. (F.4) ist es zweckmässig, folgende Grössen einzuführen
p
2me |E|
me e2
κ=
, ρ = κ r , ρ0 =
.
(F.5)
~
2πε0 ~2 κ
Damit wird aus der Radialgleichung
d2 u
ρ0 l(l + 1)
−
1
−
+
u=0.
dρ2
ρ
ρ2
(F.6)
Um die Lösungen zu finden, betrachten wir zunächst die Grenzfälle sehr grosser und sehr
kleiner Abstände. Im Limes ρ → ∞ wird aus (F.6)
d2 u
=u
dρ2
⇒
u ∝ exp(±ρ) .
Wegen der Bedingung u(∞) = 0 ist die asymptotische Lösung
u(ρ) = exp(−ρ)
Im Limes ρ → 0 dominiert der Term
l(l+1)
ρ2
für ρ 1 .
(wir setzen hier l > 0 voraus), die Gleichung ist dann
d2 u
l(l + 1)
=
u
2
dρ
ρ2
⇒
u ∝ ρl+1 .
Die beiden asymptotischen Formen werden jetzt kombiniert in dem folgenden Lösungsansatz der
kompletten Differentialgleichung (F.6)
l+1
u(ρ) = ρ
exp(−ρ) v(ρ)
mit
v(ρ) =
∞
X
cj ρj .
(F.7)
j=0
Jede Lösung der Gl. (F.6) lässt sich als Potenzreihe darstellen, daher bedeutet die Form (F.7)
keine Einschränkung der Allgemeinheit. Der Vorteil der Abspaltung der Faktoren ρl+1 und
139
exp(−ρ) liegt darin, dass dadurch die Bedingungen für die Koeffizienten cj der Potenzreihe
einfacher werden. Durch Einsetzen in Gl. (F.6) bekommt man eine Differentialgleichung für die
Potenzreihe v(ρ):
d2 v
dv
ρ 2 + 2(l + 1 − ρ) + [ρ0 − 2(l + 1)] v = 0 .
dρ
dρ
Einsetzen der Reihe liefert die folgende Rekursionsformel für die Koeffizienten
cj+1 =
2(j + l + 1) − ρ0
cj .
(j + 1)(j + 2l + 2)
(F.8)
Ähnlich wie beim harmonischen Oszillator wollen wir nun zeigen, dass die Potenzreihe abbrechen
muss, damit die Wellenfunktion nicht divergiert für ρ → ∞. Für grosse j-Werte ist das Verhältnis
aufeinanderfolgender Koeffizienten
cj+1
2j
2
≈ 2 ≈
.
cj
j
j+1
2
tritt auch bei der Potenzreihenentwicklung der Funktion exp(2ρ)
Das Koeffizientenverhältnis j+1
auf. Wenn also die Reihe nicht abbricht, verhält sich die Funktion u(ρ) asymptotisch wie
exp(−ρ) · exp(2ρ) = exp(ρ) und divergiert für ρ → ∞.
Um dies zu vermeiden, müssen wir fordern, dass die Reihe bei einem maximalen j = jmax
aufhört, d.h. dass cj = 0 ist für j > jmax . Es wird jetzt die wichtige Hauptquantenzahl n
eingeführt durch die Gleichung
n = jmax + l + 1 .
(F.9)
Aus c(jmax +1) = 0 folgt dann
ρ0 = 2n .
Dies ist eine Bestimmungsgleichung für die Energie. Benutzen wir Gl. (F.5) und den BohrRadius
4πε0 ~2
a0 =
,
me e2
so wird
κ=
1
,
n a0
und die Energie ergibt sich zu
E = En = −
~2
1
e2
1
=
−
·
· 2
2
2
2 4πε0 a0 n
2 me a0 n
mit
n = 1, 2, 3, . . . .
(F.10)
Wir haben das fundamentale Resultat, dass die Schrödinger-Gleichung genau die Energieniveaus
des Bohrschen Atommodells wiedergibt.
Aus der Rekursionsformel (F.8) und Gl. (F.9) wird klar, dass die Radialfunktionen von der
Hauptquantenzahl n und der Bahndrehimpuls-Quantenzahl l abhängen, während m nicht eingeht. Die Funktion Rnl (r) ist das Produkt der Exponentialfunktion exp(−r/(n a0 )) mit einem
Polynom des Grades n − 1 in der Variablen r/(n a0 ), dessen Koeffizienten mit der Rekursionsformel (F.8) berechnet werden. Die Radialfunktionen sind - ebenso wie die Kugelfunktionen auf 1 normiert und für gleiches l aber verschiedenes n orthogonal:
Z ∞
Rnl (r)Rn0 l (r)r2 dr = δnn0 .
(F.11)
0
140
Sie haben die Gestalt
R1 0 =
R2 0 =
R2 1 =
R3 0 =
R3 1 =
R3 2 =
2
exp(−r/a0 )
3/2
a0
r
r
exp −
√ 3/2 1 −
2a0
2a0
2 a0
r
1
r
exp −
√ 3/2
2a0
6 a0 2a0
!
2
r
2
r 2
r
1
−
2
+
exp
−
√
3/2
3a0 3 3a0
3a0
27 a0
!
r
1
r 2
8
r
−
exp −
√ 3/2
3a0 2 3a0
3a0
9 6 a0
4
r
r 2
exp
−
.
√
3/2
3a0
3a0
9 30 a0
1
(F.12)
Die Wellenfunktionen des H-Atoms
ψnlm (r, θ, ϕ) = Rnl (r) Ylm (θ, ϕ)
(F.13)
bilden ein vollständiges System von normierten und paarweise orthogonalen Eigenfunktionen
b des Wasserstoffatoms.
des Hamiltons-Operators H
Z 2π Z π
Z ∞
2
∗
Rnl (r)Rn0 l0 (r)r dr
hψnlm |ψn0 l0 m0 i =
Ylm θ, ϕ)Yl0 m0 θ, ϕ) sin θdθ dϕ
0
0
0
= δnn0 δll0 δmm0 .
(F.14)
Die Vollständigkeit bedeutet, dass man jede Lösung der zeitabhängigen Schrödingergleichung
des H-Atoms als Superposition der Eigenfunktionen darstellen kann. Wenn Ψ(r, θ, ϕ, t) eine
Lösung der Differentialgleichung
∂Ψ
b
i~
= HΨ
(F.15)
∂t
ist, gibt es eindeutig bestimmte komplexe Koeffizienten cnlm , so dass folgende Darstellung gilt:
Ψ(r, θ, ϕ, t) =
∞ n−1
+l
X
X X
cnlm ψnlm (r, θ, ϕ) exp(−iωn t) .
(F.16)
n=1 l=0 m=−l
Dabei gilt für die Eigenfunktionen
b nlm = En ψnlm
Hψ
und ωn = En /~ .
(F.17)
Die Koeffizienten werden mit Hilfe der Skalarprodukte berechnet:
cnlm = hψnlm |Ψi ,
(F.18)
wobei die Funktion Ψ zum Zeitpunkt t = 0 einzusetzen ist, so dass alle Faktoren exp(−iωn t) = 1
sind. Gleichung (F.18) folgt aus der Orthogonalität der Eigenfunktionen.
141
Anhang G
Ergänzungen zu Kapitel 7
G.1
Energieniveaus im Helium-Atom
Zur Berechnung der Energieniveaus im Helium-Atom schreiben wir den Hamiltonoperator in der
Form
b =H
b1 + H
b 2 + V12
H
mit den Einteilchen-Hamiltonoperatoren
2
2
b 1 = − ~ ∇2 ψj (r j ) − 2e
H
j
2me
4πε0 |r j |
(j = 1, 2)
und dem Wechselwirkungspotential
V12 (r 1 , r 2 ) = +
e2
4πε0 r12
mit
r12 = |r 1 − r 2 |
b im Zustand ψ (1, 2) oder ψ (1, 2). Das Ergebnis
Jetzt berechnen wir den Erwartungswert von H
S
A
ist
D
E
b
ψS (1, 2) H
ψ
(1,
2)
= Ea + Eb + C + A
(G.1)
S
D
E
b
ψA (1, 2) H
(G.2)
ψA (1, 2) = Ea + Eb + C − A
Dabei treten zwei Integrale auf: das Coulomb-Integral
e2
C=
4πε0
ZZ
|ψa (1)|2 |ψb (2)|2
dV1 dV2
r12
(G.3)
ψa∗ (1)ψb (1)ψb∗ (2)ψa (2)
dV1 dV2
r12
(G.4)
und das Austausch-Integral
e2
A=
4πε0
ZZ
Die Integrale können exakt berechnet werden.
142
Anhang H
Ergänzungen zu Kapitel 8
H.1
Korrektur aufgrund der relativistischen Massenzunahme
Die kinetische Energie eines Elektrons ist
Ekin =
p
p2 c2 + m2e c4 − me c2 ≈
p2
p4
−
,
2me 8m3e c2
(H.1)
wobei der erste Term die nichtrelativistische kinetische Energie ist und der zweite Term als kleine
Störung angesehen werden kann. Der Hamilton-Operator wird
b =H
b (0) + H
b (1)
H
mit
2
2
b (0) = pb − e
H
,
2me 4πε0 r
4
b (1) = − pb
H
8m3e c2
(H.2)
Gemäß Gl. (8.8) ist die Verschiebung der Energieniveaus in 1. Ordnung der Störungsrechnung
b (1) |ψn(0) i .
En(1) = hψn(0) |H
Wir müssen daher den Erwartungswert von pb4 = pb2 · pb2 berechnen. Es gilt
woraus folgt
b (0) − V )|ψn(0) i = 2me (En(0) − V )|ψn(0) i ,
pb2 |ψn(0) i = 2me (H
hψn(0) |pb2 · pb2 |ψn(0) i = 4m2e h (En(0) − V )2 i
En(1) = −
1
[(En(0) )2 − 2En(0) hV i + hV 2 i] .
2me c2
Wegen
V (r) = −
e2
4πε0 r
(0)
treten die Erwartungswerte von 1/r und 1/r2 auf, die für ψn = ψn l m folgende Werte haben:
1
1
h i= 2 ,
r
n a0
h
1
1
i= 3
.
r2
n (l + 1/2)a20
(H.3)
Setzt man dies ein, so ergibt sich die Energieverschiebung in 1. Ordnung zu
δEn =
En(1)
(0)
2(En )2
n
3
=−
−
.
me c2
l + 1/2 4
143
(H.4)
Die dimensionslose Feinstrukturkonstante ist definiert durch
α=
e2
1
≈
4πε0 ~c
137
(H.5)
Damit lässt sich die Energieverschiebung aufgrund der relativistischen Massenänderung schreiben
1
me c2 α4
3
M asse
.
(H.6)
δEn
=−
−
2n3
l + 1/2 4n
H.2
Energieaufspaltung bei der Spin-Bahn-Kopplung
Der Hamiltonoperator ist
b =H
b (0) + H
b (1)
H
mit
Zur Vereinfachung schreiben wir
2
2
b (0) = pb − e
H
,
2me 4πε0 r
b (1) =
H
µ0 e2 b b
L·S
8πme r3
(H.7)
µ0 e2
8πme r3
Die Lösungen der Schrödingergleichung können näherungsweise als Produkt von Ortswellenfuntion und Spinfunktion geschrieben werden.
f (r) =
ψnlml (r) · χ
Dabei gilt
b (0) ψnlm (r) · χ = En ψnlm (r) · χ
H
l
l
Gemäss Gl. (8.8) ist die Energieverschiebung
b · Si
b
b (1) |ψnlm (r) χi = hf (r)i · hL
δEn = hψnlml (r) χ|H
l
b · Si
b ist leicht zu berechnen. Aus
Der Erwartungswert hL
folgt
Also
b+S
b
Jb = L
i ~2
2
2
1 h b2
b
b
b
b
hL · Si =
hJ i − h L i − h S i =
[j(j + 1) − l(l + 1) − s(s + 1)]
2
2
b · Si
b =
hL
~2
·
2
l
(−l − 1)
für j = l + 1/2
für j = l − 1/2
Jetzt muss noch der Erwartungswert von f (r) berechnet werden.
Z ∞
µ 0 e2
1
µ0 e2
1 ∗
∗
hf (r)i =
h 3 i=
Rnl
(r) 3 Rnl
(r)r2 dr
8πme r
8πme 0
r
Beispielrechnung für n = 2, l = 1:
R21 (r) = √
1
1
h 3 i=
r
24a50
Z
1
3/2
6 a0
0
∞
r
r
exp −
2a0
2a0
r
1
r exp −
dr =
a0
24a30
144
(H.8)
Die allgemeine Formel lautet für n ≥ 2, l ≥ 1
h
1
1
i= 3 3
3
r
a0 n l(l + 1/2)(l + 1)
Die Energieverschiebung ergibt sich zu
b (1) | ψnlm (r) χ i
δEn = h ψnlml (r) χ |H
l
me c2 α4
l
für j = l + 1/2
=
·
(−l − 1) für j = l − 1/2
4n3 l(l + 1/2)(l + 1)
H.3
(H.9)
Zeitabhängige Störungsrechnung
In Kap. 8.4 haben wir die zeitabhängige Störungsrechnung benutzt, um die Gleichung (8.26)
herzuleiten:
X
Ψ(r, t) = ci (t)Ψi (r, t) +
cj (t)Ψj (r, t)
j6=i
mit der Anfangsbedingung ci (0) = 1, cj (0) = 0. Der gewünschte Endzustand (final state) Ψf
befindet sich unter den Ψj .
Wir nehmen jetzt an, dass die Frequenz des elektrischen Feldes die “Resonanzbedingung”
ω ≈ |ωf i | =
|Ef − Ei |
~
erfüllt. Dann dominiert in der obigen Summe der Term j = f so stark, dass man die übrigen Terme weglassen kann (dies folgt aus dem Resonanzverhalten der weiter unten stehenden
Gleichung (H.18)). Unsere vereinfachte Wellenfunktion lautet für t > 0
Ψ(r, t) = ci (t)Ψi (r, t) + cf (t)Ψf (r, t) .
(H.10)
Einsetzen in die Schrödinger-Gleichung (8.25) ergibt unter Benutzung der Gleichungen
i~
∂Ψi
b (0) Ψi
=H
∂t
i~
∂Ψf
b (0) Ψf
=H
∂t
die folgende Differentialgleichung für die Koeffizienten ci und cf
i~ċi |Ψi i + i~ċf |Ψf i = ci (t)V 0 |Ψi i + cf (t)V 0 |Ψf i .
(H.11)
Hier wird die Dirac-Schreibweise benutzt. Um die zeitliche Entwicklung der Amplitude cf (t)
des Endzustands zu ermitteln, wird die Gleichung skalar mit hΨf | multipliziert und die Orthogonalität und Normierung der Ψj ausgenutzt
i~ċf = ci (t)hΨf |V 0 |Ψi i + cf (t)hΨf |V 0 |Ψf i .
(H.12)
Nun gilt für dies spezielle Potential
0
hΨf |V |Ψf i ∝
ZZZ
|ψf (r)|2 rd3 r = 0 ,
da der Integrand eine ungerade Funktion ist. Daher folgt
i~ċf = ci (t)hΨf |V 0 |Ψi i .
145
(H.13)
Eine entsprechende Differentialgleichung ergibt sich für ci (t):
i~ċi = cf (t)hΨi |V 0 |Ψf i .
(H.14)
Dies System von gekoppelten Differentialgleichungen kann man generell lösen, wir möchten hier
aber nur den Spezialfall betrachten, dass die Störung V 0 schwach ist und nur für kurze Zeit
0 < t < T wirkt. Dann gilt |ci (t)| ≈ 1 und |cf (t)| 1 im Intervall 0 < t < T , und wir erhalten
die vereinfachte Gleichung
i~ċf = ci (0)hΨf |V 0 |Ψi i = hΨf |V 0 |Ψi i .
(H.15)
Wir schreiben das Übergangs-Matrixelement von V 0 explizit hin
e
(E0 · r f i ) · [ei(ωf i +ω)t + ei(ωf i −ω)t ]
2
hΨf |V 0 |Ψi i =
mit
rf i =
ZZZ
ψf∗ (r)rψi (r)d3 r
und
ωf i =
(H.16)
Ef − Ei
.
~
(H.17)
Integration über das Zeitintervall 0 < t < T ergibt
"
#
ei(ωf i +ω)T − 1) ei(ωf i −ω)T − 1
e
+
.
i~cf (T ) = (E0 · r f i ) ·
2
i(ωf i + ω)
i(ωf i − ω)
H.4
(H.18)
Berechnung der Dipol-Übergangsmatrixelemente
In den folgenden Rechnungen ist es zweckmässig, die Matrixelemente von x±iy = r sin θ exp(±iϕ)
und z = r cos θ getrennt auszuwerten. Mit
Z ∞
rf i =
Rnf ,lf r Rni ,li r2 dr
0
erhalten wir
(x ± iy)f i = rf i
zf i = rf i
Z
0
Z
0
H.4.1
π
Z
2π
0
π
Z
0
2π
Yl∗f ,mf (θ, ϕ) sin θe±iϕ Yli ,mi (θ, ϕ)dϕ
Yl∗f ,mf (θ, ϕ) cos θ Yli ,mi (θ, ϕ)dϕ
sin θdθ
sin θdθ
Magnetische Quantenzahl
Das Integral über den Azimuthwinkel ist leicht auszuwerten.
(x ± iy)f i ∝
Z
2π
0
Yl∗f ,mf e±iϕ Yli ,mi dϕ
∝
Z
0
2π
exp[i(mi − mf ± 1)ϕ]dϕ
Dies ist nur dann ungleich null, wenn mi − mf ± 1 = 0, also |∆m| = 1 ist.
zf i ∝
Z
0
2π
Yl∗f ,mf Yli ,mi dϕ ∝
Hier muss ∆m = 0 sein.
146
Z
0
2π
exp[i(mi − mf )ϕ]dϕ
(H.19)
H.4.2
Bahndrehimpuls-Quantenzahl
Die Regel ∆l = ±1 ist mühsam zu beweisen, wir beschränken uns daher auf einige Beispiele
und betrachten zuerst zf i . Der Anfangszustand sei Y2,0 . Wir benutzen die Abkürzung u =
cos θ, du = − sin θdθ.
Z 1
Z π
∗
u(3u2 − 1)du = 0 ∆l = 2
Y0,0 cos θ Y2,0 sin θdθ ∝
0
Z
π
0
∗
Y1,0
cos θ Y2,0 sin θdθ ∝
−1
1
Z
−1
u2 (3u2 − 1)du 6= 0 |∆l| = 1
Hier ist von vornherein die zf i -Regel ∆m = 0 vorausgesetzt worden.
Bei (x ± iy)f i erhalten wir mit dem Anfangszustand Y2,1 ∝ sin θ cos θ und den Endzuständen
Y1,0 und Y0,0
Z
π
∗
Y0,0
sin θ Y2,1 sin θdθ
0
Z
0
H.4.3
π
∝
∗
Y1,0
sin θ Y2,1 sin θdθ ∝
Z
1
−1
Z 1
−1
u(1 − u2 )du = 0
∆l = 2
u2 (1 − u2 )du 6= 0 |∆l| = 1
Hauptquantenzahl n
Im Dipolmatrixelement gibt es den Radialanteil
Z ∞
rf i =
Rnf ,lf r Rni ,li r2 dr .
(H.20)
0
Dieser Ausdruck ist für ∆l = ±1 immer ungleich null, daher darf ∆n eine beliebige ganze Zahl
sein.
147