Quantenmechanik für Lehramtsstudierende

Werbung
Quantenmechanik für Lehramtsstudierende
Thomas Filk
Skript zur Vorlesung
Fortgeschrittene Theoretische Physik für
Lehramtsstudierende
(Version vom 20. 6. 2016)
2
Vorwort
Eine erste Version dieses Skripts entstand im Sommersemester 2012 im Zusammenhang mit der Vorbereitung einer Vorlesung Fortgeschrittene Theoretische Physik für
”
Lehramtsstudierende“ an der Universität Freiburg. Diese wurde anlässlich der Wiederholung dieser Vorlesung im Sommersemester 2013 nochmals weitgehend überarbeitet.
Diese Vorlesung soll Lehramtsstudierenden in erster Linie die Grundlagen der Quantenmechanik vermitteln und ersetzt damit die Quantenmechanik-Vorlesung, die bisher
für Lehramtsstudierende Pflicht war. Außerdem werden einige ausgewählte Kapitel
aus der Statistischen Mechanik behandelt. Der Schwerpunkt bleibt jedoch die Quantenmechanik.
Im Hinblick auf die Bedürfnisse der zukünftigen Lehrer soll im Rahmen dieser Vorlesung weniger Wert auf die Vermittlung von mathematischen Techniken zur
Lösung spezifischer Probleme in der Quantenmechanik gelegt werden, statt dessen
wird den konzeptuellen Grundlagen ein größeres Gewicht zugeschrieben. Vor diesem
Hintergrund wurde beispielsweise auf eine Vermittlung von störungstheoretischen Verfahren sowie eine eingehendere Behandlung der Streutheorie verzichtet. Diese Aspekte
sind zwar für den zukünftigen Forscher von Bedeutung, sie geben jedoch keine wesentlichen Zusatzerkenntnisse über das Wesen“ der Quantenmechanik und lassen sich
”
ohnehin im Unterricht kaum einsetzen. Trotzdem bleibt natürlich der mathematische
Formalismus der Quantenmechanik ein Schwerpunktthema, insbesondere da gerade
in der Quantenmechanik die Frage nach einer anschaulichen Interpretation mancher
mathematischer Strukturen und Ausdrücke immer noch offen und umstritten ist.
Beim Durchblättern des Skripts wird vermutlich auffallen, dass gerade die späteren Abschnitte zu Potenzialsystemen, dem Zeitentwicklungsoperator etc. trotz der
obigen Bemerkungen teilweise sehr ausführliche Berechnungen enthalten; ähnliches gilt
für einige der Anhänge. Diese Rechnungen sind nicht als Teil des Lehr- und Lernstoffs
gedacht sondern als Zusatzinformation für den interessierten Leser. Dies trifft in vermehrtem Maße auf Abschnitte zu, die durch ein Asterisk (*) gekennzeichnet sind. Zu
jedem Kapitel gibt es einen einführenden Abschnitt, der kurz und knapp umreißt,
welche Inhalte dieses Kapitels verstanden und auch (beispielsweise in einer Prüfung)
gewusst werden sollten. Die weiteren Kapitel dienen eher als Anmerkungen und Vertiefungen und gehören auch nur teilweise zu dem in der Vorlesung behandelten Stoff.
4
Sehr viel Wert wird darauf gelegt, dass es eine allgemein akzeptierte anschauliche bzw. philosophische Interpretation der Quantenmechanik nicht gibt. Schon die
grundlegende Frage nach dem ontologischen Status der Wellenfunktion wird von verschiedenen Physikern unterschiedlich beantwortet. Daher wird in dem Skript einerseits
versucht, die wissenschaftlichen Aussagen möglichst interpretationsneutral zu halten
(auch wenn das nicht immer gelungen sein wird). Andererseits wird an geeigneten Stellen aber auch auf unterschiedliche Interpretationsmöglichkeiten eingegangen, angefangen bei rein positivistischen Ansätzen über subjektive und informationstheoretische
Interpretationen der Quantenmechanik bis hin zur Bohm’schen Mechanik. Die letztgenannte Theorie beruht auf einer klassischen Ontologie, wobei betont werden soll,
dass die meisten Physiker – interessanterweise im Gegensatz zu den meisten Wissenschaftsphilosophen – dieser Theorie sehr kritisch gegenüberstehen. Die Gründe dafür
werde ich auch angeben, aber ich bin der Meinung, dass ein Physiker diese Theorie
zumindest kennen sollte, um sich eine eigene Meinung bilden zu können.
Wer an einer Vertiefung der Grundlagenfragen der Quantenmechanik interessiert ist, sei auf mein Skript Grundlagen und Probleme der Quantentheorie“ hin”
gewiesen, das ebenfalls über meine Webseite an der Universität Freiburg zugänglich
ist.
Derzeit (Sommersemester 2016) wird das Skript in Einzelpunkten nochmals
überarbeitet, unter anderem auch nach vielen Anregungen und Hinweisen von Studierenden, die das Skript zur Prüfungsvorbereitung nutzen. Für weitere Vorschläge bin
ich immer dankbar.
Freiburg, Frühjahr 2016
Thomas Filk
Inhaltsverzeichnis
Vorwort
3
Inhaltsverzeichnis
5
Allgemeine Einführung
11
1 Historischer Einstieg
15
2 Weshalb Quantenmechanik?
I. Photonenexperimente zur Polarisation
Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Klassische Lichtwellen . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Licht als Welle und seine Intensität . . . . . . . . . . . . . . . .
2.1.2 Polarisation und Polarisationsstrahlteiler . . . . . . . . . . . . .
2.1.3 Hintereinandergeschaltete Polarisationsfilter . . . . . . . . . . .
2.2 Einzelne Photonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Die Eigenschaften |hi und |vi . . . . . . . . . . . . . . . . . . .
2.2.2 Die Eigenschaften |αi, |pi und |mi . . . . . . . . . . . . . . . .
2.3 Ein Vektor- und Matrizenmodell . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Zustände als Strahlen in der Ebene . . . . . . . . . . . . . . . .
2.3.2 Filter als Projektions-Matrizen . . . . . . . . . . . . . . . . . .
2.3.3 Superpositionen . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Messungen“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
”
2.4.1 Messung als Präparation, Nachweis, Bestätigung oder Prokrustie“
”
2.4.2 Ein Matrixmodell von Messung“ . . . . . . . . . . . . . . . . .
”
2.5 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
21
22
22
24
25
28
30
32
34
34
35
37
39
40
41
42
3 Weshalb Quantenmechanik?
II: Das Doppelspaltexperiment
45
Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1 Der Doppelspalt für Licht und Photonen . . . . . . . . . . . . . . . . . 46
5
6
INHALTSVERZEICHNIS
3.2
3.3
3.4
3.1.1 Schwächere Lichtquelle .
Messungen“ . . . . . . . . . .
”
Materiewellen . . . . . . . . . .
Zusammenfassung und Ausblick
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Die mathematischen Grundlagen
Was man wissen sollte . . . . . . . . . . . . . . . . . . . .
4.1 Vektorräume und physikalische Zustände . . . . . . .
4.1.1 Hilberträume . . . . . . . . . . . . . . . . . .
4.1.2 Die Bra-Ket-Notation . . . . . . . . . . . . . .
4.2 Lineare Abbildungen – Operatoren . . . . . . . . . .
4.2.1 Allgemeine Eigenschaften linearer Operatoren
4.2.2 Besonderheiten in unendlich dimensionalen
Hilberträumen . . . . . . . . . . . . . . . . . .
4.2.3 Selbstadjungierte Operatoren . . . . . . . . .
4.2.4 Projektionsoperatoren . . . . . . . . . . . . .
4.2.5 Unitäre Operatoren . . . . . . . . . . . . . . .
4.3 Die Bra-Ket-Notation für Operatoren . . . . . . . . .
4.4 Operatoren im L2 . . . . . . . . . . . . . . . . . . . .
∂
4.4.1 Das Spektrum von x und −i ∂x
. . . . . . . . .
4.4.2 Die x- und k-Basis . . . . . . . . . . . . . . .
∂
4.4.3 Der Kommutator von x und −i ∂x
. . . . . . .
5 Die Postulate der Quantenmechanik
und erste Folgerungen
Was man wissen sollte . . . . . . . . . . . . . .
5.1 Die Postulate der klassischen Mechanik . .
5.1.1 1. Postulat — Zustände . . . . . .
5.1.2 2. Postulat — Observable . . . . .
5.1.3 3. Postulat — Bewegungsgleichung
5.2 1. Postulat der Quantenmechanik:
Darstellung von Zuständen . . . . . . . . .
5.3 2. Postulat der Quantenmechanik:
Darstellung von Observablen . . . . . . . .
5.4 3. Postulat der Quantenmechanik:
Messwerte und Erwartungswerte . . . . . .
5.5 4. Postulat der Quantenmechanik:
Die Reduktion des Quantenzustands . . .
5.6 5. Postulat der Quantenmechanik:
Die Dynamik abgeschlossener Systeme . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
51
54
56
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
59
60
60
64
66
66
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
70
74
76
79
80
82
83
85
85
.
.
.
.
.
87
88
89
89
90
91
. . . . . . . . . . . . . . . .
91
. . . . . . . . . . . . . . . .
93
. . . . . . . . . . . . . . . .
99
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . . . . . . . . . 102
. . . . . . . . . . . . . . . . 103
INHALTSVERZEICHNIS
6. Postulat der Quantenmechanik:
Mehrteilchensysteme . . . . . . . . . . . . .
5.8 Die Unschärferelationen . . . . . . . . . . .
5.9 Gemischte Zustände und Dichtematrizen . .
5.9.1 Allgemeine Definition von Zuständen
5.9.2 Zustände in der klassischen Mechanik
5.9.3 Dichtematrizen . . . . . . . . . . . .
5.10 Maximale Sätze kompatibler Observabler . .
7
5.7
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Potenzialsysteme
Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . .
6.1 Schrödinger-Gleichung für Potenzialsysteme . . . . . . . . .
6.1.1 Zeitabhängige und zeitunabhängige
Schrödinger-Gleichung . . . . . . . . . . . . . . . . .
6.1.2 Die Schrödinger-Gleichung in einer Basis . . . . . . .
6.1.3 Symmetrien . . . . . . . . . . . . . . . . . . . . . . .
6.2 Die Quantisierung der Energie . . . . . . . . . . . . . . . . .
6.3 Das unendliche Kastenpotenzial . . . . . . . . . . . . . . . .
6.4 Das endliche Kastenpotenzial — Tunneleffekt . . . . . . . .
6.4.1 Der Tunneleffekt . . . . . . . . . . . . . . . . . . . .
6.5 Der harmonische Oszillator . . . . . . . . . . . . . . . . . . .
6.5.1 Exakte Lösung der Schrödinger-Gleichung . . . . . .
6.5.2 *Auf- und Absteigeoperatoren in der
Quantenfeldtheorie . . . . . . . . . . . . . . . . . . .
6.5.3 Semiklassische Berechnung der Grundzustandsenergie
6.5.4 Der harmonische Oszillator in höheren Dimensionen .
6.6 Radialpotenziale und Kugelflächenfunktionen . . . . . . . . .
6.7 Der Bahndrehimpuls . . . . . . . . . . . . . . . . . . . . . .
6.8 Das Wasserstoffatom . . . . . . . . . . . . . . . . . . . . . .
6.8.1 Ein semi-klassisches Argument für die Energieniveaus
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
105
106
112
112
113
114
115
117
. . . . . . 117
. . . . . . 119
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
121
123
124
126
132
134
136
136
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
141
142
143
144
146
147
149
.
.
.
.
.
.
.
.
151
151
152
155
156
158
158
159
161
7 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen
Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1 Der Zeitentwicklungsoperator . . . . . . . . . . . . . . . . . . . . .
7.2 Summation über Wege . . . . . . . . . . . . . . . . . . . . . . . . .
7.2.1 Das Zeigermodell“ der Teilchenpropagation . . . . . . . . .
”
7.3 Das Heisenberg-Bild der Quantenmechanik . . . . . . . . . . . . . .
7.3.1 Die Heisenberg’schen Bewegungsgleichungen . . . . . . . . .
7.3.2 Allgemeine Struktur der Heisenberg-Gleichung . . . . . . . .
7.3.3 * Lineare Bewegungsgleichungen . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
8
INHALTSVERZEICHNIS
8 Mehrteilchensysteme
163
Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
8.1 Mathematische Beschreibung von Mehrteilchensystemen . . . . . . . . 164
8.1.1 Der Tensorraum . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
8.1.2 Separable Zustände und verschränkte Zustände . . . . . . . . . 166
8.1.3 Die Reduktion von Dichtematrizen . . . . . . . . . . . . . . . . 167
8.2 Identische Teilchen und Statistik . . . . . . . . . . . . . . . . . . . . . 169
8.2.1 Fermi-Dirac- und Bose-Einstein-Statistik . . . . . . . . . . . . . 170
8.3 Einstein-Podolsky-Rosen . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.4 Bell’sche Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 176
8.4.1 Bell’sche Ungleichungen — die Version von Wigner und d’Espagnat177
8.4.2 Bell’sche Ungleichungen — CHSH-Version . . . . . . . . . . . . 180
8.5 Umsetzungen für die Schule . . . . . . . . . . . . . . . . . . . . . . . . 183
8.5.1 Drei Vesperdosen . . . . . . . . . . . . . . . . . . . . . . . . . . 183
8.5.2 Nochmals Vesperdosen . . . . . . . . . . . . . . . . . . . . . . . 184
8.5.3 Eine Schülerbefragung“ . . . . . . . . . . . . . . . . . . . . . . 184
”
9 Zwei-Zustands-Systeme
Was man wissen sollte . . . . . . . . . . . . . . .
9.1 Pauli-Matrizen . . . . . . . . . . . . . . . .
9.2 Der Zustandsraum . . . . . . . . . . . . . .
9.3 Physikalische Anwendungen . . . . . . . . .
9.3.1 Spin- 12 -Systeme . . . . . . . . . . . .
9.3.2 Polarisationszustände von Photonen .
9.3.3 2-Niveau-Systeme . . . . . . . . . . .
9.4 Quanteninformation . . . . . . . . . . . . .
9.4.1 Klassische Information . . . . . . . .
9.4.2 Qubits und Bell-Zustände . . . . . .
9.4.3 Das No-Cloning Theorem . . . . . .
9.4.4 Quanten-Teleportation . . . . . . . .
9.4.5 Quantenkryptographie . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10 Fundamentale Experimente zur Quantentheorie
Was man wissen sollte . . . . . . . . . . . . . . . . . .
10.1 Das Planck’sche Strahlungsgesetz . . . . . . . . .
10.2 Der photoelektrische Effekt . . . . . . . . . . . .
10.3 Die Compton-Streuung . . . . . . . . . . . . . . .
10.4 Zeeman- und Stark-Effekt . . . . . . . . . . . . .
10.5 Das Stern-Gerlach Experiment . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
187
187
188
189
190
190
193
194
196
196
197
200
200
202
.
.
.
.
.
.
205
205
206
209
210
211
213
INHALTSVERZEICHNIS
9
11 Optische Experimente zur Quantentheorie
Was man wissen sollte . . . . . . . . . . . . . . .
11.1 Experimentelle Bausteine . . . . . . . . . . .
11.1.1 Laser . . . . . . . . . . . . . . . . . .
11.1.2 Doppelspalt und Gitter . . . . . . . .
11.1.3 Strahlteiler . . . . . . . . . . . . . .
11.1.4 λ/4- und λ/2-Plättchen . . . . . . .
11.1.5 Down Conversion Kristalle . . . . . .
11.2 Das Mach-Zehnder-Interferometer . . . . . .
11.3 Wechselwirkungsfreie Messung —
das Knallerexperiment“ . . . . . . . . . . .
”
11.4 Das Experiment von Hong, Ou und Mandel
11.5 Delayed Choice Experimente . . . . . . . . .
11.6 Der Quantum-Eraser . . . . . . . . . . . . .
12 Nochmals Photonenpolarisation
12.1 Zusammenfassung des Bekannten .
12.2 Der (inverse) Quanten-Zenon-Effekt
12.3 Zirkulare Polarisationen . . . . . .
12.4 FAQs . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
215
215
216
216
216
217
217
218
219
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
221
223
224
225
.
.
.
.
231
231
234
237
240
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
243
244
244
244
246
248
250
251
252
255
255
256
257
259
259
260
260
261
261
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13 Probleme, Fragen und Interpretationen
Was man wissen sollte . . . . . . . . . . . . . . . . . . .
13.1 Das Messproblem . . . . . . . . . . . . . . . . . . .
13.1.1 Allgemeine Charakterisierung . . . . . . . .
13.1.2 Mathematische Beschreibung . . . . . . . .
13.1.3 Dekohärenz . . . . . . . . . . . . . . . . . .
13.2 Schrödingers Katze . . . . . . . . . . . . . . . . . .
13.3 Das Zeigerbasis-Problem . . . . . . . . . . . . . . .
13.4 Die Kopenhagener Deutung . . . . . . . . . . . . .
13.5 Weitere Interpretationen . . . . . . . . . . . . . . .
13.5.1 Ensemble-Interpretation . . . . . . . . . . .
13.5.2 Subjektive Deutungen und QBism . . . . . .
13.5.3 Many-Worlds . . . . . . . . . . . . . . . . .
13.6 Kollapsmodelle . . . . . . . . . . . . . . . . . . . .
13.6.1 Wigner und der Einfluss des Bewusstseins .
13.6.2 Die Gravitation als Auslöser der Reduktion
13.6.3 GRW – stochastische Kollapszentren . . . .
13.7 Bohm’sche Mechanik . . . . . . . . . . . . . . . . .
13.7.1 Die allgemeine Idee . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
INHALTSVERZEICHNIS
13.7.2
13.7.3
13.7.4
13.7.5
13.7.6
Das Quantenpotential . . . . . . . . . . .
Klassisch oder Quanten . . . . . . . . . . .
Vorteile der Bohm’schen Mechanik . . . .
Kritikpunkte an der Bohm’schen Mechanik
Die Ontologie? . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
263
265
266
267
271
A1Endliches Kastenpotenzial
273
A1.1 E > V — freie Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . 273
A1.2 0 < E < V — gebundene Teilchen . . . . . . . . . . . . . . . . . . . . . 276
A2Zeitentwicklung und Funktionalintegral
279
A2.1 Herleitung des freien Propagators . . . . . . . . . . . . . . . . . . . . . 279
A2.2 Das Funktionalintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
A3Darstellungen der Drehgruppe
A3.1 Symmetrien, Gruppen und ihre Darstellungen
A3.2 Die Drehgruppe . . . . . . . . . . . . . . . . .
A3.3 Die Lie-Algebra der Drehgruppe . . . . . . . .
A3.4 Die Lösung für d = 2 — die Pauli-Matrizen . .
A3.5 * Allgemeine Dimensionen . . . . . . . . . . .
A3.6 Drehimpuls und Spin in der Quantenmechanik
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
283
284
286
286
289
289
292
A4Zitate zur Quantentheorie
295
Literaturangaben
301
Allgemeine Einführung
Seit ihrer Entstehung zu Beginn des 20. Jahrhunderts steht die Quantentheorie in
dem Ruf, unverständlich, absurd und in gewisser Hinsicht sogar unlogisch zu sein.
Sie widerspricht teilweise unseren klassischen Grundvorstellungen über die Natur, wodurch ihr manchmal sogar ein esoterischer Charakter zugeschrieben wird. Unzweifelbar ist jedoch, dass diese Theorie zu sehr präzisen und teilweise verblüffenden
Vorhersagen geführt hat und immer noch führt, und soweit diese Vorhersagen experimentell überprüfbar waren, wurden sie uneingeschränkt bestätigt. Auch wenn wir
den mathematischen Formalismus der Quantenmechanik verstanden haben, bleibt das
Gefühl, diesen mathematischen Formalismus nicht wirklich mit einem physikalischen
Verständnis untermauern zu können. Häufig fällt es sogar schwer, die Fragen präzise
zu formulieren, was genau an der Quantenmechanik so seltsam oder unverständlich
erscheint.
Oft gibt man sich mit der Erklärung zufrieden, eine solche Anschauung sei nicht
möglich, da sie notwendigerweise immer auf den Konzepten der klassischen Physik, die
uns aus dem Alltag vertraut sind, beruhen wird. Diese Konzepte müssen aber nicht
zwingend auch für die mikroskopische Welt anwendbar sein. Darüber hinaus kann eine solche Anschauung, von welcher Art sie auch sei, im Rahmen des mathematischen
Formalismus nicht abgeleitet oder gar ihre Richtigkeit bewiesen werden. Es setzt sich
dann ein rein positivistischer Standpunkt durch, d.h., die Aufgabe der Physik wird
einzig in der Bereitstellung eines Formalismus gesehen, mit dem sich Vorhersagen zu
physikalischen Experimenten möglichst weitgehend aufstellen lassen. Der Versuch eines Begreifens“ im Sinne irgendeiner anschaulichen Vorstellung wird als metaphysisch
”
oder philosophisch und nicht mehr zum Bereich der Naturwissenschaft gehörend abgelehnt.
Wirklich überzeugend erscheint diese Erklärung nicht, denn beispielsweise in
der Mathematik haben wir keine wirklichen Probleme, von höher dimensionalen Vektorräumen, Topologien oder algebraischen Strukturen vieldimensionaler Mannigfaltigkeiten etc. zu sprechen und damit sogar eine gewisse Anschauung zu verbinden, die
teilweise weit von den Anschauungen des Alltags entfernt sind. Das Seltsame an der
Quantenmechanik ist weniger, dass sie mit ungewohnten mathematische Strukturen
formuliert wird, sondern dass gewisse Grundkonzepte, die wir mit der Natur verbinden,
11
12
Allgemeine Einführung
nicht mehr zu gelten scheinen. Dazu gehören beispielsweise die intrinsische Indeterminiertheit der Quantenmechanik – man könnte auch sagen, sie genügt nicht mehr dem
Leibniz’schen Prinzip des hinreichenden Grundes –, die scheinbare Nicht-Lokalität
so genannter Quantenkorrelationen, oder auch die unvermeidbare Einbeziehung des
Messprozesses (bis hin zur Einbeziehung eines Beobachters) in die Beschreibung.
Gerade wegen dieser letztgenannten Kritikpunkte besteht unter den Physikern noch nicht einmal Einigkeit darüber, inwieweit es sich bei der Quantentheorie
überhaupt um eine Theorie“ handelt bzw. was diese Theorie eigentlich umfasst. Das
”
Spektrum möglicher Antworten ist riesig: Es reicht von der Meinung, dass die Quantentheorie die fundamentale Theorie unserer Natur sei, bis hin zu der Ansicht, dass es sich
bei der Quantentheorie bestenfalls um eine Sammlung empirisch begründeter aber im
Wesentlichen unverstandener und insbesondere nicht wirklich widerspruchsfreier Vorschriften handelt. Die Anhänger der zweiten Meinung vergleichen den Formalismus der
Quantenmechanik mit einem Kochrezept für einen Kuchen, bei dem als Zutaten schon
Teile des Kuchens notwendig sind, und von dem sich bei genauerer Untersuchung aber
herausstellt, dass man am Ende gar keinen Kuchen erhält.1 Die Gründe für dieses
breite Spektrum werden wir kennen lernen.
Natürlich hat es an Erklärungs- oder Interpretationsansätzen nicht gefehlt. Diese unterschiedlichen Interpretationen basieren meist auf dem anerkannten mathematischen Formalismus der Quantenmechanik und führen daher im Allgemeinen zu denselben experimentellen Vorhersagen. Eine Widerlegung der ein oder anderen Interpretation mit wissenschaftlichen Methoden ist nicht möglich – sie sind empirisch gleichwertig. Auch diese Immunisierung der Interpretationsansätze gegen eine Widerlegbarkeit
durch das Experiment hat dazu beigetragen, alle Versuche in dieser Richtung als unwissenschaftlich abzutun und aus der wissenschaftlichen Debatte auszuschließen.
Doch gerade wenn man Quantenmechanik lehrt, ist es unvermeidbar, dass von
Seiten der Lernenden (seien es Schüler und Schülerinnen oder Studenten) Fragen im
Sinne des Wie kann ich mir das vorstellen?“ gestellt werden. Auch von einem wis”
senschaftlichen Standpunkt ist es dann unbefriedigend, solche Fragen mit einem Gar
”
nicht!“ beiseite zu schieben. Auch dieses Gar nicht!“ erfordert eine Erläuterung.
”
Die oberste Entscheidungsinstanz der Naturwissenschaft ist immer das Experiment bzw. die Naturbeobachtung. Ein solches Experiment stellt gleichsam eine Frage
an die Natur, hinter der letztendlich immer auch die Grundfrage steht, ob die Theorie
oder das Modell, mit dem wir die Natur beschreiben, richtig ist. Eine solche Frage muss
aber in einen experimentellen Aufbau und ein experimentelles Protokoll übersetzt werden, und die Antwort – das experimentelle Ergebnis – erfordert eine Interpretation.
Ohne eine Theorie oder ein Modell sind diese Übertragungen (in beide Richtungen)
unmöglich. Einstein hat in einem Gespräch gegenüber Werner Heisenberg einmal be1
In der Quantenmechanik wird Kuchen“ durch eindeutiges Messergebnis“ ersetzt.
”
”
Allgemeine Einführung
13
hauptet Erst die Theorie entscheidet darüber, was man beobachten kann“[38] (Kap.
”
5; S. 80). Und Max von Laue erwähnt in seinem Buch zur Geschichte der Physik [51]
die Messung der Lichtgeschwindigkeit in bewegten Flüssigkeiten von Fizeau, dessen
Ergebnisse zunächst als Beweis für einen Äther, später aber im Rahmen der Relativitätstheorie als Beweis für die Richtigkeit der Einstein’schen Ideen gewertet wurde.
Er schreibt dazu: So ist die Geschichte des Fizeau-Versuchs ein lehrreiches Beispiel
dafür, wie weit in die Deutung jedes Versuchs schon theoretische Elemente hineinspielen; man kann sie gar nicht ausschalten. Und wenn dann die Theorien wechseln, so
wird aus einem schlagenden Beweis für die eine leicht ein ebenso starkes Argument
für eine ganz entgegengesetzte.
Dieser wissenschaftstheoretische Aspekt spielt in der Quantenmechanik eine
noch wesentlichere Rolle als in der klassischen Physik, gerade weil dem Einfluss des
Messprozesses und der Messapparatur im allgemeinsten Sinne in der Quantenmechanik
eine weitaus größere Bedeutung zukommt als in der klassischen Physik.
Von Heisenberg und Dirac, der bekannt war für seine Schweigsamkeit sowie für
seine scharfe Logik, erzählt man sich die folgende Geschichte (siehe z.B. [8]): Heisenberg und Dirac gingen auf dem Land spazieren und Heisenberg bemerkte auf einem
nahegelegenen Feld einige frisch geschorene Schafe. Da es kalt war, meinte er zu Dirac:
Schau, Dirac, diese armen Schafe wurden geschoren.“ Dirac schaute hin, überlegte
”
eine Weile und meinte dann: Ja, zumindest auf der uns zugewandten Seite.“
”
Unabhängig davon, ob diese Anekdote stimmt oder nicht, zeigt sie in schöner
Weise, wie man mit der Quantenmechanik umgehen sollte. Man kann gar nicht vorsichtig genug sein, zunächst einmal nur das zu akzeptieren, was wir wirklich beobachten,
und jede Schlussfolgerung auf die uns abgewandte Seite“ zu vermeiden. Das wird sich
”
in aller Strenge praktisch nie umsetzen lassen, aber zumindest sollte man versuchen,
sich gelegentlich bewusst zu machen, dass man in die meisten Schlussfolgergungen immer gewisse, nicht direkt beobachtete bzw. beobachtbare Annahmen hineingesteckt
hat.
14
Allgemeine Einführung
Kapitel 1
Historischer Einstieg
Als Geburtstag der Quantenmechanik wird oft der 14. Dezember 1900 angegeben. An
diesem Tag hielt Max Planck (1858–1947) einen Vortrag vor der Versammlung der
Physikalischen Gesellschaft in Berlin und präsentierte eine Herleitung für die Verteilung der Strahlungsintensität eines schwarzen Körpers als Funktion der Temperatur
und der Wellenlänge der Strahlung. Bei dieser Herleitung hatte er von der Annahme
Gebrauch gemacht, dass Licht einer bestimmten Wellenlänge von den Oszillatoren in
den Wänden eines Strahlungsbehälters immer nur in ganzzahligen Quanten“ aufge”
nommen bzw. abgegeben werden kann (vgl. Abschnitt 10.1).
Planck hatte die Formel für die Schwarzkörperstrahlung schon ein Jahr zuvor
gefunden, allerdings handelte es sich zunächst nur um eine geratene“ Interpolation,
”
welche die damaligen thermodynamischen Vorstellungen von der elektromagnetischen
Strahlung an das experimentell gefundene Strahlungsgesetz von Wien für sehr kleine
Wellenlängen anpassen sollte. Kleine Wellenlänge“ ist hierbei im Vergleich zur ther”
mischen Energie E = kB T zu verstehen, was allerdings voraussetzt, dass man Licht
einer bestimmten Wellenlänge bzw. Frequenz eine Energie zuordnen kann. Die Konstante h zwischen der Frequenz ν der Welle (bzw. der Wellenlänge λ = c/ν) und der
Energie, E = hν, war von Planck schon in seinem Artikel von 1899 als fundamental“
”
erkannt worden.
Für Planck war die Annahme quantisierter“ elementarer Energien für Licht
”
einer bestimmten Wellenlänge nur eine Arbeitshypothese. So schreibt er in einem Brief
an Robert William Wood [64] ... ich dachte mir nicht viel dabei ...“, und an anderer
”
Stelle diese Briefs spricht er von einem Akt der Verzweiflung“. Er hatte gehofft,
”
dass diese Annahme nur eine Näherung sei, die sich aus einem besseren Verständnis
der Wechselwirkung zwischen Materie und elektromagnetischer Strahlung begründen
lassen könnte.
In der Folgezeit erwies sich die Vorstellung elementarer Lichtquanten aber auch
in anderen Bereichen als erfolgreich. So konnte Albert Einstein (1879–1955) im Jah15
16
Historischer Einstieg
re 1905 mit dieser Annahme den photoelektrischen Effekt erklären (Abschnitt 10.2).
Er erhielt dafür 1921 den Nobelpreis, der ihm allerdings erst 1922 überreicht werden konnte. Im Jahre 1907 leitete Einstein aus einer entsprechenden Annahme für die
Schwingungen in einem Kristall die spezifische Wärme von Festkörpern bei sehr kleinen Temperaturen her [23]. Er konnte so das klassische Paradoxon“ klären, weshalb
”
die spezifische Wärme für sehr kleine Temperaturen nicht mehr einfach nur durch die
Anzahl der thermodynamischen Freiheitsgrade gegeben ist, wie es die klassische statistische Mechanik vorhersagt, sondern gegen null geht, wie es auch der Dritte Hauptsatz
der Thermodynamik fordert.
In der Folgezeit konnte man mit ähnlichen Quantisierungspostulaten“ weitere
”
Scheinparadoxa klären. Beispielsweise hatte Niels Bohr 1913 für die möglichen Bahnen der Elektronen in einem Atom eine Quantisierungsbedingung aufgestellt [11] und
postuliert, dass Elektronen auf diesen Bahnen keine Strahlung emittieren und solche
Bahnen daher stabil sein sollten. Nach den klassischen Vorstellungen des Elektromagnetismus sollte das Rutherford’sche Planetenmodell für Atome (ein schwerer, positiv
geladener Atomkern im Zentrum und sehr leichte, negativ geladene Elektronen auf
Kreisbahnen um diesen Kern) instabil sein, da Elektronen auf Kreisbahnen ständig
Strahlung emittieren (die Synchrotronstrahlung“), dadurch Energie verlieren und auf
”
Spiralbahnen in den Atomkern stürzen müssten. Das Bohr’sche Atommodell konnte die
Spektrallinien von einfachen Atomen – sowohl in der Absorbtion von Strahlung durch
die Atome als Fraunhofer’sche Linien“, als auch in der Emission von Strahlung – gut
”
erklären. Später (1915/1916) erweiterte Arnold Sommerfeld (1868–1951) das Modell
um quantisierte elliptische Bahnkurven, wodurch sich die Feinstruktur und die Aufspaltung der Spektrallinien von Atomen in einem elektromagnetischen Feld (Zeemanund Stark-Effekt) erklären ließen (vgl. Abschnitt 10.4).
All diese Quantisierungsbedingungen“ waren zunächst reine Postulate. Es gab
”
keine wirkliche Erklärung, worauf diese Bedingungen beruhten oder weshalb die derart
ausgezeichneten Bahnkurven stabil sein sollten. Einstein hatte seit 1905 immer wieder
darauf hingewiesen, dass die Doppelnatur von Licht (einerseits der Teilchencharakter
der Quanten“– also der Photonen – als auch der Wellencharakter bei Interferenz- und
”
Beugungserscheinungen) das zentrale Problem sei, ohne dessen Lösung die Theorie
weiterhin unverstanden bliebe.
Mitte der 20er Jahre des letzten Jahrhunderts führten mehrere Entwicklungen zu einem besseren Verständnis sowie einem ausgereiften mathematischen Formalismus. Schließlich entstand das, was wir heute als Quantentheorie bezeichnen.
(Für eine ausführlichere Darstellung der historischen Ereignisse siehe beispielsweise
[45, 49, 34, 47].)
- 1922 entdeckte Arthur Compton (1892–1962) den später nach ihm benannten Effekt der Lichtstreuung an Teilchen, wobei das Licht seine Wellenlänge verändert.
Historischer Einstieg
17
Die naheliegende (und zu den Daten passende) Erklärung war, dass sich einzelne
Lichtquanten (Photonen) wie Teilchen verhalten und bei der Streuung entsprechend den mechanischen Stoßgesetzen einen Teil ihrer Energie an das streuende
Objekt abgeben. Dabei verlieren sie selbst Energie, was nach der schon erwähnten
Beziehung E = hν eine Veränderung der Wellenlänge bedeutet (vgl. Abschnitt
10.3).
- 1923 entwickelte Louis de Broglie (1892–1987) seine Vorstellung von Materiewellen, die er in seiner Doktorarbeit von 1924 zusammenfasste. Damit wurde der
Welle-Teilchen-Dualismus, der bisher nur für Photonen galt, auf sämtliche materielle Teilchen erweitert und es entstand ein einheitliches Bild der Materie. Die
nach diesem Bild vorhergesagten Beugungserscheinungen für Elektronen wurden
1927 von Davisson und Germer beobachtet.
- Nach der Entdeckung der Linienaufspaltung von Atomen in Magnetfeldern postulierte Wolfgang Pauli (1900-1958) im Jahre 1924 einen neuen Freiheitsgrad
für Elektronen, der nur zwei mögliche Werte annehmen kann (den Spin), und
1925 formulierte er das nach ihm benannte Ausschließungsprinzip, wonach jedes
Atomorbital nur zweimal besetzt werden kann, und zwar von jeder der beiden
Spineinstellungen einmal.
- 1925 begann Werner Heisenberg (1901–1976), die klassischen Observablen (Ort,
Impuls, Energie, etc.) nicht als Eigenschaften“ von Objekten zu deuten, son”
dern als Ausdruck von Übergängen“ zwischen verschiedenen Zuständen dieser
”
Objekte bei der Messung dieser Eigenschaften. In Zusammenarbeit mit Max
Born (1882–1970) und Pascual Jordan (1902–1980) entstand daraus 1926 die
sogenannte Matrizenmechanik [13].
- 1926 stellte Erwin Schrödinger (1887–1961) die Schrödinger-Gleichung auf und
gelangte damit zu einer Formulierung der Quantenmechanik durch eine partielle Differentialgleichung. Diese Formulierung erhielt im Folgenden die Bezeichnung Wellenmechanik“. Im Gegensatz zur Matrizenmechanik, welche für die
”
Übergänge zwischen Zuständen Quantensprünge“ postuliert, wird die zeitliche
”
Entwicklung von Quantensystemen hier kontinuierlich beschrieben. Das fundamentale mathematische Objekt, die Wellenfunktion, welches den Zustand beispielsweise eines Elektrons beschreibt, dachte sich Schrödinger noch als eine Repräsentation einer Ladungsdichteverteilung“. Diese Interpretation konnte später
”
nicht aufrecht erhalten werden. Allerdings konnte Schrödinger noch im selben
Jahr beweisen, dass seine Wellenmechanik und Heisenbergs Matrizenmechanik
im formal mathematischen Sinne äquivalent sind.
18
Historischer Einstieg
- Ebenfalls 1926 formulierte Max Born (1882–1970) die Wahrscheinlichkeitsinterpretation der Wellenfunktion und legte damit den Grundstein für die wahrscheinlichkeitstheoretische Deutung der Quantentheorie [14]. Bei dieser ersten Versi”
on“ der Wahrscheinlichkeitsinterpretation dachte Born noch an eine Unkenntnis
der tatsächlichen Zusammenhänge. Diese Interpretation musste jedoch bald aufgegeben werden, da sie im Widerspruch zum Doppelspaltexperiment war, denn
eine reine Unkenntnis des Spalts, durch den ein Teilchen tritt, könnte die Interferenz nicht erklären.
- 1926–1927 entwickelte Heisenberg aus Diskussionen mit Niels Bohr die Unschärferelationen; umgekehrt entstand bei Bohr aus diesem gedanklichen Austausch das
Konzept der so genannten Komplementarität. Die Vorstellung klassischer Teilchenbahnen, beispielsweise von Elektronen in einem Atom, ließ sich damit nicht
mehr halten.
- 1927 schließlich kristallisierte sich aus den Diskussionen zwischen Heisenberg und
Bohr, zusammen mit der Wahrscheinlichkeitsdeutung von Born, die so genannte Kopenhagener Deutung“ der Quantenmechanik heraus. Auf der 5. Solvay”
Konferenz in Brüssel im Oktober 1927 setzte sich diese Interpretation der Quantenmechanik – hauptsächlich vertreten durch Bohr, Heisenberg, Born, Dirac,
Pauli und Kramers – nach teilweise hitzigen Diskussionen mit den Zweiflern an
dieser Interpretation – Einstein, de Broglie und Schrödinger – durch.
Damit war die Entwicklung der Quantenmechanik zu einem ersten Abschluss gekommen und die kommenden Jahre zeichneten sich durch die Anwendung des neuen Formalismus auf unterschiedliche physikalische Systeme und die Vertiefung des
Verständnisses der mathematischen Strukturen aus. Versuchte Einstein anfänglich
noch durch geschickt konstruierte Gedankenexperimente zu beweisen, dass die Quantenmechanik (insbesondere die Unschärferelationen) inkonsistent sei, gab er diese Versuche um 1930 auf, nachdem systematischere Analysen dieser Experimente“ — meist
”
durch Bohr — immer wieder zugunsten der Quantenmechanik ausgefallen waren. Die
folgende Auswahl von Ereignissen, die für die Grundlagen der Quantenmechanik von
Bedeutung waren, ist sehr subjektiv und bei weitem nicht vollständig:
- Im Jahre 1932 wurde das Buch Mathematische Grundlagen der Quantentheorie“
”
[65] von Johann von Neumann veröffentlicht, das die noch vorhandenen Unsicherheiten im Zusammenhang mit unendlich dimensionalen Vektorräumen auf eine
mathematisch gesicherte Grundlage stellte. In diesem Buch bewies von Neumann
auch, dass sich die Quantenmechanik nicht durch Erweiterung um zusätzliche
(nicht beobachtbare) Freiheitsgrade im Rahmen eines klassischen Formalismus
erklären lässt (eines der bekanntesten No-Go“ -Theoreme der Physik).
”
Historischer Einstieg
19
- 1935 schrieben Einstein, Podolsky und Rosen einen Artikel [24], in welchem sie
zwei Teilchen in einem sogenannten verschränkten Zustand betrachteten und
durch eine geschickte (gedankliche) experimentelle Anordnung glaubten zeigen
zu können, dass die Quantenmechanik unvollständig sei und um zusätzliche Freiheitsgerade erweitert werden müsse. Dieses heute als EPR-Paradoxon bekannte
Experiment ist immer noch Thema hitziger Diskussionen. Es steht zwar nicht
im Widerspruch zur Quantenmechanik, zeigt aber doch die Existenz eigenartiger Korrelationen, die sich im Rahmen eines klassischen Weltbilds nicht so ohne
Weiteres erklären lassen.
- Aufbauend auf einem Modell von deBroglie aus dem Jahre 1927 zeigte David
Bohm 1952 [10] anhand einer expliziten Formulierung der Quantenmechanik in
Form von Wellen und Teilchen, dass eine Interpretation der quantenmechanischen Beobachtungen ihm Rahmen eines klassischen Formalismus möglich ist.
Seine Absicht war zu beweisen, dass von Neumann bei seinem No-Go“-Theorem
”
offenbar von physikalisch nicht notwendigen Annahmen ausgegangen sein musste,
ohne allerdings die genauen Zusammenhänge klären zu können. Dieses zunächst
als reines Gegenbeispiel gedachte Modell bezeichnet man heute als Bohm’sche
”
(Quanten-)Mechanik“.
- In den Jahren 1964–1966 konnte John Bell (1928–1990) die scheinbaren Widersprüche zwischen dem Beweis von Neumanns und dem Modell von Bohm klären,
und er formulierte in diesem Zusammenhang eine Klasse von Ungleichungen, die
jede klassische, lokale (ohne instantane Fernwirkungen) Theorie erfüllen muss,
die aber in der Quantenmechanik verletzt sein können. 1982 zeigten die Experimente von Aspect [1] eindeutig, dass die quantenmechanischen Vorhersagen
stimmen und die Bell’schen Ungleichungen verletzt sind. Damit wurde gleichzeitig gezeigt, dass die Quantenmechanik eine nicht-lokale“ Theorie ist, wobei
”
allerdings immer noch diskutiert wird, in welchem Sinne diese scheinbare Form
der Nicht-Lokalität tatsächlich zu vestehen ist.
Von einer allgemein akzeptierten Interpretation der Quantenmechanik sind wir immer
noch weit entfernt. Einen ausgezeichneten Überblick über die historische Entwicklung der Quantenmechanik und insbesondere die verschiedenen Interpretationen der
Quantenmechanik (zumindest bis in die 70er Jahre des letzten Jahrhunderts) gibt das
Buch von Max Jammer [45]. Diese Fragen spielen für die Anwendungen der Quantenmechanik, ihre Vorhersagekraft oder auch ihre mathematische Beschreibung der
Beobachtungen keine Rolle, weshalb sie auch oftmals im Rahmen der Physik nicht
diskutiert werden. Kapitel 13 gibt einen kleinen Überblick zu den verschiedenen interpretatorischen Ansätzen.
20
Historischer Einstieg
Kapitel 2
Weshalb Quantenmechanik?
I. Photonenexperimente zur
Polarisation
Um einen Einstieg in die Quantenmechanik zu erhalten, betrachten wir zunächst rein
beschreibend und möglichst frei von Interpretationen zwei Gruppen von Experimenten:
Experimente mit der Polarisation von Licht und (im nächsten Kapitel) Doppelspaltexperimente. In beiden Fällen werden die Phänomene zunächst für gewöhnliches Licht
beschrieben, wo die Erscheinungen vertraut sind. Anschließend werden wir jedoch beschreiben, was passiert, wenn die Intensität des Lichts so weit herabgesetzt wird, dass
nur noch einzelne Lichtquanten – Photonen – durch die experimentelle Anordnung treten. Der klassische mathematische Formalismus, der auf Amplituden und Intensitäten
von Lichtwellen beruht, bleibt größtenteils unverändert, aber die Konzepte Amplitu”
de“ und Intensität“ erhalten eine neue Interpretation.
”
Was man wissen sollte
Licht lässt sich klassisch durch elektromagnetische Wellen beschreiben. Diese Wellen
haben eine Amplitude und eine Phase, außerdem kann Licht eine Polarisation haben.
Das elektromagnetische Feld steht immer senkrecht zur Ausbreitungsrichtung, daher
kann man die Polarisationsrichtung der Amplitude durch einen Vektor in einer 2dimensionalen Ebene beschreiben. Tritt Licht durch einen Polarisationsfilter, wird die
Amplitude auf die Richtung der Polarisation projiziert. Die Intensität ist proportional
zum Absolutquadrat der Amplitude.
Wird Licht immer schwächer, beobachtet man nicht mehr eine kontinuierliche Intensitätsverteilung, sondern es werden lokalisiert diskrete Energiequanten auf
eine photografische Platte (Detektor etc.) übertragen. Die Energie E dieser Quan21
22
Weshalb Quantenmechanik? - Die Polarisation von Photonen
ten hängt mit der Wellenlänge λ über die Beziehung E = hc/λ zusammen, wobei h
das Planck’sche Wirkungsquantum und c die Lichtgeschwindigkeit sind (beides fundamentale Naturkonstanten). Die Intensität auf einer photografischen Platte wird zu
einer relativen Häufigkeit solcher Energiequanten. Die Interpretation der Amplitude
bleibt zunächst offen. Trotzdem bleibt der mathematische Formalismus unverändert:
Die Amplitude wird beim Durchtritt durch einen Polarisationsfilter auf die Polarisationsachse projiziert und die Intensität, die für einzelne Energiequanten oder Photonen
die Interpretation einer Wahrscheinlichkeit für den Nachweis eines solchen Photons
erhält, ist proportional zum Absolutquadrat der Amplitude.
2.1
2.1.1
Klassische Lichtwellen
Licht als Welle und seine Intensität
Der Streit, ob es sich bei Licht um Teilchen oder Wellen handelt, reicht historisch weit
zurück. Isaac Newton (1642–1726) vertrat in seiner Opticks [58] ein Teilchenbild, da
er damit beispielsweise die nahezu geradlinige Ausbreitung von Licht erklären konnte,
aber auch weil er – unter anderem wegen der nahezu reibungsfreien Bewegung der
Planeten – nicht an das Vorhandensein eines Äthers glaubte. Damals konnte man sich
eine Welle ohne ein Medium, von dem diese Welle eine Anregung oder Schwingung
darstellt, nicht vorstellen. Sein Zeitgenosse Christiaan Huygens (1629–1695) hingegen
vertrat ein Wellenbild von Licht, mit dem sich Beugungs- und Interferenzerscheinungen
(z.B. Newton’sche Ringe) leicht erklären ließen.
Im 19. Jahrhundert setzte sich die Vorstellung von Licht als einer Welle durch,
insbesondere nachdem James Clerk Maxwell (1831–1879) und Heinrich Hertz (1857–
1894) zeigen konnten, dass Licht eine elektromagnetische Welle ist, die sich als Lösung
der Maxwell-Gleichungen darstellen lässt. Dabei wird Licht durch ein elektrisches (und
magnetisches) Vektorfeld beschrieben, das der Wellengleichung genügen muss:
1 ∂2
~
− ∆ E(x,
t) = 0 .
c2 ∂t2
(2.1)
Für ebene Lichtwellen erhält man Lösungen der Form
~
~ ei(~k·~x−ωt) ,
E(x,
t) = A
(2.2)
wobei ~k (mit |~k| = 2π
) der Wellenzahlvektor ist und ω = 2πν = 2πc/λ die Winλ
kelfrequenz. λ ist die Wellenlänge des Lichts, ν die normale Frequenz (Anzahl von
Schwingungen pro Zeiteinheit) und c die Lichtgeschwindigkeit. Aus der freien Maxwell~ ·E
~ = 0 ergibt sich ~k · E
~ = 0, d.h. E
~ – und damit auch die Amplitude
Gleichung ∇
Klassische Lichtwellen
23
~ – stehen senkrecht auf der Ausbreitungsrichtung. Sichtbares Licht ist eine elektroA
magnetische Welle, deren Wellenlänge im Bereich zwischen rund 380 nm und 780 nm
liegt. Licht mit 400 nm erscheint blau-violett, Licht mit 700 nm kräftig rot.
~
Zur Bestimmung des physikalischen E-Feldes
muss man die Lösung 2.2 in ihren Real- und Imaginärteil zerlegen, also in Sinus- und Kosinusfunktionen, allerdings
~ komplex sein kann. Das bedeutet, die beiden
ist dabei zu berücksichtigen, dass A
Komponenten der reellen Lösungen können verschiedene Phasen haben. Man erhält
auf diese Weise teilweise zirkular polarisiertes Licht, wohingegen man bei Phasengleichheit von linear polarisiertem Licht spricht. Wegen der beiden gekoppelten freien
Maxwell-Gleichungen,
~
~ ×E
~ = − 1 ∂B
∇
c ∂t
und
~
~ ×B
~ = 1 ∂E ,
∇
c ∂t
(2.3)
~ B
~ = 0) liegt die Lösung für das B-Feld
~
(sowie ∇·
bis auf eine Konstante fest, sobald das
~
E-Feld bekannt ist (ich verwende hier die in der theoretischen Physik gebräuchlichen
Gauß-Einheiten, diese Details spielen aber keine Rolle).
Für das Folgende ist es wichtig, eine Vorstellung von der Intensität einer Welle
zu bekommen. Allgemein versteht man unter der Intensität einer Welle eine Energiestromdichte (Energiedichte multipliziert mit der Geschwindigkeit des Energieträgers),
also die Energiemenge, die pro Zeiteinheit durch oder auf ein Flächenelement tritt.
Zum Nachweis der Welle ist wichtig, wie viel Energie die Welle pro Zeiteinheit und
Flächeneinheit auf das Nachweismaterial (photografische Platte, Szintillationsschirm,
Geiger-Zähler, Photomultiplyer, CCD-Kamera etc.) überträgt. Diese Menge sollte aber
bei nicht zu hohen Intensitäten proportional zur Intensität der Welle sein. Die Schwärzung einer photografischen Platte ist proportional zur Intensität der Strahlung und
proportional zur Belichtungszeit, da hier die gesamte übertragene Energie relevant ist.
Die Energieflussdichte des elektromagnetischen Feldes wird durch den PoyntingVektor beschrieben:
~ t) = c (E(x,
~
~
S(x,
t) × B(x,
t)) ,
(2.4)
4π
und auch die Energiedichte selbst ist ein quadratischer Ausdruck in den Feldern:
w(x, t) =
1 ~
~
(|E(x, t)|2 + |B(x,
t)|2 ) .
8π
(2.5)
Daher ist es plausibel (und lässt sich in einer ausführlicheren Betrachtung auch zeigen),
dass die Intensität der Welle am Ort x durch das Quadrat der Amplitude gegeben ist:
I(x) ∝ |A(x)|2 .
(2.6)
Eine Zeitabhängigkeit werden wir in Zukunft vernachlässigen: Sichtbares Licht hat eine Frequenz von rund 4–8 · 1014 Hz. In den meisten Experimenten werden daher nur
24
Weshalb Quantenmechanik? - Die Polarisation von Photonen
gemittelte Intensitäten gemessen. Langsame Zeitabhängigkeiten aufgrund von Intensitätsschwankungen der Quelle lassen wir ebenfalls außer acht.
Beobachtet wird natürlich immer nur die von einem Detektor oder einer photografischen
Platte absorbierte Energiemenge. Diese wird beispielsweise von David Bohm in seinem Buch zur
Quantenmechanik [9] hergeleitet. Jeder Oszillator wirkt wie eine kleine Antenne und kann von der
Welle Energie absorbieren. Die absorbierte Energiemenge hängt natürlich auch von der Frequenz der
Welle (sowie der Eigenfrequenz der Oszillatoren) ab, bleibt aber proportional zum Absolutquadrat
der Amplitude.
2.1.2
Polarisation und Polarisationsstrahlteiler
Licht kann in unterschiedlichen Polarisationen vorkommen. Allgemein unterscheidet
man linear (oder auch planar) polarisiertes Licht und zirkular polarisiertes Licht (sowie natürlich Mischformen dieser beiden). Der Einfachheit halber interessiert uns im
Folgenden nahezu ausschließlich linear polarisiertes Licht. In diesem Fall ist der Am~ in Lösung 2.2 reell und die Phasen der Welle sind für beide Kompoplitudenvektor A
nenten gleich.
Für die weiteren Betrachtungen stellen wir uns immer vor, dass sich die ebene
~ liegt somit in der xyLichtwelle in Richtung der z-Achse ausbreitet, der Vektor A
Ebene. In dieser Ebene hat die Welle überall denselben Wert, d.h., wir vernachlässigen
die Abhängigkeiten, die sich durch die endliche Ausdehnung der Polarisationsfilter,
~ beschreibt die Amplitude der Welle
Blenden, Schirme etc. ergeben. Der Betrag von A
und seine Richtung die momentane Polarisation.
Als wichtigstes Instrument zur Beeinflussung der Amplituden betrachten wir
im Folgenden den Polarisationsstrahlteiler. Oftmals handelt es sich dabei um einen
Würfel (daher auch Polwürfel genannt), der aus zwei Prismenteilen zusammengesetzt
ist (Abb. 2.1).
Die Prismen sind durch eine Grenzfläche getrennt, deren Effekt ähnlich der einer Wasser- oder Glasoberfläche ist: Trifft ein Lichtstrahl auf die Grenzfläche, wird
ein Teil des Strahls reflektiert und ein Teil in das Medium gebrochen. Unter einem bestimmten Winkel (dem Brewster-Winkel) ist der reflektierte Strahl dabei vollständig
linear polarisiert und zwar parallel zur Grenzfläche (und natürlich senkrecht zur Ausbreitungsrichtung). Der gebrochene Strahl ist im Allgemeinen eine Superposition der
beiden möglichen Polarisationen, wobei der Anteil parallel zur Grenzfläche um den
reflektierten Anteil verringert ist. Bei bestimmten Kristallen kann man durch geeignete Beschichtungen sowie Mehrfachgrenzflächen erreichen, dass auch der gebrochene
Strahl vollständig polarisiert ist. Der Brewster-Winkel ist dadurch definiert, dass der
Winkel zwischen gebrochenem und reflektiertem Strahl gerade 90◦ beträgt.
Statt eines Polarisationsstrahlteilers verwendet man für manche Experimente
auch einfache Polarisationsfilter. Dabei handelt es sich meist um Kristalle, die Licht
Klassische Lichtwellen
25
h
6
A
.. A
...
.
.
.
.. ....
.
.
. ... .
.
.
.
.
v
@
@
@
@
@
6
@
@
@
h
6
v
Abbildung 2.1: (Links) Ein Polwürfel oder Polarisationsstrahlteiler besteht aus zwei
zusammengesetzten Prismen mit einer besonders präparierten Grenzfläche. (Mitte)
Ein einfallender (unpolarisierter) Strahl wird in zwei (orthogonal) polarisierte Strahlen
aufgespalten. Der reflektierte Strahl besitzt eine Polarisation parallel zur Grenzfläche
(v) – in der Abbildung senkrecht zur Bildebene –, der durchgelassene Strahl eine
horizontale Polarisation (h) in der Bildebene. (Rechts) Umgekehrt kann man auch
zwei geeignet polarisierte Strahlen zu einem gemeinsamen Strahl zusammenführen.
Bei umgekehrter Wahl der Polarisationen für die einfallenden Strahlen verläuft der
ausfallende Strahl nach oben.
einer Polarisation absorbieren und Licht mit einer orthogonalen Polarisation durchlassen. Oft erlauben die atomaren Bestandteile dieser Kristalle das Schwingen von Ladungsträgern entlang einer ausgezeichneten Richtung, sodass diese Ladungen bezüglich
dieser Richtung wie Antennen wirken, welche die elektromagnetische Strahlung absorbieren. Für das Folgende können wir bei Polarisationsfiltern aber auch einfach an
Polarisationsstrahlteiler denken, bei denen uns für weitere Untersuchungen nur einer
der austretenden Strahlen interessiert. Hinter der anderen austretenden Strahlrichtung
kann ein Detektor die Strahlung nachweisen (vgl. Abb. 2.2).
Wir interessieren uns bei den Polarisationsexperimenten ausschließlich für die
~ und ihr Verhalten, wenn der Lichtstrahl durch Polarisationsstrahlteiler
Amplitude A
oder Polarisationsfilter tritt, deren Achsen unter verschiedenen Winkeln in der Polarisationsebene ausgerichtet sind. Abgesehen von den Strahlteilern bzw. Filtern sollen
keine weiteren Einflüsse den Betrag oder die Richtung dieser Amplitude verändern.
Die mathematische Beschreibung reduziert sich daher auf die Betrachtung des Ampli~ in einem 2-dimensionalen (reellen) Vektorraum.
tudenvektors A
2.1.3
Hintereinandergeschaltete Polarisationsfilter
Wir stellen uns nun einen Lichtstrahl vor, der durch einen ersten Polarisationsfilter getreten ist. Die Polarisationsachse dieses Filters sei parallel zur horizontalen x-
26
Weshalb Quantenmechanik? - Die Polarisation von Photonen
h
Detektor
v
v
h
6
6
'$
6
'$
&%
&%
@
@
@
@
6
6
y
6
6
-
x
Abbildung 2.2: (Links) Wird bei einem Polwürfel die Intensität des abgelenkten Strahls
mit einem Detektor gemessen, erhält man effektiv einen Polarisationsfilter, für den (bei
Kenntnis der Intensität des einfallenden Strahls) die Intensität des durchgelassenen
Strahls auch ohne direkte Messung bekannt ist. (Mitte und Rechts) Für Polarisationsfilter bzw. bei Verwendung eines Polwürfels als Polarisationsfilter verwenden wir im
Folgenden diese Symbole. Die Richtung der durchgelassenen Polarisation wird durch
den eingezeichneten Kreisdurchmesser markiert. h bezieht sich auf horizontale Polarisation (in x-Richtung) und v auf eine vertikale Polarisation (in y-Richtung) bei Blick
in Strahlrichtung. (Achtung: Das Koordinatensystem zur xy-Richtung bezieht sich nur
auf die symolisch dargestellen Polfilter und bezeichnet immer eine Ebene senkrecht zur
Strahlrichtung.)
Achse. Hinter dem Polarisationsfilter hat die Amplitude des Lichts somit nur eine
~ = A~ex . Wir können die Intensität dieses Lichtstrahls (d.h. das Bex-Komponente: A
~ beispielsweise durch einen Szintillationsschirm sichtbar machen
tragsquadrat von A)
oder durch eine photographische Platte messen.
Lassen wir das so präparierte Licht durch einen zweiten Polarisationsfilter mit
derselben Polarisationsachse hindurchtreten, passiert im Wesentlichen nichts: Das Licht
tritt ungehindert durch den zweiten Filter hindurch; seine Intensität ist dieselbe wie
vorher. Dieses Verhalten erlaubt es uns erst, von einer Polarisation des Lichts zu sprechen. Steht die Achse des zweiten Polarisationsfilters jedoch senkrecht auf der Achse
des ersten Polarisationsfilters, wird das gesamte Licht absorbiert und es tritt nichts
hindurch, wie wir wieder durch die Detektorplatte nachweisen können.
Nun soll die Polarisationsachse des zweiten Filters jedoch unter einem Winkel
α zur Achse des ersten Filters stehen. In diesem Fall tritt nur ein bestimmer Anteil
des Lichts durch den Filter. Experimentell stellt man fest, dass die Intensität I2 hinter
dem Filter mit der Intensität I1 vor dem Filter über die Beziehung
I2 = I1 cos2 α
zusammenhängt.
(2.7)
Klassische Lichtwellen
27
~ der WelDiese Beziehung lässt sich leicht verstehen, wenn man die Amplitude A
le als einen gewöhnlichen Vektor interpretiert, der in eine Komponente parallel zur
Polarisationsachse und eine Komponente senkrecht zur Polarisationsachse des zweiten Filters zerlegt werden kann. Die Komponente senkrecht zur Polarisationsachse
des Filters wird von dem Filter absorbiert und es tritt nur die Komponente parallel
zur Polarisationsachse hindurch. Insgesamt kann man die Wirkung des zweiten Polarisationsfilters somit als als eine Projektion dieses Vektors auf die Achse des Filters
interpretieren und es gilt für den Betrag der Amplitude:
~ 2| = A
~ 1 · ~eα = |A
~ 1 |(~ex · ~eα ) = |A
~ 1 | cos α .
|A
(2.8)
Da die Intensität der Welle gleich dem Quadrat der Amplitude ist, verringert sich die
Intensität der Welle um den Faktor cos2 α.
Ein verblüffender Effekt ergibt sich, wenn man hinter den ersten Polarisationsfilter (mit seiner Achse parallel zur x-Achse) zunächst einen zweiten Filter stellt, dessen
Polarisationsachse senkrecht auf dem ersten Filter steht, dessen Achse also entlang der
y-Achse liegt. Nun tritt kein Licht durch die Anordnung der beiden Filter hindurch.
Schiebt man aber einen dritten Filter zwischen die ersten beiden Filter, sodass dessen
Polarisationsachse unter einem Winkel von 45◦ zu den anderen beiden Polarisationsachsen steht, tritt plötzlich wieder Licht durch die Anordnung hindurch. Verblüffend
an diesem Experiment ist, dass durch das Hinzufügen eines weiteren Filters zu einer
Anordnung, die zunächst sämtliches Licht absorbiert, plötzlich wieder Licht hindurchtritt.
Der Effekt lässt sich wiederum leicht verstehen, wenn man bei Licht an eine
Welle mit einer Amplitude denkt, die von den Polarisationsfiltern immer auf die Polarisationsachse projiziert wird. Anfänglich stehen die beiden Filter senkrecht aufeinander und es tritt kein Licht hindurch. Wurde der dritte Filter dazwischengeschoben,
wird die Amplitude zunächst auf eine Achse unter einem Winkel von 45◦ projiziert
und verkürzt sich damit um den Kosinus von 45◦ :
~ 2 = (|A
~ 1 |~ex · ~e45◦ )~e45◦ = |A
~ 1 | cos 45◦ ~e45◦
A
(2.9)
Am dritten Filter wird diese neue Amplitude, die nun nicht mehr senkrecht auf der
y-Achse steht, auf die y-Achse projiziert und somit wieder um den Faktor cos 45◦
gekürzt. Insgesamt erhalten wir für die Amplitude hinter dem dritten Filter:
~ 3 = |A
~ 1 | cos2 (45◦ ) ~ey .
A
(2.10)
Der Betrag der Amplitude hat sich also halbiert und für die Intensität folgt:
I3 = I2 (cos 45◦ )2 = I1 (cos 45◦ )4 =
1
I1 .
4
(2.11)
28
Weshalb Quantenmechanik? - Die Polarisation von Photonen
Wir sehen also, dass wir die Effekte an Polarisationsfiltern leicht verstehen können,
wenn wir uns Licht als eine Welle mit einer vektorwertigen Amplitude vorstellen. Diese Amplitude können wir in Bezug auf zwei beliebige aufeinander senkrecht stehende
Richtungen zerlegen, und der Filter lässt jeweils immer nur den Anteil parallel zur
Polarisationsachse hindurch. Die Amplitude wird durch die Filter also auf deren Polarisationsachse projiziert. Die Intensität wird dabei um den Faktor cos2 α abgeschwächt,
wobei α der Winkel zwischen der Polarisationsrichtung der Welle und der Polarisationsachse des Filters ist.
2.2
Einzelne Photonen
Wir verringern nun die Intensität der Lichtquelle. Die erste Feststellung ist, dass die
relativen Intensitäten, wie sie nach den Polarisationsfilteranordnungen auftreten, nicht
von der absoluten Intensität der Lichtquelle abhängen. Inbesondere ist das Verhältnis
der Intensität I2 von Licht, das zwei Filter, die unter einem Winkel α zueinander
stehen, passiert hat, im Verhältnis zur Intensität I1 des Lichts direkt hinter dem ersten
Filter durch I2 /I1 = cos2 α gegeben.
Nun soll die Intensität der Lichtquelle jedoch soweit herabgesenkt werden, dass
die pro Zeiteinheit im Mittel abgegebene Energie von der Größenordnung E = hν wird,
wobei ν = c/λ die Frequenz des Lichts ist (und h = 6, 626 · 10−34 Js das Planck’sche
Wirkungsquantum). Die Intensität ist nun sehr gering, und wenn wir eine photographische Platte zum Nachweis des Lichts hinter die Polarisationsfilter stellen, müssen
wir möglicherweise sehr lange warten, bis eine deutlich erkennbare Schwärzung zu
erkennen ist.
Ein paar Zahlen: Ein einzelnes Photon mit einer Wellenlänge von rund 660 nm (rotes Licht)
hat eine Energie von
E
m
1
c
= 6, 626 · 10−34 Js · 3 · 108 ·
λ
s 6, 6 · 10−7 m
≈ 3 · 10−19 J .
= h
Das bedeutet, ein gewöhnlicher Laserpointer mit einer Leistung von 1 mW strahlt rund 3 · 1015
Photonen in jeder Sekunde ab, wobei wir Energieverluste anderer Art außer Acht gelassen haben.
Ein Einzelphotonnachweis ist heute mit sehr empfindlichen CCD-Kameras – beispielsweise
EMCCD (electron multiplying charge-coupled device) Kameras – möglich. Sie haben eine räumliche
Auflösung im Bereich von µm und eine zeitliche Auflösung im MHz-Bereich.
Ein großes Problem sind auch Einzelphotonenquellen. Quanteneffekte verhindern, dass man
eine gleichmäßig verteilte Einzelphotonenquelle dadurch erhält, dass man gewöhnliche Lichtquellen
(Glühbirnen oder Laser) einfach ausreichend stark abschirmt. Oft verwendet man die Fluoreszenz
von Zweiniveau-Systemen (Atomen) in Kristalldefekten, die man durch Laserlicht anregt. Noch aufwendiger ist die Down-Conversion (vgl. Abschnitt 11.1.5), bei der ein einfallendes hochenergetisches
Photon in einem nicht-linearen Kristall in zwei Photonen niedrigerer Energie umgewandelt wird. Der
Einzelne Photonen
29
Vorteil ist jedoch, dass man durch den Nachweis eines dieser Photonen weiß, dass ein zweites Photon
unterwegs“ ist. Auf die experimentellen Details werde ich hier nicht weiter eingehen; wichtig ist
”
lediglich, dass die angegebenen Experimente tatsächlich durchgeführt werden können.
Mit sehr empfindlichen Nachweisgeräten beobachten wir jedoch einen seltsamen Effekt: In unregelmäßigen Abständen werden zeitlich und räumlich lokalisierte
Energieübertragungen nachgewiesen. Zunächst beobachtet man nur wenige, mehr oder
weniger statistisch verteilte Übertragungspunkte. Je länger man wartet, umso dichter
werden diese Punkte. Das Licht trifft also bei diesen geringen Intensitäten nicht mehr
kontinuierlich auf die Nachweisplatte und führt langsam aber ebenfalls kontinuierlich
zu einem zunehmenden Energieübertrag, sondern wir beobachten in unregelmäßigen
Zeitabständen einzelne Signale auf der Nachweisplatte, die davon zeugen, dass an diesem Ort eine bestimmte Energiemenge auf die Platte getroffen ist und die Reaktion
zu ihrem Nachweis ausgelöst hat. (Dabei handelt es sich im Wesentlichen um eine
Variante des photoelektrischen Effekts, bei dem ein Photon ein Elektron aus einem
Verband herausschlägt, das dann nachgewiesen werden kann.) Bei jedem einzelnen
Ereignis dieser Art wurde dieselbe Energie hν auf die Nachweisplatte übertragen.
Vergleichen wir die Anzahl der punktförmigen Nachweiszentren hinter verschiedenen Filteranordnungen, so ist diese direkt proportional zu den relativen Intensitäten,
die wir vorher bei einem intensiveren Licht gemessen haben. Bei genauerer Betrachtung erweisen sich also die klassisch gemessenen Intensitäten der elektromagnetischen
Wellen als eine relative Häufigkeit von diskreten Energiequanten — den sogenannten
Photonen — und bei der Extrapolation zur Beschreibung einzelner Teilchen wird diese
als Wahrscheinlichkeit interpretiert, bei einer Messung ein solches Photon tatsächlich
vorzufinden.
Man interpretiert die diskreten Lichtquanten, die auf die Detektorplatten übertragen werden, also als einzelne Photonen (Teilchen mit der Energie E = hν), die
von der Lichtquelle ausgesendet werden und schließlich beim Nachweis auf die Platte
treffen. Bei gewöhnlichem Licht handelt es sich um sehr viele Photonen, deren einzelne
Wirkungen wir nicht auflösen können, doch bei der als sehr schwach angenommenen
Lichtquelle treten die Photonen einzeln aus der Lichtquelle und treffen auch nacheinander und einzeln auf die Nachweisplatte.
Ich werde im Folgenden von Photonen oder Lichtquanten sprechen, ohne aber
damit bereits implizieren zu wollen, dass es sich hierbei um Teilchen im herkömmlichen
Sinne handelt. Was genau Photonen (und entsprechend alle anderen Entitäten, mit
denen wir es zu tun haben werden, wie Elektronen, Protonen etc.) sind, wissen wir
nicht. Wir können nur sagen, dass offenbar eine Energieübertragung von dieser En”
tität Photon“ auf was auch immer für ein Nachweisgerät in diskreten, räumlich und
zeitlich lokalisierten Einheiten erfolgt, die – sofern wir Licht einer festen Wellenlänge
betrachten – der Energie E = hν entspricht.
30
2.2.1
Weshalb Quantenmechanik? - Die Polarisation von Photonen
Die Eigenschaften |hi und |vi
6
h
@
Detektor 3
@
@
@
6
h
@
Detektor 2
v
@
@
@
?
v
Detektor 1
Abbildung 2.3: Hinter den ersten
Polarisationsstrahlteiler
werden
weitere
Polarisationsstrahlteiler
(in jede Strahlrichtung einer) mit
denselben Polarisationsrichtungen
gestellt. Theoretisch wären nun
vier Wege für ein Photon möglich,
die wir durch Detektoren prüfen
können. Nur in Detektor 1 und 4
werden Photonen gemessen, nie
aber in Detektoren 2 und 3. Ein
horizontal polarisiertes Photon
bleibt (ohne weitere Einflüsse)
horizontal polarisiert; entsprechend
bleibt ein vertikal polarisiertes
Photon vertikal polarisiert.
Detektor 4
Zunächst stellen wir hinter den ersten Polwürfel in jede der ausgehenden Strahlrichtungen jeweils einen weiteren Polwürfel mit den (in Strahlrichtung) selben Achsenrichtungen (vgl. Abb.2.3).
6
Nach dem ersten Polarisationsstrahlteiler, bei dem das Photon in zwei Richtungen gelenkt werden kann, befinden sich nun zwei weitere Polarisationsstrahlteiler
(in jedem Strahlengang einer), bei denen das Photon theoretisch wieder in zwei Richtungen abgelenkt werden könnte. Das ergibt insgesamt vier Möglichkeiten, die wir
durch anschließende Detektoren überprüfen können. Es zeigt sich, dass nur zwei der
Möglichkeiten tatsächlich auftreten: Ein Photon, das am ersten Polwürfel abgelenkt
wurde – dem wir also im Sinne der klassischen Interpretation eine vertikale Polarisation
zuschreiben würden – wird immer auch am zweiten Polwürfel abgelenkt; entsprechend
wird ein Photon, das am ersten Polwürfel nicht abgelenkt wurde (und eine horizontale
Polarisation hat) auch am zweiten Polwürfel nicht abgelenkt.
Dieses Verhalten hatten wir schon bei gewöhnlichen Lichtstrahlen beobachtet: Ein Lichtstrahl wird nur in Detektor 1 und Detektor 4 abgelenkt. Abbildung
2.4 zeigt die Verhältnisse nochmals mit gewöhnlichen Polarisationsfiltern hinter dem
ersten Polwürfel.
Denkt man bei Photonen an Teilchen, wie es ihr nahezu punktförmiger Nachweis
auf den Detektorplatten suggeriert, fällt es schwer sich vorzustellen, was die Polarisation bzw. die Polarisationsachse für ein solches Teilchen bedeuten soll. Andererseits
Einzelne Photonen
31
Detektor 1
Polwürfel
h
@
@
@ @
@ @
R
@v
@
P Detektor 2
Spiegel P
-
-
-
-
-
Abbildung 2.4: Wir können hinter den ersten Polarisationsstrahlteiler beliebig viele
Polarisationsfilter der entsprechenden Polarisationsrichtung aufstellen, ohne dass eine
(wesentliche) Intensitätsminderung in den Detektoren auftritt.
kann man sich natürlich auf den Standpunkt stellen, dass die Polarisation vielleicht
nur ein anschauliches, aus der Wellenvorstellung für Licht entnommenes Bild ist, das
für Photonen keine Gültigkeit mehr hat. Offensichtlich können Photonen jedoch eine
Eigenschaft besitzen, die sie beispielsweise durch einen Filter mit der Achse parallel
zu einer bestimmten Richtung hindurchtreten lässt (und zwar unabhängig davon, wie
viele dieser Filter wir hintereinanderschalten), die sie andererseits aber von einem Filter mit einer senkrecht dazu stehenden Achse absorbiert werden lässt, und das gleich
beim ersten Mal. Wir können daher das Verhalten geeignet präparierter Photonen an
bestimmten Filtern bzw. Polarisationsteilern mit Sicherheit“ vorhersagen. Dies erst
”
gibt uns die Rechtfertigung, von einer Eigenschaft“ der Photonen zu sprechen. Theo”
retisch hätte es ja auch sein können, dass ein Photon immer rein zufällig von einem
Filter absorbiert oder durchgelassen wird, unabhängig von seiner Vergangenheit. (Wir
werden später sehen, dass die klassische Vorstellung einer Polarisation einer Welle
auf dem Niveau einzelner Teilchen“ mit der Eigenschaft eines Spins“ in Verbindung
”
”
gebracht wird.)
Was auch immer diese Eigenschaft sein mag, wir geben ihr eine suggestive symbolische Bezeichnung: Wir nennen sie |hi bzw. |vi, wobei sich die Eigenschaft |hi
experimentell darin äußert, dass dieses Photon von einem Polarisationsfilter mit einer horizontalen Achse immer durchgelassen wird (die zunächst seltsam anmutenden
Klammern werden später noch erläutert, hier dienen sie einfach nur zur Kennzeichnung einer Eigenschaft). Entsprechend ist |vi die Eigenschaft, einen Polarisationsfilter
mit vertikaler Polarisationsachse immer zu passieren.
32
Weshalb Quantenmechanik? - Die Polarisation von Photonen
Weiterhin zeigen uns diese Experimente, dass die beiden Eigenschaften |hi und
|vi im klassischen Sinne entgegengesetzt sind, also sich gegenseitig ausschließen. Ein
Photon mit der Eigenschaft |hi wird von einem vertikal ausgerichteten Polarisationsfilter immer absorbiert, entsprechend ein Photon mit der Eigenschaft |vi von einem
horizontal ausgerichteten Polarisationsfilter. Außerdem sind die beiden Eigenschaften
in gewisser Hinsicht vollständig“: Jedes Photon wird von einem Polwürfel entweder
”
in die eine oder die andere Richtung abgelenkt. Bei einem Polwürfel mit einer festen
Achsenausrichtung gibt es keine dritte Möglichkeit.
Im mathematischen Sinne sind die beiden Eigenschaften |hi und |vi komplementär: Jedes
Photon, das auf einen Polwürfel trifft, hat anschließend entweder die Eigenschaft |hi oder die Eigenschaft |vi, und diese beiden Eigenschaften schließen sich auch gegenseitig aus. Das bedeutet, die
Menge der möglichen Zustände unter der gegebenen experimentellen Anordnung (also dieser speziellen Stellung des Polwürfels) besteht nur aus diesen beiden Zuständen. Man spricht daher auch von
einem Zwei-Zustands-System. Die Menge der Zustände ist somit {h, v}, und in diesem Sinne sind die
Teilmengen {h} und {v} mathematisch komplementär.
Leider wird in der Quantenmechanik der Begriff komplementär aber in einem anderen Sinne benutzt, insofern sollte man zwischen klassischer Komplementarität“ und quantenmechanischer
”
”
Komplementarität“ unterscheiden. Im obigen Beispiel wäre eine komplementäre Messanordnung im
quantenmechanischen Sinne eine andere Stellung des Polwürfels, beispielsweise mit Polarisationsrichtungen unter ±45◦ – siehe nächsten Abschnitt.
2.2.2
Die Eigenschaften |αi, |pi und |mi
Nun stellen wir hinter einen ersten Filter (der nur Photonen mit der Eigenschaft |hi
durchlassen soll) einen zweiten Polarisationsfilter, dessen Polarisationsachse um einen
Winkel α zur x-Richtung gedreht ist. Das Experiment zeigt folgende Effekte:
- Photonen werden von dem Filter entweder absorbiert oder durchgelassen, d.h.,
auf dem Detektorschirm hinter dem zweiten Filter treffen immer noch ganze
Photonen auf. Es werden weder nur Anteile“ eines Photons gemessen, noch hat
”
sich die einzelne Energie der durchgelassenen Photonen verändert.
Entsprechend werden die Photonen von einem Polarisationsstrahlteiler, dessen
Achsen nun unter einem Winkel α zur Horizontalen geneigt sind, entweder in
die eine oder die andere Richtung abgelenkt. Nie werden nur Anteile eines Photons abgelenkt, und nie wird ein Photon absorbiert, also weder in die eine noch
die andere Richtung abgelenkt. (Diese letzte Aussage ist eine Idealisierung, da
praktisch jeder Kristall einen gewissen Prozentsatz an Photonen absorbiert; dieser Prozentsatz ist aber nahezu unabhängig von dem Winkel α und kann mit
hochwertigen Geräten beliebig klein gemacht werden.)
- Eine Intensitätsmessung über einen längeren Zeitraum zeigt, dass die Anzahl der
Einzelne Photonen
33
Photonen, die pro Zeiteinheit auf einen Detektorschirm hinter dem zweiten Filter treffen, um den Faktor cos2 α geringer ist, als die Anzahl der Photonen, die
den ersten Filter passiert haben. Dies entspricht der Beobachtung bei einer klassischen elektromagnetischen Welle, deren Intensität bei dieser Filteranordnung
um den Faktor cos2 α verringert wird.
Entsprechend beobachtet man bei einem Polwürfel, dass der Anteil der abgelenkten Photonen nun sin2 α von der einfallenden Intensität beträgt.
- Befindet sich hinter dem zweiten Filter ein dritter Filter, dessen Achse ebenfalls
unter dem Winkel α zur x-Achse orientiert ist (also parallel zur Achse des zweiten
Filters steht), so tritt dieselbe Anzahl von Photonen pro Zeiteinheit hindurch.
Es werden also an dem dritten Filter keine Photonen mehr absorbiert, welche
den zweiten Filter passiert haben.
Die letztgenannte experimentelle Tatsache legt nahe, einem solchen Photon,
das den zweiten Filter passiert hat, die Eigenschaft |αi zuzusprechen. Damit ist die
Eigenschaft gemeint, mit Bestimmtheit durch einen Filter mit Polarisationsachse unter
dem Winkel α zur Horizontalen hindurchtreten zu können. Entsprechend bezeichnen
wir mit |90◦ +αi die Eigenschaft, von einem solchen Filter immer absorbiert zu werden,
bzw. (was äquivalent ist) von einem Polarisationsfilter mit der Achsenrichtung 90◦ + α
mit Sicherheit durchgelassen zu werden.
Der Winkel α ist im Prinzip beliebig, allerdings definieren die beiden Winkel α
und α + 180◦ dieselbe Polarisationsrichtung, insofern wählen wir α in Zukunft meist
im Bereich −90◦ < α ≤ +90◦ . Die Menge der möglichen Polarisationszustände lässt
sich also durch einen Winkel zwischen −90◦ und +90◦ kennzeichnen. Im Hinblick auf
spätere Anwendungen definieren wir folgende spezielle Polarisationsrichtungen (p, m
beziehen sich auf plus und minus 45◦ ):
|hi = |0◦ i
|pi = | + 45◦ i
|vi = |90◦ i
|mi = | − 45◦ i
Wir stellen nun hinter den zweiten Filter (Polarisationsrichtung α) einen dritten Filter, dessen Polarisationsachse allerdings wieder horizontal ist. Wie wir es von
unserer bei gewöhnlichem Licht gewonnenen Anschauung erwarten, werden an dem
dritten Filter wieder einige Photonen absorbiert, und die Intensität bzw. die Anzahl
der durchgelassenen Photonen verringert sich erneut um den Faktor cos2 α. Offenbar
wurde die Eigenschaft |hi, die alle Photonen hinter dem ersten Filter noch hatten,
durch den zweiten Filter teilweise zerstört. Wir müssen also schließen, dass ein Filter
nicht einfach nur Photonen mit gewissen Eigenschaften ungehindert hindurchlässt und
andere Photonen absorbiert, sondern offensichtlich hat er auch einen Einfluss auf die
Polarisationseigenschaften der Photonen — er kann diese Eigenschaften verändern.
34
Weshalb Quantenmechanik? - Die Polarisation von Photonen
Anscheinend hat ein einzelnes Photon nicht per se“ bestimmte Polarisations”
eigenschaften, sondern ein Filter, durch den dieses Photon hindurchtritt, scheint ihm
diese Eigenschaften erst zu geben. Entsprechend kann ein zweiter Filter auch eine
vorhandene Polarisationseigenschaft nehmen bzw. verändern, sofern er unter einem
bestimmten Winkel zur ursprünglichen Polarisationsrichtung steht.
Das Gesagte lässt uns also zu dem Schluss kommen, dass ein Filter nicht unbedingt eine bestimmte Eigenschaft eines Photons misst“, sondern dass ein Filter
”
Photonen, die den Filter passieren, mit dieser Eigenschaft präpariert“. Man kann
”
nun mit diesen so präparierten Photonen weitere Experimente machen. Stellt man
weitere Filter mit derselben Polarisationsachse hinter den ersten Filter, kann man eigentlich auch nicht von einer Messung sprechen – sofern man unter einer Messung
einen Informationsgewinn versteht –, sondern man bestätigt nur die Tatsache, dass
eine bestimmte Eigenschaft und damit ein bestimmter Zustand vorliegt.
2.3
2.3.1
Ein Vektor- und Matrizenmodell
Zustände als Strahlen in der Ebene
Die bisherigen Erörterungen legen es nahe, dass die Vorstellung von einem Amplitu~ zur Beschreibung der Eigenschaft, die wir klassisch mit der Polarisation
denvektor A
in Verbindung bringen, durchaus sinnvoll zu sein scheint. Dieser Amplitudenvektor
wird durch einen Filter auf eine bestimmte Achse projiziert, allerdings hat die so
erhaltene Intensität, also das Betragsquadrat des projizierten Vektors, für Photonen
die Bedeutung einer relativen Häufigkeit. Für einzelne Photonen entspricht das einer
Wahrscheinlichkeit.
Bei Wellen wissen wir, wie die neuen Amplituden nach dem Durchtritt der Welle
durch einen Filter zu berechnen sind. Wir übernehmen nun einfach diesen Formalismus
auf für einzelne Photonen — er führt zu den experimentell richtigen Ergebnissen —,
interpretieren ihn aber im Sinne von Wahrscheinlichkeiten.
Ein Photon, das einen v-Filter (alo einen vertikalen Filter) passiert hat, wird
~ = ~ey beschrieben, entsprechend wird ein Photon, das einen h-Filter
durch den Vektor A
~ = ~ex beschrieben:
(horizontale Polarisationsachse) passiert hat, durch A
!
1
~x =
A
Amplitude eines Photons, das einen x-Filter passiert hat,(2.12)
0
!
0
~y =
A
Amplitude eines Photons, das einen y-Filter passiert hat.(2.13)
1
Diese beiden Vektoren repräsentieren nun also ein Photon mit den Eigenschaften |hi
und |vi.
Ein Vektor- und Matrizenmodell
35
Allgemeiner beschreiben wir ein Photon, das einen α-Filter (relativ zur x-Achse)
passiert hat, also die Eigenschaft |αi hat, durch
~α =
A
cos α
sin α
!
Amplitude eines Photons, das einen α-Filter passiert hat. (2.14)
Streng genommen wird der Polarisationszustand eines Photons durch die Polarisationsachse beschrieben. Jeder Vektor auf dieser Achse bezeichnet somit denselben Zustand
und ist daher ein Repräsentant für diesen Zustand.
Hier scheint ein Unterschied zur klassischen Sichtweise zu bestehen: Dort ent~ einer Amplitude und das Quadrat dieser Amplitude ist proportional zur
spricht A
~ eine beobachtbare Bedeutung zu.
Intensität. Klassisch schreiben also dem Vektor A
~ 2 eine relative Häufigkeit. Bei
Denken wir an einen Schwarm von Photonen, wird aus |A|
einem Übergang zu einem einzelnen Teilchen, wird aus dieser relativen Häufigkeit die
Interpretation einer Wahrscheinlichkeit. Um bei den Berechnungen der Wahrscheinlichkeiten bzw. relativen Häufigkeiten nicht immer normieren zu müssen, wählt man
als Repräsentatenvektor für den Polarisationszustand einen auf 1 normierten Vektor.
Dies ist in obigen Beispielen geschehen. Man kann diese Normierung so interpretieren,
dass ein Photon im Zustand α mit Sicherheit (Wahrscheinlichkeit 1) eine Polarisation
~ α hat. Es verbleibt allerdings immer noch ein Vorzeichen: A
~ α und −A
~α
parallel zu A
lassen sich experimentell nicht unterscheiden und bezeichnen denselben Polarisationszustand.
2.3.2
Filter als Projektions-Matrizen
Die Wirkung eines Filters lässt sich bei einer Lichtwelle durch die Projektion der Amplitude auf die Polarisationsachse beschreiben. Zur Berechnung der Wahrscheinlichkeit,
mit der ein einzelnes Photon mit Polarisationsrichtung ~eα einen Filter passiert, dessen Polarisationsachse in Richtung ~eβ zeigt, bilden wir das Skalarprodukt der beiden
Vektoren (dies liefert uns den Betrag der projizierten Amplitude) und quadrieren das
Ergebnis:
Prob(|βi ← |αi) = |(~eβ · ~eα )|2 = cos2 (β − α) .
(2.15)
Prob(|βi ← |αi) bezeichnet die Wahrscheinlichkeit, dass ein Photon mit der Eigenschaft |αi einen Filter passiert, der ihm die Eigenschaft |βi verleiht.
Der Formalismus liefert uns also zwei Informationen: Zum einen können wir die
Wahrscheinlichkeit berechnen, mit der ein Photon mit einer bestimmten Polarisationseigenschaft durch einen bestimmten Filter tritt, bzw. bei einem Polwürfel in eine
bestimmte Richtung abgelenkt wird. Andererseits sagt er uns auch, durch welchen Zustandsvektor ein Photon, das tatsächlich durch den zweiten Filter hindurchgetreten ist
36
Weshalb Quantenmechanik? - Die Polarisation von Photonen
(bzw. von einem Polwüfel in eine bestimmte Richtung abgelenkt wurde), nun beschrieben werden muss. Der Zustandsvektor für die Polarisationseigenschaft des Photons
hinter dem Filter ist ein anderer als der vor dem Filter. Diese Neuzuschreibung eines Zustands zu einem physikalischen System nach dem Passieren eines Filters (leider
spricht man in diesem Fall auch von einer Messung“, was in meinen Augen eine sehr
”
unglückliche Bezeichnung ist) bezeichnet man in der Quantenmechanik als Kollaps“
”
des Quantenzustands oder auch als Reduktion“ des Quantenzustands.
”
Wir können die Wirkung eines Polarisations-Filters auch durch eine Matrix ausdrücken, welche einen beliebigen anfänglichen Polarisationsvektor auf einen bestimmten neuen Polarisationsvektor (parallel zur Polarisationsachse des Filters) projiziert.
Für die horizontale und vertikale Achse gilt einfach:
!
1 0
Ph =
Wirkung eines h-Filters,
(2.16)
0 0
!
0 0
Pv =
Wirkung eines v-Filters.
(2.17)
0 1
Etwas weniger offensichtlich ist, dass die folgende Matrix einen α-Filter beschreibt:
!
cos2 α
cos α sin α
Pα =
Wirkung eines α-Filters.
(2.18)
cos α sin α
sin2 α
Man erkennt jedoch, dass die Wirkung dieser Matrix auf eine Amplitude zu einem
in x-Richtung bzw. in y-Richtung polarisierten Photon folgende Amplitudenvektoren
liefert:
!
!
cos α
cos α
Pα~ex = cos α
Pα~ey = sin α
.
(2.19)
sin α
sin α
In beiden Fällen erhalten wir also eine Amplitude, die in α-Richtung zeigt, allerdings
ist das Betragsquadrat dieser Amplitude nun cos2 α bzw. sin2 α. Das entspricht jedoch
genau unserer Interpretation der Wahrscheinlichkeit: Das Betragsquadrat der Amplitude ergibt die Wahrscheinlichkeit, dass das entsprechende Photon den α-Filter passiert.
Diese Wahrscheinlichkeit ist für das h-Photon gerade cos2 α, und für das v-Photon
1 − cos2 α = sin2 α.
Für die bisher definierten Projektionsmatrizen gelten folgende Beziehungen:
Ph~ex = ~ex
und
Pv~ey = ~ey
(2.20)
Ph~ey = 0
und
Pv~ex = 0 .
(2.21)
Die ersten beiden Gleichungen bringen zum Ausdruck, dass ein in x-Richtung polarisiertes Photon mit Sicherheit von einem h-Filter durchgelassen wird, und entsprechend
Ein Vektor- und Matrizenmodell
37
wird ein in y-Richtung polarisiertes Photon von einem v-Filter durchgelassen. Die beiden unteren Gleichungen bedeuten, dass ein vertikal polarisiertes Photon mit Sicherheit von einem h-Filter und ein horizontal polarisiertes Photon von einem v-Filter
absorbiert wird.
Weitere, leicht zu zeigende Identitäten sind:
Ph Ph = Ph , P v Pv = Pv , P h Pv = P v Ph = 0 .
(2.22)
Diese Gleichungen bedeuten, dass zwei hintereinandergeschaltete h-Filter ebenso wirken wie ein einzelner h-Filter, entsprechend für v-Filter. Stellt man einen h-Filter
hinter einen v-Filter (oder umgekehrt) wird überhaupt kein Photon durchgelassen, es
werden also alle Photonen absorbiert.
2.3.3
Superpositionen
Wir wollen diese Beschreibung für den Polarisationszustand von Photonen noch etwas
weiter ausreizen. Der Zustandsvektor für ein Photon, das einen α-Filter passiert hat,
lässt sich nach den horizontalen und vertikalen Polarisationsrichtungen zerlegen (Gl.
2.14):
~ α = cos α A
~ x + sin α A
~y .
A
(2.23)
Im Sinne einer klassischen Welle besitzt diese Gleichung eine anschauliche Bedeutung: Eine in α-Richtung polarisierte Welle lässt sich als Überlagerung von einer in
x-Richtung und einer in y-Richtung polarisierten Wellen schreiben. Die Komponenten
entsprechen dabei den Amplituden dieser Wellen. Die Interpretation dieser Gleichung
für ein einzelnes Photon ist schwieriger und führt uns wieder ins Zentrum der Diskussion um die Bedeutung der Quantenmechanik. An dieser Stelle soll daher nur angedeutet
werden, was diese Gleichung nicht bedeutet:
• Sie bedeutet nicht, dass sich ein Photon im Zustand |αi aus zwei Photonen
zusammensetzt, von denen eines den Zustand |hi und das andere den Zustand
|vi hat. Beide Beiträge auf der rechten Seite der Gleichung beschreiben (bis auf
einen Faktor) einzelne Photonen, und auch die Summe beschreibt wieder nur ein
einzelnes Photon.
• Sie bedeutet ebenfalls nicht, dass sich ein Photon im Zustand |αi entweder im
Zustand |hi befindet oder im Zustand |vi. Erst auf dem Niveau von Wahrscheinlichkeiten ist eine solche entweder–oder“ -Interpretation zulässig. Bilden wir das
”
~x ⊥ A
~ y ), so erhalten wir:
Quadrat dieser Gleichung (und nutzen aus, dass A
~ α k2 = cos2 αkA
~ x k2 + sin2 αkA
~ y k2 .
kA
(2.24)
38
Weshalb Quantenmechanik? - Die Polarisation von Photonen
Diese Gleichung können wir nun im Sinne von Wahrscheinlichkeiten deuten:
Wenn an einem |αi–Photon eine Messung der horizontalen bzw. vertikalen Polarisation vorgenommen wird (das bedeutet, das Photon tritt zunächst durch
einen h-v-orientierten Polarisationsstrahlteiler, anschließend messen Detektoren
die Richtung der Ablenkung), dann finden wir mit der Wahrscheinlichkeit cos2 α
eine horizontale Polarisation (es wird von einem entsprechenden polarisationsabhängigen Strahlteiler mit dieser Wahrscheinlichkeit in die |hi-Richtung abgelenkt) und mit der Wahrscheinlichkeit sin2 α eine vertikale Polarisation.
Abbildung 2.5: Photonen, die den αFilter passieren, haben hinter dem Filter
die Polarisation |αi. Ein anschließender
Polwürfel sei so ausgerichtet, dass er einen
einfallenden Strahl in eine horizontale (h)
und eine vertikale (v) Komponente zerlegt. Durch Spiegel werden dieser Strahlen auf einen zweiten Polwürfel derselben Polarisationsrichtungen gelenkt und
wieder zusammengeführt. Hinter diesem
Polwürfel liegt wieder die Polarisation α
vor, wie man durch einen entsprechenden
Filter und anschließenden Detektor nachweisen kann. (Anmerkung: Hier wurden
die Phasenverschiebungen an den reflektierenden Flächen nicht berücksichtigt –
siehe Abschnitt 11.2. Es geht zunächst
nur um das Prinzip.)
Detektor
Ohne damit eine Erklärung gefunden zu haben, wie man Gleichung 2.23 zu interpretieren hat, spricht man in der Quantenmechanik von einer Superposition. Man sagt, dass
ein in α-Richtung polarisiertes Photon eine Superposition von einem in x-Richtung
und einem in y-Richtung polarisierten Photon ist. Dabei ist allerdings zu bedenken,
dass eine solche Zerlegung in Komponenten bezüglich zweier beliebiger orthogonaler
Vektoren vorgenommen werden kann.
α
6
α
α
-
h-
6
6
6
-
v
α
6
α
6
Abbildung 2.5 zeigt eine experimentelle Anordnung, welche die Zerlegung in
eine Superposition und anschließende Zusammenführung nach folgendem Schema
~eα −→ cos α ~ex + sin α ~ey −→ ~eα
(2.25)
experimentell realisiert, und zwar sowohl für gewöhnliche Lichtstrahlen als auch –
nach geeigneter Uminterpretation der Intensitäten in Wahrscheinlichkeiten – für ein-
Messungen“
39
”
zelne Photonen. Angenommen, ein Photon wird von einem α-Filter durchgelassen und
hat somit die Eigenschaft |αi. Anschließend trifft dieses Photon auf einen Polwürfel,
der gewöhnliches Licht in horizontale und vertikale Polarisationen aufspalten würde.
Wir könnten in beide Strahlen Detektoren stellen und nachweisen, dass jedes einzelne
Photon mit einer Wahrscheinlichkeit cos2 α in die horizontale Richtung und mit der
Wahrscheinlichkeit sin2 α in die vertikale Richtung abgelenkt wird. In einem konkreten
Experiment werden diese Wahrscheinlichkeiten durch die relativen Häufigkeiten gemessen, mit der Photonen in den jeweiligen Detektoren nachgewiesen werden. Führen
wir eine solche Messung aber nicht durch, können wir die potenziellen Strahlen wieder durch einen entsprechenden Polarisationsfilter zu einem einzigen Strahl zusammenführen. Wir werden nun feststellen, dass (1) alle Photonen, die den ersten Filter
passiert haben, auch den zweiten Filter passieren, also keines absorbiert wurde, und
(2) diese Photonen die Eigenschaft |αi haben. Eine solche Aufspaltung in die beiden
superponierten Anteile lässt sich bezüglich jeder orthonormalen Polarisationsrichtung
der Polwürfel durchführen.
2.4
Messungen“
”
Der Begriff der Messung spielt in der Quantenmechanik eine wichtige aber auch sehr
umstrittene Rolle. Einerseits haben die Väter“ der Quantenmechanik, allen voran
”
Bohr und Heisenberg, Wert darauf gelegt, dass sich die Quantenmechanik nur auf das
Beobachtbare beziehen darf, und sie haben daher ihre Axiomatik der Quantentheorie
auf das Beobachtbare und damit die Ergebnisse von Messungen aufgebaut. Andererseits haben Kritiker wie John Bell (1928–1990) immer wieder betont, dass bei einer
wirklich fundamentalen Theorie die Beschreibung einer Messung“ eigentlich aus dem
”
Formalismus ableitbar sein sollte. In einem berühmten Artikel Against Measurement‘
’
[7] spricht sich Bell dafür aus, diesen Begriff — natürlich nicht das Experiment selbst
— ganz aus dem Vokabular des Physikers zu verbannen, zumindest wenn er über die
Grundlagen der Quantentheorie spricht, da es sich letztendlich nur um eine besondere
Form von Wechselwirkung zwischen zwei Systemen handelt (siehe dazu den Abschnitt
13.1 zum Messproblem).
An dieser Stelle sollen einige Bemerkungen zum Begriff der Messung im Zusammenhang mit dem Polarisationsfreiheitsgrad von Photonen gemacht werden und
auch eine mathematische Darstellung von dem Ergebnis von Beobachtungen gewonnen
werden.
40
Weshalb Quantenmechanik? - Die Polarisation von Photonen
2.4.1
Messung als Präparation, Nachweis, Bestätigung oder
Prokrustie“
”
In der klassischen Physik bedeutet eine Messung im Idealfall, dass wir eine Information über das gemessene System erhalten, ohne dass sich der Zustand dieses Systems
in irgendeiner Weise geändert hat. Diese Idealvorstellung einer Messung ist in der
Quantentheorie im Allgemeinen nicht mehr haltbar.
Nach unseren Erläuterungen zum Polarisationszustand einzelner Photonen sollten wir die Bedeutung und Wirkung von Messgeräten“, wie Polarisationsfiltern, De”
tektoren und Polarisationsstrahlteilern, eigentlich in mehrere Klassen unterteilen:
- Den Durchtritt eines Photons durch einen Filter könnte man als Präparation
bezeichnen, insbesondere wenn über den Zustand des Photons vorher nichts bekannt ist. Eine Präparation erfolgt immer in Bezug auf eine bestimmte Polarisationsachse. Nach dem Durchtritt ist bekannt, dass das Photon die dieser Achse
entsprechende Polarisationseigenschaft hat.
Dabei ist zu berücksichtigen, dass wir ein einzelnes Photon nicht gezielt in
einen vorgegebenen Polarisationszustand bringen können. Wie der Name Filter“
”
schon zum Ausdruck bringt, werden Photonen, welche die gewünsche Eigenschaft
nicht annehmen, herausgefiltert.
- Ob ein Photon den Filter passiert hat oder nicht, wissen wir im Allgemeinen
nicht. Ein Detektor hinter einem Filter kann ein Photon registrieren, allerdings
wird das Photon dabei im Allgemeinen entweder vernichtet oder aber in seinem
Zustand drastisch verändert. Meist können wir mit einem solchen Photon keine
weiteren kontrollierten Experimente mehr durchführen. Es hat aber ein Nachweis
des Photons stattgefunden.
- Eine Bestätigung findet statt, wenn wir (aufgrund der Theorie) wissen, in welchem Polarisationszustand sich ein Photon befindet – beispielsweise, weil es einen
bestimmten Filter passiert hat – und wir nun eine Messung genau dieser Eigenschaft durchführen (also z.B. einen zweiten Filter mit exakt derselben Polarisationsrichtung hinter dem ersten aufbauen). Eine Bestätigung ändert unsere
Information über einen Zustand nicht, insofern ist es eigentlich keine Messung.
Allerdings könnte man auf einer Meta-Ebene sagen, dass eine Bestätigung eine Theorie testet (es könnte ja sein, dass Photonen ihre Polarisationsrichtung
spontan verändern). Auf einer Meta-Ebene mag also ein Informationszuwachs
stattfinden, im Rahmen einer Theorie führt eine Bestätigung nicht zu einem
Informationszuwachs.
- Die Wirkung eines Polarisationsstrahlteilers bzw. Polwürfels mit anschließenden
Messungen“
41
”
Detektoren in den beiden Strahlgängen ist das, was man landläufig als Messung“
”
bezeichnet. Doch liegt hier wirklich eine Messung in dem Sinne vor, wie wir es
aus der klassischen Physik gewohnt sind?
Erwin Schrödinger hat 1934 in einer Arbeit (eher scherzhaft) vorgeschlagen, den
Begriff der Messung durch Prokrustie“ zu ersetzen [68]. Dabei bezog er sich auf
”
den Riesen Procrustes in der griechischen Mythologie, der seine Gäste in seine
Betten zwängte: Waren die Gäste zu groß, wurden ihnen Füße oder Beine abgehackt, waren sie zu klein, wurden sie auf dem Ambos gestreckt. Er schreibt in
dieser Arbeit: Will man es wirklich noch eine Messung nennen, wenn (wie man
oft hört) der Experimentator dem Objekt denjenigen Wert der zu messenden
Größe, den er hernach als Ergebnis seiner Messung bezeichnet, erst aufzwingt?
Wenn eine Bezeichnung dafür benötigt wird, möchte ich den Ausdruck Prokrustie
vorschlagen! (obwohl ich weiß, daß der Experimentator sich den Wert nicht aussuchen kann; immerhin, er zwingt seine Opfer in eines seiner Betten, während
es überhaupt in keines paßt).
Diese Beschreibung trifft den Sachverhalt nach unseren Überlegungen zur Polarisation von Photonen recht gut. Ein Polwürfel definiert eine orthonormale Basis
der Polarisationen; er zeichnet zwei orthogonale Richtungen aus. Jedes einfallende Photon wird in eine der beiden Richtungen abgelenkt und hat anschließend
die entsprechende Polarisation. Ob es sie vorher schon hatte, erscheint nach dem
oben Gesagten im Allgemeinen zweifelhaft. Der Polwürfel zwingt dem Photon eine der beiden Polarisationen auf. Allerdings betont Schrödinger zurecht, dass der
Experimentator – im Gegensatz zu dem Riesen Procrustes – sich nicht aussuchen
kann, welche Polarisation das Photon im Anschluss haben wird.
2.4.2
Ein Matrixmodell von Messung“
”
Während Polarisationsfilter einen Lichtstrahl auf eine bestimmte Polarisationsachse
projizieren, trennt ein Polwürfel den Strahl räumlich in zwei Anteile. Mit Detektoren
in den beiden Strahlgängen können wir messen“, welche Polarisation ein Photon hat,
”
nachdem es von dem Polwürfel abgelenkt wurde.
In diesem Abschnitt soll keine dynamische Beschreibung dieses Messprozesses
vorgenommen werden, sondern es geht darum, wie wir die Information, die mit einem solchen Messprozess verbunden ist, in effektiver Weise kodieren können. Diese
Information umfasst zweierlei: Erstens die Kenntnis der beiden orthogonalen Polarisationsrichtungen, in die der Strahl zerlegt wird, und zweitens Messwerte, die angeben,
was bei einer Registrierung in einem der Detektoren eigentlich gemessen wurde (z.B.,
ob h oder v).
Die beiden Polarisationsachsen können wir entweder durch zwei Vektoren (z.B.
42
Weshalb Quantenmechanik? - Die Polarisation von Photonen
~eh und ~ev ) oder durch die beiden zugehörigen Projektionsmatrizen (Ph und Pv ) beschreiben. Als Messwerte können wir zunächst zwei beliebige Zahlen λh und λv wählen.
Wir werden später sehen, dass wir diese Messwerte mit einem Eigendrehimpuls“
”
(Spin) des Photons in Verbindung bringen und ihnen in diesem Zusammenhang auch
bestimmte Werte zuweisen können. Im Augenblick sind die Messwerte noch willkürlich.
Zur Kodierung dieser Information wählen wir eine Matrix M mit folgenden Eigenschaften: Ihre Diagonalelemente bezüglich der Polarisationsrichtungen geben die
Messwerte an, und bezüglich verschiedener Polarisationsrichtungen seien ihre Matrixelemente null, z.B.
~eh · M~eh = λh
,
~ev · M~ev = λv ,
~eh · M~ev = ~ev · M~eh = 0 .
(2.26)
Diese Eigenschaften legen die Matrix fest. Bezüglich der Basis, die durch die Polarisationsrichtungen ausgezeichnet ist, hat die Matrix also Diagonalform:
!
λh 0
M=
,
(2.27)
0 λv
doch die Definition ist unabhängig von der gewählten Koordinatenbasis.
2.5
Zusammenfassung
Wir können die bisherigen Ergebnisse folgendermaßen zusammenfassen. Diese Darstellung dient als Vorbereitung, Motivation und Veranschaulichung für den allgemeinen
Formalismus der Quantenmechanik in Kapitel 5.
Darstellung von Zuständen: Ein Polarisationszustand entspricht einer Geraden, also einem 1-dimensionalen Unterraum der Ebene. Man spricht manchmal auch
von einem Strahl. Repräsentieren können wir einen Zustand durch einen (Einheits)Vektor. Äquivalent können wir auch einen Zustand durch eine Projektionsmatrix charakterisieren, die den Polarisationsfilter auf diesen Zustand mathematisch darstellt.
Darstellung einer Observablen: Ein Polwürfel zeichnet zwei orthogonale Richtungen aus, die wir durch ein Orthonormalsystem von Vektoren beschreiben
können. Ein Polwürfel ist durch die Angabe dieser Orthonormalbasis charakterisiert.
Eine mathematische Repräsentation ist mit einer Matrix möglich, zu der die beiden
ausgezeichneten Polarisationsrichtungen gerade die Eigenvektoren sind.
Wahrscheinlichkeitsinterpretation für Übergänge: Die Wahrscheinlichkeit, dass ein im Polarisationszustand |αi präpariertes Photon durch einen Filter mit
der Polarisationsachse β tritt und somit anschließend den Polarisationszustand |βi
hat, ist cos2 (α − β) = (~eβ · ~eα )2 . Diese Wahrscheinlichkeit ist also gleich dem Quadrat
des Skalarprodukts der beiden Einheitsvektoren zu den Polarisationsrichtungen. Diese
Beziehung bezeichnet man als Born’sche Regel.
Zusammenfassung
43
Reduktionspostulat: Nachdem ein Photon durch einen Polarisationsfilter oder
einen Polwürfel getreten ist, hat sich sein Polarisationszustand verändert. Er wird nun
durch einen Vektor der durch den Polwürfel ausgezeichneten Orthonormalbasis charakterisiert.
44
Weshalb Quantenmechanik? - Die Polarisation von Photonen
Kapitel 3
Weshalb Quantenmechanik?
II: Das Doppelspaltexperiment
Als zweites Beispiel vertrauter Erscheinungen, die fast nahtlos in die Quantenmechanik
übertragen werden können, betrachten wir Doppelspaltexperimente. Bei der Beugung
von Licht sind hier insbesondere die Interferenzmuster auf einem Schirm hinter einem
Doppelspalt bekannt. Wiederum werden wir Lichtintensitäten betrachten, die nur noch
einzelnen Photonen entsprechen.
Richard Feynman (1918–1988) hat einmal über das Doppelspaltexperiment gesagt: ... [it] has been designed to contain all of the mystery of quantum mechanics“
”
([30], S.130). Damit wollte er zum Ausdruck bringen, dass es zwar viele Dinge in der
Quantenmechanik gibt, die uns von unserer Alltagsvorstellung her erstaunlich erscheinen, dass sich letztendlich aber alle diese Dinge auf das seltsame Verhalten von Teilchen beim Doppelspalt zurückführen lassen. Auch wenn man diese Aussage sicherlich
einschränken sollte, bleibt der Doppelspalt ein Paradigma für das Besondere an der
Quantentheorie. Daher soll dieses Paradigma im Folgenden eingehender beschrieben
werden.
Was man wissen sollte
Beim Doppelspaltexeriment tritt eine ebene Lichtwelle (fester Wellenlänge) zunächst
durch einen Doppelspalt und trifft anschließend auf eine photografische Platte. Dort
beobachtet man ein Interferenzmuster, bei dem sich die Orte für die Minima und Maxima der Intensität aus klassischen Überlegungen zur Überlagerung von Wellenzügen
berechnen lassen. Setzt man die Intensität herab, beobachtet man wiederum nur das
Auftreffen einzelner Energiequanten auf der Platte. Die Auftreffpunkte zeigen (für
genügend viele Photonen) eine Interferenzverteilung. Jeder Versuch, den Spalt, durch
den ein Photon tritt, zu messen (d.h. sogenannte which-path“-Information zu erlan”
45
46
Weshalb Quantenmechanik? - Der Doppelspalt
gen), zerstört das Interferenzmuster und führt zu einer Verteilung, wie man sie für
klassische Punktteilchen erwarten würde.
Der mathematische Formalismus zur Beschreibung der Photonen wird von der
klassischen Theorie unverändert übernommen: Man beschreibt ein Photon zunächst
durch eine Welle, die durch den Spalt tritt und deren beiden Anteile hinter dem Doppelspalt interferieren können. Dieser Welle wird keine direkte physikalische Interpretation
zugesprochen (man spricht manchmal von einer Wahrscheinlichkeitsamplitude), doch
das Absolutquadrat dieser Welle wird als die Wahrscheinlichkeit für das Auftreffen
eines Energiequants an einem bestimmten Ort der photografischen Platte interpretiert
und ist experimentell messbar.
DeBroglie postulierte auch Welleneigenschaften für Materie. Dabei übernahm
er die Beziehungen zwischen den Teilcheneigenschaften (Energie und Impuls) und den
Welleneigenschaften (Wellenlänge und Frequenz), die schon für Photonen bekannt waren: E = hν und p = h/λ.
3.1
Der Doppelspalt für Licht und Photonen
Die Polarisation von Licht spielt beim Doppelspalt keine Rolle: Was auch immer für
eine Polarisation vorliegt, der Doppelspalt hat keinen Einfluss auf die Polarisationsrichtung. Daher beschreiben wir der Einfachheit halber Licht mathematisch durch eine
skalare“ Welle, die an jedem Punkt eine momentane Auslenkung“ ψ(~x, t) besitzt.
”
”
Diese Auslenkung kann sowohl positive als auch negative Werte annehmen, allerdings
ist die Intensität der Welle an einem Punkt ~x (zum Zeitpunkt t) wiederum durch
I ∝ |ψ(~x, t)|2 gegeben.
Wir beschreiben eine ebene Lichtwelle, die sich in z-Richtung ausbreitet, durch
ψ(z, t) = A sin(k(z − ct)) ,
(3.1)
der Wellenvektor (in diesem einfachen
wobei A die Amplitude der Welle und k = 2π
λ
Fall die Wellenzahl) sind; c ist die Lichtgeschwindigkeit. Die Kombination (z − ct) im
Argument der Sinus-Funktion bedeutet, dass sich Stellen konstanter Auslenkung (beispielsweise Nullstellen, Wellenberge oder Wellentäler) mit Lichtgeschwindigkeit entlang
der z-Achse ausbreiten.
Wir betrachten im Folgenden eine monochromatische Lichtquelle, die in ihrer Intensität variiert werden kann, und die das Licht im Wesentlichen als parallele
Lichtstrahlen bzw. in Form einer ebenen Welle aussendet. Dieses Licht treffe auf eine
Schablone bzw. eine Abschirmung mit zwei eng beieinanderliegenden Spalten. Durch
die Spalte kann das Licht hindurchtreten. In einem gewissen Abstand hinter dem Doppelspalt befinde sich eine Detektorplatte: Dabei kann es sich um eine photographische
Platte handeln, die mehr oder weniger eine Momentaufnahme des auffallenden Lichts
Der Doppelspalt für Licht und Photonen
47
macht, oder aber besser noch um eine Szintillatorplatte, d.h. ein Material, das beim
Auftreffen von Licht leuchtet. In jedem Fall können wir die Intensität des auftreffenden Lichts messen (Abb. 3.1). Für die Experimente mit einzelnen Photonen verwendet
man typischerweise wieder CCD-Kameras.
Hinter dem Doppelspalt zeigt sich auf der photographischen Platte ein Interferenzmuster, wie es in ähnlicher Form auch von Wasserwellen bekannt ist. Effekte
dieser Art haben dazu geführt, dass wir Licht (klassisch) als eine Welle deuten.
Das Experiment lässt sich ebenso mit Elektronen, Atomen oder kleineren Molekülen durchführen. Anton Zeilinger berichtete im Jahre 2003 von einer Variante
dieses Exeriments mit Buckyballs (C60 -Moleküle) [57], und mittlerweile (2012) lassen
sich Interferenzeffekte sogar für Strahlen aus Teilchen mit einer Massenzahl von rund
10.000 amu (atomic mass units, 1/12 der Masse von 1 2C) erreichen (siehe z.B. [42]).
Qualitativ ist das Ergebnis immer dasselbe, allerdings betrachten wir zunächst Licht,
weil hier der Übergang vom klassischen Verhalten zum quantenmechanischen Verhalten deutlicher wird. Insbesondere sind die zunächst auftretenden Interferenzeffekte für
Licht bekannt und können auch ohne großen Aufwand berechnet werden.
Intensität-
ebene Welle
Lichtquelle
Kreiswellen
$
$
%
%
Schirm
mit Doppelspalt
Detektorplatte
Abbildung 3.1: Das Doppelspaltexperiment. Licht einer festen Wellenlänge trifft auf
einen Schirm mit zwei Spalten. Hinter dem Schirm befindet sich eine Detektorplatte.
Beide Spalte sind offen. Man erkennt auf der Platte die Interferenzstreifen in Form
von oszillierenden Dichteschwankungen.
Zur Erklärung der Interferenzen nimmt man an, dass das Licht zunächst als
ebene Welle auf den Doppelspalt trifft. Hinter den beiden Spalten breiten sich jeweils
kreisförmig zwei Lichtwellenanteile ψ1 (~x) und ψ2 (~x) mit der Wellenlänge des einfallenden Lichts aus. Diese beiden Anteile überlagern sich, sodass die Gesamtwelle hinter
48
Weshalb Quantenmechanik? - Der Doppelspalt
dem Doppelspalt durch
ψg (~x) = ψ1 (~x) + ψ2 (~x)
(3.2)
beschrieben wird. Da die Reaktion der Detektorplatte durch die Intensität der Welle
gegeben ist, erhält man für das Muster auf der Platte eine Verteilung proportional zu
folgender Größe:
I(~x) = |ψ1 (~x) + ψ2 (~x)|2 = |ψ1 (~x)|2 + |ψ2 (~x)|2 + ψ1 (~x)∗ ψ2 (~x) + ψ2 (~x)∗ ψ1 (~x) .
(3.3)
(Viele Gleichungen schreibe ich allgemein für komplexwertige Amplituden, obwohl sie
natürlich insbesondere auch für reelle Amplituden gelten.) An den Stellen, an denen
jeweils Wellenberg auf Wellenberg oder Wellental auf Wellental treffen, ist ψ1 (~x) ≈
ψ2 (~x) und es kommt zu konstruktiver Interferenz, d.h., die letzten beiden Terme tragen
positiv bei und führen zu einer hohen Intensität. Tatsächlich ist die Intensität an
diesen Stellen sogar viermal (!) so hoch wie die Intensität, die ein einzelner Spalt
erzeugen würde. An Stellen, wo Wellenberge auf Wellentäler treffen, kommt es zu
destruktiver Interferenz. Dort gilt ψ1 (~x) ≈ −ψ2 (~x) und die letzten Terme heben die
ersten beiden Terme nahezu auf. Die Intensität ist an diesen Stellen praktisch null,
d.h., die Detektorplatte zeigt keine Reaktion.
Die Orte auf der Platte, an denen die Intensität maximal wird bzw. an denen
sie verschwindet, lassen sich aus rein geometrischen Überlegungen bestimmen (siehe
Abb. 3.2). Dazu nehmen wir folgende Parameter an: λ sei die Wellenlänge des Lichts,
d sei der Abstand zwischen den beiden Spalten und α sei der Winkel (vom Spalt aus
betrachtet), unter dem die Intensität untersucht werden soll.
Konstruktive Interferenz tritt unter einem Winkel auf, bei dem der Gangunterschied ∆x zwischen den beiden Wegstrecken von den Spalten zu einem Punkt der
Platte gerade 0 oder ein ganzzahliges Vielfaches der Wellenlänge ist. Für die destruktive Interferenz lautet die Bedingung, dass sich die beiden optischen Weglängen gerade
um eine halbe Wellenlänge bzw. ein Vielfaches der Wellenlänge plus eine halbe Wellenlänge unterscheiden müssen.
Aus Abb. 3.2 wird offensichtlich, dass die Winkel αn , unter denen es zu konstruktiver Interferenz kommt, folgender Bedingung genügen müssen:
n · λ = ∆x = d sin αn ,
(3.4)
wohingegen für die Winkel αn0 , unter denen destruktive Interferenz auftritt, gilt:
1
λ = d sin αn0 .
(3.5)
n+
2
Die entscheidende Erklärung für das Interferenzmuster beruht somit darauf,
dass sich für eine Welle hinter dem Doppelspalt zwei Anteile überlagen und die Intensität das Quadrat dieser Summe ist: I = |ψ1 + ψ2 |2 . An Stellen, wo die beiden
Der Doppelspalt für Licht und Photonen
λ -
A
A
d A
A ∆x A
αn
49
λ Wellenlänge
d Spaltabstand
∆x Gangunterschied zwischen
den beiden Strahlen
αn Streuwinkel
Abbildung 3.2: Geometrie zur Bestimmung der Winkel, unter denen konstruktive bzw.
destruktive Interferenz auftritt.
Amplituden gleich sind, kommt es zu konstruktiver Interferenz und die Intensität ist
das Vierfache der Intensität eines Beitrags. An Stellen, wo die beiden Amplituden
entgegengesetztes Vorzeichen haben, kommt es zu destruktiver Interferenz und die Intensität verschwindet. Im Durchschnitt ist die Intensität natürlich das Doppelte der
Einzelbeiträge der beiden Spalte, aber an manchen Stellen verschwindet sie, dafür ist
sie an anderen Stellen viermal so groß.
3.1.1
Schwächere Lichtquelle
Soweit bisher geschildert, sind die Erscheinungen beim Doppelspaltexperiment vertraut, und auch die Interferenzmuster für die Intensität der Lichtwelle auf der photographischen Platte finden durch die Wellennatur eine natürliche und eingängige Erklärung.
Nun verringern wir jedoch wieder die Intensität der Lichtquelle soweit, dass
pro Zeiteinheit nur noch sehr wenige Photonen abgestrahlt werden. Wiederum sei die
Detektorplatte so empfindlich, dass einzelne Photonen nachgewiesen werden können,
bzw. dass die Energie eines Lichtquants, das auf die Platte trifft, zu einer Schwärzung
führt.
In unregelmäßigen Abständen entstehen auf der Platte wieder kleine dunkle
Punkte (oder bei einer Szintillationsplatte kleine Lichtblitze). Zunächst beobachten wir
nur wenige Punkte, die statistisch verteilt zu sein scheinen. Warten wir etwas länger,
kommen immer mehr Punkte hinzu und wir stellen fest, dass an manchen Stellen die
Dichte dieser Punkte höher ist als an anderen. Warten wir sehr lange, stellen wir eine
sehr dichte Verteilung von Punkten bei den Interferenzmaxima fest, wohingegen nur
sehr wenige bis gar keine Punkte bei den Interferenzminima liegen (vgl. Fig. 3.3).
Wie schon bei den Polarisationsexperimenten zeigt eine genauere Betrachtung, dass
die klassisch gemessenen Intensitäten der elektromagnetischen Wellen den relativen
50
Weshalb Quantenmechanik? - Der Doppelspalt
•
•
•
a)
•
•
•
• • •
•
•
•
•
•
•
•••
• • •••
•••
•• •
••• ••••••
• • •••••••• •
• •••
• ••••••••• ••• •
•
• ••• •
••• •
•• •••••
•
•
• • •• •••• ••••
•
•• •
••••••• •••
•••• • • •
•
•
•
•
••
•• •
•
•
•
••
•
••
•
•• •
•
•
••• •••• ••• •• • • ••• •••••• ••• ••
• ••• •
• ••••• • •••
•
••• •••
•• • • •
• •••••••
• ••••••
• • ••••••••••••• ••
• • •
• • ••••••• •
• • ••• ••••
••• • ••
•
•
•
• •••• • • ••
•• •
••• •
•
• ••
•••
••• •••
•
•
•
••••••
•
•
•
•
•
•
•
•
•
• ••• •
••
• • •••••• •
• ••••••• • • • •• •••••• •••••
• • ••
• ••••
•
•
•
• •
•
•
•
•
•
• •
•
• ••••• ••
•
•
• • ••• ••
• • • ••
•
•
•
• ••• •••• ••••
• •
•• •••••••• ••
• ••• •••••••
•• ••• •
•• •
••• •••• •••••
•
•• ••••
• ••• • •
• •••• ••••
Häufigkeit
6
20
•
•
b)
••
•
• • • ••• • •
•• •
••• ••••••••••• •
••••• ••••••••
•• •••••••
•••••• •
•••••••••••• •••••• •
••
•
•
•• •• ••••
•••• •••
•• •
••
•
•
••
• •
c)
d)
10
Abbildung 3.3: Punkte auf einer photographischen Platte hinter einem Doppelspalt
nach (a) 1 Sekunde, (b) 5 Sekunden, (c) 1 Minute. (d) zeigt die Häufigkeiten der
Punkte in Bild (c).
Häufigkeiten von diskreten Energiequanten — den Photonen — entsprechen. Und
wiederum führt eine Extrapolation in der Beschreibung einzelner Lichtquanten zu
einer Interpretation der Intensität der Welle als einer Wahrscheinlichkeit, bei einer
Messung ein solches Photon vorzufinden.
Stellt man sich Licht als eine Ansammlung sehr vieler Teilchen im klassischen
Sinne vor, lässt sich das Interferenzmuster kaum verstehen. Ein Strahl klassischer Teilchen würde auf der Detektorplatte eine breite, näherungsweise Gauß’sche Verteilung
ergeben. In diesem Fall ergäbe sich die Gesamtverteilung als einfache Summe der beiden Verteilungen, die man erhält, wenn einer der Spalte abgedeckt wird und nur noch
die Teilchen durch den anderen Spalt treten. Für die Gesamtintensität (die nun einfach
der Gesamtanzahl der Teilchen entspricht) auf dem Schirm würde somit gelten:
Ig (~x) = I1 (~x) + I2 (~x) .
(3.6)
Messungen“
51
”
Dieses Gesetz bringt eine statistische Unabhängigkeit von zwei Ereignissen zum Ausdruck, nämlich dass ein Teilchen entweder durch den ersten oder durch den zweiten
Spalt getreten ist.
Bei Licht hingegen werden nicht die Intensitäten sondern die Amplituden der
beiden Anteile addiert und anschließend zur Bestimmung der Intensität quadriert:
Ig (~x) = I1 (~x) + I2 (~x) + 2ψ1 (~x)ψ2 (~x) .
(3.7)
Während die ersten beiden Terme auf der rechten Seite dieser Gleichung die jeweiligen
Intensitäten wiedergeben, die das Licht hätte, falls einer der Spalte abgedeckt worden
wäre, kommt bei einer Welle noch der letzte Term hinzu, der für das Interferenzmuster
verantwortlich ist. Er ist das Produkt der beiden Amplituden und beschreibt somit
eine Korrelation“ zwischen den beiden Anteilen der Welle, die durch die beiden Spal”
te getreten sind. Eine solche Korrelation lässt sich leicht erklären, wenn irgendetwas
gleichzeitig durch beide Spalte tritt. Sie ist aber schwer erklärbar, wenn man annimmt
– wie es bei einzelnen Teilchen, die möglicherweise in großem zeitlichen Abstand auf
die Platte treffen, naheliegen würde –, dass etwas nur durch einen der beiden Spalte
treten kann.
Wie schon bei den Polarisationsexperimenten gelangen wir zu folgender Interpretation: Im Photonenbild entspricht die Intensität I(~x) einer Dichte der Teilchen an
einem Ort ~x. Wenn wir diese Beschreibung, die für sehr viele Teilchen ihre Gültigkeit
hat, auf ein einzelnes Teilchen übertragen wollen, wird I(~x) zu einer Wahrscheinlichkeit (genauer, einer Wahrscheinlichkeitsdichte): I(~x) dV ist proportional zu der Wahrscheinlichkeit, dass ein Photon in einem Volumen dV um den Punkt ~x nachgewiesen
wird. Damit sind wir für das (Absolut)Quadrat I = |ψ|2 der Welle ψ(~x) zu einer
Wahrscheinlichkeitsinterpretation gelangt. Welche Bedeutung die Welle ψ(~x) selbst
hat, bringt uns mitten in die Diskussion um das Problem der Interpretation der Quantenmechanik und soll zunächst noch nicht diskutiert werden. Man spricht manchmal
(nicht unbedingt glücklich) von einer Wahrscheinlichkeitsamplitude“, was zunächst
”
nichts weiter bedeutet, als dass das Quadrat dieser Amplitude eine Wahrscheinlichkeit
darstellt. Das Besondere an der Behandlung der Photonen ist somit, dass nicht die
Wahrscheinlichkeiten für zwei scheinbar unabhängige Ereignisse ( tritt durch Spalt 1“
”
oder tritt durch Spalt 2“) addiert werden, sondern die Wahrscheinlichkeitsamplituden
”
dieser Ereignisse. Das Quadrat dieser Summe ergibt dann die Wahrscheinlichkeit.
3.2
Messungen“
”
Das Auftreffen eines Photons auf der Detektorplatte, das beispielsweise bei einer photographischen Platte zu einer Schwärzung führt, wird üblicherweise als Messung“
”
52
Weshalb Quantenmechanik? - Der Doppelspalt
gedeutet. Allerdings sollte man auch hier vorsichtig sein, denn ähnlich wie bei den Polarisationsfiltern könnte das Auftreffen eines Photons an einem bestimmten Punkt diese
Eigenschaft ist an einem bestimmten Ort“ überhaupt erst erzeugen bzw. präparieren.
”
Mit dieser Problematik im Hinterkopf werde ich mich trotzdem im Folgenden dem
üblichen Sprachgebrauch anschließen und von einer Messung sprechen.
Die photographische Platte misst also die Intensitätsverteilung bzw. die Wahrscheinlichkeit, mit der ein Photon an einem bestimmten Ort seine Energie auf die
Platte oder einen Detektor übertägt. Der Übergang von einer Intensität zu einer relativen Häufigkeit bzw. Wahrscheinlichkeit erfordert allerdings eine Normierung, die in
diesem Fall jedoch von Vorteil ist: Eine Intensität ist, wie wir schon gesehen haben, ein
Energiedichtestrom, und hängt nicht nur von dem Quadrat der Amplitude ab, sondern
auch von der Wellenlänge des Lichts sowie möglicherweise anderen Eigenschaften. Eine
Wahrscheinlichkeit bzw. eine relative Häufigkeit ist aber eine dimensionslose Zahl, für
die außerdem noch gelten soll, dass die Summe über alle möglichen Ereignisse eins
ist. Für die Interpretation von |ψ(~x)|2 als Wahrscheinlichkeit müssen wir also noch
fordern:
Z
|ψ(~x)|2 dV = 1 .
(3.8)
V
In diesem Abschnitt werde ich noch etwas lax mit dem Integrationsvolumen, der Existenz gewisser Integrale oder auch der Dimension des zu integrierenden Volumens umgehen. Es kann sich um ein zweidimensionales Integral über eine Fläche oder auch um
ein dreidimensionales Integral über ein Volumen handeln, in manchen Fällen sogar um
ein eindimensionales Integral über ein Intervall. Das Integrationsvolumen werde ich gelegentlich weglassen, bzw. durch den gesamten Raum ersetzen, wobei immer impliziert
wird, dass die Wellen genügend weit draußen“ nahezu verschwinden. Ich werde auch
”
keine explizite Zeitabhängigkeit mehr betonen, da ich zunächst statische Situationen
betrachte (das Licht strahlt mit konstanter Intensität auf den Doppelspalt).
Da I(~x) = |ψ(~x)|2 nun einer Wahrscheinlichkeitsdichte entspricht, können wir
zunächst gewisse Kenngrößen dieser Wahrscheinlichkeitsdichte messen. Beispielsweise
ist der Erwartungswert für die Messung des Orts eines Teilchens durch
Z
Z
2
h~xi =
~x I(~x) dV =
ψ(~x)∗ ~xψ(~x) dV
(3.9)
V
V
gegeben. Entsprechend ist die Varianz für diese Ortsmessung:
Z
2
2
(∆x) = h(~x − h~xi) i =
ψ(~x)∗ (~x − h~xi)2 ψ(~x) dV .
(3.10)
V
Von besonderem Interesse ist auch die Wahrscheinlichkeit, mit der ein Photon in einem
kleinen Volumenbereich ∆V gemessen wird:
Z
Z
2
w(∆V ) =
|ψ(~x)| dV =
ψ(~x)∗ χ∆V (~x) ψ(~x) dV
(3.11)
∆V
V
Messungen“
”
mit
53
(
χ∆V (~x) =
1 für ~x ∈ ∆V
0 sonst
.
(3.12)
Wir erhalten also die Kenngrößen der räumlichen Verteilung durch die Bildung der
entsprechenden Erwartungswerte. Allgemein ist
Z
Z
Z
2
f (~x) I(~x) dV =
f (~x) |ψ(~x)| dV =
ψ ∗ (~x) f (~x)ψ(~x) dV .
(3.13)
hf (~x)i =
V
V
V
Wenn es nur die räumliche Intensitätsverteilung gäbe, könnten wir aus diesen Erwartungswerten räumlicher Funktionen sämtliche Informationen über die Intensitätsverteilung zurückgewinnen und diese sogar aus den Erwartungswerten rekonstruieren. Es erhebt sich somit die Frage, ob in der Welle ψ(~x) mehr Information steckt,
als in der Intensitätsdichte |ψ(~x)|2 . An dieser Stelle wird wichtig, dass die Welle ψ(~x)
komplex sein kann, bzw. dass die reellen Wellen nicht nur eine Amplitude sondern auch
eine (möglicherweise ortsabhängige) Phase haben, die sich in der Intensitätsmessung
nicht zeigt. In der komplexen Schreibweise gewinnen wir aus Erwartungswerten der
Art (3.13) keine Information über die Phase einer Funktion ψ(~x) = eiα(~x) |ψ(~x)|.
Hat diese Phase eine physikalische Bedeutung, oder ist lediglich die Intensitätsdichte relevant? Wir wissen, dass die klassische Welle eine bestimmte Wellenlänge
hat, beschrieben durch einen Wellenzahlvektor ~k. Auch wenn wir im Augenblick noch
nicht wissen, was dieser Wellenzahlvektor für ein einzelnes Photon bedeutet, können
wir diese Größe doch aus der Wellenfunktion ψ(~x) zurückgewinnen.
Betrachten wir dazu nochmals eine ebene Welle
~
ψ(~x) = A ei(k·~x−ωt) .
(3.14)
Eine Intensitätsmessung dieser Welle liefert I = |A|2 = const, also eine Intensitätsverteilung, aus der sich keine Information über ~k gewinnen lässt. Wie wir gesehen haben,
können wir aber von einer solchen Welle die Wellenlänge bestimmen, beispielsweise
indem wir sie durch einen Doppelspalt treten lassen und dann das Interferenzmuster
ausmessen. Der Doppelspalt wirkt nun wie eine erste Messung (vergleichbar mit einem Filter), der die ebene Welle zerstört (hinter dem Doppelspalt haben wir keine
ebene Welle mehr sondern zwei sich überlagernde Zylinderwellen), der wir aber nun
entnehmen können, welche Wellenlänge das Licht hat.
Es gibt also Messanordnungen, die es uns ermöglichen, den Wellenzahlvektor
einer Lichtwelle zu bestimmen. Wie erhalten wir nun den Wellenzahlvektor von einer
ebenen Welle, wie sie durch Gl. 3.14 beschrieben wird? Formal können wir von der
Welle ψ(x) die Fourier-Transformierte bilden:
Z
1
~
ψ(~x)e−ik·~x dV
(3.15)
ψ̃(k) =
d/2
(2π)
V
54
Weshalb Quantenmechanik? - Der Doppelspalt
(d ist die Dimension des Volumens, über das integriert wird, also d = 1 für ein Intervall, d = 2 für eine Fläche etc.) Auch zu dieser Fourier-Transformierten gehört eine
Intensitätsverteilung
I(~k) = |ψ̃(~k)|2 ,
(3.16)
die aufgrund der Parseval’schen Formel für Fouriertransformationen normiert ist:
Z
Z
Z
Z
3
∗
3
∗
3
~
~
~
I(k) d k = ψ̃(k) ψ̃(k) d k = ψ(~x) ψ(~x) d x = I(~x) dV = 1 .
(3.17)
Wir erhalten somit wieder eine Wahrscheinlichkeitsverteilung, und die Erwartungswerte bezüglich dieser Verteilung liefern uns Information zur Verteilung der Wellenzahlvektoren. Insbesondere gilt
Z
Z
3
~
~
~
~
hki = kI(k) d k = ψ(~x)∗ (−i∇)ψ(~
x) d3 x .
(3.18)
Während wir daher aus der Intensitätsverteilung I(~x) keine Information über den
Wellenvektor erhalten, können wir diese aus der Wellenfunktion ψ(~x) gewinnen.
Damit haben wir eine verallgemeinerte Klasse von Erwartungswerten definiert:
Z
~
hF (~x, ∂~x )i = ψ(~x)∗ F (~x, ∂~~x )ψ(~x) d3 x .
(3.19)
Wir werden sehen, dass es sich bei F (~x, ∂~ ) um lineare Operatoren auf dem Raum
der Wellenfunktionen handelt. Diese linearen Operatoren bringen wir später mit beobachtbaren Größen in Verbindung. An dieser Stelle haben wir gesehen, dass wir mit
solchen Operatoren Erwartungswerte für die räumliche Verteilung der Photonen wie
auch für die Verteilung der Wellenzahlvektoren gewinnen können.
3.3
Materiewellen
Im Jahre 1924 veröffentliche der französische Physiker Louis deBroglie seine Theorie
der Materiewellen. Seine Grundannahme bestand darin, dass nicht nur Photonen neben
ihren Welleneigenschaften auch Teilcheneigenschaften haben, sondern dass auch andere materielle Objekte, beispielsweise Elektronen, neben ihren Teilcheneigenschaften
noch Welleneigenschaften zugeschrieben werden können. Im Jahre 1927 beobachteten
Clinton Davisson (1881–1958) und Lester Halbert Germer (1896–1971) zum ersten Mal
die Welleneigenschaften von Elektronen bei Beugungsexperimenten an Kristallgittern.
DeBroglie postulierte für die charakteristischen Größen der Wellen (Wellenlänge
und Frequenz) von Elektronen dieselben Beziehungen zu den typischen Teilcheneigenschaften — Energie und Impuls — wie bei Photonen. Das bedeutet zum einen eine
Zusammenfassung und Ausblick
55
Beziehung zwischen der Energie E des Teilchens und der Frequenz ν (bzw. der Winkelfrequenz ω = 2πν) der zugehörigen Welle von der Form
E = hν = ~ω
(3.20)
(hierbei wurde mit ~ = h/2π das reduzierte Planck’sche Wirkungsquantum eingeführt),
zum anderen eine Beziehung zwischen dem Impuls p des Teilchens und der Wellenlänge
λ der zugehörigen Welle (bzw. dem Wellenvektor ~k, wobei |~k| = 2π/λ und die Richtung
von ~k der Ausbreitungsrichtung der Welle entspricht):
p~ = ~~k
bzw. |~p| =
h
.
λ
(3.21)
Auch diese Beziehung gilt bei Licht, wenn wir berücksichtigen, dass für Licht zwischen
der Energie und dem Impuls die Beziehung E = pc und zwischen Wellenlänge und
Frequenz die Beziehung
ν = c/λ
(3.22)
bestehen.
Da für Elektronen die Beziehung zwischen der Energie E und dem Impuls p
nicht mehr durch E = pc gegeben ist, werden die Materiewellen von Elektronen auch
nicht mehr durch eine Wellengleichung der Form (2.1) beschrieben. Nicht-relativistisch
ist die klassische Beziehung bei Teilchen zwischen dem Impuls und der Energie durch
E=
1 2
1 X 2
p~ =
p ,
2m
2m i i
(3.23)
gegeben. Wenn wir für eine Welle mit Wellenlänge λ und Frequenz ν, allgemein
2πi
x exp (2πiνt)
(3.24)
ψ(~x, t) ' exp
λ
die deBroglie’schen Beziehungen einsetzen,
i
i
ψ(~x, t) ' exp
p~ · ~x exp
Et ,
~
~
(3.25)
und nun die obige Beziehung zwischen Energie und Impuls fordern, erhalten wir die
Bedingung:
∂
~2 X ∂ 2
−i~ ψ(~x, t) = −
ψ(~x, t) .
(3.26)
∂t
2m i ∂x2i
Diese Gleichung bezeichnet man als (freie) Schrödinger-Gleichung.
Auch wenn es so aussieht, als ob wir die Schrödinger-Gleichung abgeleitet haben, sollte man sich darüber im Klaren sein, dass wir die deBroglie’schen Beziehungen
zwischen den Teilchen- und Welleneigenschaften ebenso wie die Gültigkeit der klassischen Beziehung zwischen Energie und Impuls postuliert haben.
56
3.4
Weshalb Quantenmechanik? - Der Doppelspalt
Zusammenfassung und Ausblick
Aufgrund der Überlegungen zu den Polarisationsexperimenten und zum Doppelspalt
können wir Folgendes festhalten:
Wir beschreiben den räumlichen Zustand eines Photons durch ein Feld, dessen
Betragsquadrat die Wahrscheinlichkeit(sdichte) angibt, bei einer Messung das Photon
an dem betreffenden Ort zu finden. Entsprechend beschreiben wir den Polarisati”
ons“-zustand eines Photons durch einen Amplitudenvektor. Sowohl bei dem Feld als
auch bei dem Amplitudenvektor der Polarisation handelt es sich um Vektoren, also
mathematische Objekte, die man addieren und mit Zahlen multiplizieren kann. Die
Addition der Felder haben wir explizit beim Doppelspalt benutzt, um die Gesamtwelle
als Summe von zwei Beiträgen (zu Spalt 1 und Spalt 2) schreiben zu können. Bei den
Amplitudenvektoren haben wir mehrfach benutzt, dass sich diese in Komponenten zerlegen lassen (also als Summe von zwei orthogonalen Komponenten schreiben lassen).
Vektoren können aber auch negative Komponenten haben, und erst diese Eigenschaft
führte zu der Möglichkeit von Interferenzmustern in den Intensitäten.
Zur Beschreibung des räumlichen Zustands von Photonen haben wir Felder
benutzt. Felder bilden einen Vektorraum, allerdings ist dieser Vektorraum unendlich
dimensional. Wir werden zwar an die Felder gewissen Bedingungen stellen müssen,
damit sie sinnvollen Zuständen entsprechen, trotzdem bleibt das Problem, dass wir
es mit einem unendlich dimensionalen Vektorraum zu tun haben. Dieser Aspekt der
Quantenmechanik ist der Grund vieler technischer (mathematischer) Probleme, die
zwar teilweise in diesem Skript angesprochen werden, die aber nicht immer im Detail behandelt werden, da ihre Lösung nur selten zu einem besseren Verständnis der
Quantenmechanik beiträgt.
Die Wirkung von Messungen haben wir durch Matrizen (bei den Polarisationen) bzw. (lineare) Operatoren bei Orts- und Wellenzahlvektormessungen beschreiben
können. Im Spezialfall der Polarisationsfilter handelte es sich dabei um sogenannte
Projektionsmatrizen: symmetrische Matrizen mit der Eigenschaft, dass ihre Quadrate
wieder die Matrix selbst ergeben (also F 2 = F ). Anschaulich bedeutet dies, dass zwei
unmittelbar hintereinander geschaltete Filter mit der gleichen Polarisationsrichtung
dieselbe Wirkung auf den Polarisationszustand eines Photons haben, wie ein einzelner
Filter.
Das bisher Gesagte lässt sich verallgemeinern: Quantenmechanische Zustände
lassen sich durch Vektoren in geeigneten Vektorräumen darstellen, und es lassen sich
Summen von solchen Zuständen bilden, die wiederum Zustände darstellen. Messungen bzw. Beobachtungen an einem System werden durch symmetrische Matrizen repräsentiert, wobei die Projektoren besondere Messungen darstellen, die man als verallgemeinerte Filter auffassen kann: Ein Filter ist dabei ein Messgerät, das nur sol-
Zusammenfassung und Ausblick
57
che quantenmechanische Systeme passieren“ lässt, die bestimmte Eigenschaften ha”
ben. Streng genommen sollte man sagen, dass die quantenmechanischen Systeme, die
den Filter passiert haben, diese bestimmten Eigenschaften besitzen. Ob sie die Eigenschaft schon vorher hatten, bleibt offen. In diesem Sinne ist ein Filter ein System zur
Präparierung quantenmechanischer Systeme mit bestimmten Eigenschaften.
Wir haben bisher sowohl die Amplituden der Photonen, welche die Polarisation beschreiben, als auch die Felder als reell angenommen. Das lässt sich in vielen
Fällen zwar erreichen, für eine vollständige Beschreibung der Zustände eines quantenmechanischen Systems müssen wir aber auch komplexe Werte zulassen. Beispielsweise
lassen sich mit reellen Amplituden nur planar polarisierte Photonen beschreiben. Wir
wissen aber, dass es auch zirkulare Polarisationen gibt. Wollen wir neben den planar
polarisierten Photonen auch zirkular polarisierte Photonen einbeziehen, sind komplexe Amplituden kaum zu vermeiden. Diese komplexen Amplituden beinhalten dabei
nicht nur die Information über die Auslenkungsrichtung, sondern auch die Information über die Phase. Wenn beispielsweise die Auslenkung in y-Richtung im Vergleich
zur Auslenkung in x-Richtung um eine viertel Wellenlänge verschoben ist, erhalten wir
eine zirkular polarisierte Welle. Diese Verschiebung um eine viertel Wellenlänge (die
sich beispielsweise mit λ/4-Plättchen erreichen lässt), wird durch die Multiplikation
der entsprechenden Polarisation mit i“ beschrieben. Wir werden später noch darauf
”
eingehen.
58
Weshalb Quantenmechanik? - Der Doppelspalt
Kapitel 4
Die mathematischen Grundlagen
In diesem Kapitel sollen die mathematischen Grundlagen für den Formalismus der
Quantenmechanik gelegt werden. Wie schon erwähnt, haben wir es dabei mit möglicherweise unendlich dimensionalen Vektorräumen und den linearen Abbildungen auf diesen Räumen zu tun. Viele der technischen Schwierigkeiten im Zusammenhang mit dem
mathematischen Formalismus der Quantenmechanik hängen mit dieser Unendlichkeit
zusammen. Lineare Abbildungen (sogenannte Operatoren) auf solchen Räumen können
unbeschränkt sein, d.h., endliche Vektoren (Vektoren mit einem endlichen Betrag) werden auf unendliche Vektoren abgebildet. Es kann auch passieren, dass das Spektrum
dieser Operatoren (bei endlichen Matrizen sind das die Eigenwerte) kontinuierlich ist.
In diesem Fall besitzen die Operatoren streng genommen keine Eigenwerte und auch
keine Eigenzustände.
Wir werden gelegentlich auf die besonderen Probleme im Zusammenhang mit
unendlich dimensionalen Vektorräumen hinweisen, aber der Schwerpunkt soll nicht auf
diesen technischen Details liegen. Sie tragen nur selten zu einem besseren Verständnis
der Quantenmechanik bei und spielen in erster Linie bei expliziten Berechnungen eine
Rolle. Der Schwerpunkt dieses Quantenmechanik Kurs’ soll auf den Aspekten liegen,
die zu einem besseren Verständnis dieser Theorie führen.
Was man wissen sollte
Konzept des komplexen Vektorraums; hermitesches Skalarprodukt; Hilberträume; die
Norm von Vektoren; dualer Vektorraum; lineare Abbildungen, Operatoren und Matrizen; einige Besonderheiten für unendlichdimensionale Hilberträume (mögliche Unbeschränktheit von Operatoren und Abgeschlossenheit des Hilbertraums). Eigenvektoren und Eigenwerte. Speziell selbstadjungierte Operatoren, Projektionsmatrizen und
unitäre Operatoren. Der Funktionenraum der quadratintegrablen Funktionen; die linearen Operatoren Multiplikation mit x“ und Ableitung nach x“ und ihre Kommu”
”
59
60
Mathematische Grundlagen
tatorbeziehungen. Die Bra-Ket-Notation für Vektoren und Matrizen bzw. Operatoren.
4.1
Vektorräume und physikalische Zustände
Wie wir sehen werden (und im Zusammenhang mit den einleitenden Bemerkungen zum
Doppelspalt und zu den Polarisationsexperimenten schon andeutungsweise gesehen
haben), lässt sich der Zustand eines quantenmechanischen Systems durch bestimmte
Vektoren bzw. Klassen von Vektoren in einem Vektorraum ausdrücken. Auf diesem
Vektorraum muss ein Skalarprodukt definiert sein, wodurch der Vektorraum (unter
bestimmten Bedingungen) zu einem Hilbertraum wird. Wir behandeln zunächst das
Konzept des Hilbertraums, führen eine in der Quantenmechanik häufig verwendete
Notation ein (die Bra-Ket-Notation von Dirac) und formulieren gleich das erste Axiom
der Quantenmechanik zur Darstellung von Zuständen.
4.1.1
Hilberträume
Etwas lax ausgedrückt ist ein Hilbertraum ein komplexer Vektorraum mit einem Skalarprodukt. Für manche Autoren sind Hilberträume immer abzählbar unendlich dimensional. In diesem Fall kann man aber zeigen, dass alle Hilberträume (als komplexe
Vektorräume mit hermiteschem Skalarprodukt) isomorph sind, d.h., es gibt eigentlich
nur einen Hilbertraum und die Verwendung des Plurals im Abschnittstitel ist unsinnig.
Wir werden auch endlich dimensionale komplexe Vektorräume mit einem (hermiteschen) Skalarprodukt als Hilbertraum bezeichnen. In diesem Fall sind zwei Vektorräume nur dann isomorph, wenn sie dieselbe Dimension haben.
Definition: Ein komplexer Vektorraum ist eine Menge H, auf der zwei Verknüpfungen
+ : H × H −→ H
(4.1)
· : C × H −→ H
(4.2)
definiert sind, sodass folgenden Bedingungen gelten:
∀x, y ∈ H gilt
∀x, y, z ∈ H gilt
∃0 ∈ H sodass ∀x ∈ H
∀x ∈ H ∃(−x) ∈ H sodass
x+y =y+x
(Kommutativität) (4.3)
x + (y + z) = (x + y) + z (Assoziativität)
(4.4)
x+0=0+x=x
(4.5)
(Nullvektor)
x + (−x) = (−x) + x = 0
(4.6)
(Existenz eines Inversen)
∀x ∈ H und ∀α, β ∈ C gilt
α · (β · x) = (αβ) · x
(4.7)
(Assoziativität der Multiplikation)
∀x, y ∈ H und ∀α ∈ C gilt
α · (x + y) = α · x + α · y (Distributivgesetz) (4.8)
Vektorräume und physikalische Zustände
61
Bezüglich der Addition von Vektoren handelt es sich somit um eine abelsche (d.h.
kommutative) Gruppe. Den Punkt für die Multiplikation mit den komplexen Zahlen
werden wir im Folgenden weglassen und statt α · x einfach αx schreiben.
Definition: Ein Satz von Vektoren {xi }i=1,...,n , (xi ∈ H, xi 6= 0) heißt linear unabhängig, wenn aus der Beziehung
n
X
αi xi = 0 folgt : αi = 0 ∀i .
(4.9)
i=1
Die maximale Zahl n, für die linear unabhängige Vektoren existieren, bezeichnet man
als die Dimension des Vektorraums. Für einen Vektorraum der Dimension d bilden d
linear unabhängige Vektoren eine Basis. Jeder Vektor lässt sich als Linearkombination
dieser Basis schreiben.
Definition: Ein (nicht-entartetes, positiv-definites) hermitesches Skalarprodukt (manchmal spricht man auch von einem unitären Skalarprodukt) ist eine Abbildung
(·, ·) : H × H −→ C ,
(4.10)
(x, y) = (y, x)∗
(4.11)
(x, αy + βz) = α(x, y) + β(x, z)
(4.12)
(x, x) ≥ 0 , und (x, x) = 0 ⇔ x = 0 .
(4.13)
für die gilt:
∀x, y ∈ H
∀x, y, z ∈ H und ∀α, β ∈ C
∀x ∈ H
Das Skalarprodukt ist also linear im zweiten Argument. Für das erste Argument folgt
aus der ersten Bedingung:
(αx + βy, z) = α∗ (x, z) + β ∗ (y, z) .
(4.14)
Später werden wir eine besondere Notation für Vektoren und das Skalarprodukt einführen (die sogenannte Bra-Ket-Notation von Dirac), die sich gerade für die Quantentheorie als sehr hilfreich erwiesen hat.
Das Skalarprodukt definiert eine Norm auf dem Vektorraum:
kxk2 = (x, x) .
(4.15)
Mit dieser Norm können wir
– die Länge bzw. den Betrag eines Vektors bestimmen,
– definieren, wann zwei Vektoren orthogonal sind (nämlich wenn (x, y) = 0 für
x, y 6= 0). Damit können wir auch eine Orthonormalbasis {ei } definieren, die den
Bedingungen (ei , ej ) = δij (Kronecker-Delta) genügt.
62
Mathematische Grundlagen
– den Abstand von zwei Vektoren angeben: Dist(x, y) = kx − yk,
– auf dem Vektorraum eine Topologie definieren (also sagen, was offene Teilmengen
sind).
Wir können nun die Definition eines Hilbertraums angeben:
Definition: Ein Hilbertraum ist ein Vektorraum mit einem (positiv definiten, nicht
entarteten) Skalarprodukt, der bezüglich der induzierten Topologie vollständig ist.
( Vollständig“ heisst, dass der Grenzwert jeder konvergenten Cauchy-Folge von Vek”
toren auch in diesem Raum liegt.)
Ein Hilbertraum kann also unendlich dimensional sein und die Forderung der
Vollständigkeit wäre für endlich dimensionale Hilberträume über den reellen oder komplexen Zahlen nicht notwendig, da der Körper bereits vollständig ist. Um der Unendlichkeit zumindest eine gewisse Grenze zu setzen, definieren wir den separablen Hilbertraum:
Definition: Ein separabler Hilbertraum ist ein Hilbertraum mit einer abzählbaren Basis.
In der Quantenmechanik interessieren uns nur endlich dimensionale Hilberträume (bei denen wir uns um die Vollständigkeit oder die Separabilität nicht zu
kümmern brauchen) oder separable Hilberträume. Ein separabler Hilbertraum hat die
Eigenschaft, dass es Basen gibt, bei denen man die Basisvektoren durchnummerieren
kann (e1 , e2 , ...). Bezüglich einer solchen Basis kann man oftmals wie mit gewöhnlichen
Vektoren oder Matrizen rechnen.
Beispiele
– Die Menge aller n-Tupel komplexer Zahlen {(x1 , ..., xn )|xi ∈ C} bildet einen
n-dimensionalen komplexen Vektorraum. Die Addition von Vektoren und die
Multiplikation mit einer komplexen Zahl sind komponentenweise definiert:
(x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn )
α(x1 , ..., xn ) = (αx1 , ..., αxn ) .
(4.16)
(4.17)
Der Nullvektor ist (0, 0, ..., 0), und für das Skalarprodukt gilt:
(x, y) =
n
X
x∗i yi .
(4.18)
i=1
Die n Vektoren
ei = (0, ..., 1, ..., 0) (1 an i-ter Stelle)
bilden eine Orthonormalbasis.
(4.19)
Vektorräume und physikalische Zustände
63
– Die Menge aller abzählbar unendlichen, quadratsummierbaren Folgen von komplexen Zahlen {(x1 , x2 , x3 , ...)|xi ∈ C}, für die also gilt
∞
X
|xi |2 < ∞ ,
(4.20)
i=1
bildet ebenfalls einen Hilbertraum mit dem Skalarprodukt:
(x, y) =
∞
X
x∗i yi .
(4.21)
i=1
Die Vektoren
ei = (0, ..., 0, 1, 0, ...)
(1 an i-ter Stelle)
(4.22)
bilden wieder eine Orthonormalbasis.
– Ebenfalls einen wichtigen Hilbertraum bildet die Menge der quadratintegrablen
Funktionen L2 (R, dx) (kurz L2 ) über den reellen Zahlen. Eine Funktion f : R →
C heißt dabei quadratintegrabel, wenn
Z +∞
|f (x)|2 dx < ∞ .
(4.23)
−∞
Das Skalarprodukt ist definiert als:
Z
(f, g) =
+∞
f (x)∗ g(x) dx .
(4.24)
−∞
Es gibt sehr viele Sätze von Basisfunktionen, die den Raum der quadratintegrablen Funktionen aufspannen, und ein oder zwei davon werden wir bei konkreten
Beispielen kennenlernen. Eine Basis für die quadratintegrablen Funktionen wären
z.B. die Funktionen
ek (x) = xk e−x
2
(k = 0, 1, 2, ...) ,
(4.25)
allerdings handelt es sich hierbei nicht um eine orthogonale Basis oder gar um
normierte Basisfunktionen.
Diese drei Typen von Hilberträumen spielen in der Physik eine wichtige Rolle.
Man könnte zunächst meinen, der Nullvektor im Raum der quadratintegrablen Funktionen
sei die Null-Funktion, die also jedem x ∈ R den Wert 0 zuordnet. Das ist nicht ganz richtig, denn
für jede Funktion, die nur an endlich vielen Stellen von 0 verschieden ist, gilt, dass das Integral über
ihr Absolutquadrat verschwindet. Streng genommen sind daher nicht Funktionen die Elemente dieses
Hilbertraums, sondern Äquivalenzklassen von Funktionen. Auf diese Feinheiten werden wir aber im
Folgenden nicht weiter eingehen.
Anmerkungen:
64
Mathematische Grundlagen
1. Achtung (!) — ein Wort zur Notation: In der Physik unterscheidet man in der
Schreibweise oft nicht zwischen einer Funktion f und dem Wert dieser Funktion
an einer Stelle x, also f (x). Ich werde versuchen, diese Unterscheidung zumindest
in den mathematischen Teilen beizubehalten. In den physikalischen Anwendungen wird man oft von einer Funktion f (x) oder einem Feld ϕ(x) etc. sprechen.
Wichtig ist weniger die konsequente Beibehaltung der Notation, als dass man
sich des Unterschieds bewusst ist: Eine Funktion ist eine Zuordnung, die jedem
Wert einer Urbildmenge einen Bildwert zuordnet. Sie ist im Allgemeinen ein
Element eines hochdimensionalen (meist unendlich dimensionalen) Vektorraums.
Ein Funktionswert ist der Wert dieser Funktion an einem ganz bestimmten Urbildpunkt (also meist eine reelle oder komplexe Zahl).
2. Jeder Vektorraum besitzt auch einen Dualraum, das ist der Raum der linearen
Abbildungen von dem Vektorraum in den Körper des Vektorraums, in unserem
Fall also in die komplexen (oder manchmal auch reellen) Zahlen.
Für endlich dimensionale Vektorräume kann man leicht zeigen, dass der Dualraum dieselbe Dimension wie der Vektorraum selbst hat, und daher isomorph zu
dem ursprünglichen Vektorraum ist. Dies gilt für unendliche Vektorräume nicht
mehr. Der Dualraum des L2 beispielsweise ist wesentlich größer als der L2 selbst.
Wie auch im endlichen Fall definiert das Skalarprodukt eine Abbildung vom
Vektorraum in den Dualraum, d.h., wir erhalten zu jedem Element des Vektorraums ein Element aus dem Dualraum. Dem Element x des Vektorraums wird
die Abbildung (x, ·) als Element des Dualraums zugeordnet.
3. Ein orthogonaler Satz von normierten Basisvektoren {ei } — also eine Orthonormalbasis — definiert einen besonderen Satz von Elementen des Dualraums:
{(ei , ·)}. Diese Abbildungen ordnen einem Element y des Vektorraums seine
Komponenten zu: yi = (ei , y).
Handelt es sich bei der Basis nicht um eine Orthonormalbasis, können wir zwar
einen Satz dualer Abbildungen {(fj , ·)} über die Bedingungen (fj , ei ) = δij definieren, welche ein Element y auf seine Komponenten yi abbilden, aber bei diesen
dualen Elementen handelt es sich nicht um die Abbildungen {(ei , ·)}.
4.1.2
Die Bra-Ket-Notation
In seinem berühmten Lehrbuch The Principles of Quantum Mechanics“ [22] von 1930
”
führt Paul Dirac eine Notation für Vektoren (duale Vektoren, Skalarprodukt, Operatoren etc.) ein, die sich in der Quantenmechanik als sehr sinnvoll und hilfreich erwiesen
hat, und die daher in den meisten Büchern zur Quantenmechanik verwendet wird.
Vektorräume und physikalische Zustände
65
In dieser Notation wird ein Vektor des Hilbertraums durch einen ket-Vektor |·i gekennzeichnet, und ein dualer Vektor durch einen bra-Vektor h·|. Die Bezeichnungen
bra“ und ket“ stammen von Dirac und sind ein Wortspiel mit dem englischen Aus”
”
druck bracket“ für Klammer. Das Symbol, welches den Punkt ·“ in einem bra oder
”
”
ket-Vektor ersetzt, drückt aus, um welchen Vektor es sich handelt.
Statt also zu schreiben x ∈ H, schreiben wir in Zukunft |xi ∈ H. Und für
den dualen Vektor (x, ·) schreiben wir in Zukunft hx|. Das Skalarprodukt von zwei
Vektoren — bisher durch (x, y) ausgedrückt — schreiben wir nun als hx|yi. Für eine
allgemeine Linearkombination zweier Vektoren |xi und |yi schreibt man α|xi + β|yi.
Die Relationen, durch welche wir das hermitesche Skalarprodukt definiert haben, werden in der Bra-Ket-Notation folgendermaßen geschrieben:
∀|xi, |yi ∈ H
∀|xi, |yi, |zi ∈ H und ∀α, β ∈ C
∀|xi ∈ H
hx|yi = hy|xi∗
(4.26)
hx| α|yi + β|zi = αhx|yi + βhx|zi
(4.27)
hx|xi ≥ 0 , und hx|xi = 0 ⇒ |xi = 0 .(4.28)
(Für den Nullvektor schreibt man meist einfach 0 und nicht |0i. Dieser letztere Ausdruck |0i wird oftmals für den Zustand minimaler Energie in der Quantenmechanik
verwendet, den sogenannten Grundzustand — in der Quantenfeldtheorie spricht man
auch vom Vakuumzustand — der durch einen nicht-verschwindenden normierten Vektor beschrieben wird.)
Seien beispielsweise der (unendliche) Folgen-Vektor
|xi = (x1 , x2 , x3 , ...)
(4.29)
und ein Basisvektor
|ei i = (0, ..., 0, 1, 0, ...)
(1 an i-ter Stelle)
(4.30)
gegeben, dann erhalten wir für die i-te Komponente des Vektors:
hei |xi = xi .
(4.31)
Die Argumente, durch die man einen Vektor in der Quantenmechanik kennzeichnet, und die man in den bra- oder ket-Vektor schreibt, sind meist die Eigenschaften
(oft ausgedrückt durch Quantenzahlen), von denen bekannt ist, dass sie dem Quantensystem (z.B. dem Teilchen) wirklich zukommen. Ein Photon beispielsweise, das durch
einen vertikalen Filter getreten ist und von dem bekannt ist, dass es (im Sinne von Kapitel 2.2) die Eigenschaft v besitzt, könnte durch folgende ket-Vektoren gekennzeichnet
sein:
|γ, vi , |Photon, vertikal polarisierti , |0◦ i , | l i , . . .
(4.32)
66
Mathematische Grundlagen
Ansonsten ist die explizite mathematische Darstellung dieser Vektoren ähnlich wie in
Abschnitt 2.3.
Bisher scheint die Bra-Ket-Notation noch keine besonderen Vorteile zu bringen,
abgesehen vielleicht von der spiegelbildlichen Symmetrie zwischen Vektor und dualem
Vektor, die in der Notation deutlich wird, und die Kombination dieser Vektoren im
Skalarprodukt zu einer komplexen Zahl. Die Vorteile werden später deutlich.
4.2
Lineare Abbildungen – Operatoren
Im einleitenden Kapitel hatten wir im Zusammenhang mit den Polarisationsexperimenten gesehen, dass wir die Wirkung von Polarisationsfiltern auf den Polarisationszustand von Licht durch (zweidimensionale) Matrizen beschreiben können. Wir hatten
damals schon angedeutet, dass dies ein Spezialfall ist, und dass die linearen Abbildungen auf dem Hilbertraum eine besondere Rolle spielen. Daher wollen wir in diesem
Kapitel einige Bemerkungen zu linearen Abbildungen machen. Spezielle Details folgen im Zusammenhang mit konkreten Anwendungen. Bei endlich dimensionalen Vektorräumen sprechen wir meist von linearen Abbildungen“, bei unendlich dimensio”
nalen Vektorräumen von linearen Operatoren“, wobei es sich auch hier um lineare
”
Abbildungen handelt. Dieser Begriff ist somit der Überbegriff. Ansonsten werden die
Bezeichnungen lineare Abbildungen, Matrizen, (lineare) Operatoren oft in gleicher Bedeutung verwendet.
Die folgenden drei Arten von linearen Abbildungen spielen für die Physik eine besondere Rolle: Projektionsoperatoren, selbstadjungierte Operatoren und unitäre
Operatoren, die wir der Reihe nach behandeln werden. Eine weitere Klasse von Operatoren, so genannte Dichtematrizen, werden in Kapitel 5.9 behandelt.
4.2.1
Allgemeine Eigenschaften linearer Operatoren
Eine Abbildung von einem Vektorraum V in einen Vektorraum W heißt linear, wenn
für alle |xi, |yi ∈ V und alle α, β ∈ C (oder R bei reellen Vektorräumen) folgende
Bedingung erfüllt ist:
A α|xi + β|yi = α A|xi + β A|yi .
(4.33)
Hierbei soll A|xi das Bild von |xi unter der Abbildung A darstellen. In seltenen Fällen
schreibt man auch |Axi für A|xi. Im Folgenden werden wir nahezu ausschließlich
Abbildungen auf endlich dimensionalen oder aber separablen Hilberträumen H in sich
selbst betrachten, sodass das Bild von A wieder in H liegt. Außerdem werden wir
— wie bei Hilberträumen üblich — annehmen, dass ein (positives, nicht entartetes)
Skalarprodukt erklärt ist.
Lineare Abbildungen – Operatoren
67
Matrixdarstellung linearer Operatoren
Eine lineare Abbildung liegt bereits eindeutig fest, wenn ihre Wirkung auf einer Basis
bekannt ist. Bezüglich einer abzählbaren Basis {|ei i} kann man die lineare Abbildung
auch durch ihre Matrixelemente kennzeichnen:
aij = hei |A|ej i .
(4.34)
Bei linearen Abbildungen auf endlich dimensionalen Räumen schreibt man eine lineare
Abbildung meist als Matrix:


a11 a12 · · · a1n


 a21 a22 · · · a2n 


A= .
(4.35)
.
.
.
.
.
.
.
.
 .
.
.
. 


an1 an2 · · · ann
In Bezug auf eine abzählbare Basis ist das auch bei unendlich dimensionalen Hilberträumen möglich:


a11 a12 a13 · · ·


 a21 a22 a23 · · · 


(4.36)
A=
.
 a31 a32 a33 · · · 


..
..
.. . .
.
.
.
.
Wir haben zwar betont, dass wir bestenfalls separable Hilberträume zulassen, und dass separable Hilberträume immer eine abzählbare Basis haben, aber das bedeutet nicht, dass die Operatoren immer bezüglich dieser separablen Basis ausgedrückt werden müssen. Beispielsweise ist der
∂
Ableitungsoperator ∂x
ein linearer Operator auf dem separablen Hilbertraum der quadratintegrablen
Funktionen.
Der adjungierte Operator
Da wir ein Skalarprodukt gegeben haben, können wir zu jedem Operator A auch einen
adjungierten Operator A† definieren:
∀|xi, |yi ∈ H soll gelten hA† y|xi = hx|A† |yi∗ = hy|A|xi .
(4.37)
Schreiben wir die Operatoren als Matrizen bezüglich einer orthonormalen Basis, so
erhalten wir den adjungierten Operator, indem wir die Matrix transponieren (Zeilen
und Spalten vertauschen) und die Matrixelemente komplex konjugieren. Man spricht
in diesem Fall auch schon mal von einer hermitesch konjugierten Matrix. Sie ist das
komplexe Analogon zur transponierten Matrix bei reellen Matrizen.
68
Mathematische Grundlagen
Das Adjungierte eines Produkts von Operatoren ist das umgekehrte Produkt der
adjungierten Operatoren, wie man sich leicht anhand der Definition des adjungierten
Operators überlegt:
(AB)† = B † A† .
(4.38)
Handelt es sich bei der Basis, bezüglich der die Matrixelemente ausgedrückt wurden, nicht
um eine Orthonormalbasis, wird die Beziehung zwischen den Matrixelementen von A und A† komplizierter: Sei beispielsweise eine Basis gegeben, für die hei |ej i = gij und seien |xi und |yi zwei Vektoren
mit der Entwicklung
X
X
|xi =
xi |ei i , |yi =
yi |ei i ,
(4.39)
i
i
†
und seien aij die Matrixelemente von A und (a )ij die Matrixelemente von A† , so gilt:
X
X
∗
hy|A|xi =
yi∗ gij akj xk und hx|A† |yi∗ =
xk gkj
(a† )∗ij yi
i,j,k
(4.40)
i,j,k
Wenn diese Beziehung für alle Vektoren |xi und |yi gelten soll, folgt:
X
X
∗
gij akj =
(a† )∗ij gkj
.
j
(4.41)
j
Nur für eine Orthonormalbasis mit gij = δij erhalten wir: aki = (a† )∗ik bzw. (a† )ik = a∗ki .
Der bezüglich des Skalarprodukts duale Vektor zu A|xi ist durch hAx| = hx|A† gegeben.
Eigenwerte und Eigenvektoren
Gibt es einen Vektor |xi ∈ H und eine (komplexe) Zahl λ, sodass
A|xi = λ|xi ,
(4.42)
so bezeichnet man λ als einen Eigenwert von A und |xi als den zugehörigen Eigenvektor
(für den man dann oft zur Kennzeichnung dieser Eigenschaft |λi schreibt). Gibt es
mehrere linear unabhängige Vektoren |x1 i, ..., |xn i ∈ H, die alle Eigenvektoren zum
selben Eigenwert λ sind (also A|xi i = λ|xi i), so bezeichnet man λ als entartet und n
als den Entartungsgrad von λ.
Die Norm von Operatoren
Schließlich definieren wir für Operatoren noch eine Norm, mit der wir für die Menge
der Operatoren eine Topologie erhalten. Im Allgemeinen unterscheidet man sogar zwei
verschiedene Definitionen für die Norm, und bezeichnet die entsprechenden Topologien
als starke bzw. schwache Topologie. Die starke Topologie folgt aus der Definition für
die Operatornorm:
p
p
hx|A† A|xi
kA|xik
= sup|xi p
= sup{|xi|hx|xi=1} hx|A† A|xi . (4.43)
kAkS = sup|xi
k|xik
hx|xi
Lineare Abbildungen – Operatoren
69
Die schwache (weak) Topologie ergibt sich aus der Operatornorm:
kAkW = supk|xik=k|yik=1 |hy|A|xi|
(4.44)
Bei endlich dimensionalen Hilberträumen definieren beide Normen dieselbe Topologie
auf der Menge der Matrizen. Dies ist bei unendlich dimensionalen Hilberträumen nicht
mehr der Fall.
Ein Operator dessen (starke) Norm endlich ist, heißt beschränkt, andernfalls
heißt er unbeschränkt. In endlich dimensionalen Vektorräumen sind alle linearen Abbildungen beschränkt.
Oft werden wir Funktionen von Operatoren betrachten. Daher müssen wir uns
überlegen, wie man die Funktion eines Operators definieren kann. Für endliche PolyP
nome f (x) = k ak xk kann man offenbar die Funktion eines Operators A definieren
als
X
ak Ak .
(4.45)
f (A) =
k
Diese Definition lässt sich auch auf unendliche Summen ausdehnen, sofern die Norm des
Operators kleiner ist als der Konvergenzradius der Summe. Wir werden später (Kap.
4.2.4) noch eine andere Methode kennenlernen, wie man die Funktion zumindest einer
großen Klasse von Operatoren definieren kann.
Die Menge der linearen Operatoren auf einem Hilbertraum bildet offensichtlich selbst einen
Vektorraum: man kann Operatoren addieren (bei Matrizen ist das die komponentenweise Addition
der Matrixelemente) und mit komplexen Zahlen multiplizieren (ebenfalls komponentenweise). Das
Nullelement ist der 0-Operator (der alles auf die Null abbildet, bzw. die Matrix, die nur Nulleinträge
hat), und der bezüglich der Addition inverse Operator ist einfach das Negative des Operators.
Die Menge der beschränkten Operatoren kann man zu einem topologischen Vektorraum machen und durch Vervollständigung bezüglich der definierten Norm zu einem Banachraum.
Der Kommutator von Operatoren
Wir wissen, dass das Produkt von Matrizen im Allgemeinen von der Reihenfolge der
Matrizen abhängt, d.h. AB 6= BA. In diesem Sinne handelt es sich bei dem Produkt von Matrizen um ein nicht kommutatives Produkt. Dies gilt natürlich auch für
Operatoren in einem Hilbertraum. In der Quantenmechanik spielt die Frage, ob zwei
Operatoren miteinander kommutieren oder nicht, eine wichtige Rolle. Daher definiert
man gewöhnlich den Kommutator von zwei Operatoren als die Differenz zwischen den
beiden Produkten und somit als ein Maß für die Nicht-Kommutativität von Operatoren:
[A, B] := AB − BA .
(4.46)
Wir wollen ein paar formale Eigenschaften des Kommutators zusammenfassen, die für
beliebige lineare Operatoren A, B, C gelten:
70
Mathematische Grundlagen
1. Der Kommutator ist ein anti-symmetrisches Produkt:
[A, B] = −[B, A] .
(4.47)
2. Der Kommutator ist ein bilineares Produkt:
[A, αB + βC] = α[A, B] + β[A, C]
(α, β ∈ C) .
(4.48)
3. Der Kommutator erfüllt die Jacobi-Identiät:
[[A, B], C] + [[B, C], A] + [[C, A], B] = 0 .
(4.49)
4. Der Kommutator ist eine Derivation, d.h.
[A, BC] = [A, B]C + B[A, C] .
4.2.2
(4.50)
Besonderheiten in unendlich dimensionalen
Hilberträumen
In unendlich dimensionalen (separablen) Hilberträumen gibt es einige Besonderheiten, von denen an dieser Stelle zumindest einige angesprochen werden sollen. Eine
ausführliche Diskussion findet man in Büchern zur Funktionalanalysis.
Unbeschränkte Operatoren
Es kann passieren, dass ein Operator in einem unendlich dimensionalen Hilbertraum
zwar wohl-definiert ist, dass das Ergebnis der Operation dieses Operators aber nicht
mehr in dem Hilbertraum liegt. In solchen Fällen spricht man von unbeschränkten
Operatoren. Der Grund dafür liegt oft darin, dass viele unendlich dimensionale Hilberträume in größere Vektorräume eingebettet sind, und die Abbildung aus dem Unterraum, welcher dem Hilbertraum entspricht, hinausführt.
Betrachten wir dazu zwei Beispiele:
1. Wir hatten in Abschnitt 4.1.1 den Raum der quadratsummierbaren Folgen {(x1 , x2 , ...)}
P
mit i |xi |2 < ∞ definiert. Eine solche Folge wäre beispielsweise
1
1 1
(4.51)
|harmi = 1, , , ..., , ... ,
2 3
n
denn es gilt:
∞
X
1
π2
hharm|harmi =
=
ζ(2)
=
< ∞.
2
n
6
n=0
(4.52)
Lineare Abbildungen – Operatoren
71
Eine besondere lineare Abbildung (nennen wir sie einfach N ) wäre die Diagonalmatrix mit der Zahl n in der n-ten Zeile und n-ten Spalte:


1 0 0 ···


 0 2 0 ··· 


N =
(4.53)
 oder hen |N |em i = n δnm .
 0 0 3 ··· 


.. .. .. . .
.
. . .
Die Wirkung dieser linearen Abbildung besteht darin, das n-te Element eines
Vektors mit n zu multiplizieren:
N (x1 , x2 , x3 , ...) = (1 x1 , 2 x2 , 3 x3 , ...) .
Für den Vektor |harmi hat das aber zur Folge, dass
1 1
1
N 1, , , ..., , ... = (1, 1, 1, ...)
2 3
n
(4.54)
(4.55)
und dieser Vektor ist nicht mehr quadratsummierbar und somit nicht Teil des
Hilbertraums.
2. Ein ganz ähnliches Beispiel erhalten wir, wenn wir als Hilbertraum den Raum
der quadratintegrablen Funktionen L2 über den reellen Zahlen wählen und als
linearen Operator einfach die Multiplikation einer Funktion mit x. Diese Multiplikation ist offensichtlich als Operation auf einem Funktionenraum linear, denn
es gilt:
x(αf (x) + βg(x)) = α xf (x) + β xg(x) .
(4.56)
Als Beispiel einer quadratintegrablen Funktion wählen wir
f (x) =
1
,
x + ia
so dass
|f (x)|2 =
und somit
Z
+∞
x2
(4.57)
1
+ a2
(4.58)
+∞
1
x π
= .
|f (x)| dx = arctan a
a −∞ a
2
−∞
(4.59)
Diese Funktion ist also Teil des Hilbertraums. Anwendung des Operators Mul”
tiplikation mit x“ führt jedoch auf:
xf (x) =
x
,
x + ia
und somit |xf (x)|2 =
x2
.
x 2 + a2
Diese Funktion ist offensichtlich nicht mehr quadratintegrabel.
(4.60)
72
Mathematische Grundlagen
In beiden Fällen führt also ein vergleichsweise harmloser“ linearer Operator aus dem
”
Hilbertraum heraus.
Nach unserer Defintion für lineare Abbildungen im letzten Abschnitt gehören
streng genommen beide Abbildungen nicht zu den linearen Operatoren auf den jeweiligen Hilberträumen, denn eine Minimalvoraussetzung für eine Abbildung ist, dass
sie jedem Element des Urbildraums ein Element des Bildraums zuordnet, was aber
in den Beispielen nicht erfüllt ist. Obwohl die Bilder eine wohldefinierte Folge bzw.
eine wohldefinierte Funktion waren, gehörten sie nicht mehr zum Hilbertraum der
quadratintegrablen Folgen bzw. Funktionen.
Da gerade der Multiplikationsoperator mit x ebenso wie viele weitere unbeschränkte Operatoren in der Physik eine große Bedeutung haben, werden sie gewöhnlich
nicht von der Menge der linearen Operatoren ausgeschlossen. Der mathematische Weg,
um die auftretenden Probleme zu umgehen, besteht darin, diese Operatoren nicht auf
dem gesamten Hilbertraum zu definieren, sondern nur auf dem Teilraum D, auf dem
die Bilder wieder im (gesamten) Hilbertraum liegen. Diesen Teilraum bezeichnet man
als den Definitionsbereich der Operatoren.
Viele wichtige Beziehungen für lineare Operatoren (unter anderem auch die
besonders wichtigen kanonischen Vertauschungsrelationen“) gelten nur auf den je”
weiligen Definitionsbereichen der betrachteten Operatoren. Das wird allerdings nicht
immer explizit erwähnt.
Kontinuierliches Spektrum
Wir haben im letzten Abschnitt den Begriff des Eigenwerts definiert. Eigenwerte spielen in der Quantenphysik eine besondere Rolle. Für endliche Matrizen sind die Eigenwerte diskret. Sie können zwar entartet sein, aber letztendlich bleibt die Menge der
Eigenwerte eine diskrete Punktmenge.
In einem unendlich dimensionalen Vektorraum, und hier sind es inbesondere
wieder die Funktionenräume, wie beispielsweise der L2 , kann es passieren, dass zwar
eine Gleichung der Form
A|xi = λ|xi
(4.61)
erfüllt werden kann, dass aber |xi nicht in dem Hilbertraum liegt, den man betrachtet.
Betrachten wir als Beispiel diesmal den Operator der zweiten Ableitung, der
ebenfalls eine wichtige Rolle in der Physik spielt. Man findet leicht die Funktionen,
welche die Gleichung
d2
f (x) = λf (x)
(4.62)
dx2
erfüllen. Wir kennen diese Gleichung vom klassischen harmonischen Oszillator (dort
Lineare Abbildungen – Operatoren
73
ist x die Zeit t). Lösungen sind (bis auf einen Faktor)
f (x) = sin(px) und f (x) = cos(px)
f (x) = 1 und f (x) = x
±αx
und f (x) = e
für λ = −p2 negativ
(4.63)
für λ = 0
(4.64)
für λ = α
2
positiv .
(4.65)
Eine kurze Überlegung zeigt, dass keine dieser Funktionen quadratintegrabel ist. Selbst
die trigonometrischen Funktionen, die sich für große Argumente x noch am besten
verhalten, lassen sich nicht über die gesamte reelle Achse im Quadrat integrieren.
Das bedeutet, der zweite Ableitungsoperator besitzt keine Eigenvektoren im
Hilbertraum der quadratintegrablen Funktionen, und damit streng genommen auch
keine Eigenwerte. Es stellt sich aber häufig heraus, dass man manche Eigenvektoren
(in obigem Fall die Winkelfunktionen zu den negativen Eigenwerten sowie die konstante Funktion f (x) = 1) beliebig genau innerhalb des Hilbertraums approximieren kann,
d.h., man gelangt mit quadratintegrablen Funktionen beliebig genau an die Eigenvektoren heran, ohne sie allerdings (innerhalb des Hilbertraums) erreichen zu können.
(Die Sprechweise beliebig genau“ müsste über geeignete Konvergenzkriterien definiert
”
werden, aber wir wollen es nicht übertreiben.)
In solchen Fällen, wo die Eigenvektoren eigentlich nicht Teil des Hilbertraums
sind, aber dort beliebig genau approximiert werden können, spricht man nicht von
Eigenwerten sondern vom Spektrum eines Operators. Die Menge der nicht positiven
reellen Zahlen wäre somit das Spektrum des Operators der zweiten Ableitungen.
Um den Begriff des Spektrums exakter definieren zu können, überlegen wir uns
zunächst, dass die Eigenwertgleichung Gl. 4.42
(A − λ1)|xi = 0
(4.66)
impliziert, dass der Operator (A−λ1) nicht invertiert werden kann. Diese Beobachtung
kann man für Operatoren in einem unendlich dimensionalen Hilbertraum verallgemeinern:
Definition: Das Spektrum eines Operators A besteht aus allen komplexen Zahlen λ, für
die der Operator (A − λ1)−1 ein unbeschränkter Operator ist.
Selbst wenn der Eigenvektor nicht Teil des Hilbertraums ist, in diesem aber
beliebig genau angenähert werden kann, wird der obige Operator für solche Werte von
λ unbeschränkt.
Im Allgemeinen hat die Frage, ob ein Operator ein Spektrum aber keine Eigenwerte besitzt, nichts damit zu tun, ob dieser Operator unbeschränkt ist oder nicht. Es
gibt unbeschränkte Operatoren mit diskreten Eigenwerten (beispielsweise der Operator N in Gl. 4.53), und es gibt beschränkte Operatoren, die allerdings keine Eigenwerte
besitzen sondern nur ein Spektrum. Man kann allerdings beweisen, dass die diskreten
74
Mathematische Grundlagen
Teile des Spektrums eines Operators auch gleichzeitig Eigenwerte sind, wohingegen ein
kontinuierlicher Teil des Spektrums keine Eigenvektoren im Hilbertraum besitzt.
Spurklasseoperatoren
Auch für Operatoren in einem unendlich dimensionalen Hilbertraum kann man eine
Spur definieren.
Definition: Sei |ei i eine (der Einfachheit halber orthonormale) Basis, so ist
X
Sp A =
hei |A|ei i
(4.67)
i
die Spur des Operators A. Falls die Spur existiert, hängt sie nicht von der gewählten
Orthonormalbasis ab. Operatoren, für welche die Spur endlich ist, bezeichnet man als
Spurklasseoperatoren.
In unendlich dimensionalen Hilberträumen muss die Spur eines linearen Operators nicht notwendigerweise existieren. Für unbeschränkte Operatoren existiert sie nie.
Als Beispiel betrachte man nur den Operator N (Gl. 4.53) zu Beginn dieses Kapitels.
Aber auch für beschränkte Operatoren existiert die Spur nicht immer. Ein Beispiel
ist der Identitätsoperator, dessen Spur gewöhnlich gleich der Dimension des jeweiligen
Vektorraums ist.
Wenn Operatoren keine Spurklasseoperatoren sind, erhält man meist unsinnige Ergebnisse,
wenn man trotzdem die Spur berechnet. Ein klassisches Beispiel sind die kanonischen Vertauschungsrelationen in der Quantenmechanik (siehe Kap. 5.3):
[Q, P ] = QP − P Q = i~1 .
(4.68)
Die Spur des Identiätsoperators auf der rechten Seite ist offenbar unendlich, für die linke Seite hat
man den Eindruck, als ob die Spur null ergibt: Die Spur von der Summe zweiter Operatoren ist gleich
der Summe der Einzelspuren und die Spur von dem Produkt der Operatoren hängt nicht von deren
Reihenfolge ab. Damit erhielte man 0 = ∞. Dieser Unsinn beruht natürlich darauf, dass keiner der
Operatoren (Q, P, 1) ein Spurklasseoperator ist. Für Spurklasseoperatoren kann die obige Gleichung
tatsächlich nie erfüllt werden.
Die Menge der Spurklasseoperatoren kann man sogar wieder zu einem Hilbertraum machen.
Als das Skalarprodukt zweier Operatoren definiert man in diesem Fall
(A, B) = Sp (A† B) .
4.2.3
(4.69)
Selbstadjungierte Operatoren
Eine besonders wichtige Klasse von Operatoren für die Quantenmechanik bilden die
selbst-adjungierten Operatoren, für die also gilt A† = A oder
hx|A|yi = hAx|yi .
(4.70)
Lineare Abbildungen – Operatoren
75
Wie wir später sehen werden (Kap. 5.3), hängen diese Operatoren eng mit dem zusammen, was man an einem System beobachten kann und was man für Messwerte
erhält. Eine spezielle Klasse von selbstadjungierten Matrizen ist uns schon im Zusammenhang mit der Beschreibung von Filtern in Kap. 2.3 begegnet. Dabei handelte es
sich um Projektionsoperatoren, die wir im nächsten Abschnitt behandeln werden.
Zwei einfache Theoreme machen selbstadjungierte Operatoren für die Quantenmechanik so wichtig:
Satz: (1) Die Eigenwerte eines selbstadjungierten Operators sind reell.
Beweis: Sei |λi ein normierter Eigenvektor von A mit Eigenwert λ, so gilt:
hλ|A|λi = λ .
(4.71)
hλ|A|λi = hλ|A† |λi∗ ,
(4.72)
Andererseits ist:
womit die Behauptung für selbstadjungierte Operatoren bewiesen ist. Mit etwas größerem
Aufwand kann man zeigen, dass auch das Spektrum solcher Operatoren (die also eigentlich keine Eigenvektoren haben) reell ist.
Satz: (2) Die Eigenvektoren zu verschiedenen Eigenwerten eines selbstadjungierten Operators sind orthogonal.
Beweis: Seien λ 6= λ0 zwei verschiedene Eigenwerte von A mit Eigenvektoren |λi und
|λ0 i, so gilt:
hλ0 |A|λi = λ hλ0 |λi = λ0 hλ0 |λi .
(4.73)
Da die beiden Eigenwerte als verschieden angenommen wurden, kann die rechte Gleichung nur gelten, wenn hλ0 |λi = 0.
Auch in diesem Fall lässt sich zeigen, dass der Satz auch für die Fast“-Eigen”
vektoren zum Spektrum von linearen Operatoren gilt.
Haben zwei (linear unabhängige) Vektoren denselben Eigenwert, müssen sie
nicht orthogonal sein. Allerdings spannen sie eine Ebene von Vektoren auf, und man
kann sich leicht überzeugen, dass beliebige Linearkombinationen dieser beiden Vektoren wieder Eigenvektoren zu demselben Eigenwert sind. Daher kann man in dieser
Ebene zwei orthogonale Eigenvektoren als Repräsentanten wählen.
Eine der Eigenschaften, die selbstadjungierte Operatoren so wichtig machen,
ist die Tatsache, dass sich aus den Eigenvektoren solcher Operatoren eine Orthonormalbasis definieren lässt. Gehören zwei Eigenvektoren zu verschiedenen Eigenwerten,
sind sie immer orthogonal und können natürlich normiert werden. Innerhalb von Unterräumen, in denen alle Vektoren denselben Eigenwert haben (sofern der Eigenwert
entartet ist) kann man immer eine Orthonormalbasis wählen.
76
Mathematische Grundlagen
Satz: Zwei selbstadjungierte Operatoren A und B besitzen genau dann einen gemeinsamen Satz von Eigenvektoren, wenn diese beiden Operatoren kommutieren, d.h., wenn
AB = BA.
Beweis: Zwei Operatoren, die gleichzeitig auf Diagonalgestalt gebracht werden können,
kommutieren offenbar in dieser Basis. Wenn die Gleichung AB = BA aber für eine
vollständige Basis gilt, gilt sie auf dem gesamten Hilbertraum.
Umgekehrt nehmen wir an, die Gleichung AB = BA gelte auf dem gesamten
Hilbertraum, und {|λi i} sei eine (vollständige) Basis von A. Damit folgt
0 = hλi |(AB − BA)|λj i = λi hλi |B|λj i − λj hλi |B|λj i = (λi − λj )hλi |B|λj i .
(4.74)
Wiederum folgt für λi 6= λj
hλi |B|λj i = 0
(4.75)
Bezüglich verschiedener Eigenwerte von A ist also B ebenfalls diagonal. Sind die Eigenwerte entartet, können wir B auf diesem Unterraum der Eigenvektoren zu den
entarteten Eigenwerten diagonalisieren, ohne dass sich an der Eigenschaft von A, diagonal zu sein, etwas ändert.
Die besondere Eigenschaft selbstadjungierter Operatoren — ein Orthonormalsystem von Eigenvektoren zu besitzen — ist manchmal wichtiger, als die Eigenschaft, reelle Eigenwerte zu haben.
Aus diesem Grund definiert man einen Operator als normal, wenn er mit seinem adjungierten Operator kommutiert: A† A = AA† . Von solchen Operatoren kann man zeigen, dass sie sich als Funktionen
von selbstadjungierten Operatoren schreiben lassen. Eine wichtige Klasse von normalen aber nicht
selbstadjungierten Operatoren sind die unitären Operatoren.
4.2.4
Projektionsoperatoren
Eine besondere Klasse von selbstadjungierten Operatoren bilden die (orthogonalen)
Projektionsoperatoren. Ein Projektionsoperator erfüllt dabei die Bedingungen:
P = P†
und P 2 = P .
(4.76)
(Es gibt auch Projektionsoperatoren, die nicht selbstadjungiert sind, die also nur die
zweite Bedingung erfüllen, diese sollen hier aber nicht betrachtet werden.) Wir sind
Projektionsoperatoren schon einmal in Kap. 2.3 begegnet, wo wir gezeigt hatten, dass
Projektionsoperatoren in natürlicher Weise die Projektion eines Vektors auf eine bestimmte Achse beschreiben. Generell kann man Projektionsoperatoren als lineare Abbildungen auffassen, die einen Vektor auf einen linearen Unterraum eines Hilbertraums
abbilden. Dies soll im Folgenden kurz erläutert werden.
Zunächst muss man sich vor Augen halten, dass jeder Satz von n linear unabhängigen Vektoren |xi i einen Vektorraum aufspannen. Dabei handelt es sich um die
Menge aller Vektoren, die sich als beliebige Linearkombinationen dieser n Vektoren
Lineare Abbildungen – Operatoren
77
schreiben lassen. Ein solcher Vektorraum bildet somit einen n-dimensionalen linearen
Unterraum des Vektorraums, in dem die Vektoren |xi i definiert sind. Zu jedem solchen
Unterraum gibt es einen Operator P , der einen beliebigen Vektor des Hilbertraums
orthogonal auf diesen Unterraum projiziert. Da ein Vektor, der bereits in einem solchen Unterraum liegt, durch die Projektion nicht verändert wird, gilt P 2 = P , d.h.,
die erneute Anwendung des Projektionsoperators ändert an dem Ergebnis der ersten
Projektion nichts.
Projektionsoperatoren haben nur zwei mögliche Eigenwerte: λ = 0 und λ = 1.
Das sieht man daran, dass die Eigenwerte natürlich ebenfalls die Gleichung λ2 =
λ erfüllen müssen, und da sind 0 und 1 die einzigen Lösungen. Der Eigenraum zu
λ = 1 ist offenbar der Unterraum, auf den P projiziert, denn für Vektoren in diesem
Unterraum gilt, dass P sie nicht verändert. Die dazu orthogonalen Vektoren besitzen
den Eigenwert 0 und werden auf den Nullvektor projiziert.
Die Spur von P gibt die Dimension des linearen Unterraums an, auf den P
projiziert. Ein Projektionsoperator mit Sp P = 1 projiziert somit auf einen eindimensionalen linearen Unterraum bzw. eine Linie. Die Menge aller (orthogonalen) Projektionsoperatoren mit Spur 1 entpricht somit der Menge aller linearen eindimensionalen
Unterräume, also der Menge aller Geraden durch den Nullpunkt. Die eindimensionalen
linearen Unterräume bezeichnet man manchmal auch als die Strahlen eines Vektorraums.
Die Spektraldarstellung selbstadjungierter Operatoren
Betrachten wir zunächst eine selbstadjungierte (oder allgemeiner normale“) Matrix
”
in Diagonalgestalt:


λ1 0 0 · · ·


 0 λ2 0 · · · 


A=
(4.77)
.
 0 0 λ3 · · · 


..
..
.. . .
.
.
.
.
Falls die Eigenwerte nicht entartet sind, gehört jeder Eigenwert zu einem eindimensionalen linearen Unterraum und wir können schreiben:






1 0 0 ···
0 0 0 ···
0 0 0 ···






 0 0 0 ··· 
 0 1 0 ··· 
 0 0 0 ··· 






A = λ1 
 + λ2 
 + λ3 
 + . . . (4.78)
 0 0 0 ··· 
 0 0 0 ··· 
 0 0 1 ··· 






.. .. .. . .
.. .. .. . .
.. .. .. . .
.
.
.
. . .
. . .
. . .
Jede dieser Matrizen entspricht einem Projektionsoperator auf den entsprechenden
Unterraum des Eigenwerts. Definieren wir Pλi als den Projektionsoperator auf den
78
Mathematische Grundlagen
Unterraum zum Eigenwert λi , so folgt:
A=
X
λ i Pλ i .
(4.79)
i
Diese Gleichung bleibt in beliebigen Basissystemen gültig, d.h., sie gilt nicht nur in
dem System, in dem die Matrix A diagonal ist, da bei einem Basiswechsel beide Seiten gleichermaßen transformiert werden. Außerdem bleibt die Gleichung gültig, wenn
ein Eigenwert λ entartet sein sollte, und wir unter Pλ entsprechend den Projektionsoperator auf diesen mehrdimensionalen linearen Unterraum verstehen, der von den
Eigenvektoren zu λ aufgespannt wird. Gleichung 4.79 bezeichnet man als die Spektralzerlegung von A. Offenbar lässt sich eine solche Zerlegung immer vornehmen, sofern
sich eine Orthonormalbasis von Eigenvektoren finden lässt, d.h., wenn die lineare Abbildung normal ist.
Mit etwas Aufwand kann man die Spektralzerlegung auch auf normale Operatoren mit einem kontinuierlichen Spektrum erweitern. Der Aufwand besteht darin, ein
operatorwertiges Integrationsmaß“ dPλ zu definieren, mit dem gilt:
”
Z
A = λ dPλ .
(4.80)
Anschaulich geht man dabei wie bei der Definition des Riemannschen Integrals vor: Man
definiert Projektionsoperatoren ∆Pλ auf Intervalle: ∆Pλi projiziert auf den Unterraum, in dem die
Eigenvektoren zu dem Intervall [λi , λi + ∆λ] liegen. Näherungsweise kann man A als eine Summe
darstellen:
X
A≈
λi ∆Pλi
(4.81)
i
und betrachtet anschließend den Grenzwert ∆λ → 0.
Streng genommen gibt es diese Eigenvektoren nicht in dem Hilbertraum. Daher muss man
so vorgehen, dass man zunächst den linearen Unterraum V (λ, ∆λ) definiert, sodass für alle Vektoren
|xi in diesem Unterraum gilt
hx|A|xi
≤ λ + ∆λ
(4.82)
λ≤
hx|xi
Nun handelt es sich um ein Intervall für die Matrixelemente von A und es wird nicht vorrausgesetzt,
dass |xi ein Eigenvektor von A ist. Dieser Raum ist wohl-definiert, bildet einen linearen Unterraum
und man kann den Projektionsoperator auf diesen Unterraum definieren. Anschließen betrachtet man
einen Grenzwert, bei dem ∆λ gegen null geht.
Die Spektralzerlegung erlaubt auch eine elegante Darstellung von Funktionen
von normalen (also insbesondere selbstadjungierten) Operatoren. Sei A ein normaler
Operator mit Spektrum {λ} und der Spektralzerlegung
Z
X
A=
λi Pλi bzw. A = λ dPλ ,
(4.83)
i
Lineare Abbildungen – Operatoren
79
so können wir für eine Funktion f (auf den komplexen Zahlen) definieren:
Z
X
f (A) =
f (λi ) Pλi bzw. f (A) = f (λ) dPλ .
(4.84)
i
4.2.5
Unitäre Operatoren
Abschließend wollen wir kurz auf unitäre Operatoren eingehen. Hierbei handelt es
sich um die komplexe Verallgemeinerung von Rotationen“. Unitäre Operatoren sind
”
unter anderem wichtig, wenn man einen Wechsel von einer Orthonormalbasis zu einer
anderen Orthonormalbasis vornehmen möchte.
Stellen wir uns vor, U sei eine lineare Abbildung auf dem Hilbertraum, die das
Skalarprodukt von zwei Vektoren nicht verändern soll, d.h., für zwei beliebige Vektoren
|xi, |yi im Hilbertraum soll gelten:
hU y|U xi = hy|U † U |xi = hy|xi .
(4.85)
Die erste Gleichung ist dabei eine identische Umformung und impliziert die Definition
des adjungierten Operators zu U , die zweite Gleichung ist eine Bedingungsgleichung.
Damit diese Bedingung für alle Vektoren |xi, |yi erfüllt ist, muss gelten:
U †U = 1 .
(4.86)
Definition: Ein Operator heißt unitär, wenn gilt:
U † = U −1 .
(4.87)
Ein unitärer Operator U kommutiert mit seinem adjungierten Operator U †
und somit ist U ein normaler Operator. Wie schon erwähnt, lässt sich jeder normale
Operator als Funktion eines selbstadjungierten Operators schreiben und zwar gilt:
U = eiA
(A selbstadjungiert) .
(4.88)
Der adjungierte bzw. inverse Operator dazu ist
U † = e−iA .
(4.89)
Wenn wir in einem Hilbertraum eine unitäre Transformation vornehmen, d.h. alle
Vektoren nach der Vorschrift |xi 7→ U |xi rotieren“, und wir möchten, dass die Matrix”
elemente von Operatoren hx|A|yi unverändert bleiben, so müssen wir die Operatoren
ebenfalls transformieren. Offenbar lässt das folgende Transformationsgesetz,
A 7→ U AU †
(4.90)
80
Mathematische Grundlagen
die transformierten Matrixelemente unverändert:
hx|A|yi 7→ hU x|U AU † |U yi = hx|U † (U AU † )U |yi = hx|A|yi .
(4.91)
Die Eigenwerte eines unitären Operators müssen die Bedingung λ∗ = λ−1 bzw. λ∗ λ = 1
erfüllen und sind daher alle von der Form λ = eiα , wobei α eine reelle Zahl ist.
Die Menge aller unitären Transformationen bildet eine Gruppe. Handelt es sich
um einen endlich dimensionalen Raum (Dimension N ), so spricht man von der unitären
Gruppe U(N ). Bei endlich dimensionalen Räumen kann man auch die Determinante
von Matrizen definieren, und die Untergruppe der unitären Matrizen mit der Determinante +1 bezeichnet man als Spezielle unitäre Gruppe SU(N ).
Handelt es sich um reelle Vektorräume, so lautet die Bedingung (4.87) RT = R−1
(wobei RT die transponierte Matrix von R ist) und man spricht von orthogonalen Matrizen. In einem N -dimensionalen Vektorraum bezeichnet man die Menge aller orthogonalen Matrizen als die Orthogonale Gruppe O(N ) und die Menge der orthogonalen
Matrizen mit Determinante 1 als die Spezielle orthogonale Gruppe SO(N ). Die Elemente der speziellen orthogonalen Gruppe sind gerade die Drehungen in einem Vektorraum, wohingegen die orthogonale Gruppe neben den Drehungen noch Spiegelungen
enthält. Entsprechend kann man die unitären Matrizen in komplexen Vektorräumen
als verallgemeinerte Drehungen auffassen.
4.3
Die Bra-Ket-Notation für Operatoren
Lineare Abbildungen von einem Vektorraum V in einen Vektorraum W kann man
abstrakt auch als Elemente von W × V ∗ auffassen, wobei V ∗ der Dualraum von V ist.
Ein solches Element aus W × V ∗ hat nämlich die Eigenschaft, dass man es auf ein
Element auf V anwenden muss (das ist der V ∗ -Anteil, er liefert zunächst eine Zahl)
und das Ergebnis ist ein Vektor in W (der W -Anteil, der mit der vorher erhaltenen
Zahl multipliziert wird). Diese sehr abstrakte Sichtweise steckt implizit hinter der BraKet-Notation für Operatoren, die wir nun erläutern wollen.
Immer noch als Vorbemerkung aber etwas konkreter überlegen wir uns diesen
Sachverhalt im Zusammenhang mit der vielleicht vertrauteren Schreibweise von Zeilenund Spaltenvektoren. Die Elemente des Vektorraums schreibt man üblicherweise als
Spaltenvektoren und die Elemente des Dualraums (bzw., falls es ein Skalarprodukt
gibt, die transponierten“ Elemente) als Zeilenvektor. Zeilenvektor mal Spaltenvektor
”
ist das Skalarprodukt und ergibt eine Zahl (hier an einem 2-dimensionalen Beispiel):
(y1 , y2 ) ·
x1
x2
!
= y 1 x1 + y 2 x2 .
(4.92)
Die Bra-Ket-Notation für Operatoren
81
Multiplizieren wir hingegen einen Spaltenvektor mit einem Zeilenvektor, so erhalten
wir eine Matrix:
!
!
y1
y 1 x1 y 1 x2
· (x1 , x2 ) =
.
(4.93)
y2
y 2 x1 y 2 x2
Man erhält auf diese Weise nicht jede Matrix als Multiplikation eines Spalten- und
eines Zeilenvektors, aber man kann jede beliebige Matrix als Summe solcher Produkte
darstellen. Ausgedrückt in unserer Bra-Ket-Notation entspricht die letzte Gleichung
einem Ausdruck der Form |yihx|, und genau durch Linearkombinationen von solchen
Ausdrücken lassen sich lineare Abbildungen schreiben.
Stellen wir uns zunächst eine lineare Abbildung A wieder als Matrix vor:


a11 a12 a13 · · ·


 a21 a22 a23 · · · 


A=
(4.94)
.
 a31 a32 a33 · · · 


..
..
.. . .
.
.
.
.
Die (Orthonormal)-Basis zu dieser Darstellung sei {|ei i}. Das Matrixelement aij erhalten wir offensichtlich, indem wir A von rechts mit |ej i und von links mit hei | multiplizieren:
aij = hei |A|ej i .
(4.95)
Offenbar erhalten wir genau dieses Ergebnis, wenn wir die Matrix für A in folgender
Form schreiben:
X
akl |ek ihel | .
(4.96)
A=
k,l
Die Matrixelemente der |ek ihel | sind überall 0 außer in der k-ten Zeile und l-ten Spalte,
wo eine 1 steht. Auf diese Weise kann man eine Matrix bezüglich jeder beliebigen
Orthonormalbasis durch ihre Matrixelemente ausdrücken.
Eine besonders einfache Darstellung hat ein Projektionsoperator auf einen 1dimensionalen linearen Unterraum. Sei |xi ein normierter Vektor in diesem Unterraum
(dieser Vektor spannt den Unterraum also auf), dann ist der Projektionsoperator gegeben durch
Px = |xihx| .
(4.97)
Wenn wir diesen Projektionsoperator auf einen beliebigen Vektor |yi anwenden, erhalten wir:
Px |yi = |xihx|yi ,
(4.98)
also einen Vektor, der die Richtung von |xi hat, und die Amplitude hx|yi, also das
Skalarprodukt des Einheitsvektors |xi mit dem (beliebigen) Vektor |yi, das gerade die
Länge der senkrechten Projektion von |yi auf die Richtung von |xi angibt.
82
Mathematische Grundlagen
Die Darstellung (4.97) für Projektionsoperatoren ist sehr hilfreich, wenn man
eine Projektionsmatrix zu einem gegebenen Vektor bestimmen möchte. In Kapitel 2.3
haben wir auf diese Weise die Projektionsmatrix auf den Vektor
!
cos
α
~α =
A
(4.99)
sin α
bestimmt:
Pα =
cos α
sin α
!
· (cos α, sin α) =
cos2 α
cos α sin α
cos α sin α
sin2 α
!
.
(4.100)
Für die Spektraldarstellung einer selbstadjungierten Matrix (Gl. 4.79) können
wir nun schreiben:
X
A=
λi |λi ihλi |
(4.101)
i
wobei |λi i den normierten Eigenvektor zum Eigenwert λi bezeichnet. Für die Einheitsmatrix erhalten wir die nützlich Darstellung:
X
1=
|λi ihλi | .
(4.102)
i
Diese Zerlegung der Eins gilt für jedes beliebige Orthonormalsystem, insbesondere also
auch für die Orthonormalsysteme, die sich aus den Eigenvektoren von selbstadjungierten Matrizen ergeben.
Wenn wir von der Matrix A wissen möchten, wie ihre Matrixelemente in einer
anderen Orthonormalbasis, beispielsweise {|ϕi i}, aussehen, erhalten wir:
X
λk hϕi |λk ihλk |ϕj i .
(4.103)
hϕi |A|ϕj i =
k
4.4
Operatoren im L2
Der Raum der komplexen, quadratintegrablen Funktionen über der reellen Achse
L2 (R, dx) (die Notation gibt neben dem Urbildraum R noch das Integrationsmaß dx
an; manchmal betrachtet man auch verallgemeinerte Lebesgue-Maße) spielt in der
Physik eine ganz besondere Rolle, daher sollen einige der Konzepte der vergangen
Kapitel konkret noch einmal für diesen Raum formuliert bzw. erweitert werden.
Zwei lineare Operatoren haben für die Physik eine besondere Bedeutung: die
einfache Multiplikation einer Funktion mit dem Argument x und die erste Ableitung
∂
. Den Grund für das
der Funktion (multipliziert mit der imaginären Einheit i): −i ∂x
i“ werden wir gleich sehen.
”
Operatoren im L2
4.4.1
83
∂
Das Spektrum von x und −i ∂x
Von der Multiplikation mit x haben wir schon gezeigt, dass sie linear ist (Gl 4.56), von
der Ableitung gilt entsprechend:
∂ ∂
∂
−i
αf (x) + βg(x) = α −i f (x) + β −i g(x) .
(4.104)
∂x
∂x
∂x
∂
zu bestimmen. Dabei
Wir versuchen zunächst, mögliche Eigenwerte von x und −i ∂x
beginnen wir mit dem Ableitungsoperator, d.h., wir suchen Lösungen zu der Gleichung:
−i
∂
f (x) = λf (x) .
∂x
(4.105)
Wir wissen, dass bei solchen Gleichungen ein Exponentialansatz zum Ziel führt und
finden als Lösungen:
fk (x) = Aeikx
Eigenwert λ = k .
(4.106)
Die Lösungen sind also durch einen Parameter p charakterisiert, der gleichzeitig der
∂
Eigenwert von −i ∂x
ist. Die Ampitude A ist eine Integrationskonstante.
Ähnlich wie schon in Kapitel 4.2.2 sind jedoch die Eigenfunktionen des Ope∂
rators −i ∂x
nicht quadratintegrabel. Es gilt |fk (x)|2 = 1 und das Integral über die
gesamte reelle Achse ist unbeschränkt. Die Eigenfunktionen liegen also nicht im Raum
der quadratintegrablen Funktionen. Andererseits können wir leicht zeigen, dass der
∂
− λ1)−1 für reelle Werte von λ unbeschränkt ist, da wir im Raum der
Operator (−i ∂x
quadratintegrablen Funktionen beliebig“ nahe an die Eigenfunktionen herankommen.
”
Man spricht in diesem Fall auch von uneigentlichen Eigenfunktionen. Das Spektrum
∂
von −i ∂x
besteht somit aus allen reellen Zahlen k ∈ R:
∂
= {k|k ∈ R} .
(4.107)
Spec −i
∂x
Aus der Theorie der Fouriertransformationen ist folgende Gleichung bekannt:
Z +∞
0
eix(k−k ) dx = 2πδ(k − k 0 ) .
(4.108)
−∞
Offensichtlich sind die uneigentlichen Eigenfunktionen zu verschiedenen Werten von k
orthogonal. Wir werden im Folgenden die normierten komplexen Exponentialfunktionen
1
fk (x) = √ eikx
(4.109)
2π
mit dem Parameter k durch |ki kennzeichnen. Wir haben also gezeigt, dass
−i
∂
|ki = k|ki und hk 0 |ki = δ(k − k 0 ) .
∂x
(4.110)
84
Mathematische Grundlagen
Nun wird auch der Grund deutlich, weshalb wir für den Ableitungsoperator noch einen Faktor
i heranmultipliziert haben. Zum einen lässt sich leicht zeigen, dass der Operator (mit dem i) selbstadjungiert ist. Dadurch ist das Spektrum {k} reell. Ohne das i wären die Eigenfunktionen die einfachen
Exponentialfunktionen ekx , die weit davon entfernt“ sind, quadratintegrabel zu sein, und selbst für
”
verschiedene Werte von k würde das Skalarprodukt nicht existieren. Diese Funktionen lassen sich
∂
auch nicht durch quadratintegrable Funktionen annähern. Entsprechend ist das Spektrum von −i ∂x
tatsächlich die reelle Achse, und nicht die gesamte komplexe Ebene.
Wir betrachten nun den Operator Multiplikation mit x“. Damit wir wirklich
”
einen eindeutigen Eigenwert erhalten, muss die Eigenfunktion zu diesem Operator auf
einen Punkt konzentriert sein. Zunächst könnte man vielleicht an die Funktion
(
1 x = x0
fx0 (x) =
(4.111)
0 sonst
denken. Sie erfüllt zwar die Eigenwertgleichung:
xfx0 (x) = x0 fx0 (x) ,
(4.112)
hat aber den Nachteil, dass nicht nur das Integral über das Quadrat dieser Funktion
verschwindet (sie hat einen Träger von nur einem Punkt) und damit hat diese Funktion
die Norm 0, sondern auch das Integral über das Produkt dieser Funktion mit jeder
anderen (quadratintegrablen) Funktion verschwindet. In diesem Sinne sind also auch
sämtliche Skalarprodukte von fx0 mit anderen Funktionen null. Diese Funktion ist in
Bezug auf das gewählte Skalarprodukt identisch zum Nullvektor.
Die nächste Idee für einen Satz von Eigenfunktionen zum Multiplikationsoperator wäre die (verallgemeinerte) Funktion fx0 (x) = δ(x − x0 ), die ebenfalls ihren Träger
auf den Punkt x0 konzentriert hat, deren Integral mit anderen Funktionen aber von
Null verschieden ist. Sie erfüllen (auch formal) die Eigenwertgleichung und haben nichtverschwindende Skalarprodukte mit anderen quadratintegrablen Funktionen. Außerdem lassen sie sich beliebig genau durch quadratintegrable Funktionen approximieren
(beispielsweise durch eine Folge von normierten Gauß-Funktionen mit immer kleinerer
Varianz). Lediglich eine Norm besitzen die δ-Funktionen nicht bezüglich des definierten
Skalarprodukts, da das Quadrat einer δ-Funktion nicht existiert. (Andere Versuche,
wie die Wurzel von einer δ-Funktion zu nehmen, schlagen ebenfalls fehl.) Allerdings
ist das Produkt von δ-Funktionen zu verschiedenen Parametern x0 und x1 immer null,
da die Träger verschieden sind.
Wir müssen also akzeptieren, dass der Multiplikationsoperator mit dem Argument x ebenfalls keine Eigenfunktionen im Raum der quadratintegrablen Funktionen
besitzt, allerdings hat er wiederum ein Spektrum, nämlich die gesamte reelle Achse:
Spec(x) = {x|x ∈ R}
uneigentliche Eigenfunktionen“ fx0 (x) = δ(x − x0 ) . (4.113)
”
Operatoren im L2
85
Auch in diesem Fall bezeichnen wir in Zukunft die δ-Funktion mit dem Parameter x0
als |x0 i. Wir haben gezeigt, dass
x|x0 i = x0 |x0 i und hx0 |x1 i = 0 für x0 6= x1 .
4.4.2
(4.114)
Die x- und k-Basis
Das Skalarprodukt auf dem L2 ist (vgl. Gl. 4.24):
Z +∞
f (x)∗ g(x) dx .
hf |gi =
(4.115)
−∞
Wir betrachten nun das Skalarprodukt von quadratintegrablen Funktionen mit den
uneigentlichen Eigenfunktionen des letzten Abschnitts. Offenbar gilt:
Z +∞
hx|f i =
δ(y − x)f (y) dy = f (x)
(4.116)
−∞
Z +∞
1
und
hk|f i = √
e−ikx f (x) dx = f˜(k) .
(4.117)
2π −∞
Hierbei ist f˜ die Fourier-Transformierte der Funktion f .
Wir sollten Audrücke der Form hx|f i = f (x) ähnlich interpretieren, wie beispielsweise bei diskreten Basisvektoren Ausdrücke der Form hei |xi = xi (Gl. 4.31).
Die Bildung des Skalarprodukts eines Vektors |f i (in einem Vektorraum, der eine
Darstellung als Funktionenraum hat) mit dem Vektor |xi (der Eigenfunktion des Multiplikationsoperators mit x) ist wie die Projektion einer Funktion auf eine ihrer Kom”
ponenten“ bzw. die Auswertung der Funktion an einer bestimmten Stelle x. Hier wird
der Unterschied zwischen der Funktion selbst und dem Wert der Funktion an einer
bestimmten Stelle besonders deutlich.
Interessant ist noch das Matrixelement hx|ki, für das formal gilt:
Z +∞
1
1
δ(y − x) eiky dy = √ eikx .
(4.118)
hx|ki = √
2π −∞
2π
4.4.3
∂
Der Kommutator von x und −i ∂x
Wir hatten, schon erwähnt, dass der Kommutator von Operatoren in der Physik eine
besondere Rolle spielt. Daher wollen wir den Kommutator von den beiden Operatoren
∂
x und −i ∂x
berechnen. Wir müssen dabei berücksichtigen, dass es sich wirklich um
Operatoren handelt, die auf eine Funktion anzuwenden sind. Wir berechnen somit:
∂
∂
∂ x, −i
f (x) = x −i f (x) + i
xf (x)
(4.119)
∂x
∂x
∂x
∂
∂
(4.120)
= −x · i f (x) + if (x) + ix f (x)
∂x
∂x
= if (x) .
(4.121)
86
Mathematische Grundlagen
(Der erste und dritte Term in der zweiten Zeile heben sich weg.) Damit schreibt man
für den Kommutator:
∂
= i.
(4.122)
x, −i
∂x
Kapitel 5
Die Postulate der
Quantenmechanik
und erste Folgerungen
In diesem Kapitel betrachten wir den abstrakten und formalen Rahmen der Quantenmechanik. Wir formulieren ihn in einer axiomatischen Form, obwohl das nicht unbedingt Standard ist.
Ganz allgemein sollte ein axiomatischer Rahmen zu einem physikalischen Formalismus in der Physik folgende Konzepte spezifizieren:
1. Durch welche mathematische Struktur werden physikalische Zustände bzw. wird
unser Wissen über den physikalischen Zustand eines Systems dargestellt?
2. Durch welche mathematische Struktur werden physikalische Observable dargestellt?
3. Wie gewinnt man aus einer Observablen und einem Zustand ein Ergebnis, das
sich experimentell überprüfen lässt?
4. Durch welche Vorschriften kann man einem physikalischen System einen Zustand
zuschreiben? (Woher weiß man, durch welches konkrete mathematische Element
der in 1. genannten Struktur ein physikalisches System zu beschreiben ist?)
5. Wodurch wird die Zeitentwicklung eines physikalischen Systems beschrieben?
Die Reihenfolge und Nummerierung der Postulate lehnen sich an das Lehrbuch
von Grawert [36] an, die Formulierungen sind aber nicht damit identisch.
Wir beginnen mit einer Aufzählung der Postulate der klassischen Mechanik,
da diese allgemein vertraut sein dürfte, der axiomatische Zugang aber eher fremd ist.
Außerdem können wir später leicht die Parallelen aufzeichnen.
87
88
Postulate der QM
Die letzten Abschnitte dieses Kapitels beziehen sich auf allgemeine Folgerungen aus diesen Axiomen, beispielsweise die Unschärferelationen und das Konzept der
Dichtematrizen.
Was man wissen sollte
In Anlehnung an die Forderungen, die wir an einen axiomatischen Rahmen für eine Theorie physikalischer Systeme gestellt haben, ergibt sich für die Quantentheorie
folgender Formalismus:
• Quantenmechanische Zustände werden durch die Strahlen in einem Hilbertraum
dargestellt; oft dienen normierte Vektoren als Repräsentanten dieser Strahlen.
Äquivalent kann man einen Zustand auch durch den (selbst-adjungierten) Projektionsoperator auf den Strahl des Zustands darstellen.
• Observable werden durch selbstadjungierte Matrizen bzw. Operatoren auf dem
Hilbertraum dargestellt. Zu jeder klassischen Observablen f (x, p) gehört die
quantenmechanische Observable f (Q, P ). Diese Zuordnung zwischen klassischen
und quantenmechanischen Observablen ist wegen der Nichtvertauschbarkeit der
Operatoren nicht immer eindeutig. Für Q und P fordern wir die kanonischen
Vertauschungsregeln [Q, P ] = i~.
• Die Born’sche Regel besagt: Das Absolutquadrat des Skalarprodukts von zwei
(normierten) Vektoren (Repräsentanten von Zuständen) |ϕi und |ψi ist die Wahrscheinlichkeit, bei einer Messung einer Observablen, welche den Zustand |ϕi als
Eigenzustand hat, an einem im Zustand |ψi präparierten System, den Zustand
|ϕi vorzufinden. Äquivalent kann man auch sagen, dass ein physikalischer Zustand |ψi auf der Menge der Observablen ein Erwartungswertfunktional definiert, welches den Erwartungswert dieser Observablen in diesem Zustand angibt: hψ|A|ψi. Experimentell bedeutet dies: Wenn man sehr viele physikalische
Systeme im selben Zustand |ψi präpariert und an diesen Systemen die Messung
der Observablen A vornimmt, dann ist hψ|A|ψi der Mittelwert, der sich aus den
relativen Häufigkeiten der Messwerte ergibt. Die Eigenwerte einer Observablen
A sind die möglichen Messwerte bei einer Einzelbeobachtung. Die kanonischen
Vertauschungsregeln garantieren, dass die Erwartungswerte von Observablen die
klassischen Bewegungsgleichungen erfüllen.
• Die Eigenzustände einer Observablen zu einem Eigenwert geben an, durch welchen Zustand das physikalische System unmittelbar nach der Messung und der
Feststellung des Messwerts zu beschreiben ist. Diese Eigenschaft erlaubt die
Präparation von physikalischen Systemen in bestimmten Zuständen.
Postulate der klassischen Mechanik
89
• Die zeitliche Entwicklung von Zuständen ist unitär und wird durch die zeitabhängige Schrödinger-Gleichung beschrieben. Sie besagt, dass der Generator der
Zeitentwicklung gleich dem Hamilton-Operator des Systems ist. Äquivalent kann
man auch die Zeitentwicklung den Observablen zuschreiben, die dann durch die
Heisenberg’schen Bewegungsgleichungen ausgedrückt wird.
Außerdem sollte man begründen können, weshalb man zwei Observable, deren
zugehörige selbst-adjungierte Operatoren nicht kommutieren, nicht gleichzeitig messen
kann. Für den Ort und Impuls gilt die Heisenberg’sche Unschärferelation
∆x · ∆p ≥
~
,
2
(5.1)
entsprechend gibt es auch eine Unschärferelation zwischen Zeit und Energie,
∆E · ∆t ≥
~
,
2
(5.2)
die jedoch nicht aus der Nicht-Vertauschbarkeit von Operatoren folgt sondern aus den
Eigenschaften der Fourier-Transformation.
Eine Dichtematrix ist eine positive, selbst-adjungierte, normierte Matrix, welche Gemische von Zuständen beschreibt. Ein Gemisch von Zuständen ist zu unterscheiden von der Superposition dieser Zustände: Bei Superpositionen handelt es sich
um reine Zustände und man kann Interferenzen messen. Dichtematrizen beschreiben
physikalische Gemische von Zuständen, bei denen keine Interferenzen zwischen diesen
verschiedenen Zuständen auftreten.
5.1
Die Postulate der klassischen Mechanik
In der klassischen Mechanik sind wir es nicht gewohnt, ein Axiomensystem anzugeben,
aber es ist auch hier möglich. Damit der Schritt zur Quantenmechanik nicht zu groß
ausfällt, sollen die Postulate der klassischen Mechanik kurz angedeutet werden.
5.1.1
1. Postulat — Zustände
Der (reine) Zustand eines klassischen Systems (beispielsweise einer Menge von Punktteilchen) ist durch die Angabe der Orte und der Impulse gegeben. Für N Punktteilchen entspricht dies einem Punkt im 6N -dimensionalen Phasenraum. Man kann den
Phasenraum auch als die Menge der möglichen Anfangsbedingungen“ für die Bewe”
gungsgleichungen auffassen. (Anmerkung: Es gibt in der klassischen Mechanik auch so
genannte gemischte“ Zustände, die Wahrscheinlicheitsverteilungen auf dem Phasen”
raum entsprechen — mehr dazu in Abschnitt 5.9.)
90
Postulate der QM
Postulat 1: Ein (reiner) klassischer Zustand kann durch einen Punkt (x, p) im Phasenraum P — dem Raum der Orte und Impulse — dargestellt werden.
Dieses Postulat spezifiziert Axiom 1 für die klassische Mechanik.
5.1.2
2. Postulat — Observable
Eine Observable ist etwas, das man an einem System beobachten kann. In der klassischen Mechanik sind beispielsweise die Energie, der Drehimpuls, die Koordinaten eines
Teilchens oder auch seine Geschwindigkeitskomponenten Observable. Ganz allgemein
schränkt der bekannte Wert einer Observablen den möglichen Zustand des Sytsems im
Zustandsraum ein, im Idealfall legen die möglichen Observablen den Zustand fest.
Postulat 2: Eine Observable f : P → R ist eine reellwertige Funktion auf dem Phasenraum.
Dies entspricht Axiom 2 in unserem allgemeinen Rahmen. Der Wert der Observablen f an einem bestimmten Punkt (x, p) im Phasenraum, also f (x, p), ist gleichzeitig der Messwert, den eine Messung dieser Observablen in dem durch den Punkt
beschriebenen Zustand ergeben würde. Das wird in der klassischen Mechanik nicht
besonders betont, wird aber in der Übertragung auf die Quantenmechanik zu einem
eigenen Axiom und entspricht in unserer allgemeinen axiomatischen Klassifikation dem
Axiom 3.
Zwei weitere Eigenschaften der klassischen Mechanik werden ebenfalls oft als
selbstverständlich angenommen, sind aber in der Quantenmechanik nicht mehr erfüllt:
(1) Eine Messung einer Observablen (letztendlich eine Messung von Ort und Impuls)
verändert den Zustand des gemessenen Systems nicht. Zumindest wird angenommen,
dass eine solche beliebig wenig invasive“ Messung immer durchgeführt werden kann.
”
Damit ist gleichzeitig geklärt, woher wir wissen, welcher Zustand nach einer Messung
vorliegt (Axiom 4 in unserem allgemeinen Rahmen).
(2) Führt man dieselbe Messung an identisch präparierten Systemen (also Systemen
im selben Zustand) aus, so erhält man immer denselben Messwert für eine Observable.
Diese Eigenschaft klassischer reiner Zustände — bezüglich jeder beliebigen Observablen immer denselben Messwert zu liefern — bezeichnet man als Dispersionsfreiheit
klassischer Zustände. Diese Aussage folgt schon aus der Festlegung, wie man bei gegebenem Zustand und gegebener Observablen den physikalischen Messwert dieser Observablen in diesem Zustand erhält (Axiom 3, s.o.).
Für die Funktionen auf dem Phasenraum ist ein Produkt definiert, die sogenannte Poisson-Klammer:
{f (q, p), g(q, p)} =
∂f (q, p) ∂g(q, p) ∂g(q, p) ∂f (q, p)
−
.
∂q
∂p
∂q
∂p
(5.3)
1. Postulat – Darstellung von Zuständen
91
Die Poisson-Klammer bringt eine besondere Struktur der Hamilton’schen Mechanik
zum Ausdruck, die mit der Form der Zeitentwicklung in der Mechanik zusammenhängt.
5.1.3
3. Postulat — Bewegungsgleichung
Wir kennen in der klassischen Mechanik mehrere Formen von Bewegungsgleichungen.
Die bekannteste (und auch allgemeinste) ist die Newton’sche Bewegungsgleichung:
mẍ(t) = F (x(t), ẋ(t)) .
(5.4)
Allgemein kann die Kraft eine Funktion sowohl der Orte als auch der Geschwindigkeiten bzw. Impulse von Teilchen sein; beispielsweise hängt die Lorenz-Kraft für ein
geladenes Teilchen in einem Magnetfeld von dessen Geschwindigkeit ab. Die Kraft ist
also eine Funktion auf dem Phasenraum (und damit im Sinne unserer Axiome eine
Observable).
Die für unsere Zwecke wichtigste Darstellung der Bewegungsgleichungen sind
die Hamilton’schen Bewegungsgleichungen:
ṗ = −
∂H(q, p)
∂q
und q̇ =
∂H(q, p)
,
∂p
(5.5)
wobei H(q, p) die Energie (ausgedrückt durch Orts- und Impulsvariable) ist. Aus ihnen
ergibt sich für die Zeitentwicklung einer Observablen (ausgedrückt durch die PoissonKlammer):
df (q, p)
= {f (q, p), H(q, p)} .
(5.6)
dt
Diese Bewegungsgleichungen bilden somit das Axiom 5 in unserem allgemeinen Formalismus.
5.2
1. Postulat der Quantenmechanik:
Darstellung von Zuständen
In Kapitel 5.9 werden wir nochmals allgemeiner auf den Begriff des Zustands eingehen.
Bei einem reinen Zustand denkt man gerne an das, was ist“. Streng genommen sollte
”
man aber eher an unser Wissen über ein System denken. Ein reiner Zustand entspricht
somit einer maximalen“ Kenntnis über ein System, die sich – zumindest soweit die
”
Theorie es zulässt – nicht weiter verfeinern lässt. Dieses Wissen beruht meist auf einer
Kenntnis der Vergangenheit. Wie wir im Rahmen der Quantenmechanik zu dieser
Kenntnis gelangen können, ist Gegenstand des 4. Axioms.
Eine der überraschenden Erkenntnisse im Zusammenhang mit atomaren Systemen war die experimentelle Feststellung, dass es Superpositionen von Zuständen geben
92
Postulate der QM
kann, die wiederum realisierbare Zustände darstellen. Daher liegt es nahe, quantenmechanische Zustände zunächst durch Vektoren in einem Vektorraum darzustellen.
Wir hatten am Beispiel der Polarisationen gesehen, dass sich der Polarisationszustand eines Photons durch einen Vektor beschreiben lässt. Genauer gesagt war
jedoch der Vektor nur ein Repräsentant für den Polarisationszustand, denn eigentlich
ist es nur die Richtung des Vektors, und diese sogar bis auf ein Vorzeichen, welche
den Polarisationszustand charakterisiert. Denken wir an einen Filter als ein System
zur Präparierung von Zuständen, dann ist es nur die Polarisationsachse, welche die
Polarisationseigenschaft des Photons festlegt. Diese Achse ist ein 1-dimensionaler Unterraum. Wir haben also mehrere Möglichkeiten, einen quantenmechanischen Zustand
darzustellen. Das erste Postulat besitzt daher mehrere Formulierungen.
Postulat 1: Ein quantenmechanischer Zustand kann durch einen normierten Vektor in
einem Hilbertraum dargestellt werden.
Normiert“ bedeutet hier auf 1 normiert“. Der Grund, dass man als Re”
”
präsentaten einen normierten Vektor wählt, liegt in der Wahrscheinlichkeitsinterpretation, die man der Norm eines Vektors bzw. dem Absolutquadrat von Skalarprodukten
zuschreiben möchte, wie es im 3. Postulat ausgedrückt wird. Um bei den Ausdrücken
für die Wahrscheinlichkeiten nicht immer durch die Norm der Vektoren dividieren
zu müssen, beschränkt man sich bei der Darstellung quantenmechanischer Zustände
durch Vektoren meist auf normierte Vektoren.
Durch die Normierung ist der Vektor noch nicht eindeutig festgelegt. Schon
im reellen Fall hatten wir bei den Polarisationen gesehen, dass ~x und −~x denselben
Polarisationszustand beschreiben. Bei komplexen Vektoren, können wir einen Vektor
sogar mit einer beliebigen komplexen Phase (eiα ) multiplizieren, ohne an der Norm
etwas zu ändern. Zwei normierte Vektoren, die sich nur um eine Phase unterscheiden,
entsprechen somit demselben Zustand.
Wie mehrfach erwähnt, handelt es sich bei den normierten Vektoren nur um Repräsentanten von Zuständen. Eigentlich entspricht einem Zustand ein 1-dimensionaler
linearer Unterraum des Hilbertraums.
Postulat 10 : Ein quantenmechanischer Zustand kann durch einen (komplex) 1-dimensionalen linearen Unterraum (einen Strahl) eines Hilbertraums dargestellt werden.
Diese Definition ist unserer Vorstellung vom Polarisationszustand als durch die
Polarisationsachse des präparierenden Filters gegeben am nächsten.
Schließlich haben wir gesehen, dass wir einen 1-dimensionalen linearen Unterraum auch durch den Projektionsoperator auf diesen Unterraum beschreiben können.
Zwischen den Strahlen im Hilbertraum und den selbst-adjungierten Projektionsoperatoren mit der Spur 1 besteht eine eineindeutige Beziehung:
2. Postulat – Darstellung von Observablen
93
Postulat 100 : Ein quantenmechanischer Zustand kann durch einen 1-dimensionalen
(selbst-adjungierten) Projektionsoperator dargestellt werden.
Für konkrete Rechnungen verwendet man meist Vektoren, in manchen Fällen
auch Projektionsoperatoren. Für eine geometrische Anschauung bietet sich das Bild
der Strahlen an.
Mathematisch entsprechen die drei Postulate folgenden Strukturen:
1 Sei |ψi ein (normierter) Vektor des Hilbertraums, dann dient dieser als Repräsentant eines Zustands. Da sich die Normierung bei der Multiplikation mit
einer Phase nicht ändert, ist der Repräsentant nicht eindeutig definiert.
1’ Der Strahl besteht aus allen komplexen Vielfachen eines (vom Nullvektor verschiedenen) Vektors, also beispielsweise
Strahl(ψ) = {λ|ψi|λ ∈ C}
(5.7)
1” Der (selbstadjungierte) Projektionsoperator Pψ projiziert einen beliebigen Vektor
(senkrecht) auf den durch |ψi definierten Strahl und ist für normierte Vektoren
durch
Pψ = |ψihψ|
(5.8)
gegeben.
Welchen Vektor bzw. Strahl bzw. Projektionsoperator man in einem konkreten
Fall für ein System verwendet, hängt von der Präparation des Systems (und damit
von unserem Vorwissen über das System) ab. Dieser Zusammenhang wird in Postulat
4 geklärt.
5.3
2. Postulat der Quantenmechanik:
Darstellung von Observablen
Eine strenge und allgemeine Definition des Begriffs der Observablen“ ist kaum möglich.
”
Lax ausgedrückt handelt es sich bei einer Observablen um die mathematische Repräsentation von etwas, das man an einem System beobachten kann.
In jedem Fall sollte man den Begriff der Observablen vom Begriff der Messung“
”
unterscheiden: Eine Messung besteht in einem experimentellen Aufbau und einem
experimentellen Protokoll, das angibt, wie das Experiment durchzuführen ist. Meist
wird ein zu beobachtendes System mit einem anderen System (dem Messgerät) in
Kontakt gebracht, sodass man aus der Reaktion des Messgeräts eine Information über
das untersuchte System erhält.
94
Postulate der QM
Ich definiere den Begriff der Observablen folgendermaßen: Eine Observable ist
eine mathematische Beschreibung der möglichen Informationen, die bei einem bestimmten Messprozess gewonnen werden können. Insbesondere beschreibt eine Observable nicht die Dynamik des Messprozesses selbst.
In der klassischen Mechanik gibt die Observable lediglich den Messwert an, den
man bei einer Messung der zugehörigen Messgröße für einen konkreten Zustand erhält
(für einen Zustand (q, p) also die Größe f (q, p)). Sie beinhaltet keine Beschreibung des
Messprotokolls oder des Messprozesses, sondern lediglich die gewonnene Information.
Entsprechend suchen wir nun in der Quantenmechanik nach einer Kodierung der Information, die wir bei der Durchführung einer konkreten Messung über ein System
erhalten bzw. erhalten können.
Die folgenden Erfahrungstatsachen der Quantenmechanik müssen dabei berücksichtigt werden:
1. Die meisten Messungen, die an einem System durchgeführt werden, verändern
den Zustand des Systems.
Dies haben wir schon bei den Polarisationsexperimenten (Kap. 2.2) gesehen. Die
Väter der Quantenmechanik“(Bohr, Heisenberg, etc.) glaubten zunächst, eine
”
richtige Wechselwirkung mit einer Energie- und/oder Impulsübertragung zwischen Messinstrument und Quantensystem sei dafür verantwortlich. Wie schon
die Beispiele mit Photonen und Polarisationsfiltern gezeigt haben, hat jedoch
keine Wechselwirkung in diesem klassischen Sinne zwischen dem Photon und
dem Polarisationsfilter stattgefunden, wenn das Photon den Filter passiert hat.
Trotzdem hat sich der Zustand des Photons verändert. Wir werden auf diesen
Punkt noch eingehen.
2. Werden an zwei identisch präparierten Systemen, also an Systemen im selben
Zustand, dieselben Messungen durchgeführt, erhält man nicht immer dieselben
Messergebnisse.
Auch diesen Sachverhalt haben wir schon bei Photonen und Polarisationsfiltern
beobachten können: Ein Photon, das einen horizontalen Filter (h-Filter) passiert
hat, besitzt eine bestimmte Polarisationseigenschaft, die eindeutig ist und nicht
weiter verfeinert werden kann. (Diesen Punkt müssen wir im Augenblick einfach akzeptieren, wir werden aber darauf zurückkommen.) Trotzdem steht nicht
fest, ob ein solches Photon einen Filter beispielsweise unter 45◦ passiert. Die
Wahrscheinlichkeit dafür ist 50%.
3. Eine Messung zwingt“ ein System in einen möglichen Zustand aus einem Satz
”
von orthogonalen Zuständen (die Schrödinger’sche Prokrustie“).
”
2. Postulat – Darstellung von Observablen
95
Dies ist eine Extrapolation aus unserer Erfahrung mit Polwürfeln. Ein Polwürfel
definiert zwei orthogonale Polarisationsrichtungen. Ein einfallendes Photon wird
in eine dieser beiden Richtungen gezwungen“. Wir können die Polarisations”
richtungen zwar beliebig wählen, aber für eine gegebene Messanordnung liegen
die beiden orthogonalen Möglichkeiten fest.
4. Wurde an einem System eine Messung durchgeführt, und wird dieselbe Messung
unmittelbar danach nochmals durchgeführt, erhält man auch dasselbe Ergebnis
( Kleingedrucktes“ siehe das Folgende).
”
Das Kleingedruckte“ bezieht sich auf den Ausdruck unmittelbar danach“. Be”
”
trachten wir zunächst den einfachen Fall, dass die Eigenschaft, die bei dieser
Messung geprüft wird, eine Erhaltungsgröße ist, sich also durch die Dynamik
des Systems nicht verändert. In diesem Fall bedeutet unmittelbar danach“ le”
diglich, dass zwischen der ersten und der zweiten Messung keine andere Messung
einer anderen Observablen durchgeführt wird. Auch diese Eigenschaft ist uns bei
den Photonen und Polarisationsfiltern schon begegnet: Da die freie Wellenausbreitung die Polarisationseigenschaften von elektromagnetischen Wellen nicht
verändert, können wir beliebig viele Filter mit parallelen Polarisationsachsen
hintereinander stellen. Sofern ein Photon den ersten Filter passiert hat, passiert
es auch alle anderen Filter. Wird aber ein Filter mit einer anderen Polarisationsachse dazwischen geschoben, ist das nicht mehr garantiert.
Der kritische Fall tritt auf, wenn die Dynamik des Systems die gemessene Eigenschaft verändert, wenn sich also diese Eigenschaft schon durch die reine Zeitentwicklung des Systems verändert. In diesem Fall bedeutet unmittelbar danach“,
”
dass die Messung innerhalb eines Zeitfensters ∆t ein zweites Mal durchgeführt
wird, wobei ∆t so klein sein soll, dass die Dynamik auf die geprüfte Eigenschaft noch keinen nennenswerten Einfluss hat (und nennenswert“ im Sinne
”
einer angestrebten Messgenauigkeit zu verstehen ist). Da aber Messungen selbst
Zeit in Anspruch nehmen (wir werden später sehen, dass eine Energiemessung
in Abhängigkeit von der angestrebten Genauigkeit einer Unschärferelation unterliegt, die eine untere Grenze an die Zeitdauer einer solche Messung setzt),
und andererseits sich manche Eigenschaften aufgrund der Dynamik sehr rasch
verändern können, handelt es sich bei dieser Aussage um eine Extrapolation, die
aus den Fällen gewonnen wurde, an denen eine Überprüfung möglich ist. Bisher
gibt es jedoch keinen Grund, an der Richtigkeit dieses Sachverhalts zu zweifeln.
Aus dem Gesagten können wir eine Wunschliste“ zusammenstellen, die wir an
”
die mathematische Darstellung einer Observablen stellen wollen bzw. stellen können.
1. Die mathematische Repräsentation einer Observablen sollte die Information enthalten, welche möglichen Messwerte man überhaupt bei einer Messung erhalten
96
Postulate der QM
kann.
2. Die mathematische Repräsentation einer Observablen sollte die Information enthalten, in welchem Zustand sich ein System befindet, nachdem ein bestimmter
Messwert gemessen wurde. Dieser Zustand sollte die Eigenschaft haben, durch
eine weitere Messung derselben Observablen nicht mehr verändert zu werden.
3. Die Observable sollte uns zumindest erlauben zu berechnen, mit welcher Wahrscheinlichkeit wir bei einer Messung an einem bestimmten Zustand einen bestimmten Messwert erhalten.
4. Wir sollten zumindest für die aus der klassischen Physik bekannten Observablen
(Ort, Impuls, Energie, Drehimpuls, ...) wissen, durch welche mathematische Objekte sie repräsentiert werden. Diese Forderung setzt voraus, dass die klassischen
Observablen in der Quantentheorie in einem zu beschreibenden Sinne ihre Bedeutung behalten.
Wir werden nun das Postulat angeben, das die Darstellung der Observablen in der
Quantenmechanik festlegt. Die einzelnen oben angesprochenen Punkte (welche Messwerte möglich sind, welcher Zustand nach einer Messung vorliegt, etc.) werden von
den späteren Postulaten geklärt.
Postulat 2: Eine Observable wird in der Quantenmechanik durch einen selbst-adjungierten Operator dargestellt. Soweit möglich, sollen die klassischen Beziehungen zwischen Observablen, wie sie durch die Poisson-Klammer gegeben sind, in der Quantenmechanik erhalten bleiben, wobei die Poisson-Klammer {·, ·} durch den Kommutator
i~[·, ·] zu ersetzen ist. Insbesondere sollen für die Ortsoperatoren Qi und die Impulsoperatoren Pi (der Index bezieht sich auf die drei Komponenten zu einem Teilchen)
die sogenannten kanonischen Vertauschungsrelationen gelten
[Qi , Pj ] = i~ 1 δij ,
[Qi , Qj ] = 0 ,
[Pi , Pj ] = 0 .
(5.9)
(5.10)
Zu diesem Postulat gibt es zunächst einige Anmerkungen:
1. Die Forderung, dass die klassischen Poisson-Klammern in Kommutatorbeziehungen übergehen sollen, impliziert, dass eine klassische Observable f (q, p) (als
Funktion auf dem Phasenraum) im Wesentlichen durch einen Operator F (Q, P )
repäsentiert wird, dessen funktionale Abhängigkeit von den Operatoren Q und P
dieselbe ist, wie die klassische Abhängigkeit von f als Funktion von q und p. Im
”
2. Postulat – Darstellung von Observablen
97
Wesentlichen“ deutet eine Einschränkung an, die mit der Reihenfolge von Operatoren zusammenhängt und im nächsten Punkt erläutert wird. Insbesondere ist
also der Energieoperator durch
H=
1 2
P + V (Q)
2m
(5.11)
gegeben, und die Komponenten des Drehimpulsoperators durch
L1 = Q2 P3 − Q3 P2 , L2 = Q3 P1 − Q1 P3 , L3 = Q1 P2 − Q2 P1 .
(5.12)
Man überzeugt sich leicht, dass es hier keine Probleme mit der Reihenfolge der
Operatoren gibt.
2. Seltsam für ein Postulat erscheint der Ausdruck soweit möglich“. Es wird ge”
fordert, dass die Beziehung zwischen den Poisson-Klammern und den Observablen für die Orts- und Impulsoperatoren erfüllt ist. Man kann sich leicht
überzeugen, dass sie dann auch für die Kommutatoren mit den Energieoperatoren für die bekanntesten Systeme und die Drehimpulsoperatoren gelten.
Man kann jedoch zeigen (dies ist der Inhalt des sogenannten Groenewald-van
Hove-Theorems; siehe z.B. [37]), dass dieses Verfahren nicht streng durchgehalten werden kann. Das Problem ist, dass beispielsweise klassische Observable der
Form q 2 p2 nicht einfach durch Q2 P 2 ersetzt werden können, dieses Produkt wäre
nämlich nicht selbst-adjungiert. Es gibt jedoch mehrere (klassisch äquivalente)
selbst-adjungierte Ersetzungsmöglichkeiten: 21 (Q2 P 2 + P 2 Q2 ), QP 2 Q, P Q2 P ,
1
(Q2 P 2 + QP QP + QP 2 Q + P QP Q + P 2 Q2 + P Q2 P ) etc. Da Q und P nicht
6
kommutieren, handelt es sich um verschiedene Operatoren. Durch welchen soll
also die klassische Funktion q 2 p2 ersetzt werden? Es zeigt sich, dass keine Ersetzungsvorschrift beliebiger klassischer Polynome in q und p durch Polynome in Q
und P zu einer exakten Übertragung von Poisson-Klammern in KommutatorKlammern führt. Die Unterschiede sind zwar immer proportional zu ~ oder gar ~2
und damit quantenmechanischer Natur“, aber sie bringen eine Mehrdeutigkeit
”
ins Spiel, die sich grundsätzlich nicht vermeiden lässt.
3. Weshalb sollte man überhaupt fordern, dass die klassische Poisson-Klammer etwas mit dem Kommutator zu tun hat? Heisenberg hatte zunächst die Kommutatorrelationen für den Ort- und Impulsoperator aus semi-empirischen Überlegungen gewonnen. Später erkannte Dirac, dass es sich hierbei um die Ersetzung
der klassischen Poisson-Klammern durch Kommutatorrelationen handelt. Einer
der Gründe für die Ersetzung ist, dass unter diesen Umständen ein Korrespondenzprinzip gilt, d.h., bis auf Korrekturen von ~ erfüllen die Erwartungswerte
quantenmechanischer Observablen die klassischen Bewegungsgleichungen. Damit
98
Postulate der QM
ist garantiert, dass in einem klassischen Grenzfall (wenn die relevanten Wirkungen sehr groß im Vergleich zur Planck’schen Konstante sind) die so konstruierte
Quantenmechanik wieder in die klassische Mechanik übergeht. Wie dieser klassische Grenzfall aussieht, werden wir noch sehen.
4. Abgesehen vom ersten Satz (Observable werden durch selbst-adjungierte Operatoren dargestellt) macht dieses Axiom keine Aussage über die Darstellung von
Observablen, die es in der klassischen Physik gar nicht gibt, beispielsweise Observable zum Spin. Offenbar sind mit dem Spin eines Teilchens beobachtbare
Größen verbunden, sodass auch diese durch selbst-adjungierte Operatoren repräsentiert werden. Die genaue Form dieser Repräsentation werden wir in Kap.
9 noch sehen.
5. In der klassischen Physik können wir praktisch jede Funktion f (q, p) auf dem
Phasenraum als Observable definieren und wir können auch angeben, wie man
diese Observable messen kann: Man messe die Orte q und die Impulse p und
bilde dann aus den Messdaten die Funktion f (q, p).
In der Quantenmechanik sind mit der Definition der Observablen einige Probleme
verbunden. Zunächst kann man, wie wir noch sehen werden, den Ort und den
Impuls eines quantenmechanischen Systems nicht gleichzeitig messen. Das gilt
ganz allgemein für zwei Observable, die nicht miteinander kommutieren. Das
bedeutet aber auch, dass wir die Observable zu einem Operator F (Q, P ) nicht
dadurch messen können, dass wir eine Orts- und Impulsmessung vornehmen und
dann die Funktion der Messwerte bilden.
In der Quantenmechanik hat jede Observable eine ihr eigene Messvorschrift. Wir
bestimmen die Energie H(Q, P ) nicht durch Q- und P -Messungen, sondern beispielsweise über die Beobachtung von Spektrallinien etc. Damit verbunden sind
zwei Schwierigkeiten: (1) Für eine Observable F (Q, P ) in der Quantenmechanik
ist im Allgemeinen nicht bekannt, wie die zugehörige Messgröße bestimmt werden kann. Es wird zwar behauptet, dass sie messbar ist, der Formalismus macht
aber keine Aussagen darüber, wie eine solche Messanordnung und ein Messprotokoll aussehen. (2) Eng damit verbunden ist die Frage, ob tatsächlich jeder
selbst-adjungierte Operator F (Q, P ) einer Observablen entspricht. Dieses Postulat stammt von Dirac und gehörte nicht zur ursprünglichen Formulierung der
Quantenmechanik. Allgemein gilt es immer noch als umstritten und in bestimmten Fällen sind sogar Einschränkungen bekannt (beispielsweise, wenn sogenannte
Superauswahlregeln existieren).
5.4. 3. POSTULAT DER QUANTENMECHANIK:MESSWERTE UND ERWARTUNGSWERTE99
5.4
3. Postulat der Quantenmechanik:
Messwerte und Erwartungswerte
Bisher haben wir festgelegt, durch welche mathematischen Objekte quantenmechanische Zustände und quantenmechanische Observable dargestellt werden. Nun müssen
wir angeben, was man bei einer Messung einer bestimmten Observablen an einem
System in einem bestimmten quantenmechanischen Zustand zu erwarten hat.
Postulat 3: (a) Die möglichen Messwerte {λi } einer Observablen sind die Eigenwerte
(genauer das Spektrum, siehe S. 73) des selbst-adjungierten Operators A, der diese
Observable darstellt.
(b) Die Wahrscheinlichkeit wψ (λi ), mit der ein bestimmter Eigenwert λi einer Observablen A in einem Zustand ψ (dargestellt durch einen normierten Vektor |ψi) gemessen
wird, ist gleich
wψ (λi ) = hψ|Pλi |ψi ,
(5.13)
wobei Pλi der Projektionsoperator auf den Eigenraum von A zum Eigenwert λi ist. Ist
der Eigenwert λi nicht entartet und |λi i der zugehörige Eigenvektor, ist diese Wahrscheinlichkeit durch |hλi |ψi|2 gegeben.
Auch zu diesem Postulat sind mehrere Anmerkungen angebracht:
1. Der erste Teil des Postulats (a) macht eine Aussage zu den möglichen Messwerten, d.h., den Zahlen, die konkret bei einer einzelnen Messung (egal an welchem
System, sofern die Messung überhaupt sinnvoll ist) zu erwarten sind. Eine Einzelmessung liefert als Ergebnis somit immer einen der Eigenwerte des zugehörigen
Operators. Ob eine Messung sinnvoll ist, hängt von dem System ab, nicht von
dem Zustand, in dem sich das System befindet. Es wird also nie passieren, dass
beispielsweise die Messung eines Orts für ein Teilchen kein Ergebnis liefert, selbst
wenn für den Quantenzustand der Ort nicht eindeutig gegeben ist.
2. Wie schon erwähnt, haben selbst-adjungierte Operatoren immer ein reelles Spektrum, d.h., die möglichen Messwerte sind reell.
3. Der zweite Teil des Postulats (b) ist die Born’sche Regel. An dieser Stelle kommt
die Interpretation bestimmter mathematischer Größen im Sinne von Wahrscheinlichkeiten in die Quantenmechanik. Die Quantenmechanik kann eigentlich nur
Vorhersagen zu diesen Wahrscheinlichkeiten machen, und diese lassen sich (sofern es sich nicht um 100%-Aussagen handelt) nur durch wiederholte Messungen
an sehr vielen (gleichartig) im Zustand |ψi präparierten Systemen (für jedes
System nur eine Messung) überprüfen.
100
Postulate der QM
4. Ist |ψi (oder entsprechend auch |λi i) kein normierter Eigenvektor, muss durch
die Norm dividiert werden, d.h., es gilt:
wψ (λi ) =
|hλi |ψi|2
.
hλi |λi ihψ|ψi
(5.14)
Dadurch ist diese Wahrscheinlichkeit auf den Strahlen zu einem Vektor definiert
und hängt nicht mehr von der konkreten Wahl des Repräsentaten des Strahls ab.
Man kann sich davon leicht überzeugen, indem man |ψi und |λi i mit beliebigen
komplexen Zahlen multipliziert und zeigt, dass die Wahrscheinlichkeit nicht von
diesen Zahlen abhängt. Es handelt sich also um eine Wahrscheinlichkeit, die auf
den linearen Unterräumen des Hilbertraums definiert ist.
Man beachte auch, dass diese Wahrscheinlichkeit in den beiden Zuständen symmetrisch ist:
wψ (λi ) = |hλi |ψi|2 = wλi (ψ) .
(5.15)
Auch wenn diese Bedingung unmittelbar aus den Postulaten folgt, ist sie physikalisch nicht ganz selbstverständlich: Weshalb sollte die durch eine Messung
bewirkte Übergangswahrscheinlichkeit |ha|bi|2 von einem Zustand |ai in einem
Zustand |bi dieselbe sein, wie umgekehrt von |bi nach |ai. Bei den beiden Prozessen handelt es sich um unterschiedliche Messungen, und die Systeme wurden
in verschiedenen Zuständen präpariert. Damit zusammenhängend ist auch, dass
die Wahrscheinlichkeit gar nicht von den Observablen selbst abhängt, sondern
nur von den beiden Zuständen.
5. Angenommen, |ψi sei schon einer der Eigenzustände des Operators, beispielsweise zum Eigenwert λk (für den Augenblick sei dieser nicht entartet). Dann
gilt |hλi |λk i|2 = δik . D.h., die Wahrscheinlichkeit, im Zustand |λk i den Eigenwert λk zu messen, ist 1 und die Wahrscheinlichkeit einen anderen Eigenwert zu
messen ist 0. In diesem Fall (und nur in diesem Fall) ist der Zustand bezüglich
einer Messung der Observablen A dispersionsfrei (man sagt auch nicht dispersiv),
d.h., er zeigt keine Streuung in den Messwerten bei wiederholten Messungen. Das
zeigt gleichzeitig, dass jeder Eigenwert von A unter geeigneten Umständen auch
tatsächlich als Messwert auftritt (sofern man den zugehörigen Eigenvektor als
Zustand präparieren kann).
6. Aus dem Postulat kann man ableiten, dass der Ausdruck hψ|A|ψi gleich dem
Erwartungswert für die Messergebnisse von A an Systemen im Zustand |ψi ist.
Aus der Spektraldarstellung von A
A=
X
i
λ i Pλ i
(5.16)
3. Postulat – Messwerte und Erwartungswerte
101
folgt nämlich:
hψ|A|ψi =
X
λi hψ|Pλi |ψi =
i
X
λi wψ (λi ) .
(5.17)
i
Dieser Ausdruck ist aber gerade die Definition des Erwartungswerts für Messungen mit möglichen Messwerten {λi } und zugehörigen Wahrscheinlichkeiten
wψ (λi ).
7. Wir können in Gleichung 5.13 noch einen Schritt weitergehen und auch den
Zustand ψ durch seinen Projektionsoperator ausdrücken:
wψ (λi ) = Spur Pλi Pψ
(5.18)
Auf diese Weise erhalten wir eine alternative Darstellung für den Erwartungswert
von einer Observablen A im Zustand ψ:
X
(5.19)
hψ|A|ψi = Spur APψ =
λi Spur Pλi Pψ .
i
Das Postulat 3, insbesondere der zweite Teil (b), also die Born’sche Regel, gehört
zu den umstrittendsten Aspekten der Quantentheorie. Dabei geht es weniger darum,
dass dieses Postulat nicht anerkannt wird, als darum, in welchem Sinne hier Wahrscheinlichkeit zu verstehen ist. In der klassischen Physik bringen wir das Konzept
der Wahrscheinlichkeit immer dann ins Spiel, wenn gewisse Dinge nicht bekannt oder
irrelevant sind. Es wird angenommen, dass man im Prinzip zu einer eindeutigen Aussage gelangen könnte, sofern die Einzelheiten in Bezug auf die betreffende Situation
hinreichend bekannt wären (dies bezeichnet man auch als das Prinzip des hinreichenden Grundes von Leibniz), dass aber aus praktischen Gründen diese Einzelheiten nicht
berücksichtigt werden oder werden können und daher nur Wahrscheinlichkeitsaussagen
getroffen werden.
Im herkömmlichen quantenmechanischen Formalismus handelt es sich bei dieser
Wahrscheinlichkeit um eine intrinsische oder inhärente Wahrscheinlichkeit (manchmal
spricht man auch von einer objektiven Wahrscheinlichkeit oder einer ontologischen
Wahrscheinlichkeit). Es ist nicht Unkenntnis auf Seiten des Physikers, die diese Wahrscheinlichkeitsaussagen erzwingen, sondern die Quantentheorie ist eine intrinsisch indeterministische Theorie. Es gibt keine Möglichkeit, das Ergebnis einer konkreten Messung an einem konkreten Zustand (sofern es sich nicht um einen Eigenzustand handelt) vorherzusagen. Oft wurde versucht, diesen Aspekt der Quantenmechanik durch
Einführung sogenannter verborgener Variable — also Variable, die wir bisher nicht beobachten können und die in der Quantenmechanik auch nicht berücksichtigt werden —
auf eine klassische Statistik“ zurückzuführen. Allerdings kann man für solche Modelle
”
sehr restriktive Einschränkungen beweisen (siehe Kap. 8.4 und 8.4.2).
102
Postulate der QM
Es ist auch dieses Postulat, dass die Quantenmechanik zu einer nicht-deterministischen Theorie macht. Im Allgemeinen kann das Ergebnis einer Einzelmessung
prinzipiell nicht vorhergesagt werden, ist also indeterminiert.
5.5
4. Postulat der Quantenmechanik:
Die Reduktion des Quantenzustands
Das vierte Postulat legt fest, durch welchem Zustand ein quantenmechanisches System
nach einer Messung zu beschreiben ist.
Postulat 4: Wurde an einem quantenmechanischen System im Zustand |ψi eine Messung einer Observablen A durchgeführt und ergab diese Messung den Messwert λi , so
befindet sich das System nach der Messung in dem quantenmechanischen Zustand
|λi i =
Pλi |ψi
.
kPλi |ψik
(5.20)
Anmerkungen:
1. Der im ersten Augenblick kompliziert erscheinende Ausdruck mit dem Projektionsoperator Pλi ist nur relevant, wenn λi entartet ist. Dann entspricht der Zustand nach der Messung nämlich der orthogonalen Projektion des ursprünglichen
Zustands |ψi auf den Eigenraum zu λi . Ist λi nicht entartet, können wir vereinfacht sagen: Nach einer Messung, die den Messwert λi geliefert hat, ordnen wir
dem System den Eigenzustand |λi i zu.
2. Dieses Postulat ist gleichzeitig eine Anweisung, wie ein konkreter Quantenzustand zu präparieren ist. Bisher wurde zwar vorausgesetzt, dass es bestimmte Quantenzustände gibt und wie wir daran Messungen vornehmen können,
es wurde aber noch nicht geklärt, wie man einen bestimmten Quantenzustand
tatsächlich realisiert, bzw. woher man weiß, in welchem Quantenzustand sich ein
System befindet.
Um einem Quantensystem einen bestimmten Zustand (als Strahl in einem Hilbertraum) zuweisen zu können, müssen wir die Vergangenheit des Systems betrachten (also welche Messungen an dem System zuletzt durchgeführt wurden
und welche Messergebnisse dabei aufgetreten sind). Daraus lässt sich der Zustand
des Systems erschließen.
3. Das Postulat beschreibt einen Teil der Dynamik eines Quantenzustands, d.h.,
es besagt, wie sich ein Quantenzustand unter einer Messung verändert. Diese
5. Postulat – Dynamik abgeschlossener Systeme
103
Dynamik ist statistisch: Da wir nur Wahrscheinlichkeitsaussagen darüber treffen
können, welcher Eigenwert eines Operators bei einer Messung tatsächlich gemessen wird, können wir auch nur eine Wahrscheinlichkeitsaussage darüber treffen,
durch welchen Zustand das System nach einer Messung zu beschreiben sein wird.
Man bezeichnet die Aussage dieses Postulats auch schon mal als Kollaps der Wellenfunktion oder Reduktion des Quantenzustands.
5.6
5. Postulat der Quantenmechanik:
Die Dynamik abgeschlossener Systeme
Dieses Postulat beschreibt die Dynamik eines abgeschlossenen Quantensystems, d.h.,
eines Quantensystems, das nicht mit der Umgebung (oder einem Messgerät) in Wechselwirkung steht.
Postulat 5: Die zeitliche Entwicklung eines reinen Zustands eines abgeschlossenen quantenmechanischen Systems folgt der zeitabhängigen Schrödinger-Gleichung:
d|ψ(t)i
= H|ψ(t)i ,
dt
wobei H der Hamilton-Operator des Systems ist.
i~
(5.21)
Auch wenn sich die Schrödinger-Gleichung nicht beweisen lässt, können wir
sie im Rahmen des hier vorgestellten Formalismus zumindest plausibel machen: Wenn
normierte Zustände unter der Zeitentwicklung wieder in normierte Zustände übergehen
sollen, also
hψ(t)|ψ(t)i = hψ(0)|ψ(0)i ,
(5.22)
und die Zeitentwicklung außerdem die lineare Struktur der Zustände erhalten soll (also
eine lineare Abbildung ist), muss sie durch eine unitäre Transformation beschrieben
werden (vgl. Abschnitt 4.2.5):
|ψ(t)i = U (t)|ψ(0)i .
(5.23)
Für diesen Zeitentwicklungsoperator sollte die Halbgruppeneigenschaft gelten:
U (t2 )U (t1 ) = U (t1 + t2 ) ,
(5.24)
denn die Zeitentwicklung zunächst um t1 und anschließend nochmals um t2 sollte der
Zeitentwicklung um t1 + t2 entsprechen. (Hier nehme ich eine allgemeine Zeittranslationsinvarianz an, aber die Gleichung gilt auch allgemeiner.) Verlangen wir zusätzlich
noch eine Stetigkeit in t, gibt es zu dieser Gleichung nur die Lösung
U (t) = e−iΩt ,
(5.25)
104
Postulate der QM
mit einem geeigneten (selbst-adjungierten) Operator Ω. Damit folgt für |ψ(t)i eine
Differentialgleichung der Form
d
|ψ(t)i = Ω|ψ(t)i .
(5.26)
dt
Bleibt noch zu klären, weshalb H = ~Ω der Energieoperator sein soll. Dazu gibt es
mehrere Begründungen:
i
- Auch in der klassischen Physik lässt sich die Energie (als Funktion von q und p)
bzw. die Hamilton-Funktion als Generator von Zeittranslationen interpretieren.
Manchmal wird Energie sogar auf diese Weise definiert. Daher liegt es nahe,
auch in der Quantentheorie den Generator der Zeittranslation als Energie zu
bezeichnen.
- Der Operator Ω entspricht der Observable möglicher Frequenzmessungen. Ein
Eigenzustand von Ω mit Eigenwert ω hat die Zeitabhängigkeit e−iωt . Nach der
Beziehung von deBroglie stehen die Energie E und die Frequenzen aber gerade
über E = ~ω in Beziehung.
- Es zeigt sich, dass bei der Interpretation von H als Energieoperator die Quantenmechanik im Grenzfall makroskopischer Systeme in die klassische Physik
übergeht (siehe Anmerkung 4).
Anmerkungen:
1. Die Schrödinger-Gleichung ist eine lineare Differentialgleichung für die Zustandsvektoren. Das impliziert Zweierlei: (1) Mit jeder Lösung |ψ(t)i ist auch ein Vielfaches α|ψ(t)i eine Lösung, d.h., es handelt sich um eine Differentialgleichung
für die Strahlen im Hilbertraum, also die eigentlichen physikalischen Zustände;
(2) Mit je zwei Lösungen |ψ1 (t)i und |ψ2 (t)i ist auch eine beliebige Superposition
|ψ(t)i = α|ψ1 (t)i + β|ψ2 (t)i
(5.27)
eine Lösung der Schrödinger-Gleichung und repräsentiert (eventuell nach geeigneter Normierung) einen physikalischen Zustand.
Historisch war die Entwicklung eher umgekehrt: Als man erkannte, dass die
Schrödinger-Gleichung eine lineare Gleichung ist und für die Lösungen ein Superpositionsprinzip gilt, entstand die Vorstellung, dass sich quantenmechanische
Zustände als Elemente eines Vektorraums darstellen lassen.
2. Der unitäre Zeitentwicklungsoperator U (t) erfüllt selbst eine Schrödinger-Gleichung:
dU (t)
= HU (t) .
(5.28)
i~
dt
6. Postulat – Mehrteilchensysteme
105
Zusammen mit der Anfangsbedingung“ U (0) = 1 kann man so den Zeitentwick”
lungsoperator bestimmen (siehe Abschnitt 7.1).
3. Die Schrödinger-Gleichung beschreibt eine Zeitabhängigkeit der Zustandsvektoren. Dies bezeichnet man auch als Schrödinger-Bild der Quantenmechanik. Bilden wir den Erwartungswert einer Observablen A im Zustand |ψ(t)i (d.h., wir
verfolgen den Erwartungswert als Funktion der Zeit), so gilt
hA(t)iψ = hψ(t)|A|ψ(t)i = hψ(0)|U (t)† AU (t)|ψ(0)i .
(5.29)
Da letztendlich nur Erwartungswerte dieser Art einer Messung zugänglich sind,
kann man statt einer Zeitentwicklung der Zustände äquivalent auch eine Zeitentwicklung der Observablen definieren. Eine solche zeitabhängige Observable hat
die Form:
A(t) = U (t)† AU (t)
(5.30)
Für die Erwartungswerte hat es keine Auswirkungen, ob man mit zeitabhängigen
Zuständen und zeitunabhängigen Observablen oder aber mit zeitabhängigen Observablen und zeitunabhängigen Zuständen rechnet. Mathematisch steckt dahinter lediglich die Äquivalenz zwischen passiver und aktiver Koordinantentrans”
formation“. Betrachtet man zeitabhängige Observable, so spricht man auch vom
Heisenberg-Bild der Quantenmechanik. Wir werden in Abschnitt 7.3 etwas intensiver auf das Heisenberg-Bild eingehen.
4. Bilden wir die Ableitung von zeitabhängigen Erwartungswerten (egal, ob im
Heisenberg-Bild oder im Schrödinger-Bild), folgt (unter Verwendung von Gl.
5.28 und Gl. 5.29):
i
dhA(t)iψ
= − h[A(t), H]iψ .
(5.31)
dt
~
Entsprechend unseres 1. Postulats, wonach die klassische Poisson-Klammer in der
Quantenmechanik durch den Kommutator (multipliziert mit i/~) zu ersetzen ist,
erfüllen die Erwartungswerte von Observablen dieselben Differentialgleichungen
wie in der klassischen Mechanik. Dies ist eine Form des Korrespondenzprinzips.
Falls also der Zustand ψ(t) einen klassischen Grenzfall zulässt, garantiert die Interpretation von H als Energieoperator einen nahtlosen Übergang zur klassischen
Physik.
5.7
6. Postulat der Quantenmechanik:
Mehrteilchensysteme
Das letzte Postulat bezieht sich auf Mehrteilchensysteme. Es ist an dieser Stelle der
Vollständigkeit halber gesondert angeführt und sollte streng genommen Teil des ersten
106
Postulate der QM
Axioms sein. Wir werden auf Mehrteilchensysteme in Kap. 8 genauer eingehen.
Postulat 6: Setzt sich ein Gesamtsystem aus mehreren Teilsystemen zusammen, deren
Zustände und Observablen in Hilberträumen Hi beschrieben werden, dann ist der
Hilbertraum des Gesamtsystems das Tensorprodukt der Einzelhilberträume:
Hges = ⊗i Hi = H1 ⊗ H2 ⊗ ... .
(5.32)
Handelt es sich um ununterscheidbare (identische) Teilsysteme, die entweder zur Klasse der bosonischen Teilchen (ganzzahligen Spin) oder zur Klasse der fermionischen
Teilchen (halbzahligen Spin) gehören, so ist bei bosonischen Teilsystemen ein Zustand
immer zu symmetrisieren, bei fermionischen Teilsystemen ist immer der antisymmetrische Zustand zu bilden. Daher ist bei solchen Systemen nur der total antisymmetrisierte (bzw. symmetrisierte) Unterraum von Hges der Unterraum der physikalischen
Zustände.
5.8
Die Unschärferelationen
Es wurde bereits mehrfach erwähnt, dass sich zwei Observable, die nicht miteinander
kommutieren, nicht gleichzeitig messen lassen. Dieser Abschnitt erläutert, was diese
Aussage genau bedeutet. Die Begriffe Unschärferelation“ und Unbestimmtheitsrela”
”
tion“ verwende ich in derselben Bedeutung.
Wir tragen zunächst ein paar Tatsachen zusammen, die mit der gleichzeitigen
Messbarkeit von Observablen zu tun haben:
1. Im letzten Kapitel (Abschnitt 4.2.3 auf S. 76) haben wir bewiesen, dass zwei
selbstadjungierte Operatoren genau dann miteinander kommutieren, wenn sie
einen gemeinsamen Satz von Eigenvektoren haben.
2. Weiterhin haben wir gesehen, dass eine Observable in einem Zustand nur dann
dispersionsfrei ist, also immer denselben Messwert liefert, wenn es sich bei diesem
Zustand um einen Eigenzustand des zugehörigen selbstadjungierten Operators
handelt.
3. Das 4. Postulat der Quantenmechanik (Kollapspostulat) besagte, dass einem System nach einer Messung der Observablen A mit dem registrierten Messergebnis
λ der zugehörigen Eigenzustand |λi zuzuschreiben ist.
Diese Aussagen wollen wir nun verwenden, um folgende Eigenschaft quantenmechanischer Systeme zu beweisen:
Satz: Wenn zwei Observable A und B miteinander kommutieren, dann lassen sich einem physikalischen System bezüglich beider Observable scharfe Messwerte (und damit
Unschärferelationen
107
die entsprechenden Eigenschaften) zuschreiben. Kommutieren zwei Observable A und
B nicht, dann findet man (im Allgemeinen, s.u.) keine Zustände, in denen beide Observable scharfe Werte haben: Es gilt eine Unschärferelation zwischen den Varianzen der
zugehörigen Observablen, und die Messung einer Observablen zerstört einen eventuell
vorhandenen dispersionsfreien Zustand der anderen Observablen.
Beginnen wir mit dem ersten Teil der Aussage: Angenommen A und B kommutieren, dann folgt nach (1.), dass es einen gemeinsamen Satz von Eigenvektoren gibt,
sodass nach (2.) beide Observable in einem solchen Zustand dispersionsfrei sind, also
definitive Messwerte liefern. Gleichgültig, wie oft wir die eine oder andere Observable messen, nach (3.) ändert sich der Zustand dabei nicht und wir erhalten für beide
Observable jeweils immer dieselben Messwerte. In diesem Sinne sind beide Observable
gleichzeitig messbar und einem System lassen sich zu beiden Observablen wohldefinierte Messwerte zuschreiben. Dies können wir auch dadurch ausdrücken, dass wir dem
System beide Eigenschaften zuschreiben.
Nun nehmen wir an, die beiden Observablen A und B kommutieren nicht. Etwas verschärft fordern wir zunächst, dass es auch keinen Vektor gibt, der gleichzeitig
Eigenvektor von A und von B ist. Angenommen, wir haben Systeme in einem Eigenzustand von A präpariert, dann folgt nach (2.), da dieser Zustand nicht gleichzeitig
Eigenzustand von B ist, dass B in diesem Zustand nicht dispersionsfrei ist (also nicht
immer denselben Messwert liefert), und nach (3.), dass nach einer Messung von B
der Eigenzustand von A nicht mehr vorliegt sondern nun ein Eigenzustand von B
vorliegt. Dieselben Eigenschaften gelten auch umgekehrt, wenn wir ein System im Eigenzustand von B präpariert haben. In dem angegebenen Fall können wir also dem
System nicht sowohl bezüglich A als auch B scharfe Werte zuschreiben, und da die
Eigenvektoren verschieden sind, wird eine Messung der einen Observablen immer den
Eigenzustand der anderen zerstören“. In diesem Sinne können wir die beide Observa”
blen nicht gleichzeitig messen und damit einem System nicht gleichzeitig wohldefinierte
Messwerte bezüglich beider Observablen zuschreiben.
Es kann vorkommen, dass zwei Observable A und B zwar nicht allgemein kommutieren, dass es aber spezielle Zustände gibt, die sowohl Eigenzustände von A als
auch von B sind. (Das passiert beispielsweise bei Drehimpulsoperatoren zu verschiedenen Komponenten des Drehimpulses im Drehimpulszustand l = 0; siehe Anhang
A3.) In diesem Fall kann man beide Operatoren gleichzeitig messen (falls sich das
System in dem entsprechenden Zustand befindet) und man kann dem System scharfe
Werte für beide Observablen zuschreiben. Der Grund ist, dass die beiden Observablen,
angewandt auf diesen speziellen Zustand, kommutieren oder anders ausgedrückt: Der
Kommutator der beiden Observablen verschwindet auf diesem speziellen Zustand.
Diese letztere Eigenschaft kann bei den Orts- und Impulsoperatoren nicht vorkommen. Der Kommutator [Q, P ] = i~ ist proportional zur Identiätsmatrix und ver-
108
Postulate der QM
schwindet daher auf keinem Zustand im Hilbertraum. Also gibt es auch keinen Zustand, in dem P und Q gleichzeitig scharfe Werte annehmen oder in dem man P und
Q gleichzeitig messen“ kann. In gewisser Hinsicht kann man sogar sagen, dass P und
”
Q maximal inkombatibel sind. Niels Bohr hat für diesen Fall den (eher philosophisch
geprägten) Begriff der Komplementarität eingeführt.
Der Begriff der Komplementarität spielte für Niels Bohr in seinem Verständnis der Quantenmechanik eine sehr wichtige Rolle. Für ihn handelte es sich dabei um ein Grundprinzip der Natur,
das nicht nur in der Quantentheorie Anwendung findet. Ursprünglich geht der Begriff der Komplementarität auf den Psychologen William James (1842–1910) zurück [44], der in der Psychologie als
Beispiel die Konzepte Glauben“ und Wissen“ anführt.
”
”
Heute hat dieser Begriff an Bedeutung verloren, unter anderem auch, weil er mathematisch
sehr schlecht definierbar ist. Ganz schwach formuliert könnte man zwei Observable als komplementär
bezeichnen, wenn sie nicht miteinander kommutieren, sehr stark ausgedrückt sind zwei Observable
komplementär, wenn sie die kanonischen Vertauschungsregeln erfüllen.
Früher sprach man auch oft von einer Komplementarität zwischen dem Wellenbild und dem
Teilchenbild der Quantenmechanik (eine andere Bezeichnung war der Welle-Teilchen-Dualismus). Man
kann diesen Komplementaritätsbegriff mit der Komplementarität von Ort und Impuls zusammenbringen: Ist eine Wellenfunktion räumlich sehr schaft konzentriert, vermittelt sie eher den Charakter eines
Teilchens: Der Ort ist scharf, aber die Wellenlänge der Wellenfunktion hat eine große Unschärfe und
der Wellencharakter ist nicht sehr ausgeprägt. Ist umgekehrt die Welle durch eine mehr oder weniger
wohldefinierte Wellenlänge beschreibbar, ist der Impuls nahezu scharf, aber die räumliche Verteilung
sehr verschmiert.
Zum Abschluss wollen wir noch die Unschärferelation für zwei nicht-kommutierende Operatoren ableiten. Dafür geben wir gleich zwei Beweise: Es folgt zunächst
ein algebraischer Beweis, der allgemein die Varianzen zweier Operatoren durch ihren
Kommutator ausdrückt, anschließend verwenden wir die Eigenschaften der FourierTransformation, um konkret eine Unschärferelation zwischen dem Ort und der Wellenzahl abzuleiten. Diese Unschärferelation hat zunächst nichts mit der Quantenmechanik
zu tun, sondern ist eine allgemeine Eigenschaft von Funktionen.
Gegeben seinen zwei selbstadjungierte Operatoren A und B. Für einen gegebenen Zustand |ψi definieren wir die Operatoren
∆A = A − hAi
und
∆B = B − hBi ,
(5.33)
wobei hAi = hψ|A|ψi und hBi = hψ|B|ψi bezeichnen. Mit den Definitionen |ai =
∆A|ψi und |bi = ∆B|ψi folgt:
ha|ai = h∆A2 i und hb|bi = h∆B 2 i .
(5.34)
Allgemein gilt nach der Ungleichung von Cauchy und Schwarz:
ha|aihb|bi ≥ |ha|bi|2 .
(5.35)
Unschärferelationen
109
Da das Absolutquadrat einer Zahl immer größer ist als das Quadrat des Imaginärteils,
folgt weiterhin:
2
1
2
(ha|bi − hb|ai) .
(5.36)
|ha|bi| ≥
2i
(Man beachte, dass der Ausdruck in der Klammer auf der rechten Seite immer reell
ist.) Für die rechte Seite rechnet man leicht nach, dass
ha|bi − hb|ai = hABi − hBAi = hψ|[A, B]|ψi
(5.37)
und somit insgesamt:
2
2
h∆A ih∆B i ≥
2
1
hψ|[A, B]|ψi .
2i
(5.38)
Wir sehen also, dass das Produkt der Varianzen von zwei Operatoren in einem Zustand |ψi immer nach unten beschränkt ist durch das Quadrat des Erwartungswerts
des Kommutators dieser beiden Operatoren in demselben Zustand. Definieren wir insp
p
besondere für den Ort und den Impuls ∆x = h∆Q2 i und ∆p = h∆P 2 i, so folgt
(für jeden beliebigen Zustand |ψi) die berühmte Heisenberg’sche Unschärferelation:
∆x · ∆p ≥
~
.
2
(5.39)
Abschließend wollen wir noch eine Beziehung zwischen der Varianz des Ortes
und der Varianz des Wellenzahlvektors bei einer Fourier-Transformation ableiten. Wir
werden zeigen, dass für Gaußsche Funktionen die Unschärferelation gerade saturiert
wird. Es sei ψ(x) eine quadratintegrable Funktion und
Z +∞
1
ψ̃(k) = √
ψ(x)eikx dx
(5.40)
2π −∞
die Fourier-Transformierte von ψ(x). Außerdem seien
Z ∞
Z ∞
2
∗
2
2
∆x =
ψ(x) (x−hxi) ψ(x) dx und ∆k =
ψ̃(k)∗ (k−hki)2 ψ̃(k) dk (5.41)
−∞
−∞
dann gilt
1
.
(5.42)
2
Wir werden diese Ungleichung nicht im Allgemeinen beweisen (Beweise findet man
in Büchern zur Fourier-Transformation), aber wir wollen zeigen, dass sie für Gauß–
Funktionen gerade saturiert ist. Der Vorteil bei einer Gauß–Funktion ist, dass die
Fourier-Transformierte wiederum eine Gauß–Funktion ist.
Es sei
1
x2
ψ(x) =
exp − 2
(5.43)
(2πσ 2 )1/4
4σ
∆x · ∆k ≥
110
Postulate der QM
eine quadrat-normierte Gauß–Funktion (man beachte, dass hier das Integral über
das Absolutquadrat dieser Funktion auf 1 normiert sein soll, wohingegen bei Gauß–
Funktionen als Wahrscheinlichkeitsverteilungen das Integral über die Funktion selbst
normiert ist).
Die Fourier-Transformierte dieser Gauß–Funktion erhalten wir durch eine quadratische Ergänzung im Exponenten:
Z ∞
x2
1
exp − 2 + ikx dx
ψ̃(k) =
(2π)3/4 σ 1/2 −∞
4σ
Z ∞
2
1
x
2 2
=
− σik − σ k dx
exp −
(2π)3/4 σ 1/2 −∞
2σ
√
2σ
4σ 2 k 2
=
exp −
(2π)1/4
4
Mit den Definitionen 5.41 gilt für die obigen Gauß-Funktionen:
∆x = σ
und
∆k =
1
2σ
(5.44)
und somit folgt
∆x · ∆k =
1
.
2
(5.45)
Wird also die Unschärfe einer Verteilungsfunktion |ψ(x)|2 bezüglich der räumlichen
Verteilung kleiner, dann wird die Unschärfe der zugehörigen Verteilungsfunktion |ψ̃(k)|2
bezüglich der Verteilung der Wellenzahlen größer (und umgekehrt). Ganz allgemein
kann man aus den Eigenschaften der Fourier-Transformation ableiten, dass diese Unschärfebeziehung eine untere Grenze ist und die Ungleichung
∆x · ∆k ≥
1
2
(5.46)
gilt.
Diese Ungleichung hängt natürlich nicht mit dem speziellen Argument x zusammen sondern gilt allgemein bei Fourier-Transformationen, insbesondere auch wenn man
eine zeitliche Signalfunktion ψ(t) und ihre Fourier-Transformierte ψ̃(ω)
Z ∞
1
ψ̃(ω) = √
ψ(t)eiωt dt
(5.47)
2π −∞
betrachtet. Definieren wir ähnlich wie oben
Z ∞
2
(∆t) =
ψ(t)∗ (t − hti)2 ψ(t) dt
Z−∞
∞
(∆ω)2 =
ψ̃(ω)∗ (ω − hωi)2 ψ̃(ω) dω
−∞
Gemischte Zustände und Dichtematrizen
111
so folgt allgemein die Ungleichung:
∆ω · ∆t ≥
1
.
2
(5.48)
Zusammen mit der deBroglie’schen Beziehung E = ~ω ergibt sich eine Unschärferelation
zwischen der Energie und der Zeit:
∆E · ∆t ≥
~
.
2
(5.49)
Anmerkungen:
1. Die Unschärferelation zwischen der Energie und der Zeit lässt sich nicht aus einer
Kommutatorrelation ableiten (es gibt in der Standardformulierung der Quantenmechanik keinen Zeitoperator“). Sie hat somit einen etwas anderen Charakter
”
als beispielsweise die Unschärferelation zwischen Ort und Impuls.
2. Ganz allgemein bedeuten Unschärferelation nicht eine Unkenntnis irgendwelcher wahren Ontologien (zumindest nicht in den meisten Interpretationen der
Quantenmechanik). Sie drücken eher aus, dass einem Quantenobjekt eine bestimmte Eigenschaft nicht mit einer beliebigen Schärfe zukommt. Ist der Impuls
eines Quantenobjekts beliebig genau bekannt (also ∆p praktisch 0), so macht es
überhaupt keinen Sinn, diesem Quantenobjekt die Eigenschaft, an einem Ort zu
sein, überhaupt zuzuschreiben. Schon die Annahme, dass der Ort zwar definiert
aber uns nicht bekannt sei, führt zu Problemen, wenn man für solche Systeme
die beobachteten Interferenzmuster erklären möchte.
3. Es gibt unterschiedliche Interpretationen der Unschärferelationen, und je nach
Definition, was beispielsweise genau ∆x oder ∆p bedeuten, erhält man etwas
andere Gleichungen. Bei einer experimentellen Überprüfung wird meist die Unsicherheit der einen Observablen durch die Präparation der Zustände bestimmt
und die der anderen durch die Varianz der Messergebnisse an diesen Zuständen.
Damit handelt es sich aber operational um zwei verschiedene Formen von Un”
sicherheiten“.
4. Die Unschärferelation zwischen der Energie und der Zeit hat direkt beobachtbare
Konsequenzen in der Spektroskopie. Wenn ein angeregter Zustand eines Atoms
eine Lebensdauer von ∆t hat (also ein Photon mit einer gewissen Wahrscheinlichkeit innerhalb dieser Zeitspanne emittiert wird), dann ist die Wellenlänge
(Energie) dieses Photons nur bis auf ∆ω (∆E) bestimmt. Endliche Lebensdauern führen also zu verschmierten Emissionslinien im Spektrum, wobei die Breite
der Verschmierung Aufschluss über die Lebendauer des Zustands gibt.
112
Postulate der QM
5.9
Gemischte Zustände und Dichtematrizen
5.9.1
Allgemeine Definition von Zuständen
Bisher haben wir immer von reinen Zuständen gesprochen. Oft verwendet man aber
in der Physik einen erweiterten Zustandsbegriff, der es auch erlaubt, Wahrscheinlichkeitsverteilungen von reinen Zuständen zu betrachten und somit eine Unkenntnis über
den wahren“ Zustand eines Systems zu behandeln.
”
Gemischte Zustände gibt es auch in der klassischen Mechanik. An dieser Stelle
bietet es sich an, den Begriff des Zustands ganz allgemein in einem algebraischen Sinn
zu definieren:
Definition: Ein Zustand ist ein lineares, positives, normiertes Funktional auf der Menge
der Observablen.
Zunächst klären wir die Begriffe in dieser Definition:
- Ein lineares Funktional ist eine lineare Abbildung von der Menge der Observablen
in die Menge der (reellen) Zahlen. Sei O die Menge der Observablen, f, g ∈ O
Observable und ω ein lineares Funktional, dann gilt:
ω : O → R mit ω(αf + βg) = αω(f ) + βω(g) .
(5.50)
- Ein Funktional heißt positiv, wenn einer positiven Observablen nie ein negativer
Wert zugeordnet wird, wobei eine positive Observable eine Observable ist, die
immer nur positive Messwerte zulässt. Oft schreibt man |f |2 und meint damit,
dass diese Observable (egal für welche Observable f ) in jedem Fall positiv ist.
Dann bezeichnet man ein Funktional als positiv, wenn für beliebige Observable
f gilt:
ω(|f |2 ) ≥ 0 .
(5.51)
Hierbei haben wir aber vorausgesetzt, dass |f |2 tatsächlich auf der Menge der Observablen wohldefiniert ist und eine positive Observable liefert. Das gilt sicherlich
in der klassischen Mechanik, wo die Observablen Funktionen auf dem Phasenraum sind, und auch in der Quantenmechanik: Der Operator A† A ist immer ein
positiver Operator (und bei selbst-adjungierten Operatoren ist tatsächlich A2
immer positiv).
- Schließlich bedeutet normiert, dass das Funktional auf der Observablen, die
immer nur den Messwert 1 liefert (in der klassischen Mechanik die Funktion f (x, p) = 1 auf dem Phasenraum und in der Quantenmechanik der Identitätsoperator), den Wert 1 annimmt:
ω(1) = 1 .
(5.52)
Gemischte Zustände und Dichtematrizen
113
Ein solches Funktional bezeichnet man auch als Erwartungswertfunktional. Ein Zustand ist also ein Erwartungswertfunktional auf der Menge der Observablen. Anders
ausgedrückt: Ein Zustand ist eine Vorschrift, die jeder Observablen ihren Erwartungswert zuordnet.
Für zwei Zustände ω1 und ω2 im obigen Sinn ist auch jede konvexe Kombination
dieser beiden Zustände ein Zustand:
ω(f ) = αω1 (f ) + (1 − α)ω2 (f )
(0 ≤ α ≤ 1) .
(5.53)
Wir müssen die drei Bedingungen überprüfen: (1) Die Linearität gilt allgemein für
Linearkombinationen; (2) die Positivität verlangt, dass die beiden Koeffizienten positiv
sind; (3) die Normiertheit fordert, dass die Summe der Koeffizienten 1 ist. Zustände
bilden also eine konvexe Menge.
Man definiert nun: Reine Zustände liegen auf dem Rand der konvexen Menge
von Zuständen. Das bedeutet, reine Zustände lassen sich nicht als echte Linearkombination (also α 6= 0, 1) schreiben bzw. reine Zustände lassen sich nicht weiter zerlegen.
5.9.2
Zustände in der klassischen Mechanik
Diese allgemeine Definition eines Zustands wenden wir nun auf die klassische Mechanik
und später auf die Quantenmechanik an. Beginnen wir mit der klassischen Mechanik:
Ein beliebiges lineares Funktional auf der Menge der Funktionen über dem Phasenraum lässt sich immer als (verallgemeinertes – d.h., im Sinne von Distributionen)
Integral schreiben:
Z
ω(x)f (x) dx ,
ω(f ) =
(5.54)
P
wobei der Einfachheit halber ein Punkt im Phasenraum durch x bezeichnet wurde. f (x)
ist dabei eine Observable, und ω(x) eine (verallgemeinerte) Funktion. Die Positivität
erfordert, dass ω nirgendwo negativ werden darf (zumindest nicht auf einer Menge
vom Maß ungleich 0), und Normiertheit bedeutet, dass das Integral über ω gleich 1
ist:
Z
Z
2
ω(x)|f (x)| dx ≥ 0 und
ω(x) dx = 1 .
(5.55)
P
P
Eine (verallgemeinerte) Funktion mit diesen Eigenschaften bezeichnet man als eine
Wahrscheinlichkeitsdichte auf dem Phasenraum. Hierbei handelt es sich um ein klassisches Erwartungswertfunktional. Mit wenig Aufwand lässt sich zeigen, dass die einzigen reinen Zustände Wahrscheinlichkeitsdichten sind, die an einem Punkt konzentriert
sind, also die δ–Funktion:
Z
ωx0 (f ) =
δ(x − x0 )f (x) dx = f (x0 ) .
(5.56)
P
Somit stehen die reinen Zustände in einer 1-zu-1-Beziehung mit den Punkten im Phasenraum.
114
5.9.3
Postulate der QM
Dichtematrizen
Kommen wir nun zur Quantenmechanik. Gesucht ist ein lineares Funktional auf der
Menge der Operatoren, das positiv und normiert ist. Der Beweis ist zwar etwas aufwendiger, aber man kann zeigen, dass die einzigen Funktionale dieser Art sich durch so
genannte Dichtematrizen schreiben lassen. Eine Dichtematrix ist ein Operator ρ mit
den Eigenschaften:
ρ = ρ† ,
Spur(ρA† A) ≥ 0 (für alle A) ,
Spur(ρ) = 1 .
(5.57)
Für die Positivität der Dichtematrix schreibt man manchmal auch einfacher ρ ≥ 0,
was im obigen Sinne zu verstehen ist. Einem Operator A wird nun nach folgender
Vorschrift sein Erwartungswert zugeordnet:
ω(A) = Spur(ρA) .
(5.58)
Die Linearität ist wieder offensichtlich. Die Positivität ist die zweite obige Bedingung.
Sie bedeutet (da ρ selbst-adjungiert sein soll) auch, dass die Eigenwerte von ρ alle
nicht negativ sind. Die Normiertheit bedeutet, dass die Summe der Eigenwerte gleich
1 ist. Somit hat ρ die folgende Form:
X
X
X
ρ=
p i Pi =
pi |pi ihpi |
mit pi ≥ 0 und
pi = 1 .
(5.59)
i
i
i
wobei Pi die Projektoren auf die Eigenzustände von ρ zum Eigenwert pi sind.
Man kann zeigen, dass die Bedingungen an eine Dichtematrix äquivalent sind
zu folgenden Eigenschaften:
ρ = ρ† ,
ρ≥0 ,
ρ2 ≤ ρ .
Für eine Observable A ist der Erwartungswert somit
X
ω(A) = SpurρA =
pi hpi |A|pi i
(5.60)
(5.61)
i
Auf der rechten Seite steht eine Summe über Erwartungswerte hpi |A|pi i in reinen
Zuständen, und jeder dieser Erwartungswerte wird nochmals gewichtet mit pi . Das
entspricht der klassischen Vorstellung eines Gemischs, d.h., wir wissen nicht, welcher
Zustand in einer Basis {|pi i} vorliegt, aber wir wissen, mit welcher Wahrscheinlichkeit
pi jeder dieser Zustände vorliegt, und der Erwartungswert insgesamt ist gleich der
gewichteten Summe der Einzelerwartungswerte.
Anders ausgedrückt können wir auch sagen: Gegeben sei ein Ensemble von
präparierten Systemen, wobei jedes Einzelsystem sich in einem Zustand |ψi i befinden
kann. Wir wissen nicht, welches System in welchem Zustand präpariert wurde, aber
Maximale Sätze kompatibler Observabler
115
wir kennen die relative Häufigkeit pi mit welcher der Zustand |ψi i in dem Ensemble
P
auftritt. Dann würden wir dieses Ensemble durch eine Dichtematrix ρ = i pi |ψi ihψi |
beschreiben. In diesem Fall ist noch nicht einmal notwendig, dass die Zustände |ψi i
orthogonal sind.
Man beachte, dass die Superposition
|Ψi =
X√
pi |ψi i
(5.62)
pi |ψi ihψi | .
(5.63)
i
nicht dasselbe ist wie die Dichtematrix
ρ=
X
i
Die Superposition beschreibt wieder einen reinen Zustand, und je nach experimenteller Anordnung
lassen sich auch die Interferenzterme hψi |ψj i beobachten. Die Dichtematrix beschreibt jedoch ein
klassisches Gemisch, d.h., jedes Einzelsystem in einer Reallisierung des Zustands durch ein Ensemble
befindet sich mit der Wahrscheinlichkeit pi in dem reinen Zustand |ψi i. An einem Gemisch kann man
keine Interferenzterme beobachten.
Nun ist es wiederum nicht schwer zu beweisen, dass die einzigen reinen Zustände
(Dichtematrizen, die sich nicht als konvexe Kombination von anderen Dichtematrizen
schreiben lassen) die Eigenschaft haben, dass pi = 1 für ein bestimmtes i und ansonsten
pi = 0 gilt. Anders ausgedrückt, reine Zustände sind Projektionsoperatoren auf 1dimensionale lineare Unterräume, und damit erhalten wir wieder die Definition eines
reinen Zustands aus Abschnitt 5.2.
Dichtematrizen spielen beispielsweise in der Quantenstatistik eine wichtige Rolle, d.h., wenn man statistische Quantensysteme (Quantengase etc.) betrachtet. Die
klassischen Gesamtheiten (mikrokanonische Gesamtheit, kanonische Gesamtheit etc.)
lassen sich durch Dichtematrizen beschreiben. Wir werden auf diesen Punkt nicht weiter eingehen. Allerdings werden wir auf Dichtematrizen nochmals im Zusammenhang
mit Zwei-Zustands-Systemen zu sprechen kommen.
5.10
Maximale Sätze kompatibler Observabler
Das 4. Postulat (Kollapspostulat) erlaubt es uns, Systeme in bestimmten Zuständen
zu präparieren. Im Idealfall besteht die Präparation in einem Filter“, der nur Quan”
tensysteme durchlässt, die eine bestimmte Bedingung erfüllen. Mathematisch wird ein
solcher Filter durch einen Projektionsoperator beschrieben. Ist ein Eigenwert zu einer
Observablen entartet, können wir den Zustand mit einem Filter zu dieser Observablen
nicht weiter verfeinern. Wir könnten aber mit einer zweiten Observablen, die mit der
ersten kommutiert, eine Zustandsverfeinerung vornehmen.
116
Postulate der QM
Damit erhebt sich die Frage, wie wir zu reinen Zuständen gelangen. Nach dem
oben Gesagten suchen wir einen maximalen Satz von Filtern, die miteinander verträglich sind (deren zugehörige Projektionsoperatoren miteinander kommutieren), die
zusammengenommen jedoch nur einen einzigen (durch einen 1-dimensionalen Strahl
repräsentierten) Zustand durchlassen.
Auf Dirac geht in diesem Zusammenhang der Begriff des maximalen Satzes
”
kompatibler Observabler“ zurück. Wir definieren;
Definition: Ein Satz von Observablen {A1 , A2 , ..., AN } heisst maximal kompatibel, wenn folgende Bedingungen erfüllt sind.
1. Observablen sind funktional unabhängig. Das bedeutet, es gibt in diesem Satz
keine Observable Ai , die sich als Funktion der anderen Observablen schreiben
lässt.
2. Alle Observablen kommutieren miteinander:
[Ai , Aj ] = 0
für alle i, j .
(5.64)
3. Jede weitere Observable B, welche die Eigenschaft hat, dass [B, Ai ] = 0 (für alle
i), lässt sich als Funktion der Observablen Ai schreiben: B = f (A1 , ..., AN ).
Die erste Bedingung schließt redundante Observablen (deren Information schon
in den anderen Observablen steckt) aus. Die zweite Bedingung garantiert, dass es gemeinsame Eigenzustände von allen Observablen Ai gibt, sodass wir jede dieser Observablen gleichzeitig messen und einem System bezüglich jeder dieser Observablen gleichzeitig wohldefiniert Messwerte (und damit wohldefinierte Eigenschaften) zuschreiben
können. Die dritte Bedingung besagt, dass es keine weiteren unabhängigen Observablen
gibt, die diese Bedingung erfüllen. Das ist genau dann der Fall, wenn die gemeinsamen
Eigenvektoren zu allen Observablen {Ai } (bis auf Multiplikation mit einer komplexen
Zahl) eindeutig sind, d.h. keine Entartungen mehr vorliegen. Ein Satz von Messwerten
{ai } (einer für jede Observable) legt somit eindeutig einen reinen Zustand fest.
Kapitel 6
Potenzialsysteme
Es sollen nun einige konkrete Beispiele von Quantensystemen betrachtet werden. Dabei handelt es sich zunächst um Systeme einzelner Teilchen in einem externen Potenzial. Drei Systeme werden in diesem Zusammenhang ausführlicher behandelt: das
Kastenpotenzial, der harmonische Oszillator und das Coulomb-Problem. Für alle drei
Potenziale lässt sich die Schrödinger-Gleichung exakt lösen. Schwerpunktmäßig gehe
ich auf das Kastenpotenzial ein, da es bereits die wesentlichen Charakteristika eines
Quantensystems mit externem Potenzial aufweist. Dazu zählt insbesondere die Quantisierung der möglichen Energiewerte. Außerdem hat es den Vorteil, sich mit den Verfahren der Schulmathematik lösen zu lassen. Für die anderen beiden Systeme werden die
Lösungswege skizziert und die qualitativen Eigenschaften der Lösungen diskutiert. Zuvor gehe ich allerdings auf einige allgemeine Eigenschaften der Schrödinger-Gleichung
für Potenzialsysteme (ohne weitere Freiheitsgrade wie beispielsweise den Spin) ein.
Was man wissen sollte
Man sollte die zeitabhängige und die zeitunabhängige Schrödinger–Gleichung angeben
können und auch die Beziehung zwischen den beiden Gleichungen kennen. Außerdem
sollte man allgemein wissen, dass sich Symmetrien in der Quantenmechanik darin
äußern, dass die zugehörigen unitären Transformationen (bzw. ihre Generatoren) mit
dem Hamilton-Operator kommutieren. Daher lassen sich beide Operatoren gleichzeitig
diagonalisieren, was zum einen das Auffinden der Lösungen der Schrödinger–Gleichung
vereinfacht, zum anderen aber auch bedeutet, dass die Quantenzahlen zu den Symmetrien Erhaltungsgrößen sind.
Ist die Energie eines Teilchens kleiner als der Wert eines Potenzials im Unendlichen, sind die erlaubten Energien (die Energieeigenwerte) quantisiert. Diese Quantisierung ist eine Folge der zu fordernden Randbedingungen, da die Wellenfunktionen
quadratintegrabel sein müssen. Ist die Energie größer als das Potenzial, ist das Ener117
118
Potenzialsysteme
giespektrum meist kontinuierlich.
Das unendliche Kastenpotenzial sollte jeder einmal selbst gerechnet haben. Die
Energiequantisierung folgt aus der Forderung, dass die Wellenfunktion am Rand verschwinden muss. Daher muss ein Vielfaches der halben deBroglie-Wellenlänge in den
Kasten passen. Diese Forderung – (nλ)/2 = L oder nπ~/p = L – führt auf die erlaubten Impulse p = (nπ~)/L und damit die möglichen Energien E = (nπ~)2 /(2mL2 ).
Für den eindimensionalen Kasten wachsen die Energieeigenwerte proportional zu n2
(wobei n − 1 die Anzahl der Knotenpunkte der Welle ist), sind andererseits aber
umgekehrt proportional zu L2 (bei größerem Volumen liegen die Energieeigenwerte
dichter) und m (bei schwererer Masse sind die Energieeigenwerte kleiner und dichter).
Es gibt eine endliche Grundzustandsenergie (der Fall n = 1), die auch als Folge der
Unbestimmtheitsrelationen gedeutet werden kann. Die Eigenfunktionen sind einfache
Winkelfunktionen.
Beim endlichen Kastenpotenzial bleibt die Wellenfunktion innerhalb des Kastens eine Winkelfunktion, sie verschwindet aber (auch für Energien kleiner als V )
außerhalb des Kastens nicht sondern dringt exponentiell abfallend in den klassisch
verbotenen Bereich ein. Dadurch erklärt sich der Tunneleffekt, wobei die Tunnelwahrscheinlichkeit exponentiell mit der Dicke der Wand und der Wurzel der Potenzialhöhe
über der Energie des Teilchens abnimmt. Für den Fall E > V gibt es keine Quantisierung, allerdings kann es zur Reflektion der Wellenfunktion am Potenzial kommen
sowie zu einer Phasenverschiebung und Amplitudenänderung der transmittierten Welle (dies ist der Ausgangspunkt für eine Streutheorie); für E < V ist die Quantisierung
eine Folge des exponentiellen Abfalls der Wellenfunktion außerhalb des Kastens und
der Forderung nach einer einmal stetig differenzierbaren Anschlussbedingung am Kastenrand.
Die Verhältnisse bei den anderen Potenzialen sollte man zumindest qualitativ
kennen. Die Energieeigenwerte beim harmonischen Oszillator sind En = ~ω(n + 21 )
(mit n = 0, 1, 2, ...): Sie sind äquidistant und die Grundzustandsenergie ist ~ω/2. Die
Eigenfunktionen sind (Hermite-)Polynome multipliziert mit einer Gaußfunktion. Bestimmte Linearkombinationen des Orts- und Impulsoperators bilden so genannte Aufund Absteigeoperatoren, die, angewandt auf einen Eigenzustand des Energieoperators,
zum nächst höheren (bzw. tieferen) Eigenzustand führen. Für sehr große Werte von
n nähern sich die Amplitudenquadrate der Wellenfunktion einer klassischen Aufenthaltswahrscheinlichkeit für ein Teilchen derselben Energie.
Bei radialsymmetrischen (dreidimensionalen) Potenzialen lässt sich die Winkelabhängigkeit in der Schrödinger–Gleichung geschlossen behandeln und führt auf
die Quantenzahlen l und m (Drehimpuls und magnetische Quantenzahl). Die zugehörigen Eigenfunktionen sind die Kugelflächenfunktionen Ylm (θ, ϕ). Der Drehimpuls
p
ist ~ l(l + 1), wobei l = 0, 1, 2, ... ganzzahlig sein muss. Beim Coulomb-Problem bzw.
Schrödinger-Gleichung für Potenzialsysteme
119
Wasserstoffatom kann man auch die radiale Abhängigkeit geschlossen behandeln, was
auf die Hauptquantenzahl n führt (die mit der Anzahl der Knotenpunkten der radialen Wellenfunktion zusammenhängt). Die (diskreten) Energieeigenwerte hängen nur
von dieser Hauptquantenzahl n ab (welche die Werte n = 1, 2, ... annimmt) und sind
proportional zu −1/n2 mit der Rydberg-Konstanten als Proportionalitätsfaktor. Für
positive Energien ist das Spektrum kontinuierlich. Für die möglichen Quantenzahlen l
des Drehimpulses gilt l ≤ n, für die magnetische Quantenzahl m, die Eigenzuständen
der z-Komponente des Drehimpulses entspricht, gilt m = −l, −l + 1, ..., +l; m kann
also 2l + 1 verschiedene Werte annehmen.
6.1
6.1.1
Schrödinger-Gleichung für Potenzialsysteme
Zeitabhängige und zeitunabhängige
Schrödinger-Gleichung
In Kapitel 5.6 haben wir die zeitabhängige Schrödinger-Gleichung für einen allgemeinen Zustand |ψ(t)i angegeben:
i~
d|ψ(t)i
= H|ψ(t)i .
dt
(6.1)
Die formale Lösung ist
i
|ψ(t)i = U (t)|ψ(0)i = e− ~ Ht |ψ(0)i
mit dem unitären Zeitentwicklungsoperator
i
U (t) = exp − Ht .
~
(6.2)
(6.3)
Hierbei und im Folgenden nehme ich H immer als zeitunabhängig an. Gleichung 6.1
bleibt zwar auch für einen zeitabhängigen Hamilton-Operator H = H(t) gültig, beispielsweise wenn H Teilchen in zeitabhängigen externen Potenzialen beschreibt, aber
die formale Lösung 6.2 ist nun zu modifizieren. Auch wenn zeitabhängige HamiltonOperatoren in der Praxis von Bedeutung sind, werden sie hier nicht weiter behandelt.
Die Schrödinger-Gleichung ist eine lineare Differentialgleichung erster Ordnung
in der Zeit. Das bedeutet, mit je zwei speziellen Lösungen |ψ1 (t)i und |ψ2 (t)i ist auch
die allgemeine Linearkombination
|ψ(t)i = α|ψ1 (t)i + β|ψ2 (t)i
(6.4)
eine Lösung. Da die Schrödinger-Gleichung (als Funktion von t) erster Ordnung ist,
bestimmt der Zustand |ψ(0)i zum Zeitpunkt t = 0 bereits eindeutig die Lösung |ψ(t)i.
120
Potenzialsysteme
Aus der formalen Lösung (Gl. 6.2) bzw. der Unitarität der Zeitentwicklung folgt
sofort:
i
i
†
hψ(t)|ψ(t)i = hψ(0)|e+ ~ H t e− ~ Ht |ψ(0)i = hψ(0)|ψ(0)i .
(6.5)
Der zweite Schritt gilt, weil H = H † selbst-adjungiert ist (genau deshalb ist U (t) auch
unitär). Die Norm eines Zustands bleibt daher erhalten. Wegen der Linearität der
Schrödinger-Gleichung ist mit einer Lösung |ψ(t)i auch α|ψ(t)i (für beliebiges α ∈ C)
eine Lösung, daher kann man sie auch als Gleichung für die Strahlen im Hilbertraum
auffassen, also die eigentlichen reinen Quantenzustände. Wegen der Unitarität bleibt
die Norm erhalten, d.h., normierte Repräsentanten der Zustände bleiben normierte
Repräsentanten. Da wir das Absolutquadrat eines Zustands als eine Wahrscheinlichkeit
interpretiert haben, bedeutet die Unitarität der quantenmechanischen Zeitentwicklung
die Erhaltung der Wahrscheinlichkeit“.
”
Für einen Eigenvektor zum Energieoperator
H|ψE i = E|ψE i
(6.6)
folgt aus Gl. 6.1:
i
|ψE (t)i = e− ~ Et |ψE (0)i .
(6.7)
Die Zeitentwicklung eines Eigenvektors des Energieoperators ist somit fast trivial: Der
Vektor wird lediglich mit einer zeitabhängigen Phase multipliziert. Diese globale Phase
hat aber für den physikalischen Zustand keine Bedeutung, daher sind Eigenzustände
zum Energieoperator stationär.
Zur Bestimmung der allgemeinen Lösung kann man den Anfangsvektor |ψ(0)i
nach Energieeigenvektoren entwickeln (wobei wir im Folgenden |ψE i = |Ei schreiben):
X
|ψ(0)i =
ai |Ei i .
(6.8)
i
Da die Schrödinger-Gleichung linear ist, sind Superpositionen von Lösungen wieder
Lösungen der Schrödinger-Gleichung und wir können die Lösungen für die Eigenvektoren einsetzen. Damit erhalten wir für die allgemeine Lösung der zeitabhängigen
Schrödinger-Gleichung
X
i
(6.9)
|ψ(t)i =
ai e− ~ Ei t |Ei i .
i
Man beachte, dass in diesem Ausdruck die energieabhängigen Phasen natürlich eine
physikalische (messbare) Bedeutung haben. Superpositionen von Energieeigenzuständen sind also nicht stationär sondern zeigen eine nicht-triviale Zeitentwicklung.
Das eigentliche Problem zur Lösung der Schrödinger-Gleichung ist also die Bestimmung der Eigenwerte und Eigenfunktionen aus Gl. (6.6). Diese Gleichung bezeichnet man auch als zeitunabhängige Schrödinger-Gleichung. Die zeitunabhängige
Schrödinger-Gleichung für Potenzialsysteme
121
Schrödinger-Gleichung ist eine ganz gewöhnliche Eigenwertgleichung. Insbesondere ist
sie ebenfalls linear, d.h., auch hier gilt wieder, dass Superpositionen von Lösungen
selbst wieder Lösungen darstellen.
Oftmals wird die zeitunabhängige Schrödinger-Gleichung aus der zeitabhängigen SchrödingerGleichung durch einen Separationsansatz abgeleitet“. Dazu schreibt man für einen Zustand |ψ(t)i =
”
f (t)|ψi, d.h., die Zeitabhängigkeit wird durch eine allgemeine Funktion f (t) absepariert. Setzt man
diesen Ansatz in die zeitabhängige Schrödinger-Gleichung ein, erhält man:
i~
df (t)
|ψi = Hf (t)|ψi ,
dt
(6.10)
und nach Division durch f (t) (was nicht identisch verschwinden soll):
i~
1 df (t)
|ψi = H|ψi .
f (t) dt
(6.11)
Da die rechte Seite nicht von t abhängt, darf auch die linke Seite nicht von t abhängen, also muss
gelten:
1 df (t)
= const = E ,
(6.12)
i~
f (t) dt
mit der Lösung:
i
f (t) = e− ~ Et f (0) .
(6.13)
Für den Zustand |ψi folgt:
E|ψi = H|ψi ,
(6.14)
also die zeitunabhängige Schrödinger-Gleichung.
6.1.2
Die Schrödinger-Gleichung in einer Basis
Für die bisherigen Überlegungen haben wir die Gleichungen mit abstrakten Vektoren
im Hilbertraum formuliert. Wollen wir jedoch konkrete Berechnungen durchführen,
müssen wir eine Basis wählen (oder, wie wir in endlich dimensionalen Vektorräumen
manchmal auch sagen, ein Koordinatensystem einführen).
Die meist verwendete Basis ist die Ortsraumbasis. In diesem Fall sind die Basisvektoren {|~xi} die Eigenfunktionen“ zu den Ortsoperatoren Qi . Sie erfüllen die
”
Bedingung
Qi |~xi = xi |~xi .
(6.15)
Für einen Zustand |ψi, ausgedrückt in der Ortsraumbasis, erhalten wir das Argument
der Wellenfunktion am Punkte ~x (das ist die Definition der Wellenfunktion im Ortsraum):
ψ(~x) := h~x|ψi .
(6.16)
Der Impulsoperator (bzw. seine Komponenten) ist in dieser Basis durch die
kanonischen Vertauschungsrelationen (bis auf eine additive Funktion von ~x) bestimmt:
Pi = −i~
∂
.
∂xi
(6.17)
122
Potenzialsysteme
Hat also der Hamilton-Operator, ausgedrückt durch die Operatoren P und Q, die
Form
~ P~ ) = 1 P~ 2 + V (Q)
~ ,
H(Q,
(6.18)
2m
so gilt in der Ortsraumbasis:
3
2 X
~2
∂2
~ P~ ) = − ~
+
V
(~
x
)
=
−
∆ + V (~x) .
H(Q,
2m i=1 ∂x2i
2m
(6.19)
Hier haben wir etwas geschummelt“: In der Ortsraumbasis wird aus dem Hamilton-Operator
”
2
~ P~ )|~y i = − ~ ∆y + V (~y ) δ(x − y) .
h~x|H(Q,
(6.20)
2m
Die Wirkung von H auf einen Vektor |ψi in der Ortsraumbasis wird zu:
Z
Z
~2
3
3
~
~
~
~
h~x|H(Q, P )|ψi =
d y h~x|H(Q, P )|~y ih~y |ψi = d y δ(x − y) −
∆y + V (~y ) ψ(~y )
2m
~2
=
−
∆ + V (~x) ψ(~x)
2m
Genau auf diese technischen Feinheiten soll hier aber kein Wert gelegt werden.
Damit lautet die zeitunabhängige Schrödinger-Gleichung in der Ortsraumbasis:
~2
∆ + V (~x) ψ(~x) = E ψ(~x) .
(6.21)
−
2m
Manchmal bezeichnet man auch diese Differentialgleichung einfach als SchrödingerGleichung.
Bevor wir diese Gleichung für spezielle Potenziale betrachten, soll kurz angedeutet werden, wie die Schrödinger-Gleichung in einer andere Basis, insbesondere der
Impulsraumbasis, aussieht.
In der Impulsraumbasis sind die Impulsoperatoren Pi diagonal
Pi |~pi = pi |~pi ,
(6.22)
und diesmal wird aufgrund der kanonischen Vertauschungsrelationen (die in jeder Basis
gelten müssen) der Ortsoperator zu einem Ableitungsoperator:
Qi = i~
∂
.
∂pi
(6.23)
Die Wellenfunktionen sind
ψ̃(~p ) = h~p |ψi ,
(6.24)
von denen wir schon gezeigt haben, dass es die Fourier-Transformierten der Ortsraumwellenfunktion sind. Wiederum hat man in der Hamilton-Funktion die Operatoren Q
und P durch ihre Darstellung in der Impulsraumbasis zu ersetzen:
~ P~ ) = 1 p~ 2 + V (i~∇
~ p) .
H(Q,
2m
(6.25)
Schrödinger-Gleichung für Potenzialsysteme
123
Je nach der Funktion V handelt es sich hierbei nicht mehr um einen gewöhnlichen
Differentialoperator, sondern die Funktion der Ableitung ist durch eine Fourier-Transformierte zu definieren, was zu verallgemeinerten Differentialoperatoren führt. Die
Impulsraumbasis bietet sich an, wenn V ≡ 0 ist (also ein freies Teilchen), das Kastenpotenzial oder eventuell noch für den linearen Fall V = x bzw. V = |x| (in einer
Dimension). Für V (x) = kx2 (also den harmonischen Oszillator) hat man im Ortsund Impulsraum den gleichen Typ von Differentialgleichung zu lösen. Wir werden im
Folgenden immer in der Ortsraumbasis rechnen.
6.1.3
Symmetrien
In der klassischen Mechanik spielen Symmetrien eine große Rolle. Aus dem NoetherTheorem ist bekannt, dass eine Symmetrie der Lagrange-Funktion (meist eine Symmetrie des Potenzials) zu einer Erhaltungsgröße führt. Für die Quantenmechanik haben
Symmetrien eine mindestens vergleichbare Bedeutung.
Eine Symmetrie ist eine Gruppe von (linearen) Transformationen T auf dem
Raum der Zustände (also auf den Strahlen in dem jeweiligen Hilbert-Raum), sodass mit
jeder Lösung |ψ(t)i der Schrödinger-Gleichung auch die transformierte Zustandskurve
T |ψ(t)i Lösung der Schrödinger-Gleichung ist.1 Es soll also gelten:
i~
d
d
|ψ(t)i = H|ψ(t)i =⇒ i~
T |ψ(t)i = H T |ψ(t)i .
dt
dt
(6.26)
Andererseits können wir die Schrödinger-Gleichung immer von links mit T multiplizieren, sodass unsere Forderung bedeutet:
[H, T ] = 0 .
(6.27)
(Man beachte hier, dass T ein Operator auf dem Hilbert-Raum ist und selbst nicht
explizit von der Zeit abhängt; T kann daher an der Zeitableitung vorbeigeschoben“
”
werden.)
In diesem Fall folgt aus den allgemeinen Eigenschaften von linearen Operatoren,
dass es eine Basis von Eigenzuständen zum Hamilton-Operator gibt, die gleichzeitig
Eigenzustände von T sind. Anders ausgedrückt, H und T lassen sich gleichzeitig diagonalisieren. Aus der Eigenschaft [H, T ] = 0 folgt ebenfalls sofort, dass
dhψ(t)|T |ψ(t)i
= 0,
dt
(6.28)
also T eine Erhaltungsgröße auf dem Raum der Lösungen ist (im Heisenberg-Bild, siehe
Abschnitt 7.3, sieht man das unmittelbar, im Schrödinger-Bild folgt es, wie angegeben,
1
Das Wigner-Theorem besagt, dass eine solche Symmetrie immer nur durch einen unitären oder
anti-unitären Operator auf dem Hilbert-Raum dargestellt werden kann.
124
Potenzialsysteme
für die Erwartungswerte von T ). Sei insbesondere ψ(0), der Zustand zum Zeitpunkt
t = 0, ein Eigenzustand von T zum Eigenwert τ , dann ist auch ψ(t) für alle t ein
Eigenzustand zu demselben Eigenwert:
T |ψ(0)i = τ |ψ(0)i
=⇒
T |ψ(t)i = τ |ψ(t)i für alle t .
(6.29)
Da die Eigenzustände zu T entartet sein können, bedeutet dies nicht, dass sich der
Zustand zeitlich nicht mehr ändert, aber seine Trajektorie“ verläuft in dem Bereich
”
des Hilbertraums, der Eigenraum zu einem festen Eigenwert von T ist. Damit sind
die möglichen Lösungen der zeitabhängigen Schrödinger-Gleichung sehr eingeschränkt,
was bei der Suche der Lösungen oft hilft.
Aber auch zur Lösung der zeitunabhängigen Gleichung (der Eigenwertgleichung
für H) sind Symmetrien hilfreich. Angenommen, man kennt die Eigenzustände zu T ,
also Zustände mit der Eigenschaft
T |τi , i i = τi |τi , i i
(6.30)
wobei i ein Entartungsparameter sein soll, d.h., i = 1, 2, 3, ..., ni nummeriert Eigenzustände von T zum festen Eigenwert τi , wobei ni für verschiedene Eigenwerte τi auch
verschiedene Werte annehmen kann. Ist der Eigenwert τi nicht entartet (also ni = 1),
dann handelt es sich bei |τi i schon um einen Eigenzustand von H. Ist τi entartet, also
ni > 1, weiß man zumindest, dass die Eigenzustände von H in den Eigenräumen zu
festen τi liegen, d.h., durch einen Ansatz
!
!
ni
ni
X
X
a(i )|τi , i i
(6.31)
a(i )|τi , i i = E
H
i =1
i =1
hat man das Problem der Eigenvektor (und Eigenwert)-Bestimmung von H schon auf
Teilräume reduziert. Je kleiner der Entartungsgrad zu den Eigenwerten der Symmetriegruppe, umso kleiner sind auch die Eigenräume, die bezüglich H noch diagonalisiert
werden müssen.
6.2
Die Quantisierung der Energie
Eines der augenscheinlichsten Phänomene der Quantentheorie ist die Quantisierung“
”
bestimmter Messgrößen. Hierbei handelt es sich um Observable, bei denen klassisch
eine (zumindest innerhalb von Intervallen) beliebige reelle Zahl als Messwert auftreten
kann. Bei Quantensystemen — also bei einer sehr genauen Analyse der Messdaten —
nehmen diese jedoch nur diskrete Werte an. Am offensichtlichsten wird diese Eigenschaft bei der Energie, beispielsweise in Atomen. Die diskreten Atomspektren gehörten
zu den ersten experimentellen Hinweisen, dass bei quantenmechanischen Systemen andere Gesetzmäßigkeiten als in der klassischen Newton’schen Physik gelten.
Die Quantisierung der Energie
125
Die Quantisierung der Energie tritt bei vielen Potenzialsystemen auf und hat
sehr allgemeine Gründe. Es erhebt sich somit die Frage, weshalb die SchrödingerGleichung
~2
∆ + V (~x) ψE (~x) = E ψE (~x)
(6.32)
−
2m
nur für bestimmte diskrete Werte der Energie physikalische akzeptable Lösungen hat.
Wir betrachten zunächst den eindimensionalen Fall, um die Gründe hinter der
Energiequantisierung zu erläutern. Die eindimensionale Schrödinger-Gleichung lautet:
~ 2 d2
−
+ V (x) ψE (x) = E ψE (x) .
(6.33)
2m dx2
Hierbei handelt es sich um eine gewöhnliche Differentialgleichung 2. Ordnung, d.h.,
eigentlich würde man erwarten, dass es zu jedem beliebigen Wert von E zwei linear
unabhängige Lösungen bzw. zwei Integrationskonstanten gibt. Eine dieser Konstanten
R
wird durch die Normierung |ψ(x)|2 dx = 1 festgelegt, doch was ist mit der anderen
Konstanten?
Man muss nun mehrere Fälle unterscheiden:
1. Wenn die Energie eines Teilchens zumindest asymptotisch (d.h. für große Werte von |x|) immer größer ist als das Potenzial V (x), können asymptotisch freie
Teilchen existieren (siehe endliches Kastenpotenzial Kap. 6.4 und das CoulombProblem Kap. 6.8). Es gibt zwei linear unabhängige Lösungen der SchrödingerGleichung, die im Allgemeinen zwar nicht quadratintegrabel sind, aber beliebig
genau durch quadratintegrable Funktionen approximiert werden können (ist das
Potenzial asymptotisch konstant, handelt es sich typischerweise um Sinus- und
Kosinus-Funktionen). In diesem Fall gibt es keine Energiequantisierung, streng
genommen aber auch keine realisierbaren Eigenfunktionen zu einer festen Energie, sondern nur Wellenpakete“, für welche die Energie auf ein kleines Intervall
”
beschränkt ist.
Anschaulich lässt sich dieses Verhalten folgendermaßen vestehen. Für (E−V (x)) >
0 (der klassisch erlaubte“ Bereich, da die kinetische Energie immer positiv sein
”
muss) ist die zweite Ableitung der Wellenfunktion an einer Stelle x proportional
zu minus dem Wert der Wellenfunktion an dieser Stelle. Das bedeutet, die Kurve
wird zur x-Achse gekrümmt. Dies führt zu dem oszillatorischen Verhalten, das
man auch vom harmonischen Oszillator kennt.
2. Ist die Energie E des Teilchens kleiner als das Potenzial V (x) für x → ±∞
(d.h., gibt es einen Wert x0 , sodass E < V (x) für alle |x| > x0 ), so gibt es zwar
ebenfalls zwei linear unabhängige Lösungen, die aber im Allgemeinen für |x| →
∞ exponentiell ansteigen. Durch geeignete Wahl der beiden freien Konstanten
126
Potenzialsysteme
kann man zwar erreichen, dass eine Lösung für eine beliebige Energie E auf einer
Seite (z.B. x → −∞) gegen null geht, diese Lösung wird aber auf der anderen
Seite (x → +∞) divergieren und ist somit nicht quadratintegrabel. Nur für ganz
spezielle, diskrete Werte von E erhält man auch am anderen Rand des Systems
ein Verhalten der Lösung, die sie quadratintegrabel macht. Dies führt auf die
Quantisierungsbedingung.
Anschaulich bedeutet die Bedingung (E − V (x)) < 0 (klassisch nicht erlaubt,
da diese Bedingung eine negative kinetische Energie impliziert), dass die Wellenfunktion ein exponentielles Verhalten zeigt, d.h., sich von der x-Achse weg”
biegt“. Nur bei den speziellen erlaubten Energieeigenwerten, führt dieses Weg”
biegen“ nicht zu einem exponentiellen Anstieg des Quadrats der Wellenfunktion,
sondern zu einem exponentiellen Anschmiegen“ an die x-Achse.
”
3. Ist keine der oben genannte Bedingungen erfüllt, d.h., gibt es für beliebig große
Werte von |x| immer noch Bereiche, für die manchmal E > V (x) und manchmal
E < V (x) ist, so ist das Verhalten der möglichen Energieeigenwerte komplizierter.
Bekannt sind periodische Potenziale, bei denen sich die Bedingungen E > V und
E < V periodisch abwechseln. In solchen Fällen gibt es bestimmte Intervalle, in
denen alle Werte für E erlaubt sind (sogenannte Energiebänder“), unterbrochen
”
von Intervallen, in denen keine Energieeigenwerte liegen.
Ganz ähnlich begründen lassen sich die Quantisierungen von Eigenwerten bestimmter Operatoren in mehr als einer Dimension. Die Quantisierung des Drehimpulses
lässt sich unter anderem damit begründen, dass die Wellenfunktion in Abhängigkeit
der Winkelvariablen (beispielsweise in drei Dimensionen auf einer Kugeloberfläche)
eindeutig sein soll, also periodisch. Die Quantisierung der Energie folgt aus der Quadratintegrabilität für große Werte von x, bzw. in Zylinder- oder Kugelkoordinaten für
die zu fordernden Randbedingungen bei r = 0 und r → ∞.
6.3
Das unendliche Kastenpotenzial
Für das 1-dimensionale Kastenpotenzial (unendliche Wände) lautet die SchrödingerGleichung in der Ortsraumbasis:
~2 d2
+ V (x) ψE (x) = E ψE (x)
(6.34)
−
2m dx2
mit
(
V (x) =
0
für x ∈ [0, L]
∞ sonst
.
(6.35)
Das unendliche Kastenpotenzial
127
Der Kasten hat also eine Gesamtbreite von L.
Offenbar muss ψ(x) = 0 sein für x 6∈ [0, L], da andernfalls die linke Seite
der Gleichung unendlich wird. Um zumindest eine Stetigkeit der Wellenfunktion zu
garantieren, sollte ψ(x) auch bei x = 0 und x = L verschwinden, sodass wir letztendlich
nach Lösungen der Gleichung 6.34 suchen, die auf das Interval x ∈ [0, L] beschränkt
sind und am Rand verschwinden.
Eine mathematisch strenge Begründung, weshalb wir nur Funktionen zulassen, die stetig
am Rand des Kastenpotenzials gegen 0 gehen, erfordert schon einen gewissen funktionalanalytischen Aufwand — Quadratintegrabilität alleine genügt dafür nicht, denn eine Gleichung der Form
(H − E)ψ(x) = 0 muss nicht unbedingt punktweise erfüllt sein, sondern lediglich bezüglich der Hilbertraumnorm. Daher kann auch die Stetigkeit nicht zwingend gefordert werden, da der Hilbertraum
bezüglich seiner Norm vollständig sein muss, und nicht jede Folge stetiger Funktionen wieder stetig
ist.
Eine Möglichkeit, das Problem zu umgehen, ist die Einführung eines stetigen Potenzials V ,
für das auch die Lösungen der Differenzialgleichung stetig sein sollten. Man betrachtet dann geeignete Grenzwerte zu dem unendlichen Kastenpotenzial und überzeugt sich, dass die Lösungen stetig
bleiben. Eine physikalische Begründung lautet, dass die Ableitung von ψ(x), die mit dem Impuls
zusammenhängt, am Kastenrand beschränkt sein soll (sie darf einen Sprung haben, aber es sollte
kein δ-förmiger Beitrag vom Rand kommen). Damit muss ψ(x) selbst wiederum stetig sein.
Es ist sicherlich unbefriedigend, diese für die Quantisierungsbedingung der Energieeigenwerte
so entscheidende Bedingung nicht strenger begründen zu können (zumindest nicht ohne funktionalanalytischen Aufwand). Man kann sich jedoch damit trösten, dass vergleichbare Schwierigkeiten
beispielsweise beim harmonischen Oszillator, beim Coulombpotenzial für Atommodelle oder auch bei
endlichen Kastenpotenzialen nicht auftreten.
Gesucht sind also Lösungen der Gleichung:
2m
d2
ψE (x) = −
E ψE (x)
mit ψ(0) = ψ(L) = 0 .
dx2
~2
(6.36)
Die Lösungen der Differentialgleichung sind bekannt (es ist die Gleichung für einen
harmonischen Oszillator in der klassischen Mechanik, wobei dort x der Zeit entspricht
und durch das Symbol t ersetzt wird). Damit die Lösung ψ(x) die Randbedingungen
erfüllen kann, muss der Ausdruck in Klammern (d.h., die Energie E) positiv sein. Die
allgemeinste Lösung der Gleichung, die ψ(0) = 0 erfüllt, lautet:
r
ψ(x) = A sin
2mE
x
~2
!
.
(6.37)
Da andererseits aber auch ψ(L) = 0 gelten soll, muss die sogenannte Quantisierungsbedingung gelten:
r
2mE
(nπ~)2
L = nπ bzw. En =
.
(6.38)
~2
2mL2
128
Potenzialsysteme
Wir gelangen also zu einer ersten wichtigen Schlussfolgerung: Die Bedingungen an die
Lösungen der Schrödinger-Gleichung sind nicht für beliebige Werte für E erfüllbar,
sondern nur für einen diskreten Satz {En } von Energiewerten.
Allgemein könnte n eine beliebige ganze Zahl sein, doch nicht alle Möglichkeiten
entsprechen verschiedenen Zuständen. Der Fall n = 0 führt auf die triviale Lösung
ψ(x) ≡ 0. Sie entspricht keinem Zustand (im Sinne eines Strahls im Hilbertraum).
Wegen der Asymmetrie der Sinus-Funktion, sin x = − sin(−x), definiert ein negativer
Wert für n denselben Zustand wie ein positiver Wert. Verschiedene Zustände erhalten
wir somit für n = 1, 2, 3, . . ..2
Lösungen der zeitunabhängigen Schrödinger-Gleichung zu verschiedenen Zuständen sind somit:
nπx n = 1, 2, 3, ...
(6.39)
ψn (x) = An sin
L
mit den zugehörigen Energieeigenwerten
En =
(nπ~)2
.
2mL2
(6.40)
Da wir Zustände durch normierte Eigenvektoren (in diesem Fall Eigenfunktionen“)
” RL
repräsentieren wollen, müssen wir die Amplitude noch so wählen, dass 0 |ψn (x)|2 dx =
1. Das führt auf die Bedingung:
2
Z
|An |
L
sin2
nπx 0
L
dx = 1
(6.41)
oder
r
An =
2
.
L
(6.42)
Zunächst könnte man meinen, dass mit den möglichen Energiewerten (6.40) auch bestimmte
Impulse pn = nπ~
L einhergehen. Dies ist aber nicht der Fall: Offenbar sind die Sinus-Funktionen keine
Eigenfunktionen zum Impulsoperator:
P sin
nπ nπ nπ d
nπ
x = −i~
sin
x = −i~
cos
x
L
dx
L
L
L
(6.43)
Sie sind aber Eigenfunktionen zum Quadrat des Impulsoperators:
nπ nπ nπ~ 2
nπ 2
2 d
P sin
x = −~
sin
x
=
sin
x .
L
dx2
L
L
L
2
2
(6.44)
Man beachte, dass die Entartung der Energieeigenwerte En für positive und negative Werte
von n noch kein Grund ist, eine der beiden Möglichkeiten auszuschließen; man muss überprüfen,
ob physikalisch unterschiedliche Zustände vorliegen, also ob die zugehörigen Wellenfunktionen linear
unabhängig sind.
Das unendliche Kastenpotenzial
129
Tatsächlich zeigt die komplexe Zerlegung der Sinus-Funktion in zwei Exponentialfunktionen, dass die
Energieeigenfunktionen Superpositionen von Zuständen mit positivem und negativem Impuls sind,
und daher keinen reinen Impulseigenwert haben, wohl aber einen reinen Eigenwert zum Quadrat des
P2
auch zu erwarten ist.
Impulses, wie es aus der Darstellung der Energie H = 2m
ΨHxL
ÈΨHxLÈ2
En
0
En
n=6
n=6
n=5
n=5
n=4
n=4
n=3
n=2
n=1
n=3
n=2
n=1
L
0
L
Abbildung 6.1: Die niedrigsten Energieeigenfunktionen (links) und ihre Absolutquadrate (rechts) beim unendlichen Kastenpotenzial.
Als Ergebnis erhalten wir die normierten Eigenfunktionen und die zugehörigen
Eigenwerte für das 1-dimensionale Kastenpotenzial:
r
nπ 2
(nπ~)2
sin
x
En =
n = 1, 2, 3, ...
(6.45)
ψn (x) =
L
L
2mL2
Diese Eigenfunktionen zum Energieoperator bilden ein vollständiges Orthonormalsystem, das sich auch als Basis für beliebige Funktionen über dem Intervall [0, L] eignet.
Die Orthogonalität der Eigenfunktionen folgt aus der Eigenschaft:
2
L
Z
L
0
nπ mπ sin
x sin
x dx = δmn .
L
L
(6.46)
Abschließend ein paar Bemerkungen:
1. Die Abhängigkeit der Energieeigenwerte von einigen Parametern sollte man nochmals betonen:
En ∝ n2
En ∝
1
L2
En ∝
1
m
En ∝ ~2
(6.47)
130
Potenzialsysteme
- Die erste Abhängigkeit bedeutet, dass die Abstände zwischen den Energien
mit zunehmendem n immer größer werden. Dies ist zunächst eigenartig,
da für sehr große (makroskopische) Energien auch die Lücken zwischen benachbarten Energieeigenwerten sehr groß werden. Andererseits ist
En+1 − En
2n + 1
∆En
2
=
=
→ .
2
En
En
n
n
(6.48)
Relativ werden die Abstände somit kleiner. Außerdem handelt es sich um
eine Besonderheit des 1-dimensionalen Kastens. In drei Dimensionen kann
man zeigen, dass die Anzahl der Zustände in einem vorgegebenen Energieintervall mit wachsender Energie zunimmt.
- Die zweite Abhängigkeit bedeutet, dass die Energieeigenwerte immer enger zusammenrücken, je größer der Kasten ist. Drückt man den Kasten
sehr langsam zusammen, sodass ein Teilchen im n-ten Niveau auch in diesem Niveau bleibt (hier spricht man manchmal von einer adiabatischen Zustandsänderung, obwohl man besser von einer reversiblen Änderung sprechen sollte), so wird die Energie größer. Es gibt also einen Druck.
- Die Proportionalität zu 1/m bedeutet, dass die Energieeigenwerte umso enger zusammenrücken, je größer die Masse m ist. Insbesondere sind die Effekte der Quantisierung für makroskopische Körper praktisch nicht spürbar.
- Die letzte Abhängigkeit zeigt, dass die Diskretheit der Energieeigenwerte
ein Quanteneffekt ist. Sie zeigt aber auch gleichzeitig, dass man für einen
klassischen Grenzfall nicht einfach ~ = 0 setzen darf.
2
(π~)
2. Der niedrigste Energieeigenwert ist E1 = 2mL
2 , also von 0 verschieden. Man
bezeichnet diese Energie als Grundzustandsenergie. Eine solche Grundzustandsenergie muss es aufgrund der Unschärferelationen für räumlich begrenzte Quantensysteme immer geben, denn ein exakt verschwindender Impuls erfordert eine
unendlich ausgedehnte räumliche Verteilung, die aber in einem endlichen Kastenpotenzial nicht vorliegen kann. Ganz grob kann man sagen, dass ∆x von der
Größenordnung von L ist, und somit muss ∆p von der Größenordnung ~/L sein.
~2
2
Dazu gehört aber eine Energie von 2mL
entspricht das
2 . Bis auf den Faktor π
der Grundzustandsenergie.
3. Für sehr große Werte von n werden die Eigenfunktionen sehr rasch oszillierend.
Die Wahrscheinlichkeit, bei einer Messung ein Teilchen in dem Interval [x, x+∆x]
anzutreffen, ist:
2
w∆x (x) =
L
Z
x
x+∆x
sin2
nπ ∆x
x dx ≈
(für n groß).
L
L
(6.49)
Das unendliche Kastenpotenzial
131
Die letzte Approximation ist gültig, wenn die halbe Periode der Sinus-Funktion
L
klein gegenüber der Intervallbreite ∆x ist. In diesem Fall erhalten wir also
n
das klassische Ergebnis, wonach die Aufenthaltswahrscheinlichkeit eines freien
Teilchens (konstante Geschwindigkeit) in einem Kasten überall gleich ist.
4. Die letzte Bemerkung deutet schon darauf hin, dass wir im Grenzfall n → ∞
und ~ → 0 sodass E = const (ein klassischer Energiewert) nicht das klassische
Verhalten erhalten, das wir naiv erwarten würden. Die Eigenfunktionen zum
Energieoperator sind stationär, d.h., die Eigenzustände bleiben zeitlich konstant.
Das klassische Verhalten, nämlich dass ein Teilchen mit einer bestimmten Energie auch eine bestimmte Geschwindigkeit hat und sich in dem Kasten hin- und
herbewegt, wird auch für beliebig große Werte von n nicht beschrieben. Die klassischen Bewegungszustände sind keine (stationären) Energieeigenzustände. Das
Gleiche gilt für klassisch lokalisierte Teilchen: Die Aufenthaltswahrscheinlichkeit
zu den Energieeigenzuständen ist über den gesamten Kasten verteilt. An diesem Beispiel erkennt man schon, dass ein klassischer Grenzfall, der wirklich zu
den klassisch beobachteten Bewegungen und Lokalisierungen führt, nicht selbstverständlich ist.
5. Wir haben das Kastenpotenzial asymmetrisch“ zur 0 gelegt. Dies ist meist
”
unüblich, da man symmetrische Potenziale bevorzugt (die Gründe wurden im
vorigen Abschnitt behandelt). Natürlich hätten wir das Potenzial auch symmetrisch in das Intervall [− L2 , L2 ] legen können. Für die Eigenfunktionen bedeutet
dies eine Verschiebung ψn (x) → ψ̂n (x) = ψn (x + L2 ) und die Energieeigenwerte
ändern sich nicht. Der kleine Nachteil ist, dass die Verschiebung nun eine Fallunterscheidung erfordert und abwechselnd zu Sinus- und Kosinus-Funktionen
führt:
 q
nπ
2

cos
x
n = 1, 3, 5, . . .

L
L
ψ̂n (x) =
(6.50)
q

2
nπ

sin L x
n = 2, 4, 6, . . .
L
Andererseits erkennen wir an dieser Darstellung auch eine Symmetrieeigenschaft
der Lösungen:
ψ̂n (−x) = (−1)n+1 ψ̂n (x) .
(6.51)
Diese Symmetrieeigenschaft der Lösungen hängt mit der Symmetrie des Potenzials zusammen. Es gilt nun V (−x) = V (x), d.h., das Potenzial ändert sich unter einer Paritätstransformation nicht. Definieren wir P (den Paritätsoperator;
nicht zu verwechseln mit dem Impulsoperator) als Operator auf dem Hilbertraum
durch die Vorschrift
P ψ(x) ≡ ψ P (x) = ψ(−x) ,
(6.52)
132
Potenzialsysteme
so kommutiert dieser Operator mit dem Hamilton-Operator: [H, P ] = 0. Nach
den Überlegungen des vorigen Abschnitts können wir die Eigenfunktionen von
H nach den Eigenfunktionen von P klassifizieren. Da P 2 = 1, kann P nur die
Eigenwerte +1 und −1 haben, und die Eigenfunktionen erfüllen
P ψ(x) = ψ(−x) = ± ψ(x) .
(6.53)
Die symmetrischen Funktionen haben somit den Eigenwert +1 und die antisymmetrischen den Eigenwert −1 in Bezug auf P .
6.4
Das endliche Kastenpotenzial — Tunneleffekt
Wir betrachten nun ein ähnliches Problem wie zuvor, allerdings soll das Potenzial nun
eine endliche Höhe haben:
(
0 für |x| ≤ L2
.
(6.54)
V (x) =
V sonst
Außerdem haben wir das Potenzial nun symmetrisch zu 0 gelegt. Der Grund ist (wie
schon im letzten Abschnitt angemerkt), dass die Eigenfunktionen von H nun entweder
symmetrisch ψ(−x) = ψ(x) oder antisymmetrisch ψ(−x) = −ψ(x) gewählt werden
können, weil die Spiegelung am Nullpunkt eine Symmetrie des Problems darstellt.
Innerhalb des Potenzialkastens gilt dieselbe Gleichung, wie schon beim unendlichen Kastenpotenzial:
−
~2 d2
ψ(x) = Eψ(x)
2m dx2
außerhalb des Potenzials gilt
~2 d2
−
+ V ψ(x) = Eψ(x)
2m dx2
|x| ≤
L
,
2
|x| >
oder
~2 d2
ψ(x) = (E − V )ψ(x)
2m dx2
Das können wir auch zusammenfassen:

2m

−
E
ψ(x)
2
2
~
d
ψ(x)
=

dx2
− 2m
(E
−
V
)
ψ(x)
2
~
−
(6.55)
|x| >
L
,
2
(6.56)
L
.
2
|x| ≤
L
2
|x| >
L
2
(6.57)
,
.
(6.58)
Zunächst müssen wir uns wieder überlegen, welche Randbedingungen an die
Wellenfunktion wir bei |x| = L2 zulassen. Da V endlich ist, gibt es keinen Grund anzunehmen, dass die Wellenfunktion außerhalb des Potenzialtopfes verschwindet. Da das
Das endliche Kastenpotenzial – Tunneleffekt
133
Potenzial bei x = ± L2 einen Sprung macht, und ψ(x) an dieser Stelle nicht verschwindet, macht auch das Produkt V (x)ψ(x) dort einen Sprung. Damit die Eigenwertgleichung gelöst werden kann, muss somit auch die zweite Ableitung von ψ(x) an dieser
Stelle einen Sprung machen (sollte aber keinen δ-förmigen Beitrag liefern). Wenn die
zweite Ableitung einen Sprung macht, muss die erste Ableitung einen Knick haben
und somit muss die Wellenfunktion selbst an der Stelle einmal stetig differenzierbar
sein.
Diese Anschlussbedingung wird für die folgende Quantisierungsbedingung wichtig: Wäre, wie beim unendlichen Kastenpotenzial, ein Knick in ψ zulässig, gäbe es keine
Quantisierungsbedingung; ja, es wären sogar alle positiven und negativen Werte für
E zulässig. Erst die Forderung, dass auch die erste Ableitung stetig ist, führt auf die
Einschränkungen.
Allgemein hat die Gleichung
d2
ψ(x) = αψ(x)
dx2
(6.59)
folgende (reelle) Lösungen:
α>0:
√
ψ(x) = A exp(± αx)
(6.60)
bzw. die symmetrischen und antisymmetrischen Kombinationen
√
√
ψ(x) = A cosh αx und ψ(x) = B sinh αx .
(6.61)
Außerdem
α<0:
ψ(x) = A sin
√
αx und
√
ψ(x) = B cos αx .
(6.62)
Der Fall α = 0 führt auf die allgemeine Lösung ψ(x) = c1 +c2 x. Quadratintegrabilität erfordert
c2 = 0. Die Lösung ψ(x) = c ist insofern zulässig, als sie beliebig genau durch quadartintegrable
Funktionen approximiert werden kann.
In Anhang A1 werden die Anschlussbedingungen für die beiden Fälle E > V und
E < V genauer behandelt. Hier fassen wir nur die wichtigsten Ergebnisse zusammen:
E > V : Für E > V gibt es keine Quantisierung der Energie sondern freie Teilchen.
Sowohl im Inneren des Kastens als auch außerhalb erhält man als Lösungen
Winkelfunktionen, wobei die Wellenlänge dieser Winkelfunktionen im Inneren
des Kastens (wegen des größeren Impulses der Teilchen) kleiner ist. Zu jedem
Energiewert erhält man sogar zwei linear unabhängige Lösungen, mit denen man
die Streuung an einem Kastenpotenzial beschreiben kann.
134
Potenzialsysteme
Die Amplituden der Wellenfunktion sich innerhalb des Kastens kleiner als außerhalb. Dies zeigt auch eine quasi-klassische Überlegung: Im äußeren Bereich sind
die Teilchen langsamer als im inneren und haben dort (pro Längeneinheit) im
Mittel eine größere Aufenthaltswahrscheinlichkeit als im Inneren des Kastens.
Etwas entartet ist der Grenzfall E = V . Nun gibt es außerhalb des Kastens nur
eine konstante Lösung (die beliebig genau durch eine quadratintegrable Funktion
approximiert werden kann), sie hat also immer die Ableitung null. Die möglichen
Wellen im Inneren des Kastens haben am Rand jedoch nur die Ableitung null,
√
wenn 2mV /~2 = nπL.
E < V : In diesem Fall sind die erlaubten Energieeigenwerte quantisiert. Es gibt immer
mindestens eine diskrete Lösung. Im Inneren des Kastens, also dem klassisch erlaubten Bereich, erhält man wieder eine Winkelfunktion als Lösung, deren Wellenlänge über die Beziehung von deBroglie mit dem Impulsbetrag des Teilchens
im Kasten zusammenhängt. Außerhalb des Kastens verschwindet die Wellenfunktion exponentiell nach folgender Beziehung:
!
p
2m(V − E)
|x|
(|x| > L/2) .
(6.63)
ψ(x) ∝ exp −
~
6.4.1
Der Tunneleffekt
Alle gebundenen Lösungen beim endlichen Kastenpotenzial haben die Eigenschaft,
dass die Lösungen auch außerhalb des Kastens nicht identisch null sind, d.h., es gibt
selbst für gebundene Teilchen eine nicht verschwindende Wahrscheinlichkeit, dass sie
außerhalb des Kastens angetroffen werden, wenn auch diese Wahrscheinlichkeit mit
zunehmendem Abstand exponentiell abnimmt.
Zur quantitativeren Behandlung des Tunneleffekts stellen wir uns vor, dass das
Potenzial nach einer Dicke d wieder auf null fällt, also von folgender Form ist

L


 0 |x| ≤ 2
V (x) =
(6.64)
V L2 < |x| ≤ L2 + d


 0 |x| > L + d
2
Hinsichtlich der Bedingungen an den Grenzen des Potenzialwalls beschränken wir uns
im Folgenden wieder auf den Fall x > 0, der durch eine symmetrische oder antisymmetrische Erweiterung der Lösungen auch immer auf den Fall x < 0 fortgesetzt werden
kann. Außerdem betrachten wir nur Energien 0 < E < V .
Die stationären Lösungen liefern keine Wahrscheinlichkeit für den Tunnelprozess sondern beschreiben das System, nachdem es in einen Gleichgewichtszustand“
”
gekommen ist, d.h., die Wahrscheinlichkeit für das Tunneln von Innen nach Außen ist
Der harmonische Oszillator
135
ebenso groß wie die Wahrscheinlichkeit für den umgekehrten Prozess. Daher wählen
wir eine etwas andere Strategie. Wir nehmen an, dass der Kasten zunächst unendlich dick ist, wir es also mit einem richtigen Kastenpotenzial zu tun haben. Dann
bestimmen wir das Integral über das Absolutquadrat des Teils der Wellenfunktion,
der einen Abstand von mehr als L2 + d vom Kastenmittelpunkt hat. Dies gibt uns eine
Vorstellung, mit welcher Wahrscheinlichkeit sich das Teilchen außerhalb des Bereichs
befindet, in dem das tatsächliche Kastenpotenzial liegt.
Nach den Überlegungen des letzten Abschnitts hat die Wellenfunktion in den
Kastenwänden die Form
√
ψ(x) ∝ exp(− ν − x)
für |x| >
L
.
2
(6.65)
Über den Bereich d im Inneren der Kastenwand fällt die Amplitude um den Faktor
√
exp(− ν − d)
(6.66)
und damit die Wahrscheinlichkeit um den Faktor
√
w ∝ exp(−2 ν − d)
(6.67)
ab. Diese Größe gibt an, mit welcher Wahrscheinlichkeit ein Teilchen pro Zeiteinheit
durch die Kastenwand hindurchtunneln kann. Im Exponenten steht also sowohl die
Wanddicke als auch die (Wurzel aus der) Differenz zwischen der Energie des Teilchens
und der Potenzialhöhe. Die mittlere Zeit, bis ein Teilchen ein solches Kastenpotenzial
verlassen hat, ist also proportional zum Inversen dieses Faktors und exponentiell groß
als Funktion der Wanddicke und der zu überwindenden Potenzialbarriere.
Diese exponentielle Abhängigkeit der Tunnelwahrscheinlichkeit von der Dicke
d des zu überwindenden Potenzials spielt beim Rastertunnelmikroskop eine wichtige Rolle. Beim Rastertunnelmiskroskop wird eine mikroskopisch feine Metallspitze
dicht über eine abzutastende Oberfläche gebracht und zwischen der Metallspitze und
der Oberfläche eine Spannung angelegt. Der Zwischenraum zwischen Metallspitze und
Oberfläche entspricht der Potenzialwand, die von einem Elektron überwunden werden
muss, damit ein Strom fließt. Durch den Tunneleffekt kann es trotzdem zu einem Elektronenfluss und damit zu einem Strom kommen. Dieser Strom hängt exponentiell von
dem Abstand d ab und erlaubt dadurch sehr feine Bestimmungen von d. In der Praxis
hält man meist den Strom konstant, indem man (über Piezokristalle) die Höhe der
Spitze variiert, sodass der Abstand von der rauen Oberfläche konstant bleibt. Gerade
wegen der exponentiellen Abhängigkeit von dem Abstand d ist dieses Verfahren sehr
empfindlich.
136
6.5
Potenzialsysteme
Der harmonische Oszillator
Wir betrachten im Folgenden den 1-dimensionalen harmonischen Oszillator. Auf Verallgemeinerungen auf mehr als eine Dimension gehen einige Anmerkungen ein.
Die zeitunabhängige Schrödinger-Gleichung für den eindimensionalen harmonischen Oszillator lautet:
~2 d2
mω 2 2
(6.68)
x ψ(x) = Eψ(x) ,
−
+
2m dx2
2
p
wobei wir ω = k/m als Eigenfrequenz des klassischen Oszillators eingeführt haben
(und k im klassischen Fall die Federkonstante“ bezeichnet).
”
Geschicktes Raten“ zeigt, dass eine Gauß-Funktion eine Lösung der Gleichung
”
darstellen kann, da
d2 −αx2
2
e
= (−2α + 4α2 x2 )e−αx .
(6.69)
2
dx
Durch Vergleich mit der Schrödinger-Gleichung erhalten wir
mω x2
(6.70)
ψ0 (x) = A0 exp −
2~
(A0 eine geeignete Normierung) und
1
E0 = ~ω .
2
(6.71)
(Theoretisch könnte α auch negativ sein, was sowohl das Vorzeichen im Exponenten
der Lösung (6.70) als auch das der Energie (Gl. 6.71) umkehren würde; doch die so
erhaltene Lösung wäre nicht quadratintegrabel.)
6.5.1
Exakte Lösung der Schrödinger-Gleichung
Man könnte nun durch weiteres geschicktes Raten einen Ansatz der Form
ψ(x) = H(x)e−αx
2
(6.72)
versuchen, wobei H(x) ein Polynom in x ist. In diesem Fall erhält man wieder α = mω
2~
sowie für H(x) die Differentialgleichung:
2mω
2mE mω
00
0
H (x) −
x H (x) +
−
H(x) = 0 ,
(6.73)
~
~2
~
die man nun durch geeignete Ansätze für Polynome in x lösen kann. Auf diese Weise
erhält man z.B. für H1 (x) = x als Lösung:
mω ψ1 (x) = A1 x exp −
x2
(6.74)
2~
Der harmonische Oszillator
137
(A1 eine geeignete Normierung) und
3
E1 = ~ω .
2
(6.75)
Da das Potenzial des harmonischen Oszillators invariant unter einer Paritätstransformation x → −x ist (und die Gauß-Funktion ebenfalls invariant ist), kommen als
(nicht-entartete) Lösungen von Gleichung (6.73) nur gerade bzw. ungerade Polynome
in x in Frage. H0 = 1 (zur Lösung 6.70) und H1 = x erfüllen diese Bedingung. Die
Polynome höherer Ordnung sind jedoch Linearkombinationen aus nur geraden bzw.
nur ungeraden Potenzen von x.
Ein wesentlich eleganterer Weg ist der Folgende: Man schreibt
1
mω 2
2
H = ~ω
P +
Q
(6.76)
2m~ω
2~
und definiert zunächst
r
r
mω
1
a† =
Q+i
P
2~
2m~ω
sodass
r
und
a=
mω
Q−i
2~
r
1
P,
2m~ω
ω
1
†
H = ~ω a a − i [Q, P ] = ~ω a a +
.
2
2
†
(6.77)
(6.78)
Für die Operatoren a† und a verifiziert man leicht die Vertauschungsrelationen
[a† , a† ] = [a, a] = 0
und
[a† , a] = −1 ,
(6.79)
[H, a] = −~ωa .
(6.80)
und daraus wiederum
[H, a† ] = +~ωa†
und
Sei nun |Ei ein beliebiger Eigenvektor von H, also H|Ei = E|Ei, dann gilt offenbar:
H a† |Ei = a† H|Ei + ~ωa† |Ei = (E + ~ω) a† |Ei
(6.81)
und entsprechend
H (a|Ei) = aH|Ei − ~ωa|Ei = (E − ~ω) (a|Ei) .
(6.82)
Die Vektoren a† |Ei und a|Ei sind also wieder Eigenvektoren zu H und zwar mit
den Eigenwerten E + ~ω bzw. E − ~ω. Auf diese Weise können wir aus bekannten
Eigenzuständen neue Eigenzustände konstruieren. Man bezeichnet a† auch als Aufsteigeoperator und a als Absteigeoperator.
Es hat zunächst den Anschein, dass wir auf diese Weise nicht nur Energieeigenzustände zu beliebig hohen Werten konstruieren können, sondern mithilfe der
138
Potenzialsysteme
Absteigeoperatoren auch Energieeigenzustände zu beliebig negativen Energieeigenwerten. Das ist jedoch nicht der Fall, wie wir sofort zeigen werden. Sei |Ei ein normierter
Energieeigenzustand (also hE|Ei = 1), dann gilt für die Norm des Zustands a|Ei):
2
†
ka|Eik = hE|a a|Ei =
1
E
−
~ω 2
hE|Ei =
E
1
−
~ω 2
(6.83)
H
(wobei wir a† a = ~ω
− 21 ausgenutzt haben.) Damit die Norm positiv bleibt (der
Zustand also normierbar ist), darf die rechte Seite nie negativ werden. Das ist aber
nur der Fall, wenn die rechte Seite irgendwann einmal null wird (also ein Eigenvektor
durch einen Absteigeoperator zum Nullvektor wird) und somit die Energie eine untere
Grenze besitzt, die durch E0 = 12 ~ω gegeben ist. Durch Anwendung von a† auf diesen
Zustand erhalten wir einen nach oben unbeschränkten Turm von Eigenzuständen von
H mit Eigenwerten:
1
n = 0, 1, 2, 3 . . .
(6.84)
En = ~ω n +
2
Andere Eigenwerte als diese kann es auch nicht geben, da man sonst durch wiederholte Anwendung der Absteigeoperatoren Zustände mit negativer Norm“ erzeugen
”
könnte. Außerdem können diese Zuände nicht entartet sein (es sei denn, |E0 i ist schon
entartet).
Mit diesem Trick haben wir somit schon das gesamte Energiespektrum des eindimensionalen harmonischen Oszillators gefunden. Außerdem können wir mithilfe des
Aufsteigeoperators alle Eigenzustände konstruieren (bis auf die Normierung), wenn
wir von dem sogenannten Grundzustand zur Energie E0 = 21 ~ω starten. Die zugehörige
Wellenfunktion haben wir aber schon gefunden (Gl. 6.70). Wir erhalten also (in der
Ortsdarstellung) aus ψ0 (x) die Wellenfunktion des ersten angeregten Zustands:
!
r
mω mω
~
d
x−
exp −
x2
ψ1 (x) ∝ a† ψ0 (x) = A0
2~
2mω dx
2~
mω x2
= A1 2x exp −
2~
r
(6.85)
(6.86)
mit der neuen Normierungskonstanten A1 . Diese Lösung hatten wir zuvor schon erraten. Für die weiteren Überlegungen ist es hilfreich, eine neue (dimensionslose) Variable
r
y=
mω
x
~
(6.87)
zu definieren, sodass
1
a =√
2
†
d
y+
.
dy
(6.88)
Der harmonische Oszillator
139
Bis auf Normierungsfaktoren ist dann:
1 2
ψ0 (y) = A0 exp − y
und
2
1 2
ψ1 (y) = A1 2y exp − y
2
und durch erneute Anwendung von a† folgt:
1
d
1 2
†
ψ2 (y) ∝ a ψ1 (y) = A1 √ y −
2y exp − y
dy
2
2
1
= A2 4y 2 − 2 exp − y 2 .
2
(6.89)
(6.90)
(6.91)
(Die Wahl des Koeffizienten vor den Polynomen ist Konvention.) Auf diese Weise
erhält man für ψn (y) ein Polynom n. Ordnung multipliziert mit einer Gaußfunktion.
Diese Polynome bezeichnet man auch als Hermite-Polynome:
H0 (y) = 1
(6.92)
H1 (y) = 2y
(6.93)
2
H2 (y) = 4y − 2
(6.94)
3
H3 (y) = 8y − 12y
4
(6.95)
2
H4 (y) = 16y − 48y + 12
(6.96)
H5 (y) = 32y 5 − 160y 3 + 120y
..
..
.
.
(6.97)
Insgesamt erhalten wir als Eigenfunktionen für den harmonischen Oszillator:
r
2
y
mω
ψn (x) = An Hn (y) exp −
y=
x,
2
~
(6.98)
(6.99)
mit der Normierung
p
4
mω/~
An = p
(6.100)
√ .
2n n! π
Zusammenfassend können wir sagen: Die Energieeigenwerte beim harmonischen
Oszillator (in einer Dimension) sind äquidistant (mit Abstand ∆E = ~ω). Es gibt eine
Grundzustandsenergie E0 = 21 ~ω zum Zustand niedrigster Energie, und die möglichen
Energieeigenwerte sind En = ~ω(n+ 12 ) (n = 0, 1, 2, ...). Die Parität des Grundzustands
ist +1, ebenso die Parität aller Eigenfunktionen zu geraden n, die anderen Eigenfunktionen haben ungerade Parität (diese Eigenschaft folgt sofort indem man beobachtet,
dass a† ein Operator ungerader Parität ist):
ψ2n (−x) = ψ2n (x)
ψ2n+1 (−x) = −ψ2n+1 (x) .
(6.101)
Für sehr große Werte von n erhält man Eigenfunktionen, die außerhalb des
Potenzials rasch abfallen (entsprechend der Gauß–Funktion) und im Inneren sehr rasch
140
Potenzialsysteme
E @ÑΩD
5
-4
-2
E @ÑΩD
5
4
4
3
3
2
2
1
1
0
2
y
4
-4
-2
0
2
4
y
Abbildung 6.2: Die niedrigsten Energieeigenfunktionen (links) und ihre Absolutquadrate (rechts) für den harmonischen Oszillator.
ÈΨHxLÈ2
0.25
0.20
0.15
0.10
0.05
-10
-5
0
5
10
y
Abbildung 6.3: Das Absolutquadrat der Energieeigenfunktion für den harmonischen
Oszillator zu n = 50. Gezeigt ist außerdem die klassische Aufenthaltswahrscheinlichkeitsdichte w(x) für den entsprechenden Energiewert.
Der harmonische Oszillator
141
oszillieren. Dabei ist die Amplitude an den Rändern etwas größer als in der Mitte.
Das bedeutet, die Wahrscheinlichkeit, das Teilchen bei einer Messung in Randnähe zu
finden, ist größer als in der Mitte. Das entspricht auch unserer klassischen Anschauung:
Die Geschwindigkeit am Rand ist geringer und daher hat es dort im Durchschnitt eine
höhere Aufenthaltswahrscheinlichkeit als in der Mitte.
Klassisch kann man diese Aufenthaltswahrscheinlichkeit aus der Lösung
dx(t)
= ωA cos ωt
dt
x(t) = A sin ωt
(6.102)
leicht bestimmen. Aus der Geschwindigkeit erhalten wir eine Beziehung zwischen dt
— dem Zeitintervall, für das sich ein Teilchen in dem Intervall x + dx aufhält:
p
p
dx = ωA cos ωt dt = ω A2 − A2 sin2 ωt dt = ω A2 − x(t)2 dt
(6.103)
oder
dt =
dx
ω A2 − x2
√
(6.104)
Mit der Periode T = 2π
folgt für die relative Zeitspanne, die sich ein Teilchen im
ω
Intervall dx aufhält (es gibt noch einen extra Faktor 2, da jedes Intervall dx in einer
Periode T zweimal durchlaufen wird):
ω(x)dx =
dx
dt
= √
T
π A2 − x2
(6.105)
oder
1
w(x) = √
.
(6.106)
π A2 − x2
Dies ist die Aufenthaltswahrscheinlichkeitsdichte des klassischen Teilchens am Ort x.
Die Wahrscheinlichkeitsdichte ist zwar an den Umkehrpunkten x = ±A singulär, aber
immer noch integrabel. Dieser Funktion nähert sich das gemittelte Absolutquadrat
der Wellenfunktion des harmonischen Oszillators für sehr große Werte von n an (siehe
Abb. 6.3).
6.5.2
*Auf- und Absteigeoperatoren in der
Quantenfeldtheorie
In einer Quantenfeldtheorie gibt es nicht nur einen Schwingungsmod, sondern unendlich viele: Jede mögliche Schwingung, die mit den Randbedingungen verträglich
ist, wird zu einem Mod. Die Feldgleichungen bestimmen eine Beziehung zwischen der
Frequenz ω des Schwingungsmods und der Wellenlänge bzw. der Wellenzahl ~k. Die
Beziehung ω(~k) bezeichnet man auch als Dispersonsrelation. Im einfachsten Fall einer freien Quantenfeldtheorie (die nur freie Teilchen ohne Wechselwirkung beschreibt)
142
Potenzialsysteme
kann jeder der Moden n-fach besetzt sein. Dies interpretiert man als n Teilchen mit
der Wellenzahlt ~k bzw. der Energie ~ω(~k).
Es gibt zu jedem durch ~k definierten Schwingungsmod Auf- und Absteigeoperatoren a+ (~k) bzw. a(~k). Die Anwendung eines Aufsteigeoperators auf einen Zustand
erzeugt ein Teilchen mit der zugehörigen Wellenzahl ~k, entsprechend vernichtet ein
Absteigeoperator ein Teilchen mit dieser Wellenzahl (sofern ein solches in dem Zustand vorhanden ist, andernfalls erhält man die 0). Dementsprechend spricht man in
der Quantenfeldtheorie auch von Erzeugungs- und Vernichtungsoperatoren.
Die Kommutatorregeln der Auf- und Absteigeoperatoren bestimmen ihre Statistik: Bei Bosonen kommutieren die Auf- und Absteigeoperatoren zu verschiedenen
Moden ~k, bei Fermionen fordert man Antikommutationsrelationen. Auf diese Weise sind Mehrteilchenzustände nach Konstruktion symmetrisch oder antisymmetrisch
unter Permutation der Teilchen (siehe auch Kap. 8).
Wechselwirkungen zwischen Teilchen lassen sich praktisch nur störungstheoretisch behandeln. Dabei treten Kombinationen aus mehreren Auf- und Absteigeoperationne auf. Beispielsweise beschreibt ein Ausdruck der Form a+ (~k1 )a+ (~k2 )a(~k3 ) die
Vernichtung eines Teilchens zum Mod ~k3 und gleichzeitige Erzeugung zweier Teilchen mit den Moden ~k1 und ~k2 . Energie- und Impulserhaltung erfordern gewisse Einschränkungen and die möglichen Moden bei solchen Wechselwirkungen.
Da es zu jedem Mod auch eine Grundzustandsenergie 12 ~ω(~k) gibt, und die
Anzahl der Moden im Prinzip unendlich ist, erhält man formal in einer Quantenfeldtheorie auch eine unendliche Grundzustandsenergie. Da aber nur Energiedifferenzen
beobachtet werden, spielt dies im Allgemeinen keine Rolle. Lediglich für eine Theorie
der Gravitation könnte diese Grundzustandsenergie von Bedeutung sein, ihre Rolle ist
aber immer noch umstritten. Dass diese Grundzustandsenergie aber tatsächlich physikalisch ist, zeigt sich im Casimir-Effekt [16, 50]: Die möglichen Moden einer Quantenfeldtheorie in einem endlichen (kleinen Volumen) hängen von den Abmessungen des
Volumens ab. Daher erwartet man eine Kraft auf zwei sehr eng beieinanderliegende
leitende Platten im Vakuum. Dieser Effekt wurde tatsächlich gemessen.
6.5.3
Semiklassische Berechnung der Grundzustandsenergie
Wir hatten schon beim Kastenpotenzial gesehen, dass die Grundzustandsenergie sich
als Folge der Unschärferelation deuten und zumindest bis auf konstante Faktoren auch
berechnen lässt. Eine solche halbklassische Überlegung führt beim harmonischen Oszillator sogar zum exakten Ergebnis.
Ersetzen wir in dem klassischen Ausdruck für die Energie des Oszillators
E=
1 2 mω 2 2
p +
x
2m
2
(6.107)
Radialpotenziale und Kugelflächenfunktionen
143
den Ort“ x durch ~/2p, also das Mininum, was für einen gegebenen Impuls p nach
”
der Unschärferelation zugelassen wäre, so erhalten wir
E=
1 2 mω 2 ~2
p +
.
2m
8p2
(6.108)
Durch Bilden der Ableitung erhalten wir das Minimum der Energie für p = mω~/2,
und die Energie für diesen Wert ist
E=
6.5.4
1
1 mω~ mω 2 ~2 2
+
= ~ω .
2m 2
8 mω~
2
(6.109)
Der harmonische Oszillator in höheren Dimensionen
In mehr als einer Dimension kann man die Schrödinger-Gleichung des harmonischen
Oszillators leicht durch einen Separationsansatz, beispielsweise ψ(x, y, z) = ψ1 (x)ψ2 (y)ψ3 (z)
lösen. Dieser Ansatz führt für die Funktionen ψi jeweils auf die Gleichung des 1
dimensionalen Oszillators mit einer Energie Ei = ~ω ni + 21 , und die Gesamtenergie
ist einfach die Summe der Teilenergien. Der Quantenzustand beispielsweise eines 3dimensionalen Oszillators lässt sich also durch drei Quantenzahlen n1 , n2 , n3 charakterisieren, und die allgemeine Lösung hat die Form
mω
(x2 + y 2 + z 2 ) ,
Ψn1 n2 n3 (x, y, z) = N Hn1 (x)Hn2 (y)Hn3 (z) exp −
2~
(6.110)
(Hi bezeichnet wieder die Hermite-Polynome), und die zugehörige Energie ist
3
E = ~ω n1 + n2 + n3 +
2
(ni = 0, 1, 2, 3, ...) .
(6.111)
Die möglichen Energien sind zunehmend entartet: Während der Grundzustand E =
3
~ω zu (ni = 0) eindeutig ist, ist der erste angeregte Zustand mit der Energie E = 52 ~ω
2
schon 3-fach entartet (jeder der drei n-Werte kann 1 sein, die anderen beiden sind 0)
und der zweite angeregte Zustand ist schon 6-fach entartet (mit den Quantenzahltripeln {(2, 0, 0), (0, 2, 0), (0, 0, 2), (1, 1, 0), (1, 0, 1), (0, 1, 1)}.
Im folgenden Abschnitt lösen wir allgemein radialsymmetrische Potenziale und
stoßen dabei auf die Kugelflächenfunktionen, die mit Eigenzuständen zum Drehimpuls
in Beziehung stehen. Natürlich lässt sich auch der 3-dimensionale harmonische Oszillator auf diese Weise lösen. Damit ergeben sich interessante Beziehungen zwischen den
Hermite-Polynomen und den Kugelflächenfunktionen. Außerdem zeigt sich, dass die
Entartung der Energiezustände unter anderem auch mit der Rotationssymmetrie und
der Drehimpulserhaltung zu tun hat.
144
6.6
Potenzialsysteme
Radialpotenziale und Kugelflächenfunktionen
In drei Raumdimensionen spielen Potenziale, die nur vom Abstand eines massebehafteten Körpers von einem Kraftzentrum abhängen, eine besonders wichtige Rolle.
Im nächsten Kapitel werden wir kurz das Wasserstoff-Atom (bzw. allgemeiner das
Coulomb-Problem) betrachten. Zuvor wollen wir jedoch einige allgemeine Bemerkungen zum Zentralkraftproblem anführen.
In drei Dimensionen lautet die zeitunabhängige Schrödinger-Gleichung für ein
Zentralpotenzial:
~2
∆ + V (r) ψ(x, y, z) = Eψ(x, y, z) ,
(6.112)
−
2m
wobei ∆ der Laplace-Operator ist. Ähnlich wie schon in der klassischen Mechanik ist
es auch in der Quantenmechanik sinnvoll, bei Zentralpotenzialen zu Kugelkoordinaten
zu wechseln. Der Laplace-Operator lautet in Kugelkoordinaten:
1 ∂
1
2 ∂Ψ
∆Ψ(r, θ, ϕ) = 2
(6.113)
r
+ 2 LΨ ,
r ∂r
∂r
r
wobei L ein Differenzialoperator in den Winkeln ist, d.h. nur von θ und ϕ sowie deren
Ableitungen abhängt:
1 ∂
∂Ψ
1 ∂ 2Ψ
LΨ(r, θ, ϕ) =
sin θ
+
.
(6.114)
sin θ ∂θ
∂θ
sin2 θ ∂ϕ2
Es bietet sich daher an, die Funktion Ψ(r, θ, ϕ) in einen Radial- und einen Winkelanteil
zu separieren:
Ψ(r, θ, ϕ) = R(r)Y (θ, ϕ) .
(6.115)
Setzen wir diesen Ansatz in die Schrödinger-Gleichung ein, so erhalten wir zwei Gleichungen:
LY (θ, ϕ) = −l(l + 1)Y (θ, ϕ)
(6.116)
und
l(l + 1)
~2 1 ∂
2 ∂R(r)
−
r
−
R(r) + V (r)R(r) = ER(r) .
2m r2 ∂r
∂r
r2
(6.117)
Wir haben die freie Konstante, die bei dem Separationsansatz auftritt, zunächst willkürlich mit l(l + 1) bezeichnet. Der Grund wird später offensichtlich. Zunächst könnte
l(l + 1) noch eine beliebige reelle Zahl sein (reell, weil L bezüglich des Skalarprodukts
in Kugelkoordinaten ein selbst-adjungierter Operator ist).
Die Eigenwertgleichung
∂Y (θ, ϕ)
1 ∂ 2 Y (θ, ϕ)
1 ∂
sin θ
+
= −l(l + 1)Y (θ, ϕ)
(6.118)
sin θ ∂θ
∂θ
sin2 θ ∂ϕ2
Radialpotenziale und Kugelflächenfunktionen
145
löst man wiederum durch einen Separationsansatz in den Winkeln
Y (θ, ϕ) = Θ(θ)Φ(ϕ)
(6.119)
was für Φ(ϕ) auf die sogenannte Azimutalgleichung
d2 Φ(ϕ)
= −m2 Φ(ϕ)
dϕ2
und für Θ(θ) auf die Polargleichung
1 ∂
∂Θ(θ)
m2
sin θ
−
Θ(θ) + l(l + 1)Θ(θ) = 0
sin θ ∂θ
∂θ
sin2 θ
(6.120)
(6.121)
führt. Die Lösungen der Azimutalgleichung sind komplexe Exponentialfunktionen (Winkelfunktionen):
Φ(ϕ) = e±imϕ ,
m = 0, ±1, ±2, ...
(6.122)
wobei die Ganzzahligkeit der magnetischen Quantenzahl m aus der Bedingung folgt,
dass die Funktion auf der Kugeloberfläche glatt bzw. eindeutig ist.
Die Lösungen der Polargleichung lassen sich als Polynome in cos θ und sin θ
schreiben. Allerdings sind auch hier die Lösungen nur dann eindeutig, wenn die Quantenzahl l eine natürliche Zahl (l = 0, 1, 2, 3, ...) ist. Außerdem gibt es eine Einschränkung für die magnetische Quantenzahl: m ≤ l.
Die Lösungen der Polargleichung bezeichnet man als zugeordnete LegendrePolynome. Die führenden Polynome sind:
P00 (cos θ) = 1
(6.123)
P10 (cos θ) = cos θ
(6.124)
P11 (cos θ)
(6.125)
= − sin θ
1
(3 cos2 θ − 1)
P20 (cos θ) =
2
P21 (cos θ) = −3 sin θ cos θ
(6.126)
P22 (cos θ) = 3(1 − cos2 θ)
(6.128)
(6.127)
Allgemein gilt;
Plm (cos θ) =
l+m
(−1)m
(cos2 θ − 1)l
md
(sin
θ)
.
2l l!
(d cos θ)l+m
(6.129)
Insgesamt erhalten wir somit für die Lösung der Winkelabhängigkeit der Eigenfunktionen des Energieoperators zu einem rotationssymmetrischen Problem die
Kugelflächenfunktionen:
1
Ylm (θ, ϕ) = √ Nlm Plm (cos θ) exp(imϕ) ,
2π
(6.130)
146
Potenzialsysteme
wobei die Normierungskonstanten Nlm so zu wählen sind, dass die Orthonormalitätsrelationen gelten:
Z
2π
dϕ
0
6.7
Z
1
0
∗ m
d(cos θ) (Ylm
0 (θ, ϕ)) Yl (θ, ϕ) = δll0 δmm0 .
(6.131)
−1
Der Bahndrehimpuls
Wie wir gesehen haben, tritt in der Schrödinger-Gleichung in Kugelkoordinaten ein
Term der Form
~2
l(l + 1)
(6.132)
2mr2
auf. Schreiben wir in der klassischen Mechanik die Energie in Kugelkoordinaten (und
nutzen die Drehimpulserhaltung aus), so erhalten wir:
L2
1
+ V (r)
Eklass = mṙ2 +
2
2mr2
(6.133)
Ein Vergleich mit der quantenmechanischen Beschreibung führt zu der Deutung, dass
die möglichen Eigenwerte für den Betrag des Drehimpulses durch
Spec L̂2 = {~2 l(l + 1)}
oder
p
Spec|L̂| = {~ l(l + 1)}
(l = 0, 1, 2, 3, ...) (6.134)
gegeben sind.
Außerdem legt die Analogie zur klassischen Mechanik nahe, dass
−i~
∂
= L̂z
∂ϕ
(6.135)
der Operator für die z-Komponente des Drehimpulses ist, und somit die Quantenzahl
für die z-Komponente des Drehimpulses gleich lz = ~m (mit m = 0, ±1, ±2, .., ±l) ist.
Diese Beziehungen lassen sich auch direkter ableiten. Klassisch sind die Komponenten des Drehimpulses gegeben durch


x
p
−
x
p
2
3
3
2
3
X


~ =  x3 p 1 − x1 p 3  .
Li =
ijk xj pk
bzw.
L
(6.136)


j,k=1
x1 p 2 − x2 p 1
Die Poisson-Klammer für die Drehimpulskomponenten lautet:
{Li , Lj } =
3
X
k=1
ijk Lk .
(6.137)
Das Wasserstoffatom
147
Das bedeutet für die Kommutatorrelationen der Drehimpulsoperatoren:
[L̂i , L̂j ] = i~
3
X
ijk L̂k .
(6.138)
k=1
Diese Relationen lassen sich in der Ortsdarstellung (bei denen pi durch i~∂i ersetzt
wird) auch direkt aus
3
X
∂
(6.139)
L̂i = i~
ijk xj
∂xk
j,k=1
ableiten. Eine etwas längere Rechnung, bei der diese Ausdrücke in Kugelkoordinaten
übertragen werden, führt auf die schon bekannten Beziehungen für L̂z (Gl. 6.135) und
L̂2 (Gl. 6.118):
L̂z = −i~
L̂
6.8
2
2
= −~
∂
∂ϕ
(6.140)
1 ∂
sin θ ∂θ
∂
1 ∂2
sin θ
+
∂θ
sin2 θ ∂ϕ2
(6.141)
Das Wasserstoffatom
Bisher haben wir den Winkelanteil der Schrödinger-Gleichung zu einem radialsymmetrischen Potenzial gelöst und gesehen, dass wir zwei Quantenzahlen l und m erhalten,
die wir mit dem Betrag des Drehimpulses und der z-Komponente des Drehimpulses in
Beziehung setzen können.
Nun betrachten wir den radialen Anteil der Schrödinger-Gleichung (Gl. 6.117),
in dem noch das Potenzial V (r) steht. Ganz allgemein führt der Ansatz u(r) = rR(r)
in Gl. 6.117 auf folgende Gleichung
2
~ l(l + 1)
~2 ∂ 2 u(r)
+
+ V (r) u(r) = Eu(r) .
(6.142)
−
2m ∂r2
2m r2
Dies ist eine eindimensionale Schrödinger-Gleichung für ein effektives Potenzial:
Veff (r) =
~2 l(l + 1)
+ V (r) ,
2m r2
(6.143)
was im Vergleich mit der klassischen Mechanik nochmals die Rolle von ~2 l(l + 1) als
Quantenanalogon zum Drehimpulsquadrat unterstreicht.
Für das Wasserstoffatom (oder allgemeiner das Coulomb-Problem mit einer
2
Kernladung Ze) setzen wir V (r) = − Zer und erhalten als Radialgleichung:
2
~2 ∂ 2 u(r)
~ l(l + 1) Ze2
−
+
−
u(r) = Eu(r) .
(6.144)
2m ∂r2
2m r2
r
148
Potenzialsysteme
(Man beachte, dass wir hier, wie in der theoretischen Physik oft üblich, die CoulombKonstante 1/(4π) in die Ladung aufgenommen, also Gauß’sche Einheiten gewählt haben. Im Vergleich zu anderen Konventionen wird dieser Faktor daher auch im Ergebnis
fehlen.) Da es sich eigentlich um ein Zweikörperproblem handelt, ist m strenggenommen die reduzierte Masse und r der Relativabstand zwischen Elektron und Atomkern.
Wegen der großen Masse des Atomkerns können wir aber in guter Näherung m = me
(Elektronenmasse) setzen und den Atomkern als nahezu statisch ansehen.
Damit der eigentliche radiale Anteil R(r) = u(r)/r der Wellenfunktion quadratintegrabel bei r = 0 bleibt, sollte u(r) für r → 0 gegen eine Konstante gehen oder
1
verschwinden. (Eigentlich wäre auch eine Potenz r− 2 + mit > 0 zugelassen, aber
eine genauere Analyse zeigt, dass dieser Fall nicht auftritt.) Nehmen wir rα als das
führende Verhalten von u(r) für r → 0 an, so dominiert in diesem Grenzfall der Term
vom Drehimpuls (außer für l = 0) und für eine Lösung von Gl. 6.144 muss gelten:
α(α − 1) = l(l + 1)
(6.145)
mit den beiden Lösungen α = l + 1 und α = −l, oder
(
r→0
u(r) −→
rl+1
r−l
.
(6.146)
Der untere Fall kann (zunächst für l 6= 0, eine genauere Analyse zeigt aber, dass
dies auch für l = 0 gilt) nicht auftreten, da die Lösung nicht quadratintegrabel wäre,
r→0
also bleibt nur u(r) −→ const. × rl+1 übrig. Für r → ∞ können wir die beiden
Potenzialterme vernachlässigen und finden

√
2mE

r
E>0
exp
±
i


~
r→∞
√
(6.147)
u(r) −→
2m|E|


E<0
 exp − ~ r
Der Fall E > 0 führt auf asymptotisch freie Lösungen. Da hier beide Vorzeichen
möglich sind, liefert die eine Randbedingung bei r → 0 keine Einschränkung an den
Energieeigenwert E. Diese Lösungen sind interessant, wenn man Streuprobleme an
Atompotenzialen untersuchen möchte.
√
+( 2m|E|/~)r
Der hier interessantere Fall ist E < 0. Streng genommen wäre auch e
eine Lösung, diese wäre aber nicht quadratintegrabel. Die beiden Randbedingungen
an u(r) für r → ∞ und für r → 0 führen zu einer Quantisierungsbedingung an E.
Es zeigt sich, dass nur folgende Eigenwerte für die Energie möglich sind:
En = −
mZ 2 e4 1
· 2
2~2
n
mit n = 1, 2, 3, ...
(6.148)
Das Wasserstoffatom
149
Die Quantenzahl n bezeichnet man als Hauptquantenzahl. Der tiefste Wert n = 1
bezeichnet die Grundzustandsenergie des Wasserstoffatoms. Für Z = 1 (und m = me
die Elektronenmasse) lautet die Rydberg-Konstante
me4
= 13, 605 eV
(Ionisierungsenergie, n = 1) .
2~2
Dies ist gleichzeitig die Ionisierungsenergie für ein Wasserstoffatom.
(6.149)
Um diese Zahl besser einordnen zu können, vergleichen wir sie mit anderen Größen.
Die thermische Energie zu einer (absoluten) Temperatur T ist E = kB T , wobei kB die
Boltzmann-Konstante ist:
kB = 1, 3806488 (13) · 10−23 J/K = 8, 6173324 (78) · 10−5 eV/K .
(6.150)
Somit entspricht die Ionisierungsenergie von Wasserstoff einer Temperatur von rund T = 157600◦ C.
(Dieser Wert ist allerdings nicht zu verwechseln mit der Temperatur für die Dissoziation eines H2 Moleküls in zwei Wasserstoffmoleküle, die wesentlich kleiner ist.)
Über die Beziehung E = hν kann man eine Energie auch in eine Frequenz für Licht umrechnen.
Mit der Planck’schen Konstanten
h = 6, 626 · 10−34 Js = 4, 1357 · 10−15 eV s
(6.151)
erhalten wir für die zur Ionisierungsenergie von Wasserstoff gehörende Frequenz: ν = 3, 29 · 1015 Hz
oder λ ≈ 90 nm. Im Vergleich zu sichtbarem Licht (zwischen 380 und 750 nm) ist diese Wellenlänge
also kürzer und liegt im Ultraviolettbereich.
Die Ionisierungsenergie für ein Wasserstoffatom (Z = 1), dessen Elektron sich im ersten
angeregten Zustand (n = 2) befindet, ist:
me4 1
= 3, 401 eV
(Ionisierungsenergie, n = 2) .
(6.152)
2~2 4
Sie entspricht einer Wellenlänge von rund 360 nm und kommt somit langsam an den sichtbaren Bereich
heran. Insbesondere liegen viele der Übergangslinien von höher angeregten Zuständen in den n = 2
Zustand (z.B. erscheint die Linie zu dem Übergang von n = 3 zu n = 2 mit λ = 648 nm rot) in diesem
Bereich. Diese Linien entsprechen der Balmer-Serie der Spektrallinien.
6.8.1
Ein semi-klassisches Argument für die Energieniveaus
Die folgende Herleitung“ der Energieniveaus im Wasserstoffatom (Gl. 6.148) macht
”
lediglich von klassischen Beziehungen sowie der deBroglie-Wellenlänge Gebrauch. Wie
nahezu alle Analogien birgt auch dieses Bild die Gefahr, dass es in seiner Anschaulichkeit zu Ernst genommen wird, auch wenn die Überlegungen, die Bohr 1913 zu seinem
Atommodell geführt haben, von dieser Art waren.
Zunächst können wir dem Impuls p über die deBroglie-Beziehung p = h/λ eine
Wellenlänge zuordnen. Verlangen wir nun bei einer Kreisbahn, dass der Umfang dieser
Kreisbahn (2πr) ein ganzzahliges Vielfaches dieser Wellenlänge ist, folgt
2πr = nλ = n
h
p
=⇒
p=
n~
oder pr = n~ .
r
(6.153)
150
Potenzialsysteme
Da pr gleich dem Drehimpuls des Teilchens auf der Kreisbahn ist, folgt durch diese
Beziehung die Quantisierung des Drehimpulses: Der erlaubte Drehimpuls L muss ein
ganzzahliges Vielfaches von ~ sein: L = n~.
Nun betrachten wir speziell eine Kreisbahn im Coulombpotential. Klassisch
müssen die Coulombkraft F = −Ze2 /r2 und die Fliehkraft F = mv 2 /r gleich sein,
womit wir eine klassische Beziehung zwischen dem Bahnradius und dem Impuls p = mv
erhalten:
Ze2 m
Ze2
p2
=⇒
r
=
=
.
(6.154)
r2
mr
p2
Wir verbinden diese Beziehung mit der Quantisierung des Drehimpulses:
n2 ~2 = r2 p2 = Ze2 mr
(6.155)
oder
n2 ~2
.
(6.156)
Ze2 m
Dies sind somit die erlaubten Bahnradien, wenn wir die Quantisierung des Drehimpulses verlangen (oder aber, dass ein Vielfaches der Wellenlänge zum Impuls gerade
in den Bahnumfang passt).
Andererseits folgt klassisch für die Energie des Teilchens im Coulombpotenzial
als Funktion des Radius (indem wir p entweder nach Gl. 6.154 eliminieren oder aber
den klassischen Virialsatz anwenden):
rn =
E=
p2
Ze2
Ze2 Ze2
Ze2
−
=
−
=−
.
2m
r
2r
r
2r
(6.157)
Setzen wir die erlaubten Bahnradien ein, erhalten wir für die zugehörigen Energien:
En = −
Ze2
Z 2 e4 m
=− 2 2 .
2rn
2~ n
(6.158)
Dies ist zwar die richtige Formel (einschließlich aller Faktoren), aber die Beziehung, dass die Quantenzahl n direkt mit dem Drehimpuls L zusammenhängt, ist in der
Quantentheorie falsch, da es zu jedem Wert von n beispielsweise auch den Drehimpuls
L = 0 geben kann. Eine genauere klassische Überlegung muss daher auch elliptische
Bahnkurven mit einbeziehen.
Gleichung (6.156) liefert für das Wasserstoffatom (Z = 1) im Grundzustand
(n = 1) einen Radius, den man als Bohr’schen Radius bezeichnet:
a0 =
~2
≈ 0, 5291772 · 10−10 m .
e2 m
(6.159)
Trotz seiner klassischen Ableitung vermittelt er eine Größenordnung von Atomen.
Kapitel 7
Zeitentwicklung, Funktionalintegral
und Bewegungsgleichungen
Wir werden uns in diesem Kapitel etwas eingehender mit dem Zeitentwicklungsoperator beschäftigen. Wir bestimmen diesen zunächst für die freie Schrödinger-Gleichung
(d.h., der Schrödinger-Gleichung für ein Teilchen, das sich nicht in einem Potenzial
befindet und auch keine Wechselwirkung mit anderen Teilchen hat).
Ausgehend von der bekannten Zeitentwicklung für freie Systeme können wir
dann eine Darstellung des Zeitentwicklungsoperators ableiten, die auf R. Feynman
zurückgeht und unter den Bezeichnungen Funktionalintegral“, Summation über We”
”
ge“ oder auch Summation über Geschichten“ bekannt ist. Diese Darstellung liefert
”
die Begründung für ein Verfahren zur Veranschaulichung der Amplitudenbestimmung,
das R. Feynman ursprünglich in seinem populärwissenschaftlichen Buch QED: The
”
strange theory of light and matter“ [29] eingeführt hat, und das später als Zeiger”
modell“ bekannt und sogar zeitweise in der Schule als didaktische Methode eingesetzt
wurde.
Was man wissen sollte
Zu diesem Kapitel sollte man eigentlich nur einige qualitative Zusammenhänge kennen.
Die Wahrscheinlichkeit, ein Teilchen, das zum Zeitpunkt t = 0 am Ort x
präpariert wurde, zum Zeitpunkt t am Ort y zu messen, ist durch |hy|U (t)|xi|2 gegeben, wobei U (t) der Zeitentwicklungsoperator der Quantenmechanik ist (selbst eine
Lösung der Schrödinger-Gleichung). Wie Richard Feynman gezeigt hat, besitzt die
Amplitude hy|U (t)|xi eine Darstellung als Funktionalintegral: Man summiere über alle möglichen Wege von x nach y und gewichte jeden dieser Wege mit einer Phase, die
sich aus der klassischen Wirkung zu diesem Weg ergibt. Die Summe über all diese
Phasen ist gleich der Amplitude, und das Absolutquadrat dieser Summe ist gleich der
151
152
Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen
angegebenen Wahrscheinlichkeit.
Diese formale Darstellung hat zu der anschaulichen und manchmal auch im
Schulunterricht verwendeten Zeigerrechnung“ geführt: Man denke sich einen Zeiger,
”
der entlang der möglichen Wege wie bei einer Uhr fortschreitet (zur praktischen Veranschaulichung wurden dazu schon mal Pizzarollen verwendet) und addiere (vektoriell)
zum Schluss die Zeigerstellungen zu den möglichen Wegen (beispielsweise den beiden
Wegen bei einem Doppelspalt). Auch wenn dieses Bild sehr anschaulich ist, kann es den
eigentlichen Hintergrund — das Funktionalintegral — nur sehr begrenzt wiedergeben.
Abschließend behandelt dieses Kapitel noch die Heisenberg’schen Bewegungsgleichungen. Während das Schrödinger-Bild eine Zeitabhängigkeit der Zustände (Wellenfunktionen) annimmt, und die Observablen zeitunabhängig lässt, betrachtet man
im Heisenberg–Bild zeitabhängige Observable und zeitunabhängige Zustände. Die Bewegungsgleichungen für die Operatoren gleichen den klassischen Hamilton’schen Bewegungsgleichungen, wenn man die klassische Poisson-Klammer durch einen Kommutator
(multipliziert mit i~) ersetzt. Dieses Korrespondenzprinzip garantiert, dass die Erwartungswerte von Observablen in Zuständen, die einen klassischen Grenzwert zulassen,
den klassischen Bewegungsgleichungen genügen.
7.1
Der Zeitentwicklungsoperator
Allgemein hat die (zeitabhängige) Schrödinger-Gleichung für einen Quantenzustand
|ψ(t)i folgende Form (vgl. Gl. 6.1):
i~
d
|ψ(t)i = H|ψ(t)i .
dt
(7.1)
Dazu hatten wir schon die formale Lösung:
i
|ψ(t)i = U (t)|ψ(0)i = e− ~ Ht |ψ(0)i
(7.2)
mit dem unitären Zeitentwicklungsoperator
i
U (t) = exp − Ht
~
(7.3)
angegeben. Wie im letzten Kapitel soll auch hier H nicht explizit zeitabhängig sein.
U (t) ist ein unitärer Operator auf dem Hilbertraum. Handelt es sich um ein
System mit endlich vielen Zuständen (beispielsweise um Systeme, bei denen man sich
nur für die Spin- bzw. Polarisationsfreiheitsgrade interessiert), so ist H eine Matrix und
ebenso U (t). Möchte man aber auch die räumlichen Freiheitsgrade eines Teilchens oder
allgemeiner eines Systems berücksichtigen, ist der Hilbertraum unendlich dimensional.
Der Zeitentwicklungsoperator
153
H und U (t) sind lineare Operatoren. Wir wollen nun diesen linearen Operator in der
Ortsraumdarstellung bestimmen, d.h., wir wollen
hx|U (t)|yi = U (x, y; t)
(7.4)
bestimmen.
Streng genommen lässt sich jeder lineare Operator A in der Ortsraumdarstellung in der Form
hx|A|yi = KA (x, y)
(7.5)
darstellen (vergleiche auch die Anmerkung auf S. 122). Hierbei handelt es sich um einen Integralkern,
und seine Wirkung auf eine Wellenfunktion ist in der Ortsdarstellung
Z
hx|A|ψi = dy hx|A|yihy|ψi
(7.6)
oder
Z
hx|A|ψi =
dy KA (x, y)ψ(y) .
(7.7)
Viele der Operatoren, mit denen wir es bisher zu tun hatten (Ortsoperator, Impulsoperator, Drehimpulsoperator, Energieoperator), sind jedoch lokal, d.h., KA (x, y) liefert nur einen Beitrag, wenn x = y
ist. Im Sinne von Integralkernen handelt es sich also um Distributionen, welche die δ-Funktion und
ihre Ableitungen enthalten. Beispielsweise ist
hx|Q|yi = yhx|yi = yδ(x − y)
und
hx|P |yi = −i~
d
δ(x − y)
dx
(7.8)
(7.9)
(wobei die Ableitung der δ-Funktion im Sinne von Distributionen zu verstehen ist, d.h., bei der
Anwendung auf eine Testfunktion durch partielle Integration definiert wird). In diesem Fall werden
die Integralkerne zu gewöhnlichen Differentialoperatoren. Der unitäre Zeitentwicklungsoperator ist
jedoch nicht mehr lokal.
In dieser Darstellung des Zeitentwicklungsoperators erhalten wir also für die
Zeitentwicklung einer Wellenfunktion:
Z
ψ(x, t) = dy U (x, y; t) ψ(y, 0) ,
(7.10)
wobei ψ(y, 0) eine beliebige Anfangskonfiguration bezeichnet. (Wie schon in Kap. 6
erwähnt, ist die Schrödinger-Gleichung eine Differentialgleichung 1. Ordnung in der
Zeit, sodass eine beliebige Anfangskonfiguration vorgegeben werden kann.) Von dem
Integralkern U (x, y; t) wissen wir nur, dass er selbst der Schrödinger-Gleichung genügen
muss (vgl. Gl. 5.28):
d
~2 d2
i~ U (x, y; t) = −
+ V (x) U (x, y; t) .
(7.11)
dt
2m dx2
154
Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen
Außerdem muss der Integralkern für t = 0 zum Identitätsoperator werden, also
U (x, y; 0) = δ(x − y) .
(7.12)
Damit haben wir die (zeitabhängige) Schrödinger-Gleichung zu dieser Anfangsbedingung zu lösen, wodurch gleichzeitig auch die Normierung von U (x, y; t) festgelegt ist.
Wir interessieren uns zunächst für den freien Zeitentwicklungsoperator, also
V (x) ≡ 0. Es gibt viele Lösungswege, von denen zwei im Anhang A2 skizziert werden.
Hier geben wir einfach die Lösung an und kontrollieren, dass sie sowohl die SchrödingerGleichung als auch die Anfangsbedingung erfüllt:
r
m(x − y)2
m
exp −
(7.13)
U (x, y; t) =
2πi~t
2~it
Dass diese Funktion eine Lösung der freien Schrödinger-Gleichung ist, zeigt man leicht
durch explizites Nachrechnen. Die Ableitung nach t liefert:
r
d
m
1
m(x − y)2
2 1
i~ U (x, y; t) =
−i~ + m(x − y) 2 exp −
.
(7.14)
dt
8πi~t
t
t
2~it
Die gleichen Terme treten bei der zweifachen Ableitung nach x auf.
Im Grenzfall t → 0. erkennt man, dass die Funktion außer an der Stelle x = y
unendlich rasch“ oszilliert und somit das Integral über eine Testfunktion, die bei
”
x = y verschwindet, null ist. Etwas exakter ausgedrückt gilt:
Z ∞
dy U (x, y; t)ψ(y) = ψ(x) .
(7.15)
lim
t→0
−∞
Also wird der Zeitentwicklungsoperator in diesem Grenzfall zur δ-Funktion.
Bis auf die imaginäre Einheit i handelt es sich bei der freien Schrödinger-Gleichung im Wesentlichen um eine Diffusionsgleichung:
d2
d
ψ(x, t) = −λ 2 ψ(x, t) ,
dt
dx
(7.16)
welche die Braun’sche Diffusion in einer Flüssigkeit oder einem Gas beschreibt. Die Anfangsbedingung
(Gl. 7.12) bedeutet in diesem Fall physikalisch, dass sich ein Teilchen — oder ein Farbtropfen —
zum Zeitpunkt t = 0 an einem bestimmten Ort befindet. Die Diffusion erfolgt nach einer immer
breiter werdenden Gauß-Verteilung, deren Varianz proportional zu t ist. Anders ausgedrückt, für den
√
Ausbreitungsradius R zum Zeitpunkt t gilt: R ∝ t.
Der Faktor i hat allerdings zur Folge, dass die Wellenfunktion eines Teilchens, das sich zum
Zeitpunkt t = 0 an einem bestimmten Ort befindet, bereits beliebig kurz darauf überall gleichmäßig
im Raum verteilt hat. Der Zustand eines solchen auf einen Punkt“ konzentrierten Teilchens ist
”
eine Superposition von allen Energien, und daher breitet sich dieses Teilchen mit allen Geschwindigkeiten in alle Richtungen gleichermaßen aus. Dies betont den nicht-relativistischen Charakter der
Schrödinger-Gleichung. Die relativistische Verallgemeinerung ist die Dirac-Gleichung.
7.2. SUMMATION ÜBER WEGE
7.2
155
Summation über Wege
Im Anhang A2 wird das Funktionalintegral für die Quantenmechanik abgeleitet. An
dieser Stelle gehen wir als Motivation für eine solche Darstellung nochmals von einem
Doppelspaltexperiment aus.
Wir betrachten zunächst einen Doppelspalt und eine ebene Welle von Elektronen, die sich als ebene Welle mit einem bestimmten Impuls p (bzw. einer bestimmten
= hp ) diesem Doppelspalt nähern.
deBroglie-Wellenlänge λ = 2π~
p
Zur Bestimmung der Amplitude auf einem Schirm hinter dem Doppelspalt denken wir uns von jedem der beiden Spalte eine Kugelwelle ausgehend. Diese beiden
Kugelwellen überlagern sich und führen auf dem Schirm zu einem Interferenzmuster
(Gl. 3.4 und 3.5 in Kap. 3.1).
Da die ebene Welle phasengleich auf den Doppelspalt treffen soll, erhalten wir
näherungsweise die Amplitude an einem Punkt y auf dem Schirm hinter dem Doppelspalt dadurch, dass wir die optischen Weglängen von jedem der beiden Spalte x1 und
x2 zu dem Punkt y bestimmten, also |x1 − y|/λ und |x2 − y|/λ, und die zugehörigen
Phasen addieren:
2πi
2πi
(7.17)
ψ(y) ≈ e λ |x1 −y| + e λ |x2 −y|
Angenommen, wir ersetzen den Schirm hinter dem Doppelspalt durch eine Maske,
die an den Punkten y1 und y2 ebenfalls wieder zwei Spalte hat, und wir wollen nun
die Amplitude auf einem weiteren Schirm hinter diesem zweiten Doppelspalt an einer
Stelle z bestimmen, so stellen wir uns vor, dass jeder der beiden Spalte bei y1 und y2
zum Ausgangspunkt einer neuen Welle wird, für die wir jeweils die optische Weglänge
bis zum Punkt z bestimmen müssen. Insgesamt erhalten wir die Phase bei z, indem
wir die Summe der Phasen zu den einzelnen optischen Weglängen entlang der vier
möglichen Wege — (x1 → y1 → z), (x1 → y2 → z), (x2 → y1 → z) und (x2 → y2 → z)
— bilden:
ψ(z) ≈ e
2πi
(|x1 −y1 |+|y1 −z|)
λ
+e
+e
2πi
(|x2 −y1 |+|y1 −z|)
λ
2πi
(|x1 −y2 |+|y2 −z|)
λ
+e
2πi
(|x2 −y2 |+|y2 −z|)
λ
.
(7.18)
Hierbei handelt es sich nur um eine Proportionalität, d.h., für die Bestimmung der
tatsächlichen Intensität müssen wir noch berücksichtigen, welcher Anteil des Lichts an
den jeweiligen Schirmen mit den Spalten absorbiert wird. Da wir in der Quantenmechanik letztendlich nur an der relativen“ Verteilung auf dem abschließenden Schirm
”
interessiert sind, d.h., an der Verteilung derjenigen Teilchen, die alle Masken passiert
haben, müssen wir nur die abschließende Intensität neu normieren.
Auch diese Berechnung wäre noch schwierig, wenn man berücksichtigen will,
dass die Teilchen an den einzelnen Spalten in verschiedene Richtungen unterschiedlich
stark gebeugt werden. Dies führt unter anderem dazu, dass die Interferenzmuster für
156
Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen
große Ablenkungswinkel immer schwächer werden. Sollen diese Komplikationen ebenfalls unberücksichtigt bleiben, was bei sehr engen Spalten und bei Berücksichtigung
lediglich der ersten Interferenzstreifen um den mittleren Punkt eine gute Näherung ist,
können wir die relative Intensität schon aus den Phasen ablesen. In dieser Näherung
erhalten wir für den einfachen Doppelspalt aus Gl. 7.17:
2
2πi
1
1 2πi |x1 −y|
|x2 −y| λ
λ
2 + 2 cos 2π
+e
(|x
−
y|
−
|x
−
y|)
(7.19)
I(y) = e
=
1
2
λ
N
N
Die Normierung N ist so zu wählen, dass die Integration über den relevanten y-Bereich
eins ergibt. Man erkennt, dass in das Interferenzmuster lediglich die Differenz der beiden optischen Weglängen eingeht. Die Minima und Maxima der Interferenzverteilung
erhält man aus den bekannten Bedingungen (vgl. Gl. 3.4 und 3.5).
Gleichung (7.18) lässt sich sehr leicht verallgemeinern. Angenommen, der erste
Schirm hat N1 Spalte an den Positionen x1i1 , der zweite Schirm N2 Spalte bei x2i2 , und
es gibt weitere Schirme mit weiteren Spalten, dann ist die relative Phase an einem
Punkt z auf dem abschließenden Schirm durch
ψ(z) ≈
N1 X
N2
X
i1
...e
2πi
λ
P
k
|
|xki −xk−1
i
k
k−1
(7.20)
i2
gegeben. Dabei ist letztendlich über alle Wege zu summieren, die das Teilchen nehmen
kann. Insbesondere kann es durch jeden der Spalte im ersten Schirm treten, anschließend durch jeden der Spalte im zweiten Schirm etc. Wir erhalten für die Amplitude
also eine Summe über alle möglichen Wege“ des Teilchens, und für jeden Weg er”
halten wir als Beitrag eine Phase, die sich aus der gesamten optische Weglänge dieses
Wegs ergibt. Für die Bestimmung der Intensität müssen wir das Absolutquadrat dieses
Ausdrucks bilden.
Wie schon erwähnt, wird die Funktionalintegraldarstellung für die Quantenmechanik in Anhang A2 hergeleitet. Das Ergebnis lässt sich formal folgendermaßen
zusammenfassen:
X
i
U (x, y; t) =
exp
Scl [x(τ ), t]
(7.21)
~
x(τ ):y→x
Hierbei bedeutet die Summe eine formale Summation über alle Wege x(τ ) von einem Anfangspunkt y = x(0) bis zu einem Endpunkt x = x(t) und Scl [x(τ ), t] ist die
klassische Wirkung dieses Weges:
Z t
1
2
Scl [x(τ ), t] =
dτ
mẋ(τ ) − V (x) .
(7.22)
2
0
7.2.1
Das Zeigermodell“ der Teilchenpropagation
”
Richard Feynman hat in seinem Buch QED: The strange theory of light and matter“
”
die Zeigerdarstellung populär gemacht, mit der man im Prinzip die Amplitude einer
Das Heisenberg-Bild der Quantenmechanik
157
Welle an einem Punkt berechnen kann. Dabei stellt man sich vor, dass ein Teilchen
eine Art Uhr“ mit sich schleppt, welche die momentane Phase des Zustands dieses
”
Teilchens angibt. Wenn sich ein Teilchen entlang einer ganz bestimmten Trajektorie
bewegt, schreitet dieses Phase voran, d.h., die Zeiger der Uhr drehen sich. Die Feynmann’sche Vorschrift lautet, dass man die Ampitude am Zielpunkt dadurch erhält,
dass man von jedem möglichen Weg von Anfangs- zu Endpunkt die abschließende Zeigerstellung ermittelt (in Schulen wurde das oft mit einer Pizzaschneiderolle anschaulich
gemacht, die man den Weg entlangrollt), und abschließend alle Zeigerstellungen, die
man von allen möglichen Wegen erhält, addiert. Das Ergebnis ist die Amplitude, und
das Absolutquadrat entspricht der (relativen) Intensität.
Die strenge“ Begründung hinter diesem Verfahren beruht auf der Funktionalin”
tegraldarstellung des Zeitentwicklungsoperators oder Propagators. Hier wird tatsächlich
zur Bestimmung der Amplitude über alle Wege bzw. Trajektorien summiert, und jeder
Weg trägt eine Phase bei, die proportional zur klassischen Wirkung der entsprechenden
Teilchentrajektorie ist.
Das Verfahren mag für populärwissenschaftliche Darstellungen ganz anschaulich erscheinen, doch die Funktionalintegraldarstellung zeigt auch die Grenzen dieses
Verfahrens: Zunächst bewegt sich der Zeiger“ nicht gleichmäßig mit der Zeit vor,
”
sondern die Rotationsgeschwindigkeit des Zeigers hängt von dem Wert der LagrangeFunktion an dem entsprechenden Punkt (d.h. sowohl von dem Ort, d.h. dem Wert des
Potenzials, als auch von der momentanen Geschwindigkeit des Teilchens) ab. Noch
kritischer wird die Zeigerdarstellung, wenn man beispielsweise den Tunneleffekt beschreiben möchte: Hier verläuft der Weg über einen Potenzialberg, der klassisch gar
nicht überwunden werden kann. Streng genommen wird die klassische Wirkung hier
imaginär, was zu dem exponentiellen Abfall der Amplitude von Teilchen führt, die den
Potenzialwall durchdringen.
Die einfache konstante Zeigerrotation ist lediglich für eine freie klassische Trajektorie begründet, bei der kein Potenzial vorhanden ist und bei der sich das Teilchen
mit konstanter Geschwindigkeit fortbewegt. Das liefert bei Doppelspaltexperimenten
(und Verallgemeinerungen mit mehreren Spalten und mehreren Masken) die richtigen
Ergebnisse (zumindest, sofern man nur am qualitativen Verlauf der Interferenzmuster
interessiert ist und nicht an der tatsächlichen Intensität).
Insgesamt muss die Zeigerdarstellung der Quantenmechanik also kritisch betrachtet werden. Sie hat zwar ihre theoretische Begründung, die aber nur in Spezialfällen mit einer Pizzaschneiderolle“ ermittelt werden kann. Außerdem besteht die
”
Gefahr, dass die Vorstellung einer inneren Uhr“ zur Messung der Phase zu Ernst
”
genommen wird und zu einer ontologischen Vorstellung führt, die nicht gerechtfertigt
ist.
158
7.3
Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen
Das Heisenberg-Bild der Quantenmechanik
Bisher haben wir die zeitliche Entwicklung eines Vektors im Hilbertraum (als Repräsentant für einen Quantenzustand) untersucht. Für die Erwartungswerte von Operatoren ergibt sich daraus eine Zeitabhängigkeit:
hAi(t) = hψ(t)|A|ψ(t)i .
(7.23)
Statt eine zeitliche Entwicklung von Zuständen zu betrachten, können wir auch die
Operatoren zeitabhängig wählen, und die Zustände zeitlich konstant lassen, sodass die
Erwartungswerte dieselben bleiben:
hAi(t) = hψ|A(t)|ψi .
(7.24)
Die entsprechende Bewegungsgleichung für Observable ist die Heisenberg-Gleichung.
7.3.1
Die Heisenberg’schen Bewegungsgleichungen
Wieder einmal gehen wir von der Schrödinger-Gleichung für Quantenzustände (genauer
gesagt: Hilbertraumvektoren als Repräsentanten für Quantenzustände) aus:
i~
d
|ψ(t)i = H|ψ(t)i .
dt
(7.25)
Diese Gleichung beschreibt also die zeitliche Entwicklung eines Vektors im Hilbertraum. Wie wir gesehen haben, lässt sich diese zeitliche Entwicklung als eine Rotation“
”
der Vektoren des Hilbertraums interpretieren (unitäre Matrizen sind die komplexen
Verallgemeinerungen der orthogonalen Matrizen, welche im Wesentlichen Drehungen
in Vektorräumen beschreiben).
Messungen an physikalischen System liefern jedoch nach den Axiomen der
Quantenmechanik immer nur Erwartungswerte geeigneter Operatoren, welche wir als
mathematische Repräsentationen von physikalischen Observablen auffassen. D.h., Messergebnisse in einem Zustand sind immer nur von der Form
hAi(t) = hψ(t)|A|ψ(t)i .
(7.26)
Messergebnisse können natürlich zeitabhängig sein, wenn sich der Quantenzustand
zeitlich verändert.
Statt zeitabhängige Quantenzustände zu betrachten, können wir aber auch eine
Zeitabhängigkeit der Observablen annehmen, ohne dass sich der Erwartungswert —
also das einzig physikalisch Beobachtbare — verändert:
hAi(t) = hψ(0)|U (t)† AU (t)|ψ(0) = hψ|A(t)|ψi ,
(7.27)
Das Heisenberg-Bild der Quantenmechanik
159
wobei wir |ψi = |ψ(0)i festhalten, und statt dessen eine zeitabhängige Observable
A(t) = U (t)† AU (t)
(7.28)
betrachten. Die beiden Formen von Zeitentwicklungen;
|ψi , A −→ |ψ(t)i = U (t)|ψi , A
(7.29)
|ψi , A −→ |ψi , A(t) = U (t)† AU (t)
(7.30)
sind physikalisch äquivalent, da beide zur selben Zeitentwicklung für Erwartungswerte
führen.
Wir können uns nun fragen, welche Bewegungsgleichung für einen Operator aus
der Zeitentwicklung (Gl. 7.28) folgt. Dazu berücksichtigen wir:
i
d i Ht
e ~ = U (t) H
dt
~
und
d − i Ht
i
e ~ = − H U (t)† .
dt
~
(7.31)
(Diese Gleichungen setzen voraus, dass H zeitunabhängig ist. Es gibt eine Verallgemeinerung für explizit zeitabhängige Hamilton-Operatoren, die aber hier nicht betrachtet
werden soll. Die Reihenfolge von H und U (t) ist im vorliegenden Fall egal.)
Nun können wir beide Seiten von Gl. 7.28 nach t ableiten und erhalten:
i
d
A(t) =
HU (t)† AU (t) − U (t)† AU (t)H
(7.32)
dt
~
i
i
(7.33)
=
HA(t) − A(t)H = [H, A(t)] .
~
~
Diese Gleichung,
d
i
A(t) = − [A(t), H] ,
(7.34)
dt
~
bezeichnet man als Heisenberg’sche Bewegungsgleichung.
Letztendlich kann man den Übergang vom Schrödinger-Bild zum HeisenbergBild als aktive“ und passive“ Transformation in einem Vektorraum auffassen: Es
”
”
spielt keine Rolle, ob die Vektoren gedreht werden, und die Matrix unverändert bleibt,
oder ob die Matrix gedreht“ wird, und die Vektoren unverändert bleiben.
”
7.3.2
Allgemeine Struktur der Heisenberg-Gleichung
Die Ähnlichkeit zwischen den Heisenberg-Gleichungen der Quantenmechanik (Gl. 7.34)
und den klassischen Bewegungsgleichungen für Observable (also Funktionen auf dem
Phasenraum):
d
A(x, p) = {A(x, p), H(x, p)} ,
(7.35)
dt
mit den Poisson-Klammern
{f (x, p), g(x, p)} =
∂f (x, p) ∂g(x, p) ∂f (x, p) ∂g(x, p)
−
,
∂x
∂p
∂p
∂x
(7.36)
160
Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen
legt schon nahe, dass die Struktur der Heisenberg-Gleichungen den klassischen Bewegungsgleichungen sehr ähnlich ist. Wir werden nun zeigen, dass die Form der Bewegungsgleichungen für den Orts- und Impulsoperator, Q(t) und P (t), sogar identisch
ist zu den klassischen Gleichungen (bis auf Probleme der Reihenfolge von Operatoren,
die jedoch, wie wir sehen werden, bei den meisten Beispielen keine Rolle spielen), aber
im Unterschied zu den klassischen Bewegungsgleichungen sind nun Operatoren Q(t)
und P (t) gesucht, die noch zu jedem Zeitpunkt die kanonischen Vertauschungsregeln
erfüllen.
Wir beginnen mit den folgenden Relationen:
[Q, f (P )] = i~ f 0 (P )
und
[P, g(Q)] = −i~ g 0 (Q) .
(7.37)
(Von der Richtigkeit, zumindest für Funktionen f und g mit einer Potenzreihenentwicklung, überzeugt man sich leicht, indem man für f und g reine Potenzen P n bzw.
Qm ansetzt. Die entsprechenden Relationen kann man dann induktiv über m bzw. n
beweisen.) Für einen Hamilton-Operator der Form
H=
P2
+ V (Q)
2m
(7.38)
folgt damit sofort als Bewegungsgleichung für die zeitabhängigen Orts- und Impulsoperatoren in der Heisenberg-Darstellung:
d
1
Q(t) = P (t)
dt
m
und
d
P (t) = −V 0 (Q(t)) .
dt
(7.39)
Wie wir sehen, treten in diesem Fall keine Ordnungsprobleme der Operatoren
auf, und die Bewegungsgleichungen sind form-identisch zu den klassischen Bewegungsgleichungen. Ordnungsprobleme erhält man lediglich, wenn Anteile eines HamiltonOperators Produkte von Q und P enthalten.
Bilden wir auf beiden Seiten dieser Bewegungsgleichungen Erwartungswerte (in
einem beliebigen Zustand |ψi, so folgt:
d
hQi(t) =
dt
d
hP (t)i =
dt
d
1
1
hψ|Q(t)|ψi =
hψ|P (t)|ψi = hP i(t)
dt
m
m
d
0
hψ|P (t)|ψi = −hψ|V (Q)|ψi = −hV 0 (Q)i(t) .
dt
(7.40)
(7.41)
Die Erwartungswerte von Observablen in der Quantentheorie folgen somit den klassischen Bewegungsgleichungen. Dies ist eine Form des Korrespondenzprinzips.
Die letzte Bemerkung ist eigentlich nur eine explizite Bestätigung dessen, was
wir schon in der allgemeinen axiomatischen Formulierung hineingesteckt“ haben: Die
”
Kommutatorrelationen der Quantentheorie sollen den Poisson-Klammern der entsprechenden klassischen Observablen entsprechen. Dann kann man für die Erwartungswerte quantenmechanischer Observabler die klassischen Relationen erwarten.
Das Heisenberg-Bild der Quantenmechanik
161
Operatorlösungen sind von Bedeutung, wenn man an Erwartungswerten von
Q und P (oder Funktionen von ihnen) zu verschiedenen Zeitpunkten interessiert ist.
Beispielsweise spielen in der Quantenfeldtheorie Verallgemeinerungen von Erwartungswerten der Art hQ(t1 )Q(t2 )i eine große Rolle. Solche zeitlichen Korrelationsfunktionen
lassen sich oft direkt mit experimentellen Messungen in Beziehung setzen.
7.3.3
* Lineare Bewegungsgleichungen
Wir wollen die Heisenberg’schen Bewegungsgleichungen für zwei Fälle lösen: (1) den
freien Fall und (2) den harmonischen Oszillator.
Der Fall eines freien Teilchens
Betrachten wir zunächst den Fall eines freien Teilchens. Die Heisenberg’schen Bewegungsgleichungen lauten nun:
1
P (t) und Ṗ (t) = 0 .
m
Die klassische Lösung der Gleichungen gilt auch für den Quantenfall:
Q̇(t) =
(7.42)
1
P (0)t + Q(0)
und
P (t) = P (0) .
(7.43)
m
Setzen wir für den Orts- und Impulsoperator zum Zeitpunkt t = 0 ihre kanonische
Ortsraumdarstellung ein, so erhalten wir:
Q(t) =
i~ t d
+x
m dx
d
P (t) = i~ .
dx
Q(t) =
(7.44)
(7.45)
Harmonischer Oszillator
Auch für den harmonischen Oszillator erhalten wir die Form der klassischen Bewegungsgleichungen nun als Operatorgleichungen:
Q̇(t) =
1
P (t) und Ṗ (t) = −mω 2 Q(t) ,
m
(7.46)
bzw.
Q̈(t) = −ω 2 Q(t) .
(7.47)
Auch hier können wir die klassische Lösung nehmen und die freien Anfangsbedingungen durch Operatoren ersetzen:
1
P (0) sin ωt
mω
P (t) = −mωQ(0) sin ωt + P (0) cos ωt .
Q(t) = Q(0) cos ωt +
(7.48)
(7.49)
162
Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen
In der Ortsdarstellung folgt:
Q(t) = (cos ωt) x +
d
i~
sin ωt
mω
dx
P (t) = (−mω sin ωt) x + (i~ cos ωt)
d
.
dx
(7.50)
(7.51)
Man überzeugt sich leicht, dass in beiden Fällen für alle t die kanonischen Vertauschungsrelationen gelten (wie es auch nach dem allgemeinen Formalismus der Fall sein
muss). Außerdem sieht man sofort, dass die Erwartungswerte von Q(t) und P (t) in
beliebigen Zuständen die klassische Bewegung zeigen.
Bei linearen Bewegungsgleichungen lassen sich somit vergleichsweise leicht Operatorlösungen finden: Man nehme die klassische Lösung und ersetze die freien Anfangsbedingungen (x(0) und p(0)) durch die entsprechende Operatoren. Bei nicht-linearen
Bewegungsgleichungen funktioniert dieses Prinzip nicht mehr, da dort die Anfangsbedingungen meist als komplizierte Funktionen auftreten (und nicht als die Koeffizienten
linearer Superpositionen von Lösungen).
Kapitel 8
Mehrteilchensysteme
Die meisten Aussagen der bisherigen Kapitel bezogen sich auf Systeme aus einem
einzelnen Teilchen, das sich in einem Potenzial befindet oder dem man eine bestimmte
Polarisation zuschreiben kann. Natürlich möchte man in der Quantenmechanik auch
Mehrteilchensysteme oder aus Einzelsystemen zusammengesetzte Systeme beschreiben
können.
Gerade die Behandlung von mehreren, möglicherweise sehr weit voneinander
entfernten Teilsystemen in der Quantenmechanik hat zu vielen Diskussionen Anlass gegeben. Es zeigt sich, dass in der Quantenmechanik vollkommen neue Arten von Korrelationen auftreten können, die sich weder auf eine klare kausale Beziehung noch auf eine
gemeinsame Vergangenheit (mit durchgängiger Kette von Ursache–Wirkungsrelationen)
zurückführen lassen. Diese sogenannten Quantenkorrelationen sind der Gegenstand
von Debatten um die Bedeutung einer Arbeit von Einstein, Podolsky und Rosen (EPR)
aus dem Jahre 1935. Aufbauend auf der EPR-Arbeit hat John Bell in den 60er Jahren
zeigen können, dass die Quantenmechanik eine nicht-lokale Theorie ist.
Was man wissen sollte
Der Hilbertraum eines zusammengesetzten Systems ist gleich dem Tensorprodukt der
beiden Hilberträume zu den Einzelsystemen. Die Basisvektoren im Produkthilbertraum lassen sich als Paare von Basisvektoren der Einzelhilberträume schreiben. Für
einen Zustand im Produkthilbertraum kann man Teilspuren definieren, die effektiv
zu einem (möglicherweise gemischen) Zustand in einem der beiden Teilräume führen
und angeben, welche Eigenschaften eines Zustands sich durch lokale Eigenschaften an
einem Teilsystem bestimmen lassen.
Bei Mehrteilchenzuständen aus identischen Teilchen muss eine Symmetrisierung
des Zustands (bei Bosonen) bzw. eine Antisymmetrisierung des Zustands (bei Fermionen) vorgenommen werden. Bei Fermionen folgt aus dieser Antisymmetrisierung das
163
164
Mehrteilchensysteme
Pauli’sche Ausschließungsprinzip. Die physikalischen Hilberträume identischer Teilchen sind also der total symmetrische bzw. der total antisymmetrische Unterraum des
Produkthilbertraums.
Zustände in einem Produkthilbertraum, die sich nicht als Tensorprodukt von
Zuständen aus den einzelnen Teilräumen schreiben lassen, bezeichnet man als verschränkt (ansonsten sind sie separabel). In verschränkten Zuständen kommen den
Einzelsystemen oft keine bestimmten Eigenschaften zu, wohl aber dem Gesamtsystem.
Verschränkten Zustände geben Anlass zu Quantenkorrelationen, indem eine Messung
an einem Teilsystem zu einer instantanen Änderung des Gesamtzustands führt, wobei
dem zweiten Teilsystem in dem neuen (reduzierten) Zustand Eigenschaften zukommen, die ihm vor der Messung an dem ersten Teilsystem nicht zukamen. Die Bildung
der Teilspuren von (reinen) verschränkten Zuständen führt zu gemischten Zuständen,
wohingegen die Teilspur von (reinen) separablen Zuständen wieder auf reine Zustände
führt.
Das Standardbeispiel eines verschränkten Zustands ist der EPR-Zustand (EPR
bezieht sich auf Einstein, Podolsky und Rosen, genauer sollte man jedoch vom EPRBohm-Zustand sprechen), bei dem sich ein System aus zwei Spin- 12 -Teilchen im Gesamtdrehimpuls 0-Zustand befindet, wodurch den beiden Einzelteilchen keine Spinorientierung bezüglich irgendeiner Richtung zukommt. Erst bei einer Messung der
Spinorientierung bezüglich einer Richtung an einem Teilchen erhält“ auch das ande”
re Teilchen instantan eine eindeutige Spin-Komponente bezüglich derselben Richtung.
Dieser Effekt ist nicht-lokal und scheint der Einstein-Kausalität (keine Signal- oder
Energieausbreitung außerhalb des Lichtkegels) zu widersprechen. Allerdings lassen sich
diese Korrelationen nicht zur Signalübertragung verwenden.
Die Bell’schen Ungleichungen beziehen sich auf Relationen zwischen der relativen Häufigkeit für das Auftreten verschiedener Eigenschaften, die in jeder lokalen und
objektiv realistischen Theorie erfüllt sein müssen. Ihre Verletzung in der Quantenmechanik bedeutet, dass (1) objektive Eigenschaften vor einer Messung im Allgemeinen
nicht vorliegen und (2) die Quantenmechanik nicht-lokal ist.
8.1
8.1.1
Mathematische Beschreibung von Mehrteilchensystemen
Der Tensorraum
In der klassischen Mechanik ist der Übergang von einem Einteilchensystem zu einem
Mehrteilchensystem vergleichsweise einfach: Der Phasenraum von N Teilchen ist das
kartesische Produkt der Einteilchenphasenräume. In der Quantenmechanik haben wir
den Zustandsraum durch einen Hilbertraum definiert. Bei Vektorräumen ist der Pro-
Mathematische Beschreibung
165
duktraum aber das Tensorprodukt der beiden Vektorräume; es besteht aus sämtlichen
Linearkombinationen von Paaren von Vektoren, die sich aus den beiden Vektorräumen
bilden lassen.
Konkreter definieren wir:
Seien H1 und H2 zwei Hilberträume mit jeweiligen Basisvektoren {|ei i} und {|fj i}
(die Indexmengen für i und j müssen nicht gleich sein), dann definieren wir das Tensorprodukt H = H1 ⊗ H2 als den Vektorraum, der durch die Paare von Basisvektoren
{|ei , fj i} aufgespannt wird. Ein beliebiger Vektor |xi ∈ H lässt sich somit immer in
der Form
X
|xi =
xij |ei , fj i
(8.1)
i,j
darstellen. Statt |ei , fj i schreibt man manchmal auch |ei i|fj i oder |ei i ⊗ |fj i. Seien
P
P
|ai = i ai |ei i ∈ H1 und |bi = j bj |fj i ∈ H2 Vektoren aus den Teilhilberträumen,
dann ist
X
X
X
|ai ⊗ |bi =
ai |ei i ⊗
bj |fj i =
ai bj |ei , fj i
(8.2)
i
j
i,j
das Tensorprodukt dieser beiden Vektoren.
Für das Skalarprodukt von zwei Vektoren des Tensorproduktraums
X
X
|xi, |yi ∈ H; |xi =
xij |ei , fj i ; |yi =
ykl |ek , fl i
i,j
(8.3)
k,l
gilt:
hy|xi =
X
∗
ylk
xij hei |ek ihfj |fl i ,
(8.4)
i,j,k,l
und, sofern es sich um Orthonormalbasen handelt:
X
∗
hy|xi =
yji
xij .
(8.5)
i,j
Diese Definition ist nicht sehr elegant, da sie explizit auf Basen in den jeweiligen
Hilberträumen Bezug nimmt. Es gibt in der Mathematik eine elegante Möglichkeit,
das Tensorprodukt von zwei Vektorräumen ohne Bezug auf eine Basis zu definieren,
diese ist aber für konkrete Berechnungen sehr unhandlich. Der Nachteil der obigen
Definition ist, dass man von relevanten Konzepten (beispielsweise dem Konzept der
Verschränkung, s.u.) eigentlich beweisen müsste, dass diese nicht von der Wahl der
Basisvektoren bei der Konstruktion des Tensorraums abhängen. Für das Folgende
sollte man diese Aussage einfach glauben oder ein entsprechendes Mathematikbuch
konsultieren.
Sei A1 ein linearer Operator auf H1 und A2 ein linearer Operator auf H2 , dann
ist A1 ⊗ A2 ein linearer Operator auf H, der folgendermaßen auf die Basisvektoren
wirkt:
(A1 ⊗ A2 )(|ei i ⊗ |fj i) = A1 |ei i ⊗ A2 |fj i .
(8.6)
166
Mehrteilchensysteme
Durch diese Definition ist festgelegt, wie ein solcher Operator auf einen beliebigen
Vektor im Tensorprodukt wirkt. Insbesondere kann man sich leicht überzeugen, dass
zwei Operatoren, die auf verschiedene Hilberträume wirken, im Tensorprodukt immer
kommutieren:
(A1 ⊗ 1)(1 ⊗ A2 ) = (1 ⊗ A2 )(A1 ⊗ 1) .
(8.7)
Oft findet man dafür vereinfacht die Schreibweise
[A1 , A2 ] = 0 ,
(8.8)
wobei aber klar sein muss, dass sich die Indizes auf verschiedene Vektorräume beziehen
und mit A1 eigentlich A1 ⊗ 1 gemeint ist (und entsprechend für A2 ).
Allgemein lässt sich ein Operator B auf H immer als eine Linearkombination
solcher Produktoperatoren“ schreiben, d.h.
”
X
B=
bij (Ai ⊗ Aj ) .
(8.9)
ij
8.1.2
Separable Zustände und verschränkte Zustände
Wenn ein Hilbertraum H das Tensorprodukt von zwei Hilberträumen H1 und H2 ist,
können wir für Vektoren in dem Tensorproduktraum definieren:
Definition: Ein Vektor |Ψi ∈ H1 ⊗ H2 heißt separabel, wenn es Vektoren |φi ∈ H1 und
|ψi ∈ H2 gibt, sodass
|Ψi = |φi ⊗ |ψi ,
(8.10)
andernfalls heißt der Vektor |Ψi (bezüglich des vorgegebenen Tensorprodukts) verschränkt.
Hierzu ein paar Anmerkungen:
1. Die Begriffe separabel bzw. verschränkt sind nur in Bezug auf eine Tensorproduktdarstellung des Hilbertraums definiert. Es macht überhaupt keinen Sinn,
von einem verschränkten Zustand per se zu sprechen. Ein Zustand kann immer
nur verschränkt in Bezug auf eine Partitionierung (d.h., Aufteilung des Gesamtsystems in Teilsysteme) sein.
2. Wir haben die Begriffe separabel und verschränkt für Vektoren definiert, aber
man kann sich leicht davon überzeugen, dass sie auch für physikalische Zustände
(also Strahlen bzw. 1-dimensionale lineare Unterräume im Hilbertraum) sinnvoll sind: Ist ein Vektor separabel (verschränkt), dann ist auch ein beliebiges
komplexes Vielfaches dieses Vektors separabel (bzw. verschränkt).
Mathematische Beschreibung
167
3. Es ist wichtig zu betonen, dass die Konzepte der Separabilität und Verschränktheit nicht von einer Basis in den Hilberträumen abhängen. Hier ist auch wichtig
sich klarzumachen, dass schon die Definition des Tensorprodukts nicht von einer
Wahl der Basis abhängt.
4. Auch wenn die Definition der Verschränkung sehr einfach ist, kann es in einem
konkreten Fall durchaus schwierig sein zu entscheiden, ob ein gegebener Vektor in Bezug auf eine Tensorproduktzerlegung separabel oder verschränkt ist.
Wir werden im nächsten Abschnitt ein (in konkreten Fällen oft umständliches)
Kriterium kennenlernen, mit dem sich diese Entscheidung zumindest im Prinzip
treffen lässt.
8.1.3
Die Reduktion von Dichtematrizen
In Kapitel 5.9.3 hatten wir gesehen, dass sich jeder Zustand durch eine Dichtematrix
darstellen lässt. Eine Dichtematrix ρ ist dabei eine hermitesche Matrix (bzw. ein selbstadjungierter Operator) mit folgenden Eigenschaften:
ρ† = ρ
(8.11)
Sp ρ = 1
(8.12)
ρ2 ≤ ρ .
(8.13)
Die letzte Bedingung bedeutet, dass für jeden Zustand |ψi gilt
hψ|ρ2 |ψi ≤ hψ|ρ|ψi .
(8.14)
Für einen reinen Zustand ist ρ ein Projektionsoperator (d.h. ρ2 = ρ). Ist |ψi ein (normierter) Repräsentant des reinen Zustands, dann ist ρ = |ψihψ|. Da ρ selbstadjungiert
sein muss, lässt sich jede Dichtematrix diagonalisieren. Die obigen Bedingungen bedeuten dann, dass die Eigenwerte {pi } von ρ im Intervall [0, 1] liegen und normiert sind:
P
i pi = 1. Sie lassen sich als Wahrscheinlichkeiten deuten, mit denen die zugehörigen
Eigenzustände vorliegen (all diese Eigenschaften wurden auch schon in Abschnitt 5.9.3
erwähnt).
Das bisher Gesagte gilt natürlich auch für Dichtematrizen und reine Zustände
in Tensorprodukträumen. Eine besondere Konstruktion ist jedoch, dass man Teilre”
duktionen“ vornehmen kann. Man bildet dabei die Spur über nur einen der beiden
Hilberträume. Physikalisch kann man das so deuten, dass man alle Information über
den ausreduzierten Teilraum vergisst“ und sich nur auf die Informationen beschränkt,
”
die man durch lokale Messungen an dem verbliebenen Teilsystem gewinnen kann.
Sei A eine Matrix in einem Produkthilbertraum, dann lässt sich (in Bezug auf
beliebige orthonormale Basen {|ei i} für H1 und {|fj i} für H2 ) die Matrix folgender-
168
Mehrteilchensysteme
maßen schreiben:
A=
X
aij kl |ei i|fj i hfk |hel | .
(8.15)
i,j,k,l
Wir definieren nun die Spur (bzw. Teilspur) über den Hilbertraum H1 als
X
A2 = Sp1 A =
hen |A|en i
(8.16)
n
=
X
X
aijkl
hen |ei i|fj ihfk |hel |en i
(8.17)
n
ijkl
!
=
X X
jk
anjkn
|fj ihfk | .
(8.18)
n
A2 ist ein Operator auf H2 , der auf H1 wirkende Anteil von A wurde ausgespurt“.
”
Ganz entsprechend gibt es natürlich auch eine Spur über H2 , die einen Operator
auf H1 belässt:
X
A1 = Sp2 A =
hfm |A|fm i
(8.19)
m
=
X
aijkl
X
hfm |fj i|ei ihel |hfk |fm i
(8.20)
m
ijkl
!
=
X X
il
aimml
|ei ihel | .
(8.21)
m
Diese Operationen des teilweise Ausspurens kann man natürlich auch für Dichtematrizen vornehmen. Handelt es sich um die Dichtematrix zu einem separablen reinen
Zustand, also um das Tensorprodukt von zwei Projektionsoperatoren,
ρ = |ψi|φi hφ|hψ| = Pψ ⊗ Pφ ,
(8.22)
dann erhält man durch die Teilspuren wieder Projektionsoperatoren bzw. Dichtematrizen zu reinen Zuständen:
ρ1 = Sp2 ρ = |ψihψ| = Pψ
und ρ2 = Sp1 ρ = |φihφ| = Pφ .
(8.23)
Handelt es sich jedoch bei ρ um die Dichtematrix zu einem verschränkten Zustand
(d.h., ρ ist zwar ein Projektor, aber es gibt keine Projektionsoperatoren Pφ und Pψ ,
sodass ρ = Pφ ⊗ Pψ ), dann beschreiben ρ1 und ρ2 gemischte Zustände. Auf diese Weise
erhält man ein praktisches Kriterium zur Überprüfung, ob ein Zustand separabel oder
verschränkt ist: Handelt es sich bei den Dichtematrizen der ausreduzierten Teilräume
um reine Zustände, ist der Zustand separabel, sind es Dichtematrizen zu gemischten
Zuständen, ist der Zustand verschränkt. Die von Neumann-Entropie der reduzierten
Dichtematrizen
X
S=
pα, i ln pα, i = Sp ρα ln ρα
(α = 1, 2)
(8.24)
i
Identische Teilchen und Statistik
169
wird oft als ein Verschränkungsmaß angesehen (für reine Zustände ist die von NeumannEntropie null). Man kann beweisen, dass die von null verschiedenen Eigenwerte der
beiden reduzierten Dichtematrizen gleich sind, sodass auch die beiden von NeumannEntropien gleich sind.
Man kann auch Verschränkungsmaße für gemischte Zustände formulieren, allerdings handelt es sich hier um ein sehr komplexes Thema, das immer noch Teil
der aktuellen Forschung ist. Ebenfalls ein schwieriges und noch nicht abgeschlossenes Forschungsgebiet ist die Untersuchung von Verschränkungsmaßen von (reinen und
gemischten) Zuständen in Hilberträumen, die das Tensorprodukt von mehr als zwei
Zustandsräumen sind, d.h., bezüglich einer Partition des Gesamtsystems in mehr als
zwei Teilsysteme. Ein guter Übersichtsartikel zu Verschränkungsmaßen ist [43]. In [56]
werden weitere Quantenkorrelationen von (gemischten) Zuständen behandelt.
8.2
Identische Teilchen und Statistik
Bekannt ist das Pauli’sche Ausschließungsprinzip für Elektronen in einem Atom. Es
besagt im Wesentlichen, dass keine zwei Elektronen denselben energetischen Zustand
(Eigenzustand des Hamiltonoperators) besetzen können, bzw. dass keine zwei Elektronen in einem Atom dieselben Quantenzahlen (n, l, m, s) haben können. Es handelt
sich hierbei um eine Folgerung aus einer allgemeineren Aussage für Elektronen: Der
Zustand für ein System aus mehreren Elektronen muss total antisymmetrisch unter
Vertauschung der Elektronen sein.
Auch diese Aussage ist nur ein Spezialfall: Allgemein unterteilt man elementare Teilchen in Bosonen und Fermionen. Bosonen haben einen ganzzahligen Spin,
sie genügen der sogenannten Bose-Einstein-Statistik, d.h., der Zustand eines Systems
aus identischen Bosonen ist total symmetrisch. Damit kann jeder Einteilchenzustand
von beliebig vielen Bosonen besetzt sein. Fermionen haben einen halbzahligen Spin,
sie genügen der Fermi-Dirac-Statistik und der Zustand eines Systems aus identischen
Fermionen ist total antisymmetrisch. Daraus folgt, dass jeder Einteilchenzustand in
einem System mit mehreren identischen Fermionen maximal nur einmal besetzt sein
kann.
In der Quantenmechanik müssen diese Eigenschaften für Fermionen und Bosonen zusätzlich gefordert werden, d.h., sie stellen ein zusätzliches Postulat der Quantenmechanik dar. In einer Theorie, bei der man Teilchensysteme durch Erzeuger- und Vernichteroperatoren von Teilchen beschreibt (d.h., die Mehrteilchenzustände erhält man
aus einem Grundzustand durch Anwendung von entsprechenden Erzeugeroperatoren
— man spricht in diesem Fall schon mal von einer Zweitquantisierten Theorie), lassen sich diese Postulate auf die Forderung zurückführen, dass die Erzeugeroperatoren
(bzw. entsprechend auch Vernichteroperatoren) von Bosonen untereinander kommu-
170
Mehrteilchensysteme
tieren, bzw. die Erzeugeroperatoren von Fermionen untereinander antikommutieren.
In einer relativistischen Quantenfeldtheorie, bei der man unter anderem auch LorentzInvarianz fordert, lässt sich das so genannte Spin-Statistik-Theorem aus allgemeinen
Forderungen beweisen (siehe z.B. [70])
8.2.1
Fermi-Dirac- und Bose-Einstein-Statistik
Das Grundpostulat für Mehrteilchensysteme aus identischen Fermionen (beispielsweise
mehreren Elektronen) lautet: Der Zustand des Mehrteilchensystems muss total antisymmetrisch unter Vertauschung der Teilchen sein. Entsprechend gilt für identische
Bosonen, dass der Zustand total symmetrisch sein muss. Diese Forderungen wollen
wir uns kurz anschauen und einige Folgerungen ableiten.
Ein Fermion hat immer einen halbzahligen Spin, d.h., der Spin des Teilchens
ist s = 12 , 32 , 25 , .... Im Standardmodell der Elementarteilchen sind alle Materieteil”
chen“ Fermionen und tragen den Spin s = 21 . Dazu zählen die Leptonen (Elektronen,
Myonen, Tau-Teilchen und die zugehörigen Neutrinos) und die Quarks (Up, Down,
Strange, Charm, Top, Bottom) sowie die zugehörigen Antiteilchen. Zusammengesetz”
te“ Elementarteilchen, wie Baryonen, können auch höheren halbzahligen Spin haben,
beispielsweise haben ∆, Σ und Ξ-Teilchen den Spin s = 32 . Die Bosonen im Standardmodell sind die Austauschteilchen“— Photon, W ± -Boson, Z-Boson und Gluonen. Sie
”
alle haben den Spin 1. Außerdem gehört zum Standardmodell der Elementarteilchen
noch das Higgs-Teilchen als Boson mit Spin 0. Sollte eine Theorie der Quantengravitation die Eigenschaften haben, die man aus der klassischen Relativitätstheorie vermuten
würde, so gibt es ein Austauschteilchen der Gravitation — das so genannte Graviton —
mit Spin 2. Außerdem gibt es natürlich zusammengesetzte Teilchen mit ganzzahligem
Spin, beispielsweise die Mesonen.
Das Spin-Statistik-Theorem besagt nun, dass alle Teilchen mit halbzahligem
Spin der Fermi-Dirac-Statistik genügen, bzw., dass der Zustand von mehreren identischen Teilchen dieser Art total antisymmetrisch sein muss; entsprechend genügen alle
Teilchen mit ganzzahligem Spin der Bose-Einstein-Statistik – ihr Zustand muss total
symmetrisch sein. Damit ist Folgendes gemeint:
Da es sich um N identische Fermionen bzw. Bosonen handeln soll, ist der N Teilchenzustand zunächst ein Element (wir verwenden hier die Vektorsprechweise, das
Gesagte lässt sich aber auch für Strahlen bzw. Dichtematrizen verallgemeinern) des
N -fachen Tensorprodukts gleichartiger Hilberträume Hα (α = 1, ..., N ): Hges = H1 ⊗
N
H2 ⊗ ... ⊗ HN = α Hα . Sei {|ei iα } eine Basis von Hα , so lässt sich ein Zustand in
diesem Tensorproduktraum allgemein in folgender Form schreiben:
|Ψi =
X
i1 ,...,in
ψi1 ,i2 ,...,iN |ei1 i1 |ei2 i2 ...|eiN iN .
(8.25)
Identische Teilchen und Statistik
171
Auf die Basisvektoren dieses Tensorproduktraums wirkt die Permutationsgruppe von
N Elementen: Sei P ∈ SN eine Permutation von N Elementen, dann ist
Pσ |ei1 i1 |ei2 i2 ...|eiN iN = |eσ(i1 ) i1 |eσ(i2 ) i2 ...|eσ(iN ) iN ,
(8.26)
Pσ (i1 , ..., iN ) = (σ(i1 ), ..., σ(iN )) .
(8.27)
wobei
(Wir haben hier dasselbe Symbol Pσ verwendet, obwohl es sich im oberen Fall um eine
Darstellung der Permutationsgruppe auf den Basisvektoren des Produkthilbertraums
handelt, im letzteren Fall um die Darstellung von Pσ auf geordneten Folgen von N
Elementen.) Eine Permutation ist also zunächst nur eine Abbildung auf der Menge der
Basisvektoren – sie ordnet jedem Basisvektor einen (im Allgemeinen anderen) Basisvektor zu – wird jedoch wegen der Linearität im Hilbertraum zu einer Transformation
auf dem Zuständen
X
Pσ |Ψi ≡ |Ψσ i =
ψi1 ,i2 ,...,iN |eσ(i1 ) i1 |eσ(i2 ) i2 ...|eσ(iN ) iN .
(8.28)
i1 ,...,in
Da auf der rechten Seite über alle Basisvektoren zu summieren ist, können wir die
Wirkung von Pσ auch auf die Koeffizienten ψ... zurückziehen“. Für das Folgende
”
macht dies keinen Unterschied.
Jede Permutation lässt sich als gerade“ bzw. ungerade“ klassifizieren, je nach”
”
dem ob man sie durch eine gerade oder ungerade Anzahl von Paarvertauschungen
erhält (diese Klassifikation ist eindeutig, d.h., es gibt keine Permutation, die man einmal durch eine gerade und einmal durch eine ungerade Anzahl von Paarvertauschungen
zusammensetzen kann). Diese Größe (−1)σ bezeichnet man auch als das Vorzeichen
einer Permutation. Wir bezeichnen einen Zustand als total antisymmetrisch, wenn für
alle Permutationen P gilt
P |Ψi = |Ψσ i = (−1)σ |Ψi ,
(8.29)
und als total symmetrisch, wenn
P |Ψi = |Ψσ i = |Ψi .
(8.30)
Das Spin-Statistik-Theorem besagt, dass fermionische Zustände zu identischen Teilchen
immer total antisymmetrisch und bosonische Zustände immer total symmetrisch sein
müssen.
Wir können nun den Produkthilbertraum Hges immer in eine Summe von Teilräumen zerlegen, die zu bestimmten Darstellungen der Permutationsgruppe gehören.
Uns interessieren dabei nur die beiden Teilräume zu den 1-dimensionalen Darstellungen (d.h. (−1)σ ), also die Teilräume mit den total antisymmetrischen und den total
172
Mehrteilchensysteme
symmetrischen Zuständen. (Bei 2-Teilchenzuständen lässt sich schon der gesamte Hilbertraum in diese beiden Teilräume zerlegen, bei Mehrteilchenzuständen treten auch
nicht-triviale Darstellungen der Permutationsgruppe auf, die aber bisher in der Quantentheorie keine Rolle zu spielen scheinen.)
Der physikalische Hilbertraum für ein System aus N identischen Fermionen
besteht also aus dem Unterraum der total antisymmetrischen Zustände.
Betrachten wir dazu einige Beispiele:
1. Bei zwei Teilchen, die jeweils n verschiedene Zustände annehmen können, ist
der Produkthilbertraum n2 dimensional. Der total antisymmetrische Unterraum
hat n(n − 1)/2 Dimensionen und der total symmetrische Unterraum n(n + 1)/2
Dimensionen. Bei zwei Elektronen, für die nur der Spinfreiheitsgrad relevant ist
(also n = 2), ist der total antisymmetrische Unterraum eindimensional (dies
ist der EPR-Zustand für identische Teilchen, s.u.) und der total symmetrische
Unterraum dreidimensional.
2. Für drei Teilchen, bei denen jeweils nur zwei Zustände möglich sind, gibt es
keinen total antisymmetrischen Unterraum (da man drei Teilchen nicht auf zwei
Fächer verteilen kann, ohne dass ein Fach mindestens doppelbesetzt ist). Der
total symmetrische Unterraum wäre vierdimensional.
Man kann sich zu einem beliebigen Zustand in Hges leicht den total antisymmetrisierten bzw. total symmetrisierten Zustand durch eine Projektion konstruieren:
Dazu summiert man über die gesamte Permutationsgruppe zusammen mit den Cha”
rakteren“ ((−1)σ ):
1 X
1 X
(−1)σ Pσ |Ψi =
(−1)σ |Ψσ i
NA σ
NA σ
1 X
1 X σ
=
Pσ |Ψi =
|Ψ i .
NS σ
NS σ
|ΨiA =
(8.31)
|ΨiS
(8.32)
NA/S sind Normierungsfaktoren.
Hat man also eine Lösung der Schrödinger-Gleichung zu einem N -Teilchenproblem gefunden, und soll es sich bei den N Teilchen um identische Teilchen handeln, erhält man durch diese Projektionen auf den total antisymmetrtischen bzw. total
symmetrischen Unterraum die jeweiligen Lösungen für Fermionen bzw. Bosonen.
Man erkennt nun auch leicht, weshalb keine zwei Fermionen denselben Energiezustand (oder denselben Zustand zu irgendwelchen Quantenzahlen) besetzen können.
In diesem Fall wäre nämlich ψij.... symmetrisch unter Vertauschung dieser beiden Fermionen, aber der Tausch der Basisvektoren ergibt ein Minus-Zeichen. Damit heben
sich die beiden Terme insgesamt weg und der Zustand verschwindet. Bei Bosonen
Einstein-Podolsky-Rosen
173
hingegen addieren sich diese beiden Zustände. Bildet man anschließend das Absolutquadrat (zur Berechnung der Wahrscheinlichkeiten bzw. Intensitäten), so fallen solche
mehrfach besetzten Zustände bei Bosonen besonders stark ins Gewicht. Die Symmetrisierung bzw. Antisymmetrisierung wirkt also scheinbar wie eine Wechselwirkung:
Fermionen tendieren dazu, sich abzustoßen, Bosonen tendieren dazu, sich anzuziehen.
Hierbei handelt es sich aber nicht um eine Wechselwirkung im üblichen Sinne (mit
Energieaustausch) sondern um einen reinen Statistikeffekt.
8.3
Einstein-Podolsky-Rosen
Im Jahre 1935 veröffentlichten Albert Einstein, Boris Podolsky und Nathan Rosen
einen Artikel Can quantum-mechanical description of physical reality be considered
complete? [24] (der fehlende Artikel wird dem russischen Englisch“ von Boris Podols”
ky zugeschrieben), der die ungewöhnlichen und überraschenden Folgerungen aus der
Existenz verschränkter Zuständen in der Quantenmechanik besonders deutlich machte,
und der immer noch Gegenstand von Grundsatzdiskussionen in der Quantenmechanik ist. Der Angriff der drei Autoren galt der Behauptung, die Quantenmechanik sei
vollständig und würde allen Freiheitsgraden Rechnung tragen, die physikalisch von Bedeutung und sinnvoll sind. In ihrer Arbeit kamen sie zu dem Schluss, dass es gewisse
Elemente der Realität“ geben müsse, die von der Quantenmechanik nicht beschrieben
”
werden. Daher sei diese nicht vollständig.
EPR haben ursprünglich ihr scheinbares Paradoxon anhand eines Zweiteilchensystems beschrieben, bei dem die Orts- und Impulsvariablen der einzelnen Teilchen
verschränkt sind. Lediglich der Gesamtimpuls und die Relativkoordinate liegen fest,
was kein Widerspruch ist, da diese beiden Größen miteinander kommutieren. Wir beschreiben das Paradoxon anhand der Spinfreiheitsgrade von zwei Elektronen. Diese
Version geht auf David Bohm zurück und vermeidet die formalen Schwierigkeiten im
Zusammenhang mit den Eigenfunktionen zum Ort bzw. Impuls, die nichts mit dem
eigentlichen Problem zu tun haben. Statt der Spinfreiheitsgrade kann man ebenso gut
auch die Polarisationsfreiheitsgrade von Photonen betrachten.
Gegeben seien zwei Spin- 12 -Teilchen in dem Zustand, bei dem der Gesamtdrehimpuls S = S1 + S2 verschwindet. Dieser so genannte EPR-Zustand hat die Form:
1
|ΨEPR i = √ (| ↑i1 | ↓i2 − | ↓i1 | ↑i2 ) .
2
(8.33)
Die Indizes 1 und 2 beziehen sich dabei auf Teilchen 1 und Teilchen 2. Diese beiden
Teilchen seien unterscheidbar, entweder, weil sie einen großen Abstand voneinander
haben, oder weil es sich um verschiedene Teilchenarten handelt – EPR setzt nicht
voraus, dass die verschränkten Systeme ununterscheidbar sind. Die Symbole ↑ und
174
Mehrteilchensysteme
↓ in den Ket-Klammern bezeichnen die beiden möglichen Polarisationen des Spins
bezüglich einer vorgegebenen Richtung, beispielsweise der z-Richtung. Allerdings ist
der Zustand invariant unter beliebigen Drehungen (es handelt sich um den Gesamtdrehimpuls S = 0–Zustand, der rotationsinvariant ist), die Antikorrelation gilt also
bezüglich jeder Richtung.
Dieser Zustand ist verschränkt, d.h., es gibt keine Basis, in der dieser Zustand
faktorisiert. Keinem der beiden Teilchen kann ein wohldefinierter Spinzustand zugesprochen werden, es handelt sich um eine Superposition von zwei Beiträgen, bei denen
jeweils eine Spinkomponente eines Teilchens antikorreliert ist mit der entsprechenden Spinkomponente des anderen Teilchens. Wann immer man an einem Teilchen eine
Messung des Spins bezüglich irgendeiner Richtung vornimmt, weiß man, dass die Spinkomponente des anderen Teilchens bezüglich derselben Richtung den entgegengesetzten Wert hat. Diese Eigenschaft kann man an beliebig vielen gleichartig präparierten
Systemen kontrollieren: Bezüglich derselben Richtung sind die beiden Spinkomponenten immer antikorreliert!
EPR argumentieren nun folgendermaßen: Wenn wir an Teilchen 2 eine Spinmessung bezüglich irgendeiner Richtung vornehmen, können wir das Ergebnis der entsprechenden Messung an dem anderen Teilchen mit 100-prozentiger Sicherheit vorhersagen,
ohne an diesem Teilchen irgendeine Veränderung (Messung) vorgenommen zu haben.
Da Teilchen 1 aber nicht weiß“, bezüglich welcher Richtung wir an Teilchen 2 eine
”
Messung vornehmen, und wir trotzdem anschließend vorhersagen können, was eine
Messung an diesem Teilchen bezüglich der (willkürlich gewählten) Richtung ergeben
wird, muss dieses Ergebnis schon vorher irgendwie festliegen (durch einen bisher nicht
bekannten Freiheitsgrad innerhalb des Teilchens). Dies nennen EPR Elemente der
”
Realität“. Ihre Definition lautet: Wenn wir an einem System, ohne dieses in irgendei”
ner Weise zu stören, mit Sicherheit das Ergebnis einer Messung vorhersagen können,
dann muss es ein Element der Realität geben, das diesem Freiheitsgrad entspricht“.
Da die Quantenmechanik diesem Element der Realität nicht Rechnung trägt, ist die
Quantenmechanik nicht vollständig.
Die Reaktion der zeitgenössischen Physiker und Mitbegründer der Quantenmechanik war sehr unterschiedlich. Pauli schrieb unmittelbar nach der Veröffentlichung
einen Brief an Heisenberg, in dem er ihn aufforderte, eine Antwort auf den EPR-Artikel
zu verfassen [60]. In diesem Brief schrieb er unter anderem: Einstein hat sich wieder
”
einmal zur Quantenmechanik öffentlich geäußert ... (gemeinsam mit Podolsky und Rosen – keine gute Kompanie übrigens). Bekanntlich ist das jedes Mal eine Katastrophe,
wenn es geschieht. Weil, so schließt er messerscharf - nicht sein kann, was nicht sein
’
darf.‘ (Morgenstern). ... Immerhin möchte ich ihm zugestehen, dass ich, wenn mir
ein Student in jüngeren Semestern solche Einwände machen würde, diesen für ganz
intelligent und hoffnungsvoll halten würde. ...“.
Einstein-Podolsky-Rosen
175
Die Argumentation von EPR ist verblüffend einfach und dementsprechend hatte beispielsweise Bohr große Schwierigkeiten, eine passende Antwort zu finden [12].
Seine Antwort lautete, dass eine physikalische Messung (hier an Teilchen 2) nicht
unbedingt eine mechanische Störung“ für Teilchen 1 bedeuten muss (die beiden Teil”
chen können theoretisch Lichtjahre voneinander entfernt sein und die jeweiligen Messungen innerhalb der jeweiligen Lichtkegel — also außerhalb der jeweiligen kausalen
Einflussbereiche — stattfinden), dass eine solche Messung aber einen Einfluss auf die
”
Möglichkeiten der Vorhersagen zukünftiger Messungen“ hat. Wir würden sagen, die
Messung an Teilchen 2 verändert den Gesamtzustand der beiden Teilchen und damit
auch den Zustand für Teilchen 1. Die Problematik ist jedoch: Falls die Wellenfunktion
(oder allgemeiner der quantenmechanische Zustand) irgendeine Ontologie besitzt (also
irgendein Korrelat besitzt, das außerhalb unseres Erfahrungsbereichs existiert), dann
kommt es hier zu einer instantanen Veränderung über möglicherweise große Distanzen.
Man spricht daher auch von einer Nichtlokalität der Quantenmechanik. Die Antwort
von Bohr wird oftmals so gedeutet, dass er dem Quantenzustand eines Systems keine
von unserer Erfahrung unabhängige Realität zuschreibt und dieser somit subjektiv ist.
Die Reduktion besteht für Bohr (und Heisenberg hat dies später explizit betont [39])
lediglich in der Änderung unseres Wissens über das System.
Interessant ist, dass EPR in ihrem Artikel nicht die Widerspruchsfreiheit des
quantenmechanischen Formalismus angreifen. Sie hätten dies scheinbar leicht tun können, indem sie folgendermaßen argumentieren: Angenommen, wir messen die Polarisation an Teilchen 2 in x-Richtung. Dann kennen wir damit auch die Polarisation
von Teilchen 1 in x-Richtung (wegen der Antikorrelation). Messen wir nun die Polarisation von Teilchen 1 in z-Richtung, kennen wir sowohl seine Polarisation in z als
auch in x-Richtung, was nach den Unschärferelationen nicht möglich sein sollte. In
ähnlicher Weise hatte Einstein bei seinen früheren Angriffen auf die Quantenmechanik
argumentiert und Bohr hatte immer damit gekontert, dass wir die Vorhersage, die wir
für die x-Richtung der Polarisation von Teilchen 1 treffen, nicht mehr kontrollieren
können, nachdem wir die z-Richtung gemessen haben, und somit diese Vorhersage
nicht überprüfbar sei. EPR greifen in ihrem Artikel die scheinbare Unvollständigkeit
der Quantenmechanik an, nicht ihre scheinbare Widersprüchlichkeit.
Wir sollten abschließend noch anmerken, dass die Korrelationen bzw. Antikorrelationen von verschränkten Zuständen nicht zu einer Signalübertragung verwendet
werden können, da wir keinen Einfluss auf das Ergebnis einer Spinmessung haben. In
diesem Sinne sind die Korrelationen ähnlich wie bei klassischen Systemen, bei denen
aufgrund einer gemeinsamen Ursache eine Korrelation vorliegt. Beispielsweise kann
eine Person zwei Briefe identischen Inhalts an zwei andere, weit voneinaner entfernte
Personen schicken, die diese Briefe gleichzeitig öffnen und somit instantan wissen, was
die andere Person in diesem Augenblick liest. Trotzdem kann die eine Person auf diese
176
Mehrteilchensysteme
Weise keine instantane Information zur anderen Person übertragen. Allerdings gibt es
in diesem Fall die Elemente der Realität“, denn der Inhalt der Briefe liegt ja schon
”
vor, bevor die Personen die Briefe öffnen. Eine ähnliche verborgene Variable“ stellte
”
sich wohl auch Einstein vor, als er das Paradoxon formulierte und zu dem Schluss kam,
die QM sei nicht vollständig. Wie wir im folgenden Abschnitt sehen werden, kann es
verborgene Variable dieser Art in der QM nicht geben.
8.4
Bell’sche Ungleichungen
Mitte der 60er Jahre des 20. Jahrhunderts ging John Bell in mehreren Artikeln der
Frage nach, ob es diese Elemente der Realität“ – heute würde man meist von ver”
”
steckten Parametern“ sprechen, da diese Parameter nach der Quantentheorie nicht
beobachtbar sein sollten – wirklich geben kann [4, 6]. Bis zu diesem Zeitpunkt existierten bereits mehrere so genannte No-Go-Theoreme, welche die Existenz versteckter
Variabler auszuschließen schienen. Das bekannteste dieser No-Go-Theoreme stammte
von Johann von Neumann und wurde 1932 in seinem Buch zu den mathematischen
Grundlagen der Quantenmechanik [65] veröffentlicht. Interessanter Weise hatte schon
im Jahre 1935 die Mathematikerin und Philosophin Grete Hermann auf eine physikalisch nicht gerechtfertigte Annahme in von Neumanns Beweis hingewiesen [40], durch
welche das zu Beweisende praktisch schon hineingesteckt wird. Und auch von Neumann selbst betont in seinem Buch, dass es für diese Annahme keine physikalische
oder mathematische Notwendigkeit gibt. Er schreibt, sie sei in der Quantenmechanik
aber erfüllt und für seinen Beweis (der Nichtexistenz verborgener Variabler) wolle er
von dieser Annahme ausgehen.
Obwohl jedoch beispielsweise Werner Heisenberg und Carl Friedrich von Weizsäcker von der Arbeit von Grete Hermann wussten (und sich auch Einstein dieses
Problems bewusst war), blieb diese Kritik bis in die 70er Jahre verschollen. (Nähreres
zu dieser spannenden Geschichte findet man bei Max Jammer [45] sowie in dem sehr
lesenswerten populärwissenschaftlichen Buch The Age of Entanglement“ von Louisa
”
Gilder [34].)
Nachdem im Jahre 1952 David Bohm eine Erweiterung der Quantenmechanik im Sinne von versteckten Variablen gelang, und somit das scheinbar Unmögliche
wahr geworden war, machte sich John Bell an die Untersuchung der bisherigen NoGo-Theoreme, um deren Schwachstellen zu finden. Insbesondere war ihm bewusst,
dass die Bohm’sche Mechanik keine lokale Theorie ist, d.h., physikalisch objektiv vorhandene Entitäten (das Führungsfeld, vgl. Abschnitt 13.7) ändern sich instantan und
global als Folge einer Messung. Bells eigentliches Anliegen war die Frage, ob man
nicht eine Theorie mit verborgenen Variablen konstruieren kann, die lokal ist, d.h.,
mit dem Kausalitätsverständnis der Relativitätstheorie vereinbar. Das Ergebnis seiner
Bell’sche Ungleichungen
177
Überlegungen – die Bell’schen Ungleichungen – zeigten, dass keine lokale Theorie die
experimentellen Vorhersagen der Quantenmechanik reproduzieren kann.
8.4.1
Bell’sche Ungleichungen — die Version von Wigner und
d’Espagnat
Die folgende anschauliche Herleitung einer Bell’schen Ungleichung (es gibt mehrere
verschiedene Versionen von Bell’schen Ungleichungen) geht ursprünglich auf Eugene
Wigner und in der hier vorgestellten Form auf Bernard d’Espagnat zurück [26].
Wir nehmen an, es gebe drei verschiedene Observable A, B und C, die jeweils
nur einen von zwei möglichen Werten annehmen können. Ein klassisches Beispiel wäre
ein System aus drei Münzen, die jeweils Kopf“ oder Zahl“ zeigen können. Aus irgend”
”
einem Grund können wir aber an einem System jeweils nur zwei dieser Observablen
messen, dafür können wir aber an beliebig vielen entsprechend präparierten Systemen solche Messungen vornehmen. Wir teilen nun ein ausreichend großes Ensemble
solcher Systeme in drei gleich große Gruppen. Bei der ersten Gruppe messen wir die
Observablen A, B, bei der zweiten die Observablen B und C und bei der dritten die
Observablen A und C. Die Behauptung ist nun, dass die Häufigkeit der Systeme, bei
denen die Observablen A und C gemessen werden und verschiedene Werte annehmen,
immer kleiner ist als die Summe der Fälle, bei denen A und B gemessen werden und
verschiedene Werte annehmen bzw. bei denen die Werte von B und C als verschieden
gemessen werden. Anschaulich bedeutet das, wann immer A und C verschieden sind,
muss auch entweder A und B verschieden sein oder aber B und C verschieden sein.
Diese logische Folgerung – A und C können nicht verschieden sein, wenn A und B
einerseits und B und C andererseits gleich sind – wird nun statistisch gemessen, da
nicht alle drei Observablen an denselben Systemen überprüft werden können.
Die Ungleichung lautet also:
N − (A, C) ≤ N − (A, B) + N − (B, C) ,
(8.34)
wobei N − andeuten soll, dass nur die Fälle gezählt werden, bei denen die beiden
jeweiligen Observable verschiedene Werte annehmen.
Etwas expliziter können wir auch schreiben:
N (A+ , C − ) + N (A− , C + ) ≤ N (A+ , B − ) + N (A− , B + ) + N (B + , C − ) + N (C − , B + ) ,
(8.35)
+
−
wobei nun N (A , C ) die Anzahl der Fälle kennzeichnet, bei denen die Observable A
den Wert + und die Observable C den Wert − annimmt; entsprechend für die anderen
Terme. Der Physiker John Clauser drückte diese Ungleichung einmal in der Form
aus (aus [34]): Die Anzahl der jungen Nichtraucher plus die Anzahl der weiblichen
”
178
Mehrteilchensysteme
Raucher aller Altersstufen ist größer oder gleich der Gesamtzahl aller jungen Frauen
(Raucher und Nichtraucher).“ Es sei dem Leser überlassen, die Beziehung zu obiger
Ungleichung herzustellen.
Diese Ungleichung ist fast
−
−
−
A
B
C N (A, C) N (A, B) N (B, C) trivial und man kann sich
von Ihrer Richtigkeit leicht
+1 +1 +1
überzeugen, indem man
+1 +1 −1
×
×
eine Tabelle aller acht
+1 −1 +1
×
×
Möglichkeiten für die Werte
+1 −1 −1
×
×
der Observablen erstellt und
−1 +1 +1
×
×
dann nachweist, dass die Er−1 +1 −1
×
×
eignisse, die zur linken Seite
beitragen, eine Teilmenge
−1 −1 +1
×
×
der Ereignisse sind, die zur
−1 −1 −1
rechten Seite beitragen.
Bell koppelte diese Ungleichung mit der experimentellen Situation von EPR. Da
die Werte bei Messung derselben Observablen an den beiden Teilsystemen immer antikorreliert sind, können wir eine der beiden Observablen an Teilsystem 1 messen und die
andere an Teilsystem 2. Wenn wir nun mit n+ (A, B) die Anzahl der Fälle bezeichnen,
bei denen an Teilsystem 1 Observable A gemessen wurde und an Teilsystem 2 die
Observable B und die beiden Ergebnisse gleich sind, dann folgt die Ungleichung
n+ (A, C) ≤ n+ (A, B) + n+ (B, C) .
(8.36)
Diese Ungleichung ist nochmals an untenstehender Tabelle verdeutlicht, bei der die
möglichen Zustände von beiden (vollkständig antikorrellierten) Teilchen angegeben
sind, und n+ sich jeweils auf eine Messung an Teilchen 1 und eine an Teilchen 2
bezieht, und nur die Fälle zählt, bei denen diese beiden Messungen dasselbe Ergebnis
liefern.
C2
n+ (A, C) n+ (A, B) n+ (B, C)
A1
B1
C1
A2
B2
+1
+1
+1
−1
−1 −1
+1
+1
−1
−1
−1
+1
+1
−1
+1
−1
+1
−1
+1
−1 −1
−1
+1
+1
×
×
−1
+1
+1
+1
−1 −1
×
×
−1
+1
−1
+1
−1
+1
−1 −1
+1
+1
+1
−1
−1 −1 −1
+1
+1
+1
×
×
×
×
×
×
×
×
Bell’sche Ungleichungen
179
Diese Ungleichung kann in Quantensystemen verletzt sein. Wir bezeichnen nun
mit der Observablen A die Messung der Spinvariablen in 0◦ -Richtung (relativ zur zAchse beispielsweise), mit B die Messung in 60◦ -Richtung und mit C die Messung in
120◦ -Richtung. Die Ungleichung besagt dann, wenn wir an den beiden Teilchen eine
Spinmessung in zwei Richtungen durchführen, die sich um 120◦ voneinander unterscheiden, dann ist die Häufigkeit der Fälle, bei denen wir dasselbe Resultat erhalten,
immer kleiner als die Summe der Anzahl der Fälle, bei denen wir an Teilchen 1 eine
Messung in 0◦ (bzw. 60◦ ) durchführen und an Teilchen 2 eine Messung in 60◦ -Richtung
(bzw. 120◦ -Richtung) und die Ergebnisse gleich sind. Da in der QM die Wahrscheinlichkeit, an zwei im EPR-Zustand verschränkten Teilchen dasselbe Resultat zu erhalten,
wenn die Messung an Teilchen 1 in α-Richtung erfolgt und die Messung an Teilchen 2
in β-Richtung, gleich
β−α
2
(8.37)
w(α, β) = sin
2
ist, kann man sofort sehen, dass die Ungleichung in der QM verletzt ist (sin 30◦ = 12
√
und sin 60◦ = 3/2).
Bei Polarisationsexperimenten mit Photonen muss Gleichung 8.37 übrigens durch
w(α, β) = sin2 (β − α) ersetzt werden und man würde die Polarisationsfilter unter 0◦ ,
30◦ und 60◦ ortientieren. Der unterschiedliche Faktor 21 hängt mit dem Unterschied
zwischen Spin-Orientierung und Polarisation zusammen. Anschaulich bringt er zum
Ausdruck, dass zwei entgegengesetzte Spin-Richtungen zu orthogonalen Zuständen
gehören, wohingegen zwei unter 90◦ orientierte Polarisationsrichtungen orthogonalen
Zuständen entsprechen.
In den 70er Jahren wurde mehrere Experimente zum Test der Bell’schen Ungleichung in der Quantenmechanik durchgeführt, allerdings war die Statistik sehr schlecht
und die Ergebnisse waren teilweise widersprüchlich. Im Jahre 1982 bestätigten die
Experimente von Alain Aspect [1] an Photonen schließlich, dass die Bell’schen Ungleichungen in der Quantenmechanik eindeutig verletzt sind. Insbesondere konnte Aspect
auch zeigen, dass die Verletzung der Bell’schen Ungleichung bestehen bleibt, selbst
wenn die Messungen an Teilsystem 1 und Teilsystem 2 innerhalb der jeweiligen kausalen Komplemente bezüglich einer Signalausbreitung mit Lichtgeschwindigkeit erfolgen.
(Aspect verwendete Photonenpaare in einem Abstand von rund 10 Metern, sodass
die Messungen innerhalb von Nanosekunden stattfinden mussten, mittlerweile wurden ähnliche Experimente mit Photonenpaaren im Abstand von rund 80 Kilometern
wiederholt und die Vorhersagen der Quantenmechanik bestätigt.)
Im Wesentlichen gehen drei Annahmen in die obige Form der Bell’schen Ungleichungen ein, von denen mindestens eine in der Quantenmechanik verletzt sein muss:
1. Induktionsannahme: Falls es die versteckten Variablen gibt, welche im EPRZustand für die Antikorrelation der Spinkomponenten in dieselbe Richtung ver-
180
Mehrteilchensysteme
antwortlich sind, so darf die Antikorrelation auch angenommen werden, wenn
die Messungen an den Teilsystemen in verschiedene Richtungen erfolgen.
2. Einstein-Realität: Es ist sinnvoll anzunehmen, dass es die Elemente der Realität
gibt, durch welche die Ergebnisse der Messungen schon festliegen, bevor die Messungen tatsächlich durchgeführt werden. (Die Antikorrelation wurde also schon
bei der Erstellung der Verschränkung durch die gemeinsame Ursache festgelegt.)
3. Lokalität: Die Information über das Ergebnis einer Messung breitet sich maximal mit Lichtgeschwindigkeit (bzw. einer Grenzgeschwindigkeit) aus, d.h., es
findet keine instantane Signalübertragung von Teilsystem 1 zu Teilsystem 2 im
Augenblick der Messung statt.
Könnten wir die Spinvariable in α- und β-Richtung an einem Teilsystem messen,
könnte die Bell’sche Ungleichung nur verletzt sein, wenn Bedingung 2 verletzt ist.
Da die Messungen in α- und β-Richtung aber zu nicht-kommutierenden Observablen
gehören, können sie nicht gleichzeitig an demselben System vorgenommen werden.
Daher wollen wir von der Messung an Teilsystem 2 auf die versteckten Variablen von
Teilsystem 1 schließen, und für diese Schlussfolgerung benötigen wir die beiden anderen
Annahmen.
Die Ergebnisse von Bell zeigen, dass jedes Modell mit versteckten Variablen, das
die Ergebnisse der Quantenmechanik reproduziert, nicht-lokal sein muss. Tatsächlich
ist das Bohm’sche Modell der Quantenmechanik (bzw. die Bohm’sche Mechanik) eine
nicht-lokale Theorie, bei der sich gewisse Potenzialfelder instantan im Raum ändern,
wenn eine Messung durchgeführt wird. Da die EPR-Korrelationen keine Signalübertragung ermöglichen, hat diese Nichtlokalität keine messbaren Konsequenzen. Auch die
Quantenmechanik wird als eine nicht-lokale Theorie bezeichnet, da sich der Zustand
eines verschränkten Systems instantan (d.h., möglicherweise über ein großes Gebiet
verteilt bzw. in Gebieten, die einen großen Abstand voneinander haben) verändert. Lediglich eine Interpretation der Quantenmechanik, die dem Quantenzustand (der Wellenfunktion) keinerlei ontologische Realität zuschreibt, hat mit dieser Nicht-Lokalität
keine Probleme.
8.4.2
Bell’sche Ungleichungen — CHSH-Version
Nachdem John Bell seine Ungleichung abgeleitet und veröffentlich hatte, versuchten
verschiedene Gruppen, die Ungleichung experimentell zu testen. Dabei stellte sich
jedoch heraus, dass die ursprüngliche Form von Bell nicht besonders gut für eine
experimentelle Überprüfung geeignet war.
Mehrere Gruppen bauten entsprechende Experimente auf und in diesem Zusammenhang formulierten John Clauser, Michael Horne, Abner Shimony und Richard
Bell’sche Ungleichungen
181
Holt eine neue Form der Bell’schen Ungleichung [18], die experimentell leichter zu realisieren war, da sie für jedes der beiden Teilchen nur zwei verschiedene Möglichkeiten
testete (damit waren die Schalter, die zwischen den Möglichkeiten umschalten mussten, einfacher). Diese Ungleichung bezeichnet man heute als CHSH-Ungleichung bzw.
CHSH-Form der Bell’schen Ungleichung.
Der verschränkte Zustand ist ähnlich wie der EPR-Zustand, allerdings werden
an Teilchen 1 nur die Polarisationen unter 0◦ und 45◦ gemessen, und an Teilchen 2
die Polarisationen unter 22, 5◦ und 67, 5◦ . Die genauen Winkel spielen für die Ungleichung überhaupt keine Rolle, allerdings ist die Ungleichung für diese Winkel in der
Quantenmechanik maximal verletzt.
Für das Folgende nehmen wir 4 Eigenschaften an, die wir mit a, a0 , b und b0
bezeichnen. Diese 4 Eigenschaften werden an den beiden Teilchen eines EPR-Zustands
gemessen, wobei an Teilchen 1 nur die Eigenschaften a und a0 und an Teilchen 2 nur
die Eigenschaften b und b0 gemessen werden. Die möglichen Resultate einer Messung
von jeder der vier Eigenschaften können nur +1 und −1 sein.
a
a0
b
b0
S
+1
+1
+1
+1
+2
+1
−1
+1
+1
−2
−1
+1
+1
+1
+2
−1 −1
+1
+1
−2
+1
+1
+1
−1
+2
+1
−1
+1
−1
+2
−1
+1
+1
−1
−2
−1 −1
+1
−1
−2
+1
+1
−1
+1
−2
+1
−1 −1
+1
−2
−1
+1
−1
+1
+2
−1 −1 −1
+1
+2
In nebenstehender Tabelle sind alle 16
Möglichkeiten für die vier Eigenschaften aufgelistet. Ebenfalls aufgelistet ist die folgende
Kombination:
S = ab − ab0 + a0 b + a0 b0
+1
+1
−1 −1
−2
+1
−1 −1 −1
+2
−1
+1
−1 −1
−2
Jeder Term in dieser Kombination ist ein Produkt
aus einer der beiden Eigenschaften, die am ersten
Teilchen gemessen werden (a oder a0 ) und einer der
beiden Eigenschaften, die am zweiten Teilchen gemessen werden (b oder b0 ). Man erkennt, dass in allen 16 Fällen der Wert für S immer nur +2 oder −2
sein kann. Bilden wir also den Erwartungswert von
S über sehr viele Messungen (in jeder Einzelmessung kann immer nur einer der Terme in der Summe bestimmt werden), so sollte der Erwartungswert
E(S) schließlich zwischen −2 und +2 liegen. Wir
erhalten also die Ungleichung:
−1 −1 −1 −1
+2
−2 ≤ E(S) ≤ +2 .
(8.38)
Experimentell erzeugt man ein Ensemble verschränkter Teilchen, beispielsweise im EPR-Zustand, und an jedem Teilchenpaar wird eine der vier Kominationen
(a, b), (a, b0 ), (a0 , b), (a0 , b0 ) gemessen. Zu jeder dieser Kombinationen erhält man schließ-
182
Mehrteilchensysteme
lich einen Erwartungswert für das Produkt der Messwerte, was zu der Ungleichung
−2 ≤ E(a, b) − E(a, b0 ) + E(a0 , b) + E(a0 , b0 ) ≤ +2
(8.39)
führt.
Bei der experimentellen Realisation gibt es zwei Schwierigkeiten: Erstens benötigt
man einen schnellen Schalter, mit dem man möglichst im Nanosekundenbereich zwischen den beiden Winkeln, die an einem Teilsystem gemessen werden, hin- und herschalten kann, sodass eine Signalausbreitung zwischen den beiden Teilsystemen mit
Lichtgeschwindigkeit ausgeschlossen werden kann. Das zweite Problem besteht in einem möglichst effizienten Detektor, der ein Teilchen, das einen der Filter passiert, auch
tatsächlich nachweist. Insbesondere möchte man natürlich auch umgekehrt aus dem
Nicht-Nachweis eines Teilchens in einem Detektor schließen können, dass das Teilchen
die entgegengesetzte Polarisation hatte. Nach ersten, noch mit großen Fehlern behafteten Experimenten in den 70er Jahren konnte Alain Aspect [1] 1982 die Ergebnisse
eines Experiments veröffentlichen, das (fast) alle Zweifel an den richtigen Vorhersagen
der Quantenmechanik ausräumte.
Seien N ++ , N +− , N −+ , N −− die vier Möglichkeiten, wie bei gegebener Winkeleinstellung der Filter die beiden Detektoren reagieren (+ bedeutet einen Teilchennachweis, − einen Nicht-Nachweis und somit – im theoretischen Idealfall – die orthogonale
Polarisation), dann ist der zugehörige Erwartungswert durch
E=
N ++ + N −− − N +− − N −+
N ++ + N −− + N +− + N −+
(8.40)
gegeben.
Die quantenmechanischen Erwartungswerte für eine Winkeldifferenz ∆α zwischen den beiden Einstellungen an Teilchen 1 und 2 hängen von der Art des verschränkten Zustands ab: Bei einem EPR-Zustand besteht eine totale Antikorrelation
zwischen den Polarisationen (d.h., die Wahrscheinlichkeit zwei im Bell-Zustand verschränkte Photonen mit derselben Polarisation zu messen ist null), in anderen verschränkten Zuständen kann man auch eine totale Korrelation erzeugen, sodass die
oben genannte Wahrscheinlichkeit eins ist.
Die folgenden Gleichungen beziehen sich auf einen total korrelierten verschränkten
Zustand (bei EPR müsse man überall die Kosinus- durch die Sinus-Funktion ersetzen,
was letztendlich nur zu einem Vorzeichenwechsel führt). Die Erwartungswerte für eine
Winkeldifferenze ∆α sind in diesem Fall:
E(∆α) = cos2 ∆α − sin2 ∆α = cos 2∆α .
(8.41)
cos2 ∆α ist die Wahrscheinlichkeit, dass die beiden Teilchen denselben Messwert liefern
(beide + oder beide −) und sin2 ∆α ist die Wahrscheinlichkeit, dass sie verschiedene
Werte liefern (+− bzw. −+).
8.5. UMSETZUNGEN FÜR DIE SCHULE
183
Für die Winkel a = 0◦ , a0 = 45◦ , b = 22, 5◦ und b0 = 67, 5◦ gibt es letztendlich
für ∆α nur zwei Kombinationen: (a, b0 ) → ∆α = 67, 5◦ und (a, b), (a0 , b), (a0 , b0 ) →
∆α = ±22, 5◦ . damit folgt schließlich:
√
4
(8.42)
E(S) = 3 · cos(2 · 22, 5◦ ) − cos(2 · 67, 5◦ ) = √ = 2 2 ≈ 2, 828 .
2
√
Dieses Ergebnis ist also um einen Faktor 2 größer, als es nach der Bell’schen Ungleichung erlaubt wäre (man bezeichnet diesen Wert auch als Quantum bound“). Das
”
erscheint im ersten Augenblick zwar viel, doch da sich jede Unsicherheit (beispielsweise
bei der Ansprechgenauigkeit der Detektoren) zu Ungunsten des Ergebnisses auswirkt,
war der experimentelle Nachweis der Verletzung nicht einfach.
Übrigens gehen in die CHSH-Ungleichung nur zwei der drei oben genannten
Annahmen ein. Die Induktionsannahme ist nicht erforderlich, da die Korrelation oder
Anti-Korrelation bezüglich derselben Orientierungen jetzt weder gemessen werden
noch eine entscheidende Rolle für die Ungleichung spielen. (Sie spielen natürlich eine
Rolle für den Nachweis der Verletzung in der Quantenmechanik, da an einem unverschränkten Zustand die Ungleichung nicht verletzt werden kann.)
8.5
Umsetzungen für die Schule
Zum Abschluss schildern wir noch einige Möglichkeiten, wie man die Bedeutung der
Bell’schen Ungleichungen und ihrer Verletzung in der Quantenmechanik gegenüber
Schülern verdeutlichen kann. Dazu betrachten wir drei Szenarien.
8.5.1
Drei Vesperdosen
Die folgende Darstellung ist eine Abwandlung von einer Parabel, die Ernst Specker
zugeschrieben wird (siehe z.B. [54]).
Man stelle sich vor, die Mutter einer Schülerin oder eines Schülers richtet jeden
Morgen drei Vesperdosen, davon sind zwei für den Schüler bzw. die Schülerin und eine
verbleibt bei der Mutter. Immer wenn das Kind in der Schule die beiden Vesperdosen
öffnet, befindet sich in einer ein Wurstbrot und in der anderen Vesperdose ein Käsebrot.
Wie ist das möglich?
Unnatürlich an dieser Geschichte ist, dass in den drei Vesperdosen offensichtlich
entweder jeweils ein Wurstbrot oder ein Käsebrot ist. Doch weshalb greift man nie zwei
Dosen, bei denen in beiden ein Wurstbrot bzw. in beiden ein Käsebrot ist? Bei drei
Dosen, muss doch (mindestens) in zwei Dosen dasselbe sein.
Man kann sich nun überlegen, ob die Mutter vielleicht ihr Kind beeinflusst
( hypnotisiert“), sodass es genau die beiden Dosen mit verschiedenen Inhalten nimmt.
”
184
Mehrteilchensysteme
Das würde bedeuten, dass das Kind die Dosen nicht nach freiem Willen“ greift, son”
dern in seiner Willensfreiheit eingeschränkt ist.
Dieses Beispiel zeigt die allgemeine Problematik der Quantenmechanik, nämlich
dass die Inhalte möglicherweise erst entstehen, wenn die Dosen geöffnet werden. Man
kann dann auch die Nicht-Lokalität der Quantenmechanik daran illustrieren, wenn
man nämlich die beiden Dosen noch sehr weit voneinander entfernt. Man denke z.B.
an zwei Kinder der Mutter, die sich jeweils eine Dose aussuchen können, diese aber an
getrennten Orten öffnen und am Abend feststellen, dass in der einen Dose ein Wurstund in der anderen ein Käsebrot war. Falls die Dosen gleichzeitig geöffnet wurden
und die Brote erst im Augenblick des Öffnens entstehen, wie kann es dann zu der
Antikorrelation kommen?
8.5.2
Nochmals Vesperdosen
Das obige Beispiel verdeutlicht zwar die Problematik im Zusammenhang mit verschränkten Zuständen, entspricht aber in dieser Form nicht direkt den erwähnten
Fällen (z.B. der Wigner-Ungleichung). Dies erreicht man jedoch durch eine kleine
Abwandlung der obigen Geschichte.
Eine Mutte hat zwei Kinder. Sie bereitet jeden Morgen drei Vesperdosen, die sie
nebeneinander aufstellt. Die beiden Kinder können sich jeweils eine Dose aussuchen,
die sie dann in der Schule öffnen. Immer, wenn die beiden Kinder zwei benachbarte
Dosen nehmen (also die mittlere Dose und entweder die rechte oder die linke), haben
sie denselben Brotaufstrich. Doch wenn sie die beiden äußeren Dosen nehmen, finden
sie einen verschiedenen Brotaufstrich. Wie kann das sein?
Diese Geschichte entspricht eher der Wigner-Ungleichung: Die Inhalte von A
und B bzw. die Inhalte von B und C sind (fast) immer gleich, aber die Inhalte von A
und C sind verschieden. Wenn man auch hier ausschließt, dass die Kinder ihre Dosen
nicht frei aussuchen (sondern von der Mutter beeinflusst wurden), bleibt fast nur die
Möglichkeit, dass die Inhalte der Dosen erst nach der Wahl der Dosen entstehen“.
”
8.5.3
Eine Schülerbefragung“
”
Als drittes Beispiel wählen wir eine hypothetische Hintergrundgeschichte (hier sind
der Phantasie aber keine Grenzen gesetzt): Zwei Personen (Schüler) sind Zeugen eines
Einbruchs geworden, bei dem drei Einbrecher jeweils Kleidung unterschiedlicher Farbe
hatten – B'Blau, R'Rot und S'Schwarz. Diese Kleidungsfarbe dient nur dazu, dass
man jeden der drei Einbrecher durch seine Kleidung identifizieren kann. Die beiden
Schüler werden nun getrennt zum Geschlecht der jeweiligen Einbrecher befragt. Dabei
wird jedem Schüler nur eine Frage gestellt; diese Frage unterscheidet sich lediglich in
Bezug auf die Person (die Farbe der Kleidung), lautet aber ansonsten immer gleich:
8.5. UMSETZUNGEN FÜR DIE SCHULE
185
• Welches Geschlecht hatte die Person X? (wobei X durch B, R oder S zu ersetzen
ist)
(die möglichen Antworten lauten männlich“ oder weiblich“)
”
”
Wann immer die beiden Schüler zu derselben Person befragt werden, müssen sie gleich
antworten. Dies ist eine Grundbedingung (andernfalls werden die Spielregeln verletzt
und die Schüler disqualifiziert). Werden die Schüler zu verschiedenen Personen befragt,
gibt es keine Einschränkungen. Wie schon erwähnt wird jedem Schüler nur eine Frage
gestellt.
Die einzige Möglichkeit zu garantieren, dass bei Fragen zur gleichen Person die
Antworten immer gleich sind, besteht darin, dass sich die Schüler vorher absprechen,
welche Antworten sie auf die drei möglichen Fragen geben wollen. Diese Absprache
entspricht den verborgenen Variablen“, denn nun steht ja schon vor der eigentlichen
”
Befragung fest, welche Antworten die Schüler auf die jeweiligen Fragen geben würden.
Man kann sich nun (beispielsweise anhand von der obigen Tabelle (Seite 178),
bei der lediglich A, B, C durch B, R, S sowie + und − durch m “ und w “ zu ersetzen
”
”
sind) überlegen, dass statistisch die folgende Ungleichung erfüllt sein muss (identisch
zu Gl. 8.34):
N − (B, S) ≤ N − (B, R) + N − (R, S)
(8.43)
wobei nun N − (B, S) bedeutet, dass einer der Schüler nach dem Geschlecht von Person
B und der andere nach dem von Person S befragt wurde, und sie unterschiedliche
Antworten gegeben haben.
Bei einer vorherigen Absprache der jeweiligen Antworten kann die Ungleichung
nicht verletzt werden. Ohne eine solche Absprache können die Schüler aber nicht garantieren, dass sie die Spielregeln einhalten (bei Befragung nach derselben Person auch
dasselbe zu antworten). Die verborgenen Variablen machen eine Verletzung unmöglich.
Eine Möglichkeit gibt es aber: Falls die Schüler ihre Handys eingeschaltet haben,
hören sie, welche Frage dem jeweils anderen Schüler gestellt wird und können ihre
Antworten nun spontan abstimmen: Immer, wenn ihnen dieselbe Frage gestellt wird,
antworten sie wie vorher abgesprochen; sind die Fragen aber verschieden, antworten sie
mit demselben Geschlecht (z.B., immer mit m“), wenn ein R dabei ist, und ansonsten
”
mit verschiedenen Geschlechtern. Durch diese Nicht-Lokalität“ der Kommunikation,
”
nachdem zumindest einem der Schüler die Frage gestellt wurde, kann die Ungleichung
verletzt werden.
Hypothetisch besteht noch eine zweite Möglichkeit, diese Ungleichung zu verletzen: Falls nämlich schon vor Beginn der eigentlichen Befragung bekannt ist, in welcher
Reihenfolge welche Fragen gestellt werden, beispielsweise falls eine Liste kursiert, in
der die jeweiligen Fragen, die dann später den Schülerpaaren gestellt werden, in ihrer
Reihenfolge schon festgelegt sind. Dann können sich die Schüler natürlich dahingehend
186
Mehrteilchensysteme
absprechen, dass sie bei gleichen Fragen eben Dasselbe antworten, und bei verschiedenen Fragen entsprechend der obigen Regel reagieren, die eine Verletzung der Bell’schen
Ungleichung impliziert. Eine solche vorab kursierende Liste der möglichen Fragen bedeutet in der Physik, dass die Richtungen, bezüglich derer im Experiment die SpinKomponenten bestimmt werden sollen, schon vor Beginn des Experiments festliegen,
beispielsweise bei der Erzeugung der verschränkten Teilchenpaare. Das heißt aber, der
Experimentator hat keinen freien Willen“, spontan zu entscheiden, bezüglich welcher
”
Richtung die Komponenten gemessen werden sollen.
Kapitel 9
Zwei-Zustands-Systeme
Zwei-Zustandssysteme spielen in der Quantentheorie aus vielen Gründen eine wichtige
Rolle. Zum Einen handelt es sich um die einfachsten nicht-trivialen Quantensysteme,
und daher sind sie schon allein aus pädagogischen Gründen von besonderem Interesse.
Zur Darstellung der Zustände genügt ein komplex zweidimensionaler Vektorraum, d.h.
die Observablen sind 2 × 2-Matrizen und die Zustände lassen sich durch zweidimensionale Vektoren darstellen. Trotz dieser Einfachheit kann man bereits sehr viele der
quantenmechanischen Besonderheiten an diesen Systemen erläutern.
Aber auch aus physikalischen Gründen sind Zwei-Zustandssysteme wichtig. Wie
wir gesehen haben, lassen sich die Polarisationszustände von Photonen durch ein
solches System beschreiben, das Gleiche gilt für die Spin-Zustände von Elektronen
bzw. allgemeiner von Spin- 21 -Systemen. Außerdem sind quantenmechanische ZweiZustandssysteme die natürliche Erweiterung der klassischen Bool’schen Variablen 0
und 1, also der elementaren Einheit – dem Bit – der Mathematik der Informationstheorie. Entsprechend sind quantenmechanische Zwei-Zustandssysteme die elementaren Einheiten der Quanteninformation“ und des Quantum Computing“ und be”
”
schreiben ein Qubit“.
”
Schließlich sind Zwei-Zustandssysteme oftmals gute Näherungen für komplexere
Systeme, bei denen beispielsweise aufgrund der Wechselwirkung dieser Systeme mit
anderen Objekten oder einer Umgebung nur der Grundzustand und der erste angeregte
Zustand physikalisch von Relevanz sind.
Was man wissen sollte
Man sollte die Pauli-Matrizen und ihre Vertauschungsrelationen (zumindest bis auf
Vorzeichen, die Konvention sind) kennen. Das Konzept der Bloch-Kugel sollte bekannt
sein, auf deren Oberfläche die reinen Zustände und in deren Inneren die gemischten
Zustände dargestellt werden. Das Stern-Gerlach Experiment sollte man beschreiben
187
188
Zwei-Zustands-Systeme
und auch die Gründe für die Inhomogenität des Magnetfelds angeben können. Die
Parallelen sowie auch die Unterschiede zwischen der Spin- 12 -Darstellung beispielsweise
für Elektronen und der Polarisationsdarstellung für Photonen sollten bekannt sein.
Ebenso sollte man wissen, was das No-Cloning“-Theorem aussagt. Man sollte den
”
Begriff des Qubits (der Einheit“ der Quanteninformation) kennen und seinen Bezug
”
zu den Spin- bzw. den Polarisationszuständen beschreiben können. Außerdem sollte
man das Prinzip der Quantenkryptographie beschreiben können.
9.1
Pauli-Matrizen
Zwei-Zustandssysteme werden in der Quantenmechanik in einem (komplex) zweidimensionalen Hilbertraum C2 mit dem kanonischen (hermiteschen) Skalarprodukt,
~y · ~x = hy|xi = y1∗ x1 + y2∗ x2 ,
(9.1)
beschrieben.
Bevor wir uns mit den physikalischen Zuständen und den Observablen beschäftigen, definieren wir einen Satz von Matrizen, der sich in diesem Zusammenhang
als sehr hilfreich erwiesen hat und mit dem sich jede andere Matrix ausdrücken lässt.
Dies sind die Pauli-Matrizen:
!
!
!
0 1
0 −i
1 0
σ1 =
σ2 =
σ3 =
.
(9.2)
1 0
i 0
0 −1
Es handelt sich um drei selbst-adjungierte (hermitesche) Matrizen, die zusammen mit
der Identitätsmatrix 1 den Raum aller 2 × 2 Matrizen aufspannen (im Sinne eines
Vektorraums, d.h., jede 2 × 2–Matrix lässt sich als komplexe Linearkombination der
vier genannten Matrizen schreiben).
Ist man nur an selbst-adjungierten Matrizen interessiert, lässt sich jede 2 × 2Matrix in der Form
!
3
X
a0 + a3 a1 − ia2
A=
ai σi = a0 1 + a1 σ1 + a2 σ2 + a3 σ3 =
(9.3)
a
+
ia
a
−
a
1
2
0
3
i=0
schreiben, wobei ai ∈ R. Die Eigenwerte einer solchen Matrix erhalten wir aus der
charakteristischen Gleichung:
det(λ 1 − A) = λ2 − 2a0 λ + a20 − (a21 + a22 + a23 ) = 0
(9.4)
mit den Lösungen:
λ1/2 = a0 ±
q
a20 − (a20 − ~a2 ) = a0 ± |~a| ,
(9.5)
Der Zustandsraum
189
wobei wir ~a = (a1 , a2 , a3 ) geschrieben haben. Die Pauli-Matrizen erfüllen sehr einfache
Multiplikations- und Kommutatorregeln:
σ1 σ2 = iσ3
[σ1 , σ2 ] = 2iσ3
σ2 σ3 = iσ1
σ3 σ1 = iσ2
[σ2 , σ3 ] = 2iσ1
σi2 = 1 (i = 1, 2, 3)
[σ3 , σ1 ] = 2iσ2
bzw. zusammenfassend
σi σj = i
3
X
ijk σk + δij 1
σi σj = −σj σi (i 6= j)
k=1
[σi , σj ] = 2i
3
X
ijk σk
(9.6)
k=1
(mit ijk dem total antisymmetrischen -Tensor.)
Aus der letzten Gleichung ergibt sich sofort, dass die Spin-Matrizen
~
σi
(i = 1, 2, 3)
2
eine Darstellung der Algebra der Drehimpulse (siehe Abschnitt A3) bilden:
Si =
[Si , Sj ] = i~
3
X
ijk Sk .
(9.7)
(9.8)
k=1
9.2
Der Zustandsraum
Wir hatten schon mehrfach betont, dass die physikalischen Zustände den Strahlen,
also den komplex eindimensionalen linearen Unterräumen in einem Hilbertraum entsprechen. Zwei Vektoren, die sich nur um die Multiplikation mit einer komplexen Zahl
unterscheiden, repräsentieren daher denselben Zustand.
Zur Charakterisierung der Zustände ist es oft sinnvoll, statt mit Strahlen mit
den zugehörigen selbst-adjungierten Projektionsoperatoren zu rechnen: Jeder Strahl
entspricht einem Projektionsoperator mit der Spur 1 (d.h., einer Projektion auf einen
1-dimensionalen Vektorraum). Ein Projektionsoperator erfüllt immer die Gleichung
P 2 = P und hat damit die Eigenwerte 0 und 1. Die Projektionsoperatoren auf 1dimensionale Unterräume in einem 2-dimensionalen Vektorraum sind somit genau die
hermiteschen Matrizen, die einen Eigenwert 0 und einen Eigenwert 1 haben. Nach Gl.
9.5 bedeutet das: a0 = 21 und |~a| = 21 . Die gesuchten Projektionsoperatoren haben
somit die Form:
1
P~n = (1 + ~n · ~σ ) .
(9.9)
2
(Man beachte, dass ~n ein gewöhnlicher reeller dreidimensionaler Einheitsvektor ist,
aber ~σ ein dreidimensionaler Vektor, dessen Komponenten 2 × 2–Matrizen sind.) Für
den Kommutator zweier solcher Projektionsoperatoren gilt
1X
1X
[P~n , Pm
ni mj [σi , σj ] = i
ni mj ijk σk = i(~n × m)
~ · ~σ .
(9.10)
~] =
4 i,j
2 i,j
190
Zwei-Zustands-Systeme
Zwei Projektionsoperatoren kommutieren also genau dann, wenn die Einheitsvektoren
~n und m
~ linear abhängig sind, d.h. für ~n = ±m.
~ Für m
~ = −~n gilt offenbar
P~n + P−~n = 1 ,
(9.11)
die beiden Projektionsoperatoren projizieren also auf orthogonale Unterräume.
Damit finden wir, dass wir jeden (reinen) physikalischen Zustand im C2 durch
einen dreidimensionalen Einheitsvektor ~n kennzeichnen können, oder anders ausgedrückt: Die Menge der physikalischen (reinen) Zustände bildet eine 2-Sphäre.
Der Vollständigkeit halber wollen wir auch noch die gemischten Zustände, also
die Dichtematrizen für 2-Zustandssysteme erwähnen. Für sie gilt, dass die Eigenwerte
zwischen 0 und 1 liegen müssen, ihre Summe aber 1 sein muss. Damit erhalten wir
die Dichtematrizen, indem wir Vektoren ~n mit |~n| < 1 betrachten. Zusammenfassend
können wir also sämtliche gemischten und reinen Zustände durch einen Vektor im R3
charakterisieren, dessen Länge kleiner oder gleich 1 ist. Diese Vektoren bilden eine
Kugel, die man als Bloch-Kugel bezeichnet. Der Rand der Kugel (die Vektoren ~n mit
|~n| = 1) beschreibt die reinen Zustände. Im Zentrum der Kugel ist ~n = 0 und wir
erhalten ρ = 21 1 als Dichtematrix zum maximal gemischten Zustand.
Es gibt noch eine andere Möglichkeit, sich klarzumachen, weshalb der Raum
der reinen Zustände für ein quantenmechanisches 2-Zustandssystem der Oberfläche
einer Kugel entspricht. Jeder reine Zustand lässt sich durch einen normierten Vektor
darstellen:
|ψi = α|0i + β|1i ,
(9.12)
mit
|α|2 + |β|2 = 1 .
(9.13)
Schreiben wir α = a1 + ia2 und β = b1 + ib2 (mit ai , bi ∈ R), so wird aus der Normierungsbedingung
a21 + a22 + b21 + b22 = 1 ,
(9.14)
also die Gleichung einer 3-Sphäre (S 3 ) in einem 4-dimensionalen Raum. Da sich der
Zustand durch Phasentransformationen (die als Menge einen Kreis, also eine 1-Sphäre
S 1 bilden) nicht ändert, lässt sich die Menge aller (reinen) Zustände als S 3 /S 1 ' S 2 ,
also eine 2-Sphäre, beschreiben.
9.3
9.3.1
Physikalische Anwendungen
Spin- 21 -Systeme
Die experimentellen Ergebnisse von Otto Stern und Walter Gerlach im Jahre 1922
(siehe Abschnit 10.5) waren die ersten Hinweise auf Systeme, die nur zwei diskrete
Physikalische Anwendungen
191
Zustände zulassen. Das Konzept des Spins wurde anschließend von Pauli entwickelt.
Pauli hat sich allerdings immer gegen die Bezeichnung Spin“ gestreubt, da er die
”
Vorstellung eines um eine Achse rotierenden Elektrons ablehnte.
Obwohl man sich den Spin nicht als eine Eigenrotation vorstellen sollte, hat er
etwas mit der Rotation von Systemen zu tun, denn bei Systemen mit Spin-Freiheitsgraden ist der Gesamtdrehimpuls, der sich aus dem Bahndrehimpuls und dem Spin
zusammensetzt, erhalten. Die Klassifikation der Darstellungen der Drehgruppe SO(3)
lässt auch halbzahlige Darstellungen zu, wenn man berücksichtigt, dass der Darstellungsraum nicht ein Raum von Vektoren, sondern ein Raum von Strahlen ist. Man
sucht in diesem Fall nach linearen Darstellungen der sogenannten Lie-Algebra zu
SO(3), die gleichzeitig die Lie-Algebra zu der Gruppe SU(2) ist (vgl. Abschnitt A3),
und die Gruppe SU(2) besitzt mehr lineare Darstellungen als die Gruppe SO(3).
Pauli schlug vor, ein Elektron mit Spinfreiheitsgrad durch eine zwei-komponentige
Wellenfunktion
!
ψ1 (x)
Ψ(x) =
(9.15)
ψ2 (x)
zu beschreiben. In einem statischen elektromagnetischen Feld (beschrieben durch ein
~ mit B
~ = rotA
~ und ein Skalarfeld Φ mit E
~ = −gradΦ) lautet die (ansonVektorfeld A
sten freie) zeitunabhängige Schrödinger-Gleichung:
!
~ 2
e~
(P~ − eA)
~ |Ψi = E|Ψi .
+ eΦ −
(~σ · B)
(9.16)
2m
2m
Die ersten beiden Terme stammen von der klassischen Energiefunktion eines geladenen
Teilchens in einem elektromagnetischen Feld. Der für den Spin relevante Term ist der
letzte Term auf der linken Seite. Dieser Term gibt Anlass zum Stern-Gerlach-Effekt
~ sind offensichtlich
(siehe auch Abschnitt 10.5). Die Eigenzustände zu der Matrix (~σ · B)
die Eigenvektoren der Projektionsoperatoren PB~ , die wir im letzten Abschnitt behane~ ~
delt haben. Die Eigenwerte sind ± 2m
|B|. Da es sich hier um den Beitrag zur Energie
handelt, erhalten wir die Kraft aus dem Gradienten dieses Terms. Dieser ist jedoch
~ ein konstantes Magnetfeld beschreibt. Daher haben Stern und Gerlach
null, wenn B
ein inhomogenes Magnetfeld verwendet. Dann ist die Kraft
e~ ~ ~
F~ = ±
∇|B| .
2m
(9.17)
Je nach der Spineinstellung des Teilchens wirkt die Kraft in Richtung des Gradienten
~ bestimmt also, in welche
oder in entgegengesetzter Richtung. Die Richtung von B
Richtung der Spin des Systems gemessen“ wird (hier hat gemessen“ eine ähnliche
”
”
~
Bedeutung wie bei den Polarisationsexperimenten an Photonen: Die Richtung von B
bestimmt, bezüglich welcher Richtung der Spin ausgerichtet wird.)
192
Zwei-Zustands-Systeme
Wir können den Spin also bezüglich jeder der drei Raumrichtungen messen,
und eine Messung des Spins in eine vorgegebene Richtung liefert immer nur einen von
zwei Werten. Angegeben wird dieser Wert in Einheiten von ~/2, sodass der Spin eines
Elektrons bezüglich jeder beliebigen Richtung die Werte +~/2 oder −~/2 annehmen
kann.
Speziell entsprechen die Pauli-Matrizen multipliziert mit ~/2 einer Spin-Messung
in die Richtung ~n (vgl. Abschnitt 9.1):
S~n =
~
(~n · ~σ ) .
2
(9.18)
Da σ3 in der herkömmlichen Darstellung der Pauli-Matrizen bereits diagonal ist, wählt
man die Richtung des Magnetfelds meist als die z-Richtung.
Insbesondere beschreibt man die Zustände Spin-up“ und Spin-down“ hin”
”
sichtlich der z-Richtung durch:
|z + i =
1
!
|z − i =
0
0
1
!
.
(9.19)
Manchmal verwendet man auch für |z + i beispielsweise |z, ↑i oder | ↑z i oder eine entsprechend eingängige Notation.
Damit folgen die Eigenvektoren zu σ1 als die Eigenzustände des Spins bezüglich
der x-Richtung:
1
|x i = √
2
+
1
|x− i = √
2
1
!
1
= √ (|z + i + |z − i)
2
1
!
1
1
= √ (|z + i − |z − i) ,
2
−1
(9.20)
(9.21)
und entsprechend die Eigenvektoren zu σ2 als die Eigenzustände des Spins in Bezug
auf die y-Richtung:
1
|y + i = √
2
1
|y − i = √
2
1
!
1
= √ (|z + i + i|z − i)
2
i
!
1
1
= √ (|z + i − i|z − i) ,
2
−i
(9.22)
(9.23)
Wichtig ist, dass sich bei den Spin- 21 -Zuständen die drei verschiedenen orthogonalen Basen auf die drei räumlichen Richtungen beziehen und jeweils Spin-up bzw.
Spin-down bezüglich dieser Richtungen angeben.
Physikalische Anwendungen
9.3.2
193
Polarisationszustände von Photonen
Mit den Polarisationsfreiheitsgraden von Photonen haben wir uns schon mehrfach
beschäftigt. Die Spin-1-Darstellung für Photonen und die Spin- 12 -Darstellung für Elektronen sind zwar insofern ähnlich, als beide (komplex) zweidimensional sind und die
auftretenden Matrizen daher häufig die gleichen sind, trotzdem sollte man betonen,
dass es sich – im Sinne der Darstellungstheorie der Drehgruppe – um vollkommen
verschiedene Darstellungen handelt:
1. Elektronen haben eine Masse. Daher kann man von einem Ruhesystem eines
Elektrons sprechen. Der Spin eines Elektrons bezieht sich immer auf dieses Ruhesystem. Photonen sind masselos und haben kein Ruhesystem.
2. Die Spin-1-Darstellung ist gewöhnlich 3-dimensional. Das bedeutet, es gibt drei
Zustände, die zueinander orthogonal sind. Gewöhnlich entsprechen diesen Schwingungen in die drei räumlichen Richtungen. Für Photonen (elektromagnetische
Wellen) gibt es jedoch keinen longitudinalen Freiheitsgrad: Nach den klassischen
~ und B-Feld
~
Maxwell-Gleichungen stehen das Eimmer senkrecht auf der Ausbreitungsrichtung. Daher fehlt den masselosen Photonen ein Freiheitsgrad gegenüber der gewöhnlichen Spin-1-Vektordarstellung.
3. Bei Photonen entsprechen den drei Basen die Kombinationen horizontal–vertikal,
+ oder −45◦ und rechts bzw. links zirkular polarisiert.
Entsprechend der letzten Bemerkung kann man bei Photonen die Eigenvektoren
zu σ3 mit der horizontalen bzw. vertikalen Polarisation eines Photons in Beziehung
setzen:
!
!
1
0
|hi =
|vi =
,
(9.24)
0
1
dann ist die Polarisation unter +45◦ bzw. −45◦ durch
!
1
1
1
◦
= √ (|z + i + |z − i)
| + 45 i = √
2 1
2
!
1
1
1
| − 45◦ i = √
= √ (|z + i − |z − i)
2 −1
2
(9.25)
(9.26)
gegeben, und für die zirkular polarisierten Zustände (rechts zirkular bzw. links zirkular)
folgt:
!
1
1
1
|Ri = √
= √ (|z + i + i|z − i)
(9.27)
2
2
i
!
1
1
1
|Li = √
= √ (|z + i − i|z − i) .
(9.28)
2 −i
2
194
Zwei-Zustands-Systeme
Der Faktor ±i bedeutet hier eine Phasenverschiebung der entsprechenden Komponente um ±90◦ . (Manchmal definiert man die rechts bzw. links zirkular polarisierten
Zustände relativ zu den obigen Konventionen noch zusätzlich mit einem Faktor i, der
aber auf den gewählten Strahl keine Auswirkung hat.)
9.3.3
2-Niveau-Systeme
Unter bestimmten Bedingungen kann es vorkommen, dass man auch bei komplexeren
Systemen mit vielen Zuständen nur an zwei Zuständen interessiert ist, typischerweise
handelt es sich dabei um den energetischen Grundzustand (mit der niedrigsten Energie) und den ersten angeregten Zustand. Eine solche vereinfachende Einschränkung
des Zustandsraums ist immer dann gerechtfertigt, wenn für die betrachtete Dynamik
bzw. Wechselwirkung des Systems (eventuell auch mit einer Umgebung) bevorzugt
diese beiden Zustände von Relevanz sind. Hierbei kann es sich beispielsweise um die
Schwingungszustände eines Moleküls handeln, von denen bei einer bestimmten Temperatur bestenfalls der erste angeregte Zustand vorliegt (d.h., die höheren Zustände
wegen ihrer hohen Energie vernachlässigt werden können), oder es kann sich um bestimmte elektronische Anregungen in Molekülen oder Atomen handeln.
Es gibt also zwei Energieeigenzustände zur Energie E0 und E1 , für die gilt:
H| • i = E0 | • i
und
H| • i = E1 | • i .
Der Energieoperator ist in dieser Basis diagonal:
!
E1 0
1
1
H=
= (E0 + E1 )1 + (E0 − E1 )σ3 .
2
2
0 E0
(9.29)
(9.30)
Für viele praktische Anwendungen interessiert nur der σ3 -Anteil, d.h., man setzt die
Summe der beiden Energien (ein konstanter Beitrag zur Gesamtenergie) auf 0:
H = σ3 .
Die Eigenzustände sind in dieser Darstellung:
!
0
|•i=
|•i=
1
(9.31)
1
0
!
.
(9.32)
(Für > 0 hat somit der Grundzustand | • i die kleinere Energie.)
In dieser Interpretation sind die Eigenzustände von σ1 und σ2 von geringerer
Bedeutung, allerdings kann man nun σ1 bzw. σ2 als Operatoren auffassen, die den
Grundzustand in den angeregten Zustand und den angeregten Zustand in den Grundzustand überführen. Daher dienen diese Operatoren zur Darstellung einer Dynamik,
bei der Übergänge zwischen diesen Zustanden beschrieben werden sollen.
Physikalische Anwendungen
195
Ebenfalls wichtig sind die Operatoren
!
0
1
1
1
σ + = (σ1 + iσ2 ) =
und σ − = (σ1 − iσ2 ) =
2
2
0 0
0 0
1 0
!
,
(9.33)
die als Auf- bzw. Absteigeoperatoren dienen: σ + beschreibt den Übergang vom Grundzustand in den angeregten Zustand und σ − den Übergang vom angeregten Zustand in
den Grundzustand.
Modelle dieser Art spielen eine besondere Rolle, wenn man mehrere 2-Zustandssysteme miteinander koppelt. Im Folgenden betrachten wir den einfachen Fall einer
Kopplung von zwei 2-Zustandssystemen. Ohne eine Wechselwirkung wäre ein sinnvoller
Energieoperator beispielsweise

1 + 2
0
0
0

0
1 − 2
0
0
0
0
−1 + 2
0


 . (9.34)


0
0
0
−1 − 2


H0 = 1 (σ3 ⊗ 1) + 2 (1 ⊗ σ3 ) = 


Die zugehörigen Eigenzustände sind (mit einer hoffentlich suggestiven Notation):

|• •i =
0
!
⊗
1
|• •i =
0
|• •i =
1
|• •i =
1
!
⊗
1
!
⊗
0
0
!
⊗
0
1
1
0
0
1
1
0
0

!
 
 0 

=
 
0
 
1
 
0
!  
 0 

=
 
1
 
0
 
0
!  
 1 

=
 
 0 
0
 
1
!  
 0 

=
 .
 0 
0
(9.35)
(9.36)
(9.37)
(9.38)
196
Zwei-Zustands-Systeme
Man kann nun eine Wechselwirkung zwischen diesen beiden Systemen einführen, indem
man Übergänge zwischen den Zuständen erlaubt:
H = H0 + HI
(9.39)
HI = J(σ + ⊗ σ − + σ − ⊗ σ + ) .
(9.40)
mit
Der erste Term beschreibt eine Wechselwirkung, bei der ein angeregter Zustand des
zweiten Systems in den Grundzustand übergeht und dafür der Zustand des ersten Systems (das sich im Grundzustand befindet) angeregt wird. Der zweite Term beschreibt
entsprechend den umgekehrten Prozess.
Solche und ähnliche einfache gekoppelte Systeme lassen sich noch exakt lösen,
zeigen aber schon eine überraschende Vielfalt an Quantenphänomenen. Koppelt man
in dieser Weise mehr als zwei solcher Systeme, beispielsweise eine ganze Kette von
2-Zustandssystemen, gelangt man zu den sogenannten Quantenspinketten.
9.4
Quanteninformation
Unter einem Bit versteht man in der klassischen Informationstheorie eine Variable, die
nur die beiden Werte 0 und 1 annehmen kann. Der Zustandsraum eines klassischen Bits
ist also die Menge {0, 1}. Ein Qubit – oder auch Quanten-Bit – ist eine Quantisierung“
”
eines klassischen Bits. Insofern kann jedes der physikalischen Beispiele aus dem letzten
Abschnitt für ein 2-Zustandssystem in der Quantentheorie als Realisation eines Qubits
verstanden werden.
Die Idee eines Quantencomputers“, also eines Quantensystems, das Folgen von
”
Qubits verarbeitet, geht auf Richard Feynman zurück [31]. Seit Mitte der 80er Jahre
des 20. Jahrhunderts hat sich die Quanteninformation zu einem eigenständigen Gebiet
entwickelt, und Begriffe wie Quantenrechnung“, Quanten-Teleportation“, Quan”
”
”
tenkryptographie“ etc. gehören heute zum Alltag in der Informationstechnologie. Ein
immer noch gutes Übersichtswerk zur Quanteninformation ist das Buch von Nielsen
und Chuang [59].
Bevor wir jedoch kurz auf Quanteninformationstheorie eingehen, soll der klassische Begriff des Bits nochmals angedeutet werden.
9.4.1
Klassische Information
Die elementare Einheit der Informationstheorie ist das Bit, ein Element der Menge
Z2 = {0, 1}. Die Objekte der Informationstheorie sind Folgen von Bits, also Elemente von ZN
2 . Die Operationen in der Informationstheorie bestehen aus Umformungen
Quanteninformation
197
solcher Bit-Ketten. Die einfachste dieser Operation (neben der Identität) ist die Negation:
¬ : Z2 → Z2 mit 0 → 1 und 1 → 0 .
Wir können die Negation auch als einfache Permutationsmatrix ausdrücken:
!
0 1
NOT ∼
.
1 0
Außerdem gibt es verschiedene
Abbildungen von Z2 × Z2 → Z2 ,
von denen die wichtigsten in
nebenstehender
Tabelle
zusammengefasst sind. Es lässt
sich zeigen, dass sich sämtliche
16 Möglichkeiten für solche
binären Bool’schen Funktionen
durch ein einziges Gate (die
NAND-Funktion
oder
auch
die NOR-Funktion) realisieren
lassen.
(9.41)
x1
0
0
1
1
x2
0
1
0
1
Konjunktion (AND)
0
0
0
1
Disjunktion (OR)
0
1
1
1
Nicht und (NAND)
1
1
1
0
Nicht oder (NOR)
1
0
0
0
Äquivalenz
1
0
0
1
Antivalenz (XOR)
0
1
1
0
Implikation
1
0
1
1
Bezeichnung \ Bit-Paar
Besonders interessant ist die XOR-Transformation. Wenn wir den Wert von x1
als einen Kontrollparameter auffassen, und der Wert für x2 durch das Ergebnis von
XOR ersetzt wird, so erhalten wir folgende Vorschrift: Wenn x1 = 0 ist wird x2 nicht
verändert. Ist x1 = 1 wird x2 negiert. Insbesondere gilt:
XOR : (0, 0) → (0, 0)
und
(1, 0) → (1, 1) .
Allgemein ausgedrückt:
(x, 0) → (x, x) .
Diese Vorschrift kann also eine Kopie des Zustands x herstellen. In der klassischen
Informationstheorie lassen sich Zustände beliebig vervielfältigen. Man spricht in diesem
Zusammenhang auch von klonen“.
”
Auf eine Folge von N Bits können im Prinzip 2N verschiedene Operationen wirken. Man kann allerdings sämtliche Kombinationen auf Operationen an zwei Bits sowie
eine Shift-Operation (die zyklisch alle Bits um eine Stelle verschiebt) zurückführen.
9.4.2
Qubits und Bell-Zustände
Wir fassen nun die beiden klassischen Werte eines Bits — 0 und 1 — als die Basisvektoren in einem (komplexen) Hilbertraums auf und schreiben dafür |0i und |1i. Einschließlich gemischter Zustände ist der Zustandsraum eines solchen Quantum-Bits durch die
198
Zwei-Zustands-Systeme
Bloch-Kugel gegeben. Im Folgenden interessieren wir uns jedoch nur für die reinen
Zustände, also die Oberfläche der Bloch-Kugel. (Gemischte Zustände sind in der Praxis natürlich ebenfalls von großer Bedeutung, insbesondere weil durch Dekohärenz bzw.
Wechselwirkung mit der Umgebung reine Zustände in gemischte Zustände übergehen;
dies zu verhindern bzw. geeignete Fehlerkorrekturen vorzunehmen ist eines der großen
gegenwärtigen Forschungsziele auf diesem Gebiet).
Neben den beiden klassischen 1-Bit-Operationen – der Identität und der Negation (Gl. 9.41) – kann nun die gesamte SU(2) als Transformationsgruppe auf Zustände
wirken. Die meisten dieser Transformationen überführen die Zustände |0i und |1i in
Superpositionen.
Eine Folge von N Qubits entspricht nun einem Vektor im H2N , und ein allgemeiner Zustand hat die Form:
|ψi =
X
cx1 ,x2 ,... |x1 , x2 , ..., xN i
(xi = 0, 1) .
xi =0,1
Eine allgemeine Operation auf diesem Zustand ist ein Element der SU (2N ). Auch hier
lässt sich jedoch zeigen, dass alle Operationen auf spezielle Operationen an zwei Bits
sowie eine Shift-Operation zurückgeführt werden können.
Ist N beispielsweise 10, so entspricht einer klassischen Folge aus 10 Bits eine
Zahl zwischen 0 und 210 − 1 = 1023. Ein einzelner Quantenzustand ist nun in gewisser Hinsicht eine Superposition aus sämtlichen Zahlen zwischen 0 und 1023, und
eine lineare Abbildung eines solchen Quantenzustands entspricht einer Operation, die
gleichzeitig sämtliche Zahlen betrifft. Aus diesem Grund spricht man manchmal auch
von einem massiven Parallelismus.
Betrachten wir speziell zwei Qubits. Eine mögliche Basis des zugehörigen Hilbertraums ist:
|0, 0i = |0i ⊗ |0i
|0, 1i = |0i ⊗ |1i
|1, 0i = |1i ⊗ |0i
|1, 1i = |1i ⊗ |1i .
Diese Basis hat die Eigenschaft, dass sämtliche Basisvektoren faktorisieren, also separierbar sind. Für viele der folgenden Überlegungen benötigen wir jedoch eine Basis,
in der die Zustände maximal verschränkt sind. Die Elemente einer solchen Basis bezeichnet man auch als Bell-Zustände. Wir werden meist die folgende Basis von Bell-
Quanteninformation
199
Zuständen verwenden:
1
|Φ1 i = √ (|0i ⊗ |1i − |1i ⊗ |0i) ,
2
1
|Φ2 i = √ (|0i ⊗ |1i + |1i ⊗ |0i) ,
2
1
|Φ3 i = √ (|0i ⊗ |0i − |1i ⊗ |1i) ,
2
1
|Φ4 i = √ (|0i ⊗ |0i + |1i ⊗ |1i),
2
In |Φ1 i erkennen wir den EPR-Zustand wieder. |Φ1 i und |Φ2 i beschreiben jeweils eine
totale Antikorrelation in der Verschränkung, während |Φ3 i und |Φ4 i einer absoluten
Korrelation entsprechen. Da diese vier Zustände jeweils orthogonal sind gibt es auch
selbstadjungierte Operatoren, für die die Bell-Zustände Eigenzustände sind:
B=
4
X
ai |Φi ihΦi | .
i=1
Ein Messwert ai zeigt an, dass sich das System im Zustand |Φi i befindet. Einen solchen
Operator zum Ausmessen der Bell-Zustände bezeichnen wir als Bell-Operator und die
zugehörige Messvorschrift als Bell-Messung. Die physikalische Realisation solcher BellMessung ist allerdings nicht immer einfach.
Da die Bell-Zustände eine Basis bilden, kann man auch die obige separierbare
Basis nach Bell-Zuständen entwickeln:
1
|0, 0i = √ (|Φ3 i + |Φ4 i)
2
1
|0, 1i = √ (|Φ1 i + |Φ2 i)
2
1
|1, 0i = √ (|Φ2 i − |Φ1 i)
2
1
|1, 1i = √ (|Φ4 i − |Φ3 i) .
2
(9.42)
Interessant ist, dass wir jeden beliebigen dieser Bell-Zustände durch eine unitäre
Transformation an einem der beiden Teilsysteme in jeden anderen dieser Bell-Zustände
überführen können. Betrachten wir als Beispiel |Φ1 i. Durch die Transformation
U1 = 1 ⊗ σ3
(9.43)
|Φ2 i = U1 |Φ1 i .
(9.44)
|Φ3 i = U2 |Φ1 i mit U2 = 1 ⊗ σ1 .
(9.45)
wird daraus |Φ2 i:
Entsprechend gilt:
200
Zwei-Zustands-Systeme
Und schließlich erhält man |Φ4 i durch eine Kombination dieser beiden Operationen:
|Φ4 i = U3 |Φ1 i mit U3 = 1 ⊗ σ3 σ1 .
9.4.3
(9.46)
Das No-Cloning Theorem
Das No-Cloning Theorem besagt, dass man von einem beliebigen, unbekannten Quantenzustand keine Kopie erstellen kann. Etwas genauer heißt das: Es gibt keine universelle Zustands-Verdopplungsmaschine“ oder Kloning-Maschine“, die einen beliebigen
”
”
Zustand |ϕi in einen Zustand |ϕi ⊗ |ϕi überführt.
Auch wenn wir das No-Cloning Theorem im Rahmen von 2-Zustandssystemen
behandeln, gilt es in der Quantenmechanik allgemein. Entsprechend ist auch der folgende Beweis nicht auf 2-Zustandssysteme beschränkt.
Beweis: Eine Kloning-Maschine entspräche einem linearen Operator V , der folgende
Eigenschaft hat:
V (|Φi ⊗ |ϕi) = |Φ0 i ⊗ |ϕi ⊗ |ϕi
für alle |ϕi ∈ H .
(9.47)
Für diesen Operator müsste einerseits gelten:
V |Φi ⊗ (|ϕ1 i + |ϕ2 i) = V (|Φi ⊗ |ϕ1 i) + V (|Φi ⊗ |ϕ2 i)
= |Φ0 i ⊗ |ϕ1 i ⊗ |ϕ1 i + |Φ00 i ⊗ |ϕ2 i ⊗ |ϕ2 i ,
(9.48)
und andererseits:
V |Φi ⊗ (|ϕ1 i + |ϕ2 i) = |Φ000 i ⊗ (|ϕ1 i + |ϕ2 i) ⊗ (|ϕ1 i + |ϕ2 i) .
(9.49)
Offensichtlich können die Gleichungen (9.48) und (9.49) nicht für beliebige |ϕ1 i und
|ϕ2 i gleichzeitig erfüllt sein.
Das No-Cloning-Theorem besagt natürlich nicht, dass man einen Quantenzustand überhaupt nicht kopieren kann. Ein bekannter Zustand lässt sich beispielsweise
beliebig oft präparieren. Auch wenn der Zustand nicht bekannt ist, wenn wir aber
wissen, dass es sich um einen reinen Zustand bezüglich einer bestimmten Observablen
handelt, können wir beliebig viele Kopien dieses Zustands herstellen. Etwas anders ausgedrückt besagt das No-Cloning-Theorem, dass sich ein unbekannter Zustand durch
eine Messung nicht vollständig bestimmen lässt.
9.4.4
Quanten-Teleportation
Auch wenn sich ein unbekannter Zustand nicht verdoppeln lässt, so kann man doch
von einem unbekannten Zustand eine Kopie an einem anderen Ort erzeugen. Der Preis
ist allerdings, dass der Ausgangszustand dadurch zerstört wird.
Quanteninformation
201
Statt im Folgenden immer von Person A und Person B zu sprechen, übernehmen
wir den allgemeinen Brauch der Informationstheorie und sprechen von zwei hypothetischen Personen Alice und Bob. Kommt noch eine dritte Person ins Spiel (beispielsweise
in der Quantenkryptographie der unerwünschte Lauscher - englisch eavesdropper) so
heißt diese Person meist Eve.
Angenommen, Alice möchte einen unbekannten Photonenzustand (also eine
Realisation eines Qubits)
|ϕi1 = c0 |0i1 + c1 |1i1
zu Bob teleportieren. Dieses Photon bezeichnen wir als Photon 1. Bob muss zuvor
ein verschränktes Photonenpaar (Photonen 2 und 3) erzeugen (beispielsweise im BellZustand |Φ4 i). Eines der beiden Photonen (z.B. Photon 2) schickt er an Alice, wobei
der verschränkte Zustand natürlich erhalten bleiben muss. Das Gesamtsystem aus drei
Photonen befindet sich nun im Zustand:
|Ψi = |ϕi1 ⊗ |Φ4 i2,3
1
= √ c0 |0i1 + c1 |1i1 ⊗ |0i2 ⊗ |0i3 + |1i2 ⊗ |1i3
2
1
= √ c0 |0i1 ⊗ |0i2 ⊗ |0i3 + c0 |0i1 ⊗ |1i2 ⊗ |1i3
2
+c1 |1i1 ⊗ |0i2 ⊗ |0i3 + c1 |1i1 ⊗ |1i2 ⊗ |1i3 .
Diesen Zustand können wir bezüglich der Photonen 1 und 2 nach Bell-Zuständen
zerlegen (vgl. Gl. 9.42):
1
c0 |Φ3 i1,2 + c0 |Φ4 i1,2 + c1 |Φ2 i1,2 − c1 |Φ1 i1,2 ⊗ |0i3
2
+ c0 |Φ1 i1,2 + c0 |Φ2 i1,2 + c1 |Φ4 i1,2 − c1 |Φ3 i1,2 ⊗ |1i3
1
|Φ1 i1,2 ⊗ (−c1 |0i3 + c0 |1i3 ) + |Φ2 i1,2 ⊗ (c1 |0i3 + c0 |1i3 )
=
2
+|Φ3 i1,2 ⊗ (c0 |0i3 − c1 |1i3 ) + |Φ4 i1,2 ⊗ (c0 |0i3 + c1 |1i3 ) .
|Ψi =
Man beachte, dass es sich immer noch um denselben Zustand |Ψi handelt, der bezüglich
der Photonen 2 und 3 verschränkt ist, wohingegen Photon 1 noch separabel ist. Bisher
haben wir lediglich eine Basistransformation vorgenommen.
Alice macht nun eine Bell-Messung an ihrem Photonenpaar 1 und 2. Dabei
zerstört sie den unbekannten Photonenzustand |ϕi1 . Aus dem Messergebnis ai kann
sie ablesen, dass nun einer von vier möglichen Bell-Zuständen bei ihr vorliegt. Das
bedeutet, dass sich das verbliebene Photon 3 bei Bob, je nach dem Ergebnis ai , das
202
Zwei-Zustands-Systeme
Alice erhalten hat, in einem der folgenden Zustände befindet:
a1
|ψ1 i3 = −c1 |0i3 + c0 |1i3
a2
|ψ2 i3 = c1 |0i3 + c0 |1i3
a3
|ψ3 i3 = c0 |0i3 − c1 |1i3
a4
|ψ4 i3 = c0 |0i3 + c1 |1i3 .
Alice schickt nun eine Nachricht an Bob (durch einen klassischen Informationskanal,
beispielsweise in einem gewöhnlichen Telefonat) und teilt ihm das Ergebnis ihrer Messung mit. Da es vier mögliche Ergebnisse gibt, handelt es sich um eine klassische
2-Bit-Nachricht. Je nachdem, welches Messergebnis ai Alice erhalten hat, führt Bob
eine von vier unitären Transformationen an seinem Photon aus:
a1
(σ3 σ1 )|ψ1 i3 = c0 |0i3 + c1 |1i3
a2
σ1 |ψ2 i3 = c0 |0i3 + c1 |1i3
a3
σ3 |ψ3 i3 = c0 |0i3 + c1 |1i3
a4
1 |ψ1 i3 = c0 |0i3 + c1 |1i3 .
In allen vier Fällen erhält Bob für sein Photon den Zustand |ϕi3 , also eine identische
Kopie des ursprünglichen Zustands |ϕi1 , der bei diesem Prozess zerstört wurde.
Man beachte, dass die Zustände |ψi i3 nicht orthogonal sind. Ansonsten könnte
Bob durch eine Messung an seinem Photon feststellen, welches Messergebnis Alice
erhalten hat und der klassische Informationskanal wäre überflüssig.
9.4.5
Quantenkryptographie
Man kann beweisen, dass ein absolut sicheres Verfahren der klassischen Nachrichtenübermittlung darin besteht, eine Nachricht (die wir uns immer als Folge von Bits
vorstellen) mit einer Zufallsfolge aus 0 und 1 zu verschlüsseln. Dazu addiert man zum
Klartext einfach den Schlüssel modulo 2 (d.h. als XOR Operation):
Zufallsfolge
011010001011101101001
Klartext
111000111000111000111
XOR-Kodierung
100010110011010101110
Die kodierte Nachricht ist nun ebenfalls eine Zufallsfolge, unabhängig davon, wie regulär der zu übermittelnde Klartext ist. Der Empfänger kann nun aus der ihm ebenfalls
bekannten Zufallsfolge und der kodierten Nachricht durch eine XOR-Operation die ur-
Quanteninformation
203
sprüngliche Nachricht zurückgewinnen:
Zufallsfolge
011010001011101101001
kodierte Nachricht
100010110011010101110
XOR-Dekodierung
111000111000111000111
Die Sicherheit dieses Verfahrens hängt entscheidend davon ab, dass nur Alice und
Bob die Schlüsselfolge kennen. In der Praxis ist das ein großes Problem, denn ein
solcher Schlüssel darf nur einmal verwendet werden (daher spricht man auch von einem One-Time-Pad) und muss mindestens dieselbe Länge wie der Klartext haben.
Noch schwieriger wird es, wenn Alice oder Bob den Schlüssel öffentlich austauschen
wollen, also über öffentliche Kommunikationskanäle. Dann ist eine Geheimhaltung bei
klassischen Kanälen praktisch nicht mehr möglich.
Hier kann die Quantenmechanik helfen. Die Idee beruht darauf, dass jede Messung, die ein potenzieller Eavesdropper an einem unbekannten Quantenzustand vornimmt, diesen Zustand in der Regel verändert. Diese Veränderung lässt sich aber
feststellen und somit der Eingriff des Lauschers nachweisen.
Wichtig ist, dass es die Quantenmechanik Alice und Bob lediglich ermöglicht,
sich auf eine Zufallsfolge zu einigen, die als Schlüssel dienen kann, und von der sie
überprüfen können, ob sie von einer dritten Person abgerufen wurde. Die eigentliche
Nachrichtenübermittlung erfolgt auf klassischem Weg und hat mit der Quantenmechanik nichts mehr zu tun.
Konkret könnte die Übermittlung des Schlüssels folgendermaßen erfolgen. Bob
erzeugt eine sehr große Anzahl von Photonen in EPR-Zuständen
1
|Φi = √ |+i|−i − |−i|+i .
2
Er schickt Alice jeweils eines der Photonen aus diesen Paaren und bittet Alice, an
diesen Photonen willkürlich Polarisationsmessungen entweder in der h/v–Basis (horizontal/vertikal) oder in der +/−–Basis (+45◦ /−45◦ ) vorzunehmen. Alice teilt Bob
nun mit, an welchem Photon welche Messung durchgeführt wurde (1. Photon h/vMessung, 2. Photon +/−-Messung, ...), allerdings übermittelt Alice Bob nicht die
Ergebnisse ihrer Messungen.
Bob nimmt nun an seinen Elektronen die gleichen Messungen vor und erhält
beispielsweise die Folge
+, +, −, −, +, −, −, +, +, +, −, +, +, −, −, −, ... .
Bob weiß nun, dass Alice die Folge
−, −, +, +, −, +, +, −, −, −, +, −, −, +, +, +, ...
204
Zwei-Zustands-Systeme
erhalten haben muss. Theoretisch könnten sie nun eine dieser beiden Folgen als Zufallsfolge zur Verschlüsselung ihrer Nachricht verwenden. Doch woher wissen sie, dass
niemand die Nachricht abgehört hat und nun die Zufallsfolge ebenfalls kennt?
Abhören würde bedeuten, dass Eve ( jemand“) die Photonen, die Bob an Alice
”
geschickt hat, abgefangen hat und selber Messungen an diesen Photonen vorgenommen
hat. Anschließend hat sie die Photonen an Alice weitergeleitet. In rund der Hälfte
der Fälle hat Eve vermutlich dieselben Polarisationsbasen verwendet, die auch Alice
gemessen hat, und würde somit zumindest teilweise die Zufallsfolge kennen, die Bob
nun rekonstruiert und die zur Ver- bzw. Entschlüsselung verwendet wird.
Alice und Bob können zwar nicht verhindern, dass Eve die Photonen abfängt
und an ihnen Messungen vornimmt, aber sie können feststellen, ob solche Messungen
vorgenommen wurden. Jede solche Messung hat nämlich den EPR-Zustand zerstört.
Die Photonen, die Alice schließlich erhalten hat, sind also nicht mehr mit Bobs Photonen verschränkt. Daher gibt es auch keinen Grund, weshalb die Daten von Alice und
Bob durchweg antikorreliert sein müssen.
Dies können Alice und Bob jedoch testen. Dazu schickt Alice an Bob von beispielsweise der Hälfte der Messungen (zufällig ausgewählt) nicht nur die Art der Messung (ob x- oder y-Richtung), sondern auch die Ergebnisse. Diese Ergebnisse müssen
mit den Resultaten von Bob vollständig antikorreliert sein. Ist dies nicht der Fall,
besteht die Gefahr, dass die Photonen abgefangen und Messungen an ihnen vorgenommen wurden. Findet Bob aber tatsächlich vollständige Antikorrelation, wurden
(mit sehr großer Wahrscheinlichkeit) an den Photonen keine Messungen vorgenommen.
Und da Alice diese Photonen zufällig ausgesucht hat, besteht auch kein Anlass zu der
Vermutung, dass die verbliebenen Photonen ausgemessen wurden. Bob schickt Alice
eine entsprechende Nachricht und Alice kann nun die verbliebenen Messdaten (deren
Ergebnisse sie Bob nicht explizit übermittelt hat) zur Verschlüsselung der Nachricht
verwenden.
Von dieser Art der quantenbasierten Schlüsselübermittlung existieren verschiedene Varianten, die man auch als Protokolle bezeichnet. Das bekannteste Protokoll
wurde 1984 von Charles H. Bennett und Gilles Brassard vorgeschlagen und trägt die
Bezeichnung BB84. Hierbei erzeugt Alice zunächst Photonen mit zufällig gewählter
h-, v-, p- oder m-Polarisation und schickt diese an Bob, der die Photonen mit zufällig
gewählten h/v- bzw. p/m-Polwürfeln analysiert. Anschließend tauschen Alice und Bob
die Information aus, bezüglich welcher der beiden Basen sie die jeweiligen Photonen
gemessen haben. In ungefähr der Hälfte der Fälle sind die Basen verschieden; diese
Ergebnisse sind daher nutzlos und werden verworfen. Die Ergebnisse bezüglich der
gleichen Basen liefern Alice und Bob nun eine gemeinsame Bit-Folge. Zum Test, dass
die Folge nicht abgelauscht wurde, können Alice und Bob einen Teil ihrer Bitfolge
vergleichen.
Kapitel 10
Fundamentale Experimente zur
Quantentheorie
Die Quantentheorie entstand natürlich nicht aus rein philosophischen Überlegungen,
sondern sie ist das Ergebnis eines langen Prozesses, bei dem es im Wesentlichen immer
darum ging, bestimmte experimentelle Ergebnisse im Rahmen einer Theorie zu verstehen und zu beschreiben. Einige dieser Experimente eigenen sich besonders gut, die
Eigenarten der Quantenmechanik zu verdeutlichen. In den vergangenen dreißig Jahren haben optische Experimente an Bedeutung gewonnen, und sie spielen gerade für
den Schulunterricht eine herausragende Rolle, so dass wir sie in einem eigenen Kapitel
behandelt haben (Kap. 11). Viele andere Experimente haben neben ihrer praktischen
Bedeutung auch einen historischem Wert und sollen zumindest kurz erwähnt werden.
Was man wissen sollte
Die genannten Experimente bzw. Beobachtungen sollte man kennen. Zum Planck’schen
Strahlungsgesetz sollte man wissen, dass eine klassische Betrachtung zur Ultraviolettkatastrophe führt, weil die Anzahl der Moden mit zunehmender Frequenz zunimmt und
nach dem klassischen Gleichverteilungssatz jeder Mod im thermischen Gleichgewicht
dieselbe Energie beiträgt. Da nach den Vorstellungen der Quantentheorie jeder Mod
eine Minimalenergie hat (die einem Photon – Lichtquant – entspricht) gilt ein Freiheitsgrad als eingefroren“, wenn er durch die thermische Energie praktisch nicht angeregt
”
werden kann. Daher tragen beim schwarzen Körper Moden zu Energien oberhalb der
thermischen Energie nur noch exponentiell underdrückt zum Energieerwartungswert
bei.
Den photoelektrischen Effekt und die Compton-Streuung sollte man erklären
können. Zum photoelektrischen Effekt sollte man wissen, dass die kinetische Energie
der durch das Licht herausgeschlagenen Elektronen zwar von der Frequenz des Lichts
205
206
Fundamentale Experimente zur Quantentheorie
abhängt (und unterhalb einer Schwellfrequenz, die der Austrittsarbeit entspricht, keine
Elektronen herausgeschlagen werden), nicht aber von der Intensität. Umgekehrt hängt
die Anzahl der herausgeschlagenen Elektronen mit der Lichtintensität zusammen. Der
Compton-Effekt beschreibt die Streuung eines Photons an einem Elektron, wobei ein
gestreutes Photon Impuls (und damit auch Energie) abgibt und somit eine längere
Wellenlänge hat.
Der Zeeman- und Stark-Effekt beschreiben die Aufspaltung von Spektrallinien
im magnetischen bzw. elektrischen Feld. Der Zeeman-Effekt beruht auf einer Wechselwirkung magnetischer Momente mit dem Magnetfeld, der Stark-Effekt auf der Wechselwirkung eines elektrischen Dipolmoments mit dem elektrischen Feld.
Das Stern-Gerlach-Experiment sollte man beschreiben können. Außerdem sollte
die Analogie zum Polarisationsstrahlteiler bei Photonen verstanden sein. Man sollte
wissen, weshalb das Magnetfeld inhomogen sein muss.
10.1
Das Planck’sche Strahlungsgesetz
Das Interesse Plancks an dem heute nach ihm benannten Gesetz und seinem physikalischen Hintergrund war nicht nur rein wissenschaftlich. Ende des 19. Jahrhunderts
stellten die großen Städte auf eine elektrische Beleuchtung um (auch der Vater von
Albert Einstein hatte zeitweilig eine Firma, die an der elektrischen Beleuchtung von
Straßenzügen und Plätzen in München beteiligt war, musste sich aber später den
größeren Firmen Siemens und AEG beugen). Für eine effizientere Umsetzung von
elektrischer Energie in Licht war es daher von großem Interesse, die Zusammenhänge
zwischen der Wärme von Glühlampen und Glühdrähten und der abgegebenen Strahlung besser zu verstehen. Ende des 19. Jahrhunderts hielt man die Physik, zumindest
hinsichtlich ihrer Grundlagen, als im Wesentlichen verstanden. Daher erwartete man,
auch die Beziehung zwischen abgestrahlter Lichtenergie und Temperatur im Rahmen
der klassischen Elektrodynamik und der Thermodynamik verstehen zu können.
Unter einem schwarzen Körper versteht man einen Hohlkörper (z.B., das Innere eines Kastens), dem von außen keine elektromagnetische Strahlung zugeführt wird
und der auch keine elektromagnetische Strahlung nach außen abgibt. Sämtliche Strahlung in dem Kasten beruht auf der Wechselwirkung des elektromagnetischen Feldes
mit Oszillatoren (schwingenden Ladungsträgern) in den Kastenwänden. Im thermodynamischen Gleichgewicht sollte sich ein Fließgleichgewicht zwischen absorbierter
und emittierter Strahlung im Kasteninneren einstellen. Näherungsweise spricht man
auch von einem schwarzen Strahler, wenn die abgegebene Strahlung nahezu ausschließlich auf thermischen Effekten beruht und ihre Spektralprofil der Planck’schen Formel
entspricht. Die heute idealste Realisierung einer solchen Strahlung ist die Mikrowellenhintergrundstrahlung in unserem Kosmos, die einer Temperatur von rund 2, 7 K
Das Planck’sche Strahlungsgesetz
207
entspricht.
Bestimmt werden soll die spektrale Verteilungsfunktion
u(T, ω) =
1 dE(T, ω)
,
V
dω
(10.1)
wobei E(ω) die Gesamtenergie der elektromagnetischen Strahlung des Systems ist, die
bei einer absouten Temperatur T auf Frequenzen kleiner oder gleich ω entfällt. V ist
das Volumen des Systems, man ist also an einer Energiedichte interessiert.
Diese Verteilungsfunktion setzt sich aus zwei Anteilen zusammen:
- Die Dichte N (ω) der thermodynamischen Freiheitsgrade bei ω, bzw. die Anzahl
N (ω)dω der thermodynamischen Freiheitsgrade in einem Frequenzbereich zwischen ω und ω + dω.
Diese Dichte hat nichts mit der Temperatur zu tun und ergibt sich aus einfachem
Abzählen der möglichen Schwingungsmoden zu
ω2
N (ω)
= 3 2.
V
cπ
(10.2)
Bei einem (der Einfachheit halber) kubischen Kasten mit Kantenlänge L und Volumen L3
sind die möglichen Wellenlängen in jede der drei Richtungen durch λ = 2L/n gegeben: In jede
Richtung muss ein Vielfaches einer halben Wellenlänge passen. Für die möglichen Zustände
π
im ~k-Raum ergibt sich damit ~k = L
(n1 , n2 , n3 ) mit beliebigen natürlichen Zahlen ni . Jedem
Zustand im ~k-Raum kann man daher ein Volumen |∆k|3 = π 3 /V zuschreiben. Eine Kugelschale
mit Radius k = |~k| und der Dicke dk hat für dk k ein Volumen von 4πk 2 dk und enthält
somit
4
4πk 2 dk
= V 2 k 2 dk
(10.3)
3
|∆k|
π
Zustände in dieser Kugelschale. Da aber nur der Teil der Kugelschale von Interesse ist, der
sich im positiven Quadranten befindet (die ni sind nie negativ), müssen wir noch durch 8 dividieren, andererseits kann jeder Zustand wegen der beiden Polarisationsmöglichkeiten zweimal
auftreten, sodass die Anzahl der Zustände im Bereich zwischen |~k| und |~k| + dk durch πV2 k 2 dk
gegeben ist. Mit ω = c|~k| bzw. dω = c dk ergeben sich schließlich
N (ω)dω = V
ω2
dω
π 2 c3
(10.4)
Zustände in diesem ω-Bereich.
- Die mittlere Energie, die sich bei einer Temperatur T auf einen gegebenen Freiheitsgrad mit der Frequenz ω verteilt.
Nach dem klassischen Gleichverteilungssatz – die Entropie eines Systems ist am
größten, wenn sich die Energie auf alle Freiheitsgrade gleichermaßen verteilt –
trägt jeder Freiheitsgrad dieselbe Energie. Da es sich um schwingende Oszillatoren handelt, sollte diese Energie pro Oszillator durch kB T gegeben sein. (Ein
208
Fundamentale Experimente zur Quantentheorie
eindimensionaler Oszillator hat zwei thermodynamische Freiheitsgrade: einen
bezüglich seiner kinetischen und einen bezüglich seiner potenziellen Energie.
Nach der klassischen Thermodynamik nimmt jeder thermodynamische Freiheitsgrad bei einer Temperatur T die Energie 12 kB T auf.)
Damit ergibt sich nach den klassischen Überlegungen ein Strahlungsgesetz der Form:
uklass (T, ω) =
ω2
kB T .
c3 π 2
(10.5)
Offenbar nimmt diese Verteilung als Funktion von ω rapide zu, sodass der Beitrag von
unendlich hohen Frequenzen“ selbst unendlich groß ist. Dies bezeichnete man als die
”
Ultraviolettkatastrophe“.
”
Für eine quantenmechanische Herleitung der gesuchten Strahlungsdichte ändert
sich an der Abzählung der möglichen Moden nichts. Jeder Mod ω kann mit n Photonen
mit einer Gesamtenergie von n~ω besetzt sein, und die Wahrscheinlichkeit einer solchen
Besetzung ist proportional zum Boltzmann-Faktor exp(−n~ω/kB T ). Als Mittelwert für
die Energie zu einem solchen Mod erhalten wir somit:
∞
n~ω
1X
(n~ω) exp −
h(ω, T )i =
Z n=0
kB T
∞
X
n~ω
mit Z =
exp −
.
kB T
n=0
(10.6)
Bei den auftretenden Summen handelt es sich um geometrische Reihen (bzw. Ableitungen solcher Reihen), die wir leicht ausführen können:
∞
X
1
x =
1−x
n=0
n
∞
X
x
nx =
,
(1 − x)2
n=0
=⇒
h(ω, T )i =
n
P
nxn
x
1
Pn n =
= −1
. (10.7)
1−x
x −1
nx
Damit folgt:
~ω
exp
~ω
kB T
.
(10.8)
−1
Als Ergebnis unserer Überlegungen erhalten wir die Planck’sche Formel:
u(ω, T ) =
1
~ω 3
.
c3 π 2 exp ~ω − 1
(10.9)
kB T
Für kleine Frequenzen (~ω ≤ kB T ) ergibt sich das klassische Ergebnis (Gl. 10.5).
Dies bezeichnet man auch als Rayleigh-Jeans’sches Strahlungsgesetz. Für sehr hohe
Frequenzen (~ω kB T ) folgt das Wien’sche Strahlungsgesetz
~ω 3
~ω
u(ω, T ) = 3 2 exp −
,
cπ
kB T
(10.10)
Der photoelektrische Effekt
209
das die Ultraviolettkatastrophe vermeidet.1
Der klassische Gleichverteilungssatz muss also in der Quantenmechanik modifiziert werden: Ist die notwendige Energie zur Anregung des ersten angeregten Zustands aus dem Grundzustand größer als die thermische Energie, gilt der zugehörige
Freiheitsgrad als eingefroren“ und trägt nicht zur Abzählung der thermischen Frei”
heitsgrade bei. Mit anderen Worten: Wenn die thermische Energie kB T zur Erzeugung
eines Photons mit der Energie E = ~ω nicht ausreicht, sind diese Zustände (wegen des
Boltzmann-Faktors) exponentiell unterdrückt.
10.2
Der photoelektrische Effekt
Der photoelektrische Effekt beschreibt die Herauslösung eines Elektrons aus seinem
Bindungszustand durch ein auftreffendes Photon. Streng genommen unterscheidet man
verschiedene Formen von photoelektrischen Effekten, je nachdem ob das Elektron aus
einem Atom herausgehauen und dieses Atom dadurch ionisiert wird, oder ob es aus
dem Valenzband in ein Leitungsband angehoben wird (wie in der Photovoltaik), oder
ob es bei einem Metall aus dem Leitungsband und damit aus dem Metall herausgehauen wird. Wir beschränken uns hier auf den letzteren Effekt (obwohl die allgemeine
Betrachtung davon im Wesentlichen unabhängig ist). Beobachtet wurde der Effekt
zum ersten Mal 1839 von Alexandre Edmond Becquerel; 1899 konnte Philipp Lenard
die Abhängigkeiten des Effekts von der Lichtfrequenz und der Intensität messen. Erklärt wurde der photoelektrische Effekt 1905 durch Albert Einstein, der dafür 1922
den Nobelpreis erhielt.
Beobachtet wurde, dass im Wesentlichen überhaupt keine Elektronen aus dem
Metall herausgehauen werden, wenn die Frequenz des Lichts unterhalb einer bestimmten kritischen Frequenzschwelle ν0 liegt, unabhängig von der Intensität des Lichtes.
Weiterhin hängt zwar die Anzahl der herausgehauenen Elektronen von der Intensität
ab, nicht aber deren maximale kinetische Energie. Diese wiederum ist (oberhalb der
genannten Frequenzschwelle) eine lineare Funktion der Frequenz (vgl. Abb. 10.1).
Die Deutung gelang Einstein unter der Annahme diskreter Lichtquanten“, de”
ren Energie proportional zur Frequenz des Lichts ist. Später konnte experimentell gezeigt werden, dass der Proportionalitätsfaktor zwischen Energie und Frequenz gleich
der Planck’schen Konstanten ist. Ein Photon kann nur ein einzelnes Elektron aus
seinem Verbund heraushauen. Für die kinetische Energie eines solchen Elektrons gilt
Ekin = hν − W ,
1
(10.11)
Oft findet man die Strahlungsformel als Funktion von ν oder von λ. Bei der Umrechnung muss
man darauf achten, dass es sich bei u(ω, T ) um eine Dichte handelt, d.h., auch das Integrationsmaß
dω muss transformiert werden.
210
Fundamentale Experimente zur Quantentheorie
Abbildung 10.1: Qualitatives Verhalten der
maximalen kinetischen Energie der herausgehauenen Elektronen (gemessen durch den
Nachweis eines Stroms bei einem elektrischen
Gegenfeld) als Funktion der Lichtfrequenz.
maximale
kinetische Energie
6
• • ••
•
•
•
•
•
Frequenz
ν0
wobei W die Austrittsarbeit des Elektrons ist. Ist W > hν werden keine Elektronen
herausgelöst. Die Intensität bestimmt lediglich die Anzahl der auf das Metall auftreffenden Photonen und damit die Anzahl der herausgehauenen Elektronen, nicht aber
deren Energie.
10.3
Die Compton-Streuung
Die 1922 von Sir Arthur Compton beobachtete Streuung von hochenergetischen Photonen (Röntgenstrahlung) an Elektronen zeigte mehrere Effekte (Abb. 10.2):
- Auch anfänglich ruhende Elektronen erhalten durch die Streuung einen Impuls
wie bei einem Stoß.
- Das gestreute Licht zeigt eine ausgeprägte Winkelabhängigkeit.
- Die Wellenlänge des gestreuten Lichts ist kleiner als die der einfallenden Strahlung und hängt mit dem Streuwinkel zusammen (je größer der Streuwinkel umso
größer die Änderung der Wellenlänge).
Abbildung 10.2: Trifft ein hochenergetisches Photon auf ein Elektron kommt es zu einem Stoßprozess
ähnlich der gewöhnlichen Teilchenstreuung. Das gestreute Photon besitzt eine geringere Energie und
daher eine größere Wellenlänge.
e−
*
•
ϕ
Diese Effekte waren im Rahmen einer klassischen Beschreibung der Streuung
von Licht an einem geladenen Teilchen schwer verständlich: Nach der klassischen
Vorstellung sollte das ruhende geladene Teilchen durch die einfallende Strahlung zu
Schwingungen angeregt werden. Diese Schwingungen wiederum erzeugen eine Dipolstrahlung mit derselben Frequenz wie die einfallende Strahlung. Ein solches Verhalten
wird tatsächlich bei großen Wellenlängen beobachtet.
Die Compton-Streuung findet ihre natürliche Erklärung ebenfalls in einem Teilchenbild von elektromagnetischer Strahlung. Ein einzelnes Photon mit der Energie
Zeeman- und Stark-Effekt
211
E = hν und zugehörigem Impuls p = E/c trifft auf das Elektron und übertägt bei diesem Stoß einen Teil seiner Energie und seines Impulses auf das Elektron. Dadurch wird
ein anfänglich ruhendes Elektron in eine bestimmte Richtung gestreut, und das Photon entsprechend dem Impulsübertrag in eine andere Richtung, sodass Gesamtimpuls
und -energie erhalten bleiben. Da die Energie des Photons durch den Stoß abnimmt,
hat das gestreute Photon eine kleinere Frequenz bzw. eine größere Wellenlänge. Eine
ausführliche Rechnung ergibt:
∆λ =
h
(1 − cos ϕ) ,
mc
(10.12)
wobei ∆λ die Änderung der Wellenlänge bezeichnet und ϕ den Streuwinkel. h ist das
Planck’sche Wirkungsquantum und m die Masse des Teilchens. Die Größe
λC =
h
mc
(10.13)
bezeichnet man als Compton-Wellenlänge (manchmal ersetzt man h auch durch die
reduzierte Planck’sche Konstante ~). Sie definiert eine Längenskala für ein Teilchen
der Masse m. Ist die Wellenlänge der einfallenden Strahlung wesentlich größer als
die Compton-Wellenlänge, beobachtet man das klassische Streuverhalten von Licht an
geladenen Teilchen.
10.4
Zeeman- und Stark-Effekt
Ganz allgemein versteht man unter dem Zeeman-Effekt die Aufspaltung einer Spektrallinie, wenn sich die emittierende Materie in einem Magnetfeld befindet. Entsprechend
bezeichnet der Stark-Effekt die Linienaufspaltung in einem elektrischen Feld.
Der Zeeman-Effekt unterscheidet sich insofern vom Stern-Gerlach-Experiment
(siehe nächsten Abschnitt), als beim Zeeman-Effekt direkt die Aufspaltung der Energieniveaus beobachtet wird, wohingegen beim Stern-Gerlach-Experiment die Kraft auf
ein Teilchen mit einem Spin in einem Magnetfeld untersucht wird. Der Zeeman-Effekt
wird allgemein in homogenen Magnetfeldern beobachtet, wohingegen für das SternGerlach-Experiment ein inhomogenes Magnetfeld notwendig ist.
Ganz allgemein hat ein Teilchen mit einem magnetischen Moment µ
~ in einem
~
Magnetfeld B eine potenzielle Energie
~.
Hµ = −~µ · B
(10.14)
In den meisten Fällen beruht das magnetische Moment auf einem Drehimpuls eines
~ eines geladenen
geladenen Teilchens. Allgemein besteht zwischen dem Drehimpuls L
Teilchens und dem dadurch erzeugten magnetischen Moment die Beziehung
~,
µ
~ = γL
(10.15)
212
Fundamentale Experimente zur Quantentheorie
wobei γ das gyromagnetische Verhältnis angibt. Dieses spaltet man in der Quantenmechanik meist in das Bohr’sche Magneton
µB =
e~
2m
(10.16)
(m ist die Masse des Teilchens und e seine Ladung) sowie den so genannten g-Faktor
auf, wobei der Drehimpuls in Einheiten von ~ angegeben wird:
~ = gµB
γL
~
L
.
~
(10.17)
Für einen einfachen Bahndrehimpuls ist g = 1, für den Spin eines Elektrons ergibt sich
aus der Dirac-Gleichung ein g-Faktor von ge = 2. Quantenfeldtheoretische Korrekturen
führen zu einem etwas höheren g-Wert.
Das magnetische Moment zu einem elektrischen Strom ~j (der Teil eines geschlossenen Stromkreises sein soll, damit die Kontinuitätsgleichung erfüllt ist) ist
µ
~=
1
(~r × ~j) .
2
(10.18)
Der Strom eines einzelnen Teilchens mit der Geschwindigkeit ~v und der Ladung e ist: ~j = e~v , sodass
wir
e
e ~
µ
~=
(~r × m~v ) =
L
(10.19)
2m
2m
erhalten.
Je nachdem, um welche Art von magnetischem Moment es sich handelt, unterscheidet man verschiedene Arten von Zeeman-Effekten:
• Beim normalen Zeeman-Effekt beruht das magnetische Moment auf dem Bahndrehimpuls eines Elektrons in einem Atomverbund. Je nach dem Wert des Drehimpulses wird eine Aufspaltung in 3 Linien (Drehimpuls zur Quantenzahl l = 1),
5 Linien (l = 2) oder auch gar keine Aufspaltung (l = 0) beobachtet.
• Beim anomalen Zeeman-Effekt berücksichtigt man eine Spin-Bahn-Kopplung
und einen daraus resultierenden Gesamtdrehimpuls. Für ein einzelnes Elektron
(Spin 21 ) in einem l = 1-Orbital führt das zu den magnetischen Quantenzahlen
m = + 23 , + 12 , − 12 , − 32 des Gesamtdrehimpulses und somit zu einer vierfachen Aufspaltung. Die potenzielle Energie zu dem Magnetfeld muss in diesem Fall schwach
im Vergleich zur potenziellen Energie der Spin-Bahn-Kopplung sein. (Bei sehr
starken Magnetfeldern kommt es zum so genannten Paschen-Back-Effekt, bei
dem das Magnetfeld die Spin-Bahn-Kopplung aufbricht“.)
”
Man unterscheidet noch weitere Formen des Zeeman-Effekts (quadratischen ZeemanEffekt oder Zeeman-Effekt an Atomkernen etc.), auf die hier aber nicht eingegangen
werden soll.
Das Stern-Gerlach Experiment
213
Der Stark-Effekt beruht auf einem elektrischen Dipolmoment p~ eines Atoms,
~ einem Energiebeitrag
das in einem elektrischen Feld E
~
H = p~ · E
(10.20)
liefert. Besitzt das Atom ein permanentes Dipolmoment, beschreibt obiger Term den
linearen Stark-Effekt. Bei Atomen ohne permanentem Dipolmoment induziert das an~ was dann zu einem quadratischen
gelegte elektrische Feld ein Dipolmoment p~ ∝ E
Stark-Effekt führt.
10.5
Das Stern-Gerlach Experiment
Im Jahre 1922 wollten Otto Stern und Walter Gerlach das Bohr-Sommerfeld’sche
Atommodell testen. Nach diesem Modell besitzt ein Elektron einen Bahndrehimpuls,
und nach der klassischen Theorie des Elektromagnetismus sollte zu einem Bahndrehimpuls eines geladenen Teilchens auch ein magnetisches Moment gehören. Dieses
magnetische Moment wiederum sollte sich in einem Magnetfeld bemerkbar machen,
indem die Atome je nach der Ausrichtung des magnetischen Moments in eine bestimmte Richtung abgelenkt werden (siehe auch den vorigen Abschnitt zum Zeeman-Effekt).
Statt der Aufspaltung der Energieniveaus wollten Stern und Gerlach aber die Kraft
messen, die ein Magnetfeld auf ein Atom mit einem magnetischen Moment ausübt.
Diese ergibt sich aus dem Gradienten der potenziellen Energie und ist daher nur für
inhomogene Magnetfelder von null verschieden.
Otto Stern und Walter Gerlach verwendeten einen Strahl aus Silberatomen, die
mit einer mehr oder weniger wohldefinierten Geschwindigkeit durch ein inhomogenes
Magnetfeld gelenkt wurden. Hinter dem Magnetfeld trafen die Atome auf eine Nachweisplatte, auf der nach einer Weile eine Verteilung der Silberatome sichtbar wurde.
Sehr zur Überraschung der beiden Experimentatoren, die wie bei dem damals
schon bekannten Zeeman-Effekt eine Aufspaltung in drei Teilstrahlen vermutet hatten,
zeigten sich auf der Platte jedoch nur zwei Bereiche. Eine solche Aufspaltung lies sich
nach der herkömmlichen Theorie des Drehimpulses nicht erklären, da Bahndrehimpulse immer eine ganzzahlige Quantenzahl l haben und die zugehörigen Darstellungen
(die möglichen Werte für m) ungerade Dimension (2l + 1) haben (siehe Abschnitt 6.6).
Wolfgang Pauli postulierte 1925 für das Elektron eine zusätzliche, 2-wertige Quantenzahl, die später die Bezeichnung Spin“ erhielt. (Pauli selbst hat diesen Namen
”
vermieden, da er die Vorstellung eines um eine Achse rotierenden Elektrons ablehnte.)
Eine exakte Behandlung des Elektronenspins und seiner Deutung wird erst im
Rahmen der Dirac-Gleichung möglich. Diese (relativistische) Verallgemeinerung der
Schrödinger-Gleichung beschreibt geladene Spin- 12 -Teilchen. In einer nicht-relativis-
214
Fundamentale Experimente zur Quantentheorie
Abbildung 10.3: Beim Stern-Gerlach Experiment tritt ein Atomstrahl (Silber)
durch ein inhomogenes Magnetfeld. Je
nach der Orientierung des Spins relativ zu
diesem Magnetfeld wird der Strahl nach
oben oder unten abgelenkt.
Schirm
Quelle
Strahl
A |+i
A
C``
```
C
```
|−i
Magnet
tischen Näherung beschreibt man den Spin jedoch häufig durch einen 2-komponentigen
Spinor, d.h., durch ein Paar von Wellenfunktionen.
Wie wir schon in Kap. 9.3.1 gesehen haben, ist der für die Kopplung zwischen
Spin und Magnetfeld verantwortliche Wechselwirkungs-Hamiltonoperator in der nichtrelativistischen Näherung
e~ ~
Hint = − S
·B
(10.21)
m
mit den Spin-Matrizen
~
(10.22)
Si = σi
2
(hierbei wurde der g-Faktor des Elektrons gleich 2 gesetzt). Die Kraft ergibt sich
aus dem Gradienten zu diesem Potenzial. Wählen wir die Koordinaten so, dass das
Magnetfeld nur eine z-Komponente hat, dann folgt:
e~ ∂Bz
~ez
F~ = sz
m ∂z
(10.23)
wobei sz = ± 12 ist.
Das inhomogene Magnetfeld wirkt somit auf ein Atom mit einem freien Spin
ähnlich wie ein polarisationsabhängiger Strahlteiler (Polwürfel) auf ein Photon: Je
nach der Spin- bzw. Polarisationsrichtung wird ein Teilchen in die eine oder andere
Richtung abgelenkt. Umgekehrt kann man mit einem geeignet adjustierten inhomogenen Magnetfeld auch zwei Strahlen mit entgegengesetzten Spin-Orientierungen wieder
zusammenführen. Auch diesen Effekt hatten wir bei Polwürfeln beobachtet. Damit
lassen sich mit diesen Anordnungen ganz ähnliche Experimente wie in der Optik mit
Polarisationen durchführen, insbesondere gibt es auch Mach-Zehnder“-ähnliche Ap”
paraturen oder die Möglichkeit des Nachweises von Superpositionen wie in Abb. 2.5.
Kapitel 11
Optische Experimente zur
Quantentheorie
Wegen der zunehmenden Bedeutung optischer Experimente sowohl in der Grundlagenforschung der Physik als auch in ihren Anwendungen, und insbesondere auch wegen
ihrer Möglichkeiten für den Schulunterricht widmen wir ihnen ein spezielles Kapitel.
Optische Experimente in Bezug auf den Polarisationsfreiheitsgrad von Photonen bzw.
Licht haben den Vorteil, dass die Mathematik oft auf die Eigenschaften von Vektoren
und Matrizen in zweidimensionalen Räumen beschränkt und somit auch der Schulmathematik zugänglich ist, und dass man optische Versuche leicht durchführen kann.
Schwierigkeiten in der Praxis bereiten lediglich noch Experimente, die mit einzelnen
Photonen durchgeführt werden müssen, da Einphotonenquellen und -detektoren immer noch sehr teuer sind.
Bevor wir auf verschiedene optischen Experimente eingehen, werden einige grundlegende Elemente der experimentellen Anordnungen erläutert.
Was man wissen sollte
Die prinzipielle Funktionsweise einfacher optischer Bauelemente (Laser, Polarisationsfilter, Strahlteiler, etc.) sollte bekannt sein. Ebenso sollte man das Mach-ZehnderInterferrometer kennen und seine Funktionsweise beschreiben können. Einfache Experimente mit dem Mach-Zehnder-Interferrometer, z.B. das Knallerexperiment“ (Mes”
sung ohne Wechselwirkung) sollte man beschreiben können. Ebenfalls bekannt sein
sollte der Begriff des delayed-choice“–Experiments (Experimente mit verzögerter Wahl)
”
und des Quantenradierers“ (quantum eraser).
”
215
216
11.1
Optische Experimente zur Quantentheorie
Experimentelle Bausteine
Bevor wir mit der Beschreibung einiger ausgewählter optischer Experimente zur Quantentheorie beginnen, sollen kurz einige der Elemente optischer Experimente angesprochen werden. Dabei geht es weniger darum, die neueste Technologie“ zu beschreiben,
”
als die einfachsten experimentellen Möglichkeiten anzugeben, mit denen sich das angestrebte Ziel erreichen lässt. Wichtig ist der Nachweis, dass es Bauteile gibt, welche
die geforderte Aufgabe tatsächlich erfüllen können. Der Polarisationsfilter, Polwürfel
(polarisationsabhängige Strahlteiler) sowie die Möglichkeiten des Einzelphotonennachweises wurden schon in Abschnitt 2.1.2 behandelt.
11.1.1
Laser
Zur Theorie der Laser gibt es eine sehr umfangreiche Literatur, sodass an dieser Stelle nicht auf die Einzelheiten eingegangen wird. Ein Laser besteht typischerweise aus
einem Resonator (oft zwei Spiegel, von denen einer schwach durchlässig (im Prozentbereich) ist, und einem Medium. Das Medium besitzt (mindestens) drei für die Funktionsweise relevante Energieniveaus: einen Grundzustand A, einen angeregten Zustand
B, der sehr kurzlebig ist und im Allgemeinen in einen ebenfalls angeregten Zustand
C übergeht. Dieser Zustand C ist metastabil. Durch optisches Pumpen wird zunächst
der Zustand B und damit sehr rasch der Zustand C bevölkert, sodass der Zustand C
häufiger besetzt ist als der Grundzustand A. Eine auf das Medium einwirkende elektromagnetische Welle mit exakt der Wellenlänge zu dem Übergang C→A kann eine
induzierte Emission auslösen. Auf diese Weise entsteht in dem Resonator eine stehende
Welle zu der Wellenlänge dieses Übergangs, von der ein kleiner Anteil durch den leicht
durchlässigen Spiegel nach außen dringt.
Die wesentlichen Merkmale von Laserlicht sind, dass es sehr monochromatisch
ist (also eine sehr scharfe und wohldefinierte Wellenlänge hat) und außerdem sehr
kohärent, d.h., das austretende Licht besteht aus Wellenzügen, die alle in Phase sind.
Für typische Quantenexerpimente möchte man oft sehr schwaches Laserlicht
einsetzen, im Extremfall Licht, das aus Einzelphotonen besteht.
11.1.2
Doppelspalt und Gitter
Beugungsexperimente werden meist an Doppelspalten oder Gittern ausgeführt. Die
Spaltbreite sollte (im Idealfall) klein gegen den Spaltabstand sein, und der Spaltabstand sollte nicht wesentlich größer als einige Wellenlängen sein, wenn man ein deutliches Beugungsbild und Interferenzmuster beobachten möchte. (Je nach angestrebter
Ablenkung können zwischen der Wellenlänge der elektromagnetischen Strahlung und
dem Abstand der Spalte aber auch mehrere Größenordnungen liegen.) Die Beugungs-
Experimentelle Bausteine
217
bedingung für konstruktive und destruktive Interferenz wurde schon in Abschnitt 3.1
besprochen (Gl. 3.4 und 3.5).
Da Licht unterschiedlicher Wellenlänge auch unterschiedlich stark gebeugt wird,
kann man Gitter (ähnlich wie Prismen) auch verwenden, um näherungsweise monochromatische elektromagnetische Wellen zu erhalten.
11.1.3
Strahlteiler
Strahlteiler sind Gläser mit einer dünnen Metallschicht, die einen Teil der einfallenden
elektromagnetischen Strahlung durchlassen und einen anderen Teil reflektieren.
Stellt man solche Strahlteiler unter einem Winkel von 45◦ zur Strahlrichtung
auf, wird ein Teil des Strahls gerade durchgelassen und ein anderer Teil unter einem
rechten Winkel abgelenkt. Strahlteiler spielen unter anderem eine wichtige Rolle bei
Mach-Zehnder-Interferrometern.
Umgekehrt kann man mit einem Strahlteiler Lichtstrahlen auch wieder zusammenführen: Treffen zwei Lichtstrahlen jeweils unter einem Winkel von 45◦ von beiden
Seiten auf den Strahlteiler, wird von jedem der beiden Strahlen ein Teil des Lichts
durchgelassen und ein Teil reflektiert. Die beiden austretenden Strahlen sind somit im
Allgemeinen eine Superposition der beiden einfallenden Strahlen.
Zwischen dem reflektierten Lichtstrahl und dem durchgelassenen Lichtstrahl
besteht eine Phasenverschiebung. Im Idealfall ist die Phasenverschiebung (relativ zum
einfallenden Strahl) beim durchgelassenen Strahl 0 und beim (unter 90◦ ) reflektierten
Strahl π/2 oder 90◦ . Das bedeutet, der Zustand des reflektierten Strahls erhält einen
√
zusätzlichen Faktor i = −1 relativ zum durchgelassenen Strahl.
11.1.4
λ/4- und λ/2-Plättchen
λ/4- und λ/2-Plättchen verzögern die Ausbreitung von elektromagnetischen Wellen
um eine Viertel bzw. halbe Wellenlänge in einer Polarisationsrichtung im Vergleich
zur dazu orthogonalen Polarisationsrichtung. Auf diese Weise kann ein λ/4-Plättchen
aus linear polasiertem Licht zirkular polarisiertes Licht machen. Ein λ/2-Plättchen
kann linear polarisiertes Licht um einen vorgegebenen Winkel drehen.
Die Kristallgitter dieser Plättchen sind anisotrop, d.h., ihr optischer Brechungsindex hängt von der Polarisationsrichtung der Strahlung ab. Auf diese Weise können
sich elektromagnetische Wellen, je nach ihrer Polarisationsrichtung zur Kristallachse,
schneller oder langsamer durch den Kristall bewegen und erhalten dadurch bezüglich
dieser Achsen eine unterschiedliche Phase.
Ob ein λ/4-Plättchen tatsächlich aus planar polarisiertem Licht zirkular polarisiertes Licht macht, hängt von den Polarisationsrichtungen des Plättchen relativ zu der Polarisationsrichtung des einfallenden Photons ab. Sei beispielsweise die
218
Optische Experimente zur Quantentheorie
schnelle“ Achse des λ/4-Plättchens die +45◦ -Achse und die langsame“ Achse die
” ◦
”
−45 -Achse. Ein solches Plättchen nennen wir λ+ /4-Plättchen. (Entsprechend hat ein
λ− /4-Plättchen die −45◦ -Achse als schnelle Achse und die +45◦ -Achse als langsame
Achse). Trifft Licht auf ein λ+ /4-Plättchen, passiert je nach dem Polarisationszustand
des Photons Folgendes:
|+i −→ |+i
(11.1)
|−i −→ −i|−i
1
1
|hi = √ (|+i + |−i) −→ √ (|xi − i|yi = |Ri
2
2
1
1
|vi = √ (|+i − |−i) −→ √ (|xi + i|yi = |Li
2
2
(11.2)
(11.3)
(11.4)
Ist das einfallende Photon also bezüglich der Eigenachsen des λ/4-Plättchens polarisiert, ändert sich an dem Polarisationszustand nichts, allerdings wird er eventuell
um eine Viertel Wellenlänge verzögert. Ist die Polarisation des einfallenden Photons
komplementär zu den Eigenachsen des λ/4-Plättchens (also um ±45◦ gedreht), wird
aus dem planar polarisiertem einfallenden Photon ein zirkular polarisiertes Photon.
11.1.5
Down Conversion Kristalle
Bei der parametric down conversion“ (im Deutschen spricht man auch von para”
metrischer Fluoreszenz) handelt es sich um einen nicht-linearen optischen Effekt in
Kristallen: Ein einzelnes Photon der Wellenlänge λ und zugehöriger Energie E = hc/λ
tritt in den Kristall. Es wird von dem Kristall absorbiert, wodurch Schwingungen im
Kristallgitter angeregt werden. Durch nicht-lineare Effekte können diese Schwingungen
ihre Energie wieder durch Emission von Photonen abgeben, wobei diesmal allerdings
zwei Photonen der halben Energie (und damit doppelten Wellenlänge) emittiert werden. Diese beiden Photonen sind oft verschränkt, d.h., der Polarisationszustand des
einen Photons ist anti-korreliert zum Polarisationszustand des anderen Photons wobei
typischerweise der Gesamtdrehimpuls der beiden Photonen verschwindet.
Ein bekannter und in optischen Experimenten oft verwendeter Kristall mit diesen Eigenschaften ist Beta-Bariumborat (β-BaB2 O4 , häufig schreibt man kurz BBO).
Die Einsatzmöglichkeiten sind vielfältig: In manchen Fällen dient der Nachweis eines der beiden emittierten Photonen als Indikator, dass ein zweites Photon auf dem
”
Weg ist“. Durch diesen Trigger-Effekt kann man den Zeitpunkt, zu dem ein Photon
in eine experimentelle Anordnung eintritt, sehr genau bestimmen. Eine zweite Anwendung besteht in der Erzeugung verschränkter Photonenpaare, an denen sich typische EPR-Studien, Bell’sche Ungleichungen oder auch quantum eraser“–Experimente
”
durchführen lassen.
11.2. DAS MACH-ZEHNDER-INTERFEROMETER
11.2
219
Das Mach-Zehnder-Interferometer
Das Mach-Zehnder-Interferometer wird meist eingesetzt, wenn man Doppelspaltexpe”
rimente“ mit elektromagnetischen Wellen (Licht) mit Spaltbreiten“ von makroskopi”
scher Größenordnung (mehrere Meter bis Kilometer) durchführen möchte. Die beiden
Teilstrahlen lassen sich im Prinzip beliebig weit voneinander trennen.
Beim Mach-Zehnder-Interferometer trifft ein einfallendes Photon |γi zunächst
auf einen Strahlteiler. Ein Teil des Strahls wird durchgelassen (wir bezeichnen ihn
mit |ti “ für transmittiert“) und einer wird unter einem Winkel von 90◦ reflektiert
”
”
(Lichtstrahl |ri “). Die beiden Teilstrahlen trennen sich also unter einem Winkel von
”
90◦ und werden anschließend von zwei Spiegeln ebenfalls unter einem Winkel von
90◦ reflektiert. Schließlich treffen sie bei einem zweiten Strahlteiler wieder zusammen.
Hinter diesem zweiten Strahlteiler kann das Licht im Prinzip an zwei verschiedenen
Stellen beobachtet werden (D und C).
D dunkel
|Di
Spiegel
6
- C hell
Strahlteiler
|Ci
|ri
6
|γi
6
|ti
-
Spiegel
Strahlteiler
Abbildung 11.1: Mach-Zehnder Interferometer.
Bei jeder Reflektion eines Photonzustands an einem der Spiegel oder Strahlteiler um 90◦ tritt eine Phasenverschiebung von π/2 auf (s.o., Strahlteiler), wohingegen
der durchgelassene Zustand diese Phasenverschiebung nicht erhält. Eine Phasenverschiebung von 90◦ bedeutet eine Multiplikation des Zustands mit eiπ/2 = i. Aus dem
einfallenden Zustand |γi wird somit nach dem ersten Strahlteiler (ST) der Zustand
1
1. ST
|γi −→ √ (|ti + i|ri)
2
(11.5)
Anschließend werden beide Strahlen an den Spiegeln reflektiert, was für jeden der
Teilzustände eine Multiplikation mit i bedeutet.
1
i
Spiegel
1. ST
|γi −→ √ (|ti + i|ri) −→ √ (|ti + i|ri)
2
2
(11.6)
220
Optische Experimente zur Quantentheorie
Am zweiten Strahlteiler werden beide Teilstrahlen wiederum aufgespalten, wobei der
jeweils reflektierte Anteil wieder einen Faktor i erhählt. Der Gesamtzustand ist eine
Superposition der beiden Strahlen, die in Richtung D und in Richtung C abgelenkt
wurden:
i
1
Spiegel
√ (|ti + i|ri) −→ √ (|ti + i|ri)
2
2
1
i
i
2. ST
√ (|Di + i|Ci) + √ (i|Di + |Ci)
−→ √
2
2
2
2
3
2
i
i
i
i
=
|Di + |Ci + |Di + |Ci
2
2
2
2
= −|Ci
1. ST
|γi −→
(11.7)
(11.8)
(11.9)
(11.10)
Die vorletzte Zeile dieser Gleichung kann man im Sinne von Feynman als Summation
”
über alle Möglichkeiten“ verstehen: Es gibt insgesamt vier gleichberechtigte Wege für
das Photon (daher ist das Absolutquadrat der Amplituden immer 41 ) und jeder Weg
wird gewichtet mit einer Phase, die sich aus der Anzahl der Reflektionen an Spiegeln
zusammensetzt — jede Reflektion ergibt einen Faktor i. Zwei dieser Wege enden im
Detektor D, allerdings haben diese Wege einen Phasenunterschied von i2 = 180◦ und
heben sich somit auf; in diesem Detektor sollte aufgrund einer destruktiven Interferenz
kein Photon nachgewiesen werden. Die beiden anderen Wege enden im Detektor C, sie
haben keinen relativen Phasenunterschied und es kommt zu konstruktiver Interferenz.
Sind die beiden optischen Wegstrecken der Strahlen also exakt gleich lang, findet man bei D hinter dem Mach-Zehnder-Interferometer gerade eine Auslöschung der
Teilstrahlen (destruktive Interferenz) und an der anderen Stelle eine Verstärkung (konstruktive Interferenz). Wie wir gesehen haben, liegt der Grund in einer gewissen Asymmetrie zwischen den Strahlen, die bei D und C ankommen (vgl. Abb. 11.2): Beide
Strahlen, die bei dem Detektor C zusammenkommen, wurden jeweils einmal an einem
halbdurchlässigen Spiegel reflektiert und einmal durchgelassen (die Reflektion an den
gewöhnlichen Spiegeln ist für alle Teilstrahlen dieselbe). Die beiden Strahlen befinden
sich also bei Detektor C in Phase und es tritt konstruktive Interferenz auf.
Betrachten wir die Strahlengänge zu Detektor D so stellen wir fest, dass einer
der beiden Strahlen an beiden Strahlteilern reflektiert wurde, der ander Strahl jedoch
bei beiden Strahlteilern durchgelassen wurde. Daher hat der eine Strahl relativ zu
dem anderen Strahl nun eine Phasenverschiebung von λ/2, und es findet destruktive
Interferenz statt. Werden also beide Strahlgänge kohärent durchlaufen, sollte man bei
D nie ein Photon messen, statt dessen bei C immer.
Verändert man die optischen Wegstrecken der Strahlen, sodass zu den Phasen,
die bei den Reflektionen auftreten, noch eine optische Wegdifferenz ∆x hinzukommt,
kann man die relative Intensität der gemessenen Photonen bei D und C variieren. Ist
∆x ein Vielfaches der Wellenlänge, findet man bei D destruktive Interferenz (keine
Das Knallerexperiment
221
Photonen) und bei C konstruktive Interferenz (alle Photonen). Ist ∆x gleich einem
Vielfachen der Wellenlänge plus einer halben Wellenlänge, so findet man alle Photonen
bei D und keines bei C. Als Funktion von ∆x beobachtet man somit an jedem der
beiden Detektoren ein Interferenzmuster“.
”
11.3
Wechselwirkungsfreie Messung —
das Knallerexperiment“
”
Im Jahre 1993 veröffentlichten Avshalom Elitzur und Lev Vaidman einen Artikel
mit dem Titel Quantum mechanical interaction-free measurements“ [25]. Die Idee
”
der wechselwirkungsfreien Messung ist schon ziemlich alt: Schrödinger erwähnt die
Möglichkeit eines Informationsgewinns (und damit einer Reduktion des Quantenzustands) ohne direkte Wechselwirkung in einem Artikel von 1934 [67] und bekannt
wurde sie durch einen Artikel von M. Renninger im Jahre 1960 [66]. Elitzur und Vaidman haben die Idee jedoch sehr werbeträchtig“ aufgezogen, indem sie daraus einen
”
Test für den Status einer Superbombe gemacht haben.
-
6
-
D dunkel
6
C hell
6
-
D
6
-
C
6
-
-
y
Abbildung 11.2: Mach-Zehnder Interferometer ohne und mit Hindernis in einem Strahlgang.
Gegeben sei ein Arsenal von Superbomben, die sofort detonieren, wenn ein
Lichtstrahl (ein einzelnes Photon) auf einen Auslöser trifft. Es gibt nun Vermutungen,
dass einige der Bomben nicht mehr funktionieren, weil die Auslöser fehlen. Durch einen
Blick auf den Auslöser ließe sich das zwar überprüfen, allerdings würde eine intakte
Bombe dabei explodieren. Bei den defekten Bomben, bei denen der Auslöser fehlt, tritt
ein Photon durch die Vorrichtung ungehindert hindurch, bei den intakten Bomben löst
das Photon die Bombe aus.
Elitzur und Vaidman schlagen nun folgenden Bombentest vor: Man bringe die
Auslösevorrichtung der Bombe in einen der beiden Strahlgänge eines Mach-ZehnderInterferrometers. Fehlt der Auslöser, ist die Bombe also defekt, tritt ein Photon ungehindert hindurch und das Interferrometer reagiert so, wie es auch ohne die Bombe
222
Optische Experimente zur Quantentheorie
reagieren würde, und damit sollte man nie ein Photon in Detektor D des Interferrometers messen. Ist die Bombe aber intakt, kann Folgendes passieren: Entweder trifft das
Photon auf den Auslöser und die Bombe explodiert — dies passiert in rund der Hälfte
der Fälle (falls der erste Strahlteiler eine 50-prozentige Durchlasswahrscheinlichkeit
hat). Oder aber das Photon trifft nicht auf den Auslöser, es durchläuft den anderen
Teilstrahl und kann am zweiten Strahlteiler entweder abgelenkt oder reflektiert werden
(nun kann es nicht zu einer Interferenz mit dem Anteil des Photonenzustands kommen,
der den Strahlengang mit der Bombe durchläuft). Trifft das Photon auf Detektor C,
können wir keine Aussage über den Zustand der Bombe machen. Trifft es aber auf
Detektor D, wissen wir, dass die Bombe intakt ist. Da das Photon aber im Detektor
gelandet ist, konnte es nicht mit der Bombe wechselwirken und damit auch die Bombe
nicht auslösen.
Insgesamt tritt der günstige Fall (Nachweis des Photons in Detektor D) bei
einer intakten Bombe in einem Viertel der Fälle auf. In der Hälfte der Fälle explodiert
die Bombe, und in einem Viertel der Fälle können wir keine Aussage treffen, weil das
Photon in Detektor C gelandet ist. Wird ein solches Photon (bei Ausgang C) wieder
in das Interferrometer geleitet, können wir erreichen, dass in zwei Drittel der Fälle die
intakte Bombe explodiert und in einem Drittel der Fälle der Nachweis in Detektor D
erfolgt. Zumindest ein Drittel der intakten Bomben können dadurch gerettet werden.
(Bei einer defekten Bombe kann man das Photon immer wieder in das Interferrometer
lenken: trifft es nie auf Detektor D kann man sicher sein, dass die Bombe defekt ist.)
Durch eine Kopplung von Mach-Zehnder-Interferrometer und der Idee des QuantenZenon-Effekts kann man sogar erreichen, dass man bei einer intakten Bombe in nahezu
100 Prozent der Fälle die entsprechende Information erhält, ohne dass die Bombe
explodiert [48].
Die praktische Anwendung solcher Verfahren wird sich in den seltensten Fällen
auf Bomben beziehen, aber vielleicht ist es in Zukunft unter Ausnutzung dieses Effekts
möglich, beispielsweise Röntgen-Aufnahmen oder auch γ-Strahlaufnahmen ohne die
gesundheitsschädlichen Nebenwirkungen zu machen.
In der Praxis verwendet man oft eine etwas andere Anordnung (Abb. 11.3),
die aber dem Prinzip des Mach-Zehnder-Interferometers entspricht ([48]). Zunächst
erzeugt man sich durch parametrische Fluoreszenz (beispielsweise an einem BBOKristall, s.o.) ein Photonenpaar. Wird eines dieser beiden Photonen in einem Detektor
nachgewiesen weiß man, dass ein zweites Photon da ist, das nun für das Experiment
verwendet wird.
Dieses zweite Photon trifft auf einen Strahlteiler und kann diesen durchlaufen
oder es kann reflektiert werden. In beiden Fällen wird es an Spiegeln reflektiert und
trifft wieder auf den Strahlteiler. Die Anordnung ist so justiert, dass ohne Hindernis
aufgrund von destruktiver Interferenz kein Photon auf den Detektor (dunkel) gelenkt
Das Experiment von Hong, Ou und Mandel
Detektor
(dunkel)
i
Detektor
i
*
- UV
-
223
Spiegel
@
- @
BBO
Strahlteiler
?
6
@
@
@
Spiegel@
(Bombe)
Detektor
i
Spiegel
Abbildung 11.3: Experimentelle Realisierung von Interferenzexperimenten. Der bewegliche Spiegel (Bombe) kann nach rechts in den Strahlgang geschoben werden und
lenkt das Photon auf den Detektor. Der obere Detektor (dunkel) sollte nur Ereignisse
anzeigen, bei denen ein Hindernis im zweiten Strahlgang vorhanden ist. Der untere
Detektor zeigt an, ob das Hindernis getroffen wurde. Auf diese Weise ist der Detektor
hell“ überflüssig.
”
wird. Die Photonen treten also mit Sicherheit nach links wieder aus. Als Hindernis
im unteren Strahlgang dient ein Spiegel, der, sofern er in den Strahlengang geschoben
und von einem Photon getroffen wird, dieses auf den Detektor nach rechts ablenkt.
11.4
Das Experiment von Hong, Ou und Mandel
Der Hong-Ou-Mandel-Effekt [41] zeigt deutlich die Ununterscheidbarkeit von identischen Teilchen, in diesem Fall Photonen, sowie ihre bosonische Statistik. Es handelt
sich um ein Zwei-Photonen-Experiment an einem Strahlteiler.
γ
γ2
γ2
γ
γ2
γ1
R
@
@
R
@
@
@
R
R
@
@
γ
(1)
R
@
@
γ
(2)
R
@
@
@
R
@ γ1
γ1 (3)
@
γ1 @
@ γ2
(4)
Abbildung 11.4: Der Hong-Ou-Mandel-Effekt. Die Prozesse (3) und (4) unterscheiden
sich lediglich im Vorzeichen und sind ansonsten ununterscheidbar, daher heben sie sich
gegenseitig auf. Es werden immer nur beide Photonen im oberen oder beide im unteren
Detektor nachgewiesen, nie eines im oberen und eines im unteren.
Zwei Photonen, γ, treffen jeweils aus einem Winkel von 45◦ von oben bzw.
unten auf einen Strahlteiler. Im Prinzip kann jedes der beiden Photonen durch den
Strahlteiler abgelenkt oder auch durchgelassen werden. Bei einer Ablenkung erhält der
224
Optische Experimente zur Quantentheorie
entsprechende Zustand wieder einen Phasenfaktor von eiπ/2 = i. In klassischer Vorstellungsweise können nun vier Möglichkeiten auftreten: (1) das obere Photon wird
durchgelassen und das untere abgelenkt — beide Photonen landen also im unteren
Detektor; (2) das obere Photon wird abgelenkt und das untere durchgelassen — beide
Photonen landen also im oberen Detektor; (3) beide Photonen werden abgelenkt oder
(4) beide Photonen werden durchgelassen. Für den Nachweis sind die beiden letzteren Situationen aber ununterscheidbar, da jeweils ein Photon im oberen Detektor und
eines im unteren Detektor landen würde. Wegen der Ununterscheidbarkeit der Teilchen haben wir also die beiden Anteile von Prozess (3) und (4) zu addieren. Da aber
in Prozess (3) beide Photonen abgelenkt und damit beide eine Phasenverschiebung
von 90◦ (bzw. insgesamt einen Faktor von i2 = −1) erhalten, sind Zustand (3) und
Zustand (4) bis auf ein Vorzeichen identisch. Da sie zu addieren sind, heben sie sich
gegenseitig auf. (Würde es sich bei Photonen um Fermionen handeln, würde die Vertauschung der beiden Teilchen einen zusätzlichen Faktor (−1) liefern und die beiden
Beiträge würden sich somit addieren. Das Experiment verifiziert also gleichzeitig den
bosonischen Charakter von Photonen.)
Experimentell sollte man also im Idealfall nie ein Photon im oberen Detektor
und eines im unteren Detektor nachweisen, da zu diesem Prozess zwei Möglichkeiten
beitragen, die sich aber im Vorzeichen unterscheiden und damit aufheben. Nachgewiesen werden also immer zwei Photonen im oberen Detektor (Fall 2) oder zwei Photonen
im unteren Detektor (Fall 1).
11.5
Delayed Choice Experimente
Unter Delayed-Choice“–Experimenten versteht man allgemein eine Klasse von Ex”
perimenten, bei denen die Entscheidung, welche von (zwei oder mehreren) komplementären Eigenschaften an einem Quantensystem gemessen wird, erst gefällt wird,
wenn der entscheidende Quantenprozess bereits stattgefunden hat.
Der Begriff wurde ursprünglich von John A. Wheeler (1911–2008) geprägt und
bezog sich auf eine besondere Version des Doppelspaltexperiments. Wir wissen, dass
die Verteilung von sehr vielen Teilchen (beispielsweise von Photonen) hinter einem
Doppelspalt zu einem Interferenzmuster führt, das wir nur erklären können, wenn wir
Photonen durch eine Welle beschreiben, die durch beide Spalte getreten ist. Andererseits können wir hinter den Doppelspalt auch eine Linse und hinter dieser Linse in der
Bildebene zum Doppelspalt zwei Detektoren aufstellen. In einem solchen Fall erwarten
wir, dass der Detektor, in dem ein Photon nachgewiesen wird, anzeigt, ob das Photon
durch den linken oder den rechten Spalt getreten ist.
Wheelers Idee war, dass wir die Entscheidung, ob wir eine photographische
Platte zur Messung des Interferenzmusters oder aber die Linse mit den Detektoren
Der Quantum-Eraser
225
2
` `
a
!
` `
!
` ` a !
a
` ` a
!
` `
a
!
1
Doppelspalt
Linse
1
Detektoren in der Bildebene
der beiden Spalte
2
Bildebene
Abbildung 11.5: Optische Apparatur zur Messung des Spalts, durch den ein Photon
getreten ist.
zum Nachweis des Spalts, durch den das Photon getreten ist, benützen, erst dann
fällen, wenn das Photon den Doppelspalt bereits passiert hat. Wir können zwar nicht
sowohl das Interferenzmuster messen als auch den Durchtrittspalt bestimmen, aber
zumindest kann man auf diese Weise Theorien ausschließen, bei denen das Photon
vielleicht schon vorher weiß“, welche Messung hinter dem Spalt vorgenommen wird
”
und sich entsprechend bei seinem Durchtritt durch den Spalt als Teilchen oder als
Welle verhält.
Wheeler fand sogar eine kosmische“ Version seines Experiments: Angenommen,
”
ein Quasar in einem Abstand von einigen Milliarden Lichtjahren sendet Licht aus, das
wir hier auf der Erde empfangen können. Zwischen dem Quasar und der Erde befindet
sich ein Galaxiencluster, dessen Gravitationsfeld als optische Linse wirkt, d.h., der das
Licht ablenkt wie an einer Linse. Theoretisch können wir auf der Erde mit dem Licht
des Quasars Interferenzexperimente durchführen, die zeigen, dass das Licht auf beiden
”
Seiten“ des Galaxienclusters vorbeigeflogen ist. Andererseits können wir Experimente
vornehmen, die diese Flugrichtung des Lichts messen. Auf diese Weise können wir
(im Prinzip) noch nach Milliarden Jahren die Entscheidung fällen, ob wir den Weg
eines Photons rekonstruieren wollen oder ob das Photon an Interferenzexperimenten
teilnehmen soll, zu deren Erklärung ein solcher Weg nicht angenommen werden darf.
In der Praxis ist ein solches Experiment natürlich beliebig schwierig bis unmöglich. Die Kohärenzlänge typischer Photonen liegt im Bereich von einigen Metern.
Wir würden also nur dann ein Interferenzmuster beobachten, wenn sich die unterschiedlichen Wege um bzw. durch die Gravitationslinse in ihrer optischen Weglänge
nur im Meterbereich unterscheiden.
11.6
Der Quantum-Eraser
Es gibt viele Versionen des Quantum-Erasers ( Quantenradierer“). Die folgende Dar”
stellung lehnt sich eng an die ursprünglichen Arbeiten von Scully et al. [69, 73] an.
Ganz allgemein handelt es sich bei Quantum-Erasern um eine Klasse von de”
226
Optische Experimente zur Quantentheorie
APolarisationsdetektor 1
(|h/vi oder |±i)
A
A
A
Photonenquelle
|γi
-
*
|2γiEPR
BBO H
HH
λ/4-Plättchen
HH
jH λ−H
H 4 H H
λ+ Doppelspalt 4 H H
H
Polarisationsdetektor 2
H
H (z.B. |L, Ri)
Abbildung 11.6: Aufbau eines Quantum Erasers“. Photonen aus einer Photonenquelle
”
treffen auf einen BBO-Kristall, der zwei im EPR-Zustand verschränkte Photonen der
halben Energie erzeugt. Eines der Photonen trifft auf einen Doppelspalt, hinter dem
λ/4-Plättchen eine Markierung“ eines Photons ermöglichen, durch welchen Spalt es
”
getreten ist.
layed choice“ 2-Wege-Experimenten, bei denen zunächst die Information über den
Weg eines Teilchens (im Folgenden immer Photonen) prinzipiell vorhanden ist und
somit kein Interferenzmuster gemessen wird. Wird diese Information aber unwiderruflich gelöscht“, lässt sich das Interferenzmuster beobachten bzw. zurückgewinnen.
”
Diese zunächst überraschende Tatsache hängt damit zusammen, dass man durch das
Löschen der which path“–Information eine andere Information erhält, welche die Pho”
tonen (von denen man nun nicht weiß, durch welchen Spalt sie getreten sind) in zwei
Klassen einteilt. Innerhalb jeder Klasse beobachtet man das Interferenzmuster, allerdings sind die Interferenzmuster zu den beiden Klassen um eine halbe Wellenlänge
verschoben, sodass ihre Summe keine Interferenz zeigt.
Abbildung 11.6 zeigt eine typische Quantum-Eraser Anordnung. Aus einer Photonenquelle treffen Photonen auf einen BBO-Kristall (siehe Abschnitt 11.1.5), wo
durch eine down-conversion zwei verschränkte Photonen der halben Energie erzeugt
werden. Eines der Photonen (in der Abbildung oben) trifft auf einen Polarisationsdetektor (1), d.h., einen Polarisationsstrahlteiler, hinter dessen beiden Strahlgängen
Detektoren stehen, sodass wir die Polarisation des Photons bezüglich einer voreingestellten Basis (beispielsweise horizontal/vertikal — |hi und |vi — oder ±45◦ — d.h.
|+i und |−i) messen können. Dieser Strahlteiler kann auch sehr weit hinter der Apparatur stehen, d.h. die entsprechende Information über das Photon kann (theoretisch)
noch nach Jahren eingeholt werden.
Das zweite Photon trifft auf einen Doppelspalt, hinter dessen beiden Spalten
Der Quantum-Eraser
227
zwei λ/4-Plättchen angebracht sind, deren schnelle“ Achsen orthogonal zueinander
”
sind. Die Eigenachsen der Plättchen seien wie in Abschnitt 11.1.4 gewählt. Das bedeutet, Photonen, die bezüglich der + oder −45◦ -Achse polarisiert sind (also im Zustand
|+i oder |−i), erfahren durch die λ/4-Plättchen keine Änderung ihres Polarisationszustandes sondern lediglich (je nach Spalt) eine Phasenverschiebung. Solche Photonen
erzeugen also ein Interferenzmuster an der Stelle des Detektors, allerdings sind die
beiden Interferenzmuster von |+i bzw. |−i um eine halbe Wellenlänge relativ zueinander verschoben (die Phasendifferenz hinter dem rechtem und linkem Spalt ist bei |+i
gleich +π/2 und bei |−i gleich −π/2). Die Summe dieser beiden Interferenzmuster
ergibt eine breite, unstrukturierte Verteilung ohne Interferenzanzeichen.
Wir können nun entscheiden, ob wir die Information über den Spalt, durch den
ein Photon getreten ist, messen wollen oder nicht. Wenn wir für das erste Photon
die Basis des Polarisationsdetektors 1 auf |hi bzw. |vi einstellen, ist auch das zweite
Photon, das durch den Spalt tritt, in dieser Basis polarisiert. Die λ/4-Plättchen machen
aus dieser Polarisation (die wegen der Messung an dem anderen Photon bekannt ist)
eine zirkulare Polarisation, und zwar in entgegengesetzter Richtung für den rechten
und linken Spalt. Misst man bei dem Detektor hinter dem Spalt also die zirkulare
Polarisation (und man weiß, in welchem Zustand sich das Photon vor Eintritt in den
Doppelspalt befand), so kann man von jedem Photon angeben, durch welchen Spalt es
getreten ist. Die which-path“-Information ist also vorhanden. Die Photonen werden
”
in diesem Fall kein Interferenzmuster hinter dem Doppelspalt zeigen.
Da die Messung an Photon 1 (oben) erst sehr spät erfolgen kann (theoretisch
Jahre später), erhält man dieses Ergebnis (kein Interferenzmuster) auch, wenn Photon
1 zunächst gar nicht gemessen wird. Also auch wenn der Zustand von Photon 2 unbekannt ist, ergibt sich kein Interferenzmuster in der Photonenverteilung bei Detektor 2.
Die Messung der zirkularen Polarisation lässt ohne weitere Information allerdings keinen Rückschluss auf den Spalt zu, durch den ein Photon getreten ist, da beispielsweise
ein Photon im Zustand |hi beim Nachweis einer Rechtszirkulation durch den rechten Spalt getreten ist, ein Photon im Zustand |vi beim Nachweis derselben zirkularen
Polarisation aber durch den linken Spalt.
Angenommen, wir messen an Detektor 1 (möglicherweise wieder Jahre“ später)
”
nicht die Polarisation bezüglich h und v sondern bezüglich der Basis + bzw. −. Dann
wissen wir auch, welche Photonen, die bei Detektor 2 gemessen wurden, vor ihrem
Eintritt in den Doppelspalt im Zustand |+i bzw. |−i waren. In diesem Fall ist die
which-path“-Information endgültig verloren. Doch nun können wir die Ereignisse, die
”
von Detektor 2 aufgenommen wurden, hinsichtlich der Zustände + bzw. − nachträglich
trennen (wir sortieren also den gesamten Datensatz nachträglich entsprechend der gewonnenen Information in zwei Klassen). In jeder der so gewonnenen Klassen finden
wir nun das Interferenzmuster, denn für jede dieser Klassen ist die which-path“”
228
Optische Experimente zur Quantentheorie
Information gelöscht. Auf diese Weise können wir nachträglich die Interferenzmuster
sichtbar machen. Da die beiden Interferenzmuster zu den beiden Klassen von Ereignissen jedoch um eine halbe Wellenlänge relativ zueinander verschoben sind, ist ihre
Summe eine breite Verteilung ohne Interferenzstreifen.
Abbildung 11.7 fasst diese Situation nochmals in stilisierter Form zusammen.
Teil (a) zeigt die gemessene zirkulare Polarisation der Photonen, nachdem sie durch
den Doppelspalt mit den λ/4-Plättchen getreten sind. Die Verteilung der R- bzw. Lzirkular polarisierten Photonen ist zufällig und zeigt keinerlei Interferenz. Entscheiden
wir uns, an dem Detektor für Photon (1) die h/v-Polarisation zu messen, kennen wir
die h/v-Polarisation der Photonen in Strahl 2, bevor sie auf den Doppelspalt getreten
sind (Abb. 11.7 (b)). Aus diesen beiden Informationen können wir den Spalt bestimmen, durch den jedes einzelne Photon getreten ist. Hatte ein Photon vor dem Spalt eine
h-Polarisation und wurde es nach dem Spalt mit einer R-Polarisation gemessen, wissen
wir, dass das entsprechende Photon durch den rechten Spalt getreten ist (entsprechend
bei einer L-Polarisation durch den linken Spalt). War es vorher v-polarisiert, ist die
Situation umgekehrt (Abb. 11.7 (c)). Man beachte, dass erst beide Informationen zusammengenommen (h/v-Polarisation vor dem Spalt und R/L-Polarisation hinter dem
Spalt) die Which path“-Information liefern.
”
Wird jedoch an Photon (1) die Polarisation bezüglich einer +/−-Basis gemessen, ändern die λ/4-Plättchen die Polarisation nicht und wir erhalten aus einer Messung der L/R-Polarisation hinter dem Spalt keine Which path“-Information. Statt
”
dessen zeigen sowohl die +- als auch die −-polarisierten Photonen ein Interferenzmuster (Abb. 11.7 (d)), die jedoch gegeneinander um eine halbe Interferenzbreite verschoben sind, sodass die Gesamtmenge aller Photonen eine interferenzfreie Verteilung
hat.
Der Quantum-Eraser
a)
b)
c)
d)
229
L
R
L
R
L
L
R
R
L
L
R
L
R
L
L
R
R
L
R
R
L
R
L
L
R
L
R
L
L
L
R
R
R
L
R
R
R
R
L
L
L
R
L
L
L
R
R
R
R
R
L
R
R
L
L
L
L
R
L
R
R
L
R
v
v
h
h
h
v
v
v
v
v
h
h
v
h
v
v
v
v
v
h
h
h
v
v
h
h
h
h
h
v
h
v
v
v
v
v
h
v
h
h
v
h
h
h
v
v
v
h
v
h
v
h
h
h
v
h
h
h
v
h
h
h
v
r
l
l
r
l
r
l
l
r
r
r
l
l
l
r
l
l
r
l
r
l
r
r
r
r
l
r
l
l
r
r
l
l
r
l
l
r
l
l
l
r
r
l
l
r
l
l
r
l
r
r
r
r
l
r
l
l
r
r
r
r
l
l
+
+
+
−
−
−
+
+
+
−
−
−
+
+
+
−
−
−
+
+
+
+
+
+
−
−
−
+
+
+
−
−
−
+
+
+
−
−
−
+
+
+
+
+
+
−
−
−
+
+
+
−
−
−
+
+
+
−
−
−
+
+
+
Abbildung 11.7: Stilisierte Darstellung der möglichen Ereignisse beim QuantenRadierer.
(a) Gemessene Daten in Detektor 2 (hinter dem Doppelspalt) – R, L steht für rechtsbzw. linkszirkulare Polarisation.
(b) Wird der Polarisationsmesser an Strahl 1 auf eine h/v-Basis eingestellt, kennt man
auch die h/v-Polarisation der Photonen in Strahl 2, bevor sie durch den Spalt treten.
(c) Aus der Kenntnis der h/v-Polarisation der Photonen vor dem Doppelspalt sowie ihrer zirkularen Polarisation hinter dem Doppelspalt erhält man die Information, durch
welchen Spalt jedes der Photonen getreten ist.
(d) Stellt man den Polarisationsmesser in Strahl 1 auf eine +/−-Basis ein, verliert
man die Information über den Spalt, durch den die Photonen in Strahl 2 getreten
sind. Sowohl die +-polarisierten Photonen als auch die −-polarisierten Photonen zeigen ein Interferenzmuster, die jedoch gegeneinander um eine halbe Interferenzbreite
verschoben sind.
230
Optische Experimente zur Quantentheorie
Kapitel 12
Nochmals Photonenpolarisation
In diesem Kapitel sollen nochmals die Zusammenhänge mit der Polarisation von Photonen aus Kap. 2 aufgegriffen werden, nun unter den Aspekten, die wir in den vergangenen Kapiteln behandelt haben. Insbesondere könnte sich hier eine Möglichkeit
bieten, Grundfragen der Quantenmechanik an einem einfachen, bis zu einem gewissen
Grad in der Schule behandelbaren Beispielsystem anzugehen.
Wir werden zunächst anhand der planaren Polarisation von Photonen nochmals
die Axiome sowie einige fundamentale Begriffe der Quantenmechanik wiederholen. Anschließend wird gezeigt, dass man schon bei reinen Polarisationsfreiheitsgeraden nicht
um die Einführung der komplexen Zahlen herumkommt (es sei denn, man erkauft sich
einen sehr komplizierten mathematischen Formalismus zur Beschreibung der zirkularen Polarisationen).
12.1
Zusammenfassung des Bekannten
Wir beginnen mit den Axiomen der Quantenmechanik und zeigen, dass diese eine
natürliche Deutung im Zusammenhang mit linearen Polarisationen haben.
1. Zustand: Zustände werden durch 1-dimensionale Teilräume eines Hilbertraums
dargestellt.
Die linearen Polarisationen lassen sich durch Richtungen in einer Ebene kennzeichnen, und damit ist dieses Axiom unmittelbar anschaulich. Es zeigt auch
deutlich, weshalb ein (normierter) Vektor nur ein Repräsentant sein kann, denn
ein Einheitsvektor ~e und sein Negatives −~e definieren dieselbe Polarisationsrichtung.
2. Observable: Observable werden durch selbst-adjungierte Operatoren (Matrizen) dargestellt.
231
232
Nochmals Photonenpolarisation
Eine selbst-adjungierte Matrix zeichnet ein Orthogonalsystem von Richtungen
aus. Genau dies ist auch bei einem Polarisationsstrahlteiler der Fall. Die Beziehung zwischen den Eigenwerten und den Messwerten ist zunächst nicht offensichtlich. Erst wenn wir die Polarisationsrichtungen mit Drehimpulskomponenten
identifizieren (die auch mit dem Bahndrehimpuls beispielsweise von Elektronen
wechselwirken können) erhalten die Messwerte eine physikalische Bedeutung.
Relevant bleibt aber, dass jede Messung“ ein Orthogonalsystem von möglichen
”
Zuständen auszeichnet, und ein System durch den Messprozess in einen dieser
Zustände gezwängt wird (die Schrödinger’sche Prokrustie“). Zusammen mit den
”
möglichen Messwerten kodiert in diesem Sinne eine selbstadjungierte Matrix die
Information, die in einer Messung erhalten ist.
3. Messwerte und Wahrscheinlichkeiten: Die Eigenwerte einer selbst-adjungierten Matrix entsprechen den möglichen Messwerten. Die Wahrscheinlichkeit
für das Auftreten eines Messwerts β bei einer Messung im Zustand |αi ist gleich
|hβ|αi|2 = cos2 (α − β).
Wir hatten schon erwähnt, dass die Zuweisung von Messwerten zu den möglichen
Polarisationsrichtungen eines Strahlteilers willkürlich ist. Eine physikalische Zuordnung erhalten wir erst, wenn wir den Drehimpuls messen, der durch das
Photon auf den Strahlteiler übertragen wird. Dies ist zwar bei einem makroskopischen Strahlteiler nicht möglich, aber bei Wechselwirkungen mit Elementarteilchen kann man entsprechende Effekte beobachten.
Die Wahrscheinlichkeiten ergeben sich aus den bekannten Gesetzen bei der Polarisation von Licht: Das Skalarprodukt der Einheitsvektoren |αi = ~eα (der die
Polarisation eines präparierten Lichtstrahls angibt) und ~eβ (der die Polarisationsrichtung eines Filters bzw. einer Achse des Strahlteilers angibt) entspricht
der neuen Amplitude und deren Quadarat ist gleich der Intensität. Diese wird
aber bei Einzelphotonen zu einer Wahrscheinlichkeit.
4. Kollapspostulat: Nach einer Messung mit Messwert β liegt der Eigenzustand
|βi der Observablen zu diesem Messwert vor.
Auch dies entspricht den Erfahrungen bei Polarisationsfiltern bzw. Strahlteilern:
Licht hat nach dem Passieren eines Filters genau die von dem Filter vorgegebene
Polarisation. Erst diese Erfahrungstatsache erlaubte es uns, im Zusammenhang
mit der Polarisation von einer Eigenschaft“ zu sprechen.
”
5. Schrödinger-Gleichung: Die zeitliche Entwicklung eines reinen Quantenzustands erfolgt nach einer Schrödinger-Gleichung.
Zusammenfassung des Bekannten
233
Da die Polarisation von Licht im Vakuum eine Erhaltungsgröße ist, findet gewöhnlich nur eine triviale Zeitentwicklung statt, d.h., die Polarisation ändert sich
nicht (H = 0). Es gibt jedoch Kristalle, welche die Polarisationsachse drehen.
Breitet sich linear polarisiertes Licht in einem solchen Kristall aus, erfolgt eine Drehung der Polarisationsachse mit zeitlich konstanter Drehgeschwindigkeit.
Die Wirkung eines solchen Kristalls lässt sich also durch eine Drehmatrix R(α)
charakterisieren, wobei der Drehwinkel α proportional zur Strecke (und damit
zu der Zeit) ist, die der Strahl innerhalb des Kristalls zurückgelegt hat. Diese
pro Zeiteinheit konstante Drehung lässt sich durch eine Schrödinger-Gleichung
beschreiben.
Wir können noch weitere fundamentale Begriffe anhand der Polarisation verdeutlichen:
- Komplementarität:
Die kanonischen Vertauschungsrelationen lassen sich nicht in endlich dimensionalen Vektorräumen realisieren. Aber man kann die Komplementariät von zwei
Observablen auch so definieren, dass ihre Eigenrichtungen maximal verschieden
sein sollen. Dies lässt sich geometrisch genauer definieren, aber in der Ebene bedeutet es, dass zwei Orthonormalsysteme unter einem Winkel von 45◦ zueinander stehen. In diesem Sinne definieren zwei unter 45◦ ausgerichtete Polarisationsstrahlteiler – beispielsweise einmal in h/v-Richtung und einmal in p/m-Richtung
– komplementäre Eigenschaften.
- Unbestimmtheitsrelationen:
Wir betrachten die beiden oben definierten komplementären Strahlteileranordnungen (h/v und p/m). Ist ein Strahl bezüglich der Achsen h/v polarisiert,
ist die Unschärfe“ in Bezug auf diese Richtungen null. Bezüglich der p/m”
Richtungen misst man für solche Strahlen aber eine maximale Unschärfe (statistisch gleichmäßig verteilte Werte).
Die beiden Observablen zu h/v- und p/m-Polarisationsstrahlteilern kommutieren
nicht. Das Gleiche gilt für die Projektionsmatrizen:
!
!
1 0
0 0
Ph =
, Pv =
(12.1)
0 0
0 1
!
!
1 −1
1
1 1 1
, Pm =
.
(12.2)
Pp =
2 1 1
2 −1 1
Kompatible“ Größen kommutieren:
”
[Ph , Pv ] = 0 , [Pp , Pm ] = 0 ,
(12.3)
234
Nochmals Photonenpolarisation
wohingegen komplementäre Größen nicht kommutieren:
[Ph , Pp ] 6= 0 , [Ph , Pm ] 6= 0 , [Pv , Pp ] 6= 0 , [Pv , Pm ] 6= 0 .
(12.4)
Es ist auch offensichtlich, dass einem Photon, das die Eigenschaft der h/vPolarisierung hat (also entweder h oder v), die Eigenschaft p oder m überhaupt
nicht zukommt. Es ist keine Unkenntnis, die bezüglich dieser Eigenschaften vorliegt, sondern es macht gar keinen Sinn, in diesem Fall von einer p/m-Eigenschaft
zu sprechen.
- Superpositionen:
Wir können uns jede Polarisation als Superposition von zwei Anteilen bezüglich
orthogonaler Achsen denken. Wie wir in Kapitel 2.3.3 gesehen haben, können
wir eine solche Zerlegung mit einem Polarisationsstrahlteiler explizit realisieren.
Und wir können die beiden Anteile auch wieder (durch einen zweiten Polarisationsstrahlteiler) addieren“ und erhalten auf diese Weise den ursprünglichen
”
Zustand zurück.
12.2
Der (inverse) Quanten-Zenon-Effekt
Bisher haben wir mit dem Polarisationsstrahlteiler und dem Polarisationsfilter zwei Instrumente kennengelernt, mit denen wir einen Strahl beeinflussen können. Wir hatten
zwar schon erwähnt, dass es Kristalle gibt, welche die Polarisationsrichtung eines Lichtstrahls und entsprechend auch eines einzelnen Photons drehen können, wir werden nun
aber zeigen, dass dies auch mit dem Instrument des gewöhnlichen Polarisationsfilters
möglich ist.
-
- XXX - HH - · · · · · ·
H
C
Detektor
C
C
Abbildung 12.1: Der inverse Quanten-Zenon-Effekt für Polarisationsfreiheitsgrade. Ein
polarisierter Lichtstrahl trifft auf eine Folge von N + 1 Polarisationsfiltern, die jeweils
um einen Winkel α/N zueinander gedreht sind. Die von der Anordnung durchgelassene
Intensität nähert sich für große Werte von N der Eingangsintensität, die Eingangspolarisation wurde jedoch um den Winkel α gedreht.
Dazu wählen wir N + 1 Polarisationsfilter, die wir so hintereinander aufstellen,
dass zwischen je zwei benachbarten Filtern die Polarisationsachse um einen Winkel
von α/N gedreht ist (Abb. 12.1). Der erste Filter habe dieselbe Polarisationsrichtung
Der (inverse) Quanten-Zenon-Effekt
235
wie ein einfallender Strahl (oder ein einfallendes Photon). Der letzte Filter ist dann
um den Winkel α zur einfallenden Richtung gedreht. Wir wollen nun untersuchen,
welche Intensität If durch diese Anordnung hindurchtritt, wenn I0 die Intensität eines
einfallenden Strahls ist.
Bei jedem Filter (außer dem ersten, der die Polarisationsrichtung des einfallenden Strahls hat) wird die Intensität um einen Faktor cos2 (α/N ) geringer. Insgesamt
haben wir somit eine durchgelassene (relative) Intensität von
If
= (cos2 α/N )N = exp(2N ln(cos(α/N ))) .
I0
(12.5)
Wir sind an dem Verhalten für große Werte von N interessiert. Mit den beiden
Näherungen
N
If /I0
α2
cos(α/N ) = 1 −
+ O(1/N 4 )
(12.6)
2
0.25
2N 2
3
0.42
und
4
0.53
ln(1 − ) = − + O(1/2 )
(12.7)
erhalten wir:
If
α2
2
≈ exp − + O(1/N ) .
I0
N
(12.8)
5
0.61
10
0.78
100
0.976
1000
0.998
Für sehr große Werte von N wird dieser Faktor nahezu 1. Die Tabelle auf der rechten
Seite zeigt die entsprechenden Werte für α = 90◦ . Es tritt also paktisch kein Intensitätsverlust mehr auf, bzw., durch einen ausreichend großen Wert von N können wir
den Intensitätsverlust beliebig gering halten.
Durch eine solche Anordnung können wir also eine gegebene Polarisationsrichtung effektiv um einen Winkel α drehen. Man bezeichnet diesen Effekt manchmal
als eine spezielle Realisation des inversen Quanten-Zenon-Effekts“. Er ist ein Beispiel
”
dafür, wie man durch eine besondere Abfolge von Wechselwirkungen mit einem Mess”
instrument“ (allgemeiner mit einer Umgebung“) den Quantenzustand eines Systems
”
gezielt beeinflussen kann.
Übrigens kann man mit einer ähnlichen Anordnung auch die Richtung eines
beliebig polarisierten Strahls um einen vorgegebenen Winkel drehen: Dazu ersetzen
wir die Filter durch Polarisationsstrahlteiler, deren Achsen jeweils um kleine Winkel
zueinander gedreht sind. Nun wird die Polarisationsrichtung eines beliebig polarisierten
einfallenden Strahls gedreht.
Zur Begründung des Namens betrachten wir zunächst den direkten QuantenZenon-Effekt. Dieser bezieht sich auf ein System, dessen natürliche Zeitentwicklung
in einer Rotation im Zustandsraum besteht und das durch wiederholte Messungen an
236
Nochmals Photonenpolarisation
dieser Rotation gehindert wird. Als Beispiel betrachten wir einen polarisierten Lichtstrahl in einem Medium, das die Polarisation des Lichtstrahls dreht. Dies realisieren
wir durch N hintereinandergestellte Kristalle, welche die Polarisationsachse jeweils
um den Winkel α/N drehen (Abb. 12.2 a). Zwischen die Kristalle stellen wir insgesamt N + 1 Polarisationsfilter auf, die nun aber alle dieselbe Polarisationsachse wie
der einfallende Lichtstrahl haben (Abb. 12.2 b).
-
α
N
α
N
α
N
······
α
N
······
α
N
α
N
-
Detektor
α
N
Detektor
(a)
-
(b)
α
N
α
N
α
N
Abbildung 12.2: Der (direkte) Quanten-Zenon-Effekt für Polarisationsfreiheitsgrade.
Ein polarisierter Lichtstrahl trifft auf eine Folge von N Kristallen, welche die Polarisationsachse jeweils um den Winkel α/N drehen. (a) Ohne eingeschobene Polarisationsfilter ist die Polarisationsrichtung des Strahls schließlich um den Winkel α gedreht.
(b) Mit eingeschobenen Polarisationsfiltern dreht sich die Polarisationsachse nicht und
für große Werte von N bleibt die Eingangsintensität nahezu erhalten.
Ohne die Polarisationsfilter würde sich der Strahl um den Winkel α drehen.
Doch mit den Polarisationsfiltern zeigt die entsprechende Rechnung wie oben, dass der
Strahl nicht gedreht wird und seine Intensitätsminderung durch einen genügend großen
Wert von N (und damit beliebig häufige Messungen) beliebig klein gemacht werden
kann. Mit den Polarisationsfiltern wird die Polarisation des Strahls somit eingefroren“,
”
es findet keine Drehung mehr statt.
Die Bezeichnung Quanten-Zenon-Effekt“ leitet sich von dem klassischen Ze”
non’schen Paradoxon her. Im Zusammenhang mit einem fliegenden Pfeil hatte Zenon
von Elea (um 495–430 v. Chr.) sich die Frage gestellt: Wenn der Pfeil zu jedem Zeitpunkt an einem bestimmten Ort ist, wann bewegt er sich dann von einem Ort zu einem
anderen? Zenon wollte durch solche Argumente beweisen, dass es keine Bewegung geben kann (bzw. dass jede Form von Bewegung oder Veränderung nur ein trügerischer
Schein ist). Bei der Messung von Quantensystemen kann es allerdings tatsächlich passieren, dass eine genügend rasche und intensive Beobachtung“ eines Systems den
”
Zustand des Systems einfriert“ und keine Bewegung mehr stattfindet. Dies ist dann
”
der Quanten-Zenon-Effekt.
Allgemeiner spricht man in der Physik oft vom Zenon-Bereich“, wenn ein
”
Quantensystem eine derart intensive Wechselwirkung mit seiner Umgebung hat, dass
Zirkulare Polarisationen
237
seine natürliche Dynamik davon vollkommen unterdrückt wird und ihm statt dessen
eine Dynamik aufgezwungen wird, die durch die Wechselwirkung mit der Umgebung
bestimmt ist.
12.3
Zirkulare Polarisationen
Detektor
Bisher sind wir zur Beschreibung der linearen Polarisationen mit einem reellen Vektorraum ausgekommen. In diesem Abschnitt werden wir sehen, dass dieser reelle Vektorraum nicht ausreicht, sondern dass wir mit einer einfachen Variante des Superpositi”
onsexperiments“ aus Abschnitt 2.3.3 um die komplexen Zahlen nicht herumkommen.
Wir betrachten nochmals den experimentellen Aufbau zur Superposition aus
Kapitel 2.3.3, d.h. die Zerlegung und Wiederzusammensetzung eines Strahls, (siehe
Abb. 12.3). Diesmal soll der einfallende Strahl unter +45◦ polarisiert sein. In beiden
Teilstrahlen befindet sich somit die Hälfte der Intensität. Bei Einzelphotonen würde
bei einer Messung in der Hälfte der Fälle das Photon im oberen bzw. im unteren
Strahlengang nachgewiesen.
h6
6
-
v
6
+45◦
6
Abbildung 12.3: Photonen treffen
mit einer Polarisation von +45◦ auf
6
einen h/v-Strahlteiler und werden
α
später wieder von einem entspre
chenden Strahlteiler zusammen6
geführt. Mit einem drehbaren Polarisationsfilter kann man untersuchen, für welchen Winkel α die maximale Intensität gemessen wird.
Bei gleichen Wegstrecken für die
beiden Strahlgänge ist das für
α = +45◦ der Fall und wir erhalten wieder den ursprünglichen
Polarisationszustand.
Den Polarisationsfilter hinter der Anordnung können wir frei drehen und auf
diese Weise den Winkel α bestimmen, bei dem die höchste Intensität bzw. die meisten
Photonen im Detektor nachgewiesen werden. Dies ist bei gleichen Weglängen für die
beiden Strahlengänge bei +45◦ der Fall.
238
Nochmals Photonenpolarisation
∆x = 2l
- @
? 6
l
@
(a)
∆x = (n − 1)d
-
(b)
∆x
-
-
d
-
(c)
Abbildung 12.4: Eine Beeinflussung der optischen Weglänge lässt sich theoretisch (a)
durch variable Spiegel erreichen, (b) oft nimmt man aber auch optisch dichtere Kristalle
(Brechungsindex n) einer bestimmten Dicke d. (c) Im Folgenden verwenden wir in
Skizzen das Umwegsymbol“, wobei ∆x die zusätzliche optische Weglänge angibt.
”
Abbildung 12.5: Wie in Abb. 12.3
treffen Photonen mit einer Polarisation von +45◦ auf einen
h/v-Strahlteiler und werden später
wieder von einem entsprechenden
Strahlteiler zusammengeführt. Nun
wird der eine Strahlengang jedoch um ∆x verlängert. Mit dem
drehbaren Polarisationsfilter kann
man wiederum die Intensitäten in
Abhängigkeit von dessen Achse α
messen. Ohne diesen Filter findet
man in dem Detektor die volle Intensität.
Detektor
Nun verändern wir in einem der beiden Strahlengänge die optische Weglänge.
Dies kann man theoretisch durch eine Umlenkung des Strahls durch entsprechende
Spiegel erreichen (vgl. Abb. 12.4), was allerdings wegen der kurzen Wellenlängen von
sichtbarem Licht unpraktikabel ist. Meist verwendet man präzise geschliffene Kristalle
mit einem erhöhten optischen Brechungsindex.
6
α
6
h-
-
6
6
-
v
∆x
6
+45◦
6
Je nach Wahl von ∆x und dem Winkel α für den Polarisationsfilter vor dem
Detektor finden wir folgendes Verhalten:
- Für α = 45◦ beobachten wir eine periodische Intensitätsschwankung als Funktion
Zirkulare Polarisationen
von ∆x:
239
∆x
I ∝ cos π
λ
2
(12.9)
Ist ∆x ein ganzzahliges Vielfaches von λ (der Wellenlänge des Lichts, die bisher
bei unseren Betrachtungen noch nie eine Rolle gespielt hat), ist die Intensität
wieder maximal und somit die Polarisation des resultierenden Strahls wieder
linear um +45◦ geneigt. Theoretisch kann man auf diese Weise eine Messung der
Wellenlänge vornehmen.
- Für α = +45◦ und ∆x = λ(n + 21 ) verschwindet die gemessene Intensität. Allerdings messen wir nun die maximale Intenstiät bei einer Richtung des Polarisationsfilters von α = −45◦ . Wir erhalten also linear polarisiertes Licht mit einer
um 90◦ gedrehten Polarisationsachse.
- Für andere Werte von ∆x gibt es keinen Winkel α, für den die maximale Intensität gemessen wird. Das Licht besitzt also keine lineare Polarisationsachse.
Trotzdem handelt es sich immer noch um einen reinen Zustand und nicht um
ein Gemisch aus linearen Polarisationen. Dies kann man experimentell testen,
indem man den Strahl ein zweites Mal durch eine solche Strahlanordnung mit
zwei h/v Strahlteilern schickt und diesmal in den horizontalen Strahlengang
die zusätzliche optische Wegstrecke ∆x einbaut. Nun zeigt eine abschließende
Messung wieder eine (reine) lineare Polarisation von +45◦ .
- Der Vollständigkeit halber fassen wir noch weitere Informationen zusammen:
Wird das Photon im unteren Strahlengang gemessen, hat es immer eine vPolarisation (befindet sich also in einem |vi Zustand) unabhängig von ∆x. Ebenso bleibt die relative Häufigkeit im unteren Strahlengang ein Photon zu messen
durch die Weglängenänderung unbeeinflusst.
Die nächstliegende Lösung zur Beschreibung des neuen Zustands besteht in
folgender Veränderung: Der Zustand bleibt eine Superposition von |hi und |vi; die
relative Intensität (Betrag der beiden Amplituden) bleibt unverändert; die Amplitude
von |vi beschreibt eine periodische Veränderung in ∆x mit Periode λ. Damit erhalten
wir für den Zustand hinter dem zweiten Strahlteiler:
1
∆x
|ψi = √ |hi + exp 2πi
|vi
(12.10)
λ
2
Mit dieser Darstellung des Zustands können wir alle Erscheinungen beschreiben:
- Ist ∆x ein ganzzahliges Vielfaches von λ erhalten wir wieder den Zustand |pi ≡
| + 45◦ i.
240
Nochmals Photonenpolarisation
- Unterscheidet sich ∆x um eine halbe Wellenlänge von λ, erhalten wir den Zustand
1
| − 45◦ i ≡ |mi = √ (|hi − |vi) .
(12.11)
2
- Für andere Werte von ∆x erhalten wir keine lineare Polarisation, trotzdem bleibt
|ψi ein reiner Zustand. Durch eine entsprechende Korrektur in der Weglänge des
horizontal polarisierten Strahls können wir den Effekt rückgängig machen.
- Der v-Teilstrahl bleibt vertikal polarisiert und die relativen Häufigkeiten, mit denen Photonen in den beiden Teilstrahlen gemessen werden, ändern sich ebenfalls
nicht.
Unterscheidet sich ∆x von λ nur um ein Viertel der Wellenlänge, erhalten wir je nach
Vorzeichen Licht mit einer reinen rechts- bzw. linkszirkularen Polarisation:
1
1
(12.12)
|Li = √ (|hi − i|vi) und |Ri = √ (|hi + i|vi) .
2
2
Durch die Möglichkeit, zwischen zwei Superpositionen eine relative Phase bzw. einen
Gangunterschied einzuschieben, gelangen wir zu (teilweise) zirkular polarisiertem Licht.
Damit können wir es praktisch nicht vermeiden, zur Beschreibung des vollständigen
Zustandsraums auch komplexe Zahlen zuzulassen. Der Raum der möglichen Zustände
entspricht also den 1-dimensionalen Strahlen eines komplexen 2-dimensionalen Vektorraums. Ein gemeinsamer Phasenfaktor in beiden Komponenten lässt sich nicht beobachten; er entspricht einer gleichen optischen Wegänderung in beiden Strahlengängen.
Physikalisch relevant ist nur ein relativer Phasenfaktor zwischen beiden Komponenten.
Einen möglichen Repräsentant eines allgemeinen Zustands erhalten wir durch
eine Drehung des Zustands aus Gl. 12.10 um einen Winkel α:
!
cos α + eiϕ sin α
1
|ψi = √
mit α ∈ [−90◦ , +90◦ ) , ϕ ∈ [−π, +π) .
2 − sin α + eiϕ cos α
(12.13)
Die Projektion dieser Polarisation auf die Ebene senkrecht zur Ausbreitungsrichtung
des Strahls entspricht nun einer Ellipse: Die Längen der beiden Halbachsen sind a =
cos( ϕ2 ) und b = | sin( ϕ2 )|. (Für ϕ ∈ [0, π] erhält man eine rechtsdrehende Polarisation,
ansonsten eine linksdrehende.) Für ϕ = 0 entartet diese Ellipse zu einer Strecke, für
ϕ = π2 erhält man einen Kreis. Der Winkel α beschreibt die Drehung der großen
Halbachse relativ zur Diagonalen +45◦ .
12.4
FAQs
In diesem Abschnitt greifen wir nochmals typische Fragen zur Quantenmechanik auf
und versuchen eine Antwort im Rahmen der Polarisationsfreiheitsgrade von Photonen
FAQs
241
zu geben. Die Antworten sind in diesem Fall oft überraschend einfach und offensichtlich, und trotzdem fällt es manchmal schwer, sie trotz der formalen Gleichheiten auch
auf andere Phänomene zu übertragen.
Weshalb kann man Ort und Impuls nicht gleichzeitig messen? · Ist das
Elektron auch ein Teilchen, wenn sein Ort nicht gemessen wird? · Ist der
Mond auch da, wenn niemand hinschaut?
Hierbei geht es allgemein um das Problem, weshalb komplementäre Observable – oder besser Observable, die nicht miteinander kommutieren – nicht gleichzeitig
gemessen werden können und weshalb man einem Quantensystem nicht gleichzeitig
solche Eigenschaften zuschreiben kann.
Ort und Impuls sind Observable, die durch Operatoren definiert werden, deren
Eigenvektoren maximal“ verschieden sind. Bei der linearen Polarisation von Photonen
”
gilt das für die Observablen h/v und p/m, bzw. allgemeiner für zwei Orientierungen
eines Polarisationsstrahlteilers, die sich um 45◦ unterscheiden. Übertragen auf dieses
System lautet die Frage: Weshalb kann man nicht gleichzeitig die h/v- und die p/mPolarisation messen? Nicht nur ist offensichtlich, dass man einen Polarisationsstrahlteiler nicht gleichzeitig in beide Richtungen orientieren kann, sondern es ist ebenfalls
einleuchtend, dass einem Photon höchstens nur eine dieser beiden Eigenschaften zugesprochen werden kann.
In ähnlicher Weise kann man einem Teilchen auch nicht gleichzeitig die Eigenschaften Ort und Impuls zusprechen. Setzt man die Analogie fort, so ist es unsinnig,
von einem (lokalisierten) Teilchen zu sprechen, wenn man ihm beispielsweise einen
Impuls zusprechen kann. Ein Elektron mit einem wohldefinierten Impuls hat keinen
Ort, ebensowenig wie ein Photon mit einer horizontalen Polarisierung keine wohldefinierte p/m-Polarisation hat. Man sollte daher mit Teilchen“ nicht die Vorstellung
”
eines lokalisierten Objekts verbinden.
Ob der Mond auch da ist, wenn niemand hinschaut, ist natürlich keine Ernst
gemeinte Frage. Und der Mond wird auch einen vergleichsweise wohldefinierten Ort
haben, selbst wenn niemand hinschaut. Hier spielt die Dekohärenz eine wichtige Rolle.
Ähnlich wie bei Schrödingers Katze geht es eher darum, auf die seltsamen Konsequenzen der Quantenmechanik aufmerksam zu machen, wenn man sie auf makroskopische
Gegenstände überträgt. Bei Quantensystemen ist die Zuschreibung einer Eigenschaft
eben nur dann sinnvoll, wenn sich das System in einem entsprechenden Eigenzustand
befindet.
Befindet sich ein Quantensystem in einem reinen Zustand, auch wenn wir
diesen nicht kennen?
Pauschal ist diese Frage kaum mit ja oder nein zu beantworten. Im Allgemeinen
242
Nochmals Photonenpolarisation
wird die Antwort jedoch eher nein lauten. Der Grund ist, dass ein Quantensystem in
den meisten Fällen mit anderen Quantensystemen verschränkt sein wird. Ein Photon
entstand immer durch die Emission von einem geladenen Teilchen. Meist ist die Polarisationsrichtung des Photons mit einer Polarisationseigenschaft des emittierenden
Teilchens (z.B. seinem Spin) verschränkt. Daher kommt in einem solchen Fall dem
Photon für sich genommen kein reiner Zustand zu und die Beschreibung durch eine
Dichtematrix ist nicht nur reine Unkenntnis.
Andererseits wird es ebenfalls oft vorkommen, dass ein Quantensystem aufgrund
seiner letzten Wechselwirkungen bestimmte wohldefinierte Eigenschaften hat, ohne
dass wir diese kennen. Beispielsweise könnte ein Photon durch einen Polarisationsfilter
getreten sein, dessen Orientierung wir aber nicht kennen. In solchen Fällen liegt in
”
Wirklichkeit“ ein reiner Zustand vor, wir verwenden aber aufgrund unserer Unkenntnis
zur Beschreibung eine Dichtmatrix.
((Weshalb haben einzelne Photonen eine Eigenschaft, die wir Polarisation nennen, welche sich so gut durch die Amplitude einer Welle beschreiben lassen. Das klassische Bild der Welle hat also irgendwie auch noch seine Gültigkeit für einzelne Photonen. Der Strahlteiler plus zusätzlicher Weg erlaubt es zirkulare Polarisationen zu
erzeugen. Damit kann man auch die Wellenlänge messen.
Ähnlich ist es mit anderen Eigenschaften: Weshalb sind die klassischen Vorstellungen von Ort und Impuls etc. noch gültig für einzelne Quantenobjekte?))
• Ist das Elektron – der Mond – auch da, wenn man nicht hinschaut?
• Ist das Elektron ein Teilchen, wenn man seinen Ort nicht beobachtet? Weshalb
ist es sinnlos, einem Teilchen einen Ort zuzuschreiben, wenn es einen scharfen
Impuls hat?
• Ist ein Elementarteilchen – z.B. ein Photon – überhaupt einem reinen Quantenzustand, wenn es nicht in einem solchen präpariert wurde bzw. wenn wir nichts
über das Teilchen wissen?
• Inwiefern bezeichnet die Wellenfunktion bzw. der Quantenzustand keine Unkenntnis über ein System?
• Weshalb können wir den Ort und Impuls eines Teilchens nicht gleichzeitig messen?
• Weshalb können wir den Zustand eines Systems (beispielsweise die Polarisation eines Photons) nicht messen? ((Tatsächlich ließe sich ja ein Kristall denken,
der ein Teilchen in die Richtung seiner Polarisation ablenkt und dadurch eine
Polarisationsmessung ermöglicht)).
•
Kapitel 13
Probleme, Fragen und
Interpretationen
Es gibt vermutlich viele Physiker, die behaupten würden, die Quantenmechanik habe
keine Probleme. Die Begründungen dieser Aussage fallen dabei sehr unterschiedlich
aus. Positivisten stellen sich auf den Standpunkt, dass das Kochrezept“ aus Kapitel
”
5 alle Anforderungen erfüllt, die man an eine physikalische Theorie stellen kann: Es
erlaubt prinzipiell die Vorhersage der Ergebnisse von jeder im Rahmen der Quantenmechanik denkbaren Messung an jedem denkbaren System, auf das die Quantentheorie
anwendbar ist. Insbesondere ist die Quantentheorie, zumindest soweit sie Wahrscheinlichkeitsaussagen macht, nur auf Systeme anwendbar, die sich beliebig oft in gleichen Zuständen präparieren lassen, und ihre Vorhersagen betreffen dann die relativen
Häufigkeiten bestimmter Messergebnisse. Alle Aussagen im Hinblick auf eine physikalische Deutung oder Interpretation der mathematischen Objekte wird als Metaphysik
und nicht Teil des formalen Rahmens abgetan. Auf der anderen Seite hat beispielsweise
ein Bohmianer“ (ein Anhänger der Bohm’schen Mechanik) ebenfalls keine Grundla”
genprobleme mit der Quantenmechanik, die er in einem ontologisch abgeschlossenen
und deterministischen Modell beschreibt. Seine Schwierigkeiten sind eher technischer
Natur, doch für die praktischen Anwendungen kann er das Kochrezept“ genauso ver”
wenden wie jeder andere Physiker auch.
Die meisten Physiker, insbesondere wenn sie einer eher traditionellen Interpretation der Quantenmechanik zuneigen, werden vermutlich zustimmen, dass es Grundlagenprobleme der Quantenmechanik gibt. Zumindest das Messproblem bzw. das Kollapsoder Reduktionsproblem dürfte in diesem Zusammenhang genannt werden. Dieses Kapitel soll einen Überblick geben über die Probleme und die Grundlagenfragen, welche
die Quantenmechanik (zumindest auf einer Metaebene) offenlässt. Außerdem werden
verschiedene Interpretationen bzw. Modelle und Erweiterungen der Quantenmechanik und ihr Umgang mit diesen Fragen und Problemen angesprochen. Dabei kann ich
243
244
Probleme, Fragen und Interpretationen
hier kaum auf mehr als die gängigsten Ansätze eingehen: die Kopenhagener Deutung,
die Ensemble-Interpretation, Kollapsmodelle, die Many-Worlds-Interpretation und die
Bohm’sche Mechanik. Einen recht guten Überblick liefert die Seite Interpretations
”
of quantum mechanics“ von Wikipedia sowie viele der dort angegebenen Links und
Referenzen (insbesondere enthält der Biographic Guide“ von Cabello [15] eine sehr
”
umfangreichen Literaturliste).
Was man wissen sollte
Man sollte das Messproblem in groben Zügen beschreiben können. Man sollte wissen,
was Dekohärenz ist, und welche Aspekte des Messproblems dadurch gelöst werden
und welche nicht. Die wesentlichen Züge der verschiedenen Interpretationen und ihre
Unterschiede sollte man kennen. Außerdem sollte man die Grundidee der Bohm’schen
Mechanik beschreiben können.
13.1
Das Messproblem
Das gravierendste unter den Problemen der Quantentheorie, und für viele Physiker
überhaupt das einzige wirkliche Problem, ist das Messproblem. Dabei geht es im Wesentlichen darum, dass die Quantenmechanik keine in sich geschlossene Theorie ist,
sondern zu ihrer Formulierung die Ankopplung an eine klassische Welt“ braucht, in
”
der es keine Superpositionen von Zuständen gibt, insbesondere keine Superpositionen von Messergebnissen. Diese klassische Beschreibung sollte sich aber als Grenzfall
aus einer quantentheoretischen Beschreibung ergeben, was jedoch auf Schwierigkeiten
stößt.
13.1.1
Allgemeine Charakterisierung
Die Axiome der Quantentheorie (vgl. Kap. 5) unterscheiden zwei grundsätzliche Dynamiken, nach denen sich ein quantenmechanischer Zustand verändern kann: (1) die
zeitliche Entwicklung durch die Schrödinger-Gleichung (die für abgeschlossene Systeme
gelten sollte), und (2) die Reduktion des Quantenzustands nach einer Messung. Das
Messproblem entsteht, wenn man den Vorgang der Messung durch eine SchrödingerGleichung beschreiben möchte, indem man das Messgerät als Teil des zu beschreibenden Systems auffasst.
Etwas vereinfacht ausgedrückt kann man das Messproblem“ folgendermaßen
”
beschreiben: Die Zeitentwicklung abgeschlossener physikalischer Systeme ist deterministisch und folgt der Schrödinger-Gleichung. Der Kollaps (bzw. die Reduktion) eines
Quantenzustands nach einer Messung erfolgt nach einem probabilistischen Gesetz und
Das Messproblem
245
lässt sich nicht durch eine Schrödinger-Gleichung beschreiben. Trotzdem sollte man
von einer Theorie, die den Anspruch erhebt, eine fundamentale Theorie der Naturbeschreibung zu sein, erwarten, dass auch Messgeräte und theoretisch sogar die gesamte
Umgebung (der gesamte Kosmos) zumindest im Prinzip durch sie beschrieben werden können. Daher sollte sich auch im Rahmen der Quantenmechanik erklären lassen,
weshalb wir nach einer Messung einen reduzierten Zustand wahrnehmen.
Die axiomatische Formulierung der Quantentheorie (Kap. 5) bezieht sich auf
Messungen“: Es ist von einer Reduktion des Quantenzustands nach einem Messpro”
zess, von den möglichen Messwerten und von Wahrscheinlichkeiten, bei einer Messung
bestimmte Werte zu finden, die Rede. Bohr hat immer wieder betont, dass wir das
Ergebnis von Messungen in der Sprache der klassischen Physik ausdrücken müssen.
Die herkömmliche Formulierung der Quantentheorie setzt somit eine Unterteilung der
Welt in das untersuchte Quantensystem und ein untersuchendes, klassisch zu beschreibendes System voraus. Dieses klassisch zu beschreibend“ ist ein Muss, kein Kann.
”
Doch ohne diese Möglicheit einer geschlossenen quantenmechanischen Beschreibung
auch des Messprozesses ist die Quantentheorie zumindest in dieser Hinsicht nur eine phänomenologische Theorie. Die Axiome, die sich auf den Messprozess beziehen,
sollten eigentlich aus der Quantenmechanik ableitbar sein. John Bell schreibt dazu [7]
The fact [...] that observation implies a dynamical interference, together with the belief
”
that instruments after all are no more than large assemblies of atoms, and that they
interact with the rest of the world largely through well-known electromagnetic interactions, seems to make this a distinctly uncomfortable level at which to replace analysis
by axioms.
Die Natur ist uns nicht in zwei Versionen gegeben, und wir können uns nicht aussuchen, ob wir ein physikalisches System als klassisches oder als quantenmechanisches
System vorliegen haben möchten. Jedes physikalische System besteht aus atomaren
Bestandteilen bzw. Elementarteilchen und muss daher auf diesem Niveau durch eine
Quantentheorie beschrieben werden. Was wir als klassische Physik“ bezeichnen, sollte
”
sich als Grenzfall aus einer quantentheoretischen Beschreibung ergeben. Wenn wir von
einen klassischen System“ sprechen, meinen wir lediglich, dass wir zur Beschreibung
”
der uns interessierenden Eigenschaften dieses Systems den Formalismus der klassischen
Physik verwenden können. Es gibt also keine klassischen Systeme“ sondern lediglich
”
eine klassische Beschreibung eines physikalischen Systems.
Damit hängen beim Messprozesse die beiden Probleme – Reduktion des Quantenzustands und die Ankopplung der Quantenmechanik an eine klassische, superpositionsfreie Beschreibung der Welt – eng zusammen.
246
13.1.2
Probleme, Fragen und Interpretationen
Mathematische Beschreibung
Betrachten wir nun das Problem etwas genauer: Wir unterscheiden dabei zunächst
zwei Teilsysteme (später werden wir noch ein drittes System – die Umgebung – mit
hinzunehmen): (1) das zu messende Quantensystem (S), und (2) das Messgerät (M),
das mit dem Quantensystem in Wechselwirkung steht und schließlich durch eine Zeigerstellung (oder etwas Äquivalentes) Auskunft über den Zustand von S gibt. S wird
als Quantensystem beschrieben. M wird zunächst ebenfalls quantenmechanisch beschrieben, soll als makroskopisches System jedoch die klassische Eigenschaft haben,
nie in Superpositionszuständen bezüglich seiner Ergebnisanzeige vorzuliegen.
Der Anfangszustand des Quantensystems S,
X
|φiS =
αi |si iS ,
(13.1)
i
sei eine Superposition bezüglich der Eigenschaften {si }, die von M gemessen werden
sollen. Das Messgerät selbst ist zunächst in einem neutralen Anfangszustand |0iM
und nimmt die Zustände |ϕi iM ein, wenn S im Zustand |si iS ist. Die Alternativen
{ϕi } entsprechen den verschiedenen Zeigerstellungen. Dann ist der Anfangszustand
des Gesamtsystems:
!
X
|Ψi =
αi |si iS ⊗ |0iM .
(13.2)
i
Nun findet eine Wechselwirkung zwischen dem Quantensystem S und dem Messgerät
M statt, sodass der Zustand des Messgeräts (die Zeigerstellung) mit dem Zustand des
Quantensystems korreliert ist:
X
Wechselwirkung
αi |si iS ⊗ |ϕi iM .
(13.3)
|Ψi
−→
i
Man beachte, dass jetzt das Quantensystem und das Messgerät einen gemeinsamen,
verschränkten Zustand bilden. Nach den Postulaten der Quantenmechanik kommt es
nun zu einer Reduktion des Quantenzustands und zwar mit der Wahrscheinlichkeit
|αk |2 in den Zustand k:
!
X
Wechselwirkung
Reduktion
|Ψi
−→
αi |si iS ⊗ |ϕi iM
−→ |sk iS ⊗ |ϕk iM .
(13.4)
i
Während der erste Schritt – durch die Wechselwirkung wird der Gesamtzustand von
Quantenssytem und Messgerät verschränkt – im Rahmen der Quantentheorie leicht
durch eine Schrödinger-Gleichung beschrieben werden kann, ist eine Beschreibung des
zweiten Schritts – die Reduktion des Zustands – durch eine Schrödinger-Gleichung
nicht möglich. Das wird schon alleine daran offensichtlich, dass der zweite Schritt ein
stochastischer ist, während die Schrödinger-Gleichung deterministisch ist.
Das Messproblem
247
Die Begründung für den letzten Schritt lautet: Da das Messgerät ein klassi”
sches System“ ist (also klassisch zu beschreiben ist), kann es sich nicht in einem Superpositionszustand bezüglich seiner klassischen Eigenschaften (den Zeigerstellungen)
befinden sondern muss eine wohldefinierte Zeigerstellung einnehmen. Die Wahrscheinlichkeit dafür ergibt sich nach der Born’schen Regel. Streng genommen ist schon der
Zwischenzustand, bei dem das Quantensystem und das Messgerät verschränkt sind,
physikalisch nicht realisiert. Hier wird also der Kollaps hineingesteckt.
Was hindert uns jedoch, auch das Messgerät (einschließlich der Zeigerstellung)
quantenmechanisch zu beschreiben? In diesem Fall, so lautet die herkömmliche Argumentation, haben wir neben dem quantenmechanischen Messgerät noch eine klassisch
zu beschreibende Umgebung E (anfänglich im Zustand |ψiE ) zu berücksichtigen. Nun
ist der Anfangszustand des Gesamtsystems
!
X
(13.5)
|Ψi =
αi |si iS ⊗ |0iM ⊗ |ψiE
i
und nach der Wechselwirkung liegt der Zustand
!
|Ψi
Wechselwirkung
−→
X
αi |si iS ⊗ |ϕi iM
⊗ |ψiE
(13.6)
i
vor. Doch es gibt natürlich auch eine Wechselwirkung zwischen dem Messgerät und der
Umgebung, sodass auch der Zustand der Umgebung mit dem Zustand des Messgeräts
korreliert wird (beispielsweise wird unser Gehirnzustand mit dem Messgerät korreliert,
wenn wir die Zeigerstellung ablesen):
!
X
Wechselwirkung
|Ψi
−→
(13.7)
αi |si iS ⊗ |ϕi iM ⊗ |ψiE
i
!
Wechselwirkung
−→
X
αi |si iS ⊗ |ϕi iM ⊗ |ψi iE
(13.8)
i
Reduktion
−→
|sk iS ⊗ |ϕk iM ⊗ |ψk iE .
(13.9)
Die Argumentation ist ähnlich wie vorher: Während die Messapparatur quantenmechanisch beschrieben wird, ist nun die Umgebung E als klassisches System zu beschreiben
und kann daher nicht in einem Superpositionszustand sein. Das Ergebnis ist dasselbe:
Nach der Messung liegt ein reiner Zustand vor, bei dem sich das Quantensystem S in
dem Zustand |sk i befindet, zu dem das Messgerät die Zeigerstellung ϕk hat und die
Umgebung mit diesem Messergebnis konform“ ist.
”
Wir sehen somit, dass es keinen Unterschied macht, ob wir den Schnitt“ zwi”
schen quantentheoretischer und klassischer Beschreibung zwischen das Quantensystem
S und das Messgerät M legen, oder zwischen das Messgerät M und die Umgebung E.
248
Probleme, Fragen und Interpretationen
Wir können letztendlich den Schnitt hinlegen, wohin wir wollen, aber irgendwo in unserem Gehirn entsteht das, was wir eine bewusste Wahrnehmung nennen, und diese ist
in keinem Superpositionszustand, sondern muss auf der klassischen Beschreibungsseite
liegen.
13.1.3
Dekohärenz
Wenn wir schon nicht aus der Quantenmechanik ableiten können, wie es zu einer Reduktion des Quantenzustands kommt, können wir zumindest versuchen zu verstehen,
weshalb wir nie eine Superposition makroskopischer Eigenschaften (beispielsweise Zeigerstellungen an einem Messgerät) beobachten. Hierzu wurden gerade in den letzten
40–50 Jahren Fortschritte gemacht, die unter der Bezeichnung Dekohärenz“ zusam”
mengefasst werden. Vereinfacht ausgedrückt bedeutet dies, dass die möglichen Beiträge
in einem Superpositionszustand so verschieden ( dekohärent“) sind, dass keine Inter”
ferenzen mehr beobachtet werden.
Eine mathematisch scharfe Definition von Dekohärenz ist gar nicht so einfach,
und in mehrfacher Hinsicht gleicht dieser Begriff dem der Entropie“ in der klassischen
”
statistischen Mechanik. Wird ein Quantensystem durch eine Dichtematrix ρ beschrieben (vgl. Abschnitt 5.9), ist ein mögliches Maß für Dekohärenz sogar durch die von
Neumann-Entropie,
X
S = Sp ρ ln ρ =
pi ln pi ,
(13.10)
i
gegeben (Sp bezeichnet die Spur der Matrix und {pi } sind die Eigenwerte). Handelt
es sich bei ρ um einen reinen Zustand, wäre nach dieser Definition die Entropie und
damit das Dekohärenzmaß null.
Bedeutet dies, dass ein reiner Zustand |ψi – ausgedrückt z.B. durch einen
Projektionsoperator P = |ψihψ| – immer eine verschwindende Dekohärenz hat? Ich
möchte im Folgenden eine Definition von Dekohärenz geben, deren Maß auch für reine
Zustände von null verschieden sein kann.
Während von den Gründern der Quantenmechanik zunächst nur gefordert wurde, dass Observable in der Quantenmechanik durch selbst-adjungierte Operatoren
darzustellen sind, hat Dirac auch die umgekehrte Forderung aufgestellt: Alle selbstadjungierten Operatoren sind Observable. Versteht man unter einer Observablen, dass
es zu ihr eine realisierbare Messvorschrift geben muss, ist diese Aussage sicherlich
falsch. Nur von den wenigsten selbst-adjungierten Operatoren kennen wir die zugehörigen Messvorschriften, und bei Vielteilchensystemen ist es praktisch unmöglich,
eine vollständige (maximale) Messung (siehe Abschnitt 5.10) vorzunehmen. Denken
wir an ein makroskopisches System mit rund 1023 Teilchen, ist eine vollständige Messung bzw. kontrollierte Beeinflussung des Systems unmöglich.
Schrödingers Katze
249
Statt nun alle selbst-adjungierten Operatoren als Observable zu betrachten,
wählen wir einen Satz {Ai } von selbst-adjungierten Operatoren, die wir als observabel
ansehen. Dieser Satz soll sämtliche Möglichkeiten umfassen, die uns zur Verfügung
stehen, auf das System Einfluss zu nehmen bzw. es zu messen“. Der Satz muss nicht
”
endlich sein (beispielsweise rechnet Kurt Gottfried in seinem Quantenmechaniklehrbuch [35] alle räumlich lokalen selbst-adjungierten Operatoren zu den Observablen).
Wir können nun Äquivalenzklassen von Dichtematrizen definieren, die sich bezüglich
dieses Satzes von Operatoren nicht unterscheiden lassen:
ρ1 ∼ ρ2
⇐⇒
Sp ρ1 Ai = Sp ρ2 Ai
für alle i .
(13.11)
Bezüglich aller uns zur Verfügung stehender Observablen sind ρ1 und ρ2 damit gleichwertig.
Nun definieren wir als ein Maß für die Dekohärenz eines (reinen) Zustands P die
maximale von Neumann-Entropie einer Dichtematrix, die zur selben Äquivalenzklasse
wie P gehört, die also durch Observable nicht von P zu unterscheiden ist. Der Vorteil
dieser Definition, auch auf reine Zustände anwendbar zu sein, ist durch den Nachteil
erkauft, dass Dekohärenz – zumindest im Prinzip – nur relativ zu einer Observablenmenge definiert wird. Dies gilt aber auch für die meisten Definitionen der Entropie in
der klassischen statistischen Mechanik.
Die Idee hinter der Reduktion, die in Gl. 13.9 vorgenommen wurde, ist nun
folgende: Die durch |ψiE beschriebenen Umgebungsvariablen bezeichnen die Freiheitsgrade, die von uns nicht beobachtet bzw. beeinflusst werden können. Damit lassen sich
auch keine Interferenzen zwischen verschiedenen |ψi i nachweisen und diese Zustände
erscheinen wie klassische Zustände.
Allerdings ist die Reduktion damit immer noch nicht geklärt. Wie John Bell
in einer seiner berühmten Kritiken am Messprozess betonte [7], handelt es sich immer noch um eine Superposition (im Sinne eines logischen UNDs) von verschiedenen
Möglichkeiten und nicht um klassische Alternativen (im Sinne logischer ODERs): The
idea that elimination of coherence, in one way or another, implies the replacement
of ‘and’ by ‘or’, is a very common one among solvers of the ‘measurement problem’.
Tatsächlich betrachten die meisten Physiker heute die Dekohärenz nicht als Erklärung
für das Kollapspostulat, sondern nur als Erklärung für die fehlende Interferenz zwischen makroskopisch verschiedenen Möglichkeiten.
Damit wurde zwar geklärt, weshalb wir eine klassische Welt wie bei einem reduzierten, reinen Zustand wahrnehmen, nicht aber, weshalb der quantenmechanische
Zustand tatsächlich dieser reduzierte Zustand sein soll. Eine extreme Folgerung aus
dem Gesagten führt unweigerlich auf die Viel-Welten-Theorie (siehe Abschnitt 13.5.3).
250
13.2
Probleme, Fragen und Interpretationen
Schrödingers Katze
In seinem berühmten Artikel von 1935 [67], der eine Art Bestandsaufnahme der Quantenmechanik nach dem Artikel von Einstein, Podolsky und Rosen [24] darstellte, argumentiert Schrödinger, dass wir die Quantenmechnik nicht vollständig von der klassischen Physik trennen können. Es war damals oft der Einwand vorgebracht worden,
dass die Quantenmechanik nur atomare Vorgänge betrifft und daher keinerlei Einfluss
auf makroskopische Phänomene haben könne. Schrödinger wollte durch sein etwas
makabres Beispiel deutlich machen, dass diese Meinung falsch ist, Quanteneffekte also durchaus einen makroskopischen Einfluss haben können. Schrödinger selbst gibt
folgendes Beispiel:
Man kann auch ganz burleske Fälle konstruieren. Eine Katze wird in eine Stahlkammer gesperrt, zusammen mit folgender Höllenmaschine (die man gegen den direkten Zugriff der Katze sichern
muß): in einem Geigerschen Zählrohr befindet sich eine winzige Menge radioaktiver Substanz, so
wenig, daß im Lauf einer Stunde vielleicht eines von den Atomen zerfällt, ebenso wahrscheinlich aber
auch keines; geschieht es, so spricht das Zählrohr an und betätigt über ein Relais ein Hämmerchen,
das einen Kolben mit Blausäure zertrümmert. Hat man dieses ganze System eine Stunde lang sich
selbst überlassen, so wird man sich sagen, daß die Katze noch lebt, wenn inzwischen kein Atom zerfallen ist. Der erste Atomzerfall würde sie vergiftet haben. Die ψ-Funktion des ganzen Systems würde
das so zum Ausdruck bringen, daß in ihr die lebende und die tote Katze (s.v.v.) zu gleichen Teilen
gemischt oder verschmiert sind.
Natürlich bezeichnet man es allgemein als absurd, dass die Katze gleichzeitig in
einem Superpositionszustand aus tot“ und lebendig“ existieren soll, und erst die Be”
”
obachtung, beispielsweise durch das Öffnen der Kammer, zu einer Reduktion auf tot“
”
oder lebendig“ führt. Meist wird argumentiert, dass schon lange bevor ein Beobachter
”
die Kammer öffnet, das makroskopische Innere der Kammer durch Dekohärenzeffekte
in einen reinen Zustand übergegangen ist, doch damit ist das Problem nicht gelöst:
Wenn die Kammer vollkommen von ihrer Umgebung isoliert, d.h. keinerlei Wechselwirkung (auch nicht indirekt über die Bestandteile der Kammerwand) zwischen dem
Inneren der Kammer und der Umgebung des Beobachters möglich ist, sollte die Kammer als Gesamtsystem immer noch durch einen Superpositionszustand beschrieben
werden. Wie schon im letzten Abschnitt betont wurde, führen Dekohärenzeffekte lediglich dazu, dass keinerlei Interferenzen zwischen den beiden Möglichkeiten mehr
nachweisbar sind, nicht aber zu einer Reduktion auf eine der beiden Möglichkeiten.
Gelegentlich wurde auch folgende Variante vorgeschlagen, mit der angeblich der
Unterschied zwischen Superposition und reinem Zustand nachgewiesen werden kann:
Statt der Katze befinde sich in der Kammer eine Uhr, die durch einen geeigneten Mechanismus durch den Geigerzähler gestoppt wird, sobald das Atom zerfallen ist. Öffnet
man nun den Kasten, kann man an der Uhr ablesen, wann das Atom zerfallen ist und
somit nachweisen“, dass eventuell schon seit längerem kein Superpositionszustand
”
Das Zeigerbasis-Problem
251
mehr vorliegt. Dieses Argument ist aber falsch: Bei völliger Isolierung der Kammer
befindet sich das System nach dem Formalismus der Quantentheorie in einer Superposition aus (nahezu beliebig) vielen Zuständen: zu jedem möglichen Zerfallszeitpunkt
und damit zu jeder möglichen Zeigerstellung der Uhr einer. Durch die Beobachtung
wird aus diesem verschmierten Kontinuum an superponierten Zuständen einer zum
Fakt, und das kann auch ein Zustand sein, bei dem die Uhr schon vor langer Zeit
angehalten wurde.
Letztendlich ist Schrödingers Katze also nur eine besondere Variante des Messproblems, auch wenn Schrödinger sein Beispiel ursprünglich für eine andere Argumentation gedacht hatte.
13.3
Das Zeigerbasis-Problem
Wir haben bei der Formulierung des Messproblems sehr suggestiv eine Entwicklung
des Quantenzustands nach einer Basis vorgenommen, bezüglich der ein (klassisch zu
beschreibendes) Messgerät seine verschiedenen Zeigerstellungen einnimmt. Doch was
zeichnet diese Basis aus? Anders ausgedrückt, weshalb dekohäriert der Quantenzustand eines Messgeräts gerade bezüglich der Zeigerbasis?
Betrachten wir nochmals Gleichung 13.4:
!
X
Wechselwirkung
Reduktion
−→ |sk iS ⊗ |ϕk iM .
(13.12)
|Ψi
−→
αi |si iS ⊗ |ϕi iM
i
Wir entwickeln nun jeden Eigenzustand zur Zeigerbasis |ϕi iM nach einer anderen Basis:
X
bia |φa iM
(13.13)
|ϕi iM =
a
und setzen diese Entwicklung in den verschränkten Zustand unmittelbar nach der
Wechselwirkung zwischen Messgerät und Quantensystem ein:
!
X
X
X
i
αi |si iS ⊗ |ϕi iM =
αi |si iS ⊗
ba |φa iM
(13.14)
i
a
i
!
=
X X
a
bia αi |si iS
⊗ |φa iM .
(13.15)
i
Derselbe verschränkte Zustand erlaubt also einmal eine Entwicklung bezüglich der Zeigerbasis {|ϕi iM } des Messgeräts und einmal eine Entwicklung nach der Basis {|φa iM }.
Dabei braucht uns die Tatsache, dass im Allgemeinen
X
|σa iS =
bia αi |si iS
(13.16)
i
252
Probleme, Fragen und Interpretationen
keine Orthonormalbasis ist, nicht weiter zu stören. Erstens gibt es Transformationen
der genannten Art, die wieder auf Orthonormalbasen führen, und zweitens muss die
Entwicklung eines Quantenzustands nicht nach einer Orthonormalbasis erfolgen.
Schauen wir uns jetzt die Entwicklung (Gl. 13.15) an, so könnte die Dekohärenz
ebensogut nach der neuen (makroskopischen) Basis {|φa iM } erfolgen. Was zeichnet die
Zeigerbasis aus, dass der Gesamtzustand bezüglich der Zeigerbasis dekohäriert?
Auch wenn noch nicht alle Einzelheiten dieser Frage gelöst und verstanden
sind, herrscht doch ein gewisser Konsens, dass die Art der Wechselwirkungen zwischen physikalischen Objekten diese Basis festlegt. Die bezüglich der Ortsraumbasis
lokale Form der Kopplungen zwischen den Elementarteilchen (bedingt durch die relativistische Invarianz der Theorie) könnte auch die Ortsraumbasis auszeichnen, sodass
eine Dekohärenz durch die Wechselwirkung mit der Umgebung bezüglich der räumlich
verschiedenen Zeigerstellungen erfolgt.
13.4
Die Kopenhagener Deutung
Obwohl die sogenannte Kopenhagener Deutung“ oft als die gängige Interpretation
”
der Quantenmechanik bezeichnet wird, gibt es eigentlich keine scharfe Definition, was
darunter genau zu verstehen ist. Man kann bestenfalls eine Sammlung von Konzepten angeben, die von den meistern Physikern als kennzeichnend für die Kopenhagener
Deutung angesehen werden. Dazu zählen in jedem Fall die in Kap. 5 angegebenen
Postulate, insbesondere das Kollapspostulat und die Born’sche Regel, die das Quadrat
von Skalarprodukten als Wahrscheinlichkeiten deutet. Neben den schon behandelten
Postulaten gehört zur Kopenhagener Deutung aber noch ein gewisser interpretatorischer (philosophischer) Unterbau. Diese Vorstellungen entstanden im Wesentlichen
aus den gemeinsamen Arbeiten von Bohr und Heisenberg im Jahre 1927 in Kopenhagen und wurden auf der Solvay Konferenz im Oktober 1927 von ihnen vertreten und
(teilweise gegen den Widerstand von Einstein, Schrödinger, Planck, deBroglie und anderen) durchgesetzt. Die folgenden Konzepte spielen dabei eine herausragende Rolle:
- Komplementarität
Auf die Bedeutung des Komplementaritätsbegriffs für die philosophischen Vorstellungen von Bohr sind wir schon kurz eingegangen (S. 108). Für ihn handelte
es sich dabei um ein grundlegendes Konzept der Naturerkenntnis, das er auch in
vielen anderen Bereichen zu erkennen glaubte. Eng verknüpft mit der Komplementarität war für Bohr ein relationales“ Naturverständnis, das es nur erlaubt,
”
Eigenschaften eines Systems relativ zu einer Beobachtungssituation zu verstehen.
- Der Bezug auf eine klassische Welt
Die Kopenhagener Deutung
253
Auf diesen Aspekt sind wir schon im Zusammenhang mit dem Messprozess eingegangen (Abschnitt 13.1). Bohr betonte immer, dass wir über das Ergebnis von
Messungen oder Experimenten ausschließlich in der Sprache der klassischen Physik reden können. Diese Eindeutigkeit klassischer Zustände bezüglich beliebiger
Observabler (das Fehlen jeglicher Superpositionen) ist für Bohr unumgänglich,
um über Physik sprechen zu können. Letztendlich war es vielleicht die einzige
Möglichkeit, das Problem der Reduktion des Quantenzustands zu umgehen. Man
könnte sagen, dass es eine Quantentheorie für ein abgeschlossenes System gar
nicht gibt, bzw. seine Formulierung nicht bekannt ist. Die Quantentheorie in der
Kopenhagener Deutung ist immer eine Quantentheorie von offenen Systemen,
die an eine klassisch zu beschreibende Umgebung ankoppeln.
- Die Born’sche Regel als Ausdruck einer ontologischen Wahrscheinlichkeit
Das Wesen von Wahrscheinlichkeit“ ist immer noch Gegenstand unzähliger phi”
losophischer Diskussionen. Die Mathematik hat sich mit der Aufstellung der
Kolmogorow’schen Axiome insofern dieser Diskussion entzogen, als sie gar nicht
mehr den Anspruch erhebt zu erklären, was Wahrscheinlichkeit ist. Sie legt nur
fest, welche Eigenschaften eine bestimmte mathematische Struktur haben muss,
damit man von einer Wahrscheinlichkeit sprechen darf.
Insbesondere in der Naturphilosophie wird viel diskutiert, ob es eine ontologische (objektive) Wahrscheinlichkeit überhaupt geben kann, oder ob nicht jede
Wahrscheinlichkeitsaussage nur ein Ausdruck über unsere Unkenntnis zu einem
bestimmten Sachverhalt ist. In ihrer gewöhnlichen (Kopenhagener) Deutung verletzt die Quantenmechanik das Prinzip vom hinreichenden Grund von Leibniz:
Selbst nachdem ein bestimmter experimenteller Sachverhalt festgestellt wurde
(z.B. die Ablenkung eines Elektrons in einem Stern-Gerlach-Mageneten in eine
bestimmte Richtung) ist es prinzipiell unmöglich Gründe dafür anzugeben, weshalb das Elektron nach oben und nicht nach unten abgelenkt wurde (sofern es
nicht in einem entsprechenden Zustand präpariert wurde).
Für die Quantenmechanik sind die Wahrscheinlichkeitsaussagen ontologischer
Natur. Das bekannte Einstein’sche Diktum Gott würfelt nicht“ bringt sein Un”
behagen in diesem Zusammenhang zum Ausdruck. Es war immer schon das Ziel
von Modellen mit verborgenen Variablen, den ontologischen Indeterminismus zu
einem rein epistemischen Indeterminismus (also nur unserer Kenntnis entzogenen
Determinismus) zu machen. Dass etwas ohne irgendeinen Grund geschehen soll,
ist für viele aus philosophischen Gründen undenkbar, doch genau das behauptet
die traditionelle Deutung der Quantentheorie.
254
Probleme, Fragen und Interpretationen
- Die Heisenberg’schen Unschärferelationen
Während Bohr meist den Begriff der Komplementarität in den Vordergrund stellte, wenn er das Besondere an der Quantenmechanik betonen wollte, waren es für
Heisenberg eher die Unbestimmtheits- bzw. Unschärferelationen (siehe Abschnitt
5.8). Zu Beginn – sicherlich vor 1930 – war Heisenberg der Überzeugung, dass
die Unschärferelationen ein Ausdruck der unkontrollierbaren Einwirkungen eines
Messgeräts auf ein zu messendes System darstellten. Erst später kam auch er zu
der Überzeugung, dass die Eigenschaften, deren Unbestimmtheit in die Relationen eingehen, tatsächlich als solche gar nicht schärfer definierbar sind. Es geht
nicht um eine Unkenntnis, beispielsweise des Ortes eines Teilchens, sondern darum, dass es überhaupt keinen Sinn macht, einem Teilchen das Konzept Ort“
”
in einer präziseren Weise zuzuschreiben, als es die Unschärferelationen erlauben.
Ein Teilchen“ mit einem scharfen Impuls hat gar keinen Ort.
”
- Das Korrespondenzprinzip
Wie so viele Konzepte, die über eine rein mathematische Struktur hinausgehen,
gibt es auch keine präzise Formulierung, was genau das Korrespondenzprinzip
aussagt. Allgemein stellt es eine Beziehung zwischen der Quantentheorie und der
klassischen Theorie her. Meist versteht man unter dem Korrespondenzprinzip die
(sicherlich nicht selbstverständliche) Tatsache, dass die klassischen Observablen
– Ort, Impuls, Energie, Drehimpuls, etc. – auch in der Quantenmechanik noch
sinnvolle Konzepte darstellen. Weshalb sollte der Energieoperator in der Quantenmechanik dieselbe Funktion der Orts- und Impulsoperatoren sein, wie die
Abhängigkeit der klassischen Energie von Ort und Impuls?
Wenn wir von Quantisierung“ sprechen, meinen wir damit oft die Formulierung
”
einer Quantentheorie, ausgehend von einer klassischen Theorie. Die Vorschrift
besteht im Wesentlichen aus der Ersetzung der klassischen Observablen x und p
durch Operatoren Q und P – ebenso für andere Observable f (x, p) → f (Q, P )
(bis auf die schon angesprochenen Ordnungsprobleme, siehe S. 97) – sodass
die klassischen Bewegungsgleichungen nun für die Operatoren gelten und die
Kommutatorbeziehungen dieser Operatoren sich aus den klassischen PoissonKlammern ergeben. Streng genommen sollte sich aber die Quantentheorie nicht
aus der klassischen Theorie ergeben, sondern die klassische Theorie sollte ein
Grenzfall der Quantentheorie sein.
Die Idee der Quantisierung“ ist also eigentlich die Folgende: Die genannte Vor”
schrift erlaubt es, aus einer klassischen Theorie eine Quantentheorie zu formulieren, welche die Eigenschaft hat, in einem (zu definierenden) klassischen Grenzfall wieder die klassische Theorie zu ergeben. Ein wesentliches Element dabei ist,
Weitere Interpretationen
255
dass die Erwartungswerte quantenmechanischer Operatoren bei dieser Quantisierungsvorschrift wieder die klassischen Bewegungsgleichungen bzw. die klassischen Beziehungen zwischen Observablen erfüllen (siehe Abschnitt 7.3.2). Daher
bezeichnet man auch diese Tatsache manchmal als Korrespondenzprinzip.
Während für die Gründungsväter der Quantenmechanik das Korrespondenzprinzip eine herausragende Rolle spielte, ist es heute in erster Linie in der Quantisierungsvorschrift von Bedeutung. Allgemein ungeklärt ist aber die Frage, ob die
Quantisierungsvorschrift (abgesehen von den Ordnungsproblemen) immer eindeutig ist. Die Formulierung einer Quantengravitation scheint sich z.B. nicht
so ohne weiteres aus einer kanonischen Quantisierung der Allgemeinen Relativitätstheorie in der üblichen Form zu ergeben.
13.5
Weitere Interpretationen
13.5.1
Ensemble-Interpretation
Die Quantenmechanik erlaubt größtenteils nur Wahrscheinlichkeitsaussagen bezüglich
zukünftiger Ereignisse, z.B. Messergebnissen. Will man Wahrscheinlichkeitsaussagen
experimentell prüfen, muss man sehr viele Experimente unter möglichst gleichen Bedingungen vornehmen und die relativen Häufigkeiten der Resultate bestimmen. Daher
lässt sich die Quantenmechanik nur an Ensembles von gleichartig präparierten Systemen überprüfen. Bedeutet dies, dass die Quantenmechanik auch nur auf Ensembles
von gleichartig präparierten System angewandt werden darf, also für Einzelsysteme
überhaupt keine Gültigkeit in Anspruch nehmen kann?
Vertreter einer Ensemble-Interpretation behaupten genau dies. Der Quantenzustand beispielsweise eines Elektrons beschreibt nach dieser Vorstellung gar kein
einzelnes Elektron, sondern nur ein Ensemble von gleichartig präparierten Elektronen. Damit werden die Aussagen der Quantenmechanik zu Aussagen über relative
Häufigkeiten. Der Begriff der Wahrscheinlichkeit tritt in einer strengen EnsembleInterpretation überhaupt nicht mehr auf. Die relativen Häufigkeiten beziehen sich
auf die Ensembles von Systemen nach einer Messung, die jeweils die verschiedenen
erlaubten Messwerte ergeben haben.
Damit ist allerdings auch das Kollapsproblem bzw. das Messproblem gelöst.
In gewisser Hinsicht ist es der Experimentator selbst, der diesen Kollaps“ bewirkt,
”
nämlich durch seine Entscheidung, aus dem Gemisch von Ensembles nach einer Messung (das beispielsweise durch eine Dichtematrix beschrieben wird) ein einzelnes Ensemble von Systemen mit einer wohldefinierten Eigenschaft für weitere Experimente
herauszunehmen. In seinem bekannten Lehrbuch zur Quantenmechanik [19] schreibt
256
Probleme, Fragen und Interpretationen
Dawydow zur Änderung“ der Wellenfunktion nach einer Messung: In diesem Fal”
le handelt es sich eigentlich nicht um eine Änderung der Wellenfunktion, sondern es
wird vielmehr eine Wellenfunktion durch eine andere ersetzt, weil die Aufgabenstellung
geändert wird – es ändern sich die Anfangsbedingungen. Überhaupt war die EnsembleInterpretation gerade unter den sowjetischen Physikern der Nachkriegszeit (Dawydow,
Blochinzew, Fock) weit verbreitet und galt als die einzige Interpretation, die im Einklang mit einem realistischen, marxistisch-leninistischen Materialismus“ steht.
”
Durch die Einschränkung der Anwendbarkeit der Quantentheorie ausschließlich
auf Ensembles von gleichartig präparierten Systemen fällt es jedoch schwer, die Quantenmechanik als eine fundamentale Theorie anzusehen. In diesem Sinne war vermutlich
auch Einstein ein Anhänger der Ensemble-Interpretation. Für ihn war die Quantentheorie lediglich eine phänomenologische Theorie, und er hatte immer gehofft, dass
sich eine fundamentale Theorie im Einklang mit seiner Vorstellung von objektivem
Realismus finden lassen würde.
13.5.2
Subjektive Deutungen und QBism
Scheinbar vollkommen entgegengesetzt zu der materialistischen Ensemble-Interpretation, und doch konzeptuell eng mit ihr verwandt, sind verschiedene Formen von
subjektiven Deutungen der Quantentheorie. All diesen Formen gemein ist die Interpretation der Wellenfunktion bzw. des Quantenzustands als eine Kodierung unseres
”
Wissens“ bzw. unserer Erwartungen über die Welt. Die Wellenfunktion (bzw. genauer der Quantenzustand) enthält das gesamte Wissen, das wir über die Vergangenheit
(d.h. die Präparation) eines Systems haben. Sie hat damit einen ähnlichen Status
wie eine klassische Wahrscheinlichkeitsverteilung, die im Grunde unsere Teilkenntnis
über ein System zum Ausdruck bringt, aber keinen ontologischen Status hat. Auch in
der klassischen Physik findet ein Kollaps“ statt, nämlich wenn ein Experiment oder
”
Versuch ausgeführt wurde (beispielsweise ein Würfel geworfen wurde) und aus den
anfänglichen Möglichkeiten eine bestimmte realisiert wird.
In gewisser Hinsicht gehörten auch Vertreter der Kopenhagener Deutung zu
dieser Gruppe, beispielsweise Schrödinger, der die Wellenfunktion als Katalog der
”
Erwartungen“ bezeichnet [67], oder Bohr in seiner berühmten Anwort auf den EPRArtikel, wo er die Reduktion des Quantenzustands nach einer Messung als influence
”
on the very conditions which define the possible types of predictions regarding the
future behavior of the system“ beschreibt [11]. Auch Heisenberg hat sich, zumindest
in späteren Jahren, dieser Meinung angeschlossen. Er schreibt in den 60er Jahren in
einem Brief an Renninger (aus [66]): Der Akt der Registrierung andererseits, der zur
Zustandsreduktion führt, ist ja nicht ein physikalischer, sondern sozusagen mathematischer Vorgang. Mit der unstetigen Änderung unserer Kenntnis ändert sich natürlich
Weitere Interpretationen
257
auch die mathematische Darstellung unserer Kenntnis unstetig. Auch in dieser Interpretation hat die Zustandsreduktion nach einer Messung somit eine elegante Lösung
erfahren.
Das eigentliche Problem dieser subjektiven Interpretationen lautet: Bezieht sich
unser Wissen auf etwas? Gibt es eine ontologische Realität, über die wir ein gewisses Wissen haben können, das wir dann durch den Quantenzustand kodieren? Wenn
ja“, dann übertragen sich die Probleme mit dem Kollaps oder die Nicht-Lokalität
”
bei EPR etc. auf dieses ontologische Etwas, und wir haben eigentlich nichts gelöst.
Falls nein“, dann landen wir im Extremfall bei einem Solipsismus, zumindest aber
”
bei einem Idealismus im Sinne von Berkeley.
Eine moderne Variante dieser subjektiven Interpretation des Quantenzustands
ist QBismus“ (eine Kurzform von Quanten-Bayesianismus). Der Ursprung dieser In”
terpretation liegt in einer Arbeit von Carlton M. Caves, Christopher Fuchs und Ruediger Schack aus dem Jahr 2002 [17]. Heute gilt Christopher Fuchs als ihr Hauptvertreter.
In zweifacher Hinsicht unterscheidet sich dieser Zugang von den älteren subjektiven
Deutungen: (1) Wahrscheinlichkeit wird nicht im klassisch-wissenschaftlichen Sinne als
relative Häufigkeit von Ereignissen, sondern im Bayes’schen Sinne als belief function“,
”
also als ein Maß für die subjektive Überzeugung bzw. den Glauben einer Person an
das Eintreffen eines Ereignisses, interpretiert. Quantifizieren lässt sich diese Funktion
(bis zu einem gewissen Grad) durch die Wettbereitschaft einer Person bei einer bestimmten Auszahlungsquote. Damit umgeht man Probleme mit Ereignissen, die sich
nicht beliebig oft reproduzieren lassen (was streng genommen ohnehin für kein Ereignis
gilt). (2) Die mathematische Formulierung beruht nicht auf einer Wahrscheinlichkeit
im Sinne von Kolmogorov, sondern wird durch symmetric, informationally-complete,
”
positive operator-valued measures (SIC-POVMs)“ ausgedrückt. Dabei handelt es sich
um eine operatorwertige Maß- bzw. Wahrscheinlichkeitstheorie; Ereignismengen werden also bestimmte Operatoren und nicht klassische Wahrscheinlichkeiten zugeordnet.
Letztendlich bleibt aber die Frage, ob sich dieser Glauben“ auf etwas Reales“ bezieht
”
”
– und wenn ja, auf was.
13.5.3
Many-Worlds
Die Many-Worlds- oder auch Vielwelten-Theorie gehört zu den polarisierendsten Interpretationen der Quantenmechanik. Die meisten Physiker, die sich mit Grundlagenproblemen beschäftigen, sind entweder Anhänger dieser Interpretation, oder aber sie
gehören zu den entschiedenen Gegnern und bezeichnen sie als vollkommen absurd“.
”
Nach der Vielwelten-Theorie kommt es überhaupt nicht zu einem Kollaps. Die
Ontologie dieser Welt ist eine Wellenfunktion (bzw. ein Quantenzustand). Diese entwickelt sich nach der Schrödinger-Gleichung - fertig! Es findet nie ein Kollaps statt;
258
Probleme, Fragen und Interpretationen
damit ist dieses Axiom überflüssig. Dass wir scheinbar einen reduzierten Quantenzustand wahrnehmen, liegt an der Dekohärenz verschiedener Zweige der Wellenfunktion.
Alle diese Zweige (bzw. Universen, denen diese Zweige entsprechen) sind ebenso re”
al“ wie der, den wir wahrnehmen. Die Wellenfunktion des Universums verzweigt sich
ständig und im Grunde genommen kann man sagen, dass sich alle Universen, die sich
seit Anbeginn des Kosmos hätten entwickeln können, auch tatsächlich entwickelt haben. In jeder Sekunde spaltet sich die Wellenfunktion unseres Universums in unzählige
neue Zweige auf, und wir befinden uns in jedem dieser Zweige und haben in jedem das
Gefühl, nur eine einzige Realisierung des Universums wahrzunehmen.
Der Urspung dieser Interpretation liegt in einer Arbeit von Hugh Everett aus
dem Jahre 1957 [27]. Bekannt gemacht (und auch die Bezeichnung Many-Worlds eingeführt) hat sie Bryce Seligman DeWitt rund 15 Jahre später [21]. Während Everett
in seiner Arbeit daran interessiert war, die Entwicklung der Wellenfunktion aus einer
externen Sicht zu beschreiben (und den physikalischen Beobachter als Teil der Welt,
die von der Wellenfunktion repräsentiert wird, ansah), war DeWitt an einer Quantentheorie (Quantengravitation) des gesamten Kosmos interessiert. Er hatte wenige
Jahre zuvor die Wheeler-DeWitt-Gleichung für ein solches kosmologisches Modell entwickelt und brauchte nun die Interpretation von Everett, die den Beobachter als Teil
des Quantensystems auffasst.
Im Grunde genommen ist die Vielwelten-Theorie das notwendige Ergebnis einer
konsequenten, allumfassenden Anwendung der Quantentheorie. Wenn die SchrödingerGleichung den Quantenzustand des gesamten Universums beschreibt, dann kann es
nicht zu einem Kollaps kommen. Die Dekohärenztheorie erklärt, weshalb wir trotzdem
einen reduzierten Zustand wahrzunehmen glauben. Trotz dieser lediglich bis zu Ende
gedachten Konsequenzen aus der herkömmlichen Formulierung der Quantentheorie,
gilt die Vielwelten-Theorie für die meisten Physiker als absurd oder okkult. Allerdings
gibt es keine wissenschaftlichen Argumente gegen diese Interpretation. Die einzige
(eher technische) Einschränkung ist, dass die Born’sche Regel keine unmittelbare Folgerung aus der konsequenten Anwendung der Schrödinger-Gleichung ist, sondern in
Form eines Maßes auf dem Raum aller Möglichkeiten“ einer Zusatzannahme bedarf.
”
Absurd erscheint natürlich den meisten Gegnern, dass jedes Ich“ in beliebig
”
vielen Kopien bzw., im wahrsten Sinne des Wortes, allen möglichen Kopien“ existiert.
”
Der Nobelpresiträger Antony J. Leggett meinte bei einem Vortrag in Freiburg dazu
[52]: Well, I wish I could say something intelligent about that interpretation, but I guess
I can’t, and the reason is quite simply that quite literally I do not understand it. And
I mean that very, very literally. When it is said by the adherents of this interpretation
that these so-called parallel universes are “equally real” to the ones I think I inhabit,
those words “equally real” sound like English. What do they actually suppose to mean?
I really think that it is impossible to attach any intelligible meaning to that statement.
13.6. KOLLAPSMODELLE
13.6
259
Kollapsmodelle
Da das Reduktionsproblem im Rahmen der herkömmlichen Formulierung der Quantenmechanik unvermeidbar zu sein scheint, wurden viele Ansätze entwickelt, die Quantenmechanik um einen dynamischen Kollapsprozess“ zu erweitern. Der Formalismus
”
der Quantentheorie, insbesondere die Schrödinger-Gleichung, müssen dazu explizit abgeändert werden. Bei den meisten dieser Ansätze wird die Schrödinger-Gleichung um
einen Term erweitert, der nicht-linear von der Wellenfunktion abhängt und dynamisch
zu einem Kollaps führt. Solche Modelle machen Vorhersagen, die auf bestimmten Skalen von der quantenmechanischen Beschreibung abweichen, allerdings sind solche Abweichungen bis heute noch nicht experimentell nachweisbar.
Die Modelle unterscheiden sich im Wesentlichen in der Natur der Entität, die
den Kollaps der Wellenfunktion bewirkt. Bei den im Folgenden kurz skizzierten Modellen sind das (1) das Bewusstsein, (2) die Gravitation und (3) stochastische Kollapszentren. Der Vorteil solcher dynamischer Kollapsmodelle liegt darin, dass sie zu ihrer
Formulierung keine klassische Welt“ oder einen Beobachter“ fordern müssen. Sie
”
”
sind in diesem Sinne also konsistente Theorien, ähnlich wie die Bohm’sche Mechanik,
auf die im nächsten Abschnitt eingegangen wird.
13.6.1
Wigner und der Einfluss des Bewusstseins
Erste Versuche in dieser Richtung gehen auf Eugene Paul Wigner (1902–1995) zurück:
Er glaubte, dass Bewusstseinsprozesse dynamisch auf die Wellenfunktion einwirken
könnten und zu einer Reduktion führten. Er postulierte dazu eine Wechselwirkung
zwischen herkömmlicher Materie und der Entität“ (Geist?), die er als Träger von
”
Bewusstsein ansah. Dabei stieß er allerdings auf gewisse Paradoxien.
Eine dieser Paradoxien wurde unter der Bezeichnung Wigners Freund“ be”
kannt: Nach einer Messung an einem Quantensystem (bei der sich System und Messgerät in einem verschränkten Zustand befinden) liest ein erster Beobachter das Messgerät ab. Durch sein Bewusstsein reduziert sich der Zustand. Wie beschreibt nun ein
zweiter Beobachter, der das Ergebnis noch nicht kennt, den Zustand? Sind für ihn nun
das Quantensystem, das Messgerät und der erste Beobachter in einem verschränkten
Superpositionszustand und erst durch seine Kenntnisnahme wird der Zustand reduziert, oder hat bereits der erste Beobachter eine allgemeine Reduktion herbeigeführt?
Noch verwirrender wird die Lage, wenn der zweite Beobachter nicht weiß, dass
das Ergebnis schon von einem ersten Beobachter abgelesen wurde. Er verwendet eine
unreduzierte Wellenfunktion zur Beschreibung des Systems, der erste Beobachter eine
reduzierte. Experimentell lässt sich kein Widerspruch herbeiführen: Man kann nicht
messen, ob eine Wellenfunktion schon reduziert ist.
Nimmt man Wigners Theorie des Bewusstseinseinflusses auf ein System Ernst,
260
Probleme, Fragen und Interpretationen
stellt sich auch die Frage, was genau Bewusstsein ist? Würde schon das Bewusstsein
einer Katze, die zwar den Zeiger am Messgerät betrachten, allerdings aus dem Beobachteten vermutlich keine Schlüsse ziehen kann, den Kollaps herbeiführen? Oder
Bedarf es einer gewissen Intelligenz und insbesondere eines Verständnisses, was die
Zeigerstellung aussagt? Befand sich das Universum für viele Milliarden Jahre in einer
Superposition, bis ein erstes Wesen mit ausreichendem Bewusstsein die Welt beobachtete?
Wigner hat sich in den 70er Jahren von seine Vorstellungen distanziert, nachdem er mit den Dekohärenztheorien vertraut wurde. Ein heutiger Anhänger der Idee,
dass eine Wechselwirkung zwischen Bewusstsein und Materie zur Reduktion des Quantenzustands führt, ist Henry Stapp [71].
13.6.2
Die Gravitation als Auslöser der Reduktion
Viele Physiker sind der Meinung, dass die Quantentheorie nicht vollständig ist, solange die Gravitation bzw. die Geometrie der Raumzeit nicht Teil des Formalismus’
geworden sind, und dass eine Einbeziehung der Gravitation auch das Problem der
Quantenzustandsreduktion lösen wird.
Erste Ansätze gehen hier auf Frigyes (Fritzi) Károlyházy (1929-2012) zurück
[46]. Später wurde eine ähnliche Idee von Roger Penrose entwickelt [62]. Will man
Gravitation in die Quantentheorie einbeziehen, muss man (nach den gängigen Vorstellungen) auch Superpositionszustände bezüglich der Geometrie der Raumzeit zulassen.
Befindet sich beispielsweise ein Teilchen in einem Superpositionszustand zu verschiedenen Orten (wie z.B. beim Doppelspaltexperiment), so muss dieser Zustand verschränkt
sein mit einer Raumzeitgeometrie zu unterschiedlichen Krümmungen. Die Annahme
ist nun, dass die Gravitation solche Superpositionszustände über ein gewisses Maß
hinaus nicht zulässt und damit auch zu einer dynamischen Reduktion des Superpositionszustands der Materie führt.
In diesen Modellen wird die Grundidee der Quantentheorie also abgeändert,
indem nicht-lineare Effekte (in diesem Fall induziert durch die Gravitation) zu einem
Kollaps der Wellenfunktion führen.
13.6.3
GRW – stochastische Kollapszentren
Im Jahre 1985 formulierten Giancarlo Ghirardi, Alberto Rimini und Tullio Weber
[33] ebenfalls ein dynamisches Kollapsmodell, bei dem die Schrödinger-Gleichung um
einen in der Wellenfunktion nicht-linearen stochastischen Term erweitert wird. Dieser
zusätzliche Term beschreibt den Einfluss von stochastisch im Raum verteilten Kollapszentren auf die Wellenfunktion. Trifft die Wellenfunktion auf eines dieser Kollapszentren, kommt es zu einer dynamischen Reduktion um dieses Zentrum herum.
Bohm’sche Mechanik
261
Die zusätzlichen Parameter dieses Modells (das heute als GRW-Modell bekannt
ist), sind die mittlere Dichte der Kollapszentren sowie eine mittlere Reichweite, auf
welche die Wellenfunktion bei einem Kollapszentrum reduziert wird. Beide Parameter
sind so gewählt, dass für kleine Massen (oder wenige Teilchen), ein spürbarer Einfluss
dieser Kollapszentren erst in Tausenden bis Millionen von Jahren auftritt, wohingegen für makroskopische Massen (bzw. Teilchenzahlen) dieser Einfluss nahezu instantan ist. Das Modell macht zwar prinzipielle Vorhersagen zu Abweichungen von der
herkömmlichen Quantenmechanik, allerdings liegen diese noch außerhalb der heutigen
experimentellen Möglichkeiten.
Wie die meisten dynamischen Kollapsmodelle hat auch die Theorie von GhirardiRimini-Weber Probleme mit einer relativistischen Formulierung. Nach der Quantentheorie sollte der Kollaps instantan im gesamten Raum erfolgen. Der Nachweis der
Verletzung der Bell’schen Ungleichungen beispielsweise durch Aspect [1] auch über
Bereiche, die keinen relativistischen Signalaustausch zulassen, zeigt, dass auch GRW
nicht-lokal sein muss. Tatsächlich wurden bis heute nur Verallgemeinerungen von GRW
auf freie relativistische Teilchen formuliert [72]. GRW ist eine nicht-lokale Theorie in
dem Sinne, dass die Kollapszentren nicht-lokal korreliert sein müssen, um beispielsweise die EPR-Phänomene beschreiben zu können.
13.7
Bohm’sche Mechanik
Eines der bekanntesten Modelle und sicherlich das am weitesten ausgearbeitete Modell für eine Formulierung der Quantenmechanik mit verborgenen Variablen stammt
von David Bohm [10] aus dem Jahre 1952. Ähnliche Ideen wurden schon 1926 von
Louis de Broglie [20] (siehe auch [2]) und von E. Madelung [55] geäußert. Nach kritischen Bemerkungen von Pauli im Anschluss an einen Vortrag von de Broglie auf der
Solvay Konferenz 1927 (siehe auch [61]) wurden diese Ideen aber zunächst nicht weiter verfolgt. Vermutlich kannte Bohm die Arbeiten von de Broglie nicht. Als Bezeichnung dieser Modelle findet man manchmal auch Führungsfeldtheorie“ oder Dop”
”
pellösunginterpretation“.
13.7.1
Die allgemeine Idee
Die grundlegende Idee von Bohm besteht darin, das Schrödinger-Feld Ψ(x) und das
zugehörige Teilchen (mit einer klassischen Trajektorie x(t)) als zwei verschiedene, real
existierende Entitäten anzusehen. Das Feld Ψ(x) genügt der Schrödinger-Gleichung,
das Teilchen folgt einer Dynamik, die es an das Feld bindet und durch die seine mittlere Aufenthaltswahrscheinlichkeit an einem Punkt x proportional zu |Ψ(x)|2 ist. Da
sich Ort und Impuls des Teilchens selber nicht bestimmen lassen – dies ist für Bohm
262
Probleme, Fragen und Interpretationen
kein Postulat, sondern ergibt sich aus seiner Theorie des Messprozesses –, muss mit
einem Teilchenensemble gerechnet werden, dessen Verteilung ebenfalls durch |Ψ(x)|2
gegeben ist. Dieser statistische Aspekt der Bohm’schen Theorie ist allerdings nur Ausdruck unserer Unkenntnis der Anfangsbedingungen (und damit der Trajektorien) der
einzelnen Teilchen.
Die Mathematik der Bohm’schen Mechanik ergibt sich nahezu ausschließlich aus
der Schrödinger-Gleichung. Daher kann man auch beweisen, dass die Vorhersagen der
Bohm’schen Mechanik identisch zu denen der Quantenmechanik sind. Die Gleichungen
der Quantenmechanik werden lediglich um eine Gleichung erweitert, welche die Trajektorie des Teilchens festlegt. Außerdem bedarf es einer Theorie des Messprozesses.
Man kann allerdings darüber streiten, was genau im Bohm’schen Modell die verbor”
genen Variablen“ sind: Der (im Sinne einer klassischen Theorie) Zustandsraum eines
Einteilchensystems ist durch {(Ψ, x)} gegeben, d.h., neben der Wellenfunktion gibt es
zusätzliche noch den Ort des Teilchens. In diesem Sinne wäre also die Teilchenposition
x(t) die verborgene Variable, die es in der Quantenmechanik nicht gibt. Trotzdem ist
nach der Bohm’schen Theorie der Ort des Teilchens nicht verborgen“, da bei einer
”
Messung gerade dieser Ort in Erscheinung tritt.
Das Modell beschreibt insbesondere Einteilchensysteme ausgezeichnet. Betrachten wir als Beispiel das Doppelspaltexperiment: Von der Quelle wird sowohl die Schrödinger-Welle als auch das Elektron emittiert. Der exakte Ort und damit die exakte
Trajektorie des Teilchens sind allerdings nicht bekannt. Die Schrödinger-Welle breitet
sich nach der Schrödinger-Gleichung aus, d.h. es kommt hinter den beiden Spalten zu
einer Superposition der beiden Anteile dieser Welle und zu den bekannten Interferenzmustern. Da aufgrund der dynamischen Gesetze die Aufenthaltswahrscheinlichkeit des
Teilchens proportional zu |Ψ(x)|2 ist, und da die Anfangsbedingungen verschiedener
Teilchen nicht genau bekannt sind und über diese gemittelt werden muss, treffen die
Teilchen genau dem Interferenzmuster der Welle entsprechend auf der Detektorplatte
auf.
Die Schrödinger-Welle bestimmt somit die Ausbreitung des Teilchens und seine Aufenthaltswahrscheinlichkeit an bestimmten Orten. Trifft das Teilchen auf einen
Detektor, wechselwirkt es unmittelbar mit den dortigen Atomen und bewirkt so einen
punktförmigen Nachweis.
Bohm diskutiert in seiner Arbeit auch den Messprozess und seine Auswirkungen auf das Verhalten der Schrödinger-Welle ausführlich. Er betont insbesondere den
Einfluss der verborgenen Variablen des Messinstruments auf das Ergebnis. Darin liegt
für ihn die Ursache, warum sein Modell nicht unter die Einschränkungen des von
Neumannschen Beweises fällt (und auch nicht unter andere No-Hidden-Variable Theoreme).
Wir werden im Folgenden nur die wesentlichen mathematischen Aspekte der
Bohm’sche Mechanik
263
Bohm’schen Theorie behandeln sowie einige Kritikpunkte aufzählen. Die Arbeit von
Bohm ist wesentlich ausführlicher und die Rechnungen detaillierter.
13.7.2
Das Quantenpotential
Ausgangspunkt der Bohm’schen Mechanik ist die Schrödinger-Gleichung in der bekannten Form:
~2
∂Ψ
= −
∆Ψ + V (x)Ψ .
(13.17)
i~
∂t
2m
Für die Wellenfunktion wählen wir nun folgende Darstellung
i
Ψ(x, t) = R(x, t) exp
S(x, t)
(13.18)
~
mit reellen R(x, t) und S(x, t). Die Trennung in Real- und Imaginärteil der SchrödingerGleichung führt auf die Differentialgleichungen:
1
∂R
= −
(R∆S + 2∇R · ∇S) ,
∂t
2m
(∇S)2
~2 ∆R
∂S
= −
+ V (x) −
.
∂t
2m
2m R
(13.19)
(13.20)
Statt R können wir auch das Absolutquadrat der Wellenfunktion einführen, P (x) =
R(x)2 , und erhalten die Differentialgleichungen:
∂P
∇S
+∇· P
= 0,
(13.21)
∂t
m
~2 ∆P
1 (∇P )2
∂S (∇S)2
+
+ V (x) −
−
= 0.
(13.22)
∂t
2m
4m P
2 P2
Bisher handelt es sich lediglich um eine Umformulierung der Schrödinger-Gleichung.
Die formalen Ähnlichkeiten zu Gleichungen aus der klassischen Physik (beispielsweise
Gleichungen aus der Hydrodynamik und natürlich dem Hamilton-Jacobi-Formalismus)
haben jedoch immer wieder Anlass für klassische Interpretationen der Quantenmechanik gegeben. Die Bohm’sche Mechanik ist nur eine Möglichkeit.
Im Grenzfall1 ~ → 0 haben die beiden Gleichungen (13.21) und (13.20) bzw.
(13.22) eine einfache physikalische Interpretation: Die Differentialgleichung für S entspricht einer Hamilton-Jacobi-Gleichung mit Potential V (x). Aus der klassischen Mechanik ist dann Folgendes bekannt: Sei S(x) eine Lösung der Hamilton-Jacobi-Gleichung,
dann gilt für jede Lösung der Newtonschen Bewegungsgleichungen, für die an einem
1
Setzt man in den Gleichungen ~ = 0, so entspricht das nur formal diesem Grenzfall. Es muss
noch gezeigt werden, dass die Terme, die von ~2 multipliziert werden, nicht von der Ordnung 1/~2
sind. Dies ist beispielsweise bei stationären Lösungen der Schrödinger-Gleichung der Fall.
264
Probleme, Fragen und Interpretationen
Punkt der Impuls gleich dem Gradienten von S(x) ist, dass dies entlang der gesamten Trajektorie gilt. Mit anderen Worten, das Gradientenfeld für eine Lösung der
Hamilton-Jacobi-Gleichung,
∇S(x)
v(x) =
,
(13.23)
m
ist das Geschwindigkeitsfeld von Lösungen der Newton’schen Bewegungsgleichungen.
Zur Bestimmung einer Bewegungsgleichung müssen wir nun nur noch“ eine Differen”
tialgleichung erster Ordnung lösen:
ẋ(t) =
∇S(x(t))
.
m
(13.24)
Die sich daraus ergebende Differentialgleichung für P ,
∂P
+ ∇ · (P v) = 0 ,
∂t
ist eine Kontinuitätsgleichung für die Wahrscheinlichkeitsdichte (bwz. Ensembledichte)
P und den Wahrscheinlichkeitsstrom“ (bzw. Teilchenstrom im Ensemble) P v.
”
Diese Beziehung zwischen der Schrödinger-Gleichung und der zugehörigen klassischen Mechanik im formalen Grenzfall ~ → 0 lässt sich zu einer systematischen
Behandlung des klassischen Grenzfalls erweitern und ist (in erster nicht-trivialer Ordnung von ~) als WKB-Näherung bekannt. In der Wellenoptik kennt man eine ähnliche
Näherung als Kurzwellenasymptotik“; sie beschreibt den Übergang von der Wellen”
optik zur geometrischen Optik.
Bohm stellte nun fest, dass diese Interpretation der Gleichungen (13.22) und
(13.21) auch für ~ 6= 0 aufrecht erhalten werden kann. Gleichung (13.22) ist immer
noch eine Hamilton-Jacobi-Gleichung, allerdings kommt zu dem klassischen Potential
V (x) noch ein sogenanntes Quantenpotenzial,
~2 ∆R
∆P
1 (∇P )2
U (x) = −
.
=
−
2m R
P
2 P2
hinzu. Neben die Schrödinger-Gleichung (aufgefasst als Gleichungen für S(x) und
P (x)) tritt nun noch die Gleichung 13.24 (ẋ(t) = ∇S(x(t))/m), deren Lösungen Trajektorien sind, die als physikalische Trajektorien real existierender Teilchen aufgefasst
werden. Gleichung (13.21) ist nach wie vor eine Kontinuitätsgleichung für die Wahrscheinlichkeitsdichte P .
Zu der Differentialgleichung für die Teilchentrajektorien (Gl. 13.24) gibt es
natürlich auch eine Newton’sche Bewegungsgleichung, die das Quantenpotenzial enthält
und in manchen Situationen eine gewisse Anschauung vermittelt:
~2 ∆R
d2 x
m 2 = −∇ V (x) −
.
(13.25)
dt
2m R
Bohm’sche Mechanik
265
Das sollte jedoch nicht darüber hinwegtäuschen, dass die eigentliche Trajektoriengleichung (Gl. 13.24) erster Ordnung in der Zeit ist. Daraus ergeben sich weitreichende
Konsequenzen, beispielsweise auch ein so genanntes No-Crossing“-Theorem, wonach
”
sich zwei Trajektorien niemals schneiden können (da eine Trajektorie durch die Vorgabe eines Ortes schon bestimmt ist). In der Bohm’schen Mechanik ist das Führungsfeld
S(x) durch die Anfangsbedingungen an die Wellenfunktion ψ(x) festgelegt, wohingegen es in der Newton’schen Mechanik eine Schar von Lösungen zur Hamilton-JacobiGleichung geben kann. Daher können sich Newton’sche Trajektorien auch kreuzen,
nämlich wenn sie zu verschiedenen Lösungen S(x) gehören.
Entspricht in der Bohm’schen Mechanik die anfängliche Ortsverteilung der Teilchen der Verteilung P (x), so garantiert die Unitarität der Schrödinger-Gleichung die
Erhaltung dieser Wahrscheinlichkeit, bzw. die Hamilton-Jacobi-Gleichung garantiert,
dass die Ensembleverteilung unter der Zeitentwicklung des Systems weiterhin durch
P (x) gegeben ist. Doch selbst wenn die anfängliche Verteilung nicht durch P (x) gegeben ist, kann man für viele Fälle beweisen, dass P (x) sehr rasch angenähert wird.
Gleichung (13.21) drückt als Kontinuitätsgleichung die Erhaltung der Teilchenzahl aus. Lokal kann sich die Teilchenzahl nur dadurch ändern, dass Teilchen aus dem
Gebiet abfliessen bzw. hinzukommen. Dies ist eine natürliche Forderung. In der Quantenmechanik entspricht P einer Wahrscheinlichkeit. In diesem Fall ist die Forderung
einer Kontinuitätsgleichung weniger selbstverständlich. Es gibt keinen Grund, warum
Wahrscheinlichkeit aus einem Gebiet abfließen“ muss, wenn sich die Wahrscheinlich”
keit ändert. Die Gesamtwahrscheinlichkeit ist zwar erhalten, aber eine Verringerung
in einem Raumgebiet kann durch eine Erhöhung in einem anderen Raumgebiet kompensiert werden, ohne dass ein Fluss“ stattfindet.
”
13.7.3
Klassisch oder Quanten
Manchmal erhebt sich die Frage, ob die Bohm’sche Mechanik nun eine klassische Theorie oder eine Quantentheorie sei. Die Anhänger vertreten meist den Standpunkt, dass
es sich um eine Quantentheorie handelt: Die Theorie enthält den Parameter ~, der typischerweise Quanteneffekte anzeigt, sie reproduziert sämtliche Vorhersagen der Quantentheorie, und schließlich tritt im Quantenpotenzial die Amplitude der Wellenfunktion
nur in einem Quotienten auf (vgl. Gl. 13.25), was dazu führt, dass auch an Stellen,
wo die Amplitude sehr klein ist, ein spürbarer Einfluss möglich ist. Dies ist einer der
Gründe für den holistischen“ Charakter der Quantenmechanik (Einflüsse können auch
”
über große Distanzen hinweg wesentlich sein).
Andererseits kann man auch die Meinung vertreten, dass es sich bei der Bohm’schen
Mechanik um eine klassische Theorie handelt: Sie beruht auf einem klassischen (Newton’schen) Teilchenverständnis und einem klassischen Feldbegriff. Beide Entitäten –
266
Probleme, Fragen und Interpretationen
Teilchen und Welle – existieren als objektive Realität und haben somit zu jedem Zeitpunkt objektiv wohldefinierte Eigenschaften, unabhängig von irgendwelchen Beobachtern oder Beobachtungen. Außerdem handelt es sich um eine deterministische Theorie
mit Bewegungsgleichungen bzw. Feldgleichungen wie in der klassischen Physik.
Mein Standpunkt ist, dass es sich bei der Bohm’schen Mechanik zwar um eine Quantentheorie handelt (aufgrund der oben angegebenen Argumente), allerdings
um eine Theorie mit einer klassischen Ontologie. Das bedeutet, die fundamentalen
Freiheitsgrade der Theorie haben dieselbe Ontologie (im Sinne des zweiten obigen
Absatzes) wie in der klassischen Mechanik.
13.7.4
Vorteile der Bohm’schen Mechanik
Der wesentlich Vorteil der Bohm’schen Mechanik ist natürlich, dass es sich um ein
konsistentes Modell der Quantenmechanik handelt. Es reproduziert sämtliche Vorhersagen der Quantenmechanik, aber es benötigt keinen Bezug auf einen Beobachter oder
eine Messung (und damit auf keine klassische Welt“). Auch der Kollaps der Wellen”
funktion ist kein Problem: Da sich Teilchen immer an einem bestimmten Ort befinden,
gibt es nur diese eine Realität“, alle anderen Zweige der Wellenfunktion sind leer und
”
werden für die zukünfte Entwicklung des Systems (nachdem die Welle genügend dekohärent geworden ist) nicht mehr benötigt. Die Bohm’sche Mechanik besitzt somit
nicht die Inkonsistenzen“ der Quantenmechanik.
”
Außerdem finden viele der als seltsam empfundenen Aspekte der Quantenmechanik eine einfache Erklärung, unter anderem auch die Interferenzeffekte von Teilchen.
Wäre das Zitat von Feynman zu Beginn von Kapitel 3, wonach das Doppelspaltexperiment das einzige Wundersame der Quantentheorie ist (dieses Feynman-Zitat wird von
Bohmianern auch gerne herangezogen), tatsächlich richtig, dann hat die Bohm’sche
Mechanik diesen Aspekt elegant geklärt. Welle-Teilchen-Dualismus oder Komplementarität sind für die Bohm’sche Mechanik keine Probleme. Interessanterweise kannte
Feynman die Bohm’sche Mechanik, aber er hat sie nie näher als Modell für die Quantenmechanik in Betracht gezogen.
Weiterhin ist die Bohm’sche Mechanik eine intrinsisch deterministische Theorie – die beobachteten Zufälligkeiten beruhen auf unserer Unkenntnis hinsichtlich der
tatsächlichen Teilchentrajektorien – mit einem subjektunabhängigen, realistischen Objektbegriff. Der intrinsische Determinismus umgeht die philosophischen Probleme, die
mit der Aufgabe beispielsweise des Prinzips vom hinreichenden Grund (Leibniz: Nichts
geschieht, ohne dass derjenige, der die Dinge hinlänglich genau kennte, angeben kann,
weshalb etwas genau so und nicht anders geschehen ist [53]) verbunden sind. Die Welt
ist kausal abgeschlossen. Und der objektive Realismus umgeht die Probleme im Zusammenhang mit einem partizipatorischen Universum“, bei dem der Beobachter an
”
Bohm’sche Mechanik
267
der Gestaltung der Realität teil hat.
Aus den genannten Gründen hat die Bohm’sche Mechanik gerade unter den
Wissenschaftsphilosophen viele Anhänger. Auch John Bell sah in der Bohm’schen Mechanik (ebenso wie in den Kollapsmodellen von GRW) vielversprechende Ansätze zur
Lösung der Probleme, an denen seiner Meinung nach die herkömmlichen Formulierungen der Quantenmechanik kranken.
13.7.5
Kritikpunkte an der Bohm’schen Mechanik
Im Folgenden sollen kurz einige Kritik- bzw. Schwachpunkte an der Bohm’schen Theorie zusammengefasst werden, allerdings ohne dass die Bohm’sche Theorie dadurch
widerlegt werden kann. Ihre Vorhersagen sind beweisbar identisch zu denen der Quantenmechanik, wodurch eine Widerlegung immer auch eine Widerlegung der Quantenmechanik bedeuten würde. Im Gegensatz zum Problem des Messprozesses, das für die
Quantenmechanik grundlegend ist, handelt es sich bei den meisten Kritikpunkten an
der Bohm’schen Mechanik eher um Schönheitsfehler“.
”
Mehrteilchensysteme
Als eine erste Schwäche der Bohm’schen Theorie wird ihre Behandlung von Mehrteilchensystemen angesehen. Das Schrödinger-Feld von n Teilchen, Ψ(x1 , ..., xn , t), ist
eine Funktion von 3n + 1 Variablen. Dieses Feld lebt“ also nicht mehr auf unse”
rem dreidimensionalen Anschauungsraum, sondern auf dem Konfigurationsraum der
Teilchen. In diesem Sinne unterscheidet es sich wesentlich von dem elektromagnetischen Feld oder dem Gravitationsfeld, die ebenfalls mit einer gewissen Berechtigung
als Führungsfelder“ für Teilchen mit einer Ladung bzw. Energie angesehen werden
”
können.
Der (berechtigte) Einwand von Bohmianern gegen dieses Argument lautet, dass
auch die Hamilton-Jacobi-Gleichung eines klassischen Systems von n Teilchen eine Differentialgleichung für eine Funktion S(x1 , ..., xn ) von 3n Variablen darstellt. Und wenn
es zwischen n Teilchen eine Wechselwirkung gibt, so ist das zugehörige Potenzialfeld
V (x1 , ..., xn ) ebenfalls eine Funktion von allen Orten.
In der klassischen Mechanik wird S(x1 , ..., xn ) als eine mathematische Hilfsgröße angesehehn, mit der sich Scharen von Trajektorien elegant beschreiben lassen.
Eine unmittelbare physikalische Bedeutung hat dieses Feld dort nicht. Das gilt eher
schon für das Potenzial V (x1 , ..., xn ). Doch auch diesem würde man eine physikalische
Bedeutung nur insofern zusprechen, als es durch die konkret realisierten Orte von n
Teilchen definiert ist – nicht dem verallgemeinerten Potenzialfeld für alle möglichen
Orte der Teilchen. Anders ist dies bei externen Potenzialen, wie sie sich aus den elektrischen und gravitativen Kräften ergeben, doch diese leben auf dem Ortsraum und nicht
268
Probleme, Fragen und Interpretationen
dem Konfigurationsraum. Die Ontologie des Führungsfeldes bleibt in der Bohm’schen
Mechanik offen.
Die Statistik der Teilchen
Die effektive Abstoßung zwischen Fermionen (und entsprechend eine Form der An”
ziehung“ bei Bosonen) erfolgt in der Bohm’schen Theorie über das Quantenpotenzial.
Allerdings ist die Antisymmetrie des Quantenpotentials bei Fermionen (bzw. die Symmetrie bei Bosonen) keine Folgerung aus der Schrödinger-Gleichung, sondern muss
zusätzlich gefordert werden.
Das Gleiche gilt auch in der herkömmlichen Quantenmechanik. Allerdings kann
man zeigen, dass im Rahmen einer Quantenfeldtheorie der Zusammenhang zwischen
dem Spin und der Statistik aus sehr allgemeinen Forderungen (in erster Linie der
relativistischen Invarianz) folgt [70]. Inwieweit das auch für die Bohm’sche Mechanik
gilt bleibt offen, solange eine relativistische Formulierung noch aussteht.
Der Spin
Das oben behandelte Bohm’sche Modell basiert auf einer Schrödinger-Gleichung für
spinlose Teilchen. Es gibt von Bohm zwar auch klassische“ Modelle für Spin-1/2”
Teilchen, doch die finden meist keine Anwendung. Statt dessen wird das SchrödingerFeld zu einer 2-komponentigen Größe (entsprechend der Pauli’schen Theorie des Spins,
siehe Abschnitt 9.3.1), es wirken also im Prinzip zwei Quantenpotenziale auf ein Teilchen ein. Die Ablenkung eines Elektrons in einem Stern-Gerlach-Magnetfeld erfolgt
demnach aufgrund seiner Trajektorie, nicht aufgrund einer intrinsischen Eigenschaft
Spin“ oder Polarisation“. Außerdem gehen natürlich die Anfangsbedingungen für
”
”
die Führungsfelder (die Art der Präparation des Systems) ein.
Die Nicht-Lokalität
Bohm diskutiert in Teil II seines Artikels [10] den Messprozess sehr ausführlich und
kommt zu dem Schluss, dass die verborgenen Parameter des Messgerätes eine wesentliche Rolle spielen. Diese Einbeziehung der verborgenen Parameter des Messgerätes ist
wichtig, da so das von Neumann’sche Theorem (ebenso wie andere Theoreme ähnlicher
Art – Jauch–Piron, Gleason, etc.) umgangen wird. Die Erwartungswerte von Observablen sind im Bohm’schen Modell keine linearen Funktionale der Observablen.
Da die Bohm’sche Theorie in allen Teilen mit den Vorhersagen der Quantenmechanik übereinstimmt, enthält sie auch die spooky action at a distance“ – d.h. eine
”
nicht-lokale Wirkung, die wir im Zusammenhang mit den Bell’schen Ungleichungen
(Abschnitt 8.4) angesprochen haben. Während sich andere Deutungen der Quantenmechanik in diesem Zusammenhang auf den subjektiven Charakter der Wellenfunk-
Bohm’sche Mechanik
269
tion beziehen können und die Reduktion als nicht ontologisch ansehen, ist die NichtLokalität ein wesentlicher Bestandteil der Bohm’schen Mechanik. Sie äußert sich zwar
nicht in einer Verletzung der Relativitätstheorie (auch in der Bohm’schen Mechanik
ist der Kollaps weder mit einer Energie- noch einer Signalübertragung verbunden),
bleibt aber wegen ihres ontologischen Charakters spooky“.
”
Die Asymmetrie zwischen Ort und Impuls
Die Formulierung der herkömmlichen Quantenmechanik ist symmetrisch in Orts- und
Impulsvariablen. Grundsätzlich kann jede Darstellung (d.h. jeder Satz von kompatiblen Observablen) als Basis gewählt werden. Die Bohm’sche Formulierung hängt
jedoch wesentlich von der Ortsdarstellung ab: Die Ontologie des Führungsfeldes bezieht sich auf den Ortsraum und die Teilchen propagieren als punktförmige Objekte im
Ortsraum. Während die Quantenmechanik ebenso von der Schrödinger-Gleichung im
Impulsraum ausgehen kann, ist dies für die Bohm’sche Interpretation nicht der Fall.
Diese Brechung der Symmetrie zwischen Ort und Impuls, die in der herkömmtlichen
”
”
Interpretation der Quantenmechanik noch gegeben ist, wurde insbesondere von Heisenberg und Pauli immer als Hauptkritikpunkt am Bohm’schen Modell betont.
Diesem Argument kann man allerdings entgegen halten, dass in der relativistischen Mechanik die Symmetrie zwischen Ort und Impuls ebenfalls gebrochen ist.
Das Prinzip der Mikrokausalität (kausale Einflüsse können sich nicht schneller als mit
Lichtgeschwindigkeit ausbreiten) gilt bezüglich des Raums bzw. der Raumzeit. NichtLokalität im Impulsraum (ein Teilchen mit großem Impuls wechselwirkt mit einem
Teilchen mit kleinem Impuls) ist etwas vollkommen Natürliches. Von da her ist die
Auszeichnung des Ortsraums nachvollziehbar.2 Ebenfalls für eine Auszeichnung des
Raumes wird oft angeführt, dass fast alle (wenn nicht alle) Messungen letztendlich
Ortsraummessungen sind. Jedes Ablesen einer Zeigerstellung an einem Messinstrument ist eine Ortsmessung.
Die Teilchentrajektorien
Mehr noch als alle anderen Argumente ist das folgende eher ein Schönheitsfehler“ und
”
kein wirkliches Gegenargument: Die Teilchentrajektorien erscheinen unter bestimmten
Umständen sehr unnatürlich.
Betrachten wir als Beispiel Energieeigenzustände, gleichgültig zu welchem Potenzial. Energieeigenzustände können bis auf eine globale, ortsunabhängige Phase reell
~
gewählt werden. Das bedeutet aber insbesondere ∇S/m
= v(t) = 0. Somit gilt für
2
Allerdings gibt es hier einen seltsamen Zirkelschluss: Die Bohm’sche Mechanik ist auch hinsichtlich des Raums nicht-lokal – siehe vorherigen Abschnitt – und somit scheint der Grund für die
Auszeichnung des Raums gegenüber den anderen Eigenschaften hinfällig.
270
Probleme, Fragen und Interpretationen
die Teilchentrajektorien in Energieeigenzuständen x(t) = x0 . Diese Teilchen bewegen
sich also nicht, sondern befinden sich lediglich entsprechend einer Wahrscheinlichkeitsverteilung ψ(x)2 an bestimmten Orten. Das erscheint insofern unnatürlich, als diese
Zustände beliebig hohe Energien, Drehimpulse oder auch Impulserwartungswerte haben können. Daran erkennt man auch, dass mit Ausnahme des Ortsoperators die
~ etc. nichts mit dem Impuls, der EnerErwartungswerte von Operatoren wie P , H, L
gie oder dem Drehimpuls der Teilchen zu tun haben, sondern eher mit der Form der
Wellenfunktion.
Die nicht-relativistische Schrödinger-Gleichung
Der Ausgangspunkt für das Bohm’sche Modell ist die nicht-relativistische SchrödingerGleichung, und viele Überlegungen hängen von der speziellen Form dieser Gleichung
ab. Verallgemeinerungen auf die Dirac-Gleichung sind zwar möglich, allerdings wiederum nur um den Preis zunehmender Unnatürlichkeit“.
”
Eine relativistische Formulierung der Bohm’schen Mechanik scheint schon alleine wegen der erwähnten Nicht-Lokalität (z.B. bei Zwei-Teilchen-Zuständen) zu einem
grundlegenden Problem zu werden. Wenn die Wellenfunktion wie in der Bohm’schen
Mechanik eine ontologische Bedeutung hat, dann zeichnet die instantane globale Änderung dieser Wellenfunktion als Folge einer Messung ein Bezugssystem aus, und das
widerspricht der relativistischen Invarianz.
Quantenfeldtheorie
Eine vollständige Beschreibung der Elementarteilchen einschließlich der Prozesse ihrer
Umwandlung (Paarerzeugung, Annihilation, Zerfälle, etc.) ist bisher nur im Rahmen
der Quantenfeldtheorie möglich. Daher sollte, wenn überhaupt, eine Ontologie an dieser Stelle ansetzen. Doch die Quantenfeldtheorie des Standardmodells ist selbst nur
eine phänomenologische Theorie: Sie ist der Niederenergielimes (oder Skalenlimes)
einer noch nicht bekannten tiefer liegenden Theorie, die auch die Gravitation mit einbezieht. Dieser phänomenologische Charakter der Quantenfeldtheorie wird besonders
an der Renormierung deutlich: Die formal auftretenden Unendlichkeiten lassen sich
durch einen Cut-off“ – ein Abschneiden der Theorie bei sehr hohen Impulsen bzw.
”
Energien – beseitigen, doch die nackten (unbeobachtbaren) Parameter der Theorie
hängen von diesem Cut-Off ab, sodass die physikalisch beobachteten Parameter Cutoff-unabhängig werden.
Wenn überhaupt, wären in der QFT die Felder ontologisch, doch die meisten
Bohm’schen Formulierungen von Quantenfeldtheorien gehen von Teilchen als fundamentalen Entitäten aus, obwohl eine Bohm’sche Mechanik für Felder ebenfalls möglich
ist.
Bohm’sche Mechanik
271
An dieser Stelle setzt der Kritikpunkt an, der für mich ausschlaggebend ist: Die
Quantenmechanik ist der nicht-relativistische Grenzfall der Quantenfeldtheorie, und
die Quantenfeldtheorie ist der niederenergetische Grenzfall einer noch nicht bekannten fundamental(er)en Theorie. Weshalb setzt man mit der Ontologie auf der Ebene
der Quantenmechanik an? Auf der Ebene einer Quantenfeldtheorie gibt es mehrere
Möglichkeiten, eine Bohm’sche Mechanik zu formulieren, die sich hinsichtlich ihrer
Ontologien unterscheiden. Da sie alle in ihren Vorhersagen übereinstimmen, kann man
zwischen den verschiedenen Versionen nicht unterscheiden. Doch wie kann man dann
behaupten, die wahre“ Ontologie gefunden zu haben?
”
13.7.6
Die Ontologie?
Für mich bleibt die Bohm’sche Mechanik ein interessantes Modell der Quantentheorie, das ich gelegentlich gerne zur Veranschaulichung gewisser Sachverhalte heranziehe.
Sie zeigt, dass eine solche widerspruchsfreie und beobachterunabhängige Formulierung
möglich ist. Aber abgesehen von ihrem ontologischen Balast“ (ein Ausdruck von Pau”
li) und ihrer Uneleganz“ – sicherlich ein subjektiver Eindruck – möchte ich mich auch
”
ungerne auf eine Ontologie festlegen lassen. Dafür gibt es mehrere Gründe:
1. Eine Theorie von Raum und Zeit ist noch nicht in zufriedenstellender Weise in
eine Quantentheorie einbezogen. Das bedeutet nicht nur, dass die bisherigen Formulierungen der Quantentheorie noch unvollständig hinsichtlich der bekannten
Freiheitsgrade in der Natur sind, sondern auch dass manche Begriffe der klassi”
schen“ Raum-Zeit möglicherweise in der vollen Theorie eine andere Bedeutung
erlangen können – dazu zählt beispielsweise auch der Begriff der Nicht-Lokalität.
2. Die Bohm’sche Mechanik stimmt zwar hinsichtlich ihrer Vorhersagen mit der
Quantenmechanik überein, aber wir wissen nicht, ob dies nicht auch für andere Modelle zutrifft, die eine objektive Realitätsvorstellung zulassen (ein Beispiel
für ein theoretisches Konzept, das in diese Richtung ausgebaut werden könnte,
findet man in [32]). All diese Modelle der Quantenmechanik wären hinsichtlich
ihrer experimentellen Vorhersagen identisch und könnten daher durch ein Experiment nicht unterschieden werden. Damit kann keines dieser Modelle von sich
in Anspruch nehmen, die Ontologie der Welt zu beschreiben.
272
Probleme, Fragen und Interpretationen
Kapitel A1
Endliches Kastenpotenzial
In diesem Anhang werden die beiden Fälle beim endlichen Kastenpotenzial (E > V
und E < V ) eingehender behandelt.
A1.1
E > V — freie Teilchen
Für E > V ist die rechte Seite der Schrödinger-Gleichung 6.58 sowohl innerhalb als
auch außerhalb des Kastens positiv, sodass die Lösungen durch Sinus- und Kosinusfunktionen gegeben sind. Für die folgenden Rechnungen definieren wir:
=
2mE
~2
und
ν=
2mV
.
~2
(A1.1)
Da wir die Lösungen immer symmetrisch bzw. antisymmetrisch wählen können, erhalten wir innerhalb des Kastens Lösungen von der Form
√
ψs (x) = a cos( x)
√
bzw. ψa (x) = b sin( x)
|x| ≤
L
.
2
(A1.2)
Für symmetrische Lösungen schreiben wir außerhalb des Kastens:
(
ψs (x) =
√
A0 cos( − νx + ϕs ) x >
√
A0 cos( − νx − ϕs ) x <
L
2
L
2
(A1.3)
L
2
L
2
(A1.4)
Entsprechend seien die antisymmetrischen Lösungen:
(
ψa (x) =
√
B 0 sin( − νx + ϕa ) x >
√
B 0 sin( − νx − ϕa ) x <
Durch diese Wahl erreichen wir, dass eine Festlegung der Konstanten (a, A, b, B, ϕs , ϕa )
bei x = + L2 automatisch auch bei x = − L2 gilt.
273
274
Anhang A
Die möglichen symmetrischen bzw. antisymmetrischen Lösungen sind also von
der Form:

√

x)
|x| ≤ L2

 a cos( √
ψs (x) =
(A1.5)
aA cos( − νx + ϕs ) x > L2

√

 aA cos( − νx − ϕ ) x < L
s
2

√

x)
|x| ≤ L2

 b sin( √
ψa (x) =
(A1.6)
bB sin( − νx + ϕa )
x > L2

√

 −bB sin( − νx − ϕ ) x < L
a
2
0
(Aus Gründen die gleich offensichtlich werden, haben wir A = aA und B 0 = bB
gesetzt.) Wir beschränken uns im Folgenden auf den symmetrischen Fall. Der antisymmetrische Fall folgt entsprechend.
Die Konstanten a, A und ϕs sind theoretisch durch zwei Bedingungen festgelegt:
(1) Es müssen die Anschlussbedingungen (einmal stetig differenzierbar) gelten, und (2)
die Funktionen müssen normiert werden.
Die zweite Bedingung sollte die Konstante a festlegen, ist aber offenbar nicht
erfüllbar. Das Integral über das Quadrat der Cosinus-Funktion über die gesamte reelle
Achse ist nicht endlich. Das ist ein bekanntes Problem für freie Lösungen in einem
unbegrenzten Raum. Wir können entweder das gesamte System in einen zweiten sehr
großen Kasten (mit unendlicher potenzieller Energie außerhalb) stecken, dessen Berandung sehr weit weg ist ( L), in diesem Fall wird der Normierungsfaktor sehr klein
aber er bleibt endlich. Oder wir verschmieren die Lösung mit einer Funktion die für
der große Werte von x sehr langsam und glatt gegen 0 geht. In diesem Fall haben
wir strenggenommen keine stationäre Lösung zu einem reinen Energieeigenwert mehr,
können diese aber beliebig genau approximieren. Wir werden diesen Punkt im Folgenen offen lassen und die Gesamtnormierung der Wellenfunktion nicht festlegen. Damit
können wir beispielsweise a = 1 setzen und haben uns nur noch um zwei Konstanten
zu kümmern.
Wir betrachten nun die Anschlussbedingungen bei x = L2 . Da wir einmal stetige
Differenzierbarkeit verlangen, erhalten wir zwei Bedingungen (die Wellenfunktionen
und ihre Ableitungen müssen jeweils denselben Wert haben):
√
√ L
L
= A cos
cos
− ν + ϕs
(A1.7)
2
2
und
√
√
√
√ L
L
− sin
= A − ν sin
− ν + ϕs
(A1.8)
2
2
Das sind zwei Bedingungen für ein noch unbestimmtes Amplitudenverhältnis A und
eine offene Phase ϕs , die für beliebige Werte von und ν immer lösbar sind. (Anschau√
lich wählt man zunächst A so, dass die Ableitungen bei einer Auslenkung von cos L2
Endliches Kastenpotenzial
275
übereinstimmen, anschließend wählt man die Phase so, dass die äußere Kurve an die
innere anschließt.)
((Schöne Übungsaufgabe mit Mathematica
Manipulate[Plot[Piecewise[{{Cos[a*x],x<L/2}{A*Cos[b*x+Varphi],x>L/2}}],
{x,0,L}],{A,0,5},{Varphi,0,2*Pi}]))
Eine Anmerkung noch zum Amplitudenverhältnis: Vergleicht man zwei Funktionen mit unterschiedlicher Wellenlänge, dann hat die rascher oszillierende Funktion
(also die Lösung innerhalb des Kastens) bei gegebener Auslenkung immer die größere
Steigung. Damit die Lösung innen und außen stetig ableitbar anschließen, muss daher
die Amplitude im äußeren Bereich größer sein als im inneren, also A > 1. Dies wird
insbesondere für sehr große Werte von E anschaulich, sodass man klassisch argumentieren kann: Im äußeren Bereich sind die Teilchen langsamer als im inneren und haben
dort (pro Längeneinheit) im Mittel eine größere Aufenthaltswahrscheinlichkeit als im
Inneren des Kastens.
Zusammenfassend können wir also festhalten: Für E > V gibt es keine Quantisierung der Energie sondern freie Teilchen. Die Amplitude der Lösung ist im äußeren
Bereich größer.
Etwas entartet ist der Grenzfall E = V . Nun gibt es außerhalb des Kastens
nur eine konstante Lösung (die beliebig genau durch eine quadratintegrable Funktion
approximiert werden kann), sie hat also immer die Ableitung null. Die möglichen
Wellen im Inneren des Kastens haben am Rand jedoch nur die Ableitung null, wenn
√
2mV /~2 = nπL.
Für den Fall E > V ist nicht nur jede Energie möglich, sondern für jeden Wert von E
gibt es sogar zwei unabhängige Lösungen: die symmetrische und die antisymmetrische. Keine der
beiden Lösungen ist eine Eigenfunktion zum Impulsoperator P , allerdings können wir durch Linearkombination zumindest in bestimmten Bereichen reine Impulseigenzustände erzeugen, d.h. reine
Exponentialfunktionen:
!
√
p 2mE
ψP (x) = exp ±i
x = exp i x .
(A1.9)
~
~
Die beiden Vorzeichen im Exponenten führen zu einem Eigenzustand zu +p und zu einem Eigenzustand zu −p, beschreiben also ein Teilchen, das sich entweder nach rechts oder nach links bewegt.
Wir können im Allgemeinen nur für einen der beiden Bereichen (innerhalb oder außerhalb des
Kastens) einen reinen Impulseigenzustand erreichen (wegen der unterschiedlichen Konstanten A und
B für die symmetrische und antisymmetrische Lösung). Im jeweils anderen Bereich gibt es beide Anteile in Superposition und mit unterschiedlichen Amplituden. Man kann dies als eine Streuung eines
Teils der Welle am Kastenrand interpretieren. Die relativen Amplituden würden dann einen transmittierten und einen reflektierten Anteil beschreiben und werden somit als Transmissionskoeffizient
und Reflektionskoeffizient bezeichnet.
276
A1.2
Anhang A
0 < E < V — gebundene Teilchen
Wir betrachten nun den Fall, dass die Energie der Teilchen kleiner ist als die Energie
des Kastenpotenzials, also E < V . Dabei behalten wir die Notation aus dem letzten
Abschnitt (Gl. A1.1) bei.
Zunächst einmal stellen wir fest, dass wegen der geforderten Quadratintegrabilität außerhalb des Kastens nur die Lösungen
√
L
x>
(A1.10)
ψ+ (x) = A exp(− ν − x)
2
√
L
0
ψ− (x) = A exp( ν − x)
x<−
(A1.11)
2
in Frage kommen. Diese können wir durch geeignete Wahl der Amplituden wieder als
Teil einer symmetrischen Lösung (wenn A = B) oder als Teil einer antisymmetrischen
Lösung (A = −B) schreiben.
Des weiteren müssen wir uns überzeugen, dass es wegen der geforderten Randbedingungen bei |x| = ± L2 keine Lösungen zu E < 0 geben kann. In diesem Fall kämen
innerhalb des Kastens nämlich nur der hyperbolische Kosinus oder der hyperbolische
Sinus als Lösung in Frage. Man könnte diese Lösungen zwar stetig an die obigen Exponentiallösungen anschließen, allerdings hätte die Lösung dann am Kastenrand einen
Knick, wäre also nicht stetig ableitbar. Die Forderung, dass die Lösungen am Kastenrand einmal stetig differenzierbar sein sollen (s.o.) schließt Lösungen zu E < 0
aus.
Im Inneren des Kastens erhalten wir als mögliche Lösungen wieder die trigonometrischen Funktionen und damit sind die möglichen symmetrischen bzw. antisymmetrischen Lösungen nun von der Form:

√

|x| ≤ L2

 a cos( x)√
ψs (x) =
(A1.12)
aA exp(− ν − x) x > L2

√

 aA exp( ν − x)
x < L2

√

b
sin(
x)
|x| ≤ L2


√
ψa (x) =
(A1.13)
bB exp(− ν − x) x > L2

√

 −bB exp( ν − x) x < L
2
Wir beschränken uns im Folgenden wieder auf den symmetrischen Fall. Der antisymmetrische Fall folgt entsprechend.
Der globale Faktor a bzw. b jeder Lösung wird durch die Normierungsbedingungen festgelegt, also dass das Integral über das Quadrat der Lösung gleich eins ist.
Endliches Kastenpotenzial
277
Diesmal lässt sich diese Normierungsbedingung erfüllen, da die Lösungen für große
Betragswerte von x exponentiell abfallen. Wir setzen zunächst daher wieder a = 1
und bestimmen den globalen Faktor später.
Wir haben nun eine freie Konstante A, aber zwei Anschlussbedingungen bei
L
x = 2:
√
√ L
L
cos
= A exp − ν − (A1.14)
2
2
√
√
√
√ L
L
− sin
= −A ν − exp − ν − .
(A1.15)
2
2
Insbesondere lassen sich diese beiden Anschlussbedingungen nur noch für bestimmte
Energiewerte erfüllen. Indem wir beide Gleichungen durcheinander dividieren, können
wir die Konstante A eliminieren und erhalten als Quantisierungsbedingung:
r
√ L
ν−
=
.
(A1.16)
tan
2
Interessant ist, dass diese Gleichung immer mindestens eine Lösung in dem Bereich
0 < E < V hat, es gibt also immer einen gebundenen Zustand. Für große Werte von
√
L und V (genauer für L 2mV /~ >> 1) gibt es viele Lösungen.
278
Anhang A
Kapitel A2
Zeitentwicklung und
Funktionalintegral
In diesem Anhang wird der Zeitentwicklungsoperator für ein freies Teilchen berechnet,
außerdem soll die Darstellung des Zeitentwicklungsoperators als Funktionalintegral
abgeleitet werden.
A2.1
Herleitung des freien Propagators
Ganz allgemein lässt sich der Zeitentwicklungsoperator nach Projektionen auf Energieeigenzustände entwickeln:
X
i
i
(A2.1)
U (t) = exp − Ht =
e− ~ Ei t |Ei ihEi |
~
i
und somit gilt in der Ortsdarstellung:
X i
X i
U (x, y; t) = hx|U (t)|yi =
e− ~ Ei t hx|Ei ihEi |yi =
e− ~ Ei t ψEi (x)ψE∗ i (y) . (A2.2)
i
i
Kennt man also alle Energieeigenwerte und die zugehörigen Wellenfunktionen, kann
man den Zeitentwicklungsoperator auf diese Weise berechnen. Im vorliegenden (freien)
Fall hängt die Energie jedoch nur vom Impulsoperator ab, und man kann sich die
Rechnung noch vereinfachen:
Z
i
− ~i Ht
U (x, y; t) = hx|e
|yi = dp hx|e− ~ Ht |pihp|yi
(A2.3)
Z
i p2
dp exp −
t hx|pihp|yi
(A2.4)
=
~ 2m
Z
i
i p2
=
dp exp −
t e ~ p(x−y)
(A2.5)
~ 2m
279
280
Anhang B
Die Integration über p ist Gauß’sch (mit einem linearen Term) und führt direkt auf
die Lösung (Gl. 7.13).
Auf dasselbe Integral (Gl. A2.5) führt auch eine andere Überlegung: Da die freie
Schrödinger-Gleichung (ohne Potenzial) nur den Impulsoperator enthält, können wir
auch zunächst eine Lösung im Impulsraum suchen. Diese erhalten wir aber sofort, da
die Schrödinger-Gleichung im Impulsraum lautet:
p2
p2
d
ψ̃(p, t)
=⇒ ψ̃(p, t) = exp −i
t .
(A2.6)
i~ ψ̃(p, t) =
dt
2m
2m~
Diese Lösung erfüllt auch die richtige Anfangsbedingung, da für t = 0 folgt: ψ̃(p, 0) = 1.
Die gesuchte Lösung im Ortsraum erhalten wir durch eine Fourier-Transformation, also
genau das Integral aus Gl. A2.5.
A2.2
Das Funktionalintegral
Der Zeitentwicklungsoperator U (x, y; t) erfüllt ganz allgemein (für beliebige Potenziale
und sogar für zeitabhängige Hamiltonoperatoren) die Halbgruppengleichung
Z
U (x, y; t1 + t2 ) =
dz U (x, z; t1 ) U (z, y; t2 )
(A2.7)
oder
Z
E
D i
D i E D i E
− ~ H(t1 +t2 ) x e
y
=
dz
x e− ~ Ht1 z
z e− ~ Ht2 y .
(A2.8)
Durch wiederholte Anwendung dieser Identität erhält man
U (x, y; t)
Z
=
dx1 . . . dxN −1 U (x, x1 ; t/N )U (x1 , x2 ; t/N ) . . . U (xN −1 , y; t/N ) .
Für sehr kurze Zeiten t → 0 kann man den Propagator geeignet approximieren. Dazu
verwenden wir die Baker-Campbell-Hausdorff-Formel:
eX eY = eZ(X,Y )
1
mit Z(X, Y ) = X + Y + [X, Y ] + ...
2
Damit gilt
i
i
i
2
e− ~ (H0 +V )t = e− ~ H0 t e− ~ V t+O(t ) .
(A2.9)
Sei nun
D i E
U0 (x, y; t) = x e− ~ H0 t y
m 12
i m (x − y)2
=
exp
2πi~t
~2
t
(A2.10)
Zeitentwicklung und Funktionalintegral
281
der bereits abgeleitete Propagator der freien Schrödinger-Gleichung, dann erfüllt daher
i
2
(A2.11)
U (x, y; t) = U0 (x, y; t) exp − V (x)t + O(t )
~
näherungsweise die volle Gleichung, wobei der Fehler (bedingt durch die Anwendung
des Laplace-Operators auf die potentialabhängige Phase) durch Terme höherer Ordnung in t korrigiert wird.
Man erhält so für den Propagator formal die Darstellung (N ist durch eine
geeignete Normierung des Maßes zu absorbieren):
U (x, y; t) =
"
#
2
N −1
i X 1
xi+1 − xi
dxi exp
= N lim
m
− V (xi ) ∆t
N →∞
~ i=0 2
∆t
i=1
Z Z
i t 1
2
mẋ(τ ) − V (x(τ )) dτ
=
Dx(τ ) exp
~ 0 2
y→x
Z
i
=
Dx(τ ) exp S[x(τ )] .
~
y→x
Z NY
−1
Dies nennt man die Funktionalintegraldarstellung des Propagators. Andere Bezeichnungen sind Summation“ über alle Wege, Summation“ über alle Möglichkeiten,
”
”
Summation“ über alle Geschichten.
”
Jeder Weg (Möglichkeit, Geschichte) wird mit einer Phase gewichtet“, die sich
”
aus der klassischen Wirkung ergibt. Das Funktionalmaß Dx(τ ) auf der Menge der
Wege schließt eine Normierungskonstante mit ein, sodass die Integration über alle
Anfangspunkte y eins ergibt.
282
Anhang B
Kapitel A3
Darstellungen der Drehgruppe
In einer Tabelle der Elementarteilchen, z.B. den nahezu jährlich erscheinenden Berichten der Particle Data Group“, findet man eine Vielzahl von Quantenzahlen, nach
”
denen die Elementarteilchen – Quarks, Leptonen, Eichbosonen, und mittlerweile auch
das Higgs-Teilchen – sowie die beobachteten gebundenen Zustände dieser Teilchen –
Baryonen, Mesonen, etc. – klassifiziert werden. In allen Fällen handelt es sich dabei um
Quantenzahlen, die wir (zumindest näherungsweise oder in Bezug auf bestimmte Wechselwirkungen) mit Symmetrien in Verbindung bringen und die daher Erhaltungsgrößen
sind: die Ruhemasse m, der Spin s, die Ladung q, die Parität (−1)P , die Ladungskonjugation (−1)C , sowie weitere Quantenzahlen wie Leptonenzahl, Baryonenzahl, Isospin
etc.
In diesem Kapitel geht es um die möglichen Quantenzahlen, die im Zusammenhang mit einer Symmetrie auftreten können. Wir hatten in Kapitel 6.1.3 schon gezeigt,
dass die Eigenwerte von Observablen L, die sich mit Symmetrien in Verbindung bringen lassen, für die also [H, L] = 0 gilt, Erhaltungsgrößen sind. Das folgte unmittelbar
aus der Tatsache, dass Operatoren, die mit dem Hamilton-Operator kommutieren,
auch mit dem Zeitentwicklungsoperator kommutieren. In diesem Kapitel untersuchen
wir, wie man aus den Eigenschaften einer Symmetrie schon auf die möglichen Eigenwerte schließen kann. Dass dies grundsätzlich möglich sein sollte, zeigt das einfache
Beispiel der Paritätstransformationen P ψ(x) = ψ(−x), welche die Bedingung P 2 = 1
erfüllen und daher nur die Eigenwerte ±1 haben können.
Da es hier nicht um eine Einführung in die Teilchenphysik geht, wollen wir uns
auf eine Quantenzahl beschränken – den Spin s.
283
284
A3.1
Anhang C
Symmetrien, Gruppen und ihre Darstellungen
Was ist eine Symmetrie? Für eine (mathematische) Beantwortung dieser Frage benötigt
man zwei Konzepte: (1) Eine Gruppe von Transformationen und (2) eine Menge, auf
die diese Transformationen wirken; eine solche Menge bezeichnet man auch als einen
Darstellungsraum der Gruppe. Sind diese beiden Strukturen gegeben, kann man sagen, eine Größe (z.B. ein Element, eine Teilmenge von Elementen oder eine bestimmte
Funktion dieser Elemente) ist invariant oder symmetrisch unter der Gruppe, wenn
sie sich unter den Gruppentransformationen nicht verändert bzw. auf sich selber abgebildet wird. Man kann sich leicht vorstellen, dass die invarianten Punkte des Darstellungsraums bzw. die kleinsten invarianten Teilmengen (die man auch als Orbits
bezeichnet) eine besondere Rolle spielen. Die Gruppe nennt man in solchen Fällen
auch eine Symmetriegruppe.
Diese allgemeinen Aussagen wollen wir nun etwas konkretisieren.
Definition: Eine Gruppe ist eine Menge G mit einer Verknüpfung · : G × G → G,
sodass folgende Bedingungen gelten:
1. Assoziativität: Für je drei Elemente g1 , g2 , g3 aus G gilt: g1 · (g2 · g3 ) = (g1 · g2 ) · g3 .
2. Existenz eines Einselements: Es gibt ein Elemente e ∈ G, sodass e · g = g · e = g
für alle g ∈ G.
3. Existenz des Inversen: Zu jedem Element g ∈ G gibt es ein Element g −1 ∈ G,
sodass g · g −1 = g −1 · g = e.
Gilt außerdem noch die Kommutativität, d.h. für alle g1 , g2 ∈ G folgt g1 · g2 = g2 · g1 ,
spricht man von einer kommutativen Gruppe oder abelschen Gruppe (benannt nach
dem Mathematiker Niels Henrik Abel (1802–1829)). In diesem Fall schreibt man statt
·“ auch häufig +“.
”
”
Definition: Ein Darstellungsraum einer Gruppe ist eine Menge V zusammen mit einer
Verknüpfung · : G × V → V , sodass für alle g1 , g2 ∈ G und alle v ∈ V gilt: (g1 · g2 ) · v =
g1 · (g2 · v) und e · v = v. (Die Verwendung desselben Symbols für die Verknüpfung
innerhalb der Gruppe und die Verknüpfung mit dem Darstellungsraum sollte zu keinen
Problemen führen). Man sagt in diesem Fall auch, die Gruppe wirkt“ auf der Menge
”
V.
Ganz allgemein ist eine Darstellung einer Gruppe G eine Abbildung D : G → M ,
wobei M eine im Prinzip beliebige Menge von Objekten sein kann, auf denen eine
Multiplikation erklärt ist, sodass gilt:
D(g1 ) · D(g2 ) = D(g1 · g2 ) .
(A3.1)
Darstellungen der Drehgruppe
285
Zumindest für die Bilder der Gruppenelemente muss also in M auch ein Einselement
erklärt sein und müssen die Elemente D(g) bezüglich dieses Einselements auch invertierbar sein. Mit anderen Worten: Das Bild von G in M muss selbst eine Gruppe
bilden.
In der Physik sind wir häufig an sogenannten linearen Darstellungen einer Gruppe interessiert oder auch, was für endlich dimensionale Darstellungen dasselbe ist, an
Darstellungen durch Matrizen. Wir suchen also Matrizen {M (g)}, sodass
M (g1 )M (g2 ) = M (g1 · g2 )
∀gi ∈ G
(A3.2)
(manchmal wählt man auf der linken Seite dieser Gleichung auch die Reihenfolge
umgekehrt). Da diese Matrizen auf einem entsprechenden Vektorraum als lineare Abbildungen aggieren, ist dieser Vektorraum gleichzeitig ein Darstellungsraum für die
Gruppe. Eine Matrixdarstellung einer Gruppe heißt irreduzibel, wenn Vielfache der
Identitätsmatrix die einzigen Elemente sind, die mit allen Gruppenelementen in dieser
Darstellung kommutieren. In diesem Fall lassen sich nicht sämtliche Matrizen durch
dieselbe unitäre Transformation auf eine Blockdiagonalgestalt bringen.
Wann sprechen wir in der Physik von einer Symmetrie? Wenn wir etwas lax
sagen, ein System habe eine bestimmte Symmetrie, meinen wir damit meist, dass die
mathematischen Funktionen oder Gleichungen, mit denen wir das System beschreiben,
diese Symmetrie haben. Eine Funktion f hat eine Symmetrie (man sagt auch, die
Funktion ist eine Invariante unter der Symmetriegruppe), wenn die Symmetriegruppe
G auf dem Definitionsbereich Df der Funktion wirkt und für jedes Element x ∈ Df
gilt: f (x) = f (xg ), wobei xg das Bild von x unter G ist. Der Funktionswert ist also
an zwei Punkten, die sich durch die Symmetriegruppe ineinander überführen lassen,
derselbe.
Von einer Gleichung, die wir immer in die allgemeine Form F [x] = 0 bringen
können (man beachte, dass dies auch für Differential- und Integralgleichungen gilt, bei
denen x dann Bahnkurven oder Felder darstellen), sagen wir, sie sei symmetrisch, wenn
mit jeder Lösung x der Gleichung auch das transformierte Element xg eine Lösung der
Gleichung ist. Im Allgemeinen agiert die Symmetriegruppe auf dem Raum der Werte
x, für die F [x] definiert ist, die Invarianz fordern wir aber nur für die Lösungsmenge
der Gleichung.
Von besonderem Interesse sind in der Physik die irreduziblen Darstellungen
einer Gruppe und insbesondere die Parameter, durch die sich diese irreduziblen Darstellungen charakterisieren lassen. Wir werden sehen, dass uns diese Parameter auf die
Quantenzahlen führen, mit denen wir gewöhnlich Teilchen beschreiben. Diese Quantenzahlen sind die Invarianten“ zu der Gruppe, die zeitlich konstant bleiben. Daher
”
eignen sie sich zur Charakterisierung physikalischer Zustände.
286
A3.2
Anhang C
Die Drehgruppe
Als Beispiel für eine Gruppe, die in der Physik häufig als Symmetriegruppe auftritt, betrachten wir die Drehgruppe, das heißt die Gruppe aller Drehungen im dreidimensionalen Raum. Diese Gruppe bezeichnet man auch als SO(3), für spezielle orthogonale Gruppe in 3 Dimensionen.
Bei der Gruppe SO(3) handelt es sich um eine Lie-Gruppe. Etwas vereinfacht
ausgedrückt ist eine Lie-Gruppe nicht nur eine Gruppe, sondern sie ist auch eine Mannigfaltigkeit, also ein topologischer Raum, der zumindest lokal (also in genügend kleinen Umgebungen) isomorph zu einer offenen Teilmenge des Rn ist. Wir wissen, dass
wir die Drehungen im R3 durch drei Winkel kennzeichnen können, die sogenannten
Euler-Winkel, und daher ist die Mannigfaltigkeit der Gruppe SO(3) dreidimensional.
Es wurde und wird viel darüber spekuliert, weshalb die Dimension der Drehunggruppe gleich
der Dimension des Raumes ist, auf den sie wirkt. In vier Dimensionen ist die Gruppe SO(4) 6dimensional, und in zwei Dimensionen ist die Gruppe SO(2) nur eindimensional. Nur in drei Raumdimensionen ist die Dimension der Drehgruppe ebenfalls dreidimensional. Ich will mich hier diesen
Spekulationen nicht anschließen sondern diese Anmerkung nur dazu nutzen zu betonen, dass man
zwischen der Dimension des Raumes, auf den die Gruppe wirkt, und der Dimension der Gruppe
natürlich unterscheiden muss und diese Dimensionen im Allgemeinen verschieden sind.
Für die Drehgruppe SO(3) kennen wir schon eine lineare Darstellung, d.h. einen
Satz von Matrizen, welcher die Drehgruppe repränsentiert, nämlich die 3-dimensionalen
Rotationsmatrizen. Sie bilden die definierende Darstellung der Gruppe SO(3), d.h.,
durch ihre Relationen ist die Gruppe SO(3) gerade definiert.
Gibt es auch noch andere irreduzible Darstellungen der Gruppe SO(3) durch
Matrizen? Es wird sich zeigen, dass es tatsächlich auch in anderen Dimensionen d
entsprechend d × d Matrizen gibt, die eine (irreduzible) Matrixdarstellung der Gruppe
SO(3) bilden. Zum Beweis dieser Aussage betrachten wir sehr kleine“ (infinitesimale)
”
Drehungen, denn es zeigt sich, dass wir mit diesen bereits die gesamte Gruppe generieren können. Das führt uns auf die Lie-Algebra einer Gruppe, und die Elemente dieser
Lie-Algebra bezeichnet man auch als die Generatoren der Gruppe.
A3.3
Die Lie-Algebra der Drehgruppe
Wir können um jede der drei Raumachsen eine Drehung ausführen, und jede beliebige
Drehung kann man als einer Hintereinanderschaltung solcher Drehungen ausdrücken.
Darstellungen der Drehgruppe
287
Die Drehungen um die drei Achsen sind einfach:



1
0
0
cos α2 0 − sin α2




R1 (α1 ) = 
R2 (α2 ) = 
1
0
 0 cos α1 sin α1 
 0
0 − sin α1 cos α1
sin α2 0 cos α2





(A3.3)

cos α3 sin α3 0



R3 (α3 ) =  − sin α3 cos α3 0 

0
0
1
Das Vorzeichen vor der Sinus-Funktion ist Konvention.
Die drei Winkel αi hängen zwar mit den Euler-Winkeln θ, ϕ, ψ zusammen, sind aber nicht
mit ihnen identisch. Eine allgemeine Drehung im dreidimensionalen Raum lässt sich als Hintereinanderausführung von einer Drehung um die 1-Achse, einer Drehung um die 3-Achse und einer anschließenden Drehung nochmals um die 1-Achse schreiben:
R(θ, ϕ, ψ) = R1 (θ) · R3 (ϕ) · R1 (ψ) .
(A3.4)
Dies ist die Darstellung einer allgemeinen Drehung durch die Euler-Winkel.
Für jede dieser Drehungen betrachten wir nun die Terme in linearer Ordnung
in den Winkeln, d.h., wir betrachten Drehungen um sehr kleine Winkel und entwickeln
nur bis zur ersten Ordnung. Dabei nutzen wir aus, dass
cos α = 1 + O(α2 )
und
sin α = α + O(α3 ) .
(A3.5)
Eine kurze Rechnung ergibt Folgendes:
Ri (αi ) = 1 + iαi Li + O(αi2 )
mit den drei Generatoren:


0 0 0



L1 = 
 0 0 −i 
0 i 0

0
0 i




L2 = 
 0 0 0 
−i 0 0
(A3.6)

0 −i 0

L3 = 
 i
0
0
0


0 
.
0
(A3.7)
(Auch in diesem Fall ist die Herausnahme“ eines Faktors i eine Konvektion. In der
”
vorliegenden Form sind die Generatoren Li selbst-adjungierte bzw. hermitesche Matrizen, die in der Quantentheorie mit den Observablen des Drehimpulses in Beziehung
gebracht werden.)
Man spricht in diesem Fall von Generatoren, weil man die Matrizen Ri einfach
durch Exponenzieren dieser Generatoren Li wiedergewinnt:
Ri (αi ) = exp (iαi Li ) .
(A3.8)
288
Anhang C
Es reicht also, wenn wir Darstellungen der Matrizen Li finden, um dann (durch Exponenzieren) die Gruppe zu erhalten. Doch welche Eigenschaften müssen wir von
diesen Darstellungen der Matrizen Li fordern, sodass wir von einer Darstellung der
Lie-Algebra sprechen und die Gruppe rekonstruieren zu können. Es zeigt sich, dass
die Kommutatorrelationen zwischen den Generatoren dazu ausreichen. (Der Grund
ist, dass man aus Kombinationen der Art R1 R2 R1−1 R2−1 in niedrigster nicht-trivialer
Ordnung bereits die Gruppenstruktur rekonstruieren kann, und dieser Ausdruck führt
auf die Kommutatoren).
Explizites Nachrechnen liefert:
[L1 , L2 ] = iL3
,
[L2 , L3 ] = iL1
,
[L3 , L1 ] = iL2 ,
(A3.9)
oder zusammengefasst:
[Li , Lj ] = i
3
X
ijk Lk .
(A3.10)
k=1
Beliebige (reelle) Linearkombinationen dieser drei Matrizen,
L = αL1 + βL2 + γL3 ,
(A3.11)
bilden einen Vektorraum – den Tangentialraum an die Gruppe SO(3) bei der Identiät.
Auf diesem Vektorraum ist durch die Kommutatorrelationen ein (antisymmetrisches)
Produkt definiert. Den Vektorraum mit diesem Produkt bezeichnet man als die LieAlgebra der Drehgruppe.
Man bezeichnet die ijk als Strukturkonstanten der Lie-Algebra. Dass im vorliegenden Fall
gerade der bekannte -Tensor die Strukturkonstanten bildet ist kein Zufall: Aus der klassischen Mechanik ist bekannt, dass man jede infinitesimale Drehung eines Vektors ~x durch das Kreuzprodukt von
~x mit einem Drehvektor ω
~ schreiben kann. Weitere Beziehungen zum Kreuzprodukt werden später
noch offensichtlich.
Gesucht sind also Matrizen, welche diese Kommutatorrelationen erfüllen. Es
zeigt sich, dass alle Lösungen dieser Bedingung für d × d Matrizen bis auf orthogonale
bzw. unitäre Transformationen äquivalent sind, d.h., wir finden für einen festen Wert
von d immer nur eine solche Darstellung. Dies ist ein Spezialfall für die Gruppe SO(3)
und muss im Allgemeinen nicht gelten: Erstens muss es für allgemeine Gruppen nicht
für jeden Wert von d eine (irreduzible) Darstellung geben, und zweitens kann es auch
vorkommen, dass es in einer Dimension mehrere nicht äquivalente Darstellugen gibt.
Außerdem sollten wir noch erwähnen, dass die Lie-Algebra noch nicht eindeutig
die zugehörige Lie-Gruppe festlegt, sondern nur die lokalen Eigenschaften der Gruppe. Die Lie-Algebra wird ja konstruiert, indem man die Gruppe nur in der Nähe der
Identität (des Einselements) untersucht, und somit kann man nicht erwarten, dass
auch globale topologische Aspekte von der Lie-Algebra erfasst werden. Tatsächlich
Darstellungen der Drehgruppe
289
gibt es zu der Lie-Algebra (Gl. A3.9) zwei wichtige topologisch unterschiedliche Gruppenstrukturen: einmal die schon bekannte Gruppe SO(3) und dann die sogenannte
Überlagerungsgruppe der Gruppe SO(3), die als SU(2) (spezielle unitäre Gruppe in 2
Dimensionen) bekannt ist.
A3.4
Die Lösung für d = 2 — die Pauli-Matrizen
Der Fall d = 1 ist trivial. Die einzige Darstellung“ der Drehgruppe SO(3) ist die
”
triviale Darstellung, bei der jedes Element durch die 1 repräsentiert wird. Die Generatoren sind in diesem Fall natürlich alle 0 und erfüllen somit ebenfalls trivialerweise
die Kommutatorrelationen (A3.9). Wir betrachten also den Fall d = 2. Gesucht sind
drei (nicht-triviale) 2 × 2 Matrizen, welche die Kommutatorregeln (A3.9) erfüllen.
Diese Matrizen gibt es, und sie hängen direkt mit den sogenannten PauliMatrizen zusammen. Die Pauli-Matrizen sind:
!
!
!
0 1
0 −i
1 0
σ1 =
σ2 =
σ3 =
,
(A3.12)
1 0
i 0
0 −1
und die Matrizen Si , welche die Vertauschungsregeln (A3.9) erfüllen, sind die schon in
Kapitel 9.1 erwähnten Spinmatrizen:
1
Si
= σi .
~
2
(A3.13)
Die Pauli-Matrizen erfüllen die Multiplikatonsregeln:
X
ijk σk + δij ,
σ1 σ2 = iσ3
bzw. allgemein
σi σj = i
(A3.14)
k
woraus sich sofort die Kommutatorbeziehungen
X
[σi , σj ] = 2 i
ijk σk
(A3.15)
k
ableiten lassen, und nach einer Division dieser Gleichung durch 4 sehen wir, dass die
Matrizen σi /2 tatsächlich die gesuchten Kommutatorregeln erfüllen.
A3.5
* Allgemeine Dimensionen
Wir wollen nun kurz skizzieren, wie man zeigen kann, dass es für beliebige d (Dimensionen) eine Darstellung der Kommutatorrelationen (A3.9) gibt und wie man sie (im
Prinzip) konstruieren kann. Dabei verwenden wir ein Verfahren, das auch in der Quantenmechanik oft Anwendung findet: die Konstruktion des Darstellungsraums durch
290
Anhang C
Auf- und Absteigeoperatoren (siehe Kap. 6.5.1 zum harmonischen Oszillator). In der
Mathematik bezeichnet man die so konstruierten Darstellungen auch manchmal als
“heighest weight”-Darstellungen.
Zunächst überzeugt man sich durch direktes Nachrechnen, dass aus den Kommutatorrelationen sofort folgt, dass für jede Darstellung die Größe
L2 = L21 + L22 + L23
(A3.16)
mit allen drei Generatoren kommutiert:
[L2 , Li ] = 0 .
(A3.17)
Man bezeichnet L2 als einen Casimir-Operator. Allgemein ist ein Casimir-Operator
einer Lie-Algebra eine Funktion der Generatoren, die mit allen Generatoren der Algebra kommutiert. Wenn die Darstellung irreduzibel ist, wird ein Casimir-Operator
durch ein Vielfaches der Identitätsmatrix 1 repräsentiert. Tatsächlich lässt sich für die
beiden Darstellungen in d = 2 und d = 3 Dimensionen, die wir für die Matrizen Li
bereits kennen, sofort nachrechnen:
(d = 2) L2 =
3
·1
4
(d = 3) L2 = 2 · 1 .
(A3.18)
Allgemein schreiben wir
L2 = l(l + 1) 1 .
(A3.19)
Da sich L2 als Summe von drei Quadraten von hermiteschen Matrizen schreiben lässt,
kann der Faktor nicht negativ sein. Für die beiden genannten Fälle ist l = (d − 1)/2.
Diese Relation wird sich auch allgemein als richtig erweisen.
Als nächstes betrachten wir die beiden Operatoren
L+ = L1 + iL2
und
L− = L1 − iL2
(A3.20)
und überzeugen uns (wieder durch Ausnutzung der Kommutatorbeziehungen) von den
Kommutatorrelationen
[L3 , L+ ] = L+
und
[L3 , L− ] = −L− .
(A3.21)
Da wir nach hermiteschen Matrixendarstellungen von L3 suchen (also L†3 = L3 ) können
wir für jede Darstellung eine Basis finden, in der L3 diagonal ist. Seien |mi die Eigenzustände zu L3 mit (reellem) Eigenwert m:
L3 |mi = m|mi .
(A3.22)
Offenbar folgt aus den Kommutatorrelationen (A3.21):
L3 L+ |mi = L+ L3 |mi + L+ |mi = (m + 1)L+ |mi
(A3.23)
Darstellungen der Drehgruppe
291
und entsprechend
L3 L− |mi = (m − 1)L− |mi .
(A3.24)
L+ |mi und L− |mi sind also ebenfalls Eigenvektoren von L3 , sofern |mi Eigenvektor
ist, und zwar jeweils zu den Eigenwerten m + 1 und m − 1. L+ und L− sind demnach
Auf- und Absteigeoperatoren im Sinne von Abschnitt 6.5.1.
Wir verwenden nochmals die allgemeinen Kommutatorbeziehungen der LieAlgebra für die Identität:
L− L+ = (L1 − iL2 )(L1 + iL2 ) = L21 + L22 + i[L1 , L2 ]
(A3.25)
L+ L− = L2 − L3 (L3 + 1) .
(A3.26)
oder
Nun kommt das entscheidende Argument. Angenommen, |mi ist ein normierter Eigenvektor, also hm|mi = 1, dann gilt für das Normquadrat von L+ |mi (man beachte,
dass (L+ )† = L− ):
kL+ |mik2 = hm|L− L+ |mi = hm|[L2 − L3 (L3 + 1)]|mi = l(l + 1) − m(m + 1) (A3.27)
oder
kL+ |mik =
p
l(l + 1) − m(m + 1) .
(A3.28)
Damit dieser Vektor aber normierbar bleibt (wir suchen nur Darstellungen in einem
Vektorraum mit positiv-definitem Skalarprodukt), muss m ≤ l sein. Da wir andererseits aber durch wiederholte Anwendung von L+ auf einen Eigenzustand von L3 den
Wert von m beliebig groß werden lassen können, muss es einen Vektor |mi geben, für
den L+ |mi = 0. Das ist genau dann der Fall, wenn l = m.
Umgekehrt (indem wir L− |mi betrachten) folgt nach demselben Argument, dass
m ≥ −l und der Wert m = −l auch angenommen werden muss. Da L+ bzw. L− die Eigenwerte m von L3 aber in ganzzahligen Schritten verändern, muss somit 2l ganzzahlig
sein, und die Eigenwerte m können die Wert −l, −l + 1, −l + 2, ..., +l annehmen.
Lediglich durch Ausnutzung der Kommutatorrelationen (A3.9) und der Forderung, dass wir nach hermiteschen Darstellungen der Matrizen Li in positiv-definiten
Vektorräumen suchen, sind wir also zu folgendem Schluss gekommen:
1. Die Darstellungen der Drehgruppe werden durch eine Zahl l charakterisiert, wobei der Wert des Casimir-Operators L2 in einer solchen Darstellung den Wert
l(l + 1) hat und l nur die Werte l = 0, 21 , 1, 23 , 2, ... annehmen kann.
2. Für festes l gibt es 2l + 1 verschiedene Eigenvektoren zu L3 und damit ist die
Darstellung 2l + 1-dimensional. Insbesondere finden wir für jede Dimension d
eine Darstellung mit l = (d − 1)/2.
292
Anhang C
3. Für ein gegebenes l nimmt der Eigenwert m zu L3 die Werte l, l − 1, l − 2, ..., −l
an.
Zur Veranschaulichung betrachten wir nochmals die beiden Fälle d = 2 und
d = 3. Für d = 2 ist S3 = σ3 /2 bereits eine Diagonalmatrix (vgl. Gl. A3.12) mit den
beiden Eigenwerten m = ± 12 . Für d = 3 ist L3 (aus Gl. A3.7) noch nicht diagonal,
doch ein Vergleich von L3 mit der Pauli-Matrix σ2 , welche die Eigenwerte ±1 hat,
zeigt sofort, dass L3 tatsächlich die Eigenwerte +1, 0, −1 hat.
Wir können nun auch die Darstellungen der Drehgruppe zu beliebiger Dimension d explizit konstruieren (zumindest im Prinzip): Wir beginnen mit L3 als Diagonalmatrix mit den Elementen m = l, l − 1, ..., −l auf der Diagonalen. Nun konstruieren
wir die beiden Matrizen L+ und L− , die als Auf- bzw. Absteigermatrizen nur Elemente
auf der ersten Nebendiagonalen haben (L+ auf der oberen Nebendiagonalen und L−
auf der unteren), und diese Elemente sind durch Gl. A3.28 (und eine entsprechende Gleichung für L− ) gegeben. Aus L+ und L− erhalten wir durch Umkehrung der
Linearkombinationen in Gl. (A3.20) L1 und L2 zurück.
A3.6
Drehimpuls und Spin in der Quantenmechanik
Die Drehgruppe gehört zu den zentralen Invarianzgruppen der Physik, sowohl in der
Newton’schen als auch der Relativistischen Mechanik. Wenn ein quantenmechanisches
System rotationsinvariant ist, bedeutet dies, dass mit jeder Lösung ψ(x) (ausgedrückt
als Wellenfunktion im Ortsraum) der Schrödinger-Gleichung auch die transformierte
Lösung ψ(Rx) (wobei Rx den mit der Rotationsmatrix R rotierten Punkt darstellt)
eine Lösung ist. Die Transformation ψ(x) → ψ(Rx) impliziert eine (unitäre) Darstellung der Rotationsgruppe U (R) auf dem Raum der Wellenfunktionen bzw. dem
Raum der Zustände, und die Invarianz bedeutet, dass der Hamilton-Operator und
U (R) kommutieren.
Nun sind die Operatoren U (R) im Allgemeinen keine Observable. Allerdings
sind die Generatoren von U (R) Observable, nämlich die Observablen zum Drehimpuls.
Daher kommutieren die Drehimpulsoperatoren mit dem Hamilton-Operator, wenn der
Hamilton-Operator rotationsinvariant ist. Wie üblich führt dies zu Erhaltungsgrößen,
d.h., wie schon in Kap. 6.1.3 und Kap. 6.6 angedeutet, die Quantenzahlen des Drehimpulses sind erhalten bzw. man kann die Energieeigenzustände auch nach den Quantenzahlen des Drehimpuls klassifizieren.
Betrachten wir zunächst die Kommutatorbeziehungen zwischen den Drehimpulsoperatoren der Quantentheorie: Seien
L1 = Q2 × P3 − Q3 × P2 , L2 = Q3 × P1 − Q1 × P3 , L3 = Q1 × P2 − Q2 × P1 (A3.29)
Darstellungen der Drehgruppe
293
bzw. allgemein
Li =
X
ijk Qj Pk
(A3.30)
jk
die Komponenten des Drehimpulsoperators (noch unabhängig von einer Basis). Dann
folgt aus den kanonischen Vertauschungsrelationen:
[L1 , L2 ] = [(Q2 P3 − Q3 P2 ) , (Q3 P1 − Q1 P3 )]
= i~ (−Q2 P1 + P2 Q1 )
= i~ L3 ,
und ganz entsprechend
[L2 , L3 | = i~L1
,
[L3 , L1 ] = i~L2
(A3.31)
bzw. allgemein
[Li , Lj ] = i~
X
ijk Lk .
(A3.32)
k
Wir erhalten also für die Komponenten des Drehimpulses dieselben Kommutatorbeziehungen (bis auf einen Faktor ~), wie für die Generatoren der Drehgruppe (Gl. A3.9).
Das ist auch nicht überraschend, denn der Drehimpuls ist ja gerade die Erhaltungsgröße zur Rotationsinvarianz und damit der Generator zur Darstellung der Drehgruppe
auf den physikalischen Zuständen.
Wir können somit die Schlussfolgerungen aus dem letzten Abschnitt direkt
übernehmen und schließen:
√
1. Die Eigenwerte zum Betrag des Drehimpulses |L| = L2 nehmen die Werte
p
~ l(l + 1) an, wobei l = 0, 12 , 1, 23 , 2, ....
2. Für festes l gibt es 2l + 1 verschiedene Eigenzustände von L3 mit den Quantenzahlen l3 = ~m mit m = l, l − 1, l − 2, ..., −l.
Wie schon gegen Ende von Abschnitt A3.3 angedeutet, bestimmt die Zahl l nur
die Darstellungen der Lie-Algebra, und diese müssen nicht immer auch Darstellungen
der Drehgruppe SO(3) sein, sondern es kann sich dabei auch um Darstellungen von
SU(2) (der Überlagerungsgruppe der Drehgruppe) handeln. SU(2) ist in gewisser Hinsicht doppelt“ so groß wie SO(3): Eine Dreuhung um 360◦ führt nicht wieder an den
”
Ausgangspunkt zurück, sondern erst eine Drehung um 720◦ .
Ist man daher konkret an Darstellungen der Drehgruppe SO(3) interessiert,
kommen nur die ganzzahligen Werte für l in Frage. Dies ist auch der Grund, weshalb
wir bei unseren Überlegungen zum Wasserstoffatom (Kap. 6.6) nur auf die Darstellungen zu ganzzahligen Werte von l gestoßen sind: Die Forderung, dass die Kugelflächenfunktionen Ylm (θ, ϕ) auf der Kugeloberfläche eindeutige Werte annehmen (und
stetig sind), führte auf diese Auswahl. Wir können daher nochmals zusammenfassen:
294
Anhang C
• Die Darstellungen der Drehgruppe SO(3), wie sie bei der Behandlung des Bahndrehimpulses von Teilchen auftreten, lassen für den Betrag des Drehimpulses |L|
p
nur die Werte ~ l(l + 1) zu, wobei l ganzzahlig ist.
Damit erhebt sich die Frage, ob die anderen Darstellungen der Lie-Algebra, die
zu halbzahligen Werten für l gehören und zu Darstellungen der Überlagerungsgruppe
SU(2) führen, in der Physik eine Bedeutung haben. Dies ist tatsächlich der Fall: Der
Spin von Elementarteilchen, der einer intrinsischen Eigenschaft dieser Teilchen entspricht, kann in der Tat auch halbzahlige Werte annehmen. Bei Teilchen mit halbzahligem Spin spricht man von Fermionen, bei Teilchen mit ganzzahligem Spin von
Bosonen. Beispielsweise ist das Elektron ein Fermion mit Spin s = 12 .
Daraus ergeben sich zwei Fragestellungen: (1) Was hat der Spin von Teilchen
mit dem Drehimpuls zu tun?, und (2) weshalb spielt hier die Lie-Algebra bzw. die
Überlagerungsgruppe SU(2) die wichtige Rolle und nicht die Gruppe SO(3) der Drehungen.
Zur ersten Frage stellt man experimentell fest, dass der Gesamtdrehimpuls eines
abgeschlossenen Systems (beispielsweise bei Zerfallsprozessen) nur dann erhalten ist,
wenn man auch den Spin eines Teilchens berücksichtigt. Beispielsweise trägt ein Photon den Spin 1 und ist damit für die Auswahlregel ∆l = ±1 (in Einheiten von ~) bei
vielen elektronischen Übergängen im Atom verantwortlich. Die bekannte 21 cm Linie
des Wasserstoffs beruht auf dem Umklappen des Spins des Elektrons im Grundzustand
von Wasserstoff, was gerade einer Änderung des Drehimpulses des Wasserstoffatoms
um ∆l = ±1 entspricht. Die Tatsache, dass Spin und Bahndrehimpuls zu einem Gesamtimpuls koppeln, zeigt, dass der Spin zum Drehimpuls beiträgt. Allerdings sollte
man sich den Spin nicht als eine Eigendrehung von Teilchen vorstellen, wie es oft in
populärwissenschaftlichen Darstellungen suggeriert wird.
Zur zweiten Frage: Ein quantenmechanischer Zustand wird durch Strahlen in
einem Hilbertraum beschrieben, daher sucht man nicht nur nach Vektorraumdarstellungen der Gruppe SO(3), sondern nach sogenannten projektiven Darstellungen. In
diesem Fall muss eine Drehung um 360◦ nur wieder in denselben Strahl zurückführen,
nicht aber in denselben Vektor. Die Darstellungen von SU(2) führen einen Vektor
bei einer Drehung um 360◦ in sein Negatives über, dies entspricht aber physikalisch
demselben Zustand.
Kapitel A4
Zitate zur Quantentheorie
Das Spektrum, wie Physiker oder Wissenschaftsphilosophen über die Quantenmechanik denken, ist breit gefächert. Oftmals wird noch nicht einmal klar, was genau die
Probleme sind, die uns an der Quantentheorie stören. Daher habe ich in diesem Anhang
einige Zitate zur Quantentheorie zusammengetragen in der Hoffnung, die Vielfalt der
Meinungen und der Möglichkeiten, unser Unbehagen ausdrücken zu können, zu verdeutlichen. Teilweise wurden diese Zitate von den TeilnehmerInnen an der Vorlesung
selbst ausgewählt.
Albert Einstein
• Die Quantenmechanik ist sehr Achtung gebietend. Aber eine innere Stimme sagt
mir, dass das noch nicht der wahre Jakob ist. Die Theorie liefert viel, aber dem
Geheimnis des Alten bringt sie uns kaum näher. Jedenfalls bin ich überzeugt,
dass der Alte nicht würfelt.
- oft zitiert als Gott würfelt nicht.“
”
(Albert Einstein, Brief an Max Born, 4. Dezember 1926, Einstein-Archiv 8180, zitiert nach Alice Calaprice (Hrsg.): Einstein sagt, Piper-Verlag, München,
Zürich 1996, ISBN 3-492-03935-9, Seite 143.)
• Es scheint hart, dem Herrgott in die Karten zu gucken. Aber dass er würfelt und
sich telepatischer Mittel bedient (wie es ihm von der gegenwärtigen Quantentheorie zugemutet wird), kann ich keinen Augenblick glauben.
(Albert Einstein über die Quantenmechanik in einem Brief an Cornelius Lanczos, 21. März 1942, Einstein-Archiv 15-294, zitiert nach Einstein, Briefe, Seite
65, zitiert nach Alice Calaprice (Hrsg.): Einstein sagt, Piper-Verlag, München,
Zürich 1996, ISBN 3-492-03935-9, Seite 146.)
• Der Gedanke, dass ein in einem Strahl ausgesetztes Elektron aus freiem Entschluss den Augenblick und die Richtung wählt, in der es fort springen will, ist
295
296
Anhang D
mir unerträglich. Wenn schon, dann möchte ich lieber Schuster oder gar Angestellter in einer Spielbank sein als Physiker.
(Brief an Max Born, 1924, zitiert in Albert Einstein und Max Born, Briefwechsel,
Rowolt, Reinbek, 1969, S. 67.)
Niels Bohr
• Denn wenn man nicht zunächst über die Quantentheorie entsetzt ist, kann man
sie doch unmöglich verstanden haben.
(Niels Bohr zitiert in Der Teil und das Ganze. Gespräche im Umkreis der Atomphysik von Werner Heisenberg, R. Piper & Co., München, 1969, S. 280.)
• Nun bedeutet aber das Quantenpostulat, dass [...] weder den Phänomenen noch
dem Beobachtungsmittel eine selbständige physikalische Realität im gewöhnlichen Sinne zugeschrieben werden kann.
(Niels Bohr, Das Quantenpostulat un die neuere Entwicklung in der Atomistik, in
Die Naturwissenschaften, Band 16. Kaiser-Wilhelm-Gesellschaft zur Förderung
der Wissenschaften, Springer-Verlag, Berlin, 1928, S. 245.)
• There is no quantum world. There is only an abstract physical description. It
is wrong to think that the task of physics is to find out how nature is. Physics
concerns what we can say about nature.
(The philosophy of Niels Bohr, Aage Peterson in Bulletin of the Atomic Scientists, Vol. 19 (Sept. 1963);
Werner Heisenberg
• Die Quantentheorie ist so ein wunderbares Beispiel dafür, dass man einen Sachverhalt in völliger Klarheit verstanden haben kann und gleichzeitig doch weiß,
dass man nur in Bildern und Gleichnissen von ihm reden kann.
(Physik und Philosophie)
• Die Quantentheorie lässt keine völlig objektive Beschreibung der Natur mehr zu.
(Physik und Philosophie)
• In den Experimenten über Atomvorgänge haben wir mit Dingen und Tatsachen
zu tun, mit Erscheinungen, die ebenso wirklich sind wie irgendwelche Erscheinungen im täglichen Leben. Aber die Atome oder die Elementarteilchen sind nicht
ebenso wirklich. Sie bilden eher eine Welt von Tendenzen und Möglichkeiten als
eine von Dingen und Tatsachen.
(Physik und Philosophie)
Zitate zur Quantentheorie
297
• Nicht mehr die objektiven Ereignisse, sondern die Wahrscheinlichkeiten für das
Eintreten gewisser Ereignisse können in mathematischer Form festgelegt werden. Nicht mehr das faktische Geschehen selbst, sondern die Möglichkeit zum
Geschehen – die Potentia“, wenn wir diesen Begriff der Philosophie des Aristo”
teles verwenden wollen – ist strengen Naturgesetzen unterworfen.
(1958 auf der Gedenkfeier zu Max Plancks 100. Geburtstag)
• Die Elementarteilchen können mit den regulären Körpern in Platos Timaios“
”
verglichen werden. Sie sind die Urbilder, die Ideen der Materie.
(Der Teil und das Ganze)
David Bohm
• Das Elektron beobachtet die Umgebung, soweit es auf eine Bedeutung in seiner
Umgebung reagiert. Es handelt genauso wie die Menschen.
(David Bohm; Wissenschaftler und Weise – www.zitate-aphorismen.de)
• So stimmen die Relativitätstheorie und die Quantentheorie doch beide in der
Notwendigkeit überein, die Welt als ein ungeteiltes Ganzes anzuschauen, worin
alle Teile des Universums einschließlich dem Beobachter und seinen Instrumenten
zu einer einzigen Totalität verschmelzen und sich darin vereinigen.
• If the price of avoiding non-locality is to make an intuitive explanation impossible, one has to ask whether the cost is too great.
(Physics Reports 144 (1987) 321.)
Richard Feynman
• Ein Philosoph hat einmal behauptet: Naturwissenschaft setzt notwendig voraus,
”
dass gleiche Umstände immer auch gleiche Auswirkungen haben.“ Nun, dem ist
nicht so.
(Impulse Physik, Kursstufe, Klettverlag, S.190)
• Es gab eine Zeit, als Zeitungen sagten, nur zwölf Menschen verständen die Relativitätstheorie. Ich glaube nicht, dass es jemals eine solche Zeit gab. Auf der
anderen Seite denke ich, es ist sicher zu sagen, niemand versteht Quantenmechanik.
(Richard Feynman, The Character of Physical Law, MIT-Press 1967, Kapitel 6.)
• ... the “paradox” is only a conflict between reality and your feeling of what reality
“ought to be”.
(Feynman Lectures on Physics, vol. III, S.18-9 (1965).)
298
Anhang D
• We have always had a great deal of difficulty understanding the world view that
quantum mechanics represents. [...] I cannot define the real problem, therefore I
suspect there’s no real problem, but I’m not sure there’s no real problem.
(Int. J. Theor. Phys. 21 (1982) 471.)
Andere
• Die Quanten sind doch eine hoffnungslose Schweinerei!
(Max Born an Albert Einstein, zitiert in Albert Einstein und Max Born: Briefwechsel 1916 bis 1955, Rowohlt, Reinbek bei Hamburg, 1969, S. 34.)
• Man kann die Welt mit dem p-Auge und man kann sie mit dem q-Auge ansehen,
aber wenn man beide Augen zugleich aufmachen will, dann wird man irre.
(Wolfgang Pauli; Wissenschaftlicher Briefwechsel mit Bohr, Einstein, Heisenberg
u.a.; Band I, 1919–1929; S.347)
• Wir dachten immer, wenn wir Eins kennen, dann kennen wir auch Zwei, denn
Eins und Eins sind Zwei. Jetzt finden wir heraus, dass wir vorher lernen müssen,
was und“ bedeutet.
”
(Sir Arthur Eddington; www.oberstufephysik.de/quantensprueche.html)
• Wohl keine Entwicklung der modernen Wissenschaft hat das menschliche Denken nachhaltiger beeinflußt als die Geburt der Quantentheorie. Jäh wurden die
Physiker eine Generation vor uns aus jahrhundertealten Denkmustern herausgerissen und fühlten sich zur Auseinandersetzung mit einer neuen Metaphysik
aufgerufen. Bis zum heutigen Tag währen die Qualen, die dieser Prozeß der Neuorientierung bedeutete. Im Grunde haben die Physiker einen schweren Verlust
erlitten: Sie verloren ihren Halt in der Realität.
(Original engl. – Bryce DeWitt und Neill Graham zitiert in: Quantenrealität :
jenseits der Neuen Physik / Nick Herbert: aus dem Engl. von Traude Wess. Basel [etc.] : Birkhäuser, cop. 1987 ISBN 3-7643-1871-6.)
• Einstein sagte, die Welt kann nicht so verrückt sein. Heute wissen wir, die Welt
ist so verrückt.
(Daniel M. Greenberger - www.oberstufenphysik.de/quantensprueche.html)
• Properties [...] have no independent reality outside the context of a specific experiment arranged to observe them: the moon is not there when nobody looks.
(David Mermin; Quantum Mysteries for Anyone, in The Journal of Philosophy
78 (1981) S. 397–408.)
• Wer [...] die verrückte“ Physik mit Namen Quantenmechanik beschreiben will,
”
kommt nicht ohne Ausdrücke wie Ekel und Entsetzen, Schock und Schmerzen,
Zitate zur Quantentheorie
299
wahnsinnig und widerlich aus. Den Physikern gingen die Gegenstände verloren,
weil sich herausstellte, dass die Atome keine Dinge sind. Sie sind Wirklichkeiten,
hinter denen keine dinghafte Substand mehr steckt. Sie sind factual facts“ wie
”
es in der Kunst heißt, aber keine actual facts“. Sie sind wirklich (wirksam),
”
ohne (eine) Realität zu haben.
(Ernst Peter Fischer; Leonardo, Heisenberg & Co. Eine kleine Geschichte der
Wissenschaft in Protraits. 2. Auflage, Piper Verlag, München, 2003, S. 209.)
• In der Quantentheorie geht es um die Wechselwirkung des Wirklichen mit dem
Möglichen.
(David Deutsch; www.psp-tao.de)
• Es gibt keine Materie, sondern nur ein Gewebe von Energien, dem durch intelligenten Geist Form gegeben wurde.
(Max Planck; in Ulrich Warnke, Quantenphilosophie und Spiritualität; 2. Aufl.,
Scorpio, 2011; S. 82)
• Ich bin nicht ein Anhänger des Konstruktivismus, sondern ein Anhänger der
Kopenhagener Interpretation. Danach ist der quantenmechanische Zustand die
Information, die wir über die Welt haben ... Es stellt sich letztlich heraus, dass
Information ein wesentlicher Grundbaustein der Welt ist. Wir müssen uns wohl
von dem naiven Realismus, nach dem die Welt an sich existiert, ohne unser Zutun
und unabhängig von unserer Beobachtung, irgendwann verabschieden.
(Anton Zeilinger; Interview mit Andrea Naica-Loebell, Telepolis 7. Mai 2001)
• Das Revolutionäre und zugleich Paradoxe an der Quantenphysik besteht also
darin, dass gerade die Physik als die rationalste aller Erfahrungswissenschaften
das Bestehen einer grundsätzlichen Schranke für die wissenschaftliche Rationalisierung behauptet, und das dürfte der eigentliche Grund dafür gewesen sein, dass
von so vielen Seiten gegen den quantenphysikalischen Indeterminismus Sturm gelaufen wurde.
(Krings, Baumgartner, Wild: Handbuch philosophischer Grundbegriffe, München,
Kösel, 1973, S.884.
www.psp-tao.de/zitate/details/Krings_Baumgartner_Wild/672 )
• Quantum theory was split up into dialects. Different people describe the same
experiences in remarkably different languages. This is confusing even to physicists.
(David Finkelstein, in Physical Process and Physical Law, in Physics and Whitehead: quantum, process, and experience, Timothy E. Eastman, Hank Keeton
(Hrsg.), SUNY Press, 2004, S. 181.)
300
Anhang D
• The universe does not exist ‘out there’, independent of us. We are inescapably
involved in bringing about that which appears to be happening. We are not only
observers. We are participators. In some strange sense, this is a participatory
universe. Physics is no longer satisfied with insights only into particles, fields of
force, into geometry, or even into time and space. Today we demand of physics
some understanding of existence itself.
(John A. Wheeler; in Dennis Brian, The Voice of Genius: Conversations with
Nobel Scientists and other Luminaries, 127.)
Literaturverzeichnis
[1] Aspect, A.; Grangier, Ph., und Roger, G.; Experimental Realization of EinsteinPodolsky-Rosen-Bohm Gedankenexperiment: A New Violation of Bell’s Inequalities; Phys. Rev. Lett. 49 (1982) 91–94.
Aspect, Alain; Dalibard, Jean, und Roger, Gérard: Experimental Test of Bell’s
Inequalities Using Time-Varying Analyzers; Phys. Rev. Lett. 49 (1982) 1804–1807.
[2] Bacciagaluppi, G., Valentini, Quantum Theory at the Crossroads - Reconsidering
the 1927 Solvay Conference; Cambridge University Press, 2009.
[3] Bell, J.S.; Speakable and Unspeakable in Quantum Physics, 2. edition, Cambridge
University Press (2004).
[4] Bell, J.S.; On the problem of hidden variables in quantum theory; Rev. Mod.
Phys. 38 (1966) 447. Abgedruck in [3].
[5] Bell, J.S., and Nauenberg, M.; The moral aspects of quantum mechanics; in Preludes in Theoretical Physics, A. De Shalit, H. Fesbach und L. van Hove (Hrsg.),
North Holland, Amsterdam (1966) 279–86. Abgedruckt in [3].
[6] Bell, J.S.; On the Einstein-Podolsky-Rosen paradox; Physics 1 (1964) 195. Abgedruckt in [3].
[7] Bell, J.; Against Measurement‘; in 62 Years of Uncertainty, Erice, 5–14 August
’
1989; also in Physics World 8 (1990) 33–40. Abgedruckt in [3].
[8] Bell, J., The Trieste Lecture of John Stewart Bell; J. Phys. A: Math. Theor. 40
(2007) 2919–2933.
[9] Bohm, D.J.; Quantum Theory; Dover Publications, new ed. 1989.
[10] Bohm, D.J.; A Suggested Interpretation of the Quantum Theory in Terms of “Hidden” Variables I & II; Phys. Rev. 85 (1952) S. 166 & 180.
[11] Bohr, N.; On the Constitution of Atoms and Molecules; insgesamt drei Artikel in
der Zeitschrift Philosophical Magazine 26 (1913): Part I, 1–25; Part II Systems
301
302
LITERATURVERZEICHNIS
Containing Only a Single Nucleus, 476–502; Part III Systems containing several
nuclei, 857–875.
[12] Bohr, N.; Can quantum-mechanical description of physical reality be considered
complete?; Phys. Rev. 48 (1935) 696.
[13] Born, M., Heisenberg, W., und Jordan, P.; Zur Quantenmechanik II; Zeitschrift
f. Physik 35 (1925) 557–615.
[14] Born, M.; Zur Quantenmechanik der Stoßvorgänge; Zeitschrift für Physik 37 (12)
(1926) 863–867.
[15] Cabello, A.; Bibliographic guide to the foundations of quantum mechanics and
quantum information; ArXiv:quant-ph/0012089.
[16] Casimir, Hendrik; On the attraction between two perfectly conducting plates, Proc.
Kon. Nederland. Akad. Wetensch. B51 (1948) 793.
[17] Caves, C.M., Fuchs, Ch.A., Schack, R., Unknown Quantum States: The Quantum
de Finetti Representation; J. Math. Phys. 43 (2002) 4537.
[18] Clauser, J.F., Horne, M.A., Shimony, A., and Holt, R.A.; Proposed experiment to
test local hidden-variable theories, Phys. Rev. Lett. 23 (1969) 880-884.
[19] Dawydow, A.S., Quantenmechanik; VEB Deutscher Verlag der Wissenschaften,
Berlin 1974.
[20] de Broglie, L., Sur la possibilité de relier les phénomènes de’interference et de
diffraction à la théorie des quanta de lumière; Comptes Renus 183 (1926) 447448.
de Broglie, L., La mécanique condulatoire et la structure atomique de la matiére
et du rayonnement, Journal de Physique et du Radium 8 (1927) 225–241.
[21] DeWitt, B.S., Quantum Mechanics and Reality: Could the solution to the dilemma
of indeterminism be a universe in which all possible outcomes of an experiment
actually occur? Physics Today 23 (Sept. 1970) 30–40.
[22] Dirac, P.A.M.; The Principles of Quantum Mechanics; (First Editioin 1930);
Fourth Edition, Oxford University Press 1984.
[23] Einstein, A.; Die Planck’sche Theorie der Strahlung und die Theorie der spezifischen Wärme; Annalen der Physik 22 (1907) 180–190.
[24] Einstein, A., Podolski, B., und Rosen, N.; Can quantum-mechanical description
of physical reality be considered complete?; Phys. Rev. 47 (1935) 777–780.
LITERATURVERZEICHNIS
303
[25] Elitzur, A.C., Vaidman, L.; Quantum mechanical interaction-free measurements,
Found. of Phys. 23 (1993), 987.
[26] D’Espagnat, B.; Quantentheorie und Realität; Spektrum der Wissenschaft, 1980,
Heft 1, S. 69.
[27] Everett, H., Relative State Formulation of Quantum Mechanics, Rev. Mod. Phys.
29 (1957) 454–462
Theory of the Universal Wavefunction; Thesis, Princeton University, 1956.
[28] Falk, G., Ruppel, W.; Energie und Entropie. Eine Einführung in die Thermodynamik; Springer Verlag, 1976.
[29] Feynman, R.P.; QED: The Strange Theory of Light and Matter; Princeton University Press, 1985.
[30] Feynman, R.P.; The Character of Physical Law, Penguin Books, 1992.
[31] Feynman, R.; Simulating Physics with Computers; Int. Journ. of Theor. Phys. 21
(1982) 467–488.
[32] Filk, Th.; Relational interpretation of the wave function and a possible way around
Bell’s theorem; Int. Journ. Theor. Phys. 45 (2006) 1166–1180.
[33] Ghirardi, G., Rimini, A., Weber, T., A Model for a Unified Quantum Description
of Macroscopic and Microscopic Systems, in Quantum Probability and Applications, Accardi, L. et al. (Hrsg.), Springer, Berlin (1985).
Ghirardi, G., Rimini, A., Weber, T., Unified Dynamics for microscopic and macroscopic systems, Phys. Rev. D 34 (1985) 470.
[34] Gilder, L.; The Age of Entanglement: When Quantum Physics was Reborn; Vintage Verlag, 2009.
[35] Gottfried, K., und Yan, T.-M., Quantum Mechanics - Fundamentals; Springer
2003.
[36] Grawert, G.; Quantenmechanik; Akademische Verlagsgesellschaft, Frankfurt am
Main (1973).
[37] Guillemin, V., Sternberg, S.; Symplectic Techniques in Physics, Cambridge University Press (1984).
[38] Heisenberg, W.; Der Teil und das Ganze; Piper Verlag GmbH, München, 1969; 6.
Auflage 2005.
304
LITERATURVERZEICHNIS
[39] Heisenberg, W.; Anmerkungen zu dem Artikel von Renninger [66] im Anschluss
an diesen Artikel.
[40] Hermann, G.; Die naturphilosophischen Grundlagen der Quantenmechani; in Ab”
handlungen der Fries’schen Schule“, Bd. VI, S. 75–152, 1935.
[41] Hong, D.K., Ou, Z.Y., Mandel, L.; Measurement of subpicosecond time intervals
between two photons by interference; Phys. Rev. Lett. 59 (1987) 2044.
[42] Hornberger, K., Gerlich, S., Haslinger, P., Nimmrichter, S., Arndt, M.; Colloquium: Quantum interference of clusters and molecules; Rev. Mod. Phys. 84 (2012)
157.
[43] Horodecki, R., Horodecki, P., Horodecki, M., Horodecki, K.; Quantum entanglement; Rev. Mod. Phys. 81 (2009) 865–942.
[44] James, W.; Principles of Psychology; 2 Volumes; Holt and Macmillan, New
York/London 1890.
[45] Jammer, M.; The Philosophy of Quantum Mechanics; Wiley, 1974.
[46] Károlyházy, F.; Gravitation and Quantum Mechanics of Macroscopic Objects;
Nuovo Cimento 42 A (1966) 1506 (alte Seitenangabe 390).
[47] Kragh, H., Quantum Generations: A History of Physics in the Twentieth Century;
Princeton University Press, 2002.
[48] Kwiat, P., Weinfurther, H., Herzog, T., Zelinger, A., Kasevich, M.A.; Interactionfree measurement; Phys. Rev. Lett. 74 (1995) 4763.
[49] Kumar, M.; Quantum: Einstein, Bohr and the Great Debate About the Nature of
Reality; Icon Books (2008).
[50] Lambrecht, Astrid; Das Vakuum kommt zu Kräften: Der Casimir-Effekt; Physik
in unserer Zeit 36 (2005) 85–91.
[51] von Laue, Max; Geschichte der Physik; Universitäts-Verlag Bonn, 1947.
[52] Leggett, A.J., Testing the limits of quantum mechanics: Motivation, state of play,
prospects; Vortrag an der Universität Freiburg, 22.11.2010.
[53] Leibniz, G.W., Vernunftprinzipien der Natur und der Gnade - Monadologie; Verlag Felix Meiner, 1982.
LITERATURVERZEICHNIS
305
[54] Liang, Y.-C., Spekkens, R.W., Wiseman, H.M., Specker’s Parable of the Overprotective Seer: A Road to Contextualiy, Nonlocality, and Complementarity; arXiv:1010.1273v2 [quant-ph].
[55] Madelung, E., Quantentheorie in hydrodynamischer Form, Zeitschrift für Physik
40 (1926) 322–326.
[56] Modi, K., Brodutch, A., Cable, H., Paterek, T., Vedral, V.; Quantum discord and
other measures of quantum correlation; arXiv: [quant-ph] 1112.6238v1.
[57] Nairu, O., Arndt, M. und Zeilinger, A.; Quantum interference experiments with
large molecules; Am. J. Phys. 71 (4) (2003) 319–325.
[58] Newton, I.; Opticks: or, a treatise of the Reflections, Refractions, Inflections and
Colours of Light (1704); Deutsch Optik: Oder Abhandlung über Spiegelungen, Brechungen, Beugungen und Farben des Lichts; Verlag Harri Deutsch (1996).
[59] Nielsen, M.A., Chuang, I.L.; Quantum Computation and Quantum Information;
Cambridge Series on Information and the Natural Sciences; Cambridge University
Press, 2000.
[60] Pauli, W., Brief an Heisenberg vom 15. Juni 1935, in Wolfgang Pauli - Scientific
Correspondence with Bohr, Einstein, Heisenberg a.o., Karl von Meyenn (Hrsg.),
Band II 1930–1939, Springer-Verlag, 1985.
[61] Pauli, W., Bemerkungen zum Problem der Verborgenen Parameter in der Quantenmechanik und zur Theorie der Führungswelle, in Wolfgang Pauli - Das Gewissen der Physik, C.P. Enz und K. von Meyenn (Hrsg.), Friedr. Vieweg &
Sohn, Braunschweig, (ursprünglich in der Festschrift zu de Broglies 60. Geburtstag, 1957).
[62] Penrose, R.; Computerdenken. Des Kaisers neue Kleider oder Die Debatte um
Künstliche Intelligenz, Bewusstsein und die Gesetze der Natur; Spektrum der
Wissenschaft, Heidelberg (1991).
[63] Penrose, R.; Zyklen der Zeit ; Spektrum-Verlag, Heidelberg, 2011.
[64] Planck, M.; Brief an Robert Williams Wood von 1931. Wiedergabe in
Frühgeschichte der Quantentheorie“ von A. Hermann (Physik Verlag, Mosbach
”
1969).
Siehe auch den Artikel ... ich dachte mir nicht viel dabei ...‘ Plancks ungerader
”’
Weg zur Strahlungsformel“ von D. Giulini und N. Straumann; in Physikalische
Blätter 56 (12) (2000) 37–42.
306
LITERATURVERZEICHNIS
[65] von Neumann, J.; Mathematische Grundlagen der Quantentheorie; SpringerVerlag (1932).
[66] Renninger, M.; Messung ohne Störung des Meßobjekts; Z. Physik 158 (1960) 417.
[67] Schrödinger, E.; Die gegenwärtige Situation in der Quantenmechanik; Die Naturwissenschaften 23 (1935) 807–812, 823–828, 844-849.
[68] Schrödinger, E.; Über die Unanwendbarkeit der Geometrie im Kleinen; Die Naturwissenschaften 31 (1934) 518–520.
[69] Scully, M.O., Drühl, K.; Quantum eraser: A proposed photon correlation experiment concerning observation and “delayed choice” in quantum mechanics; Phys.
Rev. A 25 (1982) 2208–2013.
Scully, M.O.; Englert, B.G.; Walther, H.; Quantum optical tests of complementarity ; Nature (London) 351 (1991) 111–116.
[70] Streater, R., und Wightman, A.; PCT, Spin and Statistic and All That; W.A.
Benjamin, 1964; also Princeton University Press, 2000.
[71] Stapp, H.P., Mindful Universe: Quantum Mechanics and the Participating Observer; Springer 2007.
[72] Tumulka, R., A Relativistic Version of the Ghirardi-Rimini-Weber Model; Journ.
Stat. Phys. 125 (2006) 821.
[73] Walborn, S.P.; Terra Cunha, M.O.; Pádua, S.; Monken, C.H.; Double-slit quantum
eraser; Phys. Rev. A 65 (2002) 033818.
Index
Abbildung, lineare, 66
Abel, Niels Henrik, 284
adiabatische Zustandsänderung, 130
adjungierter Operator, 67
Amplitudenvektor, 24, 34
Normierung, 35
Anschlussbedingungen, beim endlichen Kastenpotenzial, 132
Aspect, Alain, 19, 179, 182
Äther, 22
Auf- und Absteigeoperatoren, 137, 195, 291
Ausschließungsprinzip, 17, 169
Austrittsarbeit, 210
Axiome, 87–106, 231
allgemeiner Rahmen, 87
klassische Mechanik, 89
Azimutalgleichung, 145
Baker-Campbell-Hausdorff-Formel, 280
Bayes’sche Wahrscheinlichkeit, 257
BB84, 204
belief function, 257
Bell’sche Ungleichungen, 19, 177
Schülerexperiment, 183
Verletzung in QM, 179, 181
Bell, John, 19, 39, 176, 249
Bell-Messung, 199, 201
Bell-Zustände, 198, 201
Bennett, Charles H., 204
Beta-Bariumborat (BBO), 218
Bewegungsgleichungen, 91, 159–161
Hamilton’sche, 91
Newton’sche, 91
Bit, klassische Informationseinheit, 196
Bloch-Kugel, 190, 197
Bohm’sche Mechanik, 19, 176, 180, 261
Bohm, David, 19, 173, 176, 261, 297
Bohr’scher Radius, 150
Bohr’sches Atommodell, 16
Bohr’sches Magneton, 212
Bohr, Niels, 16, 175, 296
Boltzmann-Faktor, 208
Boltzmann-Konstante, 149
Born’sche Regel, 42, 99, 232, 253
Born, Max, 17, 18, 298
Bose-Einstein-Statistik, 169, 170
Bosonen, 142, 169, 170
Bra-Ket-Notation, 64–85
für Matrizen, 81
für Vektoren, 65
Brassard, Gilles, 204
Brewster-Winkel, 24
Casimir-Effekt, 142
Casimir-Operator, 290
Caves, Carlton M., 256
CCD-Kamera, 28
CHSH-Ungleichungen, 181
Clauser, John, 177, 180
Compton, Arthur, 16, 210
Compton-Effekt, 16
Compton-Streuung, 210
Compton-Wellenlänge, 211
Darstellung, 284
irreduzibel, 285
lineare, 285
307
308
Darstellungsraum, 284
Davisson, Clinton, 17, 54
de Broglie, Louis, 17, 54, 261
deBroglie-Wellenlänge, 55
Definitionsbereich unbeschränkter Operatoren, 72
Dekohärenz, 248, 257
Delayed-Choice, 224
Derivation, Kommutator als, 70
d’Espagnat, Bernard, 177
Deutsch, David, 299
DeWitt, Bryce, 298
Dichtematrizen, 114, 167
Diffusionsgleichung, 154
Dirac, Paul, 64
dispersionsfreie Zustände, 90
Doppellösunginterpretation, 261
Doppelspalt, 45, 155, 216
Down conversion, parametric, 28, 218
Drehgruppe, 286
Lie-Algebra, 189
Drehimpulsoperator, 97
Eigenwerte, 146
Dualer Vektorraum, 64
Ebene Welle, 22
Eddington, Arthur, 298
Eigenfunktionen
harmonischer Oszillator, 139
Kastenpotenzial, 129
Kugelflächenfunktionen, 145
uneigentliche, 83
Eigenschaft, 31, 234
Eigenvektoren, 68
kommutierender Operatoren, 76
selbstadjungierter Operatoren, 75
Eigenwerte, 68
2-dimensionale Matrizen, 188
als mögliche Messwerte, 99, 232
selbstadjungierter Operatoren, 75
INDEX
unitärer Operatoren, 80
von Projektionsoperatoren, 77
Einstein, Albert, 15, 173, 209, 295
Einstein-Podolsky-Rosen (EPR), 19, 173
Einstein-Realität, 180
Einzelphotonquelle, 28
Elektromagnetisches Feld
Energiedichte, 23
Elektronenspin, 17
Elementarteilchen, 283
Elemente der Realität, 173
Elitzur, Avshalom, 221
Elitzur–Vaidman–Experiment, 221
Emissionslinien, 111
Energie
als Generator von Zeittranslationen, 104
Energiebänder, 126
Energiedichte, 23
Energieeigenwerte, 126, 134
harmonischer Oszillator, 138
Kastenpotenzial, 127
Wasserstoffatom, 148
Energieoperator, 97
Energiequantisierung, 124
diskretes Spektrum, 125
Kontinuum, 125
Ensemble-Interpretationen, 255
Entartungsgrad (eines Eigenwerts), 68
EPR-Zustand, 173
Erwartungswert, 100
Dichtematrix, 114
klassisch, 113
Erwartungswertfunktional, 113
Erzeugungs- und Vernichtungsoperatoren,
142
Euler-Winkel, 287
Fermi-Dirac-Statistik, 169, 170
Fermionen, 142, 169, 170
Feynman, Richard, 45, 196, 297
INDEX
309
Finkelstein, David, 299
Fischer, Ernst Peter, 299
Fourier-Transformation, 53, 85, 109
Fraunhofer’sche Linien, 16
Frequenz, 22
Fuchs, Christopher A., 256
Führungsfeldtheorie, 261
Funktion vs. Funktionswert, 64
Funktional, lineares, 112
Funktionalintegraldarstellung, 156, 281
Hermite-Polynome, 139
Hermitesche Konjugation, 67
Hertz, Heinrich, 22
Hilbertraum, 62
quadratintegrable Funktionen, 63, 71,
82
quadratsummierbare Folgen, 63, 70
separabler, 62
Hong-Ou-Mandel-Effekt, 223
Huygens, Christiaan, 22
Gauß-Funktion, 109
Generator einer Gruppe, 286, 287
Gerlach, Walter, 190, 213
Germer, Lester, 17, 54
g-Faktor, 212
Gitter, optische, 216
Gleichverteilungssatz, 207
Greenberger, Daniel M., 298
Groenewald-van Hove-Theorem, 97
Grundzustandsenergie, 138
harmonischer Oszillator, 142
Kastenpotenzial, 130
Gruppe, 284
abelsche, 284
GRW-Kollapsmodell, 260
Gyromagnetisches Verhältnis, 212
Impulsoperator, 83
Impulsraumbasis, 122
Indeterminismus der Quantentheorie, 101
Induktionsannahme, 179, 183
Intensität, 26, 27
als relative Häufigkeit und Wahrscheinlichkeit, 29, 34
als Wahrscheinlichkeitsdichte, 51
relative, 28
Intensität (einer Welle), 23
Interferenz, konstruktive und destruktive,
48, 220
Interferenzexperimente, 47
Buckyballs, 47
Invariante, 285
Invarianz, 284
Ionisierungsenergie, 149
Halbgruppengleichung, 280
Hamilton-Funktion, 104
Jacobi-Identität, für Kommutatoren, 70
Hamilton-Jacobi-Gleichung, 263
James, William, 108
Hamilton-Operator, 89, 122, 123, 160
Jordan, Pascual, 17
zeitabhängig, 119
Károlyházy, Frigyes, 260
Hauptsatz der Thermodynamik
Kastenpotenzial, 126
dritter, 16
Anschlussbedingungen, 274
Heighest Weight-Darstellungen, 290
endliches, 132, 273
Heisenberg’sche Bewegungsgleichung, 159
Randbedingungen, 127
Heisenberg, Werner, 17, 174, 296
klassischer Grenzfall, 131
Heisenberg-Bild, 105
Hermann, Grete, 176
harmonischer Oszillator, 141
310
Knallerexperiment, 221
Kollaps, siehe Reduktion des Quantenzustands
Kollapsmodelle, 258
Kommutator, 69
Komplementarität, 18, 108, 233, 252
klassisch und quantenmechanisch, 32
Kontinuitätsgleichung, 264
Konversionskristall, 218, 222
Kopenhagener Deutung, 18, 252
Korrespondenzprinzip, 97, 105, 160, 254
Kugelflächenfunktionen, 145
Kurzwellenasymptotik, 264
INDEX
transponierte, 67
Matrizenmechanik, 17
Maxwell, James Clerk, 22
Maxwell-Gleichungen, 22
freie, 22
Mehrteilchensysteme, 106
Mermin, David, 298
Messproblem, 244, 255
Messung, 93
als Präparation, 40
bei Polarisationszuständen, 40
in der klassischen Physik, 40
Nachweis, 40
Prokrustrie, 41
L2 , siehe auch Hilbertraum, quadratinte- Mikrowellenhintergrundstrahlung, 206
grable Funktionen, 85
λ/4- und λ/2-Plättchen, 217
Newton, Isaac, 22
Laplace-Operator, in Kugelkoordinaten, 144 Nichtlokalität der QM, 19, 268
Laser, 216
No-Cloning-Theorem, 200
Laserlicht, Eigenschaften, 216
No-Crossing-Theorem, 264
Laserpointer, 28
No-Hidden-Variables-Theorem, 18
Legendre-Polynome, 145
Noether-Theorem, 123
Leggett, Antony J., 258
Normierung, 92
Leistung, Laserpointer, 28
Normierungsbedingung, 52
Licht
O(N), 80
sichtbares, 23
Observable, 42, 93
Wellennatur, 28
als selbst-adjungierter Operator, 232
Lie-Algebra, 288
als selbstadjungierter Operator, 96
Lie-Gruppe, 286
klassische, 90
Lokalität, 180
mögliche Messwerte, 99
Mach-Zehnder-Interferometer, 219
maximaler Satz, 116
Madelung, E., 261
Messvorschrift, 98
Magnetische Quantenzahl, 146
One-Time-Pad, 203
Magnetisches Moment, 211
Operatoren, siehe auch Matrizen und AbMany-Worlds Interpretation, 257
bildungen
Matrixelemente, 67
adjungierte, 67
Matrizen
beschränkte, 69
hermitesch konjugierte, 67
Funktionen von, 69, 78
selbst-adjungierte, 188
kommutierende, 76
INDEX
lineare, 66
normale, 76
selbstadjungierte, 74
unbeschränkte, 69, 70
unitäre, 79
Operatornorm, starke und schwache, 68
Operatortopologie, starke und schwache,
68
optisches Pumpen, 216
Orbit, einer Gruppe, 284
Orthogonale Gruppe, 80
Orthogonalität von Vektoren, 61
Orthonormalbasis, 64
Ortsoperator, 84
Ortsraumbasis, 121
Ortsraumdarstellung, 153
Oszillator, harmonischer, 136–143
mehrdimensionaler, 143
311
lineare, 23, 24, 217
zirkulare, 23, 24, 193, 217
Polarisationsexperimente, 32
Polarisationsfilter, 24
Darstellung durch Matrix, 36
hintereinandergeschaltete, 26
Polarisationsstrahlteiler, 24
Polwürfel, siehe Polarisationsstrahlteiler
Positivität
einer Dichtematrix, 114
einer Wahrscheinlichkeitsverteilung, 113
eines Funktionals, 112
POVM, 257
Poynting-Vektor, 23
Prinzip des hinreichenden Grundes, 101,
253
Projektion einer Amplitude, 27
Projektionsoperatoren, 76, 81
Eigenwerte, 77
Prokrustie, 41, 94
Parallelismus, massiver, 198
Parametrische Fluoreszenz, 218
Paritätsoperator, 131, 283
QBismus, Quanten-Bayesianismus, 256
Parseval’sche Formel, 54
quadratintegrabel, 63
Paschen-Back-Effekt, 212
Quanten, 15
Pauli, Wolfgang, 17, 174, 191, 213, 298
Quanten-Teleportation, 200
Pauli-Matrizen, 188, 289
Quanten-Zenon-Effekt, 234
Kommutatorregeln, 189
Quantencomputer, 196
Penrose, Roger, 260
Quantenfeldtheorie, 141
Permutationen, 171, 172
Quantenkryptographie, 203
Phase, 23
Quantenmechanik
Photoelektrischer Effekt, 16, 209
Bohm’sche, 19, 261
Photonen, 28
Geburtstag, 15
Interpretation, 29
Indeterminismus, 101
Planck’sche Strahlungsformel, 208
und Bewusstsein, 259
Planck’sches Wirkungsquantum, 15, 28, 149
Wahrscheinlichkeitsdeutung, 18
Planck, Max, 15, 206, 299
Quantenpotenzial, 264
Podolsky, Boris, 173
Quantenradierer, 225
Poisson-Klammern, 91, 96, 159
Quantenspinketten, 196
Polargleichung, 145
Quantensprünge, 17
Polarisation, 31, 193
Quantenstatistik, 106, 169
312
INDEX
Quantenzahlen, 283
Quantenzustand, 231
als Katalog unseres Wissens, 256
als normierter Vektor, 92, 231
als Projektionsoperator, 93
als Strahl, 92, 231
Reduktion, 249
separabler, 166
total antisymmetrischer, 171
verschänkter, 166
Quantisierung, einer Theorie, 254
Quantisierungsbedingungen
Kastenpotenzial, 127
Quantum bound, 183
Quantum-Eraser, 225
Qubit, 196
Sommerfeld, Arnold, 16
Spektralzerlegung, 78, 82
Spektrum eines Operators, 73
Spezielle Orthogonale Gruppe, 286
Spezifische Wärme, 16
Spin, 191, 192, 213
in Bohm’scher Mechanik, 268
Modell von Pauli, 191
Spin-Matrizen, 189, 214, 289
Spin-Statistik-Theorem, 171
Spur eines Operators, 74
Spurklasseoperatoren, 74
Stark-Effekt, 16, 211
linearer, 213
quadratischer, 213
Stern, Otto, 190, 213
Stern-Gerlach-Experiment, 190, 191, 213
Rastertunnelmikroskop, 135
Strahl, eines Vektorraums, 42, 77
Reduktion des Quantenzustands, 36, 43, Strahlteiler, 217
102, 232, 249
Strahlungsgesetz, klassisches, 208
Rosen, Nathan, 173
Strukturkonstanten, 288
Rotationsmatrizen, 80
SU(N), 80
Rutherford’sches Atommodell, 16
Summation über alle Wege, 156
Superposition, 37, 104, 234
Schack, Ruediger, 256
vs. Dichtematrix, 115
Schrödinger, Erwin, 17
Symmetrien, 123, 284
Schrödinger-Bild, 105
einer Funktion, 285
Schrödinger-Gleichung, 17, 122
einer Gleichung, 285
freie, 55
Wasserstoffatom, 147
zeitabhängige, 103, 119, 152
zeitunabhängige, 120
Schrödingers Katze, 249
Schwarzer Körper, 206
Schwarzkörperstrahlung, 15
Selbstadjungierte Operatoren, 74
separabel, 166
Skalarprodukt, hermitesches, 61
SO(3), 286
Solvay-Konferenz, 5., 18
Teilreduktionen, 167
Teilspur, 168
Tensorprodukt, 165
Tunneleffekt, 134
U(N), 80
Übergangswahrscheinlichkeit, 100
Ultraviolettkatastrophe, 208
Unitäre Gruppe, 80
Unitäre Operatoren, 79
Eigenwerte, 80
INDEX
Unschärferelationen, 18, 109, 233, 253
Energie–Zeit, 111
Heisenberg’sche, 109
zwischen Ort und Wellenzahl, 110
Vaidman, Lev, 221
Vakuumenergie, 142
Vakuumzustand, 65
Vektorraum, 60–66
Basis, 61
Dimension, 61
dualer, 64
komplexer, 60
Norm, 61
Strahlen, 77
verschränkt, 166, 174
Versteckte Variable
No-Go-Theoreme, 176
Vertauschungsrelationen
Drehimpuls, 147
kanonische, 72, 74, 85, 96
und Eigenzustände, 107
Unschärferelation, 109
Vielwelten-Theorie, 257
von Neumann, Johann, 18
No-Go-Theorem, 176
von Neumann-Entropie, 168, 248
Wahrscheinlichkeit, 101, 253
ontologische, 101
Wahrscheinlichkeitsamplitude, 51
Wahrscheinlichkeitsdichte
Kenngrößen, 52
Wechselwirkungsfreie Messung, 221
Welle, ebene, 46
Welle-Teilchen-Dualismus, 17, 108
Wellengleichung, 22
Wellenlänge, 22
Wellenmechanik, 17
Wellenzahlvektor, 22, 53
313
Wheeler, John A., 224
Wigner, Eugene P., 177, 259
Wigner-Theorem, 123
Wigners Freund, 259
Winkelfrequenz, 22
Wirkung, klassische, 156
WKB-Näherung, 264
Zeeman-Effekt, 16, 211
anomaler, 212
normaler, 212
Zeigerbasis-Problem, 251
Zeigerrechnung, 156
Zeilinger, Anton, 47, 299
Zeitentwicklungsoperator, 104, 119, 152,
279
freier, 154
Zeitoperator, 111
Zenon von Elea, 236
Zenon-Bereich, 236
Zentralpotenziale, 144
Zerlegung der Eins, 82
zirkulare Polarisationen, 193
Zustand, 42, 92
allgemeine Definition, 112
dispersionsfreier, 90, 100
Erwartungswertfunktional, 113
gemischter, 114
klassischer, 89
klassischer, gemischter, 113
klassischer, reiner, 113
Präparation, 102, 115
reiner, 113, 115
Zustand, quantenmechanischer, siehe auch
Quantenzustand
Zwei-Zustands-Systeme, 194
Herunterladen