Quantenmechanik für Lehramtsstudierende Thomas Filk Skript zur Vorlesung Fortgeschrittene Theoretische Physik für Lehramtsstudierende (Version vom 20. 6. 2016) 2 Vorwort Eine erste Version dieses Skripts entstand im Sommersemester 2012 im Zusammenhang mit der Vorbereitung einer Vorlesung Fortgeschrittene Theoretische Physik für ” Lehramtsstudierende“ an der Universität Freiburg. Diese wurde anlässlich der Wiederholung dieser Vorlesung im Sommersemester 2013 nochmals weitgehend überarbeitet. Diese Vorlesung soll Lehramtsstudierenden in erster Linie die Grundlagen der Quantenmechanik vermitteln und ersetzt damit die Quantenmechanik-Vorlesung, die bisher für Lehramtsstudierende Pflicht war. Außerdem werden einige ausgewählte Kapitel aus der Statistischen Mechanik behandelt. Der Schwerpunkt bleibt jedoch die Quantenmechanik. Im Hinblick auf die Bedürfnisse der zukünftigen Lehrer soll im Rahmen dieser Vorlesung weniger Wert auf die Vermittlung von mathematischen Techniken zur Lösung spezifischer Probleme in der Quantenmechanik gelegt werden, statt dessen wird den konzeptuellen Grundlagen ein größeres Gewicht zugeschrieben. Vor diesem Hintergrund wurde beispielsweise auf eine Vermittlung von störungstheoretischen Verfahren sowie eine eingehendere Behandlung der Streutheorie verzichtet. Diese Aspekte sind zwar für den zukünftigen Forscher von Bedeutung, sie geben jedoch keine wesentlichen Zusatzerkenntnisse über das Wesen“ der Quantenmechanik und lassen sich ” ohnehin im Unterricht kaum einsetzen. Trotzdem bleibt natürlich der mathematische Formalismus der Quantenmechanik ein Schwerpunktthema, insbesondere da gerade in der Quantenmechanik die Frage nach einer anschaulichen Interpretation mancher mathematischer Strukturen und Ausdrücke immer noch offen und umstritten ist. Beim Durchblättern des Skripts wird vermutlich auffallen, dass gerade die späteren Abschnitte zu Potenzialsystemen, dem Zeitentwicklungsoperator etc. trotz der obigen Bemerkungen teilweise sehr ausführliche Berechnungen enthalten; ähnliches gilt für einige der Anhänge. Diese Rechnungen sind nicht als Teil des Lehr- und Lernstoffs gedacht sondern als Zusatzinformation für den interessierten Leser. Dies trifft in vermehrtem Maße auf Abschnitte zu, die durch ein Asterisk (*) gekennzeichnet sind. Zu jedem Kapitel gibt es einen einführenden Abschnitt, der kurz und knapp umreißt, welche Inhalte dieses Kapitels verstanden und auch (beispielsweise in einer Prüfung) gewusst werden sollten. Die weiteren Kapitel dienen eher als Anmerkungen und Vertiefungen und gehören auch nur teilweise zu dem in der Vorlesung behandelten Stoff. 4 Sehr viel Wert wird darauf gelegt, dass es eine allgemein akzeptierte anschauliche bzw. philosophische Interpretation der Quantenmechanik nicht gibt. Schon die grundlegende Frage nach dem ontologischen Status der Wellenfunktion wird von verschiedenen Physikern unterschiedlich beantwortet. Daher wird in dem Skript einerseits versucht, die wissenschaftlichen Aussagen möglichst interpretationsneutral zu halten (auch wenn das nicht immer gelungen sein wird). Andererseits wird an geeigneten Stellen aber auch auf unterschiedliche Interpretationsmöglichkeiten eingegangen, angefangen bei rein positivistischen Ansätzen über subjektive und informationstheoretische Interpretationen der Quantenmechanik bis hin zur Bohm’schen Mechanik. Die letztgenannte Theorie beruht auf einer klassischen Ontologie, wobei betont werden soll, dass die meisten Physiker – interessanterweise im Gegensatz zu den meisten Wissenschaftsphilosophen – dieser Theorie sehr kritisch gegenüberstehen. Die Gründe dafür werde ich auch angeben, aber ich bin der Meinung, dass ein Physiker diese Theorie zumindest kennen sollte, um sich eine eigene Meinung bilden zu können. Wer an einer Vertiefung der Grundlagenfragen der Quantenmechanik interessiert ist, sei auf mein Skript Grundlagen und Probleme der Quantentheorie“ hin” gewiesen, das ebenfalls über meine Webseite an der Universität Freiburg zugänglich ist. Derzeit (Sommersemester 2016) wird das Skript in Einzelpunkten nochmals überarbeitet, unter anderem auch nach vielen Anregungen und Hinweisen von Studierenden, die das Skript zur Prüfungsvorbereitung nutzen. Für weitere Vorschläge bin ich immer dankbar. Freiburg, Frühjahr 2016 Thomas Filk Inhaltsverzeichnis Vorwort 3 Inhaltsverzeichnis 5 Allgemeine Einführung 11 1 Historischer Einstieg 15 2 Weshalb Quantenmechanik? I. Photonenexperimente zur Polarisation Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Klassische Lichtwellen . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Licht als Welle und seine Intensität . . . . . . . . . . . . . . . . 2.1.2 Polarisation und Polarisationsstrahlteiler . . . . . . . . . . . . . 2.1.3 Hintereinandergeschaltete Polarisationsfilter . . . . . . . . . . . 2.2 Einzelne Photonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Die Eigenschaften |hi und |vi . . . . . . . . . . . . . . . . . . . 2.2.2 Die Eigenschaften |αi, |pi und |mi . . . . . . . . . . . . . . . . 2.3 Ein Vektor- und Matrizenmodell . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Zustände als Strahlen in der Ebene . . . . . . . . . . . . . . . . 2.3.2 Filter als Projektions-Matrizen . . . . . . . . . . . . . . . . . . 2.3.3 Superpositionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Messungen“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ” 2.4.1 Messung als Präparation, Nachweis, Bestätigung oder Prokrustie“ ” 2.4.2 Ein Matrixmodell von Messung“ . . . . . . . . . . . . . . . . . ” 2.5 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 22 22 24 25 28 30 32 34 34 35 37 39 40 41 42 3 Weshalb Quantenmechanik? II: Das Doppelspaltexperiment 45 Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.1 Der Doppelspalt für Licht und Photonen . . . . . . . . . . . . . . . . . 46 5 6 INHALTSVERZEICHNIS 3.2 3.3 3.4 3.1.1 Schwächere Lichtquelle . Messungen“ . . . . . . . . . . ” Materiewellen . . . . . . . . . . Zusammenfassung und Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Die mathematischen Grundlagen Was man wissen sollte . . . . . . . . . . . . . . . . . . . . 4.1 Vektorräume und physikalische Zustände . . . . . . . 4.1.1 Hilberträume . . . . . . . . . . . . . . . . . . 4.1.2 Die Bra-Ket-Notation . . . . . . . . . . . . . . 4.2 Lineare Abbildungen – Operatoren . . . . . . . . . . 4.2.1 Allgemeine Eigenschaften linearer Operatoren 4.2.2 Besonderheiten in unendlich dimensionalen Hilberträumen . . . . . . . . . . . . . . . . . . 4.2.3 Selbstadjungierte Operatoren . . . . . . . . . 4.2.4 Projektionsoperatoren . . . . . . . . . . . . . 4.2.5 Unitäre Operatoren . . . . . . . . . . . . . . . 4.3 Die Bra-Ket-Notation für Operatoren . . . . . . . . . 4.4 Operatoren im L2 . . . . . . . . . . . . . . . . . . . . ∂ 4.4.1 Das Spektrum von x und −i ∂x . . . . . . . . . 4.4.2 Die x- und k-Basis . . . . . . . . . . . . . . . ∂ 4.4.3 Der Kommutator von x und −i ∂x . . . . . . . 5 Die Postulate der Quantenmechanik und erste Folgerungen Was man wissen sollte . . . . . . . . . . . . . . 5.1 Die Postulate der klassischen Mechanik . . 5.1.1 1. Postulat — Zustände . . . . . . 5.1.2 2. Postulat — Observable . . . . . 5.1.3 3. Postulat — Bewegungsgleichung 5.2 1. Postulat der Quantenmechanik: Darstellung von Zuständen . . . . . . . . . 5.3 2. Postulat der Quantenmechanik: Darstellung von Observablen . . . . . . . . 5.4 3. Postulat der Quantenmechanik: Messwerte und Erwartungswerte . . . . . . 5.5 4. Postulat der Quantenmechanik: Die Reduktion des Quantenzustands . . . 5.6 5. Postulat der Quantenmechanik: Die Dynamik abgeschlossener Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 51 54 56 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 60 60 64 66 66 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 74 76 79 80 82 83 85 85 . . . . . 87 88 89 89 90 91 . . . . . . . . . . . . . . . . 91 . . . . . . . . . . . . . . . . 93 . . . . . . . . . . . . . . . . 99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 . . . . . . . . . . . . . . . . 103 INHALTSVERZEICHNIS 6. Postulat der Quantenmechanik: Mehrteilchensysteme . . . . . . . . . . . . . 5.8 Die Unschärferelationen . . . . . . . . . . . 5.9 Gemischte Zustände und Dichtematrizen . . 5.9.1 Allgemeine Definition von Zuständen 5.9.2 Zustände in der klassischen Mechanik 5.9.3 Dichtematrizen . . . . . . . . . . . . 5.10 Maximale Sätze kompatibler Observabler . . 7 5.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Potenzialsysteme Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Schrödinger-Gleichung für Potenzialsysteme . . . . . . . . . 6.1.1 Zeitabhängige und zeitunabhängige Schrödinger-Gleichung . . . . . . . . . . . . . . . . . 6.1.2 Die Schrödinger-Gleichung in einer Basis . . . . . . . 6.1.3 Symmetrien . . . . . . . . . . . . . . . . . . . . . . . 6.2 Die Quantisierung der Energie . . . . . . . . . . . . . . . . . 6.3 Das unendliche Kastenpotenzial . . . . . . . . . . . . . . . . 6.4 Das endliche Kastenpotenzial — Tunneleffekt . . . . . . . . 6.4.1 Der Tunneleffekt . . . . . . . . . . . . . . . . . . . . 6.5 Der harmonische Oszillator . . . . . . . . . . . . . . . . . . . 6.5.1 Exakte Lösung der Schrödinger-Gleichung . . . . . . 6.5.2 *Auf- und Absteigeoperatoren in der Quantenfeldtheorie . . . . . . . . . . . . . . . . . . . 6.5.3 Semiklassische Berechnung der Grundzustandsenergie 6.5.4 Der harmonische Oszillator in höheren Dimensionen . 6.6 Radialpotenziale und Kugelflächenfunktionen . . . . . . . . . 6.7 Der Bahndrehimpuls . . . . . . . . . . . . . . . . . . . . . . 6.8 Das Wasserstoffatom . . . . . . . . . . . . . . . . . . . . . . 6.8.1 Ein semi-klassisches Argument für die Energieniveaus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 106 112 112 113 114 115 117 . . . . . . 117 . . . . . . 119 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 121 123 124 126 132 134 136 136 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 142 143 144 146 147 149 . . . . . . . . 151 151 152 155 156 158 158 159 161 7 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Der Zeitentwicklungsoperator . . . . . . . . . . . . . . . . . . . . . 7.2 Summation über Wege . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Das Zeigermodell“ der Teilchenpropagation . . . . . . . . . ” 7.3 Das Heisenberg-Bild der Quantenmechanik . . . . . . . . . . . . . . 7.3.1 Die Heisenberg’schen Bewegungsgleichungen . . . . . . . . . 7.3.2 Allgemeine Struktur der Heisenberg-Gleichung . . . . . . . . 7.3.3 * Lineare Bewegungsgleichungen . . . . . . . . . . . . . . . . . . . . . . . . 8 INHALTSVERZEICHNIS 8 Mehrteilchensysteme 163 Was man wissen sollte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 8.1 Mathematische Beschreibung von Mehrteilchensystemen . . . . . . . . 164 8.1.1 Der Tensorraum . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 8.1.2 Separable Zustände und verschränkte Zustände . . . . . . . . . 166 8.1.3 Die Reduktion von Dichtematrizen . . . . . . . . . . . . . . . . 167 8.2 Identische Teilchen und Statistik . . . . . . . . . . . . . . . . . . . . . 169 8.2.1 Fermi-Dirac- und Bose-Einstein-Statistik . . . . . . . . . . . . . 170 8.3 Einstein-Podolsky-Rosen . . . . . . . . . . . . . . . . . . . . . . . . . . 173 8.4 Bell’sche Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 176 8.4.1 Bell’sche Ungleichungen — die Version von Wigner und d’Espagnat177 8.4.2 Bell’sche Ungleichungen — CHSH-Version . . . . . . . . . . . . 180 8.5 Umsetzungen für die Schule . . . . . . . . . . . . . . . . . . . . . . . . 183 8.5.1 Drei Vesperdosen . . . . . . . . . . . . . . . . . . . . . . . . . . 183 8.5.2 Nochmals Vesperdosen . . . . . . . . . . . . . . . . . . . . . . . 184 8.5.3 Eine Schülerbefragung“ . . . . . . . . . . . . . . . . . . . . . . 184 ” 9 Zwei-Zustands-Systeme Was man wissen sollte . . . . . . . . . . . . . . . 9.1 Pauli-Matrizen . . . . . . . . . . . . . . . . 9.2 Der Zustandsraum . . . . . . . . . . . . . . 9.3 Physikalische Anwendungen . . . . . . . . . 9.3.1 Spin- 12 -Systeme . . . . . . . . . . . . 9.3.2 Polarisationszustände von Photonen . 9.3.3 2-Niveau-Systeme . . . . . . . . . . . 9.4 Quanteninformation . . . . . . . . . . . . . 9.4.1 Klassische Information . . . . . . . . 9.4.2 Qubits und Bell-Zustände . . . . . . 9.4.3 Das No-Cloning Theorem . . . . . . 9.4.4 Quanten-Teleportation . . . . . . . . 9.4.5 Quantenkryptographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Fundamentale Experimente zur Quantentheorie Was man wissen sollte . . . . . . . . . . . . . . . . . . 10.1 Das Planck’sche Strahlungsgesetz . . . . . . . . . 10.2 Der photoelektrische Effekt . . . . . . . . . . . . 10.3 Die Compton-Streuung . . . . . . . . . . . . . . . 10.4 Zeeman- und Stark-Effekt . . . . . . . . . . . . . 10.5 Das Stern-Gerlach Experiment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 187 188 189 190 190 193 194 196 196 197 200 200 202 . . . . . . 205 205 206 209 210 211 213 INHALTSVERZEICHNIS 9 11 Optische Experimente zur Quantentheorie Was man wissen sollte . . . . . . . . . . . . . . . 11.1 Experimentelle Bausteine . . . . . . . . . . . 11.1.1 Laser . . . . . . . . . . . . . . . . . . 11.1.2 Doppelspalt und Gitter . . . . . . . . 11.1.3 Strahlteiler . . . . . . . . . . . . . . 11.1.4 λ/4- und λ/2-Plättchen . . . . . . . 11.1.5 Down Conversion Kristalle . . . . . . 11.2 Das Mach-Zehnder-Interferometer . . . . . . 11.3 Wechselwirkungsfreie Messung — das Knallerexperiment“ . . . . . . . . . . . ” 11.4 Das Experiment von Hong, Ou und Mandel 11.5 Delayed Choice Experimente . . . . . . . . . 11.6 Der Quantum-Eraser . . . . . . . . . . . . . 12 Nochmals Photonenpolarisation 12.1 Zusammenfassung des Bekannten . 12.2 Der (inverse) Quanten-Zenon-Effekt 12.3 Zirkulare Polarisationen . . . . . . 12.4 FAQs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 215 216 216 216 217 217 218 219 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 223 224 225 . . . . 231 231 234 237 240 . . . . . . . . . . . . . . . . . . 243 244 244 244 246 248 250 251 252 255 255 256 257 259 259 260 260 261 261 . . . . . . . . . . . . . . . . 13 Probleme, Fragen und Interpretationen Was man wissen sollte . . . . . . . . . . . . . . . . . . . 13.1 Das Messproblem . . . . . . . . . . . . . . . . . . . 13.1.1 Allgemeine Charakterisierung . . . . . . . . 13.1.2 Mathematische Beschreibung . . . . . . . . 13.1.3 Dekohärenz . . . . . . . . . . . . . . . . . . 13.2 Schrödingers Katze . . . . . . . . . . . . . . . . . . 13.3 Das Zeigerbasis-Problem . . . . . . . . . . . . . . . 13.4 Die Kopenhagener Deutung . . . . . . . . . . . . . 13.5 Weitere Interpretationen . . . . . . . . . . . . . . . 13.5.1 Ensemble-Interpretation . . . . . . . . . . . 13.5.2 Subjektive Deutungen und QBism . . . . . . 13.5.3 Many-Worlds . . . . . . . . . . . . . . . . . 13.6 Kollapsmodelle . . . . . . . . . . . . . . . . . . . . 13.6.1 Wigner und der Einfluss des Bewusstseins . 13.6.2 Die Gravitation als Auslöser der Reduktion 13.6.3 GRW – stochastische Kollapszentren . . . . 13.7 Bohm’sche Mechanik . . . . . . . . . . . . . . . . . 13.7.1 Die allgemeine Idee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 INHALTSVERZEICHNIS 13.7.2 13.7.3 13.7.4 13.7.5 13.7.6 Das Quantenpotential . . . . . . . . . . . Klassisch oder Quanten . . . . . . . . . . . Vorteile der Bohm’schen Mechanik . . . . Kritikpunkte an der Bohm’schen Mechanik Die Ontologie? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 265 266 267 271 A1Endliches Kastenpotenzial 273 A1.1 E > V — freie Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . 273 A1.2 0 < E < V — gebundene Teilchen . . . . . . . . . . . . . . . . . . . . . 276 A2Zeitentwicklung und Funktionalintegral 279 A2.1 Herleitung des freien Propagators . . . . . . . . . . . . . . . . . . . . . 279 A2.2 Das Funktionalintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 A3Darstellungen der Drehgruppe A3.1 Symmetrien, Gruppen und ihre Darstellungen A3.2 Die Drehgruppe . . . . . . . . . . . . . . . . . A3.3 Die Lie-Algebra der Drehgruppe . . . . . . . . A3.4 Die Lösung für d = 2 — die Pauli-Matrizen . . A3.5 * Allgemeine Dimensionen . . . . . . . . . . . A3.6 Drehimpuls und Spin in der Quantenmechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 284 286 286 289 289 292 A4Zitate zur Quantentheorie 295 Literaturangaben 301 Allgemeine Einführung Seit ihrer Entstehung zu Beginn des 20. Jahrhunderts steht die Quantentheorie in dem Ruf, unverständlich, absurd und in gewisser Hinsicht sogar unlogisch zu sein. Sie widerspricht teilweise unseren klassischen Grundvorstellungen über die Natur, wodurch ihr manchmal sogar ein esoterischer Charakter zugeschrieben wird. Unzweifelbar ist jedoch, dass diese Theorie zu sehr präzisen und teilweise verblüffenden Vorhersagen geführt hat und immer noch führt, und soweit diese Vorhersagen experimentell überprüfbar waren, wurden sie uneingeschränkt bestätigt. Auch wenn wir den mathematischen Formalismus der Quantenmechanik verstanden haben, bleibt das Gefühl, diesen mathematischen Formalismus nicht wirklich mit einem physikalischen Verständnis untermauern zu können. Häufig fällt es sogar schwer, die Fragen präzise zu formulieren, was genau an der Quantenmechanik so seltsam oder unverständlich erscheint. Oft gibt man sich mit der Erklärung zufrieden, eine solche Anschauung sei nicht möglich, da sie notwendigerweise immer auf den Konzepten der klassischen Physik, die uns aus dem Alltag vertraut sind, beruhen wird. Diese Konzepte müssen aber nicht zwingend auch für die mikroskopische Welt anwendbar sein. Darüber hinaus kann eine solche Anschauung, von welcher Art sie auch sei, im Rahmen des mathematischen Formalismus nicht abgeleitet oder gar ihre Richtigkeit bewiesen werden. Es setzt sich dann ein rein positivistischer Standpunkt durch, d.h., die Aufgabe der Physik wird einzig in der Bereitstellung eines Formalismus gesehen, mit dem sich Vorhersagen zu physikalischen Experimenten möglichst weitgehend aufstellen lassen. Der Versuch eines Begreifens“ im Sinne irgendeiner anschaulichen Vorstellung wird als metaphysisch ” oder philosophisch und nicht mehr zum Bereich der Naturwissenschaft gehörend abgelehnt. Wirklich überzeugend erscheint diese Erklärung nicht, denn beispielsweise in der Mathematik haben wir keine wirklichen Probleme, von höher dimensionalen Vektorräumen, Topologien oder algebraischen Strukturen vieldimensionaler Mannigfaltigkeiten etc. zu sprechen und damit sogar eine gewisse Anschauung zu verbinden, die teilweise weit von den Anschauungen des Alltags entfernt sind. Das Seltsame an der Quantenmechanik ist weniger, dass sie mit ungewohnten mathematische Strukturen formuliert wird, sondern dass gewisse Grundkonzepte, die wir mit der Natur verbinden, 11 12 Allgemeine Einführung nicht mehr zu gelten scheinen. Dazu gehören beispielsweise die intrinsische Indeterminiertheit der Quantenmechanik – man könnte auch sagen, sie genügt nicht mehr dem Leibniz’schen Prinzip des hinreichenden Grundes –, die scheinbare Nicht-Lokalität so genannter Quantenkorrelationen, oder auch die unvermeidbare Einbeziehung des Messprozesses (bis hin zur Einbeziehung eines Beobachters) in die Beschreibung. Gerade wegen dieser letztgenannten Kritikpunkte besteht unter den Physikern noch nicht einmal Einigkeit darüber, inwieweit es sich bei der Quantentheorie überhaupt um eine Theorie“ handelt bzw. was diese Theorie eigentlich umfasst. Das ” Spektrum möglicher Antworten ist riesig: Es reicht von der Meinung, dass die Quantentheorie die fundamentale Theorie unserer Natur sei, bis hin zu der Ansicht, dass es sich bei der Quantentheorie bestenfalls um eine Sammlung empirisch begründeter aber im Wesentlichen unverstandener und insbesondere nicht wirklich widerspruchsfreier Vorschriften handelt. Die Anhänger der zweiten Meinung vergleichen den Formalismus der Quantenmechanik mit einem Kochrezept für einen Kuchen, bei dem als Zutaten schon Teile des Kuchens notwendig sind, und von dem sich bei genauerer Untersuchung aber herausstellt, dass man am Ende gar keinen Kuchen erhält.1 Die Gründe für dieses breite Spektrum werden wir kennen lernen. Natürlich hat es an Erklärungs- oder Interpretationsansätzen nicht gefehlt. Diese unterschiedlichen Interpretationen basieren meist auf dem anerkannten mathematischen Formalismus der Quantenmechanik und führen daher im Allgemeinen zu denselben experimentellen Vorhersagen. Eine Widerlegung der ein oder anderen Interpretation mit wissenschaftlichen Methoden ist nicht möglich – sie sind empirisch gleichwertig. Auch diese Immunisierung der Interpretationsansätze gegen eine Widerlegbarkeit durch das Experiment hat dazu beigetragen, alle Versuche in dieser Richtung als unwissenschaftlich abzutun und aus der wissenschaftlichen Debatte auszuschließen. Doch gerade wenn man Quantenmechanik lehrt, ist es unvermeidbar, dass von Seiten der Lernenden (seien es Schüler und Schülerinnen oder Studenten) Fragen im Sinne des Wie kann ich mir das vorstellen?“ gestellt werden. Auch von einem wis” senschaftlichen Standpunkt ist es dann unbefriedigend, solche Fragen mit einem Gar ” nicht!“ beiseite zu schieben. Auch dieses Gar nicht!“ erfordert eine Erläuterung. ” Die oberste Entscheidungsinstanz der Naturwissenschaft ist immer das Experiment bzw. die Naturbeobachtung. Ein solches Experiment stellt gleichsam eine Frage an die Natur, hinter der letztendlich immer auch die Grundfrage steht, ob die Theorie oder das Modell, mit dem wir die Natur beschreiben, richtig ist. Eine solche Frage muss aber in einen experimentellen Aufbau und ein experimentelles Protokoll übersetzt werden, und die Antwort – das experimentelle Ergebnis – erfordert eine Interpretation. Ohne eine Theorie oder ein Modell sind diese Übertragungen (in beide Richtungen) unmöglich. Einstein hat in einem Gespräch gegenüber Werner Heisenberg einmal be1 In der Quantenmechanik wird Kuchen“ durch eindeutiges Messergebnis“ ersetzt. ” ” Allgemeine Einführung 13 hauptet Erst die Theorie entscheidet darüber, was man beobachten kann“[38] (Kap. ” 5; S. 80). Und Max von Laue erwähnt in seinem Buch zur Geschichte der Physik [51] die Messung der Lichtgeschwindigkeit in bewegten Flüssigkeiten von Fizeau, dessen Ergebnisse zunächst als Beweis für einen Äther, später aber im Rahmen der Relativitätstheorie als Beweis für die Richtigkeit der Einstein’schen Ideen gewertet wurde. Er schreibt dazu: So ist die Geschichte des Fizeau-Versuchs ein lehrreiches Beispiel dafür, wie weit in die Deutung jedes Versuchs schon theoretische Elemente hineinspielen; man kann sie gar nicht ausschalten. Und wenn dann die Theorien wechseln, so wird aus einem schlagenden Beweis für die eine leicht ein ebenso starkes Argument für eine ganz entgegengesetzte. Dieser wissenschaftstheoretische Aspekt spielt in der Quantenmechanik eine noch wesentlichere Rolle als in der klassischen Physik, gerade weil dem Einfluss des Messprozesses und der Messapparatur im allgemeinsten Sinne in der Quantenmechanik eine weitaus größere Bedeutung zukommt als in der klassischen Physik. Von Heisenberg und Dirac, der bekannt war für seine Schweigsamkeit sowie für seine scharfe Logik, erzählt man sich die folgende Geschichte (siehe z.B. [8]): Heisenberg und Dirac gingen auf dem Land spazieren und Heisenberg bemerkte auf einem nahegelegenen Feld einige frisch geschorene Schafe. Da es kalt war, meinte er zu Dirac: Schau, Dirac, diese armen Schafe wurden geschoren.“ Dirac schaute hin, überlegte ” eine Weile und meinte dann: Ja, zumindest auf der uns zugewandten Seite.“ ” Unabhängig davon, ob diese Anekdote stimmt oder nicht, zeigt sie in schöner Weise, wie man mit der Quantenmechanik umgehen sollte. Man kann gar nicht vorsichtig genug sein, zunächst einmal nur das zu akzeptieren, was wir wirklich beobachten, und jede Schlussfolgerung auf die uns abgewandte Seite“ zu vermeiden. Das wird sich ” in aller Strenge praktisch nie umsetzen lassen, aber zumindest sollte man versuchen, sich gelegentlich bewusst zu machen, dass man in die meisten Schlussfolgergungen immer gewisse, nicht direkt beobachtete bzw. beobachtbare Annahmen hineingesteckt hat. 14 Allgemeine Einführung Kapitel 1 Historischer Einstieg Als Geburtstag der Quantenmechanik wird oft der 14. Dezember 1900 angegeben. An diesem Tag hielt Max Planck (1858–1947) einen Vortrag vor der Versammlung der Physikalischen Gesellschaft in Berlin und präsentierte eine Herleitung für die Verteilung der Strahlungsintensität eines schwarzen Körpers als Funktion der Temperatur und der Wellenlänge der Strahlung. Bei dieser Herleitung hatte er von der Annahme Gebrauch gemacht, dass Licht einer bestimmten Wellenlänge von den Oszillatoren in den Wänden eines Strahlungsbehälters immer nur in ganzzahligen Quanten“ aufge” nommen bzw. abgegeben werden kann (vgl. Abschnitt 10.1). Planck hatte die Formel für die Schwarzkörperstrahlung schon ein Jahr zuvor gefunden, allerdings handelte es sich zunächst nur um eine geratene“ Interpolation, ” welche die damaligen thermodynamischen Vorstellungen von der elektromagnetischen Strahlung an das experimentell gefundene Strahlungsgesetz von Wien für sehr kleine Wellenlängen anpassen sollte. Kleine Wellenlänge“ ist hierbei im Vergleich zur ther” mischen Energie E = kB T zu verstehen, was allerdings voraussetzt, dass man Licht einer bestimmten Wellenlänge bzw. Frequenz eine Energie zuordnen kann. Die Konstante h zwischen der Frequenz ν der Welle (bzw. der Wellenlänge λ = c/ν) und der Energie, E = hν, war von Planck schon in seinem Artikel von 1899 als fundamental“ ” erkannt worden. Für Planck war die Annahme quantisierter“ elementarer Energien für Licht ” einer bestimmten Wellenlänge nur eine Arbeitshypothese. So schreibt er in einem Brief an Robert William Wood [64] ... ich dachte mir nicht viel dabei ...“, und an anderer ” Stelle diese Briefs spricht er von einem Akt der Verzweiflung“. Er hatte gehofft, ” dass diese Annahme nur eine Näherung sei, die sich aus einem besseren Verständnis der Wechselwirkung zwischen Materie und elektromagnetischer Strahlung begründen lassen könnte. In der Folgezeit erwies sich die Vorstellung elementarer Lichtquanten aber auch in anderen Bereichen als erfolgreich. So konnte Albert Einstein (1879–1955) im Jah15 16 Historischer Einstieg re 1905 mit dieser Annahme den photoelektrischen Effekt erklären (Abschnitt 10.2). Er erhielt dafür 1921 den Nobelpreis, der ihm allerdings erst 1922 überreicht werden konnte. Im Jahre 1907 leitete Einstein aus einer entsprechenden Annahme für die Schwingungen in einem Kristall die spezifische Wärme von Festkörpern bei sehr kleinen Temperaturen her [23]. Er konnte so das klassische Paradoxon“ klären, weshalb ” die spezifische Wärme für sehr kleine Temperaturen nicht mehr einfach nur durch die Anzahl der thermodynamischen Freiheitsgrade gegeben ist, wie es die klassische statistische Mechanik vorhersagt, sondern gegen null geht, wie es auch der Dritte Hauptsatz der Thermodynamik fordert. In der Folgezeit konnte man mit ähnlichen Quantisierungspostulaten“ weitere ” Scheinparadoxa klären. Beispielsweise hatte Niels Bohr 1913 für die möglichen Bahnen der Elektronen in einem Atom eine Quantisierungsbedingung aufgestellt [11] und postuliert, dass Elektronen auf diesen Bahnen keine Strahlung emittieren und solche Bahnen daher stabil sein sollten. Nach den klassischen Vorstellungen des Elektromagnetismus sollte das Rutherford’sche Planetenmodell für Atome (ein schwerer, positiv geladener Atomkern im Zentrum und sehr leichte, negativ geladene Elektronen auf Kreisbahnen um diesen Kern) instabil sein, da Elektronen auf Kreisbahnen ständig Strahlung emittieren (die Synchrotronstrahlung“), dadurch Energie verlieren und auf ” Spiralbahnen in den Atomkern stürzen müssten. Das Bohr’sche Atommodell konnte die Spektrallinien von einfachen Atomen – sowohl in der Absorbtion von Strahlung durch die Atome als Fraunhofer’sche Linien“, als auch in der Emission von Strahlung – gut ” erklären. Später (1915/1916) erweiterte Arnold Sommerfeld (1868–1951) das Modell um quantisierte elliptische Bahnkurven, wodurch sich die Feinstruktur und die Aufspaltung der Spektrallinien von Atomen in einem elektromagnetischen Feld (Zeemanund Stark-Effekt) erklären ließen (vgl. Abschnitt 10.4). All diese Quantisierungsbedingungen“ waren zunächst reine Postulate. Es gab ” keine wirkliche Erklärung, worauf diese Bedingungen beruhten oder weshalb die derart ausgezeichneten Bahnkurven stabil sein sollten. Einstein hatte seit 1905 immer wieder darauf hingewiesen, dass die Doppelnatur von Licht (einerseits der Teilchencharakter der Quanten“– also der Photonen – als auch der Wellencharakter bei Interferenz- und ” Beugungserscheinungen) das zentrale Problem sei, ohne dessen Lösung die Theorie weiterhin unverstanden bliebe. Mitte der 20er Jahre des letzten Jahrhunderts führten mehrere Entwicklungen zu einem besseren Verständnis sowie einem ausgereiften mathematischen Formalismus. Schließlich entstand das, was wir heute als Quantentheorie bezeichnen. (Für eine ausführlichere Darstellung der historischen Ereignisse siehe beispielsweise [45, 49, 34, 47].) - 1922 entdeckte Arthur Compton (1892–1962) den später nach ihm benannten Effekt der Lichtstreuung an Teilchen, wobei das Licht seine Wellenlänge verändert. Historischer Einstieg 17 Die naheliegende (und zu den Daten passende) Erklärung war, dass sich einzelne Lichtquanten (Photonen) wie Teilchen verhalten und bei der Streuung entsprechend den mechanischen Stoßgesetzen einen Teil ihrer Energie an das streuende Objekt abgeben. Dabei verlieren sie selbst Energie, was nach der schon erwähnten Beziehung E = hν eine Veränderung der Wellenlänge bedeutet (vgl. Abschnitt 10.3). - 1923 entwickelte Louis de Broglie (1892–1987) seine Vorstellung von Materiewellen, die er in seiner Doktorarbeit von 1924 zusammenfasste. Damit wurde der Welle-Teilchen-Dualismus, der bisher nur für Photonen galt, auf sämtliche materielle Teilchen erweitert und es entstand ein einheitliches Bild der Materie. Die nach diesem Bild vorhergesagten Beugungserscheinungen für Elektronen wurden 1927 von Davisson und Germer beobachtet. - Nach der Entdeckung der Linienaufspaltung von Atomen in Magnetfeldern postulierte Wolfgang Pauli (1900-1958) im Jahre 1924 einen neuen Freiheitsgrad für Elektronen, der nur zwei mögliche Werte annehmen kann (den Spin), und 1925 formulierte er das nach ihm benannte Ausschließungsprinzip, wonach jedes Atomorbital nur zweimal besetzt werden kann, und zwar von jeder der beiden Spineinstellungen einmal. - 1925 begann Werner Heisenberg (1901–1976), die klassischen Observablen (Ort, Impuls, Energie, etc.) nicht als Eigenschaften“ von Objekten zu deuten, son” dern als Ausdruck von Übergängen“ zwischen verschiedenen Zuständen dieser ” Objekte bei der Messung dieser Eigenschaften. In Zusammenarbeit mit Max Born (1882–1970) und Pascual Jordan (1902–1980) entstand daraus 1926 die sogenannte Matrizenmechanik [13]. - 1926 stellte Erwin Schrödinger (1887–1961) die Schrödinger-Gleichung auf und gelangte damit zu einer Formulierung der Quantenmechanik durch eine partielle Differentialgleichung. Diese Formulierung erhielt im Folgenden die Bezeichnung Wellenmechanik“. Im Gegensatz zur Matrizenmechanik, welche für die ” Übergänge zwischen Zuständen Quantensprünge“ postuliert, wird die zeitliche ” Entwicklung von Quantensystemen hier kontinuierlich beschrieben. Das fundamentale mathematische Objekt, die Wellenfunktion, welches den Zustand beispielsweise eines Elektrons beschreibt, dachte sich Schrödinger noch als eine Repräsentation einer Ladungsdichteverteilung“. Diese Interpretation konnte später ” nicht aufrecht erhalten werden. Allerdings konnte Schrödinger noch im selben Jahr beweisen, dass seine Wellenmechanik und Heisenbergs Matrizenmechanik im formal mathematischen Sinne äquivalent sind. 18 Historischer Einstieg - Ebenfalls 1926 formulierte Max Born (1882–1970) die Wahrscheinlichkeitsinterpretation der Wellenfunktion und legte damit den Grundstein für die wahrscheinlichkeitstheoretische Deutung der Quantentheorie [14]. Bei dieser ersten Versi” on“ der Wahrscheinlichkeitsinterpretation dachte Born noch an eine Unkenntnis der tatsächlichen Zusammenhänge. Diese Interpretation musste jedoch bald aufgegeben werden, da sie im Widerspruch zum Doppelspaltexperiment war, denn eine reine Unkenntnis des Spalts, durch den ein Teilchen tritt, könnte die Interferenz nicht erklären. - 1926–1927 entwickelte Heisenberg aus Diskussionen mit Niels Bohr die Unschärferelationen; umgekehrt entstand bei Bohr aus diesem gedanklichen Austausch das Konzept der so genannten Komplementarität. Die Vorstellung klassischer Teilchenbahnen, beispielsweise von Elektronen in einem Atom, ließ sich damit nicht mehr halten. - 1927 schließlich kristallisierte sich aus den Diskussionen zwischen Heisenberg und Bohr, zusammen mit der Wahrscheinlichkeitsdeutung von Born, die so genannte Kopenhagener Deutung“ der Quantenmechanik heraus. Auf der 5. Solvay” Konferenz in Brüssel im Oktober 1927 setzte sich diese Interpretation der Quantenmechanik – hauptsächlich vertreten durch Bohr, Heisenberg, Born, Dirac, Pauli und Kramers – nach teilweise hitzigen Diskussionen mit den Zweiflern an dieser Interpretation – Einstein, de Broglie und Schrödinger – durch. Damit war die Entwicklung der Quantenmechanik zu einem ersten Abschluss gekommen und die kommenden Jahre zeichneten sich durch die Anwendung des neuen Formalismus auf unterschiedliche physikalische Systeme und die Vertiefung des Verständnisses der mathematischen Strukturen aus. Versuchte Einstein anfänglich noch durch geschickt konstruierte Gedankenexperimente zu beweisen, dass die Quantenmechanik (insbesondere die Unschärferelationen) inkonsistent sei, gab er diese Versuche um 1930 auf, nachdem systematischere Analysen dieser Experimente“ — meist ” durch Bohr — immer wieder zugunsten der Quantenmechanik ausgefallen waren. Die folgende Auswahl von Ereignissen, die für die Grundlagen der Quantenmechanik von Bedeutung waren, ist sehr subjektiv und bei weitem nicht vollständig: - Im Jahre 1932 wurde das Buch Mathematische Grundlagen der Quantentheorie“ ” [65] von Johann von Neumann veröffentlicht, das die noch vorhandenen Unsicherheiten im Zusammenhang mit unendlich dimensionalen Vektorräumen auf eine mathematisch gesicherte Grundlage stellte. In diesem Buch bewies von Neumann auch, dass sich die Quantenmechanik nicht durch Erweiterung um zusätzliche (nicht beobachtbare) Freiheitsgrade im Rahmen eines klassischen Formalismus erklären lässt (eines der bekanntesten No-Go“ -Theoreme der Physik). ” Historischer Einstieg 19 - 1935 schrieben Einstein, Podolsky und Rosen einen Artikel [24], in welchem sie zwei Teilchen in einem sogenannten verschränkten Zustand betrachteten und durch eine geschickte (gedankliche) experimentelle Anordnung glaubten zeigen zu können, dass die Quantenmechanik unvollständig sei und um zusätzliche Freiheitsgerade erweitert werden müsse. Dieses heute als EPR-Paradoxon bekannte Experiment ist immer noch Thema hitziger Diskussionen. Es steht zwar nicht im Widerspruch zur Quantenmechanik, zeigt aber doch die Existenz eigenartiger Korrelationen, die sich im Rahmen eines klassischen Weltbilds nicht so ohne Weiteres erklären lassen. - Aufbauend auf einem Modell von deBroglie aus dem Jahre 1927 zeigte David Bohm 1952 [10] anhand einer expliziten Formulierung der Quantenmechanik in Form von Wellen und Teilchen, dass eine Interpretation der quantenmechanischen Beobachtungen ihm Rahmen eines klassischen Formalismus möglich ist. Seine Absicht war zu beweisen, dass von Neumann bei seinem No-Go“-Theorem ” offenbar von physikalisch nicht notwendigen Annahmen ausgegangen sein musste, ohne allerdings die genauen Zusammenhänge klären zu können. Dieses zunächst als reines Gegenbeispiel gedachte Modell bezeichnet man heute als Bohm’sche ” (Quanten-)Mechanik“. - In den Jahren 1964–1966 konnte John Bell (1928–1990) die scheinbaren Widersprüche zwischen dem Beweis von Neumanns und dem Modell von Bohm klären, und er formulierte in diesem Zusammenhang eine Klasse von Ungleichungen, die jede klassische, lokale (ohne instantane Fernwirkungen) Theorie erfüllen muss, die aber in der Quantenmechanik verletzt sein können. 1982 zeigten die Experimente von Aspect [1] eindeutig, dass die quantenmechanischen Vorhersagen stimmen und die Bell’schen Ungleichungen verletzt sind. Damit wurde gleichzeitig gezeigt, dass die Quantenmechanik eine nicht-lokale“ Theorie ist, wobei ” allerdings immer noch diskutiert wird, in welchem Sinne diese scheinbare Form der Nicht-Lokalität tatsächlich zu vestehen ist. Von einer allgemein akzeptierten Interpretation der Quantenmechanik sind wir immer noch weit entfernt. Einen ausgezeichneten Überblick über die historische Entwicklung der Quantenmechanik und insbesondere die verschiedenen Interpretationen der Quantenmechanik (zumindest bis in die 70er Jahre des letzten Jahrhunderts) gibt das Buch von Max Jammer [45]. Diese Fragen spielen für die Anwendungen der Quantenmechanik, ihre Vorhersagekraft oder auch ihre mathematische Beschreibung der Beobachtungen keine Rolle, weshalb sie auch oftmals im Rahmen der Physik nicht diskutiert werden. Kapitel 13 gibt einen kleinen Überblick zu den verschiedenen interpretatorischen Ansätzen. 20 Historischer Einstieg Kapitel 2 Weshalb Quantenmechanik? I. Photonenexperimente zur Polarisation Um einen Einstieg in die Quantenmechanik zu erhalten, betrachten wir zunächst rein beschreibend und möglichst frei von Interpretationen zwei Gruppen von Experimenten: Experimente mit der Polarisation von Licht und (im nächsten Kapitel) Doppelspaltexperimente. In beiden Fällen werden die Phänomene zunächst für gewöhnliches Licht beschrieben, wo die Erscheinungen vertraut sind. Anschließend werden wir jedoch beschreiben, was passiert, wenn die Intensität des Lichts so weit herabgesetzt wird, dass nur noch einzelne Lichtquanten – Photonen – durch die experimentelle Anordnung treten. Der klassische mathematische Formalismus, der auf Amplituden und Intensitäten von Lichtwellen beruht, bleibt größtenteils unverändert, aber die Konzepte Amplitu” de“ und Intensität“ erhalten eine neue Interpretation. ” Was man wissen sollte Licht lässt sich klassisch durch elektromagnetische Wellen beschreiben. Diese Wellen haben eine Amplitude und eine Phase, außerdem kann Licht eine Polarisation haben. Das elektromagnetische Feld steht immer senkrecht zur Ausbreitungsrichtung, daher kann man die Polarisationsrichtung der Amplitude durch einen Vektor in einer 2dimensionalen Ebene beschreiben. Tritt Licht durch einen Polarisationsfilter, wird die Amplitude auf die Richtung der Polarisation projiziert. Die Intensität ist proportional zum Absolutquadrat der Amplitude. Wird Licht immer schwächer, beobachtet man nicht mehr eine kontinuierliche Intensitätsverteilung, sondern es werden lokalisiert diskrete Energiequanten auf eine photografische Platte (Detektor etc.) übertragen. Die Energie E dieser Quan21 22 Weshalb Quantenmechanik? - Die Polarisation von Photonen ten hängt mit der Wellenlänge λ über die Beziehung E = hc/λ zusammen, wobei h das Planck’sche Wirkungsquantum und c die Lichtgeschwindigkeit sind (beides fundamentale Naturkonstanten). Die Intensität auf einer photografischen Platte wird zu einer relativen Häufigkeit solcher Energiequanten. Die Interpretation der Amplitude bleibt zunächst offen. Trotzdem bleibt der mathematische Formalismus unverändert: Die Amplitude wird beim Durchtritt durch einen Polarisationsfilter auf die Polarisationsachse projiziert und die Intensität, die für einzelne Energiequanten oder Photonen die Interpretation einer Wahrscheinlichkeit für den Nachweis eines solchen Photons erhält, ist proportional zum Absolutquadrat der Amplitude. 2.1 2.1.1 Klassische Lichtwellen Licht als Welle und seine Intensität Der Streit, ob es sich bei Licht um Teilchen oder Wellen handelt, reicht historisch weit zurück. Isaac Newton (1642–1726) vertrat in seiner Opticks [58] ein Teilchenbild, da er damit beispielsweise die nahezu geradlinige Ausbreitung von Licht erklären konnte, aber auch weil er – unter anderem wegen der nahezu reibungsfreien Bewegung der Planeten – nicht an das Vorhandensein eines Äthers glaubte. Damals konnte man sich eine Welle ohne ein Medium, von dem diese Welle eine Anregung oder Schwingung darstellt, nicht vorstellen. Sein Zeitgenosse Christiaan Huygens (1629–1695) hingegen vertrat ein Wellenbild von Licht, mit dem sich Beugungs- und Interferenzerscheinungen (z.B. Newton’sche Ringe) leicht erklären ließen. Im 19. Jahrhundert setzte sich die Vorstellung von Licht als einer Welle durch, insbesondere nachdem James Clerk Maxwell (1831–1879) und Heinrich Hertz (1857– 1894) zeigen konnten, dass Licht eine elektromagnetische Welle ist, die sich als Lösung der Maxwell-Gleichungen darstellen lässt. Dabei wird Licht durch ein elektrisches (und magnetisches) Vektorfeld beschrieben, das der Wellengleichung genügen muss: 1 ∂2 ~ − ∆ E(x, t) = 0 . c2 ∂t2 (2.1) Für ebene Lichtwellen erhält man Lösungen der Form ~ ~ ei(~k·~x−ωt) , E(x, t) = A (2.2) wobei ~k (mit |~k| = 2π ) der Wellenzahlvektor ist und ω = 2πν = 2πc/λ die Winλ kelfrequenz. λ ist die Wellenlänge des Lichts, ν die normale Frequenz (Anzahl von Schwingungen pro Zeiteinheit) und c die Lichtgeschwindigkeit. Aus der freien Maxwell~ ·E ~ = 0 ergibt sich ~k · E ~ = 0, d.h. E ~ – und damit auch die Amplitude Gleichung ∇ Klassische Lichtwellen 23 ~ – stehen senkrecht auf der Ausbreitungsrichtung. Sichtbares Licht ist eine elektroA magnetische Welle, deren Wellenlänge im Bereich zwischen rund 380 nm und 780 nm liegt. Licht mit 400 nm erscheint blau-violett, Licht mit 700 nm kräftig rot. ~ Zur Bestimmung des physikalischen E-Feldes muss man die Lösung 2.2 in ihren Real- und Imaginärteil zerlegen, also in Sinus- und Kosinusfunktionen, allerdings ~ komplex sein kann. Das bedeutet, die beiden ist dabei zu berücksichtigen, dass A Komponenten der reellen Lösungen können verschiedene Phasen haben. Man erhält auf diese Weise teilweise zirkular polarisiertes Licht, wohingegen man bei Phasengleichheit von linear polarisiertem Licht spricht. Wegen der beiden gekoppelten freien Maxwell-Gleichungen, ~ ~ ×E ~ = − 1 ∂B ∇ c ∂t und ~ ~ ×B ~ = 1 ∂E , ∇ c ∂t (2.3) ~ B ~ = 0) liegt die Lösung für das B-Feld ~ (sowie ∇· bis auf eine Konstante fest, sobald das ~ E-Feld bekannt ist (ich verwende hier die in der theoretischen Physik gebräuchlichen Gauß-Einheiten, diese Details spielen aber keine Rolle). Für das Folgende ist es wichtig, eine Vorstellung von der Intensität einer Welle zu bekommen. Allgemein versteht man unter der Intensität einer Welle eine Energiestromdichte (Energiedichte multipliziert mit der Geschwindigkeit des Energieträgers), also die Energiemenge, die pro Zeiteinheit durch oder auf ein Flächenelement tritt. Zum Nachweis der Welle ist wichtig, wie viel Energie die Welle pro Zeiteinheit und Flächeneinheit auf das Nachweismaterial (photografische Platte, Szintillationsschirm, Geiger-Zähler, Photomultiplyer, CCD-Kamera etc.) überträgt. Diese Menge sollte aber bei nicht zu hohen Intensitäten proportional zur Intensität der Welle sein. Die Schwärzung einer photografischen Platte ist proportional zur Intensität der Strahlung und proportional zur Belichtungszeit, da hier die gesamte übertragene Energie relevant ist. Die Energieflussdichte des elektromagnetischen Feldes wird durch den PoyntingVektor beschrieben: ~ t) = c (E(x, ~ ~ S(x, t) × B(x, t)) , (2.4) 4π und auch die Energiedichte selbst ist ein quadratischer Ausdruck in den Feldern: w(x, t) = 1 ~ ~ (|E(x, t)|2 + |B(x, t)|2 ) . 8π (2.5) Daher ist es plausibel (und lässt sich in einer ausführlicheren Betrachtung auch zeigen), dass die Intensität der Welle am Ort x durch das Quadrat der Amplitude gegeben ist: I(x) ∝ |A(x)|2 . (2.6) Eine Zeitabhängigkeit werden wir in Zukunft vernachlässigen: Sichtbares Licht hat eine Frequenz von rund 4–8 · 1014 Hz. In den meisten Experimenten werden daher nur 24 Weshalb Quantenmechanik? - Die Polarisation von Photonen gemittelte Intensitäten gemessen. Langsame Zeitabhängigkeiten aufgrund von Intensitätsschwankungen der Quelle lassen wir ebenfalls außer acht. Beobachtet wird natürlich immer nur die von einem Detektor oder einer photografischen Platte absorbierte Energiemenge. Diese wird beispielsweise von David Bohm in seinem Buch zur Quantenmechanik [9] hergeleitet. Jeder Oszillator wirkt wie eine kleine Antenne und kann von der Welle Energie absorbieren. Die absorbierte Energiemenge hängt natürlich auch von der Frequenz der Welle (sowie der Eigenfrequenz der Oszillatoren) ab, bleibt aber proportional zum Absolutquadrat der Amplitude. 2.1.2 Polarisation und Polarisationsstrahlteiler Licht kann in unterschiedlichen Polarisationen vorkommen. Allgemein unterscheidet man linear (oder auch planar) polarisiertes Licht und zirkular polarisiertes Licht (sowie natürlich Mischformen dieser beiden). Der Einfachheit halber interessiert uns im Folgenden nahezu ausschließlich linear polarisiertes Licht. In diesem Fall ist der Am~ in Lösung 2.2 reell und die Phasen der Welle sind für beide Kompoplitudenvektor A nenten gleich. Für die weiteren Betrachtungen stellen wir uns immer vor, dass sich die ebene ~ liegt somit in der xyLichtwelle in Richtung der z-Achse ausbreitet, der Vektor A Ebene. In dieser Ebene hat die Welle überall denselben Wert, d.h., wir vernachlässigen die Abhängigkeiten, die sich durch die endliche Ausdehnung der Polarisationsfilter, ~ beschreibt die Amplitude der Welle Blenden, Schirme etc. ergeben. Der Betrag von A und seine Richtung die momentane Polarisation. Als wichtigstes Instrument zur Beeinflussung der Amplituden betrachten wir im Folgenden den Polarisationsstrahlteiler. Oftmals handelt es sich dabei um einen Würfel (daher auch Polwürfel genannt), der aus zwei Prismenteilen zusammengesetzt ist (Abb. 2.1). Die Prismen sind durch eine Grenzfläche getrennt, deren Effekt ähnlich der einer Wasser- oder Glasoberfläche ist: Trifft ein Lichtstrahl auf die Grenzfläche, wird ein Teil des Strahls reflektiert und ein Teil in das Medium gebrochen. Unter einem bestimmten Winkel (dem Brewster-Winkel) ist der reflektierte Strahl dabei vollständig linear polarisiert und zwar parallel zur Grenzfläche (und natürlich senkrecht zur Ausbreitungsrichtung). Der gebrochene Strahl ist im Allgemeinen eine Superposition der beiden möglichen Polarisationen, wobei der Anteil parallel zur Grenzfläche um den reflektierten Anteil verringert ist. Bei bestimmten Kristallen kann man durch geeignete Beschichtungen sowie Mehrfachgrenzflächen erreichen, dass auch der gebrochene Strahl vollständig polarisiert ist. Der Brewster-Winkel ist dadurch definiert, dass der Winkel zwischen gebrochenem und reflektiertem Strahl gerade 90◦ beträgt. Statt eines Polarisationsstrahlteilers verwendet man für manche Experimente auch einfache Polarisationsfilter. Dabei handelt es sich meist um Kristalle, die Licht Klassische Lichtwellen 25 h 6 A .. A ... . . . .. .... . . . ... . . . . . v @ @ @ @ @ 6 @ @ @ h 6 v Abbildung 2.1: (Links) Ein Polwürfel oder Polarisationsstrahlteiler besteht aus zwei zusammengesetzten Prismen mit einer besonders präparierten Grenzfläche. (Mitte) Ein einfallender (unpolarisierter) Strahl wird in zwei (orthogonal) polarisierte Strahlen aufgespalten. Der reflektierte Strahl besitzt eine Polarisation parallel zur Grenzfläche (v) – in der Abbildung senkrecht zur Bildebene –, der durchgelassene Strahl eine horizontale Polarisation (h) in der Bildebene. (Rechts) Umgekehrt kann man auch zwei geeignet polarisierte Strahlen zu einem gemeinsamen Strahl zusammenführen. Bei umgekehrter Wahl der Polarisationen für die einfallenden Strahlen verläuft der ausfallende Strahl nach oben. einer Polarisation absorbieren und Licht mit einer orthogonalen Polarisation durchlassen. Oft erlauben die atomaren Bestandteile dieser Kristalle das Schwingen von Ladungsträgern entlang einer ausgezeichneten Richtung, sodass diese Ladungen bezüglich dieser Richtung wie Antennen wirken, welche die elektromagnetische Strahlung absorbieren. Für das Folgende können wir bei Polarisationsfiltern aber auch einfach an Polarisationsstrahlteiler denken, bei denen uns für weitere Untersuchungen nur einer der austretenden Strahlen interessiert. Hinter der anderen austretenden Strahlrichtung kann ein Detektor die Strahlung nachweisen (vgl. Abb. 2.2). Wir interessieren uns bei den Polarisationsexperimenten ausschließlich für die ~ und ihr Verhalten, wenn der Lichtstrahl durch Polarisationsstrahlteiler Amplitude A oder Polarisationsfilter tritt, deren Achsen unter verschiedenen Winkeln in der Polarisationsebene ausgerichtet sind. Abgesehen von den Strahlteilern bzw. Filtern sollen keine weiteren Einflüsse den Betrag oder die Richtung dieser Amplitude verändern. Die mathematische Beschreibung reduziert sich daher auf die Betrachtung des Ampli~ in einem 2-dimensionalen (reellen) Vektorraum. tudenvektors A 2.1.3 Hintereinandergeschaltete Polarisationsfilter Wir stellen uns nun einen Lichtstrahl vor, der durch einen ersten Polarisationsfilter getreten ist. Die Polarisationsachse dieses Filters sei parallel zur horizontalen x- 26 Weshalb Quantenmechanik? - Die Polarisation von Photonen h Detektor v v h 6 6 '$ 6 '$ &% &% @ @ @ @ 6 6 y 6 6 - x Abbildung 2.2: (Links) Wird bei einem Polwürfel die Intensität des abgelenkten Strahls mit einem Detektor gemessen, erhält man effektiv einen Polarisationsfilter, für den (bei Kenntnis der Intensität des einfallenden Strahls) die Intensität des durchgelassenen Strahls auch ohne direkte Messung bekannt ist. (Mitte und Rechts) Für Polarisationsfilter bzw. bei Verwendung eines Polwürfels als Polarisationsfilter verwenden wir im Folgenden diese Symbole. Die Richtung der durchgelassenen Polarisation wird durch den eingezeichneten Kreisdurchmesser markiert. h bezieht sich auf horizontale Polarisation (in x-Richtung) und v auf eine vertikale Polarisation (in y-Richtung) bei Blick in Strahlrichtung. (Achtung: Das Koordinatensystem zur xy-Richtung bezieht sich nur auf die symolisch dargestellen Polfilter und bezeichnet immer eine Ebene senkrecht zur Strahlrichtung.) Achse. Hinter dem Polarisationsfilter hat die Amplitude des Lichts somit nur eine ~ = A~ex . Wir können die Intensität dieses Lichtstrahls (d.h. das Bex-Komponente: A ~ beispielsweise durch einen Szintillationsschirm sichtbar machen tragsquadrat von A) oder durch eine photographische Platte messen. Lassen wir das so präparierte Licht durch einen zweiten Polarisationsfilter mit derselben Polarisationsachse hindurchtreten, passiert im Wesentlichen nichts: Das Licht tritt ungehindert durch den zweiten Filter hindurch; seine Intensität ist dieselbe wie vorher. Dieses Verhalten erlaubt es uns erst, von einer Polarisation des Lichts zu sprechen. Steht die Achse des zweiten Polarisationsfilters jedoch senkrecht auf der Achse des ersten Polarisationsfilters, wird das gesamte Licht absorbiert und es tritt nichts hindurch, wie wir wieder durch die Detektorplatte nachweisen können. Nun soll die Polarisationsachse des zweiten Filters jedoch unter einem Winkel α zur Achse des ersten Filters stehen. In diesem Fall tritt nur ein bestimmer Anteil des Lichts durch den Filter. Experimentell stellt man fest, dass die Intensität I2 hinter dem Filter mit der Intensität I1 vor dem Filter über die Beziehung I2 = I1 cos2 α zusammenhängt. (2.7) Klassische Lichtwellen 27 ~ der WelDiese Beziehung lässt sich leicht verstehen, wenn man die Amplitude A le als einen gewöhnlichen Vektor interpretiert, der in eine Komponente parallel zur Polarisationsachse und eine Komponente senkrecht zur Polarisationsachse des zweiten Filters zerlegt werden kann. Die Komponente senkrecht zur Polarisationsachse des Filters wird von dem Filter absorbiert und es tritt nur die Komponente parallel zur Polarisationsachse hindurch. Insgesamt kann man die Wirkung des zweiten Polarisationsfilters somit als als eine Projektion dieses Vektors auf die Achse des Filters interpretieren und es gilt für den Betrag der Amplitude: ~ 2| = A ~ 1 · ~eα = |A ~ 1 |(~ex · ~eα ) = |A ~ 1 | cos α . |A (2.8) Da die Intensität der Welle gleich dem Quadrat der Amplitude ist, verringert sich die Intensität der Welle um den Faktor cos2 α. Ein verblüffender Effekt ergibt sich, wenn man hinter den ersten Polarisationsfilter (mit seiner Achse parallel zur x-Achse) zunächst einen zweiten Filter stellt, dessen Polarisationsachse senkrecht auf dem ersten Filter steht, dessen Achse also entlang der y-Achse liegt. Nun tritt kein Licht durch die Anordnung der beiden Filter hindurch. Schiebt man aber einen dritten Filter zwischen die ersten beiden Filter, sodass dessen Polarisationsachse unter einem Winkel von 45◦ zu den anderen beiden Polarisationsachsen steht, tritt plötzlich wieder Licht durch die Anordnung hindurch. Verblüffend an diesem Experiment ist, dass durch das Hinzufügen eines weiteren Filters zu einer Anordnung, die zunächst sämtliches Licht absorbiert, plötzlich wieder Licht hindurchtritt. Der Effekt lässt sich wiederum leicht verstehen, wenn man bei Licht an eine Welle mit einer Amplitude denkt, die von den Polarisationsfiltern immer auf die Polarisationsachse projiziert wird. Anfänglich stehen die beiden Filter senkrecht aufeinander und es tritt kein Licht hindurch. Wurde der dritte Filter dazwischengeschoben, wird die Amplitude zunächst auf eine Achse unter einem Winkel von 45◦ projiziert und verkürzt sich damit um den Kosinus von 45◦ : ~ 2 = (|A ~ 1 |~ex · ~e45◦ )~e45◦ = |A ~ 1 | cos 45◦ ~e45◦ A (2.9) Am dritten Filter wird diese neue Amplitude, die nun nicht mehr senkrecht auf der y-Achse steht, auf die y-Achse projiziert und somit wieder um den Faktor cos 45◦ gekürzt. Insgesamt erhalten wir für die Amplitude hinter dem dritten Filter: ~ 3 = |A ~ 1 | cos2 (45◦ ) ~ey . A (2.10) Der Betrag der Amplitude hat sich also halbiert und für die Intensität folgt: I3 = I2 (cos 45◦ )2 = I1 (cos 45◦ )4 = 1 I1 . 4 (2.11) 28 Weshalb Quantenmechanik? - Die Polarisation von Photonen Wir sehen also, dass wir die Effekte an Polarisationsfiltern leicht verstehen können, wenn wir uns Licht als eine Welle mit einer vektorwertigen Amplitude vorstellen. Diese Amplitude können wir in Bezug auf zwei beliebige aufeinander senkrecht stehende Richtungen zerlegen, und der Filter lässt jeweils immer nur den Anteil parallel zur Polarisationsachse hindurch. Die Amplitude wird durch die Filter also auf deren Polarisationsachse projiziert. Die Intensität wird dabei um den Faktor cos2 α abgeschwächt, wobei α der Winkel zwischen der Polarisationsrichtung der Welle und der Polarisationsachse des Filters ist. 2.2 Einzelne Photonen Wir verringern nun die Intensität der Lichtquelle. Die erste Feststellung ist, dass die relativen Intensitäten, wie sie nach den Polarisationsfilteranordnungen auftreten, nicht von der absoluten Intensität der Lichtquelle abhängen. Inbesondere ist das Verhältnis der Intensität I2 von Licht, das zwei Filter, die unter einem Winkel α zueinander stehen, passiert hat, im Verhältnis zur Intensität I1 des Lichts direkt hinter dem ersten Filter durch I2 /I1 = cos2 α gegeben. Nun soll die Intensität der Lichtquelle jedoch soweit herabgesenkt werden, dass die pro Zeiteinheit im Mittel abgegebene Energie von der Größenordnung E = hν wird, wobei ν = c/λ die Frequenz des Lichts ist (und h = 6, 626 · 10−34 Js das Planck’sche Wirkungsquantum). Die Intensität ist nun sehr gering, und wenn wir eine photographische Platte zum Nachweis des Lichts hinter die Polarisationsfilter stellen, müssen wir möglicherweise sehr lange warten, bis eine deutlich erkennbare Schwärzung zu erkennen ist. Ein paar Zahlen: Ein einzelnes Photon mit einer Wellenlänge von rund 660 nm (rotes Licht) hat eine Energie von E m 1 c = 6, 626 · 10−34 Js · 3 · 108 · λ s 6, 6 · 10−7 m ≈ 3 · 10−19 J . = h Das bedeutet, ein gewöhnlicher Laserpointer mit einer Leistung von 1 mW strahlt rund 3 · 1015 Photonen in jeder Sekunde ab, wobei wir Energieverluste anderer Art außer Acht gelassen haben. Ein Einzelphotonnachweis ist heute mit sehr empfindlichen CCD-Kameras – beispielsweise EMCCD (electron multiplying charge-coupled device) Kameras – möglich. Sie haben eine räumliche Auflösung im Bereich von µm und eine zeitliche Auflösung im MHz-Bereich. Ein großes Problem sind auch Einzelphotonenquellen. Quanteneffekte verhindern, dass man eine gleichmäßig verteilte Einzelphotonenquelle dadurch erhält, dass man gewöhnliche Lichtquellen (Glühbirnen oder Laser) einfach ausreichend stark abschirmt. Oft verwendet man die Fluoreszenz von Zweiniveau-Systemen (Atomen) in Kristalldefekten, die man durch Laserlicht anregt. Noch aufwendiger ist die Down-Conversion (vgl. Abschnitt 11.1.5), bei der ein einfallendes hochenergetisches Photon in einem nicht-linearen Kristall in zwei Photonen niedrigerer Energie umgewandelt wird. Der Einzelne Photonen 29 Vorteil ist jedoch, dass man durch den Nachweis eines dieser Photonen weiß, dass ein zweites Photon unterwegs“ ist. Auf die experimentellen Details werde ich hier nicht weiter eingehen; wichtig ist ” lediglich, dass die angegebenen Experimente tatsächlich durchgeführt werden können. Mit sehr empfindlichen Nachweisgeräten beobachten wir jedoch einen seltsamen Effekt: In unregelmäßigen Abständen werden zeitlich und räumlich lokalisierte Energieübertragungen nachgewiesen. Zunächst beobachtet man nur wenige, mehr oder weniger statistisch verteilte Übertragungspunkte. Je länger man wartet, umso dichter werden diese Punkte. Das Licht trifft also bei diesen geringen Intensitäten nicht mehr kontinuierlich auf die Nachweisplatte und führt langsam aber ebenfalls kontinuierlich zu einem zunehmenden Energieübertrag, sondern wir beobachten in unregelmäßigen Zeitabständen einzelne Signale auf der Nachweisplatte, die davon zeugen, dass an diesem Ort eine bestimmte Energiemenge auf die Platte getroffen ist und die Reaktion zu ihrem Nachweis ausgelöst hat. (Dabei handelt es sich im Wesentlichen um eine Variante des photoelektrischen Effekts, bei dem ein Photon ein Elektron aus einem Verband herausschlägt, das dann nachgewiesen werden kann.) Bei jedem einzelnen Ereignis dieser Art wurde dieselbe Energie hν auf die Nachweisplatte übertragen. Vergleichen wir die Anzahl der punktförmigen Nachweiszentren hinter verschiedenen Filteranordnungen, so ist diese direkt proportional zu den relativen Intensitäten, die wir vorher bei einem intensiveren Licht gemessen haben. Bei genauerer Betrachtung erweisen sich also die klassisch gemessenen Intensitäten der elektromagnetischen Wellen als eine relative Häufigkeit von diskreten Energiequanten — den sogenannten Photonen — und bei der Extrapolation zur Beschreibung einzelner Teilchen wird diese als Wahrscheinlichkeit interpretiert, bei einer Messung ein solches Photon tatsächlich vorzufinden. Man interpretiert die diskreten Lichtquanten, die auf die Detektorplatten übertragen werden, also als einzelne Photonen (Teilchen mit der Energie E = hν), die von der Lichtquelle ausgesendet werden und schließlich beim Nachweis auf die Platte treffen. Bei gewöhnlichem Licht handelt es sich um sehr viele Photonen, deren einzelne Wirkungen wir nicht auflösen können, doch bei der als sehr schwach angenommenen Lichtquelle treten die Photonen einzeln aus der Lichtquelle und treffen auch nacheinander und einzeln auf die Nachweisplatte. Ich werde im Folgenden von Photonen oder Lichtquanten sprechen, ohne aber damit bereits implizieren zu wollen, dass es sich hierbei um Teilchen im herkömmlichen Sinne handelt. Was genau Photonen (und entsprechend alle anderen Entitäten, mit denen wir es zu tun haben werden, wie Elektronen, Protonen etc.) sind, wissen wir nicht. Wir können nur sagen, dass offenbar eine Energieübertragung von dieser En” tität Photon“ auf was auch immer für ein Nachweisgerät in diskreten, räumlich und zeitlich lokalisierten Einheiten erfolgt, die – sofern wir Licht einer festen Wellenlänge betrachten – der Energie E = hν entspricht. 30 2.2.1 Weshalb Quantenmechanik? - Die Polarisation von Photonen Die Eigenschaften |hi und |vi 6 h @ Detektor 3 @ @ @ 6 h @ Detektor 2 v @ @ @ ? v Detektor 1 Abbildung 2.3: Hinter den ersten Polarisationsstrahlteiler werden weitere Polarisationsstrahlteiler (in jede Strahlrichtung einer) mit denselben Polarisationsrichtungen gestellt. Theoretisch wären nun vier Wege für ein Photon möglich, die wir durch Detektoren prüfen können. Nur in Detektor 1 und 4 werden Photonen gemessen, nie aber in Detektoren 2 und 3. Ein horizontal polarisiertes Photon bleibt (ohne weitere Einflüsse) horizontal polarisiert; entsprechend bleibt ein vertikal polarisiertes Photon vertikal polarisiert. Detektor 4 Zunächst stellen wir hinter den ersten Polwürfel in jede der ausgehenden Strahlrichtungen jeweils einen weiteren Polwürfel mit den (in Strahlrichtung) selben Achsenrichtungen (vgl. Abb.2.3). 6 Nach dem ersten Polarisationsstrahlteiler, bei dem das Photon in zwei Richtungen gelenkt werden kann, befinden sich nun zwei weitere Polarisationsstrahlteiler (in jedem Strahlengang einer), bei denen das Photon theoretisch wieder in zwei Richtungen abgelenkt werden könnte. Das ergibt insgesamt vier Möglichkeiten, die wir durch anschließende Detektoren überprüfen können. Es zeigt sich, dass nur zwei der Möglichkeiten tatsächlich auftreten: Ein Photon, das am ersten Polwürfel abgelenkt wurde – dem wir also im Sinne der klassischen Interpretation eine vertikale Polarisation zuschreiben würden – wird immer auch am zweiten Polwürfel abgelenkt; entsprechend wird ein Photon, das am ersten Polwürfel nicht abgelenkt wurde (und eine horizontale Polarisation hat) auch am zweiten Polwürfel nicht abgelenkt. Dieses Verhalten hatten wir schon bei gewöhnlichen Lichtstrahlen beobachtet: Ein Lichtstrahl wird nur in Detektor 1 und Detektor 4 abgelenkt. Abbildung 2.4 zeigt die Verhältnisse nochmals mit gewöhnlichen Polarisationsfiltern hinter dem ersten Polwürfel. Denkt man bei Photonen an Teilchen, wie es ihr nahezu punktförmiger Nachweis auf den Detektorplatten suggeriert, fällt es schwer sich vorzustellen, was die Polarisation bzw. die Polarisationsachse für ein solches Teilchen bedeuten soll. Andererseits Einzelne Photonen 31 Detektor 1 Polwürfel h @ @ @ @ @ @ R @v @ P Detektor 2 Spiegel P - - - - - Abbildung 2.4: Wir können hinter den ersten Polarisationsstrahlteiler beliebig viele Polarisationsfilter der entsprechenden Polarisationsrichtung aufstellen, ohne dass eine (wesentliche) Intensitätsminderung in den Detektoren auftritt. kann man sich natürlich auf den Standpunkt stellen, dass die Polarisation vielleicht nur ein anschauliches, aus der Wellenvorstellung für Licht entnommenes Bild ist, das für Photonen keine Gültigkeit mehr hat. Offensichtlich können Photonen jedoch eine Eigenschaft besitzen, die sie beispielsweise durch einen Filter mit der Achse parallel zu einer bestimmten Richtung hindurchtreten lässt (und zwar unabhängig davon, wie viele dieser Filter wir hintereinanderschalten), die sie andererseits aber von einem Filter mit einer senkrecht dazu stehenden Achse absorbiert werden lässt, und das gleich beim ersten Mal. Wir können daher das Verhalten geeignet präparierter Photonen an bestimmten Filtern bzw. Polarisationsteilern mit Sicherheit“ vorhersagen. Dies erst ” gibt uns die Rechtfertigung, von einer Eigenschaft“ der Photonen zu sprechen. Theo” retisch hätte es ja auch sein können, dass ein Photon immer rein zufällig von einem Filter absorbiert oder durchgelassen wird, unabhängig von seiner Vergangenheit. (Wir werden später sehen, dass die klassische Vorstellung einer Polarisation einer Welle auf dem Niveau einzelner Teilchen“ mit der Eigenschaft eines Spins“ in Verbindung ” ” gebracht wird.) Was auch immer diese Eigenschaft sein mag, wir geben ihr eine suggestive symbolische Bezeichnung: Wir nennen sie |hi bzw. |vi, wobei sich die Eigenschaft |hi experimentell darin äußert, dass dieses Photon von einem Polarisationsfilter mit einer horizontalen Achse immer durchgelassen wird (die zunächst seltsam anmutenden Klammern werden später noch erläutert, hier dienen sie einfach nur zur Kennzeichnung einer Eigenschaft). Entsprechend ist |vi die Eigenschaft, einen Polarisationsfilter mit vertikaler Polarisationsachse immer zu passieren. 32 Weshalb Quantenmechanik? - Die Polarisation von Photonen Weiterhin zeigen uns diese Experimente, dass die beiden Eigenschaften |hi und |vi im klassischen Sinne entgegengesetzt sind, also sich gegenseitig ausschließen. Ein Photon mit der Eigenschaft |hi wird von einem vertikal ausgerichteten Polarisationsfilter immer absorbiert, entsprechend ein Photon mit der Eigenschaft |vi von einem horizontal ausgerichteten Polarisationsfilter. Außerdem sind die beiden Eigenschaften in gewisser Hinsicht vollständig“: Jedes Photon wird von einem Polwürfel entweder ” in die eine oder die andere Richtung abgelenkt. Bei einem Polwürfel mit einer festen Achsenausrichtung gibt es keine dritte Möglichkeit. Im mathematischen Sinne sind die beiden Eigenschaften |hi und |vi komplementär: Jedes Photon, das auf einen Polwürfel trifft, hat anschließend entweder die Eigenschaft |hi oder die Eigenschaft |vi, und diese beiden Eigenschaften schließen sich auch gegenseitig aus. Das bedeutet, die Menge der möglichen Zustände unter der gegebenen experimentellen Anordnung (also dieser speziellen Stellung des Polwürfels) besteht nur aus diesen beiden Zuständen. Man spricht daher auch von einem Zwei-Zustands-System. Die Menge der Zustände ist somit {h, v}, und in diesem Sinne sind die Teilmengen {h} und {v} mathematisch komplementär. Leider wird in der Quantenmechanik der Begriff komplementär aber in einem anderen Sinne benutzt, insofern sollte man zwischen klassischer Komplementarität“ und quantenmechanischer ” ” Komplementarität“ unterscheiden. Im obigen Beispiel wäre eine komplementäre Messanordnung im quantenmechanischen Sinne eine andere Stellung des Polwürfels, beispielsweise mit Polarisationsrichtungen unter ±45◦ – siehe nächsten Abschnitt. 2.2.2 Die Eigenschaften |αi, |pi und |mi Nun stellen wir hinter einen ersten Filter (der nur Photonen mit der Eigenschaft |hi durchlassen soll) einen zweiten Polarisationsfilter, dessen Polarisationsachse um einen Winkel α zur x-Richtung gedreht ist. Das Experiment zeigt folgende Effekte: - Photonen werden von dem Filter entweder absorbiert oder durchgelassen, d.h., auf dem Detektorschirm hinter dem zweiten Filter treffen immer noch ganze Photonen auf. Es werden weder nur Anteile“ eines Photons gemessen, noch hat ” sich die einzelne Energie der durchgelassenen Photonen verändert. Entsprechend werden die Photonen von einem Polarisationsstrahlteiler, dessen Achsen nun unter einem Winkel α zur Horizontalen geneigt sind, entweder in die eine oder die andere Richtung abgelenkt. Nie werden nur Anteile eines Photons abgelenkt, und nie wird ein Photon absorbiert, also weder in die eine noch die andere Richtung abgelenkt. (Diese letzte Aussage ist eine Idealisierung, da praktisch jeder Kristall einen gewissen Prozentsatz an Photonen absorbiert; dieser Prozentsatz ist aber nahezu unabhängig von dem Winkel α und kann mit hochwertigen Geräten beliebig klein gemacht werden.) - Eine Intensitätsmessung über einen längeren Zeitraum zeigt, dass die Anzahl der Einzelne Photonen 33 Photonen, die pro Zeiteinheit auf einen Detektorschirm hinter dem zweiten Filter treffen, um den Faktor cos2 α geringer ist, als die Anzahl der Photonen, die den ersten Filter passiert haben. Dies entspricht der Beobachtung bei einer klassischen elektromagnetischen Welle, deren Intensität bei dieser Filteranordnung um den Faktor cos2 α verringert wird. Entsprechend beobachtet man bei einem Polwürfel, dass der Anteil der abgelenkten Photonen nun sin2 α von der einfallenden Intensität beträgt. - Befindet sich hinter dem zweiten Filter ein dritter Filter, dessen Achse ebenfalls unter dem Winkel α zur x-Achse orientiert ist (also parallel zur Achse des zweiten Filters steht), so tritt dieselbe Anzahl von Photonen pro Zeiteinheit hindurch. Es werden also an dem dritten Filter keine Photonen mehr absorbiert, welche den zweiten Filter passiert haben. Die letztgenannte experimentelle Tatsache legt nahe, einem solchen Photon, das den zweiten Filter passiert hat, die Eigenschaft |αi zuzusprechen. Damit ist die Eigenschaft gemeint, mit Bestimmtheit durch einen Filter mit Polarisationsachse unter dem Winkel α zur Horizontalen hindurchtreten zu können. Entsprechend bezeichnen wir mit |90◦ +αi die Eigenschaft, von einem solchen Filter immer absorbiert zu werden, bzw. (was äquivalent ist) von einem Polarisationsfilter mit der Achsenrichtung 90◦ + α mit Sicherheit durchgelassen zu werden. Der Winkel α ist im Prinzip beliebig, allerdings definieren die beiden Winkel α und α + 180◦ dieselbe Polarisationsrichtung, insofern wählen wir α in Zukunft meist im Bereich −90◦ < α ≤ +90◦ . Die Menge der möglichen Polarisationszustände lässt sich also durch einen Winkel zwischen −90◦ und +90◦ kennzeichnen. Im Hinblick auf spätere Anwendungen definieren wir folgende spezielle Polarisationsrichtungen (p, m beziehen sich auf plus und minus 45◦ ): |hi = |0◦ i |pi = | + 45◦ i |vi = |90◦ i |mi = | − 45◦ i Wir stellen nun hinter den zweiten Filter (Polarisationsrichtung α) einen dritten Filter, dessen Polarisationsachse allerdings wieder horizontal ist. Wie wir es von unserer bei gewöhnlichem Licht gewonnenen Anschauung erwarten, werden an dem dritten Filter wieder einige Photonen absorbiert, und die Intensität bzw. die Anzahl der durchgelassenen Photonen verringert sich erneut um den Faktor cos2 α. Offenbar wurde die Eigenschaft |hi, die alle Photonen hinter dem ersten Filter noch hatten, durch den zweiten Filter teilweise zerstört. Wir müssen also schließen, dass ein Filter nicht einfach nur Photonen mit gewissen Eigenschaften ungehindert hindurchlässt und andere Photonen absorbiert, sondern offensichtlich hat er auch einen Einfluss auf die Polarisationseigenschaften der Photonen — er kann diese Eigenschaften verändern. 34 Weshalb Quantenmechanik? - Die Polarisation von Photonen Anscheinend hat ein einzelnes Photon nicht per se“ bestimmte Polarisations” eigenschaften, sondern ein Filter, durch den dieses Photon hindurchtritt, scheint ihm diese Eigenschaften erst zu geben. Entsprechend kann ein zweiter Filter auch eine vorhandene Polarisationseigenschaft nehmen bzw. verändern, sofern er unter einem bestimmten Winkel zur ursprünglichen Polarisationsrichtung steht. Das Gesagte lässt uns also zu dem Schluss kommen, dass ein Filter nicht unbedingt eine bestimmte Eigenschaft eines Photons misst“, sondern dass ein Filter ” Photonen, die den Filter passieren, mit dieser Eigenschaft präpariert“. Man kann ” nun mit diesen so präparierten Photonen weitere Experimente machen. Stellt man weitere Filter mit derselben Polarisationsachse hinter den ersten Filter, kann man eigentlich auch nicht von einer Messung sprechen – sofern man unter einer Messung einen Informationsgewinn versteht –, sondern man bestätigt nur die Tatsache, dass eine bestimmte Eigenschaft und damit ein bestimmter Zustand vorliegt. 2.3 2.3.1 Ein Vektor- und Matrizenmodell Zustände als Strahlen in der Ebene Die bisherigen Erörterungen legen es nahe, dass die Vorstellung von einem Amplitu~ zur Beschreibung der Eigenschaft, die wir klassisch mit der Polarisation denvektor A in Verbindung bringen, durchaus sinnvoll zu sein scheint. Dieser Amplitudenvektor wird durch einen Filter auf eine bestimmte Achse projiziert, allerdings hat die so erhaltene Intensität, also das Betragsquadrat des projizierten Vektors, für Photonen die Bedeutung einer relativen Häufigkeit. Für einzelne Photonen entspricht das einer Wahrscheinlichkeit. Bei Wellen wissen wir, wie die neuen Amplituden nach dem Durchtritt der Welle durch einen Filter zu berechnen sind. Wir übernehmen nun einfach diesen Formalismus auf für einzelne Photonen — er führt zu den experimentell richtigen Ergebnissen —, interpretieren ihn aber im Sinne von Wahrscheinlichkeiten. Ein Photon, das einen v-Filter (alo einen vertikalen Filter) passiert hat, wird ~ = ~ey beschrieben, entsprechend wird ein Photon, das einen h-Filter durch den Vektor A ~ = ~ex beschrieben: (horizontale Polarisationsachse) passiert hat, durch A ! 1 ~x = A Amplitude eines Photons, das einen x-Filter passiert hat,(2.12) 0 ! 0 ~y = A Amplitude eines Photons, das einen y-Filter passiert hat.(2.13) 1 Diese beiden Vektoren repräsentieren nun also ein Photon mit den Eigenschaften |hi und |vi. Ein Vektor- und Matrizenmodell 35 Allgemeiner beschreiben wir ein Photon, das einen α-Filter (relativ zur x-Achse) passiert hat, also die Eigenschaft |αi hat, durch ~α = A cos α sin α ! Amplitude eines Photons, das einen α-Filter passiert hat. (2.14) Streng genommen wird der Polarisationszustand eines Photons durch die Polarisationsachse beschrieben. Jeder Vektor auf dieser Achse bezeichnet somit denselben Zustand und ist daher ein Repräsentant für diesen Zustand. Hier scheint ein Unterschied zur klassischen Sichtweise zu bestehen: Dort ent~ einer Amplitude und das Quadrat dieser Amplitude ist proportional zur spricht A ~ eine beobachtbare Bedeutung zu. Intensität. Klassisch schreiben also dem Vektor A ~ 2 eine relative Häufigkeit. Bei Denken wir an einen Schwarm von Photonen, wird aus |A| einem Übergang zu einem einzelnen Teilchen, wird aus dieser relativen Häufigkeit die Interpretation einer Wahrscheinlichkeit. Um bei den Berechnungen der Wahrscheinlichkeiten bzw. relativen Häufigkeiten nicht immer normieren zu müssen, wählt man als Repräsentatenvektor für den Polarisationszustand einen auf 1 normierten Vektor. Dies ist in obigen Beispielen geschehen. Man kann diese Normierung so interpretieren, dass ein Photon im Zustand α mit Sicherheit (Wahrscheinlichkeit 1) eine Polarisation ~ α hat. Es verbleibt allerdings immer noch ein Vorzeichen: A ~ α und −A ~α parallel zu A lassen sich experimentell nicht unterscheiden und bezeichnen denselben Polarisationszustand. 2.3.2 Filter als Projektions-Matrizen Die Wirkung eines Filters lässt sich bei einer Lichtwelle durch die Projektion der Amplitude auf die Polarisationsachse beschreiben. Zur Berechnung der Wahrscheinlichkeit, mit der ein einzelnes Photon mit Polarisationsrichtung ~eα einen Filter passiert, dessen Polarisationsachse in Richtung ~eβ zeigt, bilden wir das Skalarprodukt der beiden Vektoren (dies liefert uns den Betrag der projizierten Amplitude) und quadrieren das Ergebnis: Prob(|βi ← |αi) = |(~eβ · ~eα )|2 = cos2 (β − α) . (2.15) Prob(|βi ← |αi) bezeichnet die Wahrscheinlichkeit, dass ein Photon mit der Eigenschaft |αi einen Filter passiert, der ihm die Eigenschaft |βi verleiht. Der Formalismus liefert uns also zwei Informationen: Zum einen können wir die Wahrscheinlichkeit berechnen, mit der ein Photon mit einer bestimmten Polarisationseigenschaft durch einen bestimmten Filter tritt, bzw. bei einem Polwürfel in eine bestimmte Richtung abgelenkt wird. Andererseits sagt er uns auch, durch welchen Zustandsvektor ein Photon, das tatsächlich durch den zweiten Filter hindurchgetreten ist 36 Weshalb Quantenmechanik? - Die Polarisation von Photonen (bzw. von einem Polwüfel in eine bestimmte Richtung abgelenkt wurde), nun beschrieben werden muss. Der Zustandsvektor für die Polarisationseigenschaft des Photons hinter dem Filter ist ein anderer als der vor dem Filter. Diese Neuzuschreibung eines Zustands zu einem physikalischen System nach dem Passieren eines Filters (leider spricht man in diesem Fall auch von einer Messung“, was in meinen Augen eine sehr ” unglückliche Bezeichnung ist) bezeichnet man in der Quantenmechanik als Kollaps“ ” des Quantenzustands oder auch als Reduktion“ des Quantenzustands. ” Wir können die Wirkung eines Polarisations-Filters auch durch eine Matrix ausdrücken, welche einen beliebigen anfänglichen Polarisationsvektor auf einen bestimmten neuen Polarisationsvektor (parallel zur Polarisationsachse des Filters) projiziert. Für die horizontale und vertikale Achse gilt einfach: ! 1 0 Ph = Wirkung eines h-Filters, (2.16) 0 0 ! 0 0 Pv = Wirkung eines v-Filters. (2.17) 0 1 Etwas weniger offensichtlich ist, dass die folgende Matrix einen α-Filter beschreibt: ! cos2 α cos α sin α Pα = Wirkung eines α-Filters. (2.18) cos α sin α sin2 α Man erkennt jedoch, dass die Wirkung dieser Matrix auf eine Amplitude zu einem in x-Richtung bzw. in y-Richtung polarisierten Photon folgende Amplitudenvektoren liefert: ! ! cos α cos α Pα~ex = cos α Pα~ey = sin α . (2.19) sin α sin α In beiden Fällen erhalten wir also eine Amplitude, die in α-Richtung zeigt, allerdings ist das Betragsquadrat dieser Amplitude nun cos2 α bzw. sin2 α. Das entspricht jedoch genau unserer Interpretation der Wahrscheinlichkeit: Das Betragsquadrat der Amplitude ergibt die Wahrscheinlichkeit, dass das entsprechende Photon den α-Filter passiert. Diese Wahrscheinlichkeit ist für das h-Photon gerade cos2 α, und für das v-Photon 1 − cos2 α = sin2 α. Für die bisher definierten Projektionsmatrizen gelten folgende Beziehungen: Ph~ex = ~ex und Pv~ey = ~ey (2.20) Ph~ey = 0 und Pv~ex = 0 . (2.21) Die ersten beiden Gleichungen bringen zum Ausdruck, dass ein in x-Richtung polarisiertes Photon mit Sicherheit von einem h-Filter durchgelassen wird, und entsprechend Ein Vektor- und Matrizenmodell 37 wird ein in y-Richtung polarisiertes Photon von einem v-Filter durchgelassen. Die beiden unteren Gleichungen bedeuten, dass ein vertikal polarisiertes Photon mit Sicherheit von einem h-Filter und ein horizontal polarisiertes Photon von einem v-Filter absorbiert wird. Weitere, leicht zu zeigende Identitäten sind: Ph Ph = Ph , P v Pv = Pv , P h Pv = P v Ph = 0 . (2.22) Diese Gleichungen bedeuten, dass zwei hintereinandergeschaltete h-Filter ebenso wirken wie ein einzelner h-Filter, entsprechend für v-Filter. Stellt man einen h-Filter hinter einen v-Filter (oder umgekehrt) wird überhaupt kein Photon durchgelassen, es werden also alle Photonen absorbiert. 2.3.3 Superpositionen Wir wollen diese Beschreibung für den Polarisationszustand von Photonen noch etwas weiter ausreizen. Der Zustandsvektor für ein Photon, das einen α-Filter passiert hat, lässt sich nach den horizontalen und vertikalen Polarisationsrichtungen zerlegen (Gl. 2.14): ~ α = cos α A ~ x + sin α A ~y . A (2.23) Im Sinne einer klassischen Welle besitzt diese Gleichung eine anschauliche Bedeutung: Eine in α-Richtung polarisierte Welle lässt sich als Überlagerung von einer in x-Richtung und einer in y-Richtung polarisierten Wellen schreiben. Die Komponenten entsprechen dabei den Amplituden dieser Wellen. Die Interpretation dieser Gleichung für ein einzelnes Photon ist schwieriger und führt uns wieder ins Zentrum der Diskussion um die Bedeutung der Quantenmechanik. An dieser Stelle soll daher nur angedeutet werden, was diese Gleichung nicht bedeutet: • Sie bedeutet nicht, dass sich ein Photon im Zustand |αi aus zwei Photonen zusammensetzt, von denen eines den Zustand |hi und das andere den Zustand |vi hat. Beide Beiträge auf der rechten Seite der Gleichung beschreiben (bis auf einen Faktor) einzelne Photonen, und auch die Summe beschreibt wieder nur ein einzelnes Photon. • Sie bedeutet ebenfalls nicht, dass sich ein Photon im Zustand |αi entweder im Zustand |hi befindet oder im Zustand |vi. Erst auf dem Niveau von Wahrscheinlichkeiten ist eine solche entweder–oder“ -Interpretation zulässig. Bilden wir das ” ~x ⊥ A ~ y ), so erhalten wir: Quadrat dieser Gleichung (und nutzen aus, dass A ~ α k2 = cos2 αkA ~ x k2 + sin2 αkA ~ y k2 . kA (2.24) 38 Weshalb Quantenmechanik? - Die Polarisation von Photonen Diese Gleichung können wir nun im Sinne von Wahrscheinlichkeiten deuten: Wenn an einem |αi–Photon eine Messung der horizontalen bzw. vertikalen Polarisation vorgenommen wird (das bedeutet, das Photon tritt zunächst durch einen h-v-orientierten Polarisationsstrahlteiler, anschließend messen Detektoren die Richtung der Ablenkung), dann finden wir mit der Wahrscheinlichkeit cos2 α eine horizontale Polarisation (es wird von einem entsprechenden polarisationsabhängigen Strahlteiler mit dieser Wahrscheinlichkeit in die |hi-Richtung abgelenkt) und mit der Wahrscheinlichkeit sin2 α eine vertikale Polarisation. Abbildung 2.5: Photonen, die den αFilter passieren, haben hinter dem Filter die Polarisation |αi. Ein anschließender Polwürfel sei so ausgerichtet, dass er einen einfallenden Strahl in eine horizontale (h) und eine vertikale (v) Komponente zerlegt. Durch Spiegel werden dieser Strahlen auf einen zweiten Polwürfel derselben Polarisationsrichtungen gelenkt und wieder zusammengeführt. Hinter diesem Polwürfel liegt wieder die Polarisation α vor, wie man durch einen entsprechenden Filter und anschließenden Detektor nachweisen kann. (Anmerkung: Hier wurden die Phasenverschiebungen an den reflektierenden Flächen nicht berücksichtigt – siehe Abschnitt 11.2. Es geht zunächst nur um das Prinzip.) Detektor Ohne damit eine Erklärung gefunden zu haben, wie man Gleichung 2.23 zu interpretieren hat, spricht man in der Quantenmechanik von einer Superposition. Man sagt, dass ein in α-Richtung polarisiertes Photon eine Superposition von einem in x-Richtung und einem in y-Richtung polarisierten Photon ist. Dabei ist allerdings zu bedenken, dass eine solche Zerlegung in Komponenten bezüglich zweier beliebiger orthogonaler Vektoren vorgenommen werden kann. α 6 α α - h- 6 6 6 - v α 6 α 6 Abbildung 2.5 zeigt eine experimentelle Anordnung, welche die Zerlegung in eine Superposition und anschließende Zusammenführung nach folgendem Schema ~eα −→ cos α ~ex + sin α ~ey −→ ~eα (2.25) experimentell realisiert, und zwar sowohl für gewöhnliche Lichtstrahlen als auch – nach geeigneter Uminterpretation der Intensitäten in Wahrscheinlichkeiten – für ein- Messungen“ 39 ” zelne Photonen. Angenommen, ein Photon wird von einem α-Filter durchgelassen und hat somit die Eigenschaft |αi. Anschließend trifft dieses Photon auf einen Polwürfel, der gewöhnliches Licht in horizontale und vertikale Polarisationen aufspalten würde. Wir könnten in beide Strahlen Detektoren stellen und nachweisen, dass jedes einzelne Photon mit einer Wahrscheinlichkeit cos2 α in die horizontale Richtung und mit der Wahrscheinlichkeit sin2 α in die vertikale Richtung abgelenkt wird. In einem konkreten Experiment werden diese Wahrscheinlichkeiten durch die relativen Häufigkeiten gemessen, mit der Photonen in den jeweiligen Detektoren nachgewiesen werden. Führen wir eine solche Messung aber nicht durch, können wir die potenziellen Strahlen wieder durch einen entsprechenden Polarisationsfilter zu einem einzigen Strahl zusammenführen. Wir werden nun feststellen, dass (1) alle Photonen, die den ersten Filter passiert haben, auch den zweiten Filter passieren, also keines absorbiert wurde, und (2) diese Photonen die Eigenschaft |αi haben. Eine solche Aufspaltung in die beiden superponierten Anteile lässt sich bezüglich jeder orthonormalen Polarisationsrichtung der Polwürfel durchführen. 2.4 Messungen“ ” Der Begriff der Messung spielt in der Quantenmechanik eine wichtige aber auch sehr umstrittene Rolle. Einerseits haben die Väter“ der Quantenmechanik, allen voran ” Bohr und Heisenberg, Wert darauf gelegt, dass sich die Quantenmechanik nur auf das Beobachtbare beziehen darf, und sie haben daher ihre Axiomatik der Quantentheorie auf das Beobachtbare und damit die Ergebnisse von Messungen aufgebaut. Andererseits haben Kritiker wie John Bell (1928–1990) immer wieder betont, dass bei einer wirklich fundamentalen Theorie die Beschreibung einer Messung“ eigentlich aus dem ” Formalismus ableitbar sein sollte. In einem berühmten Artikel Against Measurement‘ ’ [7] spricht sich Bell dafür aus, diesen Begriff — natürlich nicht das Experiment selbst — ganz aus dem Vokabular des Physikers zu verbannen, zumindest wenn er über die Grundlagen der Quantentheorie spricht, da es sich letztendlich nur um eine besondere Form von Wechselwirkung zwischen zwei Systemen handelt (siehe dazu den Abschnitt 13.1 zum Messproblem). An dieser Stelle sollen einige Bemerkungen zum Begriff der Messung im Zusammenhang mit dem Polarisationsfreiheitsgrad von Photonen gemacht werden und auch eine mathematische Darstellung von dem Ergebnis von Beobachtungen gewonnen werden. 40 Weshalb Quantenmechanik? - Die Polarisation von Photonen 2.4.1 Messung als Präparation, Nachweis, Bestätigung oder Prokrustie“ ” In der klassischen Physik bedeutet eine Messung im Idealfall, dass wir eine Information über das gemessene System erhalten, ohne dass sich der Zustand dieses Systems in irgendeiner Weise geändert hat. Diese Idealvorstellung einer Messung ist in der Quantentheorie im Allgemeinen nicht mehr haltbar. Nach unseren Erläuterungen zum Polarisationszustand einzelner Photonen sollten wir die Bedeutung und Wirkung von Messgeräten“, wie Polarisationsfiltern, De” tektoren und Polarisationsstrahlteilern, eigentlich in mehrere Klassen unterteilen: - Den Durchtritt eines Photons durch einen Filter könnte man als Präparation bezeichnen, insbesondere wenn über den Zustand des Photons vorher nichts bekannt ist. Eine Präparation erfolgt immer in Bezug auf eine bestimmte Polarisationsachse. Nach dem Durchtritt ist bekannt, dass das Photon die dieser Achse entsprechende Polarisationseigenschaft hat. Dabei ist zu berücksichtigen, dass wir ein einzelnes Photon nicht gezielt in einen vorgegebenen Polarisationszustand bringen können. Wie der Name Filter“ ” schon zum Ausdruck bringt, werden Photonen, welche die gewünsche Eigenschaft nicht annehmen, herausgefiltert. - Ob ein Photon den Filter passiert hat oder nicht, wissen wir im Allgemeinen nicht. Ein Detektor hinter einem Filter kann ein Photon registrieren, allerdings wird das Photon dabei im Allgemeinen entweder vernichtet oder aber in seinem Zustand drastisch verändert. Meist können wir mit einem solchen Photon keine weiteren kontrollierten Experimente mehr durchführen. Es hat aber ein Nachweis des Photons stattgefunden. - Eine Bestätigung findet statt, wenn wir (aufgrund der Theorie) wissen, in welchem Polarisationszustand sich ein Photon befindet – beispielsweise, weil es einen bestimmten Filter passiert hat – und wir nun eine Messung genau dieser Eigenschaft durchführen (also z.B. einen zweiten Filter mit exakt derselben Polarisationsrichtung hinter dem ersten aufbauen). Eine Bestätigung ändert unsere Information über einen Zustand nicht, insofern ist es eigentlich keine Messung. Allerdings könnte man auf einer Meta-Ebene sagen, dass eine Bestätigung eine Theorie testet (es könnte ja sein, dass Photonen ihre Polarisationsrichtung spontan verändern). Auf einer Meta-Ebene mag also ein Informationszuwachs stattfinden, im Rahmen einer Theorie führt eine Bestätigung nicht zu einem Informationszuwachs. - Die Wirkung eines Polarisationsstrahlteilers bzw. Polwürfels mit anschließenden Messungen“ 41 ” Detektoren in den beiden Strahlgängen ist das, was man landläufig als Messung“ ” bezeichnet. Doch liegt hier wirklich eine Messung in dem Sinne vor, wie wir es aus der klassischen Physik gewohnt sind? Erwin Schrödinger hat 1934 in einer Arbeit (eher scherzhaft) vorgeschlagen, den Begriff der Messung durch Prokrustie“ zu ersetzen [68]. Dabei bezog er sich auf ” den Riesen Procrustes in der griechischen Mythologie, der seine Gäste in seine Betten zwängte: Waren die Gäste zu groß, wurden ihnen Füße oder Beine abgehackt, waren sie zu klein, wurden sie auf dem Ambos gestreckt. Er schreibt in dieser Arbeit: Will man es wirklich noch eine Messung nennen, wenn (wie man oft hört) der Experimentator dem Objekt denjenigen Wert der zu messenden Größe, den er hernach als Ergebnis seiner Messung bezeichnet, erst aufzwingt? Wenn eine Bezeichnung dafür benötigt wird, möchte ich den Ausdruck Prokrustie vorschlagen! (obwohl ich weiß, daß der Experimentator sich den Wert nicht aussuchen kann; immerhin, er zwingt seine Opfer in eines seiner Betten, während es überhaupt in keines paßt). Diese Beschreibung trifft den Sachverhalt nach unseren Überlegungen zur Polarisation von Photonen recht gut. Ein Polwürfel definiert eine orthonormale Basis der Polarisationen; er zeichnet zwei orthogonale Richtungen aus. Jedes einfallende Photon wird in eine der beiden Richtungen abgelenkt und hat anschließend die entsprechende Polarisation. Ob es sie vorher schon hatte, erscheint nach dem oben Gesagten im Allgemeinen zweifelhaft. Der Polwürfel zwingt dem Photon eine der beiden Polarisationen auf. Allerdings betont Schrödinger zurecht, dass der Experimentator – im Gegensatz zu dem Riesen Procrustes – sich nicht aussuchen kann, welche Polarisation das Photon im Anschluss haben wird. 2.4.2 Ein Matrixmodell von Messung“ ” Während Polarisationsfilter einen Lichtstrahl auf eine bestimmte Polarisationsachse projizieren, trennt ein Polwürfel den Strahl räumlich in zwei Anteile. Mit Detektoren in den beiden Strahlgängen können wir messen“, welche Polarisation ein Photon hat, ” nachdem es von dem Polwürfel abgelenkt wurde. In diesem Abschnitt soll keine dynamische Beschreibung dieses Messprozesses vorgenommen werden, sondern es geht darum, wie wir die Information, die mit einem solchen Messprozess verbunden ist, in effektiver Weise kodieren können. Diese Information umfasst zweierlei: Erstens die Kenntnis der beiden orthogonalen Polarisationsrichtungen, in die der Strahl zerlegt wird, und zweitens Messwerte, die angeben, was bei einer Registrierung in einem der Detektoren eigentlich gemessen wurde (z.B., ob h oder v). Die beiden Polarisationsachsen können wir entweder durch zwei Vektoren (z.B. 42 Weshalb Quantenmechanik? - Die Polarisation von Photonen ~eh und ~ev ) oder durch die beiden zugehörigen Projektionsmatrizen (Ph und Pv ) beschreiben. Als Messwerte können wir zunächst zwei beliebige Zahlen λh und λv wählen. Wir werden später sehen, dass wir diese Messwerte mit einem Eigendrehimpuls“ ” (Spin) des Photons in Verbindung bringen und ihnen in diesem Zusammenhang auch bestimmte Werte zuweisen können. Im Augenblick sind die Messwerte noch willkürlich. Zur Kodierung dieser Information wählen wir eine Matrix M mit folgenden Eigenschaften: Ihre Diagonalelemente bezüglich der Polarisationsrichtungen geben die Messwerte an, und bezüglich verschiedener Polarisationsrichtungen seien ihre Matrixelemente null, z.B. ~eh · M~eh = λh , ~ev · M~ev = λv , ~eh · M~ev = ~ev · M~eh = 0 . (2.26) Diese Eigenschaften legen die Matrix fest. Bezüglich der Basis, die durch die Polarisationsrichtungen ausgezeichnet ist, hat die Matrix also Diagonalform: ! λh 0 M= , (2.27) 0 λv doch die Definition ist unabhängig von der gewählten Koordinatenbasis. 2.5 Zusammenfassung Wir können die bisherigen Ergebnisse folgendermaßen zusammenfassen. Diese Darstellung dient als Vorbereitung, Motivation und Veranschaulichung für den allgemeinen Formalismus der Quantenmechanik in Kapitel 5. Darstellung von Zuständen: Ein Polarisationszustand entspricht einer Geraden, also einem 1-dimensionalen Unterraum der Ebene. Man spricht manchmal auch von einem Strahl. Repräsentieren können wir einen Zustand durch einen (Einheits)Vektor. Äquivalent können wir auch einen Zustand durch eine Projektionsmatrix charakterisieren, die den Polarisationsfilter auf diesen Zustand mathematisch darstellt. Darstellung einer Observablen: Ein Polwürfel zeichnet zwei orthogonale Richtungen aus, die wir durch ein Orthonormalsystem von Vektoren beschreiben können. Ein Polwürfel ist durch die Angabe dieser Orthonormalbasis charakterisiert. Eine mathematische Repräsentation ist mit einer Matrix möglich, zu der die beiden ausgezeichneten Polarisationsrichtungen gerade die Eigenvektoren sind. Wahrscheinlichkeitsinterpretation für Übergänge: Die Wahrscheinlichkeit, dass ein im Polarisationszustand |αi präpariertes Photon durch einen Filter mit der Polarisationsachse β tritt und somit anschließend den Polarisationszustand |βi hat, ist cos2 (α − β) = (~eβ · ~eα )2 . Diese Wahrscheinlichkeit ist also gleich dem Quadrat des Skalarprodukts der beiden Einheitsvektoren zu den Polarisationsrichtungen. Diese Beziehung bezeichnet man als Born’sche Regel. Zusammenfassung 43 Reduktionspostulat: Nachdem ein Photon durch einen Polarisationsfilter oder einen Polwürfel getreten ist, hat sich sein Polarisationszustand verändert. Er wird nun durch einen Vektor der durch den Polwürfel ausgezeichneten Orthonormalbasis charakterisiert. 44 Weshalb Quantenmechanik? - Die Polarisation von Photonen Kapitel 3 Weshalb Quantenmechanik? II: Das Doppelspaltexperiment Als zweites Beispiel vertrauter Erscheinungen, die fast nahtlos in die Quantenmechanik übertragen werden können, betrachten wir Doppelspaltexperimente. Bei der Beugung von Licht sind hier insbesondere die Interferenzmuster auf einem Schirm hinter einem Doppelspalt bekannt. Wiederum werden wir Lichtintensitäten betrachten, die nur noch einzelnen Photonen entsprechen. Richard Feynman (1918–1988) hat einmal über das Doppelspaltexperiment gesagt: ... [it] has been designed to contain all of the mystery of quantum mechanics“ ” ([30], S.130). Damit wollte er zum Ausdruck bringen, dass es zwar viele Dinge in der Quantenmechanik gibt, die uns von unserer Alltagsvorstellung her erstaunlich erscheinen, dass sich letztendlich aber alle diese Dinge auf das seltsame Verhalten von Teilchen beim Doppelspalt zurückführen lassen. Auch wenn man diese Aussage sicherlich einschränken sollte, bleibt der Doppelspalt ein Paradigma für das Besondere an der Quantentheorie. Daher soll dieses Paradigma im Folgenden eingehender beschrieben werden. Was man wissen sollte Beim Doppelspaltexeriment tritt eine ebene Lichtwelle (fester Wellenlänge) zunächst durch einen Doppelspalt und trifft anschließend auf eine photografische Platte. Dort beobachtet man ein Interferenzmuster, bei dem sich die Orte für die Minima und Maxima der Intensität aus klassischen Überlegungen zur Überlagerung von Wellenzügen berechnen lassen. Setzt man die Intensität herab, beobachtet man wiederum nur das Auftreffen einzelner Energiequanten auf der Platte. Die Auftreffpunkte zeigen (für genügend viele Photonen) eine Interferenzverteilung. Jeder Versuch, den Spalt, durch den ein Photon tritt, zu messen (d.h. sogenannte which-path“-Information zu erlan” 45 46 Weshalb Quantenmechanik? - Der Doppelspalt gen), zerstört das Interferenzmuster und führt zu einer Verteilung, wie man sie für klassische Punktteilchen erwarten würde. Der mathematische Formalismus zur Beschreibung der Photonen wird von der klassischen Theorie unverändert übernommen: Man beschreibt ein Photon zunächst durch eine Welle, die durch den Spalt tritt und deren beiden Anteile hinter dem Doppelspalt interferieren können. Dieser Welle wird keine direkte physikalische Interpretation zugesprochen (man spricht manchmal von einer Wahrscheinlichkeitsamplitude), doch das Absolutquadrat dieser Welle wird als die Wahrscheinlichkeit für das Auftreffen eines Energiequants an einem bestimmten Ort der photografischen Platte interpretiert und ist experimentell messbar. DeBroglie postulierte auch Welleneigenschaften für Materie. Dabei übernahm er die Beziehungen zwischen den Teilcheneigenschaften (Energie und Impuls) und den Welleneigenschaften (Wellenlänge und Frequenz), die schon für Photonen bekannt waren: E = hν und p = h/λ. 3.1 Der Doppelspalt für Licht und Photonen Die Polarisation von Licht spielt beim Doppelspalt keine Rolle: Was auch immer für eine Polarisation vorliegt, der Doppelspalt hat keinen Einfluss auf die Polarisationsrichtung. Daher beschreiben wir der Einfachheit halber Licht mathematisch durch eine skalare“ Welle, die an jedem Punkt eine momentane Auslenkung“ ψ(~x, t) besitzt. ” ” Diese Auslenkung kann sowohl positive als auch negative Werte annehmen, allerdings ist die Intensität der Welle an einem Punkt ~x (zum Zeitpunkt t) wiederum durch I ∝ |ψ(~x, t)|2 gegeben. Wir beschreiben eine ebene Lichtwelle, die sich in z-Richtung ausbreitet, durch ψ(z, t) = A sin(k(z − ct)) , (3.1) der Wellenvektor (in diesem einfachen wobei A die Amplitude der Welle und k = 2π λ Fall die Wellenzahl) sind; c ist die Lichtgeschwindigkeit. Die Kombination (z − ct) im Argument der Sinus-Funktion bedeutet, dass sich Stellen konstanter Auslenkung (beispielsweise Nullstellen, Wellenberge oder Wellentäler) mit Lichtgeschwindigkeit entlang der z-Achse ausbreiten. Wir betrachten im Folgenden eine monochromatische Lichtquelle, die in ihrer Intensität variiert werden kann, und die das Licht im Wesentlichen als parallele Lichtstrahlen bzw. in Form einer ebenen Welle aussendet. Dieses Licht treffe auf eine Schablone bzw. eine Abschirmung mit zwei eng beieinanderliegenden Spalten. Durch die Spalte kann das Licht hindurchtreten. In einem gewissen Abstand hinter dem Doppelspalt befinde sich eine Detektorplatte: Dabei kann es sich um eine photographische Platte handeln, die mehr oder weniger eine Momentaufnahme des auffallenden Lichts Der Doppelspalt für Licht und Photonen 47 macht, oder aber besser noch um eine Szintillatorplatte, d.h. ein Material, das beim Auftreffen von Licht leuchtet. In jedem Fall können wir die Intensität des auftreffenden Lichts messen (Abb. 3.1). Für die Experimente mit einzelnen Photonen verwendet man typischerweise wieder CCD-Kameras. Hinter dem Doppelspalt zeigt sich auf der photographischen Platte ein Interferenzmuster, wie es in ähnlicher Form auch von Wasserwellen bekannt ist. Effekte dieser Art haben dazu geführt, dass wir Licht (klassisch) als eine Welle deuten. Das Experiment lässt sich ebenso mit Elektronen, Atomen oder kleineren Molekülen durchführen. Anton Zeilinger berichtete im Jahre 2003 von einer Variante dieses Exeriments mit Buckyballs (C60 -Moleküle) [57], und mittlerweile (2012) lassen sich Interferenzeffekte sogar für Strahlen aus Teilchen mit einer Massenzahl von rund 10.000 amu (atomic mass units, 1/12 der Masse von 1 2C) erreichen (siehe z.B. [42]). Qualitativ ist das Ergebnis immer dasselbe, allerdings betrachten wir zunächst Licht, weil hier der Übergang vom klassischen Verhalten zum quantenmechanischen Verhalten deutlicher wird. Insbesondere sind die zunächst auftretenden Interferenzeffekte für Licht bekannt und können auch ohne großen Aufwand berechnet werden. Intensität- ebene Welle Lichtquelle Kreiswellen $ $ % % Schirm mit Doppelspalt Detektorplatte Abbildung 3.1: Das Doppelspaltexperiment. Licht einer festen Wellenlänge trifft auf einen Schirm mit zwei Spalten. Hinter dem Schirm befindet sich eine Detektorplatte. Beide Spalte sind offen. Man erkennt auf der Platte die Interferenzstreifen in Form von oszillierenden Dichteschwankungen. Zur Erklärung der Interferenzen nimmt man an, dass das Licht zunächst als ebene Welle auf den Doppelspalt trifft. Hinter den beiden Spalten breiten sich jeweils kreisförmig zwei Lichtwellenanteile ψ1 (~x) und ψ2 (~x) mit der Wellenlänge des einfallenden Lichts aus. Diese beiden Anteile überlagern sich, sodass die Gesamtwelle hinter 48 Weshalb Quantenmechanik? - Der Doppelspalt dem Doppelspalt durch ψg (~x) = ψ1 (~x) + ψ2 (~x) (3.2) beschrieben wird. Da die Reaktion der Detektorplatte durch die Intensität der Welle gegeben ist, erhält man für das Muster auf der Platte eine Verteilung proportional zu folgender Größe: I(~x) = |ψ1 (~x) + ψ2 (~x)|2 = |ψ1 (~x)|2 + |ψ2 (~x)|2 + ψ1 (~x)∗ ψ2 (~x) + ψ2 (~x)∗ ψ1 (~x) . (3.3) (Viele Gleichungen schreibe ich allgemein für komplexwertige Amplituden, obwohl sie natürlich insbesondere auch für reelle Amplituden gelten.) An den Stellen, an denen jeweils Wellenberg auf Wellenberg oder Wellental auf Wellental treffen, ist ψ1 (~x) ≈ ψ2 (~x) und es kommt zu konstruktiver Interferenz, d.h., die letzten beiden Terme tragen positiv bei und führen zu einer hohen Intensität. Tatsächlich ist die Intensität an diesen Stellen sogar viermal (!) so hoch wie die Intensität, die ein einzelner Spalt erzeugen würde. An Stellen, wo Wellenberge auf Wellentäler treffen, kommt es zu destruktiver Interferenz. Dort gilt ψ1 (~x) ≈ −ψ2 (~x) und die letzten Terme heben die ersten beiden Terme nahezu auf. Die Intensität ist an diesen Stellen praktisch null, d.h., die Detektorplatte zeigt keine Reaktion. Die Orte auf der Platte, an denen die Intensität maximal wird bzw. an denen sie verschwindet, lassen sich aus rein geometrischen Überlegungen bestimmen (siehe Abb. 3.2). Dazu nehmen wir folgende Parameter an: λ sei die Wellenlänge des Lichts, d sei der Abstand zwischen den beiden Spalten und α sei der Winkel (vom Spalt aus betrachtet), unter dem die Intensität untersucht werden soll. Konstruktive Interferenz tritt unter einem Winkel auf, bei dem der Gangunterschied ∆x zwischen den beiden Wegstrecken von den Spalten zu einem Punkt der Platte gerade 0 oder ein ganzzahliges Vielfaches der Wellenlänge ist. Für die destruktive Interferenz lautet die Bedingung, dass sich die beiden optischen Weglängen gerade um eine halbe Wellenlänge bzw. ein Vielfaches der Wellenlänge plus eine halbe Wellenlänge unterscheiden müssen. Aus Abb. 3.2 wird offensichtlich, dass die Winkel αn , unter denen es zu konstruktiver Interferenz kommt, folgender Bedingung genügen müssen: n · λ = ∆x = d sin αn , (3.4) wohingegen für die Winkel αn0 , unter denen destruktive Interferenz auftritt, gilt: 1 λ = d sin αn0 . (3.5) n+ 2 Die entscheidende Erklärung für das Interferenzmuster beruht somit darauf, dass sich für eine Welle hinter dem Doppelspalt zwei Anteile überlagen und die Intensität das Quadrat dieser Summe ist: I = |ψ1 + ψ2 |2 . An Stellen, wo die beiden Der Doppelspalt für Licht und Photonen λ - A A d A A ∆x A αn 49 λ Wellenlänge d Spaltabstand ∆x Gangunterschied zwischen den beiden Strahlen αn Streuwinkel Abbildung 3.2: Geometrie zur Bestimmung der Winkel, unter denen konstruktive bzw. destruktive Interferenz auftritt. Amplituden gleich sind, kommt es zu konstruktiver Interferenz und die Intensität ist das Vierfache der Intensität eines Beitrags. An Stellen, wo die beiden Amplituden entgegengesetztes Vorzeichen haben, kommt es zu destruktiver Interferenz und die Intensität verschwindet. Im Durchschnitt ist die Intensität natürlich das Doppelte der Einzelbeiträge der beiden Spalte, aber an manchen Stellen verschwindet sie, dafür ist sie an anderen Stellen viermal so groß. 3.1.1 Schwächere Lichtquelle Soweit bisher geschildert, sind die Erscheinungen beim Doppelspaltexperiment vertraut, und auch die Interferenzmuster für die Intensität der Lichtwelle auf der photographischen Platte finden durch die Wellennatur eine natürliche und eingängige Erklärung. Nun verringern wir jedoch wieder die Intensität der Lichtquelle soweit, dass pro Zeiteinheit nur noch sehr wenige Photonen abgestrahlt werden. Wiederum sei die Detektorplatte so empfindlich, dass einzelne Photonen nachgewiesen werden können, bzw. dass die Energie eines Lichtquants, das auf die Platte trifft, zu einer Schwärzung führt. In unregelmäßigen Abständen entstehen auf der Platte wieder kleine dunkle Punkte (oder bei einer Szintillationsplatte kleine Lichtblitze). Zunächst beobachten wir nur wenige Punkte, die statistisch verteilt zu sein scheinen. Warten wir etwas länger, kommen immer mehr Punkte hinzu und wir stellen fest, dass an manchen Stellen die Dichte dieser Punkte höher ist als an anderen. Warten wir sehr lange, stellen wir eine sehr dichte Verteilung von Punkten bei den Interferenzmaxima fest, wohingegen nur sehr wenige bis gar keine Punkte bei den Interferenzminima liegen (vgl. Fig. 3.3). Wie schon bei den Polarisationsexperimenten zeigt eine genauere Betrachtung, dass die klassisch gemessenen Intensitäten der elektromagnetischen Wellen den relativen 50 Weshalb Quantenmechanik? - Der Doppelspalt • • • a) • • • • • • • • • • • • ••• • • ••• ••• •• • ••• •••••• • • •••••••• • • ••• • ••••••••• ••• • • • ••• • ••• • •• ••••• • • • • •• •••• •••• • •• • ••••••• ••• •••• • • • • • • • •• •• • • • • •• • •• • •• • • • ••• •••• ••• •• • • ••• •••••• ••• •• • ••• • • ••••• • ••• • ••• ••• •• • • • • ••••••• • •••••• • • ••••••••••••• •• • • • • • ••••••• • • • ••• •••• ••• • •• • • • • •••• • • •• •• • ••• • • • •• ••• ••• ••• • • • •••••• • • • • • • • • • • ••• • •• • • •••••• • • ••••••• • • • •• •••••• ••••• • • •• • •••• • • • • • • • • • • • • • • ••••• •• • • • • ••• •• • • • •• • • • • ••• •••• •••• • • •• •••••••• •• • ••• ••••••• •• ••• • •• • ••• •••• ••••• • •• •••• • ••• • • • •••• •••• Häufigkeit 6 20 • • b) •• • • • • ••• • • •• • ••• ••••••••••• • ••••• •••••••• •• ••••••• •••••• • •••••••••••• •••••• • •• • • •• •• •••• •••• ••• •• • •• • • •• • • c) d) 10 Abbildung 3.3: Punkte auf einer photographischen Platte hinter einem Doppelspalt nach (a) 1 Sekunde, (b) 5 Sekunden, (c) 1 Minute. (d) zeigt die Häufigkeiten der Punkte in Bild (c). Häufigkeiten von diskreten Energiequanten — den Photonen — entsprechen. Und wiederum führt eine Extrapolation in der Beschreibung einzelner Lichtquanten zu einer Interpretation der Intensität der Welle als einer Wahrscheinlichkeit, bei einer Messung ein solches Photon vorzufinden. Stellt man sich Licht als eine Ansammlung sehr vieler Teilchen im klassischen Sinne vor, lässt sich das Interferenzmuster kaum verstehen. Ein Strahl klassischer Teilchen würde auf der Detektorplatte eine breite, näherungsweise Gauß’sche Verteilung ergeben. In diesem Fall ergäbe sich die Gesamtverteilung als einfache Summe der beiden Verteilungen, die man erhält, wenn einer der Spalte abgedeckt wird und nur noch die Teilchen durch den anderen Spalt treten. Für die Gesamtintensität (die nun einfach der Gesamtanzahl der Teilchen entspricht) auf dem Schirm würde somit gelten: Ig (~x) = I1 (~x) + I2 (~x) . (3.6) Messungen“ 51 ” Dieses Gesetz bringt eine statistische Unabhängigkeit von zwei Ereignissen zum Ausdruck, nämlich dass ein Teilchen entweder durch den ersten oder durch den zweiten Spalt getreten ist. Bei Licht hingegen werden nicht die Intensitäten sondern die Amplituden der beiden Anteile addiert und anschließend zur Bestimmung der Intensität quadriert: Ig (~x) = I1 (~x) + I2 (~x) + 2ψ1 (~x)ψ2 (~x) . (3.7) Während die ersten beiden Terme auf der rechten Seite dieser Gleichung die jeweiligen Intensitäten wiedergeben, die das Licht hätte, falls einer der Spalte abgedeckt worden wäre, kommt bei einer Welle noch der letzte Term hinzu, der für das Interferenzmuster verantwortlich ist. Er ist das Produkt der beiden Amplituden und beschreibt somit eine Korrelation“ zwischen den beiden Anteilen der Welle, die durch die beiden Spal” te getreten sind. Eine solche Korrelation lässt sich leicht erklären, wenn irgendetwas gleichzeitig durch beide Spalte tritt. Sie ist aber schwer erklärbar, wenn man annimmt – wie es bei einzelnen Teilchen, die möglicherweise in großem zeitlichen Abstand auf die Platte treffen, naheliegen würde –, dass etwas nur durch einen der beiden Spalte treten kann. Wie schon bei den Polarisationsexperimenten gelangen wir zu folgender Interpretation: Im Photonenbild entspricht die Intensität I(~x) einer Dichte der Teilchen an einem Ort ~x. Wenn wir diese Beschreibung, die für sehr viele Teilchen ihre Gültigkeit hat, auf ein einzelnes Teilchen übertragen wollen, wird I(~x) zu einer Wahrscheinlichkeit (genauer, einer Wahrscheinlichkeitsdichte): I(~x) dV ist proportional zu der Wahrscheinlichkeit, dass ein Photon in einem Volumen dV um den Punkt ~x nachgewiesen wird. Damit sind wir für das (Absolut)Quadrat I = |ψ|2 der Welle ψ(~x) zu einer Wahrscheinlichkeitsinterpretation gelangt. Welche Bedeutung die Welle ψ(~x) selbst hat, bringt uns mitten in die Diskussion um das Problem der Interpretation der Quantenmechanik und soll zunächst noch nicht diskutiert werden. Man spricht manchmal (nicht unbedingt glücklich) von einer Wahrscheinlichkeitsamplitude“, was zunächst ” nichts weiter bedeutet, als dass das Quadrat dieser Amplitude eine Wahrscheinlichkeit darstellt. Das Besondere an der Behandlung der Photonen ist somit, dass nicht die Wahrscheinlichkeiten für zwei scheinbar unabhängige Ereignisse ( tritt durch Spalt 1“ ” oder tritt durch Spalt 2“) addiert werden, sondern die Wahrscheinlichkeitsamplituden ” dieser Ereignisse. Das Quadrat dieser Summe ergibt dann die Wahrscheinlichkeit. 3.2 Messungen“ ” Das Auftreffen eines Photons auf der Detektorplatte, das beispielsweise bei einer photographischen Platte zu einer Schwärzung führt, wird üblicherweise als Messung“ ” 52 Weshalb Quantenmechanik? - Der Doppelspalt gedeutet. Allerdings sollte man auch hier vorsichtig sein, denn ähnlich wie bei den Polarisationsfiltern könnte das Auftreffen eines Photons an einem bestimmten Punkt diese Eigenschaft ist an einem bestimmten Ort“ überhaupt erst erzeugen bzw. präparieren. ” Mit dieser Problematik im Hinterkopf werde ich mich trotzdem im Folgenden dem üblichen Sprachgebrauch anschließen und von einer Messung sprechen. Die photographische Platte misst also die Intensitätsverteilung bzw. die Wahrscheinlichkeit, mit der ein Photon an einem bestimmten Ort seine Energie auf die Platte oder einen Detektor übertägt. Der Übergang von einer Intensität zu einer relativen Häufigkeit bzw. Wahrscheinlichkeit erfordert allerdings eine Normierung, die in diesem Fall jedoch von Vorteil ist: Eine Intensität ist, wie wir schon gesehen haben, ein Energiedichtestrom, und hängt nicht nur von dem Quadrat der Amplitude ab, sondern auch von der Wellenlänge des Lichts sowie möglicherweise anderen Eigenschaften. Eine Wahrscheinlichkeit bzw. eine relative Häufigkeit ist aber eine dimensionslose Zahl, für die außerdem noch gelten soll, dass die Summe über alle möglichen Ereignisse eins ist. Für die Interpretation von |ψ(~x)|2 als Wahrscheinlichkeit müssen wir also noch fordern: Z |ψ(~x)|2 dV = 1 . (3.8) V In diesem Abschnitt werde ich noch etwas lax mit dem Integrationsvolumen, der Existenz gewisser Integrale oder auch der Dimension des zu integrierenden Volumens umgehen. Es kann sich um ein zweidimensionales Integral über eine Fläche oder auch um ein dreidimensionales Integral über ein Volumen handeln, in manchen Fällen sogar um ein eindimensionales Integral über ein Intervall. Das Integrationsvolumen werde ich gelegentlich weglassen, bzw. durch den gesamten Raum ersetzen, wobei immer impliziert wird, dass die Wellen genügend weit draußen“ nahezu verschwinden. Ich werde auch ” keine explizite Zeitabhängigkeit mehr betonen, da ich zunächst statische Situationen betrachte (das Licht strahlt mit konstanter Intensität auf den Doppelspalt). Da I(~x) = |ψ(~x)|2 nun einer Wahrscheinlichkeitsdichte entspricht, können wir zunächst gewisse Kenngrößen dieser Wahrscheinlichkeitsdichte messen. Beispielsweise ist der Erwartungswert für die Messung des Orts eines Teilchens durch Z Z 2 h~xi = ~x I(~x) dV = ψ(~x)∗ ~xψ(~x) dV (3.9) V V gegeben. Entsprechend ist die Varianz für diese Ortsmessung: Z 2 2 (∆x) = h(~x − h~xi) i = ψ(~x)∗ (~x − h~xi)2 ψ(~x) dV . (3.10) V Von besonderem Interesse ist auch die Wahrscheinlichkeit, mit der ein Photon in einem kleinen Volumenbereich ∆V gemessen wird: Z Z 2 w(∆V ) = |ψ(~x)| dV = ψ(~x)∗ χ∆V (~x) ψ(~x) dV (3.11) ∆V V Messungen“ ” mit 53 ( χ∆V (~x) = 1 für ~x ∈ ∆V 0 sonst . (3.12) Wir erhalten also die Kenngrößen der räumlichen Verteilung durch die Bildung der entsprechenden Erwartungswerte. Allgemein ist Z Z Z 2 f (~x) I(~x) dV = f (~x) |ψ(~x)| dV = ψ ∗ (~x) f (~x)ψ(~x) dV . (3.13) hf (~x)i = V V V Wenn es nur die räumliche Intensitätsverteilung gäbe, könnten wir aus diesen Erwartungswerten räumlicher Funktionen sämtliche Informationen über die Intensitätsverteilung zurückgewinnen und diese sogar aus den Erwartungswerten rekonstruieren. Es erhebt sich somit die Frage, ob in der Welle ψ(~x) mehr Information steckt, als in der Intensitätsdichte |ψ(~x)|2 . An dieser Stelle wird wichtig, dass die Welle ψ(~x) komplex sein kann, bzw. dass die reellen Wellen nicht nur eine Amplitude sondern auch eine (möglicherweise ortsabhängige) Phase haben, die sich in der Intensitätsmessung nicht zeigt. In der komplexen Schreibweise gewinnen wir aus Erwartungswerten der Art (3.13) keine Information über die Phase einer Funktion ψ(~x) = eiα(~x) |ψ(~x)|. Hat diese Phase eine physikalische Bedeutung, oder ist lediglich die Intensitätsdichte relevant? Wir wissen, dass die klassische Welle eine bestimmte Wellenlänge hat, beschrieben durch einen Wellenzahlvektor ~k. Auch wenn wir im Augenblick noch nicht wissen, was dieser Wellenzahlvektor für ein einzelnes Photon bedeutet, können wir diese Größe doch aus der Wellenfunktion ψ(~x) zurückgewinnen. Betrachten wir dazu nochmals eine ebene Welle ~ ψ(~x) = A ei(k·~x−ωt) . (3.14) Eine Intensitätsmessung dieser Welle liefert I = |A|2 = const, also eine Intensitätsverteilung, aus der sich keine Information über ~k gewinnen lässt. Wie wir gesehen haben, können wir aber von einer solchen Welle die Wellenlänge bestimmen, beispielsweise indem wir sie durch einen Doppelspalt treten lassen und dann das Interferenzmuster ausmessen. Der Doppelspalt wirkt nun wie eine erste Messung (vergleichbar mit einem Filter), der die ebene Welle zerstört (hinter dem Doppelspalt haben wir keine ebene Welle mehr sondern zwei sich überlagernde Zylinderwellen), der wir aber nun entnehmen können, welche Wellenlänge das Licht hat. Es gibt also Messanordnungen, die es uns ermöglichen, den Wellenzahlvektor einer Lichtwelle zu bestimmen. Wie erhalten wir nun den Wellenzahlvektor von einer ebenen Welle, wie sie durch Gl. 3.14 beschrieben wird? Formal können wir von der Welle ψ(x) die Fourier-Transformierte bilden: Z 1 ~ ψ(~x)e−ik·~x dV (3.15) ψ̃(k) = d/2 (2π) V 54 Weshalb Quantenmechanik? - Der Doppelspalt (d ist die Dimension des Volumens, über das integriert wird, also d = 1 für ein Intervall, d = 2 für eine Fläche etc.) Auch zu dieser Fourier-Transformierten gehört eine Intensitätsverteilung I(~k) = |ψ̃(~k)|2 , (3.16) die aufgrund der Parseval’schen Formel für Fouriertransformationen normiert ist: Z Z Z Z 3 ∗ 3 ∗ 3 ~ ~ ~ I(k) d k = ψ̃(k) ψ̃(k) d k = ψ(~x) ψ(~x) d x = I(~x) dV = 1 . (3.17) Wir erhalten somit wieder eine Wahrscheinlichkeitsverteilung, und die Erwartungswerte bezüglich dieser Verteilung liefern uns Information zur Verteilung der Wellenzahlvektoren. Insbesondere gilt Z Z 3 ~ ~ ~ ~ hki = kI(k) d k = ψ(~x)∗ (−i∇)ψ(~ x) d3 x . (3.18) Während wir daher aus der Intensitätsverteilung I(~x) keine Information über den Wellenvektor erhalten, können wir diese aus der Wellenfunktion ψ(~x) gewinnen. Damit haben wir eine verallgemeinerte Klasse von Erwartungswerten definiert: Z ~ hF (~x, ∂~x )i = ψ(~x)∗ F (~x, ∂~~x )ψ(~x) d3 x . (3.19) Wir werden sehen, dass es sich bei F (~x, ∂~ ) um lineare Operatoren auf dem Raum der Wellenfunktionen handelt. Diese linearen Operatoren bringen wir später mit beobachtbaren Größen in Verbindung. An dieser Stelle haben wir gesehen, dass wir mit solchen Operatoren Erwartungswerte für die räumliche Verteilung der Photonen wie auch für die Verteilung der Wellenzahlvektoren gewinnen können. 3.3 Materiewellen Im Jahre 1924 veröffentliche der französische Physiker Louis deBroglie seine Theorie der Materiewellen. Seine Grundannahme bestand darin, dass nicht nur Photonen neben ihren Welleneigenschaften auch Teilcheneigenschaften haben, sondern dass auch andere materielle Objekte, beispielsweise Elektronen, neben ihren Teilcheneigenschaften noch Welleneigenschaften zugeschrieben werden können. Im Jahre 1927 beobachteten Clinton Davisson (1881–1958) und Lester Halbert Germer (1896–1971) zum ersten Mal die Welleneigenschaften von Elektronen bei Beugungsexperimenten an Kristallgittern. DeBroglie postulierte für die charakteristischen Größen der Wellen (Wellenlänge und Frequenz) von Elektronen dieselben Beziehungen zu den typischen Teilcheneigenschaften — Energie und Impuls — wie bei Photonen. Das bedeutet zum einen eine Zusammenfassung und Ausblick 55 Beziehung zwischen der Energie E des Teilchens und der Frequenz ν (bzw. der Winkelfrequenz ω = 2πν) der zugehörigen Welle von der Form E = hν = ~ω (3.20) (hierbei wurde mit ~ = h/2π das reduzierte Planck’sche Wirkungsquantum eingeführt), zum anderen eine Beziehung zwischen dem Impuls p des Teilchens und der Wellenlänge λ der zugehörigen Welle (bzw. dem Wellenvektor ~k, wobei |~k| = 2π/λ und die Richtung von ~k der Ausbreitungsrichtung der Welle entspricht): p~ = ~~k bzw. |~p| = h . λ (3.21) Auch diese Beziehung gilt bei Licht, wenn wir berücksichtigen, dass für Licht zwischen der Energie und dem Impuls die Beziehung E = pc und zwischen Wellenlänge und Frequenz die Beziehung ν = c/λ (3.22) bestehen. Da für Elektronen die Beziehung zwischen der Energie E und dem Impuls p nicht mehr durch E = pc gegeben ist, werden die Materiewellen von Elektronen auch nicht mehr durch eine Wellengleichung der Form (2.1) beschrieben. Nicht-relativistisch ist die klassische Beziehung bei Teilchen zwischen dem Impuls und der Energie durch E= 1 2 1 X 2 p~ = p , 2m 2m i i (3.23) gegeben. Wenn wir für eine Welle mit Wellenlänge λ und Frequenz ν, allgemein 2πi x exp (2πiνt) (3.24) ψ(~x, t) ' exp λ die deBroglie’schen Beziehungen einsetzen, i i ψ(~x, t) ' exp p~ · ~x exp Et , ~ ~ (3.25) und nun die obige Beziehung zwischen Energie und Impuls fordern, erhalten wir die Bedingung: ∂ ~2 X ∂ 2 −i~ ψ(~x, t) = − ψ(~x, t) . (3.26) ∂t 2m i ∂x2i Diese Gleichung bezeichnet man als (freie) Schrödinger-Gleichung. Auch wenn es so aussieht, als ob wir die Schrödinger-Gleichung abgeleitet haben, sollte man sich darüber im Klaren sein, dass wir die deBroglie’schen Beziehungen zwischen den Teilchen- und Welleneigenschaften ebenso wie die Gültigkeit der klassischen Beziehung zwischen Energie und Impuls postuliert haben. 56 3.4 Weshalb Quantenmechanik? - Der Doppelspalt Zusammenfassung und Ausblick Aufgrund der Überlegungen zu den Polarisationsexperimenten und zum Doppelspalt können wir Folgendes festhalten: Wir beschreiben den räumlichen Zustand eines Photons durch ein Feld, dessen Betragsquadrat die Wahrscheinlichkeit(sdichte) angibt, bei einer Messung das Photon an dem betreffenden Ort zu finden. Entsprechend beschreiben wir den Polarisati” ons“-zustand eines Photons durch einen Amplitudenvektor. Sowohl bei dem Feld als auch bei dem Amplitudenvektor der Polarisation handelt es sich um Vektoren, also mathematische Objekte, die man addieren und mit Zahlen multiplizieren kann. Die Addition der Felder haben wir explizit beim Doppelspalt benutzt, um die Gesamtwelle als Summe von zwei Beiträgen (zu Spalt 1 und Spalt 2) schreiben zu können. Bei den Amplitudenvektoren haben wir mehrfach benutzt, dass sich diese in Komponenten zerlegen lassen (also als Summe von zwei orthogonalen Komponenten schreiben lassen). Vektoren können aber auch negative Komponenten haben, und erst diese Eigenschaft führte zu der Möglichkeit von Interferenzmustern in den Intensitäten. Zur Beschreibung des räumlichen Zustands von Photonen haben wir Felder benutzt. Felder bilden einen Vektorraum, allerdings ist dieser Vektorraum unendlich dimensional. Wir werden zwar an die Felder gewissen Bedingungen stellen müssen, damit sie sinnvollen Zuständen entsprechen, trotzdem bleibt das Problem, dass wir es mit einem unendlich dimensionalen Vektorraum zu tun haben. Dieser Aspekt der Quantenmechanik ist der Grund vieler technischer (mathematischer) Probleme, die zwar teilweise in diesem Skript angesprochen werden, die aber nicht immer im Detail behandelt werden, da ihre Lösung nur selten zu einem besseren Verständnis der Quantenmechanik beiträgt. Die Wirkung von Messungen haben wir durch Matrizen (bei den Polarisationen) bzw. (lineare) Operatoren bei Orts- und Wellenzahlvektormessungen beschreiben können. Im Spezialfall der Polarisationsfilter handelte es sich dabei um sogenannte Projektionsmatrizen: symmetrische Matrizen mit der Eigenschaft, dass ihre Quadrate wieder die Matrix selbst ergeben (also F 2 = F ). Anschaulich bedeutet dies, dass zwei unmittelbar hintereinander geschaltete Filter mit der gleichen Polarisationsrichtung dieselbe Wirkung auf den Polarisationszustand eines Photons haben, wie ein einzelner Filter. Das bisher Gesagte lässt sich verallgemeinern: Quantenmechanische Zustände lassen sich durch Vektoren in geeigneten Vektorräumen darstellen, und es lassen sich Summen von solchen Zuständen bilden, die wiederum Zustände darstellen. Messungen bzw. Beobachtungen an einem System werden durch symmetrische Matrizen repräsentiert, wobei die Projektoren besondere Messungen darstellen, die man als verallgemeinerte Filter auffassen kann: Ein Filter ist dabei ein Messgerät, das nur sol- Zusammenfassung und Ausblick 57 che quantenmechanische Systeme passieren“ lässt, die bestimmte Eigenschaften ha” ben. Streng genommen sollte man sagen, dass die quantenmechanischen Systeme, die den Filter passiert haben, diese bestimmten Eigenschaften besitzen. Ob sie die Eigenschaft schon vorher hatten, bleibt offen. In diesem Sinne ist ein Filter ein System zur Präparierung quantenmechanischer Systeme mit bestimmten Eigenschaften. Wir haben bisher sowohl die Amplituden der Photonen, welche die Polarisation beschreiben, als auch die Felder als reell angenommen. Das lässt sich in vielen Fällen zwar erreichen, für eine vollständige Beschreibung der Zustände eines quantenmechanischen Systems müssen wir aber auch komplexe Werte zulassen. Beispielsweise lassen sich mit reellen Amplituden nur planar polarisierte Photonen beschreiben. Wir wissen aber, dass es auch zirkulare Polarisationen gibt. Wollen wir neben den planar polarisierten Photonen auch zirkular polarisierte Photonen einbeziehen, sind komplexe Amplituden kaum zu vermeiden. Diese komplexen Amplituden beinhalten dabei nicht nur die Information über die Auslenkungsrichtung, sondern auch die Information über die Phase. Wenn beispielsweise die Auslenkung in y-Richtung im Vergleich zur Auslenkung in x-Richtung um eine viertel Wellenlänge verschoben ist, erhalten wir eine zirkular polarisierte Welle. Diese Verschiebung um eine viertel Wellenlänge (die sich beispielsweise mit λ/4-Plättchen erreichen lässt), wird durch die Multiplikation der entsprechenden Polarisation mit i“ beschrieben. Wir werden später noch darauf ” eingehen. 58 Weshalb Quantenmechanik? - Der Doppelspalt Kapitel 4 Die mathematischen Grundlagen In diesem Kapitel sollen die mathematischen Grundlagen für den Formalismus der Quantenmechanik gelegt werden. Wie schon erwähnt, haben wir es dabei mit möglicherweise unendlich dimensionalen Vektorräumen und den linearen Abbildungen auf diesen Räumen zu tun. Viele der technischen Schwierigkeiten im Zusammenhang mit dem mathematischen Formalismus der Quantenmechanik hängen mit dieser Unendlichkeit zusammen. Lineare Abbildungen (sogenannte Operatoren) auf solchen Räumen können unbeschränkt sein, d.h., endliche Vektoren (Vektoren mit einem endlichen Betrag) werden auf unendliche Vektoren abgebildet. Es kann auch passieren, dass das Spektrum dieser Operatoren (bei endlichen Matrizen sind das die Eigenwerte) kontinuierlich ist. In diesem Fall besitzen die Operatoren streng genommen keine Eigenwerte und auch keine Eigenzustände. Wir werden gelegentlich auf die besonderen Probleme im Zusammenhang mit unendlich dimensionalen Vektorräumen hinweisen, aber der Schwerpunkt soll nicht auf diesen technischen Details liegen. Sie tragen nur selten zu einem besseren Verständnis der Quantenmechanik bei und spielen in erster Linie bei expliziten Berechnungen eine Rolle. Der Schwerpunkt dieses Quantenmechanik Kurs’ soll auf den Aspekten liegen, die zu einem besseren Verständnis dieser Theorie führen. Was man wissen sollte Konzept des komplexen Vektorraums; hermitesches Skalarprodukt; Hilberträume; die Norm von Vektoren; dualer Vektorraum; lineare Abbildungen, Operatoren und Matrizen; einige Besonderheiten für unendlichdimensionale Hilberträume (mögliche Unbeschränktheit von Operatoren und Abgeschlossenheit des Hilbertraums). Eigenvektoren und Eigenwerte. Speziell selbstadjungierte Operatoren, Projektionsmatrizen und unitäre Operatoren. Der Funktionenraum der quadratintegrablen Funktionen; die linearen Operatoren Multiplikation mit x“ und Ableitung nach x“ und ihre Kommu” ” 59 60 Mathematische Grundlagen tatorbeziehungen. Die Bra-Ket-Notation für Vektoren und Matrizen bzw. Operatoren. 4.1 Vektorräume und physikalische Zustände Wie wir sehen werden (und im Zusammenhang mit den einleitenden Bemerkungen zum Doppelspalt und zu den Polarisationsexperimenten schon andeutungsweise gesehen haben), lässt sich der Zustand eines quantenmechanischen Systems durch bestimmte Vektoren bzw. Klassen von Vektoren in einem Vektorraum ausdrücken. Auf diesem Vektorraum muss ein Skalarprodukt definiert sein, wodurch der Vektorraum (unter bestimmten Bedingungen) zu einem Hilbertraum wird. Wir behandeln zunächst das Konzept des Hilbertraums, führen eine in der Quantenmechanik häufig verwendete Notation ein (die Bra-Ket-Notation von Dirac) und formulieren gleich das erste Axiom der Quantenmechanik zur Darstellung von Zuständen. 4.1.1 Hilberträume Etwas lax ausgedrückt ist ein Hilbertraum ein komplexer Vektorraum mit einem Skalarprodukt. Für manche Autoren sind Hilberträume immer abzählbar unendlich dimensional. In diesem Fall kann man aber zeigen, dass alle Hilberträume (als komplexe Vektorräume mit hermiteschem Skalarprodukt) isomorph sind, d.h., es gibt eigentlich nur einen Hilbertraum und die Verwendung des Plurals im Abschnittstitel ist unsinnig. Wir werden auch endlich dimensionale komplexe Vektorräume mit einem (hermiteschen) Skalarprodukt als Hilbertraum bezeichnen. In diesem Fall sind zwei Vektorräume nur dann isomorph, wenn sie dieselbe Dimension haben. Definition: Ein komplexer Vektorraum ist eine Menge H, auf der zwei Verknüpfungen + : H × H −→ H (4.1) · : C × H −→ H (4.2) definiert sind, sodass folgenden Bedingungen gelten: ∀x, y ∈ H gilt ∀x, y, z ∈ H gilt ∃0 ∈ H sodass ∀x ∈ H ∀x ∈ H ∃(−x) ∈ H sodass x+y =y+x (Kommutativität) (4.3) x + (y + z) = (x + y) + z (Assoziativität) (4.4) x+0=0+x=x (4.5) (Nullvektor) x + (−x) = (−x) + x = 0 (4.6) (Existenz eines Inversen) ∀x ∈ H und ∀α, β ∈ C gilt α · (β · x) = (αβ) · x (4.7) (Assoziativität der Multiplikation) ∀x, y ∈ H und ∀α ∈ C gilt α · (x + y) = α · x + α · y (Distributivgesetz) (4.8) Vektorräume und physikalische Zustände 61 Bezüglich der Addition von Vektoren handelt es sich somit um eine abelsche (d.h. kommutative) Gruppe. Den Punkt für die Multiplikation mit den komplexen Zahlen werden wir im Folgenden weglassen und statt α · x einfach αx schreiben. Definition: Ein Satz von Vektoren {xi }i=1,...,n , (xi ∈ H, xi 6= 0) heißt linear unabhängig, wenn aus der Beziehung n X αi xi = 0 folgt : αi = 0 ∀i . (4.9) i=1 Die maximale Zahl n, für die linear unabhängige Vektoren existieren, bezeichnet man als die Dimension des Vektorraums. Für einen Vektorraum der Dimension d bilden d linear unabhängige Vektoren eine Basis. Jeder Vektor lässt sich als Linearkombination dieser Basis schreiben. Definition: Ein (nicht-entartetes, positiv-definites) hermitesches Skalarprodukt (manchmal spricht man auch von einem unitären Skalarprodukt) ist eine Abbildung (·, ·) : H × H −→ C , (4.10) (x, y) = (y, x)∗ (4.11) (x, αy + βz) = α(x, y) + β(x, z) (4.12) (x, x) ≥ 0 , und (x, x) = 0 ⇔ x = 0 . (4.13) für die gilt: ∀x, y ∈ H ∀x, y, z ∈ H und ∀α, β ∈ C ∀x ∈ H Das Skalarprodukt ist also linear im zweiten Argument. Für das erste Argument folgt aus der ersten Bedingung: (αx + βy, z) = α∗ (x, z) + β ∗ (y, z) . (4.14) Später werden wir eine besondere Notation für Vektoren und das Skalarprodukt einführen (die sogenannte Bra-Ket-Notation von Dirac), die sich gerade für die Quantentheorie als sehr hilfreich erwiesen hat. Das Skalarprodukt definiert eine Norm auf dem Vektorraum: kxk2 = (x, x) . (4.15) Mit dieser Norm können wir – die Länge bzw. den Betrag eines Vektors bestimmen, – definieren, wann zwei Vektoren orthogonal sind (nämlich wenn (x, y) = 0 für x, y 6= 0). Damit können wir auch eine Orthonormalbasis {ei } definieren, die den Bedingungen (ei , ej ) = δij (Kronecker-Delta) genügt. 62 Mathematische Grundlagen – den Abstand von zwei Vektoren angeben: Dist(x, y) = kx − yk, – auf dem Vektorraum eine Topologie definieren (also sagen, was offene Teilmengen sind). Wir können nun die Definition eines Hilbertraums angeben: Definition: Ein Hilbertraum ist ein Vektorraum mit einem (positiv definiten, nicht entarteten) Skalarprodukt, der bezüglich der induzierten Topologie vollständig ist. ( Vollständig“ heisst, dass der Grenzwert jeder konvergenten Cauchy-Folge von Vek” toren auch in diesem Raum liegt.) Ein Hilbertraum kann also unendlich dimensional sein und die Forderung der Vollständigkeit wäre für endlich dimensionale Hilberträume über den reellen oder komplexen Zahlen nicht notwendig, da der Körper bereits vollständig ist. Um der Unendlichkeit zumindest eine gewisse Grenze zu setzen, definieren wir den separablen Hilbertraum: Definition: Ein separabler Hilbertraum ist ein Hilbertraum mit einer abzählbaren Basis. In der Quantenmechanik interessieren uns nur endlich dimensionale Hilberträume (bei denen wir uns um die Vollständigkeit oder die Separabilität nicht zu kümmern brauchen) oder separable Hilberträume. Ein separabler Hilbertraum hat die Eigenschaft, dass es Basen gibt, bei denen man die Basisvektoren durchnummerieren kann (e1 , e2 , ...). Bezüglich einer solchen Basis kann man oftmals wie mit gewöhnlichen Vektoren oder Matrizen rechnen. Beispiele – Die Menge aller n-Tupel komplexer Zahlen {(x1 , ..., xn )|xi ∈ C} bildet einen n-dimensionalen komplexen Vektorraum. Die Addition von Vektoren und die Multiplikation mit einer komplexen Zahl sind komponentenweise definiert: (x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn ) α(x1 , ..., xn ) = (αx1 , ..., αxn ) . (4.16) (4.17) Der Nullvektor ist (0, 0, ..., 0), und für das Skalarprodukt gilt: (x, y) = n X x∗i yi . (4.18) i=1 Die n Vektoren ei = (0, ..., 1, ..., 0) (1 an i-ter Stelle) bilden eine Orthonormalbasis. (4.19) Vektorräume und physikalische Zustände 63 – Die Menge aller abzählbar unendlichen, quadratsummierbaren Folgen von komplexen Zahlen {(x1 , x2 , x3 , ...)|xi ∈ C}, für die also gilt ∞ X |xi |2 < ∞ , (4.20) i=1 bildet ebenfalls einen Hilbertraum mit dem Skalarprodukt: (x, y) = ∞ X x∗i yi . (4.21) i=1 Die Vektoren ei = (0, ..., 0, 1, 0, ...) (1 an i-ter Stelle) (4.22) bilden wieder eine Orthonormalbasis. – Ebenfalls einen wichtigen Hilbertraum bildet die Menge der quadratintegrablen Funktionen L2 (R, dx) (kurz L2 ) über den reellen Zahlen. Eine Funktion f : R → C heißt dabei quadratintegrabel, wenn Z +∞ |f (x)|2 dx < ∞ . (4.23) −∞ Das Skalarprodukt ist definiert als: Z (f, g) = +∞ f (x)∗ g(x) dx . (4.24) −∞ Es gibt sehr viele Sätze von Basisfunktionen, die den Raum der quadratintegrablen Funktionen aufspannen, und ein oder zwei davon werden wir bei konkreten Beispielen kennenlernen. Eine Basis für die quadratintegrablen Funktionen wären z.B. die Funktionen ek (x) = xk e−x 2 (k = 0, 1, 2, ...) , (4.25) allerdings handelt es sich hierbei nicht um eine orthogonale Basis oder gar um normierte Basisfunktionen. Diese drei Typen von Hilberträumen spielen in der Physik eine wichtige Rolle. Man könnte zunächst meinen, der Nullvektor im Raum der quadratintegrablen Funktionen sei die Null-Funktion, die also jedem x ∈ R den Wert 0 zuordnet. Das ist nicht ganz richtig, denn für jede Funktion, die nur an endlich vielen Stellen von 0 verschieden ist, gilt, dass das Integral über ihr Absolutquadrat verschwindet. Streng genommen sind daher nicht Funktionen die Elemente dieses Hilbertraums, sondern Äquivalenzklassen von Funktionen. Auf diese Feinheiten werden wir aber im Folgenden nicht weiter eingehen. Anmerkungen: 64 Mathematische Grundlagen 1. Achtung (!) — ein Wort zur Notation: In der Physik unterscheidet man in der Schreibweise oft nicht zwischen einer Funktion f und dem Wert dieser Funktion an einer Stelle x, also f (x). Ich werde versuchen, diese Unterscheidung zumindest in den mathematischen Teilen beizubehalten. In den physikalischen Anwendungen wird man oft von einer Funktion f (x) oder einem Feld ϕ(x) etc. sprechen. Wichtig ist weniger die konsequente Beibehaltung der Notation, als dass man sich des Unterschieds bewusst ist: Eine Funktion ist eine Zuordnung, die jedem Wert einer Urbildmenge einen Bildwert zuordnet. Sie ist im Allgemeinen ein Element eines hochdimensionalen (meist unendlich dimensionalen) Vektorraums. Ein Funktionswert ist der Wert dieser Funktion an einem ganz bestimmten Urbildpunkt (also meist eine reelle oder komplexe Zahl). 2. Jeder Vektorraum besitzt auch einen Dualraum, das ist der Raum der linearen Abbildungen von dem Vektorraum in den Körper des Vektorraums, in unserem Fall also in die komplexen (oder manchmal auch reellen) Zahlen. Für endlich dimensionale Vektorräume kann man leicht zeigen, dass der Dualraum dieselbe Dimension wie der Vektorraum selbst hat, und daher isomorph zu dem ursprünglichen Vektorraum ist. Dies gilt für unendliche Vektorräume nicht mehr. Der Dualraum des L2 beispielsweise ist wesentlich größer als der L2 selbst. Wie auch im endlichen Fall definiert das Skalarprodukt eine Abbildung vom Vektorraum in den Dualraum, d.h., wir erhalten zu jedem Element des Vektorraums ein Element aus dem Dualraum. Dem Element x des Vektorraums wird die Abbildung (x, ·) als Element des Dualraums zugeordnet. 3. Ein orthogonaler Satz von normierten Basisvektoren {ei } — also eine Orthonormalbasis — definiert einen besonderen Satz von Elementen des Dualraums: {(ei , ·)}. Diese Abbildungen ordnen einem Element y des Vektorraums seine Komponenten zu: yi = (ei , y). Handelt es sich bei der Basis nicht um eine Orthonormalbasis, können wir zwar einen Satz dualer Abbildungen {(fj , ·)} über die Bedingungen (fj , ei ) = δij definieren, welche ein Element y auf seine Komponenten yi abbilden, aber bei diesen dualen Elementen handelt es sich nicht um die Abbildungen {(ei , ·)}. 4.1.2 Die Bra-Ket-Notation In seinem berühmten Lehrbuch The Principles of Quantum Mechanics“ [22] von 1930 ” führt Paul Dirac eine Notation für Vektoren (duale Vektoren, Skalarprodukt, Operatoren etc.) ein, die sich in der Quantenmechanik als sehr sinnvoll und hilfreich erwiesen hat, und die daher in den meisten Büchern zur Quantenmechanik verwendet wird. Vektorräume und physikalische Zustände 65 In dieser Notation wird ein Vektor des Hilbertraums durch einen ket-Vektor |·i gekennzeichnet, und ein dualer Vektor durch einen bra-Vektor h·|. Die Bezeichnungen bra“ und ket“ stammen von Dirac und sind ein Wortspiel mit dem englischen Aus” ” druck bracket“ für Klammer. Das Symbol, welches den Punkt ·“ in einem bra oder ” ” ket-Vektor ersetzt, drückt aus, um welchen Vektor es sich handelt. Statt also zu schreiben x ∈ H, schreiben wir in Zukunft |xi ∈ H. Und für den dualen Vektor (x, ·) schreiben wir in Zukunft hx|. Das Skalarprodukt von zwei Vektoren — bisher durch (x, y) ausgedrückt — schreiben wir nun als hx|yi. Für eine allgemeine Linearkombination zweier Vektoren |xi und |yi schreibt man α|xi + β|yi. Die Relationen, durch welche wir das hermitesche Skalarprodukt definiert haben, werden in der Bra-Ket-Notation folgendermaßen geschrieben: ∀|xi, |yi ∈ H ∀|xi, |yi, |zi ∈ H und ∀α, β ∈ C ∀|xi ∈ H hx|yi = hy|xi∗ (4.26) hx| α|yi + β|zi = αhx|yi + βhx|zi (4.27) hx|xi ≥ 0 , und hx|xi = 0 ⇒ |xi = 0 .(4.28) (Für den Nullvektor schreibt man meist einfach 0 und nicht |0i. Dieser letztere Ausdruck |0i wird oftmals für den Zustand minimaler Energie in der Quantenmechanik verwendet, den sogenannten Grundzustand — in der Quantenfeldtheorie spricht man auch vom Vakuumzustand — der durch einen nicht-verschwindenden normierten Vektor beschrieben wird.) Seien beispielsweise der (unendliche) Folgen-Vektor |xi = (x1 , x2 , x3 , ...) (4.29) und ein Basisvektor |ei i = (0, ..., 0, 1, 0, ...) (1 an i-ter Stelle) (4.30) gegeben, dann erhalten wir für die i-te Komponente des Vektors: hei |xi = xi . (4.31) Die Argumente, durch die man einen Vektor in der Quantenmechanik kennzeichnet, und die man in den bra- oder ket-Vektor schreibt, sind meist die Eigenschaften (oft ausgedrückt durch Quantenzahlen), von denen bekannt ist, dass sie dem Quantensystem (z.B. dem Teilchen) wirklich zukommen. Ein Photon beispielsweise, das durch einen vertikalen Filter getreten ist und von dem bekannt ist, dass es (im Sinne von Kapitel 2.2) die Eigenschaft v besitzt, könnte durch folgende ket-Vektoren gekennzeichnet sein: |γ, vi , |Photon, vertikal polarisierti , |0◦ i , | l i , . . . (4.32) 66 Mathematische Grundlagen Ansonsten ist die explizite mathematische Darstellung dieser Vektoren ähnlich wie in Abschnitt 2.3. Bisher scheint die Bra-Ket-Notation noch keine besonderen Vorteile zu bringen, abgesehen vielleicht von der spiegelbildlichen Symmetrie zwischen Vektor und dualem Vektor, die in der Notation deutlich wird, und die Kombination dieser Vektoren im Skalarprodukt zu einer komplexen Zahl. Die Vorteile werden später deutlich. 4.2 Lineare Abbildungen – Operatoren Im einleitenden Kapitel hatten wir im Zusammenhang mit den Polarisationsexperimenten gesehen, dass wir die Wirkung von Polarisationsfiltern auf den Polarisationszustand von Licht durch (zweidimensionale) Matrizen beschreiben können. Wir hatten damals schon angedeutet, dass dies ein Spezialfall ist, und dass die linearen Abbildungen auf dem Hilbertraum eine besondere Rolle spielen. Daher wollen wir in diesem Kapitel einige Bemerkungen zu linearen Abbildungen machen. Spezielle Details folgen im Zusammenhang mit konkreten Anwendungen. Bei endlich dimensionalen Vektorräumen sprechen wir meist von linearen Abbildungen“, bei unendlich dimensio” nalen Vektorräumen von linearen Operatoren“, wobei es sich auch hier um lineare ” Abbildungen handelt. Dieser Begriff ist somit der Überbegriff. Ansonsten werden die Bezeichnungen lineare Abbildungen, Matrizen, (lineare) Operatoren oft in gleicher Bedeutung verwendet. Die folgenden drei Arten von linearen Abbildungen spielen für die Physik eine besondere Rolle: Projektionsoperatoren, selbstadjungierte Operatoren und unitäre Operatoren, die wir der Reihe nach behandeln werden. Eine weitere Klasse von Operatoren, so genannte Dichtematrizen, werden in Kapitel 5.9 behandelt. 4.2.1 Allgemeine Eigenschaften linearer Operatoren Eine Abbildung von einem Vektorraum V in einen Vektorraum W heißt linear, wenn für alle |xi, |yi ∈ V und alle α, β ∈ C (oder R bei reellen Vektorräumen) folgende Bedingung erfüllt ist: A α|xi + β|yi = α A|xi + β A|yi . (4.33) Hierbei soll A|xi das Bild von |xi unter der Abbildung A darstellen. In seltenen Fällen schreibt man auch |Axi für A|xi. Im Folgenden werden wir nahezu ausschließlich Abbildungen auf endlich dimensionalen oder aber separablen Hilberträumen H in sich selbst betrachten, sodass das Bild von A wieder in H liegt. Außerdem werden wir — wie bei Hilberträumen üblich — annehmen, dass ein (positives, nicht entartetes) Skalarprodukt erklärt ist. Lineare Abbildungen – Operatoren 67 Matrixdarstellung linearer Operatoren Eine lineare Abbildung liegt bereits eindeutig fest, wenn ihre Wirkung auf einer Basis bekannt ist. Bezüglich einer abzählbaren Basis {|ei i} kann man die lineare Abbildung auch durch ihre Matrixelemente kennzeichnen: aij = hei |A|ej i . (4.34) Bei linearen Abbildungen auf endlich dimensionalen Räumen schreibt man eine lineare Abbildung meist als Matrix: a11 a12 · · · a1n a21 a22 · · · a2n A= . (4.35) . . . . . . . . . . . . an1 an2 · · · ann In Bezug auf eine abzählbare Basis ist das auch bei unendlich dimensionalen Hilberträumen möglich: a11 a12 a13 · · · a21 a22 a23 · · · (4.36) A= . a31 a32 a33 · · · .. .. .. . . . . . . Wir haben zwar betont, dass wir bestenfalls separable Hilberträume zulassen, und dass separable Hilberträume immer eine abzählbare Basis haben, aber das bedeutet nicht, dass die Operatoren immer bezüglich dieser separablen Basis ausgedrückt werden müssen. Beispielsweise ist der ∂ Ableitungsoperator ∂x ein linearer Operator auf dem separablen Hilbertraum der quadratintegrablen Funktionen. Der adjungierte Operator Da wir ein Skalarprodukt gegeben haben, können wir zu jedem Operator A auch einen adjungierten Operator A† definieren: ∀|xi, |yi ∈ H soll gelten hA† y|xi = hx|A† |yi∗ = hy|A|xi . (4.37) Schreiben wir die Operatoren als Matrizen bezüglich einer orthonormalen Basis, so erhalten wir den adjungierten Operator, indem wir die Matrix transponieren (Zeilen und Spalten vertauschen) und die Matrixelemente komplex konjugieren. Man spricht in diesem Fall auch schon mal von einer hermitesch konjugierten Matrix. Sie ist das komplexe Analogon zur transponierten Matrix bei reellen Matrizen. 68 Mathematische Grundlagen Das Adjungierte eines Produkts von Operatoren ist das umgekehrte Produkt der adjungierten Operatoren, wie man sich leicht anhand der Definition des adjungierten Operators überlegt: (AB)† = B † A† . (4.38) Handelt es sich bei der Basis, bezüglich der die Matrixelemente ausgedrückt wurden, nicht um eine Orthonormalbasis, wird die Beziehung zwischen den Matrixelementen von A und A† komplizierter: Sei beispielsweise eine Basis gegeben, für die hei |ej i = gij und seien |xi und |yi zwei Vektoren mit der Entwicklung X X |xi = xi |ei i , |yi = yi |ei i , (4.39) i i † und seien aij die Matrixelemente von A und (a )ij die Matrixelemente von A† , so gilt: X X ∗ hy|A|xi = yi∗ gij akj xk und hx|A† |yi∗ = xk gkj (a† )∗ij yi i,j,k (4.40) i,j,k Wenn diese Beziehung für alle Vektoren |xi und |yi gelten soll, folgt: X X ∗ gij akj = (a† )∗ij gkj . j (4.41) j Nur für eine Orthonormalbasis mit gij = δij erhalten wir: aki = (a† )∗ik bzw. (a† )ik = a∗ki . Der bezüglich des Skalarprodukts duale Vektor zu A|xi ist durch hAx| = hx|A† gegeben. Eigenwerte und Eigenvektoren Gibt es einen Vektor |xi ∈ H und eine (komplexe) Zahl λ, sodass A|xi = λ|xi , (4.42) so bezeichnet man λ als einen Eigenwert von A und |xi als den zugehörigen Eigenvektor (für den man dann oft zur Kennzeichnung dieser Eigenschaft |λi schreibt). Gibt es mehrere linear unabhängige Vektoren |x1 i, ..., |xn i ∈ H, die alle Eigenvektoren zum selben Eigenwert λ sind (also A|xi i = λ|xi i), so bezeichnet man λ als entartet und n als den Entartungsgrad von λ. Die Norm von Operatoren Schließlich definieren wir für Operatoren noch eine Norm, mit der wir für die Menge der Operatoren eine Topologie erhalten. Im Allgemeinen unterscheidet man sogar zwei verschiedene Definitionen für die Norm, und bezeichnet die entsprechenden Topologien als starke bzw. schwache Topologie. Die starke Topologie folgt aus der Definition für die Operatornorm: p p hx|A† A|xi kA|xik = sup|xi p = sup{|xi|hx|xi=1} hx|A† A|xi . (4.43) kAkS = sup|xi k|xik hx|xi Lineare Abbildungen – Operatoren 69 Die schwache (weak) Topologie ergibt sich aus der Operatornorm: kAkW = supk|xik=k|yik=1 |hy|A|xi| (4.44) Bei endlich dimensionalen Hilberträumen definieren beide Normen dieselbe Topologie auf der Menge der Matrizen. Dies ist bei unendlich dimensionalen Hilberträumen nicht mehr der Fall. Ein Operator dessen (starke) Norm endlich ist, heißt beschränkt, andernfalls heißt er unbeschränkt. In endlich dimensionalen Vektorräumen sind alle linearen Abbildungen beschränkt. Oft werden wir Funktionen von Operatoren betrachten. Daher müssen wir uns überlegen, wie man die Funktion eines Operators definieren kann. Für endliche PolyP nome f (x) = k ak xk kann man offenbar die Funktion eines Operators A definieren als X ak Ak . (4.45) f (A) = k Diese Definition lässt sich auch auf unendliche Summen ausdehnen, sofern die Norm des Operators kleiner ist als der Konvergenzradius der Summe. Wir werden später (Kap. 4.2.4) noch eine andere Methode kennenlernen, wie man die Funktion zumindest einer großen Klasse von Operatoren definieren kann. Die Menge der linearen Operatoren auf einem Hilbertraum bildet offensichtlich selbst einen Vektorraum: man kann Operatoren addieren (bei Matrizen ist das die komponentenweise Addition der Matrixelemente) und mit komplexen Zahlen multiplizieren (ebenfalls komponentenweise). Das Nullelement ist der 0-Operator (der alles auf die Null abbildet, bzw. die Matrix, die nur Nulleinträge hat), und der bezüglich der Addition inverse Operator ist einfach das Negative des Operators. Die Menge der beschränkten Operatoren kann man zu einem topologischen Vektorraum machen und durch Vervollständigung bezüglich der definierten Norm zu einem Banachraum. Der Kommutator von Operatoren Wir wissen, dass das Produkt von Matrizen im Allgemeinen von der Reihenfolge der Matrizen abhängt, d.h. AB 6= BA. In diesem Sinne handelt es sich bei dem Produkt von Matrizen um ein nicht kommutatives Produkt. Dies gilt natürlich auch für Operatoren in einem Hilbertraum. In der Quantenmechanik spielt die Frage, ob zwei Operatoren miteinander kommutieren oder nicht, eine wichtige Rolle. Daher definiert man gewöhnlich den Kommutator von zwei Operatoren als die Differenz zwischen den beiden Produkten und somit als ein Maß für die Nicht-Kommutativität von Operatoren: [A, B] := AB − BA . (4.46) Wir wollen ein paar formale Eigenschaften des Kommutators zusammenfassen, die für beliebige lineare Operatoren A, B, C gelten: 70 Mathematische Grundlagen 1. Der Kommutator ist ein anti-symmetrisches Produkt: [A, B] = −[B, A] . (4.47) 2. Der Kommutator ist ein bilineares Produkt: [A, αB + βC] = α[A, B] + β[A, C] (α, β ∈ C) . (4.48) 3. Der Kommutator erfüllt die Jacobi-Identiät: [[A, B], C] + [[B, C], A] + [[C, A], B] = 0 . (4.49) 4. Der Kommutator ist eine Derivation, d.h. [A, BC] = [A, B]C + B[A, C] . 4.2.2 (4.50) Besonderheiten in unendlich dimensionalen Hilberträumen In unendlich dimensionalen (separablen) Hilberträumen gibt es einige Besonderheiten, von denen an dieser Stelle zumindest einige angesprochen werden sollen. Eine ausführliche Diskussion findet man in Büchern zur Funktionalanalysis. Unbeschränkte Operatoren Es kann passieren, dass ein Operator in einem unendlich dimensionalen Hilbertraum zwar wohl-definiert ist, dass das Ergebnis der Operation dieses Operators aber nicht mehr in dem Hilbertraum liegt. In solchen Fällen spricht man von unbeschränkten Operatoren. Der Grund dafür liegt oft darin, dass viele unendlich dimensionale Hilberträume in größere Vektorräume eingebettet sind, und die Abbildung aus dem Unterraum, welcher dem Hilbertraum entspricht, hinausführt. Betrachten wir dazu zwei Beispiele: 1. Wir hatten in Abschnitt 4.1.1 den Raum der quadratsummierbaren Folgen {(x1 , x2 , ...)} P mit i |xi |2 < ∞ definiert. Eine solche Folge wäre beispielsweise 1 1 1 (4.51) |harmi = 1, , , ..., , ... , 2 3 n denn es gilt: ∞ X 1 π2 hharm|harmi = = ζ(2) = < ∞. 2 n 6 n=0 (4.52) Lineare Abbildungen – Operatoren 71 Eine besondere lineare Abbildung (nennen wir sie einfach N ) wäre die Diagonalmatrix mit der Zahl n in der n-ten Zeile und n-ten Spalte: 1 0 0 ··· 0 2 0 ··· N = (4.53) oder hen |N |em i = n δnm . 0 0 3 ··· .. .. .. . . . . . . Die Wirkung dieser linearen Abbildung besteht darin, das n-te Element eines Vektors mit n zu multiplizieren: N (x1 , x2 , x3 , ...) = (1 x1 , 2 x2 , 3 x3 , ...) . Für den Vektor |harmi hat das aber zur Folge, dass 1 1 1 N 1, , , ..., , ... = (1, 1, 1, ...) 2 3 n (4.54) (4.55) und dieser Vektor ist nicht mehr quadratsummierbar und somit nicht Teil des Hilbertraums. 2. Ein ganz ähnliches Beispiel erhalten wir, wenn wir als Hilbertraum den Raum der quadratintegrablen Funktionen L2 über den reellen Zahlen wählen und als linearen Operator einfach die Multiplikation einer Funktion mit x. Diese Multiplikation ist offensichtlich als Operation auf einem Funktionenraum linear, denn es gilt: x(αf (x) + βg(x)) = α xf (x) + β xg(x) . (4.56) Als Beispiel einer quadratintegrablen Funktion wählen wir f (x) = 1 , x + ia so dass |f (x)|2 = und somit Z +∞ x2 (4.57) 1 + a2 (4.58) +∞ 1 x π = . |f (x)| dx = arctan a a −∞ a 2 −∞ (4.59) Diese Funktion ist also Teil des Hilbertraums. Anwendung des Operators Mul” tiplikation mit x“ führt jedoch auf: xf (x) = x , x + ia und somit |xf (x)|2 = x2 . x 2 + a2 Diese Funktion ist offensichtlich nicht mehr quadratintegrabel. (4.60) 72 Mathematische Grundlagen In beiden Fällen führt also ein vergleichsweise harmloser“ linearer Operator aus dem ” Hilbertraum heraus. Nach unserer Defintion für lineare Abbildungen im letzten Abschnitt gehören streng genommen beide Abbildungen nicht zu den linearen Operatoren auf den jeweiligen Hilberträumen, denn eine Minimalvoraussetzung für eine Abbildung ist, dass sie jedem Element des Urbildraums ein Element des Bildraums zuordnet, was aber in den Beispielen nicht erfüllt ist. Obwohl die Bilder eine wohldefinierte Folge bzw. eine wohldefinierte Funktion waren, gehörten sie nicht mehr zum Hilbertraum der quadratintegrablen Folgen bzw. Funktionen. Da gerade der Multiplikationsoperator mit x ebenso wie viele weitere unbeschränkte Operatoren in der Physik eine große Bedeutung haben, werden sie gewöhnlich nicht von der Menge der linearen Operatoren ausgeschlossen. Der mathematische Weg, um die auftretenden Probleme zu umgehen, besteht darin, diese Operatoren nicht auf dem gesamten Hilbertraum zu definieren, sondern nur auf dem Teilraum D, auf dem die Bilder wieder im (gesamten) Hilbertraum liegen. Diesen Teilraum bezeichnet man als den Definitionsbereich der Operatoren. Viele wichtige Beziehungen für lineare Operatoren (unter anderem auch die besonders wichtigen kanonischen Vertauschungsrelationen“) gelten nur auf den je” weiligen Definitionsbereichen der betrachteten Operatoren. Das wird allerdings nicht immer explizit erwähnt. Kontinuierliches Spektrum Wir haben im letzten Abschnitt den Begriff des Eigenwerts definiert. Eigenwerte spielen in der Quantenphysik eine besondere Rolle. Für endliche Matrizen sind die Eigenwerte diskret. Sie können zwar entartet sein, aber letztendlich bleibt die Menge der Eigenwerte eine diskrete Punktmenge. In einem unendlich dimensionalen Vektorraum, und hier sind es inbesondere wieder die Funktionenräume, wie beispielsweise der L2 , kann es passieren, dass zwar eine Gleichung der Form A|xi = λ|xi (4.61) erfüllt werden kann, dass aber |xi nicht in dem Hilbertraum liegt, den man betrachtet. Betrachten wir als Beispiel diesmal den Operator der zweiten Ableitung, der ebenfalls eine wichtige Rolle in der Physik spielt. Man findet leicht die Funktionen, welche die Gleichung d2 f (x) = λf (x) (4.62) dx2 erfüllen. Wir kennen diese Gleichung vom klassischen harmonischen Oszillator (dort Lineare Abbildungen – Operatoren 73 ist x die Zeit t). Lösungen sind (bis auf einen Faktor) f (x) = sin(px) und f (x) = cos(px) f (x) = 1 und f (x) = x ±αx und f (x) = e für λ = −p2 negativ (4.63) für λ = 0 (4.64) für λ = α 2 positiv . (4.65) Eine kurze Überlegung zeigt, dass keine dieser Funktionen quadratintegrabel ist. Selbst die trigonometrischen Funktionen, die sich für große Argumente x noch am besten verhalten, lassen sich nicht über die gesamte reelle Achse im Quadrat integrieren. Das bedeutet, der zweite Ableitungsoperator besitzt keine Eigenvektoren im Hilbertraum der quadratintegrablen Funktionen, und damit streng genommen auch keine Eigenwerte. Es stellt sich aber häufig heraus, dass man manche Eigenvektoren (in obigem Fall die Winkelfunktionen zu den negativen Eigenwerten sowie die konstante Funktion f (x) = 1) beliebig genau innerhalb des Hilbertraums approximieren kann, d.h., man gelangt mit quadratintegrablen Funktionen beliebig genau an die Eigenvektoren heran, ohne sie allerdings (innerhalb des Hilbertraums) erreichen zu können. (Die Sprechweise beliebig genau“ müsste über geeignete Konvergenzkriterien definiert ” werden, aber wir wollen es nicht übertreiben.) In solchen Fällen, wo die Eigenvektoren eigentlich nicht Teil des Hilbertraums sind, aber dort beliebig genau approximiert werden können, spricht man nicht von Eigenwerten sondern vom Spektrum eines Operators. Die Menge der nicht positiven reellen Zahlen wäre somit das Spektrum des Operators der zweiten Ableitungen. Um den Begriff des Spektrums exakter definieren zu können, überlegen wir uns zunächst, dass die Eigenwertgleichung Gl. 4.42 (A − λ1)|xi = 0 (4.66) impliziert, dass der Operator (A−λ1) nicht invertiert werden kann. Diese Beobachtung kann man für Operatoren in einem unendlich dimensionalen Hilbertraum verallgemeinern: Definition: Das Spektrum eines Operators A besteht aus allen komplexen Zahlen λ, für die der Operator (A − λ1)−1 ein unbeschränkter Operator ist. Selbst wenn der Eigenvektor nicht Teil des Hilbertraums ist, in diesem aber beliebig genau angenähert werden kann, wird der obige Operator für solche Werte von λ unbeschränkt. Im Allgemeinen hat die Frage, ob ein Operator ein Spektrum aber keine Eigenwerte besitzt, nichts damit zu tun, ob dieser Operator unbeschränkt ist oder nicht. Es gibt unbeschränkte Operatoren mit diskreten Eigenwerten (beispielsweise der Operator N in Gl. 4.53), und es gibt beschränkte Operatoren, die allerdings keine Eigenwerte besitzen sondern nur ein Spektrum. Man kann allerdings beweisen, dass die diskreten 74 Mathematische Grundlagen Teile des Spektrums eines Operators auch gleichzeitig Eigenwerte sind, wohingegen ein kontinuierlicher Teil des Spektrums keine Eigenvektoren im Hilbertraum besitzt. Spurklasseoperatoren Auch für Operatoren in einem unendlich dimensionalen Hilbertraum kann man eine Spur definieren. Definition: Sei |ei i eine (der Einfachheit halber orthonormale) Basis, so ist X Sp A = hei |A|ei i (4.67) i die Spur des Operators A. Falls die Spur existiert, hängt sie nicht von der gewählten Orthonormalbasis ab. Operatoren, für welche die Spur endlich ist, bezeichnet man als Spurklasseoperatoren. In unendlich dimensionalen Hilberträumen muss die Spur eines linearen Operators nicht notwendigerweise existieren. Für unbeschränkte Operatoren existiert sie nie. Als Beispiel betrachte man nur den Operator N (Gl. 4.53) zu Beginn dieses Kapitels. Aber auch für beschränkte Operatoren existiert die Spur nicht immer. Ein Beispiel ist der Identitätsoperator, dessen Spur gewöhnlich gleich der Dimension des jeweiligen Vektorraums ist. Wenn Operatoren keine Spurklasseoperatoren sind, erhält man meist unsinnige Ergebnisse, wenn man trotzdem die Spur berechnet. Ein klassisches Beispiel sind die kanonischen Vertauschungsrelationen in der Quantenmechanik (siehe Kap. 5.3): [Q, P ] = QP − P Q = i~1 . (4.68) Die Spur des Identiätsoperators auf der rechten Seite ist offenbar unendlich, für die linke Seite hat man den Eindruck, als ob die Spur null ergibt: Die Spur von der Summe zweiter Operatoren ist gleich der Summe der Einzelspuren und die Spur von dem Produkt der Operatoren hängt nicht von deren Reihenfolge ab. Damit erhielte man 0 = ∞. Dieser Unsinn beruht natürlich darauf, dass keiner der Operatoren (Q, P, 1) ein Spurklasseoperator ist. Für Spurklasseoperatoren kann die obige Gleichung tatsächlich nie erfüllt werden. Die Menge der Spurklasseoperatoren kann man sogar wieder zu einem Hilbertraum machen. Als das Skalarprodukt zweier Operatoren definiert man in diesem Fall (A, B) = Sp (A† B) . 4.2.3 (4.69) Selbstadjungierte Operatoren Eine besonders wichtige Klasse von Operatoren für die Quantenmechanik bilden die selbst-adjungierten Operatoren, für die also gilt A† = A oder hx|A|yi = hAx|yi . (4.70) Lineare Abbildungen – Operatoren 75 Wie wir später sehen werden (Kap. 5.3), hängen diese Operatoren eng mit dem zusammen, was man an einem System beobachten kann und was man für Messwerte erhält. Eine spezielle Klasse von selbstadjungierten Matrizen ist uns schon im Zusammenhang mit der Beschreibung von Filtern in Kap. 2.3 begegnet. Dabei handelte es sich um Projektionsoperatoren, die wir im nächsten Abschnitt behandeln werden. Zwei einfache Theoreme machen selbstadjungierte Operatoren für die Quantenmechanik so wichtig: Satz: (1) Die Eigenwerte eines selbstadjungierten Operators sind reell. Beweis: Sei |λi ein normierter Eigenvektor von A mit Eigenwert λ, so gilt: hλ|A|λi = λ . (4.71) hλ|A|λi = hλ|A† |λi∗ , (4.72) Andererseits ist: womit die Behauptung für selbstadjungierte Operatoren bewiesen ist. Mit etwas größerem Aufwand kann man zeigen, dass auch das Spektrum solcher Operatoren (die also eigentlich keine Eigenvektoren haben) reell ist. Satz: (2) Die Eigenvektoren zu verschiedenen Eigenwerten eines selbstadjungierten Operators sind orthogonal. Beweis: Seien λ 6= λ0 zwei verschiedene Eigenwerte von A mit Eigenvektoren |λi und |λ0 i, so gilt: hλ0 |A|λi = λ hλ0 |λi = λ0 hλ0 |λi . (4.73) Da die beiden Eigenwerte als verschieden angenommen wurden, kann die rechte Gleichung nur gelten, wenn hλ0 |λi = 0. Auch in diesem Fall lässt sich zeigen, dass der Satz auch für die Fast“-Eigen” vektoren zum Spektrum von linearen Operatoren gilt. Haben zwei (linear unabhängige) Vektoren denselben Eigenwert, müssen sie nicht orthogonal sein. Allerdings spannen sie eine Ebene von Vektoren auf, und man kann sich leicht überzeugen, dass beliebige Linearkombinationen dieser beiden Vektoren wieder Eigenvektoren zu demselben Eigenwert sind. Daher kann man in dieser Ebene zwei orthogonale Eigenvektoren als Repräsentanten wählen. Eine der Eigenschaften, die selbstadjungierte Operatoren so wichtig machen, ist die Tatsache, dass sich aus den Eigenvektoren solcher Operatoren eine Orthonormalbasis definieren lässt. Gehören zwei Eigenvektoren zu verschiedenen Eigenwerten, sind sie immer orthogonal und können natürlich normiert werden. Innerhalb von Unterräumen, in denen alle Vektoren denselben Eigenwert haben (sofern der Eigenwert entartet ist) kann man immer eine Orthonormalbasis wählen. 76 Mathematische Grundlagen Satz: Zwei selbstadjungierte Operatoren A und B besitzen genau dann einen gemeinsamen Satz von Eigenvektoren, wenn diese beiden Operatoren kommutieren, d.h., wenn AB = BA. Beweis: Zwei Operatoren, die gleichzeitig auf Diagonalgestalt gebracht werden können, kommutieren offenbar in dieser Basis. Wenn die Gleichung AB = BA aber für eine vollständige Basis gilt, gilt sie auf dem gesamten Hilbertraum. Umgekehrt nehmen wir an, die Gleichung AB = BA gelte auf dem gesamten Hilbertraum, und {|λi i} sei eine (vollständige) Basis von A. Damit folgt 0 = hλi |(AB − BA)|λj i = λi hλi |B|λj i − λj hλi |B|λj i = (λi − λj )hλi |B|λj i . (4.74) Wiederum folgt für λi 6= λj hλi |B|λj i = 0 (4.75) Bezüglich verschiedener Eigenwerte von A ist also B ebenfalls diagonal. Sind die Eigenwerte entartet, können wir B auf diesem Unterraum der Eigenvektoren zu den entarteten Eigenwerten diagonalisieren, ohne dass sich an der Eigenschaft von A, diagonal zu sein, etwas ändert. Die besondere Eigenschaft selbstadjungierter Operatoren — ein Orthonormalsystem von Eigenvektoren zu besitzen — ist manchmal wichtiger, als die Eigenschaft, reelle Eigenwerte zu haben. Aus diesem Grund definiert man einen Operator als normal, wenn er mit seinem adjungierten Operator kommutiert: A† A = AA† . Von solchen Operatoren kann man zeigen, dass sie sich als Funktionen von selbstadjungierten Operatoren schreiben lassen. Eine wichtige Klasse von normalen aber nicht selbstadjungierten Operatoren sind die unitären Operatoren. 4.2.4 Projektionsoperatoren Eine besondere Klasse von selbstadjungierten Operatoren bilden die (orthogonalen) Projektionsoperatoren. Ein Projektionsoperator erfüllt dabei die Bedingungen: P = P† und P 2 = P . (4.76) (Es gibt auch Projektionsoperatoren, die nicht selbstadjungiert sind, die also nur die zweite Bedingung erfüllen, diese sollen hier aber nicht betrachtet werden.) Wir sind Projektionsoperatoren schon einmal in Kap. 2.3 begegnet, wo wir gezeigt hatten, dass Projektionsoperatoren in natürlicher Weise die Projektion eines Vektors auf eine bestimmte Achse beschreiben. Generell kann man Projektionsoperatoren als lineare Abbildungen auffassen, die einen Vektor auf einen linearen Unterraum eines Hilbertraums abbilden. Dies soll im Folgenden kurz erläutert werden. Zunächst muss man sich vor Augen halten, dass jeder Satz von n linear unabhängigen Vektoren |xi i einen Vektorraum aufspannen. Dabei handelt es sich um die Menge aller Vektoren, die sich als beliebige Linearkombinationen dieser n Vektoren Lineare Abbildungen – Operatoren 77 schreiben lassen. Ein solcher Vektorraum bildet somit einen n-dimensionalen linearen Unterraum des Vektorraums, in dem die Vektoren |xi i definiert sind. Zu jedem solchen Unterraum gibt es einen Operator P , der einen beliebigen Vektor des Hilbertraums orthogonal auf diesen Unterraum projiziert. Da ein Vektor, der bereits in einem solchen Unterraum liegt, durch die Projektion nicht verändert wird, gilt P 2 = P , d.h., die erneute Anwendung des Projektionsoperators ändert an dem Ergebnis der ersten Projektion nichts. Projektionsoperatoren haben nur zwei mögliche Eigenwerte: λ = 0 und λ = 1. Das sieht man daran, dass die Eigenwerte natürlich ebenfalls die Gleichung λ2 = λ erfüllen müssen, und da sind 0 und 1 die einzigen Lösungen. Der Eigenraum zu λ = 1 ist offenbar der Unterraum, auf den P projiziert, denn für Vektoren in diesem Unterraum gilt, dass P sie nicht verändert. Die dazu orthogonalen Vektoren besitzen den Eigenwert 0 und werden auf den Nullvektor projiziert. Die Spur von P gibt die Dimension des linearen Unterraums an, auf den P projiziert. Ein Projektionsoperator mit Sp P = 1 projiziert somit auf einen eindimensionalen linearen Unterraum bzw. eine Linie. Die Menge aller (orthogonalen) Projektionsoperatoren mit Spur 1 entpricht somit der Menge aller linearen eindimensionalen Unterräume, also der Menge aller Geraden durch den Nullpunkt. Die eindimensionalen linearen Unterräume bezeichnet man manchmal auch als die Strahlen eines Vektorraums. Die Spektraldarstellung selbstadjungierter Operatoren Betrachten wir zunächst eine selbstadjungierte (oder allgemeiner normale“) Matrix ” in Diagonalgestalt: λ1 0 0 · · · 0 λ2 0 · · · A= (4.77) . 0 0 λ3 · · · .. .. .. . . . . . . Falls die Eigenwerte nicht entartet sind, gehört jeder Eigenwert zu einem eindimensionalen linearen Unterraum und wir können schreiben: 1 0 0 ··· 0 0 0 ··· 0 0 0 ··· 0 0 0 ··· 0 1 0 ··· 0 0 0 ··· A = λ1 + λ2 + λ3 + . . . (4.78) 0 0 0 ··· 0 0 0 ··· 0 0 1 ··· .. .. .. . . .. .. .. . . .. .. .. . . . . . . . . . . . . . . Jede dieser Matrizen entspricht einem Projektionsoperator auf den entsprechenden Unterraum des Eigenwerts. Definieren wir Pλi als den Projektionsoperator auf den 78 Mathematische Grundlagen Unterraum zum Eigenwert λi , so folgt: A= X λ i Pλ i . (4.79) i Diese Gleichung bleibt in beliebigen Basissystemen gültig, d.h., sie gilt nicht nur in dem System, in dem die Matrix A diagonal ist, da bei einem Basiswechsel beide Seiten gleichermaßen transformiert werden. Außerdem bleibt die Gleichung gültig, wenn ein Eigenwert λ entartet sein sollte, und wir unter Pλ entsprechend den Projektionsoperator auf diesen mehrdimensionalen linearen Unterraum verstehen, der von den Eigenvektoren zu λ aufgespannt wird. Gleichung 4.79 bezeichnet man als die Spektralzerlegung von A. Offenbar lässt sich eine solche Zerlegung immer vornehmen, sofern sich eine Orthonormalbasis von Eigenvektoren finden lässt, d.h., wenn die lineare Abbildung normal ist. Mit etwas Aufwand kann man die Spektralzerlegung auch auf normale Operatoren mit einem kontinuierlichen Spektrum erweitern. Der Aufwand besteht darin, ein operatorwertiges Integrationsmaß“ dPλ zu definieren, mit dem gilt: ” Z A = λ dPλ . (4.80) Anschaulich geht man dabei wie bei der Definition des Riemannschen Integrals vor: Man definiert Projektionsoperatoren ∆Pλ auf Intervalle: ∆Pλi projiziert auf den Unterraum, in dem die Eigenvektoren zu dem Intervall [λi , λi + ∆λ] liegen. Näherungsweise kann man A als eine Summe darstellen: X A≈ λi ∆Pλi (4.81) i und betrachtet anschließend den Grenzwert ∆λ → 0. Streng genommen gibt es diese Eigenvektoren nicht in dem Hilbertraum. Daher muss man so vorgehen, dass man zunächst den linearen Unterraum V (λ, ∆λ) definiert, sodass für alle Vektoren |xi in diesem Unterraum gilt hx|A|xi ≤ λ + ∆λ (4.82) λ≤ hx|xi Nun handelt es sich um ein Intervall für die Matrixelemente von A und es wird nicht vorrausgesetzt, dass |xi ein Eigenvektor von A ist. Dieser Raum ist wohl-definiert, bildet einen linearen Unterraum und man kann den Projektionsoperator auf diesen Unterraum definieren. Anschließen betrachtet man einen Grenzwert, bei dem ∆λ gegen null geht. Die Spektralzerlegung erlaubt auch eine elegante Darstellung von Funktionen von normalen (also insbesondere selbstadjungierten) Operatoren. Sei A ein normaler Operator mit Spektrum {λ} und der Spektralzerlegung Z X A= λi Pλi bzw. A = λ dPλ , (4.83) i Lineare Abbildungen – Operatoren 79 so können wir für eine Funktion f (auf den komplexen Zahlen) definieren: Z X f (A) = f (λi ) Pλi bzw. f (A) = f (λ) dPλ . (4.84) i 4.2.5 Unitäre Operatoren Abschließend wollen wir kurz auf unitäre Operatoren eingehen. Hierbei handelt es sich um die komplexe Verallgemeinerung von Rotationen“. Unitäre Operatoren sind ” unter anderem wichtig, wenn man einen Wechsel von einer Orthonormalbasis zu einer anderen Orthonormalbasis vornehmen möchte. Stellen wir uns vor, U sei eine lineare Abbildung auf dem Hilbertraum, die das Skalarprodukt von zwei Vektoren nicht verändern soll, d.h., für zwei beliebige Vektoren |xi, |yi im Hilbertraum soll gelten: hU y|U xi = hy|U † U |xi = hy|xi . (4.85) Die erste Gleichung ist dabei eine identische Umformung und impliziert die Definition des adjungierten Operators zu U , die zweite Gleichung ist eine Bedingungsgleichung. Damit diese Bedingung für alle Vektoren |xi, |yi erfüllt ist, muss gelten: U †U = 1 . (4.86) Definition: Ein Operator heißt unitär, wenn gilt: U † = U −1 . (4.87) Ein unitärer Operator U kommutiert mit seinem adjungierten Operator U † und somit ist U ein normaler Operator. Wie schon erwähnt, lässt sich jeder normale Operator als Funktion eines selbstadjungierten Operators schreiben und zwar gilt: U = eiA (A selbstadjungiert) . (4.88) Der adjungierte bzw. inverse Operator dazu ist U † = e−iA . (4.89) Wenn wir in einem Hilbertraum eine unitäre Transformation vornehmen, d.h. alle Vektoren nach der Vorschrift |xi 7→ U |xi rotieren“, und wir möchten, dass die Matrix” elemente von Operatoren hx|A|yi unverändert bleiben, so müssen wir die Operatoren ebenfalls transformieren. Offenbar lässt das folgende Transformationsgesetz, A 7→ U AU † (4.90) 80 Mathematische Grundlagen die transformierten Matrixelemente unverändert: hx|A|yi 7→ hU x|U AU † |U yi = hx|U † (U AU † )U |yi = hx|A|yi . (4.91) Die Eigenwerte eines unitären Operators müssen die Bedingung λ∗ = λ−1 bzw. λ∗ λ = 1 erfüllen und sind daher alle von der Form λ = eiα , wobei α eine reelle Zahl ist. Die Menge aller unitären Transformationen bildet eine Gruppe. Handelt es sich um einen endlich dimensionalen Raum (Dimension N ), so spricht man von der unitären Gruppe U(N ). Bei endlich dimensionalen Räumen kann man auch die Determinante von Matrizen definieren, und die Untergruppe der unitären Matrizen mit der Determinante +1 bezeichnet man als Spezielle unitäre Gruppe SU(N ). Handelt es sich um reelle Vektorräume, so lautet die Bedingung (4.87) RT = R−1 (wobei RT die transponierte Matrix von R ist) und man spricht von orthogonalen Matrizen. In einem N -dimensionalen Vektorraum bezeichnet man die Menge aller orthogonalen Matrizen als die Orthogonale Gruppe O(N ) und die Menge der orthogonalen Matrizen mit Determinante 1 als die Spezielle orthogonale Gruppe SO(N ). Die Elemente der speziellen orthogonalen Gruppe sind gerade die Drehungen in einem Vektorraum, wohingegen die orthogonale Gruppe neben den Drehungen noch Spiegelungen enthält. Entsprechend kann man die unitären Matrizen in komplexen Vektorräumen als verallgemeinerte Drehungen auffassen. 4.3 Die Bra-Ket-Notation für Operatoren Lineare Abbildungen von einem Vektorraum V in einen Vektorraum W kann man abstrakt auch als Elemente von W × V ∗ auffassen, wobei V ∗ der Dualraum von V ist. Ein solches Element aus W × V ∗ hat nämlich die Eigenschaft, dass man es auf ein Element auf V anwenden muss (das ist der V ∗ -Anteil, er liefert zunächst eine Zahl) und das Ergebnis ist ein Vektor in W (der W -Anteil, der mit der vorher erhaltenen Zahl multipliziert wird). Diese sehr abstrakte Sichtweise steckt implizit hinter der BraKet-Notation für Operatoren, die wir nun erläutern wollen. Immer noch als Vorbemerkung aber etwas konkreter überlegen wir uns diesen Sachverhalt im Zusammenhang mit der vielleicht vertrauteren Schreibweise von Zeilenund Spaltenvektoren. Die Elemente des Vektorraums schreibt man üblicherweise als Spaltenvektoren und die Elemente des Dualraums (bzw., falls es ein Skalarprodukt gibt, die transponierten“ Elemente) als Zeilenvektor. Zeilenvektor mal Spaltenvektor ” ist das Skalarprodukt und ergibt eine Zahl (hier an einem 2-dimensionalen Beispiel): (y1 , y2 ) · x1 x2 ! = y 1 x1 + y 2 x2 . (4.92) Die Bra-Ket-Notation für Operatoren 81 Multiplizieren wir hingegen einen Spaltenvektor mit einem Zeilenvektor, so erhalten wir eine Matrix: ! ! y1 y 1 x1 y 1 x2 · (x1 , x2 ) = . (4.93) y2 y 2 x1 y 2 x2 Man erhält auf diese Weise nicht jede Matrix als Multiplikation eines Spalten- und eines Zeilenvektors, aber man kann jede beliebige Matrix als Summe solcher Produkte darstellen. Ausgedrückt in unserer Bra-Ket-Notation entspricht die letzte Gleichung einem Ausdruck der Form |yihx|, und genau durch Linearkombinationen von solchen Ausdrücken lassen sich lineare Abbildungen schreiben. Stellen wir uns zunächst eine lineare Abbildung A wieder als Matrix vor: a11 a12 a13 · · · a21 a22 a23 · · · A= (4.94) . a31 a32 a33 · · · .. .. .. . . . . . . Die (Orthonormal)-Basis zu dieser Darstellung sei {|ei i}. Das Matrixelement aij erhalten wir offensichtlich, indem wir A von rechts mit |ej i und von links mit hei | multiplizieren: aij = hei |A|ej i . (4.95) Offenbar erhalten wir genau dieses Ergebnis, wenn wir die Matrix für A in folgender Form schreiben: X akl |ek ihel | . (4.96) A= k,l Die Matrixelemente der |ek ihel | sind überall 0 außer in der k-ten Zeile und l-ten Spalte, wo eine 1 steht. Auf diese Weise kann man eine Matrix bezüglich jeder beliebigen Orthonormalbasis durch ihre Matrixelemente ausdrücken. Eine besonders einfache Darstellung hat ein Projektionsoperator auf einen 1dimensionalen linearen Unterraum. Sei |xi ein normierter Vektor in diesem Unterraum (dieser Vektor spannt den Unterraum also auf), dann ist der Projektionsoperator gegeben durch Px = |xihx| . (4.97) Wenn wir diesen Projektionsoperator auf einen beliebigen Vektor |yi anwenden, erhalten wir: Px |yi = |xihx|yi , (4.98) also einen Vektor, der die Richtung von |xi hat, und die Amplitude hx|yi, also das Skalarprodukt des Einheitsvektors |xi mit dem (beliebigen) Vektor |yi, das gerade die Länge der senkrechten Projektion von |yi auf die Richtung von |xi angibt. 82 Mathematische Grundlagen Die Darstellung (4.97) für Projektionsoperatoren ist sehr hilfreich, wenn man eine Projektionsmatrix zu einem gegebenen Vektor bestimmen möchte. In Kapitel 2.3 haben wir auf diese Weise die Projektionsmatrix auf den Vektor ! cos α ~α = A (4.99) sin α bestimmt: Pα = cos α sin α ! · (cos α, sin α) = cos2 α cos α sin α cos α sin α sin2 α ! . (4.100) Für die Spektraldarstellung einer selbstadjungierten Matrix (Gl. 4.79) können wir nun schreiben: X A= λi |λi ihλi | (4.101) i wobei |λi i den normierten Eigenvektor zum Eigenwert λi bezeichnet. Für die Einheitsmatrix erhalten wir die nützlich Darstellung: X 1= |λi ihλi | . (4.102) i Diese Zerlegung der Eins gilt für jedes beliebige Orthonormalsystem, insbesondere also auch für die Orthonormalsysteme, die sich aus den Eigenvektoren von selbstadjungierten Matrizen ergeben. Wenn wir von der Matrix A wissen möchten, wie ihre Matrixelemente in einer anderen Orthonormalbasis, beispielsweise {|ϕi i}, aussehen, erhalten wir: X λk hϕi |λk ihλk |ϕj i . (4.103) hϕi |A|ϕj i = k 4.4 Operatoren im L2 Der Raum der komplexen, quadratintegrablen Funktionen über der reellen Achse L2 (R, dx) (die Notation gibt neben dem Urbildraum R noch das Integrationsmaß dx an; manchmal betrachtet man auch verallgemeinerte Lebesgue-Maße) spielt in der Physik eine ganz besondere Rolle, daher sollen einige der Konzepte der vergangen Kapitel konkret noch einmal für diesen Raum formuliert bzw. erweitert werden. Zwei lineare Operatoren haben für die Physik eine besondere Bedeutung: die einfache Multiplikation einer Funktion mit dem Argument x und die erste Ableitung ∂ . Den Grund für das der Funktion (multipliziert mit der imaginären Einheit i): −i ∂x i“ werden wir gleich sehen. ” Operatoren im L2 4.4.1 83 ∂ Das Spektrum von x und −i ∂x Von der Multiplikation mit x haben wir schon gezeigt, dass sie linear ist (Gl 4.56), von der Ableitung gilt entsprechend: ∂ ∂ ∂ −i αf (x) + βg(x) = α −i f (x) + β −i g(x) . (4.104) ∂x ∂x ∂x ∂ zu bestimmen. Dabei Wir versuchen zunächst, mögliche Eigenwerte von x und −i ∂x beginnen wir mit dem Ableitungsoperator, d.h., wir suchen Lösungen zu der Gleichung: −i ∂ f (x) = λf (x) . ∂x (4.105) Wir wissen, dass bei solchen Gleichungen ein Exponentialansatz zum Ziel führt und finden als Lösungen: fk (x) = Aeikx Eigenwert λ = k . (4.106) Die Lösungen sind also durch einen Parameter p charakterisiert, der gleichzeitig der ∂ Eigenwert von −i ∂x ist. Die Ampitude A ist eine Integrationskonstante. Ähnlich wie schon in Kapitel 4.2.2 sind jedoch die Eigenfunktionen des Ope∂ rators −i ∂x nicht quadratintegrabel. Es gilt |fk (x)|2 = 1 und das Integral über die gesamte reelle Achse ist unbeschränkt. Die Eigenfunktionen liegen also nicht im Raum der quadratintegrablen Funktionen. Andererseits können wir leicht zeigen, dass der ∂ − λ1)−1 für reelle Werte von λ unbeschränkt ist, da wir im Raum der Operator (−i ∂x quadratintegrablen Funktionen beliebig“ nahe an die Eigenfunktionen herankommen. ” Man spricht in diesem Fall auch von uneigentlichen Eigenfunktionen. Das Spektrum ∂ von −i ∂x besteht somit aus allen reellen Zahlen k ∈ R: ∂ = {k|k ∈ R} . (4.107) Spec −i ∂x Aus der Theorie der Fouriertransformationen ist folgende Gleichung bekannt: Z +∞ 0 eix(k−k ) dx = 2πδ(k − k 0 ) . (4.108) −∞ Offensichtlich sind die uneigentlichen Eigenfunktionen zu verschiedenen Werten von k orthogonal. Wir werden im Folgenden die normierten komplexen Exponentialfunktionen 1 fk (x) = √ eikx (4.109) 2π mit dem Parameter k durch |ki kennzeichnen. Wir haben also gezeigt, dass −i ∂ |ki = k|ki und hk 0 |ki = δ(k − k 0 ) . ∂x (4.110) 84 Mathematische Grundlagen Nun wird auch der Grund deutlich, weshalb wir für den Ableitungsoperator noch einen Faktor i heranmultipliziert haben. Zum einen lässt sich leicht zeigen, dass der Operator (mit dem i) selbstadjungiert ist. Dadurch ist das Spektrum {k} reell. Ohne das i wären die Eigenfunktionen die einfachen Exponentialfunktionen ekx , die weit davon entfernt“ sind, quadratintegrabel zu sein, und selbst für ” verschiedene Werte von k würde das Skalarprodukt nicht existieren. Diese Funktionen lassen sich ∂ auch nicht durch quadratintegrable Funktionen annähern. Entsprechend ist das Spektrum von −i ∂x tatsächlich die reelle Achse, und nicht die gesamte komplexe Ebene. Wir betrachten nun den Operator Multiplikation mit x“. Damit wir wirklich ” einen eindeutigen Eigenwert erhalten, muss die Eigenfunktion zu diesem Operator auf einen Punkt konzentriert sein. Zunächst könnte man vielleicht an die Funktion ( 1 x = x0 fx0 (x) = (4.111) 0 sonst denken. Sie erfüllt zwar die Eigenwertgleichung: xfx0 (x) = x0 fx0 (x) , (4.112) hat aber den Nachteil, dass nicht nur das Integral über das Quadrat dieser Funktion verschwindet (sie hat einen Träger von nur einem Punkt) und damit hat diese Funktion die Norm 0, sondern auch das Integral über das Produkt dieser Funktion mit jeder anderen (quadratintegrablen) Funktion verschwindet. In diesem Sinne sind also auch sämtliche Skalarprodukte von fx0 mit anderen Funktionen null. Diese Funktion ist in Bezug auf das gewählte Skalarprodukt identisch zum Nullvektor. Die nächste Idee für einen Satz von Eigenfunktionen zum Multiplikationsoperator wäre die (verallgemeinerte) Funktion fx0 (x) = δ(x − x0 ), die ebenfalls ihren Träger auf den Punkt x0 konzentriert hat, deren Integral mit anderen Funktionen aber von Null verschieden ist. Sie erfüllen (auch formal) die Eigenwertgleichung und haben nichtverschwindende Skalarprodukte mit anderen quadratintegrablen Funktionen. Außerdem lassen sie sich beliebig genau durch quadratintegrable Funktionen approximieren (beispielsweise durch eine Folge von normierten Gauß-Funktionen mit immer kleinerer Varianz). Lediglich eine Norm besitzen die δ-Funktionen nicht bezüglich des definierten Skalarprodukts, da das Quadrat einer δ-Funktion nicht existiert. (Andere Versuche, wie die Wurzel von einer δ-Funktion zu nehmen, schlagen ebenfalls fehl.) Allerdings ist das Produkt von δ-Funktionen zu verschiedenen Parametern x0 und x1 immer null, da die Träger verschieden sind. Wir müssen also akzeptieren, dass der Multiplikationsoperator mit dem Argument x ebenfalls keine Eigenfunktionen im Raum der quadratintegrablen Funktionen besitzt, allerdings hat er wiederum ein Spektrum, nämlich die gesamte reelle Achse: Spec(x) = {x|x ∈ R} uneigentliche Eigenfunktionen“ fx0 (x) = δ(x − x0 ) . (4.113) ” Operatoren im L2 85 Auch in diesem Fall bezeichnen wir in Zukunft die δ-Funktion mit dem Parameter x0 als |x0 i. Wir haben gezeigt, dass x|x0 i = x0 |x0 i und hx0 |x1 i = 0 für x0 6= x1 . 4.4.2 (4.114) Die x- und k-Basis Das Skalarprodukt auf dem L2 ist (vgl. Gl. 4.24): Z +∞ f (x)∗ g(x) dx . hf |gi = (4.115) −∞ Wir betrachten nun das Skalarprodukt von quadratintegrablen Funktionen mit den uneigentlichen Eigenfunktionen des letzten Abschnitts. Offenbar gilt: Z +∞ hx|f i = δ(y − x)f (y) dy = f (x) (4.116) −∞ Z +∞ 1 und hk|f i = √ e−ikx f (x) dx = f˜(k) . (4.117) 2π −∞ Hierbei ist f˜ die Fourier-Transformierte der Funktion f . Wir sollten Audrücke der Form hx|f i = f (x) ähnlich interpretieren, wie beispielsweise bei diskreten Basisvektoren Ausdrücke der Form hei |xi = xi (Gl. 4.31). Die Bildung des Skalarprodukts eines Vektors |f i (in einem Vektorraum, der eine Darstellung als Funktionenraum hat) mit dem Vektor |xi (der Eigenfunktion des Multiplikationsoperators mit x) ist wie die Projektion einer Funktion auf eine ihrer Kom” ponenten“ bzw. die Auswertung der Funktion an einer bestimmten Stelle x. Hier wird der Unterschied zwischen der Funktion selbst und dem Wert der Funktion an einer bestimmten Stelle besonders deutlich. Interessant ist noch das Matrixelement hx|ki, für das formal gilt: Z +∞ 1 1 δ(y − x) eiky dy = √ eikx . (4.118) hx|ki = √ 2π −∞ 2π 4.4.3 ∂ Der Kommutator von x und −i ∂x Wir hatten, schon erwähnt, dass der Kommutator von Operatoren in der Physik eine besondere Rolle spielt. Daher wollen wir den Kommutator von den beiden Operatoren ∂ x und −i ∂x berechnen. Wir müssen dabei berücksichtigen, dass es sich wirklich um Operatoren handelt, die auf eine Funktion anzuwenden sind. Wir berechnen somit: ∂ ∂ ∂ x, −i f (x) = x −i f (x) + i xf (x) (4.119) ∂x ∂x ∂x ∂ ∂ (4.120) = −x · i f (x) + if (x) + ix f (x) ∂x ∂x = if (x) . (4.121) 86 Mathematische Grundlagen (Der erste und dritte Term in der zweiten Zeile heben sich weg.) Damit schreibt man für den Kommutator: ∂ = i. (4.122) x, −i ∂x Kapitel 5 Die Postulate der Quantenmechanik und erste Folgerungen In diesem Kapitel betrachten wir den abstrakten und formalen Rahmen der Quantenmechanik. Wir formulieren ihn in einer axiomatischen Form, obwohl das nicht unbedingt Standard ist. Ganz allgemein sollte ein axiomatischer Rahmen zu einem physikalischen Formalismus in der Physik folgende Konzepte spezifizieren: 1. Durch welche mathematische Struktur werden physikalische Zustände bzw. wird unser Wissen über den physikalischen Zustand eines Systems dargestellt? 2. Durch welche mathematische Struktur werden physikalische Observable dargestellt? 3. Wie gewinnt man aus einer Observablen und einem Zustand ein Ergebnis, das sich experimentell überprüfen lässt? 4. Durch welche Vorschriften kann man einem physikalischen System einen Zustand zuschreiben? (Woher weiß man, durch welches konkrete mathematische Element der in 1. genannten Struktur ein physikalisches System zu beschreiben ist?) 5. Wodurch wird die Zeitentwicklung eines physikalischen Systems beschrieben? Die Reihenfolge und Nummerierung der Postulate lehnen sich an das Lehrbuch von Grawert [36] an, die Formulierungen sind aber nicht damit identisch. Wir beginnen mit einer Aufzählung der Postulate der klassischen Mechanik, da diese allgemein vertraut sein dürfte, der axiomatische Zugang aber eher fremd ist. Außerdem können wir später leicht die Parallelen aufzeichnen. 87 88 Postulate der QM Die letzten Abschnitte dieses Kapitels beziehen sich auf allgemeine Folgerungen aus diesen Axiomen, beispielsweise die Unschärferelationen und das Konzept der Dichtematrizen. Was man wissen sollte In Anlehnung an die Forderungen, die wir an einen axiomatischen Rahmen für eine Theorie physikalischer Systeme gestellt haben, ergibt sich für die Quantentheorie folgender Formalismus: • Quantenmechanische Zustände werden durch die Strahlen in einem Hilbertraum dargestellt; oft dienen normierte Vektoren als Repräsentanten dieser Strahlen. Äquivalent kann man einen Zustand auch durch den (selbst-adjungierten) Projektionsoperator auf den Strahl des Zustands darstellen. • Observable werden durch selbstadjungierte Matrizen bzw. Operatoren auf dem Hilbertraum dargestellt. Zu jeder klassischen Observablen f (x, p) gehört die quantenmechanische Observable f (Q, P ). Diese Zuordnung zwischen klassischen und quantenmechanischen Observablen ist wegen der Nichtvertauschbarkeit der Operatoren nicht immer eindeutig. Für Q und P fordern wir die kanonischen Vertauschungsregeln [Q, P ] = i~. • Die Born’sche Regel besagt: Das Absolutquadrat des Skalarprodukts von zwei (normierten) Vektoren (Repräsentanten von Zuständen) |ϕi und |ψi ist die Wahrscheinlichkeit, bei einer Messung einer Observablen, welche den Zustand |ϕi als Eigenzustand hat, an einem im Zustand |ψi präparierten System, den Zustand |ϕi vorzufinden. Äquivalent kann man auch sagen, dass ein physikalischer Zustand |ψi auf der Menge der Observablen ein Erwartungswertfunktional definiert, welches den Erwartungswert dieser Observablen in diesem Zustand angibt: hψ|A|ψi. Experimentell bedeutet dies: Wenn man sehr viele physikalische Systeme im selben Zustand |ψi präpariert und an diesen Systemen die Messung der Observablen A vornimmt, dann ist hψ|A|ψi der Mittelwert, der sich aus den relativen Häufigkeiten der Messwerte ergibt. Die Eigenwerte einer Observablen A sind die möglichen Messwerte bei einer Einzelbeobachtung. Die kanonischen Vertauschungsregeln garantieren, dass die Erwartungswerte von Observablen die klassischen Bewegungsgleichungen erfüllen. • Die Eigenzustände einer Observablen zu einem Eigenwert geben an, durch welchen Zustand das physikalische System unmittelbar nach der Messung und der Feststellung des Messwerts zu beschreiben ist. Diese Eigenschaft erlaubt die Präparation von physikalischen Systemen in bestimmten Zuständen. Postulate der klassischen Mechanik 89 • Die zeitliche Entwicklung von Zuständen ist unitär und wird durch die zeitabhängige Schrödinger-Gleichung beschrieben. Sie besagt, dass der Generator der Zeitentwicklung gleich dem Hamilton-Operator des Systems ist. Äquivalent kann man auch die Zeitentwicklung den Observablen zuschreiben, die dann durch die Heisenberg’schen Bewegungsgleichungen ausgedrückt wird. Außerdem sollte man begründen können, weshalb man zwei Observable, deren zugehörige selbst-adjungierte Operatoren nicht kommutieren, nicht gleichzeitig messen kann. Für den Ort und Impuls gilt die Heisenberg’sche Unschärferelation ∆x · ∆p ≥ ~ , 2 (5.1) entsprechend gibt es auch eine Unschärferelation zwischen Zeit und Energie, ∆E · ∆t ≥ ~ , 2 (5.2) die jedoch nicht aus der Nicht-Vertauschbarkeit von Operatoren folgt sondern aus den Eigenschaften der Fourier-Transformation. Eine Dichtematrix ist eine positive, selbst-adjungierte, normierte Matrix, welche Gemische von Zuständen beschreibt. Ein Gemisch von Zuständen ist zu unterscheiden von der Superposition dieser Zustände: Bei Superpositionen handelt es sich um reine Zustände und man kann Interferenzen messen. Dichtematrizen beschreiben physikalische Gemische von Zuständen, bei denen keine Interferenzen zwischen diesen verschiedenen Zuständen auftreten. 5.1 Die Postulate der klassischen Mechanik In der klassischen Mechanik sind wir es nicht gewohnt, ein Axiomensystem anzugeben, aber es ist auch hier möglich. Damit der Schritt zur Quantenmechanik nicht zu groß ausfällt, sollen die Postulate der klassischen Mechanik kurz angedeutet werden. 5.1.1 1. Postulat — Zustände Der (reine) Zustand eines klassischen Systems (beispielsweise einer Menge von Punktteilchen) ist durch die Angabe der Orte und der Impulse gegeben. Für N Punktteilchen entspricht dies einem Punkt im 6N -dimensionalen Phasenraum. Man kann den Phasenraum auch als die Menge der möglichen Anfangsbedingungen“ für die Bewe” gungsgleichungen auffassen. (Anmerkung: Es gibt in der klassischen Mechanik auch so genannte gemischte“ Zustände, die Wahrscheinlicheitsverteilungen auf dem Phasen” raum entsprechen — mehr dazu in Abschnitt 5.9.) 90 Postulate der QM Postulat 1: Ein (reiner) klassischer Zustand kann durch einen Punkt (x, p) im Phasenraum P — dem Raum der Orte und Impulse — dargestellt werden. Dieses Postulat spezifiziert Axiom 1 für die klassische Mechanik. 5.1.2 2. Postulat — Observable Eine Observable ist etwas, das man an einem System beobachten kann. In der klassischen Mechanik sind beispielsweise die Energie, der Drehimpuls, die Koordinaten eines Teilchens oder auch seine Geschwindigkeitskomponenten Observable. Ganz allgemein schränkt der bekannte Wert einer Observablen den möglichen Zustand des Sytsems im Zustandsraum ein, im Idealfall legen die möglichen Observablen den Zustand fest. Postulat 2: Eine Observable f : P → R ist eine reellwertige Funktion auf dem Phasenraum. Dies entspricht Axiom 2 in unserem allgemeinen Rahmen. Der Wert der Observablen f an einem bestimmten Punkt (x, p) im Phasenraum, also f (x, p), ist gleichzeitig der Messwert, den eine Messung dieser Observablen in dem durch den Punkt beschriebenen Zustand ergeben würde. Das wird in der klassischen Mechanik nicht besonders betont, wird aber in der Übertragung auf die Quantenmechanik zu einem eigenen Axiom und entspricht in unserer allgemeinen axiomatischen Klassifikation dem Axiom 3. Zwei weitere Eigenschaften der klassischen Mechanik werden ebenfalls oft als selbstverständlich angenommen, sind aber in der Quantenmechanik nicht mehr erfüllt: (1) Eine Messung einer Observablen (letztendlich eine Messung von Ort und Impuls) verändert den Zustand des gemessenen Systems nicht. Zumindest wird angenommen, dass eine solche beliebig wenig invasive“ Messung immer durchgeführt werden kann. ” Damit ist gleichzeitig geklärt, woher wir wissen, welcher Zustand nach einer Messung vorliegt (Axiom 4 in unserem allgemeinen Rahmen). (2) Führt man dieselbe Messung an identisch präparierten Systemen (also Systemen im selben Zustand) aus, so erhält man immer denselben Messwert für eine Observable. Diese Eigenschaft klassischer reiner Zustände — bezüglich jeder beliebigen Observablen immer denselben Messwert zu liefern — bezeichnet man als Dispersionsfreiheit klassischer Zustände. Diese Aussage folgt schon aus der Festlegung, wie man bei gegebenem Zustand und gegebener Observablen den physikalischen Messwert dieser Observablen in diesem Zustand erhält (Axiom 3, s.o.). Für die Funktionen auf dem Phasenraum ist ein Produkt definiert, die sogenannte Poisson-Klammer: {f (q, p), g(q, p)} = ∂f (q, p) ∂g(q, p) ∂g(q, p) ∂f (q, p) − . ∂q ∂p ∂q ∂p (5.3) 1. Postulat – Darstellung von Zuständen 91 Die Poisson-Klammer bringt eine besondere Struktur der Hamilton’schen Mechanik zum Ausdruck, die mit der Form der Zeitentwicklung in der Mechanik zusammenhängt. 5.1.3 3. Postulat — Bewegungsgleichung Wir kennen in der klassischen Mechanik mehrere Formen von Bewegungsgleichungen. Die bekannteste (und auch allgemeinste) ist die Newton’sche Bewegungsgleichung: mẍ(t) = F (x(t), ẋ(t)) . (5.4) Allgemein kann die Kraft eine Funktion sowohl der Orte als auch der Geschwindigkeiten bzw. Impulse von Teilchen sein; beispielsweise hängt die Lorenz-Kraft für ein geladenes Teilchen in einem Magnetfeld von dessen Geschwindigkeit ab. Die Kraft ist also eine Funktion auf dem Phasenraum (und damit im Sinne unserer Axiome eine Observable). Die für unsere Zwecke wichtigste Darstellung der Bewegungsgleichungen sind die Hamilton’schen Bewegungsgleichungen: ṗ = − ∂H(q, p) ∂q und q̇ = ∂H(q, p) , ∂p (5.5) wobei H(q, p) die Energie (ausgedrückt durch Orts- und Impulsvariable) ist. Aus ihnen ergibt sich für die Zeitentwicklung einer Observablen (ausgedrückt durch die PoissonKlammer): df (q, p) = {f (q, p), H(q, p)} . (5.6) dt Diese Bewegungsgleichungen bilden somit das Axiom 5 in unserem allgemeinen Formalismus. 5.2 1. Postulat der Quantenmechanik: Darstellung von Zuständen In Kapitel 5.9 werden wir nochmals allgemeiner auf den Begriff des Zustands eingehen. Bei einem reinen Zustand denkt man gerne an das, was ist“. Streng genommen sollte ” man aber eher an unser Wissen über ein System denken. Ein reiner Zustand entspricht somit einer maximalen“ Kenntnis über ein System, die sich – zumindest soweit die ” Theorie es zulässt – nicht weiter verfeinern lässt. Dieses Wissen beruht meist auf einer Kenntnis der Vergangenheit. Wie wir im Rahmen der Quantenmechanik zu dieser Kenntnis gelangen können, ist Gegenstand des 4. Axioms. Eine der überraschenden Erkenntnisse im Zusammenhang mit atomaren Systemen war die experimentelle Feststellung, dass es Superpositionen von Zuständen geben 92 Postulate der QM kann, die wiederum realisierbare Zustände darstellen. Daher liegt es nahe, quantenmechanische Zustände zunächst durch Vektoren in einem Vektorraum darzustellen. Wir hatten am Beispiel der Polarisationen gesehen, dass sich der Polarisationszustand eines Photons durch einen Vektor beschreiben lässt. Genauer gesagt war jedoch der Vektor nur ein Repräsentant für den Polarisationszustand, denn eigentlich ist es nur die Richtung des Vektors, und diese sogar bis auf ein Vorzeichen, welche den Polarisationszustand charakterisiert. Denken wir an einen Filter als ein System zur Präparierung von Zuständen, dann ist es nur die Polarisationsachse, welche die Polarisationseigenschaft des Photons festlegt. Diese Achse ist ein 1-dimensionaler Unterraum. Wir haben also mehrere Möglichkeiten, einen quantenmechanischen Zustand darzustellen. Das erste Postulat besitzt daher mehrere Formulierungen. Postulat 1: Ein quantenmechanischer Zustand kann durch einen normierten Vektor in einem Hilbertraum dargestellt werden. Normiert“ bedeutet hier auf 1 normiert“. Der Grund, dass man als Re” ” präsentaten einen normierten Vektor wählt, liegt in der Wahrscheinlichkeitsinterpretation, die man der Norm eines Vektors bzw. dem Absolutquadrat von Skalarprodukten zuschreiben möchte, wie es im 3. Postulat ausgedrückt wird. Um bei den Ausdrücken für die Wahrscheinlichkeiten nicht immer durch die Norm der Vektoren dividieren zu müssen, beschränkt man sich bei der Darstellung quantenmechanischer Zustände durch Vektoren meist auf normierte Vektoren. Durch die Normierung ist der Vektor noch nicht eindeutig festgelegt. Schon im reellen Fall hatten wir bei den Polarisationen gesehen, dass ~x und −~x denselben Polarisationszustand beschreiben. Bei komplexen Vektoren, können wir einen Vektor sogar mit einer beliebigen komplexen Phase (eiα ) multiplizieren, ohne an der Norm etwas zu ändern. Zwei normierte Vektoren, die sich nur um eine Phase unterscheiden, entsprechen somit demselben Zustand. Wie mehrfach erwähnt, handelt es sich bei den normierten Vektoren nur um Repräsentanten von Zuständen. Eigentlich entspricht einem Zustand ein 1-dimensionaler linearer Unterraum des Hilbertraums. Postulat 10 : Ein quantenmechanischer Zustand kann durch einen (komplex) 1-dimensionalen linearen Unterraum (einen Strahl) eines Hilbertraums dargestellt werden. Diese Definition ist unserer Vorstellung vom Polarisationszustand als durch die Polarisationsachse des präparierenden Filters gegeben am nächsten. Schließlich haben wir gesehen, dass wir einen 1-dimensionalen linearen Unterraum auch durch den Projektionsoperator auf diesen Unterraum beschreiben können. Zwischen den Strahlen im Hilbertraum und den selbst-adjungierten Projektionsoperatoren mit der Spur 1 besteht eine eineindeutige Beziehung: 2. Postulat – Darstellung von Observablen 93 Postulat 100 : Ein quantenmechanischer Zustand kann durch einen 1-dimensionalen (selbst-adjungierten) Projektionsoperator dargestellt werden. Für konkrete Rechnungen verwendet man meist Vektoren, in manchen Fällen auch Projektionsoperatoren. Für eine geometrische Anschauung bietet sich das Bild der Strahlen an. Mathematisch entsprechen die drei Postulate folgenden Strukturen: 1 Sei |ψi ein (normierter) Vektor des Hilbertraums, dann dient dieser als Repräsentant eines Zustands. Da sich die Normierung bei der Multiplikation mit einer Phase nicht ändert, ist der Repräsentant nicht eindeutig definiert. 1’ Der Strahl besteht aus allen komplexen Vielfachen eines (vom Nullvektor verschiedenen) Vektors, also beispielsweise Strahl(ψ) = {λ|ψi|λ ∈ C} (5.7) 1” Der (selbstadjungierte) Projektionsoperator Pψ projiziert einen beliebigen Vektor (senkrecht) auf den durch |ψi definierten Strahl und ist für normierte Vektoren durch Pψ = |ψihψ| (5.8) gegeben. Welchen Vektor bzw. Strahl bzw. Projektionsoperator man in einem konkreten Fall für ein System verwendet, hängt von der Präparation des Systems (und damit von unserem Vorwissen über das System) ab. Dieser Zusammenhang wird in Postulat 4 geklärt. 5.3 2. Postulat der Quantenmechanik: Darstellung von Observablen Eine strenge und allgemeine Definition des Begriffs der Observablen“ ist kaum möglich. ” Lax ausgedrückt handelt es sich bei einer Observablen um die mathematische Repräsentation von etwas, das man an einem System beobachten kann. In jedem Fall sollte man den Begriff der Observablen vom Begriff der Messung“ ” unterscheiden: Eine Messung besteht in einem experimentellen Aufbau und einem experimentellen Protokoll, das angibt, wie das Experiment durchzuführen ist. Meist wird ein zu beobachtendes System mit einem anderen System (dem Messgerät) in Kontakt gebracht, sodass man aus der Reaktion des Messgeräts eine Information über das untersuchte System erhält. 94 Postulate der QM Ich definiere den Begriff der Observablen folgendermaßen: Eine Observable ist eine mathematische Beschreibung der möglichen Informationen, die bei einem bestimmten Messprozess gewonnen werden können. Insbesondere beschreibt eine Observable nicht die Dynamik des Messprozesses selbst. In der klassischen Mechanik gibt die Observable lediglich den Messwert an, den man bei einer Messung der zugehörigen Messgröße für einen konkreten Zustand erhält (für einen Zustand (q, p) also die Größe f (q, p)). Sie beinhaltet keine Beschreibung des Messprotokolls oder des Messprozesses, sondern lediglich die gewonnene Information. Entsprechend suchen wir nun in der Quantenmechanik nach einer Kodierung der Information, die wir bei der Durchführung einer konkreten Messung über ein System erhalten bzw. erhalten können. Die folgenden Erfahrungstatsachen der Quantenmechanik müssen dabei berücksichtigt werden: 1. Die meisten Messungen, die an einem System durchgeführt werden, verändern den Zustand des Systems. Dies haben wir schon bei den Polarisationsexperimenten (Kap. 2.2) gesehen. Die Väter der Quantenmechanik“(Bohr, Heisenberg, etc.) glaubten zunächst, eine ” richtige Wechselwirkung mit einer Energie- und/oder Impulsübertragung zwischen Messinstrument und Quantensystem sei dafür verantwortlich. Wie schon die Beispiele mit Photonen und Polarisationsfiltern gezeigt haben, hat jedoch keine Wechselwirkung in diesem klassischen Sinne zwischen dem Photon und dem Polarisationsfilter stattgefunden, wenn das Photon den Filter passiert hat. Trotzdem hat sich der Zustand des Photons verändert. Wir werden auf diesen Punkt noch eingehen. 2. Werden an zwei identisch präparierten Systemen, also an Systemen im selben Zustand, dieselben Messungen durchgeführt, erhält man nicht immer dieselben Messergebnisse. Auch diesen Sachverhalt haben wir schon bei Photonen und Polarisationsfiltern beobachten können: Ein Photon, das einen horizontalen Filter (h-Filter) passiert hat, besitzt eine bestimmte Polarisationseigenschaft, die eindeutig ist und nicht weiter verfeinert werden kann. (Diesen Punkt müssen wir im Augenblick einfach akzeptieren, wir werden aber darauf zurückkommen.) Trotzdem steht nicht fest, ob ein solches Photon einen Filter beispielsweise unter 45◦ passiert. Die Wahrscheinlichkeit dafür ist 50%. 3. Eine Messung zwingt“ ein System in einen möglichen Zustand aus einem Satz ” von orthogonalen Zuständen (die Schrödinger’sche Prokrustie“). ” 2. Postulat – Darstellung von Observablen 95 Dies ist eine Extrapolation aus unserer Erfahrung mit Polwürfeln. Ein Polwürfel definiert zwei orthogonale Polarisationsrichtungen. Ein einfallendes Photon wird in eine dieser beiden Richtungen gezwungen“. Wir können die Polarisations” richtungen zwar beliebig wählen, aber für eine gegebene Messanordnung liegen die beiden orthogonalen Möglichkeiten fest. 4. Wurde an einem System eine Messung durchgeführt, und wird dieselbe Messung unmittelbar danach nochmals durchgeführt, erhält man auch dasselbe Ergebnis ( Kleingedrucktes“ siehe das Folgende). ” Das Kleingedruckte“ bezieht sich auf den Ausdruck unmittelbar danach“. Be” ” trachten wir zunächst den einfachen Fall, dass die Eigenschaft, die bei dieser Messung geprüft wird, eine Erhaltungsgröße ist, sich also durch die Dynamik des Systems nicht verändert. In diesem Fall bedeutet unmittelbar danach“ le” diglich, dass zwischen der ersten und der zweiten Messung keine andere Messung einer anderen Observablen durchgeführt wird. Auch diese Eigenschaft ist uns bei den Photonen und Polarisationsfiltern schon begegnet: Da die freie Wellenausbreitung die Polarisationseigenschaften von elektromagnetischen Wellen nicht verändert, können wir beliebig viele Filter mit parallelen Polarisationsachsen hintereinander stellen. Sofern ein Photon den ersten Filter passiert hat, passiert es auch alle anderen Filter. Wird aber ein Filter mit einer anderen Polarisationsachse dazwischen geschoben, ist das nicht mehr garantiert. Der kritische Fall tritt auf, wenn die Dynamik des Systems die gemessene Eigenschaft verändert, wenn sich also diese Eigenschaft schon durch die reine Zeitentwicklung des Systems verändert. In diesem Fall bedeutet unmittelbar danach“, ” dass die Messung innerhalb eines Zeitfensters ∆t ein zweites Mal durchgeführt wird, wobei ∆t so klein sein soll, dass die Dynamik auf die geprüfte Eigenschaft noch keinen nennenswerten Einfluss hat (und nennenswert“ im Sinne ” einer angestrebten Messgenauigkeit zu verstehen ist). Da aber Messungen selbst Zeit in Anspruch nehmen (wir werden später sehen, dass eine Energiemessung in Abhängigkeit von der angestrebten Genauigkeit einer Unschärferelation unterliegt, die eine untere Grenze an die Zeitdauer einer solche Messung setzt), und andererseits sich manche Eigenschaften aufgrund der Dynamik sehr rasch verändern können, handelt es sich bei dieser Aussage um eine Extrapolation, die aus den Fällen gewonnen wurde, an denen eine Überprüfung möglich ist. Bisher gibt es jedoch keinen Grund, an der Richtigkeit dieses Sachverhalts zu zweifeln. Aus dem Gesagten können wir eine Wunschliste“ zusammenstellen, die wir an ” die mathematische Darstellung einer Observablen stellen wollen bzw. stellen können. 1. Die mathematische Repräsentation einer Observablen sollte die Information enthalten, welche möglichen Messwerte man überhaupt bei einer Messung erhalten 96 Postulate der QM kann. 2. Die mathematische Repräsentation einer Observablen sollte die Information enthalten, in welchem Zustand sich ein System befindet, nachdem ein bestimmter Messwert gemessen wurde. Dieser Zustand sollte die Eigenschaft haben, durch eine weitere Messung derselben Observablen nicht mehr verändert zu werden. 3. Die Observable sollte uns zumindest erlauben zu berechnen, mit welcher Wahrscheinlichkeit wir bei einer Messung an einem bestimmten Zustand einen bestimmten Messwert erhalten. 4. Wir sollten zumindest für die aus der klassischen Physik bekannten Observablen (Ort, Impuls, Energie, Drehimpuls, ...) wissen, durch welche mathematische Objekte sie repräsentiert werden. Diese Forderung setzt voraus, dass die klassischen Observablen in der Quantentheorie in einem zu beschreibenden Sinne ihre Bedeutung behalten. Wir werden nun das Postulat angeben, das die Darstellung der Observablen in der Quantenmechanik festlegt. Die einzelnen oben angesprochenen Punkte (welche Messwerte möglich sind, welcher Zustand nach einer Messung vorliegt, etc.) werden von den späteren Postulaten geklärt. Postulat 2: Eine Observable wird in der Quantenmechanik durch einen selbst-adjungierten Operator dargestellt. Soweit möglich, sollen die klassischen Beziehungen zwischen Observablen, wie sie durch die Poisson-Klammer gegeben sind, in der Quantenmechanik erhalten bleiben, wobei die Poisson-Klammer {·, ·} durch den Kommutator i~[·, ·] zu ersetzen ist. Insbesondere sollen für die Ortsoperatoren Qi und die Impulsoperatoren Pi (der Index bezieht sich auf die drei Komponenten zu einem Teilchen) die sogenannten kanonischen Vertauschungsrelationen gelten [Qi , Pj ] = i~ 1 δij , [Qi , Qj ] = 0 , [Pi , Pj ] = 0 . (5.9) (5.10) Zu diesem Postulat gibt es zunächst einige Anmerkungen: 1. Die Forderung, dass die klassischen Poisson-Klammern in Kommutatorbeziehungen übergehen sollen, impliziert, dass eine klassische Observable f (q, p) (als Funktion auf dem Phasenraum) im Wesentlichen durch einen Operator F (Q, P ) repäsentiert wird, dessen funktionale Abhängigkeit von den Operatoren Q und P dieselbe ist, wie die klassische Abhängigkeit von f als Funktion von q und p. Im ” 2. Postulat – Darstellung von Observablen 97 Wesentlichen“ deutet eine Einschränkung an, die mit der Reihenfolge von Operatoren zusammenhängt und im nächsten Punkt erläutert wird. Insbesondere ist also der Energieoperator durch H= 1 2 P + V (Q) 2m (5.11) gegeben, und die Komponenten des Drehimpulsoperators durch L1 = Q2 P3 − Q3 P2 , L2 = Q3 P1 − Q1 P3 , L3 = Q1 P2 − Q2 P1 . (5.12) Man überzeugt sich leicht, dass es hier keine Probleme mit der Reihenfolge der Operatoren gibt. 2. Seltsam für ein Postulat erscheint der Ausdruck soweit möglich“. Es wird ge” fordert, dass die Beziehung zwischen den Poisson-Klammern und den Observablen für die Orts- und Impulsoperatoren erfüllt ist. Man kann sich leicht überzeugen, dass sie dann auch für die Kommutatoren mit den Energieoperatoren für die bekanntesten Systeme und die Drehimpulsoperatoren gelten. Man kann jedoch zeigen (dies ist der Inhalt des sogenannten Groenewald-van Hove-Theorems; siehe z.B. [37]), dass dieses Verfahren nicht streng durchgehalten werden kann. Das Problem ist, dass beispielsweise klassische Observable der Form q 2 p2 nicht einfach durch Q2 P 2 ersetzt werden können, dieses Produkt wäre nämlich nicht selbst-adjungiert. Es gibt jedoch mehrere (klassisch äquivalente) selbst-adjungierte Ersetzungsmöglichkeiten: 21 (Q2 P 2 + P 2 Q2 ), QP 2 Q, P Q2 P , 1 (Q2 P 2 + QP QP + QP 2 Q + P QP Q + P 2 Q2 + P Q2 P ) etc. Da Q und P nicht 6 kommutieren, handelt es sich um verschiedene Operatoren. Durch welchen soll also die klassische Funktion q 2 p2 ersetzt werden? Es zeigt sich, dass keine Ersetzungsvorschrift beliebiger klassischer Polynome in q und p durch Polynome in Q und P zu einer exakten Übertragung von Poisson-Klammern in KommutatorKlammern führt. Die Unterschiede sind zwar immer proportional zu ~ oder gar ~2 und damit quantenmechanischer Natur“, aber sie bringen eine Mehrdeutigkeit ” ins Spiel, die sich grundsätzlich nicht vermeiden lässt. 3. Weshalb sollte man überhaupt fordern, dass die klassische Poisson-Klammer etwas mit dem Kommutator zu tun hat? Heisenberg hatte zunächst die Kommutatorrelationen für den Ort- und Impulsoperator aus semi-empirischen Überlegungen gewonnen. Später erkannte Dirac, dass es sich hierbei um die Ersetzung der klassischen Poisson-Klammern durch Kommutatorrelationen handelt. Einer der Gründe für die Ersetzung ist, dass unter diesen Umständen ein Korrespondenzprinzip gilt, d.h., bis auf Korrekturen von ~ erfüllen die Erwartungswerte quantenmechanischer Observablen die klassischen Bewegungsgleichungen. Damit 98 Postulate der QM ist garantiert, dass in einem klassischen Grenzfall (wenn die relevanten Wirkungen sehr groß im Vergleich zur Planck’schen Konstante sind) die so konstruierte Quantenmechanik wieder in die klassische Mechanik übergeht. Wie dieser klassische Grenzfall aussieht, werden wir noch sehen. 4. Abgesehen vom ersten Satz (Observable werden durch selbst-adjungierte Operatoren dargestellt) macht dieses Axiom keine Aussage über die Darstellung von Observablen, die es in der klassischen Physik gar nicht gibt, beispielsweise Observable zum Spin. Offenbar sind mit dem Spin eines Teilchens beobachtbare Größen verbunden, sodass auch diese durch selbst-adjungierte Operatoren repräsentiert werden. Die genaue Form dieser Repräsentation werden wir in Kap. 9 noch sehen. 5. In der klassischen Physik können wir praktisch jede Funktion f (q, p) auf dem Phasenraum als Observable definieren und wir können auch angeben, wie man diese Observable messen kann: Man messe die Orte q und die Impulse p und bilde dann aus den Messdaten die Funktion f (q, p). In der Quantenmechanik sind mit der Definition der Observablen einige Probleme verbunden. Zunächst kann man, wie wir noch sehen werden, den Ort und den Impuls eines quantenmechanischen Systems nicht gleichzeitig messen. Das gilt ganz allgemein für zwei Observable, die nicht miteinander kommutieren. Das bedeutet aber auch, dass wir die Observable zu einem Operator F (Q, P ) nicht dadurch messen können, dass wir eine Orts- und Impulsmessung vornehmen und dann die Funktion der Messwerte bilden. In der Quantenmechanik hat jede Observable eine ihr eigene Messvorschrift. Wir bestimmen die Energie H(Q, P ) nicht durch Q- und P -Messungen, sondern beispielsweise über die Beobachtung von Spektrallinien etc. Damit verbunden sind zwei Schwierigkeiten: (1) Für eine Observable F (Q, P ) in der Quantenmechanik ist im Allgemeinen nicht bekannt, wie die zugehörige Messgröße bestimmt werden kann. Es wird zwar behauptet, dass sie messbar ist, der Formalismus macht aber keine Aussagen darüber, wie eine solche Messanordnung und ein Messprotokoll aussehen. (2) Eng damit verbunden ist die Frage, ob tatsächlich jeder selbst-adjungierte Operator F (Q, P ) einer Observablen entspricht. Dieses Postulat stammt von Dirac und gehörte nicht zur ursprünglichen Formulierung der Quantenmechanik. Allgemein gilt es immer noch als umstritten und in bestimmten Fällen sind sogar Einschränkungen bekannt (beispielsweise, wenn sogenannte Superauswahlregeln existieren). 5.4. 3. POSTULAT DER QUANTENMECHANIK:MESSWERTE UND ERWARTUNGSWERTE99 5.4 3. Postulat der Quantenmechanik: Messwerte und Erwartungswerte Bisher haben wir festgelegt, durch welche mathematischen Objekte quantenmechanische Zustände und quantenmechanische Observable dargestellt werden. Nun müssen wir angeben, was man bei einer Messung einer bestimmten Observablen an einem System in einem bestimmten quantenmechanischen Zustand zu erwarten hat. Postulat 3: (a) Die möglichen Messwerte {λi } einer Observablen sind die Eigenwerte (genauer das Spektrum, siehe S. 73) des selbst-adjungierten Operators A, der diese Observable darstellt. (b) Die Wahrscheinlichkeit wψ (λi ), mit der ein bestimmter Eigenwert λi einer Observablen A in einem Zustand ψ (dargestellt durch einen normierten Vektor |ψi) gemessen wird, ist gleich wψ (λi ) = hψ|Pλi |ψi , (5.13) wobei Pλi der Projektionsoperator auf den Eigenraum von A zum Eigenwert λi ist. Ist der Eigenwert λi nicht entartet und |λi i der zugehörige Eigenvektor, ist diese Wahrscheinlichkeit durch |hλi |ψi|2 gegeben. Auch zu diesem Postulat sind mehrere Anmerkungen angebracht: 1. Der erste Teil des Postulats (a) macht eine Aussage zu den möglichen Messwerten, d.h., den Zahlen, die konkret bei einer einzelnen Messung (egal an welchem System, sofern die Messung überhaupt sinnvoll ist) zu erwarten sind. Eine Einzelmessung liefert als Ergebnis somit immer einen der Eigenwerte des zugehörigen Operators. Ob eine Messung sinnvoll ist, hängt von dem System ab, nicht von dem Zustand, in dem sich das System befindet. Es wird also nie passieren, dass beispielsweise die Messung eines Orts für ein Teilchen kein Ergebnis liefert, selbst wenn für den Quantenzustand der Ort nicht eindeutig gegeben ist. 2. Wie schon erwähnt, haben selbst-adjungierte Operatoren immer ein reelles Spektrum, d.h., die möglichen Messwerte sind reell. 3. Der zweite Teil des Postulats (b) ist die Born’sche Regel. An dieser Stelle kommt die Interpretation bestimmter mathematischer Größen im Sinne von Wahrscheinlichkeiten in die Quantenmechanik. Die Quantenmechanik kann eigentlich nur Vorhersagen zu diesen Wahrscheinlichkeiten machen, und diese lassen sich (sofern es sich nicht um 100%-Aussagen handelt) nur durch wiederholte Messungen an sehr vielen (gleichartig) im Zustand |ψi präparierten Systemen (für jedes System nur eine Messung) überprüfen. 100 Postulate der QM 4. Ist |ψi (oder entsprechend auch |λi i) kein normierter Eigenvektor, muss durch die Norm dividiert werden, d.h., es gilt: wψ (λi ) = |hλi |ψi|2 . hλi |λi ihψ|ψi (5.14) Dadurch ist diese Wahrscheinlichkeit auf den Strahlen zu einem Vektor definiert und hängt nicht mehr von der konkreten Wahl des Repräsentaten des Strahls ab. Man kann sich davon leicht überzeugen, indem man |ψi und |λi i mit beliebigen komplexen Zahlen multipliziert und zeigt, dass die Wahrscheinlichkeit nicht von diesen Zahlen abhängt. Es handelt sich also um eine Wahrscheinlichkeit, die auf den linearen Unterräumen des Hilbertraums definiert ist. Man beachte auch, dass diese Wahrscheinlichkeit in den beiden Zuständen symmetrisch ist: wψ (λi ) = |hλi |ψi|2 = wλi (ψ) . (5.15) Auch wenn diese Bedingung unmittelbar aus den Postulaten folgt, ist sie physikalisch nicht ganz selbstverständlich: Weshalb sollte die durch eine Messung bewirkte Übergangswahrscheinlichkeit |ha|bi|2 von einem Zustand |ai in einem Zustand |bi dieselbe sein, wie umgekehrt von |bi nach |ai. Bei den beiden Prozessen handelt es sich um unterschiedliche Messungen, und die Systeme wurden in verschiedenen Zuständen präpariert. Damit zusammenhängend ist auch, dass die Wahrscheinlichkeit gar nicht von den Observablen selbst abhängt, sondern nur von den beiden Zuständen. 5. Angenommen, |ψi sei schon einer der Eigenzustände des Operators, beispielsweise zum Eigenwert λk (für den Augenblick sei dieser nicht entartet). Dann gilt |hλi |λk i|2 = δik . D.h., die Wahrscheinlichkeit, im Zustand |λk i den Eigenwert λk zu messen, ist 1 und die Wahrscheinlichkeit einen anderen Eigenwert zu messen ist 0. In diesem Fall (und nur in diesem Fall) ist der Zustand bezüglich einer Messung der Observablen A dispersionsfrei (man sagt auch nicht dispersiv), d.h., er zeigt keine Streuung in den Messwerten bei wiederholten Messungen. Das zeigt gleichzeitig, dass jeder Eigenwert von A unter geeigneten Umständen auch tatsächlich als Messwert auftritt (sofern man den zugehörigen Eigenvektor als Zustand präparieren kann). 6. Aus dem Postulat kann man ableiten, dass der Ausdruck hψ|A|ψi gleich dem Erwartungswert für die Messergebnisse von A an Systemen im Zustand |ψi ist. Aus der Spektraldarstellung von A A= X i λ i Pλ i (5.16) 3. Postulat – Messwerte und Erwartungswerte 101 folgt nämlich: hψ|A|ψi = X λi hψ|Pλi |ψi = i X λi wψ (λi ) . (5.17) i Dieser Ausdruck ist aber gerade die Definition des Erwartungswerts für Messungen mit möglichen Messwerten {λi } und zugehörigen Wahrscheinlichkeiten wψ (λi ). 7. Wir können in Gleichung 5.13 noch einen Schritt weitergehen und auch den Zustand ψ durch seinen Projektionsoperator ausdrücken: wψ (λi ) = Spur Pλi Pψ (5.18) Auf diese Weise erhalten wir eine alternative Darstellung für den Erwartungswert von einer Observablen A im Zustand ψ: X (5.19) hψ|A|ψi = Spur APψ = λi Spur Pλi Pψ . i Das Postulat 3, insbesondere der zweite Teil (b), also die Born’sche Regel, gehört zu den umstrittendsten Aspekten der Quantentheorie. Dabei geht es weniger darum, dass dieses Postulat nicht anerkannt wird, als darum, in welchem Sinne hier Wahrscheinlichkeit zu verstehen ist. In der klassischen Physik bringen wir das Konzept der Wahrscheinlichkeit immer dann ins Spiel, wenn gewisse Dinge nicht bekannt oder irrelevant sind. Es wird angenommen, dass man im Prinzip zu einer eindeutigen Aussage gelangen könnte, sofern die Einzelheiten in Bezug auf die betreffende Situation hinreichend bekannt wären (dies bezeichnet man auch als das Prinzip des hinreichenden Grundes von Leibniz), dass aber aus praktischen Gründen diese Einzelheiten nicht berücksichtigt werden oder werden können und daher nur Wahrscheinlichkeitsaussagen getroffen werden. Im herkömmlichen quantenmechanischen Formalismus handelt es sich bei dieser Wahrscheinlichkeit um eine intrinsische oder inhärente Wahrscheinlichkeit (manchmal spricht man auch von einer objektiven Wahrscheinlichkeit oder einer ontologischen Wahrscheinlichkeit). Es ist nicht Unkenntnis auf Seiten des Physikers, die diese Wahrscheinlichkeitsaussagen erzwingen, sondern die Quantentheorie ist eine intrinsisch indeterministische Theorie. Es gibt keine Möglichkeit, das Ergebnis einer konkreten Messung an einem konkreten Zustand (sofern es sich nicht um einen Eigenzustand handelt) vorherzusagen. Oft wurde versucht, diesen Aspekt der Quantenmechanik durch Einführung sogenannter verborgener Variable — also Variable, die wir bisher nicht beobachten können und die in der Quantenmechanik auch nicht berücksichtigt werden — auf eine klassische Statistik“ zurückzuführen. Allerdings kann man für solche Modelle ” sehr restriktive Einschränkungen beweisen (siehe Kap. 8.4 und 8.4.2). 102 Postulate der QM Es ist auch dieses Postulat, dass die Quantenmechanik zu einer nicht-deterministischen Theorie macht. Im Allgemeinen kann das Ergebnis einer Einzelmessung prinzipiell nicht vorhergesagt werden, ist also indeterminiert. 5.5 4. Postulat der Quantenmechanik: Die Reduktion des Quantenzustands Das vierte Postulat legt fest, durch welchem Zustand ein quantenmechanisches System nach einer Messung zu beschreiben ist. Postulat 4: Wurde an einem quantenmechanischen System im Zustand |ψi eine Messung einer Observablen A durchgeführt und ergab diese Messung den Messwert λi , so befindet sich das System nach der Messung in dem quantenmechanischen Zustand |λi i = Pλi |ψi . kPλi |ψik (5.20) Anmerkungen: 1. Der im ersten Augenblick kompliziert erscheinende Ausdruck mit dem Projektionsoperator Pλi ist nur relevant, wenn λi entartet ist. Dann entspricht der Zustand nach der Messung nämlich der orthogonalen Projektion des ursprünglichen Zustands |ψi auf den Eigenraum zu λi . Ist λi nicht entartet, können wir vereinfacht sagen: Nach einer Messung, die den Messwert λi geliefert hat, ordnen wir dem System den Eigenzustand |λi i zu. 2. Dieses Postulat ist gleichzeitig eine Anweisung, wie ein konkreter Quantenzustand zu präparieren ist. Bisher wurde zwar vorausgesetzt, dass es bestimmte Quantenzustände gibt und wie wir daran Messungen vornehmen können, es wurde aber noch nicht geklärt, wie man einen bestimmten Quantenzustand tatsächlich realisiert, bzw. woher man weiß, in welchem Quantenzustand sich ein System befindet. Um einem Quantensystem einen bestimmten Zustand (als Strahl in einem Hilbertraum) zuweisen zu können, müssen wir die Vergangenheit des Systems betrachten (also welche Messungen an dem System zuletzt durchgeführt wurden und welche Messergebnisse dabei aufgetreten sind). Daraus lässt sich der Zustand des Systems erschließen. 3. Das Postulat beschreibt einen Teil der Dynamik eines Quantenzustands, d.h., es besagt, wie sich ein Quantenzustand unter einer Messung verändert. Diese 5. Postulat – Dynamik abgeschlossener Systeme 103 Dynamik ist statistisch: Da wir nur Wahrscheinlichkeitsaussagen darüber treffen können, welcher Eigenwert eines Operators bei einer Messung tatsächlich gemessen wird, können wir auch nur eine Wahrscheinlichkeitsaussage darüber treffen, durch welchen Zustand das System nach einer Messung zu beschreiben sein wird. Man bezeichnet die Aussage dieses Postulats auch schon mal als Kollaps der Wellenfunktion oder Reduktion des Quantenzustands. 5.6 5. Postulat der Quantenmechanik: Die Dynamik abgeschlossener Systeme Dieses Postulat beschreibt die Dynamik eines abgeschlossenen Quantensystems, d.h., eines Quantensystems, das nicht mit der Umgebung (oder einem Messgerät) in Wechselwirkung steht. Postulat 5: Die zeitliche Entwicklung eines reinen Zustands eines abgeschlossenen quantenmechanischen Systems folgt der zeitabhängigen Schrödinger-Gleichung: d|ψ(t)i = H|ψ(t)i , dt wobei H der Hamilton-Operator des Systems ist. i~ (5.21) Auch wenn sich die Schrödinger-Gleichung nicht beweisen lässt, können wir sie im Rahmen des hier vorgestellten Formalismus zumindest plausibel machen: Wenn normierte Zustände unter der Zeitentwicklung wieder in normierte Zustände übergehen sollen, also hψ(t)|ψ(t)i = hψ(0)|ψ(0)i , (5.22) und die Zeitentwicklung außerdem die lineare Struktur der Zustände erhalten soll (also eine lineare Abbildung ist), muss sie durch eine unitäre Transformation beschrieben werden (vgl. Abschnitt 4.2.5): |ψ(t)i = U (t)|ψ(0)i . (5.23) Für diesen Zeitentwicklungsoperator sollte die Halbgruppeneigenschaft gelten: U (t2 )U (t1 ) = U (t1 + t2 ) , (5.24) denn die Zeitentwicklung zunächst um t1 und anschließend nochmals um t2 sollte der Zeitentwicklung um t1 + t2 entsprechen. (Hier nehme ich eine allgemeine Zeittranslationsinvarianz an, aber die Gleichung gilt auch allgemeiner.) Verlangen wir zusätzlich noch eine Stetigkeit in t, gibt es zu dieser Gleichung nur die Lösung U (t) = e−iΩt , (5.25) 104 Postulate der QM mit einem geeigneten (selbst-adjungierten) Operator Ω. Damit folgt für |ψ(t)i eine Differentialgleichung der Form d |ψ(t)i = Ω|ψ(t)i . (5.26) dt Bleibt noch zu klären, weshalb H = ~Ω der Energieoperator sein soll. Dazu gibt es mehrere Begründungen: i - Auch in der klassischen Physik lässt sich die Energie (als Funktion von q und p) bzw. die Hamilton-Funktion als Generator von Zeittranslationen interpretieren. Manchmal wird Energie sogar auf diese Weise definiert. Daher liegt es nahe, auch in der Quantentheorie den Generator der Zeittranslation als Energie zu bezeichnen. - Der Operator Ω entspricht der Observable möglicher Frequenzmessungen. Ein Eigenzustand von Ω mit Eigenwert ω hat die Zeitabhängigkeit e−iωt . Nach der Beziehung von deBroglie stehen die Energie E und die Frequenzen aber gerade über E = ~ω in Beziehung. - Es zeigt sich, dass bei der Interpretation von H als Energieoperator die Quantenmechanik im Grenzfall makroskopischer Systeme in die klassische Physik übergeht (siehe Anmerkung 4). Anmerkungen: 1. Die Schrödinger-Gleichung ist eine lineare Differentialgleichung für die Zustandsvektoren. Das impliziert Zweierlei: (1) Mit jeder Lösung |ψ(t)i ist auch ein Vielfaches α|ψ(t)i eine Lösung, d.h., es handelt sich um eine Differentialgleichung für die Strahlen im Hilbertraum, also die eigentlichen physikalischen Zustände; (2) Mit je zwei Lösungen |ψ1 (t)i und |ψ2 (t)i ist auch eine beliebige Superposition |ψ(t)i = α|ψ1 (t)i + β|ψ2 (t)i (5.27) eine Lösung der Schrödinger-Gleichung und repräsentiert (eventuell nach geeigneter Normierung) einen physikalischen Zustand. Historisch war die Entwicklung eher umgekehrt: Als man erkannte, dass die Schrödinger-Gleichung eine lineare Gleichung ist und für die Lösungen ein Superpositionsprinzip gilt, entstand die Vorstellung, dass sich quantenmechanische Zustände als Elemente eines Vektorraums darstellen lassen. 2. Der unitäre Zeitentwicklungsoperator U (t) erfüllt selbst eine Schrödinger-Gleichung: dU (t) = HU (t) . (5.28) i~ dt 6. Postulat – Mehrteilchensysteme 105 Zusammen mit der Anfangsbedingung“ U (0) = 1 kann man so den Zeitentwick” lungsoperator bestimmen (siehe Abschnitt 7.1). 3. Die Schrödinger-Gleichung beschreibt eine Zeitabhängigkeit der Zustandsvektoren. Dies bezeichnet man auch als Schrödinger-Bild der Quantenmechanik. Bilden wir den Erwartungswert einer Observablen A im Zustand |ψ(t)i (d.h., wir verfolgen den Erwartungswert als Funktion der Zeit), so gilt hA(t)iψ = hψ(t)|A|ψ(t)i = hψ(0)|U (t)† AU (t)|ψ(0)i . (5.29) Da letztendlich nur Erwartungswerte dieser Art einer Messung zugänglich sind, kann man statt einer Zeitentwicklung der Zustände äquivalent auch eine Zeitentwicklung der Observablen definieren. Eine solche zeitabhängige Observable hat die Form: A(t) = U (t)† AU (t) (5.30) Für die Erwartungswerte hat es keine Auswirkungen, ob man mit zeitabhängigen Zuständen und zeitunabhängigen Observablen oder aber mit zeitabhängigen Observablen und zeitunabhängigen Zuständen rechnet. Mathematisch steckt dahinter lediglich die Äquivalenz zwischen passiver und aktiver Koordinantentrans” formation“. Betrachtet man zeitabhängige Observable, so spricht man auch vom Heisenberg-Bild der Quantenmechanik. Wir werden in Abschnitt 7.3 etwas intensiver auf das Heisenberg-Bild eingehen. 4. Bilden wir die Ableitung von zeitabhängigen Erwartungswerten (egal, ob im Heisenberg-Bild oder im Schrödinger-Bild), folgt (unter Verwendung von Gl. 5.28 und Gl. 5.29): i dhA(t)iψ = − h[A(t), H]iψ . (5.31) dt ~ Entsprechend unseres 1. Postulats, wonach die klassische Poisson-Klammer in der Quantenmechanik durch den Kommutator (multipliziert mit i/~) zu ersetzen ist, erfüllen die Erwartungswerte von Observablen dieselben Differentialgleichungen wie in der klassischen Mechanik. Dies ist eine Form des Korrespondenzprinzips. Falls also der Zustand ψ(t) einen klassischen Grenzfall zulässt, garantiert die Interpretation von H als Energieoperator einen nahtlosen Übergang zur klassischen Physik. 5.7 6. Postulat der Quantenmechanik: Mehrteilchensysteme Das letzte Postulat bezieht sich auf Mehrteilchensysteme. Es ist an dieser Stelle der Vollständigkeit halber gesondert angeführt und sollte streng genommen Teil des ersten 106 Postulate der QM Axioms sein. Wir werden auf Mehrteilchensysteme in Kap. 8 genauer eingehen. Postulat 6: Setzt sich ein Gesamtsystem aus mehreren Teilsystemen zusammen, deren Zustände und Observablen in Hilberträumen Hi beschrieben werden, dann ist der Hilbertraum des Gesamtsystems das Tensorprodukt der Einzelhilberträume: Hges = ⊗i Hi = H1 ⊗ H2 ⊗ ... . (5.32) Handelt es sich um ununterscheidbare (identische) Teilsysteme, die entweder zur Klasse der bosonischen Teilchen (ganzzahligen Spin) oder zur Klasse der fermionischen Teilchen (halbzahligen Spin) gehören, so ist bei bosonischen Teilsystemen ein Zustand immer zu symmetrisieren, bei fermionischen Teilsystemen ist immer der antisymmetrische Zustand zu bilden. Daher ist bei solchen Systemen nur der total antisymmetrisierte (bzw. symmetrisierte) Unterraum von Hges der Unterraum der physikalischen Zustände. 5.8 Die Unschärferelationen Es wurde bereits mehrfach erwähnt, dass sich zwei Observable, die nicht miteinander kommutieren, nicht gleichzeitig messen lassen. Dieser Abschnitt erläutert, was diese Aussage genau bedeutet. Die Begriffe Unschärferelation“ und Unbestimmtheitsrela” ” tion“ verwende ich in derselben Bedeutung. Wir tragen zunächst ein paar Tatsachen zusammen, die mit der gleichzeitigen Messbarkeit von Observablen zu tun haben: 1. Im letzten Kapitel (Abschnitt 4.2.3 auf S. 76) haben wir bewiesen, dass zwei selbstadjungierte Operatoren genau dann miteinander kommutieren, wenn sie einen gemeinsamen Satz von Eigenvektoren haben. 2. Weiterhin haben wir gesehen, dass eine Observable in einem Zustand nur dann dispersionsfrei ist, also immer denselben Messwert liefert, wenn es sich bei diesem Zustand um einen Eigenzustand des zugehörigen selbstadjungierten Operators handelt. 3. Das 4. Postulat der Quantenmechanik (Kollapspostulat) besagte, dass einem System nach einer Messung der Observablen A mit dem registrierten Messergebnis λ der zugehörigen Eigenzustand |λi zuzuschreiben ist. Diese Aussagen wollen wir nun verwenden, um folgende Eigenschaft quantenmechanischer Systeme zu beweisen: Satz: Wenn zwei Observable A und B miteinander kommutieren, dann lassen sich einem physikalischen System bezüglich beider Observable scharfe Messwerte (und damit Unschärferelationen 107 die entsprechenden Eigenschaften) zuschreiben. Kommutieren zwei Observable A und B nicht, dann findet man (im Allgemeinen, s.u.) keine Zustände, in denen beide Observable scharfe Werte haben: Es gilt eine Unschärferelation zwischen den Varianzen der zugehörigen Observablen, und die Messung einer Observablen zerstört einen eventuell vorhandenen dispersionsfreien Zustand der anderen Observablen. Beginnen wir mit dem ersten Teil der Aussage: Angenommen A und B kommutieren, dann folgt nach (1.), dass es einen gemeinsamen Satz von Eigenvektoren gibt, sodass nach (2.) beide Observable in einem solchen Zustand dispersionsfrei sind, also definitive Messwerte liefern. Gleichgültig, wie oft wir die eine oder andere Observable messen, nach (3.) ändert sich der Zustand dabei nicht und wir erhalten für beide Observable jeweils immer dieselben Messwerte. In diesem Sinne sind beide Observable gleichzeitig messbar und einem System lassen sich zu beiden Observablen wohldefinierte Messwerte zuschreiben. Dies können wir auch dadurch ausdrücken, dass wir dem System beide Eigenschaften zuschreiben. Nun nehmen wir an, die beiden Observablen A und B kommutieren nicht. Etwas verschärft fordern wir zunächst, dass es auch keinen Vektor gibt, der gleichzeitig Eigenvektor von A und von B ist. Angenommen, wir haben Systeme in einem Eigenzustand von A präpariert, dann folgt nach (2.), da dieser Zustand nicht gleichzeitig Eigenzustand von B ist, dass B in diesem Zustand nicht dispersionsfrei ist (also nicht immer denselben Messwert liefert), und nach (3.), dass nach einer Messung von B der Eigenzustand von A nicht mehr vorliegt sondern nun ein Eigenzustand von B vorliegt. Dieselben Eigenschaften gelten auch umgekehrt, wenn wir ein System im Eigenzustand von B präpariert haben. In dem angegebenen Fall können wir also dem System nicht sowohl bezüglich A als auch B scharfe Werte zuschreiben, und da die Eigenvektoren verschieden sind, wird eine Messung der einen Observablen immer den Eigenzustand der anderen zerstören“. In diesem Sinne können wir die beide Observa” blen nicht gleichzeitig messen und damit einem System nicht gleichzeitig wohldefinierte Messwerte bezüglich beider Observablen zuschreiben. Es kann vorkommen, dass zwei Observable A und B zwar nicht allgemein kommutieren, dass es aber spezielle Zustände gibt, die sowohl Eigenzustände von A als auch von B sind. (Das passiert beispielsweise bei Drehimpulsoperatoren zu verschiedenen Komponenten des Drehimpulses im Drehimpulszustand l = 0; siehe Anhang A3.) In diesem Fall kann man beide Operatoren gleichzeitig messen (falls sich das System in dem entsprechenden Zustand befindet) und man kann dem System scharfe Werte für beide Observablen zuschreiben. Der Grund ist, dass die beiden Observablen, angewandt auf diesen speziellen Zustand, kommutieren oder anders ausgedrückt: Der Kommutator der beiden Observablen verschwindet auf diesem speziellen Zustand. Diese letztere Eigenschaft kann bei den Orts- und Impulsoperatoren nicht vorkommen. Der Kommutator [Q, P ] = i~ ist proportional zur Identiätsmatrix und ver- 108 Postulate der QM schwindet daher auf keinem Zustand im Hilbertraum. Also gibt es auch keinen Zustand, in dem P und Q gleichzeitig scharfe Werte annehmen oder in dem man P und Q gleichzeitig messen“ kann. In gewisser Hinsicht kann man sogar sagen, dass P und ” Q maximal inkombatibel sind. Niels Bohr hat für diesen Fall den (eher philosophisch geprägten) Begriff der Komplementarität eingeführt. Der Begriff der Komplementarität spielte für Niels Bohr in seinem Verständnis der Quantenmechanik eine sehr wichtige Rolle. Für ihn handelte es sich dabei um ein Grundprinzip der Natur, das nicht nur in der Quantentheorie Anwendung findet. Ursprünglich geht der Begriff der Komplementarität auf den Psychologen William James (1842–1910) zurück [44], der in der Psychologie als Beispiel die Konzepte Glauben“ und Wissen“ anführt. ” ” Heute hat dieser Begriff an Bedeutung verloren, unter anderem auch, weil er mathematisch sehr schlecht definierbar ist. Ganz schwach formuliert könnte man zwei Observable als komplementär bezeichnen, wenn sie nicht miteinander kommutieren, sehr stark ausgedrückt sind zwei Observable komplementär, wenn sie die kanonischen Vertauschungsregeln erfüllen. Früher sprach man auch oft von einer Komplementarität zwischen dem Wellenbild und dem Teilchenbild der Quantenmechanik (eine andere Bezeichnung war der Welle-Teilchen-Dualismus). Man kann diesen Komplementaritätsbegriff mit der Komplementarität von Ort und Impuls zusammenbringen: Ist eine Wellenfunktion räumlich sehr schaft konzentriert, vermittelt sie eher den Charakter eines Teilchens: Der Ort ist scharf, aber die Wellenlänge der Wellenfunktion hat eine große Unschärfe und der Wellencharakter ist nicht sehr ausgeprägt. Ist umgekehrt die Welle durch eine mehr oder weniger wohldefinierte Wellenlänge beschreibbar, ist der Impuls nahezu scharf, aber die räumliche Verteilung sehr verschmiert. Zum Abschluss wollen wir noch die Unschärferelation für zwei nicht-kommutierende Operatoren ableiten. Dafür geben wir gleich zwei Beweise: Es folgt zunächst ein algebraischer Beweis, der allgemein die Varianzen zweier Operatoren durch ihren Kommutator ausdrückt, anschließend verwenden wir die Eigenschaften der FourierTransformation, um konkret eine Unschärferelation zwischen dem Ort und der Wellenzahl abzuleiten. Diese Unschärferelation hat zunächst nichts mit der Quantenmechanik zu tun, sondern ist eine allgemeine Eigenschaft von Funktionen. Gegeben seinen zwei selbstadjungierte Operatoren A und B. Für einen gegebenen Zustand |ψi definieren wir die Operatoren ∆A = A − hAi und ∆B = B − hBi , (5.33) wobei hAi = hψ|A|ψi und hBi = hψ|B|ψi bezeichnen. Mit den Definitionen |ai = ∆A|ψi und |bi = ∆B|ψi folgt: ha|ai = h∆A2 i und hb|bi = h∆B 2 i . (5.34) Allgemein gilt nach der Ungleichung von Cauchy und Schwarz: ha|aihb|bi ≥ |ha|bi|2 . (5.35) Unschärferelationen 109 Da das Absolutquadrat einer Zahl immer größer ist als das Quadrat des Imaginärteils, folgt weiterhin: 2 1 2 (ha|bi − hb|ai) . (5.36) |ha|bi| ≥ 2i (Man beachte, dass der Ausdruck in der Klammer auf der rechten Seite immer reell ist.) Für die rechte Seite rechnet man leicht nach, dass ha|bi − hb|ai = hABi − hBAi = hψ|[A, B]|ψi (5.37) und somit insgesamt: 2 2 h∆A ih∆B i ≥ 2 1 hψ|[A, B]|ψi . 2i (5.38) Wir sehen also, dass das Produkt der Varianzen von zwei Operatoren in einem Zustand |ψi immer nach unten beschränkt ist durch das Quadrat des Erwartungswerts des Kommutators dieser beiden Operatoren in demselben Zustand. Definieren wir insp p besondere für den Ort und den Impuls ∆x = h∆Q2 i und ∆p = h∆P 2 i, so folgt (für jeden beliebigen Zustand |ψi) die berühmte Heisenberg’sche Unschärferelation: ∆x · ∆p ≥ ~ . 2 (5.39) Abschließend wollen wir noch eine Beziehung zwischen der Varianz des Ortes und der Varianz des Wellenzahlvektors bei einer Fourier-Transformation ableiten. Wir werden zeigen, dass für Gaußsche Funktionen die Unschärferelation gerade saturiert wird. Es sei ψ(x) eine quadratintegrable Funktion und Z +∞ 1 ψ̃(k) = √ ψ(x)eikx dx (5.40) 2π −∞ die Fourier-Transformierte von ψ(x). Außerdem seien Z ∞ Z ∞ 2 ∗ 2 2 ∆x = ψ(x) (x−hxi) ψ(x) dx und ∆k = ψ̃(k)∗ (k−hki)2 ψ̃(k) dk (5.41) −∞ −∞ dann gilt 1 . (5.42) 2 Wir werden diese Ungleichung nicht im Allgemeinen beweisen (Beweise findet man in Büchern zur Fourier-Transformation), aber wir wollen zeigen, dass sie für Gauß– Funktionen gerade saturiert ist. Der Vorteil bei einer Gauß–Funktion ist, dass die Fourier-Transformierte wiederum eine Gauß–Funktion ist. Es sei 1 x2 ψ(x) = exp − 2 (5.43) (2πσ 2 )1/4 4σ ∆x · ∆k ≥ 110 Postulate der QM eine quadrat-normierte Gauß–Funktion (man beachte, dass hier das Integral über das Absolutquadrat dieser Funktion auf 1 normiert sein soll, wohingegen bei Gauß– Funktionen als Wahrscheinlichkeitsverteilungen das Integral über die Funktion selbst normiert ist). Die Fourier-Transformierte dieser Gauß–Funktion erhalten wir durch eine quadratische Ergänzung im Exponenten: Z ∞ x2 1 exp − 2 + ikx dx ψ̃(k) = (2π)3/4 σ 1/2 −∞ 4σ Z ∞ 2 1 x 2 2 = − σik − σ k dx exp − (2π)3/4 σ 1/2 −∞ 2σ √ 2σ 4σ 2 k 2 = exp − (2π)1/4 4 Mit den Definitionen 5.41 gilt für die obigen Gauß-Funktionen: ∆x = σ und ∆k = 1 2σ (5.44) und somit folgt ∆x · ∆k = 1 . 2 (5.45) Wird also die Unschärfe einer Verteilungsfunktion |ψ(x)|2 bezüglich der räumlichen Verteilung kleiner, dann wird die Unschärfe der zugehörigen Verteilungsfunktion |ψ̃(k)|2 bezüglich der Verteilung der Wellenzahlen größer (und umgekehrt). Ganz allgemein kann man aus den Eigenschaften der Fourier-Transformation ableiten, dass diese Unschärfebeziehung eine untere Grenze ist und die Ungleichung ∆x · ∆k ≥ 1 2 (5.46) gilt. Diese Ungleichung hängt natürlich nicht mit dem speziellen Argument x zusammen sondern gilt allgemein bei Fourier-Transformationen, insbesondere auch wenn man eine zeitliche Signalfunktion ψ(t) und ihre Fourier-Transformierte ψ̃(ω) Z ∞ 1 ψ̃(ω) = √ ψ(t)eiωt dt (5.47) 2π −∞ betrachtet. Definieren wir ähnlich wie oben Z ∞ 2 (∆t) = ψ(t)∗ (t − hti)2 ψ(t) dt Z−∞ ∞ (∆ω)2 = ψ̃(ω)∗ (ω − hωi)2 ψ̃(ω) dω −∞ Gemischte Zustände und Dichtematrizen 111 so folgt allgemein die Ungleichung: ∆ω · ∆t ≥ 1 . 2 (5.48) Zusammen mit der deBroglie’schen Beziehung E = ~ω ergibt sich eine Unschärferelation zwischen der Energie und der Zeit: ∆E · ∆t ≥ ~ . 2 (5.49) Anmerkungen: 1. Die Unschärferelation zwischen der Energie und der Zeit lässt sich nicht aus einer Kommutatorrelation ableiten (es gibt in der Standardformulierung der Quantenmechanik keinen Zeitoperator“). Sie hat somit einen etwas anderen Charakter ” als beispielsweise die Unschärferelation zwischen Ort und Impuls. 2. Ganz allgemein bedeuten Unschärferelation nicht eine Unkenntnis irgendwelcher wahren Ontologien (zumindest nicht in den meisten Interpretationen der Quantenmechanik). Sie drücken eher aus, dass einem Quantenobjekt eine bestimmte Eigenschaft nicht mit einer beliebigen Schärfe zukommt. Ist der Impuls eines Quantenobjekts beliebig genau bekannt (also ∆p praktisch 0), so macht es überhaupt keinen Sinn, diesem Quantenobjekt die Eigenschaft, an einem Ort zu sein, überhaupt zuzuschreiben. Schon die Annahme, dass der Ort zwar definiert aber uns nicht bekannt sei, führt zu Problemen, wenn man für solche Systeme die beobachteten Interferenzmuster erklären möchte. 3. Es gibt unterschiedliche Interpretationen der Unschärferelationen, und je nach Definition, was beispielsweise genau ∆x oder ∆p bedeuten, erhält man etwas andere Gleichungen. Bei einer experimentellen Überprüfung wird meist die Unsicherheit der einen Observablen durch die Präparation der Zustände bestimmt und die der anderen durch die Varianz der Messergebnisse an diesen Zuständen. Damit handelt es sich aber operational um zwei verschiedene Formen von Un” sicherheiten“. 4. Die Unschärferelation zwischen der Energie und der Zeit hat direkt beobachtbare Konsequenzen in der Spektroskopie. Wenn ein angeregter Zustand eines Atoms eine Lebensdauer von ∆t hat (also ein Photon mit einer gewissen Wahrscheinlichkeit innerhalb dieser Zeitspanne emittiert wird), dann ist die Wellenlänge (Energie) dieses Photons nur bis auf ∆ω (∆E) bestimmt. Endliche Lebensdauern führen also zu verschmierten Emissionslinien im Spektrum, wobei die Breite der Verschmierung Aufschluss über die Lebendauer des Zustands gibt. 112 Postulate der QM 5.9 Gemischte Zustände und Dichtematrizen 5.9.1 Allgemeine Definition von Zuständen Bisher haben wir immer von reinen Zuständen gesprochen. Oft verwendet man aber in der Physik einen erweiterten Zustandsbegriff, der es auch erlaubt, Wahrscheinlichkeitsverteilungen von reinen Zuständen zu betrachten und somit eine Unkenntnis über den wahren“ Zustand eines Systems zu behandeln. ” Gemischte Zustände gibt es auch in der klassischen Mechanik. An dieser Stelle bietet es sich an, den Begriff des Zustands ganz allgemein in einem algebraischen Sinn zu definieren: Definition: Ein Zustand ist ein lineares, positives, normiertes Funktional auf der Menge der Observablen. Zunächst klären wir die Begriffe in dieser Definition: - Ein lineares Funktional ist eine lineare Abbildung von der Menge der Observablen in die Menge der (reellen) Zahlen. Sei O die Menge der Observablen, f, g ∈ O Observable und ω ein lineares Funktional, dann gilt: ω : O → R mit ω(αf + βg) = αω(f ) + βω(g) . (5.50) - Ein Funktional heißt positiv, wenn einer positiven Observablen nie ein negativer Wert zugeordnet wird, wobei eine positive Observable eine Observable ist, die immer nur positive Messwerte zulässt. Oft schreibt man |f |2 und meint damit, dass diese Observable (egal für welche Observable f ) in jedem Fall positiv ist. Dann bezeichnet man ein Funktional als positiv, wenn für beliebige Observable f gilt: ω(|f |2 ) ≥ 0 . (5.51) Hierbei haben wir aber vorausgesetzt, dass |f |2 tatsächlich auf der Menge der Observablen wohldefiniert ist und eine positive Observable liefert. Das gilt sicherlich in der klassischen Mechanik, wo die Observablen Funktionen auf dem Phasenraum sind, und auch in der Quantenmechanik: Der Operator A† A ist immer ein positiver Operator (und bei selbst-adjungierten Operatoren ist tatsächlich A2 immer positiv). - Schließlich bedeutet normiert, dass das Funktional auf der Observablen, die immer nur den Messwert 1 liefert (in der klassischen Mechanik die Funktion f (x, p) = 1 auf dem Phasenraum und in der Quantenmechanik der Identitätsoperator), den Wert 1 annimmt: ω(1) = 1 . (5.52) Gemischte Zustände und Dichtematrizen 113 Ein solches Funktional bezeichnet man auch als Erwartungswertfunktional. Ein Zustand ist also ein Erwartungswertfunktional auf der Menge der Observablen. Anders ausgedrückt: Ein Zustand ist eine Vorschrift, die jeder Observablen ihren Erwartungswert zuordnet. Für zwei Zustände ω1 und ω2 im obigen Sinn ist auch jede konvexe Kombination dieser beiden Zustände ein Zustand: ω(f ) = αω1 (f ) + (1 − α)ω2 (f ) (0 ≤ α ≤ 1) . (5.53) Wir müssen die drei Bedingungen überprüfen: (1) Die Linearität gilt allgemein für Linearkombinationen; (2) die Positivität verlangt, dass die beiden Koeffizienten positiv sind; (3) die Normiertheit fordert, dass die Summe der Koeffizienten 1 ist. Zustände bilden also eine konvexe Menge. Man definiert nun: Reine Zustände liegen auf dem Rand der konvexen Menge von Zuständen. Das bedeutet, reine Zustände lassen sich nicht als echte Linearkombination (also α 6= 0, 1) schreiben bzw. reine Zustände lassen sich nicht weiter zerlegen. 5.9.2 Zustände in der klassischen Mechanik Diese allgemeine Definition eines Zustands wenden wir nun auf die klassische Mechanik und später auf die Quantenmechanik an. Beginnen wir mit der klassischen Mechanik: Ein beliebiges lineares Funktional auf der Menge der Funktionen über dem Phasenraum lässt sich immer als (verallgemeinertes – d.h., im Sinne von Distributionen) Integral schreiben: Z ω(x)f (x) dx , ω(f ) = (5.54) P wobei der Einfachheit halber ein Punkt im Phasenraum durch x bezeichnet wurde. f (x) ist dabei eine Observable, und ω(x) eine (verallgemeinerte) Funktion. Die Positivität erfordert, dass ω nirgendwo negativ werden darf (zumindest nicht auf einer Menge vom Maß ungleich 0), und Normiertheit bedeutet, dass das Integral über ω gleich 1 ist: Z Z 2 ω(x)|f (x)| dx ≥ 0 und ω(x) dx = 1 . (5.55) P P Eine (verallgemeinerte) Funktion mit diesen Eigenschaften bezeichnet man als eine Wahrscheinlichkeitsdichte auf dem Phasenraum. Hierbei handelt es sich um ein klassisches Erwartungswertfunktional. Mit wenig Aufwand lässt sich zeigen, dass die einzigen reinen Zustände Wahrscheinlichkeitsdichten sind, die an einem Punkt konzentriert sind, also die δ–Funktion: Z ωx0 (f ) = δ(x − x0 )f (x) dx = f (x0 ) . (5.56) P Somit stehen die reinen Zustände in einer 1-zu-1-Beziehung mit den Punkten im Phasenraum. 114 5.9.3 Postulate der QM Dichtematrizen Kommen wir nun zur Quantenmechanik. Gesucht ist ein lineares Funktional auf der Menge der Operatoren, das positiv und normiert ist. Der Beweis ist zwar etwas aufwendiger, aber man kann zeigen, dass die einzigen Funktionale dieser Art sich durch so genannte Dichtematrizen schreiben lassen. Eine Dichtematrix ist ein Operator ρ mit den Eigenschaften: ρ = ρ† , Spur(ρA† A) ≥ 0 (für alle A) , Spur(ρ) = 1 . (5.57) Für die Positivität der Dichtematrix schreibt man manchmal auch einfacher ρ ≥ 0, was im obigen Sinne zu verstehen ist. Einem Operator A wird nun nach folgender Vorschrift sein Erwartungswert zugeordnet: ω(A) = Spur(ρA) . (5.58) Die Linearität ist wieder offensichtlich. Die Positivität ist die zweite obige Bedingung. Sie bedeutet (da ρ selbst-adjungiert sein soll) auch, dass die Eigenwerte von ρ alle nicht negativ sind. Die Normiertheit bedeutet, dass die Summe der Eigenwerte gleich 1 ist. Somit hat ρ die folgende Form: X X X ρ= p i Pi = pi |pi ihpi | mit pi ≥ 0 und pi = 1 . (5.59) i i i wobei Pi die Projektoren auf die Eigenzustände von ρ zum Eigenwert pi sind. Man kann zeigen, dass die Bedingungen an eine Dichtematrix äquivalent sind zu folgenden Eigenschaften: ρ = ρ† , ρ≥0 , ρ2 ≤ ρ . Für eine Observable A ist der Erwartungswert somit X ω(A) = SpurρA = pi hpi |A|pi i (5.60) (5.61) i Auf der rechten Seite steht eine Summe über Erwartungswerte hpi |A|pi i in reinen Zuständen, und jeder dieser Erwartungswerte wird nochmals gewichtet mit pi . Das entspricht der klassischen Vorstellung eines Gemischs, d.h., wir wissen nicht, welcher Zustand in einer Basis {|pi i} vorliegt, aber wir wissen, mit welcher Wahrscheinlichkeit pi jeder dieser Zustände vorliegt, und der Erwartungswert insgesamt ist gleich der gewichteten Summe der Einzelerwartungswerte. Anders ausgedrückt können wir auch sagen: Gegeben sei ein Ensemble von präparierten Systemen, wobei jedes Einzelsystem sich in einem Zustand |ψi i befinden kann. Wir wissen nicht, welches System in welchem Zustand präpariert wurde, aber Maximale Sätze kompatibler Observabler 115 wir kennen die relative Häufigkeit pi mit welcher der Zustand |ψi i in dem Ensemble P auftritt. Dann würden wir dieses Ensemble durch eine Dichtematrix ρ = i pi |ψi ihψi | beschreiben. In diesem Fall ist noch nicht einmal notwendig, dass die Zustände |ψi i orthogonal sind. Man beachte, dass die Superposition |Ψi = X√ pi |ψi i (5.62) pi |ψi ihψi | . (5.63) i nicht dasselbe ist wie die Dichtematrix ρ= X i Die Superposition beschreibt wieder einen reinen Zustand, und je nach experimenteller Anordnung lassen sich auch die Interferenzterme hψi |ψj i beobachten. Die Dichtematrix beschreibt jedoch ein klassisches Gemisch, d.h., jedes Einzelsystem in einer Reallisierung des Zustands durch ein Ensemble befindet sich mit der Wahrscheinlichkeit pi in dem reinen Zustand |ψi i. An einem Gemisch kann man keine Interferenzterme beobachten. Nun ist es wiederum nicht schwer zu beweisen, dass die einzigen reinen Zustände (Dichtematrizen, die sich nicht als konvexe Kombination von anderen Dichtematrizen schreiben lassen) die Eigenschaft haben, dass pi = 1 für ein bestimmtes i und ansonsten pi = 0 gilt. Anders ausgedrückt, reine Zustände sind Projektionsoperatoren auf 1dimensionale lineare Unterräume, und damit erhalten wir wieder die Definition eines reinen Zustands aus Abschnitt 5.2. Dichtematrizen spielen beispielsweise in der Quantenstatistik eine wichtige Rolle, d.h., wenn man statistische Quantensysteme (Quantengase etc.) betrachtet. Die klassischen Gesamtheiten (mikrokanonische Gesamtheit, kanonische Gesamtheit etc.) lassen sich durch Dichtematrizen beschreiben. Wir werden auf diesen Punkt nicht weiter eingehen. Allerdings werden wir auf Dichtematrizen nochmals im Zusammenhang mit Zwei-Zustands-Systemen zu sprechen kommen. 5.10 Maximale Sätze kompatibler Observabler Das 4. Postulat (Kollapspostulat) erlaubt es uns, Systeme in bestimmten Zuständen zu präparieren. Im Idealfall besteht die Präparation in einem Filter“, der nur Quan” tensysteme durchlässt, die eine bestimmte Bedingung erfüllen. Mathematisch wird ein solcher Filter durch einen Projektionsoperator beschrieben. Ist ein Eigenwert zu einer Observablen entartet, können wir den Zustand mit einem Filter zu dieser Observablen nicht weiter verfeinern. Wir könnten aber mit einer zweiten Observablen, die mit der ersten kommutiert, eine Zustandsverfeinerung vornehmen. 116 Postulate der QM Damit erhebt sich die Frage, wie wir zu reinen Zuständen gelangen. Nach dem oben Gesagten suchen wir einen maximalen Satz von Filtern, die miteinander verträglich sind (deren zugehörige Projektionsoperatoren miteinander kommutieren), die zusammengenommen jedoch nur einen einzigen (durch einen 1-dimensionalen Strahl repräsentierten) Zustand durchlassen. Auf Dirac geht in diesem Zusammenhang der Begriff des maximalen Satzes ” kompatibler Observabler“ zurück. Wir definieren; Definition: Ein Satz von Observablen {A1 , A2 , ..., AN } heisst maximal kompatibel, wenn folgende Bedingungen erfüllt sind. 1. Observablen sind funktional unabhängig. Das bedeutet, es gibt in diesem Satz keine Observable Ai , die sich als Funktion der anderen Observablen schreiben lässt. 2. Alle Observablen kommutieren miteinander: [Ai , Aj ] = 0 für alle i, j . (5.64) 3. Jede weitere Observable B, welche die Eigenschaft hat, dass [B, Ai ] = 0 (für alle i), lässt sich als Funktion der Observablen Ai schreiben: B = f (A1 , ..., AN ). Die erste Bedingung schließt redundante Observablen (deren Information schon in den anderen Observablen steckt) aus. Die zweite Bedingung garantiert, dass es gemeinsame Eigenzustände von allen Observablen Ai gibt, sodass wir jede dieser Observablen gleichzeitig messen und einem System bezüglich jeder dieser Observablen gleichzeitig wohldefiniert Messwerte (und damit wohldefinierte Eigenschaften) zuschreiben können. Die dritte Bedingung besagt, dass es keine weiteren unabhängigen Observablen gibt, die diese Bedingung erfüllen. Das ist genau dann der Fall, wenn die gemeinsamen Eigenvektoren zu allen Observablen {Ai } (bis auf Multiplikation mit einer komplexen Zahl) eindeutig sind, d.h. keine Entartungen mehr vorliegen. Ein Satz von Messwerten {ai } (einer für jede Observable) legt somit eindeutig einen reinen Zustand fest. Kapitel 6 Potenzialsysteme Es sollen nun einige konkrete Beispiele von Quantensystemen betrachtet werden. Dabei handelt es sich zunächst um Systeme einzelner Teilchen in einem externen Potenzial. Drei Systeme werden in diesem Zusammenhang ausführlicher behandelt: das Kastenpotenzial, der harmonische Oszillator und das Coulomb-Problem. Für alle drei Potenziale lässt sich die Schrödinger-Gleichung exakt lösen. Schwerpunktmäßig gehe ich auf das Kastenpotenzial ein, da es bereits die wesentlichen Charakteristika eines Quantensystems mit externem Potenzial aufweist. Dazu zählt insbesondere die Quantisierung der möglichen Energiewerte. Außerdem hat es den Vorteil, sich mit den Verfahren der Schulmathematik lösen zu lassen. Für die anderen beiden Systeme werden die Lösungswege skizziert und die qualitativen Eigenschaften der Lösungen diskutiert. Zuvor gehe ich allerdings auf einige allgemeine Eigenschaften der Schrödinger-Gleichung für Potenzialsysteme (ohne weitere Freiheitsgrade wie beispielsweise den Spin) ein. Was man wissen sollte Man sollte die zeitabhängige und die zeitunabhängige Schrödinger–Gleichung angeben können und auch die Beziehung zwischen den beiden Gleichungen kennen. Außerdem sollte man allgemein wissen, dass sich Symmetrien in der Quantenmechanik darin äußern, dass die zugehörigen unitären Transformationen (bzw. ihre Generatoren) mit dem Hamilton-Operator kommutieren. Daher lassen sich beide Operatoren gleichzeitig diagonalisieren, was zum einen das Auffinden der Lösungen der Schrödinger–Gleichung vereinfacht, zum anderen aber auch bedeutet, dass die Quantenzahlen zu den Symmetrien Erhaltungsgrößen sind. Ist die Energie eines Teilchens kleiner als der Wert eines Potenzials im Unendlichen, sind die erlaubten Energien (die Energieeigenwerte) quantisiert. Diese Quantisierung ist eine Folge der zu fordernden Randbedingungen, da die Wellenfunktionen quadratintegrabel sein müssen. Ist die Energie größer als das Potenzial, ist das Ener117 118 Potenzialsysteme giespektrum meist kontinuierlich. Das unendliche Kastenpotenzial sollte jeder einmal selbst gerechnet haben. Die Energiequantisierung folgt aus der Forderung, dass die Wellenfunktion am Rand verschwinden muss. Daher muss ein Vielfaches der halben deBroglie-Wellenlänge in den Kasten passen. Diese Forderung – (nλ)/2 = L oder nπ~/p = L – führt auf die erlaubten Impulse p = (nπ~)/L und damit die möglichen Energien E = (nπ~)2 /(2mL2 ). Für den eindimensionalen Kasten wachsen die Energieeigenwerte proportional zu n2 (wobei n − 1 die Anzahl der Knotenpunkte der Welle ist), sind andererseits aber umgekehrt proportional zu L2 (bei größerem Volumen liegen die Energieeigenwerte dichter) und m (bei schwererer Masse sind die Energieeigenwerte kleiner und dichter). Es gibt eine endliche Grundzustandsenergie (der Fall n = 1), die auch als Folge der Unbestimmtheitsrelationen gedeutet werden kann. Die Eigenfunktionen sind einfache Winkelfunktionen. Beim endlichen Kastenpotenzial bleibt die Wellenfunktion innerhalb des Kastens eine Winkelfunktion, sie verschwindet aber (auch für Energien kleiner als V ) außerhalb des Kastens nicht sondern dringt exponentiell abfallend in den klassisch verbotenen Bereich ein. Dadurch erklärt sich der Tunneleffekt, wobei die Tunnelwahrscheinlichkeit exponentiell mit der Dicke der Wand und der Wurzel der Potenzialhöhe über der Energie des Teilchens abnimmt. Für den Fall E > V gibt es keine Quantisierung, allerdings kann es zur Reflektion der Wellenfunktion am Potenzial kommen sowie zu einer Phasenverschiebung und Amplitudenänderung der transmittierten Welle (dies ist der Ausgangspunkt für eine Streutheorie); für E < V ist die Quantisierung eine Folge des exponentiellen Abfalls der Wellenfunktion außerhalb des Kastens und der Forderung nach einer einmal stetig differenzierbaren Anschlussbedingung am Kastenrand. Die Verhältnisse bei den anderen Potenzialen sollte man zumindest qualitativ kennen. Die Energieeigenwerte beim harmonischen Oszillator sind En = ~ω(n + 21 ) (mit n = 0, 1, 2, ...): Sie sind äquidistant und die Grundzustandsenergie ist ~ω/2. Die Eigenfunktionen sind (Hermite-)Polynome multipliziert mit einer Gaußfunktion. Bestimmte Linearkombinationen des Orts- und Impulsoperators bilden so genannte Aufund Absteigeoperatoren, die, angewandt auf einen Eigenzustand des Energieoperators, zum nächst höheren (bzw. tieferen) Eigenzustand führen. Für sehr große Werte von n nähern sich die Amplitudenquadrate der Wellenfunktion einer klassischen Aufenthaltswahrscheinlichkeit für ein Teilchen derselben Energie. Bei radialsymmetrischen (dreidimensionalen) Potenzialen lässt sich die Winkelabhängigkeit in der Schrödinger–Gleichung geschlossen behandeln und führt auf die Quantenzahlen l und m (Drehimpuls und magnetische Quantenzahl). Die zugehörigen Eigenfunktionen sind die Kugelflächenfunktionen Ylm (θ, ϕ). Der Drehimpuls p ist ~ l(l + 1), wobei l = 0, 1, 2, ... ganzzahlig sein muss. Beim Coulomb-Problem bzw. Schrödinger-Gleichung für Potenzialsysteme 119 Wasserstoffatom kann man auch die radiale Abhängigkeit geschlossen behandeln, was auf die Hauptquantenzahl n führt (die mit der Anzahl der Knotenpunkten der radialen Wellenfunktion zusammenhängt). Die (diskreten) Energieeigenwerte hängen nur von dieser Hauptquantenzahl n ab (welche die Werte n = 1, 2, ... annimmt) und sind proportional zu −1/n2 mit der Rydberg-Konstanten als Proportionalitätsfaktor. Für positive Energien ist das Spektrum kontinuierlich. Für die möglichen Quantenzahlen l des Drehimpulses gilt l ≤ n, für die magnetische Quantenzahl m, die Eigenzuständen der z-Komponente des Drehimpulses entspricht, gilt m = −l, −l + 1, ..., +l; m kann also 2l + 1 verschiedene Werte annehmen. 6.1 6.1.1 Schrödinger-Gleichung für Potenzialsysteme Zeitabhängige und zeitunabhängige Schrödinger-Gleichung In Kapitel 5.6 haben wir die zeitabhängige Schrödinger-Gleichung für einen allgemeinen Zustand |ψ(t)i angegeben: i~ d|ψ(t)i = H|ψ(t)i . dt (6.1) Die formale Lösung ist i |ψ(t)i = U (t)|ψ(0)i = e− ~ Ht |ψ(0)i mit dem unitären Zeitentwicklungsoperator i U (t) = exp − Ht . ~ (6.2) (6.3) Hierbei und im Folgenden nehme ich H immer als zeitunabhängig an. Gleichung 6.1 bleibt zwar auch für einen zeitabhängigen Hamilton-Operator H = H(t) gültig, beispielsweise wenn H Teilchen in zeitabhängigen externen Potenzialen beschreibt, aber die formale Lösung 6.2 ist nun zu modifizieren. Auch wenn zeitabhängige HamiltonOperatoren in der Praxis von Bedeutung sind, werden sie hier nicht weiter behandelt. Die Schrödinger-Gleichung ist eine lineare Differentialgleichung erster Ordnung in der Zeit. Das bedeutet, mit je zwei speziellen Lösungen |ψ1 (t)i und |ψ2 (t)i ist auch die allgemeine Linearkombination |ψ(t)i = α|ψ1 (t)i + β|ψ2 (t)i (6.4) eine Lösung. Da die Schrödinger-Gleichung (als Funktion von t) erster Ordnung ist, bestimmt der Zustand |ψ(0)i zum Zeitpunkt t = 0 bereits eindeutig die Lösung |ψ(t)i. 120 Potenzialsysteme Aus der formalen Lösung (Gl. 6.2) bzw. der Unitarität der Zeitentwicklung folgt sofort: i i † hψ(t)|ψ(t)i = hψ(0)|e+ ~ H t e− ~ Ht |ψ(0)i = hψ(0)|ψ(0)i . (6.5) Der zweite Schritt gilt, weil H = H † selbst-adjungiert ist (genau deshalb ist U (t) auch unitär). Die Norm eines Zustands bleibt daher erhalten. Wegen der Linearität der Schrödinger-Gleichung ist mit einer Lösung |ψ(t)i auch α|ψ(t)i (für beliebiges α ∈ C) eine Lösung, daher kann man sie auch als Gleichung für die Strahlen im Hilbertraum auffassen, also die eigentlichen reinen Quantenzustände. Wegen der Unitarität bleibt die Norm erhalten, d.h., normierte Repräsentanten der Zustände bleiben normierte Repräsentanten. Da wir das Absolutquadrat eines Zustands als eine Wahrscheinlichkeit interpretiert haben, bedeutet die Unitarität der quantenmechanischen Zeitentwicklung die Erhaltung der Wahrscheinlichkeit“. ” Für einen Eigenvektor zum Energieoperator H|ψE i = E|ψE i (6.6) folgt aus Gl. 6.1: i |ψE (t)i = e− ~ Et |ψE (0)i . (6.7) Die Zeitentwicklung eines Eigenvektors des Energieoperators ist somit fast trivial: Der Vektor wird lediglich mit einer zeitabhängigen Phase multipliziert. Diese globale Phase hat aber für den physikalischen Zustand keine Bedeutung, daher sind Eigenzustände zum Energieoperator stationär. Zur Bestimmung der allgemeinen Lösung kann man den Anfangsvektor |ψ(0)i nach Energieeigenvektoren entwickeln (wobei wir im Folgenden |ψE i = |Ei schreiben): X |ψ(0)i = ai |Ei i . (6.8) i Da die Schrödinger-Gleichung linear ist, sind Superpositionen von Lösungen wieder Lösungen der Schrödinger-Gleichung und wir können die Lösungen für die Eigenvektoren einsetzen. Damit erhalten wir für die allgemeine Lösung der zeitabhängigen Schrödinger-Gleichung X i (6.9) |ψ(t)i = ai e− ~ Ei t |Ei i . i Man beachte, dass in diesem Ausdruck die energieabhängigen Phasen natürlich eine physikalische (messbare) Bedeutung haben. Superpositionen von Energieeigenzuständen sind also nicht stationär sondern zeigen eine nicht-triviale Zeitentwicklung. Das eigentliche Problem zur Lösung der Schrödinger-Gleichung ist also die Bestimmung der Eigenwerte und Eigenfunktionen aus Gl. (6.6). Diese Gleichung bezeichnet man auch als zeitunabhängige Schrödinger-Gleichung. Die zeitunabhängige Schrödinger-Gleichung für Potenzialsysteme 121 Schrödinger-Gleichung ist eine ganz gewöhnliche Eigenwertgleichung. Insbesondere ist sie ebenfalls linear, d.h., auch hier gilt wieder, dass Superpositionen von Lösungen selbst wieder Lösungen darstellen. Oftmals wird die zeitunabhängige Schrödinger-Gleichung aus der zeitabhängigen SchrödingerGleichung durch einen Separationsansatz abgeleitet“. Dazu schreibt man für einen Zustand |ψ(t)i = ” f (t)|ψi, d.h., die Zeitabhängigkeit wird durch eine allgemeine Funktion f (t) absepariert. Setzt man diesen Ansatz in die zeitabhängige Schrödinger-Gleichung ein, erhält man: i~ df (t) |ψi = Hf (t)|ψi , dt (6.10) und nach Division durch f (t) (was nicht identisch verschwinden soll): i~ 1 df (t) |ψi = H|ψi . f (t) dt (6.11) Da die rechte Seite nicht von t abhängt, darf auch die linke Seite nicht von t abhängen, also muss gelten: 1 df (t) = const = E , (6.12) i~ f (t) dt mit der Lösung: i f (t) = e− ~ Et f (0) . (6.13) Für den Zustand |ψi folgt: E|ψi = H|ψi , (6.14) also die zeitunabhängige Schrödinger-Gleichung. 6.1.2 Die Schrödinger-Gleichung in einer Basis Für die bisherigen Überlegungen haben wir die Gleichungen mit abstrakten Vektoren im Hilbertraum formuliert. Wollen wir jedoch konkrete Berechnungen durchführen, müssen wir eine Basis wählen (oder, wie wir in endlich dimensionalen Vektorräumen manchmal auch sagen, ein Koordinatensystem einführen). Die meist verwendete Basis ist die Ortsraumbasis. In diesem Fall sind die Basisvektoren {|~xi} die Eigenfunktionen“ zu den Ortsoperatoren Qi . Sie erfüllen die ” Bedingung Qi |~xi = xi |~xi . (6.15) Für einen Zustand |ψi, ausgedrückt in der Ortsraumbasis, erhalten wir das Argument der Wellenfunktion am Punkte ~x (das ist die Definition der Wellenfunktion im Ortsraum): ψ(~x) := h~x|ψi . (6.16) Der Impulsoperator (bzw. seine Komponenten) ist in dieser Basis durch die kanonischen Vertauschungsrelationen (bis auf eine additive Funktion von ~x) bestimmt: Pi = −i~ ∂ . ∂xi (6.17) 122 Potenzialsysteme Hat also der Hamilton-Operator, ausgedrückt durch die Operatoren P und Q, die Form ~ P~ ) = 1 P~ 2 + V (Q) ~ , H(Q, (6.18) 2m so gilt in der Ortsraumbasis: 3 2 X ~2 ∂2 ~ P~ ) = − ~ + V (~ x ) = − ∆ + V (~x) . H(Q, 2m i=1 ∂x2i 2m (6.19) Hier haben wir etwas geschummelt“: In der Ortsraumbasis wird aus dem Hamilton-Operator ” 2 ~ P~ )|~y i = − ~ ∆y + V (~y ) δ(x − y) . h~x|H(Q, (6.20) 2m Die Wirkung von H auf einen Vektor |ψi in der Ortsraumbasis wird zu: Z Z ~2 3 3 ~ ~ ~ ~ h~x|H(Q, P )|ψi = d y h~x|H(Q, P )|~y ih~y |ψi = d y δ(x − y) − ∆y + V (~y ) ψ(~y ) 2m ~2 = − ∆ + V (~x) ψ(~x) 2m Genau auf diese technischen Feinheiten soll hier aber kein Wert gelegt werden. Damit lautet die zeitunabhängige Schrödinger-Gleichung in der Ortsraumbasis: ~2 ∆ + V (~x) ψ(~x) = E ψ(~x) . (6.21) − 2m Manchmal bezeichnet man auch diese Differentialgleichung einfach als SchrödingerGleichung. Bevor wir diese Gleichung für spezielle Potenziale betrachten, soll kurz angedeutet werden, wie die Schrödinger-Gleichung in einer andere Basis, insbesondere der Impulsraumbasis, aussieht. In der Impulsraumbasis sind die Impulsoperatoren Pi diagonal Pi |~pi = pi |~pi , (6.22) und diesmal wird aufgrund der kanonischen Vertauschungsrelationen (die in jeder Basis gelten müssen) der Ortsoperator zu einem Ableitungsoperator: Qi = i~ ∂ . ∂pi (6.23) Die Wellenfunktionen sind ψ̃(~p ) = h~p |ψi , (6.24) von denen wir schon gezeigt haben, dass es die Fourier-Transformierten der Ortsraumwellenfunktion sind. Wiederum hat man in der Hamilton-Funktion die Operatoren Q und P durch ihre Darstellung in der Impulsraumbasis zu ersetzen: ~ P~ ) = 1 p~ 2 + V (i~∇ ~ p) . H(Q, 2m (6.25) Schrödinger-Gleichung für Potenzialsysteme 123 Je nach der Funktion V handelt es sich hierbei nicht mehr um einen gewöhnlichen Differentialoperator, sondern die Funktion der Ableitung ist durch eine Fourier-Transformierte zu definieren, was zu verallgemeinerten Differentialoperatoren führt. Die Impulsraumbasis bietet sich an, wenn V ≡ 0 ist (also ein freies Teilchen), das Kastenpotenzial oder eventuell noch für den linearen Fall V = x bzw. V = |x| (in einer Dimension). Für V (x) = kx2 (also den harmonischen Oszillator) hat man im Ortsund Impulsraum den gleichen Typ von Differentialgleichung zu lösen. Wir werden im Folgenden immer in der Ortsraumbasis rechnen. 6.1.3 Symmetrien In der klassischen Mechanik spielen Symmetrien eine große Rolle. Aus dem NoetherTheorem ist bekannt, dass eine Symmetrie der Lagrange-Funktion (meist eine Symmetrie des Potenzials) zu einer Erhaltungsgröße führt. Für die Quantenmechanik haben Symmetrien eine mindestens vergleichbare Bedeutung. Eine Symmetrie ist eine Gruppe von (linearen) Transformationen T auf dem Raum der Zustände (also auf den Strahlen in dem jeweiligen Hilbert-Raum), sodass mit jeder Lösung |ψ(t)i der Schrödinger-Gleichung auch die transformierte Zustandskurve T |ψ(t)i Lösung der Schrödinger-Gleichung ist.1 Es soll also gelten: i~ d d |ψ(t)i = H|ψ(t)i =⇒ i~ T |ψ(t)i = H T |ψ(t)i . dt dt (6.26) Andererseits können wir die Schrödinger-Gleichung immer von links mit T multiplizieren, sodass unsere Forderung bedeutet: [H, T ] = 0 . (6.27) (Man beachte hier, dass T ein Operator auf dem Hilbert-Raum ist und selbst nicht explizit von der Zeit abhängt; T kann daher an der Zeitableitung vorbeigeschoben“ ” werden.) In diesem Fall folgt aus den allgemeinen Eigenschaften von linearen Operatoren, dass es eine Basis von Eigenzuständen zum Hamilton-Operator gibt, die gleichzeitig Eigenzustände von T sind. Anders ausgedrückt, H und T lassen sich gleichzeitig diagonalisieren. Aus der Eigenschaft [H, T ] = 0 folgt ebenfalls sofort, dass dhψ(t)|T |ψ(t)i = 0, dt (6.28) also T eine Erhaltungsgröße auf dem Raum der Lösungen ist (im Heisenberg-Bild, siehe Abschnitt 7.3, sieht man das unmittelbar, im Schrödinger-Bild folgt es, wie angegeben, 1 Das Wigner-Theorem besagt, dass eine solche Symmetrie immer nur durch einen unitären oder anti-unitären Operator auf dem Hilbert-Raum dargestellt werden kann. 124 Potenzialsysteme für die Erwartungswerte von T ). Sei insbesondere ψ(0), der Zustand zum Zeitpunkt t = 0, ein Eigenzustand von T zum Eigenwert τ , dann ist auch ψ(t) für alle t ein Eigenzustand zu demselben Eigenwert: T |ψ(0)i = τ |ψ(0)i =⇒ T |ψ(t)i = τ |ψ(t)i für alle t . (6.29) Da die Eigenzustände zu T entartet sein können, bedeutet dies nicht, dass sich der Zustand zeitlich nicht mehr ändert, aber seine Trajektorie“ verläuft in dem Bereich ” des Hilbertraums, der Eigenraum zu einem festen Eigenwert von T ist. Damit sind die möglichen Lösungen der zeitabhängigen Schrödinger-Gleichung sehr eingeschränkt, was bei der Suche der Lösungen oft hilft. Aber auch zur Lösung der zeitunabhängigen Gleichung (der Eigenwertgleichung für H) sind Symmetrien hilfreich. Angenommen, man kennt die Eigenzustände zu T , also Zustände mit der Eigenschaft T |τi , i i = τi |τi , i i (6.30) wobei i ein Entartungsparameter sein soll, d.h., i = 1, 2, 3, ..., ni nummeriert Eigenzustände von T zum festen Eigenwert τi , wobei ni für verschiedene Eigenwerte τi auch verschiedene Werte annehmen kann. Ist der Eigenwert τi nicht entartet (also ni = 1), dann handelt es sich bei |τi i schon um einen Eigenzustand von H. Ist τi entartet, also ni > 1, weiß man zumindest, dass die Eigenzustände von H in den Eigenräumen zu festen τi liegen, d.h., durch einen Ansatz ! ! ni ni X X a(i )|τi , i i (6.31) a(i )|τi , i i = E H i =1 i =1 hat man das Problem der Eigenvektor (und Eigenwert)-Bestimmung von H schon auf Teilräume reduziert. Je kleiner der Entartungsgrad zu den Eigenwerten der Symmetriegruppe, umso kleiner sind auch die Eigenräume, die bezüglich H noch diagonalisiert werden müssen. 6.2 Die Quantisierung der Energie Eines der augenscheinlichsten Phänomene der Quantentheorie ist die Quantisierung“ ” bestimmter Messgrößen. Hierbei handelt es sich um Observable, bei denen klassisch eine (zumindest innerhalb von Intervallen) beliebige reelle Zahl als Messwert auftreten kann. Bei Quantensystemen — also bei einer sehr genauen Analyse der Messdaten — nehmen diese jedoch nur diskrete Werte an. Am offensichtlichsten wird diese Eigenschaft bei der Energie, beispielsweise in Atomen. Die diskreten Atomspektren gehörten zu den ersten experimentellen Hinweisen, dass bei quantenmechanischen Systemen andere Gesetzmäßigkeiten als in der klassischen Newton’schen Physik gelten. Die Quantisierung der Energie 125 Die Quantisierung der Energie tritt bei vielen Potenzialsystemen auf und hat sehr allgemeine Gründe. Es erhebt sich somit die Frage, weshalb die SchrödingerGleichung ~2 ∆ + V (~x) ψE (~x) = E ψE (~x) (6.32) − 2m nur für bestimmte diskrete Werte der Energie physikalische akzeptable Lösungen hat. Wir betrachten zunächst den eindimensionalen Fall, um die Gründe hinter der Energiequantisierung zu erläutern. Die eindimensionale Schrödinger-Gleichung lautet: ~ 2 d2 − + V (x) ψE (x) = E ψE (x) . (6.33) 2m dx2 Hierbei handelt es sich um eine gewöhnliche Differentialgleichung 2. Ordnung, d.h., eigentlich würde man erwarten, dass es zu jedem beliebigen Wert von E zwei linear unabhängige Lösungen bzw. zwei Integrationskonstanten gibt. Eine dieser Konstanten R wird durch die Normierung |ψ(x)|2 dx = 1 festgelegt, doch was ist mit der anderen Konstanten? Man muss nun mehrere Fälle unterscheiden: 1. Wenn die Energie eines Teilchens zumindest asymptotisch (d.h. für große Werte von |x|) immer größer ist als das Potenzial V (x), können asymptotisch freie Teilchen existieren (siehe endliches Kastenpotenzial Kap. 6.4 und das CoulombProblem Kap. 6.8). Es gibt zwei linear unabhängige Lösungen der SchrödingerGleichung, die im Allgemeinen zwar nicht quadratintegrabel sind, aber beliebig genau durch quadratintegrable Funktionen approximiert werden können (ist das Potenzial asymptotisch konstant, handelt es sich typischerweise um Sinus- und Kosinus-Funktionen). In diesem Fall gibt es keine Energiequantisierung, streng genommen aber auch keine realisierbaren Eigenfunktionen zu einer festen Energie, sondern nur Wellenpakete“, für welche die Energie auf ein kleines Intervall ” beschränkt ist. Anschaulich lässt sich dieses Verhalten folgendermaßen vestehen. Für (E−V (x)) > 0 (der klassisch erlaubte“ Bereich, da die kinetische Energie immer positiv sein ” muss) ist die zweite Ableitung der Wellenfunktion an einer Stelle x proportional zu minus dem Wert der Wellenfunktion an dieser Stelle. Das bedeutet, die Kurve wird zur x-Achse gekrümmt. Dies führt zu dem oszillatorischen Verhalten, das man auch vom harmonischen Oszillator kennt. 2. Ist die Energie E des Teilchens kleiner als das Potenzial V (x) für x → ±∞ (d.h., gibt es einen Wert x0 , sodass E < V (x) für alle |x| > x0 ), so gibt es zwar ebenfalls zwei linear unabhängige Lösungen, die aber im Allgemeinen für |x| → ∞ exponentiell ansteigen. Durch geeignete Wahl der beiden freien Konstanten 126 Potenzialsysteme kann man zwar erreichen, dass eine Lösung für eine beliebige Energie E auf einer Seite (z.B. x → −∞) gegen null geht, diese Lösung wird aber auf der anderen Seite (x → +∞) divergieren und ist somit nicht quadratintegrabel. Nur für ganz spezielle, diskrete Werte von E erhält man auch am anderen Rand des Systems ein Verhalten der Lösung, die sie quadratintegrabel macht. Dies führt auf die Quantisierungsbedingung. Anschaulich bedeutet die Bedingung (E − V (x)) < 0 (klassisch nicht erlaubt, da diese Bedingung eine negative kinetische Energie impliziert), dass die Wellenfunktion ein exponentielles Verhalten zeigt, d.h., sich von der x-Achse weg” biegt“. Nur bei den speziellen erlaubten Energieeigenwerten, führt dieses Weg” biegen“ nicht zu einem exponentiellen Anstieg des Quadrats der Wellenfunktion, sondern zu einem exponentiellen Anschmiegen“ an die x-Achse. ” 3. Ist keine der oben genannte Bedingungen erfüllt, d.h., gibt es für beliebig große Werte von |x| immer noch Bereiche, für die manchmal E > V (x) und manchmal E < V (x) ist, so ist das Verhalten der möglichen Energieeigenwerte komplizierter. Bekannt sind periodische Potenziale, bei denen sich die Bedingungen E > V und E < V periodisch abwechseln. In solchen Fällen gibt es bestimmte Intervalle, in denen alle Werte für E erlaubt sind (sogenannte Energiebänder“), unterbrochen ” von Intervallen, in denen keine Energieeigenwerte liegen. Ganz ähnlich begründen lassen sich die Quantisierungen von Eigenwerten bestimmter Operatoren in mehr als einer Dimension. Die Quantisierung des Drehimpulses lässt sich unter anderem damit begründen, dass die Wellenfunktion in Abhängigkeit der Winkelvariablen (beispielsweise in drei Dimensionen auf einer Kugeloberfläche) eindeutig sein soll, also periodisch. Die Quantisierung der Energie folgt aus der Quadratintegrabilität für große Werte von x, bzw. in Zylinder- oder Kugelkoordinaten für die zu fordernden Randbedingungen bei r = 0 und r → ∞. 6.3 Das unendliche Kastenpotenzial Für das 1-dimensionale Kastenpotenzial (unendliche Wände) lautet die SchrödingerGleichung in der Ortsraumbasis: ~2 d2 + V (x) ψE (x) = E ψE (x) (6.34) − 2m dx2 mit ( V (x) = 0 für x ∈ [0, L] ∞ sonst . (6.35) Das unendliche Kastenpotenzial 127 Der Kasten hat also eine Gesamtbreite von L. Offenbar muss ψ(x) = 0 sein für x 6∈ [0, L], da andernfalls die linke Seite der Gleichung unendlich wird. Um zumindest eine Stetigkeit der Wellenfunktion zu garantieren, sollte ψ(x) auch bei x = 0 und x = L verschwinden, sodass wir letztendlich nach Lösungen der Gleichung 6.34 suchen, die auf das Interval x ∈ [0, L] beschränkt sind und am Rand verschwinden. Eine mathematisch strenge Begründung, weshalb wir nur Funktionen zulassen, die stetig am Rand des Kastenpotenzials gegen 0 gehen, erfordert schon einen gewissen funktionalanalytischen Aufwand — Quadratintegrabilität alleine genügt dafür nicht, denn eine Gleichung der Form (H − E)ψ(x) = 0 muss nicht unbedingt punktweise erfüllt sein, sondern lediglich bezüglich der Hilbertraumnorm. Daher kann auch die Stetigkeit nicht zwingend gefordert werden, da der Hilbertraum bezüglich seiner Norm vollständig sein muss, und nicht jede Folge stetiger Funktionen wieder stetig ist. Eine Möglichkeit, das Problem zu umgehen, ist die Einführung eines stetigen Potenzials V , für das auch die Lösungen der Differenzialgleichung stetig sein sollten. Man betrachtet dann geeignete Grenzwerte zu dem unendlichen Kastenpotenzial und überzeugt sich, dass die Lösungen stetig bleiben. Eine physikalische Begründung lautet, dass die Ableitung von ψ(x), die mit dem Impuls zusammenhängt, am Kastenrand beschränkt sein soll (sie darf einen Sprung haben, aber es sollte kein δ-förmiger Beitrag vom Rand kommen). Damit muss ψ(x) selbst wiederum stetig sein. Es ist sicherlich unbefriedigend, diese für die Quantisierungsbedingung der Energieeigenwerte so entscheidende Bedingung nicht strenger begründen zu können (zumindest nicht ohne funktionalanalytischen Aufwand). Man kann sich jedoch damit trösten, dass vergleichbare Schwierigkeiten beispielsweise beim harmonischen Oszillator, beim Coulombpotenzial für Atommodelle oder auch bei endlichen Kastenpotenzialen nicht auftreten. Gesucht sind also Lösungen der Gleichung: 2m d2 ψE (x) = − E ψE (x) mit ψ(0) = ψ(L) = 0 . dx2 ~2 (6.36) Die Lösungen der Differentialgleichung sind bekannt (es ist die Gleichung für einen harmonischen Oszillator in der klassischen Mechanik, wobei dort x der Zeit entspricht und durch das Symbol t ersetzt wird). Damit die Lösung ψ(x) die Randbedingungen erfüllen kann, muss der Ausdruck in Klammern (d.h., die Energie E) positiv sein. Die allgemeinste Lösung der Gleichung, die ψ(0) = 0 erfüllt, lautet: r ψ(x) = A sin 2mE x ~2 ! . (6.37) Da andererseits aber auch ψ(L) = 0 gelten soll, muss die sogenannte Quantisierungsbedingung gelten: r 2mE (nπ~)2 L = nπ bzw. En = . (6.38) ~2 2mL2 128 Potenzialsysteme Wir gelangen also zu einer ersten wichtigen Schlussfolgerung: Die Bedingungen an die Lösungen der Schrödinger-Gleichung sind nicht für beliebige Werte für E erfüllbar, sondern nur für einen diskreten Satz {En } von Energiewerten. Allgemein könnte n eine beliebige ganze Zahl sein, doch nicht alle Möglichkeiten entsprechen verschiedenen Zuständen. Der Fall n = 0 führt auf die triviale Lösung ψ(x) ≡ 0. Sie entspricht keinem Zustand (im Sinne eines Strahls im Hilbertraum). Wegen der Asymmetrie der Sinus-Funktion, sin x = − sin(−x), definiert ein negativer Wert für n denselben Zustand wie ein positiver Wert. Verschiedene Zustände erhalten wir somit für n = 1, 2, 3, . . ..2 Lösungen der zeitunabhängigen Schrödinger-Gleichung zu verschiedenen Zuständen sind somit: nπx n = 1, 2, 3, ... (6.39) ψn (x) = An sin L mit den zugehörigen Energieeigenwerten En = (nπ~)2 . 2mL2 (6.40) Da wir Zustände durch normierte Eigenvektoren (in diesem Fall Eigenfunktionen“) ” RL repräsentieren wollen, müssen wir die Amplitude noch so wählen, dass 0 |ψn (x)|2 dx = 1. Das führt auf die Bedingung: 2 Z |An | L sin2 nπx 0 L dx = 1 (6.41) oder r An = 2 . L (6.42) Zunächst könnte man meinen, dass mit den möglichen Energiewerten (6.40) auch bestimmte Impulse pn = nπ~ L einhergehen. Dies ist aber nicht der Fall: Offenbar sind die Sinus-Funktionen keine Eigenfunktionen zum Impulsoperator: P sin nπ nπ nπ d nπ x = −i~ sin x = −i~ cos x L dx L L L (6.43) Sie sind aber Eigenfunktionen zum Quadrat des Impulsoperators: nπ nπ nπ~ 2 nπ 2 2 d P sin x = −~ sin x = sin x . L dx2 L L L 2 2 (6.44) Man beachte, dass die Entartung der Energieeigenwerte En für positive und negative Werte von n noch kein Grund ist, eine der beiden Möglichkeiten auszuschließen; man muss überprüfen, ob physikalisch unterschiedliche Zustände vorliegen, also ob die zugehörigen Wellenfunktionen linear unabhängig sind. Das unendliche Kastenpotenzial 129 Tatsächlich zeigt die komplexe Zerlegung der Sinus-Funktion in zwei Exponentialfunktionen, dass die Energieeigenfunktionen Superpositionen von Zuständen mit positivem und negativem Impuls sind, und daher keinen reinen Impulseigenwert haben, wohl aber einen reinen Eigenwert zum Quadrat des P2 auch zu erwarten ist. Impulses, wie es aus der Darstellung der Energie H = 2m ΨHxL ÈΨHxLÈ2 En 0 En n=6 n=6 n=5 n=5 n=4 n=4 n=3 n=2 n=1 n=3 n=2 n=1 L 0 L Abbildung 6.1: Die niedrigsten Energieeigenfunktionen (links) und ihre Absolutquadrate (rechts) beim unendlichen Kastenpotenzial. Als Ergebnis erhalten wir die normierten Eigenfunktionen und die zugehörigen Eigenwerte für das 1-dimensionale Kastenpotenzial: r nπ 2 (nπ~)2 sin x En = n = 1, 2, 3, ... (6.45) ψn (x) = L L 2mL2 Diese Eigenfunktionen zum Energieoperator bilden ein vollständiges Orthonormalsystem, das sich auch als Basis für beliebige Funktionen über dem Intervall [0, L] eignet. Die Orthogonalität der Eigenfunktionen folgt aus der Eigenschaft: 2 L Z L 0 nπ mπ sin x sin x dx = δmn . L L (6.46) Abschließend ein paar Bemerkungen: 1. Die Abhängigkeit der Energieeigenwerte von einigen Parametern sollte man nochmals betonen: En ∝ n2 En ∝ 1 L2 En ∝ 1 m En ∝ ~2 (6.47) 130 Potenzialsysteme - Die erste Abhängigkeit bedeutet, dass die Abstände zwischen den Energien mit zunehmendem n immer größer werden. Dies ist zunächst eigenartig, da für sehr große (makroskopische) Energien auch die Lücken zwischen benachbarten Energieeigenwerten sehr groß werden. Andererseits ist En+1 − En 2n + 1 ∆En 2 = = → . 2 En En n n (6.48) Relativ werden die Abstände somit kleiner. Außerdem handelt es sich um eine Besonderheit des 1-dimensionalen Kastens. In drei Dimensionen kann man zeigen, dass die Anzahl der Zustände in einem vorgegebenen Energieintervall mit wachsender Energie zunimmt. - Die zweite Abhängigkeit bedeutet, dass die Energieeigenwerte immer enger zusammenrücken, je größer der Kasten ist. Drückt man den Kasten sehr langsam zusammen, sodass ein Teilchen im n-ten Niveau auch in diesem Niveau bleibt (hier spricht man manchmal von einer adiabatischen Zustandsänderung, obwohl man besser von einer reversiblen Änderung sprechen sollte), so wird die Energie größer. Es gibt also einen Druck. - Die Proportionalität zu 1/m bedeutet, dass die Energieeigenwerte umso enger zusammenrücken, je größer die Masse m ist. Insbesondere sind die Effekte der Quantisierung für makroskopische Körper praktisch nicht spürbar. - Die letzte Abhängigkeit zeigt, dass die Diskretheit der Energieeigenwerte ein Quanteneffekt ist. Sie zeigt aber auch gleichzeitig, dass man für einen klassischen Grenzfall nicht einfach ~ = 0 setzen darf. 2 (π~) 2. Der niedrigste Energieeigenwert ist E1 = 2mL 2 , also von 0 verschieden. Man bezeichnet diese Energie als Grundzustandsenergie. Eine solche Grundzustandsenergie muss es aufgrund der Unschärferelationen für räumlich begrenzte Quantensysteme immer geben, denn ein exakt verschwindender Impuls erfordert eine unendlich ausgedehnte räumliche Verteilung, die aber in einem endlichen Kastenpotenzial nicht vorliegen kann. Ganz grob kann man sagen, dass ∆x von der Größenordnung von L ist, und somit muss ∆p von der Größenordnung ~/L sein. ~2 2 Dazu gehört aber eine Energie von 2mL entspricht das 2 . Bis auf den Faktor π der Grundzustandsenergie. 3. Für sehr große Werte von n werden die Eigenfunktionen sehr rasch oszillierend. Die Wahrscheinlichkeit, bei einer Messung ein Teilchen in dem Interval [x, x+∆x] anzutreffen, ist: 2 w∆x (x) = L Z x x+∆x sin2 nπ ∆x x dx ≈ (für n groß). L L (6.49) Das unendliche Kastenpotenzial 131 Die letzte Approximation ist gültig, wenn die halbe Periode der Sinus-Funktion L klein gegenüber der Intervallbreite ∆x ist. In diesem Fall erhalten wir also n das klassische Ergebnis, wonach die Aufenthaltswahrscheinlichkeit eines freien Teilchens (konstante Geschwindigkeit) in einem Kasten überall gleich ist. 4. Die letzte Bemerkung deutet schon darauf hin, dass wir im Grenzfall n → ∞ und ~ → 0 sodass E = const (ein klassischer Energiewert) nicht das klassische Verhalten erhalten, das wir naiv erwarten würden. Die Eigenfunktionen zum Energieoperator sind stationär, d.h., die Eigenzustände bleiben zeitlich konstant. Das klassische Verhalten, nämlich dass ein Teilchen mit einer bestimmten Energie auch eine bestimmte Geschwindigkeit hat und sich in dem Kasten hin- und herbewegt, wird auch für beliebig große Werte von n nicht beschrieben. Die klassischen Bewegungszustände sind keine (stationären) Energieeigenzustände. Das Gleiche gilt für klassisch lokalisierte Teilchen: Die Aufenthaltswahrscheinlichkeit zu den Energieeigenzuständen ist über den gesamten Kasten verteilt. An diesem Beispiel erkennt man schon, dass ein klassischer Grenzfall, der wirklich zu den klassisch beobachteten Bewegungen und Lokalisierungen führt, nicht selbstverständlich ist. 5. Wir haben das Kastenpotenzial asymmetrisch“ zur 0 gelegt. Dies ist meist ” unüblich, da man symmetrische Potenziale bevorzugt (die Gründe wurden im vorigen Abschnitt behandelt). Natürlich hätten wir das Potenzial auch symmetrisch in das Intervall [− L2 , L2 ] legen können. Für die Eigenfunktionen bedeutet dies eine Verschiebung ψn (x) → ψ̂n (x) = ψn (x + L2 ) und die Energieeigenwerte ändern sich nicht. Der kleine Nachteil ist, dass die Verschiebung nun eine Fallunterscheidung erfordert und abwechselnd zu Sinus- und Kosinus-Funktionen führt: q nπ 2 cos x n = 1, 3, 5, . . . L L ψ̂n (x) = (6.50) q 2 nπ sin L x n = 2, 4, 6, . . . L Andererseits erkennen wir an dieser Darstellung auch eine Symmetrieeigenschaft der Lösungen: ψ̂n (−x) = (−1)n+1 ψ̂n (x) . (6.51) Diese Symmetrieeigenschaft der Lösungen hängt mit der Symmetrie des Potenzials zusammen. Es gilt nun V (−x) = V (x), d.h., das Potenzial ändert sich unter einer Paritätstransformation nicht. Definieren wir P (den Paritätsoperator; nicht zu verwechseln mit dem Impulsoperator) als Operator auf dem Hilbertraum durch die Vorschrift P ψ(x) ≡ ψ P (x) = ψ(−x) , (6.52) 132 Potenzialsysteme so kommutiert dieser Operator mit dem Hamilton-Operator: [H, P ] = 0. Nach den Überlegungen des vorigen Abschnitts können wir die Eigenfunktionen von H nach den Eigenfunktionen von P klassifizieren. Da P 2 = 1, kann P nur die Eigenwerte +1 und −1 haben, und die Eigenfunktionen erfüllen P ψ(x) = ψ(−x) = ± ψ(x) . (6.53) Die symmetrischen Funktionen haben somit den Eigenwert +1 und die antisymmetrischen den Eigenwert −1 in Bezug auf P . 6.4 Das endliche Kastenpotenzial — Tunneleffekt Wir betrachten nun ein ähnliches Problem wie zuvor, allerdings soll das Potenzial nun eine endliche Höhe haben: ( 0 für |x| ≤ L2 . (6.54) V (x) = V sonst Außerdem haben wir das Potenzial nun symmetrisch zu 0 gelegt. Der Grund ist (wie schon im letzten Abschnitt angemerkt), dass die Eigenfunktionen von H nun entweder symmetrisch ψ(−x) = ψ(x) oder antisymmetrisch ψ(−x) = −ψ(x) gewählt werden können, weil die Spiegelung am Nullpunkt eine Symmetrie des Problems darstellt. Innerhalb des Potenzialkastens gilt dieselbe Gleichung, wie schon beim unendlichen Kastenpotenzial: − ~2 d2 ψ(x) = Eψ(x) 2m dx2 außerhalb des Potenzials gilt ~2 d2 − + V ψ(x) = Eψ(x) 2m dx2 |x| ≤ L , 2 |x| > oder ~2 d2 ψ(x) = (E − V )ψ(x) 2m dx2 Das können wir auch zusammenfassen: 2m − E ψ(x) 2 2 ~ d ψ(x) = dx2 − 2m (E − V ) ψ(x) 2 ~ − (6.55) |x| > L , 2 (6.56) L . 2 |x| ≤ L 2 |x| > L 2 (6.57) , . (6.58) Zunächst müssen wir uns wieder überlegen, welche Randbedingungen an die Wellenfunktion wir bei |x| = L2 zulassen. Da V endlich ist, gibt es keinen Grund anzunehmen, dass die Wellenfunktion außerhalb des Potenzialtopfes verschwindet. Da das Das endliche Kastenpotenzial – Tunneleffekt 133 Potenzial bei x = ± L2 einen Sprung macht, und ψ(x) an dieser Stelle nicht verschwindet, macht auch das Produkt V (x)ψ(x) dort einen Sprung. Damit die Eigenwertgleichung gelöst werden kann, muss somit auch die zweite Ableitung von ψ(x) an dieser Stelle einen Sprung machen (sollte aber keinen δ-förmigen Beitrag liefern). Wenn die zweite Ableitung einen Sprung macht, muss die erste Ableitung einen Knick haben und somit muss die Wellenfunktion selbst an der Stelle einmal stetig differenzierbar sein. Diese Anschlussbedingung wird für die folgende Quantisierungsbedingung wichtig: Wäre, wie beim unendlichen Kastenpotenzial, ein Knick in ψ zulässig, gäbe es keine Quantisierungsbedingung; ja, es wären sogar alle positiven und negativen Werte für E zulässig. Erst die Forderung, dass auch die erste Ableitung stetig ist, führt auf die Einschränkungen. Allgemein hat die Gleichung d2 ψ(x) = αψ(x) dx2 (6.59) folgende (reelle) Lösungen: α>0: √ ψ(x) = A exp(± αx) (6.60) bzw. die symmetrischen und antisymmetrischen Kombinationen √ √ ψ(x) = A cosh αx und ψ(x) = B sinh αx . (6.61) Außerdem α<0: ψ(x) = A sin √ αx und √ ψ(x) = B cos αx . (6.62) Der Fall α = 0 führt auf die allgemeine Lösung ψ(x) = c1 +c2 x. Quadratintegrabilität erfordert c2 = 0. Die Lösung ψ(x) = c ist insofern zulässig, als sie beliebig genau durch quadartintegrable Funktionen approximiert werden kann. In Anhang A1 werden die Anschlussbedingungen für die beiden Fälle E > V und E < V genauer behandelt. Hier fassen wir nur die wichtigsten Ergebnisse zusammen: E > V : Für E > V gibt es keine Quantisierung der Energie sondern freie Teilchen. Sowohl im Inneren des Kastens als auch außerhalb erhält man als Lösungen Winkelfunktionen, wobei die Wellenlänge dieser Winkelfunktionen im Inneren des Kastens (wegen des größeren Impulses der Teilchen) kleiner ist. Zu jedem Energiewert erhält man sogar zwei linear unabhängige Lösungen, mit denen man die Streuung an einem Kastenpotenzial beschreiben kann. 134 Potenzialsysteme Die Amplituden der Wellenfunktion sich innerhalb des Kastens kleiner als außerhalb. Dies zeigt auch eine quasi-klassische Überlegung: Im äußeren Bereich sind die Teilchen langsamer als im inneren und haben dort (pro Längeneinheit) im Mittel eine größere Aufenthaltswahrscheinlichkeit als im Inneren des Kastens. Etwas entartet ist der Grenzfall E = V . Nun gibt es außerhalb des Kastens nur eine konstante Lösung (die beliebig genau durch eine quadratintegrable Funktion approximiert werden kann), sie hat also immer die Ableitung null. Die möglichen Wellen im Inneren des Kastens haben am Rand jedoch nur die Ableitung null, √ wenn 2mV /~2 = nπL. E < V : In diesem Fall sind die erlaubten Energieeigenwerte quantisiert. Es gibt immer mindestens eine diskrete Lösung. Im Inneren des Kastens, also dem klassisch erlaubten Bereich, erhält man wieder eine Winkelfunktion als Lösung, deren Wellenlänge über die Beziehung von deBroglie mit dem Impulsbetrag des Teilchens im Kasten zusammenhängt. Außerhalb des Kastens verschwindet die Wellenfunktion exponentiell nach folgender Beziehung: ! p 2m(V − E) |x| (|x| > L/2) . (6.63) ψ(x) ∝ exp − ~ 6.4.1 Der Tunneleffekt Alle gebundenen Lösungen beim endlichen Kastenpotenzial haben die Eigenschaft, dass die Lösungen auch außerhalb des Kastens nicht identisch null sind, d.h., es gibt selbst für gebundene Teilchen eine nicht verschwindende Wahrscheinlichkeit, dass sie außerhalb des Kastens angetroffen werden, wenn auch diese Wahrscheinlichkeit mit zunehmendem Abstand exponentiell abnimmt. Zur quantitativeren Behandlung des Tunneleffekts stellen wir uns vor, dass das Potenzial nach einer Dicke d wieder auf null fällt, also von folgender Form ist L 0 |x| ≤ 2 V (x) = (6.64) V L2 < |x| ≤ L2 + d 0 |x| > L + d 2 Hinsichtlich der Bedingungen an den Grenzen des Potenzialwalls beschränken wir uns im Folgenden wieder auf den Fall x > 0, der durch eine symmetrische oder antisymmetrische Erweiterung der Lösungen auch immer auf den Fall x < 0 fortgesetzt werden kann. Außerdem betrachten wir nur Energien 0 < E < V . Die stationären Lösungen liefern keine Wahrscheinlichkeit für den Tunnelprozess sondern beschreiben das System, nachdem es in einen Gleichgewichtszustand“ ” gekommen ist, d.h., die Wahrscheinlichkeit für das Tunneln von Innen nach Außen ist Der harmonische Oszillator 135 ebenso groß wie die Wahrscheinlichkeit für den umgekehrten Prozess. Daher wählen wir eine etwas andere Strategie. Wir nehmen an, dass der Kasten zunächst unendlich dick ist, wir es also mit einem richtigen Kastenpotenzial zu tun haben. Dann bestimmen wir das Integral über das Absolutquadrat des Teils der Wellenfunktion, der einen Abstand von mehr als L2 + d vom Kastenmittelpunkt hat. Dies gibt uns eine Vorstellung, mit welcher Wahrscheinlichkeit sich das Teilchen außerhalb des Bereichs befindet, in dem das tatsächliche Kastenpotenzial liegt. Nach den Überlegungen des letzten Abschnitts hat die Wellenfunktion in den Kastenwänden die Form √ ψ(x) ∝ exp(− ν − x) für |x| > L . 2 (6.65) Über den Bereich d im Inneren der Kastenwand fällt die Amplitude um den Faktor √ exp(− ν − d) (6.66) und damit die Wahrscheinlichkeit um den Faktor √ w ∝ exp(−2 ν − d) (6.67) ab. Diese Größe gibt an, mit welcher Wahrscheinlichkeit ein Teilchen pro Zeiteinheit durch die Kastenwand hindurchtunneln kann. Im Exponenten steht also sowohl die Wanddicke als auch die (Wurzel aus der) Differenz zwischen der Energie des Teilchens und der Potenzialhöhe. Die mittlere Zeit, bis ein Teilchen ein solches Kastenpotenzial verlassen hat, ist also proportional zum Inversen dieses Faktors und exponentiell groß als Funktion der Wanddicke und der zu überwindenden Potenzialbarriere. Diese exponentielle Abhängigkeit der Tunnelwahrscheinlichkeit von der Dicke d des zu überwindenden Potenzials spielt beim Rastertunnelmikroskop eine wichtige Rolle. Beim Rastertunnelmiskroskop wird eine mikroskopisch feine Metallspitze dicht über eine abzutastende Oberfläche gebracht und zwischen der Metallspitze und der Oberfläche eine Spannung angelegt. Der Zwischenraum zwischen Metallspitze und Oberfläche entspricht der Potenzialwand, die von einem Elektron überwunden werden muss, damit ein Strom fließt. Durch den Tunneleffekt kann es trotzdem zu einem Elektronenfluss und damit zu einem Strom kommen. Dieser Strom hängt exponentiell von dem Abstand d ab und erlaubt dadurch sehr feine Bestimmungen von d. In der Praxis hält man meist den Strom konstant, indem man (über Piezokristalle) die Höhe der Spitze variiert, sodass der Abstand von der rauen Oberfläche konstant bleibt. Gerade wegen der exponentiellen Abhängigkeit von dem Abstand d ist dieses Verfahren sehr empfindlich. 136 6.5 Potenzialsysteme Der harmonische Oszillator Wir betrachten im Folgenden den 1-dimensionalen harmonischen Oszillator. Auf Verallgemeinerungen auf mehr als eine Dimension gehen einige Anmerkungen ein. Die zeitunabhängige Schrödinger-Gleichung für den eindimensionalen harmonischen Oszillator lautet: ~2 d2 mω 2 2 (6.68) x ψ(x) = Eψ(x) , − + 2m dx2 2 p wobei wir ω = k/m als Eigenfrequenz des klassischen Oszillators eingeführt haben (und k im klassischen Fall die Federkonstante“ bezeichnet). ” Geschicktes Raten“ zeigt, dass eine Gauß-Funktion eine Lösung der Gleichung ” darstellen kann, da d2 −αx2 2 e = (−2α + 4α2 x2 )e−αx . (6.69) 2 dx Durch Vergleich mit der Schrödinger-Gleichung erhalten wir mω x2 (6.70) ψ0 (x) = A0 exp − 2~ (A0 eine geeignete Normierung) und 1 E0 = ~ω . 2 (6.71) (Theoretisch könnte α auch negativ sein, was sowohl das Vorzeichen im Exponenten der Lösung (6.70) als auch das der Energie (Gl. 6.71) umkehren würde; doch die so erhaltene Lösung wäre nicht quadratintegrabel.) 6.5.1 Exakte Lösung der Schrödinger-Gleichung Man könnte nun durch weiteres geschicktes Raten einen Ansatz der Form ψ(x) = H(x)e−αx 2 (6.72) versuchen, wobei H(x) ein Polynom in x ist. In diesem Fall erhält man wieder α = mω 2~ sowie für H(x) die Differentialgleichung: 2mω 2mE mω 00 0 H (x) − x H (x) + − H(x) = 0 , (6.73) ~ ~2 ~ die man nun durch geeignete Ansätze für Polynome in x lösen kann. Auf diese Weise erhält man z.B. für H1 (x) = x als Lösung: mω ψ1 (x) = A1 x exp − x2 (6.74) 2~ Der harmonische Oszillator 137 (A1 eine geeignete Normierung) und 3 E1 = ~ω . 2 (6.75) Da das Potenzial des harmonischen Oszillators invariant unter einer Paritätstransformation x → −x ist (und die Gauß-Funktion ebenfalls invariant ist), kommen als (nicht-entartete) Lösungen von Gleichung (6.73) nur gerade bzw. ungerade Polynome in x in Frage. H0 = 1 (zur Lösung 6.70) und H1 = x erfüllen diese Bedingung. Die Polynome höherer Ordnung sind jedoch Linearkombinationen aus nur geraden bzw. nur ungeraden Potenzen von x. Ein wesentlich eleganterer Weg ist der Folgende: Man schreibt 1 mω 2 2 H = ~ω P + Q (6.76) 2m~ω 2~ und definiert zunächst r r mω 1 a† = Q+i P 2~ 2m~ω sodass r und a= mω Q−i 2~ r 1 P, 2m~ω ω 1 † H = ~ω a a − i [Q, P ] = ~ω a a + . 2 2 † (6.77) (6.78) Für die Operatoren a† und a verifiziert man leicht die Vertauschungsrelationen [a† , a† ] = [a, a] = 0 und [a† , a] = −1 , (6.79) [H, a] = −~ωa . (6.80) und daraus wiederum [H, a† ] = +~ωa† und Sei nun |Ei ein beliebiger Eigenvektor von H, also H|Ei = E|Ei, dann gilt offenbar: H a† |Ei = a† H|Ei + ~ωa† |Ei = (E + ~ω) a† |Ei (6.81) und entsprechend H (a|Ei) = aH|Ei − ~ωa|Ei = (E − ~ω) (a|Ei) . (6.82) Die Vektoren a† |Ei und a|Ei sind also wieder Eigenvektoren zu H und zwar mit den Eigenwerten E + ~ω bzw. E − ~ω. Auf diese Weise können wir aus bekannten Eigenzuständen neue Eigenzustände konstruieren. Man bezeichnet a† auch als Aufsteigeoperator und a als Absteigeoperator. Es hat zunächst den Anschein, dass wir auf diese Weise nicht nur Energieeigenzustände zu beliebig hohen Werten konstruieren können, sondern mithilfe der 138 Potenzialsysteme Absteigeoperatoren auch Energieeigenzustände zu beliebig negativen Energieeigenwerten. Das ist jedoch nicht der Fall, wie wir sofort zeigen werden. Sei |Ei ein normierter Energieeigenzustand (also hE|Ei = 1), dann gilt für die Norm des Zustands a|Ei): 2 † ka|Eik = hE|a a|Ei = 1 E − ~ω 2 hE|Ei = E 1 − ~ω 2 (6.83) H (wobei wir a† a = ~ω − 21 ausgenutzt haben.) Damit die Norm positiv bleibt (der Zustand also normierbar ist), darf die rechte Seite nie negativ werden. Das ist aber nur der Fall, wenn die rechte Seite irgendwann einmal null wird (also ein Eigenvektor durch einen Absteigeoperator zum Nullvektor wird) und somit die Energie eine untere Grenze besitzt, die durch E0 = 12 ~ω gegeben ist. Durch Anwendung von a† auf diesen Zustand erhalten wir einen nach oben unbeschränkten Turm von Eigenzuständen von H mit Eigenwerten: 1 n = 0, 1, 2, 3 . . . (6.84) En = ~ω n + 2 Andere Eigenwerte als diese kann es auch nicht geben, da man sonst durch wiederholte Anwendung der Absteigeoperatoren Zustände mit negativer Norm“ erzeugen ” könnte. Außerdem können diese Zuände nicht entartet sein (es sei denn, |E0 i ist schon entartet). Mit diesem Trick haben wir somit schon das gesamte Energiespektrum des eindimensionalen harmonischen Oszillators gefunden. Außerdem können wir mithilfe des Aufsteigeoperators alle Eigenzustände konstruieren (bis auf die Normierung), wenn wir von dem sogenannten Grundzustand zur Energie E0 = 21 ~ω starten. Die zugehörige Wellenfunktion haben wir aber schon gefunden (Gl. 6.70). Wir erhalten also (in der Ortsdarstellung) aus ψ0 (x) die Wellenfunktion des ersten angeregten Zustands: ! r mω mω ~ d x− exp − x2 ψ1 (x) ∝ a† ψ0 (x) = A0 2~ 2mω dx 2~ mω x2 = A1 2x exp − 2~ r (6.85) (6.86) mit der neuen Normierungskonstanten A1 . Diese Lösung hatten wir zuvor schon erraten. Für die weiteren Überlegungen ist es hilfreich, eine neue (dimensionslose) Variable r y= mω x ~ (6.87) zu definieren, sodass 1 a =√ 2 † d y+ . dy (6.88) Der harmonische Oszillator 139 Bis auf Normierungsfaktoren ist dann: 1 2 ψ0 (y) = A0 exp − y und 2 1 2 ψ1 (y) = A1 2y exp − y 2 und durch erneute Anwendung von a† folgt: 1 d 1 2 † ψ2 (y) ∝ a ψ1 (y) = A1 √ y − 2y exp − y dy 2 2 1 = A2 4y 2 − 2 exp − y 2 . 2 (6.89) (6.90) (6.91) (Die Wahl des Koeffizienten vor den Polynomen ist Konvention.) Auf diese Weise erhält man für ψn (y) ein Polynom n. Ordnung multipliziert mit einer Gaußfunktion. Diese Polynome bezeichnet man auch als Hermite-Polynome: H0 (y) = 1 (6.92) H1 (y) = 2y (6.93) 2 H2 (y) = 4y − 2 (6.94) 3 H3 (y) = 8y − 12y 4 (6.95) 2 H4 (y) = 16y − 48y + 12 (6.96) H5 (y) = 32y 5 − 160y 3 + 120y .. .. . . (6.97) Insgesamt erhalten wir als Eigenfunktionen für den harmonischen Oszillator: r 2 y mω ψn (x) = An Hn (y) exp − y= x, 2 ~ (6.98) (6.99) mit der Normierung p 4 mω/~ An = p (6.100) √ . 2n n! π Zusammenfassend können wir sagen: Die Energieeigenwerte beim harmonischen Oszillator (in einer Dimension) sind äquidistant (mit Abstand ∆E = ~ω). Es gibt eine Grundzustandsenergie E0 = 21 ~ω zum Zustand niedrigster Energie, und die möglichen Energieeigenwerte sind En = ~ω(n+ 12 ) (n = 0, 1, 2, ...). Die Parität des Grundzustands ist +1, ebenso die Parität aller Eigenfunktionen zu geraden n, die anderen Eigenfunktionen haben ungerade Parität (diese Eigenschaft folgt sofort indem man beobachtet, dass a† ein Operator ungerader Parität ist): ψ2n (−x) = ψ2n (x) ψ2n+1 (−x) = −ψ2n+1 (x) . (6.101) Für sehr große Werte von n erhält man Eigenfunktionen, die außerhalb des Potenzials rasch abfallen (entsprechend der Gauß–Funktion) und im Inneren sehr rasch 140 Potenzialsysteme E @ÑΩD 5 -4 -2 E @ÑΩD 5 4 4 3 3 2 2 1 1 0 2 y 4 -4 -2 0 2 4 y Abbildung 6.2: Die niedrigsten Energieeigenfunktionen (links) und ihre Absolutquadrate (rechts) für den harmonischen Oszillator. ÈΨHxLÈ2 0.25 0.20 0.15 0.10 0.05 -10 -5 0 5 10 y Abbildung 6.3: Das Absolutquadrat der Energieeigenfunktion für den harmonischen Oszillator zu n = 50. Gezeigt ist außerdem die klassische Aufenthaltswahrscheinlichkeitsdichte w(x) für den entsprechenden Energiewert. Der harmonische Oszillator 141 oszillieren. Dabei ist die Amplitude an den Rändern etwas größer als in der Mitte. Das bedeutet, die Wahrscheinlichkeit, das Teilchen bei einer Messung in Randnähe zu finden, ist größer als in der Mitte. Das entspricht auch unserer klassischen Anschauung: Die Geschwindigkeit am Rand ist geringer und daher hat es dort im Durchschnitt eine höhere Aufenthaltswahrscheinlichkeit als in der Mitte. Klassisch kann man diese Aufenthaltswahrscheinlichkeit aus der Lösung dx(t) = ωA cos ωt dt x(t) = A sin ωt (6.102) leicht bestimmen. Aus der Geschwindigkeit erhalten wir eine Beziehung zwischen dt — dem Zeitintervall, für das sich ein Teilchen in dem Intervall x + dx aufhält: p p dx = ωA cos ωt dt = ω A2 − A2 sin2 ωt dt = ω A2 − x(t)2 dt (6.103) oder dt = dx ω A2 − x2 √ (6.104) Mit der Periode T = 2π folgt für die relative Zeitspanne, die sich ein Teilchen im ω Intervall dx aufhält (es gibt noch einen extra Faktor 2, da jedes Intervall dx in einer Periode T zweimal durchlaufen wird): ω(x)dx = dx dt = √ T π A2 − x2 (6.105) oder 1 w(x) = √ . (6.106) π A2 − x2 Dies ist die Aufenthaltswahrscheinlichkeitsdichte des klassischen Teilchens am Ort x. Die Wahrscheinlichkeitsdichte ist zwar an den Umkehrpunkten x = ±A singulär, aber immer noch integrabel. Dieser Funktion nähert sich das gemittelte Absolutquadrat der Wellenfunktion des harmonischen Oszillators für sehr große Werte von n an (siehe Abb. 6.3). 6.5.2 *Auf- und Absteigeoperatoren in der Quantenfeldtheorie In einer Quantenfeldtheorie gibt es nicht nur einen Schwingungsmod, sondern unendlich viele: Jede mögliche Schwingung, die mit den Randbedingungen verträglich ist, wird zu einem Mod. Die Feldgleichungen bestimmen eine Beziehung zwischen der Frequenz ω des Schwingungsmods und der Wellenlänge bzw. der Wellenzahl ~k. Die Beziehung ω(~k) bezeichnet man auch als Dispersonsrelation. Im einfachsten Fall einer freien Quantenfeldtheorie (die nur freie Teilchen ohne Wechselwirkung beschreibt) 142 Potenzialsysteme kann jeder der Moden n-fach besetzt sein. Dies interpretiert man als n Teilchen mit der Wellenzahlt ~k bzw. der Energie ~ω(~k). Es gibt zu jedem durch ~k definierten Schwingungsmod Auf- und Absteigeoperatoren a+ (~k) bzw. a(~k). Die Anwendung eines Aufsteigeoperators auf einen Zustand erzeugt ein Teilchen mit der zugehörigen Wellenzahl ~k, entsprechend vernichtet ein Absteigeoperator ein Teilchen mit dieser Wellenzahl (sofern ein solches in dem Zustand vorhanden ist, andernfalls erhält man die 0). Dementsprechend spricht man in der Quantenfeldtheorie auch von Erzeugungs- und Vernichtungsoperatoren. Die Kommutatorregeln der Auf- und Absteigeoperatoren bestimmen ihre Statistik: Bei Bosonen kommutieren die Auf- und Absteigeoperatoren zu verschiedenen Moden ~k, bei Fermionen fordert man Antikommutationsrelationen. Auf diese Weise sind Mehrteilchenzustände nach Konstruktion symmetrisch oder antisymmetrisch unter Permutation der Teilchen (siehe auch Kap. 8). Wechselwirkungen zwischen Teilchen lassen sich praktisch nur störungstheoretisch behandeln. Dabei treten Kombinationen aus mehreren Auf- und Absteigeoperationne auf. Beispielsweise beschreibt ein Ausdruck der Form a+ (~k1 )a+ (~k2 )a(~k3 ) die Vernichtung eines Teilchens zum Mod ~k3 und gleichzeitige Erzeugung zweier Teilchen mit den Moden ~k1 und ~k2 . Energie- und Impulserhaltung erfordern gewisse Einschränkungen and die möglichen Moden bei solchen Wechselwirkungen. Da es zu jedem Mod auch eine Grundzustandsenergie 12 ~ω(~k) gibt, und die Anzahl der Moden im Prinzip unendlich ist, erhält man formal in einer Quantenfeldtheorie auch eine unendliche Grundzustandsenergie. Da aber nur Energiedifferenzen beobachtet werden, spielt dies im Allgemeinen keine Rolle. Lediglich für eine Theorie der Gravitation könnte diese Grundzustandsenergie von Bedeutung sein, ihre Rolle ist aber immer noch umstritten. Dass diese Grundzustandsenergie aber tatsächlich physikalisch ist, zeigt sich im Casimir-Effekt [16, 50]: Die möglichen Moden einer Quantenfeldtheorie in einem endlichen (kleinen Volumen) hängen von den Abmessungen des Volumens ab. Daher erwartet man eine Kraft auf zwei sehr eng beieinanderliegende leitende Platten im Vakuum. Dieser Effekt wurde tatsächlich gemessen. 6.5.3 Semiklassische Berechnung der Grundzustandsenergie Wir hatten schon beim Kastenpotenzial gesehen, dass die Grundzustandsenergie sich als Folge der Unschärferelation deuten und zumindest bis auf konstante Faktoren auch berechnen lässt. Eine solche halbklassische Überlegung führt beim harmonischen Oszillator sogar zum exakten Ergebnis. Ersetzen wir in dem klassischen Ausdruck für die Energie des Oszillators E= 1 2 mω 2 2 p + x 2m 2 (6.107) Radialpotenziale und Kugelflächenfunktionen 143 den Ort“ x durch ~/2p, also das Mininum, was für einen gegebenen Impuls p nach ” der Unschärferelation zugelassen wäre, so erhalten wir E= 1 2 mω 2 ~2 p + . 2m 8p2 (6.108) Durch Bilden der Ableitung erhalten wir das Minimum der Energie für p = mω~/2, und die Energie für diesen Wert ist E= 6.5.4 1 1 mω~ mω 2 ~2 2 + = ~ω . 2m 2 8 mω~ 2 (6.109) Der harmonische Oszillator in höheren Dimensionen In mehr als einer Dimension kann man die Schrödinger-Gleichung des harmonischen Oszillators leicht durch einen Separationsansatz, beispielsweise ψ(x, y, z) = ψ1 (x)ψ2 (y)ψ3 (z) lösen. Dieser Ansatz führt für die Funktionen ψi jeweils auf die Gleichung des 1 dimensionalen Oszillators mit einer Energie Ei = ~ω ni + 21 , und die Gesamtenergie ist einfach die Summe der Teilenergien. Der Quantenzustand beispielsweise eines 3dimensionalen Oszillators lässt sich also durch drei Quantenzahlen n1 , n2 , n3 charakterisieren, und die allgemeine Lösung hat die Form mω (x2 + y 2 + z 2 ) , Ψn1 n2 n3 (x, y, z) = N Hn1 (x)Hn2 (y)Hn3 (z) exp − 2~ (6.110) (Hi bezeichnet wieder die Hermite-Polynome), und die zugehörige Energie ist 3 E = ~ω n1 + n2 + n3 + 2 (ni = 0, 1, 2, 3, ...) . (6.111) Die möglichen Energien sind zunehmend entartet: Während der Grundzustand E = 3 ~ω zu (ni = 0) eindeutig ist, ist der erste angeregte Zustand mit der Energie E = 52 ~ω 2 schon 3-fach entartet (jeder der drei n-Werte kann 1 sein, die anderen beiden sind 0) und der zweite angeregte Zustand ist schon 6-fach entartet (mit den Quantenzahltripeln {(2, 0, 0), (0, 2, 0), (0, 0, 2), (1, 1, 0), (1, 0, 1), (0, 1, 1)}. Im folgenden Abschnitt lösen wir allgemein radialsymmetrische Potenziale und stoßen dabei auf die Kugelflächenfunktionen, die mit Eigenzuständen zum Drehimpuls in Beziehung stehen. Natürlich lässt sich auch der 3-dimensionale harmonische Oszillator auf diese Weise lösen. Damit ergeben sich interessante Beziehungen zwischen den Hermite-Polynomen und den Kugelflächenfunktionen. Außerdem zeigt sich, dass die Entartung der Energiezustände unter anderem auch mit der Rotationssymmetrie und der Drehimpulserhaltung zu tun hat. 144 6.6 Potenzialsysteme Radialpotenziale und Kugelflächenfunktionen In drei Raumdimensionen spielen Potenziale, die nur vom Abstand eines massebehafteten Körpers von einem Kraftzentrum abhängen, eine besonders wichtige Rolle. Im nächsten Kapitel werden wir kurz das Wasserstoff-Atom (bzw. allgemeiner das Coulomb-Problem) betrachten. Zuvor wollen wir jedoch einige allgemeine Bemerkungen zum Zentralkraftproblem anführen. In drei Dimensionen lautet die zeitunabhängige Schrödinger-Gleichung für ein Zentralpotenzial: ~2 ∆ + V (r) ψ(x, y, z) = Eψ(x, y, z) , (6.112) − 2m wobei ∆ der Laplace-Operator ist. Ähnlich wie schon in der klassischen Mechanik ist es auch in der Quantenmechanik sinnvoll, bei Zentralpotenzialen zu Kugelkoordinaten zu wechseln. Der Laplace-Operator lautet in Kugelkoordinaten: 1 ∂ 1 2 ∂Ψ ∆Ψ(r, θ, ϕ) = 2 (6.113) r + 2 LΨ , r ∂r ∂r r wobei L ein Differenzialoperator in den Winkeln ist, d.h. nur von θ und ϕ sowie deren Ableitungen abhängt: 1 ∂ ∂Ψ 1 ∂ 2Ψ LΨ(r, θ, ϕ) = sin θ + . (6.114) sin θ ∂θ ∂θ sin2 θ ∂ϕ2 Es bietet sich daher an, die Funktion Ψ(r, θ, ϕ) in einen Radial- und einen Winkelanteil zu separieren: Ψ(r, θ, ϕ) = R(r)Y (θ, ϕ) . (6.115) Setzen wir diesen Ansatz in die Schrödinger-Gleichung ein, so erhalten wir zwei Gleichungen: LY (θ, ϕ) = −l(l + 1)Y (θ, ϕ) (6.116) und l(l + 1) ~2 1 ∂ 2 ∂R(r) − r − R(r) + V (r)R(r) = ER(r) . 2m r2 ∂r ∂r r2 (6.117) Wir haben die freie Konstante, die bei dem Separationsansatz auftritt, zunächst willkürlich mit l(l + 1) bezeichnet. Der Grund wird später offensichtlich. Zunächst könnte l(l + 1) noch eine beliebige reelle Zahl sein (reell, weil L bezüglich des Skalarprodukts in Kugelkoordinaten ein selbst-adjungierter Operator ist). Die Eigenwertgleichung ∂Y (θ, ϕ) 1 ∂ 2 Y (θ, ϕ) 1 ∂ sin θ + = −l(l + 1)Y (θ, ϕ) (6.118) sin θ ∂θ ∂θ sin2 θ ∂ϕ2 Radialpotenziale und Kugelflächenfunktionen 145 löst man wiederum durch einen Separationsansatz in den Winkeln Y (θ, ϕ) = Θ(θ)Φ(ϕ) (6.119) was für Φ(ϕ) auf die sogenannte Azimutalgleichung d2 Φ(ϕ) = −m2 Φ(ϕ) dϕ2 und für Θ(θ) auf die Polargleichung 1 ∂ ∂Θ(θ) m2 sin θ − Θ(θ) + l(l + 1)Θ(θ) = 0 sin θ ∂θ ∂θ sin2 θ (6.120) (6.121) führt. Die Lösungen der Azimutalgleichung sind komplexe Exponentialfunktionen (Winkelfunktionen): Φ(ϕ) = e±imϕ , m = 0, ±1, ±2, ... (6.122) wobei die Ganzzahligkeit der magnetischen Quantenzahl m aus der Bedingung folgt, dass die Funktion auf der Kugeloberfläche glatt bzw. eindeutig ist. Die Lösungen der Polargleichung lassen sich als Polynome in cos θ und sin θ schreiben. Allerdings sind auch hier die Lösungen nur dann eindeutig, wenn die Quantenzahl l eine natürliche Zahl (l = 0, 1, 2, 3, ...) ist. Außerdem gibt es eine Einschränkung für die magnetische Quantenzahl: m ≤ l. Die Lösungen der Polargleichung bezeichnet man als zugeordnete LegendrePolynome. Die führenden Polynome sind: P00 (cos θ) = 1 (6.123) P10 (cos θ) = cos θ (6.124) P11 (cos θ) (6.125) = − sin θ 1 (3 cos2 θ − 1) P20 (cos θ) = 2 P21 (cos θ) = −3 sin θ cos θ (6.126) P22 (cos θ) = 3(1 − cos2 θ) (6.128) (6.127) Allgemein gilt; Plm (cos θ) = l+m (−1)m (cos2 θ − 1)l md (sin θ) . 2l l! (d cos θ)l+m (6.129) Insgesamt erhalten wir somit für die Lösung der Winkelabhängigkeit der Eigenfunktionen des Energieoperators zu einem rotationssymmetrischen Problem die Kugelflächenfunktionen: 1 Ylm (θ, ϕ) = √ Nlm Plm (cos θ) exp(imϕ) , 2π (6.130) 146 Potenzialsysteme wobei die Normierungskonstanten Nlm so zu wählen sind, dass die Orthonormalitätsrelationen gelten: Z 2π dϕ 0 6.7 Z 1 0 ∗ m d(cos θ) (Ylm 0 (θ, ϕ)) Yl (θ, ϕ) = δll0 δmm0 . (6.131) −1 Der Bahndrehimpuls Wie wir gesehen haben, tritt in der Schrödinger-Gleichung in Kugelkoordinaten ein Term der Form ~2 l(l + 1) (6.132) 2mr2 auf. Schreiben wir in der klassischen Mechanik die Energie in Kugelkoordinaten (und nutzen die Drehimpulserhaltung aus), so erhalten wir: L2 1 + V (r) Eklass = mṙ2 + 2 2mr2 (6.133) Ein Vergleich mit der quantenmechanischen Beschreibung führt zu der Deutung, dass die möglichen Eigenwerte für den Betrag des Drehimpulses durch Spec L̂2 = {~2 l(l + 1)} oder p Spec|L̂| = {~ l(l + 1)} (l = 0, 1, 2, 3, ...) (6.134) gegeben sind. Außerdem legt die Analogie zur klassischen Mechanik nahe, dass −i~ ∂ = L̂z ∂ϕ (6.135) der Operator für die z-Komponente des Drehimpulses ist, und somit die Quantenzahl für die z-Komponente des Drehimpulses gleich lz = ~m (mit m = 0, ±1, ±2, .., ±l) ist. Diese Beziehungen lassen sich auch direkter ableiten. Klassisch sind die Komponenten des Drehimpulses gegeben durch x p − x p 2 3 3 2 3 X ~ = x3 p 1 − x1 p 3 . Li = ijk xj pk bzw. L (6.136) j,k=1 x1 p 2 − x2 p 1 Die Poisson-Klammer für die Drehimpulskomponenten lautet: {Li , Lj } = 3 X k=1 ijk Lk . (6.137) Das Wasserstoffatom 147 Das bedeutet für die Kommutatorrelationen der Drehimpulsoperatoren: [L̂i , L̂j ] = i~ 3 X ijk L̂k . (6.138) k=1 Diese Relationen lassen sich in der Ortsdarstellung (bei denen pi durch i~∂i ersetzt wird) auch direkt aus 3 X ∂ (6.139) L̂i = i~ ijk xj ∂xk j,k=1 ableiten. Eine etwas längere Rechnung, bei der diese Ausdrücke in Kugelkoordinaten übertragen werden, führt auf die schon bekannten Beziehungen für L̂z (Gl. 6.135) und L̂2 (Gl. 6.118): L̂z = −i~ L̂ 6.8 2 2 = −~ ∂ ∂ϕ (6.140) 1 ∂ sin θ ∂θ ∂ 1 ∂2 sin θ + ∂θ sin2 θ ∂ϕ2 (6.141) Das Wasserstoffatom Bisher haben wir den Winkelanteil der Schrödinger-Gleichung zu einem radialsymmetrischen Potenzial gelöst und gesehen, dass wir zwei Quantenzahlen l und m erhalten, die wir mit dem Betrag des Drehimpulses und der z-Komponente des Drehimpulses in Beziehung setzen können. Nun betrachten wir den radialen Anteil der Schrödinger-Gleichung (Gl. 6.117), in dem noch das Potenzial V (r) steht. Ganz allgemein führt der Ansatz u(r) = rR(r) in Gl. 6.117 auf folgende Gleichung 2 ~ l(l + 1) ~2 ∂ 2 u(r) + + V (r) u(r) = Eu(r) . (6.142) − 2m ∂r2 2m r2 Dies ist eine eindimensionale Schrödinger-Gleichung für ein effektives Potenzial: Veff (r) = ~2 l(l + 1) + V (r) , 2m r2 (6.143) was im Vergleich mit der klassischen Mechanik nochmals die Rolle von ~2 l(l + 1) als Quantenanalogon zum Drehimpulsquadrat unterstreicht. Für das Wasserstoffatom (oder allgemeiner das Coulomb-Problem mit einer 2 Kernladung Ze) setzen wir V (r) = − Zer und erhalten als Radialgleichung: 2 ~2 ∂ 2 u(r) ~ l(l + 1) Ze2 − + − u(r) = Eu(r) . (6.144) 2m ∂r2 2m r2 r 148 Potenzialsysteme (Man beachte, dass wir hier, wie in der theoretischen Physik oft üblich, die CoulombKonstante 1/(4π) in die Ladung aufgenommen, also Gauß’sche Einheiten gewählt haben. Im Vergleich zu anderen Konventionen wird dieser Faktor daher auch im Ergebnis fehlen.) Da es sich eigentlich um ein Zweikörperproblem handelt, ist m strenggenommen die reduzierte Masse und r der Relativabstand zwischen Elektron und Atomkern. Wegen der großen Masse des Atomkerns können wir aber in guter Näherung m = me (Elektronenmasse) setzen und den Atomkern als nahezu statisch ansehen. Damit der eigentliche radiale Anteil R(r) = u(r)/r der Wellenfunktion quadratintegrabel bei r = 0 bleibt, sollte u(r) für r → 0 gegen eine Konstante gehen oder 1 verschwinden. (Eigentlich wäre auch eine Potenz r− 2 + mit > 0 zugelassen, aber eine genauere Analyse zeigt, dass dieser Fall nicht auftritt.) Nehmen wir rα als das führende Verhalten von u(r) für r → 0 an, so dominiert in diesem Grenzfall der Term vom Drehimpuls (außer für l = 0) und für eine Lösung von Gl. 6.144 muss gelten: α(α − 1) = l(l + 1) (6.145) mit den beiden Lösungen α = l + 1 und α = −l, oder ( r→0 u(r) −→ rl+1 r−l . (6.146) Der untere Fall kann (zunächst für l 6= 0, eine genauere Analyse zeigt aber, dass dies auch für l = 0 gilt) nicht auftreten, da die Lösung nicht quadratintegrabel wäre, r→0 also bleibt nur u(r) −→ const. × rl+1 übrig. Für r → ∞ können wir die beiden Potenzialterme vernachlässigen und finden √ 2mE r E>0 exp ± i ~ r→∞ √ (6.147) u(r) −→ 2m|E| E<0 exp − ~ r Der Fall E > 0 führt auf asymptotisch freie Lösungen. Da hier beide Vorzeichen möglich sind, liefert die eine Randbedingung bei r → 0 keine Einschränkung an den Energieeigenwert E. Diese Lösungen sind interessant, wenn man Streuprobleme an Atompotenzialen untersuchen möchte. √ +( 2m|E|/~)r Der hier interessantere Fall ist E < 0. Streng genommen wäre auch e eine Lösung, diese wäre aber nicht quadratintegrabel. Die beiden Randbedingungen an u(r) für r → ∞ und für r → 0 führen zu einer Quantisierungsbedingung an E. Es zeigt sich, dass nur folgende Eigenwerte für die Energie möglich sind: En = − mZ 2 e4 1 · 2 2~2 n mit n = 1, 2, 3, ... (6.148) Das Wasserstoffatom 149 Die Quantenzahl n bezeichnet man als Hauptquantenzahl. Der tiefste Wert n = 1 bezeichnet die Grundzustandsenergie des Wasserstoffatoms. Für Z = 1 (und m = me die Elektronenmasse) lautet die Rydberg-Konstante me4 = 13, 605 eV (Ionisierungsenergie, n = 1) . 2~2 Dies ist gleichzeitig die Ionisierungsenergie für ein Wasserstoffatom. (6.149) Um diese Zahl besser einordnen zu können, vergleichen wir sie mit anderen Größen. Die thermische Energie zu einer (absoluten) Temperatur T ist E = kB T , wobei kB die Boltzmann-Konstante ist: kB = 1, 3806488 (13) · 10−23 J/K = 8, 6173324 (78) · 10−5 eV/K . (6.150) Somit entspricht die Ionisierungsenergie von Wasserstoff einer Temperatur von rund T = 157600◦ C. (Dieser Wert ist allerdings nicht zu verwechseln mit der Temperatur für die Dissoziation eines H2 Moleküls in zwei Wasserstoffmoleküle, die wesentlich kleiner ist.) Über die Beziehung E = hν kann man eine Energie auch in eine Frequenz für Licht umrechnen. Mit der Planck’schen Konstanten h = 6, 626 · 10−34 Js = 4, 1357 · 10−15 eV s (6.151) erhalten wir für die zur Ionisierungsenergie von Wasserstoff gehörende Frequenz: ν = 3, 29 · 1015 Hz oder λ ≈ 90 nm. Im Vergleich zu sichtbarem Licht (zwischen 380 und 750 nm) ist diese Wellenlänge also kürzer und liegt im Ultraviolettbereich. Die Ionisierungsenergie für ein Wasserstoffatom (Z = 1), dessen Elektron sich im ersten angeregten Zustand (n = 2) befindet, ist: me4 1 = 3, 401 eV (Ionisierungsenergie, n = 2) . (6.152) 2~2 4 Sie entspricht einer Wellenlänge von rund 360 nm und kommt somit langsam an den sichtbaren Bereich heran. Insbesondere liegen viele der Übergangslinien von höher angeregten Zuständen in den n = 2 Zustand (z.B. erscheint die Linie zu dem Übergang von n = 3 zu n = 2 mit λ = 648 nm rot) in diesem Bereich. Diese Linien entsprechen der Balmer-Serie der Spektrallinien. 6.8.1 Ein semi-klassisches Argument für die Energieniveaus Die folgende Herleitung“ der Energieniveaus im Wasserstoffatom (Gl. 6.148) macht ” lediglich von klassischen Beziehungen sowie der deBroglie-Wellenlänge Gebrauch. Wie nahezu alle Analogien birgt auch dieses Bild die Gefahr, dass es in seiner Anschaulichkeit zu Ernst genommen wird, auch wenn die Überlegungen, die Bohr 1913 zu seinem Atommodell geführt haben, von dieser Art waren. Zunächst können wir dem Impuls p über die deBroglie-Beziehung p = h/λ eine Wellenlänge zuordnen. Verlangen wir nun bei einer Kreisbahn, dass der Umfang dieser Kreisbahn (2πr) ein ganzzahliges Vielfaches dieser Wellenlänge ist, folgt 2πr = nλ = n h p =⇒ p= n~ oder pr = n~ . r (6.153) 150 Potenzialsysteme Da pr gleich dem Drehimpuls des Teilchens auf der Kreisbahn ist, folgt durch diese Beziehung die Quantisierung des Drehimpulses: Der erlaubte Drehimpuls L muss ein ganzzahliges Vielfaches von ~ sein: L = n~. Nun betrachten wir speziell eine Kreisbahn im Coulombpotential. Klassisch müssen die Coulombkraft F = −Ze2 /r2 und die Fliehkraft F = mv 2 /r gleich sein, womit wir eine klassische Beziehung zwischen dem Bahnradius und dem Impuls p = mv erhalten: Ze2 m Ze2 p2 =⇒ r = = . (6.154) r2 mr p2 Wir verbinden diese Beziehung mit der Quantisierung des Drehimpulses: n2 ~2 = r2 p2 = Ze2 mr (6.155) oder n2 ~2 . (6.156) Ze2 m Dies sind somit die erlaubten Bahnradien, wenn wir die Quantisierung des Drehimpulses verlangen (oder aber, dass ein Vielfaches der Wellenlänge zum Impuls gerade in den Bahnumfang passt). Andererseits folgt klassisch für die Energie des Teilchens im Coulombpotenzial als Funktion des Radius (indem wir p entweder nach Gl. 6.154 eliminieren oder aber den klassischen Virialsatz anwenden): rn = E= p2 Ze2 Ze2 Ze2 Ze2 − = − =− . 2m r 2r r 2r (6.157) Setzen wir die erlaubten Bahnradien ein, erhalten wir für die zugehörigen Energien: En = − Ze2 Z 2 e4 m =− 2 2 . 2rn 2~ n (6.158) Dies ist zwar die richtige Formel (einschließlich aller Faktoren), aber die Beziehung, dass die Quantenzahl n direkt mit dem Drehimpuls L zusammenhängt, ist in der Quantentheorie falsch, da es zu jedem Wert von n beispielsweise auch den Drehimpuls L = 0 geben kann. Eine genauere klassische Überlegung muss daher auch elliptische Bahnkurven mit einbeziehen. Gleichung (6.156) liefert für das Wasserstoffatom (Z = 1) im Grundzustand (n = 1) einen Radius, den man als Bohr’schen Radius bezeichnet: a0 = ~2 ≈ 0, 5291772 · 10−10 m . e2 m (6.159) Trotz seiner klassischen Ableitung vermittelt er eine Größenordnung von Atomen. Kapitel 7 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen Wir werden uns in diesem Kapitel etwas eingehender mit dem Zeitentwicklungsoperator beschäftigen. Wir bestimmen diesen zunächst für die freie Schrödinger-Gleichung (d.h., der Schrödinger-Gleichung für ein Teilchen, das sich nicht in einem Potenzial befindet und auch keine Wechselwirkung mit anderen Teilchen hat). Ausgehend von der bekannten Zeitentwicklung für freie Systeme können wir dann eine Darstellung des Zeitentwicklungsoperators ableiten, die auf R. Feynman zurückgeht und unter den Bezeichnungen Funktionalintegral“, Summation über We” ” ge“ oder auch Summation über Geschichten“ bekannt ist. Diese Darstellung liefert ” die Begründung für ein Verfahren zur Veranschaulichung der Amplitudenbestimmung, das R. Feynman ursprünglich in seinem populärwissenschaftlichen Buch QED: The ” strange theory of light and matter“ [29] eingeführt hat, und das später als Zeiger” modell“ bekannt und sogar zeitweise in der Schule als didaktische Methode eingesetzt wurde. Was man wissen sollte Zu diesem Kapitel sollte man eigentlich nur einige qualitative Zusammenhänge kennen. Die Wahrscheinlichkeit, ein Teilchen, das zum Zeitpunkt t = 0 am Ort x präpariert wurde, zum Zeitpunkt t am Ort y zu messen, ist durch |hy|U (t)|xi|2 gegeben, wobei U (t) der Zeitentwicklungsoperator der Quantenmechanik ist (selbst eine Lösung der Schrödinger-Gleichung). Wie Richard Feynman gezeigt hat, besitzt die Amplitude hy|U (t)|xi eine Darstellung als Funktionalintegral: Man summiere über alle möglichen Wege von x nach y und gewichte jeden dieser Wege mit einer Phase, die sich aus der klassischen Wirkung zu diesem Weg ergibt. Die Summe über all diese Phasen ist gleich der Amplitude, und das Absolutquadrat dieser Summe ist gleich der 151 152 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen angegebenen Wahrscheinlichkeit. Diese formale Darstellung hat zu der anschaulichen und manchmal auch im Schulunterricht verwendeten Zeigerrechnung“ geführt: Man denke sich einen Zeiger, ” der entlang der möglichen Wege wie bei einer Uhr fortschreitet (zur praktischen Veranschaulichung wurden dazu schon mal Pizzarollen verwendet) und addiere (vektoriell) zum Schluss die Zeigerstellungen zu den möglichen Wegen (beispielsweise den beiden Wegen bei einem Doppelspalt). Auch wenn dieses Bild sehr anschaulich ist, kann es den eigentlichen Hintergrund — das Funktionalintegral — nur sehr begrenzt wiedergeben. Abschließend behandelt dieses Kapitel noch die Heisenberg’schen Bewegungsgleichungen. Während das Schrödinger-Bild eine Zeitabhängigkeit der Zustände (Wellenfunktionen) annimmt, und die Observablen zeitunabhängig lässt, betrachtet man im Heisenberg–Bild zeitabhängige Observable und zeitunabhängige Zustände. Die Bewegungsgleichungen für die Operatoren gleichen den klassischen Hamilton’schen Bewegungsgleichungen, wenn man die klassische Poisson-Klammer durch einen Kommutator (multipliziert mit i~) ersetzt. Dieses Korrespondenzprinzip garantiert, dass die Erwartungswerte von Observablen in Zuständen, die einen klassischen Grenzwert zulassen, den klassischen Bewegungsgleichungen genügen. 7.1 Der Zeitentwicklungsoperator Allgemein hat die (zeitabhängige) Schrödinger-Gleichung für einen Quantenzustand |ψ(t)i folgende Form (vgl. Gl. 6.1): i~ d |ψ(t)i = H|ψ(t)i . dt (7.1) Dazu hatten wir schon die formale Lösung: i |ψ(t)i = U (t)|ψ(0)i = e− ~ Ht |ψ(0)i (7.2) mit dem unitären Zeitentwicklungsoperator i U (t) = exp − Ht ~ (7.3) angegeben. Wie im letzten Kapitel soll auch hier H nicht explizit zeitabhängig sein. U (t) ist ein unitärer Operator auf dem Hilbertraum. Handelt es sich um ein System mit endlich vielen Zuständen (beispielsweise um Systeme, bei denen man sich nur für die Spin- bzw. Polarisationsfreiheitsgrade interessiert), so ist H eine Matrix und ebenso U (t). Möchte man aber auch die räumlichen Freiheitsgrade eines Teilchens oder allgemeiner eines Systems berücksichtigen, ist der Hilbertraum unendlich dimensional. Der Zeitentwicklungsoperator 153 H und U (t) sind lineare Operatoren. Wir wollen nun diesen linearen Operator in der Ortsraumdarstellung bestimmen, d.h., wir wollen hx|U (t)|yi = U (x, y; t) (7.4) bestimmen. Streng genommen lässt sich jeder lineare Operator A in der Ortsraumdarstellung in der Form hx|A|yi = KA (x, y) (7.5) darstellen (vergleiche auch die Anmerkung auf S. 122). Hierbei handelt es sich um einen Integralkern, und seine Wirkung auf eine Wellenfunktion ist in der Ortsdarstellung Z hx|A|ψi = dy hx|A|yihy|ψi (7.6) oder Z hx|A|ψi = dy KA (x, y)ψ(y) . (7.7) Viele der Operatoren, mit denen wir es bisher zu tun hatten (Ortsoperator, Impulsoperator, Drehimpulsoperator, Energieoperator), sind jedoch lokal, d.h., KA (x, y) liefert nur einen Beitrag, wenn x = y ist. Im Sinne von Integralkernen handelt es sich also um Distributionen, welche die δ-Funktion und ihre Ableitungen enthalten. Beispielsweise ist hx|Q|yi = yhx|yi = yδ(x − y) und hx|P |yi = −i~ d δ(x − y) dx (7.8) (7.9) (wobei die Ableitung der δ-Funktion im Sinne von Distributionen zu verstehen ist, d.h., bei der Anwendung auf eine Testfunktion durch partielle Integration definiert wird). In diesem Fall werden die Integralkerne zu gewöhnlichen Differentialoperatoren. Der unitäre Zeitentwicklungsoperator ist jedoch nicht mehr lokal. In dieser Darstellung des Zeitentwicklungsoperators erhalten wir also für die Zeitentwicklung einer Wellenfunktion: Z ψ(x, t) = dy U (x, y; t) ψ(y, 0) , (7.10) wobei ψ(y, 0) eine beliebige Anfangskonfiguration bezeichnet. (Wie schon in Kap. 6 erwähnt, ist die Schrödinger-Gleichung eine Differentialgleichung 1. Ordnung in der Zeit, sodass eine beliebige Anfangskonfiguration vorgegeben werden kann.) Von dem Integralkern U (x, y; t) wissen wir nur, dass er selbst der Schrödinger-Gleichung genügen muss (vgl. Gl. 5.28): d ~2 d2 i~ U (x, y; t) = − + V (x) U (x, y; t) . (7.11) dt 2m dx2 154 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen Außerdem muss der Integralkern für t = 0 zum Identitätsoperator werden, also U (x, y; 0) = δ(x − y) . (7.12) Damit haben wir die (zeitabhängige) Schrödinger-Gleichung zu dieser Anfangsbedingung zu lösen, wodurch gleichzeitig auch die Normierung von U (x, y; t) festgelegt ist. Wir interessieren uns zunächst für den freien Zeitentwicklungsoperator, also V (x) ≡ 0. Es gibt viele Lösungswege, von denen zwei im Anhang A2 skizziert werden. Hier geben wir einfach die Lösung an und kontrollieren, dass sie sowohl die SchrödingerGleichung als auch die Anfangsbedingung erfüllt: r m(x − y)2 m exp − (7.13) U (x, y; t) = 2πi~t 2~it Dass diese Funktion eine Lösung der freien Schrödinger-Gleichung ist, zeigt man leicht durch explizites Nachrechnen. Die Ableitung nach t liefert: r d m 1 m(x − y)2 2 1 i~ U (x, y; t) = −i~ + m(x − y) 2 exp − . (7.14) dt 8πi~t t t 2~it Die gleichen Terme treten bei der zweifachen Ableitung nach x auf. Im Grenzfall t → 0. erkennt man, dass die Funktion außer an der Stelle x = y unendlich rasch“ oszilliert und somit das Integral über eine Testfunktion, die bei ” x = y verschwindet, null ist. Etwas exakter ausgedrückt gilt: Z ∞ dy U (x, y; t)ψ(y) = ψ(x) . (7.15) lim t→0 −∞ Also wird der Zeitentwicklungsoperator in diesem Grenzfall zur δ-Funktion. Bis auf die imaginäre Einheit i handelt es sich bei der freien Schrödinger-Gleichung im Wesentlichen um eine Diffusionsgleichung: d2 d ψ(x, t) = −λ 2 ψ(x, t) , dt dx (7.16) welche die Braun’sche Diffusion in einer Flüssigkeit oder einem Gas beschreibt. Die Anfangsbedingung (Gl. 7.12) bedeutet in diesem Fall physikalisch, dass sich ein Teilchen — oder ein Farbtropfen — zum Zeitpunkt t = 0 an einem bestimmten Ort befindet. Die Diffusion erfolgt nach einer immer breiter werdenden Gauß-Verteilung, deren Varianz proportional zu t ist. Anders ausgedrückt, für den √ Ausbreitungsradius R zum Zeitpunkt t gilt: R ∝ t. Der Faktor i hat allerdings zur Folge, dass die Wellenfunktion eines Teilchens, das sich zum Zeitpunkt t = 0 an einem bestimmten Ort befindet, bereits beliebig kurz darauf überall gleichmäßig im Raum verteilt hat. Der Zustand eines solchen auf einen Punkt“ konzentrierten Teilchens ist ” eine Superposition von allen Energien, und daher breitet sich dieses Teilchen mit allen Geschwindigkeiten in alle Richtungen gleichermaßen aus. Dies betont den nicht-relativistischen Charakter der Schrödinger-Gleichung. Die relativistische Verallgemeinerung ist die Dirac-Gleichung. 7.2. SUMMATION ÜBER WEGE 7.2 155 Summation über Wege Im Anhang A2 wird das Funktionalintegral für die Quantenmechanik abgeleitet. An dieser Stelle gehen wir als Motivation für eine solche Darstellung nochmals von einem Doppelspaltexperiment aus. Wir betrachten zunächst einen Doppelspalt und eine ebene Welle von Elektronen, die sich als ebene Welle mit einem bestimmten Impuls p (bzw. einer bestimmten = hp ) diesem Doppelspalt nähern. deBroglie-Wellenlänge λ = 2π~ p Zur Bestimmung der Amplitude auf einem Schirm hinter dem Doppelspalt denken wir uns von jedem der beiden Spalte eine Kugelwelle ausgehend. Diese beiden Kugelwellen überlagern sich und führen auf dem Schirm zu einem Interferenzmuster (Gl. 3.4 und 3.5 in Kap. 3.1). Da die ebene Welle phasengleich auf den Doppelspalt treffen soll, erhalten wir näherungsweise die Amplitude an einem Punkt y auf dem Schirm hinter dem Doppelspalt dadurch, dass wir die optischen Weglängen von jedem der beiden Spalte x1 und x2 zu dem Punkt y bestimmten, also |x1 − y|/λ und |x2 − y|/λ, und die zugehörigen Phasen addieren: 2πi 2πi (7.17) ψ(y) ≈ e λ |x1 −y| + e λ |x2 −y| Angenommen, wir ersetzen den Schirm hinter dem Doppelspalt durch eine Maske, die an den Punkten y1 und y2 ebenfalls wieder zwei Spalte hat, und wir wollen nun die Amplitude auf einem weiteren Schirm hinter diesem zweiten Doppelspalt an einer Stelle z bestimmen, so stellen wir uns vor, dass jeder der beiden Spalte bei y1 und y2 zum Ausgangspunkt einer neuen Welle wird, für die wir jeweils die optische Weglänge bis zum Punkt z bestimmen müssen. Insgesamt erhalten wir die Phase bei z, indem wir die Summe der Phasen zu den einzelnen optischen Weglängen entlang der vier möglichen Wege — (x1 → y1 → z), (x1 → y2 → z), (x2 → y1 → z) und (x2 → y2 → z) — bilden: ψ(z) ≈ e 2πi (|x1 −y1 |+|y1 −z|) λ +e +e 2πi (|x2 −y1 |+|y1 −z|) λ 2πi (|x1 −y2 |+|y2 −z|) λ +e 2πi (|x2 −y2 |+|y2 −z|) λ . (7.18) Hierbei handelt es sich nur um eine Proportionalität, d.h., für die Bestimmung der tatsächlichen Intensität müssen wir noch berücksichtigen, welcher Anteil des Lichts an den jeweiligen Schirmen mit den Spalten absorbiert wird. Da wir in der Quantenmechanik letztendlich nur an der relativen“ Verteilung auf dem abschließenden Schirm ” interessiert sind, d.h., an der Verteilung derjenigen Teilchen, die alle Masken passiert haben, müssen wir nur die abschließende Intensität neu normieren. Auch diese Berechnung wäre noch schwierig, wenn man berücksichtigen will, dass die Teilchen an den einzelnen Spalten in verschiedene Richtungen unterschiedlich stark gebeugt werden. Dies führt unter anderem dazu, dass die Interferenzmuster für 156 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen große Ablenkungswinkel immer schwächer werden. Sollen diese Komplikationen ebenfalls unberücksichtigt bleiben, was bei sehr engen Spalten und bei Berücksichtigung lediglich der ersten Interferenzstreifen um den mittleren Punkt eine gute Näherung ist, können wir die relative Intensität schon aus den Phasen ablesen. In dieser Näherung erhalten wir für den einfachen Doppelspalt aus Gl. 7.17: 2 2πi 1 1 2πi |x1 −y| |x2 −y| λ λ 2 + 2 cos 2π +e (|x − y| − |x − y|) (7.19) I(y) = e = 1 2 λ N N Die Normierung N ist so zu wählen, dass die Integration über den relevanten y-Bereich eins ergibt. Man erkennt, dass in das Interferenzmuster lediglich die Differenz der beiden optischen Weglängen eingeht. Die Minima und Maxima der Interferenzverteilung erhält man aus den bekannten Bedingungen (vgl. Gl. 3.4 und 3.5). Gleichung (7.18) lässt sich sehr leicht verallgemeinern. Angenommen, der erste Schirm hat N1 Spalte an den Positionen x1i1 , der zweite Schirm N2 Spalte bei x2i2 , und es gibt weitere Schirme mit weiteren Spalten, dann ist die relative Phase an einem Punkt z auf dem abschließenden Schirm durch ψ(z) ≈ N1 X N2 X i1 ...e 2πi λ P k | |xki −xk−1 i k k−1 (7.20) i2 gegeben. Dabei ist letztendlich über alle Wege zu summieren, die das Teilchen nehmen kann. Insbesondere kann es durch jeden der Spalte im ersten Schirm treten, anschließend durch jeden der Spalte im zweiten Schirm etc. Wir erhalten für die Amplitude also eine Summe über alle möglichen Wege“ des Teilchens, und für jeden Weg er” halten wir als Beitrag eine Phase, die sich aus der gesamten optische Weglänge dieses Wegs ergibt. Für die Bestimmung der Intensität müssen wir das Absolutquadrat dieses Ausdrucks bilden. Wie schon erwähnt, wird die Funktionalintegraldarstellung für die Quantenmechanik in Anhang A2 hergeleitet. Das Ergebnis lässt sich formal folgendermaßen zusammenfassen: X i U (x, y; t) = exp Scl [x(τ ), t] (7.21) ~ x(τ ):y→x Hierbei bedeutet die Summe eine formale Summation über alle Wege x(τ ) von einem Anfangspunkt y = x(0) bis zu einem Endpunkt x = x(t) und Scl [x(τ ), t] ist die klassische Wirkung dieses Weges: Z t 1 2 Scl [x(τ ), t] = dτ mẋ(τ ) − V (x) . (7.22) 2 0 7.2.1 Das Zeigermodell“ der Teilchenpropagation ” Richard Feynman hat in seinem Buch QED: The strange theory of light and matter“ ” die Zeigerdarstellung populär gemacht, mit der man im Prinzip die Amplitude einer Das Heisenberg-Bild der Quantenmechanik 157 Welle an einem Punkt berechnen kann. Dabei stellt man sich vor, dass ein Teilchen eine Art Uhr“ mit sich schleppt, welche die momentane Phase des Zustands dieses ” Teilchens angibt. Wenn sich ein Teilchen entlang einer ganz bestimmten Trajektorie bewegt, schreitet dieses Phase voran, d.h., die Zeiger der Uhr drehen sich. Die Feynmann’sche Vorschrift lautet, dass man die Ampitude am Zielpunkt dadurch erhält, dass man von jedem möglichen Weg von Anfangs- zu Endpunkt die abschließende Zeigerstellung ermittelt (in Schulen wurde das oft mit einer Pizzaschneiderolle anschaulich gemacht, die man den Weg entlangrollt), und abschließend alle Zeigerstellungen, die man von allen möglichen Wegen erhält, addiert. Das Ergebnis ist die Amplitude, und das Absolutquadrat entspricht der (relativen) Intensität. Die strenge“ Begründung hinter diesem Verfahren beruht auf der Funktionalin” tegraldarstellung des Zeitentwicklungsoperators oder Propagators. Hier wird tatsächlich zur Bestimmung der Amplitude über alle Wege bzw. Trajektorien summiert, und jeder Weg trägt eine Phase bei, die proportional zur klassischen Wirkung der entsprechenden Teilchentrajektorie ist. Das Verfahren mag für populärwissenschaftliche Darstellungen ganz anschaulich erscheinen, doch die Funktionalintegraldarstellung zeigt auch die Grenzen dieses Verfahrens: Zunächst bewegt sich der Zeiger“ nicht gleichmäßig mit der Zeit vor, ” sondern die Rotationsgeschwindigkeit des Zeigers hängt von dem Wert der LagrangeFunktion an dem entsprechenden Punkt (d.h. sowohl von dem Ort, d.h. dem Wert des Potenzials, als auch von der momentanen Geschwindigkeit des Teilchens) ab. Noch kritischer wird die Zeigerdarstellung, wenn man beispielsweise den Tunneleffekt beschreiben möchte: Hier verläuft der Weg über einen Potenzialberg, der klassisch gar nicht überwunden werden kann. Streng genommen wird die klassische Wirkung hier imaginär, was zu dem exponentiellen Abfall der Amplitude von Teilchen führt, die den Potenzialwall durchdringen. Die einfache konstante Zeigerrotation ist lediglich für eine freie klassische Trajektorie begründet, bei der kein Potenzial vorhanden ist und bei der sich das Teilchen mit konstanter Geschwindigkeit fortbewegt. Das liefert bei Doppelspaltexperimenten (und Verallgemeinerungen mit mehreren Spalten und mehreren Masken) die richtigen Ergebnisse (zumindest, sofern man nur am qualitativen Verlauf der Interferenzmuster interessiert ist und nicht an der tatsächlichen Intensität). Insgesamt muss die Zeigerdarstellung der Quantenmechanik also kritisch betrachtet werden. Sie hat zwar ihre theoretische Begründung, die aber nur in Spezialfällen mit einer Pizzaschneiderolle“ ermittelt werden kann. Außerdem besteht die ” Gefahr, dass die Vorstellung einer inneren Uhr“ zur Messung der Phase zu Ernst ” genommen wird und zu einer ontologischen Vorstellung führt, die nicht gerechtfertigt ist. 158 7.3 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen Das Heisenberg-Bild der Quantenmechanik Bisher haben wir die zeitliche Entwicklung eines Vektors im Hilbertraum (als Repräsentant für einen Quantenzustand) untersucht. Für die Erwartungswerte von Operatoren ergibt sich daraus eine Zeitabhängigkeit: hAi(t) = hψ(t)|A|ψ(t)i . (7.23) Statt eine zeitliche Entwicklung von Zuständen zu betrachten, können wir auch die Operatoren zeitabhängig wählen, und die Zustände zeitlich konstant lassen, sodass die Erwartungswerte dieselben bleiben: hAi(t) = hψ|A(t)|ψi . (7.24) Die entsprechende Bewegungsgleichung für Observable ist die Heisenberg-Gleichung. 7.3.1 Die Heisenberg’schen Bewegungsgleichungen Wieder einmal gehen wir von der Schrödinger-Gleichung für Quantenzustände (genauer gesagt: Hilbertraumvektoren als Repräsentanten für Quantenzustände) aus: i~ d |ψ(t)i = H|ψ(t)i . dt (7.25) Diese Gleichung beschreibt also die zeitliche Entwicklung eines Vektors im Hilbertraum. Wie wir gesehen haben, lässt sich diese zeitliche Entwicklung als eine Rotation“ ” der Vektoren des Hilbertraums interpretieren (unitäre Matrizen sind die komplexen Verallgemeinerungen der orthogonalen Matrizen, welche im Wesentlichen Drehungen in Vektorräumen beschreiben). Messungen an physikalischen System liefern jedoch nach den Axiomen der Quantenmechanik immer nur Erwartungswerte geeigneter Operatoren, welche wir als mathematische Repräsentationen von physikalischen Observablen auffassen. D.h., Messergebnisse in einem Zustand sind immer nur von der Form hAi(t) = hψ(t)|A|ψ(t)i . (7.26) Messergebnisse können natürlich zeitabhängig sein, wenn sich der Quantenzustand zeitlich verändert. Statt zeitabhängige Quantenzustände zu betrachten, können wir aber auch eine Zeitabhängigkeit der Observablen annehmen, ohne dass sich der Erwartungswert — also das einzig physikalisch Beobachtbare — verändert: hAi(t) = hψ(0)|U (t)† AU (t)|ψ(0) = hψ|A(t)|ψi , (7.27) Das Heisenberg-Bild der Quantenmechanik 159 wobei wir |ψi = |ψ(0)i festhalten, und statt dessen eine zeitabhängige Observable A(t) = U (t)† AU (t) (7.28) betrachten. Die beiden Formen von Zeitentwicklungen; |ψi , A −→ |ψ(t)i = U (t)|ψi , A (7.29) |ψi , A −→ |ψi , A(t) = U (t)† AU (t) (7.30) sind physikalisch äquivalent, da beide zur selben Zeitentwicklung für Erwartungswerte führen. Wir können uns nun fragen, welche Bewegungsgleichung für einen Operator aus der Zeitentwicklung (Gl. 7.28) folgt. Dazu berücksichtigen wir: i d i Ht e ~ = U (t) H dt ~ und d − i Ht i e ~ = − H U (t)† . dt ~ (7.31) (Diese Gleichungen setzen voraus, dass H zeitunabhängig ist. Es gibt eine Verallgemeinerung für explizit zeitabhängige Hamilton-Operatoren, die aber hier nicht betrachtet werden soll. Die Reihenfolge von H und U (t) ist im vorliegenden Fall egal.) Nun können wir beide Seiten von Gl. 7.28 nach t ableiten und erhalten: i d A(t) = HU (t)† AU (t) − U (t)† AU (t)H (7.32) dt ~ i i (7.33) = HA(t) − A(t)H = [H, A(t)] . ~ ~ Diese Gleichung, d i A(t) = − [A(t), H] , (7.34) dt ~ bezeichnet man als Heisenberg’sche Bewegungsgleichung. Letztendlich kann man den Übergang vom Schrödinger-Bild zum HeisenbergBild als aktive“ und passive“ Transformation in einem Vektorraum auffassen: Es ” ” spielt keine Rolle, ob die Vektoren gedreht werden, und die Matrix unverändert bleibt, oder ob die Matrix gedreht“ wird, und die Vektoren unverändert bleiben. ” 7.3.2 Allgemeine Struktur der Heisenberg-Gleichung Die Ähnlichkeit zwischen den Heisenberg-Gleichungen der Quantenmechanik (Gl. 7.34) und den klassischen Bewegungsgleichungen für Observable (also Funktionen auf dem Phasenraum): d A(x, p) = {A(x, p), H(x, p)} , (7.35) dt mit den Poisson-Klammern {f (x, p), g(x, p)} = ∂f (x, p) ∂g(x, p) ∂f (x, p) ∂g(x, p) − , ∂x ∂p ∂p ∂x (7.36) 160 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen legt schon nahe, dass die Struktur der Heisenberg-Gleichungen den klassischen Bewegungsgleichungen sehr ähnlich ist. Wir werden nun zeigen, dass die Form der Bewegungsgleichungen für den Orts- und Impulsoperator, Q(t) und P (t), sogar identisch ist zu den klassischen Gleichungen (bis auf Probleme der Reihenfolge von Operatoren, die jedoch, wie wir sehen werden, bei den meisten Beispielen keine Rolle spielen), aber im Unterschied zu den klassischen Bewegungsgleichungen sind nun Operatoren Q(t) und P (t) gesucht, die noch zu jedem Zeitpunkt die kanonischen Vertauschungsregeln erfüllen. Wir beginnen mit den folgenden Relationen: [Q, f (P )] = i~ f 0 (P ) und [P, g(Q)] = −i~ g 0 (Q) . (7.37) (Von der Richtigkeit, zumindest für Funktionen f und g mit einer Potenzreihenentwicklung, überzeugt man sich leicht, indem man für f und g reine Potenzen P n bzw. Qm ansetzt. Die entsprechenden Relationen kann man dann induktiv über m bzw. n beweisen.) Für einen Hamilton-Operator der Form H= P2 + V (Q) 2m (7.38) folgt damit sofort als Bewegungsgleichung für die zeitabhängigen Orts- und Impulsoperatoren in der Heisenberg-Darstellung: d 1 Q(t) = P (t) dt m und d P (t) = −V 0 (Q(t)) . dt (7.39) Wie wir sehen, treten in diesem Fall keine Ordnungsprobleme der Operatoren auf, und die Bewegungsgleichungen sind form-identisch zu den klassischen Bewegungsgleichungen. Ordnungsprobleme erhält man lediglich, wenn Anteile eines HamiltonOperators Produkte von Q und P enthalten. Bilden wir auf beiden Seiten dieser Bewegungsgleichungen Erwartungswerte (in einem beliebigen Zustand |ψi, so folgt: d hQi(t) = dt d hP (t)i = dt d 1 1 hψ|Q(t)|ψi = hψ|P (t)|ψi = hP i(t) dt m m d 0 hψ|P (t)|ψi = −hψ|V (Q)|ψi = −hV 0 (Q)i(t) . dt (7.40) (7.41) Die Erwartungswerte von Observablen in der Quantentheorie folgen somit den klassischen Bewegungsgleichungen. Dies ist eine Form des Korrespondenzprinzips. Die letzte Bemerkung ist eigentlich nur eine explizite Bestätigung dessen, was wir schon in der allgemeinen axiomatischen Formulierung hineingesteckt“ haben: Die ” Kommutatorrelationen der Quantentheorie sollen den Poisson-Klammern der entsprechenden klassischen Observablen entsprechen. Dann kann man für die Erwartungswerte quantenmechanischer Observabler die klassischen Relationen erwarten. Das Heisenberg-Bild der Quantenmechanik 161 Operatorlösungen sind von Bedeutung, wenn man an Erwartungswerten von Q und P (oder Funktionen von ihnen) zu verschiedenen Zeitpunkten interessiert ist. Beispielsweise spielen in der Quantenfeldtheorie Verallgemeinerungen von Erwartungswerten der Art hQ(t1 )Q(t2 )i eine große Rolle. Solche zeitlichen Korrelationsfunktionen lassen sich oft direkt mit experimentellen Messungen in Beziehung setzen. 7.3.3 * Lineare Bewegungsgleichungen Wir wollen die Heisenberg’schen Bewegungsgleichungen für zwei Fälle lösen: (1) den freien Fall und (2) den harmonischen Oszillator. Der Fall eines freien Teilchens Betrachten wir zunächst den Fall eines freien Teilchens. Die Heisenberg’schen Bewegungsgleichungen lauten nun: 1 P (t) und Ṗ (t) = 0 . m Die klassische Lösung der Gleichungen gilt auch für den Quantenfall: Q̇(t) = (7.42) 1 P (0)t + Q(0) und P (t) = P (0) . (7.43) m Setzen wir für den Orts- und Impulsoperator zum Zeitpunkt t = 0 ihre kanonische Ortsraumdarstellung ein, so erhalten wir: Q(t) = i~ t d +x m dx d P (t) = i~ . dx Q(t) = (7.44) (7.45) Harmonischer Oszillator Auch für den harmonischen Oszillator erhalten wir die Form der klassischen Bewegungsgleichungen nun als Operatorgleichungen: Q̇(t) = 1 P (t) und Ṗ (t) = −mω 2 Q(t) , m (7.46) bzw. Q̈(t) = −ω 2 Q(t) . (7.47) Auch hier können wir die klassische Lösung nehmen und die freien Anfangsbedingungen durch Operatoren ersetzen: 1 P (0) sin ωt mω P (t) = −mωQ(0) sin ωt + P (0) cos ωt . Q(t) = Q(0) cos ωt + (7.48) (7.49) 162 Zeitentwicklung, Funktionalintegral und Bewegungsgleichungen In der Ortsdarstellung folgt: Q(t) = (cos ωt) x + d i~ sin ωt mω dx P (t) = (−mω sin ωt) x + (i~ cos ωt) d . dx (7.50) (7.51) Man überzeugt sich leicht, dass in beiden Fällen für alle t die kanonischen Vertauschungsrelationen gelten (wie es auch nach dem allgemeinen Formalismus der Fall sein muss). Außerdem sieht man sofort, dass die Erwartungswerte von Q(t) und P (t) in beliebigen Zuständen die klassische Bewegung zeigen. Bei linearen Bewegungsgleichungen lassen sich somit vergleichsweise leicht Operatorlösungen finden: Man nehme die klassische Lösung und ersetze die freien Anfangsbedingungen (x(0) und p(0)) durch die entsprechende Operatoren. Bei nicht-linearen Bewegungsgleichungen funktioniert dieses Prinzip nicht mehr, da dort die Anfangsbedingungen meist als komplizierte Funktionen auftreten (und nicht als die Koeffizienten linearer Superpositionen von Lösungen). Kapitel 8 Mehrteilchensysteme Die meisten Aussagen der bisherigen Kapitel bezogen sich auf Systeme aus einem einzelnen Teilchen, das sich in einem Potenzial befindet oder dem man eine bestimmte Polarisation zuschreiben kann. Natürlich möchte man in der Quantenmechanik auch Mehrteilchensysteme oder aus Einzelsystemen zusammengesetzte Systeme beschreiben können. Gerade die Behandlung von mehreren, möglicherweise sehr weit voneinander entfernten Teilsystemen in der Quantenmechanik hat zu vielen Diskussionen Anlass gegeben. Es zeigt sich, dass in der Quantenmechanik vollkommen neue Arten von Korrelationen auftreten können, die sich weder auf eine klare kausale Beziehung noch auf eine gemeinsame Vergangenheit (mit durchgängiger Kette von Ursache–Wirkungsrelationen) zurückführen lassen. Diese sogenannten Quantenkorrelationen sind der Gegenstand von Debatten um die Bedeutung einer Arbeit von Einstein, Podolsky und Rosen (EPR) aus dem Jahre 1935. Aufbauend auf der EPR-Arbeit hat John Bell in den 60er Jahren zeigen können, dass die Quantenmechanik eine nicht-lokale Theorie ist. Was man wissen sollte Der Hilbertraum eines zusammengesetzten Systems ist gleich dem Tensorprodukt der beiden Hilberträume zu den Einzelsystemen. Die Basisvektoren im Produkthilbertraum lassen sich als Paare von Basisvektoren der Einzelhilberträume schreiben. Für einen Zustand im Produkthilbertraum kann man Teilspuren definieren, die effektiv zu einem (möglicherweise gemischen) Zustand in einem der beiden Teilräume führen und angeben, welche Eigenschaften eines Zustands sich durch lokale Eigenschaften an einem Teilsystem bestimmen lassen. Bei Mehrteilchenzuständen aus identischen Teilchen muss eine Symmetrisierung des Zustands (bei Bosonen) bzw. eine Antisymmetrisierung des Zustands (bei Fermionen) vorgenommen werden. Bei Fermionen folgt aus dieser Antisymmetrisierung das 163 164 Mehrteilchensysteme Pauli’sche Ausschließungsprinzip. Die physikalischen Hilberträume identischer Teilchen sind also der total symmetrische bzw. der total antisymmetrische Unterraum des Produkthilbertraums. Zustände in einem Produkthilbertraum, die sich nicht als Tensorprodukt von Zuständen aus den einzelnen Teilräumen schreiben lassen, bezeichnet man als verschränkt (ansonsten sind sie separabel). In verschränkten Zuständen kommen den Einzelsystemen oft keine bestimmten Eigenschaften zu, wohl aber dem Gesamtsystem. Verschränkten Zustände geben Anlass zu Quantenkorrelationen, indem eine Messung an einem Teilsystem zu einer instantanen Änderung des Gesamtzustands führt, wobei dem zweiten Teilsystem in dem neuen (reduzierten) Zustand Eigenschaften zukommen, die ihm vor der Messung an dem ersten Teilsystem nicht zukamen. Die Bildung der Teilspuren von (reinen) verschränkten Zuständen führt zu gemischten Zuständen, wohingegen die Teilspur von (reinen) separablen Zuständen wieder auf reine Zustände führt. Das Standardbeispiel eines verschränkten Zustands ist der EPR-Zustand (EPR bezieht sich auf Einstein, Podolsky und Rosen, genauer sollte man jedoch vom EPRBohm-Zustand sprechen), bei dem sich ein System aus zwei Spin- 12 -Teilchen im Gesamtdrehimpuls 0-Zustand befindet, wodurch den beiden Einzelteilchen keine Spinorientierung bezüglich irgendeiner Richtung zukommt. Erst bei einer Messung der Spinorientierung bezüglich einer Richtung an einem Teilchen erhält“ auch das ande” re Teilchen instantan eine eindeutige Spin-Komponente bezüglich derselben Richtung. Dieser Effekt ist nicht-lokal und scheint der Einstein-Kausalität (keine Signal- oder Energieausbreitung außerhalb des Lichtkegels) zu widersprechen. Allerdings lassen sich diese Korrelationen nicht zur Signalübertragung verwenden. Die Bell’schen Ungleichungen beziehen sich auf Relationen zwischen der relativen Häufigkeit für das Auftreten verschiedener Eigenschaften, die in jeder lokalen und objektiv realistischen Theorie erfüllt sein müssen. Ihre Verletzung in der Quantenmechanik bedeutet, dass (1) objektive Eigenschaften vor einer Messung im Allgemeinen nicht vorliegen und (2) die Quantenmechanik nicht-lokal ist. 8.1 8.1.1 Mathematische Beschreibung von Mehrteilchensystemen Der Tensorraum In der klassischen Mechanik ist der Übergang von einem Einteilchensystem zu einem Mehrteilchensystem vergleichsweise einfach: Der Phasenraum von N Teilchen ist das kartesische Produkt der Einteilchenphasenräume. In der Quantenmechanik haben wir den Zustandsraum durch einen Hilbertraum definiert. Bei Vektorräumen ist der Pro- Mathematische Beschreibung 165 duktraum aber das Tensorprodukt der beiden Vektorräume; es besteht aus sämtlichen Linearkombinationen von Paaren von Vektoren, die sich aus den beiden Vektorräumen bilden lassen. Konkreter definieren wir: Seien H1 und H2 zwei Hilberträume mit jeweiligen Basisvektoren {|ei i} und {|fj i} (die Indexmengen für i und j müssen nicht gleich sein), dann definieren wir das Tensorprodukt H = H1 ⊗ H2 als den Vektorraum, der durch die Paare von Basisvektoren {|ei , fj i} aufgespannt wird. Ein beliebiger Vektor |xi ∈ H lässt sich somit immer in der Form X |xi = xij |ei , fj i (8.1) i,j darstellen. Statt |ei , fj i schreibt man manchmal auch |ei i|fj i oder |ei i ⊗ |fj i. Seien P P |ai = i ai |ei i ∈ H1 und |bi = j bj |fj i ∈ H2 Vektoren aus den Teilhilberträumen, dann ist X X X |ai ⊗ |bi = ai |ei i ⊗ bj |fj i = ai bj |ei , fj i (8.2) i j i,j das Tensorprodukt dieser beiden Vektoren. Für das Skalarprodukt von zwei Vektoren des Tensorproduktraums X X |xi, |yi ∈ H; |xi = xij |ei , fj i ; |yi = ykl |ek , fl i i,j (8.3) k,l gilt: hy|xi = X ∗ ylk xij hei |ek ihfj |fl i , (8.4) i,j,k,l und, sofern es sich um Orthonormalbasen handelt: X ∗ hy|xi = yji xij . (8.5) i,j Diese Definition ist nicht sehr elegant, da sie explizit auf Basen in den jeweiligen Hilberträumen Bezug nimmt. Es gibt in der Mathematik eine elegante Möglichkeit, das Tensorprodukt von zwei Vektorräumen ohne Bezug auf eine Basis zu definieren, diese ist aber für konkrete Berechnungen sehr unhandlich. Der Nachteil der obigen Definition ist, dass man von relevanten Konzepten (beispielsweise dem Konzept der Verschränkung, s.u.) eigentlich beweisen müsste, dass diese nicht von der Wahl der Basisvektoren bei der Konstruktion des Tensorraums abhängen. Für das Folgende sollte man diese Aussage einfach glauben oder ein entsprechendes Mathematikbuch konsultieren. Sei A1 ein linearer Operator auf H1 und A2 ein linearer Operator auf H2 , dann ist A1 ⊗ A2 ein linearer Operator auf H, der folgendermaßen auf die Basisvektoren wirkt: (A1 ⊗ A2 )(|ei i ⊗ |fj i) = A1 |ei i ⊗ A2 |fj i . (8.6) 166 Mehrteilchensysteme Durch diese Definition ist festgelegt, wie ein solcher Operator auf einen beliebigen Vektor im Tensorprodukt wirkt. Insbesondere kann man sich leicht überzeugen, dass zwei Operatoren, die auf verschiedene Hilberträume wirken, im Tensorprodukt immer kommutieren: (A1 ⊗ 1)(1 ⊗ A2 ) = (1 ⊗ A2 )(A1 ⊗ 1) . (8.7) Oft findet man dafür vereinfacht die Schreibweise [A1 , A2 ] = 0 , (8.8) wobei aber klar sein muss, dass sich die Indizes auf verschiedene Vektorräume beziehen und mit A1 eigentlich A1 ⊗ 1 gemeint ist (und entsprechend für A2 ). Allgemein lässt sich ein Operator B auf H immer als eine Linearkombination solcher Produktoperatoren“ schreiben, d.h. ” X B= bij (Ai ⊗ Aj ) . (8.9) ij 8.1.2 Separable Zustände und verschränkte Zustände Wenn ein Hilbertraum H das Tensorprodukt von zwei Hilberträumen H1 und H2 ist, können wir für Vektoren in dem Tensorproduktraum definieren: Definition: Ein Vektor |Ψi ∈ H1 ⊗ H2 heißt separabel, wenn es Vektoren |φi ∈ H1 und |ψi ∈ H2 gibt, sodass |Ψi = |φi ⊗ |ψi , (8.10) andernfalls heißt der Vektor |Ψi (bezüglich des vorgegebenen Tensorprodukts) verschränkt. Hierzu ein paar Anmerkungen: 1. Die Begriffe separabel bzw. verschränkt sind nur in Bezug auf eine Tensorproduktdarstellung des Hilbertraums definiert. Es macht überhaupt keinen Sinn, von einem verschränkten Zustand per se zu sprechen. Ein Zustand kann immer nur verschränkt in Bezug auf eine Partitionierung (d.h., Aufteilung des Gesamtsystems in Teilsysteme) sein. 2. Wir haben die Begriffe separabel und verschränkt für Vektoren definiert, aber man kann sich leicht davon überzeugen, dass sie auch für physikalische Zustände (also Strahlen bzw. 1-dimensionale lineare Unterräume im Hilbertraum) sinnvoll sind: Ist ein Vektor separabel (verschränkt), dann ist auch ein beliebiges komplexes Vielfaches dieses Vektors separabel (bzw. verschränkt). Mathematische Beschreibung 167 3. Es ist wichtig zu betonen, dass die Konzepte der Separabilität und Verschränktheit nicht von einer Basis in den Hilberträumen abhängen. Hier ist auch wichtig sich klarzumachen, dass schon die Definition des Tensorprodukts nicht von einer Wahl der Basis abhängt. 4. Auch wenn die Definition der Verschränkung sehr einfach ist, kann es in einem konkreten Fall durchaus schwierig sein zu entscheiden, ob ein gegebener Vektor in Bezug auf eine Tensorproduktzerlegung separabel oder verschränkt ist. Wir werden im nächsten Abschnitt ein (in konkreten Fällen oft umständliches) Kriterium kennenlernen, mit dem sich diese Entscheidung zumindest im Prinzip treffen lässt. 8.1.3 Die Reduktion von Dichtematrizen In Kapitel 5.9.3 hatten wir gesehen, dass sich jeder Zustand durch eine Dichtematrix darstellen lässt. Eine Dichtematrix ρ ist dabei eine hermitesche Matrix (bzw. ein selbstadjungierter Operator) mit folgenden Eigenschaften: ρ† = ρ (8.11) Sp ρ = 1 (8.12) ρ2 ≤ ρ . (8.13) Die letzte Bedingung bedeutet, dass für jeden Zustand |ψi gilt hψ|ρ2 |ψi ≤ hψ|ρ|ψi . (8.14) Für einen reinen Zustand ist ρ ein Projektionsoperator (d.h. ρ2 = ρ). Ist |ψi ein (normierter) Repräsentant des reinen Zustands, dann ist ρ = |ψihψ|. Da ρ selbstadjungiert sein muss, lässt sich jede Dichtematrix diagonalisieren. Die obigen Bedingungen bedeuten dann, dass die Eigenwerte {pi } von ρ im Intervall [0, 1] liegen und normiert sind: P i pi = 1. Sie lassen sich als Wahrscheinlichkeiten deuten, mit denen die zugehörigen Eigenzustände vorliegen (all diese Eigenschaften wurden auch schon in Abschnitt 5.9.3 erwähnt). Das bisher Gesagte gilt natürlich auch für Dichtematrizen und reine Zustände in Tensorprodukträumen. Eine besondere Konstruktion ist jedoch, dass man Teilre” duktionen“ vornehmen kann. Man bildet dabei die Spur über nur einen der beiden Hilberträume. Physikalisch kann man das so deuten, dass man alle Information über den ausreduzierten Teilraum vergisst“ und sich nur auf die Informationen beschränkt, ” die man durch lokale Messungen an dem verbliebenen Teilsystem gewinnen kann. Sei A eine Matrix in einem Produkthilbertraum, dann lässt sich (in Bezug auf beliebige orthonormale Basen {|ei i} für H1 und {|fj i} für H2 ) die Matrix folgender- 168 Mehrteilchensysteme maßen schreiben: A= X aij kl |ei i|fj i hfk |hel | . (8.15) i,j,k,l Wir definieren nun die Spur (bzw. Teilspur) über den Hilbertraum H1 als X A2 = Sp1 A = hen |A|en i (8.16) n = X X aijkl hen |ei i|fj ihfk |hel |en i (8.17) n ijkl ! = X X jk anjkn |fj ihfk | . (8.18) n A2 ist ein Operator auf H2 , der auf H1 wirkende Anteil von A wurde ausgespurt“. ” Ganz entsprechend gibt es natürlich auch eine Spur über H2 , die einen Operator auf H1 belässt: X A1 = Sp2 A = hfm |A|fm i (8.19) m = X aijkl X hfm |fj i|ei ihel |hfk |fm i (8.20) m ijkl ! = X X il aimml |ei ihel | . (8.21) m Diese Operationen des teilweise Ausspurens kann man natürlich auch für Dichtematrizen vornehmen. Handelt es sich um die Dichtematrix zu einem separablen reinen Zustand, also um das Tensorprodukt von zwei Projektionsoperatoren, ρ = |ψi|φi hφ|hψ| = Pψ ⊗ Pφ , (8.22) dann erhält man durch die Teilspuren wieder Projektionsoperatoren bzw. Dichtematrizen zu reinen Zuständen: ρ1 = Sp2 ρ = |ψihψ| = Pψ und ρ2 = Sp1 ρ = |φihφ| = Pφ . (8.23) Handelt es sich jedoch bei ρ um die Dichtematrix zu einem verschränkten Zustand (d.h., ρ ist zwar ein Projektor, aber es gibt keine Projektionsoperatoren Pφ und Pψ , sodass ρ = Pφ ⊗ Pψ ), dann beschreiben ρ1 und ρ2 gemischte Zustände. Auf diese Weise erhält man ein praktisches Kriterium zur Überprüfung, ob ein Zustand separabel oder verschränkt ist: Handelt es sich bei den Dichtematrizen der ausreduzierten Teilräume um reine Zustände, ist der Zustand separabel, sind es Dichtematrizen zu gemischten Zuständen, ist der Zustand verschränkt. Die von Neumann-Entropie der reduzierten Dichtematrizen X S= pα, i ln pα, i = Sp ρα ln ρα (α = 1, 2) (8.24) i Identische Teilchen und Statistik 169 wird oft als ein Verschränkungsmaß angesehen (für reine Zustände ist die von NeumannEntropie null). Man kann beweisen, dass die von null verschiedenen Eigenwerte der beiden reduzierten Dichtematrizen gleich sind, sodass auch die beiden von NeumannEntropien gleich sind. Man kann auch Verschränkungsmaße für gemischte Zustände formulieren, allerdings handelt es sich hier um ein sehr komplexes Thema, das immer noch Teil der aktuellen Forschung ist. Ebenfalls ein schwieriges und noch nicht abgeschlossenes Forschungsgebiet ist die Untersuchung von Verschränkungsmaßen von (reinen und gemischten) Zuständen in Hilberträumen, die das Tensorprodukt von mehr als zwei Zustandsräumen sind, d.h., bezüglich einer Partition des Gesamtsystems in mehr als zwei Teilsysteme. Ein guter Übersichtsartikel zu Verschränkungsmaßen ist [43]. In [56] werden weitere Quantenkorrelationen von (gemischten) Zuständen behandelt. 8.2 Identische Teilchen und Statistik Bekannt ist das Pauli’sche Ausschließungsprinzip für Elektronen in einem Atom. Es besagt im Wesentlichen, dass keine zwei Elektronen denselben energetischen Zustand (Eigenzustand des Hamiltonoperators) besetzen können, bzw. dass keine zwei Elektronen in einem Atom dieselben Quantenzahlen (n, l, m, s) haben können. Es handelt sich hierbei um eine Folgerung aus einer allgemeineren Aussage für Elektronen: Der Zustand für ein System aus mehreren Elektronen muss total antisymmetrisch unter Vertauschung der Elektronen sein. Auch diese Aussage ist nur ein Spezialfall: Allgemein unterteilt man elementare Teilchen in Bosonen und Fermionen. Bosonen haben einen ganzzahligen Spin, sie genügen der sogenannten Bose-Einstein-Statistik, d.h., der Zustand eines Systems aus identischen Bosonen ist total symmetrisch. Damit kann jeder Einteilchenzustand von beliebig vielen Bosonen besetzt sein. Fermionen haben einen halbzahligen Spin, sie genügen der Fermi-Dirac-Statistik und der Zustand eines Systems aus identischen Fermionen ist total antisymmetrisch. Daraus folgt, dass jeder Einteilchenzustand in einem System mit mehreren identischen Fermionen maximal nur einmal besetzt sein kann. In der Quantenmechanik müssen diese Eigenschaften für Fermionen und Bosonen zusätzlich gefordert werden, d.h., sie stellen ein zusätzliches Postulat der Quantenmechanik dar. In einer Theorie, bei der man Teilchensysteme durch Erzeuger- und Vernichteroperatoren von Teilchen beschreibt (d.h., die Mehrteilchenzustände erhält man aus einem Grundzustand durch Anwendung von entsprechenden Erzeugeroperatoren — man spricht in diesem Fall schon mal von einer Zweitquantisierten Theorie), lassen sich diese Postulate auf die Forderung zurückführen, dass die Erzeugeroperatoren (bzw. entsprechend auch Vernichteroperatoren) von Bosonen untereinander kommu- 170 Mehrteilchensysteme tieren, bzw. die Erzeugeroperatoren von Fermionen untereinander antikommutieren. In einer relativistischen Quantenfeldtheorie, bei der man unter anderem auch LorentzInvarianz fordert, lässt sich das so genannte Spin-Statistik-Theorem aus allgemeinen Forderungen beweisen (siehe z.B. [70]) 8.2.1 Fermi-Dirac- und Bose-Einstein-Statistik Das Grundpostulat für Mehrteilchensysteme aus identischen Fermionen (beispielsweise mehreren Elektronen) lautet: Der Zustand des Mehrteilchensystems muss total antisymmetrisch unter Vertauschung der Teilchen sein. Entsprechend gilt für identische Bosonen, dass der Zustand total symmetrisch sein muss. Diese Forderungen wollen wir uns kurz anschauen und einige Folgerungen ableiten. Ein Fermion hat immer einen halbzahligen Spin, d.h., der Spin des Teilchens ist s = 12 , 32 , 25 , .... Im Standardmodell der Elementarteilchen sind alle Materieteil” chen“ Fermionen und tragen den Spin s = 21 . Dazu zählen die Leptonen (Elektronen, Myonen, Tau-Teilchen und die zugehörigen Neutrinos) und die Quarks (Up, Down, Strange, Charm, Top, Bottom) sowie die zugehörigen Antiteilchen. Zusammengesetz” te“ Elementarteilchen, wie Baryonen, können auch höheren halbzahligen Spin haben, beispielsweise haben ∆, Σ und Ξ-Teilchen den Spin s = 32 . Die Bosonen im Standardmodell sind die Austauschteilchen“— Photon, W ± -Boson, Z-Boson und Gluonen. Sie ” alle haben den Spin 1. Außerdem gehört zum Standardmodell der Elementarteilchen noch das Higgs-Teilchen als Boson mit Spin 0. Sollte eine Theorie der Quantengravitation die Eigenschaften haben, die man aus der klassischen Relativitätstheorie vermuten würde, so gibt es ein Austauschteilchen der Gravitation — das so genannte Graviton — mit Spin 2. Außerdem gibt es natürlich zusammengesetzte Teilchen mit ganzzahligem Spin, beispielsweise die Mesonen. Das Spin-Statistik-Theorem besagt nun, dass alle Teilchen mit halbzahligem Spin der Fermi-Dirac-Statistik genügen, bzw., dass der Zustand von mehreren identischen Teilchen dieser Art total antisymmetrisch sein muss; entsprechend genügen alle Teilchen mit ganzzahligem Spin der Bose-Einstein-Statistik – ihr Zustand muss total symmetrisch sein. Damit ist Folgendes gemeint: Da es sich um N identische Fermionen bzw. Bosonen handeln soll, ist der N Teilchenzustand zunächst ein Element (wir verwenden hier die Vektorsprechweise, das Gesagte lässt sich aber auch für Strahlen bzw. Dichtematrizen verallgemeinern) des N -fachen Tensorprodukts gleichartiger Hilberträume Hα (α = 1, ..., N ): Hges = H1 ⊗ N H2 ⊗ ... ⊗ HN = α Hα . Sei {|ei iα } eine Basis von Hα , so lässt sich ein Zustand in diesem Tensorproduktraum allgemein in folgender Form schreiben: |Ψi = X i1 ,...,in ψi1 ,i2 ,...,iN |ei1 i1 |ei2 i2 ...|eiN iN . (8.25) Identische Teilchen und Statistik 171 Auf die Basisvektoren dieses Tensorproduktraums wirkt die Permutationsgruppe von N Elementen: Sei P ∈ SN eine Permutation von N Elementen, dann ist Pσ |ei1 i1 |ei2 i2 ...|eiN iN = |eσ(i1 ) i1 |eσ(i2 ) i2 ...|eσ(iN ) iN , (8.26) Pσ (i1 , ..., iN ) = (σ(i1 ), ..., σ(iN )) . (8.27) wobei (Wir haben hier dasselbe Symbol Pσ verwendet, obwohl es sich im oberen Fall um eine Darstellung der Permutationsgruppe auf den Basisvektoren des Produkthilbertraums handelt, im letzteren Fall um die Darstellung von Pσ auf geordneten Folgen von N Elementen.) Eine Permutation ist also zunächst nur eine Abbildung auf der Menge der Basisvektoren – sie ordnet jedem Basisvektor einen (im Allgemeinen anderen) Basisvektor zu – wird jedoch wegen der Linearität im Hilbertraum zu einer Transformation auf dem Zuständen X Pσ |Ψi ≡ |Ψσ i = ψi1 ,i2 ,...,iN |eσ(i1 ) i1 |eσ(i2 ) i2 ...|eσ(iN ) iN . (8.28) i1 ,...,in Da auf der rechten Seite über alle Basisvektoren zu summieren ist, können wir die Wirkung von Pσ auch auf die Koeffizienten ψ... zurückziehen“. Für das Folgende ” macht dies keinen Unterschied. Jede Permutation lässt sich als gerade“ bzw. ungerade“ klassifizieren, je nach” ” dem ob man sie durch eine gerade oder ungerade Anzahl von Paarvertauschungen erhält (diese Klassifikation ist eindeutig, d.h., es gibt keine Permutation, die man einmal durch eine gerade und einmal durch eine ungerade Anzahl von Paarvertauschungen zusammensetzen kann). Diese Größe (−1)σ bezeichnet man auch als das Vorzeichen einer Permutation. Wir bezeichnen einen Zustand als total antisymmetrisch, wenn für alle Permutationen P gilt P |Ψi = |Ψσ i = (−1)σ |Ψi , (8.29) und als total symmetrisch, wenn P |Ψi = |Ψσ i = |Ψi . (8.30) Das Spin-Statistik-Theorem besagt, dass fermionische Zustände zu identischen Teilchen immer total antisymmetrisch und bosonische Zustände immer total symmetrisch sein müssen. Wir können nun den Produkthilbertraum Hges immer in eine Summe von Teilräumen zerlegen, die zu bestimmten Darstellungen der Permutationsgruppe gehören. Uns interessieren dabei nur die beiden Teilräume zu den 1-dimensionalen Darstellungen (d.h. (−1)σ ), also die Teilräume mit den total antisymmetrischen und den total 172 Mehrteilchensysteme symmetrischen Zuständen. (Bei 2-Teilchenzuständen lässt sich schon der gesamte Hilbertraum in diese beiden Teilräume zerlegen, bei Mehrteilchenzuständen treten auch nicht-triviale Darstellungen der Permutationsgruppe auf, die aber bisher in der Quantentheorie keine Rolle zu spielen scheinen.) Der physikalische Hilbertraum für ein System aus N identischen Fermionen besteht also aus dem Unterraum der total antisymmetrischen Zustände. Betrachten wir dazu einige Beispiele: 1. Bei zwei Teilchen, die jeweils n verschiedene Zustände annehmen können, ist der Produkthilbertraum n2 dimensional. Der total antisymmetrische Unterraum hat n(n − 1)/2 Dimensionen und der total symmetrische Unterraum n(n + 1)/2 Dimensionen. Bei zwei Elektronen, für die nur der Spinfreiheitsgrad relevant ist (also n = 2), ist der total antisymmetrische Unterraum eindimensional (dies ist der EPR-Zustand für identische Teilchen, s.u.) und der total symmetrische Unterraum dreidimensional. 2. Für drei Teilchen, bei denen jeweils nur zwei Zustände möglich sind, gibt es keinen total antisymmetrischen Unterraum (da man drei Teilchen nicht auf zwei Fächer verteilen kann, ohne dass ein Fach mindestens doppelbesetzt ist). Der total symmetrische Unterraum wäre vierdimensional. Man kann sich zu einem beliebigen Zustand in Hges leicht den total antisymmetrisierten bzw. total symmetrisierten Zustand durch eine Projektion konstruieren: Dazu summiert man über die gesamte Permutationsgruppe zusammen mit den Cha” rakteren“ ((−1)σ ): 1 X 1 X (−1)σ Pσ |Ψi = (−1)σ |Ψσ i NA σ NA σ 1 X 1 X σ = Pσ |Ψi = |Ψ i . NS σ NS σ |ΨiA = (8.31) |ΨiS (8.32) NA/S sind Normierungsfaktoren. Hat man also eine Lösung der Schrödinger-Gleichung zu einem N -Teilchenproblem gefunden, und soll es sich bei den N Teilchen um identische Teilchen handeln, erhält man durch diese Projektionen auf den total antisymmetrtischen bzw. total symmetrischen Unterraum die jeweiligen Lösungen für Fermionen bzw. Bosonen. Man erkennt nun auch leicht, weshalb keine zwei Fermionen denselben Energiezustand (oder denselben Zustand zu irgendwelchen Quantenzahlen) besetzen können. In diesem Fall wäre nämlich ψij.... symmetrisch unter Vertauschung dieser beiden Fermionen, aber der Tausch der Basisvektoren ergibt ein Minus-Zeichen. Damit heben sich die beiden Terme insgesamt weg und der Zustand verschwindet. Bei Bosonen Einstein-Podolsky-Rosen 173 hingegen addieren sich diese beiden Zustände. Bildet man anschließend das Absolutquadrat (zur Berechnung der Wahrscheinlichkeiten bzw. Intensitäten), so fallen solche mehrfach besetzten Zustände bei Bosonen besonders stark ins Gewicht. Die Symmetrisierung bzw. Antisymmetrisierung wirkt also scheinbar wie eine Wechselwirkung: Fermionen tendieren dazu, sich abzustoßen, Bosonen tendieren dazu, sich anzuziehen. Hierbei handelt es sich aber nicht um eine Wechselwirkung im üblichen Sinne (mit Energieaustausch) sondern um einen reinen Statistikeffekt. 8.3 Einstein-Podolsky-Rosen Im Jahre 1935 veröffentlichten Albert Einstein, Boris Podolsky und Nathan Rosen einen Artikel Can quantum-mechanical description of physical reality be considered complete? [24] (der fehlende Artikel wird dem russischen Englisch“ von Boris Podols” ky zugeschrieben), der die ungewöhnlichen und überraschenden Folgerungen aus der Existenz verschränkter Zuständen in der Quantenmechanik besonders deutlich machte, und der immer noch Gegenstand von Grundsatzdiskussionen in der Quantenmechanik ist. Der Angriff der drei Autoren galt der Behauptung, die Quantenmechanik sei vollständig und würde allen Freiheitsgraden Rechnung tragen, die physikalisch von Bedeutung und sinnvoll sind. In ihrer Arbeit kamen sie zu dem Schluss, dass es gewisse Elemente der Realität“ geben müsse, die von der Quantenmechanik nicht beschrieben ” werden. Daher sei diese nicht vollständig. EPR haben ursprünglich ihr scheinbares Paradoxon anhand eines Zweiteilchensystems beschrieben, bei dem die Orts- und Impulsvariablen der einzelnen Teilchen verschränkt sind. Lediglich der Gesamtimpuls und die Relativkoordinate liegen fest, was kein Widerspruch ist, da diese beiden Größen miteinander kommutieren. Wir beschreiben das Paradoxon anhand der Spinfreiheitsgrade von zwei Elektronen. Diese Version geht auf David Bohm zurück und vermeidet die formalen Schwierigkeiten im Zusammenhang mit den Eigenfunktionen zum Ort bzw. Impuls, die nichts mit dem eigentlichen Problem zu tun haben. Statt der Spinfreiheitsgrade kann man ebenso gut auch die Polarisationsfreiheitsgrade von Photonen betrachten. Gegeben seien zwei Spin- 12 -Teilchen in dem Zustand, bei dem der Gesamtdrehimpuls S = S1 + S2 verschwindet. Dieser so genannte EPR-Zustand hat die Form: 1 |ΨEPR i = √ (| ↑i1 | ↓i2 − | ↓i1 | ↑i2 ) . 2 (8.33) Die Indizes 1 und 2 beziehen sich dabei auf Teilchen 1 und Teilchen 2. Diese beiden Teilchen seien unterscheidbar, entweder, weil sie einen großen Abstand voneinander haben, oder weil es sich um verschiedene Teilchenarten handelt – EPR setzt nicht voraus, dass die verschränkten Systeme ununterscheidbar sind. Die Symbole ↑ und 174 Mehrteilchensysteme ↓ in den Ket-Klammern bezeichnen die beiden möglichen Polarisationen des Spins bezüglich einer vorgegebenen Richtung, beispielsweise der z-Richtung. Allerdings ist der Zustand invariant unter beliebigen Drehungen (es handelt sich um den Gesamtdrehimpuls S = 0–Zustand, der rotationsinvariant ist), die Antikorrelation gilt also bezüglich jeder Richtung. Dieser Zustand ist verschränkt, d.h., es gibt keine Basis, in der dieser Zustand faktorisiert. Keinem der beiden Teilchen kann ein wohldefinierter Spinzustand zugesprochen werden, es handelt sich um eine Superposition von zwei Beiträgen, bei denen jeweils eine Spinkomponente eines Teilchens antikorreliert ist mit der entsprechenden Spinkomponente des anderen Teilchens. Wann immer man an einem Teilchen eine Messung des Spins bezüglich irgendeiner Richtung vornimmt, weiß man, dass die Spinkomponente des anderen Teilchens bezüglich derselben Richtung den entgegengesetzten Wert hat. Diese Eigenschaft kann man an beliebig vielen gleichartig präparierten Systemen kontrollieren: Bezüglich derselben Richtung sind die beiden Spinkomponenten immer antikorreliert! EPR argumentieren nun folgendermaßen: Wenn wir an Teilchen 2 eine Spinmessung bezüglich irgendeiner Richtung vornehmen, können wir das Ergebnis der entsprechenden Messung an dem anderen Teilchen mit 100-prozentiger Sicherheit vorhersagen, ohne an diesem Teilchen irgendeine Veränderung (Messung) vorgenommen zu haben. Da Teilchen 1 aber nicht weiß“, bezüglich welcher Richtung wir an Teilchen 2 eine ” Messung vornehmen, und wir trotzdem anschließend vorhersagen können, was eine Messung an diesem Teilchen bezüglich der (willkürlich gewählten) Richtung ergeben wird, muss dieses Ergebnis schon vorher irgendwie festliegen (durch einen bisher nicht bekannten Freiheitsgrad innerhalb des Teilchens). Dies nennen EPR Elemente der ” Realität“. Ihre Definition lautet: Wenn wir an einem System, ohne dieses in irgendei” ner Weise zu stören, mit Sicherheit das Ergebnis einer Messung vorhersagen können, dann muss es ein Element der Realität geben, das diesem Freiheitsgrad entspricht“. Da die Quantenmechanik diesem Element der Realität nicht Rechnung trägt, ist die Quantenmechanik nicht vollständig. Die Reaktion der zeitgenössischen Physiker und Mitbegründer der Quantenmechanik war sehr unterschiedlich. Pauli schrieb unmittelbar nach der Veröffentlichung einen Brief an Heisenberg, in dem er ihn aufforderte, eine Antwort auf den EPR-Artikel zu verfassen [60]. In diesem Brief schrieb er unter anderem: Einstein hat sich wieder ” einmal zur Quantenmechanik öffentlich geäußert ... (gemeinsam mit Podolsky und Rosen – keine gute Kompanie übrigens). Bekanntlich ist das jedes Mal eine Katastrophe, wenn es geschieht. Weil, so schließt er messerscharf - nicht sein kann, was nicht sein ’ darf.‘ (Morgenstern). ... Immerhin möchte ich ihm zugestehen, dass ich, wenn mir ein Student in jüngeren Semestern solche Einwände machen würde, diesen für ganz intelligent und hoffnungsvoll halten würde. ...“. Einstein-Podolsky-Rosen 175 Die Argumentation von EPR ist verblüffend einfach und dementsprechend hatte beispielsweise Bohr große Schwierigkeiten, eine passende Antwort zu finden [12]. Seine Antwort lautete, dass eine physikalische Messung (hier an Teilchen 2) nicht unbedingt eine mechanische Störung“ für Teilchen 1 bedeuten muss (die beiden Teil” chen können theoretisch Lichtjahre voneinander entfernt sein und die jeweiligen Messungen innerhalb der jeweiligen Lichtkegel — also außerhalb der jeweiligen kausalen Einflussbereiche — stattfinden), dass eine solche Messung aber einen Einfluss auf die ” Möglichkeiten der Vorhersagen zukünftiger Messungen“ hat. Wir würden sagen, die Messung an Teilchen 2 verändert den Gesamtzustand der beiden Teilchen und damit auch den Zustand für Teilchen 1. Die Problematik ist jedoch: Falls die Wellenfunktion (oder allgemeiner der quantenmechanische Zustand) irgendeine Ontologie besitzt (also irgendein Korrelat besitzt, das außerhalb unseres Erfahrungsbereichs existiert), dann kommt es hier zu einer instantanen Veränderung über möglicherweise große Distanzen. Man spricht daher auch von einer Nichtlokalität der Quantenmechanik. Die Antwort von Bohr wird oftmals so gedeutet, dass er dem Quantenzustand eines Systems keine von unserer Erfahrung unabhängige Realität zuschreibt und dieser somit subjektiv ist. Die Reduktion besteht für Bohr (und Heisenberg hat dies später explizit betont [39]) lediglich in der Änderung unseres Wissens über das System. Interessant ist, dass EPR in ihrem Artikel nicht die Widerspruchsfreiheit des quantenmechanischen Formalismus angreifen. Sie hätten dies scheinbar leicht tun können, indem sie folgendermaßen argumentieren: Angenommen, wir messen die Polarisation an Teilchen 2 in x-Richtung. Dann kennen wir damit auch die Polarisation von Teilchen 1 in x-Richtung (wegen der Antikorrelation). Messen wir nun die Polarisation von Teilchen 1 in z-Richtung, kennen wir sowohl seine Polarisation in z als auch in x-Richtung, was nach den Unschärferelationen nicht möglich sein sollte. In ähnlicher Weise hatte Einstein bei seinen früheren Angriffen auf die Quantenmechanik argumentiert und Bohr hatte immer damit gekontert, dass wir die Vorhersage, die wir für die x-Richtung der Polarisation von Teilchen 1 treffen, nicht mehr kontrollieren können, nachdem wir die z-Richtung gemessen haben, und somit diese Vorhersage nicht überprüfbar sei. EPR greifen in ihrem Artikel die scheinbare Unvollständigkeit der Quantenmechanik an, nicht ihre scheinbare Widersprüchlichkeit. Wir sollten abschließend noch anmerken, dass die Korrelationen bzw. Antikorrelationen von verschränkten Zuständen nicht zu einer Signalübertragung verwendet werden können, da wir keinen Einfluss auf das Ergebnis einer Spinmessung haben. In diesem Sinne sind die Korrelationen ähnlich wie bei klassischen Systemen, bei denen aufgrund einer gemeinsamen Ursache eine Korrelation vorliegt. Beispielsweise kann eine Person zwei Briefe identischen Inhalts an zwei andere, weit voneinaner entfernte Personen schicken, die diese Briefe gleichzeitig öffnen und somit instantan wissen, was die andere Person in diesem Augenblick liest. Trotzdem kann die eine Person auf diese 176 Mehrteilchensysteme Weise keine instantane Information zur anderen Person übertragen. Allerdings gibt es in diesem Fall die Elemente der Realität“, denn der Inhalt der Briefe liegt ja schon ” vor, bevor die Personen die Briefe öffnen. Eine ähnliche verborgene Variable“ stellte ” sich wohl auch Einstein vor, als er das Paradoxon formulierte und zu dem Schluss kam, die QM sei nicht vollständig. Wie wir im folgenden Abschnitt sehen werden, kann es verborgene Variable dieser Art in der QM nicht geben. 8.4 Bell’sche Ungleichungen Mitte der 60er Jahre des 20. Jahrhunderts ging John Bell in mehreren Artikeln der Frage nach, ob es diese Elemente der Realität“ – heute würde man meist von ver” ” steckten Parametern“ sprechen, da diese Parameter nach der Quantentheorie nicht beobachtbar sein sollten – wirklich geben kann [4, 6]. Bis zu diesem Zeitpunkt existierten bereits mehrere so genannte No-Go-Theoreme, welche die Existenz versteckter Variabler auszuschließen schienen. Das bekannteste dieser No-Go-Theoreme stammte von Johann von Neumann und wurde 1932 in seinem Buch zu den mathematischen Grundlagen der Quantenmechanik [65] veröffentlicht. Interessanter Weise hatte schon im Jahre 1935 die Mathematikerin und Philosophin Grete Hermann auf eine physikalisch nicht gerechtfertigte Annahme in von Neumanns Beweis hingewiesen [40], durch welche das zu Beweisende praktisch schon hineingesteckt wird. Und auch von Neumann selbst betont in seinem Buch, dass es für diese Annahme keine physikalische oder mathematische Notwendigkeit gibt. Er schreibt, sie sei in der Quantenmechanik aber erfüllt und für seinen Beweis (der Nichtexistenz verborgener Variabler) wolle er von dieser Annahme ausgehen. Obwohl jedoch beispielsweise Werner Heisenberg und Carl Friedrich von Weizsäcker von der Arbeit von Grete Hermann wussten (und sich auch Einstein dieses Problems bewusst war), blieb diese Kritik bis in die 70er Jahre verschollen. (Nähreres zu dieser spannenden Geschichte findet man bei Max Jammer [45] sowie in dem sehr lesenswerten populärwissenschaftlichen Buch The Age of Entanglement“ von Louisa ” Gilder [34].) Nachdem im Jahre 1952 David Bohm eine Erweiterung der Quantenmechanik im Sinne von versteckten Variablen gelang, und somit das scheinbar Unmögliche wahr geworden war, machte sich John Bell an die Untersuchung der bisherigen NoGo-Theoreme, um deren Schwachstellen zu finden. Insbesondere war ihm bewusst, dass die Bohm’sche Mechanik keine lokale Theorie ist, d.h., physikalisch objektiv vorhandene Entitäten (das Führungsfeld, vgl. Abschnitt 13.7) ändern sich instantan und global als Folge einer Messung. Bells eigentliches Anliegen war die Frage, ob man nicht eine Theorie mit verborgenen Variablen konstruieren kann, die lokal ist, d.h., mit dem Kausalitätsverständnis der Relativitätstheorie vereinbar. Das Ergebnis seiner Bell’sche Ungleichungen 177 Überlegungen – die Bell’schen Ungleichungen – zeigten, dass keine lokale Theorie die experimentellen Vorhersagen der Quantenmechanik reproduzieren kann. 8.4.1 Bell’sche Ungleichungen — die Version von Wigner und d’Espagnat Die folgende anschauliche Herleitung einer Bell’schen Ungleichung (es gibt mehrere verschiedene Versionen von Bell’schen Ungleichungen) geht ursprünglich auf Eugene Wigner und in der hier vorgestellten Form auf Bernard d’Espagnat zurück [26]. Wir nehmen an, es gebe drei verschiedene Observable A, B und C, die jeweils nur einen von zwei möglichen Werten annehmen können. Ein klassisches Beispiel wäre ein System aus drei Münzen, die jeweils Kopf“ oder Zahl“ zeigen können. Aus irgend” ” einem Grund können wir aber an einem System jeweils nur zwei dieser Observablen messen, dafür können wir aber an beliebig vielen entsprechend präparierten Systemen solche Messungen vornehmen. Wir teilen nun ein ausreichend großes Ensemble solcher Systeme in drei gleich große Gruppen. Bei der ersten Gruppe messen wir die Observablen A, B, bei der zweiten die Observablen B und C und bei der dritten die Observablen A und C. Die Behauptung ist nun, dass die Häufigkeit der Systeme, bei denen die Observablen A und C gemessen werden und verschiedene Werte annehmen, immer kleiner ist als die Summe der Fälle, bei denen A und B gemessen werden und verschiedene Werte annehmen bzw. bei denen die Werte von B und C als verschieden gemessen werden. Anschaulich bedeutet das, wann immer A und C verschieden sind, muss auch entweder A und B verschieden sein oder aber B und C verschieden sein. Diese logische Folgerung – A und C können nicht verschieden sein, wenn A und B einerseits und B und C andererseits gleich sind – wird nun statistisch gemessen, da nicht alle drei Observablen an denselben Systemen überprüft werden können. Die Ungleichung lautet also: N − (A, C) ≤ N − (A, B) + N − (B, C) , (8.34) wobei N − andeuten soll, dass nur die Fälle gezählt werden, bei denen die beiden jeweiligen Observable verschiedene Werte annehmen. Etwas expliziter können wir auch schreiben: N (A+ , C − ) + N (A− , C + ) ≤ N (A+ , B − ) + N (A− , B + ) + N (B + , C − ) + N (C − , B + ) , (8.35) + − wobei nun N (A , C ) die Anzahl der Fälle kennzeichnet, bei denen die Observable A den Wert + und die Observable C den Wert − annimmt; entsprechend für die anderen Terme. Der Physiker John Clauser drückte diese Ungleichung einmal in der Form aus (aus [34]): Die Anzahl der jungen Nichtraucher plus die Anzahl der weiblichen ” 178 Mehrteilchensysteme Raucher aller Altersstufen ist größer oder gleich der Gesamtzahl aller jungen Frauen (Raucher und Nichtraucher).“ Es sei dem Leser überlassen, die Beziehung zu obiger Ungleichung herzustellen. Diese Ungleichung ist fast − − − A B C N (A, C) N (A, B) N (B, C) trivial und man kann sich von Ihrer Richtigkeit leicht +1 +1 +1 überzeugen, indem man +1 +1 −1 × × eine Tabelle aller acht +1 −1 +1 × × Möglichkeiten für die Werte +1 −1 −1 × × der Observablen erstellt und −1 +1 +1 × × dann nachweist, dass die Er−1 +1 −1 × × eignisse, die zur linken Seite beitragen, eine Teilmenge −1 −1 +1 × × der Ereignisse sind, die zur −1 −1 −1 rechten Seite beitragen. Bell koppelte diese Ungleichung mit der experimentellen Situation von EPR. Da die Werte bei Messung derselben Observablen an den beiden Teilsystemen immer antikorreliert sind, können wir eine der beiden Observablen an Teilsystem 1 messen und die andere an Teilsystem 2. Wenn wir nun mit n+ (A, B) die Anzahl der Fälle bezeichnen, bei denen an Teilsystem 1 Observable A gemessen wurde und an Teilsystem 2 die Observable B und die beiden Ergebnisse gleich sind, dann folgt die Ungleichung n+ (A, C) ≤ n+ (A, B) + n+ (B, C) . (8.36) Diese Ungleichung ist nochmals an untenstehender Tabelle verdeutlicht, bei der die möglichen Zustände von beiden (vollkständig antikorrellierten) Teilchen angegeben sind, und n+ sich jeweils auf eine Messung an Teilchen 1 und eine an Teilchen 2 bezieht, und nur die Fälle zählt, bei denen diese beiden Messungen dasselbe Ergebnis liefern. C2 n+ (A, C) n+ (A, B) n+ (B, C) A1 B1 C1 A2 B2 +1 +1 +1 −1 −1 −1 +1 +1 −1 −1 −1 +1 +1 −1 +1 −1 +1 −1 +1 −1 −1 −1 +1 +1 × × −1 +1 +1 +1 −1 −1 × × −1 +1 −1 +1 −1 +1 −1 −1 +1 +1 +1 −1 −1 −1 −1 +1 +1 +1 × × × × × × × × Bell’sche Ungleichungen 179 Diese Ungleichung kann in Quantensystemen verletzt sein. Wir bezeichnen nun mit der Observablen A die Messung der Spinvariablen in 0◦ -Richtung (relativ zur zAchse beispielsweise), mit B die Messung in 60◦ -Richtung und mit C die Messung in 120◦ -Richtung. Die Ungleichung besagt dann, wenn wir an den beiden Teilchen eine Spinmessung in zwei Richtungen durchführen, die sich um 120◦ voneinander unterscheiden, dann ist die Häufigkeit der Fälle, bei denen wir dasselbe Resultat erhalten, immer kleiner als die Summe der Anzahl der Fälle, bei denen wir an Teilchen 1 eine Messung in 0◦ (bzw. 60◦ ) durchführen und an Teilchen 2 eine Messung in 60◦ -Richtung (bzw. 120◦ -Richtung) und die Ergebnisse gleich sind. Da in der QM die Wahrscheinlichkeit, an zwei im EPR-Zustand verschränkten Teilchen dasselbe Resultat zu erhalten, wenn die Messung an Teilchen 1 in α-Richtung erfolgt und die Messung an Teilchen 2 in β-Richtung, gleich β−α 2 (8.37) w(α, β) = sin 2 ist, kann man sofort sehen, dass die Ungleichung in der QM verletzt ist (sin 30◦ = 12 √ und sin 60◦ = 3/2). Bei Polarisationsexperimenten mit Photonen muss Gleichung 8.37 übrigens durch w(α, β) = sin2 (β − α) ersetzt werden und man würde die Polarisationsfilter unter 0◦ , 30◦ und 60◦ ortientieren. Der unterschiedliche Faktor 21 hängt mit dem Unterschied zwischen Spin-Orientierung und Polarisation zusammen. Anschaulich bringt er zum Ausdruck, dass zwei entgegengesetzte Spin-Richtungen zu orthogonalen Zuständen gehören, wohingegen zwei unter 90◦ orientierte Polarisationsrichtungen orthogonalen Zuständen entsprechen. In den 70er Jahren wurde mehrere Experimente zum Test der Bell’schen Ungleichung in der Quantenmechanik durchgeführt, allerdings war die Statistik sehr schlecht und die Ergebnisse waren teilweise widersprüchlich. Im Jahre 1982 bestätigten die Experimente von Alain Aspect [1] an Photonen schließlich, dass die Bell’schen Ungleichungen in der Quantenmechanik eindeutig verletzt sind. Insbesondere konnte Aspect auch zeigen, dass die Verletzung der Bell’schen Ungleichung bestehen bleibt, selbst wenn die Messungen an Teilsystem 1 und Teilsystem 2 innerhalb der jeweiligen kausalen Komplemente bezüglich einer Signalausbreitung mit Lichtgeschwindigkeit erfolgen. (Aspect verwendete Photonenpaare in einem Abstand von rund 10 Metern, sodass die Messungen innerhalb von Nanosekunden stattfinden mussten, mittlerweile wurden ähnliche Experimente mit Photonenpaaren im Abstand von rund 80 Kilometern wiederholt und die Vorhersagen der Quantenmechanik bestätigt.) Im Wesentlichen gehen drei Annahmen in die obige Form der Bell’schen Ungleichungen ein, von denen mindestens eine in der Quantenmechanik verletzt sein muss: 1. Induktionsannahme: Falls es die versteckten Variablen gibt, welche im EPRZustand für die Antikorrelation der Spinkomponenten in dieselbe Richtung ver- 180 Mehrteilchensysteme antwortlich sind, so darf die Antikorrelation auch angenommen werden, wenn die Messungen an den Teilsystemen in verschiedene Richtungen erfolgen. 2. Einstein-Realität: Es ist sinnvoll anzunehmen, dass es die Elemente der Realität gibt, durch welche die Ergebnisse der Messungen schon festliegen, bevor die Messungen tatsächlich durchgeführt werden. (Die Antikorrelation wurde also schon bei der Erstellung der Verschränkung durch die gemeinsame Ursache festgelegt.) 3. Lokalität: Die Information über das Ergebnis einer Messung breitet sich maximal mit Lichtgeschwindigkeit (bzw. einer Grenzgeschwindigkeit) aus, d.h., es findet keine instantane Signalübertragung von Teilsystem 1 zu Teilsystem 2 im Augenblick der Messung statt. Könnten wir die Spinvariable in α- und β-Richtung an einem Teilsystem messen, könnte die Bell’sche Ungleichung nur verletzt sein, wenn Bedingung 2 verletzt ist. Da die Messungen in α- und β-Richtung aber zu nicht-kommutierenden Observablen gehören, können sie nicht gleichzeitig an demselben System vorgenommen werden. Daher wollen wir von der Messung an Teilsystem 2 auf die versteckten Variablen von Teilsystem 1 schließen, und für diese Schlussfolgerung benötigen wir die beiden anderen Annahmen. Die Ergebnisse von Bell zeigen, dass jedes Modell mit versteckten Variablen, das die Ergebnisse der Quantenmechanik reproduziert, nicht-lokal sein muss. Tatsächlich ist das Bohm’sche Modell der Quantenmechanik (bzw. die Bohm’sche Mechanik) eine nicht-lokale Theorie, bei der sich gewisse Potenzialfelder instantan im Raum ändern, wenn eine Messung durchgeführt wird. Da die EPR-Korrelationen keine Signalübertragung ermöglichen, hat diese Nichtlokalität keine messbaren Konsequenzen. Auch die Quantenmechanik wird als eine nicht-lokale Theorie bezeichnet, da sich der Zustand eines verschränkten Systems instantan (d.h., möglicherweise über ein großes Gebiet verteilt bzw. in Gebieten, die einen großen Abstand voneinander haben) verändert. Lediglich eine Interpretation der Quantenmechanik, die dem Quantenzustand (der Wellenfunktion) keinerlei ontologische Realität zuschreibt, hat mit dieser Nicht-Lokalität keine Probleme. 8.4.2 Bell’sche Ungleichungen — CHSH-Version Nachdem John Bell seine Ungleichung abgeleitet und veröffentlich hatte, versuchten verschiedene Gruppen, die Ungleichung experimentell zu testen. Dabei stellte sich jedoch heraus, dass die ursprüngliche Form von Bell nicht besonders gut für eine experimentelle Überprüfung geeignet war. Mehrere Gruppen bauten entsprechende Experimente auf und in diesem Zusammenhang formulierten John Clauser, Michael Horne, Abner Shimony und Richard Bell’sche Ungleichungen 181 Holt eine neue Form der Bell’schen Ungleichung [18], die experimentell leichter zu realisieren war, da sie für jedes der beiden Teilchen nur zwei verschiedene Möglichkeiten testete (damit waren die Schalter, die zwischen den Möglichkeiten umschalten mussten, einfacher). Diese Ungleichung bezeichnet man heute als CHSH-Ungleichung bzw. CHSH-Form der Bell’schen Ungleichung. Der verschränkte Zustand ist ähnlich wie der EPR-Zustand, allerdings werden an Teilchen 1 nur die Polarisationen unter 0◦ und 45◦ gemessen, und an Teilchen 2 die Polarisationen unter 22, 5◦ und 67, 5◦ . Die genauen Winkel spielen für die Ungleichung überhaupt keine Rolle, allerdings ist die Ungleichung für diese Winkel in der Quantenmechanik maximal verletzt. Für das Folgende nehmen wir 4 Eigenschaften an, die wir mit a, a0 , b und b0 bezeichnen. Diese 4 Eigenschaften werden an den beiden Teilchen eines EPR-Zustands gemessen, wobei an Teilchen 1 nur die Eigenschaften a und a0 und an Teilchen 2 nur die Eigenschaften b und b0 gemessen werden. Die möglichen Resultate einer Messung von jeder der vier Eigenschaften können nur +1 und −1 sein. a a0 b b0 S +1 +1 +1 +1 +2 +1 −1 +1 +1 −2 −1 +1 +1 +1 +2 −1 −1 +1 +1 −2 +1 +1 +1 −1 +2 +1 −1 +1 −1 +2 −1 +1 +1 −1 −2 −1 −1 +1 −1 −2 +1 +1 −1 +1 −2 +1 −1 −1 +1 −2 −1 +1 −1 +1 +2 −1 −1 −1 +1 +2 In nebenstehender Tabelle sind alle 16 Möglichkeiten für die vier Eigenschaften aufgelistet. Ebenfalls aufgelistet ist die folgende Kombination: S = ab − ab0 + a0 b + a0 b0 +1 +1 −1 −1 −2 +1 −1 −1 −1 +2 −1 +1 −1 −1 −2 Jeder Term in dieser Kombination ist ein Produkt aus einer der beiden Eigenschaften, die am ersten Teilchen gemessen werden (a oder a0 ) und einer der beiden Eigenschaften, die am zweiten Teilchen gemessen werden (b oder b0 ). Man erkennt, dass in allen 16 Fällen der Wert für S immer nur +2 oder −2 sein kann. Bilden wir also den Erwartungswert von S über sehr viele Messungen (in jeder Einzelmessung kann immer nur einer der Terme in der Summe bestimmt werden), so sollte der Erwartungswert E(S) schließlich zwischen −2 und +2 liegen. Wir erhalten also die Ungleichung: −1 −1 −1 −1 +2 −2 ≤ E(S) ≤ +2 . (8.38) Experimentell erzeugt man ein Ensemble verschränkter Teilchen, beispielsweise im EPR-Zustand, und an jedem Teilchenpaar wird eine der vier Kominationen (a, b), (a, b0 ), (a0 , b), (a0 , b0 ) gemessen. Zu jeder dieser Kombinationen erhält man schließ- 182 Mehrteilchensysteme lich einen Erwartungswert für das Produkt der Messwerte, was zu der Ungleichung −2 ≤ E(a, b) − E(a, b0 ) + E(a0 , b) + E(a0 , b0 ) ≤ +2 (8.39) führt. Bei der experimentellen Realisation gibt es zwei Schwierigkeiten: Erstens benötigt man einen schnellen Schalter, mit dem man möglichst im Nanosekundenbereich zwischen den beiden Winkeln, die an einem Teilsystem gemessen werden, hin- und herschalten kann, sodass eine Signalausbreitung zwischen den beiden Teilsystemen mit Lichtgeschwindigkeit ausgeschlossen werden kann. Das zweite Problem besteht in einem möglichst effizienten Detektor, der ein Teilchen, das einen der Filter passiert, auch tatsächlich nachweist. Insbesondere möchte man natürlich auch umgekehrt aus dem Nicht-Nachweis eines Teilchens in einem Detektor schließen können, dass das Teilchen die entgegengesetzte Polarisation hatte. Nach ersten, noch mit großen Fehlern behafteten Experimenten in den 70er Jahren konnte Alain Aspect [1] 1982 die Ergebnisse eines Experiments veröffentlichen, das (fast) alle Zweifel an den richtigen Vorhersagen der Quantenmechanik ausräumte. Seien N ++ , N +− , N −+ , N −− die vier Möglichkeiten, wie bei gegebener Winkeleinstellung der Filter die beiden Detektoren reagieren (+ bedeutet einen Teilchennachweis, − einen Nicht-Nachweis und somit – im theoretischen Idealfall – die orthogonale Polarisation), dann ist der zugehörige Erwartungswert durch E= N ++ + N −− − N +− − N −+ N ++ + N −− + N +− + N −+ (8.40) gegeben. Die quantenmechanischen Erwartungswerte für eine Winkeldifferenz ∆α zwischen den beiden Einstellungen an Teilchen 1 und 2 hängen von der Art des verschränkten Zustands ab: Bei einem EPR-Zustand besteht eine totale Antikorrelation zwischen den Polarisationen (d.h., die Wahrscheinlichkeit zwei im Bell-Zustand verschränkte Photonen mit derselben Polarisation zu messen ist null), in anderen verschränkten Zuständen kann man auch eine totale Korrelation erzeugen, sodass die oben genannte Wahrscheinlichkeit eins ist. Die folgenden Gleichungen beziehen sich auf einen total korrelierten verschränkten Zustand (bei EPR müsse man überall die Kosinus- durch die Sinus-Funktion ersetzen, was letztendlich nur zu einem Vorzeichenwechsel führt). Die Erwartungswerte für eine Winkeldifferenze ∆α sind in diesem Fall: E(∆α) = cos2 ∆α − sin2 ∆α = cos 2∆α . (8.41) cos2 ∆α ist die Wahrscheinlichkeit, dass die beiden Teilchen denselben Messwert liefern (beide + oder beide −) und sin2 ∆α ist die Wahrscheinlichkeit, dass sie verschiedene Werte liefern (+− bzw. −+). 8.5. UMSETZUNGEN FÜR DIE SCHULE 183 Für die Winkel a = 0◦ , a0 = 45◦ , b = 22, 5◦ und b0 = 67, 5◦ gibt es letztendlich für ∆α nur zwei Kombinationen: (a, b0 ) → ∆α = 67, 5◦ und (a, b), (a0 , b), (a0 , b0 ) → ∆α = ±22, 5◦ . damit folgt schließlich: √ 4 (8.42) E(S) = 3 · cos(2 · 22, 5◦ ) − cos(2 · 67, 5◦ ) = √ = 2 2 ≈ 2, 828 . 2 √ Dieses Ergebnis ist also um einen Faktor 2 größer, als es nach der Bell’schen Ungleichung erlaubt wäre (man bezeichnet diesen Wert auch als Quantum bound“). Das ” erscheint im ersten Augenblick zwar viel, doch da sich jede Unsicherheit (beispielsweise bei der Ansprechgenauigkeit der Detektoren) zu Ungunsten des Ergebnisses auswirkt, war der experimentelle Nachweis der Verletzung nicht einfach. Übrigens gehen in die CHSH-Ungleichung nur zwei der drei oben genannten Annahmen ein. Die Induktionsannahme ist nicht erforderlich, da die Korrelation oder Anti-Korrelation bezüglich derselben Orientierungen jetzt weder gemessen werden noch eine entscheidende Rolle für die Ungleichung spielen. (Sie spielen natürlich eine Rolle für den Nachweis der Verletzung in der Quantenmechanik, da an einem unverschränkten Zustand die Ungleichung nicht verletzt werden kann.) 8.5 Umsetzungen für die Schule Zum Abschluss schildern wir noch einige Möglichkeiten, wie man die Bedeutung der Bell’schen Ungleichungen und ihrer Verletzung in der Quantenmechanik gegenüber Schülern verdeutlichen kann. Dazu betrachten wir drei Szenarien. 8.5.1 Drei Vesperdosen Die folgende Darstellung ist eine Abwandlung von einer Parabel, die Ernst Specker zugeschrieben wird (siehe z.B. [54]). Man stelle sich vor, die Mutter einer Schülerin oder eines Schülers richtet jeden Morgen drei Vesperdosen, davon sind zwei für den Schüler bzw. die Schülerin und eine verbleibt bei der Mutter. Immer wenn das Kind in der Schule die beiden Vesperdosen öffnet, befindet sich in einer ein Wurstbrot und in der anderen Vesperdose ein Käsebrot. Wie ist das möglich? Unnatürlich an dieser Geschichte ist, dass in den drei Vesperdosen offensichtlich entweder jeweils ein Wurstbrot oder ein Käsebrot ist. Doch weshalb greift man nie zwei Dosen, bei denen in beiden ein Wurstbrot bzw. in beiden ein Käsebrot ist? Bei drei Dosen, muss doch (mindestens) in zwei Dosen dasselbe sein. Man kann sich nun überlegen, ob die Mutter vielleicht ihr Kind beeinflusst ( hypnotisiert“), sodass es genau die beiden Dosen mit verschiedenen Inhalten nimmt. ” 184 Mehrteilchensysteme Das würde bedeuten, dass das Kind die Dosen nicht nach freiem Willen“ greift, son” dern in seiner Willensfreiheit eingeschränkt ist. Dieses Beispiel zeigt die allgemeine Problematik der Quantenmechanik, nämlich dass die Inhalte möglicherweise erst entstehen, wenn die Dosen geöffnet werden. Man kann dann auch die Nicht-Lokalität der Quantenmechanik daran illustrieren, wenn man nämlich die beiden Dosen noch sehr weit voneinander entfernt. Man denke z.B. an zwei Kinder der Mutter, die sich jeweils eine Dose aussuchen können, diese aber an getrennten Orten öffnen und am Abend feststellen, dass in der einen Dose ein Wurstund in der anderen ein Käsebrot war. Falls die Dosen gleichzeitig geöffnet wurden und die Brote erst im Augenblick des Öffnens entstehen, wie kann es dann zu der Antikorrelation kommen? 8.5.2 Nochmals Vesperdosen Das obige Beispiel verdeutlicht zwar die Problematik im Zusammenhang mit verschränkten Zuständen, entspricht aber in dieser Form nicht direkt den erwähnten Fällen (z.B. der Wigner-Ungleichung). Dies erreicht man jedoch durch eine kleine Abwandlung der obigen Geschichte. Eine Mutte hat zwei Kinder. Sie bereitet jeden Morgen drei Vesperdosen, die sie nebeneinander aufstellt. Die beiden Kinder können sich jeweils eine Dose aussuchen, die sie dann in der Schule öffnen. Immer, wenn die beiden Kinder zwei benachbarte Dosen nehmen (also die mittlere Dose und entweder die rechte oder die linke), haben sie denselben Brotaufstrich. Doch wenn sie die beiden äußeren Dosen nehmen, finden sie einen verschiedenen Brotaufstrich. Wie kann das sein? Diese Geschichte entspricht eher der Wigner-Ungleichung: Die Inhalte von A und B bzw. die Inhalte von B und C sind (fast) immer gleich, aber die Inhalte von A und C sind verschieden. Wenn man auch hier ausschließt, dass die Kinder ihre Dosen nicht frei aussuchen (sondern von der Mutter beeinflusst wurden), bleibt fast nur die Möglichkeit, dass die Inhalte der Dosen erst nach der Wahl der Dosen entstehen“. ” 8.5.3 Eine Schülerbefragung“ ” Als drittes Beispiel wählen wir eine hypothetische Hintergrundgeschichte (hier sind der Phantasie aber keine Grenzen gesetzt): Zwei Personen (Schüler) sind Zeugen eines Einbruchs geworden, bei dem drei Einbrecher jeweils Kleidung unterschiedlicher Farbe hatten – B'Blau, R'Rot und S'Schwarz. Diese Kleidungsfarbe dient nur dazu, dass man jeden der drei Einbrecher durch seine Kleidung identifizieren kann. Die beiden Schüler werden nun getrennt zum Geschlecht der jeweiligen Einbrecher befragt. Dabei wird jedem Schüler nur eine Frage gestellt; diese Frage unterscheidet sich lediglich in Bezug auf die Person (die Farbe der Kleidung), lautet aber ansonsten immer gleich: 8.5. UMSETZUNGEN FÜR DIE SCHULE 185 • Welches Geschlecht hatte die Person X? (wobei X durch B, R oder S zu ersetzen ist) (die möglichen Antworten lauten männlich“ oder weiblich“) ” ” Wann immer die beiden Schüler zu derselben Person befragt werden, müssen sie gleich antworten. Dies ist eine Grundbedingung (andernfalls werden die Spielregeln verletzt und die Schüler disqualifiziert). Werden die Schüler zu verschiedenen Personen befragt, gibt es keine Einschränkungen. Wie schon erwähnt wird jedem Schüler nur eine Frage gestellt. Die einzige Möglichkeit zu garantieren, dass bei Fragen zur gleichen Person die Antworten immer gleich sind, besteht darin, dass sich die Schüler vorher absprechen, welche Antworten sie auf die drei möglichen Fragen geben wollen. Diese Absprache entspricht den verborgenen Variablen“, denn nun steht ja schon vor der eigentlichen ” Befragung fest, welche Antworten die Schüler auf die jeweiligen Fragen geben würden. Man kann sich nun (beispielsweise anhand von der obigen Tabelle (Seite 178), bei der lediglich A, B, C durch B, R, S sowie + und − durch m “ und w “ zu ersetzen ” ” sind) überlegen, dass statistisch die folgende Ungleichung erfüllt sein muss (identisch zu Gl. 8.34): N − (B, S) ≤ N − (B, R) + N − (R, S) (8.43) wobei nun N − (B, S) bedeutet, dass einer der Schüler nach dem Geschlecht von Person B und der andere nach dem von Person S befragt wurde, und sie unterschiedliche Antworten gegeben haben. Bei einer vorherigen Absprache der jeweiligen Antworten kann die Ungleichung nicht verletzt werden. Ohne eine solche Absprache können die Schüler aber nicht garantieren, dass sie die Spielregeln einhalten (bei Befragung nach derselben Person auch dasselbe zu antworten). Die verborgenen Variablen machen eine Verletzung unmöglich. Eine Möglichkeit gibt es aber: Falls die Schüler ihre Handys eingeschaltet haben, hören sie, welche Frage dem jeweils anderen Schüler gestellt wird und können ihre Antworten nun spontan abstimmen: Immer, wenn ihnen dieselbe Frage gestellt wird, antworten sie wie vorher abgesprochen; sind die Fragen aber verschieden, antworten sie mit demselben Geschlecht (z.B., immer mit m“), wenn ein R dabei ist, und ansonsten ” mit verschiedenen Geschlechtern. Durch diese Nicht-Lokalität“ der Kommunikation, ” nachdem zumindest einem der Schüler die Frage gestellt wurde, kann die Ungleichung verletzt werden. Hypothetisch besteht noch eine zweite Möglichkeit, diese Ungleichung zu verletzen: Falls nämlich schon vor Beginn der eigentlichen Befragung bekannt ist, in welcher Reihenfolge welche Fragen gestellt werden, beispielsweise falls eine Liste kursiert, in der die jeweiligen Fragen, die dann später den Schülerpaaren gestellt werden, in ihrer Reihenfolge schon festgelegt sind. Dann können sich die Schüler natürlich dahingehend 186 Mehrteilchensysteme absprechen, dass sie bei gleichen Fragen eben Dasselbe antworten, und bei verschiedenen Fragen entsprechend der obigen Regel reagieren, die eine Verletzung der Bell’schen Ungleichung impliziert. Eine solche vorab kursierende Liste der möglichen Fragen bedeutet in der Physik, dass die Richtungen, bezüglich derer im Experiment die SpinKomponenten bestimmt werden sollen, schon vor Beginn des Experiments festliegen, beispielsweise bei der Erzeugung der verschränkten Teilchenpaare. Das heißt aber, der Experimentator hat keinen freien Willen“, spontan zu entscheiden, bezüglich welcher ” Richtung die Komponenten gemessen werden sollen. Kapitel 9 Zwei-Zustands-Systeme Zwei-Zustandssysteme spielen in der Quantentheorie aus vielen Gründen eine wichtige Rolle. Zum Einen handelt es sich um die einfachsten nicht-trivialen Quantensysteme, und daher sind sie schon allein aus pädagogischen Gründen von besonderem Interesse. Zur Darstellung der Zustände genügt ein komplex zweidimensionaler Vektorraum, d.h. die Observablen sind 2 × 2-Matrizen und die Zustände lassen sich durch zweidimensionale Vektoren darstellen. Trotz dieser Einfachheit kann man bereits sehr viele der quantenmechanischen Besonderheiten an diesen Systemen erläutern. Aber auch aus physikalischen Gründen sind Zwei-Zustandssysteme wichtig. Wie wir gesehen haben, lassen sich die Polarisationszustände von Photonen durch ein solches System beschreiben, das Gleiche gilt für die Spin-Zustände von Elektronen bzw. allgemeiner von Spin- 21 -Systemen. Außerdem sind quantenmechanische ZweiZustandssysteme die natürliche Erweiterung der klassischen Bool’schen Variablen 0 und 1, also der elementaren Einheit – dem Bit – der Mathematik der Informationstheorie. Entsprechend sind quantenmechanische Zwei-Zustandssysteme die elementaren Einheiten der Quanteninformation“ und des Quantum Computing“ und be” ” schreiben ein Qubit“. ” Schließlich sind Zwei-Zustandssysteme oftmals gute Näherungen für komplexere Systeme, bei denen beispielsweise aufgrund der Wechselwirkung dieser Systeme mit anderen Objekten oder einer Umgebung nur der Grundzustand und der erste angeregte Zustand physikalisch von Relevanz sind. Was man wissen sollte Man sollte die Pauli-Matrizen und ihre Vertauschungsrelationen (zumindest bis auf Vorzeichen, die Konvention sind) kennen. Das Konzept der Bloch-Kugel sollte bekannt sein, auf deren Oberfläche die reinen Zustände und in deren Inneren die gemischten Zustände dargestellt werden. Das Stern-Gerlach Experiment sollte man beschreiben 187 188 Zwei-Zustands-Systeme und auch die Gründe für die Inhomogenität des Magnetfelds angeben können. Die Parallelen sowie auch die Unterschiede zwischen der Spin- 12 -Darstellung beispielsweise für Elektronen und der Polarisationsdarstellung für Photonen sollten bekannt sein. Ebenso sollte man wissen, was das No-Cloning“-Theorem aussagt. Man sollte den ” Begriff des Qubits (der Einheit“ der Quanteninformation) kennen und seinen Bezug ” zu den Spin- bzw. den Polarisationszuständen beschreiben können. Außerdem sollte man das Prinzip der Quantenkryptographie beschreiben können. 9.1 Pauli-Matrizen Zwei-Zustandssysteme werden in der Quantenmechanik in einem (komplex) zweidimensionalen Hilbertraum C2 mit dem kanonischen (hermiteschen) Skalarprodukt, ~y · ~x = hy|xi = y1∗ x1 + y2∗ x2 , (9.1) beschrieben. Bevor wir uns mit den physikalischen Zuständen und den Observablen beschäftigen, definieren wir einen Satz von Matrizen, der sich in diesem Zusammenhang als sehr hilfreich erwiesen hat und mit dem sich jede andere Matrix ausdrücken lässt. Dies sind die Pauli-Matrizen: ! ! ! 0 1 0 −i 1 0 σ1 = σ2 = σ3 = . (9.2) 1 0 i 0 0 −1 Es handelt sich um drei selbst-adjungierte (hermitesche) Matrizen, die zusammen mit der Identitätsmatrix 1 den Raum aller 2 × 2 Matrizen aufspannen (im Sinne eines Vektorraums, d.h., jede 2 × 2–Matrix lässt sich als komplexe Linearkombination der vier genannten Matrizen schreiben). Ist man nur an selbst-adjungierten Matrizen interessiert, lässt sich jede 2 × 2Matrix in der Form ! 3 X a0 + a3 a1 − ia2 A= ai σi = a0 1 + a1 σ1 + a2 σ2 + a3 σ3 = (9.3) a + ia a − a 1 2 0 3 i=0 schreiben, wobei ai ∈ R. Die Eigenwerte einer solchen Matrix erhalten wir aus der charakteristischen Gleichung: det(λ 1 − A) = λ2 − 2a0 λ + a20 − (a21 + a22 + a23 ) = 0 (9.4) mit den Lösungen: λ1/2 = a0 ± q a20 − (a20 − ~a2 ) = a0 ± |~a| , (9.5) Der Zustandsraum 189 wobei wir ~a = (a1 , a2 , a3 ) geschrieben haben. Die Pauli-Matrizen erfüllen sehr einfache Multiplikations- und Kommutatorregeln: σ1 σ2 = iσ3 [σ1 , σ2 ] = 2iσ3 σ2 σ3 = iσ1 σ3 σ1 = iσ2 [σ2 , σ3 ] = 2iσ1 σi2 = 1 (i = 1, 2, 3) [σ3 , σ1 ] = 2iσ2 bzw. zusammenfassend σi σj = i 3 X ijk σk + δij 1 σi σj = −σj σi (i 6= j) k=1 [σi , σj ] = 2i 3 X ijk σk (9.6) k=1 (mit ijk dem total antisymmetrischen -Tensor.) Aus der letzten Gleichung ergibt sich sofort, dass die Spin-Matrizen ~ σi (i = 1, 2, 3) 2 eine Darstellung der Algebra der Drehimpulse (siehe Abschnitt A3) bilden: Si = [Si , Sj ] = i~ 3 X ijk Sk . (9.7) (9.8) k=1 9.2 Der Zustandsraum Wir hatten schon mehrfach betont, dass die physikalischen Zustände den Strahlen, also den komplex eindimensionalen linearen Unterräumen in einem Hilbertraum entsprechen. Zwei Vektoren, die sich nur um die Multiplikation mit einer komplexen Zahl unterscheiden, repräsentieren daher denselben Zustand. Zur Charakterisierung der Zustände ist es oft sinnvoll, statt mit Strahlen mit den zugehörigen selbst-adjungierten Projektionsoperatoren zu rechnen: Jeder Strahl entspricht einem Projektionsoperator mit der Spur 1 (d.h., einer Projektion auf einen 1-dimensionalen Vektorraum). Ein Projektionsoperator erfüllt immer die Gleichung P 2 = P und hat damit die Eigenwerte 0 und 1. Die Projektionsoperatoren auf 1dimensionale Unterräume in einem 2-dimensionalen Vektorraum sind somit genau die hermiteschen Matrizen, die einen Eigenwert 0 und einen Eigenwert 1 haben. Nach Gl. 9.5 bedeutet das: a0 = 21 und |~a| = 21 . Die gesuchten Projektionsoperatoren haben somit die Form: 1 P~n = (1 + ~n · ~σ ) . (9.9) 2 (Man beachte, dass ~n ein gewöhnlicher reeller dreidimensionaler Einheitsvektor ist, aber ~σ ein dreidimensionaler Vektor, dessen Komponenten 2 × 2–Matrizen sind.) Für den Kommutator zweier solcher Projektionsoperatoren gilt 1X 1X [P~n , Pm ni mj [σi , σj ] = i ni mj ijk σk = i(~n × m) ~ · ~σ . (9.10) ~] = 4 i,j 2 i,j 190 Zwei-Zustands-Systeme Zwei Projektionsoperatoren kommutieren also genau dann, wenn die Einheitsvektoren ~n und m ~ linear abhängig sind, d.h. für ~n = ±m. ~ Für m ~ = −~n gilt offenbar P~n + P−~n = 1 , (9.11) die beiden Projektionsoperatoren projizieren also auf orthogonale Unterräume. Damit finden wir, dass wir jeden (reinen) physikalischen Zustand im C2 durch einen dreidimensionalen Einheitsvektor ~n kennzeichnen können, oder anders ausgedrückt: Die Menge der physikalischen (reinen) Zustände bildet eine 2-Sphäre. Der Vollständigkeit halber wollen wir auch noch die gemischten Zustände, also die Dichtematrizen für 2-Zustandssysteme erwähnen. Für sie gilt, dass die Eigenwerte zwischen 0 und 1 liegen müssen, ihre Summe aber 1 sein muss. Damit erhalten wir die Dichtematrizen, indem wir Vektoren ~n mit |~n| < 1 betrachten. Zusammenfassend können wir also sämtliche gemischten und reinen Zustände durch einen Vektor im R3 charakterisieren, dessen Länge kleiner oder gleich 1 ist. Diese Vektoren bilden eine Kugel, die man als Bloch-Kugel bezeichnet. Der Rand der Kugel (die Vektoren ~n mit |~n| = 1) beschreibt die reinen Zustände. Im Zentrum der Kugel ist ~n = 0 und wir erhalten ρ = 21 1 als Dichtematrix zum maximal gemischten Zustand. Es gibt noch eine andere Möglichkeit, sich klarzumachen, weshalb der Raum der reinen Zustände für ein quantenmechanisches 2-Zustandssystem der Oberfläche einer Kugel entspricht. Jeder reine Zustand lässt sich durch einen normierten Vektor darstellen: |ψi = α|0i + β|1i , (9.12) mit |α|2 + |β|2 = 1 . (9.13) Schreiben wir α = a1 + ia2 und β = b1 + ib2 (mit ai , bi ∈ R), so wird aus der Normierungsbedingung a21 + a22 + b21 + b22 = 1 , (9.14) also die Gleichung einer 3-Sphäre (S 3 ) in einem 4-dimensionalen Raum. Da sich der Zustand durch Phasentransformationen (die als Menge einen Kreis, also eine 1-Sphäre S 1 bilden) nicht ändert, lässt sich die Menge aller (reinen) Zustände als S 3 /S 1 ' S 2 , also eine 2-Sphäre, beschreiben. 9.3 9.3.1 Physikalische Anwendungen Spin- 21 -Systeme Die experimentellen Ergebnisse von Otto Stern und Walter Gerlach im Jahre 1922 (siehe Abschnit 10.5) waren die ersten Hinweise auf Systeme, die nur zwei diskrete Physikalische Anwendungen 191 Zustände zulassen. Das Konzept des Spins wurde anschließend von Pauli entwickelt. Pauli hat sich allerdings immer gegen die Bezeichnung Spin“ gestreubt, da er die ” Vorstellung eines um eine Achse rotierenden Elektrons ablehnte. Obwohl man sich den Spin nicht als eine Eigenrotation vorstellen sollte, hat er etwas mit der Rotation von Systemen zu tun, denn bei Systemen mit Spin-Freiheitsgraden ist der Gesamtdrehimpuls, der sich aus dem Bahndrehimpuls und dem Spin zusammensetzt, erhalten. Die Klassifikation der Darstellungen der Drehgruppe SO(3) lässt auch halbzahlige Darstellungen zu, wenn man berücksichtigt, dass der Darstellungsraum nicht ein Raum von Vektoren, sondern ein Raum von Strahlen ist. Man sucht in diesem Fall nach linearen Darstellungen der sogenannten Lie-Algebra zu SO(3), die gleichzeitig die Lie-Algebra zu der Gruppe SU(2) ist (vgl. Abschnitt A3), und die Gruppe SU(2) besitzt mehr lineare Darstellungen als die Gruppe SO(3). Pauli schlug vor, ein Elektron mit Spinfreiheitsgrad durch eine zwei-komponentige Wellenfunktion ! ψ1 (x) Ψ(x) = (9.15) ψ2 (x) zu beschreiben. In einem statischen elektromagnetischen Feld (beschrieben durch ein ~ mit B ~ = rotA ~ und ein Skalarfeld Φ mit E ~ = −gradΦ) lautet die (ansonVektorfeld A sten freie) zeitunabhängige Schrödinger-Gleichung: ! ~ 2 e~ (P~ − eA) ~ |Ψi = E|Ψi . + eΦ − (~σ · B) (9.16) 2m 2m Die ersten beiden Terme stammen von der klassischen Energiefunktion eines geladenen Teilchens in einem elektromagnetischen Feld. Der für den Spin relevante Term ist der letzte Term auf der linken Seite. Dieser Term gibt Anlass zum Stern-Gerlach-Effekt ~ sind offensichtlich (siehe auch Abschnitt 10.5). Die Eigenzustände zu der Matrix (~σ · B) die Eigenvektoren der Projektionsoperatoren PB~ , die wir im letzten Abschnitt behane~ ~ delt haben. Die Eigenwerte sind ± 2m |B|. Da es sich hier um den Beitrag zur Energie handelt, erhalten wir die Kraft aus dem Gradienten dieses Terms. Dieser ist jedoch ~ ein konstantes Magnetfeld beschreibt. Daher haben Stern und Gerlach null, wenn B ein inhomogenes Magnetfeld verwendet. Dann ist die Kraft e~ ~ ~ F~ = ± ∇|B| . 2m (9.17) Je nach der Spineinstellung des Teilchens wirkt die Kraft in Richtung des Gradienten ~ bestimmt also, in welche oder in entgegengesetzter Richtung. Die Richtung von B Richtung der Spin des Systems gemessen“ wird (hier hat gemessen“ eine ähnliche ” ” ~ Bedeutung wie bei den Polarisationsexperimenten an Photonen: Die Richtung von B bestimmt, bezüglich welcher Richtung der Spin ausgerichtet wird.) 192 Zwei-Zustands-Systeme Wir können den Spin also bezüglich jeder der drei Raumrichtungen messen, und eine Messung des Spins in eine vorgegebene Richtung liefert immer nur einen von zwei Werten. Angegeben wird dieser Wert in Einheiten von ~/2, sodass der Spin eines Elektrons bezüglich jeder beliebigen Richtung die Werte +~/2 oder −~/2 annehmen kann. Speziell entsprechen die Pauli-Matrizen multipliziert mit ~/2 einer Spin-Messung in die Richtung ~n (vgl. Abschnitt 9.1): S~n = ~ (~n · ~σ ) . 2 (9.18) Da σ3 in der herkömmlichen Darstellung der Pauli-Matrizen bereits diagonal ist, wählt man die Richtung des Magnetfelds meist als die z-Richtung. Insbesondere beschreibt man die Zustände Spin-up“ und Spin-down“ hin” ” sichtlich der z-Richtung durch: |z + i = 1 ! |z − i = 0 0 1 ! . (9.19) Manchmal verwendet man auch für |z + i beispielsweise |z, ↑i oder | ↑z i oder eine entsprechend eingängige Notation. Damit folgen die Eigenvektoren zu σ1 als die Eigenzustände des Spins bezüglich der x-Richtung: 1 |x i = √ 2 + 1 |x− i = √ 2 1 ! 1 = √ (|z + i + |z − i) 2 1 ! 1 1 = √ (|z + i − |z − i) , 2 −1 (9.20) (9.21) und entsprechend die Eigenvektoren zu σ2 als die Eigenzustände des Spins in Bezug auf die y-Richtung: 1 |y + i = √ 2 1 |y − i = √ 2 1 ! 1 = √ (|z + i + i|z − i) 2 i ! 1 1 = √ (|z + i − i|z − i) , 2 −i (9.22) (9.23) Wichtig ist, dass sich bei den Spin- 21 -Zuständen die drei verschiedenen orthogonalen Basen auf die drei räumlichen Richtungen beziehen und jeweils Spin-up bzw. Spin-down bezüglich dieser Richtungen angeben. Physikalische Anwendungen 9.3.2 193 Polarisationszustände von Photonen Mit den Polarisationsfreiheitsgraden von Photonen haben wir uns schon mehrfach beschäftigt. Die Spin-1-Darstellung für Photonen und die Spin- 12 -Darstellung für Elektronen sind zwar insofern ähnlich, als beide (komplex) zweidimensional sind und die auftretenden Matrizen daher häufig die gleichen sind, trotzdem sollte man betonen, dass es sich – im Sinne der Darstellungstheorie der Drehgruppe – um vollkommen verschiedene Darstellungen handelt: 1. Elektronen haben eine Masse. Daher kann man von einem Ruhesystem eines Elektrons sprechen. Der Spin eines Elektrons bezieht sich immer auf dieses Ruhesystem. Photonen sind masselos und haben kein Ruhesystem. 2. Die Spin-1-Darstellung ist gewöhnlich 3-dimensional. Das bedeutet, es gibt drei Zustände, die zueinander orthogonal sind. Gewöhnlich entsprechen diesen Schwingungen in die drei räumlichen Richtungen. Für Photonen (elektromagnetische Wellen) gibt es jedoch keinen longitudinalen Freiheitsgrad: Nach den klassischen ~ und B-Feld ~ Maxwell-Gleichungen stehen das Eimmer senkrecht auf der Ausbreitungsrichtung. Daher fehlt den masselosen Photonen ein Freiheitsgrad gegenüber der gewöhnlichen Spin-1-Vektordarstellung. 3. Bei Photonen entsprechen den drei Basen die Kombinationen horizontal–vertikal, + oder −45◦ und rechts bzw. links zirkular polarisiert. Entsprechend der letzten Bemerkung kann man bei Photonen die Eigenvektoren zu σ3 mit der horizontalen bzw. vertikalen Polarisation eines Photons in Beziehung setzen: ! ! 1 0 |hi = |vi = , (9.24) 0 1 dann ist die Polarisation unter +45◦ bzw. −45◦ durch ! 1 1 1 ◦ = √ (|z + i + |z − i) | + 45 i = √ 2 1 2 ! 1 1 1 | − 45◦ i = √ = √ (|z + i − |z − i) 2 −1 2 (9.25) (9.26) gegeben, und für die zirkular polarisierten Zustände (rechts zirkular bzw. links zirkular) folgt: ! 1 1 1 |Ri = √ = √ (|z + i + i|z − i) (9.27) 2 2 i ! 1 1 1 |Li = √ = √ (|z + i − i|z − i) . (9.28) 2 −i 2 194 Zwei-Zustands-Systeme Der Faktor ±i bedeutet hier eine Phasenverschiebung der entsprechenden Komponente um ±90◦ . (Manchmal definiert man die rechts bzw. links zirkular polarisierten Zustände relativ zu den obigen Konventionen noch zusätzlich mit einem Faktor i, der aber auf den gewählten Strahl keine Auswirkung hat.) 9.3.3 2-Niveau-Systeme Unter bestimmten Bedingungen kann es vorkommen, dass man auch bei komplexeren Systemen mit vielen Zuständen nur an zwei Zuständen interessiert ist, typischerweise handelt es sich dabei um den energetischen Grundzustand (mit der niedrigsten Energie) und den ersten angeregten Zustand. Eine solche vereinfachende Einschränkung des Zustandsraums ist immer dann gerechtfertigt, wenn für die betrachtete Dynamik bzw. Wechselwirkung des Systems (eventuell auch mit einer Umgebung) bevorzugt diese beiden Zustände von Relevanz sind. Hierbei kann es sich beispielsweise um die Schwingungszustände eines Moleküls handeln, von denen bei einer bestimmten Temperatur bestenfalls der erste angeregte Zustand vorliegt (d.h., die höheren Zustände wegen ihrer hohen Energie vernachlässigt werden können), oder es kann sich um bestimmte elektronische Anregungen in Molekülen oder Atomen handeln. Es gibt also zwei Energieeigenzustände zur Energie E0 und E1 , für die gilt: H| • i = E0 | • i und H| • i = E1 | • i . Der Energieoperator ist in dieser Basis diagonal: ! E1 0 1 1 H= = (E0 + E1 )1 + (E0 − E1 )σ3 . 2 2 0 E0 (9.29) (9.30) Für viele praktische Anwendungen interessiert nur der σ3 -Anteil, d.h., man setzt die Summe der beiden Energien (ein konstanter Beitrag zur Gesamtenergie) auf 0: H = σ3 . Die Eigenzustände sind in dieser Darstellung: ! 0 |•i= |•i= 1 (9.31) 1 0 ! . (9.32) (Für > 0 hat somit der Grundzustand | • i die kleinere Energie.) In dieser Interpretation sind die Eigenzustände von σ1 und σ2 von geringerer Bedeutung, allerdings kann man nun σ1 bzw. σ2 als Operatoren auffassen, die den Grundzustand in den angeregten Zustand und den angeregten Zustand in den Grundzustand überführen. Daher dienen diese Operatoren zur Darstellung einer Dynamik, bei der Übergänge zwischen diesen Zustanden beschrieben werden sollen. Physikalische Anwendungen 195 Ebenfalls wichtig sind die Operatoren ! 0 1 1 1 σ + = (σ1 + iσ2 ) = und σ − = (σ1 − iσ2 ) = 2 2 0 0 0 0 1 0 ! , (9.33) die als Auf- bzw. Absteigeoperatoren dienen: σ + beschreibt den Übergang vom Grundzustand in den angeregten Zustand und σ − den Übergang vom angeregten Zustand in den Grundzustand. Modelle dieser Art spielen eine besondere Rolle, wenn man mehrere 2-Zustandssysteme miteinander koppelt. Im Folgenden betrachten wir den einfachen Fall einer Kopplung von zwei 2-Zustandssystemen. Ohne eine Wechselwirkung wäre ein sinnvoller Energieoperator beispielsweise 1 + 2 0 0 0 0 1 − 2 0 0 0 0 −1 + 2 0 . (9.34) 0 0 0 −1 − 2 H0 = 1 (σ3 ⊗ 1) + 2 (1 ⊗ σ3 ) = Die zugehörigen Eigenzustände sind (mit einer hoffentlich suggestiven Notation): |• •i = 0 ! ⊗ 1 |• •i = 0 |• •i = 1 |• •i = 1 ! ⊗ 1 ! ⊗ 0 0 ! ⊗ 0 1 1 0 0 1 1 0 0 ! 0 = 0 1 0 ! 0 = 1 0 0 ! 1 = 0 0 1 ! 0 = . 0 0 (9.35) (9.36) (9.37) (9.38) 196 Zwei-Zustands-Systeme Man kann nun eine Wechselwirkung zwischen diesen beiden Systemen einführen, indem man Übergänge zwischen den Zuständen erlaubt: H = H0 + HI (9.39) HI = J(σ + ⊗ σ − + σ − ⊗ σ + ) . (9.40) mit Der erste Term beschreibt eine Wechselwirkung, bei der ein angeregter Zustand des zweiten Systems in den Grundzustand übergeht und dafür der Zustand des ersten Systems (das sich im Grundzustand befindet) angeregt wird. Der zweite Term beschreibt entsprechend den umgekehrten Prozess. Solche und ähnliche einfache gekoppelte Systeme lassen sich noch exakt lösen, zeigen aber schon eine überraschende Vielfalt an Quantenphänomenen. Koppelt man in dieser Weise mehr als zwei solcher Systeme, beispielsweise eine ganze Kette von 2-Zustandssystemen, gelangt man zu den sogenannten Quantenspinketten. 9.4 Quanteninformation Unter einem Bit versteht man in der klassischen Informationstheorie eine Variable, die nur die beiden Werte 0 und 1 annehmen kann. Der Zustandsraum eines klassischen Bits ist also die Menge {0, 1}. Ein Qubit – oder auch Quanten-Bit – ist eine Quantisierung“ ” eines klassischen Bits. Insofern kann jedes der physikalischen Beispiele aus dem letzten Abschnitt für ein 2-Zustandssystem in der Quantentheorie als Realisation eines Qubits verstanden werden. Die Idee eines Quantencomputers“, also eines Quantensystems, das Folgen von ” Qubits verarbeitet, geht auf Richard Feynman zurück [31]. Seit Mitte der 80er Jahre des 20. Jahrhunderts hat sich die Quanteninformation zu einem eigenständigen Gebiet entwickelt, und Begriffe wie Quantenrechnung“, Quanten-Teleportation“, Quan” ” ” tenkryptographie“ etc. gehören heute zum Alltag in der Informationstechnologie. Ein immer noch gutes Übersichtswerk zur Quanteninformation ist das Buch von Nielsen und Chuang [59]. Bevor wir jedoch kurz auf Quanteninformationstheorie eingehen, soll der klassische Begriff des Bits nochmals angedeutet werden. 9.4.1 Klassische Information Die elementare Einheit der Informationstheorie ist das Bit, ein Element der Menge Z2 = {0, 1}. Die Objekte der Informationstheorie sind Folgen von Bits, also Elemente von ZN 2 . Die Operationen in der Informationstheorie bestehen aus Umformungen Quanteninformation 197 solcher Bit-Ketten. Die einfachste dieser Operation (neben der Identität) ist die Negation: ¬ : Z2 → Z2 mit 0 → 1 und 1 → 0 . Wir können die Negation auch als einfache Permutationsmatrix ausdrücken: ! 0 1 NOT ∼ . 1 0 Außerdem gibt es verschiedene Abbildungen von Z2 × Z2 → Z2 , von denen die wichtigsten in nebenstehender Tabelle zusammengefasst sind. Es lässt sich zeigen, dass sich sämtliche 16 Möglichkeiten für solche binären Bool’schen Funktionen durch ein einziges Gate (die NAND-Funktion oder auch die NOR-Funktion) realisieren lassen. (9.41) x1 0 0 1 1 x2 0 1 0 1 Konjunktion (AND) 0 0 0 1 Disjunktion (OR) 0 1 1 1 Nicht und (NAND) 1 1 1 0 Nicht oder (NOR) 1 0 0 0 Äquivalenz 1 0 0 1 Antivalenz (XOR) 0 1 1 0 Implikation 1 0 1 1 Bezeichnung \ Bit-Paar Besonders interessant ist die XOR-Transformation. Wenn wir den Wert von x1 als einen Kontrollparameter auffassen, und der Wert für x2 durch das Ergebnis von XOR ersetzt wird, so erhalten wir folgende Vorschrift: Wenn x1 = 0 ist wird x2 nicht verändert. Ist x1 = 1 wird x2 negiert. Insbesondere gilt: XOR : (0, 0) → (0, 0) und (1, 0) → (1, 1) . Allgemein ausgedrückt: (x, 0) → (x, x) . Diese Vorschrift kann also eine Kopie des Zustands x herstellen. In der klassischen Informationstheorie lassen sich Zustände beliebig vervielfältigen. Man spricht in diesem Zusammenhang auch von klonen“. ” Auf eine Folge von N Bits können im Prinzip 2N verschiedene Operationen wirken. Man kann allerdings sämtliche Kombinationen auf Operationen an zwei Bits sowie eine Shift-Operation (die zyklisch alle Bits um eine Stelle verschiebt) zurückführen. 9.4.2 Qubits und Bell-Zustände Wir fassen nun die beiden klassischen Werte eines Bits — 0 und 1 — als die Basisvektoren in einem (komplexen) Hilbertraums auf und schreiben dafür |0i und |1i. Einschließlich gemischter Zustände ist der Zustandsraum eines solchen Quantum-Bits durch die 198 Zwei-Zustands-Systeme Bloch-Kugel gegeben. Im Folgenden interessieren wir uns jedoch nur für die reinen Zustände, also die Oberfläche der Bloch-Kugel. (Gemischte Zustände sind in der Praxis natürlich ebenfalls von großer Bedeutung, insbesondere weil durch Dekohärenz bzw. Wechselwirkung mit der Umgebung reine Zustände in gemischte Zustände übergehen; dies zu verhindern bzw. geeignete Fehlerkorrekturen vorzunehmen ist eines der großen gegenwärtigen Forschungsziele auf diesem Gebiet). Neben den beiden klassischen 1-Bit-Operationen – der Identität und der Negation (Gl. 9.41) – kann nun die gesamte SU(2) als Transformationsgruppe auf Zustände wirken. Die meisten dieser Transformationen überführen die Zustände |0i und |1i in Superpositionen. Eine Folge von N Qubits entspricht nun einem Vektor im H2N , und ein allgemeiner Zustand hat die Form: |ψi = X cx1 ,x2 ,... |x1 , x2 , ..., xN i (xi = 0, 1) . xi =0,1 Eine allgemeine Operation auf diesem Zustand ist ein Element der SU (2N ). Auch hier lässt sich jedoch zeigen, dass alle Operationen auf spezielle Operationen an zwei Bits sowie eine Shift-Operation zurückgeführt werden können. Ist N beispielsweise 10, so entspricht einer klassischen Folge aus 10 Bits eine Zahl zwischen 0 und 210 − 1 = 1023. Ein einzelner Quantenzustand ist nun in gewisser Hinsicht eine Superposition aus sämtlichen Zahlen zwischen 0 und 1023, und eine lineare Abbildung eines solchen Quantenzustands entspricht einer Operation, die gleichzeitig sämtliche Zahlen betrifft. Aus diesem Grund spricht man manchmal auch von einem massiven Parallelismus. Betrachten wir speziell zwei Qubits. Eine mögliche Basis des zugehörigen Hilbertraums ist: |0, 0i = |0i ⊗ |0i |0, 1i = |0i ⊗ |1i |1, 0i = |1i ⊗ |0i |1, 1i = |1i ⊗ |1i . Diese Basis hat die Eigenschaft, dass sämtliche Basisvektoren faktorisieren, also separierbar sind. Für viele der folgenden Überlegungen benötigen wir jedoch eine Basis, in der die Zustände maximal verschränkt sind. Die Elemente einer solchen Basis bezeichnet man auch als Bell-Zustände. Wir werden meist die folgende Basis von Bell- Quanteninformation 199 Zuständen verwenden: 1 |Φ1 i = √ (|0i ⊗ |1i − |1i ⊗ |0i) , 2 1 |Φ2 i = √ (|0i ⊗ |1i + |1i ⊗ |0i) , 2 1 |Φ3 i = √ (|0i ⊗ |0i − |1i ⊗ |1i) , 2 1 |Φ4 i = √ (|0i ⊗ |0i + |1i ⊗ |1i), 2 In |Φ1 i erkennen wir den EPR-Zustand wieder. |Φ1 i und |Φ2 i beschreiben jeweils eine totale Antikorrelation in der Verschränkung, während |Φ3 i und |Φ4 i einer absoluten Korrelation entsprechen. Da diese vier Zustände jeweils orthogonal sind gibt es auch selbstadjungierte Operatoren, für die die Bell-Zustände Eigenzustände sind: B= 4 X ai |Φi ihΦi | . i=1 Ein Messwert ai zeigt an, dass sich das System im Zustand |Φi i befindet. Einen solchen Operator zum Ausmessen der Bell-Zustände bezeichnen wir als Bell-Operator und die zugehörige Messvorschrift als Bell-Messung. Die physikalische Realisation solcher BellMessung ist allerdings nicht immer einfach. Da die Bell-Zustände eine Basis bilden, kann man auch die obige separierbare Basis nach Bell-Zuständen entwickeln: 1 |0, 0i = √ (|Φ3 i + |Φ4 i) 2 1 |0, 1i = √ (|Φ1 i + |Φ2 i) 2 1 |1, 0i = √ (|Φ2 i − |Φ1 i) 2 1 |1, 1i = √ (|Φ4 i − |Φ3 i) . 2 (9.42) Interessant ist, dass wir jeden beliebigen dieser Bell-Zustände durch eine unitäre Transformation an einem der beiden Teilsysteme in jeden anderen dieser Bell-Zustände überführen können. Betrachten wir als Beispiel |Φ1 i. Durch die Transformation U1 = 1 ⊗ σ3 (9.43) |Φ2 i = U1 |Φ1 i . (9.44) |Φ3 i = U2 |Φ1 i mit U2 = 1 ⊗ σ1 . (9.45) wird daraus |Φ2 i: Entsprechend gilt: 200 Zwei-Zustands-Systeme Und schließlich erhält man |Φ4 i durch eine Kombination dieser beiden Operationen: |Φ4 i = U3 |Φ1 i mit U3 = 1 ⊗ σ3 σ1 . 9.4.3 (9.46) Das No-Cloning Theorem Das No-Cloning Theorem besagt, dass man von einem beliebigen, unbekannten Quantenzustand keine Kopie erstellen kann. Etwas genauer heißt das: Es gibt keine universelle Zustands-Verdopplungsmaschine“ oder Kloning-Maschine“, die einen beliebigen ” ” Zustand |ϕi in einen Zustand |ϕi ⊗ |ϕi überführt. Auch wenn wir das No-Cloning Theorem im Rahmen von 2-Zustandssystemen behandeln, gilt es in der Quantenmechanik allgemein. Entsprechend ist auch der folgende Beweis nicht auf 2-Zustandssysteme beschränkt. Beweis: Eine Kloning-Maschine entspräche einem linearen Operator V , der folgende Eigenschaft hat: V (|Φi ⊗ |ϕi) = |Φ0 i ⊗ |ϕi ⊗ |ϕi für alle |ϕi ∈ H . (9.47) Für diesen Operator müsste einerseits gelten: V |Φi ⊗ (|ϕ1 i + |ϕ2 i) = V (|Φi ⊗ |ϕ1 i) + V (|Φi ⊗ |ϕ2 i) = |Φ0 i ⊗ |ϕ1 i ⊗ |ϕ1 i + |Φ00 i ⊗ |ϕ2 i ⊗ |ϕ2 i , (9.48) und andererseits: V |Φi ⊗ (|ϕ1 i + |ϕ2 i) = |Φ000 i ⊗ (|ϕ1 i + |ϕ2 i) ⊗ (|ϕ1 i + |ϕ2 i) . (9.49) Offensichtlich können die Gleichungen (9.48) und (9.49) nicht für beliebige |ϕ1 i und |ϕ2 i gleichzeitig erfüllt sein. Das No-Cloning-Theorem besagt natürlich nicht, dass man einen Quantenzustand überhaupt nicht kopieren kann. Ein bekannter Zustand lässt sich beispielsweise beliebig oft präparieren. Auch wenn der Zustand nicht bekannt ist, wenn wir aber wissen, dass es sich um einen reinen Zustand bezüglich einer bestimmten Observablen handelt, können wir beliebig viele Kopien dieses Zustands herstellen. Etwas anders ausgedrückt besagt das No-Cloning-Theorem, dass sich ein unbekannter Zustand durch eine Messung nicht vollständig bestimmen lässt. 9.4.4 Quanten-Teleportation Auch wenn sich ein unbekannter Zustand nicht verdoppeln lässt, so kann man doch von einem unbekannten Zustand eine Kopie an einem anderen Ort erzeugen. Der Preis ist allerdings, dass der Ausgangszustand dadurch zerstört wird. Quanteninformation 201 Statt im Folgenden immer von Person A und Person B zu sprechen, übernehmen wir den allgemeinen Brauch der Informationstheorie und sprechen von zwei hypothetischen Personen Alice und Bob. Kommt noch eine dritte Person ins Spiel (beispielsweise in der Quantenkryptographie der unerwünschte Lauscher - englisch eavesdropper) so heißt diese Person meist Eve. Angenommen, Alice möchte einen unbekannten Photonenzustand (also eine Realisation eines Qubits) |ϕi1 = c0 |0i1 + c1 |1i1 zu Bob teleportieren. Dieses Photon bezeichnen wir als Photon 1. Bob muss zuvor ein verschränktes Photonenpaar (Photonen 2 und 3) erzeugen (beispielsweise im BellZustand |Φ4 i). Eines der beiden Photonen (z.B. Photon 2) schickt er an Alice, wobei der verschränkte Zustand natürlich erhalten bleiben muss. Das Gesamtsystem aus drei Photonen befindet sich nun im Zustand: |Ψi = |ϕi1 ⊗ |Φ4 i2,3 1 = √ c0 |0i1 + c1 |1i1 ⊗ |0i2 ⊗ |0i3 + |1i2 ⊗ |1i3 2 1 = √ c0 |0i1 ⊗ |0i2 ⊗ |0i3 + c0 |0i1 ⊗ |1i2 ⊗ |1i3 2 +c1 |1i1 ⊗ |0i2 ⊗ |0i3 + c1 |1i1 ⊗ |1i2 ⊗ |1i3 . Diesen Zustand können wir bezüglich der Photonen 1 und 2 nach Bell-Zuständen zerlegen (vgl. Gl. 9.42): 1 c0 |Φ3 i1,2 + c0 |Φ4 i1,2 + c1 |Φ2 i1,2 − c1 |Φ1 i1,2 ⊗ |0i3 2 + c0 |Φ1 i1,2 + c0 |Φ2 i1,2 + c1 |Φ4 i1,2 − c1 |Φ3 i1,2 ⊗ |1i3 1 |Φ1 i1,2 ⊗ (−c1 |0i3 + c0 |1i3 ) + |Φ2 i1,2 ⊗ (c1 |0i3 + c0 |1i3 ) = 2 +|Φ3 i1,2 ⊗ (c0 |0i3 − c1 |1i3 ) + |Φ4 i1,2 ⊗ (c0 |0i3 + c1 |1i3 ) . |Ψi = Man beachte, dass es sich immer noch um denselben Zustand |Ψi handelt, der bezüglich der Photonen 2 und 3 verschränkt ist, wohingegen Photon 1 noch separabel ist. Bisher haben wir lediglich eine Basistransformation vorgenommen. Alice macht nun eine Bell-Messung an ihrem Photonenpaar 1 und 2. Dabei zerstört sie den unbekannten Photonenzustand |ϕi1 . Aus dem Messergebnis ai kann sie ablesen, dass nun einer von vier möglichen Bell-Zuständen bei ihr vorliegt. Das bedeutet, dass sich das verbliebene Photon 3 bei Bob, je nach dem Ergebnis ai , das 202 Zwei-Zustands-Systeme Alice erhalten hat, in einem der folgenden Zustände befindet: a1 |ψ1 i3 = −c1 |0i3 + c0 |1i3 a2 |ψ2 i3 = c1 |0i3 + c0 |1i3 a3 |ψ3 i3 = c0 |0i3 − c1 |1i3 a4 |ψ4 i3 = c0 |0i3 + c1 |1i3 . Alice schickt nun eine Nachricht an Bob (durch einen klassischen Informationskanal, beispielsweise in einem gewöhnlichen Telefonat) und teilt ihm das Ergebnis ihrer Messung mit. Da es vier mögliche Ergebnisse gibt, handelt es sich um eine klassische 2-Bit-Nachricht. Je nachdem, welches Messergebnis ai Alice erhalten hat, führt Bob eine von vier unitären Transformationen an seinem Photon aus: a1 (σ3 σ1 )|ψ1 i3 = c0 |0i3 + c1 |1i3 a2 σ1 |ψ2 i3 = c0 |0i3 + c1 |1i3 a3 σ3 |ψ3 i3 = c0 |0i3 + c1 |1i3 a4 1 |ψ1 i3 = c0 |0i3 + c1 |1i3 . In allen vier Fällen erhält Bob für sein Photon den Zustand |ϕi3 , also eine identische Kopie des ursprünglichen Zustands |ϕi1 , der bei diesem Prozess zerstört wurde. Man beachte, dass die Zustände |ψi i3 nicht orthogonal sind. Ansonsten könnte Bob durch eine Messung an seinem Photon feststellen, welches Messergebnis Alice erhalten hat und der klassische Informationskanal wäre überflüssig. 9.4.5 Quantenkryptographie Man kann beweisen, dass ein absolut sicheres Verfahren der klassischen Nachrichtenübermittlung darin besteht, eine Nachricht (die wir uns immer als Folge von Bits vorstellen) mit einer Zufallsfolge aus 0 und 1 zu verschlüsseln. Dazu addiert man zum Klartext einfach den Schlüssel modulo 2 (d.h. als XOR Operation): Zufallsfolge 011010001011101101001 Klartext 111000111000111000111 XOR-Kodierung 100010110011010101110 Die kodierte Nachricht ist nun ebenfalls eine Zufallsfolge, unabhängig davon, wie regulär der zu übermittelnde Klartext ist. Der Empfänger kann nun aus der ihm ebenfalls bekannten Zufallsfolge und der kodierten Nachricht durch eine XOR-Operation die ur- Quanteninformation 203 sprüngliche Nachricht zurückgewinnen: Zufallsfolge 011010001011101101001 kodierte Nachricht 100010110011010101110 XOR-Dekodierung 111000111000111000111 Die Sicherheit dieses Verfahrens hängt entscheidend davon ab, dass nur Alice und Bob die Schlüsselfolge kennen. In der Praxis ist das ein großes Problem, denn ein solcher Schlüssel darf nur einmal verwendet werden (daher spricht man auch von einem One-Time-Pad) und muss mindestens dieselbe Länge wie der Klartext haben. Noch schwieriger wird es, wenn Alice oder Bob den Schlüssel öffentlich austauschen wollen, also über öffentliche Kommunikationskanäle. Dann ist eine Geheimhaltung bei klassischen Kanälen praktisch nicht mehr möglich. Hier kann die Quantenmechanik helfen. Die Idee beruht darauf, dass jede Messung, die ein potenzieller Eavesdropper an einem unbekannten Quantenzustand vornimmt, diesen Zustand in der Regel verändert. Diese Veränderung lässt sich aber feststellen und somit der Eingriff des Lauschers nachweisen. Wichtig ist, dass es die Quantenmechanik Alice und Bob lediglich ermöglicht, sich auf eine Zufallsfolge zu einigen, die als Schlüssel dienen kann, und von der sie überprüfen können, ob sie von einer dritten Person abgerufen wurde. Die eigentliche Nachrichtenübermittlung erfolgt auf klassischem Weg und hat mit der Quantenmechanik nichts mehr zu tun. Konkret könnte die Übermittlung des Schlüssels folgendermaßen erfolgen. Bob erzeugt eine sehr große Anzahl von Photonen in EPR-Zuständen 1 |Φi = √ |+i|−i − |−i|+i . 2 Er schickt Alice jeweils eines der Photonen aus diesen Paaren und bittet Alice, an diesen Photonen willkürlich Polarisationsmessungen entweder in der h/v–Basis (horizontal/vertikal) oder in der +/−–Basis (+45◦ /−45◦ ) vorzunehmen. Alice teilt Bob nun mit, an welchem Photon welche Messung durchgeführt wurde (1. Photon h/vMessung, 2. Photon +/−-Messung, ...), allerdings übermittelt Alice Bob nicht die Ergebnisse ihrer Messungen. Bob nimmt nun an seinen Elektronen die gleichen Messungen vor und erhält beispielsweise die Folge +, +, −, −, +, −, −, +, +, +, −, +, +, −, −, −, ... . Bob weiß nun, dass Alice die Folge −, −, +, +, −, +, +, −, −, −, +, −, −, +, +, +, ... 204 Zwei-Zustands-Systeme erhalten haben muss. Theoretisch könnten sie nun eine dieser beiden Folgen als Zufallsfolge zur Verschlüsselung ihrer Nachricht verwenden. Doch woher wissen sie, dass niemand die Nachricht abgehört hat und nun die Zufallsfolge ebenfalls kennt? Abhören würde bedeuten, dass Eve ( jemand“) die Photonen, die Bob an Alice ” geschickt hat, abgefangen hat und selber Messungen an diesen Photonen vorgenommen hat. Anschließend hat sie die Photonen an Alice weitergeleitet. In rund der Hälfte der Fälle hat Eve vermutlich dieselben Polarisationsbasen verwendet, die auch Alice gemessen hat, und würde somit zumindest teilweise die Zufallsfolge kennen, die Bob nun rekonstruiert und die zur Ver- bzw. Entschlüsselung verwendet wird. Alice und Bob können zwar nicht verhindern, dass Eve die Photonen abfängt und an ihnen Messungen vornimmt, aber sie können feststellen, ob solche Messungen vorgenommen wurden. Jede solche Messung hat nämlich den EPR-Zustand zerstört. Die Photonen, die Alice schließlich erhalten hat, sind also nicht mehr mit Bobs Photonen verschränkt. Daher gibt es auch keinen Grund, weshalb die Daten von Alice und Bob durchweg antikorreliert sein müssen. Dies können Alice und Bob jedoch testen. Dazu schickt Alice an Bob von beispielsweise der Hälfte der Messungen (zufällig ausgewählt) nicht nur die Art der Messung (ob x- oder y-Richtung), sondern auch die Ergebnisse. Diese Ergebnisse müssen mit den Resultaten von Bob vollständig antikorreliert sein. Ist dies nicht der Fall, besteht die Gefahr, dass die Photonen abgefangen und Messungen an ihnen vorgenommen wurden. Findet Bob aber tatsächlich vollständige Antikorrelation, wurden (mit sehr großer Wahrscheinlichkeit) an den Photonen keine Messungen vorgenommen. Und da Alice diese Photonen zufällig ausgesucht hat, besteht auch kein Anlass zu der Vermutung, dass die verbliebenen Photonen ausgemessen wurden. Bob schickt Alice eine entsprechende Nachricht und Alice kann nun die verbliebenen Messdaten (deren Ergebnisse sie Bob nicht explizit übermittelt hat) zur Verschlüsselung der Nachricht verwenden. Von dieser Art der quantenbasierten Schlüsselübermittlung existieren verschiedene Varianten, die man auch als Protokolle bezeichnet. Das bekannteste Protokoll wurde 1984 von Charles H. Bennett und Gilles Brassard vorgeschlagen und trägt die Bezeichnung BB84. Hierbei erzeugt Alice zunächst Photonen mit zufällig gewählter h-, v-, p- oder m-Polarisation und schickt diese an Bob, der die Photonen mit zufällig gewählten h/v- bzw. p/m-Polwürfeln analysiert. Anschließend tauschen Alice und Bob die Information aus, bezüglich welcher der beiden Basen sie die jeweiligen Photonen gemessen haben. In ungefähr der Hälfte der Fälle sind die Basen verschieden; diese Ergebnisse sind daher nutzlos und werden verworfen. Die Ergebnisse bezüglich der gleichen Basen liefern Alice und Bob nun eine gemeinsame Bit-Folge. Zum Test, dass die Folge nicht abgelauscht wurde, können Alice und Bob einen Teil ihrer Bitfolge vergleichen. Kapitel 10 Fundamentale Experimente zur Quantentheorie Die Quantentheorie entstand natürlich nicht aus rein philosophischen Überlegungen, sondern sie ist das Ergebnis eines langen Prozesses, bei dem es im Wesentlichen immer darum ging, bestimmte experimentelle Ergebnisse im Rahmen einer Theorie zu verstehen und zu beschreiben. Einige dieser Experimente eigenen sich besonders gut, die Eigenarten der Quantenmechanik zu verdeutlichen. In den vergangenen dreißig Jahren haben optische Experimente an Bedeutung gewonnen, und sie spielen gerade für den Schulunterricht eine herausragende Rolle, so dass wir sie in einem eigenen Kapitel behandelt haben (Kap. 11). Viele andere Experimente haben neben ihrer praktischen Bedeutung auch einen historischem Wert und sollen zumindest kurz erwähnt werden. Was man wissen sollte Die genannten Experimente bzw. Beobachtungen sollte man kennen. Zum Planck’schen Strahlungsgesetz sollte man wissen, dass eine klassische Betrachtung zur Ultraviolettkatastrophe führt, weil die Anzahl der Moden mit zunehmender Frequenz zunimmt und nach dem klassischen Gleichverteilungssatz jeder Mod im thermischen Gleichgewicht dieselbe Energie beiträgt. Da nach den Vorstellungen der Quantentheorie jeder Mod eine Minimalenergie hat (die einem Photon – Lichtquant – entspricht) gilt ein Freiheitsgrad als eingefroren“, wenn er durch die thermische Energie praktisch nicht angeregt ” werden kann. Daher tragen beim schwarzen Körper Moden zu Energien oberhalb der thermischen Energie nur noch exponentiell underdrückt zum Energieerwartungswert bei. Den photoelektrischen Effekt und die Compton-Streuung sollte man erklären können. Zum photoelektrischen Effekt sollte man wissen, dass die kinetische Energie der durch das Licht herausgeschlagenen Elektronen zwar von der Frequenz des Lichts 205 206 Fundamentale Experimente zur Quantentheorie abhängt (und unterhalb einer Schwellfrequenz, die der Austrittsarbeit entspricht, keine Elektronen herausgeschlagen werden), nicht aber von der Intensität. Umgekehrt hängt die Anzahl der herausgeschlagenen Elektronen mit der Lichtintensität zusammen. Der Compton-Effekt beschreibt die Streuung eines Photons an einem Elektron, wobei ein gestreutes Photon Impuls (und damit auch Energie) abgibt und somit eine längere Wellenlänge hat. Der Zeeman- und Stark-Effekt beschreiben die Aufspaltung von Spektrallinien im magnetischen bzw. elektrischen Feld. Der Zeeman-Effekt beruht auf einer Wechselwirkung magnetischer Momente mit dem Magnetfeld, der Stark-Effekt auf der Wechselwirkung eines elektrischen Dipolmoments mit dem elektrischen Feld. Das Stern-Gerlach-Experiment sollte man beschreiben können. Außerdem sollte die Analogie zum Polarisationsstrahlteiler bei Photonen verstanden sein. Man sollte wissen, weshalb das Magnetfeld inhomogen sein muss. 10.1 Das Planck’sche Strahlungsgesetz Das Interesse Plancks an dem heute nach ihm benannten Gesetz und seinem physikalischen Hintergrund war nicht nur rein wissenschaftlich. Ende des 19. Jahrhunderts stellten die großen Städte auf eine elektrische Beleuchtung um (auch der Vater von Albert Einstein hatte zeitweilig eine Firma, die an der elektrischen Beleuchtung von Straßenzügen und Plätzen in München beteiligt war, musste sich aber später den größeren Firmen Siemens und AEG beugen). Für eine effizientere Umsetzung von elektrischer Energie in Licht war es daher von großem Interesse, die Zusammenhänge zwischen der Wärme von Glühlampen und Glühdrähten und der abgegebenen Strahlung besser zu verstehen. Ende des 19. Jahrhunderts hielt man die Physik, zumindest hinsichtlich ihrer Grundlagen, als im Wesentlichen verstanden. Daher erwartete man, auch die Beziehung zwischen abgestrahlter Lichtenergie und Temperatur im Rahmen der klassischen Elektrodynamik und der Thermodynamik verstehen zu können. Unter einem schwarzen Körper versteht man einen Hohlkörper (z.B., das Innere eines Kastens), dem von außen keine elektromagnetische Strahlung zugeführt wird und der auch keine elektromagnetische Strahlung nach außen abgibt. Sämtliche Strahlung in dem Kasten beruht auf der Wechselwirkung des elektromagnetischen Feldes mit Oszillatoren (schwingenden Ladungsträgern) in den Kastenwänden. Im thermodynamischen Gleichgewicht sollte sich ein Fließgleichgewicht zwischen absorbierter und emittierter Strahlung im Kasteninneren einstellen. Näherungsweise spricht man auch von einem schwarzen Strahler, wenn die abgegebene Strahlung nahezu ausschließlich auf thermischen Effekten beruht und ihre Spektralprofil der Planck’schen Formel entspricht. Die heute idealste Realisierung einer solchen Strahlung ist die Mikrowellenhintergrundstrahlung in unserem Kosmos, die einer Temperatur von rund 2, 7 K Das Planck’sche Strahlungsgesetz 207 entspricht. Bestimmt werden soll die spektrale Verteilungsfunktion u(T, ω) = 1 dE(T, ω) , V dω (10.1) wobei E(ω) die Gesamtenergie der elektromagnetischen Strahlung des Systems ist, die bei einer absouten Temperatur T auf Frequenzen kleiner oder gleich ω entfällt. V ist das Volumen des Systems, man ist also an einer Energiedichte interessiert. Diese Verteilungsfunktion setzt sich aus zwei Anteilen zusammen: - Die Dichte N (ω) der thermodynamischen Freiheitsgrade bei ω, bzw. die Anzahl N (ω)dω der thermodynamischen Freiheitsgrade in einem Frequenzbereich zwischen ω und ω + dω. Diese Dichte hat nichts mit der Temperatur zu tun und ergibt sich aus einfachem Abzählen der möglichen Schwingungsmoden zu ω2 N (ω) = 3 2. V cπ (10.2) Bei einem (der Einfachheit halber) kubischen Kasten mit Kantenlänge L und Volumen L3 sind die möglichen Wellenlängen in jede der drei Richtungen durch λ = 2L/n gegeben: In jede Richtung muss ein Vielfaches einer halben Wellenlänge passen. Für die möglichen Zustände π im ~k-Raum ergibt sich damit ~k = L (n1 , n2 , n3 ) mit beliebigen natürlichen Zahlen ni . Jedem Zustand im ~k-Raum kann man daher ein Volumen |∆k|3 = π 3 /V zuschreiben. Eine Kugelschale mit Radius k = |~k| und der Dicke dk hat für dk k ein Volumen von 4πk 2 dk und enthält somit 4 4πk 2 dk = V 2 k 2 dk (10.3) 3 |∆k| π Zustände in dieser Kugelschale. Da aber nur der Teil der Kugelschale von Interesse ist, der sich im positiven Quadranten befindet (die ni sind nie negativ), müssen wir noch durch 8 dividieren, andererseits kann jeder Zustand wegen der beiden Polarisationsmöglichkeiten zweimal auftreten, sodass die Anzahl der Zustände im Bereich zwischen |~k| und |~k| + dk durch πV2 k 2 dk gegeben ist. Mit ω = c|~k| bzw. dω = c dk ergeben sich schließlich N (ω)dω = V ω2 dω π 2 c3 (10.4) Zustände in diesem ω-Bereich. - Die mittlere Energie, die sich bei einer Temperatur T auf einen gegebenen Freiheitsgrad mit der Frequenz ω verteilt. Nach dem klassischen Gleichverteilungssatz – die Entropie eines Systems ist am größten, wenn sich die Energie auf alle Freiheitsgrade gleichermaßen verteilt – trägt jeder Freiheitsgrad dieselbe Energie. Da es sich um schwingende Oszillatoren handelt, sollte diese Energie pro Oszillator durch kB T gegeben sein. (Ein 208 Fundamentale Experimente zur Quantentheorie eindimensionaler Oszillator hat zwei thermodynamische Freiheitsgrade: einen bezüglich seiner kinetischen und einen bezüglich seiner potenziellen Energie. Nach der klassischen Thermodynamik nimmt jeder thermodynamische Freiheitsgrad bei einer Temperatur T die Energie 12 kB T auf.) Damit ergibt sich nach den klassischen Überlegungen ein Strahlungsgesetz der Form: uklass (T, ω) = ω2 kB T . c3 π 2 (10.5) Offenbar nimmt diese Verteilung als Funktion von ω rapide zu, sodass der Beitrag von unendlich hohen Frequenzen“ selbst unendlich groß ist. Dies bezeichnete man als die ” Ultraviolettkatastrophe“. ” Für eine quantenmechanische Herleitung der gesuchten Strahlungsdichte ändert sich an der Abzählung der möglichen Moden nichts. Jeder Mod ω kann mit n Photonen mit einer Gesamtenergie von n~ω besetzt sein, und die Wahrscheinlichkeit einer solchen Besetzung ist proportional zum Boltzmann-Faktor exp(−n~ω/kB T ). Als Mittelwert für die Energie zu einem solchen Mod erhalten wir somit: ∞ n~ω 1X (n~ω) exp − h(ω, T )i = Z n=0 kB T ∞ X n~ω mit Z = exp − . kB T n=0 (10.6) Bei den auftretenden Summen handelt es sich um geometrische Reihen (bzw. Ableitungen solcher Reihen), die wir leicht ausführen können: ∞ X 1 x = 1−x n=0 n ∞ X x nx = , (1 − x)2 n=0 =⇒ h(ω, T )i = n P nxn x 1 Pn n = = −1 . (10.7) 1−x x −1 nx Damit folgt: ~ω exp ~ω kB T . (10.8) −1 Als Ergebnis unserer Überlegungen erhalten wir die Planck’sche Formel: u(ω, T ) = 1 ~ω 3 . c3 π 2 exp ~ω − 1 (10.9) kB T Für kleine Frequenzen (~ω ≤ kB T ) ergibt sich das klassische Ergebnis (Gl. 10.5). Dies bezeichnet man auch als Rayleigh-Jeans’sches Strahlungsgesetz. Für sehr hohe Frequenzen (~ω kB T ) folgt das Wien’sche Strahlungsgesetz ~ω 3 ~ω u(ω, T ) = 3 2 exp − , cπ kB T (10.10) Der photoelektrische Effekt 209 das die Ultraviolettkatastrophe vermeidet.1 Der klassische Gleichverteilungssatz muss also in der Quantenmechanik modifiziert werden: Ist die notwendige Energie zur Anregung des ersten angeregten Zustands aus dem Grundzustand größer als die thermische Energie, gilt der zugehörige Freiheitsgrad als eingefroren“ und trägt nicht zur Abzählung der thermischen Frei” heitsgrade bei. Mit anderen Worten: Wenn die thermische Energie kB T zur Erzeugung eines Photons mit der Energie E = ~ω nicht ausreicht, sind diese Zustände (wegen des Boltzmann-Faktors) exponentiell unterdrückt. 10.2 Der photoelektrische Effekt Der photoelektrische Effekt beschreibt die Herauslösung eines Elektrons aus seinem Bindungszustand durch ein auftreffendes Photon. Streng genommen unterscheidet man verschiedene Formen von photoelektrischen Effekten, je nachdem ob das Elektron aus einem Atom herausgehauen und dieses Atom dadurch ionisiert wird, oder ob es aus dem Valenzband in ein Leitungsband angehoben wird (wie in der Photovoltaik), oder ob es bei einem Metall aus dem Leitungsband und damit aus dem Metall herausgehauen wird. Wir beschränken uns hier auf den letzteren Effekt (obwohl die allgemeine Betrachtung davon im Wesentlichen unabhängig ist). Beobachtet wurde der Effekt zum ersten Mal 1839 von Alexandre Edmond Becquerel; 1899 konnte Philipp Lenard die Abhängigkeiten des Effekts von der Lichtfrequenz und der Intensität messen. Erklärt wurde der photoelektrische Effekt 1905 durch Albert Einstein, der dafür 1922 den Nobelpreis erhielt. Beobachtet wurde, dass im Wesentlichen überhaupt keine Elektronen aus dem Metall herausgehauen werden, wenn die Frequenz des Lichts unterhalb einer bestimmten kritischen Frequenzschwelle ν0 liegt, unabhängig von der Intensität des Lichtes. Weiterhin hängt zwar die Anzahl der herausgehauenen Elektronen von der Intensität ab, nicht aber deren maximale kinetische Energie. Diese wiederum ist (oberhalb der genannten Frequenzschwelle) eine lineare Funktion der Frequenz (vgl. Abb. 10.1). Die Deutung gelang Einstein unter der Annahme diskreter Lichtquanten“, de” ren Energie proportional zur Frequenz des Lichts ist. Später konnte experimentell gezeigt werden, dass der Proportionalitätsfaktor zwischen Energie und Frequenz gleich der Planck’schen Konstanten ist. Ein Photon kann nur ein einzelnes Elektron aus seinem Verbund heraushauen. Für die kinetische Energie eines solchen Elektrons gilt Ekin = hν − W , 1 (10.11) Oft findet man die Strahlungsformel als Funktion von ν oder von λ. Bei der Umrechnung muss man darauf achten, dass es sich bei u(ω, T ) um eine Dichte handelt, d.h., auch das Integrationsmaß dω muss transformiert werden. 210 Fundamentale Experimente zur Quantentheorie Abbildung 10.1: Qualitatives Verhalten der maximalen kinetischen Energie der herausgehauenen Elektronen (gemessen durch den Nachweis eines Stroms bei einem elektrischen Gegenfeld) als Funktion der Lichtfrequenz. maximale kinetische Energie 6 • • •• • • • • • Frequenz ν0 wobei W die Austrittsarbeit des Elektrons ist. Ist W > hν werden keine Elektronen herausgelöst. Die Intensität bestimmt lediglich die Anzahl der auf das Metall auftreffenden Photonen und damit die Anzahl der herausgehauenen Elektronen, nicht aber deren Energie. 10.3 Die Compton-Streuung Die 1922 von Sir Arthur Compton beobachtete Streuung von hochenergetischen Photonen (Röntgenstrahlung) an Elektronen zeigte mehrere Effekte (Abb. 10.2): - Auch anfänglich ruhende Elektronen erhalten durch die Streuung einen Impuls wie bei einem Stoß. - Das gestreute Licht zeigt eine ausgeprägte Winkelabhängigkeit. - Die Wellenlänge des gestreuten Lichts ist kleiner als die der einfallenden Strahlung und hängt mit dem Streuwinkel zusammen (je größer der Streuwinkel umso größer die Änderung der Wellenlänge). Abbildung 10.2: Trifft ein hochenergetisches Photon auf ein Elektron kommt es zu einem Stoßprozess ähnlich der gewöhnlichen Teilchenstreuung. Das gestreute Photon besitzt eine geringere Energie und daher eine größere Wellenlänge. e− * • ϕ Diese Effekte waren im Rahmen einer klassischen Beschreibung der Streuung von Licht an einem geladenen Teilchen schwer verständlich: Nach der klassischen Vorstellung sollte das ruhende geladene Teilchen durch die einfallende Strahlung zu Schwingungen angeregt werden. Diese Schwingungen wiederum erzeugen eine Dipolstrahlung mit derselben Frequenz wie die einfallende Strahlung. Ein solches Verhalten wird tatsächlich bei großen Wellenlängen beobachtet. Die Compton-Streuung findet ihre natürliche Erklärung ebenfalls in einem Teilchenbild von elektromagnetischer Strahlung. Ein einzelnes Photon mit der Energie Zeeman- und Stark-Effekt 211 E = hν und zugehörigem Impuls p = E/c trifft auf das Elektron und übertägt bei diesem Stoß einen Teil seiner Energie und seines Impulses auf das Elektron. Dadurch wird ein anfänglich ruhendes Elektron in eine bestimmte Richtung gestreut, und das Photon entsprechend dem Impulsübertrag in eine andere Richtung, sodass Gesamtimpuls und -energie erhalten bleiben. Da die Energie des Photons durch den Stoß abnimmt, hat das gestreute Photon eine kleinere Frequenz bzw. eine größere Wellenlänge. Eine ausführliche Rechnung ergibt: ∆λ = h (1 − cos ϕ) , mc (10.12) wobei ∆λ die Änderung der Wellenlänge bezeichnet und ϕ den Streuwinkel. h ist das Planck’sche Wirkungsquantum und m die Masse des Teilchens. Die Größe λC = h mc (10.13) bezeichnet man als Compton-Wellenlänge (manchmal ersetzt man h auch durch die reduzierte Planck’sche Konstante ~). Sie definiert eine Längenskala für ein Teilchen der Masse m. Ist die Wellenlänge der einfallenden Strahlung wesentlich größer als die Compton-Wellenlänge, beobachtet man das klassische Streuverhalten von Licht an geladenen Teilchen. 10.4 Zeeman- und Stark-Effekt Ganz allgemein versteht man unter dem Zeeman-Effekt die Aufspaltung einer Spektrallinie, wenn sich die emittierende Materie in einem Magnetfeld befindet. Entsprechend bezeichnet der Stark-Effekt die Linienaufspaltung in einem elektrischen Feld. Der Zeeman-Effekt unterscheidet sich insofern vom Stern-Gerlach-Experiment (siehe nächsten Abschnitt), als beim Zeeman-Effekt direkt die Aufspaltung der Energieniveaus beobachtet wird, wohingegen beim Stern-Gerlach-Experiment die Kraft auf ein Teilchen mit einem Spin in einem Magnetfeld untersucht wird. Der Zeeman-Effekt wird allgemein in homogenen Magnetfeldern beobachtet, wohingegen für das SternGerlach-Experiment ein inhomogenes Magnetfeld notwendig ist. Ganz allgemein hat ein Teilchen mit einem magnetischen Moment µ ~ in einem ~ Magnetfeld B eine potenzielle Energie ~. Hµ = −~µ · B (10.14) In den meisten Fällen beruht das magnetische Moment auf einem Drehimpuls eines ~ eines geladenen geladenen Teilchens. Allgemein besteht zwischen dem Drehimpuls L Teilchens und dem dadurch erzeugten magnetischen Moment die Beziehung ~, µ ~ = γL (10.15) 212 Fundamentale Experimente zur Quantentheorie wobei γ das gyromagnetische Verhältnis angibt. Dieses spaltet man in der Quantenmechanik meist in das Bohr’sche Magneton µB = e~ 2m (10.16) (m ist die Masse des Teilchens und e seine Ladung) sowie den so genannten g-Faktor auf, wobei der Drehimpuls in Einheiten von ~ angegeben wird: ~ = gµB γL ~ L . ~ (10.17) Für einen einfachen Bahndrehimpuls ist g = 1, für den Spin eines Elektrons ergibt sich aus der Dirac-Gleichung ein g-Faktor von ge = 2. Quantenfeldtheoretische Korrekturen führen zu einem etwas höheren g-Wert. Das magnetische Moment zu einem elektrischen Strom ~j (der Teil eines geschlossenen Stromkreises sein soll, damit die Kontinuitätsgleichung erfüllt ist) ist µ ~= 1 (~r × ~j) . 2 (10.18) Der Strom eines einzelnen Teilchens mit der Geschwindigkeit ~v und der Ladung e ist: ~j = e~v , sodass wir e e ~ µ ~= (~r × m~v ) = L (10.19) 2m 2m erhalten. Je nachdem, um welche Art von magnetischem Moment es sich handelt, unterscheidet man verschiedene Arten von Zeeman-Effekten: • Beim normalen Zeeman-Effekt beruht das magnetische Moment auf dem Bahndrehimpuls eines Elektrons in einem Atomverbund. Je nach dem Wert des Drehimpulses wird eine Aufspaltung in 3 Linien (Drehimpuls zur Quantenzahl l = 1), 5 Linien (l = 2) oder auch gar keine Aufspaltung (l = 0) beobachtet. • Beim anomalen Zeeman-Effekt berücksichtigt man eine Spin-Bahn-Kopplung und einen daraus resultierenden Gesamtdrehimpuls. Für ein einzelnes Elektron (Spin 21 ) in einem l = 1-Orbital führt das zu den magnetischen Quantenzahlen m = + 23 , + 12 , − 12 , − 32 des Gesamtdrehimpulses und somit zu einer vierfachen Aufspaltung. Die potenzielle Energie zu dem Magnetfeld muss in diesem Fall schwach im Vergleich zur potenziellen Energie der Spin-Bahn-Kopplung sein. (Bei sehr starken Magnetfeldern kommt es zum so genannten Paschen-Back-Effekt, bei dem das Magnetfeld die Spin-Bahn-Kopplung aufbricht“.) ” Man unterscheidet noch weitere Formen des Zeeman-Effekts (quadratischen ZeemanEffekt oder Zeeman-Effekt an Atomkernen etc.), auf die hier aber nicht eingegangen werden soll. Das Stern-Gerlach Experiment 213 Der Stark-Effekt beruht auf einem elektrischen Dipolmoment p~ eines Atoms, ~ einem Energiebeitrag das in einem elektrischen Feld E ~ H = p~ · E (10.20) liefert. Besitzt das Atom ein permanentes Dipolmoment, beschreibt obiger Term den linearen Stark-Effekt. Bei Atomen ohne permanentem Dipolmoment induziert das an~ was dann zu einem quadratischen gelegte elektrische Feld ein Dipolmoment p~ ∝ E Stark-Effekt führt. 10.5 Das Stern-Gerlach Experiment Im Jahre 1922 wollten Otto Stern und Walter Gerlach das Bohr-Sommerfeld’sche Atommodell testen. Nach diesem Modell besitzt ein Elektron einen Bahndrehimpuls, und nach der klassischen Theorie des Elektromagnetismus sollte zu einem Bahndrehimpuls eines geladenen Teilchens auch ein magnetisches Moment gehören. Dieses magnetische Moment wiederum sollte sich in einem Magnetfeld bemerkbar machen, indem die Atome je nach der Ausrichtung des magnetischen Moments in eine bestimmte Richtung abgelenkt werden (siehe auch den vorigen Abschnitt zum Zeeman-Effekt). Statt der Aufspaltung der Energieniveaus wollten Stern und Gerlach aber die Kraft messen, die ein Magnetfeld auf ein Atom mit einem magnetischen Moment ausübt. Diese ergibt sich aus dem Gradienten der potenziellen Energie und ist daher nur für inhomogene Magnetfelder von null verschieden. Otto Stern und Walter Gerlach verwendeten einen Strahl aus Silberatomen, die mit einer mehr oder weniger wohldefinierten Geschwindigkeit durch ein inhomogenes Magnetfeld gelenkt wurden. Hinter dem Magnetfeld trafen die Atome auf eine Nachweisplatte, auf der nach einer Weile eine Verteilung der Silberatome sichtbar wurde. Sehr zur Überraschung der beiden Experimentatoren, die wie bei dem damals schon bekannten Zeeman-Effekt eine Aufspaltung in drei Teilstrahlen vermutet hatten, zeigten sich auf der Platte jedoch nur zwei Bereiche. Eine solche Aufspaltung lies sich nach der herkömmlichen Theorie des Drehimpulses nicht erklären, da Bahndrehimpulse immer eine ganzzahlige Quantenzahl l haben und die zugehörigen Darstellungen (die möglichen Werte für m) ungerade Dimension (2l + 1) haben (siehe Abschnitt 6.6). Wolfgang Pauli postulierte 1925 für das Elektron eine zusätzliche, 2-wertige Quantenzahl, die später die Bezeichnung Spin“ erhielt. (Pauli selbst hat diesen Namen ” vermieden, da er die Vorstellung eines um eine Achse rotierenden Elektrons ablehnte.) Eine exakte Behandlung des Elektronenspins und seiner Deutung wird erst im Rahmen der Dirac-Gleichung möglich. Diese (relativistische) Verallgemeinerung der Schrödinger-Gleichung beschreibt geladene Spin- 12 -Teilchen. In einer nicht-relativis- 214 Fundamentale Experimente zur Quantentheorie Abbildung 10.3: Beim Stern-Gerlach Experiment tritt ein Atomstrahl (Silber) durch ein inhomogenes Magnetfeld. Je nach der Orientierung des Spins relativ zu diesem Magnetfeld wird der Strahl nach oben oder unten abgelenkt. Schirm Quelle Strahl A |+i A C`` ``` C ``` |−i Magnet tischen Näherung beschreibt man den Spin jedoch häufig durch einen 2-komponentigen Spinor, d.h., durch ein Paar von Wellenfunktionen. Wie wir schon in Kap. 9.3.1 gesehen haben, ist der für die Kopplung zwischen Spin und Magnetfeld verantwortliche Wechselwirkungs-Hamiltonoperator in der nichtrelativistischen Näherung e~ ~ Hint = − S ·B (10.21) m mit den Spin-Matrizen ~ (10.22) Si = σi 2 (hierbei wurde der g-Faktor des Elektrons gleich 2 gesetzt). Die Kraft ergibt sich aus dem Gradienten zu diesem Potenzial. Wählen wir die Koordinaten so, dass das Magnetfeld nur eine z-Komponente hat, dann folgt: e~ ∂Bz ~ez F~ = sz m ∂z (10.23) wobei sz = ± 12 ist. Das inhomogene Magnetfeld wirkt somit auf ein Atom mit einem freien Spin ähnlich wie ein polarisationsabhängiger Strahlteiler (Polwürfel) auf ein Photon: Je nach der Spin- bzw. Polarisationsrichtung wird ein Teilchen in die eine oder andere Richtung abgelenkt. Umgekehrt kann man mit einem geeignet adjustierten inhomogenen Magnetfeld auch zwei Strahlen mit entgegengesetzten Spin-Orientierungen wieder zusammenführen. Auch diesen Effekt hatten wir bei Polwürfeln beobachtet. Damit lassen sich mit diesen Anordnungen ganz ähnliche Experimente wie in der Optik mit Polarisationen durchführen, insbesondere gibt es auch Mach-Zehnder“-ähnliche Ap” paraturen oder die Möglichkeit des Nachweises von Superpositionen wie in Abb. 2.5. Kapitel 11 Optische Experimente zur Quantentheorie Wegen der zunehmenden Bedeutung optischer Experimente sowohl in der Grundlagenforschung der Physik als auch in ihren Anwendungen, und insbesondere auch wegen ihrer Möglichkeiten für den Schulunterricht widmen wir ihnen ein spezielles Kapitel. Optische Experimente in Bezug auf den Polarisationsfreiheitsgrad von Photonen bzw. Licht haben den Vorteil, dass die Mathematik oft auf die Eigenschaften von Vektoren und Matrizen in zweidimensionalen Räumen beschränkt und somit auch der Schulmathematik zugänglich ist, und dass man optische Versuche leicht durchführen kann. Schwierigkeiten in der Praxis bereiten lediglich noch Experimente, die mit einzelnen Photonen durchgeführt werden müssen, da Einphotonenquellen und -detektoren immer noch sehr teuer sind. Bevor wir auf verschiedene optischen Experimente eingehen, werden einige grundlegende Elemente der experimentellen Anordnungen erläutert. Was man wissen sollte Die prinzipielle Funktionsweise einfacher optischer Bauelemente (Laser, Polarisationsfilter, Strahlteiler, etc.) sollte bekannt sein. Ebenso sollte man das Mach-ZehnderInterferrometer kennen und seine Funktionsweise beschreiben können. Einfache Experimente mit dem Mach-Zehnder-Interferrometer, z.B. das Knallerexperiment“ (Mes” sung ohne Wechselwirkung) sollte man beschreiben können. Ebenfalls bekannt sein sollte der Begriff des delayed-choice“–Experiments (Experimente mit verzögerter Wahl) ” und des Quantenradierers“ (quantum eraser). ” 215 216 11.1 Optische Experimente zur Quantentheorie Experimentelle Bausteine Bevor wir mit der Beschreibung einiger ausgewählter optischer Experimente zur Quantentheorie beginnen, sollen kurz einige der Elemente optischer Experimente angesprochen werden. Dabei geht es weniger darum, die neueste Technologie“ zu beschreiben, ” als die einfachsten experimentellen Möglichkeiten anzugeben, mit denen sich das angestrebte Ziel erreichen lässt. Wichtig ist der Nachweis, dass es Bauteile gibt, welche die geforderte Aufgabe tatsächlich erfüllen können. Der Polarisationsfilter, Polwürfel (polarisationsabhängige Strahlteiler) sowie die Möglichkeiten des Einzelphotonennachweises wurden schon in Abschnitt 2.1.2 behandelt. 11.1.1 Laser Zur Theorie der Laser gibt es eine sehr umfangreiche Literatur, sodass an dieser Stelle nicht auf die Einzelheiten eingegangen wird. Ein Laser besteht typischerweise aus einem Resonator (oft zwei Spiegel, von denen einer schwach durchlässig (im Prozentbereich) ist, und einem Medium. Das Medium besitzt (mindestens) drei für die Funktionsweise relevante Energieniveaus: einen Grundzustand A, einen angeregten Zustand B, der sehr kurzlebig ist und im Allgemeinen in einen ebenfalls angeregten Zustand C übergeht. Dieser Zustand C ist metastabil. Durch optisches Pumpen wird zunächst der Zustand B und damit sehr rasch der Zustand C bevölkert, sodass der Zustand C häufiger besetzt ist als der Grundzustand A. Eine auf das Medium einwirkende elektromagnetische Welle mit exakt der Wellenlänge zu dem Übergang C→A kann eine induzierte Emission auslösen. Auf diese Weise entsteht in dem Resonator eine stehende Welle zu der Wellenlänge dieses Übergangs, von der ein kleiner Anteil durch den leicht durchlässigen Spiegel nach außen dringt. Die wesentlichen Merkmale von Laserlicht sind, dass es sehr monochromatisch ist (also eine sehr scharfe und wohldefinierte Wellenlänge hat) und außerdem sehr kohärent, d.h., das austretende Licht besteht aus Wellenzügen, die alle in Phase sind. Für typische Quantenexerpimente möchte man oft sehr schwaches Laserlicht einsetzen, im Extremfall Licht, das aus Einzelphotonen besteht. 11.1.2 Doppelspalt und Gitter Beugungsexperimente werden meist an Doppelspalten oder Gittern ausgeführt. Die Spaltbreite sollte (im Idealfall) klein gegen den Spaltabstand sein, und der Spaltabstand sollte nicht wesentlich größer als einige Wellenlängen sein, wenn man ein deutliches Beugungsbild und Interferenzmuster beobachten möchte. (Je nach angestrebter Ablenkung können zwischen der Wellenlänge der elektromagnetischen Strahlung und dem Abstand der Spalte aber auch mehrere Größenordnungen liegen.) Die Beugungs- Experimentelle Bausteine 217 bedingung für konstruktive und destruktive Interferenz wurde schon in Abschnitt 3.1 besprochen (Gl. 3.4 und 3.5). Da Licht unterschiedlicher Wellenlänge auch unterschiedlich stark gebeugt wird, kann man Gitter (ähnlich wie Prismen) auch verwenden, um näherungsweise monochromatische elektromagnetische Wellen zu erhalten. 11.1.3 Strahlteiler Strahlteiler sind Gläser mit einer dünnen Metallschicht, die einen Teil der einfallenden elektromagnetischen Strahlung durchlassen und einen anderen Teil reflektieren. Stellt man solche Strahlteiler unter einem Winkel von 45◦ zur Strahlrichtung auf, wird ein Teil des Strahls gerade durchgelassen und ein anderer Teil unter einem rechten Winkel abgelenkt. Strahlteiler spielen unter anderem eine wichtige Rolle bei Mach-Zehnder-Interferrometern. Umgekehrt kann man mit einem Strahlteiler Lichtstrahlen auch wieder zusammenführen: Treffen zwei Lichtstrahlen jeweils unter einem Winkel von 45◦ von beiden Seiten auf den Strahlteiler, wird von jedem der beiden Strahlen ein Teil des Lichts durchgelassen und ein Teil reflektiert. Die beiden austretenden Strahlen sind somit im Allgemeinen eine Superposition der beiden einfallenden Strahlen. Zwischen dem reflektierten Lichtstrahl und dem durchgelassenen Lichtstrahl besteht eine Phasenverschiebung. Im Idealfall ist die Phasenverschiebung (relativ zum einfallenden Strahl) beim durchgelassenen Strahl 0 und beim (unter 90◦ ) reflektierten Strahl π/2 oder 90◦ . Das bedeutet, der Zustand des reflektierten Strahls erhält einen √ zusätzlichen Faktor i = −1 relativ zum durchgelassenen Strahl. 11.1.4 λ/4- und λ/2-Plättchen λ/4- und λ/2-Plättchen verzögern die Ausbreitung von elektromagnetischen Wellen um eine Viertel bzw. halbe Wellenlänge in einer Polarisationsrichtung im Vergleich zur dazu orthogonalen Polarisationsrichtung. Auf diese Weise kann ein λ/4-Plättchen aus linear polasiertem Licht zirkular polarisiertes Licht machen. Ein λ/2-Plättchen kann linear polarisiertes Licht um einen vorgegebenen Winkel drehen. Die Kristallgitter dieser Plättchen sind anisotrop, d.h., ihr optischer Brechungsindex hängt von der Polarisationsrichtung der Strahlung ab. Auf diese Weise können sich elektromagnetische Wellen, je nach ihrer Polarisationsrichtung zur Kristallachse, schneller oder langsamer durch den Kristall bewegen und erhalten dadurch bezüglich dieser Achsen eine unterschiedliche Phase. Ob ein λ/4-Plättchen tatsächlich aus planar polarisiertem Licht zirkular polarisiertes Licht macht, hängt von den Polarisationsrichtungen des Plättchen relativ zu der Polarisationsrichtung des einfallenden Photons ab. Sei beispielsweise die 218 Optische Experimente zur Quantentheorie schnelle“ Achse des λ/4-Plättchens die +45◦ -Achse und die langsame“ Achse die ” ◦ ” −45 -Achse. Ein solches Plättchen nennen wir λ+ /4-Plättchen. (Entsprechend hat ein λ− /4-Plättchen die −45◦ -Achse als schnelle Achse und die +45◦ -Achse als langsame Achse). Trifft Licht auf ein λ+ /4-Plättchen, passiert je nach dem Polarisationszustand des Photons Folgendes: |+i −→ |+i (11.1) |−i −→ −i|−i 1 1 |hi = √ (|+i + |−i) −→ √ (|xi − i|yi = |Ri 2 2 1 1 |vi = √ (|+i − |−i) −→ √ (|xi + i|yi = |Li 2 2 (11.2) (11.3) (11.4) Ist das einfallende Photon also bezüglich der Eigenachsen des λ/4-Plättchens polarisiert, ändert sich an dem Polarisationszustand nichts, allerdings wird er eventuell um eine Viertel Wellenlänge verzögert. Ist die Polarisation des einfallenden Photons komplementär zu den Eigenachsen des λ/4-Plättchens (also um ±45◦ gedreht), wird aus dem planar polarisiertem einfallenden Photon ein zirkular polarisiertes Photon. 11.1.5 Down Conversion Kristalle Bei der parametric down conversion“ (im Deutschen spricht man auch von para” metrischer Fluoreszenz) handelt es sich um einen nicht-linearen optischen Effekt in Kristallen: Ein einzelnes Photon der Wellenlänge λ und zugehöriger Energie E = hc/λ tritt in den Kristall. Es wird von dem Kristall absorbiert, wodurch Schwingungen im Kristallgitter angeregt werden. Durch nicht-lineare Effekte können diese Schwingungen ihre Energie wieder durch Emission von Photonen abgeben, wobei diesmal allerdings zwei Photonen der halben Energie (und damit doppelten Wellenlänge) emittiert werden. Diese beiden Photonen sind oft verschränkt, d.h., der Polarisationszustand des einen Photons ist anti-korreliert zum Polarisationszustand des anderen Photons wobei typischerweise der Gesamtdrehimpuls der beiden Photonen verschwindet. Ein bekannter und in optischen Experimenten oft verwendeter Kristall mit diesen Eigenschaften ist Beta-Bariumborat (β-BaB2 O4 , häufig schreibt man kurz BBO). Die Einsatzmöglichkeiten sind vielfältig: In manchen Fällen dient der Nachweis eines der beiden emittierten Photonen als Indikator, dass ein zweites Photon auf dem ” Weg ist“. Durch diesen Trigger-Effekt kann man den Zeitpunkt, zu dem ein Photon in eine experimentelle Anordnung eintritt, sehr genau bestimmen. Eine zweite Anwendung besteht in der Erzeugung verschränkter Photonenpaare, an denen sich typische EPR-Studien, Bell’sche Ungleichungen oder auch quantum eraser“–Experimente ” durchführen lassen. 11.2. DAS MACH-ZEHNDER-INTERFEROMETER 11.2 219 Das Mach-Zehnder-Interferometer Das Mach-Zehnder-Interferometer wird meist eingesetzt, wenn man Doppelspaltexpe” rimente“ mit elektromagnetischen Wellen (Licht) mit Spaltbreiten“ von makroskopi” scher Größenordnung (mehrere Meter bis Kilometer) durchführen möchte. Die beiden Teilstrahlen lassen sich im Prinzip beliebig weit voneinander trennen. Beim Mach-Zehnder-Interferometer trifft ein einfallendes Photon |γi zunächst auf einen Strahlteiler. Ein Teil des Strahls wird durchgelassen (wir bezeichnen ihn mit |ti “ für transmittiert“) und einer wird unter einem Winkel von 90◦ reflektiert ” ” (Lichtstrahl |ri “). Die beiden Teilstrahlen trennen sich also unter einem Winkel von ” 90◦ und werden anschließend von zwei Spiegeln ebenfalls unter einem Winkel von 90◦ reflektiert. Schließlich treffen sie bei einem zweiten Strahlteiler wieder zusammen. Hinter diesem zweiten Strahlteiler kann das Licht im Prinzip an zwei verschiedenen Stellen beobachtet werden (D und C). D dunkel |Di Spiegel 6 - C hell Strahlteiler |Ci |ri 6 |γi 6 |ti - Spiegel Strahlteiler Abbildung 11.1: Mach-Zehnder Interferometer. Bei jeder Reflektion eines Photonzustands an einem der Spiegel oder Strahlteiler um 90◦ tritt eine Phasenverschiebung von π/2 auf (s.o., Strahlteiler), wohingegen der durchgelassene Zustand diese Phasenverschiebung nicht erhält. Eine Phasenverschiebung von 90◦ bedeutet eine Multiplikation des Zustands mit eiπ/2 = i. Aus dem einfallenden Zustand |γi wird somit nach dem ersten Strahlteiler (ST) der Zustand 1 1. ST |γi −→ √ (|ti + i|ri) 2 (11.5) Anschließend werden beide Strahlen an den Spiegeln reflektiert, was für jeden der Teilzustände eine Multiplikation mit i bedeutet. 1 i Spiegel 1. ST |γi −→ √ (|ti + i|ri) −→ √ (|ti + i|ri) 2 2 (11.6) 220 Optische Experimente zur Quantentheorie Am zweiten Strahlteiler werden beide Teilstrahlen wiederum aufgespalten, wobei der jeweils reflektierte Anteil wieder einen Faktor i erhählt. Der Gesamtzustand ist eine Superposition der beiden Strahlen, die in Richtung D und in Richtung C abgelenkt wurden: i 1 Spiegel √ (|ti + i|ri) −→ √ (|ti + i|ri) 2 2 1 i i 2. ST √ (|Di + i|Ci) + √ (i|Di + |Ci) −→ √ 2 2 2 2 3 2 i i i i = |Di + |Ci + |Di + |Ci 2 2 2 2 = −|Ci 1. ST |γi −→ (11.7) (11.8) (11.9) (11.10) Die vorletzte Zeile dieser Gleichung kann man im Sinne von Feynman als Summation ” über alle Möglichkeiten“ verstehen: Es gibt insgesamt vier gleichberechtigte Wege für das Photon (daher ist das Absolutquadrat der Amplituden immer 41 ) und jeder Weg wird gewichtet mit einer Phase, die sich aus der Anzahl der Reflektionen an Spiegeln zusammensetzt — jede Reflektion ergibt einen Faktor i. Zwei dieser Wege enden im Detektor D, allerdings haben diese Wege einen Phasenunterschied von i2 = 180◦ und heben sich somit auf; in diesem Detektor sollte aufgrund einer destruktiven Interferenz kein Photon nachgewiesen werden. Die beiden anderen Wege enden im Detektor C, sie haben keinen relativen Phasenunterschied und es kommt zu konstruktiver Interferenz. Sind die beiden optischen Wegstrecken der Strahlen also exakt gleich lang, findet man bei D hinter dem Mach-Zehnder-Interferometer gerade eine Auslöschung der Teilstrahlen (destruktive Interferenz) und an der anderen Stelle eine Verstärkung (konstruktive Interferenz). Wie wir gesehen haben, liegt der Grund in einer gewissen Asymmetrie zwischen den Strahlen, die bei D und C ankommen (vgl. Abb. 11.2): Beide Strahlen, die bei dem Detektor C zusammenkommen, wurden jeweils einmal an einem halbdurchlässigen Spiegel reflektiert und einmal durchgelassen (die Reflektion an den gewöhnlichen Spiegeln ist für alle Teilstrahlen dieselbe). Die beiden Strahlen befinden sich also bei Detektor C in Phase und es tritt konstruktive Interferenz auf. Betrachten wir die Strahlengänge zu Detektor D so stellen wir fest, dass einer der beiden Strahlen an beiden Strahlteilern reflektiert wurde, der ander Strahl jedoch bei beiden Strahlteilern durchgelassen wurde. Daher hat der eine Strahl relativ zu dem anderen Strahl nun eine Phasenverschiebung von λ/2, und es findet destruktive Interferenz statt. Werden also beide Strahlgänge kohärent durchlaufen, sollte man bei D nie ein Photon messen, statt dessen bei C immer. Verändert man die optischen Wegstrecken der Strahlen, sodass zu den Phasen, die bei den Reflektionen auftreten, noch eine optische Wegdifferenz ∆x hinzukommt, kann man die relative Intensität der gemessenen Photonen bei D und C variieren. Ist ∆x ein Vielfaches der Wellenlänge, findet man bei D destruktive Interferenz (keine Das Knallerexperiment 221 Photonen) und bei C konstruktive Interferenz (alle Photonen). Ist ∆x gleich einem Vielfachen der Wellenlänge plus einer halben Wellenlänge, so findet man alle Photonen bei D und keines bei C. Als Funktion von ∆x beobachtet man somit an jedem der beiden Detektoren ein Interferenzmuster“. ” 11.3 Wechselwirkungsfreie Messung — das Knallerexperiment“ ” Im Jahre 1993 veröffentlichten Avshalom Elitzur und Lev Vaidman einen Artikel mit dem Titel Quantum mechanical interaction-free measurements“ [25]. Die Idee ” der wechselwirkungsfreien Messung ist schon ziemlich alt: Schrödinger erwähnt die Möglichkeit eines Informationsgewinns (und damit einer Reduktion des Quantenzustands) ohne direkte Wechselwirkung in einem Artikel von 1934 [67] und bekannt wurde sie durch einen Artikel von M. Renninger im Jahre 1960 [66]. Elitzur und Vaidman haben die Idee jedoch sehr werbeträchtig“ aufgezogen, indem sie daraus einen ” Test für den Status einer Superbombe gemacht haben. - 6 - D dunkel 6 C hell 6 - D 6 - C 6 - - y Abbildung 11.2: Mach-Zehnder Interferometer ohne und mit Hindernis in einem Strahlgang. Gegeben sei ein Arsenal von Superbomben, die sofort detonieren, wenn ein Lichtstrahl (ein einzelnes Photon) auf einen Auslöser trifft. Es gibt nun Vermutungen, dass einige der Bomben nicht mehr funktionieren, weil die Auslöser fehlen. Durch einen Blick auf den Auslöser ließe sich das zwar überprüfen, allerdings würde eine intakte Bombe dabei explodieren. Bei den defekten Bomben, bei denen der Auslöser fehlt, tritt ein Photon durch die Vorrichtung ungehindert hindurch, bei den intakten Bomben löst das Photon die Bombe aus. Elitzur und Vaidman schlagen nun folgenden Bombentest vor: Man bringe die Auslösevorrichtung der Bombe in einen der beiden Strahlgänge eines Mach-ZehnderInterferrometers. Fehlt der Auslöser, ist die Bombe also defekt, tritt ein Photon ungehindert hindurch und das Interferrometer reagiert so, wie es auch ohne die Bombe 222 Optische Experimente zur Quantentheorie reagieren würde, und damit sollte man nie ein Photon in Detektor D des Interferrometers messen. Ist die Bombe aber intakt, kann Folgendes passieren: Entweder trifft das Photon auf den Auslöser und die Bombe explodiert — dies passiert in rund der Hälfte der Fälle (falls der erste Strahlteiler eine 50-prozentige Durchlasswahrscheinlichkeit hat). Oder aber das Photon trifft nicht auf den Auslöser, es durchläuft den anderen Teilstrahl und kann am zweiten Strahlteiler entweder abgelenkt oder reflektiert werden (nun kann es nicht zu einer Interferenz mit dem Anteil des Photonenzustands kommen, der den Strahlengang mit der Bombe durchläuft). Trifft das Photon auf Detektor C, können wir keine Aussage über den Zustand der Bombe machen. Trifft es aber auf Detektor D, wissen wir, dass die Bombe intakt ist. Da das Photon aber im Detektor gelandet ist, konnte es nicht mit der Bombe wechselwirken und damit auch die Bombe nicht auslösen. Insgesamt tritt der günstige Fall (Nachweis des Photons in Detektor D) bei einer intakten Bombe in einem Viertel der Fälle auf. In der Hälfte der Fälle explodiert die Bombe, und in einem Viertel der Fälle können wir keine Aussage treffen, weil das Photon in Detektor C gelandet ist. Wird ein solches Photon (bei Ausgang C) wieder in das Interferrometer geleitet, können wir erreichen, dass in zwei Drittel der Fälle die intakte Bombe explodiert und in einem Drittel der Fälle der Nachweis in Detektor D erfolgt. Zumindest ein Drittel der intakten Bomben können dadurch gerettet werden. (Bei einer defekten Bombe kann man das Photon immer wieder in das Interferrometer lenken: trifft es nie auf Detektor D kann man sicher sein, dass die Bombe defekt ist.) Durch eine Kopplung von Mach-Zehnder-Interferrometer und der Idee des QuantenZenon-Effekts kann man sogar erreichen, dass man bei einer intakten Bombe in nahezu 100 Prozent der Fälle die entsprechende Information erhält, ohne dass die Bombe explodiert [48]. Die praktische Anwendung solcher Verfahren wird sich in den seltensten Fällen auf Bomben beziehen, aber vielleicht ist es in Zukunft unter Ausnutzung dieses Effekts möglich, beispielsweise Röntgen-Aufnahmen oder auch γ-Strahlaufnahmen ohne die gesundheitsschädlichen Nebenwirkungen zu machen. In der Praxis verwendet man oft eine etwas andere Anordnung (Abb. 11.3), die aber dem Prinzip des Mach-Zehnder-Interferometers entspricht ([48]). Zunächst erzeugt man sich durch parametrische Fluoreszenz (beispielsweise an einem BBOKristall, s.o.) ein Photonenpaar. Wird eines dieser beiden Photonen in einem Detektor nachgewiesen weiß man, dass ein zweites Photon da ist, das nun für das Experiment verwendet wird. Dieses zweite Photon trifft auf einen Strahlteiler und kann diesen durchlaufen oder es kann reflektiert werden. In beiden Fällen wird es an Spiegeln reflektiert und trifft wieder auf den Strahlteiler. Die Anordnung ist so justiert, dass ohne Hindernis aufgrund von destruktiver Interferenz kein Photon auf den Detektor (dunkel) gelenkt Das Experiment von Hong, Ou und Mandel Detektor (dunkel) i Detektor i * - UV - 223 Spiegel @ - @ BBO Strahlteiler ? 6 @ @ @ Spiegel@ (Bombe) Detektor i Spiegel Abbildung 11.3: Experimentelle Realisierung von Interferenzexperimenten. Der bewegliche Spiegel (Bombe) kann nach rechts in den Strahlgang geschoben werden und lenkt das Photon auf den Detektor. Der obere Detektor (dunkel) sollte nur Ereignisse anzeigen, bei denen ein Hindernis im zweiten Strahlgang vorhanden ist. Der untere Detektor zeigt an, ob das Hindernis getroffen wurde. Auf diese Weise ist der Detektor hell“ überflüssig. ” wird. Die Photonen treten also mit Sicherheit nach links wieder aus. Als Hindernis im unteren Strahlgang dient ein Spiegel, der, sofern er in den Strahlengang geschoben und von einem Photon getroffen wird, dieses auf den Detektor nach rechts ablenkt. 11.4 Das Experiment von Hong, Ou und Mandel Der Hong-Ou-Mandel-Effekt [41] zeigt deutlich die Ununterscheidbarkeit von identischen Teilchen, in diesem Fall Photonen, sowie ihre bosonische Statistik. Es handelt sich um ein Zwei-Photonen-Experiment an einem Strahlteiler. γ γ2 γ2 γ γ2 γ1 R @ @ R @ @ @ R R @ @ γ (1) R @ @ γ (2) R @ @ @ R @ γ1 γ1 (3) @ γ1 @ @ γ2 (4) Abbildung 11.4: Der Hong-Ou-Mandel-Effekt. Die Prozesse (3) und (4) unterscheiden sich lediglich im Vorzeichen und sind ansonsten ununterscheidbar, daher heben sie sich gegenseitig auf. Es werden immer nur beide Photonen im oberen oder beide im unteren Detektor nachgewiesen, nie eines im oberen und eines im unteren. Zwei Photonen, γ, treffen jeweils aus einem Winkel von 45◦ von oben bzw. unten auf einen Strahlteiler. Im Prinzip kann jedes der beiden Photonen durch den Strahlteiler abgelenkt oder auch durchgelassen werden. Bei einer Ablenkung erhält der 224 Optische Experimente zur Quantentheorie entsprechende Zustand wieder einen Phasenfaktor von eiπ/2 = i. In klassischer Vorstellungsweise können nun vier Möglichkeiten auftreten: (1) das obere Photon wird durchgelassen und das untere abgelenkt — beide Photonen landen also im unteren Detektor; (2) das obere Photon wird abgelenkt und das untere durchgelassen — beide Photonen landen also im oberen Detektor; (3) beide Photonen werden abgelenkt oder (4) beide Photonen werden durchgelassen. Für den Nachweis sind die beiden letzteren Situationen aber ununterscheidbar, da jeweils ein Photon im oberen Detektor und eines im unteren Detektor landen würde. Wegen der Ununterscheidbarkeit der Teilchen haben wir also die beiden Anteile von Prozess (3) und (4) zu addieren. Da aber in Prozess (3) beide Photonen abgelenkt und damit beide eine Phasenverschiebung von 90◦ (bzw. insgesamt einen Faktor von i2 = −1) erhalten, sind Zustand (3) und Zustand (4) bis auf ein Vorzeichen identisch. Da sie zu addieren sind, heben sie sich gegenseitig auf. (Würde es sich bei Photonen um Fermionen handeln, würde die Vertauschung der beiden Teilchen einen zusätzlichen Faktor (−1) liefern und die beiden Beiträge würden sich somit addieren. Das Experiment verifiziert also gleichzeitig den bosonischen Charakter von Photonen.) Experimentell sollte man also im Idealfall nie ein Photon im oberen Detektor und eines im unteren Detektor nachweisen, da zu diesem Prozess zwei Möglichkeiten beitragen, die sich aber im Vorzeichen unterscheiden und damit aufheben. Nachgewiesen werden also immer zwei Photonen im oberen Detektor (Fall 2) oder zwei Photonen im unteren Detektor (Fall 1). 11.5 Delayed Choice Experimente Unter Delayed-Choice“–Experimenten versteht man allgemein eine Klasse von Ex” perimenten, bei denen die Entscheidung, welche von (zwei oder mehreren) komplementären Eigenschaften an einem Quantensystem gemessen wird, erst gefällt wird, wenn der entscheidende Quantenprozess bereits stattgefunden hat. Der Begriff wurde ursprünglich von John A. Wheeler (1911–2008) geprägt und bezog sich auf eine besondere Version des Doppelspaltexperiments. Wir wissen, dass die Verteilung von sehr vielen Teilchen (beispielsweise von Photonen) hinter einem Doppelspalt zu einem Interferenzmuster führt, das wir nur erklären können, wenn wir Photonen durch eine Welle beschreiben, die durch beide Spalte getreten ist. Andererseits können wir hinter den Doppelspalt auch eine Linse und hinter dieser Linse in der Bildebene zum Doppelspalt zwei Detektoren aufstellen. In einem solchen Fall erwarten wir, dass der Detektor, in dem ein Photon nachgewiesen wird, anzeigt, ob das Photon durch den linken oder den rechten Spalt getreten ist. Wheelers Idee war, dass wir die Entscheidung, ob wir eine photographische Platte zur Messung des Interferenzmusters oder aber die Linse mit den Detektoren Der Quantum-Eraser 225 2 ` ` a ! ` ` ! ` ` a ! a ` ` a ! ` ` a ! 1 Doppelspalt Linse 1 Detektoren in der Bildebene der beiden Spalte 2 Bildebene Abbildung 11.5: Optische Apparatur zur Messung des Spalts, durch den ein Photon getreten ist. zum Nachweis des Spalts, durch den das Photon getreten ist, benützen, erst dann fällen, wenn das Photon den Doppelspalt bereits passiert hat. Wir können zwar nicht sowohl das Interferenzmuster messen als auch den Durchtrittspalt bestimmen, aber zumindest kann man auf diese Weise Theorien ausschließen, bei denen das Photon vielleicht schon vorher weiß“, welche Messung hinter dem Spalt vorgenommen wird ” und sich entsprechend bei seinem Durchtritt durch den Spalt als Teilchen oder als Welle verhält. Wheeler fand sogar eine kosmische“ Version seines Experiments: Angenommen, ” ein Quasar in einem Abstand von einigen Milliarden Lichtjahren sendet Licht aus, das wir hier auf der Erde empfangen können. Zwischen dem Quasar und der Erde befindet sich ein Galaxiencluster, dessen Gravitationsfeld als optische Linse wirkt, d.h., der das Licht ablenkt wie an einer Linse. Theoretisch können wir auf der Erde mit dem Licht des Quasars Interferenzexperimente durchführen, die zeigen, dass das Licht auf beiden ” Seiten“ des Galaxienclusters vorbeigeflogen ist. Andererseits können wir Experimente vornehmen, die diese Flugrichtung des Lichts messen. Auf diese Weise können wir (im Prinzip) noch nach Milliarden Jahren die Entscheidung fällen, ob wir den Weg eines Photons rekonstruieren wollen oder ob das Photon an Interferenzexperimenten teilnehmen soll, zu deren Erklärung ein solcher Weg nicht angenommen werden darf. In der Praxis ist ein solches Experiment natürlich beliebig schwierig bis unmöglich. Die Kohärenzlänge typischer Photonen liegt im Bereich von einigen Metern. Wir würden also nur dann ein Interferenzmuster beobachten, wenn sich die unterschiedlichen Wege um bzw. durch die Gravitationslinse in ihrer optischen Weglänge nur im Meterbereich unterscheiden. 11.6 Der Quantum-Eraser Es gibt viele Versionen des Quantum-Erasers ( Quantenradierer“). Die folgende Dar” stellung lehnt sich eng an die ursprünglichen Arbeiten von Scully et al. [69, 73] an. Ganz allgemein handelt es sich bei Quantum-Erasern um eine Klasse von de” 226 Optische Experimente zur Quantentheorie APolarisationsdetektor 1 (|h/vi oder |±i) A A A Photonenquelle |γi - * |2γiEPR BBO H HH λ/4-Plättchen HH jH λ−H H 4 H H λ+ Doppelspalt 4 H H H Polarisationsdetektor 2 H H (z.B. |L, Ri) Abbildung 11.6: Aufbau eines Quantum Erasers“. Photonen aus einer Photonenquelle ” treffen auf einen BBO-Kristall, der zwei im EPR-Zustand verschränkte Photonen der halben Energie erzeugt. Eines der Photonen trifft auf einen Doppelspalt, hinter dem λ/4-Plättchen eine Markierung“ eines Photons ermöglichen, durch welchen Spalt es ” getreten ist. layed choice“ 2-Wege-Experimenten, bei denen zunächst die Information über den Weg eines Teilchens (im Folgenden immer Photonen) prinzipiell vorhanden ist und somit kein Interferenzmuster gemessen wird. Wird diese Information aber unwiderruflich gelöscht“, lässt sich das Interferenzmuster beobachten bzw. zurückgewinnen. ” Diese zunächst überraschende Tatsache hängt damit zusammen, dass man durch das Löschen der which path“–Information eine andere Information erhält, welche die Pho” tonen (von denen man nun nicht weiß, durch welchen Spalt sie getreten sind) in zwei Klassen einteilt. Innerhalb jeder Klasse beobachtet man das Interferenzmuster, allerdings sind die Interferenzmuster zu den beiden Klassen um eine halbe Wellenlänge verschoben, sodass ihre Summe keine Interferenz zeigt. Abbildung 11.6 zeigt eine typische Quantum-Eraser Anordnung. Aus einer Photonenquelle treffen Photonen auf einen BBO-Kristall (siehe Abschnitt 11.1.5), wo durch eine down-conversion zwei verschränkte Photonen der halben Energie erzeugt werden. Eines der Photonen (in der Abbildung oben) trifft auf einen Polarisationsdetektor (1), d.h., einen Polarisationsstrahlteiler, hinter dessen beiden Strahlgängen Detektoren stehen, sodass wir die Polarisation des Photons bezüglich einer voreingestellten Basis (beispielsweise horizontal/vertikal — |hi und |vi — oder ±45◦ — d.h. |+i und |−i) messen können. Dieser Strahlteiler kann auch sehr weit hinter der Apparatur stehen, d.h. die entsprechende Information über das Photon kann (theoretisch) noch nach Jahren eingeholt werden. Das zweite Photon trifft auf einen Doppelspalt, hinter dessen beiden Spalten Der Quantum-Eraser 227 zwei λ/4-Plättchen angebracht sind, deren schnelle“ Achsen orthogonal zueinander ” sind. Die Eigenachsen der Plättchen seien wie in Abschnitt 11.1.4 gewählt. Das bedeutet, Photonen, die bezüglich der + oder −45◦ -Achse polarisiert sind (also im Zustand |+i oder |−i), erfahren durch die λ/4-Plättchen keine Änderung ihres Polarisationszustandes sondern lediglich (je nach Spalt) eine Phasenverschiebung. Solche Photonen erzeugen also ein Interferenzmuster an der Stelle des Detektors, allerdings sind die beiden Interferenzmuster von |+i bzw. |−i um eine halbe Wellenlänge relativ zueinander verschoben (die Phasendifferenz hinter dem rechtem und linkem Spalt ist bei |+i gleich +π/2 und bei |−i gleich −π/2). Die Summe dieser beiden Interferenzmuster ergibt eine breite, unstrukturierte Verteilung ohne Interferenzanzeichen. Wir können nun entscheiden, ob wir die Information über den Spalt, durch den ein Photon getreten ist, messen wollen oder nicht. Wenn wir für das erste Photon die Basis des Polarisationsdetektors 1 auf |hi bzw. |vi einstellen, ist auch das zweite Photon, das durch den Spalt tritt, in dieser Basis polarisiert. Die λ/4-Plättchen machen aus dieser Polarisation (die wegen der Messung an dem anderen Photon bekannt ist) eine zirkulare Polarisation, und zwar in entgegengesetzter Richtung für den rechten und linken Spalt. Misst man bei dem Detektor hinter dem Spalt also die zirkulare Polarisation (und man weiß, in welchem Zustand sich das Photon vor Eintritt in den Doppelspalt befand), so kann man von jedem Photon angeben, durch welchen Spalt es getreten ist. Die which-path“-Information ist also vorhanden. Die Photonen werden ” in diesem Fall kein Interferenzmuster hinter dem Doppelspalt zeigen. Da die Messung an Photon 1 (oben) erst sehr spät erfolgen kann (theoretisch Jahre später), erhält man dieses Ergebnis (kein Interferenzmuster) auch, wenn Photon 1 zunächst gar nicht gemessen wird. Also auch wenn der Zustand von Photon 2 unbekannt ist, ergibt sich kein Interferenzmuster in der Photonenverteilung bei Detektor 2. Die Messung der zirkularen Polarisation lässt ohne weitere Information allerdings keinen Rückschluss auf den Spalt zu, durch den ein Photon getreten ist, da beispielsweise ein Photon im Zustand |hi beim Nachweis einer Rechtszirkulation durch den rechten Spalt getreten ist, ein Photon im Zustand |vi beim Nachweis derselben zirkularen Polarisation aber durch den linken Spalt. Angenommen, wir messen an Detektor 1 (möglicherweise wieder Jahre“ später) ” nicht die Polarisation bezüglich h und v sondern bezüglich der Basis + bzw. −. Dann wissen wir auch, welche Photonen, die bei Detektor 2 gemessen wurden, vor ihrem Eintritt in den Doppelspalt im Zustand |+i bzw. |−i waren. In diesem Fall ist die which-path“-Information endgültig verloren. Doch nun können wir die Ereignisse, die ” von Detektor 2 aufgenommen wurden, hinsichtlich der Zustände + bzw. − nachträglich trennen (wir sortieren also den gesamten Datensatz nachträglich entsprechend der gewonnenen Information in zwei Klassen). In jeder der so gewonnenen Klassen finden wir nun das Interferenzmuster, denn für jede dieser Klassen ist die which-path“” 228 Optische Experimente zur Quantentheorie Information gelöscht. Auf diese Weise können wir nachträglich die Interferenzmuster sichtbar machen. Da die beiden Interferenzmuster zu den beiden Klassen von Ereignissen jedoch um eine halbe Wellenlänge relativ zueinander verschoben sind, ist ihre Summe eine breite Verteilung ohne Interferenzstreifen. Abbildung 11.7 fasst diese Situation nochmals in stilisierter Form zusammen. Teil (a) zeigt die gemessene zirkulare Polarisation der Photonen, nachdem sie durch den Doppelspalt mit den λ/4-Plättchen getreten sind. Die Verteilung der R- bzw. Lzirkular polarisierten Photonen ist zufällig und zeigt keinerlei Interferenz. Entscheiden wir uns, an dem Detektor für Photon (1) die h/v-Polarisation zu messen, kennen wir die h/v-Polarisation der Photonen in Strahl 2, bevor sie auf den Doppelspalt getreten sind (Abb. 11.7 (b)). Aus diesen beiden Informationen können wir den Spalt bestimmen, durch den jedes einzelne Photon getreten ist. Hatte ein Photon vor dem Spalt eine h-Polarisation und wurde es nach dem Spalt mit einer R-Polarisation gemessen, wissen wir, dass das entsprechende Photon durch den rechten Spalt getreten ist (entsprechend bei einer L-Polarisation durch den linken Spalt). War es vorher v-polarisiert, ist die Situation umgekehrt (Abb. 11.7 (c)). Man beachte, dass erst beide Informationen zusammengenommen (h/v-Polarisation vor dem Spalt und R/L-Polarisation hinter dem Spalt) die Which path“-Information liefern. ” Wird jedoch an Photon (1) die Polarisation bezüglich einer +/−-Basis gemessen, ändern die λ/4-Plättchen die Polarisation nicht und wir erhalten aus einer Messung der L/R-Polarisation hinter dem Spalt keine Which path“-Information. Statt ” dessen zeigen sowohl die +- als auch die −-polarisierten Photonen ein Interferenzmuster (Abb. 11.7 (d)), die jedoch gegeneinander um eine halbe Interferenzbreite verschoben sind, sodass die Gesamtmenge aller Photonen eine interferenzfreie Verteilung hat. Der Quantum-Eraser a) b) c) d) 229 L R L R L L R R L L R L R L L R R L R R L R L L R L R L L L R R R L R R R R L L L R L L L R R R R R L R R L L L L R L R R L R v v h h h v v v v v h h v h v v v v v h h h v v h h h h h v h v v v v v h v h h v h h h v v v h v h v h h h v h h h v h h h v r l l r l r l l r r r l l l r l l r l r l r r r r l r l l r r l l r l l r l l l r r l l r l l r l r r r r l r l l r r r r l l + + + − − − + + + − − − + + + − − − + + + + + + − − − + + + − − − + + + − − − + + + + + + − − − + + + − − − + + + − − − + + + Abbildung 11.7: Stilisierte Darstellung der möglichen Ereignisse beim QuantenRadierer. (a) Gemessene Daten in Detektor 2 (hinter dem Doppelspalt) – R, L steht für rechtsbzw. linkszirkulare Polarisation. (b) Wird der Polarisationsmesser an Strahl 1 auf eine h/v-Basis eingestellt, kennt man auch die h/v-Polarisation der Photonen in Strahl 2, bevor sie durch den Spalt treten. (c) Aus der Kenntnis der h/v-Polarisation der Photonen vor dem Doppelspalt sowie ihrer zirkularen Polarisation hinter dem Doppelspalt erhält man die Information, durch welchen Spalt jedes der Photonen getreten ist. (d) Stellt man den Polarisationsmesser in Strahl 1 auf eine +/−-Basis ein, verliert man die Information über den Spalt, durch den die Photonen in Strahl 2 getreten sind. Sowohl die +-polarisierten Photonen als auch die −-polarisierten Photonen zeigen ein Interferenzmuster, die jedoch gegeneinander um eine halbe Interferenzbreite verschoben sind. 230 Optische Experimente zur Quantentheorie Kapitel 12 Nochmals Photonenpolarisation In diesem Kapitel sollen nochmals die Zusammenhänge mit der Polarisation von Photonen aus Kap. 2 aufgegriffen werden, nun unter den Aspekten, die wir in den vergangenen Kapiteln behandelt haben. Insbesondere könnte sich hier eine Möglichkeit bieten, Grundfragen der Quantenmechanik an einem einfachen, bis zu einem gewissen Grad in der Schule behandelbaren Beispielsystem anzugehen. Wir werden zunächst anhand der planaren Polarisation von Photonen nochmals die Axiome sowie einige fundamentale Begriffe der Quantenmechanik wiederholen. Anschließend wird gezeigt, dass man schon bei reinen Polarisationsfreiheitsgeraden nicht um die Einführung der komplexen Zahlen herumkommt (es sei denn, man erkauft sich einen sehr komplizierten mathematischen Formalismus zur Beschreibung der zirkularen Polarisationen). 12.1 Zusammenfassung des Bekannten Wir beginnen mit den Axiomen der Quantenmechanik und zeigen, dass diese eine natürliche Deutung im Zusammenhang mit linearen Polarisationen haben. 1. Zustand: Zustände werden durch 1-dimensionale Teilräume eines Hilbertraums dargestellt. Die linearen Polarisationen lassen sich durch Richtungen in einer Ebene kennzeichnen, und damit ist dieses Axiom unmittelbar anschaulich. Es zeigt auch deutlich, weshalb ein (normierter) Vektor nur ein Repräsentant sein kann, denn ein Einheitsvektor ~e und sein Negatives −~e definieren dieselbe Polarisationsrichtung. 2. Observable: Observable werden durch selbst-adjungierte Operatoren (Matrizen) dargestellt. 231 232 Nochmals Photonenpolarisation Eine selbst-adjungierte Matrix zeichnet ein Orthogonalsystem von Richtungen aus. Genau dies ist auch bei einem Polarisationsstrahlteiler der Fall. Die Beziehung zwischen den Eigenwerten und den Messwerten ist zunächst nicht offensichtlich. Erst wenn wir die Polarisationsrichtungen mit Drehimpulskomponenten identifizieren (die auch mit dem Bahndrehimpuls beispielsweise von Elektronen wechselwirken können) erhalten die Messwerte eine physikalische Bedeutung. Relevant bleibt aber, dass jede Messung“ ein Orthogonalsystem von möglichen ” Zuständen auszeichnet, und ein System durch den Messprozess in einen dieser Zustände gezwängt wird (die Schrödinger’sche Prokrustie“). Zusammen mit den ” möglichen Messwerten kodiert in diesem Sinne eine selbstadjungierte Matrix die Information, die in einer Messung erhalten ist. 3. Messwerte und Wahrscheinlichkeiten: Die Eigenwerte einer selbst-adjungierten Matrix entsprechen den möglichen Messwerten. Die Wahrscheinlichkeit für das Auftreten eines Messwerts β bei einer Messung im Zustand |αi ist gleich |hβ|αi|2 = cos2 (α − β). Wir hatten schon erwähnt, dass die Zuweisung von Messwerten zu den möglichen Polarisationsrichtungen eines Strahlteilers willkürlich ist. Eine physikalische Zuordnung erhalten wir erst, wenn wir den Drehimpuls messen, der durch das Photon auf den Strahlteiler übertragen wird. Dies ist zwar bei einem makroskopischen Strahlteiler nicht möglich, aber bei Wechselwirkungen mit Elementarteilchen kann man entsprechende Effekte beobachten. Die Wahrscheinlichkeiten ergeben sich aus den bekannten Gesetzen bei der Polarisation von Licht: Das Skalarprodukt der Einheitsvektoren |αi = ~eα (der die Polarisation eines präparierten Lichtstrahls angibt) und ~eβ (der die Polarisationsrichtung eines Filters bzw. einer Achse des Strahlteilers angibt) entspricht der neuen Amplitude und deren Quadarat ist gleich der Intensität. Diese wird aber bei Einzelphotonen zu einer Wahrscheinlichkeit. 4. Kollapspostulat: Nach einer Messung mit Messwert β liegt der Eigenzustand |βi der Observablen zu diesem Messwert vor. Auch dies entspricht den Erfahrungen bei Polarisationsfiltern bzw. Strahlteilern: Licht hat nach dem Passieren eines Filters genau die von dem Filter vorgegebene Polarisation. Erst diese Erfahrungstatsache erlaubte es uns, im Zusammenhang mit der Polarisation von einer Eigenschaft“ zu sprechen. ” 5. Schrödinger-Gleichung: Die zeitliche Entwicklung eines reinen Quantenzustands erfolgt nach einer Schrödinger-Gleichung. Zusammenfassung des Bekannten 233 Da die Polarisation von Licht im Vakuum eine Erhaltungsgröße ist, findet gewöhnlich nur eine triviale Zeitentwicklung statt, d.h., die Polarisation ändert sich nicht (H = 0). Es gibt jedoch Kristalle, welche die Polarisationsachse drehen. Breitet sich linear polarisiertes Licht in einem solchen Kristall aus, erfolgt eine Drehung der Polarisationsachse mit zeitlich konstanter Drehgeschwindigkeit. Die Wirkung eines solchen Kristalls lässt sich also durch eine Drehmatrix R(α) charakterisieren, wobei der Drehwinkel α proportional zur Strecke (und damit zu der Zeit) ist, die der Strahl innerhalb des Kristalls zurückgelegt hat. Diese pro Zeiteinheit konstante Drehung lässt sich durch eine Schrödinger-Gleichung beschreiben. Wir können noch weitere fundamentale Begriffe anhand der Polarisation verdeutlichen: - Komplementarität: Die kanonischen Vertauschungsrelationen lassen sich nicht in endlich dimensionalen Vektorräumen realisieren. Aber man kann die Komplementariät von zwei Observablen auch so definieren, dass ihre Eigenrichtungen maximal verschieden sein sollen. Dies lässt sich geometrisch genauer definieren, aber in der Ebene bedeutet es, dass zwei Orthonormalsysteme unter einem Winkel von 45◦ zueinander stehen. In diesem Sinne definieren zwei unter 45◦ ausgerichtete Polarisationsstrahlteiler – beispielsweise einmal in h/v-Richtung und einmal in p/m-Richtung – komplementäre Eigenschaften. - Unbestimmtheitsrelationen: Wir betrachten die beiden oben definierten komplementären Strahlteileranordnungen (h/v und p/m). Ist ein Strahl bezüglich der Achsen h/v polarisiert, ist die Unschärfe“ in Bezug auf diese Richtungen null. Bezüglich der p/m” Richtungen misst man für solche Strahlen aber eine maximale Unschärfe (statistisch gleichmäßig verteilte Werte). Die beiden Observablen zu h/v- und p/m-Polarisationsstrahlteilern kommutieren nicht. Das Gleiche gilt für die Projektionsmatrizen: ! ! 1 0 0 0 Ph = , Pv = (12.1) 0 0 0 1 ! ! 1 −1 1 1 1 1 , Pm = . (12.2) Pp = 2 1 1 2 −1 1 Kompatible“ Größen kommutieren: ” [Ph , Pv ] = 0 , [Pp , Pm ] = 0 , (12.3) 234 Nochmals Photonenpolarisation wohingegen komplementäre Größen nicht kommutieren: [Ph , Pp ] 6= 0 , [Ph , Pm ] 6= 0 , [Pv , Pp ] 6= 0 , [Pv , Pm ] 6= 0 . (12.4) Es ist auch offensichtlich, dass einem Photon, das die Eigenschaft der h/vPolarisierung hat (also entweder h oder v), die Eigenschaft p oder m überhaupt nicht zukommt. Es ist keine Unkenntnis, die bezüglich dieser Eigenschaften vorliegt, sondern es macht gar keinen Sinn, in diesem Fall von einer p/m-Eigenschaft zu sprechen. - Superpositionen: Wir können uns jede Polarisation als Superposition von zwei Anteilen bezüglich orthogonaler Achsen denken. Wie wir in Kapitel 2.3.3 gesehen haben, können wir eine solche Zerlegung mit einem Polarisationsstrahlteiler explizit realisieren. Und wir können die beiden Anteile auch wieder (durch einen zweiten Polarisationsstrahlteiler) addieren“ und erhalten auf diese Weise den ursprünglichen ” Zustand zurück. 12.2 Der (inverse) Quanten-Zenon-Effekt Bisher haben wir mit dem Polarisationsstrahlteiler und dem Polarisationsfilter zwei Instrumente kennengelernt, mit denen wir einen Strahl beeinflussen können. Wir hatten zwar schon erwähnt, dass es Kristalle gibt, welche die Polarisationsrichtung eines Lichtstrahls und entsprechend auch eines einzelnen Photons drehen können, wir werden nun aber zeigen, dass dies auch mit dem Instrument des gewöhnlichen Polarisationsfilters möglich ist. - - XXX - HH - · · · · · · H C Detektor C C Abbildung 12.1: Der inverse Quanten-Zenon-Effekt für Polarisationsfreiheitsgrade. Ein polarisierter Lichtstrahl trifft auf eine Folge von N + 1 Polarisationsfiltern, die jeweils um einen Winkel α/N zueinander gedreht sind. Die von der Anordnung durchgelassene Intensität nähert sich für große Werte von N der Eingangsintensität, die Eingangspolarisation wurde jedoch um den Winkel α gedreht. Dazu wählen wir N + 1 Polarisationsfilter, die wir so hintereinander aufstellen, dass zwischen je zwei benachbarten Filtern die Polarisationsachse um einen Winkel von α/N gedreht ist (Abb. 12.1). Der erste Filter habe dieselbe Polarisationsrichtung Der (inverse) Quanten-Zenon-Effekt 235 wie ein einfallender Strahl (oder ein einfallendes Photon). Der letzte Filter ist dann um den Winkel α zur einfallenden Richtung gedreht. Wir wollen nun untersuchen, welche Intensität If durch diese Anordnung hindurchtritt, wenn I0 die Intensität eines einfallenden Strahls ist. Bei jedem Filter (außer dem ersten, der die Polarisationsrichtung des einfallenden Strahls hat) wird die Intensität um einen Faktor cos2 (α/N ) geringer. Insgesamt haben wir somit eine durchgelassene (relative) Intensität von If = (cos2 α/N )N = exp(2N ln(cos(α/N ))) . I0 (12.5) Wir sind an dem Verhalten für große Werte von N interessiert. Mit den beiden Näherungen N If /I0 α2 cos(α/N ) = 1 − + O(1/N 4 ) (12.6) 2 0.25 2N 2 3 0.42 und 4 0.53 ln(1 − ) = − + O(1/2 ) (12.7) erhalten wir: If α2 2 ≈ exp − + O(1/N ) . I0 N (12.8) 5 0.61 10 0.78 100 0.976 1000 0.998 Für sehr große Werte von N wird dieser Faktor nahezu 1. Die Tabelle auf der rechten Seite zeigt die entsprechenden Werte für α = 90◦ . Es tritt also paktisch kein Intensitätsverlust mehr auf, bzw., durch einen ausreichend großen Wert von N können wir den Intensitätsverlust beliebig gering halten. Durch eine solche Anordnung können wir also eine gegebene Polarisationsrichtung effektiv um einen Winkel α drehen. Man bezeichnet diesen Effekt manchmal als eine spezielle Realisation des inversen Quanten-Zenon-Effekts“. Er ist ein Beispiel ” dafür, wie man durch eine besondere Abfolge von Wechselwirkungen mit einem Mess” instrument“ (allgemeiner mit einer Umgebung“) den Quantenzustand eines Systems ” gezielt beeinflussen kann. Übrigens kann man mit einer ähnlichen Anordnung auch die Richtung eines beliebig polarisierten Strahls um einen vorgegebenen Winkel drehen: Dazu ersetzen wir die Filter durch Polarisationsstrahlteiler, deren Achsen jeweils um kleine Winkel zueinander gedreht sind. Nun wird die Polarisationsrichtung eines beliebig polarisierten einfallenden Strahls gedreht. Zur Begründung des Namens betrachten wir zunächst den direkten QuantenZenon-Effekt. Dieser bezieht sich auf ein System, dessen natürliche Zeitentwicklung in einer Rotation im Zustandsraum besteht und das durch wiederholte Messungen an 236 Nochmals Photonenpolarisation dieser Rotation gehindert wird. Als Beispiel betrachten wir einen polarisierten Lichtstrahl in einem Medium, das die Polarisation des Lichtstrahls dreht. Dies realisieren wir durch N hintereinandergestellte Kristalle, welche die Polarisationsachse jeweils um den Winkel α/N drehen (Abb. 12.2 a). Zwischen die Kristalle stellen wir insgesamt N + 1 Polarisationsfilter auf, die nun aber alle dieselbe Polarisationsachse wie der einfallende Lichtstrahl haben (Abb. 12.2 b). - α N α N α N ······ α N ······ α N α N - Detektor α N Detektor (a) - (b) α N α N α N Abbildung 12.2: Der (direkte) Quanten-Zenon-Effekt für Polarisationsfreiheitsgrade. Ein polarisierter Lichtstrahl trifft auf eine Folge von N Kristallen, welche die Polarisationsachse jeweils um den Winkel α/N drehen. (a) Ohne eingeschobene Polarisationsfilter ist die Polarisationsrichtung des Strahls schließlich um den Winkel α gedreht. (b) Mit eingeschobenen Polarisationsfiltern dreht sich die Polarisationsachse nicht und für große Werte von N bleibt die Eingangsintensität nahezu erhalten. Ohne die Polarisationsfilter würde sich der Strahl um den Winkel α drehen. Doch mit den Polarisationsfiltern zeigt die entsprechende Rechnung wie oben, dass der Strahl nicht gedreht wird und seine Intensitätsminderung durch einen genügend großen Wert von N (und damit beliebig häufige Messungen) beliebig klein gemacht werden kann. Mit den Polarisationsfiltern wird die Polarisation des Strahls somit eingefroren“, ” es findet keine Drehung mehr statt. Die Bezeichnung Quanten-Zenon-Effekt“ leitet sich von dem klassischen Ze” non’schen Paradoxon her. Im Zusammenhang mit einem fliegenden Pfeil hatte Zenon von Elea (um 495–430 v. Chr.) sich die Frage gestellt: Wenn der Pfeil zu jedem Zeitpunkt an einem bestimmten Ort ist, wann bewegt er sich dann von einem Ort zu einem anderen? Zenon wollte durch solche Argumente beweisen, dass es keine Bewegung geben kann (bzw. dass jede Form von Bewegung oder Veränderung nur ein trügerischer Schein ist). Bei der Messung von Quantensystemen kann es allerdings tatsächlich passieren, dass eine genügend rasche und intensive Beobachtung“ eines Systems den ” Zustand des Systems einfriert“ und keine Bewegung mehr stattfindet. Dies ist dann ” der Quanten-Zenon-Effekt. Allgemeiner spricht man in der Physik oft vom Zenon-Bereich“, wenn ein ” Quantensystem eine derart intensive Wechselwirkung mit seiner Umgebung hat, dass Zirkulare Polarisationen 237 seine natürliche Dynamik davon vollkommen unterdrückt wird und ihm statt dessen eine Dynamik aufgezwungen wird, die durch die Wechselwirkung mit der Umgebung bestimmt ist. 12.3 Zirkulare Polarisationen Detektor Bisher sind wir zur Beschreibung der linearen Polarisationen mit einem reellen Vektorraum ausgekommen. In diesem Abschnitt werden wir sehen, dass dieser reelle Vektorraum nicht ausreicht, sondern dass wir mit einer einfachen Variante des Superpositi” onsexperiments“ aus Abschnitt 2.3.3 um die komplexen Zahlen nicht herumkommen. Wir betrachten nochmals den experimentellen Aufbau zur Superposition aus Kapitel 2.3.3, d.h. die Zerlegung und Wiederzusammensetzung eines Strahls, (siehe Abb. 12.3). Diesmal soll der einfallende Strahl unter +45◦ polarisiert sein. In beiden Teilstrahlen befindet sich somit die Hälfte der Intensität. Bei Einzelphotonen würde bei einer Messung in der Hälfte der Fälle das Photon im oberen bzw. im unteren Strahlengang nachgewiesen. h6 6 - v 6 +45◦ 6 Abbildung 12.3: Photonen treffen mit einer Polarisation von +45◦ auf 6 einen h/v-Strahlteiler und werden α später wieder von einem entspre chenden Strahlteiler zusammen6 geführt. Mit einem drehbaren Polarisationsfilter kann man untersuchen, für welchen Winkel α die maximale Intensität gemessen wird. Bei gleichen Wegstrecken für die beiden Strahlgänge ist das für α = +45◦ der Fall und wir erhalten wieder den ursprünglichen Polarisationszustand. Den Polarisationsfilter hinter der Anordnung können wir frei drehen und auf diese Weise den Winkel α bestimmen, bei dem die höchste Intensität bzw. die meisten Photonen im Detektor nachgewiesen werden. Dies ist bei gleichen Weglängen für die beiden Strahlengänge bei +45◦ der Fall. 238 Nochmals Photonenpolarisation ∆x = 2l - @ ? 6 l @ (a) ∆x = (n − 1)d - (b) ∆x - - d - (c) Abbildung 12.4: Eine Beeinflussung der optischen Weglänge lässt sich theoretisch (a) durch variable Spiegel erreichen, (b) oft nimmt man aber auch optisch dichtere Kristalle (Brechungsindex n) einer bestimmten Dicke d. (c) Im Folgenden verwenden wir in Skizzen das Umwegsymbol“, wobei ∆x die zusätzliche optische Weglänge angibt. ” Abbildung 12.5: Wie in Abb. 12.3 treffen Photonen mit einer Polarisation von +45◦ auf einen h/v-Strahlteiler und werden später wieder von einem entsprechenden Strahlteiler zusammengeführt. Nun wird der eine Strahlengang jedoch um ∆x verlängert. Mit dem drehbaren Polarisationsfilter kann man wiederum die Intensitäten in Abhängigkeit von dessen Achse α messen. Ohne diesen Filter findet man in dem Detektor die volle Intensität. Detektor Nun verändern wir in einem der beiden Strahlengänge die optische Weglänge. Dies kann man theoretisch durch eine Umlenkung des Strahls durch entsprechende Spiegel erreichen (vgl. Abb. 12.4), was allerdings wegen der kurzen Wellenlängen von sichtbarem Licht unpraktikabel ist. Meist verwendet man präzise geschliffene Kristalle mit einem erhöhten optischen Brechungsindex. 6 α 6 h- - 6 6 - v ∆x 6 +45◦ 6 Je nach Wahl von ∆x und dem Winkel α für den Polarisationsfilter vor dem Detektor finden wir folgendes Verhalten: - Für α = 45◦ beobachten wir eine periodische Intensitätsschwankung als Funktion Zirkulare Polarisationen von ∆x: 239 ∆x I ∝ cos π λ 2 (12.9) Ist ∆x ein ganzzahliges Vielfaches von λ (der Wellenlänge des Lichts, die bisher bei unseren Betrachtungen noch nie eine Rolle gespielt hat), ist die Intensität wieder maximal und somit die Polarisation des resultierenden Strahls wieder linear um +45◦ geneigt. Theoretisch kann man auf diese Weise eine Messung der Wellenlänge vornehmen. - Für α = +45◦ und ∆x = λ(n + 21 ) verschwindet die gemessene Intensität. Allerdings messen wir nun die maximale Intenstiät bei einer Richtung des Polarisationsfilters von α = −45◦ . Wir erhalten also linear polarisiertes Licht mit einer um 90◦ gedrehten Polarisationsachse. - Für andere Werte von ∆x gibt es keinen Winkel α, für den die maximale Intensität gemessen wird. Das Licht besitzt also keine lineare Polarisationsachse. Trotzdem handelt es sich immer noch um einen reinen Zustand und nicht um ein Gemisch aus linearen Polarisationen. Dies kann man experimentell testen, indem man den Strahl ein zweites Mal durch eine solche Strahlanordnung mit zwei h/v Strahlteilern schickt und diesmal in den horizontalen Strahlengang die zusätzliche optische Wegstrecke ∆x einbaut. Nun zeigt eine abschließende Messung wieder eine (reine) lineare Polarisation von +45◦ . - Der Vollständigkeit halber fassen wir noch weitere Informationen zusammen: Wird das Photon im unteren Strahlengang gemessen, hat es immer eine vPolarisation (befindet sich also in einem |vi Zustand) unabhängig von ∆x. Ebenso bleibt die relative Häufigkeit im unteren Strahlengang ein Photon zu messen durch die Weglängenänderung unbeeinflusst. Die nächstliegende Lösung zur Beschreibung des neuen Zustands besteht in folgender Veränderung: Der Zustand bleibt eine Superposition von |hi und |vi; die relative Intensität (Betrag der beiden Amplituden) bleibt unverändert; die Amplitude von |vi beschreibt eine periodische Veränderung in ∆x mit Periode λ. Damit erhalten wir für den Zustand hinter dem zweiten Strahlteiler: 1 ∆x |ψi = √ |hi + exp 2πi |vi (12.10) λ 2 Mit dieser Darstellung des Zustands können wir alle Erscheinungen beschreiben: - Ist ∆x ein ganzzahliges Vielfaches von λ erhalten wir wieder den Zustand |pi ≡ | + 45◦ i. 240 Nochmals Photonenpolarisation - Unterscheidet sich ∆x um eine halbe Wellenlänge von λ, erhalten wir den Zustand 1 | − 45◦ i ≡ |mi = √ (|hi − |vi) . (12.11) 2 - Für andere Werte von ∆x erhalten wir keine lineare Polarisation, trotzdem bleibt |ψi ein reiner Zustand. Durch eine entsprechende Korrektur in der Weglänge des horizontal polarisierten Strahls können wir den Effekt rückgängig machen. - Der v-Teilstrahl bleibt vertikal polarisiert und die relativen Häufigkeiten, mit denen Photonen in den beiden Teilstrahlen gemessen werden, ändern sich ebenfalls nicht. Unterscheidet sich ∆x von λ nur um ein Viertel der Wellenlänge, erhalten wir je nach Vorzeichen Licht mit einer reinen rechts- bzw. linkszirkularen Polarisation: 1 1 (12.12) |Li = √ (|hi − i|vi) und |Ri = √ (|hi + i|vi) . 2 2 Durch die Möglichkeit, zwischen zwei Superpositionen eine relative Phase bzw. einen Gangunterschied einzuschieben, gelangen wir zu (teilweise) zirkular polarisiertem Licht. Damit können wir es praktisch nicht vermeiden, zur Beschreibung des vollständigen Zustandsraums auch komplexe Zahlen zuzulassen. Der Raum der möglichen Zustände entspricht also den 1-dimensionalen Strahlen eines komplexen 2-dimensionalen Vektorraums. Ein gemeinsamer Phasenfaktor in beiden Komponenten lässt sich nicht beobachten; er entspricht einer gleichen optischen Wegänderung in beiden Strahlengängen. Physikalisch relevant ist nur ein relativer Phasenfaktor zwischen beiden Komponenten. Einen möglichen Repräsentant eines allgemeinen Zustands erhalten wir durch eine Drehung des Zustands aus Gl. 12.10 um einen Winkel α: ! cos α + eiϕ sin α 1 |ψi = √ mit α ∈ [−90◦ , +90◦ ) , ϕ ∈ [−π, +π) . 2 − sin α + eiϕ cos α (12.13) Die Projektion dieser Polarisation auf die Ebene senkrecht zur Ausbreitungsrichtung des Strahls entspricht nun einer Ellipse: Die Längen der beiden Halbachsen sind a = cos( ϕ2 ) und b = | sin( ϕ2 )|. (Für ϕ ∈ [0, π] erhält man eine rechtsdrehende Polarisation, ansonsten eine linksdrehende.) Für ϕ = 0 entartet diese Ellipse zu einer Strecke, für ϕ = π2 erhält man einen Kreis. Der Winkel α beschreibt die Drehung der großen Halbachse relativ zur Diagonalen +45◦ . 12.4 FAQs In diesem Abschnitt greifen wir nochmals typische Fragen zur Quantenmechanik auf und versuchen eine Antwort im Rahmen der Polarisationsfreiheitsgrade von Photonen FAQs 241 zu geben. Die Antworten sind in diesem Fall oft überraschend einfach und offensichtlich, und trotzdem fällt es manchmal schwer, sie trotz der formalen Gleichheiten auch auf andere Phänomene zu übertragen. Weshalb kann man Ort und Impuls nicht gleichzeitig messen? · Ist das Elektron auch ein Teilchen, wenn sein Ort nicht gemessen wird? · Ist der Mond auch da, wenn niemand hinschaut? Hierbei geht es allgemein um das Problem, weshalb komplementäre Observable – oder besser Observable, die nicht miteinander kommutieren – nicht gleichzeitig gemessen werden können und weshalb man einem Quantensystem nicht gleichzeitig solche Eigenschaften zuschreiben kann. Ort und Impuls sind Observable, die durch Operatoren definiert werden, deren Eigenvektoren maximal“ verschieden sind. Bei der linearen Polarisation von Photonen ” gilt das für die Observablen h/v und p/m, bzw. allgemeiner für zwei Orientierungen eines Polarisationsstrahlteilers, die sich um 45◦ unterscheiden. Übertragen auf dieses System lautet die Frage: Weshalb kann man nicht gleichzeitig die h/v- und die p/mPolarisation messen? Nicht nur ist offensichtlich, dass man einen Polarisationsstrahlteiler nicht gleichzeitig in beide Richtungen orientieren kann, sondern es ist ebenfalls einleuchtend, dass einem Photon höchstens nur eine dieser beiden Eigenschaften zugesprochen werden kann. In ähnlicher Weise kann man einem Teilchen auch nicht gleichzeitig die Eigenschaften Ort und Impuls zusprechen. Setzt man die Analogie fort, so ist es unsinnig, von einem (lokalisierten) Teilchen zu sprechen, wenn man ihm beispielsweise einen Impuls zusprechen kann. Ein Elektron mit einem wohldefinierten Impuls hat keinen Ort, ebensowenig wie ein Photon mit einer horizontalen Polarisierung keine wohldefinierte p/m-Polarisation hat. Man sollte daher mit Teilchen“ nicht die Vorstellung ” eines lokalisierten Objekts verbinden. Ob der Mond auch da ist, wenn niemand hinschaut, ist natürlich keine Ernst gemeinte Frage. Und der Mond wird auch einen vergleichsweise wohldefinierten Ort haben, selbst wenn niemand hinschaut. Hier spielt die Dekohärenz eine wichtige Rolle. Ähnlich wie bei Schrödingers Katze geht es eher darum, auf die seltsamen Konsequenzen der Quantenmechanik aufmerksam zu machen, wenn man sie auf makroskopische Gegenstände überträgt. Bei Quantensystemen ist die Zuschreibung einer Eigenschaft eben nur dann sinnvoll, wenn sich das System in einem entsprechenden Eigenzustand befindet. Befindet sich ein Quantensystem in einem reinen Zustand, auch wenn wir diesen nicht kennen? Pauschal ist diese Frage kaum mit ja oder nein zu beantworten. Im Allgemeinen 242 Nochmals Photonenpolarisation wird die Antwort jedoch eher nein lauten. Der Grund ist, dass ein Quantensystem in den meisten Fällen mit anderen Quantensystemen verschränkt sein wird. Ein Photon entstand immer durch die Emission von einem geladenen Teilchen. Meist ist die Polarisationsrichtung des Photons mit einer Polarisationseigenschaft des emittierenden Teilchens (z.B. seinem Spin) verschränkt. Daher kommt in einem solchen Fall dem Photon für sich genommen kein reiner Zustand zu und die Beschreibung durch eine Dichtematrix ist nicht nur reine Unkenntnis. Andererseits wird es ebenfalls oft vorkommen, dass ein Quantensystem aufgrund seiner letzten Wechselwirkungen bestimmte wohldefinierte Eigenschaften hat, ohne dass wir diese kennen. Beispielsweise könnte ein Photon durch einen Polarisationsfilter getreten sein, dessen Orientierung wir aber nicht kennen. In solchen Fällen liegt in ” Wirklichkeit“ ein reiner Zustand vor, wir verwenden aber aufgrund unserer Unkenntnis zur Beschreibung eine Dichtmatrix. ((Weshalb haben einzelne Photonen eine Eigenschaft, die wir Polarisation nennen, welche sich so gut durch die Amplitude einer Welle beschreiben lassen. Das klassische Bild der Welle hat also irgendwie auch noch seine Gültigkeit für einzelne Photonen. Der Strahlteiler plus zusätzlicher Weg erlaubt es zirkulare Polarisationen zu erzeugen. Damit kann man auch die Wellenlänge messen. Ähnlich ist es mit anderen Eigenschaften: Weshalb sind die klassischen Vorstellungen von Ort und Impuls etc. noch gültig für einzelne Quantenobjekte?)) • Ist das Elektron – der Mond – auch da, wenn man nicht hinschaut? • Ist das Elektron ein Teilchen, wenn man seinen Ort nicht beobachtet? Weshalb ist es sinnlos, einem Teilchen einen Ort zuzuschreiben, wenn es einen scharfen Impuls hat? • Ist ein Elementarteilchen – z.B. ein Photon – überhaupt einem reinen Quantenzustand, wenn es nicht in einem solchen präpariert wurde bzw. wenn wir nichts über das Teilchen wissen? • Inwiefern bezeichnet die Wellenfunktion bzw. der Quantenzustand keine Unkenntnis über ein System? • Weshalb können wir den Ort und Impuls eines Teilchens nicht gleichzeitig messen? • Weshalb können wir den Zustand eines Systems (beispielsweise die Polarisation eines Photons) nicht messen? ((Tatsächlich ließe sich ja ein Kristall denken, der ein Teilchen in die Richtung seiner Polarisation ablenkt und dadurch eine Polarisationsmessung ermöglicht)). • Kapitel 13 Probleme, Fragen und Interpretationen Es gibt vermutlich viele Physiker, die behaupten würden, die Quantenmechanik habe keine Probleme. Die Begründungen dieser Aussage fallen dabei sehr unterschiedlich aus. Positivisten stellen sich auf den Standpunkt, dass das Kochrezept“ aus Kapitel ” 5 alle Anforderungen erfüllt, die man an eine physikalische Theorie stellen kann: Es erlaubt prinzipiell die Vorhersage der Ergebnisse von jeder im Rahmen der Quantenmechanik denkbaren Messung an jedem denkbaren System, auf das die Quantentheorie anwendbar ist. Insbesondere ist die Quantentheorie, zumindest soweit sie Wahrscheinlichkeitsaussagen macht, nur auf Systeme anwendbar, die sich beliebig oft in gleichen Zuständen präparieren lassen, und ihre Vorhersagen betreffen dann die relativen Häufigkeiten bestimmter Messergebnisse. Alle Aussagen im Hinblick auf eine physikalische Deutung oder Interpretation der mathematischen Objekte wird als Metaphysik und nicht Teil des formalen Rahmens abgetan. Auf der anderen Seite hat beispielsweise ein Bohmianer“ (ein Anhänger der Bohm’schen Mechanik) ebenfalls keine Grundla” genprobleme mit der Quantenmechanik, die er in einem ontologisch abgeschlossenen und deterministischen Modell beschreibt. Seine Schwierigkeiten sind eher technischer Natur, doch für die praktischen Anwendungen kann er das Kochrezept“ genauso ver” wenden wie jeder andere Physiker auch. Die meisten Physiker, insbesondere wenn sie einer eher traditionellen Interpretation der Quantenmechanik zuneigen, werden vermutlich zustimmen, dass es Grundlagenprobleme der Quantenmechanik gibt. Zumindest das Messproblem bzw. das Kollapsoder Reduktionsproblem dürfte in diesem Zusammenhang genannt werden. Dieses Kapitel soll einen Überblick geben über die Probleme und die Grundlagenfragen, welche die Quantenmechanik (zumindest auf einer Metaebene) offenlässt. Außerdem werden verschiedene Interpretationen bzw. Modelle und Erweiterungen der Quantenmechanik und ihr Umgang mit diesen Fragen und Problemen angesprochen. Dabei kann ich 243 244 Probleme, Fragen und Interpretationen hier kaum auf mehr als die gängigsten Ansätze eingehen: die Kopenhagener Deutung, die Ensemble-Interpretation, Kollapsmodelle, die Many-Worlds-Interpretation und die Bohm’sche Mechanik. Einen recht guten Überblick liefert die Seite Interpretations ” of quantum mechanics“ von Wikipedia sowie viele der dort angegebenen Links und Referenzen (insbesondere enthält der Biographic Guide“ von Cabello [15] eine sehr ” umfangreichen Literaturliste). Was man wissen sollte Man sollte das Messproblem in groben Zügen beschreiben können. Man sollte wissen, was Dekohärenz ist, und welche Aspekte des Messproblems dadurch gelöst werden und welche nicht. Die wesentlichen Züge der verschiedenen Interpretationen und ihre Unterschiede sollte man kennen. Außerdem sollte man die Grundidee der Bohm’schen Mechanik beschreiben können. 13.1 Das Messproblem Das gravierendste unter den Problemen der Quantentheorie, und für viele Physiker überhaupt das einzige wirkliche Problem, ist das Messproblem. Dabei geht es im Wesentlichen darum, dass die Quantenmechanik keine in sich geschlossene Theorie ist, sondern zu ihrer Formulierung die Ankopplung an eine klassische Welt“ braucht, in ” der es keine Superpositionen von Zuständen gibt, insbesondere keine Superpositionen von Messergebnissen. Diese klassische Beschreibung sollte sich aber als Grenzfall aus einer quantentheoretischen Beschreibung ergeben, was jedoch auf Schwierigkeiten stößt. 13.1.1 Allgemeine Charakterisierung Die Axiome der Quantentheorie (vgl. Kap. 5) unterscheiden zwei grundsätzliche Dynamiken, nach denen sich ein quantenmechanischer Zustand verändern kann: (1) die zeitliche Entwicklung durch die Schrödinger-Gleichung (die für abgeschlossene Systeme gelten sollte), und (2) die Reduktion des Quantenzustands nach einer Messung. Das Messproblem entsteht, wenn man den Vorgang der Messung durch eine SchrödingerGleichung beschreiben möchte, indem man das Messgerät als Teil des zu beschreibenden Systems auffasst. Etwas vereinfacht ausgedrückt kann man das Messproblem“ folgendermaßen ” beschreiben: Die Zeitentwicklung abgeschlossener physikalischer Systeme ist deterministisch und folgt der Schrödinger-Gleichung. Der Kollaps (bzw. die Reduktion) eines Quantenzustands nach einer Messung erfolgt nach einem probabilistischen Gesetz und Das Messproblem 245 lässt sich nicht durch eine Schrödinger-Gleichung beschreiben. Trotzdem sollte man von einer Theorie, die den Anspruch erhebt, eine fundamentale Theorie der Naturbeschreibung zu sein, erwarten, dass auch Messgeräte und theoretisch sogar die gesamte Umgebung (der gesamte Kosmos) zumindest im Prinzip durch sie beschrieben werden können. Daher sollte sich auch im Rahmen der Quantenmechanik erklären lassen, weshalb wir nach einer Messung einen reduzierten Zustand wahrnehmen. Die axiomatische Formulierung der Quantentheorie (Kap. 5) bezieht sich auf Messungen“: Es ist von einer Reduktion des Quantenzustands nach einem Messpro” zess, von den möglichen Messwerten und von Wahrscheinlichkeiten, bei einer Messung bestimmte Werte zu finden, die Rede. Bohr hat immer wieder betont, dass wir das Ergebnis von Messungen in der Sprache der klassischen Physik ausdrücken müssen. Die herkömmliche Formulierung der Quantentheorie setzt somit eine Unterteilung der Welt in das untersuchte Quantensystem und ein untersuchendes, klassisch zu beschreibendes System voraus. Dieses klassisch zu beschreibend“ ist ein Muss, kein Kann. ” Doch ohne diese Möglicheit einer geschlossenen quantenmechanischen Beschreibung auch des Messprozesses ist die Quantentheorie zumindest in dieser Hinsicht nur eine phänomenologische Theorie. Die Axiome, die sich auf den Messprozess beziehen, sollten eigentlich aus der Quantenmechanik ableitbar sein. John Bell schreibt dazu [7] The fact [...] that observation implies a dynamical interference, together with the belief ” that instruments after all are no more than large assemblies of atoms, and that they interact with the rest of the world largely through well-known electromagnetic interactions, seems to make this a distinctly uncomfortable level at which to replace analysis by axioms. Die Natur ist uns nicht in zwei Versionen gegeben, und wir können uns nicht aussuchen, ob wir ein physikalisches System als klassisches oder als quantenmechanisches System vorliegen haben möchten. Jedes physikalische System besteht aus atomaren Bestandteilen bzw. Elementarteilchen und muss daher auf diesem Niveau durch eine Quantentheorie beschrieben werden. Was wir als klassische Physik“ bezeichnen, sollte ” sich als Grenzfall aus einer quantentheoretischen Beschreibung ergeben. Wenn wir von einen klassischen System“ sprechen, meinen wir lediglich, dass wir zur Beschreibung ” der uns interessierenden Eigenschaften dieses Systems den Formalismus der klassischen Physik verwenden können. Es gibt also keine klassischen Systeme“ sondern lediglich ” eine klassische Beschreibung eines physikalischen Systems. Damit hängen beim Messprozesse die beiden Probleme – Reduktion des Quantenzustands und die Ankopplung der Quantenmechanik an eine klassische, superpositionsfreie Beschreibung der Welt – eng zusammen. 246 13.1.2 Probleme, Fragen und Interpretationen Mathematische Beschreibung Betrachten wir nun das Problem etwas genauer: Wir unterscheiden dabei zunächst zwei Teilsysteme (später werden wir noch ein drittes System – die Umgebung – mit hinzunehmen): (1) das zu messende Quantensystem (S), und (2) das Messgerät (M), das mit dem Quantensystem in Wechselwirkung steht und schließlich durch eine Zeigerstellung (oder etwas Äquivalentes) Auskunft über den Zustand von S gibt. S wird als Quantensystem beschrieben. M wird zunächst ebenfalls quantenmechanisch beschrieben, soll als makroskopisches System jedoch die klassische Eigenschaft haben, nie in Superpositionszuständen bezüglich seiner Ergebnisanzeige vorzuliegen. Der Anfangszustand des Quantensystems S, X |φiS = αi |si iS , (13.1) i sei eine Superposition bezüglich der Eigenschaften {si }, die von M gemessen werden sollen. Das Messgerät selbst ist zunächst in einem neutralen Anfangszustand |0iM und nimmt die Zustände |ϕi iM ein, wenn S im Zustand |si iS ist. Die Alternativen {ϕi } entsprechen den verschiedenen Zeigerstellungen. Dann ist der Anfangszustand des Gesamtsystems: ! X |Ψi = αi |si iS ⊗ |0iM . (13.2) i Nun findet eine Wechselwirkung zwischen dem Quantensystem S und dem Messgerät M statt, sodass der Zustand des Messgeräts (die Zeigerstellung) mit dem Zustand des Quantensystems korreliert ist: X Wechselwirkung αi |si iS ⊗ |ϕi iM . (13.3) |Ψi −→ i Man beachte, dass jetzt das Quantensystem und das Messgerät einen gemeinsamen, verschränkten Zustand bilden. Nach den Postulaten der Quantenmechanik kommt es nun zu einer Reduktion des Quantenzustands und zwar mit der Wahrscheinlichkeit |αk |2 in den Zustand k: ! X Wechselwirkung Reduktion |Ψi −→ αi |si iS ⊗ |ϕi iM −→ |sk iS ⊗ |ϕk iM . (13.4) i Während der erste Schritt – durch die Wechselwirkung wird der Gesamtzustand von Quantenssytem und Messgerät verschränkt – im Rahmen der Quantentheorie leicht durch eine Schrödinger-Gleichung beschrieben werden kann, ist eine Beschreibung des zweiten Schritts – die Reduktion des Zustands – durch eine Schrödinger-Gleichung nicht möglich. Das wird schon alleine daran offensichtlich, dass der zweite Schritt ein stochastischer ist, während die Schrödinger-Gleichung deterministisch ist. Das Messproblem 247 Die Begründung für den letzten Schritt lautet: Da das Messgerät ein klassi” sches System“ ist (also klassisch zu beschreiben ist), kann es sich nicht in einem Superpositionszustand bezüglich seiner klassischen Eigenschaften (den Zeigerstellungen) befinden sondern muss eine wohldefinierte Zeigerstellung einnehmen. Die Wahrscheinlichkeit dafür ergibt sich nach der Born’schen Regel. Streng genommen ist schon der Zwischenzustand, bei dem das Quantensystem und das Messgerät verschränkt sind, physikalisch nicht realisiert. Hier wird also der Kollaps hineingesteckt. Was hindert uns jedoch, auch das Messgerät (einschließlich der Zeigerstellung) quantenmechanisch zu beschreiben? In diesem Fall, so lautet die herkömmliche Argumentation, haben wir neben dem quantenmechanischen Messgerät noch eine klassisch zu beschreibende Umgebung E (anfänglich im Zustand |ψiE ) zu berücksichtigen. Nun ist der Anfangszustand des Gesamtsystems ! X (13.5) |Ψi = αi |si iS ⊗ |0iM ⊗ |ψiE i und nach der Wechselwirkung liegt der Zustand ! |Ψi Wechselwirkung −→ X αi |si iS ⊗ |ϕi iM ⊗ |ψiE (13.6) i vor. Doch es gibt natürlich auch eine Wechselwirkung zwischen dem Messgerät und der Umgebung, sodass auch der Zustand der Umgebung mit dem Zustand des Messgeräts korreliert wird (beispielsweise wird unser Gehirnzustand mit dem Messgerät korreliert, wenn wir die Zeigerstellung ablesen): ! X Wechselwirkung |Ψi −→ (13.7) αi |si iS ⊗ |ϕi iM ⊗ |ψiE i ! Wechselwirkung −→ X αi |si iS ⊗ |ϕi iM ⊗ |ψi iE (13.8) i Reduktion −→ |sk iS ⊗ |ϕk iM ⊗ |ψk iE . (13.9) Die Argumentation ist ähnlich wie vorher: Während die Messapparatur quantenmechanisch beschrieben wird, ist nun die Umgebung E als klassisches System zu beschreiben und kann daher nicht in einem Superpositionszustand sein. Das Ergebnis ist dasselbe: Nach der Messung liegt ein reiner Zustand vor, bei dem sich das Quantensystem S in dem Zustand |sk i befindet, zu dem das Messgerät die Zeigerstellung ϕk hat und die Umgebung mit diesem Messergebnis konform“ ist. ” Wir sehen somit, dass es keinen Unterschied macht, ob wir den Schnitt“ zwi” schen quantentheoretischer und klassischer Beschreibung zwischen das Quantensystem S und das Messgerät M legen, oder zwischen das Messgerät M und die Umgebung E. 248 Probleme, Fragen und Interpretationen Wir können letztendlich den Schnitt hinlegen, wohin wir wollen, aber irgendwo in unserem Gehirn entsteht das, was wir eine bewusste Wahrnehmung nennen, und diese ist in keinem Superpositionszustand, sondern muss auf der klassischen Beschreibungsseite liegen. 13.1.3 Dekohärenz Wenn wir schon nicht aus der Quantenmechanik ableiten können, wie es zu einer Reduktion des Quantenzustands kommt, können wir zumindest versuchen zu verstehen, weshalb wir nie eine Superposition makroskopischer Eigenschaften (beispielsweise Zeigerstellungen an einem Messgerät) beobachten. Hierzu wurden gerade in den letzten 40–50 Jahren Fortschritte gemacht, die unter der Bezeichnung Dekohärenz“ zusam” mengefasst werden. Vereinfacht ausgedrückt bedeutet dies, dass die möglichen Beiträge in einem Superpositionszustand so verschieden ( dekohärent“) sind, dass keine Inter” ferenzen mehr beobachtet werden. Eine mathematisch scharfe Definition von Dekohärenz ist gar nicht so einfach, und in mehrfacher Hinsicht gleicht dieser Begriff dem der Entropie“ in der klassischen ” statistischen Mechanik. Wird ein Quantensystem durch eine Dichtematrix ρ beschrieben (vgl. Abschnitt 5.9), ist ein mögliches Maß für Dekohärenz sogar durch die von Neumann-Entropie, X S = Sp ρ ln ρ = pi ln pi , (13.10) i gegeben (Sp bezeichnet die Spur der Matrix und {pi } sind die Eigenwerte). Handelt es sich bei ρ um einen reinen Zustand, wäre nach dieser Definition die Entropie und damit das Dekohärenzmaß null. Bedeutet dies, dass ein reiner Zustand |ψi – ausgedrückt z.B. durch einen Projektionsoperator P = |ψihψ| – immer eine verschwindende Dekohärenz hat? Ich möchte im Folgenden eine Definition von Dekohärenz geben, deren Maß auch für reine Zustände von null verschieden sein kann. Während von den Gründern der Quantenmechanik zunächst nur gefordert wurde, dass Observable in der Quantenmechanik durch selbst-adjungierte Operatoren darzustellen sind, hat Dirac auch die umgekehrte Forderung aufgestellt: Alle selbstadjungierten Operatoren sind Observable. Versteht man unter einer Observablen, dass es zu ihr eine realisierbare Messvorschrift geben muss, ist diese Aussage sicherlich falsch. Nur von den wenigsten selbst-adjungierten Operatoren kennen wir die zugehörigen Messvorschriften, und bei Vielteilchensystemen ist es praktisch unmöglich, eine vollständige (maximale) Messung (siehe Abschnitt 5.10) vorzunehmen. Denken wir an ein makroskopisches System mit rund 1023 Teilchen, ist eine vollständige Messung bzw. kontrollierte Beeinflussung des Systems unmöglich. Schrödingers Katze 249 Statt nun alle selbst-adjungierten Operatoren als Observable zu betrachten, wählen wir einen Satz {Ai } von selbst-adjungierten Operatoren, die wir als observabel ansehen. Dieser Satz soll sämtliche Möglichkeiten umfassen, die uns zur Verfügung stehen, auf das System Einfluss zu nehmen bzw. es zu messen“. Der Satz muss nicht ” endlich sein (beispielsweise rechnet Kurt Gottfried in seinem Quantenmechaniklehrbuch [35] alle räumlich lokalen selbst-adjungierten Operatoren zu den Observablen). Wir können nun Äquivalenzklassen von Dichtematrizen definieren, die sich bezüglich dieses Satzes von Operatoren nicht unterscheiden lassen: ρ1 ∼ ρ2 ⇐⇒ Sp ρ1 Ai = Sp ρ2 Ai für alle i . (13.11) Bezüglich aller uns zur Verfügung stehender Observablen sind ρ1 und ρ2 damit gleichwertig. Nun definieren wir als ein Maß für die Dekohärenz eines (reinen) Zustands P die maximale von Neumann-Entropie einer Dichtematrix, die zur selben Äquivalenzklasse wie P gehört, die also durch Observable nicht von P zu unterscheiden ist. Der Vorteil dieser Definition, auch auf reine Zustände anwendbar zu sein, ist durch den Nachteil erkauft, dass Dekohärenz – zumindest im Prinzip – nur relativ zu einer Observablenmenge definiert wird. Dies gilt aber auch für die meisten Definitionen der Entropie in der klassischen statistischen Mechanik. Die Idee hinter der Reduktion, die in Gl. 13.9 vorgenommen wurde, ist nun folgende: Die durch |ψiE beschriebenen Umgebungsvariablen bezeichnen die Freiheitsgrade, die von uns nicht beobachtet bzw. beeinflusst werden können. Damit lassen sich auch keine Interferenzen zwischen verschiedenen |ψi i nachweisen und diese Zustände erscheinen wie klassische Zustände. Allerdings ist die Reduktion damit immer noch nicht geklärt. Wie John Bell in einer seiner berühmten Kritiken am Messprozess betonte [7], handelt es sich immer noch um eine Superposition (im Sinne eines logischen UNDs) von verschiedenen Möglichkeiten und nicht um klassische Alternativen (im Sinne logischer ODERs): The idea that elimination of coherence, in one way or another, implies the replacement of ‘and’ by ‘or’, is a very common one among solvers of the ‘measurement problem’. Tatsächlich betrachten die meisten Physiker heute die Dekohärenz nicht als Erklärung für das Kollapspostulat, sondern nur als Erklärung für die fehlende Interferenz zwischen makroskopisch verschiedenen Möglichkeiten. Damit wurde zwar geklärt, weshalb wir eine klassische Welt wie bei einem reduzierten, reinen Zustand wahrnehmen, nicht aber, weshalb der quantenmechanische Zustand tatsächlich dieser reduzierte Zustand sein soll. Eine extreme Folgerung aus dem Gesagten führt unweigerlich auf die Viel-Welten-Theorie (siehe Abschnitt 13.5.3). 250 13.2 Probleme, Fragen und Interpretationen Schrödingers Katze In seinem berühmten Artikel von 1935 [67], der eine Art Bestandsaufnahme der Quantenmechanik nach dem Artikel von Einstein, Podolsky und Rosen [24] darstellte, argumentiert Schrödinger, dass wir die Quantenmechnik nicht vollständig von der klassischen Physik trennen können. Es war damals oft der Einwand vorgebracht worden, dass die Quantenmechanik nur atomare Vorgänge betrifft und daher keinerlei Einfluss auf makroskopische Phänomene haben könne. Schrödinger wollte durch sein etwas makabres Beispiel deutlich machen, dass diese Meinung falsch ist, Quanteneffekte also durchaus einen makroskopischen Einfluss haben können. Schrödinger selbst gibt folgendes Beispiel: Man kann auch ganz burleske Fälle konstruieren. Eine Katze wird in eine Stahlkammer gesperrt, zusammen mit folgender Höllenmaschine (die man gegen den direkten Zugriff der Katze sichern muß): in einem Geigerschen Zählrohr befindet sich eine winzige Menge radioaktiver Substanz, so wenig, daß im Lauf einer Stunde vielleicht eines von den Atomen zerfällt, ebenso wahrscheinlich aber auch keines; geschieht es, so spricht das Zählrohr an und betätigt über ein Relais ein Hämmerchen, das einen Kolben mit Blausäure zertrümmert. Hat man dieses ganze System eine Stunde lang sich selbst überlassen, so wird man sich sagen, daß die Katze noch lebt, wenn inzwischen kein Atom zerfallen ist. Der erste Atomzerfall würde sie vergiftet haben. Die ψ-Funktion des ganzen Systems würde das so zum Ausdruck bringen, daß in ihr die lebende und die tote Katze (s.v.v.) zu gleichen Teilen gemischt oder verschmiert sind. Natürlich bezeichnet man es allgemein als absurd, dass die Katze gleichzeitig in einem Superpositionszustand aus tot“ und lebendig“ existieren soll, und erst die Be” ” obachtung, beispielsweise durch das Öffnen der Kammer, zu einer Reduktion auf tot“ ” oder lebendig“ führt. Meist wird argumentiert, dass schon lange bevor ein Beobachter ” die Kammer öffnet, das makroskopische Innere der Kammer durch Dekohärenzeffekte in einen reinen Zustand übergegangen ist, doch damit ist das Problem nicht gelöst: Wenn die Kammer vollkommen von ihrer Umgebung isoliert, d.h. keinerlei Wechselwirkung (auch nicht indirekt über die Bestandteile der Kammerwand) zwischen dem Inneren der Kammer und der Umgebung des Beobachters möglich ist, sollte die Kammer als Gesamtsystem immer noch durch einen Superpositionszustand beschrieben werden. Wie schon im letzten Abschnitt betont wurde, führen Dekohärenzeffekte lediglich dazu, dass keinerlei Interferenzen zwischen den beiden Möglichkeiten mehr nachweisbar sind, nicht aber zu einer Reduktion auf eine der beiden Möglichkeiten. Gelegentlich wurde auch folgende Variante vorgeschlagen, mit der angeblich der Unterschied zwischen Superposition und reinem Zustand nachgewiesen werden kann: Statt der Katze befinde sich in der Kammer eine Uhr, die durch einen geeigneten Mechanismus durch den Geigerzähler gestoppt wird, sobald das Atom zerfallen ist. Öffnet man nun den Kasten, kann man an der Uhr ablesen, wann das Atom zerfallen ist und somit nachweisen“, dass eventuell schon seit längerem kein Superpositionszustand ” Das Zeigerbasis-Problem 251 mehr vorliegt. Dieses Argument ist aber falsch: Bei völliger Isolierung der Kammer befindet sich das System nach dem Formalismus der Quantentheorie in einer Superposition aus (nahezu beliebig) vielen Zuständen: zu jedem möglichen Zerfallszeitpunkt und damit zu jeder möglichen Zeigerstellung der Uhr einer. Durch die Beobachtung wird aus diesem verschmierten Kontinuum an superponierten Zuständen einer zum Fakt, und das kann auch ein Zustand sein, bei dem die Uhr schon vor langer Zeit angehalten wurde. Letztendlich ist Schrödingers Katze also nur eine besondere Variante des Messproblems, auch wenn Schrödinger sein Beispiel ursprünglich für eine andere Argumentation gedacht hatte. 13.3 Das Zeigerbasis-Problem Wir haben bei der Formulierung des Messproblems sehr suggestiv eine Entwicklung des Quantenzustands nach einer Basis vorgenommen, bezüglich der ein (klassisch zu beschreibendes) Messgerät seine verschiedenen Zeigerstellungen einnimmt. Doch was zeichnet diese Basis aus? Anders ausgedrückt, weshalb dekohäriert der Quantenzustand eines Messgeräts gerade bezüglich der Zeigerbasis? Betrachten wir nochmals Gleichung 13.4: ! X Wechselwirkung Reduktion −→ |sk iS ⊗ |ϕk iM . (13.12) |Ψi −→ αi |si iS ⊗ |ϕi iM i Wir entwickeln nun jeden Eigenzustand zur Zeigerbasis |ϕi iM nach einer anderen Basis: X bia |φa iM (13.13) |ϕi iM = a und setzen diese Entwicklung in den verschränkten Zustand unmittelbar nach der Wechselwirkung zwischen Messgerät und Quantensystem ein: ! X X X i αi |si iS ⊗ |ϕi iM = αi |si iS ⊗ ba |φa iM (13.14) i a i ! = X X a bia αi |si iS ⊗ |φa iM . (13.15) i Derselbe verschränkte Zustand erlaubt also einmal eine Entwicklung bezüglich der Zeigerbasis {|ϕi iM } des Messgeräts und einmal eine Entwicklung nach der Basis {|φa iM }. Dabei braucht uns die Tatsache, dass im Allgemeinen X |σa iS = bia αi |si iS (13.16) i 252 Probleme, Fragen und Interpretationen keine Orthonormalbasis ist, nicht weiter zu stören. Erstens gibt es Transformationen der genannten Art, die wieder auf Orthonormalbasen führen, und zweitens muss die Entwicklung eines Quantenzustands nicht nach einer Orthonormalbasis erfolgen. Schauen wir uns jetzt die Entwicklung (Gl. 13.15) an, so könnte die Dekohärenz ebensogut nach der neuen (makroskopischen) Basis {|φa iM } erfolgen. Was zeichnet die Zeigerbasis aus, dass der Gesamtzustand bezüglich der Zeigerbasis dekohäriert? Auch wenn noch nicht alle Einzelheiten dieser Frage gelöst und verstanden sind, herrscht doch ein gewisser Konsens, dass die Art der Wechselwirkungen zwischen physikalischen Objekten diese Basis festlegt. Die bezüglich der Ortsraumbasis lokale Form der Kopplungen zwischen den Elementarteilchen (bedingt durch die relativistische Invarianz der Theorie) könnte auch die Ortsraumbasis auszeichnen, sodass eine Dekohärenz durch die Wechselwirkung mit der Umgebung bezüglich der räumlich verschiedenen Zeigerstellungen erfolgt. 13.4 Die Kopenhagener Deutung Obwohl die sogenannte Kopenhagener Deutung“ oft als die gängige Interpretation ” der Quantenmechanik bezeichnet wird, gibt es eigentlich keine scharfe Definition, was darunter genau zu verstehen ist. Man kann bestenfalls eine Sammlung von Konzepten angeben, die von den meistern Physikern als kennzeichnend für die Kopenhagener Deutung angesehen werden. Dazu zählen in jedem Fall die in Kap. 5 angegebenen Postulate, insbesondere das Kollapspostulat und die Born’sche Regel, die das Quadrat von Skalarprodukten als Wahrscheinlichkeiten deutet. Neben den schon behandelten Postulaten gehört zur Kopenhagener Deutung aber noch ein gewisser interpretatorischer (philosophischer) Unterbau. Diese Vorstellungen entstanden im Wesentlichen aus den gemeinsamen Arbeiten von Bohr und Heisenberg im Jahre 1927 in Kopenhagen und wurden auf der Solvay Konferenz im Oktober 1927 von ihnen vertreten und (teilweise gegen den Widerstand von Einstein, Schrödinger, Planck, deBroglie und anderen) durchgesetzt. Die folgenden Konzepte spielen dabei eine herausragende Rolle: - Komplementarität Auf die Bedeutung des Komplementaritätsbegriffs für die philosophischen Vorstellungen von Bohr sind wir schon kurz eingegangen (S. 108). Für ihn handelte es sich dabei um ein grundlegendes Konzept der Naturerkenntnis, das er auch in vielen anderen Bereichen zu erkennen glaubte. Eng verknüpft mit der Komplementarität war für Bohr ein relationales“ Naturverständnis, das es nur erlaubt, ” Eigenschaften eines Systems relativ zu einer Beobachtungssituation zu verstehen. - Der Bezug auf eine klassische Welt Die Kopenhagener Deutung 253 Auf diesen Aspekt sind wir schon im Zusammenhang mit dem Messprozess eingegangen (Abschnitt 13.1). Bohr betonte immer, dass wir über das Ergebnis von Messungen oder Experimenten ausschließlich in der Sprache der klassischen Physik reden können. Diese Eindeutigkeit klassischer Zustände bezüglich beliebiger Observabler (das Fehlen jeglicher Superpositionen) ist für Bohr unumgänglich, um über Physik sprechen zu können. Letztendlich war es vielleicht die einzige Möglichkeit, das Problem der Reduktion des Quantenzustands zu umgehen. Man könnte sagen, dass es eine Quantentheorie für ein abgeschlossenes System gar nicht gibt, bzw. seine Formulierung nicht bekannt ist. Die Quantentheorie in der Kopenhagener Deutung ist immer eine Quantentheorie von offenen Systemen, die an eine klassisch zu beschreibende Umgebung ankoppeln. - Die Born’sche Regel als Ausdruck einer ontologischen Wahrscheinlichkeit Das Wesen von Wahrscheinlichkeit“ ist immer noch Gegenstand unzähliger phi” losophischer Diskussionen. Die Mathematik hat sich mit der Aufstellung der Kolmogorow’schen Axiome insofern dieser Diskussion entzogen, als sie gar nicht mehr den Anspruch erhebt zu erklären, was Wahrscheinlichkeit ist. Sie legt nur fest, welche Eigenschaften eine bestimmte mathematische Struktur haben muss, damit man von einer Wahrscheinlichkeit sprechen darf. Insbesondere in der Naturphilosophie wird viel diskutiert, ob es eine ontologische (objektive) Wahrscheinlichkeit überhaupt geben kann, oder ob nicht jede Wahrscheinlichkeitsaussage nur ein Ausdruck über unsere Unkenntnis zu einem bestimmten Sachverhalt ist. In ihrer gewöhnlichen (Kopenhagener) Deutung verletzt die Quantenmechanik das Prinzip vom hinreichenden Grund von Leibniz: Selbst nachdem ein bestimmter experimenteller Sachverhalt festgestellt wurde (z.B. die Ablenkung eines Elektrons in einem Stern-Gerlach-Mageneten in eine bestimmte Richtung) ist es prinzipiell unmöglich Gründe dafür anzugeben, weshalb das Elektron nach oben und nicht nach unten abgelenkt wurde (sofern es nicht in einem entsprechenden Zustand präpariert wurde). Für die Quantenmechanik sind die Wahrscheinlichkeitsaussagen ontologischer Natur. Das bekannte Einstein’sche Diktum Gott würfelt nicht“ bringt sein Un” behagen in diesem Zusammenhang zum Ausdruck. Es war immer schon das Ziel von Modellen mit verborgenen Variablen, den ontologischen Indeterminismus zu einem rein epistemischen Indeterminismus (also nur unserer Kenntnis entzogenen Determinismus) zu machen. Dass etwas ohne irgendeinen Grund geschehen soll, ist für viele aus philosophischen Gründen undenkbar, doch genau das behauptet die traditionelle Deutung der Quantentheorie. 254 Probleme, Fragen und Interpretationen - Die Heisenberg’schen Unschärferelationen Während Bohr meist den Begriff der Komplementarität in den Vordergrund stellte, wenn er das Besondere an der Quantenmechanik betonen wollte, waren es für Heisenberg eher die Unbestimmtheits- bzw. Unschärferelationen (siehe Abschnitt 5.8). Zu Beginn – sicherlich vor 1930 – war Heisenberg der Überzeugung, dass die Unschärferelationen ein Ausdruck der unkontrollierbaren Einwirkungen eines Messgeräts auf ein zu messendes System darstellten. Erst später kam auch er zu der Überzeugung, dass die Eigenschaften, deren Unbestimmtheit in die Relationen eingehen, tatsächlich als solche gar nicht schärfer definierbar sind. Es geht nicht um eine Unkenntnis, beispielsweise des Ortes eines Teilchens, sondern darum, dass es überhaupt keinen Sinn macht, einem Teilchen das Konzept Ort“ ” in einer präziseren Weise zuzuschreiben, als es die Unschärferelationen erlauben. Ein Teilchen“ mit einem scharfen Impuls hat gar keinen Ort. ” - Das Korrespondenzprinzip Wie so viele Konzepte, die über eine rein mathematische Struktur hinausgehen, gibt es auch keine präzise Formulierung, was genau das Korrespondenzprinzip aussagt. Allgemein stellt es eine Beziehung zwischen der Quantentheorie und der klassischen Theorie her. Meist versteht man unter dem Korrespondenzprinzip die (sicherlich nicht selbstverständliche) Tatsache, dass die klassischen Observablen – Ort, Impuls, Energie, Drehimpuls, etc. – auch in der Quantenmechanik noch sinnvolle Konzepte darstellen. Weshalb sollte der Energieoperator in der Quantenmechanik dieselbe Funktion der Orts- und Impulsoperatoren sein, wie die Abhängigkeit der klassischen Energie von Ort und Impuls? Wenn wir von Quantisierung“ sprechen, meinen wir damit oft die Formulierung ” einer Quantentheorie, ausgehend von einer klassischen Theorie. Die Vorschrift besteht im Wesentlichen aus der Ersetzung der klassischen Observablen x und p durch Operatoren Q und P – ebenso für andere Observable f (x, p) → f (Q, P ) (bis auf die schon angesprochenen Ordnungsprobleme, siehe S. 97) – sodass die klassischen Bewegungsgleichungen nun für die Operatoren gelten und die Kommutatorbeziehungen dieser Operatoren sich aus den klassischen PoissonKlammern ergeben. Streng genommen sollte sich aber die Quantentheorie nicht aus der klassischen Theorie ergeben, sondern die klassische Theorie sollte ein Grenzfall der Quantentheorie sein. Die Idee der Quantisierung“ ist also eigentlich die Folgende: Die genannte Vor” schrift erlaubt es, aus einer klassischen Theorie eine Quantentheorie zu formulieren, welche die Eigenschaft hat, in einem (zu definierenden) klassischen Grenzfall wieder die klassische Theorie zu ergeben. Ein wesentliches Element dabei ist, Weitere Interpretationen 255 dass die Erwartungswerte quantenmechanischer Operatoren bei dieser Quantisierungsvorschrift wieder die klassischen Bewegungsgleichungen bzw. die klassischen Beziehungen zwischen Observablen erfüllen (siehe Abschnitt 7.3.2). Daher bezeichnet man auch diese Tatsache manchmal als Korrespondenzprinzip. Während für die Gründungsväter der Quantenmechanik das Korrespondenzprinzip eine herausragende Rolle spielte, ist es heute in erster Linie in der Quantisierungsvorschrift von Bedeutung. Allgemein ungeklärt ist aber die Frage, ob die Quantisierungsvorschrift (abgesehen von den Ordnungsproblemen) immer eindeutig ist. Die Formulierung einer Quantengravitation scheint sich z.B. nicht so ohne weiteres aus einer kanonischen Quantisierung der Allgemeinen Relativitätstheorie in der üblichen Form zu ergeben. 13.5 Weitere Interpretationen 13.5.1 Ensemble-Interpretation Die Quantenmechanik erlaubt größtenteils nur Wahrscheinlichkeitsaussagen bezüglich zukünftiger Ereignisse, z.B. Messergebnissen. Will man Wahrscheinlichkeitsaussagen experimentell prüfen, muss man sehr viele Experimente unter möglichst gleichen Bedingungen vornehmen und die relativen Häufigkeiten der Resultate bestimmen. Daher lässt sich die Quantenmechanik nur an Ensembles von gleichartig präparierten Systemen überprüfen. Bedeutet dies, dass die Quantenmechanik auch nur auf Ensembles von gleichartig präparierten System angewandt werden darf, also für Einzelsysteme überhaupt keine Gültigkeit in Anspruch nehmen kann? Vertreter einer Ensemble-Interpretation behaupten genau dies. Der Quantenzustand beispielsweise eines Elektrons beschreibt nach dieser Vorstellung gar kein einzelnes Elektron, sondern nur ein Ensemble von gleichartig präparierten Elektronen. Damit werden die Aussagen der Quantenmechanik zu Aussagen über relative Häufigkeiten. Der Begriff der Wahrscheinlichkeit tritt in einer strengen EnsembleInterpretation überhaupt nicht mehr auf. Die relativen Häufigkeiten beziehen sich auf die Ensembles von Systemen nach einer Messung, die jeweils die verschiedenen erlaubten Messwerte ergeben haben. Damit ist allerdings auch das Kollapsproblem bzw. das Messproblem gelöst. In gewisser Hinsicht ist es der Experimentator selbst, der diesen Kollaps“ bewirkt, ” nämlich durch seine Entscheidung, aus dem Gemisch von Ensembles nach einer Messung (das beispielsweise durch eine Dichtematrix beschrieben wird) ein einzelnes Ensemble von Systemen mit einer wohldefinierten Eigenschaft für weitere Experimente herauszunehmen. In seinem bekannten Lehrbuch zur Quantenmechanik [19] schreibt 256 Probleme, Fragen und Interpretationen Dawydow zur Änderung“ der Wellenfunktion nach einer Messung: In diesem Fal” le handelt es sich eigentlich nicht um eine Änderung der Wellenfunktion, sondern es wird vielmehr eine Wellenfunktion durch eine andere ersetzt, weil die Aufgabenstellung geändert wird – es ändern sich die Anfangsbedingungen. Überhaupt war die EnsembleInterpretation gerade unter den sowjetischen Physikern der Nachkriegszeit (Dawydow, Blochinzew, Fock) weit verbreitet und galt als die einzige Interpretation, die im Einklang mit einem realistischen, marxistisch-leninistischen Materialismus“ steht. ” Durch die Einschränkung der Anwendbarkeit der Quantentheorie ausschließlich auf Ensembles von gleichartig präparierten Systemen fällt es jedoch schwer, die Quantenmechanik als eine fundamentale Theorie anzusehen. In diesem Sinne war vermutlich auch Einstein ein Anhänger der Ensemble-Interpretation. Für ihn war die Quantentheorie lediglich eine phänomenologische Theorie, und er hatte immer gehofft, dass sich eine fundamentale Theorie im Einklang mit seiner Vorstellung von objektivem Realismus finden lassen würde. 13.5.2 Subjektive Deutungen und QBism Scheinbar vollkommen entgegengesetzt zu der materialistischen Ensemble-Interpretation, und doch konzeptuell eng mit ihr verwandt, sind verschiedene Formen von subjektiven Deutungen der Quantentheorie. All diesen Formen gemein ist die Interpretation der Wellenfunktion bzw. des Quantenzustands als eine Kodierung unseres ” Wissens“ bzw. unserer Erwartungen über die Welt. Die Wellenfunktion (bzw. genauer der Quantenzustand) enthält das gesamte Wissen, das wir über die Vergangenheit (d.h. die Präparation) eines Systems haben. Sie hat damit einen ähnlichen Status wie eine klassische Wahrscheinlichkeitsverteilung, die im Grunde unsere Teilkenntnis über ein System zum Ausdruck bringt, aber keinen ontologischen Status hat. Auch in der klassischen Physik findet ein Kollaps“ statt, nämlich wenn ein Experiment oder ” Versuch ausgeführt wurde (beispielsweise ein Würfel geworfen wurde) und aus den anfänglichen Möglichkeiten eine bestimmte realisiert wird. In gewisser Hinsicht gehörten auch Vertreter der Kopenhagener Deutung zu dieser Gruppe, beispielsweise Schrödinger, der die Wellenfunktion als Katalog der ” Erwartungen“ bezeichnet [67], oder Bohr in seiner berühmten Anwort auf den EPRArtikel, wo er die Reduktion des Quantenzustands nach einer Messung als influence ” on the very conditions which define the possible types of predictions regarding the future behavior of the system“ beschreibt [11]. Auch Heisenberg hat sich, zumindest in späteren Jahren, dieser Meinung angeschlossen. Er schreibt in den 60er Jahren in einem Brief an Renninger (aus [66]): Der Akt der Registrierung andererseits, der zur Zustandsreduktion führt, ist ja nicht ein physikalischer, sondern sozusagen mathematischer Vorgang. Mit der unstetigen Änderung unserer Kenntnis ändert sich natürlich Weitere Interpretationen 257 auch die mathematische Darstellung unserer Kenntnis unstetig. Auch in dieser Interpretation hat die Zustandsreduktion nach einer Messung somit eine elegante Lösung erfahren. Das eigentliche Problem dieser subjektiven Interpretationen lautet: Bezieht sich unser Wissen auf etwas? Gibt es eine ontologische Realität, über die wir ein gewisses Wissen haben können, das wir dann durch den Quantenzustand kodieren? Wenn ja“, dann übertragen sich die Probleme mit dem Kollaps oder die Nicht-Lokalität ” bei EPR etc. auf dieses ontologische Etwas, und wir haben eigentlich nichts gelöst. Falls nein“, dann landen wir im Extremfall bei einem Solipsismus, zumindest aber ” bei einem Idealismus im Sinne von Berkeley. Eine moderne Variante dieser subjektiven Interpretation des Quantenzustands ist QBismus“ (eine Kurzform von Quanten-Bayesianismus). Der Ursprung dieser In” terpretation liegt in einer Arbeit von Carlton M. Caves, Christopher Fuchs und Ruediger Schack aus dem Jahr 2002 [17]. Heute gilt Christopher Fuchs als ihr Hauptvertreter. In zweifacher Hinsicht unterscheidet sich dieser Zugang von den älteren subjektiven Deutungen: (1) Wahrscheinlichkeit wird nicht im klassisch-wissenschaftlichen Sinne als relative Häufigkeit von Ereignissen, sondern im Bayes’schen Sinne als belief function“, ” also als ein Maß für die subjektive Überzeugung bzw. den Glauben einer Person an das Eintreffen eines Ereignisses, interpretiert. Quantifizieren lässt sich diese Funktion (bis zu einem gewissen Grad) durch die Wettbereitschaft einer Person bei einer bestimmten Auszahlungsquote. Damit umgeht man Probleme mit Ereignissen, die sich nicht beliebig oft reproduzieren lassen (was streng genommen ohnehin für kein Ereignis gilt). (2) Die mathematische Formulierung beruht nicht auf einer Wahrscheinlichkeit im Sinne von Kolmogorov, sondern wird durch symmetric, informationally-complete, ” positive operator-valued measures (SIC-POVMs)“ ausgedrückt. Dabei handelt es sich um eine operatorwertige Maß- bzw. Wahrscheinlichkeitstheorie; Ereignismengen werden also bestimmte Operatoren und nicht klassische Wahrscheinlichkeiten zugeordnet. Letztendlich bleibt aber die Frage, ob sich dieser Glauben“ auf etwas Reales“ bezieht ” ” – und wenn ja, auf was. 13.5.3 Many-Worlds Die Many-Worlds- oder auch Vielwelten-Theorie gehört zu den polarisierendsten Interpretationen der Quantenmechanik. Die meisten Physiker, die sich mit Grundlagenproblemen beschäftigen, sind entweder Anhänger dieser Interpretation, oder aber sie gehören zu den entschiedenen Gegnern und bezeichnen sie als vollkommen absurd“. ” Nach der Vielwelten-Theorie kommt es überhaupt nicht zu einem Kollaps. Die Ontologie dieser Welt ist eine Wellenfunktion (bzw. ein Quantenzustand). Diese entwickelt sich nach der Schrödinger-Gleichung - fertig! Es findet nie ein Kollaps statt; 258 Probleme, Fragen und Interpretationen damit ist dieses Axiom überflüssig. Dass wir scheinbar einen reduzierten Quantenzustand wahrnehmen, liegt an der Dekohärenz verschiedener Zweige der Wellenfunktion. Alle diese Zweige (bzw. Universen, denen diese Zweige entsprechen) sind ebenso re” al“ wie der, den wir wahrnehmen. Die Wellenfunktion des Universums verzweigt sich ständig und im Grunde genommen kann man sagen, dass sich alle Universen, die sich seit Anbeginn des Kosmos hätten entwickeln können, auch tatsächlich entwickelt haben. In jeder Sekunde spaltet sich die Wellenfunktion unseres Universums in unzählige neue Zweige auf, und wir befinden uns in jedem dieser Zweige und haben in jedem das Gefühl, nur eine einzige Realisierung des Universums wahrzunehmen. Der Urspung dieser Interpretation liegt in einer Arbeit von Hugh Everett aus dem Jahre 1957 [27]. Bekannt gemacht (und auch die Bezeichnung Many-Worlds eingeführt) hat sie Bryce Seligman DeWitt rund 15 Jahre später [21]. Während Everett in seiner Arbeit daran interessiert war, die Entwicklung der Wellenfunktion aus einer externen Sicht zu beschreiben (und den physikalischen Beobachter als Teil der Welt, die von der Wellenfunktion repräsentiert wird, ansah), war DeWitt an einer Quantentheorie (Quantengravitation) des gesamten Kosmos interessiert. Er hatte wenige Jahre zuvor die Wheeler-DeWitt-Gleichung für ein solches kosmologisches Modell entwickelt und brauchte nun die Interpretation von Everett, die den Beobachter als Teil des Quantensystems auffasst. Im Grunde genommen ist die Vielwelten-Theorie das notwendige Ergebnis einer konsequenten, allumfassenden Anwendung der Quantentheorie. Wenn die SchrödingerGleichung den Quantenzustand des gesamten Universums beschreibt, dann kann es nicht zu einem Kollaps kommen. Die Dekohärenztheorie erklärt, weshalb wir trotzdem einen reduzierten Zustand wahrzunehmen glauben. Trotz dieser lediglich bis zu Ende gedachten Konsequenzen aus der herkömmlichen Formulierung der Quantentheorie, gilt die Vielwelten-Theorie für die meisten Physiker als absurd oder okkult. Allerdings gibt es keine wissenschaftlichen Argumente gegen diese Interpretation. Die einzige (eher technische) Einschränkung ist, dass die Born’sche Regel keine unmittelbare Folgerung aus der konsequenten Anwendung der Schrödinger-Gleichung ist, sondern in Form eines Maßes auf dem Raum aller Möglichkeiten“ einer Zusatzannahme bedarf. ” Absurd erscheint natürlich den meisten Gegnern, dass jedes Ich“ in beliebig ” vielen Kopien bzw., im wahrsten Sinne des Wortes, allen möglichen Kopien“ existiert. ” Der Nobelpresiträger Antony J. Leggett meinte bei einem Vortrag in Freiburg dazu [52]: Well, I wish I could say something intelligent about that interpretation, but I guess I can’t, and the reason is quite simply that quite literally I do not understand it. And I mean that very, very literally. When it is said by the adherents of this interpretation that these so-called parallel universes are “equally real” to the ones I think I inhabit, those words “equally real” sound like English. What do they actually suppose to mean? I really think that it is impossible to attach any intelligible meaning to that statement. 13.6. KOLLAPSMODELLE 13.6 259 Kollapsmodelle Da das Reduktionsproblem im Rahmen der herkömmlichen Formulierung der Quantenmechanik unvermeidbar zu sein scheint, wurden viele Ansätze entwickelt, die Quantenmechanik um einen dynamischen Kollapsprozess“ zu erweitern. Der Formalismus ” der Quantentheorie, insbesondere die Schrödinger-Gleichung, müssen dazu explizit abgeändert werden. Bei den meisten dieser Ansätze wird die Schrödinger-Gleichung um einen Term erweitert, der nicht-linear von der Wellenfunktion abhängt und dynamisch zu einem Kollaps führt. Solche Modelle machen Vorhersagen, die auf bestimmten Skalen von der quantenmechanischen Beschreibung abweichen, allerdings sind solche Abweichungen bis heute noch nicht experimentell nachweisbar. Die Modelle unterscheiden sich im Wesentlichen in der Natur der Entität, die den Kollaps der Wellenfunktion bewirkt. Bei den im Folgenden kurz skizzierten Modellen sind das (1) das Bewusstsein, (2) die Gravitation und (3) stochastische Kollapszentren. Der Vorteil solcher dynamischer Kollapsmodelle liegt darin, dass sie zu ihrer Formulierung keine klassische Welt“ oder einen Beobachter“ fordern müssen. Sie ” ” sind in diesem Sinne also konsistente Theorien, ähnlich wie die Bohm’sche Mechanik, auf die im nächsten Abschnitt eingegangen wird. 13.6.1 Wigner und der Einfluss des Bewusstseins Erste Versuche in dieser Richtung gehen auf Eugene Paul Wigner (1902–1995) zurück: Er glaubte, dass Bewusstseinsprozesse dynamisch auf die Wellenfunktion einwirken könnten und zu einer Reduktion führten. Er postulierte dazu eine Wechselwirkung zwischen herkömmlicher Materie und der Entität“ (Geist?), die er als Träger von ” Bewusstsein ansah. Dabei stieß er allerdings auf gewisse Paradoxien. Eine dieser Paradoxien wurde unter der Bezeichnung Wigners Freund“ be” kannt: Nach einer Messung an einem Quantensystem (bei der sich System und Messgerät in einem verschränkten Zustand befinden) liest ein erster Beobachter das Messgerät ab. Durch sein Bewusstsein reduziert sich der Zustand. Wie beschreibt nun ein zweiter Beobachter, der das Ergebnis noch nicht kennt, den Zustand? Sind für ihn nun das Quantensystem, das Messgerät und der erste Beobachter in einem verschränkten Superpositionszustand und erst durch seine Kenntnisnahme wird der Zustand reduziert, oder hat bereits der erste Beobachter eine allgemeine Reduktion herbeigeführt? Noch verwirrender wird die Lage, wenn der zweite Beobachter nicht weiß, dass das Ergebnis schon von einem ersten Beobachter abgelesen wurde. Er verwendet eine unreduzierte Wellenfunktion zur Beschreibung des Systems, der erste Beobachter eine reduzierte. Experimentell lässt sich kein Widerspruch herbeiführen: Man kann nicht messen, ob eine Wellenfunktion schon reduziert ist. Nimmt man Wigners Theorie des Bewusstseinseinflusses auf ein System Ernst, 260 Probleme, Fragen und Interpretationen stellt sich auch die Frage, was genau Bewusstsein ist? Würde schon das Bewusstsein einer Katze, die zwar den Zeiger am Messgerät betrachten, allerdings aus dem Beobachteten vermutlich keine Schlüsse ziehen kann, den Kollaps herbeiführen? Oder Bedarf es einer gewissen Intelligenz und insbesondere eines Verständnisses, was die Zeigerstellung aussagt? Befand sich das Universum für viele Milliarden Jahre in einer Superposition, bis ein erstes Wesen mit ausreichendem Bewusstsein die Welt beobachtete? Wigner hat sich in den 70er Jahren von seine Vorstellungen distanziert, nachdem er mit den Dekohärenztheorien vertraut wurde. Ein heutiger Anhänger der Idee, dass eine Wechselwirkung zwischen Bewusstsein und Materie zur Reduktion des Quantenzustands führt, ist Henry Stapp [71]. 13.6.2 Die Gravitation als Auslöser der Reduktion Viele Physiker sind der Meinung, dass die Quantentheorie nicht vollständig ist, solange die Gravitation bzw. die Geometrie der Raumzeit nicht Teil des Formalismus’ geworden sind, und dass eine Einbeziehung der Gravitation auch das Problem der Quantenzustandsreduktion lösen wird. Erste Ansätze gehen hier auf Frigyes (Fritzi) Károlyházy (1929-2012) zurück [46]. Später wurde eine ähnliche Idee von Roger Penrose entwickelt [62]. Will man Gravitation in die Quantentheorie einbeziehen, muss man (nach den gängigen Vorstellungen) auch Superpositionszustände bezüglich der Geometrie der Raumzeit zulassen. Befindet sich beispielsweise ein Teilchen in einem Superpositionszustand zu verschiedenen Orten (wie z.B. beim Doppelspaltexperiment), so muss dieser Zustand verschränkt sein mit einer Raumzeitgeometrie zu unterschiedlichen Krümmungen. Die Annahme ist nun, dass die Gravitation solche Superpositionszustände über ein gewisses Maß hinaus nicht zulässt und damit auch zu einer dynamischen Reduktion des Superpositionszustands der Materie führt. In diesen Modellen wird die Grundidee der Quantentheorie also abgeändert, indem nicht-lineare Effekte (in diesem Fall induziert durch die Gravitation) zu einem Kollaps der Wellenfunktion führen. 13.6.3 GRW – stochastische Kollapszentren Im Jahre 1985 formulierten Giancarlo Ghirardi, Alberto Rimini und Tullio Weber [33] ebenfalls ein dynamisches Kollapsmodell, bei dem die Schrödinger-Gleichung um einen in der Wellenfunktion nicht-linearen stochastischen Term erweitert wird. Dieser zusätzliche Term beschreibt den Einfluss von stochastisch im Raum verteilten Kollapszentren auf die Wellenfunktion. Trifft die Wellenfunktion auf eines dieser Kollapszentren, kommt es zu einer dynamischen Reduktion um dieses Zentrum herum. Bohm’sche Mechanik 261 Die zusätzlichen Parameter dieses Modells (das heute als GRW-Modell bekannt ist), sind die mittlere Dichte der Kollapszentren sowie eine mittlere Reichweite, auf welche die Wellenfunktion bei einem Kollapszentrum reduziert wird. Beide Parameter sind so gewählt, dass für kleine Massen (oder wenige Teilchen), ein spürbarer Einfluss dieser Kollapszentren erst in Tausenden bis Millionen von Jahren auftritt, wohingegen für makroskopische Massen (bzw. Teilchenzahlen) dieser Einfluss nahezu instantan ist. Das Modell macht zwar prinzipielle Vorhersagen zu Abweichungen von der herkömmlichen Quantenmechanik, allerdings liegen diese noch außerhalb der heutigen experimentellen Möglichkeiten. Wie die meisten dynamischen Kollapsmodelle hat auch die Theorie von GhirardiRimini-Weber Probleme mit einer relativistischen Formulierung. Nach der Quantentheorie sollte der Kollaps instantan im gesamten Raum erfolgen. Der Nachweis der Verletzung der Bell’schen Ungleichungen beispielsweise durch Aspect [1] auch über Bereiche, die keinen relativistischen Signalaustausch zulassen, zeigt, dass auch GRW nicht-lokal sein muss. Tatsächlich wurden bis heute nur Verallgemeinerungen von GRW auf freie relativistische Teilchen formuliert [72]. GRW ist eine nicht-lokale Theorie in dem Sinne, dass die Kollapszentren nicht-lokal korreliert sein müssen, um beispielsweise die EPR-Phänomene beschreiben zu können. 13.7 Bohm’sche Mechanik Eines der bekanntesten Modelle und sicherlich das am weitesten ausgearbeitete Modell für eine Formulierung der Quantenmechanik mit verborgenen Variablen stammt von David Bohm [10] aus dem Jahre 1952. Ähnliche Ideen wurden schon 1926 von Louis de Broglie [20] (siehe auch [2]) und von E. Madelung [55] geäußert. Nach kritischen Bemerkungen von Pauli im Anschluss an einen Vortrag von de Broglie auf der Solvay Konferenz 1927 (siehe auch [61]) wurden diese Ideen aber zunächst nicht weiter verfolgt. Vermutlich kannte Bohm die Arbeiten von de Broglie nicht. Als Bezeichnung dieser Modelle findet man manchmal auch Führungsfeldtheorie“ oder Dop” ” pellösunginterpretation“. 13.7.1 Die allgemeine Idee Die grundlegende Idee von Bohm besteht darin, das Schrödinger-Feld Ψ(x) und das zugehörige Teilchen (mit einer klassischen Trajektorie x(t)) als zwei verschiedene, real existierende Entitäten anzusehen. Das Feld Ψ(x) genügt der Schrödinger-Gleichung, das Teilchen folgt einer Dynamik, die es an das Feld bindet und durch die seine mittlere Aufenthaltswahrscheinlichkeit an einem Punkt x proportional zu |Ψ(x)|2 ist. Da sich Ort und Impuls des Teilchens selber nicht bestimmen lassen – dies ist für Bohm 262 Probleme, Fragen und Interpretationen kein Postulat, sondern ergibt sich aus seiner Theorie des Messprozesses –, muss mit einem Teilchenensemble gerechnet werden, dessen Verteilung ebenfalls durch |Ψ(x)|2 gegeben ist. Dieser statistische Aspekt der Bohm’schen Theorie ist allerdings nur Ausdruck unserer Unkenntnis der Anfangsbedingungen (und damit der Trajektorien) der einzelnen Teilchen. Die Mathematik der Bohm’schen Mechanik ergibt sich nahezu ausschließlich aus der Schrödinger-Gleichung. Daher kann man auch beweisen, dass die Vorhersagen der Bohm’schen Mechanik identisch zu denen der Quantenmechanik sind. Die Gleichungen der Quantenmechanik werden lediglich um eine Gleichung erweitert, welche die Trajektorie des Teilchens festlegt. Außerdem bedarf es einer Theorie des Messprozesses. Man kann allerdings darüber streiten, was genau im Bohm’schen Modell die verbor” genen Variablen“ sind: Der (im Sinne einer klassischen Theorie) Zustandsraum eines Einteilchensystems ist durch {(Ψ, x)} gegeben, d.h., neben der Wellenfunktion gibt es zusätzliche noch den Ort des Teilchens. In diesem Sinne wäre also die Teilchenposition x(t) die verborgene Variable, die es in der Quantenmechanik nicht gibt. Trotzdem ist nach der Bohm’schen Theorie der Ort des Teilchens nicht verborgen“, da bei einer ” Messung gerade dieser Ort in Erscheinung tritt. Das Modell beschreibt insbesondere Einteilchensysteme ausgezeichnet. Betrachten wir als Beispiel das Doppelspaltexperiment: Von der Quelle wird sowohl die Schrödinger-Welle als auch das Elektron emittiert. Der exakte Ort und damit die exakte Trajektorie des Teilchens sind allerdings nicht bekannt. Die Schrödinger-Welle breitet sich nach der Schrödinger-Gleichung aus, d.h. es kommt hinter den beiden Spalten zu einer Superposition der beiden Anteile dieser Welle und zu den bekannten Interferenzmustern. Da aufgrund der dynamischen Gesetze die Aufenthaltswahrscheinlichkeit des Teilchens proportional zu |Ψ(x)|2 ist, und da die Anfangsbedingungen verschiedener Teilchen nicht genau bekannt sind und über diese gemittelt werden muss, treffen die Teilchen genau dem Interferenzmuster der Welle entsprechend auf der Detektorplatte auf. Die Schrödinger-Welle bestimmt somit die Ausbreitung des Teilchens und seine Aufenthaltswahrscheinlichkeit an bestimmten Orten. Trifft das Teilchen auf einen Detektor, wechselwirkt es unmittelbar mit den dortigen Atomen und bewirkt so einen punktförmigen Nachweis. Bohm diskutiert in seiner Arbeit auch den Messprozess und seine Auswirkungen auf das Verhalten der Schrödinger-Welle ausführlich. Er betont insbesondere den Einfluss der verborgenen Variablen des Messinstruments auf das Ergebnis. Darin liegt für ihn die Ursache, warum sein Modell nicht unter die Einschränkungen des von Neumannschen Beweises fällt (und auch nicht unter andere No-Hidden-Variable Theoreme). Wir werden im Folgenden nur die wesentlichen mathematischen Aspekte der Bohm’sche Mechanik 263 Bohm’schen Theorie behandeln sowie einige Kritikpunkte aufzählen. Die Arbeit von Bohm ist wesentlich ausführlicher und die Rechnungen detaillierter. 13.7.2 Das Quantenpotential Ausgangspunkt der Bohm’schen Mechanik ist die Schrödinger-Gleichung in der bekannten Form: ~2 ∂Ψ = − ∆Ψ + V (x)Ψ . (13.17) i~ ∂t 2m Für die Wellenfunktion wählen wir nun folgende Darstellung i Ψ(x, t) = R(x, t) exp S(x, t) (13.18) ~ mit reellen R(x, t) und S(x, t). Die Trennung in Real- und Imaginärteil der SchrödingerGleichung führt auf die Differentialgleichungen: 1 ∂R = − (R∆S + 2∇R · ∇S) , ∂t 2m (∇S)2 ~2 ∆R ∂S = − + V (x) − . ∂t 2m 2m R (13.19) (13.20) Statt R können wir auch das Absolutquadrat der Wellenfunktion einführen, P (x) = R(x)2 , und erhalten die Differentialgleichungen: ∂P ∇S +∇· P = 0, (13.21) ∂t m ~2 ∆P 1 (∇P )2 ∂S (∇S)2 + + V (x) − − = 0. (13.22) ∂t 2m 4m P 2 P2 Bisher handelt es sich lediglich um eine Umformulierung der Schrödinger-Gleichung. Die formalen Ähnlichkeiten zu Gleichungen aus der klassischen Physik (beispielsweise Gleichungen aus der Hydrodynamik und natürlich dem Hamilton-Jacobi-Formalismus) haben jedoch immer wieder Anlass für klassische Interpretationen der Quantenmechanik gegeben. Die Bohm’sche Mechanik ist nur eine Möglichkeit. Im Grenzfall1 ~ → 0 haben die beiden Gleichungen (13.21) und (13.20) bzw. (13.22) eine einfache physikalische Interpretation: Die Differentialgleichung für S entspricht einer Hamilton-Jacobi-Gleichung mit Potential V (x). Aus der klassischen Mechanik ist dann Folgendes bekannt: Sei S(x) eine Lösung der Hamilton-Jacobi-Gleichung, dann gilt für jede Lösung der Newtonschen Bewegungsgleichungen, für die an einem 1 Setzt man in den Gleichungen ~ = 0, so entspricht das nur formal diesem Grenzfall. Es muss noch gezeigt werden, dass die Terme, die von ~2 multipliziert werden, nicht von der Ordnung 1/~2 sind. Dies ist beispielsweise bei stationären Lösungen der Schrödinger-Gleichung der Fall. 264 Probleme, Fragen und Interpretationen Punkt der Impuls gleich dem Gradienten von S(x) ist, dass dies entlang der gesamten Trajektorie gilt. Mit anderen Worten, das Gradientenfeld für eine Lösung der Hamilton-Jacobi-Gleichung, ∇S(x) v(x) = , (13.23) m ist das Geschwindigkeitsfeld von Lösungen der Newton’schen Bewegungsgleichungen. Zur Bestimmung einer Bewegungsgleichung müssen wir nun nur noch“ eine Differen” tialgleichung erster Ordnung lösen: ẋ(t) = ∇S(x(t)) . m (13.24) Die sich daraus ergebende Differentialgleichung für P , ∂P + ∇ · (P v) = 0 , ∂t ist eine Kontinuitätsgleichung für die Wahrscheinlichkeitsdichte (bwz. Ensembledichte) P und den Wahrscheinlichkeitsstrom“ (bzw. Teilchenstrom im Ensemble) P v. ” Diese Beziehung zwischen der Schrödinger-Gleichung und der zugehörigen klassischen Mechanik im formalen Grenzfall ~ → 0 lässt sich zu einer systematischen Behandlung des klassischen Grenzfalls erweitern und ist (in erster nicht-trivialer Ordnung von ~) als WKB-Näherung bekannt. In der Wellenoptik kennt man eine ähnliche Näherung als Kurzwellenasymptotik“; sie beschreibt den Übergang von der Wellen” optik zur geometrischen Optik. Bohm stellte nun fest, dass diese Interpretation der Gleichungen (13.22) und (13.21) auch für ~ 6= 0 aufrecht erhalten werden kann. Gleichung (13.22) ist immer noch eine Hamilton-Jacobi-Gleichung, allerdings kommt zu dem klassischen Potential V (x) noch ein sogenanntes Quantenpotenzial, ~2 ∆R ∆P 1 (∇P )2 U (x) = − . = − 2m R P 2 P2 hinzu. Neben die Schrödinger-Gleichung (aufgefasst als Gleichungen für S(x) und P (x)) tritt nun noch die Gleichung 13.24 (ẋ(t) = ∇S(x(t))/m), deren Lösungen Trajektorien sind, die als physikalische Trajektorien real existierender Teilchen aufgefasst werden. Gleichung (13.21) ist nach wie vor eine Kontinuitätsgleichung für die Wahrscheinlichkeitsdichte P . Zu der Differentialgleichung für die Teilchentrajektorien (Gl. 13.24) gibt es natürlich auch eine Newton’sche Bewegungsgleichung, die das Quantenpotenzial enthält und in manchen Situationen eine gewisse Anschauung vermittelt: ~2 ∆R d2 x m 2 = −∇ V (x) − . (13.25) dt 2m R Bohm’sche Mechanik 265 Das sollte jedoch nicht darüber hinwegtäuschen, dass die eigentliche Trajektoriengleichung (Gl. 13.24) erster Ordnung in der Zeit ist. Daraus ergeben sich weitreichende Konsequenzen, beispielsweise auch ein so genanntes No-Crossing“-Theorem, wonach ” sich zwei Trajektorien niemals schneiden können (da eine Trajektorie durch die Vorgabe eines Ortes schon bestimmt ist). In der Bohm’schen Mechanik ist das Führungsfeld S(x) durch die Anfangsbedingungen an die Wellenfunktion ψ(x) festgelegt, wohingegen es in der Newton’schen Mechanik eine Schar von Lösungen zur Hamilton-JacobiGleichung geben kann. Daher können sich Newton’sche Trajektorien auch kreuzen, nämlich wenn sie zu verschiedenen Lösungen S(x) gehören. Entspricht in der Bohm’schen Mechanik die anfängliche Ortsverteilung der Teilchen der Verteilung P (x), so garantiert die Unitarität der Schrödinger-Gleichung die Erhaltung dieser Wahrscheinlichkeit, bzw. die Hamilton-Jacobi-Gleichung garantiert, dass die Ensembleverteilung unter der Zeitentwicklung des Systems weiterhin durch P (x) gegeben ist. Doch selbst wenn die anfängliche Verteilung nicht durch P (x) gegeben ist, kann man für viele Fälle beweisen, dass P (x) sehr rasch angenähert wird. Gleichung (13.21) drückt als Kontinuitätsgleichung die Erhaltung der Teilchenzahl aus. Lokal kann sich die Teilchenzahl nur dadurch ändern, dass Teilchen aus dem Gebiet abfliessen bzw. hinzukommen. Dies ist eine natürliche Forderung. In der Quantenmechanik entspricht P einer Wahrscheinlichkeit. In diesem Fall ist die Forderung einer Kontinuitätsgleichung weniger selbstverständlich. Es gibt keinen Grund, warum Wahrscheinlichkeit aus einem Gebiet abfließen“ muss, wenn sich die Wahrscheinlich” keit ändert. Die Gesamtwahrscheinlichkeit ist zwar erhalten, aber eine Verringerung in einem Raumgebiet kann durch eine Erhöhung in einem anderen Raumgebiet kompensiert werden, ohne dass ein Fluss“ stattfindet. ” 13.7.3 Klassisch oder Quanten Manchmal erhebt sich die Frage, ob die Bohm’sche Mechanik nun eine klassische Theorie oder eine Quantentheorie sei. Die Anhänger vertreten meist den Standpunkt, dass es sich um eine Quantentheorie handelt: Die Theorie enthält den Parameter ~, der typischerweise Quanteneffekte anzeigt, sie reproduziert sämtliche Vorhersagen der Quantentheorie, und schließlich tritt im Quantenpotenzial die Amplitude der Wellenfunktion nur in einem Quotienten auf (vgl. Gl. 13.25), was dazu führt, dass auch an Stellen, wo die Amplitude sehr klein ist, ein spürbarer Einfluss möglich ist. Dies ist einer der Gründe für den holistischen“ Charakter der Quantenmechanik (Einflüsse können auch ” über große Distanzen hinweg wesentlich sein). Andererseits kann man auch die Meinung vertreten, dass es sich bei der Bohm’schen Mechanik um eine klassische Theorie handelt: Sie beruht auf einem klassischen (Newton’schen) Teilchenverständnis und einem klassischen Feldbegriff. Beide Entitäten – 266 Probleme, Fragen und Interpretationen Teilchen und Welle – existieren als objektive Realität und haben somit zu jedem Zeitpunkt objektiv wohldefinierte Eigenschaften, unabhängig von irgendwelchen Beobachtern oder Beobachtungen. Außerdem handelt es sich um eine deterministische Theorie mit Bewegungsgleichungen bzw. Feldgleichungen wie in der klassischen Physik. Mein Standpunkt ist, dass es sich bei der Bohm’schen Mechanik zwar um eine Quantentheorie handelt (aufgrund der oben angegebenen Argumente), allerdings um eine Theorie mit einer klassischen Ontologie. Das bedeutet, die fundamentalen Freiheitsgrade der Theorie haben dieselbe Ontologie (im Sinne des zweiten obigen Absatzes) wie in der klassischen Mechanik. 13.7.4 Vorteile der Bohm’schen Mechanik Der wesentlich Vorteil der Bohm’schen Mechanik ist natürlich, dass es sich um ein konsistentes Modell der Quantenmechanik handelt. Es reproduziert sämtliche Vorhersagen der Quantenmechanik, aber es benötigt keinen Bezug auf einen Beobachter oder eine Messung (und damit auf keine klassische Welt“). Auch der Kollaps der Wellen” funktion ist kein Problem: Da sich Teilchen immer an einem bestimmten Ort befinden, gibt es nur diese eine Realität“, alle anderen Zweige der Wellenfunktion sind leer und ” werden für die zukünfte Entwicklung des Systems (nachdem die Welle genügend dekohärent geworden ist) nicht mehr benötigt. Die Bohm’sche Mechanik besitzt somit nicht die Inkonsistenzen“ der Quantenmechanik. ” Außerdem finden viele der als seltsam empfundenen Aspekte der Quantenmechanik eine einfache Erklärung, unter anderem auch die Interferenzeffekte von Teilchen. Wäre das Zitat von Feynman zu Beginn von Kapitel 3, wonach das Doppelspaltexperiment das einzige Wundersame der Quantentheorie ist (dieses Feynman-Zitat wird von Bohmianern auch gerne herangezogen), tatsächlich richtig, dann hat die Bohm’sche Mechanik diesen Aspekt elegant geklärt. Welle-Teilchen-Dualismus oder Komplementarität sind für die Bohm’sche Mechanik keine Probleme. Interessanterweise kannte Feynman die Bohm’sche Mechanik, aber er hat sie nie näher als Modell für die Quantenmechanik in Betracht gezogen. Weiterhin ist die Bohm’sche Mechanik eine intrinsisch deterministische Theorie – die beobachteten Zufälligkeiten beruhen auf unserer Unkenntnis hinsichtlich der tatsächlichen Teilchentrajektorien – mit einem subjektunabhängigen, realistischen Objektbegriff. Der intrinsische Determinismus umgeht die philosophischen Probleme, die mit der Aufgabe beispielsweise des Prinzips vom hinreichenden Grund (Leibniz: Nichts geschieht, ohne dass derjenige, der die Dinge hinlänglich genau kennte, angeben kann, weshalb etwas genau so und nicht anders geschehen ist [53]) verbunden sind. Die Welt ist kausal abgeschlossen. Und der objektive Realismus umgeht die Probleme im Zusammenhang mit einem partizipatorischen Universum“, bei dem der Beobachter an ” Bohm’sche Mechanik 267 der Gestaltung der Realität teil hat. Aus den genannten Gründen hat die Bohm’sche Mechanik gerade unter den Wissenschaftsphilosophen viele Anhänger. Auch John Bell sah in der Bohm’schen Mechanik (ebenso wie in den Kollapsmodellen von GRW) vielversprechende Ansätze zur Lösung der Probleme, an denen seiner Meinung nach die herkömmlichen Formulierungen der Quantenmechanik kranken. 13.7.5 Kritikpunkte an der Bohm’schen Mechanik Im Folgenden sollen kurz einige Kritik- bzw. Schwachpunkte an der Bohm’schen Theorie zusammengefasst werden, allerdings ohne dass die Bohm’sche Theorie dadurch widerlegt werden kann. Ihre Vorhersagen sind beweisbar identisch zu denen der Quantenmechanik, wodurch eine Widerlegung immer auch eine Widerlegung der Quantenmechanik bedeuten würde. Im Gegensatz zum Problem des Messprozesses, das für die Quantenmechanik grundlegend ist, handelt es sich bei den meisten Kritikpunkten an der Bohm’schen Mechanik eher um Schönheitsfehler“. ” Mehrteilchensysteme Als eine erste Schwäche der Bohm’schen Theorie wird ihre Behandlung von Mehrteilchensystemen angesehen. Das Schrödinger-Feld von n Teilchen, Ψ(x1 , ..., xn , t), ist eine Funktion von 3n + 1 Variablen. Dieses Feld lebt“ also nicht mehr auf unse” rem dreidimensionalen Anschauungsraum, sondern auf dem Konfigurationsraum der Teilchen. In diesem Sinne unterscheidet es sich wesentlich von dem elektromagnetischen Feld oder dem Gravitationsfeld, die ebenfalls mit einer gewissen Berechtigung als Führungsfelder“ für Teilchen mit einer Ladung bzw. Energie angesehen werden ” können. Der (berechtigte) Einwand von Bohmianern gegen dieses Argument lautet, dass auch die Hamilton-Jacobi-Gleichung eines klassischen Systems von n Teilchen eine Differentialgleichung für eine Funktion S(x1 , ..., xn ) von 3n Variablen darstellt. Und wenn es zwischen n Teilchen eine Wechselwirkung gibt, so ist das zugehörige Potenzialfeld V (x1 , ..., xn ) ebenfalls eine Funktion von allen Orten. In der klassischen Mechanik wird S(x1 , ..., xn ) als eine mathematische Hilfsgröße angesehehn, mit der sich Scharen von Trajektorien elegant beschreiben lassen. Eine unmittelbare physikalische Bedeutung hat dieses Feld dort nicht. Das gilt eher schon für das Potenzial V (x1 , ..., xn ). Doch auch diesem würde man eine physikalische Bedeutung nur insofern zusprechen, als es durch die konkret realisierten Orte von n Teilchen definiert ist – nicht dem verallgemeinerten Potenzialfeld für alle möglichen Orte der Teilchen. Anders ist dies bei externen Potenzialen, wie sie sich aus den elektrischen und gravitativen Kräften ergeben, doch diese leben auf dem Ortsraum und nicht 268 Probleme, Fragen und Interpretationen dem Konfigurationsraum. Die Ontologie des Führungsfeldes bleibt in der Bohm’schen Mechanik offen. Die Statistik der Teilchen Die effektive Abstoßung zwischen Fermionen (und entsprechend eine Form der An” ziehung“ bei Bosonen) erfolgt in der Bohm’schen Theorie über das Quantenpotenzial. Allerdings ist die Antisymmetrie des Quantenpotentials bei Fermionen (bzw. die Symmetrie bei Bosonen) keine Folgerung aus der Schrödinger-Gleichung, sondern muss zusätzlich gefordert werden. Das Gleiche gilt auch in der herkömmlichen Quantenmechanik. Allerdings kann man zeigen, dass im Rahmen einer Quantenfeldtheorie der Zusammenhang zwischen dem Spin und der Statistik aus sehr allgemeinen Forderungen (in erster Linie der relativistischen Invarianz) folgt [70]. Inwieweit das auch für die Bohm’sche Mechanik gilt bleibt offen, solange eine relativistische Formulierung noch aussteht. Der Spin Das oben behandelte Bohm’sche Modell basiert auf einer Schrödinger-Gleichung für spinlose Teilchen. Es gibt von Bohm zwar auch klassische“ Modelle für Spin-1/2” Teilchen, doch die finden meist keine Anwendung. Statt dessen wird das SchrödingerFeld zu einer 2-komponentigen Größe (entsprechend der Pauli’schen Theorie des Spins, siehe Abschnitt 9.3.1), es wirken also im Prinzip zwei Quantenpotenziale auf ein Teilchen ein. Die Ablenkung eines Elektrons in einem Stern-Gerlach-Magnetfeld erfolgt demnach aufgrund seiner Trajektorie, nicht aufgrund einer intrinsischen Eigenschaft Spin“ oder Polarisation“. Außerdem gehen natürlich die Anfangsbedingungen für ” ” die Führungsfelder (die Art der Präparation des Systems) ein. Die Nicht-Lokalität Bohm diskutiert in Teil II seines Artikels [10] den Messprozess sehr ausführlich und kommt zu dem Schluss, dass die verborgenen Parameter des Messgerätes eine wesentliche Rolle spielen. Diese Einbeziehung der verborgenen Parameter des Messgerätes ist wichtig, da so das von Neumann’sche Theorem (ebenso wie andere Theoreme ähnlicher Art – Jauch–Piron, Gleason, etc.) umgangen wird. Die Erwartungswerte von Observablen sind im Bohm’schen Modell keine linearen Funktionale der Observablen. Da die Bohm’sche Theorie in allen Teilen mit den Vorhersagen der Quantenmechanik übereinstimmt, enthält sie auch die spooky action at a distance“ – d.h. eine ” nicht-lokale Wirkung, die wir im Zusammenhang mit den Bell’schen Ungleichungen (Abschnitt 8.4) angesprochen haben. Während sich andere Deutungen der Quantenmechanik in diesem Zusammenhang auf den subjektiven Charakter der Wellenfunk- Bohm’sche Mechanik 269 tion beziehen können und die Reduktion als nicht ontologisch ansehen, ist die NichtLokalität ein wesentlicher Bestandteil der Bohm’schen Mechanik. Sie äußert sich zwar nicht in einer Verletzung der Relativitätstheorie (auch in der Bohm’schen Mechanik ist der Kollaps weder mit einer Energie- noch einer Signalübertragung verbunden), bleibt aber wegen ihres ontologischen Charakters spooky“. ” Die Asymmetrie zwischen Ort und Impuls Die Formulierung der herkömmlichen Quantenmechanik ist symmetrisch in Orts- und Impulsvariablen. Grundsätzlich kann jede Darstellung (d.h. jeder Satz von kompatiblen Observablen) als Basis gewählt werden. Die Bohm’sche Formulierung hängt jedoch wesentlich von der Ortsdarstellung ab: Die Ontologie des Führungsfeldes bezieht sich auf den Ortsraum und die Teilchen propagieren als punktförmige Objekte im Ortsraum. Während die Quantenmechanik ebenso von der Schrödinger-Gleichung im Impulsraum ausgehen kann, ist dies für die Bohm’sche Interpretation nicht der Fall. Diese Brechung der Symmetrie zwischen Ort und Impuls, die in der herkömmtlichen ” ” Interpretation der Quantenmechanik noch gegeben ist, wurde insbesondere von Heisenberg und Pauli immer als Hauptkritikpunkt am Bohm’schen Modell betont. Diesem Argument kann man allerdings entgegen halten, dass in der relativistischen Mechanik die Symmetrie zwischen Ort und Impuls ebenfalls gebrochen ist. Das Prinzip der Mikrokausalität (kausale Einflüsse können sich nicht schneller als mit Lichtgeschwindigkeit ausbreiten) gilt bezüglich des Raums bzw. der Raumzeit. NichtLokalität im Impulsraum (ein Teilchen mit großem Impuls wechselwirkt mit einem Teilchen mit kleinem Impuls) ist etwas vollkommen Natürliches. Von da her ist die Auszeichnung des Ortsraums nachvollziehbar.2 Ebenfalls für eine Auszeichnung des Raumes wird oft angeführt, dass fast alle (wenn nicht alle) Messungen letztendlich Ortsraummessungen sind. Jedes Ablesen einer Zeigerstellung an einem Messinstrument ist eine Ortsmessung. Die Teilchentrajektorien Mehr noch als alle anderen Argumente ist das folgende eher ein Schönheitsfehler“ und ” kein wirkliches Gegenargument: Die Teilchentrajektorien erscheinen unter bestimmten Umständen sehr unnatürlich. Betrachten wir als Beispiel Energieeigenzustände, gleichgültig zu welchem Potenzial. Energieeigenzustände können bis auf eine globale, ortsunabhängige Phase reell ~ gewählt werden. Das bedeutet aber insbesondere ∇S/m = v(t) = 0. Somit gilt für 2 Allerdings gibt es hier einen seltsamen Zirkelschluss: Die Bohm’sche Mechanik ist auch hinsichtlich des Raums nicht-lokal – siehe vorherigen Abschnitt – und somit scheint der Grund für die Auszeichnung des Raums gegenüber den anderen Eigenschaften hinfällig. 270 Probleme, Fragen und Interpretationen die Teilchentrajektorien in Energieeigenzuständen x(t) = x0 . Diese Teilchen bewegen sich also nicht, sondern befinden sich lediglich entsprechend einer Wahrscheinlichkeitsverteilung ψ(x)2 an bestimmten Orten. Das erscheint insofern unnatürlich, als diese Zustände beliebig hohe Energien, Drehimpulse oder auch Impulserwartungswerte haben können. Daran erkennt man auch, dass mit Ausnahme des Ortsoperators die ~ etc. nichts mit dem Impuls, der EnerErwartungswerte von Operatoren wie P , H, L gie oder dem Drehimpuls der Teilchen zu tun haben, sondern eher mit der Form der Wellenfunktion. Die nicht-relativistische Schrödinger-Gleichung Der Ausgangspunkt für das Bohm’sche Modell ist die nicht-relativistische SchrödingerGleichung, und viele Überlegungen hängen von der speziellen Form dieser Gleichung ab. Verallgemeinerungen auf die Dirac-Gleichung sind zwar möglich, allerdings wiederum nur um den Preis zunehmender Unnatürlichkeit“. ” Eine relativistische Formulierung der Bohm’schen Mechanik scheint schon alleine wegen der erwähnten Nicht-Lokalität (z.B. bei Zwei-Teilchen-Zuständen) zu einem grundlegenden Problem zu werden. Wenn die Wellenfunktion wie in der Bohm’schen Mechanik eine ontologische Bedeutung hat, dann zeichnet die instantane globale Änderung dieser Wellenfunktion als Folge einer Messung ein Bezugssystem aus, und das widerspricht der relativistischen Invarianz. Quantenfeldtheorie Eine vollständige Beschreibung der Elementarteilchen einschließlich der Prozesse ihrer Umwandlung (Paarerzeugung, Annihilation, Zerfälle, etc.) ist bisher nur im Rahmen der Quantenfeldtheorie möglich. Daher sollte, wenn überhaupt, eine Ontologie an dieser Stelle ansetzen. Doch die Quantenfeldtheorie des Standardmodells ist selbst nur eine phänomenologische Theorie: Sie ist der Niederenergielimes (oder Skalenlimes) einer noch nicht bekannten tiefer liegenden Theorie, die auch die Gravitation mit einbezieht. Dieser phänomenologische Charakter der Quantenfeldtheorie wird besonders an der Renormierung deutlich: Die formal auftretenden Unendlichkeiten lassen sich durch einen Cut-off“ – ein Abschneiden der Theorie bei sehr hohen Impulsen bzw. ” Energien – beseitigen, doch die nackten (unbeobachtbaren) Parameter der Theorie hängen von diesem Cut-Off ab, sodass die physikalisch beobachteten Parameter Cutoff-unabhängig werden. Wenn überhaupt, wären in der QFT die Felder ontologisch, doch die meisten Bohm’schen Formulierungen von Quantenfeldtheorien gehen von Teilchen als fundamentalen Entitäten aus, obwohl eine Bohm’sche Mechanik für Felder ebenfalls möglich ist. Bohm’sche Mechanik 271 An dieser Stelle setzt der Kritikpunkt an, der für mich ausschlaggebend ist: Die Quantenmechanik ist der nicht-relativistische Grenzfall der Quantenfeldtheorie, und die Quantenfeldtheorie ist der niederenergetische Grenzfall einer noch nicht bekannten fundamental(er)en Theorie. Weshalb setzt man mit der Ontologie auf der Ebene der Quantenmechanik an? Auf der Ebene einer Quantenfeldtheorie gibt es mehrere Möglichkeiten, eine Bohm’sche Mechanik zu formulieren, die sich hinsichtlich ihrer Ontologien unterscheiden. Da sie alle in ihren Vorhersagen übereinstimmen, kann man zwischen den verschiedenen Versionen nicht unterscheiden. Doch wie kann man dann behaupten, die wahre“ Ontologie gefunden zu haben? ” 13.7.6 Die Ontologie? Für mich bleibt die Bohm’sche Mechanik ein interessantes Modell der Quantentheorie, das ich gelegentlich gerne zur Veranschaulichung gewisser Sachverhalte heranziehe. Sie zeigt, dass eine solche widerspruchsfreie und beobachterunabhängige Formulierung möglich ist. Aber abgesehen von ihrem ontologischen Balast“ (ein Ausdruck von Pau” li) und ihrer Uneleganz“ – sicherlich ein subjektiver Eindruck – möchte ich mich auch ” ungerne auf eine Ontologie festlegen lassen. Dafür gibt es mehrere Gründe: 1. Eine Theorie von Raum und Zeit ist noch nicht in zufriedenstellender Weise in eine Quantentheorie einbezogen. Das bedeutet nicht nur, dass die bisherigen Formulierungen der Quantentheorie noch unvollständig hinsichtlich der bekannten Freiheitsgrade in der Natur sind, sondern auch dass manche Begriffe der klassi” schen“ Raum-Zeit möglicherweise in der vollen Theorie eine andere Bedeutung erlangen können – dazu zählt beispielsweise auch der Begriff der Nicht-Lokalität. 2. Die Bohm’sche Mechanik stimmt zwar hinsichtlich ihrer Vorhersagen mit der Quantenmechanik überein, aber wir wissen nicht, ob dies nicht auch für andere Modelle zutrifft, die eine objektive Realitätsvorstellung zulassen (ein Beispiel für ein theoretisches Konzept, das in diese Richtung ausgebaut werden könnte, findet man in [32]). All diese Modelle der Quantenmechanik wären hinsichtlich ihrer experimentellen Vorhersagen identisch und könnten daher durch ein Experiment nicht unterschieden werden. Damit kann keines dieser Modelle von sich in Anspruch nehmen, die Ontologie der Welt zu beschreiben. 272 Probleme, Fragen und Interpretationen Kapitel A1 Endliches Kastenpotenzial In diesem Anhang werden die beiden Fälle beim endlichen Kastenpotenzial (E > V und E < V ) eingehender behandelt. A1.1 E > V — freie Teilchen Für E > V ist die rechte Seite der Schrödinger-Gleichung 6.58 sowohl innerhalb als auch außerhalb des Kastens positiv, sodass die Lösungen durch Sinus- und Kosinusfunktionen gegeben sind. Für die folgenden Rechnungen definieren wir: = 2mE ~2 und ν= 2mV . ~2 (A1.1) Da wir die Lösungen immer symmetrisch bzw. antisymmetrisch wählen können, erhalten wir innerhalb des Kastens Lösungen von der Form √ ψs (x) = a cos( x) √ bzw. ψa (x) = b sin( x) |x| ≤ L . 2 (A1.2) Für symmetrische Lösungen schreiben wir außerhalb des Kastens: ( ψs (x) = √ A0 cos( − νx + ϕs ) x > √ A0 cos( − νx − ϕs ) x < L 2 L 2 (A1.3) L 2 L 2 (A1.4) Entsprechend seien die antisymmetrischen Lösungen: ( ψa (x) = √ B 0 sin( − νx + ϕa ) x > √ B 0 sin( − νx − ϕa ) x < Durch diese Wahl erreichen wir, dass eine Festlegung der Konstanten (a, A, b, B, ϕs , ϕa ) bei x = + L2 automatisch auch bei x = − L2 gilt. 273 274 Anhang A Die möglichen symmetrischen bzw. antisymmetrischen Lösungen sind also von der Form: √ x) |x| ≤ L2 a cos( √ ψs (x) = (A1.5) aA cos( − νx + ϕs ) x > L2 √ aA cos( − νx − ϕ ) x < L s 2 √ x) |x| ≤ L2 b sin( √ ψa (x) = (A1.6) bB sin( − νx + ϕa ) x > L2 √ −bB sin( − νx − ϕ ) x < L a 2 0 (Aus Gründen die gleich offensichtlich werden, haben wir A = aA und B 0 = bB gesetzt.) Wir beschränken uns im Folgenden auf den symmetrischen Fall. Der antisymmetrische Fall folgt entsprechend. Die Konstanten a, A und ϕs sind theoretisch durch zwei Bedingungen festgelegt: (1) Es müssen die Anschlussbedingungen (einmal stetig differenzierbar) gelten, und (2) die Funktionen müssen normiert werden. Die zweite Bedingung sollte die Konstante a festlegen, ist aber offenbar nicht erfüllbar. Das Integral über das Quadrat der Cosinus-Funktion über die gesamte reelle Achse ist nicht endlich. Das ist ein bekanntes Problem für freie Lösungen in einem unbegrenzten Raum. Wir können entweder das gesamte System in einen zweiten sehr großen Kasten (mit unendlicher potenzieller Energie außerhalb) stecken, dessen Berandung sehr weit weg ist ( L), in diesem Fall wird der Normierungsfaktor sehr klein aber er bleibt endlich. Oder wir verschmieren die Lösung mit einer Funktion die für der große Werte von x sehr langsam und glatt gegen 0 geht. In diesem Fall haben wir strenggenommen keine stationäre Lösung zu einem reinen Energieeigenwert mehr, können diese aber beliebig genau approximieren. Wir werden diesen Punkt im Folgenen offen lassen und die Gesamtnormierung der Wellenfunktion nicht festlegen. Damit können wir beispielsweise a = 1 setzen und haben uns nur noch um zwei Konstanten zu kümmern. Wir betrachten nun die Anschlussbedingungen bei x = L2 . Da wir einmal stetige Differenzierbarkeit verlangen, erhalten wir zwei Bedingungen (die Wellenfunktionen und ihre Ableitungen müssen jeweils denselben Wert haben): √ √ L L = A cos cos − ν + ϕs (A1.7) 2 2 und √ √ √ √ L L − sin = A − ν sin − ν + ϕs (A1.8) 2 2 Das sind zwei Bedingungen für ein noch unbestimmtes Amplitudenverhältnis A und eine offene Phase ϕs , die für beliebige Werte von und ν immer lösbar sind. (Anschau√ lich wählt man zunächst A so, dass die Ableitungen bei einer Auslenkung von cos L2 Endliches Kastenpotenzial 275 übereinstimmen, anschließend wählt man die Phase so, dass die äußere Kurve an die innere anschließt.) ((Schöne Übungsaufgabe mit Mathematica Manipulate[Plot[Piecewise[{{Cos[a*x],x<L/2}{A*Cos[b*x+Varphi],x>L/2}}], {x,0,L}],{A,0,5},{Varphi,0,2*Pi}])) Eine Anmerkung noch zum Amplitudenverhältnis: Vergleicht man zwei Funktionen mit unterschiedlicher Wellenlänge, dann hat die rascher oszillierende Funktion (also die Lösung innerhalb des Kastens) bei gegebener Auslenkung immer die größere Steigung. Damit die Lösung innen und außen stetig ableitbar anschließen, muss daher die Amplitude im äußeren Bereich größer sein als im inneren, also A > 1. Dies wird insbesondere für sehr große Werte von E anschaulich, sodass man klassisch argumentieren kann: Im äußeren Bereich sind die Teilchen langsamer als im inneren und haben dort (pro Längeneinheit) im Mittel eine größere Aufenthaltswahrscheinlichkeit als im Inneren des Kastens. Zusammenfassend können wir also festhalten: Für E > V gibt es keine Quantisierung der Energie sondern freie Teilchen. Die Amplitude der Lösung ist im äußeren Bereich größer. Etwas entartet ist der Grenzfall E = V . Nun gibt es außerhalb des Kastens nur eine konstante Lösung (die beliebig genau durch eine quadratintegrable Funktion approximiert werden kann), sie hat also immer die Ableitung null. Die möglichen Wellen im Inneren des Kastens haben am Rand jedoch nur die Ableitung null, wenn √ 2mV /~2 = nπL. Für den Fall E > V ist nicht nur jede Energie möglich, sondern für jeden Wert von E gibt es sogar zwei unabhängige Lösungen: die symmetrische und die antisymmetrische. Keine der beiden Lösungen ist eine Eigenfunktion zum Impulsoperator P , allerdings können wir durch Linearkombination zumindest in bestimmten Bereichen reine Impulseigenzustände erzeugen, d.h. reine Exponentialfunktionen: ! √ p 2mE ψP (x) = exp ±i x = exp i x . (A1.9) ~ ~ Die beiden Vorzeichen im Exponenten führen zu einem Eigenzustand zu +p und zu einem Eigenzustand zu −p, beschreiben also ein Teilchen, das sich entweder nach rechts oder nach links bewegt. Wir können im Allgemeinen nur für einen der beiden Bereichen (innerhalb oder außerhalb des Kastens) einen reinen Impulseigenzustand erreichen (wegen der unterschiedlichen Konstanten A und B für die symmetrische und antisymmetrische Lösung). Im jeweils anderen Bereich gibt es beide Anteile in Superposition und mit unterschiedlichen Amplituden. Man kann dies als eine Streuung eines Teils der Welle am Kastenrand interpretieren. Die relativen Amplituden würden dann einen transmittierten und einen reflektierten Anteil beschreiben und werden somit als Transmissionskoeffizient und Reflektionskoeffizient bezeichnet. 276 A1.2 Anhang A 0 < E < V — gebundene Teilchen Wir betrachten nun den Fall, dass die Energie der Teilchen kleiner ist als die Energie des Kastenpotenzials, also E < V . Dabei behalten wir die Notation aus dem letzten Abschnitt (Gl. A1.1) bei. Zunächst einmal stellen wir fest, dass wegen der geforderten Quadratintegrabilität außerhalb des Kastens nur die Lösungen √ L x> (A1.10) ψ+ (x) = A exp(− ν − x) 2 √ L 0 ψ− (x) = A exp( ν − x) x<− (A1.11) 2 in Frage kommen. Diese können wir durch geeignete Wahl der Amplituden wieder als Teil einer symmetrischen Lösung (wenn A = B) oder als Teil einer antisymmetrischen Lösung (A = −B) schreiben. Des weiteren müssen wir uns überzeugen, dass es wegen der geforderten Randbedingungen bei |x| = ± L2 keine Lösungen zu E < 0 geben kann. In diesem Fall kämen innerhalb des Kastens nämlich nur der hyperbolische Kosinus oder der hyperbolische Sinus als Lösung in Frage. Man könnte diese Lösungen zwar stetig an die obigen Exponentiallösungen anschließen, allerdings hätte die Lösung dann am Kastenrand einen Knick, wäre also nicht stetig ableitbar. Die Forderung, dass die Lösungen am Kastenrand einmal stetig differenzierbar sein sollen (s.o.) schließt Lösungen zu E < 0 aus. Im Inneren des Kastens erhalten wir als mögliche Lösungen wieder die trigonometrischen Funktionen und damit sind die möglichen symmetrischen bzw. antisymmetrischen Lösungen nun von der Form: √ |x| ≤ L2 a cos( x)√ ψs (x) = (A1.12) aA exp(− ν − x) x > L2 √ aA exp( ν − x) x < L2 √ b sin( x) |x| ≤ L2 √ ψa (x) = (A1.13) bB exp(− ν − x) x > L2 √ −bB exp( ν − x) x < L 2 Wir beschränken uns im Folgenden wieder auf den symmetrischen Fall. Der antisymmetrische Fall folgt entsprechend. Der globale Faktor a bzw. b jeder Lösung wird durch die Normierungsbedingungen festgelegt, also dass das Integral über das Quadrat der Lösung gleich eins ist. Endliches Kastenpotenzial 277 Diesmal lässt sich diese Normierungsbedingung erfüllen, da die Lösungen für große Betragswerte von x exponentiell abfallen. Wir setzen zunächst daher wieder a = 1 und bestimmen den globalen Faktor später. Wir haben nun eine freie Konstante A, aber zwei Anschlussbedingungen bei L x = 2: √ √ L L cos = A exp − ν − (A1.14) 2 2 √ √ √ √ L L − sin = −A ν − exp − ν − . (A1.15) 2 2 Insbesondere lassen sich diese beiden Anschlussbedingungen nur noch für bestimmte Energiewerte erfüllen. Indem wir beide Gleichungen durcheinander dividieren, können wir die Konstante A eliminieren und erhalten als Quantisierungsbedingung: r √ L ν− = . (A1.16) tan 2 Interessant ist, dass diese Gleichung immer mindestens eine Lösung in dem Bereich 0 < E < V hat, es gibt also immer einen gebundenen Zustand. Für große Werte von √ L und V (genauer für L 2mV /~ >> 1) gibt es viele Lösungen. 278 Anhang A Kapitel A2 Zeitentwicklung und Funktionalintegral In diesem Anhang wird der Zeitentwicklungsoperator für ein freies Teilchen berechnet, außerdem soll die Darstellung des Zeitentwicklungsoperators als Funktionalintegral abgeleitet werden. A2.1 Herleitung des freien Propagators Ganz allgemein lässt sich der Zeitentwicklungsoperator nach Projektionen auf Energieeigenzustände entwickeln: X i i (A2.1) U (t) = exp − Ht = e− ~ Ei t |Ei ihEi | ~ i und somit gilt in der Ortsdarstellung: X i X i U (x, y; t) = hx|U (t)|yi = e− ~ Ei t hx|Ei ihEi |yi = e− ~ Ei t ψEi (x)ψE∗ i (y) . (A2.2) i i Kennt man also alle Energieeigenwerte und die zugehörigen Wellenfunktionen, kann man den Zeitentwicklungsoperator auf diese Weise berechnen. Im vorliegenden (freien) Fall hängt die Energie jedoch nur vom Impulsoperator ab, und man kann sich die Rechnung noch vereinfachen: Z i − ~i Ht U (x, y; t) = hx|e |yi = dp hx|e− ~ Ht |pihp|yi (A2.3) Z i p2 dp exp − t hx|pihp|yi (A2.4) = ~ 2m Z i i p2 = dp exp − t e ~ p(x−y) (A2.5) ~ 2m 279 280 Anhang B Die Integration über p ist Gauß’sch (mit einem linearen Term) und führt direkt auf die Lösung (Gl. 7.13). Auf dasselbe Integral (Gl. A2.5) führt auch eine andere Überlegung: Da die freie Schrödinger-Gleichung (ohne Potenzial) nur den Impulsoperator enthält, können wir auch zunächst eine Lösung im Impulsraum suchen. Diese erhalten wir aber sofort, da die Schrödinger-Gleichung im Impulsraum lautet: p2 p2 d ψ̃(p, t) =⇒ ψ̃(p, t) = exp −i t . (A2.6) i~ ψ̃(p, t) = dt 2m 2m~ Diese Lösung erfüllt auch die richtige Anfangsbedingung, da für t = 0 folgt: ψ̃(p, 0) = 1. Die gesuchte Lösung im Ortsraum erhalten wir durch eine Fourier-Transformation, also genau das Integral aus Gl. A2.5. A2.2 Das Funktionalintegral Der Zeitentwicklungsoperator U (x, y; t) erfüllt ganz allgemein (für beliebige Potenziale und sogar für zeitabhängige Hamiltonoperatoren) die Halbgruppengleichung Z U (x, y; t1 + t2 ) = dz U (x, z; t1 ) U (z, y; t2 ) (A2.7) oder Z E D i D i E D i E − ~ H(t1 +t2 ) x e y = dz x e− ~ Ht1 z z e− ~ Ht2 y . (A2.8) Durch wiederholte Anwendung dieser Identität erhält man U (x, y; t) Z = dx1 . . . dxN −1 U (x, x1 ; t/N )U (x1 , x2 ; t/N ) . . . U (xN −1 , y; t/N ) . Für sehr kurze Zeiten t → 0 kann man den Propagator geeignet approximieren. Dazu verwenden wir die Baker-Campbell-Hausdorff-Formel: eX eY = eZ(X,Y ) 1 mit Z(X, Y ) = X + Y + [X, Y ] + ... 2 Damit gilt i i i 2 e− ~ (H0 +V )t = e− ~ H0 t e− ~ V t+O(t ) . (A2.9) Sei nun D i E U0 (x, y; t) = x e− ~ H0 t y m 12 i m (x − y)2 = exp 2πi~t ~2 t (A2.10) Zeitentwicklung und Funktionalintegral 281 der bereits abgeleitete Propagator der freien Schrödinger-Gleichung, dann erfüllt daher i 2 (A2.11) U (x, y; t) = U0 (x, y; t) exp − V (x)t + O(t ) ~ näherungsweise die volle Gleichung, wobei der Fehler (bedingt durch die Anwendung des Laplace-Operators auf die potentialabhängige Phase) durch Terme höherer Ordnung in t korrigiert wird. Man erhält so für den Propagator formal die Darstellung (N ist durch eine geeignete Normierung des Maßes zu absorbieren): U (x, y; t) = " # 2 N −1 i X 1 xi+1 − xi dxi exp = N lim m − V (xi ) ∆t N →∞ ~ i=0 2 ∆t i=1 Z Z i t 1 2 mẋ(τ ) − V (x(τ )) dτ = Dx(τ ) exp ~ 0 2 y→x Z i = Dx(τ ) exp S[x(τ )] . ~ y→x Z NY −1 Dies nennt man die Funktionalintegraldarstellung des Propagators. Andere Bezeichnungen sind Summation“ über alle Wege, Summation“ über alle Möglichkeiten, ” ” Summation“ über alle Geschichten. ” Jeder Weg (Möglichkeit, Geschichte) wird mit einer Phase gewichtet“, die sich ” aus der klassischen Wirkung ergibt. Das Funktionalmaß Dx(τ ) auf der Menge der Wege schließt eine Normierungskonstante mit ein, sodass die Integration über alle Anfangspunkte y eins ergibt. 282 Anhang B Kapitel A3 Darstellungen der Drehgruppe In einer Tabelle der Elementarteilchen, z.B. den nahezu jährlich erscheinenden Berichten der Particle Data Group“, findet man eine Vielzahl von Quantenzahlen, nach ” denen die Elementarteilchen – Quarks, Leptonen, Eichbosonen, und mittlerweile auch das Higgs-Teilchen – sowie die beobachteten gebundenen Zustände dieser Teilchen – Baryonen, Mesonen, etc. – klassifiziert werden. In allen Fällen handelt es sich dabei um Quantenzahlen, die wir (zumindest näherungsweise oder in Bezug auf bestimmte Wechselwirkungen) mit Symmetrien in Verbindung bringen und die daher Erhaltungsgrößen sind: die Ruhemasse m, der Spin s, die Ladung q, die Parität (−1)P , die Ladungskonjugation (−1)C , sowie weitere Quantenzahlen wie Leptonenzahl, Baryonenzahl, Isospin etc. In diesem Kapitel geht es um die möglichen Quantenzahlen, die im Zusammenhang mit einer Symmetrie auftreten können. Wir hatten in Kapitel 6.1.3 schon gezeigt, dass die Eigenwerte von Observablen L, die sich mit Symmetrien in Verbindung bringen lassen, für die also [H, L] = 0 gilt, Erhaltungsgrößen sind. Das folgte unmittelbar aus der Tatsache, dass Operatoren, die mit dem Hamilton-Operator kommutieren, auch mit dem Zeitentwicklungsoperator kommutieren. In diesem Kapitel untersuchen wir, wie man aus den Eigenschaften einer Symmetrie schon auf die möglichen Eigenwerte schließen kann. Dass dies grundsätzlich möglich sein sollte, zeigt das einfache Beispiel der Paritätstransformationen P ψ(x) = ψ(−x), welche die Bedingung P 2 = 1 erfüllen und daher nur die Eigenwerte ±1 haben können. Da es hier nicht um eine Einführung in die Teilchenphysik geht, wollen wir uns auf eine Quantenzahl beschränken – den Spin s. 283 284 A3.1 Anhang C Symmetrien, Gruppen und ihre Darstellungen Was ist eine Symmetrie? Für eine (mathematische) Beantwortung dieser Frage benötigt man zwei Konzepte: (1) Eine Gruppe von Transformationen und (2) eine Menge, auf die diese Transformationen wirken; eine solche Menge bezeichnet man auch als einen Darstellungsraum der Gruppe. Sind diese beiden Strukturen gegeben, kann man sagen, eine Größe (z.B. ein Element, eine Teilmenge von Elementen oder eine bestimmte Funktion dieser Elemente) ist invariant oder symmetrisch unter der Gruppe, wenn sie sich unter den Gruppentransformationen nicht verändert bzw. auf sich selber abgebildet wird. Man kann sich leicht vorstellen, dass die invarianten Punkte des Darstellungsraums bzw. die kleinsten invarianten Teilmengen (die man auch als Orbits bezeichnet) eine besondere Rolle spielen. Die Gruppe nennt man in solchen Fällen auch eine Symmetriegruppe. Diese allgemeinen Aussagen wollen wir nun etwas konkretisieren. Definition: Eine Gruppe ist eine Menge G mit einer Verknüpfung · : G × G → G, sodass folgende Bedingungen gelten: 1. Assoziativität: Für je drei Elemente g1 , g2 , g3 aus G gilt: g1 · (g2 · g3 ) = (g1 · g2 ) · g3 . 2. Existenz eines Einselements: Es gibt ein Elemente e ∈ G, sodass e · g = g · e = g für alle g ∈ G. 3. Existenz des Inversen: Zu jedem Element g ∈ G gibt es ein Element g −1 ∈ G, sodass g · g −1 = g −1 · g = e. Gilt außerdem noch die Kommutativität, d.h. für alle g1 , g2 ∈ G folgt g1 · g2 = g2 · g1 , spricht man von einer kommutativen Gruppe oder abelschen Gruppe (benannt nach dem Mathematiker Niels Henrik Abel (1802–1829)). In diesem Fall schreibt man statt ·“ auch häufig +“. ” ” Definition: Ein Darstellungsraum einer Gruppe ist eine Menge V zusammen mit einer Verknüpfung · : G × V → V , sodass für alle g1 , g2 ∈ G und alle v ∈ V gilt: (g1 · g2 ) · v = g1 · (g2 · v) und e · v = v. (Die Verwendung desselben Symbols für die Verknüpfung innerhalb der Gruppe und die Verknüpfung mit dem Darstellungsraum sollte zu keinen Problemen führen). Man sagt in diesem Fall auch, die Gruppe wirkt“ auf der Menge ” V. Ganz allgemein ist eine Darstellung einer Gruppe G eine Abbildung D : G → M , wobei M eine im Prinzip beliebige Menge von Objekten sein kann, auf denen eine Multiplikation erklärt ist, sodass gilt: D(g1 ) · D(g2 ) = D(g1 · g2 ) . (A3.1) Darstellungen der Drehgruppe 285 Zumindest für die Bilder der Gruppenelemente muss also in M auch ein Einselement erklärt sein und müssen die Elemente D(g) bezüglich dieses Einselements auch invertierbar sein. Mit anderen Worten: Das Bild von G in M muss selbst eine Gruppe bilden. In der Physik sind wir häufig an sogenannten linearen Darstellungen einer Gruppe interessiert oder auch, was für endlich dimensionale Darstellungen dasselbe ist, an Darstellungen durch Matrizen. Wir suchen also Matrizen {M (g)}, sodass M (g1 )M (g2 ) = M (g1 · g2 ) ∀gi ∈ G (A3.2) (manchmal wählt man auf der linken Seite dieser Gleichung auch die Reihenfolge umgekehrt). Da diese Matrizen auf einem entsprechenden Vektorraum als lineare Abbildungen aggieren, ist dieser Vektorraum gleichzeitig ein Darstellungsraum für die Gruppe. Eine Matrixdarstellung einer Gruppe heißt irreduzibel, wenn Vielfache der Identitätsmatrix die einzigen Elemente sind, die mit allen Gruppenelementen in dieser Darstellung kommutieren. In diesem Fall lassen sich nicht sämtliche Matrizen durch dieselbe unitäre Transformation auf eine Blockdiagonalgestalt bringen. Wann sprechen wir in der Physik von einer Symmetrie? Wenn wir etwas lax sagen, ein System habe eine bestimmte Symmetrie, meinen wir damit meist, dass die mathematischen Funktionen oder Gleichungen, mit denen wir das System beschreiben, diese Symmetrie haben. Eine Funktion f hat eine Symmetrie (man sagt auch, die Funktion ist eine Invariante unter der Symmetriegruppe), wenn die Symmetriegruppe G auf dem Definitionsbereich Df der Funktion wirkt und für jedes Element x ∈ Df gilt: f (x) = f (xg ), wobei xg das Bild von x unter G ist. Der Funktionswert ist also an zwei Punkten, die sich durch die Symmetriegruppe ineinander überführen lassen, derselbe. Von einer Gleichung, die wir immer in die allgemeine Form F [x] = 0 bringen können (man beachte, dass dies auch für Differential- und Integralgleichungen gilt, bei denen x dann Bahnkurven oder Felder darstellen), sagen wir, sie sei symmetrisch, wenn mit jeder Lösung x der Gleichung auch das transformierte Element xg eine Lösung der Gleichung ist. Im Allgemeinen agiert die Symmetriegruppe auf dem Raum der Werte x, für die F [x] definiert ist, die Invarianz fordern wir aber nur für die Lösungsmenge der Gleichung. Von besonderem Interesse sind in der Physik die irreduziblen Darstellungen einer Gruppe und insbesondere die Parameter, durch die sich diese irreduziblen Darstellungen charakterisieren lassen. Wir werden sehen, dass uns diese Parameter auf die Quantenzahlen führen, mit denen wir gewöhnlich Teilchen beschreiben. Diese Quantenzahlen sind die Invarianten“ zu der Gruppe, die zeitlich konstant bleiben. Daher ” eignen sie sich zur Charakterisierung physikalischer Zustände. 286 A3.2 Anhang C Die Drehgruppe Als Beispiel für eine Gruppe, die in der Physik häufig als Symmetriegruppe auftritt, betrachten wir die Drehgruppe, das heißt die Gruppe aller Drehungen im dreidimensionalen Raum. Diese Gruppe bezeichnet man auch als SO(3), für spezielle orthogonale Gruppe in 3 Dimensionen. Bei der Gruppe SO(3) handelt es sich um eine Lie-Gruppe. Etwas vereinfacht ausgedrückt ist eine Lie-Gruppe nicht nur eine Gruppe, sondern sie ist auch eine Mannigfaltigkeit, also ein topologischer Raum, der zumindest lokal (also in genügend kleinen Umgebungen) isomorph zu einer offenen Teilmenge des Rn ist. Wir wissen, dass wir die Drehungen im R3 durch drei Winkel kennzeichnen können, die sogenannten Euler-Winkel, und daher ist die Mannigfaltigkeit der Gruppe SO(3) dreidimensional. Es wurde und wird viel darüber spekuliert, weshalb die Dimension der Drehunggruppe gleich der Dimension des Raumes ist, auf den sie wirkt. In vier Dimensionen ist die Gruppe SO(4) 6dimensional, und in zwei Dimensionen ist die Gruppe SO(2) nur eindimensional. Nur in drei Raumdimensionen ist die Dimension der Drehgruppe ebenfalls dreidimensional. Ich will mich hier diesen Spekulationen nicht anschließen sondern diese Anmerkung nur dazu nutzen zu betonen, dass man zwischen der Dimension des Raumes, auf den die Gruppe wirkt, und der Dimension der Gruppe natürlich unterscheiden muss und diese Dimensionen im Allgemeinen verschieden sind. Für die Drehgruppe SO(3) kennen wir schon eine lineare Darstellung, d.h. einen Satz von Matrizen, welcher die Drehgruppe repränsentiert, nämlich die 3-dimensionalen Rotationsmatrizen. Sie bilden die definierende Darstellung der Gruppe SO(3), d.h., durch ihre Relationen ist die Gruppe SO(3) gerade definiert. Gibt es auch noch andere irreduzible Darstellungen der Gruppe SO(3) durch Matrizen? Es wird sich zeigen, dass es tatsächlich auch in anderen Dimensionen d entsprechend d × d Matrizen gibt, die eine (irreduzible) Matrixdarstellung der Gruppe SO(3) bilden. Zum Beweis dieser Aussage betrachten wir sehr kleine“ (infinitesimale) ” Drehungen, denn es zeigt sich, dass wir mit diesen bereits die gesamte Gruppe generieren können. Das führt uns auf die Lie-Algebra einer Gruppe, und die Elemente dieser Lie-Algebra bezeichnet man auch als die Generatoren der Gruppe. A3.3 Die Lie-Algebra der Drehgruppe Wir können um jede der drei Raumachsen eine Drehung ausführen, und jede beliebige Drehung kann man als einer Hintereinanderschaltung solcher Drehungen ausdrücken. Darstellungen der Drehgruppe 287 Die Drehungen um die drei Achsen sind einfach: 1 0 0 cos α2 0 − sin α2 R1 (α1 ) = R2 (α2 ) = 1 0 0 cos α1 sin α1 0 0 − sin α1 cos α1 sin α2 0 cos α2 (A3.3) cos α3 sin α3 0 R3 (α3 ) = − sin α3 cos α3 0 0 0 1 Das Vorzeichen vor der Sinus-Funktion ist Konvention. Die drei Winkel αi hängen zwar mit den Euler-Winkeln θ, ϕ, ψ zusammen, sind aber nicht mit ihnen identisch. Eine allgemeine Drehung im dreidimensionalen Raum lässt sich als Hintereinanderausführung von einer Drehung um die 1-Achse, einer Drehung um die 3-Achse und einer anschließenden Drehung nochmals um die 1-Achse schreiben: R(θ, ϕ, ψ) = R1 (θ) · R3 (ϕ) · R1 (ψ) . (A3.4) Dies ist die Darstellung einer allgemeinen Drehung durch die Euler-Winkel. Für jede dieser Drehungen betrachten wir nun die Terme in linearer Ordnung in den Winkeln, d.h., wir betrachten Drehungen um sehr kleine Winkel und entwickeln nur bis zur ersten Ordnung. Dabei nutzen wir aus, dass cos α = 1 + O(α2 ) und sin α = α + O(α3 ) . (A3.5) Eine kurze Rechnung ergibt Folgendes: Ri (αi ) = 1 + iαi Li + O(αi2 ) mit den drei Generatoren: 0 0 0 L1 = 0 0 −i 0 i 0 0 0 i L2 = 0 0 0 −i 0 0 (A3.6) 0 −i 0 L3 = i 0 0 0 0 . 0 (A3.7) (Auch in diesem Fall ist die Herausnahme“ eines Faktors i eine Konvektion. In der ” vorliegenden Form sind die Generatoren Li selbst-adjungierte bzw. hermitesche Matrizen, die in der Quantentheorie mit den Observablen des Drehimpulses in Beziehung gebracht werden.) Man spricht in diesem Fall von Generatoren, weil man die Matrizen Ri einfach durch Exponenzieren dieser Generatoren Li wiedergewinnt: Ri (αi ) = exp (iαi Li ) . (A3.8) 288 Anhang C Es reicht also, wenn wir Darstellungen der Matrizen Li finden, um dann (durch Exponenzieren) die Gruppe zu erhalten. Doch welche Eigenschaften müssen wir von diesen Darstellungen der Matrizen Li fordern, sodass wir von einer Darstellung der Lie-Algebra sprechen und die Gruppe rekonstruieren zu können. Es zeigt sich, dass die Kommutatorrelationen zwischen den Generatoren dazu ausreichen. (Der Grund ist, dass man aus Kombinationen der Art R1 R2 R1−1 R2−1 in niedrigster nicht-trivialer Ordnung bereits die Gruppenstruktur rekonstruieren kann, und dieser Ausdruck führt auf die Kommutatoren). Explizites Nachrechnen liefert: [L1 , L2 ] = iL3 , [L2 , L3 ] = iL1 , [L3 , L1 ] = iL2 , (A3.9) oder zusammengefasst: [Li , Lj ] = i 3 X ijk Lk . (A3.10) k=1 Beliebige (reelle) Linearkombinationen dieser drei Matrizen, L = αL1 + βL2 + γL3 , (A3.11) bilden einen Vektorraum – den Tangentialraum an die Gruppe SO(3) bei der Identiät. Auf diesem Vektorraum ist durch die Kommutatorrelationen ein (antisymmetrisches) Produkt definiert. Den Vektorraum mit diesem Produkt bezeichnet man als die LieAlgebra der Drehgruppe. Man bezeichnet die ijk als Strukturkonstanten der Lie-Algebra. Dass im vorliegenden Fall gerade der bekannte -Tensor die Strukturkonstanten bildet ist kein Zufall: Aus der klassischen Mechanik ist bekannt, dass man jede infinitesimale Drehung eines Vektors ~x durch das Kreuzprodukt von ~x mit einem Drehvektor ω ~ schreiben kann. Weitere Beziehungen zum Kreuzprodukt werden später noch offensichtlich. Gesucht sind also Matrizen, welche diese Kommutatorrelationen erfüllen. Es zeigt sich, dass alle Lösungen dieser Bedingung für d × d Matrizen bis auf orthogonale bzw. unitäre Transformationen äquivalent sind, d.h., wir finden für einen festen Wert von d immer nur eine solche Darstellung. Dies ist ein Spezialfall für die Gruppe SO(3) und muss im Allgemeinen nicht gelten: Erstens muss es für allgemeine Gruppen nicht für jeden Wert von d eine (irreduzible) Darstellung geben, und zweitens kann es auch vorkommen, dass es in einer Dimension mehrere nicht äquivalente Darstellugen gibt. Außerdem sollten wir noch erwähnen, dass die Lie-Algebra noch nicht eindeutig die zugehörige Lie-Gruppe festlegt, sondern nur die lokalen Eigenschaften der Gruppe. Die Lie-Algebra wird ja konstruiert, indem man die Gruppe nur in der Nähe der Identität (des Einselements) untersucht, und somit kann man nicht erwarten, dass auch globale topologische Aspekte von der Lie-Algebra erfasst werden. Tatsächlich Darstellungen der Drehgruppe 289 gibt es zu der Lie-Algebra (Gl. A3.9) zwei wichtige topologisch unterschiedliche Gruppenstrukturen: einmal die schon bekannte Gruppe SO(3) und dann die sogenannte Überlagerungsgruppe der Gruppe SO(3), die als SU(2) (spezielle unitäre Gruppe in 2 Dimensionen) bekannt ist. A3.4 Die Lösung für d = 2 — die Pauli-Matrizen Der Fall d = 1 ist trivial. Die einzige Darstellung“ der Drehgruppe SO(3) ist die ” triviale Darstellung, bei der jedes Element durch die 1 repräsentiert wird. Die Generatoren sind in diesem Fall natürlich alle 0 und erfüllen somit ebenfalls trivialerweise die Kommutatorrelationen (A3.9). Wir betrachten also den Fall d = 2. Gesucht sind drei (nicht-triviale) 2 × 2 Matrizen, welche die Kommutatorregeln (A3.9) erfüllen. Diese Matrizen gibt es, und sie hängen direkt mit den sogenannten PauliMatrizen zusammen. Die Pauli-Matrizen sind: ! ! ! 0 1 0 −i 1 0 σ1 = σ2 = σ3 = , (A3.12) 1 0 i 0 0 −1 und die Matrizen Si , welche die Vertauschungsregeln (A3.9) erfüllen, sind die schon in Kapitel 9.1 erwähnten Spinmatrizen: 1 Si = σi . ~ 2 (A3.13) Die Pauli-Matrizen erfüllen die Multiplikatonsregeln: X ijk σk + δij , σ1 σ2 = iσ3 bzw. allgemein σi σj = i (A3.14) k woraus sich sofort die Kommutatorbeziehungen X [σi , σj ] = 2 i ijk σk (A3.15) k ableiten lassen, und nach einer Division dieser Gleichung durch 4 sehen wir, dass die Matrizen σi /2 tatsächlich die gesuchten Kommutatorregeln erfüllen. A3.5 * Allgemeine Dimensionen Wir wollen nun kurz skizzieren, wie man zeigen kann, dass es für beliebige d (Dimensionen) eine Darstellung der Kommutatorrelationen (A3.9) gibt und wie man sie (im Prinzip) konstruieren kann. Dabei verwenden wir ein Verfahren, das auch in der Quantenmechanik oft Anwendung findet: die Konstruktion des Darstellungsraums durch 290 Anhang C Auf- und Absteigeoperatoren (siehe Kap. 6.5.1 zum harmonischen Oszillator). In der Mathematik bezeichnet man die so konstruierten Darstellungen auch manchmal als “heighest weight”-Darstellungen. Zunächst überzeugt man sich durch direktes Nachrechnen, dass aus den Kommutatorrelationen sofort folgt, dass für jede Darstellung die Größe L2 = L21 + L22 + L23 (A3.16) mit allen drei Generatoren kommutiert: [L2 , Li ] = 0 . (A3.17) Man bezeichnet L2 als einen Casimir-Operator. Allgemein ist ein Casimir-Operator einer Lie-Algebra eine Funktion der Generatoren, die mit allen Generatoren der Algebra kommutiert. Wenn die Darstellung irreduzibel ist, wird ein Casimir-Operator durch ein Vielfaches der Identitätsmatrix 1 repräsentiert. Tatsächlich lässt sich für die beiden Darstellungen in d = 2 und d = 3 Dimensionen, die wir für die Matrizen Li bereits kennen, sofort nachrechnen: (d = 2) L2 = 3 ·1 4 (d = 3) L2 = 2 · 1 . (A3.18) Allgemein schreiben wir L2 = l(l + 1) 1 . (A3.19) Da sich L2 als Summe von drei Quadraten von hermiteschen Matrizen schreiben lässt, kann der Faktor nicht negativ sein. Für die beiden genannten Fälle ist l = (d − 1)/2. Diese Relation wird sich auch allgemein als richtig erweisen. Als nächstes betrachten wir die beiden Operatoren L+ = L1 + iL2 und L− = L1 − iL2 (A3.20) und überzeugen uns (wieder durch Ausnutzung der Kommutatorbeziehungen) von den Kommutatorrelationen [L3 , L+ ] = L+ und [L3 , L− ] = −L− . (A3.21) Da wir nach hermiteschen Matrixendarstellungen von L3 suchen (also L†3 = L3 ) können wir für jede Darstellung eine Basis finden, in der L3 diagonal ist. Seien |mi die Eigenzustände zu L3 mit (reellem) Eigenwert m: L3 |mi = m|mi . (A3.22) Offenbar folgt aus den Kommutatorrelationen (A3.21): L3 L+ |mi = L+ L3 |mi + L+ |mi = (m + 1)L+ |mi (A3.23) Darstellungen der Drehgruppe 291 und entsprechend L3 L− |mi = (m − 1)L− |mi . (A3.24) L+ |mi und L− |mi sind also ebenfalls Eigenvektoren von L3 , sofern |mi Eigenvektor ist, und zwar jeweils zu den Eigenwerten m + 1 und m − 1. L+ und L− sind demnach Auf- und Absteigeoperatoren im Sinne von Abschnitt 6.5.1. Wir verwenden nochmals die allgemeinen Kommutatorbeziehungen der LieAlgebra für die Identität: L− L+ = (L1 − iL2 )(L1 + iL2 ) = L21 + L22 + i[L1 , L2 ] (A3.25) L+ L− = L2 − L3 (L3 + 1) . (A3.26) oder Nun kommt das entscheidende Argument. Angenommen, |mi ist ein normierter Eigenvektor, also hm|mi = 1, dann gilt für das Normquadrat von L+ |mi (man beachte, dass (L+ )† = L− ): kL+ |mik2 = hm|L− L+ |mi = hm|[L2 − L3 (L3 + 1)]|mi = l(l + 1) − m(m + 1) (A3.27) oder kL+ |mik = p l(l + 1) − m(m + 1) . (A3.28) Damit dieser Vektor aber normierbar bleibt (wir suchen nur Darstellungen in einem Vektorraum mit positiv-definitem Skalarprodukt), muss m ≤ l sein. Da wir andererseits aber durch wiederholte Anwendung von L+ auf einen Eigenzustand von L3 den Wert von m beliebig groß werden lassen können, muss es einen Vektor |mi geben, für den L+ |mi = 0. Das ist genau dann der Fall, wenn l = m. Umgekehrt (indem wir L− |mi betrachten) folgt nach demselben Argument, dass m ≥ −l und der Wert m = −l auch angenommen werden muss. Da L+ bzw. L− die Eigenwerte m von L3 aber in ganzzahligen Schritten verändern, muss somit 2l ganzzahlig sein, und die Eigenwerte m können die Wert −l, −l + 1, −l + 2, ..., +l annehmen. Lediglich durch Ausnutzung der Kommutatorrelationen (A3.9) und der Forderung, dass wir nach hermiteschen Darstellungen der Matrizen Li in positiv-definiten Vektorräumen suchen, sind wir also zu folgendem Schluss gekommen: 1. Die Darstellungen der Drehgruppe werden durch eine Zahl l charakterisiert, wobei der Wert des Casimir-Operators L2 in einer solchen Darstellung den Wert l(l + 1) hat und l nur die Werte l = 0, 21 , 1, 23 , 2, ... annehmen kann. 2. Für festes l gibt es 2l + 1 verschiedene Eigenvektoren zu L3 und damit ist die Darstellung 2l + 1-dimensional. Insbesondere finden wir für jede Dimension d eine Darstellung mit l = (d − 1)/2. 292 Anhang C 3. Für ein gegebenes l nimmt der Eigenwert m zu L3 die Werte l, l − 1, l − 2, ..., −l an. Zur Veranschaulichung betrachten wir nochmals die beiden Fälle d = 2 und d = 3. Für d = 2 ist S3 = σ3 /2 bereits eine Diagonalmatrix (vgl. Gl. A3.12) mit den beiden Eigenwerten m = ± 12 . Für d = 3 ist L3 (aus Gl. A3.7) noch nicht diagonal, doch ein Vergleich von L3 mit der Pauli-Matrix σ2 , welche die Eigenwerte ±1 hat, zeigt sofort, dass L3 tatsächlich die Eigenwerte +1, 0, −1 hat. Wir können nun auch die Darstellungen der Drehgruppe zu beliebiger Dimension d explizit konstruieren (zumindest im Prinzip): Wir beginnen mit L3 als Diagonalmatrix mit den Elementen m = l, l − 1, ..., −l auf der Diagonalen. Nun konstruieren wir die beiden Matrizen L+ und L− , die als Auf- bzw. Absteigermatrizen nur Elemente auf der ersten Nebendiagonalen haben (L+ auf der oberen Nebendiagonalen und L− auf der unteren), und diese Elemente sind durch Gl. A3.28 (und eine entsprechende Gleichung für L− ) gegeben. Aus L+ und L− erhalten wir durch Umkehrung der Linearkombinationen in Gl. (A3.20) L1 und L2 zurück. A3.6 Drehimpuls und Spin in der Quantenmechanik Die Drehgruppe gehört zu den zentralen Invarianzgruppen der Physik, sowohl in der Newton’schen als auch der Relativistischen Mechanik. Wenn ein quantenmechanisches System rotationsinvariant ist, bedeutet dies, dass mit jeder Lösung ψ(x) (ausgedrückt als Wellenfunktion im Ortsraum) der Schrödinger-Gleichung auch die transformierte Lösung ψ(Rx) (wobei Rx den mit der Rotationsmatrix R rotierten Punkt darstellt) eine Lösung ist. Die Transformation ψ(x) → ψ(Rx) impliziert eine (unitäre) Darstellung der Rotationsgruppe U (R) auf dem Raum der Wellenfunktionen bzw. dem Raum der Zustände, und die Invarianz bedeutet, dass der Hamilton-Operator und U (R) kommutieren. Nun sind die Operatoren U (R) im Allgemeinen keine Observable. Allerdings sind die Generatoren von U (R) Observable, nämlich die Observablen zum Drehimpuls. Daher kommutieren die Drehimpulsoperatoren mit dem Hamilton-Operator, wenn der Hamilton-Operator rotationsinvariant ist. Wie üblich führt dies zu Erhaltungsgrößen, d.h., wie schon in Kap. 6.1.3 und Kap. 6.6 angedeutet, die Quantenzahlen des Drehimpulses sind erhalten bzw. man kann die Energieeigenzustände auch nach den Quantenzahlen des Drehimpuls klassifizieren. Betrachten wir zunächst die Kommutatorbeziehungen zwischen den Drehimpulsoperatoren der Quantentheorie: Seien L1 = Q2 × P3 − Q3 × P2 , L2 = Q3 × P1 − Q1 × P3 , L3 = Q1 × P2 − Q2 × P1 (A3.29) Darstellungen der Drehgruppe 293 bzw. allgemein Li = X ijk Qj Pk (A3.30) jk die Komponenten des Drehimpulsoperators (noch unabhängig von einer Basis). Dann folgt aus den kanonischen Vertauschungsrelationen: [L1 , L2 ] = [(Q2 P3 − Q3 P2 ) , (Q3 P1 − Q1 P3 )] = i~ (−Q2 P1 + P2 Q1 ) = i~ L3 , und ganz entsprechend [L2 , L3 | = i~L1 , [L3 , L1 ] = i~L2 (A3.31) bzw. allgemein [Li , Lj ] = i~ X ijk Lk . (A3.32) k Wir erhalten also für die Komponenten des Drehimpulses dieselben Kommutatorbeziehungen (bis auf einen Faktor ~), wie für die Generatoren der Drehgruppe (Gl. A3.9). Das ist auch nicht überraschend, denn der Drehimpuls ist ja gerade die Erhaltungsgröße zur Rotationsinvarianz und damit der Generator zur Darstellung der Drehgruppe auf den physikalischen Zuständen. Wir können somit die Schlussfolgerungen aus dem letzten Abschnitt direkt übernehmen und schließen: √ 1. Die Eigenwerte zum Betrag des Drehimpulses |L| = L2 nehmen die Werte p ~ l(l + 1) an, wobei l = 0, 12 , 1, 23 , 2, .... 2. Für festes l gibt es 2l + 1 verschiedene Eigenzustände von L3 mit den Quantenzahlen l3 = ~m mit m = l, l − 1, l − 2, ..., −l. Wie schon gegen Ende von Abschnitt A3.3 angedeutet, bestimmt die Zahl l nur die Darstellungen der Lie-Algebra, und diese müssen nicht immer auch Darstellungen der Drehgruppe SO(3) sein, sondern es kann sich dabei auch um Darstellungen von SU(2) (der Überlagerungsgruppe der Drehgruppe) handeln. SU(2) ist in gewisser Hinsicht doppelt“ so groß wie SO(3): Eine Dreuhung um 360◦ führt nicht wieder an den ” Ausgangspunkt zurück, sondern erst eine Drehung um 720◦ . Ist man daher konkret an Darstellungen der Drehgruppe SO(3) interessiert, kommen nur die ganzzahligen Werte für l in Frage. Dies ist auch der Grund, weshalb wir bei unseren Überlegungen zum Wasserstoffatom (Kap. 6.6) nur auf die Darstellungen zu ganzzahligen Werte von l gestoßen sind: Die Forderung, dass die Kugelflächenfunktionen Ylm (θ, ϕ) auf der Kugeloberfläche eindeutige Werte annehmen (und stetig sind), führte auf diese Auswahl. Wir können daher nochmals zusammenfassen: 294 Anhang C • Die Darstellungen der Drehgruppe SO(3), wie sie bei der Behandlung des Bahndrehimpulses von Teilchen auftreten, lassen für den Betrag des Drehimpulses |L| p nur die Werte ~ l(l + 1) zu, wobei l ganzzahlig ist. Damit erhebt sich die Frage, ob die anderen Darstellungen der Lie-Algebra, die zu halbzahligen Werten für l gehören und zu Darstellungen der Überlagerungsgruppe SU(2) führen, in der Physik eine Bedeutung haben. Dies ist tatsächlich der Fall: Der Spin von Elementarteilchen, der einer intrinsischen Eigenschaft dieser Teilchen entspricht, kann in der Tat auch halbzahlige Werte annehmen. Bei Teilchen mit halbzahligem Spin spricht man von Fermionen, bei Teilchen mit ganzzahligem Spin von Bosonen. Beispielsweise ist das Elektron ein Fermion mit Spin s = 12 . Daraus ergeben sich zwei Fragestellungen: (1) Was hat der Spin von Teilchen mit dem Drehimpuls zu tun?, und (2) weshalb spielt hier die Lie-Algebra bzw. die Überlagerungsgruppe SU(2) die wichtige Rolle und nicht die Gruppe SO(3) der Drehungen. Zur ersten Frage stellt man experimentell fest, dass der Gesamtdrehimpuls eines abgeschlossenen Systems (beispielsweise bei Zerfallsprozessen) nur dann erhalten ist, wenn man auch den Spin eines Teilchens berücksichtigt. Beispielsweise trägt ein Photon den Spin 1 und ist damit für die Auswahlregel ∆l = ±1 (in Einheiten von ~) bei vielen elektronischen Übergängen im Atom verantwortlich. Die bekannte 21 cm Linie des Wasserstoffs beruht auf dem Umklappen des Spins des Elektrons im Grundzustand von Wasserstoff, was gerade einer Änderung des Drehimpulses des Wasserstoffatoms um ∆l = ±1 entspricht. Die Tatsache, dass Spin und Bahndrehimpuls zu einem Gesamtimpuls koppeln, zeigt, dass der Spin zum Drehimpuls beiträgt. Allerdings sollte man sich den Spin nicht als eine Eigendrehung von Teilchen vorstellen, wie es oft in populärwissenschaftlichen Darstellungen suggeriert wird. Zur zweiten Frage: Ein quantenmechanischer Zustand wird durch Strahlen in einem Hilbertraum beschrieben, daher sucht man nicht nur nach Vektorraumdarstellungen der Gruppe SO(3), sondern nach sogenannten projektiven Darstellungen. In diesem Fall muss eine Drehung um 360◦ nur wieder in denselben Strahl zurückführen, nicht aber in denselben Vektor. Die Darstellungen von SU(2) führen einen Vektor bei einer Drehung um 360◦ in sein Negatives über, dies entspricht aber physikalisch demselben Zustand. Kapitel A4 Zitate zur Quantentheorie Das Spektrum, wie Physiker oder Wissenschaftsphilosophen über die Quantenmechanik denken, ist breit gefächert. Oftmals wird noch nicht einmal klar, was genau die Probleme sind, die uns an der Quantentheorie stören. Daher habe ich in diesem Anhang einige Zitate zur Quantentheorie zusammengetragen in der Hoffnung, die Vielfalt der Meinungen und der Möglichkeiten, unser Unbehagen ausdrücken zu können, zu verdeutlichen. Teilweise wurden diese Zitate von den TeilnehmerInnen an der Vorlesung selbst ausgewählt. Albert Einstein • Die Quantenmechanik ist sehr Achtung gebietend. Aber eine innere Stimme sagt mir, dass das noch nicht der wahre Jakob ist. Die Theorie liefert viel, aber dem Geheimnis des Alten bringt sie uns kaum näher. Jedenfalls bin ich überzeugt, dass der Alte nicht würfelt. - oft zitiert als Gott würfelt nicht.“ ” (Albert Einstein, Brief an Max Born, 4. Dezember 1926, Einstein-Archiv 8180, zitiert nach Alice Calaprice (Hrsg.): Einstein sagt, Piper-Verlag, München, Zürich 1996, ISBN 3-492-03935-9, Seite 143.) • Es scheint hart, dem Herrgott in die Karten zu gucken. Aber dass er würfelt und sich telepatischer Mittel bedient (wie es ihm von der gegenwärtigen Quantentheorie zugemutet wird), kann ich keinen Augenblick glauben. (Albert Einstein über die Quantenmechanik in einem Brief an Cornelius Lanczos, 21. März 1942, Einstein-Archiv 15-294, zitiert nach Einstein, Briefe, Seite 65, zitiert nach Alice Calaprice (Hrsg.): Einstein sagt, Piper-Verlag, München, Zürich 1996, ISBN 3-492-03935-9, Seite 146.) • Der Gedanke, dass ein in einem Strahl ausgesetztes Elektron aus freiem Entschluss den Augenblick und die Richtung wählt, in der es fort springen will, ist 295 296 Anhang D mir unerträglich. Wenn schon, dann möchte ich lieber Schuster oder gar Angestellter in einer Spielbank sein als Physiker. (Brief an Max Born, 1924, zitiert in Albert Einstein und Max Born, Briefwechsel, Rowolt, Reinbek, 1969, S. 67.) Niels Bohr • Denn wenn man nicht zunächst über die Quantentheorie entsetzt ist, kann man sie doch unmöglich verstanden haben. (Niels Bohr zitiert in Der Teil und das Ganze. Gespräche im Umkreis der Atomphysik von Werner Heisenberg, R. Piper & Co., München, 1969, S. 280.) • Nun bedeutet aber das Quantenpostulat, dass [...] weder den Phänomenen noch dem Beobachtungsmittel eine selbständige physikalische Realität im gewöhnlichen Sinne zugeschrieben werden kann. (Niels Bohr, Das Quantenpostulat un die neuere Entwicklung in der Atomistik, in Die Naturwissenschaften, Band 16. Kaiser-Wilhelm-Gesellschaft zur Förderung der Wissenschaften, Springer-Verlag, Berlin, 1928, S. 245.) • There is no quantum world. There is only an abstract physical description. It is wrong to think that the task of physics is to find out how nature is. Physics concerns what we can say about nature. (The philosophy of Niels Bohr, Aage Peterson in Bulletin of the Atomic Scientists, Vol. 19 (Sept. 1963); Werner Heisenberg • Die Quantentheorie ist so ein wunderbares Beispiel dafür, dass man einen Sachverhalt in völliger Klarheit verstanden haben kann und gleichzeitig doch weiß, dass man nur in Bildern und Gleichnissen von ihm reden kann. (Physik und Philosophie) • Die Quantentheorie lässt keine völlig objektive Beschreibung der Natur mehr zu. (Physik und Philosophie) • In den Experimenten über Atomvorgänge haben wir mit Dingen und Tatsachen zu tun, mit Erscheinungen, die ebenso wirklich sind wie irgendwelche Erscheinungen im täglichen Leben. Aber die Atome oder die Elementarteilchen sind nicht ebenso wirklich. Sie bilden eher eine Welt von Tendenzen und Möglichkeiten als eine von Dingen und Tatsachen. (Physik und Philosophie) Zitate zur Quantentheorie 297 • Nicht mehr die objektiven Ereignisse, sondern die Wahrscheinlichkeiten für das Eintreten gewisser Ereignisse können in mathematischer Form festgelegt werden. Nicht mehr das faktische Geschehen selbst, sondern die Möglichkeit zum Geschehen – die Potentia“, wenn wir diesen Begriff der Philosophie des Aristo” teles verwenden wollen – ist strengen Naturgesetzen unterworfen. (1958 auf der Gedenkfeier zu Max Plancks 100. Geburtstag) • Die Elementarteilchen können mit den regulären Körpern in Platos Timaios“ ” verglichen werden. Sie sind die Urbilder, die Ideen der Materie. (Der Teil und das Ganze) David Bohm • Das Elektron beobachtet die Umgebung, soweit es auf eine Bedeutung in seiner Umgebung reagiert. Es handelt genauso wie die Menschen. (David Bohm; Wissenschaftler und Weise – www.zitate-aphorismen.de) • So stimmen die Relativitätstheorie und die Quantentheorie doch beide in der Notwendigkeit überein, die Welt als ein ungeteiltes Ganzes anzuschauen, worin alle Teile des Universums einschließlich dem Beobachter und seinen Instrumenten zu einer einzigen Totalität verschmelzen und sich darin vereinigen. • If the price of avoiding non-locality is to make an intuitive explanation impossible, one has to ask whether the cost is too great. (Physics Reports 144 (1987) 321.) Richard Feynman • Ein Philosoph hat einmal behauptet: Naturwissenschaft setzt notwendig voraus, ” dass gleiche Umstände immer auch gleiche Auswirkungen haben.“ Nun, dem ist nicht so. (Impulse Physik, Kursstufe, Klettverlag, S.190) • Es gab eine Zeit, als Zeitungen sagten, nur zwölf Menschen verständen die Relativitätstheorie. Ich glaube nicht, dass es jemals eine solche Zeit gab. Auf der anderen Seite denke ich, es ist sicher zu sagen, niemand versteht Quantenmechanik. (Richard Feynman, The Character of Physical Law, MIT-Press 1967, Kapitel 6.) • ... the “paradox” is only a conflict between reality and your feeling of what reality “ought to be”. (Feynman Lectures on Physics, vol. III, S.18-9 (1965).) 298 Anhang D • We have always had a great deal of difficulty understanding the world view that quantum mechanics represents. [...] I cannot define the real problem, therefore I suspect there’s no real problem, but I’m not sure there’s no real problem. (Int. J. Theor. Phys. 21 (1982) 471.) Andere • Die Quanten sind doch eine hoffnungslose Schweinerei! (Max Born an Albert Einstein, zitiert in Albert Einstein und Max Born: Briefwechsel 1916 bis 1955, Rowohlt, Reinbek bei Hamburg, 1969, S. 34.) • Man kann die Welt mit dem p-Auge und man kann sie mit dem q-Auge ansehen, aber wenn man beide Augen zugleich aufmachen will, dann wird man irre. (Wolfgang Pauli; Wissenschaftlicher Briefwechsel mit Bohr, Einstein, Heisenberg u.a.; Band I, 1919–1929; S.347) • Wir dachten immer, wenn wir Eins kennen, dann kennen wir auch Zwei, denn Eins und Eins sind Zwei. Jetzt finden wir heraus, dass wir vorher lernen müssen, was und“ bedeutet. ” (Sir Arthur Eddington; www.oberstufephysik.de/quantensprueche.html) • Wohl keine Entwicklung der modernen Wissenschaft hat das menschliche Denken nachhaltiger beeinflußt als die Geburt der Quantentheorie. Jäh wurden die Physiker eine Generation vor uns aus jahrhundertealten Denkmustern herausgerissen und fühlten sich zur Auseinandersetzung mit einer neuen Metaphysik aufgerufen. Bis zum heutigen Tag währen die Qualen, die dieser Prozeß der Neuorientierung bedeutete. Im Grunde haben die Physiker einen schweren Verlust erlitten: Sie verloren ihren Halt in der Realität. (Original engl. – Bryce DeWitt und Neill Graham zitiert in: Quantenrealität : jenseits der Neuen Physik / Nick Herbert: aus dem Engl. von Traude Wess. Basel [etc.] : Birkhäuser, cop. 1987 ISBN 3-7643-1871-6.) • Einstein sagte, die Welt kann nicht so verrückt sein. Heute wissen wir, die Welt ist so verrückt. (Daniel M. Greenberger - www.oberstufenphysik.de/quantensprueche.html) • Properties [...] have no independent reality outside the context of a specific experiment arranged to observe them: the moon is not there when nobody looks. (David Mermin; Quantum Mysteries for Anyone, in The Journal of Philosophy 78 (1981) S. 397–408.) • Wer [...] die verrückte“ Physik mit Namen Quantenmechanik beschreiben will, ” kommt nicht ohne Ausdrücke wie Ekel und Entsetzen, Schock und Schmerzen, Zitate zur Quantentheorie 299 wahnsinnig und widerlich aus. Den Physikern gingen die Gegenstände verloren, weil sich herausstellte, dass die Atome keine Dinge sind. Sie sind Wirklichkeiten, hinter denen keine dinghafte Substand mehr steckt. Sie sind factual facts“ wie ” es in der Kunst heißt, aber keine actual facts“. Sie sind wirklich (wirksam), ” ohne (eine) Realität zu haben. (Ernst Peter Fischer; Leonardo, Heisenberg & Co. Eine kleine Geschichte der Wissenschaft in Protraits. 2. Auflage, Piper Verlag, München, 2003, S. 209.) • In der Quantentheorie geht es um die Wechselwirkung des Wirklichen mit dem Möglichen. (David Deutsch; www.psp-tao.de) • Es gibt keine Materie, sondern nur ein Gewebe von Energien, dem durch intelligenten Geist Form gegeben wurde. (Max Planck; in Ulrich Warnke, Quantenphilosophie und Spiritualität; 2. Aufl., Scorpio, 2011; S. 82) • Ich bin nicht ein Anhänger des Konstruktivismus, sondern ein Anhänger der Kopenhagener Interpretation. Danach ist der quantenmechanische Zustand die Information, die wir über die Welt haben ... Es stellt sich letztlich heraus, dass Information ein wesentlicher Grundbaustein der Welt ist. Wir müssen uns wohl von dem naiven Realismus, nach dem die Welt an sich existiert, ohne unser Zutun und unabhängig von unserer Beobachtung, irgendwann verabschieden. (Anton Zeilinger; Interview mit Andrea Naica-Loebell, Telepolis 7. Mai 2001) • Das Revolutionäre und zugleich Paradoxe an der Quantenphysik besteht also darin, dass gerade die Physik als die rationalste aller Erfahrungswissenschaften das Bestehen einer grundsätzlichen Schranke für die wissenschaftliche Rationalisierung behauptet, und das dürfte der eigentliche Grund dafür gewesen sein, dass von so vielen Seiten gegen den quantenphysikalischen Indeterminismus Sturm gelaufen wurde. (Krings, Baumgartner, Wild: Handbuch philosophischer Grundbegriffe, München, Kösel, 1973, S.884. www.psp-tao.de/zitate/details/Krings_Baumgartner_Wild/672 ) • Quantum theory was split up into dialects. Different people describe the same experiences in remarkably different languages. This is confusing even to physicists. (David Finkelstein, in Physical Process and Physical Law, in Physics and Whitehead: quantum, process, and experience, Timothy E. Eastman, Hank Keeton (Hrsg.), SUNY Press, 2004, S. 181.) 300 Anhang D • The universe does not exist ‘out there’, independent of us. We are inescapably involved in bringing about that which appears to be happening. We are not only observers. We are participators. In some strange sense, this is a participatory universe. Physics is no longer satisfied with insights only into particles, fields of force, into geometry, or even into time and space. Today we demand of physics some understanding of existence itself. (John A. Wheeler; in Dennis Brian, The Voice of Genius: Conversations with Nobel Scientists and other Luminaries, 127.) Literaturverzeichnis [1] Aspect, A.; Grangier, Ph., und Roger, G.; Experimental Realization of EinsteinPodolsky-Rosen-Bohm Gedankenexperiment: A New Violation of Bell’s Inequalities; Phys. Rev. Lett. 49 (1982) 91–94. Aspect, Alain; Dalibard, Jean, und Roger, Gérard: Experimental Test of Bell’s Inequalities Using Time-Varying Analyzers; Phys. Rev. Lett. 49 (1982) 1804–1807. [2] Bacciagaluppi, G., Valentini, Quantum Theory at the Crossroads - Reconsidering the 1927 Solvay Conference; Cambridge University Press, 2009. [3] Bell, J.S.; Speakable and Unspeakable in Quantum Physics, 2. edition, Cambridge University Press (2004). [4] Bell, J.S.; On the problem of hidden variables in quantum theory; Rev. Mod. Phys. 38 (1966) 447. Abgedruck in [3]. [5] Bell, J.S., and Nauenberg, M.; The moral aspects of quantum mechanics; in Preludes in Theoretical Physics, A. De Shalit, H. Fesbach und L. van Hove (Hrsg.), North Holland, Amsterdam (1966) 279–86. Abgedruckt in [3]. [6] Bell, J.S.; On the Einstein-Podolsky-Rosen paradox; Physics 1 (1964) 195. Abgedruckt in [3]. [7] Bell, J.; Against Measurement‘; in 62 Years of Uncertainty, Erice, 5–14 August ’ 1989; also in Physics World 8 (1990) 33–40. Abgedruckt in [3]. [8] Bell, J., The Trieste Lecture of John Stewart Bell; J. Phys. A: Math. Theor. 40 (2007) 2919–2933. [9] Bohm, D.J.; Quantum Theory; Dover Publications, new ed. 1989. [10] Bohm, D.J.; A Suggested Interpretation of the Quantum Theory in Terms of “Hidden” Variables I & II; Phys. Rev. 85 (1952) S. 166 & 180. [11] Bohr, N.; On the Constitution of Atoms and Molecules; insgesamt drei Artikel in der Zeitschrift Philosophical Magazine 26 (1913): Part I, 1–25; Part II Systems 301 302 LITERATURVERZEICHNIS Containing Only a Single Nucleus, 476–502; Part III Systems containing several nuclei, 857–875. [12] Bohr, N.; Can quantum-mechanical description of physical reality be considered complete?; Phys. Rev. 48 (1935) 696. [13] Born, M., Heisenberg, W., und Jordan, P.; Zur Quantenmechanik II; Zeitschrift f. Physik 35 (1925) 557–615. [14] Born, M.; Zur Quantenmechanik der Stoßvorgänge; Zeitschrift für Physik 37 (12) (1926) 863–867. [15] Cabello, A.; Bibliographic guide to the foundations of quantum mechanics and quantum information; ArXiv:quant-ph/0012089. [16] Casimir, Hendrik; On the attraction between two perfectly conducting plates, Proc. Kon. Nederland. Akad. Wetensch. B51 (1948) 793. [17] Caves, C.M., Fuchs, Ch.A., Schack, R., Unknown Quantum States: The Quantum de Finetti Representation; J. Math. Phys. 43 (2002) 4537. [18] Clauser, J.F., Horne, M.A., Shimony, A., and Holt, R.A.; Proposed experiment to test local hidden-variable theories, Phys. Rev. Lett. 23 (1969) 880-884. [19] Dawydow, A.S., Quantenmechanik; VEB Deutscher Verlag der Wissenschaften, Berlin 1974. [20] de Broglie, L., Sur la possibilité de relier les phénomènes de’interference et de diffraction à la théorie des quanta de lumière; Comptes Renus 183 (1926) 447448. de Broglie, L., La mécanique condulatoire et la structure atomique de la matiére et du rayonnement, Journal de Physique et du Radium 8 (1927) 225–241. [21] DeWitt, B.S., Quantum Mechanics and Reality: Could the solution to the dilemma of indeterminism be a universe in which all possible outcomes of an experiment actually occur? Physics Today 23 (Sept. 1970) 30–40. [22] Dirac, P.A.M.; The Principles of Quantum Mechanics; (First Editioin 1930); Fourth Edition, Oxford University Press 1984. [23] Einstein, A.; Die Planck’sche Theorie der Strahlung und die Theorie der spezifischen Wärme; Annalen der Physik 22 (1907) 180–190. [24] Einstein, A., Podolski, B., und Rosen, N.; Can quantum-mechanical description of physical reality be considered complete?; Phys. Rev. 47 (1935) 777–780. LITERATURVERZEICHNIS 303 [25] Elitzur, A.C., Vaidman, L.; Quantum mechanical interaction-free measurements, Found. of Phys. 23 (1993), 987. [26] D’Espagnat, B.; Quantentheorie und Realität; Spektrum der Wissenschaft, 1980, Heft 1, S. 69. [27] Everett, H., Relative State Formulation of Quantum Mechanics, Rev. Mod. Phys. 29 (1957) 454–462 Theory of the Universal Wavefunction; Thesis, Princeton University, 1956. [28] Falk, G., Ruppel, W.; Energie und Entropie. Eine Einführung in die Thermodynamik; Springer Verlag, 1976. [29] Feynman, R.P.; QED: The Strange Theory of Light and Matter; Princeton University Press, 1985. [30] Feynman, R.P.; The Character of Physical Law, Penguin Books, 1992. [31] Feynman, R.; Simulating Physics with Computers; Int. Journ. of Theor. Phys. 21 (1982) 467–488. [32] Filk, Th.; Relational interpretation of the wave function and a possible way around Bell’s theorem; Int. Journ. Theor. Phys. 45 (2006) 1166–1180. [33] Ghirardi, G., Rimini, A., Weber, T., A Model for a Unified Quantum Description of Macroscopic and Microscopic Systems, in Quantum Probability and Applications, Accardi, L. et al. (Hrsg.), Springer, Berlin (1985). Ghirardi, G., Rimini, A., Weber, T., Unified Dynamics for microscopic and macroscopic systems, Phys. Rev. D 34 (1985) 470. [34] Gilder, L.; The Age of Entanglement: When Quantum Physics was Reborn; Vintage Verlag, 2009. [35] Gottfried, K., und Yan, T.-M., Quantum Mechanics - Fundamentals; Springer 2003. [36] Grawert, G.; Quantenmechanik; Akademische Verlagsgesellschaft, Frankfurt am Main (1973). [37] Guillemin, V., Sternberg, S.; Symplectic Techniques in Physics, Cambridge University Press (1984). [38] Heisenberg, W.; Der Teil und das Ganze; Piper Verlag GmbH, München, 1969; 6. Auflage 2005. 304 LITERATURVERZEICHNIS [39] Heisenberg, W.; Anmerkungen zu dem Artikel von Renninger [66] im Anschluss an diesen Artikel. [40] Hermann, G.; Die naturphilosophischen Grundlagen der Quantenmechani; in Ab” handlungen der Fries’schen Schule“, Bd. VI, S. 75–152, 1935. [41] Hong, D.K., Ou, Z.Y., Mandel, L.; Measurement of subpicosecond time intervals between two photons by interference; Phys. Rev. Lett. 59 (1987) 2044. [42] Hornberger, K., Gerlich, S., Haslinger, P., Nimmrichter, S., Arndt, M.; Colloquium: Quantum interference of clusters and molecules; Rev. Mod. Phys. 84 (2012) 157. [43] Horodecki, R., Horodecki, P., Horodecki, M., Horodecki, K.; Quantum entanglement; Rev. Mod. Phys. 81 (2009) 865–942. [44] James, W.; Principles of Psychology; 2 Volumes; Holt and Macmillan, New York/London 1890. [45] Jammer, M.; The Philosophy of Quantum Mechanics; Wiley, 1974. [46] Károlyházy, F.; Gravitation and Quantum Mechanics of Macroscopic Objects; Nuovo Cimento 42 A (1966) 1506 (alte Seitenangabe 390). [47] Kragh, H., Quantum Generations: A History of Physics in the Twentieth Century; Princeton University Press, 2002. [48] Kwiat, P., Weinfurther, H., Herzog, T., Zelinger, A., Kasevich, M.A.; Interactionfree measurement; Phys. Rev. Lett. 74 (1995) 4763. [49] Kumar, M.; Quantum: Einstein, Bohr and the Great Debate About the Nature of Reality; Icon Books (2008). [50] Lambrecht, Astrid; Das Vakuum kommt zu Kräften: Der Casimir-Effekt; Physik in unserer Zeit 36 (2005) 85–91. [51] von Laue, Max; Geschichte der Physik; Universitäts-Verlag Bonn, 1947. [52] Leggett, A.J., Testing the limits of quantum mechanics: Motivation, state of play, prospects; Vortrag an der Universität Freiburg, 22.11.2010. [53] Leibniz, G.W., Vernunftprinzipien der Natur und der Gnade - Monadologie; Verlag Felix Meiner, 1982. LITERATURVERZEICHNIS 305 [54] Liang, Y.-C., Spekkens, R.W., Wiseman, H.M., Specker’s Parable of the Overprotective Seer: A Road to Contextualiy, Nonlocality, and Complementarity; arXiv:1010.1273v2 [quant-ph]. [55] Madelung, E., Quantentheorie in hydrodynamischer Form, Zeitschrift für Physik 40 (1926) 322–326. [56] Modi, K., Brodutch, A., Cable, H., Paterek, T., Vedral, V.; Quantum discord and other measures of quantum correlation; arXiv: [quant-ph] 1112.6238v1. [57] Nairu, O., Arndt, M. und Zeilinger, A.; Quantum interference experiments with large molecules; Am. J. Phys. 71 (4) (2003) 319–325. [58] Newton, I.; Opticks: or, a treatise of the Reflections, Refractions, Inflections and Colours of Light (1704); Deutsch Optik: Oder Abhandlung über Spiegelungen, Brechungen, Beugungen und Farben des Lichts; Verlag Harri Deutsch (1996). [59] Nielsen, M.A., Chuang, I.L.; Quantum Computation and Quantum Information; Cambridge Series on Information and the Natural Sciences; Cambridge University Press, 2000. [60] Pauli, W., Brief an Heisenberg vom 15. Juni 1935, in Wolfgang Pauli - Scientific Correspondence with Bohr, Einstein, Heisenberg a.o., Karl von Meyenn (Hrsg.), Band II 1930–1939, Springer-Verlag, 1985. [61] Pauli, W., Bemerkungen zum Problem der Verborgenen Parameter in der Quantenmechanik und zur Theorie der Führungswelle, in Wolfgang Pauli - Das Gewissen der Physik, C.P. Enz und K. von Meyenn (Hrsg.), Friedr. Vieweg & Sohn, Braunschweig, (ursprünglich in der Festschrift zu de Broglies 60. Geburtstag, 1957). [62] Penrose, R.; Computerdenken. Des Kaisers neue Kleider oder Die Debatte um Künstliche Intelligenz, Bewusstsein und die Gesetze der Natur; Spektrum der Wissenschaft, Heidelberg (1991). [63] Penrose, R.; Zyklen der Zeit ; Spektrum-Verlag, Heidelberg, 2011. [64] Planck, M.; Brief an Robert Williams Wood von 1931. Wiedergabe in Frühgeschichte der Quantentheorie“ von A. Hermann (Physik Verlag, Mosbach ” 1969). Siehe auch den Artikel ... ich dachte mir nicht viel dabei ...‘ Plancks ungerader ”’ Weg zur Strahlungsformel“ von D. Giulini und N. Straumann; in Physikalische Blätter 56 (12) (2000) 37–42. 306 LITERATURVERZEICHNIS [65] von Neumann, J.; Mathematische Grundlagen der Quantentheorie; SpringerVerlag (1932). [66] Renninger, M.; Messung ohne Störung des Meßobjekts; Z. Physik 158 (1960) 417. [67] Schrödinger, E.; Die gegenwärtige Situation in der Quantenmechanik; Die Naturwissenschaften 23 (1935) 807–812, 823–828, 844-849. [68] Schrödinger, E.; Über die Unanwendbarkeit der Geometrie im Kleinen; Die Naturwissenschaften 31 (1934) 518–520. [69] Scully, M.O., Drühl, K.; Quantum eraser: A proposed photon correlation experiment concerning observation and “delayed choice” in quantum mechanics; Phys. Rev. A 25 (1982) 2208–2013. Scully, M.O.; Englert, B.G.; Walther, H.; Quantum optical tests of complementarity ; Nature (London) 351 (1991) 111–116. [70] Streater, R., und Wightman, A.; PCT, Spin and Statistic and All That; W.A. Benjamin, 1964; also Princeton University Press, 2000. [71] Stapp, H.P., Mindful Universe: Quantum Mechanics and the Participating Observer; Springer 2007. [72] Tumulka, R., A Relativistic Version of the Ghirardi-Rimini-Weber Model; Journ. Stat. Phys. 125 (2006) 821. [73] Walborn, S.P.; Terra Cunha, M.O.; Pádua, S.; Monken, C.H.; Double-slit quantum eraser; Phys. Rev. A 65 (2002) 033818. Index Abbildung, lineare, 66 Abel, Niels Henrik, 284 adiabatische Zustandsänderung, 130 adjungierter Operator, 67 Amplitudenvektor, 24, 34 Normierung, 35 Anschlussbedingungen, beim endlichen Kastenpotenzial, 132 Aspect, Alain, 19, 179, 182 Äther, 22 Auf- und Absteigeoperatoren, 137, 195, 291 Ausschließungsprinzip, 17, 169 Austrittsarbeit, 210 Axiome, 87–106, 231 allgemeiner Rahmen, 87 klassische Mechanik, 89 Azimutalgleichung, 145 Baker-Campbell-Hausdorff-Formel, 280 Bayes’sche Wahrscheinlichkeit, 257 BB84, 204 belief function, 257 Bell’sche Ungleichungen, 19, 177 Schülerexperiment, 183 Verletzung in QM, 179, 181 Bell, John, 19, 39, 176, 249 Bell-Messung, 199, 201 Bell-Zustände, 198, 201 Bennett, Charles H., 204 Beta-Bariumborat (BBO), 218 Bewegungsgleichungen, 91, 159–161 Hamilton’sche, 91 Newton’sche, 91 Bit, klassische Informationseinheit, 196 Bloch-Kugel, 190, 197 Bohm’sche Mechanik, 19, 176, 180, 261 Bohm, David, 19, 173, 176, 261, 297 Bohr’scher Radius, 150 Bohr’sches Atommodell, 16 Bohr’sches Magneton, 212 Bohr, Niels, 16, 175, 296 Boltzmann-Faktor, 208 Boltzmann-Konstante, 149 Born’sche Regel, 42, 99, 232, 253 Born, Max, 17, 18, 298 Bose-Einstein-Statistik, 169, 170 Bosonen, 142, 169, 170 Bra-Ket-Notation, 64–85 für Matrizen, 81 für Vektoren, 65 Brassard, Gilles, 204 Brewster-Winkel, 24 Casimir-Effekt, 142 Casimir-Operator, 290 Caves, Carlton M., 256 CCD-Kamera, 28 CHSH-Ungleichungen, 181 Clauser, John, 177, 180 Compton, Arthur, 16, 210 Compton-Effekt, 16 Compton-Streuung, 210 Compton-Wellenlänge, 211 Darstellung, 284 irreduzibel, 285 lineare, 285 307 308 Darstellungsraum, 284 Davisson, Clinton, 17, 54 de Broglie, Louis, 17, 54, 261 deBroglie-Wellenlänge, 55 Definitionsbereich unbeschränkter Operatoren, 72 Dekohärenz, 248, 257 Delayed-Choice, 224 Derivation, Kommutator als, 70 d’Espagnat, Bernard, 177 Deutsch, David, 299 DeWitt, Bryce, 298 Dichtematrizen, 114, 167 Diffusionsgleichung, 154 Dirac, Paul, 64 dispersionsfreie Zustände, 90 Doppellösunginterpretation, 261 Doppelspalt, 45, 155, 216 Down conversion, parametric, 28, 218 Drehgruppe, 286 Lie-Algebra, 189 Drehimpulsoperator, 97 Eigenwerte, 146 Dualer Vektorraum, 64 Ebene Welle, 22 Eddington, Arthur, 298 Eigenfunktionen harmonischer Oszillator, 139 Kastenpotenzial, 129 Kugelflächenfunktionen, 145 uneigentliche, 83 Eigenschaft, 31, 234 Eigenvektoren, 68 kommutierender Operatoren, 76 selbstadjungierter Operatoren, 75 Eigenwerte, 68 2-dimensionale Matrizen, 188 als mögliche Messwerte, 99, 232 selbstadjungierter Operatoren, 75 INDEX unitärer Operatoren, 80 von Projektionsoperatoren, 77 Einstein, Albert, 15, 173, 209, 295 Einstein-Podolsky-Rosen (EPR), 19, 173 Einstein-Realität, 180 Einzelphotonquelle, 28 Elektromagnetisches Feld Energiedichte, 23 Elektronenspin, 17 Elementarteilchen, 283 Elemente der Realität, 173 Elitzur, Avshalom, 221 Elitzur–Vaidman–Experiment, 221 Emissionslinien, 111 Energie als Generator von Zeittranslationen, 104 Energiebänder, 126 Energiedichte, 23 Energieeigenwerte, 126, 134 harmonischer Oszillator, 138 Kastenpotenzial, 127 Wasserstoffatom, 148 Energieoperator, 97 Energiequantisierung, 124 diskretes Spektrum, 125 Kontinuum, 125 Ensemble-Interpretationen, 255 Entartungsgrad (eines Eigenwerts), 68 EPR-Zustand, 173 Erwartungswert, 100 Dichtematrix, 114 klassisch, 113 Erwartungswertfunktional, 113 Erzeugungs- und Vernichtungsoperatoren, 142 Euler-Winkel, 287 Fermi-Dirac-Statistik, 169, 170 Fermionen, 142, 169, 170 Feynman, Richard, 45, 196, 297 INDEX 309 Finkelstein, David, 299 Fischer, Ernst Peter, 299 Fourier-Transformation, 53, 85, 109 Fraunhofer’sche Linien, 16 Frequenz, 22 Fuchs, Christopher A., 256 Führungsfeldtheorie, 261 Funktion vs. Funktionswert, 64 Funktional, lineares, 112 Funktionalintegraldarstellung, 156, 281 Hermite-Polynome, 139 Hermitesche Konjugation, 67 Hertz, Heinrich, 22 Hilbertraum, 62 quadratintegrable Funktionen, 63, 71, 82 quadratsummierbare Folgen, 63, 70 separabler, 62 Hong-Ou-Mandel-Effekt, 223 Huygens, Christiaan, 22 Gauß-Funktion, 109 Generator einer Gruppe, 286, 287 Gerlach, Walter, 190, 213 Germer, Lester, 17, 54 g-Faktor, 212 Gitter, optische, 216 Gleichverteilungssatz, 207 Greenberger, Daniel M., 298 Groenewald-van Hove-Theorem, 97 Grundzustandsenergie, 138 harmonischer Oszillator, 142 Kastenpotenzial, 130 Gruppe, 284 abelsche, 284 GRW-Kollapsmodell, 260 Gyromagnetisches Verhältnis, 212 Impulsoperator, 83 Impulsraumbasis, 122 Indeterminismus der Quantentheorie, 101 Induktionsannahme, 179, 183 Intensität, 26, 27 als relative Häufigkeit und Wahrscheinlichkeit, 29, 34 als Wahrscheinlichkeitsdichte, 51 relative, 28 Intensität (einer Welle), 23 Interferenz, konstruktive und destruktive, 48, 220 Interferenzexperimente, 47 Buckyballs, 47 Invariante, 285 Invarianz, 284 Ionisierungsenergie, 149 Halbgruppengleichung, 280 Hamilton-Funktion, 104 Jacobi-Identität, für Kommutatoren, 70 Hamilton-Jacobi-Gleichung, 263 James, William, 108 Hamilton-Operator, 89, 122, 123, 160 Jordan, Pascual, 17 zeitabhängig, 119 Károlyházy, Frigyes, 260 Hauptsatz der Thermodynamik Kastenpotenzial, 126 dritter, 16 Anschlussbedingungen, 274 Heighest Weight-Darstellungen, 290 endliches, 132, 273 Heisenberg’sche Bewegungsgleichung, 159 Randbedingungen, 127 Heisenberg, Werner, 17, 174, 296 klassischer Grenzfall, 131 Heisenberg-Bild, 105 Hermann, Grete, 176 harmonischer Oszillator, 141 310 Knallerexperiment, 221 Kollaps, siehe Reduktion des Quantenzustands Kollapsmodelle, 258 Kommutator, 69 Komplementarität, 18, 108, 233, 252 klassisch und quantenmechanisch, 32 Kontinuitätsgleichung, 264 Konversionskristall, 218, 222 Kopenhagener Deutung, 18, 252 Korrespondenzprinzip, 97, 105, 160, 254 Kugelflächenfunktionen, 145 Kurzwellenasymptotik, 264 INDEX transponierte, 67 Matrizenmechanik, 17 Maxwell, James Clerk, 22 Maxwell-Gleichungen, 22 freie, 22 Mehrteilchensysteme, 106 Mermin, David, 298 Messproblem, 244, 255 Messung, 93 als Präparation, 40 bei Polarisationszuständen, 40 in der klassischen Physik, 40 Nachweis, 40 Prokrustrie, 41 L2 , siehe auch Hilbertraum, quadratinte- Mikrowellenhintergrundstrahlung, 206 grable Funktionen, 85 λ/4- und λ/2-Plättchen, 217 Newton, Isaac, 22 Laplace-Operator, in Kugelkoordinaten, 144 Nichtlokalität der QM, 19, 268 Laser, 216 No-Cloning-Theorem, 200 Laserlicht, Eigenschaften, 216 No-Crossing-Theorem, 264 Laserpointer, 28 No-Hidden-Variables-Theorem, 18 Legendre-Polynome, 145 Noether-Theorem, 123 Leggett, Antony J., 258 Normierung, 92 Leistung, Laserpointer, 28 Normierungsbedingung, 52 Licht O(N), 80 sichtbares, 23 Observable, 42, 93 Wellennatur, 28 als selbst-adjungierter Operator, 232 Lie-Algebra, 288 als selbstadjungierter Operator, 96 Lie-Gruppe, 286 klassische, 90 Lokalität, 180 mögliche Messwerte, 99 Mach-Zehnder-Interferometer, 219 maximaler Satz, 116 Madelung, E., 261 Messvorschrift, 98 Magnetische Quantenzahl, 146 One-Time-Pad, 203 Magnetisches Moment, 211 Operatoren, siehe auch Matrizen und AbMany-Worlds Interpretation, 257 bildungen Matrixelemente, 67 adjungierte, 67 Matrizen beschränkte, 69 hermitesch konjugierte, 67 Funktionen von, 69, 78 selbst-adjungierte, 188 kommutierende, 76 INDEX lineare, 66 normale, 76 selbstadjungierte, 74 unbeschränkte, 69, 70 unitäre, 79 Operatornorm, starke und schwache, 68 Operatortopologie, starke und schwache, 68 optisches Pumpen, 216 Orbit, einer Gruppe, 284 Orthogonale Gruppe, 80 Orthogonalität von Vektoren, 61 Orthonormalbasis, 64 Ortsoperator, 84 Ortsraumbasis, 121 Ortsraumdarstellung, 153 Oszillator, harmonischer, 136–143 mehrdimensionaler, 143 311 lineare, 23, 24, 217 zirkulare, 23, 24, 193, 217 Polarisationsexperimente, 32 Polarisationsfilter, 24 Darstellung durch Matrix, 36 hintereinandergeschaltete, 26 Polarisationsstrahlteiler, 24 Polwürfel, siehe Polarisationsstrahlteiler Positivität einer Dichtematrix, 114 einer Wahrscheinlichkeitsverteilung, 113 eines Funktionals, 112 POVM, 257 Poynting-Vektor, 23 Prinzip des hinreichenden Grundes, 101, 253 Projektion einer Amplitude, 27 Projektionsoperatoren, 76, 81 Eigenwerte, 77 Prokrustie, 41, 94 Parallelismus, massiver, 198 Parametrische Fluoreszenz, 218 Paritätsoperator, 131, 283 QBismus, Quanten-Bayesianismus, 256 Parseval’sche Formel, 54 quadratintegrabel, 63 Paschen-Back-Effekt, 212 Quanten, 15 Pauli, Wolfgang, 17, 174, 191, 213, 298 Quanten-Teleportation, 200 Pauli-Matrizen, 188, 289 Quanten-Zenon-Effekt, 234 Kommutatorregeln, 189 Quantencomputer, 196 Penrose, Roger, 260 Quantenfeldtheorie, 141 Permutationen, 171, 172 Quantenkryptographie, 203 Phase, 23 Quantenmechanik Photoelektrischer Effekt, 16, 209 Bohm’sche, 19, 261 Photonen, 28 Geburtstag, 15 Interpretation, 29 Indeterminismus, 101 Planck’sche Strahlungsformel, 208 und Bewusstsein, 259 Planck’sches Wirkungsquantum, 15, 28, 149 Wahrscheinlichkeitsdeutung, 18 Planck, Max, 15, 206, 299 Quantenpotenzial, 264 Podolsky, Boris, 173 Quantenradierer, 225 Poisson-Klammern, 91, 96, 159 Quantenspinketten, 196 Polargleichung, 145 Quantensprünge, 17 Polarisation, 31, 193 Quantenstatistik, 106, 169 312 INDEX Quantenzahlen, 283 Quantenzustand, 231 als Katalog unseres Wissens, 256 als normierter Vektor, 92, 231 als Projektionsoperator, 93 als Strahl, 92, 231 Reduktion, 249 separabler, 166 total antisymmetrischer, 171 verschänkter, 166 Quantisierung, einer Theorie, 254 Quantisierungsbedingungen Kastenpotenzial, 127 Quantum bound, 183 Quantum-Eraser, 225 Qubit, 196 Sommerfeld, Arnold, 16 Spektralzerlegung, 78, 82 Spektrum eines Operators, 73 Spezielle Orthogonale Gruppe, 286 Spezifische Wärme, 16 Spin, 191, 192, 213 in Bohm’scher Mechanik, 268 Modell von Pauli, 191 Spin-Matrizen, 189, 214, 289 Spin-Statistik-Theorem, 171 Spur eines Operators, 74 Spurklasseoperatoren, 74 Stark-Effekt, 16, 211 linearer, 213 quadratischer, 213 Stern, Otto, 190, 213 Stern-Gerlach-Experiment, 190, 191, 213 Rastertunnelmikroskop, 135 Strahl, eines Vektorraums, 42, 77 Reduktion des Quantenzustands, 36, 43, Strahlteiler, 217 102, 232, 249 Strahlungsgesetz, klassisches, 208 Rosen, Nathan, 173 Strukturkonstanten, 288 Rotationsmatrizen, 80 SU(N), 80 Rutherford’sches Atommodell, 16 Summation über alle Wege, 156 Superposition, 37, 104, 234 Schack, Ruediger, 256 vs. Dichtematrix, 115 Schrödinger, Erwin, 17 Symmetrien, 123, 284 Schrödinger-Bild, 105 einer Funktion, 285 Schrödinger-Gleichung, 17, 122 einer Gleichung, 285 freie, 55 Wasserstoffatom, 147 zeitabhängige, 103, 119, 152 zeitunabhängige, 120 Schrödingers Katze, 249 Schwarzer Körper, 206 Schwarzkörperstrahlung, 15 Selbstadjungierte Operatoren, 74 separabel, 166 Skalarprodukt, hermitesches, 61 SO(3), 286 Solvay-Konferenz, 5., 18 Teilreduktionen, 167 Teilspur, 168 Tensorprodukt, 165 Tunneleffekt, 134 U(N), 80 Übergangswahrscheinlichkeit, 100 Ultraviolettkatastrophe, 208 Unitäre Gruppe, 80 Unitäre Operatoren, 79 Eigenwerte, 80 INDEX Unschärferelationen, 18, 109, 233, 253 Energie–Zeit, 111 Heisenberg’sche, 109 zwischen Ort und Wellenzahl, 110 Vaidman, Lev, 221 Vakuumenergie, 142 Vakuumzustand, 65 Vektorraum, 60–66 Basis, 61 Dimension, 61 dualer, 64 komplexer, 60 Norm, 61 Strahlen, 77 verschränkt, 166, 174 Versteckte Variable No-Go-Theoreme, 176 Vertauschungsrelationen Drehimpuls, 147 kanonische, 72, 74, 85, 96 und Eigenzustände, 107 Unschärferelation, 109 Vielwelten-Theorie, 257 von Neumann, Johann, 18 No-Go-Theorem, 176 von Neumann-Entropie, 168, 248 Wahrscheinlichkeit, 101, 253 ontologische, 101 Wahrscheinlichkeitsamplitude, 51 Wahrscheinlichkeitsdichte Kenngrößen, 52 Wechselwirkungsfreie Messung, 221 Welle, ebene, 46 Welle-Teilchen-Dualismus, 17, 108 Wellengleichung, 22 Wellenlänge, 22 Wellenmechanik, 17 Wellenzahlvektor, 22, 53 313 Wheeler, John A., 224 Wigner, Eugene P., 177, 259 Wigner-Theorem, 123 Wigners Freund, 259 Winkelfrequenz, 22 Wirkung, klassische, 156 WKB-Näherung, 264 Zeeman-Effekt, 16, 211 anomaler, 212 normaler, 212 Zeigerbasis-Problem, 251 Zeigerrechnung, 156 Zeilinger, Anton, 47, 299 Zeitentwicklungsoperator, 104, 119, 152, 279 freier, 154 Zeitoperator, 111 Zenon von Elea, 236 Zenon-Bereich, 236 Zentralpotenziale, 144 Zerlegung der Eins, 82 zirkulare Polarisationen, 193 Zustand, 42, 92 allgemeine Definition, 112 dispersionsfreier, 90, 100 Erwartungswertfunktional, 113 gemischter, 114 klassischer, 89 klassischer, gemischter, 113 klassischer, reiner, 113 Präparation, 102, 115 reiner, 113, 115 Zustand, quantenmechanischer, siehe auch Quantenzustand Zwei-Zustands-Systeme, 194