Kapitel 2 Der Wissensstand der klassischen Physik am Ende des 19. Jahrhunderts oder was wir bis jetzt verwendet haben Ende des 19. Jahrhunderts bildete die Physik eine wohlgeordnete und übersichtliche Wissenschaft, so dass sogar die Meinung aufkam, dass die Physik eine im Wesentlichen abgeschlossene Disziplin sei. Die Theoretische Physik umfasste im Prinzip mehrere getrennte Bereiche, von denen einige die Begriffe der Physik der Massenpunkte (erster Teil der L1: Mechanik) benützten und einige die Begriffe der Kontinuumsphysik (zweiter Teil der L1, Elektrodynamik, oder auch Wellenlehre, Optik, Hydrodynamik) benützten. Eines der ersten umfassendsten Lehrbücher zur Theoretischen Physik beginnt in seinem ersten Band — der Mechanik — mit den Worten [1] (und auch wir haben in der L1 so angefangen): Einer der Grundbegriffe der Mechanik ist der Begriff des Massenpunktes. Unter dieser Bezeichnung versteht man einen Körper, dessen Ausmaße man bei der Beschreibung seiner Bewegung vernachlässigen kann. Die Autoren fügen sogleich eine Fußnote an, in der es heißt: Statt ‘‘Massenpunkt´´ werden wir oft ‘‘Teilchen´´ sagen. Tatsächlich werden die beiden Begriffe synonym verwendet, Massenpunkt ist lediglich die ältere, Teilchen die jüngere. Der Begriff Punkt“ist der Inbegriff des Diskreten; ” 15 Kapitel 2. Der Wissensstand der klassischen Physik am Ende des 19. Jahrhunderts oder was wir bis jetzt verwendet haben schon Euklid definiert zu Beginn seiner berühmten Element“: Ein Punkt ist, was ” keine Teile hat. Somit können wir zusammenfassen, dass die Physik des ausgehenden 19. Jahrhunderts die Natur wahlweise mit folgenden Paaren beschreibt: • Kontinuumsphysik — Physik des Diskreten • Wellenphänomene — Teilchenphänomene • Physik der Felder — Physik der Massenpunkte Sowohl die Begriffsbildung und die physikalischen Vorgänge sind dabei in beiden Bereichen grundverschieden und scheinbar unvereinbar. Entweder zwei Lichtstrahlen durchdringen sich ohne Effekt (Welleneigenschaft) oder sie bestehen aus Teilchen, dann stoßen sie aneinander (Teilcheneigenschaft). Der Hausverstand sagt, dass dieser Widerspruch nicht auflösbar ist. Aber schauen wir uns das mal genauer an. 2.1 Begriffe der Physik des diskreten Massenpunktes Wie wir im vorigen Semester (L1) gesehen haben, ist die Beschreibung der Bahn eines Massenpunktes der zentrale Punkt der Mechanik. Newton hat dazu den Kraftbe” griff“und damit die Bewegungsgleichungen entworfen. Im Speziellen haben wir erkannt, dass aus der Bahnkurve ~r(t) zu jedem Zeitpunkt t und Ort ~r der Impuls p~(t) = m ~r˙ (t) gleichzeitig bestimmt werden kann (Zur Erinnerung, der Impuls war ein besseres Konzept als die Geschwindigkeit). Im nichtrelativistischen Fall ist die kinetische Energie gegeben durch Ekin = p~ 2 . 2m (2.1) Für ein Teilchen unter Einwirkung einer konservativen Kraft haben wir gesehen, dass das Konzept des Potentials sehr mächtig ist. Für die Bewegung eines Teilchens in einem äußeren Potential V ist die kinetische Energie alleine nicht erhalten, jedoch ist die Gesamtenergie eine Erhaltungsgröße H = Ekin + V (~r) . (2.2) H haben wir auch unter dem Namen Hamilton kennengelernt. Wir haben in L1 eine andere wichtige Erhaltungsgröße kennengelernt, den Drehimpuls. Er ist dann erhalten, wenn das vorliegende System bezüglich eines ausgezeichneten 16 2.2. Begriffe der Kontinuumsphysik Punktes dreh-invariant ist (Zusammenhang Symmetrie und Erhaltungsgröße)! Der Koordinatenursprung kann dann in diesen ausgezeichneten Punkt gelegt werden und ist durch das Vektorprodukt ~ = ~r × p~ L (2.3) definiert. Als Beispiel haben wir die Planetenbewegung um ein Zentralgestirn (wobei beide als Massenpunkte idealisiert wurden) betrachtet. Dabei haben wir bemerkt, dass falls keine Periheldrehungen vorliegen, es neben der Energie und dem Drehimpuls noch eine weitere Erhaltungsgröße gibt, den Lenz–Runge Vektor. Charakteristisch für die Physik der Massenpunkte oder Teilchen sind nicht nur der Begriff der Bahn, sondern auch der Stoß und die Streuung, also das Verhalten von mehreren Teilchen, die in Wechselwirkung treten. 2.2 Begriffe der Kontinuumsphysik In der Kontinuumsphysik hingegen ist der zentrale Begriffe die Dichte ρ. Sie kann vom Ort und der Zeit abhängen, also ρ(~r, t). Das räumliche Integral über die Dichte in einem gegebenen, beliebigen Volumen V ist die entsprechende Größe, z.B. Masse oder Ladung Z Q(t) = d3 x ρ(~r, t) . (2.4) V Da wir das Volumen beliebig gelassen haben, kann sich die Masse/Ladung durch Einund Ausströmen im Allgemeinen ständig ändern. In der Elektrodynamik haben wir gesehen, dass die Erhaltungsgröße der Kontinuumsphysik dadurch bestimmt ist, dass jede zeitliche Änderung durch Ein- und Ausströmen zustande kommt, also dass es weder Quellen noch Senken geben kann. In der Elektrodynamik (L1) haben wir aus den beiden inhomogenen Maxwellgleichungen die Kontinuitätsgleichung, also den Satz von der Erhaltung der elektrischen Ladung in diesem Fall, hergeleitet ∂ ρ(~x, t) + div~j(~x, t) = 0 . ∂t (2.5) Oder in der vierdimensionalen Schreibweise ∂ µ j = 0 ∂xµ 17 (2.6) Kapitel 2. Der Wissensstand der klassischen Physik am Ende des 19. Jahrhunderts oder was wir bis jetzt verwendet haben mit (j µ ) = (c ρ, ~j). Diese wichtige Kontinuitätsgleichung ist der mathematische Ausdruck eines Erhaltungssatzes in der Kontinuumsphysik. Zu jeder kontinuierlich, erhaltenen Größe gehört demnach eine Dichte und ein Stromdichtevektor, die zusammen die obige Gleichung erfüllen müssen. Die Lösungen der Maxwellgleichungen sind mathematische Objekte, die Wellen genannt werden. Typische Phänomene sind Interferenz und Beugung. An Hand dieser Phänomene stellt man fest, ob es sich bei einem vorliegender Prozess um ein Kontinuumsphänomen handelt oder nicht: Indem man nach der Existenz von Interferenz fragt, weist man nach, dass das untersuchte Objekt einen Wellencharakter“hat. ” 2.3 Entdeckung des Elektrons: Alles ist teilbar? Das Jahr 1897 gilt als Entdeckung des Elektrons durch J.J. Thomson. Damit wurde erstmalig klar, dass die Teilbarkeit einer bis dahin kontinuierlich gedachten Größe, der elektrischen Ladung, eine grundsätzliche Grenze hat! Die Ladung eines Elektrons hat die elektrische Elementarladung1 e, ist einerseits endlich (> 0), andererseits nicht mehr weiter teilbar. Genau dieses hat Demokrit — allerdings von den Atomen — gefordert. Natürlich sind räumliche Ausdehnung und Teilbarkeit gerade zu synonym, etwas ist entweder ausdehnungslos (punktförmig) oder teilbar. Bei der elektrischen Ladung wird dieser Widerspruch jedoch nicht sofort sichtbar, trotzdem könnte man genauso die Elementarladung als Atom der elektrischen Ladung“bezeichnen, da eine Ladung Q nicht ” mehr jeden beliebigen Wert annehmen kann, sie tritt nur in ganzzahligen Vielfachen der Elementarladung e auf Q = n·e (n . . . ganze Zahl) (2.7) Heute spricht man davon, dass die elektrische Ladung quantisiert ist! Da die üblicherweise auftretenden Ladungen so riesige Zahlen n enthalten, fällt die Quantisierung in der Alltagsphysik nicht auf, d.h. ist im Wesentlichen nicht messbar. Die Geschwindigkeit einer Modelleisenbahn lässt sich mit einem Trafo scheinbar stufenlos verstellen. 1 Die Unteilbarkeit der Elementarladung gilt auch noch nach der Entdeckung der Quarks, man muss ihnen nur Drittelladungen zuweisen. 18 Kapitel 3 Wie soll man mit Quantenobjekten umgehen? Wir werden hier das quantenmechanische Kalkül anhand von typischen (modernen) Experimenten mit Quantenobjekten erarbeiten. Wie bereits erwähnt, soll hier nicht der (vergebliche) Versuch unternommen werden, die Gesetze der QM herzuleiten, ich will sie aber auch nicht einfach auf den Kopf werfen“. Daher werden wir schrittweise ” vorgehen. Wobei wir bereits mit dem einfachsten Experiment tief in die Quantentheorie vorstoßen werden und mit der Begriffsbildung von Zustand, Präparation und Messung beginnen. Und es bei weiteren Experimenten wiederholen und vertiefen. 3.1 Ein Experiment mit polarisiertem Licht Wir betrachten zunächst einen ganz einfachen Versuchsaufbau und werden sehen, dass wir dabei bereits tief in die Quantentheorie eindringen müssen. Anschließend werden wir unsere ersten quantenmechanischen Rechnungen durchführen. 3.1.1 Polarisiertes Licht quantenmechanisch verstehen Wir starten mit polarisiertem Licht und versuchen eine Interpretation im Rahmen der Korpuskulartheorie, also in Termen von Photonen. Alle experimentellen Befunde können in diesem Fall (solange die Intensität genügend groß ist) auch mit der klassischen Elektrodynamik (Wellentheorie des Lichtes) verstanden werden. Da es aber andere Experimente gibt, die nur in Termen von Photonen verstanden werden können, muss es auch möglich sein, die Polarisationsexperimente im Rahmen der Quantentheorie zu beschreiben, denn diese soll ja die klassische Theorie enthalten. Wir werden auf diese Weise Aufschluss über typisch quantenmechanische Verhaltensweisen erhalten, 19 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? Abbildung 3.1: Wie die Polarisierung geändert wird. die auch für Systeme zutreffen, bei denen eine klassische Interpretation nicht möglich ist. Gegenüber anderen Objekten haben Photonen einige Vorteile. Sie haben untereinander (nahezu) keine Wechselwirkung, ein Experiment mit einem Photonstrahl gibt daher Aufschluss über das einzelne Photon; die Charakterisierung der Zustände und damit unsere erste Begriffsbildung ist relativ einfach. Wie stellt man einen linear polarisierten Lichtstrahl her? Dazu produziert man einen unpolarisierten Strahl und lässt diesen durch einen Polarisator a (z.B. eine Polarisationsbrille) treten. Ein solcher Polarisator lässt nur den Anteil des Lichtes durch, der parallel zu einer bestimmten Richtung (Durchlasrichtung ~a) polarisiert ist. Den polarisierten Strahl lassen wir durch einen zweiten Polarisator b treten, dessen Durchlasrichtung gegenüber der des ersten Polarisators um einen Winkel α verdreht ist. Wir messen die durchgelassene Intensität als Funktion von α, die gemessene Intensität ergibt I = I0 cos2 α . (3.1) Im Rahmen der klassischen Elektrodynamik ist dieses Resultat leicht herzuleiten. Eine ebene, linear polarisierte elektromagnetische Welle, die in der z–Richtung läuft (Polarisatoren senkrecht auf diese Richtung), wird durch einen elektrischen Feldvektor ~ und einen magnetischen Feldvektor B ~ mit den Komponenten (~ak y–Richtung, der E Einfachheit halber) Ey = −Bx = A cos(kz − ωt) Ex = Ez = By = Bz = 0 ω ω = 2π ν , k = c (3.2) beschrieben. Der zweite Polarisator lässt nur den Anteil des Lichtes durch, dessen EVektor parallel zur Durchlassrichtung ist, das ist die Projektion von Ey auf diese Rich20 3.1. Ein Experiment mit polarisiertem Licht Abbildung 3.2: Wie aus unpolarisierten Licht, polarisiertes entsteht. tung, also Ey cos α (cos α = ~a·~b ). |~a||~b| ~2 Die dazu senkrechte Komponente wird absorbiert. Die Intensität ist proportional E , also erhalten wir ∼ Ey2 cos2 (α). Nun versuchen wir eine quantenmechanische Beschreibung. Wir fassen den Lichtstrahl als einen Strahl von Photonen (=Lichtteilchen) auf. Den Zustand eines Photons, seine Kenngrößen oder Eigenschaften, können wir dann durch die Energie, die Bewegungsrichtung und die Polarisation charakterisieren. Wir denken uns Energie und Richtung fixiert (wir gehen davon aus, dass sie sich während des Experimentes nicht ändern) und betrachten nur die Polarisation. Wir müssen uns zuerst davon überzeugen, ob die Aussage, der Zustand der Photonen oder sogar eines Photons nach dem Polarisator a ist solch, dass dieser in Richtung ~a polarisiert ist, ein korrektes Konzept ist. Es muss also einen eindeutigen Test geben, ob vorgegebene Teilchen in einer betreffenden Klasse sind oder nicht. Ein solcher ist leicht durchzuführen. Stellen wir den Polarisator b parallel zu a (α = 0) und messen die Intensität, so können wir feststellen: Die Photonen eines gegebenen Strahls sind dann und nur dann im Zustand der ~a–Polarisation, d.h. in der Richtung ~a polarisiert, wenn sie einen Polarisator mit der 21 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? Durchlassrichtung parallel zu ~a ungeschwächt passieren. Als nächstes müssen wir untersuchen, ob eine weitere Unterteilung möglich ist. Wenn wir außer der Polarisation noch Energie und Bewegungsrichtung vorgeben, ist dies nach allgemeinem physikalischen Wissen nicht der Fall, d.h. diese Angaben legen den Zustand fest. Das ist keineswegs evident, sondern das Resultat vieler Experimente, das geändert werden müsste, wenn uns neue Experimente dazu zwingen würden. Es muss beachtet werden, dass wir zur Zustandsdefinition der Polarisation den Begriff des elektromagnetischen Feldes nicht verwendet haben. Es war für die Definition des Polarisationszustandes nicht notwendig, die klassische Aussage Ey 6= 0, Ex = Ez = 0 zu benutzen. Sie kann auch mit keinem der vorhin beschriebenen Experimente gemessen werden. Eine eingehende quantenmechanische Analyse zeigt, dass der Begriff elektromagnetisches Feld eines Photons“physikalisch sinnlos ist. Ein solches kann erst ” realisiert werden, wenn viele Photonen vorhanden sind. Das Versagen dieses Begriffes beschränkt aber in keiner Weise unsere Möglichkeiten, Polarisationszustände experimentell herzustellen und zu untersuchen. Die Tatsache, dass wir einen Messapparat (Polarisator) dazu verwendet haben, einen Zustand zu erklären, ist für die Quantentheorie typisch. Dieser Apparat ist alles, was man für die Beschreibung des Zustandes braucht und diese so gegebene Beschreibung funktioniert sowohl für wenig intensive Strahlen, für die man kein elektrisches Feld definieren kann, als auch für intensive, für die eine klassische Wellenbeschreibung möglich wäre. Ein weiterer für die QM typischer Punkt ist, dass unsere Zustandsdefinition die Registrierung vieler identisch präparierter Photonen enthält: Wenn das Vorliegen des Zustandes festgestellt werden soll, müssen Intensitätsmessungen vorgenommen, d.h. viele Teilchen gezählt werden. Das ist auch kein Hindernis bei intensitätsschwachen Strahlen. Man verwendet als Nachweisgerät einen Photovervielfacher genügender Empfindlichkeit und detektiert über genügend lange Zeiten. Man bestimmt also den Zustand von identisch präparierten Objekten. Den Zustand eines einzelnen Photons kann man offenbar auf diese Weise nicht bestimmen: Registriert man hinter dem Polarisator einen Click, so sagt dieser nichts über die Polarisation des Teilchens vor dem Polarisator aus, denn es kann z.B. auch einem schräg polarisierten Strahl entstammen. Dass es nicht sinnvoll ist, den Zustandsbegriff anzuwenden, wenn es keine Gesamtheit identischer Objekte gibt, liegt also am Begriff selbst (bzw. an seiner Definition). Zusammenfassend können wir sagen, dass der Polarisator a die Photonen so präpariert, das diese nachher in ~a Richtung polarisiert sind. Nun betrachten wir das Experiment mit dem um den Winkel α verdrehten zweiten Polarisator b im Sinn der Quantentheorie. Es wäre naheliegend anzunehmen, dass der zweite Polarisator jedes Photon irgendwie in zwei neue spaltet, von denen eines parallel zur Durchlassrichtung polarisiert ist und durchgelassen wird, das zweite hingegen 22 3.1. Ein Experiment mit polarisiertem Licht senkrecht dazu polarisiert ist und absorbiert wird. Wenn das so wäre, müsste aber der durchgelassene Strahl aus genauso vielen Photonen wie der einfallende bestehen. Um die niedrigere Intensität zu erklären, müsste man annehmen, dass der durchgelassene Strahl im Mittel weniger Energie transportiert. Wegen E = hν müsste sich dann die Frequenz ν ändern. Wie Messungen der Frequenz jedoch zeigen, ist das nicht der Fall. Jedes Photon hat nach Durchdringen des Polarisators genau dieselbe Energie wie vorher. Die Abnahme der Intensität bedeutet daher die Abnahme der Anzahl der Photonen pro Sekunde. Wir schließen daraus, das ein Bruchteil cos2 α der auf den zweiten Polarisator fallenden Photonen durchgelassen und ein Bruchteil sin2 α absorbiert wird. Die Wahrscheinlichkeit dafür, das Photonen in dem durch den Polarisator a bestimmten Zustand den Polarisator b durchdringen, ist W = cos2 α . (3.3) Ist das die richtige“Interpretation der experimentellen Ergebnisse? ” Man könnte gegen diese Interpretationen einwenden, dass sich die identisch präparierten Photonen in dem durch a hergestellten Zustand nicht gleich benehmen, wenn sie auf b treffen. Dies bedeutet, dass man mit dem Begriff identisch vorsichtig umgehen muss: Er ist so gemeint, dass sich die Teilchen dann identisch benehmen, wenn nach ihrer Identität gefragt wird, dass es also eine Anordnung gibt, gegenüber der sie sich identisch verhalten (nämlich die mit α = 0). Achtung: Dies wird uns noch öfter begegnen, eine Interpretation eines Experiments muss oft total“geändert werden, falls man ein neues Element dazu nimmt (hier der ” zweite Polarisator), da dabei — gegen unseren Hausverstand — praktisch ein neues Experiment erfolgt! Man muss also allgemein immer sehr vorsichtig sein, welche Schlussfolgerungen aus einem Experiment wirklich folgen und welche nur, wenn man Zusatzannahmen (oft versteckt) macht. Die angeführte statistische Interpretation bezieht sich zunächst auf viele Photonen, es war von einem absorbierten bzw. durchgelassenen Bruchteil die Rede. Man kann aber auch für ein einzelnes Photon keine exakten, sondern nur statistische Aussagen machen: Die Wahrscheinlichkeit für die Absorption ist sin2 α, die für das Durchdringen, die Gegenwahrscheinlichkeit, cos2 α. Das kann man experimentell sehen, indem man das Experiment mit einem sehr intensitätsschwachen Strahl und einem Photovervielfacher durchführt. Dieser spricht nur gelegentlich an, die Clicks sind in der Zeit statistisch verteilt, aber immer solche eines ganzen“Photons (es kommen nie halbe“Teilchen ” ” an). Die statistische Interpretation wird also durch das Experiment gestützt. Die Teilchennatur der Photonen bleibt durch sie gesichert. Sie stellt den auffallendsten Unterschied 23 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? zwischen klassischer Physik und Quantenphysik dar. Die klassische Beschreibung ist vollkommen deterministisch: Bei gegebenen Anfangsbedingungen kann (wenigstens im Prinzip) das Resultat jedes Experimentes genau berechnet werden. In der Quantentheorie ist das anders: Der Zustand enthält die maximale mögliche Information über ein Kollektiv identischer Objekte. Über die meisten Experimente können nur statistische Aussagen gemacht werden. Dieser Zug der Quantentheorie wurde von vielen Physikern kritisiert, vor allem von solchen der älteren Generation, die noch mit der klassischen Physik aufgewachsen sind (z.B. Einstein). Es hat viele Versuche gegeben, nach verbor” genen“Variablen zu suchen (siehe Kapitel 1), die eine deterministische Beschreibung ermöglichen sollten. Keiner von ihnen war in dem Sinn erfolgreich, dass man dabei auf Variablen mit besonderer physikalischer Bedeutung gestoßen ist. Es ist aber zu beachten, das die Wahrscheinlichkeit für jedes Experiment streng determiniert ist: es ist Aufgabe der Quantentheorie, sie zu berechnen. Ein weiterer, von der klassischen Physik her ungewohnter Aspekt der Quantentheorie kann an dem Experiment ebenfalls abgelesen werden. Die Photonen, die den zweiten Polarisator b durchquert haben, sind nicht mehr im selben Quantenzustand wie vorher. Wie man mit einem dritten Polarisator leicht nachmessen kann, sind sie in dem durch die Durchlassrichtung von b bestimmten Zustand. Diese Änderung des Zustandes durch eine Messung ist ein weiterer wesentlicher Zug der Quantentheorie. Klassisch ändert sich der Inhalt eines Buches nicht, wenn es gelesen wird, jedoch ein quantenmechanisches Buch wäre für jeden Leser ein neues! Bei klassischen Systemen kann man die Störung des Systems durch die Messung vernachlässigen (d.h. als beliebig klein ansehen), da man es mit großen Objekten zu tun hat. Bei Quantensystemen ist diese Vernachlässigung nicht erlaubt: Der Zustand wird bei einer Messung immer verändert, wenn man nicht gerade nach dem Zustand testet, in dem das System vor der Messung war. Puuhhhhhhh, jetzt sind wir mit dem einfachst möglichsten Experiment, bereits in die Tiefen der QM eingedrungen. Wir werden alle hier erwähnten Erkenntnisse mit neuen Experimenten wiederholen bzw. vertiefen. Halten wir unsere Erkenntnisse mal soweit fest: • Die QM macht nur statistische Aussagen, sie ist eine statistische Theorie. Für ein einzelnes Photon gib es keine exakten, sondern nur statistische Aussagen. 24 3.1. Ein Experiment mit polarisiertem Licht ~ Abbildung 3.3: Ein E–Vektor einer elektromagnetischen Welle kann in zwei orthogonale Komponenten zerlegt werden. Beim linear polarisierten Licht besteht der Lichtstrahl ~ entweder nur aus einer Komponente des E–Vektors oder aus mehreren Lichtstrahlen, ~ deren E–Vektoren in verschiedene Richtungen zeigen können, die aber immer zur selben Zeit ihre Schwingungsknoten haben. Zirkular polarisiertes Licht erhält man aus der ~ Überlagerung zweier Lichtstrahlen, deren E–Vektoren im rechten Winkel zueinander stehen, betragsmäßig die selbe Amplitude besitzen und eine Phasenverschiebung von π ~ aufweisen. Der E–Vektor beschreibt eine Spirale, die rechts– oder linksdrehend ist. 2 Sind die Amplituden nicht gleich, ergibt sich eine elliptische Polarisation. • Sagt man, ein Objekt sei in diesem oder jenem Zustand, so impliziert man, dass das Objekt einer Gesamtheit von identisch präparierten Objekten angehört. • Dass man einen Messapparat (Polarisator) dazu verwendet einen Zustand zu erklären, ist typisch für die Quantentheorie. Es entspricht der interpretatorischen Freiheit, was man dem Quantenobjekt zuordnet und was man dem Objekt zuordnet, das es messen soll. • Die Experimente zeigen, dass es keinen Sinn macht, hal” be“Photonen anzunehmen. Die Reduktion der Intensität bedeutet eine Reduktion der Zählrate, der Anzahl an Photonen pro Zeiteinheit. 25 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? • Der Zustand enthält die maximale mögliche Information über ein Kollektiv (ensemble) identischer Objekte. • Der Zusand wird im Allgemeinen durch eine Messung verändert. • Aufgabe der Quantentheorie ist es, die Wahrscheinlichkeiten für jedes Experiment vorherzusagen, d.h. ein Re” zept“zu präsentieren, wie man diese berechnet. 3.1.2 Unsere ersten quantenmechanischen Berechnungen Ein Quantenobjekt wird durch das Symbol |Fi (3.4) charakterisiert, wobei F für den Zustand steht, also polarisiert in ~a Richtung, oder horizontal (H) oder vertical (V) polarisiert, der Spin zeigt in ⇑ Richtung oder z Richtung, das Teilchen ist dort oder da, die Katze ist tot oder nicht, das Teilchen ist im Zustand ψ und so weiter. Wir haben im vorigen Experiment verwendet, dass die Polarisation in einen Anteil parallel zur Polarisationsrichtung des Polarisator b und einen Anteil normal zur Polarisationsrichtung zerlegt werden kann. Damit haben wir das Superpositionsprinzip verwendet, ein sehr grundlegendes Prinzip der Quantentheorie. Zur Auswertung des Superpositionsprinzips liegt es nahe, die physikalischen Zustände durch mathematische Größen zu repräsentieren, die man linear kombinieren kann. Dafür bietet es sich an, auf die in der Mathematik entwickelten Begriffe des Vektors und des Vektorraumes zurückzugreifen. Daher versuchen wir, die Menge der physikalischen Zustände mit einem komplexen (mit einem nur reellen funktioniert es nicht) Vektorraum in Verbindung zu bringen. Die Elemente eines solchen Vektorraumes nennen wir nach Dirac ket-Vektoren | i und bezeichnen sie dementsprechend mit |ψi, |φi, . . . (sprich ket-ψ u.s.w) . (3.5) Genau genommen beschreibt das in der Halbklammer | i enthaltene Symbol, dass der ket-Vektor |ψi dem Zustand ψ zugeordnet ist. Für diese ket-Vektoren gelten die 26 3.1. Ein Experiment mit polarisiertem Licht üblichen Vektorraumgesetze. Inbesondere, da der Vektorraum V abgeschlossen ist, gilt für alle |ψ1 i ∈ V und |ψ2 i ∈ V und ∀ c1 , c2 ∈ C das Superpositionsprinzip c1 |ψ1 i + c2 |ψ2 i ∈ V , (3.6) also ergibt einen neuen Zustandsvektor, ein Teilchen in einem Zustand, der sich durch die Addition“der zwei vorigen Zustand“ψ1 , ψ2 ergibt. ” ” Wir sehen aber auch sofort, welchen Preis wir zu zahlen haben. Gehen wir von einem Zustand ψ aus und ordnen diesem einen ket–Vektor |ψi zu, dann sind auch |ψi + |ψi = 2 |ψi (3.7) und c |ψi mit c ∈ C (3.8) ket-Vektoren zu dem Zustand ψ und entsprechen dem gleichen physikalischen Zustand, wie wir noch öfters sehen werden. Die physikalische Ununterscheidbarkeit von |ψi und c |ψi zeigt einen entscheidenden Unterschied zwischen der QM und z.B. der klassischen Feldtheorie. Dieser Sachverhalt ist ein wenig analog zum Potentialbegriff in der Mechanik, da mussten wir auch einen Preis zahlen, das Potential war nur bis auf eine Konstante eindeutig. Allerdings kann man in der Quantentheorie dies in keiner Weise umschiffen, egal wie man sich dreht und wendet, man muss sozusagen immer damit leben. Zurück zum Experiment: Nach dem ersten Polarisator a können wir sagen, dass der Zustandsvektor des Photons durch |Photon polarisiert in Richtung ~ai (3.9) gegeben ist oder kurz, wenn wir definiert haben, worüber wir sprechen durch |~ai , (3.10) oder in unserem Fall zeigt der Vektor ~a in y–Richtung, also auch so |yi . (3.11) Wie kommen wir jetzt an die Intensität oder an die Wahrscheinlichkeit, mit der das Photon beim Polarisator b durchgelassen oder absorbiert wird, heran. Das Rezept der Quantentheorie sagt, dass eine Messung durch das mathematische Messsymbol“ ” |~bih~b| (3.12) 27 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? erreicht wird. Dabei soll sich die rechte Hälfte auf den Zustand beziehen, der akzeptiert wird (auf das, was hineinfließt), und die linke Hälfte (ein ket-Vektor) auf den Zustand, der herauskommt“. In der Quantentheorie wird immer von rechts nach links ” gelesen, wie bei den Chinesen. Der rechte Ausdruck h | bezeichnet einen bra-Vektor. Wir wollen ja schlussendlich eine Wahrscheinlichkeit, d.h. ein reelle Zahl zwischen 0 und 1 erhalten, d.h. wir suchen etwas, dass aus einem Input Zustandsvektor |ψi einen Output Zustandsvektor |φi macht und, dies mit einer bestimmten Wahrscheinlichkeitsamplitude. Wenn wir uns an die Vektorraumtheorie bzw. an die Vektorrechnung erinnern, wissen wir, dass wir eine Linearform oder ein lineares Funktional über dem ket–Vektorraum V suchen. Eine Linearform L über dem Vektorraum V ist eine Abbildung von V in die Menge der komplexen Zahlen Lφ : V −→ C |ψi −→ Lφ (|ψi) := hφ|ψi ∈ C (3.13) Für den bekannten R3 Vektorraum nichts anderes als das übliche Skalarprodukt, und wir haben auch so etwas für die relativistische Mechanik eingeführt (z.B. xµ xµ ). Hierher kommt auch der Begriff braket“(Engl. Klammer). ” Zusammenfassend können wir jedem Zustand ψ einen ket-Vektor (als Representant eines Strahls), der im Vektorraum V lebt, oder andererseits einen bra-Vektor, der im Dualraum V † (als Representant eines Strahls) lebt, zuordnen. bra-Dual-Vektorraum V † physikalischer Zustand ket-Vektorraum V hψ| ψ |ψi Beide Vektoren liegen in verschiedenen Räumen, sind also nicht identisch. Da beide auf den gleichen physikalischen Zustand bezogen sind, müssen wir fordern, dass ihre Vektorräume V und V † umkehrbar eindeutig, also bijektiv aufeinander abgebildet werden. Aber zurück zu unserem Experiment. Der Polarisator b angewandt auf unser in ~a Richtung polarisiertes Photon ergibt: |~bih~b| |~ai = h~b|~ai |~bi . |{z} (3.14) ∈C D.h. unser Photon ist nach dem Polarisator b in ~b Richtung polarisiert. Aber welche Bedeutung hat die komplexe Zahl? 28 3.1. Ein Experiment mit polarisiertem Licht Wie kommen wir an die Wahrscheinlichkeiten, die Vorhersagen der QM, heran? Wahrscheinlichkeiten sind Zahlen zwischen 0 und 1, wir haben aber behauptet, dass ~ hb|~ai eine komplexe Zahl ist. Wie erhält man aus einer komplexen Zahl eine reelle Zahl? Durch Betrag nehmen. Dann müssen wir nur noch schauen, dass diese Zahl aus dem Bereich [0, 1] ist, was leicht durch so genanntes Normieren zu erreichen ist. Damit hätten wir alle formalen Kriterien einer Wahrscheinlichkeit erfüllt. Nimmt man das Quadrat von der Wahrscheinlichkeitsamplitude h~b|~ai, dann erhält man ¯ ¯2 ¯ ¯2 ¯ ¯ ¯ ¯ W = ¯h~b|~ai|~bi¯ = (h~b|~ai|~bi)† (h~b|~ai|~bi) = ¯h~b|~ai¯ h~b|~bi |{z} 1 ¯2 ¯ ¯ ¯ (3.15) = ¯h~b|~ai¯ . Bei unserem Experiment war der Polarisator b um den Winkel α verdreht. Zunächst können wir durch das Superpositionsprinzip den Zustand nach Polarisator a auch so anschreiben: |~ai = cos(α) |~bi + sin(α) |~b⊥ i . (3.16) Nach dem Polarisator b haben wir den folgenden Zustand |~bih~b| |~ai = (cos(α) h~b|~bi + sin(α) h~b|~b⊥ i) |~bi |{z} | {z } 1 0 = cos(α) |~bi . (3.17) Damit ergibt sich die Durchlasswahrscheinlichkeit zu ¯ ¯2 ¯ ¯ W = ¯cos(α) |~bi¯ = ( cos(α) |~bi)† (cos(α) |~bi) = cos(α)∗ cos(α)h~b|~bi = cos2 (α) Dies ist identisch zu der Wahrscheinlichkeitsamplitude zum Quadrat. Die Absorptionswahrscheinlichkeit ergibt sich durch ¯2 ¯ ¯ ¯ Wabs = ¯sin(α)|~b⊥ i¯ = sin2 (α) , (3.18) (3.19) also genau die Gegenwahrscheinlichkeit zur Durchlasswahrscheinlichkeit, d.h. W + Wabs = 1 . 29 (3.20) Kapitel 3. Wie soll man mit Quantenobjekten umgehen? Abbildung 3.4: Schematische Darstellung eines doppelt brechenden Kristalls (z.B. Kalkspat). Ein paar Rechenbeispiele: |~aih~a| |~ai = 1 · |~ai = |~ai |~a⊥ ih~a⊥ | |~ai = 0 · |~a⊥ i |~bih~b| (c1 · |~ai + c2 · |~a⊥ i) = (c1 · h~b|~ai + c2 · h~b|~a⊥ i) · |~bi 3.2 (3.21) Der Zweikanalanalysator und Projektoren Wir betrachten weiterhin polarisiertes Licht, werden aber nicht wie im vorigen Abschnitt einen Polarisator betrachten, der ein Photon durchlässt oder absorbiert, sondern einen doppelt brechenden Kristall (z.B. Kalkspat). Dieser hat die Eigenschaft, einen unpolarisierten Lichtstrahl in zwei senkrecht zueinander linear polarisierte Anteile aufzuspalten. Wir nennen die durch den ordentlichen Strahl definierte Polarisationsrichtung ~a und die durch den außerordentlichen Strahl definierte zu ~a orthogonale Richtung ~a⊥ (~a · ~a⊥ = 0; im R2 gibt es natürlich zu ~a zwei orthogonale Vektoren, allerdings unterscheiden sie sich nur im Vorzeichen, das keine Rolle spielt). Falls zum Beispiel ~a in die x-Richtung zeigt und ~a⊥ in die y-Richtung, dann stellt der ganze Kristall einen xy-Analysator dar. Wir werden den Apparat (und entsprechende analoge Verallgemeinerungen) oft verwenden und führen daher ein kurzes Schaltzeichen ein: 30 3.2. Der Zweikanalanalysator und Projektoren Dabei bezeichnen 1, 2 den ordentlichen und den außerordentlichen Strahl, beziehungsweise allgemeiner, die Aufspaltung in zwei Möglichkeiten. Schalten wir einen solchen Analysator und einen entsprechenden umgekehrten hintereinander, der so beschaffen ist, dass er den ursprünglichen Strahl voll rekonstruiert, so nennen wir die Anordnung einen Analysatorkreis und schreiben dafür Per definitionem ändert eine solche Anordnung an einem Strahl nichts. Um sie praktisch herzustellen, muss man zwischen den Analysatoren in einen der Strahlengänge ein Stück durchsichtiges Material einbringen, damit die relative Phasenbeziehung bei der Rekombination der Strahlen dieselbe wie vor der Trennung ist. Blockieren wir zwischen den Analysatoren einen der Strahlen, so erhalten wir einen Polarisator, wie wir ihn im ersten Experiment im vorigen Abschnitt kennengelernt haben. Wir nennen ihn einen Projektor auf die entsprechende Polarisationsrichtung. Das Schaltzeichen dafür ist Hier wir auf den Ausgang (Output) 1 projiziert, zum Beispiel polarisiert in x–Richtung, das wir auch mit horizontal polarisiert (H) bezeichnen können. Natürlich können wir auch auf Output 2 projizieren, in unserem Fall würden wir einen in y–Richtung oder vertikal (V ) polarisierten Strahl erzeugen: 31 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? Statt nach den Richtungen x, y (bzw. 1,2) zu analysieren, können wir auch nach zwei anderen, zueinander und zur Strahlrichtung senkrechten Richtungen analysieren, indem wir z.B. den Analysator (bzw. die entsprechenden anderen Anordnungen) um die Strahlrichtung um einen festen Winkel α drehen. Wir bezeichnen die entsprechenden Apparate mit Ein Analysatorkreis muss für alle α wieder den ursprünglichen Strahl herstellen: Statt mit linear polarisiertem Licht kann man auch mit zirkular polarisiertem arbeiten. Klassisch wird eine zirkular polarisierte ebene Welle, die in der z–Richtung läuft, ~ durch einen E–Vektor beschrieben, der mit konstanter Winkelgeschwindigkeit um die z-Achse rotiert. Je nach dem Drehsinn kann man zwischen rechtszirkularer und linkszirkularer Polarisation unterscheiden. Eine zirkular polarisierte Welle kann man durch Überlagerung von zwei senkrecht zueinander linear polarisierten Wellen mit gleicher Amplitude und 90◦ Phasenverschiebung erzeugen. Um einen zirkular polarisierten Strahl im Teilchenbild interpretieren zu können, muss man entsprechend einen rechtszirkularen, bzw. linkszirkularen Polarisationszustand für das Photon definieren. Praktisch kann ein solcher Analysator z.B. aus einem Quarzkristall bestehen: Quarz ist doppeltbrechend, wobei die beiden gebrochenen Strahlen 32 3.3. Weitere Experimente mit Analysatoren rechts- bzw. linkszirkular polarisiert sind. Bei Verdrehen um die Strahlachse ändert sich wegen der Rotationssymmetrie an der Struktur der auslaufenden Strahlen nichts. Analog wie für lineare Polarisation kann man Analysatoren bzw. Analysatorkreise durch charakterisieren. Analog zu vorher kann man Projektoren durch Blocken eines Strahls erreichen. Die beschriebenen Apparate sind genauso wie die Apparate für die linear polarisierten Strahlen dazu geeignet, Polarisationszustände eines Strahls herzustellen und zu untersuchen. Offenbar stellt ein Projektor aus einem beliebigen Strahl einen solchen her, dessen Photonen alle in dem Polarisationszustand sind, den der Projektor durchlässt. Wie stellt man fest, wie ein Strahl polarisiert ist? Mit einem Analysator kann man offensichtlich auch untersuchen, ob ein Strahl polarisiert ist. Setzt man z.B. in den Strahl einen linearen α–Analysator ein, so ist der Strahl 10 polarisiert, wenn man im 10 –Ausgangskanal die volle und im 20 –Ausgangskanal die Intensität 0 feststellt. Wird für keinen Winkel α in einem Kanal die volle und im anderen die Intensität 0 gemessen, so war der Strahl nicht linear polarisiert. Zirkulare Polarisationszustände können analog untersucht werden. Alle charakterisierten Apparate sind wirklich herstellbar, und zwar sogar so, dass man der hier angenommenen Idealisierung verlustfreier“Apparate (z.B. ” kein Intensitätsverlust beim Durchgang eines Lichtstrahls durch einen Analysatorkreis) sehr nahekommt. 3.3 Weitere Experimente mit Analysatoren Wir führen nun mit diesen Apparaten einige Experimente durch, bei denen wir bestimmte Apparate hintereinander in einen Strahlengang einsetzen und an gewissen Stellen (a, a1 , a2 , b1 , b2 ) die Intensität (I(ai ), I(bi )) messen. Das Ergebnis kann im Rahmen der klassischen Wellenvorstellung hergeleitet werden. Für die Quantentheorie liefert uns die relative Intensität I(bi )/I(ai ) eine Aussage über eine Wahrscheinlichkeit, die experimentell gemessen wird. Das erste Experiment sieht so aus: 33 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? Ergebnis: I(b1 ) = I(a1 ), I(b2 ) = 0. Das Experiment entspricht auch unserer Zustandsdefinition. Der Projektor stellt den Zustand a1 (= lineare Polarisation in 1 = x– Richtung) her (d.h. er lässt nur solche Photonen durch). Mit dem Analysator wird dann festgestellt, dass dieser Zustand vorliegt (s.o., α = 0). In Termen von Wahrscheinlichkeiten lautet das Resultat W (b1 |a1 ) = 1 , W (b2 |a1 ) = 0 . (3.22) Aber wir wissen bereits aus dem vorvorigen Abschnitt, wie die quantenmechanische Rechnung dazu aussieht: W (b1 |a1 ) = ||b1 ihb1 | |a1 i|2 = |hb1 |a1 i |b1 i|2 = |hb1 |a1 i|2 = |ha1 |a1 i|2 = 1 , W (b2 |a1 ) = ||b2 ihb2 | |a1 i|2 = |hb2 |a1 i |b2 i|2 = |hb2 |a1 i|2 = |ha2 |a1 i|2 = 0 . (3.23) oder in der vorigen Schreibweise W (b1 |a1 ) = |h~a|~ai |~ai|2 = |h~a|~ai|2 = 1 , W (b2 |a1 ) = |h~a⊥ |~ai|~a⊥ i|2 = |h~a⊥ |~ai|2 = 0 . (3.24) Wir können natürlich genauso Strahl 1 blocken, dann sieht das Ergebnis genau umgekehrt aus(siehe Übungen): Statt dieses Experimentes kann man auch zwei Messungen vornehmen, bei denen nur Projektoren verwendet werden: 34 3.3. Weitere Experimente mit Analysatoren Experiment Ia Ergebnis: I(b1 ) = I(a1 ), W (b1 |a1 ) = 1. Experiment Ib Ergebnis: I(b2 ) = 0, W (b2 |a1 ) = 0. Version Ia zeigt, dass zwei hintereinander geschaltete gleiche Projektoren so gut wie einer sind! Eine wichtige Eigenschaft, die wir oft verwenden werden und bereits bei der Zustandsdefinition benützt haben. Mathematisch wird ein Projektor durch Pa1 = |a1 iha1 | (3.25) bezeichnet (unser Messsymbol) und die Idempotenz, also das Hintereinaderschalten mehrerer Projektoren ergibt wieder den gleichen Projektor Pa1 Pa1 . . . Pa1 = Pa1 = |a1 i ha1 | |a1 iha1 | . . . |a1 iha1 | = |a1 iha1 | | {z } (3.26) 1 Führt man hingegen das folgende Experiment durch Experiment Ib zeigt, dass zwei hintereinandergeschaltete entgegengesetzte Projektoren so wirken, dass der Strahl blockiert wird (Intensität 0): Pa2 Pa2 . . . Pa1 = Pa2 Pa1 = |a2 i ha2 | |a2 iha2 | . . . |a2 i ha2 ||a1 iha1 | | {z } | {z } 1 = 0 · |a2 iha1 | 0 (3.27) Allgemein können wir das so zusammenfassen: Falls wir zwei Projektoren auf verschiedene Zustände einer orthogonalen Basis (s.u.) haben, gilt Pai Paj = δij Pai , 35 (3.28) Kapitel 3. Wie soll man mit Quantenobjekten umgehen? wobei δij das Kronecker Delta ist (δ ist gleich 1 falls i = j und 0 falls i 6= j). Wir führen jetzt eine etwas allgemeinere Notation ein, d.h. ~a ≡ a1 und ~a⊥ ≡ a2 . Damit können wir unser Ergebnis auch so schreiben: Pi Pj = δij Pi = |ai ihai |aj ihaj | = hai |aj i |ai ihaj | . | {z } (3.29) δij Führt man das Experiment mit anderen Projektoren durch (z.B. für zirkulare Polarisation), so kommt evidenterweise dasselbe Resultat heraus, solange der Analysator (bzw. der zweite Projektor) und der erste Projektor auf denselben Polarisationstyp bezogen sind. Allgemein erhalten wir die obigen Ergebnisse nur falls beide Projektoren auf den gleichen Polarisationstyp (linear, zirkulär oder elliptisch) analysieren. Wir werden einen solchen Typ eine Basis nennen. Die entsprechenden Photonzustände (z.B. l1 = linear polarisiert (parallel zu x, horizontal polarisiert H), l2 = linear polarisiert (parallel zu y, vertikal polarisiert V ) nennen wir Basiszustände. Nun betrachten wir ein weiteres Experiment, hier ist der zweite Projektor um den Winkel α verdreht: Welche Wahrscheinlichkeit bzw. Intensität werden wir erhalten? Hier können wir wieder das Superpositionsprinzip verwenden |b1 i = cos α |a1 i + sin α |a2 i |b2 i = − sin α |a1 i + cos α |a2 i (3.30) Damit ist die Wahrscheinlichkeit für Kanal b1 durch W (b1 |a1 ) = |Pb1 |a1 i|2 = |cos α ha1 |a1 i |b1 i|2 = cos2 α (3.31) und für Kanal b2 durch W (b2 |a1 ) = |Pb2 |a1 i|2 = |sin α ha1 |a1 i |b2 i|2 = sin2 α (3.32) gegeben. In der Intensität ausgedrückt, die ein Experimentator misst, erhält man damit I(b1 ) = I(a1 ) cos2 α , I(b2 ) = I(a1 ) sin2 α . (3.33) Auch die Resultate dieses Experimentes kann man durch zwei Messungen erhalten, bei denen nur Projektoren verwendet werden, z.B.: 36 3.3. Weitere Experimente mit Analysatoren Ergebnis W (b1 |a1 ) = cos2 α. Oder falls b1 geblockt wird W (b2 |a1 ) = sin2 α. Diese zwei Experimente entsprechen offenbar den früher mit den Polarisatoren durchgeführten Experimenten. Mit anderen Projektoren bzw. Analysatoren erhält man andere Zahlen. Wird z.B. der erste Projektor durch einen für zirkulare Polarisation ersetzt und der Analysator ist einer für linear polarisierte Polarisation, so können wir die Wahrscheinlichkeit erraten, W (b1 |a1 ) = W (b2 |a1 ) = 1 , 2 (3.34) da wir diesen Fall klassisch verstehen können: Der Projektor stellt einen Strahl mit (links-) zirkularer Polarisation her; da eine zirkularpolarisierte Welle aus zwei senkrecht zueinander linear polarisierten Wellen mit gleicher Amplitude aufgebaut werden kann, filtert jeder der beiden zweiten Projektoren die halbe Intensität heraus. Wie sieht aber die quantenmechanische Rechnung dazu aus? Dazu ändern wir unsere Notation ein wenig. Bezeichnen wir die zwei möglichen Outputs, Basiszustände, eines Analysators, der linear polarisiertes Licht produziert, mit |Hi, |V i , mit hH|Hi = hV |V i = 1 und hH|V i = hH|V i = 0 , (3.35) wobei wir wählen, dass der horizontal H schwingende Anteil sich im Kanal 1 befindet, während der vertikal schwingende Anteil im Kanal 2 zu finden ist. Durch die obigen Bedingungen haben wir eine orthonormierte (= orthogonale und normierte) Basis erhalten. 37 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? Hingegen bezeichnen wir die zwei Outputs, Basiszustände, eines Analysators, der zirkular polarisiertes Licht erzeugt, mit |Ri, |Li , mit hR|Ri = hL|Li = 1 und hR|Li = hL|Ri = 0 , (3.36) wobei die rechtsdrehende (R) Welle in Kanal 1 und die linksdrehende (L) in Kanal zwei erzeugt werden soll. Damit erhalten wir für das obige Experiment: W (H, R) = |hH|Ri|2 W (V, R) = |hV |Ri|2 . (3.37) Da beide Wahrscheinlichkeiten nach unserer klassischen Überlegung, die ja hier genauso zutrifft falls die Intensität hoch genug ist, 12 ist, stellt sich die Frage, ob wir den Zusammenhang zwischen den verschiedenen Basiszuständen eruieren können. Also ob wir aus |hH|Ri|2 = |hV |Ri|2 = 12 schließen können, was hH|Ri bzw. hV |Ri ist. Da die Übergangsamplituden im Allgemeinen komplex sein können, erhalten wir keine eindeutige Lösung! Nur das Argument der komplexen Zahl ist eindeutig: 1 hH|Ri = eiφ1 √ 2 1 hV |Ri = eiφ2 √ , 2 (3.38) wobei φ1 , φ2 beliebige (reelle) Phasen sind. Und damit können wir den Zusammenhang zwischen der Basis H/V und R so hinschreiben: ¢ 1 ¡ |Ri = √ eiφ1 |Hi + eiφ2 |V i . 2 (3.39) Jetzt gilt, wie bereits besprochen, dass eine so genannte Overallphase, also eine komplexe Zahl vor einem Zustandsvektor, den gleichen physikalischen Zustand beschreibt, daher können wir eine Phase herausziehen ¢ 1 ¡ |Ri = eiφ1 √ |Hi + ei(φ2 −φ1 ) |V i . 2 (3.40) Es kommt also nur auf die Phase φ := φ2 − φ1 zwischen dem Zustandsvektor |Hi und |V i an, diese relativ Phase ist im Experiment messbar, wie wir gleich sehen werden. Sie ist sehr typisch für die Quantentheorie. 38 3.3. Weitere Experimente mit Analysatoren Damit können wir den Zusammenhang zwischen der Basis H/V und dem Basisvektor R auch so hinschreiben: ¢ 1 ¡ |Ri = √ |Hi + eiφ |V i . (3.41) 2 Der Zusammenhang mit |Li ergibt sich durch die Bedingungen an die orthonomierte Basis hR|Li = 0 und der Tatsache, dass falls wir nicht den zweier Kanal geblockt hätten und damit den Zustand |Li erzeugt hätten, die klassische Überlegung die gleichen Wahrscheinlichkeiten ergibt. D.h. wir können |Li anschreiben durch ª 1 © |Li = √ |Hi + eiχ |V i 2 und aus ½ ¾½ ¾ 1 −iχ iφ hL|Ri = 0 = hH| + e hV | |Hi + e |V i 2 ½ ¾ 1 i(φ−χ) hH|Hi + e hV |V i = 2 ½ ¾ 1 i(φ−χ) = 1+e 2 (3.42) ! (3.43) folgt, dass ei(φ−χ) = −1 sein muss und damit χ = φ + kπ mit k = 1, 3, 5, . . . . Damit haben wir gefunden ª 1 © |Li = √ |Hi − eiφ |V i . 2 (3.44) Ist die relative Phase φ bestimmbar? Dazu brauchen wir uns nur eine kleine Variante unseres Experiments überlegen: Das Ergebnis können wir uns wieder gleich überlegen, da die zirkular polarisierte Welle rotationssymmetrisch ist, Abb. 3.3, folgt, egal wie wir den zweiten Analysator zum ~ Vektor kann immer zu gleichen Teiersten Projektor verdrehen, der momentane E len aus horizontal und vertikal polarisiertem Licht bestehend aufgefasst werden, d.h. 39 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? die Wahrscheinlichkeit im oberen oder unteren Kanal Photonen zu finden sind immer gleich: 1 2 1 W (V α, R) = 2 W (Hα, R) = Die quantenmechanische Rechnung dazu ist ¯¡ ¯2 ¢ W (Hα, R) = ¯ cos α hH| + sin α hV | |Ri¯ ¯¡ ¢¡ ¢¯2 = ¯ cos α hH| + sin α hV | |Hi + eiφ |V i ¯ ¯2 1 ¯¯ = cos α + eiφ sin α¯ 2 ¢ 1¡ = 1 + 2 cos α sin α cos φ . 2 (3.45) (3.46) Damit für alle α’s 12 herauskommt, muss φ = k π2 , wobei k eine ungerade Zahl ist, gelten. Damit haben wir den Zusammenhang zwischen zwei orthonormierten Basen, den linear und zirkulär polarisierten Basen, gefunden: 1 |Ri = √ (|Hi + i |V i) 2 1 |Li = √ (|Hi − i |V i) . 2 (3.47) Das Vorzeichen ist wieder Konvention (d.h. hier die Wahl k = 1, 5, 9 . . . ). Hier sehen wir auch zum ersten Mal, dass wir komplexe Zahlen, Vektoren benötigen, um den Unterschied zwischen linear und zirkular polarisiertem Licht beschreiben zu können. Und dass relative Phasen im Gegensatz zu Overall–Phasen messbar sind! 3.3.1 Verschiedene Analysatoren und deren Zusammenhang Fassen wir unsere Experimente aus dem vorigen Abschnitt zusammen. In unserer ersten Serie haben wir jeweils linear polarisierende Analysatoren verwendet, die wir zueinander um einen Winkel α gedreht haben. Die gleichen Ergebnisse würden wir erhalten falls wir nur mit z.B. zirkular polarisierenden Analysatoren arbeiten würden. In unserer zweiten Serie haben wir untersucht, wie linear polarisiertes Licht mit zirkular polarisierten Licht zusammen hängt. 40 3.3. Weitere Experimente mit Analysatoren Die Zusammenhänge sind jeweils durch vier (komplexe) Zahlen beschrieben, hH 0 |Hi hV 0 |V i hH 0 |V i hV 0 |Hi = = = = hHα|Hi hV α|V i hHα|V i hV α|Hi = = = = cos α , sin α , cos α , − sin α (3.48) und 1 i 1 i hH|Ri = √ , hV |Ri = √ , hH|Li = √ und hV |Li = − √ . 2 2 2 2 (3.49) Das können wir auch kompakter zusammenschreiben. Dazu identifizieren wir den Zustandsvektor mit einem Spaltenvektor µ ¶ µ ¶ 1 0 |Hi ≡ , |V i ≡ (3.50) 0 1 Dann können wir den Zusammenhang von linear polarisierten Basiszuständen (H/V ) zu den linear polarisierten Zuständen (H 0 /V 0 ) auch so schreiben ¶ ¶µ µ 0 ¶ µ H H cos α sin α (3.51) = V V0 − sin α cos α Diese Matrix, die wir im folgenden U (α) nennen wollen, ist uns aus dem R2 bekannt, sie beschreibt nichts anderes als die Rotation eines 2 dimensionalen Vektors um den Winkel α. Bzw. beschreibt diese Matrix das Verhalten der Komponenten eines Vektors in der Ebene bei Drehung des Koordinatensystems. Allgemein gilt für Drehspiegelmatrizen R · RT = RT · R = 1, falls auch gilt det R = 1 beschreibt R eine Rotation. D.h. es sind genau diese Matrizen, die das (reelle) Skalarprodukt erhalten. Das entspricht genau dem, das wir bei den aller ersten Experimenten mit einem Polarisator gemacht haben. Was wir benötigen ist eine Matrix mit solchen Eigenschaften, die das (komplexe) Skalarprodukt unserer komplexen Vektoren unverändert lassen! In Experimenten können nur Wahrscheinlichkeiten gemessen werden, ein kurzes Nachrechnen zeigt, dass die Matrix µ iφ ¶ e 1 cos α eiφ2 sin α 0 U (α) = (3.52) eiφ3 sin α eiφ4 cos α mit der Zusatzbedingung ei(φ2 −φ1 ) = −ei(φ4 −φ3 ) 41 (3.53) Kapitel 3. Wie soll man mit Quantenobjekten umgehen? das Skalarprodukt und damit die Wahrscheinlichkeiten invariant lässt (bis auf eine Gesamtphase). Bei der zweiten Serie hatten wir die Transformation aus der Basis (H/V ) zu (R/L) betrachtet. Diese wird durch die Matrix à ! √1 2 √1 2 √i 2 −i √ 2 (3.54) gewährleistet, sie gibt also an, wie man von linear polarisiertem Licht zu zirkulär polarisiertem Licht kommt, wir bezeichnen diese Matrix daher durch U (zirk, l). Und die vorige Basistransformation durch U (l0 , l) und analog dazu kann man die Transformationsmatrix zwischen beliebigen Basen berechnen. Welche allgemeinen Eigenschaften haben solche Matrizen? Der Zusammenhang zwischen den Basen zwischen zwei Analysatoren a und b ist durch die Transformationsmatrix U (b|a)ik = hbi |ak i i, k = 1, 2 (3.55) gegeben. Mit k werden die zwei Basiszustände von Analysator a bezeichnet (also falls a = l, dann k = H, V ) und mit i die Basiszustände von Analysator b. Diese 2 × 2 Matrizen besitzen die folgenden Eigenschaften: 1. U −1 (b|a) = U (a|b) bzw. U · U −1 = U −1 · U = 1 (Invertierbarkeit). 2. U † (b|a) = U −1 (b|a) bzw. U † U = U · U † = 1 (Unitarität). 3. U (c|b) · U (b|a) = U (c|a) (Gruppeneigenschaft). Die erste Eigenschaft ist leicht bewiesen U (b|a) · U −1 (b|a) = U (b|a) · U (a|b) = X hbi |aj ihaj |bk i = δik (3.56) j und Ausdruck der Orthonormierung. Die zweite wichtige Eigenschaft beweist sich durch (U −1 (a|b))ik = (U (b|a))ik = hbi |ak i = hak |bi i∗ = ((U (a|b))ki )∗ = (U † (a|b))ik . Dies bedeutet inbesondere, dass das Photon seine Polarisierung nie verliert! 42 (3.57) 3.3. Weitere Experimente mit Analysatoren Die letzte Eigenschaft, die Gruppeneigenschaft, beweist sich über ¡ j X ¢ ¡X ¢ |bj ihbj | |ak i U (c|b) · U (b|a) ik = 2hci |bj ihbj |ak i = hci | j=1 j=1 | {z 1 } = hci |ak i = (U (c|a))ik . (3.58) Dabei haben wir benützt, P dass die Summe aller Projektoren eines vollständig, orthogonalen Basissystems jj=1 |bj ihbj | = 1 sich zur Einheit addiert oder anders formuliert eine solche Summe ist ein Analysatorkreis. Das ist eine sehr wichtige Formel, die wir oft verwenden werden, und welche die Vollständigkeit der Basis ausdrückt. Schematisch entspricht es dem Analysator Zusammenfassend haben wir gefunden, dass verschiedene Basen stets durch unitäre Matrizen zusammenhängen und eine Gruppe bilden! D.h. die Matrizen, die das Skalarprodukt erhalten hφ|U † U |ψi = hφ|ψi , (3.59) müssen die obigen Eigenschaften haben. (Hinweis: U muss nicht unbedingt als Matrix darstellbar sein.) 3.3.2 Unterschiedliche Projektoren hintereinandergeschaltet Betrachten wir das folgende Experiment: 43 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? Welches Ergebnis erwarten wir? Der erste Analysator a erzeugt horizontal polarisiertes Licht. Der zweite zirkular polarisierende Analysator b lässt nur links polarisierendes Licht durch. Der dritte Projektor c lässt wiederum nur vertikal polarisiertes Licht durch. Das Ergebnis können wir klassisch errechnen, der zweite Analysator lässt nur 50% der hereinkommenden Photonen durch, der dritte wiederum nur 50% der hereinkommenden Photonen, d.h. W (c|a) = 14 . Die quantenmechanische Rechnung dazu können wir auch schon hinschreiben: |V ihV |LihL|Hi −→ W (V |L|H) = |hV |LihL|Hi|2 = 1 . 4 (3.60) Wir erkennen, dass durch eine Messung sich der Zustand ändert, jedoch keine Regene” ration“erfolgt: Vor dem zirkularen Filter enthält der Strahl keine vertikal polarisierten Photonen, hinter diesem Filter sind sie offenbar wieder vorhanden. Das gleiche erhalten wir, falls wir unser Experiment so adaptieren: |V ihV |RihR|Hi −→ W (V |R|H) = |hV |RihR|Hi|2 = 1 . 4 (3.61) Aber wie sieht es mit dieser experimentellen Anordnung aus: Naiv würden wir erwarten, dass jetzt doppelt so viele Photonen durchkommen. Das ist aber nicht der Fall, man erhält sogar, dass kein Photon durchkommt. Das ist sofort klar, falls wir uns an den vorigen Abschnitt erinnern, wo wir gezeigt haben, das 44 3.3. Weitere Experimente mit Analysatoren ein Analysatorkreis nichts am Zustand ändert, oder mathematisch die Summe aller Projektoren die Einheit ergibt. Die ganze Schaltung entspricht: ¡ ¢ |V ihV | |RihR| + |LihL| |Hi = |V ihV |Hi = 0|V i | {z } 1 −→ W (V |1|H) = W (V |H) = 0 . (3.62) Wir lernen daraus, dass man bei mehreren offenen Wegen die entsprechenden Wahrscheinlichkeiten nicht addieren darf, und dass man ohne komplexe Übergangselemente, ohne komplexe Wahrscheinlichkeitamplituden nicht auskommt. Im Rahmen der klassischen Wellentheorie kennen wir dieses Phänomen bereits. Es handelt sich um einen Spezialfall der allgemeinen Welleneigenschaft Interferenz, zu der es immer kommt, wenn mehrere Strahlen aus derselben Quelle überlagert werden. Kann Licht auf mehreren Wegen an eine bestimmte Stelle gelangen, so ist das gesamte elektrische Feld an dieser Stelle die Vektorsumme der Felder, die den entlang der einzelnen Wege laufenden Wellen entsprechen. Die gesamte Intensität ist das Quadrat des resultierenden elektrischen Vektors, der länger oder kürzer sein kann, als jeder der Summanden, aus denen er sich zusammensetzt; er kann auch die Länge Null haben. Der wesentliche Zug, dass man die Vektoren erst addieren und dann quadrieren muss, ist eine Folge der Wellentheorie des Lichtes. In der quantentheoretischen Beschreibung, um die es hier geht, dürfen wir das klassische Wellenbild nicht benützen, da es für intensitätsschwache Strahlen, bzw. für einzelne Photonen nicht funktioniert. Das ist aber auch der Kern, warum wir erstaunt sind. Bei klassischen Wellen erklärt sich die Auslösung einfach (Berg trifft auf Tal). Aber, wenn wir nun ein einziges Photon durchschicken und dann, nachdem es sicher schon registriert wurde, noch eines und so weiter und trotzdem finden wir ein Interferenzbild, also Bereiche die bevorzugt besucht, andere die weniger bis gar nicht besucht werden, finden wir keine dem Hausverstand genügende Erklärung. Wir müssen sagen, jedes Photon interferiert mit sich selbst! In unserem entwickelten Formalismus stellt es sich so dar: die Wahrscheinlichkeitsamplituden interferieren miteinander. Aber was soll schon eine Wahrscheinlichkeitsamplitude sein?! Kein Wunder also, dass diese einfachen“Experimente, von denen wir noch einige dis” kutieren werden (siehe auch Kapitel 6), schon zu soviel Kopfzerbrechen führen (geführt haben)! 45 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? 3.4 Allgemeine Apparate bzw. Operatoren Bisher haben wir gelernt, wie man gewisse Apparate (Projektoren, Analysatorkreise und daraus aufgebaute Schaltungen“) algebraisch darstellt. Wir interessieren uns nun ” für die Verallgemeinerung auf beliebige Apparate. Zunächst betrachten wir wieder die Photonpolarisation. Jeder Apparat, der nur auf die Polarisation wirkt, kann als Kasten mit einer Eingangs- und einer Ausgangsöffnung gedacht werden, der die Energie der Photonen sowie die Strahlrichtung nicht ändert, wohl aber die Polarisation und die Intensität beeinflusst. Wir bestrahlen nun einen solchen Apparat der Reihe nach mit H und V polarisiertem Licht und messen die relative Intensität des auslaufenden Strahls nach Passieren eines H bzw. V Projektors. Die Schaltung ist also z.B. Auf diese Weise messen wir 4 positive Zahlen (Wahrscheinlichkeiten). Diese reichen aber nicht aus, um den Apparat eindeutig zu charakterisieren. Das sieht man an folgendem Beispiel: Nehmen wir für A einen R Projektor, so sind alle vier Wahrscheinlichkeiten 1/4. Für einen L Projektor ist das aber auch der Fall; der Apparat ist daher nicht eindeutig bestimmt. Nach der vorhergehenden Untersuchung ist das nicht verwunderlich, denn wir wissen bereits, dass wir jede Messung durch komplexe Zahlen charakterisieren müssen. Daher sollten 4 komplexe (bzw. 8 reelle) Zahlen zur Charakterisierung ausreichen. Algebraisieren wir unser Schaltbild nach unseren bisherigen Regeln, wobei wir für den Apparat einfach A schreiben, so erhalten wir für das gezeichnete Bild den Ausdruck |HihH| A |HihH| . (3.63) Wir haben gesehen, dass falls für A bekannte Apparate eingesetzt werden, so resultiert für hH| A |Hi stets eine komplexe Zahl. Wir versuchen daher, das für einen beliebigen Apparat durchzuhalten: wir fordern, dass hH| A |Hi für jeden Apparat eine komplexe Zahl sein soll, deren Betragsquadrat die Bedeutung einer Wahrscheinlichkeit hat. Algebraisieren wir die vier angedeuteten Messexperimente, so erhalten wir vier komplexe Zahlen, die wir als 2 × 2–Matrix schreiben: µ ¶ hH| A |Hi hH| A |V i A(l|l) := (3.64) hV | A |Hi hV | A |V i 46 3.4. Allgemeine Apparate bzw. Operatoren Wir nennen diese Matrix eine Darstellung vom Apparat A in der H/V Basis. Eine andere Darstellung erhält man, indem man die zwei linearen Analysatoren gegen andere austauscht. Durch solche Experimente kann man die Wirkung“eines beliebigen ” Apparates A, also alle 4 komplexen Zahlen erhalten. Schalten wir vor und nach dem Apparat A einen zirkularen Analysatorkreis erhalten wir µ |Hi hH|Ri · hR| A |Ri · hR|Hi + hH|Li · hL| A |Ri · hR|Hi ¶ hH|Ri · hR| A |Li · hL|Hi + hH|Li · hL| A |Li · hL|Hi hH| . (3.65) Betrachten wir am Anfang und Ende wieder alle vier Möglichkeiten erhalten wir A(l|l) = U (l|z) · A(z|z) · U (z|l) = U (l|z) · A(z|z) · U † (l|z) , (3.66) dabei ist U die unitäre Matrix, die eine Basis in eine andere umwandelt. Damit kennen wir den Zusammenhang zwischen den verschiedenen Darstellungen eines allgemeinen Apparates. Wir erkennen auch das falls wir A mit eiα , also einer belieben Phase multiplizieren, diese aus allen Summanden als Faktor herausgehoben werden kann und fällt damit bei der Bildung des Betragsquadrates —nur dieses ist messbar— wieder heraus. D.h. wir brauchen nicht 8 reelle Zahlen, sondern nur 7 (vier Beträge, 3 Phasen) zur Bestimmung eines allgemeinen Apparates. Jetzt haben wir gelernt, wie wir im Formalismus jeden beliebigen Apparat durch eine Matrix beschreiben können. Hier sei darauf hingewiesen, dass nicht jede Matrix ein Messapparat ist. Welche mathematischen Einschränkungen an die Matrix gemacht werden müssen, werden wir später noch genauer behandeln. Ein Kriterium können wir leicht angeben: wir haben stets Apparate betrachtet, in denen keine Objekte erzeugt werden. Für solche darf die Summe der Ausgangsintensitäten höchstens gleich der Eingangsintensität sein, d.h. es muss für ein vollständiges System (|bi i) von Basiszuständen und irgendeinen Zustand, z.B. |a1 i) X |hbi |A|a1 i|2 ≤ 1 (3.67) i gelten. Die analoge Beziehung für Matrixelemente in einer Zeile X |ha1 |A|bi i|2 ≤ 1 i ist ebenfalls erfüllt. 47 (3.68) Kapitel 3. Wie soll man mit Quantenobjekten umgehen? 3.5 Das Observablenaxiom oder wie das Experiment mit der Theorie zusammenhängt Wir haben bis jetzt sehr viel über Operatoren gesprochen und sehr wage darüber, wie es mit der im Experiment beobachteten Größe, Observable, zusammenhängt. Das Axiom, also eine nicht überprüfbare Feststellung, können wir so formulieren: Das Observablenaxiom: (1) Jede physikalische Observable A wird durch einen linearen hermitischen Operator A in der Theorie dargestellt. (2) Der Erwartungswert hAiψ von A im (normierten) Zustand ψ ist durch hAiψ = hψ| A |ψi = T r(A |ψihψ|) (3.69) gegeben. Die Hermitizität von A garantiert, dass der Erwartungswert reell ist. Nach diesem Axiom muss man für jede physikalische beobachtbare Größe einen hermitischen Operator konstruieren können. Interessant ist die Frage, ob auch die Umkehrung gilt. Das muss eindeutig verneint werden; nicht jeder hermitische Operator entspricht einer Observablen. Es ist aber oft hilfreich die Menge aller hermitischen Operatoren zu betrachten und dann später eventuell Superauswahlregeln“zu definieren. ” Ein weiteres Grundprinzip der empirischen Wissenschaften ist, dass Messungen reproduzierbar sein müssen. Wie wir bei der Diskussion von Spin 12 Teilchen sehen werden, sind die möglichen Eigenwerte eines Operators die im Experiment gemessenen Werte. Weiters haben wir in unseren Experimenten erkannt, dass falls sich das Teilchen schon in einem der möglichen Eigenzustände befindet, dann ändert dies eine weitere Messung nicht. Allgemein können wir dies so zusammenfassen: 48 3.5. Das Observablenaxiom oder wie das Experiment mit der Theorie zusammenhängt Messwerte: (3) Durch Messung eines diskreten Messwertes der Observablen A stellt man einen Eigenzustand |ai des zugehörigen Operators A her: A |ai = a |ai . (3.70) Die möglichen Messwerte von der Observablen A sind also die Eigenwerte vom Operator A. Ein Spezialfall eines Messoperators ist der Projektor, den wir als ersten kennengelernt haben. Diese Operatoren sind durch die Idempotenz, also Pb1 · · · · · Pb1 = Pb1 · Pb1 = Pb1 , (3.71) definiert. Die Eigenwertgleichung lautet daher Pb1 · · · · · Pb1 |Eigenzustandi = Pb1 · Pb1 |Eigenzustandi = Pb1 |Eigenzustandi = λ · · · · · λ|Eigenzustandi = λ2 |Eigenzustandi = λ|Eigenzustandi . (3.72) Die Lösungen dieser Eigenwertgleichung sind λ = 0 und λ = 1. Die Eigenvektoren zum Projektor Pb1 = |b1 ihb1 | können wir daher gleich erraten Pb1 |b1 i = 1 · |b1 i Pb1 |b2 i = 0 · |b1 i , (3.73) wobei |b2 i alle Zustandsvektoren sind, die orthogonal auf |b1 i sind. Die zum Projektionsoperator Pb1 gehörende Observable legt also fest, ob der Zustand |b1 i vorliegt oder nicht, entspricht also der Frage ans Quantensystem: Bist Du im Zustand b1 oder nicht? Alle möglichen Werte eines Messoperators werden als Spektrum bezeichnet. Es stellt sich heraus, dass jeder Operator in die so genannte Spektraldarstellung zerlegt werden kann X X A = an |an ihan | = an Pn (3.74) n n und das sogar eindeutig! Hierbei erfolgte die Summe über alle möglichen Messwerte. Wir sehen also, dass wir einen beliebigen Operator immer in Projektoren zerlegen können. 49 Kapitel 3. Wie soll man mit Quantenobjekten umgehen? Insbesondere gilt also nicht: A · A 6= A X X X X ( an Pn ) · ( am Pm ) = a2n Pn · Pn + an am Pn · Pm n = m X n i.Allg. a2n Pn 6= an Pn . n6=m (3.75) n 50