Grundlagen der Elementarteilchenphysik Nicolas BORGHINI Fakultät für Physik Universität Bielefeld 4. Februar 2014 N.BORGHINI Elementarteilchenphysik Inhaltsverzeichnis Vorbemerkungen 1 A 3 I II III IV Relativistische Quantenmechanik Spezielle Relativitätstheorie I.1 Vorbereitung: Isometrien im 3-dimensionalen euklidischen Raum I.1.1 Isometrien . . . . . . . . . . . . . . . . . . . . . . . . . . . I.1.2 Skalare, Vektoren und Tensoren . . . . . . . . . . . . . . . I.1.3 Irreduzible Darstellungen . . . . . . . . . . . . . . . . . . I.1.4 Spinoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.2 Lorentz-Transformationen . . . . . . . . . . . . . . . . . . . . . . I.2.1 Linienelement . . . . . . . . . . . . . . . . . . . . . . . . . I.2.2 Lorentz-Transformationen . . . . . . . . . . . . . . . . . . I.2.3 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.3 Kontra- und kovariante Indizes . . . . . . . . . . . . . . . . . . . I.3.1 Skalare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.3.2 Kontravariante Vektoren . . . . . . . . . . . . . . . . . . . I.3.3 Kovariante Vektoren . . . . . . . . . . . . . . . . . . . . . I.3.4 Tensoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.3.5 Kontraktion zweier Tensoren . . . . . . . . . . . . . . . . I.3.6 Kovariante Formulierung eines physikalischen Gesetzes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 6 6 7 9 13 14 14 15 16 16 16 17 17 18 19 19 Klein–Gordon-Gleichung II.1 Heuristische Herleitung . . . . . . . . . . . . . . . . . . . . . . . . II.2 Lösung der freien Klein–Gordon-Gleichung . . . . . . . . . . . . . II.2.1 Allgemeine Lösung . . . . . . . . . . . . . . . . . . . . . . II.2.2 Teilchen-Interpretation der Klein–Gordon-Wellenfunktion II.3 Zweite Quantisierung der freien Klein–Gordon-Gleichung . . . . . II.3.1 Zweite Quantisierung . . . . . . . . . . . . . . . . . . . . . II.3.2 Physikalische Deutung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 22 22 23 24 24 25 Dirac-Gleichung III.1 Heuristische Herleitung . . . . . . . . . . . . . . . III.2 „Diracologie“ . . . . . . . . . . . . . . . . . . . . III.2.1 Eigenschaften der Dirac-Matrizen . . . . . III.2.2 Chiralitätsoperator . . . . . . . . . . . . . III.2.3 Dirac-adjungierter Spinor . . . . . . . . . III.3 Lösung der freien Dirac-Gleichung . . . . . . . . III.3.1 Wellenlösungen . . . . . . . . . . . . . . . III.3.2 Zweite Quantisierung der Wellenlösungen III.3.3 Helizität und Chiralität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 28 30 30 31 31 32 32 35 37 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Maxwell-Gleichungen 41 IV.1 Kovariante Formulierung der Elektrodynamik . . . . . . . . . . . . . . . . . . . . . . 41 IV.2 Lösung der freien Maxwell-Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 42 ii N.BORGHINI B V VI Elementarteilchenphysik Wechselwirkende Teilchen 45 Relativistische Kinematik V.1 Schwerpunktsenergie, Reaktionsschwelle V.2 Zwei Teilchen im Endzustand . . . . . . V.3 Drei Teilchen im Endzustand . . . . . . V.4 Kinematik einfacher Stöße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 48 48 49 50 Zerfälle VI.1 Definitionen . . . . . . . . . . . . . . . VI.2 Berechnung der Zerfallsrate . . . . . . VI.2.1 Streumatrix . . . . . . . . . . . VI.2.2 Zeitabhängige Störungstheorie . VI.2.3 Vereinfachtes Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 52 52 52 53 54 . . . . . . . 58 58 58 59 61 61 62 63 . . . . . VII Streuprozesse VII.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII.1.1 Erste Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII.1.2 Wirkungsquerschnitt. Luminosität . . . . . . . . . . . . . . . . . . . . . VII.2 Berechnung des Wirkungsquerschnitts . . . . . . . . . . . . . . . . . . . . . . . VII.2.1 Fermis Goldene Regel für Streuprozesse . . . . . . . . . . . . . . . . . . VII.2.2 Flussfaktor. Lorentz-invariante Form des totalen Wirkungsquerschnitts VII.2.3 Differentieller Wirkungsquerschnitt in einem Zwei-nach-zwei-Prozess . . VIII C IX X . . . . . . . . . . . . . . Feynman-Regeln 66 Wechselwirkungen der Elementarteilchenphysik Quantenelektrodynamik IX.1 Feynman-Regeln der Quantenelektrodynamik . . . . . . . . IX.2 Grundlegende Prozesse . . . . . . . . . . . . . . . . . . . . . IX.2.1 Prozess erster Ordnung . . . . . . . . . . . . . . . . IX.2.2 Elastische Prozesse zweiter Ordnung . . . . . . . . . IX.2.3 Inelastische Prozesse zweiter Ordnung . . . . . . . . IX.2.4 Wichtige Prozesse dritter Ordnung . . . . . . . . . . IX.3 Wirkungsquerschnitt für elastische Elektron–Myon-Streuung Starke Wechselwirkung X.1 Quarkmodell . . . . . . . . . . . . . . . . . . . . . . . . . . X.1.1 Eightfold Way . . . . . . . . . . . . . . . . . . . . . X.1.2 Hadronenerzeugung in Elektron–Positron-Kollisionen X.2 Partonmodell . . . . . . . . . . . . . . . . . . . . . . . . . . X.2.1 Tiefinelastische Streuung . . . . . . . . . . . . . . . . X.2.2 Partonen . . . . . . . . . . . . . . . . . . . . . . . . X.3 Quantenchromodynamik . . . . . . . . . . . . . . . . . . . . X.3.1 Vertices der QCD . . . . . . . . . . . . . . . . . . . . X.3.2 Wichtige Vorhersagen der Quantenchromodynamik . X.3.3 Symmetrien der QED und der QCD . . . . . . . . . 71 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 74 75 75 76 78 79 80 . . . . . . . . . . 85 85 85 88 91 91 92 94 95 96 98 iii N.BORGHINI XI Elementarteilchenphysik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 . 103 . 103 . 103 . 105 . 105 . 105 . 106 . 106 . 107 . 107 . 110 . 111 . 111 . 112 XII Elektroschwaches Standardmodell XII.1 Eichtheorien . . . . . . . . . . . . . . . . . . . . . . . . . XII.1.1 Notwendigkeit nach Renormierbarkeit . . . . . . . XII.1.2 Eichinvarianz . . . . . . . . . . . . . . . . . . . . . XII.2 Lagrange-Dichte des Standardmodells . . . . . . . . . . . XII.2.1 Bausteine des Standardmodells . . . . . . . . . . . XII.2.2 Lagrange-Dichte des elektroschwachen Sektors . . XII.3 Spontane Symmetriebrechung. Higgs-Boson . . . . . . . . XII.3.1 Spontane Symmetriebrechung . . . . . . . . . . . XII.3.2 Higgs-Boson . . . . . . . . . . . . . . . . . . . . . XII.4 Vektorbosonen im Standardmodell . . . . . . . . . . . . . XII.5 Fermionen im Standardmodell . . . . . . . . . . . . . . . XII.5.1 Wechselwirkung der Leptonen mit dem Higgs-Feld XII.5.2 Quark-Massen . . . . . . . . . . . . . . . . . . . . XII.5.3 CKM-Matrix und CP -Verletzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . D Schwache Wechselwirkung XI.1 Symmetrieverletzungen . . . . . . . . . . . . . XI.1.1 Verletzung der Flavour-Quantenzahlen XI.1.2 Paritätsverletzung . . . . . . . . . . . XI.1.3 Verletzung der Ladungskonjugation . . XI.1.4 CP -Verletzung . . . . . . . . . . . . . XI.1.5 Zeitumkehrverletzung . . . . . . . . . XI.2 Phänomenologische Modelle . . . . . . . . . . XI.2.1 Fermi-Modell . . . . . . . . . . . . . . XI.2.2 V −A-Modell . . . . . . . . . . . . . . XI.2.3 Flavour-Mischung im V −A-Modell . . XI.2.4 Neutrale Ströme . . . . . . . . . . . . XI.3 Vektorbosonen der schwachen Wechselwirkung XI.3.1 Unitaritätsgrenze . . . . . . . . . . . . XI.3.2 Schwache Bosonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Jenseits des Standardmodells XIII Neutrinos XIII.1 Neutrino-Massen . . . . . . . . . XIII.1.1 Neutrinomischung . . . . . XIII.1.2 Neutrino-Oszillationen . . XIII.2 Neutrinos als Majorana-Teilchen . 114 114 114 115 116 116 118 120 121 122 123 125 126 126 127 131 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 134 134 135 138 iv N.BORGHINI Elementarteilchenphysik Vorbemerkungen Einheiten In der Teilchenphysik wird ein System sogenannter natürlicher Einheiten verwendet, und zwar ein Einheitensystem, in dem die Vakuumlichtgeschwindigkeit c und das Planck’sche Wirkungsquantum ~ = h/2π den Wert 1 annehmen. Infolgedessen können diese Konstanten dann von den Gleichungen weggelassen werden. Zur Rechtfertigung dieser Wahl sei erinnert, dass mechanische Größen wie Länge ([L]), Zeit ([T ]), Masse ([M ]), Energie ([E]), Geschwindigkeit ([v]), Kraft ([F ]), Drehimpuls ([J]), usw. sich als Kombinationen von Potenzen von nur 3 Basisgrößen zerlegen lassen. Im MKS-System (Meter, Kilogramm, Sekunde) handelt es sich bei diesen Grundgrößen um die Länge, die Masse und die Zeit, mit zugehörigen metrischen Einheiten. Dann können andere Größen, und somit deren Einheiten, durch diese Basisgrößen ausgedrückt werden: [L], [M ], [T ], [E] = [M L2 T −2 ], [v] = [LT −1 ], [F ] = [M LT −2 ], [J] = [M L2 T −1 ] . . . Man darf aber andere Basisgrößen wählen, solange die Basis alle anderen Größen erzeugen kann. Eine mögliche solche Wahl besteht darin, als Grundgrößen Energie, Geschwindigkeit und Drehimpuls zu nehmen. Dann erhält man1 [L] = [JvE −1 ], [M ] = [Ev −2 ], [T ] = [JE −1 ], [F ] = [E 2 J −1 v −1 ] . . . Jetzt soll man noch die Basiseinheiten für die neuen Grundgrößen wählen. Die Energie wollen wir im Folgenden in GeV messen, wobei 1 eV (Elektronenvolt) der Zunahme der kinetischen Energie eines durch eine Spannung von 1 Volt beschleunigten Elektrons entspricht, 1 eV ' 1, 6 · 10−19 J. Dann wollen wir Geschwindigkeit in Einheiten der Lichtgeschwindigkeit c messen. Schließlich werden Drehimpulse in Einheiten des Wirkungsquantums ~ ausgedrückt — entsprechend der Redensart „Spin 12 “ für einen Spin, dessen Projektion auf eine Achse 12 ~ beträgt. Somit werden jetzt Längen in Einheiten von ~c/GeV gemessen, Massen in Einheiten von GeV/c2 , Zeiten in Einheiten von ~/GeV, Impulse in Einheiten von GeV/c, usw.: 1 fm = 10−15 m ' 1 ~c , 0, 197 GeV 10−23 s ' 1 ~ , 0, 0658 GeV 10−27 kg ' 1 GeV/c2 . . . 1, 783 Schließlich kann man jetzt ~ = c = 1 annehmen, so dass Längen und Zeiten in GeV−1 und Massen in GeV angegeben sind. Auf der Seite des Elektromagnetismus werden hiernach elektrische Ladungen in Einheiten der Elementarladung e ' 1, 602 · 10−19 C — entsprechend dem Betrag der Ladung des Elektrons — gemessen. Darüber hinaus wird 0 = 1 angenommen, woraus µ0 = 1 dank der Beziehung 0 µ0 c2 = 1 folgt (Heaviside–Lorentz-Einheitensystem). Schließlich werden Temperaturen, falls sie auftreten, ebenfalls in GeV angegeben, entsprechend erstens der Wahl von Energie / Temperatur als Grundgröße — anstatt der Temperatur wie im SISystem—, und zweitens der Messung dieser neuen Basisgröße in Einheiten von der BoltzmannKonstante kB : 1 GeV/kB . 1013 K = 1, 16 Dann kann man kB = 1 annehmen. 1 Vgl. die bekannten Beziehungen: de Broglie-Wellenlänge λ = ~ / Impuls = ~c / Energie, Energie = Masse × c2 , Energie = ~ × Frequenz = ~ / Zeit, Kraft = Gradient der potentiellen Energie = Energie / Länge... 1 N.BORGHINI Elementarteilchenphysik Notationen Die Vektoren des dreidimensionalen euklidischen Raums werden mit einem Pfeil geschrieben, wie z.B. ~v oder ~x. Die Vierervektoren werden in einer Sans Serif-Schriftart geschrieben, wie z.B. p (Viererimpuls), A (Viererpotential), usw. Die gleiche Schriftart wird auch für Lorentz-Tensoren höherer Stufe verwendet, z.B. für die Feldstärketensoren F, G, oder für den metrischen Tensor η. Dagegen werden die Komponenten dieser Vierervektoren und Lorentz-Tensoren in Kursivschrift geschrieben: pµ , Aµ , F µν , ηµν , usw. Quantenmechanische Operatoren werden mit einem Zirkumflex bezeichnet, z.B. â, ↠Indizes Lateinische Indizes i, j, k, l, usw. laufen über die drei möglichen räumlichen Koordinaten, d.h. über 1, 2, 3 oder x, y, z. Ziemlich inkonsequent wird auf ihre Stelle (tief- oder hochgestellt) nicht aufgepasst, wenn sie sich auf rein dreidimensionale Größen beziehen, d.h. nicht auf die räumlichen Komponenten von Vierervektoren oder Lorentz-Tensoren. Somit gilt vi = v i für die i-Komponente der Geschwindigkeit ~v . Dagegen ist im Fall des Raumanteils eines Vierervektors oder eines Lorentz-Tensors die Stelle des Index wichtig. Griechische Indizes µ, ν, ρ, σ, usw. laufen über die vier Raumzeit-Koordinaten 0, 1, 2, 3. Auf die Stelle dieser Lorentz-Indizes soll aufgepasst werden, vgl. Abschn. I.3. Im ganzen Skript wird die Einstein’sche Summenkonvention verwendet, d.h. auf doppelt auftretende Indizes wird summiert. Somit gelten im Fall dreidimensionaler Indizes ai bi = ai bi ≡ 3 X ai bi , Mii ≡ i=1 3 X Mii , i=1 entsprechend dem Skalarprodukt ~a · ~b bzw. der Spur Tr M. Im Fall von Lorentz-Indizes sollte der eine kontravariant, der andere kovariant sein [s. Abschn. I.3.5]: µ µ a bµ = aµ b ≡ 3 X µ=0 µ a bµ = 3 X µ aµ b , µ=0 T µ µ = 3 X T µµ, µ=0 entsprechend dem Viererprodukt a · b bzw. der Spur Tr T. 2 Teil A Relativistische Quantenmechanik Version vom 4. Februar 2014, 10:59 3 N.BORGHINI Elementarteilchenphysik Elementarteilchen blabla... eine Einleitung fehlt... Relativistische Quantenmechanik 5 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik I. Spezielle Relativitätstheorie In diesem Kapitel werden einige Elemente der Speziellen Relativitätstheorie dargestellt. Das Ziel dabei ist meistens ein paar Definitionen und Ergebnisse zu sammeln, die für die Elementarteilchenphysik relevant sind, sowie Notationen einzuführen. In einem ersten Schritt (Abschn. I.1) wird der Fall des mehr intuitiven dreidimensionalen euklidischen Raums der nicht-relativistischen Physik diskutiert, beginnend mit dessen Isometrien, dann über die mathematischen Größen, die sich unter solchen Isometrien einfach transformieren, bis hin zur unterliegenden Algebra der Gruppe der Drehungen. Abschnitt I.2 befasst sich dann mit dem Minkowski-Raum der relativistischen Physik und mit dessen Lorentz-Transformationen. Schließlich wird in Abschn. I.3 das Verhalten physikalischer Größen unter solchen Lorentz-Transformationen diskutiert. I.1 Vorbereitung: Isometrien im 3-dimensionalen euklidischen Raum Hiernach werden einige Ergebnissen über Isometrien, insbesondere Drehungen, in drei Dimensionen, sowie über die Algebra des Drehimpulses zusammengefasst. I.1.1 Isometrien Sei eine lineare Abbildung vom dreidimensionalen euklidischen RaumE 3 in sich selbst der Form ~x → ~x 0 = R(~x). (I.1) Die Isometrien sind solche Abbildungen, die das (euklidische) Skalarprodukt ~x · ~x invariant lassen. Darunter sind z.B. die Translationen sowie Transformationen mit mindestens einem Fixpunkt, wie die Drehungen oder die Punktspiegelungen. Im Folgenden wird die Diskussion auf solche Isometrien beschränkt, die einen gewissen Punkt invariant lassen, der als Ursprungspunkt eines kartesischen Koordinatensystems gewählt wird. Dementsprechend werden nur Vektoren ~x ausgehend von dieser Ursprung betrachtet. Stellt man die Vektoren ~x, ~x 0 vonE 3 als reelle einspaltige 3×1-Matrizen X, X 0 und R als eine reelle 3×3-Matrix R dar, so lässt sich Gl. (I.1) umschreiben als X → X 0 = RX. (I.2a) Mithilfe der jeweiligen Koordinaten xi , x0i mit i = 1, 2, 3 der Vektoren und der Matrixelemente Rij mit i, j = 1, 2, 3 der Abbildungsmatrix R lautet dies auch xi → x0i = Rij xj , (I.2b) wobei die Einstein’sche Summenkonvention — über doppelt auftretende Indizes wird summiert2 — verwendet wurde. In Matrixdarstellung lautet das Skalarprodukt X T X, mit X T dem einzeiligen transponierten Vektor von X. Damit R eine Isometrie darstellt, muss für jeden X ∈ R3 X T X = X 0 T X 0 = (RX)T RX = X T RT RX gelten, d.h. die Matrix R muss der Eigenschaft RT R = 13 (I.3) genügen, mit 13 der 3 × 3-Identitätsmatrix. Umgekehrt stellt jede Matrix R, die diese Gleichung erfüllt, eine Isometrie des dreidimensionalen Raums dar. 2 S. die Bemerkung über die Stelle der Indizes in den einführenden Vorbemerkungen. I. Spezielle Relativitätstheorie 6 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Man prüft einfach nach, dass die Isometrien vonE 3 eine Gruppe bilden.3 Ebenfalls formen die assoziierten reellen 3×3-Matrizen mit der Eigenschaft (I.3) die orthogonale Gruppe O(3). Bemerkung: Dank der Beschränkung auf Isometrien mit einem festen Fixpunkt ist die Korrespondenz zwischen solchen Isometrien vonE 3 und den Matrizen von O(3) bijektiv. Mathematisch gesagt ist diese Korrespondenz eine sog. lineare Darstellung. Da die Matrizen der O(3) linearen Abbildungen vom dreidimensionalen Vektorraum R3 , dem Darstellungsraum, in sich selbst entsprechen, spricht man von einer Darstellung vom Grad 3. Die O(3)-Matrizen sind unitär—sie sind reell und erfüllen Gl. (I.3)—, so dass die Darstellung auch als unitär bezeichnet wird. Schließlich ist die Darstellung irreduzibel , weil es keinen nicht-trivialen Unterraum des Darstellungsraums gibt, der invariant unter der Wirkung der O(3) ist. Bildet man die Determinante der Gleichung (I.3), so erhält man (det R)2 = 1, d.h. det R = ±1. Solche Matrizen mit Determinante +1 formen die spezielle orthogonale Gruppe SO(3), deren Elemente die dreidimensionalen Drehungen (um den Ursprungspunkt) darstellen. Die Isometrien4 mit Determinante −1 ergeben sich durch Komposition der Drehungen mit der Punktspiegelung um den Ursprungspunkt, auch Raumspiegelung genannt, die der Abbildungsmatrix −13 entspricht. Bemerkung: Die Bijektivität der Korrespondenz zwischen Isometrien von E 3 mit einem festen Fixpunkt und O(3)-Matrizen wird benutzt, um die letzteren ebenfalls als „Isometrien“ zu nennen, vgl. Fußnote 4. Dementsprechend werden die Matrizen von SO(3) als „Drehungen“ bezeichnet. I.1.2 Skalare, Vektoren und Tensoren In diesem Abschnitt werden Klassen von Größen definiert, die sich unter den Isometrien vonE 3 gemäß allgemeinen Gesetzen transformieren. I.1.2 a Skalare :::::::::::::: Als Skalar wird eine physikalische Größe bezeichnet, die unter Isometrien invariant bleibt. Zum Beispiel ist das infinitesimale Volumenelement d3 ~x ≡ dx1 dx2 dx3 ein Skalar, da aus Gl. (I.2b) folgt d3 ~x 0 = |det R| d3 ~x = d3 ~x für alle R ∈ O(3). Sei f (~x) eine Funktion aufE 3 , entsprechend einer ortsabhängigen physikalischen Größe. In einer isometrischen Transformation ~x → ~x 0 wird diese Funktion zu einer neuen Funktion f 0 (~x 0 ). Die Funktion f wird skalar genannt—und wird als Skalarfeld bezeichnet—, wenn für jede Isometrie ~x → ~x 0 , die transformierte Funktion f 0 genügt der Gleichung f 0 (~x 0 ) = f (~x). Ein Beispiel von Skalarfeld ist das elektrostatische Skalarpotential Φ(~x). Bemerkungen: ∗ Für das Verständnis der Bedeutung der transformierten Funktion f 0 lohnt es sich, die Transformation ~x → ~x 0 nicht als eine „aktive Transformation“—entsprechend einer Änderung des Zustands eines physikalischen Systems (z.B. dessen Orientierung, wenn das System nicht punktförmig ist) bei unverändertem Koordinatensystem—, sondern als eine „passive Transformation“—wobei der Zustand des Systems unverändert bleibt, während das Koordinatensystem transformiert ist. Beispielsweise ist die aktive Drehung eines Vektors um einen Winkel θ um eine gegebene Achse äquivalent zur passiven Drehung um den Winkel −θ um die gleiche Achse.5 ∗ Auch wenn eine Funktion f skalar ist, kann deren Variation f 0 (~x) − f (~x) in einem Punkt nicht null sein. Diese Variation wird in Abschn. I.1.3 c unten für den Fall einer infinitesimalen Drehung berechnet. 3 1. Die Komposition zweier Isometrien ergibt eine Isometrie. 2. Die Komposition ist assoziativ. 3. Die Identität wirkt als neutrales Element bzgl. der Komposition. 4. Jede Isometrie besitzt ein inverses Element. 4 Genauer, die durch eine Matrix mit Determinante −1 dargestellten Isometrien. 5 Zu aktiven und passiven Transformationen, s. z.B. Ref. [1], Kap. 7.1. I. Spezielle Relativitätstheorie 7 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Einige physikalischen Größen bleiben invariant unter der Wirkung der Drehungen, ändern aber ihr Vorzeichen unter der Raumspiegelung — und somit, unter der Isometrien mit Determinante −1. Eine solche Größe wird Pseudoskalar genannt. I.1.2 b Vektoren :::::::::::::::: In der Physik wird nicht jedes Element eines Vektorraums als Vektor bezeichnet. Die Bezeichnung wird nur für solche verwendet, deren Koordinaten sich unter einer Isometrie ähnlich verhalten, wie die Raumkoordinaten. Somit transformieren sich die Koordinaten Vi , i = 1, 2, 3 eines Vektors gemäß [vgl. Gl. (I.2b)] Vi → Vi0 = Rij Vj . (I.4a) In Matrixdarstellung lautet diese Transformation V → V 0 = RV. (I.4b) Ein triviales Beispiel von Vektor ist die Geschwindigkeit eines Teilchen. Analog mit den Skalarfeldern bzw. Pseudoskalaren werden Vektorfelder bzw. Pseudovektoren definiert. Die Letzteren werden auch Axialvektoren genannt. ~ ~x , wobei der Index ~x weggelassen Ein wichtiges Beispiel von Vektorfeld ist der Gradient-Operator ∇ wird, wenn es keine Mehrdeutigkeit geben kann. Unter einer Isometrie (I.1)–(I.2) transformiert sich dessen Matrixdarstellung gemäß ∇~x → ∇~x 0 = R∇~x . (I.5) Beweis: Betrachtet man die Komponenten des Gradienten, so liefert die Kettenregel ∂x0j ∂ ∂ ∂ ∂ = Rji 0 = (RT )ij 0 . = ∂xi ∂xi ∂x0j ∂xj ∂xj In Matrixdarstellung lautet dies ∇~x = RT ∇~x 0 , woraus Gl. (I.5) nach Inversion unter Verwendung von (RT )−1 = R [vgl. Gl. (I.3)] folgt. ~ x) ein Vektorfeld. Infolgedessen ist das elektrostatische Feld E~ (~x) = −∇Φ(~ I.1.2 c Tensoren beliebiger Stufe ::::::::::::::::::::::::::::::: Ein Tensor ist eine physikalische Größe, deren Koordinatendarstellung eine beliebige feste Zahl von Indizes — die Stufe des Tensors — erfordert, z.B. Tij , wobei jeder Index sich unter Isometrien wie die Komponenten eines Vektors transformiert, also gemäß Gl. (I.4a). Beispielsweise lautet die Transformation eines Tensors 2. Stufe 0 Tij → Tij = Rik Rjl Tkl . (I.6) Der auf die Tensorkoordinaten wirkenden Operator für die Isometrie ist somit das Produkt der Isometrien auf jeden Index. Dazu definiert man noch Pseudotensoren, deren Komponenten unter Isometrien sich wie die Komponenten von Pseudovektoren verhalten, sowie ortsabhängige Tensorfelder . Bemerkungen: ∗ Da jeder Index die Werte 1,2,3 annehmen kann, hat ein Tensor k-ter Stufe insgesamt 3k Komponenten. ∗ Skalare bzw. Vektoren sind Tensoren 0. bzw. 1. Stufe. ∗ Die Komponenten eines Tensors 2. Stufe Tij können als die Elemente einer 3×3-Matrix T betrachtet werden. Dann wird das Transformationsgesetz (I.6) zu T → T 0 = RTRT = RTR−1 , (I.7) entsprechend der Transformation einer Matrix unter eine Änderung des Koordinatensystems. I. Spezielle Relativitätstheorie 8 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Invariante Tensoren Nimmt man Tij = δij in Gl. (I.6), mit δij dem üblichen Kronecker-Symbol δij = 1 wenn i = j, 0 0 = T . Ein solcher Tensor, dessen Komponenten die gleichen unter Isometrien sonst, so erhält man Tij ij bleiben, heißt invarianter Tensor . Ein weiteres Beispiel ist der vollständig antisymmetrische Levi–Civita-Tensor +1 falls (i, j, k) eine gerade Permutation von (1,2,3) ist, ijk = −1 falls (i, j, k) eine ungerade Permutation von (1,2,3) ist, (I.8) 0 sonst. Da jeder Index sich gemäß Gl. (I.6) transformiert, erhält man ijk → 0ijk = Rii0 Rjj 0 Rkk0 i0 j 0 k0 = (det R)ijk . (I.9) Somit ist der Levi–Civita-Tensor ein invarianter Pseudotensor, der unverändert unter Drehungen bleibt, während er unter Raumspiegelung sein Vorzeichen ändert. Kontraktion zweier Tensoren Es seien Vi , Wj die Komponenten zweier Vektoren. Dann sind die 9 Produkte Vi Wj die Komponenten eines Tensors 2. Stufe. Setzt man die zwei Indizes i und j gleich und summiert man dann über alle Werte von i, so erhält man Vi Wi . Das ist gerade das Skalarprodukt der zwei Vektoren, d.h. ein Tensor 0. Stufe. Allgemeiner erhält man ausgehend von einem Tensor k-ter Stufe einen Tensor der Stufe k − 2, indem zwei Indizes des Ausgangstensors gleichgesetzt und dann die Summe über alle Werte des Index gebildet wird. Diese Operation wird Kontraktion gennant. Beispielswiese liefert die Kontraktion der zwei Indizes eines Tensors 2. Stufe Tij gerade die Spur Tr T der assoziierten Matrix T. Betrachtet man den Pseudotensor 5. Stufe ijk Vl Wm , mit Vl , Wm ~ und W ~ , und bildet man die doppelte Kontraktion zum einen den Komponenten zweier Vektoren V der Indizes j und l, zum anderen von k und m, so ergibt sich der Pseudovektor mit Komponenten ~ ×W ~. ijk Vj Wk , d.h. der Kreuzprodukt V I.1.3 Irreduzible Darstellungen Jetzt wird das Verhalten physikalischer Größen unter Isometrien vonE 3 , und insbesondere unter Drehungen, etwa systematischer untersucht. Dafür werden einige Begriffe und Ergebnisse der Gruppentheorie eingeführt und verwendet, ohne Beweis. I.1.3 a Infinitesimale Drehungen ::::::::::::::::::::::::::::::: Eine Drehung um den infinitesimal kleinen Winkel dθ um die Koordinatenachse j transformiert einen Vektor ~x vonE 3 in ~x 0 = R(~x) = ~x + dθ~ej × ~x, (I.10a) mit ~ej dem Einheitsvektor in Richtung j. In Koordinaten lautet dies x0k = Rkl xl = xk + dθjkl xl . (I.10b) Somit sind die Elemente der Darstellungsmatrix R gegeben durch Rkl = δkl + dθjkl . (I.10c) Diese Drehungsmatrix kann umgeschrieben werden als R = 13 − i dθ Jj , (I.10d) wobei Jj eine 3 × 3-Matrix ist, die als Generator oder Erzeuger der Gruppe SO(3) bezeichnet ist I. Spezielle Relativitätstheorie 9 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Aus den zwei letzteren Gleichungen leitet man die Matrixelemente von J ab: (Jj )kl = −ijkl . In Matrixdarstellung lauten die drei Generatoren von 0 0 0 0 0 J1 = 0 0 −i , J2 = 0 0 0 i 0 −i 0 SO(3) i 0 −i 0 0 , J3 = i 0 0 . 0 0 0 0 (I.11a) (I.11b) Diese Matrizen sind hermitesch. Man prüft einfach nach, dass die Generatoren Jj den Vertauschungsrelationen [ Ji , Jj ] = iijk Jk (I.11c) genügen. Allgemein lautet die infinitesimale Drehung um den Winkel dθ um die Richtung mit Einheitsvektor ~e R = 13 − i dθ~e · ~J, (I.12) wobei zu beachten ist, dass das Punktprodukt ~e · ~J eine Matrix bezeichnet. Eine Drehung um einen beliebigen Winkel θ kann dann als Produkt von N Drehungen um den Winkel θ/N um die gleiche Achse ausgedrückt werden. Somit erhält man N θ R = lim 13 − i ~e · ~J = exp −iθ~e · ~J . (I.13) N →∞ N Bemerkung: Die Einführung eines Faktors i in Gl. (I.10d), und entsprechend in die Matrizen Jj Gl. (I.11), ist zwar überraschend, da die SO(3)-Matrizen reell sind. Dieser Faktor erlaubt aber eine einfache Verallgemeinerung auf Gruppen komplexer Matrizen, wie z.B. in Abschn. I.1.4 unten. I.1.3 b Lineare Darstellungen der Gruppe der Drehungen ::::::::::::::::::::::::::::::::::::::::::::::::::::::: Wie schon in Abschn. (I.1.1) erwähnt wurde, handelt es sich bei den 3×3-Matrizen R im vorigen Abschnitt um die Operatoren (auf R3 ) einer linearen Darstellung von Grad 3 der Drehungen R des euklidischen RaumsE 3 . Allgemeiner kann man die Drehungen als Operatoren (bzw. Matrizen, wenn E endlicher Dimension ist) S(R) auf einem Vektorraum E darstellen, mit S einem Gruppenhomomorphismus. Betrachtet man dann eine infinitesimale Drehung, so lässt sich der assoziierte Operator in der Form (I.12) schreiben, mit R bzw. den Matrizen Jj ersetzt durch S(R) bzw. durch drei Operatoren Jj(E) . Meistens benutzt man unitäre Darstellungen, so dass die Generatoren Jj(E) hermitesch sind.6 Dank Gl. (I.13) bestimmen die Letzteren völlig die Transformationen durch Drehungen. Ein wichtiger Punkt ist, dass die Vertauschungsrelationen (I.11c) auch für die Generatoren Jj(E) gelten. Diese Relationen werden (in der Physik) Lie-Algebra der Gruppe genannt. Daraus folgen einige Ergebnisse:7 2 2 2 2 • Der Operator J~ (E) ≡ J1(E) + J2(E) + J3(E) kommutiert mit jedem Generator Jj(E) und 2 damit mit jedem Operator S(R). Somit ist jeder Eigenunterraum von J~ (E) invariant unter der Gruppe der S(R). 2 • Die möglichen Eigenwerte von J~ (E) sind der Form j(j + 1) mit j ganz- oder halbzahlig. 2 • Die möglichen Eigenwerte von J3(E) im Eigenunterraum J~ (E) assoziiert mit dem Eigenwert j sind die 2j + 1 reellen Zahlen m = −j, −j + 1, . . . , j − 1, j. Ein zugehöriger Eigenvektor wird hiernach als |j, mi bezeichnet. (E) (E) † † Aus Jj(E) = Jj(E) folgt für die Drehung um θ um die j-Achse S(R)† = eiθJj = e−iθJj = S(R)−1 . 7 Diese Eigenschaften sollten aus der Quantenmechanik-Vorlesung schon bekannt sein. 6 I. Spezielle Relativitätstheorie 10 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik • Ausgehend von einem Eigenvektor |j, m0 i erhält man durch sukzessive Anwendungen der Lei(E) teroperatoren J± ≡ J1(E) ± iJ2(E) — die m um ±1 vergrößern — alle |j, mi für einen gegebenen Wert j. Diese Vektoren erzeugen einen einen Untervektorraum Ej der Dimension 2j + 1, invariant unter den Drehoperatoren S(R). Die Einschränkungen der S(R) auf Ej bilden also eine Darstellung der Drehungen. Da kein nicht-trivialer Unterraum von Ej invariant unter Drehungen ist, ist diese Darstellung irreduzibel. Dazu kann man zeigen, dass alle Darstellungen mit dem gleichen Eigenwert j äquivalent zueinander sind, so dass j die Darstellung vollständig charakterisiert. Beispiele Bei der Darstellung mithilfe von 3 × 3-Matrizen des Abschn. I.1.3 a handelte es sich um eine Darstellung von Grad 3. Für die Generatoren (I.11) gilt ~J 2 = 2 · 13 , entsprechend j = 1. Da 2j + 1 = 3 ist die Darstellung irreduzibel. Somit charakterisiert j = 1 die Transformation eines Vektors ~x vonE 3 . Betrachten wir jetzt die Transformationen der Tensoren 2. Stufe. Der assoziierten Darstellungsraum ist der Dimension 32 = 9. Gemäß Gl. (I.6) ist jetzt der Operator S(R) gleich dem Produkt zweier auf einem einzigen Index wirkenden Operatoren. Für eine infinitesimale Drehung gilt S(R) = 13 − i dθ~e · ~J(1) ⊗ 13 − i dθ~e · ~J(2) = 19 − i dθ~e · ~J(1) + ~J(2) + O (dθ)2 , wobei ~J(1) und ~J(2) die Generatoren der Drehungen auf jeden Index sind.8 Der Generator der Transformation für Tensoren ist somit ~J ≡ ~J(1) + ~J(2) ,8 d.h. die Summe zweier miteinander kommutierenden Operatoren gehorchend der Lie-Algebra (I.11c). Die möglichen Eigenwerte von ~J sind dann7 j(j + 1) mit j = |j1 − j2 |, |j1 − j2 | + 1, . . . , j1 + j2 , wobei j1 , j2 die Eigenwerte von ~J(1) , ~J(2) sind. Hier gilt j1 = j2 = 1, so dass j die Werte 0, 1 und 2 annehmen kann: der Darstellungsraum der Tensoren ist die direkte Summe der zugehörigen Eigenräumen mit der jeweiligen Dimension 1, 3 und 5. Was entsprechen diese Eigenräume? Das Transformationsgesetz (I.6) zeigt, das ein symmetrischer bzw. antisymmetrischer Tensor 2. Stufe sich unter Drehungen in einen symmetrischen bzw. antisymmetrischen Tensor transformiert, d.h. die Symmetrie unter dem Austausch der Indizes ist erhalten unter Drehungen. Somit bilden die antisymmetrischen Tensoren einen unter Drehungen invarianten Unterraum der Dimension 3, entsprechend der Angabe von T12 , T13 und T23 . Dieser Unterraum entspricht einer vektoriellen (j = 1) Darstellung — tatsächlich kann mit jedem antisymmetrischen Tensor Tjk ein Vektor Vi = 12 ijk Tjk assoziiert werden.9 Zum anderen bilden die symmetrischen Tensoren 2. Stufe einen Unterraum der Dimension 6. In Abschn. I.1.2 c wurde schon erwähnt, dass solche, die proportional zur Identität sind Tij ∝ δij , invariant unter Drehungen sind: diese Tensoren bilden eine skalare Darstellung (j = 0). Indem man schreibt 1 1 Tij = Tkk δij + Tij − Tkk δij , 3 3 lässt sich jeder symmetrische Tensor in einen Anteil proportional zur Identität und einen spurlosen Anteil zerlegen. Da die Spur invariant unter Rotationen ist [vgl. Gl. (I.7)], bilden die spurlosen symmetrischen Tensoren die Darstellung vom Grad 5, entsprechend j = 2. Bemerkung: Im Fall einer anderen Gruppe — z.B. für die Gruppe der D-dimensionalen Drehungen, entsprechend „natürlich“ der speziellen orthogonalen Gruppe SO(D) —, verallgemeinern sich die Vertauschungsrelationen (I.11c) der zugehörigen Generatoren — deren Anzahl nicht mehr unbedingt gleich 3 ist — auf die Lie-Algebra [Ji , Jj ] = ifijk Jk , mit sog. Strukturkonstanten fijk . 8 9 Im rechten Glied der Gleichung ist ~J(1) + ~J(2) eine Kurzform für ~J(1) ⊗ 13 + 13 ⊗ ~J(2) . Die Abbildung zwischen Tjk und Vi ist bijektiv: Tjk = ijk Vi . I. Spezielle Relativitätstheorie 11 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik I.1.3 c Transformation eines skalaren Feldes :::::::::::::::::::::::::::::::::::::::::: Bei den zwei Beispielen im letzteren Abschnitt handelt es sich um Darstellungen der Drehgruppe auf einem Darstellungsraum endlicher Dimension. Jetzt wird die Wirkung von Drehungen auf skalare Felder untersucht, d.h. auf die Elemente eines Vektorraums unendlicher Dimension. Sei wieder die Drehung um einen infinitesimal kleinen Winkel dθ um die j-Achse. Die Variation einer skalaren Funktion [f 0 (~x 0 ) = f (~x)] im Punkt ~x unter dieser Drehung lautet f 0 (~x) − f (~x) = f 0 (~x) − f 0 (~x 0 ) ' − ∂f 0 (~x) δxk ∂xk mit δxk ≡ x0k − xk , wobei die zweite Gleichung aus einer Taylor-Entwicklung folgt. Zur erster Ordnung kann f 0 durch f ersetzt werden. Mit δxk gegeben durch Gl. (I.10b) ergibt sich dann f 0 (~x) − f (~x) = dθjkl xl ∂f ∂ = −idθJj f (~x) mit Jj ≡ −ijlk ∂xk ∂xk (I.14) einem differentiellen Operator. Vektoriell lässt sich der letztere als das Kreuzprodukt ~ J~ = ~x × (−i ∇) (I.15) umschreiben: bis auf einen fehlenden Faktor ~ erkennt man den Ausdruck des Bahndrehimpulses in der Quantenmechanik. Der Darstellungsraum ist der Raum der Funktionen auf R3 . Da die Drehungen nur auf die Winkelkoordinaten θ und ϕ wirken, kann man Funktionen von nur diesen Winkeln betrachten. Der entsprechende Raum E ist wieder unendlicher Dimension. Die Darstellung lässt sich als eine unendliche direkte Summe irreduzibler Darstellungen, entsprechend jedem möglichen Wert von j, zerlegen:7 E = E0 ⊕ E 1 ⊕ E2 ⊕ · · · Eine Basis des Unterraums E` — dessen Dimension 2` + 1 ist — besteht aus den Kugelflächenfunktionen Y`m (θ, ϕ), die die Eigenvektoren von Jz [Gl. (I.14)] mit den Eigenwerten m = −`, −`+1, . . . , ` sind. I.1.3 d Tensoroperatoren :::::::::::::::::::::::: Bisher wurde die Transformation unter Drehungen für die Elemente des Darstellungsraums E betrachtet. In diesem Abschnitt wollen wir die Transformation der Matrixelemente von Operatoren auf E untersuchen. Hiernach werden einige Notationen der Quantenmechanik verwendet: ein Element von E wird als |ψi bezeichnet, und das unter einer Drehung R transformierte Element als |ψ 0 i = S(R)|ψi. Die konjugierten Bras lauten hψ| und hψ 0 | = hψ|S(R)−1 .10 Ein Operator Σ auf E wird skalar genannt, wenn seine Matrixelemente unverändert unter Drehungen bleiben, d.h. wenn für alle |ψ1 i, |ψ2 i in E und für jede Drehung R 0 0 ψ1 Σ ψ2 = ψ1 Σ ψ2 . (I.16a) Dies gibt sofort S(R)−1 Σ S(R) = Σ, (I.16b) d.h. Σ soll mit jedem Operator S(R) kommutieren, insbesondere mit den Generatoren Jj(E) der auf E wirkenden Drehoperatoren: Σ, Jj(E) = 0. (I.16c) 2 Ein Beispiel von skalarem Operator ist einfach J~ (E) . Im Fall einer unitären Darstellung gilt auch hψ 0 | = hψ|S(R)† ; für nicht-unitäre Darstellungen soll man aber S(R)−1 benutzen. 10 I. Spezielle Relativitätstheorie 12 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Ähnlich bilden drei Operatoren V1 , V2 , V3 einen sog. Vektoroperator , wenn die Matrixelemente sich gemäß 0 0 (I.17a) ψ1 Vi ψ2 = Rik ψ1 Vk ψ2 für alle |ψ1 i, |ψ2 i in E und für jede Drehung R transformieren, entsprechend S(R)−1 Vi S(R) = Rik Vk . (I.17b) Schreibt man diese Beziehung für die infinitesimale Drehung (I.10d) um die j-Achse mit Jj ersetzt durch Jj(E) , so findet man zur ersten Ordnung in dθ Vi , Jj(E) = i ijk Vk . (I.17c) Gleichung (I.11c) nach ist J~(E) selber ein Vektoroperator. Man definiert noch Tensoroperatoren höherer Stufe, durch die Verallgemeinerung der Beziehung (I.17a) auf mehrere Indizes. I.1.4 Spinoren Bisher wurden nur Darstellungen entsprechend ganzzahligen Werten von j diskutiert. Wenn j = 21 , dann ist der Darstellungsraum von Dimension 2j + 1 = 2. In einer geeigneten Basis lauten die Generatoren der Drehungen J~ = ~σ /2, mit σi den Pauli-Matrizen 1 0 0 −i 0 1 . (I.18) , σ3 = , σ2 = σ1 = 0 −1 i 0 1 0 Diese Matrizen genügen der Eigenschaft σi σj = δij + i ijk σk , (I.19) woraus die Vertauschungsrelationen (I.11c) für ~σ /2 sofort folgen. Eine wichtige Besonderheit der Spin- 12 -Darstellung ist, dass J1 und J3 reelle Matrizen sind. Infolgedessen können die Drehmatrizen (I.13) in dieser Darstellung auch komplexe Koeffizienten haben: man findet einfach, dass der Operator für eine Rotation um θ um die Richtung mit Einheitsvektor ~e durch11 θ θ θ S(R) = exp −i ~σ · ~e = cos 12 −i sin ~e · ~σ (I.20) 2 2 2 gegeben ist. Somit ist der Darstellungsraum ein komplexer Vektorraum, statt eines reellen Vektorrraums. Die zweikomponentigen Elemente dieses Darstellungsraums werden als Spinoren bezeichnet. Die Matrizen S(R) sind komplexe 2 × 2-Matrizen. Dank der Hermitizität der Pauli-Matrizen sind diese Matrizen unitär, vgl. Fußnote 6. Man prüft einfach nach, dass deren Determinante 1 ist. Somit handelt es sich um die Matrizen der speziellen unitären Gruppe SU(2). Gleichung (I.20) zeigt, dass die mit einer Drehung vonE 3 um 2π assoziierten Matrix tatsächlich S(R) = −12 ist. In der Tat ist SU(2) keine lineare Darstellung von SO(3), sondern nur eine sogenannte projektive Darstellung, für die S(R1 R2 ) = eiφ(R1 ,R2 ) S(R1 )S(R2 ) mit φ(R1 , R2 ) einer nicht-verschwindenden Phase gilt. Man kann zeigen, dass es einen Gruppenhomomorphismus von SU(2) nach SO(3) gibt, nicht aber von SO(3) nach SU(2). Somit ist jede lineare Darstellung von SO(3) auch eine Darstellung von SU(2), während es lineare Darstellungen von SU(2) gibt — insbesondere die Darstellung von SU(2) durch SU(2) selber —, die SO(3) nicht treu darstellen. Dies gilt, auch wenn SU(2) und SO(3) die gleiche Lie-Algebra (I.11c) haben. 11 Der Beweis der zweiten Gleichung beruht auf der Identität ~σ ·~e sich aus dem Produkt (I.19) einfach herleiten lässt. I. Spezielle Relativitätstheorie 2 = 12 für einen auf 1 normierten Vektor ~e, die 13 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik I.2 Lorentz-Transformationen Bekannterweise ist die Gruppe der Isometrien des dreidimensionalen euklidischen Raums nicht die „gute“ Symmetriegruppe für die Gesetze der Physik, insbesondere für die Maxwell-Gleichungen des Elektromagnetismus. Stattdessen soll man Transformationen in einer vierdimensionalen Raumzeit betrachten. In diesem Abschnitt werden diese Transformation eingeführt und (schnell) studiert. I.2.1 Linienelement Die Spezielle Relativitätstheorie (SRT) beruht auf zwei experimentell motivierten Postulaten und zwar SRT I. Die Lichtgeschwindigkeit im Vakuum c ist in allen Inertialsystemen gleich. SRT II. Die Gesetze der Physik sollen in allen solchen Bezugssystemen die gleiche Form annehmen (Relativitätsprinzip). Um dem ersten Postulat zu genügen, soll Zeit nicht mehr als eine absolute Größe betrachtet werden, sondern muss mit den Ortskoordinaten — die in diesem Abschnitt entweder als x, y, z oder als x1 , x2 , x3 bezeichnet werden — in einen Punkt x mit Koordinaten (x0 = ct, x1 , x2 , x3 ) der Raumzeit vereinigt werden. Lässt man Gravitation weg, so handelt es sich bei der letzteren um einen vierdimensionalen reellen Vektorraum, der als Minkowski-Raum M 4 bezeichnet wird. Die Punkte von M 4 werden auch Ereignisse genannt. Der Abstand, oder Linienelement, zwischen zwei solchen unendlich benachbarten Ereignissen (ct, x, y, z) und c(t+dt), x+dx, y+dy, z +dz ist gegeben durch ds2 = c2 dt2 − dx2 − dy 2 − dz 2 = c2 dt2 − d~x 2 . (I.21) Man kann dx0 = c dt, dx1 = dx, dx2 = dy, dx3 = dz als die Komponenten einer einspaltigen Matrix dX betrachten. Führt man dann den metrischen Tensor 2. Stufe η, mit der Matrizendarstellung 1 0 0 0 0 −1 0 0 (I.22a) η= 0 0 −1 0 , 0 0 0 −1 so lässt sich das Linienelement (I.21) als ds2 = dX T η dX (I.22b) umschreiben. Sei ηµν das Matrixelement (µ, ν) der Matrix (I.22a), mit µ, ν = 0, 1, 2, 3. Das Matrizenprodukt (I.22b) lautet noch ds2 = ηµν dxµ dxν , (I.22c) wobei die Einstein’sche Summenkonvention benutzt wurde. Bemerkungen: ∗ Die Stelle der Lorentz-Indizes µ, ν ist wichtig!Somit sollen beide Indizes des metrischen Tensors unten sein — manchmal wird η als 0-Tensor bezeichnet. Dies wird weiter in Abschn. I.3 diskutiert. 2 ∗ Je nach dem Vorzeichen des Linienelements spricht man von einem zeitartigen (ds2 > 0), lichtartigen (ds2 = 0), oder raumartigen (ds2 < 0) Intervall zwischen den zwei Ereignissen. ∗ Wenn das Intervall zwischen zwei Ereignissen zeitartig ist, dann existiert ein Inertialsystem, in dem die Ereignisse im gleichen Ort stattfinden. ds2 entspricht dem infinitesimalen Zeitintervall in diesem Bezugssystem: ds2 = c2 dτ 2 , (I.23) mit τ der Eigenzeit. I. Spezielle Relativitätstheorie 14 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik ∗ Einige Autoren benutzen, statt der hier verwendeten (+, −, −, −) Signatur für den metrischen Tensor (I.22a), die entgegengesetzte Konvention (−, +, +, +). I.2.2 Lorentz-Transformationen Sei eine lineare Transformation der Koordinaten xµ der Form xµ → x0µ = Λµ ν xν , (I.24a) X → X 0 = ΛX, (I.24b) oder äquivalent in Matrixform mit Λ der Matrix, deren Matrixelement (µ, ν) Λµ ν ist. Die Transformation Λ wird Lorentz-Transformation genannt, wenn sie das Linienelement (I.22b) invariant lässt. Somit muss für jede infinitesimale Verschiebung dX, entsprechend einer transformierten Verschiebung dX 0 , die Identität dX T η dX = dX 0 T η dX 0 gelten. Aus der Linearität der Transformation Λ folgt dX 0 = Λ dX, so dass diese Gleichung äquivalent zur Bedingung η = ΛT ηΛ (I.25a) ist. Mithilfe der Matrixelemente lautet dies12 ηµν = Λρ µ ηρσ Λσ ν . (I.25b) Bildet man die Determinante der Gl. (I.25a), so erhält man sofort det Λ = ±1. Infolgedessen bleibt das 4-Volumenelement d4 x ≡ dx0 dx1 dx2 dx3 invariant unter Lorentz-Transformationen, da es sich transformiert gemäß (I.26) d4 x → d4 x0 = det Λ d4 x. Die Lorentz-Transformationen formen eine Gruppe, die sog. Lorentz-Gruppe (oder manchmal homogene Lorentz-Gruppe), die hiernach als L bezeichnet wird.13 Die Transformationen mit Determinante +1, die eigentlichen Lorentz-Transformationen, bilden eine Teilgruppe L+ , die eigentliche Lorentz-Gruppe.13 Darüber hinaus werden die Transformationen mit Λ0 0 > 0 orthochron gennant; diese bilden auch eine Gruppe, L↑+ . Je nach den Vorzeichen der Determinante det Λ und der Komponente Λ0 0 erhält man die vier Zusammenhangskomponenten L↑+ , L↓+ , L↑− und L↓− der Lorentz-Gruppe. Bemerkungen: ∗ In der Tat bleibt das Linienelement (I.21) invariant nicht nur unter der Lorentz-Transformationen, sondern allgemeiner unter den linearen Transformationen der Poincaré-Gruppe (oder inhomogene Lorentz-Gruppe), d.h. der Form xµ → x0µ = Λµ ν xν + aµ . (I.27) Die Transformationen mit Λ = 14 und aµ beliebig sind offensichtlich die Raumzeit-Translationen. ∗ Aus Gl. (I.24a) folgt Λµ ν = ∂x0µ . ∂xν 12 ρ Λ µ ist das Element (ρ, µ) der Matrixdarstellung von Λ, und also das Element (µ, ρ) von ΛT . Manchmal findet man die Notation Λµρ anstatt Λρ µ . Jedenfalls bleibt der Zeilenindex solcher Lorentz-Transformationen oben, der Spaltenindex unten. 13 Eine alternative Bezeichnung ist O(1,3); dementsprechend wird der Minkowski-Raum auch als R1+3 bezeichnet, die eigentliche Lorentz-Gruppe als SO(1,3), und die eigentliche orthochrone Lorentz-Gruppe als SO+ (1,3). I. Spezielle Relativitätstheorie 15 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik I.2.3 Beispiele Die Isometrien des dreidimensionalen Raums E 3 mit mindestens einem Fixpunkt sind natürlich auch Lorentz-Transformationen, die eine Untergruppe der (eigentlichen orthochronen) LorentzGruppe bilden. Die Raumspiegelung ist ebenfalls eine Lorentz-Transformation, diesmal aber eine uneigentliche Transformation (det Λ = −1), mit der Matrixdarstellung 1 0 0 0 0 −1 0 0 ΛP = (I.28) 0 0 −1 0 . 0 0 0 −1 Somit gehört die Raumspiegelung zu L↑− . Allgemeiner ergeben sich die uneigentlichen orthochronen Transformationen durch Multiplikation einer eigentlichen orthochronen Transformation mit dieser Raumspiegelung. Auf ähnlicher Weise sind die Transformationen von L↓− die Produkte einer eigentlichen orthochronen Transformation mit dem Operator des Zeitumkehrs, dessen Matrixdarstellung −1 0 0 0 0 1 0 0 ΛT = (I.29) 0 0 1 0 0 0 0 1 ist. Die speziellen Lorentz-Transformationen (oder Boosts) entlang einer Richtung sind die eigentlichen orthochronen Transformationen, die die Ortskomponenten senkrecht zur Richtung unverändert bleiben. Im Beispiel eines Boosts entlang der x1 -Achse bleiben x2 und x3 invariant. Solche Transformationen sind der Form cosh φ sinh φ 0 0 sinh φ cosh φ 0 0 , Λ= (I.30) 0 0 1 0 0 0 0 1 mit φ einer reellen Zahl, der Rapidität des Boosts. Ist die durch Λ beschriebene Transformation passiv, so bewegt sich der Ursprungspunkt ~x = ~0 des alten Bezugssystems mit der Geschwindigkeit ~v = c tanh φ ~e1 im neuen Bezugssystem. Außerdem definiert man den entsprechenden Lorentz-Faktor γ als γ = (1 − |~v |2 /c2 )−1/2 = cosh φ. Die Komposition zweier speziellen Lorentz-Transformationen entlang derselben Richtung mit Rapiditäten φ1 , φ2 ergibt wieder eine spezielle Lorentz-Transformation — die Boosts entlang einer Richtung bilden eine Gruppe — mit Rapidität φ3 = φ1 + φ2 . Daraus folgt sofort das relativistische Additionstheorem für Geschwindigkeiten v3 = v1 + v2 . 1 + v1 v2 /c2 I.3 Kontra- und kovariante Indizes In diesem Abschnitt wird das Verhalten physikalischer Größen unter Lorentz-Transformationen diskutiert, ähnlich wie im Abschn. I.1.2 im Fall der Isometrien von E 3 . Dabei sollen aber zwei Arten von Indizes eingeführt werden, sog. kontravariante und kovariante Indizes, entsprechend der Tatsache, dass der metrische Tensor η keine positiv definite Bilinearform ist. I. Spezielle Relativitätstheorie 16 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik I.3.1 Skalare Ein Lorentz-Skalar ist eine Größe, die invariant unter Lorentz-Transformationen ist. Beispiele davon sind definitionsgemäß das Linienelement (I.21) oder das 4-Volumenelement d4 x, Gl. (I.26). Man definiert auch Pseudoskalare, die invariant unter der eigentlichen Lorentz-Gruppe sind, und ihr Vorzeichen unter uneigentlichen Transformationen — wie Raumspiegelung oder Zeitumkehr — ändern. I.3.2 Kontravariante Vektoren Ein sog. kontravarianter (Vierer)Vektor V ist eine Menge aus vier Größen V µ , die sich unter Lorentz-Transformationen wie die Koordinaten xµ transformieren, d.h. V µ → V 0µ = Λµ ν V ν , (I.31a) V → V0 = ΛV. (I.31b) oder in Matrixform Ein Beispiel ist die Vierergeschwindigkeit (Trajektorie in der Zeitraum) X µ (s), die als uµ uµ ≡ eines massiven Teilchens entlang seiner Weltlinie dX µ (s) dτ (I.32a) definiert ist, mit s einer Parametrisierung der Weltlinie und τ der Eigenzeit des Teilchens. Dies folgt aus der Tatsache, dass das Eigenzeitelement dτ im Zähler ein Lorentz-Skalar ist [vgl. Gl. (I.23)]. Komponentenweise gelten u0 = γc, ui = γv i für i = 1, 2, 3, mit γ dem Lorentz-Faktor und v i den Komponenten der dreidimensionalen Geschwindigkeit ~v des Teilchens. Der Kürze halber wird im Folgenden für diese Zerlegung in Zeit- und Ortskoordinaten die Notation γc µ (I.32b) u = γ~v benutzt. Der kontravariante Viererimpuls eines Teilchens der Masse m entlang dieser Weltlinie ist E/c µ µ , (I.33) p = mu = p~ mit E bzw. p~ der Energie bzw. dem Impuls des Teilchens. p~ c . E Bemerkung: Die Vierergeschwindigkeit wird für ein masseloses Teilchen, z.B. ein Photon, nicht definiert, da solche Teilchen kein Ruhesystem haben, in welchem die Eigenzeit definiert werden kann: sie bewegen sich entlang lichtartige Weltlinien. De Vergleich zwischen Gl. (I.32b) und (I.33) gibt die nützliche Beziehung ~v = I.3.3 Kovariante Vektoren Ein kovarianter (Vierer)Vektor ist defintionsgemäß eine Menge aus vier Größen, die sich unter Lorentz-Transformationen wie der Gradient-Operator ∂/∂xµ verhalten, wobei der letztere auch als ∂µ bezeichnet wird. Mithilfe der Kettenregel gilt ∂µ ≡ ∂ ∂x0ν ∂ ∂ = = Λν µ 0ν = Λν µ ∂ν0 , ∂xµ ∂xµ ∂x0ν ∂x (I.34) d.h., wenn man die einspaltige Matrix der ∂µ als ∇ schreibt, ∇ = ΛT ∇0 . Multipliziert man diese −1 Gleichung links mit ΛT , so kommt −1 ∇0 = ΛT ∇. (I.35) I. Spezielle Relativitätstheorie 17 N.BORGHINI Relativistische Quantenmechanik Nun, die Eigenschaft (I.25a), multipliziert links mit ΛT ΛT −1 −1 Elementarteilchenphysik und rechts mit η−1 , gibt14 = ηΛη−1 . (I.36) Aus den zwei letzteren Gleichungen folgt η−1 ∇0 = Λ η−1 ∇ , (I.37) d.h. η−1 ∇ transformiert sich wie ein kontravarianter Vektor. Mit jedem kontravarianten Vektor V µ kann man also einen kovarianten Vektor Vµ assoziieren gemäß Vµ = ηµν V ν . Komponentenweise gilt unter Verwendung des metrischen Tensors (I.22a) 0 V0 V V1 −V 1 = V2 −V 2 . V3 −V 3 (I.38) (I.39) Umgekehrt kann mit jedem kovarianten Vektor Vµ der kontravariante Vektor V µ = η µν Vν (I.40) assoziiert werden, mit η µν den Matrixelementen von η−1 . Bemerkungen: ∗ Der Unterschied zwischen der positiv definiten Metrik des euklidischen RaumsE 3 und der Metrik mit Signatur (+, −, −, −) des Minkowski-Raums M 4 spielt eine Rolle in Gl. (I.36), die mit Gl. (I.3) verglichen sein soll. ∗ Der Grund für die Existenz in der Relativitätstheorie von kontra- und kovarianten Vierervektoren ist einfach, dass es sich dabei um Elemente unterschiedlicher Vektorräume handelt. Somit sind die kovarianten Vektoren die Linearformen auf dem Vektorraum der kontravarianten Vektoren, d.h. die Elemente dessen Dualraums. Diese Betrachtungsweise wird z.B. in Ref. [2] (s. Kap. 3) verwendet, und lässt sich auf die Tensoren des nächsten Abschnitts einfach verallgemeinern. I.3.4 Tensoren Ein Tensor ist eine Größe mit möglicherweise kontravarianten und kovarianten Indizen, wobei jeder Index sich wie ein entsprechender Vektor transformiert. Beispielsweise transformiert sich der Tensor 3. Stufe mit Komponenten T µνρ wie V µ V ν Vρ . Ein solcher Tensor kann als zweimal kontraund einmal kovarianter Tensor, oder kürzer 2-Tensor oder gar Tensor vom Typ (2,1), bezeichnet 1 werden. Für einen zweimal kovarianten Tensor lautet das Transformationsgesetz, unter Verwendung der Gl. (I.34), 0 Tµν = Λρ µ Λσ ν Tρσ , (I.41) d.h. in Matrixform, indem Tµν durch eine 4×4-Matrix dargestellt wird, T = ΛT T0 Λ. (I.42) Der Vergleich mit Gl. (I.25a) zeigt, dass der metrische Tensor η invariant unter einer beliebigen Lorentz-Transformation bleibt. Dies erklärt im Nachhinein die Stelle der Indizes dessen Matrixelemente ηµν . 14 Gleichung (I.22a) gibt sofort η−1 = η, doch wir wollen diese Identität der Allgemeinheit halber nicht benutzen. I. Spezielle Relativitätstheorie 18 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Mithilfe der Tensoren ηµν bzw. η µν kann man kontra- bzw. kovariante Lorentz-Indizes heraufbzw. herabziehen, ähnlich den Gleichungen (I.38) und (I.40). Wendet man diese Möglichkeit an η µν selber, so erhält man η µ ν = η µρ ηρν = δ µ ν , (I.43) mit δ µ ν = 1 wenn µ = ν und 0 sonst dem üblichen Kronecker-Symbol. Dies entspricht einfach der Identität η−1 η = 14 . Ein anderer invarianter Tensor (genauer: Pseudotensor , da sein Vorzeichen sich unter uneigentlicher Transformationen ändert) ist der vollständig antisymmetrische Levi–Civita-Tensor15 µνρσ +1 falls (µ, ν, ρ, σ) eine gerade Permutation von (0,1,2,3) ist, = −1 falls (µ, ν, ρ, σ) eine ungerade Permutation von (0,1,2,3) ist, 0 sonst. (I.44) Dieser Tensor transformiert sich nämlich gemäß µνρσ → 0 µνρσ = µνρσ det Λ. (I.45) Hier sollte beachtet werden, dass 0123 = −0123 , während für den dreidimensionalen Levi–Civita Tensor 123 = 123 gilt. I.3.5 Kontraktion zweier Tensoren Seien V µ ein kontravarianter und Wµ ein kovarianter Vektor. Die Transformationsgesetze (I.31b) und (I.35) zeigen, dass Wµ V µ = WT V ein Lorentz-Skalar ist — das uneigentlich genannte „Skalarprodukt“ der zwei Vektoren. Dagegen sind W µ V µ und Wµ Vµ keine Skalare unter der Lorentz-Gruppe, und stellen somit keine „gültige“ Tensorkontraktionen dar. Dem in Abschn. I.1.2 c gegebenen Rezept, um zwei Tensoren zu kontrahieren, muss man also die zusätzliche Regel hinzufügen, dass einer der kontrahierten Indizes kontra- und der andere kovariant sein soll. Da Wµ V µ = ηµν W µ V ν = W ν Vν = W µ Vµ ist, spielt es in einer Kontraktion keine Rolle, welcher Index oben und welcher unten ist. Beispielsweise beträgt der skalare Lorentz-Quadrat des Viererimpulses (I.33) pµ pµ = m2 c2 , während für die Vierergeschwindigkeit (I.32a) gilt immer uµ uµ = 1. Wenn V und W zwei Vierervektoren mit kontravarianten Koordinaten V µ und W µ bezeichnen, wird im Folgenden die Notation V · W ≡ Vµ W µ = Wµ V µ oft verwendet. Dementsprechend wird der Lorentz-Quadrat des Viererimpulses (multipliziert mit c2 ) als p2 c2 = E 2 − p~ 2 c2 = m2 c4 geschrieben. I.3.6 Kovariante Formulierung eines physikalischen Gesetzes Laut dem Einstein’schen Relativitätsprinzip (Postulat SRT II) sollen die Naturgesetze mathematisch so formuliert werden, dass die Form der entsprechenden Gleichungen in allen Inertialsystemen unverändert bleibt. Theorien, die diesem Prinzip genügen, werden als Lorentz- oder relativistisch kovariant bezeichnet. Infolgedessen können solche Gleichungen nur Identitäten zwischen Lorentz-Tensoren der gleichen Stufe sein, nachdem alle möglichen Kontraktionen von Indizes berücksichtigt wurden. Somit sind V µ = W µ oder V µ Tµν = Wν kovariante Gleichungen: eine Lorentz-Transformation 0 = W 0 , d.h. sie nehmen die gleiche Form an. Dagegen transformiert sie in V 0 µ = W 0 µ oder V 0 µ Tµν ν µ µ µ stellen Identitäten wie V = T ν oder V = Wµ keine relativistisch kovariante Gleichungen dar, sondern können einen (Tipp-?)Fehler signalisieren. . . 15 Einige Autoren benutzen die Konvention 0123 = +1, entsprechend 0123 = −1. . . I. Spezielle Relativitätstheorie 19 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Bemerkung: Manchmal wird statt Lorentz-kovariant die Redensart „Lorentz-invariant“ verwendet. Streng genommen bedeutet aber die Letztere, dass die Gleichungen unverändert unter den Lorentz-Transformationen bleiben, was eine stärkere Bedingung ist, als die Invarianz der Form der Gleichungen. Literatur Zur Speziellen Relativitätstheorie: • Feynman, Band 1 [3], Kap. 15–17. • Fließbach, Band I [4], Kap. IX. • Landau & Lifschitz, Band II [5], Kap. I. • Nolting, Band 4 [6], 1. Teil. Zur Gruppentheorie in der (Teilchen)Physik: • Georgi [7]. • Ramond [8]. I. Spezielle Relativitätstheorie 20 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik II. Klein–Gordon-Gleichung Dieses Kapitel und die zwei darauf folgenden befassen sich mit relativistischen Wellengleichungen, für Teilchen mit dem Spin 0 (hiernach), 12 (Kap. III) oder 1 (Kap. IV). In jedem dieser Fälle lässt sich ein solcher Wellenfunktion-basierter Formalismus sinnvoll nur auf wechselwirkungsfreie (oder kurz: freie) Teilchen anwenden — in Anwesenheit von Wechselwirkungen können Teilchen im relativistischen Regime leicht erzeugt werden, oder sie können zerfallen, was mit Wellenfunktionen nicht beschrieben werden kann. Hier wird zunächst in Abschn. II.1 die freie Klein–Gordon-Gleichung eingeführt, deren Lösungen in Abschn. II.2 diskutiert werden. Die physikalische Deutung einiger dieser Lösungen führt zu Schwierigkeiten, die sich am besten im Rahmen einer quantenfeldtheoretischen Beschreibung vermeiden lassen. Somit werden in Abschn. II.3 einige Elemente der zweiten Quantisierung der Klein–Gordon-Wellenfunktion kurz dargestellt. II.1 Heuristische Herleitung Bekannterweise lautet die Schrödinger-Wellengleichung in Ortsdarstellung für ein nicht-relativistisches freies Teilchen mit der Masse m ~2 ∂ψ(t, ~x) =− 4ψ(t, ~x), (II.1) i~ ∂t 2m ~ 2 dem Laplace-Operator. Diese Gleichung folgt aus der nicht-relativistischen Energie– mit 4 = ∇ Impuls-Beziehung E = p~ 2 /2m, indem die Energie E bzw. der Impuls p~ durch den auf Wellenfunk~ ersetzt wird. tionen wirkenden Differentialoperator i~∂/∂t bzw. −i~ ∇ Wendet man jetzt — nach Schrödinger, vgl. [9], Gl. (34)–(36) — diese Korrespondenz auf die relativistische Energie–Impuls-Relation E 2 − p~ 2 c2 = m2 c4 an, so ergibt sich die Wellengleichung 2 2∂ 2 2 −~ 2 + ~ c 4 φ(t, ~x) = m2 c4 φ(t, ~x). (II.2) ∂t Diese Gleichung wird (wechselwirkungsfreie) Klein–Gordon-Gleichung genannt [10, 11]. In relativistischer Notation gilt 1 ∂2 − 4 = ∂0 ∂ 0 + ∂i ∂ i = ∂µ ∂ µ ≡ , (II.3) c2 ∂t2 mit dem d’Alembert-Operator , der offenbar relativistisch kovariant ist, denn es handelt sich um einen Lorentz-Quadrat. Dann lautet die Klein–Gordon-Gleichung (II.2) in kovarianter Schreibweise m2 c2 + 2 φ(x) = 0. (II.4) ~ Dank der relativistischen Kovarianz des d’Alembert-Operators ist das Verhalten dieser Gleichung unter einer Lorentz-Transformation x → x0 völlig durch das Verhalten der Wellenfunktion φ(x) unter der Transformation bestimmt. Falls die Letztere sich gemäß φ(x) → φ0 (x0 ) = φ(x) transformiert, stellt die Klein–Gordon-Gleichung auch eine skalare Gleichung dar. In diesem Fall ist φ(x) ein Lorentz-Skalar, entsprechend einem Teilchen mit Spin 0. Bemerkungen: ~ lässt sich kurz als ∗ Die Korrespondenz E → i~∂/∂t, p~ → −i~ ∇ pµ → i~∂ µ (II.5) umschreiben. Wird dies in pµ pµ = m2 c2 eingesetzt, so folgt Gl. (II.4) sofort. II. Klein–Gordon-Gleichung 21 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik 2 2 2 2 4 ∗ Statt von der Beziehung p E = p~ c + m c auszugehen, könnte man die Korrespondenz in die genauere Gleichung E = p~ 2 c2 + m2 c4 einsetzen, da die Energie eines Teilchens p positiv sein soll. Wendet man aber den auf der rechten Seite resultierenden Differentialoperator m2 c4 − ~2 c2 4 auf Wellenfunktionen an, so ergeben sich Ortsableitungen der Letzteren beliebiger Ordnung, entsprechend einer nicht-lokalen Gleichung, was unbefriedigend ist. ∗ Eine Lösung φ(x) der Klein–Gordon-Gleichung kann entweder reell- oder komplexwertig sein. Die Möglichkeiten werden im nächsten Abschnitt anhand der allgemeinen Lösung der Gleichung (II.4) noch diskutiert. II.2 Lösung der freien Klein–Gordon-Gleichung II.2.1 Allgemeine Lösung Da die Klein–Gordon-Gleichung eine lineare partielle Differentialgleichung ist, kann man als Lösungsansatz eine ebene Welle φ(x) = N e−ik·x annehmen, mit N einer Normierungskonstante. Mit k · x = kµ xµ = k µ xµ gibt das Einsetzen dieses Ansatzes in Gl. (II.4) m2 c2 µ −kµ k + 2 N e−ik·x = 0. ~ Dies führt zur Dispersionsrelation q k 0 = ± ~k 2 + m2 c2/~2 , d.h. für jeden Wert des Wellenvektors ~k kann die Zeitkomponente k 0 zwei mögliche Werte annehmen. Eine allgemeine Lösung der Klein–Gordon-Gleichung ist eine Linearkombination solcher ebenen Wellen, mit beliebigen Koeffizienten. Um die beiden möglichen Vorzeichen von k 0 einfacher zu berücksichtigen, bezeichnet man q ω~ ≡ +c ~k 2 + m2 c2/~2 . (II.6) k Dann lautet die allgemeine Lösung Z h i d3~k ~ ~ . φ(t, ~x) = N+ (~k) e−iω~k t+i k·~x + N− (~k) eiω~k t+i k·~x (2π)3 Die Substitution ~k → −~k im zweiten Summanden gibt Z h i d3~k ~ ~ φ(t, ~x) = . N+ (~k) e−iω~k t+i k·~x + N− (−~k) eiω~k t−i k·~x (2π)3 Ep~ p~ p0 c und ω~k → ≡ durch, so gilt einerseits ~ ~ ~ p·x ω~k t − ~k · ~x → , ~ wobei die eingeführten Größen p0 und p~ zu einem Vierervektor p kombiniert wurden. Dank Gl. (II.6) genügt der Letztere der Beziehung p2 = m2 c2 . Dazu kann man noch die Koeffizienten N+ (~k), N− (−~k) durch neue Koeffizienten ap~ , bp~ wie folgt ersetzen16 (2π~)3/2 ~c (2π~)3/2 ~c ∗ N+ (~k) → p ap~ , N− (−~k) → p bp~ . 2Ep~ 2Ep~ Führt man dann die Substitutionen ~k → 16 Die auf den ersten Blick willkürlich aussehenden Faktoren von ~, c oder Ep~ werden später in Abschn. II.3 zu einfacheren Gleichungen führen. II. Klein–Gordon-Gleichung 22 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Die allgemeine Lösung der Klein–Gordon-Gleichung (II.4) wird dann zu Z h i ~c d3 p~ φ(x) = . ap~ e−ip·x/~ + bp∗~ eip·x/~ p (2π~)3 2Ep~ (II.7) Wenn ap~ und bp~ für jeden Wert von p~ unabhängig voneinander sind, dann ist das Skalarfeld φ(x) komplexwertig, entsprechend zwei reellen Freiheitsgraden. Ein solches Feld beschreibt z.B. geladene Pionen π ± . Dagegen ist φ(x) reellwertig wenn ap~ = bp~ für jeden p~, entsprechend einem einzigen Freiheitsgrad: dies beschreibt z.B. neutrale Pionen π 0 . II.2.2 Teilchen-Interpretation der Klein–Gordon-Wellenfunktion Sucht man jetzt nach einer speziellen Lösung, die ein einziges Teilchen mit Masse m und Impuls ~q beschreibt, so trifft man auf eine Schwierigkeit. In der Tat führen die natürlichen Versuche ap~ ∝ δ (3) (~ p − ~q) oder bp~ ∝ δ (3) (~ p − ~q) jeweils zu −iE t/~+i~ q ·~ x /~ iE t/~−i~ q ·~ x/~ . Die Letztere könnte aber auch q ~ q ~ Lösungen φ(t, ~x) ∝ e oder φ(t, ~x) ∝ e ein Teilchen mit negativer Energie −Eq~ und Impuls −~q beschreiben, was unannehmbar ist: wenn Teilchen mit negativer Energie existieren, dann kann man immer die Energie des Universums durch die Erzeugung neuer Teilchen reduzieren, und das Universum wird unstabil. Dieses Problem lässt sich anders betrachten. Sei φ(x) eine Lösung der Klein–Gordon-Gleichung. Definiert man dann einen Viererstrom durch17 ! cρKG (t, ~x) i~ µ ∗ µ µ ∗ jKG (x) ≡ , (II.8) φ(x) ∂ φ(x) − φ(x)∂ φ(x) ≡ 2m ~KG (t, ~x) so findet man µ (x) = ∂µ jKG ∂ρKG (t, ~x) ~ + ∇ · ~KG (t, ~x) = 0, ∂t (II.9) Z entsprechend einer Kontinuitätsgleichung: damit prüft man einfach nach, dass Erhaltungsgröße ist. ρKG (t, ~x) d3 ~x eine Multipliziert man die Klein–Gordon-Gleichung (II.4) links mit iφ(x)∗ und subtrahiert man davon das Produkt von iφ(x) mit der komplex konjugierten Gleichung zu Gl. (II.4), so ergibt sich (die x-Abhängigkeit wird der Kürze halber nicht geschrieben) 1 ∂2 m2 c2 1 ∂2 m2 c2 ∗ 0 = iφ −4+ 2 φ − iφ 2 2 − 4 + 2 φ∗ c2 ∂t2 ~ c ∂t ~ h i 1∂ 1 ∂φ∗ ∗ 1 ∂φ ~ · −i φ∗ ∇φ ~ − φ ∇φ ~ ∗ , = i φ −φ +∇ c ∂t c ∂t c ∂t entsprechend bis auf den Faktor ~/2m der Gleichung (II.9). In Anlehnung am nicht-relativistischen Fall möchte man ρKG (t, ~x) bzw. ~KG (t, ~x) als eine Wahrscheinlichkeitsdichte bzw. eine Wahrscheinlichkeitsstromdichte interpretieren.18 Im Fall einer ebenen µ Welle φ(x) = N e∓ip·x/~ findet man aber jKG (x) = ±|N |2 pµ /m. Eine Lösung in eip·x/~ — d.h. mit negativer Energie — hat somit ρKG < 0, was für eine Wahrscheinlichkeitsdichte nicht gelten kann. Diese Lösungen mit negativer Energie — die man nicht einfach wegwerfen darf, da eip·x/~ eine ebenso gültige Lösung wie e−ip·x/~ ist — haben historisch viel Verwirrung verursacht. 17 Der Faktor ~/2m wurde eingeführt in Ähnlichkeit mit der Definition der Wahrscheinlichkeitsstromdichte i~ ~ ∗ − ψ ∗ ∇ψ ~ ~Schr. = ψ ∇ψ 2m der Schrödinger-Gleichung. µ 18 Tatsächlich sollte jKG durch ~c geteilt werden, um die passenden Einheiten für eine solche Interpretation zu erhalten. Die Einheiten der Schrödinger- und der Klein–Gordon-Wellenfunktion sind nicht die gleichen, vgl. Bemerkung am Ende des Abschn. II.3.2. II. Klein–Gordon-Gleichung 23 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Die triviale Gleichung e+iEp~ t/~ = e−iEp~ (−t)/~ deutet eine mögliche problemlose Deutung der Lösungen mit negativer Energie an, die auf Stückelberg and Feynman zurückgeht. Somit wird in dieser Feynman–Stückelberg-Interpretation ein Teilchen mit negativer Energie (e+iEp~ t/~ ) als ein Teilchen mit positiver Energie, das rückwärts in der Zeit propagiert, interpretiert. In einem zweiten Schritt wird das Letztere als ein Antiteilchen mit positiver Energie, das sich vorwärts in der Zeit bewegt, angesehen. Bildlich lässt sich die Äquivalenz zwischen Teilchen, die vorwärts in Zeit propagieren, und deren Antiteilchen, die rückwärts propagieren, so darstellen: F Teilchen t - ∼ = Antiteilchen Um die anscheinende Willkür dieser Interpretation etwa zu begründen, wird jetzt die korrekte Beschreibung von Teilchen und Antiteilchen, basierend auf Quantenfeldern, jetzt eingeführt. II.3 Zweite Quantisierung der freien Klein–Gordon-Gleichung In diesem Abschnitt wird der Übergang von einer Wellenfunktion- zu einer quantenfeldtheoretischen Beschreibung skizziert. II.3.1 Zweite Quantisierung Ersetzt man in die Lösung (II.7) der Klein–Gordon-Gleichung die klassischen Zahlen ap~ , bp~ ∈ C durch Operatoren âp~ , b̂p~ eines noch unspezifizierten Hilbert-Raums mit den einfachen Vertauschungsrelationen âp~ , â†q~ = δ (3) (~ p − ~q), b̂p~ , b̂†q~ = δ (3) (~ p − ~q) (II.10a) sowie âp~ , âq~ = b̂p~ , b̂q~ = âp~ , b̂q~ = âp~ , b̂†q~ = · · · = 0, so wird die Wellenfunktion φ(x) zu einem Feldoperator Z ~c d3 p~ âp~ e−ip·x/~ + b̂p†~ eip·x/~ p φ̂(x) = . (2π~)3 2Ep~ (II.10b) (II.11a) Dieses Ersetzen von kommutierenden Zahlen mit nicht-kommutierenden Operatoren wird als zweite Quantisierung bezeichnet. Die Kommutatoren (II.10) ähneln stark den Vertauschungsrelationen der bei der Quantisierung des harmonischen Oszillators eingeführten Leiteroperatoren â und ↠. Somit werden jetzt die âp~ und b̂p~ bzw. die âp†~ und b̂p†~ als Vernichtungs- bzw. Erzeugungsoperatoren bezeichnet. Der zu φ̂(x) hermitesch konjungierte Operator lautet Z ~c d3 p~ φ̂(x)† = âp†~ eip·x/~ + b̂p~ e−ip·x/~ p . (2π~)3 2Ep~ Definiert man einen zum Feldoperator φ̂(x) kanonisch konjugierten Operator durch Z E d3 p~ 1 i † ip·x/~ p ~ † π̂(x) ≡ ∂0 φ̂(x) = âp~ e − b̂p~ e−ip·x/~ p , c c (2π~)3 2Ep~ so führen die verschiedenen Vertauschungsrelationen (II.10) zum Kommutator φ̂(t, ~x), π̂(t, ~y ) = i~ δ (3) (~x − ~y ). (II.11b) (II.12) (II.13) Hier sollen die Felder zur gleichen Zeit betrachtet werden. Diese Relation ist ähnlich dem kanonischen Kommutator [x̂, p̂x ] = i~ der Quantenmechanik. II. Klein–Gordon-Gleichung 24 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Beweis der Relation (II.13): Das Einsetzen der Ausdrücke (II.11a) und (II.12), geschrieben mit der Integrationsvariable ~q in den Kommutator gibt Z d3 p~ E d3 ~q pq~ φ̂(x), π̂(y) = i~ , âp~ , âq†~ e−i(p·x−q·y)/~ − b̂p†~ , b̂q~ ei(p·x−q·y)/~ (2π~)3 2Ep~ 2Eq~ wobei die verschwindenden Kommutatoren âp~ , b̂q~ und b̂p†~ , âq†~ schon nicht geschrieben wurden. Mithilfe der Relationen (II.10a) wird die Integration nach ~q trivial Zh i d3 p~ E d3 ~q pq~ , φ̂(x), π̂(y) = i~ δ (3) p~ − ~q e−i(p·x−q·y)/~ + δ (3) p~ − ~q ei(p·x−q·y)/~ (2π~)3 2Ep~ 2Eq~ Zh i d3 p~ 0 0 0 0 . = i~ ei[Ep~ (y −x )−~p·(~y−~x)]/~ + ei[Ep~ (x −y )−~p·(~x−~y)]/~ 2(2π~)3 Macht man dann x0 = y 0 = ct, so ergibt sich das gesuchte Ergebnis. II.3.2 Physikalische Deutung Um die physikalische Deutung der oben eingeführten Operatoren âp~ , âp†~ , b̂p~ und b̂p†~ besser zu erkennen, werden jetzt zwei „üblichen“ Operatoren durch diese Leiteroperatoren ausgedrückt. Man kann zeigen, dass der Hamilton-Operator für das Skalarfeld genügend der Klein–GordonGleichung durch Z m2 c2 † † † ~ ~ (II.14) Ĥ = π̂(x) π̂(x) + ∇φ̂(x) · ∇φ̂(x) + 2 φ̂(x) φ̂(x) d3 ~x ~ gegeben ist. Skizzenhaft ist die Klein–Gordon-Gleichung (II.4) die Bewegungsgleichung, die sich aus der Lagrange-Dichte m2 c2 L̂KG φ̂(x), ∂ µ φ̂(x) = ∂µ φ̂(x)† ∂ µ φ̂(x) − 2 φ̂(x)† φ̂(x) ~ unter Nutzung der Euler–Lagrange-Gleichung, entsprechend der Extremierung der Wirkung, herleiten lässt. Führt man eine Legendre-Transformation dieser Dichte bezüglich ∂0 φ̂(x) durch, so erhält man die Hamilton-Dichte, die den Integranden in Gl. (II.14) darstellt. Setzt man den Ausdruck (II.11a) des Klein–Gordon-Feldes in diesen Hamilton-Operator ein, so findet man Z Z h i 1 1 † Ĥ = âp~ âp~ + âp~ âp†~ + b̂p†~ b̂p~ + b̂p~ b̂p†~ Ep~ d3 p~ = âp†~ âp~ + b̂p†~ b̂p~ + δ (3) (~0) Ep~ d3 p~, (II.15) 2 2 wobei die zweite Gleichung aus den Vertauschungsrelationen (II.10a) folgt. Bei den hermiteschen (a) (b) Operatoren N̂p~ ≡ âp†~ âp~ und N̂p~ ≡ b̂p†~ b̂p~ im rechten Glied erkennt man in Ähnlichkeit mit dem harmonischen Oszillator die Besetzungszahloperatoren für jeden Typ von Teilchen (a und b) mit einem gegebenen Impuls. Dazu stellt der Term δ (3) (~0) die unphysikalische Vakuumenergie dar, die schon bei der Quantisierung des einfachen harmonischen Oszillator auftritt. Wichtig ist, dass beide Teilchenarten positiv zur Gesamtenergie beitragen, auch wenn in der Wellenfunktion-Beschreibung die Wellen des Typs b eine „negative Energie“ hatten. Die Herleitung des Ausdrucks (II.15) ist ähnlich den Beweisen des Kommutators (II.13) oben oder der Beziehung (II.17) unten und wird der Leserin überlassen. Bemerkung: Der Ausdruck (II.14) des liefert die hier adoptierte Dimension Hamilton-Operators des Klein–Gordon-Feldes, und zwar φ̂ = M 1/2 L1/2 T −1 . In einem System natürlicher Einheiten hat φ̂ die Dimension Dazu geben die Kommutatoren (II.10a) die Dimension der einer Energie. −1 −3/2 Leiteroperatoren, â = b̂ = (M LT ) . II. Klein–Gordon-Gleichung 25 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Um zwischen den beiden Teilchenarten unterscheiden zu können, kann man den Operator Z i i h φ̂(x)† ∂0 φ̂(x) − φ̂(x)∂0 φ̂(x)† d3 ~x (II.16) N̂ ≡ ~c betrachten. Der Vergleich dieser Definition mit der Zeitkomponente des Viererstroms (II.8) weist auf die Erhaltung der entsprechenden physikalischen Größe hin. Mit den Ausdrücken von φ̂(x) und φ̂(x)† in Abhängigkeit der Erzeugungs- und Vernichtungsoperatoren und unter Verwendung der Vertauschungsrelationen der Letzteren ergibt sich Z Z h i 1 † 1 † † † 3 N̂ = âp~ âp~ + âp~ âp~ − b̂p~ b̂p~ + b̂p~ b̂p~ d p~ = âp†~ âp~ − b̂p†~ b̂p~ d3 p~. (II.17) 2 2 Gleichungen (II.11) und (II.12), mit φ̂(x)† und ∂0 φ̂(x)† bzw. φ̂(x) und ∂0 φ̂(x) geschrieben als Integrale über p~ bzw. ~q, führen zu Z Eq~ 1/2 N̂ = â†p~ eip·x/~ + b̂p~ e−ip·x/~ âq~ e−iq·x/~ − b̂q†~ eiq·x/~ Ep~ Ep~ 1/2 d3 p~ d3 ~q 3 † ip·x/~ † iq·x/~ −iq·x/~ −ip·x/~ d ~x. + âq~ e âp~ e + b̂q~ e − b̂p~ e Eq~ 2(2π~)3 Multipliziert man die Produkte aus, so ergeben sich Terme der Art â†p~ âq~ ei(p−q)·x/~ , mit entweder ±i(p−q)·x/~ oder ±i(p+q)·x/~ im Exponent. Durch die Integration über d3 ~x werden diese Ex3 (3) ponentialfunktionen durch entsprechende Terme (2π~)3 δ (3) (~ p − ~q) oder (~ p + ~q) ersetzt. p (2π~) δ p 3 Integriert man als nächstes über d ~q, so werden die zwei Faktoren Eq~ /Ep~ und Ep~ /Eq~ gleich 1. Dann tauchen alle Produkte von â und b̂ Operatoren bzw. von ihren adjungierten Operator als Kommutatoren auf, die dank Gl. (II.10b) verschwinden. Die restlichen Terme entsprechen gerade dem zweiten Glied in Gl. (II.17). Auf Gl. (II.17) erkennt man wieder die Besetzungszahloperatoren für jede Teilchenart, doch jetzt tragen sie mit entgegengesetzten Vorzeichen zu N̂ bei. Dies lässt sich einfach interpretieren, indem man sich vorstellt, dass die zugehörige Erhaltungsgröße irgendeiner erhaltene „Ladung“ entspricht, wobei die Teilchen des Typs a eine positive Ladung und die Teilchen des Typs b eine negative, entgegengesetzte Ladung tragen. Beide Teilchenarten besitzen also die gleiche Masse m — sie genügen derselben Klein–GordonGleichung —, doch ihre Ladungen sind entgegengesetzt: bei dem Typ b handelt es sich definitionsgemäß um die Antiteilchen zum Typ a. Somit lässt die Feynman–Stückelberg-Interpretation der Quanten des Typs b als Antiteilchen mit positiver Energie einfach als natürliche Folgerung des Formalismus wiederentdecken. Die Wirkungen der unterschiedlichen Leiteroperatoren lassen sich wie folgt zusammenfassen: • âp~ vernichtet ein Teilchen mit Impuls p~, das also im Anfangszustand eines Streuprozesses vorhanden sein muss. Somit steht dieser Vernichter für ein einlaufendes Teilchen. • âp†~ erzeugt ein Teilchen mit Impuls p~, das sich also im Endzustand eines Stoßes befinden wird: dieser Erzeugungsoperator repräsentiert ein auslaufendes Teilchen. • b̂p~ vernichtet ein einlaufendes Antiteilchen mit Impuls p~. • b̂p†~ erzeugt ein auslaufendes Antiteilchen mit Impuls p~. Wenn das Feldoperator φ̂(x) hermitesch ist, so dass die entsprechende Wellenfunktion φ(x) = hφ̂(x)i reelle Werte annimmt, dann gilt âp~ = b̂p~ für jeden p~: das Teilchen ist sein eigenes Antiteilchen. Dieser Fall wird länger in Abschn. IV.2 diskutiert. Bemerkung: Die Erzeugungs- und Vernichtungsoperatoren âp†~ , âp~ , b̂p†~ und b̂p~ — und somit das Feldoperator φ̂(x), dessen hermitesch Konjugierte und deren Ableitungen — sind Operatoren auf II. Klein–Gordon-Gleichung 26 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik einem (bosonischen) Fock-Raum, der den geeigneten Hilbert-Raum für Viel-Teilchen-Systeme darstellt. Ein besonderer Zustand dieses Raums ist der Vakuumzustand |0i, der so definiert ist, dass âp~ |0i = b̂p~ |0i = 0 für jeden p~ gilt. Literatur • Landau & Lifschitz, Band IV [12], Kap. II § 10–12. • Nachtmann [13], Kap. 3.2. • Schwabl [1], Kap. 5.1–5.2. II. Klein–Gordon-Gleichung 27 N.BORGHINI Elementarteilchenphysik Relativistische Quantenmechanik III. Dirac-Gleichung Historisch wurde die Existenz der Lösungen der Klein–Gordon-Gleichung mit negativer Energie als einen Beweis der Irrelevanz der Gleichung für Physik angesehen, bevor die Stückelberg–FeynmanInterpretation und die zweite Quantisierung eingeführt wurden. Da diese damals unerwünschten Lösungen daraus folgen, dass die Klein–Gordon-Gleichung (II.4) zweiter Ordnung in der Zeit t ist, wurde nach einer relativistischen Wellengleichung gesucht. Eine solche Gleichung wurde durch P. A. M. Dirac gefunden [14] und wird in Abschn. III.1 für den Fall eines freies Teilchen hergeleitet. Diese Gleichung nutzt Matrizen, deren Eigenschaften in Abschn. III.2 dargestellt sind. Schließlich befasst sich Abschn. III.3 mit den Lösungen der Gleichung sowie mit deren physikalischen Deutung. III.1 Heuristische Herleitung Die ursprüngliche Idee von Dirac bestand darin, die linke Seite der quadratischen relativistischen Energie–Impuls-Beziehung p2 − m2 c2 = 0 als Produkt von zwei linearen Beiträgen zu faktorisieren pµ pµ − m2 c2 ≡ (γ ν pν + mc)(β λ pλ − mc) wobei β λ , γ ν acht zu bestimmenden Koeffizienten sind. Dann gewährleistet das Verschwinden eines der Multiplikanden des rechten Glieds, dass die Beziehung erfüllt wird. Berechnet man das Produkt auf der rechten Seite, so ergibt sich durch Gleichsetzung der quadratischen und linearen Terme in p η µν pµ pν = β λ γ ν pλ pν und mc(β λ − γ λ )pλ = 0. Die zweite Gleichung liefert β λ = γ λ für λ = 0, . . . , 3. Ersetzt man dann β λ in der ersten Gleichung, so lautet die Letztere (hier wird die Einstein’sche Summenkonvention ausnahmsweise nicht verwendet!) 3 3 3 X X X (γ µ )2 (pµ )2 + (γ µ γ ν + γ ν γ µ )pµ pν = η µµ (pµ )2 . µ=0 µ,ν=0 µ6=ν µ=0 Der Vergleich der Koeffizienten der Bilinearformen in p0 , p1 , p2 , p3 auf den beiden Seiten dieser Gleichung führt zu (γ 0 )2 = +1, (γ 1 )2 = −1, (γ 2 )2 = −1, (γ 3 )2 = −1, γ µ γ ν + γ ν γ µ = 0 für µ 6= ν. (III.1) Mit Zahlen können diese Beziehungen nicht erfüllt werden — die Wahlen γ 0 = ±1, γ k = ±i genügen ja den vier ersten Relationen, nicht aber der letzten. Um mögliche Lösungen des Systems (III.1) zu finden, soll man somit nicht nach Zahlen, sondern nach N ×N -Matrizen suchen. Mittels des Antikommutators zweier Matrizen {A, B} ≡ AB − BA lassen sich die Beziehungen als µ ν γ , γ = 2η µν 1N (III.2) umschreiben, mit 1N der N×N -Identitätsmatrix und η µν den Komponenten des inversen metrischen Tensors. Die Matrizen kleinster Dimension, die den Beziehungen (III.2) genügen, sind 4×4-Matrizen. Der Fall N = 1 entspricht Zahlen und wurde schon diskutiert. Für N = 2 existieren ja drei linear unabhängige 2 × 2-Matrizen, die Pauli-Matrizen σk , die tatsächlich miteinander antikommutieren: {σj , σk } = 2δjk . Die einzigen noch bleibenden linear unabhängigen Matrizen sind proportional zur Identität 12 , die aber nicht mit den Pauli-Matrizen anitkommutiert: {12 , σk } = 2σk , so dass Beziehung (III.2) nicht erfüllt werden kann. III. Dirac-Gleichung 28 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Für N = 3 führt die Gleichung γ µ γ ν = −γ ν γ µ für µ 6= ν zu (det γ µ )(det γ ν ) = −(det γ µ )(det γ ν ), d.h. eine der Determinanten muss gleich 0 sein, was vermeidet sein soll, damit das Produkt einer γ µ -Matrix mit einem nicht-verschwindenden D-komponentigen Vektor nicht Null ist. Eine mögliche Wahl, gennant Standard- oder Dirac-Darstellung, besteht aus den Matrizen 12 0 0 σk 0 k γ = , γ = , (III.3) 0 −12 −σk 0 mit σk für k = 1, 2, 3 den üblichen Pauli-Matrizen 0 1 0 −i σ1 = , σ2 = , 1 0 i 0 1 0 σ3 = . 0 −1 (III.4) Die Matrizen γ µ werden als Dirac-Gamma-Matrizen oder kurz Dirac-Matrizen bezeichnet. Zusammen bilden die vier Dirac-Matrizen γ µ eine Größe, die sich unter der Lorentz-Gruppe wie ein kontravarianter Vektor — dessen Komponenten 4×4-Matrizen sind — transformieren. Dementsprechend stellen die Beziehungen (III.2) die Komponenten einer Gleichung zwischen zwei LorentzTensoren zweiter Stufe dar, wobei eine Komponente schon eine 4×4-Matrix ist. Sei aµ ein aus vier Zahlen bestehender kovarianter Vektor. Dann bezeichnet das „Skalarprodukt“ aµ γ µ eine Lorentz-invariante 4 × 4-Matrix. Diese lässt sich auch kompakt in der durch Feynman eingeführten Slash-Notation als 6 a ≡ aµ γ µ . (III.5) Die relativistische Energie–Impuls-Beziehung pµ pµ − m2 c2 = 0 für ein Teilchen der Masse m kann jetzt erfüllt werden, indem wir das Teilchen durch eine Größe ψ(x) beschreiben, auf das die Wirkung der Matrix γ µ pµ − mc14 Null gibt: (γ µ pµ − mc14 )ψ(x) = 0, wobei wir im Folgenden die 4-dimensionale Identität 14 weglassen können. Unter Verwendung der Korrespondenz (II.5) zur Ortsdarstellung ergibt sich dann die Dirac-Gleichung (in Ortsdarstellung) mc µ iγ ∂µ − ψ(x) = 0. (III.6a) ~ Unter Verwendung der Slash-Notation lautet dies auch mc i6 ∂ − ψ(x) = 0. ~ (III.6b) Da die Dirac-Matrizen der Dimension 4 sind, ist ψ(x) ein vierkomponentiger Spaltenvektor, der auch Dirac-Spinor oder 4-Spinor genannt wird. Unter Lorentz-Transformationen transformiert sich der Letztere aber nicht wie ein Vierervektor — seine Komponenten sollten deshalb nicht mit einem Lorentz-Index µ = 0, 1, 2, 3 bezeichnet werden. Die Anwesenheit der Pauli-Matrizen in den Dirac-Matrizen deutet darauf hin, dass die DiracSpinoren freie Teilchen mit dem Spin 12 beschreiben. Solche Teilchen besitzen aber nur zwei Freiheitsgrade, während ein Dirac-Spinor vier Freiheitsgrade hat. Tatsächlich werden wir im Folgenden sehen, dass ein Dirac-Spinor ein Spin- 21 -Teilchen und sein Antiteilchen auf einmal beschreiben. Bemerkungen: ∗ Mittels des metrischen Tensors definiert man auch Matrizen γµ . ∗ Andere Darstellungen der Dirac-Matrizen sind auch möglich, und lassen sich durch Basistransformationen im vierdimensionalen Vektorraum, auf welchen die γ µ -Matrizen wirken, erhalten. Zum Beispiel ist es manchmal bequemer, mit der folgenden sog. chiralen Darstellung zu arbeiten 0 12 0 σk 0 k γ = , γ = . (III.7) 12 0 −σk 0 III. Dirac-Gleichung 29 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik III.2 „Diracologie“ In diesem Abschnitt werden einige Eigenschaften der Gamma-Matrizen dargestellt, sowie einige Definitionen eingeführt. III.2.1 Eigenschaften der Dirac-Matrizen Hiernach werden einige Eigenschaften der Dirac-Matrizen gelistet, die sich in einer gegebenen Darstellung einfach nachprüfen lassen. III.2.1 a Spuren von Dirac-Matrizen und deren Produkte ::::::::::::::::::::::::::::::::::::::::::::::::::::::: Die Dirac-Matrizen sind spurlos Tr γ µ = 0 für µ = 0, 1, 2, 3. (III.8) Die Grundrelation (III.2) gibt (γ µ )2 = η µµ 14 für jeden möglichen µ. Sei jetzt ν ∈ {0, 1, 2, 3} und µ 6= ν. Dann führt γ ν = γ ν (γ µ )2 /η µµ zu 1 1 1 Tr γ ν = µµ Tr γ ν (γ µ )2 = − µµ Tr γ µ γ ν γ µ = − µµ Tr (γ µ )2 γ ν = −Tr γ ν , η η η wobei die zweite Gleichung aus der Antikommutationsrelation (III.2) folgt, und die dritte aus der Zyklizität der Spur. Die Spur des Produkts zweier Dirac-Matrizen folgt sofort aus dem Antikommutator (III.2) Tr γ µ γ ν ) = 4η µν . (III.9) Das Produkt von drei Dirac-Matrizen, oder allgemeiner von einer ungeraden Zahl von DiracMatrizen ist spurlos Tr γ µ γ ν γ ρ ) = 0. (III.10) Der Beweis nutzt die unter eingeführte γ5 -Matrix und deren Eigenschaften (γ5 )2 = 14 und {γ µ , γ5 } = 0 für jeden µ. Dann wird wie im Beweis der Eigenschaft (III.8) (γ5 )2 in die Spur eingeführt: eine der γ5 wird mit den anderen Matrizen des Produkts dreimal (oder mehr, im Fall des Produkts 5 oder mehr Matrizen) antikommutiert, und die Zyklizität der Spur gibt letztendlich Tr γ µ γ ν γ ρ ) = −Tr γ µ γ ν γ ρ ). III.2.1 b Verhalten unter hermitescher Konjugation :::::::::::::::::::::::::::::::::::::::::::::::::: Auf Gl. (III.3) sieht man sofort, dass γ 0 in der Standard-Darstellung reell symmetrisch und somit hermitesch ist, (γ 0 )† = γ 0 . Dagegen sind γ 1 und γ 3 in dieser Darstellung reell antisymmetrisch und deshalb antihermitesch, (γ 1 )† = −γ 1 und (γ 3 )† = −γ 3 . Schließlich ist die Dirac-Darstellung von γ 2 komplex symmetrisch, also ebenfalls antihermitesch, (γ 2 )† = −γ 2 . Dank der allgemein geltenden Relation (III.2) lassen sich diese Eigenschaften der GammaMatrizen in der Dirac-Darstellung als (γ µ )† = γ 0 γ µ γ 0 (III.11) zusammenfassen. Die Beziehungen (III.11) lassen sich auch in der chiralen Darstellung (III.7) der Dirac-Matrizen einfach prüfen. Diese Relationen (III.11) folgen allgemeiner aus der nötigen Hermitizität des auf Dirac-Spinoren wirkenden Hamilton-Operators H = α ~ ·~ p c+βmc2 14 , wobei αk = (γ 0 )−1 γ k = γ 0 γ k für k = 1, 2, 3 und β = (γ 0 )−1 = γ 0 . Aus Gl. (III.11) folgt die Unitarität der Dirac-Matrizen (γ µ )† γ µ = 14 III. Dirac-Gleichung für µ = 0, 1, 2, 3. (III.12) 30 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik III.2.2 Chiralitätsoperator Mit den Dirac-Matrizen definiert man den (auf Dirac-Spinoren wirkenden) Chiralitätsoperator γ5 ≡ γ 5 ≡ iγ 0 γ 1 γ 2 γ 3 . (III.13) In der Dirac-Darstellung findet man sofort γ5 = 0 12 , 12 0 (III.14) während in der chiralen Darstellung γ5 diagonal ist: −12 0 γ5 = . 0 12 (III.15) Aus der Definition (III.13) und der Relation (III.2) folgen sofort die Eigenschaften (γ5 )2 = 14 , (III.16a) so dass die einzigen möglichen Eigenwerte von γ5 nur +1 und −1 sein können, und µ γ , γ5 = 0 für µ = 0, 1, 2, 3. (III.16b) Dazu ist γ5 spurlos Tr γ5 = 0. (III.16c) Mithilfe von (γ 0 )2 = 14 , der Vertauschungsrelation γ 0, γ5 = 0 und der Zyklizität der Spur 0 0 2 0 erhält man Tr γ5 = Tr (γ ) γ5 = −Tr γ γ5 γ = −Tr γ 5 (γ 0 )2 = −Tr γ5 . Schließlich führt Gl. (III.11) zur Hermitizität von γ5 γ5† = γ5 . (III.16d) Bemerkung: Eine nützliche alternative Formel für γ5 ist i (III.17) γ5 = − µνρσ γ µ γ ν γ ρ γ σ , 4! mit µνρσ dem Levi–Civita-Tensor (I.45) mit der Konvention 0123 = −1. Dieser Ausdruck zeigt, dass γ5 sich unter Lorentz-Transformation wie ein Pseudoskalar transformiert, da µνρσ ein Pseudotensor ist. III.2.3 Dirac-adjungierter Spinor Sei ψ ein Dirac-Spinor, mit a b ψ= c . d Der dazu hermitesch-konjugierte Spinor ψ † wird definiert als ψ † = a∗ b∗ c∗ d∗ . Nützlicher als ψ † ist aber der Dirac-adjungierte Spinor ψ̄, definiert als ψ̄ ≡ ψ † γ 0 . (III.18) Man kann zeigen, dass ψ̄ sich unter Lorentz-Transformationen einfacher als ψ † transformiert. Mithilfe der Beziehung (III.11) findet man, dass wenn ψ(x) der Dirac-Gleichung (III.6a) erfüllt, dann genügt ψ̄(x) die Gleichung ← mc µ ψ̄(x) iγ ∂ µ + = 0, (III.19) ~ wobei der Pfeil nach links bedeutet, dass die Ableitungen hier nach links wirken. III. Dirac-Gleichung 31 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik III.3 Lösung der freien Dirac-Gleichung Dieser Abschnitt geht auf die Lösungen der Gleichung (III.6) und einige deren Eigenschaften ein, beginnend mit ebenen Wellen (Abschn. III.3.1). Dann wird die zweite Quantisierung dieser Lösungen in Abschn. III.3.2 kurz dargestellt. Schließlich befasst sich Abschn. III.3.3 mit zwei Größen, die eine Lösung charakterisieren. III.3.1 Wellenlösungen Da die Dirac-Gleichung eine lineare Differentialgleichung erster Ordnung ist, sucht man nach Lösungen in Form von ebenen Wellen. Sei also ψ(x) ∝ u(~ p) e−ip·x/~ , (III.20) wobei der Dirac-Spinor u(~ p) ortsunabhängig ist. Dieser spielt die gleiche Rolle, wie der Polarisationsvektor bei den Lösungen der Maxwell-Gleichungen [vgl. Abschn. IV.2]. Setzt man diesen Ansatz in die Dirac-Gleichung (III.6a) ein, so kommt dank der Beziehung i∂µ e−ip·x/~ = pµ e−ip·x/~ /~ die Gleichung γ µ pµ − mc u(~ p) = 6 p − mc u(~ p) = 0. (III.21a) Diese Gleichung bedeutet, dass u(~ p) Eigenvektor der Matrix 6 p mit dem Eigenwert mc ist. In der Standard-Darstellung lautet die Gleichung ! ! ! (p0 − mc)12 −~ p · ~σ uA (~ p) 0 = , (III.21b) p~ · ~σ (−p0 − mc)12 uB (~ p) 0 mit uA (~ p) und uB (~ p) einspaltigen zweikomponentigen Vektoren, während p~ · ~σ ≡ pj σj mit σj den Pauli-Matrizen. Diese Matrixgleichung gibt sofort ! ! (p0 − mc)uA (~ p) − p~ · ~σ uB (~ p) 0 = , p~ · ~σ uA (~ p) − (p0 + mc)uB (~ p) 0 d.h. uA (~ p) = p0 1 p~ · ~σ uB (~ p), − mc uB (~ p) = p0 1 p~ · ~σ uA (~ p). + mc Setzt man die zweite Gleichung in die erste ein, so ergibt sich uA (~ p) = (p0 )2 2 1 1 p~ · ~σ uA (~ p) = 0 2 pi σi pj σj uA (~ p). 2 2 −m c (p ) − m2 c2 Unter Verwendung der Beziehung σi σj = δij 12 + i ijk σk findet man pi σi pj σj = p~ 2 12 , so dass die letztere Gleichung auch als p~ 2 uA (~ p) = 0 2 uA (~ p) (p ) − m2 c2 geschrieben werden kann. Daraus folgt, dass die Komponenten des Vierervektors p im Lösungsansatz (III.20) die Relation p~ 2 = (p0 )2 − m2 c2 erfüllen sollen, d.h. p p0 c = ± p~ 2 c2 + m2 c4 = ±Ep~ . (III.22) Somit hat die Dirac-Gleichung (III.6a), ähnlich wie die Klein–Gordon-Gleichung (II.4), zwei Arten von Lösungen, mit „positiver Energie“ (p0 > 0) sowie mit „negativer Energie“ (p0 < 0). Beide Wellenarten sind durch Viererimpulse p charakterisiert, die der relativistischen Energie–ImpulsBeziehung (p0 )2 = p~ 2 + m2 c2 genügen. III. Dirac-Gleichung 32 N.BORGHINI Elementarteilchenphysik Relativistische Quantenmechanik Bemerkungen: ∗ Alternativ kann man ausgehend von der Matrixgleichung (III.21) sagen, dass diese nur dann nicht-triviale Lösungen hat, wenn die Determinante der Matrix 6 p − mc14 verschwindet, was sofort zur Bedingung (III.22) führt. ∗ Natürlich ist es ziemlich bedeutsam, dass die Lösungen mit negativer Energie wieder vorkommen, obwohl eines der Ziele Diracs bei der Suche nach einer relativistischen Wellengleichung von erster Ordnung in der Zeit war, solche Lösungen zu vermeiden. III.3.1 a Lösungen positiver oder negativer Energie ::::::::::::::::::::::::::::::::::::::::::::::::: Multipliziert man die Gl. (III.21a) links mit γ 0 , so ergibt sich unter Berücksichtigung der Relationen (III.2) (p0 − pk γ 0 γ k − mcγ 0 )u(~ p) = 0, d.h. mcγ 0 − pk γ 0 γ k u(~ p) = p0 u(~ p). Diese Gleichung stellt für jeden p~ eine Eigenwert-Gleichung für die Matrix mcγ 0 − pk γ 0 γ k dar. Nach Gl. (III.22) sind die möglichen Eigenwerte entweder p0 = +Ep~ /c oder p0 = −Ep~ /c. Da die Matrix mcγ 0 − pk γ 0 γ k spurlos ist, soll jeder Eigenwert zweimal vorkommen. Zunächst werden die Lösungen mit „positiver Energie“ p0 > 0 betrachtet und als u(~ p) e−ip·x/~ geschrieben, mit u(~ p) einer Lösung von Gl. (III.21a). Dank der Beziehung 6 p − mc 14 6 p + mc 14 = p2 − m2 c2 14 kann man für den Dirac-Spinor u(~ p) die Form u(~ p) = N+ (~ p) 6 p + mc u0 annehmen, mit N+ (~ p) ∈ R einer (~ p-abhängigen, vgl. unten) Normierungskonstante und u0 einem p~-unabhängigen Dirac-Spinor. Die zwei unabhängigen „Spinzustände“, entsprechend der oben diskutierten zweifachen Entartung des Eigenwerts p0 = +Ep~ /c, werden als ! ξ± u0 = 0 gewählt, mit ξ± definiert durch ξ+ ≡ 1 0 ! , ξ− ≡ 0 ! 1 . (III.23) Mithilfe der Bezeichnung σ ≡ ± lautet die Lösung mit Impuls p~ und „positiver Energie“ p0 > 0 ! ξσ u(~ p, σ) = N+ (~ p) 6 p + mc . (III.24) 0 In der Standard-Darstellung der Dirac-Matrizen lautet diese Lösung ! Ep~ /c + mc ξσ u(~ p, σ) = N+ (~ p) . p~ · ~σ ξσ (III.25) Sei v(~ p) e+ip·x/~ eine Lösung „negativer Energie“, wobei jetzt p0 = +Ep~ /c (dank einer Umbenenµ nung p → −pµ , vgl. Absch. II.2.1). Man zeigt einfach, dass v(~ p) eine Lösung der Gleichung γ µ pµ + mc v(~ p) = 6 p + mc v(~ p) = 0. (III.26) sein soll. Als Lösungsansatz kann man die Form v(~ p) = N− (~ p) 6 p − mc v0 annehmen, mit N− (~ p) bzw. v0 einer Normierungskonstante bzw. einem Dirac-Spinor. Für den LetzIII. Dirac-Gleichung 33 N.BORGHINI Elementarteilchenphysik Relativistische Quantenmechanik teren sind zwei mögliche unabhängige Wahlen 0 v0 = ξ∓ ! , wobei ξ+ und ξ− durch Gl. (III.23) gegeben sind. Somit gilt schließlich für die Lösungen mit Impuls p~ und „negativer Energie“ ! 0 v(~ p, σ) = N− (~ p) 6 p − mc . (III.27) ξ−σ In der Standard-Darstellung der Dirac-Matrizen lautet dies ! p~ · ~σ ξ−σ . v(~ p, σ) = −N− (~ p) Ep~ /c + mc ξ−σ (III.28) III.3.1 b Lösungen mit p~ = ~0 :::::::::::::::::::::::::::: Für die Lösungen mit p~ = ~0 geben Gl. (III.24) und (III.27) unter Verwendung von 6 p = γ 0 p0 und p0 = p0 = mc jeweils ! ! ! (p0 +mc)12 0 ξσ ξσ u(~0, σ) = N+ (~0) = 2mcN+ (~0) , 0 0 0 (−p0 +mc)12 und v(~0, σ) = N− (~0) (p0 −mc)12 0 0 (−p0 −mc)12 ! 0 ! ξ−σ = −2mcN− (~0) 0 ξ−σ ! . Diese Ergebnisse erklären im Nachhinein die Stelle von ξσ in den Dirac-Spinoren u(~ p, σ) (oben) und v(~ p, σ) (unten). III.3.1 c Normierung der Lösungen :::::::::::::::::::::::::::::::::: Bisher wurden die Normierungskonstanten N+ (~ p) und N− (~ p) in den Lösungen (III.24), (III.27) nicht spezifiziert. Eine im Folgende nützliche Wahl für diese Konstanten ist 1 , N+ (~ p) = p Ep~ /c + mc −1 N− (~ p) = p . Ep~ /c + mc (III.29) Dies führt zu den Lorentz-invarianten Normierungen ū(~ p, σ)u(~ p, σ0 ) = 2mc δσσ0 , (III.30a) v̄(~ p, σ)v(~ p, σ0 ) = −2mc δσσ0 (III.30b) ū(~ p, σ)v(~ p, σ0 ) = v̄(~ p, σ)u(~ p, σ0 ) = 0 (III.30c) und mit ū, v̄ den Dirac-adjungierten Spinoren. Betrachtet man statt der Letzteren die hermiteschkonjugierten Spinoren, so lauten die Normierungen u(~ p, σ)† u(~ p, σ0 ) = v(~ p, σ)† v(~ p, σ0 ) = 2Ep~ δσσ0 . c Beweis der Beziehungen (III.30): Die Relation (III.11) gibt ū(~ p, σ) = N+(~ p)∗ ξσT 0 (γ µ )† pµ + mc14 γ 0 = N+(~ p)∗ ξσT 0 γ 0 γ µ pµ + mc14 = N+(~ p)∗ ξσT 0 6 p + mc14 , (III.30d) (III.31) während in der analogen Berechnung mit v̄(~ p, σ) ein Minus-Vorzeichen in der letzten Gleichung III. Dirac-Gleichung 34 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik kommt. Somit gilt der Dirac-Matrizen in der Standard-Darstellung T T T T ∗ ū(~ p, σ) = N+ (~ p) Ep~ /c+mc ξσ − p~·~σ ξσ , v̄(~ p, σ) = −N− (~ p)∗ − p~·~σ ξ−σ , Ep~ /c+mc ξ−σ (III.32) was sich auch direkt aus Gl. (III.25) und (III.28) herleiten lässt. Man findet dann z.B. 2 2 Ep~ 2 Ep~ p) + mc − p~ 2 ξσT ξσ0 = 2mc N+ (~ + mc δσσ0 , ū(~ p, σ)u(~ p, σ0 ) = N+ (~ p) c c wobei die zweite Gleichung aus der relativistischen Energie–Impuls-Beziehung folgt. Der Ausdruck (III.29) der Normierungskonstante N+ (~ p) ergibt das gesuchte Ergebnis. III.3.1 d Vollständigkeitsrelation :::::::::::::::::::::::::::::::: Für die Beschreibung von Teilchenstoß-Experimenten, in denen der Spin der beteiligten Teilchen nicht gemessen wird — entsprechend der Mehrheit der Experimente —, ist es nützlich, die Summe über Spinzustände19 σ = ± zu kennen. Es gelten die Vollständigkeitsrelationen X u(~ p, σ) ū(~ p, σ) = 6 p + mc14 (III.33a) σ=± und X v(~ p, σ)v̄(~ p, σ) = 6 p − mc14 . (III.33b) σ=± Diese Beziehungen lassen sich einfach nachprüfen. Beispielsweise lautet einer der Beiträge zur 4×4-Matrix auf der linken Seite der Gl. (III.33a) unter Nutzung der Gl. (III.24) und (III.31) ! ξσ 2 u(~ p, σ) ū(~ p, σ) = N+ (~ p) 6 p + mc14 ξσT 0 6 p + mc14 . 0 ! ξσ Dabei ist ξσT 0 gleich einer diagonalen 4×4-Matrix, und zwar 0 ! ( diag(1, 0, 0, 0) für σ = + ξσ T ξσ 0 = 0 diag(0, 1, 0, 0) für σ = −, ! ! X ξσ 12 0 so dass ξσT 0 = . Dann ergibt sich in der Standard-Darstellung 0 0 0 σ=± ! ! ! 0 X −~ p · ~σ 12 0 (p0 +mc)12 −~ p · ~σ 2 (p +mc)12 . u(~ p, σ) ū(~ p, σ) = N+ (~ p) p~ · ~σ (−p0 +mc)12 0 0 p~ · ~σ (−p0 +mc)12 σ=± Dies gibt gerade das Resultat (III.33a). III.3.2 Zweite Quantisierung der Wellenlösungen Wie bei den Lösungen der Klein–Gordon-Gleichung erfolgt die korrekte Deutung der Lösungen der Dirac-Gleichung über die zweite Quantisierung. Dabei wird die allgemeine Lösung der Gleichung geschrieben als eine Linearkombination aller möglichen ebenen Wellen der Type u(~ p, σ) e−ip·x/~ und +ip·x/~ v(~ p, σ) e mit jeweiligen Amplituden: Z Xh i d3 p~ ψ(x) = . cp~,σ u(~ p, σ) e−ip·x/~ + dp∗~,σ v(~ p, σ) eip·x/~ p (2π~)3 2Ep~ /c σ=± In einem zweiten Schritt werden diese komplexen Zahlen cp~,σ , dp∗~,σ durch Operatoren ĉp~,σ , dˆp†~,σ mit geeigneten Vertauschungsrelationen ersetzt. Man zeigt, da diese Relationen auf Antikommutatoren · , · beruhen sollen: ĉp~,σ , ĉ†q~,σ0 = δ (3) (~ p − ~q) δσσ0 , dˆp~,σ , dˆ†q~,σ0 = δ (3) (~ p − ~q) δσσ0 , (III.34a) während alle anderen Antikommutatoren verschwinden ĉp~,σ , ĉq~,σ0 = dˆp~,σ , dˆq~,σ = · · · = 0. 19 (III.34b) Diese Bezeichnung wird im Abschn. III.3.3 a unten gerechtfertigt. III. Dirac-Gleichung 35 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Die Wahl zwischen Kommutatoren — für Teilchen mit ganzzahligem Spin — und Antikommutatoren — für Teilchen mit halbzahligem Spin — ist natürlich nicht beliebig, sondern folgt aus zwei Forderungen. Erstens soll die Energie positiv sein, so dass den Moden mit „negativer Energie“ Erzeugungsoperatoren assoziiert werden sollen. Dazu soll die Theorie lokal sein, d.h. Operatoren bezüglich Raumzeit-Punkte x, x0 , getrennt durch ein raumartiges Intervall (x − x0 )2 < 0, sollen miteinander (anti)kommutieren. Somit lautet der Dirac-Feldoperator Z Xh i d3 p~ ψ̂(x) = ĉp~,σ u(~ p, σ) e−ip·x/~ + dˆp†~,σ v(~ p, σ) eip·x/~ p (2π~)3 2Ep~ /c σ=± und dessen Dirac-adjungiertes Feld Z Xh i d3 p~ ˆ ψ̄ (x) = ĉp†~,σ ū(~ p, σ) eip·x/~ + dˆp~,σ v̄(~ p, σ) e−ip·x/~ p . (2π~)3 2Ep~ /c σ=± (III.35a) (III.35b) Bemerkung: des Dirac-Feldes lässt sich aus Gl. (III.30a), (III.34a) und (III.35a) Die Dimension erkennen: ψ̂ = L−3/2 , wie bei einer Schrödinger-Wellenfunktion. In einem System natürlicher Einheiten hat ψ̂ die Dimension von E 3/2 . Ähnlich wie beim Klein–Gordon-Feld in Abschn. II.3.2 kann man zwei physikalische Operatoren benutzen, um die Deutung der Leiteroperatoren ĉp~,σ , dˆp~,σ zu erkennen. Beispielsweise kann man den Hamilton-Operator entsprechend der Dirac-Gleichung schreiben 20 als Z X Z Xh i † † 3 ˆ ˆ Ĥ = ĉp~,σ ĉp~,σ − dp~,σ dp~,σ Ep~ d p~ = ĉp†~,σ ĉp~,σ + dˆp†~,σ dˆp~,σ − δ (3) (~0) Ep~ d3 p~. (III.36) σ=± σ=± Interpretiert man ĉp~,σ , dˆp~,σ als Vernichtungsoperatoren, und ĉp†~,σ , dˆp†~,σ als Erzeugungsoperatoren, so sind ĉp†~,σ ĉp~,σ und dˆp†~,σ dˆp~,σ Besetzungszahloperatoren: jede Teilchenart trägt positiv zur Gesamtenergie bei. Interessanterweise kommt der Beitrag des Vakuums hier mit einem Minus-Vorzeichen, im Vergleich zum Plus-Vorzeichen in Gl. (II.15). Bemerkungen: ∗ Die einzigen Eigenwerte der Besetzungszahloperatoren ĉp†~,σ ĉp~,σ und dˆp†~,σ dˆp~,σ sind entweder 0 — entsprechend der Abwesenheit von Teilchen mit Impuls p~ und Spinzustand σ — oder 1. Im Gegensatz zu den Teilchenoperatoren für Spin-0-Teilchen sind höhere Besetzungszahlen in einer Mode hier nicht möglich, entsprechend dem Pauli-Prinzip. Sei n ein Eigenwert eines Operators ĉ† ĉ, wobei ĉ und ĉ† antikommutieren, und |ni ein zugehöriger Eigenvektor: ĉ† ĉ|ni = n|ni. Aus {ĉ, ĉ† } = 1̂ folgt n|ni = (1̂ − ĉĉ† )|ni = |ni − ĉĉ† |ni. Wenn n 6= 0, dann gilt |ni = n−1 ĉ† ĉ|ni, so dass ĉĉ† |ni = n−1 ĉĉ† ĉ† ĉ|ni = 0, wobei die zweite Gleichung aus ĉ† ĉ† = 21 {ĉ† , ĉ† } = 0 folgt. Somit bleibt n|ni = |ni, d.h. n = 1. Allgemeiner lassen sich Teilchen mit ganzzahligem Spin durch kommutierende Operatoren beschreiben, was zu einer Bose–Einstein-Statistik führt: sie sind also Bosonen. Dagegen sollen Teilchen mit halbzahligem Spin durch antikommutierende Operatoren beschrieben werden, und genügen deshalb der Fermi–Dirac-Statistik: solche Teilchen sind Fermionen. ∗ In supersymmetrischen Theorien entspricht jedem bosonischen Freiheitsgrad ein fermionischer Freiheitsgrad. Dank den entgegengesetzten Vorzeichen der bosonischen und fermionischen Beiträge zur Vakuumsenergie verschwindet dann die Letztere. 20 Durch die Feldoperatoren ausgedrückt lautet der Hamilton-Operator Z Z ~ + mc ψ̂(t, ~ ~ + mc γ 0 ψ̂(t, ~ Ĥ = ~c ψ̄ˆ(t, ~ x) −i~γ · ∇ x ) d3 ~ x = ~c ψ̂(t, ~ x)† −iγ 0~γ · ∇ x ) d3 ~ x. ~ ~ III. Dirac-Gleichung 36 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Multipliziert man die Dirac-Gleichung (III.6a) von links mit ψ̄(x), und die Dirac-adjungierte Gleichung (III.19) von rechts mit ψ(x), und addiert man beide Gleichungen, so findet man i∂µ ψ̄(x)γ µ ψ(x) = 0, entsprechend einer Kontinuitätsgleichung für die Viererstromdichte i~ µ jDirac (x) ≡ ψ̄(x)γ µ ψ(x). 2m Z i~ Somit ist ψ̄(t, ~x)γ 0 ψ(t, ~x) d3 ~x eine Erhaltungsgröße. Aus Gl. (III.35) folgt 2m Z Xh Z i i~ 0 3 ˆ ψ̄ (t, ~x)γ ψ̂(t, ~x) d ~x = ĉp†~,σ ĉp~,σ − dˆp†~,σ dˆp~,σ d3 p~, N̂ = 2m σ=± (III.37) (III.38) d.h. die beiden Teilchenarten tragen mit entgegengesetzten Vorzeichen zur Erhaltungsgröße bei: ˆ dˆ† -Operatoren beschriebenen Teilchen sind die Antiteilchen zu denen, die durch ĉ, ĉ† die mit d, beschrieben sind. Bemerkung: Im Gegensatz zur 0-Komponente der Klein–Gordon-Viererstromdichte (II.8) ist 0 0 jDirac (x) immer eine positiv definite reelle Zahl. Somit kann ρ0Dirac (x) ≡ jDirac (x)/c als eine Wahrscheinlichkeitsdichte interpretiert werden, ähnlich der mit einer Schrödinger-Wellenfunktion assoziierten Wahrscheinlichkeitsdichte. Zusammenfassend wirken die verschiedenen Leiteroperatoren wie folgt: • ĉp~,σ vernichtet ein Teilchen mit Impuls p~ und Spinzustand σ, das also im Anfangszustand eines Stoßprozesses vorhanden sein muss. Somit steht dieser Vernichter für ein einlaufendes Teilchen. • ĉp†~,σ erzeugt ein Teilchen mit Impuls p~ und Spinzustand σ, das sich also im Endzustand einer Kollision befinden wird: dieser Erzeugungsoperator repräsentiert ein auslaufendes Teilchen. • dˆp~,σ vernichtet ein (in einem Streuprozess) einlaufendes Antiteilchen mit Impuls p~ und Spinzustand σ. • dˆp†~,σ erzeugt ein (in einem Streuprozess) auslaufendes Antiteilchen mit Impuls p~ und Spinzustand σ. Um die Bezeichnung „Spinzustand“ für den Freiheitsgrad σ besser zu motivieren, sollen nun zwei weitere Operatoren eingeführt und diskutiert werden. III.3.3 Helizität und Chiralität In diesem Abschnitt werden zwei auf Dirac-Spinoren wirkenden Operatoren diskutiert, und zwar die Helizitäts- und Chiralitätsoperatoren. Um diese Operatoren von denen des Abschn. (III.3.2) — die auf die Zustände eines fermionischen Fock-Raums wirken — zu unterscheiden, werden sie ohne Zirkumflex geschrieben, also als einfache 4×4-Matrizen. III.3.3 a Helizität ::::::::::::::::: Man kann zeigen, dass der Spin einer Lösung der freien Dirac-Gleichung keine Erhaltungsgröße ~ nicht mit dem ist, entsprechend der Tatsache, dass der auf Dirac-Spinoren wirkende Spinoperator S 21 Hamilton-Operator kommutiert. Dagegen ist die Komponente des Spins entlang der Bewegungsrichtung, d.h. die Richtung des Impulses p~, erhalten. 21 Dieser Spinoperator ist gleich ~ mal dem Generator der Drehungen auf dem durch die Dirac-Spinoren gespannten Vektorraum, vgl. Abschn. I.1.3. III. Dirac-Gleichung 37 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Sei ~ep~ ≡ p~/|~ p | der Einheitsvektor in Bewegungsrichtung eines Dirac-Spinors. Im Folgenden wird der Helizitätsoperator definiert als ! ~ σ 0 ~ mit Σ ~ = h(~ p) ≡ ~ep~ · Σ , (III.39) 0 ~σ ~ ist tatsächlich einfach verknüpft mit dem Spinoperator auf Diracmit σ k den Pauli-Matrizen. Σ ~~ ~ Spinoren, S = 2 Σ. Somit ist die Komponente des Spinoperators entlang der Bewegungsrichtung Sp~ = ~2 h(~ p). Dank der Beziehung (~ p · ~σ )2 = p~ 2 12 findet man sofort, dass [h(~ p)]2 = 14 ist. Infolgedessen sind die Eigenwerte von h(~ p) gleich ±1. Ist ein Dirac-Spinor ψ Eigenvektor von h(~ p), so wird der entsprechende Eigenwert als die Helizität des Spinors bezeichnet: ein Spinor mit Helizität +1 bzw. −1 hat also eine Spinkomponente ~2 (kurz: ↑) bzw. − ~2 (kurz: ↓) entlang seines Impulses. Bemerkung: Manchmal (z.B. in Landau & Lifschitz [12] oder Nachtmann [13]) wird die Helizität als Eigenwert des Spinoperators in Bewegungsrichtung definiert, entsprechend dem Erwartungswert des oben eingeführten OperatorsSp~ . Die möglichen Helizitäten sind dann ± ~2 statt ±1. Jedenfalls bleibt das Vorzeichen der Helizität eines gegebenen Spinors ungeändert. Seien nun die zwei Operatoren (h) P± ≡ 14 ± h(~ p) . 2 Es gelten die Beziehungen (h) 2 (h) • P± = P± ; • • (h) (h) (h) (h) P+ P− = P− P+ (h) (h) P+ + P− = 14 . (III.40) (III.41a) = 0; (III.41b) (III.41c) (h) P+ (h) P− Die Erstere bedeutet, dass und Projektoren sind. Dann lässt sich gemäß Gl. (III.41c) jeder (h) Dirac-Spinor als Summe von einem Spinor des Bildes von P+ und einem Spinor des Bildes von (h) P− schreiben: (h) (h) (h) (h) ψ = P+ ψ + P− ψ ≡ ψ+ + ψ− . Dank Gl. (III.41b) ist diese Zerlegung eindeutig. Beispiel: Sei z.B. angenommen, dass p~ entlang der z-Achse ausgerichtet ist: p1 = p2 = 0, p3 = |~ p|. ~ = diag(1, −1, 1, −1). Für einen Dirac-Spinor mit „positiver Energie“ führt Dann gilt h(~ p) = ~e3 · Σ Gl. (III.25) unter Berücksichtigung der Normierungskonstante (III.29) zu p Ep~ /c + mc ξσ u(~ p, σ) = σ|~ p| . p ξσ Ep~ /c + mc Damit findet man h(~ p)u(~ p, σ) = σu(~ p, σ): das Vorzeichen der Helizität ist gerade durch σ gegeben, das also direkt mit dem Spin (entlang der Bewegungsrichtung) verknüpft ist. Ähnlicherweise zeigt man für einen Spinor „negativer Energie“, dass h(~ p)v(~ p, σ) = −σv(~ p, σ) ist. Bemerkung: Betrachtet man jetzt die vier unabhängigen Dirac-Spinoren [Gl. (III.24) und (III.27)] ! ! ! ! ξ+ ξ− 0 0 N+ (~ p) 6 p + mc , N+ (~ p) 6 p + mc , N− (~ p) 6 p − mc , N− (~ p) 6 p − mc , 0 0 ξ+ ξ− so stellen sie ein Teilchen mit Spin (entlang des Impulses) ↑, ein Teilchen mit Spin ↓, ein Antiteilchen mit Spin ↓, und schließlich ein Antiteilchen mit Spin ↑ dar. Historisch wurde ein Antiteilchen mit Spin ↓ (bzw. ↑) als ein fehlendes Teilchen — ein „Loch“ — mit Spin ↑ (bzw. ↓) interpretiert, was die gewählte Ordnung der Zustände erklärt. III. Dirac-Gleichung 38 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik III.3.3 b Chiralität ::::::::::::::::::: In Abschn. III.2.2 wurde der Chiralitätsoperator γ5 definiert und einige dessen Eigenschaften dargestellt, insbesondere dass dessen Eigenwerte die Werte +1 oder −1 annehmen kann. Diese stellen die Chiralität der zugehörigen Eigenvektoren dar. Definiert man jetzt zwei Operatoren 14 − γ5 14 + γ5 PL ≡ und PR ≡ , (III.42) 2 2 so genügen sie den Beziehungen 2 2 • PL = PL , PR = PR ; (III.43a) • PL PR = PR PL = 0; (III.43b) • PL + PR = 14 . (III.43c) D.h., PL und PR sind Projektoren, und jeder Dirac-Spinor lässt sich eindeutig als Summe eines „linkshändigen“ und eines „rechtshändigen“ Spinors schreiben. Konventionell gilt für Dirac-Spinoren mit positiver Energie, entsprechend Teilchen, uL (~ p, σ) = PL u(~ p, σ), uR (~ p, σ) = PR u(~ p, σ), (III.44) was ziemlich natürlich aussieht: linkshändige Teilchen haben die Chiralität −1 und rechtshändige Teilchen die Chiralität +1. Für Dirac-Spinoren mit negativer Energie, entsprechend Antiteilchen, definiert man dagegen vL (~ p, σ) = PR v(~ p, σ), vR (~ p, σ) = PL v(~ p, σ). (III.45) Dank der Hermizität von γ5 , Gl. (III.16d), sind PL und PR hermitesch. Somit gilt für die Diracadjungierten Spinoren unter Verwendung der Relation (III.16b) ūL (~ p, σ) = uL (~ p, σ)† γ 0 = u(~ p, σ)† PL γ 0 = u(~ p, σ)† γ 0 PR = ū(~ p, σ)PR , (III.46) v̄R (~ p, σ) = v̄(~ p, σ)PR . (III.47) und ähnlich Bemerkungen: ∗ Der Chiralitätsoperator γ5 kommutiert im Allgemeinen nicht mit dem Hamilton-Operator eines freien Spin- 12 -Teilchens, so dass die Chiralität keine Erhaltungsgröße in der Bewegung des Teilchens ist. ∗ Im Gegensatz dazu ist die Chiralität nützlich in der Beschreibung der schwachen Wechselwirkungen, weil die Letzteren nur auf linkshändige Teilchen bzw. rechtshändige Antiteilchen wirken, d.h. auf Spinoren, die mit PL projiziert werden. III.3.3 c Helizität und Chiralität masseloser Teilchen ::::::::::::::::::::::::::::::::::::::::::::::::::: Für masselose Teilchen sind die Helizität und die Chiralität einfach miteinander verbunden. Betrachtet man z.B. wie oben ein Teilchen mit Impuls entlang der z-Achse, dann lautet der entsprechende Spinor ! p ξσ p| , u(~ p, σ) = |~ σ ξσ wobei Ep~ = |~ p|c benutzt wurde. Dann gilt unter Verwendung der Standard-Darstellung (III.14) des Chiralitätsoperators ! ! ! p p 0 12 ξσ σ ξσ γ5 u(~ p, σ) = |~ p| = |~ p| = σu(~ p, σ). σ ξσ 12 0 ξσ Somit ist der Chiralitätseigenwert gleich dem Helizitätseigenwert: ein linkshändiges masseloses Teilchen hat die Helizität −1. III. Dirac-Gleichung 39 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Literatur • Griffiths [15], Kap. 7.1–7.3 & 9.7.1. • Nachtmann [13], Kap. 4.1–4.2 & 4.4. • Schwabl [1], Kap. 5.3, 6 & 11.5–11.6. III. Dirac-Gleichung 40 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik IV. Maxwell-Gleichungen Dieses Kapitel geht auf die relativistische Wellengleichung für ein wechselwirkungsfreies masseloses Teilchen mit Spin 1 ein. Dabei handelt es sich tatsächlich um die Maxwell-Gleichungen des freien elektromagnetischen Feldes, die in einem ersten Schritt in kovarianter Schreibweise geschrieben werden (Abschn. IV.1). Dann werden die Lösungen zu diesen Gleichungen in Abschn. IV.2 diskutiert, wobei die wichtige Rolle der Eichinvarianz offenbar wird. IV.1 Kovariante Formulierung der Elektrodynamik Die Maxwell-Gleichungen der klassischen Elektrodynamik sind (fast definitionsgemäß) Lorentz~ ~x) einen Viererkovariant. Somit bilden das Skalarpotential Φ(t, ~x) und das Vektorpotential A(t, vektor, das Viererpotential A(x), mit den kontravarianten Komponenten ! Φ(x)/c Aµ (x) = . (IV.1) ~ A(x) Ausgehend vom Viererpotential definiert man einen zweimal kontravarianten Lorentz-Tensor F µν (x), den elektromagnetischen Feldstärketensor , als F µν (x) = ∂ µ Aν (x) − ∂ ν Aµ (x). (IV.2) Unter Nutzung der Beziehungen ~ ~x) ∂ A(t, ~ ~x) = ∇ ~ × A(t, ~ ~x) ~ , B(t, (IV.3) E~ (t, ~x) = −∇φ(t, ~r) − ∂t prüft man nach, dass die Komponenten des Feldstärketensors einfach mit den Komponenten der ~ verknüpft sind: elektrischen und magnetischen Felder E~ , B Ei F i0 = ∂ i A0 − ∂ 0 Ai = −∂i A0 − ∂0 Ai = , c F ij = ∂ i Aj − ∂ j Ai = −∂i Aj + ∂j Ai = −ijk B k Diese Relationen lassen sich mithilfe der Matrixform des Feldstärketensors zusammenfassen Ey Ex Ez 0 − − − c c c Ex 0 −Bz By c , F µν = (IV.4) Ey B 0 −B z x c Ez −By Bx 0 c wobei die x-Abhängigkeit der Felder der Kürze halber nicht geschrieben wurde. Durch den elektromagnetischen Feldstärketensor können die Maxwell-Gleichungen in Abwesenheit äußerer Quellen durch22 ∂µ F µν (x) = 0 ∀ν (IV.5a) und ∂ µ F νρ (x) + ∂ ν F ρµ (x) + ∂ ρ F µν (x) = 0 ∀µ, ν, ρ. (IV.5b) ~ = 0 und ~ ·B ausgedrückt werden. Die Letztere — entsprechend der Maxwell–Thomson-Gleichung ∇ 22 In Anwesenheit einer äußeren Ladungsdichte ρ(t, ~ x) bzw. einer Ladungsstromdichte ~(t, ~ x) bilden die beiden einen Viererstrom mit kontravarianten Komponenten j µ = (ρc, ~)T und die Maxwell-Gleichung wird ∂µ F µν = µ0 j ν . IV. Maxwell-Gleichungen 41 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik ~ ~ × E~ + ∂ B/∂t der Maxwell–Faraday-Gleichung ∇ = ~0 — enthält keine Dynamik und folgt sofort aus der Antisymmetrie des Feldstärketensors (IV.2). Dagegen bestimmt Gl. (IV.5a) die Dynamik der elektrischen und magnetischen Felder — die ~ · E~ = 0, während die räumlichen ν = 0-Komponente entspricht der Maxwell–Gauß-Gleichung ∇ −2 ~ ~ Komponenten die Maxwell–Ampère-Gleichung ∇ × B + c ∂ E~ /∂t = ~0 darstellen. Mit Gl. (IV.2) ergibt sich ∂µ F µν (x) = ∂µ ∂ µ Aν (x) − ∂µ ∂ ν Aµ (x) = Aν (x) − ∂ ν ∂µ Aµ (x) . ~ und somit A, nicht eindeutig definiert, sondern Bekannterweise sind die Potentiale Φ und A, können gemäß sogenannter Eichtransformationen µ Aµ (x) → A0 (x) = Aµ (x) + ∂ µ χ(x) (IV.6) ~ bzw. mit χ(x) einer skalaren Funktion transformiert werden, ohne die physikalischen Felder E~ und B µν den elektromagnetischen Feldstärketensor F zu ändern. Diese Eichfreiheit kann benutzt werden, um Gleichungen zu vereinfachen. Zum Beispiel kann man erfordern, dass das Viererpotential der Lorenz-Eichung-Bedingung ∂µ Aµ (x) = 0 (IV.7) genügt. Unter dieser Forderung lauten die freien Maxwell-Gleichungen (IV.5a) einfach Aν (x) = 0. (IV.8) Somit sind die Maxwell-Gleichungen ziemlich ähnlich der Klein–Gordon-Gleichung (II.4), für den Fall masseloser Teilchen. Da Aµ (x) sich wie ein (kontravarianter) Vierervektor transformiert, handelt es sich um Teilchen mit dem Spin 1. Bemerkungen: ∗ Für massive Teilchen mit dem Spin 1, beschrieben durch ein Vektorfeld V µ (x), heißt die relativistische Wellengleichung m2 c2 + 2 V µ (x) = 0 (IV.9) ~ Proca-Gleichung, wobei m die Teilchenmasse bezeichnet. Wegen des Massenterms besitzt aber das Vektorfeld V µ (x) keine Eichfreiheit mehr. ∗ Die Lorenz-Eichung-Bedingung (IV.7) bestimmt noch nicht das Viererpotential eindeutig. Es gibt noch eine Eichfreiheit um einen Vierergradienten ∂ µ χ(x) mit χ(x) Lösung von χ(x) = 0. In Abwesenheit äußerer Quellen kann diese Freiheit benutzt werden, um die temporale Weyl-EichungBedingung A0 (x) = 0 (IV.10) zu erfordern. Dann wird die Lorenz-Eichung äquivalent zur Coulomb-Eichung ~ · A(t, ~ ~x) = 0. ∇ (IV.11) IV.2 Lösung der freien Maxwell-Gleichungen In diesem Abschnitt werden die Lösungen der Maxwell-Gleichungen im freien Raum (IV.8) unter Berücksichtigung der (Eichung-)Bedingungen (IV.10) und (IV.11) untersucht. Dabei sollen die Lösungen reellwertig sein, damit die physikalischen elektrischen und magnetischen Felder ebenfalls reelle Werte annehmen. Anknüpfend an die Ergebnisse des Abschn. II.2 über die Lösungen der freien Klein–GordonGleichung kann man die allgemeine Lösung der Gl. (IV.8) schreiben als eine Überlagerung ebener IV. Maxwell-Gleichungen 42 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik Wellen mit unterschiedlichen Wellenvektoren [vgl. Gl. (II.7)] Z X h i ~c d3 p~ (λ) (λ) ∗ µ µ , A (x) = ε(λ) (~ p) ap~ e−ip·x/~ + ap~ eip·x/~ p (2π~)3 2Ep~ λ (IV.12) µ mit ε(λ) (~ p) dem (reellen) Polarisationsvektor für jeden Polarisationszustand λ. 0 (~ Die Bedingung A0 (x) = 0 gibt sofort ε(λ) p) für jeden Impuls p~ und Polarisationszustand λ. Dann führt die Coulomb-Eichung-Bedingung ∂j Aj (x) = 0 dank ∂j e−ip·x/~ = −ipj e−ip·x/~ /~ zu j pj ε(λ) (~ p) = 0, d.h. der dreidimensionale Polarisationsvektor ~ε(λ)(~ p) ist senkrecht zur Propagationsrichtung der Welle: die freie Welle wird als transversal polarisiert bezeichnet. Für jeden Impuls p~ gibt es zwei linear unabhängige Lösungen von p~ · ~ε(λ)(~ p) = 0. Ist p~ z.B. in z-Richtung gerichtet, so findet man die möglichen Polarisationsvektoren 1 0 ~ε(1)(~ p) = 0 , ~ε(2)(~ p) = 1 . 0 0 Natürlich sind andere Wahlen der Basisvektoren möglich. Wichtig ist, das es für jeden Impuls p~ nur zwei unabhängige Freiheitsgrade gibt, entsprechend den zwei möglichen Polarisationsrichtungen. Naiv könnte man vier Freiheitsgrade erwarten, entsprechend der Zahl der Komponenten eines Vierervektors. Da Gl. (IV.12) es erlaubt, die Normierung des Polarisationsvektors frei zu µ wählen — hier ist ε(λ) (~ p) auf −1 normiert —, bleiben nur drei Freiheitsgrade. Dies wäre ja zufriedenstellend, da ein Teilchen mit Spin 1 normalerweise drei Freiheitsgrade besitzt: für j = 1 sind mj = −1, 0 und +1 möglich. Für masselose Teilchen mit Spin 1 existiert aber die Eichfreiheit, so dass eines dieser Freiheitsgrade tatsächlich keine Dynamik enthält, und nur zwei dynamische Spinzustände bleiben. Ist das Teilchen mit Spin 1 massiv, und somit beschrieben durch die Proca-Gleichung (IV.9), so gibt es keine Eichfreiheit mehr, und es bleiben drei Spinzustände. In einem echten Teilchenstoß-Experiment ist die Polarisation bzw. der Spin der einlaufenden und auslaufenden Teilchen nicht immer gemessen. Somit wird es sich lohnen, über Polarisationen summieren zu können, d.h. den Tensor X µ ν ε(λ)(~ p)ε(λ) (~ p) λ=1,2 zu berechnen. Diese Summe wird als Vollständigkeitsrelation bezeichnet. In der Coulomb-Eichung gilt X pi pj j i ε(λ) (~ p)ε(λ) (~ p) = δ ij − 2 . (IV.13) p~ λ=1,2 Führt man jetzt die zweite Quantisierung der allgemeinen Lösung (IV.12) durch, indem die (λ) (λ) Amplituden ap~ durch Vernichtungsoperatoren âp~ mit den Vertauschungsrelationen h i h i h i (λ) (λ0 ) † (λ) (λ0 ) (λ) † (λ0 )† âp~ , âq~ = δλλ0 δ (3) (~ p − ~q), âp~ , âq~ = âp~ , âq~ =0 (IV.14) ersetzt werden, so erhält man den Feldoperator Z X h i ~c d3 p~ (λ) (λ) † µ µ  (x) = ε(λ) (~ p) âp~ e−ip·x/~ + âp~ eip·x/~ p . 3 2E (2π~) p ~ λ=1,2 (IV.15) Verglichen mit dem Feldoperator (II.11a) gibt es hier keinen Operator des b̂-Typs, entsprechend der Hermitizität von µ (x) bzw. der Reellwertigkeit dessen Vakuumserwartungswerts Aµ (x). Es gibt IV. Maxwell-Gleichungen 43 N.BORGHINI Relativistische Quantenmechanik Elementarteilchenphysik (λ) † (λ) also kein unabhängiges Antiteilchen zu dem durch âp~ beschriebenen Teilchen — z.B., wenn âp~ ein Quantum des elektromagnetischen Feldes, ein Photon, mit der Polarisation λ erzeugt, bedeutet dies, dass es kein Antiphoton gibt: das Photon ist sein eigenes Antiteilchen. (λ) (λ) † Die Operatoren âp~ , âp~ lassen sich wie in Abschn. II.3 interpretieren: (λ) i (~ • âp~ vernichtet ein Teilchen mit Impuls p~ und Polarisationsvektor ε(λ) p), das also im Anfangszustand eines Stoßprozesses vorhanden sein muss. Somit repräsentiert dieser Vernichtungsoperator ein einlaufendes Teilchen. (λ) † • âp~ erzeugt ein Teilchen mit Impuls p~ und Polarisation λ, das sich also im Endzustand einer Streuung befinden wird: dieser Erzeuger repräsentiert ein auslaufendes Teilchen. (λ) (λ) † Bemerkung: Der erste Kommutator (IV.14) liefert die Dimension der Leiteroperatoren âp~ , âp~ , µ und somit des die Dimension Vektorfelds  (x), Gl. (IV.15). Wie im Fall des Klein–Gordon-Feldes µ 1/2 1/2 −1 gilt  = M L T : dies entspricht nicht der üblichen Dimension des elektromagnetischen Potentials, lässt sich aber einfacher auf andere Vektorfelder verallgemeinern. Literatur • Griffiths [15], Kap. 7.4. • Landau & Lifschitz, Band IV [12], Kap. I § 2–4. • Nachtmann [13], Kap. 7.1. IV. Maxwell-Gleichungen 44 Teil B Wechselwirkende Teilchen Version vom 4. Februar 2014, 10:59 45 N.BORGHINI Elementarteilchenphysik Im vorigen Teil A wurden die Gleichungen zur Beschreibung der Bewegung wechselwirkungsfreier relativistischer Teilchen mit Impuls p~ und gegebenenfalls Helizität σ bzw. Polarisation λ dargestellt. Wenn Wechselwirkungen vorhanden sind, können Teilchen an zwei grundlegenden Arten von Prozessen teilnehmen, und zwar an Zerfällen und Streuungen: – Zerfall: Anfangszustand 111 000 000 111 000 111 Wechselwirkung Zerfallsprodukte – Streuung: Anfangszustand 111 000 000 111 000 111 6 Wechselwirkung Streuprodukte In beiden Fällen stellt sich die Frage, was ist die Wahrscheinlichkeit dafür, pro Zeiteinheit vom Anfangszustand in einen gegebenen Endzustand zu übergehen. Dieser Teil befasst sich mit dem geeigneten Formalismus um diese Frage zu beantworten, unabhängig von den eigentlichen Wechselwirkungen, erstens für Zerfälle (Kapitel VI), dann für Streuungen (Kapitel VII). Insbesondere werden hiernach Ähnlichkeiten zwischen den Ausdrücken der Größen, die für jeden Prozess die Übergangswahrscheinlichkeiten pro Zeiteinheit charakterisieren, gefunden. Tatsächlich weisen diese Größen — Zerfallsrate bzw. Wirkungsquerschnitt — die gleiche mathematische Struktur auf, in der Form von Integralen über den verfügbaren Phasenraum für alle Endzustandsteilchen von dem Betragsquadrat einer Amplitude. Die Letztere wird letztendlich bestimmt von den für den Prozess relevanten Wechselwirkungen. Diese werden nur im nächsten Teil detailliert behandelt werden, doch die durch Feynman eingeführten Regeln, basierend auf Diagramme, zur Berechnung einer Amplitude werden schon in Kap. VIII dargestellt. Wechselwirkende Teilchen 47 N.BORGHINI Elementarteilchenphysik V. Relativistische Kinematik In der Elementarteilchenphysik lassen sich die meisten Prozesse in zwei Kategorien einordnen: zum einen in Zerfälle eines instabilen Teilchens der Masse m in zwei oder mehr leichtere Teilchen, und zum anderen in Stöße zweier Teilchen mit Viererimpulsen pa und pb , mit zwei oder mehr Teilchen im Endzustand. Unabhängig von den für diese Prozesse verantwortlichen Wechselwirkungen liefert die Erhaltung des gesamten Viererimpulses — entsprechend den nicht-relativistischen Erhaltungssätzen der Energie und des Impulses — vier Gleichungen, die die Viererimpulse der emittierten Teilchen einschränken. In diesem Kapitel wird kurz auf diese rein kinematischen Einschränkungen eingegangen, für kinematisch erlaubte (Abschn. V.1) Prozesse mit zwei (Abschn. V.2) oder drei (Abschn. V.3) Teilchen im Endzustand. Schließlich werden in Abschn. V.4 einige Definitionen und ein paar oft auftretende kinematische Variablen eingeführt. Hiernach werden nur sogenannte „on-Shell-Teilchen“ betrachtet, d.h. Teilchen, die den klassischen Bewegungsgleichungen genügen, und insbesondere der Beziehung23 E 2 − |~ p|2 c2 = m2 c4 mit m der Teilchenmasse. V.1 Schwerpunktsenergie, Reaktionsschwelle Eine wichtige Größe zur Charakterisierung eines Prozesses ist die verfügbare Energie im Schwerpunktsystem oder Schwerpunktsenergie Ecms .24 Dabei ist das Letztere so definiert als das Bezugssystem, wo der dreidimensionale Gesamtimpuls einer Menge von Teilchen — entsprechend hier dem bzw. den Teilchen vor (oder, dank dem Impulssatz, nach) der Reaktion — gleich Null ist. In einem Zerfall ist Ecms gerade gleich der Massenenergie mc2 des zerfallenden Teilchens. Im Fall des Stoßes zweier Teilchen lässt sich Ecms durch die Viererimpulse pa und pb einfach ausdrücken. Im Schwerpunktsystem gilt tatsächlich definitionsgemäß p~a,cms + p~b,cms = ~0, woraus 2 2 2 2 2 Ecms = p0a,cms + p0b,cms = p0a,cms + p0b,cms − p~a,cms + p~b,cms = pa,cms + pb,cms 2 c folgt. Da das Lorentz-Quadrat eines Vierervektors ein Lorentz-Skalar ist, bleibt der Term ganz rechts gleich (pa + pb )2 in jedem Inertialsystem. Somit gilt in allen Inertialsystemen 2 Ecms = (pa + pb )2 c2 . (V.1) Ein Prozess ist nur dann kinematisch erlaubt, wenn die verfügbare Energie im Schwerpunktsystem größer als die Summe der Massenenergien der Endzustandsteilchen ist. Für Zerfälle bedeutet P diese Bedingung m > j mj , mit mj den Massen der „Tochterteilchen“. Im Fall eines Stoßes soll P (pa + pb )2 > ( j mj )2 c2 gelten. Die letztere Ungleichung kann auch anders gedeutet werden. Damit der Endzustand eines ZweiTeilchen-Stoßes aus gegebenen Teilchen mit Massen mj besteht, die Schwerpunktsenergie der P muss 2 4 Kollision einen Wert überschreiten, die Reaktionsschwelle ( j mj ) c . Bemerkung: Auch wenn ein gegebener Prozess kinematisch erlaubt ist, ist es noch möglich, dass er aus anderen Gründen nicht stattfinden kann — insbesondere wenn der Prozess weiteren Erhaltungssätzen nicht genügt, z.B. der Erhaltung des Drehimpulses oder der elektrischen Ladung. V.2 Zwei Teilchen im Endzustand Besteht der Endzustand eines Prozesses aus nur zwei Teilchen mit Massen m1 und m2 , so lässt sich dieser mit sechs Parametern, entsprechend den Komponenten der Impulse der Teilchen — die 23 ... entsprechend der Gleichung eines Hyperboloids, der Massenschale (mass-shell), im vierdimensionalen Raum aller möglichen Werte der Energie und der Impulskomponenten. 24 Hier steht die Abkürzung cms für center-of-mass system. Wechselwirkende Teilchen 48 N.BORGHINI Elementarteilchenphysik Energien der Teilchen sind dann durch die on-shell-Bedingungen Ej2 = |~ pj |2 c2 + m2j c4 bestimmt. Sei jetzt angenommen, dass der gesamte Viererimpuls p des Anfangszustands bekannt ist. Da die Erhaltung des Viererimpulses vier Bedingungen darstellt, bleiben tatsächlich nur zwei Freiheitsgrade für den Endzustand, entsprechend z.B. den zwei Winkeln, die die Richtung eines der emittierten Teilchen charakterisieren. Dies wird hiernach am Beispiel des Endzustands eines Zwei-TeilchenZerfalls illustriert.25 In diesem und im nächsten Abschnitt wird der Zerfall eines unpolarisierten Teilchens betrachtet, so dass der Zerfall isotrop ist. Im Ruhesystem des „Mutterteilchens“, entsprechend dem Schwerpunktsystem der Zerfallsprodukte, werden die Letzteren in entgegengesetzte Richtungen emittiert. Es seien mc E1 /c E2 /c p = ~ , p1 = , p2 = p~1 p~2 0 die Viererimpulse der Mutter- und Tochterteilchen im Schwerpunktsystem. Die Erhaltung des gesamten Viererimpulses p = p1 + p2 im Zerfall führt sofort zu (p − p1 )2 = (p2 )2 = m22 c2 . Berechnet man das Lorentz-Quadrat auf der linken Seite unter Berücksichtigung der Gleichungen p2 = m2 c2 , (p1 )2 = m21 c2 und p · p1 = mE1 — wobei die Letztere nur im Schwerpunktsystem gilt —, so ergibt sich m2 c2 + m21 c2 − 2mE1 = m22 c2 , d.h. E1 = m2 + m21 − m22 2 c . 2m In ähnlicher Weise erhält man E2 = (m2 + m22 − m21 ) c2 /2m. Die Energien E1 und E2 im Schwerpunktsystem sind somit unabhängig von den Richtungen der emittierten Teilchen. Diese Eigenschaft gilt in einem anderen Bezugssystem nicht mehr! Aus dem Ausdruck der Energie und der on-shell-Bedingung folgt für den Betrag des Impulses jedes Tochterteilchens |~ pj |2 = Ej2 m4 + m41 + m42 − 2m2 m21 − 2m2 m22 − 2m21 m22 2 2 2 − m c = c . j c2 4m2 Bemerkung: Der Zähler dieses Ausdrucks lässt sich als [m2 − (m1 + m2 )2 ][m2 − (m1 − m2 )2 ] umschreiben. Dies ist immer positiv für m größer als m1 + m2 , kann aber wenn m < m1 + m2 negativ werden, was für ein Betragsquadrat problematisch ist! Hier erkennt man die in Abschn. V.1 diskutierte Bedingung über die Massen der beteiligten Teilchen. V.3 Drei Teilchen im Endzustand In einem Prozess mit drei Teilchen im Endzustand existieren auch kinematisch bedingte Einschränkungen, die hier am Beispiel des Zerfalls eines Teilchens der Masse m in drei Teilchen mit Massen m1 , m2 und m3 illustriert werden. Seien p, p1 , p2 und p3 die jeweiligen Viererimpulse der Teilchen. Die Erhaltung des gesamten Viererimpuls p = p1 + p2 + p3 liefert vier Bedingungen für die 9 Komponenten der Impulse der Zerfallsprodukte, so dass es 5 Freiheitsgrade übrig bleiben. Drei davon entsprechen Winkeln — zwei für die Ebene, in der p~1 und p~2 liegen, und einem für die Richtung von p~1 in dieser Ebene —, wovon die Energien der emittierten Teilchen im Schwerpunktsystem aus Symmetrie-Gründen nicht abhängen können. Diese Energien hängen nur von den zwei restlichen 25 Handelt es sich bei dem Prozess um einen Streuprozess, so soll m in allen Gleichungen dieses und des nächsten Abschnitts durch Ecms /c2 ersetzt werden. Wechselwirkende Teilchen 49 N.BORGHINI Elementarteilchenphysik Freiheitsgraden ab. Für die Letzteren werden üblicherweise zwei der Lorentz-invarianten DalitzVariablen m2ij angenommen, wobei m212 c2 ≡ (p1 + p2 )2 = (p − p3 )2 , m213 c2 ≡ (p1 + p3 )2 = (p − p2 )2 , m223 c2 ≡ (p2 + p3 )2 = (p − p1 )2 , (V.2) z.B. m212 und m213 . Die Menge der kinematisch erlaubten Werte dieser Variablen ist ein konvexes Gebiet der (m212 , m213 )-Ebene, dessen Grenzen von m, m1 , m2 und m3 abhängen. Aus der Gleichung m212 = (p − p3 )2 /c2 = m2 + m23 − 2mE3 /c2 im Schwerpunktsystem und der Bedingung E3 /c2 ≥ m3 folgt die obere Schranke m212 ≤ (m − m3 )2 . Um eine untere Schranke von m212 zu erhalten, kann man ins Schwerpunktsystem des aus Teilchen 1 und 2 bestehenden Teilsystems übergehen. Bezeichnet man die Energien in diesem Bezugssystem mit einem Strich, so gilt m212 = (p1 + p2 )2 /c2 = (E10 + E20 )2 /c4 ≥ (m1 + m2 )2 , wobei die Ungleichung trivial ist. Somit hat man schließlich m212 ∈ (m1 + m2 )2, (m − m3 )2 , und ähnlich m213 ∈ (m1 + m3 )2 , (m − m2 )2 und m223 ∈ (m2 + m3 )2 , (M − m1 )2 . Wegen der Beziehung (V.3) zwischen den Dalitz-Variablen kann bei gegebener m212 die Variable m213 nicht ihre Werte im ganzen Intervall annehmen, sondern nur in einem kleineren, m212 -abhängig Bereich. Weitere Details dazu können in der Review of Particle Properties [16], Abschn. 43.4.3 & 43.4.4 gefunden werden. Bemerkungen: ∗ Wegen der Erhaltung des gesamten Viererimpulses sind die Dalitz-Variablen nicht unabhängig voneinander, sondern genügen der Beziehung m212 + m213 + m223 = m2 + m21 + m22 + m23 . (V.3) ∗ In einem Drei-Teilchen-Zerfall sind die Energien und Impulse der Zufallsprodukte nicht durch die Kinematik völlig festgelegt, sondern können ein kontinuierliches Spektrum an Werten annehmen,26 wobei der maximale mögliche Wert der Energie E1 und somit des Impulses |~ p1 | für Teilchen 1 durch 2 2 den minimalen möglichen Wert von m23 gegeben ist [vgl. E1 = (m + m1 − m223 )c2 /2m]. V.4 Kinematik einfacher Stöße In diesem Abschnitt werden ein paar Definitionen betreffend Teilchenstöße eingeführt. Wir diskutieren nur Kollisionen zwischen zwei durch a bzw. b gekennzeichneten Teilchen, weil Stöße in einer relativistischen Theorie nur lokal sein können, d.h. die beteiligten Teilchen sollen sich im gleichen Punkt der Raumzeit befinden, was mit mehr als zwei Teilchen unmöglich wird. Bekannterweise unterscheidet man zwischen elastischen Stößen, in denen die Teilchen im Endzustand die gleichen wie im Anfangszustand bleiben, und inelastischen Stößen. Unter den letzteren werden die Stöße mit nur zwei Teilchen (1 und 2) im Endzustand als quasielastisch bezeichnet. Zusammen werden elastische und quasielastische Stöße auch Zwei-nach-zwei-Prozesse genannt. Sei a + b → 1 + 2 ein solcher Prozess, mit ma , mb , m1 und m2 bzw. pa , pb , p1 und p2 den Massen bzw. den Viererimpulsen der Teilchen. Falls der Stoß elastisch ist, wird (p1 )2 = (pa )2 = m2a c2 und damit (p2 )2 = (pb )2 = m2b c2 angenommen. Die Mandelstam-Variablen für den Prozess werden definiert durch s ≡ (pa + pb )2 /c2 = (p1 + p2 )2 /c2 , t ≡ (pa − p1 )2 /c2 = (pb − p2 )2 /c2 , (V.4) 2 2 2 2 u ≡ (pa − p2 ) /c = (pb − p1 ) /c . 26 Gerade diese Beobachtung hat Wolfgang Pauli 1930 veranlasst, die Existenz des (Anti-)Neutrinos zu postulieren, um das kontinuierliche Energiespektrum der in β-Zerfällen emittierten Elektronen zu erklären. Wechselwirkende Teilchen 50 N.BORGHINI Elementarteilchenphysik Die Variable s ist gleich 1/c4 mal dem Quadrat der Schwerpunktsenergie Ecms der kollidierenden Teilchen, während t den Quadrat des Viererimpuls-Übertrags geteilt durch c2 darstellt. Insbesondere gilt im Schwerpunktsystem eines elastischen Stoßes Ea = E1 , d.h. t = −|~ pa − p~1 |2 . Definitionsgemäß sind die drei Mandelstam-Variablen Lorentz-invariant. Sie sind nicht unabhängig voneinander, da im allgemeinen Fall eines Zwei-nach-zwei-Prozesses gilt s + t + u = m2a + m2b + m21 + m22 . (V.5) Im besonderen Fall einer elastischen Kollision lautet diese Gleichung s + t + u = 2m2a + 2m2b . Beweis der Beziehung (V.5): Die Definitionen (V.4) liefern s + t + u = 3m2a + m2b + m21 + m22 + 2pa · (pb − p1 − p2 )/c2 . Unter Verwendung des Viererimpulserhaltung gilt pb − p1 − p2 = −pa , woraus das Ergebnis folgt. Wechselwirkende Teilchen 51 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik VI. Zerfälle Dieses Kapitel behandelt die erste Art von elementaren Prozessen bei wechselwirkenden Teilchen, und zwar den Zerfall instabiler Teilchen. In Abschn. VI.1 werden einige wichtigen auf Zerfälle bezogenen Begriffe eingeführt. Dann geht Abschn. VI.2 auf die Berechnung der Zerfallsrate ein, verdeutlicht am Beispiel eines vereinfachten Modells für die Wechselwirkung. VI.1 Definitionen Eine erste wichtige Eigenschaft von instabilen Teilchen ist die Lebensdauer τ . Genauer sollte man von der mittleren Lebensdauer sprechen, da die Lebensdauer eines einzigen Teilchens nicht vorhersagbar ist, weil es sich bei dem Zerfall um einen quantenmechanischen Prozess handelt. Meist wird diese mittlere Lebensdauer τ für ein ruhendes Teilchen angegeben.27 Eine verwandte Größe ist die Zerfallsrate, entsprechend der Wahrscheinlichkeit pro Zeiteinheit, dass ein Zerfall stattfindet. Diese Zerfallsrate wird üblicherweise als Γ bezeichnet. Damit lautet das Zerfallsgesetz für die Abnahme der Teilchenzahl N (t) zwischen den Zeiten t und t + dt: dN = −ΓN (t) dt, 1 was sich sofort integrieren lässt als N (t) = N (0) e−Γt . Somit findet man einfach, dass Γ = gilt. τ Oft kann ein gegebenes Teilchen in mehrere verschiedene Mengen an Zerfallsprodukten zerfallen. Jede solche mögliche Art von Zerfallsprodukten wird Zerfallskanal genannt. Wird ein Zerfallskanal als j beschrieben, so definiert man Xdie (partielle) Zerfallsrate in diesen Kanal, Γj . Für die Gesamtzerfallsrate gilt natürlich Γtot = Γj . j Dazu definiert man das Verzweigungsverhältnis in einen Kanal als Γj /Γtot . Je größer dieses Verzweigungsverhältnis ist, desto mehr Zerfälle in den zugehörigen Kanal führen. VI.2 Berechnung der Zerfallsrate Jetzt wird das Prinzip der Berechnung der Zerfallsrate dargestellt und an einem vereinfachten Beispiel verdeutlicht. VI.2.1 Streumatrix Im Anfangszustand eines Zerfalls befindet sich ein Teilchen mit Masse m und Viererimpuls p, beschrieben durch den Zustandsvektor |ii eines geeigneten Hilbert-Raums. Der Endzustand besteht aus Zerfallsprodukten mit jeweiligen Massen m1 , m2 . . . und Viererimpulsen p1 , p2 . . . : diese werden kollektiv durch einen Zustandsvektor |fi dargestellt. Sowohl |ii als |fi sind Eigenvektoren eines Hamilton-Operators Ĥ0 , entsprechend freien Teilchen.28 Der gesamte Hamilton-Operator für diese Teilchen enthält aber auch Wechselwirkungen und ist also der Form Ĥ = Ĥ0 + g V̂ , mit g V̂ einem Wechselwirkungsterm, der Übergänge zwischen den Eigenzuständen von Ĥ0 induzieren kann. Die Zeitentwicklung eines Zustandsvektors lässt sich dann mithilfe des mit Ĥ assoziierten Zeitentwicklungsoperators Û (t, t0 ) beschreiben. Insbesondere ist die Wahrscheinlichkeitsamplitude dafür, dass das System von Teilchen sich zur Zeit t0 im Zustand |ii 27 Natürlich stellt sich dann die Frage, ob masselose Teilchen, die kein Ruhesystem haben, instabil sein können — was im Standard-Modell nicht passiert. Kinematisch darf ein solches Teilchen in zwei oder mehr masselose Teilchen zerfallen, vorausgesetzt diese sich kollinear zum Mutterteilchen bewegen. Dann kann man zeigen, dass die mittlere Lebensdauer τ in einem Bezugssystem, wo das Teilchen die Energie E hat, proportional zu dieser Energie ist [17], in Übereinstimmung mit dem Ergebnis für massive Teilchen, vgl. die Zerfallsrate (VI.18). 28 Dabei stehen die Bezeichnungen i und f für „initial“ und „final“. VI. Zerfälle 52 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik und zur späteren Zeit t im Zustand |fi befindet, einfach durch das Matrixelement hf| Û (t, t0 )|ii gegeben. Man definiert die Streumatrix Ŝ, auch S-Matrix genannt, durch die Angabe deren Matrixelemente Sfi ≡ f Û (+∞, −∞) i . (VI.1) Dieser Definition nach sind die wechselwirkungsfreien Anfangs- und Endzustände sog. asymptotische Zustände, die nur in der unendlichen Vergangenheit bzw. in der unendlichen Zukunft zu finden sind. Bemerkung: Man kann zeigen, dass die Streumatrix unitär ist. Die Berechnung der Streumatrix bzw. deren Elemente erfolgt normalerweise in der Quantenfeldtheorie. Hiernach wird das Prinzip der Berechnung ausgehend von nicht-relativistischer Quantenmechanik illustriert. VI.2.2 Zeitabhängige Störungstheorie In diesem Abschnitt wird die Übergangswahrscheinlichkeitsamplitude zwischen einem Anfangsund einem Endzustand eines nicht-relativistischen quantenmechanischen Systems mithilfe der sog. zeitabhängigen Störungstheorie, formuliert im Wechselwirkungsbild, dargestellt. VI.2.2 a Wechselwirkungsdarstellung :::::::::::::::::::::::::::::::::::: Ein System sei durch den Hamilton-Operator Ĥ(t) = Ĥ0 + g V̂ (t) beschrieben, wobei Ĥ0 zeitunabhängig ist, während der Term g V̂ (t) eine „Wechselwirkung“ beschreibt. Insbesondere kann das System unter dem Einfluss von g V̂ (t) von einem Eigenzustand zu Ĥ0 in einen anderen übergehen. Dabei wird üblicherweise angenommen, dass der Wechselwirkungsterm langsam („adiabatisch“) ein- und ausgeschaltet werden kann, entsprechend dessen Zeitabhängigkeit, damit ein Eigenzustand zu Ĥ0 auch Eigenzustand zu Ĥ(t) zu gegebenen Zeiten t ist. Solche Feinheiten werden in der kurzen Diskussion dieses Abschnitts ignoriert.29 Um solche Übergangswahrscheinlichkeiten zu berechnen, lohnt es sich, das Problem in der Wechselwirkungsdarstellung zu betrachten, entsprechend Zustandsvektoren |ψ(t)iI ≡ eiĤ0 t/~ |ψ(t)iS , (VI.2a) ÂI (t) ≡ eiĤ0 t/~ ÂS e−iĤ0 t/~ , (VI.2b) und Observablen mit |ψ(t)iS bzw. ÂS dem Zustandsvektor bzw. der Observable in der Schrödinger-Darstellung. Ausgehend von der Schrödinger-Gleichung in der Schrödinger-Darstellung zeigt man einfach, dass die Bewegungsgleichung für |ψ(t)iI lautet i~ ∂ |ψ(t)iI = g V̂I (t)|ψ(t)iI ∂t mit V̂I (t) ≡ eiĤ0 t/~ V̂ (t) e−iĤ0 t/~ , (VI.3) d.h. die zeitliche Entwicklung von |ψ(t)iI wird bestimmt durch den Wechselwirkungsterm g V̂I (t) allein. Die formale Lösung zu dieser Gleichung für eine gegebene Anfangsbedingung |ψ(t0 )iI lässt sich durch den Zeitentwicklungsoperator ÛI (t, t0 ) ausdrücken: |ψ(t)iI = ÛI (t, t0 )|ψ(t0 )iI . (VI.4) Setzt man diese Form in Gl. (VI.3) ein, so findet man, dass ÛI (t, t0 ) der Gleichung i~ ∂ ÛI (t, t0 ) = g V̂I (t) ÛI (t, t0 ) ∂t (VI.5a) genügt, mit der Randbedingung ÛI (t0 , t0 ) = 1̂. 29 (VI.5b) Für eine Diskussion dieser „adiabatischen Näherung“ s. z.B. Griffiths [18] Kap. 10.1. VI. Zerfälle 53 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik VI.2.2 b Störungsrechnung des Zeitentwicklungsoperators ::::::::::::::::::::::::::::::::::::::::::::::::::::::: Die Integration von Gl. (VI.5) nach t liefert die Integralgleichung Z ig t V̂I (t0 ) ÛI (t0 , t0 ) dt0 . ÛI (t, t0 ) = 1̂ − ~ t0 Z 0 ig t 0 Ersetzt man ÛI (t , t0 ) im Integranden durch 1̂ − V̂I (t00 ) ÛI (t00 , t0 ) dt00 , so ergibt sich ~ t0 Z ig t ÛI (t, t0 ) = 1̂ − V̂I (t0 ) dt0 + O g 2 . ~ t0 (VI.6) (VI.7) Allgemeiner kann Gl. (VI.6) iterativ gelöst werden. Dies liefert die Dyson-Reihe Z Z t Z t0 ∞ X g2 g t (k) 0 0 0 00 00 0 V̂I (t ) dt + V̂ (t ) ÛI (tf , ti ) = 1̂ + V̂ (t ) dt dt + . . . ≡ ÛI (t, t0 ), I I i~ t0 (i~)2 t0 t0 k=0 Z t g (k−1) 0 (0) (k) 0 0 V̂I (t ) ÛI (t , t0 ) dt . Explizit gilt mit ÛI (t, t0 ) = 1̂ und ÛI (t, t0 ) = i~ t0 Z tk Z t2 Z t gk (k) V̂I (t1 ) dt1 dt2 · · · dtk ÛI (t, t0 ) = V̂I (tk ) ··· (i~)k t0 t0 t0 Z Z gk = · · · V̂I (tk ) · · · V̂I (t1 ) dt1 · · · dtk , (i~)k t≥tk ≥···≥t1 ≥t0 (k) ÛI d.h., ist der Ordnung k in der Störung g V̂I (t). Dabei sind die Operatoren so angeordnet, dass der mit dem größten Zeitargument ganz links steht, der mit dem zweitgrößten an zweiter Stelle von links steht, usw. — die Ordnung ist wichtig, da i.A. [V̂I (t), V̂I (t0 )] 6= 0 für t 6= t0 . Das Volumen des k-dimensionalen Bereichs t0 ≤ t1 ≤ · · · ≤ tk ≤ t ist eigentlich 1/k! mal dem Volumen des Bereichs t0 ≤ tj ≤ t für j = 1, . . . , k. Es gilt also Z t Z t 1 gk (k) ÛI (t, t0 ) = · · · T V̂I (tk ) · · · V̂I (t1 ) dt1 · · · dtk , k k! (i~) t0 t0 wobei das zeitgeordnete Produkt T (· · · ) die zeitliche Anordnung der Operatoren gewährleistet in Bereichen, wo tj+1 < tj für mindestens einen Wert von j. Es folgt dann nach Summation der Dyson-Reihe Z ig t VI (t0 ) dt0 . ÛI (t, t0 ) = T exp − ~ t0 Für weitere Details, vgl. ein Lehrbuch über Quantenmechanik, wie z.B. Griffiths [18] Kap. 9.1 oder Messiah, Band 2 [19], Anfang des Kapitels 17 (bis einschließlich §17.1.1). VI.2.3 Vereinfachtes Modell Der Einfachheit halber wird jetzt der Zerfall eines als ρ bezeichneten skalaren Teilchens mit Masse m und Viererimpuls p in zwei ebenfalls skalare Teilchen betrachtet, wobei die Zerfallsprodukte ein Teilchen π + (Masse m1 , Viererimpuls p1 ) und dessen Antiteilchen π − (Masse m2 = m1 , Viererimpuls p2 ) sind. Der Feldoperator für einlaufende ρ-Teilchen wird durch Gl. (II.11a) gegeben: Z h i ~c d3 ~q (ρ) (ρ)† φ̂ρ (x) = âq~ e−iq·x/~ + âq~ eiq·x/~ p , (VI.8) (2π~)3 2Eq~ wobei benutzt wurde, dass das ρ-Teilchen sein eigenes Antiteilchen ist.30 Zur Beschreibung der auslaufenden π + -Teilchen, die erzeugt werden sollen, gibt Gl. (II.11b) Z h i ~c d3 ~q1 (π)† (π) † φ̂π (x) = âq~1 eiq1 ·x/~ + b̂q~1 e−iq1 ·x/~ p . (VI.9) (2π~)3 2Eq~1 30 Jede erhaltene innere Quantenzahl des ρ ist gleich der Summe der entsprechenden Quantenzahlen für die π + und π , bei denen die Zahl mit entgegengesetzten Vorzeichen vorkommt, so dass die Summe verschwindet. Das ρ kann also keine innere Quantenzahl haben, und somit kein verschiedenes Antiteilchen. − VI. Zerfälle 54 N.BORGHINI Elementarteilchenphysik Wechselwirkende Teilchen Schließlich lautet der Feldoperator für die auslaufenden π − -Antiteilchen Z h i ~c d3 ~q2 (π) (π)† . φ̂π (x) = âq~2 e−iq2 ·x/~ + b̂q~2 eiq2 ·x/~ p (2π~)3 2Eq~2 (VI.10) Bemerkung: Das eigentliche ρ-Meson hat den Spin 1, nicht den Spin 0, wie hier der Einfachheit halber angenommen wird. Für den Wechselwirkungsterm im Hamilton-Operator wird die folgende vereinfachte Form in Abhängigkeit der obigen Feldoperatoren angenommen: Z M √ φ̂π (t, ~x)† φ̂π (t, ~x) φ̂ρ (t, ~x) d3 ~x, g V̂I (t) ≡ (VI.11) ~ ~c wobei die Amplitude M ∈ C zeit- und ortsunabhängig ist. Der Anfangszustand |ii des untersuchten Zerfalls besteht aus ρ-Teilchen mit Viererimpuls p. Ein (ρ)† solcher Zustand lässt sich durch die Wirkung des Erzeugungsoperators âp~ auf den Vakuumzustand erhalten: (ρ)† |ρ(~ p)i = âp~ |0i. (VI.12) Dieser Zustandsvektor ist aber nicht auf 1 normiert, sondern auf hρ(~ p)|ρ(~ p)i = δ 3 (~0) = V (2π~)3 , (VI.13) mit V dem (möglicherweise unendlichen) dreidimensionalen Volumen, in dem die ρ-Teilchen bzw. die zugehörige ebene Welle sich befinden. Dies wiederum bedeutet, dass der Zustandsvektor |ρ(~ p)i nicht ein einziges Teilchen, sondern V /(2π~)3 davon beschreibt. Beweis der Gl. (VI.13): Die erste Gleichung folgt aus (ρ) (ρ)† (ρ) (ρ)† (ρ)† (ρ) p − p~ 0 )0 , hρ(~ p)|ρ(~ p 0 )i = 0 âp~ âp~ 0 0 = 0 âp~ , âp~ 0 + âp~ 0 âp~ 0 = 0δ (3) (~ wobei der Kommutator (II.10a) verwendet wurde, sowie die Normierung auf 1 des Vakuumzustands. Die zweite Gleichung entspricht einfach der Tatsache, dass die Dirac-Distribution die FourierZ transformierte von 1 ist: 2πδ(k) = eikx dx, d.h. 2πδ(0) = L, Volumen des (hier eindimensionalen) Raums. Um festzustellen, wie viele Teilchen durch den Zustandsvektor beschrieben werden, soll man den Erwartungswert des Teilchenzahloperators N̂ (ρ) in diesem Zustand berechnen. Dabei ist N̂ (ρ) (ρ) (ρ)† (ρ) das Integral über alle mögliche Impulse p~ 0 von dem Besetzungszahloperator N̂p~ 0 = âp~ 0 âp~ 0 . Z Dann hat man (ρ) (ρ)† (ρ) (ρ)† 3 0 hρ(~ p)| N̂ (ρ) |ρ(~ p)i = 0 âp~ âp~ 0 âp~ 0 âp~ 0 d p~ . Schreibt man für die zwei letzten Leiteroperatoren rechts (ρ) (ρ)† (ρ)† (ρ) (ρ)† (ρ) (ρ) (ρ)† p 0 − p~) 1̂ + âp~ âp~ 0 âp~ 0 âp~ = âp~ 0 , âp~ + âp~ âp~ 0 = δ (3) (~ Z (ρ) (ρ)† (ρ) (ρ)† (3) 0 so kommt hρ(~ p)| N̂ (ρ) |ρ(~ p)i = 0 âp~ âp~ 0 0 δ (~ p − p~) d3 p~ 0 = h0 âp~ âp~ 0 = hρ(~ p)|ρ(~ p)i. Ähnlich dem Anfangszustand lautet der Zustandsvektor für den Endzustand (π)† (π)† |π + (~ p1 ) π − (~ p2 )i = âp~1 b̂p~2 |0i, d.h. (π) (π) hπ + (~ p1 ) π − (~ p2 )| = h0| b̂p~2 âp~1 . (VI.14) Mit dem annähernden Ausdruck (VI.7) des Zeitentwicklungsoperators lautet das Streumatrixelement (VI.1) Z ig ∞ V̂I (t0 ) dt0 i I + O g 2 . (VI.15) Sfi = I f ÛI (∞, −∞) i I = δfi − I f ~ −∞ VI. Zerfälle 55 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik Im jetzigen Fall von Interesse sind Anfangs- und Endzustand unterschiedlich, so dass der erste nicht-verschwindende Beitrag durch den Term der Ordnung g gegeben ist. Unter Verwendung des Wechselwirkungsterms (VI.11) kommt Z i + M − √ φ̂π (t, ~x)† φ̂π (t, ~x) φ̂ρ (t, ~x) d3 ~x dt ρ(~ Sfi = − π (~ p1 ) π (~ p2 ) p) . ~ ~ ~c Das Einsetzen der Feldoperatoren (VI.8)–(VI.10) und der Zustandsvektoren (VI.12), (VI.14) in dieses Matrixelement gibt Z (~c)5/2 M i p p Sfi = − 2 p ei(p1 +p2 −p)·x/~ d3 ~x dt. ~ (2π~)3 2Ep~ (2π~)3 2Ep~1 (2π~)3 2Ep~2 Durch dieses Einsetzen erhält man das Integral nach Zeit und Raum von Integralen nach den Impulsen ~q, ~q1 , ~q2 von Termen der Art ( (ρ) )( (π) )( (π) ) −iq·x/~ b̂q~1 e−iq1 ·x/~ âq~2 e−iq2 ·x/~ (ρ)† (π) (π) âq ~ e h0| b̂p~2 âp~1 âp~ |0i, (ρ)† (π)† (π)† âq~ eiq·x/~ âq~1 eiq1 ·x/~ b̂q~2 eiq2 ·x/~ wobei die geschweiften Klammern bedeuten, dass einer der beiden Operatoren genommen werden (ρ) (π)† (π)† soll. Der einzige nicht-verschwindende Beitrag kommt vom Term mit âq~ âq~1 b̂q~2 — für jede Teilchen- und Antiteilchenart muss es die gleiche Zahl von Vernichtern und Erzeugern geben — entsprechend dem Phasenfaktor ei(q1 +q2 −q)·x/~ . Benutzt man dann Gleichungen der Form (ρ) (ρ)† (ρ) (ρ)† (ρ)† (ρ) (ρ)† (ρ) âq~ âp~ = âq~ , âp~ + âp~ âq~ = δ (3) (~ p − ~q)1 + âp~ âq~ , wobei der letztere Term angewandt auf den Vakuumzustand Null geben wird, so findet man (π) (π) (ρ) (π)† (π)† (ρ)† h0| b̂p~2 âp~1 âq~ âq~1 b̂q~2 âp~ |0i = δ (3) (~ p − ~q) δ (3) (~ p1 − ~q1 ) δ (3) (~ p2 − ~q2 ). Dann sind die Integrale über ~q, ~q1 , ~q2 trivial und liefern das Resultat. Die Integration nach t und ~x lässt sich einfach durchführen und liefert eine Dirac-Distribution M p p Sfi = −i (2π)4 δ (4) (p1 + p2 − p) p 3 (2π) 2Ep~ /c (2π)3 2Ep~1 /c (2π)3 2Ep~2 /c (VI.16) ≡ −i (2π)4 δ (4) (p1 + p2 − p) Tfi , mit Tfi dem Transfermatrixelement. Dabei kommt die Erhaltung des Viererimpulses, ausgedrückt durch den δ (4) (p1 + p2 − p)-Term, automatisch heraus! Die Wahrscheinlichkeit für den Zerfall des Anfangszustands wird durch den Betragsquadrat der Amplitude (VI.16) gegeben: |Sfi |2 = (2π)4 δ (4) (p1 + p2 − p) (2π)4 δ (4) (0) |M|2 . (2π)3 2Ep~ /c (2π)3 2Ep~1 /c (2π)3 2Ep~2 /c Hier stellt δ (4) (0) das vierdimensionale Raumzeitvolumen dar, in dem die Teilchen sich bewegen können. Ähnlich wie im zweiten Teil der Gl. (VI.13) gilt δ (4) (0) = V cT /(2π~)4 , mit V bzw. T dem dreidimensionalen Volumen, in dem die Teilchen sich befinden, bzw. der Zeitspanne, in der der Zerfall stattfinden kann. Die Zerfallsrate für den betrachteten Anfangszustand ist die Wahrscheinlichkeit pro Zeiteinheit, also |Sfi |2 /T , integriert über alle möglichen Impulse der auslaufenden Teilchen: Z V c2 |M|2 c d3 p~1 c d3 p~2 4 (4) Γ |ii→··· = (2π) δ (p + p − p) . 1 2 (2π)3 ~4 2Ep~ (2π)3 2Ep~1 (2π)3 2Ep~2 Dabei ist aufzupassen, dass diese Rate für einen Anfangszustand gilt, der V /(2π~)3 Teilchen enthält, wie oben bemerkt wurde. Um die Übergangsrate für einen auf 1 normierten Anfangszustand, VI. Zerfälle 56 N.BORGHINI Elementarteilchenphysik Wechselwirkende Teilchen entsprechend einem einzigen zerfallenden Teilchen, zu kriegen, soll man deshalb durch V /(2π~)3 teilen. Somit lautet die gesuchte Zerfallsrate Z c2 c d3 p~1 c d3 p~2 Γ= (2π)4 δ (4) (p1 + p2 − p)|M|2 . (VI.17) 2~Ep~ (2π)3 2Ep~1 (2π)3 2Ep~2 Dieses Resultat stellt ein Beispiel von Fermis Goldene Regel für Zerfälle dar. Im allgemeinen Fall mit n Teilchen im Endzustand ist die Zerfallsrate gegeben durch X Z n n Y c2 c d3 p~i 4 (4) Γ= C (2π) δ pi − p |M|2 . 2~Ep~ (2π)3 2Ep~i i=1 (VI.18) i=1 Abgesehen von numerischen Faktoren besteht diese Zerfallsrate aus drei Elementen, die jetzt diskutiert werden. • Erstens ist C ein statistischer Faktor, der die mögliche Ununterscheidbarkeit einiger der auslaufenden Teilchen berücksichtigt: für je j identische Teilchen im Endzustand bekommt C einen Faktor 1/j!. • Dann wird die Amplitude M durch den eigentlichen Wechselwirkungen festgestellt: hier spielt die Dynamik der Teilchen eine Rolle — welchen Wechselwirkungen unterliegen sie, welche Werte nehmen deren innere Quantenzahlen an —, sowie ihre Natur — handelt es sich um Teilchen mit Spin 0, 21 oder 1. . . • Schließlich kommt eine Phasenraumintegration X Y Z n n 4 (4) (2π) δ pi − p i=1 i=1 c d3 p~i , (2π)3 2Ep~i (VI.19) wobei die Erhaltung des Viererimpulses schon berücksichtigt wird. Dabei lässt sich das Maß für die Integration im Impulsraum eines einzigen Teilchens in der Lorentz-invarianten Form Z Z 4 c d3 p~i 2 2 2 0 d pi = 2πδ(p − m c ) Θ(p ) (VI.20) i i i (2π)3 2Ep~i (2π)4 schreiben, wobei Θ die Heaviside-Funktion bezeichnet. Somit enthält die Phasenraumintegration auch die Bedingung, dass alle auslaufenden (Anti-)Teilchen „on-Shell-Teilchen“ sind, mit einer positiven Energie. Bemerkungen: ∗ Ist die Amplitude M ein Lorentz-Skalar, so ist das ganze Integral in Gl. (VI.18) Lorentz-invariant, und die Zerfallsrate Γ skaliert unter Lorentz-Transformationen wie der Kehrwert der Energie Ep~ , d.h. wie der Kehrwert des Lorentz-Faktors γ. Dann skaliert die mittlere Lebensdauer τ einfach proportional zu γ. . . was zu erwarten war. ∗ Im Ruhesystem des zerfallenden Teilchens vereinfacht sich der Faktor c2 /Ep~ in Gl. (VI.18) zu 1/m. ∗ Die Phasenraumintegration lässt sich für einen Zwei-Teilchen-Zerfall komplett ausführen dank der Tatsache, dass die Kinematik in diesem Fall völlig festgestellt ist, wie in Abschn. V.2 schon gesehen wurde. Literatur • Griffiths [15], Kap. 6.1.1 & 6.2.1. VI. Zerfälle 57 N.BORGHINI Elementarteilchenphysik Wechselwirkende Teilchen VII. Streuprozesse In diesem Kapitel werden Streuprozesse, d.h. Teilchenstöße, diskutiert. Nach der Einführung von ein paar Begriffen (Abschn. VII.1) wird das Prinzip der Berechnung des Wirkungsquerschnitts in Abschn. VII.2 dargestellt, mithilfe eines Beispiels ähnlich dem vereinfachten Zerfallsprozess im vorigen Kapitel. Hiernach werden nur Kollisionen zwischen zwei Teilchen a und b betrachtet, mit zwei oder mehr Teilchen 1, 2, . . . im Endzustand. Prozesse mit drei oder mehr Teilchen im Anfangszustand, sowie solche mit nur einem Teilchen im Endzustand, sind tatsächlich in der Elementarteilchenphysik höchst unwahrscheinlich.31 VII.1 Grundbegriffe Dieser erste Abschnitt fasst die Definitionen von ein paar Grundbegriffen betreffend Streuprozesse zusammen. VII.1.1 Erste Definitionen Der Unterschied zwischen elastischen Streuungen — d.h. Prozesse der Art a + b → a0 + b0 — und inelastischen Streuungen — entweder der Art a + b → 1 + 2, entsprechend quasielastischen Streuungen, oder a + b → 1 + 2 + 3 + · · · — wurde schon in Abschn. V.4 eingeführt. Experimentell werden manchmal alle Streuprodukte gemessen und identifiziert, öfter sind aber nur Teil der Endteilchen bekannt, während die anderen uncharakterisiert bleiben. Dementsprechend soll man theoretisch einerseits exklusive Prozesse betrachten, in denen alle Teilchen im Endzustand vollständig charakterisiert sind, und andererseits inklusive Prozesse, in denen Teil der Streuprodukte nicht untersucht werden, wie z.B. a + b → 1 + „Rest“. Der Streuwinkel θ ist klassisch der Winkel, um den ein einlaufendes Teilchen abgelenkt wird, wie in Abb. VII.1 dargestellt wird. Allgemeiner wird er durch das Skalarprodukt zwischen den Impulsen eines einlaufenden und eines auslaufenden Teilchens definiert, hier ist z.B. θ der Winkel zwischen p~a und p~1 . Man sollte darauf aufpassen, dass der Streuwinkel vom Bezugssystem abhängt, in dem die Streuung untersucht wird. d2 Ω p~1 einlaufendes Teilchen p~a b auslaufendes Teilchen θ ϕ Streuzentrum Abbildung VII.1: Darstellung einiger Größen zur Charakterisierung eines Streuprozesses. Bemerkung: Mithilfe der in Gl. (V.4) definierten Mandelstam-Variable t findet man die Beziehung t − m2a − m21 + 2Ea E1 /c4 . (VII.1) cos θ = 2|~ pa ||~ p1 |/c2 31 Für Prozesse des Typs a + b → 1 ist die Kinematik gerade die gleiche wie beim Zwei-Teilchen-Zerfall, so dass der Prozess nur dann zu einem on-Shell-Teilchen führen kann, wenn die einlaufenden Teilchen genau bestimmte Energien und Impulse haben. VII. Streuprozesse 58 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik Im besonderen Fall einer elastischen Streuung gilt im Schwerpunktsystem der einlaufenden Teilchen, wo Ea = E1 ist, die einfache Relation t = −2|~ pa |2 (1 − cos θ)/c2 . Im Stoß klassischer Teilchen definiert man noch den Stoßparameter b, entsprechend dem minimalen Abstand der einlaufenden Teilchen für den fiktiven Fall, wo sie sich geradlinig bewegen würden, statt abgelenkt zu werden. In der Quantenmechanik, wo Teilchen keiner Bahnkurve folgen, verliert dieser Begriff an Bedeutung. VII.1.2 Wirkungsquerschnitt. Luminosität Die Wahrscheinlichkeit, dass ein Streuprozess stattfindet, wird in der Teilchenphysik mithilfe des Wirkungsquerschnitts charakterisiert. Klassisch handelt es sich dabei um die (effektive) Schnittfläche des Ziels — entsprechend hier dem zweiten einlaufenden Teilchen bzw. dem Streuzentrum — aus der Sicht eines einlaufenden Teilchens. Dies wird unten am Beispiel der Streuung eines klassischen Teilchens an einer harten Kugel illustriert. In der Quantenmechanik entspricht der Begriff einer ähnlichen Größe, die aber von der Energie bzw. der Geschwindigkeit des einlaufenden Teilchens abhängt. Insbesondere können bei bestimmten Energien sog. Resonanzen auftreten, bei denen die Streuwahrscheinlichkeit stark wächst — das Ziel wird bei diesen Resonanzenergien als größer gesehen. Für eine genaue Definition des Wirkungsquerschnitts soll man zuerst die Anzahl der Teilchen betrachten, die in einem (Gedenk-)Streuexperiment pro Zeit- und pro Raumwinkeleinheit in eine Richtung (θ, ϕ) ≡ Ω gestreut werden, wobei die Winkeln in Abb. VII.1 definiert sind. Diese Anzahl sei als d3Naus (θ, ϕ)/dt d2 Ω bezeichnet. Dazu wird die Luminosität Lein als die Anzahl der einlaufenden Teilchen, die pro Zeiteinheit durch die Einheitsfläche fließen, definiert. Dann ist der differentielle Wirkungsquerschnitt durch die Beziehung d2 σ(θ, ϕ) 1 d3Naus (θ, ϕ) ≡ d2 Ω Lein dt d2 Ω (VII.2) definiert. Anders gesagt ist die Ereignisrate in eine gegebene Richtung gleich dem Produkt der Luminosität mit dem differentiellen Wirkungsquerschnitt, wobei ein Ereignis hier die Streuung eines Teilchens in die Richtung bezeichnet. Der totale Wirkungsquerschnitt ist dann das Integral des differentiellen Wirkungsquerschnitts über alle Raumwinkel Z 2 Z 2πZ π 2 d σ(θ, ϕ) d σ(θ, ϕ) 2 σtot ≡ d Ω = sin θ dθ dϕ. (VII.3) 2 d Ω d2 Ω 0 0 Dementsprechend ist die gesamte Ereignisrate gleich dem Produkt der Luminosität mit dem totalen Wirkungsquerschnitt dNaus = Lein σtot . (VII.4) dt Da die Ereignisrate die Dimension einer Rate (!) [T −1 ] und die Luminosität die Dimension einer Teilchenstromdichte [L−2 T −1 ] hat, haben Wirkungsquerschnitte die Dimension L2 einer Fläche. In der Teilchenphysik wird statt des m2 der barn benutzt, wobei 1 b = 10−28 m2 = (10 fm)2 . Bemerkungen: ∗ Der Winkel zwischen zwei Impulsen hängt allgemein vom Bezugssystem ab, insbesondere der Streuwinkel. Dementsprechend hängt der differentielle Wirkungsquerschnitt vom Bezugssystem ab. Dagegen ist der totale Wirkungsquerschnitt σtot eine Lorentz-invariante Größe, da es nur eine richtungsunabhängige Zahl charakterisiert. VII. Streuprozesse 59 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik ∗ Bei der oben eingeführten Luminosität Lein handelt es sich tatsächlich um die instantane Luminosität. Diese kann auch integriert über die Dauer eines Experiments werden, was die integrierte Luminosität liefert. Beispielsweise wurde das Large Hadron Collider am CERN entwickelt, um eine instantane Luminosität in Proton–Proton-Stößen von 1034 cm−2 s−1 = 104 µb−1 s−1 zu erreichen. In der zweiten Hälfte von 2012 wurde routinemäßig eine instantane Luminosität von ca. 7000 µb−1 s−1 erreicht.32 Dazu betrug die in über die Periode 2010–2012 integrierte Luminosität in Proton–Proton-Kollisionen im ATLAS-Experiment ca. 25 fb−1 . Luminosität in Teilchenstößen Betrachte den Stoß zweier Teilchen a und b, wobei der Endzustand für die Diskussion beliebig sein kann. Es wird angenommen, dass eines der Teilchen, z.B. Teilchen b, eine nichtverschwindende Masse hat. Dann kann man in dessen Ruhesystem gehen: a b va -~ • • Sei jetzt angenommen, dass es im Volumen V , wo die Teilchen sich befinden, nur ein einziges Teilchen a und ein einziges Teilchen b gibt. Dann ist die Luminosität der einlaufenden Welle, die das Teilchen a beschreibt, gegeben durch 1 Lein = ~va , (VII.5) V wobei 1/V die durchschnittliche Teilchendichte der einlaufenden Teilchen darstellt. Beispiel: Streuung an einer harten Kugel Im Fall der Streuung eines klassischen Teilchens an einer festen harten Kugel mit dem Radius R sind der Stoßparameter b und der Streuwinkel θ einfach miteinander verknüpft. Somit findet man für b ≤ R (vgl. Abb. VII.2) b = R sin α mit 2α = π − θ, d.h. b = R cos 2θ . Hier ist das Problem azimutal symmetrisch. α b α θ α Abbildung VII.2: Streuung an einer harten Kugel. Sei θ ∈ [0, π]; die Teilchen, die um einen Winkel zwischen θ und θ + dθ gestreut werden, sind solche, die mit einem Stoßparameter zwischen b und b + db auf die Kugel stoßen, wobei R θ θ = − sin dθ. db = d R cos 2 2 2 Sei Nein die Anzahl der einlaufenden Teilchen, entsprechend einer Teilchendichte Nein /V . Wenn diese Teilchen alle dieselbe Geschwindigkeit vein haben, dann lautet die Luminosität Lein = Nein vein /V . Dazu bleibt die Geschwindigkeit der Teilchen unverändert in der Streuung, so dass die Anzahl der in die Richtung (θ, ϕ) gestreuten Teilchen pro Zeit- und Raumwinkeleinheit durch d3Naus (θ, ϕ) 1 Nein = vein |b db dϕ| 2 dt d Ω dΩ V gegeben ist, mit dΩ = sin θ dθ dϕ. Unter Berücksichtigung der Ausdrücke für b, db und die Lumi32 Diese Information kann online auf der LHC luminosity Webseite gefunden werden. VII. Streuprozesse 60 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik nosität findet man R cos 2θ · R2 sin 2θ dθ d3Naus (θ, ϕ) R2 = L = L , ein ein dt d2 Ω sin θ dθ 4 R2 d2 σ(θ, ϕ) = für alle θ ∈ [0, π] und entsprechend einem differentiellen Wirkungsquerschnitt d2 Ω 4 ϕ ∈ [0, 2π]. Dies gibt einen totalen Wirkungsquerschnitt σtot = πR2 , d.h. gleich der Schnittfläche der Kugel. VII.2 Berechnung des Wirkungsquerschnitts Ähnlich der Zerfallsrate in Abschn. VI.2 lässt sich der Wirkungsquerschnitt mithilfe von Fermis Goldener Regel schreiben. Somit beruht der totale Wirkungsquerschnitt auf dem Phasenraumintegral einer Amplitude zum Quadrat über die Impulse der auslaufenden Teilchen (Abschn. VII.2.1). Dieses Integral wird mit einem Vorfaktor multipliziert, dem sog. Møller-Flussfaktor, der in Abschn. VII.2.2 diskutiert wird. Wenn es nur zwei Teilchen im Endzustand kann das Phasenraumintegral weitgehend ohne Kenntnisse über die zugrundeliegende Wechselwirkung durchgeführt werden (Abschn. VII.2.3), woraus der differentielle Wirkungsquerschnitt folgt. VII.2.1 Fermis Goldene Regel für Streuprozesse Betrachte z.B. den Zwei-nach-zwei-Prozess a + b → 1 + 2, mit pa , pb , p1 , p2 den Viererimpulsen der Teilchen. Der Einfachheit halber wird angenommen, dass die einlaufenden bzw. auslaufenden Teilchen nicht identisch sind, und dass sie den Spin 0 haben. Die einlaufenden Teilchen werden durch einen Zustandsvektor |a(~ pa ), b(~ pb )i beschrieben, der sich durch Anwendung von geeigneten Erzeugungsoperatoren auf den Vakuumzustand erhalten lässt. Deshalb ist dieser Zustandsvektor auf [δ (3) (~0)]2 = [V /(2π~)3 ]2 normiert. Wiederum entsprechen die auslaufenden Teilchen einem Endzustand h1(~ p1 ), 2(~ p2 )|. Beide Anfangs- und Endzustand sind Eigenzustände zu einem wechselwirkungsfreien Hamilton-Operator Ĥ0 . Der Prozess unter Berücksichtigung erfolgt aus dem Einschalten eines zusätzlichen Wechselwirkungsterms g V̂ (t) im Hamilton-Operator, mit Z M g V̂I (t) ≡ φ̂a (t, ~x) φ̂b (t, ~x) φ̂1 (t, ~x) φ̂2 (t, ~x) d3 ~x, (VII.6) ~c wobei die komplexwertige Amplitude M zeit- und ortsunabhängig ist, während φ̂i (x) für i = a, b, 1, 2 den mit Teilchen i assoziierten Klein–Gordon-Feldoperator bezeichnet. Zur ersten nicht-trivialen Ordnung in Störungsrechnung lautet das Streumatrixelement (VI.1) zwischen Anfangs- und Endzustand [vgl. (VI.15)] Z M i p1 ), 2(~ p2 ) φ̂a (t, ~x) φ̂b (t, ~x) φ̂1 (t, ~x) φ̂2 (t, ~x) d3 ~x dt a(~ Sfi = − 1(~ pa ), b(~ pb ) . ~ ~c Drückt man die Feldoperatoren durch die zugehörigen Vernichtungs- und Erzeugungsoperatoren aus, so findet man, dass die Wirkung von φ̂i (x) für auf den Anfangszustand p i = a oder b bzw. i = 1 oder 2 p bzw. Endzustand einen Term ~c e−ipi ·x/~ / (2π~)3 2Ep~i bzw. ~c e+ipi ·x/~ / (2π~)3 2Ep~i liefert, so dass Z i (~c)3 M p p p p Sfi = − ei(p1 +p2 −pa −pb )·x/~ d3 ~x dt. 3 3 3 3 ~ (2π~) 2Ep~a (2π~) 2Ep~b (2π~) 2Ep~1 (2π~) 2Ep~2 Die Integration nach Raum und Zeit gibt dann c2 M p p p Sfi = −i (2π)4 δ (4) (p1 + p2 − pa − pb ) p . (VII.7) (2π)3 2Ep~a (2π)3 2Ep~b (2π)3 2Ep~1 (2π)3 2Ep~2 Dieser Ausdruck des Streumatrixelements hat die gleiche Struktur wie in Gl. (VI.16), und insbesondere berücksichtigt automatisch die Energie–Impuls-Erhaltung. VII. Streuprozesse 61 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik Bildet man den Betragsquadrat dieses Streumatrixelements, so ergibt sich 2 c4 M 2 4 (4) 4 (4) , |Sfi | = (2π) δ (p1 + p2 − pa − pb ) (2π) δ (0) (2π)3 2Ep~a (2π)3 2Ep~b (2π)3 2Ep~1 (2π)3 2Ep~2 wobei (2π)4 δ (4) (0) gleich 1/~4 mal dem Raumzeitvolumen V cT ist, in dem die ein- und auslaufenden Teilchen propagieren. |Sfi |2 stellt die Wahrscheinlichkeit dafür dar, dass der Anfangszustand |a(~ pa ), b(~ pb )i nach einer Zeit T in den Endzustand h1(~ p1 ), 2(~ p2 )| gestreut wird. Um die entsprechende Wahrscheinlichkeit pro Zeiteinheit und für ein einziges Paar von einlaufenden Teilchen zu erhalten, soll man einfach |Sfi |2 durch T und durch die Normierung des Anfangszustands teilen. Somit lautet die Anzahl der pro Zeiteinheit mit Impulsen p~1 , p~2 auslaufenden Teilchen 2 M d7Naus (~ p1 , p~2 ) ~2 c3 1 4 (4) = (2π) δ (p + p − p − p ) . (VII.8) 1 2 a b dt d3 p~1 d3 p~2 V 4Ep~a Ep~b (2π)3 2Ep~1 /c (2π)3 2Ep~2 /c Aus dieser Formel, integriert über die passenden Variablen, lassen sich Ausdrücke für den differentiellen und den totalen Wirkungsquerschnitt herleiten. Dabei ist der Letztere zunächst einfacher zu erhalten, zumindest formell. Integriert man die Anzahl (VII.8) über alle möglichen Werte der auslaufenden Impulse, so ergibt sich die Anzahl der pro Zeiteinheit auslaufenden Teilchen 1 und 2 Z 2 c d3 p~1 ~2 c3 1 c d3 p~2 dNaus (2π)4 δ (4) (p1 + p2 − pa − pb )M = . dt V 4Ep~a Ep~b (2π)3 2Ep~1 (2π)3 2Ep~2 Diese Anzahl ist über Beziehung (VII.4) mit dem totalen Wirkungsquerschnitt und der Luminosität verknüpft. Um die Letztere zu ermitteln, kann man ins Ruhesystem von Teilchen b gehen — wobei angenommen wird, dass Teilchen b nicht masselos ist. In diesem Bezugssystem gilt Ep~b = mb c2 , während die Luminosität gemäß Gl. (VII.5) gleich Lein = ~va /V ist, mit ~va der Geschwindigkeit des Teilchens a. Dies gibt für den totalen Wirkungsquerschnitt Z 2 c d3 p~1 ~2 c c d3 p~2 σtot = (2π)4 δ (4) (p1 + p2 − pa − pb )M . (VII.9) (2π)3 2Ep~1 (2π)3 2Ep~2 4 ~va Ep~ mb a Diese Formel stellt noch ein mal ein Beispiel von Fermis Goldener Regel dar. Wie schon oben erwähnt wurde, soll der totale Wirkungsquerschnitt Lorentz-invariant 2 sein. Während das Integral deutlich Lorentz-invariant ist — vorausgesetzt das gilt auch für M , was hier ohne Beweis angenommen wird —, ist es für der Vorfaktor nicht sofort klar. Somit wird der Letztere im nächsten Abschnitt genauer untersucht. VII.2.2 Flussfaktor. Lorentz-invariante Form des totalen Wirkungsquerschnitts Das im Vorfaktor des totalen Wirkungsquerschnitts (VII.9) auftretende Produkt 4~va Ep~a mb /c, wobei ~va und Ep~a im Ruhesystem des Teilchens b gemessen werden, wird (Møller -) Flussfaktor genannt und hiernach als F bezeichnet. In einem beliebigen Ruhesystem, wo die Viererimpulse der kollidieren Teilchen pa und pb sind, gilt q F = 4 (pa · pb )2 − m2a m2b c4 . (VII.10) Ep~a /c Ep~b /c , pb = . Im Bezugssystem wo p~b = ~0, Ep~b = mb c2 gilt pa ·pb = Ep~a mb p~a p~b und somit pa |2 c2 m2b . (pa · pb )2 − m2a m2b c4 = Ep~2a − m2a c4 m2b = |~ Seien pa = Dies gibt F = 4|~ pa |c mb = 4 VII. Streuprozesse |~va | |~ pa |c Ep~a mb = 4 Ep~a mb . Ep~a c 62 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik Ein alternativer nützlicher Ausdruck des Flussfaktors beruht auf der Mandelstam-Variable s, Gl. (V.4). Somit kann man schreiben q 2 (VII.11) F = 2 s − m2a − m2b − 4m2a m2b c2 . Diese Formel folgt sofort aus der Gleichung 2 2 4(pa · pb )2 = (2pa · pb )2 = (pa + pb )2 − p2a − p2b = s − m2a − m2b c4 . Für die Berechnung des differentiellen Wirkungsquerschnitts im nächsten Abschnitt wird es sich auch lohnen, den Møller-Flussfaktor im Schwerpunktsystem der einlaufenden Teilchen zu kennen. In diesem Bezugssystem findet man F = 4(Ep~a + Ep~b )|~ pa |/c im Schwerpunktsystem der Teilchen a und b. (VII.12) Im Schwerpunktsystem gilt p~b = −~ pa , was sofort zu pa · pb = Ep~a Ep~b /c2 + |~ pa |2 führt. Somit 2 2 2 4 4 2 2 ergibt sich (pa · pb ) = Ep~a Ep~b /c + |~ pa | + 2Ep~a Ep~b |~ pa | /c , und unter Verwendung der Energie– Impuls-Relation Ep~2i /c2 = |~ pi |2 + m2i c2 für beide Teilchen (pa · pb )2 − m2a m2b c4 = 2|~ pa |4 + |~ pa |2 m2a c2 + m2b c2 + 2Ep~2a Ep~2b /c2 2 = |~ pa |2 |~ pa |2 + |~ pa |2 Ep~a + Ep~b /c2 . pb |2 + m2a c2 + m2b c2 + 2Ep~2a Ep~2b /c2 = |~ Zusammen liefern Gl. (VII.9) und (VII.10) den totalen Wirkungsquerschnitt für einen Zweinach-zwei-Streuprozess Z 2 c d3 p~1 c d3 p~2 ~2 (2π)4 δ (4) (p1 + p2 − pa − pb )M . (VII.13) σtot = q (2π)3 2Ep~1 (2π)3 2Ep~2 4 (pa · pb )2 − m2a m2b c4 Dieser Ausdruck lässt sich auf den Fall des totalen Wirkungsquerschnitts für eine Streuung mit n Teilchen (gekennzeichnet 1, 2, . . . , n) im Endzustand verallgemeinern. Dann gilt X Z n n Y ~2 c d3 p~i 4 (4) 2 , (VII.14) σtot = q C (2π) δ pi − pa − pb |M| (2π)3 2Ep~i 4 (pa · pb )2 − m2a m2b c4 i=1 i=1 wobei C ein ähnlicher statistischer Faktor wie bei der Zerfallsrate (VI.18) ist. VII.2.3 Differentieller Wirkungsquerschnitt in einem Zwei-nach-zwei-Prozess Im besonderen Fall einer Zwei-nach-zwei-Streuung sind die Energien und Impulse der Streuprodukte durch die Kinematik so eingeschränkt, dass der zugehörige differentielle Wirkungsquerschnitt explizit berechnet werden kann, auch wenn die Amplitude M, die durch die Dynamik bestimmt wird, unbekannt ist. Dies lässt sich am einfachsten finden im Schwerpunktsystem der einlaufenden Teilchen, wo definitionsgemäß p~a + p~b = ~0. Unter Verwendung des Ausdrucks (VII.12) des Flussfaktors in diesem Bezugssystem wird der „unintegrierte“ Wirkungsquerschnitt — entsprechend einem Maß für die Wahrscheinlichkeit dafür, dass die gestreuten Teilchen Impulse zwischen p~1 und p~1 + d3 p~1 bzw. p~2 und p~2 + d3 p~2 haben — gegeben durch [vgl. Gl. (VII.13)] 2 c d3 p~1 ~2 c c d3 p~2 d6 σ(~ p1 , p~2 ) = (2π)4 δ (4) (p1 + p2 − pa − pb )M 4(Ep~a + Ep~b )|~ pa | (2π)3 2Ep~1 (2π)3 2Ep~2 = ~2 |M|2 c3 δ (4) (p1 + p2 − pa − pb ) d3 p~1 d3 p~2 . 2 64π (Ep~a + Ep~b )|~ pa |Ep~1 Ep~2 Dabei kann der δ (4) -Term als c δ(Ep~1 + Ep~2 − Ep~a − Ep~b )δ (3) (~ p1 + p~2 ) geschrieben werden, wobei die ~ Gleichung p~a + p~b = 0 benutzt wurde. Dann wird das Integral über p~2 trivial und ergibt VII. Streuprozesse 63 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik p p m21 c4 + p~12 c2 + m22 c4 + p~12 c2 − Ep~a − Ep~b 3 p p d p~1 . m21 c2 + p~12 m22 c2 + p~12 δ ~2 |M|2 c2 d σ(~ p1 ) = 2 64π (Ep~a + Ep~b )|~ pa | 3 Um dies weiter zu integrieren, soll die Abhängigkeit der Amplitude M bzw. von deren Betragsquadrat nach den kinematischen Variablen diskutiert werden. Allgemein sollte M eine Funktion der Impulse der ein- und auslaufenden Teilchen sein: M(~ pa , p~b , p~1 , p~2 ). Im Schwerpunktsystem, wo p~b = −~ pa und dank der Impulserhaltung p~2 = −~ p1 gelten, ist M nur Funktion von p~a und p~1 . Dazu ist M ein Lorentz-Skalar, d.h. insbesondere invariant unter Drehungen, und kann deshalb nur von den skalaren Größen p~a2 , p~12 und p~a · p~1 = |~ pa ||~ p1 | cos θ abhängen. Zusammenfassend ist die Amplitude M für eine Zwei-nach-zwei-Streuung nur Funktion von |~ pa |, |~ p1 | und θ, wobei diese Größen im Schwerpunktsystem gemessen werden. Wegen der möglichen Abhängigkeit von dem Streuwinkel θ kann die Winkelintegration nicht durchgeführt werden, im Gegensatz zum Fall des Phasenraumintegrals beim Zwei-Teilchen-Zerfall. Für die restlichen Integrationen kann man zunächst die Substitution d3 p~1 → p2 dp d2 Ω, mit Ω ≡ (θ, ϕ) und dementsprechend d2 Ω = sin θ dθ dϕ, in die obige Formel für d3 σ(~ p1 ) einsetzen. Dann ergibt sich für den differentiellen Wirkungsquerschnitt p p Z ∞ m21 c4 + p2 c2 + m22 c4 + p2 c2 − Ep~a − Ep~b 2 d2 σ(θ, ϕ) ~2 c2 2δ p p |M| p dp. = d2 Ω 64π 2 (Ep~a + Ep~b )|~ pa | 0 m21 c2 + p2 m22 c2 + p2 Weiterer Fortschritt erfolgt unter Nutzung der neuen Integrationsvariable q q 2 4 2 2 E ≡ m1 c + p c + m22 c4 + p 2 c2 , entsprechend dE = c2 c2 E p p p p + p dp, p dp = m21 c4 + p2 c2 m22 c4 + p2 c2 m21 c2 + p2 m22 c2 + p2 sowie p(E) = 1 2Ec q 2 E 4 − 2E 2 m21 + m22 c4 + m21 − m22 c8 Die letztere Formel folgt aus einfachen Berechnungen. Zunächst gilt q q E 2 = m21 c4 + m22 c4 + 2p2 c2 + 2 m21 c4 + p2 c2 m22 c4 + p2 c2 , d.h. 2 E 2 − m21 c4 − m22 c4 − 2p2 c2 = 4 m21 c4 + p2 c2 m22 c4 + p2 c2 . Nach dem Ausmultiplizieren der Produkte auf beiden Seiten und dem Herauskürzen von ein paar Termen kommt E 4 + m41 c8 + m42 c8 − 2E 2 m21 c4 − 2E 2 m22 c2 − 2m21 m22 c8 = 4E 2 p2 c2 , woraus das Ergebnis folgt. Mithilfe der Integrationsvariable E lässt dich der differentielle Wirkungsquerschnitt schreiben als d2 σ(θ, ϕ) ~2 c2 = 2 2 d Ω 64π (Ep~a + Ep~b )|~ pa | Z ∞ 2 p(E) M(|~ pa |, p(E), cos θ) δ(E − Ep~a − Ep~b ) dE, E Emin wobei die untere Grenze Emin ≡ (m1 +m2 )c2 ist. Damit das Argument der Delta-Funktion für einen Wert von E im Integrationsbereich verschwindet, soll Emin − Ep~a − Ep~b < 0 sein. Anders gesagt soll die Schwerpunktsenergie Ep~a + Ep~b ≡ Ecms größer sein als die Summe der Massenenergien (m1 + m2 )c2 der auslaufenden Teilchen, entsprechend einer trivialen kinematischen Bedingung zur Realisierbarkeit des Prozesses. In diesem Fall kann die Integration leicht durchgeführt werden, und es ergibt sich 2 d2 σ(θ, ϕ) ~2 c2 p(Ecms ) . = M(|~ p |, p(E ), cos θ) a cms d2 Ω 64π 2 Ecms |~ pa | Ecms VII. Streuprozesse 64 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik Dabei stellt p(Ecms ) den Wert des Impulsbetrags |~ p1 | = |~ p2 | dar, bei dem die Dirac-Distribution für Energie–Impuls-Erhaltung realisiert wird. Somit lautet der differentielle Wirkungsquerschnitt für den Prozess a + b → 1 + 2 im Schwerpunktsystem der einlaufenden Teilchen 2 pa |, |~ p1 |, cos θ) d2 σ(θ, ϕ) ~2 c2 |~ p1 | M(|~ , (VII.15) = d2 Ω 64π 2 |~ pa | (Ep~a + Ep~b )2 mit |~ p1 | dem durch Viererimpulserhaltung bestimmten Betrag des Impulses eines der auslaufenden Teilchen. Bemerkung: Da die kinematischen Größen hier im Schwerpunktsystem der einlaufenden Teilchen angegeben sind, ist (Ep~a + Ep~b )2 im Nenner dieser Formel gleich s c4 , mit s der (Lorentz-invarianten) ersten Mandelstam-Variable. Literatur • Griffiths [15], Kap. 6.1.2 & 6.2.2. VII. Streuprozesse 65 N.BORGHINI Elementarteilchenphysik Wechselwirkende Teilchen VIII. Feynman-Regeln Zur Berechnung der Amplitude M für einen gegebenen quantenfeldtheoretischen Prozess wurde ein günstiger Formalismus entwickelt, basierend auf einer graphischen Darstellung. In diesem kurzen Kapitel werden diese sog. Feynman-Regeln ohne Beweis eingeführt.33 Betrachte den Übergang, induziert durch einen Wechselwirkungsterm, zwischen einem Anfangsund einem Endzustand bestehend aus beliebig vielen ein- und auslaufenden Teilchen mit bestimmten Viererimpulsen und Spins, wie z.B. in Abb. VIII.1 schematisch dargestellt wird. 4 3 CC 6 COC t 6 5 Prozess CC COC 1 2 Abbildung VIII.1: Schematische Darstellung eines Prozesses mit zwei Teilchen im Anfangszustand und drei Teilchen im Endzustand. Zu einer gegebenen Ordnung in Störungsrechnung — entsprechend der Potenz des Wechselwirkungsterms in der Entwicklung des Zeitentwicklungsoperators, vgl. Abschn. VI.2.2 b — lässt sich die Amplitude als Summe von Teilamplituden schreiben. Jeder Teilamplitude kann ein FeynmanDiagramm zugeordnet werden, bestehend aus drei Arten von elementaren Bausteinen: externen Linien, mit einem freien Endpunkt; Vertices, wo drei oder mehr Linien sich treffen; und möglicherweise internen Linien, auch Propagatoren genannt, mit einem Vertex an beiden Endpunkten. Als Beispiel ist der Annihilationsprozess e− (p1 , σ1 ) + e+ (p2 , σ2 ) → γ(p3 , λ3 ) + γ(p4 , λ4 ) in Abb. VIII.2 abgebildet, mit pi , σi bzw. λi den Viererimpulsen, Helizitäten bzw. Polarisationen der ein- und auslaufenden Teilchen. p3 ,λ3 ,µ3 p4 ,λ4 ,µ4 vvkFkuu e d E e d I @ @ 6 t p1 ,σ1 @ I @ p2 ,σ2 Abbildung VIII.2: Feynman-Diagramm für Elektron–Positron-Annihilation zur führenden Ordnung. Ein solches Diagramm darf nicht als Darstellung einer Folge von Ereignissen in der Raumzeit interpretiert werden. Insbesondere bedeutet der mit t versehene Pfeil links nur, dass die externen Linien 1 und 2 unten bzw. 3 und 4 oben für die ein- bzw. auslaufenden Teilchen stehen. Jeder Baustein eines Feynman-Diagramms entspricht einem multiplikativen Beitrag zur Teilamplitude, gegeben durch die Feynman-Regeln, die jetzt formuliert werden. Linien À Externe :::::::::::::: Diese stellen die ein- und auslaufenden Teilchen dar, wobei der freie Endpunkt dem asymptotisch freien Anfangs- bzw. Endzustand bei t → −∞ bzw. t → +∞ entspricht. Jede solche Linie wird durch den Viererimpuls des Teilchens gekennzeichnet, sowie, im Fall von Spin- 21 - bzw. Spin-1-Teilchen, durch die zugehörige Helizität σ bzw. Polarisation λ. 33 Entäuschte Leserinnen können sich mit dem Gedanken trösten, dass Feynman selbst „seine“ Regeln für quantenelektrodynamische Prozesse nicht hergeleitet, sondern genial intuitiert hat. VIII. Feynman-Regeln 66 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik Je nach der Art des Teilchens werden verschiedene Typen von Linien benutzt, entsprechend verschiedenen Beiträgen zur Amplitude: hh kFk p −→ p,σ −→ kk p,σ −→ gg für ein Spin-0-Teilchen mit Viererimpuls p. Dies gibt einen Faktor 1 in der Amplitude. für ein Spin- 21 -Teilchen (z.B. ein Elektron) mit Viererimpuls p und Helizität σ. Für ein einlaufendes Teilchen ist der Beitrag zur Amplitude gleich u(~ p, σ); für ein auslaufendes Teilchen ist der Beitrag zur Amplitude gleich ū(~ p, σ). für ein Spin- 21 -Antiteilchen (z.B. ein Positron) mit Viererimpuls p und Helizität σ. Für ein einlaufendes Antiteilchen ist der Beitrag zur Amplitude gleich v̄(~ p, σ); für ein auslaufendes Antiteilchen ist der Beitrag zur Amplitude gleich v(~ p, σ). p,λ,µ −→ für ein Spin-1-Teilchen (z.B. ein Photon) mit Viererimpuls p und Polarisation λ. µ Dies gibt einen Faktor ε(λ) (~ p) in der Amplitude. Bemerkungen: ∗ Äußere Linien stehen für on-Shell-Teilchen bzw. -Antiteilchen, so dass die Angabe des Impulses p~ und der Masse m — je nach der Teilchenart: Elektron, Myon, Neutrino, Photon. . . — die Energie und somit den Viererimpuls vollständig bestimmt. ∗ Der Pfeil auf den für Spin- 12 -(Anti)Teilchen stehenden Linien gibt an, welche Teilchen und welche Antiteilchen sind: bei den Ersteren propagieren die Ladungen in die gleiche Richtung wie der Viererimpuls, bei den Letzteren propagieren sie rückwärts. Die Linien für Spin-0- oder Spin-1-Teilchen können natürlich auch mit solchen Pfeilen versehen werden, falls die Teilchen eine erhaltene Ladung tragen. Im Fall der Bosonen des Standardmodells werden jene Pfeile traditionell nicht geschrieben. ∗ In dieser Vorlesung wurde angenommen, dass Polarisationsvektoren reell sind [vgl. Gl. (IV.12)]. Man darf auch komplexwertige Polarisationsvektoren betrachten. In jenem Fall ist der Faktor in der µ µ∗ Amplitude ε(λ) (~ p) für ein einlaufendes Spin-1-Teilchen und ε(λ) (~ p) für ein auslaufendes Teilchen. Á Vertices ::::::: Vertices stellen die Punkte dar, wo Teilchen miteinander wechselwirken. Dabei hat man, je nach dem Wechselwirkungsterm im Hamilton-Operator, 3-Teilchen-Vertices, 4-Teilchen-Vertices, usw. In Abschn. VI.2.2 b wurde gezeigt, dass die Reihenentwicklung des Zeitentwicklungsoperators ÛI (t, t0 ) der nichtrelativistischen Quantenmechanik nach Potenzen der Wechselwirkung Terme der Z Form i − g V̂I (t0 ) dt0 ~ liefert. In einer quantentheoretischen Beschreibung, basierend auf einer Lagrange’schen Formulierung, lauten diese Terme Z i L̂I dt0 d3 ~x 0 , ~ mit L̂I dem Wechselwirkungsterm (im Wechselwirkungsbild) in der Lagrange-Dichte. Der Letztere ist allgemein ein Polynom in den Feldoperatoren der an der Wechselwirkung teilnehmenden Teilchen, wie z.B. für Teilchen mit Spin 0 L̂I = gjkl φ̂j φ̂k φ̂l + ghjkl φ̂h φ̂j φ̂k φ̂l + · · · (VIII.1) Dann schreibt man für jeden Vertex des Feynman-Diagramms einfach einen Faktor ig, wo die Kopplungskonstante g der passende Koeffizient des Polynoms ist. Im Beispiel der obigen LagrangeVIII. Feynman-Regeln 67 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik Dichte (VIII.1) lautet der Beitrag zur Teilamplitude jh i ji ij j • für jeden 3-Teilchen-Vertex k kommt ein Faktor igjkl ; l • für jeden 4-Teilchen-Vertex Linien  Interne ::::::::::::: h k j l kommt ein Faktor ighjkl , usw. Eine günstige doch schnell irreführende Interpretation einer solchen Linie ist, dass sie das Propagieren von irgendeinem (Anti)Teilchen zwischen zwei Wechselwirkungspunkten beschreiben. Jenes (Anti)Teilchen hätte dann die gleiche Masse m und die gleichen Quantenzahlen (Spin, Ladungen. . . ) wie das entsprechende „reale“ Teilchen, das im Anfangs- oder Endzustand auftreten kann. Dagegen hat es keinen Helizitäts- oder Polarisationszustand — in den hiernach angegebenen Propagatoren wird schon über alle Möglichkeiten summiert. Dazu trägt es einen Viererimpuls q, der die Energie–Impuls-Beziehung q2 = m2 c2 nicht erfüllen soll: es ist „off-Shell“. Somit wird das Ding, das man mit einer inneren Linie assoziiert, als virtuelles (Anti)Teilchen bezeichnet. Hiernach werden die verschiedenen internen Linien je mit der zugehörigen Form des Propagators dargestellt. In jedem Fall bezeichnet m die Masse des virtuellen (Anti)Teilchens. q i −→ (VIII.2a) (Spin-0-Teilchen) entspricht dem Propagator 2 . q − m2 c2 q ) −→ i (6 q + mc) (Spin- 21 -Teilchen) und q (VIII.2b) entsprechen dem Propagator 2 . ←− 1 q − m2 c2 (Spin- 2 -Antiteilchen) q −→ µ −iη µν ν (VIII.2c) (Spin-1-Teilchen) entspricht dem Propagator 2 . q − m2 c2 Alle diese Propagatoren tragen multiplikativ zur Amplitude M bei. hh kFk kk gg à Energie–Impuls-Erhaltung ::::::::::::::::::::::::: An jedem Vertex muss der Viererimpuls erhalten sein. Diese Bedingung schränkt die möglichen Werte der Viererimpulse vieler interner Linien ein. Hier soll die globale Viererimpulserhaltung zwischen Anfangs- und Endzustand benutzt werden. über die Viererimpulse der internen Linien Ä Integration :::::::::::::::::::::::::::::::::::::::::::::::::::: Jetzt integriert man üben jedem internen Viererimpuls q, der im vorigen Schritt à nicht bestimmt wurde, mit dem Integrationsmaß d4 q/(2π)4 . (1) Å Antisymmetrisierung ::::::::::::::::::::::: Für jede geschlossene Fermion-Schleife eines gegebenen Feynman-Diagramms wird die Teilamplitude mit (−1) multipliziert. Dazu soll man die Spur des entsprechenden Produkts von GammaMatrizen bilden. Æ Gesamtphase :::::::::::: Das Ergebnis der Schritte À bis Å wird jetzt noch mit einem Faktor i multipliziert, was die endgültige Teilamplitude M liefert. Dies hat natürlich keinen Einfluss auf |M|2 , ist aber üblich. Jetzt sollen alle Teilamplituden, die bis zu einer gegebenen Ordnung vorkommen, summiert werden, um die gesamte Amplitude zu geben. Dabei kommt ein letzter Schritt, falls es zwei identische ein- oder auslaufende Fermionen gibt: (2) Ç Antisymmetrisierung ::::::::::::::::::::::: Zwei Diagramme, die sich nur durch Austausch von zwei externen Fermionen unterscheiden, sollen nicht addiert, sondern subtrahiert werden, d.h. eines davon soll mit einem Minuszeichen versehen werden. VIII. Feynman-Regeln 68 N.BORGHINI Elementarteilchenphysik Wechselwirkende Teilchen Beispiele Jetzt werden drei Beispiele von Feynman-Diagrammen sowie die zugehörigen Amplituden M angegeben, für den Fall einer Theorie skalarer Teilchen, die über den Term L̂I = −g φ̂1 φ̂2 φ̂3 in der Lagrange-Dichte wechselwirken. Somit können in dieser Theorie nur Drei-Teilchen-Vertices, mit je einem Teilchen von jeder Art (1, 2 und 3) betrachtet werden. - Beispiel 1: 1 → 2 + 3 Zerfallsprozess 2 j i ji 3 p3 M = (−ig)(i) = g { n hh I p@ @ 2 Á Æ p1 6 1 Hier und in den zwei folgenden Beispielen werden die aus den äußeren Linien kommenden trivialen Faktoren 1 vom Schritt À nicht geschrieben. - Beispiel 2: elastischer 1 + 2 → 10 + 20 Streuprozess 20 10 à 1 { Á p 2 @ I @ g2 (i) = (p1−p02 )2 − m23 c2 (p1−p02 )2 − m23 c2 Æ Â&à i 2 ( - Beispiel 3: elastischer 1 + 2 → 10 + 20 Streuprozess 20 q 0 I @ p2@ 1 3 3 0 p1−p2 p1−p02 2 p1 à p1−p02 +q (Ã) 1 = ig 2 (p1−p02 )2 − m23 c2 2 { Â&à 1 p 2 @ I @ i i d4 q (i) q2 − m21 c2 (p1−p02 +q)2 − m22 c2 (2π)4 Æ Ä Ä Â Â&à { 4 (p1−p02 )2 − m23 c2 Á p01 2 Z i M = (−ig)4 10 q2 − m21 c2 Z M = (−ig)2 3 q = p1−p02 p1 p01 jjhhii i j i j I p02@ @ 1 d4 q . (p1−p02 +q)2 − m22 c2 (2π)4 Somit stellt dieses Feynman-Diagramm einen Beitrag der Ordnung O(g 4 ) zur Amplitude für den Streuprozess. Bemerkungen: ∗ Die Anzahl der Vertices entspricht der Ordnung in Störungsrechnung der Teilamplitude unter Betrachtung. Wenn man nach der Amplitude bis zur einer gegebenen Ordnung k sucht, dann soll man nur die Diagramme mit k 0 ≤ k Vertices zeichnen. ∗ Falls es Fermionen gibt, ist die Anordnung der Beiträge der dazugehörigen Vertices und Propagatoren zu einer Teilamplitude nicht beliebig — sie involvieren nämlich Dirac-Matrizen, deren Produkt nicht kommutativ ist. Dies wird in Abschn. IX.1 am Beispiel der Feynman-Regeln der Quantenelektrodynamik weiter detailliert. VIII. Feynman-Regeln 69 N.BORGHINI Wechselwirkende Teilchen Elementarteilchenphysik ∗ Regel à für die Viererimpulserhaltung an den Vertices wird manchmal anders angegeben, z.B. in Griffiths [15], Kap. 6.3: mit jedem Vertex sollte ein Faktor (2π)4 δ (4) ( · · · ) assoziiert werden, wobei die Auslassungspunkte für die algebraische Summe der Viererimpulse an dem Vertex steht, z.B. · · · = p1 − p02 − q für den Vertex links im Beispiel 2 oben. Dann bleiben viel mehr interne Viererimpulse, P die im PSchritt Ä integriert werden. Nach jenem Schritt gibt es aber noch einen Faktor (2π)4 δ (4) ( paus − pein ) für die globale Viererimpulserhaltung zu viel, der von Hand gelöscht werden muss. Die globale Viererimpulserhaltung ist nämlich schon in der Phasenraumintegration nach den auslaufenden Impulsen berücksichtigt. Literatur • Griffiths [15], Kap. 6.3. VIII. Feynman-Regeln 70 Teil C Wechselwirkungen der Elementarteilchenphysik Version vom 4. Februar 2014, 10:59 71 N.BORGHINI Elementarteilchenphysik Wechselwirkungen blabla... eine Einleitung fehlt... Wechselwirkungen der Elementarteilchenphysik 73 N.BORGHINI Elementarteilchenphysik IX. Quantenelektrodynamik Dieses Kapitel befasst sich mit einer ersten Wechselwirkung, der die Elementarteilchen unterliegen, und zwar mit der Quantenelektrodynamik (QED), d.h. das quantenfeldtheoretische Pendant zum Elektromagnetismus.34 Dabei handelt es sich um die am an genauesten verifizierte Theorie der Physik, dank experimentellen Messungen mit sehr geringen Messfehlern einerseits und hochpräzisen Berechnungen andererseits. Das Musterbeispiel dafür ist das magnetische Dipolmoment des Elektrons µe , gemessen in Einheiten des Bohr’schen Magnetons µB = e~/2me (in SI-Einheiten). Definiert man ae ≡ µe /µB , so findet man experimentell [21]35 aexp = 1, 00115965218076(27) e und in störungsrechnerischen Berechnungen bis zur 10. Potenz der Kopplungskonstante [23]36 ath e = 1, 00115965218178(77). Somit stimmen Experiment und Theorie bis zur 12. Stelle nach dem Komma überein.37 In Abschn. IX.1 wird der Term für die Wechselwirkung von elektrisch geladenen Spin- 21 -Teilchen mit Photonen eingeführt. Die wichtigsten daraus folgenden quantenelektrodynamischen Prozesse niedriger Ordnung werden in Abschn. IX.2 anhand deren Feynman-Diagramme vorgestellt. Dann wird in Abschn. IX.3 der totale Wirkungsquerschnitt für den einfachsten jener Prozesse berechnet. IX.1 Feynman-Regeln der Quantenelektrodynamik Die Quantenelektrodynamik beschreibt die Wechselwirkung elektrisch geladener Teilchen mit einem Vektorfeldoperator µ (x), wobei der Letztere dem Viererpotential des klassischen elektromagnetischen Felds entspricht, und als Feldoperator für Photonen interpretiert wird. Im Rahmen der Elementarteilchenphysik haben alle elektrisch geladenen Teilchen — bis auf die elektroschwachen Bosonen W ± — den Spin 21 und werden also durch Dirac-Spinoren ψ̂(x) beschrieben. Deshalb wird hiernach nur auf die Wechselwirkung zwischen Spinoren und Photonen eingegangen. Betrachte zunächst nur ein Elektron, oder allgemeiner ein einziges geladenes Lepton. Dessen Wechselwirkung mit dem Vektorpotential lässt sich völlig durch den folgenden Term in der LagrangeDichte beschreiben: L̂I = e ψ̄ˆ(x)γ µ µ (x) ψ̂(x). (IX.1) Dabei ist die Kopplungskonstante gleich der Elementarladung e, entsprechend dem Betrag der Elektronenladung. Statt der Letzteren benutzt man oft die Feinstrukturkonstante αem , definiert durch e2 αem ≡ . (IX.2) 4π Im SI-Einheitensystem gilt αem = e2 /(4π0 ~c). Der 2010 von CODATA empfohlene Wert, der in −1 ≈ 137, 035999 [21]. Prozessen mit kleinen Energieüberträgen gilt, beträgt αem 34 Historisch wurde die QED auch als erste entwickelt, und zwar in den Jahren 1946–1951 durch Feynman, Schwinger und Tomonaga, die dafür den Nobelpreis gekriegt haben, sowie Dyson, der die Äquivalenz der Theorien der drei ersteren gezeigt hat. Manche der wichtigen Artikel werden in [20] gesammelt. 35 Dieser Mittelwert über verschiedene Experimente spiegelt meistens die Ergebisse von [22] wider. 36 Zur Ordnung O(e10 ) tragen 12672 unterschiedliche quantenelektrodynamische Feynman-Diagramme bei. Zum 8 Vergleich gilt zur 8. Ordnung ath e = 1, 00115965218279(771) [24], mit „nur“ 891 Diagrammen der Ordnung O(e ). 37 Die Übereinstimmung zwischen Experiment und Theorie ist im Fall des magnetischen Dipolmoments des Myons nicht so beeindrückend: aexp = 1, 0011659091(63) einerseits [21], ath µ µ = 1, 00116591840(59) andererseits [25]. Der letztere Wert enthält aber, neben dem bis zur Ordnung O(e10 ) berechneten QED-Beitrag, auch einen weniger kontrollierten Beitrag aus der hadronischen Physik, der die Diskrepanz teilweise erklären könnte — und ist viel kleiner bei ath e . Wechselwirkungen der Elementarteilchenphysik 74 N.BORGHINI Elementarteilchenphysik In Übereinstimmung mit der in Kap. VIII eingeführten Feynman-Regel Á entspricht der Wechselwirkungsterm (IX.1) einem einzigen Drei-Teilchen-Vertex, wo eine Spin-1- und zwei Spin- 12 -Linien sich treffen: d dgg eEe entsprechend einem Faktor ieγ µ in einer Amplitude. (IX.3) Hier sollten die Feynman-Regeln in Anwesenheit von Spin- 21 -Teilchen präzisiert werden. Hat man in einem Feynman-Diagramm solche (Anti)Teilchen, so gibt es zwei Möglichkeiten: bei der Linie handelt es sich entweder um eine Linie, die zwei externe Linien miteinander verbindet, oder um eine innere Schleife. Im ersten Falle muss man für die Berechnung der Beitrag zur Teilamplitude von dem Endpunkt der Linie, der ein einlaufendes Teilchen bzw. ein auslaufendes Antiteilchen darstellt, anfangen, und den entsprechenden Beitrag u(~ p, σ) bzw. v(~ p, σ) ganz rechts schreiben. Folgt man dann der Linie in die mit einem Pfeil gekennzeichnete Richtung des Ladungsstroms weiter, so trifft man aufeinander folgende Vertices und innere Linien: die zugehörigen Vertexfaktoren (IX.3) (im Falle von QEDVertices) und Propagatoren (VIII.2b) müssen rechts nach links geschrieben werden. Schlussendlich kommt ganz links der Beitrag für den zweiten Endpunkt der Linie, d.h. für ein auslaufendes Teilchen bzw. ein einlaufendes Antiteilchen, entsprechend einem Faktor ū(~ p 0 , σ0 ) bzw. v̄(~ p 0 , σ0 ). Im Falle einer inneren Fermion-Schleife kann man von einem beliebigen Vertex anfangen, dann entgegen der Pfeilrichtung für den Ladungsstrom die sukzessiven Vertexfaktoren und Propagatoren von links nach rechts schreiben. Am Ende bildet man die Spur (vgl. Regel Å), deren Zyklizität die freie Wahl des Anfangsvertex ermöglicht. Bisher konnte nur eine Art von Spin- 12 -Teilchen mit dem Photon wechselwirken. Sei jetzt eine Theorie mit mehreren elektrisch geladenen Fermionen, gekennzeichnet mit einem index j, mit jeweiligen elektrischen Ladungen Qj (in Einheiten von e) und Feldoperatoren ψ̂j (x). Dann lautet der QED-Wechselwirkungsterm in der Lagrange-Dichte X L̂I = − Qj e ψ̄ˆj (x)γ µ µ (x) ψ̂j (x). (IX.4) j Im Fall Qj = −1, wie z.B. für das Elektron oder das Myon, findet man den Term (IX.1) wieder. Entsprechend jedem Term in Gl. (IX.4) hat man für jede Teilchenart j einen Drei-Teilchen-Vertex des Typs (IX.3), mit dem Vertexfaktor −iQj eγ µ . Bemerkungen: ∗ Der Wechselwirkungsterm L̂I in Gl. (IX.1) oder (IX.4) ist eine Lorentz-invariante komplexwertige Funktional der Feldoperatoren, auch wenn die Letzteren nicht Lorentz-invariant sind. ∗ An einem quantenelektrodynamischen Vertex bleibt die Art des beteiligten Spin- 21 -Teilchens unverändert. Dies wird bei der schwachen Wechselwirkung nicht mehr der Fall sein. ∗ In der skalaren Elektrodynamik, die die Wechselwirkung zwischen Photonen und elektrisch geladenen Spin-0-Teilchen (wie z.B. Pionen π ± ) beschreibt, gibt es zwei Vertices, statt nur einen. IX.2 Grundlegende Prozesse Die ganzen Prozesse der Quantenelektrodynamik beruhen auf dem einfachen Term (IX.4) bzw. auf dem elementaren Vertex (IX.3), wobei das propagierende Spin- 21 -Teilchen eines der Elementarteilchen des Standard-Modells ist. In diesem Abschnitt werden die Feynman-Diagramme für die einfachsten dieser Prozesse dargestellt. Wechselwirkungen der Elementarteilchenphysik 75 N.BORGHINI Elementarteilchenphysik IX.2.1 Prozess erster Ordnung Die Wechselwirkung zwischen einem Photon entsprechend einem magnetischen Feld und einem Elektron, beschrieben zur niedrigsten Ordnung durch das Feynman-Diagramm der Abb. IX.1, hängt vom magnetischen Dipolmoment des Elektrons ab. Zu dieser Ordnung gilt µe = µB ∝ e. e− e− Abbildung IX.1: Feynman-Diagramm für das magnetische Dipolmoment zur Ordnung O(e). IX.2.2 Elastische Prozesse zweiter Ordnung Mit zwei Vertices findet man mehr Prozesse, insbesondere verschiedene elastische Streuprozesse. IX.2.2 a Elektron–Myon-Streuung ::::::::::::::::::::::::::::::::: Das einfachste Beispiel davon ist der Streuprozess e− + µ− → e− + µ− , mit zwei verschiedenen Teilchenarten im Anfangszustand — und folglich, im Endzustand. Der Klarheit halber wird hier das Myon mit einer doppelten Linien bezeichnet, um den Unterschied mit dem Elektron zu betonen. Das einzige mögliche Feynman-Diagramm mit einem Elektron und einem Myon im Anfangs- und im Endzustand und nur zwei Vertizes wird in Abb. IX.2 dargestellt. Es besteht aus zwei elementaren µ− e− I p3 , σ@ 3@ q- p1 , σ1 p4 , σ4 p ,σ @ I @ 2 2 µ− Abbildung IX.2: Feynman-Diagramm für Elektron–Myon-Streuung zur führenden Ordnung. e− Vertizes, und zwar einem für die Elektron-Photon-Wechselwirkung und einem für die Myon-PhotonWechselwirkung. In diesem Prozess kann das Myon durch irgendein anderes elektrisch geladenes Teilchen j bis auf ein Elektron ersetzt werden. In allen Fällen gilt dann mj > me . Im Grenzfall mj → ∞, was physikalisch für mj ≫ me relevant ist, wird der Prozess als Mott-Streuung bezeichnet — und der differentielle Wirkungsquerschnitt wird unabhängig von der Masse des schweren Teilchens. Hat das einfallende Elektron dazu eine geringe relative Geschwindigkeit ve → 0, so spricht man von Rutherford-Streuung, in Anlehnung am ursprünglichen Rutherford-Streuexperiment38 an schwere Atomkerne. IX.2.2 b Elektron–Elektron-Streuung :::::::::::::::::::::::::::::::::::: Wenn die zwei Teilchen im Anfangszustand identisch sind, als z.B. im Falle des Streuprozesses e− + e− → e− + e− , spricht man von Møller-Streuung. Aufgrund der Ununterscheidbarkeit der auslaufenden Teilchen sollen dann zwei Diagramme betrachtet werden. e− e− e− e− k Q 3 p , σ I p4 , σ4 p3 , σ@ p3 , σ3Q 4 4 3@ und p1 , σ1 p ,σ @ I @ 2 2 p1 , σ1 p ,σ @ I @ 2 2 e− e− e− e− Abbildung IX.3: Feynman-Diagramme für Møller-Streuung zur führenden Ordnung. 38 . . . durchgeführt durch Geiger & Müller, und mit Spin-0-Projektilteilchen (α-Teilchen), statt Spin- 12 wie hier. . . Wechselwirkungen der Elementarteilchenphysik 76 N.BORGHINI Elementarteilchenphysik Dabei unterscheiden sich die Diagramme daran, dass in dem einen das einlaufende Elektron mit Viererimpuls p2 nach der Streuung den Viererimpuls p3 hat, während es im anderen Fall mit dem Viererimpuls p4 ausläuft. Somit folgt die Teilamplitude für das Diagramm rechts aus der Amplitude für das Diagramm links nach Austauschen von p3 und σ3 gegen p4 und σ4 . Aufgrund der Regel Ç muss eine der Teilamplituden mit (−1) multipliziert werden, bevor die beiden addiert werden. IX.2.2 c Elektron–Positron-Streuung Der letzte elastische Streuprozess zwischen zwei Fermionen ist die Streuung eines Teilchens mit dem zugehörigen Antiteilchen, z.B. die Bhabha-Streuung e− +e+ → e− +e+ . Zur Ordnung e2 tragen die zwei in Abb. IX.4 dargestellten Feynman-Diagramme bei. :::::::::::::::::::::::::::::::::::: e− I p3 , σ@ 3@ e− k Q p3 , σQ 3 e+ p4 , σ4 e+ 3 p4 , σ4 und p1 , σ1 p ,σ @ I @ 2 2 e− e+ p1 , σ1 e− p ,σ @ I @ 2 2 e+ Abbildung IX.4: Feynman-Diagramme für Bhabha-Streuung zur führenden Ordnung. Betrachtet man diese zwei Diagramme, so sieht man, dass das zweite sich aus dem ersten erhalten lässt durch den Austausch des mit 3 gekennzeichneten auslaufenden Elektrons mit dem mit 2 gekennzeichneten einlaufenden Positron. Somit soll hier auch eines der Diagramme vom anderen subtrahiert werden. IX.2.2 d Elektron–Photon-Streuung ::::::::::::::::::::::::::::::::::: Schließlich bleibt es noch ein elastischer Prozess der Ordnung e2 , und zwar die Compton-Streuung e− + γ → e− + γ. es gibt auch zwei mögliche Feynman-Diagramme, die in Abb. IX.5 dargestellt werden. γ e− 3 k γ p3 , λQ p4 , σ4 3Q e− I p3 , λ@ 3@ p1 , σ1 e− q- p4 , σ4 und p ,λ @ I @ 2 2 γ p1 , σ1 e− p ,λ @ I @ 2 2 γ Abbildung IX.5: Feynman-Diagramme für Compton-Streuung zur führenden Ordnung. Für die zugehörigen Amplituden spielt die oben angegebene Regel für die Anordnung der Vertices und Propagatoren entlang einer Fermion-Linie eine Rolle. Beispielsweise lautet die Amplitude des linken Diagramms i(6 p1 − 6 p3 + me ) µ ν M = i ε(λ (~ p2 ) ū(~ p4 , σ4 )(ieγµ ) (ieγν )u(~ p1 , σ1 )ε(λ (~ p ) 3) 3 2) (p1 − p3 )2 − m2e wobei der Viererimpuls q = p1 − p3 getragen durch die innere Elektron-Linie — mit der Masse me im Propagator — aus der Viererimpulserhaltung folgt. Unter Verwendung der kürzeren Notationen µ u(i) ≡ u(~ pi , σi ), εµ (j) ≡ ε(λ (~ pj ) lässt sich diese Teilamplitude schreiben als j) 6 p1 − 6 p3 + me 6 ε(3)u(1). M = e2 ū(4)6 ε(2) (p1 − p3 )2 − m2e Die Teilamplitude für das Diagramm rechts erfolgt durch Ersetzen von p1 − p3 durch p1 + p2 und Austauschen von 6 ε(2) mit 6 ε(3). Wechselwirkungen der Elementarteilchenphysik 77 N.BORGHINI Elementarteilchenphysik IX.2.3 Inelastische Prozesse zweiter Ordnung Jetzt werden ein paar wichtige inelastische Prozesse der Ordnung O(e2 ) dargestellt. IX.2.3 a Paarvernichtung ::::::::::::::::::::::::: Ein erster wichtiger Prozess zweiter Ordnung ist die Vernichtung eines Elektron–Positron-Paars in zwei on-Shell-Photonen e− + e+ → γ + γ. Aufgrund der Anwesenheit zweier identischer Teilchen im Endzustand gibt es zwei Feynman-Diagramme, entsprechend dem Austausch der Labels der Photonen, die in Abb. IX.6 gezeigt sind. Da die zwischen diesen Diagrammen ausgetauschten Photonen Bosonen sind, sollen die zugehörigen Teilamplituden einfach addiert werden. γ γ γ γ I p3 , σ@ 3@ k Q p3 , σQ 3 p4 , σ4 3 p4 , σ4 und p1 , σ1 p ,σ @ I @ 2 2 p1 , σ1 p ,σ @ I @ 2 2 e− e+ e− e+ Abbildung IX.6: Feynman-Diagramme für Elektron–Positron-Annihilation zur führenden Ordnung. Man findet problemlos, dass die Teilamplitude für das Diagramm links durch 6 p1 − 6 p3 + me 6 ε(3)u(1) M = e2 v̄(2)6 ε(4) (p1 − p3 )2 − m2e gegeben wird, sehr ähnlich der Teilamplitude für das Diagramm links in Abb. IX.5 IX.2.3 b Paarerzeugung ::::::::::::::::::::::: Tauscht man die Rollen der ein- und auslaufenden Teilchen im letzteren Prozess, so erhält man statt Elektron-Paarvernichtung die Paarerzeugung γ + γ → e− + e+ . Hier auch tragen zwei Feynman-Diagramme zur Ordnung O(e2 ) bei, vgl. Abb. IX.7. e+ e+ e− e− k Q 3 p , σ I p4 , σ4 p3 , σ3Q p3 , σ@ 3@ 4 4 q und p1 , σ1 γ p ,σ @ I @ 2 2 γ p1 , σ1 γ p ,σ @ I @ 2 2 γ Abbildung IX.7: Feynman-Diagramme für Paarerzeugung zur führenden Ordnung. Für das Diagramm links gibt die Viererimpulserhaltung q = p3 − p1 , so dass die zugehörige Teilamplitude lautet 6 p3 − 6 p1 + me M = e2 ū(3)6 ε(1) 6 ε(2)v(4). (p3 − p1 )2 − m2e Bemerkungen: ∗ Da die Amplitude eine komplexe Zahl ist, sind hermitesche Konjugation und komplexe Konjugation bei ihr äquivalent: M† = M∗ . Berechnet man dann M† unter Verwendung der Beziehung γ 0 (γ µ )† = γ µ (γ 0 )† [Gl. (III.11)], und tauscht man am Ende die Labels 1 gegen 3 und 2 gegen 4, so findet man, dass die komplex-konjugierte Amplitude M∗ des linken Diagramms in Abb. IX.7 gleich der Amplitude für das linke Diagramm von Abb. IX.6 ist, d.h. für den zeitumgekehrten Prozess. ∗ Kinematisch ist Paarerzeugung nicht immer möglich!Um ein Elektron–Positron-Paar erzeugen zu können, muss die Energie im Schwerpunktsystem der einlaufenden Photonen größer als zweimal die Elektronenmasse (mal c2 ) sein. Dagegen kann Paarvernichtung immer stattfinden. IX.2.3 c Myon-Paarerzeugung in Elektron–Positron-Streuung ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Der Stoß eines Elektrons an einem Positron kann nicht nur entweder elastisch sein (Abb. IX.4) oder zu deren Vernichtung in zwei Photonen führen (Abb. IX.6), sondern kann noch weitere Endzustände geben, auch zur niedrigsten Ordnung O(e2 ). Wenn die Energie im Schwerpunktsystem der Wechselwirkungen der Elementarteilchenphysik 78 N.BORGHINI Elementarteilchenphysik einlaufenden e− und e+ groß genug ist, dann kann im Endzustand ein Teilchen–Antiteilchen-Paar entstehen, wie z.B. ein Myon–Antimyon-Paar: e− + e+ → µ− + µ+ . Das Feynman-Diagramm für diesen Prozess zur Ordnung O(e2 ) wird in Abb. IX.8 dargestellt. µ− µ+ k Q p3 , σQ 3 3 p4 , σ4 p1 , σ1 e− p ,σ @ I @ 2 2 e+ Abbildung IX.8: Feynman-Diagramm für Myon-Paarerzeugung zur führenden Ordnung. Die zugehörige Amplitude lautet e2 v̄(~ p2 , σ2 )γµ u(~ p1 , σ1 ) ū(~ p3 , σ3 )γ µ v(~ p4 , σ4 ) . M=− 2 (p1 + p2 ) Unter Verwendung der in Abschn. IX.3 dargestellten Methoden kann man den entsprechenden differentiellen Wirkungsquerschnitt berechnen, sowie den totalen Wirkungsquerschnitt. Für den Fall, wo die Helizitätszustände der ein- und auslaufenden Teilchen unbekannt sind, gilt zur niedrigsten Ordnung s 2 1 − 4m2µ /s 2m2µ 4π α 2m2e em − + − + σtot (e +e → µ +µ ) = 1+ 1+ , (IX.5) 3 s 1 − 4m2e /s s s mit s dem Quadrat der Schwerpunktsenergie. Dabei erkennt man, dass die Letztere größer als 2mµ sein muss, damit die Wurzel positiv ist. IX.2.3 d Quark–Antiquark-Paarerzeugung in Elektron–Positron-Streuung ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Eine andere Möglichkeit ist, dass die Vernichtung eines Elektron–Positron-Paars zur Erzeugung eines Quark–Antiquark-Paar führt, entsprechend dem in Abb. IX.9 dargestellten FeynmanDiagramm. q q̄ Q Q p3 , σk 3 3 p4 , σ4 p1 , σ1 e− p ,σ @ I @ 2 2 e+ Abbildung IX.9: Feynman-Diagramm für Quark–Antiquark-Paarerzeugung zur führenden Ordnung. Wenn Qq die elektrische Ladung des erzeugten Quarks in Einheiten von e bezeichnet — Qq = 23 für u, c und t-Quarks, oder − 31 für d, s und b-Quarks —, dann ist die Amplitude für den Prozess zur Ordnung O(e2 ) gegeben durch Qq e2 M= v̄(~ p2 , σ2 )γµ u(~ p1 , σ1 ) ū(~ p3 , σ3 )γ µ v(~ p4 , σ4 ) . 2 (p1 + p2 ) Diese Amplitude ist natürlich sehr ähnlich jener für den Prozess e− + e+ → µ− + µ+ , bis auf den Faktor −Qq — dazu unterscheiden sich auch die Spinoren für die auslaufenden Teilchen, in denen die Teilchenmasse eine Rolle spielt. Wechselwirkungen der Elementarteilchenphysik 79 N.BORGHINI Elementarteilchenphysik IX.2.4 Wichtige Prozesse dritter Ordnung Zur Ordnung O(e3 ) kommen schon viele Prozesse bzw. Feynman-Diagramme vor. Darunter befinden sich die vier Diagramme der Abb. IX.10, die sog. Strahlungskorrekturen zum magnetischen Moment beschreiben. + + + Abbildung IX.10: Strahulungskorrekturen zum magnetischen Dipolmoment. Die zwei ersten Diagramme können in der Definition der Masse des Spin- 21 -Teilchens absorbiert werden. Analog kann das dritte Diagramm in einer Neudefinition der Kopplungskonstante e der Quantenelektrodynamik angenommen werden.39 Abgesehen von diesen Renormierungen bleibt das vierte Diagramm, das zu einer Änderung des magnetischen Dipolmoments führt. Man kann zeigen, das zur Ordnung O(e2 ) gilt e2 αem µe = µB 1 + 2 = µ B 1 + ' 1, 001164µB . 8π 2π IX.3 Wirkungsquerschnitt für elastische Elektron–Myon-Streuung Dieser Abschnitt befasst sich mit der Berechnung des Wirkungsquerschnitts für die in Abb. IX.2 dargestellte elastische Elektron–Myon-Streuung. Die Amplitude für jenen Prozess ist, nach Anwendung der Feynman-Regeln −iηµν M = i ū(~ p3 , σ3 ) ieγ µ u(~ p1 , σ1 ) ū(~ p4 , σ4 ) ieγ ν u(~ p2 , σ2 ) (p1 − p3 )2 e2 =− ū(~ p3 , σ3 )γ µ u(~ p1 , σ1 ) ū(~ p4 , σ4 )γµ u(~ p2 , σ2 ). (IX.6) (p1 − p3 )2 In einem echten Experiment sind die Helizitätszustände der kollidieren Teilchen selten bekannt, und jene der Streuprodukte werden nicht gemessen. Stattdessen hat jedes einlaufende Teilchen mit der gleichen Wahrscheinlichkeit entweder eine positive oder eine negative Helizität, so dass jede Konfiguration der Spinzustände σ1 = ±, σ2 = ± kann mit Wahrscheinlichkeit 41 vorkommen. In solchen Fällen lohnt es sich, anstatt die Wirkungsquerschnitte mit bestimmten Helizitäten herzuleiten, den unpolarisierten Wirkungsquerschnitt direkt zu berechnen, was oft einfacher ist. Somit soll man zum einen über die verschiedenen möglichen Spinzustände der einlaufenden Teilchen mitteln, und zum anderen über die Spinkonfigurationen im Endzustand summieren. Dies lässt sich schon auf der ebene der Amplitudenbetragsquadrate durchführen, und statt das Betragsquadrat der Amplitude M({~ pi , σi }) für bestimmte Werte der ein- und auslaufenden Impulse und Spins zu berechnen, betrachtet man direkt den Mittelwert D 2 E 1 X X X X 2 M({~ M({~ pi }) = pi , σi }) . (IX.7) 4 σ =± σ =± σ =± σ =± 1 2 3 4 Hier führt die Amplitude (IX.6) zu 2 ∗ e4 M({~ pi , σi }) = ū(~ p3 , σ3 )γ µ u(~ p1 , σ1 ) ū(~ p3 , σ3 )γ ρ u(~ p1 , σ1 ) 4 (p1 − p3 ) ∗ × ū(~ p4 , σ4 )γµ u(~ p2 , σ2 ) ū(~ p4 , σ4 )γρ u(~ p2 , σ2 ) . 39 Die zwei ersten Diagramme und das vierte tragen auch individuell zur Kopplungskonstante bei, doch ihre Beiträge heben sich auf. Wechselwirkungen der Elementarteilchenphysik 80 N.BORGHINI Elementarteilchenphysik Jedes Produkt ū(~ pi , σi )γµ u(~ pj , σj ) mit entweder einem kontra- oder einem kovarianten Index ist tatsächlich eine Zahl, d.h. eine 1 × 1-Matrix, die gleich deren Transponierten ist. Nach kom ∗ † plexer Konjugation kommt somit ū(~ pi , σi )γµ u(~ pj , σj ) = ū(~ pi , σi )γµ u(~ pj , σj ) . Führt man die hermitesche Kongujation wie üblich durch, so kommt † † ū(~ pi , σi )γµ u(~ pj , σj ) = u(~ pi , σi )† γ0 γµ u(~ pj , σj ) = u(~ pj , σj )† 㵆 γ0† u(~ pi , σi ). Unter Verwendung der Beziehung 㵆 γ0† = 㵆 γ0 = γ0 γµ ergibt sich dann ∗ ū(~ pi , σi )γµ u(~ pj , σj ) = ū(~ pj , σj )γµ u(~ pi , σi ). 2 pi , σi }) oben eingesetzt Diese Relation kann dann zweimal in den Amplitudenbetragsquadrat M({~ werden. Nach Mittelung über einlaufende Spinzustände und Summe über auslaufende Spinzustände erhält man somit D X 2 E e4 M({~ ū(~ p3 , σ3 )γ µ u(~ p1 , σ1 ) ū(~ p1 , σ1 )γ ρ u(~ p3 , σ3 ) pi }) = 4(p1 − p3 )4 σ =± i i=1,2,3,4 × ū(~ p4 , σ4 )γµ u(~ p2 , σ2 ) ū(~ p2 , σ2 )γρ u(~ p4 , σ4 ). (IX.8) Für die einlaufenden Teilchen kann man die Vollständigkeitsrelation (III.33a) verwenden, um für i = 1, 2 die Summe über σi von u(~ pi , σi ) ū(~ pi , σi ) durch 6 pi + mi 14 zu ersetzen, mit m1 = me und m2 = mµ . Dazu hat man für eine beliebige 4×4-Matrix M die Gleichung 4 4 X X X X X ū(~ p, σ)M u(~ p, σ) = ū(~ p, σ)α Mαβ u(~ p, σ)β = Mαβ u(~ p, σ)β ū(~ p, σ)α . σ=± σ=± α,β=1 σ=± α,β=1 Dabei ist u(~ p, σ)β ū(~ p, σ)α das Matrixelement (β, α) der Matrix u(~ p, σ) ū(~ p, σ). Nach Summieren über σ findet man dann mithilfe der Vollständigkeitsrelation X 4 4 X X X ū(~ p, σ)M u(~ p, σ) = Mαβ u(~ p, σ) ū(~ p, σ) = Mαβ 6 p + m14 βα . σ=± α,β=1 σ=± βα α,β=1 d.h. X ū(~ p, σ)M u(~ p, σ) = Tr M 6 p + m14 . (IX.9) σ=± Unter Verwendung dieser Formel mit M = γ µ (6 p1 + me 14 )γ ρ bzw. M = γµ (6 p2 + mµ 14 )γρ wird die Summe über σ3 bzw. σ4 in Gl. (IX.8) trivial. Insgesamt ergibt sich D 2 E µ e4 ρ M({~ pi }) = Tr γ (6 p + m 1 )γ 6 p + m 1 Tr γ (6 p + m 1 )γ 6 p + m 1 . 1 e 4 3 e 4 µ 2 µ 4 ρ 4 µ 4 4(p1 − p3 )4 In der ersten Spur treten nur Größen auf, die das Elektron charakterisieren: dessen Masse und einund auslaufende Viererimpulse. Dagegen hängt die zweite Spur nur von dem Myon ab. Zudem ist der Ausdruck des gemittelten Amplitudenquadrats jetzt frei von Dirac-Spinoren, die durch Spuren von Produkten von Gamma-Matrizen ersetzt sind. Jene lassen sich durch die Formeln (III.8)–(III.10) sowie die Relation Tr γ µ γ ν γ ρ γ σ = 4 η µν η ρσ − η µρ η νσ + η µσ η νρ mit dem Produkt von vier DiracMatrizen ausdrücken.40 Mit deren Hilfe erhält man z.B. Tr γ µ (6 p1 + me 14 )γ ρ 6 p3 + me 14 = p1ν p3σ Tr γ µ γ ν γ ρ γ σ + m2e Tr γ µ γ ρ = 4 p1ν p3σ η µν η ρσ − η µρ η νσ + η µσ η νρ + m2e η µρ = 4 pµ1 pρ3 + pµ3 pρ1 − p1 · p3 − m2e η µρ , und in ähnlicher Weise Tr γµ (6 p2 + mµ 14 )γρ 6 p4 + mµ 14 = 4 p2µ p4ρ + p4µ p2ρ − p2 · p4 − m2µ ηµρ . 40 Weitere Identitäten für Spuren von Produkten von Gamma-Matrizen können in Lehrbüchern der Relativistischen Quantenmechanik oder der Quantenfeldtheorie gefunden werden, z.B. in Bjorken & Drell [26] Kap. 7.2 oder in Landau & Lifschitz [12] Kap. III § 22. Wechselwirkungen der Elementarteilchenphysik 81 N.BORGHINI Elementarteilchenphysik Schließlich findet man nach einigen einfachen Berechnungen D 2 E 8e4 M({~ pi }) = p1 · p2 p3 · p4 + p1 · p4 p2 · p3 − m2µ p1 · p3 − m2e p2 · p4 + 2m2e m2µ . 4 (p1 − p3 ) (IX.10) Man sieht, dass dieser gemittelte Amplitudenbetragsquadrat Lorentz-invariant ist. Bemerkung: Ähnlich der Beziehung (IX.11) kann man auch deren Pendant X v̄(~ p, σ)M v(~ p, σ) = Tr M 6 p − m14 (IX.11) σ=± für jede beliebige 4×4-Matrix M beweisen. Mottund Rutherford-Formel :::::::::::::::::::::::::::: Als letzter Schritt kann der Ausdruck (IX.10) in Gl. (VII.15) eingesetzt werden, um den differentiellen Wirkungsquerschnitt für den elastischen Prozess der Abb. IX.2 zu liefern. Die Berechnung im allgemeinen Fall stellt keine Schwierigkeit dar, es lohnt sich aber, den Grenzfall der Streuung des Elektrons an einem viel schwereren Spin- 12 -Teilchen zu betrachten, entsprechend mµ → ∞. In diesem Grenzfall kann man in einem ersten Fall annehmen, dass der Schwerpunktsystem der einlaufenden Teilchen gleich dem Ruhesystem des „Myons“ ist. Diese Näherung gilt, falls die (kinetische) Energie des Elektrons viel kleiner als die Massenenergie des Myons ist. Dann kann der Rückstoß des Letzteren vernachlässigt werden, d.h. es ruht noch nach dem Stoß.41 Unter diesen Annahmen reduziert sich die Energieerhaltung einfach auf Ep~1 = Ep~3 und daher auf die Erhaltung der kinetischen Energie des Elektrons, was zu |~ p1 | = |~ p3 | führt. Somit ist der zweite Faktor im rechten Glied der Gl. (VII.15) gleich 1. Dazu gilt (p1−p3 )2 = −(~ p1−~ p3 )2 = −4|~ p1 |2 sin2 2θ , mit θ dem Streuwinkel. Die sechs skalaren Produkte pi · pj in Gl. (IX.10) lassen sich auch sofort berechnen. Da das Myon immer in Ruhe bleibt, sind alle Produkte des Viererimpulses des Elektrons vor oder nach dem Stoß mit dem Viererimpuls des Myons einfach gleich mµ Ep~1 . Dann gilt p2 · p4 = m2µ . Schließlich kommt p1 · p3 = m2e + 2|~ p1 |2 sin2 2θ . Die letzte Vereinfachung besteht in der Approximation der Schwerpunktsenergie Ep~1 +Ep~2 durch Ep~2 = mµ .42 Dann führen Gl. (VII.15) und (IX.10) zu 1 h|M({~ pi })|2 i 1 1 8e4 d2 σ 2 2 2 2 2 θ ' = p1 | sin . 2 2mµ E1 − 2mµ |~ d2 Ω mµ →∞ 64π 2 m2µ 64π 2 m2µ −4|~ 2 p1 |2 sin2 2θ Unter Verwendung der Energie–Impuls-Beziehung für das einlaufende Elektron ergibt sich die sog. Mott-Streuformel 2 d2 σ 1 e4 αem 2 2 2 θ 2 2 2 θ ' me + |~ p1 | cos = me + |~ p1 | cos . (IX.12) d2 Ω mµ →∞ 64π 2 |~ 2 2 p1 |4 sin4 2θ 4|~ p1 |4 sin4 2θ Falls das einlaufende Elektron nicht-relativistisch ist, so dass der Betrag dessen Impuls |~ p1 | viel kleiner als me ist, dann lautet dieser Wirkungsquerschnitt 2 d2 σ αem ' , (IX.13) d2 Ω 2me |~v1 |2 sin2 2θ mit ~v1 der Geschwindigkeit des einlaufenden Elektrons. Dies ist gerade die Rutherford-Formel für die Streuung eines nicht-relativistischen klassischen — d.h. insbesondere ohne Spin — geladenen Teilchens in dem Coulomb-Feld eines festen Streuzentrums. 41 42 Dabei werden Terme von relativer Ordnung |~ p1 |/mµ oder |~ p3p |/mµ weggelassen, konsistent mit der Annahme. . . . unter Vernachlässigung der Energie des Elektrons Ep~1 = m2e + |~ p 1 |2 . Wechselwirkungen der Elementarteilchenphysik 82 N.BORGHINI Elementarteilchenphysik Wirkungsquerschnitt bei großem Energieübertrag ::::::::::::::::::::::::::::::::::::::::::::::: Für das folgende Kapitel ist es interessant, einen alternativen Ausdruck des Wirkungsquerschnitts herzuleiten, der auch für großen Energien des Elektrons gilt. Sei q ≡ p1 − p3 der Viererimpuls des virtuellen Photons, vgl. Abb. IX.2. Wegen der Energie– Impuls-Erhaltung gilt auch q = p4 − p2 . Nach quadrieren dieser Gleichungen kommen die Produkte p1 · p3 = m2e − q2 /2 und p2 · p4 = m2µ − q2 /2. Arbeitet man wieder im Ruhesystem des Myons vor dem Stoß, dann gelten noch p1 · p2 = mµ Ep~1 und p2 · p3 = mµ Ep~3 . Jetzt wird aber der Rückstoß des Myons nicht mehr vernachlässigt, so dass Ep~1 6= Ep~3 ist. Schließlich folgen aus p4 = p2 + q die Produkte p1 · p4 = mµ Ep~1 + q2 /2 und p3 · p4 = mµ Ep~3 − q2 /2. Nach Einsetzen dieser Produkte in Gl. (IX.10) ergibt sich der exakte Ausdruck D 2 2 E 8e4 q2 2 2 2 q M({~ pi }) = 4 2mµ Ep~1 Ep~3 + mµ (Ep~3 − Ep~1 ) + (me + mµ ) . q 2 2 Jetzt wird m2e gegen m2µ in diesem gemittelten Betragsquadrat vernachlässigt. Dazu wird angenommen, dass das Elektron relativistisch ist, so dass dessen Massenenergie vernachlässigbar gegen dessen Energie Ep~1 oder Ep~3 ist. Diese Hypothese führt zu q2 = 2m2e − 2Ep~1 Ep~3 + 2~ p1 · p~3 ' −2Ep~1 Ep~3 (1 − cos θ). Schließlich erkennt man bei Ep~3 − Ep~1 die 0-Komponente von p3 − p1 = −q, was auch als 1 2 2 2 q · p2 q2 2 (q + p2 ) − q − p2 Ep~3 − Ep~1 = − =− = mµ mµ 2mµ geschrieben werden kann. Diese Resultate führen schließlich nach einiger Algebra zu D 2 E 16e4 2 q2 2 θ 2 θ M({~ pi }) = 4 mµ Ep~1 Ep~3 cos − sin . q 2 2m2µ 2 (IX.14) Dieser gemittelte Amplitudenquadrat darf nicht in den Ausdruck (VII.15) des Wirkungsquerschnitts eingesetzt werden, weil das verwendete Bezugssystem nicht das Schwerpunktsystem der einlaufenden Teilchen ist. Stattdessen sollte man mit der unintegrierten Version von Gl. (VII.9) anfangen: D 2 E 1 d3 p~3 d3 p~4 d6 σ(~ p3 , p~4 ) = (2π)4 δ (4) (p3 + p4 − p1 − p2 ) M({~ pi }) . 4|~v1 |Ep~1 mµ (2π)3 2Ep~3 (2π)3 2Ep~4 Da das Elektron relativistisch ist, gelten |~v1 | ' 1 sowie d3 p~3 = |~ p3 |2 d|~ p3 | d2 Ω ' E 02 dE 0 d2 Ω mit E 0 der Energie des Elektrons nach dem Stoß, d.h. D 3 2 E E0 dE 0 d2 Ω d p~4 δ (4) (p3 + p4 − p1 − p2 ) M({~ d6 σ(E 0 , Ω, p~4 ) = p }) i 32π 2 Ep~1 m2 2Ep~4 e4 θ q2 d3 p~4 (4) 0 2 2 θ = 2 4 mµ E 02 cos2 − sin dE d Ω δ (p4 − p2 − q). 2π q 2 2m2µ 2 2Ep~4 Wenn der Impuls des auslaufenden Myons nicht gemessen wird, kann man nach p~4 integrieren. Dabei gibt die Beziehung (VI.20) Z d3 p~4 δ (4) (p4 − p2 − q) = δ (p2 + q)2 − m2µ = δ 2p2 · q + q2 . 2Ep~4 Somit ergibt sich schließlich 2 d3 σ 4αem q2 p2 · q q2 02 2 θ 2 θ = E cos − sin δ + . dE 0 d2 Ω q4 2 2m2µ 2 mµ 2mµ Führt man die Änderung der Energie des Elektrons ν ≡ (p2 · q)/mµ ein, so lautet dies 2 d3 σ 4αem q2 q2 02 2 θ 2 θ = E cos − sin δ ν+ . dE 0 d2 Ω q4 2 2m2µ 2 2mµ Wechselwirkungen der Elementarteilchenphysik 83 N.BORGHINI Elementarteilchenphysik 2 Schließlich kann q4 im Nenner des Vorfaktors noch durch [2EE 0 (1 − cos θ)]2 = 4EE 0 sin2 2θ , mit E der Energie des Elektrons vor dem Stoß, ersetzt werden. Es kommt dann 2 2 q2 p2 · q d3 σ αem q2 2 θ 2 θ cos δ ν+ mit ν ≡ . (IX.15) = − sin 0 2 2 θ 2 dE d Ω 2 2mµ 2 2mµ mµ 2E sin 2 Diese Form wird sich für die Diskussion der tiefinelastischen Elektron–Proton-Streuung im nächsten Kapitel (Abschn. X.2.1) als günstig erweisen. Literatur • Berger [27], Kap. 3. • Griffiths [15], Kap. 7.5–7.9. • Halzen & Martin [28], Kap. 6. • Nachtmann [13], Kap. 9–11. Wechselwirkungen der Elementarteilchenphysik 84 N.BORGHINI Elementarteilchenphysik X. Starke Wechselwirkung In diesem Kapitel wird auf eine weitere Wechselwirkung eingegangen, und zwar auf die starke Wechselwirkung, die ursprünglich eingeführt wurde, um die Bindungskraft zwischen Protonen und Neutronen im Atomkern zu erklären. Jene starke Wechselwirkung stellt einen krassen Gegensatz zur Quantenelektrodynamik dar, indem die unterliegende Theorie extrem kompliziert zu lösen ist, insbesondere weil Störungsrechnung für manche Phänomene fast nutzlos ist. Dazu können die heutzutage als elementar betrachteten Teilchen, die der starken Wechselwirkung unterliegen, d.h. die Quarks, nicht isoliert voneinander werden, sondern kommen sie immer innerhalb Hadronen vor. Somit ist es zunächst interessant zu zeigen, aus welchen Überlegungen auf die Existenz der Quarks geschlossen wird. Diese Folgerung entsteht einerseits aus einer Klassifizierung der verschiedenen Hadronen nach einigen ihrer Quantenzahlen, im Rahmen des Quarkmodells (Abschn. X.1). Andererseits deuten einige experimentelle Ergebnisse auf eine innere Struktur des Protons hin, insbesondere Daten, gewonnen in Streuexperimenten mit Elektronen an Protonen, die zum Partonmodell führen (Abschn. X.2). Schließlich werden in Abschn. X.3 einige Ideen der Theorie der starken Wechselwirkung zwischen Quarks, die als Quantenchromodynamik bezeichnet wird, kurz dargestellt. X.1 Quarkmodell In der Klassifizierung der vielen bekannten Hadronen nach den Werten ihrer gemessenen Spin, elektrischen Ladung und Strangeness haben Gell-Mann und Ne’eman 1961 eine einfache Struktur entdeckt [29, 30], die als „Eightfold Way“ (achtfacher Weg) bezeichnet wird (Abschn. X.1.1). Ein weiterer Schritt, entsprechend dem Quarkmodell , ist die Erklärung dieser Struktur durch die Existenz von elementaren Bausteinen in den Hadronen (Gell-Mann [31] und Zweig [32], 1964). X.1.1 Eightfold Way Hadronen lassen sich durch verschiedene Quantenzahlen charakterisieren. Diese entsprechen oft Symmetrien, unter denen die Wechselwirkungen invariant sind, und sind deshalb in Prozessen erhalten.43 Insbesondere sind die elektrische Ladung Q und der (gesamte) Spin J immer erhalten, sowie die Strangeness S solange die schwache Wechselwirkung keine Rolle spielt. Basierend auf diesen drei Quantenzahlen kann man Regelmäßigkeiten bei den Hadronen erkennen. Somit werden in Abb. X.1 die leichten Mesonen mit J = 0 bzw. J = 1 in Neunergruppen unS = +1 - S=0 - S = −1 - K0 • K+ • K ∗0 • K ∗+ • A A A A A A A A π − • A A A A A η η0 • • • π0 ρ− • A A A A A A + A• π • K̄ 0 A• K− A K A Q = −1 A K A Q=0 ω φ • • • ρ0 • K̄ ∗0 A• K ∗− KA A Q = +1 A + A• ρ KA A Q = −1 KA A Q=0 KA A Q = +1 Abbildung X.1: Leichte Mesonen mit J = 0 (links) und mit J = 1 (rechts). 43 Symmetrien werden in Abschn. X.3.3 länger diskutiert. Wechselwirkungen der Elementarteilchenphysik 85 N.BORGHINI Elementarteilchenphysik terteilt, während die leichten Baryonen mit J = 12 bzw. J = 32 sich in eine Achtergruppe (Abb. X.2) und eine Zehnergruppe (Abb. X.3) aufteilen. Dazu können weitere ähnliche Neuner- bzw. Achteroder Zehnergruppen für die schwereren Mesonen bzw. Baryonen auch gefunden werden (vgl. z.B. die nachgedruckten Artikel in Teil III der Artikelsammlung [33]). n S=0 - p • • A A A S = −1 - S = −2 - Σ−• A A A A A Σ0 • • Λ A A A• Σ+ • Ξ0 A• Ξ− KA A KA A KA A Q = −1 Q = +1 Q=0 Abbildung X.2: Leichte Baryonen mit J = 21 . S=0 - ∆− • ∆0 • ∆+ • ∆++ • A A A A S = −1 Σ∗0 • A - Σ∗−A• • Σ∗+ A A A - A Ξ∗− •A A ∗0 • Ξ A A A S = −3 Q = +2 A S = −2 KA A - A• KA A Q = +1 KA A Q=0 Ω− KA A Q = −1 Abbildung X.3: Leichte Baryonen mit J = 23 . Bei diesen Teilchengruppen handelt es sich auf den ersten Blick nur um bildliche Darstellungen. Sowohl Gell-Mann als auch Ne’eman haben aber auch bemerkt, dass 8, 9 oder 10 den Grad einfacher unitärer Darstellungen der Gruppe SU(3) sein können. Somit gibt das Tensorprodukt zweier Darstellungen von Grad 3 (und zwar der Fundamentaldarstellung und deren komplex konjugierten) eine Darstellung von Grad 9.44 Wiederum kommen irreduzible Darstellungen von Grad 10 und 8 im Tensorprodukt von drei Darstellungen vom Grad 3 vor. 44 Diese lässt sich dann als direkte Summe irreduzibler Darstellungen von Grad 8 und 1 schreiben, 3 ⊗ 3̄ = 8 ⊕ 1, wobei die Darstellung vom Grad 1 im Fall der leichten Mesonen mit J = 0 dem η 0 entspricht, das deutlich schwerer als die acht anderen ist. Wechselwirkungen der Elementarteilchenphysik 86 N.BORGHINI Elementarteilchenphysik Der nächste Schritt, den Gell-Mann und Zweig als erste gemacht haben, besteht in der Identifikation der Fundamentaldarstellung und deren komplex konjugierten mit elementaren Bausteinen, aus denen die Mesonen und Baryonen bestehen. Physikalisch steht die Fundamentaldarstellung bzw. deren komplex konjugierte für drei Teilchen bzw. deren Antiteilchen, die als Quarks bzw. Antiquarks bezeichnet werden. Dann bestehen Mesonen aus einem Quark und einem Antiquark, und Baryonen aus drei Quarks. Um die Quantenzahlen der Hadronen wiederzugeben, werden den Quarks geeignete Werte der Quantenzahlen zugeordnet. Somit haben alle Quarks den Spin J = 21 und die Baryonenzahl B = + 13 . Die Werte der elektrischen Ladung Q und der Strangeness S für die u (up), d (down) und s (strange) Quarks, aus denen die in den Abb. X.1–X.3 dargestellten Hadronen bestehen, werden in Abb. X.4 angegeben. S=0 - d • A A A A S = −1 - u • A A• s̄ • A K A Q = + 23 s A A A A A A• • KA A Q = − 31 S = +1 S=0 d¯ ū A K A Q = − 23 KA A Q = + 31 Abbildung X.4: Quarks und Antiquarks, aus denen die Hadronen der Abb. X.1–X.3 bestehen. Bemerkungen: ∗ Die obige Diskussion lässt sich auf eine größere Anzahl Nf der Quark-Flavours verallgemeinern: um die Hadronen mit Charm und solche mit Beauty (auch „Bottomness“ genannt) zu beschreiben, führt man die c (charm) und b Quarks mit jeweiligen elektrischen Ladungen Q = + 32 und Q = − 31 ein. Für Hadronen bestehend aus u, d, s und c-Quarks kann man dreidimensionale Verallgemeinerungen der Abb. X.1–X.3 darstellen, z.B. Sechzehnergruppen von Mesonen mit J = 0 oder mit J = 1 oder Zwanzigergruppen von Baryonen (vgl. Abb. 14.1 und 14.4 der Review of Particle Properties [16]). Dazu kommt noch das t (top) Quark, mit der elektrischen Ladung Q = + 23 , mit dem aber kein bekanntes Hadron gebildet wird. ∗ Die SU(3)-Gruppe, die zu Grunde der Überlegungen von Gell-Mann und Ne’eman lag, wird SU(3)-Flavour-Gruppe genannt, und oft als SU(3)f bezeichnet. ∗ Als zweite Achse neben der Strangeness in den Abb. X.1–X.4 verwendet man auch die Isospin3-Komponente I3 (vgl. Abschn. X.3.3 a unten) statt der elektrischen Ladung Q. Jene Quantenzahl nimmt die Werte I3 = + 21 für das u-Quark, I3 = − 12 für das d-Quark und I3 = 0 für das s-Quark an. Ein großer Erfolg des Quarkmodells war die Vorhersage eines Baryons mit Q = −1 und S = −3, das in die untere Ecke in Abb. X.3 passen würde, und für welches Gell-Mann eine Masse von 1685 MeV/c2 berechnet hatte. Tatsächlich wurde ein solches Baryon, das Ω− , mit einer Masse von 1672 MeV/c2 bald darauf entdeckt [34]. Dennoch weist das Modell auch zwei große Probleme auf, so dass es lange nur als eine günstige mathematische Beschreibung ohne physikalische Deutung angesehen wurde. Erstens konnten isolierte Quarks nicht beobachtet werden — und wurden seitdem noch nie gesehen. Zweitens stellten ein paar Baryonen, z.B. die Ecken ∆++ = uuu, ∆− = ddd und Ω− = sss des J = 23 -Dekupletts der Wechselwirkungen der Elementarteilchenphysik 87 N.BORGHINI Elementarteilchenphysik Abb. X.3, anscheinend einen Widerspruch zum Pauli-Prinzip dar, da die drei identischen Quarks den gleichen Spinzustand haben. Um das zweite Problem zu beseitigen wurde eine ad hoc Quantenzahl eingeführt, die Farbe, die in drei Varianten — „rot“, „grün“ und „blau“ — vorkommen kann und durch die Quarks getragen wird, während die Antiquarks die zugehörigen „Antifarben“ tragen. Dazu wurde postuliert, dass nur farblose Kombinationen von Quarks und Antiquarks als freie Teilchen auftreten können,45 was das erste Problem löst — natürlich eher künstlich, da mit Hilfe eines Postulats. Unter diesen Annahmen ist die Wellenfunktion eines ∆++ , ∆− oder Ω− total symmetrisch unter dem Austausch der Spins oder der Orte der Quarks, hat aber einen total antisymmetrischen Farbanteil. Gemäß der Farbhypothese gibt es also nicht nur einen, sondern Nc = 3 verschiedene u-Quarks, drei d-Quarks, usw., was beobachtbar sein sollte. X.1.2 Hadronenerzeugung in Elektron–Positron-Kollisionen Um die durch die Einführung der Farbquantenzahl implizierte Multiplikation der Freiheitsgrade besser in den Griff zu bekommen, kann man die Quark–Antiquark-Paarerzeugung in inelastischen Elektron–Positron-Kollisionen in Betracht ziehen. Betrachte also die Erzeugung in einem solchen Streuprozess von einem Teilchen–AntiteilchenPaar, wobei das erzeugte Teilchen die Masse m und die elektrische Ladung Q hat. Hiernach wird m immer viel größer als die Elektronenmasse me sein. Zur niedrigsten Ordnung ist der Prozess rein quantenelektrodynamisch und dessen Amplitude wird durch ein einziges Feynman-Diagramm gegeben, ähnlich dem Diagramm der Abb. IX.8 (entsprechend Myon-Paarerzeugung) oder der Abb. IX.9 (entsprechend Quark–Antiquark-Paarerzeugung). Die zugehörige Amplitude lautet Qe2 M= v̄(~ p2 , σ2 )γµ u(~ p1 , σ1 ) ū(~ p3 , σ3 )γ µ v(~ p4 , σ4 ) 2 (p1 + p2 ) und führt zum totalen Wirkungsquerschnitt [vgl. Gl. (IX.5)] s 2 α2 4π Q 1 − 4m2 /s 2m2 2m2e em − + σtot (e +e → Teilchen–Antiteilchen-Paar) = 1+ 1+ , 3 s 1 − 4m2e /s s s √ mit s der Schwerpunktsenergie der einlaufenden Teilchen. Ist die Letztere viel größer als zweimal √ der Masse der auslaufenden Teilchen s 2m 2me , so findet man nach einer trivialen TaylorEntwicklung 2 4π Q2 αem σtot (e− +e+ → Teilchen–Antiteilchen-Paar) ' , (X.1) 3 s wobei die weggelassenen Terme der Ordnung O(m4 /s2 ) sind. Dabei kann man die rechte Seite der √ Gleichung noch mit Θ( s − 2m) multiplizieren, mit Θ der Heaviside-Funktion, um die Erzeugungsschwelle des Paars in die Formel einzubeziehen. Jetzt kann jenes Ergebnis auf den Fall der Erzeugung eines Quark–Antiquark-Paares angewandt √ werden, für ein Quark mit Flavour f und elektrischen Ladung Qf . Wenn s 2mqf gibt Gl. (X.1) den totalen Wirkungsquerschnitt für die Erzeugung eines qf q̄f -Paares, wobei das Quark eine bestimmte Farbe hat, entweder rot oder grün oder blau. Will man den totalen Wirkungsquerschnitt für die Erzeugung eines Quark–Antiquark-Paares mit beliebiger Farbe erhalten, so muss man über die drei Farben summieren: 2 2 2 X 4π Q2f αem 4π Qf αem = Nc . (X.2) σtot (e− +e+ → qf + q̄f ) ' 3 s 3 s a=r,g,b Somit hängt der Wirkungsquerschnitt von der Anzahl der Farben ab. In einem Experiment werden Quarks nicht beobachtet, sondern nur Hadronen. Die Erzeugung des Quark–Antiquark-Paares qf q̄f ist somit nur ein Zwischenschritt des komplizierteren Prozesses e− + e+ → qf + q̄f → Hadronen, 45 (X.3) Dabei gilt die Summe gleicher Mengen von rot, grün und blau als farblos. Wechselwirkungen der Elementarteilchenphysik 88 N.BORGHINI Elementarteilchenphysik wie in Abb. X.5 schematisch dargestellt wird, und man untersucht Hadronenerzeugung, statt Quark– Antiquark-Paarerzeugung. Zur niedrigsten Ordnung in αem werden alle Hadronen über einen sol Meson Meson Meson q̄ 0 q0 qf q̄f γ e+ e− Abbildung X.5: Elektron–Positron-Vernichtung in Hadronen-Jets. chen Prozess erzeugt. Dabei kann aber der Flavour des Quarks im Zwischenzustand beliebig sein, solange die Energie ausreicht, um das entsprechende Paar zu erzeugen. Somit ist der totale Wirkungsquerschnitt für Hadronenerzeugung die Summe über die Flavours der Wirkungsquerschnitte für qf q̄f -Paarerzeugung. Unter Berücksichtigung der Formel (X.2) ergibt sich − + σtot (e +e → Hadronen) ' Nc 2 X 4π Q2f αem f 3 s √ Θ( s − 2mqf ), (X.4) √ wobei dieses Resultat für Energien s weit von den Paar-Erzeugungsschwellen 2mqf gilt. Teilt man diesen Wirkungsquerschnitt durch jenen für Myon-Paarerzeugung, der sich auch durch Gl. (X.1) approximieren lässt, so findet man X √ √ σtot (e− +e+ → Hadronen) (X.5) ' Nc Q2f Θ( s − 2mqf ). R( s) ≡ − + − + σtot (e +e → µ +µ ) f √ Je nach dem Wert von s nimmt die Summe im rechten Glied nur diskrete Werte an, die von den elektrischen Ladungen Qu = Qc = Qt = 32 und Qd = Qs = Qb = − 13 der Quarks abhängen. Wiederum nimmt das Verhältnis auch nur diskrete Werte an, die direkt proportional zu Nc sind: √ 2 Nc für 2ms s 2mc 3 √ √ R( s) ' 10 s 2mb 9 Nc für 2mc √ 11 s 2mt 9 Nc für 2mb √ √ und R( s) ' 53 Nc für s 2mt . √ Experimentell beobachtet man sukzessive Stufen mit R ≈ 2 für 2ms s 2mc , R ≈ 3, 33 √ √ für 2mc s 2mb , und R ≈ 3, 67 für 2mb s 2mt .46 Diese Messungen entsprechen somit einer Messung der Anzahl der Farben und liefern Nc = 3. Das heißt, dass jedes Quark mit gegebenem Flavour wirklich in drei unterschiedlichen Versionen auftreten kann, so dass die Farbhypothese bestätigt ist. Bemerkung: Die Berechnung des Wirkungsquerschnitts (X.2), und somit des Verhältnisses (X.5), beruht auf der Annahme, dass die auslaufenden Quarks wechselwirkungsfreie on-Shell-Teilchen sind. 46 Hier sollte ich wahrscheinlich ein Plot einführen... wenn ich Zeit finde! N.B. Wechselwirkungen der Elementarteilchenphysik 89 N.BORGHINI Elementarteilchenphysik Doch im Prozess (X.3) sind jene Quarks nur off-Shell virtuelle Teilchen. Somit soll es nicht über√ raschend sein, wenn das experimentelle Verhältnis R( s) stark von der einfachen Vorhersage (X.5) √ abweicht. Dies ist insbesondere der Fall für eine Schwerpunktsenergie s in der Nachbarschaft der Masse eines gebundenen q q̄-Zustands, d.h. wenn ein Quark und dessen Antiquark zu einem Meson verbinden können, vorausgesetzt sie miteinander (stark) wechselwirken können. Wechselwirkungen der Elementarteilchenphysik 90 N.BORGHINI Elementarteilchenphysik X.2 Partonmodell Dem Quarkmodell nach sind Hadronen, insbesondere Protonen, keine Elementarteilchen, sondern bestehen aus mehr fundamentalen Freiheitsgraden. Daher sollte das Proton eine innere Struktur besitzen, die sich experimentell nachweisen lassen sollte. Um das Innere des Protons zu untersuchen, soll die „Sonde“ eine kurze Wellenlänge bzw. eine hohe Energie haben. Dies wird in Streuexperimenten realisiert, in denen ein Lepton — insbesondere ein Elektron — an dem Proton stößt, wobei das Letztere zerstört wird (Abschn. X.2.1). Dabei entdeckt man, dass das Proton aus punktförmigen Freiheitsgraden besteht (Abschn. X.2.2), die sich anscheinend frei im Proton bewegen. X.2.1 Tiefinelastische Streuung Historisch zeigte die Verteilung der gestreuten α-Teilchen im Rutherford-Experiment, dass das Atom eine innere Struktur besitzt. In ähnlicher Weise können geladene Leptonen an Hadronen beschleunigt werden, wobei das Lepton ein virtuelles Photon emittiert, das die Struktur des Hadrons untersucht. Hiernach wird erstens die Kinematik eines solchen Prozesses eingeführt. Dann wird die Parametrisierung des differentiellen Wirkungsquerschnitts für das gestreute Lepton dargestellt. ) X.2.1 a Kinematik :::::::::::::::::: Betrachte die in Abb. X.6 dargestellte inelastische Streuung eines hochenergetischen Elektrons mit Viererimpuls k ≡ (E, ~k) an einem Proton mit Viererimpuls P. Dabei sind k und P durch die experimentellen Bedingungen bestimmt, und deshalb bekannt. X e− JJ k0] θ q- k ] JJP e− p Abbildung X.6: Kinematik der tiefinelastischen Streuung eines Elektrons an einem Proton. Nach dem Stoß wird nur das gestreute Elektron gemessen, während der Rest — die aus der Zerstörung des Protons stammenden Hadronen — nicht identifiziert wird. Dieser inklusive inelastische Prozess wird als e− + p → e− + X (X.6) 0 0 0 ~ geschrieben. Sei k ≡ (E , k ) der Viererimpuls des Elektron nach dem Stoß und q ≡ k − k0 der Viererimpuls des virtuellen Photons. Da alles über X unbekannt ist — bis auf dem gesamten Viererimpuls P + q —, bleiben für die kinematischen Größen des Elektrons nach dem Stoß mehr unabhängige Freiheitsgrade, als im Fall elastischer Streuung. Somit können noch zwei kinematische Variablen als unabhängig angenommen werden, z.B. die Energie E 0 nach dem Stoß und der Streuwinkel θ — diese reichen aus, um den auslaufenden Viererimpuls vollständig zu charakterisieren. Sowohl E 0 als auch θ hängen vom Bezugssystem ab. In theoretischen Überlegungen benutzt man eher die Lorentz-invarianten Größen q·P Q2E ≡ −q2 , ν≡ (X.7a) mp mit mp der Protonenmasse. Die zweite Größe kann äquivalent durch die Bjorken-x Variable xBj ≡ Q2E Q2E = 2mp ν 2q · P Wechselwirkungen der Elementarteilchenphysik (X.7b) 91 N.BORGHINI Elementarteilchenphysik ersetzt werden. Dabei ist der Zusammenhang zwischen den Variablenpaaren (E 0 , θ) und (Q2E , ν) eindeutig. Bemerkung: Man kann zeigen, dass Q2E und ν positiv sind, und dass 0 ≤ xBj ≤ 1. X.2.1 b Bjorken-Skalenverhalten ::::::::::::::::::::::::::::::: Für hohe Energien E me parametrisiert man den differentiellen Wirkungsquerschnitt für das gestreute Elektron als 2 αem d3 σ 2 2 θ 2 2 θ W2 (ν, QE ) cos . (X.8) = + 2W1 (ν, QE ) sin dE 0 d2 Ω 2 2 2E sin2 2θ W1 und W2 werden Strukturfunktionen des Protons genannt. Diese spiegeln Eigenschaften dessen inneren Struktur wider, und sind experimentell gut bekannt. Bemerkung: Für die elastische Streuung eines Elektrons mit Energie E an einem punktförmigen Spin- 21 -Elementarteilchen mit Masse m und elektrischer Ladung Q = 1 gilt [vgl. Gl. (IX.15)] 2 2 d3 σ q2 αem q2 2 θ 2 θ cos δ ν+ , = − sin dE 0 d2 Ω 2 2m2 2 2m 2E sin2 2θ wobei die δ-Funktion die Energie E 0 des Elektrons nach dem Stoß bestimmt. Eine solche Formel folgt aus Gl. (X.8), wenn man für die Strukturfunktionen die Formen Q2 Q2 Q2E Q2E Q2E 1 2 2W1 (ν, Q2E ) = E2 δ ν − E = δ 1 − , W (ν, Q ) = δ 1 − (X.9) 2 E 2m 2m 2m2 ν 2mν ν 2mν annimmt. In diesem Fall hängen mW1 und νW2 nur vom dimensionslosen Verhältnis Q2E /2mν. Für den Streuprozess (X.6) hat Bjorken 1969 aus theoretischen Überlegungen vorgeschlagen [35], dass im Limes Q2E → ∞, ν → ∞ bei festem xBj ≡ Q2E /2mp ν die Funktionen mp W1 (ν, Q2E ) und νW2 (ν, Q2E ) nur von der Variable xBj abhängen mp W1 (ν, Q2E ) → F1 (xBj ), νW2 (ν, Q2E ) → F2 (xBj ). (X.10) Diese Eigenschaften wird als Bjorken-Skalenverhalten bezeichnet. Das Argument beruht teilweise auf einer dimensionalenpAnalyse: Die Funktionen mp W1 und νW2 sind dimensionslos. Im hochenergetischen Limes Q2E → ∞, ν → ∞ werden me , mp vernachlässigbar, und die Funktionen können nur von einer dimensionslosen Variable abhängen. Dazu haben Callan und Gross vorhergesagt [36], dass für nicht zu kleine Werte von xBj , die Funktionen F1 und F2 einfach über die Beziehung 2xBj F1 (xBj ) = F2 (xBj ) (X.11) verknüpft sind. Diese theoretischen Vorhersagen wurden kurz darauf experimentell am SLAC bestätigt [37, 38]. Dabei bedeuten das Bjorken-Skalenverhalten und die Callan–Gross-Beziehung, dass die Parametrisierung des Wirkungsquerschnitts (X.8) schon mit einer Funktion von einer einzigen Variable erfolgt, statt zwei Funktionen von zwei Variablen betrachten zu müssen. Das Proton muss also eine spezielle Struktur haben, die zu dieser Vereinfachung führt. X.2.2 Partonen Die Strukturfunktionen (X.9) für elastische Streuung an punktförmigen Teilchen genügen dem Bjorken-Skalenverhalten (X.10) und der Callan–Gross-Beziehung (X.11). Diese Tatsache deutet auf eine mögliche Erklärung — das sog. Partonmodell — dafür hin, warum beide Relationen auch in tiefinelastischen experimentell Streuungen an Protonen experimentell beobachtet werden. Wechselwirkungen der Elementarteilchenphysik 92 N.BORGHINI Elementarteilchenphysik Dieses Modell beruht auf der Grundidee, dass in solchen Prozessen (X.6) alles passiert, als ob das durch das Elektron emittierte virtuelle Photon mit einer Wahrscheinlichkeit f (x) an einem freien punktförmigen Teilchen mit Viererimpuls xP elastisch stoße, wobei P den Viererimpuls des Protons bezeichnet und 0 < x < 1 ist. Diese punktförmigen Bestandteilchen des Protons werden Partonen genannt,47 und die Partonverteilungsfunktion f (x) stellt eine Eigenschaft des Protons dar. Verallgemeinert man diese Grundidee, so führt man verschiedene Arten von Partonen — hier gekennzeichnet durch einen Index i — mit jeweiliger Partonverteilungsfunktion fi und elektrischer Ladung Qi . Die unterschiedlichen Arten werden später weiter diskutiert. Sind das Lorentz-Quadrat q2 = −Q2E des Viererimpulses des virtuellen Photons und sein Energie ν im Ruhesystem des Protons fest, so kann der Viererimpuls xP des an dem Stoß beteiligten Partons nicht beliebig sein. Die Strukturfunktionen für elastische Streuung (X.9) zeigen nämlich, dass die „Masse“ m des Partons genau gleich Q2E /2ν sein soll. Diese Masse lässt sich aus der Energie– Impuls-Beziehung als m2 = (xP)2 = x2 m2p ausdrücken, so dass die Bedingung über m zu einer Bedingung über den durch das beteiligte Parton getragenen Bruchteil x des Protonenviererimpulses wird. Genauer muss x = Q2E /2mp ν gelten, d.h. der Bruchteil x ist gleich der Bjorken-Skalenvariable xBj . Dann ist die Strukturfunktion F2 des Protons gegeben durch X F2 (x) = x Q2i fi (x) für 0 ≤ x ≤ 1, (X.12) i wobei die Summe über alle Arten von Partonen läuft. Dazu werden sowohl das Bjorken-Skalenverhalten und als auch die Callan–Gross-Beziehung automatisch erfüllt, wie sich an Gl. (X.9) erkennen lässt. Bemerkung: Summiert man den Viererimpuls xP eines Partons multipliziert mit der Wahrscheinlichkeit fi (x), dass ein Parton i den Bruchteil x trägt, über alle möglichen Werte von x und alle Arten von Teilchen, so soll man den gesamten Viererimpuls P des Protons finden, d.h. Z 1X Z 1X P= fi (x) xP dx ⇔ fi (x) x dx = 1. (X.13) 0 i 0 i Die letztere Gleichung ist eine sog. Summenregel , der die Verteilungsfunktionen genügen müssen. Eine ausführliche Analyse der experimentellen Daten im Rahmen des Partonmodells führt zur Einführung von drei großen Klassen von Partonen in einem Hadron: • Erstens gibt es „Valenz-Quarks“ mit Verteilungsfunktionen uv (x), dv (x). Dabei ist xuv (x) bzw. xdv (x) in einem Proton maximal für x ≈ 0, 1–0, 2, mit xuv (x) ≈ 32 bzw. xdv (x) ≈ 13 , d.h. solche u- bzw. d-Quarks tragen etwa 32 bzw. 13 des Protonenimpulses. Dies entspricht den drei Quarks uud des Quarkmodells. In einem Hadron mit Strangeness, Charm oder Beauty treten natürlich auch Valenz-s-, c- oder b-Quarks mit jeweiliger Verteilungsfunktion. • Eine zweite Klasse besteht aus sog. „See-Quarks“, entsprechend virtuellen Quark–AntiquarkPaaren, mit Verteilungsfunktionen us (x), ūs (x), ds (x), d¯s (x), s(x), s̄(x). . . Diese See-Quarks tragen nur einen geringen Anteil des gesamten Impuls. Das Produkt xfi (x) wird für x . 0, 01– 0, 1 aber größer als für die Valenzquarks. Die Kinematik zeigt, dass Valenz- und See-Quarks den Spin 1 2 haben. • Schließlich findet man noch Partonen mit dem Spin 1, die sich mit den Gluonen identifizieren lassen, mit einer Verteilungsfunktion g(x). Diese haben keine elektrische Ladung, und tragen also nicht direkt zu F2 (x) bei. Sie müssen aber berücksichtigt werden, da sie teil des Gesamt47 Die Bezeichnung wurde durch Feynman eingeführt [39]. Wechselwirkungen der Elementarteilchenphysik 93 N.BORGHINI Elementarteilchenphysik impulses des Protons tragen; insbesondere ist für x . 0, 01 das Produkt xg(x) größer als die Summe der xfi (x) über alle anderen Arten von Partonen: bei kleinem x besteht ein Hadron meistens aus Gluonen. Ein Beispiel von Partonverteilungsfunktionen für die Valenz-u- und d-Quarks, See-Quarks und Gluonen im Proton wird in Abb. X.7 dargestellt. June 2011 Q2 = 10 GeV2 HERAPDF1.7 (prel.) exp. uncert. 0.8 model uncert. parametrization uncert. HERAPDF Structure Function Working Group xf HERA I+II inclusive, jets, charm PDF Fit 1 xuv 0.6 HERAPDF1.6 (prel.) 0.4 xg (× 0.05) xdv 0.2 xS (× 0.05) 10-4 -3 10 10-2 10-1 x 1 Abbildung X.7: Partonverteilungsfunktionen in einem Proton für Valenz-u- und d-Quarks (uv , dv ), See-Quarks (S) und Gluonen (g), multipliziert mit x, laut den H1 & ZEUS-Experimenten am HERA Beschleuniger. Aus https://www.desy.de/h1zeus/combined_results/index.php?do=proton_structure. Eine genauere Untersuchung der Strukturfunktion F2 des Protons zeigt, dass sie tatsächlich nicht nur Funktion der Bjorken-Skalenvariable xBj ist, sondern hängt auch von Q2E ab, wenn xBj kleiner als etwa 0, 1 wird. Das heißt, dass das Skalenverhalten (X.10) verletzt ist. Dementsprechend sind die Partonverteilungsfunktionen Funktionen von x und Q2E , fi (x, Q2E ): je nach der Auflösung, mit der das Proton untersucht wird — grob gesagt stellt (Q2E )−1/2 die typische Längenskala der kleinsten Details dar, die das virtuelle Photon auflösen kann —, sieht das Proton unterschiedlich aus, insbesondere bei kleinem x. Diese Abhängigkeit nach Q2E lässt sich im Rahmen der Quantenchromodynamik, die im folgenden Abschnitt kurz vorgestellt wird, berechnen. X.3 Quantenchromodynamik Die Theorie der starken Wechselwirkung, die hinter dem Quark- und dem Partonmodell steht und die zugehörigen Phänomene erklären kann, ist die Quantenchromodynamik (QCD). Dabei handelt es sich um eine sog. nicht-abelsche Eichfeldtheorie, basierend auf eine Gruppe SU(3), die als Farbgruppe bezeichnet wird, und daher noch als SU(3)c geschrieben wird. Betrachtet man die drei möglichen Dirac-Spinoren qfa mit a = r, g, b für einen gegebenen QuarkFlavour f als die drei möglichen Komponenten eines Vektors qf im „Farbraum“ — wobei jede Komponente aus einem Quark-Spinor mit fester Farbe besteht —, so folgt die QCD aus der Wechselwirkungen der Elementarteilchenphysik 94 N.BORGHINI Elementarteilchenphysik Forderung, dass die Physik invariant unter lokalen SU(3)c -Transformationen der Vektoren qf , die sich als Tripletts transformieren, sein soll, entsprechend einer Eichinvarianz . In diesem Abschnitt werden nur einige Elemente der QCD dargestellt, und zwar erstens die Vertices der Theorie (Abschn. X.3.1) — welche die möglichen Prozesse festlegen —, dann einige wichtigen Vorhersagen der Theorie — die nur auf einer qualitativen Ebene in Abschn. X.3.2 diskutiert werden. Schließlich befasst sich Abschn. X.3.3 mit den globalen Symmetrien der QCD, die zur Einführung mehrerer Quantenzahlen führen, die zur Charakterisierung der Elementarteilchen sowie der Hadronen dienen. X.3.1 Vertices der QCD Ähnlich der Quantenelektrodynamik kann die Quantenchromodynamik durch die FeynmanRegeln für die zugehörigen Vertices, die sich aus der Lagrange-Dichte herleiten lassen, spezifiziert werden. Im Fall der QCD kommen die drei in Abb. X.8 dargestellten Vertices vor. Dabei stellen die spiralförmigen Linien die Gluonen dar, d.h. die masselosen elektrisch neutralen Vektorteilchen, die die starke Wechselwirkung vermitteln und an die Farbladung koppeln. q g q Abbildung X.8: Vertices der Quantenchromodynamik. Die an einem qqg-Vertex (Abb. X.8 links) ein- und auslaufenden Quarks tragen typischerweise unterschiedliche Farbladungen. Dann trägt das Gluon die „Differenz“ dieser Farbladung. Trägt z.B. das ein- bzw. auslaufende Quark die Farbladung r (rot) bzw. b (blau), so soll das Gluon die Farbladung rb̄ nach rechts transportieren. Somit sind Gluonen farbgeladen und können in 8 (= Nc2 − 1, mit Nc = 3 der Anzahl der Farben) Farbkombinationen vorkommen. Mathematisch entsprechen die Gluonen Vektorfeldern AA µ mit A = 1, . . . , 8. Um deren Koppa=1,2,3 lung den Quarks-Tripletts qf zu beschreiben, werden acht 3×3- „Gell-Mann“ Matrizen λA eingeführt, welche die gleiche Rolle für SU(3) spielen, wie die Pauli-Matrizen für SU(2). Wegen ihrer Farbladung können Gluonen miteinander wechselwirken, entsprechend den zwei rechten Vertices der Abb. X.8. Diese Selbstwechselwirkung der Gluonen stellt einen großen Unterschied zum Photon in der QED dar. Da die drei Vertices der QCD aus einer eichinvarianten Lagrange-Dichte kommen, sind die zugehörigen Kopplungskonstanten nicht unabhängig. In der Tat werden die beiden Drei-TeilchenVertices durch die gleiche starke Kopplungskonstante gs bestimmt, während der Vier-Gluonen-Vertex durch gs2 kontrolliert wird. Anstelle von gs benutzt man auch die zugehörige starke Kopplungsstärke αs ≡ gs2 , 4π (X.14) analog zu αem in der QED. Im Gegensatz zu αem kann aber αs „groß“, d.h. nicht viel kleiner als 1, sein. Infolgedessen48 funktioniert Störungstheorie im Allgemeinen nicht so perfekt, wie in der QED, und Berechnungen erreichen selten eine Genauigkeit von 1% oder besser. Somit stellen numerische Gitter-QCD-Berechnungen eine wichtige Lösungsmethode dar. 48 . . . und wegen der Selbstwechselwirkung der Gluonen, die zur Existenz von viel mehr Feynman-Diagrammen zu einer gegebenen Ordnung in gs führt. Wechselwirkungen der Elementarteilchenphysik 95 N.BORGHINI Elementarteilchenphysik X.3.2 Wichtige Vorhersagen der Quantenchromodynamik Die „einfache“ Forderung einer eichinvarianten SU(3) Theorie führt zu einer Vielzahl an Phänomenen, die in der QED nicht auftreten. Hiernach werden zwei hervortretende Eigenschaften ohne Beweis dargestellt. X.3.2 a Asymptotische Freiheit :::::::::::::::::::::::::::::: Die Kopplungskonstante gs ist trotz ihrer Namen keine Konstante, sondern sie hängt von der Energie- bzw. Impulsskala QE des Prozesses unter Betrachtung ab. Genauer haben Gross, Politzer und Wilczek 1973 entdeckt, dass gs (QE ) mit steigender Energieskala QE abnimmt und im Limes QE → ∞ nach Null geht. Dieses Verhalten wird als asymptotische Freiheit bezeichnet. Genauer findet man αs (µ2 ) (X.15) αs (Q2E ) = 1 + 4παs (µ2 )b0 ln(Q2E /µ2 ) mit µ einer Referenzskala und b0 ≡ (11Nc −2Nf )/48π 2 , wobei Nc = 3 die Anzahl der Farben und Nf die Anzahl der bei der Energieskala QE aktiven Flavours bezeichnet — d.h. Nf = 3 für QE . 2mc , Nf = 4 für 2mc . QE . 2mb , usw. Der Verlauf von αs (Q2 ), ermittelt aus unterschiedlichen Experimenten, wird in Abb. X.9 gezeigt. Abbildung X.9: Experimentell ermittelter Verlauf der starken Kopplungsstärke. Genommen aus der Review of Particle Physics [16], Abb. 9.4. Insbesondere sieht man, dass die Kopplungsstärke bei der Masse MZ ≈ 91, 2 GeV des Z 0 -Bosons beträgt αs (MZ ) = 0, 1184 ± 0, 0007. (X.16) Asymptotische Freiheit liefert eine natürliche Erklärung für das Bjorken-Skalenverhalten (Abschn. X.2.1 b): für Prozesse mit großem Q2E ist die Kopplungskonstante klein, so dass Quarks und Gluonen sich tatsächlich wie freie Teilchen verhalten, wie im Partonmodell. Bei endlichem Q2E treten Korrekturen auf, die sei im Rahmen der QCD berechnen lassen, und zu einer entsprechenden Abhängigkeit der Partonverteilungsfunktionen führen: fi (x, Q2E ). Wechselwirkungen der Elementarteilchenphysik 96 N.BORGHINI Elementarteilchenphysik Bemerkungen: ∗ Definiert man eine neue Energieskala ΛQCD , die oft als QCD-Skala bezeichnet wird, durch αs (µ2 ) ≡ 1 , 4πb0 ln(µ2 /Λ2QCD ) so findet man nach Einsetzen in Gl. (X.15) unter der Annahme, dass Nf und daher b0 konstant zwischen ΛQCD , µ und QE bleibt, αs (Q2E ) = 1 . 4πb0 ln(Q2E /Λ2QCD ) (X.17) Dies bedeutet, dass die Kopplungsstärke divergiert, wenn QE → Λ+ QCD . ∗ Dem Heisenberg’schen Prinzip nach entspricht eine hohe Impulsskala einer kleinen Längenskala, und umgekehrt. Daher bedeutet asymptotische Freiheit, dass je näher zwei farbgeladene Teilchen benachbart sind, desto kleiner ist die Stärke deren Wechselwirkung. ∗ Mathematisch tritt asymptotische Freiheit nicht nur in QCD auf, sondern in allen nicht-abelschen Eichtheorien. Somit nimmt die Kopplungskonstante g der SU(2)L -Gruppe des elektroschwachen Standardmodells (Kap. XII) mit der Energieskala ab. X.3.2 b Quarkeinschluss :::::::::::::::::::::::: Für kleine Werte von Q2E wird die Kopplungsstärke αs (Q2E ) groß, d.h. die Wechselwirkungen zwischen farbgeladenen Teilchen sind sehr stark. Diese Tatsache erklärt qualitativ die Existenz von farbneutralen gebundenen Zuständen, den Hadronen, sowie das Confinement der Quarks und Gluonen innerhalb der Letzteren. Versucht man, zwei farbgeladenen Teilchen voneinander zu entfernen, dann bilden sich aus der hingefügten Energie Quark–Antiquark-Paare. Daraus resultieren, statt zweier getrennter Farbladungen, zwei oder mehr Hadronen. Bemerkung: Genau gesagt existiert noch kein formeller Beweis, dass die Quantenchromodynamik tatsächlich zum Confinement führt. Das Letztere wird aber in numerischen QCD-Simulationen auf einer diskretisierten Raumzeit, d.h. in sog. Gitter-QCD, nachgewiesen. Wechselwirkungen der Elementarteilchenphysik 97 N.BORGHINI Elementarteilchenphysik X.3.3 Symmetrien der QED und der QCD Die Lagrange-Dichten der Quantenchromodynamik, die zu den Vertices der Abb. X.8 führt, und der Quantenelektrodynamik, Gl. (IX.4), sind invariant unter verschiedenen Symmetrien, d.h. unter der Wirkung von Gruppen von Transformationen. Dabei unterscheidet man, je nach der Gruppe, zwischen kontinuierlichen und diskreten Symmetrien. Gemäß dem Noether-Theorem liefert jede kontinuierliche Symmetrie der Lagrange-Dichte eine Erhaltungsgröße — z.B. sind Lagrange-Dichten konstruktionsgemäß Lorentz-invariant, was insbesondere die Erhaltung der Energie, des Impulses sowie des Drehimpulses zur Folge hat. In diesem Abschnitt werden ein paar solche Symmetrien mit den zugehörigen Erhaltungsgrößen diskutiert. Diese schränken die möglichen Prozesse ein, die durch die Wechselwirkungen erlaubt werden. Dazu kommen einige diskrete Symmetrien, die ebenfalls die Dynamik beschränken. X.3.3 a Kontinuierliche innere Symmetrien ::::::::::::::::::::::::::::::::::::::::: Neben den Lorentz-Transformationen in der Raumzeit findet man noch Transformationen auf „inneren“ Vektorräumen, z.B. auf dem Hilbert-Raum der Zustände, die ein bzw. mehrere Teilchen beschreiben. Hiernach werden nur solche Transformationen betrachtet, bei denen die Zustände in jedem Punkt der Raumzeit identisch transformiert werden, d.h. globale Transformationen der Zustände. Es existieren auch lokale Transformationen, und zwar die Eichtransformationen, die hier aber nicht weiter diskutiert werden. Leptonen- und Baryonenzahl Eine erste Symmetrie der bisher betrachteten Wechselwirkungen ist die Invarianz der LagrangeDichte (IX.4) der QED unter den gleichzeitigen Transformationen ψ̂j → ψ̂j0 = eiα ψ̂j , ψ̄ˆj → ψ̄ˆj0 = e−iα ψ̄ˆj , µ → Â0µ = µ , (X.18) mit α ∈ R und ψ̂j dem Feldoperator für ein beliebiges Fermion j (Lepton oder Quark). Diese Symmetrie funktioniert, weil es an jedem Vertex (IX.3) so viele ein- als auslaufende Fermionenlinien, entsprechend der gleichen Anzahl von ψ̂j und ψ̄ˆj -Operatoren. Infolge dieser Symmetrie ist die Nettoanzahl der Spin- 21 -Teilchen der Art j, d.h. die Anzahl der Teilchen minus der Anzahl ihrer Antiteilchen, in einem quantenelektrodynamischen Prozess erhalten. Summiert man über alle Leptonspezies bzw. über alle Quark-Flavours und -Farben, so gibt diese Symmetrie die Erhaltung der Leptonenzahl L bzw. der Baryonenzahl B. Ähnlich dieser Symmetrie der QED ist die Lagrange-Dichte der QCD invariant unter den Transformationen q̂f → eiα q̂f , q̄ˆf → e−iα q̄ˆf , mit α ∈ R (X.19) für einen Quark-Flavour qf , während die Feldoperatoren für alle anderen Flavours und für die Gluonen unverändert bleiben. Diese Invarianz der Lagrange-Dichte spiegelt sich in der Tatsache wider, dass der Quark-Flavour an einem qqg-Vertex (Abb. X.8 links) unverändert ist. Entsprechend diesen Symmetrien existieren verschiedene erhaltene Quantenzahlen, die jetzt diskutiert werden. Strangeness, Charm, Beauty Aus der Invarianz der Lagrange-Dichte der Quantenchromodynamik unter der Multiplikation des Feldoperators für s-Quarks durch eine beliebige Phase folgt die Erhaltung der Strangeness. Anders gesagt ist die Nettoanzahl der strange Quarks, d.h. die Anzahl der s-Quarks minus der Anzahl der s̄-Antiquarks, erhalten.49 Daraus folgt, dass Mesonen wie K + = us̄, K − = sū in der QCD nicht zerfallen können, weil es kein leichteres Baryon mit Strangeness gibt. 49 Da die Strangeness des s-Quarks als S = −1 definiert ist, ist die Strangeness tatsächlich gleich Minus der Nettoanzahl der s-Quarks. Wechselwirkungen der Elementarteilchenphysik 98 N.BORGHINI Elementarteilchenphysik In ähnlicher Weise sind Charm C, Beauty (oder „Bottomness“) B und Truth (oder „Topness“) T ebenfalls in der QCD erhalten, wobei C als die Nettoanzahl der c-Quarks, B als Minus der Nettoanzahl der b-Quarks, und T als die Nettoanzahl der t-Quarks definiert wird. Bemerkung: S, C, B und T werden auch in der QED erhalten, entsprechend der schon oben diskutierten Symmetrie (X.18). Isospin Man könnte noch auch „Upness“ bzw. „Downness“ definieren, entsprechend der Nettoanzahl der u bzw. d-Quarks.50 Diese sind wieder in der QCD erhalten, dank der Invarianz der Lagrange-Dichte unter den Transformationen (X.19) für ψ̂u - oder ψ̂d -Feldoperatoren. In der Praxis betrachtet man aber eine größere Symmetrie, die exakt wird, falls elektromagnetische Effekte sowie die Massendifferenz der u- und d-Quarks vernachlässigt werden können. Unter solchen Umständen ist die Lagrange-Dichte der Quantenchromodynamik tatsächlich invariant unter Transformationen der Art ! ! ! ψ̂u ψ̂u0 ψ̂u → ≡U , (X.20) ψ̂d ψ̂d0 ψ̂d mit U einer beliebigen speziellen unitären 2×2-Matrix, U ∈ SU(2). Die entsprechende Symmetrie der QCD wird Isospin-Symmetrie genannt, oder auch starker Isospin.51 Die zugehörige Symmetriegruppe wird als SU(2)-Flavour-Gruppe bezeichnet.52 Jede Isospin-Transformation U lässt sich als Exponential einer Linearkombination der PauliMatrizen σj schreiben: U = e−iα ~σ·~e , mit α ∈ R und ~e einem dreidimensionalen Einheitsvektor [vgl. Gl. (I.20)]. Solche SU(2)-Matrizen beschreiben auch die Drehungen im Spin-Vektorraum von nicht-relativistischen Teilchen — woraus die Bezeichnung Isospin tatsächlich folgt.53 Die Invarianz der Lagrange-Dichte der QCD unter Transformationen (X.20) bedeutet, dass der zugehörige Hamilton-Operator mit jeder Matrix σj , betrachtet als Operator auf den durch die zwei leichten Flavours aufgespannten zweidimensionalen Vektorraum, kommutiert. Somit können der Hamilton-Operator, Iˆ2 ≡ 14 ~σ 2 und Iˆ3 ≡ 12 σ3 gleichzeitig diagonalisiert werden. Infolgedessen lassen sich die stark-wechselwirkenden Teilchen, d.h. die Eigenzustände zum QCD-Hamilton-Operator, durch deren Werte von I und I3 klassifizieren, mit I(I + 1) bzw. I3 dem zugehörigen Eigenwert zu Iˆ2 bzw. Iˆ3 . Zum Beispiel gelten für das u-Quark, entsprechend dem ersten Basisvektor im Flavour-Raum, I = 12 und I3 = 12 , während das d-Quark I = 21 und I3 = − 12 hat: ! ! 1 0 u≡ ≡ | 12 , 12 i, d≡ ≡ | 12 , − 12 i. (X.21) 0 1 Bei den Antiquarks nimmt I3 den entgegengesetzten Wert zum entsprechenden Quark an ū ≡ | 12 , − 12 i, d¯ ≡ | 12 , 12 i, (X.22) ¯ d.h. bezüglich des Isospins hat ein ū- bzw. d-Antiquark die gleichen Quantenzahlen wie ein d- bzw. u-Quark. Schließlich tragen alle anderen Quarks und Antiquarks keinen Isospin. 50 Oder Minus der Nettoanzahl der d Quarks, sowie die Strangeness als Minus der Nettoanzahl der negativ elektrisch geladenen s-Quarks definiert ist. 51 Da die u- und d-Quarks unterschiedliche elektrische Ladungen haben, ist der Isospin keine Symmetrie der QED. Dagegen sind „Upness“ und „Downness“ in der QED erhalten. 52 Diese Flavour-Gruppe ist eine Untergruppe der SU(3)-Flavour-Gruppe von Gell-Mann und Ne’eman. Die Letztere lässt sich wiederfinden, indem man die Massendifferenz des s-Quarks und der zwei leichteren Quarks vernachlässigt, was schon eine stärkere Näherung darstellt. 53 Ursprünglich wurde der Isospin nicht als Symmetrie der u und d-Quarks, sondern als Symetrie zwischen Proton und Neutron durch Heisenberg eingeführt [40], vgl. auch Gl. (X.24). Wechselwirkungen der Elementarteilchenphysik 99 N.BORGHINI Elementarteilchenphysik Die Isospin-Quantenzahlen von Hadronen lassen sich dann aus denen der Quarks erhalten, indem man die Isospins wie übliche Drehimpulse koppelt. Beispielsweise gilt für die Pionen π + = ud¯ = | 1 , 1 i| 1 , 1 i = |1, 1i, π − = dū = | 1 , − 1 i| 1 , − 1 i = |1, −1i, (X.23a) 2 2 2 2 2 2 2 2 1 π 0 = √ | 12 , 12 i| 12 , − 21 i + | 12 , − 12 i| 21 , 12 i = |1, 0i. (X.23b) 2 Alle drei Pionen bilden somit das Isospin-Triplett, kurz „Iso-Triplett“, mit I = 1. Sie sollten dann dieselbe Masse haben, da sie miteinander über die Operatoren Iˆ1 ± i Iˆ2 verknüpft sind, die mit dem Hamilton-Operator vertauschen. Koppelt man drei u oder d Quarks, so findet man mit I = 21 das Isospin-Dublett („Iso-Dublett“) bestehend aus Proton und Nukleon p = | 12 , 12 i, n = | 21 , − 12 i. (X.24) Dieses Dublett wird kollektiv als Nukleon bezeichnet. Der Isospin ist nicht nur für Klassifierungszwecke nützlich, sondern kann auch benutzt werden, um Vorhersagen über die Dynamik zu machen. Somit führt die Erhaltung des Isospins in QCDProzessen zur Existenz von einfachen Verhältnissen — bestimmt durch geeignete Clebsch–GordanKoeffizienten54 — zwischen den Amplituden bzw. Wirkungsquerschnitten für unterschiedliche Endzustände einer Streuung, oder gar zwischen den Amplituden für Prozesse mit unterschiedlichen Anfangszuständen, die über Isospin-Transformationen verknüpft sind. Bemerkung: Der Wert der dritten Komponente I3 des Isospins ist einfach mit der elektrischen Ladung Q verknüpft. Für die u, d und s-Quarks und deren Antiquarks gilt die Gell-Mann–Nishijima Formel Q = I3 + 21 (B + S), (X.25a) mit B der Baryonenzahl und S der Strangeness. Diese Beziehung gilt noch für die Hadronen, die aus diesen drei Flavours bestehen. Verallgemeinert man auf b, c und t Quarks und die Hadronen, die auch solche Quarks enthalten, so erhält man Q = I3 + 21 (B + S + C + B + T ). (X.25b) Dabei wird B + S + C + B + T ≡ Y als Hyperladung bezeichnet. Diese wird sowohl in der QED als in der QED erhalten. X.3.3 b Diskrete Symmetrien Die im vorigen Unterabschnitt diskutierten kontinuierlichen inneren Symmetrien führen zur Existenz von additiven Quantenzahlen. Jetzt werden ein paar diskrete Symmetrien behandelt, und die zugehörigen multiplikativen Quantenzahlen eingeführt. :::::::::::::::::::::::::::: Parität Bei der Raumspiegelung handelt es sich um die Transformation, die den Ortsvektor ~r in −~r transformiert. In der Raumzeit lässt sich die Wirkung der Raumspiegelung auf den KoordinatenVierervektor durch eine schon in Gl. (I.28) eingeführte uneigentliche Lorentz-Transformation ΛP . Allgemeiner lässt sich die Operation dieser Transformation auf eine beliebige physikalische Größe G(x) durch einen Paritätsoperator , auch Raumspiegelungsoperator gennant, P̂ beschreiben, und zwar gemäß P̂ G(x) = G(ΛP x). (X.26) Dieser Operator hängt von der Natur von G(x) ab — je nachdem, ob es sich um eine skalare, spinorielle, vektorielle, oder tensorielle Größe handelt, entsprechend dem Verhalten unter dreidimensionalen Drehungen. In allen Fällen ist P̂ eine Involution, d.h. P̂ 2 = 1. 54 Einige dieser Koeffizienten können z.B. in der Review of Particle Physics [16], Kap. 40 gefunden werden. Wechselwirkungen der Elementarteilchenphysik 100 N.BORGHINI Elementarteilchenphysik Infolge dieser Eigenschaft sind die möglicher Eigenwerte des Paritätsoperators P = ±1. Ist eine Größe ein Eigenvektor zu P̂ , so wird der entsprechende Eigenwert P als seine Parität bezeichnet. Je nach dem Verhalten unter der Parität unterscheidet man • für skalare Größen, zwischen Skalaren — P̂ s = s, d.h. P = +1 — und Pseudoskalaren — P̂ ps = −ps, d.h. P = −1; • für vektorielle Größen, zwischen Vektoren — P̂ ~v = −~v , d.h. P = −1 — und axialen Vektoren (oder Pseudovektoren) — P̂~a = ~a, d.h. P = +1. Ein Beispiel für eine pseudoskalare Größe ist die Helizität, Produkt von einem Vektor (dem Impuls) und einem axialen Vektor (dem Spin). Teilchen, insbesondere Elementarteilchen, können Eigenzustände zum Paritätsoperator sein, und somit eine feste Parität haben. Das ist der Fall der Teilchen, die entweder der QED oder der QCD unterliegen, weil die Lagrange-Dichten jener Wechselwirkungen invariant unter Raumspiegelung sind. Somit haben die Quarks und die geladenen Leptonen (e− , µ− , τ − ) die Parität +1, während ihre Antiteilchen die Parität −1 haben. Dazu haben Photonen und Gluonen, die durch Vierervektoren beschrieben werden, die Parität −1. Bei nicht-elementaren Teilchen hängt die Parität von denen der Bestandteilchen ab, sowie vom Bahndrehimpuls, der einen Beitrag (−1)` gibt, mit ` der Bahndrehimpulsquantenzahl, wobei die Beiträge multipliziert werden sollen. Somit haben Pionen (` = 0) die Parität −1. Ladungskonjugation Eine weitere diskrete Transformation ist die Ladungskonjugation, die ein Teilchen in dessen Antiteilchen und umgekehrt bei unveränderter Raumzeit-Position transformiert. Man kann zeigen, dass die Lagrange-Dichten der QED und der QCD invariant unter dieser Transformation sind. Für ein gegebenes Teilchen–Antiteilchen System wird die Ladungskonjugation durch einen Operator Ĉ darstellt. Da Ĉ 2 = 1 ist, sind die möglichen Eigenwerte dieses Ladungskonjugationsoperators C = ±1.55 Die entsprechenden Eigenzustände stellen definitionsgemäß Teilchen dar, die gleich ihrer Antiteilchen sind. Dies betrifft nur wenige Teilchen wie das Photon γ, das neutrale Pion π 0 , oder die in Abb. X.1 vorkommenden η, η 0 , ρ0 , ω und φ Mesonen, die alle aus u, d und s Quarks und deren Antiquarks bestehen. Dazu kommen noch die sog. Charmonia und Bottomonia, d.h. die gebundenen cc̄- und bb̄-Zustände. Als Beispiel hat das Photon die C-Parität C = −1, während für das neutrale Pion C = +1 ist: Ĉ |γi = −|γi, Ĉ |π 0 i = |π 0 i. (X.27a) Ĉ |π − i = |π + i. (X.27b) Dagegen gilt für die geladenen Pionen Ĉ |π + i = |π − i, Wegen der Erhaltung der Ladungskonjugation in der QED und der QCD, sollen die Zerfallsprodukte von Ĉ-Eigenzustände, die über die QED oder die QCD zerfallen, ebenfalls Eigenzustände zur Ladungskonjugation sein, mit dem gleichen Eigenwert. Infolgedessen kann das neutrale Pion in 2 oder 4 Photonen zerfallen,56 nicht aber in 3 Photonen. Bemerkungen: ∗ Eine verwandte multiplikative Quantenzahl, die in der starken Wechselwirkung erhalten bleibt, ˆ ist die sog. G-Parität, entsprechend dem Eigenwert des Operators Ĝ ≡ Ĉ eiπ I2 , wobei Iˆ2 die 2Komponente des Isospins bezeichnet. Das Interesse an dieser G-Parität liegt daran, dass zusätzliche 55 In diesem Skript wird der gleiche Buchstabe C für die C-Parität und die Charm-Quantenzahl benutzt, was aber zu keinem Fehler führen sollte. 56 Dabei wird die Parität auch erhalten, vorausgesetzt die Photonen mit einem relativen Bahndrehimpuls ` = 1 emittiert werden. Wechselwirkungen der Elementarteilchenphysik 101 N.BORGHINI Elementarteilchenphysik Teilchen wie z.B. die geladenen Pionen Eigenzustände dazu sind,57 die nicht Eigenzustand zum Ladungskonjugationsoperator sind. Der Erfahrung des Autors nach wird die G-Parität aber in der Praxis selten verwendet. ∗ Der Ladungskonjugationsoperator Ĉ ist ein seltenes Beispiel für einen antiunitären Operator.58 Dies ist eine nötige Eigenschaft, um einen normierten Zustand in den dazu komplexen konjugierten Zustand zu transformieren (vgl. die Teilchen-Interpretation der Lösungen zu den Klein–Gordonoder Dirac-Gleichungen). Zeitumkehr Eine weitere Transformation, die eine diskrete Symmetrie de QED und der QCD darstellt, ist die Zeitumkehr, die die Zeit t in −t bei unveränderten Raumkoordinaten transformiert. Die Wirkung dieser Operation auf Vierervektoren erfolgt durch die Lorentz-Transformation ΛT , Gl. (I.29). Allgemeiner wird ein (antiunitärer) Zeitumkehroperator T̂ eingeführt, um die Operation auf Zustände mit bestimmtem Spin durchzuführen, und dessen Eigenwerte die Werte T = ±1 annehmen können. Laut dem CPT-Theorem ist jede lokale Lorentz-invariante Quantenfeldtheorie invariant unter dem Produkt von Ladungskonjugation (Ĉ), Raumspiegelung (P̂ ) und Zeitumkehr (T̂ ), so dass T̂ äquivalent zu Ĉ P̂ ist, d.h. zur Transformation, die ein Teilchen mit bestimmter Helizität bzw. Polarisation in das zugehörige Antiteilchen mit entgegengesetzer Helizität bzw. Polarisation überführt. Gleichzeitige Eigenzustände zu Ĉ und P̂ , wie z.B. alle oben erwähnten Teilchen mit bestimmter C-Parität, sind natürlich Eigenzustände zu Ĉ P̂ , d.h. automatisch zur Zeitumkehr. Literatur • Berger [27], Kap. 5.1 & 5.3. • Griffiths [15], Kap. 4.3–4.4, 8.1–8.3 & 8.6. • Halzen & Martin [28], Kap. 2.5–2.11, 8, 9, 10.1 & 11.1. • Nachtmann [13], Kap. 17–18. ˆ Dies folgt aus eiπ I2 |π ± i = |π ∓ i und daher Ĝ|π ± i = |π ± i. Dies bedeutet, dass Ĉ einerseits antilinear ist: für alle Zustände |1i und |2i und komplexe Zahlen λ1 und λ2 gilt Ĉ(λ1 |1i + λ2 |2i) = λ∗1 Ĉ |1i + λ∗2 Ĉ |2i; andererseits ist Ĉ Ĉ † = Ĉ † Ĉ = 1, mit Ĉ † dem adjungierten Operator. 57 58 Wechselwirkungen der Elementarteilchenphysik 102 N.BORGHINI Elementarteilchenphysik XI. Schwache Wechselwirkung Die dritte Wechselwirkung der Elementarteilchen, neben den elektromagnetischen und starken Kräften, ist die schwache Wechselwirkung. Wie durch deren Bezeichnung angedeutet wird, ist diese Wechselwirkung in niederenergetischen Phänomenen üblicherweise (viel) schwächer als die zwei anderen. Sie kann aber nicht einfach vernachlässigt werden, weil sie oft Prozesse erlaubt, die in der QED und der QCD nicht stattfinden können. Dies geht zusammen mit der Verletzung unterschiedlicher Symmetrien der elektromagnetischen und starken Wechselwirkungen (Abschn. XI.1). Zur Beschreibung der entsprechenden Prozesse wurden mehrere Modelle eingeführt, je nach der Entdeckung neuer erlaubter Prozesse (Abschn. XI.2). Trotz der sukzessiven Verbesserungen bleibt das resultierende Modell unzufriedenstellend, jetzt aber aus theoretischen Gründen. Eine weitere Änderung des Modells ist möglich, auf Kosten der Einführung von ein paar neuen Teilchen mit Spin 1 (Abschn. XI.3). Die Letzteren sollen aber eine Masse haben, was wieder zu Probleme führt. . . , die sich nur in einer Theorie lösen lassen, in der die schwache Wechselwirkung mit der QED kombiniert wird, was im nächsten Kapitel behandelt wird. XI.1 Symmetrieverletzungen Ein Merkmal der schwachen Wechselwirkung ist die Tatsache, dass sie viele globale Symmetrien der QED und der QCD verletzt. Somit können Prozesse stattfinden, die im Rahmen der elektromagnetischen und starken Wechselwirkungen verboten sind. In diesem Abschnitt werden Beispiele solcher experimentell beobachteten Symmetrie-verletzenden Prozesse diskutiert. XI.1.1 Verletzung der Flavour-Quantenzahlen In der QED und der QCD sind die leichtesten Hadronen, die eine gegebene Flavour-Quantenzahl (Strangeness, Charm, Beauty) tragen, stabil. Dies gilt auch für die geladenen Pionen — die „Upness“ oder „Downness“ tragen. In der Natur können alle diese Teilchen aber zerfallen: π + → µ+ + νµ π − → µ− + ν̄µ K + → µ+ + νµ π+ + π0 D0 → K − + π+ + π0 .. . Dabei werden Upness and Downness in den ersten zwei Prozessen nicht erhalten. Die zwei Zerfallskanäle des K + = us̄ verletzen die Erhaltung der Strangeness. Schließlich verletzt der Zerfall des D0 = cū die Erhaltung des Charms — dazu wird in diesem Zerfallskanal Strangeness erzeugt. Eine Besonderheit dieser Zerfälle ist die relativ lange Lebensdauer des zerfallenden Hadrons, etwa 10−8 s für die geladenen Pionen, 10−10 –10−8 s für die Kaonen oder ca. 10−12 s für die Mesonen mit Charm oder Beauty. Diese Lebensdauern sind mit den des neutralen Pions (8 × 10−17 s) oder der durch die starke Wechselwirkung zerfallenden Teilchen (10−23 –10−21 s) zu vergleichen. XI.1.2 Paritätsverletzung Die Flavour-Quantenzahlen könnten als „zufällige“ Erhaltungsgrößen betrachtet werden, die interessante aber nicht tiefgreifende Symmetrien der QED und QCD widerspiegeln, und somit ohne Wechselwirkungen der Elementarteilchenphysik 103 N.BORGHINI Elementarteilchenphysik weiteres verletzt werden können. Die schwache Wechselwirkung verletzt aber noch weitere Symmetrien, anfangend mit der Symmetrie der Raumzeit unter Raumspiegelung. XI.1.2 a Das „theta-tau Puzzle“ ::::::::::::::::::::::::::::::: Was sich später als das positiv geladene Kaon K + erwiesen hat, wurde Mitte der 1950er Jahre als zwei unterschiedliche Teilchen identifiziert, und zwar einerseits als das „θ+ “ — mit dem Zerfallskanal θ+ → π + + π 0 , entsprechend der Parität +1 im Endzustand —, andererseits als das „τ + “,59 das in drei Pionen zerfallen kann — z.B. τ + → π + + π 0 + π 0 oder τ + → π + + π + + π − — entsprechend einem Endzustand mit Parität −1, obwohl es die gleiche Masse und den gleichen Spin wie das θ+ hat. Heutzutage ist klar geworden, dass es sich dabei um verschiedene Zerfallskanäle eines einzelnen Teilchens mit negativer Parität handelt. Dabei ist die Parität aber in den Zerfällen in den 2-PionenKanal nicht erhalten, was in der QED oder der starken Wechselwirkung verboten ist. Diese Identifikation des θ+ mit dem τ + wurde 1956 durch T.D.Lee and C.N.Yang vorgeschlagen, nachdem sie gefunden hatten, dass keines der damals existierenden experimentellen Ergebnisse die Erhaltung der Parität in schwachen Prozessen testete [41]. XI.1.2 b Das Wu-Experiment ::::::::::::::::::::::::::::: Kurz nach dem Vorschlag von Lee & Yang, dass die Erhaltung der Parität in schwachen Prozessen systematisch experimentell geprüft werden sollte, hat C.S.Wu den Zerfall polarisierter Kobalt-60 Kerne untersucht [42].60 Dabei wurde gefunden, dass die Elektronen bevorzugt entgegen der Richtung des Kernspins J~Co , d.h. mit einem Polarwinkel θ > 90o , emittiert werden, wie in Abb. XI.1 dargestellt wird. Wenn p~e den Impuls des Elektrons im Ruhesystem des 60 Co-Kerns bezeichnet, dann nimmt der Erwartungswert des Skalarprodukt p~e · J~Co über viele Zerfälle einen negativen Wert an. J~Co p~e θ J~Co 60 Co 60 Co P̂ - p~e Abbildung XI.1: Emissionsrichtung des Elektrons im Wu-Experiment (links) und im raumgespiegelten Prozess (rechts). Betrachtet man den raumgespiegelten Prozess, so werden die Richtungen der Impulse der emittierten Elektronen invertiert — Impulse sind Vektoren —, während die Richtung des Kernspins ungeändert bleibt — der Spin ist ein axialer Vektor. In diesem raumgespiegelten Experiment wären die Elektronen also vorzugsweise parallel zum Kernspin (Polarwinkel θ < 90o ) emittiert, im Gegensatz zum echten Experiment. In der Natur findet ein solcher Prozess aber nie statt! Die eigentlichen Zerfallsraten für die links und rechts dargestellten Zerfälle — d.h. für einen Prozess und den raumgespiegelten — sind unterschiedlich, was einer Verletzung der Parität entspricht. Abbildung XI.2 gibt eine alternative schematische Darstellung dieses Experiments, in der die Spins der Teilchen präzisiert werden. Im Ruhesystem des 60 Co-Kerns bleibt der Tochter-60 Ni-Kern auch fast in Ruhe, während das Elektron und das Antineutrino in entgegengesetzte Richungen 59 60 Dieses historische τ + -Meson sollt nicht mit dem Antiteilchen zum τ -Lepton verwechselt werden. Weitere experimentelle Details können z.B. in [43], Experiment 45, gefunden werden. Wechselwirkungen der Elementarteilchenphysik 104 N.BORGHINI Elementarteilchenphysik emittiert werden. Dabei sieht man, dass das Antineutrino ν̄e wegen der Erhaltung des Drehimpulses eine positive Helizität h = +1 hat. Jz = 5 p~ν̄ Jz = 4 60 Co ν̄e 60 Ni → 6J = 1 z 2 + e− Jz = 1 2 p~e ? Abbildung XI.2: Schematische Darstellung der Spinorientierungen im Wu-Experiment. Betrachtet man dann das (Anti)Neutrino als masselos — was in diesem Experiment eine ausgezeichnete Näherung ist —, so ist die positive Helizität des Antineutrinos äquivalent zu dessen Rechtshändigkeit (Abschn. III.3.3 c). Falls die CP -Symmetrie gilt, sollen Neutrinos wiederum linkshändig sein, was durch Goldhaber und seine Mitarbeiter in einem Elektroneneinfang-Experiment bestätigt wurde [44].61 XI.1.2 c Pionenzerfall ::::::::::::::::::::: In ihrem Artikel vorschlugen Lee & Yang noch, dass eine mögliche Verletzung der Parität durch die schwache Wechselwirkung im Zerfall des positiven Pions in ein Antimyon und das zugehörige Neutrino beobachtet sein könnte π + → µ+ + νµ . (XI.1) Im Ruhesystem des Spin-0-Pions werden die Zerfallsprodukte nämlich in entgegengesetzte Richtungen emittiert. Um den Drehimpuls zu erhalten, sollen die Spins ebenfalls in entgegengesetzten Richtungen orientiert werden, so dass die beiden Teilchen die gleiche Helizität haben, entweder positiv oder negativ. Experimentell wird das Antimyon immer mit h = −1 beobachtet,62 was wieder eine Verletzung der Parität signalisiert — wäre die Parität erhalten, so sollte das Antimyon in 50% die Helizität +1 haben. Wiederum bedeutet die Helizität des µ+ , dass das Neutrino ebenfalls eine negative Helizität hat. XI.1.3 Verletzung der Ladungskonjugation Experimentell kann man auch den ladungskonjugierten Prozess zum Zerfall (XI.1) untersuchen, und zwar den Zerfall des negativ geladenen Pions π − → µ− + ν̄µ . (XI.2) Wieder müssen das Myon und das Antineutrino dieselbe Helizität haben, um den Drehimpuls zu erhalten. Hier findet man, dass das Myon, und daher das ν̄µ , immer die Helizität +1 hat. Dies bedeutet, dass die Endteilchen des Prozesses (XI.2) nicht den ladungskonjugierten Zustand zu denen des Zerfalls (XI.1) darstellen, weil Ĉ die Helizität eines Teilchens unverändert lässt. In diesen Prozessen (XI.1)–(XI.2) wird (neben der Parität) die Ladungskonjugation also verletzt. Dagegen findet man, dass die Pionenzerfälle (XI.1) und (XI.2) Ĉ P̂ -konjugiert zueinander sind. ) XI.1.4 CP -Verletzung später XI.1.5 Zeitumkehrverletzung 61 Vgl. auch Experiment 49 in [43]. Genauer deutet die Winkelwerteilung des im Zerfall des Antimyons erzeugten Positrons auf die Polarisation des Antimyons entlang dessen Flugrichtung hin [45, 46]. 62 Wechselwirkungen der Elementarteilchenphysik 105 N.BORGHINI Elementarteilchenphysik XI.2 Phänomenologische Modelle In diesem Abschnitt werden einige wichtige Modelle dargestellt, die zur Beschreibung der schwachen Prozesse entwickelt wurden. XI.2.1 Fermi-Modell Ursprünglich wurde die schwache Wechselwirkung eingeführt, um den β-Zerfall des Neutrons n → p + e− + ν̄e (XI.3) zu beschreiben. Zu diesem Zweck hat Fermi 1933 ein Modell entwickelt [47], beruhend (in moderner Formulierung) auf der Lagrange-Dichte (XI.4) L̂Fermi = −G0 ψ̄ˆ γ ρ ψ̂ ψ̄ˆ γ ψ̂ + ψ̄ˆ γ ρ ψ̂ ψ̄ˆ γ ψ̂ . I F p n e ρ νe n p νe ρ e Dabei sind ψ̂n , ψ̂p , ψ̂e , ψ̂νe Dirac-Feldoperatoren und ψ̄ˆn , ψ̄ˆp , ψ̄ˆe , ψ̄ˆνe die dazu Dirac-adjungierten Felder. Die Kopplungskonstante für die Wechselwirkung dieser Feldoperatoren ist G0F ' 0, 974GF ≈ GF , mit GF ' 1, 166 × 10−5 GeV−2 der Fermi-Kopplungskonstante.63 Wendet man dieses Modell auf Quarks an, statt auf Nukleonen, so schreibt man (XI.5) L̂Fermi = −G0 ψ̄ˆ γ ρ ψ̂ ψ̄ˆ γ ψ̂ + ψ̄ˆ γ ρ ψ̂ ψ̄ˆ γ ψ̂ , I F u d e ρ νe d u νe ρ e mit ψ̂d , ψ̂u den Feldoperatoren für d und u Quarks. Dementsprechend lautet der Prozess, der dem Zerfall (XI.3) unterliegt d → u + e− + ν̄e . (XI.6) Der Wechselwirkungsterm (XI.5) führt zu den zwei Vier-Fermionen-Vertices der Abb. XI.3. Dabei kann man nachprüfen, dass die elektrische Ladung an den Vertices erhalten ist. νe d u e− und u νe d e− Abbildung XI.3: Vertices im Fermi-Modell (XI.5). Dieses Modell war revolutionär, weil es auf der Idee beruhte, dass das Elektron und das Neutrino „entstehen“ können, statt vor dem Zerfall schon im Neutron vorhanden zu sein.64 Dazu sagte das Fermi-Modell zwei neue Prozesse vorher, und zwar den β + -Zerfall (p → n + e+ + νe , mit p einem in einem Atomkern gebundenen Proton) und den Elektroneneinfang (p + e− → n + νe ), die kurz darauf entdeckt wurden. Bemerkungen: ∗ Dieses Modell wird oft als eine Theorie geladener vektorieller Ströme bezeichnet. Es beschreibt ρ nämlich die Kopplung von Viererströmen der Art ̂ki ≡ ψ̄ˆk γ ρ ψ̂i ρ ρ σ L̂Fermi = −G0F ̂ud ηρσ ̂eν + ̂du ηρσ ̂νσe e , I e wobei jeder Strom ein Lorentz-Vektor ist, der an einem Vertex seine elektrische Ladung ändert.65 ∗ In den Lagrange-Dichten (XI.4) oder (XI.5) ist der zweite Term hermitesch konjugiert zum ersten. 63 Der Unterschied zwischen der eigentlichen Fermi-Konstante GF und der Kopplungskonstante in Gl. (XI.4), (XI.5) und (XI.7) wird in Abschn. XI.2.3 weiter diskutiert. 64 Dabei betrachtete Fermi das zerfallende Neutron und das emittierte Proton als die zwei „inneren Quantenzustände“ des Nukleons. 65 Im Gegensatz dazu transportiert der vektorielle Viererstrom ψ̄ˆi γ µ ψ̂i , der in der QED mit dem Photon wechselwirkt [Gl. (IX.4)], das gleiche Teilchen vor und nach einem Vertex, so dass dessen elektrische Ladung ungeändert bleibt: dabei handelt es sich um einen neutralen Strom. Wechselwirkungen der Elementarteilchenphysik 106 N.BORGHINI Elementarteilchenphysik Im Fermi-Modell bleibt die Parität erhalten. Daher ist eine neue Beschreibung der schwachen Wechselwirkung nötig, um die Phänomene des Abschn. XI.1.2 beschreiben zu können. XI.2.2 V −A-Modell Kurz nach der Entdeckung der Paritätsverletzung haben Feynman & Gell-Mann einerseits und Sudarshan & Marshak andererseits das Fermi-Modell modifiziert gemäß [48, 49]66 i ˆ G0F h ˆ ρ ˆ γ ρ 1 − γ ψ̂ ψ̄ˆ γ 1 − γ ψ̂ . √ L̂V−A ψ̄ γ 1 − γ ψ̂ ψ̄ γ 1 − γ ψ̂ + ψ̄ = − u 5 e ρ 5 ν 5 u ν ρ 5 e d d e e I 2 (XI.7a) Wie im Fermi-Modell gibt diese Lagrange-Dichte vier-Fermionen-Vertices, wobei der Beitrag eines gegebenen Vertex zu einer Amplitude natürlich unterschiedlich von dem aus Gl. (XI.5) folgenden Beitrag ist. Bemerkung: Bei diesem Modell handelt es sich wieder um eine Theorie geladener Ströme. Dabei hat man aber zwei Arten von Viererströmen, und zwar zum einen vektorielle Ströme ψ̄ˆk γ ρ ψ̂i und zum anderen pseudovektorielle Ströme ψ̄ˆk γ ρ γ5 ψ̂i , woher die Bezeichnung V −A (Vektor − Axialvektor) kommt. Definiert man (vgl. Abschn. III.3.3 b) linkshändige Spinoren durch ψ̂i,L ≡ PL ψ̂i , so kann die Lagrange-Dichte des V −A-Modells noch nur diese Spinoren ausgedrückt werden √ 0 ˆ = −2 L̂V−A 2 GF ψ̄u,L γ ρ ψ̂d,L ψ̄ˆe,L γρ ψ̂νe ,L + ψ̄ˆd,L γ ρ ψ̂u,L ψ̄ˆνe ,L γρ ψ̂e,L . (XI.7b) I Diese Form des Wechselwirkungsterms wird oft interpretiert, als ob die schwache Wechselwirkung nur die linkshändigen Anteile der Teilchen bzw. die rechtshändigen Anteile der Antiteilchen (kurz: „linkshändige Teilchen“ bzw. „rechtshändige Antiteilchen“) miteinander koppelte. Da die Neutrinos nur über die schwache Wechselwirkung wechselwirken, spielen nur linkshändige Neutrinos bzw. rechtshändige Antineutrinos eine physikalische Rolle in Wechselwirkungen. Daher sagt man, dass Neutrinos immer linkshändig und Antineutrinos immer rechtshändig sind. In der Bewegung eines freien Teilchens ist sein Chiralität nur dann erhalten, wenn das Teilchen masselos ist — die Chiralität stimmt dann mit der Helizität überein, die bei freien Teilchen erhalten bleibt. Sind Neutrinos masselos, so kommen sie wirklich nur mit immer derselben Chiralität vor. Haben sie aber eine Masse, dann existieren auch „rechtshändige Neutrinos“, die aber nicht an den bekannten Wechselwirkungen — außerhalb der Gravitation — teilnehmen. XI.2.3 Flavour-Mischung im V −A-Modell Bisher wurden nur die Terme im Wechselwirkungsterm der Lagrange-Dichte berücksichtigt, die den u/d-Quark-Viererstrom mit dem e−/νe -Viererstrom koppeln. Dadurch können nur die wenigen Prozesse zwischen den entsprechenden Teilchen beschrieben werden. Um weitere Prozesse zu beschreiben, insbesondere solche, die zur Verletzung der Seltsamkeit, des Charms oder der Beauty führen, sollen zuerst die geeigneten Terme in die Lagrange-Dichte des V −AModells eingeführt werden. Beispielsweise erfordert das Modellieren der Zerfälle µ− → e− + νµ + ν̄e , π + → µ+ + νµ und K + → µ+ + νµ die Einführung einerseits von zwei zusätzlichen Strömen ψ̄ˆνµ ,L γ ρ ψ̂µ,L und ψ̄ˆu,L γ ρ ψ̂s,L , und andererseits von drei Termen, die den µ−/νµ -Viererstrom mit dem e−/νe -Viererstrom, dem u/d-Quark-Viererstrom oder dem u/s-Quark-Viererstrom koppeln, wie z.B. √ (XI.8) L̂V−A = −2 2 GF ψ̄ˆνµ ,L γ ρ ψ̂µ,L ψ̄ˆe,L γρ ψ̂νe ,L + ψ̄ˆµ,L γ ρ ψ̂νµ ,L ψ̄ˆνe ,L γρ ψ̂e,L I für den Myon-Zerfall. Dabei weicht aber die Kopplungskonstante von derjenigen im Wechselwirkungsterm (XI.7b). 66 In diesen Artikeln weicht die Definition von γ5 von Gl. (III.13) ab. Wechselwirkungen der Elementarteilchenphysik 107 N.BORGHINI Elementarteilchenphysik Somit stellt sich die Frage der Stärke der Kopplung zwischen den neu eingeführten Strömen. Ist diese Kopplung universell, bis auf vielleicht der Einführung von für jeden Strom spezifischen „Ladungen“, ähnlich den elektrischen Ladungen Qi in der QED [Gl. (IX.4)]? In diesem Fall weist der Vergleich der Wechselwirkungsterme (XI.7b) und (XI.8) z.B. darauf hin, dass der Quark-Strom ψ̄ˆu,L γ ρ ψ̂d,L mit einer Ladung kommt, die 0,974 mal der Ladung des leptonischen Stroms ψ̄ˆνµ ,L γ ρ ψ̂µ,L beträgt. Oder soll für jeden Wechselwirkungsterm zwischen zwei Strömen eine neue Kopplungskonstante eingeführt werden? Im letzteren Fall würde die Anzahl der Kopplungskonstanten, die freie Parameter des Modells sind, quadratisch mit der Anzahl der Ströme wachsen, während im ersteren Fall die Anzahl der freien Parameter maximal linear in der Anzahl der Ströme wäre, was schon ein viel einfacheres Modell ergeben würde. Experimentell hat sich erwiesen, dass die Kopplung und somit die schwache Wechselwirkung zwischen geladenen Strömen universell ist. Dabei tragen die geladenen `−/ν` -Ströme der Leptonen (`− = e− , µ− oder τ − ) alle die gleiche Ladung, die als 1 angenommen werden kann. Dagegen sind die Ladungen, getragen durch die geladenen qf1 /qf2 -Ströme der Quarks, mit qf1 = u, c oder t und qf2 = d, s oder b, nicht so einfach. Betrachtet man aber geladene Ströme, die der Umwandlung von positiv elektrisch geladenen Quarks (Typ qf1 ) in geeignete Linearkombinationen qf0 2 der negativ geladenen Quarks (Typ qf2 ) entsprechen, so erhält man geladene Ströme, die ebenfalls eine Ladung 1 bezüglich der schwachen Wechselwirkung tragen. Diese Idee wird hiernach mehr detailliert dargestellt. Der Einfachheit halber werden in diesem Abschnitt nur die u, d, s und c Quarks einerseits und andererseits nur die zwei leichtesten geladenen Leptonen e− und µ− mit den zugehörigen Neutrinos berücksichtigt, bis auf bei der Einführung der Lepton- und Quark-Dubletts (XI.9) und (XI.12). Die Verallgemeinerung auf alle Quark-Flavours bzw. Arten von Leptonen wird in späteren Kapiteln diskutiert. XI.2.3 a Fermionen-Generationen :::::::::::::::::::::::::::::::: Die bekannten Fermionen werden traditionell drei Generationen zugeordnet, wobei jede Generation aus zwei Leptonen und zwei Quark-Flavours besteht. Darüber hinaus wird es sich als günstig erweisen, die Leptonen einer Generation — und zwar ein elektrisch geladenes Lepton und das zugehörige Neutrino — als ein Lepton-Dublett zu schreiben: ! ! ! νe νµ ντ L1 ≡ , L2 ≡ , L3 ≡ , (XI.9a) e− µ− τ− wobei die elektrisch neutralen in der ersten Komponente und die geladenen (mit Q = −1) in der zweiten Komponente vorkommen. In ähnlicher Weise bilden die Quarks einer Generation — eines des „u-Typs“, d.h. mit elektrischer Ladung + 23 , und eines des „d-Typs“ mit elektrischer Ladung − 13 entsprechende Quark-Dubletts ! ! ! u c t Q1 ≡ , Q2 ≡ , Q3 ≡ , (XI.9b) d s b mit den positiv bzw. negativ geladenen Quarks in den ersten bzw. zweiten Komponente. Es seien L̂i , Q̂i die entsprechenden Feldoperatoren und L̂i,L , Q̂i,L die zugehörigen linkshändigen Anteile, wie z.B. ! ! ψ̂u,L ψ̂νe ,L L̂1,L ≡ , Q̂1,L ≡ . ψ̂e,L ψ̂d,L Unter Verwendung dieser Dubletts lässt sich die Lagrange-Dichte (XI.8) des V −A-Modells für die schwachen Prozesse zwischen den leptonischen µ−/νµ - und e−/νe -Viererströmen schreiben als " ! ! ! ! # √ 0 γ 0 0 0 0 0 γ ρ ρ ˆ ˆ ˆ ˆ L̂V−A = −2 2 GF L̄ L̂2,L L̄ L̂1,L + L̄ L̂2,L L̄ L̂1,L . 2,L 1,L 2,L 1,L I 0 0 γρ 0 γρ 0 0 0 (XI.10) Wechselwirkungen der Elementarteilchenphysik 108 N.BORGHINI Elementarteilchenphysik Wiederum ist die Lagrange-Dichte (XI.7b) für schwache Prozesse zwischen Quarks und Leptonen der ersten Generation äquivalent zu " ! ! ! ! # √ 0 γ 0 0 0 0 0 γ ρ ρ ˆ ˆ ˆ ˆ L̂V−A = −2 2 G0F Q̄ Q̂1,L L̄ L̂1,L + Q̄ Q̂1,L L̄ L̂1,L , 1,L 1,L 1,L 1,L I 0 0 γρ 0 γρ 0 0 0 (XI.11) wie sich einfach nachprüfen lässt. Die Frage jetzt ist, wie diese Lagrange-Dichten verallgemeinert werden, wenn zusätzliche Kopplungen zwischen Dubletts eingeführt werden. XI.2.3 b Cabibbo-Winkel ::::::::::::::::::::::::: Eine überraschende experimentelle Entdeckung ist, dass die anscheinend „natürlichen“ QuarkDubletts (XI.9b) — bestehend je aus zwei Teilchen mit bestimmten Massen — bezüglich der schwachen Wechselwirkung nicht optimal sind. Um geladene Quark-Viererströme zu bilden, die einfach miteinander oder mit den geladenen Leptonen-Strömen wechselwirken, sollte man die unteren Komponenten der Dubletts, d.h. Quarks des d-Typs, durch Linearkombinationen davon ersetzen ! ! ! u c t Q01 ≡ , Q02 ≡ , Q03 ≡ 0 . (XI.12) d0 s0 b Betrachtet man momentan nur zwei Generationen,67 so können d0 und s0 durch die d und s Quarks mithilfe einer Mischungsmatrix ausgedrückt werden: ! ! ! ! ! d0 Vud Vus d cos θC sin θC d = ≡ . (XI.13) s0 Vcd Vcs s − sin θC cos θC s Dabei wird θC als Cabibbo-Winkel bezeichnet. Bemerkung: In Gl. (XI.12) und (XI.13) wurde die gewöhnliche Schreibweise benutzt, die die Mischung auf der Ebene der Teilchen darstellt. Tatsächlich handelt es sich um eine Mischung deren Feldoperatoren, und die Freiheitsgrade d0 , s0 , b0 entsprechen Operatoren ψ̂d0 , ψ̂s0 , ψ̂b0 , die Linearkombinationen der Operatoren ψ̂d , ψ̂s , ψ̂b sind. Mit diesen neuen Dubletts, und ohne Änderung der Lepton-Dubletts, lässt sich die LagrangeDichte (XI.11) verallgemeinern auf ! ! X √ 0 0 0 γρ V−A 0 ˆ ˆ D̄L ρ D̂L D̄L L̂I = −2 2 GF D̂L0 , (XI.14) γ 0 0 0 0 DL ,DL wobei die Summe über alle Dubletts D, D0 ∈ {Q01 , Q02 , L1 , L2 } läuft, die alle mit der gleichen Stärke miteinander koppeln — vergleicht man diese Lagrange-Dichte mit der der QED, Gl. (IX.4), so tritt kein Analogon der elektrischen Ladungen auf. Experimentell beträgt der gemessene Wert des Cabibbo-Winkels etwa θC ≈ 13o , entsprechend |Vus | = 0, 2252 ± 0, 0009. Sei zunächst bemerkt das rein leptonische Prozesse, wie der Zerfall µ− → e− + νµ + ν̄e , nur die Lepton-Dubletts L1 und L2 in Gl. (XI.14) hineinziehen, so dass der Cabibbo-Winkel dabei keine Rolle spielt. Als erstes nicht-triviales Anwendungsbeispiel der verallgemeinerten Lagrange-Dichte (XI.14) kann man den Term für die Kopplung zwischen den u- und d-Quarks, dem Elektron e− und dessen√Neutrino νe in der Lagrange-Dichte (XI.14) explizit schreiben. Der zugehörige Koeffizient ist √ −2 2 GF cos θC , der mit −2 2 G0F in Gl. (XI.7b) zu vergleichen ist. Dank dem Wert von θC , der cos θC ≈ 0, 974 gibt, findet man eigentlich das gleiche Ergebnis wieder. 67 Die Verallgemeinerung auf drei Generationen wird in Abschn. XII.5.3 unten diskutiert. Wechselwirkungen der Elementarteilchenphysik 109 N.BORGHINI Elementarteilchenphysik π+ µ− ¯ d u p~1 ,σ1 6 p~2 ,σ2 ν̄µ I @ @ p ~3 ,σ3 6 p~, σ d¯s K̄ 0 Abbildung XI.4: Darstellung des Zerfalls K̄ 0 → π + + µ− + ν̄µ . Ein zweites Beispiel ist der Zerfall K̄ 0 → π + + µ− + ν̄µ (Abb. XI.4). Dieser Prozess wird durch den Term in der Summe von Gl. (XI.14) beschrieben, der den Strom für ein einlaufendes s-Quark (ψ̂s ) und ein auslaufendes u-Quark (ψ̄ˆu ) mit dem Strom für ein auslaufendes Myon (ψ̄ˆµ ) und ein auslaufendes Antineutrino (ψ̂νµ ) koppelt. Der fermionische Strom entspricht trivial dem Dublett L2 der zweiten Generation. Für die Quarks tritt das u-Quark nur im Dublett Q01 auf. Somit wird der Zerfall beschrieben durch den Term ! ! √ √ 0 0 0 γ ρ ˆ0 ˆ −2 2 GF L̄ L̂2,L Q̄ Q̂01,L = −2 2 GF ψ̄ˆµ,L γ ρ ψ̂νµ ,L ψ̄ˆu,L γρ ψ̂d0 ,L 2,L 1,L ρ γ 0 0 0 √ = −2 2 G sin θ ψ̄ˆ γ ρ ψ̂ ψ̄ˆ γ ψ̂ . F C µ,L νµ ,L u,L ρ s,L Die Kopplung ist hier proportional zu sin θC ≈ 0, 225. Nach Anwendungen der Feynman-Regeln des Kapitels VIII liefert dieser Term die Amplitude i p1 , σ1 )γ ρ (1 − γ5 )u(~ p, σ) ū(~ p3 , σ3 )γρ (1 − γ5 )v(~ p2 , σ2 ), M = − √ GF sin θC ū(~ 2 mit p~, σ dem Impuls und der Helizität des einlaufenden s-Quarks, während die Indices 1, 2, 3 sich jeweils auf die auslaufenden u-Quark, Myon und ν̄µ beziehen. Unabhängig von den Werten der Impulse wird der Betragsquadrat jener Amplitude proportional zu sin2 θC ≈ 0, 05 sein. XI.2.4 Neutrale Ströme Die Lagrange-Dichte (XI.14) beschreibt nur Wechselwirkungen zwischen geladenen Strömen der Art ψ̄ˆk γ ρ (1 − γ5 )ψ̂i mit k 6= i, wobei die Teilchen i und k unterschiedliche elektrische Ladungen tragen. Theoretische Überlegungen, die unten in Abschn. XI.3.2 kurz erläutert werden, haben zur Vorhersage geführt, dass die schwache Wechselwirkung noch weitere Prozesse zwischen neutralen Strömen — und zwar Linearkombinationen von ψ̄ˆi γ ρ ψ̂i und ψ̄ˆi γ ρ γ5 ψ̂i — enthält. Diese schwachen neutralen Ströme besitzen aber nicht die V −A-Struktur der geladenen Ströme. Sie sind nämlich der Art ψ̄ˆi cV γ ρ − cA γ ρ γ5 ψ̂i , mit im Allgemeinen cV 6= cA , wobei die beiden Koeffizienten von der Teilchenspezies i abhängen — genauer findet man experimentell, dass sie nur von der elektrischen Ladung des Teilchens abhängen. Dd Dd Du u Bezeichnet man als cD V und cA bzw. cV und cA die zwei Koeffizienten für die obere bzw. untere 0 0 Komponente eines Dubletts D ∈ {Q1 , Q2 , L1 , L2 }, so kann man einen neutralen Strom68 ! Du 1 ρ Du X γ (c −c γ ) 0 5 V A ˆ 2 D̂ (XI.15a) (̂ NC )ρ ≡ D̄ Dd 1 ρ Dd 0 2 γ (cV −cA γ5 ) D bilden. Dann lautet der Beitrag der neutralen Ströme zur Lagrange-Dichte der schwachen Wechsel68 NC und CC stehen jeweils für neutral current und charged current. Wechselwirkungen der Elementarteilchenphysik 110 N.BORGHINI Elementarteilchenphysik wirkung √ = −2 2 GF (̂ NC )ρ (̂ NC )ρ . L̂NC I (XI.15b) Zum Vergleich lässt sich der Anteil (XI.14) der geladenen Ströme umschreiben als √ L̂CC = −2 2 GF (̂ CC )ρ (̂ CC )†ρ , I (XI.16a) mit dem geladenen Strom68 (̂ CC )ρ ≡ X D ! 0 ˆ D̄ D̂, 1 ρ 2 γ (14 −γ5 ) 0 0 (̂ CC )†ρ = X D ˆ 0 D̄ 0 ! 1 2 γρ (14 −γ5 ) 0 D̂. (XI.16b) Die schwache Wechselwirkung neutraler Ströme wurde 1973 am CERN entdeckt, und zwar in der Untersuchung elastischer Streuprozesse ν̄µ + e− → ν̄µ + e− , in den weder geladene Ströme noch die elektromagnetische oder starke Wechselwirkungen eine Rolle spielen. Bemerkungen: ∗ Für Neutrinos νe , νµ und ντ gilt cV = cA . Somit spielen auch bei neutralen Strömen nur die linkshändigen Anteile von Neutrinos eine Rolle. ∗ Der neutrale Strom (XI.15a) ist eine Summe von Termen, die jeweils nur ein einziges Dublett involvieren, statt unterschiedliche Dubletts miteinander zu mischen. Dementsprechend kann der Wechselwirkungsterm (XI.15b) den Flavour eines Quarks bzw. die Art eines Leptons nicht ändern. Diese bisher experimentell bestätigte Tatsache wird als die Abwesenheit von Flavour-ändernden neutralen Strömen bezeichnet.69 XI.3 Vektorbosonen der schwachen Wechselwirkung Trotz seiner Erfolge leidet das Modell bestehend aus der Summe der Lagrange-Dichten (XI.15) und (XI.16) — d.h. umfassend einerseits das V − A-Modell für geladene Ströme und andererseits die neutralen Ströme — unter einigen gravierenden theoretischen Problemen. In diesem Abschnitt wird eines dieser Probleme dargestellt, sowie eine mögliche zugehörige Lösung. XI.3.1 Unitaritätsgrenze In alle phänomenologischen Modelle des vorigen Abschnitts wird die Fermi-Konstante GF hineingezogen. Im Gegensatz zu den Kopplungskonstanten der QED und der QCD ist diese Konstante nicht dimensionslos. Dementsprechend ist das Verhalten von Wirkungsquerschnitten bei hoher Energie unterschiedlich, wie sich mithilfe dimensionaler Analyse argumentieren lässt. Beispielsweise kann man zunächst die elastische Streuung eines Elektrons und eines Myons in der QED, oder äquivalent die elastische Streuung von zwei Quarks in der QCD betrachten. Der totale Wirkungsquerschnitt σtot für den Prozess hat die dimension einer Fläche, d.h. in natürlichen Einheiten [σtot ] = [E −2 ]. √ Ist die Schwerpunktsenergie s solcher Prozesse viel größer als die Massen der beteiligten Teilchen, so spielen die Letzteren keine Rolle, so dass die einzige relevante Energieskala für den Prozess √ √ genau s ist. Dann lässt sich σtot durch s, die geeignete Kopplungskonstante e bzw. gs — zur vierten Potenz, da die Amplitude zur niedrigsten Ordnung schon zwei Vertices enthält — und ein paar hier unwesentliche numerische Faktoren ausdrücken. Um die passende Dimension zu erhalten, ist eine einzige Kombination möglich, und zwar z.B. e4 α2 σtot (e− + µ− → e− + µ− ) ∝ √ 2 ∝ em , s ( s) (XI.17) entsprechend dem Verhalten der Rutherford-Formel (IX.13) oder des Wirkungsquerschnitts (IX.15). 69 Auf English spricht man von „flavor-changing neutral currents“, kurz FCNC. Wechselwirkungen der Elementarteilchenphysik 111 N.BORGHINI Elementarteilchenphysik Betrachtet man jetzt den totalen Wirkungsquerschnitt für einen schwachen Prozess wie die √ elastische Streuung ν̄e + e− → ν̄µ + µ− , so sollen für s mµ die Massen der Teilchen nicht im Ausdruck für σtot auftauchen. Zur niedrigsten Ordnung in Störungsrechnung ist die Amplitude für den Prozess proportional zu GF , so dass der Wirkungsquerschnitt proportional zu G2F ist. Damit σtot die passende Dimension hat, soll G2F — Dimension [E −4 ] — noch mit dem Quadrat einer Energie multipliziert werden, d.h. √ (XI.18) σtot (ν̄e +e− → ν̄µ +µ− ) ∝ G2F ( s)2 . Ein solches Verhalten — der Wirkungsquerschnitt kann im Limes hoher Energien unendlich groß werden — kann aber nicht realisiert werden. Der Wirkungsquerschnitt ist nämlich mit der Amplitude verknüpft, und die Letztere ist proportional zu einem Streumatrixelement Sfi , das beschränkt bleiben soll, weil die Streumatrix unitär ist. Somit würde das Wachstum (XI.18) die Unitarität der Theorie verletzen — d.h. würde zu Wahrscheinlichkeiten größer als 1 führen —, was offensichtlich nicht richtig ist. XI.3.2 Schwache Bosonen Eine sehr elegante Lösung zum Problem des Wachstums der Wirkungsquerschnitte in Modellen mit 4-Fermionen-Vertices beruht auf der Einführung von neuen, massiven Vektorteilchen, und zwar die sog. W + -, W − , und Z 0 -Bosonen. Mit deren Hilfe kann ein 4-Fermionen-Vertex durch zwei Vertices mit je zwei Fermionen und einem Boson ersetzt werden. Somit entspricht der Streuprozess ν̄e + e− → ν̄µ + µ− den zwei sukzessiven Schritten ν̄e + e− → W − → ν̄µ + µ− , wie in Abb. XI.5 dargestellt wird. Die geladenen Ströme ψ̄ˆνe ,L γ ρ ψ̂e,L -und ψ̄ˆµ,L γ σ ψ̂νµ ,L wechselwirken ν̄µ µ− ν̄µ µ− → e− W− ν̄e ν̄e e− − Abbildung XI.5: Einführung des W -Bosons. also nicht direkt miteinander, sondern über den Austausch eines W − -Bosons, wobei der Lorentz√ Quadrat des Viererimpulses q des W − gleich ( s)2 ist. Sei mW die Masse des W ± -Bosons und gw die Kopplungskonstante assoziert mit dem neuen Vertex. Dazu wird angenommen, dass die zwei Vertices des rechten Diagramms in Abb. XI.5 einen Faktor 21 liefern.70 Unter Nutzung des Propagators (VIII.2c) für das massive Vektorboson, wobei hier q2 = s gilt, lautet die Amplitude für das Diagramm 2 −iηρσ ˆ 1 −gw σ i ψ̄ˆνe ,L (igw γ ρ )ψ̂e,L ψ̄ (ig γ ) ψ̂ = ψ̄ˆν ,L γ ρ ψ̂e,L ψ̄ˆµ,L γρ ψ̂νµ ,L . w µ,L ν ,L µ 2 s − m2w 2(s − m2w ) e √ Für Schwerpunktsenergien s mW reduziert sich die linke Seite auf 2 gw ψ̄ˆν ,L γ ρ ψ̂e,L ψ̄ˆµ,L γρ ψ̂νµ ,L , 2m2W e entsprechend der Amplitude für das linke √ Diagramm in Abb. XI.5 folgend aus Gl. (XI.16), voraus2 /2m2 mit 2 2 G identifiziert wird. gesetzt das Verhältnis gw F W 70 Dieser Faktor wird im nächsten Kapitel genauer eingeführt. Wechselwirkungen der Elementarteilchenphysik 112 N.BORGHINI Elementarteilchenphysik Diese Beobachtung deutet darauf hin, dass das V −A-Modell tatsächlich den niederenergetischen Limes eines Modells mit den W − - und W + -Bosonen darstellt, das nur für Energien kleiner als die Masse mW gilt. Dementsprechend ist die durch Gl. (XI.15) beschriebene schwache Wechselwirkung zwischen neutralen Strömen in der Tat der niederenergetische Limes eines Modells, in dem die Wechselwirkung durch das elektrisch neutrale Z 0 -Boson vermittelt wird. √ 2 = 2 2 G m2 ist die Kopplungskonstante g jetzt dimensionslos. Bei Dank der Beziehung gw w F W √ hohen Energien s mW wird der Wirkungsquerschnitt für den Prozess ν̄e + e− → ν̄µ + µ− somit 4 /s2 , ähnlich wie in Gl. (XI.17), und daher fallend mit √s, statt wachsend wie im proportional zu gw Fall eines 4-Fermionen-Vertex. Literatur • Cottingham & Greenwood [50], Kap. 9. • Griffiths [15], Kap. 9. • Halzen & Martin [28], Kap. 12. • Nachtmann [13], Kap. 21. Wechselwirkungen der Elementarteilchenphysik 113 N.BORGHINI Elementarteilchenphysik XII. Elektroschwaches Standardmodell Im vorigen Kapitel wurden unterschiedliche Modelle der Schwachen Wechselwirkung diskutiert, entsprechend sukzessiven Verfeinerungen, um experimentelle Daten zu beschreiben. Trotz deren Nützlichkeit besitzen diese phänomenologischen Modelle aber viele unerklärten Parameter und beruhen nicht auf einem einfachen Prinzip wie die QED und die QCD. In Abschn. XII.1 wird argumentiert, dass ein solches grundlegendes Prinzip — die Invarianz der Theorie unter lokalen Symmetrien — tatsächlich notwendig ist, damit die Theorie wohldefiniert ist. Diese Forderung fungiert somit als Auswahlskriterium für mögliche Theorien. In Abschn. XII.2 wird dann ein passendes Modell eingeführt, das sowohl die schwache Wechselwirkung als auch die QED und die QCD umfasst, wobei die zwei Ersteren zu einer elektroschwachen Wechselwirkung vereinheitlicht werden. Die folgenden Abschnitte befassen sich dann mit Vorhersagen im Rahmen dieses Modells, und zwar im Higgs-Sektor (Abschn. XII.3), im Eichbosonen-Sektor (Abschn. XII.4) und schließlich im Fermionen-Sektor (Abschn. XII.5). XII.1 Eichtheorien Die Wechselwirkungen des Standardmodells entsprechend Theorien mit Invarianz unter lokalen Transformationen, sog. Eichtransformationen. Dies gewährleistet die Renormierbarkeit der Theorie, schränkt aber die möglichen Terme ein, die in der Theorie auftreten können. XII.1.1 Notwendigkeit nach Renormierbarkeit Die in Teil B eingeführte Berechnung der Zerfallsraten oder Wechselwirkungen beruht auf Störungsrechnung, wobei bisher nur der Beitrag der niedrigsten Ordnung, entsprechend den einfachsten Feynman-Diagrammen, berücksichtigt wurde. Eine wichtige Frage ist dann natürlich, ob die höhere Ordnungen der Störungstheorie klein gegen die niedrigste Ordnung sind, damit der störungsrechnerische Ansatz überhaupt Sinn macht. Um diese Frage zu beantworten, kann man als Beispiel einen zwei-nach-zwei-Streuprozess in der QED betrachten, mit zwei Fermionen im Anfangs- und zwei Fermionen im Endzustand. Das Feynman-Diagramm für die niedrigste Ordnung in Störungsrechnung — das sog. „Baum-Niveau“, entsprechend der baumartigen Topologie des Diagramms — und eines der Diagramme für die nächste Ordnung — hier mit einer einzigen Fermionen-Schleife — werden in Abb. XII.1 dargestellt. k q- ν µ (1) (2) Abbildung XII.1: „Baum-Niveau“ (1) und 1-Schleifen-Niveau (2) für einen 2-nach-2-Streuprozess. Im Vergleich zur Amplitude für das Baum-Niveau (1) lautet die Größenordnung der Amplitude entsprechend dem Feynman-Diagramm (2): gc a M(2) ∼ M(1) ∗ k q- µ a •ν Die Anwendung der Feynman-Regeln (Kap. VIII) gibt 4 Z i e2 i(6 k + m) ν i(6 q+ 6 k + m) d k M(2) ∼ M(1) ∗ 2 Tr iγ µ 2 iγ , q k − m2 (q + k)2 − m2 (2π)4 Wechselwirkungen der Elementarteilchenphysik 114 N.BORGHINI Elementarteilchenphysik mit m der Masse des Fermions in der Schleife. Der globale Faktor i (Regel Æ) wurde nicht explizit eingeführt, weil es schon in der Amplitude M(1)auftritt. Die Formeln (III.8)–(III.10) zusammen mit Tr γ µ γ ρ γ ν γ σ = 4 η µρ η νσ − η µν η ρσ + η µσ η ρν liefern Z −4ie2 k µ q ν + k ν q µ + 2k µ k ν − η µν (k · q + k2 − m2 ) d4 k M(2) ∼ M(1) ∗ q2 (k2 − m2 )[(q + k)2 − m2 ] (2π)4 Das Integral im rechten Glied ist tatsächlich divergent, und zwar auf zwei Weisen: q p 2 2 ~ • „Auf der Massenschale“: für k0 = ± k + m und k0 = −q0 ± (~q + ~k) 2 + m2 verschwindet der Nenner. Diese Divergenz lässt sich aber unter Verwendung einer genaueren Definition der Propagatoren vermeiden: fügt man einen Term iε im Nenner hinzu, wobei ε = 0+ ein infinitesimal kleiner positiver Parameter ist, so erhält man, wie es mit diesen Polen umgegangen wird. • „Ultraviolett-Divergenz“: für große Werte von |~k| ist das Integral ebenfalls divergent. Der letzte Teil des Zählers im Integranden lässt sich in der Tat wie folgt umformen: k · q + k2 − m2 = k2 + 12 (q + k)2 − q2 − k2 − m2 = 21 (k2 − m2 ) + 12 (q + k)2 − m2 − 12 q2 . Daher enthält das Integral einen Anteil Z Z d4 k q2 1 d4 k 1 µν − , −η k2 − m2 (2π)4 2 (k2 − m2 )[(q + k)2 − m2 ] (2π)4 wobei ein Beitrag mithilfe der Substitution q + k → k umgeschrieben wurde. Das erste Integral ist quadratisch divergent (d.h. ∝ Λ2 , mit Λ der oberen Grenze des Integrals, die gegen unendlich gehen soll), das zweite logarithmisch divergent (d.h. ∝ ln Λ). Die durch die höheren Ordnungen bedingten Korrekturen scheinen also im Allgemeinen nicht klein, sondern gar unendlich zu sein, was katastrophal aussieht. In diesem Fall wäre Störungsrechnung tatsächlich ganz unbrauchbar. Tatsächlich existieren Klassen von sog. renormierbaren Theorien, in denen sich alle solche Divergenzen kürzen — Ordnung für Ordnung in Störungsrechnung —, wenn man Beziehungen zwischen physikalisch messbaren Größen betrachtet. In solchen Theorien kann man also sinnvoll Störungsrechnung durchführen und dabei endliche Ergebnisse erhalten. Somit kann man die Argumentation herumdrehen, und vom Anfang an erfordern, dass die Theorie renormierbar — und damit wohldefiniert — sein soll. XII.1.2 Eichinvarianz In der Quantenfeldtheorie zeigt man, dass die folgenden Bedingungen hinreichend sind, damit eine Theorie renormierbar ist • die Lagrange-Dichten für die Vektorfelder — in der uns bekannten Elementarteilchenphysik handelt es sich um die Photonen, Gluonen, W ± - und Z 0 -Bosonen — sollen eichinvariant sein; • die Lagrange-Dichte enthält nur Wechselwirkungsterme zwischen drei (fermionischen oder bosonischen) oder vier (bosonischen) Feldern.71 Dabei bedeutet „Eichinvarianz“, dass die Theorie invariant unter bestimmten lokalen Transformationen sein soll, ähnlich den Transformationen der Spinoren in Gl. (X.18) mit x-abhängigen Phasen α(x) und mit einer gleichzeitigen Transformation der Vektorfelder wie in Gl. (IV.6) für das Vektorpotential des Elektromagnetismus. 71 Dabei können die Fermionen bzw. die Bosonen nur den Spin betrachteten Elementarteilchen umfasst. Wechselwirkungen der Elementarteilchenphysik 1 2 bzw. den Spin 0 oder 1 haben, was alle bisher 115 N.BORGHINI Elementarteilchenphysik Betrachtet man z.B. den Fall der QED, so ist es wohl bekannt, dass die Maxwell-Gleichungen invariant sind unter die lokalen Transformationen [vgl. Gl. (IV.6)] 1 µ (x) → Â0µ (x) = µ (x) + ∂ µ α(x) (XII.1) e mit α(x) einer skalaren Funktion und e der Kopplungskonstante. Wie in der Bemerkung unter Gl. (IV.9) schon erwähnt wurde, verhindert diese Eichinvarianz das Einführen eines Massenterms für das Vektorfeld µ . Solche Massenterme sind — unabhängig, ob das Feld skalar, spinoriell, oder vektoriell ist — quadratische Terme in der Lagrange-Dichte. Damit die Letztere Lorentz-invariant bleibt, ist der einzige mögliche Beitrag für ein Vektorfeld der Art 21 m2 µ µ .72 Unter einer Eichtransformation (XII.1) wird aber ein solcher Term zu 1 2 0 0µ 1 2 1 m2 µ m2 m µ  = m µ µ +  ∂µ α + 2 ∂ µ α ∂µ α 6= m2 µ µ , 2 2 e e 2 d.h. der Term verletzt die Invarianz und darf somit nicht auftreten. Somit können in eichinvarianten Theorien die Vektorfelder keinen Massenterm in der Lagrange-Dichte haben. Das ist ja kein Problem für die zwei eichinvarianten Wechselwirkungen, die bisher in dieser Vorlesung getroffen wurden, und zwar die QED und die QCD, weil die Photonen und die Gluonen masselos sind. Will man aber eine eichinvariante Theorie für die schwache Wechselwirkung finden, so werden die Massen der W ± und Z 0 -Bosonen problematisch. Für ein skalares Teilchen lautet die Eichtransformation entsprechend Gl. (XII.1) φ̂(x) → φ̂0 (x) = e−iα(x) φ̂(x), φ̂† (x) → φ̂0† (x) = eiα(x) φ̂† (x). (XII.2) Dann kann ein Massenterm m2 φ̂† φ̂ problemlos in der Lagrange-Dichte auftreten, da er Lorentz- und eichinvariant ist. Somit können Spin-0-Teilchen in einer eichinvarianten Theorie eine Masse haben. Im Fall eines Spin- 21 -Teilchens verhalten sich die links- und rechtshändigen Anteile von DiracSpinoren manchmal unterschiedlich unter Wechselwirkungen — insbesondere unter der schwachen Wechselwirkung —, so dass jedem Anteil eine Masse zugeordnet sollte. Dabei lautet aber ein solcher Massenterm z.B. m ψ̄ˆL ψ̂L = m ψ̄ˆPR PL ψ̂ = 0 [vgl. Gl. (III.43b)], d.h. das Teilchen soll masselos sein. Hier auch stellt also die Masse der fermionischen Elementarteilchen ein Problem dar, um eine konsistente Theorie zu bilden. Die Aufgabe einer zufriedenstellenden Theorie für die schwache Wechselwirkung wird also vielfach sein. Einerseits soll sie eichinvariant sein, um deren Renormierbarkeit zu gewährleisten. Dazu soll sie noch erklären, wieso die schwachen Bosonen und die Fermionen eine Masse erhalten können. Tatsächlich wird das Letztere möglich sein, indem die Theorie ein neues Feld enthält, und zwar ein Skalarfeld, das mit den anderen Feldern wechselwirkt, und ihnen somit unter Umständen eine Masse geben kann. XII.2 Lagrange-Dichte des Standardmodells In diesem Abschnitt wird das durch Glashow, Salam, Weinberg und andere konstruierte Standardmodell der Elementarteilchenphysik dargestellt. XII.2.1 Bausteine des Standardmodells XII.2.1 a Lokale Symmetriegruppen Am Herzen des Standardmodells der Elementarteilchenphysik liegt die Eichgruppe, unter dessen Transformationen die Theorie invariant bleibt. Somit ist die Symmetriegruppe des Standardmodells ::::::::::::::::::::::::::::::::::: 72 Der Faktor 12 m2 liefert die gute Bewegungsgleichung, und zwar die Proca-Gleichung, wenn man die Euler– Lagrange-Gleichung für die Lagrange-Dichte betrachtet. Wechselwirkungen der Elementarteilchenphysik 116 N.BORGHINI Elementarteilchenphysik das direkte Produkt SU(3)c × SU(2)L × U(1)Y (XII.3) • Die SU(3)c -Gruppe stellt die Symmetriegruppe für die starke Wechselwirkung dar, wobei der tiefgestellte Index c daran erinnert, dass die Gluonen an die Farbe („color“) koppeln. • SU(2)L ist die Eichgruppe der schwachen Wechselwirkung, insbesondere für deren linkshändigen Anteil. Die dazu zugehörigen Vektorbosonen Ŵ1ρ , Ŵ2ρ , Ŵ3ρ , die später die massiven W ± und Z 0 -Bosonen liefern werden, bilden ein SU(2)-Triplett. Die Ladung, an die die Ŵiρ -Bosonen koppeln, wird elektroschwacher oder kurz schwacher Isospin genannt und als I W bezeichnet. • U(1)Y ist eine Eichgruppe, die teilweise zur elektromagnetischen Wechselwirkung und teilweise zur schwachen Wechselwirkung zwischen neutralen Strömen führt. Die entsprechende Ladung ist die sog. Hyperladung, bezeichnet als YW oder manchmal Y . Das Vektorboson, das an die Hyperladung koppelt, wird als B̂ ρ geschrieben. Später wird es (teilweise) das Photon liefern, sowie zum Z 0 -Boson beitragen. Der SU(2)L × U(1)Y -Anteil wird als elektroschwache Wechselwirkung bezeichnet. XII.2.1 b Materie-Teilchen :::::::::::::::::::::::::: Die „Materie“-Teilchen, die diesen Wechselwirkungen unterliegen, sind Spin- 21 -Fermionen, die zweien Arten gehören: Leptonen Erstens kommen drei SU(2)L -Dubletts von linkshändigen Dirac-Teilchen, die der starken Wechselwirkungen nicht unterliegen ! ! ! νe,L νµ,L ντ,L L1,L = , L2,L = , L3,L = . µL τL eL Dazu hat man die rechtshändigen Anteile entsprechend den unteren Komponenten dieser Dubletts eR , µR , τR . Quarks Zweitens enthält das Standardmodell sechs SU(3)c -Tripletts von Quarks, deren linkshändige Anteile sich in SU(2)L -Dubletts austeilen lassen ! ! ! uL cL tL 0 0 0 Q1,L = 0 , Q2,L = 0 , Q3,L = 0 , dL sL bL während die rechtshändigen Anteile SU(2)L -Singuletts sind uR , cR , tR . dR , sR , bR . Im Folgenden werden die Dirac-Felder entsprechend diesen Leptonen und Quarks als ψ̂`,L/R , ψ̂ν` ,L , ψ̂q,L/R geschrieben, mit ` = e, µ oder τ and q = u, d, s, c, b oder t. Gestrichte Teilchen/Felder (d0L , s0L , b0L ) stellen Linearkombinationen der entsprechenden nicht-gestrichten Felder dar. Neben den Vektorbosonen und diesen Fermionen gibt es im Standardmodell noch ein Skalar-Feld Φ̂, das sog. Higgs-Feld . XII.2.1 c Quantenzahlen :::::::::::::::::::::::: Ein weiteres Element des Standardmodells besteht aus den Werten der unterschiedlichen Ladungen der im vorigen Paragraph eingeführten Felder, die bestimmen, wie sich diese Felder unter den verschiedenen Eichsymmetrien transformieren. Wechselwirkungen der Elementarteilchenphysik 117 N.BORGHINI Elementarteilchenphysik Somit tragen alle links- und rechtshändigen Leptonen sowie das Higgs-Feld keine Farbladung — während jedes Quark-Spezies in jeder Farbe vorkommt. Hiernach wird die Farbladung der Quarks nicht weiter spezifiziert, und es wird nicht mehr auf den SU(3)c -Sektor der Theorie eingegangen. Der elektroschwache Isospin der Fermionen lässt sich direkt auf der Dublett-Struktur lesen: die Dubletts haben I W = 12 , wobei die obere bzw. untere Komponente die Projektion I3W = + 12 bzw. I3W = − 21 hat, während für die SU(2)L -Singuletts — die rechtshändigen Teilchen — natürlich I W = 0 gilt. Dazu kommt das Higgs-Feld tatsächlich auch als ein SU(2)L -Dublett vor, vgl. Gl. (XII.6a) unten. Schließlich lauten die Hyperladungen der unterschiedlichen Fermionen wie folgt73 Teilchen Li,L eR , µR , τR Q0i,L uR , cR , tR dR , sR , bR YW − 12 −1 + 61 + 23 − 13 während das Higgs-Feld Φ̂ die Hyperladung YW = + 12 trägt. Darüber hinaus ist jedes Vektorboson assoziiert mit einer der Gruppe SU(3)c , SU(2)L oder U(1)Y ungeladen unter den zwei anderen Eichsymmetrien: die Gluonen tragen nur eine Farbladung, die Ŵiρ -Felder nur einen schwachen Isospin und das B̂ ρ -Feld nur eine Hyperladung. Bemerkung: Dagegen sollen die physikalischen W + - und W − -Bosonen der QED und der schwachen Wechselwirkung unterliegen, was schon zeigt, dass es keine genaue Äquivalenz zwischen der Letzteren und der SU(2)L gibt. XII.2.1 d Renormierbarkeit ::::::::::::::::::::::::::: Wie schon am Anfang des Abschn. XII.1.2 erwähnt wurde, sollen die in der Theorie erlaubten Wechselwirkungsterme einerseits Lorentz-invariant sein, andererseits entweder drei fermionischen und bosonischen Felder oder vier bosonischen Felder miteinander koppeln, damit die Theorie renormierbar ist. XII.2.1 e Kopplungskonstanten :::::::::::::::::::::::::::::: Schreibt man die allgemeinst mögliche Lagrange-Dichte für die verschiedenen Felder der Paragraphen (XII.2.1 a) und (XII.2.1 b), so sollen noch viele freie Parameter eingeführt werden, und zwar Kopplungskonstanten für alle erlaubten Vertices der Theorie.74 XII.2.1 f Offene Fragen ::::::::::::::::::::::: Das aus den oben dargestellten Bausteinen bestehende Standardmodell ist ziemlich einfach, doch lässt Raum für viele Fragen, die sich im Rahmen des Modells nicht beantworten lassen: - Warum besitzt die Theorie die Symmetriegruppe (XII.3)? - Warum findet man diese Felder und nicht andere? - Warum besitzen jene Felder gerade die in Paragraph XII.2.1 c gegebenen Quantenzahlen? - Warum nehmen die Kopplungskonstanten bestimmte Werte und nicht andere an? Im Rahmen des Standardmodells sind die Quantenzahlen und die Kopplungskonstanten Parameter, die experimentell mehr oder weniger gut bekannt sind. XII.2.2 Lagrange-Dichte des elektroschwachen Sektors Die Lagrange-Dichte L̂SM des Standardmodells ist eine Funktionale der verschiedenen Felder eingeführt in Abschn. XII.2.1 und deren Vierergradienten. Hiernach werden die unterschiedlichen Terme entsprechend dem elektroschwachen SU(2)L × U(1)Y -Anteil der Theorie erläutert. 73 Statt dieser Werte kann die Leserin sich die Beziehung (XII.27) zwischen Hyperladung, schwachem Isospin und der mehr bekannten elektrischen Ladung merken — insbesondere da die Konvention für die Hyperladung nicht universell ist. 74 ~ˆ ρ , B̂ ρ ) und den Fermionen; 3 Kopplungskonstanten (gs , g, g 0 ) für die Vertices zwischen jedem Vektorfeld (Gluon, W 9 „Yukawa-Kopplungen“ (hi ) für die Vertices zwischen dem Higgs-Feld und den Fermionen; 2 Parameter (λ, µ) für das Potential des Higgs-Feldes. Wechselwirkungen der Elementarteilchenphysik 118 N.BORGHINI Elementarteilchenphysik XII.2.2 a Eichkovariante Ableitung :::::::::::::::::::::::::::::::::: Um die Eichinvarianz der Theorie zu gewährleisten, sollen in der Lagrange-Dichte die Vierergradienten ∂ρ in den „kinetischen Termen“ 75 der verschiedenen Fermionen und des Higgs-Feldes durch sog. eichkovariante Ableitungen ersetzt werden. Für ein SU(2)L -Dublett mit Hyperladung YW lautet diese Ableitung76 ~ˆ ρ + iYW g 0 B̂ρ , (XII.4) D̂ρ ≡ ∂ρ + ig T~ · W mit g, g 0 den jeweiligen Kopplungskonstanten der Gruppen SU(2)L , U(1)Y , und T1 , T2 , T3 drei 2×2-Matrizen, und zwar Tj ≡ 12 σj , wobei die σj die Pauli-Matrizen sind. Für ein SU(2)L -Singulett fällt natürlich der zweite Term in Gl. (XII.4) weg. Für ein SU(2)L -Dublett Ψ̂(x) mit Hyperladung YW lautet die Eichtransformation entsprechend der eichkovarianten Ableitung (XII.4) Ψ̂(x) → Ψ̂0 (x) = e−iYW α(x) e−iβj (x)Tj Ψ̂(x), (XII.5a) mit α(x) und βj (x), j = 1, 2, 3, vier beliebigen reellen Funktionen. Gleichzeitig transformieren sich die Eichfelder gemäß ~ˆ ρ (x) → T~ · W ~ˆ ρ0 (x) = U(x) T~ · W ~ˆ ρ (x)U(x)−1 + i ∂ρ U(x) U(x)−1 , (XII.5b) T~ · W g ~ ~ mit U(x) ≡ e−iβj (x)Tj = e−i β(x)·T , und 1 B̂ρ (x) → B̂ρ0 (x) = B̂ρ (x) + 0 ∂ρ α(x), (XII.5c) g vgl. Gl. (XII.1). Bemerkung: Die kinetischen Terme für die Eichfelder in der Lagrange-Dichte lauten 1 1 i = − F̂iµν F̂µν − B̂ µν B̂µν , L̂gauge kin 4 4 j k i i i mit F̂µν ≡ ∂µ Ŵν − ∂ν Ŵµ − gεijk Ŵµ Ŵν für i = 1, 2, 3 bzw. B̂µν ≡ ∂µ B̂ν − ∂ν B̂µ dem SU(2)L - bzw. U(1)Y -Feldstärketensor. XII.2.2 b Higgs-Sektor Wie oben schon erwähnt wurde transformiert das skalare Higgs-Feld Φ̂ wie ein Dublett ! Φ̂+ , (XII.6a) Φ̂ = Φ̂0 :::::::::::::::::::::: unter SU(2)L -Transformationen, wobei die Skalarfelder Φ̂+ und Φ̂0 komplexwertig sind. Dies entspricht also insgesamt 4 Freiheitsgraden. Für das Folgende lohnt es sich, das ladungskonjugierte Dublett ! (Φ̂0 )∗ ˆ = iσ2 Φ̂∗ (XII.6b) Φ̃ = + ∗ −(Φ̂ ) einzuführen. Kinetischer Term und Wechselwirkung des Higgs-Feldes mit den Eichfeldern Ein erster Beitrag zur Lagrange-Dichte des Standardmodells im Higgs-Sektor besteht aus der Summe des kinetischen Terms für das Higgs-Feld und dessen Wechselwirkungsterm mit den SU(2)L und U(1)L -Eichfeldern. Das ganze lässt sich einfach mithilfe der eichkovarianten Ableitung (XII.4) schreiben † Φ/gauge L̂Φ = D̂ρ Φ̂ D̂ρ Φ̂ , (XII.7) kin + L̂ mit hier YW = 12 . Diese Terme werden mehr detailliert in Abschn. XII.4 hiernach untersucht. 75 Solche Terme entsprechen der kinetischen Energie des Feldes. In diesem Fall ist D̂ρ tatsächlich eine auf Dubletts wirkende 2 × 2-Matrix, und man sollte den ersten und den dritten Term auf der rechten Seite der Gl. (XII.4) mit der 2×2-Einheitsmatrix 12 multiplizieren. 76 Wechselwirkungen der Elementarteilchenphysik 119 N.BORGHINI Elementarteilchenphysik Selbstwechselwirkung In der Lagrange-Dichte können noch Terme auftreten, die nur das Higgs-Feld enthalten, und zwar der Art L̂ΦΦ = −V (Φ̂) mit V einem „Potential“ für das Feld. Die einzige Möglichkeit, die Lorentzund Eichinvarianz berücksichtigt und zu Vertices mit maximal vier Feldern führt, ist 2 (XII.8) V Φ̂ = κΦ̂† Φ̂ + λ Φ̂† Φ̂ , mit κ und λ freien Parametern. Die Rolle dieses Terms im Standardmodell wird in Abschn. XII.3 erläutert. Wechselwirkung des Higgs-Feldes mit den Fermionen Schließlich kann das Higgs-Feld noch mit den Fermionen wechselwirken. Um der Eichinvarianz unter SU(2)L zu genügen, soll das Higgs-Dublett einerseits an die Dubletts Q0i,L , Li,L koppeln. Dazu soll noch ein zweites, rechtshändiges Fermion — gleicher Natur (Quark oder Lepton), wegen der SU(3)c Symmetrie — im Term vorkommen, um die Lorentz-Invarianz zu gewährleisten. Hiernach wird der Allgemeinheit halber angenommen, dass jenes Fermion nicht genau eines der rechtshändigen Fermionen des Paragraphs XII.2.1 b ist, sondern nur eine Linearkombination davon, die mit zwei Strichen geschrieben wird: ψ̂q00 ,R . Insgesamt lautet also der Wechselwirkungsterm zwischen dem Higgs-Feld und den Quarks ˆ ˆ† 0 † 0 ˆ ˆ ˆ 0 Φ̃ ˆ0 L̂Φq = −hu Q̄ 1,L ψ̂u00 ,R + ψ̄u00 ,R Φ̃ Q̂1,L − hd Q̄1,L Φ̂ ψ̂d00 ,R + ψ̄d00 ,R Φ̂ Q̂1,L + ähnliche Terme für die 2. und 3. Generationen, (XII.9) mit sog. Yukawa-Kopplungskonstanten hu , hd , usw., die hiernach reelle Zahlen sein werden. Für den Wechselwirkungsterm zwischen dem Higgs-Feld und den Leptonen kann man schon berücksichtigen, dass es im Standardmodell keine „Leptonen-Mischung“ gibt, im Gegensatz zur Quark-Mischung in der schwachen Wechselwirkung. Somit wird auf die Einführung von Feldern ψ̂`00 ,R verzichtet. Der Wechselwirkungsterm lautet dann ˆ Φ̂ ψ̂ + ψ̄ˆ Φ̂† L̂ L̂Φ` = −he L̄ 1,L e,R 1,L + ähnliche Terme für die 2. und 3. Generationen, (XII.10) e,R mit he , hµ , hτ reellen Yukawa-Kopplungskonstanten. Die Wechselwirkungsterm (XII.9) und (XII.10) werden in Abschn. XII.5 weiter diskutiert. Bemerkung: Vom Anfang an wurden keine rechtshändige Neutrinos eingeführt, so dass Neutrinos tatsächlich nicht mit dem Higgs-Feld wechselwirken und somit keine Masse kriegen werden. XII.2.2 c Fermionischer Sektor :::::::::::::::::::::::::::::: Die Lagrange-Dichte enthält noch Terme, die die kinetischen Energien der Fermionen und ihre Wechselwirkungen mit den Eichfeldern beschreiben, und zwar der Art X X q,`/gauge ˆ iD ˆ ψ̂L + L̂q,` + L̂ = ψ̄ 6 ψ̄ˆR iD 6 ˆ ψ̂R , (XII.11) L kin ψL ψR wobei die Summen über alle links- bzw. rechtshändigen Fermionen laufen, während D 6 ˆ ≡ γ ρ D̂ρ ist. XII.3 Spontane Symmetriebrechung. Higgs-Boson Im vorigen Abschnitt wurde das Potential V (Φ̂) des Higgs-Feldes eingeführt, um seine „Selbstwechselwirkung“ zu beschreiben. Dieser Abschnitt befasst sich genauer mit den Folgerungen dieses Terms für die Dynamik des Higgs-Feldes. Wenn das Potential die geeignete Form hat, dann wird die U(1)Y × SU(2)L Eichinvarianz der Lagrange-Dichte im physikalischen realisierten Zustand spontan gebrochen (Abschn. XII.3.1). Infolge dieser Symmetriebrechung entspricht das Higgs-Dublett nicht vier, sondern nur einem Teilchen, dessen Masse und Selbstwechselwirkungen durch die Parameter des Potentials V (Φ̂) bestimmt werden (Abschn. XII.3.2). Wechselwirkungen der Elementarteilchenphysik 120 N.BORGHINI Elementarteilchenphysik XII.3.1 Spontane Symmetriebrechung Zur Untersuchung des Einflusses des Potentials V (Φ̂) lohnt es sich zunächst, das Verhalten in Abhängigkeit von Φ̂† Φ̂ zu betrachten. Zu diesem Zweck macht man den Ansatz ! 1 0 Φ̂(x) = √ , (XII.12a) 2 v mit v einer von x unabhängigen positiven reellen Zahl. Dies gibt für das Potential 1 1 V Φ̂ = κv + λv . 2 4 2 4 Sind κ negativ und λ positiv, so hat V Φ̂ ein Minimum für einen endlichen Wert von auf Abb. XII.2 erkennen lässt. V Φ̂ (XII.12b) v , wie sich v Abbildung XII.2: Verlauf des Potentials (XII.12b) für κ < 0, λ > 0. Dank der U(1)Y × SU(2)L -Eichsymmetrie des Standardmodells ist die Konfiguration (XII.12a) ziemlich allgemein, weil sie sich aus jeder anderen Feldkonfiguration mit Φ̂† Φ̂ = 2 /2 durch eine geeignete Eichtransformation erhalten lässt. Beispielsweise gelten für jeden reellen Parameter θ !! !! !! 0 1 0 1 1 eiθ V √ =V √ =V √ . 2 2 eiθ 2 0 v v v v v Wenn das Higgs-Feld sich in einer Konfiguration wie (XII.12a) mit 6= 0 befindet, dann ist die resultierende Theorie nicht mehr eichinvariant — z.B. weil die Vektorbosonen eine Masse kriegen, vgl. Abschn. XII.4 —, d.h. die Eichsymmetrie ist gebrochen. Da dies nicht durch einen Term in der Lagrange-Dichte, sondern durch die zufällige Wahl77 einer besonderen Konfiguration verursacht wird, spricht man von spontaner Symmetriebrechung. Um mit positiven Parametern zu arbeiten, wird das Potential des Higgs-Feldes im Folgenden als 2 V Φ̂ = −µ2 Φ̂† Φ̂ + λ Φ̂† Φ̂ , (XII.13) mit µ2 > 0 und λ > 0 geschrieben. Dann gilt für die Feldkonfiguration (XII.12a) 77 nicht nur des Autors, sondern der Natur! Wechselwirkungen der Elementarteilchenphysik 121 N.BORGHINI Elementarteilchenphysik 1 V Φ̂ = − µ2 2 r v was minimal für den Wert v= 2 1 + λ 4 v, 4 (XII.14) µ2 λ (XII.15) ist. XII.3.2 Higgs-Boson Aus quantenmechanischen Gründen kann das Higgs-Feld nicht genau konstant sein, sondern soll noch in jedem Punkt kleine Schwankungen um den Wert (XII.12a) haben. Diese lassen sich allgemeinen schreiben als ! φ̂1 (x)+i φ̂2 (x) 1 Φ̂(x) = √ , 2 + φ̂0 (x)+i φ̂3 (x) v mit φ̂0 , φ̂1 , φ̂2 , φ̂3 vier reellen Skalarfeldoperatoren. Dank der Invarianz unter der Eichgruppe U(1)Y × SU(2)L können aber die Felder φ̂1 , φ̂2 , φ̂3 weggedreht werden, so dass man einfach das Dublett ! 0 1 Φ̂(x) = √ (XII.16) 2 + φ̂0 (x) v betrachten kann. Jetzt hängt das Higgs-Feld Φ̂(x) von nur einem reellen Skalarfeld ab, entsprechend einem einzigen Teilchen, dem Higgs-Boson. Mithilfe der SU(2)-Matrix i i U(x) = exp − φ̂2 (x)σ1 + φ̂1 (x)σ2 + φ̂3 (x)σ3 ≈ 12 − φ̂2 (x)σ1 + φ̂1 (x)σ2 + φ̂3 (x)σ3 v v gilt in jedem Raumzeitpunkt x (der Kurze halber wird die x-Abhängigkeit der Felder nicht geschrieben) ! ! ! ! 0 0 1 − i φ̂3 / φ1 / + iφ̂2 / φ̂1 +i φ̂2 1 1 1 √ U ≈√ ≈√ . 2 2 φ1 / − iφ̂2 / 2 + φ̂0 + φ̂0 1 + i φ̂3 / + φ̂0 +i φ̂3 v v v v v v v v v Somit ist das Dublett im rechten Glied äquivalent unter einer Eichtransformation zum Dublett (XII.16). Für das Feld (XII.16) lautet das Potential λ4 4 µ2 2 V Φ̂ = − + 2 φ̂0 + φ̂20 + + 4 3 φ̂0 + 6 2 φ̂20 + 4 φ̂30 + φ̂40 2 4 µ2 4 λ 4 2 1 λ =− + + (−µ2 +λ 2 ) φ̂0 + (−µ2 +3λ 2 ) φ̂20 + λ φ̂30 + φ̂40 . 2 4 2 4 Die zwei ersten Terme stellen einfach das schon bekannte Minimum (XII.14) des Potentials dar. Der nächste, lineare Term in φ̂0 verschwindet dank der Beziehung (XII.15). Der quadratische Term in φ̂0 , mit −µ2 +3λ 2 = 2λ 2 = 2µ2 ≡ m2H (XII.17) v v v v v v v v v v v v v v entspricht dem Massenterm des Higgs-Bosons, mit mH der Bosonenmasse. Schließlich stellen die zwei letzten Terme die Selbstwechselwirkung des Higgs-Bosons dar. Dabei treten Vertices mit entweder drei oder vier Higgs-Bosonen auf mit jeweiliger Kopplungskonstante λ jh i v = pλµ , 2 Wechselwirkungen der Elementarteilchenphysik und ji ij λ . 4 122 N.BORGHINI Elementarteilchenphysik Im Rahmen des Standardmodells sind λ und µ2 , oder äquivalent Experimentell findet man78 v und m v ' 246, 22 GeV, H, freie Parameter. mH ≈ 125 GeV (XII.18) wobei der zweite Wert die Masse des 2011-2012 am LHC entdeckten Teilchens, das sich sehr ähnlich einem Higgs-Boson verhält, ist. XII.4 Vektorbosonen im Standardmodell Im vorigen Abschnitt wurde gezeigt, dass falls das Potential (XII.8) des Higgs-Feldes die Form 2 + λ Φ̂† Φ̂ mit µ2 > 0 und λ > 0 hat, dann ist die U(1)Y × SU(2)L -Eichinvarianz des Standardmodells im physikalisch realisierten Vakuum spontan gebrochen. In diesem Abschnitt wird eine erste Folge dieser Symmetriebrechung untersucht, und zwar der sog. Higgs-Mechanismus,79 gemäß dem der endliche Vakuumerwartungswert des Higgs-Feldes den schwachen Bosonen eine Masse gibt. p Sei also angenommen, dass das Higgs-Feld den Wert (XII.12a) annimmt, mit = µ2 /λ einer positiven reellen Konstante. In diesem Fall vereinfacht sich der Anteil (XII.7) der Lagrange-Dichte nach Auslassen des kinetischen Terms für das φ̂0 -Feld zu !# " !#† " 0 0 † ρ 1 i i ˆ ˆ W,Z 0 ρ 0 ρ ~ ρ + g B̂ρ ~ + g B̂ D̂ρ Φ̂ D̂ Φ̂ ≈ L̂M ≡ ig T~ · W ig T~ · W 2 2 2 ! 0 1 ˆ ˆ ρ ρ 0 0 ~ + ig B̂ ~ ρ − ig B̂ρ ig ~σ · W (XII.19) , = −ig ~σ · W 0 8 −µ2 Φ̂† Φ̂ v v v v v wobei die zweite Zeile die Hermizität der Pauli-Matrizen und die Reellwertigkeit der Vektorfelder benutzt. Das Ausmultiplizieren des Produkts im rechten Glied gibt dann ! i 0 2 h 2 W,Z ρ i jρ 0 i ρ iρ 02 L̂M = . 0 1 g σi σj Ŵρ Ŵ + gg σi Ŵρ B̂ + B̂ρ Ŵ + g B̂ρ B̂ 8 1 v Dies kann noch als Summe von drei Termen geschrieben werden, die sich einfach berechnen lassen. Unter Verwendung der Beziehung σi σj = δij 12 + iijk σk und der Vertauschungsrelation der bosonischen Feldoperatoren Ŵρi und Ŵρj kommt zuerst für den ersten Term ! 0 g2 2 g 2 2 ~ˆ ~ˆ ρ 0 1 σi σj Ŵρi Ŵ jρ = Wρ · W . 8 8 1 v v Im zweiten Term tragen die Pauli-Matrizen σ1 und σ2 , deren (2,2)-Element Null ist, nicht bei, so dass es nur ! 0 gg 0 2 gg 0 2 3 ρ i ρ iρ 0 1 σi Ŵρ B̂ + B̂ρ Ŵ =− Ŵρ B̂ + B̂ρ Ŵ 3ρ 8 8 1 v v 0 2 2 B̂ B̂ ρ /8. Insgesamt findet übrig bleibt. Schließlich ist der dritte Beitrag zu L̂W,Z ρ M einfach gleich g man also 1 g 2 W,Z Ŵρ1 Ŵ 1ρ + Ŵρ2 Ŵ 2ρ L̂M = 2 2 2 h i 1 + g 2 Ŵρ3 Ŵ 3ρ − gg 0 Ŵρ3 B̂ ρ + B̂ρ Ŵ 3ρ + g 0 2 B̂ρ B̂ ρ . (XII.20) 2 2 v v v Unter der Annahme, dass die W ± - und Z 0 -Bosonen ihre Masse über den in Abschn. XII.4 dargestellten HiggsMechanismus kriegen. 79 ... auch Brout–Englert–Higgs- oder gar Englert–Brout–Higgs–Guralnik–Hagen–Kibble-Mechanismus genannt. 78 Wechselwirkungen der Elementarteilchenphysik 123 N.BORGHINI Elementarteilchenphysik Führt man jetzt die komplexwertigen Vektorfeldoperatoren 1 1 Ŵρ+ ≡ √ Ŵρ1 − i Ŵρ2 und Ŵρ− ≡ √ Ŵρ1 + i Ŵρ2 = Ŵρ+∗ (XII.21) 2 2 ∗ i ∗ 1 g 2h + Ŵρ Ŵ +ρ + Ŵρ− Ŵ −ρ . ein, so lautet die erste Zeile in Gl. (XII.20) noch 2 2 Wiederum lässt sich der Term in den eckigen Klammern in der zweiten Zeile umschreiben als g Ŵρ3 − g 0 B̂ρ g Ŵ 3ρ − g 0 B̂ ρ = ! ! 0 0 g g g g p g 2 + g 02 p Ŵρ3 − p B̂ρ Ŵ 3ρ − p B̂ ρ . g 2 + g 02 g 2 + g 02 g 2 + g 02 g 2 + g 02 v Definiert man den Weinberg-Winkel — auch elektroschwacher Mischungswinkel gennant — θW durch tan θW ≡ g0 , g (XII.22) g0 g entsprechend sin θW = p und cos θW = p , sowie neue reelle Vektorfeldoperatoren g 2 + g 02 g 2 + g 02 Ẑρ , Âρ durch ! ! ! Ẑρ cos θW − sin θW Ŵρ3 = , (XII.23) sin θW cos θW Âρ B̂ρ so ergibt sich g Ŵρ3 − g 0 B̂ρ g Ŵ 3ρ − g 0 B̂ ρ = g 2 + g 02 Ẑρ Ẑ ρ . Wenn man schließlich p g 2 + g 02 g mW ≡ , mZ ≡ (XII.24) 2 2 sowie mγ ≡ 0(!) schreibt, dann wird Gl. (XII.20) zu v v ∗ 1 1 2 1 1 + +ρ ∗ L̂W,Z + m2W Ŵρ− Ŵ −ρ + m2Z Ẑρ Ẑ ρ + m2γ Âρ Âρ , (XII.25) M = mW Ŵρ Ŵ 2 2 2 2 wobei der letzte Term natürlich gleich Null ist. Das ist gerade die Summe der Massentermen für vier Vektorfeldern, und zwar zwei Spin-1-Teilchen mit der Masse mW — die W ± -Bosonen —, ein Spin-1-Teilchen mit der Masse mZ — das Z 0 -Boson —, und ein masseloses Spin-1-Teilchen — das Photon. Dazu geben die Relationen (XII.22) und (XII.24) sofort mW = mZ cos θW , d.h. mZ > mW . Somit kriegen die schwachen Vektorbosonen W ± und Z 0 eine Masse, obwohl Eichinvarianz die Anwesenheit von Massentermen für Vektorfelder in der Lagrange-Dichte verbietet. Die eichkovariante Ableitung Dρ , Gl. (XII.4), kann in der neuen Basis bestehend aus den Feldoperatoren {Ŵρ+ , Ŵρ− , Ẑρ , Âρ } geschrieben werden. Im Allgemeinen gilt zunächst ~ˆ ρ + iYW g 0 B̂ρ D̂ρ ≡ ∂ρ + ig T~ · W ! 0 Ŵρ1 −i Ŵρ2 g = ∂ρ + i 2 Ŵρ1 +i Ŵρ2 0 ! p 3 0 g 2 + g 02 cos θW Ŵρ +2YW sin θW B̂ρ +i . 2 0 − cos θW Ŵρ3 +2YW sin θW B̂ρ Im zweiten Term auf der rechten Seite von D̂ρ erkennt man Ŵρ± = Ŵρ1 ∓i Ŵρ2 . Ersetzt man im dritten Term Ŵρ3 und B̂ρ durch die geeigneten Linearkombinationen von Ẑρ und Âρ — entsprechend einer Drehung um einen Winkel −θW , vgl. Gl. (XII.23) —, so erhält man für D̂ρ nach einiger einfachen Algebra Wechselwirkungen der Elementarteilchenphysik 124 N.BORGHINI Elementarteilchenphysik ! + 0 Ŵρ g ∂ρ + i √ 2 Ŵρ− 0 (cos2 θW −2YW sin2 θW )Ẑρ p 0 g 2 +g 02 +2 cos θW sin θW (YW + 21 )Âρ +i . 2 2 2 (−cos θW −2YW sin θW )Ẑρ 0 +2 cos θW sin θW (YW − 12 )Âρ Dabei stellt der Term proportional zur Kopplungskonstante g die Kopplung der W ± -Bosonen zu den geladenen schwachen Strömen dar — da die Matrix mit den Vektorfeldern antidiagonal ist, koppelt sie die obere Komponente eines SU(2)L -Dubletts mit der unteren Komponente eines anderen Dubletts, d.h. mit einem Teilchen mit einer unterschiedlichen elektrischen Ladung. Somit ist g gleich der Kopplungskonstante gw des Abschn. XI.3.2 — bis auf einer multiplikativen Konstante, die als 1 angenommen wird. p Dagegen liefert der Term proportional zu g 2 + g 02 , mit der diagonalen Matrix, die Wechselwirkungen zwischen neutralen Strömen und den elektrisch neutralen Z 0 -Bosonen oder Photonen. p 2 02 Insbesondere ist die Kopplung zum Photon-Feldoperator µ proportional zu g +g cos θW sin θW . Somit wird dieses Produkt mit der Kopplungskonstante e der Elektrodynamik identifiziert e≡ p g 2 +g 02 cos θW sin θW = g sin θW . (XII.26) Dementsprechend lässt sich die elektrische Ladung Q für die obere bzw. untere Komponente eines Dubletts mit YW + 21 bzw. YW − 12 gleichsetzen. Da 12 bzw. − 12 gerade der schwache Isospin I3W des jeweiligen Teilchens ist, gilt allgemein die Beziehung80 Q = I3W + YW (XII.27) zwischen elektrischer Ladung, schwachem Isospin und elektroschwacher Hyperladung. Beispielsweise ist die elektroschwache Hyperladung des Higgs-Feldes (XII.6a) YW = 21 . Dies gibt Q = 0 für dessen untere Komponente Φ̂0 , d.h. das physikalische Higgs-Boson ist elektrisch neutral. Für die obere Komponente Φ̂+ kommt Q = +1 — wie sich aus der Notation vermuten ließ. √ 2 = 2 2 G m2 Bemerkung: Kombiniert man die erste Definition in (XII.24) mit der Beziehung gw F W (Abschn. XI.3.2) und mit gw = g, so kommt v 2 =√ 1 , 2 GF woraus der Wert (XII.18) sich erhalten lässt. XII.5 Fermionen im Standardmodell Die nicht-triviale Konfiguration des Higgs-Feldes, die mit der spontanen Symmetriebrechung der U(1)Y × SU(2)L -Eichsymmetrie einhergeht, gibt nicht nur Massen zu den schwachen Vektorbosonen, sondern auch zu den Fermionen, die zum Higgs-Feld koppeln. Somit erhalten sowohl die elektrisch geladenen Leptonen (Abschn. XII.5.1) als auch die Quarks (Abschn. XII.5.2) eine Masse. Bei den Letzteren unterscheiden sich die Masseneigenzustände von den Zuständen, die einfach zu den schwachen W ± -Bosonen koppeln. Diese Tatsache erlaubt die Existenz im Standardmodell von Prozessen, die die CP -Symmetrie verletzen (Abschn. XII.5.3), wie experimentell beobachtet wurde. ! ! 0 + φ̂ (x) 1 1 0 ˆ , entsprechend Φ̃(x) =√ , angenommen. Hiernach wird Φ̂(x) = √ 2 2 + φ̂0 (x) 0 v v 0 Verwendet man die Konvention, laut der die elektroschwache Hyperladung YW = 2YW ist, so gilt natürlich W 0 Q = I3 + YW /2, in Ähnlichkeit zur (verallgemeinerten) Gell-Mann–Nishijima-Formel (X.25b). 80 Wechselwirkungen der Elementarteilchenphysik 125 N.BORGHINI Elementarteilchenphysik XII.5.1 Wechselwirkung der Leptonen mit dem Higgs-Feld Mit der obigen Feldkonfiguration für Φ̂ lautet der erste Term in der Lagrange-Dichte (XII.10), entsprechend der Wechselwirkung zwischen Elektron- und Higgs-Feld he ˆ he ˆ Φ̂ ψ̂ + ψ̄ˆ Φ̂† L̂ −he L̄ ψ̄e,L ψ̂e,R + ψ̄ˆe,R ψ̂e,L − √ ψ̄ˆe,L ψ̂e,R + ψ̄ˆe,R ψ̂e,L φ̂0 . 1,L = − √ e,R e,R 1,L 2 2 Für die zweite und dritte Generation, d.h. für das Myon und das Tau, gelten ähnliche Gleichungen. Schreibt man dann ψ̄ˆL ψ̂R = ψ̄ˆ PR PR ψ̂ = ψ̄ˆ PR ψ̂ und ebenso ψ̄ˆR ψ̂L = ψ̄ˆ PL ψ̂, so kommt unter Nutzung von PR + PL = 1 v v v v hµ hµ he hτ he hτ L̂Φ` = − √ ψ̄ˆe ψ̂e − √ ψ̄ˆµ ψ̂µ − √ ψ̄ˆτ ψ̂τ − √ ψ̄ˆe ψ̂e φ̂0 − √ ψ̄ˆµ ψ̂µ φ̂0 − √ ψ̄ˆτ ψ̂τ φ̂0 . (XII.28) 2 2 2 2 2 2 XII.5.1 a Leptonen-Massen ::::::::::::::::::::::::::: Um die Eichinvarianz nicht zu verletzen, haben die Leptonen — und allgemeiner die Fermionen — ursprünglich keinen Massenterm in der Lagrange-Dichte: die Eichsymmetrie wird also nicht explizit gebrochen. Mit den Definitionen hµ he hτ me ≡ √ , mµ ≡ √ , mτ ≡ √ (XII.29a) 2 2 2 v v v lassen sich die drei ersten Terme in L̂Φ` [Gl. (XII.28)] als Massenterme L̂`M = −me ψ̄ˆe ψ̂e − mµ ψ̄ˆµ ψ̂µ − mτ ψ̄ˆτ ψ̂τ (XII.29b) für die Leptonen identifizieren, wobei me , mµ , mτ die Massen der Leptonen sind. Somit kriegen nach der spontanen Brechung der Eichsymmetrie die Fermionen eine Masse, ohne die Renormierbarkeit der Theorie zu gefährden: eine zufällige Wahl der Natur zerstört nicht die mathematische Wohldefiniertheit des Standardmodells. XII.5.1 b Wechselwirkung der Leptonen mit dem Higgs-Boson :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Die drei letzten Terme in Gl. (XII.28) stellen Wechselwirkungsterme zwischen einem der drei Leptonen und dem Higgs-Boson dar. Genauer handelt es sich um Dreiervertizes h E √ wobei die Kopplungskonstante zwischen jeder Leptonart und dem Higgs-Boson jeweils gleich h / 2, e √ √ hµ / 2 und hτ / 2 ist. Die Beziehungen (XII.29a) zeigen, dass die Yukawa-Kopplung hi mit i = e, µ oder τ proportional zur entsprechenden Teilchenmasse mi sein soll. Somit koppeln schwere Leptonen stärker zum HiggsBoson als leichte Leptonen. Diese Bemerkung gilt auch für die Kopplung zwischen dem Higgs-Boson und den Quarks. XII.5.2 Quark-Massen Unter Vernachlässigung des skalaren Feldes φ̂0 des Higgs-Bosons gilt für die Wechselwirkung zwischen dem Higgs-Feld und den Feldern für die Quarks der ersten Generation ˆ † Q̂0 ˆ ψ̂ 00 + ψ̄ˆ 00 Φ̃ ˆ 0 Φ̂ ψ̂ 00 + ψ̄ˆ 00 Φ̂† Q̂0 ˆ 0 Φ̃ −h Q̄ − h Q̄ ' u 1,L u ,R u ,R 1,L d 1,L v d ,R d ,R 1,L v h hu d − √ ψ̄ˆu,L ψ̂u00,R + ψ̄ˆu00,R ψ̂u,L − √ ψ̄ˆd0 ,L ψ̂d00,R + ψ̄ˆd00,R ψ̂d0 ,L . 2 2 Die rechte Seite kann noch geschrieben werden als h hu ˆ d −√ ψ̄u PR ψ̂u00 + ψ̄ˆu00 PL ψ̂u − √ ψ̄ˆd0 PR ψ̂d00 + ψ̄ˆd00 PL ψ̂d0 . 2 2 Für die zweite und dritte Generation gelten ähnliche Gleichungen. v Wechselwirkungen der Elementarteilchenphysik v 126 N.BORGHINI Elementarteilchenphysik Dabei sollen die „nicht-gestrichten Quarks“ u, d, s, c, b und t die QCD-Eigenzustände sein, entsprechend z.B. den Valenz-Quarks in einem Hadron. Das Feld ψ̂d0 (und in ähnlicher Weise ψ̂s0 oder ψ̂b0 ) stellt die unitäre Linearkombination der Quark-Felder ψ̂d , ψ̂s und ψ̂b dar, die mit ψ̂u (bzw. ψ̂c , ψ̂t ) über ein W + -Boson wechselwirkt. Wiederum sind die Felder ψ̂u00 , ψ̂c00 und ψ̂t00 unitäre Linearkombinationen von ψ̂u , ψ̂c und ψ̂t , die je einfach mit einem dieser Felder und mit dem HiggsFeld wechselwirken. Schließlich sind ψ̂d00 , ψ̂s00 und ψ̂b00 unitäre Linearkombinationen der Felder ψ̂d , ψ̂s und ψ̂b , die je einfach mit dem Higgs-Feld und entweder ψ̂d0 , ψ̂s0 oder ψ̂b0 wechselwirken. Experiment zeigt, dass ψ̂u , ψ̂c und ψ̂t tatsächlich auch Masseneigenzustände sind. Damit die Theorie dies gibt, sollen ψ̂u00 = ψ̂u , ψ̂c00 = ψ̂c und ψ̂t00 = ψ̂t gelten. Dann kommt tatsächlich in der Lagrange-Dichte i hu ˆ hu h hu −√ ψ̄u PR ψ̂u00 + ψ̄ˆu00 PL ψ̂u = − √ ψ̄ˆu (PR + PL )ψ̂u = − √ ψ̄ˆu ψ̂u ≡ −mu ψ̄ˆu ψ̂u , 2 2 2 mit mu der Masse des u-Quarks. Für die c und t-Quarks gelten ähnliche Ergebnisse. v v v Für die d-, s- und b-Quarks sind die QCD-Eigenzustände ψ̂d , ψ̂s und ψ̂b auch Masseneigenzustände; sie sind aber nicht Eigenzustände zur Wechselwirkung mit den schwachen W ± -Bosonen, entsprechend der schon gesehenen Flavour-Mischung. Infolgedessen wechselwirken ψ̂d , ψ̂s , ψ̂b nicht direkt mit dem Higgs-Feld, sondern nur als Linearkombinationen. Sei VCKM die spezielle unitäre 3×3-Matrix, die die Felder ψ̂d0 , ψ̂s0 , ψ̂b0 als Funktion der QCD-Eigenzustände gibt: ψ̂d0 ψ̂d ψ̂s0 = VCKM ψ̂s . (XII.30) ψ̂b0 ψ̂b Nimmt man für die Felder ψ̂d00 , ψ̂s00 und ψ̂b00 −1 ψ̂d00 hd 0 ψ̂s00 = 0 h−1 s 0 0 ψ̂b00 die Linearkombinationen ψ̂d 0 hd 0 0 0 VCKM 0 hs 0 ψ̂s 0 0 hb h−1 ψ̂b b an, so lässt sich die Summe h h hd ˆ s b ψ̄d0 PR ψ̂d00 + ψ̄ˆd00 PL ψ̂d0 − √ ψ̄ˆs0 PR ψ̂s00 + ψ̄ˆs00 PL ψ̂s0 − √ ψ̄ˆb0 PR ψ̂b00 + ψ̄ˆb00 PL ψ̂b0 −√ 2 2 2 als hd hs hb − √ ψ̄ˆd ψ̂d − √ ψ̄ˆs ψ̂s − √ ψ̄ˆb ψ̂b ≡ −md ψ̄ˆd ψ̂d − ms ψ̄ˆs ψ̂s − mb ψ̄ˆb ψ̂b 2 2 2 umschreiben, entsprechend Massentermen für die d, s und b Quarks. v v v v v v In Zusammenfassung erhalten die Quarks, wie die Leptonen, durch ihre Wechselwirkung mit dem Higgs-Feld eine Masse, die proportional zu der jeweiligen Yukawa-Kopplung hi ist. Bemerkung: Berücksichtigt man auch das Higgs-Boson-Feld φ̂0 in L̂Φq , so findet man wie für die Leptonen in Paragraph XII.5.1 b, dass die Yukawa-Kopplungskonstante hq ebenfalls die Stärke des Vertex ψ̄ˆq ψ̂q φ̂0 für jeden Quark-Flavour q bestimmt. XII.5.3 CKM-Matrix und CP -Verletzung Die in Gl. (XII.30) eingeführte Matrix VCKM ist die Verallgemeinerung auf drei Generationen der Mischungsmatrix (XI.13), und wird Cabibbo–Kobayashi–Maskawa-Matrix , oder kurz CKM-Matrix genannt. Deren Elemente werden als Vud Vus Vub VCKM ≡ Vcd Vcs Vcb (XII.31) Vtd Wechselwirkungen der Elementarteilchenphysik Vts Vtb 127 N.BORGHINI Elementarteilchenphysik geschrieben, wobei jedes Vij eine komplexe Zahl ist. Im Rahmen des Standardmodells sind diese Zahlen freie Parameter, die aber experimentell gemessen werden können. Dabei findet man für die Beträge der Matrixelemente (vgl. Kap. 11 der Review of Particle Physics [16]) 0, 974 0, 225 0, 004 |VCKM | ≈ 0, 225 0, 973 0, 041. 0, 009 0, 040 0, 999 Somit ist die Mischung zwischen der 3. Generation und den zwei ersten ziemlich klein. Eine spezielle unitäre 3 × 3-Matrix wird allgemein durch 32 = 9 reelle Parameter bestimmt.81 Aus diesen 9 Parametern können 6 als Phasen geschrieben werden — z.B. als die Phasen der Matrixelemente Vij mit i ≤ j —, während die 3 anderen Winkel sind.82 5 dieser Phasen können in den Definitionen der Quark-Felder ψ̂s , ψ̂b , ψ̂d0 , ψ̂s0 und ψ̂b0 absorbiert werden, entsprechend einer Verschiebung ihrer relativen Phasen zur Phase des ψ̂d -Feldes. Es bleiben allgemein also 4 reelle Parameter, einschließlich einer Phase. Somit lautet eine übliche Parametrisierung der CKM-Matrix 1 0 0 c13 0 s13 e−iδ c12 s12 0 0 1 0 −s12 c12 0 VCKM ≡ 0 c23 s23 0 −s23 c23 0 0 1 −s13 e−iδ 0 c13 c12 c13 s12 c13 s13 e−iδ s23 c13 , = −s12 c23 − c12 s23 s13 eiδ c12 c23 − s12 s23 s13 eiδ (XII.32) s12 s23 − c12 c23 s13 eiδ −c12 s23 − s12 c23 s13 eiδ c23 c13 wobei cij = cos ϑij , sij = sin ϑij mit ϑ12 , ϑ13 , ϑ23 drei Winkeln. Zur Illustration dieser Absorption der Phasen in einer Neudefinition der Felder kann man der Einfachheit halber ein Beispiel mit nur zwei Generationen betrachten. Es seien also zwei „Masseneigenzustände“ ψ̂1 , ψ̂2 und dementsprechend „Wechselwirkungseigenzustände“ ψ̂10 , ψ̂20 , wobei die Letzteren unitäre Linearkombinationen der Ersteren sind: ! ! ! ! c eiδ1 s eiδ3 ψ̂10 ψ̂1 ψ̂1 = V2 = , −s eiδ2 c ei(δ2 +δ3 −δ1 ) ψ̂2 ψ̂20 ψ̂2 mit V2 einer unitären Matrix, deren allgemeine Parametrisierung durch einen Winkel ϑ (mit c ≡ cos ϑ, s ≡ sin ϑ) und drei Phasen δi geschrieben wurde. V2 lässt sich noch schreiben als ! ! ! 0 eiδ1 0 c s 1 . V2 = −s c 0 ei(δ3 −δ1 ) 0 eiδ2 Definiert man neue Felder ψ̂10 ≡ ψ̂1 , ψ̂20 ≡ ei(δ3 −δ1 ) ψ̂2 , ψ̂10 0 ≡ e−iδ1 ψ̂10 und ψ̂20 0 ≡ e−iδ2 ψ̂20 , so gilt ! ! ! ψ̂10 0 c s ψ̂10 , = −s c ψ̂20 ψ̂20 0 d.h. die Matrix V2 und die ursprünglichen Felder werden durch eine Matrix V02 ohne Phase und durch neue Felder, die sich von den alten einfach um eine Phase unterscheiden, ersetzt. Man sieht noch, dass das Feld ψ̂1 nicht mehr um eine Phase gedreht werden kann, ohne die Determinante von V02 zu ändern. Dementsprechend können nur 2n − 1 Phasen einer speziellen unitären n× n-Matrix absorbiert werden. 81 Eine spezielle unitäre n×n-Matrix lässt sich als eiH schreiben, mit H einer hermitischen Matrix. Die Letztere wird durch n reelle diagonale Elemente und n(n − 1)/2 komplexe Elemente Hij mit i < j charakterisiert, entsprechend n + 2n(n − 1)/2 = n2 reellen Parametern. 82 In n = 3 Dimensionen kann man n(n − 1)/2 = 3 paarweise orthogonale Ebene finden; die n(n − 1)/2 Winkel entsprechen Drehungen in diesen Ebenen. Wechselwirkungen der Elementarteilchenphysik 128 N.BORGHINI Elementarteilchenphysik Die Phase δ stellt ein wichtiges Merkmal der CKM-Matrix dar. Ist diese Phase nämlich nicht Null, so kann man keinen rein reellen Ausdruck der CKM-Matrix finden. Dies hat dann zur Folge, dass es im Standardmodell CP -verletzende Prozesse geben kann, wie jetzt an einem Beispiel gezeigt wird. Betrachte man also den Zerfall B 0 → K + + π − , wobei im Quarkmodell B 0 = db̄, K + = us̄ und − π = dū, sowie den Ĉ P̂ -konjugierten Prozess B̄ 0 → K − + π + . Hiernach wird der erstere Prozess e bezeichnet. als (Z) und der Letztere als (Z) Zur niedrigsten Ordnung in der schwachen Kopplungskonstante g trägt der in Abb. XII.3 dargestellte „direkte“ Prozess (ZD) b̄ → ū + W + → ū + u + s̄ zur Amplitude für den Zerfall (Z) bei. Das Diagramm zeigt sofort, dass die Amplitude für diesen ∗ V von Matrixelementen der CKM-Matrix ist. Genauer findet Prozess proportional zum Produkt Vub us d d B0 π− ∗ Vub ū s̄ b̄ W+ t- Vus K+ u Abbildung XII.3: „Direkter“ Prozess für den Zerfall B 0 → K + + π − . ∗V man eine Amplitude MD = |AD | eiθD eiδD mit δD der Phase von Vub us — und zwar δD = δ, obwohl das für das Folgende unwesentlich ist — und θD einer „starken“ Phase, die aus der hadronischen Physik kommt.83 e einen Beitrag aus dem Ähnlich diesem Prozess (ZD) erhält die Amplitude für den Prozess (Z) f Prozess (ZD), der Ĉ P̂ -konjugiert zu (ZD) ist, und sich mit dem gleichen Diagram wie in Abb. XII.3 mit den Teilchen ersetzt durch ihre Antiteilchen darstellen lässt. Die zugehörige Amplitude ist dann ∗ , und genauer beträgt M fD = |AD | eiθD e−iδD : die starke Phase ist die gleiche proportional zu Vub Vus wie in MD — weil die starke Wechselwirkung unter Ĉ P̂ symmetrisch ist —, die schwache Phase ist aber das Negative von dieser des Ĉ P̂ -konjugierten Prozesses. Somit führt die Anwesenheit einer nicht-verschwindenden Phase in der CKM-Matrix zu einen Unterschied zwischen den Amplituden für einen Prozess und dessen Ĉ P̂ -konjugierten. f der einzige Prozess wäre, der zur führenden Ordnung eine Rolle beim Wenn (ZD) bzw. (ZD) e spielt, dann wären die Raten für (Z) und (Z) e gleich, da eine Rate nur vom Zerfall (Z) bzw. (Z) Betragsquadrat der Amplitude abhängt, vgl. Fermis Goldene Regel. Die Phase der CKM-Matrix wurde dann im Endeffekt keine Rolle spielen. In der Tat ist (ZD) nicht der einzige Kanal für den Zerfall (Z) zur Ordnung g 2 . Es gibt noch den durch das „Penguin-Diagram“ der Abb. XII.4 dargestellte Prozess (ZP) b̄ → q̄ + W + → g + q̄ + W + → u + ū + q̄ + W + → ū + u + s̄ mit q̄ = ū, c̄, t̄, dessen Amplitude proportional zum Produkt Vqb∗ Vqs ist. Genauer lautet die Teilamplitude für (ZP) MP = |AP | eiθP eiδP mit δP der Phase von Vqb∗ Vqs , die für q = c oder t ungleich δD ist, und θP einer „starken“ Phase, die wiederum ungleich θD ist. Somit ist die gesamte Amplitude zur Ordnung g 2 für den Zerfall (Z) durch M = MD + MP = |AD | eiθD eiδD + |AP | eiθP eiδP mit δD 6= δP und θD 6= θP gegeben. 83 Grob gesagt folgt diese Phase aus der Tatsache, dass das b̄- bzw. ū-Antiquark nicht frei ist, sondern in einem B 0 bzw. π − -Meson eingeschlossen. Wechselwirkungen der Elementarteilchenphysik 129 N.BORGHINI Elementarteilchenphysik d d Vqb∗ Vqs b̄ t- s̄ ū u Abbildung XII.4: „Penguin-Diagramm“ für den Zerfall B 0 → K + + π − . f ist dann M fP = |AP | eiθP e−iδP , Die Amplitude für den zu (ZP) Ĉ P̂ -konjugierten Prozess (ZP) e entsprechend für den Zerfall (Z) der gesamten Amplitude f=M fD + M fP = |AD | eiθD e−iδD + |AP | eiθP e−iδP . M f jetzt verschieden sind. Man prüft einfach nach, dass jetzt die Betragsquadrate von M und M Genauer gilt 2 2 f − M = 4|AD ||AP | sin(θD − θP ) sin(δD − δP ). M Daher ist die Zerfallsrate für den Zerfall B 0 → K + + π − verschieden von der Zerfallsrate für den Ĉ P̂ -konjugierten Prozess B̄ 0 → K − + π + , entsprechend einer Verletzung der CP -Symmetrie. Eine nötige Voraussetzung für diese Verletzung ist δD 6= δP , was überhaupt nur dann möglich ist, wenn die CKM-Matrix komplexe Elemente enthält. Tatsächlich haben die BABAR [51] und BELLE [52] Experimente einen Unterschied zwischen den Raten für die Zerfälle der B 0 - und B̄ 0 -Mesonen in geladene Pionen und und Kaonen gemessen, und zwar eine Asymmetrie Γ(B̄ 0 → K − + π + ) − Γ(B 0 → K + + π − ) = −0, 115 ± 0, 018, Γ(B̄ 0 → K − + π + ) + Γ(B 0 → K + + π − ) deutlich verschieden von Null. Bemerkung: Eine zweite nötige Voraussetzung für die Verletzung der CP -Symmetrie ist natürlich auch ein Unterschied zwischen den starken Phasen θD und θP , die in Rahmen dieser Vorlesung schwer zu begründen ist — in der Praxis ist die Berechnung solcher Phasen hoch kompliziert. Literatur • Cottingham & Greenwood [50], Kap. 10–14 & 18. • Griffiths [15], Kap. 9. • Halzen & Martin [28], Kap. 14.4–14.9, 15.1–15.6. • Nachtmann [13], Kap. 22. Wechselwirkungen der Elementarteilchenphysik 130 Teil D Jenseits des Standardmodells Version vom 4. Februar 2014, 10:59 131 N.BORGHINI Elementarteilchenphysik blabla... eine Einleitung fehlt... Jenseits des Standardmodells 133 N.BORGHINI Elementarteilchenphysik XIII. Neutrinos XIII.1 Neutrino-Massen Im (minimalen) Standardmodell koppeln die Neutrinos nicht zum Higgs-Feld, so dass sie auch nach der spontanen Brechung der elektroschwachen Symmetrie masselos bleiben. Es hat sich aber experimentell aufgewiesen, dass die Neutrinos tatsächlich eine Masse haben, und das die entsprechenden Masseneigenzustände sich von den Wechselwirkungseigenzuständen unterscheiden. Dies lässt sich mithilfe einer nichtdiagonalen Mischungsmatrix beschreiben (Abschn. XIII.1.1), ähnlich der CKM-Matrix für die Quarks. Das aus der Existenz der Mischung entstehende Phänomenon der Oszillationen von propagierenden Neutrinos zwischen den verschiedenen „Flavours“ — wobei die Bezeichnung in diesem Kapitel synonym für „Leptonenart“ ist — wird dann in Abschn. XIII.1.2 beschrieben, zusammen mit den Arten von Experimenten, in den solche Oszillationen beobachtet wurden. XIII.1.1 Neutrinomischung Wenn die Neutrinos masselos sind, dann lassen sie sich nur durch ihre schwachen Wechselwirkungen unterscheiden: die unterschiedlichen Arten von Neutrinos werden durch das elektrisch geladene Lepton, mit dem sie ein SU(2)L -Dublett bilden, gekennzeichnet. Sind die Neutrinos dagegen massiv, dann existieren Masseneigenzustände νi , i = 1, 2, 3, mit jeweiliger Masse mi . Wenn alle Massen nicht entartet sind, dann können die Wechselwirkungseigenzustände ν` mit ` = e, µ, τ nicht-triviale Linearkombinationen der Masseneigenzustände sein. Dies lässt sich mithilfe einer 3×3-Matrix, die als Pontecorvo–Maki–Nakagawa–Sakata-Matrix oder kurz PMNS-Matrix bezeichnet wird, schreiben: νe ν1 Ue1 Ue2 Ue3 ν1 (XIII.1) νµ = UPMNS ν2 ≡ Uµ1 Uµ2 Uµ3 ν2 . ντ ν3 Uτ 1 Uτ 2 Uτ 3 ν3 Wie die CKM-Matrix ist die PMNS-Matrix unitär. Sie lässt sich daher durch drei Winkeln sowie ein paar Phasen parametrisieren. Dabei hängt die Anzahl der nötigen Phasen von der Tatsache ab, ob die Neutrinos gleich ihren eigenen Antiteilchen sind oder nicht. Die erstere Möglichkeit — die für Quarks ausgeschlossen ist, weil sie eine Farb- und eine elektrische Ladung tragen — wird in Abschn. XIII.2 weiter diskutiert. Unterscheiden sich die Neutrinos von den Antineutrinos, so kann UPMNS ähnlich der CKM-Matrix (XII.32) mit drei Winkeln θij und nur einer einzigen Phase parametrisiert werden. Dabei führt die Phase, falls sie nicht Null ist, wie bei der Quarkmischung in Abschn. XII.5.3 zur Verletzung der CP -Symmetrie, hier in leptonischen Prozessen. Bisher (Anfang 2014) wurden solche CP -verletzenden leptonischen Prozesse (noch?) nicht experimentell beobachtet. Daher ist nichts über die Phase bekannt. Dagegen hat das hiernach studierte Phänomenon der Neutrino-Oszillationen gezeigt, dass die Mischungswinkeln θij nicht gering sind, d.h. die PMNS-Matrix unterscheidet sich stark von der Identitätsmatrix. Somit deuten Messungen auf die Werte sin2 (2θ12 ) ' 0, 857, sin2 (2θ23 ) > 0, 95, sin2 (2θ13 ) ' 0, 098 (XIII.2) hin [16]. Beispielsweise ist die Mischung zwischen ν2 und ν3 fast maximal, d.h. θ23 beträgt fast 45o . Zum Vergleich gilt für den Cabibbo-Winkel θC ≈ 13o , entsprechend einer kleineren Mischung zwischen d und s Quarks. Jenseits des Standardmodells 134 N.BORGHINI Elementarteilchenphysik Bemerkung: Die unten diskutierten Neutrino-Oszillationen zeigen, dass die Neutrinos massiv sind, liefern aber keine direkte Messung der Massen. Ein Beispiel einer solchen Messung könnte prinzipiell in Untersuchungen des β-Zerfalls von Tritium 3 H erfolgen, wobei die Masse des emittierten ν̄e die Krümmung des Elektronenspektrums neben dessen Endpunkt beeinflusst. Die Ergebnisse solcher Untersuchungen geben bisher nur eine obere Schranke, und zwar gemäß den Mainz–Troitsk Experimenten mν̄e < 2, 2 eV [53, 54]. Das KATRIN Experiment sollte noch Massen von 0,2–2 eV messen können. Dazu geben kosmologische Überlegungen für die Summe der Massen der „leichten“ Neutrinos mtot . 0.5 eV. XIII.1.2 Neutrino-Oszillationen Bei seiner Erzeugung oder seinem Nachweis befindet sich ein Neutrino in einem Wechselwirkungseigenzustand ν` , da beide Ereignisse auf schwachen Prozessen beruhen. Zwischen den Ereignissen ist das Neutrino dagegen frei, wobei jeder „Masseneigenzustand νi -Anteil“ gemäß einem einfachen Gesetz propagiert. Im Allgemeinen unterscheidet sich die Zusammensetzung der Masseneigenzustände zum Zeitpunkt der Messung von der Zusammensetzung bei der Erzeugung. Dies führt zur Möglichkeit, dass ein in einem gegebenen Flavour erzeugten Neutrino später als ein Neutrino eines anderen Flavours detektiert wird. Der entsprechende Formalismus wird erstens dargestellt. Dann werden einige Beispiele, entsprechend Neutrinos aus unterschiedlichen Quellen, diskutiert. XIII.1.2 a Formalismus ::::::::::::::::::::::: Der Einfachheit halber werden in der folgenden Herleitung nur zwei Neutrino-Flavours betrachtet ! ! ! 0 0 sin θjk cos θjk ν`j νj , ≈ 0 0 cos θjk − sin θjk νk ν`k wobei `j , `k für e, µ oder τ stehen, während j, k ∈ {1, 2, 3} sind. Dabei wird der Mischungswinkel als 0 bezeichnet, um ihn von den Mischungswinkeln in einem Drei-Flavour-Szenario zu unterscheiden. θjk Die Energie-Eigenzustände νj , νk propagieren gemäß |νi (x)i = e−ipi ·x |νi i = e−i(Ei t−~pi ·~x) |νi i, (XIII.3) mit Ei bzw. p~i der Energie bzw. dem Impuls des Zustands. Nach einer Strecke der Länge L, die in einer Zeitspanne tL zurückgelegt wird, gibt dies |νi (tL , L)i = e−i(Ei tL −pi L) |νi i, mit pi ≡ |~ pi |. Ein Neutrino84 mit Energie E sei zur Zeit t = 0 als Flavour-Eigenzustand erzeugt, z.B. als ν`j : 0 |ν i + sin θ 0 |ν i. Nach einer Strecke der Länge L sein Zustand lautet dann |ν(0)i = |ν`j i = cos θjk j jk k bzw. einer Zeit tL ist der Zustand gegeben durch 0 0 |ν(tL , L)i = cos θjk e−i(EtL −pj L) |νj i + sin θjk e−i(EtL −pk L) |νk i, q wobei pi = E 2 − m2i . Die Amplitude, dass das Neutrino dann als ein Neutrino des zweiten Flavours ν`k beobachtet 0 hν | + cos θ 0 hν | gegeben, wird, wird durch die Projektion von dessen Zustand auf hν`k | = − sin θjk j jk k und zwar (pk − pj )L 0 0 0 e−iEtL ei(pj +pk )L/2 sin . hν`k | ν(tL , L)i = cos θjk sin θjk e−iEtL eipk L − eipj L = i sin 2θjk 2 84 Genauer, eine Menge von Neutrinos mit identischen kinematischen Eigenschaften. Jenseits des Standardmodells 135 N.BORGHINI Elementarteilchenphysik Dies entspricht einer Wahrscheinlichkeit 2 (pk − pj )L 0 P(ν`j → ν`k ) = hν`k | ν(tL , L)i = sin2 (2θjk , ) sin2 2 dass das Neutrino nach einer Strecke L sich von einem ν`j - in ein ν`k -Neutrino umwandelt. Dabei sieht man, dass diese Wahrscheinlichkeit unabhängig von der Zeitspanne ist. Nimmt man an, dass das Neutrino ultrarelativistisch ist, d.h. E mi , so gilt pi ∼ E − 1 m2i , 2 E und die obige Wahrscheinlichkeit wird zu 2 0 (2θjk ) sin2 ∆m2jk L mit ∆m2jk ≡ m2j − m2k . (XIII.4) 4E Bei fester Energie des Neutrinos ist diese Wahrscheinlichkeit eine periodische Funktion der zurückgelegten Strecke L, d.h. der Flavour des Neutrinos oszilliert entlang seiner Trajektorie, entsprechend sog. Neutrinooszillationen. Die Amplitude dieser Schwingungen wird durch den Mischungswinkel 0 festgelegt: maximale Mischung gibt die größten Oszillationen, während es in Abwesenheit von θjk Mischung keine Oszillation gibt. Die Wellenlänge der Oszillationen wird bestimmt durch die Energie des Neutrinos, sowie durch die Differenz der Massenquadrate der Eigenzustände, die propagieren. Experimentell findet man für diese Massenquadrate P(ν`j → ν`k ) = sin |∆m221 | ≡ |m22 − m21 | ' 7, 50 · 10−5 eV2 , |∆m232 | ≡ |m23 − m22 | ' 2, 32 · 10−3 eV2 . (XIII.5) Bemerkungen: ∗ In einem realistischen Drei-Flavour-Szenario ist der Ausdruck der Wahrscheinlichkeit natürlich komplizierter, doch im Endeffekt hängt sie noch von den gleichen Parametern, und zwar den sin2 (2θij ), die die Amplitude bestimmen, und die ∆m2ij , die eine Rolle in der Wellenlänge spielen. Somit findet man für die Wahrscheinlichkeit einer Umwandlung von ν`j in ν`k P(ν`j → ν`k ) = 4 3 X U`j i U`∗k i U`∗j l U`k i sin2 i,l=1 i<l ∆m2li L , 4E und für die Überlebungswahrscheinlichkeit für einen Flavour 3 2 X U` k 2 U` k 2 sin2 ∆mki L . P(ν`j → ν`j ) = 1 − j j 4E (XIII.6a) (XIII.6b) i,k=1 i<k ∗ Betrachtet man ∆m221 und ∆m232 , so ergibt sich sofort ∆m231 ∼ ∆m232 . Somit sind m1 und m2 „nah an einander“, während m3 „weit entfernt“ (auf einer Massenskala) ist. Dabei ist die Reihenfolge der Massen aber unbekannt, und zwar insbesondere ob m1 , m2 m3 oder m1 , m2 m3 gilt. Man spricht im ersteren Fall von einer normalen Hierarchie — weil ν3 der Zustand ist, der den größten Anteil an ντ enthält, entsprechend dem Partner des schwersten Leptons —, und im letzteren Fall von invertierter Hierarchie. ∗ Setzt man numerische Werten ein, so findet man, dass die Wellenlänge der Schwingung gegeben ist durch E [GeV] λ [km] = 2, 48 . ∆m2 [eV2 ] Damit die Oszillation nicht gering ist, soll L der Ordnung eines Vierfachen dieser Wellenlänge sein, d.h. für eine typische Neutrinoenergie von etwa 1 GeV soll der Abstand zwischen Erzeugungs- und Beobachtungspunkt des Neutrinos von etwa 103 km sein. Dies wird in den nächsten Paragraphen illustriert. Jenseits des Standardmodells 136 N.BORGHINI Elementarteilchenphysik XIII.1.2 b Sonnen-Neutrinos :::::::::::::::::::::::::::: Eine erste Quelle von Neutrinos, deren Oszillation gemessen wurde, ist die Sonne. Gemäß dem Standard-Sonnenmodell werden im Kern der Sonne nur Elektron-Neutrinos νe erzeugt, in den dort stattfindenden Kernreaktionen: • pp I-Kette: 4p → 4 He + 2e+ + 2νe , wobei die Neutrinos aus β + -Prozesse kommen; • pp II-Kette: e− + 3 He + 4 He → e− + 7 Be → 7 Li + νe . • pp III-Kette: p + 3 He + 4 He → p + 7 Be → 8 B → 2 4 He + e+ + νe . Dabei haben die Neutrinos Energien von etwa 0.1–10 MeV. Der auf der Erde gemessene Fluss von Elektron-Neutrinos aus der pp III-Kette, entsprechend νe die eine Strecke von etwa 1, 5 · 108 km zurückgelegt haben, beträgt nur ungefähr ein Drittel des erwarteten Flusses [55] gemessener νe -Fluss ≈ 0, 35. erwarteter νe -Fluss Dabei konnte die SNO Collaboration den erwarteten Fluss, der im Nenner steht, wirklich messen, indem sie den gesamten Fluss an allen Neutrinos (νe , νµ und ντ ) gemessen hat. Die Deutung dieser Beobachtung ist, dass die erzeugten Elektron-Neutrinos sich in die zwei anderen Flavours, die nicht separat gemessen werden, umwandeln. Genauer liefert die Messung den Winkel θ12 und die Differenz ∆m221 .85 XIII.1.2 c Atmosphärische Neutrinos :::::::::::::::::::::::::::::::::::: Die Streuung von kosmischer Strahlung, insbesondere Protonen, an den Atomkernen der oberen Atmosphäre führt zur Entstehung von positiven Pionen. Jedes π + zerfällt dann meistens in ein Antimyon µ+ und ein Myon-Neutrino νµ . Wiederum zerfällt das Antimyon gemäß µ+ → e+ +νe + ν̄µ . Die dabei entstehenden Neutrinos werden kollektiv als atmosphärische Neutrinos bezeichnet und haben eine Energie von etwa E = 1–10 GeV. Solche atmosphärischen Neutrinos werden dann durch einen Detektor, der sich nah an der Erdoberfläche befindet, nachgewiesen, und zwar durch die Reaktion ν` + A → ` + A0 , wobei ` = e− oder µ− , während A und A0 Atomkerne bezeichnen — somit werden die Antineutrinos aus dem µ+ -Zerfall ignoriert. Die im Detektor reagierenden Neutrinos können entweder direkt aus der Atmosphäre oberhalb des Labors kommen, oder sie erreichen den Detektor, nachdem sie durch die Erde durchgeflogen sind. Im ersteren Fall haben sie eine Strecke von einige 10 km „nach unten“ zurückgelegt, während im letzteren Fall die Strecke „nach oben“ etwa L ≈ 104 km beträgt. Messungen der Flüsse von Myon-Neutrinos in beide Richtungen durch das Super-Kamiokande Experiment haben gezeigt, dass etwa die Hälfte der Myon-Neutrinos, die durch die Erde propagieren, den Detektor nicht als νµ , sondern als Neutrinos eines anderen Flavours erreichen [56] Fluss von νµ nach oben ≈ 0, 54. Fluss von νµ nach unten Dieses Ergebnis wird meistens als die Oszillation von Myon- in τ -Neutrinos interpretiert, d.h. die Messung liefert θ23 und ∆m232 . Bemerkung: Bei der Interpretation muss man für die Neutrinos, welche durch die Erde propagieren, sog. Materie-Effekte — auch bekannt als Mikheyev–Smirnov–Wolfenstein- (MSW) Effekt — berücksichtigen. In Materie werden die Massen mi bzw. die Mischungswinkeln θij durch effektive Massen bzw. effektive Mischungswinkeln ersetzt, was die Oszillationen verstärken kann. Dieser Effekt spielt auch eine Rolle für die Sonnen-Neutrinos aus der pp III-Kette, die viel mehr oszillieren, als solche aus der pp I- und pp II-Ketten, wenn sie durch die Sonne propagieren. 85 Da sin2 (2θ13 ) ziemlich kleiner als sin2 (2θ12 ) ist, hängt die Messung viel weniger von θ13 und ∆m231 ab. Jenseits des Standardmodells 137 N.BORGHINI Elementarteilchenphysik XIII.1.2 d Beschleuniger-Neutrinos :::::::::::::::::::::::::::::::::: Weitere Ergebnisse betreffen Neutrinos, die in einem Beschleuniger-Experiment erzeugt werden, und danach in einem entfernten Detektor gemessen werden. Dabei ist der Abstand zwischen Erzeugungs- und Messungspunkt kleiner als bei Sonnen- oder atmosphärischen Neutrinos, was etwas ungünstig ist, um Oszillationen beobachten zu können. Dieser Nachteil wird aber kompensiert durch die Tatsache, dass die Energie der Neutrinos hier ziemlich genau bekannt ist. Beispiele von solchen Experimenten sind K2K (KEK to Kamioka, in Japan, mit einem Abstand L ≈ 250 km), OPERA & ICARUS (vom CERN nach dem Gran Sasso, entsprechend L = 730 km) oder MINOS (vom Tevatron nach der Soudan Mine, L = 735 km). XIII.1.2 e Kernreaktor-Neutrinos ::::::::::::::::::::::::::::::::: Schließlich benutzen einige Experimente die Neutrinos, die aus wirtschaftlichen Kernreaktoren emittiert werden. Hier auch sind Energie und Fluß der Neutrinos gut kontrolliert. Beispiele sind im Japan KamLAND — wobei im Kamioka-Laboratorium die ν̄e -Antineutrinos aus etwa fünfzig Kernkraftwerken mit gut bekannten Leistungen gemessen werden —, CHOOZ (Frankreich), Daya Bay (China) oder RENO (Südkorea). Die zwei letzteren Experimente haben im Frühling86 von 2012 die ersten Messungen von θ13 durchgeführt. XIII.2 Neutrinos als Majorana-Teilchen später! Literatur • Cottingham & Greenwood [50], Kap. 19–20. • Griffiths [15], Kap. 11. 86 8. März für Daya Bay [57], 3. April für RENO [58]. Jenseits des Standardmodells 138 N.BORGHINI Elementarteilchenphysik Literaturverzeichnis [1] F. Schwabl, Quantenmechanik für Fortgeschrittene (QM II), 5. Aufl. (Springer, Berlin & Heidelberg, 2008). [2] B. F. Schutz, A first course in general relativity (University Press, Cambridge, 1985). [3] R. P. Feynman, R. B. Leighton, M. Sands, Feynman-Vorlesungen über Physik. Band 1 : Mechanik, Strahlung, Wärme, 5. Aufl. (Oldenbourg Wissenschaftsverlag, München, 2007). [4] T. Fließbach, Lehrbuch zur theoretischen Physik I. Mechanik , 4. Aufl. (Spektrum Akademischer Verlag, Heidelberg & Berlin, 2003). [5] L. Landau, E. Lifschitz, Lehrbuch der theoretischen Physik. Band II : Klassische Feldtheorie, 12. Aufl. (Harri Deutsch, Frankfurt am Main, 1997). [6] W. Nolting, Grundkurs Theoretische Physik. Band 4 : Spezielle Relativitätstheorie. Thermodynamik , 6. Aufl. (Springer, Berlin & Heidelberg, 2005). [7] H. Georgi, Lie Algebras in Particle Physics, 2. Aufl. (Westview Press, Reading, MA, 1999). [8] P. Ramond, Group theory: A physicist’s survey (University Press, Cambridge, 2010). [9] E. Schrödinger, Ann. Phys. (Leipzig) 81 (1926) 109–139. [10] W. Gordon, Z. Phys. 40 (1926) 117–133. [11] O. Klein, Z. Phys. 41 (1927) 407–442. [12] L. Landau, E. Lifschitz, Lehrbuch der theoretischen Physik. Band IV : Quantenelektrodynamik , 7. Aufl. (Harri Deutsch, Frankfurt am Main, 1991). [13] O. Nachtmann, Phänomene und Konzepte der Elementarteilchenphysik (Vieweg, Braunschweig, 1986). [14] P. A. M. Dirac, Proc. Roy. Soc. Lond. A 117 (1928) 610–624. [15] D. Griffiths, Elementary Particle Physics (Wiley-VCH, Weinheim, 2008). [16] Particle Data Group (J. Beringer et al.), Review of Particle Physics, Phys. Rev. D 86 (2012) 010001. [17] G. Modanese, Phys. Lett. B 348 (1995) 51–54 [hep-th/9501123]. [18] D. J. Griffiths, Quantenmechanik , 2. Aufl. (Pearson, München, 2012). [19] A. Messiah, Quantenmechanik, Band 2 , 2. Aufl. (De Gruyter, Berlin, 1991). [20] Selected papers on Quantum Electrodynamics, J. Schwinger (Hrsg.) (Dover, New York, 1958). [21] P. J. Mohr, B. N. Taylor, D. B. Newell, Rev. Mod. Phys. 84 (2012) 1527–1605 [1203.5425]. [22] D. Hanneke, S. Fogwell, G. Gabrielse, Phys. Rev. Lett. 100 (2008) 120801 [0801.1134]. [23] T. Aoyama, M. Hayakawa, T. Kinoshita, M. Nio, Phys. Rev. Lett. 109 (2012) 111807 [1205.5368]. [24] T. Aoyama, M. Hayakawa, T. Kinoshita, M. Nio, Phys. Rev. D 77 (2008) 053012 [0712.2607]. Literaturverzeichnis 139 N.BORGHINI Elementarteilchenphysik [25] T. Aoyama, M. Hayakawa, T. Kinoshita, M. Nio, Phys. Rev. Lett. 109 (2012) 111808 [1205.5370]. [26] J. D. Bjorken, S. D. Drell, Relativistic Quantum Mechanics (McGraw-Hill, New York, 1964). [27] C. Berger, Elementarteilchenphysik , 2. Aufl. (Springer, Berlin & Heidelberg, 2006). [28] F. Halzen, A. D. Martin, Quarks and Leptons: An introductory course in modern particle physics (John Wiley & Sons, New York, 1984). [29] M. Gell-Mann, The Eightfold Way: A theory of strong interaction symmetry, Preprint CTSL-20, TID-12608 (1961). [30] Y. Ne’eman, Nucl. Phys. 26 (1961) 222–229. [31] M. Gell-Mann, Phys. Lett. 8 (1964) 214–215. [32] G. Zweig, An SU(3) model for strong interaction symmetry and its breaking, Preprint CERNTH-401 (1964). [33] M. Gell-Mann, Y. Neemam, The Eightfold Way (Benjamin, New York, 1964). [34] V. E. Barnes et al., Phys. Rev. Lett. 12 (1964) 204–206. [35] J. Bjorken, Phys. Rev. 179 (1969) 1547–1553. [36] J. Callan, Curtis G., D. J. Gross, Phys. Rev. Lett. 22 (1969) 156–159. [37] E. D. Bloom et al., Phys. Rev. Lett. 23 (1969) 930–934. [38] M. Breidenbach et al., Phys. Rev. Lett. 23 (1969) 935–939. [39] R. P. Feynman, Phys. Rev. Lett. 23 (1969) 1415–1417. [40] W. Heisenberg, Z. Phys. 77 (1932) 1–11. [41] T. Lee, C.-N. Yang, Phys. Rev. 104 (1956) 254–258. [42] C. Wu, E. Ambler, R. Hayward, D. Hoppes, R. Hudson, Phys. Rev. 105 (1957) 1413–1414. [43] E. Bodenstedt, Experimente der Kernphysik und ihre Deutung, Teil II (Bibliographisches Institut, Zurich, 1973). [44] M. Goldhaber, L. Grodzins, A. Sunyar, Phys. Rev. 109 (1958) 1015–1017. [45] R. Garwin, L. Lederman, M. Weinrich, Phys. Rev. 105 (1957) 1415–1417. [46] J. Friedman, V. Telegdi, Phys. Rev. 105 (1957) 1681–1682. [47] E. Fermi, Z. Phys. 88 (1934) 161–177. [48] R. Feynman, M. Gell-Mann, Phys.Rev. 109 (1958) 193–198. [49] E. Sudarshan, R. Marshak, Phys.Rev. 109 (1958) 1860–1862. [50] W. N. Cottingham, D. A. Greenwood, An introduction to the Standard Model of particle physics, 2. Aufl. (University Press, Cambridge, 2007). [51] BaBar Collaboration [B. Aubert et al.], Phys. Rev. Lett. 93 (2004) 131801 [hep-ex/0407057]. Literaturverzeichnis 140 N.BORGHINI Elementarteilchenphysik [52] Belle Collaboration [Y. Chao et al.], Phys. Rev. Lett. 93 (2004) 191802 [hep-ex/0408100]. [53] V. Lobashev, Prog. Part. Nucl. Phys. 48 (2002) 123–131. [54] C. Kraus et al., Eur. Phys. J. C 40 (2005) 447–468 [hep-ex/0412056]. [55] SNO Collaboration [Q. Ahmad et al.], Phys. Rev. Lett. 87 (2001) 071301 [nucl-ex/0106015]. [56] Super-Kamiokande Collaboration [Y. Fukuda et al.], Phys. Rev. Lett. 81 (1998) 1562–1567 [hep-ex/9807003]. [57] DAYA-BAY Collaboration [F. An et al.], Phys. Rev. Lett. 108 (2012) 171803 [1203.1669]. [58] RENO Collaboration [J. Ahn et al.], Phys. Rev. Lett. 108 (2012) 191802 [1204.0626]. Literaturverzeichnis 141