Theoretische Elementarteilchenphysik – eine Einführung Notizen Michael Ratz 20. März 2011 1 INHALTSVERZEICHNIS 2 Inhaltsverzeichnis Vorwort und Notation 6 Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Bemerkungen zur Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1 Quanten-Elektrodynamik (QED) 1.1 Elektrodynamik als abelsche Eichtheorie . . . . . . . . . . 1.2 Klassische Elektrodynamik . . . . . . . . . . . . . . . . . 1.3 Photon-Propagator . . . . . . . . . . . . . . . . . . . . . . (i) Faddeev-Popov-Methode für abelsche Eichtheorien (ii) Eichfixierungsterm . . . . . . . . . . . . . . . . . . 1.4 QED: Störungsentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 12 14 18 18 20 22 2 Streutheorie 2.1 Streuprozesse . . . . . . . . . . . . . . . . . . (i) S- und T -Matrix . . . . . . . . . . . . (ii) Das erzeugende Funktional S[J, φ0 ] . . (iii) Betrachtungen im Fourierraum . . . . (iv) S-Matrix und Green’sche Funktionen . 2.2 Berechnung messbarer Größen . . . . . . . . . 2.3 Feynmanregeln der QED . . . . . . . . . . . . 2.4 QED auf Tree-Level: Beispiele . . . . . . . . . (i) Der Prozess e+ e− → µ+ µ− . . . . . . (ii) Møller-Streuung . . . . . . . . . . . . (iii) Bhabha-Streuung . . . . . . . . . . . . (iv) Compton-Streuung . . . . . . . . . . . (v) Paarvernichtung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 25 25 26 27 28 29 33 34 34 40 42 43 44 3 Nicht-abelsche Eichtheorien 3.1 Grundlegende Eigenschaften von Lie-Gruppen . . . . . . . 3.2 Yang-Mills-Theorie . . . . . . . . . . . . . . . . . . . . . . 3.3 Klassische Bewegungsgleichungen der Yang-Mills-Theorie 3.4 Fadeev-Popov-Methode für nicht-abelsche Eichtheorien . . 3.5 Feynman-Regeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 45 49 51 52 54 4 Aspekte des Renormierungs-Programms 4.1 Fragestellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Effektive Kopplungsstärke . . . . . . . . . . . . . . . . . . . . . . . . . . . (i) (Dimensionale) Regularisierung des Vakuum-Polarisations-Tensors (ii) |k 2 | ≪ m2 : Quantenkorrekturen zum Coulomb-Potential . . . . . . (iii) |k 2 | ≫ m2 : Laufende Kopplungsstärke der QED . . . . . . . . . . . . . . . . 56 56 56 58 66 67 . . . . . 69 69 69 69 70 71 5 Quantenchromodynamik (QCD) 5.1 Historische Vorbemerkung . . . . . . . . 5.2 QCD als SU(3) Eichtheorie . . . . . . . (i) Lagrangedichte der QCD . . . . (ii) Feynmanregeln der QCD . . . . 5.3 Effektive Kopplungsstärke der QCD und . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . asymptotische Freiheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . INHALTSVERZEICHNIS 3 . . . . . . . . . . . . . . . . . . . . . . . . 71 73 73 74 74 76 76 77 78 78 79 82 6 Spontane Symmetriebrechung 6.1 Spontan gebrochene diskrete Symmetrie . . . . . . . . . . . . . . . 6.2 Das lineare Sigma-Modell . . . . . . . . . . . . . . . . . . . . . . . 6.3 Das Goldstone-Theorem . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Spontan gebrochene Eichsymmetrie (Higgs-Mechanismus) . . . . . (i) Higgs-Mechanismus für die abelsche Eichtheorie . . . . . . . (ii) Ein ‘makroskopisches’ Beispiel für den Higgs-Mechanismus: leitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (iii) Higgs-Mechanismus für nicht-abelsche Symmetrien . . . . . (iv) Allgemeine Systematik beim Higgs-Mechanismus . . . . . . . . . . . . . . . . . . . . . . . . . . Supra. . . . . . . . . . . . . . . . . 84 84 85 86 87 87 . 89 . 90 . 92 7 Elektroschwache Theorie 7.1 Eichtheorie der elektroschwachen Wechselwirkung 7.2 Feynman-Regeln . . . . . . . . . . . . . . . . . . 7.3 Fermion-Massen . . . . . . . . . . . . . . . . . . 7.4 Phänomenologische Aspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 94 101 101 103 8 Standardmodell 8.1 Fermion–Massen . . . . . . . . . . . . (i) Massen der Leptonen . . . . . (ii) Massen der Quarks . . . . . . . 8.2 Lagrangedichte des Standardmodells . 8.3 Symmetrien des Standardmodells . . . (i) Raum–Zeit–Symmetrien . . . . (ii) Globale Symmetrien . . . . . . 8.4 Vorhersagen und Tests . . . . . . . . . 8.5 Der Higgs–Sektor . . . . . . . . . . . . (i) Hierarchie–Problem . . . . . . (ii) Higgs–Produktion . . . . . . . (iii) Higgs–Kopplungen und Zerfall (iv) Schranken an die Higgs–Masse 5.4 5.5 5.6 (i) Laufende Kopplungsstärke der QCD . . . . . . . . . . . (ii) Asymptotische Freiheit . . . . . . . . . . . . . . . . . . (iii) Dimensionale Transmutation . . . . . . . . . . . . . . . QCD Phänomenologie . . . . . . . . . . . . . . . . . . . . . . . (i) Das R-Verhältnis . . . . . . . . . . . . . . . . . . . . . . (ii) QCD-Korrekturen (. . . am Beispiel der b b-Produktion) . (iii) Quark-Antiquark-Potential . . . . . . . . . . . . . . . . (iv) Hadronisierung und Jets . . . . . . . . . . . . . . . . . . QCD-Bindungszustände leichter Quarks . . . . . . . . . . . . . (i) Ausreduzieren von Produkten von SU(3)c -Darstellungen (ii) Die SU(3)F . . . . . . . . . . . . . . . . . . . . . . . . . Abschliessende Bemerkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 106 106 107 112 114 114 117 118 120 121 121 121 123 9 Teilchenphysik jenseits des Standard–Modells 9.1 Neutrino–Massen . . . . . . . . . . . . . . . . . (i) Der effektive Neutrino–Massenoperator (ii) Dirac–Neutrino–Massen . . . . . . . . . (iii) See–Saw–Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 126 126 127 127 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . INHALTSVERZEICHNIS 9.2 9.3 4 (iv) Ausintegrieren schwerer Freiheitsgrade . . . . (v) Neutrino–Massendiagonalisierung . . . . . . . (vi) Neutrino–Oszillationen . . . . . . . . . . . . . (vii) Neutrinoloser doppelter β–Zerfall . . . . . . . (viii) Vergleich zwischen Quark- und Leptonsektor Große Vereinheitlichung . . . . . . . . . . . . . . . . (i) Die Idee der GUTs anhand SU(5) . . . . . . (ii) Eichkopplungsvereinigung . . . . . . . . . . . (iii) SO(10) . . . . . . . . . . . . . . . . . . . . . (iv) Signaturen von GUTs . . . . . . . . . . . . . (v) Jenseits SU(5) und SO(10) . . . . . . . . . . Aspekte von Supersymmetry . . . . . . . . . . . . . (i) Das Hierarchie–Problem . . . . . . . . . . . . (ii) Supersymmetrie–Transformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Abschliessende Bemerkungen I 153 Anhang A Funktionalableitung A.1 Erinnerungen an Analysis . . . . . . . . . . . A.2 Grundlegende Begriffe der Funktionalanalysis (i) Räume . . . . . . . . . . . . . . . . . . (ii) Operatoren . . . . . . . . . . . . . . . (iii) Funktionale . . . . . . . . . . . . . . . A.3 Lineare Funktionale . . . . . . . . . . . . . . A.4 Definition der Funktionalableitung . . . . . . A.5 Regeln . . . . . . . . . . . . . . . . . . . . . . A.6 Operatorableitung . . . . . . . . . . . . . . . A.7 Höhere Funktionalableitungen . . . . . . . . . 128 129 130 133 133 134 134 138 141 143 143 144 144 147 154 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 155 155 155 155 156 156 156 158 159 160 B Superzahlen B.1 Algebra und Generatoren einer Algebra . . . . . . . . . . B.2 Endlichdimensionale Grassmann-Algebra . . . . . . . . . . B.3 Unendlichdimensionale Grassmann-Algebren; Superzahlen B.4 Elemente der Analysis mit Superzahlen . . . . . . . . . . (i) Differentiation nach a-Zahlen . . . . . . . . . . . . (ii) Integration über a-Zahlen . . . . . . . . . . . . . . B.5 Fermionische Felder . . . . . . . . . . . . . . . . . . . . . B.6 Funktionalanalysis im Kontext von Superzahlen . . . . . . (i) Funktionalableitung . . . . . . . . . . . . . . . . . (ii) Funktionalintegration . . . . . . . . . . . . . . . . (iii) Funktionalintegrationsregeln für Fermionenfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 161 161 161 163 163 164 166 166 166 166 167 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C Lösungen der Dirac-Gleichung für freie Teilchen 168 C.1 γ-Matrizen und Clifford-Algebra . . . . . . . . . . . . . . . . . . . . . . . . 168 C.2 Basislösungen u und v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 D Spurbildung von Produkten von Dirac-Matrizen 170 INHALTSVERZEICHNIS 5 E Young-Tableaux E.1 Generelle Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . (i) Tensor-Notation für SU(N ) . . . . . . . . . . . . . . . . . . . . . . (ii) Einführendes Beispiel: Symmetrische und antisymmetrische Tensoren zweiter Stufe . . . . . . . . . . . . . . . . . . . . . . . . . . . . (iii) Verallgemeinerungen . . . . . . . . . . . . . . . . . . . . . . . . . . E.2 Standard-Anordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E.3 Young-Tableaux zur Bestimmung der Dimension irreduzibler Darstellungen der SU(N ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E.4 Young-Tableaux zur Ausreduktion von Produkten irreduzibler Darstellungen der SU(N ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E.5 Young-Tableaux zur Bestimmung der Verzweigungs-Regeln . . . . . . . . (i) Beispiel: SU(3) → SU(2) ⊗ U(1) . . . . . . . . . . . . . . . . . . . . (ii) Verallgemeinerung SU(N + M ) → SU(N ) ⊗ SU(M ) ⊗ U(1) . . . . 172 . 172 . 172 . 172 . 173 . 174 . 175 . . . . 177 179 179 180 F Matrix-Diagonalisierung 182 F.1 Hermitesche Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 F.2 Allgemeine Matrizen (Biunitäre Diagonalisierung) . . . . . . . . . . . . . . 182 F.3 Symmetrische Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 G Die G.1 G.2 G.3 G.4 Transformationen P , T und C Die Paritätstransformation P . . . . . Die Zeitumkehrtransformation T . . . Ladungskonjugation . . . . . . . . . . Die kombinierte Transformation P C T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 184 185 186 188 H Dirac- und Majorana–Massen 189 H.1 Weyl–Spinoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 H.2 Dirac–Spinoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 H.3 Majorana–Spinoren und Massen . . . . . . . . . . . . . . . . . . . . . . . . 190 I Supersymmetrie–Theoreme 191 I.1 Das Coleman-Mandula-Theorem . . . . . . . . . . . . . . . . . . . . . . . . 191 I.2 Haag-Sohnius-Lopuszański-Theorem . . . . . . . . . . . . . . . . . . . . . . 191 Vorwort und Notation 6 Vorwort und Notation Warnhinweis Das ist kein ausgearbeitetes Skript sondern es handelt sich um Notizen zur Vorlesung Theoretische Elementarteilchenphysik“, gehalten im WS 10/11. Diese Notizen können ” zur Orientierung dienen, ersetzen aber nicht das sorgfältige Lesen von Büchern. Feedback zu den Notizen (auch Verbesserung von Tippfehlern) ist höchst willkommen! Danksagung Ich danke Anna Brunnbauer und David Nolde für die Korrektur einiger Tippfehler und für Verbesserungsvorschläge. Allgemeine Vorbemerkungen Diese Vorlesung richtet sich an Master-Studenten sowie Studenten des siebten Semesters im Diplom-Studiengang allgemeine Physik“. Nach aktuellem Stand der Dinge ist die Vor” lesung nicht verpflichtend für KTA Master-Studenten (die Pflichtvorlesung ist die Quantenmechanik 2); jedoch wird insbesondere den Studenten mit Interesse an Theorie nachdrücklich empfohlen, diese Vorlesung zu besuchen und darin die Prüfung abzulegen. Die Grundvoraussetzungen beinhalten die üblichen Theorie-Vorlesungen (Mechanik, Elektrodynamik, Quantenmechanik 1 und 2); Kenntnisse aus der im sechsten Semester angebotenen Vorlesung zur Quantenfeldtheorie sind extrem hilfreich und vorteilhaft. Es wird empfohlen, die parallel angebotene Vorlesung zur fortgeschrittenen Quantenfeldtheorie zu besuchen. Zielsetzung Das Ziel der Vorlesung ist die Vermittlung eines fundamental(er)en Verständnisses der Materie und Wechselwirkungen. Wir wissen, dass sich die Stoffe in unserer Umgebung aus chemischen Elementen zusammensetzen, die sich in dem Periodensystem anordnen lassen. Dies hängt damit zusammen, dass die Elemente aus Kernen und Hüllen bestehen, wobei die Kerne sich aus Protonen (p) und Neutronen (n) zusammensetzen und die Hüllen aus Elektronen (e− ). Es ist ebenfalls bekannt, dass die Protonen und Neutronen gebundene Zustände aus up- und down-Quarks (u und d) sind. Nach dem heutigen Verständnis sind e− , u und d elementar“, d.h. setzen sich nicht aus kleineren Bausteinen zusammen. ” Ein Ziel dieser Vorlesung ist die Beschreibung dieser Quarks und Leptonen sowie ihrer schwereren Brüder“. ” Es sind vier Grundkräfte bekannt – die Gravitation, der Elektromagnetismus, die schwache und die starke Kraft. Die drei letztgenannten Wechselwirkungen lassen sich durch Eichtheorien beschreiben. Ein wesentliches Ziel der Vorlesung ist diese Beschreibung der Grundkräfte durch Quanten-Eichtheorien. Die Gravitation wird weitestgehend außer Acht gelassen. Literatur Für die Elementarteilchenphysik empfehlenswert sind die Bücher von Cheng und Li [1] und von Bailin und Love [2]. Wie bereits erwähnt, ist für die theoretische Elementarteilchenphysik ein gutes Verständnis der Quantenfeldtheorie unerlässlich. Das Standard-Werk für Quantenfeldtheorie mit Anwendungen aus der Elementarteilchenphysik ist das Buch Vorwort und Notation 7 von Peskin und Schroeder [3]. Das Buch von Pokorski [4] ist durchaus vergleichbar. Ein hervorragendes Buch, das zudem noch zum freien Download bereitsteht, ist [5]. Ein guter Einstieg in die Quantenfeldtheorie wird ermöglicht durch die Bücher von Ramond [6] und Zee [7], die die zugrundeliegenden Ideen möglichst einfach erklären. Das Buch von Ryder [8] erklärt die Ideen ebenfalls sehr strukturiert, allerdings sei davor gewarnt, dass es in diesem Buch eine vergleichsweise hohe Zahl von Tippfehlern gibt. Die ganze Materie wird exzellent vertieft in den Büchern von Weinberg [9, 10]. Spezielle Aspekte werden sorgfältig in weiteren Büchern dargestellt: Gruppentheorie in den Büchern von Sexl und Urbantke [11] und Cornwell [12, 13], Renormierung in einem Buch von Collins [14], a-Zahlen in einem Buch von Buchbinder und Kuzenko [15] und Phänomenologie in [16]. Wesentliche Aspekte des Vorlesungsinhalts sind in [17] zusammengefasst. Die historische Entwicklung zum Standardmodell ist in [18] dargestellt. Eine Einführung in Supersymmetrie ist beispielsweise in [19] gegeben. Ein relativ aktueller Überblick über Grand Unification findet sich in [20]. LITERATUR 8 Literatur [1] T. P. Cheng and L. F. Li, Gauge theory of elementary particle physics, Oxford Science Publications, 1984, 536 p. [2] D. Bailin and A. Love, Introduction to quantum field theory, second ed., IOP Publishing, 1993. [3] M. E. Peskin and D. V. Schroeder, An introduction to quantum field theory, AddisonWesley, 1995. [4] S. Pokorski, Gauge field theories, Cambridge, Univ. Pr, 1987, 394 p. [5] M. Srednicki, Quantum field theory, Cambridge, UK: Univ. Pr. (2007) 641 p, online version available under http://www.physics.ucsb.edu/ mark/qft.html. [6] P. Ramond, Field theory: A modern primer, vol. 74, Addison-Wesley, 1989. [7] A. Zee, Quantum field theory in a nutshell, Princeton University Press, 2003. [8] L. H. Ryder, Quantum field theory, Cambridge University Press, 1996. [9] S. Weinberg, The quantum theory of fields. vol. 1: Foundations, Cambridge University Press, 1995, 609 p. [10] S. Weinberg, The quantum theory of fields. vol. 2: Modern applications, Cambridge University Press, 1996, 489 p. [11] R. U. Sexl and H. K. Urbantke, Relativity, Groups, Particles, Springer, 2001. [12] J. F. Cornwell, Group theory in physics. vol. 2, Academic, 1985, 589 p. [13] J. F. Cornwell, Group theory in physics. vol. 3: Supersymmetries and infinite dimensional algebras, Academic, 1989, 628 p. [14] J. C. Collins, Renormalization. an introduction to renormalization, the renormalization group, and the operator product expansion, Cambridge, Univ. Pr., 1984, 380 p. [15] I. L. Buchbinder and S. M. Kuzenko, Ideas and methods of supersymmetry and supergravity: A walk through superspace, Bristol, UK: IOP, 1995, 640 p. [16] J. F. Donoghue, E. Golowich, and B. R. Holstein, Dynamics of the standard model, vol. 2, Camb. Monogr. Part. Phys. Nucl. Phys. Cosmol., 1992. [17] W. Buchmüller and C. Lüdeling, Field theory and standard model, (2006), hep-ph/0609174, http://arxiv.org/abs/hep-ph/0609174. [18] S. Weinberg, The Making of the standard model, Eur. Phys. J. C34 (2004), 5–13, hep-ph/0401010. [19] S. P. Martin, A Supersymmetry primer, (1997), arXiv:hep-ph/9709356 [hep-ph], http://arxiv.org/abs/hep-ph/9709356. [20] S. Raby, Searching for the Standard Model in the String Landscape : SUSY GUTs, (2011), arXiv:1101.2457 [hep-ph], http://arxiv.org/abs/arXiv:1101.2457. LITERATUR 9 [21] S. R. Coleman, There are no Goldstone bosons in two-dimensions, Commun. Math. Phys. 31 (1973), 259–264. [22] I. L. Buchbinder and S. M. Kuzenko, Ideas and methods of supersymmetry and supergravity: A walk through superspace, IOP publishing, 1995, 640 p. [23] M. Hamermesh, Group theory and its application to physical problems, AddisonWesley, 1962, 509 p. [24] R. F. Streater and A. S. Wightman, PCT, spin and statistics, and all that, Redwood City, USA: Addison-Wesley, 1989, 207 p. (Advanced book classics). Notation 10 Bemerkungen zur Notation In CGS- bzw. SI hat man ~ = 6.582 · 10−25 GeV s Natürliche Einheiten. ~ = 1 und und ~ c = 0.1973 GeV fm . Die Einheiten werden im Folgenden so gewählt, dass c = 1. Damit sind sowohl Zeiten als auch Längen in reziproken Einheiten der Energie messbar, 10−25 s = 1 6.582 GeV bzw. 10−13 cm = 1 . 0.1973 GeV Indizes. Griechische Indizes (µ, ν, . . . ) bedeuten, dass der Index von 0 bis 3 läuft, lateinische Indizes (i, j . . . ), dass der Index nur über die räumlichen Komponenten, d.h. von 1 bis 3, läuft. Ortskoordinaten. Kontravariante Vierervektoren werden notiert mit xµ = (t, x, y, z) = (t, ~r) = (t, ~x) , kovariante Vierervektoren mit xµ = (t, −x, −y, −z) = (t, −~r) = (t, −~x) . Die Indizes kann man hoch- bzw. runterziehen: xµ = η µν xν wobei ηµν bzw. 1 0 0 −1 = 0 0 0 0 xµ = ηµν xν , 0 0 0 0 = η µν −1 0 0 −1 der metrische Tensor ist. Hierbei haben wir die (Einstein’sche) Summenkonvention verwendet, die besagt, dass über gleiche Indizes, die einmal oben und einmal unten auftreten, zu summieren ist. Beispielsweise η µν xν := 3 X η µν xν . ν=0 Entsprechend der obigen Diskussion werden griechische Indizes von 0 bis 3 und lateinische Indizes von 1 bis 3 summiert; bei lateinischen Indizes wird die Indexstellung oft ignoriert. Damit lautet die Norm x2 = xµ xµ = t2 − ~r 2 . Notation 11 Invariantes Raum-Zeit-Linienelement. In jedem (physikalischen) Bezugssystem ist der metrische Tensor derselbe. Entsprechend ist das RaumZeit-Linienelement (ds)2 = = dxµ dxµ c2 (dt)2 − (dx)2 − (dy)2 − (dz)2 t dxµ xµ xµ + dxµ in jedem Bezugssystem dasselbe. Impulskoordinaten. geschrieben als pµ = (E, p~) , x Der Viererimpuls wird pµ = ηµν pν = (E, −~ p) . Insbesondere stimmt das Quadrat des Viererimpulses eines Objektes in jedem Bezugssystem mit seiner Ruhemasse überein, p2 = pµ pµ = E 2 − p~2 = m2 . Ableitungen. ∂µ Man schreibt ∂ ∂ ∂ ∂ ∂ ~ = ∇µ = (∂t , ∇) = , , , = ∂xµ ∂t ∂x1 ∂x2 ∂x3 bzw. ~ . ∂ µ = η µν ∂ν = (∂t , −∇) Als d’Alembert-Operator“ bezeichnet man: ” ∂2 ~ 2. = ∂ µ ∂µ = −∇ ∂t2 Der Impulsoperator lautet in der Ortsdarstellung: ∂ 1~ ∂ = i , ∇ = i∇µ pµ = i ∂xµ ∂t i Hier und im Folgenden werden Operatoren immer fett geschrieben. Damit stimmt p2 bis auf das Vorzeichen mit überein: pµ pµ = − ∂ ∂ = − ∂ µ ∂µ = − . ∂xµ ∂xµ Elektromagnetisches Feld. Das elektromagnetische Feld wird als ~ Aµ = (φ, A) geschrieben, und der Feldstärketensor ist F µν = ∂ µ Aν − ∂ ν Aµ . 1 QUANTEN-ELEKTRODYNAMIK (QED) 1 12 Quanten-Elektrodynamik (QED) 1.1 Elektrodynamik als abelsche Eichtheorie Die folgende Diskussion folgt im Wesentlichen [3, Abschnitt 15.1]. Betrachte ein DiracFermionfeld Ψ(x). Für dieses wollen wir nun fordern, dass die Physik invariant ist unter der lokalen Eichtransformation Ψ(x) Ψ(x) → → U (x) Ψ(x) , Ψ(x) U † (x) , (1.1a) (1.1b) wobei U ∈ U(1) ist. U besitzt somit die Darstellung U (x) = ei α(x) (1.2) mit einer reellwertigen Funktion α. Man spricht von einer abelschen Eichtheorie, da die den Transformationen zugrundeliegende Gruppe U(1) abelsch ist, d.h. die Gruppenelemente vertauschen, etwa ei α(x) ei β(x) = ei β(x) ei α(x) . Unser erster Versuch für eine Lagrangedichte ist die der freien Dirac-Theorie, L0 = Ψ (i γ µ ∂µ − m) Ψ . (1.3) Diese ist jedoch nicht invariant unter der Eichtransformation (1.1). Der Massenterm bereitet keine Probleme, allerdings der Ableitungsterm. Das kommt daher, dass in der Richtungsableitung Ψ(x + ε n) − Ψ(x) , εց0 ε nµ ∂µ Ψ(x) = lim (1.4) wo n die Richtung der Ableitung ist, die zwei Felder Ψ(x) und Ψ(x + ε n) verglichen werden. Da α ortsabhängig ist, haben diese jedoch unterschiedliches Transformationsverhalten unter (1.1), Ψ(x) Ψ(x + ε n) → ei α(x) Ψ(x) , → ei α(x+ε n) Ψ(x + ε n) . Um die Felder am Punkt x und y miteinander vergleichen zu können, muss man Ψ von x nach y parallel-transportieren“. Dazu führt man eine Funktion U (y, x) ein mit den ” Eigenschaften U (y, x) → ei α(y) U (y, x) e−i α(x) (1.5) U (y, y) = 1 . (1.6) und Da U (x, y) ∈ U(1), gilt U (y, x) = ei φ(y,x) mit rein reellem φ. Damit hat man erreicht, dass Ψ(y) und U (y, x) Ψ(x) (1.7) 1 QUANTEN-ELEKTRODYNAMIK (QED) 13 das gleiche Transformationsverhalten haben. Dies führt auf den Begriff der eichkovarianten Ableitung nµ Dµ Ψ(x) = lim εց0 Ψ(x + ε n) − U (x + ε n, x) Ψ(x) . ε (1.8) Durch die Entwicklung von U U (x + ε n, x) = =: 1 + (∂µ U )(x, x) ε nµ + O(ε2 ) 1 + i g ε nµ Aµ (x) + O(ε2 ) , (1.9) erhält man das Feld Aµ . Insbesondere erhält man durch Einsetzen von Ψ(x + ε n) = Ψ(x) + ε nµ ∂µ Ψ(x) + O(ε2 ) in (1.8) die bekannte Form der eichkovarianten Ableitung, Dµ Ψ(x) = ∂µ Ψ(x) − i g Aµ (x) Ψ(x) . (1.10) Wir werden später g = −e setzen; e bezeichnet die elektromagnetisch Kopplung in einer Konvention, in der das Elektron negativ geladen ist. Interessanterweise erwächst“ in diesem Zugang das Eichfeld Aµ , d.h. das Photon, aus ” der Forderung, dass man die Felder mit einer ortsabhängigen Phase durchmultiplizieren kann. Aus U (x + ε n, x) = → = = = 1 + i g ε nµ Aµ (x) + O(ε2 ) ei α(x+ε n) 1 + i g ε nµ Aµ (x) + O(ε2 ) e−i α(x) ei (α(x+εn)−α(x)) 1 + i g ε nµ Aµ (x) + O(ε2 ) 1 + i ε nµ ∂µ α(x) + O(ε2 ) · 1 + i g ε nµ Aµ (x) + O(ε2 ) 1 1 + i g ε nµ Aµ (x) + ∂µ α(x) + O(ε2 ) g schließt man auf das Verhalten von Aµ unter (1.1), Aµ (x) → Aµ (x) + 1 ∂µ α(x) . g (1.11) Damit wird die Lagrangedichte 1 L = Ψ(i γ µ Dµ − m) Ψ − Fµν F µν 4 (1.12) Fµν = ∂µ Aν − ∂ν Aµ (1.13) mit1 1 F µν F µν ist der einzige Term, der aus A und seinen Ableitungen gebildet werden kann, wenn man Renormierbarkeit fordert (siehe [3], S. 485). Renormierung wird in der Vorlesung “QFT 2” diskutiert. 1 QUANTEN-ELEKTRODYNAMIK (QED) 14 invariant unter der lokalen U(1)-Transformation (1.1) oder abelschen Eichtransformationen, denn 1 Dµ Ψ(x) → ∂µ − i g Aµ (x) + ∂µ α(x) ei α(x) Ψ(x) g = ei α(x) {∂µ − i g Aµ (x)} Ψ(x) = ei α(x) Dµ Ψ(x) , (1.14) und Fµν ist ebenfalls invariant unter der Eichtransformation. Bemerkung: Fµν läßt sich als Kommutator schreiben, [Dµ , Dν ] = − i g Fµν . (1.15) Neben-Bemerkung: Der Parameter α in (1.2) lässt sich als Koordinate auf einem Kreis, d.h. der S1 , auffassen. Eichtransformationen können auch als Freiheit verstanden werden, den Ursprung des Kreises an jedem Punkt der Raumzeit unterschiedlich zu wählen. Es stellt sich in der Tat heraus, dass, wenn man allgemeine Relativitätstheorie auf M4 × S1 betrachtet, die extra Komponenten des metrischen Tensors in 4 + 1 Dimensionen das Eichfeld beinhalten. Schematisch hat man g00 · · · · · · g03 A0 .. .. .. . . (GM N ) = . g03 · · · · · · g33 A3 A0 · · · · · · A3 G55 D.h. die (Gravitations-)Kräfte, die mit den lokalen Koordinatentransformationen der internen Dimension zusammenhängen, erscheinen als Eichwechselwirkung. Diese Beobachtung geht auf Kaluza und Klein zurück; eine ausführlichere Behandlung dieses Themas findet sich etwa in [7, S. 419 ff.]. Ganz allgemein werden aus Isometrien kompakter Dimensionen sog. interne Symmetrien in der (effektiven) vierdimensionalen Theorie. 1.2 Klassische Elektrodynamik Es soll nun gezeigt werden, dass die Lagrangedichte (1.12) auf die klassische Elektrodynamik führt. Feldstärketensor. Der Zusammenhang zwischen dem Feldstärketensor, F µν = ∂ µ Aν − ∂ ν Aµ , und den Feldern der klassischen Elektrodynamik ist 0 −Ex −Ey −Ez Ex 0 −Bz By . F µν = Ey B z 0 −Bx Ez −By Bx 0 (1.16) (1.17) 1 QUANTEN-ELEKTRODYNAMIK (QED) Feldgleichungen. 15 Betrachte die Lagrangedichte 1 Lphoton = − Fµν F µν . 4 (1.18) Die Euler-Lagrange-Gleichungen liefern ! 0 = ∂µ ∂Lphoton = ∂µ (∂ µ Aν − ∂ ν Aµ ) ∂(∂µ Aν ) für ν = 0, 1, 2, 3, d.h. Aν (x) − ∂ ν (∂µ Aµ (x)) = 0 . (1.19) Steht in der Lagrangedichte zusätzlich ein Quellterm −e j µ Aµ , d.h. L = Lphoton − e j µ Aµ , so folgen als Bewegungsgleichungen ∂µ F µν = e j ν . (1.20) Diese Gleichungen sind nichts anderes als die inhomogene Maxwellgleichungen ~ ·E ~ ∇ ~ ×B ~ − ∂t E ~ ∇ = eρ , (1.21a) = e ~ , (1.21b) mit j = (ρ, ~). Die Stromdichte ist bereits in der Lagrangedichte (1.12) enthalten, denn der Aµ Term in der eichkovarianten Ableitung liefert die Kopplung Aµ Ψ γ µ Ψ = Aµ j µ mit dem Dirac-Strom des Fermions jµ = Ψ γµ Ψ . Wie bereits bekannt ist, kann j als Ladungsstromdichte interpretiert werden. Wegen der Antisymmetrie von F µν folgt ∂ λ F µν + ∂ µ F νλ + ∂ ν F λµ = 0 . Für den dualen Tensor 1 ~ → B, ~ B ~ → −E) ~ Fe µν = εµνρλ Fρλ = F µν (E 2 (1.22) findet man ∂µ Fe µν = = 1 ∂µ εµνρσ (∂ρ Aσ − ∂σ Aρ ) 2 ∂µ εµνρσ ∂ρ Aσ = 0 (1.23) aufgrund der Antisymmetrie des ε-Tensors und der Symmetrie der zweiten Ableitung. Dies entspricht den homogenen Maxwellgleichungen, ~ ×E ~ + ∂t B ~ ∇ ~ ·B ~ ∇ = 0, (1.24a) = 0. (1.24b) 1 QUANTEN-ELEKTRODYNAMIK (QED) 16 Eindeutigkeit von A. A ist nicht eindeutig, denn unter einer Eichtransformation Aµ → A′µ = Aµ + ∂ µ Λ (1.25) mit einem Skalarfeld Λ(x) = g1 α(x). Wähle z.B. Λ = ΛL so, dass ΛL (x) = − ∂µ Aµ (x) , (1.26) was immer möglich ist, da (1.26) eine inhomogene Wellengleichung für Λ darstellt, die immer lösbar ist. Dann folgt für AµL = Aµ + ∂ µ ΛL ∂µ AµL = 0 ; (1.27) man spricht von der Lorentz-Eichung. AµL ist nun eindeutig bis auf AµL → AµLC = AµL + ∂ µ χ mit χ = 0 . Die Wellengleichung für χ läßt noch die Wahl von ∂t χ(0, ~x) und χ(0, ~x) zu. Wir wählen nun Z ∂t φL (0, ~y ) 1 , d3 y ∂t χ(0, ~x) = − φL (0, ~x) und χ(0, ~x) = − 4π |~x − ~y | ~ L(C) ). Damit gilt wobei AL(C) = (φL(C) , A φLC (0, ~x) ∂t φLC (0, ~x) = = 0 ∂t φL (0, ~x) + ∂t2 χ(0, ~x) ~ 2 χ(0, ~x) ∂t φL (0, ~x) + ∇ Z ∂t φL (0, ~y ) 1 ∆ d3 y ∂t φL (0, ~x) − 4π |~x − ~y | 0. = = = Zusammenfassend haben wir für AµLC erreicht AµLC = 0 , A0LC (0, ~x) = 0 und ∂t A0LC (0, ~x) = 0 . Wegen der Eindeutigkeit der Lösungen der Wellengleichung gilt insbesondere (1.27) ~ ·A ~ = 0. A0LC (t, ~x) ≡ 0 −−−−→ ∇ Es ist also möglich, in einem Koordinatensystem φ(x) = 0 und ~ ·A ~ = 0 ∇ (1.28) 1 QUANTEN-ELEKTRODYNAMIK (QED) 17 zu wählen. Man spricht von der Strahlungseichung bzw. Coulombeichung. Man beachte, dass die Strahlungseichung im Gegensatz zur Lorentzeichung nicht kovariant ist. Man lernt aus dieser Diskussion, dass das A Feld nur zwei unabhängige Komponenten hat. Das gilt dann auch für (Quanten-)Anregungen, d.h. das (masselose) Photon besitzt zwei physikalische Freiheitsgrade. Diese entsprechen eine Amplituden in die beiden räumlichen Richtungen, die transversal zum Wellenvektor sind, ~ · ~k = 0 . A (1.29) Das klassische Eichfeld kann man nach ebene Wellen zerlegen, µ A (x) = Z 3 h X ∗ i k·x i 1 d3 k r r −i k·x r ∗ r p a ε (k) e + (a ) ε (k) e . k µ k µ (2π)3 2ω~k r=0 (1.30) Hierbei ist {εrµ }0≤r≤3 eine Basis von Polarisationsvektoren. Wie oben diskutiert, haben physikalische Photonen nur zwei Freiheitsgrade. Man kann dieser Tatsache dadurch Rechnung tragen, dass man fordert, dass physikalische Photonen beschrieben werden durch Polarisationsvektoren εµ = (0, ~ε) mit ~k · ~ε = 0 . Polarisierte Photonen werden durch komplexe Linearkombinationen dieser Polarisationsvektoren beschrieben. Sz = +1 ~k 0 (unphysikalisch) Sz = −1 Wählt man das Bezugssystem so, dass k = (kz , 0, 0, kz ) , so lauten diese 1 εµ± = √ (0, 1, ±i, 0) . 2 Anschaulich entsprechen diese den Spin-Einstellungen Sz = +1 und Sz = −1. Die SpinEinstellung Sz = 0 ist unphysikalisch für masselose Eichbosonen. 1 QUANTEN-ELEKTRODYNAMIK (QED) 1.3 18 Photon-Propagator Photonen werden beschrieben durch das Viererfeld A, das eindeutig ist bis auf Umeichung, Aµ (x) → Aµ (x) + ∂ µ Λ(x) . (1.31) Hierbei ist Λ = g1 α. Das Ziel der folgenden Betrachtungen ist die (Pfadintegral-)Quantisierung des Photon-Feldes. (i) Faddeev-Popov-Methode für abelsche Eichtheorien Wir betrachten eine reine abelsche Eich-Theorie, d.h. Ausgangspunkt ist die Lagrangedichte 1 Lphoton = − Fµν F µν . 4 (1.32) Die resultierende Wirkung ist Z S = d4 x L Z 1 d4 x Aµ (x) {η µν − ∂ µ ∂ ν } Aν (x) + Oberflächenterme = | {z }, 2 (1.33) =0 d.h. man kann ebenso mit L′ = 1 Aµ (x) {η µν − ∂ µ ∂ ν } Aν (x) 2 (1.34) arbeiten. Das Eichfeld soll nun mit der Pfadintegral-Methode quantisiert werden. Dazu betrachtet man Z Z 4 ′ µ Zdiv [J] = DA exp i d x L + J (x) Aµ (x) . (1.35) Hierbei werden Konfigurationen, die über (1.31) zusammenhängen und daher physikalisch äquivalent sind, mehrfach gezählt. Das ist problematisch, weil im Raum dieser Konfigurationen der Operator {η µν − ∂ µ ∂ ν } nicht invertierbar ist. Im Folgenden geht es darum, eine Methode zu finden, das Pfadintegral nur über physikalisch verschiedene Felder laufen zu lassen. Strategie: Die Idee ist, eine Eichung zu ‘fixieren’, indem man nur solche Felder A betrachtet, welche FA = 0 (1.36) erfüllen, wobei F ein Operator ist. Um den Bereich der Pfadintegration einzuschränken, fügt man im Wesentlichen einen Faktor δ(F A) ins Pfadintegral ein. 1 QUANTEN-ELEKTRODYNAMIK (QED) Beispiel: 19 Um sich auf Felder zu beschränken, wählen wir F A = ∂ µ Aµ = 0 . Um das Pfadintegral nur über Konfigurationen laufen zu lassen, die diese Relation erfüllen, geht man folgendermaßen vor: Zunächst schreibt man die Zahl 1 in der Form Z 1 = ∆FP DΛ δ F A(Λ) , (1.37) wo Aµ (Λ) = Aµ + ∂µ Λ (1.38) das einer Eichtransformation unterworfene Feld ist. ∆FP heißt Faddeev-Popov-Determinante und liefert die Normierung. Diese 1 fügen wir dann in das Funktionalintegral ein, Z Z ei S Zdiv [J] = DA ∆FP DΛ δ F A(Λ) Z Z = DΛ DA ∆FP δ F A(Λ) ei S . (1.39) Damit hat man explizit den störenden Anteil der Pfadintegration, gegeben durch Z DΛ , R isoliert. Man braucht nur noch durch DΛ teilen, um sich des Problems des DoppeltZählens zu entledigen. Allerdings enthält (1.39) noch den unbestimmten Ausdruck ∆FP . Um diesen zu bestimmen, betrachtet man die Formel in N Dimensionen Z ∂ϕi , (1.40) 1 = dN λ δ (N ) ϕ(λ) · det ∂λj die sofort aus der Transformationsformel folgt. Dies wird im Kontinuumslimes zu Z δφ 1 = DΛ δ φΛ det (1.41) δΛ δφ . δΛ Durch Vergleich mit (1.37) erhält man einen Ausdruck für die Faddeev-Popov-Determinante, δF A(Λ) ∆FP = det (1.42) , δΛ mit der Operatorableitung (y Anhang A) wobei φ Λ := F A(Λ) als Operator wirkend auf Λ aufgefaßt wird. Für geeignete, lineare F ist ∆FP unabhängig von Λ. Gemäß (B.32) läßt sich die Determinante ihrerseits als Pfadintegral über a-Zahlen schreiben, Z Z δF A(Λ) δF A(Λ) 4 4 = Dη Dη exp i d x d y η(x) η(y) (1.43) det δΛ δΛ 1 QUANTEN-ELEKTRODYNAMIK (QED) Beispiel: 20 Für die Lorentzeichung ist F A(Λ) = ∂ µ Aµ + ∂ µ ∂µ Λ . (1.44) Damit ist δF A(Λ) = ∂µ ∂ µ δΛ ein diagonaler Operator. Daher ist die Faddeev-Popov-Determinante ∆FP = Z Z 4 µ Dη Dη exp i d x η(x) ∂µ ∂ η(x) . (1.45) Hierin sind die Felder η und η keine Spinorfelder, aber doch a-Zahlen. Die FaddeevPopov Determinante sorgt also für einen zusätzlichen Term in der Wirkung, der Spin0-Teilchen mit Fermicharakter beschreibt, d.h. unphysikalische Teilchen. Daher heißen η bzw. η auch Geist-Felder“. ” Glücklicherweise koppeln die Geist-Felder in dieser abelschen Eichtheorie nicht an die physikalischen Felder, die Faddeev-Popov-Determinante kann also getrennt integriert werden und sorgt lediglich für einen zusätzlichen Normierungsfaktor. Fazit: Das erzeugende Funktional für das Photonenfeld ist gegeben durch Z Z = ∆FP · DA ei S δ F A . (1.46) In der QED kann dabei die Faddeev-Popov-Determinante in die Normierung gesteckt werden. Wie man den δ-Term eliminiert, wird im Folgenden behandelt. (ii) Eichfixierungsterm Wir beschränken uns auf eine Verallgemeinerung der Lorentz-Eichung, d.h. der Operator F aus (1.36) soll folgende Form haben: F A = ∂ µ Aµ − ω , wo ω eine beliebige Funktion ist. Das Pfadintegral ergibt sich damit zu Z Ze = ∆FP DA ei S δ(∂ µ Aµ − ω) . (1.47) (1.48) Um sich der Funktion ω zu entledigen, wird ein Funktionalintegral darüber ausgeführt. Wir verwenden hierbei einen Gewichtsfaktor in Form einer Gauß’schen Glockenkurve, Z Z Z 2 4 ω (x) ∆FP DA ei S δ(∂ µ Aµ − ω) Z = N (α) Dω exp −i d x 2α Z Z 1 µ (1.49) (∂ Aµ )2 , = N (α) ∆FP DA ei S exp −i d4 x 2α wo N (α) die Normierung des Pfadintegrals über ω liefert. 1 QUANTEN-ELEKTRODYNAMIK (QED) 21 Fazit: Um die durch die Eichfreiheit resultierenden Probleme zu beseitigen, muß man lediglich die Normierung des erzeugenden Funktionals ändern und einen zusätzlichen Term der Lagrangedichte zufügen, 1 µ 1 L = − Fµν F µν − (∂ Aµ )2 4 2α {z } {z } | | . (1.50) Eichfixierungsterm =:Lphoton α wird als Eichfixierungsparameter bezeichnet. Man fordert anstatt der Eichfreiheit, dass die sich mit dieser Lagrangedichte ergebenden Formeln nicht von α abhängen. Achtung: Man kann auch α = 0 wählen. Erzeugendes Funktional. In Analogie zu den Skalarfeldern setzt man Z Z 4 µ Z[J] = N DA exp i d x (L + Jµ A ) (1.51) Mit partieller Integration und dem Gauß’schen Satz kann man das Argument der Exponentialfunktion umformen, Z Z 1 1 d4 x L = d4 x − Fµν F µν − (∂µ Aµ )2 4 2α Z 1 1 = − 1 ∂ µ ∂ ν Aν (x) d4 x Aµ (x) η µν + (1.52) 2 α | {z } =[D µν ]−1 + Oberflächenterme | {z } . =0 Die Oberflächenterme verschwinden, wenn man - wie üblich - kanonische Randbedingungen fordert. In Analogie zum Skalarfeld bezeichnet man [Dµν ]−1 als inversen Photonenpropagator. Durch Fouriertransformation erhält man b µν (k)]−1 = − k 2 η µν + 1 − 1 k µ k ν . (1.53) [D α Durch Matrixinversion und dem üblichen Hinzufügen des Terms i ε ergibt sich e µν (k) = − D 1 2 k + iε kµ kν η µν + (α − 1) 2 . k (1.54) Dies ist dann der freie Photon-Propagator im Impulsraum. Durch Fourier-Rücktransformation ergibt sich Dµν (x − y) = − Z d4 k −i k·(x−y) η e (2π)4 µν + (α − 1) k2 + i ε kµ kν k2 . (1.55) 1 QUANTEN-ELEKTRODYNAMIK (QED) 22 Bis auf einen Faktor −i entspricht dieser freie Photon-Propgator wieder der Zweipunktfunktion, (1.56) Dµν (x − y) = − i − T Aµ (x) Aν (y) − . Für den Feldoperator des Photons macht man den Ansatz Z 3 h i X ∗ 1 d3 k p Aµ (x) = ark εrµ (k) e−i k·x + (ark )† εrµ (k) ei k·x . 3 (2π) 2ω~k r=0 (1.57) Hierbei ist {εrµ }0≤r≤3 eine Basis von Polarisationsvektoren. Beispiele für die Eichfixierung: (1) α = 1: Feynman-Eichung: e µν (k) = D −η µν . k2 + i ε (2) α = 0: Landau-Eichung: 1.4 kµ kν − η µν e µν (k) = k 2 D . k2 + i ε QED: Störungsentwicklung Lagrangedichte der QED. Mit dem Photon-Feld Aµ und dem geladenen Dirac-Feld Ψ lautet die Lagrangedichte der QED 1 LQED = Ψ(x) (i γ µ Dµ − m) Ψ(x) − F µν Fµν + Eichfixierung . 4 (1.58) Hierbei verwenden wir die eichkovarianten Ableitung Dµ = ∂µ + i e Aµ (x) . (1.59) Diese ist nach Konstruktion invariant unter der Eichtransformation Ψ(x) Ψ† (x) Aµ (x) → → → e−i e Λ(x) Ψ(x) , Ψ† (x) e+i e Λ(x) , (1.60) (1.61) Aµ (x) + ∂ µ Λ(x) . (1.62) Die Ersetzung der partiellen Ableitung durch eichkovariante Ableitung ist die einzige Wahl (solange man linear in dem Feld A bleibt), die die U(1)-Invarianz von L garantiert. Erzeugendes Funktional. Man setzt Z Z Z Z i 4 µ 2 Z[η, η, J] = N DΨ DΨ DA exp − d x (∂µ A (x)) · 2α Z 1 · exp i d4 x − Fµν F µν + Ψ(i γ µ (∂µ + i e Aµ ) − m)Ψ 4 µ −Jµ A + η Ψ + Ψ η , (1.63) 1 QUANTEN-ELEKTRODYNAMIK (QED) 23 wo N −1 = Z[η = 0, η = 0, J = 0] . Wir erinnern uns nun an die Diskussion des reellen Skalarfeldes. Mit einem Trick gelingt es, Monome von Feldern vor das Pfadintegral zu ziehen: Mit der Formel Z Z δ Dφ exp i d4 x [L0 + J(x) φ(x)] i δJ(y) Z Z = Dφ φ(y) exp i d4 x [L0 + J(x) φ(x)] δ sieht man, dass man in (der Potenzreihe) Lint anstatt φ(y) die Funktionalableitung iδJ(y) einsetzen und vor das Pfadintegral ziehen kann, Z δ 4 · Z[J] = N exp i d y Lint i δJ(y) Z Z 4 · Dφ exp i d x [L0 + J(x) φ(x)] . (1.64) | {z } ∼Z0 [J] Das verbleiben Pfadintegral entspricht bis auf den Normierungsfaktor N dem erzeugenden Funktional für das freie Skalarfeld. Wir erhalten also Z 4 Z[J] = N exp i d y Lint mit δ i δJ(y) Z0 [J] Z Z i 4 4 ′ ′ ′ Z0 [J] = exp − d x d x J(x) ∆F (x − x ) J(x ) . 2 (1.65) (1.66) Z[η, η, J] = N · Z 1 δ 1 δ 1 δ · exp i d4 x e − γµ − Z0 [η, η, J] . (1.67) i δη(x) i δJµ (x) i δη(x) Hierbei ist Z0 das wechselwirkungsfreie erzeugende Funktional, Z Z Z Z R 4 µ 2 i Z0 [η, η, J] = DΨ DΨ DA e− 2α d x (∂µ A (x)) exp i d4 x L0 mit 1 L0 = − Fµν F µν + Ψ (i γ µ ∂µ − m) Ψ − Jµ Aµ + η Ψ + Ψ η . 4 Z0 wiederum kann folgendermaßen ausgedrückt werden: Z Z i 4 Z0 [η, η, J] = exp − d x d4 y Jµ (x) Dµν (x − y) Jν (y) 2 (1.68) 1 QUANTEN-ELEKTRODYNAMIK (QED) −i Z 4 d x Z 4 d y η(x) SF (x − y) η(y) 24 . (1.69) Hierbei ist SF der übliche Feynman-Propagator für das Dirac-Feld, SF (x) = (i γ ν ∂ν + m) ∆F (x) . (1.70) Aus den Zwei- und Drei-Punktfunktionen des erzeugenden Funktionals kann man die Feynmanregeln der QED herleiten. Diese Regeln lassen sich dazu verwenden, Übergangsamplituden in Streuprozessen zu berechnen. 2 STREUTHEORIE 2 25 Streutheorie Wir interessieren uns nun dafür, Vorhersagen für Streuprozesse zu machen. Dabei wird es im Wesentlichen um Prozesse gehen, in denen Teilchen (a1 und a2 ) aufeinander geschossen werden, und neue Teilchen entstehen, etwa a1 • • • • a 1 + a 2 → b1 + b 2 + . . . bn . Das Folgende startet mit einer Diskussion der foirmaleren Aspekte, dann werden wir uns damit beschäftigen, wie man in der Praxis relevante Messgrössen (Wirkungsquerschnitte etc.) berechenet. Die Beispiele in diesem Abschnitt beziehen sich auf die QED, die Methoden werden aber später auf andere Wechselwirkungen angewandt werden. 2.1 (i) b1 b2 a2 bn Streuprozesse S- und T -Matrix S-Matrix. Das S-Matrix-Element Sf i ist definiert über Sf i = hf | S |ii , (2.1) wobei der Operator S den Übergang des asymptotisch freien Anfangszustand |ii in einen anderen Zustand beschreibt, der dann auf den ebenfalls asymptotisch freien Endzustand |f i projiziert wird. Die Wechselwirkungen werden zu endlichen Zeiten ein“- und ausge” ” schaltet“. Bemerkung: Auf die Schwierigkeiten, die sich aus der den asymptotisch freien Zuständen ergeben, soll hier nicht näher eingegangen werden. Man fordert letztlich für φ(x) die sogenannte schwache asymptotische Bedingung, nämlich dass für beliebige Vektoren im Fockraum |ai und |bi gilt lim ha| Φ(x) |bi = a| φout in (x) |b . t→±∞ T -Matrix. Die T -Matrix wird mit dem konventionsabhängigen Normierungsfaktor N definiert durch Sf i = δf i + i N hf | T |ii . | {z } (2.2) :=Tf i Der Grund für ist die Normierung ist: Sf i soll für die Übergangsamplitude stehen. Die Zustände haben in unserer Konvention die Kontinuumsnormierung. Für eine Interpretation als Übergangsamplitude benötigt man aber auf 1 normierte Zustände. Mit (2.2) enthält die T -Matrix den nicht-trivialen Anteil der Propagation, sie erzeugt nur noch zusammenhängende Diagramme. Die S- und die T - Matrixelemente sind Lorentzinvariant. Das T -Matrixelement hängt eng mit dem invarianten Matrixelement Mf i , das 2 STREUTHEORIE 26 wir später mit den Feynman-Regeln berechnen werden, und den n-Punkt Greensfunktionen zusammen. Der Normierungsfaktor ist in der hier verwendeten Konvention Y 1 Y 1 √ p . (2.3) N = 2Ei f 2Ef i (ii) Das erzeugende Funktional S[J, φ0 ] Es geht darum, die S- und T -Matrixelemente im Pfadintegralformalismus zu berechnen. Der Weg, diese Matrixelemente zu berechnen, soll nun kurz skizziert werden. Zunächst erinnert man sich, dass das Pfadintegral mit festen Anfangs- und Endfeldkonfigurationen, Z Z 4 (2.4) I[φin , φout ] = Dφ exp i d x L0 + Lint , φin φout gerade die Übergangsamplitude von φin nach φout wiedergibt. Könnte man dieses Pfadintegral einfach berechnen, hätte man bereits die S-Matrix-Elemente bestimmt. Das ist nun leider nicht der Fall. Daher bedarf es einiger Anstrengungen, um hier weiterzukommen; wir folgen im Wesentlichen [2, S. 55 ff.]. Ein wesentlicher Schritt ist, ein erzeugendes Funktional mit festen Grenzen zu definieren, Z Z 4 S[J, φ0 ] = Dφ exp i d x L0 + L1 + J φ . (2.5) φ0 φ0 Den Wechselwirkungsterm kann man auf die übliche Weise herausziehen. Bemerkung: Im Operatorkalkül wählt man als Ausgangspunkt die Formel für den T Operator in einem Formalismus, der sich aus Überlegungen der kanonischen Quantisierung und der Pfadintegraldarstellung zusammensetzt (vgl. z.B. [8, S. 217 ff.]). Man erhält im Fall von Skalarfeldern T = : exp Z δ : W [J]J=0 . dx φin (x) K δJ(x) (2.6) Die Verallgemeinerung auf Diracfelder führt auf analoge Resultate. Das Funktional W [J] erzeugt nur die zusammenhängenden Greensfunktionen und K ist der Differentialoperator der Klein-Gordon-Gleichung, K = + m2 . Außerdem ist φin (x) der Feldoperator für asymptotisch freie Teilchen. 2 STREUTHEORIE 27 Zusammenhang S ↔ Z. Die Bedingung der festen Grenzen des Funktionalintegrals kann umgeschrieben werden. Man erhält für S[J, φ0 ] Z δ 4 2 Z[J] . (2.7) S[J, φ0 ] = exp d x φ0 (x) ( + m ) δJ(x) Damit kann man einen Zusammenhang zwischen den n-Punkt Funktionen τ (n) (x1 , . . . xn ) und den Streuamplituden, bei denen n Teilchen beteiligt sind, finden. Zumeist formuliert man die Übergangsamplituden im Impulsraum, die Gegenstand des folgenden Abschnittes sind. (iii) Betrachtungen im Fourierraum Das erzeugende Funktional kann als Funktional für die Quellfeldkonfigurationen im Ortsb raum, J(x), oder alternativ für deren Fouriertransformierte J(k) erklärt werden. Der Zub sammenhang zwischen J(x) und J(k) ist, wie üblich, Z d4 k −i k·x b e J(k) . (2.8) J(x) = (2π)4 Damit ergibt sich Z Z i d4 x d4 y J(x) ∆F (x − y) J(y) − 2 Z Z Z 4 d p1 d 4 p2 d 4 k i 4 d x d4 y = − 2 (2π)4 (2π)4 (2π)4 b 1 ) e−i (p1 +k)·x e−i (p2 −k)·y J(p b 2) J(p = − i 2 Z k 2 − m2 + i ε b b d k J(k) J(−k) . (2π)4 k 2 − m2 + i ε 4 Dafür kann man genausogut schreiben Z Z d4 x d4 y J(x) ∆F (x − y) J(y) = (2.9) Z d4 p (2π)4 Z d4 q b (2π)4 δ (4) (p + q) b J(q) . J(p) (2π)4 k 2 − m2 + i ε (2.10) Dies kann man in das erzeugende Funktional der wechselwirkungsfreien Theorie einsetzen, Z Z d4 q b (2π)4 δ (4) (p + q) b d4 p i J(p) J(q) . (2.11) Z0 [J] = exp − 2 (2π)4 (2π)4 p 2 − m2 + i ε n-Punkt-Funktionen. Man nennt τ (x1 , x2 ) = h−| T φ(x1 ) φ(x2 ) |−i oft Zweipunkt-Funktion und entsprechend τ (x1 , . . . xn ) = h−| T φ(x1 ) . . . φ(xn ) |−i n-Punkt-Funktion. Diese können durch n-fache Funktionalableitung des erzeugenden Funktionals gewonnen werden, δn n τ (x1 , . . . xn ) = (−i) Z0 [J] . (2.12) δJ(x1 ) · · · δJ(xn ) J=0 2 STREUTHEORIE 28 Gleichung (2.11) zeigt, dass die Zwei-Punkt-Funktionen im Fourierraum automatisch eine δ-Distribution enthalten. Dazu führt man die Funktionalableitung formal durch, τb(2) (p1 , p2 ) := = δ δ Z0 [J] b b i δ J(p1 ) i δ J(p2 ) (2π)4 i δ (4) (p1 + p2 ) . p21 − m2 + i ε (2.13) Hier tritt offensichtlich die δ-Distribution auf. Diese impliziert Viererimpulserhaltung, d.h. Energie und räumliche Impulserhaltung. Diese Tatsache rührt daher, dass der Propagator nur eine Funktion des Abstands der Variablen x und y ist. ∆F (x, y) = ∆F (x − y) . Dies wiederum ist eine Folge der Translationsinvarianz. Green’sche Funktionen G (n) . Offensichtlich ist die in den n-Punkt-Funktionen auftretende δ-Funktion störend. Daher definiert man die Greensfunktionen in einer Weise, dass diese bereits herausgekürzt ist. Man setzt spezifisch G (n) (2π)4 δ (4) (p1 + · · · + pn ) := Z d4 x1 · · · d4 xn τ (x1 , . . . xn ) e−i (p1 x1 +···+pn xn ) . (2.14) Green’sche Funktionen G(n) . Völlig analog transformiert man auch die zusammenhängenden n-Punktfunktionen in den Fourierraum, G(n) (2π)4 δ (4) (p1 + · · · + pn ) := Z d4 x1 · · · d4 xn Φ(x1 , . . . xn ) e−i (p1 x1 +···+pn xn ) . (iv) (2.15) S-Matrix und Green’sche Funktionen Wir interessieren uns nun konkret für einen Prozess, in dem im Anfangszustand m asymptotisch freie Teilchen mit Impulsen {pi }m i=1 und im Endzustand n − m asymptotisch freie Teilchen mit den Impulsen {pi }ni=m+1 auftreten. Hierfür wird erst eine Formel (vgl. [2] (6.50a) auf S. 69. Für die Herleitung siehe [2], S. 54 ff.) zitiert: δ n S[φ0 ] −1 Sf i = {ρ(p1 ) · · · ρ(pn )} , (2.16) ∗ ∗ δa(p1 ) · · · δa(pm ) δa (pm+1 ) · · · δa (pn ) a=a∗ =0 wobei und ρ(p) = (2π)−3 (2p0 )−1 , Z d3 p 1 a(p) e−i p·x + a∗ (p) ei p·x φ0 = 3 (2π) 2ωp S[φ0 ] = exp Z δ d x φ0 (x) ( + m ) δJ(x) 4 2 Z[J] (2.17) (2.18) . J=0 (2.19) 2 STREUTHEORIE 29 Die S-Matrix ergibt sich als Sf i = (2π)4 δ (4) (p1 + p2 + . . . pm − pm+1 − · · · − pn ) Mf i , (2.20) Mf i = (−i)n (p21 − m2 ) · · · (p2n − m2 ) G (n) (p1 , . . . pm , −pm+1 , · · · − pn ) . (2.21) wobei Mf i gegeben ist durch In diesem Matrixelement sind noch die trivialen Anteile enthalten, in denen anschaulich die Teilchen ohne Wechselwirkung aneinander vorbeifliegen. Die Berechnung dieser Übergangsamplitude entspricht üblicherweise nicht der Problemstellung, vielmehr ist man an der T -Matrix (vgl. (2.2)) interessiert. Es lässt sich nun zeigen, dass diese bei der Betrachtung spezieller Prozesse (siehe [2], S. 70), auf die wir uns im Folgenden beschränken, mit den zusammenhängenden n-Punktfunktionen G(n) im Zusammenhang steht. Es gilt X X Tf i = (2π)4 δ (4) pi − pf M f i , (2.22) i f wobei Mf i = (−i)n n Y i=1 (p2i − m2 ) G(n) (p1 , . . . pm , −pm+1 , · · · − pn ) . (2.23) Das hier definierte invariante Matrixelement Mf i hängt wie oben angegeben mit den zusammenhängenden n-Punkt-Greensfunktionen in der Fourierdarstellung zusammen. Man kann damit die Feynmanregeln ablesen, mit denen dann die Konstruktion der Matrixelemente für spezielle Terme der n-Punkt Funktion möglich ist.2 Anschauliche Interpretation. Die graphische Veranschaulichung zeigt, dass jede äußere Linie in den n-Punkt-Funktionen einem Propagator entspricht. Die Multiplikation mit −i (p2i − m2 ) kürzt gerade diesen Propagator, sodass man die S- bzw. T -Matrix erhält, indem man die Propagatoren aus den äußeren Beinen entfernt. Dieses Ergebnis lässt sich auch auf den Fall von Dirac-Feldern übertragen. 2.2 Berechnung messbarer Größen Übergangswahrscheinlichkeiten dwf i . Die Übergangswahrscheinlichkeit ist gegeben durch |Tf i |2 dNf (2.24) dwf i = T mit der Zeit T , die der Prozess in Anspruch nimmt, und dem infinitesimalen Phasenraumelement dNf im Endzustand. Hierbei sind zwei Dinge zu beachten: (1) Der Ausdruck für dwf i krankt an einem Term der Form: 2 X X (2π)4 δ (4) ( pi − pf ) . i f (2) Letztlich will man den Prozess charakterisieren durch Größen, die nicht von T abhängen. 2 Die negativen Vierer-Impulse können – wie üblich – in positive ‘umgewandelt’ werden, indem man von der Teilchen- in die Anti-Teilchen-Sprache wechselt, d.h. (Teilchen-)Lösungen zu negativer Energie als Anti-Teilchen mit positiver Energie (um-)interpretiert. 2 STREUTHEORIE 30 Fermis Trick. Um den Ausdruck 2 X X (2π)4 δ (4) pi − pf . i f zu behandeln, benutzt man Fermis Trick für große V und T , 2 Z Y X X d4 pf (2π)4 δ (4) pi − pf F (pf ) pf → = i Z Y d 4 pf pf Z d4 x e V T (2π) P i pi − P pf ) x f X X (2π)4 δ (4) pi − pf F (pf ) i V,T 4 i( f Z Y pf d4 pf δ (4) X i pi − X f f pf F (pf ) , (2.25) für beliebige Funktionen F (pf ). Formal können wir also schreiben: 2 X X X X Fermis Trick −−−−−−−−→ V T (2π)4 δ (4) pi − pf .(2.26) (2π)4 δ (4) pi − pf i i f f Man sieht sofort, dass das auftretende T mit dem T in der Definition von dwf i kürzt. Das Phasenraumelement (im Impulsraum) für den Endzustand ist dNf = Y d 3 pf 1 Se , (2π)3 2Ef (2.27) f wobei Se = Y 1 µf µf : Vielfachheit der Teilchen im Endzustand f ein kombinatorischer Symmetriefaktor ist. Damit gewinnt man für die Übergangsrate den Ausdruck: X X Y d 3 pf 1 Se . (2.28) dwf i = V (2π)4 δ (4) pi − pf |Mf i |2 (2π)3 2Ef i f f Dieser ist aufgrund der verwendeten Normierung der Zustände proportional zum betrachteten Volumen V . Um eine davon unabhängige Größe zu erhalten, teilt man durch die über das Volumen integrierte Flussdichte der einlaufenden Teilchen. Fluss. Die Flussdichte eines Teilchens in einem Bezugssystem ist |~ p| (2.29) E mit der Teilchendichte ρ. Bei der Betrachtung zweier Teilchen ist die Verallgemeinerung dieser Formel gegeben durch: φ = ρ·v mit v = φ = ρ1 ρ2 · vrel mit vrel = |~v1 − ~v2 | . (2.30) 2 STREUTHEORIE 31 Die Dichten ρi sind dabei durch die 0-ten Komponenten der Stromdichte gegeben, ρi = 2Ei . Der Gesamtfluss ist die über das Volumen integrierte Flussdichte, Φ = φ·V . Streuquerschnitt. Der differentielle Streu- oder Wirkungsquerschnitt ist definiert durch dwf i . Φ (2.31) dσ = Man sieht, dass sowohl wf i als auch Φ proportional zu V sind, so dass dσ unabhängig von dem betrachteten Volumen wird. Die Interpretation des differentiellen Streuquerschnitts ist aus der Quantenmechanik bekannt, dσ(θ, ϕ) = Strom der in Richtung (θ, ϕ) gestreuter Teilchen × r2 dΩ , Strom der einfallenden Teilchen (2.32) wo (r, θ, ϕ) die üblichen Kugelkoordinaten in drei Dimensionen bezeichnen, bzw. dσ = dΩ Strom der in Richtung (θ, ϕ) gestreuter Teilchen × r2 . Strom der einfallenden Teilchen (2.33) Der differentielle Wirkungsquerschnitt hat die Dimension einer Fläche. Man gibt ihn oft in barn an, 1 barn = 1 b = 10−24 cm2 . Wir werden häufig Situationen betrachten, in denen zwei Teilchen-Strahlen, etwa A und B, aufeinandergeschossen werden. In solchen Situationen ist es eine Frage der Konvention, ob (in der Sprache der QM 2) A das Projektil und B das Target ist oder umgekehrt. Die Definition der Flussdichte (2.30) ist gerade so gewählt, dass sie dieser Symmetrie gerecht wird. Betrachtet man speziell zwei Teilchen im Anfangszustand, so ist der Streuquerschnitt dσ gegeben durch dσ(a1 + a2 → f ) = wf i dNf φi mit der Übergangswahrscheinlichkeit (und nach Anwendung von Fermis Trick) X X wf i = (2π)4 δ (4) pi − pf |Mf i |2 , i (2.34) (2.35) f und der Flussdichte 1/2 . φi = 2E1 2E2 vrel = 4 (p1 · p2 )2 − m21 m22 (2.36) 2 STREUTHEORIE Wirkungsquerschnitt im Schwerpunktsystem. und 2 Endzustände (C, D), d.h. der Prozess ist 32 Hat man 2 Anfangszustände (A, B) A+B → C +D , so lässt sich dieser Ausdruck im Schwerpunktsystem p~A = −~ pB vereinfachen und es lässt sich der differentielle Wirkungsquerschnitt in folgender Form angeben (mit: ECM = (EA + EB )): 1 |~ pA | dσ = | M f i |2 . (2.37) 2 dΩ CM 2EA 2EB |~vA − ~vB | (2π) 4ECM Im Falle gleicher Massen aller vier Teilchen wird daraus |Mf i |2 dσ = (vier identische Massen) . 2 dΩ CM 64 π 2 ECM (2.38) Zerfallsraten. Die Zerfallsrate dΓ ist ein Spezialfall von dwf i mit nur einem einlaufenden Teilchen (siehe z.B. [3]). 2 STREUTHEORIE 2.3 33 Feynmanregeln der QED Mit den Feynmanregeln kann man das invariante Matrixelement Mf i für Streuprozesse, wie z.B. für den rechtsstehenden, a1 b1 b2 • • a 1 + a 2 → b1 + b 2 + . . . bn , berechnen. Die Prozesse werden graphisch so dargestellt, dass die Anfangszustände |ai links und die Endzustände |bi rechts sind. • • a2 Faktor bn Einlaufende Fermionlinie u(s) (p) - im Anfangszustand p v (s) (p) - im Endzustand p Auslaufende Fermionlinie v (s) (p) - im Anfangszustand p u(s) (p) - im Endzustand p Einlaufendes Photon Auslaufendes Photon εµ ε∗µ Vertex −i e γ µ Innere Fermionlinie Innere Photonlinie Fermionring p q i SF (p) = i p +m p 2 − m2 + i ε i Dµν (q) = − i η µν + (α − 1) qµ qν q2 q2 + i ε (−1) Vorgehensweise: • Die Elemente (Spinoren, γ-Matrizen, Propagatoren, Spinoren) werden so angeordnet, dass sie, von links nach rechts gelesen, die Reihenfolge entgegengesetzt der Pfeile der Feynmangraphen bilden. • Für jede Fermion-Schleife nimmt man die Spur über die Spinor-Indizes. • Jeden Impuls q, der nicht durch Viererimpulserhaltung festgelegt ist, integriert man R (2π)−4 d4 q. • Ein Faktor (−1) zwischen zwei Graphen, die sich nur durch Vertauschung zweier äußerer Fermionlinien unterscheiden. 2 STREUTHEORIE 2.4 (i) 34 QED auf Tree-Level: Beispiele Der Prozess e+ e− → µ+ µ− In führender Ordnung Störungtheorie trägt zum Prozess der durch das folgende FeynmanDiagramm dargestellte Term zum Matrixelement bei: µ− e+ k ′ p q=p+p′ =k+k′ µ ν . p k′ e− µ+ Bei der Berechnung des unpolarisierten Wirkungsquerschnitts geht man wie folgt vor: Vom Diagramm zum Matrixelement Mf i . Nach den Feynman-Regeln wandelt man das Diagramm in einen Ausdruck für das Matrixelement um: • Man verfolgt die Pfeile entgegen der Pfeilrichtung. ′ • Das auslaufende e+ im Anfangszustand erhält einen Faktor v̄ (s ) (p′ ), der Vertex liefert −i eγ µ und das einlaufende e− u(s) (p). • Die innere Photonenlinie trägt den Photonenpropagator i Dµν bei. • Mit den auslaufenden Fermionen verfährt man wie mit den einlaufenden. Man erhält also in erster Ordnung Störungsentwicklung qµ qν −i η + (α − 1) µν ′ q2 v̄ (s′ ) (p′ ) (−i eγ µ ) u(s) (p) . i Mf i = ū(r) (k) (−i eγ ν ) v (r ) (k ′ ) 2 q + iε (2.39) Quadrieren von Mf i , Spinmittelung und weitere Vereinfachungen. Um einen unpolarisierten Wirkungsquerschnitt zu erhalten, mittelt man über die Spins der Anfangszustände und summiert über die Spins der Endzustände. Des Weiteren verwenden wir Feynman-Eichung, d.h. α = 1. Dabei ist zu beachten: Zuerst wird |Mf i |2 gebildet und dann summiert bzw. gemittelt. Dies bedeutet anschaulich, dass die einzelnen Prozesse mit definiertem Spin nicht miteinander interferieren. Zu berechnen ist somit 1 X 1 XXX |Mf i |2 . (2.40) 2 s 2 ′ r ′ s r 2 STREUTHEORIE 35 Bei der Berechnung von |Mf i |2 = Mf i M†f i hat man Terme der Form (v̄ Γ u)† auszuwerten, (v̄ Γ u)† = u† Γ† (v † γ 0 )† (γ 0 γ 0 =1) u† γ 0 γ 0 Γ† γ 0 v = ū Γ v . | {z } | {z } = =ū Man erhält also (v̄ Γ u)† = ū Γ v (2.41) :=Γ mit Γ := γ 0 Γ† γ 0 . (2.42) Insbesondere gilt γµ = γµ , (2.43) denn für µ = 0 ist 3 = γ0 γ0 = γ0 und für i = 1, 2, 3 ist 2 † = γi . γi = γ0 γi γ0 = − γ0 γi γ0 = γi γ0 Wir haben es nun mit Ausdrücken wie z.B. X ′ ′ ′ ū(r) (k) γ ν v (r ) (k ′ ) v̄ (r ) (k ′ ) γ ν u(r) (k) ξ := r,r ′ X = r,r ′ ū(r) (k) α (γ ν ) αβ ′ v (r ) (k ′ ) β ′ v̄ (r ) (k ′ ) δ γν ′ δε u(r) (k) ε (2.44) zu tun, wo wir in der zweiten Zeile die Spinor-Indizes explizit zeigen. Dabei ist die Summenkonvention zu verwenden, d.h. über wiederholt auftetende Indizes zu summieren. Diesen Ausdruck kann man umarrangieren, i ′ ′ δε X h X ′ αβ ξ = u(r) (k) ū(r) (k) (γ ν ) v (r ) (k ′ ) v̄ (r ) (k ′ ) γν ε r (C.13) = = α r′ β ′ δε αβ ′ k + mµ εα (γ ν ) k − mµ βδ γ ν n ′ o , tr k + mµ (γ ν ) k′ − mµ γ ν δ (2.45) wobei wir ausgenutzt haben, dass die in auftretende Summation über ε als Spur über das Produkt der Dirac-Matrizen aufgefasst werden kann. Das analoge Vorgehen für den e+ e− -Anteil“ von |Mf i |2 führt auf die Form ” i h e4 1 X ′ µ µ′ · tr ( p − m ) γ ( p + m ) γ |Mf i |2 = e e 4 ′ ′ 4 [q 2 ]2 ss rr i h ′ (2.46) · tr (k′ − mµ ) γ ν (k + mµ ) γ ν ηµν ηµ′ ν ′ , wo wir den +i ε-Term“ im Photon-Propagator weglassen konnten. ” 2 STREUTHEORIE 36 Auswerten der Spur. Die Rechenregeln für diese Art von Spuren sind in Anhang D beschrieben. Unter Ausnutzung der zyklischen Invarianz der Spur und der Relationen der Clifford-Algebra finden wir tr [γ µ γ ν γ ρ γ σ ] = tr [γ ν γ ρ γ σ γ µ ] = = = tr [γ ν γ ρ (−γ µ γ σ ) + 2η µσ · 14 ] − tr [γ ν γ ρ γ µ γ σ ] + 2 tr [γ ν γ ρ ] · η µσ tr [γ ν γ µ γ ρ γ σ ] + 8η νρ η µσ − 8η νσ η µρ = − tr [γ µ γ ν γ ρ γ σ ] + 8 (η νρ η µσ − η νσ η µρ + η µν η ρσ ) . Damit ergibt sich tr [γ µ γ ν γ ρ γ σ ] = 4 (η µν η ρσ + η νρ η µσ − η νσ η µρ ) . Wir erhalten deshalb i h ′ = tr k′ γ ν k γ ν = (2.47) i h ′ ′ (k ′ )µ′ kµ tr γ µ γ ν γ µ γ ν i h ′ ′ ′ 4 p′ν pν + p′ν pν − p · p′ η νν . (2.48) Durch die analogen Schritte für die verbleibenden Terme ergibt sich 1 X |Mf i |2 4 ′ ′ = ss rr 8e4 [(p · k) (p′ · k ′ ) + (p · k ′ ) (p′ · k) [q 2 ]2 + m2µ (p · p′ ) + m2e (k · k ′ ) + 2 m2e m2µ . (2.49) Einsetzen der kinematischen Größen. Wir setzten uns in das Schwerpunktsystem von e+ e− . Weiter vernachlässigen wir die Elektronmasse me gegen die Energie, d.h. p2 = (p′ )2 = m2e = 0. Aufgrund dieser Näherung und der Wahl des Schwerpunkt-Systems als Bezugssystem kann man die Impulse p und p′ wie in der Skizze rechts schreiben. Für den Impuls des Myons gilt q E 2 − m2µ |~k| = k = (E, ~k) p = (E, E ~ez ) • ϑ p′ = (E, −E ~ez ) und ~k · ~ez = |~k| cos ϑ . Natürlich muss man als Bedingung k ′ = (E, −~k) für den Prozess E > mµ fordern, d.h. die Schwerpunktsenergie muss ausreichen, um 2 Myonen zu erzeugen. Um den Ausdruck (2.49) umformen zu können, benötigt man die Produkte der ViererImpulse p, p′ , k, k ′ und den Impulsübertrag q 2 . Man erhält q2 = (p + p′ )2 = 4E 2 , 2 STREUTHEORIE p · p′ p·k p · k′ = = = 37 2E 2 , p′ · k ′ = E 2 − E |~k| cos ϑ , p′ · k = E 2 + E |~k| cos ϑ . Durch Einsetzen dieser Relationen in (2.49) ergibt sich i e4 h 2 ~ 2 1 X 2 2 E + | k| cos ϑ + m |Mf i |2 = µ . 4 ′ ′ E2 (2.50a) (2.51) ss rr Mandelstam-Variablen. Speziell für Prozesse der Form A+B → C +D , d.h. mit jeweils zwei Teilchen im Anfangs- bzw. Endzustand, ist es oft vorteilhaft, lorentzinvariante Größen einzuführen, s t u = (pA + pB )2 = (pC + pD )2 , = (pA − pC )2 , = (pA − pD )2 . (2.52a) (2.52b) (2.52c) Diese sind nicht unabhängig voneinander, denn es gilt s+t+u = = (pA + pB )2 + (pA − pC )2 + (pA − pD )2 3p2A + 2pA · pB − (pC + pD ) + p2B + p2C + p2D | {z } =pA +pB = m2A + m2B + m2C + m2D . (2.53) Wesentlich ist, dass man einige Streuquerschnitte alleine durch die Mandelstam-Variablen s, t und u ausdrücken kann. Betrachte z.B. die Spinsumme (2.49) im ultrarelativistischen Limes. Wir haben s t 2 u 2 = = = (2.50) (p + p′ )2 = q 2 , 1 (2.50) (p − k)2 = − p · k = − p′ · k ′ , 2 1 (2.50) (p − k ′ )2 = − p · k ′ = − p′ · k . 2 (2.54a) (2.54b) (2.54c) Damit lässt sich die Übergandawahrscheinlichkeit alleine durch die Mandelstam-Variablen ausdrücken, ( ) 2 u 2 t 8e4 1 X 2 + . (2.55) |Mf i | = 2 4 ′ ′ s 2 2 ss rr Es sei bemerkt, dass für diesen Prozess die Definition der Mandelstam-Variablen t und u nicht eindeutig ist, d.h. wir hätten sie ebenfalls umgekehrt definieren können.3 Die Spinsumme (2.55) ist invariant unter der entsprechenden Vertauschung t ↔ u. Interpretation der Mandelstam-Variablen im ultrarelativistischen Limes. Offensichtlich kann man s als Quadrat der Schwerpunktsenergie interpretieren. Im ultrarelativistischen Grenzfall eine Deutung der anderen beiden Variablen in Abhängigkeit des Streuwinkels 3 Ich danke für den entsprechenden Hinweis während der Vorlesung. 2 STREUTHEORIE 38 ϑ = ∢(~ pA , p~C ) p~C im Schwerpunktsystem möglich, t u ϑ = −s sin2 ϑ/2 , = −s cos2 ϑ/2 . p~A Kreuzungssymmetrie. Man kann sich allgemein überlegen, was passiert, wenn man in einer Reaktion ein einlaufendes Teilchen durch ein auslaufendes Antiteilchen ersetzt. Es zeigt die Formel (2.16) M φ(p) + · · · → . . .′ = M · · · → · · · + φ(−p) , (2.56) φ(−p) . = φ(p) Man beachte, dass mit p niemals −p ein physikalischer Impuls sein kann. (2.56) besagt, dass zwei Übergangsamplituden durch analytische Fortsetzung zusammenhängen. Diese Betrachtung zeigt eine Symmetrie die S- bzw. T -Matrix als analytische Funktion der Impulsvariablen. Man spricht von Kreuzungssymmetrie. Kreuzungssymmetrie und Mandelstamvariablen. A(p) + C(k) → D(p′ ) + B(k ′ ) Betrachte nun z.B. den Prozess (−−) D C p′1 und den gekreuzten Prozess A(p1 ) + B(p2 ) → C(p′1 ) + D(p′2 ) . k p′ q=p+k=p′ +k′ p′2 In der vorangegangenen Diskussion wären beiq=p1 −p′1 spielsweise A und C Elektronen (und entsprep2 p chend C ein Anti-Elektron, d.h. ein Positron) p1 k′ und D und B Myonen. Dieser Prozess wird beschrieben durch Feynmandiagramme, die gegenüber (−−) denen des Ausgangsprozesses gekippt sind bzw. A B bei denen die Richtung des Zeitflusses um 90◦ gedreht sind. In der rechtsstehenden Diagramm muss man für den ersten Prozess das Diagramm links nach rechts“ und für den zweiten von von ” ” unten nach oben“ lesen. Dabei sind die Impulse jeweils links bzw. rechts von den Fermionlinien angezeigt. Wir sehen, dass die Übersetzungsregeln für die Viererimpulse gegeben sind durch p → p1 , p′ → p2 , k → − p′1 und k ′ → − p2 . (2.57) 2 STREUTHEORIE 39 Wir überlegen uns nun, was die Mandelstam-Variablen sind, A(p) + C(k) s t u → = = = D(p′ ) + B(k ′ ) , (p + k)2 , (p − p′ )2 , (p − k ′ )2 , A(p1 ) + B(p2 ) → s = t = u = C(p′1 ) + D(p′2 ) , (p1 + p2 )2 , (p1 − p′1 )2 , (p1 − p′2 )2 . Offensichtlich geht unter den Ersetzungen (2.57) s → t, t → u und u → s (2.58a) und u → t. (2.58b) mit der Umkehrung s → u, t → s Die Kreuzungssymmetrie bringt somit den Vorteil, bei der Berechnung der Streuquerschnitte von gekreuzten Reaktionen viel Zeit sparen zu können. Anwendung: e− -µ− -Streuung. Durch Kreuzen, d.h. durch Ausnutzen der Kreuzungssymmetrie, kann man sich durch Permutation der Mandelstamvariablen (2.58a) die Spinsumme für die e− –µ− -Streuung im ultrarelavistischen Limes besorgen, µ− µ− : 8e4 s 2 u 2 1 X 2 . + |M| = 2 4 t 2 2 Spins e− e− Von Mf i zum Wirkungsquerschnitt. Betrachten wir wieder den ursprünglichen Prozess e+ e− → µ+ µ− . Hier ist der differentielle Wirkungsquerschnitt von Interesse. Das Matrixelement erhält man durch Einsetzen von (2.50) in (2.49) und daraus berechnet sich der differentielle Wirkungsquerschnitt nach der Formel (2.37). In der Näherung E ≫ mµ kann die vereinfachte Form (2.38) verwendet werden und man erhält dσ α2 2 = (2.59) 2 (1 + cos ϑ) dΩ 4ECM mit ECM = 2E. Interpretation des Ergebnisses. Zunächst erinnern wir uns daran, dass der Wirkungsquerschnitt die Dimension einer Fläche hat. Für grosse Schwerpunktenergien ist ECM die 2 einzige relevante dimensionsbehaftete Größe; wir hätten also die 1/ECM -Abhängigkeit aus der Dimensionsanalyse erschliessen können. Die ϑ-Abhängigkeit hat ebenfalls eine einfache Interpretation. Für ϑ = 90◦ ist der Wirkungsquerschnitt unterdrückt. Das lässt sich mit der Forderung nach Helizitätserhaltung plausibel machen (siehe [3, S. 131 ff.] für eine Diskussion des polarisierten Wirkungsquerschnitts). 2 STREUTHEORIE (ii) 40 Møller-Streuung Betrachte die Streuung von Elektronen an Elektronen, e− (p1 ) + e− (p2 ) → e− (p′1 ) + e− (p′2 ) . In niedrigster Ordnung tragen zwei Diagramme bei, p′2 p′2 p2 p2 − q=p1 −p′1 . q=p1 −p′2 p1 p1 p′1 p′1 Das relative Vorzeichen −“ kommt von den Antikommutations-Eigenschaften der fermio” nischen Felder; es bewirkt, dass die Matrix Mf i antisymmetrisch unter dem Austausch der beiden Elektronen, d.h. antisymmetrisch unter p′1 ↔ p′2 , ist. Das Übergangsmatrixelement Mf i ist gegeben durch 1 2 Mf i = e u(p′1 ) γµ u(p1 ) u(p′2 ) γ µ u(p2 ) (p1 − p′1 )2 + i ε 1 ′ ′ µ u(p1 ) γ u(p2 ) . (2.60) − u(p2 ) γµ u(p1 ) (p1 − p′2 )2 + i ε Die zweite Zeile geht aus der ersten durch die Vertauschung (p′1 ↔ p′2 ) hervor. Bildung des Betragsquadrats und Spinsummation wie in (2.46) führt auf drei Terme, die wir wie folgt bezeichnen wollen: II I 1 X 2 + |Mf i | = 2 2 4 ′ 2 4e [(p1 − p1 ) + i ε] [(p1 − p′2 )2 + i ε] Spins + III . [(p1 − p′1 )2 + i ε] [(p1 − p′2 )2 + i ε] (2.61) Man erhält (mit m = me ) I = II III = = ′ µ ′ ν tr [(p 1 + m) γµ (p 1 + m) γν ] tr [(p 2 + m) γ (p 2 + m) γ ] , I mit (p′1 ↔ p′2 ) , ′ µ ν ′ − tr [γµ (p 1 + m) γν (p 2 + m) γ (p 2 + m) γ (p 1 + m)] + (p′1 ↔ p′2 ) . (2.62a) (2.62b) (2.62c) Die Spuren können wieder mit den Methoden in Anhang D ausgewertet werden, ′ tr [γν (p 1 + m) γµ (p 1 + m)] 4 [(p1 )ν (p′1 )µ − ηνµ p1 · p′1 + (p1 )µ (p′1 )ν + m2 ηµν , ′ µ ′ tr [γµ (p γ ν (p 1 + m) γν (p 2 + m) γ (p 2 + m) 1 + m)] = −32 (p1 · p2 )2 − 2m2 p1 · p2 . = (2.63) (2.64) 2 STREUTHEORIE 41 Durch Zusammenzählen erhalten wir ( (p1 · p2 )2 + (p1 · p′2 )2 + 2m2 (p1 · p′2 − p1 · p2 ) 1 X 2 |Mf i | = 8 2 4 4e [(p1 − p′1 )2 ] Spins (p1 · p2 )2 − 2m2 p1 · p2 + (p′1 ↔ p′2 ) + 2 ′ , (p1 − p1 )2 (p′2 − p1 )2 (2.65) wobei die i ε Terme“ weggelassen wurden. Durch Rechnung ergibt sich der Streuquer” schnitt α2 dσ = (s − 2m2 )2 (t2 + u2 ) + u t (−4m2 s + 12m4 + u t) . dΩ s t2 u 2 (2.66) Hierbei haben wir die Mandelstam-Variablen verwendet, s t u = (p1 + p2 )2 = 2m2 + 2p1 · p2 , = (p1 − = (p1 − p′1 )2 p′2 )2 2 = 2m − 2p1 · = 2m2 − 2p1 · p′1 p′2 (2.67a) , (2.67b) (2.67c) = t|p′1 ↔p′2 . p~1′ Im Schwerpunktsystem hat man s = 4 E2 , t u = −4 (E 2 − m2 ) sin2 ϑ/2 , = −4 (E 2 − m2 ) cos2 ϑ/2 . p~1 • ϑ p~2 Dabei ist ϑ der Winkel zwischen den einlaufenden und auslaufenden Teilchen. Im Schwerpunktsystem erhält man für den Streup~2′ querschnitt die Møllersche Formel 4 α2 (2E 2 − m2 )2 4 dσ 3 (E 2 − m2 )2 1+ = − + . (2.68) dΩ 4E 2 (E 2 − m2 )2 sin4 ϑ sin2 ϑ (2E 2 − m2 )2 sin2 ϑ Man kann die Formel im ultrarelativistischen Grenzfall auch durch Mandelstamvariablen ausdrücken, indem man von (2.65) ausgeht, α 2 s2 + u2 2s2 s 2 + t2 dσ . (2.69) = + + dΩ 2s t2 ut u2 Verwendet man die Formeln t u = −s sin2 ϑ/2 , = −s cos2 ϑ/2 , mit dem Ablenkwinkel ϑ im Schwerpunktsystem, so kann man den Streuquerschnitt auch folgendermaßen aufspalten: dσ α2 n 1 + cos4 ϑ/2 2 1 + sin4 ϑ/2 o . = + + dΩ 8E 2 cos4 ϑ/2 sin4 ϑ/2 sin2 ϑ/2 cos2 ϑ/2 {z } {z } | {z } | | direkter Beitrag InterferenzTerm AustauschBeitrag. (2.70) 2 STREUTHEORIE 42 Die etwas naive Interpretation der einzelnen Terme ist in der folgenden Skizze dargestellt: ϑ ϑ direkt“ Austausch“ ” ” Selbstverständlich kann auf dem Quantenniveau, auf dem die beiden Elektronen im Endzustand ununterscheidbar sind, nicht zwischen den verschiedenen ‘Trajektorien’ unterschieden werden. dσ nicht von s abhängt. Dies kann man einsehen, inDes Weiteren sehen wir, dass s dΩ dem man bemerkt, dass die einzige einheitenbehaftete Größe im ultrarelativistischen Limes die (Schwerpunkt-)Energie der Elektronen ist (die Masse wurde ja vernachlässigt). dσ Die einheitenlose Größe s dΩ kann nur von Quotienten von einheitenbehafteten Größen abhängen, und somit ergibt sich im Fall von nur einer einheitenbehafteten Größe eine triviale Abhängigkeit. Gäbe es eine weitere einheitenbehaftet Größe in dem Problem, etwa eine “Ausdehnung” von Elektronen, würde man ein anderes Verhalten erwarten. Wir werden später sehen, dass sich auch aufgrund von Quanteneffekten ein unterschiedliches Verhalten ergibt. dσ dΩ Ausserdem weist der Wirkungsquerschnitt in Abhängigkeit von ϑ eine Achsensymmetrie bzgl. des Winkels ϑ = 90◦ auf. Das ist eine offenϑ | sichtliche Konsequenz der Symmetrien des Problems. 90◦ (iii) Bhabha-Streuung Betrachte nun die Streuung von Elektronen an Positronen, e− (p1 ) + e+ (p2 ) → e− (p′1 ) + e+ (p′2 ) . In niedrigster Ordnung tragen wieder zwei Diagramme bei, p′2 p′2 p2 p2 q=p1 +p2 − p1 . q=p1 −p′1 p1 p′1 p′1 Nach Rechnung ergibt sich für den Streuquerschnitt im Schwerpunktsystem die längliche Formel von Bhabha, die wir uns hier sparen. Im ultrarelativistischen Limes wird der Vorteil der Mandelstam-Variablen offenkundig: Durch die Vertauschung (2.58b), d.h. s → u, u → t 2 STREUTHEORIE 43 und t → s, für das Betrags-Quadrat des Matrixelements kann man den Streuquerschnitt aus der Møllerschen Formel gewinnen, 2u2 α 2 s2 + u2 u 2 + t2 dσ . (2.71) + = + dΩ 2s t2 st s2 Man beachte, dass der Vorfaktor 1/s aus der Relation zwischen dem Betrags-Quadrat des Matrixelements und dem differentiellen Strequerschnitt kommt (vgl. Gleichungen (2.38) und (2.37) ). Im Schwerpunktsystem wird dies zu 1 + cos4 ϑ/2 α2 cos4 ϑ/2 1 dσ 2 = −2 2 + (1 + cos ϑ) , dΩ 8E 2 σ 4 ϑ/2 2 sin ϑ/2 im nichtrelativistischen Limes erhält man dσ 1 α2 = dΩ m2 16 v 4 sin4 ϑ/2 mit der Relativgeschwindigkeit v. Die ϑ-Abhängigkeit ist wie beim Rutherford-Streuquerschnitt, der in der Quantenmechanik II Vorlesung diskutiert wurde. (iv) Compton-Streuung Die elastische Streuung eines Elektrons an einem Photon heißt Compton-Streuung. Wir betrachten also γ(k) + e− (p) → γ(k ′ ) + e− (p′ ) . In niedrigster Ordnung gibt es zwei relevante Diagramme, ε′ ε ε k′ ε′ k′ k k q=p+k + p p p′ q=p−k′ p′ Für den Wirkungsquerschnitt (vgl. Übungen) im Ruhessystem des Elektrons im Anfangszustand ergibt sich nach Rechnung die Klein-Nishina-Formel , ′ 2 ′ dσ ω α2 ω ω ′ 2 · + 4 (ε · ε ) − 2 . (2.72) = + dΩ 2m2 ω ω ω′ Dabei ist ε bzw. ε′ der Polarisationsvektor des Photons im Anfangs- bzw. Endzustand; m ist die Masse des Elektrons. Bei diesem Streuquerschnitt wurde also nicht über die Photonenspins – wohl aber über die Elektronenspins – gemittelt. 2 STREUTHEORIE 44 ~k ′ Man kann auch über die Spins der Photonen gemittelten Streuquerschnitt angeben, 2 ′ dσ α2 ω ′ ω ω 2 · = + ′ − sin ϑ . dΩ 2m2 ω ω ω ~k ϑ • Dabei ist ϑ der Ablenkwinkel des Photons im Ruhesystem des einlaufenden Elektrons. (v) ~p ′ Paarvernichtung Die Annihilation eines Elektrons und eines Positrons in zwei Photonen4 wird als Paarvernichtung bezeichnet: e− (p) + e+ (p′ ) → γ(k) + γ(k ′ ) . In niedrigster Ordnung tragen zwei Diagramme bei, k′ ε′ ε′ k′ p′ p′ + q=p−k . q=p−k′ p p k k ε ε Dieser Prozess ergibt sich also durch Kreuzen aus der Compton-Streuung. Für den Wirkungsquerschnitt ergibt sich nach Rechnung ′ dσ α2 (m + E ′ ) ω ω ′ 2 = · + ′ − 4(ε · ε ) + 2 . (2.73) dΩ 8|~ p ′ | (m + E ′ − |~ p ′ | cos ϑ)2 ω ω Dabei ist ε bzw. ε′ der Polarisationsvektor des Photons mit Impuls k bzw. k ′ . m ist die Masse des Elektrons. E ist die Energie des Positrons und schließlich ϑ der Winkel zwischen den Impulsen des Positrons und eines der Photonen im Ruhesystem des Elektrons. Für grosse Energien hat man α2 1 + cos2 ϑ dσ = . dΩ s sin2 ϑ 4 Annihilation ~k ~′ p ϑ • ~k ′ in ein Photon ist aus Gründen der Energie-Impulserhaltung nicht möglich. (2.74) 3 NICHT-ABELSCHE EICHTHEORIEN 3 45 Nicht-abelsche Eichtheorien Wir hatten gesehen, dass die QED eine Eichtheorie basierend auf einer U(1) Symmetrie ist. In diesem Abschnitt befassen wir uns mit Eichtheorien, die auf etwas reichhaltigeren Eichgruppen G basieren. Die wesentliche Neuerung dabei ist, dass die Gruppen-Elemente g ∈ G nicht kommutieren; man spricht von nicht-abelschen Gruppen. 3.1 Grundlegende Eigenschaften von Lie-Gruppen Gruppe. Eine Menge G mit einer Verknüpfung m heißt Gruppe, falls folgende Axiome erfüllt sind: (i) Die Operation m, genannt Multiplikation, erfüllt m : g, h 7→ m(g, h) = g · h ∈ G (3.1) für alle g, h ∈ G. (ii) Assoziativität: g1 · (g2 · g3 ) = (g1 · g2 ) · g3 (3.2) für alle g1 , g2 , g3 ∈ G. (iii) Existenz des neutralen Elements e mit g·e = e·g = g (3.3) für alle g ∈ G. (iv) Existenz des inversen Elements, d.h. für alle g ∈ G existiert ein g −1 ∈ G mit g · g −1 = g −1 · g = e . (3.4) Lie-Gruppe. Lie-Gruppen sind ‘kontinuierliche’ Gruppen, d.h. Gruppen, bei denen die Gruppenelemente durch kontinuierliche Variablen parametrisiert werden können, G ∋ g = g(θ1 , . . . θd ) , θa ∈ R . (3.5) Mit anderen Worten, eine Lie-Gruppe ist eine Mannigfaltigkeit mit Gruppenstruktur. Ohne Beschränkung der Allgemeinheit kann die Parametrisierung so gewählt werden, dass g(0) = e = 1. Beispiel. Betrachte z.B. die Drehungen in der Ebene, ′ x x cos θ x = D(θ) = 7→ y′ y y − sin θ sin θ cos θ x · . y (3.6) Die Hintereinanderausführung entspricht der (Matrix-)Multiplikation; damit bilden die D(θ) eine Gruppe. Dabei dient θ als Parameter bzw. als Koordinate“. ” 3 NICHT-ABELSCHE EICHTHEORIEN 46 Lie-Algebra und Generatoren. Zu jeder Lie-Gruppe G gehört eine Lie-Algebra g, deren Generatoren den Tangentialraum der Lie-Gruppe am Ursprung aufspannen, ∂g(θ1 , . . . , θd ) Xa = . (3.7) ∂θa θ1 =···=θd =0 Die Gruppen-Elemente der Lie-Gruppe G, die in der gleichen Zusammmenhangs-Komponente wie das Einheitselement liegen, gehen durch die Exponential-Abbildung aus den Generatoren hervor, g(θ) = exp (θa Xa ) . (3.8) In der Physik werden die Generatoren Xa üblicherweise reskaliert und mit i-Faktoren verziert, d.h. g(θ) = exp (i θa Ta ) . (3.9) Wir werden im Folgenden mit den Generatoren Ta arbeiten, die der Normierung tr(Ta Tb ) ∝ δab (3.10) genügen. Lie-Gruppen-Homomorphismus. Ein Lie-Gruppen-Homomorphismus zwischen zwei Lie-Gruppen G und H ist eine analytische Abbildung f : G → H mit f (g1 · g2 ) = f (g1 ) · f (g2 ) ∀ g1 , g2 ∈ G . (3.11) Matrixdarstellung. Sei n ∈ N. H bezeichne die Gruppe GL(n, R) bzw. GL(n, C). Ein Lie-Gruppen-Homomorphismus f : G → H heißt n-dimensionale Darstellung der LieGruppe G über dem Darstellungsraum Rn bzw. Cn . Die Multiplikation in H ist dabei die Hintereinanderausführung; sie entspricht also der Matrixmultiplikation. Notation.“ Die Generatoren bzw. Gruppenelemente und ihre Darstellungs-Matrizen ” werden synonym verwendet. Strukturkonstanten. Eine grundlegende Eigenschaft von Lie-Algebren ist, dass sich der Kommutator (oder die Lie-Klammer) zweier Generatoren als Linearkomination der Generatoren schreiben läßt, d.h. [Ta , Tb ] = linear in T . Die Strukturkonstanten sind dann über c [Ta , Tb ] = i fab Tc (3.12) definiert; dabei wird jetzt wie im Folgenden über zweifach auftretende Indizes a, b, c, . . . c von 1 bis d summiert. Die Strukturkonstanten fab sind offensichtlich antisymmetrisch in a und b; sie erfüllen darüber hinaus die Jacobi-Identität c e c e c e fab fcd + fda fcb + fbd fca = 0. (3.13) 3 NICHT-ABELSCHE EICHTHEORIEN Gruppentheoretische Konstanten. spielen oft eine wichtige Rolle: X c1 (G) δ ab := f acd f b cd , 47 Die folgenden gruppentheoretischen Konstanten (3.14a) c,d c2 (R) δij := X (Ta Ta )ij , (3.14b) a ℓ(R) δ ab := tr(Ta Tb ) , (3.14c) wo ℓ(R) Dynkin-Index der irreduziblen Darstellung R und c2 (R) Quadratischer Casimir(Operator) heißen. R bezieht sich dabei auf die Darstellung, in der die Generator(matriz)en angegeben werden, (3.14c) kann auch als Normierungsbedingung für die Generatoren verstanden werden. Diese beiden Invarianten stehen miteinander in Beziehung, c2 (R) = dim G ℓ(R) , dim R (3.15) mit den Dimensionen dim G bzw. dim R der Gruppe bzw. der Darstellung. Die Dimension der Gruppe dim G ist dabei definiert als die Anzahl der Generatoren; wir sehen an (3.9), dass dies die Zahl der unabhängigen Parameter θa liefert. Beispiel: SO(3) und SU(2). Wie bereits erwähnt, läßt sich die (abstrakte) Drehgruppe durch SO(3) Matrizen darstellen. Diese hat drei Parameter, etwa die drei Euler-Winkel, und entsprechend drei Generatoren. Die Matrizen wirken auf Vektoren im R3 . Die Dimension der fundamentalen (oder auch definierenden) Darstellung der SO(3) ist also 3. Aus der Quantenmechanik ist bekannt, dass es weitere Objekte gibt, die unter räumlichen Rotationen nicht-trivial transformieren – die Spinoren. Die Transformation erfolgt mit SU(2)-Matrizen und die Spinoren sind (in drei räumlichen Dimensionen) 2-komponentige Objekte; entsprechend ist die Dimension der fundamentalen Darstellung 2. Die Dimension der SU(2) ist jedoch 3, wie wir nun explizit verifizieren werden. SO(3) und SU(2) sind bis auf Überlagerungseigenschaften, die etwa bewirken, dass ein Spinor nur nach einer Rotation um 4π in sich selbst übergeht, identisch. SU(N ). In dieser Vorlesung werden vor Allem die SU(N )-Gruppen relevant sein. Ist insbesondere G = SU(N ), so sind die Generatoren Ta spurfrei und hermitesch; des Weiteren ist d = dim SU(N ) = N 2 − 1. Dies sieht man folgendermassen ein: Für U = U (θ1 , . . . θd ) ∈ SU(N ) weiss man, dass U unitär ist und det U = 1. Aus der ersten Eigenschaft folgt U †U = = = † [exp(i θa Ta )] · exp(i θa Ta ) [ 1 + i θ a Ta + . . . ] · [ 1 + i θ a Ta + . . . ] 1 + i θa Ta − T†a =! 1 . † (3.16) Da das für alle θa gelten soll, muss Ta = T†a (3.17) sein. An der Relation det exp(i θa Ta ) = exp [tr(i θa Ta )] , (3.18) sieht man, dass die Spur der Ta verschwinden muss. Damit können wir uns die Dimension d der Lie-Gruppe bzw. Lie-Algebra bestimmen. Ursprünglich hatten wir 2N 2 komplexe 3 NICHT-ABELSCHE EICHTHEORIEN 48 N ×N -Matrizen; die Forderung der Hermitezität liefert N 2 Relationen und die Spurfreiheit eine weitere Relation, so dass dim SU(N ) = N 2 − 1 . (3.19) Häufig wird die Konvention verwendet, in der die Generatoren der irreduziblen Darstellung N von SU(N ) so normiert sind, dass ℓ(N ) = 21 . Für SU(N ) Gruppen gilt N2 − 1 . 2N c2 (N ) = (3.20) Beispiel: SU(2) und Pauli-Matrizen. Speziell für die SU(2) wählt man in der Physik für die Generatoren bis auf einen Faktor 1/2 die Pauli-Matrizen, Ta = σa . 2 Beispiel: SU(3) und Gell-Mann-Matrizen. Für die Generatoren der SU(3) (als Matrix-Gruppe) verwendet man häufig die sog. Gell-Mann-Matrizen; genauer gesagt wählt man als Generatoren Ta = λa /2 , wobei λ1 = λ4 = λ6 0 1 0 0 0 1 0 0 0 = (3.21) 1 0 0 0 , 0 0 0 1 0 0 , 0 0 0 0 0 1 , 1 0 λ2 λ5 λ7 0 = i 0 0 = 0 i 0 = 0 0 −i 0 0 0 0 0 0 0 i 0 0 , 0 −i 0 , 0 0 −i , 0 λ3 λ8 1 = 0 0 0 0 −1 0 , 0 0 1 1 = √ 0 3 0 0 0 1 0 . 0 −2 (3.22) Diese Matrizen erfüllen tr(λa λb ) = 2 δ ab und für die Strukturkonstanten gilt λa λb c λc , fab = −i tr 2 2 i = − tr (λa λb λc − λb λa λc ) . 4 Die nichtverschwindenden Strukturkonstanten sind (bis auf Permutationen) f 123 = = 2 f 147 = 2 f 246 = 2 f 257 = 2 f 345 = − 2 f 156 2 2 −2 f 367 = √ f 458 = √ f 678 = 1 . 3 3 (3.23) (3.24) 3 NICHT-ABELSCHE EICHTHEORIEN 3.2 49 Yang-Mills-Theorie Es wird nun diskutiert, wie die abelsche Eichtheorie auf nicht-abelsche Symmetriegruppen verallgemeinert werden kann. Der Ausgangspunkt ist wieder ein (Fermion-)Feld Ψ1 (x) .. Ψ(x) = (3.25) , . ΨN (x) wo die Ψi für 4-komponentige Dirac-Felder stehen. Lokale SU(N )-Transformation bzw. SU(N )-Eichtransformation. Transformation bzw. SU(N ) Eichtransformation definiert man Als lokale SU(N ) Ψ(x) → U (x) Ψ(x) , (3.26) U (x) = exp {i θa (x) Ta } (3.27) wo für jedes x ein Gruppenelement der nicht-abelschen Gruppe SU(N ) (N ≥ 2) ist. In diesem Fall sagt man, Ψ transformiere als N -dimensionale oder fundamentale Darstellung unter der SU(N ), oder einfach als N -plett. Betrachte zunächst die Lagrangedichte für freie Fermionen, L0 = Ψ(x) {i γ µ ∂µ − m} Ψ(x) = N X i=1 Ψi (x) {i γ µ ∂µ − m} Ψi (x) (3.28) mit Ψ wie in (3.25). L0 ist nicht invariant unter G, d.h. L0 ist nicht invariant unter den Eichtransformationen Ψ(x) Ψ(x) → → U (x) Ψ(x) , Ψ(x) U † (x) . (3.29a) (3.29b) Ähnlich wie im abelschen Fall ist L0 invariant unter globalen Transformationen, d.h. U (x) = U0 . Ziel ist es nun, eine Lagrangedichte zu konstruieren, die invariant unter lokalen Transformationen U (x) ist. In Analogie zum abelschen Fall führt man d Eichbosonenfelder Aa mit Komponenten a Aµ (x) ein. Mit diesen Feldern konstruiert man die eichkovariante Ableitung Dµ = 1N ∂µ − i g Aaµ (x) Ta . (3.30) Man beachte, dass im Gegensatz zum abelschen Fall hier die kovariante Ableitung eine nicht-triviale Matrix-Struktur aufweist. Im nächsten Schritt setzt man als Yang-MillsLagrangedichte 1 a µν µ LYM g = Ψ(x) {i γ Dµ − m} Ψ(x) − Fµν (x)Fa (x) 4 (3.31) 3 NICHT-ABELSCHE EICHTHEORIEN 50 mit dem Feldstärketensor a Fµν = ∂µ Aaν − ∂ν Aaµ + g f a bc Abµ Acν (3.32) a [Dµ , Dν ] = − i g Fµν Ta . (3.33) bzw. Nun muß noch das Transformationsverhalten der Eichbosonenfelder festgelegt werden. Wir wollen erreichen, dass für die transformierten Fermionfelder Ψ′ (x) = U (x) Ψ(x) und die transformierten Eichbosonenfelder gilt (Dµ Ψ)′ = ∂µ Ψ′ − i g A′µ a Ta Ψ′ = U ∂µ Ψ + (∂µ U ) Ψ − i g A′µ a Ta U Ψ = U Dµ Ψ . ! Der Term, der Probleme bereitet, ist (∂µ U ) Ψ. Er kann beseitigt werden, indem man i A′µ a Ta = − (∂µ U ) U † + U Aaµ Ta U † g (3.34) setzt. Benutzt man noch, dass 0 = ∂µ (U U † ) y (∂µ U ) U † = − U (∂µ U † ) , so kann man das gewünschte Transformationsverhalten von Dµ ψ erreichen durch die Forderung, dass die Eichbosonenfelder sich unter Eichtransformationen folgendermaßen verhalten sollen, Aaµ (x) Ta i a → U (x) Aµ (x) Ta + ∂µ U † (x) . g (3.35) Diese Gleichung impliziert insbesondere, dass unter einer globalen Transformation U0 Ta → U0 Ta U0† . (3.36) Zum Transformationsverhalten der Generatoren und Gruppenelemente. Die Gruppenelemente und Generatoren transformieren in der sog. adjungierten Darstellung. e := U e Ψ mit U e ∈ SU(N ). Man hat Betrachte z.B. ein Feld Ψ e → Ψ e′ = U Ψ e = UU eΨ. Ψ (3.37) eΨ → U e ′ Ψ′ = U e′ U Ψ U (3.38) e → U e′ = U U e U† . U (3.39) e auffassen, d.h. aus Man kann das nun als Transformation von U schliesst man, dass 3 NICHT-ABELSCHE EICHTHEORIEN 51 Das ist das Transformationsverhalten in der adjungierten Darstellung. Für beliebige Gruppen ist die adjungierte Darstellung definiert durch g G ∋ h − → g · h · g −1 . (3.40) Aus der Identität U exp(i θa Ta ) U † = exp i θa U Ta U † (3.41) sieht man weiterhin, dass die Ta ebenfalls in der adjungierten Darstellung transformieren, Ta → U Ta U † . Schreibweise. Aµ (x) Fµν (x) := := (3.42) Abkürzend setzt man Aaµ (x) Ta , a Fµν (x) Ta . (3.43a) (3.43b) Mit dieser Notation lautet die Yang-Mills-Lagrangedichte (3.31) klass LYM = Ψ (i γµ Dµ − m) Ψ − 1 tr (Fµν F µν ) . 2 (3.44) Dabei haben wir verwendet, dass tr(Ta Tb ) = 12 δ ab in unserer Konvention. Die eichkovariante Ableitung schreibt sich einfach als Dµ = ∂µ − i g Aµ . (3.45) Durch Zusammenzählen läßt sich zeigen, dass a Fµν = Fµν Ta → U Fµν U † (3.46) und dass somit die Lagrangedichte (3.44) invariant ist unter der lokalen nicht-abelschen Eichtransformation (3.26) bzw. (3.35). 3.3 Klassische Bewegungsgleichungen der Yang-Mills-Theorie Es sollen nun Yang-Mills-Theorien auf dem klassischen Niveau diskutiert werden. Dazu erarbeitet man sich die Euler-Lagrange-Gleichungen für die Yang-Mills-Lagrangedichte (3.31). Für das Fermion-Feld ergibt sich einfach die Dirac-Gleichung mit eichkovarianter Ableitung (i γ µ Dµ − m) Ψ(x) = 0 . (3.47) Dabei ist zu beachten, dass Ψ ein N -plett ist und Dµ einen nicht-triviale Matrix-Struktur im SU(N ) Darstellungs-Raum besitzt. Zusätzlich treten noch die Felder der Eichbosonen auf, a c ∂ µ Fµν (x) + g f a bc Aµ b (x) Fµν = − g jνa (x) (3.48) mit den Noetherströmen der Fermionen jνa (x) = Ψ(x) γν Ta Ψ(x) . (3.49) 3 NICHT-ABELSCHE EICHTHEORIEN 52 Diese Strömen folgen aus den d globalen Symmetrien, entsprechend den d Generatoren. Gemäß dem Noether’schen Theorem genügen die j a den Kontinuitätsgleichungen ∂µ j µ a (x) = 0 . (3.50) In der zuvor eingeführten kompakten Notation bekommen die Bewegungsgleichungen (3.47) und (3.48) die Gestalt (i γ µ Dµ − m) Ψ(x) = 0 (3.51) [Dµ , Fµν ] = − g jν , (3.52) und wobei in Analogie zu (3.43) jν = jνa Ta gesetzt wird. Bemerkungen: (1) Es tritt ein neues Phänomem auf: In einer nicht-abelschen Eichtheorie gibt es Wechselwirkung zwischen den Eichbosonen. (2) Als reine“ Eichtheorie bezeichnet man die Theorie ohne Fermionfelder, d.h. mit der ” Lagrangedichte Lpure YM 1 a µν Fa . = − Fµν 4 Hier folgen die Bewegungsgleichungen: a c c ∂ µ Fµν = − g fab Aµ b (x) Fµν (x) , welche wegen der nichtverschwindenden rechten Seite die Wechselwirkung der Eichbosonen untereinander implizieren. 3.4 Fadeev-Popov-Methode für nicht-abelsche Eichtheorien Fragestellung. Es geht darum, die Pfadintegralquantisierung einer nicht-abelschen Eichtheorie durchzuführen. Dazu betrachten wir nur die Eichfeldtheorie, die Fermionen können später hinzugenommen werden. Ausgangspunkt ist das Funktionalintegral Z Z 1 a µν DA exp i d4 x − Fµν Fa , (3.53) 4 3 NICHT-ABELSCHE EICHTHEORIEN 53 wobei der Exponent bis auf einen Faktor i der Wirkung entspricht, Z 1 a µν Fa . S[A] = d4 x − Fµν 4 Das Eichfeld A transformiert unter Eichtransformationen gemäß i µ a µ a Aa T → U (x) Aa (x) T + ∂µ U † (x) , g (3.54) (3.55) mit U (x) = exp (i Λa (x) Ta ) . Die Theorie ist invariant unter solchen Transformationen. Insbesondere ist die Wirkung invariant unter infinitesimalen Transformationen Aµa → := Aµa (Λ1 , . . . Λd ) 1 Aµa (x) + ∂µ Λa (x) + Λc (x) f c ab Abµ (x) , g (3.56) wo d die Dimension der Lie-Gruppe ist, d.h. unter (3.56) S[A(Λ)] = S[A] . (3.57) Felder A, welche durch eine Eichtransformation auseinander hervorgehen, sind physikalisch äquivalent. Wie im abelschen Fall will man erreichen, dass das Pfadintegral sich nur über die Anteile der Felder erstreckt, die nicht durch eine Eichtransformation mit anderen Feldern in Beziehung stehen. Wir suchen also ein Pfadintegral Z DA , das sich nur über eich-inäquivalente Feldkonfigurationen erstreckt. Eichfixierung. Die Vorgehensweise ist dieselbe wie bei der abelschen Theorie. Eine Eichung wird fixiert durch die d Bedingungen ! F a A(Λ) = ∂ µ Aaµ (Λ) − ω a = 0 . Damit ergibt sich analog zu (1.48) Z Z Z[J] = ∆FP DA exp i d4 x Lpure (3.58) YM + Jµa Aµa · δ(∂ µ A1µ − ω 1 ) · · · δ(∂ µ Adµ − ω d ) . (3.59) Die Abhängigkeit von den beliebigen Funktionen ω a beseitigt man analog zu (1.49) durch Pfadintegration mit Gauss-förmiger Gewichtsfunktion. Der wesentliche Unterschied ergibt sich bei der Auswertung der Faddeev-Popov-Determinante, a d Y δF A(Λ) , (3.60) det ∆FP = δΛ a=1 denn hier ist das Verhalten von A unter der Eichtransformation durch (3.35) gegeben. Fordern wir die verallgemeinerte Lorentz-Bedingung (3.58) und setzen die infinitesimale Transformation (3.56) ein, so folgt nach Rechnung δF a A(Λ) 1 = δba ∂ µ ∂µ + ∂ µ Acµ f a cb . b δΛ g (3.61) 3 NICHT-ABELSCHE EICHTHEORIEN 54 Damit wiederum ergibt sich die Faddeev-Popov-Determinante zu Z Z 1 ∆FP = Dη Dη exp i d4 x η a − δba ∂ µ ∂µ + ∂ µ Acµ f a bc η b . g (3.62) Um den üblichen kinetischen Term zu erhalten, muss man die Felder η und η reskalieren, √ √ η → g η und η → g η . Diese Reskalierung kann in der Normierung des Pfadintegrals absorbiert werden. Fazit: Das erzeugende Funktional kann geschrieben werden in der Form Z[J] = Z DA Z Z Dη Dη ( Z " 1 1 X 4 exp i d x − tr (Fµν F µν ) + Jµa Aµa − (∂µ Aµa )2 2 2ξ a + η a (−δba ∂ µ ∂µ + g ∂ µ Acµ f a bc ) η b . (3.63) Der Eich-Fixierungsterm ist hat die selbe Form wie im abelschen Fall. Fixiert man die Eichung durch eine spezifische Wahl von ξ spricht man auch von den Rξ -Eichung. Wie zuvor kann die Faddeev-Popov-Determinante als Pfadintegral über a-Zahl-wertige Skalarfelder geschrieben werden. Der wesentliche Unterschied zur abelschen Theorie ist jedoch, dass die Geistfelder η und η an die Eichfelder koppeln, d.h. es gibt eine neue Wechselwirkungen und ein zusätzliches propagierendes Feld. Die Geist-Felder η und η repräsentieren keine physikalischen Freiheitsgrade, sondern sind Hilfsfelder . Insbesondere tauchen diese nicht in Anfangs- oder Endzuständen auf, was sich auch darin äussert, das Z keine Quellen für η und η aufweist.5 Andererseits werden wir später sehen, dass nur durch die Geist-Beiträge die Übergangswahrscheinlichkeiten eichinvariant werden. 3.5 Feynman-Regeln Mit den üblichen Funktionalmethoden erhält man die folgenden Feynman-Regeln: (1) Fermion-Eichboson-Vertex: i µ, a : i g γµ (Ta )ij j 5 Um die Störungsentwicklung durchzuführen, kann man entsprechende Quellen als Rechentrick“ ” einführen. 3 NICHT-ABELSCHE EICHTHEORIEN 55 (2) Eichbosonen-Dreier-Vertex: ν, c k p λ, a : q g f abc [(k − q)λ ηµν + (q − p)ν ηλµ + (p − k)µ ηνλ ] µ, b (3) Eichbosonen-Vierer-Vertex: ρ, c σ, d abe cd µρ νσ 2 µσ νρ −i g f fe (η η − η η ) ace bd µν ρσ + f fe (η η − η µσ η νρ ) + f ade febc (η µν η σρ − η µσ η νρ ) : µ, a ν, b (4) Eichboson-Geist-Vertex: b µ, c : g fabc pµ p a (5) Fermion-Propagator (fundamentale Darstellung): j i p i δ ij p − m + iε : (6) Eich-Propagator: k µ, a ν, b : (7) Geist-Propagator: b q a : i δ ab q2 + i ε −i δ ab kµ kν µν η − 2 (1 − ξ) k2 + i ε k 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS 4 4.1 56 Aspekte des Renormierungs-Programms Fragestellung In der QED gibt es Schleifendiagramme, z.B. die Strahlungskorrekturen aus Abb. 1. γ γ γ (a) Vakuumpolarisation. γ γ (b) Selbstenergie. (c) Vertex-Korrektur. Abbildung 1: Beispiele für Schleifendiagramme in der QED. Die Frage ist nun, was die Implikationen dieser Strahlungskorrekturen sind. Diese Frage zu beantworten ist mit erheblichem technischen Aufwand verbunden, der in großem Detail in der parallel stattfindenden Vorlesung QFT 2“ behandelt wird. In dieser Vorlesung ” konzentrieren wir uns auf die physikalischen Implikationen. Wir werden sehen, dass die entsprechenden analytischen Ausdrücke (formal) divergieren. In diesem Abschnitt werden wir die Divergenzen wegdiskutieren und die physikalischen Implikationen der Strahlungskorrekturen diskutieren. 4.2 Effektive Kopplungsstärke Vakuum-Polarisation. Als Polarisationstensor bezeichnet man γ µ γ q ν µν i Π (k) = q−k k k amputiert“ ” Z 4 d q i (q − k + m) i (q + m) µ ν = − . tr (−i e γ ) (−i e γ ) 2 (2π)4 (q − k)2 − m2 + i ε q − m2 + i ε (4.1) Hierbei betrachten wir das amputierte Diagramm, d.h. die analytischen Ausdrücke für die Teilchen im Anfangs- bzw. Endzustand werden weggelassen. Des Weiteren lassen wir beliebige, d.h. auch off-shell“ Werte, für k zu, wir fordern also nicht, dass k 2 = 0. Später ” werden wir den Polarisationstensor in Diagramme einbauen, in denen ein Photon ausgetauscht wird, das eben nicht on-shell“ ist, d.h. nicht k 2 = 0 erfüllt. In dem betrachteten ” Fall entspricht Πµν (k) bis auf die Polarisationsvektoren der ein- bzw. auslaufenden Photonen dieser der Übergangsamplitude für die “Vakuumspolarisation”, µν Mf i = ε(i) (εν(f ) )∗ . µ · iΠ Dieser Ausdruck für den Polarisationstensor ist so, wie er in (4.1) angegeben ist, nicht wohldefiniert, denn das Integral konvergiert nicht. Wie wir später sehen werden, divergiert es quadratisch. Wir formen nun den Polarisationstensor µ Z γ (q − k + m) γ ν (q + m) d4 q µν 2 , (4.2) tr Π (k) = i e (2π)4 (q 2 − m2 ) [(q − k)2 − m2 ] bei dem bereits die i ε-Terme im Nenner bereits weggelassen wurden, weiter um. 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS Feynman-Parametrisierung. ff.]) 1 = ab Z1 57 Mit der Feynman-Parametrisierung (siehe z.B. [3, S. 189 1 [a x + b (1 − x)]2 dx 0 (4.3) wird mit a = (q − k)2 − m2 b = q 2 − m2 und und der Substitution p = q −kx der Nenner symmetrischer, Πµν (k) = i e2 Z tr d4 p (2π)4 Z1 dx 0 ν γ µ (p − k (1 − x) + m) γ (p + k x + m) 2 2 2 [p − m + k x (1 − x)]2 . (4.4) Nach einigen Umformungen (siehe Übung) wird daraus: Πµν (k) = i e2 4 Z1 dx 0 − Z d4 p (2π)4 [p2 − m2 2 pµ pν + k 2 x (1 − x)]2 2x (1 − x) [k µ k ν − η µν k 2 ] η µν − 2 2 2 2 p − m + k x (1 − x) [p − m2 + k 2 x (1 − x)]2 . (4.5) Massendimension. Als Massendimension von dimensionsbehafteten Größen bezeichnet man die die Dimension der entsprechenden Größe in Massen- bzw. Energieeinheiten, also beispielsweise in GeV. Man hat dann dim[m] = dim[E] = dim[p] = 1 und dementsprechend dim[x] = − 1 , wo m, E, p bzw. x für Massen, Energien, Impulse bzw. Raumzeit-Koordinaten stehen sollen. Die Wirkung S ist dimensionslos (weil wir in Einheiten arbeiten, in denen ~ = 1 gilt), und da Z S = d4 x L trägt die Lagrangedichte L Massendimension 4. Aus den kinetischen Termen für Skalare, Spinoren bzw. Vektoren 1 tr(Fµν F µν ) 2 liest man die Massendimensionen der Felder ab, (∂µ φ)∗ (∂ µ φ) , Ψ ∂ Ψ dim[φ] = 1 , dim[Ψ] = 3/2 bzw. bzw. dim[A] = 1 . 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS Naiver Divergenzgrad von Integralen. Z f (q 2 ) . I = d4 q 2 [q − ∆]n 58 Betrachte ein allgemeines Integral der Form Aus Dimensionsgründen muss I eine um vier höhere Massendimension als der Integrand haben. Ist die einzige massenbehaftete Größe, von der f abhängt, der Viererimpuls q, so muss I wie eine ‘neue’ Skala Λ zu der entsprechenden Potenz skalieren, I ∝ Λdim[f ]−2n+4 . Der Exponent ist dann gegeben durch 4 + Zahl der qs im Zähler − Zahl der qs im Nenner . Die Zahl 4 in dieser Formel bezeichnet die Zahl der Raumzeit-Dimensionen. Unsere Strategie wird nun sein, diese variabel zu lassen. (i) (Dimensionale) Regularisierung des Vakuum-Polarisations-Tensors Dimensionale Regularisierung. Hierbei wird die Feldtheorie in d Dimensionen untersucht, wobei sich erweisen wird, dass d 6= 4 sind die Ausdrücke endlich sind. Dann wird der Limes d → 4 gebildet. Dimensionale Analyse. Betrachte die Lagrangedichte 1 L = i Ψ γ µ ∂µ Ψ − m Ψ Ψ − e Ψ γ µ Ψ Aµ − F µν Fµν + Eichfixierung . 4 In d Dimensionen ergibt sich für die Lagrangedichte die Massendimension dim[L ] = d , denn die Wirkung Z S = dd x L ist dimensionslos. Man kann leicht die folgenden Relationen ableiten: dim[∂µ ] = 1 , dim[Aµ ] = d −1, 2 d−1 , 2 3 dim[Aµ Ψ γ µ Ψ] = d − 2 . 2 dim[Ψ] = (4.6) Damit der Wechselwirkungsterm ebenfalls die Massendimension d erhält, ersetzt man die Ladung e → e µ2−d/2 , dim[µ] = 1 . Darin ist der zusätzliche Parameter µ willkürlich, µ muss lediglich die Massendimension 1 haben. Damit lautet der Wechselwirkungsterm Lint = − e µ2−d/2 Ψ γ µ Ψ Aµ . (4.7) 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS 59 Bemerkung zur Dirac-Algebra in d Dimensionen: Im Allgemeinen konstruiert man die Dirac-Darstellung in d Dimensionen analog zu der vierdimensionalen Version. Speziell für Renormierungszwecke hat sich ein Rezept etabliert, das auf besonders wenig Komplikationen führt (das aber auch nicht wirklich die d-dimensionale Physik wiedergibt). Die Dirac-Algebra wird weiterhin von Objekten γ µ gebildet, die {γ µ , γ ν } = 2 η µν erfüllen, wobei allerdings 1 0 0 −1 η µν = 0 0 .. .. . . (4.8) hier 0 ··· 0 ··· −1 · · · .. .. . . (4.9) ist. Die Spur dieses metrischen Tensors ist ηµ µ = d , die Spur der Einheitsmatrix im Spinor-Raum ist eine Funktion von d: tr 1 = f (d) , mit f (4) = 4 . Besonders einfach werden die Ausdrücke für f (d) = 4 . Somit ist tr(γµ γν ) = f (d) ηµν (4.10) und die Spur einer ungeraden Anzahl an γ-Matrizen verschwindet. Des Weiteren gilt tr (γµ γκ γν γλ ) µ ν = γ γ γµ γ γ ν γ ρ γµ = = γ µ γ ν γ ρ γ σ γµ = µ f (d) {ηµκ ηνλ − ηµν ηκλ + ηµλ ηκν } ν (2 − d) γ , 4 η νρ − (4 − d) γ ν γ ρ , −2 γ σ γ ρ γ ν + (4 − d) γ ν γ ρ γ σ . Bemerkung zur Integration in d Dimensionen. Berechnung von Integralen der Form Z f (p2 ) Id = dd p 2 . [p − ∆]n (4.11a) (4.11b) (4.11c) (4.11d) Wir interessieren uns nun für die (4.12) Der erste Schritt ist eine sog. Wick-Rotation, d.h. wir fassen die 0-te Komponente des Vierer-Impulses p0 als komplexe Größe auf und, anstatt die p0 entlang der reellen Achse zu integrieren, integrieren wir entlang der imaginären Achse (s. Abb. 2). Das führt dann auf einen euklidischen Viererimpuls pE wobei p0 = i p0E . Damit erhalten wir für den Fall f (p2 ) = 1 Z Z 1 1 i d d p 2 d d pE 2 = (p − ∆)n (−1)n [pE + ∆]n 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS 60 Im p0 − p p~ 2 + ∆ + i ε Re p0 p 2 p~ + ∆ − i ε Abbildung 2: Wick Rotation. = i (−1) n Z Z∞ dΩd dr rd−1 . + ∆]n [r2 (4.13) 0 Im letzten Schritt haben wir r = |pE | gesetzt. Für das Oberflächenintegral kann man zeigen (vgl. Übungen), dass Z 2π d/2 dΩd = . (4.14) Γ( d2 ) Bemerkung zur Γ-Funktion. Die Γ-Funktion ist erklärt durch Z∞ dt tz−1 e−t Γ(z) = (4.15) 0 und besitzt die Eigenschaft Γ(1 + z) = z Γ(z) , (4.16) d.h. Γ ist eine ‘kontinuierliche Erweiterung der Fakultät, Γ(1 + n) = n! für n ∈ N . (4.17) Eine wesentliche Eigenschaft der Γ-Funktion ist, dass Γ(z) Pole besitzt für z = 0, −1, −2, . . . . 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS 61 Abschneiden von Integralen. Sehen wir uns nun wieder das Integral (4.12) in vier Dimensionen an. Dieses konvergiert nicht, falls n ≤ 2. Die Divergenz kommt von der rIntegration im Unendlichen, also im Bereich großer euklidischer Impulse. Man kann die Integration von Hand abschneiden“, in dem man einen Cut-Off Λ einführt, mit dem ” 2 ZΛ Z∞ d−1 rd−1 r Λ , d=4 ∧ n=1, → ∝ dr 2 dr 2 2 n n ln(Λ /∆) , d =4 ∧ n=2. [r + ∆] [r + ∆] 0 0 Im ersten Fall, d.h. für n = 1, sagt man, das Integral divergiere quadratisch (in vier Dimensionen), falls n = 2 spricht man von einer logarithmischen Divergenz. Man kann jetzt versuchen, den physikalischen Grund für das Auftreten der Divergenz zu identifizieren. Wie diskutiert ist der mathematische Grund, dass sich das Integral in (4.1) bis ∞ erstreckt. D.h. wir betrachten das Elektron und das Photon als punktförmige Teilchen bei allen Energie-Skalen. Die Divergenzen werden mit Impulsmoden assoziiert, deren Komponenten (vom Betrag her) beliebig große Einträge besitzen können. Es ist dann natürlich fraglich, ob diese Vorgehensweise sinnvoll ist. Wir könnten argumentieren, dass die Schleifenkorrekturen endlich sind, wenn man die Integration auf gewisse Bereiche im Impulsraum einschränkt. Dies stellt ein mögliches Regularisierungsverfahren dar, das unglücklicherweise nicht mit Eichtheorien harmoniert. Ausserdem hängen dann die Ergebnisse von dem Abschneide-Parameter ab. Der Königsweg“ der Regularisierung von ” Eichtheorien verläuft daher etwas anders und wird im Folgenden kurz diskutiert. Regularisierung. Da die Übergangsamplitude Mf i nicht divergieren darf, sollte es ein Verfahren geben, einen regularisierten Polarisationstensor Πµν R zu konstruieren, der die Physik richtig beschreibt. Dazu ist es nötig, die Divergenz, die in den Ausdrücken auftreten, zu isolieren. Renormierung. Das Verfahren der Renormierung, das wir im Folgenden diskutieren, erfordert einige Schritte, die zunächst möglicherweise nur schwer zu verdauen sind. Wir werden aber zum guten Schluss eine Prozedur entwickelt haben, deren Ergebnisse sehr gut mit den Experimenten übereinstimmen. Es wird sich erweisen, dass durch Umparametrisierung die Theorie endlich gemacht werden kann. Dies hat zur Folge, dass man die Werte für die Parameter Masse m, Ladung e etc. nicht als diejenigen ansehen darf, die man in die Lagrangedichte steckt. Vielmehr werden diese Parameter durch Normierungsbedingungen mit den n-Punkt-Funktionen in Verbindung gebracht; erst dadurch werden die Parameter der Lagrangedichte fixiert. Wir berechnen nun Πµν (k) in d statt 4 Dimensionen. Da nun die Kopplungsstärke Massendimension hat, ist der Vakuum-Polarisationstensor gegeben durch µ Z γ (q + m) γ ν (q − k + m) dd q µν 2 4−d , (4.18) tr Π (k) = i e µ (2π)d (q 2 − m2 ) [(q − k)2 − m2 ] wobei die i ε-Terme im Nenner bereits weggelassen wurden. Durch Verwenden der Relationen (4.10) und (4.11) wird daraus mit der FeynmanParametrisierung µν Π (k) = 2 ie µ 4−d 4 Z1 0 dx Z dd p (2π)d [p2 − m2 2 pµ pν + k 2 x (1 − x)]2 η µν 2x (1 − x) [k µ k ν − η µν k 2 ] − 2 − p − m2 + k 2 x (1 − x) [p2 − m2 + k 2 x (1 − x)]2 . (4.19) 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS 62 Die p-Integrationen lassen sich durch eine Wick-Rotation in Integrale über den euklidischen Raum umformen. Das r-Integral lässt sich weiter umformen, I Z∞ dr = rd−1 [r2 + ∆]n 0 1 2 = Z∞ (r2 )d/2−1 . d(r2 ) 2 [r + ∆]n (4.20) 0 Nun verwenden wir die Substitution y = ∆/(r2 + ∆), so dass ∆ , y r2 + ∆ = r2 = ∆ (1 − y) y und d(r2 ) = −∆ dy . y2 Damit hat man 1 I = 2 1 ∆ n−d/2 Z1 0 dy y n−1−d/2 (1 − y)d/2−1 . (4.21) Das Integral lässt sich damit auf die Euler’sche Beta-Funktion B(α, β) = Z1 0 dy y α−1 (1 − y)β−1 = Γ(α) Γ(β) Γ(α + β) zurückführen. Insgesamt erhalten wir n−d/2 Z dd p 1 i (−1)n Γ(n − d/2) 1 . = (2π)d [p2 − ∆]n Γ(n) ∆ (4π)d/2 Analoges Vorgehen liefert (vgl. Übungen) n−d/2−1 Z p2 i (−1)n d Γ(n − d/2 − 1) 1 dd p . = (2π)d [p2 − ∆]n Γ(n) ∆ (4π)d/2 2 (4.22) (4.23) (4.24) . . . zurück zum Polarisationstensor. sammenträgt, erhält man Wenn man alle gesammelten Informationen zu- Πµν (k) = (k 2 η µν − k µ k ν ) · Π(k 2 ) (4.25) mit der skalarwertigen Funktion e2 Γ(εd /2) εd −Π(k ) = µ 2π 2 (4π)−εd /2 2 Z1 0 dx x (1 − x) . [m2 − k 2 x (1 − x)]εd /2 (4.26) Hierbei ist εd = 4 − d . Wir sehen, dass der Ausdruck (nach wie vor) für d → 4 divergiert. Die Divergenz von Πµν lässt sich also auf einen einfachen Pol in εd zurückführen. Was wir bisher erreicht haben, war, die Divergenz in Pole in der Abweichung von 4 Dimensionen auszudrücken. Damit haben wir den Ausdruck regularisiert. 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS 63 Nun wollen wir den Polarisationstensor in divergente und endliche Terme aufspalten. Mit den Entwicklungen aεd = exp(εd ln a) = 1 + εd ln a + . . . und Γ(εd /2) = 2 − γ + O(εd ) εd , wo γ = 0, 57722 . . . die Eulersche Zahl ist, erhält man Z1 2 2 2 1 m − k x (1 − x) γ e dx x (1 − x) ln + O(ε ) − + 3 Π(k 2 ) = d 6π 2 εd 2 4π µ2 0 √ γ 5 1 −k 2 1 |k 2 | ≫ m2 , e2 εd + ln 4π − 2 + 6 + 2 ln µ2 , = √ γ 1 m2 k2 1 6π 2 + ln 4π − + ln 2 + , |k 2 | ≪ m2 . εd 2 2 µ 10m2 (4.27) Für den vollen“ Photon-Propagator, der alle Aneinanderreihungen von Schleifen berück” sichtigt,6 = + + + ... . Damit ergibt sich i Dµν (k) = i D0µν (k) + i D0µκ (k) i Πκλ i D0λν (k) + . . . , wobei D0µν (k) = − 1 k2 η µν + (α − 1) kµ kν k2 (4.28) der Photonpropagator (1.54) ist. Betrachte z.B. α = 1. Dann ist = −i η µν i η µκ η λν − 2 i k 2 η κλ − k κ k λ Π(k 2 ) (−i) 2 + . . . + iε k + iε k k2 6 Für einen wirklich vollen Propagator müsste man alle Diagramme mitnehmen, nicht nur die Aneinanderreihung von Schleifen. 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS = −i 64 η µκ η µκ η µν +i 2 ∆νκ Π(k 2 ) − i 2 ∆λ ∆ν [Π(k 2 )]2 + . . . , + iε k + iε k + iε κ λ k2 (4.29) wobei ∆νκ = ηκν − kκ k ν . k2 Der Projektor ∆νκ hat die offensichtliche Eigenschaft ∆λκ ∆νλ = ∆νκ . Somit ergibt sich = −i = −i (k 2 + i ε) [1 − Π(k 2 )] i η µκ η µν + 2 2 k + iε k + iε ηκν − kκ k ν k2 Π(k 2 ) + Π2 (k 2 ) + . . . ) kµ kν i kµ kν µν η − − . k2 (k 2 + i ε) k 2 Für allgemeine Eichfixierungsparameter α erhält man i kµ kν kµ kν 1 µν i Dµν (k) = − 2 η − + α . k + i ε 1 − Π(k 2 ) k2 k2 (4.30) (4.31) Interpretation: Betrachte den die Streuung von einem Elektron an einem sehr viel schwereren, positiv geladenen Teilchen, etwa einem Proton. p+k Dµν (k) k e0 P −k k e0 P p Man kann sich überlegen, dass der k µ k ν /k 2 -Anteil für die Berechnung von S-MatrixElementen keine Rolle spielt (vgl. [3, S. 246 ff.]), d.h. der Photon-Propagator ist für unsere Zwecke i Dµν (k) = − k2 i 1 η µν . + i ε 1 − Π(k 2 ) Der Nenner dieses Propagators divergiert. In diesen Streuprozess geht jedoch nicht der Propagator des Photons für sich ein, sondern nur die Kombination i e20 Dµν (k) = − i e20 η µν . k 2 + i ε 1 − Π(k 2 ) 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS 65 Dabei ist e0 die Kopplungskonstante der elektromagnetischen Wechselwirkung, die nicht direkt experimentell zugänglich ist, sondern ein Parameter, der in der Lagrangedichte auftaucht. Man fordert, dass der physikalisch beobachtbare Ladung gegeben ist durch e20 = e2 (k 2 ) , 1 − Π(k 2 ) e2 = d.h. man kann entweder mit e0 rechnen und alle Schleifen berücksichtigen oder die Schleifen weglassen und mit der effektiven Konstante“ e2 arbeiten. Die Meßgröße Kopp” ” lungsstärke“ geht also nicht direkt in der Lagrangedichte in die Theorie ein, sondern durch den Abgleich mit Amplituden. Insbesondere ist wegen der k-Abhängigkeit des Nenners 1−Π(k 2 ) die Ladung e ebenfalls k-abhängig; für k ≈ 0 fordern wir, dass sich der bekannte Wert 4π 137 e2 (0) = ergibt. Für endliche k spaltet man den Polarisationstensor auf,7 Z1 2 2 2 e 1 γ m − k x (1 − x) 0 Π(k 2 ) = + − 3 + O(ε ) dx x (1 − x) ln d 6π 2 εd 2 4πµ2 0 = mit Π(0) + ∆Π(k 2 ) Z1 γ m2 e20 1 − − 3 ln Π(0) = dx x (1 − x) 6π 2 εd 2 4πµ2 (4.32) (4.33) 0 und e20 ∆Π(k ) = 2π 2 2 Z1 0 dx x (1 − x) ln m2 − k 2 x (1 − x) . m2 (4.34) Damit erhält man e2 (k 2 ) = ≃ e20 = 1 − Π(k 2 ) e2 0 ∆Π(k 2 ) (1 − Π(0)) 1 − 1 − Π(0) 2 2 ∆Π(k ) e0 1+ . 1 − Π(0) (1 − Π(0)) (4.35) Im Folgenden werden die Implikationen dieses Ergebnisses für |k 2 | ≪ m2 und |k 2 | ≫ m2 diskutiert. 7 Die Aufspaltung ist natürlich willkürlich. Die Art, wie man solche Größen wie den Polarisationstensor in divergente und nicht-divergente Anteile aufteilt, wird als Renormierungschema bezeichnet. 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS (ii) 66 |k2 | ≪ m2 : Quantenkorrekturen zum Coulomb-Potential Als Beispiel soll Coulomb-Streuung von Elektronen an sehr viel schwereren, positiv geladenen Teilchen diskutiert werden, p+q Dµν (q) P −q q q e0 e0 . P p Dabei soll der Impulsübertrag klein und raumartig sein, d.h. q µ = (0, ~q) und |~q| ≪ m Man erhält durch Entwickeln von (4.34) für kleine |~q|2 e20 |~q|2 ∆Π(q ) ≃ 2π 2 m2 2 Z1 0 dx x2 (1 − x)2 = e20 |~q|2 . 60π 2 m2 Damit lautet ist |~q|-Abhängigkeit der Kopplungsstärke: e2 |~q|2 . e2 (|~q|2 ) ≃ e2 1 + 60π 2 m2 D.h. die Kopplung ist Impuls-abhängig, e2 → e2 (|~q|2 ) . Das Coulomb-Potential erhält man durch Fourier-Transformation aus dem Photon-Propagator. Unter Einbeziehung der Korrekturen ergibt sich8 Z d3 q i q~·~x −Z e2 e2 |~q|2 V (~x) = 1+ e (2π)3 |~q|2 60π 2 m2 4 2 4 Z (3) e Ze 1 − δ (~x) . (4.36) = − 2 4π |~x| (4π) 15 m2 Man spricht vom Uehling-Potential . Dadurch verschieben sich beispielsweise die Energieeigenwerte für S-Zustände im Wasserstoffatom9 Z α2 (3) ∆E = d3 x |Ψ(~x)|2 −4 δ (~ x ) 15 m2 4α2 |Ψ(0)|2 < 0 . (4.37) = − 15 m2 Wesentlich ist, dass wir nach der Anpassung von e20 /(1 − Π(0)) an den experimentell gemessenen Wert nicht-triviale Vorhersagen machen konnten. R beachte, dass sich ein Vorzeichen daher ergibt, dass δ (3) (~ x) = d3 q e−i q~·~x · 1 ist. Ich danke für den Hinweis während der Vorlesung. 9 Diese Verschiebung macht einen Teil dessen aus, was üblicherweise als Lamb-Shift“ bezeichnet wird. ” Die gesamte Lamb-Shift hebt die S-Niveaus an, überkompensiert also diese Verschiebung. 8 Man 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS (iii) 67 |k2 | ≫ m2 : Laufende Kopplungsstärke der QED Betrachte – im Gegensatz zum Vorangegangenen – große Impulsübertrgäge −q 2 ≫ m2 und bezeichne Q2 = −q 2 > 0. Dann ist 2 5 Q2 e20 + ln 4π − γ + − ln + O(ε ) . Π(q 2 ) = d 12π 2 εd 3 µ2 Man erhält nun e2 (q 2 ) = e20 = 1 − Π(q 2 ) 1 − Π(−µ2 ) e20 1− e20 1 Q2 ln 2 2 2 1 − Π(−µ ) 12π µ . Mit e2 (−µ2 ) = e20 1 − Π(−µ2 ) ergibt sich für Q2 > µ2 e2 (−Q2 ) = e2 (−µ2 ) . e (−µ2 ) Q2 1− ln 2 12π 2 µ (4.38) 2 Diese Formel hat eine praktische Anwendung: Man bestimme e2 (Q21 ) an einem beliebig wählbaren Impulsübertrag Q21 durch das Experiment, etwa für kleine Q21 e2 (Q21 ) ≃ 4π/137, und setzt den Parameter µ2 = Q21 . Diese Wahl von µ definiert den sog. Renormierungspunkt. e2 4π • 1 − 137 • | ln Q21 | ln Q22 Für alle anderen Werte von Q2 kann man dann e2 (−Q2 ) bzw. α aus der Formel bestimmen, e2 (−Q22 ) = e2 (−Q21 ) . e (−Q21 ) Q22 1− ln 12π 2 Q21 2 (4.39) Insbesondere ist dann die Q2 -Abhängigkeit durch die µ2 -Abhängigkeit bestimmt. In der QFT 2 Vorlesung wird erklärt, warum das so ist. Die Formel ist insofern selbstkonsistent, als dass man von einem Wert e2 (−Q21 ) ausgehend einen zweiten Wert e2 (−Q22 ) berechnen kann, den man wiederum dazu verwendet, um e2 (−Q23 ) zu bestimmen. Das selbe Ergebnis erhält man, wenn man direkt e2 (−Q21 ) als Grundlage zur Berechnung von e2 (−Q23 ) benutzt. Des Weiteren hatten wir gesehen, dass (4.39) nur für |~q|2 ≫ m2 gilt. D.h., der Effekt tritt nur in Energiebereichen auf, in denen die Elektronen und Positronen, die in der Schleife 4 ASPEKTE DES RENORMIERUNGS-PROGRAMMS 68 + − propagieren, praktisch masselos sind. Das wiederum impliziert, dass wir für Energien kleiner als (z.B.) die Myonmasse die entsprechenden Schleifen nicht mit einbeziehen müssen. M.a.W. die Theorie ist vorhersagekräftig in Energiebereichen, in denen alle Teilchen mit Massen kleiner oder gleich der betrachteten Energie einbezogen werden. + + − − − + + − Anschauliche Interpretation. Die ElektronPositron-Paare wirken als Dipole, welche die nackten Ladungen abschirmen. Für einen sehr klei− nen Abstand der Wechselwirkungspartner, was − + + einem größeren übertragenem Impuls ~q entspricht, + − – werden die Abschirmungseffekte geringer und die Kopplungs- Konstante“ größer. Dieser Effekt hat + + ” − − stärkere Auswirkungen bei der Betrachtung größe2 rer Q . Wesentlich ist, dass die Kopplungsstärke des Elektromagnetismus für große Energie-Skalen größer wird. Allerdings sollte nicht unerwähnt bleiben, dass das hier beschriebene Bild einige Schwächen hat. Warum funktioniert diese Argumentation nicht mit skalaren (anstatt fermionischen) Elektronen?10 Historisch hat sich erwiesen, dass die bahnbrechenden neue Erkenntnisse der Skalen-Abhängigkeit von Kopplungsstärken durch Rechnung und nicht durch anschauliche Bilder gewonnen wurden. Im Folgenden wollen wir den Fall einer nicht-abelschen Eichtheorie diskutieren, in der die qualitative Abhängigkeit der Kopplungsstärke von der Skala unterschiedlich zu dem bisher Diskutierten ist. − + + − + − + − − + + − + − + − 10 Hierbei ist zu beachten, dass für Skalare sich ein relatives Vorzeichen ergibt, das aus dem Fehlen des Faktors (−1) für die Fermion-Schleife folgt. 5 QUANTENCHROMODYNAMIK (QCD) 5 5.1 69 Quantenchromodynamik (QCD) Historische Vorbemerkung Die Quantenchromodynamik (QCD) gilt heute als die Theorie der starken Wechselwirkung. Um zu dieser Erkenntnis zu gelangen, waren einige Schlüsselexperimente und eine relativ intelligente Interpretation ihrer Ergebnisse von notwendig. In diesen Notizen wird zuerst die QCD vorgestellt und es werden erst danach die Experimente und ihre Deutung im Rahmen der Theorie diskutiert. 5.2 QCD als SU(3) Eichtheorie (α) Die Quantenchromodynamik (QCD) ist eine SU(3) Eichtheorie, in der es Fermionen Ψi (x) gibt, die als 3 bzw. 3 transformieren, die sog. Quarks. Hierbei ist i = 1, 2, 3 der Farb-Index (α) und α = u, d, s, c, b, t der Flavor-Index. Jedes der Ψi ist ein Dirac-Vierer-Spinor. Die Theorie weist eine SU(3) Symmetrie auf, d.h. für jedes Farb-Triplett (α) (α) Ψrot (x) Ψ1 (x) = Ψ(α) Ψ(α) (x) = Ψ(α) grün (x) 2 (x) (α) (α) Ψ3 (x) Ψblau (x) ist die Wirkung invariant unter (α) Ψ1 (x) տ (α) U (x) Ψ2 (x) → (α) ւ Ψ (x) 3 (α) Ψ1 (x) (α) · Ψ2 (x) (α) ց Ψ3 (x) ր (5.1) mit U (x) ∈ SU(3). Gemäß unserer Diskussion der nichtabelschen Eichtheorien kommen damit 8 Eichfelder ins Spiel, Aaµ (x) , (a = 1, . . . 8) die als Gluonen bezeichnet werden. (i) Lagrangedichte der QCD Die Lagrangedichte der QCD lautet 1 a µν X (α) LQCD = − Fµν Ψ (i γ µ Dµ − m(α) ) Ψ(α) + LGF Fa + 4 α (5.2) wo g3 die SU(3) Eichkopplung bezeichnet und man z.B. Ta = λa /2 setzen kann. Die eichkovarianten Ableitung ist Dµ = ∂µ − i g3 Aaµ Ta (5.3) und die Eichfixierungs-Lagrangedichte LGF = − 1 µ a a Aµa (∂µ cb ) cd (∂ Aµ ) (∂µ Aµa ) + (∂µ ca ) (∂ µ ca ) + g3 fbd 2ξ mit den Geistfeldern c und c. (5.4) 5 QUANTENCHROMODYNAMIK (QCD) (ii) 70 Feynmanregeln der QCD Die Feynmanregeln können einfach aus 3.5 übernommen werden. µ, a : i g 3 γ µ Ta : (5.5a) ν, b p q λ, c g3 f abc {η µν (k − q)λ + η νλ (q − p)µ + η λµ (p − k)ν } k µ, a (5.5b) ρ, d λ, c : µ, a −i g32 {f abe fecd {η µλ η ρν − η µρ η νλ ) + f ace febd (η µν η λρ − η µρ η νλ ) + f ade febc (η µν η λρ − η µλ η νρ )} ν, b (5.5c) c k µ, a : b p j i : q µ, a : ν, b p b a : −g3 fabc k µ (5.5d) γ µ pµ + m (5.5e) p 2 − m2 + i ε i δ ab qµ qν ab µν i Dµν (q) = 2 −η + (1 − ξ) 2 q + iε q (5.5f) ab iδ (5.5g) p2 + i ε i SF (p) δij = i 5 QUANTENCHROMODYNAMIK (QCD) 5.3 (i) 71 Effektive Kopplungsstärke der QCD und asymptotische Freiheit Laufende Kopplungsstärke der QCD Es geht darum, das Renormierungsprogramm für eine nichtabelsche Theorie – konkret die QCD – zu diskutieren. Es tragen die folgenden Diagramme bei: k a p iℓ −i Σ (p) p ℓ, = i (5.6a) p+k (0) i (Πab µν ) = , (5.6b) k p (1) i (Πab µν ) j p = µ, a ν, b , (5.6c) ν, b , (5.6d) ν, a , (5.6e) i p+k k p (2) i (Πab µν ) p = µ, a p+k k p (3) i (Πab µν ) c = µ, a d p+k p 5 QUANTENCHROMODYNAMIK (QCD) Λaµ 72 + = . (5.6f) Wir werden die Berechnung der Diagramme hier nicht durchführen; es sei auf die Vorlesung QFT 2 verwiesen. Insgesamt führen die in (5.6) aufgeführten Quantenkorrekturen, analog zu dem Fall der QED, zu einem Laufen der effektiven Kopplungsstärke g32 (µ) = g32 (µ0 ) 1 − 2 b g32 (µ0 ) ln µµ0 mit b = 1 16π 2 2 −11 + nF 3 (5.7) . Hierbei bezeichnet nF die Zahl Fermionen in 3 bzw. 3 Darstellungen, die in den Loops propagieren; mehr dazu weiter unten. Dabei ist noch nicht völlig klar, wie die Skala µ zu interpretieren ist. Schwelleneffekte. Wie wir in (4.34) explizit gesehen hatten, treten im dimensionalen Regularisierungsverfahren Integrale vom Typ Z1 0 dx x(1 − x) ln m2 − q 2 x (1 − x) 4π µ2 auf. Hier gibt es zwei Grenzfälle: • Für −q 2 ≪ m2 hängt das Ergebnis kaum von −q 2 ab. • Für −q 2 ≫ m2 kann man m2 vernachlässigen. Damit kann man (mit Q2 := −q 2 ) für • Q2 ≪ m2 den Impulsübertrag Q2 vernachlässigen und für • Q2 ≫ m2 die Quarkmasse vernachlässigen. Dies führt dazu, dass die Kopplungsstärke mit Q2 nur im ersten Fall läuft. Da verschiedene Quarks mit verschiedenen Massen im Spiel sind, gibt es Schwellen, ab denen sich jeweils nF erhöht. Man hat also 5 QUANTENCHROMODYNAMIK (QCD) α3 (Q2 ) = 73 α3 (µ0 ) nF (Q2 ) ) 3 Q2 α3 (µ0 ) ln 2 µ0 (11 − 2 1+ 4π , (5.8) wobei nF von der betrachteten Skala Q abhängt und g22 (Q2 ) 4π die Feinstruktur konstante“ der QCD ist. ” Für beliebige Impulsüberträge Q erhält man α(Q), indem man die einzelnen aus der Schwellennäherung gewonnenen Ergebnisse zusammensetzt, d.h. 0, Q2 < (m(α) )2 , Beitrag von Fermion α zu nF = 1, Q2 > (m(α) )2 . α3 (Q2 ) = Das ist in Abbildung 3 illustriert. nF = 3 nF = 4 nF = 5 • α3 • • | ms | mb | mc • | mt ln Q2 Abbildung 3: Schwellen-Näherung. (ii) Asymptotische Freiheit Man sieht, dass im realistischen Fall nF = 6 die Kopplungsstärke mit wachsendem Q sinkt. Für sehr große Impulsüberträge Q2 erwartet man, dass durch die starke Wechselwirkung gebundene Teilchen sich fast so verhalten wie freie Teilchen. Für diese und weitergehende Beobachtungen erhielten 2004 Gross, Wilczek und Politzer den Physik-Nobelpreis. (iii) Dimensionale Transmutation Experimentell erweist sich, dass α3 Q2 = MZ2 = (91.2 GeV)2 = 0.1187(20) . Damit kann man Gleichung (5.8) umschreiben, α3 (Q2 ) = 0.1187 . (11 − 2 nF /3) Q2 1+ · 0.1187 · ln 2 4π MZ (5.9) 5 QUANTENCHROMODYNAMIK (QCD) 74 Damit sieht man, dass α3 divergiert, falls 1 = M2 (11 − 2 nF /3) · 0.1187 · ln 2Z . 4π Λ Dies passiert an der renormierungsgruppen-invarianten Skala 4π MZ , Λ = exp − 2 (11 − 2nF /3) α3 (MZ ) (5.10) die sich numerisch ergibt zu Λ = ΛQCD = 200 − 250 MeV . Das Wesentliche an dieser Skala ist, dass sie sich, wenn auch numerisch etwas anders, ebenfalls ergeben würde für m(α) = 0 oder eine (reine Yang-Mills) Theorie ohne Quarks, d.h. eine Theorie, die auf dem klassischen Niveau keine Massenskalen besitzt. Die Eigenschaft von Quantenfeldtheorien, Skalen ‘aus dem Nichts’ zu generieren ist als dimensionale Transmutation bekannt. Für die Beschreibung der Natur ist wesentlich, dass ΛQCD die Skala für die Nukleonmasse setzt; die u- und d-Quark-Massen liefern nur unterdrückte Korrekturen. M.a.W., im Großen und Ganzen kommt die Masse der Materie in unserer Umgebung aus dimensionaler Transmutation. 5.4 QCD Phänomenologie Wir beginnen nun mit der Diskussion einiger Tests der QCD. (i) Das R-Verhältnis In diesem Abschnitt geht darum, die Quarks als Spin- 12 -Fermionen zu identifizieren. Eine Möglichkeit, dies zu tun, besteht darin, Fermion-Antifermion-Paarproduktion bei der Kollision von Elektronen mit Positronen, e− + e− → f + f , zu diskutieren. Exemplarisch betrachte e+ µ− : e− + e+ → µ − + µ + . e− µ+ Wie wir diskutiert haben, erhält man für s ≫ m2µ den differentiellen Wirkungsquerschnitt (2.59), α2 dσ = (1 + cos2 ϑ) . dΩ 4s (5.11) 5 QUANTENCHROMODYNAMIK (QCD) 75 Durch ϑ-Integration ergibt sich daraus der totale Wirkungsquerschnitt 4πα2 . (5.12) 3s Nun soll untersucht werden, was sich am Wirkungsquerschnitt ändert, falls man Reaktionen des Typs q e+ σ(e− + e+ → µ− + µ+ ) = q̄ e− betrachtet, wo q für ein Quark steht. Um das Ergebnis für die Myonen zu übertragen, muß man zwei Modifikationen vornehmen: (1) Ersetze die Ladung e des Myons durch die Ladung Qq |e| des Quarks. (2) Multipliziere σ mit dem Farbfaktor 3. Man erwartet also, dass das R-Verhältnis R = σ(e− + e+ → q + q) σ(e− + e+ → µ− + µ+ ) (5.13) einen konstanten Wert annimmt, R = 3 · Q2q . In dem Energiebereich, in dem nur die drei Quarkflavors u, d und s erzeugt werden können, erwartet man, dass 2 2 2 ! 1 1 2 2 2 2 + + = 2. R = 3 · Qu + Qd + Qs = 3 3 3 3 Wenn das c-Quark dazukommt, erwartet man einen Sprung von R um R ∆R = 4/3 , und einen weiteren Sprung: ∆R = 1/3 , wenn das b-Quark dazukommt. M.a.W., aus der Lage und der Höhe der Sprunge des totalen Wirkungsquerschnitts kann man auf die Massen und die elektrische Ladung der Quarks schliessen. 2 − | 2m2c | 2m2b ln s 5 QUANTENCHROMODYNAMIK (QCD) (ii) 76 QCD-Korrekturen (. . . am Beispiel der b b-Produktion) Wir betrachten nun QCD-Korrekturen zu dem oben diskutierten Prozess. In führender und zweiter Ordnung gibt es zwei Diagramme, bei denen ein bb-Paar erzeugt wird, e+ e+ b b und (5.14) e− e− b̄ und zwei, bei denen ein hartes Gluon“ abgestrahlt wird, ” e+ e+ b b̄ b g und g. e− e− b̄ Diese Diagramme werden in den Übungen diskutiert. (iii) (5.15) b̄ Quark-Antiquark-Potential Nun sollen Quark-Antiquark-Bindungszustände untersucht werden. Das Coulomb-Potential ist durch das sog. Quark-Antiquark-Potential zu ersetzen. Der wesentliche Unterschied ist, dass die Feinstruktur konstante“ im betrachteten Energiebereich, definiert durch den Im” pulsübertrag Q, variiert: Fall Q ≫ ΛQCD : Hier ergab sich, dass α3 logarithmisch, d.h. kaum, von Q abhängt, wobei die Korrekturen von α3 abhängen, das in diesem Bereich perturbativ ist. Das Potential im Ortsraum sollte sich im wesentlichen durch die Fouriertransformierte des Gluon-Propagators berchnen, d.h. V (r) ∼ 1/r für kleine r . Fall Q ց ΛQCD : Die Störungstheorie versagt. Man kann lediglich aussagen, dass α3 beliebig groß wird. Man kann sich etwa mit einem linearen Potential im Ortsraum behelfen, V (r) ∼ r für große r . V r 5 QUANTENCHROMODYNAMIK (QCD) (iv) 77 Hadronisierung und Jets Hadronisierung. Die auseinanderlaufenden Quarks gehen nicht beliebig auseinander, sondern das Laufen der Kopplungsstärke sorgt dafür, dass die Wechselwirkung mit größerem Abstand größer wird. Bei Abständen > 10−15 m setzt der Prozess der Hadronisierung ein, der in Abbildung 4 illustriert ist. Die entstehendenden farb-neutralen Zustände wer- Abbildung 4: Cartoon für Hadronisierung. den dann als Hadronen bezeichnet. Solche Zustände können vergleichsweise langlebig sein im Vergleich zu den Zeitskalen der zuvor diskutierten primären Reaktionen. Hadronen Hadronen (a) 2-JetEreignis. (b) 3-Jet-Ereignis. Abbildung 5: Jets. 2-Jet-Ereignis. Wenn ein Quark-Antiquark-Paar, das beispielsweise in der Reaktion (5.14) auseinanderläuft, so liefert das nach der Hadronisierung zwei auseinanderlaufende Hadronjets (Abbildung 5(a)). 3-Jet-Ereignis. Wie wir gesehen haben, können auch Prozesse höherer Ordnung auftreten, z.B. (5.15). In Analogie zur elektromagnetischen Bremsstrahlung kann ein ( hartes“) ” Gluon ausgesandt werden, welches als dritter Hadronenjet manifestiert. Das Wesentliche an dieser Beobachtung ist, dass die Hadronen sich nicht irgendwie über den Raum verteilen, sondern in zwei oder drei Bündeln auftreten. Dies wird als experimentelle Stütze 5 QUANTENCHROMODYNAMIK (QCD) 78 dafür gedeutet, dass bei der e+ e− -Annihilation tatsächlich Quark-Antiquark-Paare und ein Gluon entstehen, und dass die Teilstrahlen für sich hadronisieren“ (Abbildung 5(a)). ” Numerischer Wert der Kopplungsstärke aus Jet-Experimenten. Da auch Prozesse in nichtführenden Ordnung in der starken Kopplungsstärke für die Jets verantwortlich sind, erwartet man bei der Quark-Antiquark-Produktion eine erhöhte Übergangsrate gegenüber der µ− µ+ -Erzeugung bzw. einen erhöhten Wirkungsquerschnitt. Man erhält in führender Ordnung Störungstheorie nF X α3 (s) σ(e− + e+ → Hadronen) 2 2 = 3 + O(α3 ) , Qq 1 + σ(e− + e+ → µ− µ+ ) π q=1 wo s die Schwerpunktsenergie und der Vorfaktor in der Korrektur ∼ α3 durch Rechnung (siehe Übungen) bestimmt ist. Auf diese Weise kann man α3 messen. 5.5 (i) QCD-Bindungszustände leichter Quarks Ausreduzieren von Produkten von SU(3)c -Darstellungen Mit der Methode der Young-Tableaux11 kann man die Tensorprodukte der SU(3)c mit sich selbst ausreduzieren. Der Index c“ in SU(3)c steht für color“. ” ” (1) Ein 3-plett und ein 3-plett können zu einem Singlett und einem Oktett kombiniert werden, ⊗ ⊕ = 3 ⊗ 3 = 1 , ⊕ 8. (2) Zwei 3-plett können zu einem 6-plett und zu einem 3-plett kombiniert werden, ⊗ ⊕ = 3 ⊗ 3 = ⊕ 6 , 3. (3) Drei 3-pletts können zu einem 10-plett, zwei 8-pletts und einem Singlett kombiniert werden, ⊗ = 11 Siehe ⊗ = ⊕ Anhang E auf S. 172 ff. ⊕ ⊕ ⊕ ⊗ = 10 ⊕ 8 ⊕ 8 ⊕ 1 . 5 QUANTENCHROMODYNAMIK (QCD) 79 Wir hatten gesehen, dass die SU(3)c Eichwechselwirkung für große Abstände sehr stark wird. Das führt auf den Begriff des Confinements, ber impliziert, dass lediglich Farbsingletts physikalischen Zuständen entsprechen. Die einzelnen solchen farbneutralen Zustände sind: (1) 3c ⊗ 3c = 8c ⊕ 1c : Das Singlett wird aus den Mesonen gebildet. (2) 3c ⊗ 3c = 6c + 3c : Keine farbneutralen Zustände. (3) 3c ⊗ 3c ⊗ 3c = 10c ⊕ 8c ⊕ 8c ⊕ 1c : Das Singlett wird aus den Baryonen gebildet. (4) Ein weiteres Singlett erhält man in (3c ⊗ 3c ) ⊗ (3c ⊗ 3c ) = (3c + 6c ) ⊗ (3c ⊕ 6c ) = 8c ⊕ 1c ⊕ . . . Ob dies physikalischen Zuständen entspricht, ist ungeklärt. Auf jeden Fall wären diese Zustände extrem kurzlebig. (ii) Die SU(3)F Der Quark-Inhalt des Standardmodelles ist, wie wir später in mehr Detail sehen werden, gegeben durch u d c s t b Q = + 2/3 Q = −1/3 Es gibt zwei experimentelle Fakten: • Die Quarks u, d, s haben eine Masse m ≪ GeV, wohingegen bei c, b, t m & 1 GeV ist. • Für viele Belange kann die elektromagnetische Wechsewirkung gegenüber der starken vernachlässigt werden. Dies führt auf: Modell: Die Massen der Quarks u, d, s sind gleich: mu = md = ms . Die SU(3)F . Wenn die Quarks u, d und s gleiche Massen haben, bilden sie im Rahmen der starken Wechselwirkung ein Triplett unter einer Flavor-Symmetrie SU(3)F , Ψu Ψ = Ψd = 3F . Ψs Die SU(3)F soll nicht mit der SU(3)c durcheinander gebracht werden. Wir überlegen uns nun, welche Darstellungen unter SU(3)F gebundene Zustände von mehreren Quarks, d.h. SU(3)F Tripletts 3F , einnehmen können. Wie wir uns zuvor überlegt haben, zerfallen die SU(3)c -neutralen Objekte in Mesonen und Baryonen. 5 QUANTENCHROMODYNAMIK (QCD) Die Mesonen-Multipletts. zieren, 80 Die leichten Mesonen-Zustände entstehen durch Ausredu- (3c , 3F ) ⊗ (3c , 3F ) = (3c ⊗ 3c , 3F ⊗ 3F ) = (1c , 8F ⊕ 1F ) + unphysikalisches . Hierbei bedeutet ‘unphysikalisches’, dass es sich nicht um Farb-neutrale Zustände handelt, somit nicht um freie Teilchen. Strangeness und vorläufiger Isospin. Nun führen wir noch zwei (historisch entstandene) Quantenzahlen ein, um Bindungszustände leichter Quarks zu klassifizieren, die sog. ‘Strangeness’ S und den vorläufigen Isospin I3 . Den leichten Quarks weisen wir die folgenden Quantenzahlen zu: u d s S I3 0 1/2 . 0 −1/2 −1 0 Nun gibt es zwei Arten von Mesonen, entsprechend der Tatsache, dass die Spins der Quarks zu Skalar bzw. Vektor koppeln können, die pseudoskalaren Mesonen und VektorMesonen. Pseudoskalare Mesonen. Die pseudoskalaren Mesonen sind in Abbildung 6(a) aufgeführt. Der Quarkinhalt der mittleren drei Mesonen ist 1 ↓ |π 0 i = √ |u↑ u↓ i − |d↑ d i , 2 1 ↑ ↓ ↓ |ηi = √ |u u i + |d↑ d i − 2 |s↑ s↓ i , 6 1 ↑ ↓ ↓ ′ |η i = √ |u u i + |d↑ d i + |s↑ s↓ i . 3 Hier ist η ′ das Singlett 1F in der Zerlegung 3F ⊗ 3F = 8F ⊕ 1F und wurde nur der Vollständigkeit halber in das Multiplett eingetragen. Man erhält die Zustände des Oktetts, indem man die Kombinationen u ¯ s̄ Λ d ū, d, s betrachtet, wobei 1 1 3 8 1 1 2 4 5 6 7 Λ ∈ λ ,λ , √ λ ± iλ , √ λ ± iλ , √ λ ± iλ 2 2 2 bzw. Λ = 1 mit den Gell-Mann-Matrizen aus (3.22) ist. Dies sind die Auf- und Absteigeoperatoren der SU(3), d.h. die Verallgemeinderung der σ± = √12 (σ1 ± i σ2 ) in SU(2), und drückt natürlich nichts anderes aus, als dass das Oktett die adjungierte Darstellung der SU(3) ist. 5 QUANTENCHROMODYNAMIK (QCD) 81 S K ∼ s̄ d • 1 η • π − ∼ ū d K − ∼ ū s • • • π0 K ∗0 • K + ∼ s̄ u • 0 η′ π + ∼ d¯u • I3 1/2 • • K̄ 0 ∼ d¯s (a) Pseudoskalare Mesonen. S 1 ω − ρ • K ∗− • • • ρ0 K ∗+ • φ • 1/2 ρ+ • I3 • K̄ ∗0 (b) Vektor-Mesonen. Abbildung 6: SU(3)F Gewichtsdiagramme der Mesonen. Vektormesonen. Das SU(3)F Gewichtsdiagramme der Vektormesonen findet sich in Abbildung 6(b). Das ω-Meson entspricht dem Singlett, das wiederum nur aus Vollständigkeitsgründen auftaucht. Die Mesonen mit Strangeness 6= 0 nennt man konventionell KMesonen. Baryonen. Die Baryonen sind gebundene Zustände aus drei fundamentalen Darstellungen, d.h. 3-pletts unter SU(3)c und SU(3)F und 2-pletts unter der SU(2), die den räumlichen Drehungen zugeordnet ist.12 Ausreduktion liefert ⊕ 2· ⊕ für SU(3) , 10 ⊕ 2·8 ⊕ 1 (5.16) ⊗ ⊗ = ⊕ 2· für SU(2) . 4 ⊕ 2·2 Man unterscheidet dementsprechend zwischen 1/2+ -Baryonen (vgl. Abbildung 7(a)), d.h. der Darstellung der SU(2), bei denen anschaulich zwei Spins parallel sind und der dritte anti-parallel, und 3/2+ -Baryonen (vgl. Abbildung 7(b)), d.h. der vollkommen symmetrischen Darstellung der SU(2), bei denen alle drei Spins parallel sind. Hierbei gibt es einen wesentlichen Aspekt: Beispielsweise das N ∗++ Baryon (vgl. Abbildung 7(b)) setzt sich aus 3 u-Quarks mit parallelen Spins zusammen. Andererseits ist es ein Farb-Singlett, d.h. eine komplett antisymmetrische Kombination der Farbindizes, N ∗++ ∼ εijk ui↑ uj↑ uk↑ . Für gewöhnliche Tensoren ψ i würde die Kombination εijk ψ i ψ j ψ k verschwinden; u-Quarks sind jedoch Fermionen, so dass sich beim Vertauschen ein zusätzliches Vorzeichen ergibt und die obige Kombination nicht verschwindet. Diese und analoge Überlegungen ergeben, dass die Spin-1/2 Baryonen bzw. die Spin-3/2 Baryonen lediglich als 8-plett bzw. 10-plett unter SU(3)F transformieren. 12 Sie transformieren als (0, 12 ) ⊕ ( 12 , 0) unter der Lorentz-Gruppe. 5 QUANTENCHROMODYNAMIK (QCD) 82 S N ∗− • 0 N • S n ∼ u u d• p ∼ uud • 0 • Σ∗− Λ0 • Σ− ∼ s d d • • • (a) • Σ∗0 Σ0 ∼ s u d 1/2 Σ∗+ • I3 I3 • 1/2 Σ+ ∼ s u u Ξ∗− Ξ− ∼ s s d 0 N ∗++ • N ∗+ • • • Ξ∗0 • Ξ0 ∼ s s u 1/2+ -Baryonen. (b) • Ω 3/2+ -Baryonen. Bemerkungen: (1) Die SU(3)F ist explizit durch die Massen ms , md und mu sowie durch die elektrische Ladung gebrochen. (2) Die Pionen haben vergleichsweise kleine Massen. Man kann dies dadurch verstehen, dass man sie als approximative Goldstone-Bosonen einer SU(2)V × SU(2)A Symmetrie auffasst [10]. Wir werden den Begriff des Goldstone-Bosons in Abschnitt 6 diskutieren. 5.6 Abschliessende Bemerkung Wir haben gesehen, dass die perturbative QCD bei hohen Energien eine gute Beschreibung der Theorie liefert. In der Nähe bzw. unterhalb der Skala ΛQCD bricht die Störungstheorie zusammen. Die Wechselwirkung wird stark, und es macht wenig Sinn die Theorie auf nicht-trivialen Darstellungen der SU(3)C aufzubauen. Stattdessen kann man farb-neutrale, zusammengesetzte Objekte, die Baryonen und Mesonen, als Freiheitsgrade einer effektiven Theorie verwenden. Im Prinzip sind die Wechselwirkungen der effektiven Theorie durch LQCD bestimmt. Die tatsächliche Berechung der Kopplungen der effektiven Lagrangedichte Leff ist aber sowohl technisch als auch konzeptionell nicht-trivial (siehe Abb. 7). 5 QUANTENCHROMODYNAMIK (QCD) 83 perturbative QCD effektive Theorie L = Leff (p, n, π ± , π 0 . . . ) L = LQCD (Quarks, Gluonen) ? Q Abbildung 7: QCD und effektive Theorie. 6 SPONTANE SYMMETRIEBRECHUNG 6 84 Spontane Symmetriebrechung In diesem Abschnitt behandeln wir die Theorien weitgehende auf dem klassischen Niveau. 6.1 Spontan gebrochene diskrete Symmetrie Betrachte die φ4 -Theorie eines reellen Skalarfeldes mit der Lagrangedichte L = 1 1 λ (∂µ φ) (∂ µ φ) − m2 φ2 − φ4 . 2 2 4! (6.1) Ersetzt man den Parameter m2 durch −µ2 , so entsteht L = = 1 λ 1 (∂µ φ) (∂ µ φ) + µ2 φ2 − φ4 2 2 4! T −V (6.2) mit der kinetischen Energie T und dem Potential 1 λ V (φ) = − µ2 φ2 + φ4 . 2 4! (6.3) Das Potential und somit auch die Lagrangedichte besitzen eine diskrete (Z2 ) Symmetrie V φ → −φ. Das Potential V hat zwei Minima bei r 6 ± φ0 = ± v = ± µ. λ −v v φ Man nennt v (bzw. −v) den Vakuumerwartungswert von φ. Nun kann man V um eines der beiden Minima, etwa φ = v, entwickeln, φ(x) = v + σ(x) . (6.4) Setzt man (6.4) in (6.2) ein, ergibt sich für die Lagrangedichte bis auf eine Konstante r 1 λ λ 1 µ 2 2 µ σ3 − σ4 . (6.5) L = (∂µ σ)(∂ σ) − (2µ ) σ − 2 2 6 4! Das Hinzunehmen der Konstante hat keine Konsequenzen für die Dynamik, d.h. die EulerLagrange-Bewegungsgleichungen. √ Die Lagrangedichte (6.5) beschreibt ein massives Skalarfeld mit Masse 2µ und σ 3 bzw. σ 4 -Wechselwirkung. Sie ist offensichtlich nicht (mehr) invariant unter der Symmetrie σ → −σ. Man sagt, die diskrete Symmetrie sei spontan gebrochen, d.h. während die Theorie die Symmetrie aufweist, respektiert der Grundzustand diese nicht. 6 SPONTANE SYMMETRIEBRECHUNG 6.2 85 Das lineare Sigma-Modell Anstatt des reellen Skalarfeldes betrachte nun das relle N -plett 1 φ .. φ = . . φN Die zugehörige Lagrangedichte sei13 N L = 1X λ 1 (∂µ φi )(∂ µ φi ) + µ2 φ2 − (φ2 )2 2 i=1 2 4 (6.6) mit dem Skalarprodukt φ2 = N X (φi )2 . (6.7) i=1 Diese ist invariant unter SO(N )-Transformationen φ → R·φ, φi → R i j φj , (6.8) wo R eine orthogonale N × N -Matrix ist. Das Potential λ 1 V (φ) = − µ2 φ2 + (φ2 )2 2 4 ist minimal für Felder φ0 mit µ2 . λ Für N = 2 hat es das rechtsstehende, som” brerohafte“ Aussehen. Ein mögliches Minimum ist 0 .. µ mit v = √ . φ0 = . 0 λ v φ20 = V Φ1 Stellt man ein beliebiges φ dar in der Form π 1 (x) .. . φ(x) = , π N −1 (x) v + σ(x) Φ2 (6.9) (6.10) N −1 so erhält man durch Einsetzen die Lagrangedichte in Abhängigkeit von den Feldern {π k }k=1 und σ, L = N −1 1 1 1 X (∂µ π k ) (∂ µ π k ) + (∂µ σ) (∂ µ σ) − (2 µ2 ) σ 2 2 2 2 k=1 13 Beachte: Anstatt 4! steht hier im Bruch unter λ nur 4, um in den weiteren Ergebnissen keinen Faktor 6 mitschleppen zu müssen. 6 SPONTANE SYMMETRIEBRECHUNG − √ λ µ σ3 − √ λ µ π2 σ − λ 4 λ 2 2 λ 2 2 σ − π σ − (π ) , 4 2 4 86 (6.11) wobei in Analogie zu (6.7) π2 = N −1 X (π k )2 (6.12) k=1 und eine Konstante weggelassen wurde. Diese Lagrangedichte beschreibt ein massives Feld √ N −1 . Die SO(N )-Symmetrie ist verσ der Masse 2µ und N − 1 masselose Felder {π k }k=1 borgen; offensichtlich ist nur eine SO(N − 1)-Symmetrie der Felder π k , die sich dadurch manifestiert, dass L nur von π 2 abhängt. Das Verhalten des Grundzustands, nicht die volle Symmetrie der Lagrangedichte zu besitzen, bezeichnet man als spontane Symmetriebrechung. Im obigen Beispiel sagt man, die Symmetrie sei spontan von SO(N ) auf SO(N − 1) gebrochen. 6.3 Das Goldstone-Theorem Betrachte eine Theorie mit N Feldern {φi }N i=1 und eine Lagrangedichte der Form L = (Ableitungsterme) − V (φ) . Es sei φ0 ein konstantes Feld, welches V minimiert, d.h. ∂ = 0, V ∂φi φ=φ0 ∂2 V =: m2ij ist positiv semi-definit . i i ∂φ ∂φ (6.13) (6.14a) (6.14b) φ=φ0 Entwicklung von V um das Minimum φ0 führt auf 1X 2 m (φ − φ0 )i (φ − φ0 )j + . . . . V (φ) = V (φ0 ) + 2 i,j ij (6.15) Betrachte nun eine allgemeine, einparametrige Symmetrietransformation φ → ℓ(α, φ) , ℓ(0, φ) = φ (6.16) mit der Entwicklung ℓ(α, φ) = φ + α ∆φ + O(α2 ) . (6.17) Hierbei sind die Komponenten von ∆φ gegeben durch X ∆φi = ∂ξ ℓi (ξ, φ)|ξ=0 = i Ti j φj (1 ≤ i ≤ N ) j mit dem Generator der Symmetrietransformation T = (Ti j ). Dabei soll Symmetrietransformation heißen, dass L invariant unter (6.16) ist. Spezialisiert man sich auf konstante Felder, so verschwinden die Ableitungsterme, und V muß invariant unter (6.16) sein, d.h. V (φ + α ∆φ) = V (φ) für infinitesimale α . 6 SPONTANE SYMMETRIEBRECHUNG 87 Die Bedingung der Invarianz kann also geschrieben werden als X ∂ V (φ) ∆φi = 0 . i ∂φ i Durch Differenzieren nach φk und Einsetzen von φ = φ0 ergibt sich 2 X X ∂V ∂ V i i Tk+ ∆φ |φ 0 = . ∂φi φ0 ∂φi ∂φk φ0 | {z }0 i i {z } =Ti j (φ0 )j | (6.18) (6.19) =m2ik Der erste Term verschwindet, da φ0 ein Minimum von V ist. Also muß auch der zweite Term verschwinden. Nun gibt es zwei Fälle: (1) Die Symmetrietransformation läßt φ0 invariant, d.h. φ0 ist im Kern von Ti j . Das bedeutet insbesondere, dass der Grundzustand die entsprechend Symmetrie respektiert, denn exp(α T) φ0 = φ0 für beliebige α. (2) Ist aber ∆φ|φ0 6= 0, d.h. der Grundzustand φ0 besitzt nicht die Symmetrie der Lagrangedichte, so ist ∆φi ein nichtverschwindender Eigenvektor der Massenmatrix m2ik = m2ki zum Eigenwert 0. Goldstone-Theorem: Für jede spontan gebrochene kontinuierliche Symmetrie erhält man ein Feld, welches ein masseloses Teilchen beschreibt. Dieses Teilchen nennt man Goldstone-Boson. Beispiel: Betrachten wir das lineare Sigma-Modell aus Abschnitt 6.2. Die SO(N ) besitzt N (N − 1)/2 Generatoren und die SO(N − 1) somit (N − 1) (N − 2)/2 davon, was einer Zahl von N − 1 gebrochenen Generatoren“ entpricht. Die Goldstone-Bosonen sind die ” Felder π k , bei denen wir explizit gesehen hatten, dass sie masselos sind. Bemerkung: Wir führen die Diskussion bisher auf dem klassischen Niveau. Es stellt sich heraus, dass die Ergebnisse in drei oder mehr Dimensionen auch im Rahmen der Quantenfeldtheorie qualitativ Bestand haben. In zwei Dimensionen gibt es das Phänomem der spontanen Symmetriebrechung jedoch nicht. (Dies ist die Aussage des sog. MerminWagner-Theorems; siehe z.B. [21].) 6.4 Spontan gebrochene Eichsymmetrie (Higgs-Mechanismus) Es geht darum, zu studieren, was passiert, wenn eine Eichsymmetrie, d.h. eine lokale Symmetrie, gebrochen wird. (i) Higgs-Mechanismus für die abelsche Eichtheorie Der einfachste Fall ergibt sich bei der Betrachtung einer abelschen Eichgruppe, also bei der Invarianz der Lagrangedichte unter lokalen U(1)-Transformationen φ(x) → ei Λ(x) φ(x) . (6.20) 6 SPONTANE SYMMETRIEBRECHUNG 88 Als Lagrangedichte wählt man 1 L = (Dµ φ)(Dµ φ)∗ + µ2 φ∗ φ − λ (φ∗ φ)2 − Fµν F µν 4 (6.21) mit Dµ = ∂µ + i e Aµ , wobei gegenüber der Lagrangedichte der (skalaren) QED das Vorzeichen von m2 geändert und der Term −λ(φ∗ φ)2 hinzugefügt wurde. Das Potential V = − µ2 φ∗ φ + λ (φ∗ φ)2 wird minimiert durch Felder, die r v µ2 =: √ |φ| = 2λ 2 (6.22) erfüllen. φ ist darin wieder nicht √ eindeutig bestimmt; wir wählen das Feld der Vakuumkonfiguration reell, d.h. φ = v/ 2. Nun ist es üblich, das komplexe Feld φ durch die rellen Felder σ und ξ auszudrücken, φ(x) v + σ(x) √ 2 = ei ξ(x)/v = 1 √ (v + σ(x) + i ξ(x) + . . . ) . 2 (6.23) Da V überhaupt nicht von der Phase ξ abhängt, bleibt ξ masselos. ξ ist ein sog. “MöchteGern-Goldstone-Boson”, denn wäre die U(1) Symmetrie global, wäre ξ das GoldstoneBoson. Nun führen wir eine Eichtransformation mit Λ = −ξ/v durch, φ(x) → φ′ (x) = e−i ξ(x)/v φ(x) = Aµ (x) → A′µ (x) = Aµ (x) − v + σ(x) √ , 2 1 ∂µ ξ(x) . ev (6.24) Mit diesen neuen Feldern lautet die Lagrangedichte, L = 1 ′ µν ′ 1 1 − Fµν F + ∂µ σ ∂ µ σ + e2 v 2 A′µ Aµ′ 4 2 2 1 2 1 1 2 ′ 2 + e (Aµ ) σ (2v + σ) − σ (3λ v 2 − µ2 ) −λ v σ 3 − λ σ 4 . | {z } 2 2 4 (6.25) =2µ2 Man kann zwei wichtige Resultate ablesen: (1) Es erscheint hier das Feld ξ nicht mehr; es wurde mit (6.24) weggeeicht“. Man sagt ” auch, das Feld ξ wurde vom Eichfeld A aufgegessen“. ” (2) Das Eichfeld A erhält durch den Term 21 e2 v 2 A′µ A′µ Masse. 6 SPONTANE SYMMETRIEBRECHUNG 89 Man beachte, dass die Zahl der Freiheitsgrade Sz = +1 erhalten bleibt: Zwar fehlt das Feld ξ, aber das massiv gewordene Vektorfeld verfügt nun zusätz lich über eine longitudinale Polarisation. Eine aufgegessenes ~ k Möglichkeit, das einzusehen, besteht darin, dass Möchte-Gern 0 man sich bei einem massiven Vektorfeld, im Ge Goldstone-Boson gensatz zu der Situation beim masselosen Vektorfeld, in das Ruhesystem setzen kann. Dort verliert der Begriff der Transversalität“ seine Sz = −1 ” Bedeutung, d.h. alle drei räumlichen Richtungen sind gleichberechtigt. Entsprechend kann die Zahl der Polarisationen nicht auf zwei beschränkt sein. Higgs-Mechanismus. Insgesamt sehen wir, dass bei der spontanen Brechung einer Eichsymmetrie das Eichfeld das Möchte-Gern-Goldstone-Boson“ absorbiert (oder auf” ” isst“) und dadurch massiv wird. Dieser Vorgang trägt den Namen Higgs-Mechanismus. Vergleich mit spontan gebrochener globaler Symmetrie. Abschliessend soll der Unterschied zur gebrochenen globalen Symmetrie noch verdeutlicht werden: Globale U(1)-Symmetrie 2 massive∗ Skalarfelder ⇓ 1 massives Skalarfeld + 1 masseloses Skalarfeld Lokale U(1)-Symmetrie 2 massive∗ Skalarfelder + 1 Photon ⇓ 1 massives Skalarfeld + 1 massives Vektorfeld Der hochgestellte Stern ∗ soll jeweils andeuten, dass es sich nicht wirklich um massive“ ” Felder handelt, sondern dass der der Parameter m2 das falsche Vorzeichen hat. (ii) Ein ‘makroskopisches’ Beispiel für den Higgs-Mechanismus: Supraleitung Die makroskopische (effektive) Beschreibung eines Typ II Supraleiters erfolgt durch die Ginzburg-Landau-Theorie. Die supraleitende Phase wird beschrieben durch ein komplexes Ordnungsparameterfeld“ φ, das die Cooper-Paare beschreibt. ” Ausgangspunkt ist eine die U(1)-eichkovariante Lagrangedichte für ein Skalarfeld φ im stationären Fall, d.h. alle Zeitableitungen seien Null. Man betrachtet also 2 h i h i ~ ×A ~ .(6.26) ~ − ieA ~ φ · ∇ ~ + ieA ~ φ∗ − m2 |φ|2 − λ |φ|4 − 1 ∇ L = − ∇ 2 Bemerkungen: (1) Der letzte Term ergibt sich aus dem Quadrat des Feldstärketensors: 2 1 ~ 1 ~ ∇×A Fµν F µν = 4 2 im stationärenen Fall 6 SPONTANE SYMMETRIEBRECHUNG 90 (2) Das negative der Lagrangedichte, −L = 2 2 1 ~ ~ + ∇ ~ − ieA ~ φ + m2 |φ|2 + λ|φ|4 ∇×A 2 ist als Ginzburg-Landau freie Energie bekannt. (3) In der Nähe der kritischen Temperatur Tc gilt m2 = a (T − Tc ) mit a > 0 . Die Symmetriebrechung erfolgt also für T < Tc . Für m2 < 0 ist das Minimum der freien Energie gegeben durch |φ|2 = − m2 >0. 2λ (6.27) Der Grundzustand kann beispielsweise reell gewählt werden und bricht die lokale U(1)Symmetrie. Damit haben wir bereits das Möchtegern–Golstone–Boson eliminiert. Dies ~ in der Lagrangedichte. Für konstante Felder φ folgen führt zu einem Massenterm für A ~ letztlich Bewegungsgleichungen für A ~ 2 − µ2 A ~ = 0, ∇ (6.28) ~ führen, welche auf ein exponentielles Verhalten von A ~ ~0 . A(x) ∼ e−µ x A x parametrisiert hierbei eine Eindringtiefe in den Supraleiter. Dies impliziert insbesondere auch ein exponentielles Abfallen des magnetischen Feldes ~ = ∇ ~ ×A ~, B also den Meissner-Effekt. (iii) Higgs-Mechanismus für nicht-abelsche Symmetrien Exemplarisch soll ein SO(3)-Modell betrachtet werden. Ausgangspunkt ist die Lagrangedichte L = 2 1 ~ · (Dµ φ) ~ +µ φ ~·φ ~ − λ (φ ~ · φ) ~ 2 − 1 F~µν · F~ µν (Dµ φ) 2 2 4 mit den reellen Feldern φ1 ~ = φ2 φ φ3 und den Eichbosonenfeldern µ A1 µ ~ Aµ2 . A = Aµ3 (6.29) 6 SPONTANE SYMMETRIEBRECHUNG 91 Die eichkovarianten Ableitung ist ~ µ · ~L , Dµ = ∂ µ + i g A wo die La die Generatoren der SO(3) sind, explizit 0 0 0 L1 = Lx = i 0 0 1 , 0 −1 0 0 0 −1 L2 = Ly = i 0 0 0 , 1 0 0 0 1 0 L3 = Lz = i −1 0 0 . 0 0 0 Entsprechend gibt es drei Feldstärketensoren ~ ν − ∂ν A ~µ + g A ~µ × A ~ν . F~µν = ∂µ A Das Vakuum ist wieder entartet, wir wählen das Feld für den Grundzustand 0 µ mit v = √ . φ0 = 0 2 λ v Diese Wahl des Grundzustands respektiert die von den L3 generierten Transformationen, wird aber von L1 und L2 (und beliebigen Linearkombinationen daraus) rotiert. D.h., der Generator L3 ist ungebrochen“ wohingegen L1 und L2 gebrochen“ sind. Wiederum ist es ” ” vorteilhaft, die Felder {φi }3i=1 durch die Felder ξ1 , ξ2 und σ auszudrücken, 0 i , 0 (ξ1 (x) L1 + ξ2 (x) L2 ) (6.30) φ(x) = exp v v + σ(x) Nun führen wir wieder eine Eichtransformation durch, welche die ξ-Felder beseitigt, φ ~ µ · ~L A wobei → → φ′ = Ω φ , ~ µ ′ · ~L = Ω A ~ µ · ~L Ω−1 − i (∂µ Ω) Ω−1 , A g i Ω = exp − (ξ1 L1 + ξ2 L2 ) . v (6.31) (6.32) Die Terme der Lagrangedichte mit den Eichbosonenfeldern lauten dann, wie man durch Nachrechnen bestätigt, 1 ′ ~ ′µν 1 2 2 1 1µ ·F + g v (Aµ A + A2µ A2µ ) . L (A) = − F~µν 4 2 (6.33) Die Felder A1 und A2 haben Masse erhalten, A3 nicht. Dies bringt zum Ausdruck, dass das (willkürlich festgelegte) Vakuum keine Drehsymmetrie bzgl. der 1- bzw. 2-Achse mehr aufweist, aber die Drehsymmetrie bzgl. der 3-Achse erhalten bleibt. 6 SPONTANE SYMMETRIEBRECHUNG 92 In der übrigen Lagrangedichte L (σ) 1 ∂ µ σ ∂ µ σ + m2 σ 2 2 + höhere Terme in σ + Konstanten = (6.34) treten die Felder ξ1 und ξ2 nicht mehr auf. Auch hier halten wir den Unterschied zu einer gebrochenen globalen Symmetrie fest. Globale SO(3)-Symmetrie 3 massive∗ Skalarfelder ⇓ 1 massives Skalarfeld + 2 masselose Skalarfelder Lokale SO(3)-Symmetrie 3 massive∗ Skalarfelder + 3 Eichfelder ⇓ 1 massives Skalarfeld + 2 massive Vektorfelder + 1 masseloses Vektorfeld Man beachte auch, dass sich die Zahl der Freiheitsgrade wieder nicht ändert, d.h. die zwei weggegessenen“ Freiheitsgrade der ξ-Felder erscheinen nun als zusätzliche longitudinale ” Polarisationsrichtungen der Felder A1 bzw. A2 . Das masselos gebliebene Eichfeld entspricht der residualen SO(2) Symmetrie. (iv) Allgemeine Systematik beim Higgs-Mechanismus Betrachte eine Theorie mit einer N -dimensionalen Eichgruppe G. Ausgangspunkt ist die Lagrangedichte 1 a µν 1 Fa + (∂µ − i g Aaµ Ta ) φ (∂ µ − i g Aµ b Tb ) φ − V (φ) , L = − Fµν 4 2 (6.35) wobei V so beschaffen sein soll, dass Symmetriebrechung erfolgt. Ferner ist φ ein L-Tupel von reellen Skalarfeldern.14 Sei φ = φ0 eine Wahl von φ, die V minimiert. Dieses Vakuum φ0 sei invariant unter einer M -dimensionalen Untergruppe H von G, d.h. wählt man ohne Einschränkung als Generatoren von H die letzten M Generatoren von G: {Ta }N a=N −M +1 , so ist φ0 invariant unter ) ( N X a (6.36) α Ta φ 0 = φ 0 φ0 → exp i a=N −M +1 a für beliebige α . Das Skalarfeld φ wird zweckmäßig parametrisiert durch ! ) ( N −M N X i X a ξ Ta σa (x) φ0 + φ = exp v a=1 a=N −M +1 mit linear unabhängigen σa , die auch lokal orthogonal sind zu den durch exp aufgespannten Richtungen, und v = |φ0 |. (6.37) i v NP −M a=1 a ξ Ta 14 Wir können uns auf reelle Felder beschränken, da komplexe Felder immer in Real- und Imaginärteil zerlegt werden können, und SU(n) ⊂ SO(2n). φ0 6 SPONTANE SYMMETRIEBRECHUNG 93 Die ξ-Felder können durch die eine Eichtransformation werden eliminiert bzw. wegge” eicht“ werden, ) ( NX −M i (6.38) ξ a Ta φ = U φ . φ → φ′ = exp − v a=1 Setzt man diese Parametrisierung in die Lagrangedichte ein, so kann man Massenterme für die Vektorfelder aufsammeln, 1 1 a Aµ (m2 )ab Aµ b = (g Ta φ0 |g Tb φ0 ) Aaµ Aµ b , 2 2 (1 ≤ a, b ≤ N − M ) (6.39) wo mit den Klammern (·|·) das Skalarprodukt der L-komponentigen Spalten Ta φ0 bzw. Tb φ0 gemeint ist. Das Objekt (m2 )ab ist die Massenmatrix für die Eichbosonen. Sie ist von der Form m2ab = ua · ub (6.40) mit ua = g Ta φ0 . Sie ist symmetrisch und somit diagonalisierbar. Die Diagonalelemente sind durch das Betrags-Quadrat der (transformierten) u-Vektoren gegeben, somit ist (m2 )ab positiv definit. Somit gibt es N − M massive Vektorfelder, die übrigen M Stück bleiben masselos. Fazit: Spontane Symmetriebrechung bei einer N -dimensionalen Eichgruppe G, wobei das Vakuum invariant ist unter der M -dimensionalen Symmetriegruppe H ⊂ G, läßt sich wie folgt zusammenfassen: L − (N − M ) massive Skalarfelder L massive∗ Skalarfelder + M masselose Vektorfelder =⇒ + N masselose Eichfelder + N − M massive Vektorfelder Die M masselosen Vektorfelder sind die Eichbosonen der ungebrochenen Eichsymmetrie H, die (N − M ) massiven Vektorfelder erhalten ihre Masse durch das Aufessen“ der ” Möchte-Gern-Goldstone-Bosonen. 7 ELEKTROSCHWACHE THEORIE 7 94 Elektroschwache Theorie Es wird die Theorie der elektroschwachen Vereinheitlichung formuliert. Diese liefert eine Erklärung, warum die schwache Wechselwirkung so schwach ist, und liefert nebenbei“ die ” Massen der geladenenen Leptonen. 7.1 Eichtheorie der elektroschwachen Wechselwirkung Links- und rechtshändige Fermionen. Ausgangspunkt ist ein Satz an masselosen Fermionen, die jeweils beschrieben werden durch die Dirac-Lagrangedichte LDirac = i Ψ γ µ ∂µ Ψ . (7.1) Aus den Fermionfeldern kann man jeweils den links- bzw. rechtshändigen Anteil herausprojizieren, 1 − γ5 Ψ, (7.2a) Ψ L = PL Ψ = 2 1 + γ5 Ψ R = PR Ψ = Ψ. (7.2b) 2 Mit diesen Definitionen können die kinetischen Terme in der Lagrangedichte umgeschrieben werden, i Ψγ µ ∂µ Ψ = i (ΨL + ΨR ) γ µ ∂µ (ΨL + ΨR ) = i Ψ R γ µ ∂ µ ΨR + i Ψ L γ µ ∂ µ ΨL , (7.3) da γ5 mit den γ µ antikommutiert. Das bedeutet, das die kinetischen Terme nur Felder mit identischen Transformationseigenschaften ‘verheiratet’. Beispielsweise das Elektron hat L- und R-Komponenten; vorläufig nehmen wir an, die Neutrinos νe , νµ und ντ besäßen nur L-Komponenten. Für die kinetischen Terme einer Lepton-Lagrangedichte setzt man also LLepton ⊃ i eR γ µ ∂µ eR + i eL γ µ ∂µ eL + i ν e γ µ ∂µ νe + (e → µ) + (e → τ ) . (7.4) Die µ- und τ -Terme werden im folgenden weggelassen, da sie analog zu den e-Termen behandelt werden können. Schwacher Isospin. Kontinuierliche Symmetrien von (7.4) dürfen Zustände nur auf Zustände mit identischen Raum-Zeit-Eigenschaften abbilden, also nur etwa eL und νe ‘mischen’. Dies legt nahe, eL und νe in Isospinor“zusammenzufassen, ” νe ℓ = , (7.5) eL der aufgefaßt wird als Dublett einer nicht-abelschen SU(2)-Gruppe, die wir im Folgenden als SU(2)L bezeichnen werden. Die Eigenwerte I3 dieser Gruppe definieren eine neue Quantenzahl, genannt schwacher Isospin. Der übriggebliebene Zustand r = eR (7.6) 7 ELEKTROSCHWACHE THEORIE 95 ist ein Singlett bzgl. dieser Gruppe. Insgesamt ordnet man also den Teilchen den folgenden Isospin zu: r = eR νe ℓ = eL SU(2)L 1 I 0 2 1 2 I3 0 1 2 1 − 2 Somit ist die Lagrangedichte L = i r γ µ ∂µ r + i ℓ γ µ ∂µ ℓ (7.7) invariant unter der globalen Transformation ℓ r → → exp (−i αa Ta ) ℓ , (7.8a) r, (7.8b) oder explizit νe a eL → exp (−i α Ta ) 0 0 eR 0 νe 0 eL . 1 eR (7.9) Hierbei sind die Generatoren Ta bis auf einen Faktor durch die Paulimatrizen gegeben sind, d.h. Ta = 1 σa , 2 (7.10) und die Summation über den Gruppenindex a erstreckt sich von 1 bis 3. Hyperladung. (7.4) weist noch eine weitere Symmetrie auf: Man kann die Felder jeweils mit einem Phasenfaktor multiplizieren, und L bleibt unter dieser Operation invariant. Dabei kann zunächst die Phase für jedes Feld eine andere sein. Allerdings müssen wir den Komponenten von ℓ die gleiche Phase zuordnen, denn sonst würden wir die SU(2)L Symmetrie explizit brechen. Natürlich rotieren bei einer SU(2)L Transformation in σ3 Richtung die beiden Komponenten ℓ mit entgegengesetzter Phase. Für r kann die Phase weiterhin anders gewählt werden. Somit ergibt sich die folgende U(1)-Symmetrie: inβ e 0 0 νe νe eL → 0 ei n β 0 eL , (7.11) eR eR 0 0 ei β wo β die erwähnte Phase ist und n noch zu ermitteln bleibt. Mit dieser Symmetrie folgt die Existenz einer erhaltenen Ladung, die schwache Hyperladung genannt und mit qY bezeichnet wird. n beschreibt das Verhältnis der Ladung von ℓ zur Ladung von r. Weinbergs Vorschlag. Der schwache Isopsin und die schwache Hyperladung haben – im Gegensatz zur elektrischen Ladung Q – in der QED keine Bedeutung. Weinberg hat daher einen Zusammenhang der Form Q = I 3 + qY (7.12) 7 ELEKTROSCHWACHE THEORIE 96 gefordert. Um elektrisch geladene Elektronen und neutrale Neutrinos zu erhalten, muß man für ℓ : qY = −1/2 und r : qY = −1 setzen; dies legt n auf 21 fest. Damit schreibt sich (7.11) i β/2 e 0 0 νe νe eL → 0 ei β/2 0 eL . eR eR 0 0 ei β (7.13) Übergang zur lokalen Symmetrie bzw. Eichsymmetrie. Die Lagrangedichte (7.4) ist invariant unter globalen SU(2)L ×U(1)Y Transformationen. Nun fordern wir Invarianz unter lokalen SU(2)L × U(1)Y -Transformationen. Dies führt dazu, dass man die partiellen Ableitungen durch die eichkovarianten zu ersetzen hat, ∂µ ℓ → ∂µ r → σa ℓ − i g1 (− 12 ) Bµ ℓ , 2 Dµ r = ∂µ r − i g1 (−1) Bµ r , Dµ ℓ = ∂µ ℓ − i g2 Wµa (7.14a) (7.14b) mit den Eichkopplungen g1 der U(1)Y und g2 der SU(2)L . Dabei wurden die Felder der Eichbosonen für die SU(2)L -Symmetrie {W a }3a=1 und für die U(1)Y -Symmetrie B eingeführt. Des Weiteren benötigen wir die kinetischen Terme für die Eichbososonen. Da gibt es zum Einen für die SU(2)L ~ ν − ∂ν W ~ µ + g2 W ~µ×W ~ ν )2 =: Wµν W µν , (∂µ W wobei schon ausgenutzt wurde, daß die Strukturkonstanten bei der Wahl der Pauli-Matrizen als Generatoren der Lie-Algebra der SU(2) gleich dem Levi-Civita-Symbol εabc sind. Zum Anderen hat man für die U(1)Y (∂µ Bν − ∂ν Bµ ) (∂ µ B ν − ∂ ν B µ ) = Bµν B µν . Diese Terme, die im Elektromagnetismus dem Quadrat des Feldstärketensors entsprechen, werden der Lagrangedichte addiert. Insgesamt ergibt sich eine Lagrangedichte der Form 1 1 L1 = i r γ µ Dµ r + i ℓ γ µ Dµ ℓ − Wµν W µν − Bµν B µν . 4 4 (7.15) Dabei bedeuten die Symbole Dµ vor ℓ bzw. r gemäß (7.14a) und (7.14b) jeweils etwas Anderes. Man beachte, dass auf diesem Niveau die Fermion-Massen durch die (globale) SU(2)L × U(1)Y -Symmetrie verboten sind, d.h. es können der Lagrangedichte keine SU(2)L ×U(1)Y invarianten Massenterme hinzugefügt werden. Man sagt, die Fermionen seien chiral bzgl. der SU(2)L × U(1)Y -Symmetrie. Die SU(2)L × U(1)Y -Symmetrie ist jedoch offenbar in dem Grundzustand, den wir beobachten, nicht linear realisiert. D.h., wir beobachten derzeit weder masselose W - noch Y -Bosonen. Somit müssen diese Symmetrien, wenn sie überhaupt existieren, spontan gebrochen sein. 7 ELEKTROSCHWACHE THEORIE 97 Higgs-Feld. Um diese Brechung zu bewerkstelligen, führt man das sog. Higgs-Feld ein, + φ , (7.16) φ = φ0 das bzgl. SU(2)L als Dublett transformiert. Des Weiteren müssen φ+ und φ0 komplex sein, sodass das Higgsfeld die Quantenzahlen I = 1 2 und qY = 1/2 trägt, wobei die Festsetzung von qY ante Ableitung von φ lautet dann σa − Dµ φ = ∂µ − i g2 Wµa 2 auf 1/2 sich später rechtfertigen wird. Die eichkovarii g1 Bµ 2 φ. (7.17) 2 Eichinvariante Terme für das Higgs-Feld umfassen einen ‘Massenterm’ m2 φ† φ sowie einen ‘quartischen’ Term λ4 (φ† φ)2 . Des Weiteren soll das φ-Feld noch mit der Kopplungsstärke ye mit e− und νe wechselwirken. Somit erhalten wir eine Lagrangedichte L2 = (Dµ φ)† (Dµ φ) + µ2 † λ φ φ − (φ† φ)2 − (ye ℓ φ r + ye∗ r φ† ℓ) . 2 4 (7.18) Der Massenterm“ mit dem falschen Vorzeichen bewirkt, dass die Vakuumfeldkonfiguration ” von φ nicht bei φ = 0 liegt, sondern bei r v2 2 2 + 2 0 2 |φ| = |φ | + |φ | = mit v = µ. 2 λ Wir wählen als Vakuumkonfiguration 1 0 . φ0 = √ v 2 (7.19) √ Hierbei wurde der Konventionsfaktor 1/ 2 eingeführt wurde, damit die Fluktuationen um φ0 , die im Gegensatz zu φ durch reelle Skalarfelder beschrieben wurden, kanonisch normiert sind, d.h. den richtigen“ kinetischen Term haben. ” Bemerkung: (7.19) ist eine spezifische Wahl, die gewissermassen das Koordinatensystem im SU(2)L -Raum festlegt. Genausogut hätten wir 1 v √ φ0 = 0 2 setzen können. Dies hätte zur Konsequenz, dass wir auch die Komponenten von ℓ und φ, die wir im Vorgriff auf die Wahl (7.19) bereits sinnvoll“ benannt hatten, vertauschen ” 2 müßten. Jede Wahl von φ0 so, dass |φ0 |2 = v2 , ist physikalisch äquivalent. Beliebige φ-Felder parametrisieren wir durch i 1 0 [ξ0 (12 − σ3 )ξ1 σ1 + ξ2 σ2 ] . (7.20) φ = √ exp v+h 2v 2 Durch die lokale SU(2)L × U(1)Y -Transformation i ′ φ → φ = exp − [ξ0 (12 − σ3 ) + ξ1 σ1 + ξ2 σ2 ] φ 2v (7.21) 7 ELEKTROSCHWACHE THEORIE 98 lassen sich die ξ-Felder wegtransformieren, 1 0 ′ φ (x) = √ . v + h(x) 2 (7.22) Hier haben wir die Linearkombination von 12 und σ3 verwendet, die die Phase von (v + h(x)) ändert. Die orthogonale Linearkombination 12 +σ3 läßt den Vakuumerwartungswert invariant. Dies hat, wie wir später sehen werden, zur Folge, dass ein Eichfeld, entsprechend einer ungebrochenen U(1) Symmetrie, masselos bleibt. Später werden wir ebenfalls sehen, dass die Wechselwirkungsterme in (7.18) für Massenterme für die Leptonen sorgen. Nun wenden wir uns den Massentermen für die W -Bosonen sowie für B zu. In der obigen Eichung erhalten wir † σa 1 i 0 · ··· (Dµ φ)† (Dµ φ) = ∂µ − i g2 Wµa − g1 Bµ √ v + h(x) 2 2 2 1 = (∂µ h) (∂ µ h) 2 † 1 0 g2 W3µ + g1 B µ g2 (W1µ − i W2µ ) · · · · . (7.23) + v+h g2 (W1µ + i W2µ ) −g2 W3µ + g1 B µ 8 Die Terme, die quadratisch in v und den Eichbosonen sind, liefern die Massenterm LEichbosonmassen = g22 v 2 1 1 µ Wµ W + Wµ2 W 2 µ 8 v2 + (g2 Wµ3 − g1 Bµ ) (g2 W3µ − g1 B µ ) . 8 (7.24) Die zweite Zeile kann kompakter geschrieben werden, (g2 Wµ3 Die Matrix M = − g1 Bµ ) (g2 W3µ g22 −g1 g2 µ − g1 B ) = −g1 g2 g12 (W3µ , B µ ) · g22 −g1 g2 −g1 g2 g12 Wµ3 · . Bµ läßt sich diagonalisieren durch die Transformation 0 Wµ3 Zµ Wµ3 cos ϑW − sin ϑW → = · . sin ϑW cos ϑW Bµ Aµ Bµ (7.25) M hat verschwindende Determinante, d.h. ein Masseneigenwert ist 0. Der zugehörige (normierte) Eigenvektor und der dazu orthogonale Vektor sind 1 1 g1 g2 u0 = p 2 und u⊥ = p 2 . g2 −g1 g1 + g22 g1 + g22 Damit bestimmt sich der sog. Weinberg-Winkel ϑW zu p g2 g22 + g12 = cos ϑW . (7.26) 7 ELEKTROSCHWACHE THEORIE 99 Mit den neuen Feldern g2 Wµ3 − g1 Bµ p = cos(ϑW ) Wµ3 − sin(ϑW ) Bµ g22 + g12 Zµ0 = und (7.27) g1 Wµ3 + g2 Bµ p = sin(ϑW ) Wµ3 + cos(ϑW ) Bµ , g22 + g12 Aµ = (7.28) lautet der Term in der zweiten Zeile von (7.23) v2 g2 Wµ3 − g1 Bµ (g2 W3µ − g1 B µ ) 8 = 1 Z 0 µ , Aµ · 2 m2Z 0 0 0 0 Zµ · . Aµ (7.29) Hierbei ist g12 + g22 2 v . 4 m2Z = Definiert man weiter 1 Wµ± = √ Wµ1 ∓ i Wµ2 , 2 (7.30) so sieht an (7.23), dass die W ± - und Z-Bosonen Masse erhalten, m2W + = m2W − = g22 v 2 =: m2W 4 und m2Z = m2W ; cos2 ϑW (7.31) die Masse von A verschwindet. Die W ± -Bosonen bzw. das Z 0 können erzeugt werden. Man kann ihre Masse bestimmen und somit den Weinberg-Winkel. Die gemessenen Werte sind mW mZ = = sin2 ϑW = 80.425(38) GeV , 91.1876(21) GeV , m2 = 0.23120(15) . 1− W m2Z Kopplung der Fermionen an die ‘rotierten’ Eichbosonen. Man kann sich genau überlegen, wie die einzelnen Fermionen an die neuen Eichfelder koppeln. Dazu betrachtet man die linkshändigen Anteile ℓ i γ µ Dµ ℓ = ℓ γ µ i ∂µ − qY g1 Bµ 12 − i g2 Wµa σa ℓ !) ( (ν) (ν) (ℓ) Qem Aµ + QN Zµ0 QC Wµ+ µ ℓ. (7.32) i ∂µ − i = ℓγ (e) (e) (ℓ) Qem Aµ + QN Zµ0 QC Wµ− Durch Vergleich erhält man Qe/ν em = (I3 + qY ) e , 7 ELEKTROSCHWACHE THEORIE e/ν = QLC = QN 100 (I3 cot ϑW − qY tan ϑW ) e , g2 2I √ 2 mit der elektromagnetischen Kopplungskonstanten e = p g1 g2 g12 + g22 = g2 sin ϑW . (7.33) Völlig analog formt man die rechtshändigen Anteile um, r i γ µ Dµ r = r γ µ {i ∂µ − qY g1 Bµ } r n o (e) 0 = r γ µ i ∂µ − Q(e) em Aµ − QN Zµ r . (7.34) Insbesondere sind die Ladungen von links- und rechtshändigen Elektronen (formal) identisch, formal Q(e) em = (e) QN −e = −qY tan ϑW e = (I3 + qY ) , formal = (I3 cot ϑW − qY tan ϑW ) . Hierbei ist I = I3 = 0 für r. Insgesamt erhalten wir also, daß sich die Kopplung an die Vektorfelder Z 0 und W ± bzw. an das elektromagnetische Feld aus den Quantenzahlen I, I3 und qY ablesen läßt, Kopplung an A : Kopplung an Z 0 : Kopplung an W ± : Qem = (I3 + qY ) e , QN = (I3 cot ϑW − qY tan ϑW ) e , g2 QC = 2I √ . 2 Bemerkungen: (1) Das masselose Feld A koppelt nur an die Elektronen, und zwar gleich stark an linksund rechtshändige Anteile, nicht aber an die Neutrinos. Wir identifizieren es mit dem Photon. (2) Die Z-Bosonen koppeln unterschiedlich an die Ströme der linkshändigen Elektronen, der rechtshändigen Elektronen und der Neutrinos. (3) Da man Terme ψγ µ ψ als Stromdichten für Dirac-Teilchen interpretiert, bezeichnet √ man beispielsweise ν γ µ eL als Elektron-Neutrino-Strom“. Dieser koppelt mit g2 / 2 ” an das Vektorfeld W ± . (4) Die W ± -Bosonen koppeln nur an linkshändige Fermionen (und rechtshändige AntiFermionen). Prozesse, bei denen diese als Austauschbosonen dienen, würden also in einem raumgespiegelten System nicht ablaufen; man spricht von maximaler Paritätsverletzung. 7 ELEKTROSCHWACHE THEORIE 101 (5) Wesentlich ist, dass die drei Parameter aus der Theorie g1 , g2 und v sowohl mW und mZ als auch die Kopplung der Fermionen and die Eichbosonen A, Z 0 und W ± festgelegen. Wenn man also die Kopplungen kennt, ist das Verhältnis mW /mZ eine Vorhersage; für diese Vorhersage erhielten Glashow, Salam und Weinberg 1979 den Nobelpreis. 7.2 Feynman-Regeln Aus der Lagrangedichte kann man die Feynman-Regeln ablesen. Man erhält (s. z.B. [3]) eL eL µ γ µ : −i e γ PL µ : i e γµ − 21 + sin2 ϑW PL cos ϑW sin ϑW µ : i e γµ sin2 ϑW PR cos ϑW sin ϑW Z0 eL eL eR eR µ γ µ : −i e γ PR Z0 eR eR νe W− g µ : −i √2 γ µ PL 2 eL νe µ: Z0 1 i e γµ PL 2 cos ϑW sin ϑW νe Für den Propagator eines massiven Eichbosons erhält man k −i kµ kν µν : 2 η − (1 − ξ) µ ν k − m2 + i ε k 2 − ξ m2 mit dem Eichfixierungsparameter ξ und den Eichbosonenmassen m = mW , mZ bzw. 0 für die W -Bosonen, das Z-Boson bzw. das Photon. 7.3 Fermion-Massen Wir hatten zuvor gesehen, dass in der SU(2)L × U(1)Y Eichtheorie das Elektron masselos ist – der Massenterm ist verboten durch die Eichsymmetrie. Es wird nun gezeigt, dass die Massenterme durch die elektroschwache Symmetriebrechung generiert werden. Ausgangspunkt ist die Yukawa-Kopplung (7.35) LY = − ye ℓ · φ r + ye∗ r φ† ℓ = − ye ℓ · φ r + h.c. . Hierbei betrachten wir zunächst nur eine Generation, d.h. νe ℓ = und r = eR . eL (7.36) 7 ELEKTROSCHWACHE THEORIE 102 Ersetzt man das Higgs-Feld durch seinen Vakuumerwartungswert, 1 0 φ → √ , v 2 so erhält man LY → = (7.37) ye 0 eR + h.c. − √ (νe , eL ) · v 2 ye v − √ eL eR + h.c. =: − me eL eR + h.c. = − me Ψe Ψe , 2 (7.38) wo Ψe der Dirac-Spinor ist, der links- und rechtshändige Komponenten des Elektrons zusammenfasst, PL/R Ψe = eL/R . Nun verallgemeinern wir die Diskussion auf die drei Generationen der Leptonen, d.h. ′ ′ ′ ′ eR νµ ντ νe . (7.39) , , r = µ′R und ℓT = τL′ e′L µ′L ′ τR Wir werden weiter unten sehen, warum die Felder mit Apostrophen Lagrangedichte ist nun LY = − 3 X ′ verziert sind. Die f (Ye )f g ℓ · φ rg + h.c. , (7.40) f,g=1 wobei Ye eine 3 × 3-Matrix ist und f, g Generationen-Indizes bezeichnen. Führt man nun die Ersetzung (7.37) durch, ergibt sich ′ eR LY → − (e′L , µ′L , τL′ ) · M · µ′R + h.c. . (7.41) τR′ Hierbei ist M = √12 Ye v eine komplexe 3 × 3 Matrix. Diese kann durch eine sog. bi-unitäre Transformation diagonalisiert werden, me 0 0 † (7.42) U L M U R = D = 0 mµ 0 , 0 0 mτ wobei UL/R unitäre 3 × 3-Matrizen sind. Wir führen wir nun eine Feld-Redefinition durch, ′ ′ eL eR eR eL µL = U † µ′L µR = U † µ′R , (7.43) und L R τL τR′ τR τL′ so dass ((νe , eL ) , (νµ , µL ) , (ντ , τL )) = Damit erhält man νe′ , e′L , νµ′ , µ′L , ντ′ , τL′ UL . Lmass = − me eL eR − mµ µL µR − mτ τL τR + h.c. . (7.44) (7.45) D.h. man kann die drei Dirac-Massenterme für die geladenen Leptonen auf die Lagrangedichte LY zurückführen. 7 ELEKTROSCHWACHE THEORIE 103 Fazit: Die Tatsache, dass das Higgs-Feld einen Vakuumerwartungswert entwickelt, führt neben den Massentermen für die Eichbosonen W ± und Z 0 auch auf Massentermen für die geladenen Leptonen. 7.4 Phänomenologische Aspekte Betrachte nun z.B. den µon-Zerfall µ − → e− + ν e + ν µ . In führender Ordnung Störungstheorie wird der Prozess beschrieben durch das Diagram νe q ′ k µ− W e− −q p p′ νµ Nach den Feynmanregeln ergibt sich ein Übergangsmatrixelement kµ kν −i η − µν m2W g22 u(p′ ) γ µ PL u(p) u(q) γ ν PL v(q ′ ) Mf i = 2 k 2 − m2W + i ε kµ kν −i ηµν − 2 mW g22 u(p′ ) γ µ (1 − γ5 ) u(p) u(q) γ ν (1 − γ5 ) v(q ′ ) . (7.46) = 8 k 2 − m2W + i ε Dabei wurde der übertragene Impuls q eingeführt, der in den Argumenten der Spinoren unterdrückt ist. Im Propagator für das W -Boson wird die sog. R∞ -Eichung verwendet. Da mµ ≪ mW , hat man k 2 ≪ m2W . D.h., man kann man k 2 im Propagator vernachlässigen, im Ortsraum wird der Propagator zur δ-Funktion und man spricht von Punktwechselwirkung. Des Weiteren erhält man für das Übergangsmatrixelement die einfache Gestalt Mf i = i g22 λ † GF λ † µ j(e) λ j(µ) j(e) λ = i √ j(µ) 2 8mW 2 mit den Strömen“ ” λ j(µ) = u(p) γ λ (1 − γ5 ) u(p′ ) und der Fermi-Konstante GF = g2 √ 2 2 . 4 2 mW und λ j(e) = u(q) γ λ (1 − γ5 ) v(q ′ ) (7.47) 7 ELEKTROSCHWACHE THEORIE 104 M.a.W., wir können das Diagramm mit dem W -Boson durch ein Diagramm mit VierFermion-Wechselwirkung ersetzen, νe νe q′ q′ k2 ≪m k µ− W W e− −−−−−→ µ− −q q p p p′ e− . p′ νµ νµ Historisch wurde zuerst die Fermi-Theorie zur Beschreibung der schwachen Wechselwirkung formuliert und erst später die elektroschwache Theorie vorgeschlagen. Die VierFermion-Wechselwirkung führt auf zwei wesentliche konzeptionelle Schwierigkeiten. Zum Einen ist sie nicht renormierbar, zum Anderen verletzen die damit gewonnenen Übergangswahrscheinlichkeiten für große Energien Unitarität. Nichts desto trotz liefert die FermiTheorie im Energie-Bereich weit unterhalb mW eine akkurate Beschreibung. Dies ist ein Beispiel für eine effektive Theorie. Mit der Formel (vgl. [3, S. 808]) n n X (2π)4 Y d3 pf 1 2 pf , |M(X → f1 + · · · + fn )| δ (4) pX − dΓ = 2MX (2π)3 2Ef f =1 f =1 (7.48) die den Zerfall des instabilen Teilchens X in n Teilchen mit Impulsen pf beschreibt, kann man die Zerfallsrate berechnen. Ein wesentlicher Aspekt dabei ist, dass es sich um einen 3-Körper-Zerfall handelt. Die Phasenraum-Integration ergibt für die inverse Lebensdauer bzw. die Zerfallsrate τµ−1 = Γ(µ → e− + ν̄e + νµ ) ≃ G2F m5µ , 192 π 3 (7.49) wobei die Elektron-Masse gegen die Masse des µ vernachlässigt wurde. Experimentell findet man, dass τµ ≃ 2.197 · 10−6 s . Wesentlich ist, dass wir GF alleine durch den Vakuumerwartungswert des Higgs-Feldes v ausdrücken können, m2W = g22 2 v 4 y GF = 1 g2 √ 2 2 = √ . 4 2 mW 2 v2 Die Lebensdauer des µ ist also gemäß (7.49) (beachte: GeV−1 ≃ 6.6 · 10−25 s) v 4 τ ≃ 6.16 s, GeV was v ≃ 246 GeV und 1 √ v ≃ 175 GeV 2 7 ELEKTROSCHWACHE THEORIE 105 liefert. Dies impliziert insbesondere, dass die Elektron, µ und τ Yukawa-Kopplungen durch ye ≃ 3 · 10−6 , yµ ≃ 6 · 10−4 und yτ ≃ 1 · 10−2 gegeben sind. Man kann offensichtlich die Parameter der Lagrangedichte so wählen, dass die beobachteten Fermion-Massen reproduziert werden. Andererseits sind diese Parameter, im Gegensatz zu den Eichkopplungen, hierarchisch klein und stark unterschiedlich. Es ist bislang noch nicht verstanden, warum das so ist. 8 STANDARDMODELL 8 106 Standardmodell 8.1 Fermion–Massen (i) Massen der Leptonen Wir haben die Massen der Leptonen bereits im Rahmen der elektroschwachen Theorie diskutiert. Dort war der Ausgangspunkt die Lagrangedichte (7.40), LY = − 3 X f (Ye )f g ℓ · φ rg + h.c. , f,g=1 wobei Ye eine 3 × 3–Matrix ist, f, g Generationen–Indizes bezeichnen und ′ ′ ′ ′ eR νµ ντ νe . , , r = µ′R und ℓT = τL′ e′L µ′L ′ τR Wenn man das Higgs–Feld durch seinen Vakuumerwartungswert ersetzt, 1 0 √ φ → , v 2 ergibt sich LY e′R → − (e′L , µ′L , τL′ ) · M · µ′R + h.c. . τR′ Die Massenmatrix M = werden, UL† M UR √1 Ye 2 v kann durch eine bi–unitäre Transformation diagonalisiert me = D = 0 0 0 mµ 0 0 0 , mτ (8.1) wobei UL/R unitäre 3 × 3–Matrizen sind. D.h., durch die Feld–Redefinitionen ′ ′ eL eR eL eR µL = U † µ′L µR = U † µ′R , und L R τL τR′ τR τL′ erhält man die Massenterme der geladenen Leptonen, Lmass = − me eL eR − mµ µL µR − mτ τL τR + h.c. . Bemerkung: Wir identifizieren beispielsweise 1 me = √ y e v . 2 Dabei ist zu beachten, dass der Massenterm für die W - bzw. Z–Bosonen ebenfalls ∼ v ist. Der Parameter ye sorgt dafür, dass die Massen von Elektronen und dieser Bosonen um 6 Größenordnungen auseinander liegen. Diese Hierarchie ist ein Input und findet keine Erklärung im betrachteten Modell. Die Kleinheit der Yukawa–Kopplungen ist jedoch stabil 8 STANDARDMODELL 107 unter Quanten–Korrekturen. Quantenkorrekturen können beschrieben werden durch die sog. Renormierungsgruppengleichungen, welche im betrachteten Fall der Form 3 15 9 d ye = ye |ye |2 + (|ye |2 + |yµ |2 + |yτ |2 ) − g12 − g22 + . . . (8.2) 16π 2 µ dµ 2 4 4 ist. Insbesondere sind die Korrekturen zur Yukawa–Kopplung eines Fermions sind proportional zur Yukawa–Kopplung selbst, d.h. eine hierarchisch kleine Kopplung bleibt hierarchisch klein. (ii) Massen der Quarks Das Vorgehen für die Leptonen kann auf die Quarks übertragen werden. Wir wollen wieder Massen erhalten, die linear im Vakuumerwartungswert v des Higgsfeldes sind. D.h., wir benötigen in der Lagrangedichte Kopplungen, die linear in dem Higgsfeld φ sind. Das wiederum impliziert, dass irgendwelche Quarks als SU(2)L –Dubletts transformieren. Analog zu den Leptonen versuchen wir es mit den linkshändigen Quarks, d.h. wir führen (zunächst nur für eine Generation) das linkshändige Quark–Dublett uL QL = (8.3) dL ein. Damit können wir zwei Arten von SU(2)L –invarianten Termen hinschreiben, Lud = − yd QL · φ dR − yu εij (QL )i (φ∗ )j uR + h.c. mit dem Levi–Civita–Symbol 0 1 ij (ε) = −1 0 und (ε)ij = 0 1 −1 0 Bemerkung zu den SU(2) Dublett–Kontraktionen. SU(2) Dubletts ψ und χ invariant zu kontrahieren, ψ∗ · χ und ψ·ε·χ. (8.4) . Es gibt zwei Möglichkeiten, (8.5) Die erste Kontraktion ist übertragbar auf beliebige SU(N ) Symmetrien während die zweite spezifisch für die SU(2) gilt und Konsequenz der Tatsache ist, dass eine anti–symmetrische 2 × 2–Matrix nur eine Komponente hat. Wir müssen uns nun über die Quantenzahlen der Felder QL , uR und dR Gedanken machen. Ausgangspunkt ist die Forderung, dass das Quark–Dublett als 3–plett unter der SU(3)C und als 2–plett unter der SU(2)L transformiert. Des Weiteren transformieren die rechts–händigen Quark–Singletts uR und dR als 3–pletts unter SU(3)C . Deren elektrische Ladungen sind durch Q = qY gegeben. Um dem u–Quark bzw. dem d–Quark die Ladungen Q = 2/3 bzw. Q = −1/3 zu verleihen, müssen also uR bzw. dR die Hyperladungen qY (uR ) = 2/3 bzw. qY (dR ) = − 1/3 tragen. Damit die Terme in (8.4) eichinvariant sind, muss, da φ die Ladung 1/2 hat, QL die Ladung 1/6 haben. Interessanterweise sind beide Terme in (8.4) konsistent mit dieser Ladungszuweisung; wir werden später einen möglichen Grund kennenlernen. Setzen wir jetzt den Vakuum–Erwartungswert für das Higgs–Feld ein (siehe (7.22)), so ergibt sich 1 1 Lud → − √ yd v dL dR − √ yu v uL uR + h.c. . 2 2 (8.6) 8 STANDARDMODELL 108 Dies führt auf die Quark–Massen 1 md = √ y d v 2 und 1 mu = √ y u v . 2 Das jetzt massive u–Quark wird durch uL und uR beschrieben. Im Folgenden soll dieses Verfahren auf die anderen Quark–Generationen ausgedehnt werden. Wie wir aus dem Experiment wissen, gibt es drei Generationen an Quarks. Daher können zusätzliche Kopplungsterme auftreten, die die Generationen mischen. Wir betrachten also drei Generationen an Quarks, f uL QfL = : 3 × (3, 2)1/6 unter SU(3)C × SU(2)L × U(1)Y , dfL ufR : dfR 3 × (3, 1)2/3 , : 3 × (3, 1)−1/3 . Die Notation ist dabei folgendermassen zu verstehen: Die beiden fett gedruckten Zahlen in den Klammern geben die Dimension der Darstellung bzgl. SU(3)C und SU(2)L an; das Subskript ist die Hyperladung. Wir haben hierbei eine willkürliche Basis für die Zustände gewählt. In dieser Basis haben wir −LQuark = 3 h X f,g=1 i f f QL · φ (Yd )f g dgR + QL · ε · φ∗ (Yu )f g ugR + h.c. . (8.7) Es gibt ausgezeichnete Basen. Die wichtigste ist die der Massen–Eigenzustände, in der die Yukawa–Matrizen Yu bzw. Yd diagonal sind. Es ist bekannt, dass sich beliebige Matrizen (u) biunitär diagonalisieren lassen (siehe Anhang F.2), d.h. es existieren unitäre Matrizen UL , (u) (d) (d) UR , UL und UR , so dass yu † (u) (u) , yc (8.8a) UL Yu UR = yt yd † (d) (d) . ys (8.8b) UL Yd UR = yb Hierbei sind yu , yc , yt , yd , ys und yb reell und positiv. Die Tatsache, dass die linkshändigen Quarks in Dubletts zusammengefasst sind, führt allerdings zu Subtelitäten. Um dies zu sehen, gehen wir zunächst in die Massen–Basis für die ‘u–artigen’ Quarks, d.h. anstatt in der ursprünglichen (willkürlich gewählten) Basis arbeiten wir in der Basis der gestrichenen Felder † (u) ~ ′ ~ ~ ′ = U (u) Q ~L , UL Q bzw. Q (8.9a) L = QL L L † (u) (u) UR ~uR′ = ~uR bzw. ~uR′ = UR ~uR . (8.9b) Gemäß dem oben Gesagten ist in dieser Basis die Yukawa–Matrix Yu diagonal, denn z.B. ~ T Y ~u = Q ~ ′ T U (u) † Y U (u) ~u ′ = Q ~ ′ T diag(y , y , y ) ~u ′ . Q u R u c t L u R L R L R L 8 STANDARDMODELL 109 Bezeichnen wir nun uL cL tL ~ ′L )T = (Q , , d′L s′L b′L und (~uR′ )T = (uR , cR , tR ) , (8.10) so entsteht nach elektroschwacher Symmetriebrechung, d.h. für 1 0 , φ → √ v 2 aus dem Yu –Term in (8.7) 3 X f,g=1 f QL · ε · φ∗ (Yu )f g ugR → yu v y v y v √ uL uR + √c cL cR + √t tL tR 2 2 2 =: mu u L u R + mc c L c R + mt t L t R . (8.11) Wir können die selben Schritte für die ‘d–artigen’ Quarks wiederholen. D.h., wir können in einer Basis † (d) ~ ′′ ~ ~ ′′L = U (d) Q ~L , UL Q bzw. Q (8.12a) L = QL L † (d) (d) bzw. d~R′′ = UR UR d~R′′ = d~R d~R . (8.12b) arbeiten, wobei ~ ′′ )T = (Q L u′L dL ′ ′ cL tL , , sL bL und (d~′R )T = (dR , sR , bR ) . (8.13) Analog zu (8.11) entsteht 3 X f,g=1 f QL · φ (Yd )f g dgR → yd v y v y v √ dL dR + √s sL sR + √b bL bR 2 2 2 =: md d L d R + ms s L s R + mb bL bR . (8.14) Allerdings haben wir i.A. (und in der realen Welt) ~ ′ 6= Q ~ ′′ . Q L L (8.15) Dies hat wichtige Konsequenzen. Die Tatsache, dass die QiL als SU(2)L 2–pletts transformieren, impliziert, dass die kovariante Ableitung Terme mit den W –Bosonen beinhalten, σa 1 f Dµ QfL = ∂µ QfL − i g2 W Q + ... . (8.16) 2 µ L Hierbei ist f ein Flavor–Index und a ein SU(2)L –Generator–Index. Nach der Diagonalisierung der Eichbosonen–Massen (siehe (7.23)) ergibt sich zunächst eine Kopplung zwischen den linkshändigen Quarks und den W ± Bosonen der Form X 1 f 1 f √ uL γ µ dfL Wµ+ + √ dL γ µ ufL Wµ− . (8.17) 2 2 f In der Massenbasis der u–artigen Quarks entsteht aus der Kopplung an W + 1 √ uL γ µ d′L + cL γ µ s′L + tL γ µ b′L Wµ+ , 2 (8.18) 8 STANDARDMODELL wobei 110 ′ տ dL sL = bL ւ (u) UL (u) † ր ց † · (d) տ ւ (d) UL dL · sL . bL ց ր (8.19) Die Matrix–Kombination UL UL bezeichnet — bis auf Phasenkonventionen, die wir uns etwas später ansehen werden — die sog. Cabibbo–Kobayashi–Maskawa–Matrix oder kurz CKM–Matrix VCKM .15 Zumeist schreibt man sie in der Form ′ d Vud Vus Vub d s′ = Vcd Vcs Vcb · s , (8.20) b′ Vtd Vts Vtb b wo die gestrichenen Zustände diejenigen sind, in welche die Masseneigenzustände bei Prozessen der schwachen Wechselwirkung übergehen. In dem rechtsstehenden Diagramm geht ein linkshändiges u–Quark in seinen Wechselwirkungspartner d′ = Vud d + Vus s + Vub b d′ über. Die Übergangswahrscheinlichkeit für den Übergang q → q ′ ist proportional zu |Vqq′ |2 . Die Matrix ist stark diagonaldominant, die Diagonalelemente sind vom Betrag ≥ 0.97; die Elemente, die ein Quark der ersten Generation mit einem Quark der zweiten Generation verknüpfen liegen betragsmäßig bei etwa 0.2 und die, die mit einem Quark der dritten Generation was zu tun haben, sind wesentlich kleiner als 0.02. (u) † u W+ (d) Phasen–Ambiguitäten. Die CKM–Matrix, VCKM = UL · UL , ist nicht eindeutig. (u) Um dies einzusehen, betrachte z.B. UL . Diese unitäre Matrix ist bestimmt dadurch, dass (u) † UL (u) Yu Yu† UL ! = diag(yu2 , yc2 , yt2 ) mit yu , yc , yt ∈ R. Wenn UL (u) (u) ′ UL (8.21) die Gleichung (8.21) erfüllt, erfüllt (u) = UL · diag(ei ϕ1 , ei ϕ2 , ei ϕ3 ) die Gleichung (8.21) ebenfalls. D.h., man hat drei Phasen, die nicht bestimmt sind, die man (willkürlich) in eine globale Phase (etwa ϕ3 ) und zwei relative Phasen (etwa ϕ1 − ϕ3 und (u) † (d) ϕ2 − ϕ3 ) einteilen kann. Insgesamt sehen wir dann, dass in UL · UL sind die Differenz der globalen Phasen und die insgesamt vier Relativ–Phasen unbestimmt sind. Ganz allgmein ist die CKM–Matrix bei n Generationen von Quarks eine U(n)–Matrix. 2n − 1 Parameter lassen sich in der Phasenwahl der Zustände absorbieren, sodass man die CKM–Matrix durch n2 − 2n + 1 Parameter beschreiben kann. Cabibbo–Winkel. Betrachte nur zwei Generationen. Dann gibt es lediglich einen Parameter, den sog. Cabibbo–Winkel θC . Man hat dann beispielsweise j V1j d′ L = cos θC d′L + sin θC s′L . (8.22) Der Term sin θC erlaubt es einem s–Quark, schwach in ein u–Quark zu zerfallen. 15 Kobayashi und Maskawa haben im Jahr 2008 für damit im Zusammenhang stehende Arbeiten den Nobelpreis erhalten. 8 STANDARDMODELL 111 Standardparametrisierung der CKM–Matrix. Für n = 3 benötigt man 4 Parameter. Die Matrix wird dann üblicherweise zerlegt in zwei unphysikalische Phasenmatrizen und die physikalische CKM–Matrix V , U wobei = diag(ei δu , ei δc , ei δt ) · V · diag(e−i φ1 /2 , e−i φ2 /2 , 1) , c12 c13 V = −c23 s12 − s23 s13 c12 eiδ s23 s12 − c23 s13 c12 eiδ s12 c13 c23 c12 − s23 s13 s12 eiδ −s23 c12 − c23 s13 s12 eiδ (8.23) s13 e−iδ s23 c13 . c23 c13 (8.24) Dabei sind cij := cos θij und sij := sin θ12 . Die beiden Phasen-Matrizen diag(ei δu , ei δc , ei δt ) und diag(e−i φ1 /2 , e−i φ2 /2 , 1) können in einer Re-Definition der Felder absorbiert werden. Was bleibt sind die physikalischen CKM-Parameter θ12 , θ13 , θ23 und δ. Insbesondere ergibt sich für δ 6= 0 eine komplexe Matrix, was, wie später diskutiert wird, CP-Verletzung impliziert. Wolfenstein-Parametrisierung. Zum Teil wird von der sog. Wolfenstein-Parametrisierung Gebrauch gemacht, die eine näherungsweise Beschreibung der CKM-Matrix erlaubt, λ A λ3 (ρ − iη) 1 − 12 λ2 . A λ2 1 − 21 λ2 (8.25) V ≃ −λ − i A λ5 η 3 2 4 A λ (1 − ρ − iη) −A λ − i A λ η 1 Diese kann als Entwicklung in λ ≃ 0.23 ≃ sin θC aufgefasst werden. i i Fazit: Die Masseneigenzustände der Quarks u′ L bzw. d′ L und die Quarkzustände, die an die schwache Wechselwirkung koppeln, stimmen nicht überein, sondern sind durch die CKM-Matrix verbunden. Durch die schwache Wechselwirkung sind also Übergänge zwischen den Quark-Generationen im Sinne der Masseneigenzustände möglich. Ausdehnung auf Leptonen: Prinzipiell spräche nichts dagegen, die Vorgehensweise g von den Quarks auf die Leptonen zu übertragen. Man müsste lediglich drei Felder νR einführen, die komplett invariant unter SU(3)C × SU(2)L × U(1)Y sind. Zusätzlich müsste zur Lagrangedichte (7.18) ein Term fi g Lν = − (Yν )f g εij ℓL (φ∗ )j νR + h.c. (8.26) addiert werden. Völlig analog zu den Quarks würde man • massive Neutrinos und • Übergänge zwischen den Leptonenfamilien bekommen. Tatsächlich werden beide Phänomene beobachtet. Allerdings ist die Masse der Neutrinos von der Größenordnung 0.1 eV oder darunter. Dies erfordert Yukawa–Kopplungen von Ordnung . 10−12 . Später werden wir eine Konstruktion diskutieren, die kleine Neutrinomassen plausibel macht. 8 STANDARDMODELL 8.2 112 Lagrangedichte des Standardmodells Eichgruppe. Die Eichgruppe des Standardmodells ist GSM = SU(3)C × SU(2)L × U(1)Y . (8.27) Selbstverständlich gilt, dass [Ta , Ii ] = [Ta , Y ] = [Ii , Y] = 0 , {Ta }8a=1 (8.28) SU(3)C , {Ii }3i=1 wo mit Ta = λa /2 die Generatoren der ratoren der SU(2)L und Y der Generator der U(1)Y sind. mit Ii = σi /2 die Gene- Fermionen. Die Eichquantenzahlen der Fermionen des Standardmodells sind in Tabelle 8.1 zusammengefasst. ν e e L νµ µ eR µR u c d′ s′ L Darstellung ν τ τ L L L (1, 2)−1/2 Q 0 −1 τR t b′ L (1, 1)−1 −1 (3, 2)1/6 2 3 − 31 uR cR tR (3, 1)2/3 2 3 dR sR bR (3, 1)−1/3 − 31 Leptonen Quarks Tabelle 8.1: Fermionen des Standardmodells. Q bezeichnet die elektromagnetische Ladung. Higgs. Des Weiteren beinhaltet das Standardmodell noch das skalare Higgsfeld φ, das bzgl. der SU(2)L als 2–plett transformiert und die schwache Hyperladung +1/2 trägt, d.h. + φ : (1, 2)1/2 . φ = φ0 Bezüglich der SU(3)C sind alle Leptonen Singletts, die Quarks Tripletts und das Higgsfeld Singlett. Lagrangedichte. L = Die Lagrangedichte des Standardmodells ist 1 1 1 − tr(Gµν Gµν ) − tr(Wµν W µν ) − Bµν B µν 2 2 4 3 h X f f QL iγ µ Dµ QfL + ufR iγ µ Dµ ufR + dR iγ µ Dµ dfR + f =1 f + ℓL iγ µ Dµ ℓfL + efR iγ µ Dµ efR − 3 h X f,g=1 f i f f (Yu )f g QL · ε · φ∗ ugR + (Yd )f g QL · φ dgR + (Ye )f g ℓL · φ egR + h.c. i 8 STANDARDMODELL 113 + (Dµ φ)† (Dµ φ) − + Eichfixierung . 2 λ † φ φ − v2 2 (8.29) Dabei gilt: • Die einzelnen Feldstärketensoren sind = Gaµν Ta Wµν = i Wµν Ii Bµν = ∂ µ Bν − ∂ ν Bµ . Gµν a mit Gaµν = ∂µ Gaν − ∂ν Gaµ + g3 fbc Gbµ Gcν , mit Wµν i = ∂µ Wνi − ∂ν Wµi + i g2 fjk Wµj Wνk (8.30a) , (8.30b) (8.30c) Die Spuren können dabei auch in Kontraktionen der Gruppenindizes umgewandelt werden, etwa 1 1 tr(Gµν Gµν ) = Gaµν Gµν a . 2 4 • Die einzelnen kovarianten Ableitungen sind implizit durch die jeweilige Darstellung gegeben, Dµ QfL = ∂µ − i g3 Gaµ Ta − i g2 Wµi Ii − i g1 qY (QL ) Bµ QfL , (8.31a) f f i (8.31b) Dµ ℓL = ∂µ − i g2 Wµ Ii − i g1 qY (ℓL ) Bµ ℓL , f f a Dµ uR = ∂µ − i g3 Gµ Ta − i g1 qY (uR ) Bµ uR , (8.31c) (8.31d) Dµ dfR = ∂µ − i g3 Gaµ Ta − i g1 qY (dR ) Bµ dfR , Dµ efR Dµ φ = = [∂µ − i g1 qY (eR ) Bµ ] efR , ∂µ − i g2 Wµi Ii − i g1 qY (φ) Bµ φ . (8.31e) (8.31f) Die Hyperladungen qY erscheinen als Index in Tabelle 8.1. • Im Grundzustand hat man SU(2)L × U(1)Y 0 φ→ v −−−−−−−−−→ U(1)em . Die resultierenden elektrischen Ladungen sind in der letzten Spalte von Tabelle 8.1 aufgelistet. Parameter des Standardmodells. auf: Im Standardmodell treten die folgenden Parameter 3 Eichkopplungen: g1 , g2 , g3 9 Fermion–Massen: (mν = 0) m u , md , mc , ms , mt , mb me , mµ , mτ 4 CKM–Parameter: θ12 , θ13 , θ23 , δ 2 Higgs–Parameter: v, λ 18 Parameter des Standardmodells 8 STANDARDMODELL 114 Bemerkungen: (1) 18 Parameter genügen, um eine große Zahl an Observablen zu beschreiben. Anderseits sind 18 Parameter ein bisschen zu viel dafür, um das Standardmodell eine wirklich grundlegende Theorie nennen zu können. (2) Die Terme in LSM umfassen alle eichinvariante und renormierbare (d.h. die Kopplungsstärke hat nicht–negative Massendimension) Möglichkeiten bis auf e µν , θQCD Gµν G (8.32) e µν = 1 εµνρσ Gρσ den sog. dualen Feldstärketensor bezeichnet, und der analogen wo G 2 Konstruktion für Wµν und Bµν . Während die beiden letztgenannten keine beobachtbaren Konsequenzen haben, würde ein nicht–triviales θQCD interessante Implikationen besitzen. Bisher kann man nur obere Schranken an θQCD angeben; man könnte θQCD durchaus als 19. Parameter des Standardmodells bezeichnen. (3) Diese herkömmliche Version von LSM beschreibt nicht die beobachteten Neutrino– Massen, die wir separat in 9.1 diskutieren werden. (4) Alle Parameter des Standardmodells sind (abgesehen von Messungenauigkeiten) bekannt bis auf λ, ein Maß für die Higgs–Masse. Tatsächlich repräsentiert die letzte Zeile in (8.29) nur die ökonomischste Möglichkeit, elektroschwache Symmetriebrechung zu realisieren. Das Higgs Teilchen wurde (noch?) nicht nachgewiesen; es ist durchaus denkbar, dass es die elektroschwache Symmetriebrechung von einem komplexeren Sektor kommt. 8.3 Symmetrien des Standardmodells Neben den Eich–Symmetrien SU(3)C × SU(2)L × U(1)Y hat das Standardmodell noch weitere Symmetrien, die im Folgenden diskutiert werden. (i) Raum–Zeit–Symmetrien Die SU(2)L × U(1)Y –Wechselwirkungen verletzen offensichtlich P und C. Z.B. gilt P νL −→ νR , (8.33a) d.h. ein Teil des SU(2)L Lepton–Dubletts wird abgebildet auf ein Teilchen, das es im Standardmodell nicht gibt. Die analoge Aussage gilt für C νL −→ ν L . (8.33b) Jedoch hat man für die kombinierte Transformation CP νL −−−→ ν R , das Antiteilchen zum linkshändigen Neutrino ist ein rechtshändiges Anti–Neutrino. (8.34) 8 STANDARDMODELL 115 Bemerkung: Tatsächlich ist die Benennung SU(2)L , wobei das L“ für links“ steht, ” ” reine Konvention, da wir die Chiralität der Teilchen, aus denen sich unsere Umgebung zusammensetzt, betrachten. Im Prinzip könnten wir die Rolle von Teilchen und Anti– Teilchen vertauschen; wir würden dann in einer Welt leben, in der die Gegenstände im Wesentlichen aus Anti–Materie besteht, und würden von einer SU(2)R sprechen. Nun könnte man vermuten, dass die Kombination CP erhalten ist. Im Folgenden soll 0 gezeigt werden, dass dies nicht der Fall ist. Dazu betrachte das K 0 − K –System. Die Kaonen sind auch s- und d–Quarks zusammengesetzt, |K 0 i = |s di , 0 |K i = |d si . (8.35) 0 |K 0 i und |K i werden durch CP bis auf eine Phase in einander abgebildet, 0 C P |K 0 i = ξ |K i ; (8.36) wir wählen ξ = −1. 0 Die Zustände |K 0 i und |K i mischen. Dies kann daran gesehen werden, dass beide in Pionen zerfallen können. Für unsere Diskussion werden die in Abbildung 8 gezeigten Diagramme von Bedeutung sein. d¯ u, c, t u, c, t s d¯ s̄ W W d (a) s̄ ū, c̄, t̄ W s W u, c, t (b) d Abbildung 8: Box–Diagramme. Nun soll ein System von zwei mischenden Zuständen quantenmechanisch beschrieben werden. Hier folgen wir [16, S. 232 ff.]. Dazu identifizieren wir 0 a(t) 0 |ψ(t)i = a(t) |K i + b(t) |K i ≡ . (8.37) b(t) Wir sind nur an der Zeit–Abhängigkeit interessiert. Der Hamilton–Operator ist dann eine Matrix i H11 H12 H = H = M− Γ = , (8.38) H21 H22 2 wobei M † = M und Γ† = Γ gilt. Es lässt sich zeigen, dass CPT–Invarianz impliziert H11 = H22 , M11 = M22 , Somit können wir H schreiben als i A p2 H = M− Γ = q2 A 2 Γ11 = Γ22 . (8.39) (8.40) Diagonalisieren der hermiteschen Matrix H führt auf zwei Eigenzustände |KL i und |KS i, d.h. H |KL/S i = λL/S |KL/S i , (8.41) 8 STANDARDMODELL 116 wobei mit |KL/S i = p 1 |p|2 + |q|2 0 p |K 0 i ± q |K i λL/S = 2 q p i i p ML/S − ΓL/S = M11 − Γ11 ± 2 2 q = ∗ M12 − 2i Γ∗12 , M12 − 2i Γ12 2p q = = (8.42) i M12 − Γ12 2 , i (ML − MS ) − (ΓL − ΓS ) 2 1/2 1/2 i i ∗ 2 M12 − Γ12 M12 − Γ∗12 . 2 2 Betrachte nun die CP–Eigenzustände i 1 h 0 0 |K± i = √ |K 0 i ∓ |K i 2 (8.43) (8.44) (8.45) (8.46) mit 0 0 C P |K± i = ± |K± i. (8.47) Vergleich mit (8.42) zeigt, dass die CP–Eigenzustände nicht den Eigenzuständen von H entsprechen, sondern |KL/S i = p Hierbei ist ε = 1 1+ |ε|2 0 0 |K∓ i ± ε |K± i . p−q . p+q (8.48) (8.49) Man kann weiter zeigen, dass ein Zustand aus zwei bzw. drei Pionen gerade bzw. ungerade unter CP ist (vgl. Übungen). Das langlebige Kaon KL zerfällt dominant in drei Pionen, aber zu einem kleinen Teil auch in zwei Pionen. Dies zeigt, dass KL einen (kleinen) Anteil an K+ hat. Andererseits kann man sich vorstellen, dass man KL aus drei Pionen produziert. Wenn KL dann in zwei Pionen zerfällt, ist offensichtlich CP verletzt. Man kann mittels der Box–Diagramme (Abbildung 8) die Mischung der Kaonen, und somit CP–Verletzung, zur CKM–Matrix in Beziehung setzen. Man findet durch Rechnung der Diagramme, dass im Quark–Sektor des Standardmodells CP genau dann verletzt ist, wenn • δ nicht–trivial ist, d.h. δ 6= 0, π (vgl. Gleichung (8.24)), und • es nicht–triviale Mischung zwischen allen drei Generationen gibt. Experimentell findet man δ ≃ 60◦ . Man beachte auch, dass CP–Verletzung nicht–triviale CKM–Matrix–Elemente erfordert. M.a.W., ohne Quark–Mischung gäbe es auch keine CP Verletzung im Quark–Sektor. Das wird durch die sog. Jarlskog–Invarianten explizit gemacht, die durch JCP = 1 1 ∗ ∗ ∗ ∗ |Im(V11 V12 V21 V22 )| = |Im(V11 V13 V31 V33 )| 2 2 8 STANDARDMODELL = 117 1 1 ∗ ∗ |Im(V22 V23 V32 V33 )| = c12 c213 c23 sin δ s12 s13 s23 2 2 (8.50) gegeben sind, und die ein Maß für die CP–Verletzung darstellen. Ist beispielsweise θ13 = 0, so verschwindet JCP , und es gibt keine CP–Verletzung. Abschließend sei bemerkt, dass CP–Verletzung eine entscheidende Rolle in der (Teilchen)Kosmologie spielt. So erfordert die Erklärung der beobachteten Baryonen–Antibaryonen– Asymmetrie eine Verletzung von CP. CP–Verletzung impliziert nach dem CPT–Theorem T–Verletzung. Ob die mikroskopische CP–Verletzung in direktem Zusammenhang mit der z.B. durch den zweiten Hauptsatz der Thermodynamik ausgezeichneten Zeitrichtung steht, ist nicht wirklich geklärt. Fazit: Die diskreten Transformationen P, T und C sind nicht Symmetrien des Standardmodells der Elementarteilchenphysik. (ii) Globale Symmetrien Neben den Eichsymmetrien gibt es im Standardmodell kontinuierliche globale Symmetrien. Die Lagrangedichte (8.29) hat vier globale U(1) Symmetrien, die Baryonzahl U(1)B sowie die drei Leptonfamilienzahlen U(1)e , U(1)µ und U(1)τ , die definiert sind durch U(1)B : QfL → exp(i β/3) QfL , (8.51a) , (8.51b) , (8.51c) (8.51d) ufR dfR U(1)e : U(1)µ : U(1)τ : → exp(i β/3) ufR exp(i β/3) dfR → eR → exp(i αe ) eR νe → exp(i αe ) eL , νe eL , (8.51e) µR → exp(i αµ ) µR , νµ νµ → exp(i αµ ) , µL µL (8.51f) τR → exp(i ατ ) τR , ντ νe → exp(i ατ ) . τL eL (8.51g) (8.51h) (8.51i) D.h., die Quarks tragen Baryon–Zahl 1/3. Gemäß dem Noether’schen Theorem ergeben sich daraus vier klassische Erhaltungsgrößen, die Baryon–Zahl B sowie die drei Leptonfamilienzahlen Le , Lµ und Lτ . Die Baryon–Zahl–Erhaltung impliziert die Stabilität des Protons; das Proton ist bekanntlich sehr stabil, seine ‘Halbwertszeit’ beträgt mindestens 1033 Jahre. Es sei bemerkt, dass diese klassischen Erhaltungsgrößen auf dem Quantenniveau nicht streng erhalten sind, sondern dass die entsprechenden Erhaltungssätze durch sog. Anomalien gebrochen werden. Es zeigt sich jedoch, dass es eine nicht–anomale Linearkombination gibt, die U(1)B−L , die sich ergibt, indem man β = −αe − αµ − ατ setzt in (8.51). Diese ist nicht–anomal in dem Sinn, dass sich die gemischten SU(3)C − SU(3)C − U(1)B−L -, SU(2)L − SU(2)L − U(1)B−L - und U(1)Y − U(1)Y − U(1)B−L –Anomalien wegheben. Damit sich die gravitationellen und U(1)B−L − U(1)B−L − U(1)B−L –Anomalien ebenfalls wegheben, muss man drei rechts–händige Neutrinos einführen (siehe Gleichungen (8.26) und (9.5)). 8 STANDARDMODELL 118 Fazit: Die Lepton- und Baryonzahl–Symmetrien sind zufällige Symmetrien des Standardmodells und auf dem Quanten–Niveau gebrochen. Es gibt eine globale U(1)B−L – Symmetrie, die frei ist von Anomalien. Wie wir später in Abschnitt 9.1 diskutieren werden, gibt es Gründe, anzunehmen, dass diese ebenfalls gebrochen ist. 8.4 Vorhersagen und Tests Der elektroschwache Sektor beinhaltet vier Parameter, die zwei Eichkopplungen g1 und g2 sowie die Parameter des Higgs–Potentials µ2 und λ. Diese Parameter können eingetauscht werden gegen vier Messgrößen, die Feinstruktur–Konstante α, die Fermi–Konstante GF , die Z–Masse MZ und die (noch) unbekannte Higgs–Masse mh . f W f Z f′ (a) W → f + f ′ . f (b) Z → f + f . Abbildung 9: Zerfall eines (a) W - bzw. (b) Z–Bosons in zwei Fermionen. Beim W –Zerfall können das Fermion und das Anti–Fermion verschiedene Flavors haben. Die Blobs deuten an, dass (Quanten-)Korrekturen berücksichtigt sind. Am LEP Experiment wurden die W - und Z–Bosonen in großen Zahlen produziert. Es gibt viele Observablen im Zusammenhang mit ihrer Produktion bzw. ihrem Zerfall (Abbildung 9). Zerfallsraten und W - bzw. Z–Masse. Die Massen MW und MZ können beispielsweise kinematisch gemessen werden, die Lebensdauer liefert die Zerfallsraten ΓW und ΓZ . R–Verhältnisse. Die Verhältnisse der verschiedenen partiellen Zerfallsraten, etwa das Verhältnis der Zerfallsrate des Z in b–Quarks zu der Zerfallsrate des Z in beliebige Hadronen, Rb = 1 Γ Z →b+b . Γ(Z → Hadronen) (8.52) Wie wir in Abschnitt 5.4 (i) diskutiert haben kann man aus den R–Verhältnissen auch auf die Zahl der Farben schließen. 8 STANDARDMODELL 119 f e+ Vorwärts–Rückwärts–Asymmetrien. aktionen vom Typ In Re- e+ + e− → Z/γ → f + f Z, γ ist die Richtung des auslaufenden Fermions f korreliert mit der Richtung des einlaufenden Elektrons. Dies wird durch die sog. Vorwärts–Rückwärts– e− Asymmetrien Affb ausgedrückt, die erklärt sind über Affb = σff − σbf σff + σbf f für f = µ, τ, b, c . ρ = MZ2 ϑ e− Dabei ist σff der Wirkungsquerschnitt für ein vorwärts auslaufendes Fermion, d.h. ϑ ∈ [0, π/2] in der rechtsstehenden Abbildung, wohingegen σbf den Wirkungsquerschnitt für ein vorwärts auslaufendes Fermion bezeichnet. ρ–Parameter. f • e+ f Eine weitere wichtige Observable ist der sog. ρ–Parameter, der durch 2 MW cos2 θW (8.53) definiert ist. Auf Tree–Niveau gilt ρ = 1. Schleifen korrigieren diesen Wert. Insbesondere liefern Schleifen Korrekturen zu der Masse der W ± - und Z–Bosonen (Abbildung 10). t W+ t W+ b (a) Korrektur zum W + Propagator. Z Z t (b) Korrektur zum Z Propagator. h h W ±, Z W ±, Z (c) Higgs–Korrektur. W ±, Z W ±, Z (d) Higgs–Korrektur. Abbildung 10: Schleifen–Korrekturen zum ρ–Parameter. Dabei haben die Korrekturen, etwa 10(a) und 10(b), die identische Struktur, unterscheiden sich jedoch dadurch, dass die Teilchen, die in den Schleifen propagieren, verschiedene Massen und Kopplungen an die Eichbosonen haben. Hätten sie identische Massen und Kopplungen, wären die Quantenkorrekturen universell und es würde ρ = 1 auch auf dem Quantenniveau gelten. Man sagt, es gibt eine ‘custodial SU(2) Symmetrie’, die lediglich 8 STANDARDMODELL 120 durch die Yukawa–Kopplungen und die Hyperladung gebrochen wird. Dementsprechend hängen die Korrekturen von den Fermionmassen ab und sind durch die t–Masse dominiert. Die Diagramme in Abbildungen 10(a) und 10(b) liefern ∆ρ(t) ≃ m2t 3GF m2t √ ∝ 2 . MW 8π 2 2 (8.54) Historisch konnte damit die t–Masse vorhergesagt werden bevor das Teilchen am TeVatron gefunden wurde. Die Higgs–Korrekturen 10(c) und 10(d) hängen von der Higgs–Masse ab, jedoch nur logarithmisch, ∆ρ(h) = − C ln m2h 2 . MW (8.55) Damit kann man im Prinzip die Higgs–Masse vorhersagen. Jedoch ist diese Vorhersage sehr sensitiv auf Parameter wie z.B. die t–Masse, von der ρ quadratisch abhängt. Wir werden später sehen, dass dadurch die Vorhersage noch relativ große Fehlerbalken hat; dies gilt leider auch für analoge Möglichkeiten, die Higgs–Masse indirekt zu bestimmen. Eichboson–Selbstwechselwirkung. Wie wir bei der Diskussion der nicht–abelschen Eichtheorien gesehen hatten, treten Wechselwirkungen zwischen den Eichbosonen auf (vgl. S. 52). Beispielsweise benötigt man, um die Beobachtung im Prozess e+ + e− → W + + W − beide in Abbildung 11 dargestellten Diagramme. e− W− e− W− νe Z, γ e+ (a) W+ e+ (b) W+ Abbildung 11: W –Boson Paar–Produktion. 8.5 Der Higgs–Sektor Alle Teilchen des Standardmodells wurden im Experiment gesehen — bis auf das Higgs– Boson. An dieser Stelle sei bemerkt, dass das Higgs–Boson die minimale Möglichkeit darstellt, die elektroschwache Symmetriebrechung zu bewerkstelligen und die Fermion–Massen zu generieren. Es ist sehr gut möglich, dass es einen ganzen Higgs–Sektor gibt; beispielsweise sagen supersymmetrische Theorien mindestens zwei Higgs–Bosonen voraus. Eine der wesentlichen Aufgaben des derzeit laufenden LHC Experiments ist die Suche nach dem Higgs bzw. die Klärung der Frage des Ursprungs der elektroschwachen Symmetriebrechung. 8 STANDARDMODELL (i) 121 Hierarchie–Problem Ein konzeptionelles Problem des Higgs–Sektors ist, dass die Higgs–Masse UV–sensitiv“ ” ist. Damit ist gemeint, dass Strahlungskorrekturen der Higgs–Masse von der Größenordnung einer Einbettungs–Skala Λ sind, d.h. einer Skala, an der die Beschreibung durch das Standardmodell ihre Gültigkeit verliert. Um das zu sehen, betrachte die Korrekturen, die aus den Yukawa–Kopplungen resultieren, f −i M 2 (p) k+p = h k p = − (−iyf )2 = − 4 yf2 Z f Z h p i k+p+m i k+m d4 k f f i ih tr h (2π)4 (k + p)2 − m2 k 2 − m2 f f k · (p + k) + m2f d4 k i. ih h (2π)4 (k + p)2 − m2 k 2 − m2 f f (8.56) Durch dimensionale Analyse sehen wir, dass das Integral (nach einer Wick–Rotation) quadratisch divergiert (vgl. die Diskussion auf S. 61). M.a.W., die Korrekturen zur Higgs– Masse gehen wie yf2 Λ2 , wegen yt ≫ yf 6=t also ∆m2h ≃ 1 2 2 y Λ . 16π 2 t (8.57) Man nimmt deswegen an, dass das Standardmodell nicht zu beliebig hohen Skalen die Physik angemessen beschreibt, sondern dass es bei Λ ≃ TeV neue Physik jenseits des Standardmodelles gibt. Wir werden darauf kurz in Abschnitt 9 eingehen. (ii) Higgs–Produktion Um das Higgs–Boson direkt nachzuweisen, muss es zunächst einmal produziert werden. Dafür sind sowohl Lepton- als auch Hadron–Collider geeignet (Abbildung 12). Am LEP Experiment wurde nach dem Higgs gesucht, es jedoch nicht gefunden. Daraus leitet man eine Schranke mh & 114 GeV (8.58) an die Higgs–Masse ab. Dabei muss man insofern vorsichtig sein, als dass das eine Schranke an ein Boson mit den Eigenschaften des SM Higgses ist; in Erweiterungen des SM gibt es durchaus die Möglichkeit, leichtere Skalare zu haben die konsistent sind mit dem LEP Experiment. (iii) Higgs–Kopplungen und Zerfall Am LHC wird man (hoffentlich) viele Resonanzen sehen. Nehmen an, eine davon hat eine Masse von mehr als 114 GeV und ist neutral. Ist das das Higgs? Es gibt einige, für das Higgs charakteristische Eigenschaften. Alle Tree–Niveau Kopplungen sind proportional zu Massen, da die Massen ja ihrerseits vom Vakuum–Erwartungswert des Higgs kommen. Dementsprechend ist der Zerfall von dem schwersten kinematisch zugänglichen Teilchen dominiert. Das kann, für ein schweres Higgs, das tt–Paar sein oder, 8 STANDARDMODELL 122 e− h G h Z e+ Z G (b) (a) Abbildung 12: Higgs–Produktion. Das Higgs–Boson kann sowohl in (a) e+ e− –Kollisionen als auch in (b) Hadron–Collidern produziert werden. Wlong , Zlong f h h Wlong , Zlong f (a) M ∝ mf . (b) M ∝ mh . G h γ h (c) G γ (d) Abbildung 13: Higgs–Zerfälle. Die Übergangsamplituden der Tree–Niveau Diagramme (a) und (b) sind proportional zu Massen, aber es gibt auch Schleifendiagramme, etwa (c) und (d), die den Zerfall in masselose Teilchen erlauben. für ein leichteres Higgs, die bb- bzw. τ τ –Paare (Abbildung 13(a)). Es gibt auch eine signifikante Zerfallsrate in die longitudinalen Komponenten der W - und Z–Bosonen (Abbildung 13(b)). Diagramme mit Schleifen ermöglichen den Zerfall in Gluonen (Abbildung 13(c)) und Photonen (Abbildung 13(d)). Die Zerfallsraten für den Zerfall in Fermionen (Abbildung 13(a)) und in die longitudinalen Komponenten der W –Bosonen sind für mh ≫ mf , MW Γ h→f +f Γ(h → Zlong + Zlong ) = = GF mh m2f √ Nc , 4π 2 1 GF m3h √ . Γ(h → Wlong + Wlong ) = 2 32π 2 (8.59a) (8.59b) Dabei konzentrieren wir uns auf die longitudinalen Komponenten der Z–Bosonen, denn 8 STANDARDMODELL 123 es erweist sich, dass diese Prozesse die dominanten Beiträge liefern (vgl. die Übung zum Goldstone Equivalence Theorem“). Des Weiteren ist Nc ein Farbfaktor, d.h. Nc = 3 für ” Quarks und Nc = 1 für Leptonen. Die Verzweigungsverhältnisse des Higgs in verschiedene Zerfallsprodukte hängt stark von der betrachteten Energie ab. Falls das Higgs–Boson vergleichsweise schwer ist, mh > 2MW , dominiert der Zerfall in zwei W –Bosonen. Falls das Higgs relativ nahe bei der unteren Massenschranke von ungefähr 114 GeV ist, könnte der Zerfall in zwei Photonen der Kanal mit den größten Erfolgsaussichten bedeuten. Das würde bedeuten, dass es mehrere Jahre dauern könnte, bis das Higgs–Boson am LHC gefunden ist. (iv) Schranken an die Higgs–Masse Wir beschäftigen uns nun mit der Higgs–Masse. Im Standardmodell ist m2h = 2λv 2 ein freier Parameter und kann nicht vorhergesagt werden. Nun sollen kurz die experimentellen Schranken angegeben werden: • Das Higgs wurde beim LEP Experiment nicht gefunden. Daher schliesst man, das mh & 114 GeV . (8.60) • Wie bereits erwähnt, trägt das Higgs zu Strahlungskorrekturen bei, insbesondere zum ρ–Parameter. Daher liefern Präzisionsmessungen indirekte Schranken an die Higgs–Masse. Die Resultate eines globalen Fits sind im sog. “Blueband–Plot” (Abbildung 14) dargestellt. Mit einer statistischen Sicherheit von 95 % ist das Higgs–Boson leichter als 185 GeV. Bemerkung: Es gibt theoretische Argumente, die relativ enge obere bzw. untere Schranken für die Higgs–Masse implizieren. (1) In der minimalen supersymmetrischen Erweiterung des Standardmodells ist die Higgs– Selbstkopplung λ durch die Eichkopplungen gegeben und man ein relativ leichtes Higgs, mh . 135 GeV. (2) Unter der Annahme, dass das Standardmodell eine adäquate Beschreibung auch bei höheren Energieskalen liefert, kann man Schranken aus der Forderung, dass λ zum einen perturbativ bleibt und zum Anderen nicht negativ wird, ableiten. Die relevanten Renormierungsgruppengleichungen lauten µ d λ(µ) dµ = µ d yt (µ) dµ = 1 2 12λ2 − 12 yt4 + . . . , (4π) 9 2 yt 2 y − 8g + . . . . 3 2 2 t (4π) (8.61a) (8.61b) Hierbei ist µ die Skala in dimensionaler Regularisierung und soll nicht mit dem Parameter im Higgs–Potential verwechselt werden! Wir sehen an (8.61), dass yt mit größerer Renormierungsskala µ kleiner wird. Das Verhalten von λ hängt von seinem Startwert“ an der elektroschwachen Skala, d.h. der Higgs–Masse ab. Wir nehmen ” nun an, das Standardmodell würde eine adäquate Beschreibung der Physik bis zu einer Skala Λ liefern. Dann gibt es zwei Schranken: STANDARDMODELL 124 6 Theory uncertainty ∆αhad = (5) 5 0.02758±0.00035 0.02749±0.00012 incl. low Q2 data 2 4 ∆χ 8 3 2 1 0 Excluded 30 100 300 mH [GeV] Abbildung 14: “Blueband–Plot”. (Für die Quelle der Abbildung siehe [17].) • Die sog. Trivialitäts–Schranke“ λ(µ) < ∞ für v ≤ µ ≤ Λ. λ muss in dem ” betrachteten Bereich endlich bleiben. Würde die Kopplung also an einer Skala µL < Λ explodieren, dann wäre die perturbative Interpretation der Theorie nicht mehr angemessen. M.a.W., das Standardmodell wäre nur bis zur Skala µL gültig. Im Umkehrschluss liefert also die Forderung, dass das Standardmodell bis zu einer Skala Λ die richtige Beschreibung liefert, eine obere Schranke an λ(v), und damit an die Higgs–Masse. • Die sog. Vakuum–Stabilitäts–Schranke“ λ(µ) > 0. Falls λ im Intervall v ≤ µ ≤ ” Λ negativ würde, wäre das Higgs–Potential nach unten unbeschränkt, und das elektroschwache Vakuum wäre nicht länger der Grundzustand der Theorie.16 Die numerischen Implikationen sind in Abbildung 15 dargestellt. 16 Es besteht durchaus die Möglichkeit, dass wir in einem metastabilen Vakuum leben. 8 STANDARDMODELL 125 60 0 M H [GeV/ 2 c ] mh /GeV 50 0 40 0 Triviality EW 3 00 Precision 2 00 1 00 EW vacuum is absolute minimum 0 3 5 7 9 11 13 15 17 19 Λ [ Ge V ] log10 Λ/GeV lo g 10 Abbildung 15: Trivialitäts- und Vakuum–Stabilitäts–Schranken an die Higgs–Masse. Nach rechts ist die Skala, bis zu der das Standardmodelle eine adäquate Beschreibung liefert, angetragen. (Für die Quelle der Abbildung siehe [17].) 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 9 9.1 126 Teilchenphysik jenseits des Standard–Modells Neutrino–Massen Das Standardmodell kann aus verschiedenen Gründen keine vollständige Beschreibung der Natur liefern. Es gibt einige wenige experimentelle Befunde, die zeigen, dass man das Standard–Modell, definiert durch (8.29), erweitert werden muss. Einer dieser Befunde ist die Beobachtung der sog. Neutrino–Oszillationen, die hier näher betrachtet werden sollen. Die bei Weitem plausibelste Erklärung von Neutrino–Oszillationen ergibt sich, wenn man annimmt, dass Neutrinos massive Teilchen sind. Allerdings kann man sich leicht überlegen, dass man mit dem Teilcheninhalt des Standardmodells (vgl. Tabelle 8.1) keine eichinvarianten und renormierbaren Terme schreiben lassen, die über (8.29) hinausgehen. D.h., um Neutrino–Massen zu beschreiben muss man: (1) nicht–renormierbare Operatoren zulassen und/oder (2) neue (νR ) Freiheitsgrade einführen. Im Folgenden soll zuerst die erste Möglichkeit betrachtet werden. (i) Der effektive Neutrino–Massenoperator Betrachte g 1 f κgf ℓC · ε · φ ℓ · ε · φ + h.c. . (9.1) L L 4 Hierbei ist ℓC L der ladungskonjugierte Spinor zu ℓL , κ eine Matrix von Kopplungen mit Massendimension GeV−1 , f und g sind Flavor–Indizes. Im Vakuum, d.h. für 1 0 , φ → √ v 2 hat man g 1 Lκ → κgf v 2 νLC νLf + h.c. . (9.2) 8 Dies stellt einen sog. Majorana–Massenterm dar (siehe Anhang H). Der Klarheit halber drücken wir (9.2) durch Weyl–Spinoren aus. Bezeichnen wir die linkshändigen ν Weyl– Spinoren mit ξ, f ξ , νLf = 0 Lκ = so wird (9.2) zu 1 1 f g ¯f ¯g κgf v 2 ξ ·ξ +ξ ·ξ , (9.3) 4 2 wo ·“ das SL(2, C)–invariante Spinor–Produkt bezeichnet. Der Faktor 1/2 vor der Klam” mer ist ein kombinatorischer Faktor, der, wie auch im Fall des reellen Skalarfeldes, auftritt, ¯ da die Klammer quadratisch in den ξ- und ξ–Spinoren ist. Wir identifizieren dementsprechend als Neutrino–Massen–Matrix 1 (mν )gf = κgf v 2 . (9.4) 4 Diese Massenterme (und natürlich auch (9.1)) brechen die Lepton–Zahl–Symmetrien in (8.51). Wenn diese Konstruktion in der Natur realisiert ist, sind Neutrinos gewissermaßen ihre eigenen Antiteilchen. 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS (ii) 127 Dirac–Neutrino–Massen Nun wenden wir uns der zweiten Möglichkeit zu, d.h. wir führen neue Freiheitsgrade ein, rechtshändige Neutrinos f νR : (1, 1)0 , (9.5) d.h. Singletts unter GSM . Dies ermöglicht es, die Lagrangedichte des Standardmodells um einen renormierbaren Term zu erweitern, g f + h.c. . LνDirac = − (Yν )gf ℓL · ε · φ∗ νR (9.6) Dieser Term ist das Analogon zum Yu –Term in (8.29). Analog zur Diskussion im Quark– Sektor liefert dieser Term eine Dirac–Masse für die Neutrinos, −LνDirac 0 v −−−−−−−−−→ φ→ √12 =: (iii) v f + h.c. (Yν )gf √ νL g νR 2 f + h.c. . (mDirac )gf νL g νR ν (9.7) See–Saw–Modell Wenn man die νR –Freiheitsgrade einführt und alle renormierbaren eichinvarianten Terme in die Lagrangedichte aufnimmt, gibt es noch einen Term, der berücksichtigt werden muss, g 1 C ν f + h.c. . LνMajorana = − Mgf νR R 2 (9.8) Man kann sich überlegen, dass nur der symmetrische Teil von M eine Rolle spielt, d.h. MT = M . (9.9) Es ist zu beachten, dass die Skala von M unabhängig von der elektroschwachen Skala ist. Betrachten wir jetzt der Einfachheit halber nur eine Generation, d.h. −LνDirac = −LνMajorana = y ℓL ε φ∗ νR + h.c. , 1 C ν + h.c. . M νR R 2 (9.10a) (9.10b) Dann kann dann die sog. See–Saw–Lagrangedichte umschreiben in −LSee−Saw = − (LνMajorana + LνDirac ) = 1 C Ψ M Ψ + h.c. , 2 wobei Ψ := νL C νR und M = 0 y √v 2 y √v2 M ! . (9.11) (9.12) Die Massenmatrix M hat die Invarianten det M = − y 2 v2 2 und tr M = M . (9.13) Für die Eigenwerte m1 und m2 ergibt sich daher m1 · m2 = − y 2 v 2 und m1 + m 2 = M . (9.14) 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS Dies führt auf m1/2 M = 2 1∓ r y2 v2 1+4 2 M 2 ! . 128 (9.15) Betrachte nun den Fall M ≫ y v. Es ergibt sich m1 ≃ − y2 v2 (mDirac )2 ν = − 2M M und m2 ≃ M . (9.16) Insbesondere gilt nun für die Eigenzustände ν1/2 ν1 ≃ νL und ν2 ≃ νR . (9.17) Diese Eigenschaft bleibt erhalten, wenn man anstatt einer drei Generationen betrachtet. Ein wesentliches Merkmal dieses Szenarios ist, dass man leichte Neutrinomassen erhält, die durch die See–Saw–Formel bestimmt sind, |mleicht | ≃ ν )2 (mDirac ν . M (9.18) Diese Struktur ergibt sich auch mit dem effektiven Neutrino–Massenoperator (9.1), wenn man κ = 1/M wählt. Tatsächlich entsteht (9.1) durch Ausintegieren schwerer rechtshändiger Neutrinos, wie die folgende Diskussion zeigt. (iv) Ausintegrieren schwerer Freiheitsgrade Es soll das Konzept des Ausintegrierens von effektiven Theorien erklärt werden. Wir betrachten dazu eine ‘Spielzeug–Lagrangedichte’ M2 2 1 Φ + a(φ) Φ − Lleicht (φ) . −Ltoy = − (∂µ Φ) (∂ µ Φ) + 2 2 (9.19) Hierbei ist Φ ein schweres reelles Skalarfeld, φ repräsentiert leichte Skalarfelder, die via dem a(φ) Φ Term an Φ koppeln. Nun soll die Theorie für Energieskalen E ≪ M untersucht werden. Für solche Energien kann der kinetische Term von Φ gegen M vernachlässigt werden, −Ltoy ≃ M2 2 Φ + a(φ) Φ − Lleicht (φ) . 2 Quadratische Ergänzung liefert 2 a(φ) a(φ)2 M2 Φ+ − Lleicht (φ) − −Ltoy ≃ 2 M2 2M 2 M 2 2 a(φ)2 =: Φ̃ − − Lleicht (φ) . 2 2M 2 (9.20) (9.21) Die Vorhersagen der Quantenfeldtheorie erhält man aus dem erzeugenden Funktional, d.h. aus dem Pfadintegral (bei dem wir die Quellen 0 gesetzt haben) Z Z 4 (9.22) Z = Dφ DΦ exp i d x Ltoy . 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS Wenn man die kinetischen Terme vernachlässigt, ergibt sich Z Z M 2 2 a(φ)2 4 e Φ̃ + + Lleicht (φ) . Z ≃ Dφ DΦ exp i d x − 2 2M 2 129 (9.23) e und die (Gauß’sche) IntegraNun kann man die Integrationsvariable verschieben, Φ → Φ, e durchführen mit dem Ergebnis tion über Φ Z Z a(φ)2 4 Z ≃ N Dφ exp i d x + Lleicht (φ) . (9.24) 2M 2 N ist eine irrelevante Normierungskonstante. Das schwere Feld Φ ist aus der Theorie verschwunden, man sagt es sei ‘ausintegriert’ worden. Die Theorie wird nun durch eine effektive Lagrangedichte beschrieben, Leff = a(φ)2 + Lleicht (φ) , 2M 2 (9.25) die nur die leichten Freiheitsgrade betrifft. Es gibt neue Wechselwirkungen zwischen den leichten Feldern, die durch die Skala M unterdrückt sind, und die nicht–renormierbare Terme beinhalten kann auch wenn die Ausgangstheorie renormierbar war. Bemerkung: ! 0 = Wenn man in den Bewegungsgleichungen von Φ, ∂Ltoy ∂Ltoy − ∂µ , ∂Φ ∂(∂µ Φ) die Ableitungs–Terme vernachlässigt, erhält man die algebraische Relation Φ = − a(φ) . M2 Einsetzen in Ltoy und Vernachlässigen des kinetischen Terms von Φ liefert ebenfalls Leff . Diese Aussage gilt ganz allgemein: Ersetzung Ausintegrieren von Φ durch schwerer Bewegungsgleichung ↔ Freiheitsgrade unter Vernachlässigung Φ für E ≪ M der kinetischen Terme Es gibt Ausnahmen von dieser Regel, wenn man Eichtheorien betrachtet. Beispiel: Der effektive Neutrino–Massen–Operator (9.1) ergibt sich durch Ausintegrieren der rechtshändigen Neutrinos in der See–Saw–Lagrangedichte (9.11). (v) Neutrino–Massendiagonalisierung Neutrinomassen implizieren, dass — wie auch im Quark–Sektor — die Wechselwirkungspartner bzgl. der schwachen Wechselwirkung nicht mit den Masseneigenzuständen übereinstimmen müssen. Es soll nun die Neutrinomassendiagonalisierung für die betrachteten Fälle diskutiert werden. 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 130 Dirac–Neutrinos. Die Diskussion verläuft parallel zu den Quarks. Im ersten Schritt gehen wir in eine Basis, in der die Yukawa–Kopplungen der geladenen Leptonen Ye diagonal sind. In dieser Basis können wir Yν diagonalisieren, † (ν) (ν) = diag(y1 , y2 , y3 ) . (9.26) UL Yν UR Majorana–Neutrinos. Im Fall von drei rechts- und linkshändigen Neutrinos kann die Massenmatrix M aus (9.12) geschrieben werden als ! 0 YνT √v2 1 M = . (9.27) Yν √v2 M 2 Diese Matrix kann diagonalisiert werden, wobei man entsprechend der obigen Diskussion eine Näherungsformel für die 3 × 3–Massenmatrix der leichten Neutrinos erhält, mMajorana ≃ − ν v2 T Y · M −1 · Yν . 2 ν (9.28) In einer Basis, in der Ye diagonal ist, kann man dann die symmetrische Majorana–Massenmatrix mMajorana diagonalisieren, ν U T mMajorana U = diag(m1 , m2 , m3 ) . ν (9.29) In beiden Fällen hat man einen Zusammenhang zwischen den Wechselwirkungspartnern νℓ (ℓ = e, µ, τ ) der geladenen Leptonen und den Masseneigenzuständen νi , X νℓ = Uℓi νi . (9.30) i Die Mischungsmatrix U wird gemeinhin als MNS–Matrix bezeichnet, gemäß den Pionieren in der Theorie der Lepton–Mischung Maki, Nakagawa und Sakata. Bemerkung: Im Majorana–Fall treten zwei zusätzliche Phasen auf, Majorana Dirac UMNS = UMNS · diag(1, ei ϕ1 /2 , ei ϕ2 /2 ) , (9.31) Dirac wobei UMNS analog zur CKM–Matrix parametrisiert werden kann. (vi) Neutrino–Oszillationen Die Tatsache, dass Neutrino–Masseneigenzustände nicht–triviale Superpositionen von Neutrino– Flavoreigenzuständen sind, hat wichtige Konsequenzen. Ein Neutrino, das irgendwo als ‘Elektron–Neutrino’ erzeugt wird, kann an einem anderen Platz (falls die Energie ausreichend ist) als µ–Neutrino detektiert werden, oder umgekehrt (siehe Abb. 16). Im Folgenden soll eine vereinfachte, quantenmechanische Beschreibung des Phänomens gegeben werden. Die zeitliche Entwicklung von Neutrinos ist dann X |νℓ (t)i = e−i Ej t Uℓj |νj i , (9.32) j wobei Ej = q p~ 2 + m2j . 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 131 W W ν µ− e− Abbildung 16: Neutrino–Flavor–Übergänge. Die Wahrscheinlichkeitsamplitude für den Übergang in den Neutrino–Flavor ℓ′ zum Zeitpunkt t ist X † −i Ej t hνℓ′ |νℓ (t)i = hνk |Ukℓ Uℓj |νj i ′ e j,k = X e−i Ej t Uℓj Uℓ∗′ j . (9.33) j Im letzten Schritt wurde verwendet, dass die Masseneigenzustände orthonormal sind, hνk |νj i = δjk . Die Wahrscheinlichkeit für den Flavorübergang ist dann das Betragsquadrat, 2 X −i Ej t ∗ ′ Uℓj e U ℓ′ j . P (νℓ → νℓ ; t) = j (9.34) Um ein Gefühl für diesen Ausdruck zu bekommen, wird die Diskussion im 2 × 2–Fall durchgeführt. Hier haben wir c s (9.35) U = −s c mit c = cos θ und s = sin θ. D.h., die Wechselwirkungspartner bzgl. der schwachen Wechselwirkung des Elektrons und des µ sind |νe i |νµ i = = c |ν1 i + s |ν2 i , −s |ν1 i + c |ν2 i . (9.36a) (9.36b) Ferner erweist es sich, dass in Prozessen, in denen nachweisbare Neutrinos produziert werden, die Energien sehr viel größer sind als die Neutrino–Massen. Daher kann man die Energie entwickeln, Ej = q m2j m2j p~ 2 + m2j ≃ |~ p| + ≃ |~ p| + . 2|~ p| 2E Damit ergibt sich (für universelles |~ p|) ∆m2 P (νℓ → νℓ′ ; t) = sin2 2θ sin2 t 4E (9.37) (9.38) 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 132 mit ∆m2 = m22 − m21 . Außerdem bewegen sich die Neutrinos praktisch mit Lichtgeschwindigkeit, d.h. man kann die Zeit t durch die durchquerte Distanz L ersetzen, L , (9.39) P (νℓ → νℓ′ ; L) = sin2 2θ sin2 π Losc wobei die sog. Oszillationslänge 4π E (9.40) Losc = ∆m2 eingeführt wurde. Wenn man also an einem Ort ein Elektron–Neutrino produziert, ist die Wahrscheinlichkeit, im Abstand L wieder ein Elektron–Neutrino zu messen i.A. von 1 verschieden. Diese Wahrscheinlichkeit ist eine oszillierende Funktion des Abstands (Abbildung 17). P (νe → νe ) 1 sin2 2θ Losc L Abbildung 17: Neutrino–Oszillationen. Es lässt sich zeigen, dass im 3 × 3–Fall die selben Effekte auftreten. Der einzige Unterschied ist, dass man hier drei Mischungswinkel und zwei Massenquadrat–Aufspaltungen als Parameter eingehen. Wir beobachten zwei Arten von Neutrino–Oszillationen in der Natur. Zum Einen die solaren Neutrino–Oszillationen, die das sog. solare Neutrino–Problem lösen, d.h. die Frage, warum weniger Elektron–Neutrinos an der Erde ankommen als das gemäß dem Sonnen– Modell sein sollte. Dies sind Oszillationen zwischen Elektron–Neutrinos und anderen Neutrino– Flavors. Zum Anderen beobachten wir die atmosphärischen Neutrino–Oszillationen. Diese erklären, warum wir weniger µ–Neutrinos messen als wir es gemäß der µs, die durch die Wechselwirkung von hochenergetischer kosmischer Strahlung mit der Atmosphäre entstehen, erwarten würden. Diese beiden Arten von Neutrino–Oszillationen sind charakterisiert durch unterschiedliche Oszillationslängen und damit unterschiedliche ∆m2 , die entsprechend mit ∆m2sol bzw. ∆m2atm bezeichnet werden. Wir folgen der Konvention, ∆m2sol = m22 − m21 und ∆m2atm = |m23 − m22 | zu setzen. Dabei ist z.Zt. noch nicht geklärt, ob m3 > m2 oder m3 < m2 ist. Man unterscheidet zwischen Neutrino–Spektren mit normaler und invertierter Hierarchie (Abbildung 18). Des Weiteren ist die Masse m1 unbekannt; astrophysikalische Argumente legen m1 . 0.2 eV nahe. Im Folgenden stellen wir kurz Schlüssel–Experimente vor, die es uns möglicherweise in der Zukunft erlauben werden, m1 zu bestimmen. 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS m2 133 m2 νe νµ ντ m32 solar~7×10−5eV2 atmospheric ~2×10−3eV2 m22 m12 m22 m12 atmospheric ~2×10−3eV2 solar~7×10−5eV2 m32 ? ? 0 0 Abbildung 18: Neutrino–Spektren mit normaler (links) und invertierter (rechts) Hierarchie. Die farbigen Balken geben die Flavor–Zusammensetzung der einzelnen Massen–Eigenzustände wieder. (vii) Neutrinoloser doppelter β–Zerfall Im gewöhnlichen β–Zerfall zerfällt ein Neutron in ein Proton, ein Elektron und ein Anti– Neutrino (Abb. 19(a)). Wenn Neutrinos Majorana–Massen haben, ist Lepton–Zahl gebrochen, und es können zwei β–Zerfälle gleichzeitig ablaufen, ohne dass (Anti–)Neutrinos entstehen (Abb. 19(b)). Das resultiert in einer Verschiebung des Spektrums der Elektronen hin zu höheren Energien. Der Nachweis von neutrinolosem doppelten β–Zerfall würde somit zeigen, dass Neutrinos Majorana–Teilchen sind. Umgekehrt kann man auch die kinematische Masse der Neutrinos messen. Ist diese bekannt und sind die Schranken an die neutrinolose doppelten β–Zerfalls–Amplitude hinreichend stark, so kann man schließen, dass Neutrinos Dirac–Teilchen sind. Derzeit ist diese Frage nicht geklärt. M.a.W. wissen wir nicht, mit welchen Termen in der Lagrangedichte Neutrino–Massen beschrieben werden. (viii) Vergleich zwischen Quark- und Leptonsektor Abschließend sollen noch die Parameter im Leptonsektor mit denen im Quark–Sektor verglichen werden. Man kann davon ausgehen, dass alle Teilchen massiv sind, wobei der Nachweis der Masse für das leichteste Neutrino noch aussteht. Die Massen–Eigenwerte sind md ≃ 3 . . . 7 MeV , ms = 95 ± 25 MeV , mb = 4.20 0, 07 GeV , me = 511 keV , mµ = 105 MeV , mτ = 1.8 GeV , 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS n p W p n 134 e− W e− e− ν̄ W (a) β–Zerfall. n p (b) Neutrinoloser doppelter β– Zerfall. Abbildung 19: Falls Neutrinos Majorana–Teilchen sind, ist neutrinoloser doppelter β–Zerfall möglich. mu ≃ 1.5 . . . 3 MeV , mc ≃ 1.25 GeV , mt ≃ 173 GeV , m1 = ? , ∆m2sol = (7.3 . . . 8.5) · 10−5 eV2 , ∆m2atm = (2.2 . . . 3.0) · 10−3 eV2 . (9.41) Während die Massen p der geladenen Teilchen starke Hierarchien aufweisen, hat man im Neutrino–Sektor ∆m2atm /∆m2sol ∼ 5. Die Neutrinos sind auch systematisch sehr viel leichter als die geladenen Teilchen. Eine plausible Erklärung für die Unterdrückung der Neutrino–Massen ist durch das See–Saw–Modell gegeben. Um Neutrino–Massen im Bereich von 0.1 eV zu bekommen, benötigt man für die Eigenwerte der Massenmatrix M Mi ≃ 1014 GeV , (9.42) wenn für die Yukawa–Kopplungen in Yν Werte der Größenordnung 1 angesetzt werden. Die Mischungsstruktur im Quark- und Lepton–Sektor ist stark unterschiedlich, 0.82 0.56 0 0.97 0.23 0.004 |VCKM | ≃ 0.23 0.973 0.04 ↔ |UMNS | ≃ 0.41 0.56 0.71 . 0.41 0.56 0.71 0.008 0.04 1 Im Standardmodell, erweitert durch Neutrino–Massen, bedeuten die obigen Aussagen, dass man die Parameter entsprechend wählen muss. Viele Teilchenphysiker sind der Auffassung, dass die Massen- und Mischungsstruktur des Fermion–Sektors des Standardmodells in Erweiterungen eine Erklärung findet. Obwohl es viele Erklärungsversuche gibt, erfordert es noch große theoretische und experimentelle Anstrengungen, die zutreffende Erklärung zu finden bzw. zu identifizieren. 9.2 (i) Große Vereinheitlichung Die Idee der GUTs anhand SU(5) Das Standardmodell der Elementarteilchenphysik beschreibt drei der vier bekannten Grundkräfte mit großer Präzision. Es basiert auf der Symmetriegruppe GSM = SU(3)C × SU(2)L × U(1)Y . 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 135 Die sog. fundamentalen Fermionen transformieren mit den Quantenzahlen linkshändige“ Quark–Dubletts Q : (3, 2)1/6 , ” rechtshändige“ u–artige Quarks u : (3, 1)2/3 , ” rechtshändige“ d–artige Quarks d : (3, 1)−1/3 , ” linkshändige“ Lepton–Dubletts ℓ : (1, 2)−1/2 , ” rechtshändige“ Lepton–Singletts e : (1, 1)−1 . ” Die erste Beobachtung ist, dass der Teilchencharakter der Fermionen durch die Transformationseigenschaften unter GSM festgelegt ist. Wie wir diskutiert haben, bedeutet die Notation z.B. dass linkshändige“ Quark–Dubletts als 3–Vektor“ unter einer SU(3)C ” ” Transformation transformiert, ′ qrot qrot ∗ ∗ ∗ qrot ′ = ∗ ∗ ∗ · qgrün . qgrün → qgrün ′ qblau ∗ ∗ ∗ qblau qblau {z } | SU(3)C Matrix Zweitens ist der Materie–Inhalt des Standardmodells etwas merkwürdig. Warum gibt es genau diese Darstellungen, und nicht andere? Um diese Frage zu beantworten, schreiben wir zunächst mal alle Teilchen des Standardmodells als linkshändige Fermionen, linkshändige“ Quark–Dubletts Q : (3, 2)1/6 , ” linksshändige“ Anti–u–artige Quarks uC : (3, 1)−2/3 , ” linkshändige“ Anti–d–artige Quarks dC : (3, 1)1/3 , ” linkshändige“ Lepton–Dubletts ℓ : (1, 2)−1/2 , ” linksshändige“ Anti–Lepton–Singletts eC : (1, 1)1 . ” Man kann sich jetzt überlegen, dass GSM in SU(5) passt“, ” GSM ⊂ SU(5) . Für SU(3)C und SU(2)L ist das relativ einfach zu sehen, können zu einer 5 × 5 Matrix zusammengefasst werden, ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ → ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ eine 3 × 3 und eine 2 × 2 Matrix ∗ ∗ ∗ ∗ ∗ . (9.43) Darüber hinaus findet man, dass sich die Standardmodell Materie in zwei SU(5) Multipletts zusammenfassen lässt. Konkret hat man d¯rot d¯grün ¯ (9.44) 5 = ψi = dblau ℓ↑ ℓ↓ 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 136 und 10 = χij 1 = √ 2 0 −uC blau uC grün −Q↑rot −Q↓rot uC blau 0 −uC rot −Q↑grün −Q↓grün −uC grün uC rot 0 −Q↑blau −Q↓blau Q↑rot Q↑grün Q↑blau 0 −eC Q↓rot Q↓grün Q↓blau eC 0 . (9.45) Für die 5–Darstellung ist es relativ offensichtlich, dass — unter der Annahme der Block– Gestalt (9.43) — die oberen 3 Komponenten als SU(3)C 3–plett und die unteren beiden als SU(2)L 2–plett transformieren. Bei dem 10–plett, d.h. dem antisymmetrischen SU(5)– Tensor zweiter Stufe, muss man sich vor Augen halten, dass χ mit zwei SU(5)–Matrizen transformiert, χ → U · χ · UT . (9.46) Nun schreiben wir U als U3 0 U = 0 U2 (9.47) mit den SU(3)C - bzw. SU(2)L –Matrizen U3 bzw. U2 sowie 1 uC Q . 10 = √ −QT eC 2 (9.48) Damit finden wir für die einzelnen Blöcke im 10–plett das Transformationsverhalten 0 uC −uC 0 uC −uC grün grün blau blau · U3T , → U3 · −uC −uC 0 uC 0 uC rot rot blau blau C C C C ugrün −urot 0 ugrün −urot 0 Q↑rot Q↑grün Q↑blau Q↓rot Q↓grün Q↓blau C 0 −eC e 0 → → U3 · U2 · Q↑rot Q↑grün Q↑blau 0 −eC Q↓rot Q↓grün Q↓blau C e 0 T · U2 , · U2T . (9.49a) (9.49b) (9.49c) Wir sehen, dass die uC –Matrix in (9.49a) als antisymmetrischer Tensor zweiter Stufe unter SU(3)C , also als 3–plett, und als Singlett unter SU(2)L transformiert. Des Weiteren transformiert die Q–Matrix in (9.49b) als SU(3)C 3–plett und als SU(2)L 2–plett; die eC – Matrix in (9.49c) transformiert als antisymmetrischer Tensor zweiter Stufe unter SU(2)L , also als Singlett. Zwischen–Resume: Wir finden, dass die SU(5)–Darstellungen 5 und 10 eine Generation an Standardmodell–Materie beinhalten, Q dC → 10 . (9.50) → 5 , uC ℓ eC 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 137 Darüber hinaus erweist es sich, dass SU(5) nicht nur SU(3)C und SU(2)L beinhaltet, sondern auch Hyperladung. Es gibt einen Generator in SU(5), der mit den Generatoren der SU(3)C - und SU(2)L –Untergruppen vertauscht, −1/3 −1/3 . −1/3 tY = N (9.51) 1/2 1/2 Dabei ist N eine Normierungskonstante, um die wir uns etwas später kümmern, und es geht ein, dass die Generatoren der SU(N ) spurfrei sind. In einer etwas mathematischeren Sichtweise würden wir sagen, dass SU(N ) Rang N − 1 hat, so dass SU(3) und SU(2) zusammen Rang 3 besitzen, und Hyperladung den Rang auf 4 = Rang(SU(5)) ergänzt. Insgesamt haben wir also SU(5) ⊃ SU(3)C × SU(2)L × U(1)Y = GSM . (9.52) Wir müssen nun überprüfen, dass tY tatsächlich die richtigen Hyperladungen liefert. Für das 5–plett liefert eine infinitesimale Transformation C 1 C drot qY dC rot 3 drot dC qY d C 1 dC grün grün 31 grün C C C −tY dblau = N 3 dblau = N qY dblau (9.53) . ℓ↑ qY ℓ ↑ − 1 ℓ↑ 2 ℓ↓ qY ℓ ↓ − 12 ℓ↓ Die Notation hier ist etwas schlampig; qY nimmt je nach Multiplett einen anderen Wert an. Durch Vergleich finden wir, dass (bis auf die Normierung N ) die richtigen“ Hyperladungen ” qY entstehen. Das 10–plett schreiben wir in Blockform und erhalten für das Verhalten unter einer infinitesimalen Transformation C C C u Q u Q u Q tTY + → tY −Q eC −Q eC −Q eC 1 C C 1 −3 0 u Q u Q −3 0 · +N · = N 1 1 −Q eC −Q eC 0 0 2 2 − 31 − 31 uC − 13 + 12 Q = N 1 + 1 eC − −1 + 1 Q 2 C3 12 2 2 Q −3 u qY u C qY Q 6 = N . (9.54) = N −qY Q qY eC − 61 Q 1 eC tY liefert in der Tat die richtigen Hyperladungen; die Normierung N kann in eine Redefinition der Kopplungsstärke g1 gesteckt werden. Es ist überaus bemerkenswert, dass die Einbettung von GSM in SU(5) die auf die beobachteten Hyperladungen führt. Ladungsquantisierung. Insbesondere erklärt die obige Analyse, warum die die Ladungen quantisiert“ sind, d.h. warum alle qY –Ladungen ganzzahlige Vielfache von 1/6 ” sind. Es sei jedoch bemerkt, dass Ladungsquantisierung ebenfalls aus den Anomalien– Bedingungen folgt (siehe [10, S. 383 ff.]). 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 138 GUT–Normierung für Hyperladung. Wie wir im Zusammenhang mit den nicht– abelschen Eichtheorien besprochen haben (siehe z.B. die Relation (3.14c)), werden die Generatoren der SU(N ) Gruppen auf 1/2 normiert. Wir müssen daher fordern, dass r 3 2 2 5 ! 1 y N = . (9.55) = tr(tY · tY ) = N · (3/9 + 2/4) = N · 6 2 5 Die Normierung kann in einer Redefinition der Kopplungsstärke g1 absorbiert werden. (ii) Eichkopplungsvereinigung Es gibt ein offensichtliches Problem mit der Idee der großen Vereinheitlichung. Obwohl die Struktur der SM Materie perfekt in SU(5) passt, wissen wir, das die Kopplungsstärken der Eichgruppen SU(3)C , SU(2)L und U(1)Y unterschiedlich sind. Andererseits haben wir in vorher im Zusammenhang mit der QED (siehe S. 67) und der QCD (siehe S. 71) gesehen, dass die Kopplungsstärken von der Skala abhängig sind. Darüber hinaus haben wir gefunden, dass die Kopplung g3 der QCD zu höheren Energien hin abnimmt während die Kopplung g1 einer U(1) Eichwechselwirung größer wird. M.a.W., die Kopplungen bewegen sich aufeinander zu. Die Situation ist in Abbildung 20 veranschaulicht, wo g1 in GUT– Normierung (9.55) aufgetragen ist. Abbildung 20: Laufen der Eichkopplungen im Standardmodell. Wir sehen, dass die Kopplungen sich beinahe treffen. Die Skala, an der das passiert ist von der Größenordnung 1014−16 GeV. Interessanterweise haben wir eine vergleichbare Skala bei der Diskussion des See–Saw Mechanismus in (iii) kennengelernt (siehe Gleichung (9.42)). Es wird jedoch i.A. nicht davon ausgegangen, dass das SM die Physik bis zu dieser Skala die gültige Beschreibung liefert. Aufgrund des Hierarchie–Problems (siehe (i)) nimmt man an, dass es bei einer Skala von etwa einem TeV neue Physik gibt, die es uns erlaubt, zu verstehen, warum der Vakuumerwartungswert des elektroschwachen Higgsfeldes von der Größenordnung 100 GeV ist. Ein sehr attraktiver Kandidat für diese neue Physik ist Supersymmetrie, die hier aus Zeitgründen nicht im Detail diskutiert wird. Supersymmetrie impli- 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 139 ziert, dass es für jedes Teilchen einen Superpartner gibt. Der Superpartner eines Fermions ist ein Boson und umgekehrt. In der sog. minimalen supersymmetrischen Erweiterung des Standardmodells, dem MSSM, führt man für jedes Standardmodell–Teilchen einen Superpartner ein (sowie ein zweites Higgs–Superfeld, um die Anomalien wegzuheben). Die Anwesenheit dieser Superpartner modifiziert die Renormierungsgruppengleichungen. In Abbildung 21 wird die Evolution der Eichkopplungen unter der Annahme gezeigt, dass die Superpartner Massen von einem TeV haben. Man erkennt, dass sich die Eichkopplungen Abbildung 21: Laufen der Eichkopplungen in der minimalen supersymmetrischen Erweiterung des Standardmodells. praktisch exakt treffen bei einer Skala MGUT ≃ 2 · 1016 GeV , (9.56) die relativ ähnlich zu der naiven See–Saw–Skala (9.42) ist (und sich auch nicht allzu stark von der Planck–Skala MP ≃ 2 · 1018 GeV unterscheidet). Extra Eichbosonen. Wie wir diskutiert haben, hat die SU(5) zwei Unterblöcke, entsprechend den nicht–abelschen Untergruppen SU(3)C und SU(2)L , und Hyperladung lebt“ ” in beiden Blöcken. Wir können folglich die Eichbosonen der SU(5) in die Eichbosonen des Standardmodells und einen Rest zerlegen, X1 Y1 G − √2 B X2 Y2 30 1 X3 Y3 (9.57) A = √ , 3 1 ∗ ∗ ∗ 3 + 2 √ √ X X X W + B W 1 2 3 2 30 Y1∗ Y2∗ Y3∗ W− − √12 W 3 + √330 B wo G für die Gluonen steht. Gruppentheoretisch zerlegt sich die adjungierte Darstellung von SU(5) gemäß 24 = (8, 1)0 ⊕ (1, 3)0 ⊕ (1, 1)0 ⊕ (3, 2)−5/6 ⊕ (3, 2)5/6 , (9.58) 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 140 wobei (8, 1)0 , (1, 3)0 bzw. (1, 1)0 den Generatoren von SU(3)C , SU(2)L bzw. U(1)Y entsprechen und hermitesche Linearkombinationen der Auf- bzw. Absteigeoperatoren (3, 2)−5/6 bzw. (3, 2)5/6 die X- und Y –Bosonen liefern. Letztere vermitteln zwischen den verschiedenen Standardmodell–Multipletts. GUT–Symmetriebrechung. spontane Symmetriebrechung Ähnlich wie im Standardmodell ist der Sektor, der die SU(5) → GSM (9.59) induziert, möglicherweise der unästhetischste Teil der ganzen Diskussion. Um in SU(5) das gewünschte zu erreichen, benötigen wir (in der minimalen Version) zwei Higgs–Felder, das 24–plett H, das die Brechung (9.59) bewerkstelligt, sowie φ, das das elektroschwache Higgs beinhaltet. Für den ersten Schritt betrachtet man das Skalarpotential 2 (9.60) V (H) = − m21 tr H 2 + λ1 tr H 2 + λ2 tr H 4 , wobei λ2 > 0. Wie man zeigen kann (vgl. Übungen), gibt es drei inäquivalente Möglichkeiten für das Minimum, m21 < 0 y hHi = 0 , m21 > 0 ∧ λ1 > − y y 7 λ2 30 hHi = v1 diag(2, 2, 2, −3, −3) m21 > 0 ∧ − (9.61a) mit v12 = m21 , 60λ1 + 14λ2 (9.61b) 13 7 λ2 > λ1 > − λ2 30 20 hHi = v1 diag(1, 1, 1, 1, −4) mit v12 = m21 . 40λ1 + 26λ2 (9.61c) Im ersten Fall (9.61a) bleibt SU(5) ungebrochen und im dritten Fall (9.61c) wird SU(5) zu SU(4) × U(1) gebrochen; im zweiten Fall ist hHi proportional zu tY und SU(5) wird zu GSM gebrochen. Dies ist der interessante Fall, d.h. von jetzt an nehmen wir an, dass 7 m21 > 0 und λ1 > − 30 λ2 , so dass SU(5) zu GSM gebrochen wird. Wir können die Fluktuationen von H um hHi gemäß (9.58) zerlegen, HX 1 H Y1 HX 2 H Y2 H8 − √230 H0 ′ HX 3 H Y3 H = H − hHi = (9.62) . ∗ ∗ ∗ HX H H X2 X3 1 H3 + √330 H0 HY∗1 HY∗2 HY∗3 Die Fluktuationen HXi bzw. HYi werden von den X- bzw. Y –Eichbosonen aufgegessen. Die Massen dieser massiven Vektorfelder sind r 25 g v1 , (9.63) MX = MY = 2 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 141 wo g die vereinheitlichte Eichkopplung bezeichnet. In Analogie zur Schwellen–Näherung (5.8) finden wir, dass die Eichbeiträge zu den radiativen Korrekturen zu den Eichkopplungen oberhalb MX/Y universell sind und sich unterhalb MX/Y unterscheiden; entsprechend können wir die Skala der Vereinheitlichung abschätzen durch r 25 MGUT ≃ MX = MY = g v1 . (9.64) 2 Die Higgsfelder H8 , H3 bzw. H0 bekommen Massen, die durch m28 m23 m20 = = = 20 λ2 v12 , 80 λ2 v12 , 4m21 (9.65a) (9.65b) (9.65c) gegeben sind. Nun müssen wir noch das 5–plett φ diskutieren, das das elektroschwache Higgs beinhaltet. Dafür erweitern wir (9.60) um Terme mit φ; wenn alle renormierbaren Terme, die konsistent sind mit der SU(5) Symmetrie zulassen, bekommen wir V (H, φ) = V (H) + V (φ) + λ4 (tr H 2 ) (φ† φ) + λ5 (φ† H 2 φ) (9.66) mit V (H) aus (9.60) und V (φ) = − m22 (φ† φ) + λ3 (φ† φ)2 . (9.67) Nach Einsetzen des Vakuumerwartungswertes für H bekommen die Dublett- und Triplett– Komponenten von φ unterschiedliche Massen, m2Triplett m2Dublett = = −m22 + (30 λ4 + 4 λ5 ) v12 , −m22 + (30 λ4 + 9 λ5 ) v12 . (9.68a) (9.68b) Man benötigt aus verschiedenen Gründen eine große Triplett–Masse. Zum Einen würde die Anwesenheit eines Tripletts bei Skalen unterhalb von MGUT die Eichkopplungsvereinigung (zer-)stören. Zum Anderen führt ein leichtes Triplett auf Proton–Zerfallsraten (siehe die Diskussion in (iv)) die inkonsistent sind mit der Beobachtung. Um ein schweres Triplett und ein leichtes Dublett zu erhalten, benötigen wir eine beinahe perfekte Auslöschung der verschiedenen Terme in (9.68b). Dies ist ein Teil des sog. doublet–triplett splitting ” problems“, für das im Rahmen von vierdimensionalen GUT Modellen keine besonders ansprechende Lösung bekannt ist. Andererseits lässt sich das Problem in Modellen mit mehr als vier Raum–Zeit–Dimensionen sehr elegant lösen; mit etwas gutem Willen kann man das als Motivation für Stringtheorie werten, die 10 Raum–Zeit–Dimensionen vorhersagt. (iii) SO(10) Die Vereinfachung des Materie–Inhalts des Standardmodells kann noch weiter getrieben werden. SU(5) ist eine Unterguppe von SO(10). Es stellt sich heraus, dass die 16– dimensionale Spinordarstellung von SO(10), das 16–plett, sowohl das 10–plet als auch das 5–plett von SU(5) beinhaltet, SO(10) 16 ⊃ → SU(5) × U(1)χ , 101 ⊕ 5−3 ⊕ 15 . (9.69a) (9.69b) Es gibt verschiedene Möglichkeiten, sich die Spinordarstellungen der orthogonalen Gruppen zu veranschaulichen. Eine davon ist, die Spinoren als fundamentale Darstellungen des 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 142 Tensorprodukts mehrerer SU(2)–Faktoren aufzufassen. Die Elemente der Darstellung des 16–pletts von SO(10) kann dann beschrieben werden als Produkt von fünf 2–dimensionalen Spinoren, ψ = = =: ψ (1) ⊗ ψ (2) ⊗ ψ (3) ⊗ ψ (4) ⊗ ψ (5) ↑ ↑ ↑ ↑ ↑ ⊗ ⊗ ⊗ ⊗ ↓ ↓ ↓ ↓ ↓ (± ± ± ± ±) , (9.70) wobei die Zahl der ↓ bzw. Minuszeichen gerade sein muß (und ungerade für das 16–plett). Durch Abzählen sehen wir, dass man so gerade eine Darstellung mit 16 Elementen erhält. Das SU(5)–Singlett ist das Element der Darstellung mit 0 Minuszeichen, das 10–plett das mit 2 Minuszeichen und das 5–plett das mit vier Minuszeichen (siehe Tabelle 9.1). Die SO(10) GUT SM U(1)Y νC 0 eC 1 urot drot ugrün 1 6 dgrün ublau dblau uC rot uC − 32 grün uC blau dC rot 1 dC grün 3 dC blau ν − 21 e SU(3)C +++ +++ −++ −++ +−+ +−+ ++− ++− +−− −+− −−+ +−− −+− −−+ −−− −−− SU(2)L ++ −− +− −+ +− −+ +− −+ ++ ++ ++ −− −− −− +− −+ 1 10 5 Tabelle 9.1: Spinor–Darstellung von SO(10). Hyperladung qY ist gegeben durch 3 qY 5 1X 1X = Si − Si 3 i=1 2 i=4 (9.71) mit Si = ± 12 . Wir sehen, dass das SU(5) und damit GSM Singlett, also ein Kandidat für das rechtshändige Neutrino, enthalten ist. Damit entsteht ein Zusammenhang zwischen der GUT-Skala und der See-Saw-Skala. Insbesondere liefert ein naives Gleichsetzen von M = MGUT in (9.18) liefert leichte Neutrino-Massen von ungefähr der richtigen Größenordnung. Die kleinste Darstellung, die das Higgs–Dublett enthält, ist das 10–plett, d.h. die Vektor– Darstellung von SO(10). Das führt automatisch auf zwei Higgs–Dubletts und ebensoviele Tripletts. In der minimalen supersymmetrischen Erweiterung des Standardmodells hat man ebenfalls zwei Higgs–Dubletts. Die Frage, warum die Tripletts so schwer sind, bleibt auch hier unbeantwortet. 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS (iv) 143 Signaturen von GUTs Protonzerfall. Der experimentelle Nachweis erfordern würde, dass man die entsprechenden Eichbosonen sehen müsste. Wie wir gesehen haben, sind die Massen der extra Eichbosonen sind von der Größenordnung MGUT . Man kann die extra Eichbosonen jedoch indirekt sehen, da diese Übergänge zwischen den verschiedenen Multipletts des Standardmodells ermöglichen. Die entsprechenden Kopplungen bekommt man, indem man eichinvariante Kopplungen zwischen Standardmodell-Fermionen und den X- und Y -Bosonen identifiziert, die gemäß (9.58) mit den Quantenzahlen (3, 2)−5/6 und (3, 2)5/6 kommen. Eichinvariante Terme sind (3, 2)1/6 (3, 2)−5/6 (3, 1)2/3 : (3, 2)1/6 (3, 2)5/6 (1, 1)−1 : (1, 2)−1/2 (3, 2)5/6 (3, 1)−1/3 : µ i j εij εabc uC a γ Qb (Xc )µ , (9.72a) j εij eC γ µ Qia (X a )µ , j µ i εij dC a γ ℓ (X a )µ . (9.72b) (9.72c) Dabei werden ein links- und ein rechtshändiges Fermion zu einem Vektor kombiniert und der Vektor-Index mit dem des X-Bosons kontrahiert, die wir in SU(2) Multipletts gepackt haben, X i = (X, Y ). Diese Vertizes führen auf Prozesse, bei denen Baryonzahl und Leptonzahl verletzt sind (Abbildung 22). u d u X u (a) d d Y Y e+ d u ν u (b) (c) e+ Abbildung 22: Baryonzahl-verletzende Prozesse, die durch die X- und Y -Bosonen vermittelt werden. Diese Prozesse erlauben insbesondere den Zerfall eines Protons, p → π 0 + e+ . (9.73) Es wird zur Zeit intensiv nach solchen Prozessen gesucht; bisher leider ohne Erfolg. (v) Jenseits SU(5) und SO(10) Es gibt eine (natürlich spekulative) Kette der Vereinheitlichung“, ” GSM ⊂ SU(5) ⊂ SO(10) ⊂ E6 ⊂ E7 ⊂ E8 . Diese Kette endet bei der exzeptionellen Gruppe E8 , die auch in der (heterotischen) Stringtheorie eine Schlüsselrolle spielt. Für einen relativ aktuellen Überblick der Thematik siehe z.B. [20]. 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 9.3 144 Aspekte von Supersymmetry Supersymmetrie ist der vielleicht derzeit popolärste Kandidat für Physik jenseits des Standardmodells. Dies hat viele Gründe. Wir haben bereits gesehen, dass Supersymmetrie aufgrund der Eichkopplungsvereinigung in der minimalen supersymmetrischen Erweiterung des Standardmodells (MSSM) präzise treffen. Es gibt aber noch einige weitere Aspekte, die Supersymmetrie besonders attraktiv erscheinen lasse (für eine Einführung und einen Überblick siehe z.B. [19]). Zunächst wenden wir uns noch einmal dem sog. Hierarchie-Problem zu und sehen, dass eine Symmetrie zwischen den bosonischen und fermionischen Freiheitsgraden des Standardmodells es ermöglicht, dieses zu lösen bzw. zu lindern. Dann werden das sog. HaagSohnius-Lopuszański-Theorem heranziehen, um die unter gewissen Voraussetzungen möglichen Erweiterungen der Poincarè-Symmetrie zu konstruieren. Wir werden diese Symmetrie am Wess–Zumino Modell illustrieren. (i) Das Hierarchie–Problem Beispiel: Korrektur zum Photonpropagator. Wir hatten bereist in Abschnitt 4 Korrekturen zum Photonpropagator diskutiert. Wir hatten gefunden, dass die Korrektur Πµν (0) = (9.74) γ γ amputiert“ ” nicht auf einen Massenterm für das Photon führt. Dies läßt sich folgendermaßen einsehen. Der Ausdruck entspricht einem Massenterm für das Photon. Dieser ist jedoch wegen der Eichsymmetrie verboten. Beispiel: Korrektur zum Propagator des Elektrons. Nun betrachten wir die Korrektur zum Propagator des Elektrons. Hier ist Σe = γ amputiert“ ” Z d4 k i −i ηµν = (−i e γ µ ) (−i e γ ν ) (2π)4 k2 k − me Z 4 d k 1 = − γµ (k + me ) γ µ 4 2 2 (2π) k (k − m2e ) Z 2me − k d4 k = − 2 e2 4 2 (2π) k (k 2 − m2e ) Z 1 d4 k Λ = − 2 e 2 me ∼ me ln . (9.75) 4 2 2 2 (2π) k (k − me ) me Hier bezeichnet Λ einen ‘Cut-Off’ Parameter, und die Korrektur geht logarithmisch mit diesem, δme ∼ me α Λ ln . π me (9.76) 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 145 D.h., durch Quanteneffekte entstehen Korrekturen zur Tree-Level-Masse me . Diese sind jedoch proportional zur Masse me (und numerisch kleiner als me , wenn man etwa von Λ ∼ MGUT ∼ 1016 GeV ausgeht). Folgende Überlegungen lassen das Ergebnis verstehen: Eine Lagrangedichte ohne Massenterm ist invariant unter der Transformation Ψ e → e i λ γ5 Ψ e und Ψ e → Ψ e e i λ γ5 , (9.77) man spricht von der chiralen Symmetrie. Eine sehr kleine Masse ist von der Symmetrie geschützt. Beispiel: Korrektur zum Propagator des Higgs-Bosons. Yukawakopplung der Fermionen an das Higgsboson ist λf λf L = − λf f¯ f φ + h.c. = − √ h f¯ f − √ v f¯ f + h.c. . 2 2 | {z } Die Lagrangedichte der (9.78) =mf Diese liefert bekanntlich die Massenterme für die Fermionen. Wie wir in (8.56) gesehen hatten, gehen die Yukawakopplungen λf in die Massen–Korrektur für das Higgsboson ein, f λf λf 2 −i M (p) = h h f amputiert“ ” Z 4 k · (p + k) + m2f d k h ih i. (9.79) = − 4 λ2f (2π)4 (k + p)2 − m2 k 2 − m2 f f In diesem Fall divergiert die Korrektur quadratisch, δm2h ∼ λ2f Λ2 ≫ m2h . 16π 2 (9.80) Gemäß der vorangegangen Diskussion sind plausible Werte für Λ die GUT- oder See–Saw– Skala. Die Quantenkorrekturen zu der Higgs–Massenskala sind also sehr viel größer als die Massenskala selbst. Dies ist das sog. Hierarchie-Problem. Die Korrektur ist um einige Größenordnungen höher als der physikalische Wert der Masse, was extremes Fine-Tuning für die Wahl der Potential-Parameter für das Higgs-Feld erfodert. Die quadratische Divergenz im letzten Beispiel tritt auf, da im Standardmodell keine Symmetrie existiert, welche die Higgsmasse schützt. Nun wollen wir eine solche Symmetrie konstruieren. Postulat: Es gibt Skalarfelder feL , feR , welche durch folgende Lagrangedichte an das Higgsfeld koppeln e 2 2 e 2 |feL |2 + |feR |2 L f = λfe|φ|2 feL + feR + λf Af φ feL feR + h.c − m = λfe 2 (h2 + 2 h v) |feL |2 + |feR |2 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 146 λf e 2 |feL |2 + |feR |2 . + √ Af h feL feR + h.c. − m 2 (9.81) In der zweiten Zeile haben wir durch den Vakuumerwartungswert v induzierte Korrekturen zu den Massen von feL und feR vernachlässigt. Diese Felder und Kopplungen führen auf drei Diagramme, welche neue Korrekturen zum Higgs-Propagator liefern, f˜L ,f˜R e f Πh (0) = h h amputiert“ ” Z Z d4 k d4 k i 1 = = − 2 λ , (9.82) (i λ ) e e 2 f f (2π)4 k2 − m e (2π)4 k 2 − m2e f f und ee Πfhf (0) = = = vλ ˜ f h Z feL , feR vλf˜ h + feL , feR h λf Af feL , feR !2 d4 k (i λfev)2 (2π)4 feL , feR λf Af h i i + (i λf Af )2 k 2 − m2e k 2 − m2e f f h i Z d4 k 1 ∼ ln Λ . 2 (λfe v)2 + (λf Af )2 4 2 (2π) (k − m2e)2 2 amputiert“ ” !2 (9.83) f Die quadratischen Divergenzen kommen alleine von (9.79) und (9.82). Wählt man speziell λfe = − λ2f , so ergibt ihre Summe Πhq.D. = 2 λ2f Z m2f − m2fe d4 k . (2π)4 (k 2 − m2f ) (k 2 − m2e) (9.84) f Die quadratische Divergenz verschwindet also, falls (1) eine gleiche Anzahl an bosonischen und fermionischen Freiheitsgraden existiert, und (2) es Beziehungen zwischen den dimensionslosen Kopplungen in L gibt. Wenn zusätzlich gilt (3) m2f = m2fe = m2fe und L R (4) Af = 0, so verschwindet die Korrektur identisch, d.h. Πh (0) = 0 . (9.85) 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 147 Die Bedingungen 1 und 2 implizieren bereits, dass die Massenkorrektur lediglich logarithmisch ist, Πh (0) ∼ . i A2f h Λ 2 2 2 c (m − m ) + c A 1 2 f f · ln e 2 f 2π mf 2 m2h ∼ MW . (9.86) Das bedeutet, dass mfe, |Af | . 1 TeV gelten muß. Um also die Korrekturen zur Higgsmasse zu klein zu halten, kann man eine Symmetrie zwischen bosonischen und fermionischen Freiheitsgraden der Theorie einführen. Man spricht von einer fermionischen Symmetrie bzw. Supersymmetrie. In den vorausgehenden Überlegungen sind wir zu dem Schluß gekommen, dass man das Hierarchie-Problem lösen kann, falls Folgendes gilt: (1) Es gibt die gleiche Anzahl an bosonischen und fermionischen Freiheitsgraden. (2) Es existieren Beziehungen zwischen den Kopplungen. Die Gültigkeit dieser Aussagen kann Konsequenz einer Symmetrie sein, die zwischen bosonischen und fermionischen Freiheitsgraden vermittelt, schematisch Q |Bosoni = |Fermioni und Q |Fermioni = |Bosoni . (9.87) Im Folgenden geht es darum, eine solche Symmetrie bzw. deren Algebra zu konstruieren. Da Bosonen und Fermionen verscheidenden Darstellungen der Poincaré-Gruppe sind, können die Generatoren Q nicht mit denen der Poincaré-Algebra kommutieren. Darüber hinaus findet man, dass – unter relativ schwachen Voraussetzungen – jegliche Erweiterung der Poincaré-Algebra fermionisch sein muss (vgl. Anhang I). (ii) Supersymmetrie–Transformationen Eine Supersymmetrie–Transformation sollte zwischen einem bosonischen Feld φ und einem Fermion–Feld ψα vermitteln. Die einfachste Lagrangedichte ist dann gegeben durch on−shell LWZ = LSkalar + LFermion , (9.88) wobei LSkalar LFermion ∗ = (∂µ φ) ∂ µ φ , = i ψ̄ σ̄ µ ∂µ ψ . (9.89a) (9.89b) WZ“ steht für Wess und Zumino, denn die Lagrangedichte (9.88) definiert das sog. ” Wess–Zumino–Modell. Die Terminologie on–shell” wird später erklärt. Eine offensicht” liche Möglichkeit für eine solche Transformation ist δε φ δε φ ∗ = = εψ , ε ψ̄ , (9.90a) (9.90b) wobei εα ein infinitesimales, zwei–komponentiges und a–Zahl–wertiges Objekt ist, das wie eine Weyl–Fermion unter der Lorentzgruppe transformiert. Wir beschränken uns hier auf globale Lorentztransformationen, so dass εα konstant ist. Da ψ bzw. φ Massendimensionen 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 148 3/2 bzw. 1 besitzen, muss ε Massendimension −1/2 haben. LSkalar transformiert unter (9.90) gemäß δε LSkalar = ε (∂ µ ψ) (∂µ φ∗ ) + ε ∂ µ ψ̄ (∂µ φ) . (9.91) Damit wir eine Symmetrie bekommen, sollten diese Terme (bis auf eine mögliche totale Ableitung) durch δε LFermion kompensiert werden. Durch Vergleich von (9.91) mit LFermion sehen wir, dass dazu δε ψ linear in ε und φ sein und eine Ortsableitung beinhalten sollte. Wir setzen deshalb an, dass δε ψα = − i (σ µ ε)α ∂µ φ und δε ψ̄α̇ = i (εσ µ )α̇ ∂µ φ∗ . (9.92) Mit diesem Ansatz erhalten wir δε LFermion = − εσ µ σ̄ ν ∂ν ψ ∂µ φ∗ + ψ̄σ̄ ν σ µ ε ∂µ ∂ν φ . (9.93) An diesem Punkt benötigen wir einige Identitäten für die Pauli–Matrizen, σαµα̇ σ̄µβ̇β σαµα̇ σµβ β̇ = = 2δαβ δα̇β̇ , 2εαβ εα̇β̇ , (9.94a) (9.94b) σ̄ µα̇α σ̄µβ̇β µ ν σ σ̄ + σ ν σ̄ µ α β µ ν β̇ σ̄ σ + σ̄ ν σ µ α̇ = 2εαβ εα̇β̇ , (9.94c) = 2η µν δαβ , (9.94d) = 2η µν δα̇β̇ µν ρ (9.94e) σ̄ µ σ ν σ̄ ρ σ µ σ̄ ν σ ρ = = , η σ̄ + η νρ σ̄ µ − η µρ σ̄ ν − i εµνρκ σ̄κ , η µν σ ρ + η νρ σ µ − η µρ σ ν + i εµνρκ σκ , (9.94f) (9.94g) wobei wir hier zwischen gepunkteten und ungepunkteten Spinorindizes für rechts- und linkshändige Weylspinoren unterscheiden. Unter Verwendung von (9.94d) und (9.94e) und der Symmetrie der zweiten Ableitung, (∂µ ∂ν = ∂ν ∂µ ), wird aus Gleichung (9.93) δε LFermion = −ε∂ µ ψ ∂µ φ∗ − ε∂ µ ψ̄ ∂µ φ − ∂µ εσ ν σ̄ µ ψ ∂ν φ∗ − εψ ∂ µ φ∗ − εψ̄ ∂ µ φ . (9.95) Die ersten beiden Terme lieferen gerade das Negative von δε LSkalar und der Rest ist eine totale Ableitung. Somit finden wir Z δε S = d4 x (δε LSkalar + δε LFermion ) = 0 . (9.96) Dies rechtfertigt in Nachhinein den Ansatz (9.92). Um wirklich zu zeigen, dass das Wess–Zumino–Modell (9.88) eine Symmetrie aufweist, müssen wir zeigen, dass die obigen Transformationen eine Algebra bilden, d.h. der Kommutator zweier Supersymmetrie–Transformationen δε1 und δε2 muss wieder eine Supersymmetrie– Transformation sein. Einsetzen von (9.92) in (9.90) liefert (δε2 δε1 − δε1 δε2 ) φ ≡ δε2 (δε1 φ) − δε1 (δε2 φ) = i (−ε1 σ µ ε2 + ε2 σ µ ε1 ) ∂µ φ .(9.97) Dieses Resultat ist bemerkenswert: Wir sehen, dass der Kommutator zweier Supersymmetrie– Transformationen eine Ableitung liefern, die ihrerseits eine Translation generiert! Der Kommutator zweier Supersymmetrie–Transformationen angewandt auf Fermionen ergibt gemäß (9.90) und (9.92) (δε2 δε1 − δε1 δε2 ) ψα = − i (σ µ ε1 )α ε2 ∂µ ψ + i (σ µ ε2 )α ε1 ∂µ ψ . (9.98) 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 149 Wir verwenden nun die sog. Fierz-Identitität χα (ξη) = − ξα (ηχ) − ηα (χξ) (9.99) und die Relation ξ † σ̄ µ χ = − χσ µ ξ † = (χ† σ̄ µ ξ)∗ = − (ξσ µ χ† )∗ (9.100) für drei Weyl–Spinoren χ, ξ und η. Wir wählen zum Einen χ = σ µ ε1 , ξ = ε2 und η = ∂µ ψ (9.101a) ξ = ε1 und η = ∂µ ψ (9.101b) und zum Anderen χ = σ µ ε2 , für die beiden Terme in (9.98). Damit ergibt sich (δε2 δε1 − δε1 δε2 ) ψα i (−ε1 σ µ ε2 + ε2 σ µ ε1 ) ∂µ ψα + i ε1α ε2 σ̄ µ ∂µ ψ − i ε2α ε1 σ̄ µ ∂µ ψ . = (9.102) Die Terme in der zweiten Zeile verschwinden on–shell“, d.h. nach Einsetzen der Bewe” gungsgleichungen für das freie Weyl–Fermion. Der Term in der ersten Zeile ist — genau wie beim Skalarfeld — eine Ortsableitung. Die Tatsache, dass die Supersymmetrie–Algebra nur on–shell schließt, ist auf den ersten Blick besorgniserregend, denn sie könnte dadurch durch Quanteneffekte verletzt sein. Um dieses Problem zu lösen, führt man ein sog. Hilfsfeld F ein, das in diesem Fall keinen kinetischen Term besitzt, d.h. F entspricht keinen propagierenden Freiheitsgraden. Die Lagrangedichte für F ist einfach LHilfsfeld = F ∗ F . (9.103) Wir sehen, dass F Massendimension 2 tragen muß. Die Bewegungsgleichungen sind ∂LHilfsfeld ∂LHilfsfeld ! − ∂µ = 0 ∂F ∂(∂µ F ) y F = F∗ = 0 . (9.104) Das Hilfsfeld kann in die Supersymmetrie–Algebra eingebaut werden. Aufgrund der Massendimensionen ist es plausibel, anzusetzen, dass δε F δε F ∗ = = −i εσ̄ µ ∂µ ψ , i ∂µ ψ̄σ̄ µ ε . (9.105a) (9.105b) Die Vorzeichen sind in weiser Voraussicht gewählt. Damit transformiert LHilfsfeld wie (9.106) δε LHilfsfeld = − i εσ̄ µ (∂µ ψ) F ∗ + i ∂µ ψ̄ σ̄ µ ε F . Dieser Ausdruck verschwindet on–shell, jedoch nicht allgemein. Nun ändern wir das Transformationsverhalten von ψ und ψ̄ zu δε ψα δε ψα̇† = = −i (σ µ ε)α ∂µ φ + εα F , µ ∗ ∗ i (εσ )α̇ ∂µ φ + εα̇ F . (9.107a) (9.107b) Damit erhält man einen zusätzlichen Beitrag zu δε LFermion , der – bis auf eine totale Ableitung – gerade δε LHilfsfeld aufhebt. 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS on-shell (nB = nF = 2) off-shell (nB = nF = 4) φ 2 2 ψ 2 4 150 F 0 2 Tabelle 9.2: Freiheitsgrade im Wess–Zumino–Modell. Insgesamt haben wir dann eine Theorie mit Lagrangedichte off−shell LWZ = LSkalar + LFermion + LHilfsfeld , (9.108) die invariant unter Supersymmetrie–Transformationen ist. Für das Transformationsverhalten der sog. Komponentenfelder X = φ, φ∗ , ψ, ψ̄, F, F ∗ ergibt sich (δε2 δε1 − δε1 δε2 ) X = i (−ε1 σ µ ε2 + ε2 σ µ ε1 ) ∂µ X . (9.109) Dabei haben wir (9.90), (9.105) und (9.107) eingesetzt, jedoch keine Bewegungsgleichungen off−shell verwendet. Man sagt, in LWZ sei Supersymmetrie off–shell“ realisiert. ” Der Grund dafür, dass wir Hilfsfelder benötigen für eine off–shell Formulierung, hat eigentlich nichts mit Supersymmetrie zu tun. Vielmehr werden Fermionen durch Weyl– Spinoren mit zwei (a–Zahl–wertigen) komplexen Komponenten beschrieben, entsprechen aber nur zwei physikalischen Freiheitsgraden. Im Gegensatz zu dem Skalarfeld sind die kanonischen Variablen bei einem Fermion nicht unabhängig. D.h. abgesehen vom Feld ψ hat man den kanonischen Impuls ∂L /∂ ψ̇, der jedoch — anders als beim Skalarfeld — keine Zeitableitung aufweist. Wir mussten deshalb zwei zusätzliche off–shell skalare Freiheitsgrade einführen, d.h. das komplexe Feld F . Die on– und off–shell–Freiheitsgrade sind in Tabelle 9.2 aufgeführt. Gemäß dem Noether’schen Theorem impliziert eine kontinuierliche Symmetrie immer einen erhaltenen Strom, der im Fall der Supersymmetrie als Superstrom“ bezeichnet ” wird. Hier haben wir es mit einer fermionischen Transformation zu tun, so dass der Suµ perstrom Jα einen Spinorindex α trägt und durch a–Zahlen beschrieben wird. Gemäß der Noether’schen Formel hat man X δL δε X − Kµ , (9.110) εJ µ + εJ †µ ≡ δ(∂µ X) X µ wo K die totale Ableitung reproduziert, die durch die Supersymmetrie–Transformation entsteht, d.h. δε L = ∂µ K µ . K µ ist eindeutig bis auf Vektoren k µ , die ∂µ k µ = 0 erfüllen, etwa k µ = ∂ µ ∂ν aν − ∂ν ∂ ν aµ . Nach einer kurzen Rechnung erhält man einen möglichen Superstrom der Form Jαµ = Jα̇†µ = (σ ν σ̄ µ ψ)α ∂ν φ∗ , ψ̄σ̄ µ σ ν α̇ ∂ν φ . (9.111a) (9.111b) Der Superstrom (und sein hermitesch Konjugiertes) ist erhalten, ∂µ Jαµ = ∂µ Jα̇†µ = 0 , (9.112) wobei man die Bewegungsgleichung benutzen muss. Wie üblich konstruiert man die Operatoren der erhaltenen Ladungen √ Z 3 (9.113a) Qα = 2 d x J 0α , 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS Qα̇ = √ Z 3 2 d x J †0 α̇ , 151 (9.113b) die die Supersymmetrie–Transformationen generieren.17 Hierbei sind wir von den Strömen zu den entsprechenden Operatoren übergegangen, indem wir die Felder durch die Feldoperatoren ersetzt (und die Reihenfolge beibehalten) haben. Sie erfüllen √ (9.114) εQ + εQ, X = − i 2 δε X für beliebige Komponentenfelder X bis auf Terme, die on–shell verschwinden. Um dies zu verifizieren, benötigt man die gleichzeitigen (Anti-)Kommutatoren h i [φ(t, ~x), π(t, ~y )] = φ† (t, ~x), π † (t, ~y ) = i δ (3) (~x − ~y ) , (9.115) n o ψ α (~x), ψ †α̇ (~y ) = (σ 0 )αα̇ δ (3) (~x − ~y ) . (9.116) Mit (9.114) findet man, dass h i h i ε2 Q + ε2 Q, ε1 Q + ε1 Q, X − ε1 Q + ε1 Q, ε2 Q + ε2 Q, X = 2 (ε1 σ µ ε2 − ε2 σ µ ε1 ) i ∂µ X (9.117) ~ ) mit dem bis auf Terme, die on–shell verschwinden. Der Impulsoperator ist P µ = (H, P Hamilton–Operator H. Im kanonischen Formalismus hat man Z h i ~ † ) · (∇φ) ~ ~ H = d3 x π † π + (∇φ + i ψ †~σ · ∇ψ , (9.118) Z ~ = − d3 x π ∇ ~ ψ . ~ φ + π† ∇ ~ φ† + i ψ † σ̄ 0 ∇ (9.119) P Der Operator des Viererimpulses generiert eine Raum–Zeit–Translation der Komponentenfelder X, [P µ , X] = − i ∂ µ X . Damit wird aus (9.117) unter Benutzung der Jacobi–Identität h i ε2 Q + ε†2 Q, ε1 Q + ε†1 Q , X = 2 (−ε1 σµ ε†2 + ε2 σµ ε†1 ) [P µ , X] , für beliebige X bis auf Terme, die on–shell verschwinden. Daher gilt ε2 Q + ε†2 Q, ε1 Q + ε†1 Q = 2 (−ε1 σµ ε†2 + ε2 σµ ε†1 ) P µ . (9.120) (9.121) (9.122) Durch Entwickeln von (9.122) erhält man die N = 1 Supersymmetrie–Algebra {Qα , Qα̇ } = {Qα , Qβ } = {Qα̇ , Qβ̇ } = 17 Die √ 2σαµα̇ P µ , (9.123a) 0, (9.123b) 0. (9.123c) 2–Faktoren sind historische Artefakte. 9 TEILCHENPHYSIK JENSEITS DES STANDARD–MODELLS 152 Durch Entfernen der a–Zahl–wertigen Spinoren ε1 und ε2 wurde aus dem Kommutator in (9.122) der Antikommutator in (9.123a) und (9.123). Aus (9.120) und der Tatsache, dass die Supersymmetrie–Transformationen global sind, also nicht von x abhängen, folgt, dass [Q , P µ ] α µ Qα̇ , P = 0, (9.124a) = 0. (9.124b) α̇ Schliesslich folgt aus der Tatsache, dass Qα bzw. Q wie links- bzw. rechtschirale Weylspinoren transformieren, dass [M µν , Qα ] = i h α̇ = M µν , Q − 12 (σµν )α β Qβ , (9.124c) − 12 (σ µν )α̇ β̇ Q . (9.124d) β̇ 10 10 ABSCHLIESSENDE BEMERKUNGEN 153 Abschliessende Bemerkungen Elementarteilchenphysik ist ein Gebiet, das (zum Glück) noch nicht abgeschlossen ist. Deswegen fällt es schwer, eine Zusammenfassung der Vorlesung zu geben. Stattdessen schliessen wir die Vorlesung mit historischen Bemerkungen ab, die auch Spekulationen auf zukünftige Entwicklungen nahelegen; wir folgen hier [17]. Wie in [18] dargestellt, war die Entwicklung des Standardmodells geprägt von einigen guten Ideen“, die aufgrund von ” Missverständnissen“ nicht unmittelbar in der richtigen Weise angewendet wurden, so dass ” Durchbrüche um einige Jahre verzögert wurden. (1) Eine gute Idee“ war das Quark-Modell (siehe S. 79). Die Annahme, dass sich Hadro” nen aus Quarks und Anti-Quarks zusammensetzen erlaubt es, die Quantenzahlen zu verstehen. Andererseits hatten viele Physiker Zweifel an diesem Bild, denn schliesslich wurden ja keine Teilchen mit drittel-zahligen Ladungen gefunden. Erst das Bild des Confinements“ konnte klären, warum das Bild Sinn macht und ” man trotzdem (bei niedrigen Energien) keine freie Quarks sieht. (2) Eine weitere gute Idee“ war die Formulierung von nicht-abelschen Eichtheorien ” von Yang und Mills im Jahr 1954. Aber die entsprechenden Eichbosonen wurde nicht gesehen. In den ersten Versuchen, nicht-abelsche Eichtheorien für die reale Welt zu verwenden wurde die Eichsymmetrie explizit gebrochen. Abgesehen von der Tatsache, dass das relativ unästhetisch ist, gibt es in solchen Theorien große konzeptionelle Probleme, sie sind insbesondere nicht renormierbar. Erst die Erkenntnis, dass bei der spontanen Brechung (siehe Abschnitt 6) einer lokalen Symmetrie die Eichbosonen massiv wurden, hat den Vorschlag der elektroschwache Theorie ermöglicht, deren Vorhersagen präzise bestätigt wurden. Ausblick. Heutzutage gibt es ebenfalls eine Menge guter Ideen“ wie z.B. GUTs, Su” persymmetrie, Stringtheorie und Vieles mehr. Aus der historisch Entwicklung könnte man aber schliessen, dass diese Ideen z.Zt. etwas zu naiv angewandt werden, d.h. es gibt vermutlich noch eine Reihe von Missverständissen“. Vielleicht können am LHC Experiment ” einige davon geklärt werden. 154 Teil I Anhang A FUNKTIONALABLEITUNG A A.1 155 Funktionalableitung Erinnerungen an Analysis Gewöhnliche Differentiation. Sei U ⊂ Rn eine offene Menge und f : U → Rm eine Abbildung. f heißt im Punkt x ∈ U differenzierbar, falls es eine lineare Abbildung A: Rn → Rm (A.1) gibt, so dass in einer Umgebung von x f (x + ξ) = f (x) + A ξ + ε(ξ) (A.2) gilt, wobei ε eine in einer Umgebung von 0 definierte Funktion mit Werten in ε(ξ) lim = 0. ξ→0 kξk Man bezeichnet: R ist mit: n Df := A als Differential von f . Das Differential in einem Punkt x ist offensichtlich die lineare Approximation an f in diesem Punkt. Im Folgenden soll die Begriffsbildung auf den Fall übertragen werden, dass anstatt einer Funktion f ein Funktional F betrachtet wird. A.2 (i) Grundlegende Begriffe der Funktionalanalysis Räume Ein linearer, normierter, vollständiger Raum heißt Banachraum; ein linearer, unitärer, vollständiger Raum heißt Hilbertraum. Im folgenden sollen Vektorräume V von Funktionen behandelt werden. In der Physik kann man sich auf unendlich oft differenzierbare Funktionen beschränken.18 Konkret seien die Räume von der Form: C ∞ (M, M ′ ) = {φ : M → M ′ ; φ ist unendlich oft differenzierbar} . Von besonderem Interesse sind die folgenden Räume: Raum der Testfunktionen: D(Rn ) = {φ ∈ C ∞ (Rn , C); supp φ ist kompakt} , wo supp φ = {x ∈ Rn ; φ(x) 6= 0} der Träger von φ ist. Schwartz-Raum S n : Raum der beliebig oft differenzierbaren und stärker als jede Potenz abfallenden Funktionen φ : Rn → C. (ii) Operatoren Gegeben seien zwei Räume V und V ′ . Unter einer Operationsvorschrift O verstehen wir eine Vorschrift, die Elementen φ ∈ V eindeutig jeweils ein Element φ′ ∈ V ′ zuordnet, O φ = φ′ . Die Gesamtheit der φ, für die O eine Zuordnung vermittelt, heißt Definitionsbereich D ⊆ V , die Menge der Bilder Of heißt Wertebereich W =: OD ⊆ V ′ . Die Operationsvorschrift O zusammen mit dem Definitionsbereich D nennen wir Operator O, kurz O auf D“. ” 18 Denn: Jede integrierbare Funktion kann im Sinne der L1 -Norm beliebig genau durch eine C ∞ -Funktion approximiert werden. A FUNKTIONALABLEITUNG (iii) 156 Funktionale Wenn der Bildraum V ′ eines Operators der Körper C der komplexen Zahlen ist, V ⊇ D −→ W ⊆ C , O bezeichnen wir den Operator als Funktional.19 A.3 Lineare Funktionale Linear-stetiges Funktional. Als linear-stetiges Funktional L über einem linearen metrischen oder normierten oder unitären Raum V bezeichnen wir eine (1) überall definierte, (2) lineare, d.h. L(a1 φ1 + a2 φ2 ) = a1 L(φ1 ) + a2 L(φ2 ) , und (3) stetige Abbildung von V nach C. Die linear-stetigen Funktionale über einem Funktionenraum, meist über D(Rn ) oder n S , heißen auch Distributionen. Beispiele: (1) Die δ-Distribution δ : φ 7→ δ[φ] = φ(0) ∈ C erfüllt die drei oben genannten Eigenschaften. (2) Sei V = C ∞ ([a, b], R). Für ein festes f ∈ C([a, b], R) ist das Funktional bzw. die Distribution Tf : φ 7→ Zb dx f (x) φ(x) (A.3) a ebenfalls linear-stetig. Die Gesamtheit aller linearen Funktionale, die sich durch (A.3) darstellen lassen, heißt Menge der regulären Distributionen. A.4 Definition der Funktionalableitung Betrachtet sei ein Funktional A : DA → C, also eine Abbildung vom Banachraum V nach C; DA sei die Definitionsmenge von A. Gesucht ist eine lineare Approximation an A, d.h. ein lineares Funktional L, sodass für f ∈ V und h ∈ V mit khk klein“ folgendes gilt: ” A[φ + h] ≈ A[φ] + L(A, φ)[h] . (A.4) Dabei hängt L von A und von der Stelle φ ab. 19 Dies auch dann, wenn die φ ∈ V keine Funktionen sind; ist etwa V = Funktional. Rn , so ist die Norm k · k ein A FUNKTIONALABLEITUNG 157 Definition: Ein Funktional A : V ⊃ DA → C heißt an der Stelle φ ∈ DA differenzierbar, wenn es ein lineares Funktional L(A, φ) =: δA δφ gibt, so dass Folgendes gilt: A[φ + h] − A[φ] − δA [h] ≤ ε(khk) . δφ (A.5) Dabei ist ε(·) eine Nullfunktion, d.h. ε(x)/x → 0 für x → 0. Existiert so ein L, so heißt δA δφ Funktionalableitung. Spezialfall. Beschränkt man sich auf den Fall, dass DA = V ein Funktionenraum ist, dass A überall auf V differenzierbar ist und dass δA δφ überall stetig ist, so ist die Funktionalableitung eine Distribution. Wir nehmen an, dass sich das Funktional als reguläre Distribution schreiben läßt, d.h. Z δA δA [h] = dξ h(ξ) . (A.6) δφ δφ(ξ) Damit beschreibt die zugehörige Funktion g(x), die man formal schreibt als δA = Tg δφ mit g(x) =: δA δφ(x) , also δA . δφ(x) δA Anschaulich beschreibt δφ(x) die Änderung des Funktionals A[φ] bei Änderung der Funktion φ an der Stelle x, denn man kann solche h betrachten, die nur in der Umgebung von x von Null verschieden sind. δA mit der FunktionalableiIn der Physik identifiziert man oft die reguläre Funktion δφ(x) tung, δA = Tg δφ Identifizierung = g(x) =: δA . δφ(x) Diese Identifizierung führt auf den Begriff der δ-Funktion. Obwohl δ keine reguläre Distribution ist, schreibt man Z δ[φ] = φ(0) =: dx δ(x) φ(x) . (A.7) Beispiele: (1) Läßt sich das Funktional schreiben in der Form: Zx+ A[φ] = dx ℓ(x, φ(x), φ′ (x)) , (A.8) x− so liefert eine Taylorentwicklung (vgl. Übung) Zx+ n o A[φ + h] − A[φ] = dx ℓ x, φ(x) + h(x), φ′ (x) + h′ (x) − ℓ x, φ(x), φ′ (x) x− A FUNKTIONALABLEITUNG 158 Zx+ ∂ℓ dx ℓ x, φ(x), φ′ (x) + x, φ(x), φ′ (x) · h(x) = ∂φ x− ∂ℓ ′ ′ ′ x, φ(x), φ (x) · h (x) − ℓ x, φ(x), φ (x) + ∂φ′ + O khk2 + O kh′ k2 Zx+ ∂ℓ ∂ℓ ′ ′ ′ dx = x, φ(x), φ (x) · h(x) + x, φ(x), φ (x) · h (x) ∂φ ∂φ′ x− = + O khk2 + O kh′ k2 Zx+ ∂ℓ d ∂ℓ ′ dx x, φ(x), φ′ (x) − x, φ(x), φ (x) · h(x) ∂φ dx ∂φ′ x− ∂ℓ ′ x, φ(x), φ (x) · h(x) ∂φ′ + O khk2 + O kh′ k2 . + x+ x− Daraus liest man sofort die Distribution Funktion ist somit: δA δφ(x) = (A.9) δA δf ab. Die zugehörige verallgemeinerte d ∂ℓ ∂ℓ ′ x, φ(x), φ′ (x) − x, φ(x), φ (x) ∂φ dx ∂φ′ ∂ℓ x, φ(x), φ′ (x) [δ(x − x+ ) − δ(x − x− )] . + ∂φ′ (A.10) (2) Die lineare Approximation an ein lineares Funktional an der Stelle φ ist wieder das lineare Funktional. Insbesondere ist die Funktionalableitung der Distribution T = δ(· − y) an der Stelle φ wieder δ(· − y). Da T (φ) = φ(y) ist, schreibt man formal δφ(y) = δ(x − y) . δφ(x) (A.11) (3) Hängt ein Funktional von einem Parameter y ab und läßt es sich darstellen mit Integral über den sog. Kern K(y, ·), Fy [φ] = Z dx′ K(y, x′ ) φ(x′ ) , (A.12) so ist die Funktionalableitung ebenfalls abhängig vom Parameter y und es gilt δFy = K(y, x) . δφ(x) A.5 Regeln Die folgenden Regeln werden in den Übungen hergeleitet. (A.13) A FUNKTIONALABLEITUNG Produktregel. 159 Läßt sich ein Funktional F als Produkt schreiben: F [φ] = G[φ] · H[φ] , so kann man die Funktionalableitung mit der Produktregel berechnen: δG δH δF = · H[φ] + G[φ] · . δφ(x) δφ(x) δφ(x) Kettenregel. (A.14) Ist das Funktional F Argument einer Funktion g, so gilt δg(F [φ]) δF dg = . δφ(x) dF [φ] δφ(x) (A.15) Schreibt man umgekehrt in das Argument eine Funktion von der (Test-)Funktion φ, so gilt dg δF δF [g(φ)] = (φ(x)) . δφ(x) δg(φ(x)) dφ (A.16) Steht im Argument das Bild eines Operators O, so gilt δF [Oφ] δO δF = , δφ(x) δ(Oφ(x)) δφ (A.17) wobei wir die Operatorableitung benötigen. A.6 Operatorableitung Die Funktionalableitung läßt sich auf Operatoren verallgemeinern. (Ein Funktional ist ein Spezialfall für einen Operator.) Auch hier sucht man die lineare Approximation an einen Operator O, d.h. einen linearen Operator L mit O(φ + h) ≃ O φ + L h für kleine“ h. ” Ein Operator O auf DO heißt an der Stelle φ ∈ DO differenzierbar, wenn δO gibt, sodass es einen linear-beschränkten Operator δφ O(φ + h) − Oφ − δO h ≤ ε(khk) (A.18) δφ Definition: gilt mit einer Nullfunktion ε, d.h. x→0 ε(x) −−−→ 0 . Das Objekt δO heißt dann Operatorableitung. δφ Bemerkung: In der Physik hat man es meist mit linearen Operatoren zu tun, daher kommt die Operatorableitung nicht so häufig zum Tragen. A FUNKTIONALABLEITUNG A.7 160 Höhere Funktionalableitungen Die Funktionalableitung δF δφ ist ein lineares Funktional über V , das i.a. von der Stelle φ abhängt. Bei festem h ist δF [h] δφ wiederum eine Abbildung der φ ∈ V nach C, die man wiederum nach φ differenzieren kann. Durch δF 2 δF δ F − [h] [h] − [h, k] (A.19) ≤ kkk · ε(kkk) 2 δφ δφ δφ φ+k φ wird die zweite Funktionalableitung δ2F δφ2 eines Funktionals F : V → R eindeutig definiert, sofern sie existiert. Man setzt also: δ δF δ2F [h, k] = [h] [k] . δφ2 δφ δφ (A.20) Auf die gleiche Weise, wie man die erste Funktionalableitung identifizieren kann mit einer Funktion f : Rn → C, identifiziert man die zweite Funktionalableitung mit einer Funktion g : Rn × Rn → C. Dafür schreibt man: g(x, y) = δ2F δφ(x) δφ(y) Identifizierung = δ2 F , δφ2 wodurch auch klar wird, wie man (A.20) auszuwerten hat: Z Z δ2F δ2 F n [h, k] = d x dn y h(x) k(y) . 2 δφ δφ(x) δφ(y) (A.21) (A.22) Dabei wurde wieder vorausgesetzt, dass die entsprechenden Funktionalableitungen regulär sind. Beispiel: Betrachte Z Z 1 F [φ] = dx dy φ(x) ∆(x, y) φ(y) , 2 wo ∆ symmetrisch in seinen Argumenten sein soll. Mit der ersten Funktionalableitung identifiziert man: Z δF = dy ∆(x, y) φ(x) . δφ(x) Diese hängt offensichtlich von der Stelle φ ∈ V ab. Die zweite Funktionalableitung wird mit den selben Regeln gebildet, die auch für die erste gelten. Man erhält gemäß (A.13) δ2F = ∆(x, y) . δφ(x) δφ(y) Verallgemeinerung: Die Bildung höherer Funktionalableitungen erfolgt analog. B SUPERZAHLEN B 161 Superzahlen Die folgenden Ausführungen orientieren sich an dem Buch von Buchbinder & Kuzenko [22]. B.1 Algebra und Generatoren einer Algebra Definition: Eine Algebra ist ein linearer Raum A, auf dem eine Multiplikation “·“ (α, β) 7→ α · β ∈ A ∀α, β ∈ A (B.1) definiert ist, die für α, β, γ ∈ A und a, b ∈ C folgende Axiome erfüllt: α (a β + b γ) (a β + b γ) α = = aαβ + bαγ , aβ α + bγ α . (B.2) Ist die Multiplikation assoziativ, so nennt man A eine assoziative Algebra. Definition: Sei A eine assoziative Algebra mit Einselement 1 und sei B ⊂ A eine Teilmenge von A. Man nennt die Elemente ζi ∈ B Generatoren der Algebra A, falls sich jedes Element γ ∈ A als ein Polynom endlicher Ordnung in den Elementen ζi ∈ B darstellen läßt, γ = γ (0) 1+ p X X (k) k=1 i1 ,i2 ...ik B.2 γi1 ,i2 ...ik ζi1 ζi2 · · · ζik . (B.3) Endlichdimensionale Grassmann-Algebra Definition: Die Grassmann-Algebra Λn der Dimension n ist eine assoziative Algebra mit Einselement. Sie wird dadurch definiert, dass die Generatoren die folgenden Antikommutatorrelationen erfüllen: {ζi , ζj } := ζi ζj + ζj ζi = 0 , i, j = 1, . . . , n . (B.4) Für die Generatoren gilt wegen (B.4) insbesondere ζi2 = 0 . (B.5) Ein beliebiges Element γ der endlichdimensionalen Grassmann-Algebra läßt sich darstellen als ein Polynom der Form γ = γ (0) 1+ n X X k=1 i1 <i2 <···<ik (k) γi1 i2 ···ik ζi1 ζi2 · · · ζik . (B.6) Dabei sind die Koeffizienten γi1 i2 ···ik ∈ C. Die Polynome, nach denen γ entwickelt“ wird, ” sind in dieser Darstellung wegen i1 < i2 < · · · < ik linear unabhängig und bilden zusammen mit dem Einselement eine Basis der Algebra. Wegen (B.5) verschwinden alle Polynome mit ii = ij und wegen (B.4) sind Polynome mit permutierten Generatoren nicht linear unabhängig. (k) B.3 Unendlichdimensionale Grassmann-Algebren; Superzahlen Durch den Übergang zu unendlich vielen Generatoren ζi kann man eine unendlichdimensionale Grassmann-Algebra erklären. B SUPERZAHLEN 162 Definition: Die Elemente der unendlichdimensionalen Grassmannalgebra Λ∞ heißen Superzahlen. Superzahlen z lassen sich schreiben als Summe z = zB + zS , (B.7) wo zB ∈ C und zS ∞ X 1 X zi ···i ζi . . . ζi1 = n! i ,i ,...i 1 n n n=1 1 2 (B.8) k gilt. Man kann Superzahlen z in einen geraden und einen ungeraden Teil zerlegen z u v = u+v , ∞ X = zB + (B.9) 1 (2n)! n=1 i = ∞ X 1 (2n + 1)! n=0 X 1 ,i2 ,...ik X i1 ,i2 ,...ik zi1 ···i2n ζi2n . . . ζi1 , (B.10) zi1 ···i2n+1 ζi2n+1 . . . ζi1 . (B.11) Rein ungerade Superzahlen heißen a-Zahlen und antikommutieren untereinander. Rein gerade Superzahlen heißen c-Zahlen und kommutieren mit allem anderen. Die Menge der a-Zahlen Ca bildet keine (Unter-)Algebra, die Menge Cc der c-Zahlen hingegen schon. a-Zahlen bzw. c-Zahlen werden als reine Superzahlen bezeichnet. Definition: Sei z eine reine Superzahl. Die Parität ε ist 0, falls z ∈ Cc , ε(z) := 1, falls z ∈ Ca . (B.12) Definition: Die komplex konjugierte z ∗ einer Superzahl z ∈ Λ∞ ist erklärt über folgende Wirkungsweise der komplexen Involution ∗ (ζ i )∗ := ζ i , (α z)∗ := α∗ z ∗ , i = 1, 2, . . . α∈C (z + w)∗ := z ∗ + w∗ , (z w)∗ := w∗ z ∗ . w ∈ Λ∞ (B.13a) (B.13b) (B.13c) (B.13d) Entsprechend heißt z reell, falls z ∗ = z und imaginär, falls z ∗ = −z. Bemerkung: Das Produkt zweier reeller a-Zahlen ist imaginär, denn (w z)∗ = z ∗ w∗ = z w = − w z . Die Menge der reellen Superzahlen in Ca bzw. Cc wird als Ra bzw. Rc bezeichnet. Bemerkung: Man muß bei der durch Transposition bedingten Vertauschung von aZahlen auf das Vorzeichen achten: Seien a1 und a2 a-Zahlen. Wir fordern, dass das Transponierte einer Superzahl wieder die selbe Superzahl ist, d.h. ! (a1 a2 )T = η aT2 aT1 = η a2 a1 = − η a1 a2 = a1 a2 . Dies legt η auf −1 fest. Transposition entspricht also der naiven Vertauschung und führt daher gegebenenfalls auf Vorzeichen. B SUPERZAHLEN 163 Satz B.1. Analytische Funktionen von a-Zahlen f : f (θ) = f0 + f1 θ B.4 mit Ca → Λ∞ haben stets die Gestalt f0 , f1 ∈ Λ∞ . (B.14) Elemente der Analysis mit Superzahlen Es werden Superfunktionen betrachtet, d.h. Abbildungen f: Rp|q → Λ∞ . (B.15) Hierbei ist Rp|q = Rpc × Rqa , d.h. die Menge der (p + q)-Tupel (x1 , . . . , xp , θ1 , . . . , θq ) mit xi ∈ Rc und θα ∈ Ra . Eine solche Funktion heißt superanalytisch, falls sie sich in als Potenzreihe darstellen läßt, f (z) = = f (x1 , . . . , xp , θ1 , . . . , θq ) ∞ X fM1 M2 ...Mk zM1 zM2 · · · zMk , (B.16) k=0 mit zα = xα , θα−p , 1≤α≤p, p<α≤p+q . (B.17) wobei fM1 M2 ...Mk ∈ Λ∞ . Nun ist klar, dass die Entwicklung in den a-Zahlen θα schnell abbricht; daher läßt sich (B.16) auch wie folgt ausdrücken: f (x1 , . . . , xp , θ1 , . . . , θq ) q X 1 = f0 (x1 , . . . xp ) + f[α α ...α ] (x1 , . . . xp ) θα1 θα2 · · · θαk . k! 1 2 k (B.18) k=1 Dabei deuten die eckigen Klammern [. . . ] an, dass die superanalytischen Koeffizientenfunktionen f[α1 α2 ...αk ] total antisymmetrisch in den Indizes sind. Da sich das Bild f (z) zerlegen läßt in c-Teil und a-Teil f (z) = fc (z) + fa (z) , fc (z) ∈ Cc , fa (z) ∈ Ca , genügt es, gerade oder bosonische“ Funktionen ” fc : Rp|q → Cc und ungerade oder fermionische“ Funktionen ” fa : Rp|q → Ca zu betrachten. Diesen weist man die Parität 0, falls f bosonisch , ε(f ) = 1, falls f fermionisch , zu. Damit weiß man auch sofort die Parität der Koeffizientenfunktionen, ε(f0 ) = ε(f ) , (i) ε(fα1 α2 ...αk ) = ε(f ) + k mod 2 . Differentiation nach a-Zahlen Für Funktionen von Superzahlen mit Werten in Λ∞ läßt sich eine Differentiation definieren. Dabei genügt es nach (B.18), festzulegen, wie die Differentiation auf ein Polynom aus den antikommutierenden θs mit wirkt. B SUPERZAHLEN 164 Definition: Man erklärt die sog. Linksdifferentiation dadurch, dass sie bei einem Produkt aus antikommutiereneden Variablen nur dann auf ein bestimmtes Element wirken kann, wenn es sich am linken Rand des Ausdrucks befindet. Die übrigen Differentiationsregeln werden beibehalten. Insbesondere gilt: q X 1 ∂ f (z) = (−1)ε(f ) f[αα1 ...αk−1 ] (x) θα1 · · · θαk−1 . (−1)k ∂θα (k − 1)! (B.19) k=1 Analog kann auch Rechtsdifferentiation definiert werden. Im folgenden wird unter der Differentiation immer Linksdifferentiation verstanden. Beispiel: Betrachte eine Funktion f : f0 , f1 , f2 , f12 , f21 die Darstellung R2a → Λ∞ . Sie besitzt mit den Koeffizienten 1 f (θ1 , θ2 ) = f0 + f1 θ1 + f2 θ2 + (f12 θ1 θ2 + f21 θ2 θ1 ) . |2 {z } =f12 θ1 θ2 Terme höherer Ordnung treten wegen θi2 = 0 nicht auf. Wie die Differentiation nach θi auf f wirkt, hängt gemäß (B.19) von der Parität von f ab. Wir wollen nun ein bosonisches f betrachten und wählen daher f0 , f12 , f21 ∈ Cc und f1 , f2 ∈ Ca . Die Ableitungen lauten dann: ∂f ∂θ1 = 1 −f1 + (f12 − f21 ) θ2 = − f1 + f12 θ2 , 2 ∂2f = − f12 ∂θ1 ∂θ2 | {z } ∂ ≡ ∂θ ∂f ∂θ2 = 1 −f2 − (f12 − f21 ) θ1 = − f2 + f21 θ1 , 2 ∂f 1 ∂θ2 ∂2f = − f21 = f12 . ∂θ2 ∂θ1 Das zeigt, dass die Reihenfolge der Differentialoperatoren von Bedeutung ist, bzw. dass die zweite fermionische Ableitung antisymmetrisch ist. Die zweite Zeile erhält man anschaulich, wenn man die Vertauschung θ1 θ2 = − θ2 θ1 durchführt, um die Linksdifferentiation ∂θ∂ 2 ausführen zu können. Bemerkung: Aus der Definition der Linksdifferentiation folgen die Antikommutatorrelationen ∂ ∂ ∂ θα , = δαβ , , = 0. (B.20) ∂θβ ∂θα ∂θβ (ii) Integration über a-Zahlen Um die Integration einer Funktion von a-Zahlen einzuführen, fordert man neben Linearität und Translationsinvarianz die Normierung Z dθi θi := 1 . (B.21) Aus der Translationsinvarianz folgt Z Z Z ! dθ1 f (θ1 ) = dθ1 f (θ1 + θ2 ) = dθ1 {f0 + f1 · (θ1 + θ2 )} B SUPERZAHLEN = 165 Z dθ1 f (θ1 ) + Z dθ1 1 f1 θ2 =⇒ Z dθα 1 = 0 . (B.22) Mehrfache Integrale werden als Iteration von Einfachintegralen verstanden. Um diese zu berechnen, benötigt man Regeln zur Vertauschung der Differentiale dθi . Die Relationen dafür werden wir uns nun ermitteln. Bemerkung: Im Raum der a-Zahlen sind Integration und Differentiation identische Operationen. Es gilt: Z ∂ . (B.23) dθα = ∂θα Um diese Aussage zu begründen, betrachte eine fermionische Funktion f : gilt: Z Z ∂ dθ1 f (θ1 ) = dθ1 (f0 + f1 θ1 ) = f1 = f (θ1 ) . ∂θ1 Ra → Ra . Es Wegen (B.23) fordert man für die Differentiale dieselben Antikommutatorrelationen wie für die Differentiationsoperatoren (B.20): {dθi , dθj } = 0 , {dθi , θj } = δij (B.24) Dies sind die gesuchten Regeln für die Vertauschung der Reihenfolge bei Mehrfachintegration. Beispiel: Gauß-Integrale mit a-Zahlen (vgl. Übungen) Es seien θα , θ̄α , ηα und η̄α (i = 1, . . . , n) jeweils a-Zahlen. Wir betrachten nun das Integral Z ZG (η, η̄) = dθ̄1 dθ1 · · · dθ̄n dθn exp{−S0 } (B.25) mit S0 = n X θ̄α aαβ θβ + α,β=1 n X (η̄α θα + θ̄α ηα ) = θ̄T A θ + η̄ T θ + θ̄T η (B.26) α=1 und der symmetrischen, invertierbaren Matrix A = (aij ). (a) Mit der Variablentransformation θα = θα′ − (A−1 )αβ ηβ und θ̄α = θ̄α′ − η̄β (A−1 )βα , zeigt man, dass ZG = (det A) exp n X α,β=1 η̄α (A−1 )αβ ηβ = (det A) exp η̄ T A−1 η .(B.27) (b) Jetzt wird zu S0 die Wechselwirkung“ V (θ, θ̄) addiert. Dann ergibt sich ” Z Z(η, η̄) = dθ̄1 dθ1 · · · dθ̄n dθn exp{−S0 + V (θ, θ̄)} ∂ ∂ ZG (η, η̄) = exp V − , ∂ η̄ ∂η (B.28) B SUPERZAHLEN 166 Bemerkung: Vergleich mit dem Gaußintegral in Cn : Für komplexe, unabhängige Variablen φi und φ∗i lautet die entsprechende Formel: Z dφ∗1 dφ1 · · · dφ∗n dφn exp −φ† · A · φ ∼ (det A)−1 . Die Determinante von A steht hier im Nenner. B.5 Fermionische Felder Im Kontinuumslimes θα −→ θ(x) . wird der diskrete Satz an a-Zahlen zum fermionischen Feld θ : riablen θ(x) sind dann für jedes x a-Zahlen. B.6 (i) M4 → Ca , d.h. die Feldva- Funktionalanalysis im Kontext von Superzahlen Funktionalableitung Die Regeln zur Differentiation nach a-Zahlen lassen sich auf die Regeln zur Funktionalableitung nach fermionischen, d.h. a-Zahl-wertigen, Feldern übertragen. Es gilt: δθ(x) = δ 4 (x − y) . δθ(y) Die Antikommutatorrelationen lauten: δ , θ(y) = δ 4 (x − y) und δθ(x) (ii) (B.29) δ δ , δθ(x) δθ(y) = 0. (B.30) Funktionalintegration Man überträgt die Integrationsregeln für a-Zahlen auf die Regeln zur Integration über fermionische Felder. Es soll gelten: Z Z dθ(x) θ(x) = 1 , dθ(x) 1 = 0 . (B.31) R Dabei bedeutet dθ(x) die Integration über R die a-Zahl zum kontinuierlichen ”Index“ x. Bei der Definition des Funktionalintegrals Dθ mittels Diskretisierung des Index“ x und ” anschließendem Grenzübergang zum Unendlichdimensionalen wird für jeden Generator zum diskreten Index xk diese Normierung des Integrals, Z dθ(xk ) θ(xk ) = 1 , gefordert. B SUPERZAHLEN (iii) 167 Funktionalintegrationsregeln für Fermionenfelder Betrachtet man Dirac-Felder, so sind die Feldvariablen ψ(x) und ψ(x) unabhängige fermionische Felder. Im Folgenden wird angenommen, dass sich (B.27) für verschwindenden Quellterm verallgemeinern läßt zu: Z Z Z Dψ Dψ exp i d4 x′ d4 x ψ(x′ ) O(x′ , x) ψ(x) = det O . (B.32) Dabei ist O ein Operator. Für den Ausdruck det O gilt die Formel det O = exp {tr(ln O)} . (B.33) Im Unterschied zur Integration über kommutierende Skalarfelder steht der Ausdruck (det O) im Zähler anstatt im Nenner. Im Ausdruck für das erzeugende Funktional wird der Term aus (B.32) in der Normierung absorbiert. Es wird davon ausgegangen, dass sich (B.27) verallgemeinern läßt zu Z Z Z Z 4 4 ′ ′ ′ 4 d x ψ(x ) O(x , x) ψ(x) + d x ψ(x) η(x) + η(x) ψ(x) Dψ Dψ exp i d x Z Z −1 ′ 4 ′ ′ 4 = (det O) exp i d x d x η(x ) O (x , x) η(x) (B.34) Dabei sind η(x) und η(x) unabhängige fermionische Felder. C LÖSUNGEN DER DIRAC-GLEICHUNG FÜR FREIE TEILCHEN C C.1 168 Lösungen der Dirac-Gleichung für freie Teilchen γ-Matrizen und Clifford-Algebra Die Dirac-Gleichung, d.h. die Feld-Gleichung für Spinoren Ψ, wird üblicherweise mit Hilfe der γ-Matrizen ausgedrückt. Diese sind Darstellungsmatrizen von Elementen der CliffordAlgebra, und erfüllen somit die Anti-Kommutationsrelationen {γµ , γν } = 2 ηµν . (C.1) Es gibt einige besonders nützliche Darstellungen der γ-Matrizen. Hierbei sind insbesondere die Dirac-Darstellung und die Weyl-Darstellung zu nennen. In der Dirac-Darstellung hat man 12 0 0 σi i 0 , (C.2) , γ = γ = 0 −12 −σ i 0 wohingegen in der Weyl-Darstellung gilt 0 σµ . γµ = σ̄ µ 0 (C.3) Die Darstellungen stehen durch unitäre Transformationen U miteinander in Beziehung, 1 12 −12 γµ′ = U † γµ U , Ψ′ = U † Ψ mit U = √ . (C.4) 12 12 2 Insbesondere hat man µ µ γDirac = U † γWeyl U. C.2 (C.5) Basislösungen u und v Betrachte die Dirac-Gleichung (i γ µ ∂µ − m) Ψ =: i ∂ − m Ψ = 0 . (C.6) In der Dirac-Darstellung zerlegt man die Lösung Ψ in Lösungen zu positiver und negativer Energie, Ψpos (x) Ψneg (x) = = exp(−i p · x) u(s) (p) , exp(i p · x) v (s) (p) . (C.7a) (C.7b) Die Spinoren u und v erfüllen hierbei die Matrix-Gleichungen (s) (p − m) u (p) (s) (p + m) v (p) = = 0, 0. Es hat sich folgende Wahl für die Spinoren u und v eingebürgert: √ p · σ χ(s) √ , u(s) = p · σ̄ χ(s) √ p · σ ε χ(s) . v (s) = − √ p · σ̄ ε χ(s) (C.8a) (C.8b) (C.9a) (C.9b) C LÖSUNGEN DER DIRAC-GLEICHUNG FÜR FREIE TEILCHEN Hierbei sind χ(1) = 1 0 und χ(2) = 0 1 , 169 (C.10) Basis-Spinoren mit Spin in z-Richtung von ±1/2 und 0 1 ε = . −1 0 (C.11) Es gilt (Übung) √ √ p·σ+m p · σ̄ + m und , p·σ = p p · σ̄ = p 0 2 (p + m) 2 (p0 + m) p wobei p0 = E = m2 + p~ 2 . Die Spinoren u und v erfüllen die Vollständigkeitsrelationen X u(s) (p) u(s) (p) = p +m, (C.12) (C.13a) s=1,2 X s=1,2 v (s) (p) v (s) (p) = p −m. Des Weiteren hat man † † ′ ′ u(s) (k) u(s ) (k) = v (s) (k) v (s ) (k) † † ′ ′ u(s) (~k) u(s ) (−~k) = v (s) (~k) u(s ) (−~k) (C.13b) ′ = 2ωk δ ss , (C.14a) = 0, (C.14b) wobei in der zweiten Zeile durch die Schreibweise ~k zum Ausdruck gebracht wird, dass nur die räumlichen Komponenten des Vierervektors k ein Minus erhalten. D SPURBILDUNG VON PRODUKTEN VON DIRAC-MATRIZEN D 170 Spurbildung von Produkten von Dirac-Matrizen Für die Spur von Produkten von γ-Matrizen gelten die folgenden Regeln: (1) tr 14 = 4. (2) tr (a 1 a 2 ) = 4 a1 · a2 . (D.1) (3) Die Spur einer ungeraden Anzahl an γ-Matrizen verschwindet, tr (a 1 a 2 · · · a n ) = 0 für ungerades n. (D.2) (4) Für eine gerade Anzahl gilt die Rekursionsformel: tr (a 1 · · · a n ) = a1 · a2 tr (a 3 · · · a n ) − a1 · a3 tr (a 2 a 4 · · · a n ) +a1 · a4 tr (a 2 · · · a 3 a 5 · · · a n ) − · · · +a1 · an tr (a 2 · · · a n−1 ) , (D.3) insbesondere: tr (a 3 a 4 ) = 2 a 1 a 4 [(a1 · a2 ) (a3 · a4 ) + (a1 · a4 ) (a2 · a3 ) − (a1 · a3 ) (a2 · a4 )] . (D.4) D SPURBILDUNG VON PRODUKTEN VON DIRAC-MATRIZEN 171 Zu (D.1): tr(a b) Zu (D.2): 1 = tr(b a) b + b a) = 2 tr(a 1 µ ν a b tr (γµ γν + γν γµ ) = 2 = ηµν aµ bν tr 14 = 4 a · b . Wegen der zyklischen Invarianz der Spur gilt: tr a 1 · · · a n γ5 . 1 · · · a n = tr a 1 · · · a n |γ5{zγ}5 = tr γ5 a =1 Mit der Relation γµ γ5 + γ5 γµ = 0 kann man das linke γ5 nach rechts durchziehen, n tr a 1 · · · a n = (−1) tr a 1 · · · a n γ5 γ5 = 0 . D.h., für ungerades n muß die Spur verschwinden. Zu (D.3): a 1 a 2 Da = = aµ1 aν2 γµ γν = aµ1 aν2 (γµ γν + γν γµ − γν γµ ) 2 aµ1 aν2 ηµν − aν2 aµ1 γν γµ = 2a · b − a 2 a 1 gilt, kann man mit a 1 + 2a1 · a2 den Faktor a 1 nach rechts schieben, 1 a 2 = −a 2 a tr a 1 a 2 · · · a n = 2 a1 · a2 tr a 3 · · · a n − tr a 2 a 1 a 3 · a n . Durch Fortsetzung des Prozesses ergibt sich tr a 1 · · · a n = 2 a1 · a2 tr a 3 · · · a n − 2 a1 · a3 tr a 2 a 4 · · · a n + · · · + 2 a1 · an tr a · · · a − tr a · · · a 2 n−1 2 n a 1 . Bringt man den letzten Term auf die rechte Seite und benutzt die zyklische Invarianz der Spur, erhält man die Behauptung. Weitere Hilfsformeln: (a) Für beliebige Dirac-Matrizen M gilt: |uf M ui |2 = (uf M ui ) (ui M uf ) (D.5) mit M = γ 0 M † γ 0 , denn (ui M uf ) (b) = (u†i γ 0 γ 0 M † γ 0 uf ) = (u†f γ 0 M ui )† . tr(γ µ γ ν γ ρ γ σ γ5 ) = − 4 i εµνρσ . (D.6) E YOUNG-TABLEAUX E 172 Young-Tableaux Das Ziel dieser Ergänzung ist es, einen Überblick über die SU(N ) Darstellungstheorie zu geben. Die Diskussion richtet sich im Wesentlichen an [1, S. 102 ff.]. E.1 (i) Generelle Eigenschaften Tensor-Notation für SU(N ) Wir betrachten in diesem Abschnitt Tensoren der SU(N ), d.h. Elemente einer Darstellung der speziellen unitären Gruppe. Mit einem (p, q)-Tensor |ψi assoziieren wir die Kompoj ...j nenten ψi11···iqp , E i ···i j ...j (E.1) |ψi = j11 ...jqp ψi11···iqp . j ...j Wir werden im Folgenden nicht zwischen dem Tensor |ψi und seinen Komponenten ψi11···iqp unterscheiden. (ii) Einführendes Beispiel: Symmetrische und antisymmetrische Tensoren zweiter Stufe Betrachte nun einen (0, 2)-Tensor Ψij . Offensichtlich läßt sich dieser zerlegen in einen (+) (−) symmetrischen Anteil ψij und einen antisymmetrischen Anteil ψij , ) (+) ψij = 21 (Ψij + Ψji ) (+) (−) ↔ Ψij = ψij + ψij . (E.2) (−) ψij = 21 (Ψij − Ψji ) Eine wesentliche Beobachtung ist, dass unter einer Transformation die Anteile nicht mischen, d.h. wegen (ψ (+) )′kℓ (+) = Uk i Uℓ j ψij Symmetrie = Uk i Uℓ j ψji Umindizierung (i↔j) Uk j Uℓ i ψij = (+) (+) = (ψ (+) )′ℓk (E.3) (−) und der analogen Überlegung für ψij bleiben die Symmetrieeigenschaften erhalten. Es hat sich die Notation eingebürgert, Antisymmetrie mit einem ;“ zu kennzeichnen, ” (−) ψi;j := ψij = Ψ[ij] , (E.4a) und bei einem fehlenden ;“ von Symmetrie auszugehen, ” (+) ψij = ψij = Ψ{ij} . (E.4b) Man erhält die Tensoren durch Symmetrisierung bzw. Antisymmetriesierung. Die Idee der Young-Tableaux ist nun, die Symmetrieeigenschaften mit Kästchen darzustellen. Nebeneinander angeordnete Kästchen deuten Symmetrie und untereinander angeordnete Kästen Antisymmetrie an, d.h. ψ i j ↔ ψij und ψ i ↔ ψi;j , j E YOUNG-TABLEAUX 173 oder kürzer (wir sparen uns das ψ auf der linken Seite in den Formeln) i j (+) ↔ ψij und i j (−) ↔ ψij . In der Sprache der Young-Tableaux schreibt sich (E.2) demzufolge als Ψij = ψij + ψi;j = (iii) i . i j + j (E.5) Verallgemeinerungen Ein beliebiger (0, q)-Tensor läßt sich stets zerlegen in Anteile definierter Symmetrie, Ψi1 ...iq = ψi1 ...iq + ψi1 ···iq−1 ;iq + ψi1 ···iq−2 ;iq−1 iq + · · · + ψi1 ;i2 ···iq + ψi1 ···iq−2 ;iq−1 ;iq + · · · + ψi1 ;i2 ···iq−1 ;iq .. . + ψi1 ;i2 ;··· ;iq . (E.6) Analog zu (E.3) finden wir, dass die Transformationen nur innerhalb der Zustände definierter Symmetrie vermitteln. Allerdings beihnaltet (E.6) unnötig viele Ausdrücke; wir werden später in E.2 sehen, wie man Redundanzen vermeidet. Ein Young-Tableau ist also ein Schema , das mit Indizes aufgefüllt wird. Mit den Indizes repräsentiert es einen Tensor gemischter Symmetrie, z.B. i j k ↔ ψij;k , wobei die Kästchen den Plätzen der Indizes entsprechen. Der wesentliche Aspekt ist, dass die Anordnung der Kästchen die Symmetrie bzgl. Austausch der Indizes i, j, k festlegt: • Sind die Kästchen nebeneinander angeordnet, so ist der Tensor symmetrisch bzgl. Austausch der Indizes, und • sind die Kästchen übereinander angeordnet, so ist der Tensor antisymmetrisch bzgl. Austausch der Indizes. Im obigen Fall ist der Zustand also symmetrisch bzgl. der Vertauschung i ↔ j und antisymmetrisch bzgl. i ↔ k. Folgerung: Nach Konstruktion läßt sich jeder Tensor mit einer definierten Symmetrie durch solch ein Schema beschreiben. Solche Zustände mit n Kästchen sind Tensoren einer irreduziblen Darstellung der Permutationsgruppe Sn . E YOUNG-TABLEAUX E.2 174 Standard-Anordnung Wegen der Symmetrieeigenschaften ist beispielsweise ψ21;3 durch ψ12;3 oder ψ1;22 = −ψ2;12 durch −ψ12;2 gegeben. Es genügt also, einige wesentliche Komponenten von ψ zu kennen [23]. Unter der Standard-Anordnung eines Young-Tableaux versteht man eine Anordnung, die die folgenden Bedingungen erfüllt: • Die Zeilen werden immer kürzer und sind linksbündig, und nicht . • Die Zahlen nehmen nach rechts nicht ab, 1 2 3 4 oder 1 2 2 3 , aber nicht 1 2 3 2 . • Die Zahlen werden nach unten größer, 1 2 3 , aber nicht 1 3 2 oder 1 2 . 2 Satz: Jeder einer irreduziblen Darstellung der Sn angehörige Tensor n-ter Stufe, der sich als Tensorprodukt von Tensoren erster Stufe eines N -dimensionalen Multipletts der SU(N ) schreiben läßt, transformiert unter einer irreduziblen Darstellung der Gruppe SU(N ). Folgerung: Jeder Tensor mit n Indizes, der einem Young-Tableau entspricht, ist ein Basiszustand einer Darstellung der SU(N ). Die Zahl der Young-Tableaux in Standardanordnung mit dieser Kästchenanordnung ist die Dimension dieser irreduziblen Darstellung. Beispiel: Die Möglichkeiten, zwei ununuterscheidbare Teilchen in zwei Zuständen symmetrisch anzuordnen, sind die drei Standard-Anordnungen: 1 1 , 2 2 und 1 2 . Dies entspricht einer dreidimensionalen irreduziblen Darstellung der SU(2), also beispielsweise dem Triplett bei der Drehimpulskopplung zweier Spin- 21 -Teilchen. Umgekehrt gibt es nur ein Young-Tableau in Standard-Anordnung für den antisymmetrischen Fall, 1 . 2 Dieser entspricht dem Singlett und spiegelt wieder, dass eine antisymmetrische 2×2 Matrix nur eine linear unabhängige Komponente hat. Es zeigt sich also, dass der horizontalen Anordnung der Kästchen drei Tableaux in Standard-Anordnung entsprechen, der vertikalen Anordnung nur eine. Im Folgenden werden allgemeine Regeln aufgestellt, womit man aus der Kästchenanordnung sofort die Anzahl der Tableaux in Standard-Anordnung ermitteln kann. E YOUNG-TABLEAUX 175 Beispiel: Wir betrachten nun die SU(3) und einen Tensor Ψij;k mit gemischter Symmetrie. Was bedeutet die Symmetrisierung oder Anti-Symmetrisierung hier? Wir symmetrisieren zunächst zeilenweise und führen dann eine Antisymmetrisierung bzgl. untereinanderstehender Indizes durch.20 Wir starten also mit dem Tensor ψijk . Symmetrisierung der Indizes i und j führt auf die Summe ψijk + ψjik . Nun antisymmetrisieren wir bzgl. der Vertauschung i ↔ k und erhalten damit bis auf einen möglichen Normierungs-Faktor Ψij;k = ψijk + ψjik − ψjki − ψkji . (E.7) Im Fall N = 3 ergeben sich die folgenden Tableaux in Standard-Anordung: 1 1 , 2 1 1 , 3 1 2 , 2 1 2 , 3 1 3 , 2 1 3 , 3 2 2 3 und 2 3 . 3 (E.8) Durch Einsetzen in (E.7) sieht man, dass beispielsweise Ψ12;2 nicht verschwindet, Ψ12;2 = ψ122 + ψ212 − ψ221 − ψ221 6= 0 . Ähnlich überzeugt man sich davon, dass alle in (E.8) aufgeführten Tableaux nicht-verschwindenden und unabhängigen Komponenten von Ψ entsprechen. Das bedeutet, dass dieser Tensor 8 unabhängige Komponenten hat. Alle weiteren Komponenten können auf diese zurückgeführt werden. Wir werden Ψij;k mit der adjungierten Darstellung identifizieren. E.3 Young-Tableaux zur Bestimmung der Dimension irreduzibler Darstellungen der SU(N ) Die SU(N ) hat eine definierende Darstellung der Dimension N ; physikalisch bedeutet das N Basiszustände, beispielsweise beschreibt die SU(2) den Spin von Teilchen mit zwei Einstellmöglichkeiten für den Spin. Weglänge. Jedem Kästchen eines Tableaus wird eine Weglänge L zugeordnet. Diese ist durch die Anzahl der nach rechts und unten durchquerten Kästchen erklärt, z.B. • × × × × ↔ Weglänge = 5 Abstand. Der Abstand D zum ersten Kästchen ist definiert als die Zahl der Schritte, die man benötigt um vom linken oberen Kästchen zu einem gegebenen Kästchen zu kommen. Dabei zählen horizontale vertikale Schritte positiv negativ , z.B. 0 −1 −2 +1 0 +2 +1 +3 +4 . Es wurde bereits erwähnt, dass jede Anordnung von Kästchen einer irreduziblen Darstellung entspricht. Die Dimension M dieser Darstellung ist gerade die Anzahl der YoungTableaux in Standard-Anordnung. 20 Ich danke für die Diskussion am Ende der bzw. am Anfang der Vorlesungen. E YOUNG-TABLEAUX 176 Dimension M einer irreduziblen Darstellung. der Kästchen berechnet man M gemäß M = Y Di + N Li i Beispiel: = Aus den Weglängen und den Abständen Produkt aller (Abstände+N ) . Produkt aller Weglängen (E.9) Betrachte die SU(2). N =2 0 −−−→ 2 : N =2 0 1 −−−→ 2 3 : 0 N =2 2 −−−→ 1 -1 : 2 = 2, 1 2·3 M = = 3, 2·1 2·1 = 1. M = 2·1 M = Insbesondere trägt ein Young-Tableau mit N Zeilen immer Dimension 1, → Dimension M = 1 . N Daraus resultiert die Regel, dass man eine Spalte mit N Zeilen aus einem Young-Tableau einfach herausstreichen darf, → N Beispiel: (E.10) Betrachte die SU(3). 0 0 1 N =3 −−−→ N =3 −−−→ 0 N =3 −−−→ -1 0 1 -1 N =3 −−−→ Man assoziiert mit Tensoren εijk und εijk , 3 : 3 4 : 3 2 : 3 4 2 : 3 = 3, 1 3·4 = 6, M = 2·1 3·2 M = = 3, 2·1 M = M = 3·4·2 = 8. 3·1·1 die Darstellung 3 und mit die Darstellung 3. Die Levi-Civita- in Tableaux-Schreibweise, transformieren als Singlett. Dies sieht man beispielsweise an εijk → Ui ℓ Uj m Uk n εℓmn = (det U) εijk = εijk . (E.11) E YOUNG-TABLEAUX 177 Die Levi-Civita-Tensoren erlauben es uns insbesondere, Indizes “hoch- bzw. runterzuziehen”, etwa ψ i;j = εijk ψk bzw. ψi = εijk ψ j;k . (E.12) M.a.W., ein vollkommen anti-symmetrischer (2, 0)-Tensor transformiert wie ein (0, 1) Tensor und umgehehrt. Des Weiteren transformiert ψ i φi trivial, woraus wir sehen können, dass Ui j = (U−1 )i j = (U† )i j (komponentenweise) . Wir können nun auch verstehen, warum Tensor-Schreibweise wird diesem Tableau ψ erhalten wir ψ ij;k = εjkℓ ψ i ℓ bzw. (E.13) der adjungierten Darstellung entspricht: In ij;k zugeordnet. Durch Kontraktion mit εjkℓ ψ i j = ψ ik;ℓ εjkℓ . (E.14) Das bedeutet, dass der (0, 3)-Tensor mit ψ ij;k gemischter Symmetrie wie ein (1, 1)-Tensor transformiert. Dies entspricht dem Transformationsverhalten Ta → U Ta U † (E.15) in der adjungierten Darstellung. E.4 Young-Tableaux zur Ausreduktion von Produkten irreduzibler Darstellungen der SU(N ) Das ausreduzierte Produkt zweier irreduziblen Darstellungen kann durch ein Produkt zweier Schemata dargestellt werden. Die Produktbildung der Schemata erfolgt in folgenden Schritten [1]: Schritt 1. Kennzeichne im ersten der beiden Tableaux alle Kästchen der ersten Zeile mit einem a, die der zweiten mit einem b usw. Schritt 2. (a) Summiere über alle Schemata mit abfallender Skyline, die sich durch Zusammensetzen des zweiten der Ausgangsschemata mit den Kästchen des Typs a ergeben. Dabei darf keine Spalte mehr als N Zeilen enthalten. (b) Fahre auf die selbe Weise fort mit den Kästchen des Typs b. (c) usw. Schritt 3. Streiche alle Spalten mit N Zeilen, solange das Schema nicht nur die Spalte ist. Schritt 4. Bilde für jedes der resultierenden Schemata eine Zeichenkette, indem die Label der ersten Zeile rückwärts gelesen werden, dann die zweite Zeile rückwärts gelesen und angefügt usw. Wenn die Zeichenkette links von einem beliebigen Element mehr b als a oder mehr c als b usw. enthält, verwerfe das entsprechende Schema. E YOUNG-TABLEAUX 178 Beispiel: Betrachte die SU(3). Quarks sind Farb-Tripletts. Wir reduzieren das Tensorprodukt der adjungierten Darstellung mit sich selbst aus: ⊗ Schritt 1. −−−−−−→ a a ⊗ b a a ⊕ Schritt 2.a −−−−−−→ a a a b ⊕ Schritt 2.b −−−−−−→ a ⊕ Schritt 3. −−−−−−→ Schritt 4. b a a b ⊕ a a a ⊕ ⊕ a b a a a a ⊕ b a ⊕ a a a b ⊕ ⊕ b a a b ⊕ a a ⊕ a a a ⊕ a b ⊕ = ⊕ ⊕ = 27 ⊕ 10 ⊕ 10 ⊕ 2 · 8 ⊕ 1 . ⊕ a a a a ⊕ b a b a a b ⊕ a a b b ⊕ b a a a b b ⊕ a a b ⊕ a a ⊕2· ⊕ ⊕ a a b a a b E YOUNG-TABLEAUX E.5 (i) 179 Young-Tableaux zur Bestimmung der Verzweigungs-Regeln Beispiel: SU(3) → SU(2) ⊗ U(1) Die SU(2) ist auf folgende, offensichtliche Weise in die SU(3) eingebettet: ! տ ր 0 SU(2) ∗∗ ւ σi ց 0 SU(3) . ↔ ∗ ∗ ∗ 0 0 0 Der Generator λ8 vertauscht mit den eingebetteten SU(2)-Generatoren λ1−3 , generiert deshalb eine U(1). Folglich haben wir SU(2) ⊗ U(1) in die SU(3) eingebettet. Weiterhin sieht man, dass die 3 in 21/3 und 1−2/3 zerfällt. Das relative Vorzeichen der U(1)-Ladungen ergibt sich aus x x iα y , exp(iαλ8 ) y = exp √ 3 0 0 0 0 −2iα 0 . exp(iαλ8 ) 0 = exp √ 3 z z Die Frage ist nun, wie ein SU(3)-Tensor ψi1 ···iq unter SU(2) ⊗ U(1) transformiert. Jeder Index kann entweder als Singlett oder Dublett unter der SU(2) transformieren. Um dies herauszufinden, verteilt man alle Kästchen eines zu einer Darstellung gehörigen YoungTableaux auf die SU(2) und die U(1), und konstruiert alle Young-Tableaux die sich als Tensorprodukt der aufgeteilten Schemata ergeben. Ein Kästchen in der U(1) entspricht +1 für die U(1)-Ladung, und es ist klar, dass die U(1)-Schemata keine vertikale Ausdehnung grösser als 1 besitzen dürfen. Desweiteren ergibt sich für ein Schema mit n Kästchen, wovon j unter SU(2) als Dubletts transformieren, eine Gesamt-Ladung“ von ” 1 2 2 Y = j − (n − j) = − n + j . (E.16) 3 3 3 Ergibt sich das Ausgangs-Tableau n mal, so tritt die Kombination in der Zelegung n mal auf. Beispiel: Zerlegung der 6. → : • ⊕ 6 → : 32/3 ⊕ 2−1/3 ⊕ 1−4/3 . ⊕ • : Dabei bedeutet ein • die Abwesenheit von Kästchen unter SU(2) bzw. U(1). Beispiel: Zerlegung der 8. → : • ⊕ 8 → 21 ⊕ 10 ⊕ 30 ⊕ 2−1 : ⊕ : ⊕ : E YOUNG-TABLEAUX (ii) 180 Verallgemeinerung SU(N + M ) → SU(N ) ⊗ SU(M ) ⊗ U(1) Das Vorgehen des letzten Abschnitts läßt sich auf SU(N + M ) → SU(N ) ⊗ SU ⊗ U(1) verallgemeinern. Offensichtlich sind Block-Matrizen mit Blöcken aus SU(N ) bzw. SU(M ) selbst Matrizen aus SU(N + M ), ∗ ··· ∗ .. . . N .. ∗ ··· ∗ . (E.17) ∗ ··· ∗ .. . . M .. ∗ ··· ∗ Darüberhinaus gibt es immer eine Superposition der Cartan-Generatoren, welche mit den Generatoren der Untergruppen vertauscht, nämlich M . .N . 1 M . (E.18) H=p −N 2 N M (N + M ) . .M . −N Die Kästchens eines Tableaux unter SU(N + M ) können analog zum vorangehenden Abschnitt verteilt werden. Aus der Gestalt des eingebetteten U(1) Generators (E.18) resultiert die U(1)-Ladung nM − mN für ein Schema mit n Kästchen in SU(N ) und m Kästchen in SU(M ). Beachte, dass Physiker dabei oft – wie auch bei SU(3) → SU(2) ⊗ U(1) – die U(1)-Ladung umnormieren. Beispiel: SU(5) → SU(3)⊗SU(2)⊗U(1). Die U(1)-Ladung ergibt sich zu 5·j−2·n, wobei n die Gesamtzahl und j die Zahl der Kästchen bezeichnet, die unter SU(3) transformieren. Physiker multiplizieren diese Zahl noch mit einem Konventionsfaktor von 1/6. (a) Zerlegung der 10. → 10 → : • ⊕ : ⊕ • : 3 ⊗ 1 −4/6 ⊕ (3 ⊗ 2)1/6 ⊕ (1 ⊗ 1)6/6 . {z } | {z } | {z } | qL uR eR (b) Zerlegung der 5. → = : ⊕ : (1 ⊗ 2)−3/6 ⊕ 3 ⊗ 1 2/6 . | {z } | {z } ℓL dR E YOUNG-TABLEAUX 181 Der Teilchengehalt einer Generation von Standard-Modell-Teilchen lässt sich also aus 5 und 10 unter SU(5) gewinnen. Das rechtshändige Neutrino kann als Singlett unter SU(5) eingeführt werden. Bemerkung: Das Young-Tableau der komplex konjugierten Darstellung erhält man, indem man ein gegebenes Young-Tableau auffüllt sodass alle Spalten die Länge N besitzen. Das Komplement, d.h. der fehlende Teil, entspricht dann nach einer Punktspiegelung genau dem Young-Tableau der komplex konjugierten Darstellung. Betrachte z.B. die SU(5): → → F MATRIX-DIAGONALISIERUNG F F.1 182 Matrix-Diagonalisierung Hermitesche Matrizen Theorem: Hermitesche Matrizen M können durch unitäre Transformationen diagonalisiert werden, U † M U = diag(M1 , . . . , Mn ) , (F.1) wo U unitär ist und die Eigenwerte Mi reell sind. Die Spalten von U enthalten die Eigenvektoren von M . Beweis: F.2 Siehe die Vorlesung zur linearen Algebra. Allgemeine Matrizen (Biunitäre Diagonalisierung) Theorem: Eine allgemeine, nicht-singuläre Matrix M kann diagonalisiert werden durch eine biunitäre Transformation, UL† M UR = diag(M1 , . . . , Mn ) . (F.2) UL und UR sind unitär, die Mi sind reell und positiv. Die Matrizen UL und UR können bestimmt werden, indem man unitäre Matrizen ermittelt, die M M † bzw. M † M diagonalisieren, d.h. UL† M M † UL UR† † M M UR Beweis: = diag(M12 , . . . , Mn2 ) , (F.3a) = diag(M12 , . . . , Mn2 ) (F.3b) . Definiere H 2 := M M † . (F.4) Diese Matrix ist offensichtlich hermitesch und kann daher durch eine unitäre Transformation diagonalisiert werden, UL† M M † UL = diag(M12 , . . . , Mn2 ) =: D2 , (F.5) wobei die Mi reell sind. Die Eigenwerte, d.h. die Diagonalelemente von D2 , sind positiv, weil M M † nur positive Eigenwerte hat. Um das zu sehen, betrachte eine Eigenvektor u von M M † , M M† u = λ u , und definiere v := M u. Dann ist 0 < v † v = u† M M † u = u† (M M † ) u = λ u† u , wo dann aus u† u > 0 die Behauptung λ > 0 folgt. Definiere nun D als diejenige diagonale Matrix, deren Diagonalelemente durch die Wurzeln der Diagonalelemente von D2 gegeben sind. Dann erfüllt H := UL D UL† (F.6) offensichtlich (F.4). Mit der Matrix V := H −1 M , die unitär ist aufgrund V†V H † =H = M † H −1 H −1 M (F.4) = M † (M M † )−1 M = 1, (F.7) F MATRIX-DIAGONALISIERUNG 183 erhalten wir M = HV (F.6) = UL D UR† , (F.8) wobei UR := V † UL unitär ist. Somit ist (F.2) bewiesen. Darüber hinaus diagonalisiert UR die Matrix M † M , denn UR† M † M UR (F.8) = UR† UR D UL† UL D UR† UR = D2 , (F.9) was (F.3b) zeigt. F.3 Symmetrische Matrizen Corrolar: Komplexe symmetrische Matrizen M können diagonalisiert werden mit einer unitären Matrix U , U T M U = diag(M1 , . . . , Mn ) =: D , (F.10) U † M † M U = D2 , (F.11) wobei d.h. die reellen Zahlen Mi sind die Wurzeln der Eigenwerte von M † M . Beweis: Von Theorem F.2 wissen wir, dass M = UL D UR† , (F.12) wobei UL , UR und D are eindeutig bestimmt sind.21 Da M symmetrisch ist, folgt M = M T = UR∗ D ULT . (F.13) Andererseits können wir diese Gleichung als Diagonalisierung von M T auffassen, die gemäß Theorem F.2 eindeutig bestimmt ist. Somit können wir UL = UR∗ schliessen. Setzt man nun U := UR und berücksichtigt (F.3b), ist die Behauptung gezeigt. 21 Beachte, dass U und U nicht eindeutig sind, falls die Eigenwerte von D entartet sind. In diesem Fall L R gibt es Matrizen U , die M † M diagonalisieren, d.h. U † M † M U = D, die jedoch nicht M diagonalisieren. Man kann M natürlich immer noch diagonalisieren, aber die Matrix U , die das bewerkstelligt, kann nicht bestimmt werden, indem man einfach die Eigenvektoren von M † M bestimmt. Jedoch gilt die Aussage des Corrollars immer noch. G DIE TRANSFORMATIONEN P , T UND C G 184 Die Transformationen P , T und C Es geht darum, das Verhalten der Lösungen der Dirac-Gleichung unter den Operationen Raumspiegelung, Zeitumkehr und Ladungskonjugation zu diskutieren. Wir verwenden die ‘Master-Formel’ (vgl. [4, S. 554]) εp + m · 1 + γ5 s Ψ , (G.1) Ψ(ε, p, s) = 2m 2 welche es erlaubt, aus einem Dirac-Spinor mit Impuls p~ auf den Anteil zu positiver (ε = 1) bzw. negativer (ε = −1) Frequenz sowie den Spin zu projizieren. Insbesondere hat man, falls 1 + γ5 s εp +m Ψ(ε, p, s) = · Ψ(ε, p, s) 2m 2 eine Lösung mit Frequenz-Vorzeichen ε und Spinvektor s. Der Spinvektor s besitzt dabei die Eigenschaften s2 = − 1 und p·s = 0; im Ruhesystem ist sRuhesystem = (0, ~s) , wobei ~s den anschaulichen Spin angibt. G.1 Die Paritätstransformation P Die Paritätstransformation P wirkt auf die Koordinaten folgendermaßen: P : xµ = (t, ~x) → (t, −~x) = x′µ . (G.2) Nun wollen wir dem Rechnung tragen, indem wir fordern, dass der Vektor v µ = Ψ γ µ Ψ wie x transformiert. Man kann sehr einfach sehen, dass die Transformation P Ψ(x) = Ψ′ (x′ ) = eiϕ γ0 Ψ(x) | {z } (G.3) =P das Gewünschte liefert, Ψ′ γ µ Ψ′ † −iϕ = Ψ e 0 † 0 µ 0 iϕ (γ ) γ γ γ e Ψ = Ψγ 0 Ψ , −Ψγ i Ψ , falls µ = 0 , falls µ = i . Im Folgenden wählen wir ϕ = 0. Die elektromagnetischen Potentiale transformieren unter P wie xµ , P A0 (x) i P A (x) = = A′0 (x′ ) = A0 (x) , ′i ′ i A (x ) = − A (x) . (G.4a) (G.4b) Wir fassen die Transformationen (G.2)–(G.4) unter dem Symbol P zusammen. Aus der Diracgleichung ∂ ∂ (G.5) γ 0 i 0 − e A0 + γ j i j − e Aj − m Ψ(x) = 0 ∂x ∂x G DIE TRANSFORMATIONEN P , T UND C 185 wird durch Linksmultiplikation mit γ 0 und Durchtauschen der γ-Matrizen ∂ ∂ j 0 i j − e Aj − m γ0 Ψ(x) = 0 . i 0 − e A0 − γ γ ∂x ∂x (G.6) Das entspricht der Diracgleichung nach Paritätstransformation, ∂ ∂ γ 0 i ′0 − e A′0 + γ j i ′j − e A′j − m Ψ′ (x′ ) = 0 . ∂x ∂x (G.7) Die Diracgleichung ist also invariant unter P . Wir untersuchen nun das Verhalten eines Zustands mit ε, p, s, 1 + γ5 s εp +m 0 Ψ P Ψ(ε, p, s) = γ 2m 2 ′ εp + m γ 0 1 + γ5 s Ψ = 2m 2 ′ 1 + γ5 s′ 0 εp +m = γ Ψ |{z} 2m 2 P Q = −e Q = −e p~ ~s ~s ′ = ~s e− =Ψ′ mit e− p~ ′ = −~ p s′ = (−s0 , ~s) . Unter Paritätstransformation ändert der Zustand also lediglich p → p′ , d.h. p~ → −~ p. G.2 Die Zeitumkehrtransformation T Betrachte die Zeitumkehrtransformation im Ortsraum, T : t → t′ = − t , ~x → ~x ′ = ~x (G.8) und die Transformation T im Spinorraum Ψ(x) → Ψ′ (x′ ) = T Ψ(x) = i γ 1 γ 3 Ψ∗ (x) . (G.9) Aus der Elektrodynamik ist bekannt, sich A unter T ändert gemäß T A0 (x) ~ T A(x) = = A′0 (x′ ) = A0 (x) , ~ ′ (x′ ) = − A(x) ~ A , (G.10) (G.11) ~ = ∂t A ~ → E ~ geht. Es ist zu beachten, dass es ein relatives Vorzeichen zwiso dass E schen der Transformation von Aµ und xµ gibt. Faßt man (G.8)–(G.11) in der Zeitumkehrtransforamtion T zusammen, so ist die Diracgleichung invariant unter T , denn aus der Diracgleichung, ∂ ∂ ~ · ~γ − m Ψ(x) = 0 , (G.12) i γ 0 0 + γ j j − e A0 γ 0 − A ∂x ∂x wird unter Verwendung von µ γ , µ 6= 2 , µ ∗ (γ ) = −γ 2 , µ=2, (G.13) G DIE TRANSFORMATIONEN P , T UND C 186 durch komplexe Konjugation n 1 ∂ 2 ∂ 3 ∂ 0 ∂ +γ −γ +γ −i γ ∂x0 ∂x1 ∂x2 ∂x3 o −e A0 γ 0 − (A1 γ 1 − A2 γ 2 + A3 γ 3 ) − m Ψ∗ (x) = 0 . (G.14) Weitere Linksmultiplikation mit i γ 1 γ 3 liefert n ∂ ∂ ∂ ∂ − i γ0 0 − γ1 1 − γ2 2 − γ3 3 ∂x ∂x ∂x ∂x o ~ · ~γ − m i γ 1 γ 3 Ψ∗ (x) = 0 , − e A0 γ 0 + A Somit gilt i γµ ∂ − e A′µ γ µ − m ∂x′µ (G.15) Ψ′ (x′ ) = 0 . (G.16) Damit ist die Diracgleichung invariant unter T . Nun betrachten wir die Wirkung von T auf einen Zustand mit ε, p und s, ∗ εp 1 + γ5s∗ +m T Ψ(ε, p, s) = i γ 1 γ 3 Ψ∗ (x) .Q = −e 2m 2 Wegen 1 3 µ ∗ γ γ (γ ) = γ0γ1γ3 , −γ µ γ 1 γ 3 , Q = −e p~ ~s µ=0 µ = 1, 2, 3 T e− e− folgt T Ψ(ε, p, s) = ′ εp +m 2m p~ ′ = −~ p 1 + γ5s′ 2 Ψ′ (x′ ) ~s ′ = −~s mit p′ = (p0 , −~ p) und s′ = (s0 , −~s) . Unter der Transformation T kehren sich also der räumliche Impuls p~ und der Spin ~s um; dies entspricht der Intution Film rückwärts laufen lassen“. ” G.3 Ladungskonjugation Ist Ψ Lösung der Dirac-Gleichung im äußeren elektromagnetischen Feld, p − eA − m Ψ = 0 , (G.17) so ist ΨC eine Lösung für ein Teilchen der Ladung −e statt e, ( p + e A − m) ΨC = 0 . (G.18) Hierbei ist der ladungskonjugierte Spinor gegeben durch ΨC = C Ψ = i γ 2 Ψ∗ = C γ 0 Ψ∗ wobei die Vorschrift mit C := i γ 2 γ 0 , (G.19) G DIE TRANSFORMATIONEN P , T UND C 187 Bilde das konjugiert Komplexe von Ψ ” und multipliziere mit i γ2“ als Ladungskonjugation bezeichnet wird. Diese Definition bzw. die häufig benutzte Alternative ΨC = i γ 2 γ 0 Ψ T sind in dieser Form nur für bestimmte Darstellungen der Dirac-Algebra verwendbar. Nun benötigen wir die Formeln (γ µ ) † = γ0 γµ γ0 , = γ (γ ) γ , (G.20b) [C, γ5 ] = 0, (G.20c) y (γ ) µ T −1 C (γ ) C = µ T (G.20a) µ ∗ 0 0 µ −γ . (G.20d) Mit der ‘Master-Formel’ (G.1), erhalten wir [Ψ(ε, p, s)] C C γ 0 Ψ∗ (ε, p, s) ∗ εp +m 1 + γ5s ∗ ∗ 0 Ψ (ε, p, s) Cγ 2m 2 T 1 − γ5s T εp +m C ·1· ·1· γ 0 Ψ∗ |{z} |{z} 2m 2 =C−1 C =C−1 C −ε p + m 1 + γ s 5 ΨC . 2m 2 = = (G.20) = = Es wird also eine positive Lösung, d.h. ε = 1, mit p und s in eine negative Lösung, d.h. ε = −1, mit demselben p und s transformiert (bis auf einen Phasenfaktor). Insbesondere vermittelt die Ladungskonjugation zwischen den Basislösungen (vgl. Abschnitt C.2), v (s) (p) u (s) (p) = = C [u(s) (p)]T T C [v (s) (p)] (G.21) T (G.22) Wir führen nun den Operator C der Ladungskonjugation ein durch C (1) Ψ −→ ΨC = i γ 2 Ψ∗ und C (2) Aµ −→ A′µ = − Aµ . Dieser Operator vermittelt zwischen den Gleichungen (G.17) und (G.18), i ∂ − e A − m Ψ = 0 l C ′ − m ΨC = 0 i ∂ − e A bzw. Die Dynamik eines Elektrons im Feld A lC Die Dynamik eines Positrons im Feld A′ C Q = −e Q = +e p~ ~s e− ~s ′ = ~s p~ ′ = ~p e+ G DIE TRANSFORMATIONEN P , T UND C 188 Neben-Bemerkung: Auf den ersten Blick erscheint es etwas merkwürdig, dass die Trnasformationen P und T der Raumzeit im selben Atemzug mit der Ladungskonjugation C diskutiert werden. Man kann das aber durch die Nebenbemerkung auf Seite 14 motivieren. Eichsymmetrien können als Isometrien interner Dimensionen aufgefasst werden; Ladungskonjugation ist dann nichts Anderes als Spiegelung der Koordinaten dieser Dimensionen. G.4 Die kombinierte Transformation P C T Unter P C T geht ein Spinor Ψ über in Ψ(x) → = ΨP CT (x′ ) = γ 0 i γ 2 i γ 1 γ 3 Ψ∗ (x) γ 0 γ 2 γ 1 γ 3 Ψ(x) = i γ5 Ψ(x) ∗ (G.23) oder kurz ΨPCT (x′ ) = i γ5 Ψ(x) , x′ = − x . (G.24) Um das Verhalten von ε, p und s zu bestimmen, betrachten wir εp +m 1 + γ5 s P CT Ψ(x) Ψ(ε, p, s) −−−−→ i γ5 2m 2 −ε p 1 − γ5 s +m ΨPCT (x) = 2m 2 (G.25) Das bedeutet, dass ΨPCT eine Positronwelle beschreibt, wenn Ψ eine Elektronwelle ist, und umgekehrt. Insbesondere ist das Anti-Teilchen zu einem linkshändigen Teilchen rechtshändig. Das Verhalten von ΨΨ (Skalar), Ψγ5 Ψ (Pseudoskalar), Ψγ µ Ψ (Vektor) und Ψγ5 γ µ Ψ (Pseudovektor), Ψσ µν Ψ sowie der partiallen Ableitung unter den Transformationen P , T , C und C P T ist in Tabelle G.1 zusammengefasst. Dabei ist P T C CP T ΨΨ + + + + Ψγ5 Ψ − − + + Ψγ µ Ψ (−)µ (−)µ − − Ψγ5 γ µ Ψ −(−)µ (−)µ + − Ψσ µν Ψ (−)µ (−)ν −(−)µ (−)ν − + ∂µ (−)µ −(−)µ + − Tabelle G.1: Transformation von (Pseudo-)Skalar, (Pseudo-)Vektor, Tensor zweiter Stufe und Ableitung. (−) µ := +1 , −1 , µ=0, µ>0. (G.26) Insbesondere transformieren potentielle Kandidaten für Terme einer relativistisch invarianten Lagrangedichte alle trivial unter C P T . Es lässt sich zeigen, dass jede relativistische lokale Quantenfeldtheorie symmetrisch bzgl. der kombinierten Transformation P C T ist [24]. H DIRAC- UND MAJORANA–MASSEN H H.1 189 Dirac- und Majorana–Massen Weyl–Spinoren Die Spinor–Darstellung der Lorentz–Gruppe L↑+ zerfällt in 1 1 L↑+ = D( 2 ,0) ⊕ D(0, 2 ) , (H.1) durch SL(2, C) und D durch deren (nicht–äquivalente) wobei (per Konvention) D 1 komplex konjugierte Matrizen dargestellt werden können. Es ist üblich, Spinoren aus D( 2 ,0) (0, 12 ) mit kleinen griechischen Buchstaben α, β usw. zu verzieren, wohingegen man für D mit gepunkteten griechischen Indizs α̇, β̇ usw. kennzeichnet. Spinor–Indizes können mit ε gehoben bzw. gesenkt werden, (0, 21 ) ( 21 ,0) ψ α = εαβ ψβ bzw. ε = (εαβ ) = wobei 0 −1 ψα = εαβ ψ β , 1 0 bzw. εT = (εαβ ) = (H.2) 0 −1 1 0 . (H.3) Das Skalarprodukt zweier Spinoren ist symmetrisch, ξ · η := ξ α εαβ η β = ξ α ηα = − ξα η α = η · ξ , (H.4) wobei wir verwendet haben, dass Spinoren durch a–Zahlen beschrieben werden. Das “Quadrat” eines Spinors ist erklärt durch ψ 2 = ψ · ψ. H.2 Dirac–Spinoren Zwei Weyl–Spinoren ξ und η können kombiniert werden zu einem Dirac–Spinor ξ ξα Ψ := . = η̄ α̇ η̄ (H.5) Hier und im Folgenden arbeiten wir in der Weyl–Basis, in der γ5 diagonal ist, d.h. −12 0 0 σµ µ γ5 = . (H.6) 12 , γ = 0 σ̄ µ 0 Üblicherweise sind die Rechenregelen für Dirac–Spinoren formuliert. Aus Weyl–Spinoren kann man immer Dirac–Spinoren machen, in dem man die üblichen Projektoren PL/R = (1 ∓ γ5 )/2 verwendet. Beispielsweise das u–Quark wird beschrieben durch uα 0 . (H.7) Ψu = , u = P Ψ = R R u (ūC )α̇ (ūC )α̇ Für die anderen Fermionen des Standardmodelles folgt man analogen Konventionen. Dirac–Massenterm. Spinoren, Der Dirac–Massenterm m Ψ Ψ verbindet zwei verschiedene Weyl– m Ψ Ψ = m Ψ† γ0 Ψ = m (ξ¯ · η̄ + η · ξ) . (H.8) H DIRAC- UND MAJORANA–MASSEN H.3 190 Majorana–Spinoren und Massen Das Ladungskonjugierte eines Dirac–Spinor ist erklärt durch εαβ 0 T ηα C wobei C = = CΨ Ψ = ξ¯α̇ 0 εα̇β̇ (H.9) in der Weyl–Basis. Spinoren, die ΨC = Ψ (H.10) erfüllen, heissen Majorana–Spinoren. Die Majorana–Bedingung (H.10) impliziert ξα C ξ = η und Ψ = . (H.11) ξ¯α̇ Durch (H.10) werden die Majorana–Spinoren mit ihrem Ladungskonjugierten gleichgesetzt und sind somit gewissermassen mit ihren Anti-Teilchen identifiziert. M.a.W., durch Majorana-Spinoren beschriebene Freiheitsgrade sind ihre eigenen Anti-Teilchen. Majorana–Massenterm. Für den Majorana–Massenterm erhalten wir 1 1 1 M Ψ Ψ = M Ψ ΨC = M ξ¯ · ξ¯ + ξ · ξ . 2 2 2 (H.12) Insbesondere verbindet eine Majorana–Massenterm einen Weylspinor mit sich selbst. I SUPERSYMMETRIE–THEOREME I 191 Supersymmetrie–Theoreme Ziel der Dikussion ist, zu zeigen, dass – unter relativ schwachen Voraussetzungen – jegliche Symmetrie, die mit der Poincaré–Symmetrie vertauscht, nicht bosonisch sein kann, d.h. wenn es sie gibt, muss sie fermionisch sein. Es stellt sich weiter heraus, dass eine solche Symmetrie existiert und praktisch eindeutig ist. I.1 Das Coleman-Mandula-Theorem Wir wollen uns nun eine Symmetrie konstruieren, welche verträglich ist mit der Poincaré– Gruppe. Konkret geht es darum, eine Algebra zu finden, welche die Poincaré–Algebra als Unteralgebra beinhaltet. Das folgende Theorem schränkt eine solche Symmetrie ein: Theorem von Coleman und Mandula. den folgenden Annahmen genügt Betrachte eine relativistische Feldtheorie, die (1) Zu jeder Masse M existiert nur eine endliche Anzahl an Spezies mit Masse kleiner als M . (2) Jeder Zwei–Teilchen–Zustand unterzieht sich für fast alle Energien, d.h. alle bis auf endlich viele, einer Reaktion. (3) Die Amplituden der elastischen Zwei–Körper–Streuung sind analytische Funktionen der Streuwinkel für fast alle Energien und Winkel. Dann ist jede bosonische Symmetrie der S–Matrix das direkte Produkt aus Poincaré– Gruppe und einer internen Symmetrie. Folgerung: Die Generatoren einer echten Erweiterung der Poincaré-Gruppe müssen fermionisch sein. I.2 Haag-Sohnius-Lopuszański-Theorem Man kann also nur durch Einführung fermionischer Generatoren die Poincaré-Gruppe echt erweitern. Haag-Sohnius-Lopuszański-Theorem. Sei H ein Hilbert-Raum mit positiv definiter ” Metrik“, d.h. 2 o E D n 2 (I.1a) . . . G, G† . . . = |G |. . .i| + G† |. . .i > 0 für jeden Generator G 6= 0. Des Weiteren sei die Energie positiv, d.h. P 0 |E, . . .i = E |E, . . .i ⇒ E>0. Dann ist die maximale Erweiterung der Poincaré-Algebra gegeben durch (I.1b) I SUPERSYMMETRIE–THEOREME [P µ , P ν ] [M µν , P ρ ] = = [M µν , M ρσ ] [B r , B r ] = = [B r , P µ ] i Qα , P µ M µν , Qiα M µν , Q̄α̇ i i Qα , B j i Q̄α̇ , B j n o Qiα , Q̄jβ̇ Qiα , Qjβ n o Q̄iα̇ , Q̄jβ̇ = = [Z ij , ∗] = = = 192 0, i (ηνρ P µ − ηµρ P ν ) , (I.2a) (I.2b) −i (ηµρ M νσ − ηνσ M νρ − ηνρ M µσ + ηνσ M µρ ) , i ctrs B t , (I.2c) (I.2d) [B r , M µν ] = 0 , i Q̄α̇ , P µ = 0 , (I.2e) (I.2f) − 12 (σµν )α β Qiβ , (I.2g) − 21 (σ̄µν )α̇ β̇ Q̄β̇i , (I.2h) (bj )ℓ k Qkα , = −(bj )ℓ = ij 2δ k Q̄ℓα̇ σαµβ̇ (I.2i) , (I.2j) Pµ , = 2εαβ Z ij = −2 εα̇β̇ Z ij = 0. mit Z ij = (I.2k) arij B r , (I.2l) mit Z ij = Z †ij , (I.2m) (I.2n) Bemerkungen: (1) Die ersten drei Relationen, (I.2a)–(I.2a) sind gerade die der Poincaré–Algebra. (2) Die Generatoren Qα bzw. Q̄α̇ (1 ≤ i ≤ N ) sind fermionisch und die B r bosonisch. (3) Die sog. zentralen Ladungen Z ij sind gemäß (I.2l) antisymmetrisch in i und j, für N = 1 müssen sie verschwinden. Sie kommutieren mit allen anderen Generatoren der Algebra, entsprechend liegen die von ihnen generierten Gruppenelmente im Zentrum der erweiterten Poincaré-Gruppe. Dies erklärt den Namen zentrale Ladung“. ” (4) Man kann zeigen, dass die Renormierbarkeit N ≤ 4 erzwingt. Für eine renormierbare Theorie mit massebehafteten Freiheitsgraden muß man sogar N ≤ 1 fordern. Des Weiteren kann man nur für N ≤ 8 konsistente Supergravitationstheorien formulieren. (5) Aus phänomenologischer Sicht ist der N = 1 Fall besonders relevant, da nur dieser chirale Theorien zuläßt. Hier kann man die Indizes i und j von den Generatoren Qα bzw. Q†α̇ entfernen und erhält (abgesehen von (I.2a)–(I.2c) und (I.2f)) n o Qα , Q̄β̇ Qα , Q β = = 2 σαµβ̇ P µ , n o Q̄α̇ , Q̄β̇ = 0. (I.3a) (I.3b)