Inhaltsverzeichnis 1 Grundlagen 1.1 Literatur . . . . . . . . . . . . . . . . . . . . . . 1.2 Historie und Überblick . . . . . . . . . . . . . . 1.3 Einheiten . . . . . . . . . . . . . . . . . . . . . 1.4 Spezielle Relativitätstheorie . . . . . . . . . . . 1.4.1 Lorentzskalare bzw. Lorentzinvariante . 1.4.2 Warum SRT? Längenskalenabschätzung 1.5 Streuung . . . . . . . . . . . . . . . . . . . . . . 1.5.1 Wirkungsquerschnitt . . . . . . . . . . . 1.5.2 Rutherford-Streuung . . . . . . . . . . . 1.5.3 Mott-Streuung bzw. Dirac-Streuung . . 1.5.4 Rosenbluth-Streuung . . . . . . . . . . . 1.5.5 Inelastische Streuung . . . . . . . . . . . 1.6 Zerfallsraten (Sehr stark an Berger angelehnt.) 1.7 Die goldene Regel . . . . . . . . . . . . . . . . . 1.8 Feynmandiagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 3 4 5 6 8 8 9 9 10 11 13 15 19 2 Teilchenbeschleuniger 2.1 Luminosität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Linearbeschleuniger/ Van de Graaff Beschleuniger . . . . . . . . . 2.2.1 Van de Graaff Beschleuniger . . . . . . . . . . . . . . . . . 2.2.2 Driftröhrenlinearbeschleuniger und “Travelling wave linacs” 2.3 Zyklotron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Synchrotron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Synchrotronstrahlung bzw. Leistungsverlust . . . . . . . . . 2.4.2 Fokussierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 23 24 25 25 30 31 33 37 3 Detektoren 3.1 Wechselwirkung von Strahlung in Materie 3.2 Detektortypen . . . . . . . . . . . . . . . 3.2.1 Blasenkammer . . . . . . . . . . . 3.2.2 Pixeldetektoren und Spurkammern 3.2.3 Kalorimeter . . . . . . . . . . . . . . . . . . . . . . . 4 Kernphysik 4.1 Äußere Kerneigenschaften . . . . . . . . . . . 4.1.1 Ladung . . . . . . . . . . . . . . . . . 4.1.2 Masse . . . . . . . . . . . . . . . . . . 4.1.3 Größe . . . . . . . . . . . . . . . . . . 4.1.4 Ladungsverteilung . . . . . . . . . . . 4.1.5 Spin . . . . . . . . . . . . . . . . . . . 4.2 Kernmodelle . . . . . . . . . . . . . . . . . . . 4.2.1 Tröpfchenmodell . . . . . . . . . . . . 4.2.2 Fermi-Gas Modell bzw. Thomas-Fermi 4.2.3 Schalenmodell . . . . . . . . . . . . . 4.2.4 Kollektivmodelle . . . . . . . . . . . . 4.3 Kernreaktionen . . . . . . . . . . . . . . . . . 4.3.1 β-Zerfall . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 47 54 55 55 57 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 60 60 62 64 65 70 70 73 81 86 88 89 . . . . . . . . . . . . . . . . . . . . 4.4 4.3.2 α-Zerfall . . . . . . . . . . . . . . . 4.3.3 Kernspaltung . . . . . . . . . . . . 4.3.4 Kernfusion . . . . . . . . . . . . . 4.3.5 Künstliche Kernfusion . . . . . . . 4.3.6 Stellare Kernfusion . . . . . . . . . Radioaktive Strahlung und Strahlenschutz 4.4.1 Strahlenschäden . . . . . . . . . . 4.4.2 Abschirmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Teilchenphysik 5.1 Standardmodell der Elementarteilchen . . . . . . . . . . . . . . . . . . . 5.1.1 Teilcheninhalt des SM . . . . . . . . . . . . . . . . . . . . . . . . 5.1.2 Wechselwirkungen (QED,QCD, schwache WW) . . . . . . . . . . 5.1.3 Gell-Manns-Eigfold Way . . . . . . . . . . . . . . . . . . . . . . . 5.1.4 Inelastische Streuung, Hadronisierung und Konstituentenmodell 5.1.5 Teilcheneigenschaften . . . . . . . . . . . . . . . . . . . . . . . . 5.1.6 Diskrete Symmetrien . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.7 Händigkeit bzw. Chiralität und Helizität . . . . . . . . . . . . . . 5.1.8 CP -Invarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Schwache Wechselwirkung und CKM-Matrix . . . . . . . . . . . . . . . 5.2.1 Phänomenologie der CKM-Matrix . . . . . . . . . . . . . . . . . 5.2.2 Neutrale Eichbosonen und elektroschwache Vereinheitlichung . . 5.3 Higgs-Mechanismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Grenzen des Standardmodells bzw. Physik jenseits des Standardmodells 5.4.1 CP-Verletzung im B-System? . . . . . . . . . . . . . . . . . . . . 5.4.2 Anomales magnetisches Moment des Muons? . . . . . . . . . . . 5.4.3 SUSY? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Einheitensysteme 1 . 90 . 93 . 95 . 96 . 99 . 102 . 103 . 106 . . . . . . . . . . . . . . . . . 107 107 108 109 113 122 127 128 131 133 141 144 145 146 146 146 146 146 146 Grundlagen Es ist geplant zu Beginn jedes Kapitels eine Box einzufügen, in der die wichtigsten Inhalte in Schlagworten und kurzen Stichpunkten angegeben werden: Natürliche Einheiten: ~ = 1, c = 1, Energie in eV SRT: Lorentztransformationen, Lorentzinvariante Streuung: Wirkungsquerschnitt 1.1 Literatur Bethge, Walter, Wiedemann Kernphysik“, Springer Verlag ” Mayer-Kuckuk Kernphysik“, Vieweg und Teubner ” Frauenfelder, Henley “Teilchen und Kerne: Die Welt der subatomaren Physik”, Oldenbourg Povh, Rith, Scholz, Zetsche, Teilchen und Kerne“, Springer-Verlag ” Berger, Elementarteilchenphysik“, Springer Verlag ” 2 Griffiths, Introduction to Elementary Particles“, Wiley VCH ” http://www.e18.physik.tu-muenchen.de/skript/ http://www.physi.uni-heidelberg.de/∼stachel/skript.pdf Weitere Bücher nach gusto der Studenten. 1.2 Historie und Überblick Der Beginn der Kernphysik läßt sich etwa in den Jahren 1895, 1896 verorten in denen Wilhelm Conrad Röntgen die Röntgenstrahlung und Antoine Henri Becquerel die Radioaktivität entdeckten. (Nobelpreise jeweils Im Jahr 1901 byw. 1903.) Bereits 1897 wurde durch Joseph John Thomson das erste Elementarteilchen das Elektron entdeckt. (Nobelpreis 1906) Für eine ausführlichere historische Übersicht siehe z.B. Bethge, Walter, Wiedemann Kernphysik“. In der Vorlesung wird ein notgedrungen recht oberflächlicher ” Überblick über 27 Größenordnungen gegeben. −18 Von 10 m, den Leptonen und Quarks und ihren Wechselwirkungen (QED,QCD, schwache WW), bis zur Kernfusion in Sternen ∼ 109 m. Dies jedoch aus dem Blickwinkel der subatomaren Physik. Die langreichweitige Gravitation, die für die Strukturbildung im Universum verantwortlich ist, wird ebenso ausgeklammert, wie viele durch die Eigenschaften der Atomhülle bestimmte chemische Eigenschaften. (Siehe z.B. Struktur der Materie I) 1.3 Einheiten Energien in der subatomaren Physik werden üblicherweise in eV (Elektronenvolt angegeben. Ein Elektronvolt entspricht der Energie, die ein Elektron gewinnt, wenn es durch eine Potentialdifferenz von einem Volt beschleunigt wird: 1eV = = = ∼ 1.602176487(40) · 10−19 C · V 1.602176487(40) · 10−19 A · s · V = 1.602176487(40) · 10−19 W · s 1.602176487(40) · 10−19 J 1.60 · 10−19 J Das Plancksche Wirkungsquantum ~ = ~ = = h 2π lautet in eV : 1.054571628(53) · 10−34 J · s 6.58211899(16) · 10−16 eV · s In der Elementarteilchenphysik werden wir aus zumeist die üblichen natürlichen“ Ein” heiten mit ~ = 1, c = 1 verwenden, um die Nomenklatur zu vereinfachen. (Impulse werden dann in eV , Längen in eV −1 angegeben.) Die Lichtgeschwindigkeit im Vakuum wird im SI System mit m c = 299792458 s angegeben. 3 1.4 Spezielle Relativitätstheorie Zunächst ein wenig Notation und ein paar Definitionen (Verschiedene Skripte finden sich unter http://www.relativity.li/de/links/relativitaetstheorie/): griechische Buchstaben als Indizes nehmen die Werte µ = 0, . . . 3 an, lateinische die Werte i = 1, . . . , 3. es wird die einsteinsche Summenkonvention verwendet, d.h. über doppelt vorkommende Indizes wird summiert: xµ xµ = 3 X xµ xµ , xi xi = µ=0 3 X xi xi . i=1 für die Nullkomponente des Ortsvektors wird üblicherweise x0 = c t, für die Nullkomponente des Impulsvektors p0 = Ec geschrieben. es wird zwischen ko- und kontravarianten Vektoren unterschieden: xµ = (x0 , ~x), xµ = (x0 , −x1 , −x2 , −x3 ) = (x0 , −~x) mit den Transformationseigenschaften: a′µ = Λµν aν , a′µ = Λµν aν . die Metrik gµν lautet: gµν = g µν 1 0 = 0 0 0 0 −1 0 0 −1 0 0 0 0 . 0 −1 Damit ergibt sich für das Skalarprodukt zweier Vierervektoren: gµν xµ y ν = xµ yµ = x0 y0 − ~x · ~y . ein Lorentztensortensor ist ein indiziertes Objekt, von dem sich jeder Index wie der Ortsvektor transformiert: T ′µν = Λµα Λνβ T αβ . Der Übergang zwischen zwei Inertialsystemen wird durch die Lorentztransformation: v1 v2 v3 γ −γ −γ −γ c c c −γ v1 c , Λ(~v ) = vi vj (γ − 1) v2 −γ δij + 2 c v v3 −γ c 4 mit γ=q 1 1− und β = v2 c2 v c beschrieben. Die Lorentztransformationen lassen das Quadrat des Wegelementes ds invariant ! ds′2 = gαβ dx′α dx′β = gαβ Λαγ Λβδ dxγ dxδ = ds2 = gγδ dxγ dxδ und erfüllen daher Λαγ Λβδ gαβ = gγδ , oder ΛT gΛ = g Im Spezialfall, daß ~v parallel zu einer der Achsen des Inertialsystems I liegt, reduziert sich die Lorentztransformation auf: v ′ γ −γ ct ct c = v x′ x −γ γ c und damit zu x − vt x′ = q , 2 1 − vc2 y ′ = y, z ′ = z, ct − x vc ct′ = q 2 1 − vc2 Es folgen die bekannten Phänomene der Längenkontraktion und Zeitdilatation, die sich als sehr wichtig bei der Bestimmung der mittleren zurückgelegten Weglänge von instabilen Teilchen herausstellen werden. (Die Notation in Einheiten mit c = 1 ergibt sich trivial.) Beispiel: Mittlere Lebenszeit des Myons Der Zerfall von Myonen wird durch N (t) = N (0) · e−t/τ beschrieben, wobei N (t) die Anzahl der Myonen zur Zeit t bezeichnet. Die mittlere Lebensdauer eines Myons in Ruhe beträgt τ ∼ 2, 2 · 10−6 s = 2, 2 µs (Genauer: τ = 2, 19703(4) µs). Via Zeitdilatation ergibt sich im Laborsystem τLab τLab τ = γτ = γ = E mc2 und eine Energie von E ∼ 10 GeV , Setzt man die Masse des Myons mµ = 105, 7 MceV 2 nicht ungewöhnlich für kosmische Strahlung, dann ergibt sich eine um den Faktor 10 längere Lebensdauer. (Hochrelativistische Myonen erreichen dann auch in relativ großer Zahl die Erdoberfläche, mit einer Flußdichte ∼ 0, 01 cm−1 s−1 , obwohl ihre Reichweite klassisch nur etwa 600 m betrüge.) 1.4.1 Lorentzskalare bzw. Lorentzinvariante Besondere Bedeutung in der experimentellen Betrachtung kommt sogenannten Lorentzskalaren bzw. Lorentzinvarianten zu. Jedes Skalarprodukt zweier Vierervektoren ist Lorentzinvariant. Aus der Energie-Impulsrelation pµ pµ = p2 = E2 − p~2 = m2 c2 c2 5 ergibt sich, daß die Masse eines Teilchens ein Lorentzskalar ist und der Viererimpuls wird als E pµ = , p~ c geschrieben. Fürderhin läßt sich die invariante Masse eines Mehrteilchensystems definieren !2 !2 X Xq 2 4 2 2 4 2 mi c + p~i c − p~i c , minvariant c = i i die in Streuexperimenten nicht nur die möglichen Reaktionen einschränkt sondern in der Analyse auch zur Rekonstruktion von Zwischenzuständen benutzt wird. Beispiel: Lorentzinvariante in der 2 nach 2 Streuung Wieviele Lorentzinvariante beschreiben einen Prozeß, in welchem 2 Teilchen mit Viererimpulsen k1 , k2 in zwei Teilchen mit Viererimpulsen p1 , p2 übergehen? Zunächst gilt Viererimpulserhaltun, also Energie- und Impulserhaltung, k1 + k2 = p1 + p2 . Sind die Massen der Teilchen bekannt, dann liefern k12 = m21 , k22 = m22 , p21 = m23 und p22 = m24 keine Informationen über den Streuprozeß. Es lassen sich jedoch sechs Skalarprodukte konstruieren: k 1 · k 2 , k 1 · p1 , k 1 · p2 , k 2 · p1 , k 2 · p2 , p1 · p2 . Via Impulserhaltung lassen sich diese auf nur zwei unabhängige zurückführen. Üblicherweise werden hierfür die Mandelstam-Variablen, nach Stanley Mandelstam, s = (k1 + k2 )2 = (p1 + p2 )2 , t = (k1 − p1 )2 = (k2 − p2 )2 , u = (k1 − p2 )2 = (k2 − p3 )2 verwendet, wobei diese nicht unabhängig sind. Es gilt s + t + u = k12 + k22 + p21 + p22 = 4 X m2i i=1 und daher kann immer eine dieser Variablen durch die anderen beiden ersetzt werden. 1.4.2 Warum SRT? Längenskalenabschätzung Wir benutzen die Heisenbergsche Unschärferelation ∆px ∆x ≥ ~ für die Abschätzung ∆px ∆x ≈ ~ (~c = 197, 33 M eV f m ≈ 200 M eV f m) und betrachten ein Elektronstreuexperiment an einem Kern. p~′ p~ Θ ∆px ∆x Wir nehmen das Quadrat des Viererimpulsübertrages, der Differenz der ein- und auslaufenden Impulse, q µ = pµ − p′µ : q2 = (E − E ′ )2 − (~ p − p~′ )2 . c2 6 Angenommen die Rückstoßenergie auf den Kern ist sehr klein, dann gilt E = E ′ , |~ p| = |~ p′ | und q 2 = −2~ p2 (1 − cos Θ). Für nicht zu große Winkel (Θ < 30 ) entwickeln wir den Cosinus in eine Reihe und brechen nach den ersten zwei Gliedern ab. Dies führt zu der Näherung p −q 2 ≈ |~ p|Θ ≈ ∆px und damit zu einer Abschätzung für die Ortsauflösung ∆x ∆x ≈ p ~ −q 2 . Vernachlässigt man den Unterschied zwischen longitudinaler und transversaler Auflösung, d.h. ∆R ∼ ∆x, schätzt den maximalen Impulsübertrag mit |q 2 |max ≈ p~2 (Eigentlich |q 2 |max ≤ 4~ p2 ) und nutzt die Hochenergienäherung, d.h. alle Massen werden vernachlässigt, dann gilt |~ p| = Ec und somit E ≈ ~c R . Auf diese Weise lassen sich folgende ungefähren Energien zum Auflösen verschiedener Strukturen angeben: R Kerne Nukleonen Quarks im Nukleon Quarks −14 E 10 m −15 10 m < 10−16 m 20 M eV 200 M eV > 2 GeV < 10−18 m > 200 GeV Vergleicht man die angegebenen Energien z.B. mit der Ruhemasse des Elektrons me = 0, 510998910(13) M eV ergibt sich, daß in der subatomaren Physik grundsätzlich relativistisch gerechnet werden muß (und daß obige Hochenergienäherung für Elektronen mit E ≈ 20 M eV gerechtfertigt ist. Für Protonen mit mp = 938, 272013(23) M eV ließe sich der erste Fall noch nichtrelativistisch rechnen.). Führt man den Blick weiter zu modernen Beschleunigerexperimenten, so werden dort Teilchen auf Energien beschleunigt, denengegenüber die Ruheenergie zu vernachlässigen ist. (Hochrelativistischer Grenzfall.) Beispiele sind E = 104 GeV im LEP 2 Experiment für Elektronen (2000 abgeschaltet), E = 980 GeV am Tevatron (Run 2, abgeschaltet am 30.09.2011) für Protonen und Antiprotonen, 27, 5 GeV für Elektronen und 920 GeV für Protonen am Hera-Ring (2007 abgeschaltet.) und 4 T eV für Protonen am LHC. (Geplante Höchstenergie des LHC: 7 T eV pro Teilchenstrahl.) (Siehe auch Wikipedia-Liste für Beschleuniger.) Beschleuniger LEP (Run 2) KEKB Hera Tevatron (Run 2) LHC Beschleunigte Teilchen Elektronen/Positronen Elektronen/Positronen Elektronen/Protonen Protonen/Antiprotonen Protonen/Protonen Strahlenergie 104 GeV 8.0 GeV 3.5 GeV 27.5 GeV 920 GeV 980 GeV 4 TeV Tabelle 1: Einige ausgewählte Beschleuniger 7 1.5 Streuung Streuexperimente sind die überwiegende Quelle von Information in der Kern- und Teilchenphysik. Wirkungsquerschnitte und Zerfallsraten werden von Theoretikern berechnet bzw. vorhergesagt, um mit den experimentellen Ergebnissen verglichen zu werden. Hier ergibt sich die Schnittstelle zwischen theoretischer und experimenteller Physik. 1.5.1 Wirkungsquerschnitt Wir definieren zunächst den geometrischen Reaktionsquerschnitt für nicht überlappende Streuzentren als die einem Teilchenstrahl effektiv dargebrachte Fläche. Dann kann dieser geschrieben werden, als Reaktionsrate Ṅ über dem Teilchenfluß Φa und der Anzahl der Streuzentren nst : σgeom = = Ṅ Φa · nst Zahl der Reaktionen pro Zeiteinheit . Zahl der Strahlteilchen pro Zeiteinheit pro Fläche × Zahl der Streuzentren Dieser stellt eine erste Näherung für den nun zu definierenden Wirkungsquerschnitt dar, dessen Herleitung vollkommen analog geschieht, dessen Interpretation jedoch durch mögliche Wechselwirkungs-und Energieabhängigkeit nicht mehr trivial einer effektiven Fläche entspricht. Der differentielle Wirkungsquerschnitt ist definiert als dσ dΩ = = Anzahl gestreuter Teilchen pro Zeit und pro dΩ Anzahl einfallender Teilchen pro Zeit und Fläche ∆N (θ) jdΩ∆t (dΩ: Raumwinkelelement.) Trivial verallgemeinert auf mehr als ein Streuzentrum (unter der Annahme der Einfachstreuung, siehe z.B. Hemmert-Skript.) dσ dN = , dΩ dΩn0 F wobei F der Fluß der einlaufenden Teilchen j und n0 die Anzahl der unabhängigen Streuzentren ist. Der totale Wirkungsquerschnitt ergibt sich als Integration über den gesamten Raumwinkel Z dσ dΩ, σtot = dΩ die Anzahl der gestreuten Teilchen ebenfalls durch Integration zu: Ns = n0 F σtot . Auf diesem Wege ließe sich der totale Wirkungsquerschnitt, der die Dimension einer Fläche hat, unter der Annahme der Abwesenheit von Mehrfachstreuung geometrisch als die vom einfallenden Teilchenstrahl effektiv gesehene Querschnittsfläche eines Streuzentrums interpretieren. Die Herleitung dieser Interpretation nutzt die Zahl der einlaufenden Teilchen Nin = F a und bildet das Verhältnis aus einlaufenden und gestreuten Teilchen: Ns n0 σtot = . Nin a 8 Hieraus wird obige Aussage ersichtlich. Allerdings ist der Wirkungsquerschnitt, wie oben erwähnt, keine rein vom Ziel abhängige Größe. Sie hängt desweiteren von der Art der einlaufenden Teilchen, da verschiedene Wechselwirkungen eine Rolle spielen können, und von deren Energie ab und kann daher nicht mehr einfach als effektiv sichtbare Fläche der Streuzentren interpretiert werden. Die übliche Maßeinheit für den Wirkungsquerschnitt ist 1 barn = 10−24 cm2 Im natürlichen System werden Flächen als eV −2 angegeben. Zur Umrechnung und gleichzeitigen Verständnis der involvierten Größenordnungen ist folgende Beziehung nützlich: 1 ≈ 0.3894 mbarn GeV 2 Beispiele für einige einfache elastische Streuquerschnitte: 1.5.2 Rutherford-Streuung Der Rutherford-Querschnitt (hier nichtrelativistisch.) beschreibt die Streuung zweier punktförmiger spinloser Teilchen dσ = dΩ Z1 Z2 ~cα 4Ekin 2 1 , sin4 θ2 2 mit α = 4πǫe0 ~c . Die Herleitung wurde bereits in der theoretischen Mechanik und vermutlich auch der theoretischen Quantenmechanik vorgenommen. Quantenmechanisch ist der Rutherfordstreuquerschnitt allerdings nur in erster (bornscher) Näherung korrekt, d.h. es existieren Korrekturen ∼ ~ und auch relativistische Korrekturen. Aus der Annahme eines 1r -Potentials und Vernachlässigung der Wechselwirkung der αTeilchen mit der Elektronenhülle konnte Rutherford die Winkelverteilung der gestreuten α-Teilchen vorhersagen und experimentell verifizieren. Damit wurde bestätigt, daß ich innerhalb des Atoms ein sehr kleiner positiv geladener Atomkern befindet. Anmerkung: Der Rutherford-Wirkungsquerschnitt divergiert für θ → 0. Dies ist eine Folge der unendlichen Reichweite des Coulomb-Potentials (bzw. eines 1r -Potentiales). Im Rutherfordschen Streuexperiment wird die Ladung der Goldatome durch die Elektronenhülle abgeschirmt, wodurch sich eine endliche Reichweite und demnach ein endliches Resultat ergibt. 1.5.3 Mott-Streuung bzw. Dirac-Streuung Der Dirac-(Mott-)Querschnitt beschreibt die Streuung zweier punktförmiger Spin 21 Teilchen, wobei über die Spins im Endzustand summiert, über die im Anfangszustand gemittelt wird: α2 1 + cos4 θ2 dσ = dΩ 8E 2 sin4 θ2 9 Häufiger findet man unter der Bezeichnung Mott-Querschnitt, den Wirkungsquerschnitt für die Streuung eines punktförmigen Spin 12 -Teilchens an einem punktförmigen spinlosem Teilchen. Dieser lautet: dσ dσ 2 Θ 2 , · 1 − β sin = dΩ dΩ Ruth 2 wobei β = vc ist. Um Effekte, die durch die Ausdehnung von z.B. Nukleonen, hervorgerufen werden, werden die sogenannten Formfaktoren eingeführt. Dies führt zum Rosenbluth-Querschnitt. Herleitung des Dirac-Querschnittes Die grundlegende Formel zur Berechnung des 2 → 2 elastischen Streuquerschnittes spinloser Teilchen lautet 1 dσ el = |Tf i |2 , dΩ 64π 2 s wobei |Tf i | die Streuamplitude und s die Mandelstamvariable für die Schwerpunktsenergie s = (p + k)2 sind. Bei Berücksichtigung des Spins muß |Tf i |2 über die einlaufenden Spins gemittelt und wenn die auslaufenden Spins nicht gemessen werden, über diese summiert werden. X s2 + u2 |Tf i |2 = 2e4 t2 Hier sind s, t, u die Mandelstammvariablen, für welche bei masselosen Teilchen s = t = u = (p + k)2 = 4E 2 (p − p′ )2 = −2E 2 (1 − cos θ) (p − k ′ )2 = −2E 2 (1 + cos θ) und s + t + u = 0 gilt. Dies und (1 − cos θ) = 2 sin2 θ , 2 (1 + cos θ) = 2 cos2 θ 2 eingesetzt liefert den Dirac- bzw. Mott-Querschnitt. (Nomenklatur nicht eindeutig.) 1.5.4 Rosenbluth-Streuung Die Rosenbluth-Formel für die Streuung an Nukleonen 2 2 Ge (Q ) + τ G2m (Q2 ) θ dσ dσ 2 2 2 = + 2τ Gm (Q ) tan dΩ dΩ M ott 1+τ 2 mit den elektrischen bzw. magnetischem Formfaktor Ge , Gm , dem Impulsübertrag Q2 = 2 −q 2 und der Wahrscheinlichkeit eines Spinflips τ = 4MQ2 c2 wird hier nur kurz angeführt und soll verdeutlichen, wie aus dem experimentell bestimmten Wirkungsquerschnitt auf die Struktur des Nukleons geschlossen werden kann. (Die Formfaktoren lassen sich als Fouriertransformierte der Ladungsverteilung bzw. des magnetischen Momentes interpretieren.) Die Vorhersage von Nukleonformfaktoren (über Gitter-QCD oder Lichtkegelsummenregeln) stellt auch ein Thema der hiesigen Teilchenphysikgruppe dar. Siehe z.B. 10 Nucleon Form Factors in QCD. V.M. Braun, A. Lenz, M. Wittmann, (Regensburg U.) . Apr 2006. 30pp. Published in Phys.Rev.D73:094019,2006. e-Print: hep-ph/0604050 Light cone sum rules for the nucleon form-factors. Vladimir M. Braun, A. Lenz, N. Mahnke, (Regensburg U.) , E. Stein, (Regensburg U. and Maharishi U., England) . Dec 2001. 23pp. Published in Phys.Rev.D65:074011,2002. e-Print: hep-ph/0112085 The Nucleon Distribution Amplitudes and their application to nucleon form factors and the N —> Delta transition at intermediate values of Q**2. Alexander Lenz, Meinulf Gockeler, Thomas Kaltenbrunner, Nikolaus Warkentin, (Regensburg U.) . Mar 2009. (Published Mar 2009). 39pp. Published in Phys.Rev.D79:093007,2009. e-Print: arXiv:0903.1723 [hep-ph] Nucleon Form Factors to Next-to-Leading Order with Light-Cone Sum Rules. K. Passek-Kumericki, (Regensburg U. and Boskovic Inst., Zagreb) , G. Peters, (Regensburg U.) . May 2008. (Published May 2008). 68pp. Published in Phys.Rev.D78:033009,2008. e-Print: arXiv:0805.1758 [hep-ph] Nucleon Form Factors and Distribution Amplitudes in QCD I.V. Anikin, V.M. Braun, N. Offen. Oct 4, 2013. 27 pp. e-Print: arXiv:1310.1375 [hep-ph] 1.5.5 Inelastische Streuung Zum Abschluß soll noch ein Blick auf inelastische Wirkungsquerschnitte geworfen werden. Zunächst ein einfaches Beispiel für einen inelastischen Streuprozess: Wir betrachten die π − + p −→ π 0 + n-Streuung. Der gesamte Wirkungsquerschnitt läßt sich dann als Summe des elastischen (für π − + p −→ π − + p) und des inelastischen Wirkungsquerschnittes schreiben. σ = σ el + σ inel Alternativ zu oben läßt sich der Wirkungsquerschnitt über die Abnahme der Teilchen, die ein Ziel durchdringen, beschreiben. Angenommen, die Zahl der einfallenden Teilchen Nin würde über einen Zähler Z1 die der auslaufenden Teilchen in z-Richtung über einen Zähler Z2 gemessen. Dann ergäbe sich für die Abnahme dN der in z-Richtung laufenden Teilchen: (Die Dicke des Targets sei zum Beispiel ∆z) dN = −N (z)n0 σdz. 11 Detektor Durch Integration ergibt sich, daß der totale Wirkungsquerschnitt die Abschwächung des Strahls einlaufender Teilchen in z-Richtung beschreibt. θ z Z1 Target Z2 Nout = Nin e−n0 σ∆z Nach der Streulänge n10 σ ist die Intensität des auslaufenden Strahls auf 1e gefallen. Die Zahl der in ein Raumwinkelelement gestreuten Pionen ergibt sich dann analog zu oben zu: dNf dσ = Nin n0 ∆z . dΩ dΩ Idealerweise ließe sich durch messen der auslaufenden π − , π 0 der inelastische und elastische Wirkungsquerschnitt bestimmen. Allgemeiner läßt sich bei hohen Energien, wenn die Produktion zusätzlicher Teilchen im Endzustand möglich wird, durch Messen der auslaufenden Pionen in ein Raumwinkelelement der differentielle Wirkungsquerschnitt der inklusiven Reaktion π − + p −→ π − + X bestimmen. X beinhaltet hier alle möglichen Endzustände, die nicht durch Erhaltungssätze, zum Beispiel Ladungserhaltung, verboten sind. Für einen kurzen Einblick in die Schwierigkeiten der Experimentalphysik wird auf die Definition der Luminosität, die im zweiten Kapitel noch ausführlicher behandelt wird vorgegriffen. Lint = Nin n0 ∆z wird als integrierte Lumnosität eines Fixed-Target-Experimentes bezeichnet. Die Luminosität ergibt sich dann trivialerweise zu L = Ṅin n0 ∆z und eine Verallgemeinerung auf Speicherringe lautet n1 n2 fp , A wobei n1 , n2 die Anzahl Teilchen in einem Paket der Strahlen, A die Fläche der Pakete und fp die Anzahl der umlaufenden Pakete pro Zeiteinheit sind. (Bestimmung allerdings üblicherweise über einen Standardquerschnitt zum Beispiel der Bhabha Streuung. Siehe Berger S. 46.) dN Um aus der Zählrate dΩf den differentiellen Wirkungsquerschnitt zu erhalten, kann in der dσ Realität nicht nach dΩ umgeformt werden, da durch die Winkelauflösung des Detektors über ein endliches Intervall integriert wird: Z dσ dN = Lint dΩ. dΩ dΩ ∆Ω L= Wird zusätzlich noch berücksichtigt, daß der Detektor nur eine endlich Ansprechwahrscheinlichkeit hat, verkompliziert sich das Problem weiter. Dies kann durch eine Akzeptanzfunktion ǫ(Ω, r), die vom Raumwinkel und weiteren Parametern r abhängt, ausgedrückt werden. Es muß demnach aus folgendem Ausdruck der differentielle Wirkungsquerschnitt extrahiert werden: Z dσ ∆Nf = Lint ǫ(Ω, r)dΩ dΩ ∆Ω 12 1.6 Zerfallsraten (Sehr stark an Berger angelehnt.) Im Beispiel zum Myonzerfall wurde bereits das radioaktive Zerfallsgesetz angegeben. In natürlichen Einheiten lautet dieses: N (t) = N (0)e−Γt Die Zerfallsbreite, Γ, die die differentielle Zerfallsrate dN = −Γ N dt bestimmt, ist wie im Vergleich zu sehen ist, auch der Kehrwert der Lebensdauer Γ = τ1 . Ihren Namen erhält die Zerfallsbreite aus der Energieunschärfe der zugehörigen Spektrallinien in der atomaren und subatomaren Physik. Die Lebensdauer kann im SI-System über 6.582 · 10−16 ~ τ= eV s = Γ Γ in Sekunden angegeben werden. Dies ergibt jedoch nur für relativ kleine Zerfallsbreiten Γ < 1 GeV Sinn, da für größere Zerfallsbreiten eine Messung nur noch über die Massenunschärfe möglich ist. Bei Teilchen, die in mehr als nur einen Endzustand zerfallen, wird die Partialbreite für jeden Zerfallskanal eines Teilchens P in einen Endzustand f angegeben 1 dN (P −→ f ) = −Γf , N dt wobei die totale Breite dann durch die Summe über alle Partialbreiten gegeben ist: X Γ= Γf . f Den Bruchteil der Zerfälle in einem Kanal, das sogenannte Verzweigungsverhältnis wird Γ mit Γf festgelegt und meist mit B für branching ration abgekürzt. Zerfallskanäle des ρ+ (770) Mesons Das ρ+ (770) ist ein Bindungszustand aus einem u- und einem Anti-d-Quark mit Drehimpuls 1, einer Masse von etwa 770 MeV und einer Zerfallsbreite von Γ ∼ 150 MeV. Diese setzt sich aus folgenden Zerfallskanälen zusammen: Zerfall ρ −→ π + π 0 ρ −→ π + γ ρ −→ π + η ρ −→ π + π + π − π 0 Γf Γ ∼ 1.00 (4.5 ± 0.5) × 10−4 < 6 × 10−3 < 2.0 × 10−3 Um aus den Zerfällen Rückschlüsse zum Beispiel auf den Spin des zerfallenden Teilchens zu erhalten, werden Winkelverteilungen betrachtet: d2 N dΓ =− . N dtdΩ dΩ Dies wird in einer relativ einfachen Form auch in dem Wu-Experiment von 1956 in Beispiel II behandelt. 13 Beispiel I: β-Zerfall des Neutrons Bis 1930 wurde der Neutron-β-Zerfall als Zweikörperzerfall n −→ p + e− angesehen. Dies läßt sich jedoch weder mit dem Zerfallsspektrum, siehe Skizze, noch mit der Drehimpulserhaltung vereinbaren, Neutron, Proton und Elektron sind jeweils Spin 12 Teilchen. 1930 postulierte Pauli in einer privaten Korrespondenz das Neutrino, ursprünglich noch Neutron genannt, das er 1933 einer breiteren Öffentlichkeit unterbreitete. Es wurde als masseloses Teilchen mit Spin 21 , für die Drehimpul- Ergebnis eines Praktikumsversuches für das β-Spektrum. serhaltung, das nur sehr schwach wechselwirke, postuliert. Erst 23 Jahre später 1956 wurde es , genauer das Antineutrino, von der Gruppe um Cowan und Reines (NPP 1995) durch den inversen β-Zerfall ν̄e +p −→ n+e+ an einem der ersten großen Kernreaktoren nachgewiesen. Die mittlere Lebensdauer des Neutrons beträgt τ = 885.7 s (Wieviel in eV −1 ?), der Zerfall des Neutrons geschieht fast ausschließlich über n −→ p + e− + ν̄e . (PDG Limit für n −→ p + e− + ν̄e + γ B = ΓΓi = (3.13 ± 0.35) · 10−3 .) Beispiel II: Das Wu-Experiment Original-Veröffentlichung: C. S. Wu, E. Ambler, R. W. Hayward, D. D. Hoppes, R. P. Hudson: Experimental Test of Parity Conservation in Beta Decay. In: Physical Review. 105, 1957, S. 1413-1415. doi:10.1103/PhysRev.105.1413 und: Question of Parity Conservation in Weak Interactions T.D. Lee (Columbia U.), Chen-Ning Yang (Brookhaven). Oct 1956. 5 pp. Published in Phys.Rev. 104 (1956) 254-258 Auf der rechten Seite ist der Aufbau des Wu-Experimentes skizziert. Co-60 wird Schematische Skizze des auf 0.01 K gekühlt. Die Reaktion lautet Versuchaufbaus 60 27 Co − −→60 28 N i + e + ν̄e Der Mutterkern hat Spinprojektion Sz = 5, der Tochterkern Sz = 4, das Elektron Sz = 21 , das Antineutrino Sz = 21 beide also mit Spinprojektion in derselben Richtung wie das Kobalt 60. Es werden nun zwei verschiedene Messungen durchgeführt: In der ersten Messung werden Elektronen detektiert, die entgegen des Kernspins emittiert werden. Die zweite Messung betrachtet die gespiegelte Situation. Da sich Spins unter Raum~ =L ~ ′ = (−~x) × (−~ ~ reicht es dafür, spiegelung nicht ändern, (Drehimpuls P L p) = L) die Spins umzudrehen, indem die Richtung des Magnetfeldes geändert wird. Der Vergleich der zwei Messungen ergab das damals überaschende Ergebnis, daß fast alle Elektronen entgegen des Kernspins emittiert werden und somit die Parität nicht erhalten ist. Sie ist in der schwachen Wechselwirkung sogar maximal verletzt, da die Eichbosonen nur an linkshändige Teilchen koppeln. Dazu später mehr. 14 Exkurs: Parität Eine Paritätstransformation beschreibt in der Physik eine Punktspiegelung am Ursprung. Vektoren wie der Ortsvektor ~x oder der Impuls p~ ändern unter dieser ihr ~ = ~x × p~ oder Spins Vorzeichen, während Pseudovektoren wie z.B. der Drehimpuls L unverändert bleiben. Wellenfunktionen von Teilchen eines Typs a wird eine intrinsische Parität ηa = ±1 zugeordnet, so daß sich diese unter Parität wie P|~ p, s; ai = ηa | − p~, s; ai transformieren. Das Pion hat zum Beispiel intrinsische Parität ηa = −1. Spin 12 Teilchen und ihre Antiteilchen haben entgegengesetzte Parität. Eine Ausnahme hierzu bilden Majorana-Teilchen, bei denen die intrinsische Parität nicht reell sein muß und ηa = −ηb∗ gilt, wenn b das Antiteilchen von a ist. (Siehe z.B. Maggiore.) 1.7 Die goldene Regel In den letzten Vorlesungen wurden Beispiele für Wirkungsquerschnitte sowie Zerfallsraten und deren experimentelle Bestimmung gegeben. Hier soll nun kurz skizziert werden, wie die theoretische Berechnung vonstatten geht. Zunächst wird ein Streuoperator definiert, der den Übergang eines Zustands |ii zur Zeit t = −∞ zu einem Zustand |i′ i zur Zeit t = +∞ beschreibt: |i′ i = S|ii. Wird nun ein bestimmmter Endzustand zum Beispiel durch einen Detektor präpariert, ergibt sich die Wahrscheinlichkeit diesen in |i′ i zu finden, zu Matrixelementen des Operators S: hf |i′ i = hf |S|ii = Sf i . Interessant sind für uns vorwiegend jene Prozesse, in denen |i′ i sich gegenüber |ii verändert hat, in denen also eine Wechselwirkung stattfand. Daher ist es sinnvoll, den Streuoperator aufzuspalten in einen Teil, der den einlaufenden Zustand |ii invariant läßt und einen zweiten interessanten Anteil. S =1+R Das Matrixelement Rf i läßt sich nun weiter aufteilen in Normierungsfaktoren der Wellenfunktionen des Anfangs- und Endzustandes, eine δ-Distribution, die für die Impulserhaltung sorgt, und die eigentliche Streuamplitude Tf i , die sämtliche dynamischen Informationen der zugrundeliegenden Theorie bzw. des zugrundeliegenden Prozesses beinhaltet. (Dies ist das Objekt, welches später via Feynmanregeln berechnet wird.) Schematisch: X X Rf i ∼ −i(2π)4 (Πki Nki )(Πkf Nkf )δ 4 ( pk i − pkf )Tf i . ki kf Die goldene Regel der Quantenmechanik besagt nun, daß die Reaktionswahrscheinlichkeit gleich dem Betragsquadrat von Rf i multipliziert mit der Anzahl der Endzustände ist. Für eine Elektron-Positron-Streuung wäre z.B. wenn man die Spins vernachlässigt: dNf = |Rf i |2 V d 3 p3 V d 3 p4 . (2π)3 (2π)3 Hierfür wird sich ein Kasten mit Volumen V , in welchem ein Target-Positron ruht, d.h. n0 = V1 vorgestellt. Im Zeitintervall T soll sich ein Elektron im Kasten befinden, also 15 Nin = T |~ v1 | ∆z , daher schreibt sich dσ = V dNf dNf = Nin n0 ∆z T |~v1 | und die Anzahl der Endzustände eines spinlosen Teilchens in einem Volumen V mit Impulsen zwischen p~ und p~ + d~ p V d3 p . dZ = (2π)3 (Eine Phasenraumzellen hat in der QM das Volumen (2π~)3 und es wird ~ = c = 1 genutzt.) Mittels1 VT 4 (δ 4 )2 = δ (2π)4 und der Normierung der relativistischen Wellen (Lösungen der Klein-Gordon Gleichung)2 1 Nn = √ 2En V erhält man dann dσ = d 3 p4 d 3 p3 1 |Tf i |2 (2π)4 δ 4 (p1 + p2 − p3 − p4 ) 3 4E1 E2 |~v1 | 2E3 (2π) 2E4 (2π)3 oder in relativistisch invarianter Schreibweise mit 4E1 E2 |~v1 | = 4|~ p1 |m2 = 2S12 (siehe Übungen) dσ = d 3 p4 d 3 p3 1 |Tf i |2 (2π)4 δ 4 (p1 + p2 − p3 − p4 ) . 2S12 2E3 (2π)3 2E4 (2π)3 1 Die Herleitung dieses Zusammenhangs läßt sich anhand des eindimensionalen Falles plausibel machen: Z +∞ 1 δ(p) = dx eipx 2π −∞ Z +X 1 dx eipx lim = 2π X→∞ −X 1 lim δX (p) = 2π X→∞ Nun läßt sich über δX (p) = 2 sin pX 2 p zeigen, dass δX (0) −→ X, was verallgemeinert das Produkt V T im Ergebnis für (δ 4 )2 ergibt. 2 Die Normierung kann aus den ebenen Wellen Lösungen der Klein-Gordon Gleichung ψ(x) = N e−ipx und der zugehörigen Wahrscheinlichkeitsdichte ∂ψ ∂ψ ∗ ρ = I ψ∗ − ψ ∂t ∂t über die Bedingungen Z dV ρ = 1 gewonnen werden. 16 Üblicherweise wird dies dσ = 1 |Tf i |2 dL 2S12 mit dL dem lorentzinvarianten Phasenraumvolumen abgekürzt. Damit ist der Wirkungsquerschnitt aufgeteilt in einen Flußfaktor für die einlaufenden Teilchen, das Übergangsmatrixelement und das Phasenraumvolumen, d.h. mehr oder weniger die Anzahl der Endzustände. Eine Integration über einen der Impulse läßt sich aufgrund der δ 4 -Distribution direkt ausführen. Wir wählen den Impuls p4 und gehen ins Schwerpunktsystem, um die verbleibende δ-Distribution auszunutzen. (~ p3 = −~ p4 ) Damit wird Z Z d 3 p4 d 3 p3 dL = (2π)4 δ 4 (p1 + p2 − p3 − p4 ) 2E3 (2π)3 2E4 (2π)3 Z 1 |~ p3 |2 d|~ p3 |dΩ3 = δ(E + E − E − E ) 1 2 3 4 4(2π)2 E3 E 4 Das Raumwinkelelement lassen wir unintegriert und lösen die δ-Distribution nach |~ p3 | auf. Somit ergibt sich Z p | 1 |~ √3 dL −→ dΩ3 2 16π s √ p1 | folgendermaßen geund der differentielle Wirkungsquerschnitt kann mit S12 = 2 s|~ schrieben werden: p3 | 1 |~ dσ = |Tf i |2 . dΩ3 64π 2 s |~ p1 | Häufig wird auch der diffferentielle Wirkungsquerschnitt in Bezug auf den Impulsübertrag t = q 2 = (p1 − p3 )2 angegeben. Dieser kann mit Hilfe von dt = 2|~ p1 ||~ p3 |d cos θ3 , wobei θ3 der Winkel zwischen einlaufenden und auslaufenden Elektronen ist, in folgende Form gebracht werden: dσ 1 2 = 2 |Tf i | . dt 16πS12 (Über den Azimuthwinkel wurde integriert, wodurch ein Faktor 2π hinzukam.) Um Spins berücksichtigen zu können, müssen die Normierungen der Wellenfunktionen aus den Lösungen der Dirac-Gleichung (oder Wellengleichungen für Spin 1 Teilchen) gewonnen werden. Für unpolarisierte einlaufende Teilchen und nichtgemessene Spins der auslaufenden Teilchen wird dann über die Spins der einlaufenden Teilchen gemittelt, über die der auslaufenden Teilchen summiert. (Wie im 1.5.3 angegebenen Mott-Querschnitt.) Für die Zerfallsrate eines Zerfalls in zwei spinlose Teilchen läßt sich eine ganz ähnliche Herleitung führen, die zu dem Ergebnis dΓ p1 | 1 |~ |Tf i |2 = dΩ1 32π 2 M 2 führt. Hier sind p~1 der Impuls des ersten Zerfallsproduktes, M die Masse des zerfallenden Teilchens und dΩ1 das dreidimensionale Raumwinkelelement des ersten Zerfallsproduktes. Wichtig ist, daß die zugrundeliegende Wechselwirkung nur |Tf i |2 bestimmt, alle anderen Faktoren folgen aus allgemeinen Überlegungen zur Impuls- und Energieerhaltung sowie zur Zustandsdichte. 17 Exkurs: Relativistische Quantenmechanik und Quantenfeldtheorie Nach der phänomenologischen Betrachtung von Wirkungsquerschnitten und Zerfallsraten, ein kurzer und sehr heuristischer Exkurs, der sämtliche Subtilitäten ignoriert, zu den theoretischen Grundlagen. Die nichtrelativistische Schrödingergleichung ~2 2 ∂ψ(~x, t) = − ∇ + V (~x, t) ψ(~x, t) i~ ∂t 2m gemeinsam mit der Bornschen Wahrscheinlichkeitsdichte P (~x, t)d3 x = |ψ(~x, t)|2 d3 x führt bei der Beschreibung subatomarer Prozesse zu einigen Problemen. Zunächst ist die Schrödingergleichung, wie angemerkt, nichtrelativistisch, was leicht einzusehen ist, da sie eine partielle Differentialgleichung erster Ordnung in der Zeit aber zweiter Ordnung im Ort ist, während Lorentztransformationen keinen solchen Unterschied zwischen Raum und Zeit machen. Zudem liefert die Wahrscheinlichkeitsdichte Z d3 x|ψ(~x, t)|2 = 1 das zu jedem Zeitpunkt die Wahrscheinlichkeit, ein Teilchen irgendwo im Raum zu finden, 1 ist. Letzteres verträgt sich nicht sonderlich gut mit instabilen oder auch der Produktion zusätzlicher Teilchen. Die Erweiterung der nichtrelativistischen Quantenmechanik zur relativistischen Quantenmechanik läßt sich via der Ersetzungsregeln relativ leicht nachvollziehen. Aus der relativistischen Energie-Impuls-Beziehung E 2 − p~2 c2 = m2 c4 ∂ die Klein-Gordon Gleichung ergibt sich durch die Zuordnungen p~ → −i~∇, E → i~ ∂t 1 ∂2 m2 c 2 − ∇2 + 2 2 2 c ∂t ~ ψ(~x, t) = 0, + m2 ψ(x) = 0, mit = ∂x∂ µ ∂x∂ µ = ∂µ ∂ µ . Diese ist offensichtlich relativistisch kovariant und beschreibt freie Spin 0 Teilchen. (Probleme mit der Kontinuitätsgleichung, Stichwort Wahrscheinlichkeitsdichte nicht positiv definit, und Lösungen negativer Energie werden hier außen vor gelassen und können in entsprechenden Büchern nachgeschlagen werden.) Sie erfüllte die in sie gesetzten Erwartungen nicht, das Wasserstoffspektrum zu erklären. 1928 entwickelte Paul Adrien Maurice Dirac die Diracgleichung (NPP 1933). Grob gesprochen eine Linearisierung der Klein-Gordon Gleichung. Diese lautet (in natürlichen Einheiten) ∂ µ γ − m ψ(x) = 0 i ∂xµ und beschreibt freie Spin 21 Teilchen. Die γµ sind 4 × 4-Matrizen womit die ψ vierdimensionale Spinoren sind. (Vergleiche mit 2-dimensionalen Spinoren in der PauliGleichung.) Mit ihr konnte unter anderem die Feinstruktur des Wasserstoffatoms erklärt werden und es wurde die Existenz von Antiteilchen vorhergesagt. (Beide Gleichungen können aus der Darstellungstheorie der Lorentzgruppe hergeleitet werden.) 18 Exkurs Fortsetzung: Um jedoch die Probleme des Zerfalls und der Teilchenerzeugung anzugehen, bedarf es weiterer Schritte. Grundlage kann eine klassische Feldtheorie wie die Elektrodynamik sein, es muß jedoch in keinster Weise ein klassisches Analog existieren, deren Felder durch Operatoren ersetzt werden. Jedem Raum-ZeitPunkt wird also anstatt einer Zahl oder eines Vektors ein Operator zugeordnet. Diese Operatoren können im freien Fall als Fouriertransformierte von Erzeugungs- und Vernichtungsoperatoren dargestellt werden. Erzeugungs- und Vernichtungsoperatoren verhalten sich grob wie Auf- bzw. Absteigeoperatoren. Sie erzeugen oder vernichten Einteilchenzustände, womit auf natürliche Weise das Problem der Teilchenzahlerhaltung in der Quantenmechanik gelöst ist. (Teilchen werden damit, salopp ausgedrückt, zu Feldanregungen von Quantenfeldern degradiert.) Das Viererpotential in Lorentzeichung hat zum Beispiel folgende Form: Aµ (x) = Z 3 h i X d3 p p ǫµ (~ p, λ)ap~,λ e−ipx + ǫ∗µ (~ p, λ)a†p~,λ eipx , (2π)3 2p0 λ=0 wobei ǫµ (~ p, λ) die Polarisationsvektoren und ap~,λ , ap†~,λ die Operatoren sind, die ein Photon mit Impuls p~ und Polarisation λ vernichten, bzw. erzeugen. Die Erzeuger und Vernichter erfüllen Kommutator- oder Antikommutatorrelationen je nachdem, ob es sich um Bosonen oder Fermionen handelt. Mit der Lagrangedichte der Quantenelektrodynamik 1 (1) L(x) = − Fµν F µν (x) + ψ̄(x)i(Dµ γ µ − m)ψ(x) 4 und der damit gegebenen Wechselwirkung aus der kovarianten Ableitung Dµ = ∂µ − ieAµ (in Analogie zur Kopplung ans elektromagnetische Feld in der ~ r, t), H → 1 (−i~∇ + eA(~r, t))2 − eφ(~r, t)) Schrödinger Gleichung p~ → p~ + eA(~ me γµ e Lint (x) = eψ̄(x)Aµ (x)γ µ ψ(x) sowie nicht zu vergessen einigen weiteren Ingredienzien wie Greens-Funktionen (Propagatoren), Spin- bzw. Polarisationssummen, Eichfixierung, Beschränkung auf physikalische Zustände, etc. ließen sich nun die Feynmanregeln der QED herleiten und via Störungstheorie z.B. das Übergangsmatrixelement Tf i berechnen. Dazu mehr im nächtsen Abschnitt und in Kapitel 5. 1.8 Feynmandiagramme Feynmandiagramme werden in der Elementarteilchenphysik, vereinfacht gesprochen, zur Illustration von zumeist kovarianten Störungsreihen benutzt, d.h. relativistischer, zeitgeordneter Störungsreihen. Jedes Feynmandiagramm stellt einen möglichen Term in dieser Reihe dar. Die Linien und Vertizes stellen Vorschriften der zugrundeliegenden Theorie dar. So korrespondiert jeder Vertex zu einer Einsetzung der Kopplunskonstante sowie einer Delta-Distribution um Impulserhaltung zu gewährleisten und jede innere Linie zu einem Propagator, d.h. zu einer Greensfunktion der entsprechenden Bewegungsgleichung. (Z.B. die Diracgleichung für Elektronen oder die Klein-Gordon-Gleichung für skalare Teilchen.) 19 Höhere Ordnungen werden durch Anfangs- und Endzustandsabstrahlung eines Photons oder durch sogenannte Schleifendiagramme, bei denen sich eine geschlossene Schleife ergibt, dargestellt. Die Berechnung von Amplituden bzw. Wirkungsquerschnitten aus solchen Feynmandiagrammen gehört inzwischen zum täglichen Brot fast jedes theoretischen Teilchenphysikers. Die Anzahl der möglichen Diagramme zu höheren Ordnungen steigt faktoriell an, so dass Berechnungen auf 3- oder 4-Schleifen schon Aufgrund der schieren Anzahl der zu berechnenden Diagramme eine enorme Herausforderung darstellen. Zur Illustration seien hier die Feynmanregeln der Quantenelektrodynamik angegeben. Diese lassen sich aus der Lagrangedichte (1) ableiten, allerdings wurde dort noch keine Eichfixierung vorgenommen, so dass die Bewegungsgleichung für den Photonpropagator nicht invertierbar ist. Wird eine kovariante Eichung verwendet L→L− 1 (∂A)2 , 2ξ für nicht kovariante Eichungen sei auf das Buch “Noncovariant Gauges” von George Leibbrandt verwiesen, so lautet die Definition des Photonpropagators 1 ∂µ ∂ν Dνρ (x) = −δµρ δ 4 (x), −gµν + 1 − ξ diese folgt, wie gesagt, aus der Bewegungsgleichung des Photons, und nach Fouriertransformation 1 q 2 gµν − 1 − qµ qν D̃νρ (q) = −δµρ . ξ Die Lösung dieser Gleichungen kann unter Berücksichtigung der Feynmanschen Kausalitätsbedingung im Impulsraum wie folgt geschrieben werden: qµ qν −i gµν − 2 (1 − ξ) . iD̃µν (q) = 2 q + iǫ q + iǫ In dieser Vorlesung wird für so gut wie alle Feynmandiagramme die Feynmaneichung ξ = 1 angenommen, so dass sich der Propagator auf iD̃µν (q) = −igµν q 2 + iǫ reduziert. Das schlußendliche Ergebnis darf nicht von der gewählten Eichung abhängen, allerdings muss die Wahl einheitlich für die gesamte Rechnung ausfallen. Die weiteren Feynmanregeln werden nachfolgend mit den entsprechenden Diagrammen angegeben. Diese werden, strikt gesprochen, für diese Vorlesung nicht benötigt, da Feynmandiagramme nur zur Illustration verwendet werden, allerdings hilft es, eine ungefähre Vorstellung zu haben, was hinter diesen Diagrammen steckt: Sie sind eine graphische Darstellung von Rechenregeln, genauer von Termen einer Störungsreihe und keine getreue Darstellung des mikroskopischen Geschehens. 20 Feynman-Diagramme der QED µ Elektronpropagator i(/ p + m) p 2 − m2 Photonpropagator −igµν q 2 + iǫ Elektron-Photon-Vertex ieγµ Äußere Linien: Elektron Positron Photon us (p) v̄ s (p) ǫ(p, λ) ūs (p) v s (p) ǫ∗ (p, λ) einlaufend auslaufend Für jede geschlossene Schleife kommt noch ein Integral über den Schleifenimpuls Z d4 q (2π)4 hinzu sowie für jeden Fermionloop ein Minuszeichen. In der QCD treten noch Symmetriefaktoren für Diagramme mit Drei- und Viergluonvertizes auf, die die Permutationen interner Gluonlinien kompensieren, aber diese sollen uns zunächst nicht interessieren. Werden die Spins des Anfangszustandes bzw. des Endzustandes nicht gemessen, so wird über die Spins gemittelt bzw. summiert. Dafür werden noch die folgenden Relationen benötigt: X us (p) ūs (p) = p /+m s X v s (p) v̄ s (p) = p /−m = s X λ ǫµ (p, λ)ǫ∗ν ((p), λ) gµν − 0 kµ kν |k|2 für µ, ν = 1, 2, 3 (2) für µ und/oder ν = 0 Die führende Ordnung z.B. in der Elektron-Positron-Streuung würde demnach durch die Diagramme in Bild 1 gegeben. Es werden beide Diagramme benötigt, da die Annihilationsamplitude und die Streuamplitude miteinander interferieren. Korrekturen höherer Ordnung werden durch Anfangs-und Endzustandsabstrahlung eines Photons sowie durch virtuelle Schleifenkorrekturen gegeben, siehe auch Bild 2, für eine beispielhafte Darstellung. 21 e− e+ e− e+ e− e+ e− e+ Abbildung 1: Feynmandiagramme führender Ordnung zur Elektron-Positron-Streuung e− e− γ e+ e− e+ e+ e− e+ Abbildung 2: Zwei Feynmandiagramme nächstführender Ordnung (NLO von next to leading order) zur Elektron-Positron-Streuung 2 Teilchenbeschleuniger Synchrotron, Linearbeschleuniger Strahlungsverlust in Linear- und Kreisbeschleunigern Nachdem in den vorhergehenden Vorlesungen ein Überblick über die Grundlagen insbesondere der Streutheorie gegeben wurde, sollen nun die wichtigsten experimentellen Hilfsmittel gewürdigt werden. Teilchenbeschleuniger in diesem Kapitel, Detektoren im nächsten. Welche Beschleunigertypen gibt es? Eine kurze Auflistung findet sich in Abb.3. Es können leider nicht alle Typen betrachtet werden. Alleine die technischen Grundlagen Abbildung 3: Auflistung verschiedener Beschleunigertypen der verschiedenen Beschleunigertypen rechtfertigten eine eigene Vorlesung. Und wofür werden Beschleuniger gebraucht? Am Ende von Abschnitt 1.4 wurde gezeigt, daß hochenergetische Strahlung benötigt wird, um subatomare Strukturen auflösen zu 22 können. Solch hochenergetische Strahlung kommt zum Beispiel in der Höhenstrahlung oder kosmischen Strahlung vor, die 1908 zum ersten Mal von Karl Friedrich August Bergwitz bei einem Ballonflug registriert wurde, von diesem jedoch auf einen Fehler in seiner Meßapparatur zurückgeführt wurde. Vier Jahre später, 1912, griff Victor Franz Hess dieses Ergebnis wieder auf und konnte bei insgesamt sieben Ballonfahrten die Existenz der kosmischen Strahlung nachweisen, wofür er 1936 den Nobelpreis in Physik erhielt. Ebenfalls 1936 erhielt Carl David Anderson den Nobelpreis für die Entdeckung des Positrons, des Antiteilchens des Elektrons und weniger als ein Jahr später gelang ihm gemeinsam mit Neddermeyer die Entdeckung des Myons, eines Leptons ähnlich dem Elektron jedoch etwa 207 mal schwerer, in der kosmischen Strahlung. Trivia: Isaac Isidor Rabi (Nobelpreis für Physik 1944 für seine Resonanzmethode zur Untersuchung magnetischer Eigenschaften von Atomkernen) soll nach der Entdeckung des Myons gesagt haben: “Who ordered that?” (“Wer hat das bestellt?”) Zudem wurde das Myon aufgrund der ähnlichen Ruhemasse zunächst für das von Yukawa postulierte Austauschteilchen der starken Kernwechselwirkung, das Pion, gehalten. Einige sehr wichtige Entdeckungen der Teilchenphysik, wie die erwähnte Entdeckung des Myons, wurden mit Hilfe der kosmischen Strahlung gemacht. 1946 konnte zudem von Scott Elsworth Forbush nachgewiesen werden, daß bei Sonneneruptionen Teilchen bis in den GeV-Bereich erzeugt werden, inzwischen sind gar Teilchen bis 1020 eV (Wikipedia gibt 3.2 · 1020 eV als höchste bisher gemessene Energie an. 1991 vom Fly’s Eye. Dies entspräche der Energie eines 10 Gramm schweren und 100 km h schnellen Hagelkorns.) und damit jenseits der Energie jedes Teilchenbeschleunigers nachgewiesen worden. Zu hohen Energien nimmt der Fluß der kosmischen Strahlung jedoch rapide ab, im Bereich von 1010 eV bis 1019 eV um 27 Größenordnungen und jenseits von 1019 eV sollte der sogenannte GZK-Cut-Off, eine von Greisen, Kuzmin und Zatsepin 1966 ausgeführte Rechnng, die vorhersagt, daß der Teilchenfluß abrupt versiegen sollte, gelten. Daher und um besser kontrollierbare Bedingungen zu haben, war der Bau von Beschleunigern zur Untersuchung subatomarer Strukturen unabdingbar. Zumal die Schwerpunktsenergie der kosmischen Strahlung schlußendlich selbst am äußersten Ende des Spektrums nicht weit über die von Beschleunigern hinausgeht. 2.1 Luminosität Bereits bei der Betrachtung von Wirkungsquerschnitten wurde die Luminosität für FixedTarget-Experimente und Speicherringe eingeführt L = Ṅin n0 ∆z, L= n1 n2 fp , A und die Verbindung zwischen integrierter Luminosität Lint = Nin n0 ∆z und Anzahl gestreuter Teilchen wurde angegeben: dσ dNf = Lint . dΩ dΩ Für Zähl- bzw. Reaktionsraten ergibt sich dann natürlicherweise dṄf dσ =L . dΩ dΩ Werden für die Teilchenstrahlen in einem Speicherring gaußförmige Dichteverteilungen transversal zur Strahlachse angenommen und die fp durch die Anzahl der umlaufenden 23 Teilchenpakete nB und die Umlauffrequenz fu ersetzt, schreibt sich die Luminosität wie folgt: nB fu n1 n2 . L= 4πσx σy Die effektive Querschnittsfläche der aufeinandertreffenden Teilchenstrahlen wird also durch die Standardabweichung in x und y Richtung der Teilchenstrahlen gegeben. (Diese sind hier für beide Strahlen als gleich angenommen.) Wie zu sehen, ist die Luminosität der entscheidende Parameter, da der Wirkungsquerschnitt nicht im selben Maße beeinflußt werden kann, um die Statistik eines Experimentes zu verbessern. (Vereinfacht: Höhere Zählrate = Höhere Statistik.) Daher wird ein gewaltiger Aufwand betrieben, um die Strahlen zu fokussieren bzw. eine kleinere effektive Querschnittsfläche im Wechselwirkungspunkt zu erhalten und um mehr Teilchenpakete in einem “Strahl” umlaufen zu lassen, im LHC waren dies z.B. bisher maximal 1374 bei einer geplanten Anzahl von 2800. Insbesondere im Abschnitt über Synchrotrons wird zu diesen Anstrengungen noch mehr gesagt werden. Beschleuniger LEP II Tevatron (Run II) PEP II (BaBar) KEKB (Belle) KEKB II LHC Spitzenluminosiät in cm−2 s−1 1 · 1032 4 · 1032 1.21 · 1034 2.11 · 1034 8 · 1035 (geplant) 7.5 · 1033 (design 1 · 1034 ) Tabelle 2: Die Luminosität einiger jüngerer Beschleuniger. LEP, PEP, KEKB sind jeweils e+ e− -Maschinen, Tevatron pp̄, LHC pp 2.2 Linearbeschleuniger/ Van de Graaff Beschleuniger Das einfachste Prinzip eines Beschleunigers ist sicher der Linearbeschleuniger. Zum Beschleunigen werden elektrische Felder benutzt. Die Energie ∆E, die zum Beispiel ein Elektron gewinnt, wenn es einen Kondensator durchläuft, an dessen Platten die Spannung U liegt, beträgt: ∆E = e U. Mit diesem Prinzip eines einfachen statischen elektrischen Feldes wurden in den 30er Jahren die ersten Beschleuniger, z.B. van de Graaff Beschleuniger (Prinzip 1931 aufgebracht.) konstruiert. Die Energie, die sich auf diesem Wege auf das Teilchen übertragen läßt, ist jedoch begrenzt, da unter anderem verhindert werden muß, daß bei zu hohen Spannungen ein Spannungsdurchbruch geschieht. Modernere Beschleuniger benutzen dann auch das Driftröhrenprinzip, in welchem die gleiche Spannung mehrfach hintereinander durchlaufen wird. Beide Konzepte sollen kurz erläutert werden. 24 2.2.1 Van de Graaff Beschleuniger Nebenstehend ist ein van de Graaff Beschleuniger skizziert. Es werden auf ein nur sehr schwach leitendes Band positive Ladungsträger aufgebracht, die mittels des Bandes zu einem Hochspannungsterminal transportiert werden. Dort nehmen “Bürsten” die Ladung auf und erzeugen so eine positive Raumladung auf der Oberfläche der Elektrode bzw. eine Potentialdifferenz gegenüber Masse. Im inneren der Elektrode befindet sich eine Quelle positiver Ionen, die abgestoßen und durch die Potentialdifferenz auf entsprechende Energien beschleunigt werden. Befindet sich der Beschleuniger in einem entsprechend durchschlagfesten Gas, zum Beispiel einer Druckkammer mit reinem Stickstoff, so lassen sich auf diesem Wege Energien bis zu E = 10 M eV erreichen. Sogenannte Tandembeschleuniger können diese Energie mehr oder weniger verdoppeln, indem sie zunächst negativ geladene Ionen von dem Potential anziehen lassen, die Ionen dann von ihren Elektronen befreien, d.h. umladen und dann abstoßen also ein weiteres Mal beschleunigen lassen. Damit sind aber die Grenzen dieses Prinzips auch erreicht und wie im Abschnitt über Größenordnungen abgeschätzt, reichen 20 M eV nur zur Auflösung von Kernstrukturen, eignen sich demnach nicht für die Teilchenphysik. 2.2.2 Driftröhrenlinearbeschleuniger und “Travelling wave linacs” Abbildung 4: Schematische Driftröhrenprinzips Darstellung des 1928 von Wideroe erdachten Bereits um 1928 ersann Rolf Wideroe in seiner Doktorarbeit das Prinzip des Driftröhrenlinearbeschleunigers. (Skizze unten) Hier wird ein Wechselspannungsgenerator mit einer Scheitelspannug U0 an sogenannte Driftröhren angeschlossen. Die eigentliche Beschleunigung geschieht in den Spalten zwischen den Driftröhren, während deren Innenraum Feldfrei bleibt. Wird die Länge der Driftröhren so abgestimmt, daß das beschleunigte Teilchen stets die halbe Periodendauer des Generators braucht, um diese zu durchqueren, wird es in jedem Zwischenraum erneut die gleiche Energie aufnehmen. Konkret hieße dies folgendes: Im Zwischenraum zwischen Ionenquelle und erster Driftröhre nähme das 25 Teilchen ∆E = eU0 sin ψs an Energie auf, wobei ψs die mittlere Phase (Sollphase) des Teilchens beim Passieren des Zwischenraumes wäre. Die Driftröhren müßten nun stets so lang sein, daß li = vi 2f gölte. Hier wäre f die Frequenz der Wechselspannung und vi die Geschwindigkeit des Teilchens beim i-ten Durchlauf. Für hohe Energien stößt dieses Prinzip ebenfalls an seine Grenzen, da entweder bei praktisch verwendbaren Frequenzen von 10 M Hz die Driftröhren sehr lang werden ∼ 15 m oder weil die Frequenzen so hoch gewählt werden müßten, daß die Anordnung nicht mehr als Wechselspannungskreis betrachtet werden könnte. In der Praxis sind diese Driftröhrenbeschleuniger nie verwendet worden. Ernest Lawrence soll jedoch, aus den Skizzen in Wideroes Veröffentlichung, Lawrence verstand kein Deutsch, die Inspiration für das Zyklotron gezogen haben. (Siehe nächster Abschnitt.) Um die Probleme, die sich in Wideroes Prinzip ergeben zu beseitigen, verwendete Alvarez 1945 ein Driftröhrensystem, daß in einem Hohlraumresonator untergebracht war und die so angeordnet waren, daß sich stehende Wellen längs der Teilchenausbreitung bildeten. In den Röhren liegt wiederum ein feldfreiher Raum vor, so daß die Teilchen ebenfalls nur zwischen den Röhren beschleunigt werden und die Durchflugszeit auf die Periodendauer der stehenden Welle abgestimmt werden muß. Abbildung 5: Feldanordnung in einer Alvarez-Struktur Moderne Linearbeschleuniger, wie das SLAC, verwenden das Prinzip des travelling wave linacs. (Siehe Skizze.) Hierbei wird ausgenutzt, daß sich in metallischen Hohlleitern elektromagnetische Wellen mit longitudinalen elektrischen Komponenten, sogenannte TM-Wellen, bilden können, die zur Beschleunigung von Teilchen genutzt werden. Die Phasengeschwindigkeit der elektromagnetischen Wellen im metallischen Hohlleiter liegt oberhalb der Vakuumlichtgeschwindigkeit, so daß diese durch Irisblenden gebremst werden muß, damit die Welle den zu beschleunigenden Teilchen nicht davonläuft. Es ergibt sich die sogenannte Runzelröhre. Neben des Vorteils der höheren möglichen Energien, werden die beschleunigten Teilchen automatisch in Paketen gesammelt. Allerdings werden zur Nutzung von Beschleunigern dieses Typs Vorbeschleuniger benötigt, die die Teilchen auf annähernd Lichtgeschwindigkeit beschleunigen (Für Elektronen kein größeres Problem). Ein anderes Problem stellt die Bereitstellung der hochfrequenten Wellen dar, die zur Beschleunigung genutzt werden. Diese können z.B. mittels eines Klystrons produziert 26 Abbildung 6: Ein durch Irisblenden unterteilter Hohlwellenleiter (Runzelröhre) und die Feldkonfiguration und dann mittels eines Wellenleiters, in welchem sich TE-Wellen (Wellen mit einer longitudinalen magnetischen Komponente,) ausbreiten, zur Runzelröhre transportiert und dort eingekoppelt werden. Abbildung 7: Prinzip der Einkopplung der elektromagnetischen Wellen in die Runzelröhre. Der bisher größte Linearbeschleuniger war derjenige am SLAC (Stanford Linear Accelerator Center). Dieser bringt Elektronen und Positronen auf einer Länge von etwa 3 km mit Strahlenergien von 50 GeV zur Kollision. Er wurde zur Untersuchung des Z-Bosons, Ruhemasse mZ = 91.1876(21) GeV gebaut. Noch in Planung befindet sich der ILC (“International Linear Collider”). Dieser soll auf einer Länge von ca. 31 km Elektronen und Positronen auf 500 GeV beschleunigen. (Bei solchen Energien läßt sich für Elektronen an sich nicht mehr von Beschleunigen sprechen, da die Geschwindigkeit des Elektrons mehr 27 Abbildung 8: Aufnahme des Linearbeschleunigers am SLAC. Der Detekorkomplex befindet sich am rechten Ende. oder weniger unverändert bleibt.) Exkurs: Hohlwellenleiter In diesem Exkurs wird das für die theoretische Elektrodynamik übliche Gaußsche System verwendet. Es wird angenommen, daß sich in dem Hohlwellenleiter ein mehr oder weniger ideales Vakuum befindet und demnach keine Ladungen oder Ströme vorhanden sind. In diesem Fall gelten die freien Maxwell-Gleichungen: ~ ·E ~ ∇ = 0, ~ ×B ~ ∇ = ~˙ E , c ~˙ ~ ×E ~ = −B , ∇ c ~ ·B ~ =0 ∇ und es lassen sich die Wellengleichungen 1 ∂2 ~ △ − 2 2 E(~ r, t) = 0, c ∂t 1 ∂2 ~ △ − 2 2 B(~ r, t) = 0 c ∂t herleiten. 28 Allgemein lassen sich via Separation Lösungen der Form E1 = Re [C1 sin(k1 x + α1 ) sin(k2 y + α2 ) sin(k3 z + α3 ) exp(−iωt)] mit ω 2 = c2 (k12 + k22 + k32 ) finden. Betrachtet man einen rechteckigen Hohlleiter mit 0 ≤ x ≤ L1 und 0 ≤ y ≤ L2 dann ergeben sich unter Berücksichtigung der Randbedingung, daß die Tangentialkomponente des elektrischen Feldes an der Oberfläche verschwindet und daß die Maxwell-Gleichungen erfüllt sein müssen, Lösungen der Art lπx mπy E1 = Re C1 cos sin exp [i(kz − ωt)] , L1 L2 lπx mπy cos exp [i(kz − ωt)] , E2 = Re C2 sin L1 L2 lπx mπy sin exp [i(kz − ωt)] , E3 = Re C3 sin L1 L2 mit 2 2 2 ω =c π m2 k2 l2 + + L21 L22 π2 . Es wurde sich hier auf Wellen, die sich in positive z-Richtung ausbreiten beschränkt. ~ ·E ~ = 0 folgt Aus ∇ lπ mπ C1 + C2 − iC3 k = 0. L1 L2 Die Komponenten des B-Feldes lassen sich aus ic ∂E1 ∂E2 ∂E3 ic ∂E3 , B2 = − , − − B1 = − ω ∂y ∂z ω ∂z ∂x ic ∂E2 ∂E1 B3 = − , − ω ∂x ∂y bestimmen, wobei ic B3 = −Re ω C2 lπ C1 mπ − L1 L2 cos lπx L1 cos mπy L2 exp [i(kz − ωt)] hier eine besondere Bedeutung zukommt.Es läßt sich zeigen, daß in einem solchen Hohlleiter keine rein transversalen Wellen existieren, (Anders als z.B. im Koaxialka~ =B ~ = 0 gilt. E3 verschwindet entweder für C3 = 0 bel.) d.h. daß für E3 = B3 = 0, E oder wenn entweder l oder m oder beide gleich null sind. Der Fall m = 0 bzw. l = 0 läßt sich leicht zeigen. Ist m = 0 so gilt E1 = 0 und es folgt aus B3 = 0, daß C2 l = 0 ~ null und ist, woraus wiederum E2 = 0 folgt. Damit sind alle Komponenten von E ~ demnach verschwinden für Wellenlösungen auch alle Komponenten von B (Maxwell~ ·E ~ = 0 und B3 = 0 Gleichungen). l = 0 läßt sich analog zeigen. C3 = 0 liefert aus ∇ die beiden Gleichungen C1 mπ lπ + C2 = 0, L1 L2 C2 lπ C1 mπ − = 0, L1 L2 ~ =B ~ =0 die sich nur für C1 = C2 = 0 oder l = m = 0 lösen lassen, woraus wiederum E folgt. 29 Somit hat anders als bei elektromagnetischen Wellen im Vakuum immer entweder das elektrische oder das magnetische Feld eine nichtverschwindende longitudinale Komponente. Diese werden üblicherweise als TE-, für transversale elektrische Welle, oder TM-Wellen, für transversale magnetische Welle, bezeichnet. Die in Büchern zur Teilchenphysik häufig erwähnte T M01 -Mode bezieht sich auf einen Hohlwellenleiter mit zylindrischem Querschnitt. Transversale elektrische Welle Hier gilt E3 = 0 und B3 6= 0. Es folgt, daß l = m = 0 nicht möglich ist und sich daher die einfachste Lösung für l = 1, m = 0 ergeben. Die Frequenz solcher Wellen lautet: s π2 ω=c + k2 . L1 D.h. Wellen dieses Typs können sich nur oberhalb einer kritischen Frequenz ω > ωkrit = cπ L1 in einem Hohlleiter ausbreiten. (Dies kann zum Beispiel in einem Hochpassfilter ausgenutzt werden, was in dieser Vorlesung jedoch nicht von weiterer Bedeutung ist.) Zudem läßt sich leicht einsehen, daß zusätzlich zu E3 auch E1 und B2 verschwinden. 2.3 Zyklotron Das Zyklotron wurde von Ernest Orlando Lawrence und seinem Doktoranden Milton Stanley Livingston 1929 entwickelt. (NPP für Lawrence 1939 für die Entwicklung des Zyklotrons und die damit durchgeführten Experimente.) Es basiert in seiner klassischen Variante auf einer runden, flachen Vakuumkammer, die sich in einem Magnetfeld befindet und in der zwei D-förmige Dosen die Elektroden einer Beschleunigungsstruktur bilden. (Skizze rechts.) Die Dosen werden mit einer Wechselspannung verbunden, so daß in dem Spalt zwischen diesen ein Teilchen die Energie ∆E gewinnt. Anschließend wird es durch ein Magnetfeld auf einen Halbkreis gezwungen, eine weitere Beschleunigung findet in den Dosen nicht statt, ehe es wieder beschleunigt wird und auf einem größeren Halbkreis in der jeweils anderen Dose umläuft. Die Zeit zwischen zwei Beschleunigungsvorgängen bleibt, solange das Teilchen keine relativistischen Energien erreicht, konstant. Dies kann an folgenden Überlegungen gesehen werden. Ein geladenes Teilchen, daß mit Impuls p~ in ein Magnetfeld eintritt, dessen Feldlinien senkrecht zum Impuls stehen, wird durch die Lorentzkraft auf einen Kreis mit Radius |~ p| R= . ~ e|B| 30 Für nichtrelativistische Teilchen gilt p~ = m~v und demnach t πR |~v | πm . ~ e|B| = = Daher kann der Wechselspannungsgenerator mit einer festen Frequenz (der Zyklotronfrequenz) ~ e|B| fz = 2πm betrieben werden. Werden die Teilchen auf relativistische Energien beschleunigt, wird die Frequenz abhängig vom γ-Faktor: f= ~ e|B| . 2πγm Um weiterhin eine konstante Frequenz zu erhalten, muß das Magnetfeld radial zunehmen, d.h. der Radius wird für höhere Energien enger gehalten. Es ergeben sich dann jedoch Probleme mit der Fokussierung des Teilchenstrahls, eine Fokussierung benötigte an sich ein radial abnehmendes Feld, welche durch eine komplizierte Anordnung von Magnetpolen behoben werden kann. Das benötigte Magnetfeld, ohne Fokussierung, läßt sich aus obigen Formeln leicht errechnen ~ = γ|B ~ 0 |, |B| ~ 0 das Magnetfeld im nichtrelativistischen Fall ist. Mit |~v | = ωr, ω = 2πf läßt wobei B ~ sich |B| dann als ~ ~ = q |B 0 | |B| 2 1 − ar 2 2 darstellen, wobei a = ωc 2 den Radius bezeichnet, auf dem sich das Teilchen mit Frequenz ω bei Lichtgeschwindigkeit befände. Die zunehmende Stärke des Magnetfeldes setzt der höhe der erreichbaren Energien starke Grenzen. Verstärkt wird dies zusätzlich durch die großen benötigten Magnete. (Der Magnetfeldradius für ein Proton, das eine kinetische Energie von 430 M eV erhalten soll, beträgt bereits 6, 6 m.) 2.4 Synchrotron Die bisher vorgestellten Beschleunigerprinzipien reichen mit Ausnahme des “travelling wave linacs” nicht aus, um die für die moderne Teilchenphysik benötigten Energien aufzubringen. Seit der Stillegung des SLACS bzw. seines Umbaus zum Röntgenlaser sind alle modernen Experimente Synchrotron- und Speicherringexperimente. Daher soll diesen hier ein wenig mehr Raum eingeräumt werden. Synchrotrons basieren auf den Arbeiten von Edwin Mattison McMillan und Vladimir Iosifovich Veksler, die 1945 unabhängig und mehr oder weniger zeitgleich das Prinzip des Synchrotrons beschrieben. 31 Ein Synchrotron besteht prinzipiell aus einem in sich geschlossenen Strahlrohr mit Ultrahochvakuum, welches durch Führungs-und Fokussiermagnete läuft. Im einfachsten Fall wird die Beschleunigungsstrecke durch einen Hohlraumresonator an einem geraden Teilstück realisiert. Vor Injektion in das Synchrotron werden die Teilchen bereits auf annähernd Lichtgeschwindigkeit vorbeschleunigt. Der Umfang der Bahn sollte dann ein ganzzahliges Vielfaches der Wellenlänge der in den Resonator eingespeisten Hochfrequenz sein, beim Tevatron z.B. 1137, damit die Teilchen bei jedem Umlauf den Energiezuwachs ∆E = eV sin ψs , mit ψs der Sollphase, erhalten. Um den Bahnradius konstant zu halten, muß das Magnetfeld synchron zum Energiezuwachs erhöht werden. (Daher Synchrotron.) Für einen Strahl mit endlichem Querschnitt ergibt sich nun das Problem, daß alle Teilchen in einem Paket leicht unterschiedliche Bahnen haben und demnach unterschiedlich lange für einen Umlauf brauchen. Die sogenannte Phasenfokussierung behebt einen Teil des Problems. Das Prinzip ist recht einfach. Ein Teilchen, dessen Bahnradius etwas kleiner ist als der Sollradius, wird etwas früher die Beschleunigungsstrecke erreichen und damit eine etwas größere Spannung durchlaufen, wodurch es etwas mehr Energie gewinnt. Analog verläuft es im entgegengesetzten Fall. Wenn das Teilchen eine etwas größere Bahn durchläuft, wird das Teilchen etwas weniger Energie gewinnen. Dies führt zu Phasen- bzw. Energieschwingungen, den sogenannten Synchrotronschwingungen. (Ebenso zum Teil zu Schwingungen um die Sollbahn.) DIAGRAMM ZUR PHASENFOKUSSIERUNG EINFUEGEN. D. Bohm und L. Foldy leiteten hierzu die Phasenschwingungsgleichung her, indem sie ausgehend von der Änderung der Amplitude der Energieschwingung pro Umlauf ∆(∆E) = eV (sin ψ − sin ψs ) und folgender Näherung für die Änderung der Winkelgeschwindigkeit (Taylorentwicklung dE in K, das sich nur langsam in t ändert. Exakt gilt dω ω = −K E .) ∆ω ψ̇ ∆E = = −K ωs ωs Es (∆E = E − Es , E legt die Geschwindigkeit fest und über ω = vr auch die Winkelgeschwindigkeit.) unter Elimination von ∆E folgende Differentialgleichung herleiteten: Es d eV ψ̇ + (sin ψ − sin ψs ) = 0. 2 dt ωs K 2π Zusätzlich werden die Teilchen Schwingungen um ihre Sollbahn ausführen, sogenannte Betatronschwingungen, mit denen sich im Abschnitt Fokussierung noch etwas eingehender beschäftigt wird. 32 2.4.1 Synchrotronstrahlung bzw. Leistungsverlust Ein weiteres Problem bei der Beschleunigung geladener Teilchen ist die sogenannte Synchrotronstrahlung. Beschleunigte geladene Teilchen strahlen elektromagnetische Wellen ab und verlieren dadurch Energie. Die abgestrahlte Energie pro Umlauf ist invers proportional zur vierten Potenz der Masse und daher für Elektronen erheblich größer als z.B. für Protonen. Dies ist zu sehen, wenn in P = γ= E m 0 c2 4πα~c γ 4 3 R eingesetzt wird. Herleitung: Energieverlust eines beschleunigten Teilchens (siehe auch Fließbach Band 2) Diese Herleitung wird wiederum im Gaußschen System durchgeführt. Es wird von den retardierten Potentialen für nichtstatische Ladungs- bzw. Stromverteilungen ausgegangen ′ r′ | Z Z ~j ~r′ , t − |~r−~r | ρ ~r′ , t − |~r−~ c c ~ ret (~r, t) = 1 d3 r′ , A . φret (~r, t) = d3 r′ ′ ′ |~r − ~r | c |~r − ~r | Für eine Punktladung auf der Bahn r0 (t) lassen sich Ladungs- und Stromdichte leicht angeben: ~j(~r, t) = q~r˙0 (t)δ(~r − ~r0 (t)). ρ(~r, t) = qδ(~r − ~r0 ), Wir führen die Abkürzung der retardierten Zeit tret = t − |~r − ~r0 (tret )| c und da wir relativistische Teilchen betrachten werden, den Vierervektor des retardierten Ortsvektors des Teilchens (Rα ) R α Rα = = ~ (c(t − tret ), ~r − ~r0 (tret )) = (R, R) 2 2 2 c (t − tret ) − |~r − ~r0 (tret )| = 0. Dies ist ein Lorentzskalar und Rα ist demnach ein lichtartiger Lorentzvektor, für dessen Nullkomponente ~ =R R0 = R0 = c(t − tret ) = |R| gilt. Im Ruhesystem des Teilchens lassen sich die retardierten Potentiale leicht angeben q ~ ′ (~r′ , t′ ) = 0 φ′ret (~r′ , t′ ) = ′ ′ , A R (tret ) und via Lorentztransformation (oder Intuition) zu den Lienard-Wiechert-Potentialen verallgemeinern: α q u Aα (~r, t) = β . u Rβ ret α α Hier ist u die Vierergeschwindigkeit (u ) = γ(c, ~v ) und es ist leicht zu sehen, daß sich dieser Ausdruck im Ruhesystem mi (u′α ) = (c, 0) zur obigen Form vereinfacht. 33 ~ B ~ lassen sich aus Die Felder E, ~ ~ = −∇φ(~ ~ r, t) − 1 ∂ A(~r, t) , E c ∂t ~ =∇ ~ × A(~ ~ r, t) B ~ r, tret ) und ~v = ~v (tret ) gewinnen. Allerdings sind die Potentiale als Funktionen von R(~ gegeben ~ v q q ~ r, t) = φ(~r, t) = , A(~ ~ v ~ ~ v ~ c R − c · R ret R − c · R ret was einiges an Arbeit zur Bestimmung der Ableitungen erfordert. Um die Ableitung ∂tret ∂R ∂ 2 ∂t zu erhalten, werden zunächst ∂tret R und ∂t betrachtet: ∂ R2 ∂tret = = ∂R ∂t ~ ∂R ~ · ∂R = 2R ∂tret ∂tret ∂~ r (t ) 0 ret ˙ ~ ~ ~ −2R · = −2R · ~r0 (tret ) = −2R · ~v ∂tret ret ~ ∂R ∂tret R · ~v ∂tret =− ∂tret ∂t R ∂t ret ~ · ~v 1 R − . R 1 − β~ · ~eR 2R = = ret Mit β~ = ~ v c und ~eR = ~ R R. Da zudem ∂tret ∂R =c 1− ∂t ∂t läßt sich für ∂tret ∂t 1 ∂tret = ~ ∂t 1 − β · ~eR ~ ret . Zunächst wird der Gradient von R schreiben. Etwas aufwendiger wird es für ∇t berechnet: ( ~ 0 = ∇c(t ~ ~ ret ∇R − tret ) = −c∇t ~ ∇R = ~ ~ r − ~r0 (tret )| = R + ∂R ∇t ~ ret = ~eR − ~eR · ~v ∇t ~ ret ∇|~ R ∂tret Gleichsetzen beider Ergebnisse liefert dann ~eR ~ ret = − 1 . ∇t c 1 − β~ · ~eR Mit ∂tret ∂t ∂R ∂t ~eR ~ ret = − 1 ∇t , c 1 − β~ · ~eR 1 ~eR ~ = = −~eR · ~v , ∇R , ~ 1 − β · ~eR 1 − β~ · ~eR = 1 , ~ 1 − β · ~eR 34 sind alle Voraussetzungen geschaffen, um sowohl das elektrische wie das magnetische Feld zu berechnen. Für das elektrische Feld ~ ~ = −∇φ(~ ~ r, t) − 1 ∂ A(~r, t) E c ∂t ergibt sich so " ( ) ~˙ · R ~ 1 ~ e ~ e β ~ e R R R ~ = q E − β~ − β~ 2 + R2 (1 − β~ · ~eR )2 1 − β~ · ~eR 1 − β~ · ~eR 1 − β~ · ~eR )# ( ˙ β~ ~v · (β~ − ~eR ) ~˙ ~ β~ −β·R + − Rc(1 − β~ · ~eR )2 R2 c(1 − β~ · ~eR )2 1 − β~ · ~eR ret " !# 2 ~˙ · ~eR ~ 1−β 1 β ( β − ~ e ) ˙ R ~ − = q (~eR − β) β~ + R2 (1 − β~ · ~eR )3 Rc(1 − β~ · ~eR )2 1 − β~ · ~eR ret " # 1 1 ˙ ~ ~ ~ = q ~eR × [(~eR − β) × β] (~eR − β) + R2 γ 2 (1 − β~ · ~eR )3 Rc(1 − β~ · ~eR )2 ret ˙ Der zweite Term, der von der Beschleunigung β~ abhängt ist derjenige, der für die weiteren Betrachtungen interessant ist. Er ist proportional zu R1 und wird zu einer Energiestromdichte S ∼ R12 führen. Der erstere ergibt das Feld der gleichförmig bewegten Ladung und wird im weiteren vernachlässigt. Das B-Feld ergibt sich in analoger Manier zu ~ = ~eR × E. ~ B Betrachten wir nun nur die Strahlungsanteile der beiden Felder, d.h. den zweiten Term q ˙ ~ ~ ~ str = ~eR × E ~ str ~ B ~eR × [(~eR − β) × β] , Estr = Rc(1 − β~ · ~eR )2 ret und berechnen die radiale Komponente der Energiestromdichte: ~ · ~eR = c ~eR · E ~ ×B ~ S 4π 2 q2 ˙ ~ ~ × β] = ~eR × [(~eR − β) 2 6 ~ 4πR c(1 − β · ~eR ) ret Die abgestrahlte Leistung, d.h. die pro Zeitelement dt abgestrahlte Energie, durch das Flächenelement R2 dΩ ergibt sich dann aus dP dP dΩ ~ · ~eR R2 dΩ = S 2 2 q ˙ ~ × β] ~ ~ · ~eR = ~eR × [(~eR − β) = R2 S 6 ~ 4πc(1 − β · ~eR ) 35 . ret Dies wird nun auf das Zeitelement dtret transformiert, d.h. mit ∂t∂t = ret pliziert, wodurch folgendes grundlegendes Ergebnis erhalten wird: 1 ~ eR 1−β~ multi- 2 dP ∂t q2 dP ′ ~˙ ~ × β] ~eR × [(~eR − β) = = . dΩ dΩ ∂tret 4πc(1 − β~ · ~eR )5 Um den Strahlungsverlust zu erhalten muß diese Formel über den Raumwinkel dΩ integriert werden. Um diesen komplizierten Schritt zu umgehen, nutzen wir aus, daß die abgestrahlte Leistung P ein Lorentzskalar ist und verallgemeinern den nichtrelativistischen Grenzfall. Daß P ein Lorentzskalar ist, läßt sich aus folgender Überlegung einsehen: P ist die elektromagnetische Feldenergie der abgestrahlten Welle pro Zeit , d.h. dx0 . dEstr = P dt = P c Nun sind sowhl dEstr wie dx0 Nullkomponenten eines Vierervektors, woraus folgt, daß Pc ein Lorentzskalar sein muß. Der nichtrelativistische Grenzfall β ≪ 1 läßt sich leicht herleiten, wobei hier der Winkel cos Θ‘ = ~˙ ~ eR · β β̇ benutzt wird. dP dP ′ q2 ˙ 2 2 ′ ~v sin Θ = = dΩ dΩ 4πc3 Wird dies über den Raumwinkel integriert, ergibt sich folgendes Ergebnis: P = 2q 2 ˙ 2 ~v . 3c3 Wie festgestellt ist P ein Lorentzskalar, d.h. wenn dieses Ergebnis in der Art verallgemeinert wird, daß es kovariant bzw. in diesem Falle invariant ist und sich für β ≪ 1 auf obigen Ausdruck reduziert, dann ist das relativistisch richtige Ergebnis gefunden. Die intuitive Erweiterung ist es, ~v˙ durch die Ableitung der Vierergeschwindigkeit nach α der Eigenzeit du dτ zu ersetzen: P = 2q 2 duα duα . 3c3 dτ dτ Wie leicht zu prüfen ist, verhält sich dieses in der Tat wie ein Lorentzskalar und reduziert sich für vc ≪ 1 auf den nichtrelativistischen Ausdruck. Damit ist der relativistisch korrekte Ausdruck für die Strahlungsleistung gefunden. Um diesen in eine verwendbare Form zu bringen, werden die Ableitungen der Vierergeschwindigkeit ausgeführt: d(uα ) dτ = = d(uα ) d ~v · ~v˙ = γ (γc, γ~v ) = γ 4 2 (c, ~v ) + γ 2 (0, ~v˙ ) dt dt c ! 2 ˙ ˙ ~v ~v · ~v ~v · ~v , 2 ~v + 1 − 2 ~v˙ . γ4 c c c γ Dies eingesetzt liefert dann (~v × ~v˙ )2 2q 2 P = 3 γ 6 ~v˙ 2 − 3c c2 36 ! und soll hier für den Spezialfall ~v˙ ⊥ ~v , also den Fall einer Kreisbeschleunigung ausgewertet werden: 2 2q 2 4 d~v 2q 2 6 ˙ 2 ~v 2 ˙ 2 ~ v − = γ ~ v γ P = 3c3 c2 3c3 dt 2 2 2q d~ p = . γ2 3m2 c3 dt Für einen Speicherring mit Radius R0 kann der Betrag der Geschwindigkeit ungefähr konstant und annähernd c angenommen werden. Dann läßt sich die Beschleunigung durch 2 2 d~v = v ≈ c dt R0 R0 annähern und für den Strahlungsverlust ergibt sich P ≈ 2cq 2 γ 4 . 3 R02 0 Wird dies mit der Umlaufzeit T ≈ 2πR multipliziert und schließlich berücksichtigt, c e2 daß im Gaußschen System α = ~c gilt, dann ergibt sich der zu Beginn angegebene Ausdruck für den Energieverlust pro Umlauf: P ≈ 2cq 2 γ 4 2πR0 4πα~c γ 4 = . 3 R02 c 3 R0 Mit der Herleitung des Strahlenverlustes pro Umlauf endet dieser Abschnitt und es wird sich im weiteren mit der Strahlfokussierung beschäftigt. Anmerkung: Die sogenannte Synchrotronstrahlung, die in der Teilchenphysik eher ein störender Nebeneffekt der Beschleunigung geladener Teilchen ist, ist z.B. in der Oberflächenphysik ein sehr begehrtes Hilfsmittel. Kleinere Kreisbeschleuniger werden seit einigen Jahren mehr oder weniger als reine Synchrotronstrahlungsquellen verwendet. Z.B. in Grenoble oder im Hasylab am Desy. Als Quelle werden dort nicht nur die kreisförmigen Ablenkstrecken sondern spezielle Magnetanordnungen verwendet, sogenannte “Wiggler” oder “Undulatoren”. Sie unterscheiden sich durch die Stärke der Auslenkung der Teilchen, d.h. auch in der Stärke der Magnetfelder und liefern dadurch unterschiedliche Synchrotronstrahlungsspektren. Letztere werden eingesetzt, um ein schmales brillantes Spektrum zu erhalten, erstere für ein den Ablenkmagneten ähnliches breites Spektrum. In modernen Synchrotronstrahlungsquellen werden fast nur noch Undulatoren eingesetzt. Eine weitere Weiterentwicklung ist dann der freie Elektronenlaser. Hier wird ein Undulator von großer Länge verwendet, L ∼ 100 m, und es kommt zu Wechselwirkung der Synchrotronstrahlung mit den Teilchenpaketen. (Dies bedürfte dann allerdings wiederum einer eigenen Vorlesung.) 2.4.2 Fokussierung Zu Beginn dieses Kapitels wurde bereits die Synchrotronschwingung betrachtet. Eine Phasen- bzw. Energieschwingung, die mit den unterschiedlichen Umlaufzeiten von Teilchen auf Bahnen mit unterschiedlichen Radien zusammenhängt. (Teilchen mit größeren Impuls laufen auf Bahnen mit größeren Radius um und brauchen daher ein wenig länger 37 Abbildung 9: Schematischer Aufbau eines Undulators für den Umlauf. Dies führt dazu, daß sie zu einer späteren Phase in der Beschleunigungsstrecke eintreffen und daher einen geringeren Energiezuwachs erfahren. Umgekehrt gilt dies für die Teilchen mit kleineren Impuls.) Siehe hierzu auch “The Theory of the Synchrotron“ von D. Bohm und L. Foldy. Für Kreisbeschleuniger führte eine leichte Abweichung des Teilchenstrahls vom Sollradius ohne einen fokussierenden Mechanismus schnell dazu, daß man den Strahl verlöre. Daher wurde, wie an sich schon bei den Zyklotrons, was wir dort aber nicht behandelten, ein radial abnehmendes Magnetfeld zur Fokussierung verwendet. Ein solches Magnetfeld ~ r ∂|B| führt, wenn es sich wie r1n mit 0 < n < 1 verhält, d.h. 0 > |B| ~ ∂r > −1, Herlei- tung siehe Übungen, zu Schwingungen um die Sollbahn und damit, wenn die Amplitude nicht zu groß wird bzw. das Strahlrohr groß genug ist, zu Strahlstabilität. Diese Bedingung für die Strahlstabilität wurde zuerst bei der Konstruktion des Betatrons vollständig behandelt, daher werden die Schwingungen Betatronschwingungen genannt. Die Differentialgleichungen für diese lauten (∆R̈) + Ė (∆Ṙ) + ωs2 (1 − n)∆R E Ė z̈ + ż + nωs2 z E = 0, = 0, wobei die nichtrelativistischen Terme, 1. und 3. Term, in den Übungen hergeleitet werden. Der zweite Term folgt aus d~ p d(γm0~v ) 1 d(E~v ) 1 = = 2 = 2 (Ė~v + E~v˙ ) dt dt c dt c und die gesamte DGL ergibt sich, wenn für die Zentripetalkraft FZentripetal = γm0 v2 r berücksichtigt wird. Der Fokussierungsmechanismus wird schwache Fokussierung genannt im Gegensatz zur 38 starken Fokussierung, die in de facto allen modernen Beschleunigern zum Einsatz kommt und die im Folgenden kurz heuristisch erläutert wird. Die Theorie wurde erstmals 1953 von Ernest David Courant, Milton Stanley Livingston und Hartland Sweet Snyder entwickelt und 1954 in Cornell praktisch demonstriert. Die Idee basiert auf magnetischen Quadrupolfeldern, die jeweils in eine Richtung fokussierend in die andere defokussierend wirken. Von diesen werden wie in einem Linsensystem mehrere hintereinander aufgestellt, um so eine effektive Fokussierung in beiden Richtungen senkrecht zur Strahlachse zu erreichen. Es lohnt sich ein etwas genauerer Blick: Nebenstehend ist ein Quadrupolmagnet samt Feldlinien skizziert. Werden die Eisenoberflächen als magnetische Äquipotentialflächen angesehen, was bei nicht zu großen Feldstärken möglich ist, steigen die Feldkomponenten in x- und y-Richtung linear an, unter der Annahme, daß die z-Richtung senkrecht zur Zeichenebene steht. Bx = gy By = gx Das B-Feld in z-Richtung hingegen verschwindet Bz = 0. Die fokussierende Wirkung dieses Feldes in eine und defokussierende in die andere Richtung ergibt sich aus der Lorentzkraft ~ F~ = e(~v × B) aus welcher Fx = −ecBy Fy = ecBx folgt, wenn die Geschwindigkeit in z-Richtung vz = c genähert wird. Hieraus läßt sich unmittelbar die Bewegungsgleichungen dpx = −ecgx dt dpy = ecgy dt dy ′ herleiten. Die Steigung der Bahnen in x- bzw. y-Richtung, x′ = dx dz , y = dz wird durch px py vx vy vz , vz gegeben. Dies kann für kleine Steigungen durch |~ p| , |~ p| angenähert werden. Zudem kann unter der Annahme, daß vz ≈ c und daß eine vorhandene Kraft in z-Richtung im Quadrupolmagneten die Geschwindigkeit nicht maßgeblich ändert, dt durch dz c ersetzt werden. Daraus folgen Bahngleichungen für die x- und y-Koordinate: x′′ = y ′′ = eg dx′ = − x = −kx, dz |~ p| dy ′ eg = y = ky, dz |~ p| eg wobei die Quadrupolstärke k = |~ p| eingeführt wurde. Solche Differentialgleichungen liefern für k > 0 Schwingungslösungen in x-Richtung, damit Fokussierung und Exponen- 39 tiallösungen in y-Richtung und damit Defokussierung. Wird das Quadrupolfeld als unabhängig von der z-Koordinate angenommen und werden Randeffekte vernachlässigt, können die Lösungen innerhalb des Quadrupols leicht angegeben werden x = x′ = y = y′ = p x′ |k|z) + p 0 sin( |k|z), |k| p p p −x0 |k| sin( |k|z) + x′0 cos( |k|z), p p y′ y0 cosh( |k|z) + p 0 sinh( |k|z), |k| p p p y0 |k| sinh( |k|z) + y0′ cosh( |k|z), x0 cos( p wobei x0 , x′0 bzw. y0 , y0′ Ort und Steigung der Bahn beim Eintritt in den Quadrupol angeben. Nehmen wir die Länge L für den Quadrupol an, dann liefert dies die Ortskoordinate und Steigung am Ende des Magneten: x = x′ = y = y′ = x′ x0 cos Ω + p 0 sin Ω, |k| p −x0 |k| sin Ω + x′0 cos Ω, y′ y0 cosh Ω + p 0 sinh Ω, |k| p y0 |k| sinh Ω + y0′ cosh Ω, Ω= p |k|L. Solche Beziehungen lassen sich äquivalent in Matrixform schreiben x0 x = M x′ x′0 und es werden die Matrizen für einen fokussierenden Quadrupol ! √1 sin Ω cos Ω |k| MF = p cos Ω − |k| sin Ω einen defokussierenden MD = und für eine feldfreie Region √1 sinh Ω cosh Ω p |k| |k| sinh Ω M0 = 1 0 cosh Ω l 1 ! eingeführt. Letztere beschreibt zum Beispiel die Strecken zwischen zwei Quadrupolen, aber auch abgesehen von der schwachen Fokussierung die Ablenkmagnete, wobei hier Ort und Steigung relativ zu einer gekrümmten Sollbahn angegeben werden müssen. x0 + lx′0 x0 1 l x = = x′0 x′0 0 1 x′ Auf diese Weise können im Prinzip beliebige Folgen von fokussierenden und defokussierenden Elementen durch einfache Matrixmultiplikation beschrieben werden. Mittels der 40 Aufteilung eines Quadrupols in Teilstücke kann aber auch die Bahn durch einen solchen beschrieben werden und es können auf diese Weise zum Beispiel Effekte an den Rändern der Magnete berechnet werden. Eine übliche Kombination aus einem fokussierenden Element, einer freien Strecke und einem defokussierenden Element (In der jeweils senkrecht zu dieser liegenden Koordinate drehte sich die Reihenfolge genau um.) beschriebe man dann durch MF OD = MD M0 MF . Die Analogie zu Linsensystemen liegt auf der Hand. In der hier vorgenommenen Näherung sind die Ausgangskoordinaten lineare Funktionen der Eingangskoordinaten und der Eingangssteigung xf = Axi + Bx′i mit A und B den Elementen der ersten Zeile einer der Transfermatrizen. In der Optik wird eine Abbildung nun dadurch definiert, daß alle Strahlen, die von einem Punkt ausgehen, auch wieder in einem Punkt zusammentreffen. Dies heißt jedoch nichts anderes als daß B verschwindet, da dann die Ausgangskoordinate nur von der Eingangskoordinate, nicht jedoch von der Steigung abhängt. Durch eine geeignete Kombination von fokussierenden und defokussierenden Quadrupolen läßt sich genau dies erreichen. Dazu mehr in den Übungen. Mittels der bis hier angegebenen Beziehungen ließe sich prinzipiell jede Teilchenbahn in einem Beschleuniger näherungsweise berechnen. Dies erweist sich jedoch als sehr aufwendig. Courant und Snyder lösten dies Problem 1953 in einer privaten Note, die 1958 in erweiterter Form veröffentlicht wurde, indem sie die Bahngleichung in einem Kreisbeschleuniger x′′ (s) + k(s)x(s) = 0 eine DGL vom Hillschen Typ mit einer Quadrupolstärke, die entlang der Bahn variiert und für einen Kreisbeschleuniger eine periodische Funktion ist, lösten. s gibt hier die Koordinate entlang der Sollbahn an. Obige Gleichung beschreibt nur Teilchen mit gleip| chen Impulsen, aber eine Verallgemeinerung auf ∆|~ |~ p| 6= 0 ist möglich. Ihre Lösung lautet: (HERLEITUNG EVENTUELL ANGEBEN!) p x(s) = ǫβ(s) cos(ψ(s) + φ). ǫ und φ sind Integrationskonstanten. ψ(s) wird aus β(s) über Z s dσ ψ(s) = β(σ) 0 berechnet. Ein wichtiger p Punkt ist nun, daß die einhüllende aller möglichen Bahnen x(s) durch die Funktion ǫβ(s) gegeben ist, da der Kosinus stets kleiner oder gleich eins ist. Wird diese für eine Sollbahn berechnet, so kann daraus die benötigte Größe des Strahlrohrs bestimmt werden. Einige Bemerkungen zum Abschluß: Ändert sich ψ(s) um 2π so entspricht dies genau einer Betatronschwingung. Bei dem Bau eines Ringbeschleunigers muß darauf geachtet werden, daß die Anzahl Betatronschwingungen, die pro Umlauf stattfinden, keine ganze Zahl ist 1 ∐β = 2π Z s+L s 41 dσ ∈ /N β(σ) da sich sonst Betatronresonanzen ergeben. Ein Teilchen kommt wieder an seine ursprüngliche Position mit gleichem Winkel zurück, wodurch sich Magnetfehler aufaddieren und sich die Schwingungsamplitude vergrößern wird, bis das Teilchen verlorengeht. Für eine genauere Behandlung der Betatronschwingungen wie auch der Beschleunigerphysik insgesamt sei auf http://tulectures.web.cern.ch/tulectures/ verwiesen. Die Konstante ǫ p| läßt sich wie folgt interpretieren: Für ∆|~ |~ p| 6= 0 füllen die Teilchen des Strahls an jedem ′ Punkt der Bahn eine Fläche in der x − x -Ebene aus. Dies ist die sogenannte Phasenraumellipse, Phasenraum, da x′ ∼ px . Eine genauere Betrachtung der Hillschen Differentialgleichung lieferte nun, daß die sogenannte Emittanz ǫ mit der Fläche A dieser Ellipse verbunden ist: A ǫ= . π Nach dem Liouvilleschen Satz bleibt die Fläche der Phasenraumellipse für ein Ensemble von Teilchen während einer Bahnbewegung unter dem Einfluß konservativer Kräfte konstant. Daher ändert sich die Emittanz durch die Quadrupollinsen nicht, nur die Form der Ellipse wird beeinflußt. Eine Ausnahme bildet die sogenannte stochastische Kühlung. Diese wird vorwiegend zur Fokussierung von Antiprotonstrahlen verwendet. Sie basiert auf folgendem Prinzip: Es wird die Abweichung der Teilchenbahn vom Sollwert gemessen, um bei großen Abweichungen einen Kickermagneten zu aktivieren, der an einem späteren Punkt für eine zusätzliche Winkelablenkung sorgt. Hier muß darauf geachtet werden, daß das Signal schneller beim Magneten ist, als die umlaufenden Teilchen. Ein Kickermagnet ist im Prinzip ein Dipolmagnet, der innerhalb sehr kurzer Zeit sein Ablenkmagnetfeld aufbaut, um nur ein Teilchenpaket abzulenken. Dieser wird außer in der stochastischen Kühlung auch z.B. in der Injektion verwendet und stellt kein konservatives System dar, daher kann durch die stochastische Kühlung die Emittanz verkleinert werden. Zu den Anfang des Kapitels erwähnten Phasenschwingungen läßt sich noch anmerken, daß sich die Konstante K aus dem Impulskompressionsfaktor (Siehe hierzu z.B. obige Vorlesung.) α= dp ps ds s mit ps dem Impuls auf der Sollbahn und s der Strecke zwischen zwei aufeinanderfolgenden Beschleunigungen zu c2 K = 1 + (α − 1) 2 vs bestimmen läßt, wobei hier vs die Geschwindigkeit auf der Sollbahn ist. Für Synchrotrons 1 > 1 womit K immer das gleiche Vorzeichen mit schwacher Fokussierung gilt α = 1−n behält. Im Falle von starker Fokussierung gilt allerdings α < 1 und damit wird es eine kritische Energie geben, für die K = 0 gilt und für die sich demnach Schwierigkeiten mit der Phasenstabilität ergeben werden. (Siehe DGL am Anfang dieses Kapitels.) Diese Problematik wurde in den fünfziger Jahren diskutiert und es sei daher auf die entsprechende Literatur verwiesen. Z.B. “Über die Phasenschwingungen beim Synchrotron mit starker Fokussierung” E. Bodenstedt Annalen der Physik. 6. Folge. Band 15 (1954) Am Tevatron wird dieses Problem im Hauptring schlicht dadurch umgangen, daß man die Teilchen mit Energien über der kritischen Energie injeziert. Ein weiterer Punkt, der hier nur kurz erwähnt werden soll, ist die Verwendung von Sextupolmagneten, um Teilchen zu fokussieren, die aufgrund ihres unterschiedlichen Impulses in einem Quadrupol 42 in Flugrichtung defokussiert wurden. (Dieser Effekt wurde hier vernachlässigt.) Trivia: Ein jenseits der Medizin, Teilchen- oder Oberflächenphysik immer wieder diskutiertes Anwendungsgebiet von Teilchenbeschleunigern stellt die Umwandlung radioaktiven Mülls durch Transmutation, meist Neutronenbeschuß dar. Speicherringe, die in dieser Behandlung nicht näher erklärt wurden, basieren auf dem Prinzip des Synchrotrons, werden jedoch zum akkumulieren höherer Ströme in Colliderexperimenten verwendet. (Die Abgrenzung zwischen Synchrotron und Speicherring ist nicht wirklich scharf, so ist zum Beispiel der Tevatron-Ring ein Speicherring, nutzt aber dennoch das gleiche Beschleunigungsprinzip wie ein Synchrotron, um die Energie von 150 GeV auf 980 GeV zu erhöhen.) 3 Detektoren Wechselwirkung von Strahlung in Materie, All or Nothing, Many Small Interactions 4π-Detektoren, Aufbau und Funktion der verschiedenen Schichten Energie und Impulsbestimmung in elektrischen und magnetischen Feldern Zu diesem Teilgebiet gibt es wiederum eigene ausgezeichnete Lehrbücher, so z.B.: C. Grupen, “Teilchendetektoren” Spektrum akademischer Verlag, 1998 K. Kleinknecht “Detektoren für Teilchenstrahlung”, Vieweg+Teubner, 2005 In dieser Vorlesung kann leider nur ein kurzer Einblick in die Detektorphysik gegeben und es muß in vielen Fällen auf ausführliche Herleitungen verzichtet werden. Trivia: Unter http://atlas-live.cern.ch/, http://cms.web.cern.ch/cms/FireworksLive.html, http://cdsweb.cern.ch/record/1305399 und http://lhcb-public.web.cern.ch/lhcbpublic/en/Collaboration/LHCbEvDis.html lassen sich Ereignisse der vier LHCDetektoren ansehen. Es können nur die Grundgedanken der Detektorphysik und die Prinizpien einiger grundlegender Detektortypen dargelegt werden. Zudem wird es einen kurzen Einblick in moderne Experimente am LHC bzw. Tevatron geben. Was sind die Anforderungen an einen Detektor an einem Collider-Experiment? Teilchenidentifikation, d.h. Masse, Spin, Lebensdauer, Energie- bzw. Impulsmessung zur Bestimmung eventueller Mutterteilchen über die invariante Masse und gemeinsam für die Identifikation notwendig, um die Masse zu bestimmen, hohe Ortsauflösung zur Spurmessung für die Vertexidentifikation aber auch für die Impulsbestimmung, kurze Totzeit insbesondere am LHC sowie zur Bestimmung der Winkelverteilung möglichst eine 4πAbdeckung. Dementsprechend sind fast alle modernen Detektoren an Speicherringen wie Zwiebeln in mehreren Schichten aufgebaut, von denen jede seine eigene Funktion hat. Zu Demonstrationszwecken sind hier die bekanntesten und größten vier Experimente am LHC, LHCb, ALICE, CMS und Atlas, dargestellt. An den Darstellungen von CMS und Atlas läßt sich sehr schön die Struktur eines modernen 4π-Detektors erkennen. Auf die einzelnen Komponenten soll im weiteren noch ein wenig eingegangen werden. (Sehr zu empfehlen sind in diesem Zusammenhang die Webseiten der Experimente: http://lhcbpublic.web.cern.ch/lhcb-public/Welcome.html, http://aliceinfo.cern.ch/Public/Welcome.html, http://cms.web.cern.ch/cms/index.html, http://www.atlas.ch/) Der Aufbau von Innen nach Außen ist in Abbildung 12 schematisch dargestellt. Im Herzen der Detektoren und dem Wechselwirkungspunkt am nächsten (CMS: Abstand 4 cm, 7 cm, 11 cm Atlas: Abstand 5 cm, 9 cm, 12 cm.) Abstand befindet sich ein Vertexdetektor bzw. ein Pixeldetek43 Abbildung 10: Schematische Darstellung der kleineren Experimente: Links der LHCbDetektor, rechts ALICE tor. Dieser wird auf eine hohe Ortsauflösung in der r − φ-Ebene optimiert (CMS ∼ 10 µm, Atlas ∼ 12 µm). Hauptsächlich um eine Rekonstruktion des Wechselwirkungspunktes oder eventueller sekundärer Wechselwirkungspunkte durch den Zerfall “langlebiger” Teilchen zu erreichen (woraus über ∆s = τ die Lebenszeit τ ermittelt werden kann, wenn ∆s der Abstand von primären und sekundären Vertex ist.), aber auch um erste Punkte mit geringen Fehler für die Spur eines Teilchens durch den Detektor zu erhalten. Um den Vertexdetektor befindet sich die sogenannte Spurkammer, die wie ihr Name bereits ausdrückt dafür da ist, eine möglichst genaue Rekonstruktion der Bahn des Teilchens zu erhalten. Auch hier wird wiederum auf Ortsauflösung optimiert, wobei die Kosten einen stark begrenzenden Faktor darstellen, und es wird ein größeres Volumen ausgefüllt um mehrere Bahnpunkte zu erhalten. (Atlas benutzt einen inneren Spurdetektor auf SiliziumBasis ∼ 17 µm Auflösung bis 52 cm Radius und einen äußeren Spurdetektor, der mit Straw-Detektoren (Driftkammern) arbeitet bis 106 cm Radius und 170 µm Auflösung. CMS benutzt den größten bisher gebauten Siliziumstreifendetektor bis 130 cm Radius.) Beide inneren Detektoren befinden sich innerhalb eines Magnetfeldes, welches in z-Richtung steht und somit die Bahnen je nach Impuls senkrecht zur Strahlachse und Ladung krümmt. Aus dem Bahnradius kann via R= pT ~ e|B| ein Rückschluß auf den transversalen Impuls pT gezogen werden. In der z − θ-Ebene sind die Bahnen Geraden und nach Messung des Polarwinkels θ läßt sich über |~ p| = pT sin θ der Betrag des Gesamtimpulses bestimmen. In R. L. Glückstein Uncertainties in Track Momentum and Direction, due to multiple ” Scattering and Measurement Errors“, Nuclear Instruments and Methods 24 (1963) wird gezeigt, wie sich die Unsicherheit σy von einzelnen Ortsmessungen senkrecht zum Magnetfeld auf die Unsicherheit des Krümmungsradius auswirkt. Das Ergebnis für N ≥ 10 äquidistante Meßpunkte lautet (HIER EBENFALL UEBER EINE HERLEITUNG NACHDENKEN!) r 720 σy 1 = 2 σ R L N +4 44 Abbildung 11: Die beiden großen Experimente: Oben CMS, unten Atlas und läßt sich via Fehlerfortpflanzung in den Fehler der Transversalimpulsmessung überführen: r 720 σ (pT ) σ y pT = . ~ 2 N +4 pT e|B|L In die Impulsbestimmung spielte noch der Fehler σθ für die Polarwinkelmessung mit rein. Dieser kann aus dem Meßfehler der y-Koordinate, der entlang der Spur gemessenen Punkte, extrahiert werden und wird in Glückstein mit s σz 12(N − 1) σθ = L N (N + 1) angegeben. Vernachlässigt wurden bisher Effekte, die durch Vielfachstreuung des Teilchens im Detektor auftreten. Diese werden ebenfalls in Glückstein behandelt und ergeben sich wiederum für eine große Anzahl N ≥ 10 äquidistanter Punkte zu: r σpV S 0.05 L = 1.43 ~ pT X 0 |B|L r L 0.015 σθV S = √ 3|~ p| X 0 mit X0 der mittleren Strahlungslänge des Teilchens im durchquerten Material. (Vorsicht: √ Für die numerische Auswertung muß e = 0.3 eingesetzt werden e = 4πα. Kleinknecht 45 Abbildung 12: Schematische Darstellung der Schichten des CMS- und des Atlas-Detektors gibt die gleichen Ergebnisse für die verschiedenen Unsicherheiten an.) Interessant hierbei ist, daß, wenn die Ortsauflösung als dominierender Beitrag angenommen wird, sich die 1 Impulsunsicherheit wie |B|L ~ 2 verhält, wohingegen die Anzahl der Meßpunkte N nur mit √1 N eingeht. Die größe des Spurdetektors und die Stärke des Magnetfeldes bilden demnach neben der Ortsauflösung entscheidende Größen für die Impulsauflösung des inneren Detektors. Auf die Spurkammer folgen elektromagnetische und hadronische Kalorimeter. Diese messen über die in ihnen deponierte Energie die kinetische Energie der Teilchen, woraus, wenn der Impuls gemessen ist, über (Ekin + m0 )2 = m0 = p~2 + m20 Ekin |~ p |2 − 2Ekin 2 die Masse bestimmt werden kann. Um die dahinterstehenden Prozesse ein wenig zu verstehen, werden wir uns im nächsten Abschnitt kurz mit der Wechselwirkung von Strahlung in Materie beschäftigen. Die äußerste Detektorschicht bilden die Myonkammern. Myonen sind Leptonen, schwere Verwandte des Elektrons und nehmen nicht an der starken Wechselwirkung teil. Sie bilden, da sie beinahe 200 mal schwerer als Elektronen sind, kaum elektromagnetische Schauern, da der Energieverlust durch Bremsstrahlung, wie im Kapitel über Strahlungsverluste hergeleitet, proportional zu m14 ist. Somit verlieren sie 46 Energie fast nur durch Ionisations- und Anregungsprozesse und durchdringen daher zumeist die Kalorimeter. Die Myonkammern dienen dann der Identifikation und zumal der genauen Impulsbestimmung. 3.1 Wechselwirkung von Strahlung in Materie Wir unterscheiden grob zwei Szenarien: Szenario 1: All or Nothing“ (AON) Ein Teilchen verliert bei der Streuung mehr ” oder weniger seine gesamte Energie oder es passiert nichts – typische Teilchenvertreter: Photonen Szenario 2: Many Small Interactions“ (MSI) Ein Teilchen verliert in vielen kleinen ” Streuungen Energie und wird bei jeder Streuung leicht abgelenkt – typische Teilchenvertreter: schwere geladene Teilchen Elektronen fallen zwischen diese beiden Extreme, da bei ihnen zusätzlich zum Energieverlust durch Ionisierung bzw. Anregung des Detektormaterials Bremsstrahlung als dominanter Effekt hinzu kommt. Der Energieverlust schwerer, geladener Teilchen in Materie wird durch die Bethe-Bloch Formel beschrieben. (An sich ist diese Bezeichnung irreführend, da Bloch 1933 nur das effektive Ionisationspotential I betrachtet hat. Man findet sie auch häufig nur unter dem Namen Bethe-Formel. Hans Bethe leitete 1930 die nichtrelativistische 1932 die relativistische Form her.) 2me c2 β 2 4πre2 me c2 ρN0 Zz 2 dE 2 log = −β − dx Aβ 2 I(1 − β 2 ) Hier sind re der klassische Elektronenradius, N0 die Avogadro-Zahl, z die Ladungszahl des einfallenden Teilchens, Z und A die Ladungs- bzw. Massenzahl des Absorber- bzw. Detektormaterials ρ dessen Dichte und I das effektive Ionisationspotential. In der Praxis wird zumeist der spezifische Energieverlust ρ1 dE dx benötigt. Spätere Rechnungen z.B. von Allison und Cobb 1980, führten auf Korrekturterme, die bei hohen bzw. niedrigen Energien relevant sind. 2me c2 β 2 4πre2 me c2 ρN0 Zz 2 δ(β) C dE 2 log = −β − − − dx Aβ 2 I(1 − β 2 ) 2 Z Dabei gibt δ(β) eine Dichtekorrektur, die klassisch mit dem Anwachsen der transversalen Komponenten des elektrischen Feldes zusammenhängt und wichtig für hohe Energien ist. Dichtekorrektur wird diese genannt, da der Effekt groß wird, wenn die Ausdehnung des transversalen Feldes von der Größenordnung der Atomabstände wird. Durch Polarisationseffekte wird das Feld abgeschirmt und es tritt eine Sättigung auf. Dieses Sättiungsplateau wird für Festkörper und Gase bei 1 dE 1 dE ∼ 1.05 − 1.1 ρ dx β→1 ρ dx M IP 1 dE 1 dE ∼ 1.5 ρ dx β→1 ρ dx M IP 47 erreicht. Der Index M IP gibt dabei den Ort des minimalen Energieverlustes an. Siehe unten. C Z sind hingegen Schalenkorrekturen, die für kleine Energien relevant sind. Klein heißt hier, sie geben etwa eine 1 %-Korrektur bei βγ = 0.3. Mit diesen Korrekturen ist die Bethe-Bloch Formel über einen Energiebereich von etwa 6 M eV < E < 6 GeV gültig. 48 Exkurs: Semiklassische Herleitung der Bethe-Bloch Formel aus Rutherford- bzw. Mott-Querschnitt. Diese Herleitung ergibt die Bethe-Bloch Formel bis auf einen Faktor 2 und die Korrekturterme. Der Faktor 2 folgt daraus, daß dies nur eine semiklassische Herleitung darstellt und quantenmechanische Effekte außer des Spins für ein freies Elektron vernachlässigt werden. Ausgangspunkt soll zunächst der rutherfordsche Streuquerschnitt in leicht abgewandelter Notation sein, d.h. es wird angenommen, dass die Energie des einlaufenden Teilchens so groß ist, dass die Bindungsenergie des Elektrons vernachlässigbar ist und die Streuung an einem quasifreien Teilchen stattfindet: dσ = dΩ z e2 2P ν 2 1 sin 4 Θ 2 , wobei ν = cβ die Geschwindigkeit und P = γβme c der Impuls des Elektrons im Ruhesystem des einlaufenden Teilchen sind. Wir bringen den Wirkungsquerschnitt auf eine lorentzinvariante Form, indem wir das Quadrat des Impulsübertrages Q2 einführen. Für elastische Streuung, die im Weiteren angenommen werden soll, ergibt sich kein Energieübertrag E = E ′ und demnach Q2 = (P − P′ )2 = P2 + P′2 − 2|P||P′ | cos Θ = 2P2 (1 − cos Θ) Θ = 4P2 sin2 2 Im Ruhesystem des einlaufenden Teilchens gilt zudem |P| = P = |P′ | = P ′ . Um die Abhängigkeit des Wirkungsquerschnittes von Q2 zu erhalten, leiten wir Q2 nach Θ ab dQ2 Θ Θ = 4P2 sin cos = 2P2 sin Θ dΘ 2 2 und setzen dies in den Wirkungsquerschnitt dσ = 2π dΘ ze2 2P ν 2 sin Θ sin4 Θ 2 ein. Hier wurde bereits beücksichtigt, dass das Coulombfeld radialsymmetrisch ist und demnach keine Abhängigkeit vom Azimutwinkel φ bestehen kann. Man erhält: dσ =π dQ2 ze2 2 2P ν sin2 Θ 2 !2 = 4π ze2 νQ2 2 . Wird das Quadrat der Masse des Elektrons vernachlässigt, ergibt sich im Ruhesystem des Elektrons Q2 = −(P − P ′ )2 ≈ 2P · P ′ = 2(q + P ) · P ≈ 2q · P = 2(k ′ − k) · P = 2me T, wobei hier Viervektoren verwendet wurden und k, k ′ die Impulse des einlaufenden Teilchens, q 2 = −Q2 , P, P ′ die Impulse des Elektrons und T den Energieverlust des einlaufenden Teilchens darstellen. Wiederum eingesetzt, wird der Wirkungsquerschnitt zu z 2 e4 dσ = 2π49 2 2 , dT me ν T wobei T zwischen Tmin und Tmax liegen muß. Tmin ist dabei gegeben durch die mittlere Bindungsenergie I des Elektrons im Material, Tmax kann aus der Kinematik des frontalen Stoßes hergeleitet werden. Im Ruhesystem R des einlaufenden Teilchens gilt für das Elektron nach dem Stoß ′ ER = ER = γme c2 und PR = −PR′ = γνme . Dies läßt sich via einer Lorentztransformation ins Laborsystem L übersetzen: Tmax = = = = EL′ − EL ′ γ(ER − νPR′ ) − γ(ER − νPR ) 2 2 2γ ν me 2P 2 me Wird der Spin des Elektrons berücksichtig, so ergibt sich statt des Rutherford- der Mott-Streuquerschnitt, d.h. es wird der Korrekturfaktor 1 − β 2 sin2 Θ 2 benötigt. Dieser wird so umgeformt, dass die Abhängigkeit von T und Tmax offensichtlich wird: 1 − β 2 sin2 Θ 2 = = = Q2 , 4P 2 2me T 1 − β2 , 4P 2 T 1 − β2 . Tmax 1 − β2 Damit ergibt sich der Mott-Querschnitt zu z 2 e4 dσ = 2π dT me c 2 β 2 T 2 1 − β2 T Tmax und um den Energieverlust des einlaufenden Teilchens pro Längeneinheit zu erhalten muß dieser mit T , der Atomdichte N sowie der Anzahl Z der Elektronen pro Atom multipliziert werden und über T integriert werden. Diese Schritte liefern dE dx = = = ≈ 2N Z Z Tmax dT t I dσ dT Z Tmax z 2 e4 1 2 1 dT − β me c 2 β 2 I T Tmax 2 2 2 4 2mγ ν I z e 2 log 1 − − β 4πN Z me c 2 β 2 I Tmax 2 2 2 4 2mγ ν z e log − β2 . 4πN Z me c 2 β 2 I 4πN Z Ein Faktor 2, der aus quantenmechanischen Effekten in der Bindung der Elektronen, und die zusätzlich angegebenen Korrekturen können auf diesem stark vereinfachtem Wege natürlich nicht hergeleitet werden, aber man erhält bereits ein gutes Bild des funktionalen Verhaltens des Energieverlustes schwerer Teilchen in Materie. 50 Einige wichtige Punkte lassen sich aus der Bethe-Bloch Formel ablesen: Der Energieverlust ist näherungsweise unabhängig von der Masse des Projektils, womit oben getätigte Aussage, daß die in den Kalorimetern deponierte Energie proportional zur kinetischen Energie des Projektilteilchens ist, bestätigt wird. Dies läßt sich wie bereits erwähnt zur Teilchenidentifikation nutzen. Im Bereich kleiner Energien fällt der Energieverlust etwa mit β12 . Es existiert ein Ionisationsminimum bei ca. βγ ∼ 3 − 4 wonach der Energieverlust wieder loga- Spezifischer Energieverlust für verschiedene Materialien. rithmisch ansteigt. Dieser Anstieg ist zunächst sehr flach, daher werden Teilchen mit Energien im und leicht oberhalb des Minimums als minimal ionisierende Teilchen (minimal ionizing particles, MIPs) bezeichnet. Als Näherung läßt sich für solche Teilchen die Formel − M eV 1 dE = 1.5 ρ dx gcm−2 Für sehr hohe Energien wird je nach Projektilart, Bremsstrahlung relevant, die von der Bethe-Bloch Formel nicht beschrieben wird. Für Elektronen ist dies aufgrund der geringen Masse bereits für sehr niedrige Energien der Fall, weswegen für Elektronen ein modifizierter Ansatz benötigt wird. Für reelle Detektoren liegen Gemische verschiedener Materialien vor, daher muß dort eine Wichtung hinsichtlich der verschiedenen Elektronenzahlen vorgenommen werden. (In der Bethe-Bloch Formel sind nur die Elektronen im Material relevant.) Elektronen, die durch Ionisation aus der Elektronenhülle entfernt werden, können, wenn Sie zuviel Energie erhalten, den Detektor verlassen. (In jedem Falle können sie jedoch eigene Ionisationsspuren bilden.) In diesem Falle kann z.B. ein Cut-off in die Bethe-Bloch Formel eingeführt werden: Tupper C 4πre2 me c2 ρN0 Zz 2 1 2me c2 β 2 Tupper δ(β) dE 2 1+ − = log −β − − dx Aβ 2 2 I 2 (1 − β 2 ) 2 TCut Z mit Tupper = min (TCut , Tmax ). In diesem Zusammenhang sollte noch erwähnt werden, daß der Logarithmus der Bethe-Bloch Formel eigentlich 2me c2 β 2 Tupper 1 log 2 I 2 (1 − β 2 ) mit Tmax = 2me c2 β 2 γ 2 1+ e 2γ m M + me 2 M ≈ 2me c2 β 2 γ 2 für γme ≪ M mit M der Projektilmasse lautet. Tmax ist dabei die maximal auf ein Elektron übertragbare kinetische Energie. Daraus ist auch schon ersichtlich, daß die Bethe-Bloch Formel in obiger Näherung für sehr große Energien nicht gültig sein kann. R Die mittlere Reichweite eines Teilchens in Materie M ergibt sich durch Integration der Bethe-Bloch Formel: Z 0 ρdx R= dE. E dE 51 Für die Reichweite in Metern muß dies noch durch die Dichte geteilt werden. Zwei Beispiele hierzu: Wir betrachten jeweils Teilchen mit einem Impuls |~ p| ∼ 1 GeV , die sich in Blei bewegen. Myonen haben dann eine mittlere Reichweite von R g = 7000 2 , M cm GeV ds = 64 cm Für Protonen ergibt sich R g = 220 2 , M cm GeV ds = 18 cm Abschließende Bemerkungen: Die Gesamtanzahl der freigesetzten Ionen nT , auch durch sekundäre Elektronen, ist proportional zum Energieverlust des Projektils nT = ∆E , Wi wobei Wi den Energieverlust pro produziertem Ionenpaar angibt. Dieser ist Materialabhängig (Ionisationsenergie) und kann als Maß für die relative Energieauflösung eines Detektors angesehen werden. Sie liegt bei etwa 41 eV für Helium, bei ca 22 eV für Xenon. In Halbleitern ist diese Energie sehr gering 3.5 eV für Silizium und 2.85 eV für Germanium, noch geringer für dotierte Halbleiter. Damit läßt sich mittels Halbleiterdetektoren eine sehr hohe Energieauflösung realisieren, allerdings verbunden mit hohen Kosten. Die Braggkurve gibt den Energieverlust in Abhängigkeit von der Eindringtiefe an. (Folie) Ein schweres Teilchen wird umso mehr Energie abgeben, je größer seine Eindringtiefe ist, da es im Verlaufe des Prozesses abgebremst wird. Es kann sich ein regelrechter Bragg-Peak herausbilden, der insbesondere in der Medizin von Interesse ist, um gezielt Bestrahlungen in einer bestimmten Tiefe vorzunehmen und das Nachbargewebe möglichst wenig zu schaden. Felix Bloch zeigte 1933, daß das mittlere Anregungspotential für Z ≥ 20 etwa I = 10 · Z eV lautet. Ein Fit neueren Datums liefert I = 16 · Z 0.9 eV Eine etwas ausführlichere Ausarbeitung findet sich z.B in www.ipp.phys.ethz.ch/education/lectures/empp/contents/km-grundlagen1.pdf Für Photonen wurde bereits erwähnt, daß sich die Wechselwirkung in Materie stark von schweren geladenen Teilchen unterscheidet. Es spielen vorwiegend die folgenden Prozesse eine Rolle: (Es sind Richtwerte für die Energien angegeben, in denen der jeweilige Prozeß dominiert.) unter 1 eV Anregung höherer energetischer Zustände von Elektronen, keine Ionisation 1 eV bis 100 keV Photoeffekt, 50 keV bis 1 MeV Compton-Effekt, 52 1,022 bis 6 MeV Paarbildung, 2,18 bis 16 MeV Kernphotoeffekt. Hierbei absorbieren bis auf der Compton-Effekt alle Prozesse das Photon komplett. Es ist demnach anzunehmen, daß das AON-Szenarion eine gute Näherung für das Verhalten von Photonen in Materie ist. Für den Photo-, Compton-Effekt und die Paarbildung werden im folgenden die Wirkungsquerschnitte angegeben. Photoeffekt ∼ Z 5 Wir definieren die reduzierte Photonenergie ǫ = querschnitt zu σph = 32π √ 5 4 1 2 2Z α 7 re 3 ǫ2 Eγ me c2 , womit sich der Wirkungs- für ǫK < ǫ < 1 σph = 4πre2 Z 5 α4 1 ǫ für ǫ > 1 wird. Dabei ist ǫK die reduzierte K-Schalen Energie und re ≈ 2.8 f m wiederum der klassische Elektronenradius. Compton-Effekt ∼ Z Die Herleitung der Klein-Nishina Formel für den Compton-Wirkunsquerschnitt pro Elektron findet sich in entsprechenden Lehrbüchern (EVENTUELL ANGEBEN!) Sie lautet: 2(1 + ǫ) 1 1 1 + 3ǫ 2 1+ǫ . − log(1 + 2ǫ) + log(1 + 2ǫ) − σc = 2πre ǫ2 1 + 2ǫ ǫ 2ǫ (1 + 2ǫ)2 Zwei Extremfälle verdeutlichen das Ergebnis: σc = σc = σT h (1 − 2ǫ), für ǫ ≪ 1 3 1 1 σT h + log 2ǫ , für ǫ ≫ 1 8 ǫ 2 wobei 8π 2 r 3 e der klassische Thomsonquerschnitt für die elastische Streuung von Photonen an Elektronen ist. σT h = Paarbildung ∼ Z 2 Die Querschnitte pro Kern ergeben sich für 1 < ǫ < σp = und für ǫ ≫ 137 1 Z3 re2 4αZ 2 137 1 Z3 7 109 log 2ǫ − 9 54 zu zu σp = re2 4αZ 2 7 log 9 53 183 1 Z3 1 − 54 Der Massenabsorptionskoeffizient µp = σp ρ NA0 für Paarbildung erreicht für hohe Energien unter Vernachlässigung des zweiten Termes in obiger Formel folgenden Grenzwert: N0 7 183 7 1 µ0p = re2 4αZ 2 ρ log . = 1 A 9 9 X0 Z3 Dies definiert die Strahlungslänge X0 , die eine Schichtdicke angibt in der mit einer Wahrscheinlichkeit von 7 P = 1 − exp − ∼ 54 % 9 Paarbildung stattfindet.(Definition aus Kleinknecht.) Vergleiche dies mit der Definition in Kapitel 1.5 Nout = Nin e−n0 σ∆z . Für Elektronen gesellt sich zum Energieverlust durch Ionisation, der ähnlich der Bethe-Bloch Formel beschrieben wird Z 2me c2 βγ 2 dE −1 , = 4πN0 ρ re2 me c2 log − dx ion A I die Bremsstrahlung. Bereits ab Energien um Ec ∼ 600 M eV dominiert diese den Energieverlust. Z2 dE 183 E − = 4αN0 ρ re2 E log 1 = dx brems A X Z3 0 Im ultrarelativistischen Bereich kann der Energieverlust durch Ionisierung vernachlässigt werden und daher wird dieser allein durch die Strahlungslänge bestimmt: dE dx = E X0 Im Gegensatz zum Photonfall gibt hier die Strahlungslänge demnach die Weglänge an, 1 zu der die Energie auf der ursprünglichen abgefallen ist. Bei den Photonen gab diese e die gleiche Reduktion in der Intensität des Strahls an N (z). Die angestellten Überlegungen führen dazu, daß im Verlaufe des Energieverlustes eines Elektrons teils hochenergetische Photonen entstehen werden, die wiederum Elektronen erzeugen, wodurch sich ein elektromagnetischer Schauer bilden wird. Zu beachten ist zudem die unterschiedliche Strahlungslänge von Photonen und Elektronen: X0P h = 9 el X . 7 0 Die Anzahl der Elektronen in einem Schauer wird zunächst ansteigen, bei zunehmender Eindringtiefe jedoch wieder abfallen. (Folie!) 3.2 Detektortypen Es wird ein kurzer Überblick ohne technische Details über die verschiedenen Detektortypen und ihre Nutzung gegeben, dabei wird jedoch abgesehen von der Blasenkammer stets auf einen modernen 4π-Detektor Bezug genommen. 54 3.2.1 Blasenkammer Die Blasenkammer ist in der Teilchenphysik vorwiegend von historischem Interesse. Sie war über Jahre hinweg der klassische 4π-Detektor für fixed-target“-Experimente am ” externen Strahl eines Beschleunigers. Das Prinzip der Blasenkammer wurde von Donald Arthur Glaser entwickelt, der dafür 1960 den Nobelpreis erhielt. Mit Ihr ist es möglich ein großes Volumen abzudecken und somit Teilchenspuren über eine längere Strecke nachzuzeichnen. Prinzipiell funktioniert sie wie folgt: Ein verflüssigtes Gas wird in einem Druckbehälter nahe dem Siedepunkt gehalten. Kurz vor einem erwarteten Teilchendurchgang wird das Gasvolumen durch einen Kolben rasch expandiert, wodurch sich die Siedetemperatur des Gases verringert und sich die Flüssigkeit in einen überhitzten Zustand begibt. Beim Durchgang eines geladenen Teilchens bilden sich Ionen. An diesen bilden sich wiederum Blasen, an denen die Flüssigkeit in die bevorzugte Gasphase übergeht. Diese Blasenspur kann dann fotografiert werden. Wird auch noch ein Magnetfeld angelegt, kann aus der Krümmung der Spuren der Impuls aller Reaktionsteilnehmer bestimmt werden. So Eindrucksvoll viele der Bilder, die mit Blasenkammern erhalten wurden, sind, (Folie) so hat dieses Prinzip einige Nachteile. Zum ersten läßt sich eine Blasenkammer nicht triggern“, d.h. es läßt sich kein Ausschlußkriterium für uninteressante Reaktionen ” festlegen bzw. im positiven Sinne kein Kriterium zum Aufzeichnen interessanter Ereignisse. Zum Zweiten erfordert die Auswertung der Fotografien einen erhöhten Aufwand. Über die längste Zeit wurde dies in den verschiedenen Kollaborationen von Hand erledigt. Zum Dritten lassen sich keine Reaktionszeiten, wie sie z.B. am LHC benötigt werden, erreichen. Dennoch ist zu sagen, daß ein nicht unerheblicher Anteil der grundlegenden Ergebnisse der Teilchenphysik mit Blasenkammern erzielt wurde. 3.2.2 Pixeldetektoren und Spurkammern Eines der einfachsten Prinzipien zum Nachweis geladener Teilchen besteht darin, diese in einem elektrischen Feld Ionen erzeugen zu lassen, die dann durch das elektrische Feld getrennt werden und schließlich an An- bzw. Kathode einen Stromimpuls liefern. Grundsätzlich unterscheiden sich Detektoren in dem verwendeten Material, in welchem die Ionen erzeugt werden. Hier werden grundsätzlich zwei Typen betrachtet: gasgefüllte Spurkammern und Halbleiterpixeldetektoren. Das Prinzip der gasgefüllten Spurkammer basiert auf dem in den 30er Jahren entwickelten Proportionalzählrohr. (Folie) Dieses besteht aus einem gasgefüllten, meist Argon, Metallrohr, auf dessen Mittelachse ein dünner Draht gespannt ist. Zwischen Draht und Metallwand wird eine Spannung U0 gelegt. (Die Endkappen, zwischen denen der Draht gespannt wird, isolieren den Draht von der Metallwand.) Draht und Wand wirken dementsprechend als An- bzw. Kathode. Dringt ionisierende Strahlung in das Zählrohr ein, so führt dies zur Bildung von Elektron-IonenPaaren im Zählgas. Die Ionen driften zur Kathode, die Elektronen zur Anode. In einer zylindrischen Anordnung steigt das elektrische Feld zum Draht gemäß ~ |E(r)| = U0 r log rrai an, wobei ra der Radius des Rohres, ri der Radius des Drahtes und r der Abstand von der Mittelachse ist. Ist das Feld stark genug bzw. der Draht dünn genug, können primär erzeugte Elektronen in der Nähe des Drahtes stark genug beschleunigt werden, um weitere Ionenpaare zu bilden. Dies führt zu einer exponentiell ansteigenden Anzahl von Sekundärelektronen und so zu einer Lawine von Elektron-Ionen-Paaren. (Dieser Effekt 55 wird Gasverstärkung genannt.) Die Spannung U0 läßt sich so einstellen, daß die Gasverstärkung proportional zur Anzahl der primär erzeugten Elektron-Ionen-Paare ist. In einem solchen Proportionalzählrohr läßt sich über die Kenntnis der Ionisationsenergie des Zählgases auch auf die abgegebene Energie des einfallenden geladenen Teilchens schließen. (Im Gegensatz zum Geiger-Müller-Zählrohr, das im Plateaubereich betrieben wird und demnach nur die Anzahl der eintreffenden Teilchen mißt.) Diese Ionisationsenergien liegen, wie bereits erwähnt zwischen 20 und 40 eV . Eine wichtige Weiterentwicklung des einfachen Proporionalzählrohres war die Vieldrahtproportionalkammer, die von Georges Charpak 1968(66?) entwickelt wurde. (Er erhielt den Nobelpreis für Physik 1992 für seine Beiträge zur Detektorentwicklung insbesondere für die Vieldrahtproportionalkammer.) Diese besteht im Prinzip aus vielen Proportionalzählrohren, wobei die einzelnen Drähte nicht jeweils in einer Röhre gelagert sind sondern alle Drähte sich in einer einzigen Metallkathode befinden. Diese Entwicklung ermöglichte es, zum Energieverlust auch den Ort in einer Ebene senkrecht zu den Drähten zu bestimmen Die Orstauflösung wird, wie leicht einzusehen ist, durch den Abstand d der Drähte bestimmt und ergibt sich zu d σx = √ . 12 Dies ließe sich nun so erweitern, daß Vieldrahtproportionalkammern senkrecht zueinander angeordnet werden, um Ortsinformationen für alle Koordinaten zu erhalten. Wird das Kathodensignal mitverwendet, wofür die Kathode in Streifen parallel zu den Drähten aufgebaut sein muß, läßt sich eine weitere Verbesserung der Ortsauflösung erreichen, wobei die Ortsauflösug dann bis zu σx ≈ 30 µm betragen kann. (Das Ausnutzen der Driftgeschwindigkeit im Gas ist nicht so ohne weiteres möglich, da dafür eine konstante Driftgeschwindigkeit und demnach auch ein konstantes elektrisches Feld im Driftbereich benötigt wird, was für parallele Drähte nicht zu erreichen ist. Erst die Einführung von Potentialdrähten auf negativen Potential zwischen den Drähten führt zu einer näherungsweisen Linearisierung des Feldes.) Bei großen Vieldrahtproportionalkammern ergeben sich allerdings Schwierigkeiten mit der mechanischen Stabilität der Drähte durch die elektrostatische Abstoßung. (Siehe z.B. Kleinknecht.) Generell ist der Aufwand, der für ein gute Ortsauflösung in allen Ebenen mittels einer Vieldrahtproportionalkammer betrieben werden muß, sehr groß. Ein entscheidender Fortschritt stellt in diesem Punkt die ZeitProjektions-Kammer (Time-Projection-Chamber, TPC) dar. Diese besteht typischerweise aus einem zylindrischen Volumen, welches durch eine Kathode in zwei Driftregionen geteilt wird. Die Anoden werden an den Endkappen durch Vieldrahtproportionalkammern gebildet. Zusätzlich zum elektrischen Feld, wird parallel ein magnetisches Feld angelegt, um die Bahnen der Ionen um ihre Driftrichtung zu krümmen. Dringt nun ein geladenes Teilchen in einen der Driftbereiche ein, wird es Elektron-Ionen-Paare erschaffen. Diese werden durch das elektrische Feld getrennt und driften nun mit konstanter Geschwindigkeit Richtung Anode bzw. Kathode. Dabei führen sie durch das magnetische Feld eine Kreisbewegung um die z-Achse aus, was eine Verbreiterung der projizierten Spur in r- bzw. φ-Richtung verringert. Die −r-φ-Koordinaten werden dann an den Endkappen gemessen. Die z-Koordinate wird hingegen aus der Zeit der ankommenden Signale und der bekannten Driftgeschwindigkeit rekonstruiert. Auf diesem Wege lassen sich Ortsauflösungen von 170 µm (Atlas) erzielen. Die zur Zeit größte TPC wird im Alice-Detektor verwendet. Diese hat einen inneren Radius von 80 cm, einen äußeren Radius von 250 cm, eine Länge von 5 m und damit ein Gesamtvolumen von 88 m3 . (Driftgas 90 % Ne und 10 % CO2 , wie in NA49.) Die Anforderungen an die Genauigkeit der Feldstärken sind bei solchen Ausmaßen nur schwer vorzustellen. Bisher wurden nur Detektoren mit Gasverstärkung vorgestellt. Ein großes Signal läßt 56 sich aber auch durch hohe Primärionisation erreichen. Dies wird in Halbleiterdetektoren verwendet, die in fast allen größeren Detektoren, den Vertexdetektor und Teile des Spurdetektors ausmachen. (Daß sie nicht in größerem Ausmaße verwendet werden, ist vorwiegend eine Frage des Preises.) Im Prinzip wird für einen Halbleiterdetektor schlicht eine Diode in Sperrichtung geschaltet. Eine Diode besteht aus einer Schicht n-dotiertem-, z.B. Silizium mit Phosphor oder Arsen, und einer Schicht p-dotiertem-, z.B. Silizium mit Bor oder Indium, Halbleiter. Durch die Dotierung werden durch die unterschiedliche Anzahl Elektronen in der äußersten Hülle entweder zusätzliche Elektronen, bei n-Dotierung, oder Fehlstellen geschaffen, bei p-Dotierung. Die Fehlstellen verhalten sich bei Stromtransport wie positive Ladungen. Zwischen den beiden Schichten rekombinieren die Ladungsträger wodurch sich die sogenannte Verarmungszone bildet. Wird eine Spannung in Sperrichtunng angelegt, d.h. eine positive Spannung an die n-dotierte Schicht und umgekehrt, so verbreitert sich die Verarmungszone und es fließt nur ein sehr geringer Strom, der sogenannte Sperrstrom. (Entspricht dem DifPN-Übergang in einem Halbleiter. fusionsstrom von Löchern aus dem n-Leiter in den p-Leiter.) Wird die Spannung umgepolt fließt ein hoher Strom, da sich die jeweiligen Majoritätsladungsträger aufeinander zubewegen und rekombinieren. Die Verarmungszone einer so in Sperrichtung geschalteten Diode kann als Detektor verwendet werden. Durch einfallende geladene Teilchen erzeugte Elektron-Loch-Paare finden in der Verarmungszone kaum Partner zur Rekombination und werden durch das hohe Feld der Sperrspannung getrennt und Richtung der jeweiligen Pole abgesaugt. Der dadurch erzeugte Strom dient als Signal für das hindurchgehende Teilchen.Dies läßt sich in verschiedener Weise praktisch verwenden. In Abbildung 13 sind schematisch verschiedene Ausführungen eines Halbleiterdetektors dargestellt. Wie oben bereits erwähnt läßt sich aufgrund der geringen Energie zur Erzeugung eines Elektron-Loch-Paares ∼ 3 eV eine sehr gute Energieauflösung erreichen. Wird zudem die Geometrie eines Pixeldetektors gewählt, können Ortsauflösungen im Bereich von σ ∼ 10 µm erlangt werden. 3.2.3 Kalorimeter Elektromagnetische Kalorimeter Im Abschnitt über Wechselwirkung von Strahlung mit Materie wurden bereits die entscheidenden Parameter für die Ausbildung eines elektromagnetischen Schauers diskutiert. Diese sind die kritische Energie Ec und die Strahlungslänge X0 . In Berger “Elementarteilchenphysik” wird ein einfaches Modell zur Illustration der grundlegenden Eigenschaften eines elektromagnetischen Schauers herangezogen, welches auch hier kurz angesprochen werden soll. Angenommen ein einfallendes Photon der Energie E konvertiere im Mittel nach einer Strahlungslänge in ein Elektron-Positron-Paar, wobei beide jeweils die Energie E2 erhalten. Dies wird fortgesetzt, indem angenommen wird, daß nach einer weiteren Strahlungslänge sowohl Elektron wie auch Positron die Hälfte ihrer Energie in Form eines Gammaquants abgestrahlt haben, welche wiederum ein Elektron-Positron-Paar bilden und so fort bis die Energie aller Teilchen unter die kritische Energie Ec gefallen ist. Für 57 Abbildung 13: Verschiedene Halbleiterdetektorgeometrien. dieses einfache Modell gilt demnach Ec = E 2nmax wobei nmax die Anzahl der Strahlungslängen ist, bei der die Zahl der Teilchen im Schauer ihr Maximum erreicht. Es ist somit leicht zu sehen, daß die in Strahlungslängen gemessene Tiefe des Schauers nur logarithmisch mit der Energie ansteigt. log EEc nmax = log 2 Sowohl die Anzahl der geladenen Teilchen im Schauer wie daraus folgend auch die gesamte zurückgelegte Wegstrecke aller Teilchen ist hingegen proportional zu E. Als weitere Annahme kommt hinzu, daß das emittierte Licht bzw. die Anzahl der erzeugten Elektron-Ionen-Paare proportional zur gesamten zurückgelegten Wegstrecke ist. Unter dieser Annahme folgte die Energieauflösung eines Detektors der Zählstatistik 1 σ(E) ∼√ E E da die Anzahl der erzeugten Elektron-Ionenpaare über die Wegstrecke proportional zur Energie wäre. Von den Ergebnissen dieses Modells erhalten sich die √1E -Auflösung und die logarithmische Abhängigkeit von E der Schauertiefe für realistischere Modelle. Aus solchen Betrachtungen ergibt sich auch, daß die laterale Ausdehnung des Schauers nur 58 durch X0 und Ec bestimmt wird. Es kann gezeigt werden, daß 95 % der Schauerenergie in einem Zylinder mit dem zweifachen Molière-Radius RM = 21X0 Ec enthalten sind. (Ec wird hier in M eV eingesetzt.) Die Energieauflösung eines Kalorimeters hängt nicht nur von der Energie der einfallenden Teilchen sondern, wie leicht einzusehen ist, auch vom verwendeten Material bzw. Aufbau des Kalorimeters ab. Es werden sogenannte homogene und sampling Kalorimeter verwendet. Erstere verwenden zum Beispiel Bleiglas in denen C̆erenkov-Strahlung, nach Pavel Alekseyewich C̆erenkov, der mit Ilja Mikhailovich Frank und Igor Yevgenyevich Tamm 1958 den Nobelpreis für die Entdeckung und Interpretation dieser Strahlung erhielt, gemessen wird oder wie am CMS Bleiwolfram-Kristalle als Szintillatoren. Zweitere werden zum Beispiel am AtlasDetektor verwendet, wo sich Metallplatten (Blei im elektromagnetischen bzw. Stahl, Kupfer und Wolfram im hadronischen Kalorimeter.) als Absorber mit flüssigen Argon bzw. im äußeren Bereich speziellem Kunststoff als Szintillator abwechseln. Erreichbare Auflösungen rangieren je nach Aufbau, wobei diese durch a in a σ(E) =√ E E √ √ charakterisiert wird, zwischen a ≈ 0.07 GeV für sampling Kalorimeter und a ≈ 0.025 GeV für homogene Kalorimeter aus speziellen Kristallen. (Auflösung von Atlas und CMS nachschlagen!) Abschließend noch zwei Bemerkungen: Im Gegensatz zur Impulsauflösung verbessert sich die Energieauflösung mit zunehmender Energie, wird aber durch Effekte, die hier nicht bearbeitet werden, Kalibrationsfehler, elektronisches Rauschen, entweichende Energie beschränkt, so daß die Auflösung gegen einen konstanten Term geht: σ(E) a = √ ⊕ b. E E Hadronische Kalorimeter: Diese funktionieren ganz ähnlich den elektromagnetischen Kalorimetern. Es wird der Energieverlust durch Ionisierung und Anregung aller Schauerteilchen aufintegriert bzw. gemessen. Es unterscheiden sich jedoch die Schauerbildung und die nötigen Abmessungen. Hadronische Kalorimeter werden für gewöhnlich in sampling Bauweise und größer konstruiert. Das Auftreten von neutralen Teilchen und größere Fluktuationen in der Schauerbildung beschränken hier die Energieauflösung sehr viel stärker, so daß nur Genauigkeiten bis 0.35 E erreicht werden. (Mag inzwischen besser sein...) 4 Kernphysik In diesem Kapitel werden wir uns mit einigen Grundlagen der Kernphysik beschäftigen. Zunächst werden einige sogenannte äußere Eigenschaften der Kerne, Eigenschaften, die meßbar sind, ohne die genaue Struktur des Kernes zu kennen, betrachtet, ehe einige einfache Modelle diskutiert werden. 4.1 Äußere Kerneigenschaften Die Existenz des Atomkernes wurde bereits von Rutherford postuliert und seine Existenz in Streuexperimenten belegt. In diesen ersten Experimenten wurden Masse,Größe, Ladungsverteilung und Spin abgeschätzt, die im Folgenden äußere Eigenschaften genannt 59 Abbildung 14: Massenspektrometer mit Mattauch-Herzog Geometrie werden. Standardmäßig charakterisiert werden die Kerne durch ihre Ladungszahl Z sowie die Massenzahl A. 4.1.1 Ladung Bereits Rutherford fand Hinweise auf die Ladung von α-Teilchen in Experimenten, in denen α-Teilchen aus einem Radiumpräparat in einem Magnetfeld abgelenkt wurden. Ihre Ablenkung war geringer, d.h. sie hatten eine höhere Masse, und in die andere Richtung als die von Elektronen. Damit waren sie positiv geladen, denn Joseph John Thomson hatte 1897 die negative Ladung des Elektrons definiert. (Zudem sind Atome offensichtlich neutrale Bindungszustände aus Elektronen und Kernen, was nur eine entgegengesetzte Ladung des Atomkerns zuläßt.) 4.1.2 Masse 1 der Atomare Masseneinheit: Die atomare Masseneinheit u ist seit 1961 als 12 1 Masse des Kohlenstoff C − 12-Atoms festgelegt, vorher 16 des O − 16-Atoms. Ihr Wert beträgt seit 1961 1 u = 931.494028(23) M eV (/c2 ). Durch diese Definition wird die Bindungsenergie von 6 Protonen, 6 Neutronen und 6 Elektronen, die das C − 12-Atom bilden, als Bezugspunkt gesetzt. Francis William Aston entwickelte den ersten Massenspektrographen (Nobelpreis in Chemie 1922), mit dem er mehr als 200 der 278 natürlich vorkommenden Isotope identifizierte. Das Prinzip ist recht einfach: Es wird eine Kombination von elektrischen und magnetischen Feldern benutzt, um eine Selektion nach Massen zu erhalten. Siehe zum Beispiel Abbildung 14. Die Ablenkung für ein nichtrelativistisches Teilchen in einem elektrischen Feld der geometrischen Länge l und der Feldstärke E lautet für ein Teilchen der Ladung q und Anfangsgeschwindigkeit v0 : tan α = qlE qlE = . mv02 2T 60 In einem Magnetfeld ist die Ablenkung, wie bereits gesehen, dem Impuls umgekehrt proportional: q lB . sin φ = p Eine Kombination der Felder ergibt also zunächst eine Selektion nach der Geschwindigkeit, welche bei identischen Geschwindigkeiten zu einer Selektion nach Massen wird. Diese Methode ist allerdings nur für mehr oder weniger stabile Isotope anwendbar. Die meisten künstlich erzeugten Isotope haben eine Halbwertszeit im Millisekundenbereich und darunter, was die Entwicklung neuer Methoden zur Massenbestimmung erzwang. Zu nennen sind hier insbesondere die Paul-Falle und die Schottky-Massenspektroskopie. Paul-Falle Um geladene Teilchen zu speichern, wird in der Paul-Falle, analog zur Fokussierung im Beschleuniger, ein Quadrupolpotential in drei Dimensionen Φ(x, y, z) = Φ0 (ax2 + by 2 + cz 2 ) l02 verwendet. Für den ladungsfreien Innenraum der Falle muß die Laplace-Gleichung ∆Φ = 0 erfüllt sein und daher ergibt sich für das Potential einer Falle mit Radius r0 und Höhe 2z0 : Φ0 Φ(x, y, z) = 2 (x2 + y 2 − 2z 2 ). r0 + 2z02 Zur Minimierung von Potentialfehlern kann das Verhältnis von Radius zu Höhe √ r0 = 2 z0 gewählt werden. Eine stabile Speicherung in allen drei Raumkomponenten ist nur mittels Anlegen einer Wechselspannung möglich Φ0 (t) = UDC + UAC cos Ωt. Dies liefert für ein Ion der Ladung E und Masse m die Bewegungsgleichungen e [UDC + UAC cos Ωt] r mr02 e z̈ − 2 2 [UDC + UAC cos Ωt] z mr0 r̈ + = 0, = 0, die man via Substitution auf dimensionslose Größen az = −2ar = qz = τ = −8eUDC mr02 Ω2 4eUAC −2qr = mr02 Ω2 Ω t 2 61 auf die Form einer Mathieuschen Differentialgleichung d2 u + [au − 2qu cos(2τ )]u = 0, dτ 2 mit u = r, z bringen kann. au und qu werden Speicherparameter genannt und bestimmen, ob eine beschränkte, stabile Lösung möglich ist. Für sehr kleine Speicherparameter au qu ≪ 1 kann die Lösung als i h p qu u(t) = c0,u A2 + B 2 1 − cos Ωt cos(ωu t − δ) 2 geschrieben werden. Sie setzt sich aus drei harmonischen Schwingungen zusammen. Den sogenannten Makrobewegungen mit den Säkularfrequenzen ωr,z und der Mikrobewegung, die einer getriebenen Schwingung mit fester Phase zum Führungsfeld und Frequenz Ω entspricht. Eine schematische Darstellung der Paul-Falle findet sich in den nachfolgenden Abbildungen: Abbildung 15: Schematische Darstellung der Felder und der Elektroden der Paul-Falle 4.1.3 Größe Eine erste Größenabschätzung des Atomkerns konnte bereits Rutherford mit seinen berühmten Streuexperimenten vornehmen. Der von ihm experimentell verifizierte Wirkungsquerschnitt wurde unter der Voraussetzung von punktförmigen Projektilen und Streuzentren hergeleitet. Damit konnte er, indem er den Punkt des geringsten Abstandes der α-Teilchen vom Kern berechnete, eine Abschätung für den Kernradius des Goldkernes angeben. 62 Kerngrößenabschätzung aus Rutherfordstreuung Rutherford behandelte die klassische Streuung zweier punktförmiger spinloser Teilchen. y b Teilchen a b Θ r x Kern Eine Voraussetzung für die Gültigkeit seiner Überlegungen ist, dass die α-Teilchen dem Kern niemals so nahe kommen, dass sie die Auswirkung der nichtpunktförmigen Ladungsverteilung spüren. Der kleinste Abstand der α-Teilchen zum Kern kann aus dem Umkehrpunkt der Streuung für verschwindenden Stoßparameter über E = rmin = Der Z 1 Z 2 e2 r Z 1 Z 2 e2 E bestimmt werden. Für die Streuung von α-Teilchen mit Ekin = 6 MeV an Gold mit Z = 79 ergibt sich ein rmin von etwa 38 fm. Radius des Protons kann auf zwei verschiedenen Wegen bestimmt werden. Aus dem Lambshift im Wasserstoffatom und aus Streuexperimenten. Letzterer Punkt wird im Abschnitt Ladungsverteilung noch kurz erwähnt werden. Es wird ein Zusammenhang zwischen dem Formfaktor und dem mittleren Radius ausgenutzt, der aus den jeweiligen Definitionen folgt: 6 dF (q 2 ) . hr2 i = − F (0) dq 2 q2 =0 D.h. es wird der Formfaktor und die Steigung des Formfaktors bei verschwindenden Impulsübertrag benötigt. Die Bestimmung des Radius aus dem Lambshift benötigt die Abweichung der Wechselwirkung zwischen einem punktförmigen und einem ausgedehnten Proton. Dieser Unterschied wird genau durch den Formfaktor gegeben. Für das Proton wird dieser Unterschied durch den elektrischen Formfaktor GE gegeben. Die Energieverschiebung des s-Zustandes im Wasserstoffatom durch die Ausdehnung des Protons wird, wenn GE (q 2 ) ≈ 1 − verwendet wird, zu q 2 r2 6 2 πα|ΨS (0)|2 r2 . 3 Die Messungen an Wasserstoff und myonischen Wasserstoff ergeben zur Zeit Werte, die sich um bis zu 7 Standardabweichungen voneinander unterscheiden. ∆E = 63 4.1.4 Ladungsverteilung Gibt man in der Rutherford-Streuformel die Voraussetzung des punktförmigen Streuzentrums als der punktförmigen Ladungsverteilung auf, dann verallgemeinert sich diese zu dσ |F (~q)|2 , dΩ wobei F (~q) ein sogenannter Formfaktor ist, der vom Impulsübertrag ~q abhängt. In Bornscher Näherung, d.h in führender Ordnung eines schwachen Wechselwirkungspotentials, kann dieser als die Fouriertransformierte der Ladugsverteilung des Streuzentrums angegeben werden. Z F (~q) = d3 r exp(i~q · ~r) f (~r) f (~r) hängt in folgender Weise mit der Ladungsverteilung ρ(~r) zusammen: ρ(~r) = Z e f (~r). Werden als Projektile Elektronen verwendet und der Spin dieser mitberücksichtigt, ergibt sich der üblicherweise Mott-Querschnitt genannte Streuquerschnitt: v2 dσ dσ 2 1 − 2 sin θ = dΩ M ott dΩ Rutherf ord c Hier wurde der Rutherford-Streuquerschnitt für relativistische Projektile verwendet und die erste quantenmechanische Korrektur berechnet, die durch den Spin des Elektrons zustandekommt. Zur Berechnung der Ladungsverteilung eines immer noch spinlosen Kernes würde hier ebenfalls ein Formfaktor eingeführt werden. dσ |F (~q)|2 dΩ M ott Für Kerne mit Spin wird die bereits angegebene Rosenbluth-Formel verwendet, die im Grenzwert sehr großer Masse in obige Beschreibung übergeht. Werden im Streuexperiment genügend Meßwerte für den Impulsübertrag gesammelt, kann die Ladungsverteilung durch die Inversion der Fourier-Transformation bestimmt werden. Die meisten Kerne folgen dabei grob einer Fermi-Verteilung, siehe Abbildung 16 ρ0 ρ(r) = 1+e r−R 1 2 a wobei R 21 als mittlerer Kernradius bezeichnet wird und a die Breite der Randzone angibt. Für stark deformierte Kerne, z.B. mit starken elektrischen Quadrupolmoment wird eine solche Beschreibung allerdings auf Schwierigkeiten stoßen. Für den Kernradius kann auch der mittlere quadratische Radius hr2 i angegeben werden, der über Z ∞ 2 dr r2 ρ(r) r2 hr i = 4π 0 mit der Ladungsdichte zusammenhängt und für kugelsymmetrische Ladungsverteilungen auf 6 dF (q 2 ) hr2 i = − F (0) dq 2 q2 =0 64 Ladungsverteilung f (r) 1 δ(r) 4π 3 a e−ar 8π 2 32 a a2 r 2 e− 2 2π C für r ≤ R 0 für r > R Punkt Exponentiell Gauß homogene Kugel F (q) Formfaktor 1 konstant 2 −2 1+q a 2 ~2 q2 exp − 2 2 2a ~ −3 3α (sin α − α cos α) mit α = qR ~ Dipol Gauß oszillierend Tabelle 3: Zusammenhang zwischen Ladungsverteilung und Formfaktor für einige kugelsymmetrische Ladungsverteilungen. Im Unterschied zum Text wurde hier ~ 6= 1 gesetzt, i d.h. das die Fouriertransformation mit e ~ q~·~r durchgeführt wurde. führt, womit aus Streuexperimenten über den Formfaktor ebenfalls der Kernradius bestimmt werden kann. Kann die Fourier-Transformation nicht invertiert werden, wird zumeist eine Fermi-Verteilung als Modell für die Ladungsverteilung angenommen und die Parameter werden so angesetzt, daß die experimentellen Werte reproduziert werden. (Solch ein Modell sollte möglichst noch weitere experimentelle Daten erklären können oder aber in anderer Hinsicht noch Erklärungspotential haben.) 1.0 0.8 Ρ Ρ0 0.6 0.4 0.2 0.0 0 2 4 6 8 fm Abbildung 16: Eine Fermi-Verteilung mit R 21 = 4 f m, a = 0.8 f m und 4.1.5 p hr2 i = 4.29 f m. Spin (Teils recht ähnlich zu Bethge, Walter, Wiedemann) Der Kernspin fällt genaugenommen nicht unter die äußeren Eigenschaften, da er stark von der Struktur des Kernes abhängt, aber in diese Kategorie fiele im Prinzip auch die Ladungsverteilung oder der Kernradius. Sie können jedoch jeweils mehr oder weniger ohne Rückgriff auf die Kernstruktur gemessen werden. Der Spin des Protons wurde bereits 1927, fünf Jahre vor Entdeckung des Neutrons durch Chadwick, von D. M. Dennison aus den Rotationsspektren des Wasserstoffmoleküls bestimmt. Dies geschah, indem ausgenutzt wurde, daß Teilchen mit halb- oder ganzzahligen Spin verschiedenen Statistiken folgen. Der Fermi-Dirac bzw. der Bose-Einstein-Statistik. Die Gesamtwellenfunktion des Wasserstoffs setzt sich aus derjenigen der beiden Atome 65 zusammen Ψ = ψM1 (A) · ψM2 (B), wobei hier nur die im weiteren betrachteten Kernspins als Indizes angegeben sind. Wenn der Spin eines Kerns I ist, dann gibt es nach den Regeln der Quantenmechanik 2I + 1 Einstellmöglichkeiten bezüglich einer vorgegebenen Achse, so daß die Werte entlang dieser Achse M = −I, −I + 1, . . . I lauten. Die Zahl der Kombinationsmöglichkeiten beider Kernspins lautet demnach (2I + 1)2 , wenn eine Vorzugsrichtung vorliegt. Obige Wellenfunktion hat nur für M1 = M2 ein eindeutiges Verhalten unter Vertauschung von A und B, sie ist symmetrisch, für alle weiteren Fälle müssen Linearkombinationen der Art Ψ = Ψ = ψM1 (A) · ψM2 (B) + ψM1 (B) · ψM2 (A) ψM1 (A) · ψM2 (B) − ψM1 (B) · ψM2 (A) gebildet werden. Durch einfaches Abzählen ergeben sich zusätzlich zu den 2I + 1 symmetrischen jeweils I(2I + 1) symmetrische bzw. antisymmetrische Zustände. Damit ergeben sich (I + 1)(2I + 1) symmetrische und I(2I + 1) antisymmetrische Wellenfunktionen. Die Gesamtwellenfunktion des Moleküls muß, so die Kerne Bosonen sind, gerade sein, für Fermionen, ungerade unter Vertauschung von A und B. Die Relativbewegung der beiden Kerne kann nach Reduktion auf ein Einkörperproblem durch Kugelflächenfunktionen ausgedrückt werden. Diese haben eindeutige Eigenschaften unter Paritätstransformationen, was einem Vertauschen von A und B entspricht. Es ergibt sich ein Faktor (−1)l , wobei l der Bahndrehimpuls des vorliegenden Zustandes ist. D.h. es ergeben sich für Zustände mit geraden bzw. ungeraden Bahndrehimpuls eine unterschiedliche Anzahl von möglichen Spinzuständen. (Wie gesagt, die Gesamtwellenfunktion muß entweder gerade oder ungerade sein, je nachdem ob Bosonen oder Fermionen vorliegen. So kommen z.B. für Fermionen, wenn l ungerade ist, nur die (I + 1)(2I + 1) symmetrischen Spinzustände in Frage.) Im thermodynamischen Gleichgewicht lassen sich daraus direkt das Verhältnis der statistischen Gewichte von Zuständen mit geradem l zu solchen mit ungeraden l angeben, was wiederum das Verhältnis der Besetzungswahrscheinlichkeiten angibt. Es ergibt sich für Fermionen I(2I + 1) I Wl, gerade = = Wl, ungerade (I + 1)(2I + 1) I +1 ein anderes Verhältnis als für Bosonen (I + 1)(2I + 1) I +1 Wl, gerade = = Wl, ungerade I(2I + 1) I womit aus der unterschiedlichen Intensität von Übergängen im Rotationsspektrum auf die Statistik und somit auf den Spin des Kernes geschlossen werden kann. (Ohne die unterschiedliche Entartung der Rotationszustände, durch die unterschiedlichen möglichen Spinwellenfunktionen, für Fermionen bzw. Bosonen, ergäben sich identische Rotationsspektren.) Eine weitere Möglichkeit der Bestimmung des Spins besteht in der elastischen Streuung gleicher Kerne aneinander. Die Erweiterung der Rutherford-Formel für zwei punktförmige Teilchen mit Spin, wobei nicht wie in Abschnitt 2.3 über den Spin gemittelt wird, lautet ) 2 2 ( 1 2 cos η log tan2 θ2 1 Z α dσ + + = dΩ 4Ekin 2I + 1 sin2 θ2 cos2 θ2 sin4 θ2 cos4 θ2 66 2 2 e mit η = Zvrel . (Diese Formel wurde ebenfalls von Mott aufgestellt und wird in Bethge, Walter, Wiedemann auch nach ihm benannt.) Es ist deutlich sowohl die Symmetrie um θ = 90 wie auch ein Interferenzglied zu erkennen. Letzteres folgt daraus, daß die quantenmechanischen Übergangsamplituden erst addiert und dann quadriert werden. Es ist vom Spin der streuenden Kerne abhängig und wird für kleine Spins die ausgeprägtesten Effekte haben, aber auch bis zu einem Spin von etwa 3 kann dieser aus dem gemessenen Streuquerschnitt bestimmt werden. Die mit Abstand wichtigste Methode zur Bestimmung des Kernspins besteht jedoch darin, auszunutzen, daß mit dem Spin auch ein magnetisches Moment verbunden ist, welches z.B. über Rabis Atomstrahlmethode, die Kernspinresonanzmethode von Bloch und Purcell oder die Hyperfeinstrukturaufspaltung bestimmt werden kann. Exkurs: Atomstrahlmethode nach Rabi Das Konzept der Rabischen Atomstrahlmethode basiert auf der Zeemanaufspaltung der Kernspinniveaus in einem Magnetfeld. Die Kraft, die auf ein (konstantes) magnetisches Moment in einem inhomogenen Magnetfeld ausgeübt wird, ist ~ F~ = µ ~ · ∇ B. Die beiden äußeren Magnetfelder (A und B) haben entgegengesetzte Gradienten, so dass die Kräfte auf ein magnetisches Moment entgegengesetzt gleich groß sind und ein Teilchen ohne Einwirkung in C stets den Detektor erreicht. Wird in Bereich C jedoch ein homogenes Magnetfeld in z-Richtung angelegt, welches klassisch zu einer Präzession des magnetischen Momentes um die Magnetfeldrichtung und quantenmechanisch zum Zeeman-Effekt, dass heißt zu einer Aufspaltung der Energieniveaus in Abhängigkeit von der magnetischen Quantenzahl führt und diesem ein senkrecht dazu stehendes magnetisches Wechselfeld überlagert, dann kann es bei geeigneten Frequenzen zu Übergängen zwischen den Energieniveaus und damit zu einer Änderung der z-Komponente des Spins und damit des magnetischen Momentes kommen. Dies führt wiederum zu einer Änderung der Kraft im Bereich B und sorgt dafür, dass entsprechende Teilchen den Detektor nicht erreichen. (Die Skizze ist hier ein wenig mißverständlich bzw. bezieht sich auf den Fall, dass die umgekehrte Idee, dass man ein Detektionsmaximun für eine Spinflip erhält.) Es wird also die Detektionsrate in Abhängigkeit von der Frequenz des eingestrahlten Magnetfeldes gemessen. Diese wird Minima einnehmen, wenn die Frequenz Übergänge zwischen verschiedenen Zeeman-Niveaus erlaubt. Aus dieser Frequenz kann die Energieaufspaltung und aus dieser wiederum das magnetische Moment bestimmt werden. Aus den experimentell bestimmten Werten ergibt sich folgende Systematik: 1. Alle Kerne mit geraden A haben ganzzahligen Spin. Kerne mit geradem Z und 67 gerader Neutronenzahl N haben Spin 0. 2. Kerne mit ungeradem A haben halbzahligen Spin. ug- bzw. gu- Kerne haben den Spin, den das ungepaarte Nukleon aufweist. (ug bzw. gu steht hierbei für ungerade Anzahl Protonen, gerade Anzahl Neutronen und umgekehrt.) 3. Kerne mit geradem A aber ungeradem Z und N haben ganzzahligen Spin in den Grenzen |IZ − IN | ≤ I ≤ |IZ + IN | Magnetisches Moment: Das magnetische Dipolmoment einer Stromverteilung ~j ist klassisch über Z 1 d3 r ~r × ~j(~r) µ ~= 2 definiert. Wird die Stromdichte ~j durch die Bewegung geladener Teilchen bzw. durch die Bewegung einer Ladungsdichte ρ(~r) verursacht, läßt sich dies umschreiben zu Z 1 d3 r ~r × ~v ρ(~r). µ ~= 2 In der Quantenmechanik wird die Ladungsverteilung eines Teilchens durch e |ψ(~r)|2 ge~ = ~r × p~ genutzt wird und der Drehimpuls zum Operator geben, daher kann dies, wenn L befördert wird, als Z e ~ r) d3 r ψ ∗ (~r)Lψ(~ µ ~= 2m geschrieben werden. D.h. das magnetische Moment eines Teilchens (oder einer Ladungsdichte) ist mit seinem Drehimpuls verknüpft. Dies wird noch auf den Spin erweitert, der kein klassisches Analogon hat. Der Gesamtdrehimpuls ergibt sich aus der Addition ~ + S. ~ Das magnetische Moment wird allgemein aus Bahndrehimpuls und Spin. I~ = L folgendermaßen geschrieben µ ~ = (gl~l + gs~s)µK , wobei µK = e 2mp e~ −8 eV 2mp = 3.15245·10 T , welches mit e~ −5 eV µB = 2me = 5.78838 · 10 T verglichen Kernmagneton genannt wird. (In SI-Einheiten µK = dem Bohrschen Magneton aus der Atomphysik werden kann.) Das gesamte magnetische Moment eines Kerns mit Spin I lautet dann µ ~I = e ~ ~ IgI = µK gI I. 2m Für Proton und Neutron wurden die g-Faktoren mittels Kernspinresonanz bzw. Atomstrahlmethode bestimmt. Die aktuellen Werte lauten gl (p) = 1.0, gl (n) = 0, gs (p) = 5.58552(12) gs (n) = −3.8256 woraus die magnetischen Momente µ(n) = −1.913042 µK µ(p) = 2.7928456 µK , 68 folgen. Die magnetischen Momente des Elektrons bzw. des Myons gehören zu den am genauesten berechneten und gemessenen Werten. Die experimentellen Werte werden mit3 ge − 2 2 gµ − 2 aµ = 2 ae = = 0.00115965218076(27) = 0.00116592089(54)(33) (3) angegeben. Wird die QED Feinstrukturkonstante aus der Geschwindigkeit, die ein Rubidiumkern bei der Absorption eines Photons erhält gemessen4 α−1 = 137.03599037(91) dann ergibt sich als theoretischer Wert aus einer fünf Schleifen Rechnung ae = 0.00115965218178(6)(4)(3)(77), wobei die ersten zwei Fehler aus der Unsicherheit im vier-und fnf-Schleifenterm, der dritte aus der hadronischen Unsicherheit und der vierte aus der Feinstrukturkonstante folgen. Die Genauigkeit der theoretischen Rechnung ist inzwischen so hoch, dass die Unsicherheit fast vollständig von der Bestimmung der Feinstrukturkonstante dominiert wird. Für das Myon sieht das Bild aus theoretischer Sicht folgendermaßen aus: aµ = 0.00116591802(49). D.h. das eine Diskrepanz von mehr als drei Standardabweichungen zum experimentellen Wert vorliegt. Hier sind allerdings die Unsicherheiten in der theoretischen Rechnung noch sehr viel schlechter verstanden, z.B. spielen die hadronischen Beiträge eine sehr viel größere Rolle als für das Elektron. Aufgrund dieser Diskrepanz wurde unter anderem eine Wiederholung und Verbesserung der Genauigkeit um einen Faktor vier der experimentellen Messung vorgeschlagen. Ein bereits erwähnter meßbarer Effekt, der durch das magnetische Moment des Kerns zustande kommt, ist die Hyperfeinstruktur. Es tritt eine Energieverschiebung auf, die durch die Wechselwirkung des Magnetfeldes der Hülle, welches vom Gesamtdrehimpuls J~ der Hülle abhängt, mit dem magnetischen Moment bewirkt wird und durch das folgende Skalarprodukt beschrieben wird: ~ ~ ∆Wmagn = −µI h|B(0)|i cos(~ µI , B(0)) = ∆WIJ . Auf diese Weise können mittels der Atomspektroskopie, Eigenschaften des Kernes ermittelt werden. Aus der Theorie folgt für die Hyperfeinstruktur für Spektrallinien: WF = WJ + A 3 C(C + 1) − I(I + 1)J(J + 1) C +B 4 2 2I(I + 1)J(2J + 1) wobei C = F (F + 1) − I(I + 1) − J(J + 1), F~ = I~ + J~ und J~ den Gesamtdrehimpuls ~ und B = eQhVzz (0)i. Der erste Term ist der der Atomhülle angibt, A = µ ~ · hB(0)i ~ J~ I· übliche Feinstrukturterm, der zweite Term gibt ∆WIJ an, und der dritte Term gibt die Wechselwirkung eines Quadrupolmomentes Q des Kerns mit dem Mittelwert eines Feldgradienten hVzz (0)i am Kernort an. Letzterer Term trägt nur bei, wenn der Kern 3 PR D 86, 010001 (2012) 106, 080801 (2011) 4 PRL 69 eine Form abweichend von der Kugelform besitzt. Elektrisches Quadrupolmoment: Davon ausgehend, daß der Kern symmetrisch zum Ursprung aufgebaut ist, taucht in der Multipolentwicklung des elektrischen Feldes kein Dipolmoment auf. Nach der Ladung ist das nächste nicht verschwindende Moment das Quadrupolmoment, welches anschaulich eine Abweichung der Form des Kernes von der Kugelform angibt. Aus der klassischen Elektrodynamik ergibt sich das Quadrupolmoment einer Ladungsverteilung längs der z-Achse Z Q33 1 q20 = d3 r 3z 2 − r2 ρ(~r) = 2 2 Dieses wird in der Kernphysik üblicherweise mit Q bezeichnet und Z e Q = e d3 r r2 3 cos2 θ − 1 ρK (~r) geschrieben wird. Abweichungen von der Kugelform werden prolat, Q > 0 zigarrenförmige Deformation, und oblat, Q < 0 diskusförmige Deformation genannt. (PARITAET UND ISOSPIN EVENTUELL NOCH KURZ ERWAEHNEN.) 4.2 Kernmodelle Dieser Abschnitt gibt einen kurzen Überblick über verschiedene Kernmodelle, die jedoch jeweils nur recht oberflächlich behandelt werden können. Wichtig ist es hierfür, sich klar zu machen, welche Größen den Kern charakterisieren und inwieweit z.B. eine statistische Beschreibung via Erwartungswerten ausreichend ist. Ladung, Größe, Masse und Spin bzw. magnetisches Dipolmoment und elektrisches Quadrupolmoment wurden im vorigen Abschnitt behandelt. Hinzu kommen Bindungsenergien, die natürlich die Masse des Kernes bestimmen, Anregungsenergien, ähnlich denen der Atomhülle und bei genauerer Betrachtung ebenso die verschiedenen Anregungszustände, die Wechselwirkungen der Nukleonen untereinander sowie schließlich die Struktur der Nukleonen selbst. (Letzterer Punkt fällt mehr in die Teilchenphysik, wobei die Trennung alles andere als scharf zu nennen ist.) Trotz aller Bemühungen ist es bisher nicht gelungen, die Kernkräfte mittels eines Potentials darzustellen und damit ein konsistentes Modell des Atomkernes anzugeben. Alle Modelle sind mehr oder weniger phänomenologische Beschreibungen, die den Kern oder bestimmte Aspekte unter gewissen Voraussetzungen gut beschreiben. Probleme bereiten die vielen Freiheitsgrade, die selbst bei einer Kenntnis der Nukleon-Nukleon Wechselwirkung eine Lösung der Schrödingergleichung erheblich erschwerten. Eine Ableitung der Kernkräfte aus der zugrundeliegenden QCD war bisher nicht möglich und scheint auch nicht in unmittelbarer Reichweite zu sein. Aus den vielen Modellen werden hier das Tröpchenmodell, welches eine erste Beschreibung der Bindungsenergien im Kern erlaubt, das Fermigas-Modell, welches den Kern als statistisches Ensemble eines Fermigases ansieht und für schwere Kerne viele gemittelte Eigenschaften beschreiben kann sowie das Einteilchenschalenmodell, das für mittelschwere nicht zu deformierte Kerne eine Beschreibung der Energieniveaus ergibt, herausgegriffen. 4.2.1 Tröpfchenmodell Ein Modell, welches sich nur mit den statischen Eigenschaften des Kernes, besser, nur mit den Bindungsenergien beschäftigt, wurde von Hans Albrecht Bethe und Carl Friedrich von Weizsäcker 1935 entwickelt. Das Tröpfchenmodell geht von der einfachen Vorstellung aus, daß die Reichweite der Kernbindungskräfte beschränkt ist und mehr oder 70 weniger nur bis zum nächsten Nachbarn reicht. Damit gibt es einen Bindungsenergieanteil proportional zum Volumen des Kernes, Nukleonen an der Oberfläche haben eine geringere Bindungsenergie, da sie weniger Nachbarn haben, die Coulombabstoßung der Protonen wirkt der Bindung entgegen und zudem werden ein Antisymmetrieterm und ein Paarungsterm eingeführt. Ehe auf diese näher eingegangen wird, werden kurz die Bindungsenergien allgemein betrachtet. Daß es eine Kraft geben muß, die die Nukleonen zusammenhält folgt schon schlicht aus der Tatsache, daß Kerne und damit Atome existieren. Da der Kern demnach einen gebundenen Zustand darstellt, muß seine Masse geringer sein, als die Summe der Masse seiner Konstituenten. mK (Z, N ) mK (Z, N ) 6= Z mP + N mN = Z mP + N mN − ∆mK Diese Massendifferenz, üblicherweise auch Massendefekt genannt, ergibt über die relativistische Massen-Energie-Äquivalenz die Bindungsenergie. Diese Bindungsenergie wird freigesetzt, wenn ein Kern aus seinen Konstituenten zusammengesetzt wird ⇒ Kernfusion und muß aufgewendet werden, wenn er in ebendiese zerlegt werden soll. Die Energie, die benötigt wird, um ein oder mehrere Nukleonen aus dem Kern zu entfernen wird Separationsenergie genannt und entspricht der negativen Bindungsenergie: ES = −EB . Für die Separation eines Protons gilt zum Beispiel ES = mK (Z, N ) − mK (Z − 1, N ) − mP für die Separation eines α-Teilchens muß berücksichtigt werden, daß dieses ebenfalls wieder eine Bindungsenergie aufweist ES = mK (Z, N ) − mK (Z − 2, N − 2) − 2mP − 2mN + EB (Z = 2, N = 2). Tabellarische Werte für Bindungsenergien sind auf den Bezugspunkt C − 12 bezogen, daher können sowohl positive wie negative Bindungsenergien auftreten. In Abbildung 17 sind die Bindungsenergien pro Nukleon für verschiedene Elemente angegeben. Als Beispiel Abbildung 17: Bindungsenergie pro Nukleon in Abhängigkeit von der Massenzahl seien zudem noch die Separationsenergien für ein Neutron in 71 208 P b und 209 P b sowie die Separationsenergie für ein Proton in 208 P b und 209 Bi angegeben: (Aus “Kernphysik” Bethge, Walter, Wiedemann) 7.367 M eV (208 P b) , ES (n) = 3.937 M eV (209 P b) 8.007 M eV (208 P b) ES (p) = . 3.799 M eV (209 Bi) Eine Besonderheit der Kernkraft kann aus der Untersuchung von Spiegelkernen, d.h. Kernen, die sich genau durch den Austausch eines Protons durch ein Neutron unterscheiden, abgeleitet werden. So haben 27 Al und 27 Si beinahe die gleichen Bindungsenergien und sehr ähnliche Anregungsniveaus, was auf eine ladungsunabhängige Kernkraft schließen läßt. Dazu später noch mehr. Die Bethe-Weizsäcker Formel des Tröpfchenmodells wurde in Analogie zu einem Tropfen einer inkompressiblen Flüssigkeit gebildet, wobei die Nukleonen die Moleküle der Flüssigkeit darstellen. (Ähnlich der Flüssigkeit wird die Dichte konstant angenommen, die Kräfte sind kurzreichweitig, es tritt Sättigung für große A ein, etc.) Die Formel ist dementsprechend ein halbempirischer Ansatz, deren Parameter aus dem Experiment bestimmt werden können. Sie setzt sich aus den Anfang dieses Abschnitts genannten fünf Termen zusammen, die nun näher erläutert werden sollen. EB = = EB 1 + EB 2 + EB 3 + EB 4 + EB 5 2 1 (N − Z)2 Z2 aV A − aO A 3 − aC 1 − aA ± aP A− 2 A A3 Volumenterm EB1 : Das Volumen des Kernes ist proportional zur Zahl seiner Konstituenten V ∼ A und die Kernbindungsenergie wird proportional zum Volumen angenommen. Der Volumenterm liefert den größten Beitrag zur Bindungsenergie. EB ∼ V ∼ A, EB1 = aV A, mit aV > 0 Hieraus ergibt sich auch ganz allgemein, daß der Kernradius, unter der Annahme eines 1 kugelförmigen Kernes, proportional zu A 3 ist. Oberflächenterm EB2 : Der Oberflächenterm trägt der Tatsache Rechnung, daß Nukleonen an der Oberfläche weniger Nachbarn haben und daher eine geringere Kraft erfahren. Dies führt zu einer Verminderung der Bindungsenergie proportional zur Oberfläche. 2 EB2 = EBO ∼ 4πR2 ∼ A 3 2 EB2 = −aO A 3 , mit aO > 0 Coulomb-Term EB3 : Dieser Term berücksichtigt die Coulombabstoßung durch die positiven Ladungen der Protonen, was wiederum zu einer Verminderung der Bindungsenergie führt. Z2 Z2 Z2 EB 3 = E B C ∼ ∼ 1 , EB3 = −aC 1 , mit aC > 0 R A3 A3 Der Coulomb-Term läßt sich aus der Elektrostatik ableiten, was in den Übungen gemacht werden soll. Asymmetrieterm EB4 : Dieser Term berücksichtigt die empirische Tatsache, daß Kerne oberhalb des 40 Ca instabil sind, wenn sie die gleiche Anzahl Protonen wie Neutronen haben bzw. umgekehrt, daß leichte Kerne bevorzugt die gleiche Anzahl Protonen wie Neutronen haben. Für schwere Kerne sorgt die zunehmende Coulombabstoßung dafür, daß die Kerne vermehrt Neutronen ansammeln, wie es in jeder Nuklidkarte zu sehen ist. Die Form des Asymmetrieterms läßt sich aus dem Thomas-Fermi bzw. Fermigas 72 Modell ableiten, siehe dafür auch den nächsten Abschnitt, und er berücksichtigt das Paulische Ausschließungsprinzip, d.h. daß die Neutronen in immer höheren Zuständen untergebracht werden müssen. EB4 = −aA (N − Z)2 A Paarungsterm EB5 : Dieser Term folgt ebenfalls aus einer empirischen Beobachtung, namentlich daß gg-Kerne stabiler sind als uu-Kerne (Es gibt überhaupt nur 4 stabile uu-Kerne 2 H, 6 Li, 10 B und 14 N .). gu- und ug-Kerne besitzen jeweils ein ungepaartes Nukleon und es tritt kein Paarungsterm auf. Dieser wird unter verschiedenen Annahmen hergeleitet und liefert üblicherweise folgende Ausdrücke: 1 EB5 = ±aP A− 2 , oder 3 EB5 = ±a′P A− 4 , mit aP , a′P > 0. Die Verstärkung der Bindungsenergie, also das positive Vorzeichen, tritt wie oben angedeutet für gg-Kerne auf, das negative für uu-Kerne. Der erste Ausdruck ist in der Literatur verbreiteter und wird häufig auch EB 5 = ± δ 1 A2 geschrieben. Die Parameter werden aus den gemessenen Bindungsenergien der Kerne extrahiert. Bethge, Walter, Wiedemann gibt folgende Werte an, die aus einem Fit nach der Methode der kleinsten Quadrate gewonnen wurden: aV = 15.5 M eV, aC = 0.715 M eV, aP = 11.3 M eV, aO = 16.8 M eV aA = 23.0 M eV a′P = 33.4 M eV Abbildung 18 zeigt die Bindungsenergie pro Nukleon mit einem Fit via Bethe-Weizsäcker. 4.2.2 Fermi-Gas Modell bzw. Thomas-Fermi Modell Dieses von Llewelly Hilleth Thomas und Enrico Fermi entwickelte Modell beschreibt die Konstituenten des Kernes als statistisches Ensemble. (Es wurde bereits 1927 entwickelt, allerdings zunächst für die Beschreibung von Elektronen in der Atomhülle.) Es gibt Mittelwerte für Bindungsenergien, Impulse der Nukleonen im Kern, etc. und diese umso genauer, je mehr Konstituenten der Kern hat. Einige der Terme der empirische BetheWeizsäcker Formel können aus dem Thomas-Fermi Modell hergeleitet werden. Wie im Abschnitt über Spin festgestellt, sind die Nukleonen Spin 12 -Teilchen, demnach Fermionen und folgen der Fermi-Dirac Statistik. Es wird angenommen, daß sich die Nukleonen im gesamten Kernvolumen unter Berücksichtigung des Pauli-Prinzips frei bewegen können. Protonen und Neutronen werden unabhängig voneinander behandelt. Das Potential, das auf sie wirkt, ist die Überlagerung der Potentiale, die durch die übrigen Nukleonen verursacht werden. Dieses wird als näherungsweise konstant im inneren des Kerns angenommen und der Einfachheit halber fällt es am Rand scharf ab. Es wird also ein dreidimensionaler Potentialtopf angenommen. −V0 0 ≤ r ≤ R V = 0 r>R 73 Abbildung 18: Bindungsenergie pro Nukleon. Die durchgezogene Kurve gibt die Werte an, die aus der Bethe-Weizsäcker Formel für einen entsprechenden Fit folgen Zur weiteren theoretischen Vereinfachung wird hier zunächst ein rechteckiges (mit Kantenlänge a) anstatt ein kugelförmiges Volumen angenommen. Die Ergebnisse lassen sich jedoch auf letzteren Fall verallgemeinern. Für jedes einzelne Nukleon wäre demnach die zeitunabhängige Schrödingergleichung mit einem Kastenpotential zu lösen. ~2 ∂ 2 ψ n ∂ 2 ψn ∂ 2 ψn ~2 = En ψ n ∆ψn = − + + − 2m 2m ∂x2 ∂y 2 ∂z 2 Auf diesem Wege lassen sich über die möglichen Energiezustände, Fermi-Energie und Fermi-Impuls jedes Nukleons und schlußendlich die totale Energie einer Nukleonsorte bestimmen. Dies wird im folgenden skizziert werden. Die Schrödingergleichung läßt sich mit Hilfe eines Separationsansatzes ψn (~r) = Xn (x) Yn (y) Zn (z) lösen. Es entstehen drei Gleichungen der Art ∂ 2 Xn (x) = −kn2 Xn (x) ∂x2 mit √ 2m En . ~ Die Lösungen sind die üblichen Lösungen eines harmonischen Oszillators kn = Xn (x) = An eik·x + Bn e−ik·x , die mittels der Randbedingungen (hier für einen unendlich tiefen Potentialkasten) Xn (x) = Yn (y) = Zn (z) = 0, 74 für x = y = z = ± a 2 zu werden, wobei 2i Xn− (x) = √ sin kn− x 2a 2 Xn+ (x) = √ cos kn+ x , 2a kn+ = kn− = n+ π , a n− π , a n+ = 1, 3, 5, . . . n− = 0, 2, 4, . . . sind. Dies ergibt die möglichen Energien im Kastenpotential 2 π~ nx 1 ~2 2 k = , Enx = 2m n 2m a 2 π~ 1 n2x + n2y + n2z , En = Enx + Eny + Enz = 2m a woraus sich auch die Impulse angeben lassen 2 π~ 2 n2x + n2y + n2z , p = 2m E = a wobei die nichtrelativistische Näherung schon aus der Verwendung der SchrödingerGleichung folgt. Stellt man sich ein dreidimensionales, rechteckiges Koordinatensystem mit nx , ny , nz -Achsen vor, dann geben die Gitterpunkte mit ganzzahligen n die zulässigen Energieeigenwerte eines Teilchens im Kastenpotential dar. Ein Volumenelement ∆Ω dieses so aufgespannten Raumes, stellt ein Produkt aus Orts- und Impulskoordinaten dar, ap da n = ak π = π~ ist. D.h. ∆Ω ∼ a3 p3 stellt ein Volumenelement des Phasenraumes dieses Teilchens im Kasten dar. Jeder Gitterpunkt entspricht demnach einem Eigenzustand des Teilchens unter den gewählten Randbedingungen. Um alle möglichen Zustände zu erhalten, nehmen wir zunächst eine Kugel mit Radius R 2m EF R2 = n2x + n2y + n2z = 2 2 a2 . ~ π Damit ist die Gesamtzahl durch das Volumen des Kugeloktanten mit nx,y,z > 0 gegeben. Liegen die Werte n genügend dicht, d.h. für große Werte von n, dann lassen sich diese als kontinuierlich verteilt ansehen und die Anzahl der Zustände in einer Kugelschale wäre gegeben durch dn = dΩ = 4πR2 dR. Beschränkt auf obigen Oktanten liefert dies demnach dn = 1 1 a 3 p2 dΩ = πR2 dR = 3 2 dp, 8 2 2~ π wobei im letzten Ausdruck R= ap , π~ dR = a dp π~ eingesetzt wurde. Dies gäbe an, wieviele Zustände für ein spinloses Teilchen, das sich frei im Innern des Kernes“ bewegen könnte, pro Impulsintervall bestünden. Für Spin- 12 ” 75 Teilchen läßt sich jeder Zustand mit genau zwei Teilchen mit entgegengesetzten Spins besetzen, d.h. die Formel würde mit einem Faktor 2 multipliziert. Die Verteilung nach Impulsen läßt sich nun natürlich auch wieder in eine nach der Energie umwandeln, indem √ p2 = 2m E bzw. p2 dp = 2m3 EdE eingesetzt wird: 3 dn = √ √ √ m2 a3 E dE = c1 a3 E dE. 2π 2 ~3 Damit wird die Besetzung der Energiezustände bis zu einer Maximalenergie EF , die oben mit dem Radius in Verbindung gesetzt wurde, und die Fermi-Energie genannt wird, angegeben. Diese ist so nur bei der Temperatur T = 0 K gültig, kann jedoch durch Multiplikation mit der Fermi-Dirac-Verteilung 1 1 + eβ(E−µ) mit β = 1 kB T für höhere Temperaturen generalisiert werden. (Siehe Abbildung 19) Wie zu Abbildung 19: Produkt aus Zustandsdichte D(ǫ) und Fermi-Dirac-Verteilung bei verschiedenen Temperaturen. sehen ist, werden für steigende Temperaturen auch Zustände jenseits der Fermi-Energie besetzt, gemeinsam ist jedoch allen Verteilungen, daß sie für E = EF den Wert 12 haben. Um die Rechnung nicht weiter zu komplizieren, wird zunächst weiterhin T = 0 angenommen. Mithilfe obiger Besetzung der Energiezustände bzw. Impulszustände kann nun die Fermi-Energie mit der Anzahl der Protonen Z und der Anzahl der Neutronen N , die beide als unabhängig voneinander angenommen werden, in Verbindung gesetzt werden Z= Z pF (p) 0 dZ dp, dp N= Z pF (n) 0 dN dp dp Wird dies integriert, mit 2 multipliziert wegen der Spins und anstelle des Würfelvolumens a3 das Kernvolumen VK eingesetzt, ergeben sich folgende Ausdrücke für die Protonenbzw. Neutronenanzahl: Z= p3F (p) VK , 3π 2 ~3 N= 76 p3F (n) VK . 3π 2 ~3 Dies ergibt durch Umstellen Aufschluß über die Impulse der Nukleonen bei der Fermip2F über die Fermi-Energie selbst. Wird das Volumen Energie und durch EF = 2m VK = 4 3 πr A 3 0 eingesetzt lauten die Ausdrücke pF (p) pF (n) = r 9π ~ 4 r0 r Z , A = r 9π ~ 4 r0 r N , A 3 3 3 3 32 2 Z 9π 3 ~2 EF (p) = 4 2mr02 A 23 32 N ~2 9π EF (n) = 4 2mr02 A Als ungefährer numerischer Wert läßt sich mit m ≈ mp ≈ mn und r0 ≈ 1.4 f m EF (p) ≈ 38.6 32 Z M eV, A EF (n) ≈ 38.6 N A 23 M eV angeben. Die Gesamtenergie einer Nukleonsorte läßt sich aus dem Integral über die Zustandsdichte multipliziert mit der Energie des jeweiligen Zustandes gewinnen: E0 (N ) = Z EF 0 dN E dE = dE Z EF 0 dN dp E dE. dp dE Aus diesem Ausdruck läßt sich unter der weiteren vereinfachenden Annahme, daß beide Nukleonsorten die gleiche Energie beitragen, wie sie bereits in den vorhergehenden Schritten zugrundegelegt wurde, der Asymmetrieterm des Tröpfchenmodells berechnen. Die Ausführung des Integrales und berücksichtigen eines Faktors 2 der aus den zwei Spineinstellungen folgt, liefert 3 E0 (N ) = 10 9π 4 32 5 3 ~2 N 3 = N EF m r02 A 32 5 Betrachten wir einen Kern aus N Neutronen und Z Protonen und vernachlässigen wie erwähnt alle Unterschiede zwischen den Energien der beiden Nukleonsorten, dann ergibt sich für die Gesamtenergie 5 5 N3 +Z3 , E0 (Z, N ) = C 2 A3 wobei hier die numerischen Vorfaktoren in einer Konstante C zusammengefaßt wurden. Sind Z und N gleich, d.h. der Kern vollständig symmetrisch vereinfacht sich dies weiter E0 (Z = N ) = 35 A C = 2 A. 2 2 3 A 23 2C Dies zeigt schon die Abhängigkeit der Energie von A, den Volumenterm. Berücksichtigte man die Tiefe des Potentialtopfes erhielte man hier auch das richtige Vorzeichen. Interessant ist zudem insbesondere zu betrachten, wie sich eine Asymmetrie Z 6= N auf die 77 Gesamtenergie auswirkt. Die Differenz zum symmetrischen Ergebnis läßt sich in folgender Weise schreiben: " 35 # 5 5 A C Z3 +N3 −2 ∆E0 (Z, N ) = 2 2 3 A " # 35 5 5 C A N −Z 3 N −Z 3 = 1− + 1+ −2 2 A A A3 2 und da A > N − Z gilt, können die Klammerausdrücke entwickelt werden. 5 5 5 5 (1 ± x) 3 = 1 ± x + x2 ∓ x3 + · · · 3 9 81 Unter Vernachlässigung des Terms ∼ x3 wird für die Energiedifferenz der Asymmetrieterm des Tröpchenmodells erhalten ∆E0 (Z, N ) = 5 C (N − Z)2 . 9 2 23 A 78 Experimentelle Verifikation des Fermi-Impulses im Kern Der Fermi-Impuls kann in quasielastischer Elektron-Nukleon Streuung gemessen werden oder vielmehr es kann der mittlere quadratische Impuls der Nukleonen im Kern gemessen werden, der mit dem Fermi-Impuls zusammenhängt. Als quasielastische Streuung wollen wir die Streuung eines Elektrons an einem gebundenen Nukleon, welches in diesem Prozeß aus dem Kern gelöst wird, bezeichnen. Das gebundene Nukleon bewege sich in einem Potential der Stärke S mit einem Impuls p~, habe demnach p ~2 eine Bindungsenergie S − 2m . Wird die Wechselwirkung mit den anderen Nukleon nen, die kinetische Energie bzw. der Impuls des restlichen Kernes vernachlässigt, dem Elektron ein Impuls ~k zugeordnet und das Nukleon als Proton angenommen, dann ergeben sich folgende kinematischen Relationen: ~k + p~ = ~k ′ + p~′ , p~′ = p~ + ~q, E + Ep = E ′ + Ep′ , wobei ~q der übertragene Impuls ist. (Übertragen durch ein Photon den Träger der e.m. Wechselwirkung.) Der Energieübertrag des Elektrons auf das Proton ergibt sich für E, E ′ ≫ me c2 und |~ p|, |~ p′ | ≪ mp c zu p~2 p~′2 2 ′ ′ 2 − mp c + −S ν = E − E = Ep − E p = m p c + 2mp 2mp 2 = p~2 (~ p + ~q) − +S 2mp 2mp = |~q||~ p| cos θ ~q2 +S+2 2mp 2mp wobei θ der Winkel zwischen ~q und p~ ist. Wir nehmen an, daß die Bewegung der Nukleonen im Kern isotrop ist, d.h. daß keine Richtung ausgezeichnet ist. Dann erhalten wir für ν eine symmetrische Verteilung um den Mittelwert ν0 = ~q2 +S 2mp 79 mit einer Breite σν = = |~q| p 2 h(ν − ν0 )2 i = h~ p cos2 θi mp r |~q| 1 2 h~ p i. mp 3 p Der Fermi-Impuls hängt nun mit dem mittleren quadratischen Impuls über p2F = 5 2 h~ p i 3 zusammen und kann daher aus dem Energiespektrum der gestreuten Elektronen bestimmt werden. Der Zusammenhang ergibt sich aus R pF dn dp p2 0 3 dp 2 h~ p i= R = p2F dn 5 pF dp 0 dp Setzt man r0 ≈ 1.2 f m, dann ergibt sich aus dem Fermigasmodell pf ≈ 250 M eV (/c). Die experimentell bestimmten Werte finden sich in Tabelle 4 Wie zu sehen ist, stimmt das Fermigas-Modell für große Kerne recht gut mit den experimentellen Werten überein. Auch zwei der Bindungsenergieterme aus der BetheWeizsäcker-Formel lassen sich erklären, aber ähnlich wie bei dieser, können keine feineren Strukturen und insbesondere auch die leichteren Kerne nicht beschrieben werden. Zu diesem Zwecke wird im nächsten Abschnitt das Einteilchen-Schalenmodell eingeführt, 80 pf S Kern [M eV (/c)] [M eV ] 6 Li 169 17 12 C 221 25 24 Mg 235 32 40 Ca 249 33 59 Ni 260 36 89 Y 254 39 119 Sn 260 42 181 Ta 265 42 208 Pb 265 44 Tabelle 4: Experimentelle Werte für den Fermi-Impuls sowie das effektive mittlere Potential S. Aus Povh, Rith, Scholz, Zetsche Teilchen und Kerne“. ” welches in Ansätzen einige der experimentell beobachteten Strukturen beschreiben kann. Zu erwähnen ist noch, daß sich auch Zwischenkerne, die sich in Kernreaktionen, zum Beispiel Streuung zweier Kerne, bilden, sogenannte Compound-Kerne als Fermigas beschreiben lassen. Für diese muß dann jedoch eine erheblich von null verschiedene Temperatur betrachtet werden. Eventuell wird darauf noch im Abschnitt über Anwendungen und Kernreaktionen zurückgekommen. 4.2.3 Schalenmodell Wie anfangs dieses Abschnittes dargelegt, sollte ein Modell nicht nur die globalen Eigenschaften des Kernes, zum Beispiel in Anlehnung an statistische Ensembles wie im Tröpfchen- oder Fermigas-Modell, sondern auch die magnetischen Momente oder Anregungsenergien beschreiben. Das Einzelteilchen-Schalenmodell vermag zumindest einige dieser Punkte zu beschreiben. Insbesondere die sogenannten magischen Zahlen (2, 8, 20, 28, 50, 82 für Protonen und 2, 8, 20, 28, 50, 82, 126 für Neutronen), Protonen- und Neutronenzahlen zu denen es besonders viele stabile Isotope gibt, gaben in den Anfangszeiten Rätsel auf und können auch durch das Schalenmodell nur teilweise beschrieben werden. Was zeichnet diese Zahlen aus? Elemente, die eine Ordnungszahl haben, die einer magischen Zahl entspricht, besitzen mehr stabile Isotope. Insbesondere auch im Vergleich zu ihren Nachbarn. Ebenso treten besonders viele Isotone, d.h. Elemente mit gleicher Neutronenzahl bei verschiedener Ordnungszahl auf Die Elementhäufigkeit im Kosmos liefert Maxima für magische Protonenzahlen Die Energie der ersten angeregten Zustände nimmt für Elemente mit magischen Zahlen besonders hohe Werte an Der Einfangsquerschnitt für Neutronen ist besonders klein für Elemente mit magischer Neutronenzahl Die Separationsenergie für Protonen und Neutronen sind für Kerne mit magischer Protonen- bzw. Neutronenzahl besonders groß. Dies erinnert an die hohen Ionisationsenergien von Edelgasen. Besonders ausgeprägt sind die erwähnten Eigenschaften für sogenannte doppelt magische Kerne, d.h. für Kerne, in denen sowohl die Protonen- wie die Neutronenzahl einer magischen Zahl entspricht. Folgende Kerne fallen darunter: 4 2 He, 16 8 O, 40 20 Ca, 81 48 20 Ca, 208 82 P b Um zur Beschreibung des Kernes durch das Einteilchen-Schalenmodell zu kommen, betrachten wir zunächst eine Schrödinger-Gleichung mit Wechselwirkungspotentialen zwischen den Nukleonen: X ~2 X Vij , H= ∆i + − 2m i<j i wobei für Vij X Vij = ij 1X V (~rij ) 2 i6=j gilt, da jede Zweiteilchenwechselwirkung nur einmal gezählt wird. Um eine analytische oder auch nur numerische Beschreibung möglich zu machen, werden die Potentiale durch abstandsabhängige Potential angenähert. X X X ~2 ∆i + V (~ri ) + V (~rij ) − V (~ri ) H= − 2m ij i i Diese abstandsabhängigen Potentiale lassen sich über folgende Überlegung plausibel machen. Wie bereits angenommen, handelt es sich bei den Vij nur um Zweiteilchenpotentiale. Um das effektive Potential, welches ein Nukleon sieht, zu erhalten, wird über alle Potentiale gemittelt. Die Summierung über alle Potentiale kann durch ein Integral über die Nukleondichte multipliziert mit dem durch ein Nukleon hervorgerufenen Potential angenähert werden. Konkret werde hier das Nukleon 1 herausgegriffen: A X j V1j ≈ Z ρ(~r) V (~r1 − ~r) = V (~r1 ) Wird nun zudem angenommen, daß die Zweiteilchenwechselwirkung sehr kurzreichweitig ist, dann kann dieses via V (~r1 − ~r) ≈ V0 δ(~r1 − ~r) ausgedrückt werden. Das effektive Potential folgte demnach der Dichteverteilung der Nukleonen im Kern V (~r1 ) ≈ V0 ρ(~r1 ). Für kleine Kerne läßt sich dies gut durch das Potential eines harmonischen Oszillators annähern, bei größeren Kernen wird dies besser durch ein Woods-Saxon Potential beschrieben, daß einer Fermi-Verteilung folgt: VW S (r) = −V0 . 1 + e(r−R)/a Letzteres läßt sich allerdings nicht mehr analytisch lösen. Als analytisch lösbare Alternative stellt sich noch das Kastenpotential dar. Im weiteren wird angenommen, daß die Restwechselwirkung X X V (~rij ) − V (~ri ) ij i 82 klein ist und demnach vernachlässigt werden kann. Mit dieser Vereinfachung beschriebe ein solches Modell bereits die magischen Zahlen 2, 8, 20 als Schalenabschlüsse, versagte jedoch bei größeren Zahlen. Letztere lassen sich erst erklären, wenn die Spin-BahnKopplung analog zur Atomhülle miteinbezogen wird. Zu diesem Zweck definieren wir den Gesamtdrehimpuls des Kernes als ~j = ~l + ~s, 1 j+ = l + , 2 j− = l − 1 2 wobei ~l und ~s der Bahndrehimpuls respektive der Spin des Nukleons sind. Für das Potential wird nun der Ansatz E D V (~ri ) = V0 (~ri ) + Vls (~ri ) ~l · ~s gemacht. Der Erwartungswert des Skalarproduktes ~l · ~s kann über die Erwartungswerte des Gesamtdrehimpulses, des Bahndrehimpulses und des Spins berechnet werden: i 1 h ~2 h~l · ~si = hj i − h~l2 i − h~s2 i ~2 2 1 [j(j + 1) − l(l + 1) − s(s + 1)] ~2 . = 2 respektive − l+1 2 und für das Potential ergibt sich l fürj+ + 2 Vls V (ri ) = V0 (ri ) . l+1 − Vls fürj− 2 D.h. für j+ und j− erhält man l 2 Dies führt demnach zu einer Energieaufspaltung ∆Els = 2l + 1 hVls (r)i 2 die mit wachsendem Drehimpuls zunimmt. Experimentell stellt man fest, daß Vls negativ ist, was im Gegensatz zur Atomhülle steht. Es ist also immer das Niveau mit j+ = l + 12 unter dem mit j− = l− 12 . Die starke Spin-Bahn-Kopplung (Die Kopplung des Spins eines Nukleons mit seinem eigenen Bahndrehimpuls aufgrund des Kernpotentials.) bewirkt eine Verschiebung der Energieniveaus in der Art, daß sich Lücken im Niveauschema ergeben, die genau bei den magischen Zahlen liegen, siehe Abbildung 20. Die Nomenklatur für die Haupt- und Drehimpulsquantenzahl wird analog zu der der Atomhülle verwendet. n = 1, 2, 3, 4, . . . Zahl der Knoten +1 nl mit l = s, p, d, f, g, h, . . . Bahndrehimpuls Allerdings muß die Aufspaltung für jede Schale den Meßdaten angepaßt werden. Wird die radiale Abhängigkeit des Spin-Bahn Potentials analog zu derjenigen in der Elektronenhülle angesetzt, dominiert dieses aufgrund der kurzreichweitigen Kernkräfte am Rand des Kerns. Insgesamt zeigt sich ein entscheidender Unterschied zur Atomhülle: Dort sorgt die Spin-Bahn-Kopplung für die Feinstrukturaufspaltung, eine kleine Korrektur zu den Energieniveaus. Im Kern allerdings ist die Aufspaltung von derselben Größenordnung wie die Trennung der nl-Schalen. 83 Abbildung 20: Zustandsschema im Schalenmodell für a) Oszillatorpotential b) WoodsSaxon-Potential und c) Woods-Saxon-Potential mit Spin-Bahn-Kopplung und Coulombkorrektur. Wie zu sehen ist, ist das Schalenmodell recht erfolgreich, die Aufspaltung der Energieniveaus und die magischen Zahlen zu beschreiben. Insbesondere für Kerne, die nur wenig von einer der magischen Zahlen entfernt sind, für die also eine neue Schale fast voll besetzt oder nur wenig besetzt ist, funktioniert das Modell sehr gut. Je weiter die Kerne sich jedoch von den magischen Zahlen entfernen oder bzw. und je stärker sie deformiert sind, desto weniger gut stimmt die Beschreibung. Auch magnetische Momente lassen sich im Schalenmodell beschreiben. Es wird für Kerne mit ungerader Massenzahl angenommen, daß das gesamte magnetische Moment, durch das eine ungepaarte Nukleon verursacht wird. Dieses Nukleon kann für h~l · ~si genau die Werte ~2 für l parallel zu s 2l h~l · ~si = ~2 − 2 (l + 1) für l antiparallel zu s annehmen. Mit den Werten für die g-Faktoren für Neutron bzw. Proton ergeben sich daraus Werte für das magnetische Moment des Kernes. Dies sind die sogenannten SchmidtWerte, die nur für wenige Kerne mit dem experimentellen Werten übereinstimmen, siehe 84 Abbildung 21. Um die magnetischen Momente korrekt beschreiben zu können, müßten Abbildung 21: Magnetische Momente verschiedener Kerne. Als Vergleich sind die Schmidt-Werte, die Vorhersagen des Einteilchen-Schalenmodells gezeigt. Korrelationen zwischen den Nukleonen berücksichtigt werden. Dies können zum einen Korrelationen zwischen den Nukleonen sein, die nicht in einer abgschlossenen Schale sitzen, so läßt sich zum Beispiel das 18 O Spektrum sehr gut durch die Korrelation der beiden Neutronen außerhalb des 16 O-Rumpfes erklären (Sie können 1d5/2 - bzw. 2s1/2 Zustände besetzen.), zum anderen kann der Kern kollektives Verhalten aufweisen, das von der Rotation deformierter Kerne bis zur Vibration des ganzen Kernes sogenannten Riesenresonanzen reichen kann. Dies übersteigt jedoch den Umfang dieser Vorlesung.WEISSKOPFEINHEITEN FUER NIVEAUUEBERGAENGE EINFUEGEN Einzelteilchenmodell in deformierten Kernen bzw. Potentialen Wir haben bereits in Kapitel 4.1.5 gesehn, daß Kerne ein Quadrupolmoment haben können, d.h. daß ihre Ladungsverteilung von der Kugelform abweicht. Das Einteilchenschalenmodell ging ursprünglich von einem kugelförmigen Potential aus, dies läßt sich jedoch z.B. für den harmonischen Oszillator relativ einsichtig auf nicht kugelförmige Konfigurationen erweitern. Nilsson führte 1955 ein anisotropisches Oszillatorpotential ein: m 2 2 ~ ω (x + y 2 ) + ωz2 z 2 + C(~l · ~s) + D~l2 . ∆+ H=− 2m 2 85 2 Hier ist ω = ω02 (1 + δ), ωz = ω02 (1 − 43 δ) und D gibt eine Abschwächung des Oszilla3 torpotentials für große Drehimpulse also für weit vom Ursprung entfernte Zustände an. Der Deformationsparameter δ ist für ein Rotationsellipsoid mit der großen Achse a bzw. der kleinen Achse b über a+b a−b , R0 = δ= R0 2 definiert. Mit diesem Modell war es möglich Energieverschiebungen in Abhängigkeit vom Deformationsparameter zu berechnen. 4.2.4 Kollektivmodelle Wie erwähnt muß das Einteilchen-Schalenmodell erheblich erweitert werden, um Energieniveaus und magnetische Momente von Kernen zu erklären, die weit von den abgeschlossenen Schalen entfernt liegen. Diese Kerne weisen zumeist eine stark von der Kugel abweichende Form auf und besitzen dadurch elektrische Quadrupol- oder höhere Momente. Aus Zeitgründen kann auf solche Kerne nicht tiefer eingegangen werden. Es sei jedoch erwähnt, daß verformte Kerne Rotationen senkrecht zur ihrer Symmetrieachse ausführen können, was zu sogenannten Rotationsbanden führt. (Die Rotation um die Symmetrieachse untscheidet sich Quantenmechanisch nicht vom nicht-rotierenden Zustand, dies gilt ebenso für die Rotation kugelförmiger Kerne.) Die Beschreibung der Rotation um eine Achse R geschieht in Analogie zum Kreisel in der klassischen Mechanik. (Siehe z.B. Fließbach Band 1.) Es wird ein Raum- und ein Körperfestes System mit Achsen x, y, z bzw. x′ , y ′ z ′ eingeführt. Wird das Analog zur Coriolis-Wechselwirkung als klein vernachlässigt, ergibt sich für den Gesamtdrehimpuls um die Achse R 2 IR = I(I + 1) − K 2 ~, ~ die Projektion des Drehimpulses auf die z ′ -Achse, d.h. die Symmetrieachse wobei K des körperfesten Systems ist. In der klassischen Mechanik ist der Drehimpuls mit dem Trägheitsmoment über 2 IR = Θ2 ω 2 verknüpft. Die Rotationsenergie ergibt sich dann zu I(I + 1) − K 2 i2R = ~. Erot = 2Θ 2Θ Werden die Rotationsbanden vermessen und daraus auf das Trägheitsmoment des Kernes zurückgeschlossen, ergibt sich, daß das Trägheitsmoment von Kernen zwischen den zwei Extremfällen (jeweils für ein Rotationsellipsoid) eines starren Körpers Θstarr = 2 2 M Rm (1 + 0.31β) 5 und dem einer Flüssigkeit Θf lg = 9 M R2 β 8π liegt. Genau: Θstarr > Θ > Θf l . Zudem stellt sich heraus, daß sich das Trägheitsmoment für hohe, angeregte Drehimpulse also für hohe Rotationsfrequenzen ändert. Dieser Effekt wird Backbending Effekt 86 genannt und kann z.B. auch in Neutronensternen beobachtet werden. Zusätzlich zu den Rotationen können auch Kernvibrationen angeregt werden, die im einfachen Einschalenmodell nicht enthalten sind. Hier wird zwischen Oberflächenschwingungen und Vibrationen, die den ganzen Kern miteinbeziehen, sogenannten Riesenresonanzen unterschieden. Die Vibrationen werden zudem nach Dipol-, Quadrupol-, Oktupol-,... Schwingungen unterschieden. (Für Riesenresonanzen kommen noch Monopolschwingungen hinzu, die jedoch nicht durch Photon-Kern-Streuung angeregt werden kann.)Als kurzes Beispiel wird eine Oberflächen-Quadrupolschwingung betrachtet. Wird der Kern als eine Flüssigkeit betrachtet und eine Abweichung von der Kugelform zugelassen, dann kann die zeitlich veränderliche Variable R(t) via Kugelflächenfunktionen dargestellt werden +λ X X R(t) = Rm + αλµ (t) Yλµ (θ, φ), λ µ=−λ wobei Rm der mittlere Radius eines kugelförmigen Kernes ist. (Auf die Bedingungen an die Koeffizienten werden wir nicht genauer eingehen. Spiegelsymmetrie verlangt allerdings αλµ = αλ−µ ) Ein Rotationsellipsoid hätte z.B die Form R(θ, φ) = Rm [1 + β Y20 (θ, φ)] wobei β mit dem Deformationsparameter δ über r 4 π δ β= 3 5 verknüpft ist. Eine Quadrupolvibration λ = 2 würde dementsprechend durch die Koeffizienten α2µ beschrieben werden. Konkret wären diese α20 = β cos γ, 1 α22 = √ β sin γ, 2 dabei gibt γ die Abweichung des Kerns von der Axialsymmetrie an, β wie bereits erwähnt die Länge des Rotationsellipsoids. Die Kernoberfläche wäre in diesem Fall durch den Radius 1 R = Rm 1 + β cos γ Y20 + √ β sin γ Y22 2 bestimmt. Die Quadrupolschwingungen werden dann nach β- und γ-Schwingungen unterschieden, die entweder eine Veränderung der Länge des Kerns oder seines axialen Querschnitts beschreiben. Riesenresonanzen stellen nun Schwingungen dar, bei denen nicht nur die Oberfläche des Kernes, sondern das komplette Volumen betroffen ist. (Auch hier liefert die Beschreibung des Kernes als Flüssigkeitstropfen wieder ein anschauliches und mehr oder weniger korrektes Bild.) Sie werden bei Anregungsenergien über der Separationsenergie gemessen ERR ≥ 10 M eV und können als Monopol-, Dipol, Quadrupol-,...Schwingungen auftreten. (Die Monopolschwingung wird auch als Atmung bezeichnet.) Es können sowohl Zustände auftreten, in denen die Neutronen und Protonen gegenläufig schwingen, Isovektorschwingungen, wie auch Zustände in denen diese in die gleiche Richtung schwingen, isoskalare Schwingungen. Isovektor und isoskalar bezieht sich hier auf den Isospin von Protonen und Neutronen. Diese Eigenschaft wurde vor dem Aufkommen des Quarkmodells eingeführt und gibt an, daß es sich bei Protonen und Neutronen um zwei Zustände ein und desselben Teilchens handelt. Dieses Teilchen hat einen Isospin von I = 12 . Das Proton ist 87 die Iz = + 21 -Einstellung, das Neutron die Iz = − 12 Einstellung. Zum Schluß seien noch exotische Kerne in der Nähe der sogenannten Abbruchkanten erwähnt. Da wären auf der einen Seite z.B. der doppelt-magische Kern 100 Sn, nach bisherigen Erkenntnissen der letzte doppelt-magische Kern mit gleichvielen Protonen wie Neutronen, auf der anderen Seite die sogenannten Halo-Kerne. Letztere haben außerordentlich große Ausdehnungen ähnlich wie die Alkaliatome. Sie kommen auf einen mehr als doppelt so großen mittleren Radius wie normale Kerne mit vergleichbarer Schalenbesetzung. D.h. das die äußersten Neutronen eine große nicht scharf begrenzte Zone den sogenannten Halo bilden. Ein Beispiel für einen solchen Kern wäre z.B 11 Li. 4.3 Kernreaktionen In diesem Abschnitt soll ein kurzer Überblick über die bekanntesten Zerfälle sowie Kernspaltung und Kernfusion gegeben werden. Wie bereits gesehen, konzentrieren sich die stabilen Kerne auf ein schmales Band in der Z − N -Ebene. Für Isobare mit deutlichem Neutronenüberschuß kann es energetisch günstig sein, daß sich ein Neutron unter Aussendung eines Elektrons und eines Neutrinos in ein Proton umwandelt. (Eine Möglichkeit dies zu bestimmen liegt in dem Vergleich der Energieniveaus von Protonen und Neutronen. Ein freies Neutron ist aufgrund seiner größeren Masse als das Proton instabil und zerfällt mit einer mittleren Lebenszeit von τ = 885.7 s.) Umgekehrt kann es günstig sein, daß sich ein Proton unter Aussendung eines Positrons und eines Neutrinos in ein Neutron umwandelt. Schwere Kerne werden aufgrund der zunehmenden Coulombabstoßung instabil und haben die Möglichkeit, in zwei Tochterkerne zu zerfallen. Einer dieser Tochterkerne ist dabei zumeist ein Heliumkern A = 4, Z = 2, erst ab einer Ordnungszahl Z ≥ 110 wird der Zerfall in zwei etwa gleich schwere Kerne relevant. Generell gilt für einen solchen Zweikörperzerfall die Bedingung: M (A, Z) > M (A − A′ , Z − Z ′ ) + M (A′ , Z ′ ). (Die Gesamtzahl von Protonen und Neutronen bleibt erhalten.) Rückgreifend auf den Abschnitt Zerfallsraten werden hier noch einmal einige Begriffe erläutert bzw. einige, die insbesondere für radioaktive Zerfälle gebraucht werden, eingeführt. Äquivalent zur Zerfallsbreite Γ, die meist in der Teilchenphysik Verwendung findet, wird die Zerfallskonstante λ (oder z.B. fπ für das Pion) definiert. Sie ist mit der mittleren Lebensdauer und der Halbwertszeit ebenso wie die Zerfallsbreite verknüpft: τ= 1 , λ t1/2 = log 2 . λ Die Zerfallskonstante bzw. Zerfallsbreite radioaktiver Kerne wird über die Aktivität, die Zahl der Zerfälle pro Zeiteinheit, gemessen A=− dN = λN = λ N0 e−λt = A0 e−λt . dt (N0 = N (t = 0))Als Einheit wird 1 Becquerel 1 Bq [Becquerel] = 1 Zerfall s in älteren Veröffentlichungen auch 1 Curie 1 Ci [Curie] = 3.7 · 1010 Bq 88 verwendet. Die mittlere Lebensdauer wird über das statistische Zerfallsgesetz als Erwartungswert definiert R∞ 0 τ = hti = R ∞ 0 4.3.1 β-Zerfall dN R∞ −λt t 1 dt = R0 dt t e = . ∞ −λt dN λ dt e 0 dt dt dt FERMI-UND-GAMOW-TELLER-ZERFAELLE EINFUEGEN In den Übungen wurden bereits Massenisobare behandelt, d.h. Kerne mit gleicher Massenzahl A aber unterschiedlicher Ordnungszahl Z. Wir wollen den β-Zerfall mit diesem einfachen Modell diskutieren. Vereinfacht läßt sich die Bethe-Weizsäcker Formel für solch einen Fall als quadratische Formel in Z schreiben, wobei hier die Elektronenmasse mitberücksichtigt wird: M (A, Z) = α · A − β · Z + γ · Z2 + α = Mn − aV + as A− 3 + β = γ = δ 1 A2 aa , 4 aa + (Mn − Mp − me ), aa ac + 1, A A3 1 mit δ dem Paarungsterm. Für ungerades A, d.h. für gu- bzw. ug-Kerne, ergibt sich β demnach eine Parabel mit Minimum bei Z = 2γ . Für gerades A ergeben sich zwei um die doppelte Paarungsenergie vertikal zueinander verschobene Parabeln für gg- bzw. uu-Kerne. Der Kern mit der kleinsten Masse in solch einer Isobare ist stabil gegenüber βZerfall. Für Kerne mit ungerader Massenzahl ergibt sich demnach ein mehr oder weniger triviales Bild. Es existiert ein stabiles Element, alle anderen können via β-Zerfall die Massenparabel entlangmarschieren, siehe Abbildung 22. Abbildung 22: Zerfallsparabeln für den β-Zerfall, die sich aus der Bethe-Weizsäcker Massenformel ergeben. bei Als Beispiel wird z.B. in Povh, Rith, Scholz, Zetsche für A = 101 das Minimum 101 Ru angegeben und der β − -und β + -Zerfall betrachtet. Die Grundreaktionen für 89 β − -bzw. β + -Zerfall lauten n −→ p + e− + ν̄e p −→ n + e+ + νe , wobei νe , ν̄e ein Elektron-Neutrino bzw. Elektron-Antineutrino sind. Der Marsch geschieht dann über die Zerfälle 101 42 M o 101 43 T c −→ −→ 101 − 43 T c + e + ν̄e , − 101 44 Ru + e + ν̄e 101 46 P d 101 45 Rh −→ −→ 101 45 Rh 101 44 Ru bzw. + e+ + ν e , + e+ + ν e . Der β − -Zerfall ist energetisch immer möglich sobald M (A, Z) > M (A, Z + 1) gilt, während beim β + -Zerfall noch die Massen der überschüssigen Elektronen berücksichtigt werden muß M (A, Z) > M (A, Z − 1) + 2me . Etwas anders sieht dies für die gg- bzw- uu-Kerne aus. Dort kann es sein, daß die benachbarten uu-Kerne energetisch ungünstiger liegen und daher nur ein doppelter β-Zerfall möglich ist. Solch ein Prozeß ist jedoch sehr unwahrscheinlich, so daß die Halbwertszeiten solcher Nuklide sehr hoch liegen oder sie sogar als stabil angesehen werden. Z.B. 106 48 Cd + −→106 46 P d + 2e + 2νe . Eine weitere Möglichkeit des β-Zerfalls ist der Elektroneneinfang. Elektronen der Atomhülle haben eine nichtverschwindende Aufenthaltswahrscheinlichkeit im Kern. Dies kann zu der Reaktion p + e −→ n + νe führen. Der Elektroneneinfang konkurriert mit dem β + -Zerfall, ist energetisch günstiger, da nur die Anregunsenergie ǫ der Elektronenschale des jeweiligen eingefangenen Elektrons aufgebracht werden muß M (A, Z) > M (A, Z − 1) + ǫ. Es existieren keine benachbarten Isobare, die beide β-stabil wären, allerdings sind einige Isobare, die in stabile Kerne zerfallen, sehr langlebig, so daß sie auch als stabil angesehen werden. Z.B. 115 In und 187 Re, die mit einer Lebenszeit von τ = 3·1014 a bzw. τ = 3·1011 a in 115 Sn bzw. 187 Os zerfallen. 4.3.2 α-Zerfall Der α-Zerfall ist im Prinzip nur ein Sonderfall des spontanen Zerfalls in zwei leichtere Kerne. Die Emission eines gebundenen Zustandes ist energetisch günstiger als Emission einzelner Nukleonen, da zusätzlich die Bindungsenergie dieses Zustandes zur Verfügung steht. Allerdings nimmt die Wahrscheinlichkeit, daß sich ein gebundenes System innerhalb des Kernes formiert rapide mit zunehmender Nukleonzahl des gebundenen Systems ab. 90 Aus diesem Grunde fällt dem α-Zerfall eine Sonderrolle zu, da 4 He-Kerne im Vergleich zu leichteren Kernen sehr stark gebunden sind ∼ 7 M eV pro Nukleon im Gegensatz zu ∼ 1 − 2 M eV pro Nukleon und zudem eine recht kleine Anzahl an Nukleonen benötigen. (Dennoch finden α-Zerfälle fast ausschließlich bei Kernen schwerer als Blei statt. Kerne mit niedriger Massenzahl können zwar theoretisch auf diesem Wege zerfallen, haben jedoch zumeist eine sehr hohe Halbwertszeit.) Davon ausgehend, daß es sich um einen Zweikörperzerfall handelt, kann zunächst klassisch aus einer einfachen kinematischen Überlegung die kinetische Energie der α-Teilchen bestimmt werden. Wird das Ruhesystem des Mutterkerns X betrachtet, so ergibt sich mX c 2 (mX − mY − mα )c2 = = mY c 2 + T Y + mα c 2 + T α TY + Tα Wir kürzen die Massendifferenz mit Q ab und nutzen Impulserhaltung, die p~Y = −~ pα verlangt, um Q Tα = mα 1+ m Y zu erhalten. Wird das α-Spektrum eines Kernes gemessen, so ergeben sich stets mehrere scharfe Linien, was nichts anderes heißt, als daß im Tochter-bzw. Rückstoßkern verschiedene angeregte Zustände eine Rolle spielen können. Betrachtet man die Potentialverhältnisse im Kern, meist vereinfacht als Coulombpotential und Potentialtopf dargestellt, dann ist der α-Zerfall klassisch nicht möglich. Das α-Teilchen muß also durch die Coulombbarriere tunneln. (Es hat eine positive Energie, da sonst kein Zerfall stattfinden könnte, wird aber durch die Barriere zurückgehalten.) Dies läßt sich näherungsweise als Durchtunneln vieler einfacher Potentialbarrieren diskutieren. (Korrekter geschähe dies mittels der WKB-Methode, aber hier soll nur eine kurze Veranschaulichung gegeben werden.) Der Transmissionskoeffizient der einfachen Barriere ist bekannt: (2kκ)2 . |T |2 = 2 (k + κ2 )2 sinh2 2κa + (2kκ)2 Dies läßt sich für κa ≫ 1 mit κ= r 2m (V0 − E) ~2 und a der Barrierenbreite als |T |2 ∼ e−4κa schreiben. Werden Effekte an den Umkehrpunkten, d.h. an den Punkten, an denen das Teilchen in das Potential eindringt bzw. wieder hervorkommt vernachlässigt, wird angenommen, daß der Transmissionskoeffizient an jeder Barriere klein ist, und wird die etwas selbstwidersprüchliche Annahme gemacht, daß κa ≫ 1 auch für sehr schmale Barrieren, d.h. im Grenzwert zum Integral, gilt, dann kann der Transmissionskoeffizient als ! Z b r 2m [V (r) − E] dr |T |2 ≈ exp −2 ~2 R geschrieben werden, mit R dem Kernradius und b dem Umkehrpunkt an dem E = V (r) gilt, d.h. die Coulombarriere wurde durch ein Integral über Rechteckpotentiale 91 angenähert. (Dieses Ergebnis läßt sich auch aus der WKB-Näherung gewinnen.) Wird das Coulombpotential eingesetzt so wird der Exponent zu G=2 2m ~2 21 Z b dr R Z 1 Z 2 e2 −E 4πǫ0 r 21 . Dies ist der sogenannte Gamow-Faktor (nach George Anthony Gamow) der entscheidend die mittlere Lebensdauer von α-Strahlern bestimmt. Das Integral kann exakt berechnet werden " 21 1 1 # Z b √ 1 1 2 R R R2 2 dr − − 2 = b arccos − r b b b b R und für kleine Energien verglichen mit der Coulombbarriere, d.h. für b ≫ R via 1 " 21 # R 2 2mZ1 Z2 e2 b 2 π − G= ~ 4πǫ0 2 b angenähert werden. b ist nach obiger Definition des Umkehrpunktes b= Z 1 Z 2 e2 . 4πǫ0 E Wird das α-Teilchen nichtrelativistisch mit einer Endgeschwindigkeit v angenommen, dann kann mv 2 E= 2 geschrieben werden und der Gamow-Faktor wird zu G≈ c 2πZ1 Z2 e2 . = 2παZ1 Z2 4πǫ0 ~v v Wie zu sehen ist, hängt demnach die Wahrscheinlichkeit, die Coulombbarriere zu durchtunneln e−G empfindlich von der Energie des α-Teilchens ab. Um die Wahrscheinlichkeit, daß ein α-Teilchen den Kern verläßt, pro Zeiteinheit abzuschätzen, bedarf es noch der v sein wird und der WahrscheinAnzahl der Stöße an die Barriere, die proportional zu 2R lichkeit w(α), daß sich ein α-Teilchen im Kern bildet. Dann gilt: λ ∼ w(α) v0 −2G e . 2R Aus der exponentiellen Abhängigkeit von der Energie der α-Teilchen lassen sich so die großen Lebensdauerunterschiede, es werden Lebensdauern zwischen 10 ns und 1017 a gemessen, zumindest plausibel machen. Zerfallsreihen: Das in der Natur nicht nur radioaktive Isotope vorkommen, die schon bei der Entstehung der Erde vorhanden waren oder gebildet wurden, sondern daß auch beständig neue radioaktive Elemente hinzukommen, kann über die vier natürlichen Zerfallsreihen erklärt werden. Vier gibt es, weil sich diese durch α- un d β-Zerfall nicht überschneiden werden. Sie werden als 4n- bis 4n + 3-Reihe bezeichnet, je nachdem ob ihre Isotope durch vier teilbar sind oder ob ein Rest bleibt. In Tabelle 5 sind die namensgebenden Nuklide der Zerfallsreihen, ihre Halbwertszeiten und ihre Endprodukte angegeben. 92 Nomenklatur 4n 4n + 1 4n + 2 4n + 3 Mutternuklid 232 Th 237 Np 238 U 235 U Halbwertszeit 1.405 · 1010 a 2.14 · 106 a 4.468 · 109 a 7.038 · 108 a Endprodukt Pb 209 Bi 206 Pb 207 Pb 208 Zerfälle 6α, 4β − 7α, 4β − 8α, 6β − bzw. 10α, 8β − 7α, 4β − Tabelle 5: Mutternuklid, Halbwertszeit, Endprodukt und Zerfälle der natürlichen Zerfallsreihe. Die Elemente der Neptuniumreihe sind aufgrund der kurzen Halbwertszeit in der Natur kaum noch anzutreffen. Oft wird bei der Neptuniumreihe auch 241 Pu als Ausgangselement genommen. 209 Bi ist strenggenommen ein α-Strahler mit einer Halbwertszeit von 19 · 1015 a. in der Thorium Reihe sind noch Vorgängerelemente bis zum 244 Pu auf der Erde vorhanden. 4.3.3 Kernspaltung KONZEPTE VON KERNKRAFTWERKEN EINFUEGEN Spontane Spaltung. Wie nun mehrfach gesehen erreicht die Bindungsenergie pro Nukleon im Bereich um 56 Fe 56 58 ein Maximum, die drei stabilsten Nuklide sind 62 28 Ni, 26 Fe und 26 Fe, wobei letzteres den Endpunkt der meisten Fusionszyklen bildet und fällt bei schwereren Kernen mit steigender Kernmasse langsam ab. Prinzipiell könnten demnach Kerne mit einer Ordnungszahl Z ≥ 40 spontan in zwei leichtere Tochterkerne zerfallen. Wie beim α-Zerfall muß hierfür jedoch eine Potentialbarriere durchtunnelt werden. Diese ist im Allgemeinen so groß, daß spontane Spaltung fast nur für Kerne jenseits des Urans mit dem α-Zerfall konkurriert, wobei dieser strenggenommen nur ein Spezialfall der spontanen Spaltung ist. Eine Abschätzung der Ladungszahl, ab der Kerne zu spontaner Spaltung neigen, läßt sich aus einem Vergleich der Oberflächen-und Coulombenergie bei Verformung des Kernes gewinnen. Gewönne ein Kern Energie durch Verformung, so ist dieser instabil. Diese Abschätzung ergäbe einen Wert Z ≥ 114 bzw. A ≥ 270. Induzierte Spaltung. Aus bereits gesagtem kann geschlossen werden, daß schwere Kerne (Z ≈ 92) eine niedrige Spaltbarriere haben. Diese Energie ließe sich z.B. durch einen Fluß Neutronen zufügen. Wird beim Neutroneneinfang zudem eine Bindungsenergie frei, die größer als die Schwellenenergie für Kernspaltung ist, dann kann es mittels niederenergetischer Neutronen zu Kettenreaktionen kommen. Dies ist z.B. für 235 U, 233 Th und 239 Pu der Fall. Hier werden einmal die Zerfälle des bekanntesten Spaltmaterials 235 U angegeben: 235 92 U ∗ + n −→236 92 U −→ −→ −→ 96 136 36 Kr +56 Ba + 4n 95 139 37 Rb +55 Cs + 2n 92 141 38 Sr +54 Xe + 3n Die Zahl der Neutronen ν aus einer Spaltung, die durch Neutronen der Energie E induziert wird, läßt sich empirisch durch einen linearen Zusammenhang angeben. ν(E) = ν0 + a E In nachfolgender Tabelle sind die Werte für einige Isotope sowie das Verhältnis des Gammaemissionswirkungsquerschnitts zum Spaltquerschnitt angegeben. 93 233 ν0 (je Spaltung) a (MeV−1 ) α = σγ /σf U 2.49 0.131 0.093 235 U 2.41 0.136 0.17 239 Pu 2.9 0.127 0.37 241 Pu 2.94 0.4 Tabelle 6: Quelle: Bethge, Walter Wiedemann Kernphysik“ ” Energiegewinnung aus Kernspaltung: Wie gesehen kann z.B. 235 U via thermischer Neutronen gespalten werden. Dabei wird außer zusätzlichen Neutronen, die für eine Kettenreaktion benötigt werden, eben auch Energie frei, die genutzt werden kann. (Zivil oder militärisch.) Dies soll hier kurz genauer betrachtet werden, ohne auf die technischen Details eines Kernkraftwerkes oder gar einer entsprechenden Bombe einzugehen. (Letzteres würde vermutlich auch für unnötige Aufmerksamkeit an dieser Vorlesung sorgen.) Die schematische Reaktionsgleichung lautet: 236 U + γ + Qγ (Qγ = 6.54 MeV) 235 236 ∗ U + n −→ U −→ f1∗ + f2∗ + νnf + ν̄e + Q f1∗ , f2∗ sind die angeregten Spaltprodukte, νnf die Anzahl von Spaltneutronen, ν̄e Elektron-Antineutrinos und Q die gesamte freigesetzte Reaktionsenergie, die sich folgendermaßen zusammensetzt: (Quelle‘: Bethge, Walter, Wiedemann) 167 ± 5 MeV 5 ± 0.2 MeV 8.0 ± 1.5 MeV 6 ± 1 MeV 6 ± 1 MeV 12.0 ± 2.5 MeV 204 ± 6 MeV Da Neutrinos nur sehr schwach mit Materie wechselwirken, kann deren Energie nicht berücksichtigt werden. Dementsprechend ergeben sich im Mittel 192 MeV= 3.08 · 10−11 Ws, die technisch verwertet werden können. Dementsprechend sind 3.25 · 1010 Spaltungen pro Sekunde erforderlich, um eine nutzbare Spaltleistung von 1 W zu erzeugen. Ein Gramm metallisches Uran enthält 2.55 · 1021 Atomkerne und demnach ein Potential an Spaltungsenergie von etwa 22 MWh. (Allerdings muß berücksichtigt werden, daß selbst hochangereichertes Uran nur ∼ 80% 235 U enthält.) Zum Vergleich: 2.7 Tonnen Kohle bzw. 1.9 Tonnen Erdöl hätten den gleichen Energiegehalt durch chemisches Verbrennen. Um aus einem Kernspaltungsprozeß kontinuierlich Energie zu gewinnen, bedarf es eines grundsätzlichen Faktums: Es müssen stets soviele Neutronen zur Verfügung stehen, daß die Kettenreaktion aufrechterhalten werden kann. In den vorgestellten Kernspaltungen werden zwar im Mittel über zwei Neutronen frei, aber ebenso gehen zwischen den Reaktionen wieder Neutronen verloren. Dieser grundsätzliche Umstand kann über den Reproduktionsfaktor k beschrieben werden. Er ist definiert als 1. 2. 3. 4. 5. 6. Kinetische Energie der Spaltfragmente Kinetische Energie von ν Spaltungsneutronen Prompte γ-Strahlung Verzögerte γ-Strahlung aus den Spaltfragmenten β-Strahlung der Spaltfragmente Kinetische Energie der Elektron-Antineutrinos ν̄e Zahl der Neutronen in der (n+1)-ten Generation Zahl der Neutronen in der n-ten Generation und muß nach dem oben gesagten größer oder gleich eins sein. Für einen unendlich großen Reaktor wird dieser durch vier Faktoren bestimmt. (Daher kommt in der Literatur der k= 94 innovative Name Vierfaktorformel.) k∞ = η · f · P · ǫ hierbei sind (am Beispiel des 235 U) η der Generationenfaktor, d.h. die mittlere Zahl von schnellen Spaltneutronen, die aus dem Einfang eines thermischen Neutrons entstehen, d.h. es wird das Verhältnis aus Spaltquerschnitt und gesamten Einfangsquerschnitt mit der Anzahl der in einer Spaltreaktion emittierten Neutronen ν multipliziert: η= σf (235 U) σf (235 U) ν + σγ (235 U) + σγ (238 U) Schnellspaltfaktor ǫ ǫ= Zahl der Kernspaltungen Zahl der durch thermische Neutronen induzierten Kernspaltungen Dieser trägt dem Umstand Rechnung, daß auch schnelle Neutronen in seltenen Fällen Kernspaltungen induzieren können. P Moderationserfolg bzw. Wahrscheinlichkeit, daß die schnellen Neutronen dem Resonanzbereich des Wirkungsquerschnitts der 238 U(n, γ)239 U-Reaktion entkommen. Allgemein: Während der Moderation werden einige schnelle Neutronen vom Moderator oder Brennmaterial eingefangen. Der thermische Nutzungsfaktor f . f= Vom Brennstoff eingefangene thermische Neutronen Insgesamt eingefangene thermische Neutronen Für einen realen Reaktor müssen noch zwei Faktoren Ps , Pt , die das herausdiffundieren der schnellen und thermischen Neutronen berücksichtigen, hinzugefügt werden. kef f = Ps · Pt · k∞ > 1 4.3.4 Kernfusion Die Kernfusion soll in diesem kurzen Abschnitt vorwiegend als Prozeß zur Energieerzeugung betrachtet werden und nicht, wie sie zum Beispiel am GSI in Darmstadt verwendet wird, als Möglichkeit zur Erzeugung schwerer Elemente. Zunächst eine Auflistung von Reaktionen, die für die Erzeugung von Energie von Relevanz sind: d+d d+3 He d+d d+t d+6 Li p+7 Li −→ −→ −→ −→ −→ −→ 3 4 He+n+3.25 MeV He+p+18.3 MeV 3 t+p+4 MeV He+n+17.6 MeV 24 He+22.4 MeV 4 24 He+17.3 MeV 95 4.3.5 Künstliche Kernfusion Als künstliche Energiequelle werden vorwiegend d+d und d+t Reaktionen in Betracht gezogen, da diese die geringste Coulombabstoßung aufweisen. (Tritium ist allerdings nicht stabil und ein β-Strahler: Halbwertszeit 12.32 Jahre, mittlere kinetische Energie des Elektrons: 5.7 keV. Zudem ergibt sich das Problem, daß Tritium nicht in ausreichender Menge natürlich vorkommt und dementsprechend entweder als Abfallprodukt aus Schwerwasserreaktoren entnommen oder im Fusionsreaktor mittels vorhandener Neutronen aus 6 Li+n −→4 He+t+4.78 MeV erbrütet werden müßte.) Für den unrealistischen Fall, daß ein Gramm Deuterium und Tritium vollständig fusioniert würde, ergäbe sich unter Vernachlässigung der nötigen Energie zum zünden einer solchen Reaktion ein Energiegehalt von fast 100 MWh, entsprechend 12.28 Tonnen Kohle. Die technischen Probleme, die einer Nutzung der Fusionsenergie im Wege stehen, können in dieser Vorlesung nicht ausreichend behandelt werden, daher sei z.B. auf die Seite des Iter-Projektes verwiesen: www.iter.org. Das augenscheinlichste Problem liegt in dem geringen Wirkungsquerschnitt der Fusionsreaktion, da unter anderem zunächst die Coulombbarriere überwunden werden muß. (Liegt die Energie der Fusionspartner in der Nähe der Energie eines angeregten Zustandes des resultierenden Kernes, so kommt es auch hier zu Resonanzen.) Dies erfordert die Aufrechterhaltung von Temperaturen im Bereich ∼ 109 K bzw. einigen keV. Ein Plasma dieser Temperatur vermag nicht in gewöhnlichen Behältern verwahrt zu werden, zudem kühlt es bei hypothetischen Kontakt mit einer Hülle schnell ab, was zu hohen Energieverlusten führte. Um dieses Problem zu lösen wird vorwiegend an dem Einschluß des Plasmas in einem toroidalen Magnetfeld geforscht. Hierbei werden zwei Konzepte verfolgt: Das Tokamakund das Stellerator-Prinzip. (Siehe Abbildung 23 und 24) Im Tokamak wird der Ein- Abbildung 23: Schema eines Tokamak schluß des Plasmas durch torusförmige Magnetspulen erreicht. Um Verwirbelungen im Plasma zu verhindern bzw. einen Drift des Plasmas nach außen ist es jedoch nötig ein spiralförmiges Magnetfeld innerhalb des Plasmas zu erzielen. Dies wird erreicht, in dem 96 das leitende Plasma als Sekundärwindung eines Transformators verwendet wird. (Siehe Abbildung 23.) Ein so in dem Plasma induzierter Strom sorgt für ein kreisförmiges Magnetfeld im Torusquerschnitt und damit ergibt sich ein resultierendes spiralförmiges Feld. Da es jedoch nicht möglich ist, den Primärstrom im Transformator beständig zu erhöhen, um so weiterhin das poloidale Magnetfeld zu erzeugen, muß dieser von Zeit zu Zeit abgeschaltet werden, womit der Plasmaeinschluß verloren geht. Ein Tokamak müßte also gepulst operieren. Das Iter-Projekt im südfranzösischen Cadarache basiert auf dem Tokamak-Prinzip und soll erstmalig 500 MW bei 50 MW eingebrachter Leistung erzielen. Im Stellerator Prinzip soll der Einschluß des Plasmas allein durch die komplizierte Geo- Abbildung 24: Schema eines Stellerator metrie der Magnetspulen erreicht werden. (Siehe Abbildung 24.) Dies ermöglichte einen kontinuierlichen Betrieb, doch ist die Konstruktion der Magnetspulen erheblich aufwendiger. Der Wendelstein 7-x, der am Max-Planck-Institut für Plasmaforschung in Greifswald gebaut wird, soll ein optimiertes Magnetfeld prüfen, welches eine dem Tokamak ähnliche Einschlußqualität des Plasmas vorweisen soll. Beide Konzepte benötigen Supraleitende Magnetspulen. In beiden Konzepten ergeben sich weitere technische Probleme, über die Heizung des Plasmas (im Wendelstein soll dies über Mikrowellen geschehen.) bis zur Abführung der entstehenden α-Teilchen. Hierzu muß jedoch auf entsprechende Spezialvorlesungen verwiesen werden, z.B. http://reaktiveplasmen.rub.de/files/skripten/skriptPP.pdf Ein wichtige Voraussetzung für die Energiegewinnung aus der Kernfusion besteht in der Erfüllung des Lawson-Kriteriums, von John D. Lawson 1957 veröffentlicht. Dieses Kriterium verleiht der intuitiven Vorstellung Rechnung, dass eine ohne äußere Energiezufuhr weiterbrennende Fusionsreaktion eine höhere Energieleistung bzw. Heizleistung haben sollte als Verlustleistung. Zur Veranschaulichung nehmen wir den Fall der DeuteriumTritium Fusion, wobei ein ideales Plasma ohne Verunreinigung und ohne Heliumasche in einen 50-50 Mischungsverhältnis angenommen wird. Die Deuterium bzw. Tritium Teilchendichte nD , nT entspricht dann der halben Elektronendichte ne . Die Energiedichte beider zusammen lautet dann: W = 3ne kB T. 97 Die Reaktionsrate pro Volumen läßt sich als f = nD nT hσvi = 1 2 n hσvi 4 e wobei hσvi das Produkt aus mittlerer Geschwindigkeit v und dem Fusionsquerschnitt σ gemittelt über die Maxwellsche Geschwindigkeitsverteilung ist, schreiben. Die Heizleistung pro Volumen ist dann f multipliziert mit der Energie der geladenen Fusionsprodukte, da die ungeladenen Produkte keinen Beitrag zur Erhitzung des Plasmas liefern. Für die betrachtete Reaktion liegt diese bei Ech ≈ 3.5 MeV. Mit der Energieeinschlußzeit τE , d.h. der Zeit in der ein System seine Energie an die Umgebung abgibt W , PV erlust τE = PV erlust ist die Rate des Energieverlustes pro Volumen und pro Zeit, läßt sich die Verlustleistung als W 3ne kB T PV erlust = = τE τE schreiben. Das Lawson Kriterium besagt nun, dass f · Ech ≥ PV erlust = W 3ne kB T = τE τE und wird üblicherweise in folgender Form geschrieben: ne τe ≥ 12 kB T . Ech hσvi Um eine konkrete Abschätzung zu bekommen, wird das absolute Minimum der Funktion T hσvi genommen. Für die angenommene Deuterium-Tritium Fusion betrüge diese ne τe ≥ 1.5 · 1020 s , m3 wobei das Minimum der Funktion ungefähr bei einer Temperatur von T = 25 keV angenommen wird. Häufig wird auch die Abschätzung für das Produkt ne τe T als LawsonKriterium angegeben: 12 kB T 2 ne τe T ≥ . Ech hσvi Dies hängt damit zusammen, dass für die meisten Konzepte des Plasma-Confinements zwar die Temperatur und die Dichte variiert werden kann, aber der Druck konstant ist. Dann ist die Energie, die aus der Fusion gewonnen wird, proportional zu p2 hσvi , T2 wobei p der Druck ist und damit wird das Maximum für die Energie für das Maximum von hσvi T 2 erreicht. Wird für die Verlustleistung nur die Bremsstrahlung der Elektronen herangezogen, so erhält man für die Deuterium-Tritium Fusion ein Zündtemperatur von 98 Abbildung 25: Werte für das Dreifachprodukt ne τe T , die an bisherigen Versuchsanlagen erreicht wurden. 4 keV und für Deuterium-Deuterium 35 keV. D.h. für Temperaturen jenseits dieser, wird mehr Heizleistung produziert als durch Bremsstrahlung verloren geht. In Abbildung 25 werden die bisher erreichten Werte für einige Versuchsreaktoren gezeigt. Hier ist allerdings zu bedenken, dass für Reaktoren, die mit Deuterium-Tritium Pellets arbeiten, die durch intensiven Laserbeschuß von allen Seiten zur Implosion gebracht werden, wie z.B. Jet, ein modifiziertes Kriterium gilt, für welches das Maximum von hσvi T 3/2 benötigt wird. Trivia: Fusionskonstante Die Fusionskonstante bezeichnet den Umstand, daß seit ca. 60 Jahren die Beherrschbarkeit der Kernfusion zur Energiegewinnung in 30-40 Jahren als möglich angesehen wird. 4.3.6 Stellare Kernfusion 1939 veröffentlichte Hans Bethe Energy Production in Stars“ in welchem er verschiedene ” Möglichkeiten der Fusion zur Energieproduktion in Sternen analysierte. Die Prozesse, die 99 er für dominant erachtete, waren die sogenannte Proton-Proton-Kette, siehe Abbildung 26 sowie der Bethe-Weizsäcker bzw. CNO-Zyklus, den etwa zeitgleich auch Carl Friedrich von Weizsäcker analysiert hatte, siehe Abbildung 27. Fred Hoyle stellte dann in einer Reihe von Veröffentlichungen zwischen 1946 und 1954 eine erste Theorie auf, wie schwerere Elemente in Sternen entstehen könnten. Diese Theorie wurde über die Jahre erweitert Abbildung 26: Schematische Darstellung des Wasserstoffbrennens und verfeinert. Als sogenannte Hauptsternphase wird die Zeit der Proton-Proton Kette Abbildung 27: Der Bethe-Weizsäcker-Zyklus, auch CNO-Zyklus, in welchem der Kohlenstoff 12 C als Katalysator dient. bzw. des Deuterium-Brennens, welches überschüssiges Deuterium verbraucht, und deren Endprodukt jeweils Helium ist, bezeichnet. Bei massiven Sternen, > 1, 3 mal die Sonnenmasse, wird der CNO-Zyklus dominant. Dieser wird in vier Zweige CNO I bis CNO IV mit absteigender Relevanz unterteilt. Zudem sind noch drei heiße CNO-Zyklen, die ausnutzen, dass bei genügend hoher Temperatur und genügend hohem Druck ein weiteres Proton aufgenommen wird, ehe es zu einem β-Zerfall kommen kann, wodurch sich weitere Fusionszweige öffnen. Im Anschschluß an die vorgenannten Zyklen findet das Heliumbrennen statt. Hier ist insbesondere der triple-α-Prozeß zu nennen, der durch Fusionierung von Helium zunächst zu Beryllium und schließlich zu Kohlenstoff führt, siehe Abbildung 28. Aus anthropischer Sicht kommt diesem Prozeß besonder Beachtung durch den Umstand zu, dass dieser 100 resonant abläuft, d.h. dass Berylliums Grundzustand fast exakt der Energie zweier αTeilchen entspricht bzw. ein angeregter Zustand des Kohlenstoffs fast exakt der Energie von Beryllium plus α-Teilchen. Ohne diese Resonanzen wäre dieser Prozeß erheblich unwahrscheinlicher und eine Produktion von Kohlenstoff wäre durch stellare Fusion nicht im beobachteten Maße möglich. Fred Hoyle hat diese Resonanzen auf Basis seiner Theorie der stellaren Nukleosynthese vorhergesagt, ehe diese beobachtet wurden. Schwerere Abbildung 28: Schematische Darstellung des Triple-α-Prozesses. Nuklide werden dann durch Kohlenstoffbrennen 12 6 C 12 6 C 12 6 C 12 6 C 12 6 C +12 6 C +12 6 C +12 6 C 12 +6 C +12 6 C −→ −→ −→ −→ −→ 20 4 10 N e +2 He + 4.617 MeV 23 11 N a + p + 2.241 MeV 23 12 M g + n − 2.599 MeV 24 12 M g + γ 13.933 MeV 16 4 8 O + 22 He − 0.113 MeV oder durch sukzessive Fusionierung von Helium 12 6 C 16 8 20 10 N e 24 12 M g +42 He +42 He +42 He +42 He −→ −→ −→ −→ 16 8 O 20 10 N e 24 12 M g 28 14 Si (4) erzeugt, wobei schwere Sterne, die nur noch Schwefel und Silizium im Kern vorliegen haben, sich weiter zusammenziehen, auf etwa 3 · 1 =9 K erhitzen und dann mit dem sogenannten Siliziumbrennen beginnen: 28 14 Si 32 16 S 36 18 Ar 40 20 Ca 44 22 T i 48 24 Cr 52 26 F e 56 28 N i +42 He +42 He +42 He +42 He +42 He +42 He +42 He +42 He −→ −→ −→ −→ −→ −→ −→ −→ 101 32 16 S 36 18 Ar 40 20 Ca 44 22 T i 48 24 Cr 52 26 F e 56 28 N i 60 30 Zn Beim letzten Prozeß wird Energie verbraucht, d.h. dem Stern ginge die Energiequelle verloren und er kollabiert. Der gesamte Prozeß des Siliziumbrennens dauert nur etwa + 56 56 einen Tag. 56 28 N i ist ein β -Strahler und zerfällt in 27 Co, welches wiederum in 26 F e zerfällt, womit dieses den Endpunkt dieser Fusionskette darstellt und daher obgleich 62 58 28 N i und 26 F e eine höhere Bindungsenergie pro Nukleon haben, meist fälschlicherweise als Maximum im Diagramm der Bindungsenergie in Abhängigkeit von der Massenzahl angegeben. 4.4 Radioaktive Strahlung und Strahlenschutz Wie in den vorhergehenden Abschnitten kann auch hier nur sehr kurz auf einige Aspekte des Strahlenschutzes und der biologischen Wirkung von radioaktiver Strahlung eingegangen werden. Zunächst werden die grundlegenden Einheiten definiert. Die Energiedosis wird als die übertragene Energie auf ein Massenelement definiert DE = ∆E ∆m und mit der abgeleiteten Einheit 1 Gray(Gy) 1 Gy = 1 J kg bezeichnet. Die alte, gelegentlich noch gebräuchliche Einheit ist 1 Rad (rd)=10−2 Gy. Die pro Zeiteinheit übertragene Energiedosis wird Dosisrate bzw. Dosisleistung genannt und ist über dDE ḊE = dt Gy definiert. Die Einheit lautet hier 1 s . Analog werden Ionendosis und Ionendosisrate als die Anzahl der erzeugten Elektron-Ion-Paar pro Masseneinheit bzw. pro Masseneinheit und Zeiteinheit definiert dDI ∆Q , ḊI = . DI = ∆m dt Sie werden mit der Einheit 1 A s bzw. 1 A angegeben. Hier kann man noch auf die kg kg alte Einheit 1 Röntgen=1 R =2.58 · 10−4 A s stoßen. Ionendosis und Energiedosis laskg sen sich über die mittlere Energie zur Erzeugung eines Ionenpaares (in Gasen um die 30 eV) in Beziehung zueinander setzen. Grenzwerte im Strahlenschutz werden allerdings üblicherweise in Sievert (Sv) der Einheit für die Äquivalenzdosis H angegeben. Diese trägt der biologischen Wirksamkeit verschiedener Strahlungstypen Rechnung und multipliziert die Energiedosis mit einem vom Strahlungstyp abhängigen dimensionslosen Strahlungswichtungsfaktor WR (früher Qualitätsfaktor Q): H = WR · D E . Die Strahlungswichtungsfaktoren für verschiedene Strahlungen sind in Tabelle 7 angegeben, die Wichtungsfaktoren für verschiedene Gewebetypen WT in Tabelle 8. Diese sollen zum Einen die untschiedlich starke Ionisationskonzentration wie auch die unterschiedlich Empfindlichkeit der verschiedenen Gewebe erfassen. (Diesbezüglich gibt es die Befürchtung daß im Falle von eingeatmeten oder anderweitig aufgenommenen α-Strahlern (inhalierten oder ingestierten) eine erhebliche Unterschätzung der biologischen Strahlenwirkung vorliegt, da ein eventueller Rückstoß auf den Tochterkern nicht 102 Art Photonen Elektronen, Myonen Neutronen Protonen außer Rückstoßprotonen α-Teilchen Spaltfragmente Schwere Kerne Energiebereich alle Energien alle Energien <10 keV 10 keV bis 100 keV >100 keV bis 2 MeV >2 MeV bis 20 MeV >20 MeV Strahlungswichtungsfaktor WR 1 1 5 10 20 10 5 >2 MeV 5 alle Energien 20 Tabelle 7: Strahlungswichtungsfaktor Stand 09/08 (Quelle:BfS) berücksichtigt würde. Dieser wird zwar aufgrund seiner Masse nur einen sehr kleinen Anteil der α-Energie erhalten, diese jedoch eben auch aufgrund seiner Masse in einem sehr konzentrierten Gebiet abgeben, wodurch es zu schweren Schäden kommen kann, wenn sich solch ein Nuklid z.B. an Chromosonen angesammelt haben sollte. (Insbesondere für 210 Po wurden Studien in Zusammenhang mit Krebserkrankungen durchs Rauchen durchgeführt.)) Die effektive Dosis setzt sich dann als gewichtete Summe der Organdosen zusammen: X Hef f = WT · H T . T In Tabelle 9 sind die Jahresgrenzwerte für verschiedene Personengruppen angegeben, die mit den natürlichen Strahlenbelastungen, im Mittel ∼ 2 msV/a verglichen werden können. Für Bayern läßt sich die externe Strahlenbelastung auch auf http://inters.bayern.de/kfue/station2.htm nachschauen, wobei sich für Regensburg via Extrapolation des momentanen Wertes 0.8 mSv/a (2011) ergibt, was nur leicht über dem deutschen Durchschnitt von etwa 0.7 mSv/a liegt. 4.4.1 Strahlenschäden Nachdem die verschiedenen Grenzwerte und Einheiten eingeführt wurden, sollen die verschiedenen Strahlenschäden kurz erläutert werden. Es wird zwischen somatischen Schäden, die beim bestrahlten Organismus selbst auftreten genetischen Schäden, die bei Nachkommen auftreten teratogenen Schäden, die während der Schwangerschaft eine Schädigung des Embryos verursachen unterschieden. Zudem werden bei den somatischen Schäden, Früh- und Spätschäden unterschieden. Frühschäden treten, wie der Name schon impliziert, bereits nach Stunden oder Tagen auf. Meist können diese erst nach einer gewissen Schwelldosis, die in kurzer Zeit (kurz im Vegleich zu physiologischen Heilprozessen) aufgenommen wird, nachgewiesen werden. 103 Gewebe oder Organe Keimdrüsen Knochenmark (rot) Dickdarm Lunge Magen Blase Brust Leber Speiseröhre Schilddrüse Speicheldrüsen Gehirn Haut Knochenoberfläche Andere Organe oder Gewebe1), 2) Gewebewichtungsfaktor WT laut StrlSchV 0.20 0.12 0.12 0.12 0.12 0.05 0.05 0.05 0.05 0.05 andere Organe andere Organe 0.01 0.01 0.05 ICRP 103 (207) Vorschlag 0.08 0.12 0.12 0.12 0.12 0.04 0.12 0.04 0.04 0.04 0.01 0.01 0.01 0.01 0.12 1) Für Berechnungszwecke setzen sich andere Organe oder Gewebe wie folgt zusammen: Nebennieren, Gehirn, Dünndarm, Niere, Muskel, Bauchspeicheldrüse, Milz, Thymusdrüse und Gebärmutter 2) In den außergewöhnlichen Fällen, in denen ein einziges der anderen Organe oder Gewebe eine Äquivalentdosis erhält, die über der höchsten Dosis in einem der 12 Organe oder Gewebe liegt, für die ein Wichtungsfaktor angegeben ist, sollte ein Wichtungsfaktor von 0.025 für dieses Organ oder Gewebe und ein Wichtungsfaktor von 0.025 für die mittlere Organdosis der restlichen Organe oder Gewebe eingesetzt werden. Tabelle 8: Gewebewichtungsfaktoren Stand 09/08 (Quelle:BfS) (Die Schwelldosis liegt für den Menschen zwischen 200 und 300 mSv.) Es kommt zu Blutbildveränderungen, Übelkeit, Durchfall, Fieber, etc... Spätschäden treten erst nach Jahren auf, obgleich die Schädigung bereits unmittelbar bei der Bestrahlung auftritt. Hier werden maligne, also Krebs, und nicht maligne Spätschäden, wie eine Trübung der Augenlinse unterschieden. Prinzipiell treten Strahlenschäden auf, indem Molekülbindungen aufgebrochen werden und dadurch frei Radikale entstehen. In vielen Fällen können diese wieder durch Selbsheilung bzw. Korrektur behoben werden, es sind aber Fälle möglich, in denen die Reparatur versagt, so z.B. Doppelstrangbrüche oder Doppelbasenschäden in der DNS. In solchen Fällen treten obengenannte Schäden auf, wobei es zudem die Unterscheidung in deterministische und stochastische Strahlenschäden gibt. Deterministische Strahlenschäden, die durch Zelltod ausgelöst werden und einer gewissen Dosisstärke bedürfen, fallen unter somatische und teratogene Schäden. Stochastische Schäden, bei denen Zellen veränderte DNA vererben, führen, wie der Name angibt, mit gewisser Wahrscheinlichkeit zu Spätfolgen , ähnlich wie spontane Mutationen. (Krebs ist hier nur die schlimmste Folge.) Diese Wahrscheinlichkeiten werden vermuttlich durch die Dosisstärke beeinflußt, daher spielen diese Schäden eine entscheidende Rolle bei der Festlegung von Grenzwerten im Strahlenschutz. Gesondert erwähnt sei hier noch die sogenannte Strahlenkrankheit. (Eventuell weglassen.) Sie tritt bei hohen akuten Dosen auf. Ab einer Dosis von etwa einem Sievert treten Symptome (Übelkeit, Erbrechen, Ermüdung, Appetitlosigkeit temporäre Unfruchtbarkeit, Haarausfall, innere und äußere Blutungen) der Strahlenkrankheit auf. Statistisch 104 Körperdosis Effektive Dosis Organdosis: 1. Keimdrüsen, Gebärmutter rotes Knochenmark 2. Augenlinse 3. Schilddrüse, Knochenoberfläche 4 Haut, Hände, Unterarme, Füße, Knöchel 5. Andere Organe Berufslebensdosis Jahresgrenzwerte der Körperdosen Beruflich Strahlenexponierte Einzelpersonen Kategorie A Kategorie B unter 18 Jahre der Bevölkerung 20 mSv 1 mSv 50 mSv - 150 mSv 15 mSv 300 mSv - 500 mSv 50 mSv 150 mSv 400 mSv - Tabelle 9: Jahresgrenzwerte für beruflich strahlenexponierte Personen und Personen der Bevölkerung zusätzlich zur natürlichen Strahlenbelastung Quelle: Haus der Technik, Unterlagen zum Strahlenschutzgrundkurs für Mediziner. werden unterschiedliche Letalitätsraten angegeben: (Es werden Ganzkörperdosen von Röntgen bzw. Gammastrahlung angegeben.) leichte Strahlenkrankheit 1-2 Sv, 10 % Todesfälle innerhalb von 30 Tagen: LD10/30 schwere Strahlenkrankheit 2-3 Sv, LD35/30 schwere Strahlenkrankheit 3-4 Sv, LD50/30 akute Strahlenkrankheit, 4-6 Sv, LD60/30 akute Strahlenkrankheit 6-10 Sv, LD100/14 akute Strahlenkrankheit 10-20 Sv, LD100/7 akute Strahlenkrankheit 20-50 Sv, LD100/3 über 50 Sv wird angenommen, daß der Tod in weniger als einem Tag eintritt Zum Vergleich: Die Dosen, die bei den unmittelbar an Strahlenfolgen verstorbenen Arbeitern in Tschernobyl gemessen wurden lagen zwischen 6 und 25 Gy. Einer bezeichnete das Gefühl als er in den Reaktorkern schaute, als hätten ihn tausende kleiner Nadeln gestochen. Bisher wurden vorwiegend die Folgen von externer Bestrahlung betrachtet. Von unmittelbarer Bedeutung, gerade in Zusammenhang mit α-Strahlern ist aber zusätzlich die Ingestion und Inhalation und demnach die effektive Halbwertszeit eines Nuklids im menschlichen Körper, d.h. die Zeit, nach der von einem aufgenommenen Nuklid noch etwa die Hälfte im Körper verblieben ist. Diese unterscheidet sich zum Teil erheblich je nachdem ob ein Element direkt ausgeschieden wird oder aber z.B. in die Knochen mit eingebaut wird wie 90 Sr. Die Definition der effektiven Halbwertszeit geschieht über die Kombination von biologischer und physikalischer Halbwertszeit, wobei die biologische Halbwertszeit angibt, in welcher Zeit ein Element aus dem Körper wieder ausgeschieden wird: 1 1 1 = + , tef f tbiol tphys tef f = tbiol · tphys . tbiol + tphys In Tabelle 10 sind die entsprechenden effektiven Halbwertszeiten angegeben. 90 Sr, 131 J, Cs und 137 Cs, allesamt β-Strahler, waren die Nuklide, die den größten Anteil an gesundheitlichen Schäden nach dem Tschernobylunfall hatten. 137 Cs liefert inzwischen den höchsten Anteil an radioaktiver Strahlung in den Gebieten um den Reaktor. 134 105 Element tphys tbiol tef f 3 He 12.3 a 12 d ∼ 12 d 14 90 C 5370 a 12 d 12 d Sr 28.8 a 35 a 15.8 a 131 J 8d 150 d 7.6 d 134 Cs 2.06 a 140 d 120 d 137 Cs 30.1 a 140 d 138 d 239 Pu 24400 a 200 a ∼ 200 a Tabelle 10: Effektive Halbwertszeiten verschiedener Isotope. Strontiums lange biologische Halbwertszeit ist darauf zurückzuführen, daß es in die Knochen eingebaut wird. Quelle: Bethge, Walter, Wiedemann 4.4.2 Abschirmung Energie (MeV) Elektronen Luft∗ H2 O Al Ge Pb Protonen Luft∗ H2 O Al Ge Pb α-Teilchen Luft∗ H2 O Al Ge Pb Schwere Ionen∗∗ H2 O C 0.05 0.1 0.5 1.0 5.0 10 100 0.04 4.2 · 10−5 2.1 · 10−5 1.4 · 10−5 8.7 · 10−6 0.13 1.4 · 10−4 6.9 · 10−5 4.3 · 10−5 2.7 · 10−5 1.53 1.7 · 10−3 8.4 · 10−4 5.1 · 10−4 2.9 · 10−4 3.8 4.3 · 10−3 2.1 · 10−3 1.2 · 10−3 6.7 · 10−4 21 2.5 · 10−2 0.01 6.4 · 10−3 3.2 · 10−3 40 4.8 · 10−2 0.02 1.2 · 10−2 5.3 · 10−3 246 0.32 0.11 4.8 · 10−2 1.7 · 10−2 6 · 10−4 7.5 · 10−7 3.7 · 10−7 3 · 10−7 1.3 · 10−3 1.2 · 10−6 7.7 · 10−7 6 · 10−7 8.4 · 10−3 8 · 10−6 5.2 · 10−6 4 · 10−6 3.5 · 10−6 2.5 · 10−2 2.2 · 10−5 1.4 · 10−5 1.5 · 10−5 8.8 · 10−6 0.38 3.2 · 10−4 1.9 · 10−4 1.4 · 10−4 1 · 10−4 1.15 1.2 · 10−3 6.3 · 10−4 4.2 · 10−4 3 · 10−4 7 0.07 0.04 0.02 1.5 · 10−2 1.2 · 10−3 1.5 · 10−6 2.7 · 10−3 5 · 10−3 3.5 · 10−6 1.8 · 10−6 1.6 · 10−6 1.3 · 10−6 3.3 · 10−6 3.2 · 10−6 2.4 · 10−6 3.5 · 10−2 2.6 · 10−5 2 · 10−5 1.8 · 10−5 1.5 · 10−5 0.1 9 · 10−5 6.6 · 10−5 4.8 · 10−5 3.7 · 10−5 6 · 10−3 3 · 10−3 2 · 10−3 1.5 · 10−3 1.5 · 10−5 8 · 10−6 3 · 10−4 1.5 · 10−4 8 · 10−7 ∗ bei 1 bar und 20 C ∗∗ Hier C-Ionen Tabelle 11: Reichweiten energetischer Teilchen in Materie in Metern. (Quelle: Bethge, Walter, Wiedemann) Im Abschnitt über Wechselwirkung von Strahlung mit Materie wurde bereits festgestellt, daß der Energieverlust bzw. Intensitätsverlust, von der Ordnungszahl des Absorbers abhängt. Schwere Elemente wie Blei eignen sich daher am besten als Abschirmung. (In Beschleunigeranlagen wird auch Barytbeton benutzt.) α-Strahlung wird allerdings auch schon von dünnen Schichten aus leichtem Material absorbiert, bei β-Strahlung besteht die Möglichkeit, daß harte Röntgenstrahlung (Aus spezifischen Bleispektrum?) entsteht, daher wird häufig noch eine Abschirmung aus leichterem Material vorgelagert. Bei der Abschirmung von Neutronenstrahlen wird meist eine Mischung aus Blei und leichteren Elementen verwendet, um eine Spallation in reiner Bleiabschirmung zu verhindern. In Tabelle 11 sind die Reichweiten verhschiedener Strahlung in verschiedenen Materialien angegeben. 106 5 Teilchenphysik Dieses Kapitel soll einen kurzen Überblick über die moderne Teilchenphysik geben. Grundlage der gesamten Teilchenphysik ist das Standardmodell. Dieses wird eingeführt, um darauf aufbauend einige wichtige Konsequenzen und eventuell auch die Grenzen aufzuzeigen. Das Standardmodell wurde bereits Ende der Sechziger Jahre unabhängig von S. L. Glashow, A. Salam und S. Weinberg entwickelt. (NPP 1979) 1972 wurde die Renormierbarkeit des Standardmodells durch G. ’t Hooft und M. J. G. Veltmann bewiesen. (NPP 1999.) 1973 wurde schließlich die asymptotische Freiheit der Quantenchromodynamik (QCD) gezeigt (NPP 2004 für d. J. Gross, H.D. Politzer, F. Wilczek.) und praktisch seitdem ist das Standardmodell mehr oder weniger unverändert die Grundlage der Elementarteilchenphysik. (Ebenfalls 1973 sagten Kobayashi und Maskawa voraus, daß es drei Quark-Familien benötigen würde, um CP-Verletzung im Standardmodell zu implementieren. NPP 2008.) Einzig die Hinweise auf eine Masse der Neutrinos können als wirkliche Neuerung angesehen werden, wobei diese nichts an der grundsätzlichen Struktur des Standardmodells ändern. 5.1 Standardmodell der Elementarteilchen Das Standardmodell der Elementarteilchenphysik ist eine SU (3) × SU (2) × U (1)-Eichfeldtheorie, wobei SU (3), SU (2), U (1) für Symmetriegruppen bzw. Eichgruppen stehen, unter denen das Standardmodell zusätzlich zur Lorentzgruppe invariant ist. (Genaugenommen könnte von einer Eichquantenfeldtheorie gesprochen werden, aber für gewöhnlich wird sich auf Eichfeldtheorie oder Eichtheorie beschränkt.) Diese Eichgruppen beschreiben die Eigenschaften der mit ihnen verbundenen Wechselwirkungen, die SU (3) zum Beispiel ist die Eichgruppe der Quantenchromodynamik (QCD). Wir werden in dieser Vorlesung nicht auf die mathematischen Grundlagen der Eichtheorie bzw. Eichgruppen eingehen können, sondern uns auf einen groben Überblick beschränken müssen, der stärker phänomenologisch als theoretisch geleitet sein wird. Grundlegend motiviert werden soll das Konzept allerdings an einer bereits bekannten Eichtheorie, der Elektrodynamik. Wenn am Ende der Vorlesung diese Beschreibung des Standardmodells plausibel geworden ist, dann wurde ein Gutteil des gewünschten erreicht. 107 5.1.1 Teilcheninhalt des SM Das Standardmodell beinhaltet drei Familien, drei Flavor (Geschmäcker) (bis auf die Neutrinos links- und rechtshändige) elementarer Fermionen, die Leptonen und Quarks, wobei letztere wiederum in drei Farben auftreten, sowie die Austauschbosonen der starken, schwachen und elektromagnetischen Wechselwirkungen, d.h. 8 Gluonen, W ± und Z 0 und ein Photon. Rechterhand sind diese skizziert und zudem dargestellt, welche Fermionen an welcher Wechselwirkung teilhaben. So haben die Leptonen nur an der schwachen und der elektromagnetischen Wechselwirkung teil, ausgenommen die ungeladenen Neutrinos, während die Quarks auch an der starken Wechselwirkung teilnehmen. Es soll noch einmal festgehalten werden, daß alle elementaren Austauschteilchen Bosonen sind, d.h geradzahligen Spin haben (siehe Tabelle 14) und somit der Bose-Einstein Statistik folgen, wohingegen alle elementaren Materieteilchen halbzahligen Spin haben und demnach Fermionen sind. (Diese Unterscheidung zwischen Materie und Austauschteilchen wird in supersymmetrischen Erweiterungen des Standardmodells insoweit aufgehoben, als daß Supersymmetrietransformationen Bosonen in Fermionen und Fermionen in Bosonen überführen.) Quarks und Gluonen wurden bisher nie in ungebundenem Zustand beobachtet. Sie wurden zunächst aus theoretischen Überlegungen eingeführt (Gell-Mann, Zweig 1964. NPP 1969 für Murray Gell-Mann. Feynman 1969.), konnten aber indirekt in tiefinelastischer Elektron-Proton bzw.Elektron-Neutron Streuung nachgewiesen werden. (Jerome I. Friedman, Henry W. Kendall, Richard E. Taylor, 1969. NPP 1990) Eine weitere Besonderheit der Quarks: Sie tragen drittelzahlige Vielfache der Elementarladung. Die up-Typ Quarks Qu = + 32 die down-typ Quarks Qd = − 31 . In Gell-Manns und Zweigs Name Up Down Charm Strange Top Bottom Symbol u d c s t b Ladung 2 3e − 13 e 2 3e − 31 e 2 3e − 31 e Masse 1.7 − 3.3 MeV 4.1 − 5.8 MeV 1.18 − 1.34 GeV 80 − 130 MeV 172 ± 0.9 ± 1.3 GeV +0.18 GeV 4.19−0.06 Tabelle 12: Quarkladungen und Massen, wobei hier außer für das Top-Quark die M¯SMassen angegeben sind. Die Massendefinitionen der Quarks sind ein Thema, welches im Laufe der Quantenfeldtheorievorlesungen behandelt werden wird. ursprünglicher Einführung der Quarks kamen nur das up-, das down- und das strangeQuark vor. Das charm-Quark wurde 1970 S. Glashow, J. Iliopoulus und L. Maiani zur Erklärung der Unterdrückung von Flavor-verändernden neutralen Strömen in der schwachen Wechselwirkung vorhergesagt (obgleich schon 1964 über ein viertes Quark spekuliert wurde.). 1974 wurde es unabhängig am SLAC wie am BNL entdeckt. Das bottom- oder 108 beauty-Quark wurde ebenso wie das top-, bzw. truth-Quark 1973 von Kobayashi und Maskawa postuliert. (Es setzten sich die Bezeichnungen top und bottom durch.) 1977 wurde das bottom-Quark am Fermilab E288-Experiment, 1995 das top-Quark ebenfalls am Fermilab von D0 und CDF am Tevatron entdeckt. Für Leptonen trüben bzw. erhellen je nach Standpunkt einzig die Neutrinos das Bild. Die Natur dieser 1930 von Pauli postulierten Teilchen ist noch immer nicht vollständig geklärt. Das Elektron wurde bereits 1897 durch J. J. Thompson nachgewiesen. Es folgten 1936 das Myon durch C. D. Anderson, 1975 das Tauon durch M. L. Perl (NPP 1995). Das Elektron-Neutrino wurde 1956 durch C. L. Cowan und F. Reines am Poltergeist-Experiment (NPP 1995 Reines) entdeckt. Das Myon-Neutrino 1962 durch J. Steinberger, M. Schwartz, L. M. Lederman (NPP 1988) mit dem ersten künstlich an einem Beschleuniger hergestellten Neutrinostrahl. Das Tau-Neutrino folgte im Jahre 2000 am Donut-Experiment. Name Elektron Elektron-Neutrino Myon Myon-Neutrino Tauon Tau-Neutrino Symbol e− νe µ− νµ τ− ντ Ladung −1e 0 −1e 0 −1e 0 Masse 0.511 MeV < 2 · 10−3 eV 105.66 MeV < −0.19 MeV 1777 MeV < 18.2 MeV Tabelle 13: Massen und Ladungen der verschiedenen Leptonen. 5.1.2 Wechselwirkungen (QED,QCD, schwache WW) Vier grundlegende Wechselwirkungen sind der modernen Physik bekannt. Die Gravitation, die starke, die schwache und die elektromagnetische Wechselwirkung. Das Standardmodell beschreibt drei dieser vier. Die Gravitation spielt aufgrund ihrer geringen Stärke, siehe Tabelle 14, zunächst keine Rolle bei der Beschreibung von Prozessen in der Elementarteilchenphysik. Wechselwirkung Starke Elektromagnetische Schwache Gravitation Stärke Reichweite in m Austauschteilchen Masse in GeV Spin Ladung 1 ∼ 10−2 ∼ 10−15 ∼ 10−41 ∼ 10−15 ∞ < 10−15 ∞ Gluonen Photon W ± , Z0 Graviton (Postuliert) 0 0 80.4, 91.2 0 1 1 1 2 Farbe elektrische Ladung schwacher Isospin Masse Tabelle 14: Stärken, Reichweiten und Austauschteilchen der vier grundlegenden Wechselwirkungen Die starke Wechselwirkung, eine SU (3) Eichtheorie oder auch Yang-Mills Theorie, beschreibt die Wechselwirkung der Quarks mit Gluonen. Gluonen koppeln an die Farbladungen Rot, Grün, Blau der Quarks, bzw. Antirot, Antigrün, Antiblau der Antiquarks. Sie ist verantwortlich für deren Bindung zu Protonen und Neutronen aber auch zu Pionen und Kaonen. Generell wurden bisher Bindungszustände von drei Quarks oder von einem Quark und einem Antiquark beobachtet. (In den letzten Jahren gab es viele Spekulationen über Tetra- oder Pentaquarks, aber bisher konnte kein solcher Zustand bestätigt werden.) Wie bereits erwähnt treten Quarks und Gluonen nicht ungebunden auf, ein Umstand, der mit Confinement bezeichnet wird (und bis heute nicht vollständig verstanden ist), andererseits stellte man fest, daß sich Quarks in Streuexperimenten mit sehr 109 hohen Energien wie quasifreie Teilchen verhalten. Letzteres ist als asymptotische Freiheit bekannt und wurde 1973 von Gross, Politzer und Wilczek gezeigt. (NPP 2004.) Als freie Teilchen wurden bisher nur farbneutrale bzw. weiße Teilchen beobachtet. Drei Quarks der Farben Rot, Grün, Blau ergeben ebenso einen farbneutralen Zustand wie ein Quark der Farbe Rot und ein Antiquark der Farbe Antirot. Die Austauschteilchen tragen dann sowohl Farbe wie Antifarbe. Deren gibt es acht, da die 3 × 3 Möglichkeiten in ein Oktett und ein Singlett, daß symmetrisch unter Farbaustausch und daher selbst farbneutral ist, zerfallen. Eine mögliche Nomenklatur lautet r r 1 1 (rr̄ − gḡ), (rr̄ + gḡ − 2bb̄), rḡ, rb̄, g b̄, gr̄, br̄, bḡ, 2 6 wobei das Singlett r 1 (rr̄ + gḡ + bb̄) 3 ist. (Eine weitere gruppentheoretische Begründung für die acht Gluonen folgt am Ende der heuristischen Erklärung der Eichtheorien.) Ein wichtiger Effekt, der in der Elektrodynamik unbekannt ist, ist der, daß die Gluonen, da sie selbst Farbe tragen, auch mit sich selbst wechselwirken. Diese Selbstwechselwirkung, siehe Abbildung 29, ist Ursache der obengenannten Effekte des Confinements und der asymptotischen Freiheit. Abbildung 29: Schematische Darstellung der möglichen Wechselwirkungen in der QCD 110 Hinweise auf Farbquantenzahl Es werden frühe Hinweise auf eine zusätzliche Quantenzahl, die Farbe, der Quarks im naiven Quark-Modell angegeben. Im Quark-Modell wird die ∆++ -Resonanz als Bindungszustand von drei up-Quarks beschrieben. Sie hat Isopsin I = 32 , siehe weiter unten, und einen Gesamtspin von J = 23 . Da es keinen niedriger liegenden Zustand aus drei up-Quarks gibt, muß der relative Drehimpuls der Quarks untereinander L = 0 sein. Dies führt allerdings zu Problemen für den Zustand mit J3 = 32 |∆++ , J3 = 3 i = |u ↑, u ↑, u ↑i. 2 Der Spin der Quarks muß in die gleiche Richtung ausgerichtet sein, doch dies sollte nach dem Pauli-Prinzip nicht möglich sein, da die Quarks in allen Quantenzahlen übereinstimmten. Zudem müßte der Zustand antisymmetrisch unter Austausch zweier Quarks sein, da diese Fermionen sind. Eine weitere Quantenzahl zur Unterscheidung ist notwendig. (Über diesen wurde 64 bzw. 65 von Greenberg bzw. Han und Nambu spekuliert.) Experimentelle Hinweise auf Farbquantenzahlen folgen unter anderem aus dem Pionzerfall π → γγ und der e+ e− -Annihilation in Hadronen e+ e− → Hadronen. Hier wird zunächst die Annihilation betrachtet. Die Wirkungsquerschnitte für die Annihilation in Myonen und in Hadronen sind gegeben durch σ(e+ e− −→ µ+ µ− ) = 4παs2 , 3s σ(e+ e− −→ Hadronen) = Nf X 4παs2 Nc Q2i , 3s i=1 wobei Nc die Anzahl der Farben, Nf die Anzahl der Quarks, die bei der betrachteten Gesamtenergie als Paar produziert werden können, sowie Qi die Ladung dieser Quarks. Die experimentelle Auswertung ergibt, daß Nc drei sein sollte. Siehe Abbildung 30 Insgesamt werden gebundene Zustände aus Quarks, Hadronen genannt, diese werden, wie zu erwarten, unterteilt in Baryonen, drei Quark Zustände und Mesonen, zwei Quark Zustände. Die Namen, Baryon aus dem altgriechischen schwer“, gewichtig“ bzw. Me” ” sonen mitten“, in der Mitte“ sind historischer Natur, da die ersten entdeckten Teilchen ” ” dieser Einteilung folgten. Die QCD unterscheidet nicht zwischen den Quarktypen einer Familie. Hätten diese die gleichen Massen, wäre es via QCD nicht möglich, diese zu unterscheiden. Damit kann schon eine heuristische Begründung des Isospins (nicht zu verwechseln mit dem schwachen Isospin) gegeben werden. Isospin wurde 1932 von Werner Heisenberg eingeführt, um zu erklären, warum Proton und Neutron nahezu die 111 Abbildung 30: Wirkungsquerschnitt für die Reaktion e+ +e− → Hadronen über e+ +e− → µ+ + µ− . gleiche Masse haben und warum die Kernkraft zwischen ihnen identisch ist. Isospin sollte also eine Symmetrie der Kernkraft sein. Betrachtet man das Proton und das Neutron als Bindungszustände von up- und down-Quarks |pi = |uudi, |ni = |uddi so folgt der Isospin daraus, daß die QCD nicht zwischen up- und down-Quarks unterscheidet. (Erklärung ist an sich zuviel gesagt. Die Theorie wurde vielmehr so konstruiert.) Den Nukleonen wurde ursprünglich der Isospin I = 12 und die z-Komponente Iz = + 21 für das Proton und Iz = − 12 für das Neutron zugeordnet. Analog wird nun für die upund down Quarks 1 1 1 I = , Iz |ui = + |ui, Iz |di = − |di 2 2 2 definiert. Es läßt sich leicht überprüfen, daß auf diese Weise der Heisenbergsche Isospin reproduziert werden kann. Allgemein kann die z-Komponente des Isospins nun durch Iz = 1 (nu − nū − (nd − nd¯)) 2 angegeben werden. In nicht ganz konsequenter Nomenklatur werden den anderen Quarks ebenfalls Quantenzahlen zugeordnet: Strangeness, Charmness, Bottomness, Topness, wobei das Strange-Quark Strangeness -1 ebenso wie das Bottom-Quark Bottomness -1 hat. Noch einmal: Die QCD unterscheidet nicht zwischen den Quarks in einer Familie und sie vermag keine Übergänge zwischen den Quarktypen zu induzieren, weshalb es sinnvoll ist, den Quarks Quantenzahlen zuzuordnen, die von der QCD erhalten werden. Der Isospin aus der Kernphysik und die Identität der Kernkraft für Protonen und Neutronen folgt aus dieser Eigenschaft der QCD. Sie wird uns in den nächsten Abschnitten noch das ein oder andere Mal begegnen. Aus ihr resultieren die größten Probleme bei der Berechnung von 112 Observablen, da sie nur bei hohen Energien störungstheoretischen Methoden zugänglich ist. 5.1.3 Gell-Manns-Eigfold Way Die anfängliche Verwirrung aufgrund der abunden Anzahl von neu entdeckten Teilchen konnte Murray Gell-Mann (NPP 1969) mittels seines Eightfold Way (nach dem edlen achtfachen Weg des Buddhismus) auflösen. Yuval Ne’eman entwickelte unabhängig die gleichen Überlegungen, aber Gell-Manns Name ist mit dieser Idee verbunden worden. Beide erkannten, dass sich Baryonen und Mesonen in Multipletts der SU(3) Gruppe ordnen ließen. Die fundamentale Darstellung dieser SU(3)f lavour wird von den drei leichtesten Quarks, up, down und strange gebildet. Bildet man das direkte Produkt eines Tripletts und eines Antitripletts, also die möglichen Einstellungen eines Mesons, dann erhält man ein Singlett und ein Oktett: 3 ⊗ 3̄ = 1 ⊕ 8. Das Singlett wird aus dem η1 , das Oktett aus den drei Pionen, dem η8 und den vier Kaonen gebildet. Siehe Abbildung 31. Abbildung 31: Oktett und Singlett der Mesonen aus up, down und strange Quark Für Baryonen wird das direkte Produkt aus drei Tripletts gebildet 3 ⊗ 3 ⊗ 3 = 1 ⊕ 8 ⊕ 8 ⊕ 10, woraus sich das Oktett der Spin 21 Baryonen, welches das Neutron und Proton enthält und das Spin 23 Dekuplett mit der ∆-Resonanz, siehe Abbildung 32, ergeben. Diese Überlegungen führten zur Vorhersage des bis dato nicht entdeckten Ω− -Teilchens, eines Bindungszustandes aus drei strange-Quarks. Zudem führten sie zur Gell-Mann Nishijima Formel Y Q = I3 + , 2 wobei I3 die Dreikomponente des Isospins und Y die Hyperladung sind. Ursprünglich war die Hyperladung nur die Summe aus Strangeness und Baryonzahl, mit dem Aufkommen weiterer Quarksorten, musste diese jedoch auf Y = s + c + b + t + B, 113 Abbildung 32: Oktett der Spin 12 - und Dekuplett der Spin 23 -Baryonen. wobei s, c, b, t für Strangeness, Charmeness, Bottomness und Topness stehen, erweitert werden. Desweiteren wurde von Gell-Mann und unabhängig von Okubo die nun GellMann-Okubo Massenformel für ein Hadronmultiplett hergeleitet: 1 2 M = a0 + a1 s + a2 I(I + 1) − s . 4 a0 , a1 , a2 sind freie Parameter, wohingegen I und s dem Isospin und der Strangeness entsprechen. Für das Baryonoktett liefert diese Formel z.B.: mN + mΞ 3mΛ + mΣ = , 2 4 wobei für die Massen die Mittelwerte des jeweiligen Isospinmultipletts einzusetzen sind. (mN entspricht also dem Mittelwert aus Proton- und Neutronmasse.) Für die Baryonmultipletts liefert diese Relation zufriedenstellende Ergebnisse, für das pseudoskalare Mesonoktett funktioniert sie allerdings nicht: mK̄ 0 +mK − 2 + 2 mK 0 +mK + 2 6= 3mη + mπ . 4 Werden jedoch die Quadrate der Massen verwendet, ergibt sich wiederum eine zufriedenstellende Übereinstimmung. Im Weinberg ”The Quantum Theory of Fields”, Band 2 ist eine Herleitung dieser quadratischen Relation für die Mesonen zu finden. Eine graphische Erweiterung der Ordnung in SU(3)-Multipletts auf SU(4)-Multipletts ist in Abbildung 33 zu finden. Nun aber zunächst zur schwachen Wechselwirkung. Diese wurde bereits beim β-Zerfall erwähnt. Im β-Zerfall wandelt sich ein Neutron unter Emission eines Elektrons und eines Antineutrinos in ein Proton um. n −→ p + e− + ν̄e , d.h. nach dem obengenannten muß es hier zur Umwandlung eines down-Quarks in ein up-Quark kommen. Die schwache Wechselwirkung vermag demnach Übergänge zwischen den Quarks zu induzieren. Zudem wurde im β-Zerfall bereits eine weitere Eigenschaft der schwachen Wechselwirkung angesprochen bzw. gefunden: Die Paritätsverletzung. D.h. der 114 Abbildung 33: Erweiterung der SU(3)-Multipletts auf SU(4)-Multipletts. schwache Isospin an den die schwache Wechselwirkung koppelt, muß paritätsverletzend implementiert sein. Eine weitere Besonderheit, die in den 60er Jahren experimentell festgestellt wurde, ist die CP -Verletzung, d.h. die schwache Wechselwirkung verletzt auch das Produkt der beiden Operationen C und P , wobei C die Ladungskonjugation ist, die Teilchen und Antiteilchen vertauscht. Zudem kann die schwache Wechselwirkung sogar Übergänge zwischen den Familien induzieren. Dies hängt indirekt mit der CP -Verletzung zusammen. Darauf soll noch näher eingegangen werden, doch zunächst werden einige Grundlagen benötigt, die am Beispiel der Elektrodynamik behandelt werden sollen. Die grundlegenden Gleichungen der klassischen Elektrodynamik sind die Maxwell-Gleichungen: ~ ·E ~ ∇ = ρ, ~ ·B ~ ∇ = 0, ~ ~ ~ ×B ~ − ∂ E = J, ∇ ∂t ~ ~ ×E ~ + ∂ B = 0. ∇ ∂t Diese sind konsistent mit Ladungserhaltung, die via Kontinuitätsgleichung ∂ρ ~ ~ +∇·J =0 ∂t ~ kann ausgedrückt wird. Durch einführen des kontravarianten Viervektors J µ = (ρ, J) diese relativistisch invariant ∂µ J µ = 0 mit ∂ ∂µ = = ∂xµ ∂ ~ ,∇ ∂t geschrieben werden. Ebenso können die Potentiale ~ =∇ ~ × A, ~ B als kontravarianter Viervektor ~ ~ = −∇φ ~ − ∂A E ∂t ~ Aµ = φ, A 115 zusammengefaßt werden. Die Maxwell-Gleichungen ergeben sich dann aus dem antisymmetrischen Feldstärketensor F µν 0 −Ex −Ey −Ez Ex 0 −Bz By . F µν = ∂ µ Aν − ∂ ν Aµ = Ey B z 0 −Bx Ez −By Bx 0 Die homogenen Maxwell-Gleichungen folgen dann aus der Identität ∂ λ F µν + ∂ ν F λµ + ∂ µ F νλ = 0, die inhomogenen haben die kovariante Form ∂µ F µν = J ν . Um den Übergang von einer klassischen Feldtheorie zu einer Quantenfeldtheorie plausibel zu machen, ist es am günstigsten zur Lagrangeformulierung überzugehen. Für kontinuierliche Systeme wird die Lagrangefunktion als Integral über die Lagrangedichte L dargestellt Z L= d3 xL. Die Euler-Lagrange-Gleichungen folgen dann aus der Lagrangedichte bzw. aus der Wirkung ganz analog zur Punktmechanik. Für die klassische Elektrodynamik lautet die Lagrangedichte 1 L = − Fµν F µν − J µ Aµ 4 und die Wirkung Z 1 4 µν µ S = d x − Fµν F − J Aµ . 4 Explizite Herleitung der Maxwell-Gleichungen aus L: δS = = = = 1 λρ µν µ d x − gµλ gνρ F δF − J δAµ 2 Z 1 λρ 4 µ d x − F (∂λ δAρ − ∂ρ δAλ ) − J δAµ 2 Z d4 x −F λρ ∂λ δAρ − J ρ δAρ Z d4 x ∂λ F λρ − J ρ δAρ Z 4 Im letzten Schritt wurde eine partielle Integration durchgeführt, im vorletzten wurde ausgenutzt, daß F λρ = −F ρλ . Die Eichtransformation der Elektrodynamik nimmt in dieser Schreibweise die Form Aµ −→ Aµ − ∂ µ Θ, mit Θ einer beliebigen skalaren Funktion, an. Der Beweis der Eichinvarianz der Wirkung ist leicht zu führen. Der Feldstärketensor ist für sich genommen schon Eichinvariant, da ∂µ∂ν Θ − ∂ν ∂µΘ = 0 116 gilt. Für den Kopplungsterm von Stromdichte und Potential sind nur wenige Schritte mehr erforderlich. Eichinvarianz der Wirkung: ∆S = = − Z Z d4 xJµ ∂ µ Θ d4 x (∂ µ Jµ ) Θ Mit der Kontinuitätsgleichung ∂ µ Jµ = 0 ergibt sich so das gesuchte Ergebnis. Die Wirkung ist also genau dann Eichinvariant, wenn der Strom an den das Potential koppelt, erhalten ist. D.h. Eichinvarianz und Ladungserhaltung bedingen sich in diesem Fall gegenseitig. Bisher geschieht die Kopplung des elektromagnetischen Feldes an Materie nur über den Strom J µ . Dies soll nun geändert werden, wobei einige der nun folgenden Schritte nur heuristisch begründet werden können. Im Abschnitt über die goldene Regel wurde bereits einmal die freie Dirac-Gleichung erwähnt. Diese ist eine relativistische Verallgemeinerung der Schrödinger-Gleichung für Spin 12 -Teilchen. (i∂ µ γµ − m) ψ = 0 Dabei sind γµ 4×4 Matrizen, die folgenden Antivertauschungsrelationen, der sogenannten Clifford-Algebra gehorchen {γµ , γν } = 2gµν und ψ ist ein vierkomponentiger Spinor. Dirac-Matrizen in chiraler Darstellung: 0 σi 0 1 i 0 , γ = γ = −σ i 0 1 0 1 0 γ 5 = iγ 0 γ 1 γ 2 γ 3 = 0 −1 σ i sind die Pauli-Matrizen, die aus der Behandlung des Spins in der nichtrelativistischen Quantenmechanik bekannt sind. Vierkomponentig, da dieser zwei Spineinstellungen sowie Teilchen und Antiteilchen beschreibt. (Lösungen positiver und negativer Energie.) Die Wirkung, aus der die DiracGleichung folgt, lautet Z S = d4 x ψ̄ (i∂ µ γµ − m) ψ, wobei ψ̄ der komplex-adjungierte Spinor ψ † multpliziert mit γ 0 ist ψ̄ = ψ † γ 0 . Die beiden Wirkungen sollen kombiniert werden, um Elektronen an das elektromagnetische Feld zu koppeln. Wie wird dabei vorgegangen? Hier soll der heuristische Weg beschritten werden. Analog zur minimalen Kopplung wird ∂ µ −→ ∂ µ + iqAµ ersetzt, d.h. die Lagrangedichte sieht nun folgendermaßen aus: 1 L = − Fµν F µν + ψ̄ (i∂ µ γµ − qAµ γµ − m) ψ. 4 117 Auch für diese soll die Wirkung invariant unter obiger Eichtransformation sein. Führt man eine solche Transformation durch, erkennt man, daß Invarianz nur gegeben ist, wenn ψ parallel mit einer lokalen Phase multipliziert wird, daß also Invarianz unter der simultanen Transformation ψ Aµ −→ −→ eiqΘ ψ Aµ − ∂ µ Θ besteht. Die Gruppe der Phasentransformationen wird mit U (1) bezeichnet, daher wird die Quantenelektrodynamik auch eine U (1)-Eichtheorie genannt. Das übliche Vorgehen ist genau umgekehrt zu dem hier beschrittenen Weg. Es wird sich eine Wirkung genommen, die unter einer bestimmten Symmetrie- oder Eichgruppe invariant sein soll. Daraus folgt ein bestimmtes Transformationsverhalten für das oder die Eichfelder und demnach eine bestimmte kovariante Ableitung, die hier Dµ = ∂ µ + iqAµ lautet. Kovariante Ableitung, da sich Dµ ψ wie folgt transformiert: Dµ ψ −→ eiqΘ Dµ ψ. (Also wie ψ selbst.) Für eine SU (2) bzw. SU (3)-Eichtheorie ändert sich nun, daß die Funktion Θ mit Generatoren der Eichgruppe, im Allgemeinen Matrizen multipliziert wird und demnach auch die Eichfelder Matrizen in einer Darstellung dieser Gruppe werden. (Die U (1)-Gruppe hat nur einen Generator, die 1, wohingegen die SU (2) drei Generatoren, die Pauli-Matrizen und die SU (3) acht Generatoren, die Gell-Mann-Matrizen hat. Die Anzahl der Generatoren entspricht der Anzahl der Austauschteilchen, wie aus der Gruppentransformation a a eigs Θ τ mit den Generatoren τ a gesehen werden kann. Zu jedem ∂µ Θa τ a gehört ein Eichfeld Aaµ τ a .) Dies hat unter anderem zur Folge, daß solche Eichtransformationen nicht mehr kommutieren und daher werden Theorien mit solchen Eichgruppen nichtabelsche Eichtheorien genannt. Eine Anmerkung noch zur schwachen Wechselwirkung. Dort wurde die Masse der Austauschteilchen mit 80.4 bzw. 91.2 GeV angegeben. Ein Massenterm für Eichbosonen der Art m2 Aµ Aµ ist jedoch nicht Eichinvariant und widerspräche demnach den gerade zugrundegelegten Prinzipien. Auf diesen Punkt soll im Rahmen des Higgs-Mechanismus noch einmal zurückgegriffen werden. 118 Quantisierung: Die Quantisierung der bis hier noch klassischen Feldtheorie mit allen Problemen kann im Rahmen dieser Vorlesung nicht abgehandelt werden. Es soll nur ein kurzer Einblick gewährt werden. Die Dirac-Gleichung kann allgemein durch eine Überlagerung von ebenen Wellen gelöst werden Z X d3 p † s −ip·x s ip·x p ψ(x) = , a u (p)e + b v (p)e p ~ ,s p ~ ,s (2π)3 2Ep~ s=1,2 wobei us (p), v s (p) Lösungen der Gleichungen (/ p − m)us (p) = 0, (/ p + m)v s (p) = 0, p / = pµ γ µ sind und demnach vierdimensionale Spinoren sind. In der chiralen Darstellung werden diese in links- und rechtshändige Komponenten aufgespalten uL (p) u(p) = , uR (p) dazu unter Helizität und Händigkeit noch mehr, aber es ist einfach einzusehen, daß 1 1 5 5 2 (1 − γ ), 2 (1 + γ ) auf links- bzw. rechtshändige Komponenten projezieren. Eine konkrete Form für den Impuls in z-Richtung, mit zweikomponentigen Spinoren ξ s 0 1 2 1 , , ξ = ξ = 1 0 die Eigenvektoren zum Spinoperator sind, lautet: i hp p 3 3 s 3 1−σ + 3 1+σ ξ E + p E − p 2 2 i . us (p) = hp p 3 3 3 1−σ E + p3 1+σ E − p ξs + 2 2 In einer klassischen Feldtheorie wären ap~,s und bp†~,s komplexe Zahlen. In einer Quantenfeldtheorie sind dies jedoch Vernichtungs- und Erschaffungsoperatoren, die analog zu den Ab- und Aufsteigeoperatoren des harmonischen Oszillators, wirken. Allerdings erschaffen und vernichten diese Einteilchenzustände aus dem perturbativen Vakuum, welches durch ap~,s |0i = 0 definiert werden kann. Für Fermionen erfüllen diese Operatoren, wieder im Unterschied zu den Auf- und Absteigeoperatoren, Antivertauschungsrelationen ′ p − p~′ ), {ap~,s , ap†~′ ,s′ } = {bp~,s , bp†~′ ,s′ } = (2π)3 δ ss δ(~ damit das Spin-Statistik-Theorem erfüllt wird. Die entsprechenden Operatoren für Bosonen erfüllen Vertauschungsrelationen. Bei Photonen und insbesondere bei Gluonen treten hier noch weitere Feinheiten auf, die nicht behandelt werden können. Hierfür sei wiederum auf den entsprechenden Vorlesungszyklus verwiesen. Ein interessanter Punkt, der sich an der Lagrangedichte erläutern läßt, ist die Invarianz gegenüber diskreten Symmetrien, wie P oder C. Die Felder ψ, Aµ müssen Darstellungen der Lorentzgruppe folgen, damit die Lagrangedichte Lorentzinvariant konstruiert werden 119 kann. Ähnliches gilt für die Parität P . Damit die Lagrangedichte invariant unter Parität ist, müssen die Spinoren ein bestimmtes Transformationsverhalten unter P befolgen. Daher obige Einteilung in uL und uR . Unter Parität transformiert sich uL uR P u(x) = P (x) −→ (x′ ), uR uL wobei x′µ = (t, −~x) ist. Insgesamt wäre danach die Lagrangedichte wieder invariant unter P . Um Paritätsverletzung schon auf dieser Ebene zu implementieren, wie es in der schwachen Wechselwirkung der Fall ist, bietet es sich an, mittels der oben bereits eingeführten Projektoren 12 (1 − γ 5 ), 12 (1 + γ 5 ) auf links- bzw. rechtshändige Komponenten zu projezieren und diese unterschiedlich an der Wechselwirkung teilhaben zu lassen. Dies geschieht in der schwachen Wechselwirkung insofern, als daß nur linkshändige Komponenten an den geladenen Wechselwirkungen (Strömen) teilnehmen. Aus der Lagrangedichte läßt sich die Hamiltondichte und damit der Zeitentwicklungsoperator Z t dt′ H(t′ ) U (t, t0 ) = T exp i t0 konstruieren. Mit diesem läßt sich dann eine Störungsreihe herleiten. Der Wechselwirkungsanteil folgt ganz offensichtlich aus Lint = ψ̄Aµ γµ ψ. Eine sehr elegante Schreibweise dieser Störungsrechnung geht auf Feynman zurück, die sogenannten Feynman-Diagramme, und wird in den weiterführenden Vorlesungen noch behandelt werden. Im Rahmen dieser Vorlesung werden sie nur zur Veranschaulichung verwendet werden. (Wobei nicht ausgeschlossen ist, daß auch einige der Feynmanregeln angegeben werden.) 120 Feynman-Diagramme der QED und QCD QED QCD Nun kann eine Verbindung zur goldenen Regel hergestellt werden. Die Summe aller möglichen Feynman-Diagramme zu einer bestimmten Ordnung in den Vertizes und damit in der Kopplungskonstanten für einen Prozeß ergeben die Übergangsamplitude Tf i zu jener Ordnung Störungstheorie. Anhand der QED wurden einige grundlegende Eigenschaften von Eich- bzw. Quantenfeldtheorien heuristisch erläutert. In einigen Aspekten ähneln sich QED und QCD, so in der Erhaltung von Parität und Ladungskonjugation, auch die Lagrangedichte hat eine sehr ähnliche Form in anderen unterscheiden sie sich grundlegend, so zum Beispiel in der Selbstwechselwirkung der Gluonen, da diese Farbe tragen und dadurch auch in dem Verhalten der Wechselwirkung bei hohen bzw. niedrigen Energien. In der QED wird die Wechselwirkung durch das sogenannte Screening zu großen Abständen kleiner, zu kleinen Abständen hingegen grösser. In der QCD herscht hingegen das Antiscreening durch die Gluonselbstwechselwirkung vor, was genau den entgegengesetzten Effekt hat. Ein weiterer vom Gesichtspunkt der Symmetrien interessanter Punkt ist, daß QED den starken Isospin, der in der QCD erhalten ist, verletzt. Up- und down- Quarks haben verschiedene Ladungen, daher wechselwirken sie unterschiedlich in der QED. (Dies kann in QCD-Rechnungen jedoch meist als kleine Störung angesehen werden.) Um nun ein wenig stärker auf die Phänomenologie insbesondere der schwachen Wechselwirkung einzugehen, werden zunächst einige grundlegende Teilcheneigenschaften noch einmal erläutert. 121 Abbildung 34: Links: Schematische Darstellung des Antiscreening. Rechts: Verhalten der Kopplungskonstanten der verschiedenen Wechselwirkungen bei ansteigender Energie. Zudem das Gleiche, wenn das Standardmodell durch eine weitere Symmetrie, die sogenannte Supersymmetrie erweitert wird. 5.1.4 Inelastische Streuung, Hadronisierung und Konstituentenmodell Experimentelle Hinweise auf die Struktur der Nukleonen wurden in der inelastischen Streuung gefunden. Hier soll speziell die inelastische Elektron-Nukleon Streuung skizziert und erläutert werden. In Spektrum der inelastischen Elektron-Proton Streuung, Abbildung 35, ist unterhalb des elastischen Streuquerschnitts deutlich eine Resonanz bei Abbildung 35: Differentieller Wirkungsquerschnitt der inelastischen Elektron-Proton Streuung. Die Elektronenergie beträgt E=4.879 GeV der Streuwinkel Θ=10 . E’≈4.21 GeV zu sehen. Schauen wir uns die Kinematik des Prozesses ein wenig genauer an: Im Ruhesystem des Protons habe das einlaufende Elektron den Impuls p, das auslaufende p′ , siehe Abbildung 36. Der Impulsübertrag werde q = (ν, ~q) geschrieben. Dann kann die invariante Masse des angeregten Protonzustandes als W 2 = P ′2 = (P + q)2 = Mp2 + 2P · q + q 2 = Mp2 + 2M ν − Q2 122 p p’ q P’ P Abbildung 36: Benutzte Notation für die inelastische Streuung. mit ν = PM·qp und Mp der Protonmasse geschrieben werden. Wird die Elektronmasse vernachlässigt, d.h. q 2 = −2EE ′ (1 − cos Θ) dann ergibt sich für die angegebenen Werte eine Resonanz mit der Masse W ≈ 1.231 GeV. Dies ist die sogenannte ∆+ -Resonanz, deren Masse laut Particle Data Group bei W = 1.232 ± 0.002 GeV liegt, und die ein Spin 23 -Zustand ist. Eine solche Resonanz deutet darauf hin, dass das Proton aus Konstituenten aufgebaut ist, deren Drehimpuls sich durch die Streuung änderte. Die ∆-Resonanz zerfällt via der starken Wechselwirkung mit einer Lebensdauer von etwa τ ≈ 5.5 · 10−24 s in ∆+ −→ −→ p + π0 , n + π+ . In Abbildung 37 sind einige weitere Nukleonresonanzen angegeben. Zur Beschreibung des Abbildung 37: Resonanzen, die in der Pion-Nukleon und Photon-Nukleon Streuung beobachtet werden. Wirkungsquerschnittes der inelastischen Elektron-Proton Streuung (die experimentelle 123 Vermessung der Elektron-Neutron Streuung wird durch den Umstand verkompliziert, dass freie Neutronen nicht stabil sind, man sich also mit der Elektron-Deuteron Streuung und entsprechenden Korrekturen behelfen muß), werden analog zu den Formfaktoren der elastischen Streuung 2 2 d σ Q2 (GE (Q) + τ G2M (Q2 )) dσ 2 2 2 Θ δ ν − = , + 2τ G (Q ) tan M dΩ dE ′ el dΩ M ott 1+τ 2 2Mp die nur Funktionen des Impulsübertrages sind, die sogenannten Strukturfunktionen, die zusätzlich Funktionen von ν sind, eingeführt: 2 dσ d σ 2 2 2 θ W (Q , ν) + 2W (Q , ν) tan , = 2 1 dΩ dE ′ inel dΩ M ott 2 wobei wiederum ν = PM·qp gilt. Der inelastische Streuquerschnitt ist also (wie erwartet) eine Funktion von zwei Variablen. Im Grenzfall E = E ′ muß dies natürlich wieder in den elastischen Streuquerschnitt übergehen, d.h. die Strukturfunktionen gehen in die Formfaktoren über. Üblicherweise werden die Bjorkensche Skalenvariable x= Q2 Q2 = 2P · q 2Mp ν und die dimensionslosen Funktionen F1 (Q2 , x) = Mp W1 (Q2 , ν) F2 (Q2 , x) = ν W2 (Q2 , ν) eingeführt. Die Bjorkensche Skalenvariable kann zunächst als ein Maß für die Inelastizität der Streuung angesehen werden: 2Mp ν − Q2 = 0 2Mp ν − Q2 > 0 −→ −→ x = 1, 0 < x < 1. Die Strukturfunktionen zeigen (Bjorkensches) Skalenverhalten, d.h. sie hängen für weite Bereiche nicht oder nur sehr schwach von Q2 ab, siehe Abbildung 38. Dies spricht jedoch für eine Streuung an punktförmigen Konstituenten, die von Feynman zunächst Partonen genannt wurden. Wir erinnern uns: Die Formfaktoren der elastischen Streuung hingen nur für punktförmige Teilchen nicht von Q2 ab. In einem solchen Partonmodell kann die Bjorkenvariable im infinite-momentum frame (IMF) als Impulsbruchteil des Protons, den das getroffene Parton trägt interpretiert werden. Für Spin 21 Konstituenten gilt zudem die Callan-Gross Relation 2x F1 (Q2 , x) = F2 (Q2 , x), die aus der Winkelverteilung der elastischen Streuung an punktförmigen Partonen folgt und wie zu sehen ist, experimentell sehr gut erfüllt ist. Bei den Partonen handelt es sich also um näherungsweise punktförmige Spin 21 Teilchen, die den Quarks aus Gell-Manns eight-fold way entsprechen. (Zweig nannte die Konstituenten aces, aber quarks scheint einen höheren Sexappeal gehabt zu haben...) 124 Abbildung 38: Q2 -Abhängigkeit von F2 für verschiedene Werte von Bjorken-x. Im vorigen Abschnitt wurde bereits erwähnt, dass Quarks und Gluonen, die Wechselwirkungsträger der QCD, nicht ungebunden beobachtet werden. Dies soll im Weiteren kurz ausgeführt werden. Entscheidend für diesen Umstand ist das Verhalten der Kopplungskonstante der QCD, siehe auch Abbildung ??. (Die Verwendung des Wortes Konstante sieht in diesem Kontext natürlich ein wenig seltsam aus.) Dieses Verhalten in Abhängigkeit von der Energie wird durch die β-Funktion β(g) = g dg =µ d log µ dµ wiedergegeben, wobei g die Kopplungskonstante und µ die Energieskala sind. Die βFunktion kann störungstheoretisch aus den Schleifenkorrekturen zum Eichbosonpropagator also zum Propagator des Photons in QED oder zum Propagator des Gluons in QCD berechnet werden. Die benötigten Feynmandiagramme finden sich in Abbildung .... Zum Vergleich werden die Ergebnisse für QED und QCD angegeben und in Abbil- 125 Abbildung 39: Tiefinelastische Streuung im Laborsystem und im infinite-momentum frame. Abbildung 40: Experimentelle Werte für die Callan-Gross Beziehung bei verschiedenen Werten von Q2 . dung 42 ist das unterschiedliche Verhalten gezeigt: β(g)QED = β(α)QED = β(g)QCD = β(α)QCD = g3 + O(e5 ) 12π 2 2α + O(α4 ) 3π 3 g 2 + O(g 5 ) − 11 − nf 3 16π 2 α 2 − 11 − nf 3 2π Hier ist nf die Anzahl der aktiven Quarksorten, d.h. die Anzahl der Quarksorten, die bis zu der betrachteten Energieskala produziert werden können. Die Unterschiede in der β-Funktion sind auf die Selbstwechselwirkung der Gluonen und damit auf die nichtabelsche Natur der QCD zurückzuführen. Wie zu sehen ist, ist die β-Funktion der QCD negativ, für nf ≤ 16, während die der QED positiv ist. D.h. die Kopplung der QED wächst, wenn die Energie höher werden und divergiert schließlich sogar, was zuerst von Landau untersucht wurde. Dieser sogenannte Landaupol drückt aus, dass perturbative 126 Abbildung 41: Verhalten der QCD-Kopplungskonstante in Abhängigkeit vom Abstand bzw. der Energie. Abbildung 42: Vergleich des Verhaltens der QED- und QCD-Kopplungskonstante. QED, d.h. die Störungstheorie der QED, nicht konsistent bis zu beliebig hohen Energien ist. Im Gegensatz dazu fällt die Kopplungskonstante der QCD zu hohen Energien. Ein Phänomen, das asymptotische Freiheit genannt wird. Bei kleinen Abständen verhalten sich Quarks demnach wie quasifreie Teilchen, da ihre Kopplung aneinander klein wird. Dies ist eine der Voraussetzungen für die partonische Interpretation der Strukturfunktionen. Zu großen Abständen hingegen wird die Kopplung der QCD groß und sorgt für das sogenannte Confinement: In der Natur sind keine farblich geladenen Zustände zu beobachten. 5.1.5 Teilcheneigenschaften In einem typischen PDG-Eintrag findet man die Masse, die Lebensdauer bzw. die Zerfallsbreite, die Zerfallskanäle sowie in der Kopfzeile z.B. für ein π ± : I G (J P ) = 1− (0− ). Diese gibt Isospin, G-Parität, Gesamtdrehimpuls und Parität an. Parität wurde berreits im Abschnitt über Streuung behandelt. Neben der Interpretation als Punktspiegelung am Ursprung wurde dort auch schon auf die intrinsische Parität ηa jedes Teilchens hingewiesen. P beschreibt dann das Produkt aus intrinsischer Parität und (−1)l , wobei l der 127 Abbildung 43: Schematische Darstellung des QCD-Strings, d.h. des Feldes zwischen zwei Farbladungen. Die Energiedichte im chromodynamischen Feld ist konstant, so dass beim auseinanderziehen zweier Farbladungen die Energie im Feld ansteigt, bis ein neues QuarkAntiquark-Paar produziert werden kann. relative Bahndrehimpuls der Konstituenten ist, P = ηa · (−1)l . Der Gesamtdrehimpuls setzt sich aus dem Spin der Konstituenten (im Valenz-Zustand) und dem relativen Bahndrehimpuls zusammen. Den Isospin haben Gell-Mann und Nishijima mit der Ladung in Verbindung gebracht. B+S Q = I3 + , 2 wobei B die Baryonzahl und S die Strangeness sind. (Diese Formel ergibt auch für Quarks die richtigen Ergebniss, wenn für diese die Baryonzahl B = 13 und für Antiquarks B = − 31 angenommen wird.) Der aufmerksame Leser wird schon ahnen, dass dies noch durch die weiteren Quarkflavorquantenzahlen C, B ′ und T erweitert werden muß. Die Kombination B + S wird auch Hyperladung Y genannt, so daß die Gell-Mann-Nishijima-Relation auch häufig als Y Q = I3 + 2 geschrieben wird. Die G-Parität ist durch folgenden Operator ˆ G = C eiπ I2 definiert, wobei I2 die zweite Komponente des Isospinvektors und C der Ladungskonjugationsoperator sind. Ladungskojugation wird schlicht durch den Austausch von Teilchen und Antiteilchen erreicht. Isospin ist eine bereits in der Kernphysik erwähnte und inzwischen auf Quarkniveau betrachtete Größe. 5.1.6 Diskrete Symmetrien Um die G-Parität und die Ladungskonjugation allerdings zu verstehen, muß dies noch ein wenig vertieft werden. In der Kernphysik wurden Proton und Neutron als Isospin I = 12 -Zustände mit Iz = ± 21 interpretiert, ebenso wie dies auf Quarkebene für die uund d-Quarks der Fall ist. Werden diese als zweidimensionale Vektoren im Isospinraum geschrieben 0 1 , , |di = |ui = 1 0 128 können die Isospinoperatoren über die Generatoren der SU (2) der Spingruppe, daher auch der Name, die Pauli-Matrizen 1 1 1 0 1 0 −i 1 0 , Iˆ2 = , Iˆ3 = Iˆ1 = 1 0 i 0 0 −1 2 2 2 mit den Vertauschungsrelationen i h Iˆi , Iˆj = iǫijk Iˆk dargestellt werden. Diese werden Spinalgebra oder aber Lie-Algebra der SU (2) genannt. Wir folgen Berger, indem wir hier zudem die dreidimensionale Darstellung der SU (2) betrachten. Die Generatoren in dieser Darstellung lauten 1 0 0 0 1 0 0 −1 0 1 i Iˆ1 = √ 1 0 1 , Iˆ2 = √ 1 0 −1 , Iˆ3 = 0 0 0 . 2 2 0 0 −1 0 1 0 0 1 0 Werden nun die Pionen |π + i = |1; 1i, |π 0 i = |1; 0i, |π − i = |1; −1i als Basisvektoren genommen bzw. wird der Übergang zu einer neuen orthonormierten Basis |π1 i = |π2 i = |π3 i = 1 √ −|π + i + |π − i 2 i √ |π + i + |π − i 2 |π 0 i durchgeführt, kommt man zur sogenannten adjungierten Darstellung, in der die Operatoren durch die Strukturkonstanten der Gruppe gegeben sind. Konkret sieht dies hier folgendermaßen aus: = −iǫijk . hπj |Iˆi |πk i = Iˆi jk D.h. die ǫijk sind die Strukturkonstanten der SU (2). In dieser Basis stellt sich desweiteren ˆ die Wirkung von eiπI2 besonders einfach dar. Sie entspricht einer Drehung um 180 um die 2-Achse, d.h. ˆ eiπI2 |π1 i = e = e iπ Iˆ2 iπ Iˆ2 |π2 i |π3 i = −|π1 i, |π2 i, −|π3 i. Mit den Rücktransformationen |π + i = |π − i = |π 0 i = 1 − √ (|π1 i + i|π2 i) 2 1 √ (|π1 i − i|π2 i) 2 3 |π i 129 kann dann die Wirkung auf die physikalischen Pionen bestimmt werden: ˆ eiπI2 |π + i ˆ = eiπI2 |π − i = e = iπ Iˆ2 |π 0 i |π − i, |π + i, −|π 0 i. Abschließend muß noch die Ladungskonjugation C auf die Pionen wirken. Nach Konvention kann dies als C|π ± i = −|π ∓ i, C|π 0 i = |π 0 i geschrieben werden. Da, wie erwähnt die QCD sowohl C wie auch I erhält, ist demnach auch G erhalten. Die QED verletzt aufgrund der unterschiedlichen Ladungen von upund down-Quarks Isospin und erhält dementsprechend G nicht. Die schwache Wechselwirkung wiederum verletzt sowohl I wie auch C. Die C-Parität von Zweiteilchensystemen wird hier noch ein wenig behandelt. Für ein π + π − -System z.B. ist die C-Parität identisch zur gewöhnlichen Parität, was relativ leicht einzusehen ist, da eine C-Konjugation dem Austausch von π + und π − entspricht. D.h. ein solches System aus spinlosem Teilchen und Antiteilchen hat C-Parität (−1)l . Etwas schwieriger wird es für ein System aus Fermion und Antifermion. Das einfachste System, daß für diesen Fall betrachtet werden kann, ist ein e− e+ -System und dieses soll nun kurz unter die Lupe genommen werden. Die Orts- und Spinkoordinaten der beiden Fermionen sollen schlicht mit 1 und 2 bezeichnet werden, dann ergibt die Anwendung der Ladungskonjugation C|e− (1) e+ (2)i = |e+ (1) e− (2)i und da dies ein Eigenzustand zu C sein soll, muß C|e− (1) e+ (2)i = ηC (e− e+ )|e− (1)e+ (2)i gelten. ηC läßt sich nun bestimmen, indem ausgenutzt wird, daß der Zustand |e+ (1) e− (2)i durch eine Paritätstransformation und anschließende Vertauschung der Spinkoordinaten in den Ursprungszustand überführt werden kann. Die Parität eines Fermion-AntifermionSystems ist (−1)l+1 . Die Vertauschung der Spins liefert eine Faktor (−1)S+1 womit |e+ (1) e− (2)i = (−1)l+S |e− (1) e+ (2)i gilt und demnach ηC (e− e+ ) = (−1)l+S . Dies läßt sich nun für allgemeine Fermion-Antifermion-Systeme generalisieren. ZEITUMKEHRINVARIANZ! Multiplikative- und additive Quantenzahlen Alle Quantenzahlen zu diskreten Symmetrien, z.B. C, P , G, sind multiplikative Quantenzahlen, d.h. der Zustand |π + i + |π − i hat G-Parität G = (−1) · (−1) = 1 und alle Quantenzahlen zu kontinuierlichen Symmetrien sind additive Quantenzahlen, die Ladung des obigen Systems ist Q = +1 + (−1) = 0. Beispiel ρ-bzw. η-Zerfall: Dieses Beispiel soll demonstrieren, wie aus den multiplikativen Quantenzahlen eines Teilchens Informationen über seine möglichen Zerfälle gezogen werden können. Das ρ-Meson, 130 ¯ ¯ |dūi bzw. √1 (|uūi − |ddi)-Zustand hat eine Masse von je nach Ladung entweder ein |udi, 2 mρ = 775.49 ± 0.34 MeV und wird von der Particle Data Group mit I G (J P C ) = 1+ (1−− ), wobei C nur für das ρ0 gilt, angegeben. Keine der Qantenzahlen spricht gegen einen Zerfall über die starke Wechselwirkung in zwei Pionen, die sich in einem Zustand mit relativem Drehimpuls l = 1 befinden. (Die Parität der zwei Pionen wird dadurch ηπ · ηπ · (−1)l = −1.) Und genau dies geschieht: Zu fast 100 % mit einer Zerfallsweite von Γ = 149.1 ± 0.8 MeV zerfallen die ρ-Mesonen über ρ± −→ π ± + π 0 , ρ0 −→ π + + π − . Wir erinnern uns, die Zerfallsbreite gibt den Kehrwert der mittleren Lebensdauer an. Eine Zerfallsbreite von 149.1 MeV entspräche einer mittleren Lebensdauer von 4.4 · 10−24 s und liegt in der typischen Größenordnung für starke Zerfälle. Zum Vergleich nun das η 0 -Meson: Es wird mit I G (J P C ) = 0+ (0−+ ) angegeben. Es ist ein Iso-Singlett mit einer Masse von mη = 547.853 ± 0.024 MeV. Paritätserhaltung spricht gegen einen starken Zerfall in zwei Pionen, da es J = 0 hat können die Pionen nicht in einem l = 1-Zustand sein. Drei Pionen sind hingegen durch G-Parität ausgeschlossen. Für einen Zerfall in vier Pionen steht nicht genug Masse zur Verfügung, d.h. da keine anderen Mesonen bzw. Baryonen leichter als das η existieren bleibt nur der Zerfall über die elektromagnetische bzw. schwache Wechselwirkung. Und tatsächlich das η 0 zerfällt elektromagnetisch entweder in zwei Photonen oder in drei Pionen, Paritätserhaltung gilt auch hier, mit einer Wahrscheinlichkeit von 39.31 % bzw 32.57 %. Die Breite des η 0 liegt bei 1.3 keV, dies entspricht einer mittleren Lebensdauer von 5.1 · 10−19 s. Die Daten sind alle aus http://pdg.lbl.gov/ entnommen. (Particle Data Group.) Nomenklatur zu SU (N )-Gruppen: Die Gruppen der speziellen unitären Transformationen SU (N ), d.h. der Transformationen U für die U U † = U † U = 1, det U = 1 gilt, haben die Ordnung m = N2 − 1 und den Rang r = N − 1, wobei die Ordnung der Gruppe, die Anzahl der Generatoren angibt, 3 Pauli-Matrizen im Falle der SU (2), und der Rang die Anzahl an Generatoren angibt, die diagonalisiert werden können, z.B. Iˆ3 für die SU (2). 5.1.7 Händigkeit bzw. Chiralität und Helizität Im Abschnitt über Wechselwirkungen, speziell in der heuristischen Herleitung der QEDLagrangedichte wurde die Händigkeit eines Fermions bereits eingeführt. Ein genauerer Blick zeigt, daß masselose Teilchen einer festen Spineinstellung grundsätzlich nur eine 131 Händigkeit haben. Dies kann an der expliziten Form des Spinors mit p~ = (0, 0, p3 ) festgemacht werden. (Die Spin s = 1-Einstellung, entspricht Jz = ± 21 für Teilchen bzw. Antiteilchen, hat nur rechtshändige, die s = 2-Einstellung, entspricht Jz = ∓ 21 für Teilchen bzw. Antiteilchen, nur linkshändige Komponenten.) Liegt der Impuls in z-Richtung sind augenscheinlich Helizität h= ~ · p~ S , |~ p| oft auch h = ~ · p~ S ~ |~ p||S| die Projektion des Spins auf die Impulsrichtung und Händigkeit äquivalent, modulo einen Faktor 21 . D.h. linkshändige masselose Teilchen ebenso wie rechtshändige Antiteilchen haben Helizität h = − 12 , rechtshändige Teilchen und linkshändige Antiteilchen h = + 21 . (Dies ist für masselose Teilchen eine relativistische Invariante, da es kein Inertialsystem gibt, in welchem sich die Impulsrichtung umdreht.) An den geladenen Übergängen der schwachen Wechselwirkung nehmen nur linkshändige Teilchen teil, d.h. masselose Neutrinos, die nur schwach wechselwirken, treten nur linkshändig und demnach nur mit Helizität − 21 auf. (Antineutrinos treten ebenfalls nur linkshändig auf und damit mit Helizität h = + 12 .) Für Teilchen mit Masse muß die Abweichung zwischen Helizität und Händigkeit mit der Masse bzw. der Geschwindigkeit (genauer β = vc ) zusammenhängen. Man stellt fest, daß die Wahrscheinlichkeit, ein Teilchen mit Helizität h = − 12 in einem linkshändigen Zustand zu finden − 1 v PLh = 1+ 2 c ist. Äquivalent ist die Wahrscheinlichkeit dieses in einem rechtshändigen Zustand zu finden + v 1 1− . PRh = 2 c Auf diese Weise kann sowohl die gemessene Rate im Wu-Experiment, siehe entsprechendes Beispiel im Abschnitt Zerfallsraten, wie auch der Zerfall des Pions erklärt werden. Dieser soll hier ein wenig näher beleuchtet werden. Die geladenen Pionen zerfallen zu fast 100 % via π − −→ µ− + ν̄µ , π + −→ µ+ + νµ , dabei wäre der Zerfall in ein Elektron und ein entsprechendes Neutrino energetisch günstiger. Hier tritt jedoch ein Effekt auf, der auch Helizitätsunterdrückung genannt wird. Nehmen wir den Zerfall des π − . Im Ruhesystem des Pions werden Elektron und Antineutrino in entgegengesetzte Richtung emittiert. Das Antineutrino hat, wie oben festgestellt, Helizität h = + 21 dementsprechend muß das Elektron, da das Pion ein Spin0-Teilchen ist, ebenfalls Helizität h = + 12 haben. Nun ist die Wahrscheinlichkeit ein Teilchen mit h = + 21 in einem linksändigen Zustand zu finden + PLh = und speziell in diesem Fall + PLh = 1 v 1− 2 c m2e = 1.34 · 10−5 . m2π + m2e + Wird die Elektronmasse durch die Myonmasse ersetzt, ergibt sich für PLh ∼ 30%, daher zerfällt das Pion vorwiegend in Myonen. Ein Wort der Vorsicht noch zum Abschluß dieses 132 Abbildung 44: Schematische Darstellung des Pion- und anschließenden Myon-Zerfalls und der ausgeschlossene Paritätstransformierte Prozeß Abschnitts: Im englischen Sprachgebrauch wird mit Händigkeit (handedness) die Helizität bezeichnet, die Händigkeit mit chirality, daher wird im Weiteren ebenfalls Chiralität verwendet, wenn Händigkeit gemeint ist. (Dies ist eine häufige Quelle von Verwirrung.) 5.1.8 CP -Invarianz Im vorigen Abschnitt wurde sich mit der Chiralität bzw. Händigkeit und demnach der Paritätserhaltung in der schwachen Wechselwirkung beschäftigt. Wir sahen, daß Antiteilchen bei gleicher Chiralität die entgegengesetzte Helizität hatten, d.h. daß Ladungskonjugation C auch keine Symmetrie der schwachen Wechselwirkung sein kann. Was aber, wenn C und P nacheinander ausgeführt würden? In diesem In diesem Falle würde ein Teilchen in sein Antiteilchen mit identischer Helizität überführt. Ist dies eine Symmetrie der schwachen Wechselwirkung? Mit diesem Thema stoßen wir in eines der aktivsten Forschungsgebiete der modernen Teilchenphysik vor und dies obwohl die experimentellen Grundlagen bereits 1964 durch James Christenson, James Cronin, Val Fitch, René Turlay (NPP 1980 für Cronin und Fitch) gelegt wurden. Zunächst wird jedoch noch einmal der Zerfall π + −→ µ+ +νµ betrachtet. Wie im vorigen Abschnitt dargelegt, haben sowohl Antimyon wie auch Neutrino Helizität − 12 . Wird eine Ladungskonjugation angewandt, von der wir wissen, daß sie von der schwachen WW nicht erhalten wird, hieße dies, daß ein π − in ein µ− und ein ν̄µ zerfiele. Die Helizität bliebe unangetastet, d.h. sowohl Myon als auch Antineutrino hätten weiterhin Helizität − 21 . Ein Antineutrino mit Helizität − 12 existiert jedoch per Konstruktion nicht. Wendet man aber zusätzlich zur Ladungskonjugation C eine Paritätstransformation P an, dann wechselten die Helizitäten ihr Vorzeichen, zur Erinnerung ~ · p~ S , h= |~ p| d.h. dieser Zerfall wäre wieder erlaubt. Daher war zunächst die Vermutung, die schwache Wechselwirkung erhielte das Produkt CP . Diese Vermutung wurde jedoch durch oben- 133 genanntes Experiment nicht bestätigt. Am klassischen Beispiel der Kaonen, das Originalexperiment wurde auch mit diesen durchgeführt, sollen die gefundenen Effekte erklärt werden. Prolog: Zweizustandsystem: Um die grundsätzliche Idee zu veranschaulichen greifen wir auf ein möglichst einfaches System zurück: Das Zweizustandsystem. Angenommen die zwei Zustände würden durch zwei identische Potentialtöpfe, die symmetrisch zum Ursprung angeordnet sind, gegeben. Ist die Barriere zwischen den beiden unendlich hoch, dann haben die Energieeigenzustände in beiden Töpfen, die nach ihrer Lage zum Ursprung |Li und |Ri genannt werden, identische Energien: H0 |Li = E0 |Li, H0 |Ri = E0 |Ri Die Zustände sind also entartet. Zudem sind dank der unendlich hohen Barriere keine Übergänge zwischen den beiden Zuständen möglich: hL|H0 |Ri = hR|H0 |Li = 0. Wird nun eine Wechselwirkung eingeführt, die Übergänge zwischen |Li und |Ri induziert und die damit Barriere zwischen den beiden Töpfen reduziert, dann werden die Eigenfunktionen zu Überlagerungen der ungestörten Zustände und die Entartung wird aufgehoben. Beides wird im Folgenden kurz erläutert. Der neue Hamiltonoperator lautet H|ψi = (H0 + Hint )|ψi, wobei sich die Eigenfunktionen aus der Symmetrie des Problems ergeben. Die beiden Potentialtöpfe sind spiegelsymmetrisch zum Ursprung, d.h. der Hamiltonoperator sollte mit dem Paritätsoperator vertauschen: [H, P ] = [(H0 + Hint ), P ] = 0. Demnach ergeben sich gemeinsame Eigenfunktionen für H und P . Da P |Li = ηP |Ri, P |Ri = ηP |Li, ergeben sich diese zu symmetrischen und antisymmetrischen Linearkombinationen der ungestörten Eigenfunktionen: |Si = |Ai = 1 √ (|Li + |Ri) , 2 1 √ (|Li − |Ri) , 2 P |Si = ηP |Si, P |Ai = −ηP |Ai. Mit hL|H0 |Ri = hR|H0 |Li = 0 gilt auch hS|H0 |Ai = hA|H0 |Si = 0. Ist die Störung klein, dann erhält man via Störungstheorie hS|Hint |Si = E ′ + ∆E, hA|Hint |Ai = E ′ − ∆E, wobei hL|Hint |Li = hR|Hint |Ri hR|Hint |Li = hL|Hint |Ri 134 = E,′ = ∆E. Wie bereits geschrieben wird also die Entartung aufgehoben, der Energiemittelwert verschoben und die Eigenfunktionen sind Überlagerungen der ursprünglichen ungestörten Eigenfunktionen. Wir werfen nun zur Zeit t = 0 ein Teilchen in den linken Potentialtopf, d.h. seine Wellenfunktion lautet 1 |ψ(0)i = |Li = √ (|Si + |Ai) . 2 Wie sieht die Zeitentwicklung dieser Wellenfunktion aus? Wir wissen, dass es sich bei |ψ(t)i um eine Linearkombination von |Li und |Ri handeln muss, dass also |ψ(t)i = α(t)|Li + β(t)|Ri gelten muss, wobei α(t), β(t) komplexe Zahlen mit |α(t)|2 + |β(t)|2 = 1 sind. Mit α(0) = 1 und β(0) = 0 ergibt sich dann ′ t ∆E t ∆E t |Li + i sin |Ri . |ψ(t)i = e−i(E0 +E ) ~ cos ~ ~ Die Wahrscheinlichkeit das Teilchen dann nach einer Zeit t im rechten Potentialtopf zu finden ergibt sich durch das Betragsquadrat der Projektion von |ψ(t)i auf hR|: PR (t) = sin2 ∆E t . ~ D.h. das Teilchen oszilliert mit einer Frequenz ω= 1 ∆E = hL|Hint |Ri ~ ~ zwischen den beiden ungestörten Zuständen. Einen ähnlichen Vorgang werden wir bei der Betrachtung der CP -Verletzung im Kaonsystem wiedertreffen. Beispiel: Kaon-Zerfall: Kaonen sind Teilchen aus einem up- bzw. down-Quark und einem strange-Quark. Interessieren sollen uns hier insbesondere die neutralen Kaonen. Diese können im Quarkmodell als ¯ K 0 = |ds̄i, K̄ 0 = |sdi dargestellt werden und sind mit ihren Quantenzahlen I(J P ) = 12 (0− ) und Strangeness s = ±1 wohldefinierte, unterscheidbare Eigenzustände der starken Wechselwirkung, nicht jedoch der Ladungskonjugation C, da C|K 0 i = |K̄ 0 i und C|K̄ 0 i = |K 0 i gilt, wobei die Phasen wiederum Konvention sind. Die Unterscheidung in der starken Wechselwirkung geschieht aufgrund der unterschiedlichen Strangeness, so sind für das K 0 unterhalb der nötigen Energie für die Erschaffung zusätzlicher Pionen folgende Streureaktionen am Proton möglich K0 + p K0 + p −→ −→ K 0 + p, K + + n, wohingegen für das K̄ 0 folgende Kanäle offenstehen: K̄ 0 + p K̄ 0 + p −→ K̄ 0 + p, −→ π + + Λ. 135 Das Λ ist ein Baryon mit einem Strange-Quark und demnach ein eindeutiges Zeichen dafür, daß ein K̄ 0 vorlag. Wie bereits erwähnt, erhält die schwache Wechselwirkung die Strangeness und allgemeiner generell Quark-Flavour nicht. Es läßt sich also ein Übergang zwischen K 0 und K̄ 0 vorstellen, bei dem das s̄ sich zun ächst in ein ū, c̄ oder t̄ umwandelt und sich die¯ Analog dazu das d, das zuerst in ein u, c oder t und dann in ein s ses dann in ein d. übergeht. In der Sprache der Feynmandiagramme ist dies in Abbildung 45 dargestellt. Dies sorgt dafür, dass |K 0 i und |K̄ 0 i keine Eigenzusände der schwachen Wechselwirkung Abbildung 45: Feynmandiagramme für die K 0 -K̄ 0 -Mischung sein können, sondern dass analog zum Zweizustandsystem, Überlagerungen betrachtet werden müssen. Zudem wurde experimentell festgestellt, daß die Kaonen in zwei oder drei Pionen zerfallen können, was Eigenzuständen von CP zu unterschiedlichen Eigenwerten entspricht. Um dies genauer zu verstehen, sollte zunächst klar sein, daß weder K 0 noch K̄ 0 ein Eigenzustand zu CP ist, sehr wohl aber die Überlagerungen 1 |K1 i = √ |K 0 i + |K̄ 0 i , 2 1 |K2 i = √ |K 0 i − |K̄ 0 i . 2 Wie oben geschrieben, wird den Kaonen wie den Pionen negative Parität zugeordnet, daher sind die CP -Eigenwerte CP |K1 i = −|K1 i, CP |K2 i = +|K2 i leicht einzusehen. Angenommen, die schwache Wechselwirkung erhielte CP , dann wären ihre Eigenzustände obige Linearkombinationen der Eigenzustände der starken Wechselwirkung. Desweiteren wäre, für l = 0 aus CP |π + π − i = +|π + π − i, CP |π + π − π 0 i = −|π + π − π 0 i ersichtlich, daß K1 in drei, K2 in zwei Pionen zerfiele und demnach daß K1 aufgrund des geringeren Phasenraums für den Zerfall in drei Pionen eine längere mittlere Lebenszeit 136 hätte. Desöfteren finden sich daher auch die Bezeichnungen KL und KS für das langbzw. kurzlebige neutrale Kaon. Umgekehrt lassen sich die Eigenzustände der starken Wechselwirkung nun auch als Linearkombination von K1 und K2 bzw. KL und KS darstellen. |K 0 i = |K̄ 0 i = 1 √ (|K1 i + |K2 i) 2 1 √ (|K1 i − |K2 i) 2 Da K1 und K2 unterschiedliche Lebensdauern haben τS = (0.8953 ± 0.0006) · 10−10 s τL = (5.116 ± 0.020) · 10−8 s, wobei KS zu nahezu 100 % in zwei Pionen zerfällt, d.h. der mögliche Zerfall in drei Pionen mit relativen Bahndrehimpuls ist stark unterdrückt, während KL als wichtigste Zerfallskanäle Γi Zerfall Γ + − KL −→ π + e + ν̄e 38.78 % KL −→ π + + µ− + ν̄µ 27.18 % KL −→ π 0 + π 0 + π 0 21.13 % KL −→ π + + π − + π 0 12.55 % aufweist, ergibt sich so die Möglichkeit, daß aus einem durch die starke Wechselwirkung entstandenen K 0 -Strahl nach einiger Zeit ein fast reiner K1 - bzw. KL -Strahl wird. Die Zeitentwicklung von KL und KS kann in ihrem jeweiligen Ruhesystem durch die Quantenmechanik instabiler Teilchen gegeben werden |KL (t)i |KS (t)i = = t |KL (0)ie−iML t e−ΓL 2 , t |KS (0)ie−iMS t e−ΓS 2 , wobei wir zunächst annehmen, daß die beiden Zustände unterschiedliche Massen haben. ∂ Die Eigenwerte des Hamiltonoperators H = i ∂t sind i ML,S − ΓL,S , 2 was in Matrixform mit |KL,S i als Basisvektoren geschrieben werden kann 0 MS − 2i ΓS . H= 0 ML − 2i ΓL Die Nichtdiagonalelemente wären ungleich null, wenn KS und KL in einander übergehen könnten, d.h. wenn CP verletzt wäre, was, wie wir sehen werden, der Realität entspricht. Doch zunächst soll die Wahrscheinlichkeit angegeben werden, daß zur Zeit t in einem K 0 Strahl ein K̄ 0 gefunden wird. Dies kann aus dem Skalarprodukt der beiden Zustände zur Zeit t bzw. zur Zeit 0 bestimmt werden: A(t) = 1 (hKL (t)| − hKS (t)|) (|KL (0)i + |KS (0)i) . 2 |KL i und |KS i sind orthogonal, daher kann t 1 −iML t −ΓL t 2 − e−iMS t e−ΓS 2 e e A(t) = 2 137 und somit das Betragsqadrat AA∗ (t) = P (t) = mit t 1 −ΓL t e + e−ΓS t − 2 cos(∆M t)e−(ΓL +ΓS ) 2 4 ∆M = ML − MS berechnet werden. Man kann also von einer Oszillation der Strangeness sprechen. Die Frequenz dieser Oszillation ist abhängig vom Massenunterschied des lang- und kurzlebigen Kaons. Dieser konnte im Experiment zu ∆M = (3.483 ± 0.006) · 10−6 eV bestimmt werden, wobei bedacht werden muß, daß für den Fall von CP -Verletzung auch die nichtdiagnonalen Elemente von H ungleich null wären und demnach zunächst eine Diagonalisierung durchgeführt werden müßte, was zu einer Mischung von |K1 i und |K2 i führte, welche dann die |KL i und |Ks i wären. Um dem letzten Absatz noch ein wenig mehr Bedeutung zu verleihen, soll nun erwähnt werden, daß in dem Experiment von 1964 festgestellt wurde, daß KL −→ π + + π − mit einem Verzweigungsverhältnis von etwa 0.2 % stattfindet und demnach CP verletzt ist. |KL i und |KS i sollten demnach, wie im vorigen Absatz geschrieben, Linearkombinationen von |K1 i und |K2 i sein, wobei die Kleinheit der CP -Verletzung nur jeweils eine kleine Beimischung impliziert. 1 (|K1 i + ǫ|K2 i) 1 + |ǫ|2 1 |KS i = p (ǫ|K1 i + |K2 i) 1 + |ǫ|2 |KL i = p ǫ läßt sich unter der Annahme, dass K1 nicht direkt in zwei Pionen zerfällt, experimentell über das Verhältnis hπ + π − |T |KL i η± = + − hπ π |T |KS i extrahieren. Unter genannter Annahme ist ǫ = η± , womit sich der Betrag, die Amplitude ist im Allgemeinen eine komplexe Zahl, von ǫ über das Verhältnis der gemessenen Zerfallsbreiten s ΓL (π + π − ) |η± | = |ǫ| = ΓS (π + π − ) = (2.288 ± 0.014) · 10−3 bestimmen läßt. Dies bestätigt die oben gemachte Aussage, dass die CP -Verletzung nur klein und demnach auch die Beimischung jeweils nur klein ist. Um die Phase, wir bezeichnen diese im Folgenden mit Φ± zu bestimmen, ist ein wenig mehr Aufwand nötig. Gehen wir zunächst zur Zeit t = 0 von einem Teilchenstrahl aus, der nur aus K 0 besteht. 138 An diesem wollen wir die Anzahl der π + π − -Paare entlang der Flugrichtung untersuchen. Die zeitabhängige Amplitude für das Auftreten solcher Paare läßt sich mit der Definition von η± und |K 0 i ∼ |KS i + |KL i relativ leicht als A(π + π − ) ∼ e−iMS t e−ΓS t/2 + η± e−iML t e−ΓL t/2 schreiben. Die Wahrscheinlichkeit des Zerfalls ergibt sich dann aus dem Betragsquadrat der Amplitude P (t) ∼ e−ΓS t + |η± |2 e−ΓL t + 2|η± |e−(ΓS +ΓL )t/2 cos(∆M t − Φ± ). Zu dieser Interferenz werden in Abbildung experimentelle Ergebnisse gezeigt. Lassen wir nun die Hypothese der CP-Erhaltung im Hamiltonoperator fallen bzw. in der T -Matrix, dann nimmt dieser folgende Gestalt in der K1 , K2 Basis an: i ′ Γ im M − S 2 S H= . i ′ −im M L − ΓL 2 Die Nichtdiagonalelemente mit reellem m′ haben entgegengesetztes Vorzeichen, da H natürlich weiterhin hermitesch ist. Die Diagonalisierung dieser Matrix liefert nur eine sehr geringe Veränderung der Eigenwerte und ein Vergleich mit der Darstellung für |KL i und |KS i liefert unter der Annahme m′2 → 0 und ΓS ≫ ΓL die Beziehung ǫ= im′ ∆M + i Γ2S für ǫ und demnach tan Φ± = 2∆M ΓS für die Phase. Der Wert, der sich aus diesen Parametern ergibt Φ± = (43.5 ± 0.1)◦ und derjenige, der direkt aus der Interferenz gemessen wurde Φ± = (43.52 ± 0.06)◦ , stimmen sehr gut miteinander überein. Die Effekte der Oszillation und der CP -Verletzung ¯ wurden inzwischen auch im B und Bs -System beobachtet. Für |B 0 i = |db̄i, |B̄ 0 i = |bdi wurde die Massendifferenz ∆M = (3.357 ± 0.026) · 10−4 eV und für |Bs0 i = |sb̄i, |B̄s0 i = |bs̄i ∆M = (116.4 ± 0.5) · 10−4 eV gemessen. 2012 wurde der analoge Effekt im D0 − D̄0 -System gesehen, allerdings wurde noch keine Massendifferenz angegeben. Bisher wurde nur die sogenannte indirekte CP-Verletzung in der Mischung, d.h. in ∆S = 2-Übergängen, die Strangeness ändert sich um zwei Einheiten, betrachtet. Direkt nach der Entdeckung der CP-Verletzung 1964 wurde von L. Wolfenstein eine “superschwache” 139 Wechselwirkung vorgeschlagen, die den Übergang zwischen KL und KS induziert, wohingegen die schwache Wechselwirkung weiterhin CP-erhaltend sein sollte, insbesondere die ∆S = 1-Zerfälle von KL und KS in zwei bzw. drei Pionen wären dementsprechend CPerhaltend. Dies hat sich in der Folge nicht bestätigt. Zur weiteren Untersuchung lassen wir zunächst die Annahme hπ + π − |T |K1 i = 0 fallen, d.h. dass η± für kleine ǫ nun die Form η± = ǫ + hπ + π − |T |K1 i hπ + π − |T |K2 i annimmt, wobei wir dies als η ± = ǫ + ǫ′ schreiben. Noch einmal, mit dieser Definition wird sowohl CP-Verletzung in der Mischung, also ∆S = 2-Übergängen, als auch im Zerfall, also ∆S = 1-Übergängen erlaubt. Um diese jedoch trennen zu können, wird eine weitere Messung benötigt, die Zugriff auf die gleichen Größen erlaubt. Eine Möglichkeit besteht im Zerfall in zwei neutrale Pionen, welcher experimentell sehr schwierig zu analysieren ist, da die neutralen Pionen in zwei Photonen zerfallen, und somit die Kinematik des Zerfalls aus einem Endzustand aus vier Photonen rekonstruiert werden muß, dieses Problem soll uns im Weiteren jedoch nicht interessieren. Um eine Verbindung zwischen dem zweiten Term in η00 = = hπ 0 π 0 |T |KL i hπ 0 π 0 |T |KS i hπ 0 π 0 |T |K1 i ǫ+ 0 0 hπ π |T |K2 i und ǫ′ herzustellen, bedarf es einer Isospinanalyse, die in ihren Grundzügen hier durchgeführt werden soll. Das K 0 und K̄ 0 sind Isospin 12 -Zustände, das π 0 π 0 -System läßt sich via Clebsch-GordanKoeffizienten als Überlagerung eines Isospin 2 Isospin 0 Zustandes schreiben: r r 2 1 0 0 |π π i = |2, 0i − |0, 0i. 3 3 In ähnlicherweise kann der π + π − -Zustand geschrieben werden, wobei hier noch beachtet werden muß, dass man diesen als normierte Summe, d.h. als 12 (|π + π − i+|π − π + i schreiben muß: r r 1 2 + − |2, 0i + |0, 0i. |π π i = 3 3 Die Übergänge des K 0 können also als Überlagerung von Übergängen in einen Isospin 2 und einen Isospin 0 Zustand geschrieben werden: r r 1 2 + − 0 hπ π |T |K i = T2 + T0 , 3 3 r r 2 1 T2 − T0 , hπ 0 π 0 |T |K 0 i = 3 3 140 wobei T2 , T0 die Amplituden des Überganges in den entsprechenden Isospinzustand angeben. Die äquivalenten Amplituden für K̄ 0 lassen sich über das CP T -Theorem zu hπ + π − |T |K 0 i = −hπ + π − |T |K̄ 0 i∗ und analog für π 0 π 0 angeben. Damit ergeben sich Ausdrücke für |K1 i und |K2 i: r r 1 2 ∗ + − (T2 − T2 ) + (T0 − T0∗ ), hπ π |T |K1 i = 3 3 r r 2 1 ∗ 0 0 (T2 − T2 ) − (T0 − T0∗ ), hπ π |T |K1 i = 3 3 r r 1 2 hπ + π − |T |K2 i = (T2 + T2∗ ) + (T0 + T0∗ ), 3 3 r r 2 1 ∗ 0 0 (T2 + T2 ) − (T0 + T0∗ ). hπ π |T |K2 i = 3 3 Die empirische ∆I = 12 -Regel der schwachen Wechselwirkung besagt nun, dass T0 die dominierende Amplitude sein wird. Dann kann unter den Annahmen, dass T0 ≫ T2 und da es nur auf die relative Phase zwischen T0 und T2 ankommt, dass T0 reell ist, trivial ein Ausdruck für η± und η00 hergeleitet werden: η± = = η00 = = hπ + π − |T |K1 i hπ + π − |T |K2 i ǫ + ǫ′ , hπ 0 π 0 |T |K1 i ǫ+ 0 0 hπ π |T |K2 i ǫ − 2ǫ′ , ǫ+ wobei T2 i ǫ′ = √ Im T 2 0 ist. Dieses ist in dieser (vereinfachten) Darstellung rein imaginär. Vernachlässigt wurde unter anderem, dass es zu Endzustandswechselwirkungen kommt, die dann die experimentell gemessene Phase von (48 ± 4)◦ ergeben. Dieser Wert ist sehr nahe an dem Wert ′ für φ± , weshalb das Verhältnis der Realteile Re ǫǫ beinahe dem Verältnis der Beträge entsprechen wird. Messungen dieser Größe ergaben als Mittelwert Re ǫ′ = (16.7 ± 2.6) · 10−4 . ǫ Dies kann aufgrund eines subtilen Interferenzeffektes zwischen Mischung und Zerfall noch nicht als Beweis für direkte CP-Verletzung im Zerfall gesehen werden, siehe hierzu z.B. Y. Nir “CP-Violation” SLAC-PUB-5874, aber inzwischen gibt es mehrere experimentelle Ergebnisse sowohl im Kaon, wie auch im B-Meson System, die eine direkte CP-Verletzung nachweisen. 5.2 Schwache Wechselwirkung und CKM-Matrix Mit der experimentellen Bestätigung der CP -Verletzung stellt sich nun die Frage der theoretischen Erklärung bzw. Beschreibung dieses Effekts, aber zunächst noch ein Anmerkung, warum der CP -Verletzung hier soviel Raum gewährt wird und warum dieser 141 Effekt für Theoretiker so interessant ist. Eine der Ursachen liegt in den sogenannten Sakharov-Kriterien. Sakharov stellte 1967 drei Kriterien auf, die nötig für Baryogenese also für die Entstehung einer effektiven Baryonenzahl im Universum sind. Meßwerte für die Baryonasymmetrie normiert auf die Photonanzahl liegen im Bereich η= nB − nB̄ ∼ (4.7 − 6.5) · 10−10 , nγ wobei nB , nB̄ , nγ die Anzahl der Baryonen, der Antibaryonen und der Photonen sind. Diese drei Kriterien lauten: 1. Es muß baryonzahlverletzende Prozesse geben, damit sich aus einem Universum mit B = 0 eines mit B 6= 0 bilden kann. 2. Es bedarf der C- und CP -Verletzung, damit nicht jedem baryonzahlverletzendem Prozeß ein äquivalenter Prozeß entspricht, dar Antibaryonen erschafft. 3. Dem dritten Kriterium zufolge kann sich eine effektive Baryonenzahl nur außerhalb des thermischen Gleichgewichts einstellen, da im Gleichgewicht die inversen Prozesse mit gleicher Rate ablaufen würden und demnach die Asymmetrie wieder auswaschen würden. Das erste Krtiterium ist mehr oder weniger Selbstevident, damit allerdings in keinster Weise uninteressant, im Standardmodell sind nur sogenannte Sphaleronprozesse bekannt, die die Baryonzahl verletzen, ansonsten gilt diese als erhalten. Kriterium 2 und 3 sind ebenfalls selbsterklärend aber gerade das zweite Kriterium hat den Bereich der sogenannten Flavour-Physik, der sich neben der Untersuchung der Quarkhierarchien genau den Übergängen zwischen den verschiedenen Quarksorten und damit auch (und teilweise sogar vorwiegend) der CP -Verletzung widmet, befeuert. Um CP -Verletzung nicht nur von der phänomenologischen Seite zu beschreiben, bedarf es der CKM-Matrix und für deren Herleitung die zugrundeliegende schwache Wechselwirkung mitsamt spontaner Symmetriebrechung durch den Higgsmechanismus. Da dies hier nicht eingeführt werden kann, wird ein Mittelweg genommen. Zunächst werden noch einmal einige grundlegende Beobachtungen bezüglich der schwachen Wechselwirkung angeführt. C- und P -Verletzung waren das Thema der letzten Abschnitte. Isopsin bzw. allgemeiner Quarkflavour bleibt ebenfalls nicht erhalten, aber woran koppelt die schwache WW? Es wurde bereits mehrfach erwähnt, daß nur linkshändige Teilchen an ihr teilnehmen. Aus Leptonzerfällen, z.B. aus µ− −→ e− + ν̄e + νµ , µ+ −→ e+ + νe + ν̄µ kann geschlossen werden, daß die schwache Wechselwirkung immer an Paare von Leptonen einer Familie koppelt, bzw. daß nur Übergänge innerhalb einer Familie stattfinden. Dieses Phänomen der Leptonzahlerhaltung bzw. genauer der Erhaltung der Leptonzahl einer Familie kann auch daran gesehen werden, daß bisher keine Zerfälle der Art µ− −→ e− + γ, µ− −→ e− + e+ + e− beobachtet wurden. Zudem scheint die Kopplung an jedes Mitglied einer Familie identisch, daher wird diesen analog zum starken Isospin der sogenannte schwache Isospin T zugeordnet: 1 νe νµ ντ +2 . , , , T3 = e− L µ− L τ− L − 12 142 Rechtshändige Leptonen werden in Singletts angeordnet und nehmen an geladenen Übergängen der schwachen Wechselwirkung, die hier vorwiegend betrachtet werden, nicht teil. Für Quarks bietet sich zunächst ein ähnliches Schema an 1 u c t +2 , , , , T3 = d L s L b L − 12 aber schon Cabibbo postulierte 1963 eine Mischung der down- und strange-Quarks, die zu Übergängen zwischen den ersten beiden Quarkfamilien führen konnte, die dritte war zu dieser Zeit noch unbekannt. Die Eigenzustände der schwachen Wechselwirkung waren demnach Mischungen der Masseneigenzustände bzw. der Eigenzustände der QCD. (Dies erinnert an die Linearkombination der starken Eigenzustände zu CP -Eigenzuständen.) In Matrixschreibweise kann dies folgendermaßen angegeben werden: ′ |d i cos ΘC sin ΘC |di = . − sin ΘC cos ΘC |s′ i |si Hier ist ΘC der Cabibbowinkel, wobei | sin ΘC | ≈ 0.22 und | cos ΘC | ≈ 0.98 gilt, d.h. das down Quark hat eine kleine Beimischung des strange-Quarks, ebenso das strangeQuark eine Beimischung des down-Quarks. Wichtigster hieraus folgender Effekt ist, daß das strange-Quark, dadurch daß es einen down-Anteil hat, in ein up-Quark zerfallen kann, indem es ein W − aussendet. Zu berücksichtigen ist nur, daß dieser Übergang im sin ΘC Vergleich zu d → u um cos ΘC unterdrückt ist. Man spricht in solchen Fällen auch häufig von Cabibbounterdrückung. Die Leistung von Kobayashi und Maskawa 1973 (NPP 2008), bevor die dritte Familie bzw. sogar bevor das charm-Quark entdeckt war, bestand darin, zu erkennen, daß CP Verletzung in den geladenen Übergängen der schwachen Wechselwirkung ganz generisch auftritt, wenn Cabibbos Ansatz auf drei Familien erweitert wird. Die explizite Herleitung gestaltet sich natürlich als schwieriger als dargelegt, aber hier soll zunächst mit dieser simplen Erweiterung Vorlieb genommen werden. Für drei Familien sieht obiger Ansatz wie folgt aus: ′ |di Vud Vus Vub |d i |s′ i = Vcd Vcs Vcb |si . |bi Vtd Vts Vtb |b′ i Ein b −→ u wäre demnach möglich, da der d′ Eigenzustand eine wenn auch sehr kleine bottom-Quark Beimischung enthält und wäre mit dem entsprechenden Matrixelement Vub verbunden. Wie steht dies aber nun in Verbindung mit der CP -Verletzung bzw. CP Invarianz des letzten Abschnitts? Man nehme zum Beispiel den Quarkzerfall b −→ u + µ− + ν̄µ und sein CP -konjugiertes b̄ −→ ū + µ+ + νµ . Bei dem leptonischen Anteil wissen wir, daß dieser keine Probleme unter einer CP Transformation. Wie sieht es bei den Quarks aus? Für den b → u-Übergang kommt ein Faktor Vub zur Kopplung hinzu. Wenn wir davon ausgehen, daß die Lagrangedichte der schwachen Wechselwirkung CP -Invariant ist, Quark- und Leptonsektor werden abgesehen von der Mischung im Quarksektor identisch implementiert, dann könnte CP Verletzung nur dadurch entstehen, daß ∗ Vub 6= Vub 143 gilt bzw. wenn wir diese Überlegung zu beliebigen Quarkzerfällen anstellen, daß die CKMMatrix komplex ist. Es stellte sich heraus bzw. dies zeigten Kobayashi und Maskawa, daß eine komplexe CKM-Matrix erst ab drei Quarkfamilien möglich ist. Genauer zeigten sie, daß diese durch drei Winkel, analog zu den Eulerwinkeln, und eine Phase parametrisiert werden kann. Plausibel gemacht werden kann sich dies folgendermaßen. Die CKM-Matrix ändert die Norm eines Vektors im Flavour-Raum nicht, d.h. sie ist Unitär. Eine unitäre n × n-Matrix hat n2 unabhängige Parameter. In drei Dimensionen sind dies drei reelle Drehwinkel und sechs Phasen. Wird ein Quarkfeld mit einer reinen Phase multipliziert, ergibt sich jedoch kein physikalisch neuer Zustand, d.h. fünf der Phasen können in Redefinitionen der sechs Quarkfelder absorbiert werden, eine bleibt jedoch übrig. (Für eine 2 × 2-Matrix ergäbe sich ein Winkel und drei Phasen. Mit 4 Qarkfeldern können jedoch alle drei Phasen absorbiert werden und die resultierende Matrix wäre rein reell.) Mit den Hinweisen auf eine nichtverschwindende Masse der Neutrinos muß davon ausgegangen werden, daß es einen ähnlichen Mischungsmechanismus auch im Leptonsektor gibt. Dieser ist bisher sehr viel weniger gut erforscht, auch ergibt sich das Problem der Natur des Neutrinos, die bisher nicht eindeutig geklärt werden konnte. Dies soll jedoch in dem entsprechendem Abschnitt besprochen werden. Bisher wurde mit schwacher Wechselwirkung zumeist die Wechselwirkung bezeichnet, die durch die geladenen Eichbosonen bzw. Austauschteilchen W ± vermittelt wird, die Kopplung an geladene Ströme. Die schwache Wechselwirkung beschreibt allerdings auch den Austausch eines neutralen Eichbosons, des Z 0 , die Kopplung an neutrale Ströme. Diese Form der schwachen Wechselwirkung wurde ebenfalls vom Standardmodell von Glashow, Salam und Weinberg vorhergesagt, allerdings erst 1973 entdeckt. Sie zeigt keine der auffälligen Eigenschaften, die mit dem Austausch geladener W ± einhergehen, spielt aber in der Vereinheitlichung von schwacher und elektromagnetischer Kraft eine zentrale Rolle. 5.2.1 Phänomenologie der CKM-Matrix Die Standardparametrisierung der Particle Data Group lautet c12 c13 s12 c13 Vud Vus Vub Vcd Vcs Vcb = −s12 c23 − c12 s23 s13 eiδ c12 c23 − s12 s23 s13 eiδ Vtd Vts Vtb s12 s23 − c12 c23 s13 eiδ −c12 s23 − s12 c23 s13 eiδ s13 e−iδ s23 c13 c23c13 mit sij = sin Θij , cij = cos Θij und entspricht einem Produkt aus einer Drehung in der 1-2-Ebene, einer Phasentransformation, einer Drehung in der 1-3-Ebene, einer weiteren Phasentransformation und einer Drehung in der 2-3-Ebene: −i δ C13 0 s13 e 2 0 0 1 0 0 1 0 1 0 0 V = 0 c23 s23 0 δ i −s13 0 c13 0 −s23 c23 0 0 e 2 −i δ e 2 0 0 c12 s12 0 1 0 −s12 c12 0 . × 0 δ 0 0 1 0 0 ei 2 Die CKM-Matrix ist stark hierarchisch, d.h. die Übergänge zwischen Quarks werden umso unwahrscheinlicher, je weiter sie auseinanderliegen. Die von der PDG angegebenen 144 numerischen Werte für die Beträge der Matrixelemente verdeutlichen dies: +0.00016 0.97428 ± 0.00015 0.2253 ± 0.0007 0.00347−0.00012 +0.0011 +0.00015 VCKM = 0.2252 ± 0.0007 0.0410−0.0007 0.97345−0.00016 +0.00026 +0.0011 +0.000030 0.00862−0.00020 0.0403−0.0007 0.999152−0.000045 5.2.2 Neutrale Eichbosonen und elektroschwache Vereinheitlichung Bisher haben wir uns im Rahmen der schwachen Wechselwirkung nur mit den geladenen W ± -Bosonen beschäftigt. Zusätzzlich wurde jedoch zu Beginn das Z 0 mit einer Masse mZ = 91.2 GeV angegeben. Wie passen diese in das bisherige Bild. Die W ± -Bosonen koppeln an den schwachen Isospin T3 . Übergänge geschehen immer zwischen Mitgliedern einer Familie, abgesehen von der CKM-Mischung, d.h. immer von einem T3 = ± 12 - zu einem T3 = ∓ 12 -Zustand. Den W ± -Bosonen kann demnach der schwache Isospin T = 1 und T3 = ±1 zugeordnet werden. Um das Triplett zu vollenden benötigte es nur noch eines T = 1, T3 = 0 Bosons, welches das Z 0 sein könnte und welches ebenfalls mit gleicher Stärke g an die Mitglieder einer Familie koppelte. Experimentell wird jedoch festgestellt, daß das Z 0 unterschiedlich mit geladenen und ungeladenen Leptonen bzw. mit up- und down-typ Quarks wechselwirkt. D.h. diese Zuordnung des Z 0 wird den experimentellen Ergebnissen nicht gerecht, da die Kopplung anscheinend auch von der Ladung abhängt. Der hypothetische T = 1, T3 = 0 soll nun zunächst mit W 0 bezeichnet werden. Wie kann aber die ungewöhnliche Kopplung des Z 0 erklärt werden. Glashow, Salam und Weinberg hatten noch vor der Entdeckung des Z 0 die Idee, daß die elektromagnetische und schwache Wechselwirkung zur elektroschwachen Wechselwirkung vereinheitlicht werden könnten, wenn ein Isosinglett B 0 mit T = 0, T3 = 0 postuliert wird und Z 0 sowie das Photon als Mischung von W 0 und B 0 angesehen werden. Die Einführung eines Singletts ermöglicht die Einführung einer zweiten Kopplungskonstante g ′ und gibt über obige Mischung potentiell die Möglichkeit die unterschiedliche Wechselwirkung von Z 0 , γ und W ± zu erklären. Photon und Z 0 sind über den Weinbergwinkel mit den Zuständen B 0 und W 0 verbunden: |γi |Z 0 i = = cos ΘW |B 0 i + sin ΘW |W 0 i, − sin ΘW |B 0 i + cos ΘW |W 0 i. Üblicherweise wird für die Kopplung g ′ die sogenannte schwache Hyperladung YW als Quantenzahl eingeführt, die mit der Ladung und der dritten Komponente des Isospins über 1 Q = T3 + Y W 2 verknüpft ist. Gemeinsam sind W ± , W 0 und B 0 die Eichbosonen der SU (2)T ⊗ U (1)Y elektroschwachen Eichtheorie des Standardmodells, die durch obige Mischung in elektromagnetische und schwache Wechselwirkung aufgeteilt werden kann. Aus der Voraussetzung, daß das Photon nur an die elektrische Ladung koppelt, nicht aber an den Isospin, kann das Verhältnis der Kopplungskonstanten bestimmt werden: tan ΘW = wenn zudem g′ , g sin ΘW = p g′ g 2 + g ′2 , e = g · sin ΘW 145 cos ΘW = p g g 2 + g ′2 , gilt. Für den Weinbergwinkel ergibt sich ein Wert von sin2 ΘW = 0.23124 ± 0.00024, d.h. die schwache Kopplungskonstant ∼ g 2 ist etwa viermal so stark wie die elektromagnetische ∼ e2 . Die schwäche der schwachen Wechselwirkung folgt demnach nicht aus der Kopplung sondern aus der Masse der Eichbosonen, für deren Verhältnis sich mW = cos ΘW ≈ 0.88, mZ mit mW = 80.4 GeV und mZ = 91.2 GeV, ergibt. Hieraus ließe sich nun auch bestimmen, wie das Z 0 an verschiedene Fermionen koppelt. Diese Kopplung gZ (f ) ist durch die Mischung ein wenig komplizierter, da sowohl Ladung wie Isospin mit hineinspielen gZ (f ) = g · T3 − zf sin2 ΘW , cos ΘW wobei zf die Ladung des Fermions in Einheiten von e ist. Hier macht sich ebenfalls wieder ein Unterschied zwischen rechts- und linkshändigen Fermionen bemerkbar. Da rechtshändige Fermionen T3 = 0 haben, koppelt das Z 0 anders an diese: R gZ (f ) = L gZ (f ) = g · −zf sin2 ΘW cos ΘW 1 g · ± − zf sin2 ΘW cos ΘW 2 Breite des Z 0 5.3 Higgs-Mechanismus 5.4 Grenzen des Standardmodells bzw. Physik jenseits des Standardmodells 5.4.1 CP-Verletzung im B-System? 5.4.2 Anomales magnetisches Moment des Muons? 5.4.3 SUSY? A Einheitensysteme 146