Datengetriebene Abschätzung von Untergrundprozessen bei Top-Paar-Ereignissen mit dem CMS-Detektor von Florian Lenz Bachelorarbeit in Physik vorgelegt der Fakultät für Mathematik, Informatik und Naturwissenschaften der RWTH Aachen im August 2012 angefertigt im III. Physikalischen Institut B bei Prof. Dr. Achim Stahl Zweitgutachter: Dr. Oliver Pooth II III Ich versichere, dass ich die Arbeit selbstständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel benutzt, sowie Zitate kenntlich gemacht habe. Aachen, den IV Inhaltsverzeichnis 1 Einleitung 1 2 Theoretische Grundlagen 2.1 Das Standardmodell der Teilchenphysik . . . . . 2.2 Das Top-Quark . . . . . . . . . . . . . . . . . . 2.2.1 Top-Quark-Paar-Produktion . . . . . . . 2.2.2 Top-Quark-Paar-Zerfall . . . . . . . . . . 2.2.3 Untergründe vom Top-Quark-Paar-Zerfall 3 3 4 4 5 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Das CMS-Experiment am LHC 9 3.1 Der LHC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.2 Der CMS-Detektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 4 Simulation und Selektion von Ereignissen 13 4.1 Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 4.2 Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 4.3 Rekonstruktion und Selektion . . . . . . . . . . . . . . . . . . . . . . . . 14 5 Datengetriebene Untergrundabschätzung 5.1 Methode und Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Diskriminierende Variablen . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Maximum-Likelihood-Methode . . . . . . . . . . . . . . . . . . . . . . 5.4 Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.1 Anpassung des Signals und der addierten Untergründe an die Daten 5.5.2 Vergleich von ROOT und RooFit . . . . . . . . . . . . . . . . . . 5.5.3 Doppelpeak in simulierten Datensätzen bei M3 . . . . . . . . . . 5.5.4 Messung des Verhältnisses der Wirkungsquerschnitte von W+Jets und Signal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6 Ensemble-Studie zur Fehlerabschätzung . . . . . . . . . . . . . . . . . . 5.6.1 Ensemble-Studie mit Pseudoexperimenten . . . . . . . . . . . . . 5.6.2 Ergebnis für das Verhältnis des Wirkungsquerschnitts . . . . . . . 17 17 18 18 19 20 20 24 25 6 Zusammenfassung und Ausblick 31 7 Anhang 33 Literaturverzeichnis 26 28 28 29 37 i ii I NHALTSVERZEICHNIS Kapitel 1 Einleitung Im November 2009 wurden am Large Hadron Collider (LHC) am CERN in Genf die ersten Kollisionen von Protonen aufgezeichnet. Seitdem werden an den verschiedenen Detektoren Daten aufgenommen, mit denen bekannte Physik überprüft und neue Physik entdeckt werden kann. Am 04.07.2012 wurde ein Teilchen mit einer Masse von ca. 125 GeV, welches am CMS- und ATLAS-Detektor mit einer Signifikanz von jeweils 5 Standardabweichungen nachgewiesen wurde, vorgestellt. Dabei handelt es sich vermutlich um das letzte vom Standardmodell (SM) der Teilchenphysik vorhergesagte Teilchen, das Higgs-Boson. Da der LHC bei sehr hoher Energie eine hohe Luminosität erreicht, werden auch sehr schwere Teilchen, wie das Top-Quark, in hoher Zahl produziert und können daher sehr genau vermessen oder für grundlegende Messungen verwendet werden. Der semimyonische Zerfallskanal von Top-Quark-Paaren hat aufgrund eines hochenergetischen Myons, fehlender transversaler Energie und vier Jets eine gut erkennbare Signatur und wird daher in dieser Arbeit genutzt. Trotzdem treten Untergründe auf, die auf verschiedene Arten abgeschätzt werden können. Die theoretisch berechneten Wirkungsquerschnitte der Untergrundprozesse sind mit großen Unsicherheiten behaftet. Im Rahmen dieser Bachelorarbeit wurde gemeinsam mit Till Arndt eine datengetriebene Untergrundabschätzung durchgeführt, wobei vom CMS-Detektors aufgenommene Daten genutzt wurden. Dazu wurde eine simultane Anpassung von generierten Templates an gemessene Daten eingesetzt. In der vorgelegten Arbeit wird zunächst eine kurze theoretische Einleitung zum TopQuark im Standardmodell und eine kurze Übersicht über den LHC, sowie das CMSExperiment gegeben. In den nachfolgenden Kapiteln wird die Methode zum Abschätzen des Untergrunds beschrieben. Die Ergebnisse werden vorgestellt und diskutiert. 1 2 K APITEL 1. E INLEITUNG Anmerkungen zu Konventionen In der gesamten Auswertung werden, wie in der Hochenergiephysik üblich, natürliche Einheiten verwendet: c = h̄ = 1 Hieraus ergibt sich inbesondere Folgendes: [Masse] = [Impuls] = [Energie] = [Zeit]−1 = [Länge]−1 = eV Ein Elektronenvolt entspricht dabei 1, 602 · 10−19 J. Ladungen werden zudem in Einheiten der Elementarladung e = 1, 602 · 10−19 C angegeben. Wenn es der Übersichtlichkeit dient, werden SI-Einheiten genutzt. Kapitel 2 Theoretische Grundlagen 2.1 Das Standardmodell der Teilchenphysik Das Standardmodell (SM) der Teilchenphysik beschreibt die Bausteine der Materie als Fermionen und deren Wechselwirkungen mit Eichbosonen. In Tabelle 2.1 sind die wichtigsten Eigenschaften der Fermionen aufgetragen. Diese werden in zwei Gruppen unterteilt, die Quarks und die Leptonen. Der große Unterschied der beiden Gruppen ist, dass die Leptonen nicht an der starken Wechselwirkung (Gluonwechselwirkung) teilnehmen. Zusätzlich werden die Fermionen noch in drei Generationen (oder auch Familien) unterteilt, wobei jede Generation aus zwei Quarks, einem geladenen Lepton und einem zugehörigen Neutrino besteht. Die zweite und dritte Familie sind in erster Näherung nur Kopien der ersten Familie, jedoch mit größerer Masse. Jedes Fermion besitzt ein Antiteilchen mit entgegengesetztem Vorzeichen für die additiven Quantenzahlen (elektrische Ladung, schwache Ladung, Farbladung, Leptonenzahl, Baryonenzahl). Vom SM werden drei der vier bekannten Wechselwirkungen beschrieben. Dabei handelt es sich um die starke Wechselwirkung (übertragen durch Gluonen), die schwache Wechselwirkung (übertragen durch Z- und W± -Bosonen) und die elektromagnetische Wechselwirkung (übertragen durch Photonen). Die Gravitation wird von diesem Modell nicht beschrieben, was in der Hochenergiephysik allerdings kein Problem darstellt, da deren Kopplungsstärke bei den gegebenen Energien gegenüber den anderen Kräften verschwindet. Tabelle 2.1: Fermionen im Standardmodell der Teilchenphysik. Die jeweiligen Antiteilchen werden nicht gezeigt [1]. Familie Fermionen I II III Q[e] T3 Y Farbe 0 1/2 −1 νe νµ ντ e− L µ− L τ− L −1 −1/2 −1 Leptonen νe,R νµ,R ντ ,R 0 0 0 − − − −1 0 −2 eR µR τR u c t 2/3 1/2 1/3 rgb d L s L b L −1/3 −1/2 1/3 rgb Quarks uR cR tR 2/3 0 4/3 rgb dR sR bR −1/3 0 2/3 rgb 3 4 2.2 K APITEL 2. T HEORETISCHE G RUNDLAGEN Das Top-Quark Das Top-Quark wurde aufgrund seiner hohen Masse von 173, 5 ± 0, 6 ± 0, 8 GeV [2] erst 1995 am Fermilab entdeckt [3]. Somit handelt es sich bei dem Top-Quark um das schwerste bisher entdeckte Elementarteilchen im Standardmodell. Es ist das einzige Quark, das nicht hadronisiert, da es nach 5 · 10−25 s zerfällt und die Hadronisierung erst eine Größenordnung später einsetzt. Daher können bei diesem Teilchen reine Quarkeigenschaften gemessen werden. Außerdem macht die hohe Masse das Top-Quark zu einem interessanten Versuchsobjekt, da die Zerfallsprodukte dadurch eine sehr hohe Energie besitzen. 2.2.1 Top-Quark-Paar-Produktion In der Top-Quark-Paar-Produktion mit Hadronen gibt es zwei dominierende Prozesse: q + q̄ = t + t̄ (2.1) g + g = t + t̄ (2.2) √ Bei einer Schwerpunktsenergie von s = 14 TeV ist die Gluonfusion (Gleichung 2.2) für 87% der Top-Paare verantwortlich und die Quark-Quark-Annihilation (Gleichung 2.1) tritt, anders als am Tevatron (85% Quark-Quark-Annihilation [4]), deutlich seltener auf [5]. Bei geringeren Schwerpunktsenergien √ nimmt der Anteil der durch Gluonfusion erzeugten Top-Quark-Paare ab und erreicht bei s = 7 TeV einen Wert von ≈ 80% [6]. In erster Ordnung gibt es bei der Gluonfusion drei Feynman-Graphen über die tt̄-Paare erzeugt werden können (siehe Abbildungen 2.1(a), 2.1(b) und 2.1(c)). Die q q̄-Annihilation ist in niedrigster Ordnung nur über den S-Kanal möglich (siehe Abbildung 2.1(d)). (a) Gluonfusion im s-Kanal (b) Gluonfusion im t-Kanal (c) Gluonfusion im u-Kanal (d) Quark-Quark-Annihilation Abbildung 2.1: Produktionskanäle für tt̄-Ereignisse. 2.2. DAS TOP -Q UARK 2.2.2 5 Top-Quark-Paar-Zerfall Das Top-Quark zerfällt ausschließlich schwach in ein W-Boson und ein Quark mit der Ladung Q = −1/3. In 99, 9% aller Fälle handelt es sich dabei um ein b-Quark. Damit zerfallen Top-Quark-Paare meistens in zwei W-Bosonen und zwei b-Quarks (W + W − bb̄), woraus drei mögliche Endzustände für den Top-Quark-Paar-Zerfall folgen [4]: tt̄ → W + bW − b̄ → q q̄ 0 bq 00 q̄ 000 b̄ tt̄ → W + bW − b̄ → q q̄ 0 blν̄l b̄ + ¯lνl bq q̄ 0 b̄ tt̄ → W + bW − b̄ → ¯lνl bl0 ν̄l0 b̄ (46, 2%) (43, 5%) (10, 3%) (2.3) (2.4) (2.5) Wie anfangs erwähnt, wird in dieser Analyse der semimyonische Kanal betrachtet, der ≈ 1/3 des semileptonischen Kanals1 (Gleichung 2.4) ausmacht. Da das τ -Lepton in ein Myon zerfallen kann, wird auch dieser Zerfallskanal indirekt einbezogen [7]. Damit werden mindestens 15% aller tt̄-Zerfälle betrachtet [4]. Abbildung 2.2 zeigt den Feynman-Graphen eines möglichen semimyonischen Top-QuarkPaar-Zerfalls, aus dem sich die Signatur ablesen lässt. Diese besteht aus mindestens vier Jets, einem Lepton und fehlender transversaler Energie von dem abgestrahlten Neutrino. Der semimyonische Kanal wird genutzt, da er, wie im Folgenden klar werden sollte, einen guten Kompromiss aus Selektierbarkeit, Rekonstruiertbarkeit und Häufigkeit darstellt. Um den Untergrund zu minimieren, werden verschiedene Bedingungen an die Ereignisse gestellt, die über die Signatur hinausgehen. Diese werden in Abschnitt 4.3 erläutert. Abbildung 2.2: Möglicher Feynman-Graph eines tt̄-Prozesses [8]. Im dileptonischen Kanal (Gleichung 2.5) ist die Signatur mit zwei hochenergetischen Myonen und fehlender transversaler Energie eindeutig. Allerdings lassen sich die Impulse der Neutrinos nur schwer rekonstruieren. Zusätzlich ist das Verzweigungsverhältnis deutlich geringer als in den anderen Kanälen [9]. 1 Wahrscheinlichkeit leptonischer W + -Boson-Zerfälle [4]: e ν : (10, 75 ± 0, 13)% µ+ ν : (10, 57 ± 0, 15)% τ + ν : (11, 25 ± 0, 20)% + 6 K APITEL 2. T HEORETISCHE G RUNDLAGEN Der hadronische Kanal (Gleichung 2.3) ist durch seine sechs harten Jets signifikant und kinematisch vollständig bestimmt. Es besteht jedoch das Problem eines schwer zu unterscheidenden QCD-Multijet-Untergrunds. Da es sich um reine Jet-Ereignisse handelt, treten zusätzlich zwei weitere Probleme auf: Erstens ist die Jet-Energie nur ungenau bekannt und zweitens gibt es Probleme bei der Berechnung der Kinematik aufgrund der kombinatorischen Ambiguitäten der Jets [10]. 2.2.3 Untergründe vom Top-Quark-Paar-Zerfall Beim Zerfall von tt̄-Paaren gibt es einige Untergründe, die sich aufgrund großer Ähnlichkeiten in der Signatur schwer differenzieren lassen. Die dominantesten Untergründe sind W-Bosonen mit mehreren Jets (W+Jets) und einzelne Top-Quarks (Single-Top). Bei dem in Abbildung 2.3(d) dargestellten Feynman-Graph für einen Single-Top-Zerfall müssen nur zwei zusätzliche Jets abgestrahlt werden, um eine ähnliche Signatur zu erhalten. Alle Ereignisse, bei denen W-Bosonen entstehen und semimyonisch zerfallen, können als Untergründe auftreten, wenn von dem Vertex zusätzliche Jets ausgehen (siehe Abbildung 2.3(a)). In den Abbildungen 2.3(c) und 2.3(b) sind die Feynman-Graphen von quantenchromodynamischen (QCD) und Z+Jets-Prozessen zu sehen. Das Z-Boson kann in zwei Leptonen zerfallen, sodass isolierte Myonen detektiert werden. Falls nur ein Myon als solches erkannt wird und weitere Jets auftreten, ist auch der Z+Jets-Prozess ein schwer zu separierender Untergrundprozess. QCD-Prozesse treten sehr häufig und in vielen Variationen auf. Es handelt sich zwar um reine Jet-Prozesse, aber ein in einem Jet entstandenes Myon kann als isoliert detektiert werden. Dadurch ist eine Verwechslung möglich. Fehlende transversale Energie tritt bei den beiden Prozessen durch nicht detektierte Teilchen auf. (a) W+Jets (b) Z+Jets (c) QCD (d) Single-Top Abbildung 2.3: Feynman-Graphen für mögliche Untergrundprozesse von tt̄Ereignisse [8]. 2.2. DAS TOP -Q UARK 7 Im Falle von tt̄-Prozessen ist ein zusätzliches Problem, dass die meisten Untergründe einen deutlichen höheren Wirkungsquerschnitt (WQ) haben als der Signalprozess. In Abbildung 2.4 kann man erkennen, dass die Ereignisraten von W- und Z-Bosonen bei einer Schwerpunktsenergie von 7 TeV zwei Größenordnungen über derjenigen von TopQuark-Ereignissen liegen. QCD-Ereignisse spielen durch einen verhältnismäßig hohen Wirkungsquerschnitt in fast jeder Analyse eine Rolle. Abbildung 2.4: Wirkungsquerschnitte von Top-Quark-Ereignissen und deren Untergründen [11], verändert von [10]. 8 K APITEL 2. T HEORETISCHE G RUNDLAGEN Kapitel 3 Das CMS-Experiment am LHC 3.1 Der LHC Der Large Hadron Collider (LHC) ist ein Hadron-Hadron-Kreisbeschleuniger, der am CERN in Genf steht und einen Umfang von 26, 7 km besitzt. Es gibt im Beschleunigerring vier Kollisionspunkte für Protonen oder schwere Ionen. An jedem Kollisionspunkt befindet sich ein großer Detektor. Diese heißen ALICE, ATLAS, CMS und LHCb und werden jeweils von hunderten Physikern für Analysen genutzt. √ Der LHC ist für eine Schwerpunktsenergie von s = 14 TeV bei einer maximalen Luminosität von L = 1034 cm−2 s− 1 konstruiert. Diese Werte werden vermutlich erst im Laufe der nächsten Jahre erreicht. Die für die vorliegende √ Arbeit genutzten Daten wurden im Sommer 2011 bei einer Schwerpunktsenergie von s = 7 TeV aufgezeichnet. In Abbildung 3.1 sind die verschiedenen Vorbeschleuniger und der Hauptbeschleuniger dargestellt, unter deren Verwendung diese hohen Energien erreicht werden. Zuerst werden die Protonen erzeugt, indem die Elektronen von Wasserstoffkernen getrennt werden. Durch einen Linearbeschleuniger (LINAC2) und drei Kreisbeschleuniger (PSB, PS, SPS) wird die kinetische Energie der Protonen auf 450 GeV erhöht, bevor diese in den Hauptbeschleuniger eingespeist werden. Innerhalb von 20 Minuten erreichen die Protonen ihre maximale kinetische Energie [12]. Insgesamt soll es letztendlich 2808 Pakete von Protonenbündeln geben, wobei jedes Paket ≈ 1, 15 · 1011 Protonen enthält. Dadurch würde es alle 25 ns zu einer Kollision kommen. Um die Hadronen auf eine Kreisbahn zu zwingen, werden 1232 Dipolmagneten benötigt. Diese werden in zwei Schritten auf eine Temperatur von 1, 7 K gekühlt, um ein maximales Magnetfeld von 8, √33 T erreichen zu können [13]. Aktuell erreichen die Protonen eine Energie von 4 TeV ( s = 8 TeV), sodass die Magneten ein Magnetfeld von 4, 7 T erzeugen müssen. 9 10 K APITEL 3. DAS CMS-E XPERIMENT AM LHC Abbildung 3.1: Schematischer Aufbau des LHC mit Vorbeschleunigern [12]. 3.2 Der CMS-Detektor Alle Daten, die in dieser Bachelorarbeit genutzt werden, wurden vom Compact Muon Solenoid (CMS) aufgezeichnet. Mit einem Gewicht von 12500 t bei einer Länge von 21, 6 m und einem Durchmesser von 14, 6 m handelt es sich, um einen sehr kompakten Detektor. Der CMS-Detektor wurde als Multi-Physik-Detektor entwickelt, woraus sich der in Abbildung 3.2 gezeigte mehrschichtige Aufbau ergibt [14]. Dabei liegt der Schwerpunkt auf einer möglichst exakten Myonrekonstruktion. Im Folgenden sind die verschiedenen Detektorkomponenten und deren Aufgabe - von dem Strahlrohr im Zentrum ausgehend beschrieben. Wie in Abbildung 3.2 zu sehen ist, befindet sich direkt hinter dem Strahlrohr ein Siliziumpixeldetektor, der von einem Siliziumstreifendetektor umgeben ist. Gemeinsam bilden diese Schichten den zentralen Spurdetektor. Durch die geschickte Positionierung der 66 Millionen Pixel und 9,6 Millionen Siliziumstreifen wird eine räumliche Auflösung im Bereich von 10 µm erreicht. Die dadurch mögliche Vertexbestimmung ermöglicht die Unterscheidung von zeitgleichen Teilchenkollisionen. Zusätzlich kann durch die Spurmessung im Magnetfeld der Impuls von geladenen Teilchen rekonstruiert werden [15]. Durch die hohe Strahlenbelastung müssen die Siliziumkomponenten in Zukunft regelmäßig ausgetauscht werden. Bisher war dies wegen der geringen Gesamtluminosität noch nicht notwendig. Kalorimeter messen die Energie von Teilchen, indem sie diese komplett stoppen, also ihre gesamte Energie absorbieren. Beim CMS-Detektor liegen das elektromagnetische Kalorimeter (ECAL) und das hadronische Kalorimeter (HCAL) noch innerhalb des Magnetspulenrings. Daher wird keine Energie im massiven Solenoidring deponiert, was die Energieauflösung deutlich verbessert. 3.2. D ER CMS-D ETEKTOR 11 Abbildung 3.2: Querschnitt durch den CMS-Detektors [1]. Das ECAL misst hauptsächlich die Energie von Elektronen (Positronen) und Photonen. Diese verlieren durch Bremsstrahlung (e → eγ) beziehungsweise Paarbildung (γ → e+ e− ) Energie und wandeln sich dabei ineinander um. Andere geladene Teilchen wie das Myon können prinzipiell Bremsstrahlung emittieren, jedoch skaliert der Wirkungsquerschnitt für diesen Prozess mit m−4 . Das führt dazu, dass der relative Energieverlust von Myon im ECAL im Vergleich zu e± gering ist. Das Blei-Wolframat, welches die Energie absorbiert, dient auch gleichzeitig als Szintillatormaterial, welches bei einer BeeV triebstemperatur von 18 °C eine Lichtausbeute von 14,5MeV = 0, 045% besitzt [16]. Die Energieauflösung des ECAL kann über !2 2 σ 2 2, 8% 12% E + = p + (0, 3%)2 (3.1) E E(GeV) E(GeV) berechnet werden [17]. Hadronen und Mesonen geben im ECAL meistens nur einen Teil ihrer Energie ab und erreichen daher das umgebende HCAL. Das hadronische Kalorimeter ist ein Sampling-Kalorimeter das Schauermaterial ist also vom Detektionsmaterial getrennt. Daher muss das Absorbermaterial kein Lichtleiter sein. Das Hadronkalorimeter besteht aus 16 Absorberplatten, wobei die Innerste und die Äußerste aus Stahl gefertigt sind. Für die anderen Platten wurde Messing (70% Kupfer, 30% Zinn) verwendet. Zwischen diesen Platten sind 17 Plastikszintillatoren positioniert, die die aufschauernden Teilchen detektieren. Die Auflösung lässt sich in erster Näherung als 2 σ 2 1 E = + 0, 0452 (3.2) E E(GeV) angeben [18]. Im Aufbau folgt die supraleitende Spule, die Magnetfelder von bis zu 3, 8 T erzeugt. 12 K APITEL 3. DAS CMS-E XPERIMENT AM LHC Durch dieses Feld können die Impulse aller geladenen Teilchen rekonstruiert werden. Die hohe Feldstärke ist notwendig, da die Ablenkung der teilweise sehr hochenergetischen Teilchen ansonsten nicht messbar wäre. Außerhalb des Solenoids befinden sich die Myonenkammern, die vom Volumen her größte Detektorkomponente am CMS. Stahlplatten bilden das Rückflußjoch der supraleitenden Spule und erzeugen so ein Magnetfeld von 2T. Mit den Spuren in den Myonenkammern, bei denen es sich um Gasdetektoren handelt, kann der Impuls der Myonen rekonstruiert werden. Wenn man die Daten aus dem Spurdetektor und den Myonenkammern kombiniert, kann der Fehler auf den Transversalimpuls durch p ∆pT = 0, 045 · pT (T eV ) pT (3.3) parametrisiert werden [14]. Bei höchster Luminosität soll am LHC eine Kollisionsrate von 40 MHz erreicht werden. Da nur 400 Ereignisse pro Sekunde gespeichert werden können, muss die Datenrate deutlich verringert werden. Dazu werden zwei Triggerstufen verwendet: Beim ersten Trigger (L1) handelt es sich um einen Hardware-Trigger, der Anforderungen an verschiedene Parameter stellt und so die Datenrate auf maximal 100 kHz reduziert. Die zweite Stufe im Trigger (HLT) ist softwarebasiert. Daher kann die Selektion im nachhinein relativ leicht verändert werden. Diese Triggerstufe nutzt die gesamten Informationen des Detektors, um interessante Ereignisse zu erkennen. Kapitel 4 Simulation und Selektion von Ereignissen 4.1 Daten Die Daten für √ die vorliegende Arbeit wurden im Sommer 2011 bei einer Schwerpunktsenergie von s = 7 TeV aufgenommen. Die Gesamtluminosität der gesammelten Ereignisse wurde zu L = 4, 6 fb−1 ermittelt. Eine Auflistung aller genutzten Datensätze ist im Anhang aufgeführt. 4.2 Simulation Für die Untergrundabschätzung in dieser Arbeit werden simulierte Referenzdatensätze des CMS-Experiments verwendet. Da die Simulation nicht Teil dieser Arbeit ist, werden die einzelnen Schritte nur kurz erläutert. Für die Datensimulation kamen folgende Programme zum Einsatz: • MADGRAPH: Generiert Feynman-Diagramme der wichtigsten Prozesse [19] • POWHEG: Simuliert Single-Top-Ereignisse [20] [21] • TAUOLA: Simuliert den Zerfall von τ -Leptonen [22] • PYTHIA: Simuliert den Fragmentations- und Hadronisierungsprozess [23] • MLM-Algorithmus: Korrigiert den Überlapp von Abstrahlungen verursacht durch die Aneinanderreihung von mehreren Generatoren [24] • GEANT4: Simuliert die Reaktion des Detektors auf die Ereignisse [25] • Z2: Anpassung der Simulation an Daten [26] [27] Eine genauere Beschreibung der Simulationsschritte ist in [28] zu finden. 13 14 K APITEL 4. S IMULATION 4.3 UND S ELEKTION VON E REIGNISSEN Rekonstruktion und Selektion In den vom Detektor aufgenommenen Ereignissen werden mit verschiedenen Algorithmen die Daten rekonstruiert. Um dabei vielen verschiedenen Analysen gerecht zu werden, gibt es für die meisten Größen mehrere Rekonstruktionsalgorithmen. An die Ereignisse werden für diese Analyse bestimmte Anforderungen gestellt [29]: • Trigger: Ein isoliertes Myon mit einem Transversalimpuls von mindestens 24 GeV • Vertex: Ein gut identifizierter Primärvertex • Myon: Genau ein isoliertes Myon mit einem Transversalimpuls von mindestens 26 GeV • Myon-Veto: Kein zweites Myon mit einem Transversalimpuls von mehr als 10 GeV • Elektron-Veto: Kein Elektron mit einer Transversalenergie von mehr als 15 GeV • Jets: Mindestens vier gut identifizierte Jets mit einem Transversalimpuls von mindestens 30 GeV Diese Kriterien entsprechen der in der CMS Top Gruppe verwendeten Referenzselektion und werden auch in anderen aktuellen Analysen benutzt [29]. Im Vergleich zu anderen Arbeiten, wird kein b-Tag1 angewendet, um den Untergrundanteil zu erhöhen. Eine genauere Erklärung der Selektionskriterien ist in [28] zu finden. Nachdem die generierten Datensätze auf die Luminosität der Daten normiert und die Selektion durchgeführt wurde, zeigt sich ein deutlicher Überschuss an generierten Ereignisen (siehe Abbildung 4.1). Dadurch ist eine direkte Korrektur des Wirkungsquerschnitts der einzelnen Untergründe nicht möglich. Hierbei ist zu bemerken, dass Daten und simulierte Ereignisse innerhalb der systematischen Unsicherheit immer noch übereinstimmen. Die systematische Unsicherheit wird von zwei Faktoren dominiert: Erstens sind die Wirkungsquerschnitte der simulierten Prozesse teilweise sehr ungenau vorhersagbar. Die nach dieser Selektion dominierenden Prozesse sind W+Jets und tt̄, die Fehler von ±30% bzw. ±15% auf den Wirkungsquerschnitt aufweisen. Die Unsicherheit des WQ der restlichen Untergründe wird mit 30% für Z+Jets-, 4% für Single-Top- und 50% für QCD-Prozesse angegeben. Eine Erläuterung zum Zustandekommen dieser Fehler wird in [28] gegeben. Zweitens ist die Jetenergieskala auf 5 − 10% genau bekannt. Eine Verschiebung würde zu abweichenden Selektionseffizienzen führen, da es ein Impulskriterium für die vier geforderten Jets gibt. 1 b-Tag: Ein Selektionsschritt, bei dem auf die Wahrscheinlichkeit geschnitten wird, dass ein Jet von einem b-Quark verursacht wurde. 4.3. R EKONSTRUKTION UND S ELEKTION 15 Daten QCD Z + Jets Single Top W + Jets tt 4 10 a.u. 103 102 10 Daten/MC 1 1 0.8 0.6 0.4 Anzahl der Jets 3 4 5 6 7 8 9 10 Anzahl der Jets Abbildung 4.1: Anzahl der Jets von gemessenen und generierten Ereignisse, wobei die simulierten Datensätze auf die Luminosität der gemessenen Daten skaliert wurden. 16 K APITEL 4. S IMULATION UND S ELEKTION VON E REIGNISSEN Kapitel 5 Datengetriebene Untergrundabschätzung 5.1 Methode und Motivation Um präzise Messung im semimyonischen Kanal durchführen zu können, muss die Unsicherheit durch Untergründe minimiert werden. Das größte Problem ist, wie im vorherigen Kapitel erwähnt, die Unsicherheit auf den Wirkungsquerschnitt der verschiedenen Untergründe. Die Form der Templates verschiedener Variablen wird genauer simuliert. Daher können bestimme Variablen, die zwischen Untergründen und Signal diskriminieren, zur Korrektur der Wirkungsquerschnitte genutzt werden. Die beiden in dieser Analye genutzten Variablen werden in Abbschnitt 5.2 vorgestellt. Zwei der Untergründe weisen einen besonders großen Fehler auf den Wirkungsquerschnitt auf: Einerseits der QCD-Untergrund, bei dem eine Unsicherheit von 50% auf einen Wirkungsquerschnitt von σQCD = 85 nb angenommen wird. Allerdings ist der QCD-Anteil am Gesamtdatensatz so gering, dass keine datengetriebene Messung möglich ist. Andererseits wird der Wirkungsquerschnitt von W+Jets für den genutzten simulierten Datensatz mit einem Wert von σW +Jets = 31 nb ± 30%1 angegeben. Zudem beschreibt der simulierte W+Jets-Datensatz 2/3 des gesamten Untergrunds, womit eine getrennte Anpassung möglich ist. Das Ziel dieser Arbeit ist es das Verhältnis der Wirkungsquerschnitte von W+Jets- und Top-Quark-Paar-Prozessen, also den beiden dominierenden Prozessen, datengetrieben zu bestimmen. Mit einer Poisson-erweiterten gebinten Maximum-Likelihood-Anpassung simultan auf alle Variablen soll eine Anpassung von W+Jets und dem Signal an die Daten vorgenommen werden. Die simulierten Templates werden folgendermaßen angepasst: aj [i] = X βk · αjk [i] (5.1) k • βk ist die Skalierung zwischen Vorhersage und Daten für Prozess k • αjk [i] ist der von Generator vorhergesagte Bineintrag von Bin i für Prozess k in Variable j 1 NNLO 17 18 K APITEL 5. DATENGETRIEBENE U NTERGRUNDABSCHÄTZUNG Die Variable βk ist proportional zum Wirkungsquerschnitt der Prozesse k. Eine Erklärung zur Maximum-Likelihood-Methode wird in Abbschnitt 5.3 gegeben. Im ersten Schritt soll die Funktionalität des Anpassungsverfahrens überprüft werden. Dazu werden die generierten Untergrundtemplates addiert und zusammen mit dem Signaltemplate an die Daten angepasst. 5.2 Diskriminierende Variablen Analog zu einer Analyse der CMS-Kollaboration wurden in dieser Analyse die Variablen MET und M3 zur Diskriminierung genutzt [30]. Bei MET handelt es sich um die fehlende transversale Energie, die durch Neutrinos oder nicht gemessene Teilchen entsteht. Daher sollte diese Variable zwischen Prozessen mit und ohne Neutrino diskriminieren. M3 beschreibt die invariante transversale Masse der drei Jets mit der höchsten transversalen Energie und approximiert für Top-Quark-Paar-Ereignisse die Top-Quark-Masse. Diese Größe sollte daher einen Unterschied in der Templateform zwischen Signal- und Untergrundereignissen aufweisen. Eine genauere Beschreibung der Variablen ist in [28] zu finden. 5.3 Maximum-Likelihood-Methode In der Physik gibt es verschiedene Methoden Messdaten zu analysieren. Oft wird dabei eine theoretische Vorhersage an die Daten angepasst, wobei mehrere abhängige Parameter bestimmt werden. Ein solches parameterbasiertes Schätzverfahren ist die MaximumLikelihood-Methode. In der allgemeinsten Form kann diese folgendermaßen dargestellt werden: N Y L= P (xi , ai ) (5.2) i=1 • P (xi , ai ) gibt die Wahrscheinlichkeit an, mit der ein Messwert xi eintritt, wenn ai der wahre Wert ist • N ist die Anzahl der Ereignisse Im Likelihood-Verfahren wird ~a so gewählt, dass L maximal wird. Die Erwartungswerte der Hypothesen werden durch freie Parameter variiert. Die freien Parameter sind im ersten Fall die Korrekturfaktoren für den Wirkungsquerschnitt für Signal und die addierten Untergründe. Da keine analytische Beschreibung der genutzen Größen exisiert, betrachtet man eine gemessene Verteilung und fragt sich Bin-weise wie wahrscheinlich es ist, dass der Bin-Inhalt xi mit dem Erwartungswert der simulierten Hypothese ai korrespondiert. Die Plausibilität ist gegeben als: m Y pi (xi , ai )ki L = N! (5.3) ki ! i=1 • ki entspricht der Anzahl der beobachteten Ereignisse in Bin i 5.4. S OFTWARE • N= m P 19 ki i=1 • m ist die Anzahl der betrachteten Bins • pi (xi , ai ) beschreibt die Wahrscheinlichkeit, dass Ereignisse in Bin i mit dem Mittelwert xi auftauchen • m P pi (xi , ai ) = 1 i=1 Diese Form wird auch als gebinter Maximum-Likelihood bezeichnet. Zusätzlich wird bei Anpassungen an Histogramme meistens eine sogenannte Poisson-Erweiterung ergänzt: m m Y Y νN pi (xi , ai )ki pi (xi , ai )ki ν N L=e · · N! =e ·ν N! ki ! ki ! i=1 i=1 ν (5.4) Diese von Fermi vorgeschlagene Erweiterung lockert die Bedingung, das die Wahrscheinlichkeitsdichte auf 1 normiert ist. Weiterführende Erklärungen finden sich in [31]. Sowohl in ROOT, als auch im RooFit-Paket, wird diese Poisson-erweiterte, gebinte LikeliloodMethode genutzt. 5.4 Software Bei ROOT handelt es sich um ein am CERN entwickeltes Analyseframework, welches hauptsächlich für die Auswertung in Hochenergiephysikanalysen genutzt wird. In der vorliegenden Arbeit werden zwei ROOT-Pakete genutzt, mit denen simulierte Templates an gemessene Daten angepasst werden können. In der normalen ROOT-Version ist ein Paket eingebunden, welches Anpassungen nach der Maximum-Likelihood-Methode ermöglicht. Es ist einfach zu konfigurieren und dabei sehr stabil. Das Paket bezieht die Fehler der anzupassenden Histogramme nicht ein, da es normalerweise zur Anpassung von analytisch beschreibbaren Funktionen dient. Aus diesem Grund müssen diese ausgegeben Fehler mit einer Ensemble-Studie korrigiert werden. Das Analyse-Paket RooFit ist für Templateanpassungen optimiert und sollte auch die Fehler der Templates einbeziehen. Auch in RooFit wird das Poisson-erweiterte, gebinte Likelihood-Verfahren genutzt. 20 5.5 5.5.1 K APITEL 5. DATENGETRIEBENE U NTERGRUNDABSCHÄTZUNG Ergebnisse Anpassung des Signals und der addierten Untergründe an die Daten Implementierung in ROOT Zunächst wurde mit ROOT eine Anpassung an die einzelnen Variablen durchgeführt. In Abbildung 5.1 ist die Anpassung für MET zu sehen, die zu Ergebnissen von σM essung σM essung = 0, 63 ± 0, 04 Untergrund : = 1, 03 ± 0, 03 tt̄ : σSimulation σSimulation geführt hat. Der Top-Quark-Paar-Wirkungsquerschnitt wird also deutlich nach unten skaliert, während die Untergrundkorrektur im Rahmen seiner Fehler eins bleibt. Die großen Unterschiede der Korrekturen könnten darauf hinweisen, dass die Separationskraft von MET nicht sehr groß ist. Das Verhältnis-Diagramm zeigt, dass es für hohe fehlende transversale Energien eine leichte systematische Abweichung gibt, allerdings ist die Statistik in diesem Diagramm sehr gering. Daten QCD Z + Jets Single Top W + Jets tt 12000 10000 Untergrundfaktor: 1.027 ± 0.034 Signalfaktor: 0.634 ± 0.036 a.u. 8000 6000 4000 Daten/MC 2000 0 1 0.8 0.6 0 50 100 150 200 250 MET[GeV] Abbildung 5.1: Anpassung der simulierten Daten an die gemessenen Daten über die Variable MET mit ROOT. MET[GeV] Bei der Variable M3 werden die Templates bis zu einer maximalen invarianten Masse von 500 GeV angepasst, da die Diskriminierung für kleine Werte stärker ist und die Sensitivität durch Einbeziehung des gesamten Bereichs schlechter wird. Dank hoher Bineinträge in doppelt so vielen Bins, beeinflusst M3 den simultanen Angleich deutlich stärker als M3. Das Ergebnis der Anpassung an die M3 ist in Abbildung 5.2 zu sehen. Die Vorfaktoren wurden zu σM essung σM essung tt̄ : = 0, 81 ± 0, 03 Untergrund : = 0, 88 ± 0, 03 σSimulation σSimulation 5.5. E RGEBNISSE 21 bestimmt. Auch in dieser Variablen kann man eine leichte Tendenz im Verhältnis von gemessenen und simulierten Daten erkennen. Auf die Abweichung im Bereich zwischen den beiden Peaks wird später in diesem Kapitel eingegangen. 4500 Daten QCD Z + Jets Single Top W + Jets tt 4000 3500 Untergrundfaktor: 0.875 ± 0.026 Signalfaktor: 0.809 ± 0.028 a.u. 3000 2500 2000 1500 1000 Daten/MC 500 0 1.4 1.2 1 0.8 0 50 100 150 200 250 300 350 400 450 500 M3[GeV] Abbildung 5.2: Anpassung der simulierten Daten an die gemessenen Daten über die Variable M3 mit ROOT. M3[GeV] Die bisherigen Ergebnisse lassen drauf schließen, dass die Separationskraft der einzelnen Variablen nicht ausreichend ist. Daher wird eine simultane Anpassung mittels eines zweidimensionalen Histogramms umgesetzt. In Abbildung 5.3 sind die einzelnen Variablen nach der Anpassung aufgetragen. Die Verhältnisse haben sich zu tt̄ : σM essung = 0, 75 ± 0, 02 σSimulation Untergrund : σM essung = 0, 93 ± 0, 02 σSimulation ergeben. Die statistischen Unsicherheiten sind dabei im Vergleich zu den Einzelanpassungen kleiner geworden. 22 K APITEL 5. DATENGETRIEBENE U NTERGRUNDABSCHÄTZUNG 10000 Daten QCD Z + Jets Single Top W + Jets tt 4000 3500 Untergrundfaktor: 0.928 ± 0.021 Signalfaktor: 0.747 ± 0.022 Untergrundfaktor: 0.928 ± 0.021 Signalfaktor: 0.747 ± 0.022 3000 a.u. 8000 a.u. 4500 Daten QCD Z + Jets Single Top W + Jets tt 12000 6000 2500 2000 1500 4000 1000 500 0 Daten/MC Daten/MC 2000 1 0.8 0.6 0 50 100 150 200 250 MET[GeV] 0 1.4 1.2 1 0.8 0 50 100 150 200 250 300 350 400 450 500 M3[GeV] (a) MET (b) M3 MET[GeV] an die Daten über die Variablen M3[GeV] Abbildung 5.3: Simultane Anpassung M3 und MET mit ROOT. Fazit zu ROOT Die von ROOT durchgeführte Anpassung kann die Form von Signal und Untergrund eindeutig diskriminieren. Problematisch ist jedoch, dass die Fehler der angepassten Histogramme nicht in die Werte bzw. deren statistische Unsicherheit einbezogen werden. Eine Möglichkeit dieses Problem zu lösen wird später vorgestellt. Implementierung mit RooFit Auch in diesem Paket werden zuerst Einzelanpassungen realisiert. In Abbildung 5.4 ist die Anpassung von MET zu sehen. Die Parameter werden zu tt̄ : σM essung = 0, 63 ± 0, 04 σSimulation Untergrund : σM essung = 1, 03 ± 0, 04 σSimulation bestimmt. Auch bei der M3-Variable war eine Diskriminierung möglich, welche zu Korrekturfaktoren von tt̄ : σM essung = 0, 81 ± 0, 03 σSimulation Untergrund : σM essung = 8, 80 ± 0, 03 σSimulation geführt hat. Zur Implementierung der simultanen Anpassung in RooFit wurde RooSimultaneous genutzt. Dabei handelt es sich um eine Methode, mit der beliebig viele Variablen simultan angepasst werden können. Das Ergebnis dieser Anpassung ist in Abbildung 5.6 dargestellt. Wie bei ROOT liegen die Parameter mit Korrekturen von tt̄ : σM essung = 0, 75 ± 0, 02 σSimulation U ntergrund : zwischen den Resultaten der beiden Einzelanpassungen. σM essung = 0, 93 ± 0, 02 σSimulation 5.5. E RGEBNISSE 23 Daten QCD Z + Jets Single Top W + Jets tt 12000 10000 Untergrundfaktor: 1.027 ± 0.036 Signalfaktor: 0.634 ± 0.039 a.u. 8000 6000 4000 Daten/MC 2000 0 1 0.8 0.6 0 50 100 150 200 250 MET[GeV] Abbildung 5.4: Anpassung der simulierten Daten an die gemessenen Daten über die Variable MET mit RooFit. MET[GeV] 4500 Daten QCD Z + Jets Single Top W + Jets tt 4000 3500 Untergrundfaktor: 0.875 ± 0.027 Signalfaktor: 0.810 ± 0.029 a.u. 3000 2500 2000 1500 1000 Daten/MC 500 0 1.4 1.2 1 0.8 0 50 100 150 200 250 300 350 400 450 500 M3[GeV] Abbildung 5.5: Anpassung der simulierten Daten an die gemessenen Daten über die Variable M3 mit RooFit. M3[GeV] 24 K APITEL 5. DATENGETRIEBENE U NTERGRUNDABSCHÄTZUNG 10000 Daten QCD Z + Jets Single Top W + Jets tt 4000 3500 Untergrundfaktor: 0.928 ± 0.022 Signalfaktor: 0.747 ± 0.023 6000 Untergrundfaktor: 0.928 ± 0.022 Signalfaktor: 0.747 ± 0.023 3000 a.u. 8000 a.u. 4500 Daten QCD Z + Jets Single Top W + Jets tt 12000 2500 2000 1500 4000 1000 500 0 Daten/MC Daten/MC 2000 1 0.8 0.6 0 50 100 150 200 250 MET[GeV] 0 1.4 1.2 1 0.8 0 50 (a) MET 100 150 200 250 300 350 400 450 500 M3[GeV] (b) M3 MET[GeV] an die Daten über die Variablen M3[GeV] Abbildung 5.6: Simultane Anpassung M3 und MET mit RooFit. Fazit zu RooFit Das Paket RooFit kann die Templates diskriminieren und anpassen. Die Berechnung der Fehler auf die Parameter konnte jedoch nicht nachvollzogen werden. Zur Überprüfung der Fehlerberechnung wurden die Fehler der gemessenen und/oder simulierten Datensätze geändert. Dies hatte keine Auswirkungen auf die ausgegeben Parameter und deren Fehler. Da die eingebenen Template-Unsicherheiten keine Auswirkung auf die Anpassung haben, scheint die Fehlerberechnung in RooFit - entgegen der Erwartung - unabhängig von diesen Eingangsgrößen zu sein. 5.5.2 Vergleich von ROOT und RooFit Beide Pakete können trotz geringer Diskriminierungsmöglichkeiten eine Templateanpassungen durchführen. Die Resultate von RooFit entsprechen dabei denen von ROOT. Dies ist bei den Einzelanpassungen zu erwarten, da dieselbe Methode genutzt wird. Bei der simultanen Anpassung war die Übereinstimmung nicht selbstverständlich, da die Gewichtung der verschiedenen Variablen in RooFit nicht bekannt war. Die ausgegeben Fehler von RooFit sind etwas größer als die Parameterunsicherheiten von ROOT. ROOT bezieht die Fehler (Poisson-Fehler) auf die gemessenen Daten mit ein. Da, wie im vorherigen Abschnitt beschrieben, die Fehlerrechnung von RooFit nicht nachvollzogen werden konnte, können die ausgegebenen Anpassungsfehler nicht verwendet werden. Für die folgenden Anpassungen wird daher ROOT benutzt und die Auswirkung der Templatefehler werden durch eine Esemble-Studie einbezogen. 5.5. E RGEBNISSE 5.5.3 25 Doppelpeak in simulierten Datensätzen bei M3 In allen Anpassungen fällt bei der Variable M3 ein auffälliger Doppelpeak zwischen 80 GeV und 200 GeV auf, der nur in den generierten Templates, nicht aber in den gemessenen Daten deutlich ist. Die Herkunft dieser Auffälligkeit ist der Arbeit [28] erläuert. Der Grund dafür, dass der Doppelpeak nur in der Simulation auftritt, könnte sein, dass verschiedene Verschmierungseffekte in der Simulation nicht korrekt berücksichtigt werden. Durch die Wahl breiterer Bins kann dieses Problem verkleinert werden. In Abbildung 5.7 ist die simultane Anpassung bei breiteren Bins zu sehen. Im entsprechenden Bereich des Histogramms ist weiterhin eine Abweichung von vier Standardabweichungen vorhanden. Daher wird, um weiterhin eine hohe Separationskraft zu behalten, die anfängliche Binweite beibehalten. Durch die geringere Auflösung der Variable M3 tritt eine Systematik im Verhältnis-Diagramm deutlich zutage. Eine mögliche Erklärung für den linaren Effekt wäre ein Problem mit der Jet-Energie-Skalierung (JES). Auf JES wird ein Fehler von 5% angegebenen. In Abbildung 5.8 ist eine Anpassung zu erkennen, bei der die invariante Masse der Daten um 5% erhöht wurde. Die Systematik konnte durch diese Verschiebung aufgehoben werden. Natürlich müssten an dieser Stelle noch andere Effekte betrachtet werden, was im Rahmen dieser Arbeit aber nicht möglich war. 10000 Daten QCD Z + Jets Single Top W + Jets tt 8000 Untergrundfaktor: 0.912 ± 0.021 Signalfaktor: 0.765 ± 0.023 Untergrundfaktor: 0.912 ± 0.021 Signalfaktor: 0.765 ± 0.023 a.u. 8000 a.u. 10000 Daten QCD Z + Jets Single Top W + Jets tt 12000 6000 6000 4000 4000 2000 0 Daten/MC Daten/MC 2000 1 0.8 0.6 0 50 100 150 (a) MET 200 250 MET[GeV] 1.2 1 0.8 0 50 100 150 200 250 300 350 400 450 500 M3[GeV] (b) M3 MET[GeV] an die Daten über die Variablen M3[GeV] Abbildung 5.7: Simultane Anpassung M3 und MET mit ROOT mit einer Binweite von 50 GeV für M3. 26 K APITEL 5. DATENGETRIEBENE U NTERGRUNDABSCHÄTZUNG 10000 Daten QCD Z + Jets Single Top W + Jets tt 8000 Untergrundfaktor: 0.957 ± 0.021 Signalfaktor: 0.711 ± 0.023 Untergrundfaktor: 0.957 ± 0.021 Signalfaktor: 0.711 ± 0.023 a.u. 8000 a.u. 10000 Daten QCD Z + Jets Single Top W + Jets tt 12000 6000 6000 4000 4000 2000 0 Daten/MC Daten/MC 2000 1 0.8 0.6 0 50 100 150 (a) MET 200 250 MET[GeV] 1.1 1 0.9 0.8 0.7 0 50 100 150 200 250 300 350 400 450 500 M3[GeV] (b) M3 MET[GeV] an die Daten über die Variablen M3[GeV] Abbildung 5.8: Simultane Anpassung M3 und MET mit ROOT mit einer Binweite von 50 GeV für M3 und einer Erhöhung der transversalen invarianten Masse für gemessene Daten um 5%. 5.5.4 Messung des Verhältnisses der Wirkungsquerschnitte von W+Jets und Signal Bei der Messung des Verhältnisses werden die W+Jets- und Signal-Templates an die Daten angepasst, während die anderen Untergründe (Single-Top, QCD und Z+Jets) nicht variiert werden, also deren theoretisch errechneten Wirkungsquerschnitten vertraut wird. Eine alternative Anpassung, bei der die anderen Untergründe als zusätzliches Template mit angepasst werden, hat zu keiner Verbesserung der Ergebnisse geführt. Zusätzlich werden die Untergründe Single-Top, QCD und Z+Jets hochskaliert, was aufgrund des Überschusses an simulierten Ereignissen unwahrscheinlich ist. Die entsprechende Abbildung ist im Anhang zu finden. Das Anpassungsergebnis ist in Abbildung 5.9 zu sehen. Durch das Fixieren der übrigen Untergründe sind beide Faktoren kleiner geworden als in den vorherigen Anpassungen. Das Wirkungsquerschnittsverhältnis ergibt sich mit den Faktoren von σM essung σM essung = 0, 88 ± 0, 03 W + Jets : = 0, 74 ± 0, 02 tt̄ : σSimulation σSimulation zu σW +Jets = 235 ± 10. σtt̄ Der für die Generatoren angenomme Wirkungsquerschnitt für tt̄-Ereignisse ist 157, 5 pb2 . Um den systematischen Einfluss des Anpassungsbereichs einbeziehen zu können, wird für eine Anpassung der Bereich von M3 von 500 GeV auf 800 GeV erhöht (siehe Abbildung 5.10). Dabei ergeben sich Korrekturwerte von σM essung tt̄ : = 0, 82 ± 0, 03 σSimulation M 3:500 M eV →800 M eV 2 NLO 5.5. E RGEBNISSE 27 W + Jets : σM essung σSimulation = 0, 78 ± 0, 02, M 3:500 M eV →800 M eV woraus ein Wirkungsquerschnittsverhältnis von σW +Jets = 209 ± 9 σtt̄ M 3:500 M eV →800 M eV folgt. Die Differenz der Erwartungswerte wird als maximale systematische Unsicherheit durch den Anpassungsbereich angenommen. 10000 W+Jets-Faktor: Signalfaktor: Daten QCD Z + Jets Single Top W + Jets tt 4000 3500 0.882 ± 0.031 0.747 ± 0.020 6000 W+Jets-Faktor: Signalfaktor: 3000 a.u. 8000 a.u. 4500 Daten QCD Z + Jets Single Top W + Jets tt 12000 0.882 ± 0.031 0.747 ± 0.020 2500 2000 1500 4000 1000 500 0 Daten/MC Daten/MC 2000 1 0.8 0.6 0 50 100 150 200 250 MET[GeV] 0 1.40 1.2 1 0.8 0 50 100 150 200 250 300 350 400 450 500 50 100 150 200 250 300 350 400 450 500 M3[GeV] M3[GeV] (a) MET (b) M3 MET[GeV] Abbildung 5.9: Simultane Anpassung von W+Jets und Signal an die Daten. 10000 W+Jets-Faktor: Signalfaktor: Daten QCD Z + Jets Single Top W + Jets tt 4000 3500 0.821 ± 0.030 0.783 ± 0.020 6000 W+Jets-Faktor: Signalfaktor: 3000 a.u. 8000 a.u. 4500 Daten QCD Z + Jets Single Top W + Jets tt 12000 0.821 ± 0.030 0.783 ± 0.020 2500 2000 1500 4000 1000 500 0 Daten/MC Daten/MC 2000 1 0.8 0.6 0 50 100 150 200 250 MET[GeV] (a) MET 0 1.40 1.2 1 0.8 0 100 200 300 400 500 600 700 800 100 200 300 400 500 600 700 800 M3[GeV] M3[GeV] (b) M3 MET[GeV] Abbildung 5.10: Simultane Anpassung von W+Jets und Signal an die Daten bis zu einer invarianten Masse von 800 GeV. 28 5.6 5.6.1 K APITEL 5. DATENGETRIEBENE U NTERGRUNDABSCHÄTZUNG Ensemble-Studie zur Fehlerabschätzung Ensemble-Studie mit Pseudoexperimenten Um den Fehler der Templates einzubeziehen wird eine Esemble-Studie durchgeführt. Dafür werden die simulierten Templates, die weiter auf die Daten normiert sind, an Pseudodaten angepasst. Anpassung von Top-Paar und W+Jets W+Jets Ax V1 + Top-Paar . . . . . . V2 1x + . . . VN A V V Z+Jets, QCD Single-Top 1x Vwahr Abbildung 5.11: Schema für die Produktion des Neyman-Graphen. Die Erzeugung der Pseudodaten aus generierten Templates ist in Abbildung 5.11 in den ersten drei Schritten dargestellt. In Schritt eins wird das W+Jets-Template mit dem Faktor A multipliziert, wobei A auf Werte zwischen 0,8 und 1,4 gesetzt wird. Die Skalierung der Templates von Single-Top, QCD, Z+Jets und tt̄ wird nicht geändert. Alle Templates werden addiert, bevor die eigentliche Erzeugung der Pseudodaten beginnt. Wie im Schema dargestellt ist, werden mit dem erhaltenen Template im nächsten Schritt Pseudoexperimente generiert. Dazu werden die einzelnen Bineinträge im Rahmen ihrer Poissonfehler neu gewürfelt. Im Folgenden werden die originalen Templates an diese Pseudodaten angepasst. Aus der Anpassung, die wie in 5.5.4 beschrieben erfolgt, ergibt sich das Verhältnis Korrekturf aktor von W + Jets V = , (5.5) Korrekturf aktor von tt̄ welches in ein Histgramm eingetragen wird. Die Abfolge aus Würfeln der Bineinträge und der Templateanpassung wird 4000 mal wiederholt. Im gefüllten Histogramm ergibt sich eine Normalverteilung um den Faktor A (siehe Abbildung 5.12(a), Kurve "Poisson"). In der Breite dieser Gaußkurve spiegelt sich der statistische Fehler der Templates wieder. Die Parameter der Gaußkurve beschreiben nun Ort und Unsicherheit eines Punktes im Neyman-Graphen. Durch verschiedene Vorfaktoren A ergibt sich ein Neyman-Graph, wie er in Abbildung 5.12(b) exemplarisch dargestellt ist. Die Projektion vom gemessenen Verhältnis und dessen Unsicherheit wird von der y- auf die x-Achse durchgeführt. Da die Statistik der simulierten Templates nicht perfekt ist, haben die einzelnen Binein- 1000 Eintraege: 800 χ2: 700 Mittelwert: Sigma: 4000 Eintraege: 0.86 χ: 0.9999 ± 0.0005 0.03008 ± 0.00034 4000 1.00 Mittelwert: Sigma: 1.0002 ± 0.0006 0.03903 ± 0.00045 N 600 F EHLERABSCHÄTZUNG Faltung aus Gauss und Poisson: Poisson: 900 ZUR 500 Gemessener Wert 5.6. E NSEMBLE -S TUDIE 29 1.6 1.4 1.2 1 400 0.8 300 200 0.6 100 0.4 0 0.9 0.95 1 (a) 1.05 1.1 1.15 V 0.4 0.6 0.8 1 1.2 1.4 1.6 Wahrer Wert (b) Abbildung 5.12: (a) zeigt den Unterschied zwischen statistischen und statistischen + systematischen Schwankungen und in (b) wird ein Beispiel für die Projektion des Wertes und der Fehler gegeben. träge einen Fehler, der bisher ignoriert wurde3 . Diese systematische Unsicherheit kann einbezogen werden, indem die Bineinträge erst im Rahmen ihrer fortgepflanzten Fehler und dann im Rahmen ihrer Poissonfehler gewürfelt werden. Die sich nach der Anpassung im Histogramm ergebende Gaußkurve ist in Abbildung 5.12(a) in rot dargestellt. Die zusätzliche Gauß-Schwankung verbreitert die Kurve bei einem Mittelwert von eins von σ = 0, 03 auf σ = 0, 04. Die Generatorstatistik ist demnach nicht ausreichend, um diese Systematik vernachlässigen zu können. Der Zusammenhang zwischen dem hier genutzten V und dem Wirkungsquerschnittsverhältnis ergibt sich durch: σW +Jets σW +Jets =V · σtt̄ σtt̄ gemessen T heorie 5.6.2 Ergebnis für das Verhältnis des Wirkungsquerschnitts Aus der Anpassung von W+Jets und Signal an die Daten wurde ein Wirkungsquerschnittsverhältnis von 235 ± 10(stat.) ± 26(sys.) ermittelt. Über den Neyman-Graphen in Abbildung 5.13 ergibt sich ein Projektionswert von σW +Jets 39 = 235 ±17 16 (stat.) ±36 (stat. + sys.). σtt̄ Anpassung Der Wirkungsquerschnitt von W+Jets wurde 2011 am CMS-Detektor zu σW +Jets = 30, 93 ± 0, 09(stat.) ± 0, 27(sys.) ± 0, 30(threshold) ± 1, 23(lumi.) nb bestimmt [32]. Eine Messung des Produktionsquerschnitts von tt̄-Ereignissen hat den Wert von σtt̄ = 154 ± 17(stat. + sys.) ± 6(lumi.) pb 3 Der Fehler folgt aus der Generatorstatistik. Bei den unnormierten simulierten Templates wird ein Poissonfehler in jedem Bin errechnet. Höhere Statistik führt also zu einem kleineren relativen Fehler. 30 K APITEL 5. DATENGETRIEBENE U NTERGRUNDABSCHÄTZUNG ergeben [33]. Daraus ergibt sich ein gemessenes Verhältnis von σW +Jets = 201 ± 21. σtt̄ M essung Die in dieser Analyse untersuchte Methode konnte das Verhältnis bestätigen. Die Fehler auf die durchgeführte Messung sind groß, liegen aber in einer ähnlichen Größenordnung, wie die Messung am CMS-Detektor. Aufgrund dieser Ergebnisse kann davon ausgegangen werden, dass die simultane Anpassung für datengetriebene Untergrundabschätzungen genutzt werden kann. 300 280 Wirkungsquerschnittsverhaeltnis: 235 +17 -16 (stat.) +39 -36 (stat.+sys.) σW+Jets σtt gemessen 260 240 220 200 180 160 140 120 140 160 180 200 220 240 260 σW+Jets σtt 280 wahr Abbildung 5.13: Projektion des Wirkungsquerschnittsverhältnisses auf die xAchse. Kapitel 6 Zusammenfassung und Ausblick Im Rahmen der vorliegenden Analyse wurde eine Methode zur datengetriebenen Untergrundabschätzung für Top-Paar-Ereignisse untersucht. Dabei wurde der semimyonische √ Zerfallskanal bei einer Schwerpunktsenergie von s = 7 TeV genutzt. Die eingebrachten Daten ensprechen einer Gesamtluminosität von L = 4, 6 fb−1 . Die Signatur des gewählten Kanals besteht aus einem isolierten hochenergetischen Myon, vier Jets und einem fehlenden transversalen Impuls, der durch das Neutrino verursacht wird. Die vier untersuchten Untergründe sind Z+Jets, W+Jets, QCD und Single-Top. Nach den verschiedenen Selektionsschritten war ein deutlicher Simulationsüberschuss zu erkennen, der im Rahmen der systematischen Unsicherheit des Wirkungsquerschnitts der Prozesse allerdings zu erklären ist. Nähere Untersuchungen zum systematischen Überschuss werden im Rahmen dieser Analyse nicht angestellt. Zur Untergrundabschätzung wurden die Variablen M3 und MET benutzt. M3 beschreibt dabei die transversale invariante Masse der drei Jets mit dem höchsten transversalen Gesamtimpuls und MET ist die fehlende transversale Energie. Diese Variablen sollten eine Diskriminierung ermöglichen. Sowohl das normale ROOT als auch das RooFit-Paket waren in der Lage, eine MaximumLikelihood-Anpassung durchzuführen. Da in der Anpassung von RooFit eingebene Fehler nicht beachtet werden, wurde diese Methode nur als Überprüfung für die Anpassung von ROOT genutzt. Dabei hat sich eine gute Übereinstimmung für die beiden Anpassungen ergeben. Daher wurde davon ausgegangen, dass die Anpassungen von ROOT korrekt sind. Die Fehler der angepassten Templates wird allerdings nicht einbezogen. Final wurden nur W+Jets und das Signal an die Daten angepasst, um das Verhältnis der beiden Größen nach der Anpassung zu überprüfen. Aus der Messung hat sich dabei ein Wert von σW +Jets = 235 ±39 36 (stat. + sys.) σtt̄ Anpassung ergeben, welcher mit der aktuellsten Messung am CMS-Detektor von σW +Jets = 201 ± 21 σtt̄ M essung in einer Standardabweichung übereinstimmt. Auch die theoretische Vorhersage von σW +Jets = 199 ± 67 σtt̄ T heorie 31 32 K APITEL 6. Z USAMMENFASSUNG UND AUSBLICK ist mit dem Ergebnis kompatibel. Die Fehler der Templates werden in den Anpassungsfehler durch eine Esemble-Studie einbezogen. Aufgrund dieser Ergebnisse kann davon ausgegangen werden, dass mit der Methode der simultanen Anpassung eine datengetriebene Untergrundabschätzung im semimyonischen Kanal möglich ist. Wenn kein Überschuss an simulierten Ereignissen vorhanden ist, sollte eine getrennte Korrektur der Wirkungsquerschnitte aller Untergründe realisierbar sein. Dazu sollte eventuell eine dritte diskrimnierende Variable eingeführt werden, um eine Anpassung nach der gesamten Selektion mit b-Tag durchführen zu können. Alternativ könnte man Ereignisse mit drei Jets in die Abschätzung einbeziehen, um die Statistik und den Untergrundanteil zu erhöhen. Die Diskriminierung der Variable M3 müsste allerdings erneut überprüft werden. Kapitel 7 Anhang 10000 Daten QCD Z + Jets Single Top W + Jets tt 4000 3500 Untergrundfaktor: 1.136 ± 0.094 W+Jets-Faktor: 0.819 ± 0.052 Signalfaktor: 0.732 ± 0.024 Untergrundfaktor: 1.136 ± 0.094 W+Jets-Faktor: 0.819 ± 0.052 Signalfaktor: 0.732 ± 0.024 3000 a.u. 8000 a.u. 4500 Daten QCD Z + Jets Single Top W + Jets tt 12000 6000 2500 2000 1500 4000 1000 500 0 Daten/MC Daten/MC 2000 1 0.8 0.6 0 50 100 150 200 250 MET[GeV] (a) MET 0 1.40 1.2 1 0.8 0 50 100 150 200 250 300 350 400 450 500 50 100 150 200 250 300 350 400 450 500 M3[GeV] M3[GeV] (b) M3 MET[GeV] Abbildung 1: Simultane Anpassung von W+Jets, Signal und die Untergründe Z+Jets, QCD und Single-Top an die Daten. 33 K APITEL 7. A NHANG 34 Tabelle 1: Datasets used for the analysis Filename Simulated Samples: /TTJets_TuneZ2_7TeV-madgraph-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM /DYJetsToLL_TuneZ2_M-50_7TeV-madgraph-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM /QCD_Pt-20_MuEnrichedPt-15_TuneZ2_7TeV-pythia6/Summer11-PU_S4_START42_V11-v1/AODSIM /WJetsTolNu_TuneZ2_7TeV-madgraph-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM /T_TuneZ2_s-channel_7_TeV-powheg-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM /T_TuneZ2_t-channel_7_TeV-powheg-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM T_TuneZ2_tW-channel-DR_7TeV-powheg-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM /Tbar_TuneZ2_s-channel_7_TeV-powheg-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM /Tbar_TuneZ2_t-channel_7_TeV-powheg-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM /Tbar_TuneZ2_tW-channel_7_TeV-powheg-tauola/Summer11-PU_S4_START42_V11-v1/AODSIM Data Smaples: /SingleMu/Run2011A-PromptReco-v6/AOD /SingleMu/Run2011A-May10ReReco-v1/AOD /SingleMu/Run2011A-05Aug2011-v1/AOD /SingleMu/Run2011A-PromptReco-v4/AOD /SingleMu/Run2011B-PromptReco-v1/AOD Tabelle 2: json and pileup-reweighting files Filename json-Files: Cert_160404-163869_7TeV_May10ReReco_Collisions11_JSON_v3.txt Cert_160404-180252_7TeV_PromptReco_Collisions11_JSON.txt Cert_170249-172619_7TeV_ReReco5Aug_Collisions11_JSON_v3.txt Pileup-Reweighting Files 3D: Cert_160404-163869_7TeV_MayReReco_Collisions11_JSON_v3.pileupTruth_v2_finebin.root Cert_165088-167913_7TeV_PromptReco_JSON.pileupTruth_v2_finebin.root Cert_170249-172619_7TeV_ReReco5Aug_Collisions11_JSON_v2.pileupTruth_v2_finebin.root Cert_172620-173692_PromptReco_JSON.pileupTruth_v2_finebin.root Cert_175832-177515_PromptReco_JSON.pileupTruth_v2_finebin.root Cert_177718-178078_7TeV_PromptReco_Collisions11_JSON.pileupTruth_v2_finebin.root Cert_178098-180252_7TeV_PromptReco_Collisions11_JSON.pileupTruth_v2_finebin.root Pileup-Reweighting Files 1BX: Cert_160404-163869_7TeV_MayReReco_Collisions11_JSON_v3.pileup_v2.root Cert_175832-177515_PromptReco_JSON.pileup_v2.root Cert_165088-167913_7TeV_PromptReco_JSON.pileup_v2.root Cert_177718-178078_7TeV_PromptReco_JSON.pileup_v2.root Cert_170249-172619_7TeV_ReReco5Aug_Collisions11_JSON.pileup_v2.root Cert_178098-180252_7TeV_PromptReco_Collisions11_JSON.pileup_v2.root Cert_172620-173692_PromptReco_JSON.pileup_v2.root 35 36 K APITEL 7. A NHANG Danksagung An dieser Stelle würde ich mich gerne bei einigen Personen bedanken, die mich beim durchführen dieser Analyse unterstützt haben. Mein erster Dank geht an Prof. Dr. Achim Stahl der mit ermöglicht hat diese interessante Bachelorarbeit zu schreiben. Außerdem geht mein Dank an Dr. Heiko Geenen, Yvonne Küssel, Heiner Tholen, Felix Höhle und Dr. Oliver Pooth, die bereit waren ungezählte Fragen zu beantworten. Zusätzlich möchte ich Tobias Marquardt und meinem Vater für das wiederholte Korrekturlesen bedanken. Besonders möchte ich meinem Mitbachelorant Till Arndt für die großartige Zusammenarbeit danken. Zuletzt möchte ich mich für die Unterstützung meiner Familie bedanken. Literaturverzeichnis [1] M ARTINA DAVIDS. Untersuchung hadronischer tt̄-Zerfälle mit dem CMSDetektor am LHC. III. Physikalisches Institut B, RWTH Aachen, (2006). [2] J. B ERINGER ET AL . (PARTICLE DATA G ROUP ). t-QUARK MASS, 2012. http://pdg.lbl.gov/2012/listings/rpp2012-list-t-quark.pdf. [3] CFD C OLLABORATION. Observation of Top Quark Production in pp̄ Collisions with the CDF Detector at Fermilab. (1995). FERMILAB-PUB-95/022-E. [4] N. NAKAMURA 2010. ET AL .(PARTICLE DATA G ROUP ). Review of particle physics. [5] L ARS S ONNENSCHEIN. The tt̄ production in pp collisions at sqrt(s) = 14 T eV . III.Physikalisches Institut der Technischen Hochschule Aachen, (2001). [6] T.M. L ISS AND A. Q UADT. The Top http://pdg.lbl.gov/2012/reviews/rpp2012-rev-top-quark.pdf. Quark, 2011. [7] Y VONNE K UESSEL. Massenbestimmung von Top-Quarks mit semileptonischen Top-Paar-Zerfällen am CMS-Detektor. III. Physikalisches Institut B, RWTH Aachen, (2009). [8] A NN H EINSON. Useful Diagrams of Top Signals and Backgrounds, 2011. http://wwwd0.fnal.gov/Run2Physics/top/top_public_web_pages/top_feynman_diagrams.html. [9] F ELIX H ÖHLE. Untersuchung von Spinkorrelationen im semileptonischen TopPaar-Zerfall mit dem CMS-Experiment. III. Physikalisches Institut B, RWTH Aachen, (2010). [10] B. K ARGOLL. Untersuchung von Top-Quark-Paaren mit dileptonischer Zerfallssignatur am CMS-Experiment. III. Physikalisches Institut B, RWTH Aachen, (2010). [11] S. C ATANI. Aspects of QCD, from the Tevatron to the LHC, 2000. arXiv:hepph/0005233v1. [12] The accelerator complex. http://public.web.cern.ch/public/en/research/AccelComplexen.html. [13] LHC Design Report. http://lhc.web.cern.ch/lhc/LHC-DesignReport.html. 37 38 L ITERATURVERZEICHNIS [14] T HE CMS C OLLABORATION. Physics Technical Design Report: Physical Performance. CMS, 2006. [15] T HE CMS C OLLABORATION. CMS Tracking Performance Results from early LHC Operation. Technical report, 2010. arXiv:1007.1988v2 [physics.ins-det]. [16] T HE CMS C OLLABORATION. Physics Technical Design Report: Detector Performance and Software. CMS, 2006. [17] CMS COLLABORATION. Electromagnetic calorimeter calibration with 7 TeV data. Technical report, 2010. CMS-PAS-EGM-10-003. [18] T HE CMS C OLLABORATION. The Hadron Calorimeter Project. Technical report, 1997. [19] J. A LWALL AND OTHERS. MadGraph/MadEvent v4: the new web generation. JHEP0709:028, (2007). arXiv:0706.2334, doi:10.1088/1126-6708/2007/09/028. [20] S. A LIOLI , P. NASON , C. O LEARI , AND E. R E. NLO single-top production matched with shower in POWHEG: s- and t-channel contributions. JHEP 0909:111, (2009). arXiv:0907.4076v2, doi:10.1088/1126-6708/2009/09/111, http://powhegbox.mib.infn.it/. [21] E. R E. Single-top Wt-channel production matched with parton showers using the POWHEG method. Eur.Phys.J.C71:1547, (2011). arXiv:1009.2450v1, doi:10.1140/epjc/s10052-011-1547-z, http://powhegbox.mib.infn.it/. [22] Z. WAS. Precision simulations with Nucl.Phys.Proc.Suppl.169:16-21, (2007). 10.1016/j.nuclphysbps.2007.02.113. TAUOLA and PHOTOS. arXiv:hep-ph/0610386v2doi: [23] T. S JOESTRAND , S. M RENNA , AND P. S KANDS. PYTHIA 6.4 physics and manual. JHEP 0605:026, (2006). arXiv:hep-ph/0603175v2, doi:10.1088/11266708/2006/05/026. [24] M. L. M ANGANO , M. M ORETTI , F. P ICCININI , AND M. T RECCAN. Matching matrix elements and shower evolution for top-pair production in hadronic collisions. JHEP 0701:013, (2007). arXiv:hep-ph/0611129v1, doi:10.1088/11266708/2007/01/013. [25] J. A LLISON AND OTHERSL. Geant4 developments and applications. IEEE Trans. Nucl. Sci. 53 (2006) 270, (2006). doi:10.1109/TNS.2006.869826. [26] Tune Z2 is identical to the tune Z1 described in [27] except for the PDF. Z2 uses CTEQ6L [36] while Z1 uses CTEQ5L. [27] R. F IELD. Early LHC Underlying Event Data - Findings and Surprises. Invited talk at HCP2010, Toronto, (2010). arXiv:1010.3558v1. [28] T. A RNDT. Data-driven Background Estimation for Top-pair Searches with the CMS detektor. III. Physikalisches Institut B, RWTH Aachen, (2012). L ITERATURVERZEICHNIS 39 [29] CMS C OLLABORATION. Constraints on the Top-Quark Charge from Top-Pair Events. CMS Physics Analysis Summary, (2012). CMS-PAS-TOP-11-031. [30] CMS C OLLABORATION. Measurement of the Top-antitop Production Cross √ Section in pp Collisions at 7 TeV using the Kinematic Properties of Events with Leptons and Jets. Eur.Physic.J C71:1721, (2011). arxiv:1106.0902v1. [31] R. J. BARLOW. Statistics: A Guide to Use of Statistical Methods in the Physical Sciences. John Wileys and Sons, 1989. [32] C. C OLLABORATION. Measurement of the inclusive W and Z production cross √ sections in pp collisions at s = 7 TeV with the CMS experiment. Journal of High Energy Physics, 2011 (2011), 1–76. 10.1007/JHEP10(2011)132. [33] CMS C OLLABORATION. Measurement of ttbar Pair Production Cross Section at sqrt(s)=7 TeV using b-quark Jet Identification Techniques in Lepton + Jet Events. Phys. Rev. D84:092004, (2011). PhysRevD.84.092004. [34] CMS COLLABORATION. Differential measurements of the charge asymmetry in top quark pair production, 2012. CMS-PAS-TOP-11-030. [35] W. V ERKERKE AND D. K IRKBY. The RooFit toolkit for data modeling, 2003. arXiv:physics/0306116v1 . [36] P. M. NADOLSKY ET AL . Implications of CTEQ global analysis for collider observables. Phys. Rev. D 78, 013004, (2008). arXiv:0802.0007v3, doi:10.1103/PhysRevD.78.013004.