Big Data - Kleine Teilchen Wenn Forscher kleine Objekte untersuchen, so macht das die Arbeit nicht unbedingt einfacher. Die erforderlichen Instrumente werden oft nicht nur komplizierter, sondern auch größer. Je kleiner die Mikroben, Bazillen, Viren sind, desto größer und teurer werden die Mikroskope, mit denen man sie untersuchen kann. Die Bausteine von Atomen, die so genannten Elementarteilchen, sind noch eine Milliarde Mal kleiner. Zu ihrer Untersuchung verwendet man Teilchenbeschleuniger, die oft viele Kilometer lang sind. Warum so viele Ereignisse? Hat man so einen großen Teilchenbeschleuniger gebaut, reicht es jedoch noch lange nicht, einfach ein paar „Fotos“ der gesuchten Elementarteilchen zu schießen. Warum? Wir können ja Elementarteilchen gar nicht „sehen“, wir können nur aus indirekten Signalen auf sie schließen. In einem Kollisionsbeschleuniger können wir Teilchen miteinander zusammenstoßen lassen - so stark, dass sie sich dabei verändern, und wir nach dem Zusammenstoß andere Teilchen feststellen. Diese neu geschaffenen Teilchen sind meistens nicht stabil, sondern zerfallen wiederum in andere Teilchen, in manchen Fällen auf viele verschiedene Weisen. Manche dieser Kollisions- und Zerfallsprozesse sind häufiger, manche aber sehr selten. Dass sie selten sind, heißt aber nicht, dass sie unwichtig wären. So, wie Biologen manchmal hartnäckig nach einer Art suchen, deren Existenz sie aus irgendeinem Grund vermuten, so sagen auch die physikalischen Theorien manchmal Teilchen oder Prozesse mit diesen vorher, die man dann finden kann - oder auch nicht. Man kann die Theorie also verifizieren oder falsifizieren. Wenn man zum Beispiel zwei Protonen mit großer Energie aufeinander schießt, kann das zu den verschiedensten Prozessen führen. Unter anderem kann z.B. auch ein so genannten „Higgs-Teilchen“ entstehen. Das wurde von Theoretikern vor über 50 Jahren vorhergesagt, und seine Existenz ist für unsere Theorien von entscheidender Bedeutung. Erst 2012 hat man dieses Teilchen dann endlich am Teilchenbeschleuniger des CERN in Genf gefunden. Der Grund für diese lange Suche war vor allem, dass man früher nicht Protonenstrahlen ausreichender Energie zur Verfügung hatte. Aber selbst, als der Beschleuniger bereits bei der entsprechenden Energie lief, musste man noch Jahre lang suchen! Wieso? Weil die Produktion eines Higgs-Teilchens selbst bei diesen Energien so selten ist! Zehn Milliarden Mal passiert bei einer Protonenkollision etwas anderes, und nur einmal entsteht das, was man wirklich sucht! Stellen Sie sich vor, Ihre Tochter (oder Schwester, oder sonst wer) hat einen chinesischen Freund, und den wollen Sie bei Ihrer Chinareise natürlich kennen lernen. Sie wissen aber nicht, wo er wohnt und wie er heißt, kennen seine Handynummer nicht, Sie haben ihn nur einmal etwas verzerrt auf Skype gesehen. Sie müssen also ganz China abklappern und jeden Chinesen genau anschauen. Das wird mühsam! Dabei gibt es ja eh nur eine Milliarde Chinesen ... beim Higgs-Teilchen müssen Sie noch zehn Mal länger suchen! CMS Event Display: Bei diesem in der Computer-Rekonstruktion dargestellten Ereignis könnte es sich um den Zerfall eines Higgs-Teilchens in zwei Photonen handeln. Erst aus vielen ähnlichen Ereignissen aber kann man die Eigenschaften dieses Teilchens ableiten. In Wirklichkeit kommt es noch schlimmer. Das Higgs-Teilchen kann man, so wie die anderen Elementarteilchen, nicht wirklich „sehen“. Sie können nur gewisse Zerfälle in andere Teilchen beobachten, die Sie vom Higgs-Teilchen erwarten. Sie lassen zum Beispiel zwei Protonen kollidieren und suchen nach Ereignissen, bei denen Sie nachher zwei Photonen (also hochenergetische Lichtteilchen) sehen (die können wir in unseren Geräten, den Teilchendetektoren, feststellen). Es gibt aber noch viele andere Prozesse, die zwei Photonen produzieren. Nur, wenn diese bestimmte Energien und Flugrichtungen haben, könnten sie auf den Zerfall eines HiggsTeilchens zurückzuführen sein. So, jetzt haben wir also das Kochrezept: Man nehme: zehn Milliarden Protonzusammenstöße, suche alle Ereignisse, bei denen zwei Photonen entstehen, und messe deren Energien und Impulse. Im Durchschnitt wäre darunter jetzt vielleicht ein Higgs-Zerfall. Aber von einem wissen wir noch nichts - wir müssen uns das viele Male ansehen, um festzustellen, ob wir wirklich Higgs-Teilchen sehen, weil sich bestimmte Verhältnisse von Energien und Impulsen immer wieder wiederholen. Um das halbwegs genau zu wissen, müssen wir das wenigstens tausend Mal wiederholen. Also: „Herr Ober, bitte zehntausend Milliarden Protonenkollisionen!“ Wie kann man diese vielen Ereignisse untersuchen? Solche unglaublichen Mengen an Zusammenstößen zwischen Protonen kann uns tatsächlich der „Large Hadron Collider“, kurz LHC am CERN liefern. (Protonen und auch alle anderen, aus so genannten „Quarks“ bestehenden Teilchen, werden in der Physik als „Hadronen“ bezeichnet, daher der Name dieses Beschleunigers.) Aber irgendwer muss sich dann ja auch diese Unmengen an Daten ansehen! Für jeden Zusammenstoß von zwei Protonpaketen - an die 40 Millionen Mal pro Sekunde muss man alle „Kanäle“, also alle einzelnen Sensoren des Detektors, auslesen, und von denen gibt es an die 100 Millionen. Das ist nicht nur für uns Menschen ein bisschen zu viel, das schaffen nicht einmal die modernsten Computer so leicht. CMS Detektor: Will man zu einem Ereignis alle Informationen sammeln, die der CMS-Detektor aufgenommen hat, so muss man an die hundert Millionen Kanäle berücksichtigen. Wenn man genug Geld hat, kann man sich viele Computer kaufen und parallel arbeiten lassen. Damit ist es aber noch nicht getan: man muss zuerst die Daten aus dem Detektor herausholen, und auch das ist keineswegs trivial. Um so viele Daten so rasch „herauszuschaufeln“, braucht man viele Datenleitungen und auch viel elektrische Leistung. Die dafür erforderlichen Stromleitungen, die Datenleitungen und die bei so viel Leistung erforderlichen Kühlanlagen würden dann aber kaum mehr Platz für die eigentlichen Detektoren lassen, die die Teilchen wahrnehmen sollen. Wie kann man sich aus dieser Zwickmühle befreien? Arbeit machen - oder Arbeit vermeiden? Am besten wäre es, gar nicht alle Informationen aus dem Detektor herausholen zu müssen. Wie wir oben gesehen haben, suchen wir ja eigentlich recht seltene Ereignisse, das meiste, was bei den Protonenkollisionen passiert, ist für uns nur störender „Untergrund“. Es geht uns ein bisschen wie einem Astronomen in einer Großstadt: er will die Sterne beobachten, hauptsächlich sieht er aber nur das Licht der Straßenbeleuchtung. Man müsste das irgendwie filtern können, irgendwie schon vorher wissen, welche Ereignisse nun interessant sind und welche nicht. Wie soll man das anstellen? Die Lösung nennt sich „Trigger“, also „Auslöser“. Ausgelöst werden soll hier aber natürlich nicht der Schuss eines Revolvers, wie bei irgendwelchen „trigger-happy cowboys“, sondern die Aufzeichnung der Daten. Die Idee ist, dass man sich an Hand von wenigen Informationen ein erstes Bild von einem Ereignis macht und damit bereits viele Untergrundereignisse, die einen nicht interessieren, verwerfen kann. Stellen Sie sich vor, Sie sind eine Dame auf einem Ball und suchen einen Tänzer. Leider sind ja viele junge Männer tanzfaul, und auf den Bällen herrscht dann manchmal Damenüberschuss und Herrenknappheit. Wenn Sie einen männlichen Tanzpartner haben wollen, werden Sie zuerst einmal alle Damen ausfiltern. Wer also im Abendkleid daherkommt, wird gar nicht erst näher angesehen. Erst, wenn Sie Beine in einer schwarzen Anzughose sehen, brauchen Sie den Blick zu heben und genauer untersuchen: ist es wirklich ein Herr oder vielleicht eine Dame in einem Hosenanzug? Sieht er halbwegs attraktiv aus? Kann er einigermaßen tanzen? Der Trigger Ähnlich gehen die Physiker mit dem „Trigger“ vor, der natürlich, auf Grund der vielen Untergrundereignisse, automatisch funktionieren muss. Zuerst werden auf Grund grober Kriterien schon viele weniger interessant erscheinende Ereignisse verworfen, dann bleiben schon weniger über, und man kann sich den Rest immer genauer ansehen. Dafür liest man die Informationen zuerst rasch, aber mit grober Auflösung aus. Dadurch bekommt man einen ersten Eindruck davon, in ungefähr welche Richtung Teilchen davonfliegen, und mit ungefähr welchem Impuls. Dann wissen wir im Nachhinein, welche Ereignisse vielleicht interessant gewesen wären und eine genauere Untersuchung verdient hätten. Aber ist es jetzt nicht schon zu spät dafür? Nein! Alle Teile des Detektors sind mit „memories“, mit Kurzzeitgedächtnissen ausgestattet, und wenn das Triggersignal nur rasch genug in den Detektor zurückkommt, können von dort noch alle Detailinformationen abgeholt werden. Wenn das Triggersignal zu spät kommt, dann hat der Detektor bereits „vergessen“, was gesehen wurde: genauer gesagt, die entsprechenden Einträge im Speicher wurden bereits überschrieben, also durch andere ersetzt. So können die Physiker also der ungeheuren Datenmengen Herr werden: - alles mit hoher Präzision lokal auf kurze Zeit abspeichern; - ein grobes Bild an das rasche elektronische Triggersystem schicken (das sind spezielle elektronische Geräte, normale Computer wären hier zu langsam); - wenn dieses das Ereignis für interessant wertet und ein entsprechendes Signal zurückschickt, die Daten mit voller Präzision aus dem Speicher holen und an eine Computerfarm weiterschicken; - viele Computer können sich nun die Arbeit teilen und an Hand der genauen Daten, die ihnen zur Verfügung stehen, nochmals viele Ereignisse als doch nicht so interessant verwerfen; diese Computerfarm bezeichnet man dann auch als „zweite Triggerstufe“ oder „High-Level Trigger“. Das Triggersystem erinnert ein bisschen an die Tauben im Aschenputtel: alleine hätte es die arme Physikerin Aschenputtel nie geschafft, alle Erbsen zu prüfen, aber die vielen Tauben haben ihr dabei geholfen, die guten herauszulesen: „Die guten ins Töpfchen, die schlechten ins Kröpfchen.“ Aschenputtel: So wie die Tauben dem Aschenputtel beim Erbsensortieren helfen, so hilft der Trigger den Physikern bei der Auswahl der interessanten Ereignisse. Bei Experimenten am LHC-Beschleuniger des CERN müssen so die elektronischen Triggersysteme 40 Millionen Mal in der Sekunde eine erste Entscheidung liefern (der Techniker sagt, sie laufen mit 40 Megahertz). Sie dürfen höchstens 100000 Mal in der Sekunde eine positive Entscheidung treffen, sonst geht es sich nicht aus, alle Daten aus dem Detektor herauszuholen (d.h. sie schicken Daten mit 100 Kilohertz an die Computerfarm weiter). Die Computer wählen dann nochmals aus dieser Zahl zwischen 100 und 1000 Ereignissen pro Sekunde aus, die wirklich so interessant scheinen, dass die Physiker sie auf Dauer abspeichern und genau analysieren. Kann sich der Trigger irren? Wichtig ist es natürlich, hier nicht das Kind mit dem Bade auszuschütten und womöglich auch eine Menge interessanter Ereignisse zu verwerfen. Wie kann man überprüfen, ob das nicht passiert? Hierfür akzeptiert man zusätzlich einen kleinen Teil der weniger interessant scheinenden Ereignisse, also z.B. nur jedes hundertste oder jedes tausendste. Die kann man sich dann getrennt anschauen und prüfen, ob hier wirklich nur uninteressante Ereignisse sind, ob man vielleicht bei irgendeiner Auswahlbedingung zu streng war (dann wäre der Trigger „ineffizient“). Umgekehrt prüft man natürlich in den ausgewählten Daten, ob man auch nicht zu viele uninteressante Ereignisse irrtümlich doch aufgezeichnet hat (ob der Trigger „sauber“ genug ist). Nur so ist es möglich, aus der Unmenge von Daten schlussendlich doch die wenigen, hochinteressanten Ereignisse herauszufiltern, die es uns dann ermöglichen, unsere physikalischen Theorien zu überprüfen und weiter zu entwickeln. Einen ganz entscheidenden Beitrag hat dabei das Institut für Hochenergiephysik der Österreichischen Akademie der Wissenschaften geleistet, von dessen Mitarbeitern einige sehr wesentliche Teile der Triggerelektronik am LHC-Experiment „CMS“ („Compact Muon Solenoid“) entwickelt und gebaut wurden. Wenn Sie uns in Genf besuchen, werden wir Ihnen das gerne zeigen und noch genauer erklären! CMS Globaler Trigger: Ein Teil der von Wien entwickelten Triggerelektronik für das CMS-Experiment am CERN in Genf. Bildunterschriften: CMS Event Display: Bei diesem in der Computer-Rekonstruktion dargestellten Ereignis könnte es sich um den Zerfall eines Higgs-Teilchens in zwei Photonen handeln. Erst aus vielen ähnlichen Ereignissen aber kann man die Eigenschaften dieses Teilchens ableiten. CMS Detektor: Will man zu einem Ereignis alle Informationen sammeln, die der CMS-Detektor aufgenommen hat, so muss man an die hundert Millionen Kanäle berücksichtigen. Aschenputtel: So wie die Tauben dem Aschenputtel beim Erbsensortieren helfen, so hilft der Trigger den Physikern bei der Auswahl der interessanten Ereignisse. CMS Globaler Trigger: Ein Teil der von Wien entwickelten Triggerelektronik für das CMS-Experiment am CERN in Genf.