ScienceblogBigData

Big Data - Kleine Teilchen
Wenn Forscher kleine Objekte untersuchen, so macht das die Arbeit nicht unbedingt
einfacher. Die erforderlichen Instrumente werden oft nicht nur komplizierter, sondern
auch größer. Je kleiner die Mikroben, Bazillen, Viren sind, desto größer und teurer
werden die Mikroskope, mit denen man sie untersuchen kann. Die Bausteine von
Atomen, die so genannten Elementarteilchen, sind noch eine Milliarde Mal kleiner.
Zu ihrer Untersuchung verwendet man Teilchenbeschleuniger, die oft viele Kilometer
lang sind.
Warum so viele Ereignisse?
Hat man so einen großen Teilchenbeschleuniger gebaut, reicht es jedoch noch lange
nicht, einfach ein paar „Fotos“ der gesuchten Elementarteilchen zu schießen. Warum?
Wir können ja Elementarteilchen gar nicht „sehen“, wir können nur aus indirekten
Signalen auf sie schließen. In einem Kollisionsbeschleuniger können wir Teilchen
miteinander zusammenstoßen lassen - so stark, dass sie sich dabei verändern, und wir
nach dem Zusammenstoß andere Teilchen feststellen. Diese neu geschaffenen
Teilchen sind meistens nicht stabil, sondern zerfallen wiederum in andere Teilchen, in
manchen Fällen auf viele verschiedene Weisen. Manche dieser Kollisions- und
Zerfallsprozesse sind häufiger, manche aber sehr selten. Dass sie selten sind, heißt
aber nicht, dass sie unwichtig wären. So, wie Biologen manchmal hartnäckig nach
einer Art suchen, deren Existenz sie aus irgendeinem Grund vermuten, so sagen auch
die physikalischen Theorien manchmal Teilchen oder Prozesse mit diesen vorher, die
man dann finden kann - oder auch nicht. Man kann die Theorie also verifizieren oder
falsifizieren.
Wenn man zum Beispiel zwei Protonen mit großer Energie aufeinander schießt, kann
das zu den verschiedensten Prozessen führen. Unter anderem kann z.B. auch ein so
genannten „Higgs-Teilchen“ entstehen. Das wurde von Theoretikern vor über 50
Jahren vorhergesagt, und seine Existenz ist für unsere Theorien von entscheidender
Bedeutung. Erst 2012 hat man dieses Teilchen dann endlich am
Teilchenbeschleuniger des CERN in Genf gefunden. Der Grund für diese lange Suche
war vor allem, dass man früher nicht Protonenstrahlen ausreichender Energie zur
Verfügung hatte. Aber selbst, als der Beschleuniger bereits bei der entsprechenden
Energie lief, musste man noch Jahre lang suchen! Wieso? Weil die Produktion eines
Higgs-Teilchens selbst bei diesen Energien so selten ist! Zehn Milliarden Mal passiert
bei einer Protonenkollision etwas anderes, und nur einmal entsteht das, was man
wirklich sucht! Stellen Sie sich vor, Ihre Tochter (oder Schwester, oder sonst wer) hat
einen chinesischen Freund, und den wollen Sie bei Ihrer Chinareise natürlich kennen
lernen. Sie wissen aber nicht, wo er wohnt und wie er heißt, kennen seine
Handynummer nicht, Sie haben ihn nur einmal etwas verzerrt auf Skype gesehen. Sie
müssen also ganz China abklappern und jeden Chinesen genau anschauen. Das wird
mühsam! Dabei gibt es ja eh nur eine Milliarde Chinesen ... beim Higgs-Teilchen
müssen Sie noch zehn Mal länger suchen!
CMS Event Display: Bei diesem in der Computer-Rekonstruktion dargestellten
Ereignis könnte es sich um den Zerfall eines Higgs-Teilchens in zwei Photonen
handeln. Erst aus vielen ähnlichen Ereignissen aber kann man die Eigenschaften
dieses Teilchens ableiten.
In Wirklichkeit kommt es noch schlimmer. Das Higgs-Teilchen kann man, so wie die
anderen Elementarteilchen, nicht wirklich „sehen“. Sie können nur gewisse Zerfälle
in andere Teilchen beobachten, die Sie vom Higgs-Teilchen erwarten. Sie lassen zum
Beispiel zwei Protonen kollidieren und suchen nach Ereignissen, bei denen Sie
nachher zwei Photonen (also hochenergetische Lichtteilchen) sehen (die können wir
in unseren Geräten, den Teilchendetektoren, feststellen). Es gibt aber noch viele
andere Prozesse, die zwei Photonen produzieren. Nur, wenn diese bestimmte
Energien und Flugrichtungen haben, könnten sie auf den Zerfall eines HiggsTeilchens zurückzuführen sein. So, jetzt haben wir also das Kochrezept:
Man nehme: zehn Milliarden Protonzusammenstöße, suche alle Ereignisse, bei denen
zwei Photonen entstehen, und messe deren Energien und Impulse. Im Durchschnitt
wäre darunter jetzt vielleicht ein Higgs-Zerfall. Aber von einem wissen wir noch
nichts - wir müssen uns das viele Male ansehen, um festzustellen, ob wir wirklich
Higgs-Teilchen sehen, weil sich bestimmte Verhältnisse von Energien und Impulsen
immer wieder wiederholen. Um das halbwegs genau zu wissen, müssen wir das
wenigstens tausend Mal wiederholen. Also: „Herr Ober, bitte zehntausend Milliarden
Protonenkollisionen!“
Wie kann man diese vielen Ereignisse untersuchen?
Solche unglaublichen Mengen an Zusammenstößen zwischen Protonen kann uns
tatsächlich der „Large Hadron Collider“, kurz LHC am CERN liefern. (Protonen und
auch alle anderen, aus so genannten „Quarks“ bestehenden Teilchen, werden in der
Physik als „Hadronen“ bezeichnet, daher der Name dieses Beschleunigers.) Aber
irgendwer muss sich dann ja auch diese Unmengen an Daten ansehen! Für jeden
Zusammenstoß von zwei Protonpaketen - an die 40 Millionen Mal pro Sekunde muss man alle „Kanäle“, also alle einzelnen Sensoren des Detektors, auslesen, und
von denen gibt es an die 100 Millionen. Das ist nicht nur für uns Menschen ein
bisschen zu viel, das schaffen nicht einmal die modernsten Computer so leicht.
CMS Detektor: Will man zu einem Ereignis alle Informationen sammeln, die der
CMS-Detektor aufgenommen hat, so muss man an die hundert Millionen Kanäle
berücksichtigen.
Wenn man genug Geld hat, kann man sich viele Computer kaufen und parallel
arbeiten lassen. Damit ist es aber noch nicht getan: man muss zuerst die Daten aus
dem Detektor herausholen, und auch das ist keineswegs trivial. Um so viele Daten so
rasch „herauszuschaufeln“, braucht man viele Datenleitungen und auch viel
elektrische Leistung. Die dafür erforderlichen Stromleitungen, die Datenleitungen und
die bei so viel Leistung erforderlichen Kühlanlagen würden dann aber kaum mehr
Platz für die eigentlichen Detektoren lassen, die die Teilchen wahrnehmen sollen. Wie
kann man sich aus dieser Zwickmühle befreien?
Arbeit machen - oder Arbeit vermeiden?
Am besten wäre es, gar nicht alle Informationen aus dem Detektor herausholen zu
müssen. Wie wir oben gesehen haben, suchen wir ja eigentlich recht seltene
Ereignisse, das meiste, was bei den Protonenkollisionen passiert, ist für uns nur
störender „Untergrund“. Es geht uns ein bisschen wie einem Astronomen in einer
Großstadt: er will die Sterne beobachten, hauptsächlich sieht er aber nur das Licht der
Straßenbeleuchtung. Man müsste das irgendwie filtern können, irgendwie schon
vorher wissen, welche Ereignisse nun interessant sind und welche nicht. Wie soll man
das anstellen?
Die Lösung nennt sich „Trigger“, also „Auslöser“. Ausgelöst werden soll hier aber
natürlich nicht der Schuss eines Revolvers, wie bei irgendwelchen „trigger-happy
cowboys“, sondern die Aufzeichnung der Daten. Die Idee ist, dass man sich an Hand
von wenigen Informationen ein erstes Bild von einem Ereignis macht und damit
bereits viele Untergrundereignisse, die einen nicht interessieren, verwerfen kann.
Stellen Sie sich vor, Sie sind eine Dame auf einem Ball und suchen einen Tänzer.
Leider sind ja viele junge Männer tanzfaul, und auf den Bällen herrscht dann
manchmal Damenüberschuss und Herrenknappheit. Wenn Sie einen männlichen
Tanzpartner haben wollen, werden Sie zuerst einmal alle Damen ausfiltern. Wer also
im Abendkleid daherkommt, wird gar nicht erst näher angesehen. Erst, wenn Sie
Beine in einer schwarzen Anzughose sehen, brauchen Sie den Blick zu heben und
genauer untersuchen: ist es wirklich ein Herr oder vielleicht eine Dame in einem
Hosenanzug? Sieht er halbwegs attraktiv aus? Kann er einigermaßen tanzen?
Der Trigger
Ähnlich gehen die Physiker mit dem „Trigger“ vor, der natürlich, auf Grund der
vielen Untergrundereignisse, automatisch funktionieren muss. Zuerst werden auf
Grund grober Kriterien schon viele weniger interessant erscheinende Ereignisse
verworfen, dann bleiben schon weniger über, und man kann sich den Rest immer
genauer ansehen. Dafür liest man die Informationen zuerst rasch, aber mit grober
Auflösung aus. Dadurch bekommt man einen ersten Eindruck davon, in ungefähr
welche Richtung Teilchen davonfliegen, und mit ungefähr welchem Impuls. Dann
wissen wir im Nachhinein, welche Ereignisse vielleicht interessant gewesen wären
und eine genauere Untersuchung verdient hätten. Aber ist es jetzt nicht schon zu spät
dafür? Nein! Alle Teile des Detektors sind mit „memories“, mit
Kurzzeitgedächtnissen ausgestattet, und wenn das Triggersignal nur rasch genug in
den Detektor zurückkommt, können von dort noch alle Detailinformationen abgeholt
werden. Wenn das Triggersignal zu spät kommt, dann hat der Detektor bereits
„vergessen“, was gesehen wurde: genauer gesagt, die entsprechenden Einträge im
Speicher wurden bereits überschrieben, also durch andere ersetzt.
So können die Physiker also der ungeheuren Datenmengen Herr werden:
- alles mit hoher Präzision lokal auf kurze Zeit abspeichern;
- ein grobes Bild an das rasche elektronische Triggersystem schicken (das sind
spezielle elektronische Geräte, normale Computer wären hier zu langsam);
- wenn dieses das Ereignis für interessant wertet und ein entsprechendes Signal
zurückschickt, die Daten mit voller Präzision aus dem Speicher holen und an eine
Computerfarm weiterschicken;
- viele Computer können sich nun die Arbeit teilen und an Hand der genauen Daten,
die ihnen zur Verfügung stehen, nochmals viele Ereignisse als doch nicht so
interessant verwerfen; diese Computerfarm bezeichnet man dann auch als „zweite
Triggerstufe“ oder „High-Level Trigger“.
Das Triggersystem erinnert ein bisschen an die Tauben im Aschenputtel: alleine hätte
es die arme Physikerin Aschenputtel nie geschafft, alle Erbsen zu prüfen, aber die
vielen Tauben haben ihr dabei geholfen, die guten herauszulesen: „Die guten ins
Töpfchen, die schlechten ins Kröpfchen.“
Aschenputtel: So wie die Tauben dem Aschenputtel beim Erbsensortieren helfen,
so hilft der Trigger den Physikern bei der Auswahl der interessanten Ereignisse.
Bei Experimenten am LHC-Beschleuniger des CERN müssen so die elektronischen
Triggersysteme 40 Millionen Mal in der Sekunde eine erste Entscheidung liefern (der
Techniker sagt, sie laufen mit 40 Megahertz). Sie dürfen höchstens 100000 Mal in der
Sekunde eine positive Entscheidung treffen, sonst geht es sich nicht aus, alle Daten
aus dem Detektor herauszuholen (d.h. sie schicken Daten mit 100 Kilohertz an die
Computerfarm weiter). Die Computer wählen dann nochmals aus dieser Zahl
zwischen 100 und 1000 Ereignissen pro Sekunde aus, die wirklich so interessant
scheinen, dass die Physiker sie auf Dauer abspeichern und genau analysieren.
Kann sich der Trigger irren?
Wichtig ist es natürlich, hier nicht das Kind mit dem Bade auszuschütten und
womöglich auch eine Menge interessanter Ereignisse zu verwerfen. Wie kann man
überprüfen, ob das nicht passiert? Hierfür akzeptiert man zusätzlich einen kleinen Teil
der weniger interessant scheinenden Ereignisse, also z.B. nur jedes hundertste oder
jedes tausendste. Die kann man sich dann getrennt anschauen und prüfen, ob hier
wirklich nur uninteressante Ereignisse sind, ob man vielleicht bei irgendeiner
Auswahlbedingung zu streng war (dann wäre der Trigger „ineffizient“). Umgekehrt
prüft man natürlich in den ausgewählten Daten, ob man auch nicht zu viele
uninteressante Ereignisse irrtümlich doch aufgezeichnet hat (ob der Trigger „sauber“
genug ist).
Nur so ist es möglich, aus der Unmenge von Daten schlussendlich doch die wenigen,
hochinteressanten Ereignisse herauszufiltern, die es uns dann ermöglichen, unsere
physikalischen Theorien zu überprüfen und weiter zu entwickeln. Einen ganz
entscheidenden Beitrag hat dabei das Institut für Hochenergiephysik der
Österreichischen Akademie der Wissenschaften geleistet, von dessen Mitarbeitern
einige sehr wesentliche Teile der Triggerelektronik am LHC-Experiment „CMS“
(„Compact Muon Solenoid“) entwickelt und gebaut wurden. Wenn Sie uns in Genf
besuchen, werden wir Ihnen das gerne zeigen und noch genauer erklären!
CMS Globaler Trigger: Ein Teil der von Wien entwickelten Triggerelektronik für
das CMS-Experiment am CERN in Genf.
Bildunterschriften:
CMS Event Display: Bei diesem in der Computer-Rekonstruktion dargestellten
Ereignis könnte es sich um den Zerfall eines Higgs-Teilchens in zwei Photonen
handeln. Erst aus vielen ähnlichen Ereignissen aber kann man die Eigenschaften
dieses Teilchens ableiten.
CMS Detektor: Will man zu einem Ereignis alle Informationen sammeln, die der
CMS-Detektor aufgenommen hat, so muss man an die hundert Millionen Kanäle
berücksichtigen.
Aschenputtel: So wie die Tauben dem Aschenputtel beim Erbsensortieren helfen, so
hilft der Trigger den Physikern bei der Auswahl der interessanten Ereignisse.
CMS Globaler Trigger: Ein Teil der von Wien entwickelten Triggerelektronik für
das CMS-Experiment am CERN in Genf.