Jahrbuch 2007/2008 | Lemson, Gerard; W hite, Simon | Simulationsdaten für alle Simulationsdaten für alle Supplying simulation data to the world Lemson, Gerard; W hite, Simon Max-Planck-Institut für Astrophysik, Garching Korrespondierender Autor E-Mail: [email protected] Zusammenfassung Drei Jahre nach seiner Fertigstellung ist die Millennium Simulation noch immer die größte Simulation kosmologische Struktur Erstehung, die bereits in über 100 Veröffentlichungen [1] resultierte. Der Großteil der Autoren benutzten dabei Web Services des German Astrophysical Observatory (GAVO) um auf die Simulationsdaten zuzugreifen. Dies ist die w eltw eit umfangreichste Anw endung von Virtual Observatory Techniken zur Publikation theoretischer Datensätze Summary Three years since its completion, the Millennium Run remains the largest simulation of cosmological structure formation. Over 100 papers [1] have been w ritten based on its numerical data. More than half of these are by authors w ho have accessed the data through a w eb service of the German Astrophysical Virtual Observatory (GAVO). This is the most complete application yet of Virtual Observatory techniques to the publication of theoretical data. Die öffentliche Bereitstellung großer und komplexer Datenmengen von state-of-the-art kosmologischen Simulationen w ie zum Beispiel die der so genannte Millennium-Simulation, bringt Herausforderungen mit sich, die sich von denen unterscheiden und darüber hinausgehen, w elchen man bei dem Aufsetzen öffentlicher Archive von Beobachtungsdaten begegnet. Viele dieser Herausforderungen rühren von der großen Vielfalt von Relationen zw ischen verschiedenen Objekten in der Simulations-Datenbank, und auch von der Tatsache, dass zahlreiche verschiedene Eigenschaften einzelnen Objekten zugeordnet w erden können. Die meisten Benutzer interessieren sich für die Eigenschaften Dunkler Materie Halos und Galaxien, Objekte die durch Nachbearbeiten der Simulationsdaten erzeugt w urden. Dunkle Materie Halos sind die grundlegenden nichtlinearen Einheiten des simulierten Universums. Sie besitzen Eigenschaften w ie Masse, Größe und Position, und zusätzlich interne Substruktur (so genannte Subhalos), die Überbleibsel derjenigen Objekte sind, die w ährend des Halo-Wachstums in diesen gefallen sind und zu seinem Wachstum beitrugen. Das MillenniumArchiv enthält Informationen für ungefähr 750 Millionen Halos und Subhalos. Diese sind alle in einer verketteten Baumstruktur verbunden, die genau angibt w ie sich jedes Objekt aus anderen zur direkt davor liegenden Zeit gebildet hat. Dies ist eine w ichtige Information, die insbesondere von GalaxienentstehungAlgorithmen benötigt w ird. © 2008 Max-Planck-Gesellschaft w w w .mpg.de 1/4 Jahrbuch 2007/2008 | Lemson, Gerard; W hite, Simon | Simulationsdaten für alle Bildschirm k opie de s W e b-Inte rfa ce zum Mille nnium -Archiv. Die da rge ste llte Abfra ge se le k tie rt a lle Ga la x ie n m it R otve rschie bung zwische n 1.0 und 1.03 in e ine m 0.1 Gra d Schnitt in De k lina tion a us e ine r Da te nba nk , die fe rne Ga la x ie n in e ine m k le ine n (1.4° x 1.4°) Be re ich de s Him m e ls m ode llie rt (De e p Mock Surve y). © Ma x -P la nck -Institut für Astrophysik , Ga rching Die Galaxien-Entstehung ist ein komplizierter und noch recht unklarer Prozess, sodass viele verschiedene physikalische Modelle getestet w erden müssen, um ein Modell zu finden, w elches die Beobachtungsdaten am besten w iedergibt. Ein Hauptanliegen der Millennium-Simulation ist es, einen Rahmen zum Vergleich verschiedener Galaxien-Entstehungsmodelle mit Beobachtungsdaten bereitzustellen. Darum ist es w ichtig simulierte Galaxien-Kataloge mit verschiedenen physikalischen nahmen über die Entstehung von Galaxien zugänglich zu machen. Dadurch können Benutzer ein Gefühl für die Unsicherheiten der jew eiligen Modelle entw ickeln. Ein Galaxien-Katalog für die vollständige Millennium-Simulation hat circa eine Milliarde Einträge. Für jede dieser Galaxien können zahlreiche Eigenschaften basierend auf dem zugrunde liegenden Entstehungsmodell berechnet w erden, die in der Datenbank abgelegt w erden müssen. Zusätzlich w erden Zeiger benötigt, die die Galaxien zu verschiedenen Zeiten miteinander verbinden, w odurch eine Baumstruktur entsteht, die die Entstehungsgeschichte (Merger History) einer jeden einzelnen Galaxie darstellt. Genau w ie die Halo-Entstehung kann so die Galaxien-Entstehung damit verfolgt w erden. © 2008 Max-Planck-Gesellschaft w w w .mpg.de 2/4 Jahrbuch 2007/2008 | Lemson, Gerard; W hite, Simon | Simulationsdaten für alle Bildschirm k opie e ine s P lots, de r m it de m W e b-Tool VO P lot e rste llt wurde . Er ze igt die P ositione n in R otve rschie bung und R e k ta sze nsion de r Ga la x ie n die von de r Abfra ge a us Abb. 1 zurück ge lie fe rt wurde n. © Ma x -P la nck -Institut für Astrophysik , Ga rching Ein w ichtiger Gesichtspunkt, der berücksichtigt w erden muss, ist der W unsch der Benutzer, die MillenniumDaten für eine Vielzahl sehr verschiedener Projekte und Fragestellungen zu verw enden. Die optimale Art der Bereitstellung der Daten hängt stark von dem entsprechenden Projekt ab. Das Verw enden „flacher Dateien“ ist hierfür nicht flexibel genug. Darum entschied sich die MPA/MPE/GAVO-Gruppe für eine relationale Datenbank zum Abspeichern der bearbeiteten Daten der Millennium-Simulation. Der Hauptvorteil dieses Vorgehens besteht darin, dass solche relationalen Datenbanken eine flexible und intuitive Abfragesprache (SQL=Sequential Query Language) anbieten, die es dem Benutzer erlaubt gezielt Daten nach seinen Bedürfnissen zu selektieren ohne dass er das zugrunde liegende Rohdaten-Format kennen muss. Die Datenbank implementiert diese Sprache mithilfe effizienter Query Engines die komplexe Benutzeranfragen interpretieren und mit höchster Effizienz ausführen. Online-Zugang zur Millennium-Datenbank ist über ein w eb-basiertes Abfrage-Interface (Abb. 1) möglich. Neben Dokumentation und Beispielanfragen für die Datenbank, kann der Benutzer dort auch seine eigenen SQL-Anfragen eingeben und ausführen. Die Ergebnisse können direkt zurückgegeben, online dargestellt (Abb. 2) oder für zukünftige Analysen in einer privaten Datenbank, die jedem registrierten Benutzer zur Verfügung steht, abgelegt w erden. Dieser Ansatz entspricht dem sehr erfolgreichen Konzept der SkyServer-Datenbank [2], ein online W eb Service zum Zugriff auf die Galaxien Kataloge des Sloan Digital Sky Survey. Momentan hat das Millennium-Archiv mehr als 200 registrierte Benutzer, denen lokaler Plattenspeicher für Aufbew ahrung und Manipulation ihrer Abfrageergebnisse zur Verfügung steht. Ungefähr 80% der Benutzer haben erfolgreich Abfragen an die Hauptdatenbank gerichtet. Die Hälfte scheint schon Forschung mit der © 2008 Max-Planck-Gesellschaft w w w .mpg.de 3/4 Jahrbuch 2007/2008 | Lemson, Gerard; W hite, Simon | Simulationsdaten für alle Datenbank zu betreiben (mehr als 100 erfolgreiche Abfragen), w ährend 20% als anspruchsvolle Benutzer eingestuft w erden können (mehr als 1000 erfolgreiche Abfragen). Im Schnitt w erden pro Woche über 700 Millionen Datenzeilen von der Seite heruntergeladen und die Benutzergemeinde des Archivs w ächst w eiter sehr schnell. Allerdings w ird es w ahrscheinlich noch einige Jahre brauchen um den Erfolg der Datenbank in Bezug auf neue w issenschaftliche Erkenntnisse vernünftig bew erten zu können [3]. © 2008 Max-Planck-Gesellschaft w w w .mpg.de 4/4