Simulationsdaten für alle Supplying simulation data to the world

Werbung
Jahrbuch 2007/2008 | Lemson, Gerard; W hite, Simon | Simulationsdaten für alle
Simulationsdaten für alle
Supplying simulation data to the world
Lemson, Gerard; W hite, Simon
Max-Planck-Institut für Astrophysik, Garching
Korrespondierender Autor
E-Mail: [email protected]
Zusammenfassung
Drei Jahre nach seiner Fertigstellung ist die Millennium Simulation noch immer die größte Simulation
kosmologische Struktur Erstehung, die bereits in über 100 Veröffentlichungen [1] resultierte. Der Großteil der
Autoren benutzten dabei Web Services des German Astrophysical Observatory (GAVO) um auf die
Simulationsdaten zuzugreifen. Dies ist die w eltw eit umfangreichste Anw endung von Virtual Observatory
Techniken zur Publikation theoretischer Datensätze
Summary
Three years since its completion, the Millennium Run remains the largest simulation of cosmological structure
formation. Over 100 papers [1] have been w ritten based on its numerical data. More than half of these are by
authors w ho have accessed the data through a w eb service of the German Astrophysical Virtual Observatory
(GAVO). This is the most complete application yet of Virtual Observatory techniques to the publication of
theoretical data.
Die öffentliche Bereitstellung großer und komplexer Datenmengen von state-of-the-art kosmologischen
Simulationen w ie zum Beispiel die der so genannte Millennium-Simulation, bringt Herausforderungen mit sich,
die sich von denen unterscheiden und darüber hinausgehen, w elchen man bei dem Aufsetzen öffentlicher
Archive von Beobachtungsdaten begegnet. Viele dieser Herausforderungen rühren von der großen Vielfalt von
Relationen zw ischen verschiedenen Objekten in der Simulations-Datenbank, und auch von der Tatsache, dass
zahlreiche verschiedene Eigenschaften einzelnen Objekten zugeordnet w erden können.
Die meisten Benutzer interessieren sich für die Eigenschaften Dunkler Materie Halos und Galaxien, Objekte die
durch Nachbearbeiten der Simulationsdaten erzeugt w urden. Dunkle Materie Halos sind die grundlegenden
nichtlinearen Einheiten des simulierten Universums. Sie besitzen Eigenschaften w ie Masse, Größe und Position,
und zusätzlich interne Substruktur (so genannte Subhalos), die Überbleibsel derjenigen Objekte sind, die
w ährend des Halo-Wachstums in diesen gefallen sind und zu seinem Wachstum beitrugen. Das MillenniumArchiv enthält Informationen für ungefähr 750 Millionen Halos und Subhalos. Diese sind alle in einer
verketteten Baumstruktur verbunden, die genau angibt w ie sich jedes Objekt aus anderen zur direkt davor
liegenden Zeit gebildet hat. Dies ist eine w ichtige Information, die insbesondere von GalaxienentstehungAlgorithmen benötigt w ird.
© 2008 Max-Planck-Gesellschaft
w w w .mpg.de
1/4
Jahrbuch 2007/2008 | Lemson, Gerard; W hite, Simon | Simulationsdaten für alle
Bildschirm k opie de s W e b-Inte rfa ce zum Mille nnium -Archiv. Die
da rge ste llte Abfra ge se le k tie rt a lle Ga la x ie n m it
R otve rschie bung zwische n 1.0 und 1.03 in e ine m 0.1 Gra d
Schnitt in De k lina tion a us e ine r Da te nba nk , die fe rne Ga la x ie n
in e ine m k le ine n (1.4° x 1.4°) Be re ich de s Him m e ls m ode llie rt
(De e p Mock Surve y).
© Ma x -P la nck -Institut für Astrophysik , Ga rching
Die Galaxien-Entstehung ist ein komplizierter und noch recht unklarer Prozess, sodass viele verschiedene
physikalische Modelle getestet w erden müssen, um ein Modell zu finden, w elches die Beobachtungsdaten am
besten w iedergibt. Ein Hauptanliegen der Millennium-Simulation ist es, einen Rahmen zum Vergleich
verschiedener Galaxien-Entstehungsmodelle mit Beobachtungsdaten bereitzustellen. Darum ist es w ichtig
simulierte Galaxien-Kataloge mit verschiedenen physikalischen nahmen über die Entstehung von Galaxien
zugänglich zu machen. Dadurch können Benutzer ein Gefühl für die Unsicherheiten der jew eiligen Modelle
entw ickeln. Ein Galaxien-Katalog für die vollständige Millennium-Simulation hat circa eine Milliarde Einträge. Für
jede
dieser
Galaxien
können
zahlreiche
Eigenschaften
basierend
auf
dem
zugrunde
liegenden
Entstehungsmodell berechnet w erden, die in der Datenbank abgelegt w erden müssen.
Zusätzlich w erden Zeiger benötigt, die die Galaxien zu verschiedenen Zeiten miteinander verbinden, w odurch
eine Baumstruktur entsteht, die die Entstehungsgeschichte (Merger History) einer jeden einzelnen Galaxie
darstellt. Genau w ie die Halo-Entstehung kann so die Galaxien-Entstehung damit verfolgt w erden.
© 2008 Max-Planck-Gesellschaft
w w w .mpg.de
2/4
Jahrbuch 2007/2008 | Lemson, Gerard; W hite, Simon | Simulationsdaten für alle
Bildschirm k opie e ine s P lots, de r m it de m W e b-Tool VO P lot
e rste llt wurde . Er ze igt die P ositione n in R otve rschie bung und
R e k ta sze nsion de r Ga la x ie n die von de r Abfra ge a us Abb. 1
zurück ge lie fe rt wurde n.
© Ma x -P la nck -Institut für Astrophysik , Ga rching
Ein w ichtiger Gesichtspunkt, der berücksichtigt w erden muss, ist der W unsch der Benutzer, die MillenniumDaten für eine Vielzahl sehr verschiedener Projekte und Fragestellungen zu verw enden. Die optimale Art der
Bereitstellung der Daten hängt stark von dem entsprechenden Projekt ab. Das Verw enden „flacher Dateien“
ist hierfür nicht flexibel genug. Darum entschied sich die MPA/MPE/GAVO-Gruppe für eine relationale Datenbank
zum Abspeichern der bearbeiteten Daten der Millennium-Simulation. Der Hauptvorteil dieses Vorgehens
besteht
darin,
dass
solche
relationalen
Datenbanken
eine
flexible
und
intuitive
Abfragesprache
(SQL=Sequential Query Language) anbieten, die es dem Benutzer erlaubt gezielt Daten nach seinen
Bedürfnissen zu selektieren ohne dass er das zugrunde liegende Rohdaten-Format kennen muss. Die
Datenbank implementiert diese Sprache mithilfe effizienter Query Engines die komplexe Benutzeranfragen
interpretieren und mit höchster Effizienz ausführen.
Online-Zugang zur Millennium-Datenbank ist über ein w eb-basiertes Abfrage-Interface (Abb. 1) möglich.
Neben Dokumentation und Beispielanfragen für die Datenbank, kann der Benutzer dort auch seine eigenen
SQL-Anfragen eingeben und ausführen. Die Ergebnisse können direkt zurückgegeben, online dargestellt (Abb.
2) oder für zukünftige Analysen in einer privaten Datenbank, die jedem registrierten Benutzer zur Verfügung
steht, abgelegt w erden. Dieser Ansatz entspricht dem sehr erfolgreichen Konzept der SkyServer-Datenbank
[2], ein online W eb Service zum Zugriff auf die Galaxien Kataloge des Sloan Digital Sky Survey.
Momentan hat das Millennium-Archiv mehr als 200 registrierte Benutzer, denen lokaler Plattenspeicher für
Aufbew ahrung und Manipulation ihrer Abfrageergebnisse zur Verfügung steht. Ungefähr 80% der Benutzer
haben erfolgreich Abfragen an die Hauptdatenbank gerichtet. Die Hälfte scheint schon Forschung mit der
© 2008 Max-Planck-Gesellschaft
w w w .mpg.de
3/4
Jahrbuch 2007/2008 | Lemson, Gerard; W hite, Simon | Simulationsdaten für alle
Datenbank zu betreiben (mehr als 100 erfolgreiche Abfragen), w ährend 20% als anspruchsvolle Benutzer
eingestuft w erden können (mehr als 1000 erfolgreiche Abfragen). Im Schnitt w erden pro Woche über 700
Millionen Datenzeilen von der Seite heruntergeladen und die Benutzergemeinde des Archivs w ächst w eiter
sehr schnell. Allerdings w ird es w ahrscheinlich noch einige Jahre brauchen um den Erfolg der Datenbank in
Bezug auf neue w issenschaftliche Erkenntnisse vernünftig bew erten zu können [3].
© 2008 Max-Planck-Gesellschaft
w w w .mpg.de
4/4
Herunterladen