Johann-Christoph Freytag, Thomas Ruf, Wolfgang Lehner, Gottfried Vossen (Hrsg.) Datenbanksysteme in Business, Technologie und Web (BTW) 13. Fachtagung des GI-Fachbereichs „Datenbanken und Informationssysteme“ (DBIS) 2.-6. März 2009 in Münster, Germany Gesellschaft für Informatik e.V. (GI) Lecture Notes in Informatics (LNI) - Proceedings Series of the Gesellschaft für Informatik (GI) Volume P-144 ISBN 978-3-88579-238-3 ISSN 1617-5468 Volume Editors Prof. Johann-Christoph Freytag, Ph.D. Institut für Informatik Humboldt-Universität zu Berlin, 10099 Berlin, Germany E-Mail: [email protected] Prof. Dr. Thomas Ruf GfK Retail and Technology GmbH, 90319 Nürnberg, Germany E-Mail: [email protected] Prof. Dr. Wolfgang Lehner Department of Computer Science Technische Universität Dresden, 01187 Dresden, Germany E-Mail: [email protected] Prof. Dr. Gottfried Vossen Institut für Wirtschaftsinformatik Universität Münster, 48149 Münster, Germany E-Mail: [email protected] Series Editorial Board Heinrich C. Mayr, Universität Klagenfurt (Chairman) Jörg Becker, Universität Münster Hinrich Bonin, Leuphana-Universität Lüneburg Dieter Fellner, Technische Universität Darmstadt Ulrich Flegel, SAP Johann-Christoph Freytag, Humboldt-Universität zu Berlin Ulrich Furbach, Universität Koblenz Michael Koch, Universität der Bundeswehr München Axel Lehmann, Universität der Bundeswehr, München Peter Liggesmeyer, Universität Kaiserslautern Ernst W. Mayr, Technische Universität München Heinrich Müller, Universität Dortmund Sigrid Schubert, Universität Siegen Martin Warnke, Leuphana-Universität Lüneburg Dissertations Dorothea Wagner, Universität Karlsruhe, Germany Seminars Reinhard Wilhelm, Universität des Saarlandes, Germany Thematics Andreas Oberweis, Universität Karlsruhe (TH) © Gesellschaft für Informatik, Bonn 2009 printed by Köllen Druck+Verlag GmbH, Bonn Vorwort Alle zwei Jahre findet die BTW-Konferenz der Gesellschaft für Informatik (GI) als die nationale Datenbankkonferenz an einem ausgezeichneten Ort in Deutschland statt. So ist die Westfälischen-Wilhelms Universität in Münster vom 4. bis 6. März 2009 Gastgeberin die 13. BTW-Konferenz. Münster mit seiner mehr als 1200-jährigen Geschichte im Zentrum Westfalens gilt vielen als Ort der Tradition und der Kultur; hier wurde 1648 der Westfälische Frieden geschlossen, der das Ende des 30-jährigen Krieges in Europa markierte. Heute sind die Stadt, traditionell Sitz von Bildungs- und Verwaltungseinrichtungen sowie Finanzdienstleistern, und das umliegende Münsterland eine Region mit wachsender Wirtschafts- und Innovationskraft, die sie zum großen Teil der hiesigen Universität und ihren angegliederten Instituten verdankt. Die BTW-Tagung ist seit über 20 Jahren das zentrale Forum der deutschsprachigen Datenbankgemeinde, die zahlen- und publikationsmäßig zu einer der stärksten weltweit gehört. Auf dieser Tagung treffen sich alle zwei Jahre nicht nur Wissenschaftler, sondern auch Praktiker und Anwender. Die Tradition der BTW hat ihren Anfang in der ersten Tagung 1985 in Karlsruhe zu einer Zeit, in der sich Datenbanksysteme von den klassischen betrieblichen Einsatzfeldern zu Anwendungen in Büro, Technik und Wissenschaft entwickelten, daher der ursprüngliche Name BTW. Heute ist Datenbanktechnologie der wichtigste Stützpfeiler der IT-Branche generell; sie ist unverzichtbar für organisationsübergreifende Kooperationen und elektronische Prozesse, als Infrastruktur in der Telekommunikation und anderen eingebetteten Technologien, als skalierbares Rückgrat digitaler Bibliotheken, vieler Data-Mining-Werkzeuge sowie für viele Arten von Web-Anwendungen und der Realisierung service-orientierter Architekturen (SOAs). Im Zeitalter der Informationsexplosion, Virtualisierung und Web-Orientierung kommen auf die Datenbank- und Informationssystemtechnologie kontinuierlich neue Herausforderungen zu. Diese spiegeln sich in Themen wie Informationsintegration aus heterogenen, verteilten Datenquellen mit verschiedenen Medien und variierendem Strukturierungsgrad, internetweites, kollaboratives Informationsmanagement, Grid/CloudComputing und E-Science-Kollaborationen oder der Gestaltung der Vision eines "Semantic Web" wider. Hinzu kommen Fragen aus den Bereichen der Datenqualität, der Datenstromverarbeitung sowie Einbindung von Ontologien und anderen Konzepten des Web 2.0, um den ständig komplexer werdenden Anforderungen aus verschiedenen Anwendungsgebieten gerecht zu werden. Im Bereich der Geschäftsprozessmodellierung und -realisierung müssen prozess- und dienstorientierte Architekturen weiterentwickelt und ihre Anforderungen auf Datenbank- und Informationssysteme hin formuliert werden. In seiner Struktur hält sich die diesjährige BTW-Tagung an ihre Tradition. Sie umfasst auch diesmal ein wissenschaftliches Programm, ein Industrieprogramm und ein Demonstrationsprogramm. Am Rande der Tagung finden zusätzlich verschiedene Workshops, Tutorien im Rahmen der Datenbank-Tutorientage sowie ein StudierendenproI gramm statt. Für das wissenschaftliche Programm wurden Beiträge über die Weiterentwicklung der Datenbanktechnologie, ihrer Grundlagen und ihrer Wechselwirkungen mit benachbarten Gebieten sowie ihrer Anwendungen ausgewählt. Beiträge über den kommerziellen Einsatz von Datenbanktechnologie, Erfahrungen und aktuelle Industrietrends wurden für das Industrieprogramm zusammengestellt. Wie bei den bisherigen BTWTagungen waren sowohl Langbeiträge (Original- oder Übersichtsarbeiten) als auch Kurzbeiträge (über neuere Projekte oder erste Zwischenergebnisse laufender Forschungsarbeiten) erwünscht. Im wissenschaftlichen Bereich werden die Themen Anfragesprachen und Anfragebearbeitung, Datenintegration und Metadaten, Data Warehousing und Caching, Datenströme sowie Neue Anwendungen adressiert. Das Industrieprogramm behandelt die Bereiche Neue Technologien für Datenbanken, Optimierungstechniken für Datenbankanfragen sowie Business Intelligence. Zusätzlich umfasst die BTW drei eingeladene Vorträge: • • • Ricardo Baeza-Yates (Yahoo!Research Barcelona) entwirft in seinem Vortrag „Towards a Distributed Search Engine“ seine Vision zur Weiterentwicklung von Suchmaschinen. Juliana Freire (University of Utah, USA) untersucht in ihrer Keynote “Provenance Management: Challenges and Opportunities” das immer wichtiger werdende Feld der Protokollierung von Daten-Herkunft. Sergey Melnik (Google Inc.) stellt als BTW-Dissertationspreisgewinner 2003 in seinem Vortrag “The Frontiers of Data Programmability” seine neuesten Forschungsarbeiten bei Google vor. Nach guter Tradition werden im Rahmen der BTW auch drei Preise für hervorragende Dissertationen im Datenbankbereich vergeben: • • • Ira Assent (RWTH Aachen): Efficient Adaptive Retrieval and Mining in Large Multimedia Databases (Betreuer: Thomas Seidl); Sebastian Michel (Universität Saarbrücken & MPI Saarbrücken): Top-k Aggregation Queries in Large-Scale Distributed System (Betreuer: Gerhard Weikum); Jürgen Krämer (Universität Marburg): Continuous Queries over Data Streams Semantics and Implementation (Betreuer: Bernhard Seeger) Die Organisation einer großen Tagung wie der BTW ist nicht ohne zahlreiche Partner und Helfer möglich. Sie sind auf den folgenden Seiten aufgeführt, und ihnen gilt unser herzlicher Dank ebenso wie den Sponsoren der Tagung und der GI-Geschäftsstelle. Berlin, Erlangen, Dresden, Münster, im Januar 2009 Johann-Christoph Freytag, Vorsitzender des Programmkomitees Thomas Ruf, Vorsitzender des Industriekomitees Wolfgang Lehner, Vorsitzender des Demokomitees Gottfried Vossen, Tagungsleitung II Tagungsleitung: Gottfried Vossen, Univ. Münster Programmkomiteeleitung: Johann-Christoph Freytag, Humboldt-Univ. zu Berlin Programmkomitee: Hans-Jürgen Appelrath, Univ. Oldenburg Christian Böhm, LMU München Stefan Conrad, Univ. Düsseldorf Stefan Dessloch, Univ. Kaiserslautern Jens Dittrich, ETH Zürich Silke Eckstein, Univ. Braunschweig Burkhard Freitag, Univ. Passau Torsten Grust, TU München Theo Härder, Univ. Kaiserslautern Andreas Henrich, Univ. Bamberg Melanie Herschel, IBM Almaden Carl Christian Kanne, Univ. Mannheim Meike Klettke, Univ. Rostock Birgitta König-Ries, Univ. Jena Klaus Küspert, Univ. Jena Jens Lechtenbörger, Univ. Münster Wolfgang Lehner, TU Dresden Ulf Leser, HU Berlin Volker Linnemann, Univ. Lübeck Thomas Mandl, Univ. Hildesheim Stefan Manegold, CWI Amsterdam Volker Markl, TU Berlin Wolfgang May, Univ. Göttingen Klaus Meyer-Wegener, Univ. Erlangen Heiko Müller, Edinburgh Felix Naumann, HPI Potsdam Thomas Neumann ,MPI Saarbrücken Daniela Nicklas, Univ. Oldenburg Peter Peinl, FH Fulda Erhard Rahm, Univ. Leipzig Manfred Reichert, Univ. Ulm Norbert Ritter, Univ. Hamburg Gunter Saake, Univ. Madgeburg Kai-Uwe Sattler, TU Ilmenau III Eike Schallehn, Univ. Magdeburg Ralf Schenkel, MPI Saarbrücken R. Ingo Schmitt, TU Cottbus Harald Schöning, Software AG Holger Schwarz, Univ. Stuttgart Bernhard Seeger, Univ. Marburg Thomas Seidl, RWTH Aachen Günther Specht, Univ. Innsbruck Myra Spiliopoulou, Univ. Magdeburg Knuth Stolze, IBM Böblingen Uta Störl, Hochschule Darmstadt Jens Teubner, ETH Zürich Can Türker, ETH Zürich Klaus Turowski, Univ. Augsburg Agnes Voisard, Fraunhofer Berlin Mechtild Wallrath, BA Karlsruhe Mathias Weske, HPI Potsdam Christa Womser-Hacker, Univ. Hildesheim Industriekomitee: Bärbel Bohr, UBS AG Götz Graefe, Hewlett Packard Christian König, Microsoft Research Albert Maier, IBM Research Thomas Ruf, GfK Retail and Technology GmbH, (Vorsitz) Carsten Sapia, BMW AG Stefan Sigg, SAP AG Studierendenprogramm: Hagen Höpfner, International University, Bruchsal Tutorienprogramm: Wolfgang Lehner, TU Dresden IV Organisationskomitee: Gottfried Vossen (Leitung) Ralf Farke Till Haselmann Jens Lechtenbörger Joachim Schwieren Jens Sieberg Gunnar Thies Barbara Wicher Gutachter für Dissertationspreise: Stefan Conrad, Univ. Düsseldorf Johann-Christoph Freytag, HU Berlin, (Vorsitz) Theo Härder, Univ. Kaiserslautern Alfons Kemper, TU München Donald Kossmann, ETH Zürich Georg Lausen, Univ. Freiburg Udo Lipeck, Univ. Hannover Bernhard Seeger, Univ. Marburg Gottfried Vossen, Univ. Münster Gerhard Weikum, MPI Saarbrücken Externe Gutachter: Sadet Alcic, Univ. Düsseldorf Christian Beecks, RWTH Aachen Stefan Bensch, Univ. Augsburg Lukas Blunschi, ETH Zurich Dietrich Boles, Univ. Oldenburg Andr Bolles, Univ. Oldenburg Stefan Brüggemann, OFFIS, Oldenburg Stephan Ewen, TU Berlin Frank Fiedler, LMU München Marco Grawunder, Univ. Oldenburg Fabian Grüning, Univ. Oldenburg Stephan Günnemann, RWTH Aachen Michael Hartung, Univ. Leipzig Wilko Heuten, OFFIS, Oldenburg Marc Holze, Univ. Hamburg Fabian Hueske, TU Berlin Jonas Jacobi, Univ. Oldenburg Thomas Kabisch, TU Berlin V Andreas Kaiser, Univ. Passau Toralf Kirsten, Univ. Leipzig Kathleen Krebs, Univ. Hamburg Hardy Kremer, RWTH Aachen Annahita Oswald, LMU München Fabian Panse, Univ. Hamburg Philip Prange, Univ. Marburg Michael von Riegen, Uni Hamburg Karsten Schmidt, Univ. Kaiserslautern Joachim Selke, TU Braunschweig Sonny Vaupel, Univ. Marburg Gottfried Vossen, Univ. Münster Bianca Wackersreuther, LMU München Andreas Weiner, Univ. Kaiserslautern VI Inhaltsverzeichnis Eingeladene Beiträge Ricardo Baeza-Yates (Yahoo!Research Barcelona): Towards a Distributed Search Engine 2 Juliana Freire (University of Utah, USA): Provenance Management: Challenges and Opportunities 4 Sergey Melnik (Google Inc.): The Frontiers of Data Programmability 5 Wissenschaftliches Programm Anfrageverarbeitung Th. Neumann (MPI Saarbrücken), G. Moerkotte (Uni Mannheim): A Framework for Reasoning about Share Equivalence and Its Integration into a Plan Generator 7 G. Graefe (HP Labs), R. Stonecipher (Microsoft): Efficient Verification of B-tree Integrity 27 M. Heimel (IBM Germany), V. Markl (TU Berlin), K. Murthy (IBM San Jose): A Bayesian Approach to Estimating the Selectivity of Conjunctive Predicates 47 Ch. Böhm, R. Noll (LMU München), C. Plant, A. Zherdin (TU München): Indexsupported Similarity Join on Graphics Processors 57 Integration M. Böhm (HTW Dresden), D. Habich, W. Lehner (TU Dresden), U. Wloka (HTW Dresden): Systemübergreifende Kostennormalisierung für Integrationsprozesse 67 S. Mir (EML Heidelberg), St. Staab (Uni Koblenz), I. Rojas (EML Heidelberg): Web-Prospector – An Automatic, Site-Wide Wrapper Induction Approach for Scientific Deep-Web Databases 87 Th. Mandl (Uni Hildesheim): Easy Tasks Dominate Information Retrieval Evaluation Results VII 107 Anfragesprachen M. Rosenmüller, Ch. Kästner, N. Siegmund, S. Sunkle (Uni Magdeburg), S. Apel (Uni Passau), Th. Leich (METOP GmbH), G. Saake (Uni Magdeburg): SQL á la Carte - Toward Tailor-made Data Management 117 I. Schmitt, D. Zellhöfer (TU Cottbus): Lernen nutzerspezifischer Gewichte innerhalb einer logikbasierten Anfragesprache 137 K. Stolze (IBM Germany R&D), V. Raman, R. Sidle (IBM ARC), O. Draese (IBM Germany R&D): Bringing BLINK Closer to the Full Power of SQL 157 Speicherung und Indizierung Th. Härder, K. Schmidt, Y. Ou, S. Bächle (Uni Kaiserslautern): Towards Flash Disk Use in Databases – Keeping Performance While Saving Energy? 167 I. Assent (Aalborg Univ., Dänemark), St. Günnemann, H. Kremer, Th. Seidl (RWTH Aachen): High-Dimensional Indexing for Multimedia Features 187 Ch. Beecks, M. Wichterich, Th. Seidl (RWTH Aachen): Metrische Anpassung der Earth Mover's Distanz zur Ähnlichkeitssuche in Multimedia-Datenbanken 207 Neue Anwendungen S. Schulze, M. Pukall, G. Saake, T. Hoppe, J. Dittmann (Uni Magdeburg): On the Need of Data Management in Automotive Systems 217 F. Irmert, Ch. Neumann, M. Daum, N. Pollner, K. Meyer-Wegener (Uni Erlangen): Technische Grundlagen für eine laufzeitadaptierbare Transaktionsverwaltung 227 D. Aumüller (Uni Leipzig): Towards web supported identification of top affiliations from scholarly papers 237 S. Tönnies, B. Köhncke (L3S Hannover), O. Köpler (Uni Hannover), W.-T. Balke (L3S Hannover): Building Chemical Information Systems – the ViFaChem II Project 247 Metadaten J. Goeres, Th. Jörg, B. Stumm, St. Dessloch (Uni Kaiserslautern): GEM: A Generic Visualization and Editing Facility for Heterogeneous Metadata VIII 257 A. Thor, M. Hartung, A. Gross, T. Kirsten, E. Rahm (Uni Leipzig): An Evolutionbased Approach for Assessing Ontology Mappings - A Case Study in the Life Sciences 277 Ch. Böhm (LMU München), L. Läer, C. Plant, A. Zherdin (TU München): Model-based Classification of Data with Time Series-valued Attributes 287 N. Siegmund, Ch. Kästner, M. Rosenmüller (Uni Magdeburg), F. Heidenreich (TU Dresden), S. Apel (Uni Passau), G. Saake (Uni Magdeburg): Bridging the Gap between Variability in Client Application and Database Schema 297 Data Warehousing und Caching M. Thiele, A. Bader, W. Lehner (TU Dresden): Multi-Objective Scheduling for Real-Time Data Warehouses 307 Th. Jörg, St. Dessloch (Uni Kaiserslautern): Formalizing ETL Jobs for Incremental Loading of Data Warehouses 327 J. Klein, S. Braun, G. Machado (Uni Kaiserslautern): Selektives Laden und Entladen von Prädikatsextensionen beim Constraint-basierten DatenbankCaching 347 Datenströme C. Franke (UC Davis), M. Karnstedt, D. Klan (TU Ilmenau), M. Gertz (Uni Heidelberg), K.-U. Sattler (TU Ilmenau), W. Kattanek (IMMS GmbH): In-Network Detection of Anomaly Regions in Sensor Networks with Obstacles 367 J. Jacobi, A. Bolles, M. Grawunder, D. Nicklas, H.-J. Appelrath (Uni Oldenburg): Priorisierte Verarbeitung von Datenstromelementen 387 St. Preißler, H. Voigt, D. Habich, W. Lehner (TU Dresden): Stream-Based Web Service Invocation 407 Dissertationspreise S. Michel (Uni Saarbrücken & MPI Saarbrücken): Top‐k Aggegation Queries in Large‐Scale Distributed Systems 418 I. Assent (RWTH Aachen): Efficient Adaptive Retrieval and Mining in Large Multimedia Databases 428 IX J. Krämer (Uni Marburg): Continuous Queries over Data Streams ‐ Semantics and lmplementation 438 Industrieprogramm Business Intelligence M. Oberhofer, E. Nijkamp (IBM Böblingen): Embedded Analytics in Front Office Applications 449 U. Christ (SAP Walldorf): An Architecture for Integrated Operational Business Intelligence 460 A. Lang, M. Ortiz, St. Abraham (IBM Böblingen): Enhancing Business Intelligence with Unstructured Data 469 Optimierungstechniken Ch. Lemke (SAP Walldorf), K.-U. Sattler (TU Ilmenau), F. Färber (SAP Walldorf): Kompressionstechniken für spaltenorientierte BI-AcceleratorLösungen 486 M. Fiedler, J. Albrecht, Th. Ruf, J. Görlich, M. Lemm (GfK Nürnberg): Pre-Caching hochdimensionaler Aggregate mit relationaler Technologie 498 H. Loeser (IBM Böblingen), M. Nicola, J. Fitzgerald (IBM San Jose): Index Challenges in Native XML Database Systems 508 Neue Technologien St. Buchwald, Th. Bauer (Daimler AG Ulm), R. Pryss (Uni Ulm): ITInfrastrukturen für flexible, service-orientierte Anwendungen - ein Rahmenwerk zur Bewertung 526 St. Aulbach (TU München), D. Jacobs, J. Primsch (SAP Walldorf), A. Kemper (TU München): Anforderungen an Datenbanksysteme für Multi-Tenancy- und Software-as-a-Service-Applikationen 544 U. Hohenstein, M. Jäger (Siemens München): Die Migration von Hibernate nach OpenJPA: Ein Erfahrungsbericht 556 X Demo-Programm D. Aumüller (Uni Leipzig): Retrieving Metadata for Your Local Scholarly Papers 577 K. Benecke, M. Schnabel (Uni Magdeburg): OttoQL 580 A. Behrend, Ch. Dorau, R. Manthey (Uni Bonn): TinTO: A Tool for View-Based Analysis of Stock Market Data Streams 584 A. Brodt, N. Cipriani (Uni Stuttgart): NexusWeb – eine kontextbasierte Webanwendung im World Wide Space 588 D. Fesenmeyer, T. Rafreider, J. Wäsch (HTWG Konstanz): Ein Tool-Set zur Datenbank-Analyse und –Normalisierung 592 B. Jäksch, R. Lembke, B. Stortz, St. Haas, A. Gerstmair, F. Färber (SAP Walldorf): Guided Navigation basierend auf SAP Netweaver BIA 596 F. Gropengießer, K. Hose, K.-U. Sattler (TU Ilmenau): Ein kooperativer XMLEditor für Workgroups 600 H. Höpfner, J. Schad, S. Wendland, E. Mansour (IU Bruchsal): MyMIDP and MyMIDP-Client: Direct Access to MySQL Databases from Cell Phones 604 St. Preißler, H. Voigt, D. Habich, W. Lehner (TU Dresden): Streaming Web Services and Standing Processes 608 St. Scherzinger, H. Karn, T. Steinbach (IBM Böblingen): End-to-End Performance Monitoring of Databases in Distributed Environments 612 A. M. Weiner, Ch. Mathis, Th. Härder, C. R. F. Hoppen (Uni Kaiserslautern): Now it’s Obvious to The Eye – Visually Explaining XQuery Evaluation in a Native XML Database Management System 616 D. Wiese, G. Rabinovitch, M. Reichert, St. Arenswald (Uni Jena / IBM Böblingen): ATE: Workload-Oriented DB2 Tuning in Action 620 E. Nijkamp, M. Oberhofer, A. Maier (IBM Böblingen): Value Demonstration of Embedded Analytics for Front Office Applications 624 Martin Oberhofer, Albert Maier (IBM Böblingen): Support 2.0: An Optimized Product Support System Exploiting Master Data, Data Warehousing and Web 2.0 Technologies 628 XI DBTT-Tutorial Dean Jacobs (SAP AG): Software as a Service: Do It Yourself or Use the Cloud XII 633