Datenbanksysteme in Business, Technologie und Web (BTW)

Werbung
Johann-Christoph Freytag, Thomas Ruf,
Wolfgang Lehner, Gottfried Vossen (Hrsg.)
Datenbanksysteme in
Business, Technologie und Web
(BTW)
13. Fachtagung des GI-Fachbereichs
„Datenbanken und Informationssysteme“ (DBIS)
2.-6. März 2009
in Münster, Germany
Gesellschaft für Informatik e.V. (GI)
Lecture Notes in Informatics (LNI) - Proceedings
Series of the Gesellschaft für Informatik (GI)
Volume P-144
ISBN 978-3-88579-238-3
ISSN 1617-5468
Volume Editors
Prof. Johann-Christoph Freytag, Ph.D.
Institut für Informatik
Humboldt-Universität zu Berlin, 10099 Berlin, Germany
E-Mail: [email protected]
Prof. Dr. Thomas Ruf
GfK Retail and Technology GmbH, 90319 Nürnberg, Germany
E-Mail: [email protected]
Prof. Dr. Wolfgang Lehner
Department of Computer Science
Technische Universität Dresden, 01187 Dresden, Germany
E-Mail: [email protected]
Prof. Dr. Gottfried Vossen
Institut für Wirtschaftsinformatik
Universität Münster, 48149 Münster, Germany
E-Mail: [email protected]
Series Editorial Board
Heinrich C. Mayr, Universität Klagenfurt (Chairman)
Jörg Becker, Universität Münster
Hinrich Bonin, Leuphana-Universität Lüneburg
Dieter Fellner, Technische Universität Darmstadt
Ulrich Flegel, SAP
Johann-Christoph Freytag, Humboldt-Universität zu Berlin
Ulrich Furbach, Universität Koblenz
Michael Koch, Universität der Bundeswehr München
Axel Lehmann, Universität der Bundeswehr, München
Peter Liggesmeyer, Universität Kaiserslautern
Ernst W. Mayr, Technische Universität München
Heinrich Müller, Universität Dortmund
Sigrid Schubert, Universität Siegen
Martin Warnke, Leuphana-Universität Lüneburg
Dissertations
Dorothea Wagner, Universität Karlsruhe, Germany
Seminars
Reinhard Wilhelm, Universität des Saarlandes, Germany
Thematics
Andreas Oberweis, Universität Karlsruhe (TH)
© Gesellschaft für Informatik, Bonn 2009
printed by Köllen Druck+Verlag GmbH, Bonn
Vorwort
Alle zwei Jahre findet die BTW-Konferenz der Gesellschaft für Informatik (GI) als die
nationale Datenbankkonferenz an einem ausgezeichneten Ort in Deutschland statt. So ist
die Westfälischen-Wilhelms Universität in Münster vom 4. bis 6. März 2009 Gastgeberin die 13. BTW-Konferenz. Münster mit seiner mehr als 1200-jährigen Geschichte im
Zentrum Westfalens gilt vielen als Ort der Tradition und der Kultur; hier wurde 1648 der
Westfälische Frieden geschlossen, der das Ende des 30-jährigen Krieges in Europa
markierte. Heute sind die Stadt, traditionell Sitz von Bildungs- und Verwaltungseinrichtungen sowie Finanzdienstleistern, und das umliegende Münsterland eine Region mit
wachsender Wirtschafts- und Innovationskraft, die sie zum großen Teil der hiesigen
Universität und ihren angegliederten Instituten verdankt.
Die BTW-Tagung ist seit über 20 Jahren das zentrale Forum der deutschsprachigen
Datenbankgemeinde, die zahlen- und publikationsmäßig zu einer der stärksten weltweit
gehört. Auf dieser Tagung treffen sich alle zwei Jahre nicht nur Wissenschaftler, sondern
auch Praktiker und Anwender. Die Tradition der BTW hat ihren Anfang in der ersten
Tagung 1985 in Karlsruhe zu einer Zeit, in der sich Datenbanksysteme von den klassischen betrieblichen Einsatzfeldern zu Anwendungen in Büro, Technik und Wissenschaft
entwickelten, daher der ursprüngliche Name BTW.
Heute ist Datenbanktechnologie der wichtigste Stützpfeiler der IT-Branche generell; sie
ist unverzichtbar für organisationsübergreifende Kooperationen und elektronische
Prozesse, als Infrastruktur in der Telekommunikation und anderen eingebetteten Technologien, als skalierbares Rückgrat digitaler Bibliotheken, vieler Data-Mining-Werkzeuge
sowie für viele Arten von Web-Anwendungen und der Realisierung service-orientierter
Architekturen (SOAs).
Im Zeitalter der Informationsexplosion, Virtualisierung und Web-Orientierung kommen
auf die Datenbank- und Informationssystemtechnologie kontinuierlich neue Herausforderungen zu. Diese spiegeln sich in Themen wie Informationsintegration aus heterogenen, verteilten Datenquellen mit verschiedenen Medien und variierendem Strukturierungsgrad, internetweites, kollaboratives Informationsmanagement, Grid/CloudComputing und E-Science-Kollaborationen oder der Gestaltung der Vision eines
"Semantic Web" wider. Hinzu kommen Fragen aus den Bereichen der Datenqualität, der
Datenstromverarbeitung sowie Einbindung von Ontologien und anderen Konzepten des
Web 2.0, um den ständig komplexer werdenden Anforderungen aus verschiedenen
Anwendungsgebieten gerecht zu werden. Im Bereich der Geschäftsprozessmodellierung
und -realisierung müssen prozess- und dienstorientierte Architekturen weiterentwickelt
und ihre Anforderungen auf Datenbank- und Informationssysteme hin formuliert
werden.
In seiner Struktur hält sich die diesjährige BTW-Tagung an ihre Tradition. Sie umfasst
auch diesmal ein wissenschaftliches Programm, ein Industrieprogramm und ein
Demonstrationsprogramm. Am Rande der Tagung finden zusätzlich verschiedene Workshops, Tutorien im Rahmen der Datenbank-Tutorientage sowie ein StudierendenproI
gramm statt. Für das wissenschaftliche Programm wurden Beiträge über die Weiterentwicklung der Datenbanktechnologie, ihrer Grundlagen und ihrer Wechselwirkungen mit
benachbarten Gebieten sowie ihrer Anwendungen ausgewählt. Beiträge über den kommerziellen Einsatz von Datenbanktechnologie, Erfahrungen und aktuelle Industrietrends
wurden für das Industrieprogramm zusammengestellt. Wie bei den bisherigen BTWTagungen waren sowohl Langbeiträge (Original- oder Übersichtsarbeiten) als auch
Kurzbeiträge (über neuere Projekte oder erste Zwischenergebnisse laufender Forschungsarbeiten) erwünscht. Im wissenschaftlichen Bereich werden die Themen
Anfragesprachen und Anfragebearbeitung, Datenintegration und Metadaten, Data
Warehousing und Caching, Datenströme sowie Neue Anwendungen adressiert. Das
Industrieprogramm behandelt die Bereiche Neue Technologien für Datenbanken,
Optimierungstechniken für Datenbankanfragen sowie Business Intelligence.
Zusätzlich umfasst die BTW drei eingeladene Vorträge:
•
•
•
Ricardo Baeza-Yates (Yahoo!Research Barcelona) entwirft in seinem Vortrag
„Towards a Distributed Search Engine“ seine Vision zur Weiterentwicklung
von Suchmaschinen.
Juliana Freire (University of Utah, USA) untersucht in ihrer Keynote
“Provenance Management: Challenges and Opportunities” das immer wichtiger
werdende Feld der Protokollierung von Daten-Herkunft.
Sergey Melnik (Google Inc.) stellt als BTW-Dissertationspreisgewinner 2003 in
seinem Vortrag “The Frontiers of Data Programmability” seine neuesten Forschungsarbeiten bei Google vor.
Nach guter Tradition werden im Rahmen der BTW auch drei Preise für hervorragende
Dissertationen im Datenbankbereich vergeben:
•
•
•
Ira Assent (RWTH Aachen): Efficient Adaptive Retrieval and Mining in Large
Multimedia Databases (Betreuer: Thomas Seidl);
Sebastian Michel (Universität Saarbrücken & MPI Saarbrücken): Top-k
Aggregation Queries in Large-Scale Distributed System (Betreuer: Gerhard
Weikum);
Jürgen Krämer (Universität Marburg): Continuous Queries over Data Streams Semantics and Implementation (Betreuer: Bernhard Seeger)
Die Organisation einer großen Tagung wie der BTW ist nicht ohne zahlreiche Partner
und Helfer möglich. Sie sind auf den folgenden Seiten aufgeführt, und ihnen gilt unser
herzlicher Dank ebenso wie den Sponsoren der Tagung und der GI-Geschäftsstelle.
Berlin, Erlangen, Dresden, Münster, im Januar 2009
Johann-Christoph Freytag, Vorsitzender des Programmkomitees
Thomas Ruf, Vorsitzender des Industriekomitees
Wolfgang Lehner, Vorsitzender des Demokomitees
Gottfried Vossen, Tagungsleitung
II
Tagungsleitung:
Gottfried Vossen, Univ. Münster
Programmkomiteeleitung:
Johann-Christoph Freytag, Humboldt-Univ. zu Berlin
Programmkomitee:
Hans-Jürgen Appelrath, Univ. Oldenburg
Christian Böhm, LMU München
Stefan Conrad, Univ. Düsseldorf
Stefan Dessloch, Univ. Kaiserslautern
Jens Dittrich, ETH Zürich
Silke Eckstein, Univ. Braunschweig
Burkhard Freitag, Univ. Passau
Torsten Grust, TU München
Theo Härder, Univ. Kaiserslautern
Andreas Henrich, Univ. Bamberg
Melanie Herschel, IBM Almaden
Carl Christian Kanne, Univ. Mannheim
Meike Klettke, Univ. Rostock
Birgitta König-Ries, Univ. Jena
Klaus Küspert, Univ. Jena
Jens Lechtenbörger, Univ. Münster
Wolfgang Lehner, TU Dresden
Ulf Leser, HU Berlin
Volker Linnemann, Univ. Lübeck
Thomas Mandl, Univ. Hildesheim
Stefan Manegold, CWI Amsterdam
Volker Markl, TU Berlin
Wolfgang May, Univ. Göttingen
Klaus Meyer-Wegener, Univ. Erlangen
Heiko Müller, Edinburgh
Felix Naumann, HPI Potsdam
Thomas Neumann ,MPI Saarbrücken
Daniela Nicklas, Univ. Oldenburg
Peter Peinl, FH Fulda
Erhard Rahm, Univ. Leipzig
Manfred Reichert, Univ. Ulm
Norbert Ritter, Univ. Hamburg
Gunter Saake, Univ. Madgeburg
Kai-Uwe Sattler, TU Ilmenau
III
Eike Schallehn, Univ. Magdeburg
Ralf Schenkel, MPI Saarbrücken
R. Ingo Schmitt, TU Cottbus
Harald Schöning, Software AG
Holger Schwarz, Univ. Stuttgart
Bernhard Seeger, Univ. Marburg
Thomas Seidl, RWTH Aachen
Günther Specht, Univ. Innsbruck
Myra Spiliopoulou, Univ. Magdeburg
Knuth Stolze, IBM Böblingen
Uta Störl, Hochschule Darmstadt
Jens Teubner, ETH Zürich
Can Türker, ETH Zürich
Klaus Turowski, Univ. Augsburg
Agnes Voisard, Fraunhofer Berlin
Mechtild Wallrath, BA Karlsruhe
Mathias Weske, HPI Potsdam
Christa Womser-Hacker, Univ. Hildesheim
Industriekomitee:
Bärbel Bohr, UBS AG
Götz Graefe, Hewlett Packard
Christian König, Microsoft Research
Albert Maier, IBM Research
Thomas Ruf, GfK Retail and Technology GmbH, (Vorsitz)
Carsten Sapia, BMW AG
Stefan Sigg, SAP AG
Studierendenprogramm:
Hagen Höpfner, International University, Bruchsal
Tutorienprogramm:
Wolfgang Lehner, TU Dresden
IV
Organisationskomitee:
Gottfried Vossen (Leitung)
Ralf Farke
Till Haselmann
Jens Lechtenbörger
Joachim Schwieren
Jens Sieberg
Gunnar Thies
Barbara Wicher
Gutachter für Dissertationspreise:
Stefan Conrad, Univ. Düsseldorf
Johann-Christoph Freytag, HU Berlin, (Vorsitz)
Theo Härder, Univ. Kaiserslautern
Alfons Kemper, TU München
Donald Kossmann, ETH Zürich
Georg Lausen, Univ. Freiburg
Udo Lipeck, Univ. Hannover
Bernhard Seeger, Univ. Marburg
Gottfried Vossen, Univ. Münster
Gerhard Weikum, MPI Saarbrücken
Externe Gutachter:
Sadet Alcic, Univ. Düsseldorf
Christian Beecks, RWTH Aachen
Stefan Bensch, Univ. Augsburg
Lukas Blunschi, ETH Zurich
Dietrich Boles, Univ. Oldenburg
Andr Bolles, Univ. Oldenburg
Stefan Brüggemann, OFFIS, Oldenburg
Stephan Ewen, TU Berlin
Frank Fiedler, LMU München
Marco Grawunder, Univ. Oldenburg
Fabian Grüning, Univ. Oldenburg
Stephan Günnemann, RWTH Aachen
Michael Hartung, Univ. Leipzig
Wilko Heuten, OFFIS, Oldenburg
Marc Holze, Univ. Hamburg
Fabian Hueske, TU Berlin
Jonas Jacobi, Univ. Oldenburg
Thomas Kabisch, TU Berlin
V
Andreas Kaiser, Univ. Passau
Toralf Kirsten, Univ. Leipzig
Kathleen Krebs, Univ. Hamburg
Hardy Kremer, RWTH Aachen
Annahita Oswald, LMU München
Fabian Panse, Univ. Hamburg
Philip Prange, Univ. Marburg
Michael von Riegen, Uni Hamburg
Karsten Schmidt, Univ. Kaiserslautern
Joachim Selke, TU Braunschweig
Sonny Vaupel, Univ. Marburg
Gottfried Vossen, Univ. Münster
Bianca Wackersreuther, LMU München
Andreas Weiner, Univ. Kaiserslautern
VI
Inhaltsverzeichnis
Eingeladene Beiträge
Ricardo Baeza-Yates (Yahoo!Research Barcelona): Towards a Distributed
Search Engine
2
Juliana Freire (University of Utah, USA): Provenance Management: Challenges
and Opportunities
4
Sergey Melnik (Google Inc.): The Frontiers of Data Programmability
5
Wissenschaftliches Programm
Anfrageverarbeitung
Th. Neumann (MPI Saarbrücken), G. Moerkotte (Uni Mannheim): A Framework
for Reasoning about Share Equivalence and Its Integration into a Plan
Generator
7
G. Graefe (HP Labs), R. Stonecipher (Microsoft): Efficient Verification of B-tree
Integrity
27
M. Heimel (IBM Germany), V. Markl (TU Berlin), K. Murthy (IBM San Jose): A
Bayesian Approach to Estimating the Selectivity of Conjunctive Predicates
47
Ch. Böhm, R. Noll (LMU München), C. Plant, A. Zherdin (TU München): Indexsupported Similarity Join on Graphics Processors
57
Integration
M. Böhm (HTW Dresden), D. Habich, W. Lehner (TU Dresden), U. Wloka
(HTW Dresden): Systemübergreifende Kostennormalisierung für Integrationsprozesse
67
S. Mir (EML Heidelberg), St. Staab (Uni Koblenz), I. Rojas (EML Heidelberg):
Web-Prospector – An Automatic, Site-Wide Wrapper Induction Approach for
Scientific Deep-Web Databases
87
Th. Mandl (Uni Hildesheim): Easy Tasks Dominate Information Retrieval
Evaluation Results
VII
107
Anfragesprachen
M. Rosenmüller, Ch. Kästner, N. Siegmund, S. Sunkle (Uni Magdeburg), S. Apel
(Uni Passau), Th. Leich (METOP GmbH), G. Saake (Uni Magdeburg): SQL á la
Carte - Toward Tailor-made Data Management
117
I. Schmitt, D. Zellhöfer (TU Cottbus): Lernen nutzerspezifischer Gewichte
innerhalb einer logikbasierten Anfragesprache
137
K. Stolze (IBM Germany R&D), V. Raman, R. Sidle (IBM ARC), O. Draese
(IBM Germany R&D): Bringing BLINK Closer to the Full Power of SQL
157
Speicherung und Indizierung
Th. Härder, K. Schmidt, Y. Ou, S. Bächle (Uni Kaiserslautern): Towards Flash
Disk Use in Databases – Keeping Performance While Saving Energy?
167
I. Assent (Aalborg Univ., Dänemark), St. Günnemann, H. Kremer, Th. Seidl
(RWTH Aachen): High-Dimensional Indexing for Multimedia Features
187
Ch. Beecks, M. Wichterich, Th. Seidl (RWTH Aachen): Metrische Anpassung
der Earth Mover's Distanz zur Ähnlichkeitssuche in Multimedia-Datenbanken
207
Neue Anwendungen
S. Schulze, M. Pukall, G. Saake, T. Hoppe, J. Dittmann (Uni Magdeburg): On the
Need of Data Management in Automotive Systems
217
F. Irmert, Ch. Neumann, M. Daum, N. Pollner, K. Meyer-Wegener (Uni Erlangen): Technische Grundlagen für eine laufzeitadaptierbare Transaktionsverwaltung
227
D. Aumüller (Uni Leipzig): Towards web supported identification of top
affiliations from scholarly papers
237
S. Tönnies, B. Köhncke (L3S Hannover), O. Köpler (Uni Hannover), W.-T.
Balke (L3S Hannover): Building Chemical Information Systems –
the ViFaChem II Project
247
Metadaten
J. Goeres, Th. Jörg, B. Stumm, St. Dessloch (Uni Kaiserslautern):
GEM: A Generic Visualization and Editing Facility for Heterogeneous Metadata
VIII
257
A. Thor, M. Hartung, A. Gross, T. Kirsten, E. Rahm (Uni Leipzig): An Evolutionbased Approach for Assessing Ontology Mappings - A Case Study in the Life
Sciences
277
Ch. Böhm (LMU München), L. Läer, C. Plant, A. Zherdin (TU München):
Model-based Classification of Data with Time Series-valued Attributes
287
N. Siegmund, Ch. Kästner, M. Rosenmüller (Uni Magdeburg), F. Heidenreich
(TU Dresden), S. Apel (Uni Passau), G. Saake (Uni Magdeburg): Bridging the
Gap between Variability in Client Application and Database Schema
297
Data Warehousing und Caching
M. Thiele, A. Bader, W. Lehner (TU Dresden): Multi-Objective Scheduling for
Real-Time Data Warehouses
307
Th. Jörg, St. Dessloch (Uni Kaiserslautern): Formalizing ETL Jobs for
Incremental Loading of Data Warehouses
327
J. Klein, S. Braun, G. Machado (Uni Kaiserslautern): Selektives Laden und
Entladen von Prädikatsextensionen beim Constraint-basierten DatenbankCaching
347
Datenströme
C. Franke (UC Davis), M. Karnstedt, D. Klan (TU Ilmenau), M. Gertz (Uni
Heidelberg), K.-U. Sattler (TU Ilmenau), W. Kattanek (IMMS GmbH):
In-Network Detection of Anomaly Regions in Sensor Networks with Obstacles
367
J. Jacobi, A. Bolles, M. Grawunder, D. Nicklas, H.-J. Appelrath (Uni
Oldenburg): Priorisierte Verarbeitung von Datenstromelementen
387
St. Preißler, H. Voigt, D. Habich, W. Lehner (TU Dresden): Stream-Based Web
Service Invocation
407
Dissertationspreise
S. Michel (Uni Saarbrücken & MPI Saarbrücken): Top‐k Aggegation Queries in
Large‐Scale Distributed Systems
418
I. Assent (RWTH Aachen): Efficient Adaptive Retrieval and Mining in Large
Multimedia Databases
428
IX
J. Krämer (Uni Marburg): Continuous Queries over Data Streams ‐ Semantics
and lmplementation
438
Industrieprogramm
Business Intelligence
M. Oberhofer, E. Nijkamp (IBM Böblingen): Embedded Analytics in Front
Office Applications
449
U. Christ (SAP Walldorf): An Architecture for Integrated Operational Business
Intelligence
460
A. Lang, M. Ortiz, St. Abraham (IBM Böblingen): Enhancing Business
Intelligence with Unstructured Data
469
Optimierungstechniken
Ch. Lemke (SAP Walldorf), K.-U. Sattler (TU Ilmenau), F. Färber (SAP
Walldorf): Kompressionstechniken für spaltenorientierte BI-AcceleratorLösungen
486
M. Fiedler, J. Albrecht, Th. Ruf, J. Görlich, M. Lemm (GfK Nürnberg):
Pre-Caching hochdimensionaler Aggregate mit relationaler Technologie
498
H. Loeser (IBM Böblingen), M. Nicola, J. Fitzgerald (IBM San Jose): Index
Challenges in Native XML Database Systems
508
Neue Technologien
St. Buchwald, Th. Bauer (Daimler AG Ulm), R. Pryss (Uni Ulm): ITInfrastrukturen für flexible, service-orientierte Anwendungen - ein Rahmenwerk
zur Bewertung
526
St. Aulbach (TU München), D. Jacobs, J. Primsch (SAP Walldorf), A. Kemper
(TU München): Anforderungen an Datenbanksysteme für Multi-Tenancy- und
Software-as-a-Service-Applikationen
544
U. Hohenstein, M. Jäger (Siemens München): Die Migration von Hibernate nach
OpenJPA: Ein Erfahrungsbericht
556
X
Demo-Programm
D. Aumüller (Uni Leipzig): Retrieving Metadata for Your Local Scholarly
Papers
577
K. Benecke, M. Schnabel (Uni Magdeburg): OttoQL
580
A. Behrend, Ch. Dorau, R. Manthey (Uni Bonn): TinTO: A Tool for View-Based
Analysis of Stock Market Data Streams
584
A. Brodt, N. Cipriani (Uni Stuttgart): NexusWeb – eine kontextbasierte
Webanwendung im World Wide Space
588
D. Fesenmeyer, T. Rafreider, J. Wäsch (HTWG Konstanz): Ein Tool-Set zur
Datenbank-Analyse und –Normalisierung
592
B. Jäksch, R. Lembke, B. Stortz, St. Haas, A. Gerstmair, F. Färber (SAP
Walldorf): Guided Navigation basierend auf SAP Netweaver BIA
596
F. Gropengießer, K. Hose, K.-U. Sattler (TU Ilmenau): Ein kooperativer XMLEditor für Workgroups
600
H. Höpfner, J. Schad, S. Wendland, E. Mansour (IU Bruchsal): MyMIDP and
MyMIDP-Client: Direct Access to MySQL Databases from Cell Phones
604
St. Preißler, H. Voigt, D. Habich, W. Lehner (TU Dresden): Streaming Web
Services and Standing Processes
608
St. Scherzinger, H. Karn, T. Steinbach (IBM Böblingen): End-to-End
Performance Monitoring of Databases in Distributed Environments
612
A. M. Weiner, Ch. Mathis, Th. Härder, C. R. F. Hoppen (Uni Kaiserslautern):
Now it’s Obvious to The Eye – Visually Explaining XQuery Evaluation in a
Native XML Database Management System
616
D. Wiese, G. Rabinovitch, M. Reichert, St. Arenswald (Uni Jena / IBM
Böblingen): ATE: Workload-Oriented DB2 Tuning in Action
620
E. Nijkamp, M. Oberhofer, A. Maier (IBM Böblingen): Value Demonstration of
Embedded Analytics for Front Office Applications
624
Martin Oberhofer, Albert Maier (IBM Böblingen): Support 2.0: An Optimized
Product Support System Exploiting Master Data, Data Warehousing and Web
2.0 Technologies
628
XI
DBTT-Tutorial
Dean Jacobs (SAP AG): Software as a Service: Do It Yourself or Use the Cloud
XII
633
Herunterladen