XML und Datenbanken Wintersemester 2003/2004 Vorlesung: Dienstag, 13:15-15:00 Uhr IFW A36 Übung: Dienstag, 15:15-16:00 Uhr IFW A36 Dozenten: Dr. Can Türker IFW C47.2 Email: [email protected] WWW: http://www.dbs.ethz.ch/~xml Vorlesungsinhalt Der W3C-Standard XML hat sich als Dokumentformat für den Austausch von Daten über das Internet etabliert. Zunehmend werden jedoch Systeme benötigt, die XMLDokumente effizient speichern, abfragen und verarbeiten können. Mit anderen Worten wird immer mehr Datenbankfunktionalität für die Verarbeitung von XML-Dokumenten gefordert. Zielsetzung dieser Vorlesung ist es daher, Grundkenntnisse für den deklarativen Zugriff auf XML-Dokumente sowie effiziente Speicherungstechniken für XML-Daten zu vermitteln. Im einzelnen diskutiert die Vorlesung semistrukturierte Datenmodelle, Algebren und Anfragesprachen für den deklarativen Zugriff auf XML (XPath, XQuery u.a.) und Abbildungen zwischen XML und konventionellen Datenmodellen. Weiterhin werden effiziente Speicherungsstrukturen für XML, Indexstrukturen für Information Retrieval auf XML, Transaktionsverwaltung für XMLRepositories sowie die Informationsintegration mittels semistrukturierter Datenmodelle behandelt. Ein wichtiger Aspekt dieser Vorlesung ist es, die vorgestellten Konzepte in Bezug zu setzen zu kommerziellen, XML unterstützenden Datenbanksystemen wie etwa IBM DB2, Oracle, Microsoft SQL Server und SAG Tamino. Vorlesung "XML und Datenbanken" - WS 2003/2004 (Dr. C. Türker) 0-2 Vorlesungsübersicht 1. Einleitung und Motivation 2. XML und verwandte Standards 3. Anfragealgebren und XML-Anfragensprachen (UnQL, XPath, XQuery, XIRQL) 4. Mapping zwischen XML und Datenbanken 5. Anfrageoptimierung und Indexstrukturen 6. Information Retrieval auf XML-Dokumenten 7. Updates auf XML-Dokumenten und Transaktionsverwaltung 8. Informationsintegration mit XML 9. Datenbanksysteme mit XML-Support (DB2, Oracle, MSSQL) 10. Reine XML-Datenbanksysteme (Tamino, Excelon, Poet) 11. Zusammenfassung/Ausblick/Diskussion Vorlesung "XML und Datenbanken" - WS 2003/2004 (Dr. C. Türker) 0-3 Übungen z Ziele: – – z Vertiefen des Vorlesungsstoffes Vermitteln von praktischen Kenntnissen zum Arbeiten mit XML-Dokumenten Übungsblätter – – – werden in der Vorlesung ausgeteilt sind bis zur nächsten Übung zu bearbeiten enthalten auch praktische Aufgaben Vorlesung "XML und Datenbanken" - WS 2003/2004 (Dr. C. Türker) 0-4 Informationen zur Vorlesung im WWW Sie finden nützliche Informationen zur Vorlesung auch auf dem World-Wide-Web. Unter http://www.dbs.ethz.ch/~xml/ gibt es Links und Demos zu den verschiedenen Themen der Vorlesung. Für verschiedene Kapitel der Vorlesung „XML und Datenbanken" kann es nützlich sein, die Unterlagen zu früheren Vorlesungen "Informationssysteme Kernfach" (IS-K) zu studieren. Diese finden Sie unter http://www.dbs.ethz.ch/~isk/ Sie finden den Stoff auch in entsprechenden Lehrbüchern der Lehrbuchsammlung in der Informatik-Bibliothek. Vorlesung "XML und Datenbanken" - WS 2003/2004 (Dr. C. Türker) 0-5 Prüfungsmodalitäten Modus: schriftliche Prüfung Dauer: 90 Minuten Hilfsmittel: keine erlaubt! Vorlesung "XML und Datenbanken" - WS 2003/2004 (Dr. C. Türker) 0-6 Literaturhinweise z M. Klettke, H. Meyer: XML und Datenbanken. dpunkt Verlag, 2002 z H. Schöning: XML und Datenbanken - Konzepte und Systeme. Carl Hanser Verlag, 2002 z E. Rahm, G. Vossen: Web & Datenbanken. Konzepte, Architekturen, Anwendungen. dpunkt, 2003 z C. Türker: SQL:1999 & SQL:2003 - Objektrelationales SQL, SQLJ & SQL/XML, dpunkt Verlag, 2003 z A. B. Chaudhri, A. Rashid, R. Zicari: XML Data Management: Native XML and XMLEnabled Database Systems, Addison-Wesley, 2003 z B. Daum, U. Merten: System Architecture with XML. Morgan Kaufmann, 2003 z W. Kazakos, A. Schmidt, P. Tomczyk: Datenbanken und XML. Springer-Verlag, 2002 z S. Abiteboul, P. Buneman, D. Suciu: Data on the Web: From Relations to Semistructured Data and XML. Morgan Kaufmann, 1999 Vorlesung "XML und Datenbanken" - WS 2003/2004 (Dr. C. Türker) 0-7 WWW-Referenzen z Homepages – – z XML und verwandte Standards: http://www.w3.org SQL:1999: http://www.techstreet.com/features/ISO_IEC_9075.html Systeme – Oracle: – DB2: – MSSQL: – Tamino: – Excelon: http://www.oracle.com/ http://www-3.ibm.com/software/data/db2/ http://www.microsoft.com/sql http://www.softwareag.com/tamino/ http://www.exln.com/ Vorlesung "XML und Datenbanken" - WS 2003/2004 (Dr. C. Türker) 0-8 Ankündigung In Koordination mit dieser Vorlesung führt IBM in der Woche 9.-11.02.2004 einen DB2Zertifizierungskurs an der ETH Zürich durch. Diesmal mit den Zertifizierungsmöglichkeiten "DB2 Fundamentals" und "DB2 Application Developers". Der Kurs behandelt die Inhalte des "DB2 Application Developers"-Zertifikats. Die Inhalte des "DB2 Fundamentals"-Zertifikats sind selbstständig zu erarbeiten. Eine CD mit entsprechenden Unterlagen wird zu Beginn der Vorlesung verteilt bzw. kann jederzeit ausgeliehen werden. Dieser Kurs findet im Rahmen des „IBM Data Management Scholars Project“ statt, dem die Datenbankgruppe der ETH Zürich als einer von zehn ausgewählten Uni-Partnern angehört. Kursteilnahme ist daher kostenlos für alle ETH-Angehörige und Zuhörer dieser Vorlesung. Genauer Schedule und Anmeldeformalitäten werden noch bekannt gegeben. Für allgemeine Informationen über die DB2-Zertifizierung verweisen wir auf http://www-3.ibm.com/software/data/education/cert/. Kommentar: Tolle Sache! Teilnahme wird sehr empfohlen! Kleiner Hinweis am Rande: Letztes Jahr hatten wir das beste Ergebnis unter allen Gruppen, die im Rahmen des Scholarship-Programms an den Zertifizierungen teilgenommen haben. Wir stehen also in der Pflicht! Vorlesung "XML und Datenbanken" - WS 2003/2004 (Dr. C. Türker) 0-9