FHTW Berlin Datenbanken Prof. Dr. Zschockelt Entwicklungsetappen von DBMS Softwareentwicklungskomponente 1960 hierarchische Mainframe-DB 1970 Theoretische Arbeiten zum relationalen DM (Codd) Basis betrieblicher IKS Tendenzen Non-Standard DBMS 1980 1990 2000 2003 2004 Relationale DBMS SQL-1 ISO/IEC-9075-Norm verabschiedet(1986) Verteilte DBS Unternehmens-DM Client-Server-DBMS SQL-92 ODBC Objektorientierte Data Warehouse DBMS ORDBMS Web-Interface für DBMS XML/Webservices Data Mining Mobile Computing Wissenstechniken Datenströme ergänzen die DB-Technologie OLTP-DBMS dominieren Erste Online-DB Multi-Media-DB DB-basierte WebApplikationen DB werden unternehmensstrategische Kerntechnik FHTW Berlin Datenbanken Prof. Dr. Zschockelt Datenbankstrategie ist unternehmenskritisch Datenbanktechnologie und Web (Architektur, XML, Webservices) Mobile Datenbanken (Architektur, Kommunikationsprofile, lokations-abhängiger Datenzugriff) Wissenstechniken (Data Warehousing, Wissensmanagement) Herausforderungen: Bewältigung der Heterogenität (= Integrationsfähigkeit) Bewältigung wachsender Datenquanten Transformation von Daten in Informationen und Wissen Forschungsschwerpunkte: FHTW Berlin Datenbanken Prof. Dr. Zschockelt Relationale – objektorientierte DBMS Relationale DBMS • Verwalten Tabellen, • dominieren im Unternehmen, • Nutzen SQL als standardisierte Sprachenebene, • sind technologisch ausgereift. Objektorientierte DBMS • Verwalten Objekte, • Lösen spezielle Aufgaben, • standardisierte Sprachenebene (ODL/OQL) noch in Entwicklung, • sind technologisch noch in Entwicklung Objektrelationale DBMS verbinden die Vorteile beider und sind als Erweiterung relationaler DBMS konzipiert. FHTW Berlin Datenbanken Prof. Dr. Zschockelt Verteilte Datenbanksysteme - Definitionen Eine verteilte Datenbank (VDB, englisch DDB) ist eine Sammlung mehrerer semantisch zusammenhängender Datenbanken, welche über ein Computernetzwerk verteilt sind Ein verteiltes Datenbankmanagementsystem (VDBMS, englisch DDBMS) ist ein Softwaresystem, welches eine VDB verwaltet und transparente Verteilung der Daten für die Nutzer übernimmt. Client-Server Server Client Verteiltes Datenbanksystem Knoten FHTW Berlin Datenbanken Prof. Dr. Zschockelt Verteilte DBMS Vertikal fragmentiert horizontal fragmentiert Nutzer (Rechnerzugänge) räumlich verteilt Historisch gewachsene heterogene "DB-Landschaft" Datenmenge zu groß FHTW Berlin Datenbanken Prof. Dr. Zschockelt Typische Anwendungen Verteilter DBS Datenbasis für räumlich verteilte Unternehmen (Bereiche und Abteilungen an unterschiedlichen Standorten). Datenbasis für Unternehmen mit Filialen. Datenbankunterstützte mobile Clients (z. B. Vertreter). Hochverfügbare Datenbankanwendungen (Netz und technischer bzw. medizinischer Bereich). Schnelle Recherche über sehr große Datenmengen (z. B. im Web und/oder Data Warehousing). B to B-Kommunikation zwischen kooperierenden Unternehmen. FHTW Berlin Datenbanken Prof. Dr. Zschockelt Besonderheiten verteilter Datenbanken Im Vergleich zu "einfachen" Datenbanksystemen ergeben sich einige technologische Besonderheiten durch die transparente und in der Regel nicht disjunkte Verteilung der Daten. Insbesondere betrifft das 1. Die Entwicklung eines globalen Datenmodells mit Fragmentierung und Allokation der Daten. 2. Die Planung und Realisierung des Datenzugriffs auf mehrere Knoten, insbesondere die Entwicklung globaler Views. 3. Die Sicherung der globalen Datenintegrität, inklusive globaler Fehlererholungsprozesse. 4. Die Replikation der Daten bei redundantem Mapping. Die Realisierung erfolgt mittels eines - Föderierten Datenbanksystems (FDBS) mit globalem Schema oder - Multidatenbanksystems ohne globalem Schema. FHTW Berlin Datenbanken Prof. Dr. Zschockelt Aspekte der Architektur VDBS in Unternehmen 1. Technisch-technologischer Aspekt: Alle Knoten sind gleichberechtigt. Online/Offline ist prozess- und kostenabhängig. 2. Betriebsorganisatorischer Aspekt: Leitungsstrukturen werden abgebildet, z. B. Master/ SlaveArchitektur für hierarchische Leitungsorganisation 3. Geschäftsprozessorientierter Aspekt: Pull (Information bei Bedarf holen) oder Push (Information bei Entstehung versenden). 4. Räumlich-zeitlicher Aspekt: Berücksichtigung des Tagesrhythmus und örtlicher Besonderheiten (z. B. Gültigkeit von Kursen, Preisen) 5. Sicherheitsaspekt: Datenreplikation aus Sicherheitsgründen, Schutz unternehmenskritischer Daten. FHTW Berlin Datenbanken Prof. Dr. Zschockelt Typische VDB- Architektur für betriebswirtschaftliche Anwendungen Zentrale Filiale 2 Filiale 1 Filiale 3 Filiale n Hierarchische Struktur (Master/Slave-Modell) Beachte: Aus technologischer Sicht sind alle Knoten gleichberechtigt. FHTW Berlin Datenbanken Prof. Dr. Zschockelt Mobile Computing – Mobile Datenbanken Mobile Clients DB-Clients Browserbasierte Clients Zentrale Datenbank Mobile Datenbanken (= VDB mit mobilen Knoten) Konsistenzhaltung mittels Online Konsistenzhaltung mittels Replikation Konsistenzhaltung mittels gelegentlicher Synchronisation Hauptproblem: Gerätetyp + Browser erkennen Marktführer: iAnywhere Solutions (Sybase) SQL-Anywhere deckt ca. 68% des Weltbedarfs als kleine mobile DB auf Clients. FHTW Berlin Datenbanken Prof. Dr. Zschockelt Gründe für den Datenbankzugang über das Web Technologiebasis - vereinheitlichter Zugriff auf Online-Datenbanken - Electronic Commerce, Merchant Server u. a. - Nutzung der Funktionalität einer (Workflow-) Datenbank - DB-Thin-Client externe Informationsquelle - Data Warehouse Zugriff - Zugriff auf Daten in Dokumenten mit Lebenszyklus - Zugriff auf XML-Daten FHTW Berlin Datenbanken Prof. Dr. Zschockelt Anforderungen an den Datenbankzugang über das Web 1. Neue Datentypen wünschenswert. Implementation hierarchischer Verzeichnisstrukturen Intelligente Volltextsuche z. B. in XHTML-Dokumenten Versionierte Dokumente 2. Lange Transaktionen erforderlich. (HTTP ist zustandslos) 3. Systemblockierung durch fehlerhafte Abfragestrategien vermeiden. 4. Authentisierung der Nutzer erforderlich. ("Normaler" Passwortschutz für kritische Anwendungen (z. B. Bankgeschäfte) nicht ausreichend.) 5. Lokale Datenintegritätskontrollen ermöglichen. 6. "Datenbanktypische" Präsentationsformen ermöglichen. (dynamische Formulare und Berichte) FHTW Berlin Datenbanken Prof. Dr. Zschockelt Schematische Darstellung der DB-Anbindung Client Web-Browser Java-Anwendung (Applet) Datenbank DatenServer Web-Server Applikationsserver Middleware Anwendung Internet Intranet FHTW Berlin Datenbanken Prof. Dr. Zschockelt Aspekte der DB-Einbindung in Web-Applikationen WWWBrowse r Server Datenbank ? 1. 2. 3. 4. Art der Veröffentlichung (dynamisch oder statisch) Netzwerk-Umgebung (LAN oder WAN) Realisierungsort (Client oder Server) Implementiertes formales Datenmodell (strukturiert = relational/objektorientiert/objektrelational oder semistrukturiert) 5. Technologievariante des Datenbankzugriffs 6. Entwicklungstechniken und -tools Bewertungskriterien: Entwicklungsaufwand in Bezug zur Nutzungshäufigkeit Sicherheit des Datentransfers Stabilität und Schnelligkeit des Zugriffs Erwartete Anzahl konkurrierender Nutzer FHTW Berlin Datenbanken Prof. Dr. Zschockelt Basistechnologien für den Web-Zugriff auf DB 1. Common Gateway Interface ( CGI ) Prinzip: WWW-Server reagiert auf Client-Anforderungen durch Aufruf einer CGIRealisiert die Logik einer Applikation auf einem eigenen Server. Schnittstelle. Diese startet beliebige Applikationen (z. B. C, PERL, Batch-Dateien), Geeignet große an und/oder komplexe zurückgeben, Anwendungen welche ihrefür Resultate den WWW-Server der sie an den WWWinsbesondere Client sendet. bei komplexen Geschäftsprozessen. Einbindung von logischen Komponenten in die DBMSFunktionalität. Geeignet insbesondere für Multimedia- und 2. Application Programming Interface (API) Prinzip: WWW-Server realisieren oder vermittelt eineRealisierungsform Verbindung Programiertechnische Anwendungen auf ODBMS z. B. CSPzur (Caché Der "Klassiker" – erste desServer DBschnittstelle des DBMS. Zugriffs. Bindet jedoch viele Systemressourcen und Pages). ist wenigMarkup konkurrenzfähig gegenüber modernen XML (Extensible Langugage) erobert die Informatik-Welt, 3. Application-Server Technologien. ist aber dennoch nicht für jede Applikation unabdingbar. Prinzip: WWW-Server baut Verbindung zum Applikation-Server auf. Dieser Sehr verbreitet im Freeware-Bereich, geeignet für realisiert Gateway-Funktionalität zur weniger Datenbank. komplexe Geschäftsprozesse. Dominierend sind ASP (Avtive Server Pages) und ASP.NET, 4. DBMS mit Web-Server-Funktionalität Prinzip: Datenbankserver Web-Server-Aufgaben. PHP (Hypertext Preprocessor)erfüllen sowie"eingebettete" Java-Servlets. 5. Web-Spracherweiterungen Prinzip: Spracherweiterungen ermöglichen einen direkten Zugriff auf Datenbanken FHTW Berlin Datenbanken Prof. Dr. Zschockelt Datenströme Datenstrom = kontinuierlich übersandte Datensätze, deren Größe, Menge sowie schnelles Aufkommen verbieten, sie vor der Verarbeitung zu speichern. Anwendungsgebiete sind z. B. Nachrichten, Systemüberwachung- und –steuerung, Analyse wissenschaftlicher Daten, Paketverfolgung usw. Vergleich Datenstromsysteme Datenbanksysteme Daten flüchtig dauerhaft Anfragen dauerhaft flüchtig Änderungen auf Hinzufügen beschränkt beliebig Ergebnisse eventuell angenähert exakt Datenzugriff möglichst EinpassVerfahren beliebig Indizierung der Anfragen der Daten FHTW Berlin Datenbanken Prof. Dr. Zschockelt XML (Extensible Markup Language) ein SGML (Standard Generalized Markup Language) - Subset Grundidee der Sprache Jedes Dokument wird zerlegt in Inhalt und Struktur Layout XML XHTML, … … liefert Methoden für das Arbeiten mit Daten und ihren Komponenten (www.xml.com) deutsche Einführung: members.aol.com/xmldoku/. Vorteile: Präzisere Suchanfragen durch neue Sprachelemente Entwicklung flexiblerer Web-Anwendungen durch Weitergabe der Resultate von DBAnfragen Lokale Berechnung und Manipulation auf dem Client möglich. Unterschiedliche Darstellungen auf dem Client möglich. Verteilung von XML-basierten Daten mittels HTTP möglich. FHTW Berlin Datenbanken Prof. Dr. Zschockelt XML (Extensible Markup Language) Geschäftsdaten und Datenbanken "70 % Geschäftsdaten stehen in Textdokumenten" Unterscheidung aus struktureller Sicht in dokumentenzentrierte Dokumente, semistrukturierte Dokumente, datenzentrierte Dokumente. Speicherort sind u. a. DBMS vom Typ relationaler DBMS (inhaltsorientiert zerlegt / strukturorientiert zerlegt / opaque approach (CLOB), ojektorientierter/objektrelationaler DBMS (benutzerdefinierte Objekte), "nativer" XML-DBMS (z. B. Tamino). Speicherformen CLOB-Ansatz (Textform bleibt bewahrt), grafenorientierte Speicherung (DOM und Dokument werden gespeichert), relationale strukturorientierte Zerlegung (Mapping). Abfragesprachen sind XPath (www.w3.org/TR/xpath.html), XMLQL(www.w3.org/TR/NOTE-xml-ql.html), Volltext-SQL u.a. FHTW Berlin Datenbanken Prof. Dr. Zschockelt XML und Datenbanken Speicherung von XML Dokumenten Generische Speicherung der Dokumentstruktur Speicherung als Ganzes Volltextindex Volltextindex und Strukturindex Einfache generische Speicherung Document Objekt Modell Abbildung auf Datenbankstruktur Automatische Verfahren Anwenderdefinierte Verfahren geeignet für dokumentzentrierte XML-Dokumente geeignet für semistrukturierte XML-Dokumente geeignet für datenzentrierte XML-Dokumente Quelle: Datenbank Spektrum Heft 5/2003 FHTW Berlin Datenbanken Prof. Dr. Zschockelt Semantic-Web eine Vision? Problemstellung: Software soll unpräzise Fragestellungen tolerieren Thesauren verknüpfen mit Ontologien Thesaurus = Stichwortsammlung; erfasst Synonyme, kennzeichnet Homonyme. Begriffe erhalten eine Bedeutung. Ontologie (KI) = formal definiertes System von Dingen und deren Beziehung zueinander, welche durch Regeln beschrieben werden. Thesauren können nach bestimmten Konventionen (z. B. Dublin Core) mit Metadaten angereichert werden. Sprachen zur Beschreibung von Ontologien sind z. B. RDF (Resource-Description-Framework), F-Logic und OWL (Ontology Web Language vom WWW-Consortium propagierte Semantic-Web-Sprache). Quelle: Computer Zeitung Nr. 13/2004