(6)wiw-db-grundlagen

Werbung
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Entwicklungsetappen von DBMS
Softwareentwicklungskomponente
1960
hierarchische Mainframe-DB
1970
Theoretische Arbeiten zum
relationalen DM (Codd)
Basis betrieblicher
IKS
Tendenzen
Non-Standard DBMS
1980
1990
2000
2003
2004
Relationale DBMS
SQL-1 ISO/IEC-9075-Norm
verabschiedet(1986)
Verteilte DBS
Unternehmens-DM
Client-Server-DBMS
SQL-92
ODBC
Objektorientierte
Data Warehouse
DBMS
ORDBMS
Web-Interface für
DBMS
XML/Webservices
Data Mining
Mobile Computing
Wissenstechniken
Datenströme ergänzen die DB-Technologie
OLTP-DBMS
dominieren
Erste Online-DB
Multi-Media-DB
DB-basierte WebApplikationen
DB werden unternehmensstrategische Kerntechnik
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Datenbankstrategie ist unternehmenskritisch
 Datenbanktechnologie und Web (Architektur,
XML, Webservices)
 Mobile Datenbanken (Architektur,
Kommunikationsprofile, lokations-abhängiger
Datenzugriff)
 Wissenstechniken (Data Warehousing,
Wissensmanagement)
Herausforderungen:
 Bewältigung der Heterogenität
(= Integrationsfähigkeit)
 Bewältigung wachsender Datenquanten
 Transformation von Daten in Informationen
und Wissen
Forschungsschwerpunkte:
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Relationale – objektorientierte DBMS
Relationale DBMS
• Verwalten Tabellen,
• dominieren im Unternehmen,
• Nutzen SQL als
standardisierte
Sprachenebene,
• sind technologisch
ausgereift.
Objektorientierte DBMS
• Verwalten Objekte,
• Lösen spezielle Aufgaben,
• standardisierte Sprachenebene
(ODL/OQL) noch in Entwicklung,
• sind technologisch noch in
Entwicklung
Objektrelationale DBMS verbinden die Vorteile beider
und sind als Erweiterung relationaler DBMS konzipiert.
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Verteilte Datenbanksysteme
- Definitionen Eine verteilte Datenbank (VDB, englisch DDB) ist eine Sammlung
mehrerer semantisch zusammenhängender Datenbanken, welche
über ein Computernetzwerk verteilt sind
Ein verteiltes Datenbankmanagementsystem (VDBMS, englisch
DDBMS) ist ein Softwaresystem, welches eine VDB verwaltet und
transparente Verteilung der Daten für die Nutzer übernimmt.
Client-Server
Server
Client
Verteiltes Datenbanksystem
Knoten
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Verteilte DBMS
Vertikal
fragmentiert
horizontal
fragmentiert
Nutzer (Rechnerzugänge) räumlich verteilt
Historisch gewachsene heterogene "DB-Landschaft"
Datenmenge zu groß
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Typische Anwendungen Verteilter DBS
 Datenbasis für räumlich verteilte Unternehmen (Bereiche
und Abteilungen an unterschiedlichen Standorten).
 Datenbasis für Unternehmen mit Filialen.
 Datenbankunterstützte mobile Clients (z. B. Vertreter).
 Hochverfügbare Datenbankanwendungen (Netz und
technischer bzw. medizinischer Bereich).
 Schnelle Recherche über sehr große Datenmengen (z. B.
im Web und/oder Data Warehousing).
 B to B-Kommunikation zwischen kooperierenden Unternehmen.
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Besonderheiten verteilter Datenbanken
Im Vergleich zu "einfachen" Datenbanksystemen ergeben sich einige
technologische Besonderheiten durch die transparente und in der
Regel nicht disjunkte Verteilung der Daten. Insbesondere betrifft das
1. Die Entwicklung eines globalen Datenmodells mit Fragmentierung und Allokation der Daten.
2. Die Planung und Realisierung des Datenzugriffs auf mehrere
Knoten, insbesondere die Entwicklung globaler Views.
3. Die Sicherung der globalen Datenintegrität, inklusive
globaler Fehlererholungsprozesse.
4. Die Replikation der Daten bei redundantem Mapping.
Die Realisierung erfolgt mittels eines
- Föderierten Datenbanksystems (FDBS)  mit globalem Schema oder
- Multidatenbanksystems
 ohne globalem Schema.
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Aspekte der Architektur VDBS in Unternehmen
1. Technisch-technologischer Aspekt:
Alle Knoten sind gleichberechtigt. Online/Offline ist prozess- und
kostenabhängig.
2. Betriebsorganisatorischer Aspekt:
Leitungsstrukturen werden abgebildet, z. B. Master/ SlaveArchitektur für hierarchische Leitungsorganisation
3. Geschäftsprozessorientierter Aspekt:
Pull (Information bei Bedarf holen) oder
Push (Information bei Entstehung versenden).
4. Räumlich-zeitlicher Aspekt:
Berücksichtigung des Tagesrhythmus und örtlicher Besonderheiten
(z. B. Gültigkeit von Kursen, Preisen)
5. Sicherheitsaspekt:
Datenreplikation aus Sicherheitsgründen, Schutz unternehmenskritischer Daten.
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Typische VDB- Architektur für betriebswirtschaftliche
Anwendungen
Zentrale
Filiale 2
Filiale 1
Filiale 3
Filiale n
Hierarchische Struktur (Master/Slave-Modell)
Beachte: Aus technologischer Sicht sind alle Knoten gleichberechtigt.
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Mobile Computing – Mobile Datenbanken
Mobile Clients
 DB-Clients
 Browserbasierte Clients
Zentrale
Datenbank
Mobile Datenbanken
(= VDB mit mobilen Knoten)
Konsistenzhaltung mittels Online
Konsistenzhaltung mittels Replikation
Konsistenzhaltung mittels gelegentlicher
Synchronisation
Hauptproblem: Gerätetyp + Browser erkennen
Marktführer: iAnywhere Solutions (Sybase)
SQL-Anywhere deckt ca. 68% des Weltbedarfs als kleine mobile DB auf Clients.
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Gründe für den Datenbankzugang über das Web
Technologiebasis
- vereinheitlichter Zugriff auf
Online-Datenbanken
- Electronic Commerce, Merchant
Server u. a.
- Nutzung der Funktionalität einer
(Workflow-) Datenbank
- DB-Thin-Client
externe Informationsquelle
- Data Warehouse Zugriff
- Zugriff auf Daten in Dokumenten
mit Lebenszyklus
- Zugriff auf XML-Daten
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Anforderungen an den Datenbankzugang über das Web
1. Neue Datentypen wünschenswert.
Implementation hierarchischer Verzeichnisstrukturen
Intelligente Volltextsuche z. B. in XHTML-Dokumenten
Versionierte Dokumente
2. Lange Transaktionen erforderlich.
(HTTP ist zustandslos)
3. Systemblockierung durch fehlerhafte Abfragestrategien
vermeiden.
4. Authentisierung der Nutzer erforderlich.
("Normaler" Passwortschutz für kritische Anwendungen (z. B.
Bankgeschäfte) nicht ausreichend.)
5. Lokale Datenintegritätskontrollen ermöglichen.
6. "Datenbanktypische" Präsentationsformen ermöglichen.
(dynamische Formulare und Berichte)
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Schematische Darstellung der DB-Anbindung
Client

Web-Browser
Java-Anwendung (Applet)

Datenbank

DatenServer
Web-Server
Applikationsserver
Middleware
Anwendung
Internet
Intranet
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Aspekte der DB-Einbindung in Web-Applikationen
WWWBrowse
r
Server
Datenbank
?
1.
2.
3.
4.
Art der Veröffentlichung (dynamisch oder statisch)
Netzwerk-Umgebung (LAN oder WAN)
Realisierungsort (Client oder Server)
Implementiertes formales Datenmodell
(strukturiert = relational/objektorientiert/objektrelational oder semistrukturiert)
5. Technologievariante des Datenbankzugriffs
6. Entwicklungstechniken und -tools
Bewertungskriterien:
 Entwicklungsaufwand in Bezug zur Nutzungshäufigkeit
 Sicherheit des Datentransfers
 Stabilität und Schnelligkeit des Zugriffs
 Erwartete Anzahl konkurrierender Nutzer
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Basistechnologien für den Web-Zugriff auf DB
1. Common Gateway Interface ( CGI )
Prinzip: WWW-Server reagiert auf Client-Anforderungen durch Aufruf einer CGIRealisiert die Logik einer Applikation auf einem eigenen Server.
Schnittstelle. Diese startet beliebige Applikationen (z. B. C, PERL, Batch-Dateien),
Geeignet
große an
und/oder
komplexe zurückgeben,
Anwendungen
welche
ihrefür
Resultate
den WWW-Server
der sie an den WWWinsbesondere
Client
sendet. bei komplexen Geschäftsprozessen.
Einbindung von logischen Komponenten in die DBMSFunktionalität.
Geeignet
insbesondere
für Multimedia- und
2. Application
Programming
Interface
(API)
Prinzip: WWW-Server
realisieren
oder vermittelt
eineRealisierungsform
Verbindung
Programiertechnische
Anwendungen
auf
ODBMS
z. B. CSPzur
(Caché
Der "Klassiker"
– erste
desServer
DBschnittstelle des
DBMS. Zugriffs. Bindet jedoch viele Systemressourcen und
Pages).
ist wenigMarkup
konkurrenzfähig
gegenüber
modernen
XML (Extensible
Langugage)
erobert die
Informatik-Welt,
3. Application-Server
Technologien.
ist aber dennoch
nicht für jede Applikation unabdingbar.
Prinzip: WWW-Server baut Verbindung zum Applikation-Server auf. Dieser
Sehr verbreitet
im Freeware-Bereich,
geeignet für
realisiert Gateway-Funktionalität
zur weniger
Datenbank.
komplexe Geschäftsprozesse.
Dominierend
sind
ASP (Avtive Server Pages) und ASP.NET,
4. DBMS mit
Web-Server-Funktionalität
Prinzip: Datenbankserver
Web-Server-Aufgaben.
PHP (Hypertext
Preprocessor)erfüllen
sowie"eingebettete"
Java-Servlets.
5. Web-Spracherweiterungen
Prinzip: Spracherweiterungen ermöglichen einen direkten Zugriff auf Datenbanken
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Datenströme
Datenstrom = kontinuierlich übersandte Datensätze, deren Größe, Menge
sowie schnelles Aufkommen verbieten, sie vor der Verarbeitung
zu speichern.
Anwendungsgebiete sind z. B. Nachrichten, Systemüberwachung- und
–steuerung, Analyse wissenschaftlicher Daten, Paketverfolgung usw.
Vergleich
Datenstromsysteme
Datenbanksysteme
Daten
flüchtig
dauerhaft
Anfragen
dauerhaft
flüchtig
Änderungen
auf Hinzufügen beschränkt
beliebig
Ergebnisse
eventuell angenähert
exakt
Datenzugriff
möglichst EinpassVerfahren
beliebig
Indizierung
der Anfragen
der Daten
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
XML (Extensible Markup Language)
ein SGML (Standard Generalized Markup Language) - Subset
Grundidee der Sprache
Jedes Dokument wird
zerlegt in
Inhalt und
Struktur
Layout
XML
XHTML, …
… liefert Methoden für das Arbeiten mit Daten und ihren Komponenten
(www.xml.com) deutsche Einführung: members.aol.com/xmldoku/.
Vorteile:
Präzisere Suchanfragen durch neue Sprachelemente
Entwicklung flexiblerer Web-Anwendungen durch Weitergabe der Resultate von DBAnfragen
Lokale Berechnung und Manipulation auf dem Client möglich.
Unterschiedliche Darstellungen auf dem Client möglich.
Verteilung von XML-basierten Daten mittels HTTP möglich.
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
XML (Extensible Markup Language)
Geschäftsdaten und Datenbanken
"70 % Geschäftsdaten stehen in Textdokumenten"
Unterscheidung aus struktureller Sicht in
 dokumentenzentrierte Dokumente,
 semistrukturierte Dokumente,
 datenzentrierte Dokumente.
Speicherort sind u. a. DBMS vom Typ
 relationaler DBMS (inhaltsorientiert zerlegt / strukturorientiert zerlegt / opaque
approach (CLOB),
 ojektorientierter/objektrelationaler DBMS (benutzerdefinierte Objekte),
 "nativer" XML-DBMS (z. B. Tamino).
Speicherformen
 CLOB-Ansatz (Textform bleibt bewahrt),
 grafenorientierte Speicherung (DOM und Dokument werden gespeichert),
 relationale strukturorientierte Zerlegung (Mapping).
Abfragesprachen sind XPath (www.w3.org/TR/xpath.html), XMLQL(www.w3.org/TR/NOTE-xml-ql.html), Volltext-SQL u.a.
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
XML und Datenbanken
Speicherung
von XML
Dokumenten
Generische
Speicherung der
Dokumentstruktur
Speicherung als
Ganzes
Volltextindex
Volltextindex
und
Strukturindex
Einfache
generische
Speicherung
Document
Objekt
Modell
Abbildung auf
Datenbankstruktur
Automatische
Verfahren
Anwenderdefinierte
Verfahren
geeignet für dokumentzentrierte XML-Dokumente
geeignet für semistrukturierte XML-Dokumente
geeignet für datenzentrierte XML-Dokumente
Quelle: Datenbank Spektrum Heft 5/2003
FHTW Berlin
Datenbanken
Prof. Dr. Zschockelt
Semantic-Web eine Vision?
Problemstellung: Software soll unpräzise Fragestellungen tolerieren
Thesauren
verknüpfen mit
Ontologien
Thesaurus = Stichwortsammlung;
erfasst Synonyme, kennzeichnet
Homonyme.
Begriffe erhalten eine Bedeutung.
Ontologie (KI) = formal definiertes
System von Dingen und deren
Beziehung zueinander, welche durch
Regeln beschrieben werden.
Thesauren können nach bestimmten
Konventionen (z. B. Dublin Core) mit
Metadaten angereichert werden.
Sprachen zur Beschreibung von
Ontologien sind z. B. RDF
(Resource-Description-Framework),
F-Logic und OWL (Ontology Web
Language vom WWW-Consortium
propagierte Semantic-Web-Sprache).
Quelle: Computer Zeitung Nr. 13/2004
Herunterladen