Datenbanken I Produkt (0,*) (0,*) 3 Karczewski Datenbanken I 1 Literatur • C.J. Date: An Introduction to Database Systems; Addison-Wesley Systems Programming Series. 6th ed. 1995 • H.E. Erbs, S. Karczewski and I. Schestag: Datenbanken (Datenmodelle, Objekte, WWW, XML); VDE-Verlag Berlin 2003; 317 pp.; 24 EUR • G. Vossen: Datenmodelle, Datenbanksprachen, Datenbankmanagementsysteme; Oldenburg-Verlag 2000; 780 pp. • A. Heuer, G. Saake: Datenbanken: Konzepte und Sprachen; mitp Verlag 2000; 670 pp.; 35 EUR Karczewski Datenbanken I 2 1. Von Dateien zu Datenbanken … … … P1, …, …… P2, …,P1, … …, … …, …,P2, … …, … … …, …, … … … … Karczewski Produkt: Datenbanken I Nummer Bezeichnung Funktion P1 Kanne Gebrauch P2 Tasse Gebrauch 3 Motivation • Professionelle Anwendungen benötigen dauerhaft verfügbare, persistent gespeicherte Daten. • Datenbank-Systeme bieten die einfache Möglichkeit, Daten persistent zu speichern. • Diese Veranstaltung zeigt die wesentlichen Aspekte zur Verwendung von Datenbanken auf: • • • • • Datenmodellierung zur Strukturierung der Realität Datendefinition und –manipulation Datenbank-Architektur Systeme zur Datenmodellierung Datenbanksysteme Karczewski Datenbanken I 4 Historische Entwicklung von Datenbanksystemen (1) • 1965: Firma IBM entwickelt das DBS: IMS, das auf dem Hierarchischen Datenmodell beruht • 1969 Standardisierungsgremium CODASYL schlägt Netzwerkmodell vor • 1976: Firma SIEMENS (UDS) u.v.a. entwickeln DBS nach dem Netzwerk-Datenmodell • seit 1970: Codd entwickelt das Relationale Datenmodell • 1971 –1981: IBM entwickelt Prototyp für Relationale Datenbanken, Name: “System /R” mit Datenbanksprache: SQL Karczewski Datenbanken I 5 Historische Entwicklung von Datenbanksystemen (2) • seit 1980: ORACLE, Relationales DBS mit SQL als Datenbanksprache auf dem Markt • seit 1982: SQL/DS der Firma IBM mit SQL auf dem Markt • seit 1984: Relationale DBS für PCs auf dem Markt: DBASE, ACCESS auch ORACLE • seit Ende der 80-er: Entwicklung Objektorientierter DBS: GEMSTONE, ObjectStore, O2, Jasmine, POET (jetzt: FastObjects) u.v.a. • 1992: SQL2-Standard wird verkündet; gleichzeitig Arbeit an einer OO-Erweiterung von SQL. Arbeitsname: SQL3 • aktuelle Situation: Client-Server–Prinzip beim Einsatz von Datenbanksystemen und Einsatz von Datenbanksystemen in integrierten Softwaresystemen (hauptsächlich noch immer: Relationale DB-Systeme), z.B. in SAP Karczewski Datenbanken I 6 Eigenschaften von DB-Systemen im Vergleich zu Dateisystemen DB-System Dateisystem Abstraktion logisch physisch Abspeicherung in Datenbank in Dateien Beschreibung der Daten im zentralen Data Dictionary im Anwendungsprogramm Zugriff Über das Datenbanksystem Über das Betriebssystem Dienstprogramme (zB. Über das Backup, Recovery) Datenbanksystem Eigene Programmierung Verknüpfung der Daten Eigene Programmierung Karczewski Über das Datenbanksystem Datenbanken I 7 Arbeiten mit Dateien AnwendungsProgr. 1 Datenstruktur (DS) ist im Programm definiert. Datei A AnwendungsProgr. 2 Bei Änderung der Datenstruktur muss jedes Anwendungsprogramm angepasst werden Datei B AnwendungsProgr. 3 ... ... Datei Z AnwendungsProgr. n Daten werden mehrfach abgespeichert (=Redundanz): Inkonsistenz möglich Jeder Nutzer der Daten muss physische Struktur kennen. Karczewski Datenbanken I 8 Arbeiten mit einem Datenbanksystem (DBS) AnwendungsProgr. 1 AnwendungsProgr. 2 Daten (DB) DBMS AnwendungsProgr. 3 Anwendungsprogramme greifen über das DBMS auf die Daten zu DBMS ist Zugriffsfilter Identische Daten werden nur einfach abgespeichert ... AnwendungsProgr. n Karczewski Bei Änderung der Datenstruktur muss nur einmal im DBS geändert werden. Datenbanken I 9 Vergleichendes Beispiel: Ausgabe aller Kunden aus Darmstadt DB-System: SELECT name, plz, ort FROM kunde WHERE ort = ´Darmstadt‘, Karczewski Dateisystem (in C++): #include <fstream.h> .. typedef struct { char name [30]; int plz; char ort [30]; } kunde_record; kunde_record buffer; fstream kunden_file; file.open (“kunden.dat“, ios::in | ios::binary); while (!file.eof()) { file.read( (char*) &buffer, sizeof(kunde_record) ); if buffer.ort = “Darmstadt“ { cout << buffer.name << … } } … Datenbanken I 10 Wesentliche Vorteile von DBS (1) Redundanzvermeidung Ein Fakt in der realen Welt ist nur ein Mal in der DB abgelegt. Vermeidung von Inkonsistenzen keine widersprüchlichen Informationen zum gleichen Objekt: Beispiel: Adresse in Datei Personalstamm und in Datei Bestellinfos gespeichert. Person zieht aus Darmstadt aus. Die Datei Personalstamm wird geändert, die Datei Bestellinfos nicht. Durch redundante Datenhaltung wurde Inkonsistenz (Person hat zwei verschiedene Adressen) provoziert. Einheitliche Sicht auf Daten Standards setzen sich besser durch Karczewski Datenbanken I 11 Wesentliche Vorteile von DBS (2) Datenunabhängigkeit Anwendungen müssen sich nicht um Details der Speicherstruktur und Zugriffstechniken kümmern. Änderungen von Speicherstrukturen, Attributanzahl etc. sind i.d.R. ohne Auswirkungen auf Anwendungsprogramme. Beispiel: Länge des Nachnamens wird von 30 auf 40 Zeichen gesetzt oder zusätzliches Attribut Qualifikation wird eingeführt. Jedoch: Streichen eines Attributs ohne Auswirkungen auf Anwendungsprogramme nicht möglich! Spontane Anfragen Mit Hilfe einer Sprache der vierten Generation ist eine Formulierung von Anfragen unter dem Motto „Was“ statt „Wie“ möglich Beispiel: Selektiere alle Mitarbeiter, die mehr als 50000 € verdienen. Karczewski Datenbanken I 12 Wesentliche Vorteile von DBS (2) Zugriffskontrolle bei parallelen Zugriff Benutzung von Daten durch mehrere Programme gleichzeitig mit Kontrolle der Zugriffe und eindeutigen Änderungen Integritätskontrolle Kontrolle von Integritätsbedingungen durch DBS (z. B. Wertebereiche, Existenzabhängigkeiten zwischen Datensätzen, allg. Beziehungen zwischen Werten), dadurch weniger Programmieraufwand Beispiele: Alter von Mitarbeitern muss immer > 14 sein. Nachname ist max. 30 Zeichen lang. Karczewski Datenbanken I 13 Wesentliche Vorteile von DBS (4) Datenschutz, Datensicherheit Zugriffskontrolle, d. h. Setzen von Sperren durch DBS auch auf Feldund Satzebene (nicht nur Read-, Write-Sperren ganzer Dateien) Beispiel: Nur Personalabteilung dürfen Gehälter der Mitarbeiter sehen. Beziehungen zwischen Daten können definiert und vom System kontrolliert werden. Beispiel: Bestellung hat Beziehung zu Kunde. Zu Bestellung gibt es immer einen Kunden Verteilung von Daten kann vom DBS verwaltet werden. Karczewski Datenbanken I 14 Begriffe Datenbank (DB) = Datenbestand Datenmanagementsystem (DBMS) = Software zum Arbeiten mit Datenbanken Datenbanksystem (DBS) = DB + DBMS aber: oft synonym zu DBMS verwendet. Karczewski Datenbanken I 15 Beteiligte Rollen am Datenbanksystem Daten-Administrator (DA) - Hat zentrale strategische Verantwortung für die Daten - Entscheidet welche Daten für wen gespeichert werden Datenbank-Administrator (DBA) - Hat technische Verantwortung - Entscheidet, wie Daten gespeichert werden Anwendungsentwickler - Entwickelt Anwendung z. B. in Programmiersprache - Arbeitet hinsichtlich der Definition von Daten mit DBA, DA zusammen Endanwender - Hat Zugriff auf Daten über GUIs / Abfragesprache - Zusammenarbeit mit Anwendungsentwickler in Entwicklungsphase Karczewski Datenbanken I 16 ANSI / SPARC-Modell externes Schema 1 externes Schema 2 konzeptionelles Schema internes / physisches Schema Karczewski externes Schema n externe Ebene Datensicht für einzelne User konzeptionelle Ebene Sicht auf die Gesamtheit aller Daten und ihre Beziehungen untereinander interne / physische Ebene physische Speicherstrukturen Datenbanken I 17 Komponenten eines DBMS s. Tafel Karczewski Datenbanken I 18 Metadaten Es gibt die Daten der Anwendung Müller, 64295, Darmstadt, … Ohne Erläuterung ist der Sinn der Daten nicht klar Abhilfe: Man gibt die Bedeutung, Formate etc, immer mit den Daten an: Name: Müller, char(30); PLZ: 64295, int; … besser: - Attribute gehören zusammen und bilden (Daten-)Objekte (Entities). - Objekte gleichen Typs kann man gemeinsam beschreiben. Dies geschieht in der Schemabeschreibung Beispiel: Relation Kunde mit den Attributen Name char(30), PLZ int, … Diese Beschreibungen stehen im Data-Dictionary des DBS. Man nennt diese Daten, die die eigentlichen Daten beschreiben, Metadaten. Karczewski Datenbanken I 19 Bedeutung der 3 Ebenen bei der ANSI/SPARC-Architektur Änderungen auf einer Ebene können vorgenommen werden, ohne dass eine benachbarte Ebene davon berührt ist. Verarbeitungsprogramme sind physisch als auch logisch datenunabhängig (mit Einschränkungen). d. h. Änderungen auf der physischen, konzeptionellen, externen Ebene haben keine Auswirkungen auf die Verarbeitungsprogramme (mit Einschränkungen, z. B. Löschung eines Attributs hat Auswirkungen, Hinzufügen eines Attributs hat keine Auswirkungen.) Frage: Welche Auswirkungen haben Änderungen in der Datenstruktur von Dateien auf die die Dateien verwendenden Anwendungsprogramme? Karczewski Datenbanken I 20 Auswirkungen von Änderungen in normalen Dateien Frage: Welche Auswirkungen haben Änderungen in der Datenstruktur von Dateien auf die die Dateien verwendenden Anwendungsprogramme? Änderungen in den Anwendungsprogrammen notwendig, da Dateibeschreibung in allen Programmen, die die Datei verwenden redundant abgelegt sind. Beispiel: 5 Programme arbeiten mit einer Datei, 1 Programm benötigt zusätzliches Feld Trotzdem müssen alle 5 Programme geändert werden. Karczewski Datenbanken I 21