Datenbanksysteme • Datenbanksysteme verwalten große Mengen strukturierter Daten. • Typische Eigenschaften: – – – – – Schema-Definition für die abgelegten Datensätze Einlesen und Ausgeben großer Mengen von Datensätzen Abfragesprache zur gezielten Abfrage bestimmter Daten Manipulationssprache zur kontrollierten Änderung bestimmter Daten Transaktionskonzept zum Zusammenfassen logisch zusammengehöriger Modifikationen – Maßnahmen zur Sicherung der Integrität des Datenbestandes – Schnittstellen zu Programmiersprachen und -systemen – Oft: Mehrbenutzerbetrieb, Zugriffsrechteverwaltung Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Typen von Datenbanksystemen • 1. Generation: Spezielle Dateitypen – ISAM, VSAM • 2. Generation: Hierarchische Datenbanksysteme – Baumstrukturen • 3. Generation: Netzwerk-Datenbanksysteme – CODASYL • 4. Generation: Relationale Datenbanksysteme – Tabellen als Repräsentation von Relationen – Abfragen durch Operationen auf Relationen • 5. Generation: Objektorientierte Datenbanksysteme – Dauerhaft bestehende (persistente) Objekte • Praktische Nutzung (derzeit): – überwiegend relationale Datenbanksysteme – gelegentlich: hierarchisch (Altsysteme), objektorientiert (Neusysteme) Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Relationale Datenbanksysteme • Verteilungsarchitektur: – lokal – Client-Server – verteilt • Bekannte lokale Datenbanksysteme für Windows: – Access – Paradox – dBase • Bekannte Client-Server-Datenbanksysteme für Unix und Großrechner (Mainframes): – – – – – Oracle Sybase Informix DB2 (IBM) ADABAS (Software AG) Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Relationen • Beispiel für Datensatz-Schema: – Stadtname (String15), Postleitzahl (String5), Einwohnerzahl (Integer) • Mathematisches Modell: Relation – Datenbestand D ist Relation: D String15 String5 Integer – Konkreter Beispiel-Datenbestand (3 Datensätze): { ("Jena", "07743", 105000), ("Lübeck", "23552", 150000), ("Pirna", "01796", 50000) } • Mathematische Operationen auf Relationen: – z.B. Projektion, Vereinigung, Komposition Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Tabellen • Tabellen dienen als effiziente Implementierung von Relationen. • Beispiel "Städte": Name (String15) PLZ (String5) EWZ (Integer) Jena 07743 105000 Lübeck 23552 150000 Pirna 01796 50000 • Zeilen sind Datensätze des aktuellen Schemas. • Spalten sind Datenfelder des aktuellen Schemas. • Alle Einträge in einer Spalte (einem Datenfeld) sind vom selben, im Schema festgelegten Datentyp. Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Relationale Datenbanken und Delphi • Delphi bietet ausgereifte und umfangreiche Unterstützung der Datenbankprogrammierung. • Unterstützte Datenbanksysteme: – dBase – Access – Paradox (Inprise) » einfache Version von Paradox wird mit Delphi geliefert » "Datenbankoberfläche" – SQL-basierte Client-Server-Systeme » SQL = Standard-Abfragesprache für relationale Datenbanken • Hinweis: Der Übergang zu einem anderen Datenbanksystem ist im allgemeinen nicht einfach! – Auch unter Delphi bestehen Differenzen zwischen Datenbanken: z.B. bezüglich unterstützter Datentypen, Integritätsprüfungen. – Delphi bietet aber einheitliche Entwicklungsumgebung. Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Sichten auf Datenbanktabellen • Struktursicht: – Anlegen oder ändern des Schemas der Tabelle – Führt bei vorhandenen Datenbeständen u.U. zu Problemen » Datenverlust » Konversion • Datensicht (lesend): – Abfrage von Daten aus den Tabellen • Datensicht (schreibend/editierend): – Modifizieren von Daten in den Tabellen – Läßt Struktur unverändert – Beschränkung des Modifikationsmöglichkeiten sinnvoll » Integritätserhaltung ! Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Sortierung und Schlüssel • Sortieroperation auf Tabelle: – Einmaliges physisches Sortieren des Tabelleninhalts – Später eingefügte Datensätze können Sortierung zerstören • Schlüssel (=Kombination von Datenfeldern): – Automatisches laufendes Sortieren der Tabelle nach dem Schlüssel – Zusatzbedingung: Eindeutigkeit » Keine zwei Datensätze mit gleichem Schlüsselwert! » Ermöglicht einfachen Zugriff auf Datensätze – Primärschlüssel: » Fest der Tabelle zugeordnet, definiert Speicherorganisation » Existenz für viele Operationen vorausgesetzt – Sekundärschlüssel: » Zusätzliche Indizes zum schnellen Suchen in der Tabelle Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Normalformen für Datenbankschemata • Regeln für saubere, redundanzfreie Datenbankschemata: – 1. Normalform: Keine zusammengesetzten Datentypen (z.B. record) für Datenfelder – 2. Normalform: Jede Tabelle hat einen Schlüssel, von dem alle Datenfelder abhängig sind. – 3. Normalform: Es gibt keine Abhängigkeiten zwischen zwei Datenfeldern der Tabelle (außer der Abhängigkeit vom Schlüssel) • Beispiel: – In der Stadt-Tabelle des Lehrbriefs hängt das Feld "NEU" vom Feld "LAND" ab. - Keine 3. Normalform. • Abhilfe ("Normalisierung"): – Einführen von zusätzlichen Tabellen und Fremdschlüsseln • Nachteile von Normalisierung: – Viele Tabellen – Viele Schlüssel – Praxis: Normalisierung maßvoll betreiben Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Beispiel für Normalisierung • Vorher: Tabelle Stadt: STADT LAND NEU PLZ EWZ Datentyp von LAND: Alphanumerisch (String) (Beispiel: "Sachsen") • Nachher: Tabelle Stadt: STADT LAND PLZ EWZ Datentyp von LAND: Schlüssel für andere Tabelle (Fremdschlüssel) z.B.: Ländercode (2 Buchstaben) (Beispiel: "SN") Tabelle Land: LANDCODE NEU Datentyp von LANDCODE: Schlüssel für Land-Tabelle (Primärschlüssel) z.B.: Ländercode (2 Buchstaben) Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Verbinden von Tabellen • Fremdschlüssel einer Tabelle verweist auf Primärschlüssel anderer Tabelle • Delphi: Referentielle Integrität nutzen – Inkonsistenzen automatisch vermeiden » Löschen indirekt zugänglicher Daten verhindern » Als Verweis genutzte Schlüsselfelder konsistent halten • Abfragen: – Delphi: Query-by-Example erfordert weitere Arbeitsschritte: » Hinzufügen weiterer Tabellen » Verbinden der Schlüsselattribute – SQL: "Join"-Operation Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Programmierung mit Datenbanken • Direkte Nutzung des Datenbanksystems: – eigene Benutzungsoberfläche – arbeitet auf Datenbank-Dateien – Beispiele: » (1) Delphi-Datenbankoberfläche, "Query by Example" (QBE) » (2) SQL-Kommandoschnittstellen • Datenbankanbindung in konventionellen Programmen – insbesondere Einbettung von SQL-Code – verbreitet für COBOL- und C-Programme • Verwendung spezieller Programmbibliotheken – Beispiel: Datenbank-Komponenten in Delphi • "Verstecken" der Datenbankspeicherung durch geeignete Softwarearchitektur – "Persistenzdienst" für Objekte – Beispiele: CORBA, Enterprise Java Beans Technische Universität Dresden Prof. Hußmann Informatik II (Maschinenwesen) Satzzeiger-Prinzip • In Delphi werden Tabellen ähnlich behandelt wie Dateien von Record-Daten: type Stadt = file of record name: String15; PLZ: String5; EWZ: Integer; end; – Wie bei einer Datei gibt es einen Zeiger auf das aktuelle Element (den aktuellen Datensatz). • Der Zugriff auf Datenbankdaten erfolgt durch spezielle Funktionen. – – – – – – First: Next: EOF: Last: Prior: BOF: Technische Universität Dresden Setzen des Zeigers auf Anfang (erster Datensatz) Weiterschalten des Zeigers auf nächsten Datensatz Abfrage, ob Zeiger am Ende Setzen des Zeigers auf Ende (letzter Datensatz) Weiterschalten des Zeigers auf vorherigen Datensatz Abfrage, ob Zeiger am Anfang Prof. Hußmann Informatik II (Maschinenwesen)