Datenbanksysteme (c) A.Kaiser; WU-Wien 1 Einteilung von Datenbanken 1. formatierte Datenbanken 2. unformatierte Datenbanken Information Retrieval Systeme 2 Wozu Datenbanken? • • • • • • Speicherung und Verwaltung von Daten Vermeidung von Mehrfachspeicherungen Plausibilitätstest Konsistenzprüfungen Datensicherheit und Datenschutz Datenunabhängigkeit 3 1 Eine symbolische Formel DBS = DBMS + n*DB DBS: Datenbanksystem DBMS: Datenbankmanagementsystem DB: Datenbanken (n>=1) 4 Datenbanksystem • Datenbank (Daten) • Datenbankmanagementsystem (Software) – Oracle – DB/2 – SQL/DS – Ingres – ... 5 Datenbanken - Datenmodelle Datenbanksysteme basieren immer auf einem Datenmodell: • relationales Datenmodell • hierarchisches Datenmodell • netzwerkorientiertes Datenmodell 6 2 Vorteile von relationalen DBS • tabellenorieniert, daher leicht nachvollziehbar • standardisierte Abfragesprache SQL • SQL ist “gut lesbar” aber trotzdem sehr mächtig • z.B. update personal set prämie=gehalt*0.10 where stufe>8; 7 Datenbasis - 3 Sichten • Konzeptionelle Sicht – ER-Modell • Externe Sicht – Benutzerorientiert • Interne Sicht – “Computer-orientiert” 8 Modellierung von Datenbanken • Konzeptionelles Datenmodell → ER Modell (Entity Relationship Modell) • Umsetzung in ein logisches Datenmodell → relationales Modell • Implementierung mit SQL 9 3 Konzeptionelles Datenmodell • Beschreibung des konkreten Datensystems einer Organisation • “Naturgetreue” Abbildung des betrachteten Realitätsausschnittes (“der Benutzer kennt sich aus”) • Erzeugung eines Modells eines Realitätsausschnittes 10 ER-Modell • Entitäten Student • Beziehungen leiht aus • Attribute Student Matrikelnr 1 leiht aus n Buch 11 Phasen beim Entwurf relationaler Datenbanken Diskurswelt konzeptueller Entwurf Entity Relationship Modell konzeptuelles Schema logischer Entwurf relationales Modell logisches Schema physischer Entwurf (c) A.Kaiser; WU-Wien physisches Schema konkretes DBMS 12 4 Ein Beispiel - Umsetzung in Relationen Student (Matrikelnr, Name, Adresse, Gebdatum, Studienkz) Prüfer (Sozversnr, Name, Adresse, Gebdatum, Art, Inr) Institut (Inr, Bezeichnung,Telefon,Sozversnr) Diplomarbeit (Nr,Titel,Matrikelnr,Sozversnr) 13 Ein Beispiel - Implementierung mit SQL Create Table Student (Matrikelnummer char(7) not null, Nachname varchar(30) not null, Vorname varchar(20) not null, Adresse varchar(70) not null, Gebdatum date not null, Studienkz varchar(10) not null, Primary Key(Matrikelnummer)); 14 Ein Beispiel - Abfragen mit SQL Select * from Student where Studienkz = ‘J151’; Select * from Student where Matrikelnummer like ‘93%’; Select * from Student where Gebdatum > ‘1970-01-01’ and Studienkz = ‘J151’; 15 5 Information Retrieval Systeme Komponenten eines IR-Systems • Informationserschließung • Informationswiedergewinnung (Retrieval) • Informationsaufbereitung 16 Formatierte DBS vs IR-Systeme formatierte DBS strukturierte, formatierte Daten IR-Systeme unformatierte Daten direkte Suche indirekte Suche “Erfolg” ist objektiv bestimmbar “Erfolg” ist subjektiv (Nutzen) 17 Informationserschließung Indexierung • Manuelle Indexierung • Automatische Indexierung • Computer-unterstützte Indexierung Die Dokumente werden “aufbereitet”, um effizient nach Informationen suchen zu können. 18 6 Informationserschließung Ein Beispiel für eine Methode der Informationserschließung ist der invertierte Index. Erzeugung einer „Tabelle“, die in der 1.Spalte alle möglichen Suchbegriffe beinhaltet und in der 2.Spalte die Verweise auf diejenigen Dokumente (Adressen, etc.), die diese Suchbegriffe beinhalten. 19 invertierter Index Datenbank SQL Internet Computer Textverarbeitung D1,D4,D7,D9 D2,D4,D7,D8 D5,D6,D7,D8,D9 D3,D4,D9 D1 Berücksichtigung von Stoppwortlisten, d.s. Listen von Begriffen ohne Informationsgehalt (der, die, ...) Vorteil: Massive Beschleunigung des Suchprozesses 20 Einsatz von IR-Systemen • • • • Literaturrecherche Suchmaschinen im Internet Suchverfahren im Multimediabereich ... 21 7