Einteilung von Datenbanken Wozu Datenbanken?

Werbung
Datenbanksysteme
(c) A.Kaiser; WU-Wien
1
Einteilung von Datenbanken
1. formatierte Datenbanken
2. unformatierte Datenbanken
Information Retrieval Systeme
2
Wozu Datenbanken?
•
•
•
•
•
•
Speicherung und Verwaltung von Daten
Vermeidung von Mehrfachspeicherungen
Plausibilitätstest
Konsistenzprüfungen
Datensicherheit und Datenschutz
Datenunabhängigkeit
3
1
Eine symbolische Formel
DBS = DBMS + n*DB
DBS: Datenbanksystem
DBMS: Datenbankmanagementsystem
DB: Datenbanken (n>=1)
4
Datenbanksystem
• Datenbank (Daten)
• Datenbankmanagementsystem
(Software)
– Oracle
– DB/2
– SQL/DS
– Ingres
– ...
5
Datenbanken - Datenmodelle
Datenbanksysteme basieren immer auf einem
Datenmodell:
• relationales Datenmodell
• hierarchisches Datenmodell
• netzwerkorientiertes Datenmodell
6
2
Vorteile von relationalen DBS
• tabellenorieniert, daher leicht
nachvollziehbar
• standardisierte Abfragesprache SQL
• SQL ist “gut lesbar” aber trotzdem sehr
mächtig
• z.B. update personal
set prämie=gehalt*0.10
where stufe>8;
7
Datenbasis - 3 Sichten
• Konzeptionelle Sicht
– ER-Modell
• Externe Sicht
– Benutzerorientiert
• Interne Sicht
– “Computer-orientiert”
8
Modellierung von Datenbanken
• Konzeptionelles Datenmodell
→ ER Modell
(Entity Relationship Modell)
• Umsetzung in ein logisches Datenmodell
→ relationales Modell
• Implementierung mit SQL
9
3
Konzeptionelles Datenmodell
• Beschreibung des konkreten Datensystems
einer Organisation
• “Naturgetreue” Abbildung des betrachteten
Realitätsausschnittes (“der Benutzer kennt
sich aus”)
• Erzeugung eines Modells eines
Realitätsausschnittes
10
ER-Modell
• Entitäten
Student
• Beziehungen
leiht aus
• Attribute
Student
Matrikelnr
1
leiht aus
n
Buch
11
Phasen beim Entwurf relationaler
Datenbanken
Diskurswelt
konzeptueller Entwurf
Entity Relationship Modell
konzeptuelles Schema
logischer Entwurf
relationales Modell
logisches Schema
physischer Entwurf
(c) A.Kaiser; WU-Wien
physisches Schema
konkretes DBMS
12
4
Ein Beispiel - Umsetzung in Relationen
Student (Matrikelnr, Name, Adresse,
Gebdatum, Studienkz)
Prüfer (Sozversnr, Name, Adresse,
Gebdatum, Art, Inr)
Institut (Inr, Bezeichnung,Telefon,Sozversnr)
Diplomarbeit (Nr,Titel,Matrikelnr,Sozversnr)
13
Ein Beispiel - Implementierung mit SQL
Create Table Student
(Matrikelnummer char(7)
not null,
Nachname
varchar(30) not null,
Vorname
varchar(20) not null,
Adresse
varchar(70) not null,
Gebdatum
date
not null,
Studienkz
varchar(10) not null,
Primary Key(Matrikelnummer));
14
Ein Beispiel - Abfragen mit SQL
Select * from Student
where Studienkz = ‘J151’;
Select * from Student
where Matrikelnummer like ‘93%’;
Select * from Student
where Gebdatum > ‘1970-01-01’
and Studienkz = ‘J151’;
15
5
Information Retrieval Systeme
Komponenten eines IR-Systems
• Informationserschließung
• Informationswiedergewinnung (Retrieval)
• Informationsaufbereitung
16
Formatierte DBS vs IR-Systeme
formatierte DBS
strukturierte,
formatierte Daten
IR-Systeme
unformatierte
Daten
direkte Suche
indirekte Suche
“Erfolg” ist objektiv
bestimmbar
“Erfolg” ist
subjektiv (Nutzen)
17
Informationserschließung
Indexierung
• Manuelle Indexierung
• Automatische Indexierung
• Computer-unterstützte Indexierung
Die Dokumente werden “aufbereitet”, um
effizient nach Informationen suchen zu
können.
18
6
Informationserschließung
Ein Beispiel für eine Methode der Informationserschließung ist der invertierte Index.
Erzeugung einer „Tabelle“, die in der 1.Spalte
alle möglichen Suchbegriffe beinhaltet und in
der 2.Spalte die Verweise auf diejenigen
Dokumente (Adressen, etc.), die diese
Suchbegriffe beinhalten.
19
invertierter Index
Datenbank
SQL
Internet
Computer
Textverarbeitung
D1,D4,D7,D9
D2,D4,D7,D8
D5,D6,D7,D8,D9
D3,D4,D9
D1
Berücksichtigung von Stoppwortlisten, d.s. Listen
von Begriffen ohne Informationsgehalt (der, die, ...)
Vorteil: Massive Beschleunigung des Suchprozesses
20
Einsatz von IR-Systemen
•
•
•
•
Literaturrecherche
Suchmaschinen im Internet
Suchverfahren im Multimediabereich
...
21
7
Herunterladen