k01 Einfuehrung und Grundbegriffe

Werbung
1.EinführungundGrundbegriffe
Vorlesung"Informationssysteme"
Sommersemester2017
Überblick
§ WasisteinInformationssystem?
§ AufgabeneinesInformationssystems(IS)
• wichtigeAnwendungsklassen
§ NutzungvonDatenbanksystemen
• AnforderungenundAufgaben
§ WichtigeKonzepteundEigenschaftenvonDBS
§ ArchitekturvonDBS
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
2
WassindInformationssysteme(IS)?
§ ComputergestützteProgrammsysteme,
• dieInformationenerfassen,dauerhaftspeichern,verarbeiten,
verändern,analysieren,bereitstellen,anzeigen
§ BetrieblicheInformationssysteme
• spiegelnGeschäftsmodelleinesUnternehmenswider
• organisierenundunterstützenArbeitsabläufe
• integriereneineVielzahlvonDatenquellen
§ Web-basierteInformationssysteme
• stellenInformationsdiensteüberWeb-Schnittstellenzur
Verfügung
• unterstützendieAbwicklungvonGeschäftsvorgängenüberdas
Internet(E-Business)
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
3
Beispiele
§ Universitätsinformationssystem(KIS,QIS,...)
• Daten:Fachbereiche,Studenten,Professoren,Vorlesungen,
Prüfungen,...
• Vorgänge:typischeVerwaltungsaufgaben
§ Produktionsbetrieb
• Daten:Abteilungen,Mitarbeiter,Produkte,Projekte,Lieferanten,...
• Vorgänge:Gehaltsabrechnung,FertigungundVersandvon
Produkten,Lagerhaltung,...
§ Bank
• Daten:Filialen,Kunden,Konten,...
• Vorgänge:Zahlungsverkehrs,Kundenverwaltung,Geldanlage,
Zinsberechnung,...
§ Internet-Auktionshaus
• Daten:Produkte,Käufer,Verkäufer,Auktionen,...
• Vorgänge:SuchenachangebotenenWaren,Prüfender
VertrauenswürdigkeitderVerkäufer,DurchführenderAuktionen,...
§ AberauchSuchmaschinen,sozialeNetzwerke,Google-Anwendungen,...
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
4
AufbaueinesrechnergestütztenInformationssystems
Anwendungssysteme
Datenbanksystem
Betriebssystem
Hardware
§ Datenbanksystem(DBS)istzentraleKomponentefürKIS
• Datenbank(DB):SammlunggespeicherteroperationalerDaten,
dievondenAnwendungssystemeneinesbestimmten
Unternehmensbenötigtwerden
• Datenbankverwaltungssystem(DBVS,DBMS):standardisiertes
SoftwaresystemzurDefinition,Verwaltung,Verarbeitungund
AuswertungvonDB-Daten.
§ Grobdefinition:DBS=DB+DBVS
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
5
ZielsetzungenfürbetrieblicheIS
§ AnforderungensindspezifischfürUnternehmensebene
§ OperierendeEbene(Sachbearbeitung)
• VerbesserungdurchAuskunfts-,Berichts-,Buchungs-,Produktions-,
Steuerungs-,Vertriebs- undAnwendungssysteme
• Kennzeichen:VerarbeitungbegrenzterDatenmengenund
großeÄnderungshäufigkeitderDaten
§ PlanendenEbene(mittleresManagement)
• Unterstützungundevtl.Teilautomatisierungdurch
benutzerorientierteBereitstellungvonInformationen,Sucheund
AuswertungvonDatenimDialog,AutomatisierungvonRoutineEntscheidungen,Einsatzvonmathematisch-statistischenMethoden
• Kennzeichen:teilweisenichtvorhersehbarerInformationsbedarf,
verdichteteDaten,großeDatenmengen,keinÄnderungsdienst
§ UnterstützungderstrategischenEbene
• durchBereitstellungvonDatenfüreinenüberwiegendnicht
vorhersehbarenInformationsbedarf
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
6
WichtigeAnwendungsklassen
§ OLTP(On-LineTransactionProcessing)
AbwicklungvonTransaktionenaufdenoperationalenDaten
UPDATE Accounts
SET Balance = Balance – 300
WHERE Acct# = 03874
BOT
Transaktionsprogramme
Transaktionssystem
EOT
Informationssysteme2017
Datenbanksystem
Karte ?
Karte
PIN??
Karte
?
PIN?
Konto?
PIN?
Konto?
Buchung
Konto?
Buchung
Ausgabe
Buchung
Ausgabe
Ausgabe
Acct#
Balance
03874
14.00
...
...
OK
Kapitel1:EinführungundGrundbegriffe
7
WichtigeAnwendungsklassen(2)
§ OLAP(On-LineAnalyticalProcessing)
AnalysebetrieblicherDatenbestände,meistanhandeinesDW
(DataWarehouse)
• alsthemenorientierte,historische,zeitlichveränderliche
Datensammlung,getrenntvondenoperationalenDaten
• aussehrgroßenDatenbeständenabgeleitetund
multidimensional aufgegliedert
• Voraggregation derDatenausLeistungsgründen
• inkrementelleAktualisierungdesDWausdenoperationalen
DBS(z. B.jedeNacht)erfolgen.
Operationale
Daten
Quelle
Quelle
Quelle
Abbildungssystem
Data
Warehouse
Anwendungssysteme
Quelle
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
8
WichtigeAnwendungsklassen(3)
§ DM(DataMining):
• selbständiges AufspürenvoninhärentenDaten- bzw.
Informationsmustern ausgroßendynamischenDatenbeständen
- BeziehungenzwischenDatensätzenoderzwischenAttributeneines
Satzes
- gewisseRegelmäßigkeitenoderRegelabweichungeninAttributwerten
• Erkennenvonunscharfenoderprobabilistischen Regeln
erforderlich
Wirksamkeit
Data
Mining
Strategisch
OLAP,DataWarehouse
Planend
Transaktionsverarbeitung(OLTP)
Effizienz
(heterogeneIS,isolierteInformationsinseln,
Operational
stetiganwachsendeDatenbestände)
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
9
NutzungvonDatenbanksystemenfürIS
§ Vielfältige,wiederkehrendeAnforderungenundAufgabenbeider
EntwicklungvonIS
• ZuverlässigeVerwaltunggroßer,persistenterDatenmengen
• EffizienterDatenzugriff
• FlexibleAuswahlundVerknüfungvonDaten
• Leistungsanforderungen
§ AdressierungdieserAnforderungen
• durchDateisystemenichtbzw.nursehrunzureichendgegeben
• inderAnwendungzukomplexundteuer
⇨ Einsatz(historisch:Entwicklung)vonDatenbanksystemenzur
ÜbernahmevonkritischenDatenverwaltungsaufgaben
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
10
VermeidungvonDatenredundanzundInkonsistenzen
§ TraditionelleDateiverarbeitung
• jedeBenutzergruppeplegteigeneDateien
- Beispiel:StudierendensekretariatundPrüfungsamtverwalten
StudierendendateningetrenntenDateien
• vieleDatenwerdenmehrfach(redundant)gespeichert
- imBeipiel:Matrikelnummer,Name,Kontaktinfo,...
- redundanterArbeitsaufwand,VerschwendungvonResourcen(Speicher)
- inkonsistenteÄnderungsstände!
§ Datenbanksystem
• integrierteDatenbankohneRedundanz
- vermeidetdieo.g.Probleme
• DatenbankentwurfberücksichtigtdieSichtenaller
Benutzergruppen
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
11
FlexibleundmächtigeZugriffs- bzw.Anfragemöglichkeiten
§ WertbasierteAuswahlvonDatensätzenundVerknüpfungvon
Sätzen
Beispiel:GibmirdieKontaktinfosallerStudierenden,diebeider
Prüfung"Informationssysteme"mit2.0oderbesserbestanden
haben
§ MitDateisystemschwerbisunmöglichzurealisieren,erfordert
komplexeFilter- undVerknüpfungslogikinderAnwendung
§ Datenbanksystem
• einheitlicheModellierungundSpeicherungdergesamten
Informationen
• mächtige(deklarative)AnfragesprachezurAuswahlund
VerknüpfungvonDaten
• effizienteZugriffsverfahrenfürgroßeDatenmengen
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
12
UnterstützungvonMehrbenutzerbetrieb
§ EinISwirdmeistvonvielenBenutzerngleichzeitigbenutzt
• Beispiele:Flugreservierung,Banktransaktionen,...
§ UnkontrollierterZugriffaufdiegleichenDatenkannproblematisch
sein(Mehrbenutzeranomalien,z.B.lostupdate)
Abheben(Benutzer1)
LeseKontostandvon1234
KtoStd:=KtoStd- Betrag1
SchreibeKontostandvon1234
Überweisen(Benutzer2)
....
LeseKontostand1234
KtoStd:=KtoStd+Betrag2
SchreibeKontostandvon1234
§ DateisystemebietenkeineoderungenügendeKontrolle
§ DatenbanksystemebietenMehrbenutzerkontrollemitHilfesog.
Synchronisationsverfahren
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
13
ZuverlässigkeitundFehlertoleranz
§ AuftretenvonFehlernkannzuDatenverlustführen
• Programmfehler,Systemausfall,Hardwarefehler,...
§ Ziel:Wiederherstellendesletztenkonsistenten(gemäßderrealen
Weltgültigen)GesamtzustandsderDaten
§ Dateisystemeunzureichend,periodischesSichernvonDateien
nichtausreichend
§ Datenbanksysteme
• EinsatzvonLogging&Recoverymechanismen
• dadurchSchutzvorDatenverlust
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
14
ÜberwachungvonIntegritätsbedingungen
§ IntegritätsbedingungensindlogischeBedingungen,welchevon
korrektenDateneingehaltenwerdenmüssen
• könnenkomplexseinundmehrereInformationseinheiten
betreffen
- BeispielUniversität:einePrüfungdarfnurfürimmatrikulierteundnicht
beurlaubteStudierendedurchgeführtwerdenundmanhatmaximal3
Versuche
§ DateisystemebietenkeineUnterstützung,Prüfungder
BedingungeninderAnwendungistunzureichend
§ Datenbanksystem
• unterstütztexpliziteIntegritätsbedingungen
• PrüfungderBedingungenundZurückweisenvonOperationen,
welchesieverletzen,zuwohldefiniertenZeitpunkten
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
15
Zugriffskontrolle
§ DerZugriff(LesenundinsbesondereÄndern)aufDatenmuß
• aufbestimmteBenutzeroderBenutzergruppeneinschränkbar
und
• füreinzelneBestandteile(Attribute)vonObjektenund
TeilmengenvonObjektenkontrollierbarsein
§ DateisystemebietennichtdieerforderlicheFlexibilität
§ Datenbanksysteme
• Zugriffsprivilegien(Lesen,Ändern,...)fürBenutzer,Rollen
• sehrflexibelundfeingranulareinsetzbar
- aufTeilevonObjektenverwendbar(z.B.spezifischeEigenschaftenwie
Name,GehalteinesAngestellten)
- aufTeilmengenvonObjektendesgleichenTypsdefinierbar(z.B.
ManagerdarfnurdasGehaltseinereigenenMitarbeitersehen)
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
16
WichtigeKonzepteundEigenschaftenvonDBS
§
§
§
§
§
§
DatenbankschemaundAusprägung
Datenmodelle
Datenabstraktion
Datenunabhägigkeit
Datenbanksprachen
Transaktionskonzept
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
17
DatenbankschemaundAusprägung
§ Datenbankschema(auch:Intension)
• legtdieStrukturdergespeichertenDB-Objektefest
• Metadaten(DatenüberDaten),weitgehendzeitinvariant
• wirdimDatenbankkatalogaufbewahrt
§ AusprägungoderInstanz(auch:Extension)
• dieeigentlichenDaten(-sätze)
• veränderlich
Schema
Ausprägungen
ANGESTELLTER
PNR
NAME
TAETIGKEIT
GEHALT
ALTER
496
Peinl
Pförtner
2100
63
497
Kinzinger
Kopist
2800
25
498
Meyweg
Kalligraph
4500
56
...
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
18
Datenmodelle
§ Datenmodell
• enthältModellierungskonstruktezurAbbildungeinesAusschnittsder
realenWelt(Miniwelt,universeofdiscourse)
• "Sprache"zurBeschreibungderStruktureinerDB,alsoDatentypen/strukturen,Beziehungen,Integritätsbedingungen
§ KategorienvonDatenmodellen
• KonzeptuelleDatenmodellebzw.Informationsmodelle
- unabhängigvomeingesetztenDBS
- Beispiele:Entity-Relationship-Modell(ERM),UML
• Logische(Implementations-)Datenmodelle
-
werdendirektvonDBVSenunterstützt
definierenaußerdem(generische)OperationenzurDatenmanipulation
dominant:relational(undobjekt-relational)
weitere:hierarchisch,netzwerkartig,objektorientiert,semistrukturiert/XML
• PhysischeDatenmodelle
- zurBeschreibungderDatenspeicherungund–organisation
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
19
Datenmodellierung
Miniwelt
Manuelle/intellektuelle
Modellierung
KonzeptuellesSchema
(ER-Schema)
Halbautomatische
Transformation
Relationales
Schema
Informationssysteme2017
XMLSchema
NetzwerkSchema
Kapitel1:EinführungundGrundbegriffe
Objektorientiertes
Schema
20
ModellierungeinerkleinenBeispielanwendung
Studenten
Professoren
Vorlesungen
RealeWelt:Universität
KonzeptuelleModellierung
MatrNr
Name
Studenten
PersNr
Professoren
hören
Name
lesen
VorlNr
Vorlesungen
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
Titel
21
TransformationinRelationalesSchema
MatrNr
Name
Studenten
Professoren
hören
Name
lesen
VorlNr
Vorlesungen
Titel
Transformation
Studenten
MatrNr
PersNr
Professoren
Name
PersNr
...
Name
...
Lesen
Hören
MatrNr
...
VorlNr
Vorlesungen
VorlNr
Titel
PersNr
VorlNr
...
...
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
22
Datenmodelle- EvolutionundHistorie
Relational Data Model
SQL-86
CODASYL Standard
ODMG 1.1
SQL
XML 1.0
EntityRelationship
Model
SQL:1999
XML Schema 1.0
SQL/XML
XQuery 1.0
Hierarchical
Network
Relational
Object-Oriented
Object-Relational
Semi-Structured
XML
1960
Informationssysteme2017
1970
1980
1990
2000
Kapitel1:EinführungundGrundbegriffe
2010
23
Datenabstraktion
Sicht1
Sicht2
...
logischesSchema
internesSchema
Informationssysteme2017
Sichtn
externe Ebene (Sichten)
jedes externe Schema (mit log. DM spezifiziert)
beschreibt die Sicht einer Benutzergruppe als
Teilmenge des log. Schemas
logische Ebene
DB-Schema (mit log. DM spezifiziert)
beschreibt die Struktur der gesamten DB
für alle Nutzer
physische Ebene
internes Schema (mit phys. DM beschrieben)
legt fest, wie die Daten gespeichert werden
Kapitel1:EinführungundGrundbegriffe
24
Datenunabhägigkeit
Sicht1
Sicht2
...
logischesSchema
Sichtn
logische Datenunabhängigkeit
einfache Änderungen des log. Schemas
(Umbenennungen, neue Satztypen und Attribute)
können in den Sichten verborgen werden;
Anwendungen nutzen nur die Sichten und
bleiben unberührt
physische Datenunabhängigkeit
log. Schema verbirgt mögliche Änderungen
im internen Schema (physische Ebene);
Anwendungen und Sichtendefinitionen auf
der externen Ebene bleiben unberührt
internesSchema
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
25
Datenbanksprachen
§ Datendefinitionssprache(DataDefinitionLanguage,DDL)
• zurDefinitiondeslogischenSchemasimDBS
• beinhaltetoftSprachefürinternesundexternesSchema:
- Speicherdefinitionssprache(StorageDefinitionLanguage,SDL)
- View-Definitionssprache(ViewDefinitionLanguage,VDL)
§ Datenmanipulationssprache(DataManipulationLanguage,DML)
• Anfragesprache(QueryLanguage,QL)
• ÄnderungsoperationenzumEinfügen,ÄndernundLöschen
§ ArtderDML
• prozedural:navigierend,satzorientiert,inProgrammgenutzt
• deklarativ:mengenorientiert– "welche"Datensindgewünscht
§ NutzungderDML:interaktivoderineinemProgramm
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
26
Beispiel:SQL
§ DML:Anfragen
select Name
from Studenten
where MatrNr='123456';
§ DDL
createtable Studenten(
MatrNr char(6) primarykey,
Name
varchar(30));
createtable Vorlesungen(
VorlNr char(10) primarykey,
Titel
varchar(30));
select s.Name,s.MatrNr,h.VorlNr
from Studentens,Hörenh
where s.MatrNr=h.MatrNr;
createtable Hören(
MatrNr
char(6)
references Studenten,
VorlNr
char(10)
references Vorlesungen,
primarykey (MatrNr,VorlNr));
...
Studenten
Hören
MatrNr
MatrNr
...
Name
...
Informationssysteme2017
Vorlesungen
VorlNr
VorlNr
...
Titel
§ DML:Änderungen
insertinto Studenten
values ('456789','HeinzMüller');
deletefrom Hören
where MatrNr='123456';
update Vorlesungen
set Titel='Datenbanksysteme'
where
Titel='Datenbankanwendung';
Kapitel1:EinführungundGrundbegriffe
27
Transaktionskonzept
§ DBSunterstütztMehrbenutzerbetrieb,Zuverlässigkeit,
FehlertoleranzundIntegritätderDaten
§ TransaktionskonzeptalsneuesVerarbeitungsparadigma
• istVoraussetzungfürdieAbwicklungbetrieblicher
Anwendungen(mission-criticalapplications)
• erlaubt"Vertragsrecht"inrechnergestütztenISzu
implementieren
§ Transaktionerlaubt"Bündelung"mehrereDB-Zugriffsoperationen
zueinerEinheit
• Beispieltransaktion"Überweisung"(Operationen1– 6)
(1)LeseKontostandvonAina;
(2)a:=a- 100;
(3)SchreibeainDB;
Informationssysteme2017
(4)LeseKontostandvonBinb;
(5)b:=b+100;
(6)SchreibebinDB;
Kapitel1:EinführungundGrundbegriffe
28
EigenschaftenvonTransaktionen(ACID-Paradigma)
§ Atomicity (Atomarität)
• TAistkleinste,nichtmehrweiterzerlegbareEinheit(„alles-oder-nichts“)
• EntwederwerdenalleÄnderungenderTAfestgeschriebenodergarkeine
§ Consistency (Konsistenz)
• EndzustandeinerTAmussdiedefiniertenIntegritätsbedingungenerfüllen
• andernfallswirdsiekomplett(sieheAtomarität)zurückgesetzt
• ZwischenzuständewährendderTA-Bearbeitungdürfeninkonsistentsein
§ Isolation
• Nebenläufig(parallel,gleichzeitig)ausgeführteTAdürfensichnicht
gegenseitigbeeinflussen
• AlleanderenparallelausgeführtenTAbzw.derenEffektedürfennicht
sichtbarsein
§ Durability (Dauerhaftigkeit)
• WirkungeinererfolgreichabgeschlossenenTAbleibtdauerhaftinderDB
• auchnacheinemSystemfehler(HW- oderSystem-SW)gewährleistet
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
29
Architektur:VereinfachtesDBMS-Schichtenmodell
Art der Operationen an
Der Schnittstelle
Aufgaben der
Systemschicht
Übersetzung und Optimierung
von Anfragen
Datensystem
Deskriptive Anfragen
Zugriff auf Satzmengen
Satzzugriffe
Verwaltung von physischen
Sätzen und Zugriffspfaden
DB-Puffer- und
Externspeicherverwaltung
Zugriffssystem
Seitenzugriffe
Speichersystem
DB
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
30
ArchitekturübersichteinesDBS(vereinfacht)
Fortgeschrittene
Benutzer
„Naive“
Benutzer
Anwendung
Interaktive
Anfrage
AnwendungsProgrammierer
Datenbankadministratoren
Präcompiler
Verwaltungswerkzeug
DML-Compiler
DDL-Compiler
Anfragebearbeitung
Mehrbenutzersynchr.
Fehlerbehandlung
DBMS
Datenbankmanager
Schemaverwaltung
Dateiverwaltung
Logdateien
Informationssysteme2017
Indexe
Datenbasis
Kapitel1:EinführungundGrundbegriffe
Datenwörterbuch
31
DBSimEinsatz
§ WiesiehtderHerstellermarktaus?
• KommerzielleSysteme
- Oracle,IBM,MicrosoftmitdengrößtenAnteilen
- danebenSybase,NCRTeradata
• OpenSource-System
- MySQL,Postgres,Derby,...
§ Fürstrukturierte Daten
• StarkeDominanzvonrelationalenDBMS
• HierarchischeDBMSund(flache)DateienspielenweiterhineineRolle
§ TrendfürDBS
• 85%derweltweitverfügbarenDatensindsemi- oderunstrukturiert
(Internet,wiss.AufzeichnungenundExperimenteusw.)
• UnterstützungfürXML,Dokumente,InformationRetrieval,
Multimedia,...
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
32
Zusammenfassung
§ InformationundInformationssysteme
• wichtigeAnwendungsklassenfür
- operierendeEbene:OLTP
- planende/kontrollierendeEbene:DW,OLAP
- strategischeEbene:OLAP,DM
§ EinsatzvonDBSzurBewältigungvonwiederkehrenden,kritischen
Datenverwaltungsaufgaben
• VermeidungvonRedundanzen,Inkonsistenzen
• FlexibleundmächtigeZugriffs- undVerknüfungsmöglichkeiten
• UnterstützungvonMehrbenutzerbetrieb
• ZuverlässigkeitundFehlertoleranz
• DatenintegritätundZugriffskontrolle
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
33
Zusammenfassung(2)
§ WichtigeKonzepteundEigenschaftenvonDBS
• TrennungvonSchemaundAusprägung
- Schemaweitgehendzeitinvariant,Ausprägungändertsichlaufend
• DatenmodellezurModellierungeinerMiniwelt
- konzeptuelle,logischeundphysischeModellierung
• DatenabstraktionundDatenunabhängigkeit
- gezielteUnterstützungvonBenutzergruppen
- AnwendungbleibtisoliertvonÄnderungenderinternenundphysichen
Strukturmodelle
• Datenbanksprachen
- DatendefinitionundDatenmanipulation
- deklarative,mengenorientierteAnfragen
• Transaktionskonzept(ACID)alswichtigesVerarbeitungsmodell
§ Vereinfachte(Schichten-)ArchitekturfürDBS
Informationssysteme2017
Kapitel1:EinführungundGrundbegriffe
34
Herunterladen