1.EinführungundGrundbegriffe Vorlesung"Informationssysteme" Sommersemester2017 Überblick § WasisteinInformationssystem? § AufgabeneinesInformationssystems(IS) • wichtigeAnwendungsklassen § NutzungvonDatenbanksystemen • AnforderungenundAufgaben § WichtigeKonzepteundEigenschaftenvonDBS § ArchitekturvonDBS Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 2 WassindInformationssysteme(IS)? § ComputergestützteProgrammsysteme, • dieInformationenerfassen,dauerhaftspeichern,verarbeiten, verändern,analysieren,bereitstellen,anzeigen § BetrieblicheInformationssysteme • spiegelnGeschäftsmodelleinesUnternehmenswider • organisierenundunterstützenArbeitsabläufe • integriereneineVielzahlvonDatenquellen § Web-basierteInformationssysteme • stellenInformationsdiensteüberWeb-Schnittstellenzur Verfügung • unterstützendieAbwicklungvonGeschäftsvorgängenüberdas Internet(E-Business) Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 3 Beispiele § Universitätsinformationssystem(KIS,QIS,...) • Daten:Fachbereiche,Studenten,Professoren,Vorlesungen, Prüfungen,... • Vorgänge:typischeVerwaltungsaufgaben § Produktionsbetrieb • Daten:Abteilungen,Mitarbeiter,Produkte,Projekte,Lieferanten,... • Vorgänge:Gehaltsabrechnung,FertigungundVersandvon Produkten,Lagerhaltung,... § Bank • Daten:Filialen,Kunden,Konten,... • Vorgänge:Zahlungsverkehrs,Kundenverwaltung,Geldanlage, Zinsberechnung,... § Internet-Auktionshaus • Daten:Produkte,Käufer,Verkäufer,Auktionen,... • Vorgänge:SuchenachangebotenenWaren,Prüfender VertrauenswürdigkeitderVerkäufer,DurchführenderAuktionen,... § AberauchSuchmaschinen,sozialeNetzwerke,Google-Anwendungen,... Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 4 AufbaueinesrechnergestütztenInformationssystems Anwendungssysteme Datenbanksystem Betriebssystem Hardware § Datenbanksystem(DBS)istzentraleKomponentefürKIS • Datenbank(DB):SammlunggespeicherteroperationalerDaten, dievondenAnwendungssystemeneinesbestimmten Unternehmensbenötigtwerden • Datenbankverwaltungssystem(DBVS,DBMS):standardisiertes SoftwaresystemzurDefinition,Verwaltung,Verarbeitungund AuswertungvonDB-Daten. § Grobdefinition:DBS=DB+DBVS Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 5 ZielsetzungenfürbetrieblicheIS § AnforderungensindspezifischfürUnternehmensebene § OperierendeEbene(Sachbearbeitung) • VerbesserungdurchAuskunfts-,Berichts-,Buchungs-,Produktions-, Steuerungs-,Vertriebs- undAnwendungssysteme • Kennzeichen:VerarbeitungbegrenzterDatenmengenund großeÄnderungshäufigkeitderDaten § PlanendenEbene(mittleresManagement) • Unterstützungundevtl.Teilautomatisierungdurch benutzerorientierteBereitstellungvonInformationen,Sucheund AuswertungvonDatenimDialog,AutomatisierungvonRoutineEntscheidungen,Einsatzvonmathematisch-statistischenMethoden • Kennzeichen:teilweisenichtvorhersehbarerInformationsbedarf, verdichteteDaten,großeDatenmengen,keinÄnderungsdienst § UnterstützungderstrategischenEbene • durchBereitstellungvonDatenfüreinenüberwiegendnicht vorhersehbarenInformationsbedarf Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 6 WichtigeAnwendungsklassen § OLTP(On-LineTransactionProcessing) AbwicklungvonTransaktionenaufdenoperationalenDaten UPDATE Accounts SET Balance = Balance – 300 WHERE Acct# = 03874 BOT Transaktionsprogramme Transaktionssystem EOT Informationssysteme2017 Datenbanksystem Karte ? Karte PIN?? Karte ? PIN? Konto? PIN? Konto? Buchung Konto? Buchung Ausgabe Buchung Ausgabe Ausgabe Acct# Balance 03874 14.00 ... ... OK Kapitel1:EinführungundGrundbegriffe 7 WichtigeAnwendungsklassen(2) § OLAP(On-LineAnalyticalProcessing) AnalysebetrieblicherDatenbestände,meistanhandeinesDW (DataWarehouse) • alsthemenorientierte,historische,zeitlichveränderliche Datensammlung,getrenntvondenoperationalenDaten • aussehrgroßenDatenbeständenabgeleitetund multidimensional aufgegliedert • Voraggregation derDatenausLeistungsgründen • inkrementelleAktualisierungdesDWausdenoperationalen DBS(z. B.jedeNacht)erfolgen. Operationale Daten Quelle Quelle Quelle Abbildungssystem Data Warehouse Anwendungssysteme Quelle Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 8 WichtigeAnwendungsklassen(3) § DM(DataMining): • selbständiges AufspürenvoninhärentenDaten- bzw. Informationsmustern ausgroßendynamischenDatenbeständen - BeziehungenzwischenDatensätzenoderzwischenAttributeneines Satzes - gewisseRegelmäßigkeitenoderRegelabweichungeninAttributwerten • Erkennenvonunscharfenoderprobabilistischen Regeln erforderlich Wirksamkeit Data Mining Strategisch OLAP,DataWarehouse Planend Transaktionsverarbeitung(OLTP) Effizienz (heterogeneIS,isolierteInformationsinseln, Operational stetiganwachsendeDatenbestände) Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 9 NutzungvonDatenbanksystemenfürIS § Vielfältige,wiederkehrendeAnforderungenundAufgabenbeider EntwicklungvonIS • ZuverlässigeVerwaltunggroßer,persistenterDatenmengen • EffizienterDatenzugriff • FlexibleAuswahlundVerknüfungvonDaten • Leistungsanforderungen § AdressierungdieserAnforderungen • durchDateisystemenichtbzw.nursehrunzureichendgegeben • inderAnwendungzukomplexundteuer ⇨ Einsatz(historisch:Entwicklung)vonDatenbanksystemenzur ÜbernahmevonkritischenDatenverwaltungsaufgaben Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 10 VermeidungvonDatenredundanzundInkonsistenzen § TraditionelleDateiverarbeitung • jedeBenutzergruppeplegteigeneDateien - Beispiel:StudierendensekretariatundPrüfungsamtverwalten StudierendendateningetrenntenDateien • vieleDatenwerdenmehrfach(redundant)gespeichert - imBeipiel:Matrikelnummer,Name,Kontaktinfo,... - redundanterArbeitsaufwand,VerschwendungvonResourcen(Speicher) - inkonsistenteÄnderungsstände! § Datenbanksystem • integrierteDatenbankohneRedundanz - vermeidetdieo.g.Probleme • DatenbankentwurfberücksichtigtdieSichtenaller Benutzergruppen Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 11 FlexibleundmächtigeZugriffs- bzw.Anfragemöglichkeiten § WertbasierteAuswahlvonDatensätzenundVerknüpfungvon Sätzen Beispiel:GibmirdieKontaktinfosallerStudierenden,diebeider Prüfung"Informationssysteme"mit2.0oderbesserbestanden haben § MitDateisystemschwerbisunmöglichzurealisieren,erfordert komplexeFilter- undVerknüpfungslogikinderAnwendung § Datenbanksystem • einheitlicheModellierungundSpeicherungdergesamten Informationen • mächtige(deklarative)AnfragesprachezurAuswahlund VerknüpfungvonDaten • effizienteZugriffsverfahrenfürgroßeDatenmengen Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 12 UnterstützungvonMehrbenutzerbetrieb § EinISwirdmeistvonvielenBenutzerngleichzeitigbenutzt • Beispiele:Flugreservierung,Banktransaktionen,... § UnkontrollierterZugriffaufdiegleichenDatenkannproblematisch sein(Mehrbenutzeranomalien,z.B.lostupdate) Abheben(Benutzer1) LeseKontostandvon1234 KtoStd:=KtoStd- Betrag1 SchreibeKontostandvon1234 Überweisen(Benutzer2) .... LeseKontostand1234 KtoStd:=KtoStd+Betrag2 SchreibeKontostandvon1234 § DateisystemebietenkeineoderungenügendeKontrolle § DatenbanksystemebietenMehrbenutzerkontrollemitHilfesog. Synchronisationsverfahren Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 13 ZuverlässigkeitundFehlertoleranz § AuftretenvonFehlernkannzuDatenverlustführen • Programmfehler,Systemausfall,Hardwarefehler,... § Ziel:Wiederherstellendesletztenkonsistenten(gemäßderrealen Weltgültigen)GesamtzustandsderDaten § Dateisystemeunzureichend,periodischesSichernvonDateien nichtausreichend § Datenbanksysteme • EinsatzvonLogging&Recoverymechanismen • dadurchSchutzvorDatenverlust Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 14 ÜberwachungvonIntegritätsbedingungen § IntegritätsbedingungensindlogischeBedingungen,welchevon korrektenDateneingehaltenwerdenmüssen • könnenkomplexseinundmehrereInformationseinheiten betreffen - BeispielUniversität:einePrüfungdarfnurfürimmatrikulierteundnicht beurlaubteStudierendedurchgeführtwerdenundmanhatmaximal3 Versuche § DateisystemebietenkeineUnterstützung,Prüfungder BedingungeninderAnwendungistunzureichend § Datenbanksystem • unterstütztexpliziteIntegritätsbedingungen • PrüfungderBedingungenundZurückweisenvonOperationen, welchesieverletzen,zuwohldefiniertenZeitpunkten Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 15 Zugriffskontrolle § DerZugriff(LesenundinsbesondereÄndern)aufDatenmuß • aufbestimmteBenutzeroderBenutzergruppeneinschränkbar und • füreinzelneBestandteile(Attribute)vonObjektenund TeilmengenvonObjektenkontrollierbarsein § DateisystemebietennichtdieerforderlicheFlexibilität § Datenbanksysteme • Zugriffsprivilegien(Lesen,Ändern,...)fürBenutzer,Rollen • sehrflexibelundfeingranulareinsetzbar - aufTeilevonObjektenverwendbar(z.B.spezifischeEigenschaftenwie Name,GehalteinesAngestellten) - aufTeilmengenvonObjektendesgleichenTypsdefinierbar(z.B. ManagerdarfnurdasGehaltseinereigenenMitarbeitersehen) Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 16 WichtigeKonzepteundEigenschaftenvonDBS § § § § § § DatenbankschemaundAusprägung Datenmodelle Datenabstraktion Datenunabhägigkeit Datenbanksprachen Transaktionskonzept Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 17 DatenbankschemaundAusprägung § Datenbankschema(auch:Intension) • legtdieStrukturdergespeichertenDB-Objektefest • Metadaten(DatenüberDaten),weitgehendzeitinvariant • wirdimDatenbankkatalogaufbewahrt § AusprägungoderInstanz(auch:Extension) • dieeigentlichenDaten(-sätze) • veränderlich Schema Ausprägungen ANGESTELLTER PNR NAME TAETIGKEIT GEHALT ALTER 496 Peinl Pförtner 2100 63 497 Kinzinger Kopist 2800 25 498 Meyweg Kalligraph 4500 56 ... Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 18 Datenmodelle § Datenmodell • enthältModellierungskonstruktezurAbbildungeinesAusschnittsder realenWelt(Miniwelt,universeofdiscourse) • "Sprache"zurBeschreibungderStruktureinerDB,alsoDatentypen/strukturen,Beziehungen,Integritätsbedingungen § KategorienvonDatenmodellen • KonzeptuelleDatenmodellebzw.Informationsmodelle - unabhängigvomeingesetztenDBS - Beispiele:Entity-Relationship-Modell(ERM),UML • Logische(Implementations-)Datenmodelle - werdendirektvonDBVSenunterstützt definierenaußerdem(generische)OperationenzurDatenmanipulation dominant:relational(undobjekt-relational) weitere:hierarchisch,netzwerkartig,objektorientiert,semistrukturiert/XML • PhysischeDatenmodelle - zurBeschreibungderDatenspeicherungund–organisation Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 19 Datenmodellierung Miniwelt Manuelle/intellektuelle Modellierung KonzeptuellesSchema (ER-Schema) Halbautomatische Transformation Relationales Schema Informationssysteme2017 XMLSchema NetzwerkSchema Kapitel1:EinführungundGrundbegriffe Objektorientiertes Schema 20 ModellierungeinerkleinenBeispielanwendung Studenten Professoren Vorlesungen RealeWelt:Universität KonzeptuelleModellierung MatrNr Name Studenten PersNr Professoren hören Name lesen VorlNr Vorlesungen Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe Titel 21 TransformationinRelationalesSchema MatrNr Name Studenten Professoren hören Name lesen VorlNr Vorlesungen Titel Transformation Studenten MatrNr PersNr Professoren Name PersNr ... Name ... Lesen Hören MatrNr ... VorlNr Vorlesungen VorlNr Titel PersNr VorlNr ... ... Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 22 Datenmodelle- EvolutionundHistorie Relational Data Model SQL-86 CODASYL Standard ODMG 1.1 SQL XML 1.0 EntityRelationship Model SQL:1999 XML Schema 1.0 SQL/XML XQuery 1.0 Hierarchical Network Relational Object-Oriented Object-Relational Semi-Structured XML 1960 Informationssysteme2017 1970 1980 1990 2000 Kapitel1:EinführungundGrundbegriffe 2010 23 Datenabstraktion Sicht1 Sicht2 ... logischesSchema internesSchema Informationssysteme2017 Sichtn externe Ebene (Sichten) jedes externe Schema (mit log. DM spezifiziert) beschreibt die Sicht einer Benutzergruppe als Teilmenge des log. Schemas logische Ebene DB-Schema (mit log. DM spezifiziert) beschreibt die Struktur der gesamten DB für alle Nutzer physische Ebene internes Schema (mit phys. DM beschrieben) legt fest, wie die Daten gespeichert werden Kapitel1:EinführungundGrundbegriffe 24 Datenunabhägigkeit Sicht1 Sicht2 ... logischesSchema Sichtn logische Datenunabhängigkeit einfache Änderungen des log. Schemas (Umbenennungen, neue Satztypen und Attribute) können in den Sichten verborgen werden; Anwendungen nutzen nur die Sichten und bleiben unberührt physische Datenunabhängigkeit log. Schema verbirgt mögliche Änderungen im internen Schema (physische Ebene); Anwendungen und Sichtendefinitionen auf der externen Ebene bleiben unberührt internesSchema Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 25 Datenbanksprachen § Datendefinitionssprache(DataDefinitionLanguage,DDL) • zurDefinitiondeslogischenSchemasimDBS • beinhaltetoftSprachefürinternesundexternesSchema: - Speicherdefinitionssprache(StorageDefinitionLanguage,SDL) - View-Definitionssprache(ViewDefinitionLanguage,VDL) § Datenmanipulationssprache(DataManipulationLanguage,DML) • Anfragesprache(QueryLanguage,QL) • ÄnderungsoperationenzumEinfügen,ÄndernundLöschen § ArtderDML • prozedural:navigierend,satzorientiert,inProgrammgenutzt • deklarativ:mengenorientiert– "welche"Datensindgewünscht § NutzungderDML:interaktivoderineinemProgramm Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 26 Beispiel:SQL § DML:Anfragen select Name from Studenten where MatrNr='123456'; § DDL createtable Studenten( MatrNr char(6) primarykey, Name varchar(30)); createtable Vorlesungen( VorlNr char(10) primarykey, Titel varchar(30)); select s.Name,s.MatrNr,h.VorlNr from Studentens,Hörenh where s.MatrNr=h.MatrNr; createtable Hören( MatrNr char(6) references Studenten, VorlNr char(10) references Vorlesungen, primarykey (MatrNr,VorlNr)); ... Studenten Hören MatrNr MatrNr ... Name ... Informationssysteme2017 Vorlesungen VorlNr VorlNr ... Titel § DML:Änderungen insertinto Studenten values ('456789','HeinzMüller'); deletefrom Hören where MatrNr='123456'; update Vorlesungen set Titel='Datenbanksysteme' where Titel='Datenbankanwendung'; Kapitel1:EinführungundGrundbegriffe 27 Transaktionskonzept § DBSunterstütztMehrbenutzerbetrieb,Zuverlässigkeit, FehlertoleranzundIntegritätderDaten § TransaktionskonzeptalsneuesVerarbeitungsparadigma • istVoraussetzungfürdieAbwicklungbetrieblicher Anwendungen(mission-criticalapplications) • erlaubt"Vertragsrecht"inrechnergestütztenISzu implementieren § Transaktionerlaubt"Bündelung"mehrereDB-Zugriffsoperationen zueinerEinheit • Beispieltransaktion"Überweisung"(Operationen1– 6) (1)LeseKontostandvonAina; (2)a:=a- 100; (3)SchreibeainDB; Informationssysteme2017 (4)LeseKontostandvonBinb; (5)b:=b+100; (6)SchreibebinDB; Kapitel1:EinführungundGrundbegriffe 28 EigenschaftenvonTransaktionen(ACID-Paradigma) § Atomicity (Atomarität) • TAistkleinste,nichtmehrweiterzerlegbareEinheit(„alles-oder-nichts“) • EntwederwerdenalleÄnderungenderTAfestgeschriebenodergarkeine § Consistency (Konsistenz) • EndzustandeinerTAmussdiedefiniertenIntegritätsbedingungenerfüllen • andernfallswirdsiekomplett(sieheAtomarität)zurückgesetzt • ZwischenzuständewährendderTA-Bearbeitungdürfeninkonsistentsein § Isolation • Nebenläufig(parallel,gleichzeitig)ausgeführteTAdürfensichnicht gegenseitigbeeinflussen • AlleanderenparallelausgeführtenTAbzw.derenEffektedürfennicht sichtbarsein § Durability (Dauerhaftigkeit) • WirkungeinererfolgreichabgeschlossenenTAbleibtdauerhaftinderDB • auchnacheinemSystemfehler(HW- oderSystem-SW)gewährleistet Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 29 Architektur:VereinfachtesDBMS-Schichtenmodell Art der Operationen an Der Schnittstelle Aufgaben der Systemschicht Übersetzung und Optimierung von Anfragen Datensystem Deskriptive Anfragen Zugriff auf Satzmengen Satzzugriffe Verwaltung von physischen Sätzen und Zugriffspfaden DB-Puffer- und Externspeicherverwaltung Zugriffssystem Seitenzugriffe Speichersystem DB Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 30 ArchitekturübersichteinesDBS(vereinfacht) Fortgeschrittene Benutzer „Naive“ Benutzer Anwendung Interaktive Anfrage AnwendungsProgrammierer Datenbankadministratoren Präcompiler Verwaltungswerkzeug DML-Compiler DDL-Compiler Anfragebearbeitung Mehrbenutzersynchr. Fehlerbehandlung DBMS Datenbankmanager Schemaverwaltung Dateiverwaltung Logdateien Informationssysteme2017 Indexe Datenbasis Kapitel1:EinführungundGrundbegriffe Datenwörterbuch 31 DBSimEinsatz § WiesiehtderHerstellermarktaus? • KommerzielleSysteme - Oracle,IBM,MicrosoftmitdengrößtenAnteilen - danebenSybase,NCRTeradata • OpenSource-System - MySQL,Postgres,Derby,... § Fürstrukturierte Daten • StarkeDominanzvonrelationalenDBMS • HierarchischeDBMSund(flache)DateienspielenweiterhineineRolle § TrendfürDBS • 85%derweltweitverfügbarenDatensindsemi- oderunstrukturiert (Internet,wiss.AufzeichnungenundExperimenteusw.) • UnterstützungfürXML,Dokumente,InformationRetrieval, Multimedia,... Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 32 Zusammenfassung § InformationundInformationssysteme • wichtigeAnwendungsklassenfür - operierendeEbene:OLTP - planende/kontrollierendeEbene:DW,OLAP - strategischeEbene:OLAP,DM § EinsatzvonDBSzurBewältigungvonwiederkehrenden,kritischen Datenverwaltungsaufgaben • VermeidungvonRedundanzen,Inkonsistenzen • FlexibleundmächtigeZugriffs- undVerknüfungsmöglichkeiten • UnterstützungvonMehrbenutzerbetrieb • ZuverlässigkeitundFehlertoleranz • DatenintegritätundZugriffskontrolle Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 33 Zusammenfassung(2) § WichtigeKonzepteundEigenschaftenvonDBS • TrennungvonSchemaundAusprägung - Schemaweitgehendzeitinvariant,Ausprägungändertsichlaufend • DatenmodellezurModellierungeinerMiniwelt - konzeptuelle,logischeundphysischeModellierung • DatenabstraktionundDatenunabhängigkeit - gezielteUnterstützungvonBenutzergruppen - AnwendungbleibtisoliertvonÄnderungenderinternenundphysichen Strukturmodelle • Datenbanksprachen - DatendefinitionundDatenmanipulation - deklarative,mengenorientierteAnfragen • Transaktionskonzept(ACID)alswichtigesVerarbeitungsmodell § Vereinfachte(Schichten-)ArchitekturfürDBS Informationssysteme2017 Kapitel1:EinführungundGrundbegriffe 34