Datenorganisation | Veranstaltung 2 Datenorganisation Februar bis Mai 2007 Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover Telefon: +49 (0) 511 762 - 4979 +49 (0) 170 342 84 95 Email: [email protected] Internet: www.iwi.uni-hannover.de 1 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Inhalt der Veranstaltung 2. Datenbanken 2.1 Grundlagen 2.2 Drei-Ebenen-Architektur 2.3 Datenmodellierung 2.3.1 Der Modellbegriff 2.3.2 Datenmodelle 2.3.2.1 Konzeptionell 2.3.2.2 Logisch 2.3.2.3 Physisch 2.3.3 Datenbankmodelle 2.3.3.1 Hierarchisch 2.3.3.2 Netzwerk 2.3.3.3 Relational 2.3.3.4 Objektorientiert 2.4 Abstraktionskonzepte für Daten 2.5 Datenbankentwurf 3 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Wiederholung 4 • Motivation • Daten, Zeichen, Informationen, Wissen, Können, … • Abgrenzung Datenorganisation und Datenmanagement • Datensatz, Datenelement, Datei, Schlüssel, Datenarten, … 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Bedeutung von Datenorganisation Effiziente Datenorganisation ist wichtiger denn je, da 5 • Daten sind notwendig zur Erledigung von Aufgaben. • Daten haben in IV-Systemen die längste Lebensdauer. • Daten ändern sich in IV-Systemen am schnellsten. • Daten sind strategische Erfolgsfaktoren. • Das Datenvolumen nimmt ständig zu. • Daten stammen aus unterschiedlichen Quellen. • Daten können unterschiedliche Formate haben. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Motivation 6 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Motivation • Wirtschaftsinformatiker als Schnittstelle • Datenspezialisten sind derzeit gefragt — Data- and Information-Lifecycle-Management — Integrationsprojekte • Land Niedersachsen — VoIP • Nds. Landesamt für Denkmalpflege (NLD) • „Fast Close“ Ö Schnellere Jahresabschlüsse 7 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Definition von Daten, Informationen und Wissen 8 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Datenmanagement Ziele des Datenmanagements — Bestmögliche Nutzung der Daten, — Verbesserung der Qualität der Informationen, — Erhöhung der Produktivität der Anwendungssystementwicklung und -nutzung durch den Einsatz von Datenbankmanagementsystemen (DBMS). Ziele des Datenmanagements sind Formalziele der Datenorganisation! 9 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Bedeutung von Datenorganisation Aufgaben der Datenorganisation 10 • Datenmanagementstrategie: WELCHE Daten für WELCHE Systeme und Aufgaben WIE speichern und zur Verfügung stellen, • festlegen der organisatorischen Verantwortung für Pflege und Erfassung der Daten, • Bereitstellung von Daten bzw. Informationen an der richtigen Stelle, zur richtigen Zeit, beim richtigen Adressaten, in der richtigen Form. • Daraus leiten sich zentrale Anforderungen ab --> nächste Folie! 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 Anforderungen an ein Datenmanagement Zentrale Anforderungen sind 1. minimale Zugriffs- und Übertragungszeiten, 2. minimale (optimale) Redundanz, 3. logische Integration und Zentralisierung, 4. überschaubarer innerer Aufbau, 5. Anpassbarkeit der Datenstruktur und der Daten, 6. logische und physische Unabhängigkeit, 7. Möglichkeiten der Auswertung und Verknüpfung, 8. Datenintegrität, 9. Wirtschaftlichkeit. 11 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2. Datenbanken Datenorganisation | Veranstaltung 2 2.1 Grundlagen „Eine Datenbank ist die gemeinsame Speicherung logisch zusammenhängender Daten, um die Informationsbedürfnisse verschiedener Anwender in einer Organisation zu befriedigen.“ Quelle: Schwarze z. B. eine Auftragsdatenbank 13 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.1 Grundlagen „Eine Datenbank ist eine Sammlung von Daten, die untereinander in einer logischen Beziehung stehen und von einem eigenen Datenbankverwaltungssystem ... verwaltet werden.“ Quelle: Schicker 14 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.1 Grundlagen Beispiele für aktuelle (kommerzielle und freie) Datenbanken. 15 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.1 Grundlagen Anforderungen An Datenbanken können folgende Anforderungen gestellt werden: • Sammlung logisch verbundener Daten • Speicherung der Daten mit möglichst wenig Redundanz • Abfragemöglichkeit und Änderbarkeit von Daten • Logische Unabhängigkeit der Daten von ihrer physischen Struktur • Zugriffsschutz, Integrität, Mehrfachzugriff • Zuverlässigkeit, Ausfallsicherheit 16 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.1 Grundlagen Datenbank-Schema und -Inhalt • Das Datenbank-Schema beschreibt die logische Struktur der Daten (das „Design“). Es ändert sich nur selten. • Der Datenbank-Inhalt (Datenbank-Zustand) ergibt sich aus den zu einem bestimmten Zeitpunkt gespeicherten Daten. Die Daten ändern sich i. d. R. häufig. 17 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.1 Grundlagen Database Management System 18 • Ein Database Management System (DBMS, Datenbankverwaltungssystem) ist ein Programm, mit dem das Datenbank-Schema erstellt und verändert sowie auf den Datenbank-Inhalt zugegriffen werden kann. Quelle: Schwarze • „Die Gesamtheit der Programme zum Zugriff auf die Datenbasis, zur Kontrolle der Konsistenz und zur Modifikation der Daten wird als Datenbankverwaltungssystem bezeichnet.“ Quelle: Kemper, Eickler 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.1 Grundlagen Database Management System Ein DBMS deckt u. a. die folgenden Teilbereiche ab: 19 • Datendefinition (DDL: Data Description Language): Festlegung der logischen Strukturen. • Datenmanipulation (DML: Data Manipulation Language): Zugriff auf die Daten. • Datenspeicherung (DSDL: Data Storage Description Language): Optimierung der physischen Speicherung. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.1 Grundlagen Database Management System Datenbankmanagementsystem DBMS. Quelle: Schwarze 20 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.2 Drei-Ebenen-Architektur Einleitung 21 • Die drei dargestellten Teilbereiche eines DBMS können auch als Ebenen einer Datenbank interpretiert werden. • Die unterste Ebene einer Datenbank ist die physische Datenspeicherung (internes Schema). „Bei der Festlegung eines internen Schemas geht es vor allem um optimale Speicherausnutzung und zugriffszeitminimale Gestaltung der Zugriffspfade.“ 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.2 Drei-Ebenen-Architektur Einleitung 22 • Die mittlere Ebene bildet die logische Datenbankstruktur (logisches Schema) mittels logischen (datenbankabhängigen) Datenmodellen ab. • Die oberste Ebene einer Datenbank stellt die Schnittstelle zu den Anwendungen dar und wird externes Schema genannt. Es enthält nur denjenigen Ausschnitt des logischen Schemas, der für die zugehörige Anwendung benötigt wird. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.2 Drei-Ebenen-Architektur Drei-Ebenen-Architektur. Quelle: Schwarze 23 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.2 Drei-Ebenen-Architektur Konzeptionelles Datenbankmodell Ein konzeptionelles Datenmodell ist die Basis für die Entwicklung des logischen Datenmodells. Es wird nicht für eine konkrete Anwendung erstellt, d. h. es ist für alle potentiellen Anwendungen geeignet. Außerdem ist das konzeptionelle Datenmodell unabhängig von einem konkreten Datenbankmanagementsystem. 24 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3 Datenmodellierung Die Datenmodellierung teilst sich auf in 2.3.1 Den Modellbegriff 2.3.2 Das Datenmodell 2.3.2.1 Konzeptionelles Modell 2.3.2.2 Logisches Modell 2.3.2.3 Physisches Modell 2.3.3 Das Datenbankmodell 2.3.3.1 Hierarchisch 2.3.3.2 Netzwerk 2.3.3.3 Relational 2.3.3.4 Objektorientiert 25 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3.1 Der Modellbegriff 26 • ital. „modello“, lat. „modulus“ (Maß) • seit 16. Jahrhundert verwendet für: Vorbild, Muster, Entwurf, … • Der Begriff des Modells umfasst — die Abbildung eines Gebildes (verstanden als Entwurf) sowie — das Vorbild für ein Gebilde • In verschiedenen Wissenschaftsdisziplinen wird der Begriff unterschiedlich verwendet. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3.1 Der Modellbegriff Funktionen eines Modells — Abbildungsfunktion (mengentheoretische Zuordnung von Attributen des Originals zu Attributen des Modells) — Verkürzungsfunktion (Berücksichtigung nur von relevanten Merkmalen) — Pragmatische Funktion (Modelle sind Abbildungen für einen bestimmten Nutzer in einem bestimmten Zeitraum) 27 • „Modell: wovon Æ wozu Æ für wen“ • Modelle als Funktion mit genau einer Variablen und den Konstanten: Zeit, Ort, Zielgruppe, … • Modelle sind immer zweckorientiert! 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3.1 Der Modellbegriff Grundsätze ordnungsmäßiger Modellierung (GOM) 28 • Grundsatz der syntaktischen (strukturellen) und semantischen (inhaltlichen) Richtigkeit • Grundsatz der Relevanz • Grundsatz der Wirtschaftlichkeit • Grundsatz des systematischen Aufbaus • Grundsatz der Vergleichbarkeit • Grundsatz der Klarheit 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3.2 Datenmodelle • Beschreibung der in einem Unternehmen oder einem Informationssystem zu verwendenden Datenelemente • Unterscheidung zwischen: — Konzeptioneller Datenmodellierung — Logischer Datenmodellierung — Physischer Datenmodellierung 29 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3.2.1 Konzeptionelle Datenmodelle 30 • wird auch konzeptionelles oder semantisches Datenmodell genannt. • Aufgabe — formale Beschreibung der Daten und deren Beziehungen zueinander — unabhängig von einer bestimmten Anwendung (logisch) — unabhängig von einem bestimmten Datenbanksystem (physisch) • Bedeutung — ungeeignet für unmittelbare Verwendung zur Speicherung und Verwaltung von Daten. — notwendig zur unabhängigen Analyse von Datenstrukturen. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3.2.2 Logische Datenmodelle 31 • beschreibt die logische Struktur der Daten in einer Datenbank • unter Verwendung des jeweiligen Datenbankmodells • unabhängig von einer bestimmten Anwendung (logisch). 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3.2.2 Physische Datenmodelle 32 • … beschreibt die physische Form der Speicherung und den Datenzugriff und • ist die endgültige Überführung des logischen Datenmodells in das ausgewählte Datenbanksystem. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.3.3 Datenbankmodelle 33 • Datenbankmodelle sind bspw. — das hierarchische Datenbankmodell — das Netzwerk-Datenbankmodell — das relationale Datenbankmodell — das objektorientierte Datenbankmodell • Die derzeit auf dem Markt verfügbaren Datenbanksysteme basieren im Wesentlichen auf dem relationalen oder dem objektorientierten Datenbankmodell. • Näheres im Abschnitt 3.2. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.4 Abstraktionskonzepte für Daten 1. reale Welt Abstraktionsgrad 2. verbale Beschreibung der realen Welt 3. Modell der realen Welt 4. konzeptionelles Datenmodell 5. logisches Datenmodell 6. gespeicherte Information 7. Speichermedium Ö Zeichen 34 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.4 Abstraktionskonzepte für Daten 35 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.4 Abstraktionskonzepte für Daten Klassifikation 36 • Daten beziehen sich auf reale oder abstrakte Phänomene bzw. Gegenstände, die als Objekte bezeichnet werden können. • Gleichartige Objekte können zu Objektmengen zusammengefasst werden und durch einen Objekttyp beschrieben werden. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.4 Abstraktionskonzepte für Daten Beziehungen zwischen Objekten 37 • Zwischen Objekten können Beziehungen bestehen. • Beziehungen können zu Beziehungsmengen zusammengefasst werden, die durch Beziehungstypen beschrieben werden. • Beziehungstypen können Eigenschaften besitzen. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.4 Abstraktionskonzepte für Daten Aggregation 38 • Daten beziehen sich auf die Eigenschaften oder Attribute von Objekten. • Die interessierenden Eigenschaften eines Objekttyps sind für alle dazugehörigen Objekte gleich. • Ein konkretes Objekt hat bestimmte Ausprägungen oder Werte von Eigenschaften (Attributwerte). 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.4 Abstraktionskonzepte für Daten Spezialisierung und Generalisierung von Objekttypen 39 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Quelle: Vossen 1999, S.71f 40 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Quelle: Vossen 1999, S.69f 41 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf „Zum Datenbankentwurf gehört die Ermittlung der in einer Datenbank abzuspeichernden Daten, die Ermittlung der Datenstrukturen mit Objekttypen, Beziehungstypen und Attributen, Entwurf der konzeptionellen und logischen Datenmodelle sowie die Implementierung.“ Quelle: Schwarze 42 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Überblick über das Vorgehen bei der Datenbankentwicklung 43 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Vorgehensmodell bei der Datenbankentwicklung nach McFadden/Hoffer Quelle: in Anlehnung an McFadden/Hoffer 1994, S.37 44 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Vorgehensmodell bei der Datenbankentwicklung nach Vossen Quelle: Vossen 1999, S. 73 45 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Im Rahmen einer Anforderungsanalyse werden die Anforderungen aller potentiellen Nutzer der Datenbank ermittelt. Man unterscheidet dabei statische und dynamische Anforderungen. Quelle: Schwarze 46 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Bei der Untersuchung der statischen Anforderungen geht es darum, zu entscheiden welche Daten (was) gespeichert werden sollen, z. B. - Welche Objekte der realen Welt? - Welche Eigenschaften der Objekte? - Beziehungen zwischen Objekten? - Bestimmung von Schlüsseln? - Festlegung von Integritätsbedingungen? 47 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Die dynamischen Anforderungen betreffen die Anforderungen, die an die Be- und Verarbeitungsprozesse (wie) gestellt werden, z. B. - Verarbeitungsprozeduren - Datenvolumen - Effizienzanforderungen - Zugriffsbestimmungen - Sicherheitsanforderungen 48 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Anforderungskategorien Quelle: Schwarze 2000, S.250 49 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Stehen die Anforderungen an die zukünftige Datenbank fest, kann mit der konzeptionellen Datenmodellierung begonnen werden. Hierbei wird ein formales Datenbank-Schema bestimmt. Dabei ist darauf zu achten, dass das konzeptionelle Datenmodell unabhängig von einer konkreten Anwendung und auch unabhängig von dem später zum Einsatz kommenden DBMS sein sollte. 50 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf Das konzeptionelle Datenmodell ist die Grundlage für die logische Datenmodellierung, bei der ein logisches Datenbank-Schema entworfen wird. Dieses Datenmodell ist Datenbank-spezifisch, also angepasst an das jeweilige DBMS. Beim physischen Datenbankentwurf (internes Schema) werden Parameter festgelegt, die die Speicherung der Daten betreffen und auf die über das DBMS Einfluss genommen werden kann, z. B. Indizes oder die Größe von Pufferspeichern. 51 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 2.5 Datenbankentwurf In der Implementierungsphase wird die Datenbank mit den Vorgaben aus dem logischen Datenmodell und dem internen Schema erstellt. An die Implementierungsphase schließt sich die Phase des Betriebs an. In dieser Phase sind z. B. Wartungsarbeiten durchzuführen. 52 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3. Datenmodellierung Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung „IS weisen im allgemeinen eine hohe Komplexität auf. Geeignete Modellierungsmethodiken unterstützen die Beherrschung dieser Komplexität.“ Quelle: Ferstl/Sinz „Die methodisch geleitete Tätigkeit der Erstellung von Modellen wird als Modellierung bezeichnet.“ Quelle: Ferstl/Sinz 54 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung Modellierungsansätze (Sichten) für betriebliche IS: • Funktionale Zerlegung (z. B. HIPO) • Datenflussansatz (z. B. SADT, SA) • Datenmodellierung (z. B. ERM, SERM) • Objektorientierter Ansatz (z. B. UML) • Geschäftsprozessorientierter Ansatz (z. B. ARIS) 55 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung Funktionale Zerlegung: • Mehrstufige Zerlegung der Funktionen eines IS in Teilfunktionen • Festlegung von Schnittstellen • HIPO: Hierarchy of Input-Process-Output 56 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung Datenflussansatz: • Menge von Datenflüssen, die durch Aktivitäten transformiert werden • Hierarchische Verfeinerung der Aktivitäten • Datenspeicher zur Zwischenspeicherung von Datenflüssen • Kontakte zur Umwelt werden über Terminatoren abgebildet • SADT: Structured Analysis and Design Technique • SA: Strukturierte Analyse 57 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung Datenmodellierung: • Beschreibung der Struktur der Daten • Objekttypen, Beziehungen, Attribute • ERM: Entity-Relationship-Modell • SERM: Strukturiertes-Entity-Relationship-Modell 58 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung Objektorientierter Ansatz: • Beschreibung eines IS als Menge von Objekttypen • Attribute, Methoden, Nachrichten • mit Methoden werden Instanzen manipuliert • Nachrichten dienen der Kommunikation zwischen Objekten • UML: Unified Modeling Language 59 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung Geschäftsprozessorientierter Ansatz, z. B. ARIS : • Modellierung von Geschäftsprozessen bzw. Vorgängen • Dynamische und verhaltensorientierte Sicht • ARIS: Methode von Prof. Dr. Scheer Link 60 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung Jede Sicht des ARIS-Konzepts gibt das Modell eines Geschäftsprozesses unter einem bestimmten Aspekt wieder: • Funktionssicht: Alle funktionalen Elemente, ihre Gruppierungen und hierarchischen Beziehungen → Funktionsbaum • Organisationssicht: Alle Ressourcen (Menschliche Arbeitskräfte, Maschinen, Hardware), d. h. alle Organisationseinheiten und ihre Beziehungen → Organigramm • Datensicht: Alle Ereignisse (die Daten generieren) und Umfelddaten, wie Schriftverkehr, Dokumente etc., d. h. alle unternehmensrelevanten Informationsobjekte → Entity-Relationship-Modell • Steuerungssicht: Integration der vorangegangenen Sichten in einen logischen und zeitlichen Ablaufplan, d. h. Verknüpfung der anderen Sichten → Ereignisgesteuerte Prozesskette 61 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung Datenmodellierung: „Im Vordergrund stehen dabei die Analyse von Datenstrukturen und deren Darstellung in grafischen und tabellarischen Modellen.“ Ein Modell ist ein vereinfachtes Abbild der Realität. Ein Datenmodell beschreibt folglich Daten und ihre Strukturen. Quelle: Schwarze 62 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung „Daten beschreiben oder beziehen sich auf reale oder abstrakte Phänomene bzw. Gegenstände, die man als Objekte bezeichnet. Objekte sind grundsätzlich individuelle Exemplare.“ „Gleichartige Objekte kann man zu einer Objektmenge zusammenfassen und durch einen Objekttyp beschreiben.“ Beispiel: Schmidt, Meyer und Susi sind Objekte einer Objektmenge, die durch den Objekttyp Mensch beschrieben werden können. Quelle: Schwarze 63 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung „Daten beziehen sich auf die Eigenschaften oder Attribute von Objekten, sind also Informationen über Objekte. Die interessierenden Eigenschaften eines Objekttyps sind für alle dazugehörigen Objekte gleich.“ „An einem konkreten Objekt kann man bestimmte Ausprägungen oder Werte von Eigenschaften (Attributwerte) feststellen.“ Beispiel: Die Eigenschaften Name, Alter und Haarfarbe beschreiben den Objekttyp Mensch; Jochen, 25 und braun sind Ausprägungen. Quelle: Schwarze 64 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.1. Grundlagen der Datenmodellierung „Zwischen Objekten können Beziehungen (Relationship) bestehen. Beziehungen des gleichen Typs können zu Beziehungsmengen zusammengefasst werden, die durch Beziehungstypen beschrieben werden.“ „Beziehungstypen können wie Objekte Eigenschaften haben.“ Quelle: Schwarze 65 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell 66 • Im Jahr 1976 von Chen eingeführt. • Objekt-Beziehungs-Modell. • Wichtigstes konzeptionelles DM. • Relativ einfach. • Keine standardisierte Notation, sondern Defacto-Standard. • Wird permanent weiterentwickelt. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Grundlagen des ERM Entities 67 • Entities sind wohlunterscheidbare Dinge der realen Welt • Eine Menge von Entities wird Entity-Set (Entitäten-Menge) genannte (Entity = Patrick ⇒ Entity-Set = Mensch) • Entities besitzen Eigenschaften (sog. Attribute), deren konkrete Ausprägung Werte heißen • Alle zugelassenen Werte heißen Wertebereich • Attribute können zusammengesetzt sein • Attribute können mehrere Werte annehmen (mehrwertig) 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Ein Entity „ist ein abgrenzbares Objekt der Realität und kann sowohl ein reales Objekt als auch eine gedankliche Abstraktion darstellen.“ Eine Beziehung „ist eine Verknüpfung von zwei oder mehreren Entities.“ Quelle: Ferstl; Sinz Beispiel: Entität Mensch 68 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Zwei konkrete Ausprägungen des Entity-Set „Menschen“ 69 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Beispiel für den Wertebereich 70 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Beispiel für eine Beziehung 71 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Graphische Darstellung eines ER-Modells durch ein ERDiagramm: • Objekttypen durch Rechtecke • Beziehungstypen durch Rauten • Attribute durch Ellipsen • Primärschlüssel: unterstrichenes Attribut • Verbindung der Symbole erfolgt durch ungerichtete Kanten 72 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell 73 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell 74 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Objekte: — Personen: Patienten, Studenten — Gegenstände: Maschine, Gebäude — Vorgänge: Verkauf, Immatrikulation — Konzepte: Konto, Vorlesung Objekttyp: beschreibt Menge gleicher Objekte Instanz: einzelne Einheit des Objekttyps 75 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Attribute: • Student: • Auto: • Mitarbeiter: Immatrikulationsnummer, Name, Adresse Kennzeichen, Farbe, PS Mitarbeiter-, Personalnummer, Name, Kenntnisse "Attribute dienen dazu, Gegenstände bzw. Beziehungen zu charakterisieren.“ Quelle: Kemper/Eickler "Die Menge der Werte, die ein bestimmtes Attribut annehmen kann, nennt man den Wertebereich oder die Domäne (Domain).“ Quelle: Schwarze 76 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Primärschlüssel: „Ein Schlüsselkandidat ist eine minimale Attributkombination, mit der ein Objekt eindeutig identifiziert werden kann und deren Werte sich in der Regel nicht ändern.“ Quelle: Kemper/Eickler „Ein Schlüsselkandidat, der bei der Datenmodellierung als Identifikationsschlüssel festgelegt wird, heißt Primärschlüssel.“ Quelle: Ferstl/Sinz 77 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Tabellarische Darstellung von Datenstrukturen: - Für jeden Objekt- und jeden Beziehungstyp wird eine eigene Tabelle erzeugt. - Jedes Attribut ist eine Spalte der Tabelle. - Die Beziehungstabellen enthalten die Primärschlüssel der an der Beziehung beteiligten Objekttypen. 78 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Mehrwertige Attribute: • Ein mehrwertiges Attribut hat mehr als einen Wert für jede Instanz, z. B. Kenntnisse eines Mitarbeiters • 79 Als Symbol wird eine Ellipse mit doppelter Linie verwendet. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Sind in diesem ER-Diagramm mehrwertige Attribute vorhanden? 80 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell 81 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell 82 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Mehrwertige Attribute werden meist aus dem Objekttyp, in dem sie auftauchen, entfernt. 83 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Zusammengesetzte Attribute: • Ein zusammengesetztes Attribut besteht aus mehreren Attributen, z. B. besteht die Anschrift aus PLZ, Ort und Strasse. 84 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Eine Beziehung ist die Verbindung zwischen Objekten bzw. Objekttypen. Grad der Beziehung: • Binäre Beziehung zwischen 2 Objekten • Rekursive (unäre) Beziehung eines Objektes mit sich selbst • Dreistellige (ternäre) Beziehung zwischen 3 Objekten 85 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Kardinalität (Komplexität) der Beziehung: (Mengen-) Verhältnis, in welchem die beteiligten Objekttypen zueinander in Beziehung stehen. • 1:1-Beziehung (bspw. Mitarbeiter — Arbeitsplatz oder Stelle) • 1:n-Beziehung (bspw. Mitarbeiter — Abteilung) • n:m-Beziehung (bspw. Mitarbeiter — Projekt) 86 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Binäre Beziehungen: 87 Mitarbeiter 1 bekommt 1 Parkplatz Produktlinie 1 enthält n Produkt Student n hört m Vorlesung 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Rekursive Beziehungen: An einer Beziehung sind mehrere Objekte desselben Objekttyps beteiligt. An den Kanten sollte ein Rollenname angegeben werden. Beispiel Stücklistenstruktur: Ein Teil besteht aus mehreren Teilen und wird umgekehrt in mehreren Teilen verwendet. 88 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Produkte Endprodukt 1 Baugruppe 1 (8) Endprodukt 2 ET 3 (10) Einzelteil 1 (7) ET 2 (10) 89 26. Februar 2006 BG 2 (8) ET 1 (4) BG 1 (8) ET 3 (5) ET 1 (7) Dipl.-Ök. Patrick Bartels ET 2 (9) ET 2 (10) Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Rekursive Beziehung: verwendet in n TeilNr Teil Bezeichnung Struktur m besteht aus Quelle: Ferstl/Sinz 90 26. Februar 2006 Dipl.-Ök. Patrick Bartels Menge Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Top-Down-Ansatz der Datenmodellierung: 91 1. Bestimmung der Objekttypen und der Beziehungen zwischen den Objekttypen. Erstellung eines ER-Diagramms. 2. Zuordnung von Attributen zu den Objekttypen und Beziehungstypen. Bei großen ER-Diagrammen kann dies auch separat erfolgen. 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Schwache Objekttypen Starke Objekttypen existieren autonom. Schwache Objekttypen können nicht ohne die Existenz eines anderen (zugehörigen) Objektes vorkommen. Schwache Objekttypen sind also Objekttypen mit einer Existenzabhängigkeit. Primärschlüssel für Schwache Objekttypen bestehen aus dem Primärschlüssel des starken Objekttyps und einem Hilfsschlüssel. 92 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Schwache Objekttypen Schwache Objekttypen haben meist keinen (natürlichen) Primärschlüssel. Der Primärschlüssel eines schwachen Objekts setzt sich i. d. R. aus dem Primärschlüssel des übergeordneten Objekttyps sowie einem eigenen Attribut zusammen. Darstellung: Schwache Objekte werden mit einem doppelten Rahmen gekennzeichnet. 93 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Beispiel 1: Auftrag — Auftragsposition (AP) Auftrag 1 besteht aus n AP n Räume Beispiel 2: Gebäude — Räume Gebäude 94 26. Februar 2006 1 liegt in Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Aufgabe: Zeichnen Sie ein ER-Diagramm (ohne Attribute) mit den Objekttypen - Kunde, - Auftrag, - Auftragsposition, - Rechnung, - Rechnungsposition und - Artikel. Kennzeichen Sie schwache Objekttypen! 95 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Quelle: Ferstl/Sinz 96 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 3.2.1. Entity-Relationship-Modell Zusammenfassung der wichtigsten Symbole 97 26. Februar 2006 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 2 98 26. Februar 2006 Dipl.-Ök. Patrick Bartels