Datenorganisation Februar bis Mai 2007 Dipl.-Oek. Patrick Bartels Institut für Wirtschaftsinformatik Universität Hannover Telefon: +49 (0) 511 762 - 4979 +49 (0) 170 342 84 95 Email: [email protected] Internet: www.iwi.uni-hannover.de Willkommen zur 1. Lehrveranstaltung „Datenorganisation“ Datenorganisation | Veranstaltung 1 Zur Person 3 • Dipl.-Ök. Patrick Bartels • Studium der Wirtschaftswissenschaften 1997 bis 2002 in Hannover, Vertiefungsfächer u. a. Wirtschaftsinformatik und eCommerce • Seit 1998 bis 2005 freiberuflicher Unternehmensberater • Seit 2002 bis 2007 wiss. Mitarbeiter am Institut für Wirtschaftsinformatik (www.iwi.uni-hannover.de) • Hauptlehrgebiete: Datenorganisation, Informationsmanagement, VoIP, eLearning, eCommerce. • Seit 2004 Dozent an der Leibniz Akademie Hannover • Seit 2007 Dozent an der Fernhochschule Hamburg • Seit 2007 Mitarbeiter bei der VHV Gruppe im Projektmanagement 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Zur Person 4 • Kontakt: — Telefon: 0511 / 762 - 4979 (Di. bis Do., 12 bis 16 Uhr) — Email: [email protected] — Sprechstunden nach Vereinbarung • Folien: — Nach jeder Veranstaltung im Netz 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Inhalt der Veranstaltung 5 • Grobe Inhaltsübersicht — Grundlagen — Datenbanken — Konzeptionelle Modellierung — Moderne Datenbankarchitekturen — Data-Warehouses • 6 Veranstaltungen Theorie, 2 Veranstaltungen Praxis (Access) • Fragen fragen!!! • Klausuraufbau 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Literatur 6 • Ferstl, O. K.; Sinz, E. J.: Grundlagen der Wirtschaftsinformatik, Band 1, 4. Aufl., München/Wien: Oldenbourg, 2006. ISBN: 3486255878 • Kemper, A.; Eickler, A.: Datenbanksysteme — Eine Einführung, 5. Aufl., München/Wien: Oldenbourg, 2004. ISBN: 3486273922 • Schicker, E.: Datenbanken und SQL, 3. Aufl., Stuttgart u. a.: Teubner, 2000. ISBN: 3519229919 • Schwarze, J.: Einführung in die Wirtschaftsinformatik, 5. Aufl., Herne/Berlin: NWB-Verlag, 2000. ISBN: 3482485518 • Vossen, G.: Datenmodelle, Datenbanksprachen und Datenbank-ManagementSysteme, 4. Aufl., München/Wien: Oldenbourg, 2000. ISBN: 3486245449 • Stahlknecht, P.; Hasenkamp, U.: Einführung in die Wirtschaftsinformatik, 11. Auflage, Berlin: Springer 2004. ISBN: 3540011838 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 0. Motivation Datenorganisation | Veranstaltung 1 Motivation 8 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Motivation 9 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Motivation 10 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenbanken sind heute fast überall 11 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenbanken sind heute fast überall (Quelle: www.ryanair.com) 12 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenbanken sind heute fast überall (Quelle: www.dell.de) 13 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenbanken sind heute fast überall (Quelle: www.docmorris.com) 14 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenbanken sind heute fast überall 15 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenbanken sind heute fast überall 16 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenbanken sind heute fast überall 17 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenbanken sind heute fast überall Jeder Zweite arbeitet heute bereits am PC. Siehe: http://www.heise.de/newsticker/meldung/85539/from/rss09 http://www.spiegel.de/netzwelt/tech/0,1518,467255,00.html http://www.zdnet.de/news/business/0,39023142,39151883,00.htm http://www.computerbase.de/news/allgemein/studien/2007/februar/jeder_zweite_computer/ http://www.netzeitung.de/arbeitundberuf/541375.html 18 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 1. Grundlagen der Datenorganisation Datenorganisation | Veranstaltung 1 Definition von Daten, Informationen und Wissen Daten 20 • Brenner: Daten sind die Repräsentation von Informationen auf einem bestimmten Medium (Datenträger).[1] • Voß/Gutenschwager: Daten sind eine Folge von Zeichen, über deren Bedeutung weitestgehend Konsens besteht, d.h. die verstanden und prinzipiell von einer Person aufgenommen werden können.[2] • Schwarze: „Daten sind Zeichen ..., die Informationen zum Zwecke der Verarbeitung nach bestimmten Regeln oder Verabredungen darstellen.“ [1] Vgl. Brenner 1994, S. 168. [2] Vgl. Voß/Gutenschwager 2001, S. 24. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Definition von Daten, Informationen und Wissen Informationen 21 • Hansen/Neumann: „Daten … stellen Informationen … auf Grund bekannter oder unterstellter Abmachungen in einer maschinell verarbeitbaren Form dar“.[1] • Wittmann: Informationen sind zweckorientiertes Wissen zur Vorverarbeitung des Handelns.[2] • Schwarze: Informationen sind mitgeteilte und aufgenommene Bestandteile von Wissen. Sie werden aus Wissen abgeleitet und sollen das Wissen eines Empfängers erweitern und/oder aktualisieren.[3] [1] Vgl. Hansen/Neumann 2001, S. 8. [2] Vgl. Wittmann 1959, S. 14. [3] Vgl. Schwarze 1998, S. 24. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Definition von Daten, Informationen und Wissen Wissen 22 • Kant: Endlich heißt das sowohl subjectiv als auch objectiv zureichende Führwahrhalten Wissen.[1] • Stickel: Wissen ist die Gesamtheit aller Kenntnisse und Fertigkeiten auf einem bestimmten Gebiet.[2] • Wittmann: Als Wissen sollen Vorstellungsinhalte verstanden werden, die Überzeugungen über die Wahrheit von Feststellungen (Aussagen, Behauptungen, Sätzen) zum Inhalt haben.[3] • Ropohl: Wissen ist die Menge der in Informationsspeichern fixierten und durch planmäßigen Abruf reproduzierbaren Informationen.[4] [1] Vgl. Kant 1781, S. 823. [2] Vgl. Stickel 2001, S. 2. [3] Vgl. Wittmann 1979, Sp. 2263. [4] Vgl. Ropohl 1979, S. 216. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Definition von Daten, Informationen und Wissen 23 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Fazit — Was sind Daten? Der Begriff Daten wird meist im Kontext der maschinellen Verarbeitung, insbesondere mittels Computer, verwendet. Daten bestehen aus einem oder mehreren Zeichen. Die meisten Daten entstehen in operativen Systemen. Sie können aber auch z. B. von Informationsanbietern erworben werden. Daten sind selbst nur „Träger von Informationen“, d. h. sie sind das „Rohmaterial“ für die Erzeugung und Speicherung von Informationen. 24 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Fazit — Was sind Informationen? Aus den Daten entstehen durch Aufbereitung und Aggregation Informationen. Informationen sind zweckorientiert und kontextbezogen. Sie können weiterverarbeitet werden und werden so zu neuen Informationen bzw. zu Wissen. Kontextbezogen bedeutet bspw., dass die Zahl 1,27 ein Wechselkurs ist. 25 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele • Beispiel 1: Im Postleitzahlgebiet 30165 wohnt eine Bevölkerungsschicht, die mit 70 % Wahrscheinlichkeit Produkt x kaufen wird und deshalb über ein Mailing angesprochen werden soll. Dabei sind … — Daten: Die abgespeicherten alphanumerischen Zeichen in der Logdatei eines Webservers. — Informationen: Der User mit der IP-Adresse 125.75.126.7 hat hintereinander folgende Seiten besucht: Homepage, FAQSeite, Kontakte — Wissen: Die User, die die Seiten a-b-c-d-e in dieser Reihenfolge aufgerufen haben, haben in 70 % der Fälle das Produkt x gekauft. 26 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenorganisation vs. Datenmanagement • Datenorganisation umfasst — Analyse der logischen Datenstrukturen — Beschreibung der Datenstrukturen durch ein geeignetes Datenmodell — Bestimmung optimaler Speicherungsformen bezüglich • Kosten und • Verarbeitungs- bzw. Übertragungsgeschwindigkeit — Bestimmung von Schlüsseln zur Identifizierung von Daten — Bestimmung optimaler Manipulationsverfahren im Hinblick auf ein wirtschaftliches Gesamtkonzept eines IV-Systems. 27 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenorganisation vs. Datenmanagement Datenorganisation umfasst — Festlegung der Datenstrukturen (Datenmodellierung) und — Verfahren und Vorschriften zum Speichern, Widerauffinden und Verändern von Daten. Während Datenorganisation vor allem physische Datenspeicherung betrifft, bezieht sich Datenmanagement vor allem auf betriebswirtschaftliche Aspekte und Managementfragen. 28 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenmanagement Management wird bei Staehle als „Beschreibung der Prozesse und Funktionen, die in arbeitsteiligen Organisationen notwendig werden, wie Planung, Organisation und Kontrolle (managerial functions approach)“ beschrieben.[1] Dabei wird ausschließlich auf die Funktionen, die das Management ausübt abgezielt. Ein zweiter, personenbezogener Ansatz ist ebenfalls bei Staehle zu finden und bezeichnet als Management „die Personen (-gruppen), die Managementaufgaben wahrnehmen, ihre Tätigkeiten und Rollen (managerial roles approach)“. [1] Vgl. Staehle 1989, S. 65. 29 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenmanagement Datenmanagement umfasst alle Aufgaben der Planung, Steuerung und Kontrolle im Zusammenhang mit — Definition und Modellierung von Daten, — Entwurf und Betrieb von Datenbanken, — bedarfsgerechter Aufbereitung und — Präsentation der Daten, — Gewährleistung von Datensicherheit und — Datenschutz, — Beschaffung von Daten aus externen Quellen. Datenmanagement bezieht sich vor allem auf betriebswirtschaftliche Aspekte und Managementaufgaben. 30 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenmanagement Ziele des Datenmanagements — Bestmögliche Nutzung der Daten, — Verbesserung der Qualität der Informationen, — Erhöhung der Produktivität der Anwendungssystementwicklung und -nutzung durch den Einsatz von Datenbankmanagementsystemen (DBMS). Ziele des Datenmanagements sind Formalziele der Datenorganisation! 31 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenmanagement Gründe für den Wandel in der IT. 32 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenmanagement Viele IT-Entscheider wollen erreichen, dass man mit der IT schneller an die richtigen Informationen kommt. 33 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenmanagement Ö Entwicklung vom Push- zum Pull-Prinzip Vgl. Krcmar 2003, S. 50 34 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenmanagement Das erhöhte Informationsangebot erhöht den subjektiv empfundenen Informationsbedarf. Ö Informationsflut Vgl. Krcmar 2003, S. 52 35 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Bedeutung von Datenorganisation Aufgaben der Datenorganisation 36 • Datenmanagementstrategie: WELCHE Daten für WELCHE Systeme und Aufgaben WIE speichern und zur Verfügung stellen. • Die Datenmanagementstrategie leitet sich immer mittelbar aus der Unternehmensstrategie ab! • Festlegen der organisatorischen Verantwortung für Pflege und Erfassung der Daten. • Bereitstellung von Daten bzw. Informationen an der richtigen Stelle, zur richtigen Zeit, beim richtigen Adressaten, in der richtigen Form. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Bedeutung von Datenorganisation Effiziente Datenorganisation ist wichtiger denn je, da 37 • Daten sind notwendig zur Erledigung von Aufgaben. • Daten haben in IV-Systemen die längste Lebensdauer. • Daten ändern sich in IV-Systemen am schnellsten. • Daten sind strategische Erfolgsfaktoren. • Das Datenvolumen nimmt ständig zu. • Daten stammen aus unterschiedlichen Quellen. • Daten können unterschiedliche Formate haben. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Daten in betrieblichen Aufgaben 38 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Anforderungen an die Realisierung einer Datenbank 39 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Daten in unterschiedlichen Aufgabenbereichen 40 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 41 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Aufbau des Datenmanagements 42 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Anforderungen an ein Datenmanagement Zentrale Anforderungen sind 1. minimale Zugriffs- und Übertragungszeiten, 2. minimale (optimale) Redundanz, 3. logische Integration und Zentralisierung, 4. überschaubarer innerer Aufbau, 5. Anpassbarkeit der Datenstruktur und der Daten, 6. logische und physische Unabhängigkeit, 7. Möglichkeiten der Auswertung und Verknüpfung, 8. Datenintegrität, 9. Wirtschaftlichkeit. 43 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Beispiele für einzelne Anforderungen: 44 • Schneller Zugriff: Auskunfts- und Reservierungssysteme • Anpassbarkeit und Aktualisierbarkeit: Bestellannahme • Schutz vor unbefugtem Zugriff: Vertrauliche Personaldaten • Beliebige Auswertbarkeit: Umsatzauswertungen • Flexible Verknüpfbarkeit: Errechnung von Kennzahlen 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (1) - Ansatzpunkte zur Beeinflussung der Zugriffs- und Übertragungszeiten: 45 • Hardwarekonfiguration, • Verteilung der Datenbank, • Konfiguration des Netzwerkes, • Parameter des Betriebssystems, • Parameter des DBMS, • Datenstrukturen, • physische Struktur der Daten, • Zugriffsverwaltung. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (2) - Minimale (optimale) Redundanz: 46 • Redundanz bedeutet hier die mehrfache Datenhaltung, • Redundanz beansprucht Ressourcen, • Redundanz verursacht Kosten, • Redundanz kann zu Anomalien führen, • Redundanz, z. B. bei Sicherungskopien, ist notwendig, • redundante Datenhaltung kann die Zugriffsgeschwindigkeit auf Daten erheblich verbessern (physische Struktur), bspw. bei verteilten Datenbanken. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (3) - logische Integration und Zentralisierung 47 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (4) - Überschaubarer innerer Aufbau: 48 • erleichtert das Verständnis der DB, • erleichtert die Administration, • erleichtert die Fehlerbehebung, • erleichtert die Einarbeitung, • spart Kosten, • kann in Konflikt stehen mit anderen Zielen. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (5) - Anpassbarkeit der Datenstruktur und der Daten 49 • Anpassung der Datenmengen, • Rahmenbedingungen ändern sich (Technologie), • neue Anforderungen entstehen, • alte Anforderungen werden unwichtig (z. B. Sparsamkeit beim Gebrauch von Ressourcen), • neue Datentypen entstehen (z. B. Audio, Video). 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (6) - logische und physische Unabhängigkeit 50 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (7) - Möglichkeiten der Auswertung und Verknüpfung hängen ab von: 51 • der Komplexität der Auswertungen, • den Möglichkeiten des DBMS, • der gewünschten Schnelligkeit der Auswertungen, • der Darstellung der Auswertung, • den Datenquellen, • den unterschiedlichen Datenformaten. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (8) - Datenintegrität: 52 • Datenkonsistenz (Widerspruchsfreiheit) — Plausibilität der Eingabedaten, — konkurrierender Zugriff, — konsistente Datenmanipulation. • Datensicherheit — Zugriff von unberechtigten Personen, — Schutz gegen absichtliches Verändern, — Schutz gegen unabsichtliches Verändern oder Zerstören. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (8) - Datenintegrität: • 53 Datenschutz (rechtliche Aspekte) — Schutz personenbezogener Daten — vor dem unbefugtem Zugriff und — der unbefugtem Weitergabe. — Geregelt z. B. im Bundesdatenschutzgesetz, Landesdatenschutzgesetz, Betriebsverfassungsgesetz 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Zu (9) - Wirtschaftlichkeit: 54 • Erstinvestition als auch Kosten des operativen Betriebs betrachten • Berücksichtigung des Wirtschaftlichkeitsprinzips (Minimalprinzip bzw. Maximalprinzip) • Insbesondere ist die Wirtschaftlichkeit bei der Auswahl und beim Customizing von Standardsoftware (z. B. SAP / R3) zu berücksichtigen. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Beispiele für einzelne Anforderungen Anforderungen sind teilweise konkurrierend: 55 • Redundanzfreiheit vs. schneller Zugriff • Schutz vor unbefugtem Zugriff vs. beliebige Auswertbarkeit • usw… 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 2. Grundbegriffe der Datenorganisation Datenorganisation | Veranstaltung 1 Komponenten eines IV-Systems Komponenten eines IV-Systems.[1] [1] 57 Vgl. Schwarze 2000, S. 49. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenelement, Datensegment und Datensatz 58 • Zeichen (Character) = kleinste speicherbare Einheit • Datenelement (item) = kleinste logische Dateneinheit, 1 oder mehrere Zeichen • Datensegment = logisch zusammenhängende Felder • Datensatz (set) = Zusammenfassung logisch zusammengehöriger Datensegmente oder —elemente • Datei (file) = logische Zusammenfassung von Datensätzen mit der gleichen Struktur • Datenbank (database) = Zusammenfassung logisch zusammengehöriger Dateien 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenelement, Datensegment und Datensatz Datenelemente und Datensätze.[1] [1] Vgl. Schwarze 2000 S. 208. 59 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenelement, Datensegment und Datensatz Datenelemente und Datensätze. 60 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenelement, Datensegment und Datensatz Hierarchie der Begriffe in der Datenorganisation 61 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten Basiseigenschaften von Daten 62 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten Basiseigenschaften von Daten — Elementare Datentypen 63 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten | Datentypen Vorteile der Zuordnung von Daten zu Typen — Daten- und Programmentwurf erfolgt bewusster und verständlicher, — Verminderung von Laufzeitfehlern durch Überprüfung, ob sich Wertebereiche und Operationen eines Programms vertragen sowie — speichersparende und laufzeiteffiziente Darstellung von Variablen. 64 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten | Datentypen Fragestellungen bei der Auswahl von Datentypen — Welche Werte muss ein Attribut annehmen können? — Welche Operationen sollen auf dem Attribut möglich sein? — Wie viel Speicherplatz darf ein Datentyp höchstens beanspruchen? — Muss sich ein Attribut sortieren oder indizieren lassen? — Wie werden Werte sortiert? Ö Eine Art (unvollständige) Checkliste für eigene Datenbanken! 65 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten Basiseigenschaften von Daten 66 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten Verschiedene Datenformate als Beispiel: • numerische Formate: Decodierung der Bitfolge 1010000 als Dezimalzahl 80 • alphanumerische Formate: Entschlüsselung der Bitfolge 1010000 unter dem ASCII-Code als Buchstabe P (65-90: A-Z) • Interpretation von Bildmustern: 1 als „Bildpunkt/ Pixel“ und 0 als „kein Bildpunkt/Pixel“ • Interpretation als Tondaten: Bitfolgen als Frequenz- oder Amplitudenwerte akustischer Signale Bild- und Tondaten werden oft in Feldern der Datentypen — BLOB (Binary Large Objects, variabel lange Zeichenfolgen zur Verschlüsselung von Texten, Bildern, Ton) und — OLE (Object Linking and Embedding) gespeichert 67 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten Basiseigenschaften von Daten Daten Datentyp y Wertemenge (z. B. reelle Zahlen) y zulässige Operationen (z. B. Addition, Subtraktion) 68 22. Februar 2007 Datenformat y interne und externe Repräsentation (Anzahl mögliche Stellen, Anzahl der Nachkommastellen) Dipl.-Ök. Patrick Bartels Eigenbereich y Anwendungsspezifische Wertemenege Datenorganisation | Veranstaltung 1 Datenarten Systematik von Daten 69 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten Strukturierte, konsistente und redundante Daten 70 • strukturiert: Systematische Untergliederungen und Verknüpfungen sind möglich. • konsistent: Konsistenzbedingungen werden eingehalten, keine Widersprüchlichkeiten. • Redundanz: Mehrfaches Vorkommen der gleichen Aussage. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenarten Strukturierte, konsistente und redundante Daten — Beispiele: Vorname Strasse + Nr. Name PLZ Ortschaft PLZ Ortschaft Heidi Badstrasse 3 Meier 54000 Baden 54000 Baden Ursula Buckmatte 1 Müller 54000 Münzlishausen 54000 Münzlishausen Patrick Zwyssigstrasse 28 Roth 54000 Wettingen 54050 Baden-Dättwill 54300 Wettingen Frage: • Daten strukturiert? • Daten konsistent? • Daten redundant? Beispiel aus Zehnder, C. A..: Informationssysteme und Datenbanken. vdf Hochschulverlag, 6. Auflage 1998, S. 25. 71 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenschlüssel 72 • Kombination von Datenelementen, mit denen ein Datensatz (eindeutig) identifiziert werden kann. • Dienen nicht immer der eindeutigen Identifizierbarkeit. • Liefern oft auch zusätzliche Informationen (sprechender Schlüssel, Informationsschlüssel). 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenschlüssel Ziel ist es, das richtige Feld oder die optimale Kombination von Feldern zur Identifikation auszuwählen. 73 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenschlüssel Schlüssel bzw. Datenschlüssel: 74 • Identifikationsschlüssel Æ eindeutige Identifikation • Klassifikationsschlüssel Æ Zuordnung übereinstimmender Eigenschaften • Verbundschlüssel Æ Klassifikations- und Identifikationsfunktion • Parallelschlüssel Æ Ergänzung des identifizierenden Teils um einen klassifizierenden • Primärschlüssel Æ Hauptordnungskriterium • Sekundärschlüssel Æ Kombination von Datenelementen 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenschlüssel 75 • Primärschlüssel? • Sekundärschlüssel? • Andere Schlüssel? 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenschlüssel Arten von Datenschlüsseln Datenschlüsselarten.[1] [1] Vgl. Schwarze 2000, S. 213. 76 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 Datenschlüssel Anforderungen an Schlüsselsysteme: 77 • Eindeutigkeit, • laufende Zuordnung, d.h. jedes neue Objekt erhält einen Schlüssel, • ausreichende Anzahl verschiedener Schlüsselnummern, • Kürze, • Flexibilität gegenüber Änderungen, • Wiederverwendbarkeit, d.h. erneute Vergabe freiwerdender Schlüssel. 22. Februar 2007 Dipl.-Ök. Patrick Bartels Datenorganisation | Veranstaltung 1 78 22. Februar 2007 Dipl.-Ök. Patrick Bartels