Datenorganisation

Werbung
Datenorganisation
Februar bis Mai 2007
Dipl.-Oek. Patrick Bartels
Institut für Wirtschaftsinformatik
Universität Hannover
Telefon:
+49 (0) 511 762 - 4979
+49 (0) 170 342 84 95
Email: [email protected]
Internet: www.iwi.uni-hannover.de
Willkommen zur 1. Lehrveranstaltung
„Datenorganisation“
Datenorganisation | Veranstaltung 1
Zur Person
3
•
Dipl.-Ök. Patrick Bartels
•
Studium der Wirtschaftswissenschaften 1997 bis 2002 in Hannover,
Vertiefungsfächer u. a. Wirtschaftsinformatik und eCommerce
•
Seit 1998 bis 2005 freiberuflicher Unternehmensberater
•
Seit 2002 bis 2007 wiss. Mitarbeiter am Institut für
Wirtschaftsinformatik (www.iwi.uni-hannover.de)
•
Hauptlehrgebiete: Datenorganisation, Informationsmanagement, VoIP,
eLearning, eCommerce.
•
Seit 2004 Dozent an der Leibniz Akademie Hannover
•
Seit 2007 Dozent an der Fernhochschule Hamburg
•
Seit 2007 Mitarbeiter bei der VHV Gruppe im Projektmanagement
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Zur Person
4
•
Kontakt:
— Telefon: 0511 / 762 - 4979 (Di. bis Do., 12 bis 16 Uhr)
— Email: [email protected]
— Sprechstunden nach Vereinbarung
•
Folien:
— Nach jeder Veranstaltung im Netz
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Inhalt der Veranstaltung
5
•
Grobe Inhaltsübersicht
— Grundlagen
— Datenbanken
— Konzeptionelle Modellierung
— Moderne Datenbankarchitekturen
— Data-Warehouses
•
6 Veranstaltungen Theorie, 2 Veranstaltungen Praxis (Access)
•
Fragen fragen!!!
•
Klausuraufbau
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Literatur
6
•
Ferstl, O. K.; Sinz, E. J.: Grundlagen der Wirtschaftsinformatik, Band 1, 4. Aufl.,
München/Wien: Oldenbourg, 2006.
ISBN: 3486255878
•
Kemper, A.; Eickler, A.: Datenbanksysteme — Eine Einführung, 5. Aufl.,
München/Wien: Oldenbourg, 2004.
ISBN: 3486273922
•
Schicker, E.: Datenbanken und SQL, 3. Aufl., Stuttgart u. a.: Teubner, 2000.
ISBN: 3519229919
•
Schwarze, J.: Einführung in die Wirtschaftsinformatik, 5. Aufl., Herne/Berlin:
NWB-Verlag, 2000.
ISBN: 3482485518
•
Vossen, G.: Datenmodelle, Datenbanksprachen und Datenbank-ManagementSysteme, 4. Aufl., München/Wien: Oldenbourg, 2000.
ISBN: 3486245449
•
Stahlknecht, P.; Hasenkamp, U.: Einführung in die Wirtschaftsinformatik, 11.
Auflage, Berlin: Springer 2004.
ISBN: 3540011838
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
0. Motivation
Datenorganisation | Veranstaltung 1
Motivation
8
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Motivation
9
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Motivation
10
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenbanken sind heute fast überall
11
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenbanken sind heute fast überall
(Quelle: www.ryanair.com)
12
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenbanken sind heute fast überall
(Quelle: www.dell.de)
13
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenbanken sind heute fast überall
(Quelle: www.docmorris.com)
14
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenbanken sind heute fast überall
15
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenbanken sind heute fast überall
16
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenbanken sind heute fast überall
17
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenbanken sind heute fast überall
Jeder Zweite arbeitet heute bereits am PC.
Siehe:
http://www.heise.de/newsticker/meldung/85539/from/rss09
http://www.spiegel.de/netzwelt/tech/0,1518,467255,00.html
http://www.zdnet.de/news/business/0,39023142,39151883,00.htm
http://www.computerbase.de/news/allgemein/studien/2007/februar/jeder_zweite_computer/
http://www.netzeitung.de/arbeitundberuf/541375.html
18
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
1. Grundlagen der Datenorganisation
Datenorganisation | Veranstaltung 1
Definition von Daten, Informationen und Wissen
Daten
20
•
Brenner: Daten sind die Repräsentation von Informationen auf
einem bestimmten Medium (Datenträger).[1]
•
Voß/Gutenschwager: Daten sind eine Folge von Zeichen, über
deren Bedeutung weitestgehend Konsens besteht, d.h. die
verstanden und prinzipiell von einer Person aufgenommen
werden können.[2]
•
Schwarze: „Daten sind Zeichen ..., die Informationen zum
Zwecke der Verarbeitung nach bestimmten Regeln oder
Verabredungen darstellen.“
[1]
Vgl. Brenner 1994, S. 168.
[2]
Vgl. Voß/Gutenschwager 2001, S. 24.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Definition von Daten, Informationen und Wissen
Informationen
21
•
Hansen/Neumann: „Daten … stellen Informationen … auf Grund
bekannter oder unterstellter Abmachungen in einer maschinell
verarbeitbaren Form dar“.[1]
•
Wittmann: Informationen sind zweckorientiertes Wissen zur
Vorverarbeitung des Handelns.[2]
•
Schwarze: Informationen sind mitgeteilte und aufgenommene
Bestandteile von Wissen. Sie werden aus Wissen abgeleitet und
sollen das Wissen eines Empfängers erweitern und/oder
aktualisieren.[3]
[1]
Vgl. Hansen/Neumann 2001, S. 8.
[2]
Vgl. Wittmann 1959, S. 14.
[3]
Vgl. Schwarze 1998, S. 24.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Definition von Daten, Informationen und Wissen
Wissen
22
•
Kant: Endlich heißt das sowohl subjectiv als auch objectiv zureichende
Führwahrhalten Wissen.[1]
•
Stickel: Wissen ist die Gesamtheit aller Kenntnisse und Fertigkeiten auf
einem bestimmten Gebiet.[2]
•
Wittmann: Als Wissen sollen Vorstellungsinhalte verstanden werden,
die Überzeugungen über die Wahrheit von Feststellungen (Aussagen,
Behauptungen, Sätzen) zum Inhalt haben.[3]
•
Ropohl: Wissen ist die Menge der in Informationsspeichern fixierten
und durch planmäßigen Abruf reproduzierbaren Informationen.[4]
[1]
Vgl. Kant 1781, S. 823.
[2]
Vgl. Stickel 2001, S. 2.
[3]
Vgl. Wittmann 1979, Sp. 2263.
[4]
Vgl. Ropohl 1979, S. 216.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Definition von Daten, Informationen und Wissen
23
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Fazit — Was sind Daten?
Der Begriff Daten wird meist im Kontext der maschinellen
Verarbeitung, insbesondere mittels Computer, verwendet. Daten
bestehen aus einem oder mehreren Zeichen. Die meisten Daten
entstehen in operativen Systemen. Sie können aber auch z. B. von
Informationsanbietern erworben werden. Daten sind selbst nur
„Träger von Informationen“, d. h. sie sind das „Rohmaterial“ für die
Erzeugung und Speicherung von Informationen.
24
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Fazit — Was sind Informationen?
Aus den Daten entstehen durch Aufbereitung und Aggregation
Informationen. Informationen sind zweckorientiert und
kontextbezogen. Sie können weiterverarbeitet werden und werden
so zu neuen Informationen bzw. zu Wissen. Kontextbezogen
bedeutet bspw., dass die Zahl 1,27 ein Wechselkurs ist.
25
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele
•
Beispiel 1: Im Postleitzahlgebiet 30165 wohnt eine
Bevölkerungsschicht, die mit 70 % Wahrscheinlichkeit Produkt x
kaufen wird und deshalb über ein Mailing angesprochen werden
soll.
Dabei sind …
— Daten: Die abgespeicherten alphanumerischen Zeichen in
der Logdatei eines Webservers.
— Informationen: Der User mit der IP-Adresse 125.75.126.7 hat
hintereinander folgende Seiten besucht: Homepage, FAQSeite, Kontakte
— Wissen: Die User, die die Seiten a-b-c-d-e in dieser
Reihenfolge aufgerufen haben, haben in 70 % der Fälle das
Produkt x gekauft.
26
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenorganisation vs. Datenmanagement
•
Datenorganisation umfasst
— Analyse der logischen Datenstrukturen
— Beschreibung der Datenstrukturen durch ein geeignetes
Datenmodell
— Bestimmung optimaler Speicherungsformen bezüglich
• Kosten und
• Verarbeitungs- bzw. Übertragungsgeschwindigkeit
— Bestimmung von Schlüsseln zur Identifizierung von Daten
— Bestimmung optimaler Manipulationsverfahren im Hinblick
auf ein wirtschaftliches Gesamtkonzept eines IV-Systems.
27
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenorganisation vs. Datenmanagement
Datenorganisation umfasst
— Festlegung der Datenstrukturen (Datenmodellierung) und
— Verfahren und Vorschriften zum Speichern, Widerauffinden
und Verändern von Daten.
Während Datenorganisation vor allem physische Datenspeicherung
betrifft, bezieht sich Datenmanagement vor allem auf
betriebswirtschaftliche Aspekte und Managementfragen.
28
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenmanagement
Management wird bei Staehle als „Beschreibung der Prozesse und
Funktionen, die in arbeitsteiligen Organisationen notwendig
werden, wie Planung, Organisation und Kontrolle (managerial
functions approach)“ beschrieben.[1] Dabei wird ausschließlich auf
die Funktionen, die das Management ausübt abgezielt. Ein zweiter,
personenbezogener Ansatz ist ebenfalls bei Staehle zu finden und
bezeichnet als Management „die Personen (-gruppen), die
Managementaufgaben wahrnehmen, ihre Tätigkeiten und Rollen
(managerial roles approach)“.
[1] Vgl. Staehle 1989, S. 65.
29
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenmanagement
Datenmanagement umfasst alle Aufgaben der Planung, Steuerung und
Kontrolle im Zusammenhang mit
— Definition und Modellierung von Daten,
— Entwurf und Betrieb von Datenbanken,
— bedarfsgerechter Aufbereitung und
— Präsentation der Daten,
— Gewährleistung von Datensicherheit und
— Datenschutz,
— Beschaffung von Daten aus externen Quellen.
Datenmanagement bezieht sich vor allem auf betriebswirtschaftliche Aspekte
und Managementaufgaben.
30
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenmanagement
Ziele des Datenmanagements
— Bestmögliche Nutzung der Daten,
— Verbesserung der Qualität der Informationen,
— Erhöhung der Produktivität der
Anwendungssystementwicklung und -nutzung durch den
Einsatz von Datenbankmanagementsystemen (DBMS).
Ziele des Datenmanagements sind Formalziele der
Datenorganisation!
31
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenmanagement
Gründe für den Wandel in der IT.
32
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenmanagement
Viele IT-Entscheider wollen erreichen, dass man mit der IT schneller
an die richtigen Informationen kommt.
33
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenmanagement
Ö Entwicklung vom Push- zum Pull-Prinzip
Vgl. Krcmar 2003, S. 50
34
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenmanagement
Das erhöhte
Informationsangebot erhöht
den subjektiv
empfundenen
Informationsbedarf.
Ö Informationsflut
Vgl. Krcmar 2003, S. 52
35
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Bedeutung von Datenorganisation
Aufgaben der Datenorganisation
36
•
Datenmanagementstrategie: WELCHE Daten für WELCHE
Systeme und Aufgaben WIE speichern und zur Verfügung
stellen.
•
Die Datenmanagementstrategie leitet sich immer mittelbar aus
der Unternehmensstrategie ab!
•
Festlegen der organisatorischen Verantwortung für Pflege und
Erfassung der Daten.
•
Bereitstellung von Daten bzw. Informationen an der richtigen
Stelle, zur richtigen Zeit, beim richtigen Adressaten, in der
richtigen Form.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Bedeutung von Datenorganisation
Effiziente Datenorganisation ist wichtiger denn je, da
37
•
Daten sind notwendig zur Erledigung von Aufgaben.
•
Daten haben in IV-Systemen die längste Lebensdauer.
•
Daten ändern sich in IV-Systemen am schnellsten.
•
Daten sind strategische Erfolgsfaktoren.
•
Das Datenvolumen nimmt ständig zu.
•
Daten stammen aus unterschiedlichen Quellen.
•
Daten können unterschiedliche Formate haben.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Daten in betrieblichen Aufgaben
38
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Anforderungen an die Realisierung einer Datenbank
39
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Daten in unterschiedlichen Aufgabenbereichen
40
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
41
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Aufbau des Datenmanagements
42
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Anforderungen an ein Datenmanagement
Zentrale Anforderungen sind
1. minimale Zugriffs- und Übertragungszeiten,
2. minimale (optimale) Redundanz,
3. logische Integration und Zentralisierung,
4. überschaubarer innerer Aufbau,
5. Anpassbarkeit der Datenstruktur und der Daten,
6. logische und physische Unabhängigkeit,
7. Möglichkeiten der Auswertung und Verknüpfung,
8. Datenintegrität,
9. Wirtschaftlichkeit.
43
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Beispiele für einzelne Anforderungen:
44
•
Schneller Zugriff: Auskunfts- und Reservierungssysteme
•
Anpassbarkeit und Aktualisierbarkeit: Bestellannahme
•
Schutz vor unbefugtem Zugriff: Vertrauliche Personaldaten
•
Beliebige Auswertbarkeit: Umsatzauswertungen
•
Flexible Verknüpfbarkeit: Errechnung von Kennzahlen
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (1) - Ansatzpunkte zur Beeinflussung der Zugriffs- und
Übertragungszeiten:
45
•
Hardwarekonfiguration,
•
Verteilung der Datenbank,
•
Konfiguration des Netzwerkes,
•
Parameter des Betriebssystems,
•
Parameter des DBMS,
•
Datenstrukturen,
•
physische Struktur der Daten,
•
Zugriffsverwaltung.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (2) - Minimale (optimale) Redundanz:
46
•
Redundanz bedeutet hier die mehrfache Datenhaltung,
•
Redundanz beansprucht Ressourcen,
•
Redundanz verursacht Kosten,
•
Redundanz kann zu Anomalien führen,
•
Redundanz, z. B. bei Sicherungskopien, ist notwendig,
•
redundante Datenhaltung kann die Zugriffsgeschwindigkeit auf
Daten erheblich verbessern (physische Struktur), bspw. bei
verteilten Datenbanken.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (3) - logische Integration und Zentralisierung
47
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (4) - Überschaubarer innerer Aufbau:
48
•
erleichtert das Verständnis der DB,
•
erleichtert die Administration,
•
erleichtert die Fehlerbehebung,
•
erleichtert die Einarbeitung,
•
spart Kosten,
•
kann in Konflikt stehen mit anderen Zielen.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (5) - Anpassbarkeit der Datenstruktur und der Daten
49
•
Anpassung der Datenmengen,
•
Rahmenbedingungen ändern sich (Technologie),
•
neue Anforderungen entstehen,
•
alte Anforderungen werden unwichtig (z. B. Sparsamkeit beim
Gebrauch von Ressourcen),
•
neue Datentypen entstehen (z. B. Audio, Video).
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (6) - logische und physische Unabhängigkeit
50
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (7) - Möglichkeiten der Auswertung und Verknüpfung hängen ab
von:
51
•
der Komplexität der Auswertungen,
•
den Möglichkeiten des DBMS,
•
der gewünschten Schnelligkeit der Auswertungen,
•
der Darstellung der Auswertung,
•
den Datenquellen,
•
den unterschiedlichen Datenformaten.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (8) - Datenintegrität:
52
•
Datenkonsistenz (Widerspruchsfreiheit)
— Plausibilität der Eingabedaten,
— konkurrierender Zugriff,
— konsistente Datenmanipulation.
•
Datensicherheit
— Zugriff von unberechtigten Personen,
— Schutz gegen absichtliches Verändern,
— Schutz gegen unabsichtliches Verändern oder Zerstören.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (8) - Datenintegrität:
•
53
Datenschutz (rechtliche Aspekte)
— Schutz personenbezogener Daten
— vor dem unbefugtem Zugriff und
— der unbefugtem Weitergabe.
— Geregelt z. B. im Bundesdatenschutzgesetz,
Landesdatenschutzgesetz, Betriebsverfassungsgesetz
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Zu (9) - Wirtschaftlichkeit:
54
•
Erstinvestition als auch Kosten des operativen Betriebs
betrachten
•
Berücksichtigung des Wirtschaftlichkeitsprinzips (Minimalprinzip
bzw. Maximalprinzip)
•
Insbesondere ist die Wirtschaftlichkeit bei der Auswahl und
beim Customizing von Standardsoftware (z. B. SAP / R3) zu
berücksichtigen.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Beispiele für einzelne Anforderungen
Anforderungen sind teilweise konkurrierend:
55
•
Redundanzfreiheit vs. schneller Zugriff
•
Schutz vor unbefugtem Zugriff vs. beliebige Auswertbarkeit
•
usw…
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
2. Grundbegriffe der Datenorganisation
Datenorganisation | Veranstaltung 1
Komponenten eines IV-Systems
Komponenten eines IV-Systems.[1]
[1]
57
Vgl. Schwarze 2000, S. 49.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenelement, Datensegment und Datensatz
58
•
Zeichen (Character) = kleinste speicherbare Einheit
•
Datenelement (item) = kleinste logische Dateneinheit, 1 oder
mehrere Zeichen
•
Datensegment = logisch zusammenhängende Felder
•
Datensatz (set) = Zusammenfassung logisch
zusammengehöriger Datensegmente oder —elemente
•
Datei (file) = logische Zusammenfassung von Datensätzen mit
der gleichen Struktur
•
Datenbank (database) = Zusammenfassung logisch
zusammengehöriger Dateien
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenelement, Datensegment und Datensatz
Datenelemente und Datensätze.[1]
[1] Vgl. Schwarze 2000 S. 208.
59
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenelement, Datensegment und Datensatz
Datenelemente und Datensätze.
60
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenelement, Datensegment und Datensatz
Hierarchie der Begriffe in der Datenorganisation
61
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten
Basiseigenschaften von Daten
62
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten
Basiseigenschaften von Daten — Elementare Datentypen
63
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten | Datentypen
Vorteile der Zuordnung von Daten zu Typen
— Daten- und Programmentwurf erfolgt bewusster und
verständlicher,
— Verminderung von Laufzeitfehlern durch Überprüfung, ob
sich Wertebereiche und Operationen eines Programms
vertragen sowie
— speichersparende und laufzeiteffiziente Darstellung von
Variablen.
64
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten | Datentypen
Fragestellungen bei der Auswahl von Datentypen
— Welche Werte muss ein Attribut annehmen können?
— Welche Operationen sollen auf dem Attribut möglich sein?
— Wie viel Speicherplatz darf ein Datentyp höchstens
beanspruchen?
— Muss sich ein Attribut sortieren oder indizieren lassen?
— Wie werden Werte sortiert?
Ö Eine Art (unvollständige) Checkliste für eigene Datenbanken!
65
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten
Basiseigenschaften von Daten
66
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten
Verschiedene Datenformate als Beispiel:
•
numerische Formate: Decodierung der Bitfolge 1010000 als
Dezimalzahl 80
•
alphanumerische Formate: Entschlüsselung der Bitfolge 1010000 unter
dem ASCII-Code als Buchstabe P (65-90: A-Z)
•
Interpretation von Bildmustern: 1 als „Bildpunkt/ Pixel“ und 0 als „kein
Bildpunkt/Pixel“
•
Interpretation als Tondaten: Bitfolgen als Frequenz- oder
Amplitudenwerte akustischer Signale
Bild- und Tondaten werden oft in Feldern der Datentypen
— BLOB (Binary Large Objects, variabel lange Zeichenfolgen zur
Verschlüsselung von Texten, Bildern, Ton) und
— OLE (Object Linking and Embedding) gespeichert
67
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten
Basiseigenschaften von Daten
Daten
Datentyp
y Wertemenge
(z. B. reelle Zahlen)
y zulässige Operationen
(z. B. Addition,
Subtraktion)
68
22. Februar 2007
Datenformat
y interne und externe
Repräsentation
(Anzahl mögliche Stellen,
Anzahl der
Nachkommastellen)
Dipl.-Ök. Patrick Bartels
Eigenbereich
y Anwendungsspezifische
Wertemenege
Datenorganisation | Veranstaltung 1
Datenarten
Systematik von Daten
69
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten
Strukturierte, konsistente und redundante Daten
70
•
strukturiert: Systematische Untergliederungen und
Verknüpfungen sind möglich.
•
konsistent: Konsistenzbedingungen werden eingehalten, keine
Widersprüchlichkeiten.
•
Redundanz: Mehrfaches Vorkommen der gleichen Aussage.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenarten
Strukturierte, konsistente und redundante Daten — Beispiele:
Vorname
Strasse + Nr.
Name
PLZ
Ortschaft
PLZ
Ortschaft
Heidi
Badstrasse 3
Meier
54000
Baden
54000
Baden
Ursula
Buckmatte 1
Müller
54000
Münzlishausen
54000
Münzlishausen
Patrick
Zwyssigstrasse 28
Roth
54000
Wettingen
54050
Baden-Dättwill
54300
Wettingen
Frage:
•
Daten strukturiert?
•
Daten konsistent?
•
Daten redundant?
Beispiel aus Zehnder, C. A..: Informationssysteme und Datenbanken. vdf Hochschulverlag, 6. Auflage 1998, S. 25.
71
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenschlüssel
72
•
Kombination von Datenelementen, mit denen ein Datensatz
(eindeutig) identifiziert werden kann.
•
Dienen nicht immer der eindeutigen Identifizierbarkeit.
•
Liefern oft auch zusätzliche Informationen (sprechender
Schlüssel, Informationsschlüssel).
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenschlüssel
Ziel ist es, das richtige Feld oder die optimale Kombination von
Feldern zur Identifikation auszuwählen.
73
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenschlüssel
Schlüssel bzw. Datenschlüssel:
74
•
Identifikationsschlüssel Æ eindeutige Identifikation
•
Klassifikationsschlüssel Æ Zuordnung übereinstimmender
Eigenschaften
•
Verbundschlüssel Æ Klassifikations- und Identifikationsfunktion
•
Parallelschlüssel Æ Ergänzung des identifizierenden Teils um einen
klassifizierenden
•
Primärschlüssel Æ Hauptordnungskriterium
•
Sekundärschlüssel Æ Kombination von Datenelementen
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenschlüssel
75
•
Primärschlüssel?
•
Sekundärschlüssel?
•
Andere Schlüssel?
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenschlüssel
Arten von Datenschlüsseln
Datenschlüsselarten.[1]
[1] Vgl. Schwarze 2000, S. 213.
76
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
Datenschlüssel
Anforderungen an Schlüsselsysteme:
77
•
Eindeutigkeit,
•
laufende Zuordnung, d.h. jedes neue Objekt erhält einen
Schlüssel,
•
ausreichende Anzahl verschiedener Schlüsselnummern,
•
Kürze,
•
Flexibilität gegenüber Änderungen,
•
Wiederverwendbarkeit, d.h. erneute Vergabe freiwerdender
Schlüssel.
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Datenorganisation | Veranstaltung 1
78
22. Februar 2007
Dipl.-Ök. Patrick Bartels
Herunterladen