XML und Datenbanken © K. Schild 2006/M. Mochol 2007 1 Heutige Vorlesung letzte Woche ; Warum XML-Dokumente transformieren? ; XML-Dokumente mit XSLT transformieren ; XSL-FO zur Erzeugung von druckfähigem Layout heutige Vorlesung XML und Datenbanken © K. Schild 2006/M. Mochol 2007 2 Übersicht Daten vs. Dokumente Wie XML persistent speichern? Vergleich XML mit relationalem Modell Exkurs: relationales Modell - Darstellung von N:M-Beziehungen - funktionale Abhängigkeiten, Normalformen Wie Daten mit XML modellieren? © K. Schild 2006/M. Mochol 2007 3 Daten & Dokumente © K. Schild 2006/M. Mochol 2007 4 Daten vs. Dokumente Auswahl der Datenbank hängt von den zu speichernden „Objekt“ Daten- vs. Dokumentspezifische Dokumente (data-centric vs. document-centric documents) documents © K. Schild 2006/M. Mochol 2007 5 Datenspezifische Dokumente reguläre Struktur (hoher Strukturierungsgrad) feinkörnige Daten wenig bzw. keine gemischte Inhalte leichte Verarbeitung für Maschinen Beispiele: Kataloge, Verkaufsaufträge, Flugpläne, etc. Ö traditionelle Datenbanken (relationale, objekt-orientierte) Ö XML-fähige Datenbanken (XML-enabled databases) © K. Schild 2006/M. Mochol 2007 6 Dokumentspezifische Dokumente weniger reguläre Struktur /irreguläre Struktur grobkörnige Daten viele gemischte Inhalte Dokument als Ganzes von Bedeutung entwickelt für Menschen Beispiele: Bücher, E-Mails, Werbung, etc. Ö CMS Ö XML Datenbanken (nativ XML databases) © K. Schild 2006/M. Mochol 2007 7 Wie XML persistent speichern? © K. Schild 2006/M. Mochol 2007 8 XML vs. relationale Datenbanken XML relationale Datenbanken Book book edition Beginning XML 2nd Authorship author author David Hunter Curt Cagle Title Edition 1 Beginning XML 2nd Author authors title BookKey author Chris Dix AuthorKey FirstName LastName 1 David Hunter 2 Kurt Cagle 3 Chris Dix Key BookKey AuthorKey 1 1 1 2 1 2 3 1 3 Hierarchie (Baum) Tabellen mit Schlüssel Kind-Elemente: Reihenfolge relevant Spalten und Zeilen: Reihenfolge egal Anfragen: XPath Anfragen: SQL © K. Schild 2006/M. Mochol 2007 9 Wie XML persistent speichern? Anwendung Tabellen/SQL Anwendung Anwendung XML XML/XPath Wrapper Tabellen/SQL relationale Datenbank XML als einfachen String speichern © K. Schild 2006/M. Mochol 2007 XMLDatenbank XML als strukturiertes XML-Dokument speichern Customers CustomerNo Customers FirstName LastName CityId 1 CustomerNo 2 1 Brian FirstName Sally Brian Thompson NYC LastName CityId Henderson NYC Thompson NYC 2 Sally Henderson NYC relationale Datenbank XML als Tabellen speichern 10 1. XML als String speichern hierarchische XML-Struktur als Wert eines Feldes in einer Tabelle speichern XML-Struktur als String serialisieren Vor- und Nachteile Anwendung Tabellen/SQL + vorhandenes relationales Datenbanksystem (RDBMS) kann genutzt werden + triviale Schnittstelle zwischen XML und RDBMS relationale Datenbank - keine komplexen Anfragen (z.B. mit XPath) auf XML-Struktur © K. Schild 2006/M. Mochol 2007 11 2. XML in XML-Datenbank speichern Internes Model basiert auf XML Übersicht XML-Datenbanken: www.rpbourret.com/xml/XMLDatabaseProds.htm Vorteile + komplexe Anfragen auf XML-Struktur möglich Anwendung XML/ XPath + XPath wird unterstützt + Schnell bei einheitlichen Views XMLDatenbank © K. Schild 2006/M. Mochol 2007 12 2. XML in XML-Datenbank speichern Nachteile - neue Datenbank nötig - XML-Datenbanken nicht interoperabel - XML-Datenbanken liefern nur XML zurück - schwierige Integration mit bestehenden relationalen Datenbanken (RDB) - keine Systematik der Datenmodellierung - Langsam bei Anfragen, die unterschiedliche Views verlangen © K. Schild 2006/M. Mochol 2007 13 3. XML als Tabellen speichern Abbildung XML ÎTabellen möglich Abbildung Tabellen Î XML problemlos Anfragen: SQL mit XML-Funktionen (z.B. SQL/XML) Vor- und Nachteile Anwendung XML Wrapper Tabellen/SQL + vorhandene RDB kann genutzt werden + von modernen RDBMS unterstützt + Systematik der Datenmodellierung für Tabellen Customers CustomerNo FirstName LastName CityId Customers 1 Brian Thompson NYC CustomerNo FirstName LastName CityId 2 Sally Henderson NYC 1 Brian Thompson NYC 2 Sally Henderson NYC relationale Datenbank - Abbildung XML ÎTabellen Î XML liefert nicht unbedingt ursprüngliche XML-Struktur © K. Schild 2006/M. Mochol 2007 14 Fazit: Wie XML speichern? Sollen Daten oder Dokumente gespeichert werden? Wie tief XML-Strukturen in die Datenbank integrieren? 1. XML als einfachen String in Feld einer Tabelle speichern: gar nicht integrieren 2. XML-Datenbanken: voll integrieren 3. XML als Tabellen speichern: soweit wie möglich integrieren nur zu beantworten, wenn XML mit relationalem Datenmodell verglichen wird © K. Schild 2006/M. Mochol 2007 15 Exkurs: Relationales Modell © K. Schild 2006/M. Mochol 2007 16 Relationales Modell Customers 1970 von Codd eingeführt CustomerNo FirstName LastName CityId 1 Brian Thompson NYC 2 Sally Henderson NYC Daten in Tabellen organisiert Tabelle repräsentiert n-stellige Beziehung (Relation) Relation zwischen primitiven Daten. Ö keine geschachtelten Tabellen Tabelle besteht aus Spalten (Felder) Felder und Zeilen (Tupel). Tupel Zeilen und Spalten ungeordnet Tabellen haben eindeutige Namen. © K. Schild 2006/M. Mochol 2007 17 Primär- und Fremdschlüssel mindestens eine Spalte einer Tabelle ist Primärschlüssel: ssel eindeutiger Repräsentant einer bestimmten Zeile bei mehreren Spalten: zusammengesetzter Primärschlüssel Fremdschlüssel: ssel referenziert Primärschlüssel anderer Tabelle Customers CustomerNo FirstName LastName CityId 1 Brian Thompson NYC 2 Sally Henderson NYC Orders © K. Schild 2006/M. Mochol 2007 OrderNo CustomerNo ItemNo 121 1 FX100 5 1 FX200 18 Eindeutigkeit und Existenz Customers CustomerNo FirstName LastName CityId 1 Brian Thompson NYC 2 Sally Henderson NYC Orders OrderNo CustomerNo ItemNo 121 1 FX100 5 1 FX200 Primärschlüssel müssen für jede Zeile einen Wert haben. müssen innerhalb der Tabelle eindeutig sein. Für jeden Fremdschlüssel muss ein zugehöriger Primärschlüssel existieren. © K. Schild 2006/M. Mochol 2007 19 Typen von Beziehungen Tabellen (Relationen): Customers CustomerNo FirstName LastName CityId 1 Brian Thompson NYC Beziehungen zwischen 2 Sally Henderson NYC primitiven Daten meist Objekte der realen Welt, wie z.B. Kunden oder Aufträge. Zwischen zwei Objekten der realen Welt kann 1:1-, 1:1 1:N1:N oder N:M-Beziehung bestehen. N:M Wie werden 1:1-, 1:N- und N:M-Beziehungen im relationalem Modell ausgedrückt? © K. Schild 2006/M. Mochol 2007 20 1:N-Beziehung Kunde 1 * Auftrag Bestimmter Kunde kann mehrere Aufträge erteilen. Umgekehrt ist aber jedem Auftrag immer genau ein Kunde zugeordnet. Ö Zwischen Kunden und Aufträgen besteht eine 1:NBeziehung. © K. Schild 2006/M. Mochol 2007 21 1:N-Beziehung im relationalen Modell Primärschlüssel 1 : N Customers CustomerNo FirstName LastName CityId 1 Brian Thompson NYC 2 Sally Henderson NYC eindeutig Fremdschlüssel Orders OrderNo CustomerNo ItemNo 121 1 FX100 5 1 FX200 © K. Schild 2006/M. Mochol 2007 nicht eindeutig 22 1:1-Beziehung Kunde 1 1 Kunde (ausführlich) 1:1-Beziehungen eher selten Beispiel: zwei unterschiedliche Kunden-Tabellen kompakte Version für Außendienstmitarbeiter ausführlichere Version für die interne Verwaltung ÖZwischen den beiden Tabellen besteht eine 1:1Beziehung. © K. Schild 2006/M. Mochol 2007 23 1:1-Beziehung im relationalen Modell Customers CustomerNo FirstName LastName CityId 1 Brian Thompson NYC 2 Sally Henderson NYC Customers (detailed) CustomerNo LastName FirstName CityId CreditCard CreditCardNo 1 Brian Thompson NYC Amex 100900402344 2 Sally Henderson NYC Visa 100800402e33 beide Schlüssel gleichzeitig Primär- und Fremdschlüssel © K. Schild 2006/M. Mochol 2007 24 N:M-Beziehung Kunde * * Angestellter Angestellter kann mehrere Kunden betreuen. Umgekehrt kann Kunde gleichzeitig von mehreren Angestellten betreut werden. Ö Zwischen Kunden und Angestellten besteht eine N:MBeziehung. © K. Schild 2006/M. Mochol 2007 25 N:M-Beziehung im relationalen Modell Kunde 1 * * 1 Angestellter im relationalen Modell N:M-Bezeiehung nicht direkt darstellbar muss in zwei 1:N-Beziehungen aufgebrochen werden Dritte Tabelle enthält Fremdschlüssel beider Tabellen. © K. Schild 2006/M. Mochol 2007 26 N:M-Beziehung im relationalen Modell Customers 1 CustomerNo FirstName LastName CityId 1 Brian Thompson NYC 2 Sally Henderson NYC : N:M-Relationship N N : Key CustomerNo EmployeeNo 121 1 4 5 1 5 Employees 1 EmployeeNo FirstName LastName CityId Type 4 Mark Whitehorn NYC Sales person 5 Bill Marklyn NYC Human Resources © K. Schild 2006/M. Mochol 2007 27 Alternative Darstellung Customers 1 CustomerNo FirstName LastName CityId 1 Brian Thompson NYC 2 Sally Henderson NYC : N:M-Relationship N N : CustomerNo EmployeeNo 1 4 1 5 Employees 1 EmployeeNo FirstName LastName CityId Type 4 Mark Whitehorn NYC Sales person 5 Bill Marklyn NYC Human Resources © K. Schild 2006/M. Mochol 2007 28 Normalformen Hilfsmittel zur Modellierung von Daten für relationales Modell formal definiert Ziel Eigenschaften (Felder) zu passenden Objekten (Tabellen) gruppieren redundante Informationen eliminieren sicherstellen, dass jede Information eindeutig identifiziert werden kann Mittel Verständnis der Bedeutung der Daten Verständnis funktionaler Abhängigkeiten © K. Schild 2006/M. Mochol 2007 29 Funktionale Abhängigkeiten Beispiel: Fläche = Höhe X Breite Fläche funktional abhängig von der Höhe und Breite: Fläche = f(Höhe, Breite), für eine Funktion f es gibt auch funktionale Abhängigkeiten zwischen Feldern einer Tabelle © K. Schild 2006/M. Mochol 2007 30 Beispiel Orders OrderNo ItemNo EmployeeNo CustomerNo ItemName Quantity 121 3 4 1024 Nut 3 121 4 4 1024 Bolt 67 122 3 9 176 Nut 9 Annahme: jedem Auftrag genau ein Angestellter (Vermittler) zugeordnet Ö EmployeeNo = f(OrderNo) Ö EmployeeNo funktional abhängig von OrderNo. Wichtig: Funktionale Abhängigkeiten nicht an Daten selbst zu erkennen, sondern an ihrer Verwendung. © K. Schild 2006/M. Mochol 2007 31 Weitere funktionale Abhängigkeiten Orders OrderNo ItemNo EmployeeNo CustomerNo ItemName Quantity 121 3 4 1024 Nut 3 121 4 4 1024 Bolt 67 122 3 9 176 Nut 9 Quantity = f1(OrderNo, ItemNo) ItemName = f2(ItemNo) CustomerNo = f3(OrderNo) © K. Schild 2006/M. Mochol 2007 32 Normalformen verschiedene Stufen, die aufeinander aufbauen: 1., 2., 3. Normalform (Ö Anhang) Grundidee Unterscheidung funktionaler Abhängigkeiten in notwendige und nicht erlaubte Sei P der Primärschlüssel einer Tabelle. Seien Fi ein beliebiges Nicht-Schlüssel-Feld der Tabelle. notwendig: nicht erlaubt: Fi = f(P) Fi = f(P'), P' echte Teilmenge von P Fi = f(P), jedoch Fi = f(Fj), Fj = f(P) für ein weiteres Nicht-Schlüssel-Feld Fj © K. Schild 2006/M. Mochol 2007 33 Beispiel Orders OrderNo ItemNo EmployeeNo CustomerNo ItemName Quantity 121 3 4 1024 Nut 3 121 4 4 1024 Bolt 67 122 3 9 176 Nut 9 notwendig Fi = f(OrderNo,ItemNo), Fi = EmployeeNo,…,Quantity nicht erlaubt ItemName = f(ItemNo) CustomerNo = f(OrderNo) EmployeeNo = f(OrderNo) © K. Schild 2006/M. Mochol 2007 34 Weiteres Beispiel Customers CustomerNo FirstName LastName CityId City 1 Brian Thompson NYC New York City 2 Sally Henderson NYC New York City notwendig Fi = f(CustomerNo), Fi = FirstName,…,CityId, City nicht erlaubt City = f(CityId) © K. Schild 2006/M. Mochol 2007 35 Abbildung relationales Modell Î XML © K. Schild 2006/M. Mochol 2007 36 Relationales Modell Î XML Relationales Modell kann einfach und ohne Informationsverlust in XML kodiert werden. werden Ö Kodierung könnte als Standard für RDBMS dienen. Hierfür gibt es allerdings keinen etablierten Standard. inoffizieller Vorschlag: http://www.w3.org/XML/RDB.html Ö XML mindestens so ausdrucksstark wie relationales Modell © K. Schild 2006/M. Mochol 2007 37 Mapping-Verfahren Geeignete Abbildungen und Transformationsmechanismen zwischen beiden ”Informationsträgern“ finden Mapping-Verfahren Template-driven Mapping: Datenbankinhalte Æ XML Model-driven Mapping: Datenbank Æ XML & XMLÆ Datenbank © K. Schild 2006/M. Mochol 2007 38 Template-driven Mapping <?xml version="1.0"?> <FlightInfo> <Intro> the following flights have available seats: </Intro> <SelectStmt> SELECT Airline, FltNumber, Depart, Arrive FROM Flights </SelectStmt> </FlightInfo> © K. Schild 2006/M. Mochol 2007 keine fest definierte Abbildung Verwendung von XML-Dokumenten, die als Templates dienen Einbettung von Anweisungen (z.B. SELECTStatements) 39 Template-driven Mapping – Beispiel <?xml version="1.0"?> <FlightInfo> <Intro> the following flights have available seats: </Intro> <SelectStmt> SELECT Airline, FltNumber, Depart, Arrive FROM Flights <?xml version="1.0"?> </SelectStmt> <FlightInfo> </FlightInfo> <Intro> XML-Template mit Select-Anweisung Ergebnis © K. Schild 2006/M. Mochol 2007 the following flights have available seats: </Intro> <Flights> <Row> <Airline>ACME</Airline> <FltNumber>123</FltNumber> <Depart>Dec 12, 2001 13:43</Depart> <Arrive>Dec 13, 2001 01:21</Arrive> </Row> ... </Flights> </FlightInfo> 40 Model-driven Mapping Mapping: Datenbank Æ XML & XMLÆ Datenbank festes Model Table Model wenig flexibel aber intuitive Abbildung nur für sehr flache XML-Dokumente Einsatzbereich beschränkt auf relationale Strukturen Data Specific Object Model Modellierung der Daten Abbildung: Daten Ækorrespondierende Objekte Æ hierarchische Baumstruktur © K. Schild 2006/M. Mochol 2007 41 Table Model <database> <table> <row> <column1>...</column1> <column2>...</column2> <column3>...</column3> ... </row> ... </table> <table> ... </table> </database> © K. Schild 2006/M. Mochol 2007 Vorteile + einfach + leicht zu implementieren + schneller und effizienter Datenaustausch Nachteil - nicht anwendbar bei komplexeren Datenmodellen und tiefer verschachtelten XML-Dokumenten 42 Data Specific Object Model <Orders> Daten-spezifischer Objektbaum <SalesOrder SONumber="12345"> Orders <Customer CustNumber="543"> ... </Customer> SalesOrder <OrderDate>150999</OrderDate> <Line LineNumber="1"> <Product Name="Cherries"> Customer Line ... </Product> <Quantity Unit="ton">2</Quantity> Product </Line> </SalesOrder> </Orders> object SalesOrder { soNumber = "12345"; customer = { custPtr}; abgeleitete Objekte line = { linePtr}; orderDate = "150999"; object Line { } lineNumber = "1"; product = { prodPtr}; quantity = { quantPtr}; © K. Schild 2006/M. Mochol 2007 43 } Quelle: http://www-is.informatik.uni-oldenburg.de/~grawund/Lehre/Seminare/WWD_2000_2001/Texte/DB_und_XML.pdf Abbildung relationales Modell Î XML Type Model © K. Schild 2006/M. Mochol 2007 44 Kodierung einer RDB in XML <Database> <database> Wurzel-Element = <EmployeeTable> <table> Name der <EmployeeTuple> <row> <EmployeeNo>k1</EmployeeNo> <column1>...</column1> Datenbank <FirstName>Mark</FirstName> <column2>...</column2> für jede Tabelle <LastName>Whitehorn</LastName> <column3>...</column3> ... <CityId>NYC</CityId> genau ein Kind</row> <Type>Sales Person</Type> Element ... </EmployeeTuple> </table> <EmployeeTuple> darunter für jedes <table> <EmployeeNo>k2</EmployeeNo> Tupel genau ein ... <FirstName>Bill</FirstName> Kind-Element </table> <LastName>Marklyn</LastName> </database> <CityId>NYC</CityId> darunter für jede <Type>Human Resources</Type> Spalte ein Kind</EmployeeTuple> Element </EmployeeTable> ... © K. Schild 2006/M. Mochol 2007 45 Kodierung von Null Values <Database> <EmployeeTable> <EmployeeTuple> <EmployeeNo>k1</EmployeeNo> <FirstName>Mark</FirstName> <LastName>Whitehorn</LastName> <CityId>NYC</CityId> <Type>Sales Person</Type> </EmployeeTuple> <EmployeeTuple> <EmployeeNo>k2</EmployeeNo> <FirstName>Bill</FirstName> <LastName>Marklyn</LastName> Leerwerte (null values): values undefinierte Werte Kodierung: entsprechendes Element (= Feld) einfach weglassen dadurch Unterscheidung zu leerem Inhalt <Type></Type> </EmployeeTuple> </EmployeeTable> … © K. Schild 2006/M. Mochol 2007 46 Das zugehörige XML-Schema xsd:sequence xsd:all xsd:all minOccurs="0" Reihenfolge der Tabellen, Tupel und Spalten egal © K. Schild 2006/M. Mochol 2007 47 Kodierung von Schlüssel Primärschlüssel: Typ xsd:ID. Fremdschlüssel: Typ xsd:IDREF. Probleme dieser Kodierung keine zusammengesetzten Primärschlüssel darstellbar Statt Eindeutigkeit innerhalb der Tabelle, erzwingt xsd:ID Eindeutigkeit aller Attribute mit Typ xsd:ID ÖZwei Tabellen dürfen keine identischen Primärschlüssel haben. Statt eines ganz bestimmten Primärschlüssels, referenziert xsd:IDREF beliebigen Primärschlüssel mit Typ xsd:ID. © K. Schild 2006/M. Mochol 2007 48 Beispiel <Database> <EmployeeTable> <EmployeeTuple> <EmployeeNo>ID4</EmployeeNo> <FirstName>String</FirstName> <LastName>String</LastName> <CityId>ID5</CityId> <Type>String</Type> </EmployeeTuple> </EmployeeTable> <CustomerTable> <CustomerTuple> <CustomerNo>ID5</CustomerNo> … </CustomerTuple> </CustomerTable> </Database> © K. Schild 2006/M. Mochol 2007 Primärschlüssel müssen in gesamter Datenbank (nicht nur in Tabelle) eindeutig sein. Fremdschlüssel kann sich auf beliebigen Primärschlüssel beziehen 49 Primärschlüssel als key <xsd:element name="Database"> <xsd:complexType> Definition der Tabellen </xsd:complexType> <xsd:key name="EmployeeKey"> <xsd:selector xpath="EmployeeTable/EmployeeTuple"/> <xsd:field xpath="EmployeeNo"/> </xsd:key> Ö EmployeeNo innerhalb </xsd:element> EmployeeTable eindeutig name: name eindeutiger Namen des Primärschlüssels xsd:selector: xsd:selector spezifiziert Kontext, auf die die Eindeutigkeitsbedingung angewandt wird. ein oder mehrere xsd:field-Elemente: Elemente/Attribute, xsd:field die zusammen eindeutig sind © K. Schild 2006/M. Mochol 2007 50 Fremdschlüssel als keyref <xsd:element name="Database"> <xsd:complexType> Definition der Tabellen </xsd:complexType> <xsd:keyref name="CityIDKeyRef" refer="CityIDKey"> <xsd:selector xpath="*/*"/> <xsd:field xpath="CityID"/> </xsd:keyref> </xsd:element> Ö Wert von CityId immer definiert refer: refer Auf welchen Primärschlüssel wird verwiesen? xsd:selector: xsd:selector Wo ist der Fremdschlüssel zu finden? xsd:field: xsd:field Aus welchen Feldern besteht der Fremdschlüssel? © K. Schild 2006/M. Mochol 2007 51 Fazit: Relationales Modell Î XML einfach und ohne Informationsverlust möglich gilt auch für Primär- und Fremdschlüssel XML mindestens so ausdrucksstark wie relationales Modell XML-Dokument (Instanz) kodiert Datenbank XML-Schema kodiert Datenbankschema © K. Schild 2006/M. Mochol 2007 52 Datenmodellierung mit XML © K. Schild 2006/M. Mochol 2007 53 XML zur Datenmodellierung XML flexibler als relationales Model: Relationales Modell keine geschachtelten Tabellen N:M-Beziehungen müssen in eigenen Tabellen ausgelagert werden. XML erlaubt geschachtelte Strukturen N:M-Beziehungen können unkompliziert ausgedrückt werden. Warum also die Möglichkeiten von XML nicht voll ausnutzen? © K. Schild 2006/M. Mochol 2007 54 Beispiel <Employee> <EmployeeNo>4</EmployeeNo> <Name> <First>Mark</First> <Last>Whitehorn</Last> </Name> <City> <Name>New York City</Name> <CityId>NYC</CityId> </City> <Type>Sales Person</Type> <Orders> <Order> <OrderNo>121</OrderNo> <OrderItems>…</OrderIntems> <CustomerNo>999</CustomerNo> </Order> </Orders> </Employee> © K. Schild 2006/M. Mochol 2007 Könnte so zwischen Vertriebsund Gehaltsabteilung ausgetauscht werden als Austauschformat OK auch als Speicherformat OK? 55 Löschanomalie <Employee> <EmployeeNo>4</EmployeeNo> <Name> <First>Mark</First> <Last>Whitehorn</Last> </Name> <City> <Name>New York City</Name> <CityId>NYC</CityId> </City> <Type>Sales Person</Type> <Orders> <Order> <OrderNo>121</OrderNo> <OrderItems>…</OrderIntems> <CustomerNo>999</CustomerNo> </Order> </Orders> </Employee> © K. Schild 2006/M. Mochol 2007 Wird ein AngestelltenDatensatz gelöscht, dann werden auch alle Aufträge gelöscht, die er vermittelt hat. Gefahr, ungewollt Informationen zu löschen Ö Order-Informationen auslagern und durch Fremdschlüssel OrderNo ersetzen. 56 Verbesserte Modellierung <Employee> <EmployeeNo>4</EmployeeNo> <Name> <First>Mark</First> <Last>Whitehorn</Last> </Name> <City> <Name>New York City</Name> <CityId>NYC</CityId> </City> <Type>Sales Person</Type> <Orders> <OrderNo>121</OrderNo> </Orders> </Employee> © K. Schild 2006/M. Mochol 2007 <Order-DB> <Order> <OrderNo>121</OrderNo> <OrderItems>…</OrderItems> <CustomerNo>999</CustomerNo> </Order> </Order-DB> 57 Änderungsanomalie <Employee> <EmployeeNo>4</EmployeeNo> <Name> <First>Mark</First> <Last>Whitehorn</Last> </Name> <City> <Name>New York City</Name> <CityId>NYC</CityId> </City> <Type>Sales Person</Type> <Orders> <OrderNo>121</OrderNo> </Orders> </Employee> © K. Schild 2006/M. Mochol 2007 Wird CityId oder Name geändert, dann muss diese Änderung in allen Angestellten-Datensätzen nachvollzogen werden. unnötiger Verwaltungsaufwand Gefahr von Inkonsistenzen Ö City-Informationen auslagern und hier durch Fremdschlüssel ersetzen. 58 Verbesserte Modellierung <Employee-DB> <Employee> <EmployeeNo>4</EmployeeNo> <Name> <First>Mark</First> <Last>Whitehorn</Last> </Name> <CityKey>C123</CityKey> <Type>Sales Person</Type> <Orders> <OrderNo>121</OrderNo> </Orders> </Employee> </Employee-DB> © K. Schild 2006/M. Mochol 2007 <Order-DB> <Order> <OrderNo>121</OrderNo> <OrderItems>…</OrderItems> <CustomerNo>999</CustomerNo> </Order> </Order-DB> <City-DB> <City> <CityKey>C123</CityKey> <CityId>NYC</CityId> <Name>New York City</Name> </City> </City-DB> 59 Noch eine Änderungsanomalie <Order-DB> <Order> <OrderNo>121</OrderNo> <OrderItems> <OrderItem> <ItemNo>FX100</ItemNo> <ItemName>Black-Bag</ItemName> <Quantity>1000</Quantity> </OrderItem> </OrderItems> <CustomerNo>999</CustomerNo> </Order> </Order-DB> © K. Schild 2006/M. Mochol 2007 Wird ItemName geändert, dann muss diese Änderung in allen Order-Datensätzen nachvollzogen werden. Ö Zuordnung ItemNo/ItemName auslagern und hier durch Fremdschlüssel ItemNo ersetzen. 60 Verbesserte Modellierung <Order-DB> <Order> <OrderNo>121</OrderNo> <OrderItems> <OrderItem> <ItemNo>FX100</ItemNo> <Quantity>1000</Quantity> </OrderItem> </OrderItems> <CustomerNo>999</CustomerNo> </Order> </Order-DB> © K. Schild 2006/M. Mochol 2007 <Inventory-DB> <Item> <ItemNo>FX100</ItemNo> <ItemName>Black-Bag</ItemName> </Item> </Inventory-DB> 61 Anfrageoptimierung <Order-DB> <Order> <OrderNo>121</OrderNo> <OrderItems> <OrderItem> <ItemNo>FX100</ItemNo> <Quantity>1000</Quantity> </OrderItem> </OrderItems> <CustomerNo>999</CustomerNo> </Order> </Order-DB> Hier fehlt Verweis auf Vermittler (EmployeeNo). Vermittler normalerweise Ansprechpartner für Kundenauftrag Wer ist Vermittler? Ö Angestellten-Datenbank muss durchsucht werden, um Vermittler zu ermitteln. © K. Schild 2006/M. Mochol 2007 62 Anfrageoptimierung <Order-DB> <Order> <OrderNo>121</OrderNo> <OrderItems> <OrderItem> <ItemNo>FX100</ItemNo> <Quantity>1000</Quantity> </OrderItem> </OrderItems> <CustomerNo>999</CustomerNo> </Order> <EmployeeNo>4</EmployeeNo> </Order> </Order-DB> </Order-DB> © K. Schild 2006/M. Mochol 2007 <Employee-DB> <Employee> <EmployeeNo>4</EmployeeNo> <Name> <First>Mark</First> <Last>Whitehorn</Last> </Name> <CityKey>C123</CityKey> <Type>Sales Person</Type> <Orders> <OrderNo>121</OrderNo> </Orders> </Employee> </Employee-DB> statt Verweis Angestellter Î Auftrag Verweis Auftrag Î Vermittler 63 Endgültige Modellierung <Order> <OrderNo>121</OrderNo> <OrderItems> <OrderItem> <ItemNo>FX100</ItemNo> <Quantity>1000</Quantity> </OrderItem> </OrderItems> <CustomerNo>999</CustomerNo> <EmployeeNo>4</EmployeeNo> </Order> <Item> <ItemNo>FX100</ItemNo> <ItemName>Black-Bag</ItemName> </Item> © K. Schild 2006/M. Mochol 2007 <Employee> <EmployeeNo>4</EmployeeNo> <Name> <First>Mark</First> <Last>Whitehorn</Last> </Name> <CityKey>C123</CityKey> <Type>Sales Person</Type> </Employee> <City> <CityKey>C123</CityKey> <CityId>NYC</CityId> <Name>New York City</Name> </City> 64 Vergleich mit relationalem Modell <OrderTuple> <OrderNo>121</OrderNo> <OrderItemTable> <OrderItemTuple> <ItemNo>FX100</ItemNo> <Quantity>1000</Quantity> </OrderItemTuple> </OrderItemTable> <CustomerNo>999</CustomerNo> <EmployeeNo>4</EmployeeNo> </OrderTuple> <ItemTuple> <ItemNo>FX100</ItemNo> <ItemName>Black-Bag</ItemName> </ItemTuple> 9 © K. Schild 2006/M. Mochol 2007 <EmployeeTuple> <EmployeeNo>4</EmployeeNo> <Name> <First>Mark</First> <Last>Whitehorn</Last> </Name> <CityKey>NYC</CityKey> <Type>Sales Person</Type> </EmployeeTuple> <CityTuple> <CityKey>C123</CityKey> <CityId>NYC</CityId> <Name>New York City</Name> </CityTuple> 9 65 Vergleich mit relationalem Modell <OrderTuple> <OrderNo>121</OrderNo> <OrderItemTable> N:M <OrderItemTuple> <ItemNo>FX100</ItemNo> <Quantity>1000</Quantity> </OrderItemTuple> </OrderItemTable> <CustomerNo>999</CustomerNo> <EmployeeNo>4</EmployeeNo> </OrderTuple> <ItemTuple> <ItemNo>FX100</ItemNo> <ItemName>BlackBag</ItemName> </ItemTuple> © K. Schild 2006/M. Mochol 2007 9 <EmployeeTuple> <EmployeeNo>4</EmployeeNo> <FirstName>Mark</FirstName> <LastName>Whitehorn</LastName> <CityKey>C123</CityKey> <Type>Sales Person</Type> </EmployeeTuple> 9 <CityTuple> <CityKey>C123</CityKey> <CityId>NYC</CityId> <Name>New York City</Name> </CityTuple> 9 N:M-Beziehung zwischen OrderNo und ItemNo als Hierarchie 66 Relationale Modellierung <OrderSpecTuple> <OrderNo>121</OrderNo> <ItemNo>FX100</ItemNo> <Quantity>1000</Quantity> 9 </OrderSpecTuple> <OrderTuple> <OrderNo>121</OrderNo> <CustomerNo>999</CustomerNo> <EmployeeNo>4</EmployeeNo> </OrderTuple> 9 <ItemTuple> <ItemNo>FX100</ItemNo> <ItemName>Black-Bag</ItemName> </ItemTuple> 9 © K. Schild 2006/M. Mochol 2007 <EmployeeTuple> <EmployeeNo>4</EmployeeNo > <First>Mark</First> <Last>Whitehorn</Last> <CityKey>C123</CityKey> <Type>Sales Person</Type> 9 </EmployeeTuple> <CityTuple> <CityKey>C123</CityKey> <CityId>NYC</CityId> <Name>New York City</Name> 9 </CityTuple> N:M-Beziehung als Relation OrderSpec mit zusammengesetztem Primärschlüssel 67 Fazit aus dem Beispiel Ausgangspunkt strukturiertes XML-Dokument als Speicherformat Transformationen Beseitigung von Lösch- und Änderungsanomalien Ergebnis mehrere, wesentlich flachere XML-Strukturen relationalem Modell (in 3. NF) sehr ähnlich Ausnahme: N:M-Beziehungen als geschachtelte Strukturen © K. Schild 2006/M. Mochol 2007 68 Systematik der Datenmodellierung relationales Modell schrittweise Normalformbildung: Ergebnis formal definiert XML Normalformen aus relationalem Modell nicht auf XML übertragbar Grund: relationales Model erlaubt keine geschachtelten Tabellen bisher keine Systematik der Datenmodellierung informelles Verfahren: Asset-Oriented Modeling (Daum & Merten, System Architecture with XML, 2003). © K. Schild 2006/M. Mochol 2007 69 Fazit aus heutiger Vorlesung Daten mit vielen funktionalen Abhängigkeiten bewährte Speicherformate wie relationale Datenbanken besser Tabellen als XML serialisieren Text-Dokumente mit nur wenigen funktionalen Abhängigkeiten XML auch als Speicherformat geeignet © K. Schild 2006/M. Mochol 2007 70 Wie geht es weiter? heutige Vorlesung ; Daten vs. Dokumente ; Wie XML persistent speichern? ; Vergleich XML mit relationalem Modell www.rpbourret.com/xml/XMLAndDatabases.htm ; Wie Daten mit XML modellieren? nächste Übung XML und Datenbanken Vorlesung nächste Woche Web Services (insgesamt 4 Termine) © K. Schild 2006/M. Mochol 2007 71 Anhang © K. Schild 2006/M. Mochol 2007 72 1. Normalform (NF) Eine relationale Datenbank ist in 1. Normalform, Normalform falls alle Tabellen 1) einen Primärschlüssel haben und 2) nur primitive Daten enthalten. Entspricht der Definition des relationalen Modells © K. Schild 2006/M. Mochol 2007 73 2. Normalform (NF) Eine relationale Datenbank ist in 2. Normalform, Normalform falls 1) sie in 1. Normalform ist, 2) alle Nicht-Schlüssel-Felder vom Primärschlüssel funktional abhängig sind und 3) kein Nicht-Schlüssel-Feld bereits von einem Teil des Primärschlüssels funktional abhängig ist. nicht in 2. NF Orders OrderNo ItemNo EmployeeNo CustomerNo ItemName Quantity 121 3 4 1024 Nut 3 121 4 4 1024 Bolt 67 122 3 9 176 Nut 9 © K. Schild 2006/M. Mochol 2007 74 3. Normalform (NF) Eine relationale Datenbank ist in 3. Normalform, Normalform falls 1) sie in 2. Normalform ist und 2) alle Nicht-Schlüssel-Felder direkt (d.h. nicht transitiv) vom Primärschlüssel funktional abhängig sind. nicht in 3. NF Customers CustomerNo FirstName LastName CityId City 1 Brian Thompson NYC New York City 2 Sally Henderson NYC New York City © K. Schild 2006/M. Mochol 2007 75