Datenbankdesign im E-Commerce - Klassifikation von Produkttermen im Datenbankschema - Ein Vortrag von: Michaela Geierhos Centrum für Informations- und Sprachverarbeitung LMU München 15.06.2005 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 1 Gliederung • Das relationale Datenbankmodell • Generische vs. Proprietäre Produkte • Semantische Klassifikation anhand des CISLEX • Bewertung der CISLEX Kategorien bzgl. ihrer E-Commerce Tauglichkeit • DB-Design-Vorschlag für generische Produkte • Produkt-DB in der E-Commerce-Anwendung • Kommunikation zwischen Anwender und Datenbank • Datenbanktransformation in XML Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce Das relationale Datenbankmodell • Eine Relationale Datenbank ist eine Datenbank, die auf dem Relationalen Datenbankmodell basiert, das von Edgar F. Codd 1970 erstmals vorgeschlagen wurde. • Dahinter stehen Relationen (im streng mathematischen Sinn), so dass man sagen kann, dass im wesentlichen ein mathematisches Modell für eine Tabelle beschrieben wird. • Die Daten werden dabei in Form von zweidimensionalen Tabellen verwaltet, die über Schlüssel (Primärschlüssel, Fremdschlüssel) miteinander verknüpft werden können. • Für relationale Datenbanken gibt es mit SQL eine verbreitete und teilweise standardisierte Anfragesprache. Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 2 Datenbankdesign im E-Commerce Das relationale Datenbankmodell • Zur Modellierung von relationalen Datenbanken wird meist das EntityRelationship-Modell oder Varianten davon verwendet. • Es dient zum Entwurf eines konzeptuellen Schemas, welches unter Verwendung eines DBMS implementiert werden kann. • Dieser Schritt wird als logischer Entwurf oder auch Datenmodellabbildung bezeichnet und hat als Ergebnis ein Datenbankschema im Implementierungssdatenmodell des DBMS. • Als relationale Anfragesprache wird MySQL für das Konzept und die Umsetzung der entstehenden Produkt-Datenbank gewählt. Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 3 Datenbankdesign im E-Commerce Generische vs. Proprietäre Produkte Wie behandelt man sie in einer Datenbank? • Generische Produkte: Diese Produkte sind auch als sogenannte Produktklassen“oder generi” ” sche Produkte“bekannt. Ihre (morphologischen/semantischen) Eigenschaften werden nur einmal beschrieben. Ein tatsächlich erstelltes Produkt wird als Instanz“(auch Ausprägung“) des (generischen) Produkts bezeichnet. ” ” Beispiel: Notebook • Proprietäre Produkte: Ein tatsächlich erstelltes Produkt“ist im weiteren Sinne ein proprietäres ” Produkt, das im Grunde nur dadurch Eigentümer/Hersteller spezifisch wird, in dem es einen Firmen gebundenen Markennamen bekommt, oder der Herstellername in der Produktbezeichnung mit auftaucht. Beispiel: Sony Vaio VGN-T2XP/S Notebook Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 4 Datenbankdesign im E-Commerce 5 Generische Produkte Linguistisch relevante Informationen • generische Produkte (meist) ⊂ proprietäre Produkte → gleiche morphologische, syntaktische und semantische Eigenschaften → Archivierung linguistischer Daten nur für generische Produkte! • Vollformen • (starke/schwache) Synonyme • Grundformen • Rechtschreibvarianten • Kompositum → ja/nein ? • Semantische Information/Klassifika- • E-Commerce-Kategorien der Produkte (Branchen) tion Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce Generische Produkte Semantische Klassifikation anhand des CISLEX • Vollformen • Grundformen • Kompositum → ja/nein ? • Semantische Information/Klassifikation • (starke/schwache) Synonyme • Rechtschreibvarianten • E-Commerce-Kategorien der Produkte (Branchen) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 6 Datenbankdesign im E-Commerce 7 Welche Kategorien des CISLEX sind E-Commerce relevant? - Tiere - knk (”Konkreta“, ”Konkreta, auch Stoffe“, Direkt: 0, Gesamt: 15226, Oberbegriffe: {-}) • kon ( konkrete Individualnomina“, Objekte“, Direkt: 261, Gesamt: 13053, Oberbegriffe: ” {Objekt, Gegenstand}) ” – leb ( Lebewesen“, “, Direkt: 53, Gesamt: 9169, Oberbegriffe: {Geschöpf, Kreatur}) ” ” ∗ tie ( Tiere“, “, Direkt: 88, Gesamt: 853, Oberbegriffe: {Tier, Fauna, Getier}) ” ” · tst ( Säugetiere“, “, Direkt: 217, Gesamt: 270, Oberbegriffe: {Säuger, Mammalia, ” Mammalium}) ” + tms ( Meeressäuger“, “, Direkt: 16, Gesamt: 16, Oberbegriffe: {-}) ” ” + thu ( Haushunde“, Hunderassen & nicht-Rassen“, Direkt: 37, Gesamt: 37, ” ” Oberbegriffe: {-}) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 8 Welche Kategorien des CISLEX sind E-Commerce relevant? - Pflanzen - leb (”Lebewesen“, ” “, Direkt: 53, Gesamt: 9169, Oberbegriffe: {Geschöpf, Kreatur}) • tie ( Tiere“, “, Direkt: 88, Gesamt: 853, Oberbegriffe: {Tier, Fauna, Getier}) ” ” • pfl ( Pflanzen“, “, Direkt: 189, Gesamt: 513, Oberbegriffe: {Pflanze, Flora, Vegetabilien}) ” ” – pba ( Bäume“, “, Direkt: 57, Gesamt: 71, Oberbegriffe: {Baum}) ” ” – pst ( Sträucher“, “, Direkt: 14, Gesamt: 14, Oberbegriffe: {Busch, Strauch, Gebüsch, – – – ” ” Gesträuch}) pbl (”Blumen“, ” “, Direkt: 56, Gesamt: 56, Oberbegriffe: {Blume}) ppl (”Pilze“, ” “, Direkt: 23, Gesamt: 23, Oberbegriffe: {Pilz, Schwammerl}) pzi (”Zierpflanzen“, ”Zier- und Zimmerpflanzen“, Direkt: 20, Gesamt: 20, Oberbegriffe: {-}) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 9 Welche Kategorien des CISLEX sind E-Commerce relevant? - Artefakte: Kleidungsstücke - knk (”Konkreta“, ”Konkreta, auch Stoffe“, Direkt: 0, Gesamt: 15226, Oberbegriffe: {-}) • kon ( konkrete Individualnomina“, Objekte“, Direkt: 261, Gesamt: 13053, Oberbegriffe: ” {Objekt, Gegenstand}) ” – leb ( Lebewesen“, “, Direkt: 53, Gesamt: 9169, Oberbegriffe: {Geschöpf, Kreatur}) ” ” – art ( Artefakte“, Von Menschenhand geschaffene Gegenstände“, Direkt: 469, Gesamt: ” ” 3369, Oberbegriffe: {Artefakt, Manufakt}) ∗ kle ( Kleidungsstücke“, Oberklasse für alle Kleidungstücke“, Direkt: 218, Gesamt: ” ” 279, Oberbegriffe: {Kleidung, Bekleidung, Klamotte}) · klk ( Kopfbedeckungen“, “, Direkt: 31, Gesamt: 31, Oberbegriffe: {-}) ” ” · klf ( Fußbekleidung“, “, Direkt: 30, Gesamt: 30, Oberbegriffe: {-}) ” ” Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 10 Welche Kategorien des CISLEX sind E-Commerce relevant? - Artefakte: Fahrzeuge - • art ( Artefakte“, Von Menschenhand geschaffene Gegenstände“, Direkt: 469, Gesamt: ” ” 3369, Oberbegriffe: {Artefakt, Manufakt}) ..... – fze ( Fahrzeuge“, Fahrzeuge, Verkehrsmittel“, Direkt: 33, Gesamt: 390, Oberbegriffe: ” ” {Fahrzeug, Gefährt, Vehikel}) ∗ fzw ( Wasserfahrzeuge“, Alle Fahrzeuge, die sich im Wasser fortbewegen“, Direkt: ” ” 105, Gesamt: 108, Oberbegriffe: {Schiff}) · fzu ( Unterwasserfahrzeuge“, Uboote etc.“, Direkt: 3, Gesamt: 3, Oberbegriffe: ” ” {-}) ∗ fzl ( Luftfahrzeuge“, Alle Arten von Luftfahrzeugen“, Direkt: 28, Gesamt: 28, ” ” Oberbegriffe: {Flugzeug}) ∗ fza ( Autos“, PKWs und LKWs“, Direkt: 77, Gesamt: 77, Oberbegriffe: {Auto, ” ” Laster}) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 11 Welche Kategorien des CISLEX sind E-Commerce relevant? - weitere Artefakte - • art ( Artefakte“, Von Menschenhand geschaffene Gegenstände“, Direkt: 469, Gesamt: ” ” 3369, Oberbegriffe: {Artefakt, Manufakt}) – sca ( Schalter/Tasten/Knöpfe“, Vorrichtungen zum ein- und ausschalten, regeln etc.“, ” ” Direkt: 6, Gesamt: 6, Oberbegriffe: {Schalter}) – beg ( Begrenzungen“, “, Direkt: 37, Gesamt: 37, Oberbegriffe: {-}) ” ” – moe ( Möbelstücke“, “, Direkt: 91, Gesamt: 91, Oberbegriffe: {Möbel}) ” ” – waf ( Waffen“, “, Direkt: 39, Gesamt: 76, Oberbegriffe: {Waffe}) ” ” – wfs ( Schußfeuerwaffen“, “, Direkt: 25, Gesamt: 25, Oberbegriffe: {-}) ” ” – wfg ( Geschosse“, “, Direkt: 12, Gesamt: 12, Oberbegriffe: {-}) ” ” Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 12 Welche Kategorien des CISLEX sind E-Commerce relevant? - weitere Artefakte - • art ( Artefakte“, Von Menschenhand geschaffene Gegenstände“, Direkt: 469, Gesamt: ” ” 3369, Oberbegriffe: {Artefakt, Manufakt}) – asn ( Schnüre“, Schnüre, Taue, Drähte“, Direkt: 32, Gesamt: 32, Oberbegriffe: {-}) ” ” – sul ( Schreib- und Zeichenunterlagen“, “, Direkt: 15, Gesamt: 15, Oberbegriffe: {-}) ” ” – wer ( Werkzeuge“, “, Direkt: 126, Gesamt: 126, Oberbegriffe: {-}) ” ” – ake ( Kleineisenwaren“, Schrauben, Nägel, Muttern“, Direkt: 10, Gesamt: 10, Ober” begriffe: {-}) ” – mas ( Maschinen“, Maschinen, Geräte und Automaten außer Fahrzeuge“, Direkt: ” ” 338, Gesamt: 338, Oberbegriffe: {Maschine, Apparat, Apparatur}) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 13 Welche Kategorien des CISLEX sind E-Commerce relevant? - Artefakte: Musikinstrumente - • ami ( Musikinstrumente“, “, Direkt: 25, Gesamt: 128, Oberbegriffe: {Instrument}) ” – amb ” ( Blasinstrumente“, “, Direkt: 13, Gesamt: 17, Oberbegriffe: {-}) ” ” – amh ( Holzblasinstrumente“, “, Direkt: 4, Gesamt: 4, Oberbegriffe: {-}) ” ” – amm ( Blechblasinstrumente“, “, Direkt: 6, Gesamt: 6, Oberbegriffe: {-}) ” ” – ams ( Streichinstrumente“, “, Direkt: 17, Gesamt: 17, Oberbegriffe: {-}) ” ” – amt ( Tasteninstrumente“, “, Direkt: 20, Gesamt: 20, Oberbegriffe: {-}) ” ” – amz ( Zupfinstrumente“, “, Direkt: 17, Gesamt: 17, Oberbegriffe: {-}) ” ” – amc ( Schlagzeug“, “, Direkt: 18, Gesamt: 18, Oberbegriffe: {-}) ” ” Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 14 Welche Kategorien des CISLEX sind E-Commerce relevant? - Genussmittel- • gmi ( Genußmittel“, “, Direkt: 0, Gesamt: 165, Oberbegriffe: {-}) ” ” – gal ( Alkoholische ” {Alkoholikum}) Getränke“, “, ” Direkt: 97, Gesamt: 120, Oberbegriffe: ∗ gaw ( Weine“, “, Direkt: 20, Gesamt: 23, Oberbegriffe: {Wein}) ” ” · pws ( Weinrebensorten“, Weinrebensorten - auch Weintrauben- und Weinsor” ” ten“, Direkt: 3, Gesamt: 3, Oberbegriffe: {Wein}) – gmt ( Rauchwaren“, “, Direkt: 22, Gesamt: 22, Oberbegriffe: {-}) ” ” – gmd ( Drogen“, Halb- u. illegale Drogen“, Direkt: 23, Gesamt: 23, Oberbegriffe: ” {Droge}) ” Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 15 Welche Kategorien des CISLEX sind E-Commerce relevant? - Stoffbezeichnungen- sto ( Stoffbezeichnungen“, “, Direkt: 749, Gesamt: 1594, Oberbegriffe: ” ” {Material, Stoff, Materie}) • nhg ( Nahrungsgrundstoffe“, Ingredenzien zur Nahrungsherstellung“, Di” ” rekt: 29, Gesamt: 29, Oberbegriffe: {-}) • sfl ( Flüssigkeiten“, “, Direkt: 34, Gesamt: 213, Oberbegriffe: {Flüssigkeit}) ” ” • med ( Medikamente“, Medizin zum Einnehmen, Auftragen ...“, Direkt: 114, ” ” Gesamt: 124, Oberbegriffe: {Medikament, Medizin, Arznei, Pharmazeutikum, Pharmakon}) • kos ( Kosmetika“, “, Direkt: 40, Gesamt: 40, Oberbegriffe: {Kosmetik, ” ” Kosmetikum}) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce Beispiele für E-Commerce irrelevante CISLEX Kategorien • tsr ( Saurier“, “, Direkt: 7, Gesamt: 7, Oberbegriffe: {-}) ” ” • tmy ( Sagentiere“, Tierartige Sagenwesen“, Direkt: 27, Gesamt: 27, Ober” ” begriffe: {-}) • pmy ( mythische Pflanzen“, Nicht real existierende Pflanzen“, Direkt: 3, ” ” Gesamt: 3, Oberbegriffe: {-}) • omy ( Mythischer Ort“, “, Direkt: 31, Gesamt: 31, Oberbegriffe: {-}) ” ” • atv ( Tötungsvorgänge“, “, Direkt: 45, Gesamt: 45, Oberbegriffe: {-}) ” ” • mvb ( Verbrecher“, “, Direkt: 48, Gesamt: 48, Oberbegriffe: {Verbrecher, ” ” Gangster, Gauner, Delinquent, Verbrechertum, Rechtsverletzer}) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 16 Datenbankdesign im E-Commerce 17 Neue Kategorien für das CISLEX? • 239 von insgesamt 429 CISLEX-Kategorien sind E-Commerce relevant (ca. 56 %) • Manche CISLEX-Kategorien müssten mit weiteren Unterkategorien noch feiner klassifiziert werden, wie z. B. – mas ( Maschinen“, Maschinen, Geräte und Automaten außer Fahrzeuge“, Direkt: ” ” 338, Gesamt: 338, Oberbegriffe: {Maschine, Apparat, Apparatur}) ⇒ Computer und Hammer sind beide auf gleicher Ebene in dieser Kategorie ⇒ feinere semantische Klassifikation nötig ! ∗ ∗ ∗ ∗ Haushaltsgeräte Computer und Zubehör Industriegeräte Bau- und Heimwerkergeräte ∗ ∗ ∗ ∗ HiFi- und TV-Geräte Gartenbau-Geräte Landwirtschaftliche Geräte Aufnahmegeräte (z.B. Foto) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce Generische Produkte In welchen Relationen stehen diese Attribute zueinander? • Vollformen • Grundformen • Kompositum → ja/nein ? • Semantische Information/Klassifikation • (starke/schwache) Synonyme • Rechtschreibvarianten • E-Commerce-Kategorien der Produkte (Branchen) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 18 Datenbankdesign im E-Commerce Generische Produkte wichtige Beziehungen zwischen den Attributen • Vollform : Grundform = n : 1 (1) • Grundform : Kompositumkopf = n : 1 (1) → Vollform : Kompositumkopf = n : 1 (1) • Varianten : Grundform = n : m (2) • Grundform : Semantische Kategorie = n : m (3) • Grundform : Branche(E-Commerce-Kategorie) = n : m (4) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 19 Datenbankdesign im E-Commerce Morphologische Informationen zu Produkten Erzeugen der Tabelle produkt morpho Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 20 Datenbankdesign im E-Commerce 21 Morphologische Informationen zu Produkten Das Schema der Tabelle produkt morpho Feld vollform grundform kopf kurzform uhrzeit datum Typ varchar(50) varchar(50) varchar(30) varchar(30) time date Null Standard Nein Ja NULL Ja NULL Ja NULL Nein 00:00:00 Nein 0000-00-00 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 22 Morphologische Informationen zu Produkten Beispieleinträge der Tabelle produkt morpho vollform grundform kopf Blumen Waschmaschinen Nudeln Fotoapparate Bücher Hosenknöpfe Babynahrung Windeln Handtücher Kondome DVD-Rohlinge Fahrräder Blume Waschmaschine Nudel Fotoapparat Buch Hosenknopf Babynahrung Windel Handtuch Kondom DVD-Rohling Fahrrad NULL Maschine NULL Apparat NULL Knopf Nahrung NULL Tuch NULL Rohling Rad kurzform uhrzeit datum NULL NULL NULL Foto NULL NULL NULL NULL NULL NULL DVD Rad 17:31:28 17:31:28 17:31:28 17:31:28 17:31:28 17:31:28 17:31:28 17:31:28 17:31:28 17:31:28 17:31:28 17:31:28 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 23 Produktnamenvariation Erzeugen der Tabelle produkt varianten Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 24 Produktnamenvariation Das Schema der Tabelle produkt varianten Feld Typ Null Standard grundform varchar(50) Nein variante varchar(50) Nein variationsart varchar(50) Ja uhrzeit time Nein 00:00:00 datum date Nein 0000-00-00 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 25 Produktnamenvariation Beispieleinträge der Tabelle produkt varianten grundform variante variationsart uhrzeit datum DVD-Player Fahrrad Fahrrad Feldsalat Fotoapparat Kohlkopf Kondom Masskrug Mobiltelefon Angebot Rechen Tomate DVD Player Drahtesel Velo Vogerlsalat Photoapparat Krautkopf Präservativ Maßkrug Handy Occasion Harke Paradeiser Orthografische Variante Umgangssprache schweizerdeutsche Sprachvariante österreichische Sprachvariante Rechtschreibreform regionale Variante Synonym / regionale Variation Rechtschreibreform Synonym schweizerdeutsche Sprachvariante regionale Variante österreichische Sprachvariante 18:06:34 18:06:34 18:27:07 18:20:35 17:56:45 18:18:01 18:11:14 17:56:45 18:11:14 18:27:07 18:18:01 18:20:35 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 2005-06-11 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce Einordnung von Produkten in CISLEX-Kategorien Erzeugen der Tabelle produkt semkat Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 26 Datenbankdesign im E-Commerce Einordnung von Produkten in CISLEX-Kategorien Das Schema der Tabelle produkt semkat Feld Typ Null Standard grundform varchar(50) Nein semkat varchar(30) Nein uhrzeit time Nein 00:00:00 datum date Nein 0000-00-00 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 27 Datenbankdesign im E-Commerce 28 Einordnung von Produkten in CISLEX-Kategorien Beispieleinträge der Tabelle produkt semkat grundform Blume Bluse Buch Computer Füller Föhn Kondom Fahrrad Pille Tisch Video Video semkat PBL PFL LEB KON KNK KLE ART KON KNK GBC GED ART KON KNK MAS ART KON KNK SCG ART KON KNK MAS ART KON KNK KSX KON KNK FZF FZE ART KON KNK MED STO KNK MOE ART KON KNK DTR ART KON KNK XNK uhrzeit 10:40:56 23:43:55 21:02:40 21:04:09 01:45:10 01:02:55 23:45:05 12:32:05 22:12:27 21:00:08 21:07:35 15:40:54 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 datum 2005-06-05 2005-06-06 2005-06-07 2005-06-07 2005-06-06 2005-06-06 2005-06-06 2005-06-05 2005-06-06 2005-06-07 2005-06-07 2005-06-08 Datenbankdesign im E-Commerce Branchenzugehörigkeit von Produkten Erzeugen der Tabelle produkt branche Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 29 Datenbankdesign im E-Commerce Branchenzugehörigkeit von Produkten Das Schema der Tabelle produkt branche Feld Typ Null Standard grundform varchar(50) Nein branche varchar(50) Nein uhrzeit time Nein 00:00:00 datum date Nein 0000-00-00 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 30 Datenbankdesign im E-Commerce 31 Branchenzugehörigkeit von Produkten Beispieleinträge der Tabelle produkt branche grundform Computer Fahrrad Kondom Fußball Füller Hose Notebook Pille Tisch Video Waschmaschine Windel branche Computer Sport und Freizeit Hygieneartikel Sport und Freizeit Büro und Schreibwaren Kleidung und Accessoires Computer Gesundheit Möbel und Wohnen Filme und DVDs Haushaltsgeräte Babybedarf uhrzeit 18:45:09 23:41:16 22:36:19 23:14:37 23:12:22 22:36:29 18:46:12 21:33:27 12:19:52 22:46:12 19:07:55 21:16:26 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 datum 2005-06-06 2005-06-07 2005-06-07 2005-06-06 2005-06-06 2005-06-06 2005-06-06 2005-06-06 2005-06-06 2005-06-07 2005-06-07 2005-06-06 Datenbankdesign im E-Commerce 32 E-Commerce relevante Informationen in einer Datenbank • Produkt-ID • Produktbeschreibung • Produkt-ID-Typ • Markenname – – – – – UPC EAN ASIN ISBN PZN ... • Produktlinie • Modell • Farbe • Herstellernummer • Größe • Herstellername • Seitenanzahl • (genaue) Produktbezeichnung • Netto-Gewicht • Produktart (generische Produktbezeichnung) • Zusatzinformationen (optional) Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 33 Hersteller von Produkten Erzeugen der Tabelle produkt hersteller Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 34 Hersteller von Produkten Das Schema der Tabelle produkt hersteller Feld Typ Null Standard id varchar(50) Nein name varchar(50) Nein uhrzeit time Nein 00:00:00 datum date Nein 0000-00-00 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 35 Hersteller von Produkten Beispieleinträge der Tabelle produkt hersteller id 300706EK 9325A017 9719A017 E0413110 E3163974 name uhrzeit LaCie 14:31:54 Canon 14:27:40 Canon 14:27:40 Olympus 14:31:54 EPPLE Zweirad GmbH 13:41:32 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 datum 2005-06-12 2005-06-12 2005-06-12 2005-06-12 2005-06-12 Datenbankdesign im E-Commerce 36 Spezifikationen der Produkte Erzeugen der Tabelle produkt Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 37 Spezifikationen der Produkte Das Schema der Tabelle produkt Feld id id typ herstellernummer bezeichnung art beschreibung markenname linie modell uhrzeit datum Typ varchar(20) varchar(10) varchar(50) varchar(50) varchar(50) varchar(100) varchar(40) varchar(30) varchar(30) time date Null Nein Nein Nein Nein Nein Ja Ja Ja Ja Nein Nein Standard NULL NULL NULL NULL 00:00:00 0000-00-00 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 38 Spezifikationen der Produkte Beispieleinträge der Tabelle produkt id 9136344297912 9136344297913 id typ herstellernummer EAN EAN E3163974 E3163974 bezeichnung art Epple Trendline CC1.0 Epple Trendline CC1.0 Fahrrad Fahrrad beschreibung Epple Fahrrad Trendline für den günstigen Einstieg in die Qualitätsklasse bei Cross Cat. Epple Fahrrad Trendline für den günstigen Einstieg in die Qualitätsklasse bei Cross Cat. markenname Epple Epple linie modell uhrzeit datum Trendline Trendline CC1.0 CC1.0 13:59:00 14:04:44 2005-06-12 2005-06-12 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce Verschiedene Ausführungen der Produkte Erzeugen der Tabelle produkt ausfuehrungen Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 39 Datenbankdesign im E-Commerce Verschiedene Ausführungen der Produkte Das Schema der Tabelle produkt ausfuehrungen Feld Typ Null Standard varchar(20) Nein produkt id id typ varchar(10) Nein farbe varchar(30) Ja NULL groesse varchar(30) Ja NULL seitenzahl int(11) Ja NULL netto gewicht in kg decimal(10,0) Ja NULL uhrzeit time Nein 00:00:00 datum date Nein 0000-00-00 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 40 Datenbankdesign im E-Commerce Verschiedene Ausführungen der Produkte Beispieleinträge der Tabelle produkt ausfuehrungen produkt id id typ farbe groesse 9136344297912 EAN silber NULL 9136344297913 EAN schwarz NULL seitenzahl netto gewicht in kg uhrzeit datum NULL 16 14:01:30 2005-06-12 NULL 16 14:01:30 2005-06-12 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 41 Datenbankdesign im E-Commerce Zusatzinformationen zu den Produkten Erzeugen der Tabelle produkt zusatzinformationen Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 42 Datenbankdesign im E-Commerce 43 Zusatzinformationen zu den Produkten Das Schema der Tabelle produkt zusatzinformationen Feld produkt id id typ info 1 info 2 info 3 info 4 info 5 info 6 uhrzeit datum Typ varchar(20) varchar(10) varchar(50) varchar(50) varchar(50) varchar(50) varchar(50) varchar(50) time date Null Nein Nein Nein Ja Ja Ja Ja Ja Nein Nein Standard NULL NULL NULL NULL NULL 00:00:00 0000-00-00 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 44 Zusatzinformationen zu den Produkten Beispieleinträge der Tabelle produkt zusatzinformationen produkt id id typ 9136344297912 9136344297913 EAN EAN info 1 Rahmen: Aluminium 7005, double butted Rahmen: Aluminium 7005, double butted info 2 info 3 Gabel: In´Sync Odessa AC schwarz Gabel: In´Sync Odessa AC schwarz Bereifung: Schwalbe City Cruiser Bereifung: Schwalbe City Cruiser info 4 info 5 info 6 uhrzeit datum Schaltung: 7 Gang Spectro, 24 Gang Alivio Schaltung: 7 Gang Spectro, 24 Gang Alivio NULL NULL NULL NULL 14:09:37 14:09:37 2005-06-12 2005-06-12 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce Kommunikation zwischen Anwender und Datenbank Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 45 Datenbankdesign im E-Commerce 46 Kommunikation zwischen Anwender und Datenbank SELECT p.id, p.id_typ, p.bezeichnung FROM produkt p,produkt_morpho m WHERE m.grundform IN ( SELECT v.grundform FROM produkt_varianten v WHERE v.variante=’Velo’ ) AND m.grundform = p.art AND p.herstellernummer = ( SELECT h.id FROM produkt_hersteller h WHERE h.name like ’%Epple%’ ) AND p.id = ( SELECT a.produkt_id FROM produkt_ausfuerhungen a WHERE a.farbe like ’silber’ ) AND p.id_typ = ( SELECT a.id_typ FROM produkt_ausfuehrungen a WHERE a.farbe like ’silber’ ); /* DB-Abfrage in PostgreSQL */ /* Nachschlagen bei den Produkttermvarianten */ /* Velo -> Fahrrad */ /* Nachschlagen bei den Herstellern */ /* Epple -> Herstellernummer */ /* Nachschlagen bei den Produktausführungen */ /* silber -> Produkt-ID */ Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce 47 Kommunikation zwischen Anwender und Datenbank Das Ergebnis id id typ bezeichnung 9136344297912 EAN Epple Trendline CC1.0 Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 Datenbankdesign im E-Commerce Datenbanken und XML Transformation der Tabelle produkt <?xml version="1.0" encoding="iso-8859-1" ?> <geierhos_Perl> <!-- Tabelle produkt --> <produkt> <id>9136344297912</id> <id_typ>EAN</id_typ> <herstellernummer>E3163974</herstellernummer> <bezeichnung>Epple Trendline CC1.0</bezeichnung> <art>Fahrrad</art> <beschreibung>Epple Fahrrad Trendline für den günstigen Einstieg in die Qualitätsklasse bei Cross Cat.</beschreibung> <markenname>Epple</markenname> <linie>Trendline</linie> <modell>CC1.0</modell> <uhrzeit>13:59:00</uhrzeit> <datum>2005-06-12</datum> </produkt> Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 48 Datenbankdesign im E-Commerce Datenbanken und XML Transformation der Tabelle produkt <?xml version="1.0" encoding="iso-8859-1" ?> .... <produkt> <id>9136344297913</id> <id_typ>EAN</id_typ> <herstellernummer>E3163974</herstellernummer> <bezeichnung>Epple Trendline CC1.0</bezeichnung> <art>Fahrrad</art> <beschreibung>Epple Fahrrad Trendline für den günstigen Einstieg in die Qualitätsklasse bei Cross Cat.</beschreibung> <markenname>Epple</markenname> <linie>Trendline</linie> <modell>CC1.0</modell> <uhrzeit>14:04:44</uhrzeit> <datum>2005-06-12</datum> </produkt> </geierhos_Perl> Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 49 Datenbankdesign im E-Commerce Abfrage der Datenbank von WAND Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 50 Datenbankdesign im E-Commerce Auswahlmöglichkeiten nach DB-Lookup Einblick in das Schema der WAND-Datenbank Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 51 Datenbankdesign im E-Commerce Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 52 Datenbankdesign im E-Commerce Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 53 Datenbankdesign im E-Commerce Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 54 Datenbankdesign im E-Commerce Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 55 Datenbankdesign im E-Commerce Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 56 Datenbankdesign im E-Commerce Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005 57