Datenbankdesign im E-Commerce - Centrum für Informations

Werbung
Datenbankdesign im E-Commerce
- Klassifikation von Produkttermen im Datenbankschema -
Ein Vortrag von:
Michaela Geierhos
Centrum für Informations- und Sprachverarbeitung
LMU München
15.06.2005
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
1
Gliederung
• Das relationale Datenbankmodell
• Generische vs. Proprietäre Produkte
• Semantische Klassifikation anhand des CISLEX
• Bewertung der CISLEX Kategorien bzgl. ihrer E-Commerce Tauglichkeit
• DB-Design-Vorschlag für generische Produkte
• Produkt-DB in der E-Commerce-Anwendung
• Kommunikation zwischen Anwender und Datenbank
• Datenbanktransformation in XML
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
Das relationale Datenbankmodell
• Eine Relationale Datenbank ist eine Datenbank, die auf dem Relationalen Datenbankmodell basiert, das von Edgar F. Codd 1970 erstmals vorgeschlagen
wurde.
• Dahinter stehen Relationen (im streng mathematischen Sinn), so dass man
sagen kann, dass im wesentlichen ein mathematisches Modell für eine Tabelle
beschrieben wird.
• Die Daten werden dabei in Form von zweidimensionalen Tabellen verwaltet,
die über Schlüssel (Primärschlüssel, Fremdschlüssel) miteinander verknüpft
werden können.
• Für relationale Datenbanken gibt es mit SQL eine verbreitete und teilweise
standardisierte Anfragesprache.
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
2
Datenbankdesign im E-Commerce
Das relationale Datenbankmodell
• Zur Modellierung von relationalen Datenbanken wird meist das EntityRelationship-Modell oder Varianten davon verwendet.
• Es dient zum Entwurf eines konzeptuellen Schemas, welches unter Verwendung eines DBMS implementiert werden kann.
• Dieser Schritt wird als logischer Entwurf oder auch Datenmodellabbildung
bezeichnet und hat als Ergebnis ein Datenbankschema im Implementierungssdatenmodell des DBMS.
• Als relationale Anfragesprache wird MySQL für das Konzept und die Umsetzung der entstehenden Produkt-Datenbank gewählt.
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
3
Datenbankdesign im E-Commerce
Generische vs. Proprietäre Produkte
Wie behandelt man sie in einer Datenbank?
• Generische Produkte:
Diese Produkte sind auch als sogenannte Produktklassen“oder generi”
”
sche Produkte“bekannt. Ihre (morphologischen/semantischen) Eigenschaften werden nur einmal beschrieben. Ein tatsächlich erstelltes Produkt wird
als Instanz“(auch Ausprägung“) des (generischen) Produkts bezeichnet.
”
”
Beispiel: Notebook
• Proprietäre Produkte:
Ein tatsächlich erstelltes Produkt“ist im weiteren Sinne ein proprietäres
”
Produkt, das im Grunde nur dadurch Eigentümer/Hersteller spezifisch wird,
in dem es einen Firmen gebundenen Markennamen bekommt, oder der
Herstellername in der Produktbezeichnung mit auftaucht.
Beispiel: Sony Vaio VGN-T2XP/S Notebook
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
4
Datenbankdesign im E-Commerce
5
Generische Produkte
Linguistisch relevante Informationen
• generische Produkte (meist) ⊂ proprietäre Produkte
→ gleiche morphologische, syntaktische und semantische Eigenschaften
→ Archivierung linguistischer Daten nur für generische Produkte!
• Vollformen
• (starke/schwache) Synonyme
• Grundformen
• Rechtschreibvarianten
• Kompositum → ja/nein ?
• Semantische Information/Klassifika- • E-Commerce-Kategorien der Produkte (Branchen)
tion
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
Generische Produkte
Semantische Klassifikation anhand des CISLEX
• Vollformen
• Grundformen
• Kompositum → ja/nein ?
• Semantische Information/Klassifikation
• (starke/schwache) Synonyme
• Rechtschreibvarianten
• E-Commerce-Kategorien der Produkte (Branchen)
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
6
Datenbankdesign im E-Commerce
7
Welche Kategorien des CISLEX sind E-Commerce relevant?
- Tiere -
knk (”Konkreta“, ”Konkreta, auch Stoffe“, Direkt: 0, Gesamt: 15226, Oberbegriffe: {-})
• kon ( konkrete Individualnomina“, Objekte“, Direkt: 261, Gesamt: 13053, Oberbegriffe:
”
{Objekt, Gegenstand})
”
– leb ( Lebewesen“, “, Direkt: 53, Gesamt: 9169, Oberbegriffe: {Geschöpf, Kreatur})
”
”
∗ tie ( Tiere“, “, Direkt: 88, Gesamt: 853, Oberbegriffe: {Tier, Fauna, Getier})
”
”
· tst ( Säugetiere“, “, Direkt: 217, Gesamt: 270, Oberbegriffe: {Säuger, Mammalia,
”
Mammalium})
”
+ tms ( Meeressäuger“, “, Direkt: 16, Gesamt: 16, Oberbegriffe: {-})
”
”
+ thu ( Haushunde“, Hunderassen & nicht-Rassen“, Direkt: 37, Gesamt: 37,
”
”
Oberbegriffe: {-})
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
8
Welche Kategorien des CISLEX sind E-Commerce relevant?
- Pflanzen -
leb (”Lebewesen“, ” “, Direkt: 53, Gesamt: 9169, Oberbegriffe: {Geschöpf, Kreatur})
• tie ( Tiere“, “, Direkt: 88, Gesamt: 853, Oberbegriffe: {Tier, Fauna, Getier})
”
”
• pfl ( Pflanzen“, “, Direkt: 189, Gesamt: 513, Oberbegriffe: {Pflanze, Flora, Vegetabilien})
”
”
– pba ( Bäume“, “, Direkt: 57, Gesamt: 71, Oberbegriffe: {Baum})
”
”
– pst ( Sträucher“, “, Direkt: 14, Gesamt: 14, Oberbegriffe: {Busch, Strauch, Gebüsch,
–
–
–
”
”
Gesträuch})
pbl (”Blumen“, ” “, Direkt: 56, Gesamt: 56, Oberbegriffe: {Blume})
ppl (”Pilze“, ” “, Direkt: 23, Gesamt: 23, Oberbegriffe: {Pilz, Schwammerl})
pzi (”Zierpflanzen“, ”Zier- und Zimmerpflanzen“, Direkt: 20, Gesamt: 20, Oberbegriffe:
{-})
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
9
Welche Kategorien des CISLEX sind E-Commerce relevant?
- Artefakte: Kleidungsstücke -
knk (”Konkreta“, ”Konkreta, auch Stoffe“, Direkt: 0, Gesamt: 15226, Oberbegriffe: {-})
• kon ( konkrete Individualnomina“, Objekte“, Direkt: 261, Gesamt: 13053, Oberbegriffe:
”
{Objekt, Gegenstand})
”
– leb ( Lebewesen“, “, Direkt: 53, Gesamt: 9169, Oberbegriffe: {Geschöpf, Kreatur})
”
”
– art ( Artefakte“, Von Menschenhand geschaffene Gegenstände“, Direkt: 469, Gesamt:
”
”
3369, Oberbegriffe: {Artefakt, Manufakt})
∗ kle ( Kleidungsstücke“, Oberklasse für alle Kleidungstücke“, Direkt: 218, Gesamt:
”
”
279, Oberbegriffe: {Kleidung, Bekleidung, Klamotte})
· klk ( Kopfbedeckungen“, “, Direkt: 31, Gesamt: 31, Oberbegriffe: {-})
”
”
· klf ( Fußbekleidung“, “, Direkt: 30, Gesamt: 30, Oberbegriffe: {-})
”
”
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
10
Welche Kategorien des CISLEX sind E-Commerce relevant?
- Artefakte: Fahrzeuge -
• art ( Artefakte“, Von Menschenhand geschaffene Gegenstände“, Direkt: 469, Gesamt:
”
”
3369, Oberbegriffe: {Artefakt, Manufakt})
.....
– fze ( Fahrzeuge“, Fahrzeuge, Verkehrsmittel“, Direkt: 33, Gesamt: 390, Oberbegriffe:
”
”
{Fahrzeug, Gefährt, Vehikel})
∗ fzw ( Wasserfahrzeuge“, Alle Fahrzeuge, die sich im Wasser fortbewegen“, Direkt:
”
”
105, Gesamt: 108, Oberbegriffe: {Schiff})
· fzu ( Unterwasserfahrzeuge“, Uboote etc.“, Direkt: 3, Gesamt: 3, Oberbegriffe:
”
”
{-})
∗ fzl ( Luftfahrzeuge“, Alle Arten von Luftfahrzeugen“, Direkt: 28, Gesamt: 28,
”
”
Oberbegriffe: {Flugzeug})
∗ fza ( Autos“, PKWs und LKWs“, Direkt: 77, Gesamt: 77, Oberbegriffe: {Auto,
”
”
Laster})
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
11
Welche Kategorien des CISLEX sind E-Commerce relevant?
- weitere Artefakte -
• art ( Artefakte“, Von Menschenhand geschaffene Gegenstände“, Direkt: 469, Gesamt:
”
”
3369, Oberbegriffe: {Artefakt, Manufakt})
– sca ( Schalter/Tasten/Knöpfe“, Vorrichtungen zum ein- und ausschalten, regeln etc.“,
”
”
Direkt: 6, Gesamt: 6, Oberbegriffe: {Schalter})
– beg ( Begrenzungen“, “, Direkt: 37, Gesamt: 37, Oberbegriffe: {-})
”
”
– moe ( Möbelstücke“, “, Direkt: 91, Gesamt: 91, Oberbegriffe: {Möbel})
”
”
– waf ( Waffen“, “, Direkt: 39, Gesamt: 76, Oberbegriffe: {Waffe})
”
”
– wfs ( Schußfeuerwaffen“, “, Direkt: 25, Gesamt: 25, Oberbegriffe: {-})
”
”
– wfg ( Geschosse“, “, Direkt: 12, Gesamt: 12, Oberbegriffe: {-})
”
”
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
12
Welche Kategorien des CISLEX sind E-Commerce relevant?
- weitere Artefakte -
• art ( Artefakte“, Von Menschenhand geschaffene Gegenstände“, Direkt: 469, Gesamt:
”
”
3369, Oberbegriffe: {Artefakt, Manufakt})
– asn ( Schnüre“, Schnüre, Taue, Drähte“, Direkt: 32, Gesamt: 32, Oberbegriffe: {-})
”
”
– sul ( Schreib- und Zeichenunterlagen“, “, Direkt: 15, Gesamt: 15, Oberbegriffe: {-})
”
”
– wer ( Werkzeuge“, “, Direkt: 126, Gesamt: 126, Oberbegriffe: {-})
”
”
– ake ( Kleineisenwaren“, Schrauben, Nägel, Muttern“, Direkt: 10, Gesamt: 10, Ober”
begriffe: {-})
”
– mas ( Maschinen“, Maschinen, Geräte und Automaten außer Fahrzeuge“, Direkt:
”
”
338, Gesamt: 338, Oberbegriffe: {Maschine, Apparat, Apparatur})
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
13
Welche Kategorien des CISLEX sind E-Commerce relevant?
- Artefakte: Musikinstrumente -
• ami ( Musikinstrumente“, “, Direkt: 25, Gesamt: 128, Oberbegriffe: {Instrument})
”
– amb
”
( Blasinstrumente“, “, Direkt: 13, Gesamt: 17, Oberbegriffe: {-})
”
”
– amh ( Holzblasinstrumente“, “, Direkt: 4, Gesamt: 4, Oberbegriffe: {-})
”
”
– amm ( Blechblasinstrumente“, “, Direkt: 6, Gesamt: 6, Oberbegriffe: {-})
”
”
– ams ( Streichinstrumente“, “, Direkt: 17, Gesamt: 17, Oberbegriffe: {-})
”
”
– amt ( Tasteninstrumente“, “, Direkt: 20, Gesamt: 20, Oberbegriffe: {-})
”
”
– amz ( Zupfinstrumente“, “, Direkt: 17, Gesamt: 17, Oberbegriffe: {-})
”
”
– amc ( Schlagzeug“, “, Direkt: 18, Gesamt: 18, Oberbegriffe: {-})
”
”
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
14
Welche Kategorien des CISLEX sind E-Commerce relevant?
- Genussmittel-
• gmi ( Genußmittel“, “, Direkt: 0, Gesamt: 165, Oberbegriffe: {-})
”
”
– gal
( Alkoholische
”
{Alkoholikum})
Getränke“,
“,
”
Direkt:
97,
Gesamt:
120,
Oberbegriffe:
∗ gaw ( Weine“, “, Direkt: 20, Gesamt: 23, Oberbegriffe: {Wein})
”
”
· pws ( Weinrebensorten“, Weinrebensorten - auch Weintrauben- und Weinsor”
”
ten“, Direkt: 3, Gesamt: 3, Oberbegriffe: {Wein})
– gmt ( Rauchwaren“, “, Direkt: 22, Gesamt: 22, Oberbegriffe: {-})
”
”
– gmd ( Drogen“, Halb- u. illegale Drogen“, Direkt: 23, Gesamt: 23, Oberbegriffe:
”
{Droge})
”
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
15
Welche Kategorien des CISLEX sind E-Commerce relevant?
- Stoffbezeichnungen-
sto ( Stoffbezeichnungen“, “, Direkt: 749, Gesamt: 1594, Oberbegriffe:
”
”
{Material, Stoff, Materie})
• nhg ( Nahrungsgrundstoffe“, Ingredenzien zur Nahrungsherstellung“, Di”
”
rekt: 29, Gesamt: 29, Oberbegriffe: {-})
• sfl ( Flüssigkeiten“, “, Direkt: 34, Gesamt: 213, Oberbegriffe: {Flüssigkeit})
”
”
• med ( Medikamente“, Medizin zum Einnehmen, Auftragen ...“, Direkt: 114,
”
”
Gesamt: 124, Oberbegriffe: {Medikament, Medizin, Arznei, Pharmazeutikum,
Pharmakon})
• kos ( Kosmetika“, “, Direkt: 40, Gesamt: 40, Oberbegriffe: {Kosmetik,
”
”
Kosmetikum})
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
Beispiele für E-Commerce irrelevante CISLEX Kategorien
• tsr ( Saurier“, “, Direkt: 7, Gesamt: 7, Oberbegriffe: {-})
”
”
• tmy ( Sagentiere“, Tierartige Sagenwesen“, Direkt: 27, Gesamt: 27, Ober”
”
begriffe: {-})
• pmy ( mythische Pflanzen“, Nicht real existierende Pflanzen“, Direkt: 3,
”
”
Gesamt: 3, Oberbegriffe: {-})
• omy ( Mythischer Ort“, “, Direkt: 31, Gesamt: 31, Oberbegriffe: {-})
”
”
• atv ( Tötungsvorgänge“, “, Direkt: 45, Gesamt: 45, Oberbegriffe: {-})
”
”
• mvb ( Verbrecher“, “, Direkt: 48, Gesamt: 48, Oberbegriffe: {Verbrecher,
”
”
Gangster, Gauner, Delinquent, Verbrechertum, Rechtsverletzer})
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
16
Datenbankdesign im E-Commerce
17
Neue Kategorien für das CISLEX?
• 239 von insgesamt 429 CISLEX-Kategorien sind E-Commerce relevant
(ca. 56 %)
• Manche CISLEX-Kategorien müssten mit weiteren Unterkategorien noch
feiner klassifiziert werden, wie z. B.
– mas ( Maschinen“, Maschinen, Geräte und Automaten außer Fahrzeuge“, Direkt:
”
”
338, Gesamt: 338, Oberbegriffe: {Maschine, Apparat, Apparatur})
⇒ Computer und Hammer sind beide auf gleicher Ebene in dieser Kategorie
⇒ feinere semantische Klassifikation nötig !
∗
∗
∗
∗
Haushaltsgeräte
Computer und Zubehör
Industriegeräte
Bau- und Heimwerkergeräte
∗
∗
∗
∗
HiFi- und TV-Geräte
Gartenbau-Geräte
Landwirtschaftliche Geräte
Aufnahmegeräte (z.B. Foto)
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
Generische Produkte
In welchen Relationen stehen diese Attribute zueinander?
• Vollformen
• Grundformen
• Kompositum → ja/nein ?
• Semantische Information/Klassifikation
• (starke/schwache) Synonyme
• Rechtschreibvarianten
• E-Commerce-Kategorien der Produkte (Branchen)
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
18
Datenbankdesign im E-Commerce
Generische Produkte
wichtige Beziehungen zwischen den Attributen
• Vollform : Grundform = n : 1 (1)
• Grundform : Kompositumkopf = n : 1 (1)
→ Vollform : Kompositumkopf = n : 1 (1)
• Varianten : Grundform = n : m (2)
• Grundform : Semantische Kategorie = n : m (3)
• Grundform : Branche(E-Commerce-Kategorie) = n : m (4)
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
19
Datenbankdesign im E-Commerce
Morphologische Informationen zu Produkten
Erzeugen der Tabelle produkt morpho
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
20
Datenbankdesign im E-Commerce
21
Morphologische Informationen zu Produkten
Das Schema der Tabelle produkt morpho
Feld
vollform
grundform
kopf
kurzform
uhrzeit
datum
Typ
varchar(50)
varchar(50)
varchar(30)
varchar(30)
time
date
Null Standard
Nein
Ja
NULL
Ja
NULL
Ja
NULL
Nein 00:00:00
Nein 0000-00-00
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
22
Morphologische Informationen zu Produkten
Beispieleinträge der Tabelle produkt morpho
vollform
grundform
kopf
Blumen
Waschmaschinen
Nudeln
Fotoapparate
Bücher
Hosenknöpfe
Babynahrung
Windeln
Handtücher
Kondome
DVD-Rohlinge
Fahrräder
Blume
Waschmaschine
Nudel
Fotoapparat
Buch
Hosenknopf
Babynahrung
Windel
Handtuch
Kondom
DVD-Rohling
Fahrrad
NULL
Maschine
NULL
Apparat
NULL
Knopf
Nahrung
NULL
Tuch
NULL
Rohling
Rad
kurzform
uhrzeit
datum
NULL
NULL
NULL
Foto
NULL
NULL
NULL
NULL
NULL
NULL
DVD
Rad
17:31:28
17:31:28
17:31:28
17:31:28
17:31:28
17:31:28
17:31:28
17:31:28
17:31:28
17:31:28
17:31:28
17:31:28
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
23
Produktnamenvariation
Erzeugen der Tabelle produkt varianten
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
24
Produktnamenvariation
Das Schema der Tabelle produkt varianten
Feld
Typ
Null Standard
grundform varchar(50) Nein
variante
varchar(50) Nein
variationsart varchar(50) Ja
uhrzeit
time
Nein 00:00:00
datum
date
Nein 0000-00-00
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
25
Produktnamenvariation
Beispieleinträge der Tabelle produkt varianten
grundform
variante
variationsart
uhrzeit
datum
DVD-Player
Fahrrad
Fahrrad
Feldsalat
Fotoapparat
Kohlkopf
Kondom
Masskrug
Mobiltelefon
Angebot
Rechen
Tomate
DVD Player
Drahtesel
Velo
Vogerlsalat
Photoapparat
Krautkopf
Präservativ
Maßkrug
Handy
Occasion
Harke
Paradeiser
Orthografische Variante
Umgangssprache
schweizerdeutsche Sprachvariante
österreichische Sprachvariante
Rechtschreibreform
regionale Variante
Synonym / regionale Variation
Rechtschreibreform
Synonym
schweizerdeutsche Sprachvariante
regionale Variante
österreichische Sprachvariante
18:06:34
18:06:34
18:27:07
18:20:35
17:56:45
18:18:01
18:11:14
17:56:45
18:11:14
18:27:07
18:18:01
18:20:35
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
2005-06-11
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
Einordnung von Produkten in CISLEX-Kategorien
Erzeugen der Tabelle produkt semkat
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
26
Datenbankdesign im E-Commerce
Einordnung von Produkten in CISLEX-Kategorien
Das Schema der Tabelle produkt semkat
Feld
Typ
Null Standard
grundform varchar(50) Nein
semkat
varchar(30) Nein
uhrzeit
time
Nein 00:00:00
datum
date
Nein 0000-00-00
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
27
Datenbankdesign im E-Commerce
28
Einordnung von Produkten in CISLEX-Kategorien
Beispieleinträge der Tabelle produkt semkat
grundform
Blume
Bluse
Buch
Computer
Füller
Föhn
Kondom
Fahrrad
Pille
Tisch
Video
Video
semkat
PBL PFL LEB KON KNK
KLE ART KON KNK
GBC GED ART KON KNK
MAS ART KON KNK
SCG ART KON KNK
MAS ART KON KNK
KSX KON KNK
FZF FZE ART KON KNK
MED STO KNK
MOE ART KON KNK
DTR ART KON KNK
XNK
uhrzeit
10:40:56
23:43:55
21:02:40
21:04:09
01:45:10
01:02:55
23:45:05
12:32:05
22:12:27
21:00:08
21:07:35
15:40:54
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
datum
2005-06-05
2005-06-06
2005-06-07
2005-06-07
2005-06-06
2005-06-06
2005-06-06
2005-06-05
2005-06-06
2005-06-07
2005-06-07
2005-06-08
Datenbankdesign im E-Commerce
Branchenzugehörigkeit von Produkten
Erzeugen der Tabelle produkt branche
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
29
Datenbankdesign im E-Commerce
Branchenzugehörigkeit von Produkten
Das Schema der Tabelle produkt branche
Feld
Typ
Null Standard
grundform varchar(50) Nein
branche
varchar(50) Nein
uhrzeit
time
Nein 00:00:00
datum
date
Nein 0000-00-00
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
30
Datenbankdesign im E-Commerce
31
Branchenzugehörigkeit von Produkten
Beispieleinträge der Tabelle produkt branche
grundform
Computer
Fahrrad
Kondom
Fußball
Füller
Hose
Notebook
Pille
Tisch
Video
Waschmaschine
Windel
branche
Computer
Sport und Freizeit
Hygieneartikel
Sport und Freizeit
Büro und Schreibwaren
Kleidung und Accessoires
Computer
Gesundheit
Möbel und Wohnen
Filme und DVDs
Haushaltsgeräte
Babybedarf
uhrzeit
18:45:09
23:41:16
22:36:19
23:14:37
23:12:22
22:36:29
18:46:12
21:33:27
12:19:52
22:46:12
19:07:55
21:16:26
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
datum
2005-06-06
2005-06-07
2005-06-07
2005-06-06
2005-06-06
2005-06-06
2005-06-06
2005-06-06
2005-06-06
2005-06-07
2005-06-07
2005-06-06
Datenbankdesign im E-Commerce
32
E-Commerce relevante Informationen in einer Datenbank
• Produkt-ID
• Produktbeschreibung
• Produkt-ID-Typ
• Markenname
–
–
–
–
–
UPC
EAN
ASIN
ISBN
PZN ...
• Produktlinie
• Modell
• Farbe
• Herstellernummer
• Größe
• Herstellername
• Seitenanzahl
• (genaue) Produktbezeichnung
• Netto-Gewicht
• Produktart
(generische Produktbezeichnung)
• Zusatzinformationen (optional)
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
33
Hersteller von Produkten
Erzeugen der Tabelle produkt hersteller
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
34
Hersteller von Produkten
Das Schema der Tabelle produkt hersteller
Feld
Typ
Null Standard
id
varchar(50) Nein
name varchar(50) Nein
uhrzeit
time
Nein 00:00:00
datum
date
Nein 0000-00-00
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
35
Hersteller von Produkten
Beispieleinträge der Tabelle produkt hersteller
id
300706EK
9325A017
9719A017
E0413110
E3163974
name
uhrzeit
LaCie
14:31:54
Canon
14:27:40
Canon
14:27:40
Olympus
14:31:54
EPPLE Zweirad GmbH 13:41:32
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
datum
2005-06-12
2005-06-12
2005-06-12
2005-06-12
2005-06-12
Datenbankdesign im E-Commerce
36
Spezifikationen der Produkte
Erzeugen der Tabelle produkt
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
37
Spezifikationen der Produkte
Das Schema der Tabelle produkt
Feld
id
id typ
herstellernummer
bezeichnung
art
beschreibung
markenname
linie
modell
uhrzeit
datum
Typ
varchar(20)
varchar(10)
varchar(50)
varchar(50)
varchar(50)
varchar(100)
varchar(40)
varchar(30)
varchar(30)
time
date
Null
Nein
Nein
Nein
Nein
Nein
Ja
Ja
Ja
Ja
Nein
Nein
Standard
NULL
NULL
NULL
NULL
00:00:00
0000-00-00
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
38
Spezifikationen der Produkte
Beispieleinträge der Tabelle produkt
id
9136344297912
9136344297913
id typ
herstellernummer
EAN
EAN
E3163974
E3163974
bezeichnung
art
Epple Trendline CC1.0
Epple Trendline CC1.0
Fahrrad
Fahrrad
beschreibung
Epple Fahrrad Trendline für den günstigen Einstieg in die Qualitätsklasse bei Cross Cat.
Epple Fahrrad Trendline für den günstigen Einstieg in die Qualitätsklasse bei Cross Cat.
markenname
Epple
Epple
linie
modell
uhrzeit
datum
Trendline
Trendline
CC1.0
CC1.0
13:59:00
14:04:44
2005-06-12
2005-06-12
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
Verschiedene Ausführungen der Produkte
Erzeugen der Tabelle produkt ausfuehrungen
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
39
Datenbankdesign im E-Commerce
Verschiedene Ausführungen der Produkte
Das Schema der Tabelle produkt ausfuehrungen
Feld
Typ
Null Standard
varchar(20) Nein
produkt id
id typ
varchar(10) Nein
farbe
varchar(30)
Ja
NULL
groesse
varchar(30)
Ja
NULL
seitenzahl
int(11)
Ja
NULL
netto gewicht in kg decimal(10,0) Ja
NULL
uhrzeit
time
Nein
00:00:00
datum
date
Nein 0000-00-00
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
40
Datenbankdesign im E-Commerce
Verschiedene Ausführungen der Produkte
Beispieleinträge der Tabelle produkt ausfuehrungen
produkt id
id typ farbe groesse
9136344297912 EAN
silber
NULL
9136344297913 EAN
schwarz NULL
seitenzahl netto gewicht in kg uhrzeit
datum
NULL
16
14:01:30 2005-06-12
NULL
16
14:01:30 2005-06-12
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
41
Datenbankdesign im E-Commerce
Zusatzinformationen zu den Produkten
Erzeugen der Tabelle produkt zusatzinformationen
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
42
Datenbankdesign im E-Commerce
43
Zusatzinformationen zu den Produkten
Das Schema der Tabelle produkt zusatzinformationen
Feld
produkt id
id typ
info 1
info 2
info 3
info 4
info 5
info 6
uhrzeit
datum
Typ
varchar(20)
varchar(10)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
varchar(50)
time
date
Null
Nein
Nein
Nein
Ja
Ja
Ja
Ja
Ja
Nein
Nein
Standard
NULL
NULL
NULL
NULL
NULL
00:00:00
0000-00-00
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
44
Zusatzinformationen zu den Produkten
Beispieleinträge der Tabelle produkt zusatzinformationen
produkt id
id typ
9136344297912
9136344297913
EAN
EAN
info 1
Rahmen: Aluminium 7005, double butted
Rahmen: Aluminium 7005, double butted
info 2
info 3
Gabel: In´Sync Odessa AC schwarz
Gabel: In´Sync Odessa AC schwarz
Bereifung: Schwalbe City Cruiser
Bereifung: Schwalbe City Cruiser
info 4
info 5
info 6
uhrzeit
datum
Schaltung: 7 Gang Spectro, 24 Gang Alivio
Schaltung: 7 Gang Spectro, 24 Gang Alivio
NULL
NULL
NULL
NULL
14:09:37
14:09:37
2005-06-12
2005-06-12
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
Kommunikation zwischen Anwender und Datenbank
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
45
Datenbankdesign im E-Commerce
46
Kommunikation zwischen Anwender und Datenbank
SELECT p.id, p.id_typ, p.bezeichnung
FROM produkt p,produkt_morpho m
WHERE m.grundform IN (
SELECT v.grundform
FROM produkt_varianten v
WHERE v.variante=’Velo’ )
AND m.grundform = p.art
AND p.herstellernummer = (
SELECT h.id
FROM produkt_hersteller h
WHERE h.name like ’%Epple%’ )
AND p.id = (
SELECT a.produkt_id
FROM produkt_ausfuerhungen a
WHERE a.farbe like ’silber’ )
AND p.id_typ = (
SELECT a.id_typ
FROM produkt_ausfuehrungen a
WHERE a.farbe like ’silber’ );
/* DB-Abfrage in PostgreSQL */
/* Nachschlagen bei den
Produkttermvarianten */
/* Velo -> Fahrrad */
/* Nachschlagen bei den
Herstellern */
/* Epple -> Herstellernummer */
/* Nachschlagen bei den
Produktausführungen */
/* silber -> Produkt-ID */
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
47
Kommunikation zwischen Anwender und Datenbank
Das Ergebnis
id
id typ
bezeichnung
9136344297912 EAN
Epple Trendline CC1.0
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
Datenbankdesign im E-Commerce
Datenbanken und XML
Transformation der Tabelle produkt
<?xml version="1.0" encoding="iso-8859-1" ?>
<geierhos_Perl>
<!-- Tabelle produkt -->
<produkt>
<id>9136344297912</id>
<id_typ>EAN</id_typ>
<herstellernummer>E3163974</herstellernummer>
<bezeichnung>Epple Trendline CC1.0</bezeichnung>
<art>Fahrrad</art>
<beschreibung>Epple Fahrrad Trendline für den günstigen
Einstieg in die Qualitätsklasse bei Cross
Cat.</beschreibung>
<markenname>Epple</markenname>
<linie>Trendline</linie>
<modell>CC1.0</modell>
<uhrzeit>13:59:00</uhrzeit>
<datum>2005-06-12</datum>
</produkt>
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
48
Datenbankdesign im E-Commerce
Datenbanken und XML
Transformation der Tabelle produkt
<?xml version="1.0" encoding="iso-8859-1" ?>
....
<produkt>
<id>9136344297913</id>
<id_typ>EAN</id_typ>
<herstellernummer>E3163974</herstellernummer>
<bezeichnung>Epple Trendline CC1.0</bezeichnung>
<art>Fahrrad</art>
<beschreibung>Epple Fahrrad Trendline für den günstigen
Einstieg in die Qualitätsklasse bei Cross
Cat.</beschreibung>
<markenname>Epple</markenname>
<linie>Trendline</linie>
<modell>CC1.0</modell>
<uhrzeit>14:04:44</uhrzeit>
<datum>2005-06-12</datum>
</produkt>
</geierhos_Perl>
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
49
Datenbankdesign im E-Commerce
Abfrage der Datenbank von WAND
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
50
Datenbankdesign im E-Commerce
Auswahlmöglichkeiten nach DB-Lookup
Einblick in das Schema der WAND-Datenbank
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
51
Datenbankdesign im E-Commerce
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
52
Datenbankdesign im E-Commerce
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
53
Datenbankdesign im E-Commerce
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
54
Datenbankdesign im E-Commerce
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
55
Datenbankdesign im E-Commerce
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
56
Datenbankdesign im E-Commerce
Centrum für Informations- und Sprachverarbeitung (CIS) - LMU - Michaela Geierhos - 15.06.2005
57
Herunterladen