Anragesprachen12

Werbung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
1/24
Beispiel einer Anfrage
Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen Kosmetik,
Elektro und Haushaltswaren in den Bundesländern Sachsen-Anhalt und
Thüringen angefallen?
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
2/24
Fragestellungen und Aufgaben (Bsp.)
• Überprüfung des Warensortiments zur Erkennung von Ladenhütern oder
Verkaufsschlagern
• Standortanalyse zur Einschätzung der Rentabilität von Niederlassungen
• Untersuchung der Wirksamkeit von Marketing-Aktionen
• Auswertung von Kundenbefragungen, Reklamationen bezüglich bestimmter
Produkte etc.
• Analyse des Lagerbestandes
• Warnkorbanalyse mit Hilfe der Kassenbons
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
3/24
Ergebnis (Würfel)
Produkt
Summe
Haushalt
Elektro
Kosmetik
1998
1999
Kennzahl
Summe
Zeitraum
Umsatz
Region
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
4/24
Ergebnis (Bericht)
Umsatz
1998
1999
Kosmetik
Elektro
Haushalt
SUMME
Sachsen-Anhalt
45
123
17
185
Thüringen
43
131
21
195
SUMME
88
254
38
380
Sachsen-Anhalt
47
131
19
197
Thüringen
40
136
20
196
SUMME
87
267
39
393
SUMME
175
521
77
773
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
5/24
Aspekte von Data Warehouses
Integration
• Vereinigung von Daten aus verschiedenen, meist heterogenen Quellen
• Überwindung der Heterogenität auf verschiedenen Ebenen (System, Schema,
Daten)
Analyse
• Bereitstellung der Daten in einer vom Anwender gewünschten Form (bezogen
auf Entscheidungsgebiet)
• erfordert Vorauswahl, Zeitbezug, Aggregation
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
6/24
Marktentwicklung
Marktgröße
Data Warehouse und OLAP (Quelle: OLAP Report OnLine www.olapreport.com)
4,5
4
3,5
3
2,5
Mrd. Euro
2
1,5
1
0,5
0
1994
1995 1996
1997
1998
1999
2000
2001
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Abgrenzung zu OLTP
Klassische operative Informationssysteme
 Online Transactional Processing (OLTP)
• Erfassung und Verwaltung von Daten
• Verarbeitung unter Verantwortung der jeweiligen Abteilung
• Transaktionale Verarbeitung: Kurze Lese-/Schreibzugriffe auf wenige
Datensätze
Data Warehouse
• Analyse im Mittelpunkt
• lange Lesetransaktionen auf vielen Datensätzen
• Integration, Konsolidierung und Aggregation der Daten
7/24
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
8/24
Abgrenzung zu OLTP: Anfragen
Anfrage
transaktional
analytisch
Fokus
Lesen, Schreiben,
Modifizieren, Löschen
Lesen, periodisches
Hinzufügen
Transaktionsdauer
und -typ
kurze Lese-/
Schreibtransaktionen
lange
Lesetransaktionen
Anfragestruktur
einfach strukturiert
komplex
Datenvolumen einer
Anfrage
wenige Datensätze
viele Datensätze
Datenmodell
anfrageflexibel
analysebezogen
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
9/24
Abgrenzung zu OLTP: Daten
Daten
transaktional
analytisch
Datenquellen
meist eine
mehrere
Eigenschaften
nicht abgeleitet,
zeitaktuell, autonom,
dynamisch
abgeleitet/konsolidiert,
nicht zeitaktuell,
integriert, stabil
Datenvolumen
MByte…GByte
GByte…TByte
Zugriffe
Einzeltupelzugriff
Tabellenzugriff
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
10/24
Abgrenzung zu OLTP: Anwender
Anwender
transaktional
analytisch
Anwendertyp
Ein-/Ausgabe durch
Angestellte oder
Applikationssoftware
Manager, Controller,
Analyst
Anwenderzahl
sehr viele
wenige (bis einige
hundert)
Antwortzeit
ms…sec
sec…min
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
11/24
Data Warehouse: Charakteristika
Fachorientierung (subject-oriented)
• Zweck des Systems ist nicht Erfüllung einer Aufgabe (z.B.
Personaldatenverwaltung), sondern Modellierung eines spezifischen
Anwendungsziels
Integrierte Datenbasis (integrated)
• Verarbeitung von Daten aus mehreren verschiedenen Datenquellen (intern und
extern)
Nicht-flüchtige Datenbasis (non-volatile)
• stabile, persistente Datenbasis
• Daten im Data Warehouse werden nicht mehr entfernt oder geändert
Historische Daten (time-variant)
• Vergleich der Daten über Zeit möglich (Zeitreihenanalyse)
• Speicherung über längeren Zeitraum
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
12/24
Data Warehouse
Datenbank, die Daten aus unterschiedlichen Quellen integriert und Analysen
darauf unterstützt (Rahm/Vossen)
Data Mining
Nach Rahm/Vossen eine Sammlung von Verfahren zur Entdeckung von Mustern
in großen Datenmengen.
Verfahrensklassen sind Clustering, Klassifikation und die Bestimmung von
Assoziationsregeln
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
13/24
Aufgabe 1 (IR)
Information Retrieval wird durch sogenannte Suchmaschinen (Search Engines)
im Web realisiert.
Teilweise spezialisieren sich diese Suchmaschinen auf bestimmte
Themengebiete.
Finden Sie solche Anbieter mit Suchmaschinen und notieren Sie sich die
abgedeckten Themengebiete.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Erweiterung der Abfrage
Kombination
select
*
from
germany, cities
where
cities.name = germany.stadt
and
germany.hotel
like
arcor
and
cities.plz
like
6%
or
cities.plz
like
5%
14/24
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
W3QL Beispiel
• select from
where
n1, l1, (n2, l2), n3, l3
n1 in {URL};
l1 in {path}
l2 in {path}
n3: PERLCOND, n3.format =~/image/‘
n3 in {path}
using ISSEARCH –d 5-l 1000
• Ergebnis: Tabelle mit Links
15/24
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
XML Beispiel
• WHERE <hotel>
<name>arcor<name/>
<inhaber>$i<inhaber/>
<stadt>$s<stadt/>
</hotel> IN „www.a.b/hotels.xml“
• CONSTRUCT <result>
<inhaber>$i<inhaber/>
<stadt>$s</stadt>
<result/>
16/24
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
17/24
Meta Viz
• Umgebung zur visuellen Interaktion mit Geodaten
• Ziel: Reduktion des Informationsüberflusses anderer Geodatensuchmaschinen
• Auswahl der Zielregion durch Zoomen
• Suche nach Attributen in Metadaten
• Gefundene Objekte werden im
selektierten Großraum angezeigt
• Problem: einzelne Objekte
können verdeckt werden
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Meta Viz
• Lösung: rotierbare 3D-Darstellung
18/24
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
19/24
Information Retrieval
• Art und Weise der Informationsbeschaffung
• Ziel: effektive Verwaltung großer Datenmengen
• Benutzerorientiertes Extrahieren von interessanten Informationen aus beliebiger
Datenbasis
• Sinnvolle, interaktive, graphische Sortierung/Darstellung der Suchergebnisse
Abfragesprachen
• Schnittstelle zwischen Datenbank und Benutzerinterface
• einfache Darstellung der Abfrage, verständlich für Mensch und Maschine
• flexible Gestaltung der Sprache für einfache und komplexe Abfragen
• Erweiterbarkeit von Abfragen graphischer Präsentationen unterstützt
ausgeprägte menschliche Mustererkennungsfähigkeit
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
SQL
Erweiterungen der Sprache durch CSQL und ParaSQL
W3QL
XML basierende Abfragesprachen
XML-QL
SQL
• allgemeiner Standard
• SQL hat als Datengrundlage eine relationale Datenbankstruktur
20/24
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
21/24
Aufbau von SQL
• Formulierung mittels Text
• Datentypen wie Text und Zahl
• Gliederung:
•
Definition der Rückgabe
select
cities
•
Datenquelle
from
germany
•
Suchparameter
where
hotel
•
Sortierreihenfolge
order by inhaber
like
ar%
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Ergänzungen von SQL
CSQL
• geo-technische Funktionen
• Abstand, Überschneidung (z.B. Flugbahnen, Straßen) und Grenzen
• Distance (hotel, bahnhof) <= 100
ParaSQL
• pattern matching auf Geodaten
• neue Datentypen: Raum, Zeit, Raum-Zeit
• Bsp: Circle (earth-quake(10) = high,50)
Kommerzielle Produkte
• Oracle, Sybase: Ergänzungen von SQL um eigene Funktionen
22/24
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
23/24
W3QL
• Struktur wie SQL
• Datenquelle: das WWW (Domains und Pfade)
• zur Suche regular expressions (Perl)
• Suche nach/in verschiedenen Datei-Typen: Text, HTML, LaTeX, Bildern, Filmen
• automatische Formbearbeitung
• Tiefensuche
XML und Abfragesprachen
• Datenquelle: XML-Dokumente (Objekt, Struktur)
• eignet sich zur Speicherung von Metadaten
• kein einheitlicher Standard für Abfragesprache
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
XML-QL
• Formulierung mittels Text
• typenlose bzw. an XML-Struktur gebunden
• Struktur der Abfrage
• Suchbedingungen
• Definition der Rückgabe
24/24
Herunterladen