Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/24 Beispiel einer Anfrage Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen Kosmetik, Elektro und Haushaltswaren in den Bundesländern Sachsen-Anhalt und Thüringen angefallen? Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 2/24 Fragestellungen und Aufgaben (Bsp.) • Überprüfung des Warensortiments zur Erkennung von Ladenhütern oder Verkaufsschlagern • Standortanalyse zur Einschätzung der Rentabilität von Niederlassungen • Untersuchung der Wirksamkeit von Marketing-Aktionen • Auswertung von Kundenbefragungen, Reklamationen bezüglich bestimmter Produkte etc. • Analyse des Lagerbestandes • Warnkorbanalyse mit Hilfe der Kassenbons Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 3/24 Ergebnis (Würfel) Produkt Summe Haushalt Elektro Kosmetik 1998 1999 Kennzahl Summe Zeitraum Umsatz Region Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 4/24 Ergebnis (Bericht) Umsatz 1998 1999 Kosmetik Elektro Haushalt SUMME Sachsen-Anhalt 45 123 17 185 Thüringen 43 131 21 195 SUMME 88 254 38 380 Sachsen-Anhalt 47 131 19 197 Thüringen 40 136 20 196 SUMME 87 267 39 393 SUMME 175 521 77 773 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 5/24 Aspekte von Data Warehouses Integration • Vereinigung von Daten aus verschiedenen, meist heterogenen Quellen • Überwindung der Heterogenität auf verschiedenen Ebenen (System, Schema, Daten) Analyse • Bereitstellung der Daten in einer vom Anwender gewünschten Form (bezogen auf Entscheidungsgebiet) • erfordert Vorauswahl, Zeitbezug, Aggregation Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 6/24 Marktentwicklung Marktgröße Data Warehouse und OLAP (Quelle: OLAP Report OnLine www.olapreport.com) 4,5 4 3,5 3 2,5 Mrd. Euro 2 1,5 1 0,5 0 1994 1995 1996 1997 1998 1999 2000 2001 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Abgrenzung zu OLTP Klassische operative Informationssysteme Online Transactional Processing (OLTP) • Erfassung und Verwaltung von Daten • Verarbeitung unter Verantwortung der jeweiligen Abteilung • Transaktionale Verarbeitung: Kurze Lese-/Schreibzugriffe auf wenige Datensätze Data Warehouse • Analyse im Mittelpunkt • lange Lesetransaktionen auf vielen Datensätzen • Integration, Konsolidierung und Aggregation der Daten 7/24 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 8/24 Abgrenzung zu OLTP: Anfragen Anfrage transaktional analytisch Fokus Lesen, Schreiben, Modifizieren, Löschen Lesen, periodisches Hinzufügen Transaktionsdauer und -typ kurze Lese-/ Schreibtransaktionen lange Lesetransaktionen Anfragestruktur einfach strukturiert komplex Datenvolumen einer Anfrage wenige Datensätze viele Datensätze Datenmodell anfrageflexibel analysebezogen Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 9/24 Abgrenzung zu OLTP: Daten Daten transaktional analytisch Datenquellen meist eine mehrere Eigenschaften nicht abgeleitet, zeitaktuell, autonom, dynamisch abgeleitet/konsolidiert, nicht zeitaktuell, integriert, stabil Datenvolumen MByte…GByte GByte…TByte Zugriffe Einzeltupelzugriff Tabellenzugriff Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 10/24 Abgrenzung zu OLTP: Anwender Anwender transaktional analytisch Anwendertyp Ein-/Ausgabe durch Angestellte oder Applikationssoftware Manager, Controller, Analyst Anwenderzahl sehr viele wenige (bis einige hundert) Antwortzeit ms…sec sec…min Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 11/24 Data Warehouse: Charakteristika Fachorientierung (subject-oriented) • Zweck des Systems ist nicht Erfüllung einer Aufgabe (z.B. Personaldatenverwaltung), sondern Modellierung eines spezifischen Anwendungsziels Integrierte Datenbasis (integrated) • Verarbeitung von Daten aus mehreren verschiedenen Datenquellen (intern und extern) Nicht-flüchtige Datenbasis (non-volatile) • stabile, persistente Datenbasis • Daten im Data Warehouse werden nicht mehr entfernt oder geändert Historische Daten (time-variant) • Vergleich der Daten über Zeit möglich (Zeitreihenanalyse) • Speicherung über längeren Zeitraum Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 12/24 Data Warehouse Datenbank, die Daten aus unterschiedlichen Quellen integriert und Analysen darauf unterstützt (Rahm/Vossen) Data Mining Nach Rahm/Vossen eine Sammlung von Verfahren zur Entdeckung von Mustern in großen Datenmengen. Verfahrensklassen sind Clustering, Klassifikation und die Bestimmung von Assoziationsregeln Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 13/24 Aufgabe 1 (IR) Information Retrieval wird durch sogenannte Suchmaschinen (Search Engines) im Web realisiert. Teilweise spezialisieren sich diese Suchmaschinen auf bestimmte Themengebiete. Finden Sie solche Anbieter mit Suchmaschinen und notieren Sie sich die abgedeckten Themengebiete. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Erweiterung der Abfrage Kombination select * from germany, cities where cities.name = germany.stadt and germany.hotel like arcor and cities.plz like 6% or cities.plz like 5% 14/24 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg W3QL Beispiel • select from where n1, l1, (n2, l2), n3, l3 n1 in {URL}; l1 in {path} l2 in {path} n3: PERLCOND, n3.format =~/image/‘ n3 in {path} using ISSEARCH –d 5-l 1000 • Ergebnis: Tabelle mit Links 15/24 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg XML Beispiel • WHERE <hotel> <name>arcor<name/> <inhaber>$i<inhaber/> <stadt>$s<stadt/> </hotel> IN „www.a.b/hotels.xml“ • CONSTRUCT <result> <inhaber>$i<inhaber/> <stadt>$s</stadt> <result/> 16/24 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 17/24 Meta Viz • Umgebung zur visuellen Interaktion mit Geodaten • Ziel: Reduktion des Informationsüberflusses anderer Geodatensuchmaschinen • Auswahl der Zielregion durch Zoomen • Suche nach Attributen in Metadaten • Gefundene Objekte werden im selektierten Großraum angezeigt • Problem: einzelne Objekte können verdeckt werden Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Meta Viz • Lösung: rotierbare 3D-Darstellung 18/24 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 19/24 Information Retrieval • Art und Weise der Informationsbeschaffung • Ziel: effektive Verwaltung großer Datenmengen • Benutzerorientiertes Extrahieren von interessanten Informationen aus beliebiger Datenbasis • Sinnvolle, interaktive, graphische Sortierung/Darstellung der Suchergebnisse Abfragesprachen • Schnittstelle zwischen Datenbank und Benutzerinterface • einfache Darstellung der Abfrage, verständlich für Mensch und Maschine • flexible Gestaltung der Sprache für einfache und komplexe Abfragen • Erweiterbarkeit von Abfragen graphischer Präsentationen unterstützt ausgeprägte menschliche Mustererkennungsfähigkeit Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg SQL Erweiterungen der Sprache durch CSQL und ParaSQL W3QL XML basierende Abfragesprachen XML-QL SQL • allgemeiner Standard • SQL hat als Datengrundlage eine relationale Datenbankstruktur 20/24 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 21/24 Aufbau von SQL • Formulierung mittels Text • Datentypen wie Text und Zahl • Gliederung: • Definition der Rückgabe select cities • Datenquelle from germany • Suchparameter where hotel • Sortierreihenfolge order by inhaber like ar% Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Ergänzungen von SQL CSQL • geo-technische Funktionen • Abstand, Überschneidung (z.B. Flugbahnen, Straßen) und Grenzen • Distance (hotel, bahnhof) <= 100 ParaSQL • pattern matching auf Geodaten • neue Datentypen: Raum, Zeit, Raum-Zeit • Bsp: Circle (earth-quake(10) = high,50) Kommerzielle Produkte • Oracle, Sybase: Ergänzungen von SQL um eigene Funktionen 22/24 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 23/24 W3QL • Struktur wie SQL • Datenquelle: das WWW (Domains und Pfade) • zur Suche regular expressions (Perl) • Suche nach/in verschiedenen Datei-Typen: Text, HTML, LaTeX, Bildern, Filmen • automatische Formbearbeitung • Tiefensuche XML und Abfragesprachen • Datenquelle: XML-Dokumente (Objekt, Struktur) • eignet sich zur Speicherung von Metadaten • kein einheitlicher Standard für Abfragesprache Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg XML-QL • Formulierung mittels Text • typenlose bzw. an XML-Struktur gebunden • Struktur der Abfrage • Suchbedingungen • Definition der Rückgabe 24/24