ppt, 2,1 MB

Werbung
Teil 1: Metadaten Editor – Technologie und Status
Teil 2: Weitergehende Gedanken
Wassilios Kazakos
FZI Forschungszentrum Informatik Karlsruhe
[email protected]
http://www.fzi.de/dbs
Metadaten Editor
Technologie und Status
Wassilios Kazakos
FZI Forschungszentrum Informatik Karlsruhe
[email protected]
http://www.fzi.de/dbs
Projektübersicht
zentrale Installation
Replikation
zentrales Metadatenschema
+ lokale Attribute
Extraktion
aus ArcView/
ArcInfo
UDK-Export
Filter
Eingabemasken
Eingabemasken
Thesaurus
Browser
Thesaurus
Browser
Karte
Karte
Suchformular
n lokale Installationen
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
3
zentrales
Metadatenschema
Volltextsuchdienst
Suchformular
Funktionalität
HTML-basierte Eingabemasken
kontextsensitives Hilfesystem
datenbankgestützt
Importmöglichkeiten aus ESRI-Produkten
Mehrsprachigkeit (deutsch + englisch)
Dokumentation
Export nach UDK
Administration (Neu)
Verbesserte Suchfunktionalität (Neu)
Koordinatentransformation (Neu)
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
4
Spezielle Anforderungen
Umfangreiches Schema nach ISO 19115
 Weit mehr als nur die Kernelemente
Komplexe Strukturen
 optionale und Pflichtfelder
 wiederholbare Felder
 mehrere Strukturierungsebenen
 bedingte Unterstrukturen
Einfache Anpassungen an spezielle lokale Gegebenheiten
erforderlich
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
5
Lösungsansatz
Schemagetriebene automatische Generierung der
Benutzerschnittstelle
 Gemeinsame Funktionalität der einzelnen Instanzen
rausarbeiten
 Anpassungen über die Definition des Schemas
 NOKIS-Schema definiert alle Elemente eines Metadatums
 Annotationen für spezielle Anpassungen
 dadurch deutlich verkürzte Änderungs- und
Anpassungszeiten
Visualisierung
 Gutes Ergebnis nach vielen Diskussionen mit den Benutzern
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
6
z.B. Ändern des
Layouts
Editorschablonen
(XSLT)
Sprachpaket
(XML)
XSLT
Prozessor
z.B. Erweitern
um neue
Elemente
Automatische Generierung
Benutzerschnittstelle
(XSLT)
Gemeinsame
Funktionalität
Erzeugen, Aktualisieren,
Suche, Import, Export,
PDF, Text Erzeugung etc.
NOKIS Schema
ISO 19115
(XML Schema)
DB-Typbibliothek
(XML)
XSLT
Prozessor
Annotationen
XPath
XML-Vorgabefragmente
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
7
DB-Schema
(SQL)
XML->DB-Abbildung
(XSLT)
Technik
Technische Plattform
 Programmiersprache Java
 Apache Xerces (XML Schema), Saxon (XSLT)
 Apache Tomcat als Applikationsserver
 PostgreSQL als freies Datenbanksystem
(ausgereifter als MySQL)
 Minnesota Map Server
 alle Produkte: keine Lizenzgebühren, Open Source
Technische Anforderung (Beispiel)
 Server bei 5-10 gleichzeitigen Nutzern:
 Pentium III, 256 MB RAM
 Client: Netzzugang, Browser
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
8
Eingabemaske
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
9
Erweiterte Suche
eine/alle
Art der
Konditionen
auswählen
Konditionen
festlegen
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
10
Koordinatentransformation
Transformation
Koordinaten im
Zielkoordinatensystem
Koordinaten angeben
Koordinatensystem angeben
 Für Editor, die Suche und als
 WebService für andere Anwendungen
 Kapselung von Proj4
(Open Source, c)
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
11
Fazit (Ende Teil 1)
Umfassendes Werkzeug zur Erfassung, Pflege, Recherche
von Metadaten
Wichtigste Neuerungen
 Verbesserter Editor, umfassende Suche, Transformationen
 Administrationswerkzeug
Sehr innovativer Ansatz
Zukunft:
 Integration mit Daten
 Semantic Web?
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
12
Weitergehende Gedanken
Übersicht
Mehr Semantik
 Thesauri & Gazetteer
 Semantic Web
Integration mit Daten
 Zugreifen, Analysieren, Publizieren
 disy Cadenza (Niedersachsen, Schleswig-Holstein)
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
14
Thesauri und Gazetteers
Thesauri
(Fach-)Wortgutsammlung
 Begriffe und in ihrer hierarchischen Beziehungen zueinander
 Synonyme werden auf einen einzigen Terminus reduziert
 Homonyme werden eindeutig festgelegt
Einsatzmöglichkeit:
 Beschreibung von Metadaten mit definierten, vereinbarten und
genormten Bezeichnungen (Deskriptoren)
 Verbesserung der Suche über gezielte Suche nach Deskriptoren
Beispiele: GEMET (EEA), UBA-Thesaurus
 Gute Ausgangsbasis, aber zu wenig spezifisch für IKZM
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
16
Beispiel GEMET+C in CoastBase
CoastBase controlled vocabulary
Coastal terms
not in GEMET
Coastal extension
CDS
Coastal terms
within GEMET
using
GELOS
GEMET
Conceptual View 1:
CoastBase domain model
Terms needed for eutrophication assessment
Conceptual View 2:
Terms needed for ICZM planning
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
17
Thesaurus in Coastbase
Sicht speziell für
die aktuelle
Aufgabe
des Benutzers
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
18
Thesaurus in EUROSION
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
19
Gazetteer
Ein geographisches Wörterbuch
 Suche über Namen und Beschreibungen statt Koordinaten
 Ozeane, Inseln, Meeresregionen etc.
Beispiele:
 Geo-Thesaurus Environment (GTE) von GEIN
 Mehr als 48.213 Ortsangaben in Deutschland
 Alexandria Digital Library Gazetteer
 5.9 Mio Ortsangaben Weltweit
Anpassung und Erweiterung auf Besonderheiten der
deutschen Küstenregionen notwendig
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
20
Semantic Web
Semantic Web: Die Vision
“The Semantic Web is a vision: the idea of having data on the
Web defined and linked in a way that it can be used by
machines not just for display purposes, but for automation,
integration and reuse of data across various applications. ”
[W3C 2001]
“The Semantic Web is an extension of the current Web in which
information is given well-defined meaning, better enabling
computers and people to work in cooperation.” [Berners-Lee
et al 2001]
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
22
Schichten des Semantic Web
Quelle: Berners-Lee (1999)
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
23
Was ist eine Ontologie
Aus B.Smith, C. Welty, FOIS 2001 Introduction, Ontology: Towards a New Synthesis
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
24
Beispiel: Das Web + Semantik
Beschreibung
hat Ziel
Link
10.03.2004
Workshop-Seite
NOKIS Startseite
NOKIS ist ein Projekt....
organisiert
Projekt NOKIS
hat Thema
beginnt am
Im Rahmen des Projekts
NOKIS findet ein Workshop in
NOKIS Workshop
Büsum statt.
http://nokis.baw.de
Metadaten
endet am
http://nokis.baw.de/workshop
11.03.2004
findet statt in
Büsum
Touristeninformationen
Büsum
Büsum liegt... Hat.... ist,..
Liegt an
Link
http://www.buesum.de
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
25
Nordsee
Was hat das mit IKZM zu tun?
The More Difficult the Integration Problem, the
Bigger is the Potential of Semantic Technologies
high
Service-Driven
Integration
... to allow for flexible and
dynamic integration of suppliers
customers and partners
Added
value
by
integration
Process Integration
Application Integration
Data & Information
Integration
Data Transport
low
... to automate business operations, tasks
and transactions of business processes
... to integrate application logic and data
between two or more applications
... to have a common understanding
of the data of an enterprise
... to transport data
Business Complexity
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
27
high
An emerging agenda for the Semantic Web
Applications
Annotation &
recommendation
systems
Automatic
Web resource
classification
Metadata
extraction
& storage
Web metadata
standards
Conceptual
schemas for
sites & portals
Semantic
interoperability
frameworks
Browsing /
querying
interfaces
Distributed
inference
services
Query
languages
Information &
services
brokering
architectures
P. Constantopoulos, SemWeb 2000, Semantic Web Workshop, Lisbon 21-9-2000
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
28
Integration von Daten
Aktuelle Herausforderungen
Einheitliche und übergreifende Sicht auf Daten:
 Fachanwender müssen immer mehr und komplexere
Berichtspflichten wahrnehmen
 Entscheider, Sachbearbeiter wollen gezielte Recherchen und
Aufbereitungen auf aktuellen Daten, die sie beim
Entscheidungsprozess unterstützen
 Externe Büros und Öffentlichkeit benötigen Zugang zu Daten
Gestiegene Anforderungen müssen mit immer weniger
finanziellen und personellen Mitteln umgesetzt werden!
 Metadaten sind das Mittel um Informationen zu finden und
zu beschreiben
 Benötigt wird Zugriff auf die Daten und Werkzeuge zur
Analyse und Aufbereitung
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
30
Lösungsansätze
Ausgangszustand:




Dateninseln einzelner Fachanwendungen
Nur teilweise sind abgestimmte Strukturen vorhanden
GIS und Fachanwendungen schlecht integriert
Kein durchgängiges Konzept bei der Informationsverteilung
Lösung hat drei Fassetten:




Auffinden von Daten (über Metadaten)
Datenintegration
Umfassendes Berichts- und Auswertewerkzeug
"Business Intelligence" oder "Spatial Intelligence"
Beispiel
 disy Cadenza
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
31
Plattform disy Cadenza
einfacher
Web-Klient
leistungsfähiger
Web-Klient
EAI
Designerwerkzeug für
Informationssichten,
Benutzer- und
Rechteverwaltung
Teilmodule:
• Metadaten
• Ad-hoc Query
•
Tabellenanalyse
• Diagramme
• Karten
• Reporting
Informationssichten
in den Datenbestand
Repository
Datenbanken,
Data Warehouses
Oracle, SQL-Server, DB2,
Informix, MS-Access, ...
32
Wie werden
Informationen
gesucht ?
Informationen
finden u. des
erklären
Der Navigator
zeigt Informationssichten
Repository
(Sichten in das Data Warehouse und die operationellen Datenbanken)
Wie werden
Informationen
ausgewählt ?
Wie werden
Informationen
analysiert ?
Einfache Suche über
Schlagwörter
Ähnlich Web-Suchmaschine
Erläuterung einer
Informationssicht
Wie werden
Informationen
publiziert ?
Hierarchische Suche nach
Informationssichten
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
33
Einbindung von
Datenkatalogen,
Thesauri, ...
Informationen
Wie werden
Informationen
gesucht ?
auswählen u. verknüpfen
Ad-hoc Querys:
Explorativer und kontextsensitiver Informationszugriff
Wie werden
Informationen
ausgewählt ?
Wie werden
Informationen
analysiert ?
Suchkriterien
Kriterienbelegung:
• Fach- und Geokriterien
• Verschiedene Typen
• Hierarchische Kriterien
• Kontextsensitive Auswahl
• Auswahl in der Karte
Wie werden
Informationen
publiziert ?
Verknüpfung unterschiedlicher
Informationsquellen
Kunden
Lager
Vertrieb
Produkte
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
34
Informationen
Wie werden
Informationen
gesucht ?
Wie werden
Informationen
ausgewählt ?
auswählen u. verknüpfen
Integriertes GIS:
Grafische Recherche und Auswahl
Alle GISStandardfunktionen
Wie werden
Informationen
analysiert ?
Wie werden
Informationen
publiziert ?
Heterogene
Geodaten:
• Oracle Spatial
• ESRI ArcSDE
• g.Server
• ArcIMS (nativ)
• WMS
• WFS
• ESRI-Shapefiles
• Rasterbildkataloge
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
35
• GML
Informationen
analysieren u. aufbereiten
Wie werden
Informationen
gesucht ?
Wie werden
Informationen
ausgewählt ?
Wie werden
Informationen
analysiert ?
Officeanbindung
• Vordefinierte
Auswertesichten
• Speichern
erstellter Sichten
Komplexe Tabellenanalysen
und –aufbereitungen:
Sortierung, Filter, Auswertespalten, Gruppierung,
Aggregierung, ...
Analysen in
Diagrammen
Wie werden
Informationen
publiziert ?
Räumlich Analyse in
interaktiven Karten
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
36
Wie werden
Informationen
gesucht ?
Informationen
Einfache Erstellung von
Reportvorlagen
Wie werden
Informationen
ausgewählt ?
Wie werden
Informationen
analysiert ?
Wie werden
Informationen
publiziert ?
Flexible Reportformate
(PDF, RTF, ...)
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
37
berichten u. verteilen
Zusammenfassung
NOKIS liefert die Infrastruktur für Metadaten
 Erfassung, Pflege
 Suche, Austausch
Ansätze für die Zukunft
 Mehr Semantik
 Hin zu Thesauri und Gazetteers
 Auf dem Weg zum Semantic Web
 Integration mit Daten
 Zugreifen, Analysieren, Publizieren
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
38
Weiter Informationen unter
NOKIS Projektseite
 http://nokis.baw.de
Abteilung DBS im FZI
 http://www.fzi.de/dbs
 [email protected]
FZI Forschungszentrum Informatik - Abteilung Datenbanksysteme
39
Herunterladen