Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden Prof. Dipl.-Ing. R. Kettemann Hochschule für Technik Stuttgart, Schellingstraße 24, 70174 Stuttgart Tel.: 0711-121-2608, Fax: 0711-121-2556 E-Mail: [email protected] 1. Allgemeines Daten sind der wertvollste Bestandteil eines Geoinformationssystems. Um diese in konsistenter Form verfügbar zu haben, ist es besonders wichtig, die Informationen der originär zuständigen Stellen in eigene Anwendungen zu integrieren. Nur dadurch kann der Aufwand für die Erfassung, Verwaltung und die Pflege von Daten minimiert und damit optimiert werden. Der Datenaustausch zwischen verschiedenen Geoinformationssystemen oder noch eleganter, der Zugriff aus einer eigenen Anwendung auf Daten in einem Fremdsystem sind deshalb entscheidende Faktoren für die Wirtschaftlichkeit von Geoinformationssystemen. Abbildung 1: Begriffe aus dem Bereich Datenaustausch zwischen Geoinformationssystemen. Ein wichtiges Spektrum aus dem in großer Vielfalt vorhandenen Datenangebot in BadenWürttemberg wird in den nachfolgenden Beiträgen vorgestellt. Die vorliegende Einführung beschäftigt sich mit generellen Regeln zum Datenaustausch und mit den wichtigsten Schnittstellen zu den vorgestellten Datenangeboten. Ferner wird auf das vom Open GIS Consortium propagierte Modell der Interoperabilität näher eingegangen. Die Abbildung 1 vermittelt einen Eindruck von den vielen, im Zusammenhang mit dem Datenaustausch auftretenden Begriffe. 2. Datentypen und zugehörige Datenformate Die in Geoinformationssystemen verwalteten Daten lassen sich grob in drei Arten von Datentypen gliedern: • Rasterdaten beschreiben die Geometrie flächenhaft durch Bildelemente (Pixel), die in Matrixform angeordnet sind. Jedem Pixel ist ein Zahlenwert (Grau- oder Farbwert, Höhe, Emission, etc.) zugeordnet. Es existieren keine logischen Verbindungen zwischen den einzelnen Bildelementen. 1 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden • Vektordaten beschreiben raumbezogene Objekte mit den grafischen Grundelementen Punkt, Linie und Fläche. Der Raumbezug ist durch Koordinaten der Stützpunkte gegeben. Vektordaten sind dadurch im Prinzip maßstabslos. Es können nahezu beliebig komplexe Strukturen und topologische Beziehungen modelliert werden. • Sachdaten beschreiben Eigenschaften von Geometrie- und sonstigen Objekten. Sie repräsentieren alle nicht geometrischen Inhalte eines Informationssystems. Jeder dieser drei Datentypen erfordert besondere Schnittstellen zum Transport von einem System in eine anderes. Die gebräuchlichsten sind in der folgenden Tabelle aufgeführt: Rasterdaten z.B. TIFF, GeoTIFF, GIF, JPEG und viele andere Sachdaten z.B. ASCII-Tabellen (spaltenorientiert oder durch Trennzeichen separiert), Excel-Tabellen, Datenbankfiles und viele andere Vektordaten CAD-Formate (Geometrie mit Präsentationsattributen) z.B. DXF, DWG, DGN, SQD und viele andere GIS-Formate (Geometrie mit Sachattributen) z.B. Shape, EDBS, BGRUND, SQD und viele andere Tabelle 1: Beispiele für Datenformate zum Austausch verschiedener Datentypen. 3. Datenformate für Rasterdaten TIFF (Tagged Image File Format): Im Bereich der Rasterdaten ist mit dem TIF-Format ein Standard am Markt, der nahezu von jedem Grafikprogramm erzeugt und gelesen werden kann. Seit einiger Zeit kann sogar die Georeferenzierung der einzelnen Pixel im Header der TIF-Files weitergegeben werden. Sind die dazu erforderlichen Elemente (TAGs) vorhanden, spricht man vom GeoTIF-Format. Im TIF-Format werden alle Informationen in der Auflösung, die der Erzeuger gewählt hat, verlustfrei abgebildet. Ein Nutzer erhält dadurch exakt das selbe Bild, wie der Erzeuger. Sind den einzelnen Pixeln Grau- oder Farbwerte als Attribute zugeordnet (z.B. 24Bit RGB), sind auch die Farben bis auf die geringfügigen Modifikationen durch den Monitor des Empfängers gleich. Diesem Vorteil einer nahezu identischen Präsentation beim Sender und Empfänger von Daten stehen einige Nachteile gegenüber: Die Qualität ist eng an den Maßstab der Geometrieinformation gebunden. Ein Hineinzoomen ist nur sehr begrenzt möglich. Qualitätssteigerungen gehen mit einem quadratisch anwachsenden Datenvolumen einher. Außerdem sind Rasterdaten für Analysen wesentlich schlechter geeignet als Vektordaten. Die sehr große Datenmenge schränkt die Nutzung des TIF-Formats vor allem in Netzwerken, speziell im Internet sehr stark ein. Durch handelsübliche Packprogramme können Rasterdaten im TIF-Format abhängig von der Homogenität der Informationen mehr oder weniger stark komprimiert und verlustfrei dekomprimiert werden. GIF (Graphical Interchange Format): Rasterdaten mit einer geringen Farbtiefe können in diesem für maximal 256 Farben definierten, automatisch stark komprimierten (LZWAlgorithmus) und verlustfrei dekomprimierbaren Format optimal und platzsparend gespeichert und übertragen werden. Das GIF Rasterdaten-Format wurde von der Firma CompuServe speziell für Internetanwendungen entwickelt. Es eignet sich wegen der verlustfreien Komprimierung sehr gut zur Übertragung von Karten und Plänen mit einem naturgemäß relativ geringen Farbumfang. Wie beim TIF-Format kommt auch bei diesem Format ein Plan 2 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden beim Nutzer in derselben Präsentation und Qualität an, wie er vom Lieferanten bereitgestellt wird. JPEG (gesprochen „jay-peg“, Joint Photographic Experts Group): Im JPEG-Format können 24 Bit Rasterdaten (RGB) nahezu beliebig stark komprimiert werden. Dabei werden die radiometrischen Eigenschaften der Pixel in Abhängigkeit von Ihrer Nachbarschaft so modifiziert, dass eine bestmögliche Komprimierung erreicht wird. Das hat zur Folge, dass aus einem JPEG-Bild nie mehr ein Bild mit derselben Qualität wie das zugrunde liegende Original erzeugt werden kann. Die JPEG-Komprimierung eignet sich am besten für natürliche Bilder (Fotos). Bei Karten und Plänen mit scharfen Objekträndern stört, dass diese bei der Komprimierung irreparabel verwischt werden. Abbildung 2: Das Logo des Statistischen Landesamtes übertragen in verschiedenen Grafikformaten. Original TIFF: 72 dpi, 43 kb, Komprimiert als GIF: 72 dpi, 3kb, bei wenigen Farben kein Qualitätsverlust Komprimiert als JPEG: 72 dpi, 3kb, bei der Komprimierung modifizierte Farbwerte Bewertung der Rasterdaten-Formate Rasterdaten haben den Vorteil, dass ein Nutzer genau das „Bild“ erhält, das der Anbieter bereitgestellt hat. Sie eignen sich deshalb sehr gut zum Transport von Hintergrundgrafiken für GIS oder als Datenquelle zum Erzeugen von Vektordaten. Für Analysen sind sie, abgesehen von den Multispektralaufnahmen für die Fernerkundung, weniger gut geeignet. Die Datenmenge und die geometrische Qualität der Daten hängen sehr stark voneinander ab. Maßstabsänderungen sind nur sehr eingeschränkt möglich. 4. Datenformate für Sachdaten Am wenigsten problematisch ist der Datenaustausch bei Sachdaten. Hier hat das sehr breite Spektrum der Anwendungen im Verwaltungs- und Wirtschaftsbereich schon lange für einheitliche Austauschformate der in Tabellenform relativ einfach strukturierten Daten geführt. Jedes Office-Programm kann heutzutage ASCII-Dateien einlesen und weiterverarbeiten. Diese können entweder spaltengerecht formatiert sein oder durch Trennzeichen separierte Einträge haben. Auch der Übergang vom ASCII-Zeichensatz (DOS) auf den ANSIZeichensatz (Windows) oder auf andere Zeichensätze ist gelöst oder leicht lösbar. Tauscht man derartige Daten über Standardformate von Tabellenkalkulationsprogrammen (z.B. Excel) aus, werden sogar die Datentypen und Formatierungen der einzelnen Spalten übergeben. Die weite Verbreitung von Microsoft Produkten hat hier in den letzten Jahren einen de facto Standard geschaffen und sich damit für Endanwender günstig ausgewirkt. 3 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden Die weite Verbreitung bestimmter Datenbanken wie dBASE, ACCESS und ORACLE haben auch dafür gesorgt, dass Datenbanktabellen direkt ausgetauscht werden können oder dass auf diese über standardisierte Schnittstellen, wie z.B. ODBC, sogar über verschiedenartige Betriebssysteme hinweg zugegriffen werden kann. 5. Vektordatenformate Die gemeinsame Verarbeitung von Grafik- und Sachdaten ist ein wesentliches Merkmal von Geoinformationssystemen. Sie ermöglicht den Zugriff auf raumbezogene Informationen sowohl über geometrische Operationen als auch über Sachdatenabfragen (attributive oder räumliche Selektion). Die Geometrieobjekte sind dabei als Vektorelemente (Punkte, Linien, Flächen) beschrieben oder aus Vektorelementen zusammengesetzt. CAD Formate DXF DWG DGN SQD Geometrie mit Präsentationsregeln (aussagekräftige Grafik), interne Kombination mit Sachdaten über Blockstrukturen oder Verknüpfung mit externen Sachdaten über Identifikatoren Strukturparameter: Ebene, Farbe, Art, Grösse usw. GIS Formate Shape EDBS BGRUND RDBMS Objekte bestehend aus Geometrie mit Sachdaten, ohne Präsentationsregeln Die Darstellung muss jeweils aus den Attributen (Sachdaten) abgeleitet werden. SQD Abbildung 3: Wichtige CAD- und GIS- Datenformate Am Markt sind zwei Typen von Geoinformationssystemen auf Vektorbasis zu finden: GIS Systeme auf CAD-Basis (CAD-GIS) verknüpfen die Elemente in CAD-Zeichnungen über Identifikatoren mit Sachdatentabellen. Die Grafik dieser Systeme weist alle Merkmale einer CAD-Grafik auf. Wesentlich ist dabei, dass bei jedem Element alle zur Visualisierung erforderlichen Parameter (Zeichenvorschrift) gespeichert sind. Daneben ist eine Strukturierung in verschiedene Ebenen (Layer) vorzufinden. Die wesentlichen Struktur- und Präsentationsparameter sind: • Ebene bzw. Layer, • Elementfarbe, • Darstellungsart (Linienart, Textfont, Füllmuster) und • Größe (Linienbreite, Texthöhe etc.). Sie sind als kleinster gemeinsamer Nenner nahezu immer vorhandenen und können in der Regel auch als Selektionskriterien verwendet werden. Importschnittstellen von Geoinformationssystemen werten Sie als objektbildende Eigenschaften aus. Stehen nach der Datenübernahme von CAD-Daten im Zielsystem dieselben Paletten und Zeichenmuster wie im Ausgangssystem zur Verfügung, kann auch die Präsentation der Daten eindeutig übertragen werden. Bei entsprechender Modellierung lassen sich sogar die mit Grafikelementen verbundenen Sachdaten über CAD-Schnittstellen transportieren. Wichtige Schnittstellen für CAD-Daten sind z.B.: • DXF ASCII-Datenformat für AutoCAD-Zeichnungen. Dieses von der Firma Autodesk entwickelte Dateiformat hat sich mittlerweile 4 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden • DWG • DGN • SQD zu einem „Quasistandard“ entwickelt, der von sehr vielen CAD- und GISSystemen und auch von Office-Produkten gelesen und häufig auch erzeugt werden kann. Binäres Dateiformat für AutoCAD Zeichnungen. In den binären DWG-Dateien ist der auch in DXF-Dateien vorhandene Inhalt wesentlich komprimierter abgespeichert. Mittlerweile kann auch das DWGFormat von vielen Fremdsystemen gelesen werden. Binäres Dateiformat des CAD-Systems Microstation. Auch dieses Datenformat kann von vielen Fremdsystemen gelesen werden Dieses ASCII-Format für SICAD-Dateien ist ein Musterbeispiel für die Übertragung komplexer Geometriemodelle. Wegen der darin abgelegten Präsentationsparameter kann es den CAD-Formaten zugerechnet werden. Es ist aber auch für den Austausch von Sachdaten eindeutig definiert. GIS-Systeme in Reinkultur verwalten keine Präsentationsregeln bei den einzelnen Geometrieobjekten. Letztere sind immer mit Sachdaten gekoppelt und ohne die Attribute aus den Sachdatentabellen nicht interpretierbar. Die Vielfalt der möglichen Attribute erlaubt häufig die Erzeugung unterschiedlichster thematischer Darstellungen, die im jeweiligen System in sogenannten Legenden verwaltet werden. Die darin getroffenen, sehr stark systemspezifischen Festlegungen werden nicht zusammen mit den Daten sondern in der Projektverwaltung gespeichert. Abbildung 4 zeigt eine derartige Struktur am Beispiel GeoMedia. RDBMS-Warehousesmit Koordinatensystem, Geometrie mit Attributen Workspace mit Koordinatensystem T Kartenfenster mit Legende Datenfenster WarehouseAnbindungen T K T K T K Abbildung 4: Moderne GISArchitektur am Beispiel GeoMedia. ESRI-Verzeichnisse mit Geometrie- und Attributdateien sowie Koordinatensystemdatei CAD-Dateien mit Objektdefinitionsdatei und Koordinatensystemdefinition T = Koordinatentransformation K = Konvertierung in GeoMedia-Datenstruktur Im Projekt (Workspace) werden die Verknüpfungen zu „Datentöpfen„ und die jeweiligen Präsentationsregeln verwaltet. Beim Lesen der Daten werden diese jeweils in das Koordinatensystem und in die Datenstruktur des Präsentationssystems (hier: GeoMedia) gewandelt und visualisiert. Wichtige Schnittstellen für GIS-Daten sind z.B.: • • • • ArcView Shape-Format Dieses sehr einfache und deshalb eindeutig interpretierbare Dateiformat (3 zusammengehörende Dateien) hat sich zu einem „Quasistandard“ für GIS-Daten entwickelt, der von sehr vielen Systemen gelesen und häufig auch erzeugt werden kann. EDBS Die Einheitliche Datenbankschnittstelle der Vermessungsverwaltungen ist ebenfalls den GIS-Schnittstellen zuzuordnen. Auch hier werden Geometrieund Sachdaten gekoppelt und ohne Präsentationsregeln übertragen. BGRUND Das originäre Datenformat der ALK-Baden-Württemberg beschreibt ebenfalls Objekte (Geometrie mit Sachinformationen) ohne Präsentationsregeln. Letztere sind in der Zeichenvorschrift analog abgelegt. SQD Das SICAD-Format ist in der Lage, neben der Geometrie mit einigen wenigen Präsentationsangaben auch alle zugehörigen Sachdaten zu übertragen. 5 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden Landesklinik Nordschwarzwald Präsentation für das Zielsystem abgeleitet aus dem ATKIS OK Ernstmühl Ottenbronn Neuhengstett Hirsau Spindlershof Althengstett Alzenberg Calw Wimberg Heumaden Bundesstraße Landesstraße Schienenbahn Tunnel Gewässer Ortslage Wald Abbildung 5: Geometrieobjekte einer GIS-Schnittstelle am Beispiel ATKIS-EDBS im Bereich CALW. Ohne die Erstellung einer eigenen Präsentationsvorschrift (Legende) kann die Geometrie (linke Seite) nicht interpretiert werden. Das BasisDLM enthält in der Ausbaustufe 1 (DLM 25/1) 65 Objektarten mit 19 Attributtypen. In der Ausbaustufe 2 werden zur Zeit weitere 48 Objektarten und zusätzliche Attribute erfasst. Vektordatenformate, die speziell für Internetanwendungen definiert wurden, werden im Beitrag von Prof. Dr. Schröder behandelt. 6. Metadaten Um Daten zwischen verschiedenen Systemen austauschen und im Zielsystem qualifiziert nutzen zu können, genügt es nicht, diese dahin zu transportieren. Für eine qualifizierte Datenübergabe sind intensive Kenntnisse über die Datenstruktur, Datenqualität und die Bedeutung (Semantik) der Daten erforderlich. Diese Zusatzdaten werden auch als Metadaten (Daten über Daten) bezeichnet. Generell gilt die Formel: „Daten + Metadaten = Information“. Für die amtlichen Geobasisdaten ALB, ALK und ATKIS existieren Metadaten in Form von Objektartenkatalogen und Schnittstellenbeschreibungen. Zu den Metadaten gehören ferner die Informationen über Verfügbarkeit, Nutzungsbeschränkungen und Kosten. Um Daten über Daten allgemein verfügbar zu machen, sind Metainformationssysteme erforderlich. Diese sind allerdings nur dann effektiv einsetzbar, wenn ihre Inhalte so standardisiert sind, dass sie automatisch ausgewertet werden können. Erste Ansätze zur Normung von Metadaten befinden sich im CEN-Normenwerk (Centre Européen de Normalisation). Zur Beschreibung der Datenstruktur existieren mit EXPRESS, INTERLIS, UML, u.a. bereits genormte Sprachen. Eine nicht automatisierte, sehr einfache, aber aufwendige Art der Metadatenübermittlung ist das Seminar „Digitales Datenangebot“, bei dem verschiedene GIS-Betreiber ihr spezielles Datenangebot vorstellen. 7. Datenaustausch oder Interoperabilität? Beim Datenaustausch bzw. Datentransfer werden die Informationen von einem System zum anderen transportiert. Zum Einsatz kommen dabei entweder die proprietären Formate der Hersteller oder Standardformate. Im ersten Fall muss das empfangende System das originäre Speicherformat des jeweiligen Lieferantensystems lesen können. Die Alternative ist ein gemeinsames Standardformat, auf das sich die Beteiligten einigen und in das die je- 6 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden weiligen Inhalte abgebildet werden. Die im Standard nicht vorgesehenen Informationen gehen verloren. Proprietäre Formate und Datenstrukturen wird es vermutlich immer geben, weil nur damit spezielle Anforderungen bestmöglich erfüllt werden können. Sie sind die optimale Lösung für die Systemadministration. Innerhalb einer Organisation eignen sie sich hervorragend zum Datenaustausch, wenn entsprechende Absprachen zur Datenmodellierung getroffen und eingehalten werden. Standardformate erfordern Normierungen, es sei denn, man verwendet die Schnittstellen der Marktführer als sogenannte „Quasistandards“. Beispiele dafür sind das DXF- und das ArcView Shape-Format. Vor allem bei DXF ist festzustellen, dass es sich originär um ein proprietäres Format handelt, das von der Firma Autodesk für jede neue Version von AutoCAD modifiziert wird. Um Anpassungen zu vermeiden verwenden Fremdnutzer häufig nur die einfachen Elemente früher DXF-Versionen in einer sehr flachen Strukturierung. Die damit einher gehenden Einschränkungen und Informationsverluste werden als Mangel von DXF gesehen. Bei entsprechender Absprache könnten via DXF sehr komplexe Strukturen verlustfrei übertragen werden. Auch am Standardformat EDBS der Vermessungsverwaltungen in Deutschland ist sehr deutlich erkennbar, dass neben der generellen Struktur einer Schnittstelle die Modellierung der darin übertragenen Daten eine wesentliche Rolle spielt. Mit dem EDBS-Reader für die ALK können ATKIS-Daten aus der ATKIS-EDBS-Schnittstelle nicht verarbeitet werden. Abbildung 4: Datenaustausch zwischen Informationssystemen. n*n Schnittstellen Grafikf und / oder Sachdaten Beim direkten Datenaustausch zwischen n Systemen sind, wenn man das systemeigene Speicherformat mitzählt, bis zu n*n Schnittstellen erforderlich, die regelmässig gewartet und angepasst werden müssen. Modellbasierte Transferverfahren könnten hier Abhilfe schaffen. Dabei wird den zu übertragenden Daten in einem genormten Formalismus (Datenbeschreibungssprache) die Beschreibung der Datenstruktur vorangestellt. Dieser Weg wurde in der Schweiz mit dem Transferverfahren INTERLIS realisiert. In letzter Konsequenz könnte die Anzahl der Schnittstellen auf ein gemeinsames Transferformat und das proprietäre eigene Speicherformat reduziert werden. Der Normungsaufwand und die Restriktionen für alle Beteiligten wären allerdings sehr groß. 7 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden Gemeinsames Format Abbildung 5: Modellbasierter Datentransfer über ein gemeinsames Austauschformat. Die Anzahl der Schnittstellen wir deutlich reduziert. Allerdings wachsen die administrativen Anforderungen bei allen Beteiligten. n Schnittstellen zu i gemeinsamen Format Interoperabilität zwischen Geoinformationssystemen ist der Lösungsansatz des Open GIS Consortiums (OGC). Diese Organisation, der nahezu alle Softwarehersteller im GIS-Umfeld in irgend einer Weise angehören, setzt auf die sogenannte Distributed Computer Plattform (DCP) und auf genormte Fragen und Antworten. Damit soll es möglich werden, Daten aus Fremdsystemen temporär für eigene Anwendungen zu nutzen. Bisher sind die Fragen und Antworten für sogenannte „Simple Features“ für die Plattformen SQL, OLE/COM und CORBA definiert. Alle Definitionen sind im Internet unter http://www.opengis.org/techno/specs.htm abrufbar. Die Antworten sind objektstrukturiert. Es werden jeweils die gesamten Sachdaten mit der kompletten Geometrie übergeben. Bei den Antworten sind z.B. für SQL Tabellenstrukturen zur Übergabe der Geometrie aller definierten Elemente vorgegeben. Diese sind aber keinesfalls als Richtlinien zur Speicherung der Geometrie im jeweiligen System zu verstehen. Etliche Systemhersteller, wie z.B. ESRI, speichern allerdings ihre Grafikelemente schon seit Jahren in einer ähnlichen Datenstruktur, bei der die Geometrie benachbarter Objekte redundant geführt wird. Das OGC definiert im Rahmen der Interoperabilität nicht die zu speichernde Datenstruktur! Ungeachtet dessen ist es von großem Vorteil, wenn durch diesen freiwilligen Zusammenschluss der Systemhersteller eine gemeinsame Terminologie und Mindeststandards für die gemeinsame Nutzung verteilter Datentöpfe entstehen. Leider kann man aus der Mitgliedschaft eines Softwareherstellers im OGC noch nicht darauf schließen, dass die dort getroffenen Regeln und die Terminologie des OGC konsequent benutzt und umgesetzt werden. Wir haben bisher an der HfT noch kein System, auf das über die OGC-Standards zugegriffen werden kann. Interoperabilität Abbildung 6: Interoperabilität als Schlüssel des Open GIS Consortiums zur Lösung der Schnittstellenprobleme. Open Definierte Fragen und Antworten für GIS Grafik (Simple Features) mit Sachdaten Consortium Auf der Basis der plattformübergreifenden Schnittstellen CORBA, OLE/COM oder ODBC/SQL werden Fragen definiert, zu denen ein OGC-compatibles System ebenfalls standardisierte Antworten gibt. CORBA OLE / COM ODBC / SQL 8 Distributet Computer Plattform DCP Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden 8. Beispiele aus der Spezifikation „Simple Features für SQL“ Zur Spezifikation gehören neben der Definition möglicher Geometrieobjekte eine Vielzahl von Methoden (Fragen), die auf diese Objekte angewandt werden können. Einige der Definitionen werden nachfolgend kurz vorgestellt: Definiert sind bisher folgende Geometrieobjekte und Gruppierungen gleichartiger Objekte: • Punkte und Punktgruppen • Linien, Linienzüge und deren Gruppierung • Flächen (auch mit Löchern) und Gruppierungen von Flächen Gruppierung bedeutet jeweils, dass alle Elemente einer Gruppe dieselben Attribute haben. Sowohl bei Linien als auch bei den durch Ihren Rand beschriebenen Flächen ist nur ein geradliniger Verlauf zwischen den Stützpunkten der Geometrie möglich. Es ist nicht zulässig, dass sich die Segmente eines Linienzuges oder Teilflächen eines Flächenobjektes schneiden oder überlagern. Auch die im Vermessungswesen übliche Beschreibung eines Lochs in einer Fläche über eine gemeinsame Linie vom Rand zum Loch und zurück ist unzulässig. Es ist nicht vorgesehen, die topologische Beziehungen zwischen einzelnen Objekten zu verwalten und mit diesen zu übergeben. Zur Auswertung der Topologie stehen spezielle Methoden zur Verfügung Objekt (Feature) Punkt Linie / Linienzug Fläche (mit Löchern) Einzelobjekte Gruppierungen gleichartiger Objekte Geradlinige Verbindung der Stützpunkte eines Objektes Keine Topologie zwischen einzelnen Objekten gespeichert Abbildung 7: Geometrieobjekte entsprechend der Definition des Open GIS Consortiums (OGC) für Simple Features. Alle Verbindungen verlaufen geradlinig. Objektteile eines Objektes dürfen sich nicht gegenseitig überlagern. Methoden zur räumlichen Analyse sind: • • • • • • Der Abstand zwischen Objekten in einem definierten Koordinatensystem Bildung eines Puffers um vorgegebene Objekte Berechnung der konvexen Hülle um vorgegebene Objekte Die Verschneidung der Ausgangsgeometrie mit einer anderen Geometrie Die Vereinigung der Ausgangsgeometrie mit einer anderen Geometrie Die Differenz der Ausgangsgeometrie und einer anderen Geometrie 9 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden Methoden zum Ermitteln topologischer Beziehungen sind: • • • • • • • • Test auf Gleichheit (Equals) der Ausgangsgeometrie und einer anderen Geometrie Test auf Getrenntheit (Disjoint) der Ausgangsgeometrie und einer anderen Geometrie Test auf Überschneidung (Intersect) der Ausgangsgeometrie und einer anderen Geometrie (Umkehrung von Disjoint). Test auf Berührung (Touch) der Ausgangsgeometrie und einer anderen Geometrie Test auf Kreuzen (Cross) der Ausgangsgeometrie und einer anderen Geometrie (nur definiert für die Beziehungen Punkt/Linie, Punkt/Fläche, Linie/Linie und Linie/Fläche) Test, ob die Ausgangsgeometrie innerhalb (Within) einer anderen Geometrie liegt Test, ob die Ausgangsgeometrie eine andere Geometrie umschließt (Contains) Test, ob sich die Ausgangsgeometrie und eine andere Geometrie teilweise überlagern (Overlaps, nur definiert für Fläche/Fläche und Linie/Linie) Präsentationsregeln für Geometrieobjekte sind vom OGC nicht vorgesehen. Da im Rahmen der Interoperabilität neben der Geometrie zu jedem Objekt alle Attribute verfügbar sind, kann und muss sich der Nutzer bei Bedarf seine eigene, projektbezogene Visualisierung erzeugen. 9. Zusammenfassung Die zunehmende Verbreitung von Geoinformationssystemen und der damit stark ansteigende Bestand an digitalen raumbezogenen Daten machen den Datenaustausch zwischen Systemen bzw. den Zugriff auf fremde Datenquellen für ein wirtschaftliches Arbeiten immer wichtiger. An Normen, Regeln und Standards, die diesen Austausch bzw. den leichten Zugriff ermöglichen, wird weltweit gearbeitet. Die sich überaus rasch entwickelnde Internettechnologie weckt bei den Endanwendern Bedürfnisse und Erwartungen, die möglichst schnell zu befriedigen sind. Sie setzt deshalb wesentlich schneller sogenannte de facto Standards als jedes Normungsgremium es kann. Bis zum Vorliegen besserer Standards können auch mit den vorhandenen Schnittstellen gute Ergebnisse erzielt werden, wenn sich die Beteiligten vorab verständigen bzw. wenn die Anbieter zu den in einem Schnittstellenformat abgelegten Daten Metainformationen bereithalten und weitergeben. Im oft gescholtenen DXF-Format kann hochwertigere Geometrie transportiert werden, als sie die Simple Feature Definition vorsieht. Es ist ferner auch in diesem Format möglich, Sachdaten zu transportieren. Daneben bietet das weit verbreitete ArcView Shape Format schon lange die Möglichkeit, Simple Feature Geometrie zusammen mit Attributen zu transportieren. Bevor auf Fremddaten zugegriffen werden kann, muss allerdings deren Existenz bekannt sein. Nur wer weiß, was andere in welcher Qualität zu welchem Preis anbieten, kann wirtschaftlich agieren und Doppelarbeiten vermeiden. Auch hier wird das Internet mit Metainformationssystemen, die noch zu entwickeln sind, das Medium der Wahl sein. Einen kleinen Schritt zur Verbreitung von Informationen über Geodaten leistet das Seminar „Digitales Datenangebot in Baden Württemberg“. Die Organisatoren werden darüber hinaus künftig unter der Homepage des Fachbereichs Vermessung und Geoinformatik der HfTStuttgart eine Seite mit Verweisen zu Datenangeboten erstellen und pflegen. Den Start 10 Öffentliches Digitales Datenangebot in Baden-Württemberg Fremddaten in Geoinformationssystemen – Schnittstellen und Zugriffsmethoden stellen die Seminarbeiträge dar. Weitere Datenangebote, die aus Zeitgründen im Seminar nicht vorgestellt wurden, werden gerne integriert. Anregungen sind stets willkommen. Literatur Erläuterungen zu TIFF, GIF- und JPEG: http://kb.indiana.edu/index.cgi TIFF-Formatbeschreibung: ftp://ftp.adobe.com/pub/adobe/ devrelations/devtechnotes/pdffiles/tiff6.pdf Spezifikationen des Open GIS Consortiums: http://www.opengis.org/techno/specs.htm Beschreibung des ArcView Shape-Formats: http://www.esri.com/library/ whitepapers/ av_lit.html DXF-Formatbeschreibungen: http://www3.autodesk.com/adsk/support/ item/0,,140239--125452,00.html Homepage der HfT Stuttgart: http://www.fht-stuttgart.de Alessandro Carosio, ETH Zürich, Transfer von Geodaten: Anforderungen, Strategien Lösungsansätze. Tagunsband zum Fortbildungsseminar Geoinformationssysteme, 10.12.März 1999, TU München. Martin Pohl, Holger Eriksdottar, Die wunderbare Welt der Grafikformate von CGM über TIFF bis WMF, Wolfram´s Fachverlag 11