GIS Carolin Latze Introduction Fallbeispiel: Google Earth vs. GIS Charakterisierung Earth Viewer 1/2 ● ● ...webbasierte Dienste zur räumlichen Visualisierung der Erdoberfläche... Leistungsmerkmale: ● ● Hochwertiger globaler Datenbestand Kostenlose Nutzung (eingeschränkt) ● GIS Funktionalitäten ● Schnittstellen ● Performance ● Benutzerfreundlich Charakterisierung Earth Viewer 2/2 Definition Web Mapping Systeme ● Betrachtung der räumlichen Daten mit einem gängigen Webbrowser Google Maps Bing Maps HERE ... Definition Client Systeme ● Installation eines Software Clients erforderlich Discussion Google Earth/ Map vs. GIS ● ● ● ● ● “the claim that a web map is GIS is similar to saying that a light switch is Electrical Engineering” “it’s not only the GUI or end user application, but also the servers, databases, algorithms, etc. that make up the GIS. So yes, when viewed as such, Google Maps is a GIS.” “Google Maps|Earth is not a GIS, in that it does not offer analysis services.” “It does a marvelous job of making the data accessible to a broader public. The analysis is limited to basic functionality of a GIS: measuring distances and navigational features. “ “Try the current Google Maps API for regions close to the poles. It just falls apart because it was never meant to be used in this way.” [Source: http://highearthorbit.com/is-googlemaps-gis/] GIS remains of enduring importance because of its central coordinating principles, ● the specialist tools that have been developed to handle spatial data, ● the unique analysis methods that are key to understanding spatial data, ● and the distinctive management techniques required for geographical information (GI) handling [Source: Longley et al, 2011] Der GIS Markt der Zukunft ● Teilmarkt 1: Experten GIS ● ● Teilmarkt 2: Kombinierte Nutzung ● ● High End GIS und etablierte klassische GIS Anbieter Kombinierte Nutzung aus Experten-GIS und Earth Viewer Teilmarkt 3: Massenmarkt ● Massenmarkt, welche die Earth Viewer abdecken und der für den klassischen GIS Anbieter verloren scheint [Quelle : Schilcher/ Donaubauer] Beispiel aus der GIS Forschung: Katastrophenmanagement bei Hochwasser (Kombinierte Nutzung) [Quelle : Schilcher] Bedeutung als Querschnittsdisziplin (Beispiele von GIS) [Quelle : Schilcher] Definition Geo Informations System Geographic information systems (GIS) are a special class of information systems that keep track not only of events, activities, and things, but also of where these events, activities, and things happen or exist. [Longley et al, 2011] Geographic information systems are computer-based systems for storing and processing geographic information. They are tools that improve the efficiency and effectiveness of handling information about geographic objects and events [Longley et al, 2011] Geoinformationssysteme bestehen aus Hard- und SoftwareKomponenten. Zu den wichtigsten Teilkomponenten zählen das Datenmodell, Methoden zur Analyse, die Datenbank mit Schnittstellen für den Datenaustausch,Tool zur Visualisierung und die Daten. Die kostenintensivste und langlebigste Komponente sind die Geodaten. Klassifizierungsmerkmale von Geoinformationssystemen sind: Fachanwendung, Lebensdauer der Geodaten, Räumliche Ausdehnung und Datenauflösung sowie die Systemarchitektur. [SCHILCHER] Definition vs. Audience Definition Audience A container of maps in digital form the general public A computerized tool for solving geographic problems decision makers, community groups, planners A spatial decision support system management scientists, operations researchers A mechanized inventory of geographically distributed features and facilities utility managers, transportation officials, resource managers A tool for revealing what is otherwise invisible in geographic information scientists, investigators A tool for performing operations on geographic data that are too tedious or expensive or inaccurate if performed by hand resource managers, planners As a (mobile) software developer, use the definition that fits best for the customer. [SOURCE: Longley et al, 2011] Terminology geographic = “refers to the Earth's surface or near surface” spatial = “refers to any space, not only the space of the Earth's surface” (such as other planets or other disciplines of science) geospatial = “implying a subset of spatial applied to the Earth's surface and near surface” [Source: Longley et al, 2011] Querschnittsdisziplin GIS: 3 Ebenenkonzept [Quelle : Schilcher] Teilkomponenten der Geoinformatik [Quelle : Schilcher] Wesentliche Kerngebiete von GIS ● Geodaten ● Technologien ● Anwendungen ● Markt/ Akteure (Anbieter Systeme, Anbieter, Daten, GIS-Dienstleister, Nutzer) Anwendungsspektrum von GIS [Quelle : Schilcher] History Entwicklung GIS Systeme 1960er Jahre ● ● first real GIS: Canada Geographic Information System (CGIS): mid 1960s ● Canada land inventory ● goal: identify nation's land resources + existing and potential uses ● planned and developed as measuring tool, not as a mapping tool 2nd burst: late 1960s: US Bureau of the Census ● ● ● goal: planning the tools needed to conduct the 1970 census of population DIME program (Dual Independent Map Encoding): creation of digital records of all US streets in order to support automatic referencing and aggregation of census records latter half of 1960s: question arose if computers might be adapted to reduce costs and shorten the time needed to create maps => 1968: UK Experimental Cartography Unit (ECU) pioneered computer mapping => publication of world's first computer made map in 1973 ● further pioneering results of the ECU (amongst others) – – – GIS work in education post- and ZIP codes as geographic references visual perception of maps ● first automated cartography developments by national mapping agencies ● 1969: ESRI Inc was formed by a student at Harvard Lab Entwicklung GIS Systeme 1970er Jahre ● DIME and CGIS were recognized as similar projects => major program at Harvard University's Laboratory for Computer Graphics and Spatial Analysis ● ● ● goal: development of general purpose GIS => lead to ODYSSEY GIS software: late 1970s most major cartography agencies were computerized to some degree Großrechner (DBMS) Entwicklung GIS Systeme 1980er Jahre ● Client/Server-Systeme ● Unix-Workstations ● takeoff of GIS since computing hardware got cheaper ● ● ● first customers: forestry companies and natural resource agencies 1981: ArcInfo launched: first commercial GIS software system 1986: MapInfo Corp founded: develops first major desktop GIS products Entwicklung GIS Systeme 1990er Jahre ● ● ● 1995: first country (Britain) had complete digital map coverage in a database 1996: Internet GIS products introduced (e.g. by ESRI, MapInfo, Autodesk) PC-Windows-Systeme Entwicklung GIS Systeme 2000er Jahre ● Mobile GIS, GNSS (Global Navigation Satellite System) ● World Wide Web (WebGIS) ● Internet / Intranet ● Mehr Interoperabilität Nutzung verteilter Systeme, OGC Web Services, Geoportale ● 2006: launch of Google Earth ● Earth Viewer ● Daten & Bilder ● KML Earth Viewer als Content Platform Entwicklung GIS System 2010er Jahre ● SaaS ● Cloud GIS Classification and Applications Klassifizierung für GIS (Taxonomie) [Quelle: Lother/Schilcher 2005] Klassifizierungsmerkmal Fachanwendung = Einteilung nach Anwendungsgebiet Die Anwendung gibt: Typ der Geoobjekte, Eigenschaften und Merkmale, Qualitätsanforderungen, Datentyp (Raster/Vektor) vor. Beispiele: ● Kommunale GIS (KIS) ● Netzinformationssysteme (NIS) ● ● GIS für Ver- und Entsorungsunternehmen Umweltinformationssysteme (UIS) Klassifizierungsmerkmal Lebensdauer der Geodaten GIS-Projekt oder „echtes“ Informationssystem • GIS zur langfristigen Speicherung und Auswertung (pesistente Datenhaltung) Qualität der Datenbank hat Vorrang, Kontinuität über einen längeren Zeitraum muss gewährleistet sein, Aktualisierung ist wichtigste Qualitätsanforderung • GIS-Einsatz für Projekte (temporäre Datenhaltung) Zeitlich begrenzte Vorgänge, fachübergreifende Zusammenschau von Daten aus unterschiedlichen Quellen, Fortführung der Daten nach Projektende findet nicht statt • Ad hoc (online) Datenkombination Sehr kurze Aktivierung der Geodaten (nur für Zeitdauer einer Anfrage), Komplexität des Systems bleibt verborgen, keine Kenntnisse über Daten und Technologie nötig beim Endanwender (Beispiel: Browser für WebGIS) Klassifizierungsmerkmal räumliche Ausdehnung und Datenauflösung ● Räumliche Ausdehnung = sowohl Dimension als auch die Größe des im Systems abgebildeten Ausschnitts der Realen Welt ● Größen: globales, regionales, lokales GIS ● Dimensionen: 2D, 2.5D, 3D, 2D+Zeit, 2.5D+Zeit, 4D – – ● 2.5D = Projektion, Fläche mit Höhenrelief, aber ohne Volumen 4D = 3D + Zeit (e.g. Erdentstehung, www.scotese.com) Geometrische Auflösung der Daten ist eng an den Erfassungsmaßstab gekoppelt ● ● ● ● Landinformationssysteme (M=1:1 bis 1:5.000) Topographische Informationssysteme (M=1:2.500 bis 1:100.000) Geographische Informationssysteme (M<=1:100.000) Maßstab < 1:10.000 i.d.R. Generalisierungseffekte Klassifizierungsmerkmal räumliche Ausdehnung und Datenauflösung ● Räumliche Ausdehnung = sowohl Dimension als auch die Größe des im Systems abgebildeten Ausschnitts der Realen Welt ● Größen: globales, regionales, lokales GIS ● Dimensionen: 2D, 2.5D, 3D, 2D+Zeit, 2.5D+Zeit, 4D – – ● 2.5D = Projektion, Fläche mit Höhenrelief, aber ohne Volumen 4D = 3D + Zeit (e.g. Erdentstehung, www.scotese.com) Geometrische Auflösung der Daten ist eng an den Erfassungsmaßstab gekoppelt ● ● ● ● Landinformationssysteme (M=1:1 bis 1:5.000) Topographische Informationssysteme (M=1:2.500 bis 1:100.000) Geographische Informationssysteme (M<=1:100.000) Maßstab < 1:10.000 i.d.R. Generalisierungseffekte Klassifizierungsmerkmal Systemarchitektur Komponenten eines GIS [Quelle : Schilcher] Architekturen: ● Desktop-GIS (Einplatzsysteme) ● Client/Server-GIS (Standarddatenbank) ● Web-GIS ● Mobile GIS ● Geoportale (Nutzung verteilter Daten) ● Cloud GIS GIS Architekturen 1 Unterschiedliche Sichtweisen [Quelle : Schilcher] GIS Architekturen 2 Standardarchitektur eines GIS [Quelle : Schilcher] Produktfamilie ESRI – ArcGIS 10 (www.esri-germany.de) ● One example to show the complexity of GIS systems (ESRI ArcGIS has products for almost every use case) ● Create and use maps ● Compile geographic data ● Analyze mapped information ● ● ● ● ● ● Share and discover geographic information Use maps and geographic information in a range of applications Manage geographic information in a database Online GIS, allowing for different clients & providing information from lots of different GIS and mapping organizations worldwide Cloud access worldwide, local access with local files, enterprise web access within one company REST/ SOAP API ArcGIS 10 Cont. ● ● Maps ● Strong cartography (like paper maps) ● Including point, line, polygon features for analytic tools (more than a paper map!) ● May contain raster, terrain, other specialized data ● Editable (→ compile new information) ● Interactive to reach into richer information and tools Applications ● ● ● Create specialized web map interface for certain applications People and Communities ● Share geographic information, maps, applications, … ● www.arcgis.com Services ● Make maps available to people without GIS software (web, mobile clients) ● ArcGIS servers makes compiled map available through web and mobile app APIs ArcGIS 10 Community Web Example ArcGIS 10 Community iPhone Example ArcGIS 10 Android Example ● ● Delivers parcel boundaries Send current location to ArcGIS 10 Server to retrieve parcel information The anatomy of a GIS ● ● ● ● ● network to exchange information prominent way to deliver GIS applications link together distributed users today many GIServices are made available to mobile devices for personal use = location based services with web 2.0, information flow is even bidirectional to collect data and interpret it that are needed for management purposes (make sure it meets its needs, stays within budget, …) either web-only using a webbrowser or a GIS software package ● ● ● ● hardware used to be a desktop, today more and more also mobile devices thin or thick clients stores digital representations of selections of the Earth's surface may be rather static for certain projects or updated every day Höchste Leistungsklasse: Client/Service GIS „High-End-GIS“ ● Integrierte Datenhaltung am Zentralrechner (Server) ● Viele PC-Arbeitsplätze (Clients) ● Anschluss über internes Netz (LAN) ● Individuelle Anwendungsfachschalen ● Vorteil: Viele Nutzer mit wenig Know-how können das GIS nutzen Internet GIS ● ● ● ● Zentraler, leistungsstarker Server (Geodatenserver) im Internet Zugriff über WWW oder Intranet und InternetTechnologie Browserarbeitsplätze Vorteil: Kein vorinstallierter Client, einfacher Internet-Browser mit oder ohne Zusatzfunktionalität Cloud GIS ● GIS data today is often unintentionally locked up, also because server infrastructure is expensive ● Either in public or private cloud ● Always most up-to-date version ● Allow more applications in parallel ● Integration into enterprise GIS ● Free viewer GIS Architekturen: GIS & Internet / Geo Web Services High-End-GIS - AED-SICAD - Autodesk - ESRI - Intergraph - GE Energy Smallworld (SICAD = Siemens CAD) [Quelle : Schilcher] GIS Architekturen: Betreibermodell eines externen Dienstleisters GIS Architekturen: Datenbanken im Internet (3-Tier-Architektur) [Quelle : Schilcher] Applications of GIS ● ● 5 Ms of GIS Applications ● Mapping ● Measurement ● Monitoring ● Modeling ● Management Application areas ● Government and public services – ● First to afford a GIS and still the major user group Business and service planning – Supporting business decisions ● Logistics and transportation ● Environment Geo Data Datenmengen (1) GIS db sizes, 1kB = 1024B 1MB = 1 000 000 B = Single dataset in a small project database 1GB = 1 000 000 000 B = Entire Street Network of a large city or small country 1TB = 1 000 000 000 000 B = Elevation of entire Earth surface recorded at 30m intervals 1 PB (peta byte) = 1 000 000 000 000 000 B = Satellite image of entire Earth surface at 1m resolution 1 EB (exa byte) = 1 000 000 000 000 000 000 B = A future 3D representation of entire Earth at 10m resolution ? => be careful!!! [Source: Longley et al] Datenmengen (2) the Earth's surface must be described efficiently, otherwise it will generate too much data example: 1pixel = 100qkm => Manhattan could be displayed on 10 pixels (blurred) => spacial resolution of 10km (=1 side of 1 pixel) => anything less than 10km is invisible Earth = 500 Mio qkm => resolution of 10km (100 qkm) => 5 Mio Pixel needed instead of 500 at a resolution of 1km (1qkm) other strategy to limit detail: many properties remain constant over large areas (e.g. there is a lot of water at sea level) 5 Mio pixel at resolution of 10km; 3.4 Mio will have an altitude of zero => identify the water and store the remaining part in only 1.6 Mio pixels [Source: Longley et al] „Jede Geoinformationslösung ist nur so gut wie die Daten, die sie beinhaltet“ (Borchert U. Wilting 2003) Qualitätsaspekte sind entscheidend für die Bewertung von Analyseergebnissen. Fallbeispiel: Geodaten des Landesvermessungsamtes Vorarlberg in Feldkirch Datenvolumen Laserdaten ASCII-Rohdaten (x,y,z Koordinaten); Davon zum Beispiel abgeleitet: 514 GB DXF-Isolinien / Höhenlinien (DXF = Autodesk Drawing Interchange Format zur Übergabe von vektorisierten Daten) 103 GB Route der Laserscan-Befliegung 0,05 GB GIS-Daten (DGM, Schattierung, Isolinien/Höhenlinien) (DGM = Digitales, numerisches Modell der Geländehöhen & -formen/ Digital Geophysical Model) 43 GB Orthophotos Jahr 195x, Schwarz / Weiß, 25cm Auflösung (entzerrte Jahr 2001, in Farbe, 25cm Auflösung Fotos zur Darstellung Jahr 2006, in Farbe, 12,5cm und 25cm Auflösung auf Karten) 5,5 GB Topographis Bereiche „Blattschnitte“, „Verkehr“, „Wasser“ und che Daten „Grenzen“ 1,5 GB 16 GB 57 GB Das Orthophoto von Vorarlberg (Ausschnitt) ● ● Das Orthophoto zählt zu den Geobasisdaten, weil es vom Landesvermessungsamt flächendeckend bereitgestellt wird (amtlich, für alle Behörden) Ist ein Rasterdatensatz (aus Pixeln (1 Pixel = 1 m2) / Gitterzellen zusammengesetzt) ● Genauigkeit 12 cm ● Dargestellt in 2D (mit ArcMap) [Quelle: Schilcher] Das Orthophoto von Vorarlberg überlagert mit dem Layer „Seen“ ● ● Der Layer „Seen“ gehört ebenfalls zu den Geobasisdaten Der Layer „Seen“ ist ein Vektordatensatz (aus einer zusammenhängenden Reihe von Koordinatenpaaren zusammengesetzt). ● Dargestellt in 2D (ArcMap) ● Sachdaten zum Layer „Seen“: Fläche Umfang [Quelle: Schilcher] Vorarlberg Basisdaten überlagert mit Layer für Mountainbike Tour ● ● ● Mountainbike Touren gehören zu den Fachdaten (nicht amtlich, nicht flächendeckend) Vektordatensatz Dargestellt in 2D (ArcMap) [Quelle: Schilcher] Das Geländemodell von Vorarlberg (Ausschnitt) ● ● ● ● ● Das Höhenmodell (=DGM) gehört zu den Geobasisdaten Ist ein Rasterdatensatz (aus Pixeln bzw. Gitterzellen zusammengesetzt) Auflösung 1m In diesem Fall mit Schattierungseffekt visualisiert, um Konturen besser zu erkennen Dargestellt in 2D (ArcMap) [Quelle: Schilcher] Das Geländemodell von Vorarlberg in 3d (I) ● Höhenmodell überlagert mit Orthophotos ● Dargestellt in 3D (ArcScene) ● Blickrichtung Norden [Quelle: Schilcher] Das Geländemodell von Vorarlberg in 3d (II) ● ● ● ● Detaildarstellung Höhenmodell überlagert mit Orthophoto und Mountainbikeroute (= Basisdaten UND Fachdaten) Blickrichtung Nordost 2 fache Überhöhung des Geländes [Quelle: Schilcher] Metadaten am Beispiel der Seen (I) ● ● Metadaten = „Daten über Daten“ bzw „Zusatzinformationen“ zu Daten Beschreiben die Eigenschaften der Daten Transverse Mercator = Projektion Mit Konzentration auf bewohnte Teile der Erde [Quelle: Schilcher] Metadaten am Beispiel der Seen (II) [Quelle: Schilcher] Metadaten am Beispiel der Seen (III) ● ● ● ● Metadaten innerhalb der GIS-Software ArcCatalog, dem Dateimanager der Software ArcGIS Verwendete Projektion Geodätische Bezugshöhe Räumliche Ausdehnung des Datensatzes [Quelle: Schilcher] Geodaten Geodaten sind Daten über Gegenstände, Geodaten beschreiben Objekte, die durch eine Position im Geländeformen und Infrastrukturen an der Erdoberfläche, Raum direkt (z.B. durch Koordinaten) oder indirekt (z.B.durch wobei als wesentliches Element ein Raumbezug vorliegen Beziehungen) referenzierbar sind. Aus informationstechnischer muss. Sie beschreiben die einzelnen Objekte der Sicht kann man die Daten, die zusammengesetzt Geodaten Landschaft. Geodaten lassen sich über den Raumbezug ausmachen, einteilen in: miteinander verknüpfen, woraus insbesondere unter • Geometriedaten (Lage und Form der Objekte) Nutzung von GIS-Funktionalitäten wiederum neue • Topologie (explizit gespeicherte räumliche Beziehungen) Informationen abgeleitet werden können. Auf und mit • graphische Ausprägungen wie Signaturen, Farbe, Typographie ihnen lassen sich Abfragen, Analysen und Auswertungen • Sachdaten (alphanumerische Daten zur Beschreibung der für bestimmte Fragestellungen durchführen. Semantik). Geoinformationen sind Informationen zu Phänomenen, die direkt oder indirekt in Bezug zu einem Ort auf der Erde stehen. Geodaten sind eine datenverarbeitungstechnische Form von Geoinformationen. Geodaten schließen semantische Aspekte, räumliche Aspekte und Qualitätsaspekte ein. Die semantischen Aspekte beschreiben das von den Daten repräsentierte Modell. Die räumlichen Aspekte definieren ihre Lage und Form. Die Qualitätsaspekte zeigen ihre Verwendungsmöglichkeiten an. [Quelle: Schilcher] Geodaten: Klassifizierungsmöglichkeiten Klassifizierungsmerkmale: ● Datenarten (Geometriedaten, Sachdaten, Metadaten, ...) ● Datentypen (Vektor, Raster) ● ● ● Datenherkunft bzw. Zuständigkeit für Erfassung und Pflege (amtliche, behördliche, kommunale, private Geodaten) Grad der Spezialisierung (Geobasisdaten, Geofachdaten) Thematik (Umweltdaten, Katasterdaten, sozioökonomische Daten, topographische Daten etc.) ● Raumbezug (direkter / indirekter Raumbezug) ● Strukturierung (unstrukturiert, layerstrukturiert, objektstrukturiert, etc.) ● Modellierung (relational, objektrelational, objektorientiert) ● Erfassungsmaßstab (großmaßstäbige, kleinmaßstäbige Daten) Datenart: Geometriedaten – Datentyp: Vektordaten (1) [Quelle: Schilcher] Datenart: Geometriedaten – Datentyp: Vektordaten (2) Polygone werden “rechtsrum” beschrieben [Quelle: Schilcher] Datenart: Geometriedaten – Datentyp: Vektordaten (3) [Quelle: Schilcher] Datenart: Geometriedaten – Datentyp: Vektordaten (4) TIN ● Ein TIN (= Triangulated Irregular Network) ist eine gängige GIS-Methode zur Erstellung einer digitalen Geländedarstellung aus Punktdaten im Vektordatenmodell mittels Dreiecken. ● Darstellung mittels Dreiecken ● Höhenwert für jeden Dreiecksknoten ● unregelmäßig verteilte Datensätze [Quelle: Schilcher] Datenart: Geometriedaten – Datentyp: Rasterdaten (1) Rasterdaten ● ● ● ● ● entstehen vorwiegend durch Scannen und anschließendes Georeferenzieren von analogen Karten, Plänen, oder Bildern. Geräte zur Datengewinnung, diedirekt Rasterdaten liefern, bestehen aus einer bestimmten Anzahl von Bildpunkten (Pixel). Anzahl der Pixel durch Auflösung bestimmt Jedem Bildpunkt ist ein Wert zugeordnet. [Quelle: Schilcher] Datenart: Geometriedaten – Datentyp: Rasterdaten (2) ● Matrix von Zellen, die in Zeilen und Spalten organisiert ist. ● Jeder Zelle ist ein Wert zugeordnet ● ● Grauwert für Bilder, gescannte Karten ● Attributwert bei GRIDs, z.B. Höhe bei DGM Genauigkeit hängt von der Bodenauflösung ab [Quelle: Schilcher, Longley et al] Datenart: Geometriedaten – Datentyp: Rasterdaten (3) ● variation in cells will be lost => value of the cell is usually the one with the greatest share within the cell Vergleich Vektor- und Rasterdaten Element Vektor Raster Punkt x,y Koord. Pixel Linie x,y Koord.-folge Pixel Fläche Geschlossene x,y Koord.-folge Pixel [Quelle: Schilcher] Geographic Elements and their Dimension ● polygon = 2dim ● line = 1dim ● point =0dim [Quelle: Longley et.al] > if streets are represented with lines, they are 2dimensional => how to specify overpasses and underpasses? => use turning options! From Link To Link Turn? A B No A C Yes A D No B C No B D Yes B A No C D No C A Yes C B No D A No D B Yes D C No Vergleich Vektor- und Rasterdaten Cont. Anwendungsbereiche Vektordaten Rasterdaten großmaßstäbige Bereiche 1:500 bis 1:10000, d.h. Bereiche ohne generalisierte Kartengrundlagen (maßstäbliche Darstellungen) vorzugsweise in kleineren und mittleren Maßstäben, vor allem in den Bereichen Umweltanalysen, Planung und Satellitenbildkartographie teilweise auch in kleineren Maßstäben Vergleich Vektor- und Rasterdaten Cont. Vorteile Vektordaten Rasterdaten höhere Punktgenauigkeit räumliche Analysen weniger Speicherplatzbedarf zeitliche Veränderungen (Vegetation, Waldschäden, Gewässerverunreinigung usw.) effizienter Zugriff und höhere Performance einfache Datenstruktur (Pixelmatrix) einfache Generierung der Topologie (Knoten, Kanten, Flächen) Überlagerungen bei Visualisierungen homogene Datenbestände bei Transformationen geringerer Erfassungsaufwand leichte Verbindung zu Sachdaten (Attributierung, Objektdefinition) Vergleich Vektor- und Rasterdaten Cont. Nachteile Vektordaten Rasterdaten hohe Rechenzeiten bei Flächenanalysen (Verschneidungen = Kombination der Daten aus mehreren Karten) unklare Grenzdefinition (Punkt/Pixel) hoher Erfassungsaufwand im grossmassstäbigen Bereich (Zeit und Kosten) begrenzte Auflösungsgenauigkeit (Pixel entspricht nicht genau einem Objekt) grosses Datenvolumen begrenzte Einsatzfähigkeit im Bereich parzellenscharfer Flächenanalysen Hybride GIS-Technik ● gleichzeitige Verarbeitung von Vektor- und Rasterdaten → Zusammenführung unterschiedlichster Quellen ● Rasterbilder: → Georeferenzierung → Zuweisen eines geodätischen Koordinatensystems → Herstellung des Raumbezugs → Hintergrundinformation für vektorielle Daten Datenart: Sachdaten ● ● ● ● Werden auch als „Attribute“ oder „Alphanumerische Daten“ bezeichnet Sämtliche nichtgeometrischen Daten Häufig Speicherung in relationalen Datenbanken Verknüpfung mit Geometrie über eindeutige Schlüssel (ID) Geo Attributes ● ● ● ● ● nominal = identify an entity (e.g. in order to distinguish it from others) ordinal = values that have a natural order (e.g. Canada's agricultural land: class 1 – best, class 2 – not so good, …) interval = difference between values makes sense (scale of Celsius is interval since 30 and 20 are as different as 20 and 10) ratio = ratios between values makes sense (weight is ratio since a person of 100kg is as twice as heavy as a person of 50kg; scale of Celsius is not ratio since 20 is not as twice as hot as 10) cyclic = GIS data is cyclic since the Earth is a globe (highly important when dealing with coordination, there is a 0-meridian!) Datenquellen und Methoden zur Datengewinnung Vektordaten ● Elektronische Tachymeter (Geländeaufnahme) ● GPS (Geländeaufnahme) ● Graphisch-elektronische Feldbücher (mobile GIS) ● Analytische und digitale Photogrammetrie (Luftbilder) ● Orthophototechnik ● Rasterdaten ● Analoge Orthophotos ● Digitale Orthophotos Bildgebende Sensoren ● Radar, Video, Laserscanner ● Satellitendaten ● Fernerkundung ● Scanner für analoge Karten und Pläne Vielzahl an Datenquellen heute bereits digital vorhanden Geobasisdaten Quelle CH: Swisstopo ● Liegenschaftskataster (ALKIS) – CH: Grundbuch ● Automatisiertes Liegenschaftsbuch (ALB) ● Digitale Flurkarte (DFK) ● Hauskoordinaten ● Digitale Orthophotos (DOP) ● Digitale Topographische Karten (DTK) ● Amtl. Topographisches Informationssystem (ATKIS) ● Digitales Geländemodell (DGM) Datenqualität Basis einer sinnvollen Arbeit mit GIS sind Geodaten, die in angemessener Qualität vorliegen! ● Es gibt Leitfäden für Behörden und Planer mit Anforderungen an die Daten Was bedeutet Qualität von Geodaten? 1. Qualität ist nach DIN definiert als „die Gesamtheit von Merkmalen einer Einheit (Produkt, Dienstleistung) bezüglich ihrer Eignung, festgelegte und vorausgesetzte Erfordernisse zu erfüllen“ (DIN ISO 8402, 1992). 2. Geodaten sind immer nur ein unvollständiges Abbild eines Teilausschnitts der Erdoberfläche. Sie bilden ein bestimmtes Thema zu einem bestimmten Zeitpunkt und für einen bestimmten Raum ab (Was? - Wann? - Wo?). Was bedeutet Qualität von Geodaten? ● Qualität bezieht sich immer auf einen bestimmten Einsatzzweck. ● ● ● Es gibt keine perfekte Karte (Küstenlinien bestehen z.B. aus einer unendliche grossen Menge von Informationen, die so nie abgebildet werden könnten) => Raster- und Vektordaten sind immer nur Abstraktionen Qualität von Daten nie per se „gut“ oder „schlecht“. Daten sind nur für einen bestimmten Zweck mehr oder weniger geeignet. Verschiedene Aspekte von Datenqualität Um die Qualität von Geodaten genauer definieren zu können, benötigt man detailliertere Bezeichnungen für den sehr allgemeinen Begriff der Datenqualität. Gängige Kategorien zur Beschreibung der Qualität von Geodaten: ● Aktualität ● Genauigkeit ● Richtigkeit ● Vollständigkeit ● Konsistenz Heterogene Geodaten Beispiele für Geodaten ● ● ● ● ● ● Digitale Flurkarte (DFK) Automatisiertes Liegenschaftsbuch (ALB) Digitale Orthophotos (DOP) Digitale Topographische Karte 1:25.000 (DTK) Georeferenzierte Gebäudeadressen Gemeindeteildatei und Gemarkungsverzeichnis ● Biotopkartierung ● Raumordnungskataster ● Digitale Bebauungspläne ● Wald-Standortkartierung wichtige Heterogenitätsmerkmale ● ● ● ● Aktualität: Aktualisierungszyklen von „tagesaktuell“ bis 15 Jahre Metrische Genauigkeit / Maßstabsbereich: Zentimeter (1:1.000) bis 10 Meter und schlechter (Generalisierung bei 1:25.000) Datentypen und Datenmodelle: Raster-, Vektor-, Sachdaten, Multimedia,unstrukturiert, objektstrukturiert ... Transferformate: GeoTIFF, SQD, Shape, DatRiGRUBIS... ● ● ● GeoTIFF: (1) verlustfreie Speicherung & (2) nicht sichtbare Daten wie z.B. Koordinaten für Georeferenzierung SQD: Austauschformat für SICAD Daten DatRi-GRUBIS: DatenaustauschsRichtlinien für Grundstücks- und Bodeninformationssystem (SICAD) Aktualität Aktualität beschreibt zeitliche Gültigkeit vorliegender Daten. Beschreibung durch: ● Erfassungsdatum ● Stand der Daten ● Gültigkeitsdauer Genauigkeit Genauigkeit / Auflösung (engl. Resolution): Maß für die Bearbeitungstiefe des betrachteten Datensatzes. Genauigkeit bezüglich Raum, Zeit und Thema. ● Räumliche Genauigkeit : Maßstab oder Lagegenauigkeit der Daten. ● ● ● Faustformel: Lagegenauigkeit [m] = 1 Tausendstel der Maßstabszahl Zeitliche Genauigkeit: Gültigkeitsdauer von Geodaten. Thematische Genauigkeit: Detaillierungsgrad der Datenmodellierung (Sachdaten). Richtigkeit Richtigkeit ist das Gegenteil von Fehlerhaftigkeit. Richtige Daten sind also räumlich, zeitlich und auch thematisch richtig. Vollständigkeit ● ● ● räumliche Vollständigkeit: Raum muss vollständig abgedeckt sein zeitliche Vollständigkeit: Daten müssen vollständig in benötigter Aktualität vorliegen thematische Vollständigkeit: Daten müssen vollständig in der richtigen Bearbeitungstiefe vorliegen Konsistenz Konsistenz beschreibt die logische Gültigkeit der vorliegenden Daten. • räumliche Konsistenz • zeitliche Konsistenz • thematische Konsistenz Gründe für (mangelnde) Datenqualität Einflussfaktoren bei der Erstellung von Daten, welche die Qualität beeinflussen können: ● ● Generalisierung Verdrängung ● Grenzziehung ● Klassifizierung ● ● Auswahl und Betonung von Objekten Massstab ● Kartierfehler ● Qualität von aggregierten Daten ● Digitalisierungsfehler ● Alter / Aktualität der Daten ● Mangelnde Vollständigkeit ● Formatkonvertierungen Datenstruktur und Datenformat In welcher Form sollen die Daten vorliegen? ● Als Karten / Pläne oder als Geodaten ● Als Raster- oder als Vektordaten ● Vektordaten als Punkt, Linie oder Fläche ● Werden Sachinformationen benötigt? Welches Datenformat ist sinnvoll? ● Bilddatenformat ● CAD-Format ● GIS-Format Geometrien Bei der Erstellung neuer Geodaten kann auf die Qualität der Geodaten Einfluss genommen werden, indem ● ● Digitalisiervorgaben gemacht werden und / oder Qualitätskriterien für die Geometrien vorgegeben und diese auch kontrolliert werden. Qualitätskriterien für Geometrien Flächengeometrien ● keine Splitterfläche Liniengeometrien ● keine Undershoots / Overshoots ● ● ● ● keine Lücken (Gaps) keine Überlappungen (Overlaps) keine Multipart-Polygone ● ● Groups of polygons that have gaps inbetween Zu kurz / zu lang ● durchgehende Linien ● Vorgaben für sich kreuzende Linien Punktgeometrien ● geschlossene Polylinien ● Vorgabe der Lagegenauigkeit Trennung von Thema und Layout Metadaten GIS Daten können nur dann sinnvoll genutzt werden, wenn genügend Informationen über diese Daten vorliegen. Solche „Daten über Daten“ werden auch als Metadaten bezeichnet. Metadaten sind alle Informationen rund um die Daten selbst, beispielsweise Art und Maßstab der Daten, Aktualität und Bearbeiter oder die Bedeutung bestimmter Informationen und Symbole Welche Metadaten sollen erfasst werden? Datenbeschreibung ● Beschreibung der Daten (Text) ● Zweck / Nutzung der Daten ● Zugangs- und Nutzungsbeschränkungen ● Bearbeitungsstand (z.B. abgeschlossen, in Bearbeitung, ...) ● räumliches Bezugssystem ● räumliche Zuordnung, z.B. über Koordinaten im Koordinatensystem ● Maßstab ● Kontaktperson ● Bezugsquelle ● Nutzungsbedingungen ● Änderungshistorie Welche Metadaten sollen erfasst werden? Qualitätsinformationen ● die Herkunft / Entstehung der Daten ● die Genauigkeit der Sachdaten ● die logische Konsistenz der Daten ● die Vollständigkeit ● die Lagegenauigkeit Ausprägung ● ● Rasterdaten: Welche Größe hat ein Pixel? Vektordaten: Liegen die Daten als Punkt-, Linien- oder Flächendaten vor? Welche Metadaten sollen erfasst werden? Sachinformationen ● Welche Attribute (Felder) enthält die Tabelle? ● Felddefinitionen Darstellung ● Verweis auf Standardlegenden oder Farbtabellen Software ● Name der Software ● Datenformat ● Version Welche Metadaten sollen erfasst werden? Bezugsdaten ● Kontaktperson ● Bezug als nicht digitale oder digitale Karte ● Datenformat ● Dateigröße ● Kosten ● Bezugsbedingungen Metadaten für einen digitalen Bebauungsplan (nach ISO 19115) <MD_DataIdentification> <citation> <title>Bebauungsplan 16 I, Hauptstrasse, 82223 Eichenau, Deutschland</title> <date> <dateType> <CI_DateTypeCode_CodeList>creation</CI_DateTypeCode_CodeList> </dateType> <date>2003-03-24</date> </date> </citation> <abstract>Digitalisierter Bebauungsplan aus der Gemeinde Eichenau</abstract> <status> <MD_ProgressCode_CodeList>completed</MD_ProgressCode_CodeList> </status> <pointOfContact> <contactInfo> <phone> <voice>+49 89 289 22973</voice> <voice>+49 89 289 22578</voice> <facsimile>+49 89 289 22878</facsimile> </phone> <address> <deliveryPoint>Arcisstrasse 21</deliveryPoint> <city>Muenchen</city> <administrativeArea>Bayern</administrativeArea> Scales ● ● ● Scale of a paper map = ratio of the distance in the map to distance on the ground does not really make sense for digital data (= ratio of the distance in the computer to distance on the ground) digital data scale = ratio of the distance in the map that formed the source of the digital data to the distance on the ground Die amtliche Vermessung der Schweiz (www.cadastre.ch) ● ● ● Ist Bestandteil des Grundbuchs um genau Grenzverlaeufe der Grundstuecke festzuhalten Direkte Produkte (Auszug): ● Grundbuch ● Digitales Terrainmodell ● Gebaeudeadressen Anwendungsgebiete (Auszug) ● Kataster der oeffentlich-rechtlichen Eigentumsbeschraenkungen (OEREB) ● Verwaltung ● Bauvorhaben ● GIS ● Rettungsdienste/ Feuerwehr LV95 - “Neue Koordinaten fuer die Schweiz” ● ● 1903: Zylinderprojektion (LV03) ● Landspezifisch, kein gemeinsames europaeisches Bezugssytem ● Beruehrungspunkt Zylinder & Kugel = 0 Punkt (= alte Sternwarte in Bern) ● Angabe der Koordinaten in x und y 1989 – 1995: neue Landesvermessung basierend auf satellitengestuetzten Positionierungsdienste (LV95) ● ● ● Angabe der Koordinaten in E (East) und N (North) Daraus folgt die Aenderung der Koordinaten in Landeskarten Starke Auswirkung bei der amtlichen Vermessung, Raumplanung, etc [Quelle: www.cadastre.ch] Transformation LV03 → LV95 ● ● Es gibt einen Transformationsdatensatz fuer die offizielle Transformation von LV03 → LV95 Bestandteile ● ● ● ● Mathematische Beziehen: FINELTRA = FINite Elemente TRAnsformation Passpunkte (Punkte, deren Koordinaten in beiden Systemen bestimmt wurde) Verfuegbar auf www.swisstopo.admin.ch → Interaktive Anwendungen → Rechendienste (z.B. REFRAME, NAVREF) Detailinformationen auf www.swisstopo.ch → Themen → Vermessung/ Geodaesie → Neue Koordinaten → Bezugsrahmenwechsel Geo Referencing Terminology ● referencing = specify location ● data without location = non-spacial ● ● there are several terms to describe the assignment of location to information: ● georeferencing ● geolocating ● geocoding ● tagging records with geographic locations ● locating requirements of a georeference ● unique ● meaning is shared among all people that wish to work with that information ● persistent through time (names that change can cause a lot of issues, Burma → Myanmar, Peking → Beijing, Karl-Marx-Stadt → Chemnitz) Properties of Geo References ● ● ● ● ● there is a spatial resolution assigned to each georeference ● mailing address = size of the mailbox ● us state = depending on the size of the state ● swiss canton = depending on the size of the canton a (place-)name is not necessarily unique on a global scale ● Bern, CH ● Berne, NY, USA metric georeferences ● longitude, latitude, … various kinds of coordinate systems ● used to make maps (and calculate distances) geographic names are usually standardized but there might be different versions ● across different languages (Florence in English, Firenze in Italian) ● across different cultures (Mount Everest to many globally, Chomolungma to many Tibetians) www.wikimapia.org is an example for user generated georeferences ● wikimapia'smantra: “Let's describe the whole world” ● VGI = Volunteered geographic information Commonly used Systems System Domain of uniqueness Metric? Example Spatial resolution Place-name varies no Berne, NY, USA Varies by feature type Postal address global No, but ordered along streets in most countries Wankdorffeldstrasse 102, Bern, Switzerland Size of one mailbox Postal code country no 93117 (U.S. Zip code), WC1E 6BT (UK Unit Postcode), 3000 Bern Area occupied by a defined number of mailboxes Telephone calling area country no 031 varies Cadastral system Local authority no Parcel 01452954, City of Springfield, MA Area occupied by a single parcel of land Public land survey system Western Canada and US only, unique to Prime Meridian yes Sec 5, Township 4N, Range 6E Defined by level of subdivision Latitude/ Longitude global yes 46 degrees 57 minutes East, 7 degrees 27 minutes North Infinitely fine Universal Transverse Mercator Zones six degrees of longitude wide, and N or S Hemisphere yes 563146E, 4356731N Infinitely fine State plane coordinates United states only, unique to state and to zone within state yes 55086.34E,75210.76N Infinitely fine [Source: Longley et al] Commonly used Systems Cont. Postal and IP Addresses ● postal addresses ● ● ● ● mail delivery has been developed in the 19th century today used for many purposes (place of residence, place of business, …) fails for places that is not supposed to be a destination for mail (such as the Mount Everest) IP addresses can be used as geo references in a way ● ● IP ranges are assigned to several operators which allows to assign at least a region servers or universities might be even more accurate (since they have a fixed location and IP) Swiss Postal Codes ● Nine postal districts ● Example: ● 3436 Zollbrück ● 3 = district (Berne) ● 34 = area (Burgdorf) ● ● 343 = route (Burgdorf - Langnau) 3436 = post office number (Zollbrück) [Source: http://en.wikipedia.org/wiki/Postal_codes_in_Switzerland_and_Liechtenstein] Commonly used Systems Cont Linear Referencing ● identification of location based on the distance to a defined point or reference along a defined path ● used e.g. to locate accidents ● used e.g. to identify locations on a highway ● ● lots of applications for GIS applications in transportation (GIS-T) and intelligent transportation systems (ITS) often difficult to implement e.g. if a street has several intersections with another street Street A Street B Commonly used Systems Cont Cadaster ● ● ● map of land ownership in an area could be the universal basis of mapping; all other geographical information could be bound to this identifier few people know the ID of their parcel => limited use in georeferencing Commonly used Systems Cont U.S. Public Land Survey System ● principal meridian = accurate north-south line ● east-west baseline laid out perpendicular to the principal meridian ● rows 6 miles apart and parallel to baseline = townships ● blocks in 6 miles by 6 miles squares on either side of the principal meridian = ranges ● reference of each square = township number, range number, east or west, name of principal meridian ● inside each township: 36 sections 1 mile by 1 mile; numbered using a standard system ● each section is divided into 4 quarter-sections of ¼ quarter mile (160 acres) = size of a nominal family farm ● since the Earth is not flat, rows must be offset regularly Conclusion Geo Referencing ● GIS allows to convert between projections and coordinate systems; further functions ● ● ● ● ● geocoding: assign coordinates to addresses combination of datasets that use different systems of georeferencing conversion to projections that meet the requirements for analysis search the Internet or other distributed data sources for additional data at specific locations http://geonames.usgs.gov ● geo referencing over the Internet Geo DB GIS Architecture Szenario: Dynamische Verkehrsinformationen als OGC Web Service für Earth Viewer, mobile Endgeräte und Desktop GIS Desktop GIS Intergraph, ESRI,... Earth Viewer Clients KML SOAP Webservice Webservices WMS Server ArcSDE Technology www.parkinfo.com Parkhausbelegung, Info, Preise ... [Quelle: Schilcher] Streckennetz, Level of Service Informationen Echtzeitverkehrsmodell AppServer Geo DB DB Rollenverteilung GIS & GeoDB ● ● ● ● Laden von Daten Editierung Kartierung Analyse GIS ● ● Geo DB (ORDBMS) Daten [Quelle: Longley et al] ● ● ● Speicherung Indexierung Sicherheit Abfrage (Query) Sicherung (Bkp) Modellierung (1) Abstraktion Definition of main objects to be represented in final GIS anwendungsabhängig systemunabhängig anwendungsabhängig Konzeptionelles systemorientiert Schema anwendungsabhängig (Datenmodell) systemabhängig Daten und Beziehungen ObjektAbbildung Logisches Modell Diagramme + Listen (Objektname + Interaktionen) Implementierung Physikalisches Modell Dateien/ DB Tabellen, Beziehungen und erlaubte Operationen Modellierung (2) Computer-Aided Design (CAD) Automating engineering design and drafting ●Used by the earliest GIS ●Used local coordinates instead of real-world coords ●No unique identifiers for objects ●Focus on graphical representation => no relationships Graphical (non-topological) Simple mapping and graphic arts ●Digitization of maps (very early GIS) ●Again no relationships or further object attributes image Image processing and simple grid analysis ●Main source: scanned aerial photos and digital satellite images ●Raster data Raster/grid Spatial analysis and modeling, especially in environmental and natural resource applications ●Raster fields may have attributes assigned (e.g. forest or no forest) ●Stored as grid with metadata ●Useful as background image Vector/ georelational topological Many operations on geometric features in cartography, socioeconomics, and resource analysis and modeling ●Precise ●Efficient storage network Network analysis in transportation and utilities ●Special applications ●Lines connecting two points might have special attributes such as flow direction ●Supports linear referencing Triangulated irregular network (TIN) Surface/ terrain visualization, analysis and modeling ●Number of sampled points can be adapted to the topology (more in case of a variable relief) ●Incorporate the sampled points → easy accuracy checks possible ●Efficient storage ●Can provide photorealistic views of landscapes object Many operations on all types of entities (raster/ vector/ TIN, etc) in all types of applications ●Most geographic objects have a lot of properties → not easy to capture with geometric models ●Geometry = one attribute of the object geometry-centric Example Application & Comments historic Data Model Compression of Raster Data ● ● ● run-length encoding ● simple and easy to use → widely used ● encode adjacent cells with the same value as a pair of values (nr of cells, value) ● loss-less block encoding ● two-dim version of run-length encoding ● areas of common cell values = single value ● array = series of square blocks of largest size possible ● sometimes described as quadtree structure ● loss-less wavelet compression ● ● remove information by recursively examining patterns in datasets at different scales → try to reproduce the original as closely as possible ● similar to JPEG ● lossy quadtrees (may also be used to index geographic data) ● subsequently divide the raster image into 4 squares of equal size until every square has homogenous attributes ● loss-less Real World Example A Water Facility Object Data Model House Main Meter Lateral pump Fitting Street Pump house Valve hydrant Real World Example A Water Facility Object Data Model House Main Meter Lateral pump Fitting Street Valve hydrant Pump house Main Meter Lateral Classify objects into landbase and water facilities pump Fitting Street Valve hydrant Real World Example A Water Facility Object Data Model ● Next step: Implement in DB :-) [Source: Longley et al] Datenhaltung (1) [Quelle: Schilcher] Datenhaltung (2) Dateisystem (duale Datenhaltung) Vorteile Nachteile Performance (Aktueller Zugriff auf Geometrie) bei wenigen Benutzern Hersteller-spezifische Speicherungsstrukturen Günstiger Preis Konsistenz zwischen Geometrie und Sachdaten nicht gewährleistet Kein spezielles DB-Know-How bzw. Datenbankadministrator keine echte Blattschnittfreiheit keine Transaktionsbearbeitung für Geometrie und Sachdaten keine Transaktionsbearbeitung für Geometrie und Sachdaten Grundlagen DBMS (1) ● Was ist ein Datenbanksystem? ● Ein Datenbanksystem ist ein Werkzeug zur Entwicklung von datenintensiven Anwendungen: – – grosser Datenbestand grosse Datenströme Grundlagen DBMS (2) ● Begriffsdefinitionen ● Datenbanksystem (DBS) = – ● Datenbank – ● Eine Sammlung gespeicherter operationaler Daten, die von Anwendungssystemen (z.B. GIS) benötigt werden. DBMS – ● Datenbank (DB) + Datenbankmanagementsystem (DBMS) Ein standardisiertes Softwaresystem zur Definiton, Verwaltung, Verarbeitung und Auswertung der Daten in der DB. Standarddatenbanken – hierarchisch, netzwerkartig, relational, objektrelational Grundlagen DBMS (3) ● Motivation für den Einsatz eines DBMS bzw. Geo-DBMS ● Typische Probleme bei Informationsverarbeitung ohne DBMS: – – – – – – – Redundanz und Inkonsistenz beschränkte Zugriffsmöglichkeiten Probleme beim Mehrbenutzerbetrieb Verlust von Daten Integritätsverletzung Sicherheitsprobleme hohe Entwicklungskosten für Anwendungsprogramme Modellierung (3) ● Konzepte der logischen Modellierung bei DBMS RDBMS ORDBMS OODBMS (ODBMS) relational objektrelational Objektorientiert Datenspeicherung in Tabellen Datenspeicherung in Tabellen und komplexen Objekten Datenspeicherung in Objekten Ursprünglich für Business (Banking) Apps optimiert Erweiterung von RDBMS, da diese weit verfügbar waren Konsistenz über Objektbeziehungen Konsistenz über Verknüpfungen zwischen Tabellen Konsistenz über Verknüpfungen zwischen Tabellen und Objekten Keine Abfragesprache nur Objektschnittstellen (Konzept der Kapselung) Abfragesprache SQL (ISOStandard) Abfragesprache SQL mit Erweiterungen (herstellerspezifisch) Haben sich nicht so richtig durchgesetzt Am wichtigsten im GIS Bereich Architekturen (1) ● Großrechner (Mainframes) ● Client-Server (PC-/Unix-Architektur) ● Multi-Tier Architekturen (Web-Architektur) ● Parallele Datenbanksysteme ● Verteiltes Datenbanksystem Architekturen (2) Client-Server Anwendungslogik Benutzeroberfläche Client Client Datenhaltung Datenbankserver Architekturen (3) Vorteile von Client/Server ● ● ● ● ● Skalierbarkeit: Clientrechner übernehmen einen Teil der Last – je mehr Nutzer desto mehr Clientrechner Verfügbarkeit: Hardware am Server kann redundant ausgelegt werden Sicherheit: Nur ein zentraler Punkt (Server) zu schützen Administrierbarkeit: Backups nur am Server Nachteil: Komplexität (Caching, usw.) und größere Netzwerklast Architekturen (4) Datenbanken im Internet (3-Tier-Architektur) [Quelle: Schilcher] Architekturen (5) Multi-Tier Architektur in der Praxis Ausgewählte Eigenschaften eines DBS (1) ● ● ● ● ● Einheitliche Sprache zur Datenmodellierung, -abfrage und -fortführung (SQL) Konzepte zur Datensicherheit: Zugangskontrolle (security), Recovery-Strategien (safety) und Integritätsprüfung (integrity) Konzepte der aktiven Datenbank (z.B. Trigger) Mechanismen zur Zugriffsbeschleunigung auf die Datenbestände (Index, Caching) Einheitliche Schnittstellen zum Datenzugriff von Applikationen (ODBC, JDBC, Perl-DBI, ...) Ausgewählte Eigenschaften eines DBS (2) Transaktion = zu Paketen zusammengefasste Anweisungen an die DB Transaktionen – das ACID-Prinzip ● ● ● ● Atomarität (Atomicity) - „Alles oder Nichts“ Konsistenz (Consistency) - Eine Transaktion schließt nur dann erfolgreich ab, wenn sie die DB in einem konsistenten Zustand hinterlässt. Isolation (Isolation) - Parallel ablaufende Transaktionen beeinflussen sich nicht. Dauerhaftigkeit (Durability) - Änderungen einer abgeschlossenen Transaktion sind gegen Systemfehler (Hardund Software) geschützt. Typisch für GeoDBs: lange Transaktionen Ausgewählte Eigenschaften eines DBS (3) ● ● Typisch für DBS: Speicherung großer Datenmengen Wichtig für Performanz: schnelles Auffinden bestimmter Datensätze ● Lösung in Datenbanksystemen: Index ● Unterscheidung aufgrund der Datentypen ● Index für alphanumerische Daten ● Index für räumliche Daten – – zweidimensional mehrdimensional Unterschiede zwischen StandardDBMS und Geo-DBMS Datenbank ≠ Geodatenbank DBMS ≠ Geo-DBMS Besondere Anforderungen von GIS an Geodatenbanken: ● ● ● ● Raumbezogene Daten (2D, 3D): Verwaltung in Standard-DB nicht möglich Räumlicher Zugriff: nicht möglich, erfordert Erweiterung der Abfragesprachen für „Spatial Data“ Große Datenmengen (v.a. durch Rasterdaten) Heterogene Geodaten (Vektor, Raster, Alphanumerisch, Topologien, Netzwerkstrukturen) ● Verknüpfung und Abfrage geometrischer und alphanumerischer Daten ● Lange Transaktionen (Erfassung und Fortführung in GIS) ● Performance für räumliche Abfragen und Analysen (räumliche Indizes) ● Neuester Trend: Integration räumlicher Operationen in das Geo-DBMS Datenhaltung (3) Geo-DBMS Vorteile Nachteile Integration von Geometrie und Sachdaten (entspricht konzeptioneller Modellierung Geoobjekte) hohe Investitionen bei Anschaffung und Pflege Echte Blattschnittfreiheit Schlechtere Performance ggü. Filebasierter Datenhaltung bei wenigen Benutzern Redundanzfreie Geometrie Standardisierte Anfragesprachen Mehrbenutzerzugriff geregelt Intelligente Caching-Algorithmen bei vielen Benutzern Datenhaltung (4) Vergleich Dateisystem / Datenbanksystem Dateisystem (Geo-) DBMS Performant bei wenigen Benutzern Performant bei vielen Benutzern Preis Konsistenz zwischen Geometrie und Sachdaten Kein spezielles DB-Know-How Blattschnittfreiheit Hersteller-spezifische Speicherungsstrukturen Transaktionsbearbeitung für Geometrie und Sachdaten Hersteller-spezifische Speicherungsstrukturen Feingranulares Sicherheitskonzept Spezielle Geo Funktionen und Methoden von DBs Beziehungen von Objekten ● equals ● disjoint ● intersect ● touches (intersection at boundaries) ● crosses (overlap, different dimensions possible) ● within ● contains ● overlaps (must be same dimension) ● relate (any intersections...?) Spezielle Geo Funktionen und Methoden von DBs Methoden auf Objekten ● Distance ● Buffer (all objects whose dist from an obj is <= given dist) ● convexhull (smallest polygon to enclose another geometry) ● intersection (points common to both geometries) ● union ● ● difference (points that are in base and not in comparison geometry) A-B symdifference (points that are in either of the geometry but not in both) DB Normalisierung ● improve stability and simplicity ● reduce redundancy ● split into subtables and rejoin at query time... can be computational expensive and is therefore often not done in GIS Geo Interop GeoWeb ● GIS are more and more distributed today and used on mobile devices or webbrowsers ● U = user ● D = where is the data stored ● P = where is the data processed ● S = area that is the focus of this GIS project U UDP S D S P Systemarchitektur Verkehrsinfosystem Desktop GIS Intergraph, ESRI,... Earth Viewer Präsentationsschicht WMS KML Appschicht KML Generator SOAP Parkinfo.com Matlab Verkehrsmodell Server ODBC ArcSDE Technology www.parkinfo.com Parkhausbelegung, Info, Preise ... [Quelle: Schilcher] Streckennetz, Level of Service Informationen Datenhaltungsschicht Begriffsbestimmung (1) ● Interoperabilität ● ● ● gegenseitige Inanspruchnahme von Dienstleistungen und Austausch von Daten über Schnittstellen Syntaktische Interoperabilität ● ● ● Fähigkeit von heterogenen Systemen zusammenzuarbeiten Struktur der Schnittstellen bzw. Datenformate (Syntax) ist zwischen beteiligten Systemen bekannt und nutzbar Voraussetzung für Interoperabilität im Allgemeinen Semantische Interoperabilität ● Bedeutung der Strukturen (Semantik) ist beteiligten Systemen bekannt und nutzbar Begriffsbestimmung (2) ● Service Orientierte Architektur (SOA): ● ● Bereitstellung fachlicher Funktionalitäten in Form von Diensten Im Allgemeinen: Verteiltes, heterogenes und lose gekoppeltes System. Begriffsbestimmung (3) Web Service: ● Softwarekomponente (für Inter- und Intranet), ● Funktionalität über Web-Schnittstelle nutzbar. Geo Web Service: ● Web Service zur Nutzung von Geodaten. Open Geospatial Consortium (OGC): ● ● internationales Standardisierungsgremium (Hersteller, Anwender, Hochschulen) Ziel: Interoperabilität zwischen heterogenen GI-Systemen durch Standards OGC Web Service: ● Geo Web Service mit Zugriffsschnittstelle gemäß OGC-Standard Standardisierungs-/ Normungsgremien im GIS-Bereich [Quelle: Schilcher] Systemarchitektur Verkehrsinfosystem - Standards Desktop GIS Intergraph, ESRI,... Earth Viewer KML Präsentationsschicht KML De-facto Std (Google/OGC) KML Generator SOAP Matlab Verkehrsmodell Parkinfo.com ODBC SOAP De-facto Std. (W3C) www.parkinfo.com Parkhausbelegung, Info, Preise ... [Quelle: Schilcher] SQL De-jure Std (ANSI/ISO) WMS WMS De-jure Std (ISO/OGC) Appschicht Server ODBC De-facto Std (Microsoft) ArcSDE Technology Streckennetz, Level of Service Informationen Datenhaltungsschicht Spezifikationen des OGC ● WMS - Web Map Service (Version 1.3) ● WMC - Web Map Context Documents (Version 1.3) ● SLD - Styled Layer Descriptor (Version 1.1) ● WFS - Web Feature Service (Version 1.1) ● FE - Filter Encoding (Version 1.1) ● GML - Geography Markup Language (Version 3.1.2) ● WCS - Web Coverage Service (Version 1.0) ● CAT – Catalog Services (Version 2.0) ● WSAS – Web Spatial Analysis Service (Entwurf TU München) ● WPS – Web Processing Service (Version 1.0) ● KML – Keyhole Markup Language (Version 2.2.0) Details unter: http://www.opengeospatial.org/specs/ Was ist WMS? ● ● ● ● ● ● Standard des OGC für Web Map Services grundlegenden Funktionen zum Generieren von Karten und Sachdatenanfragen hierzu: Unterstützung standardisierter Operationen ● getCapabilities ● getMap ● getFeatureInfo (optional) ● ... (optional) Version 1.0.0 im Jahr 2000 erstmals wirkliche Interoperabilität zwischen unterschiedlichen GIS auf Basis von Web Services. WMS im Detail 1. getCapabilities: ● ● Ermittelt die Fähigkeiten eines WMS-Servers (welches Gebiet, welche Themen, welche Datenformate, welche Koordinatensysteme) => Layertree im WMS Client wird automatisch generiert 2. getMap ● ● Fragt nach einem Kartenausschnitt mit Angabe von Gebiet, Themen, Koordinatensystem und Datenformat => Grafikbild wird aufgebaut 3. getFeatureInfo ● ● Fragt nach Eigenschaften aller Features, die in einem Gebiet liegen und zum angegebenen Thema passen => Sachdaten werden angezeigt WFS – die Schnittstellen Web Feature Service Implementation Specification: ● ● lesender und schreibenden Zugriff auf Geodaten auf der Ebene von Geoobjekten (sog. Features). Operationen: – GetCapabilities: ● – DescribeFeatureType: ● ● – Fähigkeiten des Web Feature Servers Beschreibung eines Objekttyps (welche Attribute hat das Objekt, welche Datentypen haben die Attribute) Transferformat der Beschreibung: XMLSCHEMA GetFeature: ● ● Liefert Vektordaten (Transferformat GML) Auswahl der Daten über sog. Filter gemäß OGC Filter Encoding Unterscheidung WMS, WFS ● ● WMS beschränkt die Interoperabilität auf grafikorientierte Auskunftslösungen WFS überwindet diese Grenzen in Richtung Objektlogik, Sachdaten und Schreibzugriff (objektstrukturiert) <gml:featureMember> <gmgml:Beleuchtung fid="Beleuchtung.167"> <gmgml:PktAnfLfdNr>6110169</gmgml:PktAnfLfdNr> <gml:LineString srsName="EPSG:31467"> <gml:coordinates>3476917.975,5367569.196 3476918.322,5367568.68 </gml:coordinates> </gml:LineString> </gmgml:Geometry2> </gmgml:Beleuchtung> </gml:featureMember>