Datenarten und Dimensionen Prof. Dr.-Ing. Ralf Bill Professur für Geodäsie und Geoinformatik Agrar- und Umweltwissenschaftliche Fakultät Universität Rostock GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik Anliegen Wie lässt sich die reale Welt und ihre Probleme im Rechner abbilden? Klärung der wesentlichen Datenarten in der Geoinformatik Klärung der Dimensionen in der Geoinformatik GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 2 Inhalte Abbildung der realen Welt im Computer Anwendungsschema Geoobjekt Datenarten Geometrie Topologie Thematik Dynamik Graphikbeschreibung Vektor-, Raster- und hybride GIS Dimensionen Geometrie Topologie Zeit Thematik (Geo-)Objekt und Objektklasse Objektklasse Ebenen GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 3 Abbildung der realen Welt im Computer GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 4 Abbildung der realen Welt Ausschnitt reale Welt (Anwendungssicht) (Universe of discourse) Bedeutungsvolle Objektklassen in realer Welt Anwendungsschema Logisches Schema aus Datenbanksicht Gebäude 125 Gebäude 3 Parzelle .. Gebäude Parzelle .. 125 1 Wohngebäude Nutzgebäude Anwendungsschema: Konzeptuelles Schema für Daten, die von einer oder mehreren Anwendungen benötigt werden. Liefert formale Beschreibung für Datenstrukturen/Dateninhalte in einer oder mehreren Anwendungen. Zweck ist es, ein gemeinsames und einheitliches Verständnis der Daten zu erreichen. Schema: Anschauliche (bildliche) Darstellung des Wesentlichen eines Sachverhalts. Ergebnis der darstellenden und/oder lexikalischen (textlichen) Beschreibung eines Modells mit Hilfe einer (normierten) Modellierungssprache. GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 5 Geoobjekt Unter einem Geoobjekt (engl. spatial feature oder spatial object, deutsch auch raumbezogenes oder räumliches Objekt genannt) wird eine aus Nutzersicht in einem GIS enthaltene und für seine Arbeit bedeutsame Einheit verstanden, welche mittels Geodaten eindeutig beschreibbar, in der Realität identifizierbar und referenzierbar ist. Geoobjekt stellt i.d.R. das Abbild einer konkreten physisch, geometrisch oder begrifflich begrenzten Einheit der Erde dar, ist in dem Sinne also ein Unikat in der realen Welt und besitzt eine eindeutige Identität. Ein Geoobjekt kann elementar oder beliebig komplex zusammengesetzt sein und sowohl eine quantitative (z.B. geometrische) als auch eine qualitative (z.B. thematische) Komponente aufweisen. Jedes Geoobjekt kann einer bestimmten Objektklasse zugeordnet werden. Quelle: vgl. ISO 19109 resp. Definition 1.10 aus R. Bill (2016), Seite 18-19 GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 6 Geoobjekt besitzt Objektidentifikatoren (Schlüssel) GM_Objekt Geometrische Eigenschaften Topologische Eigenschaften Thematische Eigenschaften Temporale Eigenschaften TP_Objekt Geometrie Topologie Geoobjekt Thematik FM_Objekt Metainformationen Objektzugehörigkeit Dynamik TM_Objekt MD_Objekt Metadaten Graphische Ausprägung GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 7 Geoobjekt „Gebäude“ Datenmodellierung am Beispiel Gebäude Haus { ObjektID + Geometrie (Koordinaten des Umringpolygons in 2 D) + Topologie (ist vom Typ Masche in 2 D, hat Nachbargebäude) + Thematik (hat Besitzer, Anzahl Stockwerke, Zweck, Wert) + Dynamik (Baujahr) Haus + Metainformation (Ersteller, Datum, ..) + gehört zur Klasse „Gebäude“ } Darstellungsmodellierung am Beispiel Gebäude Haus { hat Graphikbeschreibung (schwarzer Umring, flächig schraffiert) zur Visualisierung in einer Karte } GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 8 Diskrete oder kontinuierliche Geoobjekte Diskrete Phänomene: Objekte mit wohldefinierten Abgrenzungen und räumlicher Ausdehnung z.B. Gebäude, Parzellen und Straßen. Vektordaten Kontinuierliche Phänomene variieren im Raum und sind i.d.R. nicht scharf abgegrenzt z.B. Bodenarten, Temperaturverteilungen oder Geländeoberflächen. Felder (Coverages) können beschrieben sein: diskret: - in Form von Dreiecken, Gitterzellen (=> Rasterdaten) - oder Tesselationen (wie z.B. Thiessen-Polygonen) kontinuierlich: - in Form von Funktionen (z.B. Interpolationsfunktionen), die räumliche Positionen mit Attributwerten z.B. bei Trendoberflächen verbinden. GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 9 Von der realen Welt zum Modell im Computer Reale Welt Abstraktion Informationsorientiert Datenmodell Prozessmodell Ebenen Objektklassen Eigenschaften Funktionen Abläufe Analysen Aufgabenorientiert Interpretation Präsentation Darstellungsmodell Symbolik GI-DatenDimensionen Zeichenvorschriften Planwerke UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 10 Von der realen Welt zum Modell im Computer Vermessung Photogrammetrie Kartographie REALE WELT Vermessung Photogrammetrie KARTE KARTE Digitalisierung GIS Verarbeitungsund Präsentationsformen GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK ANALYSE ABFRAGE BERICHT 11 Datenarten GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 12 Geometrie versus Topologie Geometrie Topologie z.B. in Form des Stadtplans z.B. in Form des Verkehrsverbundplans GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 13 Geometrie benennt sämtliche geometrischen Elemente wie Punkte, Linien, Flächen, Raster, ist in einem Koordinatensystem definiert und beschreibt Form und Lage von Objekten, kommt sowohl analog als auch digital in Vektor- und Rasterform vor. Der Punkt ist Träger der geometrischen Information. Mathematisches Gerüst: Computergeometrie GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 14 Geometrie – Raster- versus Vektordaten Rasterdaten Vektordaten nach Objektlinien geordnet gute logische Strukturierung bekannte Akquisitionsmethoden kleine Datenmengen Element Vektor Digital Analog Raster Digital Punkt x,y-Koordinaten Pixel Linie x,y-Koordinatenfolge Pixel Fläche geschlossene x,y-Koordinatenfolge Pixel Körper Randflächenrepräsentation GIDatenDimensione geordnet nach Lage beschränkte logische Strukturierung leichte Datenakquisition große Datenmengen Analog Voxel UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 15 Vektor – unterschiedliche Repräsentationen Ein Vektor x ist ein Element des mehrdimensionalen Raumes und repräsentiert durch seine Komponenten x1, x2, x3 ein sogenanntes Zahlentupel. Beispiel 3D-Vektor: Zeilendarstellung x Spaltendarstellung x1 xx x 1 2 3 Indexschreibweise: x x : xi i 123 x2 x3 Realisierung in Java-Code: Graphische Repräsentation Speicherung der Vektorkomponenten in einem Feld (Array). Achse 2 x1 public double [ ] setVector (double x, double y, double z) { double [ ] vector = new double [3]; // Array einrichten vector [0] = x; // Komponente x zuweisen vector [1] = y; // Komponente y zuweisen vector [2] = z; // Komponente z zuweisen return vector; // Array übergeben } x x2 Achse 1 Quelle: modifiziert nach Zimmermann (2012) GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 16 Raster – unterschiedliche Repräsentationen Ein Raster R (Weite, Höhe) ist vollständig definiert durch: Rasterweite: Anzahl der Pixel in x-Richtung Rasterhöhe: Anzahl der Pixel in y-Richtung ein Datenfeld mit (Weite x Höhe) Einträgen (z.B. Integerwerte) Ein Raster besitzt einen Eintrag für jedes Pixel im Raster. Indexschreibweise: Ri,j {i=1,Weite, j=1,Höhe} Graphische Repräsentation j=1, Höhe i=1, Weite 12 13 16 12 02 17 27 21 Ri,j 33 26 71 23 23 23 31 21 53 08 11 15 08 01 88 GI-DatenDimensionen Realisierung als Java-Klasse: class Raster { protected int Weite; protected int Höhe; protected int[] Data; public Raster(int width, int height) { Data = new int[width*height]; ... } public int getPixel(int x, int y) { return Data[y*Weite+x]; } public void setPixel(int pixelValue, int x, int y) { Data[y*Weite+x] = pixelValue; } ... }; UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 17 Topologie benennt topologische Elemente wie Knoten (0-Zelle), Kanten (1-Zelle) und Maschen (2-Zellen), beschreibt koordinatenfreie Geometrie, sogenannte Nachbarschaftsbeziehungen und ist gegenüber topologischen Transformationen invariant. Kante ist Träger der topologischen Information. Mathematisches Gerüst: Topologie, Graphentheorie Geometrisch ungleich Topologisch gleich 2 1 a 4 GI-DatenDimensionen 5 b 125 f g 6 2 c 126 e 1 b d 3 c 5 d a 125 4 f 126 g 6 UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK e 3 19 Thematik benennt sämtliche nichtgeometrischen Elemente wie Texte, Zahlensammlungen, Messwerte, Medien etc. Ist in einem fachspezifischen Zusammenhang zur Erledigung fachspezifischer Aufgaben erhoben. Kommt sowohl analog als auch digital vor. Alternative Bezeichnungen: Sachdaten, Attribute, beschreibende Daten Mathematisches Gerüst: Mengenlehre, Relationale Algebra. Analog .. Karteien Protokolle Notizen Akten Punktnummer 128 GI-DatenDimensionen Straßenname Parzellennr. Grauwerte 128/1 64=belegt 64,126,32=Wald UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK Digital .. Datenbanken Informationssysteme Dateien 20 Zeit und Dynamik Zeitliche Bezugssysteme Beispiel Gregorianischer Kalender: 11.02.2016 Uhrzeit: 13:56 MEZ = 12:56 UTC Unix-Zeit: 1455195361 sec Neuzeit/Jetztzeit Kalender-/Uhrzeitsysteme Temporale Koordinatensysteme Temporale Ordinalsysteme Zeitangaben kontinuierlich Jahrmillionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK langsame Ereignisse Jahre GI-DatenDimensionen Monate Zeitbasierte Ansätze Veränderungsbasierte Ansätze mittlere Tage - schnelle Stunden Dynamisches Objektverhalten diskret Sekunden Zeitliche Dynamik Zeitachse Jahrtausende (Geo-)Objekt ist eine Ereignis (Geo-)Objekt findet zu einem Zeitpunkt statt und hat evtl. eine gewisse Zeitdauer (Geo-)Objekt besitzt Zeitstempel Zeitliche Dimension Anwendung 21 Graphikbeschreibung Graphikdaten = Geometriedaten + graphische Beschreibungselemente Hintergrund: Kartographie und Visualisierung. Objektdarstellung wird bestimmt durch: Datentyp (quantitativ, qualitativ) Geometrietyp (Punkt, Linie, Fläche) passende Darstellungsmethode Festlegung der Gestaltungsparameter, z.B.: - für punktförmige Kartenzeichen: Größe, Farbe, Form - für linienförmige Kartenzeichen: Linienbreite, -struktur, Farbe - für flächige Darstellungen: Farbe, Füllmuster, Konturlinie GI-DatenDimensionen - wird aus Geometriedaten durch Hinzufügen von graphischen Beschreibungsinformationen wie Symbolen, Schraffur, Grauwerte etc. - findet sich in analoger Form z.B. als Karte und in digitaler Form z.B. als Bildschirmgraphik. - ist in der Regel noch um das Element Text ergänzt, da sie sich an den Darstellungselementen der früheren graphischen Standards orientiert. UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 23 (Geo-)Objekt und Objektklasse GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 24 Objekt Objektklasse Objektklasse/Objektarten Objekt (Geoobjekt) ist eine individuelle Ausprägung (Unikat) einer Objektklasse, ist ein konkreter geometrisch begrenzter Gegenstand der Natur, ist DB-technisch gesprochen eine Instanz. Objektklasse: Wald Objektklassen-ID 3321 GI-DatenDimensionen Topologietyp Fläche hat evtl. einen Objektartencode, besitzt topologischen Typ (Knoten, Kante, Fläche), benennt charakteristische Attribute (z.B. Baumart), legt deren Domäne (Eiche, Buche, Kastanie ..), Form (char ..) und Status fest und definiert mindestens eine Darstellungsart (graphische Präsentation). Graphikbeschr. Grün, gefüllt Attributdefinition/Domäne Laubwald Nadelwald .. UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK Aufforstungsjahr 25 Objektinformation im GIS In der Objektklasse: Nadelwald einzelnes (Geo-)Objekt Geometrie (x1,y1,z1, x2,y2,z2, …,…,…, xn,yn,zn, x1,y1,z1) Objektidentifikator 71 Topologie Fläche - 2-Zelle Nachbarzellen (Zeitmarke) Graphische Beschreibung Symbol Umring Attribute Baumart Aufforstungsjahr Datenmodellierung in objektorientierter Datenbank Objektklasse definiert Relation/Tabelle Nadelwald => 1 (Geo-)Objekt = 1 Zeile (Tupel) Nadelwald {ID, GEOMETRIE, TOPOLOGIE, GRAPHIK, Baumart, Aufforstungsjahr} 1 (Geo-)Objekt GI-DatenDimensionen 71 BLOB 83 BLOB ... ......... Fläche Fläche ........ grün gelb .......... Tanne Kiefer ...... UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 1965 1872 ....... 26 (Geo-)Objekt wird beschrieben durch einen Objektidentifikator, wird durch seine Geometrie in sich und als Objekt in einem gegebenen Koordinatensystem eindeutig festgelegt, wird durch seine Topologie als Objekt zu seinen Nachbarn eindeutig festgelegt, wird durch eine Zeitmarke zeitlich fixiert und wird durch thematische Daten (Attributausprägungen) fachlich näher beschrieben. Objektidentifikator realisiert den umkehrbar-eindeutigen Zugriff auf ein individuelles Objekt und sollte zur EDV-technischen Verarbeitung geeignet sein. GI-DatenDimensionen Reale Welt Abbild Krähenwald 71 UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 27 Ein Objekt – verschiedene Sichten Raster Vektor Objektklasse: Nadelwald Geometrie Objektidentifikator Topologie (Fläche - 2-Zelle, Nachbarzellen) (x1,y1,z1, x2,y2,z2, .. .. .. xn,yn,zn, x1,y1,z1) Graphische Beschreibung 71 Symbol Umring y x Sachdaten GI-DatenDimensionen Vermessung .. Fläche Eigentümer Arten .. Forstwesen .. Arten Alter Aufforstungsjahr .. Naturschutz .. Pflanzenvielfalt Artenvielfalt Erholungscharakter Schutzstatus .. UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK Verschiedene Sichten auf die reale Welt 28 Objektklassen definieren welche Arten von Objekten in der fachlichen Sicht der realen Welt vorkommen durch welche Attribute, die für alle Objekte dieser Art gelten, diese in ihrer Charakteristik beschrieben sind und welche Ausprägungen (Domäne) diese Attribute annehmen können. Objektklassencode/-ID dient primär der IT-mäßigen Vereinfachung (sortierbar, speichersparend) und ist i.d.R. ein numerisches oder alphanumerisches Kürzel. Objektartenkatalog ist die katalogisierte Sammlung aller definierten Objektarten und evtl. in Objektgruppen (Vegetationsfläche) und Objektbereiche (Vegetation) weiter hierarchisch gegliedert. GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 29 Auszug aus dem AAAObjektartenkatalog Objektartenbereich 60000 Relief Objektartengruppe 61000 Reliefformen 62000 Primäres DGM 63000 Sekund. DGM GI-DatenDimensionen Objektarten 61001 Böschung, Kliff 61002 Böschungsfläche 61003 Damm, Wall, Deich 61004 Einschnitt 61005 Höhleneingang 61006 Felsen, Felsblock, Felsnadel 61007 Düne 61008 Höhenlinie 61009 Besonderer topograph. Punkt 61010 Soll 62010 Unregelm. vert. Geländepunkte 62020 Strukturiert erf. Geländepunkte 62030 Nicht-Geländepunkte 62040 Geländekante 62050 Gewässerbegrenzung 62060 Geripplinie 62070 Markanter Geländepunkt 62080 Aussparungsfläche 62090 Besonderer Höhenpunkt 63010 DGM-Gitter 63020 Abgeleitete Höhenlinie UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 30 Ebenenmodell (Layer- oder Folienprinzip) Natürliche Gewässer Siedlungen Verkehrswege Nutzungsarten Niederschlag Reale Welt GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 31 Vektor-/Raster-/Hybride GIS GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 32 Vektor-GIS 12 125 1 14 15 Aufwendige Datenerfassung Bestimmte Berechnungen sehr 125 2 zeitintensiv Probleme in relationalen Datenbanken 126 16 Nachteile : 18 125 3 aße ptstr Hau Punkte, Linien, Flächen als 2DKoordinatenfolge 17 Geometrie in Vektorform 125 4 Vorteile: Daten nach Objektbedeutung getrennt Objektbezug sehr einfach Topologische Strukturierung Geringe Datenmengen GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 33 Raster-GIS Geometrie in Rasterform Pixel Vorteile : Einfache Datenerfassung Unstrukturierte (dumme) Daten Probleme in relationalen Datenbanken Flächenhafte Betrachtungsweise Nachteile: Große Datenmengen i.d.R. hoher Rechenaufwand Keine logische Datenstrukturierung Kein Objektbezug GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 34 Hybride GIS Geometrie in Vektorform Punkte, Linien, Flächen als 2DKoordinatenfolge Geometrie in Rasterform Pixel Vorteile: Vektor-Rasterkonversion gelöst Matrixanordnung und topologische objektbezogene Strukturierung Vorteile beider Datenarten in Auswertung kombinierbar Nachteile: Raster-Vektorkonversion und Objekterkennung ungelöst Große Datenmengen Getrennte Datenhaltung GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 35 Raster-Vektor Vektor-Raster Probleme der Datenkonvertierung Vektordaten GI-DatenDimensionen unproblematisch Rasterdaten UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 36 Dimensionen GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 38 Geometrische Dimensionen 2D - Planimetrie 2D+1D - Planimetrie + DGM (keine Verknüpfung Lage und Höhe) 2.5D - x,y,z 527.0 125 125 3 125 125 125 1 1 125 2 3D-Linienmodell 125 125 125 4 2 4 (Planimetrie+DGM verknüpft) 3D-Flächenmodell 524.9 1 525.2 GI-DatenDimensionen 125 3 3 125 2 524.9 125 4 3D-Volumenmodell UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 39 Topologische Dimensionen Knoten 0-Zelle Kante Masche 1-Zelle Körper 2-Zelle B B A 3-Zelle C F I A A E V H D A GI-DatenDimensionen G UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK D 40 Natürliche Gewässer Siedlungen Verkehrswege Nutzungsarten 5-dimensional Thematische Dimensionen Niederschlag Reale Welt GI-DatenDimensionen UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 41 Temporale Dimension Zeit wird als eigenständige Dimension eindimensional (1DZeit, t) betrachtet. Kombiniert mit dem Raum entsteht die vierdimensionale Raumzeit (4D-Zeit, (x; y; z; t)) In der Praxis unterscheidet man: 2D+Zeit (x; y; t) 2,5D+Zeit (x; y; z = f(x,y); t) 3D+Zeit = 4D (x; y; z; t) GI-DatenDimensionen Zeitachse Zeitstrahl Relativitätstheorie Beispiel für Geoobjekte Liegenschaftskataster Archäologie Geologie, Umwelt UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK 42 Selbststudium GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 43 Literaturhinweis Bücher: Bill (2010): Kapitel 1.3, 1.4, 1.5 de Lange (2005): Kapitel 5.1 Bartelme (2005): Kapitel 1.4, 3, 4 Podcasts: GIS-Grundlagen GI-DatenDimensionen UNIVERSITÄT ROSTOCK, Professur für Geodäsie und Geoinformatik 44