Friedrich-Schiller-Universität Jena Institut für Geografie HS Analyse und Modellierung räumlicher Daten Seminarleiter: Dr. Martin Herold WS 2004/2005 Hausarbeit zum Thema: GIS Funktionalität I: Distanz- und Bufferanalysen Vorgelegt von: Jan Böttger Bonhoeffer Straße 19 07747 Jena [email protected] Abgabe: 12.11.2004 Gliederung 1 Einleitung 2 2 Fallbeispiel 2 3 Modellierung von Graphen 3 3.1 Formen von Graphen 3 3.2 Gewichtung von Graphen 4 4 Shortest-Path-Algorithmen 6 4.1 Dijkstra Algorithmus 6 4.1.1 Ausführung 7 Floyd Algorithmus 9 4.2 5 6 Distanzanalysen im Netzwerk 9 5.1 Ermittlung von Einzugsgebieten 10 5.2 Das Rundreiseproblem 10 Bufferung 11 6.1 Zonengenerierung im Vektormodell 12 6.2 Zonengenerierung im Rasterdatenformat 13 7 Zusammenfassung 14 8 Literatur 15 1 1 Einleitung Distanzanalysen gehören zu den wichtigsten Anwendungen von Geoinformationssystemen. Vor allem Algorithmen zur Berechnung kürzester Wege sind in der Praxis nicht mehr wegzudenken. Eine andere Form von Distanzanalysen stellt das Generieren von Abstandszonen (sog. buffering) dar. Einem GIS steht dafür ein vielfältiges methodisches Repertoire zur Verfügung (CASTLE 1993:26). In dieser Arbeit werden anfangs die graphentheoretischen Grundlagen dargestellt, um anschließend die häufigsten Algorithmen herleiten zu können. Die Anwendungen solcher Algorithmen werden dann am Beispiel eines Netzwerkes vorgestellt. Im letzten Kapitel wird die Modellierung von Pufferzonen abgehandelt. Zunächst jedoch soll ein Fallbeispiel die Problematik – welche nicht nur dem GIS- Nutzer vorbehalten ist – verdeutlichen. 2 Fallbeispiel Eines der ältesten Modelle, bei dem es zur Anwendung raumbezogener visueller Analysemethoden kam, stammt aus dem Jahre 1854. Im Londoner Stadtteil Soho breitete sich eine Cholera Epidemie aus, deren Ursprung zunächst unbekannt war. Der Anästhesiearzt Dr. John Snow erstellte eine Karte, auf der die Wohnorte von 500 an Cholera erkrankten Patienten eingetragen wurden. Aufgrund der ungleichen Verbreitung der Epidemie vermutete Snow, dass die Übertragung nicht durch die Luft sondern durch die Wasserversorgung stattfand. Durch das zusätzliche Eintragen der Wasserpumpen in die Straßenkarte konnte die Quelle des verunreinigten Wassers ermittelt werden (www.jsi.com). Abb.1: Verbreitung der Cholera. Quelle: www.jsi.com 2 Abb. 1 zeigt das Einzugsgebiet der Wasserpumpe. Es fällt auf, dass entlang der Straßen, welche direkt mit der Broad Street verbunden sind, die Verbreitung besonders stark war. Auch gab es Erkrankte, die viel näher an anderen, nicht verunreinigten Pumpen wohnten. Dr. Snow beachtete, dass die Menschen das Wasser in Eimern durch die Straßen tragen mussten. Dadurch war für die Analyse nicht die tatsächliche Entfernung zu nächsten Wasserpumpe relevant, sondern vielmehr die kürzeste Verbindung entlang der Straßen (LONGLEY ET AL 2001:279). Diese Methodik der Distanzanlyse, die von Dr. Snow hier erstmals angewandt wurde, findet in den heutigen Geoinformationssystemen eine breite Anwendung. Als die verseuchte Pumpe identifiziert wurde, demontierte Dr. Snow diese eigenhändig. Auch diese Aufgabe kann ein GIS übernehmen. Moderne Wasserwerke sind mit den im Land verteilten Pumpstationen und Wasserrückhaltebecken über ein GIS verbunden. Werden bei den automatischen Messungen Schwellwerte überschritten wird die Wasserversorgung selbständig unterbrochen. Darüber hinaus berechnet das GIS eine alternative Wasserversorgung für das Einzugsgebiet der gesperrten Pumpstation. 3 Modellierung von Graphen Straßenkarten, wie die von Dr. Snow werden in der Graphentheorie als plättbare Flächenmodelle bezeichnet. Sie sind auf einer Ebene abgebildet und bestehen aus einem planaren (plättbaren) Graph, der mit Punkten und Linien dargestellt werden kann (BILL 1999:257). Die Punkte werden als Knoten bezeichnet, die Linien sind Kanten. Ein Knoten wird als die Stelle definiert, in der eine Kante beginnt oder endet. Eine Kante ist somit die Verbindung zwischen zwei Knoten und bildet im Flächenmodell die Grenze. Die Ebenen zwischen Grenzen sind die Maschen. Flächen, die nicht durch die Kanten eingegrenzt werden, gehören zum äußeren Gebiet. 3.1 Formen von Graphen Das Einzugsgebiet im Fallbeispiel wurde durch die Laufwege bestimmt, indem die einzelnen Straßenabschnitte zwischen den Kreuzungen und Abbiegungen aufaddiert wurden. Der Weg in einem endlichen Graphen ist somit eine zusammenhängende Folge von Kanten, die von einem Knoten zu einem anderen Knoten führt (BILL 1999:255). In einem zusammenhängenden Graphen sind zwei verschiedene Knoten über mindestens einen Weg erreichbar. Nicht zusammenhängende Graphen weisen Unterbrechungen auf, so dass zwei verschiedene Punkte nicht durch einen Weg erreicht werden können. Weiterhin unterscheidet man zyklische, ausschließlich zyklische und nicht zyklische Graphen. Zyklische Graphen bestehen aus Schleifen. Zwischen zwei Knoten gibt es hier mehrere Wege und ein Knoten kann auf einem Weg sowohl Ausgangs- als auch Endpunkt sein. Bei einem Graphen, der nur aus Schleifen besteht, gilt dies für jeden Knoten. Zusammenhängende Graphen, die keinen Zyklus aufweisen, werden als Baum bezeichnet (DE LANGE 2002:94). In Abb. 2 sind die wichtigsten Graphen abgebildet. 3 Abb.2 Typen von Graphen (DE LANGE 2002:94) Die Graphentheorie ist die Grundlage für auf Vektordaten basierender Geoinformationssysteme. Vektoren sind Teilabschnitte des Graphen und repräsentieren die Kanten. Jedem Vektor ist eine Richtung zugeordnet, d.h. er hat einen Anfangs- und Endpunkt. Wie sich in den folgenden Kapiteln herausstellen wird, ist ein GIS in der Lage jedem Kanten und Knoten Attributwerte zuzuordnen. Diese Informationen können im einfachsten Fall Entfernungen oder Zeiteinheiten zwischen zwei Knoten darstellen. 3.2 Gewichtung von Graphen Ein raumbezogenes Objekt besteht aus einer Menge von Kanten (E) und einer Menge von Knoten (V). Weiterhin wird das Objekt durch die Anzahl der Polygone (P) und Volumenkörper charakterisiert. Dieser Zusammenhang kann durch die Euler- Konstante dargestellt werden (DE LANGE 2002:95). Gilt die Gleichung 2 = V – E + P, besteht das Flächenmodell aus einem zusammenhängenden planaren Graphen (G). Ein solcher Graph ist in Abb. 3 dargestellt worden. Neben der Richtungsangabe, erhält jede Kante einen Gewichtungsfaktor von p = 1 bis p = 7. In diesem einfachen Modell entspricht der Gewichtungsfaktor der Entfernung zwischen zwei Knoten. In der Praxis (z.B. auf Karten) sind solche Attribute jedoch weitaus differenzierter (CASTLE 1993:26). Abb.3 gewichteter Graph. Bearbeitet nach BILL (1999:29). 4 Zur analytischen Betrachtung wird die visuelle Darstellungsform in einer Matrix repräsentiert. Die gewichtete Bewertungsmatrix (Tab.1a) resultiert aus einer Knoten- Kantendarstellung, in der jeder Kante einen Anfang- bzw. Endknoten zugeordnet wird. Die Anfangsknoten werden in den Zeilen (jn), die Endknoten in den Spalten (in) abgelesen. Ein Gewichtungsfaktor von p = 0 bedeutet, dass zwischen diesen beiden Punkten in diese Richtung keine Verbindung besteht. In der Inzidenzmatrix (Tab.1b) werden die Beziehungen zwischen verschiedenen Elementen des Graphen dargestellt, d.h. zwischen Kanten und Knoten. Eine Kante ist z.B. inzident mit ihrem Anfangs- und Endknoten. In der abgebildeten Matrix erhält der Anfangsknoten einer Kante die Zahl 1. Der Endknoten wird durch -1 markiert und nicht inzidente Knoten bekommen den Wert 0. Beziehungen zwischen zwei Knoten eines Graphen werden Adjazenz genannt und in einer Knotenadjazenzmatrix (Tab.1c) dargestellt. Sie beschreibt das Aneinandergrenzen, Berühren oder Verbunden sein gleichartiger Strukturelemente eines Graphen. Adjazenz liegt z.B. dann vor, wenn zwei Knoten über eine Kannte verbunden sind oder wenn zwei Kanten sich an einem Knoten treffen. Die Hauptdiagonale der Matrix zeigt die Anzahl der Kanten, die vom jeweiligen Knoten ausgehen. Der Endknoten für die Kante wird mit dem Wert -1 gekennzeichnet (BILL 1999:29). Bewertungsmatrix A B C D E A 0 0 0 0 3 B 7 0 0 0 0 C 0 0 0 5 1 D 6 0 0 0 2 Inzidenzmatrix E 0 1 0 0 0 1 2 3 4 5 6 7 A 1 1 0 -1 0 0 0 B -1 0 1 0 0 0 0 C 0 0 0 0 -1 0 -1 D 0 -1 0 0 0 -1 1 Adjazenzmatrix E 0 0 -1 1 1 1 0 A B C D E A B 3 -1 -1 2 0 0 -1 0 -1 -1 C 0 0 2 -1 -1 D -1 0 -1 3 -1 E -1 -1 -1 -1 4 Tab.1a,b,c: Matrixdarstellungsformen. BILL (1999:29). Diese topologischen Beziehungen dienen dem Geoinformationssystem als Grundlage für die Berechnung kürzester Wege. Die Algorithmen im folgenden Abschnitt müssen in jedem Schritt auf solche Matrizen zurückgreifen können, damit zunächst potentielle, anschließend optimale Wege zwischen den Knoten gefunden werden können. 5 4 Shortest-Path-Algorithmen Die Aufgabe der Bildverarbeitung besteht darin, aus den gegebenen Geobasisdaten Informationen für den Nutzer des GIS abzuleiten. Erst durch die Zusammenführung metrischer und topologischer Eigenschaften von Objekten sind Berechnungen möglich. Ein GIS ist dadurch in der Lage Distanzanalysen zwischen verschiedenen Objekten durchzuführen. Durch die große Anzahl endogener und exogener Parameter sind solche Berechnungen sehr komplex. Endogene Parameter stellen jene Variablen dar, die vom Modell selbst erklärt werden können. Die Modellierung der exogenen Parameter stellt sich weitaus komplizierter dar und gestaltet sich je nach Problemstellung unterschiedlich. Die Analysen dieser Variablen können empirisch oder algebraisch erfolgen. Die Ergebnisse fließen oft als Restriktionen (Widerstandswerte) in das Modell mit ein und können somit Einfluss auf die Gewichtung der einzelnen Elemente (Kanten oder Knoten) nehmen. Für eine effiziente Verarbeitung dieser Informationen bedient sich das GIS unterschiedlicher Algorithmen. Nach DE LANGE (2002:81) ist ein Algorithmus „[…] eine allgemeine Berechnungsvorschrift zur Lösung eines Problems, die sich aus mehreren elementaren Schritten zusammensetzt, die in einer festen Reihenfolge ausgeführt werden müssen“. Mit zunehmender Komplexität des Algorithmus steigt auch die Anforderung an die Hardwarekomponete, Rechenzeitaufwand und Speicherbedarf. In den folgenden Abschnitten werden daher nur sehr einfache Modelle betrachtet. Die Widerstandswerte zwischen zwei Knoten werden nur durch die Distanz bestimmt und sind in beide Richtungen identisch. 4.1 Der Dijkstra Algorithmus Zu den bekanntesten Methoden zur Berechnung kürzester Wege gehört der Algorithmus von Dijkstra. Dieser ermittelt die kürzesten Wege von einem bestimmten Startkoten zu allen anderen Knoten des zusammenhängenden, gewichteten Graphen. Vom Startpunkt ausgehend, wird in jedem Schritt ein neuer Knoten ermittelt, der anschließend der Route hinzugeführt wird. Dabei resultiert die (konstante) Gesamtmenge aller Knoten V aus der Addition folgender drei Teilmengen (LANGE W. & D. EXNER 2004): - Menge der Knoten T, die schon zur Route dazugehören - Menge der von Kandidaten K, die einem Knoten der Route benachbart sind, aber noch nicht zur Route hinzugehören. - Menge der unberücksichtigten Knoten Die Aufgabe besteht nun darin, alle Kandidaten K abzufragen und den günstigsten Knoten in die Route zu integrieren. Hierbei nimmt der Gewichtungsfaktor einer Kante (zwischen potentiellen- und bereits ausgewählten Knoten) eine wichtige Rolle ein. Dieser Gewichtungsfaktor wird mit dem Abstand des ausgewählten Punktes zum Startpunkt S addiert. Hinzugeführt wird der Knoten, der den geringsten Betrag ergibt. Das folgende Beispiel illustriert diesen Sachverhalt (Abb.4): Ausgehend vom Startpunkt (0) hat der 6 Algorithmus bereits eine Route konstruiert (fette Linie). Der Gewichtungsfaktor einer Kante entspricht hier der Entfernung zwischen zwei adjazenten Knoten. Die Knoten sind durch die bereits ermittelte Entfernung zum Startpunkt gekennzeichnet. Es stehen drei Kandidaten zur Verfügung. Durch die Addition des Gewichtungsfaktors der Kante mit dem Wert des Knotens ergibt sich für den untersten Kandidaten der geringste Wert (10). An dieser Stelle wird die Route weitergeführt. Abb.4 Auswahl des nächsten Kandidaten (LANGE W. & D. EXNER 2004): 4.1.1 Ausführung In diesem Abschnitt wird die Abhandlung des Djikstar Algorithmus nochmals verdeutlicht. Die Menge an Knoten, für die bereits ein Weg vom Startpunkt aus gefunden wurden, wird schrittweise vergrößert. Folgende Variablen werden benötigt (FREUND E. 2004): G S [v1…v2] Distanz (u,v) Q_Suche QDistanz[v] Q_Vorgänger[v] Graph Startknoten Menge aller Verbindungsknoten inkl. Z Kantenlängen zwischen den Knoten u und v Liste über die noch nicht untersuchten Knoten Liste der bisher gefundenen Distanzen von S zu v Liste über den Vorgängerknoten für jeden erledigten Knoten v Initialisierung Im ersten Schritt wird die Ausgangssituation festgelegt. Q_Suche wird eine Menge zugewiesen, die der Anzahl der Knoten (mit Startknoten, abzüglich Zielknoten) entspricht. Der Knoten S wird als Startknoten definiert. Die Listen der Gesamtdistanz und der Vorgängerknoten ist am Anfang noch leer. Formal dargestellt: Q_Suche Q_Erledigt = S + [v1…vn] – Z; = leer; Für jeden Knoten v 7 Q_Distanz[v] = unendlich; Q_Vorgänger[v] = leer; Q_Distanz[S] = 0; Q_Vorgänger[S] = leer; Suche Die Liste Q_Suche ist zunächst leer. Schrittweise wird die Liste mit allen Kandidaten, also allen Knoten mit direkter Kantenverbindung aufgefüllt. Anschließend werden alle Kandidaten nach ihren Widerstandswerten (Distanz) sortiert. Der Knoten mit der geringsten Distanz u wird aus dieser Liste gestrichen und in die Liste der bereits zum Weg gehörigen Knoten hinzuaddiert (FREUND E. 2004). Die Suche der Knoten erfolgt nach der Greedy-Strategie, d.h. dass der Knoten zu Q_Suche hinzugeführt wird, dessen Distanz am geringsten ist, auch wenn dieser Knoten – der ja jetzt belegt ist – im späteren Wegverlauf für eine günstigere Route geeignet wäre (LANGE W. & D EXNER 2004): Solange (Q_Suche != leer) Sortiere Q_Suche nach Q_Distanz[v], v ist Knoten aus Q_Suche; Extrahiere Knoten u aus Q_Suche mit Q_Distanz = minimal; Streiche aus Q_Suche; Addiere u zu Q_Erledigt; Im nächsten Teilschritt der Suche werden vom Punkt u aus neue Nachbarn ermittelt. Da u in die Liste Q_Erledigt übernommen wurde muss die Liste der Vorgänger aktualisiert werden. Der Punkt u ist jetzt Vorgänger für die nächsten Kandidaten v aus der Liste Q_Suche. Die Listen Q_Distanz[v] der neuen Kandidaten v werden mit der Summe aus der Liste Q_Distanz[u] des Punktes u und des Absandes von u zum jeweiligen Kandidaten verglichen. Wenn die direkte Distanz vom Startpunkt S zum Kandidaten v (Q_Distanz[v]) größer ist als die Distanz vom Startpunkt über den Umweg des Vorgängers u (Q_Distanz[u] + Distanz (u,v)), wird dieser Weg in die Listen übernommen. Für jeden Knoten v, der Nachbar von u ist Wenn (Q_Distanz[v] > Q_Distanz[u] + Distanz(u,v)) Q_Distanz[v] = Q_Distanz[u] + Distanz(u,v); Q_Vorgänger[v] = u; 8 Ausgabe Wenn alle kürzesten Wege gefunden wurden, erfolgt die Ausgabe der Knoten. Vom Zielknoten Z ausgehend, werden alle Vorgänger aus der Liste Q_Vorgänger in der berechneten Reihenfolge ausgegeben. Gebe aus: Z; U = Z; Solange(u != leer) u = Q_Vorgänger[u]; Gebe aus: u; 4.2 Der Floyd Algorithmus Im Gegensatz zum Algorithmus von Dijkstra, dessen Berechnung immer von einem fest definierten Startpunkt ausgeht, ist der Floyd Algorithmus in der Lage die kürzesten Wege von jedem Knoten aus zu bestimmen (DE LANGE 2002:95). Dies wäre theoretisch auch mit der Methode von Dijkstra möglich, allerdings müsste der Algorithmus mehrfach wiederholt werden, indem der Startknoten in jedem Schritt neu definiert werden müsste. Ein Sonderfall des Floyd Algorithmus ist der Warshall Algorithmus, der mit ungewichteten Graphen arbeitet. 5 Distanzanalysen im Netzwerk Netzwerke sind definiert als eine Menge von Knoten und Kanten. Sie gehören zu den Vektormodellen, wonach sich Berechnungen in Netzwerken auf die Graphentheorie stützen. Die Graphen sind meist bewertet bzw. gewichtet (DE LANGE 2002:341). Diese Attribute stellen Widerstandswerte dar, die zwischen zwei Knoten überwunden werden müssen. Auf einer Kante können sich diese Werte in Abhängigkeit der Richtung voneinander unterscheiden. Gelten auf einer Straße in beide Richtungen unterschiedliche Höchstgeschwindigkeiten, so lautet der Widerstandswert z.B. p(u,v) = 50; p(v,u) = 30, wobei v und u die Knoten beschreiben. In einer Einbahnstraße bekommt die gesperrte Richtung einen negativen Widerstandswert: p(u,v) = 50; p(v,u) < 0. Für die Modellierung der Kanten sind sehr differenzierte Widerstandswerte möglich, so können z.B. Transportkosten, Zeiteinheiten oder die Anzahl der Sehenswürdigkeiten zwischen zwei Knoten aufgeschlüsselt werden. Die Knoten im Netzwerk können ebenfalls durch Sachdaten modelliert werden. 9 5.1 Ermittlung von Einzugsgebieten Ausgangspunkt für die Distanzberechnung ist ein Knoten. Der Knoten kann z.B. ein Supermarkt sein, wonach die Straßen, welche vom Supermarkt wegführen als Kanten definiert sind. In einem einfachen Modell berechnet sich die maximale Entfernung für das Einzugsgebiet entlang der Fußwege (DE LANGE 2002:343). Es sei angenommen, das es hier keine Hindernisse gibt und die Geschwindigkeit auf allen Kanten, d.h. auf den Wegabschnitten zwischen den Kreuzungen gleich ist. Um das Einzugsgebiet zu bestimmen müssen lediglich die Entfernungen der einzelnen Straßenabschnitte aufaddiert werden bis man den maximal zulässigen Wert erreicht. Verbindet man die Endpunkte, erhält man ein unregelmäßiges Polygon, welches den Einzugsbereich mit allen Haushalten umschließt. Wird die maximale Entfernung auf einer Kante erreicht, entsteht an dieser Stelle ein neuer Knoten, der das Polygon vom äußeren Gebiet abgrenzt. In komplexeren Modellen ist die Anzahl exogen beeinflussbarer Parameter weitaus höher. Nicht nur messbare Größen, wie Tempolimits, Einbahnstraßen, Verkehrsaufkommen (verursachen Verzögerungen) oder Haltezeiten an den Knotenpunkten (Rotphasen an der Ampel) können modelliert werden. Subjektive Bewertungen wie die Zielgruppen dieser Ladenkette, Werbeffekte oder das Image werden in ökonomischen Modellierungen immer häufiger angewendet. Diese Variablen können als Widerstandswerte der Knoten das Einzugsgebiet maßgeblich beeinflussen. 5.2 Das Rundreiseproblem Die logistische Herausforderung bei Packetzustelldiensten oder bei anderen Fahrunternehmen besteht darin, die Route so zu planen, dass der gesamte Weg minimal ist, wobei jede Station nur einmal angefahren werden soll. Ausgenommen sei das Depot, welches als Ausgangs- und Endpunkt der Route dient. Die analytischen Darstellung dieses Problems wird durch den „Banch and Bound Algorithmus“ realisiert (DE LANGE 2002:97). Vom Depot ausgehend bleibt noch eine Menge M für die Berechnung aller Möglichen Wege. Diese Menge resultiert aus der Anzahl der noch verbleibenden Knoten n (Stationen). Jede Station hat n Verzweigungen (banch). Beträgt also die Gesamtanzahl der Stationen auf der Route drei, so gibt es am Depot drei mögliche Verzweigungen. An der nächsten Station sind es noch zwei. Die Entfernungen zwischen den einzelnen Stationen können einer Entfernungsmatrix entnommen werden (Tab.2). Durch das aufaddieren die einzelnen Teilabschnitte erhält man die Länge der Gesamtroute. Wird während der Berechnung einer Route der Länge einer bereits berechneten Route überschritten, wird Algorithmus an dieser „Schranke“ (engl.: bound) abgebrochen. Die Abb.5 zeigt alle Routen (W1 bis W6), die sich aus drei Stationen ergeben. Formal lässt sich die Route W1 folgendermaßen darstellen: 10 W1 = W1(E(1,2), E(2,3), E(3,4), E(4,1)) = E(1,2) + E(2,3) + E(3,4) + E(4,1)) = 20 + 11 + 30 + 13 = 74 1 1 2 3 4 20 10 13 2 20 11 12 3 10 11 4 13 12 30 30 Tab.2: Entfernungsmatrix, bearbeitet nach DE LANGE 2002:98. Abb.5: Routendiagram (DE LANGE 2002:98). 6 Buffering Das im Eingangsbeispiel genannte Cholera Virus kann sich auch – so waren die ersten Vermutungen des Dr. Snow – durch die Luft übertragen. Der Erreger breitet sich nicht mehr entlang der fest vorgegeben Routen aus, in dem die Menschen das Wasser durch die Straßen tragen. Die Ausbreitung erfolgt nun relativ linear. Ein solches Problem lässt sich durch die Generierung einer Pufferzone um die verunreinigte Wasserpumpe visuell darstellen. Puffer (engl.: buffer) sind im Durchmesser fest definierte Flächen, die um Punkte, Linien oder Polygone gelegt werden und zählen zu den wichtigsten Anwendungen in der Bildverarbeitung (LONGLEY ET AL 2001:279). Ein anderes Beispiel wird von HEYWOOD ET AL. (2002:115) dargestellt. Gesucht sind Hotels, die sich im Umkreis von 200m an einer Hauptstraße befinden. Aus dieser Fragestellung ergeben sich für ein GIS mehrere Alternativen: Die erste Möglichkeit besteht in der Abfrage einer Datenbank, welche zunächst die Entfernung aller Hotels von der Straße abfragt und anschließend die Hotels mit einer geringeren Entfernung von 200m herausfiltert. Eine zweite Möglichkeit bietet die Pufferzone, welche entlang der Straße mit einem Abstand von 200m definiert wird. In dieser Zone befinden sich alle gesuchten Hotels. Die Zonenbildung kann auf Raster- und Vektordatenebene stattfinden. Rasterzellen besitzen Attributeigenschaften und werden durch den Puffer neu klassifiziert, d.h. das Attribut, welches die Zugehörigkeit zu einem Objekt charakterisiert wird überschrieben. Bei Vektormodellen werden hingegen neue Objekte definiert (LONGLEY ET AL. 2001:292). Im folgenden werden beide Formate getrennt voneinander behandelt. 11 6.1 Zonengenerierung im Vektormodell Im ersten oben genannten Beispiel handelt es sich um einen Punktpuffer. Um die betroffene Wasserpumpe wird ein Kreis mit einem fest definierten Durchmesser gespannt. Der Durchmesser in der Abbildung berechnet sich aus dem Ausbreitungsgebiet und dem Abbildungsmaßstab. Es sei an dieser Stelle noch einmal darauf hingewiesen, dass die Generierung der Pufferzone nicht nur durch reine Entfernungsangaben ausgehend vom Punkt erfolgen muss. Temperaturdifferenzen, Niederschlagsmengen oder Einkommensunterschiede können ebenfalls Variablen darstellen, die die Größe einer Pufferzone bestimmen. Ein alternativer Punktpuffer ist ein Quadrat, dessen Durchmesser dem des Kreises entspricht. Ein solcher Puffer findet vor allem in der Wirtschaftsgeografie Anwendung, wo Einzugsgebiete durch eindeutige Kanten abgegrenzt werden können. Das zweite Beispiel zeigt einen Linienpuffer. Nach BILL (1999:33) sind Linien- und Flächenpuffer gleichzusetzen, da für die Modellierung von Flächen nur die Kante (also die Grenze) relevant ist. Zu unterscheiden ist jedoch, dass bei einer Fläche die abgrenzende Kante nur einen einseitigen Puffer im äußeren Gebiet erhält. Die gegenüberliegende Kante der Fläche vervollständigt dann den Puffer. Ein Sonderfall ist, wenn der Puffer in die Fläche hineingeht und das äußere Gebiet frei bleibt. Ein solcher Puffer wird „setback buffer“ genannt (YEUNG 2002:207). Bei einer Linie wird der Puffer beidseitig modelliert. Wie bei den Punktpuffern wird auch hier zwischen kreisförmigen und rechteckigen Puffern unterschieden. Entlang der Kanten erfolgt die Modellierung identisch (Abb.6, Fall 1): Die Pufferzone wird parallel zu der Linie bzw. Fläche mit dem gewünschten Abstand konstruiert. Es entstehen zwei neue Parallelen, die jetzt das neu definierte Objekt abgrenzen. Das hier verwendete Verfahren wird daher Parallelengenerierung von Vektordaten genannt (BILL 1999:33). An den Knotenpunkten unterscheiden sich Kreis- bzw. Rechteckpuffer: Bei dem Rechteckpuffer werden an den Anfangs- und Endpunkten des Graphen die Parallelen um jenen Wert verlängert, der dem Abstand zwischen Linie bzw. der Kante des Objektes und der Parallelen selbst entspricht. Die Parallelen werden durch eine Linie verbunden und die rechteckige Pufferzone ist geschlossen (Abb.6, Fall 4). An den Knotenpunkten, in welchen sich mehrere Kanten in einem Winkel von größer 0° treffen, kommt es zu Überlappungen der Rechtecke im Innenwinkelbereich der „Abbiegung“ (Fall 3). Im Außenwinkel kann es zu einer Vergrößerung der Pufferzone kommen. Bei Kreisförmigen Übergängen zwischen den einzelnen Pufferzonen werden diese Effekte vermieden, da der Abstand zwischen der Linie des Objektes und der Pufferzone konstant bleibt. Bei der Konstruktion dienen die Knoten als Ausgangpunkt für den Kreisbogen, dessen Radius dem Abstand der Parallelen zu der Linie des Objektes entspricht. Der Winkel des Kreisbogens wird durch den Winkel der aufeinander treffenden Kanten bestimmt. Bei den Endpunkten einer Linie beträgt der Winkel 180° (YEUNG 2002:207). 12 Abb.6: Punkt-, Linien-, und Flächpuffer (BILL 1999:33) 6.2 Zonengenerierung im Rasterdatenformat Wie oben schon angedeutet wurde, werden Rasterzellen durch ein oder mehrere Attribute charakterisiert. Hierbei handelt es sich nicht um Topologische Informationen – die Lage der Rasterzellen wird durch den Zeilen- bzw. Spaltenindex bestimmt – sondern um Sachinformationen, wie z.B. die Zugehörigkeit zu Objekten, Einwohnerzahlen, Schadstoffgehalte in der Luft oder Wirtschaftsdaten wie durchschnittliche Konsumquoten. Ein typisches Verfahren der Bildverarbeitung ist daher die Klassifizierung. Einzelne Raster mit den gleichen Attributeigenschaften können zu einem Objekt zusammengefasst werden. Wird eine Pufferzone um ein Objekt gelegt, werden alle Raster innerhalb dieser Zone mit der Information belegt, dass sie jetzt zum Ausgangsobjekt gehören. In einem einfachen Modell, in dem es nur 0 (ohne Zugehörigkeit zu einem Objekt) und 1 (gehört zum Objekt) gibt, erhalten demnach alle Raster in der Pufferzone einheitlich den Wert 1. Ein genaueres Verfahren ist die Abstandstransformation. Die Raster werden je nach Abstand zum Objekt klassifiziert und erhalten daher Unterschiedliche Werte. In der Tab.3 ist dieses Verfahren dargestellt. In der Originalmatrix sind alle Raster ohne Zugehörigkeit zum Ausgangsobjekt mit einem „*“ gekennzeichnet. Das Objekt selbst wird hier mit „0“ gekennzeichnet. In der zweiten Matrix ist Ergebnis der Abstandstransformation abzulesen. In diesem Beispiel wurde die Transformation nach der euklidischen Distanz berechnet. Der Abstandswert Da wird über die direkte diagonale Verbindung der Rasterzellen nach Da2 = Db + Dc berechnet, wobei Db den vertikalen und Dc den horizontalen Abstand darstellen. Die euklidische Distanz wird also über den Umweg der Manhattandistanz berechnet, die sich durch Da = Db + Dc 13 ergibt (LAURINI & THOMPSON 1992:135). Für das transformierte Bild in dem Beispiel würden sich hieraus insgesamt höhere Werte für die Rasterzellen ergeben. Vor allem aber in der Darstellung unmittelbarer Nachbarschaftsbeziehungen unterscheiden sich beide Distanzdarstellungen: Ein Raster, welches diagonal direkt an ein Objekt angrenzt und nach der euklidischen Distanz den Wert 1 erhält, bekommt nach der Manhattandistanz den Wert 2. Originalmatrix Abstandstransformation * * * * * * * * * * * 3 3 2 2 2 2 2 2 2 3 3 * * * * * * * * * * * 3 2 2 1 1 1 1 1 2 2 3 * * * * 0 0 0 * * * * 3 2 1 1 0 0 0 1 1 2 3 * * * 0 * * * 0 * * * 3 2 1 0 1 1 1 0 1 2 3 * * * 0 * * * * * * * 3 2 1 0 1 1 1 1 1 2 3 * * * * 0 0 0 * * * * 3 2 1 1 0 0 0 1 1 2 3 * * * * * * * 0 * * * 3 2 1 1 1 1 1 0 1 2 3 * * * 0 * * * 0 * * * 3 2 1 0 1 1 1 0 1 2 3 * * * * 0 0 0 * * * * 3 2 1 1 0 0 0 1 1 2 3 * * * * * * * * * * * 3 2 2 1 1 1 1 1 2 2 3 * * * * * * * * * * * 3 3 2 2 2 2 2 2 2 3 3 * * * * * * * * * * * 4 3 3 3 3 3 3 3 3 3 4 Tab.3a,b: Original- und Ausgabebild. Bearbeitet nach BILL (1999:35). Ein weiterführender Schritt der Abstandstransformation, resultiert aus der großen Anzahl der gebildeten Klassen. Aus Platzgründen wurden in der Abbildung nur vier Klassen abgebildet. In der Praxis aber wird Hochauflösendes Bildmaterial eingesetzt. Eine Pufferzone um ein Objekt (z.B. Lärmschutzbereich um eine Autobahn) kann somit einige Hundert Raster belegen. Die hohe Anzahl der dadurch gebildeten Klassen kann durch das Verfahren der Reklassifizierung reduziert werden. Durch einen Algorithmus, dem Schwellenwerte zugewiesen wurden, werden den einzelnen Rasterzellen neue Attribute zugewiesen. In einem zweiten Schritt werden die Rasterzellen mit denselben Attributen (Klassen) zusammengefasst, um Redundanzen zu vermeiden (YEUNG 2002:208). 7 Zusammenfassung Wie sich in dieser Arbeit herausgestellt hat, ist das Anwendungsspektrum von Distanzanalysen sehr breit. Die Navigationssysteme der Autofahrer oder der Piloten profitieren von ihnen genauso, wie Wirtschafts- oder Umweltinformationssysteme. „ShortestPath- Algorithmen sind aber nicht nur Herausforderungen für Geoinformationssysteme, sondern können in allen Netzwerken (z.B. Internet) gleichermaßen angewendet werden. 14 8 Literatur BILL R. (1999): Grundlagen der Geo-Informationssysteme. Band 1. Heidelberg. BILL R. (1999): Grundlagen der Geo-Informationssysteme. Band 2. Heidelberg. CASTLE(1993): Profiting from a Geographic Information System. Fort Collins. DE LANGE N. (2002): Geoinformatik in Theorie und Praxis. Berlin. HEYWOOD I., S. CORNELIUS & CARVER S. (2002): An Introduction To Geographical Information Systems. Harlow. LAURINI R. & D. THOMPSON (1992): Fundamentals of Spatial Informations Systems. London. LONGLEY P.A., M.F. GOODCHILD, D.J. MAGUIRE & D.W. RHIND (2001): Geographic Information Systems and Science. Chichster. YEUNG(2002): Concepts and techniques of Geographic Information System. New Jersey. FREUND E. (2004): Institut für Roboterforschung. www.irf.de. JSI RESEARCH & TRAINING INSTITUTE, INC. (2004): www.jsi.com. LANGE W. & D EXNER (2004): Institut für Medieninformatik und technische Informatik. FH Flensburg. www.iti.fh-flensburg.de. 15