Hausarbeit - Geoinformatik - Friedrich-Schiller

Werbung
Friedrich-Schiller-Universität Jena
Institut für Geografie
HS Analyse und Modellierung räumlicher Daten
Seminarleiter: Dr. Martin Herold
WS 2004/2005
Hausarbeit
zum Thema:
GIS Funktionalität I:
Distanz- und Bufferanalysen
Vorgelegt von:
Jan Böttger
Bonhoeffer Straße 19
07747 Jena
[email protected]
Abgabe: 12.11.2004
Gliederung
1
Einleitung
2
2
Fallbeispiel
2
3
Modellierung von Graphen
3
3.1
Formen von Graphen
3
3.2
Gewichtung von Graphen
4
4
Shortest-Path-Algorithmen
6
4.1
Dijkstra Algorithmus
6
4.1.1 Ausführung
7
Floyd Algorithmus
9
4.2
5
6
Distanzanalysen im Netzwerk
9
5.1
Ermittlung von Einzugsgebieten
10
5.2
Das Rundreiseproblem
10
Bufferung
11
6.1
Zonengenerierung im Vektormodell
12
6.2
Zonengenerierung im Rasterdatenformat
13
7
Zusammenfassung
14
8
Literatur
15
1
1 Einleitung
Distanzanalysen gehören zu den wichtigsten Anwendungen von Geoinformationssystemen.
Vor allem Algorithmen zur Berechnung kürzester Wege sind in der Praxis nicht mehr
wegzudenken. Eine andere Form von Distanzanalysen stellt das Generieren von
Abstandszonen (sog. buffering) dar. Einem GIS steht dafür ein vielfältiges methodisches
Repertoire zur Verfügung (CASTLE 1993:26). In dieser Arbeit werden anfangs die
graphentheoretischen Grundlagen dargestellt, um anschließend die häufigsten Algorithmen
herleiten zu können. Die Anwendungen solcher Algorithmen werden dann am Beispiel eines
Netzwerkes vorgestellt. Im letzten Kapitel wird die Modellierung von Pufferzonen
abgehandelt. Zunächst jedoch soll ein Fallbeispiel die Problematik – welche nicht nur dem
GIS- Nutzer vorbehalten ist – verdeutlichen.
2 Fallbeispiel
Eines der ältesten Modelle, bei dem es zur Anwendung raumbezogener visueller Analysemethoden kam, stammt aus dem Jahre 1854. Im Londoner Stadtteil Soho breitete sich eine
Cholera Epidemie aus, deren Ursprung zunächst unbekannt war. Der Anästhesiearzt Dr. John
Snow erstellte eine Karte, auf der die Wohnorte von 500 an Cholera erkrankten Patienten
eingetragen wurden. Aufgrund der ungleichen Verbreitung der Epidemie vermutete Snow,
dass die Übertragung nicht durch die Luft sondern durch die Wasserversorgung stattfand.
Durch das zusätzliche Eintragen der Wasserpumpen in die Straßenkarte konnte die Quelle des
verunreinigten Wassers ermittelt werden (www.jsi.com).
Abb.1: Verbreitung der Cholera. Quelle: www.jsi.com
2
Abb. 1 zeigt das Einzugsgebiet der Wasserpumpe. Es fällt auf, dass entlang der Straßen,
welche direkt mit der Broad Street verbunden sind, die Verbreitung besonders stark war.
Auch gab es Erkrankte, die viel näher an anderen, nicht verunreinigten Pumpen wohnten. Dr.
Snow beachtete, dass die Menschen das Wasser in Eimern durch die Straßen tragen mussten.
Dadurch war für die Analyse nicht die tatsächliche Entfernung zu nächsten Wasserpumpe
relevant, sondern vielmehr die kürzeste Verbindung entlang der Straßen (LONGLEY ET AL
2001:279).
Diese Methodik der Distanzanlyse, die von Dr. Snow hier erstmals angewandt wurde, findet
in den heutigen Geoinformationssystemen eine breite Anwendung. Als die verseuchte Pumpe
identifiziert wurde, demontierte Dr. Snow diese eigenhändig. Auch diese Aufgabe kann ein
GIS übernehmen. Moderne Wasserwerke sind mit den im Land verteilten Pumpstationen und
Wasserrückhaltebecken über ein GIS verbunden. Werden bei den automatischen Messungen
Schwellwerte überschritten wird die Wasserversorgung selbständig unterbrochen. Darüber
hinaus berechnet das GIS eine alternative Wasserversorgung für das Einzugsgebiet der
gesperrten Pumpstation.
3 Modellierung von Graphen
Straßenkarten, wie die von Dr. Snow werden in der Graphentheorie als plättbare
Flächenmodelle bezeichnet. Sie sind auf einer Ebene abgebildet und bestehen aus einem
planaren (plättbaren) Graph, der mit Punkten und Linien dargestellt werden kann (BILL
1999:257). Die Punkte werden als Knoten bezeichnet, die Linien sind Kanten. Ein Knoten
wird als die Stelle definiert, in der eine Kante beginnt oder endet. Eine Kante ist somit die
Verbindung zwischen zwei Knoten und bildet im Flächenmodell die Grenze. Die Ebenen
zwischen Grenzen sind die Maschen. Flächen, die nicht durch die Kanten eingegrenzt werden,
gehören zum äußeren Gebiet.
3.1 Formen von Graphen
Das Einzugsgebiet im Fallbeispiel wurde durch die Laufwege bestimmt, indem die einzelnen
Straßenabschnitte zwischen den Kreuzungen und Abbiegungen aufaddiert wurden. Der Weg
in einem endlichen Graphen ist somit eine zusammenhängende Folge von Kanten, die von
einem Knoten zu einem anderen Knoten führt (BILL 1999:255). In einem zusammenhängenden Graphen sind zwei verschiedene Knoten über mindestens einen Weg erreichbar.
Nicht zusammenhängende Graphen weisen Unterbrechungen auf, so dass zwei verschiedene
Punkte nicht durch einen Weg erreicht werden können. Weiterhin unterscheidet man
zyklische, ausschließlich zyklische und nicht zyklische Graphen. Zyklische Graphen bestehen
aus Schleifen. Zwischen zwei Knoten gibt es hier mehrere Wege und ein Knoten kann auf
einem Weg sowohl Ausgangs- als auch Endpunkt sein. Bei einem Graphen, der nur aus
Schleifen besteht, gilt dies für jeden Knoten. Zusammenhängende Graphen, die keinen Zyklus
aufweisen, werden als Baum bezeichnet (DE LANGE 2002:94). In Abb. 2 sind die wichtigsten
Graphen abgebildet.
3
Abb.2 Typen von Graphen (DE LANGE 2002:94)
Die Graphentheorie ist die Grundlage für auf Vektordaten basierender Geoinformationssysteme. Vektoren sind Teilabschnitte des Graphen und repräsentieren die Kanten. Jedem
Vektor ist eine Richtung zugeordnet, d.h. er hat einen Anfangs- und Endpunkt. Wie sich in
den folgenden Kapiteln herausstellen wird, ist ein GIS in der Lage jedem Kanten und Knoten
Attributwerte zuzuordnen. Diese Informationen können im einfachsten Fall Entfernungen
oder Zeiteinheiten zwischen zwei Knoten darstellen.
3.2 Gewichtung von Graphen
Ein raumbezogenes Objekt besteht aus einer Menge von Kanten (E) und einer Menge von
Knoten (V). Weiterhin wird das Objekt durch die Anzahl der Polygone (P) und
Volumenkörper charakterisiert. Dieser Zusammenhang kann durch die Euler- Konstante
dargestellt werden (DE LANGE 2002:95). Gilt die Gleichung
2 = V – E + P,
besteht das Flächenmodell aus einem zusammenhängenden planaren Graphen (G). Ein solcher
Graph ist in Abb. 3 dargestellt worden. Neben der Richtungsangabe, erhält jede Kante einen
Gewichtungsfaktor von p = 1 bis p = 7. In diesem einfachen Modell entspricht der
Gewichtungsfaktor der Entfernung zwischen zwei Knoten. In der Praxis (z.B. auf Karten) sind
solche Attribute jedoch weitaus differenzierter (CASTLE 1993:26).
Abb.3 gewichteter Graph. Bearbeitet nach BILL (1999:29).
4
Zur analytischen Betrachtung wird die visuelle Darstellungsform in einer Matrix repräsentiert.
Die gewichtete Bewertungsmatrix (Tab.1a) resultiert aus einer Knoten- Kantendarstellung, in
der jeder Kante einen Anfang- bzw. Endknoten zugeordnet wird. Die Anfangsknoten werden
in den Zeilen (jn), die Endknoten in den Spalten (in) abgelesen. Ein Gewichtungsfaktor von
p = 0 bedeutet, dass zwischen diesen beiden Punkten in diese Richtung keine Verbindung
besteht.
In der Inzidenzmatrix (Tab.1b) werden die Beziehungen zwischen verschiedenen Elementen
des Graphen dargestellt, d.h. zwischen Kanten und Knoten. Eine Kante ist z.B. inzident mit
ihrem Anfangs- und Endknoten. In der abgebildeten Matrix erhält der Anfangsknoten einer
Kante die Zahl 1. Der Endknoten wird durch -1 markiert und nicht inzidente Knoten
bekommen den Wert 0.
Beziehungen zwischen zwei Knoten eines Graphen werden Adjazenz genannt und in einer
Knotenadjazenzmatrix (Tab.1c) dargestellt. Sie beschreibt das Aneinandergrenzen, Berühren
oder Verbunden sein gleichartiger Strukturelemente eines Graphen. Adjazenz liegt z.B. dann
vor, wenn zwei Knoten über eine Kannte verbunden sind oder wenn zwei Kanten sich an
einem Knoten treffen. Die Hauptdiagonale der Matrix zeigt die Anzahl der Kanten, die vom
jeweiligen Knoten ausgehen. Der Endknoten für die Kante wird mit dem Wert -1
gekennzeichnet (BILL 1999:29).
Bewertungsmatrix
A
B
C
D
E
A
0
0
0
0
3
B
7
0
0
0
0
C
0
0
0
5
1
D
6
0
0
0
2
Inzidenzmatrix
E
0
1
0
0
0
1
2
3
4
5
6
7
A
1
1
0
-1
0
0
0
B
-1
0
1
0
0
0
0
C
0
0
0
0
-1
0
-1
D
0
-1
0
0
0
-1
1
Adjazenzmatrix
E
0
0
-1
1
1
1
0
A
B
C
D
E
A B
3 -1
-1 2
0 0
-1 0
-1 -1
C
0
0
2
-1
-1
D
-1
0
-1
3
-1
E
-1
-1
-1
-1
4
Tab.1a,b,c: Matrixdarstellungsformen. BILL (1999:29).
Diese topologischen Beziehungen dienen dem Geoinformationssystem als Grundlage für die
Berechnung kürzester Wege. Die Algorithmen im folgenden Abschnitt müssen in jedem
Schritt auf solche Matrizen zurückgreifen können, damit zunächst potentielle, anschließend
optimale Wege zwischen den Knoten gefunden werden können.
5
4 Shortest-Path-Algorithmen
Die Aufgabe der Bildverarbeitung besteht darin, aus den gegebenen Geobasisdaten
Informationen für den Nutzer des GIS abzuleiten. Erst durch die Zusammenführung
metrischer und topologischer Eigenschaften von Objekten sind Berechnungen möglich. Ein
GIS ist dadurch in der Lage Distanzanalysen zwischen verschiedenen Objekten
durchzuführen. Durch die große Anzahl endogener und exogener Parameter sind solche
Berechnungen sehr komplex. Endogene Parameter stellen jene Variablen dar, die vom Modell
selbst erklärt werden können. Die Modellierung der exogenen Parameter stellt sich weitaus
komplizierter dar und gestaltet sich je nach Problemstellung unterschiedlich. Die Analysen
dieser Variablen können empirisch oder algebraisch erfolgen. Die Ergebnisse fließen oft als
Restriktionen (Widerstandswerte) in das Modell mit ein und können somit Einfluss auf die
Gewichtung der einzelnen Elemente (Kanten oder Knoten) nehmen. Für eine effiziente
Verarbeitung dieser Informationen bedient sich das GIS unterschiedlicher Algorithmen. Nach
DE LANGE (2002:81) ist ein Algorithmus „[…] eine allgemeine Berechnungsvorschrift zur
Lösung eines Problems, die sich aus mehreren elementaren Schritten zusammensetzt, die in
einer festen Reihenfolge ausgeführt werden müssen“. Mit zunehmender Komplexität des
Algorithmus steigt auch die Anforderung an die Hardwarekomponete, Rechenzeitaufwand
und Speicherbedarf. In den folgenden Abschnitten werden daher nur sehr einfache Modelle
betrachtet. Die Widerstandswerte zwischen zwei Knoten werden nur durch die Distanz
bestimmt und sind in beide Richtungen identisch.
4.1 Der Dijkstra Algorithmus
Zu den bekanntesten Methoden zur Berechnung kürzester Wege gehört der Algorithmus von
Dijkstra. Dieser ermittelt die kürzesten Wege von einem bestimmten Startkoten zu allen
anderen Knoten des zusammenhängenden, gewichteten Graphen.
Vom Startpunkt ausgehend, wird in jedem Schritt ein neuer Knoten ermittelt, der
anschließend der Route hinzugeführt wird. Dabei resultiert die (konstante) Gesamtmenge aller
Knoten V aus der Addition folgender drei Teilmengen (LANGE W. & D. EXNER 2004):
- Menge der Knoten T, die schon zur Route dazugehören
- Menge der von Kandidaten K, die einem Knoten der Route benachbart sind, aber
noch nicht zur Route hinzugehören.
- Menge der unberücksichtigten Knoten
Die Aufgabe besteht nun darin, alle Kandidaten K abzufragen und den günstigsten Knoten in
die Route zu integrieren. Hierbei nimmt der Gewichtungsfaktor einer Kante (zwischen
potentiellen- und bereits ausgewählten Knoten) eine wichtige Rolle ein. Dieser
Gewichtungsfaktor wird mit dem Abstand des ausgewählten Punktes zum Startpunkt S
addiert. Hinzugeführt wird der Knoten, der den geringsten Betrag ergibt. Das folgende
Beispiel illustriert diesen Sachverhalt (Abb.4): Ausgehend vom Startpunkt (0) hat der
6
Algorithmus bereits eine Route konstruiert (fette Linie). Der Gewichtungsfaktor einer Kante
entspricht hier der Entfernung zwischen zwei adjazenten Knoten. Die Knoten sind durch die
bereits ermittelte Entfernung zum Startpunkt gekennzeichnet. Es stehen drei Kandidaten zur
Verfügung. Durch die Addition des Gewichtungsfaktors der Kante mit dem Wert des Knotens
ergibt sich für den untersten Kandidaten der geringste Wert (10). An dieser Stelle wird die
Route weitergeführt.
Abb.4 Auswahl des nächsten Kandidaten (LANGE W. & D. EXNER 2004):
4.1.1 Ausführung
In diesem Abschnitt wird die Abhandlung des Djikstar Algorithmus nochmals verdeutlicht.
Die Menge an Knoten, für die bereits ein Weg vom Startpunkt aus gefunden wurden, wird
schrittweise vergrößert. Folgende Variablen werden benötigt (FREUND E. 2004):
G
S
[v1…v2]
Distanz (u,v)
Q_Suche
QDistanz[v]
Q_Vorgänger[v]
Graph
Startknoten
Menge aller Verbindungsknoten inkl. Z
Kantenlängen zwischen den Knoten u und v
Liste über die noch nicht untersuchten Knoten
Liste der bisher gefundenen Distanzen von S zu v
Liste über den Vorgängerknoten für jeden erledigten Knoten v
Initialisierung
Im ersten Schritt wird die Ausgangssituation festgelegt. Q_Suche wird eine Menge
zugewiesen, die der Anzahl der Knoten (mit Startknoten, abzüglich Zielknoten) entspricht.
Der Knoten S wird als Startknoten definiert. Die Listen der Gesamtdistanz und der
Vorgängerknoten ist am Anfang noch leer. Formal dargestellt:
Q_Suche
Q_Erledigt
= S + [v1…vn] – Z;
= leer;
Für jeden Knoten v
7
Q_Distanz[v] = unendlich;
Q_Vorgänger[v] = leer;
Q_Distanz[S] = 0;
Q_Vorgänger[S] = leer;
Suche
Die Liste Q_Suche ist zunächst leer. Schrittweise wird die Liste mit allen Kandidaten, also
allen Knoten mit direkter Kantenverbindung aufgefüllt. Anschließend werden alle Kandidaten
nach ihren Widerstandswerten (Distanz) sortiert. Der Knoten mit der geringsten Distanz u
wird aus dieser Liste gestrichen und in die Liste der bereits zum Weg gehörigen Knoten
hinzuaddiert (FREUND E. 2004).
Die Suche der Knoten erfolgt nach der Greedy-Strategie, d.h. dass der Knoten zu Q_Suche
hinzugeführt wird, dessen Distanz am geringsten ist, auch wenn dieser Knoten – der ja jetzt
belegt ist – im späteren Wegverlauf für eine günstigere Route geeignet wäre (LANGE W. & D
EXNER 2004):
Solange (Q_Suche != leer)
Sortiere Q_Suche nach Q_Distanz[v], v ist Knoten aus Q_Suche;
Extrahiere Knoten u aus Q_Suche mit Q_Distanz = minimal;
Streiche aus Q_Suche;
Addiere u zu Q_Erledigt;
Im nächsten Teilschritt der Suche werden vom Punkt u aus neue Nachbarn ermittelt. Da u in
die Liste Q_Erledigt übernommen wurde muss die Liste der Vorgänger aktualisiert werden.
Der Punkt u ist jetzt Vorgänger für die nächsten Kandidaten v aus der Liste Q_Suche. Die
Listen Q_Distanz[v] der neuen Kandidaten v werden mit der Summe aus der Liste
Q_Distanz[u] des Punktes u und des Absandes von u zum jeweiligen Kandidaten verglichen.
Wenn die direkte Distanz vom Startpunkt S zum Kandidaten v (Q_Distanz[v]) größer ist als
die Distanz vom Startpunkt über den Umweg des Vorgängers u (Q_Distanz[u] + Distanz
(u,v)), wird dieser Weg in die Listen übernommen.
Für jeden Knoten v, der Nachbar von u ist
Wenn (Q_Distanz[v] > Q_Distanz[u] + Distanz(u,v))
Q_Distanz[v] = Q_Distanz[u] + Distanz(u,v);
Q_Vorgänger[v] = u;
8
Ausgabe
Wenn alle kürzesten Wege gefunden wurden, erfolgt die Ausgabe der Knoten. Vom
Zielknoten Z ausgehend, werden alle Vorgänger aus der Liste Q_Vorgänger in der
berechneten Reihenfolge ausgegeben.
Gebe aus: Z;
U = Z;
Solange(u != leer)
u = Q_Vorgänger[u];
Gebe aus: u;
4.2 Der Floyd Algorithmus
Im Gegensatz zum Algorithmus von Dijkstra, dessen Berechnung immer von einem fest
definierten Startpunkt ausgeht, ist der Floyd Algorithmus in der Lage die kürzesten Wege von
jedem Knoten aus zu bestimmen (DE LANGE 2002:95). Dies wäre theoretisch auch mit der
Methode von Dijkstra möglich, allerdings müsste der Algorithmus mehrfach wiederholt
werden, indem der Startknoten in jedem Schritt neu definiert werden müsste. Ein Sonderfall
des Floyd Algorithmus ist der Warshall Algorithmus, der mit ungewichteten Graphen arbeitet.
5 Distanzanalysen im Netzwerk
Netzwerke sind definiert als eine Menge von Knoten und Kanten. Sie gehören zu den
Vektormodellen, wonach sich Berechnungen in Netzwerken auf die Graphentheorie stützen.
Die Graphen sind meist bewertet bzw. gewichtet (DE LANGE 2002:341). Diese Attribute
stellen Widerstandswerte dar, die zwischen zwei Knoten überwunden werden müssen. Auf
einer Kante können sich diese Werte in Abhängigkeit der Richtung voneinander
unterscheiden. Gelten auf einer Straße in beide Richtungen unterschiedliche
Höchstgeschwindigkeiten, so lautet der Widerstandswert z.B. p(u,v) = 50; p(v,u) = 30, wobei
v und u die Knoten beschreiben. In einer Einbahnstraße bekommt die gesperrte Richtung
einen negativen Widerstandswert: p(u,v) = 50; p(v,u) < 0. Für die Modellierung der Kanten
sind sehr differenzierte Widerstandswerte möglich, so können z.B. Transportkosten,
Zeiteinheiten oder die Anzahl der Sehenswürdigkeiten zwischen zwei Knoten aufgeschlüsselt
werden. Die Knoten im Netzwerk können ebenfalls durch Sachdaten modelliert werden.
9
5.1 Ermittlung von Einzugsgebieten
Ausgangspunkt für die Distanzberechnung ist ein Knoten. Der Knoten kann z.B. ein
Supermarkt sein, wonach die Straßen, welche vom Supermarkt wegführen als Kanten
definiert sind. In einem einfachen Modell berechnet sich die maximale Entfernung für das
Einzugsgebiet entlang der Fußwege (DE LANGE 2002:343). Es sei angenommen, das es hier
keine Hindernisse gibt und die Geschwindigkeit auf allen Kanten, d.h. auf den
Wegabschnitten zwischen den Kreuzungen gleich ist. Um das Einzugsgebiet zu bestimmen
müssen lediglich die Entfernungen der einzelnen Straßenabschnitte aufaddiert werden bis man
den maximal zulässigen Wert erreicht. Verbindet man die Endpunkte, erhält man ein
unregelmäßiges Polygon, welches den Einzugsbereich mit allen Haushalten umschließt. Wird
die maximale Entfernung auf einer Kante erreicht, entsteht an dieser Stelle ein neuer Knoten,
der das Polygon vom äußeren Gebiet abgrenzt.
In komplexeren Modellen ist die Anzahl exogen beeinflussbarer Parameter weitaus höher.
Nicht nur messbare Größen, wie Tempolimits, Einbahnstraßen, Verkehrsaufkommen
(verursachen Verzögerungen) oder Haltezeiten an den Knotenpunkten (Rotphasen an der
Ampel) können modelliert werden. Subjektive Bewertungen wie die Zielgruppen dieser
Ladenkette, Werbeffekte oder das Image werden in ökonomischen Modellierungen immer
häufiger angewendet. Diese Variablen können als Widerstandswerte der Knoten das
Einzugsgebiet maßgeblich beeinflussen.
5.2 Das Rundreiseproblem
Die logistische Herausforderung bei Packetzustelldiensten oder bei anderen Fahrunternehmen
besteht darin, die Route so zu planen, dass der gesamte Weg minimal ist, wobei jede Station
nur einmal angefahren werden soll. Ausgenommen sei das Depot, welches als Ausgangs- und
Endpunkt der Route dient.
Die analytischen Darstellung dieses Problems wird durch den „Banch and Bound
Algorithmus“ realisiert (DE LANGE 2002:97). Vom Depot ausgehend bleibt noch eine Menge
M für die Berechnung aller Möglichen Wege. Diese Menge resultiert aus der Anzahl der noch
verbleibenden Knoten n (Stationen). Jede Station hat n Verzweigungen (banch). Beträgt also
die Gesamtanzahl der Stationen auf der Route drei, so gibt es am Depot drei mögliche
Verzweigungen. An der nächsten Station sind es noch zwei. Die Entfernungen zwischen den
einzelnen Stationen können einer Entfernungsmatrix entnommen werden (Tab.2).
Durch das aufaddieren die einzelnen Teilabschnitte erhält man die Länge der Gesamtroute.
Wird während der Berechnung einer Route der Länge einer bereits berechneten Route
überschritten, wird Algorithmus an dieser „Schranke“ (engl.: bound) abgebrochen. Die Abb.5
zeigt alle Routen (W1 bis W6), die sich aus drei Stationen ergeben. Formal lässt sich die
Route W1 folgendermaßen darstellen:
10
W1 = W1(E(1,2), E(2,3), E(3,4), E(4,1))
= E(1,2) + E(2,3) + E(3,4) + E(4,1))
= 20 + 11 + 30 + 13 = 74
1
1
2
3
4
20
10
13
2
20
11
12
3
10
11
4
13
12
30
30
Tab.2: Entfernungsmatrix, bearbeitet nach DE LANGE 2002:98.
Abb.5: Routendiagram (DE LANGE 2002:98).
6 Buffering
Das im Eingangsbeispiel genannte Cholera Virus kann sich auch – so waren die ersten
Vermutungen des Dr. Snow – durch die Luft übertragen. Der Erreger breitet sich nicht mehr
entlang der fest vorgegeben Routen aus, in dem die Menschen das Wasser durch die Straßen
tragen. Die Ausbreitung erfolgt nun relativ linear. Ein solches Problem lässt sich durch die
Generierung einer Pufferzone um die verunreinigte Wasserpumpe visuell darstellen. Puffer
(engl.: buffer) sind im Durchmesser fest definierte Flächen, die um Punkte, Linien oder
Polygone gelegt werden und zählen zu den wichtigsten Anwendungen
in der
Bildverarbeitung (LONGLEY ET AL 2001:279).
Ein anderes Beispiel wird von HEYWOOD ET AL. (2002:115) dargestellt. Gesucht sind Hotels,
die sich im Umkreis von 200m an einer Hauptstraße befinden. Aus dieser Fragestellung
ergeben sich für ein GIS mehrere Alternativen: Die erste Möglichkeit besteht in der Abfrage
einer Datenbank, welche zunächst die Entfernung aller Hotels von der Straße abfragt und
anschließend die Hotels mit einer geringeren Entfernung von 200m herausfiltert. Eine zweite
Möglichkeit bietet die Pufferzone, welche entlang der Straße mit einem Abstand von 200m
definiert wird. In dieser Zone befinden sich alle gesuchten Hotels.
Die Zonenbildung kann auf Raster- und Vektordatenebene stattfinden. Rasterzellen besitzen
Attributeigenschaften und werden durch den Puffer neu klassifiziert, d.h. das Attribut,
welches die Zugehörigkeit zu einem Objekt charakterisiert wird überschrieben. Bei
Vektormodellen werden hingegen neue Objekte definiert (LONGLEY ET AL. 2001:292). Im
folgenden werden beide Formate getrennt voneinander behandelt.
11
6.1 Zonengenerierung im Vektormodell
Im ersten oben genannten Beispiel handelt es sich um einen Punktpuffer. Um die betroffene
Wasserpumpe wird ein Kreis mit einem fest definierten Durchmesser gespannt. Der
Durchmesser in der Abbildung berechnet sich aus dem Ausbreitungsgebiet und dem
Abbildungsmaßstab. Es sei an dieser Stelle noch einmal darauf hingewiesen, dass die
Generierung der Pufferzone nicht nur durch reine Entfernungsangaben ausgehend vom Punkt
erfolgen muss. Temperaturdifferenzen, Niederschlagsmengen oder Einkommensunterschiede
können ebenfalls Variablen darstellen, die die Größe einer Pufferzone bestimmen. Ein
alternativer Punktpuffer ist ein Quadrat, dessen Durchmesser dem des Kreises entspricht. Ein
solcher Puffer findet vor allem in der Wirtschaftsgeografie Anwendung, wo Einzugsgebiete
durch eindeutige Kanten abgegrenzt werden können.
Das zweite Beispiel zeigt einen Linienpuffer. Nach BILL (1999:33) sind Linien- und
Flächenpuffer gleichzusetzen, da für die Modellierung von Flächen nur die Kante (also die
Grenze) relevant ist. Zu unterscheiden ist jedoch, dass bei einer Fläche die abgrenzende Kante
nur einen einseitigen Puffer im äußeren Gebiet erhält. Die gegenüberliegende Kante der
Fläche vervollständigt dann den Puffer. Ein Sonderfall ist, wenn der Puffer in die Fläche
hineingeht und das äußere Gebiet frei bleibt. Ein solcher Puffer wird „setback buffer“ genannt
(YEUNG 2002:207). Bei einer Linie wird der Puffer beidseitig modelliert. Wie bei den
Punktpuffern wird auch hier zwischen kreisförmigen und rechteckigen Puffern unterschieden.
Entlang der Kanten erfolgt die Modellierung identisch (Abb.6, Fall 1): Die Pufferzone wird
parallel zu der Linie bzw. Fläche mit dem gewünschten Abstand konstruiert. Es entstehen
zwei neue Parallelen, die jetzt das neu definierte Objekt abgrenzen. Das hier verwendete
Verfahren wird daher Parallelengenerierung von Vektordaten genannt (BILL 1999:33). An den
Knotenpunkten unterscheiden sich Kreis- bzw. Rechteckpuffer: Bei dem Rechteckpuffer
werden an den Anfangs- und Endpunkten des Graphen die Parallelen um jenen Wert
verlängert, der dem Abstand zwischen Linie bzw. der Kante des Objektes und der Parallelen
selbst entspricht. Die Parallelen werden durch eine Linie verbunden und die rechteckige
Pufferzone ist geschlossen (Abb.6, Fall 4). An den Knotenpunkten, in welchen sich mehrere
Kanten in einem Winkel von größer 0° treffen, kommt es zu Überlappungen der Rechtecke im
Innenwinkelbereich der „Abbiegung“ (Fall 3). Im Außenwinkel kann es zu einer
Vergrößerung der Pufferzone kommen. Bei Kreisförmigen Übergängen zwischen den
einzelnen Pufferzonen werden diese Effekte vermieden, da der Abstand zwischen der Linie
des Objektes und der Pufferzone konstant bleibt. Bei der Konstruktion dienen die Knoten als
Ausgangpunkt für den Kreisbogen, dessen Radius dem Abstand der Parallelen zu der Linie
des Objektes entspricht. Der Winkel des Kreisbogens wird durch den Winkel der aufeinander
treffenden Kanten bestimmt. Bei den Endpunkten einer Linie beträgt der Winkel 180°
(YEUNG 2002:207).
12
Abb.6: Punkt-, Linien-, und Flächpuffer (BILL 1999:33)
6.2 Zonengenerierung im Rasterdatenformat
Wie oben schon angedeutet wurde, werden Rasterzellen durch ein oder mehrere Attribute
charakterisiert. Hierbei handelt es sich nicht um Topologische Informationen – die Lage der
Rasterzellen wird durch den Zeilen- bzw. Spaltenindex bestimmt – sondern um
Sachinformationen, wie z.B. die Zugehörigkeit zu Objekten, Einwohnerzahlen,
Schadstoffgehalte in der Luft oder Wirtschaftsdaten wie durchschnittliche Konsumquoten.
Ein typisches Verfahren der Bildverarbeitung ist daher die Klassifizierung. Einzelne Raster
mit den gleichen Attributeigenschaften können zu einem Objekt zusammengefasst werden.
Wird eine Pufferzone um ein Objekt gelegt, werden alle Raster innerhalb dieser Zone mit der
Information belegt, dass sie jetzt zum Ausgangsobjekt gehören. In einem einfachen Modell, in
dem es nur 0 (ohne Zugehörigkeit zu einem Objekt) und 1 (gehört zum Objekt) gibt, erhalten
demnach alle Raster in der Pufferzone einheitlich den Wert 1.
Ein genaueres Verfahren ist die Abstandstransformation. Die Raster werden je nach Abstand
zum Objekt klassifiziert und erhalten daher Unterschiedliche Werte. In der Tab.3 ist dieses
Verfahren dargestellt. In der Originalmatrix sind alle Raster ohne Zugehörigkeit zum
Ausgangsobjekt mit einem „*“ gekennzeichnet. Das Objekt selbst wird hier mit „0“
gekennzeichnet. In der zweiten Matrix ist Ergebnis der Abstandstransformation abzulesen. In
diesem Beispiel wurde die Transformation nach der euklidischen Distanz berechnet. Der
Abstandswert Da wird über die direkte diagonale Verbindung der Rasterzellen nach
Da2 = Db + Dc
berechnet, wobei Db den vertikalen und Dc den horizontalen Abstand darstellen. Die
euklidische Distanz wird also über den Umweg der Manhattandistanz berechnet, die sich
durch
Da = Db + Dc
13
ergibt (LAURINI & THOMPSON 1992:135). Für das transformierte Bild in dem Beispiel würden
sich hieraus insgesamt höhere Werte für die Rasterzellen ergeben. Vor allem aber in der
Darstellung unmittelbarer Nachbarschaftsbeziehungen unterscheiden sich beide Distanzdarstellungen: Ein Raster, welches diagonal direkt an ein Objekt angrenzt und nach der
euklidischen Distanz den Wert 1 erhält, bekommt nach der Manhattandistanz den Wert 2.
Originalmatrix
Abstandstransformation
*
*
*
*
*
*
*
*
*
*
*
3
3
2
2
2
2
2
2
2
3
3
*
*
*
*
*
*
*
*
*
*
*
3
2
2
1
1
1
1
1
2
2
3
*
*
*
*
0
0
0
*
*
*
*
3
2
1
1
0
0
0
1
1
2
3
*
*
*
0
*
*
*
0
*
*
*
3
2
1
0
1
1
1
0
1
2
3
*
*
*
0
*
*
*
*
*
*
*
3
2
1
0
1
1
1
1
1
2
3
*
*
*
*
0
0
0
*
*
*
*
3
2
1
1
0
0
0
1
1
2
3
*
*
*
*
*
*
*
0
*
*
*
3
2
1
1
1
1
1
0
1
2
3
*
*
*
0
*
*
*
0
*
*
*
3
2
1
0
1
1
1
0
1
2
3
*
*
*
*
0
0
0
*
*
*
*
3
2
1
1
0
0
0
1
1
2
3
*
*
*
*
*
*
*
*
*
*
*
3
2
2
1
1
1
1
1
2
2
3
*
*
*
*
*
*
*
*
*
*
*
3
3
2
2
2
2
2
2
2
3
3
*
*
*
*
*
*
*
*
*
*
*
4
3
3
3
3
3
3
3
3
3
4
Tab.3a,b: Original- und Ausgabebild. Bearbeitet nach BILL (1999:35).
Ein weiterführender Schritt der Abstandstransformation, resultiert aus der großen Anzahl der
gebildeten Klassen. Aus Platzgründen wurden in der Abbildung nur vier Klassen abgebildet.
In der Praxis aber wird Hochauflösendes Bildmaterial eingesetzt. Eine Pufferzone um ein
Objekt (z.B. Lärmschutzbereich um eine Autobahn) kann somit einige Hundert Raster
belegen. Die hohe Anzahl der dadurch gebildeten Klassen kann durch das Verfahren der
Reklassifizierung reduziert werden. Durch einen Algorithmus, dem Schwellenwerte
zugewiesen wurden, werden den einzelnen Rasterzellen neue Attribute zugewiesen. In einem
zweiten Schritt werden die Rasterzellen mit denselben Attributen (Klassen) zusammengefasst,
um Redundanzen zu vermeiden (YEUNG 2002:208).
7 Zusammenfassung
Wie sich in dieser Arbeit herausgestellt hat, ist das Anwendungsspektrum von
Distanzanalysen sehr breit. Die Navigationssysteme der Autofahrer oder der Piloten
profitieren von ihnen genauso, wie Wirtschafts- oder Umweltinformationssysteme. „ShortestPath- Algorithmen sind aber nicht nur Herausforderungen für Geoinformationssysteme,
sondern können in allen Netzwerken (z.B. Internet) gleichermaßen angewendet werden.
14
8 Literatur
BILL R. (1999): Grundlagen der Geo-Informationssysteme. Band 1. Heidelberg.
BILL R. (1999): Grundlagen der Geo-Informationssysteme. Band 2. Heidelberg.
CASTLE(1993): Profiting from a Geographic Information System. Fort Collins.
DE LANGE N. (2002): Geoinformatik in Theorie und Praxis. Berlin.
HEYWOOD I., S. CORNELIUS & CARVER S. (2002): An Introduction To Geographical
Information Systems. Harlow.
LAURINI R. & D. THOMPSON (1992): Fundamentals of Spatial Informations Systems. London.
LONGLEY P.A., M.F. GOODCHILD, D.J. MAGUIRE & D.W. RHIND (2001): Geographic
Information Systems and Science. Chichster.
YEUNG(2002): Concepts and techniques of Geographic Information System. New Jersey.
FREUND E. (2004): Institut für Roboterforschung. www.irf.de.
JSI RESEARCH & TRAINING INSTITUTE, INC. (2004): www.jsi.com.
LANGE W. & D EXNER (2004): Institut für Medieninformatik und technische Informatik. FH
Flensburg. www.iti.fh-flensburg.de.
15
Herunterladen