Einsatz digitaler Landkarten bei der Visualisierung, Analyse und Berechnung von Business-Informationen Gerrit Schreiber, GfK GeoMarketing, Hamburg Schlüsselworte: Thematische Karten, räumliche Auswertungen, Oracle Spatial, Oracle Maps, MapViewer Vektorkarten, SDO_GEOMETRY, GfK GeoMarketing, digitale Landkarten, Regionale Potenzialdaten, Geodaten, GIS, Business Intelligence, Business Mapping, Spatial SQL, Visualisierung Einleitung Viele Aspekte im Informationsmanagement von Unternehmen wie z.B. Lieferplanung, Vertriebsgebietsplanung oder Expansionsplanung beinhalten räumliche Dimensionen. Da ist es wenig überraschend, dass räumliche Daten heute ganz alltäglich eingesetzt werden, nicht nur in InternetDiensten oder Navigationsgeräten, sondern auch in Geschäftsanwendungen für Vertriebssteuerung, Marketing oder Controlling. Durch rein tabellarisch strukturierte Daten können „topologische Beziehungen“ und geografische „Kon- und Disjunktion“ unterschiedlicher Informationen nicht erkannt und damit nicht genutzt werden. Dies ist umso augenfälliger, als jede Datenbank seit jeher eine große Anzahl von GeoAttributen enthält, wie z. B. Kundenadressen oder räumliche Zuordnungen (zu einer Filiale oder einem Liefergebiet). Der Vortrag zeigt anhand von Beispielen aus der Praxis den unmittelbaren Nutzen, den die Verknüpfung von Unternehmensdaten auf digitalen Landkarten für Unternehmen bringt. Darüber hinaus werden die formellen Bedingungen sowohl seitens des Daten- als auch seitens des Kartenmaterials erörtert. Verknüpfung von Daten mit digitalen Landkarten Sie sind ein täglicher Begleiter in unserer heutigen Welt. So selbstverständlich wie einen Text oder eine Tabelle betrachten und lesen wir Landkarten. Landkarten verdeutlichen uns räumliche Zusammenhänge, sei es in Magazinen, Reports, im Internet, im Fernsehen oder als Wandkarte im Büro. Karten vermitteln in verdichteter Form eine Vielzahl an Informationen, manche davon sind auch nur über dieses Medium darstellbar. Daher haben Karten auch seit jeher einen festen Platz bei Unternehmen und Organisationen. Denn die überwältigende Mehrheit aller Geschäftsprozesse - strategisch wie operativ - beinhaltet entscheidungsrelevante räumliche Aspekte; sei es bei der Planung von Geschäftsstellen bzw. Außendienstmitarbeiten, bei der Filial- und Expansionsplanung, im Kundenservice und der Kundeninformation, bei Produktionsabläufen über mehrere Standorte, bei der Liefertarifierung und Planung von Lieferzonen, der Kundenanalyse nach Verteilung oder bei der Marktanteilsbestimmung und Wettbewerbsanalyse. Nicht ohne Grund ist der Suchmaschinenhersteller Google bereits Mitte des letzten Jahrzehnts dazu übergegangen, sämtliche Informationen und Services direkt auf einem digitalen Modell der Weltkugel abzubilden. Und das lässt sich im Prinzip auch mit jeder Unternehmensdatenbank realisieren. Dass in der Vergangenheit das Medium Landkarte nicht noch intensiver zum Einsatz kam - jenseits der im Büro aufgehängten Orga-Wandkarte - ist dem einstmals „sperrigen“ Handling von Geodaten geschuldet. Die Verwendung genauer Lagebeschreibungen durch räumliche Koordinaten blieb Spezialanwendungen im Planungs-, Netz- oder Liegenschaftsbereich vorbehalten. Das hat sich mit der heutigen Geoinformations-Technologie fundamental gewandelt; die Verknüpfung von Daten mit digitalen Landkarten ist technisch kein Problem mehr und so ist die Nachfrage nach geografischen Unternehmenslösungen riesig. Denn in jeder Datenbank, auch ganz ohne GIS-Fachschale, wimmelt es bereits von geografischen Attributen. Seien es unmittelbare Ortsangaben wie Kunden-/Geschäftsstellen-/Filialadressen (Str., PLZ, Ort), Tarifzonen oder Zuständigkeiten von Vertriebsbüros (nach PLZ, Ländern etc.), Vertreter-Kunde-Beziehungen oder Besuchstouren (von A nach B), oder gar standortbeschreibende Zusatzinformationen wie beispielsweise die Angabe des Landkreises, in dem ein Standort liegt oder auch die Entfernung eines Kunden zur nächsten Geschäftsstelle etc. An letzterem Beispiel wird deutlich, dass die Speicherung einer Ortsangabe in Form eines TextStrings bestenfalls eine Krücke ist. Was passiert beispielsweise, wenn die Adresse der Geschäftsstelle sich verändert? Spätestens seitdem Unternehmen ganz unmittelbar mit primären Geodaten (wie Längen-/Breitengrad) aus den GPS-Geräten der LKW-Flotte oder im Handheld des Außendienstmitarbeiters konfrontiert sind, ist klar: An der Verwaltung von Geodaten kommt fast kein Unternehmen mehr vorbei. Beispiele für den Einsatz von digitalen Landkarten Der „offensichtliche“ – aber keineswegs einzige – Vorteil von Landkarten erwächst aus der Möglichkeit, eine Vielzahl von Informationen verdichtet in nur einer Grafik zu integrieren. Häufigster Ausgangspunkt für den Einsatz von Karten in Unternehmensdatenbanken ist die Darstellung eigener Unternehmensdaten. Beispiel 1: Abbildung und Analyse der Kundenstruktur mit der digitalen Landkarte Im abgebildeten Beispiel (Abb. 1) sind die kaufenden Kunden eines Versandhändlers in der Karte dargestellt. Allein die geocodierten Herkunftsadressen erlauben auf den ersten Blick zahlreiche Rückschlüsse. So ist beispielsweise unübersehbar, dass Baden-Württemberg ein Verkaufsschwerpunkt des Händlers ist. Die Karte erlaubt es, noch einen Schritt weiter zu gehen: Aufgrund der geografischen Referenzierung können diese internen Unternehmensdaten mit externen Indikationen verknüpft und dadurch objektiviert werden, beispielsweise über die Einwohnerzahl als Kunden je 1.000 Einwohner. In der Darstellung als „Kundendichte“ wird deutlich, dass die Marktposition des Unternehmens beispielsweise im Westen von Nordrhein-Westfalen keineswegs so gut ist, wie es auf den ersten Blick scheint. Gleiches gilt für die meisten Großstädte, in denen die Marktposition ebenfalls unterdurchschnittlich ist. Abb. 1 a-c: Unüberschaubare Kundendaten (1a) erlauben auf eine Karte projiziert (1b) zahlreiche Rückschlüsse. Die Kartendarstellung ermöglicht darüber hinaus die Verknüpfung mit anderen Informationen, beispielsweise zur Kundendichte pro Einwohner je Landkreis (1c). Beispiel 2: Auswertung von Kassenbefragungen und Einzugsgebieten Ein Einzelhändler hat über einen bestimmten Zeitraum hinweg seine Kunden nach ihrer Wohn-PLZ befragt. Die gesammelten Nennungen ergeben, in einer PLZ-Karte dargestellt, ein höchst aufschlussreiches Bild. Abb.2: Die Karte visualisiert die Absolutzahl von PLZ-Nennungen im Zuge einer Kassenbefragung eines Einzelhändlers mit Sitz in Mannheim. Über diese rein visuellen Erkenntnisse hinaus kann man eine funktionale Abhängigkeit herleiten, also den Zusammenhang zwischen Entfernung und Umsatz je Einwohner, der – wie in diesem Beispiel – keineswegs linear und noch nicht mal in alle Richtungen gleich stark ausgeprägt sein muss. Am Schluss steht unter anderem die Erkenntnis, wie groß (bevölkerungsreich/kaufkräftig) das Umfeld eines erfolgreichen Standortes ist – eine essenzielle Information zum Beispiel für die Bewertung von potenziellen Neustandorten. Abb.3, 4: Über die Verknüpfung mit der digitalen PLZ-Karte kann in einem Scatterplot ein funktionaler Zusammenhang von Entfernung und Umsatz je Einwohner hergestellt werden. Auch „Ausreißer“(rot und grün markiert) können identifiziert und untersucht werden. Für das so modellierte Einzugsgebiet können dann Einwohner-, Haushalts- oder beliebige andere Daten berechnet werden. Beispiel 3: Einsatz digitaler Landkarten bei der Analyse und Steuerung von Vertriebsaktivitäten. Nahezu jedes Unternehmen und jede Organisation steht vor der Notwendigkeit, den Verkauf seiner Produkte oder Dienstleistungen geografisch zu organisieren. Kein Wunder also, dass die Vertriebsabteilung traditionell der Bereich ist, der im Unternehmen schon am längsten und am umfangreichsten Landkarten und – seit EDV-Einführung – digitale Landkarten einsetzt. Branchenübergreifend kommen dabei dieselben Methoden zum Einsatz, die in Kurzform wie folgt beschrieben werden können: Alle vertriebsrelevanten Kennziffern und Werte werden auf der digitalen Landkarte verortet. Dazu gehören Kundenstandorte mit all ihren Attributierungen wie Umsatz oder Liefer/Besuchshäufigkeit, genauso wie Filial- und auch Wettbewerbsstandorte. Auch weitere, externe Potenzialkennziffern, wie die Verteilung der Haushalte, des Kaufkraftvolumen oder Gewerbestatistiken werden in der Karte platziert. All diese Informationen werden – gleichsam wie auf den „kleinsten gemeinsamen Nenner“ – auf eine Gebietseinheit, zumeist das PLZ-Gebiet zusammengefasst. Erst durch diese „Standardisierung“ unterschiedlichster Informationsquellen wird eine objektive regionale Bewertung und Planung möglich. Diese Daten pro Gebietseinheit können dann für die Bewertung oder auch Planung von Vertriebsgebieten aggregiert werden. Beispielsweise, um die regionale Vertriebsperformance regelmäßig auszulesen und in Reports auf Karten zu visualisieren. Abb. 5: Mit Hilfe von digitalen Landkarten können Daten unterschiedlichster Herkunft (linke Karte) in einem Gebietsraster – hier die PLZ-Gebiete – in numerischen Werten (rechte Karte) pro Gebietseinheit (PLZ-Gebiet) zusammengefasst und auf diese Weise standardisiert werden. Abb. 6: Vertriebsgebietskarte, bestehend aus aggregierten Postleitzahlen. Unzählige Zusatzinformationen lassen sich durch die Aggregation von Unternehmensdaten auf digitalen Landkarten generieren; so wird beispielsweise deutlich, dass das Gebiet ‚Goergen‘ mit der gleichen Anzahl an Filialen fast dreimal so viele Haushalte erreichen muss wie das Gebiet ‚Etgeton‘. Es gibt also eine ganze Reihe von Berechnungen, die sich ausschließlich auf der Basis von auf Landkarten geocodierten Unternehmensdaten durchführen lassen. Im letzten Abschnitt werfen wir daher einen genaueren Blick auf die erforderliche Methodik und die Kartenbasis. Beispiel 4: Risikomodellierung auf Basis von digitalen Landkarten Da Großschadenslagen, beispielsweise infolge von Naturkatastrophen, sich in der Regel regional konzentrieren, ist es insbesondere für die Rückversicherungsbranche essentiell, die Prämienberechnung auf Basis einer räumlichen Modellierung durchzuführen. Rückversicherer, beispielsweise die „Swiss RE“ oder „Munich Re“, sind bei Katastrophen zeitgleich mit einem hohen Forderungsvolumen durch andere Versicherungsunternehmen konfrontiert, die sich ihrerseits für solche Großschadensfälle rückversichert hatten. Um dieses Geschäft überhaupt kalkulierbar zu machen, wird sowohl die Eintrittswahrscheinlichkeit von (Natur-)Katastrophen als auch das potenzielle Versicherungsvolumen (repräsentiert durch Menschen und Güter) auf digitalen Landkarten modelliert und räumlich differenziert bewertet. In einer sogenannten CRESTA-Karte (Catastrophe Risk Evaluating and Standardizing Target Accumulations) ist die gesamte Welt in Gebiete (Accumulations) unterteilt, deren Raster die Grundlage für alle Versicherungsberechnungen ist. Abbildung 7 – 10: Auf Basis der Sturmläufe in den vergangenen 50 Jahren (Abb. 7) wird pro CRESTA-Zone eine Wahrscheinlichkeit für das Sturmschadensrisiko ermittelt (Abb. 8). In Kombination mit der tatsächlichen Bevölkerungsverteilung (Abb. 9) werden dann jene CRESTA-Zonen ausgewiesen, für die aufgrund großer Bevölkerung und hohem Sturmrisiko ein erhöhtes Risiko für Großschadenslagen besteht (Abb.10). Das gezeigte Beispiel nimmt Bezug auf den Sturm „Irene“, der im Spätaugust die Ostküste der USA bis nach New York streifte. Obgleich deutlich schwächer ausgefallen als befürchtet, war dieser Sturm aus versicherungswirtschaftlicher Sicht dennoch vergleichsweise gravierend, da er durch dichtbesiedeltes und begütertes Gebiet zog. Entsprechend viele Forderungen bestanden (und bestehen) nun gegenüber Versicherungen. Nur digitale Landkarten erlauben es der Versicherungswirtschaft, so unterschiedliche Datenquellen wie Wetteraufzeichnungen, die Verteilung von Haushalten oder Standorte von Versicherungsgütern in einem Modell zu vereinen. In der Landkarte kann für jede CRESTA-Zone so ein individuelles Risiko berechnet und ein potenziell bereit zu stellendes Finanzvolumen ermittelt werden. Qualitätsmerkmale und Datentypen bei geografischen Primärdaten Landkartengeometrien sind die logische Fortentwicklung von Datenbanken, da sie getreu dem EntitiyRelationship-Modell oder auch dem Objektmodell präzise und redundanzfrei eine Vielzahl an Eigenschaften zu einem Punkt, einem Gebiet oder auch einem dreidimensionalen Objekt beschreiben. Ein mit geografischen Koordinaten versehener (geocodierter) Standort beispielsweise kann jederzeit einem Gebiet zugeordnet werden – auch nach einer Gemeindereformen oder veränderten Gebietszuordnungen bleiben dabei die Standortinformationen aktuell. Abb 11.: Die Speicherung der Geo-Koordinaten eines Standortes (z.B. Nürnberg Messe) ermöglicht die redundanzfreie Verknüpfung mit zahlreichen zusätzlichen Informationen wie Postleitzahlgebiet, Verwaltungsbereich, aber auch die Berechnung der nächsten U-Bahn-Station oder BAB-Anschlussstelle. Zudem eröffnet das Landkartenmodell – wie gezeigt – unzählige zusätzliche Möglichkeiten der Analytik. Seien es: Topologische Zusatzinformationen über Form, Größe und Lage und Beziehung zwischen Objekten. Nur so lässt sich beispielsweise die Frage lösen, welche PLZ-Gebiete im Umkreis X eines Standortes liegen. Kon- und Disjunktion von verschiedenen Informationsquellen. Nur so kann man einen räumlichen Zusammenhang herstellen zwischen unterschiedlichen Werten: aus einer Kundentabelle und einer Einwohnerstatistik wird so beispielsweise die Kundenzahl je 1.000 Einwohner pro Landkreis. Diese Möglichkeit, ad-hoc über Anfragen alle notwendigen Zusatzinformationen zu erhalten, macht die Stärke von digitalen Landkarten aus. Sie ist im Prinzip als Erweiterung jeder Datenbank denkbar. Ohne es an dieser Stelle erschöpfend zu thematisieren, ist darauf hinzuweisen, dass Oracle alle Module für die Haltung und Auswertung geografischer Informationen bereithält. Die Oracel Spatial Option beinhaltet bereits einen Geocoder, der – in Verbindung mit einer Adressdatenbank – Adressdaten in Geokoordinaten transkribiert. Überdies ist Oracle mit der Spatial Option in der Lage, alle gängigen Geodaten-Typen zu verarbeiten, wie: Vektordaten (OGC1 Simple features2) SDO_GEOMETRY sowie ST_GEOMETRY, Letzterer als ISO/OGC konforme Abbildung. Rasterdaten (Luft- oder Satellitenbilder) SDO_GEORASTER. Komplexe dreidimensionale Objekte (Point Clouds oder Triangulated Irregular Network) SDO_TIN und SDO_PC. (Wobei in der Businessanalyse fast ausschließlich erstere Datentypen, die Vektordaten, zum Einsatz kommen.) Um die enthaltenen toplogischen und geometrischen Zusammenhänge in einer Datenbank nutzen zu können, steht außerdem eine entsprechend erweiterte Abfragesprache zur Verfügung, etwa eine „Spatial SQL“, mit der man Bedingungen wie „liegt in“, „grenzt an“ und viele weitere Eigenschaften abfragen kann. Abb 12. Beispiel für räumliche Abfrage mit SQL (Städte mit 10-20 Tausend Einw. in den gespeicherten PLZ1-Gebieten plus Zusatzinformationen). Der SQL-Operator SDO_RELATE dient zum Überprüfen von topologischen Beziehungen zwischen Geometrien. So kann u.a. festgestellt werden, ob Geometrien sich berühren (touch), deckungsgleich sind (equal) oder eine sich innerhalb einer anderen befindet (inside). 1 Open Geospatial Consortium – Internationales Standardisierungsgremium im Bereich Geoinformationen Speichern, Abrufen, Auswerten und Ändern von einfachen Geometrien (geometrische Primitive, wie Punkte, Linien und Polygone) 2 Sollen Karten in Anwendungen integriert werden, stellt sich nicht nur die Frage, mit welchen Werkzeugen die Anwendung erstellt werden kann, sondern auch, woher die notwendigen Geodaten kommen. Denn neben den (Unternehmens-)eigenen geocodierten Standortinformationen benötigt man auch die genauen Koordinaten z.B. von PLZ-Gebieten oder administrativen Grenzen. Die Erzeugung und Pflege dieser Geodaten ist bis heute zu einem ganz wesentlichen Teil Handarbeit. Denn obwohl Geodaten in Form von gigantischen Luftbild-Mengen verfügbar sind, bleiben auf diesen Rasterdaten die meisten unternehmensrelevanten Informationen, wie Verwaltungsgrenzen, Postleitbereiche oder Verkehrsverbindungen unsichtbar. Diese Informationen müssen - größtenteils in Handarbeit - recherchiert, gepflegt und in einem einheitlichen Bezugs- (Koordinaten-)System als Linien digitalisiert werden. Vektordaten sind daher im Businessmapping wichtiger als Rasterdaten, haben aber auch deutlich höhere Qualitätsanforderungen: 1. Vollständigkeit: Geografische Zuordnung und Analyse von Daten kann nur erfolgen, wenn alle Raumeinheiten – seien es Gemeinden, Kreise, Ortsteile oder Postleitzahlen – vollständig und flächendeckend verzeichnet und auch ebenso vollständig mit ihren offiziellen Namen (PLZ, Gemeindeschlüssel, Kreisname, etc.) attributiert sind. 2. Logische Konsistenz: Alle verwendeten Vektordaten (z.B. Straßen + Verwaltungsgrenzen) sollten in einheitlicher Genauigkeit vorliegen. Idealerweise haben alle Daten die gleiche Digitalisierungsgrundlage. 3. Positionsgenauigkeit: „Niemandsland“ gibt es weder in der Verwaltung noch bei der Post; Lücken oder gar Überlappungen von Gebieten darf es nicht geben. Gerade im PLZ-System entscheidet oft die Straßenseite über die Zugehörigkeit zu einer Lieferzone. Manche Linien beschreiben mehrere Objektgrenzen. Wenn Beispielsweise die Mitte eines Flusses gleichzeitig Grenze eines Bundeslandes und einer Postleitregion ist, sollte das aus den Kartendaten klar hervor gehen. 4. Zeitliche Genauigkeit: Post, Verwaltung und Straßennetz unterliegen stetiger Veränderung was sich auch in den Kartengrundlagen ablesen lässt. Alle Karten sollten einen aktuellen, zumindest aber einem einheitlichen Datenstand haben. 5. Thematische Genauigkeit: Thematische Unterschiede liegen oft im Detail, sind aber dennoch von großer Bedeutung. Französische Departements zum Beispiel sind fast deckungsgleich mit den Grenzen der zweistelligen Postleitzahl – aber eben nur fast. Der Nutzer muss sich auf die thematisch korrekte Spezifikation der Karten verlassen können. Weil die zugrundeliegenden Karteninformationen zu alledem auch noch so unterschiedlichen Ursprungs sind - von Verwaltungs-, bzw. Postinstitutionen aus verschiedenen Ländern -, gibt es bis heute wenige Anbieter, die vollständige Kartengrundlagen entsprechend dieser Qualitätsanforderungen bereit stellen können. Tatsächlich ist in der Vergangenheit die mangelnde Verfügbarkeit digitaler Landkarten mit der größte ‚Bremsklotz‘ für die Etablierung Geografischer Informationssysteme in Business-Anwendungen gewesen. Zu den Anbietern solcher Karten zählt seit bald 20 Jahren GfK GeoMarketing, eine Tochter der GfK. Mit der Erstellung und Pflege von weltweiten administrativen und postalischen Landkarten hat das Unternehmen eine Marktlücke besetzt und bietet inzwischen die weltweit vollständigste Sammlung solcher digitalen Vektordaten. Neben den Quasi-Standard-Formaten wie beispielsweise „Shape-Files“ werden die Karten auch standardmäßig im Oracle-konformen Dateiformat angeboten. http://www.oracle.com/technetwork/database/options/spatial/downloads/partners Oracle verweist auf den Spatial-Seiten im Oracle Technology Network auf die von unseren Partnern im Oracle Format bereitgestellte Datensets 3. Dort finden Sie auch den Zugang zu den von GfK GeoMarketing bereitgestellten Daten. Kontaktadresse: Gerrit Schreiber GfK GeoMarketing GmbH Herrengraben 3-5 20459 Hamburg Telefon: Fax: E-Mail Internet: 3 +49 (0) 40-5701 325 32 +49 (0) 40 227 72 82 [email protected] www.gfk-geomarketing.de http://www.oracle.com/technetwork/database/options/spatial/spatial-partners-data-087203.html