Software zur Prognose von Ereignissen und Phänomen im Raum mit Methoden der künstlichen Intelligenz und GIS Gefördert durch das Bundesministerium für Wirtschaft und Technologie: Förderkennzeichen: IW072061 Silke Noack, Andreas Barth IW072061 2 Gliederung 1. Motivation 2. Lösungsansätze 3. Künstliche neuronale Netze 4. Software 5. Anwendungsbeispiele 6. Zusammenfassung IW072061 Folie 2 3 Motivation Karsttrichter Wo findet ein Ereignis statt? Lagerstättensuche Wo ist die Lagerstätte? Hangrutschung Welche Parameter beeinflussen es ? Steinschlag Wahrscheinlichkeit des Auftretens? Hangkrieche n IW072061 Folie 3 4 Schritte der Datenanalyse Eingangsinformation: Bodentypen, Geologie, Geländeeigenschaften, Landnutzung, Messdaten… Unser Wissen: bekannte Ereignisse, Zusammenhänge Möglichkeiten der Datenanalyse: analytische oder statistische Lösungansätze IW072061 Anwendung des Gelernten an ähnlichen Gebieten/ Problemen Prognosekarte Folie 4 Grundsätzliche Modellierungs- und Vorhersageansätze 5 Analytischer Ansatz: mathematische Modellierung • • • • setzen ein komplexes Verständnis der ursächlichen physikalischen und chemischen Zusammenhänge voraus E = f (a,b,c,d,g,...) Felduntersuchungen, Modellkalibrierung und -anwendung zeitaufwändig, teuer braucht viele verschiedene Daten (die in der Realität oft nicht verfügbar sind) Statistischer Ansatz: z.B. Regression, Diskriminanzanalyse, … Methoden künstlicher Intelligenz: Analyse von komplexen, nichtlinearen Zusammenhänge möglich lernfähig generalisierungsfähig robust arbeitet mit verfügbaren Daten IW072061 Folie 5 6 Prinzip künstlicher neuronaler Netze Vorbild Natur • Funktionsweise dem biologischen Nervensystem nachempfunden • besteht aus Nervenzellen (Neuronen) • Simulation der biochemischen Prozesse durch geeignete Rechenoperationen: Ausführung durch künstlichen Neuronen • meist schichtweise Organisation der Neuronen Nervenzelle als Prozessor • Verbindungen zwischen Neuronen = Gewichte wx Stärken oder schwächen das Eingangssignal sind gerichtet, werden trainiert • Eingangssignale werden zu einem einzigen Eingangssignal verrechnet: Propagierungsfunktion • Aktivierungsfunktion berechnet den Ausgabestatus des Neurons IW072061 Folie 6 7 Prinzip künstlicher neuronaler Netze Mehrschichtiger Netzaufbau Beispiel Wie lernt das Netz? Durch wiederholte Eingabe von Trainingsmustern wird die Stärke der Verbindungen zwischen den Neuronen modifiziert. Der Fehler zwischen erwarteter und tatsächlicher Ausgabe des Netzes wird minimiert. IW072061 Folie 7 Geodatenanalyse mit künstlichen Neuronalen Netzen und GIS 8 Eigenschaften unserer Software Einfache Verfügbarmachung von Methoden der künstlichen Intelligenz zur räumlichen Prognose Dokumentation des Workflows Erfassung und Pflege von Metadaten zu den Geodaten und deren Bearbeitung Werkzeuge zur Datenvorbereitung, Datennachbereitung, Darstellung Nutzerfreundlichkeit Ziel: breite Anwendergruppe durch Integration in Standard GIS- und Datenbanksoftware IW072061 VB.NET 2005 Folie 8 9 Komponenten Daten- und Modellexplorer GIS Extension IW072061 Application Meta Database SQL Server / SQL Server Express Project Database Referenzierte Datenquellen ESRI Grid + Shapefile / FGDB / PGDB Systemvoraussetzung: ArcGIS Desktop 9.2 + Spatial Analyst von ESRI Folie 9 10 Daten- und Modellexplorer Menü und Toolbar mit Werkzeugen und Funktionen Formular zur Erfassung, Bearbeitung und Anzeige zu Datenobjekten und Modellen Übersicht zu Datenobjekten und Modellen IW072061 Explorerbaum zum Navigieren in Projekten Funktionalität per Kontext Meldungsfenster mit Informationen zu Status, Warnungen, Fehlern Folie 10 GIS-Extension mit Toolbar und Treeview 11 Toolbar mit Werkzeugen zur Datenbearbeitung und zur Kommunikation mit IW072061 Treeview der Projekte und ihrer Daten mit Funktionalität zum Daten laden und zur Kommunikation mit Folie 11 Arbeitsablauf und Softwareunterstützung 12 Arbeitsschritte: 1. Formulierung der Aufgabenstellung 2. Abgrenzung des Modellgebiets 3. Zusammenstellen der Datengrundlagen 4. Datenaufbereitung (datentechnisch, fachlich) 5. Statistisches Preprocessing (Skalentransformationen, Datenpartitionierung, Dimensionsreduktion…) 6. Aufbau und Berechnen der Modellszenarien 7. Statistisches Postprocessing (Bewertung Generalisierungsfähigkeit, Reproduzierbarkeit, Robustheit… ) IW072061 8. Darstellung der Prognoseergebnisse Folie 12 13 1. Formulierung der Aufgabenstellung Formulierung der Aufgabenstellung: Was ist Gegenstand? Was will ich herausfinden? IW072061 Folie 13 2. Abgrenzung des Modellgebiets Festlegen des Rasters Abgrenzung des Projektgebietes Abgrenzung von Teilgebieten für Training, Test und Validierung 14 IW072061 Folie 14 3. Zusammenstellen der Datengrundlagen 15 IW072061 Erfassen von relevanten Daten und zusätzlichen Informationen Bodenkarte (Quelle: sächs.LFUG) Folie 15 4. Datenaufbereitung (datentechnisch, fachlich) Fachliche und technische Datenaufbereitung: z.B. Ableiten von Sand-, Schluff-, Tonanteilen (Quelle: BKKonz, Sächs. LfUG) 16 IW072061 Folie 16 5. Erstellen der Modelleingangsdaten Erstellen konsistenter Rasterdaten unter Berücksichtigung des Basisrasters und des Projektgebietes: Hier z.B. Bodenbestandteile und Hangneigung im EZG des Reichstädter Bach (Quelle: BKKonz, Sächs. LfUG, Sächs. LVermA) 17 IW072061 Folie 17 6. Aufbau und Berechnen der Modellszenarien 18 IW072061 Aufbau parametrisierter Modelle: Definierte Analysemethode Anlegen von Trainingsszenarien mit definierten Input und Parametern Training des Netzes Folie 18 8. Darstellung der Prognoseergebnisse 19 IW072061 Karte mit Prognoseergebnissen (Quelle des Luftbildes: Sächs. LVermA) Folie 19 Praxistest: Prognose niederschlagsindizierter Bodenerosion 20 Bearbeitungsgebiet: Einzugsgebiet der Weißeritz, Sachsen Trainingspunkte (überwachtes Lernen): Erfassung von Abtragsflächen aus Orthofotos (2002 nach Augusthochwasser aufgenommen, Quelle Sächs. LVermA)) Verschiedene Eingangsdaten: Bodenkonzeptkarte, DGM, Nutzungsdaten Datenformat / Codierung: IW072061 Erstellen der Modelleingangsinformationen im Rasterformat Skalentransformation: Metrisches Skalenniveau: Transformation auf Wertebereich [0..1] Nominales Skalenniveau: Binäre Codierung (0/1: An-/Abwesenheit) Folie 20 Praxistest: Prognose niederschlagsindizierter Bodenerosion 21 KNN-Parameter: • • • • Nutzung von Feedforward-Netzen: Multilayer-Perceptron Lernalgorithmus: RPROP = Abwandlung des Backpropagation-Algorithmus Aktivierungsfunktion: Sigmoidfunktion (logistische Funktion) Netzwerktopologie, z.B.: 7 - 15 - 1 Beispiel einer Netzkonfiguration: Schluffanteil / Gesamtboden Tonanteil / Gesamtboden Sandanteil / Gesamtboden Ackerflächen Erosionswahrscheinlichkeit Grünlandflächen Fließakkumulation IW072061 . . . Hangneigung Folie 21 22 Praxistest: Prognose niederschlagsindizierter Bodenerosion Eingangsdaten: verschiedene thematische Karten Training mit bekanntem Muster, z.B. Erosionsflächen IW072061 Folie 22 Validierung der Prognose 23 Vergleich der Prognoseergebnisse mit bekannten Testflächen (nicht als Trainingsflächen verwendet) Insgesamt ca. 90% der Flächen erkannt (mit p > 75%) IW072061 Folie 23 24 Überprüfung der Ergebnisse durch Begehung vor Ort IW072061 Folie 24 25 Erosion: Planung von Schutzmaßnahmen Planungsmaßnahmen: z.B. Pflanzen von Hecken IW072061 Auflösung 5m Eingabedaten: Schluff-, Ton-,Sandanteil Acker und Grünland Hangneigung Fließlänge Folie 25 26 Praxistest: Prognose von Lagerstätten Training mit bekanntem Muster, z.B Lagerstätten Prognose von Rohstofflagerstätten im Kosovo Datenquelle: Independent Commission for Mines and Minerals, Prishtina, Kosovo IW072061 Folie 26 Praxistest: Prognose von Lagerstätten 27 Praxistest an verschiedenen Lagerstätten: Blei/Zink Gold Chrom … IW072061 Folie 27 Zusammenfassung • Neuronale (MLP-) Netze sind zur Analyse und Prognose räumlicher Probleme geeignet . • Mit einem moderaten Aufwand an Datenaufbereitung und Berechnungszeit können gute Ergebnisse erzielt werden. • Die Software macht diese Vorteile für den (ESRI-)GISAnwender in einer nutzerfreundlichen Umgebung verfügbar und komfortabel nutzbar. • Nutzer von werden in die Lage versetzt, parametrisierte Modelle nachvollziehbar aufzubauen und zu dokumentieren. 28 IW072061 Folie 28 29 Vielen Dank für Ihre Aufmerksamkeit IW072061 Folie 29