Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Künstliche Intelligenz Fachbereich Informatik Jens Lüssem Reinhard Gerndt Wolfenbüttel, Sommersemester 2009 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - KI-Themen (I) Lokale Suchverfahren Breitensuche Greedy Search Einfache Suchverfahren Tiefensuche Hill Climbing A*-Suche Simulated Annealing Heuristiken Backtracking Tabu Search Constraint Satisfaction Problems Min Conflicts Genetische Algorithmen Evolutionäre Programmierung Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 Evolutionäre Algorithmen 2 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - KI-Themen (II) Logik Aussagenlogik Prädikatenlogik Fachbereich Informatik Logische Programmierung Heuristiken Jens Lüssem, Reinhard Gerndt, SS 2009 3 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - KI-Themen (III) Klassifikation Entscheidungsbäume Neuronale Netze Fachbereich Informatik Nearest Neighbor Heuristiken Jens Lüssem, Reinhard Gerndt, SS 2009 4 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - KI-Themen (IV) Unsicheres Wissen Bayessche Netze Heuristiken Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 5 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Gliederung der Veranstaltung Einführung & Motivation Suchverfahren Modellierung mit Logik Klassifikation Verarbeitung unsicheren Wissens Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 6 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Gliederung der Veranstaltung Einführung & Motivation Suchverfahren Modellierung mit Logik Klassifikation Verarbeitung unsicheren Wissens Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 7 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Agenda Themenblock: Einführung & Motivation – Organisation – Motivation – Agenten – Problemtypen Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 8 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Unterlagen: Folien und Literatur Organisation – Von Jens Lüssem, basieren teilweise auf einem Foliensatz aus der Universität Bonn – 10% Note durch Poster und Präsentation – 90% Note durch Klausur ohne Unterlagen – Vorlesung und Labor in Kooperation mit der FH Kiel (Jens Lüssem) – Selbststudienanteil – Labor mit Exkursion – Termin: t.b.d. Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 9 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Unterlagen: Folien und Literatur Literatur – Russel & Norvig: Artificial Intelligence – A Modern Approach (umfassendes Standardwerk, gibt es auch auf deutsch!) – Lämmel & Cleve: Künstliche Intelligenz (einfach geschrieben) – Luger: Künstliche Intelligenz (umfassendes Buch) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 10 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Motivation Sony startete am 11.05.1999 den Verkauf von einem vierbeinigen Unterhaltungsroboter „AIBO“ – Preis: ca. 2.500 € – AIBO ist ein autonomer Roboter – AIBO reagiert auf externe Stimulation Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 11 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Motivation Honda stellte am 10.07.2003 den Roboter „ASIMO“ vor – Preis: ca. 16.000 € (Tagesmiete) – ASIMO kann auf 2 Beinen gehen – ASIMO kann Treppen steigen – ASIMO kann (sehr) begrenzt auf Handsignale reagieren Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 12 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Motivation Was braucht ein intelligentes System? – Suchen nach Lösungen in einer Umwelt – Planung von Handlungsabläufen – Wahrnehmung der Umwelt – Ausführung von Handlungen – Repräsentation von Wissen über die Umwelt – Umgang mit Unsicherheit – Lernen – Her- bzw. Ableitung von neuem Wissen Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 13 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Motivation Was ist „künstliche Intelligenz“? – Einige Definitionen – Systeme, die wie Menschen denken • „The exciting new effort to make computers think ... machines with minds, in the full and literal sense“ (Haugeland, 1985) • „The automation of activities that we associate with human thinking, activities such as decision making, problem solving, learning ...“ (Bellmann, 1978) – Systeme, die wie Menschen handeln • „The art of creating machines that perform functions that require intelligence when performed by people“ (Kurzweil, 1990) • „The study of how to make computers do things at which, at the moment, people are better“ (Rich & Knight, 1991) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 14 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Motivation Was ist „künstliche Intelligenz“? – Einige Definitionen – Systeme, die rational denken • „The study of mental faculties through the use of computational models“ (McDermott, 1985) • „The study of the computations that make it possible to perceive, reason, and act.“ (Winston, 1992) – Systeme, die rational handeln • „Computational Intelligence is the study of the design of intelligent agents“ (Poole et al., 1998) • „Artificial Intelligence ... is concerned with intelligent behavior in artefacts.“ (Nilsson, 1998) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 15 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Ansatz: Systeme, die wie Menschen handeln Nachbildung menschlichen Verhaltens steht im Vordergrund – Beispiel: Turing-Test (in der KI kaum verfolgt) – Turing, Alan (1923 – 1954) • britischer Mathematiker • Erfinder der „Turing-Maschine“ – erstes Automatenmodell zur formalen Präzisierung der Begriffe Berechenbarkeit, Entscheidbarkeit etc. • Turing-Test (1950) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 16 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Ansatz: Systeme, die wie Menschen handeln Turing-Test (1950) – 5 min Online-Gespräch über Tastatur und Textbildschirm – Sprachverstehen: Natural Language Processing – Wissen: Automated Reasoning – Lernen: Machine Learning Übungsaufgabe: – Besuchen Sie „ALICE“ auf der Website „www.alicebot.org“ und führen Sie den Turing-Test durch. Zeichnen Sie Ihr Gespräch auf und berichten Sie darüber in der kommenden Woche. Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 17 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Ansatz: Systeme, die wie Menschen denken Welche kognitiven Fähigkeiten sind notwendig, um intelligente Leistungen wie Menschen zu erbringen? – hierbei ist es nicht wichtig, Aufgaben präzise zu lösen – vielmehr ist es wichtig, Aufgaben so wie ein Mensch zu lösen, nämlich approximativ – Gegenstand von Kognitionswissenschaft und kognitiver Psychologie Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 18 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Ansatz: Systeme, die rational denken Wie sollen wir denken? – Rationalität als idealisiertes Konzept von Intelligenz Logischer Ansatz: – Regeln für korrekte Schlüsse aus korrekten Prämissen Probleme: – Darstellung informeller Sachverhalte durch logischen Formalismus (W/F vs. Unsicherheit, Unschärfe und Unvollständigkeit) ist schwierig – Undurchführbarkeit prinzipieller Lösungsansätze durch Inferenz (Kombinatorische Explosion) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 19 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Ansatz: Systeme, die rational denken Agenten – lateinisch: agere – handeln, tun – agieren autonom in und mit ihrem Umwelt – nehmen durch Sensoren ihre Umwelt wahr (→ Perzepte) – manipulieren ihre Umwelt mit ihren Effektoren (→ Aktionen) Sensoren Perzepte Agent Umgebung Aktionen Effektoren Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 20 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Ansatz: Systeme, die rational denken Rationale Agenten – agieren so, dass gegebene Ziele erreicht werden unter folgenden Voraussetzungen: • Eindrücke von der Umwelt sind korrekt • Überzeugungen sind richtig – Rationales Denken ist eine Voraussetzung für rationales Handeln, allerdings keine notwendige Voraussetzung. ♣ Übungsaufgabe: – Beschreiben Sie mindestens eine Situation rationalen Handelns, der kein rationales Denken vorausging! Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 21 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Ansatz: Systeme, die rational denken Vorteile des Ansatzes über rationale Agenten – rationales Handeln umfasst i. A. rationales Denken – rationales Verhalten sollte allgemeinen Regeln folgen → Zugänglichkeit für eine wissenschaftliche Betrachtung → Sicht der Mathematik, Informatik und Ingenieurswissenschaften wird gestärkt: Definierbarkeit, Messbarkeit, Beweisbarkeit Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 22 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI-Landschaft ♣ Anwendungsfelder – Expertensysteme – Assistenzsysteme – Bildverstehende Systeme – Sprachverstehende Systeme – Sprachgenerierende Systeme – Robotik – ... Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 23 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI-Landschaft ♣ Methoden – Problemlösen und Suche – Wissensrepräsentation – Wissensverarbeitung – Verarbeitung unsicheren Wissens – Handlungsplanung – Maschinelles Lernen – Neuronale Netze – Bayessche Netze – ... Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 24 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI-Landschaft ♣ Interdisziplinarität – Informatik – Mathematik – Ingenieurswissenschaften – Psychologie – Philosophie – Linguistik – Biologie – Neurowissenschaften – ... Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 25 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI – gestern und heute ♣ Entstehung der KI – 1943-1956 zeitgleich mit der Entwicklung der ersten Computer beschäftigten sich die ersten Wissenschaftler mit der Frage: Können Computer den menschlichen Geist nachbilden? (→ Turing-Test) Frühe Beteiligung der Disziplinen: • Philosophie • Mathematik • Psychologie • Linguistik • Informatik Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 26 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI – gestern und heute ♣ Entstehung der KI – 1956 Dartmouth Workshop: McCarthy führt den Begriff Artificial Intelligence ein – 1960-1970 Demonstrationssysteme für Mikrowelten zeigen „intelligentes Verhalten“ – 1970-1980 Auftreten der ersten großen Probleme • Systeme für Mikrowelten nicht skalierbar (reale Anwendungen bleiben außen vor) • „Intelligentes Verhalten“ benötigt viel Wissen (Aufkommen von wissensbasierten Systemen) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 27 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI – gestern und heute ♣ Entstehung der KI – 1980-1988 • Kommerzieller Erfolg von Expertensystemen • intensive Forschungsförderung (v. a. fifth generation computer systems projects in Japan) • Rückkehr neuronaler Netze – 1989-1990 • Entzauberung von Expertensystemen • Ende des fifth generation computer systems projects • „KI-Winter“ Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 28 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI – gestern und heute ♣ Entstehung der KI – seit 1990 • Integration probabilistischer Methoden • Agentenorientierte Sichtweise • Mathematisierung von KI-Techniken Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 29 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI – gestern und heute ♣ KI – Status Quo – Verwendung vieler koexistierender Paradigmen • z. B. probabilistisch vs. analytisch (Computerlinguistik) • häufig auch Hybridansätze – Verwendung vieler Methoden • logische Methoden • algorithmische Methoden • entscheidungstheoretische Methoden Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 30 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI – gestern und heute ♣ KI – Status Quo – Verwendung vieler Herangehensweisen • theoretische Herangehensweise • systemorientierte Herangehensweise • experimentell algorithmische Herangehensweise Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 31 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI – gestern und heute ♣ KI – Status Quo – Beispiele für die experimentell algorithmische Herangehensweise • Viele KI-Probleme sind schwierig (NP-hart), können aber mit guten Heuristiken und Suchtechniken Probleminstanzen bis zu einer gewissen Größe gut lösen: – Erfüllbarkeit boolescher Formeln → randomisierte, lokale Suchtechniken können Formeln bis zu 2.500 Variablen lösen Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 32 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - KI – gestern und heute ♣ KI – Status Quo ♣ Übungsaufgabe: – Überlegen Sie sich, ob ein Roboter viele Umgebungsvariablen benötigt, um sich in einem unbekannten Raum zu bewegen! Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 33 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Was versteht man unter einem Agenten? Agenten – agieren autonom – nehmen durch Sensoren ihre Umwelt wahr (→ Perzepte) – manipulieren ihre Umwelt mit ihren Effektoren (→ Aktionen) Sensoren Perzepte Agent Umgebung Aktionen Effektoren Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 34 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Was versteht man unter einem rationalen Agenten? Rationale Agenten – ... machen das „Richtige“ – Zur Beurteilung rationaler Agenten müssen objektive Performanzkriterien angelegt werden – Beispiel: autonomer Staubsauger • Wie viele qm pro Stunde werden gereinigt? • Wie hoch ist der Reinheitsgrad? • Wie hoch ist der Stromverbrauch? • Wie hoch ist der Sicherheitsstandard? (Verhalten gegenüber Kleinkindern und Haustieren) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 35 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Was versteht man unter einem rationalen Agenten? Optimales Verhalten ist für rationale Agenten oft unmöglich: – unvollständige Wahrnehmung → Optimierung unter Unsicherheit – hohe Berechnungskomplexität → Optimierung unter Ressourcenbeschränkung Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 36 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Was versteht man unter einem rationalen Agenten? ♣ Rationale Agenten vs. allwissende Agenten – Ein allwissender Agent kennt sämtliche tatsächlichen Effekte seiner Aktionen – Ein rationaler Agent handelt dagegen auf Grund seines Wissens und seiner Wahrnehmungen. Er versucht die erwartete Performanz zu maximieren. Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 37 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Was versteht man unter einem rationalen Agenten? ♣ Rationales Handeln ist abhängig von: – Performanzkriterien (Ziele) – Wahrnehmungssequenzen (in der Regel ist eine aktive Wahrnehmung erforderlich) – Wissen über die Welt – möglichen Aktionen Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 38 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Was versteht man unter einem rationalen Agenten? ♣ Idealer rationaler Agent ... – ist ein Agent, der für alle möglichen Wahrnehmungssequenzen und gegebenem Wissen über die Welt die Aktion auswählt, die die Performanz maximiert. – wird realisiert durch eine Agentenfunktion: • Idealer_Rationaler_Agent: Wahrnehmungssequenz x Weltwissen → Aktion Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 39 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Was versteht man unter einem rationalen Agenten? ♣ Beispiele rationaler Agenten Agententyp Perzepte Aktionen Ziele Medizinisches Diagnosesyste m Symptome, Antworten von Patienten Fragen stellen, Tests durchführen Gesunder Patient, Krankenhaus, Minimierung von Patient Kosten Interaktiver Englisch-Tutor Eingegebene Worte Übungsaufgaben stellen, Korrektur Maximieren der Testergebnisse Gruppe von Studierenden SatellitenbildAnalysesystem Bildpunkt unterschiedlicher Helligkeit Kategorisierung des Bildmaterials Korrekte Kategorisierung Bilder des Satelliten Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 Umgebung 40 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Wie sieht die Struktur rationaler Agenten aus? ♣ Realisierung einer Agentenfunktion durch – ein Agentenprogramm und – einer Agentenarchitektur, die auch die Schnittstellen zur Umwelt realisiert (Perzepte, Aktionen) → Agentenstruktur = Agentenarchitektur + Agentenprogramm Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 41 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Wie sieht die Struktur rationaler Agenten aus? ♣ Prinzip eines Agentenprogramms function AGENT (Perzept) returns Aktion static: Wissen Wissen ← UPDATE-MEMORY (Wissen, Perzept) Aktion ← CHOOSE-BEST-ACTION (Wissen) Wissen ← UPDATE-MEMORY (Wissen, Aktion) return Aktion – Bemerkung: Bewertung der Performanz ist nicht Teil des Agenten, sondern erfolgt von außen. Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 42 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Wie sieht die Struktur rationaler Agenten aus? ♣ Prinzip eines tabellengesteuerten Agenten function TABLE-DRIVEN-AGENT (Perzept) returns Aktion static: Perzepte (initial: leere Liste), Tabelle (Perzeptsequenzen) Perzepte ← APPEND (Perzept) Aktion ← LOOKUP (Perzepte, Tabelle) return Aktion Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 43 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Wie sieht die Struktur rationaler Agenten aus? ♣ Probleme bei tabellengesteuerten Agenten – Tabelle kann sehr groß werden (z. B. beim Schach: 10150 Zeilen) – Tabelle muss explizit erstellt werden → aufwendig – Agentenfunktion kann man nicht als intelligent bezeichnen (z. B. keine Generalisierung möglich) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 44 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Welche Klassen von Agenten existieren? ♣ Einfache reflexive Agenten Agent Sensoren Regeln Welche Aktion soll ich ausführen? Umgebung Wie sieht die Welt aus? Effektoren – Reaktion nur aufgrund des aktuellen Perzepts (keine Betrachtung der Perzepthistorie) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 45 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Welche Klassen von Agenten existieren? ♣ Prinzip eines einfachen reflexiven Agenten function SIMPLE-REFLEX-AGENT (Perzept) returns Aktion static: Regeln (Regelmenge) Status ← INTERPRET-INPUT (Perzept) Regel ← RULE-MATCH (Status, Regeln) Aktion ← RULE-ACTION (Regel) return Aktion ♣ Bemerkung: Status: Interpretation nur aufgrund des aktuellen Perzepts Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 46 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Welche Klassen von Agenten existieren? ♣ Prinzip eines einfachen reflexiven Agenten – Ansatz sinnvoll für • vollständig beobachtbare Umwelt (Aktuelles Perzept umfasst die relevante Information für die Auwahl der Aktion) • die Lösung einfacher Aufgaben • das Auslösen von Reflexen Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 47 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Welche Klassen von Agenten existieren? ♣ Agenten mit internem Weltmodell Agent Sensoren – Weltmodell besteht aus: Status Wie sieht die Welt aus? Was bewirkten meine Aktionen? Regeln Welche Aktion soll ich ausführen? • Zustandsmodell Umgebung Wie verändert sich die Welt? • Änderungsmodell • Wechselwirkungsmodell Effektoren – Internes (Um-)Weltmodell bestimmt neben dem aktuellen Perzept die Auswahl von Aktionen Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 48 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Welche Klassen von Agenten existieren? ♣ Prinzip eines Agenten mit internem Weltmodell function REFLEX-AGENT-WITH-STATE (Perzept) returns Aktion static: Status (Beschreibung der Welt), Regeln (Regelmenge) Status ← UPDATE-STATE (Status, Perzept) Regel ← RULE-MATCH (Status, Regeln) Aktion ← RULE-ACTION (Regel) Status ← UPDATE-STATE (Status, Aktion) return Aktion Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 49 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Welche Klassen von Agenten existieren? ♣ Prinzip eines Agenten mit internem Weltmodell – Agent erhält eine neue Zustandsbeschreibung durch: • das Änderungsmodell (aktueller Zustand + Perzept) • das Änderungs- und Wechselwirkungsmodell (aktueller Zustand + Aktion) – Weltmodell umfassender als Perzepthistorie (nicht beobachtete und nicht beobachtbare Zusammenhänge fließen mit in das Weltmodell ein) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 50 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Welche Klassen von Agenten existieren? ♣ Zielbasierte Agenten Agent Status Was bewirkten meine Aktionen? Ziele Wie sieht die Welt aus? Was wird passieren, wenn ich die Aktion ausführe? Welche Aktion soll ich ausführen? Umgebung Wie verändert sich die Welt? Sensoren Effektoren – Weltmodell und Perzepte sind für die Aktionenauswahl nicht ausreichend, wenn die richtige Aktion von explizit vorgegebenen Zielen abhängt Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 51 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Welche Klassen von Agenten existieren? ♣ Nutzenbasierte Agenten Agent Sensoren Status Wie sieht die Welt aus? Was bewirkten meine Aktionen? Ziele Was wird passieren, wenn ich die Aktion ausführe? Wie „glücklich bin ich in diesem Zustand? Umgebung Wie verändert sich die Welt? – Meist führen mehrere Aktionsfolgen zu einem Ziel. Um eine Auswahl der nächsten Aktion zu treffen, kann der Nutzen des erreichten Zustands herangezogen werden Welche Aktion soll ich ausführen? Effektoren – Explizite Nutzenfunktionen sind umfassender als Zielrepräsentationen, da komplexere Zusammenhänge (z. B. Effizienz) einfließen können Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 52 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Wie kann die Umgebung charakterisiert werden? ♣ Charakterisierung der Umgebung – zugänglich vs. unzugänglich Sind alle relevanten Aspekte der Welt den Sensoren zugänglich? – deterministisch vs. nicht deterministisch Hängt der nächste Weltzustand allein vom jetzigen Zustand und der ausgeführten Aktion ab? – episodisch vs. nicht episodisch Kann die Qualität einer Aktion innerhalb einer einzelnen Episode (d. h. Perzept + Aktion) bewertet werden? – statisch vs. dynamisch Kann sich die Welt ändern, während der Agent reflektiert? – diskret vs. kontinuierlich Ist die Welt diskret? Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 53 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Wie kann die Umgebung charakterisiert werden? ♣ Beispiele für Umgebungen Umgebung zugänglich deterministisch episodisch statisch diskret Medizinisches Diagnosesystem Nein Nein Nein Nein Nein Interaktiver Englisch-Tutor Nein Nein Nein Nein Ja SatellitenbildAnalysesystem Ja Ja Ja teilw. SchachComputer Ja Ja Nein Ja Ja Nein Nein Nein Nein Nein Taxifahren Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 Nein 54 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Wie sieht die Struktur lernender Agenten aus? ♣ Ein lernender Agent evaluiert sich selbst, um eine bessere Performanz zu erreichen ♣ Ein lernender Agent besteht aus 4 Komponenten: – Performanzkomponente (Verwendung eines der beschriebenen Agentenkonzepte) – Bewertungskomponente (Bewertung der Performanzergebnisse anhand von Benchmarks) – Lernkomponente (Generierung von Änderungsvorschlägen für die Performanzkomponente aufgrund der Bewertung der bisherigen Performanzergebnisse) – Problemgenerator (Auswahl von Aktionen, die der Explorationen dienen) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 55 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Wie sieht die Struktur lernender Agenten aus? ♣ Lernende Agenten Benchmar k Bewertungskomponente Sensoren Feedback Änderungen Wissen Performanzkomponente Lernziele Umgebung Lernkomponente Problemgenerator Agent Fachbereich Informatik Effektoren Jens Lüssem, Reinhard Gerndt, SS 2009 56 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemlösende Agenten ♣ Entwurf von Agenten nach dem folgenden Schema: – Formulieren (des Problems) – Suchen (einer zum Erreichen des Ziels geeigneten Aktionsfolge) – Ausführen (dieser Aktionsfolge) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 57 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemlösende Agenten ♣ Einfacher problemlösender Agent Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 58 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemformulierungen ♣ Problemformulierung – Festlegung des Zustandsraumes der Welt • durch Abstraktion: ausschließliche Betrachtung relevanter Aspekte • mit Bestimmung des Problemtyps: abhängig vom verfügbaren Wissen über Zustände der Welt und Aktionen – Festlegung des Startzustands: Zustände der Welt mit bestimmten Starteigenschaften – Festlegung der Aktionen zur Überführung (Transformation) von Zuständen der Welt Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 59 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemformulierungen ♣ Problemformulierung – Formulierung des Zielzustands: Zustände der Welt mit bestimmten Zieleigenschaften – Bestimmung der Kosten: • für das Suchen (Suchkosten, Offline-Kosten) • für die Ausführung (Pfadkosten, Online-Kosten) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 60 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemformulierungen ♣ Beispiel: Staubsaugender Agent – Zustandsraum der Welt • 2 Agentenpositionen (jeweils eine in jedem Raum) • In jedem der Räume befindet sich entweder – Schmutz oder – kein Schmutz Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 61 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Problemformulierungen ♣ Beispiel: Staubsaugender Agent – Startzustand: jeder beliebige Zustand (Z) – Aktionen: • links (L) • rechts (R) • staubsaugen (S) – Zielzustand: kein Schmutz in beiden Räumen (d. h. Zustände 7 bzw. 8) – mögliche Lösungen bei Startzustand Z1: – Pfadkosten: pro Aktion eine Kosteneinheit • Lösung 1: – S (Z5) – R (Z6) – S (Z8) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 62 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemtypen ♣ Problemtypen: Wissen über Zustände und Aktionen – Einzustandsproblem • vollständig beobachtbare Umwelt • deterministische Aktionen → Agent weiß immer eindeutig, in welchem Zustand der Welt er sich befindet → Agent weiß immer eindeutig, in welchen Zustand der Welt er durch eine Aktion gelangen wird Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 63 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemtypen ♣ Problemtypen: Wissen über Zustände und Aktionen – Mehrzustandsproblem • vollständig unbeobachtbare Umwelt (keine Sensoren) → Agent weiß nur, in welcher Menge von Zuständen der Welt er sich befindet Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 64 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemtypen ♣ Problemtypen: Wissen über Zustände und Aktionen – Kontingenzproblem • partiell beobachtbare Umwelt oder • nichtdeterministische Aktionen → keine eindeutige Aktionsfolge zur Lösung ist im Voraus bestimmbar, da Abhängigkeiten bzgl. tatsächlicher Zwischenzustände vorliegen Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 65 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemtypen ♣ Problemtypen: Wissen über Zustände und Aktionen – Explorationsproblem • Umwelt und Effekte der Aktionen sind teilweise oder vollständig unbekannt → gruseligster Fall (sparen wir uns für ein späteres Kapitel auf) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 66 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemtypen ♣ „Staubsaugerwelt“ als Einzustandsproblem – Falls das Wissen um die Welt und die Aktionen vollständig ist, • weiß der staubsaugende Agent immer und • wo er sich befindet und Schmutz zu finden ist. – Problemlösen reduziert sich dann auf die Suche nach einem Pfad vom Startzustand zu einem Zielzustand Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 67 Informatik Fachhochschule Braunschweig / Wolfenbüttel - University of Applied Sciences - Problemtypen ♣ „Staubsaugerwelt“ als Einzustandsproblem 1 2 3 Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 68 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemtypen ♣ „Staubsaugerwelt“ als Mehrzustandsproblem – Aktionen des staubsaugenden Agenten sind verlässlich (Effekte der Aktionen sind deterministisch) – Agent besitzt allerdings keine Sensoren • Agent weiß somit (von Beginn an) nicht, wo er ist • Agent weiß somit (von Beginn an) nicht, wo Schmutz ist – Problem kann trotzdem gelöst werden • Zustände werden zu „Wissenszuständen“ (Belief States) Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 69 Fachhochschule Braunschweig / Wolfenbüttel Informatik - University of Applied Sciences - Problemtypen ♣ „Staubsaugerwelt“ als Mehrzustandsproblem Fachbereich Informatik Jens Lüssem, Reinhard Gerndt, SS 2009 70