Künstliche Intelligenz - public.fh

Werbung
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Künstliche Intelligenz
Fachbereich Informatik
Jens Lüssem
Reinhard Gerndt
Wolfenbüttel, Sommersemester 2009
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
KI-Themen (I)
Lokale
Suchverfahren
Breitensuche
Greedy Search
Einfache
Suchverfahren
Tiefensuche
Hill Climbing
A*-Suche
Simulated Annealing
Heuristiken
Backtracking
Tabu Search
Constraint
Satisfaction
Problems
Min Conflicts
Genetische
Algorithmen
Evolutionäre
Programmierung
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
Evolutionäre
Algorithmen
2
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
KI-Themen (II)
Logik
Aussagenlogik
Prädikatenlogik
Fachbereich Informatik
Logische
Programmierung
Heuristiken
Jens Lüssem, Reinhard Gerndt, SS 2009
3
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
KI-Themen (III)
Klassifikation
Entscheidungsbäume
Neuronale Netze
Fachbereich Informatik
Nearest Neighbor
Heuristiken
Jens Lüssem, Reinhard Gerndt, SS 2009
4
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
KI-Themen (IV)
Unsicheres Wissen
Bayessche Netze
Heuristiken
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
5
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Gliederung der Veranstaltung
 Einführung & Motivation
 Suchverfahren
 Modellierung mit Logik
 Klassifikation
 Verarbeitung unsicheren
Wissens
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
6
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Gliederung der Veranstaltung
 Einführung & Motivation
 Suchverfahren
 Modellierung mit Logik
 Klassifikation
 Verarbeitung unsicheren
Wissens
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
7
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Agenda
 Themenblock: Einführung & Motivation
– Organisation
– Motivation
– Agenten
– Problemtypen
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
8
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Unterlagen: Folien und Literatur
 Organisation
– Von Jens Lüssem, basieren teilweise auf einem Foliensatz aus der
Universität Bonn
– 10% Note durch Poster und Präsentation
– 90% Note durch Klausur ohne Unterlagen
– Vorlesung und Labor in Kooperation mit der FH Kiel (Jens Lüssem)
– Selbststudienanteil
– Labor mit Exkursion
– Termin: t.b.d.
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
9
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Unterlagen: Folien und Literatur
 Literatur
– Russel & Norvig: Artificial
Intelligence – A Modern Approach
(umfassendes Standardwerk,
gibt es auch auf deutsch!)
– Lämmel & Cleve: Künstliche
Intelligenz
(einfach geschrieben)
– Luger: Künstliche Intelligenz
(umfassendes Buch)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
10
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Motivation
 Sony startete am 11.05.1999 den
Verkauf von einem vierbeinigen
Unterhaltungsroboter „AIBO“
– Preis: ca. 2.500 €
– AIBO ist ein autonomer Roboter
– AIBO reagiert auf externe
Stimulation
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
11
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Motivation
 Honda stellte am 10.07.2003 den
Roboter „ASIMO“ vor
– Preis: ca. 16.000 € (Tagesmiete)
– ASIMO kann auf 2 Beinen gehen
– ASIMO kann Treppen steigen
– ASIMO kann (sehr) begrenzt auf
Handsignale reagieren
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
12
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Motivation
 Was braucht ein intelligentes System?
– Suchen nach Lösungen in
einer Umwelt
– Planung von
Handlungsabläufen
– Wahrnehmung der Umwelt
– Ausführung von Handlungen
– Repräsentation von Wissen
über die Umwelt
– Umgang mit Unsicherheit
– Lernen
– Her- bzw. Ableitung von
neuem Wissen
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
13
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Motivation
 Was ist „künstliche Intelligenz“? – Einige Definitionen
– Systeme, die wie Menschen denken
• „The exciting new effort to make computers think ... machines
with minds, in the full and literal sense“ (Haugeland, 1985)
• „The automation of activities that we associate with human
thinking, activities such as decision making, problem solving,
learning ...“ (Bellmann, 1978)
– Systeme, die wie Menschen handeln
• „The art of creating machines that perform functions that require
intelligence when performed by people“ (Kurzweil, 1990)
• „The study of how to make computers do things at which, at the
moment, people are better“ (Rich & Knight, 1991)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
14
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Motivation
 Was ist „künstliche Intelligenz“? – Einige Definitionen
– Systeme, die rational denken
• „The study of mental faculties through the use of computational
models“ (McDermott, 1985)
• „The study of the computations that make it possible to perceive,
reason, and act.“ (Winston, 1992)
– Systeme, die rational handeln
• „Computational Intelligence is the study of the design of intelligent
agents“ (Poole et al., 1998)
• „Artificial Intelligence ... is concerned with intelligent behavior in
artefacts.“ (Nilsson, 1998)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
15
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Ansatz: Systeme, die wie Menschen handeln
 Nachbildung menschlichen Verhaltens steht im Vordergrund
– Beispiel: Turing-Test (in der KI kaum verfolgt)
– Turing, Alan (1923 – 1954)
• britischer Mathematiker
• Erfinder der „Turing-Maschine“ –
erstes Automatenmodell zur formalen
Präzisierung der Begriffe Berechenbarkeit, Entscheidbarkeit etc.
• Turing-Test (1950)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
16
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Ansatz: Systeme, die wie Menschen handeln
 Turing-Test (1950)
– 5 min Online-Gespräch über
Tastatur und Textbildschirm
– Sprachverstehen: Natural Language
Processing
– Wissen: Automated Reasoning
– Lernen: Machine Learning
 Übungsaufgabe:
– Besuchen Sie „ALICE“ auf der Website „www.alicebot.org“ und führen
Sie den Turing-Test durch. Zeichnen Sie Ihr Gespräch auf und
berichten Sie darüber in der kommenden Woche.
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
17
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Ansatz: Systeme, die wie Menschen denken
 Welche kognitiven Fähigkeiten sind notwendig, um intelligente
Leistungen wie Menschen zu erbringen?
– hierbei ist es nicht wichtig, Aufgaben präzise zu lösen
– vielmehr ist es wichtig, Aufgaben so wie ein Mensch zu lösen,
nämlich approximativ
– Gegenstand von Kognitionswissenschaft und kognitiver Psychologie
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
18
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Ansatz: Systeme, die rational denken
 Wie sollen wir denken?
– Rationalität als idealisiertes Konzept von Intelligenz
 Logischer Ansatz:
– Regeln für korrekte Schlüsse aus korrekten Prämissen
 Probleme:
– Darstellung informeller Sachverhalte durch logischen Formalismus
(W/F vs. Unsicherheit, Unschärfe und Unvollständigkeit) ist schwierig
– Undurchführbarkeit prinzipieller Lösungsansätze durch Inferenz
(Kombinatorische Explosion)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
19
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Ansatz: Systeme, die rational denken
 Agenten
– lateinisch: agere – handeln, tun
– agieren autonom in und mit ihrem Umwelt
– nehmen durch Sensoren ihre Umwelt wahr
(→ Perzepte)
– manipulieren ihre Umwelt mit ihren Effektoren
(→ Aktionen)
Sensoren
Perzepte
Agent
Umgebung
Aktionen
Effektoren
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
20
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Ansatz: Systeme, die rational denken
 Rationale Agenten
– agieren so, dass gegebene Ziele erreicht werden
unter folgenden Voraussetzungen:
• Eindrücke von der Umwelt sind korrekt
• Überzeugungen sind richtig
– Rationales Denken ist eine Voraussetzung für rationales Handeln,
allerdings keine notwendige Voraussetzung.
♣ Übungsaufgabe:
– Beschreiben Sie mindestens eine Situation rationalen Handelns, der kein
rationales Denken vorausging!
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
21
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Ansatz: Systeme, die rational denken
 Vorteile des Ansatzes über rationale Agenten
– rationales Handeln umfasst i. A. rationales Denken
– rationales Verhalten sollte allgemeinen Regeln folgen
→ Zugänglichkeit für eine wissenschaftliche Betrachtung
→ Sicht der Mathematik, Informatik und Ingenieurswissenschaften
wird gestärkt: Definierbarkeit, Messbarkeit, Beweisbarkeit
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
22
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI-Landschaft
♣ Anwendungsfelder
– Expertensysteme
– Assistenzsysteme
– Bildverstehende Systeme
– Sprachverstehende Systeme
– Sprachgenerierende Systeme
– Robotik
– ...
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
23
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI-Landschaft
♣ Methoden
– Problemlösen und Suche
– Wissensrepräsentation
– Wissensverarbeitung
– Verarbeitung unsicheren Wissens
– Handlungsplanung
– Maschinelles Lernen
– Neuronale Netze
– Bayessche Netze
– ...
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
24
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI-Landschaft
♣ Interdisziplinarität
– Informatik
– Mathematik
– Ingenieurswissenschaften
– Psychologie
– Philosophie
– Linguistik
– Biologie
– Neurowissenschaften
– ...
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
25
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI – gestern und heute
♣ Entstehung der KI
– 1943-1956
zeitgleich mit der Entwicklung der ersten Computer beschäftigten
sich die ersten Wissenschaftler mit der Frage: Können Computer
den menschlichen Geist nachbilden? (→ Turing-Test)
Frühe Beteiligung der Disziplinen:
• Philosophie
• Mathematik
• Psychologie
• Linguistik
• Informatik
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
26
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI – gestern und heute
♣ Entstehung der KI
– 1956
Dartmouth Workshop: McCarthy führt den Begriff
Artificial Intelligence ein
– 1960-1970
Demonstrationssysteme für Mikrowelten zeigen
„intelligentes Verhalten“
– 1970-1980
Auftreten der ersten großen Probleme
• Systeme für Mikrowelten nicht skalierbar
(reale Anwendungen bleiben außen vor)
• „Intelligentes Verhalten“ benötigt viel Wissen
(Aufkommen von wissensbasierten Systemen)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
27
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI – gestern und heute
♣ Entstehung der KI
– 1980-1988
• Kommerzieller Erfolg von Expertensystemen
• intensive Forschungsförderung (v. a. fifth generation
computer systems projects in Japan)
• Rückkehr neuronaler Netze
– 1989-1990
• Entzauberung von Expertensystemen
• Ende des fifth generation computer systems projects
• „KI-Winter“
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
28
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI – gestern und heute
♣ Entstehung der KI
– seit 1990
• Integration probabilistischer Methoden
• Agentenorientierte Sichtweise
• Mathematisierung von KI-Techniken
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
29
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI – gestern und heute
♣ KI – Status Quo
– Verwendung vieler koexistierender Paradigmen
• z. B. probabilistisch vs. analytisch (Computerlinguistik)
• häufig auch Hybridansätze
– Verwendung vieler Methoden
• logische Methoden
• algorithmische Methoden
• entscheidungstheoretische Methoden
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
30
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI – gestern und heute
♣ KI – Status Quo
– Verwendung vieler Herangehensweisen
• theoretische Herangehensweise
• systemorientierte Herangehensweise
• experimentell algorithmische Herangehensweise
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
31
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI – gestern und heute
♣ KI – Status Quo
– Beispiele für die experimentell algorithmische
Herangehensweise
• Viele KI-Probleme sind schwierig (NP-hart), können aber
mit guten Heuristiken und Suchtechniken Probleminstanzen
bis zu einer gewissen Größe gut lösen:
– Erfüllbarkeit boolescher Formeln
→ randomisierte, lokale Suchtechniken können
Formeln bis zu 2.500 Variablen lösen
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
32
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
KI – gestern und heute
♣ KI – Status Quo
♣ Übungsaufgabe:
– Überlegen Sie sich, ob ein Roboter viele Umgebungsvariablen benötigt,
um sich in einem unbekannten Raum zu bewegen!
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
33
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Was versteht man unter einem Agenten?
 Agenten
– agieren autonom
– nehmen durch Sensoren ihre Umwelt wahr
(→ Perzepte)
– manipulieren ihre Umwelt mit ihren Effektoren
(→ Aktionen)
Sensoren
Perzepte
Agent
Umgebung
Aktionen
Effektoren
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
34
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Was versteht man unter einem rationalen Agenten?
 Rationale Agenten
– ... machen das „Richtige“
– Zur Beurteilung rationaler Agenten müssen objektive Performanzkriterien
angelegt werden
– Beispiel: autonomer Staubsauger
• Wie viele qm pro Stunde werden gereinigt?
• Wie hoch ist der Reinheitsgrad?
• Wie hoch ist der Stromverbrauch?
• Wie hoch ist der Sicherheitsstandard?
(Verhalten gegenüber Kleinkindern und Haustieren)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
35
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Was versteht man unter einem rationalen Agenten?
 Optimales Verhalten ist für rationale Agenten oft unmöglich:
– unvollständige Wahrnehmung → Optimierung unter Unsicherheit
– hohe Berechnungskomplexität → Optimierung unter
Ressourcenbeschränkung
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
36
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Was versteht man unter einem rationalen Agenten?
♣ Rationale Agenten vs. allwissende Agenten
– Ein allwissender Agent kennt sämtliche tatsächlichen Effekte seiner
Aktionen
– Ein rationaler Agent handelt dagegen auf Grund seines Wissens und
seiner Wahrnehmungen. Er versucht die erwartete Performanz zu
maximieren.
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
37
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Was versteht man unter einem rationalen Agenten?
♣ Rationales Handeln ist abhängig von:
– Performanzkriterien (Ziele)
– Wahrnehmungssequenzen
(in der Regel ist eine aktive Wahrnehmung erforderlich)
– Wissen über die Welt
– möglichen Aktionen
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
38
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Was versteht man unter einem rationalen Agenten?
♣ Idealer rationaler Agent ...
– ist ein Agent, der für alle möglichen Wahrnehmungssequenzen und
gegebenem Wissen über die Welt die Aktion auswählt, die die
Performanz maximiert.
– wird realisiert durch eine Agentenfunktion:
• Idealer_Rationaler_Agent:
Wahrnehmungssequenz x Weltwissen → Aktion
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
39
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Was versteht man unter einem rationalen Agenten?
♣ Beispiele rationaler Agenten
Agententyp
Perzepte
Aktionen
Ziele
Medizinisches
Diagnosesyste
m
Symptome,
Antworten von
Patienten
Fragen
stellen, Tests
durchführen
Gesunder Patient, Krankenhaus,
Minimierung von
Patient
Kosten
Interaktiver
Englisch-Tutor
Eingegebene
Worte
Übungsaufgaben
stellen, Korrektur
Maximieren der
Testergebnisse
Gruppe von
Studierenden
SatellitenbildAnalysesystem
Bildpunkt
unterschiedlicher
Helligkeit
Kategorisierung
des Bildmaterials
Korrekte
Kategorisierung
Bilder des
Satelliten
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
Umgebung
40
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Wie sieht die Struktur rationaler Agenten aus?
♣ Realisierung einer Agentenfunktion durch
– ein Agentenprogramm und
– einer Agentenarchitektur, die auch die Schnittstellen zur Umwelt
realisiert (Perzepte, Aktionen)
→ Agentenstruktur = Agentenarchitektur + Agentenprogramm
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
41
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Wie sieht die Struktur rationaler Agenten aus?
♣ Prinzip eines Agentenprogramms
function AGENT (Perzept) returns Aktion
static: Wissen
Wissen ← UPDATE-MEMORY (Wissen, Perzept)
Aktion ← CHOOSE-BEST-ACTION (Wissen)
Wissen ← UPDATE-MEMORY (Wissen, Aktion)
return Aktion
– Bemerkung:
Bewertung der Performanz ist nicht Teil des Agenten,
sondern erfolgt von außen.
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
42
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Wie sieht die Struktur rationaler Agenten aus?
♣ Prinzip eines tabellengesteuerten Agenten
function TABLE-DRIVEN-AGENT (Perzept) returns Aktion
static: Perzepte (initial: leere Liste),
Tabelle (Perzeptsequenzen)
Perzepte ← APPEND (Perzept)
Aktion ← LOOKUP (Perzepte, Tabelle)
return Aktion
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
43
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Wie sieht die Struktur rationaler Agenten aus?
♣ Probleme bei tabellengesteuerten Agenten
– Tabelle kann sehr groß werden (z. B. beim Schach: 10150 Zeilen)
– Tabelle muss explizit erstellt werden → aufwendig
– Agentenfunktion kann man nicht als intelligent bezeichnen
(z. B. keine Generalisierung möglich)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
44
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Welche Klassen von Agenten existieren?
♣ Einfache reflexive Agenten
Agent
Sensoren
Regeln
Welche Aktion
soll ich ausführen?
Umgebung
Wie sieht die
Welt aus?
Effektoren
– Reaktion nur aufgrund des aktuellen Perzepts
(keine Betrachtung der Perzepthistorie)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
45
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Welche Klassen von Agenten existieren?
♣ Prinzip eines einfachen reflexiven Agenten
function SIMPLE-REFLEX-AGENT (Perzept) returns Aktion
static: Regeln (Regelmenge)
Status ← INTERPRET-INPUT (Perzept)
Regel ← RULE-MATCH (Status, Regeln)
Aktion ← RULE-ACTION (Regel)
return Aktion
♣ Bemerkung:
Status: Interpretation nur aufgrund des aktuellen Perzepts
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
46
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Welche Klassen von Agenten existieren?
♣ Prinzip eines einfachen reflexiven Agenten
– Ansatz sinnvoll für
• vollständig beobachtbare Umwelt (Aktuelles Perzept umfasst die relevante Information für die Auwahl der Aktion)
• die Lösung einfacher Aufgaben
• das Auslösen von Reflexen
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
47
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Welche Klassen von Agenten existieren?
♣ Agenten mit internem Weltmodell
Agent
Sensoren
– Weltmodell besteht aus:
Status
Wie sieht die
Welt aus?
Was bewirkten
meine Aktionen?
Regeln
Welche Aktion
soll ich ausführen?
• Zustandsmodell
Umgebung
Wie verändert
sich die Welt?
• Änderungsmodell
• Wechselwirkungsmodell
Effektoren
– Internes (Um-)Weltmodell bestimmt neben dem aktuellen Perzept
die Auswahl von Aktionen
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
48
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Welche Klassen von Agenten existieren?
♣ Prinzip eines Agenten mit internem Weltmodell
function REFLEX-AGENT-WITH-STATE (Perzept) returns Aktion
static: Status (Beschreibung der Welt),
Regeln (Regelmenge)
Status ← UPDATE-STATE (Status, Perzept)
Regel ← RULE-MATCH (Status, Regeln)
Aktion ← RULE-ACTION (Regel)
Status ← UPDATE-STATE (Status, Aktion)
return Aktion
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
49
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Welche Klassen von Agenten existieren?
♣ Prinzip eines Agenten mit internem Weltmodell
– Agent erhält eine neue Zustandsbeschreibung durch:
• das Änderungsmodell (aktueller Zustand + Perzept)
• das Änderungs- und Wechselwirkungsmodell
(aktueller Zustand + Aktion)
– Weltmodell umfassender als Perzepthistorie
(nicht beobachtete und nicht beobachtbare Zusammenhänge
fließen mit in das Weltmodell ein)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
50
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Welche Klassen von Agenten existieren?
♣ Zielbasierte Agenten
Agent
Status
Was bewirkten
meine Aktionen?
Ziele
Wie sieht die
Welt aus?
Was wird passieren,
wenn ich die Aktion
ausführe?
Welche Aktion
soll ich ausführen?
Umgebung
Wie verändert
sich die Welt?
Sensoren
Effektoren
– Weltmodell und Perzepte sind für die Aktionenauswahl nicht ausreichend,
wenn die richtige Aktion von explizit vorgegebenen Zielen abhängt
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
51
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Welche Klassen von Agenten existieren?
♣ Nutzenbasierte Agenten
Agent
Sensoren
Status
Wie sieht die
Welt aus?
Was bewirkten
meine Aktionen?
Ziele
Was wird passieren,
wenn ich die Aktion
ausführe?
Wie „glücklich bin ich
in diesem Zustand?
Umgebung
Wie verändert
sich die Welt?
– Meist führen mehrere
Aktionsfolgen zu einem
Ziel. Um eine Auswahl
der nächsten Aktion zu
treffen, kann der Nutzen
des erreichten Zustands
herangezogen werden
Welche Aktion
soll ich ausführen?
Effektoren
– Explizite Nutzenfunktionen sind umfassender als Zielrepräsentationen, da
komplexere Zusammenhänge (z. B. Effizienz) einfließen können
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
52
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Wie kann die Umgebung charakterisiert werden?
♣ Charakterisierung der Umgebung
– zugänglich vs. unzugänglich
Sind alle relevanten Aspekte der Welt den Sensoren zugänglich?
– deterministisch vs. nicht deterministisch
Hängt der nächste Weltzustand allein vom jetzigen Zustand und der
ausgeführten Aktion ab?
– episodisch vs. nicht episodisch
Kann die Qualität einer Aktion innerhalb einer einzelnen Episode
(d. h. Perzept + Aktion) bewertet werden?
– statisch vs. dynamisch
Kann sich die Welt ändern, während der Agent reflektiert?
– diskret vs. kontinuierlich
Ist die Welt diskret?
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
53
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Wie kann die Umgebung charakterisiert werden?
♣ Beispiele für Umgebungen
Umgebung
zugänglich
deterministisch episodisch statisch
diskret
Medizinisches
Diagnosesystem
Nein
Nein
Nein
Nein
Nein
Interaktiver
Englisch-Tutor
Nein
Nein
Nein
Nein
Ja
SatellitenbildAnalysesystem
Ja
Ja
Ja
teilw.
SchachComputer
Ja
Ja
Nein
Ja
Ja
Nein
Nein
Nein
Nein
Nein
Taxifahren
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
Nein
54
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Wie sieht die Struktur lernender Agenten aus?
♣ Ein lernender Agent evaluiert sich selbst, um eine bessere
Performanz zu erreichen
♣ Ein lernender Agent besteht aus 4 Komponenten:
– Performanzkomponente
(Verwendung eines der beschriebenen Agentenkonzepte)
– Bewertungskomponente
(Bewertung der Performanzergebnisse anhand von Benchmarks)
– Lernkomponente
(Generierung von Änderungsvorschlägen für die Performanzkomponente aufgrund der Bewertung der bisherigen Performanzergebnisse)
– Problemgenerator
(Auswahl von Aktionen, die der Explorationen dienen)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
55
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Wie sieht die Struktur lernender Agenten aus?
♣ Lernende Agenten
Benchmar
k
Bewertungskomponente
Sensoren
Feedback
Änderungen
Wissen
Performanzkomponente
Lernziele
Umgebung
Lernkomponente
Problemgenerator
Agent
Fachbereich Informatik
Effektoren
Jens Lüssem, Reinhard Gerndt, SS 2009
56
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemlösende Agenten
♣ Entwurf von Agenten nach dem folgenden Schema:
– Formulieren (des Problems)
– Suchen (einer zum Erreichen des Ziels geeigneten Aktionsfolge)
– Ausführen (dieser Aktionsfolge)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
57
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemlösende Agenten
♣ Einfacher problemlösender Agent
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
58
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemformulierungen
♣ Problemformulierung
– Festlegung des Zustandsraumes der Welt
• durch Abstraktion: ausschließliche Betrachtung relevanter
Aspekte
• mit Bestimmung des Problemtyps: abhängig vom verfügbaren
Wissen über Zustände der Welt und Aktionen
– Festlegung des Startzustands: Zustände der Welt mit bestimmten
Starteigenschaften
– Festlegung der Aktionen zur Überführung (Transformation) von
Zuständen der Welt
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
59
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemformulierungen
♣ Problemformulierung
– Formulierung des Zielzustands: Zustände der Welt mit bestimmten
Zieleigenschaften
– Bestimmung der Kosten:
• für das Suchen (Suchkosten, Offline-Kosten)
• für die Ausführung (Pfadkosten, Online-Kosten)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
60
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemformulierungen
♣ Beispiel: Staubsaugender Agent
– Zustandsraum der Welt
• 2 Agentenpositionen
(jeweils eine in jedem Raum)
• In jedem der Räume befindet
sich entweder
– Schmutz oder
– kein Schmutz
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
61
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Problemformulierungen
♣ Beispiel: Staubsaugender Agent
– Startzustand:
jeder beliebige Zustand (Z)
– Aktionen:
• links (L)
• rechts (R)
• staubsaugen (S)
– Zielzustand:
kein Schmutz in beiden Räumen
(d. h. Zustände 7 bzw. 8)
– mögliche Lösungen bei
Startzustand Z1:
– Pfadkosten:
pro Aktion eine Kosteneinheit
• Lösung 1:
– S (Z5)
– R (Z6)
– S (Z8)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
62
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemtypen
♣ Problemtypen: Wissen über Zustände und Aktionen
– Einzustandsproblem
• vollständig beobachtbare Umwelt
• deterministische Aktionen
→ Agent weiß immer eindeutig, in welchem Zustand der Welt er sich
befindet
→ Agent weiß immer eindeutig, in welchen Zustand der Welt er durch
eine Aktion gelangen wird
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
63
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemtypen
♣ Problemtypen: Wissen über Zustände und Aktionen
– Mehrzustandsproblem
• vollständig unbeobachtbare Umwelt
(keine Sensoren)
→ Agent weiß nur, in welcher Menge von Zuständen der Welt er sich
befindet
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
64
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemtypen
♣ Problemtypen: Wissen über Zustände und Aktionen
– Kontingenzproblem
• partiell beobachtbare Umwelt oder
• nichtdeterministische Aktionen
→ keine eindeutige Aktionsfolge zur Lösung ist im Voraus bestimmbar,
da Abhängigkeiten bzgl. tatsächlicher Zwischenzustände vorliegen
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
65
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemtypen
♣ Problemtypen: Wissen über Zustände und Aktionen
– Explorationsproblem
• Umwelt und Effekte der Aktionen sind teilweise oder vollständig
unbekannt
→ gruseligster Fall (sparen wir uns für ein späteres Kapitel auf)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
66
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemtypen
♣ „Staubsaugerwelt“ als Einzustandsproblem
– Falls das Wissen um die Welt und die Aktionen vollständig ist,
• weiß der staubsaugende Agent immer und
• wo er sich befindet und Schmutz zu finden ist.
– Problemlösen reduziert sich dann auf die Suche nach einem Pfad vom
Startzustand zu einem Zielzustand
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
67
Informatik
Fachhochschule Braunschweig / Wolfenbüttel
- University of Applied Sciences -
Problemtypen
♣ „Staubsaugerwelt“ als Einzustandsproblem
1
2
3
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
68
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemtypen
♣ „Staubsaugerwelt“ als Mehrzustandsproblem
– Aktionen des staubsaugenden Agenten sind verlässlich
(Effekte der Aktionen sind deterministisch)
– Agent besitzt allerdings keine Sensoren
• Agent weiß somit (von Beginn an) nicht, wo er ist
• Agent weiß somit (von Beginn an) nicht, wo Schmutz ist
– Problem kann trotzdem gelöst werden
• Zustände werden zu „Wissenszuständen“ (Belief States)
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
69
Fachhochschule Braunschweig / Wolfenbüttel
Informatik
- University of Applied Sciences -
Problemtypen
♣ „Staubsaugerwelt“ als Mehrzustandsproblem
Fachbereich Informatik
Jens Lüssem, Reinhard Gerndt, SS 2009
70
Herunterladen