KI und das Web Vorüberlegung: Was ist KI? Was ist KI im Web? Was

Werbung
Vorüberlegung: Was ist KI?
• Am Anfang: Philosophische Fragen
– Starke vs. Schwache These der KI
– Sprache und Denken
– TURING-Test und Chinesisches Zimmer
KI und das Web
• Heute: Praktische Umsetzung, d.h. wissensbasierte
Ansätze zur Problemlösung mit dem Rechner
KI im Internet:
Schlüsseltechnologie oder
unnötiger Ballast?
–
–
–
–
–
Verfahren: Planen, Suchen, …
Programmiermethoden: Strukturiert, OO, …?
Wissensbasiert vs. datengetrieben/stochastisch
Wissenserwerb und maschinelles Lernen
Wissensrepräsentation und Wissensnutzung
© Martin Klarner/Horst Silberhorn, Informatik 8
Was ist keine KI im Web?
Was ist KI im Web?
• Metaphern und Anwendungsbereiche
–
–
–
–
Das Internet als eigenes Gehirn (Global Brain)
Das Web als größte Wissensbasis
Das Web als größtes Hypertext-Dokument
Das Web als größte Agenten-Domäne
– Hypermedia-Server in Lisp:
www.ai.mit.edu/projects/iiip/doc/cl-http/home-page.html
– Webserver in Prolog: www.als.com/pxml.html
– Prolog-Datenbank & -“XPS“:
www8.informatik.uni-erlangen.de/IMMD8/Lectures/KI-METHODENFUER-DAS-WEB/
– Volltext-“Suchmaschinen“ (wie grep)
– Statistische Verfahren zur …
– Klassisch: Wissens- und symbolbasiert
– Modern: Soft Computing
– Statistisch und randomisiert
• Analyse von Logfiles
• Benutzerprofilerstellung
• Kundenberatung (wie z.B. bei www.amazon.de)
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 3
Was ist keine KI im Web? (2)
VORL 12a/Folie 4
Was ist keine KI im Web? (3)
• „Intelligente“ Lösungen für Probleme im Web
• Viren, Worms, Trojaner, Hoaxes
– Server-Unterstützung: Load balancing
– E-Commerce: Produktsuche
– Web als Transportmedium und „Nährboden“
– Web-Services als Angriffsfläche
– Kleine Ursache, große Wirkung
• Sprachverarbeitung ohne Semantik und Inferenz
• Wissensmanagement; zwei Beispiele:
– AgITus, www.forwiss.uni-erlangen.de/fg-we/projekte/AgITuS.html
• Statisches HTML-Generat aus Interviews
• Probleme beim Wissenserwerb
• Keine formale Repräsentation
– Eliza: Dialogsimulation mit Keyword spotting und zufälligen
Templates, www-ai.ijs.si/eliza/eliza.html
– BabelFish: Statistische Übersetzung mit translation memory,
world.altavista.com/
• Aber:
– Web Design, lsmandl.emp.paed.uni-muenchen.de/~infotech/web-design/
• KM als „Umgang mit Informationstechnologien“
• KI als „Grenzwissenschaft“
© Martin Klarner/Horst Silberhorn, Informatik 8
• Web-Applikationen in KI-Prg.-Sprachen
• Brute-force-Lösungen von KI-Problemen im Web
• Methoden und Ansätze
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 2
VORL 12a/Folie 5
– Die „dümmsten“ Lösungen sind oft die erfolgreichsten!
(Gesetz der großen Zahlen, www.amazon.de)
– Die „intelligentesten“ Lösungen scheitern an zu hohen Ansprüchen
oder Alltäglichkeiten (VerbMobil, www.verbmobil.dfki.de)
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 6
1
Global Brain
Global Brain (2)
• Metapher: Das Internet/Web als Gehirn eines neuen
„Superorganismus‘“
• Nicht KI im Netz, sondern das Netz selbst ist die KI!
• Hypothese: Emergenz des Bewusstseins aus Komplexität
• Biologische Analogien
– Rechner/Seiten als Nervenzellen
– Netzwerk-Verbindungen/Links als Synapsen
– Netz-Traffic/Linkverfolgung als Aktivierung
• Klassische Denker und moderne Systemtheorie: Korrespondenz
zwischen organischen und sozialen Funktionen
• Metasystem Transition Theory: Entwicklungsstufen des Gehirns
und des Netzes
– Reflexe: Übermitteln von Aktivierung
→ aktueller Zustand des Netzes: Komplexe Signale werden auf
festverdrahteten Wegen übermittelt
– Lernen: Anpassung an Umgebungsbedingungen
→ anstehende Entwicklungsstufe des Netzes: Adaptive Links
durch Verstärkung häufig benutzter Pfade
– Denken: Spontane Verbreitung von Aktivierung auf neue Bereiche
→ angestrebte Entwicklung des Netzes: Über Agenten, die das
Semantic Web durchstreifen
– Metakognition: Entdecken neuer Konzepte und Regeln
→ Ziel der Entwicklung des Netzes: Durch Clustering und
maschinelles Lernen
⇒ Interessante Idee ohne praktische Bedeutung (noch?)
© Martin Klarner/Horst Silberhorn, Informatik 8
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 7
Typische KI-Programmiersprachen
• Lisp
VORL 12a/Folie 8
Wissensrepräsentation mit Logik
• Vorteile
– Funktionales Paradigma
– Auswertung von Ausdrücken
– Programme als Daten
– Operationale Semantik
– Verfügbarkeit von Inferenzmaschinen
• Nachteile
• Prolog
– Mangelnde Ausdrucksstärke (gemessen an natürlicher Sprache)
– Hohe Komplexität (Einstiegsschwierigkeiten)
– Deklaratives Paradigma
– Berechnung als Deduktion
– Logikprogrammierung
• Aktuell: Beschreibungslogiken (DLs)
– RACER (Lisp + Java): Schnell und ausdrucksstark,
kogs-www.informatik.uni-hamburg.de/~race/
– FaCT (Lisp + Java + Corba): Ausdrucksstarke DLs,
http://www.cs.man.ac.uk/~horrocks/FaCT/
– OIL (RDF-basiert): Primär für Ontologien,
www.ontoknowledge.org/oil/
• Smalltalk: Objektorientiertes Paradigma
• Oz
– Constraintprogrammierung
– Nebenläufige Logikprogrammierung
– Aktoren
© Martin Klarner/Horst Silberhorn, Informatik 8
Wozu Inferenzmaschinen?
• Explizites Wissen mit
Wissensrepräsentationssprache
• Zugriff auf implizites Wissen durch Inferenzmaschine
• Automatisches Klassifizieren von dynamisch
instantiierten Konzepten
• Domänenmodellierung; unser Ansatz:
– Systemweit verfügbare Konzeptualisierung und
Hierarchisierung der Applikationsdomäne
– DL-Server mit Inferenzmaschine als eigenständiger Agent
© Martin Klarner/Horst Silberhorn, Informatik 8
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 9
VORL 12a/Folie 11
VORL 12a/Folie 10
Alternativen zur Prädikatenlogik:
Wissensrepräsentation
• Semantische Netze, Frames
– Wo ist die Semantik?
– Was ist mit Inferenzmöglichkeiten?
• Neuronale Netze, Genetische Algorithmen
– Was ist mit explizitem Wissen?
– Was wird überhaupt repräsentiert?
• Hypertext
– Wo ist das Strukturmodell?
– Wie geht man mit Redundanz und Inkonsistenz um?
• Fachsprache und natürliche Sprache
– Wo ist die Formalisierung?
– Was ist mit Knappheit und Exaktheit?
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 12
2
Alternativen zur Prädikatenlogik: Soft
Computing
• Ausgangspunkt: Enttäuschung über nicht eingehaltene
Versprechungen der symbolverarbeitenden KI
„Traditional artificial intelligence is the technological failure of the
20th century.“
(www.psyex.com)
• Statt dessen Verarbeitung von „defizitärem“ Wissen
• Ansätze
–
–
–
–
Unsicheres Wissen: Fuzzy-Logik, modale Logiken
Unvollständiges Wissen: Spezielle Logiken
Widersprüchliches und nichtmonotones Wissen: Default-Logik
Simulation biologischer Vorbilder
• Entwicklung einer Population: Genetische Algorithmen
• Struktur und Arbeitsweise des Gehirns: Neuronale Netze
© Martin Klarner/Horst Silberhorn, Informatik 8
• Weg vom Fokus der klassischen KI auf
Planen, Repräsentation, Inferenz
• Hin zu Systemen aus parallelen, autonom mit der Umwelt
agierenden, lose gekoppelten Modulen
• Nachbildung wesentlicher Gehirnleistungen
[→ mögliche Web-Applikationen]
– Aktoren → Agenten
– Artikulatoren → Sprachverarbeitungsysteme
– Sensoren → Suchmaschinen (Web-Content als Umwelt)
• Kritik
– Robotik-lastiger Ansatz (traditionell am MIT)
– Behaviouristischer Ansatz (contra Kognitionswissenschaft)
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 13
Klassifikation von
KI-Web-Anwendungen
• Typisierung: KI-Applikation mit Web als Domäne
• Ziele
– Lokalisierung: Client, Medium, Server
– SWE-Phase: Entwicklung, Testen, Wartung, …
– Typisierung
– Benutzerfreundlichkeit und –adaptivität
– Persistenz und Konfigurierbarkeit
– Anonymität durch Simulation mehrerer unterschiedlicher
Benutzer von Web Services
– Personalisierung der Kommunikation
– Simulation und Ersatz menschlicher Teilnehmer
• Typen von KI-Anwendungen
– KI-Applikation mit Web-Schnittstelle
Beispiel: Expertensystem im Web (⇒ s. alte VORL!)
– KI-basierte Anfrageschnittstelle
Beispiel: Natürlichsprachliche (⇒ s. nächste VORL!)
• Typen: Spider, Crawler, Avatare, Bots
• Reaktives und adaptives Planen erforderlich?
– Web-Applikation mit KI-Techniken
Beispiel: Suchmaschinen (⇒ s. letzte VORL!)
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 15
Computerspiele im Web
• Szenario: Web als Plattform
–
–
–
–
–
–
VORL 12a/Folie 16
KI in Computerspielen
• Strategien
Dedizierte Game-Server für multiplayer-fähige Spiele
Virtuelle Umgebung (2D, Quasi-3D, 3D)
Menschliche und „künstliche“ Aktoren
Kooperationen: Teams, Clans, Allianzen
Deathmatches, Turniere, Ligen
Real world problems (lagging, cheating)
– Aggressiv/defensiv
– Konfrontation/Kooperation
• Taktiken
– Einsatz der Waffen
– Ausnutzen des Geländes
• Wegeplanung
• Relevante Typen
– Ego-Shooter
• Ziel: Überleben und frags erzielen
• Erweiterte Ziele möglich (capture the flag, Geiselbefreiung, …)
• „Künstliche“ Teilnehmer: Bots
– Weltmodell: Festverdrahtet oder Heuristik
– Umgehen von Hindernissen
– Terrainbewertung
• Methoden
– Skripte und Regelsysteme
– Neuronale Netze und Genetische Algorithmen
– Agenten und Planer
– Echtzeit-Strategiespiele
• Ziel: Zivilisation aufbauen und Gegner dominieren
• „Künstliche“ Teilnehmer: Civs
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 14
Intelligente Agenten im Web
• Einteilung nach …
© Martin Klarner/Horst Silberhorn, Informatik 8
Alternativen zur
Wissensrepräsentation: BROOKS
VORL 12a/Folie 17
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 18
3
Data Mining im Web
•
•
•
•
Text Mining im Web
Metapher: Das Web als größte Datenbank
Problem: Fehlendes Datenbankschema!
Ansatz: Systematisierung der Metadaten (RDF!)
Realisierung durch …
– Automatisierung von OLAP-Systemen (Berichtssysteme für
data warehouses)
– Klassifikation (überwacht und unüberwacht)
– Statistische Analyse
– Datentransformation und –säuberung
– Visualisierung
• Software: www.kdnuggets.com/software/
© Martin Klarner/Horst Silberhorn, Informatik 8
• Metapher: Das Web als größter Hypertext
• Ziel: Unterstützung der Suche und Navigation durch
(semi-)automatische Erstellung eines Thesaurus oder
sogar einer Ontologie
• Probleme
– Größe und Heterogenität des Web
– Tendenz geht weg von Dokumenten zu Applikationen
• Realisierung
– Volltextsuche
– Indizierung
– Clustering und Visualisierung
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 19
IBM Intelligent Miner for Text
• Textanalyse
–
–
–
–
–
Sprachidentifikation
Clusteranalyse auf Dokumenten
Klassifikation nach benutzerdefinierten Kategorien
Zusammenfassung durch Sammeln wichtiger Sätze
„Merkmalsextraktion“: Namen, Fachwörter, Abk.
• Volltextsuche: Indizierung mit online-update
• Webcrawler mit Toolkit zur Anpassung und
Entwicklung eigener Applikationen
• Intranet-/Internet-Suchmaschine
© Martin Klarner/Horst Silberhorn, Informatik 8
Web Mining
• Nicht nur Inhalt, sondern auch Benutzerverhalten
sind Gegenstand der Analyse (z.B. von logfiles)
• Ziel: Personalisierung von Web Services
• Interessensgebiete
– Klassifikation (Gruppierung von Seiten)
– Assoziation (gemeinsam aufgerufene Seiten)
– Sequentialisierung (Reihenfolge von Seiten)
• Anforderungen
– Skalierbarkeit (auf große Datenmengen)
– Unschärfe (für realistisches Clustering)
– Robustheit (gegenüber geringem Informationsgehalt)
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 21
Virtuelle Realität im Web
• KI-Teilbereiche
–
–
–
–
VORL 12a/Folie 22
Was bleibt?
• Weitere klassische KI-Felder
Symbolische Raum-Zeit-Modellierung: VRML
Bildverarbeitung
Szenenrekonstruktion
Sensorik; neu: Haptische Interfaces
–
–
–
–
–
• Computergrafik-Teilbereiche
Automatisches Beweisen
Maschinelles Lernen
Constraints
Case-based reasoning
Robotik
• Einsatz von KI in und für Web-Applikationen
– Mathematische Raum-Zeit-Modellierung
– Kollisionsdetektion und -verarbeitung
– Rendering
• Beispiele unter www.itl.nist.gov/iaui/ovrt/hotvr.html
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 20
VORL 12a/Folie 23
– Agenten
– Sprachverarbeitung
– Suchmaschinen
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 24
4
Literatur und Links
•
•
•
•
•
•
•
•
•
www.cy-sys.com/inhalt.htm?/network/virustroja/virustypen.shtml
Global Brain: pespmc1.vub.ac.be/GBRAIN-L.html
Data Mining: www.webtechniques.com/archives/2000/01/greening/
Text Mining: www-personal.umich.edu/~wfan/text_mining.html
IBM Intelligent Miner for Text:
www-3.ibm.com/software/data/iminer/fortext/index.html
Web Mining: www.cs.umbc.edu/~ajoshi/web-mine/
Virtual Reality: www.itl.nist.gov/iaui/ovrt/hotvr.html
Brooks, R. Intelligence without representation. Artificial Intelligence 47
(1991). www.ai.mit.edu/people/brooks/papers/representation.pdf
Aktuelle Web-Techniken: www.webtechniques.com
© Martin Klarner/Horst Silberhorn, Informatik 8
VORL 12a/Folie 25
5
Herunterladen