KI und das Web

Werbung
KI und das Web
KI im Internet:
Schlüsseltechnologie oder
unnötiger Ballast?
Web Site Engineering,
Vorlesung Nr. 14,
Teil 1
Vorüberlegung: Was ist KI?
• Am Anfang: Philosophische Fragen
– Starke vs. Schwache These der KI
– Sprache und Denken
– TURING-Test und Chinesisches Zimmer
• Heute: Praktische Umsetzung, d.h. wissensbasierte
Ansätze zur Problemlösung mit dem Rechner
–
–
–
–
–
Verfahren: Planen, Suchen, …
Programmiermethoden: Strukturiert, OO, …?
Wissensbasiert vs. datengetrieben/stochastisch
Wissenserwerb und maschinelles Lernen
Wissensrepräsentation und Wissensnutzung
© Martin Klarner, Informatik 8
VORL 14a/Folie 2
Was ist KI im Web?
• Metaphern und Anwendungsbereiche
–
–
–
–
Das Internet als eigenes Gehirn (Global Brain)
Das Web als größte Wissensbasis
Das Web als größtes Hypertext-Dokument
Das Web als größte Agenten-Domäne
• Methoden und Ansätze
– Klassisch: Wissens- und symbolbasiert
– Modern: Soft Computing
– Statistisch und randomisiert
© Martin Klarner, Informatik 8
VORL 14a/Folie 3
Was ist keine KI im Web?
• Web-Applikationen in KI-Programmiersprachen
– Hypermedia-Server in Lisp:
www.ai.mit.edu/projects/iiip/doc/cl-http/home-page.html
– Webserver in Prolog: www.als.com/pxml.html
– Prolog-Datenbank & -„Expertensystem“:
www8.informatik.uni-erlangen.de/IMMD8/Lectures/KI-METHODENFUER-DAS-WEB/
• Brute-force-Lösungen von KI-Problemen im Web
– Volltext-„Suchmaschinen“ (wie grep)
– Statistische Verfahren zur …
• … Analyse von Logfiles
• … Benutzerprofilerstellung
• … Kundenberatung (wie z.B. bei www.amazon.de)
© Martin Klarner, Informatik 8
VORL 14a/Folie 4
Was ist keine KI im Web? (2)
• Viren, Worms, Trojaner, Hoaxes
– Web als Transportmedium und „Nährboden“
– Web-Services als Angriffsfläche
– Kleine Ursache, große Wirkung
• Wissensmanagement; zwei Beispiele:
– AgITus, www.forwiss.uni-erlangen.de/fg-we/projekte/AgITuS.html
• Statisches HTML-Generat aus Interviews
• Probleme beim Wissenserwerb
• Keine formale Repräsentation
– Web Design, lsmandl.emp.paed.uni-muenchen.de/~infotech/web-design/
• KM als „Umgang mit Informationstechnologien“
• KI als „Grenzwissenschaft“
© Martin Klarner, Informatik 8
VORL 14a/Folie 5
Was ist keine KI im Web? (3)
•
„Intelligente“ Lösungen für Probleme im Web
– Server-Unterstützung: Load Balancing
– E-Commerce: Produktsuche
•
Sprachverarbeitung ohne Semantik und Inferenz
– Eliza: Dialogsimulation mit Keyword Spotting und passenden
Templates, www.planet-stuff.freeserve.co.uk/Software/Eliza.htm
– BabelFish: Statistische Übersetzung mit Translation Memory,
world.altavista.com/
•
Aber:
– Die „dümmsten“ Lösungen sind oft die erfolgreichsten!
(Gesetz der großen Zahlen, www.amazon.de)
– Die „intelligentesten“ Lösungen scheitern an zu hohen Ansprüchen
oder Alltäglichkeiten (VerbMobil, verbmobil.dfki.de/)
© Martin Klarner, Informatik 8
VORL 14a/Folie 6
Global Brain
•
•
•
•
Metapher: Das Internet/Web als Gehirn eines neuen
„Superorganismus‘“
Nicht KI im Netz, sondern das Netz selbst ist die KI!
Hypothese: Emergenz des Bewusstseins aus Komplexität
Biologische Analogien
– Rechner/Seiten als Nervenzellen
– Netzwerk-Verbindungen/Links als Synapsen
– Netz-Traffic/Linkverfolgung als Aktivierung
•
Klassische Denker und moderne Systemtheorie: Korrespondenz
zwischen organischen und sozialen Funktionen
© Martin Klarner, Informatik 8
VORL 14a/Folie 7
Global Brain (2)
•
Metasystem Transition Theory: Entwicklungsstufen des Gehirns
und des Netzes
– Reflexe: Übermitteln von Aktivierung
→ aktueller Zustand des Netzes: Komplexe Signale werden auf
festverdrahteten Wegen übermittelt
– Lernen: Anpassung an Umgebungsbedingungen
→ anstehende Entwicklungsstufe des Netzes: Adaptive Links
durch Verstärkung häufig benutzter Pfade
– Denken: Spontane Verbreitung von Aktivierung auf neue Bereiche
→ angestrebte Entwicklung des Netzes: Über Agenten, die das
Semantic Web durchstreifen
– Metakognition: Entdecken neuer Konzepte und Regeln
→ Ziel der Entwicklung des Netzes: Durch Clustering und
maschinelles Lernen
⇒ Interessante Idee ohne praktische Bedeutung (noch?)
© Martin Klarner, Informatik 8
VORL 14a/Folie 8
Typische KI-Programmiersprachen
•
Lisp
– Funktionales Paradigma
– Auswertung von Ausdrücken
– Programme als Daten
•
Prolog
– Deklaratives Paradigma
– Berechnung als Deduktion
– Logikprogrammierung
•
•
Smalltalk: Objektorientiertes Paradigma
Oz
– Constraintprogrammierung
– Nebenläufige Logikprogrammierung
– Aktoren
© Martin Klarner, Informatik 8
VORL 14a/Folie 9
Wissensrepräsentation mit Logik
•
Vorteile
– Operationale Semantik
– Verfügbarkeit von Inferenzmaschinen
•
Nachteile
– Mangelnde Ausdrucksstärke (gemessen an natürlicher Sprache)
– Hohe Komplexität (Einstiegsschwierigkeiten)
•
Aktuell: Beschreibungslogiken (DLs)
– RACER (Lisp + Java): Schnell und ausdrucksstark,
www.fh-wedel.de/~mo/racer/
– FaCT (Lisp + Java + Corba): Ausdrucksstarke DLs,
www.cs.man.ac.uk/~horrocks/FaCT/
– OIL (RDF-basiert): Primär für Ontologien,
www.ontoknowledge.org/oil/
© Martin Klarner, Informatik 8
VORL 14a/Folie 10
Wozu Inferenzmaschinen?
• Explizites Wissen mit
Wissensrepräsentationssprache
• Zugriff auf implizites Wissen durch Inferenzmaschine
• Automatisches Klassifizieren von dynamisch
instantiierten Konzepten
• Domänenmodellierung; unser Ansatz:
– Systemweit verfügbare Konzeptualisierung und
Hierarchisierung der Applikationsdomäne
– DL-Server mit Inferenzmaschine als eigenständiger Agent
© Martin Klarner, Informatik 8
VORL 14a/Folie 11
Alternativen zur Prädikatenlogik
für die Wissensrepräsentation
•
Semantische Netze, Frames
– Wo ist die Semantik?
– Was ist mit Inferenzmöglichkeiten?
•
Neuronale Netze, Genetische Algorithmen
– Was ist mit explizitem Wissen?
– Was wird überhaupt repräsentiert?
•
Hypertext
– Wo ist das Strukturmodell?
– Wie geht man mit Redundanz und Inkonsistenz um?
•
Fachsprache und natürliche Sprache
– Wo ist die Formalisierung?
– Was ist mit Knappheit und Exaktheit?
© Martin Klarner, Informatik 8
VORL 14a/Folie 12
Alternativen zur Prädikatenlogik (2):
Soft Computing
•
•
•
Ausgangspunkt: Enttäuschung über nicht eingehaltene
Versprechungen der klassischen, symbolverarbeitenden KI
„Traditional artificial intelligence is the technological failure of the
[www.psyex.com]
20th century.“
Statt dessen Verarbeitung von „defizitärem“ Wissen
Ansätze
–
–
–
–
Unsicheres Wissen: Fuzzy-Logik, modale Logiken
Unvollständiges Wissen: Spezielle Logiken
Widersprüchliches und nichtmonotones Wissen: Default-Logik
Simulation biologischer Vorbilder
• Entwicklung einer Population: Genetische Algorithmen
• Struktur und Arbeitsweise des Gehirns: Neuronale Netze
© Martin Klarner, Informatik 8
VORL 14a/Folie 13
Alternativen zur
Wissensrepräsentation: BROOKS
•
•
•
Weg vom Fokus der klassischen KI auf
Planen, Repräsentation, Inferenz
Hin zu Systemen aus parallelen, autonom mit der Umwelt
agierenden, lose gekoppelten Modulen
Nachbildung wesentlicher Gehirnleistungen
→ mögliche Web-Applikationen
– Aktoren → Agenten
– Artikulatoren → Sprachverarbeitungsysteme
– Sensoren → Suchmaschinen (Web-Content als Umwelt)
•
Kritik
– Robotik-lastiger Ansatz (traditionell am MIT)
– Behaviouristischer Ansatz (contra Kognitionswissenschaft)
© Martin Klarner, Informatik 8
VORL 14a/Folie 14
Klassifikation von
KI-Web-Anwendungen
• Einteilung nach …
– … Lokalisierung: Client, Medium, Server
– … SWE-Phase: Entwicklung, Testen, Wartung, …
– … Typisierung
• Typen von KI-Anwendungen
– KI-Applikation mit Web-Schnittstelle
Beispiel: Expertensystem im Web (⇒ s. alte VORL!)
– KI-basierte Anfrageschnittstelle
Beispiel: Natürlichsprachliche Systeme (⇒ s. VORL 15!)
– Web-Applikation mit KI-Techniken
Beispiel: Suchmaschinen (⇒ s. VORL 12!)
© Martin Klarner, Informatik 8
VORL 14a/Folie 15
Computerspiele im Web
•
Szenario: Web als Plattform
–
–
–
–
–
–
•
Dedizierte Game-Server für multiplayer-fähige Spiele
Virtuelle Umgebung (2D, Quasi-3D, 3D)
Menschliche und „künstliche“ Aktoren
Kooperationen: Teams, Clans, Allianzen
Deathmatches, Turniere, Ligen
Real World Problems (Lagging, Cheating)
Relevante Typen
– Ego-Shooter
• Ziel: Überleben und Frags erzielen
• Erweiterte Ziele möglich (Capture The Flag, Geiselbefreiung, …)
• „Künstliche“ Teilnehmer: Bots
– Echtzeit-Strategiespiele
• Ziel: Zivilisation aufbauen und Gegner dominieren
• „Künstliche“ Teilnehmer: Civs
© Martin Klarner, Informatik 8
VORL 14a/Folie 16
KI in Computerspielen
•
Strategien
– Aggressiv/defensiv
– Konfrontation/Kooperation
•
Taktiken
– Einsatz der Waffen
– Ausnutzen des Geländes
•
Wegeplanung
– Weltmodell: Festverdrahtet oder Heuristik
– Umgehen von Hindernissen
– Terrainbewertung
•
Methoden
– Skripte und Regelsysteme
– Neuronale Netze und Genetische Algorithmen
– Agenten und Planer
© Martin Klarner, Informatik 8
VORL 14a/Folie 17
Data Mining im Web
•
•
•
•
Metapher: Das Web als größte Datenbank
Problem: Fehlendes Datenbankschema!
Ansatz: Systematisierung der Metadaten (RDF!)
Realisierung durch …
– … Automatisierung von OLAP-Systemen (Berichtssysteme
für Data Warehouses)
– … Klassifikation (überwacht und unüberwacht)
– … statistische Analyse
– … Datentransformation und –säuberung
– … Visualisierung
• Software: www.kdnuggets.com/software/
© Martin Klarner, Informatik 8
VORL 14a/Folie 18
Text Mining im Web
• Metapher: Das Web als größter Hypertext
• Ziel: Unterstützung der Suche und Navigation durch
(semi-)automatische Erstellung eines Thesaurus oder
sogar einer Ontologie
• Probleme
– Größe und Heterogenität des Web
– Tendenz geht weg von Dokumenten zu Applikationen
• Realisierung
– Volltextsuche
– Indizierung
– Clustering und Visualisierung
© Martin Klarner, Informatik 8
VORL 14a/Folie 19
IBM Intelligent Miner for Text
• Textanalyse
–
–
–
–
–
Sprachidentifikation
Clusteranalyse auf Dokumenten
Klassifikation nach benutzerdefinierten Kategorien
Zusammenfassung durch Sammeln wichtiger Sätze
„Merkmalsextraktion“: Namen, Fachwörter, Abk.
• Volltextsuche: Indizierung mit Online-Update
• Webcrawler mit Toolkit zur Anpassung und
Entwicklung eigener Applikationen
• Intranet-/Internet-Suchmaschine
© Martin Klarner, Informatik 8
VORL 14a/Folie 20
Web Mining
• Nicht nur Inhalt, sondern auch Benutzerverhalten
sind Gegenstand der Analyse (z.B. von Logfiles)
• Ziel: Personalisierung von Web Services
• Teilaufgaben
– Klassifikation (Gruppierung von Seiten)
– Assoziation (gemeinsam aufgerufene Seiten)
– Sequenzialisierung (Reihenfolge von Seiten)
• Anforderungen
– Skalierbarkeit (auf große Datenmengen)
– Unschärfe (für realistisches Clustering)
– Robustheit (gegenüber geringem Informationsgehalt)
© Martin Klarner, Informatik 8
VORL 14a/Folie 21
Virtuelle Realität im Web
• KI-Teilbereiche
–
–
–
–
Symbolische Raum-Zeit-Modellierung: VRML
Bildverarbeitung
Szenenrekonstruktion
Sensorik; neu: Haptische Interfaces
• Computergrafik-Teilbereiche
– Mathematische Raum-Zeit-Modellierung
– Kollisionsdetektion und -verarbeitung
– Rendern
• Beispiele unter www.itl.nist.gov/iaui/ovrt/hotvr.html
© Martin Klarner, Informatik 8
VORL 14a/Folie 22
Was bleibt?
• Weitere klassische KI-Felder
–
–
–
–
–
Automatisches Beweisen
Maschinelles Lernen
Constraints
Case-Based Reasoning
Robotik
• Einsatz von KI in und für Web-Applikationen
– Agenten
– Sprachverarbeitung
– Suchmaschinen
© Martin Klarner, Informatik 8
VORL 14a/Folie 23
Literatur und Links
•
•
•
•
•
•
•
•
•
www.cy-sys.com/inhalt.htm?/network/virustroja/virustypen.shtml
Global Brain: pespmc1.vub.ac.be/GBRAIN-L.html
Data Mining: www.webtechniques.com/archives/2000/01/greening/
Text Mining: www-personal.umich.edu/~wfan/text_mining.html
IBM Intelligent Miner for Text:
www-3.ibm.com/software/data/iminer/fortext/index.html
Web Mining: www.cs.umbc.edu/~ajoshi/web-mine/
Virtual Reality: www.itl.nist.gov/iaui/ovrt/hotvr.html
Brooks, R. Intelligence without representation. Artificial Intelligence 47
(1991). www.ai.mit.edu/people/brooks/papers/representation.pdf
Aktuelle Web-Techniken: www.webtechniques.com
© Martin Klarner, Informatik 8
VORL 14a/Folie 24
Herunterladen