Vorüberlegung: Was ist KI? • Am Anfang: Philosophische Fragen – Starke vs. Schwache These der KI – Sprache und Denken – TURING-Test und Chinesisches Zimmer KI und das Web • Heute: Praktische Umsetzung, d.h. wissensbasierte Ansätze zur Problemlösung mit dem Rechner KI im Internet: Schlüsseltechnologie oder unnötiger Ballast? – – – – – Verfahren: Planen, Suchen, … Programmiermethoden: Strukturiert, OO, …? Wissensbasiert vs. datengetrieben/stochastisch Wissenserwerb und maschinelles Lernen Wissensrepräsentation und Wissensnutzung © Martin Klarner/Horst Silberhorn, Informatik 8 Was ist keine KI im Web? Was ist KI im Web? • Metaphern und Anwendungsbereiche – – – – Das Internet als eigenes Gehirn (Global Brain) Das Web als größte Wissensbasis Das Web als größtes Hypertext-Dokument Das Web als größte Agenten-Domäne – Hypermedia-Server in Lisp: www.ai.mit.edu/projects/iiip/doc/cl-http/home-page.html – Webserver in Prolog: www.als.com/pxml.html – Prolog-Datenbank & -“XPS“: www8.informatik.uni-erlangen.de/IMMD8/Lectures/KI-METHODENFUER-DAS-WEB/ – Volltext-“Suchmaschinen“ (wie grep) – Statistische Verfahren zur … – Klassisch: Wissens- und symbolbasiert – Modern: Soft Computing – Statistisch und randomisiert • Analyse von Logfiles • Benutzerprofilerstellung • Kundenberatung (wie z.B. bei www.amazon.de) © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 3 Was ist keine KI im Web? (2) VORL 12a/Folie 4 Was ist keine KI im Web? (3) • „Intelligente“ Lösungen für Probleme im Web • Viren, Worms, Trojaner, Hoaxes – Server-Unterstützung: Load balancing – E-Commerce: Produktsuche – Web als Transportmedium und „Nährboden“ – Web-Services als Angriffsfläche – Kleine Ursache, große Wirkung • Sprachverarbeitung ohne Semantik und Inferenz • Wissensmanagement; zwei Beispiele: – AgITus, www.forwiss.uni-erlangen.de/fg-we/projekte/AgITuS.html • Statisches HTML-Generat aus Interviews • Probleme beim Wissenserwerb • Keine formale Repräsentation – Eliza: Dialogsimulation mit Keyword spotting und zufälligen Templates, www-ai.ijs.si/eliza/eliza.html – BabelFish: Statistische Übersetzung mit translation memory, world.altavista.com/ • Aber: – Web Design, lsmandl.emp.paed.uni-muenchen.de/~infotech/web-design/ • KM als „Umgang mit Informationstechnologien“ • KI als „Grenzwissenschaft“ © Martin Klarner/Horst Silberhorn, Informatik 8 • Web-Applikationen in KI-Prg.-Sprachen • Brute-force-Lösungen von KI-Problemen im Web • Methoden und Ansätze © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 2 VORL 12a/Folie 5 – Die „dümmsten“ Lösungen sind oft die erfolgreichsten! (Gesetz der großen Zahlen, www.amazon.de) – Die „intelligentesten“ Lösungen scheitern an zu hohen Ansprüchen oder Alltäglichkeiten (VerbMobil, www.verbmobil.dfki.de) © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 6 1 Global Brain Global Brain (2) • Metapher: Das Internet/Web als Gehirn eines neuen „Superorganismus‘“ • Nicht KI im Netz, sondern das Netz selbst ist die KI! • Hypothese: Emergenz des Bewusstseins aus Komplexität • Biologische Analogien – Rechner/Seiten als Nervenzellen – Netzwerk-Verbindungen/Links als Synapsen – Netz-Traffic/Linkverfolgung als Aktivierung • Klassische Denker und moderne Systemtheorie: Korrespondenz zwischen organischen und sozialen Funktionen • Metasystem Transition Theory: Entwicklungsstufen des Gehirns und des Netzes – Reflexe: Übermitteln von Aktivierung → aktueller Zustand des Netzes: Komplexe Signale werden auf festverdrahteten Wegen übermittelt – Lernen: Anpassung an Umgebungsbedingungen → anstehende Entwicklungsstufe des Netzes: Adaptive Links durch Verstärkung häufig benutzter Pfade – Denken: Spontane Verbreitung von Aktivierung auf neue Bereiche → angestrebte Entwicklung des Netzes: Über Agenten, die das Semantic Web durchstreifen – Metakognition: Entdecken neuer Konzepte und Regeln → Ziel der Entwicklung des Netzes: Durch Clustering und maschinelles Lernen ⇒ Interessante Idee ohne praktische Bedeutung (noch?) © Martin Klarner/Horst Silberhorn, Informatik 8 © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 7 Typische KI-Programmiersprachen • Lisp VORL 12a/Folie 8 Wissensrepräsentation mit Logik • Vorteile – Funktionales Paradigma – Auswertung von Ausdrücken – Programme als Daten – Operationale Semantik – Verfügbarkeit von Inferenzmaschinen • Nachteile • Prolog – Mangelnde Ausdrucksstärke (gemessen an natürlicher Sprache) – Hohe Komplexität (Einstiegsschwierigkeiten) – Deklaratives Paradigma – Berechnung als Deduktion – Logikprogrammierung • Aktuell: Beschreibungslogiken (DLs) – RACER (Lisp + Java): Schnell und ausdrucksstark, kogs-www.informatik.uni-hamburg.de/~race/ – FaCT (Lisp + Java + Corba): Ausdrucksstarke DLs, http://www.cs.man.ac.uk/~horrocks/FaCT/ – OIL (RDF-basiert): Primär für Ontologien, www.ontoknowledge.org/oil/ • Smalltalk: Objektorientiertes Paradigma • Oz – Constraintprogrammierung – Nebenläufige Logikprogrammierung – Aktoren © Martin Klarner/Horst Silberhorn, Informatik 8 Wozu Inferenzmaschinen? • Explizites Wissen mit Wissensrepräsentationssprache • Zugriff auf implizites Wissen durch Inferenzmaschine • Automatisches Klassifizieren von dynamisch instantiierten Konzepten • Domänenmodellierung; unser Ansatz: – Systemweit verfügbare Konzeptualisierung und Hierarchisierung der Applikationsdomäne – DL-Server mit Inferenzmaschine als eigenständiger Agent © Martin Klarner/Horst Silberhorn, Informatik 8 © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 9 VORL 12a/Folie 11 VORL 12a/Folie 10 Alternativen zur Prädikatenlogik: Wissensrepräsentation • Semantische Netze, Frames – Wo ist die Semantik? – Was ist mit Inferenzmöglichkeiten? • Neuronale Netze, Genetische Algorithmen – Was ist mit explizitem Wissen? – Was wird überhaupt repräsentiert? • Hypertext – Wo ist das Strukturmodell? – Wie geht man mit Redundanz und Inkonsistenz um? • Fachsprache und natürliche Sprache – Wo ist die Formalisierung? – Was ist mit Knappheit und Exaktheit? © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 12 2 Alternativen zur Prädikatenlogik: Soft Computing • Ausgangspunkt: Enttäuschung über nicht eingehaltene Versprechungen der symbolverarbeitenden KI „Traditional artificial intelligence is the technological failure of the 20th century.“ (www.psyex.com) • Statt dessen Verarbeitung von „defizitärem“ Wissen • Ansätze – – – – Unsicheres Wissen: Fuzzy-Logik, modale Logiken Unvollständiges Wissen: Spezielle Logiken Widersprüchliches und nichtmonotones Wissen: Default-Logik Simulation biologischer Vorbilder • Entwicklung einer Population: Genetische Algorithmen • Struktur und Arbeitsweise des Gehirns: Neuronale Netze © Martin Klarner/Horst Silberhorn, Informatik 8 • Weg vom Fokus der klassischen KI auf Planen, Repräsentation, Inferenz • Hin zu Systemen aus parallelen, autonom mit der Umwelt agierenden, lose gekoppelten Modulen • Nachbildung wesentlicher Gehirnleistungen [→ mögliche Web-Applikationen] – Aktoren → Agenten – Artikulatoren → Sprachverarbeitungsysteme – Sensoren → Suchmaschinen (Web-Content als Umwelt) • Kritik – Robotik-lastiger Ansatz (traditionell am MIT) – Behaviouristischer Ansatz (contra Kognitionswissenschaft) © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 13 Klassifikation von KI-Web-Anwendungen • Typisierung: KI-Applikation mit Web als Domäne • Ziele – Lokalisierung: Client, Medium, Server – SWE-Phase: Entwicklung, Testen, Wartung, … – Typisierung – Benutzerfreundlichkeit und –adaptivität – Persistenz und Konfigurierbarkeit – Anonymität durch Simulation mehrerer unterschiedlicher Benutzer von Web Services – Personalisierung der Kommunikation – Simulation und Ersatz menschlicher Teilnehmer • Typen von KI-Anwendungen – KI-Applikation mit Web-Schnittstelle Beispiel: Expertensystem im Web (⇒ s. alte VORL!) – KI-basierte Anfrageschnittstelle Beispiel: Natürlichsprachliche (⇒ s. nächste VORL!) • Typen: Spider, Crawler, Avatare, Bots • Reaktives und adaptives Planen erforderlich? – Web-Applikation mit KI-Techniken Beispiel: Suchmaschinen (⇒ s. letzte VORL!) © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 15 Computerspiele im Web • Szenario: Web als Plattform – – – – – – VORL 12a/Folie 16 KI in Computerspielen • Strategien Dedizierte Game-Server für multiplayer-fähige Spiele Virtuelle Umgebung (2D, Quasi-3D, 3D) Menschliche und „künstliche“ Aktoren Kooperationen: Teams, Clans, Allianzen Deathmatches, Turniere, Ligen Real world problems (lagging, cheating) – Aggressiv/defensiv – Konfrontation/Kooperation • Taktiken – Einsatz der Waffen – Ausnutzen des Geländes • Wegeplanung • Relevante Typen – Ego-Shooter • Ziel: Überleben und frags erzielen • Erweiterte Ziele möglich (capture the flag, Geiselbefreiung, …) • „Künstliche“ Teilnehmer: Bots – Weltmodell: Festverdrahtet oder Heuristik – Umgehen von Hindernissen – Terrainbewertung • Methoden – Skripte und Regelsysteme – Neuronale Netze und Genetische Algorithmen – Agenten und Planer – Echtzeit-Strategiespiele • Ziel: Zivilisation aufbauen und Gegner dominieren • „Künstliche“ Teilnehmer: Civs © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 14 Intelligente Agenten im Web • Einteilung nach … © Martin Klarner/Horst Silberhorn, Informatik 8 Alternativen zur Wissensrepräsentation: BROOKS VORL 12a/Folie 17 © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 18 3 Data Mining im Web • • • • Text Mining im Web Metapher: Das Web als größte Datenbank Problem: Fehlendes Datenbankschema! Ansatz: Systematisierung der Metadaten (RDF!) Realisierung durch … – Automatisierung von OLAP-Systemen (Berichtssysteme für data warehouses) – Klassifikation (überwacht und unüberwacht) – Statistische Analyse – Datentransformation und –säuberung – Visualisierung • Software: www.kdnuggets.com/software/ © Martin Klarner/Horst Silberhorn, Informatik 8 • Metapher: Das Web als größter Hypertext • Ziel: Unterstützung der Suche und Navigation durch (semi-)automatische Erstellung eines Thesaurus oder sogar einer Ontologie • Probleme – Größe und Heterogenität des Web – Tendenz geht weg von Dokumenten zu Applikationen • Realisierung – Volltextsuche – Indizierung – Clustering und Visualisierung © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 19 IBM Intelligent Miner for Text • Textanalyse – – – – – Sprachidentifikation Clusteranalyse auf Dokumenten Klassifikation nach benutzerdefinierten Kategorien Zusammenfassung durch Sammeln wichtiger Sätze „Merkmalsextraktion“: Namen, Fachwörter, Abk. • Volltextsuche: Indizierung mit online-update • Webcrawler mit Toolkit zur Anpassung und Entwicklung eigener Applikationen • Intranet-/Internet-Suchmaschine © Martin Klarner/Horst Silberhorn, Informatik 8 Web Mining • Nicht nur Inhalt, sondern auch Benutzerverhalten sind Gegenstand der Analyse (z.B. von logfiles) • Ziel: Personalisierung von Web Services • Interessensgebiete – Klassifikation (Gruppierung von Seiten) – Assoziation (gemeinsam aufgerufene Seiten) – Sequentialisierung (Reihenfolge von Seiten) • Anforderungen – Skalierbarkeit (auf große Datenmengen) – Unschärfe (für realistisches Clustering) – Robustheit (gegenüber geringem Informationsgehalt) © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 21 Virtuelle Realität im Web • KI-Teilbereiche – – – – VORL 12a/Folie 22 Was bleibt? • Weitere klassische KI-Felder Symbolische Raum-Zeit-Modellierung: VRML Bildverarbeitung Szenenrekonstruktion Sensorik; neu: Haptische Interfaces – – – – – • Computergrafik-Teilbereiche Automatisches Beweisen Maschinelles Lernen Constraints Case-based reasoning Robotik • Einsatz von KI in und für Web-Applikationen – Mathematische Raum-Zeit-Modellierung – Kollisionsdetektion und -verarbeitung – Rendering • Beispiele unter www.itl.nist.gov/iaui/ovrt/hotvr.html © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 20 VORL 12a/Folie 23 – Agenten – Sprachverarbeitung – Suchmaschinen © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 24 4 Literatur und Links • • • • • • • • • www.cy-sys.com/inhalt.htm?/network/virustroja/virustypen.shtml Global Brain: pespmc1.vub.ac.be/GBRAIN-L.html Data Mining: www.webtechniques.com/archives/2000/01/greening/ Text Mining: www-personal.umich.edu/~wfan/text_mining.html IBM Intelligent Miner for Text: www-3.ibm.com/software/data/iminer/fortext/index.html Web Mining: www.cs.umbc.edu/~ajoshi/web-mine/ Virtual Reality: www.itl.nist.gov/iaui/ovrt/hotvr.html Brooks, R. Intelligence without representation. Artificial Intelligence 47 (1991). www.ai.mit.edu/people/brooks/papers/representation.pdf Aktuelle Web-Techniken: www.webtechniques.com © Martin Klarner/Horst Silberhorn, Informatik 8 VORL 12a/Folie 25 5