KI und das Web KI im Internet: Schlüsseltechnologie oder unnötiger Ballast? Web Site Engineering, Vorlesung Nr. 14, Teil 1 Vorüberlegung: Was ist KI? • Am Anfang: Philosophische Fragen – Starke vs. Schwache These der KI – Sprache und Denken – TURING-Test und Chinesisches Zimmer • Heute: Praktische Umsetzung, d.h. wissensbasierte Ansätze zur Problemlösung mit dem Rechner – – – – – Verfahren: Planen, Suchen, … Programmiermethoden: Strukturiert, OO, …? Wissensbasiert vs. datengetrieben/stochastisch Wissenserwerb und maschinelles Lernen Wissensrepräsentation und Wissensnutzung © Martin Klarner, Informatik 8 VORL 14a/Folie 2 Was ist KI im Web? • Metaphern und Anwendungsbereiche – – – – Das Internet als eigenes Gehirn (Global Brain) Das Web als größte Wissensbasis Das Web als größtes Hypertext-Dokument Das Web als größte Agenten-Domäne • Methoden und Ansätze – Klassisch: Wissens- und symbolbasiert – Modern: Soft Computing – Statistisch und randomisiert © Martin Klarner, Informatik 8 VORL 14a/Folie 3 Was ist keine KI im Web? • Web-Applikationen in KI-Programmiersprachen – Hypermedia-Server in Lisp: www.ai.mit.edu/projects/iiip/doc/cl-http/home-page.html – Webserver in Prolog: www.als.com/pxml.html – Prolog-Datenbank & -„Expertensystem“: www8.informatik.uni-erlangen.de/IMMD8/Lectures/KI-METHODENFUER-DAS-WEB/ • Brute-force-Lösungen von KI-Problemen im Web – Volltext-„Suchmaschinen“ (wie grep) – Statistische Verfahren zur … • … Analyse von Logfiles • … Benutzerprofilerstellung • … Kundenberatung (wie z.B. bei www.amazon.de) © Martin Klarner, Informatik 8 VORL 14a/Folie 4 Was ist keine KI im Web? (2) • Viren, Worms, Trojaner, Hoaxes – Web als Transportmedium und „Nährboden“ – Web-Services als Angriffsfläche – Kleine Ursache, große Wirkung • Wissensmanagement; zwei Beispiele: – AgITus, www.forwiss.uni-erlangen.de/fg-we/projekte/AgITuS.html • Statisches HTML-Generat aus Interviews • Probleme beim Wissenserwerb • Keine formale Repräsentation – Web Design, lsmandl.emp.paed.uni-muenchen.de/~infotech/web-design/ • KM als „Umgang mit Informationstechnologien“ • KI als „Grenzwissenschaft“ © Martin Klarner, Informatik 8 VORL 14a/Folie 5 Was ist keine KI im Web? (3) • „Intelligente“ Lösungen für Probleme im Web – Server-Unterstützung: Load Balancing – E-Commerce: Produktsuche • Sprachverarbeitung ohne Semantik und Inferenz – Eliza: Dialogsimulation mit Keyword Spotting und passenden Templates, www.planet-stuff.freeserve.co.uk/Software/Eliza.htm – BabelFish: Statistische Übersetzung mit Translation Memory, world.altavista.com/ • Aber: – Die „dümmsten“ Lösungen sind oft die erfolgreichsten! (Gesetz der großen Zahlen, www.amazon.de) – Die „intelligentesten“ Lösungen scheitern an zu hohen Ansprüchen oder Alltäglichkeiten (VerbMobil, verbmobil.dfki.de/) © Martin Klarner, Informatik 8 VORL 14a/Folie 6 Global Brain • • • • Metapher: Das Internet/Web als Gehirn eines neuen „Superorganismus‘“ Nicht KI im Netz, sondern das Netz selbst ist die KI! Hypothese: Emergenz des Bewusstseins aus Komplexität Biologische Analogien – Rechner/Seiten als Nervenzellen – Netzwerk-Verbindungen/Links als Synapsen – Netz-Traffic/Linkverfolgung als Aktivierung • Klassische Denker und moderne Systemtheorie: Korrespondenz zwischen organischen und sozialen Funktionen © Martin Klarner, Informatik 8 VORL 14a/Folie 7 Global Brain (2) • Metasystem Transition Theory: Entwicklungsstufen des Gehirns und des Netzes – Reflexe: Übermitteln von Aktivierung → aktueller Zustand des Netzes: Komplexe Signale werden auf festverdrahteten Wegen übermittelt – Lernen: Anpassung an Umgebungsbedingungen → anstehende Entwicklungsstufe des Netzes: Adaptive Links durch Verstärkung häufig benutzter Pfade – Denken: Spontane Verbreitung von Aktivierung auf neue Bereiche → angestrebte Entwicklung des Netzes: Über Agenten, die das Semantic Web durchstreifen – Metakognition: Entdecken neuer Konzepte und Regeln → Ziel der Entwicklung des Netzes: Durch Clustering und maschinelles Lernen ⇒ Interessante Idee ohne praktische Bedeutung (noch?) © Martin Klarner, Informatik 8 VORL 14a/Folie 8 Typische KI-Programmiersprachen • Lisp – Funktionales Paradigma – Auswertung von Ausdrücken – Programme als Daten • Prolog – Deklaratives Paradigma – Berechnung als Deduktion – Logikprogrammierung • • Smalltalk: Objektorientiertes Paradigma Oz – Constraintprogrammierung – Nebenläufige Logikprogrammierung – Aktoren © Martin Klarner, Informatik 8 VORL 14a/Folie 9 Wissensrepräsentation mit Logik • Vorteile – Operationale Semantik – Verfügbarkeit von Inferenzmaschinen • Nachteile – Mangelnde Ausdrucksstärke (gemessen an natürlicher Sprache) – Hohe Komplexität (Einstiegsschwierigkeiten) • Aktuell: Beschreibungslogiken (DLs) – RACER (Lisp + Java): Schnell und ausdrucksstark, www.fh-wedel.de/~mo/racer/ – FaCT (Lisp + Java + Corba): Ausdrucksstarke DLs, www.cs.man.ac.uk/~horrocks/FaCT/ – OIL (RDF-basiert): Primär für Ontologien, www.ontoknowledge.org/oil/ © Martin Klarner, Informatik 8 VORL 14a/Folie 10 Wozu Inferenzmaschinen? • Explizites Wissen mit Wissensrepräsentationssprache • Zugriff auf implizites Wissen durch Inferenzmaschine • Automatisches Klassifizieren von dynamisch instantiierten Konzepten • Domänenmodellierung; unser Ansatz: – Systemweit verfügbare Konzeptualisierung und Hierarchisierung der Applikationsdomäne – DL-Server mit Inferenzmaschine als eigenständiger Agent © Martin Klarner, Informatik 8 VORL 14a/Folie 11 Alternativen zur Prädikatenlogik für die Wissensrepräsentation • Semantische Netze, Frames – Wo ist die Semantik? – Was ist mit Inferenzmöglichkeiten? • Neuronale Netze, Genetische Algorithmen – Was ist mit explizitem Wissen? – Was wird überhaupt repräsentiert? • Hypertext – Wo ist das Strukturmodell? – Wie geht man mit Redundanz und Inkonsistenz um? • Fachsprache und natürliche Sprache – Wo ist die Formalisierung? – Was ist mit Knappheit und Exaktheit? © Martin Klarner, Informatik 8 VORL 14a/Folie 12 Alternativen zur Prädikatenlogik (2): Soft Computing • • • Ausgangspunkt: Enttäuschung über nicht eingehaltene Versprechungen der klassischen, symbolverarbeitenden KI „Traditional artificial intelligence is the technological failure of the [www.psyex.com] 20th century.“ Statt dessen Verarbeitung von „defizitärem“ Wissen Ansätze – – – – Unsicheres Wissen: Fuzzy-Logik, modale Logiken Unvollständiges Wissen: Spezielle Logiken Widersprüchliches und nichtmonotones Wissen: Default-Logik Simulation biologischer Vorbilder • Entwicklung einer Population: Genetische Algorithmen • Struktur und Arbeitsweise des Gehirns: Neuronale Netze © Martin Klarner, Informatik 8 VORL 14a/Folie 13 Alternativen zur Wissensrepräsentation: BROOKS • • • Weg vom Fokus der klassischen KI auf Planen, Repräsentation, Inferenz Hin zu Systemen aus parallelen, autonom mit der Umwelt agierenden, lose gekoppelten Modulen Nachbildung wesentlicher Gehirnleistungen → mögliche Web-Applikationen – Aktoren → Agenten – Artikulatoren → Sprachverarbeitungsysteme – Sensoren → Suchmaschinen (Web-Content als Umwelt) • Kritik – Robotik-lastiger Ansatz (traditionell am MIT) – Behaviouristischer Ansatz (contra Kognitionswissenschaft) © Martin Klarner, Informatik 8 VORL 14a/Folie 14 Klassifikation von KI-Web-Anwendungen • Einteilung nach … – … Lokalisierung: Client, Medium, Server – … SWE-Phase: Entwicklung, Testen, Wartung, … – … Typisierung • Typen von KI-Anwendungen – KI-Applikation mit Web-Schnittstelle Beispiel: Expertensystem im Web (⇒ s. alte VORL!) – KI-basierte Anfrageschnittstelle Beispiel: Natürlichsprachliche Systeme (⇒ s. VORL 15!) – Web-Applikation mit KI-Techniken Beispiel: Suchmaschinen (⇒ s. VORL 12!) © Martin Klarner, Informatik 8 VORL 14a/Folie 15 Computerspiele im Web • Szenario: Web als Plattform – – – – – – • Dedizierte Game-Server für multiplayer-fähige Spiele Virtuelle Umgebung (2D, Quasi-3D, 3D) Menschliche und „künstliche“ Aktoren Kooperationen: Teams, Clans, Allianzen Deathmatches, Turniere, Ligen Real World Problems (Lagging, Cheating) Relevante Typen – Ego-Shooter • Ziel: Überleben und Frags erzielen • Erweiterte Ziele möglich (Capture The Flag, Geiselbefreiung, …) • „Künstliche“ Teilnehmer: Bots – Echtzeit-Strategiespiele • Ziel: Zivilisation aufbauen und Gegner dominieren • „Künstliche“ Teilnehmer: Civs © Martin Klarner, Informatik 8 VORL 14a/Folie 16 KI in Computerspielen • Strategien – Aggressiv/defensiv – Konfrontation/Kooperation • Taktiken – Einsatz der Waffen – Ausnutzen des Geländes • Wegeplanung – Weltmodell: Festverdrahtet oder Heuristik – Umgehen von Hindernissen – Terrainbewertung • Methoden – Skripte und Regelsysteme – Neuronale Netze und Genetische Algorithmen – Agenten und Planer © Martin Klarner, Informatik 8 VORL 14a/Folie 17 Data Mining im Web • • • • Metapher: Das Web als größte Datenbank Problem: Fehlendes Datenbankschema! Ansatz: Systematisierung der Metadaten (RDF!) Realisierung durch … – … Automatisierung von OLAP-Systemen (Berichtssysteme für Data Warehouses) – … Klassifikation (überwacht und unüberwacht) – … statistische Analyse – … Datentransformation und –säuberung – … Visualisierung • Software: www.kdnuggets.com/software/ © Martin Klarner, Informatik 8 VORL 14a/Folie 18 Text Mining im Web • Metapher: Das Web als größter Hypertext • Ziel: Unterstützung der Suche und Navigation durch (semi-)automatische Erstellung eines Thesaurus oder sogar einer Ontologie • Probleme – Größe und Heterogenität des Web – Tendenz geht weg von Dokumenten zu Applikationen • Realisierung – Volltextsuche – Indizierung – Clustering und Visualisierung © Martin Klarner, Informatik 8 VORL 14a/Folie 19 IBM Intelligent Miner for Text • Textanalyse – – – – – Sprachidentifikation Clusteranalyse auf Dokumenten Klassifikation nach benutzerdefinierten Kategorien Zusammenfassung durch Sammeln wichtiger Sätze „Merkmalsextraktion“: Namen, Fachwörter, Abk. • Volltextsuche: Indizierung mit Online-Update • Webcrawler mit Toolkit zur Anpassung und Entwicklung eigener Applikationen • Intranet-/Internet-Suchmaschine © Martin Klarner, Informatik 8 VORL 14a/Folie 20 Web Mining • Nicht nur Inhalt, sondern auch Benutzerverhalten sind Gegenstand der Analyse (z.B. von Logfiles) • Ziel: Personalisierung von Web Services • Teilaufgaben – Klassifikation (Gruppierung von Seiten) – Assoziation (gemeinsam aufgerufene Seiten) – Sequenzialisierung (Reihenfolge von Seiten) • Anforderungen – Skalierbarkeit (auf große Datenmengen) – Unschärfe (für realistisches Clustering) – Robustheit (gegenüber geringem Informationsgehalt) © Martin Klarner, Informatik 8 VORL 14a/Folie 21 Virtuelle Realität im Web • KI-Teilbereiche – – – – Symbolische Raum-Zeit-Modellierung: VRML Bildverarbeitung Szenenrekonstruktion Sensorik; neu: Haptische Interfaces • Computergrafik-Teilbereiche – Mathematische Raum-Zeit-Modellierung – Kollisionsdetektion und -verarbeitung – Rendern • Beispiele unter www.itl.nist.gov/iaui/ovrt/hotvr.html © Martin Klarner, Informatik 8 VORL 14a/Folie 22 Was bleibt? • Weitere klassische KI-Felder – – – – – Automatisches Beweisen Maschinelles Lernen Constraints Case-Based Reasoning Robotik • Einsatz von KI in und für Web-Applikationen – Agenten – Sprachverarbeitung – Suchmaschinen © Martin Klarner, Informatik 8 VORL 14a/Folie 23 Literatur und Links • • • • • • • • • www.cy-sys.com/inhalt.htm?/network/virustroja/virustypen.shtml Global Brain: pespmc1.vub.ac.be/GBRAIN-L.html Data Mining: www.webtechniques.com/archives/2000/01/greening/ Text Mining: www-personal.umich.edu/~wfan/text_mining.html IBM Intelligent Miner for Text: www-3.ibm.com/software/data/iminer/fortext/index.html Web Mining: www.cs.umbc.edu/~ajoshi/web-mine/ Virtual Reality: www.itl.nist.gov/iaui/ovrt/hotvr.html Brooks, R. Intelligence without representation. Artificial Intelligence 47 (1991). www.ai.mit.edu/people/brooks/papers/representation.pdf Aktuelle Web-Techniken: www.webtechniques.com © Martin Klarner, Informatik 8 VORL 14a/Folie 24