Künstliche Intelligenz als Autor von Geschichten Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Software Engineering WS 2013/14 Dozent: Manfred Thaller Datum: 12.11.2013 Referent: Marvin Liu Gliederung 1. Tale-Spin 2. Minstrel 3. Universe 4. Terminal Time/ NLG 5. Finite-state machine/ NPCs in F.E.A.R. 1. Tale-Spin - Meehan Ursprünglich: Simulation der realen Welt Sinn: Modellierung rationalen Verhaltens der Figuren → Menschliches Verhalten zu komplex, daher wurden stattdessen Tiere integriert Welt von Tale-Spin verändert sich durch Events und deren Folgen Alle Events sind Handlungen, die Figuren involvieren, welche Aktionen ausführen Conceptual dependency Theory Es gibt nur 11 primitive Handlungen: – Propel, move, ingest, expel, grasp, speak, attend – Information in Person transferieren/ Information austauschen – Standortänderung – Abstrakte Beziehung zu einem Objekt ändern – Gedanken kreieren oder kombinieren Abläufe in Tale-Spin Wahl der Figuren Generierung von Figuren und passenden Fakten Wahl des Protagonisten Motivation des Protagonisten (hungry, tired, thirsty, horny) Planung der Figuren, um vorgegebenes Ziels zu erreichen Control structure of Tale-Spin's simulator Abläufe in Tale-Spin Benutzer entscheidet, was Figuren übereinander denken bzw. ihre Einstellung zueinander Von der jeweiligen Konstellation abhängig, können daraus Lügen entstehen, die Alternativwelten von Tale-Spin vorgaukeln Obwohl eine Figur schon mehrfach getäuscht wurde und sich die Einstellung zu der anderen Figur verschlechtert, wird immer wieder die selbe Figur befragt, weil keine anderen Figuren existieren Tale-Spin Beispiel Fazit Tale-Spin erzeugt an Figuren gekoppelte Events, ohne Wert auf die Repräsentation zu legen Geschichte ist allein abhängig von den Beziehung der Figuren und dem Ziel des Protagonisten. Die fiktionale Welt ist beinahe irrelevant Keine tiefgehenden Charaktere, Beziehungen, Emotionen und Umschreibungen Tale-Spin effect Als akkurate Simulation menschlichen Verhaltens gedacht, entpuppt sich Tale-Spin selbst als Fiktion von menschlichem Verhalten Zeigt die Grenzen der Simulation menschlichen Verhaltens auf Grundlage von vorprogrammierten Regeln auf Demonstriert die Entstehung von nur eingeschränkt sichtbaren fiktionalen Welten, da die zugrunde liegende K.I. weitestgehend unsichtbar bleibt → Tale-Spin effect 2. Minstrel - Turner TRAMs (transform-recall-adapt methods): 1. Szene wird durch Benutzer vorgegeben 2. Durchsuchen des Speichers nach dieser Szene 3. Überprüfung, ob die Szene schon 2x verwendet wurde → Bei Misserfolg von 2. oder 3. muss eine neue Lösung durch Transformation von bekannten Szenen gefunden werden Minstrels Transformationsmethoden Generalize-constraint: – Simular-outcome-partial-change: – Eine Bedingung wird gelockert Ähnliche Bedingungen werden gleichgesetzt Intention-switch: – Absichten werden verändert Fazit Aus Wissen über zwei Kurzgeschichten über König Arthur kann Minstrel mehr als 10 andere vollständige Geschichten und weit mehr unvollständige Geschichten erzählen Problem: Je mehr Minstrel weiß, desto mehr transformiert er sein Wissen und es entstehen unangebrachte Geschichten → Common-sense reasoning problem, da nur ein Teil menschlicher Kognition/Kreation simuliert wird 3. Universe Unterschiede zu Minstrel und Tale-Spin: 1. Kreiert Geschichten, die niemals enden 2. Form eines TV Melodramas, statt Fabeln 3. Orientiert sich an Art der Story und Charakterstrukturen, anstelle der Vorstellung wie menschliche Kognition Geschichten generiert Zweiteilige Organisation von Universe 1. Kreation eines verbundenen Sets von Charakteren und deren Hintergrundgeschichten, die das Grundgerüst der fiktiven Geschichte bilden 2. Erzeugung von Daten, wie Stereotype und Storyfragmente Generierung in Universe Das Autorenziel ist eine endlose Geschichte Story und Figuren werden nicht zufällig generiert, sondern in einer Konstellation aus dem Speicher entnommen, die dem Autorenziel dienlich ist Charaktere verfolgen kein Ziel, das zu einem Schlusspunkt führt. Hindernisse in der Story führen zu priorisierten untergeordneten Zielen der Charaktere Kreislauf von Heirat, Geburt und Tod Kinder erben z.T. Eigenschaften der Eltern und Eigenschaften ihres Rollenstereotyps Fazit Finale Version wurde bis 2008 noch nicht präsentiert, doch die Geschichten sollten damals schon deutlich komplexer sein, als die von Tale-Spin und Minstrel Kritik: Universe ist nur eine Aneinanderreihung von handgeschriebenen Storyelementen, statt ein Erzeugnis einer K.I. → Könnte bei genügend großen Datensätzen als Tool zur Storygenerierung für Autoren dienen 4. Terminal Time Ironische Darstellung von gesellschaftskritischen Themen in 20 minütigen audiovisuellen Präsentationen Präsentation innerhalb eines Theaters Auswahl der Themen, des Textes und der Videoclips durch applause-meter Wiederholte Befragung des Publikums nach Themen/Gefallen Vorherige Abstimmungen haben Einfluss auf den nächste Inhalte Texte werden durch NLG produziert und durch text-tospeech Programm wiedergegeben 2 Durchgänge mit unterbrechender Pause/Diskussion NLG (Natural Language Generation) Laut Reiter & Dale 6 grundlegende Aktivitäten: 1. Content determination: NLG System wandelt semantischen Input in Text um und erzeugt Set von Botschaften 2. Discourse planning: Strukturiert die Botschaften 3. Sentence aggregation: Bestimmt, wie Botschaften in Sätze gruppiert werden 4. Lexicalization: Bestimmt, welche Worte und Phrasen verwendet werden, um ein bestimmtes Konzept auszudrücken 5. Referring expression generation: Auswahl der Wörter und Phrasen, die auf bisherige Botschaften Bezug nehmen 5. Finite-state machine (FSM) Für simple Abfolgen verwendbar Bei komplexen Situationen fehleranfällig Beispiele: NPCs in NOLF 2 und The Sims NPCs in F.E.A.R. Verwendung von Strips (Stanford Research Institute Problem Solver), der Veränderung seiner Umgebung zu einer Zielumgebung wahrnimmt und schrittweise dahingehend verändert Bei jeder Veränderung wird die Umgebung neu analysiert und die eigene Aktion interpretiert NPCs in F.E.A.R. haben unterschiedliche Ziele, die um Aktivierung wetteifern (z.B. KillEnemy, Dodge, Goto) Ziel kann durch Abfolge von mehreren Aktionen erreicht werden (statt FSM) Durch Strips kann die Umgebung situativ genutzt werden NPCs in F.E.A.R. Verwendung der lowest-cost Methode Verhalten von Squads, die Sperrfeuer leisten und Dialoge auf Tale-Spin Niveau führen Bei Fehlschlägen einer Aktion wird der Grund des Misserfolgs gespeichert, damit ein Fehler/eine Aktion nicht fortlaufend wiederholt wird Fazit NPC's sind nur für Kampfsituationen geeignet, jedoch nicht für anderen Tätigkeiten und Verhaltensweisen NPC's haben ihre komplette Umgebung im Speicher und reagieren in der gleichen Situation immer auf die selbe Weise → Keine akkurate Simulation menschlichen Verhaltens → Integration von NLG wäre erstrebenswert, anstelle von vorgefertigten Audiodateien Vielen Dank für Eure Aufmerksamkeit!