Soziale Simulationen Künstliche Gesellschaften und individuelles Sozialverhalten Matthias Schmitt 1 Was sind soziale Simulationen? Informatik Sozialwissenschaft Soziale Simulationen & künstliche Gesellschaften Psychologie Ökonomie 2 Interessante Fragestellungen Gesellschaften Warum entsteht soziales Verhalten in Gruppen? Was ist die Voraussetzung dafür? Wie wirken bestehende Normen? soziale Individuen Computer Simulationen Menschen Warum ist der einzelne sozial? Wie entsteht Kooperation? 3 Interessante Fragen II • Entstehung und Verbreitung von Normen, Allianzen, Kooperationen, Gruppenbildung und –dynamik • Kommunikation und Sprache, soziale Interaktion, Kultur • Institutionen und Politik, • Ökonomische Fragestellungen 4 Übersicht • Soziale Simulationen mit zellulären Automaten • Untersuchung von Normen unter diversen Aspekten • Soziales Lernen • Spielstrategien und –theorie • Emotionale Agenten 5 Soziale Simulationen und zelluläre Automaten • Segregation als makroskopischer Effekt bei mikroskopischer Veränderung • Migration, Kultur, Krieg, Handel • Entstehung und Wirkung von Normen 6 Die Schelling-Simulation • Primitiver zellulärer Automat • Fragestellung: Entstehung von Segregation in nicht-rassistischen Gesellschaften 7 Modell • Zwei antagonistische Typen von Agenten können sich bewegen • Eine Gefühlsregel implementiert eine lokal begrenzte FitnessFunktion, die dem Agenten eine Präferenz für die nächste Bewegung eingibt. 8 Regeln • Ist ein Bürger unglücklich aufgrund seiner Nachbarn, so wandert er auf ein angrenzendes Feld mit besseren Bedingungen • Wie empfindlich ein Bürger auf die „falschen“ Nachbarn reagiert, kann als Parameter e gewählt werden • Die falschen Nachbarn können durch „gute“ wieder ausgeglichen werden; e ergibt sich also aus dem Verhältnis der Anzahlen auf den angrenzenden Feldern 9 Fragen • Wie hängt die Empfindlichkeit eines Bürgers von der Neigung des Systems zur Clusterbildung ab? 10 Ergebnisse • Das makroskopische Ergebnis (Segregation) ist in den überwiegenden Fällen unabhängig von der Empfindlichkeit der Bürger • obwohl Bürger auch durch „komplexe“ Musterbildung zufriedengestellt werden könnten, bilden sich grosse, simple Anhäufungen von gleichartigen Individuen • Dabei ist zu beobachten, dass beispielsweise bei einer Präferenz von 55% in den resultierenden Clustern eine Majorität von ca. 80% besteht (linearer 1D-Automat), wenn die Gruppen genau gleich stark sind. • Extrem primitiver Automat zeigt emergentes Verhalten, das auf reale Situationen bezogen werden kann (Bsp.: erste Einwanderer in Amerika) 11 Das Sugarscape-Modell • Vielfältig einsetzbarer zellulärer Automat • Simulation einer Population in einer künstlichen Umwelt, die durch Regelwerk repräsentiert wird • Primitive, regelbasierte Agentenreaktionen erzeugen komplexe Strukturen (Emergenz) • Fragestellungen: – – – – – – – Migration Fortpflanzung Kultur Aggression Eigentumsnorm Handel Krankheit 12 Modell • Agenten bewegen sich in einer Landschaft, die eine oder mehrere begrenzte, nachwachsende Ressource(n) bereitstellt • Agenten sind ausgezeichnet durch ihre Sichtweite und ihren Verdauungszyklus • Untereinander können sie Verhaltensregeln („Meme“) oder Ressourcen austauschen 13 Leben in Sugarscape • Landschaft: Torus von 50 x 50 Feldern (periodic boundary) mit VonNeumann-Nachbarschaft • Verschiedenen Regionen mit unterschiedlicher Zuckermenge • Standardregel - G a (G für growth): in jeder Stelle regeneriert sich der Zucker mit einer Rate a pro Zeiteinheit bis zur maximalen lokalen Menge • Agenten sind am Anfang mit Zucker „ausgestattet“ • Zucker der nicht gegessen wurde, wird als Vermögen bezeichnet (bei Vermögen gibt es keine Begrenzung und wird von der Zeit nicht beeinflusst) • Wenn ein Agent kein Zucker mehr besitzt, stirbt er und wird von Sugarscape entfernt • Die Agenten haben ein endliches Dasein und ihnen ist ein Geschlecht zugewiesen • Tragfähigkeit: Die Umwelt kann nicht beliebig viele Agenten ernähren 14 Beispiel-Simulationszyklus Bewegungsregel (M) • • • • Fortpflanzungsregel (S) Kampfregeln (Ca) Handelsregeln (T) Jahreszeitenregeln (Se) ... Kulturübertragungsregel (K) Wachstumsregel (G) 15 Grundlegende Regel-Beispiele (M) Schau dich soweit wie möglich um und finde die nächste leere Zelle mit max. Zucker. Gehe dorthin. Nimm allen Zucker. (S) Falls im fruchtbaren Alter und beide Partner genügend Zucker besitzen, wird ein Nachkomme erzeugt. Als Partner dienen alle Nachbarn, die den Bedingungen genügen. Erbschaftsregeln können (K) Im Gegensatz zur genetischen Ausprägung können die Kulturtags während der Lebensspanne des Agenten geändert werden: Für jeden Nachbarn wird zufällig ein Kulturtag ausgewählt und angeglichen. Man kann die Population in Völker einteilen, indem man bestimmte Übereinstimmungen in der Kultur zusammenfasst. Eltern vererben ihre kulturellen Traditionen; bei unterschiedlicher „Meinung“ entscheidet der Zufall. (G) Regenerationsregel, die den Zucker wachsen lässt. Im „Winter“ wächst der Zucker langsamer als im Sommer, die Jahreszeiten lassen sich auch lokal auf der Sugarscape-Welt einstellen, wodurch Migrationsverhalten erzeugt werden kann. 16 Exkurs: Meme (Dawkins) • „emanzipierte“ Informationseinheiten • Gedanke oder „Idee“, Verhalten, Kulturtechniken => „Kulturtags“ • Mutation während der Fortpflanzung möglich 17 Fragen • Wie wirken sich Beweglichkeit, Zuckerverteilung, verschiedene Metabolismen oder Jahreszeiten aus? (Migration) • Wie wirken sich verschiedene Kulturübertragungsregeln aus? (Kultur) • Wie wirken sich Handelsbeziehungen aus? (Handel) • Unter welchen Umweltbedingungen entsteht eine Eigentumsnorm? (Sozialverhalten) 18 Migration in Sugarscape • Agenten konzentrieren sich auf die Orte höchster Zuckerkonzentration • Durch Jahreszeiten kann ein Zugvogelverhalten oder ein „Winterschlaf“ erzeugt werden • Besonders günstig: natürlich niedriger Metabolismus und hoher Sichtradius 19 Kultur in Sugarscape • Führt man eine kulturelle Zugehörigkeit ein, so nehmen entweder langfristig alle die gleiche Kultur an, oder es entstehen „Stämme“ • Dieser Zustand ist dann ein Gleichgewichtszustand • Je länger der kulturelle Code ist, desto länger dauert es bis zum equilibrierten System 20 Handel auf Sugarscape • Es wird eine zweite Ressource eingefügt, z.B. Gewürz und jeder Agent erhält ein Bedürfnis (Metabolismusraten SZ und SG) nach dieser Ressource • Dieses Bedürfnis hat je nach seiner Wichtigkeit Auswirkung auf das Verhalten des Agenten: tG VG SG tZ VZ SZ • Relative Wichtigkeit, G zu finden: w tZ tG 21 Handel auf Sugarscape II • Neue Bewegungsregel: schaue dich soweit wie möglich um und bestimme das Feld, das den meisten Profit verspricht. Gehe dorthin und sammle die entsprechende Ressource. • Ergebnis: Pendelbewegung zwischen den Bergen und Erschöpfungstod 22 Handel auf Sugarscape III • „... We can imagine consumers wandering around a large market square with all their possessions on their backs. They have chance meeting each other, and when two consumers meet, they examine what each has to offer to see if they can arrange a mutually agreeable trade...“ (Kreps, 1990, zitiert nach Ernst) • Wann und mit wem werden die Agenten handeln? • Wie wird der Preis bestimmt? • Wie groß wird das Handelsvolumen sein? 23 Handelsregeln • Bedürfnis w: Mangel an Zucker: w 1 • Treffen zwei Agenten aufeinander, berechnen sie ihr w wahrheitsgemäß und die folgende Tabelle gibt Aufschluss über ihre Handelsverhalten (wA = wB => kein Handel): wA > wB Aktion A wA < wB B A B Kaufen Zucker Gewürz Gewürz Zucker Verkaufen Gewürz Zucker Zucker Gewürz • Mit jedem Handel nähern sich beide w an; der Wohlstand steigt. • Handel wird auch stattfinden, wenn es beiden Akteuren an derselben Ressource mangelt; der Agent mit dem relativ geringeren Mangel wird durch Bestpreise belohnt 24 Preisbestimmung • Damit beide profitieren, muss der Preis im Intervall wA ... wB liegen. Um Zucker zu erhalten, ist A also nicht zu jeden Preis bereit; der max. Preis ist wA. Alle Preise in diesem Intervall wären akzeptabel, aber je näher der Preis an einem Ende liegt, desto unfairer der Handel. • Preis: p wA wB • p > 1: p Einheiten G pro Einheit Z • p < 1: 1/p Einheiten Z pro Einheit G 25 Handel: Forschungsfragen • Entwicklung der Preise und des Handelsvolumens? • Individueller Profit und gesellschaftlicher Profit? • Was passiert bei Auflockerung der neoklassischen Annahmen von – ewigem Leben – konstanten Präferenzen und – vollständiger Information • Treten die Marktergebnisse der klassischen Theorie ein? – Stellt sich eine pareto-optimale Verteilung ein? – Erreichen Markt und Preis allg. Gleichgewicht? 26 Ergebnisse bei klassischen Agenten • Anfängliche Preisvarianz nimmt ab; der Preis konvergiert • Große Schwankungen im Handelsvolumen • Bevölkerungskapazität des Systems wird verbessert • Ein wirtschaftliches Gleichgewicht entsteht „from bottom up“ • Aber: das theoretische Handelsvolumen wird nie erreicht und das Gleichgewicht ist nur bzgl. der nächsten Nachbarn optimal. 27 Handel unter dem Gesetz R(60,100) • Ein Agent hat keine konstanten Präferenzen mehr, scheidet nach einer festgelegten Zeit aus und wird durch einen randomisierten Akteur ersetzt • Folge: Entfernung von jeglichem Gleichgewicht • Weitere Variante: Hinzunahme von S und evolutionäre Änderung von Sichtweite und Metabolismus • Folge: wie in R(60,100) 28 Handel und Kultur • Änderung von Präferenzen durch den Kontakt mit anderen Akteuren – Durch jeden Kontakt mit einem anderen Akteure kann sich der Bedarf (=Stoffwechsel) an Z und G verschieben. Folge: Eine enorme Preisschwankung und eine konstant hohe Standardabweichung • Wohlstandsverteilung – Handel verschärft das Wohlstandsgefälle. Im Gegensatz zu einem allgemeinen Gleichgewicht resultiert dieses nicht allein aus den Unterschieden der ursprünglichen Ausstattung, sondern auch aus der lokalen Preisheterogenität • Veränderung des neoklassischen Modells zugunsten einer realitätsnäheren Simulation zeigen eine dramatische Entfernung der Lehrbuchmeinung über allgemeines Marktverhalten 29 Normemergenz auf Sugarscape • Einführung eines „Eigentums-Mems“, welches das Agentenverhalten beeinflusst. Ist es im kulturellen Code aktiv, so – Wird der Agent Felder, auf die er kommt, als sein Eigentum markieren – Keinen fremden Zucker aus anderweitig markierten Zellen nehmen – Optional (nicht in Originalarbeit): der Agent wird eine leichte Präferenz für eigene Felder haben • Der Nachwuchs erhält die Mem-Ausstattung der Eltern • Einführung eines „Sanktionierungs-Mems“, dass den Agenten dazu veranlasst, alle eventuellen Diebstähle (auch die bei fremdem Eigentum) innerhalb seiner Sichtweite unter Einsatz einer gewissen Zuckermenge seines eigenen Vorrats zu bestrafen. 30 Normemergenz auf Sugarscape II • Startbedingung: – Ohne Sanktionierungsmöglichkeit – 50% der Bevölkerung hat Eigentums-Mem – Mem-Übertragungswahrscheinlichkeit 1/11 • Ergebnis: die Populationen sterben aus, sobald das Mem verschwunden ist: Agenten ohne Mem sind zu arm, um sich zu paaren. • Populationen mit Mem am Start leben etwas länger als solche völlig ohne Mem 31 Normemergenz auf Sugarscape III • Startbedingung: – Sanktionierungsmöglichkeit – 50% der Bevölkerung hat Eigentums-Mem – Sanktionierung kostet den Strafenden • Ergebnis: das Eigentums-Mem hat weiterhin Schwierigkeiten, sich zu etablieren • Grund: es besteht ein Trittbrettfahrerproblem; das Sanktionierungsmem erweist sich als Nachteil und stirbt aus 32 Normemergenz auf Sugarscape IV • Startbedingung: – Kostenfreie Sanktionierungsmöglichkeit – 50% der Bevölkerung hat Eigentums-Mem • Ergebnis: das Eigentums-Mem bleibt erhalten und sorgt für ein dauerhaftes Überleben der Population auch bei hohen Verdauungsraten 33 Normemergenz auf Sugarscape V Ergebnisse: • Die Durchsetzung einer Norm erfordert „billige“ Sanktionierungsmöglichkeiten • Andernfalls besteht das Trittbrettfahrerproblem, dass Normemergenz verhindert. • Populationen ohne Eigentumsnorm sterben aus, wenn ihre Umweltbedingungen und ihre Metabolismen nicht optimal sind. 34 Normen: Entstehen und Wirkung • Zusammenfassung: – Normen können als emergentes Verhalten in Sugarscape simuliert werden. – Zellularautomaten sind mächtige Werkzeuge zur Untersuchung von Artificial Societies • Jetzt: – Normen als Regelsysteme – Andere Normerzeugungsmechanismen in verschiedenen Simulationssystemen und Modellen 35 Vorgegebene Normen • Castelfranchi et al.: Norm zur Aggressionskontrolle in einem zellulären Automat, dessen Agenten Stärke besitzen, die abhängig von ihrer Nahrungsaufnahme ist und die bestimmte Felder als Eigentum markieren können. • Die Nahrung erscheint zufällig auf den Feldern • Blind, Strategisch, oder Nonaggression als Agentenverhalten implementiert. Attacken kosten den Angreifer und den Verteidiger gleichermaßen Stärke. • Die Nahrungsaufnahme benötigt mehrere Taktzyklen, in dieser Zeit kann der essende Agent in den ersten beiden Fällen angegriffen werden; der Stärkere gewinnt, reisst dem schwachen das Futter weg und kann selbst den Essvorgang beginnen. • Nonaggression bedeutet, dass kein Angriff gegen einen Agenten erfolgen darf, der auf seinem eigenen Feld isst. 36 Vorgegebene Normen II Ergebnis: • Normen können Aggression beschränken • Normen haben einen positiven Effekt auf die durchschnittliche Stärke eines Agenten, mindestens genauso effektiv ist wie strategische Aggression • Bei strategischer Aggression erleiden die schwachen Agenten einen Nachteil, weil sie die Hauptlast der Aggressionskontrolle tragen (die Starken werden ja nie attackiert) • Normen haben Auswirkungen auf den Anteil des Agenten am gesamten Nahrungsvorkommen, weil sowohl vorteilhafte wie unvorteilhafte Attacken unterbunden werden und so die Kosten für die Aggressionskontrolle gleichmäßiger verteilt werden 37 Normentstehung in anderen Modellen Können egoistische Agenten Normen erlernen? – Antwort Flentge: „Ja, solange billige Sanktionsmöglichkeiten bestehen“ – Antwort Dawkin: „Ja, solange sie die gleichen Gene haben“ – Antwort Axelrod: „Ja, wenn die gleichen Agenten mehrfach aufeinander stossen“ – Antwort Ito: „Ja, wenn das Wissen über das Verhalten des Einzelnen jedem zugänglich ist“ – Antwort Dörner: „Ja, wenn sie ein emotionales Bedürfnis danach haben“ 38 Normverbreitung in anderen Algorithmen • Die Durchsetzung einer Norm hängt in der Realität stark von der Interaktion zwischen den Spielern ab, die bisher vernachlässigt wurde. • Interaktion bzw. Kommunikation wird in drei Formen modelliert: – Zellularautomat – Netzwerk mit power-law Verhalten – Zufallsgraph mit poissonverteilten Verbindungen • Fragestellung: MDT, Einfluss der Lernalgorithmen, Einfluss der Konnektivität 39 Power-law-Netzwerk • Eine kleine Anzahl Agenten hat eine weit überdurchschnittliche Anzahl von Sozialkontakten • Ausgehend von einer kleinen Anzahl Kontakte werden in jedem Zeitschritt weitere Verbindungen geschaffen, wobei Andockstellen bevorzugt werden, die bereits von vielen Verbindungen angelaufen werden. • Normkodierung wie bisher (Bitmuster) 40 Zufallsgraph • Jeder Agent hat eine fixe Anzahl Verbindungen, die Verbindungen sind poissonverteilt. Bei kleiner mittlerer Verbindungszahl existieren isolierte Agenten. Bei beiden Modellen interagiert jeweils ein zufällig gewählter Akteur via einer seiner Verbindungen wie folgt: Imitation: mit einer gewissen Wahrscheinlichkeit wird das Gegenüber die Normcodierung übernehmen (oder umgekehrt), wobei die Wahrscheinlichkeit dafür von der Hamming-Distanz der Normen abhängen kann. Individuell: ein Agent kann mit einer gewissen Wahrscheinlicheit seine eigene Meinung bilden (zufällig). 41 Ergebnis • Ohne individuelles Lernen setzt sich in allen Interaktionsmodellen eine Norm durch • Individuelles Lernen fördert die Koexistenz zweier verschiedener Normen • Die MDT für den Zufallsgraphen ist im allgemeinen deutlich größer als für das PL-Netz (Spezialfall: durchschnittliche Konnektivität ist 1); Grund: Die Pfadlänge ist im PL-Netz kürzer. • Nähert sich die Konnektivität einem kritischen Bereich, so konvergieren Randomnet und Powernet gegen eine gemeinsame MDT. • Die MDT hat ein Minimum zwischen den Bereichen extrem weniger und extrem starker Interaktion. 42 Soziales Lernen • Biologische Evolution, individuelles Lernen und kulturelle Evolution sind Wege, das gleiche Problem zu lösen: Koordination zwischen Agenteninterner und der Umweltstruktur zu erreichen. Sie sind allerdings unterschiedlich schnell. • Gibt man einer Population die Möglichkeit der Umweltveränderung, so können auch komplexe Prozesse, die vom Individuum innerhalb seiner Lebensspanne nicht gelernt werden können, von der Gesellschaft adaptiert werden. • Kultur involviert die Fähigkeit, Repräsentationen der Umwelt zu erschaffen und so Informationen schneller und sicherer weiterzugeben. • Fragestellung: Erlernen einer Mondphasenvorhersage in einer Gesellschaft 43 Relation zwischen den Strukturen und ihre Möglichkeiten Umweltstruktur 1. Direktes Lernen durch Umweltbeobachtung Interne Struktur 2. Erlernen einer Sprache, um die Relation zwischen Umwelt- und Kulturstruktur zu beschreiben Kulturelle Struktur 3. Vermitteltes Lernen durch Betrachtung der kulturellen Struktur 44 Simulation: Agenten • Die Bewohner sind durch neuronale Netze repräsentiert, deren Input sowohl künstliche als auch natürliche Muster sein können • Ein Zyklus: jeder lernt so gut er kann (aus allen Bereichen: Umwelt und Kultur), erzeugt ein Artefakt, erzeugt einen Nachkommen und stirbt. Es findet keine „genetische“ Informationsübertragung statt. • Jeder Nachkomme bekommt ein randomisiertes Startnetz. • Welches Artefakt als Studienobjekt benutzt wird, kann parametrisiert werden (auf „Erfolgsbasis“ der letzten Generation oder per Zufall) 45 Simulation II: Umwelt • Die zu erlernende Regel ist ein simples XOR. Ein perfektes Artefakt sähe daher so aus: Mondstatus Tidenstatus Mond Tide Neumond 1000 01 N 00 0 Erstes Viertel 0100 10 E 10 1 Vollmond 0010 01 V 11 0 Drittes Viertel 0001 10 D 01 1 Symbolische Repräsentation (Agenten-Intern) Physikalische Repräsentation • Jede Ziffer kann mit reellen Zahlen von 0..1 belegt sein; die Tabellen sind prototypisch 46 Aufbau eines Agenten Mond-Beschreibungsnetz Input des Artefakts, Mond-Anteil Tiden-Beschreibungsnetz Symbolisch Symbolisch Input des Artefakts, Tiden-Anteil Erfahrung Input durch Erfahrung, Tiden-Anteil Aktuator Input durch Beobachtung, Mond-Anteil Erfahrung Artefakt 47 Der Lernprozess • Die Agentennetze werden in einem bestimmten Verhältnis von direkter und vermittelter Beobachtung trainiert. • Das Lernen von Artefakten wird bevorzugt, weil die natürliche Beobachtung sehr lange dauert. 48 Ergebnis • Der Lernprozess verläuft sehr langsam, falls keine Präferenz der Nachkommen für die Nutzung von Artefakten „kompetenter“ Eltern besteht • Mit einer solchen Vorliebe lernt die Gesellschaft in einer absehbaren Anzahl von Generationen, sehr gute Artefakte herzustellen und die durchschnittliche Kompetenz steigt stark an, obgleich die Lernfähigkeit nicht zugenommen hat. • Gesellschaften, die kulturelle Artefakte herstellen, profitieren von diesen und helfen bei der Anpassung an die Umwelt; die genetische Ausstattung ist nicht die einzige Quelle solcher Anpassungen. 49 Spieltheoretische Ansätze • Spiele eignen sich besonders, um bei Menschen (und Maschinen) Verhaltensweisen zu erkennen; sie erzeugen eine Abstraktion, die eine leichtere Mustererkennung möglich macht. • Entstehung und Stabilisierung von Kooperation am Beispiel des iterierten Gefangenendilemmas • Fragestellung: Welche Strategien sind in diesem Spiel besonders erfolgreich? 50 Das iterierte Gefangenendilemma • N Spieler treffen mehrfach eine Entscheidung: zu kooperieren (C) oder zu defektieren (D). • Das Spiel endet nach jedem Zug mit der Beendigungswahrscheinlichkeit p = 1-w • w nennt man Diskontparameter; er ist ein Maß für die Wichtigkeit des nächsten Zuges • Defektionsverhalten wird klar belohnt, falls das Gegenüber kooperiert. C D C 3/3 0/5 D 5/0 1/1 Typische Pay-off-Matrix P 51 Strategien für das Gefangenendilemma TFT: „Wie du mir, so ich dir“ TRANQUILIZER: „Bilde eine Kooperationsphase, dann defektiere gelegentlich“ TESTER: „Defektiere, dann spiele in Abhängigkeit von der Reaktion TFT (nach D) oder spiele CC; defektiere danach bei jedem zweiten Zug (nach C)“ 52 Vergleich der Strategien • TFT ist die „erfolgreichste“ Strategie, da sie – – – – Robust Nachsichtig Durchsichtig ... ist. Sie ist diejenige Strategie, die am schwierigsten auszubeuten ist. • Der Vergleich der Strategien ist schwierig, weil es von der Zusammensetzung der Population abhängt, wie erfolgreich eine Strategie ist. 53 Strategiegruppen • Eindringen einer Strategie: eine Regel erzielt in einer homogenen Regelpopulation höhere Punktzahlen als die Population. • Kollektive Stabilität: Zustand, in dem keine Regel eindringen kann • Kollektiv stabile Populationen können als einzige langfristig das Auftreten von Mutanten verkraften 54 Axelrod´s Theoreme 1. 2. 3. 4. 5. 6. 7. Wenn w groß genug ist, gibt es keine beste Strategie unabhängig von der Strategie des anderen Spielers TFT ist genau dann kollektiv stabil, wenn das Spiel lange genug dauert (dabei ist w ist abhängig von P) Jede Strategie, die mit p > ½ im ersten Zug C spielt, kann nur kollektiv stabil sein, wenn w hinreichend groß ist Eine freundliche Strategie ist nur dann kollektiv stabil, wenn sie durch eine erste Defektion des anderen Spielers provoziert wird Immer-D ist stabil Diejenigen Strategien, die in Immer-D als Gruppe eindringen können, sind maximal diskriminierend, wie z.B. TFT Wenn ein einzelnes Individuum nicht in eine freundliche Gruppe eindringen kann, kann auch keine Gruppe eindringen. 55 Schlussfolgerungen • Sei nicht neidisch • Defektiere nicht als erster • Erwidere alle Verhaltensmuster • Sei nicht zu raffiniert [1], S. 99ff. 56 Das Nachbarschaftsbegrenzungsmodell • Segregation kann mit dem alternativen Modell der „bounded neighbourhoods“ untersucht werden. • Die Begriffe, die für Strategiegruppen eingeführt wurden, können aber hier interessanterweise analog genutzt werden. 57 Theoretische Psychologie: PSI • Nach den Fragen zu normkonformem Verhalten, der Rolle der Agenteninteraktion bei dessen Entstehen und der Untersuchung des sozialen Lernens sollen nun die Motivationen untersucht werden, die ein Individuum besitzt, sozial zu werden. • Offenbar ist der Mensch kein vollständig rationale Subjekt, also kann auch seine Motivation bei der Emergenz sozialen Verhaltens nicht nur auf rational-egoistische Motive zurückgeführt werden. • Die theoretische Motivationspsychologie führt einen emotionalen Aspekt in die Handlungssteuerung der Agenten ein und sorgt so für realistischere Modelle. 58 PSI: Modellvorstellung • Ein Roboter lebt auf einer Insel und benötigt zum Überleben Wasser als auch diverse weitere Ressourcen. • Sein Handlungsrepertoire umfasst verschiedene Aktivitäten, die er auf Objekte seiner Umwelt anwenden kann. • Der Roboter vermag durch korrekte Handlungen, seine Bedürfnisse zu befriedigen. 59 PSI: Interner Aufbau 60 PSI: Funktionsweise • PSI basiert auf einer Bedürfnisorientierten Motivationsstruktur • Emotionale, materielle und informationelle Bedürfnisse erzeugen Motivationen, die um die Kontrolle über die Steuerung des Organismus konkurrieren (Subsumption); die Handlungen hängen also vom gerade dominierenden Motiv ab. • Da die „Sensoren“ von PSI nicht perfekt sind, kommt es zu ungenauer Umweltwahrnehmung. • Mit Hilfe eines Protokolls vermag PSI, seine Handlungen zu reflektieren und so zu optimieren („Lernen“). 61 PSI: Emotionen als Quelle normativen Verhaltens • Setzt man mehrere PSI-Agenten auf die Insel und gibt ihnen ein Affiliationsbedürfnis, so das andere PSIs durch Aussendung eines Legitimitätssignalen (L-Signalen) dieses Bedürfnis befriedigen können, so können Normen entstehen. • Dies geschieht, weil PSIs lernen, L-Signale geschickt einzusetzen, d.h. solche Signale hauptsächlich nur zu senden, wenn das Gegenüber sich erkenntlich zeigt, indem es andere Bedürfnisse des Senders befriedigt. Es entstehen Kooperation und Hilfsbereitschaft. • Gegebenfalls muss ein PSI ein supplikatives Signal aussenden, also ein Ankündigungssignal für ein potentielles L-Signal. Es entsteht ein „Handel“, der z.B. Hilfe bei der Durstbefriedigung gegen die Aussendung von L-Signalen tauscht. • Das Erlernen von Zielen im Zusammenhang mit Affiliationsbedürfnis führt zu engen Beziehungen, „Liebe“ zwischen den PSIs, da durch häufigen Austausch von L-Signalen das Gegenüber zur Quelle derselben wird. 62 Zusammenfassung • Eine Vielzahl sozialwissenschaftlicher Situationen lässt sich relativ gut simulieren. • Inwieweit diese Simulationen reale Tatsachen wiederspiegeln, kann nicht abschliessend geklärt werden; Simulationen können also Hilfe und Ideengeneratoren sein, niemals aber die Erhebung realer Daten ersetzen. Simulationen machen Vorschläge zur Interpretation dieser Daten. • Der für AL-Forschung interessante Blickwinkel ist die Emergenz komplexen Verhaltens bei minimaler Ausstattung der Agenten. • Für die Sozialwissenschaften ist die Modellierung realer Systeme und die Möglichkeit der Thesengenerierung von Bedeutung 63 Quellen [1] [2] [3] [4] [5] [6] [7] Axelrod, R.: „Die Evolution der Kooperation“, 1984 Flentge et al.: „Modelling the Emergence of Possession Norms using Memes“, in: JASS Vol. 4 (2001) Schelling, T.S.: „Dynamic Models of Segregation“ ; Journal of Mathematical Sociology 1971 Vol. 1 S. 143-186 Epstein, Axtell: „Growing artificial societies“ 1996 Dawkins, R.: „The selfish gene“, 1989 Ito, A.: „How do selfish agents learn to cooperate?“ in Artificial Life V, hrsgg. von Adami et al. Conti, R. und Castelfranchi, C.: „Understanding the function of norms in social groups through simulation“ in „Simulating social phenomena“ 1997 [8] Nakamaru et al.: „Spread of two linked social norms on complex interaction networks“ in JOTB 230 (2004) S. 57ff. [9] Hutchins, E. und Hazlehurst, B.: „Learning in the cultural process“ in Artificial Life I, 1990 [10] Levy, S.: „Künstliches Leben aus dem Computer“, 1996 [11] Dörner, D.: „Bauplan für eine Seele“, 1996 [12] Albert, R. und Barabasi, A.: „Statistical mechanics of complex networks“ in Review of modern Physics, Vol. 74 (2002) S. 47ff. [13] Detje, F.: „PSI: erste Schritte in Richtung sozialen Verhaltens“, Memo 41 des Instituts für th. Psych. Der Uni Bamberg (2001) 64