Soziale Simulationen

Werbung
Soziale Simulationen
Künstliche Gesellschaften und
individuelles Sozialverhalten
Matthias Schmitt
1
Was sind soziale Simulationen?
Informatik
Sozialwissenschaft
Soziale Simulationen &
künstliche Gesellschaften
Psychologie
Ökonomie
2
Interessante Fragestellungen
Gesellschaften
Warum entsteht soziales Verhalten in Gruppen?
Was ist die Voraussetzung dafür?
Wie wirken bestehende Normen?
soziale
Individuen
Computer
Simulationen
Menschen
Warum ist der einzelne sozial?
Wie entsteht Kooperation?
3
Interessante Fragen II
• Entstehung und Verbreitung von Normen, Allianzen,
Kooperationen, Gruppenbildung und –dynamik
• Kommunikation und Sprache, soziale Interaktion, Kultur
• Institutionen und Politik,
• Ökonomische Fragestellungen
4
Übersicht
• Soziale Simulationen mit zellulären Automaten
• Untersuchung von Normen unter diversen Aspekten
• Soziales Lernen
• Spielstrategien und –theorie
• Emotionale Agenten
5
Soziale Simulationen und zelluläre Automaten
• Segregation als makroskopischer Effekt bei mikroskopischer
Veränderung
• Migration, Kultur, Krieg, Handel
• Entstehung und Wirkung von Normen
6
Die Schelling-Simulation
• Primitiver zellulärer Automat
• Fragestellung: Entstehung von Segregation in nicht-rassistischen
Gesellschaften
7
Modell
• Zwei antagonistische
Typen von Agenten
können sich bewegen
• Eine Gefühlsregel
implementiert eine lokal
begrenzte FitnessFunktion, die dem Agenten
eine Präferenz für die
nächste Bewegung eingibt.
8
Regeln
• Ist ein Bürger unglücklich aufgrund seiner Nachbarn, so wandert
er auf ein angrenzendes Feld mit besseren Bedingungen
• Wie empfindlich ein Bürger auf die „falschen“ Nachbarn reagiert,
kann als Parameter e gewählt werden
• Die falschen Nachbarn können durch „gute“ wieder ausgeglichen
werden; e ergibt sich also aus dem Verhältnis der Anzahlen auf
den angrenzenden Feldern
9
Fragen
• Wie hängt die Empfindlichkeit eines Bürgers von der Neigung des
Systems zur Clusterbildung ab?
10
Ergebnisse
• Das makroskopische Ergebnis (Segregation) ist in den
überwiegenden Fällen unabhängig von der Empfindlichkeit der
Bürger
• obwohl Bürger auch durch „komplexe“ Musterbildung
zufriedengestellt werden könnten, bilden sich grosse, simple
Anhäufungen von gleichartigen Individuen
• Dabei ist zu beobachten, dass beispielsweise bei einer Präferenz von
55% in den resultierenden Clustern eine Majorität von ca. 80%
besteht (linearer 1D-Automat), wenn die Gruppen genau gleich
stark sind.
• Extrem primitiver Automat zeigt emergentes Verhalten, das auf
reale Situationen bezogen werden kann (Bsp.: erste Einwanderer in
Amerika)
11
Das Sugarscape-Modell
• Vielfältig einsetzbarer zellulärer Automat
• Simulation einer Population in einer künstlichen Umwelt, die
durch Regelwerk repräsentiert wird
• Primitive, regelbasierte Agentenreaktionen erzeugen komplexe
Strukturen (Emergenz)
• Fragestellungen:
–
–
–
–
–
–
–
Migration
Fortpflanzung
Kultur
Aggression
Eigentumsnorm
Handel
Krankheit
12
Modell
• Agenten bewegen sich
in einer Landschaft, die
eine oder mehrere
begrenzte,
nachwachsende
Ressource(n) bereitstellt
• Agenten sind
ausgezeichnet durch
ihre Sichtweite und
ihren Verdauungszyklus
• Untereinander können
sie Verhaltensregeln
(„Meme“) oder
Ressourcen austauschen
13
Leben in Sugarscape
• Landschaft: Torus von 50 x 50 Feldern (periodic boundary) mit VonNeumann-Nachbarschaft
• Verschiedenen Regionen mit unterschiedlicher Zuckermenge
• Standardregel - G a (G für growth): in jeder Stelle regeneriert sich der
Zucker mit einer Rate a pro Zeiteinheit bis zur maximalen lokalen
Menge
• Agenten sind am Anfang mit Zucker „ausgestattet“
• Zucker der nicht gegessen wurde, wird als Vermögen bezeichnet (bei
Vermögen gibt es keine Begrenzung und wird von der Zeit nicht
beeinflusst)
• Wenn ein Agent kein Zucker mehr besitzt, stirbt er und wird von
Sugarscape entfernt
• Die Agenten haben ein endliches Dasein und ihnen ist ein Geschlecht
zugewiesen
• Tragfähigkeit: Die Umwelt kann nicht beliebig viele Agenten ernähren
14
Beispiel-Simulationszyklus
Bewegungsregel
(M)
•
•
•
•
Fortpflanzungsregel
(S)
Kampfregeln (Ca)
Handelsregeln (T)
Jahreszeitenregeln (Se)
...
Kulturübertragungsregel (K)
Wachstumsregel
(G)
15
Grundlegende Regel-Beispiele
(M) Schau dich soweit wie möglich um und finde die nächste leere Zelle mit
max. Zucker. Gehe dorthin. Nimm allen Zucker.
(S) Falls im fruchtbaren Alter und beide Partner genügend Zucker besitzen,
wird ein Nachkomme erzeugt. Als Partner dienen alle Nachbarn, die den
Bedingungen genügen. Erbschaftsregeln können
(K) Im Gegensatz zur genetischen Ausprägung können die Kulturtags
während der Lebensspanne des Agenten geändert werden:
Für jeden Nachbarn wird zufällig ein Kulturtag ausgewählt und
angeglichen. Man kann die Population in Völker einteilen, indem man bestimmte
Übereinstimmungen in der Kultur zusammenfasst. Eltern vererben ihre kulturellen
Traditionen; bei unterschiedlicher „Meinung“ entscheidet der Zufall.
(G) Regenerationsregel, die den Zucker wachsen lässt. Im „Winter“ wächst
der Zucker langsamer als im Sommer, die Jahreszeiten lassen sich auch
lokal auf der Sugarscape-Welt einstellen, wodurch Migrationsverhalten
erzeugt werden kann.
16
Exkurs: Meme (Dawkins)
• „emanzipierte“ Informationseinheiten
• Gedanke oder „Idee“, Verhalten, Kulturtechniken => „Kulturtags“
• Mutation während der Fortpflanzung möglich
17
Fragen
• Wie wirken sich Beweglichkeit, Zuckerverteilung, verschiedene
Metabolismen oder Jahreszeiten aus? (Migration)
• Wie wirken sich verschiedene Kulturübertragungsregeln aus?
(Kultur)
• Wie wirken sich Handelsbeziehungen aus? (Handel)
• Unter welchen Umweltbedingungen entsteht eine
Eigentumsnorm? (Sozialverhalten)
18
Migration in Sugarscape
• Agenten konzentrieren sich auf die Orte höchster
Zuckerkonzentration
• Durch Jahreszeiten kann ein Zugvogelverhalten oder ein
„Winterschlaf“ erzeugt werden
• Besonders günstig: natürlich niedriger Metabolismus und hoher
Sichtradius
19
Kultur in Sugarscape
• Führt man eine kulturelle Zugehörigkeit ein, so nehmen
entweder langfristig alle die gleiche Kultur an, oder es entstehen
„Stämme“
• Dieser Zustand ist dann ein Gleichgewichtszustand
• Je länger der kulturelle Code ist, desto länger dauert es bis zum
equilibrierten System
20
Handel auf Sugarscape
• Es wird eine zweite Ressource eingefügt, z.B. Gewürz und jeder
Agent erhält ein Bedürfnis (Metabolismusraten SZ und SG) nach
dieser Ressource
• Dieses Bedürfnis hat je nach seiner Wichtigkeit Auswirkung auf
das Verhalten des Agenten:
tG 
VG
SG
tZ 
VZ
SZ
• Relative Wichtigkeit, G zu finden:
w
tZ
tG
21
Handel auf Sugarscape II
• Neue Bewegungsregel: schaue dich soweit wie möglich um und
bestimme das Feld, das den meisten Profit verspricht. Gehe
dorthin und sammle die entsprechende Ressource.
• Ergebnis: Pendelbewegung zwischen den Bergen und
Erschöpfungstod
22
Handel auf Sugarscape III
• „... We can imagine consumers wandering around a large market
square with all their possessions on their backs. They have
chance meeting each other, and when two consumers meet, they
examine what each has to offer to see if they can arrange a
mutually agreeable trade...“ (Kreps, 1990, zitiert nach Ernst)
• Wann und mit wem werden die Agenten handeln?
• Wie wird der Preis bestimmt?
• Wie groß wird das Handelsvolumen sein?
23
Handelsregeln
• Bedürfnis w: Mangel an Zucker: w  1
• Treffen zwei Agenten aufeinander, berechnen sie ihr w
wahrheitsgemäß und die folgende Tabelle gibt Aufschluss über
ihre Handelsverhalten (wA = wB => kein Handel):
wA > wB
Aktion
A
wA < wB
B
A
B
Kaufen
Zucker
Gewürz
Gewürz
Zucker
Verkaufen
Gewürz
Zucker
Zucker
Gewürz
• Mit jedem Handel nähern sich beide w an; der Wohlstand steigt.
• Handel wird auch stattfinden, wenn es beiden Akteuren an
derselben Ressource mangelt; der Agent mit dem relativ
geringeren Mangel wird durch Bestpreise belohnt
24
Preisbestimmung
• Damit beide profitieren, muss der Preis im Intervall wA ... wB
liegen. Um Zucker zu erhalten, ist A also nicht zu jeden Preis
bereit; der max. Preis ist wA. Alle Preise in diesem Intervall
wären akzeptabel, aber je näher der Preis an einem Ende liegt,
desto unfairer der Handel.
• Preis: p  wA wB
• p > 1: p Einheiten G pro Einheit Z
• p < 1: 1/p Einheiten Z pro Einheit G
25
Handel: Forschungsfragen
• Entwicklung der Preise und des Handelsvolumens?
• Individueller Profit und gesellschaftlicher Profit?
• Was passiert bei Auflockerung der neoklassischen Annahmen
von
– ewigem Leben
– konstanten Präferenzen und
– vollständiger Information
• Treten die Marktergebnisse der klassischen Theorie ein?
– Stellt sich eine pareto-optimale Verteilung ein?
– Erreichen Markt und Preis allg. Gleichgewicht?
26
Ergebnisse bei klassischen Agenten
• Anfängliche Preisvarianz nimmt ab; der Preis konvergiert
• Große Schwankungen im Handelsvolumen
• Bevölkerungskapazität des Systems wird verbessert
• Ein wirtschaftliches Gleichgewicht entsteht „from bottom up“
• Aber: das theoretische Handelsvolumen wird nie erreicht und das
Gleichgewicht ist nur bzgl. der nächsten Nachbarn optimal.
27
Handel unter dem Gesetz R(60,100)
• Ein Agent hat keine konstanten Präferenzen mehr, scheidet nach
einer festgelegten Zeit aus und wird durch einen randomisierten
Akteur ersetzt
• Folge: Entfernung von jeglichem Gleichgewicht
• Weitere Variante: Hinzunahme von S und evolutionäre Änderung
von Sichtweite und Metabolismus
• Folge: wie in R(60,100)
28
Handel und Kultur
• Änderung von Präferenzen durch den Kontakt mit anderen Akteuren
– Durch jeden Kontakt mit einem anderen Akteure kann sich der
Bedarf (=Stoffwechsel) an Z und G verschieben.
Folge: Eine enorme Preisschwankung und eine konstant hohe
Standardabweichung
• Wohlstandsverteilung
– Handel verschärft das Wohlstandsgefälle. Im Gegensatz zu einem
allgemeinen Gleichgewicht resultiert dieses nicht allein aus den
Unterschieden der ursprünglichen Ausstattung, sondern auch aus der
lokalen Preisheterogenität
• Veränderung des neoklassischen Modells zugunsten einer
realitätsnäheren Simulation zeigen eine dramatische Entfernung der
Lehrbuchmeinung über allgemeines Marktverhalten
29
Normemergenz auf Sugarscape
• Einführung eines „Eigentums-Mems“, welches das
Agentenverhalten beeinflusst. Ist es im kulturellen Code aktiv, so
– Wird der Agent Felder, auf die er kommt, als sein Eigentum
markieren
– Keinen fremden Zucker aus anderweitig markierten Zellen nehmen
– Optional (nicht in Originalarbeit): der Agent wird eine leichte Präferenz für
eigene Felder haben
• Der Nachwuchs erhält die Mem-Ausstattung der Eltern
• Einführung eines „Sanktionierungs-Mems“, dass den Agenten
dazu veranlasst, alle eventuellen Diebstähle (auch die bei
fremdem Eigentum) innerhalb seiner Sichtweite unter Einsatz
einer gewissen Zuckermenge seines eigenen Vorrats zu
bestrafen.
30
Normemergenz auf Sugarscape II
• Startbedingung:
– Ohne Sanktionierungsmöglichkeit
– 50% der Bevölkerung hat Eigentums-Mem
– Mem-Übertragungswahrscheinlichkeit 1/11
• Ergebnis: die Populationen sterben aus, sobald das Mem
verschwunden ist: Agenten ohne Mem sind zu arm, um sich zu
paaren.
• Populationen mit Mem am Start leben etwas länger als solche
völlig ohne Mem
31
Normemergenz auf Sugarscape III
• Startbedingung:
– Sanktionierungsmöglichkeit
– 50% der Bevölkerung hat Eigentums-Mem
– Sanktionierung kostet den Strafenden
• Ergebnis: das Eigentums-Mem hat weiterhin Schwierigkeiten, sich
zu etablieren
• Grund: es besteht ein Trittbrettfahrerproblem; das
Sanktionierungsmem erweist sich als Nachteil und stirbt aus
32
Normemergenz auf Sugarscape IV
• Startbedingung:
– Kostenfreie Sanktionierungsmöglichkeit
– 50% der Bevölkerung hat Eigentums-Mem
• Ergebnis: das Eigentums-Mem bleibt erhalten und sorgt für ein
dauerhaftes Überleben der Population auch bei hohen
Verdauungsraten
33
Normemergenz auf Sugarscape V
Ergebnisse:
• Die Durchsetzung einer Norm erfordert „billige“
Sanktionierungsmöglichkeiten
• Andernfalls besteht das Trittbrettfahrerproblem, dass
Normemergenz verhindert.
• Populationen ohne Eigentumsnorm sterben aus, wenn
ihre Umweltbedingungen und ihre Metabolismen nicht
optimal sind.
34
Normen: Entstehen und Wirkung
• Zusammenfassung:
– Normen können als emergentes Verhalten in Sugarscape simuliert werden.
– Zellularautomaten sind mächtige Werkzeuge zur Untersuchung von Artificial
Societies
• Jetzt:
– Normen als Regelsysteme
– Andere Normerzeugungsmechanismen in verschiedenen
Simulationssystemen und Modellen
35
Vorgegebene Normen
• Castelfranchi et al.: Norm zur Aggressionskontrolle in einem
zellulären Automat, dessen Agenten Stärke besitzen, die
abhängig von ihrer Nahrungsaufnahme ist und die bestimmte
Felder als Eigentum markieren können.
• Die Nahrung erscheint zufällig auf den Feldern
• Blind, Strategisch, oder Nonaggression als Agentenverhalten
implementiert. Attacken kosten den Angreifer und den
Verteidiger gleichermaßen Stärke.
• Die Nahrungsaufnahme benötigt mehrere Taktzyklen, in dieser
Zeit kann der essende Agent in den ersten beiden Fällen
angegriffen werden; der Stärkere gewinnt, reisst dem
schwachen das Futter weg und kann selbst den Essvorgang
beginnen.
• Nonaggression bedeutet, dass kein Angriff gegen einen
Agenten erfolgen darf, der auf seinem eigenen Feld isst.
36
Vorgegebene Normen II
Ergebnis:
• Normen können Aggression beschränken
• Normen haben einen positiven Effekt auf die durchschnittliche
Stärke eines Agenten, mindestens genauso effektiv ist wie
strategische Aggression
• Bei strategischer Aggression erleiden die schwachen Agenten
einen Nachteil, weil sie die Hauptlast der Aggressionskontrolle
tragen (die Starken werden ja nie attackiert)
• Normen haben Auswirkungen auf den Anteil des Agenten am
gesamten Nahrungsvorkommen, weil sowohl vorteilhafte wie
unvorteilhafte Attacken unterbunden werden und so die Kosten
für die Aggressionskontrolle gleichmäßiger verteilt werden
37
Normentstehung in anderen Modellen
Können egoistische Agenten Normen erlernen?
– Antwort Flentge: „Ja, solange billige Sanktionsmöglichkeiten
bestehen“
– Antwort Dawkin: „Ja, solange sie die gleichen Gene haben“
– Antwort Axelrod: „Ja, wenn die gleichen Agenten mehrfach
aufeinander stossen“
– Antwort Ito: „Ja, wenn das Wissen über das Verhalten des
Einzelnen jedem zugänglich ist“
– Antwort Dörner: „Ja, wenn sie ein emotionales Bedürfnis danach
haben“
38
Normverbreitung in anderen Algorithmen
• Die Durchsetzung einer Norm hängt in der Realität stark von der
Interaktion zwischen den Spielern ab, die bisher vernachlässigt
wurde.
• Interaktion bzw. Kommunikation wird in drei Formen modelliert:
– Zellularautomat
– Netzwerk mit power-law Verhalten
– Zufallsgraph mit poissonverteilten Verbindungen
• Fragestellung: MDT, Einfluss der Lernalgorithmen, Einfluss der
Konnektivität
39
Power-law-Netzwerk
• Eine kleine Anzahl Agenten hat eine weit überdurchschnittliche
Anzahl von Sozialkontakten
• Ausgehend von einer kleinen Anzahl Kontakte werden in jedem
Zeitschritt weitere Verbindungen geschaffen, wobei Andockstellen
bevorzugt werden, die bereits von vielen Verbindungen
angelaufen werden.
• Normkodierung wie bisher (Bitmuster)
40
Zufallsgraph
• Jeder Agent hat eine fixe Anzahl Verbindungen, die
Verbindungen sind poissonverteilt. Bei kleiner mittlerer
Verbindungszahl existieren isolierte Agenten.
Bei beiden Modellen interagiert jeweils ein zufällig gewählter
Akteur via einer seiner Verbindungen wie folgt:
Imitation: mit einer gewissen Wahrscheinlichkeit wird das Gegenüber
die Normcodierung übernehmen (oder umgekehrt), wobei die
Wahrscheinlichkeit dafür von der Hamming-Distanz der Normen
abhängen kann.
Individuell: ein Agent kann mit einer gewissen Wahrscheinlicheit
seine eigene Meinung bilden (zufällig).
41
Ergebnis
• Ohne individuelles Lernen setzt sich in allen Interaktionsmodellen
eine Norm durch
• Individuelles Lernen fördert die Koexistenz zweier verschiedener
Normen
• Die MDT für den Zufallsgraphen ist im allgemeinen deutlich größer
als für das PL-Netz (Spezialfall: durchschnittliche Konnektivität ist 1);
Grund: Die Pfadlänge ist im PL-Netz kürzer.
• Nähert sich die Konnektivität einem kritischen Bereich, so
konvergieren Randomnet und Powernet gegen eine gemeinsame
MDT.
• Die MDT hat ein Minimum zwischen den Bereichen extrem weniger
und extrem starker Interaktion.
42
Soziales Lernen
• Biologische Evolution, individuelles Lernen und kulturelle
Evolution sind Wege, das gleiche Problem zu lösen: Koordination
zwischen Agenteninterner und der Umweltstruktur zu erreichen.
Sie sind allerdings unterschiedlich schnell.
• Gibt man einer Population die Möglichkeit der
Umweltveränderung, so können auch komplexe Prozesse, die
vom Individuum innerhalb seiner Lebensspanne nicht gelernt
werden können, von der Gesellschaft adaptiert werden.
• Kultur involviert die Fähigkeit, Repräsentationen der Umwelt zu
erschaffen und so Informationen schneller und sicherer
weiterzugeben.
• Fragestellung: Erlernen einer Mondphasenvorhersage in einer
Gesellschaft
43
Relation zwischen den Strukturen und ihre
Möglichkeiten
Umweltstruktur
1. Direktes Lernen durch
Umweltbeobachtung
Interne Struktur
2. Erlernen einer Sprache,
um die Relation zwischen Umwelt- und
Kulturstruktur zu beschreiben
Kulturelle Struktur
3. Vermitteltes Lernen durch
Betrachtung der kulturellen Struktur
44
Simulation: Agenten
• Die Bewohner sind durch neuronale Netze repräsentiert, deren
Input sowohl künstliche als auch natürliche Muster sein können
• Ein Zyklus: jeder lernt so gut er kann (aus allen Bereichen:
Umwelt und Kultur), erzeugt ein Artefakt, erzeugt einen
Nachkommen und stirbt. Es findet keine „genetische“
Informationsübertragung statt.
• Jeder Nachkomme bekommt ein randomisiertes Startnetz.
• Welches Artefakt als Studienobjekt benutzt wird, kann
parametrisiert werden (auf „Erfolgsbasis“ der letzten Generation
oder per Zufall)
45
Simulation II: Umwelt
• Die zu erlernende Regel ist ein simples XOR. Ein perfektes
Artefakt sähe daher so aus:
Mondstatus Tidenstatus
Mond
Tide
Neumond
1000
01
N
00
0
Erstes Viertel
0100
10
E
10
1
Vollmond
0010
01
V
11
0
Drittes Viertel
0001
10
D
01
1
Symbolische Repräsentation (Agenten-Intern)
Physikalische Repräsentation
• Jede Ziffer kann mit reellen Zahlen von 0..1 belegt sein; die
Tabellen sind prototypisch
46
Aufbau eines Agenten
Mond-Beschreibungsnetz
Input des
Artefakts,
Mond-Anteil
Tiden-Beschreibungsnetz
Symbolisch
Symbolisch
Input des
Artefakts,
Tiden-Anteil
Erfahrung
Input durch
Erfahrung,
Tiden-Anteil
Aktuator
Input durch
Beobachtung,
Mond-Anteil
Erfahrung
Artefakt
47
Der Lernprozess
• Die Agentennetze werden in einem bestimmten Verhältnis von
direkter und vermittelter Beobachtung trainiert.
• Das Lernen von Artefakten wird bevorzugt, weil die natürliche
Beobachtung sehr lange dauert.
48
Ergebnis
• Der Lernprozess verläuft sehr langsam, falls keine Präferenz der
Nachkommen für die Nutzung von Artefakten „kompetenter“
Eltern besteht
• Mit einer solchen Vorliebe lernt die Gesellschaft in einer
absehbaren Anzahl von Generationen, sehr gute Artefakte
herzustellen und die durchschnittliche Kompetenz steigt stark an,
obgleich die Lernfähigkeit nicht zugenommen hat.
• Gesellschaften, die kulturelle Artefakte herstellen, profitieren von
diesen und helfen bei der Anpassung an die Umwelt; die
genetische Ausstattung ist nicht die einzige Quelle solcher
Anpassungen.
49
Spieltheoretische Ansätze
• Spiele eignen sich besonders, um bei Menschen (und
Maschinen) Verhaltensweisen zu erkennen; sie erzeugen eine
Abstraktion, die eine leichtere Mustererkennung möglich macht.
• Entstehung und Stabilisierung von Kooperation am Beispiel des
iterierten Gefangenendilemmas
• Fragestellung: Welche Strategien sind in diesem Spiel besonders
erfolgreich?
50
Das iterierte Gefangenendilemma
• N Spieler treffen mehrfach eine
Entscheidung: zu kooperieren
(C) oder zu defektieren (D).
• Das Spiel endet nach jedem Zug
mit der
Beendigungswahrscheinlichkeit
p = 1-w
• w nennt man Diskontparameter;
er ist ein Maß für die Wichtigkeit
des nächsten Zuges
• Defektionsverhalten wird klar
belohnt, falls das Gegenüber
kooperiert.
C
D
C
3/3
0/5
D
5/0
1/1
Typische Pay-off-Matrix P
51
Strategien für das Gefangenendilemma
TFT: „Wie du mir, so ich dir“
TRANQUILIZER: „Bilde eine Kooperationsphase, dann defektiere
gelegentlich“
TESTER: „Defektiere, dann spiele in Abhängigkeit von der Reaktion
TFT (nach D) oder spiele CC; defektiere danach bei jedem
zweiten Zug (nach C)“
52
Vergleich der Strategien
• TFT ist die „erfolgreichste“ Strategie, da sie
–
–
–
–
Robust
Nachsichtig
Durchsichtig
...
ist. Sie ist diejenige Strategie, die am schwierigsten
auszubeuten ist.
• Der Vergleich der Strategien ist schwierig, weil es von der
Zusammensetzung der Population abhängt, wie erfolgreich eine
Strategie ist.
53
Strategiegruppen
• Eindringen einer Strategie: eine Regel erzielt in einer homogenen
Regelpopulation höhere Punktzahlen als die Population.
• Kollektive Stabilität: Zustand, in dem keine Regel eindringen kann
• Kollektiv stabile Populationen können als einzige langfristig das
Auftreten von Mutanten verkraften
54
Axelrod´s Theoreme
1.
2.
3.
4.
5.
6.
7.
Wenn w groß genug ist, gibt es keine beste Strategie
unabhängig von der Strategie des anderen Spielers
TFT ist genau dann kollektiv stabil, wenn das Spiel lange genug
dauert (dabei ist w ist abhängig von P)
Jede Strategie, die mit p > ½ im ersten Zug C spielt, kann nur
kollektiv stabil sein, wenn w hinreichend groß ist
Eine freundliche Strategie ist nur dann kollektiv stabil, wenn sie
durch eine erste Defektion des anderen Spielers provoziert wird
Immer-D ist stabil
Diejenigen Strategien, die in Immer-D als Gruppe eindringen
können, sind maximal diskriminierend, wie z.B. TFT
Wenn ein einzelnes Individuum nicht in eine freundliche
Gruppe eindringen kann, kann auch keine Gruppe eindringen.
55
Schlussfolgerungen
• Sei nicht neidisch
• Defektiere nicht als erster
• Erwidere alle Verhaltensmuster
• Sei nicht zu raffiniert
[1], S. 99ff.
56
Das Nachbarschaftsbegrenzungsmodell
• Segregation kann mit dem alternativen Modell der „bounded
neighbourhoods“ untersucht werden.
• Die Begriffe, die für Strategiegruppen eingeführt wurden,
können aber hier interessanterweise analog genutzt werden.
57
Theoretische Psychologie: PSI
• Nach den Fragen zu normkonformem Verhalten, der Rolle der
Agenteninteraktion bei dessen Entstehen und der Untersuchung
des sozialen Lernens sollen nun die Motivationen untersucht
werden, die ein Individuum besitzt, sozial zu werden.
• Offenbar ist der Mensch kein vollständig rationale Subjekt, also
kann auch seine Motivation bei der Emergenz sozialen
Verhaltens nicht nur auf rational-egoistische Motive
zurückgeführt werden.
• Die theoretische Motivationspsychologie führt einen emotionalen
Aspekt in die Handlungssteuerung der Agenten ein und sorgt so
für realistischere Modelle.
58
PSI: Modellvorstellung
• Ein Roboter lebt auf einer
Insel und benötigt zum
Überleben Wasser als auch
diverse weitere Ressourcen.
• Sein Handlungsrepertoire
umfasst verschiedene
Aktivitäten, die er auf Objekte
seiner Umwelt anwenden
kann.
• Der Roboter vermag durch
korrekte Handlungen, seine
Bedürfnisse zu befriedigen.
59
PSI: Interner Aufbau
60
PSI: Funktionsweise
• PSI basiert auf einer Bedürfnisorientierten Motivationsstruktur
• Emotionale, materielle und informationelle Bedürfnisse erzeugen
Motivationen, die um die Kontrolle über die Steuerung des
Organismus konkurrieren (Subsumption); die Handlungen hängen
also vom gerade dominierenden Motiv ab.
• Da die „Sensoren“ von PSI nicht perfekt sind, kommt es zu
ungenauer Umweltwahrnehmung.
• Mit Hilfe eines Protokolls vermag PSI, seine Handlungen zu
reflektieren und so zu optimieren („Lernen“).
61
PSI: Emotionen als Quelle normativen
Verhaltens
• Setzt man mehrere PSI-Agenten auf die Insel und gibt ihnen ein
Affiliationsbedürfnis, so das andere PSIs durch Aussendung eines
Legitimitätssignalen (L-Signalen) dieses Bedürfnis befriedigen können,
so können Normen entstehen.
• Dies geschieht, weil PSIs lernen, L-Signale geschickt einzusetzen, d.h.
solche Signale hauptsächlich nur zu senden, wenn das Gegenüber sich
erkenntlich zeigt, indem es andere Bedürfnisse des Senders befriedigt.
Es entstehen Kooperation und Hilfsbereitschaft.
• Gegebenfalls muss ein PSI ein supplikatives Signal aussenden, also ein
Ankündigungssignal für ein potentielles L-Signal. Es entsteht ein
„Handel“, der z.B. Hilfe bei der Durstbefriedigung gegen die
Aussendung von L-Signalen tauscht.
• Das Erlernen von Zielen im Zusammenhang mit Affiliationsbedürfnis
führt zu engen Beziehungen, „Liebe“ zwischen den PSIs, da durch
häufigen Austausch von L-Signalen das Gegenüber zur Quelle derselben
wird.
62
Zusammenfassung
• Eine Vielzahl sozialwissenschaftlicher Situationen lässt sich relativ gut
simulieren.
• Inwieweit diese Simulationen reale Tatsachen wiederspiegeln, kann nicht
abschliessend geklärt werden; Simulationen können also Hilfe und
Ideengeneratoren sein, niemals aber die Erhebung realer Daten
ersetzen. Simulationen machen Vorschläge zur Interpretation dieser
Daten.
• Der für AL-Forschung interessante Blickwinkel ist die Emergenz
komplexen Verhaltens bei minimaler Ausstattung der Agenten.
• Für die Sozialwissenschaften ist die Modellierung realer Systeme und die
Möglichkeit der Thesengenerierung von Bedeutung
63
Quellen
[1]
[2]
[3]
[4]
[5]
[6]
[7]
Axelrod, R.: „Die Evolution der Kooperation“, 1984
Flentge et al.: „Modelling the Emergence of Possession Norms using Memes“, in: JASS Vol. 4 (2001)
Schelling, T.S.: „Dynamic Models of Segregation“ ; Journal of Mathematical Sociology 1971 Vol. 1 S. 143-186
Epstein, Axtell: „Growing artificial societies“ 1996
Dawkins, R.: „The selfish gene“, 1989
Ito, A.: „How do selfish agents learn to cooperate?“ in Artificial Life V, hrsgg. von Adami et al.
Conti, R. und Castelfranchi, C.: „Understanding the function of norms in social groups through simulation“
in „Simulating social phenomena“ 1997
[8] Nakamaru et al.: „Spread of two linked social norms on complex interaction networks“ in JOTB 230 (2004) S.
57ff.
[9] Hutchins, E. und Hazlehurst, B.: „Learning in the cultural process“ in Artificial Life I, 1990
[10] Levy, S.: „Künstliches Leben aus dem Computer“, 1996
[11] Dörner, D.: „Bauplan für eine Seele“, 1996
[12] Albert, R. und Barabasi, A.: „Statistical mechanics of complex networks“ in Review of modern Physics, Vol. 74
(2002) S. 47ff.
[13] Detje, F.: „PSI: erste Schritte in Richtung sozialen Verhaltens“, Memo 41 des Instituts für th. Psych. Der Uni
Bamberg (2001)
64
Herunterladen