Proseminar: Visualisierung in der Bioinformatik 6LPXODWLRQGHU(YROXWLRQ Computersimulationen von evolutionären Veränderungen durch Mutation und Selektion Bianca Büttner SS 2004 Überblick • Mechanismen der Evolution als Grundlage für Computersimulationen (kurz) • Simulationsbeispiele: – Die Avida-Welt – Creatures – Das interaktive PC-Spiel – Dawkins Biomorphe • Vor- und Nachteile von Evolutionssimulationen • Ausblick auf die Zukunft der Evolutionssimulationen Bianca Büttner Simulation der Evolution 2 1 Mechanismen der Evolution Basierend auf der Hypothese von C. Darwin • Natürliche Selektion • Mutation • Vererbung der Gene Bianca Büttner Simulation der Evolution 3 Natürliche Selektion • • • • • Selektionsvorteil durch phänotypische Anpassung an die Umwelt (d.h. nur Gene, die direkt das äußere Erscheinungsbild beeinflussen, sind betroffen). Selektion entscheidet ob eine Mutation positiv oder negativ für den Organismus ist. Selektionsdruck wird von den Umweltbedingungen eines Lebewesens ausgeübt. Erhöhung der Überlebenschance einer Population durch Weitergeben des genetischen Selektionsvorteils an die Nachkommen. Beispiel: Stummelflügelmutant der Fruchtfliege auf den Kergueleninseln. Bianca Büttner Simulation der Evolution 4 2 Selektionsarten • Gerichtete Selektion – Beispiel: DDT-Resistenz bei Insekten • Stabilisierende Selektion – Eliminiert die Extrema eines Phänotyps – Beispiel: Erhöhte Sterblichkeit bei Säuglingen über und unter 7,5 Pfund • Unterbrechende Selektion – Erzeugt mehrere Variationen eines Phänotyps statt eines Einzigen als Anpassung an die Umwelt Bianca Büttner Simulation der Evolution 5 Mutation • Genommutation – Fehler bei der Verteilung der Chromosomen auf die Tochterzellen bei der Zellteilung. – Beispiel: Down-Syndrom (21. Chromosom ist dreifach vorhanden) • Chromosomenmutation – Veränderung der Chromosomenform z.B. können Chromosomen verkürzt oder ringförmig sein. • Genmutation – Modifizierung von Genen, die als Vorlage für Proteine dienen. – Sehr wichtig für die evolutionären Prozesse, die simuliert werden sollen. Bianca Büttner Simulation der Evolution 6 3 Genmutationsarten • Punktmutation – Vertauschung einer Base im DNA-Strang. • Fehlsinnmutation: Es entsteht ein neues Codon und somit ein neues Protein. • Stille Mutation: Es entsteht ein Codon, dass nicht existiert. • Nonsensmutation – Durch Basentausch entsteht ein Stopcodon, was zu einem defekten Protein führt. • Rastermutation – Insertion oder Deletion von Basenpaaren führen zur Verschiebung des Triplettrasters und somit zu defekten Proteinen. Bianca Büttner Simulation der Evolution 7 Programmierung • Computersimulationen über die Evolution sind meist objektorientiert programmiert (vor allem in C++ oder Java). • Die Plattform einer Simulation ist abhängig vom Entwickler. • Avida wurde ursprünglich für Linux und Creatures für Windows 95 entwickelt. Bianca Büttner Simulation der Evolution 8 4 Die Avida-Welt • Simuliert digitale Lebewesen in einer virtuellen Umwelt in Form von kleinen Computerprogrammen, die sich selbst kopieren und ausführen können (vergleichbar mit einem Virus). • Entwickelt von Christopher Adami (Digital Life Laboratory, California Institute of Technology, Pasadena) in Zusammenarbeit mit Richard E. Lenski, Charles Ofria und Robert T. Pennock von der Michigan State University. • Seit 2003 kostenlos im Netz erhältlich. • Erster Vorläufer (1990) war „Tierra“ von Thomas Ray. Bianca Büttner Simulation der Evolution 9 Aufbau eines Avida-Lebewesens • Zirkuläres Genom: Kette von Genen - einfache Maschinenbefehle, die der Reihenfolge nach abgearbeitet werden. • Virtuelle CPU, bestehend aus 3 Registern und 2 Stacks, die 32-Bit-Eingabestrings verarbeiten können. • keine sichtbare Benutzeroberfläche, Phänotyp ist der virtuelle Computer, der die Instruktionen ausführt. Bianca Büttner Simulation der Evolution 10 5 Übersicht der Maschinenbefehle Es gibt insgesamt 26 Instruktionen, die das AvidaLebewesen ausführen kann, um logische Funktionen zu berechnen. Beispiel: IO = Eingabe/Ausgabe der Register Bianca Büttner Simulation der Evolution 11 Fortpflanzung in Avida • • • Asexuelle Vermehrung Fehlerhafter Kopiervorgang sorgt für Entstehung von Mutationen: Gene werden ersetzt (Punktmutation), hinzugefügt (Insertion) oder weggelassen (Deletion). Durch die Mutationen kommt es zu Variationen der Genomlänge (Anzahl der Instruktionen im Genom): – Je kürzer das Genom desto schneller der Kopiervorgang (Selektionsvorteil). – Je kürzer das Genom desto weniger Funktionen sind ausführbar (Selektionsnachteil). • Die meisten Mutationen sind neutral oder sogar nachteilig, aber ein paar Wenige bewirken einen Selektionsvorteil. Bianca Büttner Simulation der Evolution 12 6 Energie als Belohnung für evolutionäre Entwicklung • • • • • • Pro Instruktion wird eine Energieeinheit (SIP – Single Instruction Processing Unit) verbraucht. Begrenzter Energievorrat – zusätzliche Energie nötig zur Ausführung von Instruktionen (Selektionsdruck). Lebewesen erhält Energie für korrektes Ausführen logischer Operationen an 32-Bit-Strings. Es gibt 9 logische Funktionen (über Instruktion NAND aufgebaut), die jede unterschiedlich viele SIPs liefert. Funktion EQU liefert die meiste Energie (Selektionsvorteil). Lebewesen bekommt nur Energie beim 1. Mal Ausführen der neu erlernten Funktion – muß also immer neue Funktionen erlernen. Es sind viele Mutationen nötig, um eine logische Operation ausführen zu können, und nicht alle sind auf den ersten Blick positiv. Bianca Büttner Simulation der Evolution 13 Berechnung der logischen Funktion „EQU“ • • • • Überprüft zwei binäre 32-Bit lange Strings auf Gleichheit. Strings werden eingegeben, durch NAND-Operatoren verknüpft und in den Registern BX und CX gespeichert. Vergleich der Strings liefert eine Null, beide an der gleichen Position eine Eins haben, ansonsten wird eine Eins ausgegeben. Das Ergebnis des Vergleichs wird in Register AX gespeichert und von dort ausgegeben (über Instruktionen: nop-A und IO). Bianca Büttner Simulation der Evolution 14 7 Visualisierung von Ergebnissen (1) • Fallstudie: – 3600 Avida-Lebewesen – zu Beginn unfähig zu logischen Funktionen – vermehrten sich 16 000 Generationen lang. – Ihre Genomlänge von 50 Instruktionen zu Beginn, variierte zum Schluss zwischen 49 – 356 Instruktionen, wobei aber Genomlänge 83 dominierte. – In 23 von 50 Fällen entwickelten sich EQU-fähige Lebewesen. – Einmal entwickelt, ging diese Fähigkeit auch später nicht mehr verloren. – Visualisierung dieser Ergebnisse siehe Diagramm... Bianca Büttner Simulation der Evolution 15 Visualisierung von Ergebnissen (2) • • Das Diagramm zeigt, wieviele Generationen (344) nötig gewesen wären, um von der UrForm mit 50 Instruktionen ohne Umwege auf die dominante Lebensform mit 83 Instruktionen zu kommen. Die Y-Achse stellt die phylogenetische Tiefe dar, d.h. die Anzahl von Generationen von einem Individuum zu seinen Vorfahren. Bianca Büttner Simulation der Evolution 16 8 Creatures – Das PC-Spiel Bianca Büttner Simulation der Evolution 17 Was ist Creatures? • Der Natur nachempfundene virtuelle Umgebung, in der künstliche Lebensformen – genannt Norns – leben und sich nach den Prinzipien der Evolution entwickeln. • Ein interaktives PC-Spiel, 1996 von Stephen Grand in Oxford entwickelt (Vertrieb: Cyberlife). • Aufgabe des Spielers ist die Pflege und Erziehung „seiner“ Norns, sobald sie aus ihren Eiern schlüpfen (virtuelles Tomagotchi). • Selbständige Entwicklung der Norns – Spielablauf ist nicht im voraus geplant. Bianca Büttner Simulation der Evolution 18 9 Fähigkeiten eines Norns (1) • • • • Norns sind lernfähig und besitzen ein primitives Gehirn, mit dem sie Erfahrungen speichern, die ihr weiteres Verhalten bestimmen. Eigenschaften wie Phänotyp, Persönlichkeit und Lebensdauer sind genetisch festgelegt: Jeder Norn ist anders – Veränderungen durch Mutationen sind sichtbar. Spieler kann seinem Schützling eine VerbObjekt-Sprache beibringen (z. B. hole Obst). Norn muss Mechanismen gegen Überbevölkerung überwinden (Grendel, Nahrungsknappheit, Krankheiten). Bianca Büttner Simulation der Evolution 19 Fähigkeiten eines Norns (2) • • • • Norns besitzen ein biochemisches System: Chemische Substanzen (Hormone, Botenstoffe, Antikörper) simulieren Gefühle wie Hunger und Müdigkeit => bestimmt ebenfalls Verhalten der Norns. Norns haben simulierte Sinne und können Sehen, Hören und Tasten. Sie durchlaufen 6 verschiedene Lebensstadien – ihre maximale Lebensdauer ist 14 Stunden. In der neueren Version von Creatures besitzen die Norns sogar eine Atmung, Organe und einen Blutkreislauf. Bianca Büttner Simulation der Evolution 20 10 Fortpflanzung der Norns • Vereinfachte Fortpflanzung zur Züchtung gesunder Norns (Spiel): – In Genen (Programmcode in Form von langen Zeichenketten) können keine tödlichen Mutationen vorkommen => lebenswichtige Gene sind gegen Ausfall, Mutation und Verdopplung geschützt. – Haploides (einzelsträngiges) Genom. – Geschlechtsspezifische Gene sind bei weiblichen und männlichen Norns gleichermaßen vorhanden, aber je nach Geschlecht, ist das eine oder andere Gen stummgeschaltet. • Vorteil zu Avida: – Sexuelle Fortpflanzung inklusive Crossing-Over (Rekombination). – Technik des genetischen Algorithmus: Rekombination und Modifikation von Programmstücken durch Mutation und Selektion wie bei echtem genetischen Code. Bianca Büttner Simulation der Evolution 21 Aufbau eines Norn-Gehirns (1) • • • • • Ein Norn-Gehirn entspricht einem neuralem Netzwerk. Es ist in 9 Bereiche – genannt Lobes – unterteilt. Jeder Lobe besteht aus Neuronen mit gleicher Aufgabe. Die Neuronen stehen über Synapsen miteinander in Verbindung und nehmen Reize über ihre Dendriten auf. Die Anzahl der Neuronen und Lobes ist genetisch festgelegt und somit durch Mutation veränderbar. Bianca Büttner Simulation der Evolution 22 11 Aufbau eines Norn-Gehirns (2) • • • • • $WWHQWLRQ/REH Verarbeitet Signale aus der Umgebung => Norn richtet seine Aufmerksamkeit auf Signalgeber. 3HUFHSWLRQ/REH Verarbeitet ebenfalls Signale von außen. &RQFHSW/REHSpeichert Erinnerungen an Ereignisse. 'HFLVLRQ/REHTrifft Entscheidungen aufgrund der Vorarbeit der Perception- und Decision-Lobes. 'ULYH/REH Verarbeitet Signale von chem. Botenstoffen, die einen Drang erzeugen (z. B. den Drang den Hunger zu stillen). Als Belohnung für die Drangreduzierung entstehen freudeerzeugende Synapsen. Bianca Büttner Simulation der Evolution 23 Das Biochemische System • • Simulierung endokriner Funktionen, eines grundlegenden Metabolismus und eines einfachen Immunsystems. Basiert auf vier wichtigen Objektklassen: – &KHPLNDOLHQ symbolisiert durch Nummern (0 – 255), eine 2. Nummer gibt Höhe der Konzentration an. – %RWHQVWRIIHXQGLKUH5H]HSWRUHQ Ausschüttung durch Emitter-Objekte, Zielort ist genetisch festgelegt. – &KHPLVFKH5HDNWLRQHQWelche Reaktion bei welcher Chemikalie entsteht ist ebenfalls genetisch festgelegt und hat nichts mit Moleküleigenschaften zu tun. • Beispiel Nahrungsaufnahme: – Hungergefühl => Drang zu Essen => Glucose wird frei und teilweise in Glykogen umgewandelt (Speicherung), der Rest gelangt als Energie ins Gehirn: Verstärkung von Synapsen als Belohnung für richtiges Verhalten. Bianca Büttner Simulation der Evolution 24 12 Dawkins Biomorphe (1) • Richard Dawkin entwickelte einen Algorithmus, der aus den Knoten und Kanten eines symmetrischen Binärbaums durch Mutation und Selektion insektenähnliche digitale Lebewesen erschafft. • Das Genom eines biomorphen Organismus besteht aus 9 Genen, die jeweils 19 verschiedene Allele (von +9 bis –9) besitzen. – Gen 1-4 legt Kantenlänge fest. – Gen 5-8 bestimmt Winkel zwischen zwei Kanten an einem Knoten. – Gen 9 legt Iterationstiefe fest. • • Asexuelle Vermehrung mit bis zu 18 Nachkommen. Mutationsrate pro Generation: +/- 1 Bianca Büttner Simulation der Evolution 25 Dawkins Biomorphe (2) • • Die folgende Abbildung zeigt ein Ergebnis von Dawkins Biomorphe mit einer Rekursionstiefe von 29, d.h. es waren 29 Generationen nötig bis zum vorläufigen, in diesem Falle insektenähnlichen, Ergebnis. Die Seitenzweige entsprechen evolutionäre Sackgassen, die keine weiteren Nachkommen haben. Bianca Büttner Simulation der Evolution 26 13 Vor- und Nachteile von Simulationen • Vorteile: • Nachteile: – Schnellere Lieferung von Ergebnissen als im Labor, da digitale Lebensformen eine kürzere Lebensdauer besitzen. – Versuchsbedingungen lassen sich leichter kontrollieren und wiederholen. – Evolution ist Schritt für Schritt nachvollziehbar – ohne Missing Links. Bianca Büttner – Die starke Vereinfachung stellt die Realitätsnähe der Ergebnisse in Frage. – Für spezielle Fragestellungen sind die meisten Simulationen noch nicht ausgereift genug. Simulation der Evolution 27 Möglichkeiten in der Zukunft • Vor allem Creatures erweist sich als zukunftsträchtig: – Einsatz der lernfähigen Norns als adaptive Kontrollsysteme und künstliche Intelligenzen. – Testen von Systemen in Simulationen, z. B. Gibt es genug Notausgänge bei einer Panik in einem Stadion? – Britische Luftwaffe setzt verbesserte Norns bereits als Flugsimulatoren für ihre Flugschüler ein. Bianca Büttner Simulation der Evolution 28 14