Schrodinger-Operatoren und Evolutionare Strategien Dissertation zur Erlangung des akademischen Grades doctor rerum naturalium ( Dr. rer. nat. ) im Fach Physik eingereicht an der Mathematisch{Naturwissenschaftlichen Fakultat I der Humboldt-Universitat zu Berlin von Dipl. Phys. Torsten Aelmeyer geboren am 1.10.1970 in Lauchhammer Prasident der Humboldt-Universitat zu Berlin Prof. Dr. Dr. H. Meyer Dekanin der Humboldt-Universitat zu Berlin Prof. Dr. V. Bonacic-Koutecky Gutachter: 1. Prof. W. Ebeling 2. Prof. J. Nietzsch 3. Prof. R. Keiper Tag der mundlichen Prufung: 22. Dezember 1997 Inhaltsverzeichnis 1 Einleitung 5 2 Ein physikalischer Zugang zu den EA 2.1 2.2 2.3 2.4 2.5 2.6 Die Boltzmann-Strategie . . . Die Darwin-Strategie . . . . . Die Gemischte Strategie . . . Die adaptive Darwin-Strategie Die Selfannealing-Strategie . . Einheitliche Beschreibung . . 3 Der Vergleich von Strategien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Vergleichsmae fur die Strategien . . . . . . . . 3.1.1 Denition der Mae . . . . . . . . . . . . 3.1.2 Die Boltzmann-Strategie . . . . . . . . . 3.1.3 Die Darwin-Strategie . . . . . . . . . . . 3.1.4 Weitere Strategien . . . . . . . . . . . . 3.2 Vergleich der Boltzmann- und Darwin-Strategie 3.2.1 Topologie von Fitnesslandschaften . . . . 3.2.2 Gemeinsamkeiten . . . . . . . . . . . . . 3.2.3 Unterschiede . . . . . . . . . . . . . . . . 3.3 Die Gemischte Strategie . . . . . . . . . . . . . 3.3.1 Diskussion des Verhaltens . . . . . . . . 3.3.2 Wahl der Parameter . . . . . . . . . . . 3.4 Simulation der Strategien . . . . . . . . . . . . 3.4.1 Die Boltzmann-Strategie . . . . . . . . . 3.4.2 Die Darwin-Strategie . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 18 24 28 31 34 35 39 40 40 43 43 44 44 45 47 54 64 65 68 73 74 75 INHALTSVERZEICHNIS 2 4 Mathematische Untersuchung 4.1 Spektrale Eigenschaften . . . . . . . . . . . . 4.1.1 Die Eigenschaften des Spektrums . . . 4.1.2 Eigenwerte und Korrelationsfunktionen 4.1.3 Deformation der Fitnessfunktion . . . 4.2 Konstruktion des Losungsraumes . . . . . . . 4.3 Die Eigenschaften des Losungsraumes . . . . . 4.4 Beschreibung durch stabile Funktionenkeime . 4.5 Die Klassikation des Losungsverhaltens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 . 78 . 78 . 84 . 87 . 88 . 93 . 101 . 103 5 Die Klassikation der Strategien 109 6 Variation der Mutationsverteilung 121 5.1 Der Weg zur Klassikation . . . . . . . . . . . . . . . . . . . . 109 5.2 Die Klassikation der Darwin-Strategie . . . . . . . . . . . . . 114 5.3 Die Ausdehnung der Klassikation . . . . . . . . . . . . . . . 117 6.1 6.2 6.3 6.4 6.5 Einfuhrung . . . . . . . . . Gau-verteilte Mutationen . Cauchy-verteilte Mutationen Einheitliche Beschreibung . Ansatze zur Klassikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 . 124 . 129 . 136 . 138 7 Zusammenfassung 141 Anhange 144 A Berechnung der Betti-Zahlen 145 B Eigenwertproblem fur die Parabel 151 C Berechnung des Doppeltopfes 157 A.1 Axiomatische Einfuhrung der Homologie . . . . . . . . . . . . 145 A.2 Einfache Einschrankungen . . . . . . . . . . . . . . . . . . . . 146 A.3 Mehrfache Einschrankungen . . . . . . . . . . . . . . . . . . . 148 B.1 Boltzmann-Strategie . . . . . . . . . . . . . . . . . . . . . . . 151 B.2 Darwin-Strategie . . . . . . . . . . . . . . . . . . . . . . . . . 153 C.1 Darwin-Strategie . . . . . . . . . . . . . . . . . . . . . . . . . 157 C.2 Boltzmann-Strategie . . . . . . . . . . . . . . . . . . . . . . . 158 INHALTSVERZEICHNIS 3 D Gemischte Strategie 161 Literaturverzeichnis 165 D.1 Maximum, Minimum, Sattel . . . . . . . . . . . . . . . . . . . 161 D.2 Barriere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 4 INHALTSVERZEICHNIS Kapitel 1 Einleitung \. . . Im Unterschied zu Newton und Schoppenhauer hat Ihr Ahne nicht an eine gleichformige, absolute Zeit geglaubt. Er glaubte an unendliche Zeitreihen, an ein wachsendes, schwindelerregendes Netz auseinanderund zueinanderstrebender paralleler Zeiten. Dieses Webmuster aus Zeiten, die sich einander nahern, sich verzweigen, sich scheiden oder einander jahrhundertelang ignorieren, umfat alle Moglichkeiten. . . " Jorge Luis Borges, "Der Garten der Pfade, die sich verzweigen\ (Fiktionen, 1944) Evolutionare Optimierung und Quantenmechanik Es ist nicht bekannt, wann die Menschen vor dem ersten Optimierungsproblem standen, jedoch ist klar, da uberall im taglichen Leben Aufgaben ihrer Losung bedurfen, die im Kern das Aunden eines Optimums beinhalten. Seit dem Anfang der 60er Jahre wurde dazu ein Vorgang betrachtet, der erst einmal rein biologischen Ursprungs ist: die Evolution. Im abstrakten Sinne besteht die Evolution aus den 3 Prozessen Mutation, Selektion und Reproduktion, die zu einer Hoherentwicklung bzw. Verbesserung (in Bezug auf die Anpassung an die Umwelt) eines Individuums fuhren. Dieser Vor5 6 KAPITEL 1. EINLEITUNG gang stellt also eine Optimierung der Anpassungsfahigkeit dar. Im folgenden soll eine Beschreibungsweise fur die Evolution und deren Entsprechung in der Optimierungstheorie, die als Evolutionarer Algorithmus bezeichnet wird, gefunden werden. Dazu gehen wir dieses Probleme mit Hilfe physikalischer Methoden an, wobei es verschiedene Moglichkeiten gibt. Wir beginnen an dieser Stelle mit der Umformulierung der Variationsprinzipien der klassischen Mechanik durch die Quantenmechanik entsprechend Feynman [1]. Eine Weiterentwicklung dieses Gedankens wird uns dann zu einem einfachen Modell fur einen Evolutionaren Algorithmus fuhren. Das erste Beispiel fur die Betrachtung eines Variationsprinzips ist das Fermat'sche Prinzip. Dieses Prinzip beschreibt den optimalen Weg, welchen das Licht zwischen zwei Orten zurucklegt. Es ist ein Variationsprinzip, bei dem die minimale Zeit gesucht wird, die das Licht zwischen zwei Punkten benotigt. Verallgemeinern wir das o.g. Prinzip, was durch eine Reihe von Physikern und Mathematikern in der Mitte des 18. Jahrhunderts getan wurde, indem wir eine Groe Wirkung minimieren, lat sich ein Formalismus (Lagrange-Formalismus) ableiten, mit dessen Hilfe wir z.B. die Bewegung eines Teilchens unter bestimmten Zwangsbedingungen nachvollziehen bzw. vorhersagen konnen. Eine abstrakte Formulierung der Minimierungs- bzw. Maximierungsprinzipien in der Physik ist durch die Einfuhrung eines Zustandsraumes und eines positiven Funktionals, im obigen Fall Zeit bzw. Wirkung, auf diesem Raum gegeben. Durch Variation des Funktionals erhalten wir die dynamischen Gleichungen des Zustandes. Entlang der optimalen Trajektorie nimmt das Funktional sein Extremum an. Nun konnten wir uns naturlich fragen, warum gerade die dynamischen Gleichungen zu einer Minimierung der Wirkung fuhren. Eine mogliche Antwort wurde von Feynman im Rahmen seiner Pfadintegralformulierung der Quantenmechanik gegeben [1, 2]. Er betrachtete ein quantenmechanisches Teilchen, dessen Zustandsfunktion eine Phase und Amplitude besitzt, welches sich vom Punkt A nach B bewegt. In Anlehnung an die Arbeiten Wiener's zur Brownschen Bewegung betrachtete er die Menge aller Pfade von A nach B und wichtete die Moglichkeit der Realisierung durch eine komplexe Funktion. Die Form dieser Funktion ergab sich aus der Analyse der innitesimalen Bewegung eines quantenmechanischen Teilchens und ist einfach durch exp(iS [x]) mit der Wirkung S [x] des zum quantenmechanischen System korrespondierenden klassischen Systems, 7 gegeben. Fur kleine Abstande1 werden alle Pfade zwischen A und B durchlaufen. Die Integration uber alle Pfade mit der Funktion exp(iS [x]) als Wichtungsfaktor fuhrt zur quantenmechanischen U bergangsamplitude zwischen A und B 2. Dagegen wird im Falle groerer (makroskopischer) Abstande die unterschiedliche Phasenbeziehung zwischen den Pfaden bedeutsam. Die Wahrscheinlichkeitsamplituden der einzelnen Pfade interferieren miteinander und loschen sich aus. Dabei bleibt als einziger Pfad die klassische Trajektorie der extremalen Wirkung ubrig. Es scheint also, da die Quantenmechanik einen anderen Zugang zur Bestimmung von Extrema fur Funktionale bietet. Leider birgt die Theorie eine entscheidende Schwierigkeit in sich: Die Trajektorie der extremalen Wirkung wird nur fur groe Abstande zwischen A und B angenommen. Wie wir sofort ersehen konnen, liegt naturlich die Schwierigkeit im Wichtungsfaktor der Pfade. Wenn wir bedenken, da die Wirkung fur unser Problem minimiert wird, so konnen wir einfach den neuen Wichtungsfaktor exp(;S [x]) ansetzen. Im Gegensatz zur Quantenmechanik ist das entsprechende Pfadintegral nun eine U bergangswahrscheinlichkeit. Um die Beziehungen dieses Pfadintegrals zur Kinetik und statistischen Physik klarer herauszuarbeiten, wollen wir eine andere Argumentation aufbauen, die auf dasselbe Ergebnis fuhrt. Dazu betrachten wir die Newton'schen Bewegungsgleichungen ~x_ = ~v ~v_ = ;rF (1.1) auf dem Raum X mit dem Potential F : X ! IR, mit den Fixpunkten (~v = 0, rF = 0). Diese Dynamik kann leicht aus der Variation der klassischen Wirkung S [x; t] = Zt 1 0 _ 2 2 (~x( )) ; F (x) d (1.2) in Bezug auf feste Anfangs- und Endpunkte abgeleitet werden. Nun lassen wir alle moglichen Pfade zwischen den festen Punkten A und B zu. Alle diese Damit sind Abstande gemeint, die in der Groenordnung des quantenmechanischen Systems liegen. 2 Lassen wir zu, da der Endpunkt B ein beliebiger Punkt sein darf, so erhalten wir die Wellenfunktion des Systems in Abhangigkeit vom Endpunkt B . 1 KAPITEL 1. EINLEITUNG 8 Pfade konnen aus der klassischen Trajektorie (1.1) durch die Einfuhrung einer zufalligen Kraft gewonnen werden, d.h. einer Kraft, die in Bezug auf eine Wahrscheinlichkeitsverteilung zufallig gegeben ist. Wie konnen wir nun diese Verteilung bestimmen, so da fur groe Zeiten nur die klassische Trajektorie ubrigbleibt? Die Antwort auf diese Fragen wollen wir durch eine Analogie zur statistischen Physik geben. Dort ist die Wahrscheinlichkeit w dafur, da die Groe x einen Wert im Intervall [x; x + dx] annimmt, durch w(x) exp(S (x)) gegeben, wobei S (x) die Entropie ist. Andererseits streben aber Gleichgewichtssysteme entsprechend dem 2. Hauptsatz zur Maximierung der Entropie. An dieser Stelle sei auf den prinzipiellen Unterschied zwischen Entropie und Wirkung hingewiesen. Die Entropie ist die Kennzeichnung des Ordnungszustands fur ein Ensemble im Gleichgewicht. Im Gegensatz dazu bestimmt die Wirkung die Dynamik schon eines Teilchens. Andererseits ist unsere o.g. Situation eher eine Gleichgewichtssituation, da wir die Menge der Pfade von A nach B und nicht deren Verlauf betrachten. Berucksichtigen wir nun noch, da die Entropie S und die negative Wirkung ;S maximiert werden, so ist die Wahrscheinlichkeit W , einen Pfad x( ) im Intervall [x; x + dx] zu nden, durch W (x) exp(;S [x(t)]) gegeben. Der klassische Pfad, welcher durch das Verschwinden der ersten Variation S = 0 deniert ist, liefert naturlich den groten Beitrag. Betrachten wir die Mittelung uber alle diese Pfade in Bezug auf den variablen Endpunkt x, so erhalten wir das Funktionalintegral Z P (x; t) = Dx(t) exp(;S [x(t)]) : (1.3) Diese Groe lat sich als die Wahrscheinlichkeit auassen, aus einem Ensemble von Pfaden einen bestimmten Pfad auszuwahlen. Die Pfade werden dabei entsprechend der Funktion exp(;S ) verteilt. Wie in [1, 2] gezeigt wurde, mu das Funktionalintegral (1.3) der partiellen Dierentialgleichung @ P (x; t) = 1 4 P (x; t) ; F (x)P (x; t) (1.4) @t 2 x genugen. An dieser Stelle konnen wir uns naturlich fragen, warum wir unbedingt die klassische Trajektorie bekommen wollen. Bei der klassischen Trajektorie sind die Fixpunkte der Dynamik die kritischen Punkte des Potentials F , wobei nur die Minima von F stabile, anziehende Fixpunkte sind. Somit haben wir eine Dynamik konstruiert, welche die Minima der Funktion F anlauft. Desweiteren haben wir festgestellt, da zur Realisierung dieser 9 Dynamik ein Ensemble von Teilchen notwendig ist, das sich mittels einer stochastischen Dynamik bewegt. Auf dem Niveau der Verteilungsfunktionen mu dabei die Gleichung (1.4) erfullt sein. Spater werden wir diese Dynamik als Darwin-Strategie bezeichnen. Dieses Beispiel illustriert die Beziehung zwischen der Optimierungstheorie, der Stochastik sowie der Wahrscheinlichkeitstheorie. Die Aufgabe wird im folgenden darin bestehen, einen stochastischen Proze zur Optimierung einer Fitnessfunktion zu konstruieren. Dabei werden die Standardmethoden aus der Theorie der irreversiblen und stochastischen Prozesse verwendet wie sie von Prigogine [3], van Kampen [4] et al. entwickelt wurden. Desweiteren wurden die Prinzipien der naturlichen Evolution entsprechend Darwin [5] benutzt, die als eine Optimierung der Anpassung von Tieren und Panzen an die Umwelt aufgefat werden kann. Wir wollen im folgenden die verschiedenen Versionen dieser Idee anfuhren: Simulated Annealing (SA) [6, 7], Evolutionsstrategien (ES) [8, 9, 10, 11, 12], Genetic Algorithms (GA) [13, 14, 15], Evolutionary Programming (EP) [16, 17, 18] und Genetic Programming (GP) [19, 20], welche unter dem Begri Evolutionarer Algorithmus zusammenfat werden. Obwohl diese groe Fulle von verschiedenen Darstellungen zu implizieren scheint, da es schwierig ist, alle Algorithmen zu vereinigen, gibt es doch zwei allgemeine dynamische Prinzipien. Die Dynamik eines Evolutionaren Algorithmus' kann man als eine Bewegung x(t) in einem Suchraum X auffassen, die alle Optima einer Fitnessfunktion F (x) als kritische Punkte besitzt3. Um alle diese kritischen Punkte der deterministischen Dynamik zu erreichen, erweist es sich als notwendig, Zufallskrafte hinzuzufugen. Damit gelangen wir zu einer stochastischen Dynamik. Durch die Stochastik werden neue Moglichkeiten der Bewegung erzeugt, da die stochastische Dynamik uber die Seperatrizen zu "springen\ in der Lage ist. Etwas anders ausgedruckt bedeutet dies, da bei jedem Schritt eine neue Moglichkeit erzeugt wird. Der Vektor der Eigenschaften des Sucher wird wahrend des Vorgangs der Reproduktion kopiert und dabei mutiert, d.h. stochastisch verandert. Aus der Fulle von Moglichkeiten werden entsprechend einer gegebenen Gutefunktion, die als Fitness bezeichnet wird, die Besten derart ausgewahlt, da die Anzahl der Sucher konstant bleibt. Das Optimierungsproblem besteht nun darin, das globale Optimum der Fitness zu nden. Im Bild eines ReaktionsDen Suchraum nennen wir auch Phanotypraum. Der Phanotyp ist der Vektor von Eigenschaften eines Suchers x. 3 10 KAPITEL 1. EINLEITUNG Diusions-Systems mit zwei Spezies liee sich das als eine Asymmetrie der U bergangsraten von der einen Teilchensorte zur anderen vorstellen. Eine Spezies wird also bevorzugt, wird selektiert. Wir erhalten folglich die drei grundsatzlichen Prinzipien eines Evolutionaren Algorithmus: Reproduktion, Mutation und Selektion. Der Graph der Fitnessfunktion uber dem Suchraum (Phanotypraum) ist die Fitnesslandschaft. Die vollstandige Beschreibung solcher stochastischen Systeme geschieht durch Einfuhrung einer Wahrscheinlichkeitsverteilung P (x; t) von einem Zustand x zur Zeit t, welcher einerseits die Dichte der Sucher am Punkt (x; t) bestimmt und andererseits als Wahrscheinlichkeit, einen Sucher in (x; t) zu nden, aufgefat werden kann. Eine Dynamik von P (x; t) bezeichnen wir als stochastische Optimierung, falls fast alle Anfangsverteilungen P (x; t) zu einer stationaren Verteilung P0(x) = tlim P (x; t), welche um das globale Optimum !1 von F (x) konzentriert ist, konvergieren [21, 22, 23]. Aus der Menge der Evolutionaren Algorithmen wollen wir im folgenden zwei wichtige Klassen auswahlen, die sich entsprechend ihrem physikalischen bzw. biologischen Ursprung unterscheiden. Simulated Annealing Algorithmen sind durch thermodynamische Betrachtungen motiviert, da sie die freie Energie des Systems minimieren und die stationare Verteilung P0(x) eine Boltzmann-Verteilung ist. Deshalb wollen wir Algorithmen mit einem solchen Verhalten Boltzmann-Strategien (BS) [24, 25, 26] nennen. Fast alle anderen Algorithmen benutzen ein Selektionsschema, welches der naturlichen Selektion von biologischen Systemen nachempfunden ist. Die Klasse von Algorithmen mit einer Reproduktionsrate, die proportional zur Fitness ist, wollen wir als Darwin-Strategie (DS) [24, 25, 26] bezeichnen. Die Selektion ist dabei einfach die Konstanz der Populationsgroe. Die anderen hier behandelten Strategien gehen aus einer Kombination der beiden Strategien (Gemischte Strategie) [27, 28, 29] sowie aus der Einbeziehung der Mutationsrate (Schrittweite) in den Selektionsvorgang (adaptive Darwin-Strategie [30, 11] und Selfannealing-Strategie [31]) hervor. Als letzte Moglichkeit bleibt noch die Variation der Mutationsverteilung (siehe Kapitel 6), die einen Wechsel der Beschreibungsweise erfordert. Struktur der evolutionaren Dynamik Im zweiten Teil der vorliegenden Arbeit werden die Konsequenzen aus der Formulierung der Evolutionaren Algorithmen durch partielle Dierentialglei- 11 chungen zweiter Ordnung gezogen. Dazu ist eine Analyse der Wechselwirkung zwischen den Suchern notwendig. Wie soll dies geschehen? Seitdem Newton seine Principia schrieb, sind nunmehr 300 Jahre vergangen. Dadurch waren zwar die Grundgesetze der Mechanik formuliert, aber ein mysterioser Begri blieb: die Kraft. Die Beantwortung dieser Frage fuhrte uber die Extremalprinzipien von Lagrange, die teilweise als Gottesbeweis angesehen wurden, bis hin zum Faraday'schen Feldbegri. Jedoch wurde dieser Begri immer auf ein bestimmtes Medium, wie z.B. den A ther verlagert. Erst die abstrakte Fassung des Begris Feld fuhrte zur Formulierung der speziellen Relativitatstheorie. Es ist vor allem der Verdienst Einstein's, da er die Abstraktion des Begris weiter vorangetrieben hat. Dabei schwebte ihm ein einfaches Gedankenexperiment als Leitfaden vor: Wird die geradlinig, gleichformige Bewegung eines Massepunkts auf einer Kugel auf eine Flache projiziert, so erscheint sie dort als beschleunigte Bewegung. Damit erhielt er das scheinbar universelle Prinzip: Kraft = Krummung : Leider lie sich durch diese Konstruktion nur die Gravitation [32] beschreiben4 . Die fehlende Beziehung zwischen Ladung und Masse verhinderte erst einmal die vollstandige Geometrisierung der Wechselwirkung. Eine weitere Vertiefung des Begris der elektrischen Ladung ist mit der Entstehung der Quantenmechanik verbunden. Betrachten wir einen quantenmechanischen Zustand, der durch eine Wellenfunktion dargestellt wird, so konnen wir immer eine globale Phasentransformation des Zustandes durchfuhren, ohne da sich die physikalisch mebaren Groen andern. Andererseits ist eine A nderung der relativen Phase zwischen zwei Zustanden nicht beliebig wahlbar, wie wir durch den Aharonov-Bohm-Eekt eindrucksvoll sehen. Solche Phasenanderungen sind also lokale Transformationen. Wie Weyl [33, 34] herausfand, lat sich die entsprechende Erhaltungsgroe, die zu den lokalen Phasenanderungen korrespondiert, als elektrische Ladung deuten. Damit erkannte man, da die Elektrodynamik als U (1) Eichfeldtheorie dargestellt werden kann. Was ist aber der Grund fur die Entstehung der elektrischen Ladung? Der Zustandsraum der Quantenmechanik ist ein Hilbertraum mit einer trivialen Der Grund dafur ist einfach durch die Tatsache gegeben, da die universelle Kopplungskonstante zwischen Beschleunigung und Kraft die Masse ist. Durch die A quivalenz zwischen Masse und Energie erhalten wir eine Beziehung aller Wechselwirkungsarten zur Gravitation, da diese wenigstens immer als Energieaustausch aufzufassen sind. 4 12 KAPITEL 1. EINLEITUNG topologischen Struktur. Wenn wir dagegen alle Zustande identizieren, die auf gleiche physikalisch mebare Groen fuhren, so erhalten wir eine Mannigfaltigkeit mit nichttrivialer topologischer Struktur. Zum Generator dieser nichttrivialen, topologischen Struktur korrespondiert eine Groe (1. ChernKlasse [35]), die mit der elektrischen Ladung in Beziehung steht. Damit haben wir wiederum eine geometrische Charakterisierung einer physikalischen Groe erhalten. Nun konnten wir im Hinblick auf die allgemeine Relativitatstheorie fragen, welche geometrische Struktur in der Raum-Zeit mit dieser topologischen Groe des Zustandsraums korrespondiert. Die Antwort darauf ist bisher noch nicht bekannt. Durch diese Konstruktion haben wir ebenfalls einen interessanten Ansatz zur Beschreibung nichtlinearer Systeme erhalten. Der oben beschriebene Zustandsraum ist auf einer Mannigfaltigkeit deniert. Die Gleichung fur die zeitliche Entwicklung eines Zustands ist bei einer Wechselwirkung nichtlinear. Die grundsatzliche Invariante zur Charakterisierung des Verhaltens solcher Systeme ist die elektrische Ladung, welche eine topologische Invariante auf dem Zustandsraum ist. Nun wollen wir eine nichtlineare Gleichung zusammen mit seinem Zustandsraum, der auch als Losungsraum bezeichnet wird, betrachten. In Analogie zum eben gesagten, brauchen wir nur die topologischen Invarianten des Losungsraums zu studieren, um eine Charakterisierung der nichtlinearen Gleichung zu erhalten. Wie kann dies aber ohne Kenntnis der Losung geschehen? Dazu zerlegt man die Gleichung in einfache Teile, d.h. losbare Teilgleichungen. Studiert man nun die Beziehung dieser Teile zueinander, so erhalt man die topologischen Invarianten. Ein Beispiel fur eine solche erfolgreiche Theorie ist die Stabilitatsanalyse gewohnlicher Dierentialgleichungssysteme, welche von Poincare entwickelt wurde. In Kapitel 4 und 5 dieser Arbeit werden wir diese Herangehensweise benutzen, um die Schrodinger-Operatoren und die verallgemeinerte Warmeleitungsgleichung zu betrachten. Obwohl diese Gleichungen linear sind, zeigen sie doch ein komplexes Verhalten. So konnen sie durch eine einfache Transformation auf eine nichtlineare Dierentialgleichung gebracht werden. Wie wir spater an diesem Beispiel sehen werden, besitzt der Losungsraum bei einer Gleichung mit komplexem Verhalten ebenfalls eine komplizierte topologische Struktur. Sie spiegelt sich in diesem Falle durch die Hierarchie von selbstahnlichen Unterraumen des Losungsraums wieder. Bei den meisten Arten von Gleichungen kann man nicht einmal von einer Mannigfaltigkeitsstruktur auf dem Losungsraum ausgehen. An diesen Beispielen sehen wir 13 nun, da die Wechselwirkung zu einer komplizierten Struktur auf dem Zustandsraum fuhrt, welche durch topologische Invarianten wenigstens teilweise verstanden werden kann. In dieser Arbeit wurde eine spezielle Form der Wechselwirkung zusammen mit der entsprechenden Analyse des Losungsraums behandelt. Dabei handelt es sich um eine Menge von Punktteilchen, die dem Gradient eines Potentials folgen und gleichzeitig von einer Zufallskraft gestort werden. Die Storung soll dabei so klein sein, da der entsprechende stochastische Proze als Diffusion beschreibbar ist. Damit ist zwar das physikalische Problem umrissen, aber der Sinn des Modells ist noch nicht ganz klar. Deshalb betrachten wir nun die deterministische Dynamik des Systems. Die Fixpunkte der Dynamik sind die Punkte, an denen der Gradient des Potentials verschwindet. Ist dieser kritische Punkt des Potentials ein Minimum, so ist der entsprechende Fixpunkt stabil, andernfalls instabil. Der stochastische Proze ermoglicht es, aus dem Anziehungsbereich eines Fixpunktes in einen anderen Anziehungsbereich zu springen. Die Wahrscheinlichkeitsverteilung dieses Prozesses besitzt damit Maxima in der Umgebung der stabilen Fixpunkte. Benutzt man mehrere unabhangige Punktteilchen, die dieser Dynamik folgen, so beschreibt die Wahrscheinlichkeitsverteilung die Dichte der Punktteilchen. Diese Eigenschaften der Dynamik lassen wiederum eine Beziehung zur Optimierungstheorie erkennen. Fat man namlich das Potential als Gute (Fitness) der gefundenen Losung auf, so beschreibt die oben dargestellte Dynamik einen stochastischen Optimierungsproze. Dieser Proze hat auch eine anschauliche Bedeutung: Er modelliert die biologische Evolution. Um dies zu verstehen, betrachten wir die Realisierung des oben beschriebenen Algorithmus'. Im biologischen Sinne fassen wir jedes Teilchen als Sucher bzw. Individuum auf. Dann fuhrt der stochastische Proze zur Entstehung neuer Individuen, d.h., er lat sich als Mutation verstehen. Desweiteren vervielfaltigen wir alle die Individuen, die oberhalb des Mittelwertes der Fitness liegen. Dieser Proze entspricht der Reproduktion. Alle anderen Individuen sterben aus, d.h. wir erhalten den Proze Selektion. Zur Vereinfachung haben wir keine lokale Wechselwirkung zwischen den Individuen angenommen, da die entstehenden Gleichungen nichtlinearer Natur sind. Eine groe Klasse solcher Modelle, die als Lotka-Volterra-Modelle bezeichnet werden, wurden in der Vergangenheit im starken Mae untersucht. Als weitere wichtige und zugleich groe Klasse solcher Modelle erhalten wir alle physikalischen Modelle, die eine Groe minimieren. Bekanntlich sind fast alle dynamischen Gleichungen der Physik als Variationsprinzipien darstell- 14 KAPITEL 1. EINLEITUNG bar, was die Groe der Klasse noch unterstreicht. So kann man die gesamte Feldtheorie als ein Beispiel einer Koevolution auassen. In der Koevolution erzeugen die Kongurationen von Individuen die Fitness, die damit nicht fest vorgegeben ist. Fat man nun jedes Individuum als Punkt eines Feldes auf, so beschreiben die Feldgleichungen die Dynamik der Individuen, die lokal miteinander wechselwirken und dabei das Energiefunktional minimieren. Diese Problematik soll hier nicht behandelt werden. Der Aufbau dieser Arbeit Am Anfang der Einleitung hatten wir ein einfaches Modell zur Beschreibung Evolutionarer Algorithmen eingefuhrt, da auf partiellen Dierentialgleichungen 2. Ordnung fur die Verteilungsfunktion der Individuen basiert. Im nachsten Kapitel werden die Konsequenzen dieses Ansatzes studiert, der sowohl "simulated annealing\ als auch die adaptive Strategie von Schwefel enthalt. Eine geschickte Darstellung der Gleichungen fuhrt zur Idee der Vereinheitlichung aller Strategien durch eine verallgemeinerte Warmeleitungsgleichung. Im darauolgenden Kapitel wenden wir uns den Eigenschaften der Boltzmannund Darwin-Strategie zu. Dabei steht ein Vergleich beider Strategien im Mittelpunkt des Interesses. Dieser Vergleich erfolgt anhand zweier Beispiele: der Parabel und dem Doppeltopf. Anschaulich ist zu erwarten, da das Verhalten beider Strategien fur den Fall einer Parabel gleich sein mu, da die Strategien nur dem Gradienten folgen mussen. Auch fur den Fall eines Maximums bzw. eines Sattels als Fitnessfunktion sollte sich ein qualitativ gleiches Verhalten ergeben. Da jede Fitnessfunktion lokal durch eine quadratische Funktion approximiert werden kann, arbeiten die Boltzmann- und Darwin-Strategie lokal gleich, was durch den Titel unterstrichen wurde. Verkomplizieren wir das Problem von einer Parabel zum Doppeltopf, so ist zu erwarten, da sich erste Unterschiede im Verhalten zeigen. Diese Unterschiede werden durch eine systematische Veranderung der Parameter herausgearbeitet. Bei der Analyse spielt die Wahrscheinlichkeit, im anderen Topf zu sein, eine herausragende Rolle. Das Ergebnis dieser Untersuchung zusammen mit einigen Computersimulationen legen die Mischung zwischen der Boltzmannund der Darwin-Strategie nahe. Die Beantwortung der Frage, ob diese Strategie wirklich besser ist, nimmt der nachste Abschnitt in Angri. Am Schlu dieses Kapitels soll noch auf die stochastische Realisierung der Strategien 15 und deren Vergleich mit den theoretischen Ergebnissen eingegangen werden. Das Kapitel 4 ist den mathematischen Eigenschaften von SchrodingerOperatoren gewidmet, da sie ein Hauptbestandteil der dynamischen Gleichung fur die Verteilungsfunktion der Individuen sind. Wie wir im vorherigen Kapitel dargelegt haben, besitzt das Spektrum dieser Operatoren einen entscheidenden Einu auf die Geschwindigkeit der Strategien. Deshalb ist es zuerst notwendig, sowohl Aussagen uber die Spektraldichte wie auch uber deren Reproduzierbarkeit wahrend eines Simulationslaufs zusammenzutragen. Die restlichen Abschnitte dieses Kapitels sind der Analyse des Kerns sowie der Abhangigkeit des Schrodinger-Operators vom Potential gewidmet. Zur Gewinnung der entsprechenden Aussagen wurde eine neue Methode entwickelt, die in der Umformulierung des ursprunglich analytischen Problems in ein algebraisches Problem besteht. Als Schlufolgerung aus den Ergebnissen des Kapitels 4 erhalten wir in Kapitel 5 die Klassikation der Strategien in Abhangigkeit von der Fitness. Da die zugrundeliegende Mathematik relativ kompliziert ist, wird zuerst eine kurze, anschauliche Zusammenfassung der Beweise aus Kapitel 4 angegeben. Als Schlufolgerung erhalten wir die Klassikation der Evolutionaren Strategien, die durch eine partielle Dierentialgleichung 2. Ordnung beschrieben werden, bezuglich Ihres Losungsverhaltens. Als Kernstuck dieser Klassikation ergeben sich die schwierigen Probleme, die durch eine Irrefuhrung der Strategie entstehen. Es ist noch interessant zu notieren, da diese Probleme im Fall der Darwin-Strategie genau die Thom'schen Katastrophen sind. Im Kapitel 6 beschaftigen wir uns mit der Variation der Mutationsverteilung. Bisher wurden nur kleine, Gau-verteilte Mutationen angenommen. Bei den "realen\ Algorithmen (z.B. Evolutionsstrategien) gibt es aber die Einschrankung der kleinen Sprunge uberhaupt nicht. Anhand der Standardbeispiele Parabel und Doppeltopf werden die Losungen fur die Gau- und Cauchy-Verteilung durch die Methode des iterierten Kerns berechnet. Dabei ist zu erwarten, da fur die Gau-Verteilung qualitativ gleiche Ergebnisse herauskommen. Unterschiede ergeben sich lediglich fur die Cauchy-Verteilung, da bei dieser Form der Verteilung groe Mutationen wahrscheinlicher sind. Die einheitliche Darstellung dieser Strategien sowie ein paar Ideen zur Klassikation schlieen dieses Kapitel. Eine Zusammenfassung, in der die wichtigsten Ergebnisse zusammengetragen wurden, beendet den Hauptteil der Arbeit. Um die Transparenz der Arbeit zu erhohen, wurden die umfangreichen Formeln und Berechnungen in 4 Anhange am Ende der Arbeit verbannt. Im ersten Anhang bendet sich 16 KAPITEL 1. EINLEITUNG eine kurze Diskussion des Einusses von Zwangsbedingungen, die an das Optimierungsproblem gestellt werden, auf die Topologie der Fitnesslandschaft. Dabei werden keine Grundkenntnisse der Topologie vorausgesetzt. Im nachsten Abschnitt bendet sich eine Sammlung von Formeln, die die Berechnung des Eigenwertproblems auf der Parabel fur die Boltzmann- und Darwin-Strategie betreen. Die letzten beiden Anhange sind der Berechnung der Wahrscheinlichkeiten im Fall des stuckweise, quadratischen Doppeltopfes fur die Boltzmann-, Darwin- und Gemischte Strategie gewidmet. Diese Arbeit ist eine zusammenfassende Untersuchung der tnessproportionalen Evolutionaren Algorithmen auf kontinuierlichen Raumen. Neuere Untersuchungen zu den diskreten Fallen ndet man u.a. in [36, 12]. Daneben gibt es noch andere Moglichkeiten der Optimierung, wie z.B. adaptive Anpassung der Populationsgroe [37] oder die Zerlegung des Optimierungsproblems in Teilprobleme und deren simultane Optimierung (multitome Optimierung) [38, 39]. Kapitel 2 Ein physikalischer Zugang zu den Evolutionaren Algorithmen \Da namlich der Plan des Universums der vollkommenste ist, kann kein Zweifel bestehen, da alle Wirkungen in der Welt aus den Ursachen mit Hilfe der Methode der Maxima und Minima gleich gut bestimmt werden konnen." Leonhard Euler In diesem Kapitel werden wir eine Klasse von einfachen Dynamiken betrachten, welche die Evolution in kontinuierlichen Raumen realisieren. Dazu fuhren wir einen kontinuierlichen Raum X ein, der den schon erwahnten Phanotypraum darstellt. Desweiteren benotigen wir eine reell-wertige, die Fitness darstellende Funktion F : X ! IR. Diese Funktion mit die Qualitat des gefundenen Optimums und reprasentiert in praktischen Problemen z.B. die Kosten fur den Aufbau eines Netzwerkes. Die Aufgabe besteht nun darin, das globale Optimum (Maximum bzw. Minimum) von F zu bestimmen. Im folgenden wollen wir annehmen, da der Raum X durch X = IRd gegeben ist. Der Zeitparameter wird ebenfalls als kontinuierlich angenommen. Da die meisten Algorithmen lokal arbeiten, ist eine Beschreibung uber eine Dierentialgleichung moglich. Als Heuristik fur eine solche Beschreibung verweisen wir auf die obige Diskussion, d.h., im folgenden wollen wir die Dynamik als partielle Dierentialgleichung zweiter Ordnung wahlen. Diese Art der Beschreibung wird uns spater erlauben, die Boltzmann- und die Darwin17 18 KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA Strategie durch einen Typ von Gleichung zu beschreiben. Beide genugen namlich einer Schrodingergleichung [24, 25], wobei der Unterschied zwischen beiden durch die Transformation der Fitnessfunktion gegeben ist. Im nachsten Kapitel werden wir die Geschwindigkeit dieser Strategien bestimmen. Die Ergebnisse zeigen, da die Boltzmann- und die DarwinStrategie gegenlauges Verhalten bzgl. ihrer Geschwindigkeiten aufweisen. Daher scheint es angebracht, beide Strategien zu mischen. Diese Idee fuhrt zur Gemischten Strategie, die in den Simulationen eine groere Geschwindigkeit und Robustheit besitzt [25, 26, 40, 41]. Entsprechend Schwefel [30] ist eine konstante Fortschrittsgeschwindigkeit der Evolutionsstrategie ein Nachteil, da die Strategie an Stellen, die weit vom Optimum entfernt sind, genauso schnell ist, wie an den interessanten Stellen nahe des Optimums. Die Losung dieses Problems besteht darin, da man die Schrittweite als zusatzliche Variable betrachtet, die in den Selektionsproze einbezogen wird. So gelangt man auf ganz naturliche Weise zur adaptiven Strategie. Im Falle der Darwin-Strategie wird dabei die Diusionskonstante und im Falle der Boltzmann-Strategie die Temperatur gesteuert. Letzterer Fall wurde von Rose [31] entwickelt und zeigt fur die meisten Realisierungen die Besonderheit, da das \cooling schedule" adaptiv an das Problem angepat wird. Im Gegensatz zur adaptiven Darwin-Strategie bleibt diese adaptive Gemischte Strategie (Selfannealing Strategie) nicht in lokalen Optima "hangen\. Nach dieser Fulle von verschiedenen Strategien kann man sich nun fragen, ob es vielleicht die Moglichkeit einer groen Vereinheitlichung gibt. Im Falle der Boltzmann- und Darwin-Strategie wurde dies schon kurz erwahnt. In der Tat zeigt sich, da man alle Strategien durch eine Gleichung in einem Raum M beschreiben kann, wobei sich die einzelnen Strategien durch die Wahl der Fitnessfunktion bzw. durch die Metrik von M unterscheiden. 2.1 Die Boltzmann-Strategie Die alteste und zugleich einfachste Variante einer Optimierungsstrategie, die wir im folgenden auch unter dem Begri Evolutionaren Strategie betrachten, ist die Boltzmann-Strategie. Im Jahre 1953 wurde sie von Metropolis et al. [42] als Algorithmus zur Erzeugung von Ensemble benutzt, die als stationare Verteilung eine Boltzmannverteilung ; F (x) P (x) = tlim !1 P (x; t) e 2.1. DIE BOLTZMANN-STRATEGIE 19 besitzen. Kirkpatrick et al. [6] erweiterten 1983 durch die Einfuhrung eines \cooling schedules" den Metropolis-Algorithmus zum Simulated Annealing, welcher in der Folgezeit zahlreiche Anwendungen auf verschiedenste Optimierungsprobleme gefunden hat [7, 43]. Eine Weiterentwicklung dieses Algorithmus wurde durch verschiedene Autoren vorgeschlagen (z.B. [44, 45]). Der einzige Parameter des Algorithmus' bestimmt den Grad der Akzeptanz von verschlechternden Mutationen. In Analogie zur statistischen Physik wollen wir diesen Parameter als reziproke Temperatur auassen. Eine hohe Temperatur (kleines ) fuhrt zur Akzeptanz jedes Schritts, was aquivalent zu einer Zufallsbewegung ist; wahrend eine kleine Temperatur (groes ) den Proze eines stochastischen Gradientenabstiegs beschreibt. Eine Analyse des Prozesses mit Hilfe des thermodynamischen Formalismus und unter Berucksichtigung des informationstheoretischen Maes Entropie fuhrte [46, 47, 48, 49] zur Konstruktion einer optimalen Abkuhlungskurve (cooling schedule), d.h. einer zeitabhangigen Funktion T = T (t), wahrend des Simulationslaufs. Diese Kurve stellt das wichtigste Problem fur den \simulated annealing" Algorithmus dar. Wird namlich die Temperatur wahrend des Simulationslaufs erniedrigt, so "sammeln\ sich die Sucher in den lokalen Minima der Fitnesslandschaft. Man hot nun, da eines der gefundenen Minima das globale Minimum ist, wodurch die Strategie das Ziel erreicht hatte. Wie aus der oben gegebenen Boltzmann-Verteilung ersichtlich ist, ist die stationare Verteilung um das globale Minimum konzentriert. Damit erfullt diese Strategie die Minimalanforderung an eine Optimierungsstrategie. Spater werden wir noch einen detaillierten Beweis dafur erbringen, da alle Anfangsverteilungen gegen diese stationare Verteilung konvergieren. Die Einordnung dieser Strategie unter die Klasse der Evolutionaren Strategien erscheint auf den ersten Blick nicht ganz gerechtfertigt, da ein solches Verhalten gerade dem Verhalten thermodynamischer Systeme entspricht. Es konnte jedoch gezeigt werden [25], da sowohl die Boltzmann-Strategie als auch die spater vorgestellte Darwin-Strategie durch ein und dieselbe Grundgleichung beschrieben werden konnen. Am Ende dieses Abschnitts werden wir sogar eine Grundgleichung fur alle bekannten tnessproportionalen Strategien angeben. Die Besonderheit der Boltzmann-Strategie besteht darin, da sie schon durch einen Sucher realisiert werden kann. Dazu wird zuerst sein Zustand xi im Suchraum X durch eine Mutation in einen neuen Zustand xj uberfuhrt. Die Bewertung dieser Mutation erfolgt anhand der Fitnessdierenz F = 20 KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA F (xj ) ; F (xi) mit der U bergangswahrscheinlichkeit ( F 0 pij = e;1 F :: F > 0 (2.1) Dies bedeutet, da Mutationen, die zur Verbesserung der Fitness fuhren (Minimierung), immer vollzogen werden, verschlechternde Mutationen jedoch nur mit einer Wahrscheinlichkeit e; F . Um das Verhalten der Strategie besser zu verstehen, versuchen wir eine Gleichung herzuleiten, die alle oben erwahnten Eigenschaften enthalt. Dazu benutzen wir die Akzeptanzwahrscheinlichkeit (2.1) und verwenden das Konzept der Mastergleichung, wobei wir folgenden Ansatz fur die Raten ! W (xj ;! xi) = exp 2 (F (xi) ; F (xj )) N (xi ; xj ; 2D) ! W (xi ;! xj ) = exp ; 2 (F (xi ) ; F (xj )) N (xi ; xj ; 2D) (2.2) der beiden U bergange wahlen, dabei ist die reziproke Temperatur und N (xi ; xj ; 2D) = (4D);1=2 exp(;(xi ; xj )2=(4D)) die Normalverteilung von xi um xj mit Standardabweichung 2D. Die Wahl der Raten wird nur durch die Bedingung der detailierten Balance beschrankt. Wir haben der symmetrischen Form der Raten den Vorzug gegeben. Fur die Mastergleichung @ P (x ; t) = Z (W (x ;! x )P (x ; t) ; W (x ;! x )P (x ; t)) dx(2.3) j i j i j i j @t i erhalten wir unter Berucksichtigung der Abkurzungen xj = xi + r und 4(xi; r) = (F (xi) ; F (xj ))=2 den Ausdruck @ P (x ; t) = Z N (r; 2D) e4(xi;r)P (x + r; t) ; e;4(xi;r)P (x ; t) dr (2.4) : i i @t i Entsprechend [4] existiert unter der Annahme kleiner "Sprunge\ ein > 0, so da W (xj ;! xi ) = W (xj ; r) 0 W (xj + x; r) W (xj ; r) fur jrj > ; fur jxj < : 2.1. DIE BOLTZMANN-STRATEGIE 21 Nehmen wir weiterhin an, da die Losung P (xi; t) auch in Bezug auf xi wenig variiert, dann ist es moglich, den Integranden in (2.4) um r = 0 in eine Taylorreihe bis zu Termen zweiter Ordnung zu entwickeln. Wir erhalten somit e4(xi;r)P (xi + r; t) ; e;4(xi;r)P (xi; t) ;r@xi (F (xi )P (xi; t)) + 2 +r(@xi F (xi))P (xi; t) + r2 (@xi (P (xi; t)@xi F (xi ) + @xi P (xi; t)) + O(r3) mit der Abkurzung @x = @=@x und der Relation 4(x; 0) = 0. Die erste Ableitung wird durch die Beziehung Z rN (r; 2D)dr = 0 eliminiert und wir erhalten ! @ P (x ; t) = 1 Z r2N (r; 2D) @ @F (xi ) P (x ; t) + @ P (x ; t) dr : i @t i 2 @xi @xi @xi i (2.5) Mittels der Denition Z 2D = r2N (r; 2D)dr konnen wir das Endergebnis wie folgt angeben: @ P (~x; t) = rD [rP + rFP ] = D4P + Dr(P rF ) (2.6) @t mit der Diusionskonstante D, der reziproken Temperatur und dem Zustandsvektor ~x. Diese partielle Dierentialgleichung ist vom Typ einer FokkerPlanck-Gleichung und stellt gleichzeitig das kontinuierliche Gegenstuck zum oben beschriebenen Algorithmus dar. Ein anderer Zugang ist durch die Langevin-Gleichung p ~x_ = ;D rF (~x) + 2D (t) (2.7) gegeben, wobei (t) Gausches, weies Rauschen mit < (t) >= 0 < (t) (t0) >= (t ; t0) KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA 22 beschreibt. Durch eine Kramers-Moyal-Entwicklung erhalt man dieselbe Fokker-Planck-Gleichung (2.6) wie oben. In [50] haben wir damit die BoltzmannStrategie simuliert. Im nachsten Kapitel wollen wir die Simulation der Gleichung (2.7) mit den analytischen Ergebnissen von (2.6) vergleichen. Um im nachsten Kapitel losbare Falle von (2.6) zu diskutieren, machen wir entsprechend [24] den Ansatz " # F ( x ) P (~x; t) = exp ; 2 y(~x; t) (2.8) und nach Separation der raumlichen und zeitlichen Variablen erhalten wir die Eigenwertgleichung D4 i(~x) ; V (~x) i(~x) = ;H (~x) = ;i (~x) (2.9) mit Eigenwert i , Eigenfunktion i (~x) und neuer Fitnessfunktion 2 V (~x) = 4 DrF rF ; 2 D4F : (2.10) Diese Gleichung ist die wohlbekannte stationare Schrodingergleichung der Quantenmechanik. Die Annahme eines diskreten Spektrums fuhrt zur allgemeinen Losung " #X 1 (2.11) P (~x; t) = exp ; 2 F (~x) ci i (~x) exp(;i t) : i=0 Als nachstes haben wir die Frage zu entscheiden, ob die Losung der Gleichung (2.6) zur Gleichgewichtsverteilung konvergiert. Wir wollen an dieser Stelle die Standardargument zum Beweis dieser Konvergenz anfuhren. Der Beweis soll in zwei Schritten erfolgen. Dazu zeigen wir als erstes die Positivitat des Operators H , welcher durch (2.9) deniert ist. Aufgrund der negativen Denitheit des Laplace-Operators bzgl. des L2 -Skalarprodukts1 erhalten wir fur die Denitheit von H Z Z y(x)Hy(x)dvol(X ) = y(x)(;D4 + V (x))y(x)dvol(X ) X X Z Z 2 = D (ry(x)) dvol(X ) + y(x)V (x)y(x)dvol(X ) ; X 1 X Mit L2 wird der Hilbertraum der quadratisch integrierbaren Funktionen bezeichnet. 2.1. DIE BOLTZMANN-STRATEGIE 23 wobei dvol(X ) die Volumenform auf X bezeichnet. Damit bestimmt allein der Erwartungswert der neuen Fitness V die Denitheit des Operators und wir erhalten als hinreichende Bedingung (rF )2 > 4F : (2.12) 2 Das bedeutet aber, da die Krummung des Graphen der Fitnessfunktion2, dargestellt durch 4F , kleiner als das Quadrat des Gradienten sein mu. Diese Bedingung deniert eine Untermenge von X auf der der Operator H positiv ist. Als nachstes denieren wir ein positives, monoton fallendes Funktional, das als Liapunov-Funktional [51] bezeichnet wird. Es wird durch folgende Gleichung deniert: d y(~x; t) = ; L(y; ry) : (2.13) dt y Wir erhalten in unserem konkreten Fall L(y; ry) = Z X L(y; ry) dvol(X ) ; (2.14) L(y; ry) = D2 (ry)2 + 12 V y2 mit den Eigenschaften L 0 und L_ 0. Mit Hilfe der Gleichung (2.13) und der Positivitat des Operators H konnen diese Relationen veriziert werden. Insbesondere korrespondiert das Minimum L = 0 des Funktionals L zu (2.15) y0 = exp(; 21 F (x)) ; was gleichbedeutend mit der Gleichgewichtsverteilung P0(~x) exp[;F (~x)] (2.16) ist, die auch zum Eigenwert 0 korrespondiert. Das bedeutet aber, da die Gleichgewichtsverteilung um das globale Minimum von F lokalisiert ist, da dieser Extremwert von F gleichzeitig das Maximum von P0(x) ist. Wir haben damit gezeigt, da jede Anfangsverteilung P (~x; 0) im Grenzwert t ! 1 zur Gleichgewichtsverteilung konvergiert. 2 Der Graph der Fitnessfunktion wird auch als Fitnesslandschaft bezeichnet. KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA 24 2.2 Die Darwin-Strategie Diese Strategie unterscheidet sich grundlegend von der Boltzmann-Strategie. Wahrend die Boltzmann-Strategie nur mit einem Sucher auskommt, so ist im Falle einer Darwin-Strategie gerade der Fakt wichtig, da ein Ensemble von Suchern verwendet wird. Fur dieses Ensemble spielen die drei Prozesse Mutation\ und "Selektion\ die herausragende Rolle. "Reproduktion\, " Im folgenden wollen wir ein einfaches Modell betrachten, das alle wichtigen oben genannten Gesichtspunkte enthalt, das Fisher-Eigen-Modell. Erstmals durch Fisher 1930 untersucht [52], wurde es von Eigen als Standardmodell fur Systeme mit Konkurrenz und Selektion formuliert [53]. Kennzeichnend fur das Fisher-Eigen-Modell ist eine tnessproportionale Vermehrung der Individuen bei konstanter Populationsgroe [21]. Evolutionare Strategien, die dies erfullen, wollen wir mit Ebeling Darwin-Strategien nennen [26]. Um dieses Modell zu illustrieren, geben wir eine heuristische Erklarung desselben. Dazu verwenden wir das Bild der chemischen Reaktionen, d.h. ein Sucher mit einer festen Fitness sei "Sorte\ A wahrend ein anderer Sucher mit einer anderen Fitness als C bezeichnet wird. Dann wird die Mutation durch den U bergang A ! C beschrieben. Der Reproduktionsproze ist dabei durch F die Reaktion A ! 2A mit der Fitness F des Suchers A als U bergangsrate gegeben. Aus der Forderung, da die Anzahl der Sucher wahrend der Evolution konstant bleibt, erhalten wir das A quivalent zum Selektionsdruck. Diese drei einfachen Reaktionen konnen unter der Annahme, da die Mutation durch die Diusion realisiert wird, als folgende kompakte Gleichung @ P (~x; t) = [< F > ;F (~x)]P (~x; t) + D4P (~x; t) ; (2.17) @t R F (x)P (~x; t)dx < F > (t) = R P (~x; t)dx beschrieben werden3 . Nach dieser vereinfachten Herleitung der Darwin-Strategie wollen wir ein Schema zur Realisierung derselben angeben, das nicht nur auf Gleichung (2.17) fuhrt, sondern sich auch fur die Simulation eignet. Wir lehnen uns dabei an den Artikel [50] an. Aufgrund der Unabhangigkeit der Mutation von den beiden anderen Prozessen teilen wir die Ableitung der Gleichung in zwei Schritte auf. 3 Auch diese Gleichungen beschreiben die Minimierung von F . 2.2. DIE DARWIN-STRATEGIE 25 Der erste Schritt bei der Herleitung von (2.17) besteht in der Herleitung der Fisher-Eigen-Gleichung [21] @ P (x; t) = (hF i ; F (x))P (x; t) ; @t welche nur die Dynamik des Reproduktions- und Selektionsprozesses beschreibt. Nach Schimansky-Geier [54] betrachten wir dazu 2-Teilchenreaktionen, d.h., wir wahlen zwei Sucher x und y. Ist die Fitness F (x) von x kleiner als die mittlere Fitness hF i, dann kopiert man den Sucher x auf y. Im anderen Fall stirbt der Sucher x und y wird reproduziert. Damit ergeben sich folgende 2-Teilchenreaktionen fur das Paar (x; y) 8 f (x)j < j;! (x; y) : jf (x)j (x; x) : f (x) > 0 ;! (y; y) : f (x) < 0 mit der tnessproportionalen Rate f (x) := ( hF i ) ; F (x) ; hF i := Z F (x) P (x) dx : (2.18) (2.19) Der Grund fur die Wahl dieser Raten ist im Artikel [55] zu nden, wo wir festgestellt haben, da damit eine sehr gute U bereinstimmung zwischen den analytischen und numerischen Losungen schon fur kleine Ensemble gegeben ist. Naturlich gibt es auch andere U bergangsraten, welche die Gleichung (2.17) simulieren. Nun betrachten wir die Dynamik der Verteilung P (x; t), die durch die U bergange (2.18) deniert wird. Solche Dynamiken werden durch die Mastergleichung [4, 54] @ P (x; y; t) = Z W (x; x; y) P (x; y) ; W (x; x; y) P (x; y) dx @t Z + W (y; y; x) P (x; y) ; W (y; y; x) P (x; y) dy (2.20) in Bezug auf die 2-Teilchenverteilung P (x; y; t) beschrieben. Die Wahl einer 2-Teilchenverteilung ist, wie oben schon erwahnt, fur die Beschreibung der Wechselwirkung zwischen zwei Suchern notwendig. Die entsprechenden Raten zu den U bergangen (2.18) sind durch W (x; x; y) := W ((x; y) ! (x; y)) = (x;y) (jf (x)j (;f (x)) + f (y) (f (y))) (2.21) 26 KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA gegeben. Wir bemerken den wichtigen Fakt, da W ((x; y) ! (x; y)) nur fur x = y verschieden von Null ist, was in U bereinstimmung mit den Raten (2.18) steht. Zusammen mit den nutzlichen Abkurzungen A(x) := jf (x)j (;f (x)) ; B (x) := f (x) (f (x)) ; P (x) = erhalten wir fur (2.20) Z P (x; y) dy (2.22) @ P (x; y; t) = (x ; y) Z A(x) P (x; y) dx + B (y) P (y) ; ( A(x) + B (y) ) P @t Z + (y ; x) A(y) P (x; y) dy + B (x) P (x) ; ( A(y) + B (x) ) P : Als nachstes vernachlassigen wir die Korrelationen zwischen zwei Suchern, was durch die Forderung P (x; y) = P (x)P (y) ausgedruckt wird. So gelangen wir zur Fisher-Eigen-Gleichung @ P (x; t) = ( h2 A ; jf ji + 2 B ; jf j ) P (x) = f (x) P (x) ; (2.23) @t wobei die Beziehungen 2 A ; jf j = ;f ; 2 B ; jf j = f ; hf i = 0 benutzt wurden. Der Mutationsproze wird nun einfach durch Addition einer symmetrischen Rate WD mit WD (x; y) = WD (y; x) = WD (y; r) ; r = x ; y zu den Raten (2.18) dargestellt. Entsprechend ([4] S. 214) erhalten wir die Mastergleichung @ P (x; t) = Z W (x ; r; r)P (x ; r; t)dr ; P (x; t) Z W (x; ;r)dr ; (2.24) D D @t welche einen solchen Proze beschreibt. Unter der Annahme kleiner "Sprunge\ und kleiner Variation der Losung P (x; t) bei diesen Sprungen konnen wir genauso wie im vorherigen Abschnitt eine Taylorentwicklung des Integranden in (2.24) um r = 0 bis zur zweiten Ordnung vornehmen. Dabei wird wieder der Term erster Ordnung durch die Symmetrie von WD eliminiert. Wenn wir Z 2D = r2WD (x; r)dr = const. 2.2. DIE DARWIN-STRATEGIE 27 ansetzen, erhalten wir aus (2.24) die Diusionsgleichung [4]. Damit haben wir unter der Annahme kleiner Mutationsschritte r die Darwin-Strategie (2.17) reproduziert. Nach der Herleitung von (2.17) wollen wir nun die Eigenschaften dieser Gleichung studieren, welche spater zur Berechnung expliziter Losungen gebraucht werden. Dazu betrachten wir den Ansatz 2Zt 3 P (~x; t) = exp 4 < F > (t0 )dt05 y(~x; t) ; 0 (2.25) der die Nichtlinearitat in der Gleichung beseitigt. Wir bekommen so die parabolische Gleichung d y(~x; t) = ;Hy(~x; t) = (D4 ; F (~x))y(~x; t) (2.26) dt und nach Separation der Zeit und Ortsvariable erhalten wir unter der Annahme eines diskreten Spektrums die Losung X y(~x; t) = aie;it i (~x) ; (2.27) i d.h. die Dynamik reduziert sich auf eine stationare Schrodingergleichung ahnlich zu (2.9) ;H i(~x) = [D4 ; F (~x)] i (~x) = ;i i (~x) (2.28) wobei i der Eigenwert und i (~x) die Eigenfunktion ist. Damit erhalten wir das wichtige Ergebnis, da die Dynamik der Boltzmann- und der DarwinStrategie durch die Losungen einer stationaren Schrodingergleichung bestimmt sind. Der Unterschied zwischen beiden Strategien lat sich nun dadurch beschreiben, da in der Eigenwertgleichung (2.9) eine transformierte Fitnessfunktion (2.10) auftritt. Wie im vorherigen Abschnitt kann fur die Gleichung (2.26) auch ein Liapunov-Funktional, welches der Gleichung (2.13) genugt, gefunden werden. Man erhalt das positive Funktional Z L = D2 (rP )2 + 12 (F )P 2 dvol(X ) ; (2.29) X welches auch die stationare Verteilung als Extremum hat. Weiterhin wollen wir noch bemerken, da die A hnlichkeit der Gleichung (2.26) mit der 28 KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA Schrodingergleichung eine andere Beschreibung der Losung nahelegt. Wie Feynman [1] zeigte, lat sich die Losung der Schrodingergleichung und der Gleichung (2.26) durch ein Funktionalintegral ausdrucken. In unserem Fall erhalten wir Z y(~x; t) = Dx(t) exp(;S ) (2.30) mit der "klassischen\ Wirkung 0 1 !2 1 dx S = d @ 4D d ; F (x( ))A : 0 Zt (2.31) Durch eine Sattelpunktsapproximation von (1.3) erhalt man die Bewegungsgleichung d2x = ;2DrF ; (2.32) dt2 die gleichzeitig auch die Trajektorie mit der minimalen Wirkung (2.31) ist. Wie man leicht sieht, sind die stationaren Punkte dieser Dynamik mit den kritischen Punkten der Fitnessfunktion identisch. Weiterhin erhalt man aus der Sattelpunktsapproximation, da der grote Beitrag zur Losung y(~x; t) der Gleichung (2.26) durch die Trajektorien von (2.32) erbracht wird. Das bedeutet aber, da sich die meisten Sucher entlang dieser Trajektorien bewegen. Zum Verstandnis des Verhaltens der Darwin-Strategie bzw. der BoltzmannStrategie ist also die Kenntnis der Losung von (2.32) wichtig. Diese Tatsache hatten wir in der Einleitung zu diesem Kapitel benutzt, um die Beschreibung einer evolutionaren Strategie einzufuhren. Am Ende wollen wir noch auf die hauptsachlichen Unterschied zwischen der Darwin-Strategie und der Quantenmechanik eingehen. In der Quantenmechanik ist die Menge der Funktionen exp(it) eine Basis des Hilbertraums der t-abhangigen Funktionen. Im Falle von Gleichung (2.26) erzeugt der zeitabhangige Teil exp(;t) keine solche Basis. 2.3 Die Gemischte Strategie Die Boltzmann- und die Darwin-Strategie besitzen einige Vor- und Nachteile, die bezuglich einer fest gewahlten Fitness genau entgegengesetzt zueinander sind. Mathematisch manifestiert sich dieser Umstand in der Transformation (2.10). Eine genaue Diskussion des Einusses dieser Transformation auf das 2.3. DIE GEMISCHTE STRATEGIE 29 Verhalten der Boltzmann-Strategie wird im nachsten Kapitel durchgefuhrt. Es scheint daher ganz naturlich, die Vor- und Nachteile beider Strategie durch Mischung derselben zu verbinden. So gelangen wir zur Gemischten Strategie. Ursprunglich wurde die Gemischte Strategie durch Computersimulationen [26, 27, 29] entdeckt, die eine deutliche Geschwindigkeitssteigerung dieser Strategie gegenuber der Darwin- und Boltzmann-Strategie zeigen. Fur die mathematische Realisierung dieser Idee addieren wir einfach die beiden Gleichungen (2.6) und (2.17) und bezeichnen die entsprechenden Diusionskonstanten mit DB bzw. mit DD . So denieren wir die Dynamik der Gemischten Strategie durch @ P (~x; t) = (D + D )4P (~x; t) + D r(P rF ) (2.33) B D B @t + [< F > ;F (~x)]P (~x; t) mit den beiden positiven Parametern > 0 und > 0. Naturlich erhalten wir auch wieder die Grenzfalle der reinen Strategien durch eine spezielle Wahl beider Parameter. So ergibt sich fur = 0 und DD = 0 die BoltzmannStrategie und fur DB = 0 und = 0 die Darwin-Strategie. Die Wahl zweier Parameter erscheint seltsam, aber der Grund dafur liegt einfach in der Reproduktion der Grenzfalle. Als einzige Schwierigkeit stellt sich der Fall T ! 0 (bzw. ! 1) dar. Bei diesem Fall folgt die Boltzmann-Strategie nur dem Gradienten. Durch die Mischung mit der Darwin-Strategie werden aber trotzdem noch Mutationen und Selektionen ausgefuhrt. Der Grenzubergang ! 1 spiegelt dieses Verhalten nicht wieder. Als ersten Ausweg aus diesem Dilemma bietet sich ein simultaner Grenzubergang der Form ! 1, DB ! 0 mit DB = const: an. Als weiteren Ausweg mussen wir Gleichung (2.35) umformulieren. Dazu schauen wir uns noch einmal Gleichung (2.6) genauer an. Multiplizieren wir in dieser Gleichung beide Seiten mit der Temperatur T und fuhren eine neue Zeitskala t ! t=T ein, so erhalten wir @ P (~x; t) = TD4P + Dr(P rF ) : @t Diese Gleichung ist frei von den Schwierigkeiten beim Grenzubergang T ! 0. Damit erhalten wir fur die Gemischte Strategie die neue Gleichung @ P (~x; t) = (TD + D )4P (~x; t) + D r(P rF ) (2.34) B D B @t + [< F > ;F (~x)]P (~x; t) : KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA 30 Im folgenden geben wir aus rechentechnischen Grunden der folgenden Gleichung (2.35) den Vorzug. Wir erhalten somit eine 3-parametrige Familie (; ; DD )4 von Strategien, welche die Grenzfalle enthalten. Eine schematische Darstellung der Parameterabhangigkeit im Falle der 2 Parameter (; ) ist in Abbildung (2.1) gegeben. Anschlieend wollen wir uns starker auf die- γ Darwin strategy . P=DD∆P + γ (<F>-F) 1 . P=(DB+DD) ∆ P +γ (<F>-F) +Dβ(∆FP+gradF gradP ) mixed strategies Boltzmann strategy β . P=DB∆P +D β(∆FP+gradF gradP ) Abbildung 2.1: Parameterabhangigkeit der Gemischten Strategie se 2-parametrige Familie konzentrieren und fuhren zu diesem Zweck nur eine Diusionskonstante durch die Gleichung @ P (~x; t) = D4P (~x; t) + Dr(P rF ) @t + [< F > ;F (~x)]P (~x; t) (2.35) ein. Dann ist es moglich, durch eine einfache Kombination der Ansatze in der Form 2 Zt 3 1 P (~x; t) = exp 4 < F > dt0 ; 2 F (~x)5 y(~x; t) (2.36) 0 Bei den Diusionskonstanten ist es ausreichend, nur eine zu betrachten, da nur das relative Verhaltnis von DD zu DB interessant ist. 4 2.4. DIE ADAPTIVE DARWIN-STRATEGIE 31 wieder zur Umwandlung des ursprunglichen Problems in ein Eigenwertproblem 0 = D4 i(~x) + [i ; E (~x; ; )] i(~x) (2.37) 2 E (~x; ; ) = F (~x) + V (~x) = F ; D 4 F + D (rF ) (rF ()2.38) 2 4 zu kommen. Die Einfuhrung eines Hamiltonoperators der Form H (; ) = ;D4 + E (~x; ; ) (2.39) erzeugt eine 2-parametrige Familie von stationaren Schrodingergleichungen. Eine ausfuhrliche Diskussion der Eigenschaften dieser Gleichung ndet sich im nachsten Kapitel. 2.4 Die adaptive Darwin-Strategie Wir wollen uns nun dem Problem der automatischen Anpassung von Fortschrittsgeschwindigkeiten wahrend des Simulationslaufs zuwenden. Schwefel [30] schlug dafur eine Strategie vor, welche die Schrittweite jedes Suchers ebenfalls mutiert und selektiert. Die Idee besteht darin, den Nachteil der Evolutionsstrategie - an Stellen, die weit vom Optimum entfernt sind, genauso schnell zu sein, wie an den interessanten Stellen nahe des Optimum - zu beseitigen. Wie oben schon kurz erwahnt besteht eine Losung dieses Problems darin, da man die Schrittweite als zusatzliche Variable betrachtet, die in den Selektionsproze einbezogen wird. In der bisherigen Darwin-Strategie wurde die Schrittweite, ausgedruckt durch die Diusionskonstante D, konstant gehalten. Nun erweitern wir den Suchraum X um eine Koordinate, und es ergibt sich (~x; ) 2 X IR. Die Mutation der Schrittweite erfolgt durch eine log-normalverteilte Zufallszahl, die durch die Transformation = exp() mit als normalverteilte Zufallszahl dargestellt werden kann.Um die entsprechende Gleichung aus diesen Vorstellungen zu erhalten, werden wir auf einen von Schimansky-Geier [54] entwickelten Formalismus zuruckgreifen. Dazu betrachtet man zwei Sucher, die durch die Paare (x; x) und (y; y ) beschrieben werden. Sei F (x) die zu minimierende Fitnessfunktion und f (x) = hF i;F (x) die Fitness oberhalb des zeitabhangigen Mittelwertes. In einem Schritt des Algorithmus' wird die Selektion fur x mit der Rate und die fur x mit 32 KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA der Rate in Abhangigkeit von f (x) ausgefuhrt. So erhalten wir dafur die folgenden U bergange: 8 jf (x)j > ;! > > jf (x)j < ;! (x; x; y; y ) > jf (x)j ;! > > jf (x)j : ;! (x; x; x; y ) (y; x; y; y ) (x; x; y; x) (x; y ; y; y ) : : : : f (x) > 0 f (x) < 0 : f (x) > 0 f (x) < 0 (2.40) Die ersten beiden U bergange beschreiben die Selektion in x-Richtung, wahrend die nachsten zwei U bergange die Selektion der Schrittweite bewirken. Um die zeitliche A nderung von P (x; t) durch die U bergange (2.40) zu beschreiben, betrachtet man die Mastergleichung [4]. Dazu konstruiert man aus den U bergangen die entsprechenden Raten W (u; u; v) := W ((u; v) ! (u; v)) mit u = (x; x ) und v = (y; y ). Dann ist die Mastergleichung durch @ P (u; v; t) = Z W (u; u; v) P (u; u; t) ; W (u; u; v) P (u; v; t) du @t Z + W (v; v; u) P (u; v) ; W (v; v; u) P (u; v; t) dv (2.41) gegeben, wobei wir die Zweiteilchenverteilung P (u; v; t) zu betrachten haben, da unser Selektionsschema eine Wechselwirkung zwischen zwei Suchern darstellt. Aus den vorherigen Abschnitten wissen wir, da der Mutationsproze von den beiden anderen Prozessen Selektion und Reproduktion unabhangig ist. Deshalb zerlegen wir die Raten W in zwei Raten W = Wm + Wrs fur die Mutation Wm und die verbleibenden Prozesse Wrs. Fur die erste Rate nehmen wir an: Wm ((x0 ; 0) ! (x; ta)) = N (x0 ; x; exp(0 ; )) N (0 ; ; 1) (2.42) Wm ((x; ) ! (x0 ; 0)) = N (x ; x0 ; exp( ;!0)) N ( ; 0; 1) (2.43) 2 mit N (x; ) = p 1 exp ; 2x2 2 und konnen dadurch die U bergange x ! x0 = x + ! 0 = + ' beschreiben, wobei eine Gausche Zufallszahl mit Standardabweichung 2.4. DIE ADAPTIVE DARWIN-STRATEGIE 33 exp() und ' ebenfalls eine solche Zufallszahl, jedoch mit der Standardabweichung 1, ist. Zusammen mit diesen Raten erhalten wir die Mastergleichung @ P (x; ; t) = Z (N (x0 ; x; exp(0))N (0 ; ; 1)P (x0; 0; t) @t ; N (x ; x0 ; exp())N ( ; 0; 1)P (x; ; t)) dx0 d0 (:2.44) Entsprechend [4] nehmen wir wiederum an, da nur kleine Sprunge auftreten, so da ein > 0 und ein > 0 existieren mit Wm ((x0; 0) ! (x; )) = W ((x0; 0); r; ) 0 W ((x0 + x; 0 + ); r; ) W ((x0 ; 0; r; ) fur jrj > jj > ; fur jxj < jj < : Weiterhin nehmen wir wieder an, da die Losung P (x; ; t) nur schwach in Bezug auf x und variiert. Dann entwickeln wir unter der Annahme x0 = x + r und 0 = + den Integranden der Mastergleichung um r = 0 und = 0 bis zur zweiten Ordnung. Wir erhalten somit N (r; exp( + ))N (; 1)P (x + r; + ; t) ; N (r; exp())N (; 1)P (x; ; t) N (r; exp())N (; 1) r@xP (x; ; t) + @ P (x; ; t) + 21 r2@x2 P (x; ; t) 1 1 2 2 3 3 + 2 @ P (x; ; t) + 2 @x@ P (x; ; t) + O(r ) + O( ) 1 2 2 + N (; 1)P (x; ; t) @ N (r; exp()) + @ N (r; exp()) : 2 Zusammen mit den Beziehungen Z Z rN (r; exp())dr = 0 N (; 1)d = 0 Z Z r2N (r; exp())dr = exp() 2 N (; 1) = 1 sieht der erste Teil der Entwicklung wie folgt aus: 1 exp()@ 2 P (x; ; t) + 1 @ 2 P (x; ; t) ; x 2 2 wahrend der weitere Teil den Ausdruck 1 P (x; ; t) Z (r4 exp(;4) + 1 ; 4r2 exp(;2))N (r; exp())dr = 3 P (x; ; t) 2 2 34 KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA produziert. Wenn wir wie bei der Darwin-Strategie die tnessproportionale Vermehrung annehmen, so erhalten wir @ P (x; ; t) = F (x) + 3 P (x; ; t) + 1 exp()@ 2 P (x; ; t) + 1 @ 2 P (x; ; t) : x @t 2 2 2 (2.45) Den Selektionsterm konnen wir einfach aus der Forderung nach der Erhaltung der Normierung von P (x; ; t) gewinnen. Dies ist naturlich aquivalent zur konstanten Anzahl von Suchern wahrend des dynamischen Prozesses. Wir erhalten nun das Endergebnis @ P (x; ; t) = (F (x) ; hF i) P (x; ; t) + 1 e 4 P (x; ; t) + 1 4 P (x; ; t) ; @t 2 x 2 (2.46) welches alle Prozesse, d.h. Mutation, Selektion und Reproduktion, berucksichtigt. Wie wir teilweise in [56] gezeigt haben, besitzt diese Strategie das gewunschte Verhalten der Geschwindigkeitssteuerung. Weitere Untersuchungen benden sich in [30, 11, 12, 36] sowie in der angegebenen Literaturliste. 2.5 Die Selfannealing-Strategie Diese Strategie wurde von Rose [31] entwickelt, um das Problem der richtigen Wahl eines \cooling schedule" zu losen. Durch Simulationen wurde diese Strategie mit den vorher beschriebenen verglichen, wobei sich eine Vergroerung der Geschwindigkeit gegenuber den anderen Strategien zeigt. Die Idee ist genau die gleiche wie bei der adaptiven Darwin-Strategie. Wir gehen von einem Ensemble von Boltzmannsuchern aus, wobei jeder Sucher ein eigenes besitzt. Damit wird die Temperatur in die Selektion einbezogen. Dies druckt sich in der Tatsache aus, da wir eine Rate fur die Temperaturselektion wahlen mussen. Desweiteren wird naturlich auch die Temperatur jedes Suchers mutiert. Mathematisch erhalten wir, da in jedem Schritt des Algorithmus' die Selektion fur die x-Richtung (Rate ) und fur die x-Richtung (Rate ) jeweils mit f (x) = hF i ; F (x) multipliziert wird. Damit ergeben sich die U bergange 8 jf (x)j > ;! (x; x; x; y ) : f (x) > 0 > > jf (x)j < ;! (x; x; y; y ) > jf (x)j (y; x; y; y ) : f (x) < 0 : (2.47) ;! ( x; ; y; ) : f ( x ) > 0 > x x > jf (x)j : ;! (x; y ; y; y ) : f (x) < 0 2.6. EINHEITLICHE BESCHREIBUNG 35 Diese U bergange lassen sich mit (2.40) vergleichen, wobei die ersten beiden U bergange die alleinige x-Selektion und die letzten beiden die alleinige x-Selektion beschreiben. In der Mastergleichung ergibt sich fur die ersten beiden U bergange wieder der bekannte Ausdruck (2.23). Wegen der Unabhangigkeit der letzten beiden U bergange von x leisten diese keinen Beitrag. Das ist aus physikalischer Sicht auch verstandlich, da die Interpretation von als reziproke Temperatur zeigt, da bei dieser Strategie kein Warmeaustausch erfolgt und daher auch keine Veranderung von durch den Selektionsterm erfolgen kann. Wir wollen an dieser Stelle nicht die Rechnung wiederholen, da sie sich aus den Herleitungen in Abschnitt 2.1 und 2.2 zusammensetzen lassen. Damit ergibt sich die Dynamik der SelfannealingStrategie @ P (x; ; t) = f P + D @ (P @ f ) + D @ 2 P + D @ 2 P : (2.48) x x x @t Die Anpassung von steuert allein der Term D @x (P @x f ), wobei die Mutationsstarke durch D gegeben ist. Die Selfannealing-Strategie umfat alle drei oben behandelten Strategien und erweitert diese durch die Steuerung von . 2.6 Einheitliche Beschreibung Angesichts der Fulle verschiedener Strategien fragt man sich naturlich, ob es moglich ist, diese Vielfalt unter einem bestimmten Gesichtspunkt zusammenzufassen. Dazu nehmen wir an, da wir eine Fitnessfunktion F : X ! IR uber einen Raum X mit Metrik gij deniert haben. Die grundsatzliche Struktur aller Gleichungen ist einfach durch d P (~x; t) = ;HP (~x; t) ; (2.49) dt wobei H ein Operator der Form X (2.50) H = ; p1g @i(gij pg @j ) + V (F (x); rF; 4F ) i;j mit g = det(gij ) ist, gegeben. Die Losung von (2.49) lat sich formal durch P (~x; t) = exp(;tH )P (~x; 0) (2.51) 36 KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA mit exp(;tH ) als Warmeleitungskern (Heat-Kernel) ausdrucken. Die genaue Auswertung dieses Ausdrucks werden wir im Kapitel 4 behandeln, wo auch eine Klassikation fur solche Arten von Gleichungen bzgl. ihres Losungsverhaltens vorgeschlagen wird. An dieser Stelle wollen wir uns nur auf die Ableitung aller vorher besprochenen Strategien konzentrieren. Dazu legen wir die Funktion V sowie die Metrik gij auf X bzgl. der gewahlten Koordinaten fest. Desweiteren lassen wir noch eine Transformation der Verteilungsfunktion P (x; t) zu, um die Gleichung auf die Normalform zu bringen. Der Einfachheit halber wahlen wir einen 2-dimensionalen Raum IR2 als unterliegenden Raum. Dann ist die Strategie durch die Angabe der Metrik, der Funktion V sowie der Transformation von P eindeutig bestimmt. Im folgenden werden die Symbole x; y als Koordinaten des Phanotypraums und bzw. zur Beschreibung der Schrittweite benutzt. Fur die einzelnen Strategien erhalten wir: Boltzmann-Strategie (Gleichung (2.6)) Koordinaten (x; y) Transformation P (x; y; t) ! exp(F (x; y)=2)P (x; y; t) Metrik gxx = gyy = 1 D 2 Funktion V V = D 4F (x; y) ; D (rF )2 2 4 Darwin-Strategie (Gleichung (2.17)) Koordinaten (x; y) Transformation 0 1 P (x; y; t) ! exp @; hF i( )d A P (x; y; t) Zt 0 Metrik gxx = gyy = 1 D Funktion V V = F (x; y) Gemischte Strategie (Gleichung (2.35)) Koordinaten (x; y) 2.6. EINHEITLICHE BESCHREIBUNG 37 Transformation 0 1 Zt P (x; y; t) ! exp @; hF i( )d + 2 F (x; y)A P (x; y; t) 0 Metrik gxx = gyy = D1 2 Funktion V V = D 4F (x; y) ; D (rF )2 + F (x; y) 2 4 Adaptive Darwin-Strategie (Gleichung (2.46)) Koordinaten (x; ) Transformation 0 1 Zt P (x; ; t) ! exp @; hF i( )d + 4 A P (x; ; t) 0 Metrik gxx = exp(;) g = 1 Funktion V V = F (x) ; 1 16 Selfannealing-Strategie (Gleichung (2.48)) Koordinaten (x; ) Transformation: P (x; ; t) ! exp(F (x)=4)P (x; ; t) Metrik gxx = exp(F (x)=4)=D g = exp(;F (x)=4)=D Funktion V 2 V = D 2 @x2 F (x; y) ; D 4 (@xF )2 ; D F 2(x)=2 Aufbauend auf dieser Aufstellung konnen wir nun eine geometrische Darstellung fur die adaptiven Strategien liefern. Bei jeder dieser Strategien ist die Komponente der Metrik, die den Abstand zwischen zwei Phanotypen bestimmt, explizit von der Schrittweitenkoordinate abhangig. Das bedeutet aber wiederum, da bei einer Anpassung der Schrittweite der Abstand zwischen den Phanotypen deformiert wird. Wir erhalten damit das gewunschte Verhalten. 38 KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA Im nachsten Kapitel werden wir uns vorerst auf die Frage nach der Geschwindigkeit einer Strategie konzentrieren, um im ubernachsten Kapitel eine Klassikation aller Strategien entsprechend der einheitlichen Darstellung (2.49) vorzuschlagen. Kapitel 3 Der Vergleich von Strategien \Unter allen Disziplinen der Mathematik ist die Theorie der Dierentialgleichungen die Wichtigste. Alle Zweige der Physik stellen uns Probleme, die auf die Integration von Dierentialgleichungen hinauskommen. Es gibt ja uberhaupt die Theorie der Dierentialgleichungen den Weg zur Erklarung von Naturphanomen, die Zeit brauchen." Sophus Lie (1894) Der Vergleich der im vorherigen Kapitel denierten Strategien soll unter Berucksichtigung zweier Gesichtspunkte erfolgen. Als erstes werden dazu zwei Groen angegeben, die eine adaquate Wiederspiegelung der Geschwindigkeit der Strategie darstellen. Die Berechnung dieser Geschwindigkeiten in Abhangigkeit von der Strategie zeigt fur die Parabel das erwartete Ergebnis. Fur den Fall einer zu uberwindenden Barriere fuhren wir eine weitere Groe ein, die die Wahrscheinlichkeit fur das Aunden eines Suchers auf der anderen Seite der Barriere darstellt. Mit Hilfe dieser Groe werden wir die einzelnen Strategien vergleichen. 39 40 KAPITEL 3. DER VERGLEICH VON STRATEGIEN 3.1 Vergleichsmae fur die Strategien 3.1.1 Denition der Mae Am Ende des letzten Kapitels hatten wir eine allgemeine Gleichung (2.49) angegeben, die alle oben beschriebenen Typen von Strategien enthalt. Die Losung dieser Gleichung widerspiegelt naturlich das wahre Verhalten der Strategie, lat sich aber beim konkreten Problem schwer bzw. gar nicht berechnen. Auerdem werden bei der konkreten Realisierung der Strategien nicht die partiellen Dierentialgleichungen, sondern deren stochastische Entsprechungen benutzt. Deshalb suchen wir nach Groen, die sich wahrend des Simulationslaufs leicht bestimmen lassen, aber trotzdem eine gewisse Aussagekraft bzgl. des Verhaltens besitzen. Als einfachste Variante einer solchen Groe betrachten wir den Erwartungswert hF (x)i der Fitnessfunktion bzgl. der Verteilung der Sucher. Die zeitliche A nderung dieser Groe v(1) = ; dtd hF (x)i (3.1) ist die Geschwindigkeit der Strategie auf der Fitnesslandschaft. Naturlich gibt es noch die Moglichkeit, eine zweite Geschwindigkeit der Form (3.2) vk(2) = ; dtd hxk i zu denieren, leider besitzt diese Groe aufgrund des unbestimmten Vorzeichens keine so groe Aussagekraft. Stattdessen betrachten wir besser die Fitnessvarianz F2 = h(F (x) ; hF (x)i)2i = hF 2 ; hF (x)i2i ; (3.3) welche die "Breite\ der Verteilung auf der Fitnesslandschaft angibt. Erste Aussagen uber diese Groen sind mit Hilfe der entsprechenden Gleichungen moglich. Fur den Vergleich der Strategien am Beispiel eines Doppeltopfes werden noch zwei weitere Groen eine Rolle spielen. Wir denieren diese Groen durch die Beziehungen (x0 ; t) = Z1 x0 P (x; t) dx (3.4) Z1 _(x0 ; t) = d (x0 ; t) = d P (x; t) dx dt x dt 0 DIE STRATEGIEN 3.1. VERGLEICHSMASSE FUR 41 wobei x0 > 0 den Punkt kennzeichnet, den die Strategie "uberwinden\ mu. Die erste Groe (x0 ; t) gibt die Wahrscheinlichkeit dafur an, den Sucher im Intervall [x0; 1] zu nden, wahrend die zeitliche Ableitung dieser Wahrscheinlichkeit der Strom von Suchern durch die Barriere ist. Die Einfuhrung eines vollig anderen Maes fur die Geschwindigkeit einer Strategie ist durch die einheitliche Beschreibung aller Strategien mittels der Gleichung (2.49) angeregt worden. Aufgrund der A hnlichkeit mit (1.4) besitzen wir damit eine explizite Beschreibung der Losung von (2.49) durch ein Funktionalintegral der Form (1.3) mit der Wirkung (1.2). Naturlich ist die Berechnung des Funktionalintegrals genauso schwierig wie die Losung von (2.49). Wie wir aber schon im Abschnitt 2.2 durch eine Sattelpunktsapproximation gezeigt haben, bewegen sich die Sucher im Mittel auf der klassischen Trajektorie. Betrachten wir nur die Boltzmann- und Darwin-Strategie, so erhalten wir aus der Gleichung (2.49) zusammen mit dem Operator (2.50) die folgende Wirkung 0 1 !2 1 dx S [x(t)] = d @ 4D d ; V (x( ))A ; 0 Zt (3.5) aus der sich durch Variation die klassische Trajektorie d2 x(t) = ;2DrV (3.6) dt2 ergibt. Als Geschwindigkeit fur die Strategie denieren wir die zeitliche Ableitung der Trajektorie x(t) (3.7) vcl (t) = dtd x(t) : Die nachste Naherung in der Sattelpunktsapproximation ist durch die Entwicklung der Wirkung um die klassische Trajektorie xcl bis zum quadratischen Glied gegeben. Wir erhalten einfach X 2 S [x(t)] Scl + x x S [x] (xi ; (xcl )i)(xj ; (xcl )j ) + O(x3) (3.8) i j i;j x=xcl mit den Komponenten xi von x und daraus fur das Funktionalintegral (1.3) 2 0 ! 1;1=2 3 2 P (x; t) exp(;Scl ) 641 + @det xx S [x] A 75 : i j x=xcl (3.9) 42 KAPITEL 3. DER VERGLEICH VON STRATEGIEN Eine explizite Berechnung dieses Ausdrucks erlaubt uns die Berechnung der anderen Geschwindigkeiten v(1) und vi(2) . An dieser Stelle konnte man sich naturlich fragen, ob die bisherigen Mae fur die Geschwindigkeit einer Strategie schon ausreichend sind. Um diese Frage erschopfend zu beantworten, betrachten wir noch einmal die einheitliche Beschreibung aller Strategien in der Form (2.49) d P (~x; t) = ;HP (~x; t) ; dt wobei H ein positiv deniter, selbstadjungierter Operator (2.50) ist. Als formale Losung ergibt sich P (~x; t) = exp(;tH )P (~x; 0) mit exp(;tH ) als Warmeleitungskern. Dieser Warmeleitungskern lat sich wie folgt denieren: Z exp(;tH )P (~x; 0) = pt(~x; ~y)P (~y; 0)dny B (3.10) mit dem Kern pt (~x; ~y), welcher folgende asymptotische Entwicklung [57] besitzt: 1 exp(;jj~x ; ~yjj2=4t) X pt(~x; ~y) = 2 q tii (~x; ~y) (3.11) n (4t) ;(n=2 + 1) i=0 mit den Warmeleitungskernkoezienten i(~x; ~y), die Funktionen von F und deren Ableitungen sind. Ausgehend von dieser allgemeinen Entwicklung erhalten wir in Form dieser Koezienten eine Menge neuer Groen. Der Nachteil besteht nur darin, da mit fortschreitender Zeit t der Einu der schwer zu berechnenden Koezienten i(~x; ~y) starker wird. Deshalb eignet sich diese Methode nur zur Analyse kleiner Zeitschritte. Der Ausweg besteht darin, die Entwicklung der Losung nach den Eigenfunktionen der stationaren Gleichung (siehe z.B. die Formeln (2.9) und (2.11)) durchzufuhren. Dadurch bekommen wir Aussagen uber das asymptotische Verhalten der Strategie. So bestimmt der Abstand der Eigenwerte der stationaren Gleichung entscheidend die Geschwindigkeit der Strategie. Im ersten Abschnitt des nachsten Kapitels werden wir uns diesen Fragen widmen. Dort werden wir die Beziehungen zwischen der A nderung von Autokorrelationsfunktionen und dem Spektrum herstellen. Auch solche Groen lassen sich wahrend der Simulation leicht bestimmen. DIE STRATEGIEN 3.1. VERGLEICHSMASSE FUR 43 3.1.2 Die Boltzmann-Strategie Im folgenden wollen wir fur jede im vorherigen Kapitel denierte Strategie die Geschwindigkeiten unter Ausnutzung der entsprechenden Gleichung berechnen. Als erste Strategie wurde die Boltzmann-Strategie behandelt. Zusammen mit der Gleichung (2.6) erhalten wir fur die Geschwindigkeiten v(1) = ; dtd hF i = D hrF rF i ; Dh4F i ; vk(2) = D hrxk rF i : (3.12) (3.13) Die Geschwindigkeit v(1) hangt von der Krummung und dem Gradienten der Fitnesslandschaft ab. Als hinreichende Bedingung fur die Positivitat der Geschwindigkeit erhalten wir die lokale Bedingung (rF )2 > 4F ; (3.14) welche bis auf einen Faktor dieselbe wie Bedingung (2.12) ist. Setzen wir eine konkrete Fitnessfunktion F (x) ein, so konnen wir aus dieser Bedingung eine Einschrankung des Raumes X auf einen Unterraum berechnen, fur den die Geschwindigkeit v(1) immer positiv ist. 3.1.3 Die Darwin-Strategie Die Berechnung der Geschwindigkeiten fur die Darwin-Strategie geschieht nach demselben Muster und wir erhalten mit Hilfe von Gleichung (2.17) v(1) = hF 2i ; hF i2 ; Dh4F i ; vk(2) = hxk F i ; hxk ihF i : (3.15) (3.16) Wie im Falle der Boltzmann-Strategie konnen wir aus der Positiviatsforderung fur v(1) eine hinreichende Bedingung der Form F 2 F D < F > > 1 + < F >4 < F > ableiten. (3.17) 44 KAPITEL 3. DER VERGLEICH VON STRATEGIEN 3.1.4 Weitere Strategien Aufgrund der starken A hnlichkeit in der Berechnung wollen wir fur die anderen Strategien die Geschwindigkeiten nur auisten. Gemischte Strategie Gleichung (2.35) v(1) = D hrF rF i + (hF 2i ; hF i2) ; Dh4F i (3.18) vk(2) = D hrxk rF i + (hxk F i ; hxk ihF i) (3.19) adaptive Darwin-Strategie Gleichung (2.46) v(1) = hF 2i ; hF i2 ; Dhey 4F i vk(2) = hxk F i ; hxk ihF i (3.20) (3.21) Selfannealing-Strategie Gleichung (2.48) v(1) = Dh rF rF i + (hF 2i ; hF i2) ; Dh4F i (3.22) vk(2) = Dh rxk rF i + (hxk F i ; hxk ihF i) (3.23) 3.2 Vergleich der Boltzmann- und DarwinStrategie Um das Verhalten der Strategien besser zu verstehen, sollen in diesem Abschnitt anhand einiger Beispiele die Gemeinsamkeiten und Unterschiede der einzelnen Strategien untersucht werden. Dabei stehen naturlich die Boltzmannund die Darwin-Strategie im Vordergrund des Interesses. Fur diese beiden Falle ndet man entsprechende Untersuchungen in [41] und einschlielich der Simulation des Algorithmus' in [58]. Als Beispiele fur den Vergleich wahlen wir die zwei elementarsten Falle: das unimodale Problem (Parabel) und das bimodale Problem (Doppeltopf). 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 45 3.2.1 Topologie von Fitnesslandschaften Wir betrachten eine Optimierungsaufgabe, die durch die Angabe des d-dimensionalen Phanotypraums B IRn und der Fitnessfunktion F : B ! IR bestimmt ist. Weiterhin wollen wir voraussetzen, da die Fitness F eine multimodale Funktion ist. Dann konnen wir diese Funktion um die kritischen Punkte ~x(0) , d.h. @ F (x) (3.24) x=x = 0 fur alle i ; @xi mittels einer Taylorentwicklung bis zur quadratischen Ordnung entwickeln und erhalten fur die Fitnessfunktion d X 2 Fq (x) := F (x) = F (x(0) ) + 21 Hij (xi ; x(0) (3.25) i ) i=1;j =1 (0) mit der Hesseschen Matrix ! 2 F @ : (Hij ) = @x @x i j x=x (0) Ist die Hessesche Matrix nicht ausgeartet (det Hij 6= 0), so nennt man Fq auch Morsefunktion. Wird diese Bedingung nicht erfullt, so gibt es einen Unterraum N B des Phanotypraums, auf dem die ersten Ableitungen von F verschwinden. Der Grund dafur besteht darin, da die Matrix (Hij ) symmetrisch und damit diagonalisierbar ist. Verschwindet nun die Determinante dieser Matrix, so mu mindestens ein Eigenwert der Matrix verschwinden. Die Anzahl dieser verschwindenden Eigenwerte (oder auch die Dimension des Kerns ker H der Matrix) gibt die Dimension dieses Unterraumes N an. Solche "Korridore\ gehoren zu den Standardbeispielen der Evolutionsstrategien. Im folgenden wollen wir annehmen, da die Matrix (Hij ) nicht ausgeartet ist. Wie Morse [59] zeigen konnte (Lemma von Morse), ndet man immer ein Koordinatensystem (y1; : : : ; yd) in der Umgebung des kritischen Punktes x(0) = p, wo die Funktion F durch F (y) = F (p) ; (y1)2 ; : : : ; (y)2 + (y+1)2 + : : : + (yd)2 gegeben ist. Dahinter steckt einfach die Tatsache, da die Hessesche Matrix diagonalisiert wird. Die Zahl wird Index des kritischen Punktes p genannt. 46 KAPITEL 3. DER VERGLEICH VON STRATEGIEN Sei C die Anzahl der kritischen Punkte vom Index , so ergeben sich die Morse-Ungleichungen [60] b (B ) C mit den Betti-Zahlen b (B ), die nur von der Topologie von B abhangen. Weiterhin gilt noch die Beziehung X X (B ) = (;1)b (B ) = (;1) C (3.26) mit der Euler-Charakteristik (B ) von B . In Tabelle 3.1 sind diese Zahlen fur einige Beispiele berechnet worden. Aus Sicht der OptimierungstheoBezeichnung Phanotypraum Betti-Zahlen Euler-Charakteristik d d-Ball B b0 = 1; bi = 0 1 8i > 0 d-Sphare @B d+1 = S d b0 = 1; bd = 1; 1 + (;1)d bi = 0 8(i 6= d) k-te-Einschrankung B d nLk b0 = 1 + dk;1 1 + (;1)d;k;1 bd;l;1 = lk d mehrfache EinB n(Lk t Ll ) b0 = 1 + 1k + 1l 1 + 1k + 1l + schrankung ohne bd;k;1 = 1 + lk ; (;1)d;k;1 (1+ lk)+ Schnitt bd;l;1 = 1 + lk (;1)d;l;1 (1 + lk ) d k l mehrfache EinB n(Lk ? Ll ) b0 = 1 + 1 + 21 1 + 1k + 21l + schrankung mit bd;k;1 = 1 + 3lk ; (;1)d;k;1 (1 + 3lk ) k Schnitt bd;l;1 = 1 + 3l +(;1)d;l;1 (1+3lk ) Tabelle 3.1: Betti-Zahlen und Euler-Charakteristik einiger Phanotypraume (die Bezeichnungen sind in Anhang A erklart) rie lassen sich die Betti-Zahlen wie folgt interpretieren: Eine Neben- bzw. Zwangsbedingung des Optimierungsproblems auert sich darin, da ein oder mehrere Unterraume, die durch Bedingungen bestimmt sind, aus dem Phanotypraum "ausgeschnitten\ werden. Die Betti-Zahl b ist die Anzahl der dimensionalen, ausgeschnittenen Unterraume. Die beiden Zahlen C0 und Cd reprasentieren die Anzahl der Minima bzw. Maxima. Unter der Pramisse, da die Fitnessfunktion F multimodal ist und mit B = IRd erhalten wir das System von Bedingungen 1 C0 0 C Xk 1 k d 1 = (;1) C aus dem wir zusammen mit Tabelle 3.1 folgende drei Aussage treen konnen. 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 47 1. Eine Erhohung der Anzahl von Maxima und Minima (Cd und C0) ist mit einer Erhohung der Anzahl der Sattelpunkte verbunden. 2. Die Anzahl der Sattelpunkte C zum Index 0 < < d ; 1 kann erhoht werden, falls gleichzeitig die Anzahl der Sattelpunkte C+1 um denselben Betrag erhoht wird. 3. Durch die Berucksichtigung von Neben- bzw. Zwangsbedingungen wird die Anzahl der Sattelpunkte erhoht. Die erste Aussage bendet sich in U bereinstimmung mit dem Resultat in [61]. An dieser Stelle wollen wir die topologischen Untersuchungen der Struktur von Fitnesslandschaften verlassen und verweisen auf weitere Arbeiten [62, 63], die im Zusammenhang mit dem biologischen Hintergrund stehen, sowie auf eine Untersuchung der allgemeinen Struktur solcher Landschaften (siehe dazu z.B. [64]) fur verschiedene Probleme in der Dissertation von Rose [39]. 3.2.2 Gemeinsamkeiten Auf einer Fitnesslandschaft gibt es zwei wichtige Situationen, die i.a. immer auftreten. Die erste Situation ist der Gradientenabstieg in ein lokales Minimum, wahrend die andere Situation das U berspringen einer Barriere ist. Es ist anschaulich klar, da der Gradientenabstieg eine Situation darstellt, auf die alle Strategien auf die gleiche Art zu reagieren haben. Damit haben wir die Gemeinsamkeiten umrissen. Im Gegensatz dazu stellt die U berwindung einer Barriere eine Situation dar, auf die jede Strategie verschieden reagieren wird. Deshalb habe wir diesen Fall im nachsten Abschnitt dargelegt. Wir konnen das eben gesagte auch in die Form bringen, da die unimodalen Probleme die Gemeinsamkeiten zwischen den Strategien unterstreichen, wahrend die bimodalen die Unterschiede starker betonen. Im folgenden wollen wir uns auf das einfachste Beispiel einer unimodalen Fitnessfunktion beschranken, welche die 3 Falle: Maximum, Minimum und Sattel enthalt. Dieses Beispiel ist durch eine quadratische Funktion der Form Fq = Fmin + a1 (x1 ; (x(0) )1)2 + a2(x2 ; (x(0) )2)2 (3.27) mit ~x = (x1 ; x2) gegeben. Nach dem Lemma von Morse wissen wir, da eine solche Darstellung immer moglich ist. Andererseits besitzt diese Separation der Richtungen den entscheidenden Vorteil, da die Losung der 48 KAPITEL 3. DER VERGLEICH VON STRATEGIEN Darwin-Strategie und der Boltzmann-Strategie auf ein 1-dimensionales Problem zuruckgefuhrt werden kann. Die drei moglichen Falle werden wie folgt behandelt. Als erstes untersuchen wir den Fall des Minimums, um dann durch eine Transformation der Parameter a1 und a2 die anderen Falle zu erhalten. Minimum Wir beginnen mit der Untersuchung des Minimums, welches durch die Bedingungen a1 ; a2 > 0 charakterisiert ist. Sowohl fur die Boltzmann- als auch fur die Darwin-Strategie erhalten wir nach den entsprechenden Umformungen (2.8) und (2.25) sowie einer Koordinatentransformation die zeitabhangige Gleichung ! @ y(~x; t) = D @ 2 + @ 2 y(~x; t) + (A ; A x2 ; A x2 )y(~x; t) ; (3.28) 0 1 1 2 2 @t @x21 @x22 wobei fur die Boltzmann-Strategie P (~x; t) = exp(;Fq =2)y(~x; t) ; A0 = D(a1 + a2) ; A1 = D 2(a1)2 ; A2 = D 2(a2 )2 (3.29) mit der Koordinatentransformation xi ! (xi + (x(0) )i) gilt, wahrend die Darwin-Strategie bezuglich derselben Koordinatentransformation durch Zt P (~x; t) = exp(; hFq i( )d )y(~x; t) ; =0 A0 = Fmin ; A1 = ja1 j ; A2 = ja2j (3.30) dargestellt wird. Durch den Separationsansatz y(~x; t) = y1(x1 ; t)y2(x2 ; t) erhalten wir zwei 1-dimensionale Gleichungen. Fur den Fall A1 ; A2 > 0 wollen wir nun die Greensche Funktion G(x; x0; t), die durch ! @ ; D4 + ax2 ; a G (x; x0 ; t) = (x ; x0 ) (3.31) 0 1 @t deniert ist, berechnen. Diese Greensche Funktion bezeichnet man auch als Warmeleitungskern. Die Berechnung von G(x; x0; t) fur a > 0 ist durch zwei Methoden moglich: Erstens durch das Feynman'sche Pfadintegral [1, 2] 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 49 und zweitens mittels der Formel von Mehler [57]. Die Rechnung ist in der angegebenen Literatur nachzulesen und soll an dieser Stelle nicht angefuhrt werden. Fur die Losung des Problems (3.31) erhalten wir q pa(cosh(2tpDa)(x2 + (x0)2 ) ; 2xx0 ) ! a t a=De p p G1 (x; x0; t) = q : p exp ; 2 D sinh(2t Da) 2 sinh(2t Da) (3.32) Damit konnen wir fur eine beliebige Anfangsverteilung P (x; 0) die Losung durch ein Integral der Form Z P (x; t) = G1(x; x0 ; t)P (x0; 0)dx0 4 0 berechnen. Fur die Geschwindigkeit erhalten wir Z @ P (x; t) = ; Z Z ax2 @ G (x; x0 ; t)P (x0; 0)dx0 dx : v(1) = ; dtd hax2 i = ; ax2 @t @t 1 Im Falle der speziellen Anfangsverteilung P (x; 0) = (x ; x0 ) ist es einfach, die Geschwindigkeit explizit zu berechnen, und wir erhalten p p p p 2 p )p; aD cosh(t 2Da)(3.33) v(1) = ; dtd hax2 i = Da 2a (x0 ) sinh(t 2Da 3 cosh (t 2Da) (siehe [41, 58]). Naturlich ist fur das 2-dimensionale Problem (3.27) die Gesamtgeschwindigkeit die Summe der Geschwindigkeiten zu A1 und A2 . Aus (3.30) erhalten wir fur die Geschwindigkeit der Darwin-Strategie in Bezug auf die Anfangsverteilung P (x; 0) = (x1 ; (x0 )1)(x2 ; (x0 )2) und die Fitnessfunktion Fq v(1) = ; dtd hFq i q q q 2 Djai j( 2jai j=D (x0 ; x(0) )2i sinh(t 2Djaij) ; cosh(t 2Djaij)) X q = (3.34) ; cosh3(t 2Djaij) i=1 welche in Abbildung 3.1 fur die Fitnessfunktion Fq = ax2 dargestellt ist. Die Form der Geschwindigkeitskurve lat sich bei diesem Beispiel auch anschaulich verstehen. Im ersten Teil der Kurve wird die anfangliche DeltaVerteilung verbreitert, d.h., innerhalb der Population steigt die Variabilitat. KAPITEL 3. DER VERGLEICH VON STRATEGIEN 50 5.0 8.0 Geschwindigkeit Geschwindigkeit 7.0 6.0 5.0 a=1 a=2 a=5 4.0 3.0 2.0 4.0 3.0 x0=1 x0=2 x0=5 2.0 1.0 1.0 0.0 0.0 1.0 2.0 3.0 4.0 5.0 Zeit t 6.0 7.0 8.0 9.0 10.0 0.0 0.0 1.0 2.0 3.0 4.0 5.0 Zeit t 6.0 7.0 8.0 9.0 Abbildung 3.1: Darstellung der Geschwindigkeit zum Erreichen eines Minimums fur die Darwin-Strategie, das rechte Bild zeigt den Einu der Krummung a in Fq , wahrend das linke Bild die Variation des Anfangspunkts x0 darstellt. Etwas anders ausgedruckt nimmt die Standardabweichung der Verteilung erst zu, wobei sich das Maximum der Verteilung kaum verschiebt. Der Abschlu dieser Phase ist mit dem Maximum in der Geschwindigkeit erreicht. Danach beginnt sich die Population zu bewegen, wobei sie sich aufgrund des Selektionsterms wieder zusammenzieht. A ndert sich die Geschwindigkeit fast nicht mehr, so hat der grote Teil der Population das Minimum der Fitness erreicht. Fur die Boltzmann-Strategie mussen wir entsprechend der Bedingung (3.29), die Verteilungsfunktion um einen Faktor korrigieren. Wir erhalten nach einer Standardrechnung fur die Geschwindigkeit den Ausdruck v(1) = 2 X i=1 (2Djaij ; 16D (ai)2(x0 )2i ) exp(;4Dt jaij) ; (3.35) welche in Abbildung 3.2 fur die Fitnessfunktion Fq = ax2 dargestellt ist. Auch diese Kurven lassen sich theoretisch sehr gut verstehen. Durch den Driftterm in der Gleichung (2.6) besitzt diese Strategie ein vollig anderes Verhalten als die Darwin-Strategie. In Abhangigkeit von der reziproken Temperatur wird die Starke des Driftterms gesteuert. Je groer dieser Term ist, desto schneller erreicht die Strategie das Minimum, da sich dann die Stra- 10.0 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 51 30.0 25.0 40.0 Geschwindigkeit Geschwindigkeit 50.0 a=1 a=2 a=5 30.0 20.0 10.0 0.0 0.0 β=1 β=2 β=5 20.0 15.0 10.0 5.0 1.0 2.0 3.0 4.0 5.0 Zeit t 6.0 7.0 8.0 9.0 10.0 0.0 0.0 1.0 2.0 3.0 4.0 5.0 Zeit t 6.0 7.0 8.0 9.0 10.0 Abbildung 3.2: Darstellung der Geschwindigkeit fur die Boltzmann-Strategie, das rechte Bild zeigt den Einu der Krummung a in Fq , wahrend das linke Bild die Variation der reziproken Temperatur darstellt. tegie nur in Richtung des Minimums bewegt. Die Kurven in Abbildung 3.2 geben genau dieses Verhalten wieder. Maximum Vom mathematischen Standpunkt aus gesehen mu die Formel (3.35) fur die Boltzmann-Strategie nicht viel verandert werden. Es andert sich lediglich der Vorfaktor bei der Bedingung (3.29). Nach einer kurzen Rechnung erhalten wir die Formel v(1) = 2 X i=1 (16D (ai)2(x0 )2i + 2Djaij) exp(4Dt jaij) ; (3.36) welche in Abbildung 3.3 fur die Fitnessfunktion Fq = ;ax2 dargestellt ist. Da die Boltzmann-Strategie die Fitness minimiert und die beiden Minima der Fitnessfunktion Fq = ;ax2 bei +1 bzw. ;1 liegen, mu die Verteilung der Sucher immer ausgebreiteter werden. Dabei steigt die Varianz der Verteilung, was in den obigen Abbildungen dargestellt ist. Im Gegensatz zur Boltzmann-Strategie mussen wir bei der Darwin-Strategie ein neues Problem ! @ ; D4 ; ax2 ; a G (x; x0 ; t) = (x ; x0 ) (3.37) 0 2 @t KAPITEL 3. DER VERGLEICH VON STRATEGIEN 1000.0 1000.0 900.0 900.0 800.0 800.0 Geschwindigkeit Geschwindigkeit 52 700.0 600.0 a=1 a=2 a=5 500.0 400.0 300.0 200.0 100.0 0.0 0.0 700.0 β=1 β=2 β=5 600.0 500.0 400.0 300.0 200.0 100.0 1.0 2.0 3.0 4.0 5.0 Zeit t 6.0 7.0 8.0 9.0 0.0 0.0 10.0 1.0 2.0 3.0 4.0 5.0 Zeit t 6.0 7.0 8.0 9.0 10.0 Abbildung 3.3: Darstellung der Geschwindigkeit fur die Boltzmann-Strategie, das rechte Bild zeigt den Einu der Krummung a in Fq , wahrend das linke Bild die Variation der reziproken Temperatur darstellt. losen, welches aus dem Problem (3.31) durch eine Variablentransformation der Form a ! ;a entsteht. Fur die Greensche Funktion G2 (x; x0 ; t) erhalten wir auf formale Art aus der Variablentransformation anstatt (3.32) den Ausdruck q pa(cos(2tpDa)(x2 + (x0 )2) ; 2xx0 ) ! a t a=De p p G2(x; x0 ; t) = q (3.38) : p exp( ; 2 D sin(2t Da) 2 sin(2t Da) 4 0 Daraus kann die Geschwindigkeit leicht berechnet werden, und wir erhalten p p p p 2 p v(1) = dtd hax2 i = Da aD cos(t 2Da) 3; p2a (x0) sin(t 2Da) (3.39) cos (t 2Da) in Bezug auf die Anfangsverteilung P (x; 0) = (x ; x0). Wir wollen an dieser Stelle nur bemerken, da obige Greensche Funktion fast mit der Greenschen Funktion des harmonischen Oszillators in der Quantenmechanik ubereinstimmt [2]. Sowohl die Greensche Funktion (3.38) als auchp die Geschwindigkeit p (3.39) weisen eine Singularitat an den Zeitpunkten 2t Da = n bzw. t 2Da = (n + 1=2) auf. Der Grund fur das Auftreten der Singularitaten liegt in der Nichtkompaktheit des Operators (3.37). Da die Darwin-Strategie die Tendenz besitzt, nach +1 bzw. ;1 zu gelangen, wachst die Greensche 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 53 Funktion nach einer endlichen Zeit uber alle Grenzen. Wir konnen dies dadurch verhindern, da wir den Phanotypraum begrenzen (und damit auch den Trager der Greenschen Funktion). Deshalb gelangt die Darwin-Strategie in endlicher Zeit an die Grenze des Raumes, was gleichzeitig auch das Ziel ist. In Abbildung 3.4 ist die entsprechende Geschwindigkeitskurve dargestellt. Wie man aus dieser Abbildung leicht ersehen kann, gleichen sich die 50.0 500.0 30.0 Geschwindigkeit Geschwindigkeit 450.0 40.0 a=1 a=2 a=5 20.0 10.0 400.0 350.0 x0=1 x0=2 x0=5 300.0 250.0 200.0 150.0 100.0 50.0 0.0 0.0 0.3 0.5 0.8 Zeit t 1.0 1.3 1.5 0.0 0.0 0.5 1.0 1.5 Zeit t 2.0 2.5 Abbildung 3.4: Darstellung der Geschwindigkeit des Maximums fur die Darwin-Strategie, das rechte Bild zeigt den Einu der Krummung a in Fq , wahrend das linke Bild die Variation des Anfangspunkts x0 darstellt. Darwin- und Boltzmann-Strategie bzgl. ihres Verhaltens auf einem Minimum oder Maximum. Der Unterschied ist allein im funktionalen Ausdruck fur die Geschwindigkeit zu ersehen, welcher die unterschiedliche Dynamik reprasentiert. Aus diesem Grunde erwarten wir naturlich, da sich beide Strategien auf einem Sattel auch gleichartig bewegen. Sattel Um das Verhalten auf einem Sattel zu studieren, mussen wir naturlich nur die Ausdrucke fur die Geschwindigkeit auf dem Maximum bzw. Minimum addieren. Da die Geschwindigkeit auf dem Maximum dominant ist, sollte dies auch die Geschwindigkeit auf dem Sattel bestimmen. Wie in Abbildung 3.5 dargestellt, beobachtet man genau dieses Verhalten. Die Erklarung fur ein solches Verhalten lat sich wie folgt angeben. Zuerst bewegt sich die Strategie 3.0 KAPITEL 3. DER VERGLEICH VON STRATEGIEN 1000.0 50.0 900.0 45.0 800.0 40.0 Geschwindigkeit Geschwindigkeit 54 700.0 600.0 a=1 a=2 a=5 500.0 400.0 300.0 200.0 100.0 0.0 0.0 35.0 30.0 a=1 a=2 a=5 25.0 20.0 15.0 10.0 5.0 0.5 1.0 1.5 Zeit t 2.0 2.5 3.0 0.0 0.0 0.3 0.5 0.8 Zeit t 1.0 1.3 Abbildung 3.5: Darstellung der Geschwindigkeit auf einem Sattel fur die Boltzmann Strategie (linkes Bild) und fur die Darwin-Strategie (rechtes Bild) auf das Minimum zu, um dann durch eine Mutation die Richtung zu andern und sich auf einem Ast des Maximums abwarts zu bewegen. Wie wir anhand dieser Erklarung sehen, ist die einzige Minderung der Geschwindigkeit durch die Richtungsanderung gegeben. Zusammen mit dem oben beschriebenen Resultat in [61] erhalten wir das folgende Ergebnis dieses Abschnitts: 1. In Landschaften mit vielen Maxima und Minima gibt es viele Sattel. 2. Ein Sattel beeinut die Geschwindigkeit der Strategie kaum. 3. Die Boltzmann- und Darwin-Strategie verhalten sich fur die Fitnessfunktion (3.27) qualitativ gleich. Alle gewonnen Ergebnisse lassen sich auch mit einer anderen Methode erhalten, indem man die Eigenwertgleichungen (2.9) und (2.28) lost, wobei sich mittels (2.27) die Losung ergibt. In dem Artikel [41] wurde dieser Weg eingeschlagen. Um diesen Abschnitt zu vervollstandigen, wird eine Sammlung der entsprechenden Formeln im Anhang B aufgefuhrt. 3.2.3 Unterschiede Die bimodale Fitnessfunktion, d.h. eine Funktion mit 2 Minima bzw. Maxima, stellt das nachstschwierigere Problem dar und zeigt gleichzeitig auch 1.5 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 55 die Unterschiede zwischen den Strategien. Bei einer solchen Funktion mu die Strategie eine Barriere uberspringen, um das globale Optimum zu nden. Dabei ist zu vermuten, da die Unterschiede und Gemeinsamkeiten der Boltzmann- und Darwin-Strategie durch die Transformation (2.10) gegeben sind. Um dies zu zeigen, untersuchen wir 2 bimodale Fitnessfunktionen. Als Ma fur die Geschwindigkeit, mit der eine Barriere uberwunden wird, verwenden wir die Wahrscheinlichkeit (3.4). Im ersten Beispiel konzentrieren wir uns auf ein 2-Kasten-Potential und verwenden eine Darwin-Strategie. Dieses Beispiel dient zur Illustration des grundsatzlichen Vorgangs der U berwindung einer Barriere. Das zweite Beispiel einer stuckweise, quadratischen Funktion ist fur einen direkten Vergleich zwischen Boltzmann- und DarwinStrategie gedacht. In der Literatur gibt es viele Beispiele [65, 66, 67, 68, 69] zur naherungsweisen Berechnung des Doppeltopfes. Hier wollen wir jedoch starker auf eine explizite Berechnung wert legen. Doppeltopf-Potential Im folgenden wollen wir nur 1-dimensionale Probleme betrachten, da deren Komplexitat zur Analyse ausreichend ist. Dazu beginnen wir mit dem einfachsten Beispiel einer solchen Funktion, die durch 8 > 1 x < ;b > > < ;F0 ;b < x < ;a F (x) = > 0 ;a < x < a > ;F a < x < b > : 11 b<x (3.40) mit (x) als Heaviside-Funktion gegeben ist. Der Abstand zwischen beiden Kasten ist gleich 2a, wahrend die Breite der Kasten durch b ; a sowie die Tiefe durch die Parameter F0 bzw. F1 bestimmt sind. In Abbildung 3.6 ist ein Beispiel fur ein solches Potential dargestellt, wobei wir im folgenden F0 < F1 annehmen wollen. Um dieses Problem von allen Seiten zu beleuchten, wollen wir sowohl die Greensche Funktion als auch die Eigenfunktionen explizit angeben. Im folgenden wollen wir am Beispiel der Darwin-Strategie die U berwindung der Barriere genauer verstehen, wobei wir nicht nur die Greenschen Funktionen sondern auch das Spektrum bestimmen. Zunachst konzentrieren wir uns aber auf die Berechnung der Greenschen KAPITEL 3. DER VERGLEICH VON STRATEGIEN 56 2a F0 F1 |b-a| Abbildung 3.6: 2-Kasten-Potential 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 57 Funktion und der Wahrscheinlichkeit (3.4). Wir betrachten also das Problem @ P (x; t) = D4 P (x; t) ; F (x)P (x; t) (3.41) x @t mit dem stuckweise gegebenen Potential (3.40). Es ist klar, da die Greensche Funktion ebenfalls eine stuckweise Funktion ist. Eine einfache Rechnung ergibt den Ausdruck 8 > > 0 (x;x0 ) x < ;b > 1 = 2 ; 4Dt ; F 0t ;b < x < ;a > < (4Dt) exp 1 = 2 (x;x0 ) 0 Gd(x; x ; t) = (4Dt) exp ; ;a < x < a : (3.42) 4Dt > 0 1 = 2 ( x ; x ) > a<x<b (4Dt) exp ; 4Dt ; F1t > > : 0 b<x Fur jede Anfangsverteilung P (x; 0) erhalten wir durch Integration die zeitliche Entwicklung dieser Verteilungsfunktion. Um das Verhalten der Strategie explizit zu zeigen, betrachten wir die Anfangsverteilung P (x; 0) = (x ; x0 ) mit x0 2 [;b; ;a], d.h., wir starten im lokalen Minimum (der eine Topf) und wollen das globale Minimum (der andere Topf) erreichen. Fur die zeitliche Entwicklung P (x; t) der Anfangsverteilung erhalten wir nach der Integration fur kleine Zeiten t die einfache Beziehung ! 2 ( x ; x ) 0 1 = 2 P (x; t) = (4Dt) exp ; 4Dt ; F0 t : (3.43) Analog ergibt sich aus der Integration die einfache Beziehung P (x; t) = NGd (x; x0 ; t) zwischen der Losung P (x; t) und der Greenschen Funktion (3.42) mit dem noch zu bestimmenden Normierungsfaktor. Aus der Bedingung 2 2 2 1= Z1 ;1 P (x; t)dx = N Z1 ;1 Gd (x; x0 ; t)dx errechnen wir den Normierungsfaktor ! 1 = exp(;F t) erf bp+ x0 ; erf 0 N 4Dt ! ! + erf ap; x0 + erf ap+ x0 + 4Dt 4!Dt + exp(;F1 t) erf bp; x0 ; erf 4Dt ap+ x0 4Dt ap; x0 4Dt !! !! + : (3.44) KAPITEL 3. DER VERGLEICH VON STRATEGIEN 58 Dann ist die Wahrscheinlichkeit (3.4), einen Sucher im Intervall [a; 1] zu nden durch (a; t) = Za ;1 P (x; t)dx ! !! N b ; x a ; x 0 0 = 1 ; p exp(;F1 t) erf p ; erf p4Dt (3.45) 4Dt 4Dt gegeben. Der Flu beschreibt die Veranderung in der Anzahl der Sucher, die die Barriere uberwinden. Es ist nicht schwierig eine explizite Formel aus der oben gegebenen Formel zu gewinnen, aber wir wollen stattdessen die Abhangigkeit der Wahrscheinlichkeit von den Parametern des Doppeltopfes diskutieren. Dabei konnen wir feststellen, da (a; t) stark von der Dierenz F0 ; F1 abhangt. Eine Vergroerung dieser Dierenz bewirkt zuerst eine Verlangsamung der Strategie, bis der Punkt x = a erreicht ist. Danach steigt die Geschwindigkeit wieder an. Der Einu der Parameter a (halber Abstand zwischen den Topfen), D (Mutationsstarke bzw. Diusionskonstante) und x0 (Startpunkt aller Sucher) ist sicherlich anschaulich klar und soll hier nur durch die Folge von Abbildungen 3.7 dargestellt werden. Eine Besonderheit gibt es aber bei allen Abbildungen. Die Wahrscheinlichkeit steigt erst an, um dann wieder abzufallen. Der Grund fur dieses Verhalten liegt in der Behandlung des Randes. Jeder Sucher, der die Barriere uberquert und in den anderen Topf gelangt, wird an der Wand reektiert und kehrt wieder zu seinem Ausgangspunkt zuruck. Damit gibt das Maximum von (a; t) den Zeitpunkt an, wo der Sucher mit der entsprechenden Wahrscheinlichkeit durch die Barriere gelangt ist. Andererseits konnen wir die Groe auch so deuten, da sie den prozentualen Anteil der Sucher angibt, die auf der anderen Seite der Barriere sind. Den starksten Einu auf (a; t) ubt die Variation des Abstands 2a zwischen den Topfen, gefolgt vom Hohenunterschied F0 ; F1 der Topfe aus. Dagegen spielt die Breite des Topfs kaum eine Rolle. Bei der Darstellung der Wahrscheinlichkeit wurde ein fester Parametersatz (F0 = 1; F1 = 2; a = 1; b = 2; D = 1; x0 = ;1:5) benutzt, bei dem jeweils eine Groe variiert wurde. Zur Illustration des oben Gesagten wollen wir zum Abschlu dieses Unterabschnittes das Eigenwertproblem fur das Doppeltopf-Potential F (x) diskutieren. Die Berechnung des Eigenwertproblems 2 ;y(x) = D dxd 2 y(x) ; F (x)y(x) (3.46) 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 59 Wahrscheinlichkeit Wahrscheinlichkeit 4.00e-02 5.000e-02 3.00e-02 D=0.01 D=0.1 D=1 D=5 2.00e-02 F1 =1 F1=10 F1=2 F1=50 4.000e-02 3.000e-02 2.000e-02 1.00e-02 1.000e-02 0.00e+00 0.0 1.0 2.0 3.0 4.0 0.000e+00 0.0 2.0 4.0 Zeit t Wahrscheinlichkeit 8.0 10.0 Wahrscheinlichkeit 4.00e-02 8.000e-03 3.00e-02 6.000e-03 a =0.5 a=1 a=1.5 a=2 2.00e-02 b=0.5 b=1 b=2 4.000e-03 1.00e-02 0.00e+00 0.0 6.0 Zeit t 2.000e-03 1.0 2.0 Zeit t 3.0 4.0 0.000e+00 0.0 1.0 2.0 3.0 Zeit t Abbildung 3.7: Parameterabhangigkeit von (a; t) 4.0 5.0 60 KAPITEL 3. DER VERGLEICH VON STRATEGIEN stellt ein Standardbeispiel der Quantenmechanik dar, und fur die Einzelheiten verweisen wir auf [70]. Fur die Eigenwerte in jedem Kasten erhalten wir naherungsweise m = (m2 2D)=b ; F0 (3.47) n = (n22 D)=b ; F1 m; n 2 ZZ ; (3.48) wobei durch die Losung der Gleichung 0 cot(0(a ; b)) cot(ka) + k = 0 cot(0(a ; b)) + k cot(ka) (3.49) 1 cot(1 (a ; b)) cot(ka) ; k k cot(ka) ; 1 cot(1(a ; b)) q p p mit Di = ; Fi fur i = 0; 1 und k = =D eine Entartung des Spektrums erzeugt wird, die sich physikalisch als Kopplung beider Topfe interpretieren lat. Durch die Angabe von 4 Zahlen (F0 ; F1; a; b) wird eine Losung von (3.49) parametrisiert. Desweiteren erhalten wir aus der negativen Denitheit des Operators in (3.46) die Positivitat des Eigenwertes 0. Neben dieser Kopplung zwischen den beiden Topfen gibt es fur die Eigenwerte > F1 wieder ein einheitliches Spektrum mit n = (n22 D)=b : (3.50) Die Rechnungen in diesem Unterabschnitt bezogen sich auf das Verhalten der Darwin-Strategie in einer kastenformigen Fitnesslandschaft. Interessanter ware es nun, wenn man fur dieses Problem einen Vergleich zwischen der Darwin- und Boltzmann-Strategie durchfuhren konnte. Die fehlende Dierenzierbarkeit der Fitnessfunktion (3.40) erschwert dieses Vorhaben gewaltig. Deshalb wollen wir auf ein einfacheres Problem ausweichen, da aber im wesentlichen dasselbe Verhalten implizieren sollte. Das stuckweise, quadratische Potential Anknupfend an den Abschnitt (3.2.2) wollen wir nun den Fall einer bimodalen Fitnessfunktion betrachten, die aus quadratischen Funktionen zusammengesetzt ist. Ziel soll es dabei sein, die Boltzmann- und die Darwin-Strategie miteinander zu vergleichen. Dazu starten wir mit der stuckweise gegebenen Funktion ( 2 a2 x + s x 0 ; F (x) = ab1 xx2 + (3.51) 1 + b2 x + s x 0 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 61 die stetig bei x = 0 ist. Aus der Formel (3.32) mit a = a1 und a0 = (a2 )2=(4a1) ; s erhalten wir die Greensche Funktion G1(x ; a2 =(2a1); x0; t) als Losung des Problems fur x 0 und beim Austausch ai ! bi auch die entsprechende Greensche Funktion fur x 0. Die Berechnung der Wahrscheinlichkeit (0; t) kann nun auf genau dieselbe Weise wie im vorherigen Unterabschnitt durchgefuhrt werden. Auf die Einzelheiten der Berechnung sowie auf die expliziten Ausdrucke soll an dieser Stelle nicht eingegangen werden. Eine Zusammenstellung der entsprechenden Formeln ist im Anhang C zu nden. Stattdessen konzentrieren wir uns auf die Diskussion der Parameterabhangigkeit von (0; t). In den Abbildungen 3.8 sind die wichtigsten Falle aufgefuhrt. Im Gegensatz zum vorherigen Beispiel werden diesmal Wahrscheinlichkeit Wahrscheinlichkeit a2=1 a2=2 a2=3 a2=4 8.0e-01 6.0e-01 8.0e-01 4.0e-01 4.0e-01 2.0e-01 2.0e-01 0.0e+00 0.0 2.0 4.0 6.0 b1=1 b1=2 b1=3 b1=4 6.0e-01 8.0 10.0 0.0e+00 0.0 2.0 Zeit t 4.0 6.0 8.0 10.0 Zeit t Abbildung 3.8: Parameterabhangigkeit von (0; t) fur die Darwin-Strategie die Sucher nicht reektiert, sondern gelangen in das andere Minimum, wo sie auch bleiben. Bevor wir die Ergebnisse der Berechnungen diskutieren, mussen wir noch den Hohenunterschied F0 ; F1 zwischen den Minima sowie deren Abstand l angeben. Wir erhalten nach einer kurzen Rechnung 2 2 F0 ; F1 = 4bb2 ; 4aa2 1 1 a b l = 2b2 ; 2a2 : 1 1 Bei einer Variation eines Parameters andern sich damit sowohl der Abstand l als auch der Hohenunterschied F0 ; F1 . Da die Abhangigkeit des Hohenunterschieds von den Parametern a2 ; b2 quadratisch ist, konnen wir 62 KAPITEL 3. DER VERGLEICH VON STRATEGIEN bei einer kleinen Variation dieser Parameter die A nderung von F0 ; F1 vernachlassigen. Ein Blick auf die Abbildungen 3.8 zeigt, da das Verhalten der Darwin-Strategie empndlich von der Krummung des lokalen Minimums (b1 -Abhangigkeit) beeinut wird. Die A nderung der anderen Parameter beeinut das Verhalten der Strategie auf genau dieselbe Weise, wie dies im Falle des 2-Topf-Potentials schon dargelegt wurde. Eine Vergroerung des Abstands bzw. des Hohenunterschieds fuhrt zu einer Verzogerung beim Hinuberwechseln zum anderen Topf. In einigen Fallen ist sogar zu erkennen, da die Strategie gar nicht in den anderen Topf gelangt. Die Parameter wurden wieder einzeln um die Standardeinstellung a1 = 1; a2 = 1; b1 = 1; b2 = ;3; a1 = 1; s = 4; x0 = ;0:5; D = 1 variiert. Im folgenden wollen wir dieselbe Rechnung fur die Boltzmann-Strategie durchfuhren. Dazu benutzen wir aus Kapitel 2 die Transformation (2.10) zusammen mit dem Ansatz (2.8). Fur die transformierte Fitness V (x) erhalten wir ( 1 x + Da2 =2)2 ; Da1 x 0 : V (x) = ((Da (3.52) Db1x + Db2=2)2 ; Db1 x 0 Um die Stetigkeit dieser Funktion im Punkt x = 0 zu sichern, mussen wir noch die Bedingung (a2 ; b2 ) = 4(a1 ; b1 ) (3.53) erfullen. Bei freier Wahl der Koezienten ai ; bi konnen wir so eine reziproke Temperatur ausrechnen, welche die Stetigkeit der transformierte Fitness V (x) in x = 0 impliziert. Bis auf diesen singularen Fall mussen wir die Bedingung als Einschrankung an die Koezienten verstehen. Ein Koezientenvergleich zwischen (3.51) und (3.52) zeigt den Unterschied zwischen beiden Strategien. Bei der Boltzmann-Strategie wird die Krummung der Topfe mit sinkender Temperatur groer, d.h., eine Abkuhlung fuhrt zum Hangenbleiben der Strategie im lokalen Optimum. Trotzdem besitzt die Boltzmann-Strategie die Eigenschaft, da nach unendlich langer Zeit die stationare Verteilung (2.16) angenommen wird. Deshalb wird bei der Wahrscheinlichkeit in den Abbildungen 3.9 nie der Wert 1 erreicht. Die Variation der Parameter erfolgt wiederum ausgehend von einer Standardeinstellung a1 = 1; a2 = 2; b1 = 1; b2 = ;3; s = 4; x0 = ;0:5; D = 1; = 0:1 durch Veranderung nur eines Wertes genau auf dieselbe Weise wie fur die DarwinStrategie. Den starksten Einu auf die Geschwindigkeit der Strategie ubt 3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 63 Wahrscheinlichkeit Wahrscheinlichkeit 5.00e-01 4.00e-01 4.00e-01 3.00e-01 3.00e-01 a2=1 a2=2 a2=3 a2=4 2.00e-01 1.00e-01 0.00e+00 0.0 10.0 20.0 30.0 b1=1 b1=2 b1=3 b1=4 2.00e-01 1.00e-01 40.0 0.00e+00 0.0 50.0 10.0 20.0 Zeit t 30.0 40.0 50.0 Zeit t Wahrscheinlichkeit 4.00e-01 3.00e-01 2.00e-01 β=0.1 β=1 β=10 1.00e-01 0.00e+00 0.0 10.0 20.0 30.0 40.0 50.0 Zeit t Abbildung 3.9: Parameterabhangigkeit von (0; t) fur die BoltzmannStrategie KAPITEL 3. DER VERGLEICH VON STRATEGIEN 64 die Variation von aus. Weiterhin sei noch bemerkt, da die Zeitskala fur die Veranderung der Wahrscheinlichkeit im Falle der Boltzmann-Strategie um den Faktor 5 gegenuber der Darwin-Strategie gestreckt ist. Als weitere Besonderheit konnen wir aus den Abbildungen die Tatsache ableiten, da die Erniedrigung der Krummung der Topfe keinen groen Einu auf das Verhalten der Strategie ausubt. Genau dies steht aber im Gegensatz zur Darwin-Strategie. Um dieses Resultat noch einmal explizit zu unterstreichen, betrachten wir die Variation der Krummung des tieferen Topfes. Die Abbildung 3.10 spiegelt diese Situation wieder. Wie wir erkennen konnen, 1.0 20.0 Boltzmann b1=1 Boltzmann b1=2 Darwin b1=1 Darwin b1=2 0.8 Wahrscheinlichkeit 15.0 Fitness 0.9 b1=1 b1=2 10.0 5.0 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 −5.0 −3.0 −1.0 1.0 Phaenotyp 3.0 5.0 0.0 0.0 5.0 10.0 15.0 Zeit t 20.0 25.0 30.0 Abbildung 3.10: Vergleich zwischen Boltzmann- und Darwin-Strategie kommt in beiden Fallen die Boltzmann-Strategie problemlos in den anderen Topf, wahrend die Darwin-Strategie im Falle einer kleinen Krummung keinen Erfolg hat. Beide Strategien scheinen also bezuglich der Krummung und des Hohenunterschieds zwischen den Minima genau gegenlauges Verhalten zu besitzen. Diese Tatsache motiviert die Mischung zwischen beiden Strategien, die durch Computersimulationen [26, 27, 28, 29, 40] gestutzt wird. 3.3 Die Gemischte Strategie Wie wir in den vorherigen Abschnitten dieses Kapitels an einigen Beispielen gezeigt haben, besitzen die Boltzmann- und die Darwin-Strategie genau entgegengesetztes Verhalten. Wie Ebeling et al. [26] als erste bemerkten, ist 3.3. DIE GEMISCHTE STRATEGIE 65 es daher naturlich, beide Strategien zu mischen. Die Folgerungen aus diesem Ansatz sollen in diesem Abschnitt studiert werden. 3.3.1 Diskussion des Verhaltens Die Gute einer Strategie ist oft schwer zu ermitteln. Andererseits ist jede Fitnesslandschaft uber einem kontinuierlichen Raum aus zwei grundlegenden Stucken aufgebaut: der Fitnessfunktion mit einem kritischen Punkt (Parabel) und der Fitnessfunktion mit zwei kritischen Punkten (Doppeltopf). Alle anderen Falle lassen sich aus diesen grundlegenden Stucken zusammenfassen. Deshalb wurden diese Beispiele ausgewahlt. Auch in diesem Abschnitt werden wir die Beispiele verwenden, da wir dadurch einen direkten Vergleich mit den anderen Strategien bekommen. Gemeinsamkeiten zur Boltzmann- und Darwin-Strategie Als erstes wollen wir den wenig spektakularen Fall eines parabolischen Potentials (3.25) behandeln. Hierbei mu sich wieder dasselbe Verhalten wie fur die Boltzmann- und Darwin-Strategie zeigen. Dazu benutzen wir die Greensche Funktion (3.32) und setzen die entsprechenden Parameter ein. Nach Benutzung des Ansatzes (2.36) und der Transformation der Fitnessfunktion (2.38) erhalten wir fur die Parameter P (~x; t) = exp(; Zt =0 hFq i( )d ; =2Fq )y(~x; t) A0 = D(a1 + a2) + Fmin A1 = D 2a21 + ja1 j A2 = D 2a22 + ja2j : (3.54) Die Formel fur die Geschwindigkeit der Gemischten Strategie ist etwas komplizierter als fur die reinen Strategien. Deshalb wollen wir nur die Formel fur die Geschwindigkeit des Minimums angeben. q q (1) 2 v = ; aD ( aD + )D sinh(4t aD( 2aD + )) 2a2 D + a (3.55) +2x20 a3 4D + 2x20 a2 2 + 4x20DA 2 + 2x20 s 2 q + ) 4D(x a )2 + 4x2a + ; cosh(2t aD( 2aD + )) a( aD 0 0 D KAPITEL 3. DER VERGLEICH VON STRATEGIEN q q 2 2 2 2 2 2 + +2Da + 8x0D + a Da(aD + ) + 4x0 Da(aD + ) q q 2 2 cosh (2t aD( aD + )) cosh2(2t aD( 2aD + ))(8a2D2 4+ q q +8a 2D + 2 ) ; Da(aD 2 + ) sinh(4t aD( 2aD + ))(4a 2D + 2 ) ;1 q q 2 3 2 2 4 2 2 ;6 Da + 2Da aD ( aD + ) sinh(4t aD( aD + )) + D a 66 Die restlichen Formeln sind im Anhang D zusammengestellt. An dieser Stelle wollen wir uns vor allem fur die A nderung des Parameters sowie die Krummung der Parabel (3.25) a1; a2 interessieren. Der Einfachheit halber haben wir uns auf den 1-dimensionalen Fall beschrankt. In der Abbildung 3.11 ist die Variation dieser beiden Parameter dargestellt. Dazu gehen wir 100.0 3.0 2.5 a=1 a=2 a=5 60.0 Geschwindigkeit Geschwindigkeit 80.0 40.0 20.0 0.0 0.0 γ=1 γ=2 γ=5 2.0 1.5 1.0 0.5 2.0 4.0 6.0 Zeit t 8.0 10.0 0.0 0.0 2.0 4.0 6.0 8.0 10.0 Zeit t Abbildung 3.11: Geschwindigkeit der Gemischten Strategie auf einem Minimum fur die Variation der Krummung a (links) und bei Variation des Mischungsparameters (rechts) von einem festen Parametersatz = 1; a = 1; D = 0:1; x0 = 2; = 1 aus und verandern nur jeweils einen Parameter, d.h. entweder die Krummung a oder den Mischungsparameter . Wie wir sehr gut erkennen konnen, wird die Geschwindigkeit der Strategie mit steigendem Mischungsparameter sowie mit steigender Krummung groer. Naturlich setzt sich das Verhalten der gesamten Strategie aus dem Verhalten der einzelnen Strategien zusammen. Im Falle des parabolischen Potentials (3.25) ist das Verhalten der Boltzmann und der Darwin-Strategie gleich. Daher erleben wir keine U berraschung bei der Betrachtung der Kurven. 3.3. DIE GEMISCHTE STRATEGIE 67 Nehmen wir ein Maximum als Fitnessfunktion an, so konnen wir genauso wie bei der Darwin-Strategie eine formale Transformation t ! it ansetzen. Dadurch kann die Formel vom Minimum ubernommen werden. Die Formel bendet sich wiederum im Anhang D, wahrend die entsprechenden Kurven in Abbildung 3.12 dargestellt sind. Die Parameterabhangigkeit der Geschwin100.0 100.0 80.0 a=1 a=2 a=5 60.0 40.0 20.0 0.0 0.0 Geschwindigkeit Geschwindigkeit 80.0 γ=1 γ=2 γ=5 60.0 40.0 20.0 0.2 0.4 Zeit t 0.0 0.0 0.2 0.4 0.6 0.8 Zeit t Abbildung 3.12: Geschwindigkeit der Gemischten Strategie auf einem Maximum fur die Variation der Krummung a (links) und bei Variation des Mischungsparameters (rechts) digkeit bleibt auch fur diesen Fall gleich. Als wichtigster Unterschied ist nur das unbeschrankte Anwachsen der Geschwindigkeit aufzufuhren. Der Grund ist physikalisch verstandlich und liegt, mathematisch gesehen, in der fehlenden Unitaritat der Transformation. Dadurch verliert die Formel oberhalb des dargestellten Zeitpunktes ihre Gultigkeit. In einem fruheren Abschnitt hatten wir eine Moglichkeit der Reparatur angegeben, die zu einem aquivalenten Ergebnis fuhrt: der unterliegende Raum mu kompakt sein. Diese Fragen werden uns im ersten Abschnitt des nachsten Kapitels starker beschaftigen. Zum Schlu sei noch kurz auf den Fall eines Sattels eingegangen. Die Form der Kurven soll an dieser Stelle nicht angegeben werden, da sie sich aus der Addition der Geschwindigkeit des Maximums und des Minimums ergeben. Wie wir leicht aus den Abbildungen 3.11 und 3.12 entnehmen konnen, wird das Verhalten vorrangig durch das Maximum bestimmt. Auf anschauliche Art und Weise konnen wir dieses Verhalten als ein "Passieren des Sattels ohne Zeitverlust\ deuten. Ein Vergleich mit der Boltzmann- bzw. DarwinStrategie zeigt die erwartete U bereinstimmung im Ergebnis. 68 KAPITEL 3. DER VERGLEICH VON STRATEGIEN Unterschiede In diesem Unterabschnitt wollen wir auf ein entscheidendes Problem eingehen, das fast immer fur Fitnesslandschaften auftritt: Wie wird eine Barriere, die zwei lokale Minima trennt, ubersprungen? Als eine Groe, die diesen Vorgang gut charakterisiert, hat sich die Wahrscheinlichkeit (0; t) (3.4) erwiesen. Wie wir im Unterabschnitt 3.2.3 festgestellt haben, zeigen die Boltzmann und Darwin-Strategie ein unterschiedliches Verhalten bei der U berwindung der Barriere. Soll sich der Gedanke der Mischung beider Strategien als tragfahig erweisen, so mu die Gemischte Strategie in allen Fallen uber die Barriere gelangen. Dazu untersuchen wir wiederum die Variation der Parameter ausgehend von einem festen Parametersatz a1 = 1; a2 = 2; b1 = 1; b2 = ;3; s = 4; x0 = ;0:5; D = 1; = 0:1; = 1 durch Variation jeweils eines Parameters. Die Folge von Bildern in Abbildung 3.13 zeigt das Ergebnis. An dieser Stelle soll auf zwei Besonderheiten eingegangen werden, welche diese Strategie auf grundsatzliche Weise von den beiden Strategien unterscheidet. Anschaulich wurden wir erwarten, da die Erhohung des Mischungsparameters eine Erhohung der Wahrscheinlichkeit zur Folge hat, da die Darwin-Strategie besser uber Barrieren kommt. Das dies nicht immer der Fall ist, zeigt die Abbildung rechts unten. Fur diesen Parametersatz besitzt die Darwin-Strategie die Tendenz hangenzubleiben. Erstaunlich ist nun, da die weitere Erhohung des Mischungsparameters die Wahrscheinlichkeit wieder erhoht. Damit erhalten wir ein Parameterfenster fur den Mischungsparameter in Abhangigkeit von der reziproken Temperatur . Die Gemischte Strategie bleibt also nicht immer "hangen\. Als weiteren groen Unterschied zur Darwin-Strategie erhalten wir die Tatsache, da immer ein gewisser Anteil an Suchern auf die andere Seite gelangt und dort bleibt. Der Grund ist einfach durch den Einu der Boltzmann-Strategie gegeben, die als stationare Losung exp(;F (x)) hat. Die anderen Parameterabhangigkeiten sind genauso wie bei der Boltzmann- bzw. Darwin-Strategie, was durch das gleichartige Verhalten beider Strategien gegenuber solchen Parameteranderungen begrundbar ist. 3.3.2 Wahl der Parameter Hier wollen wir uns der Frage zuwenden, wie der Mischungsparameter und die reziproke Temperatur sowie die Diusionskonstante D zu wahlen sind. Dabei sollen zwei Gesichtspunkte im Mittelpunkt stehen: Zuerst konnen 69 0.9 0.9 0.8 0.8 Wahrscheinlichkeit Wahrscheinlichkeit 3.3. DIE GEMISCHTE STRATEGIE 0.7 0.6 0.5 0.4 a2=1 a2=2 a2=3 a2=4 0.3 0.2 0.1 0.0 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 b1=1 b1=2 b1=3 b1=4 0.7 0.6 0.5 0.4 0.3 0.2 0.1 8.0 9.0 10.0 0.0 0.0 1.0 2.0 3.0 Zeit t 5.0 6.0 7.0 8.0 9.0 10.0 Zeit t 0.9 Wahrscheinlichkeit 4.0 0.8 0.7 0.6 γ=0.01 γ=0.1 γ=1 γ=10 0.5 0.4 0.3 0.2 0.1 0.0 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0 Zeit t Abbildung 3.13: Parameterabhangigkeit von (0; t) fur die Gemischte Strategie 70 KAPITEL 3. DER VERGLEICH VON STRATEGIEN die Parameter fest eingestellt und desweiteren wahrend des Simulationslaufs angepat werden. Im folgenden wollen wir uns der ersten Herangehensweise zuwenden. Naturlich konnen wir bei einer festen Parametereinstellung nur Heuristiken fur die Wahl der Parameter angeben. Dazu fassen wir noch einmal die bisherigen Erkenntnisse zusammen. Fur die Darwin-Strategie ist die Hohe der Barriere nicht so entscheidend wie der Abstand der Minima und deren Hohenunterschied. In Abbildung 3.10 haben wir die Situation fur den Extremfall eines kleinen Hohenunterschieds aufgezeigt. Nur die Boltzmann Strategie erreicht nach langerer Zeit das richtige Minimum, wahrend die Darwin-Strategie wieder umkehrt. Daher erscheint es einleuchtend, da eine Gemischte Strategie diese Schwierigkeiten uberwinden sollte. Die Abbildung 3.14 zeigt dies eindrucksvoll am selben Beispiel wie Abbildung 3.10. Wie wir schon fruher vermutet haben, gibt es 1.0 0.9 0.8 0.7 0.6 b1=1,γ=0.1 b1=2,γ=0.1 b1=1,γ=1 b1=2,γ=1 0.5 0.4 0.3 0.7 0.6 0.5 0.4 0.3 0.2 0.2 0.1 0.1 0.0 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0 Zeit t Boltzmann b1=1 Boltzmann b1=2 Darwin b1=1 Darwin b1=2 0.8 Wahrscheinlichkeit Wahrscheinlichkeit 0.9 0.0 0.0 5.0 10.0 15.0 Zeit t 20.0 25.0 30.0 Abbildung 3.14: Vergleich zwischen Boltzmann-, Darwin- (rechts) und der Gemischten Strategie (links) Parametersatze, fur welche die Gemischte Strategie schneller als die einzelnen Strategien ist. Um diese Idee zu untermauern, betrachten wir die Abhangigkeit der Wahrscheinlichkeit von und , wie es in Abbildung 3.15 dargestellt ist. Im Fall einer groen Temperatur (kleinem ) nimmt die Fahigkeit, uber die Barriere zu springen, erst mit steigendem ab, um dann ganz abrupt wieder anzusteigen. Beim anderen Fall einer kleinen Temperatur hangt das Verhalten fur kleine Mischungsverhaltnisse nicht von diesem Verhaltnis ab. 3.3. DIE GEMISCHTE STRATEGIE γ=8 γ=8.5 γ=9 γ=9.5 0.8 0.7 0.6 0.9 Wahrscheinlichkeit Wahrscheinlichkeit 0.9 0.5 0.4 0.3 0.2 0.1 0.0 71 γ=0.001 γ=0.01 γ=0.1 γ=1 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 10.0 20.0 30.0 Zeit t 40.0 50.0 60.0 0.0 0.0 10.0 20.0 30.0 Zeit t 40.0 50.0 60.0 Abbildung 3.15: Darstellung der Wahrscheinlichkeit (0; t) in Abhangigkeit vom Mischungsparameter fur = 0:1 (links) und fur = 1 (rechts) In jedem Fall wird die Barriere mit einer gewissen Wahrscheinlichkeit uberwunden. Anhand dieser Tatsache konnen wir folgende Regeln formulieren: Auf stark zerklufteten Fitnesslandschaften mu bei groer Temperatur der Mischungsparameter vergroert werden. Im anderen Fall hangt die Strategie kaum von ab. Die Groe der Population, die sich auf der anderen Seite bendet, hangt dann von ab. Die Fitnessfunktion zu dieser Landschaft besitzt groe erste und zweite Ableitungen. Meist sind die zugehorigen Probleme frustriert, d.h., es werden gleichzeitig widerstrebende Groen optimiert. Auf Fitnesslandschaften, die kaum Niveauunterschiede der lokalen Mi- nima aufweisen, mu der Mischungsparameter bei kleiner Temperatur ebenfalls verkleinert werden. Andernfalls mu unbedingt vergroert werden. Die zugehorige Fitnessfunktion besitzt kleine erste und zweite Ableitungen, d.h., sie variiert nur schwach mit der A nderung des Phanotyps. Meist sind die entsprechenden Probleme in Teilprobleme zerlegbar, die unabhangig voneinander sind. Beachten wir diese Regeln, dann sollte die Einstellung der Parameter moglich sein. Leider lassen sich solche Regeln nicht genauer formulieren, weil dazu die Aufdeckung der Struktur aller Probleme notig ist. Leichter ist es dagegen, die Steuerung der Strategieparameter durch die Dynamik selbst vorzunehmen. Dazu benutzen wir Formel (3.18) und setzen einfach die Geschwindigkeit 72 KAPITEL 3. DER VERGLEICH VON STRATEGIEN v(1) = v als konstant an. Dadurch erhalten wir eine Relation v = D hrF rF i + (hF 2i ; hF i2) ; Dh4F i = const (3.56) zwischen den Groen , und D. Wahrend eines Simulationslaufs konnen wir die entsprechenden Mittelwerte auf einfache Weise bestimmen. Da wir andererseits voraussetzen, da wegen der kleinen Mutationsschritte die Strategie lokal arbeitet, so konnen wir in guter Naherung den Fall einer quadratisch abfallenden bzw. zunehmenden Fitnessfunktion ansetzen. Daraus lat sich eine Abschatzung fur einen Parameter durch die Vorgabe der beiden anderen Parameter angeben. Dazu xieren wir die Geschwindigkeit v und stellen die Formel (3.56) nach der gesuchten Groe um. Als Beispiel wahlen wir den Mischungsparameter aus und erhalten F rF i + Dh4F i : = (t; D; ; v) = v ; D hr (3.57) (hF 2i ; hF i2) Dadurch bekommen wir eine Funktion (t; D; ; v) in welche die Groe der Geschwindigkeit v eingeht. Ist diese Geschwindigkeit v positiv, so minimiert die Strategie die Fitnessfunktion. Diese Bewegung der Strategie ist der Fortschritt, da Gebiete mit einer guten Fitness erreicht werden. Ist die Geschwindigkeit negativ, so hat sich die Fitness der meisten Sucher in der Population verschlechtert. Es ist klar, da als kritischer Wert der Fall v = 0 mit keiner Verbesserung bzw. Verschlechterung auftritt. Der Wert des Mischungsparameters mu groer als der kritische Wert krit = (t; D; ; 0) sein, um eine Verbesserung hervorzurufen. Wie wir aus der Formel (3.57) leicht ersehen konnen, spielt fur das Verhalten von die Veranderung der Fitnessvarianz F = hF 2i ; hF i2 die wichtigste Rolle. Wahlen wir als Beispiel die quadratische Fitness, die als lokaler Fall schon erwahnt wurde, so stellen wir fest, da die Fitnessvarianz als Nenner von (t; D; ; v) mit hx4 i, d.h. starker als der Zahler, variiert. Damit erhalten wir die einfachen Regeln: Die Wahl des Mischungsparameters ist wahrend des Simulationslaufs umgekehrt proportional zur Fitnessvarianz F zu wahlen. Eine Erhohung bzw. Erniedrigung des Parameters zieht eine Erniedrigung bzw. Erhohung des Mischungsparameters nach sich. Diese Regeln geben naturlich nur einen groben Rahmen fur die Wahl des Parameters an. Viel wichtiger ist die Formel (3.57) sowie der kritische Wert krit, die leicht wahrend eines Simulationslaufs ermittelt werden konnen. 3.4. SIMULATION DER STRATEGIEN 73 Bevor wir die Simulation der Strategien darlegen wollen, mussen wir uns vorher noch fragen, in welchem Sinne die Gemischte Strategie besser als die Darwin- und Boltzmann-Strategie ist. Diese Frage ist eng mit der Frage verwandt, wann die Strategie anhalt, d.h., wann wird entschieden, da der angelaufene Punkt das globale Minimum ist. In den vorangegangenen Abschnitten hatten wir als Haltekriterium fur die Strategie das Verhalten des groten Teils der Population gewahlt. Bendet sich mehr als die Halfte der Sucher in der Umgebung eines Punktes und verandert sich die Verteilung dieser Sucher kaum noch, dann bezeichnen wir diesen Punkt als globales Minimum. Ein Vergleich von Strategien wurde genau in diesem Sinne durchgefuhrt, und auch nur in diesem Sinne ist die Gemischte Strategie besser als die Darwin- und Boltzmann-Strategie. Fur einen groen Parameterbereich ndet diese Strategie fast immer das globale Minimum. Die Bearbeitung der verschiedensten Optimierungsaufgaben [] beweist dieses theoretische Resultat eindrucksvoll. Am Schlu sei noch kurz auf die Bedeutung de Wahrscheinlichkeit (3.4) eingegangen. Wie Rudolph in seiner Arbeit [36] auf Seite 206 bemerkte, sei es mittels dieser Beschreibung nicht moglich, eine Aussage uber die Konvergenz von Evolutionaren Algorithmen mit endlicher Population zu gewinnen. Dies ist nach dem bisher Gesagtem nicht richtig. Die Groe (3.4) beschreibt namlich nicht nur die Dichte der Sucher auf der anderen Seite der Barriere sondern auch die Wahrscheinlichkeit einen Sucher dort zu nden. Multiplizieren wir die Wahrscheinlichkeit mit der Groe der Population, so erhalten wir die Dichte der Sucher auf der anderen Seite der Population. Legen wir weiterhin eine Schwelle bzgl. der Anzahl von Suchern, die sich auf der anderen Seite der Barriere benden fest, so konnen wir die Zeit zur Erreichung dieser Schwelle bestimmen. Genau diese Groe wurde in [36] berechnet. 3.4 Simulation der Strategien In diesem Abschnitt wollen wir die stochastische Realisierung der Boltzmannund Darwin-Strategie diskutieren. Dabei halten wir uns eng an den Artikel [58] und erklaren nur kurz die entsprechenden Algorithmen zur Simulation beider Strategien. Alle Simulationen wurden von Rose durchgefuhrt und ergaben eine sehr gute U bereinstimmung mit der Theorie. KAPITEL 3. DER VERGLEICH VON STRATEGIEN 74 3.4.1 Die Boltzmann-Strategie Zur Simulation der Boltzmann-Strategie (2.6) gibt es zwei Moglichkeiten. Als erstes betrachten wir die U bergangswahrscheinlichkeit ( 1 pxy = exp ; F (y);F (x) T wenn F (y) > F (x) sonst ; (3.58) wobei T die Temperatur kennzeichnet. Im Kapitel 2 wurde die entsprechende Herleitung der Gleichung (2.6) aus dieser Rate vorgefuhrt. Dabei trat das Problem auf, da der Algorithmus nur kleine Schritte zurucklegen darf, um in der Diusionsnaherung von Gleichung (2.6) zu bleiben. Dieser Nachteil kann durch die zweite Moglichkeit der Simulation der Boltzmann-Strategie behoben werden. Dazu benutzt man Brownsche Teilchen im uberdampften Fall, die sich entlang des Gradienten der Fitnessfunktion F (~x) bewegen. Wir erhalten also die Langevin-Gleichung d ~x = ;D rF + p2D (t) ; (3.59) dt wobei (t) Gausches weies Rauschen mit h (t)i = 0 h (t0) (t)i = (t0 ; t) : ist, D bezeichnet die Diusionskonstante und die reziproke Temperatur. Die entsprechende Fokker-Planck-Gleichung [4], die zur Langevin-Gleichung korrespondiert, ist mit Gleichung (2.6) identisch. Zur Simulation der LangevinGleichung benutzen wir das folgende Diskretisierungsschema p ; F (x(t) ; x) t (3.60) x(t + 1) = x(t) + 2Dt (t) ; D F (x(t) + x)2 x mit dem Zeitschritt t und der Kastenlange x. Den Vergleich zwischen der analytischen Losung der Boltzmann Strategie und der stochastischen Realisierung in Form einer Langevin-Gleichung wollen wir anhand einer Parabel F (x) = x2 mit dem Minimum bei x = 0 und dem Doppeltopf F (x) = 0:16 + (0:0278x2(0:16667x ; 0:9)(0:16667x + 0:8)) mit den Minima x ;3:4; 3:8 durchfuhren. In [58] wurde Zeitentwicklung der Wahrscheinlichkeitsverteilung im Falle der Parabel fur verschiedene Zeiten 3.4. SIMULATION DER STRATEGIEN 75 dargestellt, wobei die Populationsgroe N = 10000 betrug. Die entsprechenden Verteilungen gleichen den theoretischen Losungen. Wichtiger als diese zeitliche Entwicklung sind die oben denierten Geschwindigkeiten bzw. deren Integrale. Im Artikel [58] wurde die mittlere Fitness hF i sowie die Fitnessvarianz hF 2i;hF i2 mit den theoretischen Resultaten verglichen. Zur Vereinfachung geben wir noch einmal die entsprechenden Formeln im Falle der Parabel fur die Boltzmann Strategie an. Als Anfangsverteilung wahlen wir P (x; 0) = (x ; x0 ), d.h. wir starten mit allen Suchern im Punkt x0 . Dann erhalten wir 2 := hF 2i ; hF i2 = 2 1 2 ((2x20 ; 1)(e;2t ; e;4Dt) + 1 ; e;2Dt(3.61) ) hF i = 21 (x20 ; 1) exp(;D2t) : (3.62) Es ergab sich eine gute U bereinstimmung zwischen Theorie und Simulation fur die Parameter D = 0:1; x0 = ;5 bei verschiedenen -Werten. Nur fur kleine Temperaturen weichen die Ergebnisse aufgrund der kleinen Populationsgroe etwas ab. Nun wollen wir uns noch dem nachstschwierigeren Problem widmen, dem Doppeltopf. Wir verwenden dabei genau dieselben Parameter wie fur die Parabel. Da die Gleichung (2.6) fur diesen Fall nicht losbar ist, hatten wir die entsprechende partielle Dierentialgleichung numerisch integriert. Die Verteilung P (x; t) zeigt eine gute U bereinstimmung zwischen der simulierten und integrierten Losung fur verschiedene Temperaturen. Das entsprechende Verhalten wurde schon im vorherigen Unterabschnitt geschildert. Desweiteren ist im Artikel [58] eine ausfuhrliche Diskussion dieses Verhaltens enthalten. Genau wie aus der theoretischen Losung zu erwarten war, ist die Strategie stark von der Temperatur abhangig, und wir erhalten dasselbe Verhalten wie fur das stuckweise gegebene Potential (3.51). 3.4.2 Die Darwin-Strategie Um diese Strategie zu simulieren, erinnern wir an die Herleitung der DarwinStrategie (2.17) mit Hilfe der U bergangsraten (2.18). Damit reduziert sich die Simulation der Darwin-Strategie auf die Simulation der entsprechenden Mastergleichung. Als eektiver Algorithmus bietet sich die Simulation der Wartezeitverteilung [71, 72, 73, 74, 75] bzw. der Gillispie-Algorithmus an. Die Idee besteht darin, da in der Dynamik des Prozesses die haugste Zeit 76 KAPITEL 3. DER VERGLEICH VON STRATEGIEN kein U bergang stattndet. Kennen wir nun die Zeit, wann der nachste U bergang garantiert ausgefuhrt werden mu, so konnen wir einfach die Zeitskala des Prozesses verandern und den U bergang ausfuhren. Diese Zeit wird als Wartezeit bezeichnet. Der Vorteil der Methode liegt in einer starken Geschwindigkeitssteigerung des Algorithmus'. Fur die Einzelheiten verweisen wir wieder auf den Artikel [58]. p Als Mutation wahlen wir einen Diusionsproze mit der Bedingung hri = 2 D t fur jeden Mutationsschritt r. Der gesamte Algorithmus lat sich nun in folgendem Schema mit der gleichverteilten Zufallszahl z, der exponentiell verteilten Zahl und der normal-verteilten Zahl fur N Schritte zusammenfassen: t0 = t + hN i i = z1 2 f1; :::;qN g x(t0 ) = x(t)+ 2 D (t ; t0 ) z2 2 0; h1i wenn z2 < jWs = F (x) ; hF i j j = z3 2 f1; :::; i ; 1; i + 1; :::; N g y = x : Ws > 0 x = y : Ws < 0. Wiederum wollen wir die Dynamik des Algorithmus' mit der analytischen Losung der Darwin-Strategie fur dieselben Fitnessfunktionen Parabel und Doppeltopf vergleichen. Im Falle der Parabel bendet sich die Zeitentwicklung fur die Verteilungsfunktion in guter U bereinstimmung mit der theoretischen Losung, wie die entsprechende Abbildung in [58] beweist. Fur die theoretische Formel der mittleren Fitness erhalten wir in diesem Fall den Ausdruck ! 2 p p 1 x 0 hF i = 2 2D tanh(t 2D) ; 2 cosh2 (tp2D) ; (3.63) falls dieselbe Anfangsverteilung P (x; 0) = (x ; x0 ) benutzt wird. Wie aus der Simulation zu ersehen ist, haben die Fluktuationen keinen so groen Einu auf die Ergebnisse und werden mit wachsender Populationsgroe kleiner. Es sei bemerkt, da der Grund dafur in der Wahl der U bergangsraten als Differenz F (x) ; hF i liegt. Auch fur den Doppeltopf nden wir eine sehr gute U bereinstimmung zwischen der numerischen Losung der partiellen Dierentialgleichung (2.17) und der Simulation von N = 10000 Individuen. Kapitel 4 Die Mathematische Untersuchung der Schrodinger-Operatoren \Wenn uns die Beantwortung eines mathematischen Problems nicht gelingen will, so liegt haug der Grund darin, da wir noch nicht den allgemeineren Gesichtpunkt erkannt haben, von dem aus das vorgelegte Problem nur als Glied einer Kette verwandter Probleme erscheint." David Hilbert In diesem Kapitel schaen wir die mathematischen Grundlagen zur weiteren Untersuchung der Strategien. Eine Anwendung dieser Resultate auf die Klassikation der Strategien erfolgt im nachsten Kapitel. Im ersten Abschnitt werden die spektralen Eigenschaften von Schrodinger-Operatoren diskutiert. Die weiteren Abschnitte enthalten eine neue Theorie der SchrodingerOperatoren, die auf dem Studium der Zerlegung dieser Operatoren beruht. Bevor wir zu den mathematischen Einzelheiten der Konstruktion kommen, wollen wir noch andere Anwendungen dieser Theorie kurz diskutieren. Als erste wichtige Anwendung sei auf die enge Beziehung zwischen der Darwin-Strategie und der Schrodingergleichung hingewiesen. Bezuglich des stationaren Problems gleichen sich beide Zugange vollstandig, wahrend sie sich in der Zeitabhangigkeit unterscheiden. Da die Klassikation auch uber 77 78 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG den Kern des Hamiltonoperators Aussagen trit, erhalten wir damit auch eine Klassikation des Grundzustandes. Weiterhin erhalten wir dadurch ein Verfahren zur eektiven Konstruktion von Wechselwirkungstermen. In der Mathematik fuhrt diese Herangehensweise zu einer Beziehung zwischen der Singularitatstheorie algebraischer Varitaten und der K-Theorie. Nun ist es moglich, auf andere Art und Weise die Generatoren einer K-Theorie zu konstruieren. 4.1 Spektrale Eigenschaften In diesem Abschnitt werden wir, aufbauend auf die Ergebnisse der vorherigen Abschnitte die allgemeinen Eigenschaften der Operatoren vom SchrodingerTyp studieren. Dabei stehen sowohl Fragen nach der Form des Spektrums als auch nach der Reproduzierbarkeit desselben wahrend eines Simulationslaufs im Mittelpunkt. Dieser Abschnitt dient vor allem zur Vorbereitung der nachsten Abschnitte. 4.1.1 Die Eigenschaften des Spektrums Wir wollen in diesem Abschnitt auf die grundlegenden Denitionen und Satze aus der Spektraltheorie linearer Operatoren in Hilbertraumen eingehen. Dabei werden wir uns starker an die mathematische Denition anlehnen, um die entsprechenden Ergebnisse in kompakter Form darzulegen. Sei H ein unendlich-dimensionaler, vollstandiger, separabler Hilbertraum und A : H ! H ein linearer Operator uber H mit dem Wertebereich D(A) H. Denition 1 Sei 2 C eine xierte, komplexe Zahl. Die Resolvente R (A) des Operators A ist durch R(A) = (A ; 11);1 mit der identischen Abbildung 11 deniert. Die Menge 4(A) mit 4(A) = fyj9x 2 D(A) mit (A ; 11)x = yg ist der Denitionsbereich von R (A). Die Zahl heit regularer Wert, falls 1. R (A) existiert, 4.1. SPEKTRALE EIGENSCHAFTEN 79 2. die Vervollstandigung von 4(A) der gesamte Hilbertraum H ist und 3. R (A) beschrankt ist. Alle nicht-regularen Werte des Operators A bilden das Spektrum (A) von A. An dieser Stelle sei bemerkt, da die Punkte 2 und 3 in der Denition des regularen Wertes an die unendliche Dimension des Hilbertraums gebunden sind. Diese Feststellung ist nur die aquivalente Formulierung des Fakts, da lineare Operatoren (bzw. Matrizen) uber endlich-dimensionalen Vektorraumen nur ein diskretes Spektrum besitzen. Die Verletzung des Punktes 1 in der Denition des regularen Wertes deniert das Punktspektrum P (A), wahrend im Falle von Punkt 3 das kontinuierliche Spektrum C (A) sowie bei Punkt 2 das Restspektrum R (A) eingefuhrt wird. Fur das Spektrum ergeben sich folgende Eigenschaften: 1. Das Spektrum (A) ist eine abgeschlossene Teilmenge der komplexen Zahlen C. 2. Das Spektrum ist die disjunkte Vereinigung des Punkt-, kontinuierlichen sowie des Restspektrums, d.h. (A) = P (A) t C (A) t R (A) : 3. Fur einen stetigen, linearen Operator A ist (A) nicht leer und kompakt. Der Spektralradius ist durch r(A) := supfjj : 2 (A)g deniert und es gilt: qn n r(A) := nlim !1 jjA jj jjAjj ; d.h., das Spektrum des Operators A liegt in einem Kreis mit Radius jjAjj um den Nullpunkt. 4. Ist der Operator A auf einem Hilbertraum deniert, so gilt: (AT ) = (A) (A? ) = (A) KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG 80 5. Ist A ein selbstadjungierter Operator (A = A? ), so besitzt A kein Restspektrum (R (A) = ;) und das Spektrum besteht nur aus reellen Zahlen ((A) IR). Fur den Spezialfall eines kompakten1 , selbstadjungierten, linearen Operators A uber einem Hilbertraum haben Hilbert und Schmidt gefunden, da die Menge der Eigenvektoren ein Orthonormalsystem des Hilbertraums bildet. Explizit lautet dieser Satz folgendermaen. Satz 1 Fur jeden kompakten, selbstadjungierten, linearen Operator A im Hilbertraum H existiert ein othonormiertes System fng von Eigenvektoren, so da jedes Element 2 H eindeutig in der Form = X k ck k + 0 mit einem Vektor 0 2 ker A dargestellt werden kann. Dabei gilt A = X k k ck k ; wobei k der k entsprechende Eigenwert ist. Ist das System fng unendlich, so gilt nlim !1 n = 0 : Fur einen Beweis dieses Satzes verweisen wir auf [76]. Insbesondere bedeutet dieser Satz, da fur den kompakte Fall das kontinuierliche Spektrum nicht existiert. Bevor wir uns dem konkreten Fall eines Operators vom Schrodinger-Typ zuwenden, wollen wir noch kurz auf die Behandlung des kontinuierlichen Spektrums im Falle eines selbstadjungierten Operators eingehen. In der Physik wird dafur immer die Diracsche Darstellung in Form von -Funktionen gewahlt. Diese Art der Darstellung birgt aber einige Schwierigkeiten, die vor allem mit dem Konvergenzbegri zusammenhangen. An dieser Stelle wollen wir daher der mathematischen Darstellung in Form einer Spektralschar den Vorzug geben. Jede beschrankte Folge (un ) in D(A) besitzt eine Teilfolge (vn ), so da (Avn ) konvergent ist. 1 4.1. SPEKTRALE EIGENSCHAFTEN 81 Denition 2 Ein linearer Operator P : H ! H mit P 2 = P heit Projektionsoperator. Unter einer Spektralschar fEg verstehen wir eine Familie von stetigen Projektionsoperatoren E : H ! H , so da fur alle u 2 X und ; 2 IR gilt: EE = E E = E fur (i) lim E u = 0 !;1 lim E u = u !+1 lim E u = E u : !;0 und (ii) (iii) Der Teilraum H = fxjx 2 H ; Ex = xg ist der Projektionsraum von E . Aufbauend auf dieser Denition fand Hilbert 1906 fur beschrankte Operatoren, den folgenden Satz, der 1929 durch von Neumann auf allgemeine selbstadjungierte Operatoren ausgedehnt wurde. Satz 2 Zu jedem selbstadjungierten Operator A gibt es genau eine Spektralschar, so da D(A) = fu 2 H j Z1 ;1 und (Au; v) = jj2 d(Eu; u) < 1g Z1 ;1 d(E u; v) fur alle u; v 2 D(A) gilt, wobei ( : ; : ) das Skalarprodukt in H bezeichnet. Die Integrale sind dabei im Sinne von Lebesgue-Stieltjes zu verstehen. Symbolisch schreiben wir dafur auch A= Z1 ;1 dE : Dieser Satz bedeutet, da jeder selbstadjungierte Operator als Linearkombination von Projektionsoperatoren darstellbar ist. Damit ist der Projektionsoperator der "einfachste\ selbstadjungierte Operator. Wie im letzten Abschnitt von Kapitel 2 gezeigt wurde, konnen alle Strategien auf eine Gleichung der Form (2.49) zuruckgefuhrt werden. Nun wollen wir uns den spektralen Eigenschaften des Operators (2.50), welche die 82 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG Eigenschaften des Warmeleitungskerns (2.51) entscheidend beeinussen, zuwenden. Darunter zahlen solche Groen wie Spektraldichte und die Zeitentwicklung des Warmeleitungskerns. Dabei werden wir uns eng an das Buch [57] halten. Gegeben sei die verallgemeinerte Warmeleitungsgleichung (2.49) mit H als verallgemeinertem Laplace-Operator uber einem n-dimensionalen Raum B . Entsprechend [57] existiert eine Entwicklung des Warmeleitungskerns bezuglich der Zeit 1 2 =4t) X 2 exp( ;jj ~ x ; ~ y jj i (~x; ~y) q pt(~x; ~y) = t i (4t)n;(n=2 + 1) i=0 (4.2) mit den Warmeleitungskernkoezienten i(~x; ~y), die Funktionen von F und deren Ableitungen sind. Fur eine beliebige Anfangsverteilung P (x; 0) erhalten wir durch das Integral Z P (~x; t) = pt(~x; ~y)P (~y; 0)dny B (4.3) eine Losung der Gleichung (2.49). Entsprechend [57] ist es moglich eine Rekursionsformel zur Berechnung der Koezienten i(~x; ~y) anzugeben. Wir wollen uns an dieser Stelle auf den Fall einer euklidischen Metrik beschranken und erhalten mit 0 (~y; ~y) = 1 die Formel ([57], Theorem 2.26) Z1 i+1 (~x; ~y) = ; siH i(exp(sx); ~y)ds : 0 (4.4) Aufgrund der Fulle von Anwendungen in der Quantenfeldtheorie und Dierentialtopologie wurde einige Muhe auf die Berechnung dieser Koezienten aufgewendet. Die entsprechenden Resultate bis einschlielich des 5. Koezienten nden wir in [77]. Wir wollen diese Technik dazu benutzten, Aussagen uber die Spektraldichte zu bekommen. Wie aus der Algebra bekannt, ist die Spur einer Matrix gleich der Summe der Eigenwerte und damit von der Darstellung unabhangig. Benutzen wir nun eine geeignete Funktion des Operators, so gibt es zwischen der Spur dieses Ausdrucks und der Spektraldichte eine Beziehung. In unserem Fall enthalt die Spur des Warmeleitungskerns die Informationen uber das Spektrum von H . Zur Illustration dieses Gedankens geben wir ein Theorem von Weyl wieder. 4.1. SPEKTRALE EIGENSCHAFTEN 83 Satz 3 Seien i die Eigenwerte des kompakten, selbstadjungierten Operators H , der uber den kompakten Raum B gegeben ist. Fur t ! 0 erhalten wir folgende Formel X i e;ti = (4volt()Bn=)2 + O(t;n=2+1) fur die Laplace-Transformierte des Spektralmaes von H . Mit Hilfe eines geeigneten, positiven Maes () auf dem Spektrum konnte Karamata ([57], Theorem 2.42) die Formel lim t t!0 Z1 0 f (e;t )e;t d() = C Z1f (e;t)t;1 e;t dt ;() 0 mit den positiven Konstanten ; C sowie der auf dem Intervall [0; 1] stetigen Funktion f (x), herleiten. Durch eine geschickte Wahl der Funktion konnen wir das Integral uber die Zustandsdichte des Spektrums bestimmen, d.h. die Anzahl N () der Eigenwerte, die kleiner als sind. Satz 4 Sei N () die Anzahl der Eigenwerte von H die kleiner als sind, dann gilt (B ) n=2 N () (4)n=vol (4.5) 2 ;(n=2 + 1) : Diese Formel ist in der Tat erstaunlich, da in keiner Weise die konkrete Struktur des Operators H eine Rolle spielt. Alle Eigenwerte liegen in einer n=2-dimensionalen Kugel mit dem Radius . Die Dichte der Eigenwerte nimmt mit steigendem Wert ab. Wie aus der Diskussion der Geschwindigkeiten im Zusammenhang mit dem Spektrum (siehe Anhang B.1) ersichtlich ist, bestimmt die Dichte der Eigenwerte in starkem Mae die Geschwindigkeit. Aus der Formel (4.5) sehen wir aber, da zwischen den einzelnen, in Kapitel 2 aufgefuhrten Strategien keine groen Unterschiede bestehen konnen. Diese Aussage gilt naturlich nur fur eine Mittelung uber eine groe Klasse von Fitnessfunktionen. Im Einzelfall sind wohl Unterschiede festzustellen. Der Grund fur diese Universalitat in der Form des Spektrums liegt im Auftreten des Laplace-Operators in H . Wie wir spater sehen werden, andert sich das Verhalten der Strategie dramatisch bei einer Veranderung der Mutation. Zu genau denselben Schlufolgerungen ist Engel in seiner Diplomarbeit gelangt [78]. Dort gab er eine problemabhangige Formel fur die U bergangszeit 84 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG zu einem anderen lokalen Optimum an. Wir wollen an dieser Stelle nicht die Argumentation wiederholen, bemerken aber, da die Ursache fur die Problemunabhangigkeit dieser Formel genau durch das Resultat (4.5) gegeben ist. 4.1.2 Eigenwerte und Korrelationsfunktionen Nachdem wir die Eigenschaften des Spektrums sowie deren Einu auf die Geschwindigkeit der Strategien studiert haben, bleibt noch die Frage zu klaren, wie wir wahrend eines Simulationslaufs diese Information bekommen konnen. Die Messung der Geschwindigkeit (3.1) sowie der Fitnessvarianz (3.3) wahrend einer Simulation stellt keine Schwierigkeit dar. Gerade fur physikalische Anwendungen sind wir aber an der vollen Gestalt des Spektrums interessiert. Dazu beginnen wir mit der Anwendung der linearen Response-Theorie auf das Eigenwertproblem. Wir denieren die Groe E (t) Z E (t) = HP (x; t) dx (4.6) in Bezug auf den Operator (2.50). Da die Verteilung P (x; t) genugend schnell im Unendlichen abklingen soll, ergibt sich Z E (t) = FP (x; t) dx = hF i : (4.7) Zur Fixierung der Notation geben wir noch einmal die wichtigsten Gleichungen an. Das zeitabhangige Problem @ P (x; t) = ;HP (x; t) @t besitzt zusammen mit der Eigenwertgleichung H i(x) = i i (x) die Losung P (x; t) = 1 X i=0 e;i t i(x) : Der Operator H ist positiv, deshalb sind die Eigenwerte i auch positiv. O.B.d.A. ordnen wir die Eigenwerte entsprechend ihrer Groe 0 1 : : :. 4.1. SPEKTRALE EIGENSCHAFTEN 85 Desweiteren ergibt sich aus der Forderung nach der Normierung von P (x; t) das Verschwinden des kleinsten Eigenwertes 0 = 0. Dann besitzt die Losung das allgemeine Verhalten, da mit groer werdender Zeit die Beitrage der Eigenfunktionen zu hoheren Eigenwerten verschwinden. Im Grenzfall t ! 1 bleibt nur noch die Eigenfunktion 0 (x) zum kleinsten Eigenwert ubrig. Fur groe Zeiten konnen die Beitrage der hoheren Eigenfunktionen als kleine Storung (x; t) P (x; t) = 0 (x; t) + (x; t) angesehen werden. Fur E (t) ergibt sich dann Z E (t) = F (x)P (x; t) dx = E0 + E (t) : Nun betrachten wir die Autokorrelationsfunktion hE (t)E (t + )i der A nderungen. Aus der Denition des Warmeleitungskerns (3.10) ersehen wir, da der Operator H der Generator der Zeitverschiebung ist2. Fur die Zeitentwicklung der Storung erhalten wir dann (x; t + ) = exp((E0 ; H ) ) (x; t) (4.8) und damit fur die Autokorrelationsfunktion Z dx dx0 (H )(x; t)(H )(x0; t + ) (4.9) = exp((E0 ; E1 ) )h(E (x; t))2i + O(e(E ;E ) ) ) ; hE (t)E (t + )i = Z 0 2 wobei h i als zeitliche Mittelung verstanden wird. Fur den Eigenwert E1 erhalten wir den Ausdruck ! 1 h E ( t ) E ( t + ) i E1 = E0 ; lim (4.10) !1 ln h(E (x; t))2i : Ausgehend von diesem Resultat konnen wir nun eine Hierarchie von Korrelationsfunktionen aufstellen, die uns die anderen Eigenwerte liefert. Die Idee besteht darin, da wir nicht nur eine Zeit einfuhren, sondern gleich Vom formalen Standpunkt aus gesehen, kann die Schrodinger-Gleichung als ReaktionsDiusions-Gleichung in imaginarer Zeit angesehen werden. Damit ist die gesamte Operatortheorie der Quantenmechanik unter Berucksichtigung der Transformation t ! it auf diese Systeme anwendbar. 2 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG 86 eine geordnete Menge 0 > 1 > : : : von solchen Zeiten. Diese Zeiten wurden so gewahlt, da immer ein weiterer Eigenwert in der Zeitentwicklung der Storung auftritt, d.h. (x; t + 0 ) = exp((E0 ; H )1) (x; t) (x; t + 1) = exp((E1 ; H )2) (x; t) : Nun fuhren wir eine Autokorrelationsfunktion der Form C3(0 ; 1) = hE (t)E (t + 0 )E (t + 1 )i (4.11) ein und erhalten mittels obiger Zeitentwicklung C3(0 ; 1) = exp((E0 ; E1)0 + (E1 ; E2)1 )h(E (x; t))3i + O(e(E ;E ) )) : Eine einfache Umstellung sowie der Grenzubergang 0 ; 1 ! 1 bei xierter Dierenz 0 ; 1 fuhrt zum Ausdruck ! 0 1 C ( ; ) 0 3 0 1 E2 = ;lim!1 E0 + E1 1 ; ; ln h(E (x; t))3i ; (4.12) 1 1 1 ; const. 0 0 0 3 1 1 1= woraus leicht auf den allgemeinen Fall geschlossen werden kann. Wir nehmen also an, da die Eigenwerte E0; E1 ; : : : ; En;1 schon gegeben sind und fragen nun nach dem n-ten Eigenwert En. Dazu geben wir uns wiederum eine geordnete Menge von Zeiten 0 > 1 > : : : > n;1 vor. Wir erhalten die allgemeine Zeitentwicklung der Storung (x; t + i) = exp((Ei ; H )i) (x; t) (4.13) mit i = 0; 1; : : : ; n ; 1. Die Korrelationsfunktion Cn(0 ; 1 ; : : : ; n;1 ) = hE (t)E (t + 0 )E (t + 1 ) E (t + n;1 )i (4.14) reduziert sich auf den Ausdruck Cn(0 ; 1 ; : : : ; n;1) = exp nX ;1 i=0 ! (Ei ; Ei+1 )i h(E (x; t))ni + O(e(E ;En)n; ) ) ; woraus wir fur den n-ten Eigenwert 0 1 ! 1 C n (0 ; 1 ; : : : ; n;1 ) i En = En;1 + lim (Ei ; Ei+1) i !1 n;1 ; n;1 ln h(E (x; t))ni (4.15) i ;i const. i=0 nX ;2 +1 = 4.1. SPEKTRALE EIGENSCHAFTEN 87 erhalten. Die Abschatzung fur die Abstande i ; i+1 zwischen den Zeiten kann durch die Spektraldichte (4.5) erfolgen. Dazu wahlen wir in der Umgebung eines vorgegebenen Eigenwertes einen weiteren Eigenwert. Aus der Spektraldichte konnen wir die Wahrscheinlichkeit dafur berechnen, da dieser Eigenwert auch realisiert wird. Wie wir schon fruher festgestellt haben, verlieren die hoheren Eigenwerte im Laufe der Zeit ihre Bedeutung fur die Gesamtlosung des Problems. Bezogen auf die Formel (4.15) bedeutet dies, da die Korrelationen mit zunehmender Zeit immer schwacher werden. Der Evolutionare Algorithmus verliert wahrend des Simulationslaufs die Information uber schon erreichte lokale Optima. 4.1.3 Deformation der Fitnessfunktion In diesem Abschnitt wollen wir der Frage nachgehen, welche Auswirkungen eine kleine Deformation der Fitnessfunktion auf den Algorithmus besitzen. Dabei werden wir vor allem zeigen, da qualitativ gleich aussehende Fitnessfunktionen zu einem qualitativ gleichem Verhalten des Algorithmus' fuhren. Aus der Formel (4.4) ist ersichtlich, da die Koezienten in der Warmeleitungskernentwicklung die Funktionen der Fitnessfunktion und deren Ableitungen sind. Verandern sich die Ableitungen der Fitnessfunktion, so andert sich auch das Langzeitverhalten der Strategie grundlegend. Anschaulich konnen wir uns diese Tatsache uber die Sattelpunktsapproximation des Pfadintegrals (1.3) uberlegen. Wie schon im Kapitel 2 dargelegt wurde, bewegt sich das Maximum der Verteilung entlang der klassischen Trajektorie (1.1) ~x_ = ~v ~v_ = ;rF : Eine Deformation der Fitnessfunktion, welche die kritischen Punkte der Fitnessfunktion nicht andert, fuhrt auch zum selben qualitativen Verhalten, da die Fixpunkte dieselben sind. Nun entwickeln wir die Fitnessfunktion um den Punkt ~x0 F (~x) = F (~x0) + rF jx=x (~x ; ~x0 ) + 2 1 @ + 2 @x @x F jx=x (~x ; ~x0 )i(~x ; ~x0 )k + O((~x ; ~x0 )3 ) 0 i k 0 88 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG und setzen voraus, da dieser Punkt ein kritischer Punkt der Fitnessfunktion ist. Fur das klassische System erhalten wir in der Umgebung dieses Punktes x_i = vi 2 @ v_i = ; @x @x F jx=x (~x ; ~x0 )k : i k Wird die Umgebung dieses Punktes noch kleiner gewahlt, so reicht der lineare Term aus. Dieser Ansatz ist nur bei nicht-entarteten, kritischen Punkten anzuwenden, da sonst die Ableitung 4F verschwindet. Im Falle eines entarteten, kritischen Punktes erhalten wir ein vollig anderes Verhalten in der Umgebung von ~x0 . Das wird schon aus der unterschiedlichen Losung ersichtlich. Die Besonderheit des entarteten, kritischen Punktes ist aber die Instabilitat gegenuber Deformationen bzw. Transformationen der Fitnessfunktion. Damit tritt er als wichtiger Bifurkationspunkt in Erscheinung, der unterschiedliche Losungen voneinander separiert. Nach dieser rein klassischen Betrachtung wollen wir uns nun fragen, ob sich dieses Verhalten auf die gesamte Dynamik (2.49) ubertragt. Die Antwort lat sich einfach dadurch gewinnen, da die Storung der Fitnessfunktion eine unitare Transformation des Operators H zur Folge hat. Entsprechend [79] andern sich unter solchen Transformationen die Haufungspunkte des Spektrums nicht. Wenn wir nun noch wissen, da diese Haufungspunkte zu den Fixpunkten der Dynamik (1.1) korrespondieren, so erhalten wir: Alle Transformationen des Operators H , die durch Funktionen mit nicht-ausgearteten, kritischen Punkten erzeugt werden, erzeugen ein qualitativ gleiches Verhalten, sofern kein kritischer Punkt erzeugt wird. Die letzte Erkenntnis zeigt den groen Einu von nicht-ausgearteten Funktionen auf die Dynamik des Systems. Damit erhalten wir eine Methode, die Losungen der Gleichung (2.49) einzuteilen. 0 4.2 Konstruktion des Losungsraumes Im folgenden wollen wir uns auf die abstrakte Darstellung und Untersuchung der Strategien beschranken, wie sie in Abschnitt 2.6 dargestellt wurden. Dabei soll von der konkreten Realisierung abgesehen werden. Wir erhalten dann die Eigenschaften von Schrodinger-Operatoren in Abhangigkeit von der Form des Potentials. 4.2. KONSTRUKTION DES LOSUNGSRAUMES 89 Sei B IRn ein kompakter, n-dimensionaler Unterraum des n-dimensionalen reellen Raumes IRn, welcher auch als Phanotypraum bezeichnet wird. Weiterhin wollen wir annehmen, da der Rand von B homoomorph zur n ; 1dimensionalen Sphare S n;1 ist. Weiterhin sei eine glatte Funktion F : B ! IR uber B gegeben. Entsprechend Kapitel 2 interessiert uns die Gleichung d P (~x; t) = ;HP (~x; t) (4.16) dt mit dem positiven, selbstadjungierten Operator H 2 X (4.17) H = aij @x@@x + F (~x) : i j i;j Die formale Losung ist durch (5.3) mit dem Warmeleitungskern exp(;tH ) gegeben. Andererseits kann die Losung auch durch ein Eigenwertproblem der Form (5.4) mittels der Reihe (5.5) ausgedruckt werden. Entsprechend der Theorie der selbstadjungierten Operatoren H vom Sturm-Liouville Typ bilden die Eigenfunktionen i einen Hilbertraum L2 (B ), der gleichzeitig auch der Losungsraum von Gleichung (2.49) ist. Fur relevante bzw. praktische Probleme ist diese Darstellung der Losung schwierig zu berechnen (z.B. Doppeltopf). Deshalb suchen wir nach einer anderen Beschreibung des Losungsraumes. Andererseits kann jede glatte Funktion in einer geeigneten Umgebung eines Punktes durch eine Taylorentwicklung dargestellt werden. Nun konnten wir diese Umgebung derart wahlen, da der kubische Term der Entwicklung eine Korrektur in Bezug auf den quadratischen Term ist. Leider erweist sich dieser Weg als nicht gangbar, da wir dann eine Transformation des Operators H erhalten, die wiederum auf ein nicht losbares Problem fuhrt. Als Ausweg aus diesem Dilemma wahlen wir die stuckweise Approximation. Jede glatte Funktion kann durch eine stuckweise, quadratische Funktion approximiert werden. In welchem Sinne diese Approximation zu verstehen ist, beantwortet die folgende Denition. Denition 3 Sei F : B ! IR eine glatte Funktion mit p nicht-entarteten, kritischen Punkten x1 ; : : : ; xp und s entarteten, kritischen Punkten xp+1 ; : : : ; xp+s . In der Umgebung jedes nicht-entarteten, kritischen Punktes xl mit 1 l p vom Index r existiert nach dem Satz von Morse ein Koordinatensystem y1; : : : ; yd, so da in der Umgebung des kritischen Punktes die Funktion F durch die quadratische Funktion F (y) = F (xl ) ; (y1)2 ; : : : ; (yr )2 + (yr+1)2 + : : : + (yd)2 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG 90 dargestellt wird. Sei (Hij )jx=xl p die Hessesche Matrix der Funktion F im Punkt xl+p, der ein entarteter, kritischer Punkt ist. Der Rank dieser Matrix rk(Hij )jx=xl p = k < d ist eine Zahl k die kleiner als der maximal mogliche Rank ist. Besitzt der kritische Punkt xl+p den Index r so existiert wiederum ein Koordinatensystem y1; : : : ; yd, so da in der Umgebung des kritischen Punktes die Funktion F durch die quadratische Funktion + + F (y) = F (xl ) ; (y1)2 ; : : : ; (yr )2 + (yr+1)2 + : : : + (yk )2 dargestellt wird. Die stuckweise, quadratische Funktion f , die aus den quadratischen Funktionen um die kritischen Punkte zusammen mit der Transformation der Umgebungen Ui mit 1 i p + s ineinander derart gegeben ist, da die Funktion f stetig wird, heit quadratische Approximation. Aus der quadratischen Approximation f konnen wir mit Hilfe der Transformationen Ui ! Uj mit Ui \ Uj 6= ; einen neuen unterliegenden Raum M , der durch die Umgebungen Ui uberdeckt wird, erzeugen. Wir wollen diese Umgebungen als polynomiale Umgebung N vom Grad 2 bezeichnen, wobei der Radius der Umgebung ist. Entsprechend der Homotopietheorie gibt es eine stetige Transformation B ! M , die den Raum M der quadratischen Approximation mit dem Phanotypraum B identiziert. Im folgenden wollen wir nur noch mit der quadratischen Approximation f der Fitnessfunktion F arbeiten. Denition 4 Zwei glatte Funktionen F1 und F2 heien aquivalent, falls sie dieselbe quadratische Approximation besitzen. Diese A quivalenzrelation wird dadurch gerechtfertigt, da sich entsprechend der Sattelpunktapproximation der Wirkung (1.2) das Maximum der Verteilung auf der klassischen Trajektorie (3.6) bewegt. Auch fur die Optimierung ist die quadratische Approximation die eigentliche Information, die wichtig ist. Deshalb wollen wir im folgenden die A quivalenzklassen von solchen Funktionen F betrachten. Bevor wir das Problem (2.49) in der groten Allgemeinheit untersuchen werden, wollen wir den speziellen Fall einer polynomialen Umgebung N vom Grad 2 studieren. Dazu mussen wir die Gleichung @ P = D4P ; (F (x~ ) + rF (x~ )(~x ; x~ ) + 1 4F (x~ )(~x ; x~ )2 )P (4.18) 0 0 0 2 0 0 @t 4.2. KONSTRUKTION DES LOSUNGSRAUMES 91 betrachten. Als erstes transformieren wir die obige quadratische Funktion in eine Normalform rF (x~0 ))2 ; F (x) ! F~ (~x) = 12 4F (x~0)~x2 + 42FF((x~x~0)) ; ((4 F (x~0))2 0 die durch die lineare Transformation rF (x~0 ) x ! x~ = x + 4 (4.19) F (x~0) gegeben ist. Dadurch wird aber die prinzipielle Form der Gleichung (4.18) nicht geandert und wir erhalten mit @ P = D4P ; F~ (~x)P (4.20) @t eine Gleichung, die sowohl in den Ableitungen als auch im Ort quadratisch ist. Als nachstes wollen wir die Symmetrien der Gleichung (4.20) untersuchen. Dazu vereinfachen wir die obige Gleichung zu 0p 1 n X @ P = 4P + @X x2i ; x2k A P @t i=1 k=p+1 (4.21) und spalten die rechte Seite wie folgt auf: ! ! p n @ 2 + x2 P + X @ 2 ; x2 P : @P =X i k 2 2 @t i=1 @xi k=p+1 @xk (4.22) Die Menge der Transformationen, die (4.22) invariant lassen, wird durch die Gruppe O(p) O(n ; p) aufgespannt. Fuhren wir weiterhin eine xierte Orientierung auf N ein, so reduziert sich diese Gruppe auf G = SO(p) SO(n ; p). Die Wirkung dieser Symmetriegruppe G auf die Dierentialgleichung lat sich auf naturliche Weise auf den Losungsraum ausdehnen. Ein anderer Weg, dieses Problem zu beschreiben, ist durch eine quadratische Form 0n 1 p n X X @ P = @X p2i + x2i ; x2k A P @t i=1 i=1 k=p+1 (4.23) 92 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG uber der Algebra, die durch pk = @=@xk und xk mit [pk ; xl ] = kl erzeugt wird, gegeben. Spater werden wir diese Art der Beschreibung nutzen, um die Eigenschaften des Losungsraumes durch algebraische Relationen auszudrucken. Nun denieren wir eine oene U berdeckung des Phanotypraums B durch einen Atlas von polynomialen Umgebungen vom Grad 2 (N)i mit [ B = (N)i i2I und (N)i \ (N)j 6= ; wenn (N)i und (N)i benachbart sind. Fur jede Umgebung (N)i gibt es einen Hilbertraum der quadratisch integrierbaren Funktionen L2 ((N)i), welcher durch die Ergebnisse von Kapitel 3 bestimmt ist. Wahlen wir diesen Hilbertraum als Faser uber der Umgebung bzw. Karte, so erhalten wir ein Bundel P von Hilbertraumen. Es gilt folgendes Lemma. Lemma 1 In Bezug auf Gleichung (2.49) und die oene Uberdeckung von 2 B tragt sowohl der Losungsraum L (B ) als auch B die Struktur einer Man nigfaltigkeit mit Ubergangsfunktionen gij : (N)i \ (N)j ! (N)i \ (N)j mit (N)i \ (N)j 6= ;, die durch Gleichung (2.49) erzeugt werden. Die Abbildung P ! B L2 (B ) ist ein Isomorphismus von Hilbertraumbundeln. Beweis: Die Behauptung, da B eine Mannigfaltigkeit ist, ist trivial. Weiterhin denieren wir durch die Gleichung (2.49) erzeugte U bergangsfunktionen gij : (N)i \ (N)j ! (N)i \ (N)j . Zu diesem Zweck betrachten wir eine Zerlegung der Eins, d.h. eine Familie f g2A von Pstetigen Funktionen : X ! [0; 1] mit einem Trager supp = (N) und (x) = 1. Damit konnen wir die lokale Funktion F zur globalen Funktion F zusammenkleben. Die lokale Funktion F uber (N) ist derart deniert, da X F = F gilt. Die U bergangsfunktion gij ist nun so deniert, da Fi = gij (Fj ) fur alle x 2 (N)i \ (N)j gelten mu. Mit Hilfe der (Standard-)Gruppenwirkung der SO(n) auf B , konnen wir die U bergangsfunktion gij durch eine neue U bergangsfunktion g~ij : (N)i \ (N)j ! SO(n) ersetzen. Der Zusammenhang zwischen beiden ist einfach durch gij (x) = g~ij (x) x, wobei die Gruppenwirkung kennzeichnet, gegeben. Dadurch wird mittels der Beziehung f (x) = h(~gij x) = g(gij (x)) fur alle x 2 (N)i \ (N)j , f 2 L2 ((N)i) 4.3. DIE EIGENSCHAFTEN DES LOSUNGSRAUMES 93 und h 2 L2 ((N)j ) eine Transformation f = T (h) von Hilbertraumen erzeugt. Zu jedem Gruppenelement g 2 SO(n) gibt es eine Transformation T 2 Aut(L2 (N)), welche die Beziehung f = T (h) erfullt. Auf diese Weise haben wir ein Aut(L2(N))-Hauptfaserbundel erzeugt, das zum Hilbertraumbundel assoziiert ist. Zwei Hauptfaserbundel sind isomorph gdw. die Basisraume homotopieaquivalent sind. Wegen der Kontrahierbarkeit von B sind die entsprechenden Hauptfaserbundel zu P und B L2 (B ) isomorph und so auch die Bundel selbst. q.e.d. Im Gegensatz zu diesem Ergebnis steht die Einschrankung von P auf den Rand @B n = S n;1 von B n. Wir erhalten folgendes Lemma: Lemma 2 Die Einschrankung P j@B von P auf den Rand @B von B kann als ein nicht-triviales Bundel realisiert werden, d.h. es ist i.a. nicht isomorph zu @B L2 (@B ). Beweis: Wir betrachten wiederum das Hauptfaserbundel P zur Einschrankung P j@B mit der Strukturgruppe Gl, die der direkte Limes von Gln(IR) ist. Entsprechend Steenrod [80] sind die Isomorphismusklassen von P durch die Homotopiegruppe n;2(Gl) bestimmt. Mit Hilfe der Homotopie von LieGruppen [60, 81] sowie durch die Bott-Periodizitat [82] erhalten wir die Isomorphismen 8 > < 0 n = 0; 4; 6; 7 mod 8 n;2 (Gl) ( O ) ( O ) = ZZ n = 1; 5 mod 8 = n;2 = n+6 > : ZZ2 n = 2; 3 mod 8 mit O als direkter Limes der Gruppe der orthogonalen Transformationen. Daraus ersehen wir, da in den Dimensionen 1; 2; 3; 5 mod 8 nichttriviale Bundel auftreten konnen. q.e.d. 4.3 Die Eigenschaften des Losungsraumes Im vorherigen Abschnitt haben wir mit Hilfe einer geeigneten Zerlegung des Phanotypraums einen aquivalenten Losungsraum konstruiert, der einfacher zu untersuchen ist. Nun wollen wir die Eigenschaften dieses Raumes mit den Mitteln der algebraischen Topologie analysieren. Dabei steht der Begri der 94 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG Stabilitat\ im Mittelpunkt des Interesses. Um die Bedeutung dieses Begris "genau abzustecken, zitieren wir hier die Denition von J. Adams [83] some phenomenon is stable, if it can occur in any di" ... We orsayinthat mension, any suciently large dimension, provided perhaps that the dimension is suciently large...\ Aus der Sicht der Evolutionstheorie interessieren uns genau solche Eigenschaften, die in allen Dimensionen auftreten. Dadurch ist es moglich eine Generalisierung der Ergebnisse vorzunehmen. Nach der rein analytischen Beschreibung des Losungsraumes in Form des Hilbertraums L2 (B ) sowie der geometrischen Beschreibung in Form eines Faserbundels P wollen wir nun eine algebraische Beschreibung konstruieren deren A quivalenzklassen bzgl. der Stabilitat mit den entsprechenden A quivalenzklassen von P ubereinstimmen. Dazu fuhren wir die Weyl-Algebra ein. Denition 5 Sei V ein Vektorraum uber dem Korper K mit Basis fpi; qig i; j = 1; : : : n. Die Weyl-Algebra An ist als der Quotient der Tensor-Algebra des Vektorraums nach dem Ideal I , welches durch die Elemente pi qj ; qj pi ; ij pi pj ; pj pi qi qj ; qj qi erzeugt wird, deniert. Damit konnen wir den Hamilton-Operator H uber N, welcher durch (2.50) eingefuhrt wurde, mit Hilfe der Darstellung pi = @=@xi und qi = xi durch H=; n X p2i + Q(x) i=1 (4.24) mit Q(x) als quadratische Form angeben. Eine solche Form lat sich einfach durch eine symmetrische n n-Matrix S 2 M (n; IR) mit Werten in IR ausdrucken. Sei x = (x1 ; : : : ; xn) 2 IRn ein Vektor, so gilt Q(x) = xSxT . Im allgemeinen ist die Form Q(x) nicht diagonal. Nun betrachten wir das Bundel P (An) von Weyl-Algebren An uber B . Im folgenden sind wir an den stabilen Eigenschaften des Bundels P (An) interessiert. Gerade diese Eigenschaften spiegeln aber auch die dimensionsunabhangigen Eigenschaften von 4.3. DIE EIGENSCHAFTEN DES LOSUNGSRAUMES 95 Gleichung (2.49) wieder. Diese Idee lat sich dadurch realisieren, da wir dieselbe Eigenschaft der Gleichung sowohl im n-dimensionalen Raum B n als auch im (n + 1)-dimensionalen Raum B n+1 nden, wobei die U bertragung der Eigenschaft auf letzteren durch die Einbettung B n ,! B n+1 erfolgt. In der Bundeltheorie tritt diese "Stabilitat\ in Form einer algebraischen Bedingung auf. Dazu betrachten wir die Menge der stabilen A quivalenzklassen, die auch als K-Theorie bezeichnet wird. Fur die entsprechenden Denitionen verweisen wir hier auf die Standardliteratur [84, 85]. An dieser Stelle werden wir die allgemeine Theorie auf unseren konkreten Fall spezialisieren. Dazu bemerken wir als erstes, da die Weyl-Algebra eine reelle C -Algebra (siehe [86]) ist, d.h. Denition 6 Eine reelle C -Algebra A ist eine Banach -Algebra uber IR, welche -isometrisch isomorph zu einer bzgl. der Norm abgeschlossenen Unteralgebra der Operatoralgebra L(HIR) der linearen Operatoren auf einem reellen Hilbertraum HIR ist. Lemma 3 Zusammen mit den Involutionen p = ;p und q = q ist die Weyl-Algebra eine -Algebra. Weiterhin existiert eine Darstellung der Algebra als Unteralgebra von L(HIR) mit HIR = ff 2 L2 (IR)jf = f g, die diese Algebra zu einer reellen C -Algebra macht. Beweis: Das Ideal I der Tensoralgebra uber V ist in Bezug auf die Involution invariant, d.h. (p q ; q p ; 1) = q p ; p q ; 1 = p q ; q p ; 1 : Als nachstes konstruieren wir eine Norm aus dem Skalarprodukt des Hilbertraums HIR, welches durch h ji = Z IR (x)(x)dx deniert ist. Zusammen mit der Darstellung p = @=@x und q = x erhalten wir fur die Involution h jpi = hp ji = ;hp ji =) p = ;p h jqi = hq ji = hq ji =) q = q 96 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG und damit letztlich jjppjj = h jpp i = hp jp i = jjpjj2 jjqqjj = h jqq i = hq jq i = jjqjj2 ; die Eigenschaft einer -Algebra. Fur den zweiten Teil des Lemmas mussen wir entsprechend [87] nur zeigen, da 1 + pp = 1 ; p2 und 1 + q q = 1 + q2 invertierbar sind. Dies ist aber oensichtlich. q.e.d. Nun betrachten wir ein lokal triviales Banachraumbundel, dessen Fasern endlich erzeugte, projektive Moduln uber einer reellen, unitalen C -Algebra An: ein An-Bundel uber B , sind. Die Klassikation solcher Bundel, d.h. die Bestimmung und Charakterisierung von Isomorphismusklassen, erfolgt auf zwei Weisen. Als erstes ist die Klassikation durch die Homotopieklassen [B; BG] von Abbildungen vom Basisraum B in das universelle Bundel BG gegeben. Letzteres lat sich allgemein aus der Strukturgruppe G = Aut(An) konstruieren. Fur eine detailierte Konstruktion dieses Raumes verweisen wir auf [88]. Der zweite Zugang benutzt eine rein algebraischen Sichtweise. Dazu betrachten wir die Menge aller Schnitte ;(B; P (An))) des Bundels P (An), welche ein endlich erzeugter, projektiver C (B; An)-Modul ist. Die Menge C (B; An) bezeichnet die C -Algebra aller stetigen An-wertigen Abbildungen f : B ! An, welche im Unendlichen verschwinden. Zusammen mit der Operation bildet der projektive C (B; An)-Modul ;(B; P (An))) eine Halbgruppe. Durch die Grothendieck-Konstruktion konnen wir diese Halbgruppe zu einer Gruppe K (C (B; An)) (siehe [85, 86, 89]) erganzen, die auch als K-Theorie bezeichnet wird. Auch die Menge der Banachraumbundel ist durch die Whitney-Summe eine Halbgruppe, und die entsprechende Gruppe wird mit K (B; An) bezeichnet. Entsprechend einem Theorem von Swan [90] sind beide Gruppen isomorph zueinander. Desweiteren ist die Untergruppe K~ (B; An) von Bundeln gleicher Faserdimension isomorph zu den Homotopieklassen [B; BG] mit G = Aut(An). In unserem konkreten Fall erhalten wir unter Beachtung der Homotopieinvarianz der K-Theorie folgende Isomorphismen (siehe [91]) K (An) := K (f?g; An) = K (B n; An) Kp(An) := K (IRp; An) = K (B p; S p;1; An) = K (B p; @B p ; An) mit dem ein-punktigen Raum f?g. Die Gruppe Kp(An) bezeichnet die KTheorie der C -Algebra An (siehe [86, 89]). Die wichtigste Eigenschaft der K- 4.3. DIE EIGENSCHAFTEN DES LOSUNGSRAUMES 97 Theorie ist die Periodizitat, welche mit wichtigen Eigenschaften von CliordAlgebren im Zusammenhang steht. Entsprechend [85, 91] erhalten wir den Isomorphismus Kp(An) = Kp+8(An) : Die Gruppe K (B n; An) beschreibt die Isomorphismusklassen von An-Bundeln uber B n wahrend die Gruppe K (B n; S n;1; An) die Isomorphismusklassen solcher Bundel in Bezug auf den Rand @B n = S n;1 von B n beschreibt. Entsprechend Lemma 2 ist das Bundel uber den Rand von B in manchen Dimensionen nichttrivial, wobei auch hier eine 8er Periodizitat in der Dimension auftritt. Spater werden wir zeigen, da die Randbedingungen des Problems (2.49) die Verwendung der Gruppe K (B n; S n;1; An) anstatt K (B n ; An) rechtfertigen werden. Seien Aut(An) = Gln(An) die Automorphismen der Algebra. Mit Hilfe der Inklusion Gln(An) Gln+1(An+1) denieren wir den induktiven Limes der Automorphismusgruppe durch Gl(A). Nach [91] erhalten wir den Isomorphismus Kp(A) = p;1 (Gl(A)) = [S n;1; Gl(A)] fur den induktiven Limes A von An. Dies sind genau die stabilen Eigenschaften der Algebra. Um zu unserem Ausgangsproblem (2.49) zuruckzukommen, mussen wir uns auf die quadratischen Formen uber An konzentrieren. Dadurch konnen wir alle Hamiltonoperatoren der Form (4.24) darstellen und damit auch alle Gleichungen (4.22). Dabei spielt aber die quadratische Form, die durch die qi erzeugt wird, die entscheidende Rolle, da die von pi erzeugte Form sich nicht verandert. Sei Qn der Raum aller von qi erzeugten, quadratischen Formen. Nun kommen wir zum zentralen Begri dieses Kapitels, der eine Klassikation uberhaupt erst moglich macht: das quadratische Bundel. Ein quadratisches Bundel P (Qn) uber P (An) ist wie folgt deniert: Denition 7 Ein quadratisches Bundel P (Qn) uber P (An) ist ein lokal triviales Faserbundel mit Faser Qn, welches dieselbe Trivialisierung wie das Hilbertraumbundel P besitzt. Jeder Schnitt in P (Qn) erzeugt eine Funktion F : B n ! IR, d.h., die Menge der Schnitte ;(P (Q)) ist aquivalent zur Menge der glatten Funktionen F : B n ! IR. Wir erhalten folgendes Lemma: 98 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG Lemma 4 Fur eine feste Uberdeckung von B n mit polynomialen Nachbar- schaften N vom Grad 2 stellt das quadratische Bundel die Menge der moglichen Gleichungen (2.49) dar. Weiterhin gibt es fur eine Nachbarschaft N eine GNS-Darstellung von P (Qn)jN , so da der entsprechende Hilbertraum mit L2 (N ) ubereinstimmt. Beweis: Der Beweis besteht im wesentlichen im Einsetzen der Denitionen. Der Operator H in Gleichung (2.49) ist entsprechend der Denition in Bezug auf den Generator pi diagonal. Jeder Schnitt in P (Qn) ist lokal eine Abbildung x 2 U1 7! Q(x) 2 Qn mit der polynomialen Nachbarschaft U1. Es ist klar, da die quadratische Form Q(x) die Gestalt des Operators H vollstandig bestimmt. In Bezug auf die feste U berdeckung von Bn erhalten wir alle moglichen Gleichungen auf diesen Nachbarschaften. Der zweite Teil des Lemmas ist ebenfalls einfach zu zeigen. Auf der Algebra An und auf Qn gibt es ein naturliches positives Funktional entsprechend Lemma 3. Dieses Funktional erzeugt durch die GNS-Darstellung [86, 89] einen Hilbertraum. Die quadratischen Formen sind Bilinearformen Q(x) = xT Qx mit den Vektoren x. Wenn wir die Form Q(x) als Erwartungswert des Operators Q auassen, so kann die entsprechende Konstruktion auf den Operator H ausgedehnt werden. So erhalten wir den Hilbertraum der quadratisch, integrierbaren Funktionen. q.e.d. Damit haben wir eine rein algebraische Konstruktion des Losungsraumes erhalten. Nun wollen wir die stabilen A quivalenzklassen solcher Bundel untersuchen. Lemma 5 Sei F : B n ! IR eine xierte Funktion, die das Problem (2.49) deniert. Weiterhin seien P1 (Qn ) und P2 (Qn ) zwei quadratische Bundel zusammen mit einer Menge von polynomialen Nachbarschaften (N )1 bzw. (N)2 , die B uberdecken. Beide Bundel sind isomorph zueinander, falls beide Uberdeckungen homotop zueinander sind. Jede Aquivalenzklasse in Kn(A) ist homotopieinvariant und kennzeichnet die Isomorphieklasse eines A-Bundels. Beweis: Die Menge der Abbildungen P1(Qn) ! P2(Qn) ist durch die Menge der Schnitte im Hom(P1(Qn); P2(Qn))-Bundel gegeben (siehe [92] Satz 3.10). Sei f : (N)1 I ! (N)2 die Homotopie der Nachbarschaften mit I = [0; 1] als Einheitsintervall. Wir wahlen die Abbildung f derart, da f (:; 0)P2 (Qn) = P2(Qn) und f (:; 1)P2(Qn) = P1 (Qn) ist. Sei 4.3. DIE EIGENSCHAFTEN DES LOSUNGSRAUMES 99 : (N)1 I ! (N)1 die Projektion, dann sind die Bundel f P2(Qn) und f (:; t) P2(Qn) uber (N)1 ftg isomorph, da sie gleich f (:; t)P2(Qn) sind. Nach dem Erweiterungssatz von Tietze ist das Bundel f (:; t)P2 (Qn) auch fur eine Umgebung Ut von t isomorph uber (N)1 Ut . Die Isomorphieklasse von f (:; t)P2(Qn) ist lokal konstant und wegen des Zusammenhanges von I uberhaupt konstant. Aus der Denition des K-Funktors erhalten wir erst einmal die Homotopieinvarianz [84, 85]. Zur Konstruktion der Isomorphieklasse nutzen wir die Beziehung Kn(A) = K (B n; @B n ; A) aus. Entsprechend [88, 93] gibt es zu jeder Gruppe A ein universelles Bundel E A uber dem universellen Raum B A, welches bis auf Homotopie eindeutig ist, so da die Isomorphieklassen von quadratischen Bundeln durch die Homotopieklassen [B n =@B n; B A] = [S n; B A] = n(B A) gegeben sind. Durch die Isomorphismen [84, 85] K (B n; @B n ; A) = K (S n; A) = n(B A) ZZ erhalten wir einfach Kn(A) = n(B A) ZZ und damit sind die Isomorphieklassen von quadratischen Bundeln durch die K-Theorie gegeben. q.e.d. Wir erhalten ein ahnliches Ergebnis wie fur gewohnliche Faserbundel. Die Isomorphismusklasse fur das quadratische Bundel ergibt sich analog als KTheorie Kn(P (Q)), wobei die Strukturgruppen durch Aut(Q) mit Q als Menge der quadratischen Formen gegeben ist. Fur diese K-Theorie erhalten wir durch das folgende Lemma eine Beziehung zur Kn(A). Lemma 6 Fur die K-Gruppen erhalten wir den folgenden Isomorphismus Kp(P (Q)) = Kp(An Qn) = Kp(An) K0(Qn). Beweis: Als erstes bemerken wir, da das quadratische Bundel P (Q) zum Bundel E (q) An mit E (Q) als Bundel von quadratischen Formen E (Q) isomorph ist. Mittels des Thom'schen Isomorphismus erhalten wir fur die K-Theorie Kp(P (Q)) = Kp(An Qn). Die K-Theorie von Qn ist einfach durch K0(Qn) gegeben, die auch als Witt-Ring bezeichnet wird. Alle anderen Gruppen sind trivial. Nun betrachten wir die Spektralsequenz E2pq = 100 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG Kp(An) Kq (Qn) und Eipq = 0 fur i > 2. Wir erhalten E2pq = 0 fur q 6= 0 und damit nach den allgemeinen Eigenschaften von Spektralsequenzen [81], das Ergebnis Kp(P (Q)) = E1p0 q.e.d. = E2p0. Die Haupteigenschaft der oben denierten K-Theorie mit weitreichenden Konsequenzen fur die spatere Klassikation manifestiert sich in folgendem Satz. Satz 5 Sei nun P (Q) ein quadratisches Bundel, das durch fpi; qig erzeugt wird. Es gibt einen Isomorphismus Kp(P (Q)) = Kp+4(P (Q)) ; welcher durch das Cup-Produkt mit dem Generator von K (B 4 ; S 3; A) erzeugt wird. Beweis: Die Abbildung i : An ;! An Q2n a 7;! a 112n induziert in der K-Theorie die mod2-Abbildung i : K (An) ;! K (An Q2n) : [a] 7;! 2[a] Entsprechend [85, 91] besitzt die K-Theorie einer reellen Algebra eine Periodizitat von 8 bzw. Kp(An) = Kp+4(An) mod 2 induziert durch i . Nach [85] Theorem 2.11 wird dieser Isomorphismus durch das cup-Produkt mit dem Generator K (B 4; S 3; A) erzeugt. q.e.d. Als Konsequenz erhalten wir aus diesem Satz, da der Raum B in 4-dimensionale Unterraume aufspaltet, die unabhangig voneinander sind. Dies folgt aus der Denition der hoheren K-Gruppen zusammen mit der exakten Sequenz fur die relative K-Theorie und wir erhalten einfach Kp(An) = K (B p; @B p; An) = K (B p+4 ; @B p+4; An) = Kp+4(An) : Das bedeutet aber, da fur eine genugend groe Zahl n die stabilen A quivalenzklassen von Losungen nur von den Eigenschaften des Raumes L2 (B 4 ) abhangen. Etwas anders ausgedruckt spaltet der Losungsraum fur Gleichung (2.49) lokal immer in L2 (B 4 )-Unterraume auf. Im nachsten Abschnitt wollen wir diese stabilen Klassen in Beziehung zur Funktion F bringen. 4.4. BESCHREIBUNG DURCH STABILE FUNKTIONENKEIME 101 4.4 Beschreibung durch stabile Funktionenkeime Im vorherigen Abschnitt haben wir bewiesen, da die A quivalenzklassenbildung zu einer Aufspaltung des Raumes B in 4-dimensionale Teilraume fuhrt. Deshalb konnen wir uns auf die 4-dimensionalen Probleme beschranken. Aufgrund der A quivalenz zwischen den Schnitten von P (Q) und den Funktionen F , bleibt nun noch die Beantwortung der Frage, welche Art von Klassen die stabilen A quivalenzklassen auf dem Raum der Funktionen F implizieren. Im folgenden werden wir diese Frage mit Hilfe der Singularitatstheorie beantworten. Seien P1(Q) und P2(Q) zwei quadratische Bundel, die schon oben deniert wurden. Der Begri "stabile A quivalenz\ bedeutet nun, da es zwei triviale, quadratische Bundel n und m vom Rank n bzw. m gibt, so da die beiden Bundel P1(Q) n und P2(Q) m isomorph zueinander sind. Die Menge dieser A quivalenzklassen besitzt die Struktur einer Gruppe, die isomorph zur K-Theorie K (An Q2n ) (siehe Lemma 6 und [85, 91]) ist. Um eine Beziehung zwischen der K-Theorie und der Menge der Schnitte ;(P (Q)) herzustellen, mussen wir eine andere Beschreibungsweise dieser Menge entwickeln. Ein Element von ;(P (Q)) ist im wesentlichen ein konkretes Potential F , welches das Problem (2.49) bis auf die Randbedingungen eindeutig festlegt. An dieser Stelle wollen wir die Menge der Schnitte durch das rein algebraische Konzept der Garben und Funktionenkeime beschreiben. Diese Art der Beschreibung besitzt den entscheidenden Vorteil, da jede Funktion lokal durch ein Polynom approximiert wird, das nicht nur quadratisch sein mu. Mit dem folgenden Satz wollen wir die A quivalenzrelation auf der Menge der Schnitte angeben, die von der stabilen A quivalenz auf der Menge der quadratischen Bundel induziert wird. Satz 6 Zwischen der Pragarbe ;(P (Q)) und der Garbe On der glatten Funktionen B n ! IR gibt es einen Isomorphismus i. Sei O der direkte Limes der Garben und f; g 2 O zwei Keime mit f : B p ! IR und g : B q ! IR. Weiterhin seien P1 (Q) und P2 (Q) zwei quadratische Bundel, die zu den Keimen f und g uber den Isomorphismus i korrespondieren. Sind die beiden Bundel in Bezug auf die trivialen Bundel n und m mit p + n = q + m stabil aquivalent, dann sind die zwei Keime f; g auch stabil aquivalent, d.h. es gibt die Relation f (x1; : : : ; xp) x2p+1 : : : x2p+n = g(x1; : : : ; xq ) x2q+1 : : : x2q+m : 102 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG Beweis: Der Beweis des ersten Teils des Satzes ist eine funktorielle Kon- struktion, die in [94, 95, 96] zu nden ist. Jede Funktion lat sich durch Deformation aus einer stuckweise, quadratischen Funktion gewinnen. Das bedeutet, da wir ein quadratisches Bundel aus einem Funktionskeim f durch die entsprechende stuckweise, quadratische Funktion f~ erzeugen konnen, welche durch Lemma 5 bis auf Isomorphie eindeutig ist. Das triviale, quadratische Bundel ist durch eine global denierte, quadratische Funktion gegeben. Sind die beiden Bundel P1 (Q) und P2(Q) stabil aquivalent so konnen wir entsprechende triviale, quadratische Bundel 1; 2 addieren mit P1 (Q) 1 = P2(Q) 2. Nach Denition und vorheriger Betrachtung fuhrt dies auf die Relation f (x1; : : : ; xp) x2p+1 : : : x2p+n = g(x1; : : : ; xq ) x2q+1 : : : x2q+m ; wobei die beiden Keime f; g durch die entsprechenden quadratischen Funktionen angenahert werden. q.e.d. Als nachstes mussen wir die Homotopieeigenschaften der Bundel in eine entsprechende Beziehung zwischen den Keimen uberfuhren. Im folgenden Lemma wird genau diese Beziehung hergestellt. Lemma 7 Seien f; g 2 On zwei Keime, die zu den quadratischen Bundeln P1(Q) bzw. P2(Q) korrespondieren. Wenn P1 (Q) isomorph zu P2(Q) ist dann sind die beiden Keime durch eine lineare Funktion miteinander verbunden, d.h. f (x1 ; : : : ; xn) = g(x1; : : : ; xn) + a1 x1 + : : : + an xn mit den Konstanten a1 ; : : : ; an. Beweis: Als Folgerung aus Lemma 5 erhalten wir, da beide Bundel nur dann aquivalent sind, wenn die Anzahl der kritischen Punkte gleich ist. Andernfalls mute die Homotopie einen solchen Punkt erzeugen, was aufgrund der Denition einer festen Zerlegung nicht moglich ist. Damit bleibt nur noch die linearen Storungen als einzige Veranderung der Funktionenkeime f; g. q.e.d. Durch Betrachtung beider A quivalenzrelationen erhalten wir, da eine A quivalenzklasse von Keimen ein Polynom mindestens 3. Grades sein mu. Entsprechend [97] bildet die Menge der stabilen Funktionenkeime eine dichte Untermenge der Menge der Funktionen B n ! IR. Um diese Klassen zu 4.5. DIE KLASSIFIKATION DES LOSUNGSVERHALTENS 103 bestimmen, wollen wir von den Eigenschaften der Menge der stabilen, quadratischen Bundel ausgehen. Vom vorherigen Abschnitt wissen wir, da die Menge der stabilen, quadratischen Bundel bzgl. der Dimension des unterliegenden Raumes periodisch ist. Kennen wir die quadratischen Bundel bis Dimension 4 so konnen wir alle A quivalenzklassen von quadratischen Bundeln beschreiben. Daher mussen wir auch nur die stabilen A quivalenzklassen von Keimen bis Dimension 4 betrachten. Eine Untersuchung dieser Klassen wird uns im nachsten Abschnitt zu einer stabilen Klassikation des Problems (2.49) fuhren. 4.5 Die Klassikation des Losungsverhaltens In diesem Abschnitt wollen wir die Hauptresultate der vorherigen Abschnitte kombinieren, um die angekundigte Klassikation zu vollenden. Als erstes erhalten wir aus der Periodizitat der K-Theorie den Fakt, da wir nur einen 4-dimensionalen Raum B 4 zu betrachten brauchen. Weiterhin konzentrieren wir uns auf die stabilen Funktionenkeime B 4 ! IR, d.h. solche Keime, die der Relation von Satz 6 genugen. Nun konnten wir uns fragen, ob es fur diesen Raum der stabilen Funktionenkeime vielleicht einfach zu beschreibende Generatoren gibt. Glucklicherweise gibt es eine Klasse von Singularitaten und deren Entfaltungen, die dicht im Raum der Funktionenkeime liegen und damit die gesuchten Generatoren sind. Das Ziel dieses Abschnittes ist es, den folgenden Satz zu beweisen. Satz 7 Sei G4 der Ring der stabilen Aquivalenzklassen von Keimen B 4 ! B 4 vom einfachen Typ. Es gibt einen Isomorphismus zwischen der Sequenz von K-Theorien K(P (Q)) quadratischer Bundel uber B 4 und dem Ring G4 . Bevor wir zum Beweis dieses Satzes kommen, wollen wir zuerst den Ring G4 genauer charakterisieren. Die Menge C (B 4 ; IR) der glatten Funktionen B 4 ! IR besitzt eine naturliche durch IR induzierte Ringstruktur3. Entsprechend [97] liegen die Morse-Funktionen, als stabile Funktionen betrachtet, in der Menge dieser Funktionen dicht. Diese Klasse von Funktionen liefert aber nur eine Teilantwort auf die Frage nach einer Charakterisierung der Klassen in K(P (Q)), da die erzeugenden Funktionenkeime stabil aquivalent sind, wenn sie sich um eine Morse-Funktion unterscheiden. Was wir aber 3 Diese Menge ist sogar eine Algebra, was wir an dieser Stelle aber nicht benotigen 104 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG bei der Charakterisierung der A quivalenzklassen in K (P (Q)) vergessen haben, ist die Einbeziehung der U bergangsabbildungen. Dazu geben wir uns zwei Teilmengen U; V B 4 mit U \ V 6= ; vor. Die U bergangsabbildung g : U ! V mu ebenfalls stabil sein. Damit hat sich aber das Bild grundlegend geandert. Nun mussen wir nach den stabilen A quivalenzklassen von Funktionenkeimen g : U ! V suchen. U ber die Relation fV = fU g erhalten wir so wieder einen stabilen Keim fV aus dem Keim fU . Entsprechend [97] sind diese Abbildungen durch (x1 ; x2 ; x3; x4 ) 7! (x1 ; x2; x3 ; f (x1; x2 ; x3; x4 )) darstellbar, wobei f eine der 7 Thomschen Katastrophen ist. Bekanntlich gibt es zu jeder Singularitat den lokalen Ring dieser Singularitat. Als G4 denieren wir nun die direkte Summe aller lokalen Ringe der 7 Katastrophen. Der Satz 7 druckt dann die Tatsache aus, da es einen Ringhomomorphismus G4 ! K (P (Q)) geben mu. Da die Menge der Gleichungen (2.49) durch die Schnitte im Bundel P (Q) gegeben sind und die K-Theorie K(P (Q)) die Klassikation solcher Bundel darstellt, charakterisieren die Katastrophen in G4 das Losungsverhalten von Gleichung (2.49). Denition 8 Sei Cx1 der Ring der Funktionenkeime in x 2 B d mit der durch IR induzierten Ringstruktur. Mit Mx bezeichnen wir das maximale Ideal, d.h. die Menge der Keime, die in x verschwinden. Sei f : (B d ; x) ! (B d; y) ein Funktionenkeim. Der lokale Ring R(f ) von f ist der Quotientenring Cx1=Cx1f My . Ist die Dimension des unterliegenden Raumes d = 4, so erhalten wir entsprechend [97] die folgenden stabilen Funktionenkeime als A quivalenzklassen: Satz 8 Die einzigen stabilen Singularitaten in Dimension 4 sind auer dem parabolischen Nabel die 6 Thomschen Katastrophen. Nun haben wir alle Teile zusammen, um den Satz 7 zu beweisen. Beweis: (Satz 7) Sei P (Q) ein quadratisches Bundel zusammen mit einem System von Nachbarschaften fNig auf denen Funktionenkeime fi deniert sind. Jeder stabile Funktionenkeim auf einer Nachbarschaft ist zu einer Morse-Funktion aquivalent. Die U bergangsabbildung gij : Ni \ Nj ! Ni \ Nj verbindet die beiden Funktionenkeime fi und fj auf den Karten, d.h. es gilt fj = fi gij . Entsprechend [97] mu damit die U bergangsabbildung ebenfalls stabil sein. Andererseits ist bis auf A quivalenz jede Klasse in K (P (Q)) durch ein System fgij g von U bergangsfunktionen gegeben. Aufgrund der Periodizitat 4.5. DIE KLASSIFIKATION DES LOSUNGSVERHALTENS 105 entsprechend Satz 5 brauchen wir nur den Ring K (P (Q)) = K0 (P (Q)) K1(P (Q)) K2 (P (Q)) K3 (P (Q)) zu betrachten, da alle anderen Gruppen zu diesem isomorph sind. Sei G4 ein Ring, der die stabilen A quivalenzklassen von Funktionenkeimen B 4 ! B 4 als Generatoren besitzt. Jede Folge von U bergangsfunktionen, die ein nichttriviales quadratisches Bundel beschreiben, lassen sich aus stabilen Funktionen aufbauen. Jeder Generator einer stabilen A quivalenzklasse von Funktionenkeimen erzeugt ein nichttriviales Bundel (nach Satz 6 und Lemma 7). Damit gibt es eine Einbettung i : G4 ;! K(P (Q)) ; die jedem Generator in G4 einen Generator in K(P (Q)) zuordnet. Wir mussen nun noch zeigen, da K (P (Q)) genauso viele Generatoren wie G4 besitzt. Dazu konstruieren wir eine Abbildung k von der Weyl-Algebra Ad auf den Tangentialraum Te Hd der Heisenberg-Gruppe [91] an der Einheit. Diese Abbildung ist einfach die Identikation der Generatoren beider Gruppen. Dadurch wird ein Isomorphismus in der rationalen K-Theorie k : Ki (An) Q ! KOi(THn) Q = KOi(Hn) Q mit i = 0; 1; 2; 3 erzeugt [85, 91]. Entsprechend [91] sind die ersten 4 KGruppen durch: ( = 0; 3 KOi(Hn) = QQ2 ii = 1; 2 gegeben. Weil damit die Anzahl der Generatoren von K (P (Q)) nach Satz 8 gleich der Anzahl der Generatoren von G4 ist, mu i ein Isomorphismus sein. q.e.d. Nach diesem wichtigen Satz wollen wir nun auf die Folgerungen eingehen. Dazu bemerken wir als erstes, da jedem Schnitt im quadratischen Bundel uber B d ein Hamilton-Operator zugeordnet ist, den wir bis auf stabile A quivalenz eindeutig festlegen konnen. Um die A quivalenzklassenbildung auf den Losungsraum auszudehnen, mussen wir eine Entsprechung fur den Begri stabile A quivalenz nden. Denition 9 Zwei Dynamiken (2.49) heien aquivalent, falls die Kerne der entsprechenden Hamilton-Operatoren (2.50) durch einen Isomorphismus auseinander hervorgehen. 106 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG Als notwendige Voraussetzung fur die Existenz dieses Isomorphismus konnen wir die A quivalenz der Losungsraume der Dynamik ansehen. Dieser Losungsraum stimmt aber entsprechend Lemma 4 mit der GNS-Darstellung des quadratischen Bundels uberein. Weiterhin wollen wir bemerken, da der Kern durch alle Verteilungen erzeugt wird, die sich um die kritischen Punkte von F konzentrieren. Die Bifurkationen von F sind nichts weiter als die Singularitaten und deren Entfaltungen. Wir erhalten die folgende Schlufolgerung. Schlu"sfolgerung 1 Die Aquivalenzklassen von Dynamiken (2.49) sind durch den Ring G4 gegeben. Beweis: Jeder Losungsraum der Dynamik korrespondiert auf eindeutige Art und Weise zur GNS-Darstellung eines Schnitts in einem quadratischen Bundel P (Q). Sind die kritischen Punkte von F fur 2 Hamiltonoperatoren gleich, so sind die Kerne aquivalent. Die dimensionsunabhangigen Eigenschaften der Dynamik korrespondieren zu den stabilen Klassen in K(P (Q)) (nach Lemma 4 und 5). Nach Satz 7 erhalten wir daraus die Beziehung zu den stabilen Funktionenkeimen, wodurch der Kern des Operators ebenfalls festgelegt ist. q.e.d. Am Ende wollen wir noch die konkreten Ausdrucke fur die stabilen Funktionenkeime unter Berucksichtigung von Lemma 7 angeben. Dazu wahlen wir fur den Hamilton Operator aij = ij und bi = 0, d.h. wir benutzen die euklidische Metrik. Dann erhalten wir die Schlufolgerung. Name der Katastrophe Formel Falte Spitze Schwalbenschwanz Schmetterling hyperbolischer Nabel elliptischer Nabel Dimension Raum Parameter x31 + u1x1 1 1 4 2 x1 + x2 x1 + u1x1 2 1 5 3 2 x1 + x2 x1 + x3 x1 + u1x1 3 1 x61 + x2 x41 + x3 x31 + x4 x21 + u1x1 4 1 3 3 x1 + x2 + x3 x1 x2 3 2 ;u1 x1 ; u2x2 x31 ; x1 x22 + x3 (x21 + x22 ) 3 2 ;u1 x1 ; u2x2 Schlu"sfolgerung 2 Die Realisierung von G4 ist durch die Funktionen in Tabelle 4.5 gegeben. Jede Aquivalenzklasse von Funktionen F (aquivalent im Sinne der Denition 4) in (2.50) lat sich in eine Folge dieser Funktionen zerlegen, die eindeutig die Aquivalenzklasse der Dynamik festlegen. 4.5. DIE KLASSIFIKATION DES LOSUNGSVERHALTENS 107 Beweis: Entsprechend [97] und Satz 7 gibt es 6 generische Abbildungen der Form gij : (x1 ; x2 ; x3; x4 ) ! (x1 ; x2 ; x3; f (x1; x2 ; x3; x4 )) fur die U ber- gangsabbildungen, die zusammen mit den Morse-Funktionen auf jeder Karte des quadratischen Bundels die Funktion F von (2.50) erzeugen. Als Beispiel betrachten wir die Singularitat x3 und deren Entfaltung x3 + xy. Diese Abbildung tritt als generische Abbildung einer 2-Mannigfaltigkeit auf sich auf und wird als Falte bezeichnet. Nach Lemma 7 kann y keine Koordinate, sondern nur ein Parameter sein. Damit erhalten wir die erste Funktion x3 + u1x aus 4.5. Auf analoge Art ergeben sich die anderen Ausdrucke. Weiterhin liegen diese Funktionen im Raum der Funktionen B 4 ! B 4 dicht, d.h. jede Funktion g liegt in einer Umgebung von einer Folge dieser Funktionen bezuglich der Whitney-Topologie von C (B 4 ; B 4). Durch Komposition f g mit einer Morse-Funktion erhalten wir das Ergebnis. q.e.d. Damit haben wir die Klassikation abgeschlossen. Danach verhalten sich zwei Dynamiken der Form (2.49) mit aij = ij und bi = 0 gleich, wenn die Funktionen F die gleiche Folge von Funktionen aus Tabelle 4.5 besitzen. Damit ist das Verhalten der Darwin-Strategie durch die Funktionen aus Tabelle 4.5 klassiziert. Sie liefern auch die Antwort auf die Frage, welche Fitnessfunktionen in einem Optimierungsproblem die schwierigen Falle darstellen. 108 KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG Kapitel 5 Die Klassikation der Strategien \Zu oft wird in der Physik der Zustandsraum als ein linearer Raum gewahlt, obwohl die nichtlineare Struktur des Problems in naturlicher Weise auf eine Mannigfaltigkeit als Zustandsraum fuhrt. Das erschwert die mathematische Behandlung." Stephen Smale 5.1 Der Weg zur Klassikation Am Anfang dieses Kapitels wird ein kurzer Ausblick auf die wichtigsten Ideen und Resultate des letzten Abschnitts gegeben, wobei wir uns eng an die Arbeit [98] halten. Das hauptsachliche Ziel besteht darin, die folgende Frage zu beantworten: Was ist ein schwieriges Problem fur die Strategie? Dazu betrachten wir die Darwin-, Boltzmann- und Gemischte Strategie in einem kontinuierlichen Suchraum B d der Dimension d. Eine Zusammenstellung der entsprechenden Untersuchungen zu diesen 3 Strategien kann in den Kapiteln 2 und 3 gefunden werden. In [41] wurden sowohl die Boltzmann-Strategie als auch die Darwin-Strategie auf eine einheitliche Grundlage gestellt. Beide Strategien konnten nach entsprechenden Transformationen auf die Gleichung d P (~x; t) = ;HP (~x; t) (5.1) dt 109 110 KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN zuruckgefuhrt werden, wobei H ein positiv deniter, selbstadjungierter Operator der Form 2 X X H = aij @x@@x + bi @x@ + F (~x) (5.2) i j i i;j i ist und F (~x) die Fitnessfunktion F : B ! IR uber den Raum B darstellt. Als formale Losung ergibt sich P (~x; t) = exp(;tH )P (~x; 0) (5.3) mit exp(;tH ) als Warmeleitungskern. Andererseits konnen wir die Losung von (2.49) uber die Eigenwerte des Operators H (siehe Kapitel 2 und Anhang B.1) darstellen, d.h. Hi(~x) = ii(~x) ; (5.4) woraus sich die Losung P (~x; t) = X i i(~x) exp(;i t) (5.5) ergibt. Im letzten Abschnitt von Kapitel 2 nden wir auch die entsprechenden Transformationen um alle anderen Strategien auf die oben beschriebene Form zuruckzufuhren. Wie sich schon im letzten Abschnitt des vorherigen Kapitels andeutete, sind die entarteten Punkte fur das Verstandnis der Dynamik sehr wichtig. Diese Punkte sowie die zugehorigen Funktionen lassen sich als Bifurkationen der Dynamik (5.1) bezuglich der Fitnessfunktion verstehen. Vom abstrakten Standpunkt aus gesehen sind alle Dynamiken dieses Typs eindeutig durch die Fitnessfunktion bestimmt. Wir interessieren uns nun fur die A quivalenzklasse von Fitnessfunktionen, so da die Dynamik in allen Dimensionen ein ahnliches Verhalten aufweist. Eine genauere Denition dieser A quivalenzrelation werden wir spater geben. Die Herangehensweise ist die folgende: Als erstes wird die Struktur des Losungsraumes untersucht, da hier die Eigenschaften der Dynamik kodiert sind. Durch die verschiedenen Arten der Beschreibung erhalten wir sowohl eine geometrische Beschreibung uber Kartenzerlegungen als auch eine rein algebraische Beschreibung uber quadratische Formen. Es wird sich zeigen, da auf dem Losungsraum eine Periodizitat existiert, die zu einer Einteilung des Raums der Fitnessfunktionen fuhrt. Durch diese Einteilung der Fitnessfunktionen wird die Klassikation erhalten. Bevor wir mit 5.1. DER WEG ZUR KLASSIFIKATION 111 die mathematischen Satze des letzten Kapitels anwenden, wollen wir diese zwei Schritte im Beweis etwas genauer erklaren. Entsprechend der Sturm-Liouville Theorie bilden die Eigenfunktionen i(~x) einen Hilbertraum, der gleichzeitig der Losungsraum der Gleichung (2.49) ist. Leider hat dieser Losungsraum einen entscheidenden Nachteil: Um ihn zu bestimmen mussen wir das vollstandige Eigenwertproblem (5.4) losen. Fur die meisten Probleme ist das aber nicht moglich, und wir mussen uns eine praktikablere Beschreibung fur diesen Losungsraum uberlegen. Wir bemerken dazu, da jede hinreichend glatte Fitnessfunktionen (Potentiale) F (~x) immer in eine Potenzreihe F (~x) = F (x~0) + rF (x~0)(~x ; x~0 ) + 12 4F (x~0(~x ; x~0 )2 + : : : (5.6) entwickeln werden kann. Sei weiterhin der Phanotypraum B IRn eine ndimensionale kompakte Untermenge des IRn mit @B homoomorph zu S n;1. Dann nden wir eine Zerlegung von B in oene Untermengen Ui , so da F (~x) ein Polynom vom Grad p ist (naturlich bis auf einen kleinen Fehler). Die Untermengen Ui und Uj , die benachbart sind, mussen sich uberlappen, d.h., wir erhalten eine oene U berdeckung von B mit Karten Ui. Es ist klar, da diese Zerlegung vom Grad des Polynoms abhangt. Fur die Konstruktion des Losungsraumes wahlen wir p = 2, da wir dann eine explizite Losung fur das Eigenwertproblem (5.4) bzw. fur die gesamte Gleichung (2.49) besitzen. Dadurch bekommen wir uber jeder Karte Ui einen Hilbertraum L2 (Ui). Aufgrund der U berlappung zwischen zwei Karten sind diese Hilbertraume nicht unabhangig voneinander. Man kann nun zeigen, da der Losungsraum eine Blatterung uber B mit den Hilbertraumen L2 (Ui) als Blattern ist. Abbildung 5.1 zeigt eine Beispielsituation. Wir wollen nun die Grundidee fur die Klassikation vorstellen. Sei F die oben beschriebene Blatterung und fUigi2I die oene U berdeckung von B . Wir betrachten 3 Karten Ui, Uj und Uk mit Ui \ Uj \ Uk 6= ; (siehe Abbildung 5.2). Auf jeder Karte ist die Losung des Problems bekannt, aber die gegenseitige Beziehung zwischen den Losungen ist noch nicht klar. Dazu wahlen wir eine Transformation von einer Karte zur anderen, die auch als U bergangsabbildung bezeichnet wird. Bezeichne Uij den U berlapp Ui \ Uj zwischen Ui und Uj . Die Verklebung zweier Teillosungen auf den Karten erfolgt durch die Festlegung einer Funktion gij : Uij ! GL(n; IR) (analog fur die anderen Kartenubergange) auf die Gruppe der linearen Transformationen. Aufgrund der Gruppenstruktur der GL(n; IR) mu gij = gik gkj gelten. KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN 112 2 L (Ui ) Ui Uj 2 L (Uj ) Abbildung 5.1: Blatterung uber B Uj Ujk Uk Uijk Uij Uki Ui Abbildung 5.2: Darstellung von 3 Karten in B 5.1. DER WEG ZUR KLASSIFIKATION 113 Wir bemerken, da die Wahl der Gruppe keine Einschrankung darstellt, da wir immer noch die Freiheit haben, auf die Karten noch beliebige dierenzierbare Kartentransformationen anzuwenden. Wir sprechen von einer trivialen Transformation gij , wenn zwei Funktionen fi : Ui ! GL(n; IR) und fj : Uj ! GL(n; IR) existieren, so da gij = fi;1fj gilt. Dann sind namlich die beiden Losungen auf den Karten voneinander unabhangig. Die Menge der nichttrivialen Transformationen gij wird mit H 1(fUigi2I ; GL(n; IR)) bezeichnet und heit 1. C echsche Kohomologie mit Werten in GL(n; IR). Mittels algebraischer Methoden (K-Theorie [84], rationale Homotopietheorie [99]) kann diese Menge untersucht werden (siehe z.B. [100] fur die Verbindung zu Fredholm-Operatoren). Entscheidend ist nun die Tatsache, da wir lokal den Operator H als quadratische Form darstellen konnen, und die Losungen des Operators eng mit dieser Darstellung verknupft sind. Die stabile Klassikation dieser lokal denierten, quadratischen Formen erzeugt eine Einteilung des unterliegenden Raumes in 4-dimensionale Teilraume. Da jeder Operator durch die Wahl der Fitnessfunktion gegeben ist, ubertragt sich diese Einteilung auf den Raum der Fitnessfunktionen. Das bedeutet aber, da wir eine Aufspaltung der Fitness in der Form: F (x1; : : : x8 ) ;! F~ (x1 ; : : : ; x4 ) + F~ (x5 ; : : : ; x8) und damit eine Zerlegung des Eigenwertproblems (5.4) in zwei 4-dimensionale Probleme erhalten. Um die Klassikation abzuschlieen, mu nun noch die Abhangigkeit des Eigenwertproblems von einer 4-dimensionalen Fitness untersucht werden. Dazu stellen wir erst einmal fest, da eine zweimaldierenzierbare Transformation des Operators H zu einer stetigen A nderung des Spektrums fuhrt. Der Laplace-Operator andert dabei das Verhalten nicht so sehr wie die Fitness F (~x). Wie ist nun aber der Raum der Fitnessfunktionen, d.h. der Raum der Funktionen B ! IR, aufgebaut? Die Antwort lat sich mit der Singularitatstheorie [97] geben: Der Raum wird durch 6 Thomsche Katastrophen aufgespannt (Thom-Boardman-Stratizierung), d.h. diese Katastrophen liegen dicht im Raum der Funktionen IR4 ! IR. Wir erhalten diese 6 Katastrophen als die stabilen A quivalenzklassen von Funktionen IR4 ! IR4 , die sich als (x1 ; x2; x3 ; x4) ! (x1 ; x2 ; x3; F (x1; x2 ; x3 ; x4)) darstellen lassen. Als Schlufolgerung aus den mathematischen Betrachtungen des letzten Kapitels erhalten wir: Zwei Dynamiken (5.1) sind aquivalent, falls die Kerne der Schrodinger- 114 KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN Operatoren durch eine lineare Transformation auseinander hervorgehen. Die Aquivalenzklassen von Darwin-Strategien enthalten als Generatoren die 6 Katastrophen aus Tabelle 5.2. Zwei aquivalente Fitnessfunktionen (im Sinne der Denition 4, Kapitel 4) die aus den gleichen Katastrophen bestehen, erzeugen aquivalente Dynamiken. Die weiteren Schlufolgerungen aus den mathematischen Ergebnissen des letzten Kapitels werden in den folgenden Abschnitten gezogen. 5.2 Die Klassikation der Darwin-Strategie Im folgenden wollen wir uns auf die Darwin-Strategie beschranken. Danach gehen wir noch kurz auf die anderen Strategien vom Typ (5.1) ein. Andere Mutationen mit groerer Schrittweite werden spater behandelt, da sie eine andere Methodik erfordern. Sei B IRn ein kompakter, n-dimensionaler Unterraum des n-dimensionalen reellen Raumes IRn, welcher auch als Phanotypraum bezeichnet wird. Weiterhin wollen wir annehmen, da der Rand von B homoomorph zur n ; 1dimensionalen Sphare S n;1 ist. Die glatte Funktion F : B ! IR ist die Fitnessfunktion des Optimierungsproblems. Entsprechend Kapitel 2 lassen sich die bisherigen Strategien auf einheitliche Art und Weise durch die Gleichung (5.1) mit dem positiven, selbstadjungierten Operator H (5.2) beschreiben. Die formale Losung ist durch (5.3) mit dem Warmeleitungskern exp(;tH ) gegeben. Andererseits kann die Losung auch durch ein Eigenwertproblem der Form (5.4) mittels der Reihe (5.5) ausgedruckt werden. Entsprechend der Theorie der selbstadjungierten Operatoren H vom Sturm-Liouville Typ bilden die Eigenfunktionen i einen Hilbertraum L2 (B ), der gleichzeitig auch der Losungsraum von Gleichung (2.49) ist. Fur relevante bzw. praktische Probleme ist diese Darstellung der Losung schwierig zu berechnen (z.B. Doppeltopf). Deshalb suchen wir nach einer anderen Beschreibung des Losungsraumes. Vom vorherigen Kapitel wissen wir, da die quadratische Fitnessfunktion ein exakt losbares Problem darstellt. Andererseits kann jede glatte Funktion in einer geeigneten Umgebung eines Punktes durch eine Taylorentwicklung dargestellt werden. Nun konnten wir diese Umgebung derart wahlen, da der kubische Term der Entwicklung eine Korrektur in Bezug auf den quadratischen Term ist. Leider erweist sich dieser Weg als nicht gangbar, da wir dann eine Transformation des Operators H erhalten, die wiederum auf ein nicht losbares Problem fuhrt. Als Ausweg aus diesem Di- 5.2. DIE KLASSIFIKATION DER DARWIN-STRATEGIE 115 lemma wahlen wir die stuckweise Approximation. Jede glatte Funktion kann durch eine stuckweise, quadratische Funktion approximiert werden. Die entsprechende Denition 3 im Kapitel 4 klart genau die Frage, in welchem Sinne diese Approximation zu verstehen ist. Jetzt konnen wir sozusagen als "Ersatz\ fur unseren alten Phanotypraum B einen neuen Raum M konstruieren, der nur die kritischen Punkte der Fitnessfunktion einschlielich einer kleinen Umgebung um diese enthalt. Diese Information ist aber genau die wichtige Information fur die Optimierungstheorie. Deshalb wollen wir die folgende A quivalenzrelation einfuhren (siehe Denition 4 Kapitel 4). Denition 10 Zwei Fitnessfunktionen F1 und F2 heien aquivalent, falls sie dieselbe quadratische Approximation besitzen. Als weiteren Schritt erhalten wir aus der Periodizitat der K-Theorie den Fakt, da wir nur einen 4-dimensionalen Raum B 4 zu betrachten brauchen. Weiterhin konzentrieren wir uns auf die stabilen Eigenschaften der Losung, d.h. diejenigen Eigenschaften, welche in allen Dimensionen vorkommen. Als mathematisch aquivalente Formulierung erhalten wir das Problem, die stabilen Funktionenkeime B 4 ! B 4 zu betrachten. Entsprechend [97] sind dies die folgenden stabilen Funktionenkeime (siehe Satz 8): Die einzigen stabilen Singularitaten in Dimension 4 sind auer dem parabolischen Nabel die 6 Thomschen Katastrophen. Satz 7 kombiniert nun die Aussage uber die stabilen Funktionenkeime mit den Eigenschaften der Dynamik (5.1). Um diese Aussage nicht nur abstrakt zu belassen, wollen wir noch ein physikalisches Argument angeben, das dieses Ergebnis plausibel erscheinen lat. Dazu betrachten wir die Gleichung (2.49) mit dem Operator H = ;4 + F und konstruieren als Losung das Pfadintegral 0 Z 1 P (~x; t) = D~x exp @; (x_ 2 + F )dnxA : Z B (5.7) Vom mathematischen Standpunkt betrachtet, existiert dieses Integral nicht, da das Ma Dx nicht richtig deniert ist. Im folgenden sowie in den vorangegangenen Betrachtungen haben wir mit diesem Integral immer die formale Approximation durch eine Diskretisierung gemeint. In diesem Sinne konnen wir durch die Sattelpunktsapproximation zeigen, da der grote Beitrag zu 116 KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN diesem Integral durch den Pfad d2 ~x = ;rF (~x) (5.8) dt2 erbracht wird. Damit erhalten wir ein Gradientensystem, welches gleichzeitig das Standardbeispiel fur Thom's Katastrophentheorie ist. Doch nun zuruck zum konkreten Aussehen der Thomschen Katastrophen. Im Gegensatz zu Thom betrachten wir keine Entfaltungen, d.h., wir teilen nicht die Variablen in Parameter und Ort auf. Stattdessen betrachten wir bis auf die linearen Terme alle Parameter auch als Ortsvariable. Betrachtet man z.B. die Entfaltung x3 ; ux der Katastrophe x3 , so bleibt u ein Parameter wahrend im Fall des Doppeltopfs x4 ; yx2 die Variablen x; y einen Ort bezeichnen. Dadurch ergeben sich Katastrophen in 1,2,3 und 4 Dimensionen. Andererseits kann die zweidimensionale Katastrophe x4 ; yx2 auch in 4 Dimensionen auftreten. Dazu mussen einfach die anderen Richtungen durch quadratische Terme "aufgefullt\ werden (stabile A quivalenz in der Singularitatstheorie). Wegen der Einfachheit geben wir noch einmal die einzelnen Falle an. Name der Katastrophe Formel Falte Spitze Schwalbenschwanz Schmetterling hyperbolischer Nabel elliptischer Nabel Dimension Raum Parameter x31 + u1x1 1 1 4 2 x1 + x2 x1 + u1x1 2 1 x51 + x2 x31 + x3 x21 + u1x1 3 1 6 4 3 2 x1 + x2 x1 + x3 x1 + x4 x1 + u1x1 4 1 3 3 x1 + x2 + x3 x1 x2 3 2 ;u1 x1 ; u2x2 x31 ; x1 x22 + x3 (x21 + x22 ) 3 2 ;u1 x1 ; u2x2 Damit konnen wir die Hauptaussage dieses Kapitels treen: Zwei Fitnesslandschaften (aquivalent mittels Denition 4 und 10) sind bzgl. der Darwin-Strategie gleich, falls sie aus genau denselben Katastrophen in Tabelle 5.2 bestehen. Evolutionare Algorithmen lassen sich durch die Katastrophentheorie bzgl. ihres Verhaltens klassizieren. Um eine Vorstellung von der Form der Fitnessfunktionen zu bekommen, wollen wir noch kurz auf diese Katastrophen eingehen. In Abbildung 5.3 sind 5.3. DIE AUSDEHNUNG DER KLASSIFIKATION 117 die einzelnen Falle dargestellt, wobei die Darstellung der hoherdimensionalen Katastrophen (ab Dimension 3) durch Projektion auf 2 Dimensionen erhalten wurde. Die ersten beiden Falle (Falte und Spitze) stellen die einfachste Form einer Fitnessfunktion dar, bei der die Strategie eine Barriere uberspringen mu. Diese Art von Problemen tritt in vielen Fallen am haugsten auf (z.B. Rastriginfunktion). Desweiteren konnen naturlich Probleme existieren, welche die lokal arbeitende Strategie "tauschen\. So folgt der Algorithmus in den meisten Fallen der Richtung, die die grote Verbesserung verspricht. Das kann aber genau die falsche Richtung sein, wenn wir das globale Optimum nden wollen. In diese zweite Klasse von Problemen fallen die anderen Falle. Sie reprasentieren die einfachsten Moglichkeiten fur solche "irrefuhrenden\ Probleme. 5.3 Die Ausdehnung der Klassikation Die im vorherigen Abschnitt beschriebene Klassikation wurde nur fur den Fall einer Darwin-Strategie dargelegt. An dieser Stelle konnen wir uns naturlich fragen, ob eine Ausdehnung auf die anderen Strategien moglich ist. In diesem Abschnitt werden wir zeigen, in welchem Sinne diese Frage zu beantworten ist. Dazu erinnern wir an den Abschnitt 2.6, wo die einheitliche Beschreibung aller Strategien auf der Basis von Gleichung (2.49) ausgefuhrt wurde. Dabei erhielten wir explizite Formeln fur die Transformation der Metrik sowie der Fitnessfunktion. Die Frage ist nun, ob wir diese Ergebnisse verwenden konnen, um die Klassikation auch auf diese Falle auszudehnen. Dazu schauen wir noch einmal auf den Beweis. Dort wurde das Problem in viele Teilprobleme aufgeteilt, deren gegenseitige Beziehung untersucht wurde. Das Problem der verschiedenen Metrik kann einfach durch die Tatsache gelost werden, da jede Metrik zumindest lokal diagonal und konstant ist. Deshalb erhalten wir lokal wieder eine quadratische Form uber der Weyl-Algebra als Reprasentant des Operators (2.50). Auch der Vorfaktor vor der Losung der Gleichung (2.49) stort die weitere Argumentation nicht. Als einziger Unterschied bleibt nur die Transformation der Fitnessfunktion. Dadurch entstand in allen Fallen wieder eine Gleichung vom Typ einer Darwin-Strategie, fur die die Klassikation gilt. Damit erhalten wir aber genau die Regel, um die obige Klassikation auf alle Strategien auszudehnen. Betrachten wir als 118 KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN 4 2 0 -2 -4 -2 -3 -1 -2 -1 0 0 y x 1 1 2 3 Falte 2 3 2 1 0 5 -1 4 3 2 -2 -3 1 -2 -1 Spitze 0 x y 0 -1 -2 2 -3 1 4 2 0 5 -2 4 3 2 1 -4 -2 -1 0 x 0 -1 -2 -3 2 1 Schwalbenschwanz 15 10 5 0 -5 -10 -15 5 4 3 2 1 y 0 -1 -2 -3 -2 -1 0 x 1 2 y 5.3. DIE AUSDEHNUNG DER KLASSIFIKATION 119 Beispiel die transformierte Fitness der Boltzmann-Strategie (2.10) 2 V (~x) = 4 DrF rF ; 2 D4F : Dieser Ausdruck mu nun gleich einer Katastrophe sein. Durch Losung der Dierentialgleichung erhalten wir die Fitnessfunktion als Losung. So kann fur jede Strategie eine Liste von solchen Normalformen aufgestellt werden. Eine Besonderheit sei hier noch angemerkt. Bei den adaptiven Strategien war zusatzlich eine Transformation der Metrik erforderlich. Die Katastrophen gehen aber von einer euklidischen Metrik aus. Deshalb mussen die Katastrophen in diesem Fall auf die neue Metrik transformiert werden und dann gleich der transformierten Fitness gesetzt werden. 120 KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN Kapitel 6 Variation der Mutationsverteilung \Gibst du auf die kleinen Dinge nicht acht, wirst du Groeres verlieren. " Menander 6.1 Einfuhrung In den bisherigen Algorithmen zur Simulation von Evolutionaren Algorithmen mute immer eine Nebenbedingung eingebaut werden, welche die Diusionsnahrerung sicherstellt. Wenn man diese Bedingung fallenlat, so wechselt auch die Beschreibung des Algorithmus'. Wir erhalten anstatt einer partiellen Dierentialgleichung 2.Ordnung vom parabolischen Typ eine IntegroDierentialgleichung, die die kontinuierliche Verallgemeinerung der Mastergleichung darstellt. Als erstes betrachten wir einen Proze der Form x(t + t) = x(t) + ; (6.1) wobei eine Zufallszahl, die entsprechend der Verteilung N (x) gezogen wurde, ist. Diesen Zufallsproze wollen wir im folgenden so wahlen, da wir den Proze "Mutation\ erhalten. Da Mutationen ungerichtet sind, mu die Verteilung isotrop sein, d.h. fur den Prozesse (6.1) x = x(t) ! x(t + t) = x0 erhalten wir als U bergangsrate den symmetrischen Ausdruck W (x; x0 ) = 121 122 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG W (x ; x0) = N (jx ; x0 j) = W (x0; x). Die Beschreibung dieses Prozesse im Bild der Verteilungsfunktion P (x; t) fuhrt entsprechend [4] zur Mastergleichung @ P (x; t) = Z W (x ; x0 )(P (x0; t) ; P (x; t))dx0 : (6.2) @t Die Losung P (x; t) einer solchen Gleichung kann auf zweierlei Art erfolgen. Als erstes erhalten wir durch eine Laplace-Transformation der Zeitvariablen eine inhomogene Fredholmsche Integralgleichung 2.Art Z sP~ (x; s) ; P (x; 0) = W (x ; x0 )(P~ (x0 ; s) ; P~ (x; s))dx0 ; (6.3) wobei P~ (x; s) die transformierte Verteilung bezeichnet. Andererseits wird durch eine Fourier-Transformation der x-Variablen die Mastergleichung in eine gewohnliche Dierentialgleichung umgewandelt. Um dieses Resultat herzuleiten, bemerken wir, da wir die Gleichung (6.2) auch in die Form @ P (x; t) = (W P )(x; t) ; P (x; t) Z W (x)dx (6.4) @t unter zu Hilfenahme der Faltung Z (W P )(x; t) = W (x ; x0)(P (x0; t)dx0 umschreiben konnen. Bezeichnen wir die Fouriertransformierte einer Funktion F (x) mit F^ (k), so erhalten wir @ P^ (k; t) = W^ (k)P^ (k; t) ; W P^ (k; t) (6.5) @t R mit W = W (x)dx und daraus die Losung P^ (k; t) = P^ (k; 0) exp (W^ (k) ; W )t : (6.6) Das Problem bei diesem Ansatz besteht nur darin, da wir die Rucktransformation nden mussen. Bevor wir uns diesen Rechnungen zuwenden wollen, werden wir noch den umgekehrten Fall behandeln. Dazu geben wir uns eine Verteilungsfunktion P (x; t) vor und fragen nach der U bergangsrate W (x). Durch die Fourier-Transformation der Mastergleichung konnen wird dieses Problem auf 6.1. EINFUHRUNG 123 einfache Art und Weise losen. Sei F ( ) die Bezeichnung fur die FourierTransformation, so erhalten wir 0 @ 1 F P W (x) = F ;1 @ F (@tP ) A (x) (6.7) als Losung des Problems. Betrachten wir nun noch zwei Beispiele zur Illustration. Beim ersten Beispiel geben wir uns die Gau-Verteilung 2 ! 1 x P (x; t) = p exp ; 4Dt 4Dt vor und erhalten fur die Fourier-Transformierte der U bergangsrate F (W )(k) = ;Dk2 : Durch die Rucktransformation @ 2 (x) W (x) = D @x 2 dieses Ausdrucks erhalten wir fur die Mastergleichung @ P (x; t) = D @ 2 P (x; t) : @t @x2 Im zweiten Beispiel wollen wir uns der Cauchy-Verteilung 1 P (x; t) = t x2 + t2 zuwenden. Dieselbe oben beschriebene Prozedur fuhrt uns auf die Mastergleichung @ P (x; t) = Z P (x0; t) ; P (x; t) dx0 ; @t (x ; x0 )2 die nun eine singulare Integralgleichung geworden ist. Die Auswahl der Beispiele ist kein Zufall, da beide Verteilungen eine groe Rolle in der Theorie stochastischer Prozesse spielen. Nach dem Satz von Moivre-Laplace [101], der auch als zentraler Grenzwertsatz bezeichnet wird, ist die Grenzverteilung einer Folge von zufalligen Ereignissen unter bestimmten Voraussetzungen die 124 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG Gau-Verteilung. Levy erweiterte 1925 [102] die Grenzwertsatze auch auf Verteilungen, deren Momente nicht zu existieren brauchen. Er betrachtete eine Folge von Zufallsvariablen, die einer bestimmten Verteilung genugen. Der Grenzwert dieser Folge bzw. die Grenzverteilung existiert wiederum nur unter bestimmten Bedingungen. Levy mute dabei den Begri der stabilen Verteilung einfuhren. Die Gau- und die Cauchy-Verteilung sind stabile Verteilungen. Desweiteren gehort jede stabile Verteilung zum "Anziehungsbereich\ der Gau- oder Cauchy-Verteilung, d.h., eine Folge dieser Verteilungen konvergiert gegen die Gau- oder Cauchy-Verteilung. Vom Standpunkt der Grenzverteilungen her gesehen, gibt es also nur zwei Moglichkeiten. Nach diesem kleinen Exkurs in die Theorie stochastischer Prozesse wollen wir uns nun der Losung der Mastergleichung unter Einbeziehung der Prozesse "Reproduktion\ und "Selektion\ zuwenden. 6.2 Gau-verteilte Mutationen Im folgenden wollen wir annehmen, da die Mutationen durch Gau-verteilte U bergange gegeben sind. Die Unabhangigkeit der Mutation von den Prozessen Reproduktion und Selektion bzgl. einer Fitness F (x) erlaubt die Addition der entsprechenden Raten zur Mutationsrate. Wir wollen an dieser Stelle auf die Herleitung der Gleichung verzichten, da sie analog zu den Rechnungen in Kapitel 2 ist. Als Ergebnis erhalten wir @ P (x; t) = (hF i ; F (x))P (x; t) + Z N (x ; x0 ; )(P (x0; t) ; P (x; t))dx0(6.8) @t mit 2! x 1 N (x; ) = p exp ; 42 4 als Gau-Verteilung. Durch denselben Ansatz (2.25) wie fur die DarwinStrategie konnen wir wiederum den Term hF i eliminieren und durch die Vorschrift nach Normerhaltung fur die Losung P (x; t) ersetzen. Der Vorteil bei der Beschreibung durch Integralgleichungen besteht darin, da der Integraloperator bei einem Kern mit hochstens abzahlbar vielen Unstetigkeitsstellen immer kompakt ist [76, 79]. Diese Eigenschaft erleichtert die Untersuchungen sehr stark. Aufgrund der Isotropie der Mutationen ist der 6.2. GAUSS-VERTEILTE MUTATIONEN 125 Kern des Integraloperators in (6.2) symmetrisch, was zur Selbstadjungiertheit des Integraloperators fuhrt. Aus der Theorie solcher Operatoren folgt dann, da das Spektrum dieses Operators immer diskret ist. Bevor wir zur Berechnung einiger konkreter Beispiele kommen, wollen wir einige Eigenschaften der Integralgleichung @ P (x; t) = ;F (x)P (x; t) + Z W (x ; x0 )(P (x0; t) ; P (x; t))dx0 (6.9) @t angeben, wobei der Ansatz (2.25) zur Linearisierung schon benutzt wurde. Zuerst verwenden wir einen Separationsansatz fur den Raum- und Zeitanteil der Funktion P (x; t), um eine Eigenwertgleichung fur den Integraloperator zu erhalten. Sei der entsprechende Eigenwert, so konnen wir die Eigenwertgleichung durch die Transformation (6.10) K (x; y) = a1 F (x) + RWW(x(x;;y)y)dy ; in eine Fredholmsche Integralgleichung 2.Art Z P (x) = a K (x; y)P (y) dy (6.11) umwandeln. Fredholm hat solche Gleichungen auf ein Problem der linearen Algebra zuruckgefuhrt [103]. Aufbauend auf diesen Ergebnissen konnte Hilbert eine Losungstheorie fur lineare Integralgleichungen aufstellen [104]. Die Analogie mit der Algebra ist exemplarisch fur die daraus entstandene Funktionalanalysis geworden. Die Methode zur Losung der Gleichung (6.11) baut auf den Begri des iterierten Kerns auf, der gema Z K1(x; y) = K (x; y) Kn+1(x; y) = Kn(x; z)K (z; y) dz (6.12) deniert ist. Die Gleichung (6.11) lat sich nun als Iterationsgleichung Z Pn(x) = a Kn(x; y)Pn;1(y) dy auassen. Als Startverteilung fur die Iteration wahlen wir die Delta-Funktion P0(x) = (x ; x0 ). Dann erhalten wir die Losung Pn(x) = an Kn(x; x0) : (6.13) 126 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG Die Theorie von Fredholm und Hilbert sichert, da diese Iteration konvergiert, d.h. gegen die Losung von (6.11) strebt. Als weitere Information enthalten die iterierten Kerne den ersten (und groten) Eigenwert, der durch eine Grenzwertbildung gewonnen werden kann. Dazu denieren wir die Groe Z vn = Kn2 (x; y) dx dy und erhalten vn;1 : a21 = nlim !1 v (6.14) n Fur die zweite Moglichkeit einer naherungsweisen Bestimmung von a1 geben R 2 wir uns eine beliebige, stetige Funktion u(x) mit u (x)dx = 1 vor und bekommen die Ungleichung Z K (x; y)u(x)u(y) dx dy 1 : (6.15) ja1j Naturlich gibt es die Moglichkeit, die Gleichung (6.9) auf andere Art zu losen. Als eine Moglichkeit bietet sich die Fourier-Transformation an. Ist die Fitnessfunktion ein Polynom, so erhalten wir eine Dierentialgleichung im Fourier-Raum, die aber meist viel schwieriger als das ursprungliche Problem ist. Daher werden wir bis auf eine Ausnahme im folgenden nur die Methode des iterierten Kerns benutzen. Beginnen wir mit der einfachsten Fitnessfunktion F (x) = bx2 , dann erhalten wir durch die Benutzung des Ansatzes (2.25) die Gleichung @ y(x; t) = (;bx2 )y(x; t) + Z N (x ; x0 ; )(y(x0; t) ; y(x; t))dx0 ; (6.16) @t woraus wir den Kern K (x; y) exp ; (x4;y) 1 p K (x; y) = (6.17) 4 bx2 + 1 ; berechnen. Der Parameter a wird im folgenden weggelassen, da er aus der Losung (6.13) immer herausfallt. Wir beginnen nun damit, die erste Ordnung zu berechnen, was uns auf das Integral 2 2 (x +y ) Z1 z ;z(x+y) exp ; 4 exp ; 2 1 K2 (x; y) = 4 2 bx2 + 1 ; 2 + 1 ; dz bz ;1 2 2 2 2 2 (6.18) 6.2. GAUSS-VERTEILTE MUTATIONEN 127 fuhrt. Eine Entwicklung des Integrals um den Punkt x+y sowie die gliedweise Integration fuhrt auf den Ausdruck 0 0s 11 Z1 exp ; z ;2z(x+y) 2! e j 1 ; j ( x + y ) @ @ A A exp ; 2 + 1 ; dz qj1 ; j2b 2 1 ; erf 2 4 bz 2 b 24 ;1 2 2 welcher im Bereich jx + yj < 7 in guter Naherung das Integral approximiert. Bis auf eine kleine Umnormierung der Vorfaktoren kommt qualitativ derselbe Kern heraus. Damit erhalten wir nach jedem Rekursionsschritt bis auf Konstanten denselben Ausdruck. Daraus konnen wir schlieen, da das Ergebnis eine Gau-Verteilung mit einem -abhangigen Maximum ist. Die stationare Verteilung ( = 0) konzentriert sich um das Minimum x = 0. Bevor wir zum nachsten Beispiel kommen, wollen wir uns die Zeitabhangigkeit der Losung anschauen. Dazu wenden wir eine Laplace-Transformation bzgl. der Zeit t auf die Gleichung (6.9) an. Bezeichne P~ (x; s) die Transformierte, dann erhalten wir die Gleichung Z P~ (x; s) = f (x; s) + K (x; y; s)P~ (y; s) dy mit (6.19) f (x; s) = F (xP)(+x; 10)+ s ; (x ; y) : K (x; y; s) = FW (x) + s + 1 Auf genau dieselbe Weise erhalten wir durch eine Rekursion die Losung 1 1 Z X X P~ (x; s) = f (x; s) + H~ (n; x; s) = f (x; s) + Kn(x; y; s)f (y; s) dy(6.20) n=1 n=1 mit dem iterierten Kern Kn. Wegen der Additivitat der Laplace-Transformation konnen wir jedes Glied der Reihe extra behandeln. Fur den ersten Term erhalten wir f (x; s) ;! f (x; t) = P (x; 0) exp(;(F (x) + 1)t) : (6.21) Zur Berechnung der weiteren Terme benotigen wir naturlich die konkreten Ausdrucke fur K (x; y; s) und f (x; s). Fur unser Beispiel F (x) = bx2 erhalten 128 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG wir in Bezug auf die Anfangsverteilung P (x; 0) = (x ; x0) fur die ersten beiden Terme P (x; t) (x ; x0 ) exp(;(bx2 + 1)t) + tN (x ; x0 ) exp(;(bx2 + 1)t) :(6.22) Die Anfangsverteilung wird also exponentiell mit der Zeit abgebaut. Die Laplace-Transformierte des Integrals (6.18) sowie die Iteration desselben, ergeben naherungsweise fur das n-te Glied der Losung n x0 )2 ! ( x ; t n= 2 ; 3 = 2 2 H (n; x; t) = t exp ;(bx + 1)t ; (6.23) 22 wobei n > 1 ist. Mit fortschreitender Zeit konvergiert jedes Glied der Reihe gegen eine Verteilung um den Punkt x = 0. Als ein zweites Beispiel betrachten wir den Doppeltopf F (x) = x4 ; x3 ; x2 . Da wir die Methode des iterierten Kerns anwenden mussen, spielt es naturlich keine Rolle, wie kompliziert die Fitnessfunktion ist. Wir konzentrieren uns auf die zeitabhangige Losung und betrachten dazu wieder die Laplace-Transformierte der Gleichung (6.9) mit dem Kern (x;y) exp ; K (x; y; s) = p 1 s + x4 ; x3 4; x2 + 1 : (6.24) 4 Auch dieses Problem ist einer naherungsweisen Losung zuganglich und wir erhalten fur den n-ten iterierten Kern exp(;(x ; y)2=2n) Kn(x; y; s) ((x4 ; x3 ; x2 )2 + s)((( n x ; y)4 ; (x ; y)3 ; (x ; y)2)2 + s)(6.25) woraus nach der Rucktransformation ;(x ; y)2=2n) Kn(x; y; t) (((x ; y)4 ; (x ; exp( (6.26) y)3 ; (x ; y)2)2 ; (x4 ; x3 ; x2 )2)n " nX ;1 4 3 22 4 3 22kk 1 ; (((x ; y) ; (x ; y) ; (x ;k! y) ) ; (x ; x ; x ) ) t k=0 i exp(;((x ; y)4 ; (x ; y)3 ; (x ; y)2)2 t) wird. Um eine Vorstellung von der Losung zu bekommen, haben wir fur verschiedene Zeitpunkte die Kurven in Abbildung 6.1 dargestellt. Wie wir am Kurvenverlauf erkennen konnen, uberspringt die Strategie leicht die Barriere. Die Beschrankung der Schrittweite auf die Diusionsnaherung ist also eine Ursache fur die Probleme der Darwin-Strategie beim U berspringen einer Barriere. 2 2 6.3. CAUCHY-VERTEILTE MUTATIONEN 129 2.0 Verteilung P 1.0 0.0 Fitness t=1 t=2 t=3 -1.0 -2.0 -1.5 -1.0 -0.5 0.0 0.5 Phaenotyp x 1.0 1.5 Abbildung 6.1: Losung fur die Gau-verteilten Schritten im Falle des Doppeltopfes 6.3 Cauchy-verteilte Mutationen Im Gegensatz zum vorherigen Abschnitt werden wir in diesem Abschnitt Eigenschaften einer Darwin-Strategie kennenlernen, die anders geartet sind, als fur Gausche Mutationen. Neben diesen theoretischen Ausarbeitungen wurden Simulationen durchgefuhrt, die in [105] zu nden sind. Sie ergaben in einem groen Parameterbereich eine deutliche Beschleunigung des Algorithmus. Die Gleichung zur Beschreibung der Dynamik von P (x; t) ist von der gleichen Struktur wie (6.8). Wahlen wir die U bergangsraten als CauchyVerteilung W (x) = x2 +1 2 (6.27) mit der Breite , so erhalten wir @ P (x; t) = (hF i ; F (x))P (x; t) + Z P (x0; t) ; P (x; t) dx0 : (6.28) @t (x ; x0 )2 + 2 Es ist klar, da auch hier der Ansatz (2.25) zur Linearisierung der Gleichung verwendet werden kann. Die Eigenschaften der Integralgleichung bleiben fur 130 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG diesen Fall dieselben wie bei den Gau-verteilten Mutationen. Deshalb wollen wir sofort mit der Berechnung des konkreten Problems F (x) = ax2 beginnen. Dabei werden wir die Losung auf zwei Wegen erhalten: durch eine Fouriertransformation der Integralgleichung und Losung der Dierentialgleichung im Fourier-Raum sowie durch die Methode des iterierten Kerns. Mit dem Ansatz (2.25) erhalten wir die Gleichung @ y(x; t) = (;ax2 )y(x; t) + Z y(x0; t) ; y(x; t) dx0 (6.29) @t (x ; x0 )2 + 2 und nach der Fouriertransformation y~(k; t) = F (y)(k; t) @ y~(k; t) = a @ 2 y~(k; t) + exp(;k)~y(k; t) ; y~(k; t) : (6.30) @t @k2 Die Losung dieser Gleichung wird entsprechend der im Kapitel 2 beschriebenen Prozedur ermittelt. Als Ergebnis erhalten wir ! X 2 y(k; t) = exp(; t)J p exp(;k=2) (6.31) mit = (=2)2 ; = und J ( ) als Besselfunktion. Die Rucktransformation liefert das Ergebnis y(x; t) = X exp(; t)R (x) mit R (x) = < (3)ix= p (6.32) ! 1 (=2 + ix=) : (6.33) Im Gegensatz zur Darwin-Strategie mit kleinen Schrittweiten (2.17) erhalten wir ein quadratisches Spektrum, d.h., die Cauchy-verteilten Schrittweiten nden schneller das Optimum. Diese Tatsache ist nicht weiter erstaunlich, da die Wahrscheinlichkeit fur einen groen Schritt viel groer ist als bei der Darwin-Strategie (2.17). Schaut man auf die ersten Eigenfunktionen (siehe Abbildung 6.2), so sehen wir leicht, da diese Funktionen auch viel starker oszillieren als die entsprechenden Eigenfunktionen (Hermitesche Polynome) der Losung (B.1). Nach dieser Analyse des Eigenwertproblems wollen wir uns nun der Losung zuwenden, die mit der Methode des iterierten Kerns 6.3. CAUCHY-VERTEILTE MUTATIONEN 131 Verteilung P 150.0 λ=4 λ=1 λ=0 100.0 50.0 0.0 -50.0 -100.0 -3.0 -2.0 -1.0 0.0 1.0 Phaenotyp x 2.0 3.0 Abbildung 6.2: Darstellung der Eigenfunktion fur die Fitness F (x) = ;x2 und Cauchy-verteilten Mutationen 132 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG erhalten werden kann. Dabei wollen wir uns sofort auf den zeitabhangigen Fall konzentrieren. Fur den Kern der Integralgleichung (6.19) ergibt sich (6.34) K (x; y; s) = (x ; y1)2 + 2 bx2 +11 + s : Das Problem der Iteration des Kerns fuhrt uns auf die Berechnung des Integrals Z1 2 1 1 K2(x; y; s) = 2 bx2 + 1 + s ((x ; z)2 + 2dz 2 + 2 ) bz 2 + 1 + s : )(( y ; z ) ;1 Diese Art von Integralen kann sehr gut mit dem Residuenkalkul behandelt werden, da die komplexe Erweiterung des Integranden eine in der oberen Halbebene H = f z 2 C j =z > 0 g meromorphe Funktion darstellt. Wir denieren die meromorphe Funktion h(z) = h 1(z) = ((x ; z)2 + 2)((y ; 1z)2 + 2 )(bz2 + 1 + s) ; (6.35) 1 wobei z 2 C und b; c > 0 ist. Nach dem Residuensatz mu nun gelten 1 Z h(z) dz = Res h(z) = 1 (6.36) dh (z ) z z 2i H 0 =z> dz = 0 0 2 mit den Nullstellen q z0 = i (1 + s)=b ; ;x + i ; ;y + i von h1 (z) in H . Nun stellen wir die obere Halbebene H durch ein neues Gebiet D dar, das in Abbildung 6.3 dargestellt ist. Fur das Integral (6.36) ergibt sich dann 0 1 R Z Z Z 1 h(z) dz = lim B 1 1 h(z) dz C : (6.37) h ( z ) dz + @ A R!1 2 2i H 2 i ;R (R) Das erste Integral lat sich durch den Ausdruck Z h(z) dz (bR2 + 1 + 1s)(R2 + 2 )2 (R) 6.3. CAUCHY-VERTEILTE MUTATIONEN 133 Im z γ(R) -R D z0 R Re z Abbildung 6.3: Darstellung der Integrationswege in der oberen Halbebene H KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG 134 abschatzen, welcher fur R ! 1 gegen 0 strebt. Damit erhalten wir die geschlossene Formel1 Z1 ;1 dz dz = 2i Res z=z h(z ) : (6.38) ((x ; z)2 + 2)((y ; z)2 + 2 )(bz2 + 1 + s) =z>00 Naturlich hatten wir auch den alternativen Weg einer Partialbruchzerlegung wahlen konnen, welcher aber langwieriger ist. Die Auswertung des entsprechenden Ausdrucks sowie die Rucktransformation sind relativ lang und wurden teilweise numerisch durchgefuhrt. Deshalb wollen wir uns nur auf die Ergebnisse konzentrieren. In Abbildung 6.4 sind die entsprechenden genaherten Verteilungsfunktionen fur verschiedene Zeitpunkte dargestellt. Der Ver2.0 1.8 1.6 Verteilung P 1.4 1.2 1.0 0.8 stationaer t=10 t=3 t=1 0.6 0.4 0.2 0.0 −2.0 −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 2.0 Phaenotyp x Abbildung 6.4: zeitabhangige Losung fur die Parabel fur Cauchy-verteilte Mutationen Es wurde implizit vorausgesetzt, da die Formel gleichmaig stetig vom Winkel arg(z ) abhangt. Genau dies ist fur die Berechnung der Gauschen Integrale nicht erfullt. 1 6.3. CAUCHY-VERTEILTE MUTATIONEN 135 lauf ist nicht sehr uberraschend und erinnert stark an die Kurven bei Gauverteilten Mutationen. Die Geschwindigkeit ist auch nicht groer als bei den anderen Mutationsverteilungen, was durch die Einfachheit des Problems zu erklaren ist. Ein wesentlich interessanteres Problem ist dagegen der Doppeltopf. Das Verfahren zur Berechnung dieser genaherten zeitabhangigen Verteilung bleibt dasselbe, nur die Ausdrucke werden noch komplizierter. Das Problem reduziert sich auf die Betrachtung der Laplace-Transformierten des Integralkerns K (x; y; s) = (x ; y1)2 + 2 x4 ; x3 ;1x2 + 1 + s : (6.39) und die Berechnung des iterierten Kerns 2 = 2 Z1 1 K2 (x; y; s) = bx2 + 1 + s ((x ; z)2 + 2dz 2 2 4 3 2+1+s: )(( y ; z ) + ) z ; z ; z ;1 Die anschlieende Laplace-Rucktransformation von s nach t liefert das entsprechende Ergebnis fur die genaherte Verteilungsfunktion. In Abbildung 6.5 sind die genaherten Verteilungsfunktionen dargestellt. Hier sehen wir einen entscheidenden Unterschied zu den Gau-verteilten Mutationen. Wahrend die Verteilung im Falle von Gau entsprechend Abbildung 6.1 in allen Zwischenschritten nur eine bimodale Verteilungsfunktion besitzt, zeigen die Cauchyverteilten Mutationen ein komplexeres Verhalten. In einem Zwischenschritt besitzt die Verteilung 3 Maxima, was im Gegensatz zur Strategie mit Gauverteilten Mutationen steht. Die Erklarung lat sich einfach dadurch geben, da die Cauchy-Verteilung lange Sprunge starker bevorzugt als die GauVerteilung. Deshalb ist die Wahrscheinlichkeit, einen Sucher in der Umgebung der Barriere zu nden, viel groer. Damit erscheint es gunstig, in stark zerklufteten Fitnesslandschaften groe Schrittweiten zu verwenden. Als weiteren Unterschied zu den Gau-verteilten Mutationen konnen wir aus der Abbildung 6.5 entnehmen, da die stationare Verteilung eine unimodale Funktion um das globale Optimum bildet. Im Gegensatz dazu zeigen die anderen Strategien ein davon verschiedenes Verhalten, da sie eine unimodale Funktion als stationare Verteilung besitzen. Auf die weitere Beziehung zwischen der Struktur der Fitnesslandschaft und der Wahl der Mutationsverteilung soll an dieser Stelle nicht eingegangen werden. 136 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG 1.4 Verteilung P 1.2 1.0 stationaer t=3 t=10 0.8 0.6 0.4 0.2 0.0 -2.0 -1.5 -1.0 -0.5 0.0 0.5 Phaenotyp x 1.0 1.5 2.0 Abbildung 6.5: zeitabhangige Losung fur den Doppeltopf x4 ; x3 ; x2 fur Cauchy-verteilte Mutationen 6.4 Einheitliche Beschreibung Bisher haben wir nur Strategien mit Darwin-Selektion und anderen Mutationsverteilungen studiert. Naturlich mu es auch moglich sein, alle anderen Strategien in eine Integro-Dierentialgleichung einzubetten. Ausgangspunkt fur eine solche Betrachtung bilden die Artikel [106, 107] von Lebowitz und Bergmann. Dort wurde ein Hamiltonsches System im Warmebad betrachtet. Durch die Ankopplung des Warmebades gibt es U bergange innerhalb des Systems, die zu einer Veranderung der Verteilungsfunktion, die auf dem Phasenraum deniert ist, fuhren. Die LiouvilleGleichung fur die Verteilungsfunktion wird zu einer Integro-Dierentialgleichung. In den Artikeln wurde untersucht, wie die durch das Bad verursachten U bergange des einen Zustandes in einen anderen Zustand zu wahlen sind, damit eine stationare Verteilung existiert, die der kanonische Verteilung entspricht. Sei E (x) die Energie des Zustands x und T die Temperatur des Bades, so ist die U bergangsrate K (x; x0 ) vom Zustand x in den Zustand x0 durch K (x; x0 ) = exp(;E (x)=T )L(x; x0 ) mit dem symmetrischen Kern L(x; x0 ) = L(x0 ; x) gegeben. Fur ein evoluti- 6.4. EINHEITLICHE BESCHREIBUNG 137 onares System besitzt die Fitnessfunktion die Eigenschaften einer Energie, wahrend das Warmebad die Mutationen kennzeichnet. Daraus erhalten wir die Gleichung @ P (x; t) = Z (exp(;F (x0))P (x0; t) ; exp(;F (x))P (x; t))L(x; x0 )dx(6.40) 0 @t mit als reziproker Temperatur, woraus sich entsprechend Kapitel 2 im Grenzfall kleiner Schrittweiten die Boltzmann-Strategie (2.6) ergibt. Die Verallgemeinerung auf den Fall einer zusatzlichen Reproduktion und Selektion liefert den Ausdruck @ P (x; t) = Z (exp(;F (x0 ))P (x0; t) ; exp(;F (x))P (x; t))L(x; x0 )dx0 @t + (hF i ; F (x))P (x; t) ; welcher im selben Grenzfall auf die Gemischte Strategie (2.35) fuhrt. Auch der Fall einer Schrittweitensteuerung bereitet bezuglich der Gleichungen keine Probleme. Sei der Schrittweitenparameter, den wir als zusatzliche Koordinate zu den Phanotypkoordinaten hinzunehmen, dann fuhrt dies auf eine Gleichung der Form @ P (x; ; t) = Z (P (x0; ; t) ; P (x; ; t))L(x; x0 ; )dx0 + (hF i ; F (x))P (x; ; t) @t Z + (P (x; 0; t) ; P (x; ; t))L(; 0 ) d0 ; was die adaptive Darwin-Strategie (2.46) ergibt. Auf gleiche Weise erhalten wir das Analogon zur Selfannealing Strategie (2.48) @ P (x; ; t) = Z (exp(;F (x0 ))P (x0; ; t) ; exp(;F (x))P (x; ; t))L(x; x0)dx0 @t Z (P (x; 0; t) ; P (x; ; t))L(; 0) d0 + (hF i ; F (x))P (x; ; t) : Alle aufgefuhrten Integro-Dierentialgleichungen zeigen aufgrund ihrer ahnlichen Struktur auch ein ahnliches Verhalten. So sind alle Integraloperatoren kompakt, woraus wir ein diskretes Spektrum erhalten. Desweiteren sind die Gleichungen linear und fuhren damit zu Losungen, die auf einen Hilbertraum dargestellt werden konnen. In den Losungen der Standardprobleme wie Parabel und Doppeltopf gibt es groe Unterschiede, die sich aus den Eigenschaften des Integraloperators begrunden lassen. 138 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG Im strengen Sinne widerspricht die Beschreibung Evolutionarer Algorithmen durch Dierentialgleichungen dem Gedanken der Evolution. Die Evolution ist ein globaler Vorgang, der eine globale Kopplung zwischen den Individuen einfuhrt. Damit erscheint es ganz naturlich, da die adaquate Beschreibung der Evolution durch Integralgleichungen zu erfolgen hat. Fuhren wir neben dieser globalen Kopplung noch eine andere Art der Wechselwirkung ein, so kommen wir zu nichtlinearen Integralgleichungen. Eine interessante Klasse solcher Integralgleichungen sind die Lotka-Volterra-Systeme. Leider kann an dieser Stelle nicht weiter auf solche Fragen eingegangen werde. 6.5 Ansatze zur Klassikation Bevor wir dieses Kapitel beenden, sollen noch ein paar Gedanken zu einer moglichen Klassikation der Integralgleichungen dargelegt werden, die einen ahnlichen Charakter wie die Klassikation in Kapitel 4 haben soll. Dazu stellen wir als erstes fest, da die grundsatzliche Struktur aller vorher beschriebenen Gleichungen durch @ P (x; t) = ;IP (x; t) @t mit dem Integraloperator Z IP (x; t) = ; (F ; hF i)P ; (W (x; y)P (y; t) ; W (y; x)P (x; t)) dy gegeben ist, wobei die Koordinaten einschlielich der Schrittweitenparameter betrachtet werden. Genauso wie in Kapitel 4 betrachten wir eine Zerlegung der Fitnessfunktion in berechenbare Probleme. Leider haben wir hier das Problem, da die Operatoren bzgl. der Zerlegung keine quadratischen Formen uber einer bestimmten Algebra sind. Dadurch wird dieser Fall viel komplizierter als fur Schrodinger-Operatoren. Glucklicherweise gibt es aber eine Eigenschaft des Operators I , die fur alle relevanten Fitnessfunktionen erfullt ist. Der Operator I ist ein Fredholm-Operator, d.h. die Raume ker I und ker I mit I als adjungierten Operator sind endlich-dimensionale Raume. Die Dierenz beider Dimensionen ist der Index, der invariant unter Storungen mit einem kompakten Operator ist. An dieser Stelle ist zu vermuten, da diese Eigenschaft wesentlich fur die Klassikation werden wird. Im Kapitel 4 haben wir die Menge der quadratischen Formen uber dem Phanotypraum 6.5. ANSATZE ZUR KLASSIFIKATION 139 betrachtet. Die stabilen A quivalenzklassen solcher quadratischen Formen uber einem Ring R korrespondieren zum Witt-Ring W (R), welcher nichts weiter als die algebraische K-Theorie K0(R) von R ist. Die unterschiedlichen Indizes in der K-Theorie der quadratischen Bundel uber dem Raum B d hangen mit den dimensionsabhangigen Eigenschaften der Bundel zusammen. An dieser Stelle sind wir mit Hilfe des Theorems von Swan von der algebraischen K-Theorie zur topologischen K-Theorie gewechselt. Dieses Verfahren funktioniert im Fall des Integraloperators nicht. Betrachten wir den Integraloperator im anschaulichen Sinne als Folge von Schrodinger-Operatoren der Form (2.50), so mussen wir uns zur Charakterisierung dieser Folge nicht auf den Ring R konzentrieren, sondern deren Automorphismen Aut(R) studieren. Eine entsprechende stabile Klassikation dieses Ringes fuhrt uns auf die K1(R). An dieser Stelle wollen wir explizit betonen, da die K-Theorie im algebraischen Sinne verstanden wird. Der groe Unterschied zwischen der topologischen und der algebraischen K-Theorie ist vor allem durch die fehlende Bott-Periodizitat gegeben. Wenn wir also im Falle der Integraloperatoren in die algebraische K-Theorie gelangen, so bedeutet dies einen Verlust an Struktur. An dieser Stelle ist aber zu hoen, da eine Ausdehnung der durch Aut(R) gegebenen lokalen Eigenschaften auf den gesamten Raum B d moglich ist. Bisher gibt es leider nur Ansatze, aber durch die Entwicklung der simplizialen Homotopietheorie in den letzten Jahren ist eine Losung vielleicht bald in Sicht. 140 KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG Kapitel 7 Zusammenfassung Im Kapitel 2 geben wir einen U berblick uber alle Evolutionaren Algorithmen mit der oben beschriebenen Reproduktion und Selektion. Als Mutation haben wir einen Diusionsproze angenommen. Im eigentlichen Sinne zahlt die zuerst behandelte Boltzmann-Strategie nicht zu den Evolutionaren Strategien, da es im engerem Sinne keine Reproduktion und Selektion gibt. Aufgrund der ahnlichen Struktur der dynamischen Gleichungen wird sie aber im erweiterten Sinne mit dazugezahlt. Danach fuhren wir die Darwin-Strategie ein, welche ein klassisches Beispiel fur eine evolutionare Strategie ist. Eine Analyse dieser beiden Strategien hat ein gegenlauges Verhalten beim U berwinden einer Barriere ergeben. Da dieser Fall eine Standardsituation auf Fitnesslandschaften ist, fuhren wir eine Mischung der Darwin- und Boltzmann-Strategie ein. Dabei entsteht die Gemischte Strategie, die sich schon in vielen Computerexperimenten bewahrt hat. In den nachsten beiden Abschnitten behandeln wir die Frage nach einer Anpassung der Mutationsstarke (aquivalent mit der Schrittweite) und leiten erstmalig die Gleichung fur die Veranderung der Schrittweite bei einer Darwin-Strategie her. Die Grundidee fur diese adaptive Darwin-Strategie stammt von Schwefel, der sie in der Folgezeit ausgiebig untersucht hat. Ein ahnliches Problem tritt auch bei der Boltzmann-Strategie auf, die als freien Parameter fur die Schrittweite eine reziproke Temperatur besitzt. Eine "Abkuhlung\ fuhrt zu einem Hangenbleiben der Strategie in den lokalen Minima. Dabei setzen wir voraus, da die Abkuhlung so langsam vor sich geht, da dabei das globale Minimum gefunden wird. Diese Strategie wird als "simulated annealing\ bezeichnet. Wie wir uns denken, ist die Wahl der Abkuhlung das eigentliche Problem. Rose fand einen evolutionaren Ausweg 141 142 KAPITEL 7. ZUSAMMENFASSUNG aus diesem Dilemma, indem er jedem Individuum der Gemischten Strategie eine Temperatur gab, die auch der Selektion ausgesetzt wurde. Dadurch konnte die Strategie ihre Abkuhlungskurve selbst nden. Im letzten Abschnitt dieses Kapitels gehen wir noch der Frage nach einer einheitlichen Darstellung der dynamischen Gleichung nach. Dabei ergibt sich eine verallgemeinerte Warmeleitungsgleichung, die auf einem metrischen Raum deniert ist. Die Wahl der Metrik und Koezienten listen wir fur alle Strategien auf. Die Bedeutung dieses Ergebnisses liegt in der spateren Klassikation begrundet. Den groten Teil der Arbeit bildet das Kapitel 3, welches sich mit dem Vergleich der Strategien beschaftigt. Dazu fuhren wir verschiedene Mae zur Messung von Geschwindigkeiten der Strategien ein. Diese Mae bestehen vorrangig aus Kombinationen der Erwartungswerte von Polynomen der Fitnessfunktion sowie deren zeitliche Ableitungen. Wir behandeln und berechnen diese Groen anhand von zwei Beispielen: der Parabel und des Doppeltopfes. Beide Falle stellen zugleich die einfachsten Probleme fur eine Optimierung dar. Fur die Parabel ist es wichtig, da wir die Geschwindigkeit der Strategie messen. Die einfachste Groe, die dies beschreibt, ist die zeitliche A nderung des Erwartungswerts der Fitness. Sie ist die Geschwindigkeit der Strategie auf der Fitnesslandschaft. Als weitere interessante Groe betrachten wir die Varianz der Verteilungsfunktion der Individuen auf der Fitnesslandschaft. Sie gibt Auskunft uber die Variabilitat der Individuen bezuglich der Fitness. Diese beiden Groen werden im Fall der Parabel fur die Boltzmann- und Darwin-Strategie explizit berechnet. Dabei ergeben sich ahnliche Ergebnisse, die fur diesen Fall nicht erstaunlich sind, da die Strategie immer dem Gradienten der Fitnessfunktion folgen. Das zweite Beispiel ist der Doppeltopf. Hierbei interessiert uns vor allem die Wahrscheinlichkeit, da die Strategie von einem Topf in den anderen wechselt. Dazu starten wir im lokalen Minimum und versuchen in das globalen Minimum zu gelangen. Die Wahrscheinlichkeit dafur ist durch das Integral uber die Wahrscheinlichkeitsverteilung1 gegeben. Deren zeitliche Ableitung lat sich als Strom von Suchern durch die Barriere interpretieren. Eine Untersuchung dieser Groen fur die Boltzmann-und Darwin-Strategie erbringt das Ergebnis, da die Boltzmann-Strategie auf achen FitnesslandIn gewissem Sinne stellt diese Groe das 0.Moment bezuglich der Erwartungswerte der Fitness dar. 1 143 schaften schneller als die Darwin-Strategie ist. Andererseits ist die DarwinStrategie auf stark zerklufteten Landschaften schneller als die BoltzmannStrategie. Das gegenlauge Verhalten beider Strategien beim Problem des Doppeltopfes legt die Idee der Mischung der Strategien nahe. Nun fragen wir uns naturlich, ob eine Mischung wirklich den gewunschten Erfolg zeigt. Im nachsten Abschnitt wird daher erneut der Doppeltopf behandelt. Dabei zeigen wir, da die gemischte Strategie fur fast alle Parametersatze das globale Minimum ndet. Desweiteren werden Kriterien fur die Wahl des Mischungsparameters angegeben. Im letzten Abschnitt dieses Kapitels beschreiben wir die Simulationsalgorithmen der Boltzmann- und Darwin-Strategie. Im Kapitel 4 beschaftigen wir uns mit den mathematischen Eigenschaften von Schrodinger-Operatoren. Dabei steht der Zugang uber das Spektrum zusammen mit den Eigenschaften des sogenannten Warmeleitungskerns am Anfang im Mittelpunkt des Interesses. Wir zeigen, da die Geschwindigkeit der Strategie mit solchen Eigenschaften wie Spektraldichte im Zusammenhang steht. Andererseits ist das Spektrum auch in der Quantenmechanik anwendbar. Durch die Bestimmung der A nderung der Autokorrelationsfunktion in Bezug auf die Erwartungswerte der Fitness wird uber eine Hierarchie das gesamte Spektrum aufgebaut. Eine Diskussion des Einusses einer Deformation der Fitnessfunktion auf das Spektrum rundet diesen ersten Abschnitt ab. Gerade die Diskussion dieser Beziehung zu den Korrelationen sowie die Diskussion der Deformation der Fitnessfunktion sind neu. Der Hauptteil des Kapitels ist der Klassikation von Schrodinger-Operatoren durch die Untersuchung der topologischen Eigenschaften des Losungsraums gewidmet. Zuerst fuhren wir das Problem auf ein algebraisches Problem zuruck, was gleichzeitig eine Vereinfachung der ursprunglichen Fragestellung bedeutet. Eine Charakterisierung der A quivalenzklassen ist mit Hilfe der Singularitatstheorie moglich. Dabei treten als kleinste Einheiten der Fitnesslandschaft 6 Singularitaten auf, d.h. falls zwei Fitnesslandschaften die gleiche Zerlegung der Landschaft bezuglich der Singularitaten besitzen, so verhalten sich die Strategien ebenfalls gleich. Damit ist ein Zusammenhang zwischen der Struktur der Fitnesslandschaft und dem Verhalten der Strategien gefunden. Als weitere Anwendung dieses Ergebnisses erhalten wir eine Charakterisierung des Grundzustandes von Schrodinger-Operatoren. Aufbauend auf den mathematischen Ergebnissen des letzten Kapitels wird in Kapitel 5 die Klassikation der Strategien durchgefuhrt. Dabei erhalten wir das wichtige Resultat, da zwei Fitnesslandschaften, die lokal aus den gleichen Singularitaten (siehe Tabelle 4.5) bestehen dasselbe Verhalten der 144 KAPITEL 7. ZUSAMMENFASSUNG Evolutionaren Strategie implizieren. Dieses Ergebnis wurde zuerst nur fur die Darwin-Strategie erhalten, um es dann auch auf die anderen behandelten Strategien auszudehnen. Im letzten Kapitel der Arbeit wird noch der Frage nach der Veranderung der Mutationsverteilung nachgegangen. Bisher haben wir dafur eine Diffusionsnaherung benutzt, die aber im allgemeinen in Computerexperimenten nicht verwendet wird. Lassen wir diese Einschrankung fallen, so wechselt die Beschreibungsweise von partiellen Dierentialgleichungen zu IntegroDierentialgleichungen. Eine Angabe der Losung ist uber die Methode des iterierten Kerns moglich. Am Beispiel der Gau- bzw. Cauchy-Verteilung werden die Standardprobleme Parabel und Doppeltopf studiert. Die Ergebnisse erbrachten fur die Gau-Verteilung ein ahnliches Ergebnis wie fur die Diusionsnaherung. Dagegen sind die Eigenschaften der Losung fur die Cauchy-Verteilung im Falle des Doppeltopfes von denen der Gau-Verteilung verschieden. Eine Darstellung der einheitlichen Beschreibung dieser Strategien sowie ein Ansatz zur Klassikation beenden das letzte Kapitel. Am Schlu der Arbeit benden sich 4 Anhange, welche die umfangreichen Rechnungen und Formeln enthalten. Im Anhang A berechnen wir eine wichtige Invariante von Fitnesslandschaften, die uber den Einu von Zwangsbedingungen auf die Optimierung die Aussagen treen. Danach analysieren wir im Anhang B die Eigenwertprobleme der Boltzmann- und Darwin-Strategie, um eine alternative Moglichkeit zu den Berechnungen des Kapitels 3 zu erhalten. Der Anhang C ist der vollstandigen Berechnung des Stromes fur den Fall eines stuckweise quadratischen Doppeltopfes gewidmet. Im Anhang D schlielich ist eine Zusammenstellung der Formeln fur die Gemischte Strategie am Beispiel der Parabel und des Doppeltopfs zu nden. Anhang A Berechnung der Betti-Zahlen von Fitnesslandschaften Um die Darstellung der topologischen Eigenschaften von Fitnesslandschaften in Kapitel 3 zu vervollstandigen, wollen wir an dieser Stelle die Berechnung der Betti-Zahlen an einigen Beispielen durchfuhren. Dabei konzentrieren wir uns vor allem auf die Berechnung der Beispiele in Tabelle 3.1. Als Zugang wahlen wir eine axiomatische Betrachtungsweise und klammern die rein topologischen Aspekte fast vollig aus, da andernfalls der Umfang dieses Anhangs betrachtlich groer ware. Fur eine leicht verstandliche Darstellung des topologischen Hintergrundes verweisen wir auf das Buch [108]. A.1 Axiomatische Einfuhrung der Homologie An dieser Stelle wollen wir die Homologietheorie durch eine Reihe von Axiomen einfuhren. Die exakte mathematische Axiomatik benutzt die Kategorientheorie. Aus Grunden der Einfachheit modizieren wir diesen Zugang. Denition 11 Als Homologietheorie wollen wir eine 1-parametrige Familie von Vorschriften Hp( ) auassen, die jedem topologischen Raum einen Vektorraum IRn zuordnet. Die Dimension des Vektorraums zur Vorschrift Hp( ) heit p-te Betti-Zahl bp. Weiterhin sollen noch folgende Axiome erfullt sein: 1. Dimensionsaxiom: H q (Punkt) = 0 und H 0(Punkt) = IR , d.h. jedem Punkt wird die BettiZahl b0 = 1 zugeordnet. Alle anderen Betti-Zahlen verschwinden. 145 ANHANG A. BERECHNUNG DER BETTI-ZAHLEN 146 2. Homotopieaxiom: Seien X; Y zwei topologische Raume und gibt es weiterhin eine stetige Abbildung f : X ! Y , so sind alle Betti-Zahlen von X gleich den Betti-Zahlen von Y . 3. Mayer-Vietoris-Sequenz: Sei X ein topologischer Raum und seien U; V X oene Teilmengen mit X = U [ V . Dann ist die Folge @q @q j j i : : : ;! Hq (U \V ) ;! Hq (U )Hq (V ) ;! Hq (X ) ;! Hq;1(U \V ) ;! ::: mit j (x) = (x; ;x), i(x; y) = x + y und @ @q+1 = 0 exakt, d.h. im j = ker i, im i = ker @q und im @q = ker j . +1 Insbesondere das letzte Axiom ermoglicht uberhaupt erst die explizite Berechnung der Betti-Zahlen. Die folgenden Beispiele sollen dies illustrieren. A.2 Einfache Einschrankungen Wir beginnen zuerst mit der Berechnung der Betti-Zahlen des gesamten Raumes B d . Dieser Raum lat sich mit Hilfe einer stetigen Abbildung auf einen Punkt abbilden. Nach dem Homotopieaxiom sind Betti-Zahlen bp(B d ) durch die Betti-Zahlen eines Punktes gegeben, d.h. b0 (B d) = 1 ; bp(B d) = 0 8p 1 : Nun nehmen wir aus dem Inneren von B d eine abgeschlossene Menge A heraus. Es ist anschaulich klar, da dabei ein Gebilde entsteht, welches stetig auf eine Sphare S d;1 abgebildet werden kann. Durch eine Induktion uber die Dimension d konnen wir mit Hilfe der Mayer-Vietoris-Sequenz die Betti-Zahlen berechnen. Dazu beginnen wir mit B 1 (eine Strecke endlicher Lange) und nehmen ein Stuck aus dem Inneren heraus. Dadurch entstehen 2 Strecken bzw. mittels einer stetigen Abbildung 2 Punkte. Das ist genau die S 0, welche aus den Punkten P1 und P2 zusammengesetzt ist. Wir erhalten die Mengen P1 [ P2 = S 0 und P1 \ P2 = ;. Da alle hoheren Homologien verschwinden (siehe Dimensionsaxiom), brauchen wir nur die Teilsequenz fur H0 zu betrachten. Es gilt j @ i 0 = H0(P1 \ P2) ;! H0(P2 ) H0 (P1) ;! H0(S 0) ;! 0 0 A.2. EINFACHE EINSCHRANKUNGEN 147 Aus der Exaktheit der Sequenz erhalten wir im j = 0 = ker i und ker @0 = H0(S 0 ) = im i, d.h. i ist ein Isomorphismus. Es gilt also H0(S 0 ) = H0(P2) H0(P1 ) = IR IR = IR2 . Damit bekommen wir die Betti-Zahlen b0 (S 0) = 2 ; bp(B d ) = 0 8p 1 : Als nachstes wenden wir uns dem Fall d = 1 zu. Als U berdeckung des Kreises nehmen wir 2 Halbkreise U; V mit U [ V = S 1 und U \ V = S 0. Die beiden Halbkreise sind naturlich nichts weiter als 2 Strecken B 1. Damit erhalten wir die Mayer-Vietoris-Sequenz j @ @ i 0 ;! H1(S 1) ;! H0(U \ V ) ;! H0(U ) H0(V ) ;! H0(S 1 ) ;! 0: 1 0 Es gilt ker @1 = 0, H1 (S 1) = im @1 = ker j , im j = ker i und ker @0 = H0(S 1 ) = im i. Setzen wir die vorherigen Ergebnisse ein, so erhalten wir fur die Abbildung j : IR2 ! IR2 mit j ((x; y)) = (x; ;x). Daraus erhalten wir ker j = IR bzw. H1 (S 1) = IR. Da entsprechend der linearen Algebra dim ker j + dim im j = dim H0(U \ V ) = 2 sein mu, erhalten wir ker i = IR und damit auch H0 (S 1) = IR. Deshalb folgt fur die Betti-Zahlen der S 1 b0 (S 1) = b1 (S 1) = 1 ; bp(S 1) = 0 8p 2 : Auf analoge Weise konnen wir die d-Sphare in eine Nord- und eine Sudhalbkugel zerlegen, d.h. S d = U [ V mit U \ V = S d;1. Mittels einer Induktion uber die Dimension der Sphare erhalten wir durch eine Mayer-Vietoris-Sequenz die Betti-Zahlen1 b0 (S d ) = bd (S d) = 1 : Damit haben wir den Fall einer kompakten Nebenbedingung erschopfend behandelt. Sei Lk eine k-dimensionale Hyperache und B d nLk die Schnittmenge. Diese Hyperache reprasentiert eine Zwangsbedingung, die durch k Groen parametrisiert wird. Um eine anschauliche Vorstellung von der Menge B dnLk zu bekommen, betrachten wir den Fall B 3 mit den beiden moglichen Zwangsbedingungen L1 und L2 . Die Menge B 3nL2 stellt einfach die disjunkte Vereinigung von zwei B 3 dar. Damit erhalten wir fur die Betti-Zahlen b0 (B 3 nL2) = 2 : 1 Im folgenden wollen wir nur die nichtverschwindenden Betti-Zahlen angeben. ANHANG A. BERECHNUNG DER BETTI-ZAHLEN 148 Fur den anderen Fall B 3nL1 wollen wir wiederum eine stetige Abbildung auf einen schon bekannten Raum konstruieren. Dazu verdicken wir die herrausgeschnittenen Linien L1 durch eine stetige Transformation und schrumpfen gleichzeitig das Komplement B 3 nL1. Dadurch entsteht ein Zylinder, der wiederum durch eine stetige Transformation auf einen Kreis deformiert werden kann. Fur die Betti-Zahlen erhalten wir daher b0 (B 3 nL1) = b1 (B 3 nL1) = 1 : Auf analoge Weise konnen wir nun die anderen Falle behandeln. Fur k = d;1 erhalten wir b0 (B dnLd;1 ) = 2 und sonst b0 (B dnLk ) = 1; bd;k;1 (B dnLk ) = 1 : Damit erzeugt jede Einschrankung i.a. einen zusatzlichen Sattel im Sinne der Morse-Theorie. A.3 Mehrfache Einschrankungen Am Ende dieses Anhangs wollen wir noch kurz auf den Fall einer mehrfachen Einschrankung eingehen. Darunter verstehen wir im topologischen Sinne die Komplementmenge B dn(Lk tLl ), wobei Lk tLl die disjunkte Vereinigung2 ist. Aufgrund der Separabilitat der Einschrankungen konnen wir die Falle B d nLk und B dnLl unabhangig behandeln und einfach die Betti-Zahlen addieren. Es ergibt sich b0 (B d n(Lk t Ll )) = 1 + 1k + 1l bd;k;1(B d n(Lk t Ll )) = 1 + lk bd;l;1 (B d n(Lk t Ll )) = 1 + lk mit dem Kronecker-Symbol lk . Analog erhalten wir die entsprechenden Betti-Zahlen fur mehr als 2 Einschrankungen. Zum Schlu wollen wir noch den Fall betrachten, da die Einschrankungen keine disjunkte Vereinigung sind, sondern sich schneiden, wobei wir 2 Die disjunkte Vereinigung ist durch: Lk t Ll = Lk [ Ll mit Lk \ Ll = ; deniert. A.3. MEHRFACHE EINSCHRANKUNGEN 149 topologisch immer die Situation eines transversalen Schnittes herbeifuhren konnen. Wir bezeichnen mit Lk ? Ll die Vereinigung der beiden Einschrankungen unter Beachtung des Schnittes. An dieser Stelle wollen wir nur die Betti-Zahlen angeben, ohne auf die Einzelheiten einzugehen. Es folgt b0 (B d n(Lk ? Ll )) = 1 + 1k + 21l bd;k;1(B d n(Lk ? Ll )) = 1 + 3lk bd;l;1 (B d n(Lk ? Ll )) = 1 + 3lk : Fur eine komplexe Schnittmenge steigt die kombinatorische Vielfalt schnell an. Das Prinzip bleibt aber bei allen Fallen dasselbe: Die Anzahl der Sattel auf einer Fitnesslandschaft wird durch Zwangsbedingungen erhoht. 150 ANHANG A. BERECHNUNG DER BETTI-ZAHLEN Anhang B Eigenwertproblem fur die Parabel B.1 Boltzmann-Strategie Im folgenden werden wir die Losungen fur das Eigenwertproblem (2.6) im Fall der Fitne (3.25) behandeln. Die Resultate dieses Anhangs sind in [41] veroentlicht worden. Nach langerer Rechnung erhalten wir die Eigenwerte n :::nd = Umin + 1 d X i=1 aiD (ni + 1) ni = 0; 1; 2; : : : und die Eigenfunktionen n1 :::nd (x1 ; : : : ; xd ) = Yd i=1 ni (xi ) 1 ! 0s a a i 2 @ i xi A ; ni (xi ) = exp ; 4 xi Hni 2 was zur Losung P (~x; t) = q X i=n1 +:::+nd ci Yd h k=1 i exp(;k2 )Hnk (k ) exp(;i t) (B.1) mit k = xk ak =2 und Hn( ) als Hermitesche Polynome, fuhrt. Als nachstes wollen wir die Anfangsbedingungen xieren und starten mit einer 151 152 DIE PARABEL ANHANG B. EIGENWERTPROBLEM FUR Delta-Funktion P (~x; 0) = Durch die Relation Z Yd i=1 (xi ; x(0) i ): p exp(; 2)Hn( )Hm( )d = mn Nn = mn 2n(n!) (B.2) erhalten wir fur die Koezienten in der Losung (B.1) q 2 (0) ck = N a Hni ai2xi i=1 ni i Yd (B.3) mit k = n1 + n2 + : : : + nd . Im Falle einer vollkommen symmetrischen Parabel a = a1 = a2 = : : : = ad mussen wir Kugelkoordinaten benutzen und bekommen die Eigenwerte = aDd (k + 1) mit d als Dimension der Landschaft. Damit bekommen wir die einfache Regel, da die Erhohung der Dimension zu einer Reskalierung der Diusionskonstante der Form D ! Dd aquivalent ist. Fur die beiden Falle ai > 0 bzw. ai < 0 erhalten wir kleine Unterschiede in den Eigenwertproblemen, so da die Geschwindigkeiten durch 1. ai > 0 v(1) = 2 cc2 2 exp(;2 t) (B.4) 1 s (2) (B.5) vk = a2 cc1 1 exp(;1 t) k 0 2. ai < 0 1 d X Yd H2ki +1(bj ) H2k+3(bi ) 2 X c2k e(; k t) 2k (2k+1)(2 (B.6) v(1) = N k+2)(2k+3) j i6 j (2k+1) 1 k=0 i=1 k :::kd k s 1 d X H2ki +1(bj(B.7) ) 2k+3 (bi ) Y vi(2) = a2 N1 c2k+1e(; k t) 2k+1 (2Hk+2)(2 k+3) (2k+1) 2 =1 = = 1+ k 1 k=0 2 +1 j =1 i6=j k1 +:::kd =k B.2. DARWIN-STRATEGIE mit N1 = 1 X k=0 153 c2k exp(;2k t) q Yd H2ki+1 (bi) (2k+1) i=1 k1 +:::kd =k als Normierungsfaktor und bi = 2Um =ai als Intervallange, gegeben sind. B.2 Darwin-Strategie Nun wollen wir das Eigenwertproblem (2.17) fur die Fitne (3.25) losen. Fur den Fall ai > 0 bekommen wir die Eigenwerte n :::nd = Umin + 1 2ai D ni + 21 d q X i=1 ni = 0; 1; 2; : : : und die Eigenfunktionen n1 :::nd (x1 ; : : : ; xd ) = Yd i=1 r ni (xi ) r ai ai 2 ni (xi ) = exp ; 4D xi Hni 2D xi 4 welche zur Losung # 2! k (B.8) P (~x; t) = ci exp ; 2 Hnk (k ) exp(;i t) i=n +:::+nd k=1 q mit k = xk ak =(2D) fuhren. Der Fall ai < 0 ist ein wenig komplizierter und im Fall einer Dimension erhalten wir einfach r ai ; i= 4 (B.9) i (xi ) = D;iBi ; 2D e xi p mit Bi = i=(2 Dai) und Dk (x) als parabolische Besselfunktion, welche vom Parameter Bi abhangt. In der Praxis konnen wir immer die Fitnessfunktion positiv wahlen. Diese Einschrankung fuhrt zu einer Einschrankung qdes Suchraums X auf einen d-dimensionalen Wurfel der Kantenlange bi = 2Um =ai. Auf dem Rand dieses Wurfels soll die Losung verschwinden. Genau diese X Yd " 1 4 1 2 4 DIE PARABEL ANHANG B. EIGENWERTPROBLEM FUR 154 Einschrankung erzeugt ein diskretes Spektrum, welches sich als Losung der Gleichung 1 q2 ; 1 ; arccosh = (;qAk )3=2 (B.10) ki 4 ki ki 6 U2pma+inDi darstellt, wobei die Koezienten Ak in [109] stehen und die Nullstellen uber p c = 2 ai deniert sind. Fur die Eigenwerte k in (2.28) erhalten wir n = d X i=1 n1 +:::nd =n s U m D ni = 2 a ; Um i ki ni : (B.11) Nach einer langeren Rechnung bekommen wir fur die Geschwindigkeiten die Ausdrucke 1. ai > 0 (Minimum) s mit ! d Da X 1 1 X i 2k (2k ; 1)!!(4k + 1)c2k 2k e; k t (B.12) N 2 k=1 s 1 i=1 X ! 1 2 D 3 (2) k +1 vi = a N 2 (2k + 1)!!c2k+12k+1 exp(;2k+1 t)(B.13) i 1 k=0 v(1) = 4 N1 = 2 1 X k=0 (2k (2k ; 1)!!)dc2k exp(;2k t) (B.14) als Normierung, wobei (2k ; 1)!! das Produkt uber alle ungeraden Zahlen ist. 2. ai < 0 (Maximum) v(1) = N1 2 vk(2) = N1 2 mit 0v 1 s 1 X d d u Y u ;( + ib = 2) i kj nent @t ;( 43 + ib =2) A Ik (k2) D j2a(B.15) i n i=1 k=1 4 :::nd n v 0 3 s 1 1 d u X Y u 2;( + ib = 2) j i nent @t ;( 14 + ib =2) Ii()A Ik (k ) j2aDk(B.16) i n i=1 4 1 X n1 + =1 = 4 =1 n1 +:::nd =n Ik (k ) = Zuk ;uk k y1(k )dk Ik ( 2) = k Zuk ;uk k2y2(k )dk (B.17) B.2. DARWIN-STRATEGIE Ik () = N = Zuk ;uk y1(k )dk 1 X n=1 n1 +:::nd =n 155 s uk = 2jaUmj j2aDk j bk = qnk (B.18) k 2 Djak j 4 0v 1 1 d u u Y ;( + ib = 2) k ent @t ;( 43 + ib =2) Ik () A k i=1 4 (B.19) und den Funktionen y1(); y2(), welche in ([109], S.692) als Reihen 4 2 1 k 2 y1(k ) = 1 + bk 2! + bk ; 2 4!k + : : : 5 3 3 k 2 y2(k ) = k + bk 3! + bk ; 2 5!k + : : : deniert sind. (B.20) (B.21) 156 DIE PARABEL ANHANG B. EIGENWERTPROBLEM FUR Anhang C Berechnung des Doppeltopfes An dieser Stelle sollen die Ergebnisse der Untersuchungen zum Problem des Doppeltopfes fur beide Strategien aufgelistet werden. Der Weg zur Gewinnung des Resultats wird entsprechend des Kapitels 3 durchlaufen. Der Rechenweg ist fur beide Strategien bis auf die Koezienten derselbe. Als Anfangsverteilung wurde eine -Funktion um x0 angenommen. C.1 Darwin-Strategie Aus der Formel (3.32) erhalten wir die stuckweise gegebene Losung fur die Anfangsverteilung P (x; 0) = (x ; x0 ) ( a1); x0; t) x 0 P (x; t) = GG1((xx ;; ab2 ==(2 1 2 (2b1 ); x0 ; t) x 0 (C.1) mit G1( ) als Greensche Funktion (3.32) und a = a1 ; a0 = (a2 )2=(4a1 ) ; s bzw. a = b1 ; a0 = (b2 )2 =(4b1) ; s fur die Konstanten in der Greenschen Funktion. Die Berechnung der Wahrscheinlichkeit (0; t) erfolgt durch die Formel R0 P (x; t) dx (0; t) = ;1 R1 P (x; t) dx : (C.2) ;1 Da die Rechnung nicht schwierig aber langwierig ist, wollen wir an dieser Stelle nur das Ergebnis angeben. Wenn wir mit erf die Fehlerfunktion be157 158 ANHANG C. BERECHNUNG DES DOPPELTOPFES zeichnen, dann erhalten wir den Ausdruck (C.3) (0; t) = +Db Db Da mit 2 r 0 2 !2 1 q a x a a 1 2 0 pDa ) A Da = exp 4; 4D coth(2t Da1) @ 4a22 + x20 ; 2a + p a cosh(2 t 1 1 1 1 # 2 a2x0 p 1 + a2 t q ; 2a pD sinh(2 t Da1) 4a1 cosh(2tpDa1 ) 1 2 0 13 !s r q x a a 0 p 1 coth(2t Da )A5 41 ; erf @ 2 + p 2 1 4a1 2 a1 cosh(2t Da1) 4D 0 2 2 s !21 q b b b x 0 p A Db = exp 4; 4D1 coth(2t Db1) @ 4b22 + x20 ; 2b2 + p b1 cosh(2t Db1) 1 1 2t # b x b 2 0 ; 2b pD sinh(2tpDb ) + 42b q 1 p 1 cosh(2t Db1 ) 1 1 2 0 13 s u !v q u x0 p t2 b1 coth(2t Db1)CA75 : 641 + erf B@ b2 + p 4b1 2 b1 cosh(2t Db1 ) 4D Die entsprechende Parameterabhangigkeit wurde in Kapitel 3 diskutiert. C.2 Boltzmann-Strategie Der Unterschied zur Darwin-Strategie besteht nur in der Umbenennung der Konstanten. Wir erhalten wieder fur die Anfangsverteilung P (x; 0) = (x ; x0 ) die Losung ( ; (a1x2 + a2 x + s)=2)G1(x ; a2=(2a1); x0; t) x 0(C.4) P (x; t) = exp( exp(; (b1 x2 + b2 x + s)=2)G1(x ; b2=(2b1); x0 ; t) x 0 mit G1 ( ) als Greensche Funktion (3.32) und a = D2 2a21 ; a0 = Da1 bzw. a = D2 2b21 ; a0 = Db1 fur die Konstanten in der Greenschen Funktion. Mit Hilfe des allgemeinen Ausdrucks (C.2) erhalten wir die Wahrscheinlichkeit (0; t) = +Bb (C.5) Bb Ba C.2. BOLTZMANN-STRATEGIE mit Ba 159 " 2 a1 x2 ! a = exp ; coth(2tDa1 ) 8a 2 + 2 0 + Dta1 ; p a2x0 2a1 D sinh(2tDa1 ) 3 1 !2 1 2 x 0 5 p 8a1 (coth(2tDa1 ) + 1) a2 coth(2tDa1 ) + D sinh(2tDa1 ) ; a1 1q 1 qp 1 ; erf 2 2a1 (coth(2tDa1 ) + 1) D(coth(2tDa1 ) + 1) sinh(2tDa1 ) 0 113 2x ; Da a2 coth(2tDa1 ) + pD sinh(2 1 tDa ) AA5 @ 2a1 (coth(2tDa1 ) + 1) " 2 b1 x2 ! b = exp ; coth(2tDb1 ) 8b 2 + 2 0 + Dtb1 ; p b2 x0 2b1 D sinh(2tDb1 ) 1 !2 3 1 2 x 0 5 p 8b1 (coth(2tDb1 ) + 1) b2 coth(2tDb1 ) + D sinh(2tDb1 ) ; Db1 q 1 qp 1 + erf 12 2b1 (coth(2tDb1 ) + 1) D(coth(2tDb1 ) + 1) sinh(2tDb1 ) 0 113 2x b2 coth(2tDb1 ) + pD sinh(2 ; Db1 tDb ) @ AA5 : 2b1 (coth(2tDb1 ) + 1) 0 1 Bb 0 1 Fur die entsprechenden Graphen bei Variation der Parameter siehe Kapitel 3. 160 ANHANG C. BERECHNUNG DES DOPPELTOPFES Anhang D Gemischte Strategie D.1 Maximum, Minimum, Sattel Das Verfahren zur Gewinnung der Geschwindigkeiten wurde ausfuhrlich in Kapitel 3 dargelegt, auf welches wir an dieser Stelle qverweisen. Dazu benutzen wir die Greensche Funktion (3.32) mit a = D2 2a21 + a1 ; a0 = Da1 ; s + a22 =(4a1). Fur das Minimum erhalten wir v(1) = q q ; aD ( 2aD + )D sinh(4t aD( 2aD + )) 2a2 D + a +2x20 a3 4D + 2x20 a2 2 + 4x20DA 2 + 2x20 s 2 q ; cosh(2t aD( 2aD + )) a( aD + ) 4D(x0a )2 + 4x20a + (D.1) D q q 2 2 2 2 2 2 + +2Da + 8x0 D + a Da(aD + ) + 4x0 Da(aD + ) q q 2 2 cosh (2t aD( aD + )) cosh2 (2t aD( 2aD + ))(8a2 D2 4+ q q 2 2 2 +8a D + ) ; Da(aD + ) sinh(4t aD( 2aD + ))(4a 2D + 2 ) ;1 q q 2 3 2 2 4 2 2 ;6 Da + 2Da aD ( aD + ) sinh(4t aD( aD + )) + D a ; wahrend nach einer Transformation t ! it fur das Maximum q q v(1) = ; aD ( 2aD + )D sin(4t aD( 2aD + )) 2a2 D + a +2x20 a3 4D + 2x20 a2 2 + 4x20DA 2 + 2x20 161 (D.2) 162 ANHANG D. GEMISCHTE STRATEGIE s 2 q + ) 4D(x a )2 + 4x2 a + ; cos(2t aD( 2aD + )) a( aD 0 0 D q q + +2Da 2 + 8x20D + a 2 Da(aD 2 + ) + 4x20 Da(aD 2 + ) q q cos2(2t aD( 2aD + )) cos2 (2t aD( 2aD + ))(8a2D2 4+ q q +8a 2D + 2 ) ; Da(aD 2 + ) 2 (4t aD( 2aD + ))(4a 2D + 2 ) ;1 q q ;6 2Da + 2Da 3 aD ( 2aD + ) 2 (4t aD( 2aD + )) + D2a2 4 gilt. Die letzte Geschwindigkeit besitzt Singularitaten, die durch die fehlenden Unitaritat der Transformation bedingt sind. Durch ein Abschneiden nach einer gewissen Zeit kann dieser Artefakt behoben werden. D.2 Barriere Die Ausdrucke fur diese Strategie ergeben sich durch Kombination der vorherigen Strategien. Wir erhalten fur die Anfangsverteilung P (x; 0) = (x ; x0 ) die Losung ( ; (a1 x2 + a2x + s)=2)G1(x ; a2=(2a1 ); x0; t) x 0 (D.3) P (x; t) = exp( exp(; (b1x2 + b2 x + s)=2)G1(x ; b2 =(2b1); x0 ; t) x 0 q mit G1 ( ) als Greensche Funktion (3.32) und a = D2 2a21 + a1 ; a0 = q Da1 ; s + a22 =(4a1 ) bzw. a = D2 2b21 + b1; a0 = Db1 ; s + b22 =(4b1 ) fur die Konstanten in der Greenschen Funktion. Mit Hilfe des allgemeinen Ausdrucks (C.2) erhalten wir fur die Wahrscheinlichkeit (D.4) (0; t) = +Mb Mb Ma mit " q 2 2 a1 x2 ! 2t a a 2 0 2 2 Ma = exp ; coth(2t D a1 + a1 D) 8a + 2 + Dta1 + 4a2 1 1 a x 2 0 q ; p 2a1 D sinh(2t D2a21 2 + a1D) D.2. BARRIERE 163 1q + q2 2 8 a + a1 =D coth(2t D2a21 2 + a1 D) + a1 q1 q a2 a21 2 + a1=D coth(2t D2a21 2 + a1D)=a1 123 q2x0 2 ; a1A 75 +p 2 2 D sinh(2t D a1 + a1D) q 2 D2a1 2 + a1 D rp q q q D( a21 2 + a1=D coth(2t D2a21 2 + a1 D) + a1 ) sinh(2t D2a21 2 + a1D) " r q q 1 1 ; erf 2 2( a21 2 + a1=D coth(2t D2a21 2 + a1D) + a1 ) q 2 0 q2 2 113 2x 2 a1 2 + a1 D)=a1 + p p a + a =D coth(2 t D ; a a 1 1 2 1 CCCC77 BB D sinh(2t D a +a D) q 2 q2 2 AA5 @ 2 a1 + a1 =D(coth(2t D2 a1 2 + a1 D) + a1 ) " q 2 b1 x2 ! 2t b 2 2 2 2 = exp ; coth(2t D b1 + b1 D) 8b 2 + 2 0 + Dtb1 + b 4b1 1 bq2 x0 ; p 2b1 D sinh(2t D2 b21 2 + b1 D) 1q q2 2 8 b1 + b1 =D coth(2t D2b21 2 + b1 D) + b1 q q b2 b21 2 + b1 =D coth(2t D2 b21 2 + b1 D)=b1 12 3 q2x0 2 ; b1A 75 +p 2 2 D sinh(2t D b1 + b1 D) q 2 D2b1 2 + b1 D rp q q q D( b21 2 + b1 =D coth(2t D2b21 2 + b1 D) + b1 ) sinh(2t D2b21 2 + b1 D) " r q q 1 2 2 2( b1 + b1 =D coth(2t D2b21 2 + b1 D) + b1 ) 1 ; erf 2 0 2 2 2 1 Mb 1 164 ANHANG D. GEMISCHTE STRATEGIE q 2 0 q2 2 113 2 x 2 2 p p ; b b b + b =D coth(2 t D b + b D ) =b + 1 CC7 1 1 1 1 BB 2 1 D sinh(2t D b +b D) CACA75 : q q @ 2 2 2 2 2 2 b1 + b1 =D(coth(2t D b1 + b1 D) + b1 ) 0 2 2 1 2 1 Die entsprechenden Graphen fur die Wahrscheinlichkeit in Abhangigkeit von den Parametern sind in Kapitel 3 dargestellt. Literaturverzeichnis [1] R.P. Feynman. Space-time approach to non-relativistic quantum mechanics. Rev. Mod. Phys., 20:267, 1948. [2] R.P. Feynman and Hibbs. Quantum mechanics and path integrals. Int. Series in Pure and Applied Physics. McGraw-Hill, Inc., 1965. [3] I. Prigogine. Introduction To Thermodynamics of Irreversible Processes. Wiley Interscience, New York, 1967. [4] N.G. van Kampen. Stochastic processe in physics and chemistry. NorthHolland Publishing Company, Amsterdam-New York-Oxford, 1981. [5] Ch. Darwin. The origin of species. Crowell-Collier Publishing Company, Toronto/Ontario 1962, 1859. [6] S. Kirkpatrick, C.D. Gelatt Jr., and M.P. Vecchi. Optimization by simulated annealing. Science, 220:671{680, 1983. [7] P.J.M. Laarhoven and E.H.C. Aarts. Simulated Annealing: Theory and Applications. Reidel, Dordrecht, 1987. [8] I. Rechenberg. Evolutionsstrategien - Optimierung technischer Systeme nach Prinzipien der biologischen Information. Friedrich Frommann Verlag (Gunther Holzboog K.G.), Stuttgart - Bad Cannstatt, 1973. [9] H.-P. Schwefel. Numerische Optimierung von Computer-Modellen mittels der Evolutionsstrategie, volume 26 of Interdisciplinary system research. Birkhauser Verlag, Basel, 1977. [10] T. Back and H.-P. Schwefel. An overview of evolutionary algorithms for parameter optimization. Evolutionary Computation, 1:1, 1993. 165 166 LITERATURVERZEICHNIS [11] H.P. Schwefel. Evolution and optimum seeking. Wiley, New York, 1995. [12] Th. Back. Evolutionary Algorithms in Theory and Practice. Oxford University Press, Oxford, 1996. [13] J.H. Holland. Outline for a logical theory of adaptive systems. Journal of the Association for Computer Machinery, 3:297{314, 1962. [14] J.H. Holland. Adaptation in natural and articial systems. The University of Michigan Press, Ann Arbor (MI), 1975. [15] J.H. Holland. Genetic algorithms. Scientic American, 267:44{50, 1992. [16] L.J. Fogel, A.J. Owens, and M.J. Walsh. Articial Intelligence through Simulated Evolution. Wiley, New York, 1966. [17] D. B. Fogel. System identication through simulated evolution: A Machine Learning Approach to Modeling. Ginn Press, Needham Heights, 1991. [18] D.B. Fogel. Evolutionary computation { toward a new philosophy of machine intelligence. IEEE Press, Piscataway NJ, 1995. [19] J.R. Koza. Hierarchical genetic algorithms operating on populations of computer programs. In N.S. Sridharan, editor, Eleventh International Joint Conference on Articial Intelligence (IJCAI-89), Palo Alto (CA), 1989. Morgan Kaufman. [20] J.R. Koza. Genetic programming: On the programming of computers by means of natural selection. MA. MIT Press, Cambridge, 1992. [21] W. Ebeling and R. Feistel. Physik der Selbstorganisation und Evolution. Akademie-Verlag, Berlin, 1982. [22] R. Feistel and W. Ebeling. Evolution of Complex Systems. Kluwer Academic Publ., Dordrecht, 1989. [23] W. Ebeling, A. Engel, and R. Feistel. Physik der Evolutionsprozesse. Akademie-Verlag, Berlin, 1990. LITERATURVERZEICHNIS 167 [24] R. Feistel and W. Ebeling. Models of Darwinian processes and evolutionary principles. BioSystems, 15:291 { 299, 1982. [25] W. Ebeling and A. Engel. Models of evolutionary systems and their application to optimization problems. Syst. Anal. Model. Simul., 3:377{ 385, 1986. [26] T. Boseniuk, W. Ebeling, and A. Engel. Boltzmann and Darwin Strategies in Complex Optimization. Phys. Lett., 125:307{310, 1987. [27] T. Boseniuk and W. Ebeling. Optimization of NP-vomplete problems by Boltzmann-Darwin strategies including life cycles. Europhysics Letters, 6:107{112, 1988. [28] T. Boseniuk and W. Ebeling. Evolution strategies in complex optimization: The travelling salesman problem. System Analysis - Modeling - Simulation, 5:413{422, 1988. [29] T. Boseniuk and W. Ebeling. Boltzmann- , Darwin- and Haeckelstrategies in optimization problems. In PPSN Dortmund, 1990. [30] H.-P. Schwefel. Numerical Optimization of Computer Models. Wiley, New York, 1981. [31] H. Rose. Von Boltzmann und Darwin zum Self Annealing - Strategien evolutionarer Optimierung. In Jan A. Freund, editor, Dynamik, Evolution, Strukturen. Verlag Dr. Koster, Berlin, 1996. [32] A. Einstein. Grundlage der allgemeinen Relativitatstheorie. Ann. Phys.(Leipzig), 49:769{822, 1916. [33] H. Weyl. Eine neue Erweiterung der Relativitatstheorie. Ann. Phys.(Leipzig), 59:101{133, 1919. [34] H. Weyl. Elektron und Gravitation. Z. Phys., 56:330{352, 1929. [35] J. Milnor and J. Stashe. Characteristic Classes. Ann. Math. Studies,76. Princeton Univ. Press, Princeton, N.J., 1974. [36] G. Rudolph. Convergence Properties of Evolutionary Algorithms. Doktorarbeit, Universitat Dortmund, Fachbereich Informatik, 1996. 168 LITERATURVERZEICHNIS [37] V. Buchholtz and T. Poschel. Adaptive evolutionary optimization of team work. Int. J. Bifurkation and Chaos, 7:751{757, 1997. [38] F.-M. Dittes. Optimization on rugged landscapes: a new general purpose monte carlo approach. Phys. Rev. Lett., 76:4651 { 4655, 1996. [39] H. Rose. Evolutionare Strategien und Multitome Optimierung. Doktorarbeit, Humboldt Universitat, Berlin, 1998. [40] H. Rose F. Schweitzer, W. Ebeling and O. Weiss. Network optimization using evolutionary strategies. In PPSN, 1996. [41] T. Asselmeyer and W. Ebeling. Unied description of evolutionary strategies over continous parameter spaces. BioSystems, 41:167{178, 1996. [42] N. Metropolis, A. Rosenbluth, M. Rosenbluth, A. Teller, and E. Teller. Equation of state calculations by fast computing machines. J. Chem. Phys., 21:1087{1092, 1953. [43] S. Schaer. Unconstrained global optimization using stochastic integral equations. Optimization, 35:43{60, 1995. [44] H. Szu and R. Hartley. Fast simulated annealing. Phys. Lett. A, 122:157, 1987. [45] L. Ingber. Very fast simulated annealing. J. Math. Comp. Modelling, 12:967, 1989. [46] B. Andresen. Finite-time thermodynamics and simulated annealing. In Proceedings of the Fourth International Conference on Irreversible Processes and Selforganization, Rostock, 1989. [47] P. Sibiani, K.M. Pedersen, K.H. Homann, and P. Salamon. Monte carlo dynamics of optimization: A scaling description. Phys. Rev., A 42:7080, 1990. [48] B. Andresen and J.M. Gordon. Analytic constant thermodynamic speed-cooling strategies in simulated annealing. Open Sys. and Inf. Dyn., 2:1{12, 1993. LITERATURVERZEICHNIS 169 [49] B. Andresen and J.M. Gordon. Constant thermodynamic speed for minimizing entropy production in thermodynamic processes and simulated annealing. Phys. Rev. E, 50:4346{4351, 1994. [50] T. Asselmeyer, W. Ebeling, and H. Rose. Smoothing representation of tness landscapes - the genotype-phenotype map of evolution. BioSystems, 39:63{76, 1996. [51] G. Jetschke. Mathematik der Selbstorganisation. Deutscher Verlag der Wissenschaften, Berlin, 1989. [52] R.A. Fisher. The Genetical Theory of Natural Selection. Oxford University Press, Oxford, 1930. [53] M. Eigen. The selforganization of matter and the evolution of biological macromolecules. Naturwiss., 58:465, 1971. [54] L. Schimansky-Geier. Beschreibung evolutionarer Algorithmen durch 2-Teilchenreaktionen. Vortrag im Montagsseminar, 1996. [55] T. Asselmeyer, W. Ebeling, and H. Rose. Analytical and numerical investigations of Evolutionary Algorithms in continous spaces. In PPSN, 1996. [56] T. Asselmeyer. Analytische und numerische Untersuchungen zur adaptiven Fisher-Eigen-Strategie. interner EVOALG-Bericht, 1996. [57] N. Berline, M. Vergne, and E. Getzler. Heat kernels and Dirac Operators. Springer Verlag, New York, 1992. [58] T. Asselmeyer, W. Ebeling, and H. Rose. Evolutionary Strategies of Optimization. Phys. Rev. E, 56:1171{1180, 1996. [59] M. Morse. The calculus of variation in the large. AMS, New York, 1934. [60] J. Milnor. Morse theory. Ann. of Mathematical Study 51. Princeton Univ. Press, Princeton, 1963. [61] M. Conrad and W Ebeling. M.V. Volkenstein, evolutionary thinking and the structue of tness landscapes. BioSystems, 27:125, 1992. 170 LITERATURVERZEICHNIS [62] M.V. Volkenstein. Physical Approaches to Biological Evolution. Springer Verlag, Berlin, 1994. [63] P.F. Stadler. Towards a theory of landscapes. In Complex Systems and Binary Networks (Proceeding of the Guanajuato Lectures 1995). Springer-Verlag, 1996. [64] E.D. Weinberger. Fourier and Taylor series on tness landscapes. Biological Cybernetics, 65:321{330, 1991. [65] B.V. Petukhov and V.L. Pokrovski. Quantum and classical motion of dislocations in a Peierls potential relief. Soviet Physics JETP, 36:336{ 342, 1973. [66] E.M. Harrell. Double wells. Commun. Math. Phys., 75:239{261, 1980. [67] U. Weiss, H. Grabert, P. Hanggi, and P. Riseborough. Incoherent tunneling in a double well. Phys. Rev. B, 35:9535{9551, 1987. [68] A. Ranfagni and D. Mugnai. Stochastic model for tunnelling processes: The question of superluminal behavior. Phys. Rev. E, 52:1128{1134, 1995. [69] V.I. Yukalov and E.P. Yukalov. Asymptotic properties of eigenvalues in variational calculations for double-well oscillators. J. Phys. A: Math. Gen., 29:6429{6442, 1996. [70] L.D. Landau and E.M. Lifschitz. Lehrbuch der Theoretischen Physik, Band 3: Quantenmechanik, Akademie-Verlag, Berlin 1983. [71] D.T. Gillespie. A general method for numerically simulating the stochastic time evolution of coupled chemical reactions. J. Comp. Phys., 22:403{434, 1976. [72] R. Feistel. Betrachtung der Realsierung stochastischer Prozesse aus automatentheoretischer Sicht. Wiss. Z. W. Pieck Univ. Rostock, 26:663, 1977. [73] D.T. Gillespie. Monte carlo simulation of random walks with residence time dependent transition probability rates. J. of Comp. Phys., 28:435{ 450, 1978. LITERATURVERZEICHNIS 171 [74] R.L. Stratonovich. Topics in the theory of random noise, volume 1. Gordon & Breach, New York, 1963. [75] I. Matheson, D.F. Walls, and C.W. Gardiner. J. stat. phys., 12:21, 1975. [76] A.N. Kolmogorov and S.V. Fomin. Reelle Funktionen und Funktionalanlysis. Deutscher Verlag der Wissenschaften, Berlin, 1975. [77] P.B. Gilkey. Invariance, the heat equation and the Atiyah-Singer index theorem. Publish or Perish, Washington, 1984. [78] A. Engel. Selektion und Diusion in stochastischen Feldern. Diplomarbeit, Humboldt Universitat, Berlin, 1983. [79] F. Riesz and B. Sz.-Nagy. Vorlesungen uber Funktionalanalysis. Deutscher Verlag der Wissenschaften, Berlin, 1982. [80] N. Steenrod. The Topology of Fiber Bundles. Princeton University Press, Princeton, N.J., 1951. [81] R. Bott and L.W. Tu. Dierential Forms in Algebraic Topology. Graduate Texts in Mathematics 82. Springer-Verlag, 1995. [82] R. Bott. An application of the Morse theory to the topology of Liegroups. Bull. Soc. Math. France, 84:251 { 281, 1956. [83] J.F. Adams. Stable homotopy and generalised homology. Chicago Lectures in Mathematics. The University of Chicago Press, Chicago and London, 1974. [84] M. Atiyah. K-Theory. W.A. Benjamin, New York{Amsterdam, 1967. [85] M. Karoubi. K-Theorie - An Introduction, Grundlehren der Mathematischen Wissenschaften Band 226. Springer Verlag, Berlin - Heidelberg - New York 1978. [86] G.J. Murphy. C -Algebras and Operator Theory. Academic Press Inc., San Diego, 1990. [87] T.W. Palmer. Real C -algebras. Pac. J. Math., 35:195 { 204, 1970. 172 LITERATURVERZEICHNIS [88] J. Milnor. Construction of universal bundles I. Ann. Math., 63:272 { 284, 1956. [89] B.E. Blakadar. K-theory for Operators. Springer Verlag, New York Berlin, 1986. [90] R. Swan. Vector bundles and projective modules. Trans. Amer. Math. Soc., 105:264 { 277, 1962. [91] H. Schroder. K-theory for real C -algebras and application. Longman Scientic & Technical, Harlow, 1993. Copublished in The United States with John Wiley & Sons, Inc., New York. [92] T. tom Dieck. Topologie. Walter de Gruyter, Berlin-New York, 1991. [93] J. Milnor. Construction of universal bundles II. Ann. Math., 63:430 { 436, 1956. [94] R. Kultze. Garbentheorie. B.G. Teubner, Stuttgart, 1970. [95] G. Eisenreich. Vorlesung uber Funktionentheorie mehrer Variabler. Teubner Texte zur Mathematik. BSB B.G. Teubner Verlagsgesellschaft, Leipzig, 1980. [96] B. Iversen. Cohomology of Sheaves. Springer, Berlin, 1990. [97] M. Golubitsky and V. Guillemin. Stable Mappings and their Singularities. Graduate Texts in Mathematics 14. Springer Verlag, New York-Heidelberg-Berlin, 1973. [98] T. Asselmeyer. Losungsklassen Evolutionarer Algorithmen und Quantenstatistik. In J. Freund, editor, Dynamik, Evolution, Strukturen. Verlag Dr. Koster, Berlin, 1996. [99] P.A. Griths and J.W. Morgan. Rational homotopy theory and dierential forms. Birkhauser, Boston, 1981. [100] D.S. Freed. An index theorem for families of Fredholm operators parametrized by a group. Topology, 27:279{300, 1988. [101] P.S. Laplace. Oeuvres. Gauthier-Villars, Paris, 1878-1912. LITERATURVERZEICHNIS 173 [102] P. Levy. Calcul des probabilites. Gauthier-Villars, Paris, 1925. [103] I. Fredholm. Sur une classe d'equations fonctionnelles. Act. Math., 27:365{390, 1903. [104] D. Hilbert. Grundzuge einer allgemeinen Theorie der linearen Integralgleichungen. Teubner, Leipzig, 1912. [105] C. Kappler. Are evolutionary strategies improved by large mutations? In H.-M. Voigt et al., editors, Proceedings of PPSNIV, Int. Conf. on Evolutionary Computation, Berlin, 1996. Springer. [106] P.G. Bergmann and J.L. Lebowitz. New approach to nonequilibrium processes. Phys. Rev., 99:578{587, 1955. [107] J.L. Lebowitz and P.G. Bergmann. Irreversible Gibbsian ensembles. Ann Phys. (NY), 1:1{23, 1957. [108] R. Stocker and H. Zieschang. Algebraische Topologie. B.G. Teubner, Stuttgart, 1988. [109] Milton Abramowitz and Irene A. Stegun. Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematical Series 55. National Bureau of Standards, December 1972. Danksagung An dieser Stelle mochte ich meinem Betreuer Prof. W. Ebeling fur die Zusammenarbeit danken. Er hat mir trotz unterschiedlicher Meinungen immer zur Seite gestanden. Vor allem akzeptierte er die Vorlieben seines Schutzlings und unterstutzte sie an einigen Stellen. Es ist fur mich schwierig, meinen Dank an Helge und Udo richtig auszudrucken. Ihr seid fur mich nicht nur die besten Diskussionspartner und Kritiker in allen wissenschaftlichen Fragen, sondern auch sehr gute Freunde. Habt Dank fur die schonen vergangenen und zukunftigen Stunden und naturlich fur die Unterstutzung und das Verstandnis beim Schreiben dieser Arbeit. Gerade in der Phase der Fertigstellung war es sicherlich nicht einfach mit mir umzugehen. Fur die vielen Diskussionen mathematischer Fragen mochte ich meinem Freund Thomas und Prof. Nietzsch danken. Ich war sicherlich kein einfacher Diskussionspartner, trotzdem brachten Sie immer viel Verstandnis fur mich auf. Den Mitarbeitern des Lehrstuhls Statistische Physik und Nichtlineare Dynamik\ sowie den Mitstreitern beim" Projekt EVOALG danke ich fur viele Diskussionen. Diese Arbeit ist im Rahmen des Projektes EVOALG entstanden, welches vom BMBF unterstutzt wurde. Ein besonderer Dank an meine Eltern fur Ihre bedingungslose Unterstutzung LITERATURVERZEICHNIS 175 meiner Arbeit. Die Phase der Fertigstellung erforderte viel Verstandnis fur meine Gefuhlsschwankungen, die Du, liebe Andrea, aushalten mutest. Dafur mochte ich Dir danken.