Schr odinger-Operatoren und Evolution are Strategien

Werbung
Schrodinger-Operatoren und
Evolutionare Strategien
Dissertation
zur Erlangung des akademischen Grades
doctor rerum naturalium
( Dr. rer. nat. )
im Fach Physik
eingereicht an der
Mathematisch{Naturwissenschaftlichen Fakultat I
der Humboldt-Universitat zu Berlin
von
Dipl. Phys. Torsten Aelmeyer
geboren am 1.10.1970 in Lauchhammer
Prasident der Humboldt-Universitat zu Berlin
Prof. Dr. Dr. H. Meyer
Dekanin der Humboldt-Universitat zu Berlin
Prof. Dr. V. Bonacic-Koutecky
Gutachter: 1. Prof. W. Ebeling
2. Prof. J. Nietzsch
3. Prof. R. Keiper
Tag der mundlichen Prufung: 22. Dezember 1997
Inhaltsverzeichnis
1 Einleitung
5
2 Ein physikalischer Zugang zu den EA
2.1
2.2
2.3
2.4
2.5
2.6
Die Boltzmann-Strategie . . .
Die Darwin-Strategie . . . . .
Die Gemischte Strategie . . .
Die adaptive Darwin-Strategie
Die Selfannealing-Strategie . .
Einheitliche Beschreibung . .
3 Der Vergleich von Strategien
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3.1 Vergleichsmae fur die Strategien . . . . . . . .
3.1.1 Denition der Mae . . . . . . . . . . . .
3.1.2 Die Boltzmann-Strategie . . . . . . . . .
3.1.3 Die Darwin-Strategie . . . . . . . . . . .
3.1.4 Weitere Strategien . . . . . . . . . . . .
3.2 Vergleich der Boltzmann- und Darwin-Strategie
3.2.1 Topologie von Fitnesslandschaften . . . .
3.2.2 Gemeinsamkeiten . . . . . . . . . . . . .
3.2.3 Unterschiede . . . . . . . . . . . . . . . .
3.3 Die Gemischte Strategie . . . . . . . . . . . . .
3.3.1 Diskussion des Verhaltens . . . . . . . .
3.3.2 Wahl der Parameter . . . . . . . . . . .
3.4 Simulation der Strategien . . . . . . . . . . . .
3.4.1 Die Boltzmann-Strategie . . . . . . . . .
3.4.2 Die Darwin-Strategie . . . . . . . . . . .
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
18
24
28
31
34
35
39
40
40
43
43
44
44
45
47
54
64
65
68
73
74
75
INHALTSVERZEICHNIS
2
4 Mathematische Untersuchung
4.1 Spektrale Eigenschaften . . . . . . . . . . . .
4.1.1 Die Eigenschaften des Spektrums . . .
4.1.2 Eigenwerte und Korrelationsfunktionen
4.1.3 Deformation der Fitnessfunktion . . .
4.2 Konstruktion des Losungsraumes . . . . . . .
4.3 Die Eigenschaften des Losungsraumes . . . . .
4.4 Beschreibung durch stabile Funktionenkeime .
4.5 Die Klassikation des Losungsverhaltens . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
77
. 78
. 78
. 84
. 87
. 88
. 93
. 101
. 103
5 Die Klassikation der Strategien
109
6 Variation der Mutationsverteilung
121
5.1 Der Weg zur Klassikation . . . . . . . . . . . . . . . . . . . . 109
5.2 Die Klassikation der Darwin-Strategie . . . . . . . . . . . . . 114
5.3 Die Ausdehnung der Klassikation . . . . . . . . . . . . . . . 117
6.1
6.2
6.3
6.4
6.5
Einfuhrung . . . . . . . . .
Gau-verteilte Mutationen .
Cauchy-verteilte Mutationen
Einheitliche Beschreibung .
Ansatze zur Klassikation .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 121
. 124
. 129
. 136
. 138
7 Zusammenfassung
141
Anhange
144
A Berechnung der Betti-Zahlen
145
B Eigenwertproblem fur die Parabel
151
C Berechnung des Doppeltopfes
157
A.1 Axiomatische Einfuhrung der Homologie . . . . . . . . . . . . 145
A.2 Einfache Einschrankungen . . . . . . . . . . . . . . . . . . . . 146
A.3 Mehrfache Einschrankungen . . . . . . . . . . . . . . . . . . . 148
B.1 Boltzmann-Strategie . . . . . . . . . . . . . . . . . . . . . . . 151
B.2 Darwin-Strategie . . . . . . . . . . . . . . . . . . . . . . . . . 153
C.1 Darwin-Strategie . . . . . . . . . . . . . . . . . . . . . . . . . 157
C.2 Boltzmann-Strategie . . . . . . . . . . . . . . . . . . . . . . . 158
INHALTSVERZEICHNIS
3
D Gemischte Strategie
161
Literaturverzeichnis
165
D.1 Maximum, Minimum, Sattel . . . . . . . . . . . . . . . . . . . 161
D.2 Barriere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
4
INHALTSVERZEICHNIS
Kapitel 1
Einleitung
\. . . Im Unterschied zu Newton und Schoppenhauer
hat Ihr Ahne nicht an eine gleichformige, absolute Zeit
geglaubt. Er glaubte an unendliche Zeitreihen, an ein
wachsendes, schwindelerregendes Netz auseinanderund zueinanderstrebender paralleler Zeiten. Dieses
Webmuster aus Zeiten, die sich einander nahern, sich
verzweigen, sich scheiden oder einander jahrhundertelang ignorieren, umfat alle Moglichkeiten. . . "
Jorge Luis Borges, "Der Garten der Pfade, die sich
verzweigen\ (Fiktionen, 1944)
Evolutionare Optimierung und Quantenmechanik
Es ist nicht bekannt, wann die Menschen vor dem ersten Optimierungsproblem standen, jedoch ist klar, da uberall im taglichen Leben Aufgaben ihrer Losung bedurfen, die im Kern das Aunden eines Optimums beinhalten.
Seit dem Anfang der 60er Jahre wurde dazu ein Vorgang betrachtet, der
erst einmal rein biologischen Ursprungs ist: die Evolution. Im abstrakten
Sinne besteht die Evolution aus den 3 Prozessen Mutation, Selektion und
Reproduktion, die zu einer Hoherentwicklung bzw. Verbesserung (in Bezug
auf die Anpassung an die Umwelt) eines Individuums fuhren. Dieser Vor5
6
KAPITEL 1. EINLEITUNG
gang stellt also eine Optimierung der Anpassungsfahigkeit dar. Im folgenden soll eine Beschreibungsweise fur die Evolution und deren Entsprechung
in der Optimierungstheorie, die als Evolutionarer Algorithmus bezeichnet
wird, gefunden werden. Dazu gehen wir dieses Probleme mit Hilfe physikalischer Methoden an, wobei es verschiedene Moglichkeiten gibt. Wir beginnen
an dieser Stelle mit der Umformulierung der Variationsprinzipien der klassischen Mechanik durch die Quantenmechanik entsprechend Feynman [1].
Eine Weiterentwicklung dieses Gedankens wird uns dann zu einem einfachen
Modell fur einen Evolutionaren Algorithmus fuhren.
Das erste Beispiel fur die Betrachtung eines Variationsprinzips ist das
Fermat'sche Prinzip. Dieses Prinzip beschreibt den optimalen Weg, welchen das Licht zwischen zwei Orten zurucklegt. Es ist ein Variationsprinzip,
bei dem die minimale Zeit gesucht wird, die das Licht zwischen zwei Punkten benotigt. Verallgemeinern wir das o.g. Prinzip, was durch eine Reihe
von Physikern und Mathematikern in der Mitte des 18. Jahrhunderts getan
wurde, indem wir eine Groe Wirkung minimieren, lat sich ein Formalismus
(Lagrange-Formalismus) ableiten, mit dessen Hilfe wir z.B. die Bewegung
eines Teilchens unter bestimmten Zwangsbedingungen nachvollziehen bzw.
vorhersagen konnen.
Eine abstrakte Formulierung der Minimierungs- bzw. Maximierungsprinzipien in der Physik ist durch die Einfuhrung eines Zustandsraumes und
eines positiven Funktionals, im obigen Fall Zeit bzw. Wirkung, auf diesem
Raum gegeben. Durch Variation des Funktionals erhalten wir die dynamischen Gleichungen des Zustandes. Entlang der optimalen Trajektorie nimmt
das Funktional sein Extremum an. Nun konnten wir uns naturlich fragen,
warum gerade die dynamischen Gleichungen zu einer Minimierung der Wirkung fuhren. Eine mogliche Antwort wurde von Feynman im Rahmen seiner
Pfadintegralformulierung der Quantenmechanik gegeben [1, 2]. Er betrachtete ein quantenmechanisches Teilchen, dessen Zustandsfunktion eine Phase
und Amplitude besitzt, welches sich vom Punkt A nach B bewegt. In Anlehnung an die Arbeiten Wiener's zur Brownschen Bewegung betrachtete
er die Menge aller Pfade von A nach B und wichtete die Moglichkeit der
Realisierung durch eine komplexe Funktion. Die Form dieser Funktion ergab
sich aus der Analyse der innitesimalen Bewegung eines quantenmechanischen Teilchens und ist einfach durch exp(iS [x]) mit der Wirkung S [x] des
zum quantenmechanischen System korrespondierenden klassischen Systems,
7
gegeben. Fur kleine Abstande1 werden alle Pfade zwischen A und B durchlaufen. Die Integration uber alle Pfade mit der Funktion exp(iS [x]) als Wichtungsfaktor fuhrt zur quantenmechanischen U bergangsamplitude zwischen A
und B 2. Dagegen wird im Falle groerer (makroskopischer) Abstande die unterschiedliche Phasenbeziehung zwischen den Pfaden bedeutsam. Die Wahrscheinlichkeitsamplituden der einzelnen Pfade interferieren miteinander und
loschen sich aus. Dabei bleibt als einziger Pfad die klassische Trajektorie der
extremalen Wirkung ubrig.
Es scheint also, da die Quantenmechanik einen anderen Zugang zur Bestimmung von Extrema fur Funktionale bietet. Leider birgt die Theorie eine
entscheidende Schwierigkeit in sich: Die Trajektorie der extremalen Wirkung
wird nur fur groe Abstande zwischen A und B angenommen. Wie wir sofort ersehen konnen, liegt naturlich die Schwierigkeit im Wichtungsfaktor der
Pfade. Wenn wir bedenken, da die Wirkung fur unser Problem minimiert
wird, so konnen wir einfach den neuen Wichtungsfaktor exp(;S [x]) ansetzen. Im Gegensatz zur Quantenmechanik ist das entsprechende Pfadintegral
nun eine U bergangswahrscheinlichkeit.
Um die Beziehungen dieses Pfadintegrals zur Kinetik und statistischen
Physik klarer herauszuarbeiten, wollen wir eine andere Argumentation aufbauen, die auf dasselbe Ergebnis fuhrt. Dazu betrachten wir die Newton'schen Bewegungsgleichungen
~x_ = ~v
~v_ = ;rF
(1.1)
auf dem Raum X mit dem Potential F : X ! IR, mit den Fixpunkten (~v = 0,
rF = 0). Diese Dynamik kann leicht aus der Variation der klassischen
Wirkung
S [x; t] =
Zt 1
0
_ 2
2 (~x( )) ; F (x) d
(1.2)
in Bezug auf feste Anfangs- und Endpunkte abgeleitet werden. Nun lassen
wir alle moglichen Pfade zwischen den festen Punkten A und B zu. Alle diese
Damit sind Abstande gemeint, die in der Groenordnung des quantenmechanischen
Systems liegen.
2 Lassen wir zu, da der Endpunkt B ein beliebiger Punkt sein darf, so erhalten wir die
Wellenfunktion des Systems in Abhangigkeit vom Endpunkt B .
1
KAPITEL 1. EINLEITUNG
8
Pfade konnen aus der klassischen Trajektorie (1.1) durch die Einfuhrung einer
zufalligen Kraft gewonnen werden, d.h. einer Kraft, die in Bezug auf eine
Wahrscheinlichkeitsverteilung zufallig gegeben ist. Wie konnen wir nun diese
Verteilung bestimmen, so da fur groe Zeiten nur die klassische Trajektorie
ubrigbleibt? Die Antwort auf diese Fragen wollen wir durch eine Analogie
zur statistischen Physik geben. Dort ist die Wahrscheinlichkeit w dafur, da
die Groe x einen Wert im Intervall [x; x + dx] annimmt, durch w(x) exp(S (x)) gegeben, wobei S (x) die Entropie ist. Andererseits streben aber
Gleichgewichtssysteme entsprechend dem 2. Hauptsatz zur Maximierung
der Entropie. An dieser Stelle sei auf den prinzipiellen Unterschied zwischen
Entropie und Wirkung hingewiesen. Die Entropie ist die Kennzeichnung des
Ordnungszustands fur ein Ensemble im Gleichgewicht. Im Gegensatz dazu
bestimmt die Wirkung die Dynamik schon eines Teilchens. Andererseits ist
unsere o.g. Situation eher eine Gleichgewichtssituation, da wir die Menge
der Pfade von A nach B und nicht deren Verlauf betrachten. Berucksichtigen
wir nun noch, da die Entropie S und die negative Wirkung ;S maximiert
werden, so ist die Wahrscheinlichkeit W , einen Pfad x( ) im Intervall [x; x +
dx] zu nden, durch W (x) exp(;S [x(t)]) gegeben. Der klassische Pfad,
welcher durch das Verschwinden der ersten Variation S = 0 deniert ist,
liefert naturlich den groten Beitrag. Betrachten wir die Mittelung uber alle
diese Pfade in Bezug auf den variablen Endpunkt x, so erhalten wir das
Funktionalintegral
Z
P (x; t) = Dx(t) exp(;S [x(t)]) :
(1.3)
Diese Groe lat sich als die Wahrscheinlichkeit auassen, aus einem Ensemble von Pfaden einen bestimmten Pfad auszuwahlen. Die Pfade werden dabei
entsprechend der Funktion exp(;S ) verteilt. Wie in [1, 2] gezeigt wurde, mu
das Funktionalintegral (1.3) der partiellen Dierentialgleichung
@ P (x; t) = 1 4 P (x; t) ; F (x)P (x; t)
(1.4)
@t
2 x
genugen. An dieser Stelle konnen wir uns naturlich fragen, warum wir unbedingt die klassische Trajektorie bekommen wollen. Bei der klassischen
Trajektorie sind die Fixpunkte der Dynamik die kritischen Punkte des Potentials F , wobei nur die Minima von F stabile, anziehende Fixpunkte sind.
Somit haben wir eine Dynamik konstruiert, welche die Minima der Funktion
F anlauft. Desweiteren haben wir festgestellt, da zur Realisierung dieser
9
Dynamik ein Ensemble von Teilchen notwendig ist, das sich mittels einer
stochastischen Dynamik bewegt. Auf dem Niveau der Verteilungsfunktionen
mu dabei die Gleichung (1.4) erfullt sein. Spater werden wir diese Dynamik
als Darwin-Strategie bezeichnen.
Dieses Beispiel illustriert die Beziehung zwischen der Optimierungstheorie, der Stochastik sowie der Wahrscheinlichkeitstheorie. Die Aufgabe wird
im folgenden darin bestehen, einen stochastischen Proze zur Optimierung
einer Fitnessfunktion zu konstruieren. Dabei werden die Standardmethoden aus der Theorie der irreversiblen und stochastischen Prozesse verwendet
wie sie von Prigogine [3], van Kampen [4] et al. entwickelt wurden.
Desweiteren wurden die Prinzipien der naturlichen Evolution entsprechend
Darwin [5] benutzt, die als eine Optimierung der Anpassung von Tieren und
Panzen an die Umwelt aufgefat werden kann. Wir wollen im folgenden
die verschiedenen Versionen dieser Idee anfuhren: Simulated Annealing (SA)
[6, 7], Evolutionsstrategien (ES) [8, 9, 10, 11, 12], Genetic Algorithms (GA)
[13, 14, 15], Evolutionary Programming (EP) [16, 17, 18] und Genetic Programming (GP) [19, 20], welche unter dem Begri Evolutionarer Algorithmus
zusammenfat werden.
Obwohl diese groe Fulle von verschiedenen Darstellungen zu implizieren
scheint, da es schwierig ist, alle Algorithmen zu vereinigen, gibt es doch
zwei allgemeine dynamische Prinzipien. Die Dynamik eines Evolutionaren
Algorithmus' kann man als eine Bewegung x(t) in einem Suchraum X auffassen, die alle Optima einer Fitnessfunktion F (x) als kritische Punkte besitzt3. Um alle diese kritischen Punkte der deterministischen Dynamik zu
erreichen, erweist es sich als notwendig, Zufallskrafte hinzuzufugen. Damit
gelangen wir zu einer stochastischen Dynamik. Durch die Stochastik werden
neue Moglichkeiten der Bewegung erzeugt, da die stochastische Dynamik
uber die Seperatrizen zu "springen\ in der Lage ist. Etwas anders ausgedruckt bedeutet dies, da bei jedem Schritt eine neue Moglichkeit erzeugt
wird. Der Vektor der Eigenschaften des Sucher wird wahrend des Vorgangs
der Reproduktion kopiert und dabei mutiert, d.h. stochastisch verandert. Aus
der Fulle von Moglichkeiten werden entsprechend einer gegebenen Gutefunktion, die als Fitness bezeichnet wird, die Besten derart ausgewahlt, da die
Anzahl der Sucher konstant bleibt. Das Optimierungsproblem besteht nun
darin, das globale Optimum der Fitness zu nden. Im Bild eines ReaktionsDen Suchraum nennen wir auch Phanotypraum. Der Phanotyp ist der Vektor von
Eigenschaften eines Suchers x.
3
10
KAPITEL 1. EINLEITUNG
Diusions-Systems mit zwei Spezies liee sich das als eine Asymmetrie der
U bergangsraten von der einen Teilchensorte zur anderen vorstellen. Eine
Spezies wird also bevorzugt, wird selektiert. Wir erhalten folglich die drei
grundsatzlichen Prinzipien eines Evolutionaren Algorithmus: Reproduktion,
Mutation und Selektion. Der Graph der Fitnessfunktion uber dem Suchraum
(Phanotypraum) ist die Fitnesslandschaft.
Die vollstandige Beschreibung solcher stochastischen Systeme geschieht
durch Einfuhrung einer Wahrscheinlichkeitsverteilung P (x; t) von einem Zustand x zur Zeit t, welcher einerseits die Dichte der Sucher am Punkt (x; t)
bestimmt und andererseits als Wahrscheinlichkeit, einen Sucher in (x; t) zu
nden, aufgefat werden kann. Eine Dynamik von P (x; t) bezeichnen wir als
stochastische Optimierung, falls fast alle Anfangsverteilungen P (x; t) zu einer
stationaren Verteilung P0(x) = tlim
P (x; t), welche um das globale Optimum
!1
von F (x) konzentriert ist, konvergieren [21, 22, 23].
Aus der Menge der Evolutionaren Algorithmen wollen wir im folgenden
zwei wichtige Klassen auswahlen, die sich entsprechend ihrem physikalischen
bzw. biologischen Ursprung unterscheiden. Simulated Annealing Algorithmen sind durch thermodynamische Betrachtungen motiviert, da sie die freie
Energie des Systems minimieren und die stationare Verteilung P0(x) eine
Boltzmann-Verteilung ist. Deshalb wollen wir Algorithmen mit einem solchen Verhalten Boltzmann-Strategien (BS) [24, 25, 26] nennen. Fast alle
anderen Algorithmen benutzen ein Selektionsschema, welches der naturlichen Selektion von biologischen Systemen nachempfunden ist. Die Klasse
von Algorithmen mit einer Reproduktionsrate, die proportional zur Fitness
ist, wollen wir als Darwin-Strategie (DS) [24, 25, 26] bezeichnen. Die Selektion ist dabei einfach die Konstanz der Populationsgroe. Die anderen hier
behandelten Strategien gehen aus einer Kombination der beiden Strategien
(Gemischte Strategie) [27, 28, 29] sowie aus der Einbeziehung der Mutationsrate (Schrittweite) in den Selektionsvorgang (adaptive Darwin-Strategie
[30, 11] und Selfannealing-Strategie [31]) hervor. Als letzte Moglichkeit bleibt
noch die Variation der Mutationsverteilung (siehe Kapitel 6), die einen Wechsel der Beschreibungsweise erfordert.
Struktur der evolutionaren Dynamik
Im zweiten Teil der vorliegenden Arbeit werden die Konsequenzen aus der
Formulierung der Evolutionaren Algorithmen durch partielle Dierentialglei-
11
chungen zweiter Ordnung gezogen. Dazu ist eine Analyse der Wechselwirkung zwischen den Suchern notwendig. Wie soll dies geschehen?
Seitdem Newton seine Principia schrieb, sind nunmehr 300 Jahre vergangen. Dadurch waren zwar die Grundgesetze der Mechanik formuliert,
aber ein mysterioser Begri blieb: die Kraft. Die Beantwortung dieser Frage
fuhrte uber die Extremalprinzipien von Lagrange, die teilweise als Gottesbeweis angesehen wurden, bis hin zum Faraday'schen Feldbegri. Jedoch
wurde dieser Begri immer auf ein bestimmtes Medium, wie z.B. den A ther
verlagert. Erst die abstrakte Fassung des Begris Feld fuhrte zur Formulierung der speziellen Relativitatstheorie. Es ist vor allem der Verdienst Einstein's, da er die Abstraktion des Begris weiter vorangetrieben hat. Dabei
schwebte ihm ein einfaches Gedankenexperiment als Leitfaden vor: Wird die
geradlinig, gleichformige Bewegung eines Massepunkts auf einer Kugel auf eine Flache projiziert, so erscheint sie dort als beschleunigte Bewegung. Damit
erhielt er das scheinbar universelle Prinzip:
Kraft = Krummung :
Leider lie sich durch diese Konstruktion nur die Gravitation [32] beschreiben4 . Die fehlende Beziehung zwischen Ladung und Masse verhinderte erst
einmal die vollstandige Geometrisierung der Wechselwirkung.
Eine weitere Vertiefung des Begris der elektrischen Ladung ist mit der
Entstehung der Quantenmechanik verbunden. Betrachten wir einen quantenmechanischen Zustand, der durch eine Wellenfunktion dargestellt wird, so
konnen wir immer eine globale Phasentransformation des Zustandes durchfuhren,
ohne da sich die physikalisch mebaren Groen andern. Andererseits ist eine
A nderung der relativen Phase zwischen zwei Zustanden nicht beliebig wahlbar, wie wir durch den Aharonov-Bohm-Eekt eindrucksvoll sehen. Solche
Phasenanderungen sind also lokale Transformationen. Wie Weyl [33, 34]
herausfand, lat sich die entsprechende Erhaltungsgroe, die zu den lokalen Phasenanderungen korrespondiert, als elektrische Ladung deuten. Damit
erkannte man, da die Elektrodynamik als U (1) Eichfeldtheorie dargestellt
werden kann.
Was ist aber der Grund fur die Entstehung der elektrischen Ladung? Der
Zustandsraum der Quantenmechanik ist ein Hilbertraum mit einer trivialen
Der Grund dafur ist einfach durch die Tatsache gegeben, da die universelle Kopplungskonstante zwischen Beschleunigung und Kraft die Masse ist. Durch die A quivalenz
zwischen Masse und Energie erhalten wir eine Beziehung aller Wechselwirkungsarten zur
Gravitation, da diese wenigstens immer als Energieaustausch aufzufassen sind.
4
12
KAPITEL 1. EINLEITUNG
topologischen Struktur. Wenn wir dagegen alle Zustande identizieren, die
auf gleiche physikalisch mebare Groen fuhren, so erhalten wir eine Mannigfaltigkeit mit nichttrivialer topologischer Struktur. Zum Generator dieser
nichttrivialen, topologischen Struktur korrespondiert eine Groe (1. ChernKlasse [35]), die mit der elektrischen Ladung in Beziehung steht. Damit haben wir wiederum eine geometrische Charakterisierung einer physikalischen
Groe erhalten. Nun konnten wir im Hinblick auf die allgemeine Relativitatstheorie fragen, welche geometrische Struktur in der Raum-Zeit mit dieser
topologischen Groe des Zustandsraums korrespondiert. Die Antwort darauf
ist bisher noch nicht bekannt.
Durch diese Konstruktion haben wir ebenfalls einen interessanten Ansatz
zur Beschreibung nichtlinearer Systeme erhalten. Der oben beschriebene Zustandsraum ist auf einer Mannigfaltigkeit deniert. Die Gleichung fur die
zeitliche Entwicklung eines Zustands ist bei einer Wechselwirkung nichtlinear. Die grundsatzliche Invariante zur Charakterisierung des Verhaltens
solcher Systeme ist die elektrische Ladung, welche eine topologische Invariante auf dem Zustandsraum ist. Nun wollen wir eine nichtlineare Gleichung
zusammen mit seinem Zustandsraum, der auch als Losungsraum bezeichnet
wird, betrachten.
In Analogie zum eben gesagten, brauchen wir nur die topologischen Invarianten des Losungsraums zu studieren, um eine Charakterisierung der
nichtlinearen Gleichung zu erhalten. Wie kann dies aber ohne Kenntnis der
Losung geschehen? Dazu zerlegt man die Gleichung in einfache Teile, d.h.
losbare Teilgleichungen. Studiert man nun die Beziehung dieser Teile zueinander, so erhalt man die topologischen Invarianten. Ein Beispiel fur eine
solche erfolgreiche Theorie ist die Stabilitatsanalyse gewohnlicher Dierentialgleichungssysteme, welche von Poincare entwickelt wurde.
In Kapitel 4 und 5 dieser Arbeit werden wir diese Herangehensweise benutzen, um die Schrodinger-Operatoren und die verallgemeinerte Warmeleitungsgleichung zu betrachten. Obwohl diese Gleichungen linear sind, zeigen
sie doch ein komplexes Verhalten. So konnen sie durch eine einfache Transformation auf eine nichtlineare Dierentialgleichung gebracht werden. Wie
wir spater an diesem Beispiel sehen werden, besitzt der Losungsraum bei
einer Gleichung mit komplexem Verhalten ebenfalls eine komplizierte topologische Struktur. Sie spiegelt sich in diesem Falle durch die Hierarchie von
selbstahnlichen Unterraumen des Losungsraums wieder. Bei den meisten
Arten von Gleichungen kann man nicht einmal von einer Mannigfaltigkeitsstruktur auf dem Losungsraum ausgehen. An diesen Beispielen sehen wir
13
nun, da die Wechselwirkung zu einer komplizierten Struktur auf dem Zustandsraum fuhrt, welche durch topologische Invarianten wenigstens teilweise
verstanden werden kann.
In dieser Arbeit wurde eine spezielle Form der Wechselwirkung zusammen
mit der entsprechenden Analyse des Losungsraums behandelt. Dabei handelt
es sich um eine Menge von Punktteilchen, die dem Gradient eines Potentials
folgen und gleichzeitig von einer Zufallskraft gestort werden. Die Storung
soll dabei so klein sein, da der entsprechende stochastische Proze als Diffusion beschreibbar ist. Damit ist zwar das physikalische Problem umrissen,
aber der Sinn des Modells ist noch nicht ganz klar. Deshalb betrachten wir
nun die deterministische Dynamik des Systems. Die Fixpunkte der Dynamik sind die Punkte, an denen der Gradient des Potentials verschwindet. Ist
dieser kritische Punkt des Potentials ein Minimum, so ist der entsprechende
Fixpunkt stabil, andernfalls instabil. Der stochastische Proze ermoglicht es,
aus dem Anziehungsbereich eines Fixpunktes in einen anderen Anziehungsbereich zu springen. Die Wahrscheinlichkeitsverteilung dieses Prozesses besitzt
damit Maxima in der Umgebung der stabilen Fixpunkte. Benutzt man mehrere unabhangige Punktteilchen, die dieser Dynamik folgen, so beschreibt die
Wahrscheinlichkeitsverteilung die Dichte der Punktteilchen.
Diese Eigenschaften der Dynamik lassen wiederum eine Beziehung zur
Optimierungstheorie erkennen. Fat man namlich das Potential als Gute
(Fitness) der gefundenen Losung auf, so beschreibt die oben dargestellte Dynamik einen stochastischen Optimierungsproze. Dieser Proze hat auch
eine anschauliche Bedeutung: Er modelliert die biologische Evolution. Um
dies zu verstehen, betrachten wir die Realisierung des oben beschriebenen
Algorithmus'. Im biologischen Sinne fassen wir jedes Teilchen als Sucher
bzw. Individuum auf. Dann fuhrt der stochastische Proze zur Entstehung
neuer Individuen, d.h., er lat sich als Mutation verstehen. Desweiteren vervielfaltigen wir alle die Individuen, die oberhalb des Mittelwertes der Fitness
liegen. Dieser Proze entspricht der Reproduktion. Alle anderen Individuen
sterben aus, d.h. wir erhalten den Proze Selektion.
Zur Vereinfachung haben wir keine lokale Wechselwirkung zwischen den
Individuen angenommen, da die entstehenden Gleichungen nichtlinearer Natur sind. Eine groe Klasse solcher Modelle, die als Lotka-Volterra-Modelle
bezeichnet werden, wurden in der Vergangenheit im starken Mae untersucht.
Als weitere wichtige und zugleich groe Klasse solcher Modelle erhalten wir
alle physikalischen Modelle, die eine Groe minimieren. Bekanntlich sind fast
alle dynamischen Gleichungen der Physik als Variationsprinzipien darstell-
14
KAPITEL 1. EINLEITUNG
bar, was die Groe der Klasse noch unterstreicht. So kann man die gesamte
Feldtheorie als ein Beispiel einer Koevolution auassen. In der Koevolution erzeugen die Kongurationen von Individuen die Fitness, die damit nicht
fest vorgegeben ist. Fat man nun jedes Individuum als Punkt eines Feldes
auf, so beschreiben die Feldgleichungen die Dynamik der Individuen, die lokal miteinander wechselwirken und dabei das Energiefunktional minimieren.
Diese Problematik soll hier nicht behandelt werden.
Der Aufbau dieser Arbeit
Am Anfang der Einleitung hatten wir ein einfaches Modell zur Beschreibung Evolutionarer Algorithmen eingefuhrt, da auf partiellen Dierentialgleichungen 2. Ordnung fur die Verteilungsfunktion der Individuen basiert.
Im nachsten Kapitel werden die Konsequenzen dieses Ansatzes studiert, der
sowohl "simulated annealing\ als auch die adaptive Strategie von Schwefel enthalt. Eine geschickte Darstellung der Gleichungen fuhrt zur Idee
der Vereinheitlichung aller Strategien durch eine verallgemeinerte Warmeleitungsgleichung.
Im darauolgenden Kapitel wenden wir uns den Eigenschaften der Boltzmannund Darwin-Strategie zu. Dabei steht ein Vergleich beider Strategien im
Mittelpunkt des Interesses. Dieser Vergleich erfolgt anhand zweier Beispiele: der Parabel und dem Doppeltopf. Anschaulich ist zu erwarten, da das
Verhalten beider Strategien fur den Fall einer Parabel gleich sein mu, da
die Strategien nur dem Gradienten folgen mussen. Auch fur den Fall eines
Maximums bzw. eines Sattels als Fitnessfunktion sollte sich ein qualitativ
gleiches Verhalten ergeben. Da jede Fitnessfunktion lokal durch eine quadratische Funktion approximiert werden kann, arbeiten die Boltzmann- und
Darwin-Strategie lokal gleich, was durch den Titel unterstrichen wurde. Verkomplizieren wir das Problem von einer Parabel zum Doppeltopf, so ist zu erwarten, da sich erste Unterschiede im Verhalten zeigen. Diese Unterschiede
werden durch eine systematische Veranderung der Parameter herausgearbeitet. Bei der Analyse spielt die Wahrscheinlichkeit, im anderen Topf zu sein,
eine herausragende Rolle. Das Ergebnis dieser Untersuchung zusammen mit
einigen Computersimulationen legen die Mischung zwischen der Boltzmannund der Darwin-Strategie nahe. Die Beantwortung der Frage, ob diese Strategie wirklich besser ist, nimmt der nachste Abschnitt in Angri. Am Schlu
dieses Kapitels soll noch auf die stochastische Realisierung der Strategien
15
und deren Vergleich mit den theoretischen Ergebnissen eingegangen werden.
Das Kapitel 4 ist den mathematischen Eigenschaften von SchrodingerOperatoren gewidmet, da sie ein Hauptbestandteil der dynamischen Gleichung fur die Verteilungsfunktion der Individuen sind. Wie wir im vorherigen Kapitel dargelegt haben, besitzt das Spektrum dieser Operatoren einen
entscheidenden Einu auf die Geschwindigkeit der Strategien. Deshalb ist
es zuerst notwendig, sowohl Aussagen uber die Spektraldichte wie auch uber
deren Reproduzierbarkeit wahrend eines Simulationslaufs zusammenzutragen. Die restlichen Abschnitte dieses Kapitels sind der Analyse des Kerns
sowie der Abhangigkeit des Schrodinger-Operators vom Potential gewidmet.
Zur Gewinnung der entsprechenden Aussagen wurde eine neue Methode entwickelt, die in der Umformulierung des ursprunglich analytischen Problems
in ein algebraisches Problem besteht.
Als Schlufolgerung aus den Ergebnissen des Kapitels 4 erhalten wir in
Kapitel 5 die Klassikation der Strategien in Abhangigkeit von der Fitness.
Da die zugrundeliegende Mathematik relativ kompliziert ist, wird zuerst eine
kurze, anschauliche Zusammenfassung der Beweise aus Kapitel 4 angegeben.
Als Schlufolgerung erhalten wir die Klassikation der Evolutionaren Strategien, die durch eine partielle Dierentialgleichung 2. Ordnung beschrieben
werden, bezuglich Ihres Losungsverhaltens. Als Kernstuck dieser Klassikation ergeben sich die schwierigen Probleme, die durch eine Irrefuhrung der
Strategie entstehen. Es ist noch interessant zu notieren, da diese Probleme
im Fall der Darwin-Strategie genau die Thom'schen Katastrophen sind.
Im Kapitel 6 beschaftigen wir uns mit der Variation der Mutationsverteilung. Bisher wurden nur kleine, Gau-verteilte Mutationen angenommen.
Bei den "realen\ Algorithmen (z.B. Evolutionsstrategien) gibt es aber die
Einschrankung der kleinen Sprunge uberhaupt nicht. Anhand der Standardbeispiele Parabel und Doppeltopf werden die Losungen fur die Gau- und
Cauchy-Verteilung durch die Methode des iterierten Kerns berechnet. Dabei
ist zu erwarten, da fur die Gau-Verteilung qualitativ gleiche Ergebnisse herauskommen. Unterschiede ergeben sich lediglich fur die Cauchy-Verteilung,
da bei dieser Form der Verteilung groe Mutationen wahrscheinlicher sind.
Die einheitliche Darstellung dieser Strategien sowie ein paar Ideen zur Klassikation schlieen dieses Kapitel.
Eine Zusammenfassung, in der die wichtigsten Ergebnisse zusammengetragen wurden, beendet den Hauptteil der Arbeit. Um die Transparenz der
Arbeit zu erhohen, wurden die umfangreichen Formeln und Berechnungen in
4 Anhange am Ende der Arbeit verbannt. Im ersten Anhang bendet sich
16
KAPITEL 1. EINLEITUNG
eine kurze Diskussion des Einusses von Zwangsbedingungen, die an das
Optimierungsproblem gestellt werden, auf die Topologie der Fitnesslandschaft. Dabei werden keine Grundkenntnisse der Topologie vorausgesetzt.
Im nachsten Abschnitt bendet sich eine Sammlung von Formeln, die die
Berechnung des Eigenwertproblems auf der Parabel fur die Boltzmann- und
Darwin-Strategie betreen. Die letzten beiden Anhange sind der Berechnung
der Wahrscheinlichkeiten im Fall des stuckweise, quadratischen Doppeltopfes
fur die Boltzmann-, Darwin- und Gemischte Strategie gewidmet.
Diese Arbeit ist eine zusammenfassende Untersuchung der tnessproportionalen Evolutionaren Algorithmen auf kontinuierlichen Raumen. Neuere
Untersuchungen zu den diskreten Fallen ndet man u.a. in [36, 12]. Daneben
gibt es noch andere Moglichkeiten der Optimierung, wie z.B. adaptive Anpassung der Populationsgroe [37] oder die Zerlegung des Optimierungsproblems
in Teilprobleme und deren simultane Optimierung (multitome Optimierung)
[38, 39].
Kapitel 2
Ein physikalischer Zugang zu
den Evolutionaren Algorithmen
\Da namlich der Plan des Universums der vollkommenste ist, kann kein Zweifel bestehen, da alle Wirkungen in der Welt aus den Ursachen mit Hilfe der
Methode der Maxima und Minima gleich gut bestimmt
werden konnen."
Leonhard Euler
In diesem Kapitel werden wir eine Klasse von einfachen Dynamiken betrachten, welche die Evolution in kontinuierlichen Raumen realisieren. Dazu
fuhren wir einen kontinuierlichen Raum X ein, der den schon erwahnten
Phanotypraum darstellt. Desweiteren benotigen wir eine reell-wertige, die
Fitness darstellende Funktion F : X ! IR. Diese Funktion mit die Qualitat
des gefundenen Optimums und reprasentiert in praktischen Problemen z.B.
die Kosten fur den Aufbau eines Netzwerkes. Die Aufgabe besteht nun darin, das globale Optimum (Maximum bzw. Minimum) von F zu bestimmen.
Im folgenden wollen wir annehmen, da der Raum X durch X = IRd gegeben ist. Der Zeitparameter wird ebenfalls als kontinuierlich angenommen.
Da die meisten Algorithmen lokal arbeiten, ist eine Beschreibung uber eine Dierentialgleichung moglich. Als Heuristik fur eine solche Beschreibung
verweisen wir auf die obige Diskussion, d.h., im folgenden wollen wir die Dynamik als partielle Dierentialgleichung zweiter Ordnung wahlen. Diese Art
der Beschreibung wird uns spater erlauben, die Boltzmann- und die Darwin17
18
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
Strategie durch einen Typ von Gleichung zu beschreiben. Beide genugen
namlich einer Schrodingergleichung [24, 25], wobei der Unterschied zwischen
beiden durch die Transformation der Fitnessfunktion gegeben ist.
Im nachsten Kapitel werden wir die Geschwindigkeit dieser Strategien
bestimmen. Die Ergebnisse zeigen, da die Boltzmann- und die DarwinStrategie gegenlauges Verhalten bzgl. ihrer Geschwindigkeiten aufweisen.
Daher scheint es angebracht, beide Strategien zu mischen. Diese Idee fuhrt
zur Gemischten Strategie, die in den Simulationen eine groere Geschwindigkeit und Robustheit besitzt [25, 26, 40, 41].
Entsprechend Schwefel [30] ist eine konstante Fortschrittsgeschwindigkeit der Evolutionsstrategie ein Nachteil, da die Strategie an Stellen, die weit
vom Optimum entfernt sind, genauso schnell ist, wie an den interessanten
Stellen nahe des Optimums. Die Losung dieses Problems besteht darin, da
man die Schrittweite als zusatzliche Variable betrachtet, die in den Selektionsproze einbezogen wird. So gelangt man auf ganz naturliche Weise zur
adaptiven Strategie. Im Falle der Darwin-Strategie wird dabei die Diusionskonstante und im Falle der Boltzmann-Strategie die Temperatur gesteuert.
Letzterer Fall wurde von Rose [31] entwickelt und zeigt fur die meisten
Realisierungen die Besonderheit, da das \cooling schedule" adaptiv an das
Problem angepat wird. Im Gegensatz zur adaptiven Darwin-Strategie bleibt
diese adaptive Gemischte Strategie (Selfannealing Strategie) nicht in lokalen
Optima "hangen\.
Nach dieser Fulle von verschiedenen Strategien kann man sich nun fragen,
ob es vielleicht die Moglichkeit einer groen Vereinheitlichung gibt. Im Falle
der Boltzmann- und Darwin-Strategie wurde dies schon kurz erwahnt. In der
Tat zeigt sich, da man alle Strategien durch eine Gleichung in einem Raum
M beschreiben kann, wobei sich die einzelnen Strategien durch die Wahl der
Fitnessfunktion bzw. durch die Metrik von M unterscheiden.
2.1 Die Boltzmann-Strategie
Die alteste und zugleich einfachste Variante einer Optimierungsstrategie, die
wir im folgenden auch unter dem Begri Evolutionaren Strategie betrachten,
ist die Boltzmann-Strategie. Im Jahre 1953 wurde sie von Metropolis et al.
[42] als Algorithmus zur Erzeugung von Ensemble benutzt, die als stationare
Verteilung eine Boltzmannverteilung
; F (x)
P (x) = tlim
!1 P (x; t) e
2.1. DIE BOLTZMANN-STRATEGIE
19
besitzen. Kirkpatrick et al. [6] erweiterten 1983 durch die Einfuhrung
eines \cooling schedules" den Metropolis-Algorithmus zum Simulated Annealing, welcher in der Folgezeit zahlreiche Anwendungen auf verschiedenste
Optimierungsprobleme gefunden hat [7, 43]. Eine Weiterentwicklung dieses
Algorithmus wurde durch verschiedene Autoren vorgeschlagen (z.B. [44, 45]).
Der einzige Parameter des Algorithmus' bestimmt den Grad der Akzeptanz von verschlechternden Mutationen. In Analogie zur statistischen Physik
wollen wir diesen Parameter als reziproke Temperatur auassen. Eine hohe
Temperatur (kleines ) fuhrt zur Akzeptanz jedes Schritts, was aquivalent
zu einer Zufallsbewegung ist; wahrend eine kleine Temperatur (groes )
den Proze eines stochastischen Gradientenabstiegs beschreibt. Eine Analyse des Prozesses mit Hilfe des thermodynamischen Formalismus und unter Berucksichtigung des informationstheoretischen Maes Entropie fuhrte
[46, 47, 48, 49] zur Konstruktion einer optimalen Abkuhlungskurve (cooling schedule), d.h. einer zeitabhangigen Funktion T = T (t), wahrend des
Simulationslaufs. Diese Kurve stellt das wichtigste Problem fur den \simulated annealing" Algorithmus dar. Wird namlich die Temperatur wahrend
des Simulationslaufs erniedrigt, so "sammeln\ sich die Sucher in den lokalen Minima der Fitnesslandschaft. Man hot nun, da eines der gefundenen
Minima das globale Minimum ist, wodurch die Strategie das Ziel erreicht
hatte. Wie aus der oben gegebenen Boltzmann-Verteilung ersichtlich ist,
ist die stationare Verteilung um das globale Minimum konzentriert. Damit
erfullt diese Strategie die Minimalanforderung an eine Optimierungsstrategie. Spater werden wir noch einen detaillierten Beweis dafur erbringen, da
alle Anfangsverteilungen gegen diese stationare Verteilung konvergieren. Die
Einordnung dieser Strategie unter die Klasse der Evolutionaren Strategien
erscheint auf den ersten Blick nicht ganz gerechtfertigt, da ein solches Verhalten gerade dem Verhalten thermodynamischer Systeme entspricht. Es
konnte jedoch gezeigt werden [25], da sowohl die Boltzmann-Strategie als
auch die spater vorgestellte Darwin-Strategie durch ein und dieselbe Grundgleichung beschrieben werden konnen. Am Ende dieses Abschnitts werden
wir sogar eine Grundgleichung fur alle bekannten tnessproportionalen Strategien angeben.
Die Besonderheit der Boltzmann-Strategie besteht darin, da sie schon
durch einen Sucher realisiert werden kann. Dazu wird zuerst sein Zustand xi
im Suchraum X durch eine Mutation in einen neuen Zustand xj uberfuhrt.
Die Bewertung dieser Mutation erfolgt anhand der Fitnessdierenz F =
20
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
F (xj ) ; F (xi) mit der U bergangswahrscheinlichkeit
(
F 0
pij = e;1 F :: F > 0
(2.1)
Dies bedeutet, da Mutationen, die zur Verbesserung der Fitness fuhren (Minimierung), immer vollzogen werden, verschlechternde Mutationen jedoch
nur mit einer Wahrscheinlichkeit e; F . Um das Verhalten der Strategie
besser zu verstehen, versuchen wir eine Gleichung herzuleiten, die alle oben
erwahnten Eigenschaften enthalt. Dazu benutzen wir die Akzeptanzwahrscheinlichkeit (2.1) und verwenden das Konzept der Mastergleichung, wobei
wir folgenden Ansatz fur die Raten
!
W (xj ;! xi) = exp 2 (F (xi) ; F (xj )) N (xi ; xj ; 2D)
!
W (xi ;! xj ) = exp ; 2 (F (xi ) ; F (xj )) N (xi ; xj ; 2D) (2.2)
der beiden U bergange wahlen, dabei ist die reziproke Temperatur und
N (xi ; xj ; 2D) = (4D);1=2 exp(;(xi ; xj )2=(4D)) die Normalverteilung
von xi um xj mit Standardabweichung 2D. Die Wahl der Raten wird nur
durch die Bedingung der detailierten Balance beschrankt. Wir haben der
symmetrischen Form der Raten den Vorzug gegeben. Fur die Mastergleichung
@ P (x ; t) = Z (W (x ;! x )P (x ; t) ; W (x ;! x )P (x ; t)) dx(2.3)
j
i
j
i
j
i
j
@t i
erhalten wir unter Berucksichtigung der Abkurzungen xj = xi + r und
4(xi; r) = (F (xi) ; F (xj ))=2 den Ausdruck
@ P (x ; t) = Z N (r; 2D) e4(xi;r)P (x + r; t) ; e;4(xi;r)P (x ; t) dr (2.4)
:
i
i
@t i
Entsprechend [4] existiert unter der Annahme kleiner "Sprunge\ ein > 0,
so da
W (xj ;! xi ) = W (xj ; r) 0
W (xj + x; r) W (xj ; r)
fur jrj > ;
fur jxj < :
2.1. DIE BOLTZMANN-STRATEGIE
21
Nehmen wir weiterhin an, da die Losung P (xi; t) auch in Bezug auf xi
wenig variiert, dann ist es moglich, den Integranden in (2.4) um r = 0 in
eine Taylorreihe bis zu Termen zweiter Ordnung zu entwickeln. Wir erhalten
somit
e4(xi;r)P (xi + r; t) ; e;4(xi;r)P (xi; t) ;r@xi (F (xi )P (xi; t)) +
2
+r(@xi F (xi))P (xi; t) + r2 (@xi (P (xi; t)@xi F (xi ) + @xi P (xi; t)) + O(r3)
mit der Abkurzung @x = @=@x und der Relation 4(x; 0) = 0. Die erste
Ableitung wird durch die Beziehung
Z
rN (r; 2D)dr = 0
eliminiert und wir erhalten
!
@ P (x ; t) = 1 Z r2N (r; 2D) @ @F (xi ) P (x ; t) + @ P (x ; t) dr :
i
@t i
2
@xi
@xi
@xi i
(2.5)
Mittels der Denition
Z
2D = r2N (r; 2D)dr
konnen wir das Endergebnis wie folgt angeben:
@ P (~x; t) = rD [rP + rFP ] = D4P + Dr(P rF )
(2.6)
@t
mit der Diusionskonstante D, der reziproken Temperatur und dem Zustandsvektor ~x. Diese partielle Dierentialgleichung ist vom Typ einer FokkerPlanck-Gleichung und stellt gleichzeitig das kontinuierliche Gegenstuck zum
oben beschriebenen Algorithmus dar.
Ein anderer Zugang ist durch die Langevin-Gleichung
p
~x_ = ;D rF (~x) + 2D (t)
(2.7)
gegeben, wobei (t) Gausches, weies Rauschen mit
< (t) >= 0
< (t) (t0) >= (t ; t0)
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
22
beschreibt. Durch eine Kramers-Moyal-Entwicklung erhalt man dieselbe
Fokker-Planck-Gleichung (2.6) wie oben. In [50] haben wir damit die BoltzmannStrategie simuliert. Im nachsten Kapitel wollen wir die Simulation der Gleichung (2.7) mit den analytischen Ergebnissen von (2.6) vergleichen.
Um im nachsten Kapitel losbare Falle von (2.6) zu diskutieren, machen
wir entsprechend [24] den Ansatz
"
#
F
(
x
)
P (~x; t) = exp ; 2 y(~x; t)
(2.8)
und nach Separation der raumlichen und zeitlichen Variablen erhalten wir
die Eigenwertgleichung
D4 i(~x) ; V (~x) i(~x) = ;H (~x) = ;i (~x)
(2.9)
mit Eigenwert i , Eigenfunktion i (~x) und neuer Fitnessfunktion
2
V (~x) = 4 DrF rF ; 2 D4F :
(2.10)
Diese Gleichung ist die wohlbekannte stationare Schrodingergleichung der
Quantenmechanik. Die Annahme eines diskreten Spektrums fuhrt zur allgemeinen Losung
"
#X
1
(2.11)
P (~x; t) = exp ; 2 F (~x) ci i (~x) exp(;i t) :
i=0
Als nachstes haben wir die Frage zu entscheiden, ob die Losung der Gleichung
(2.6) zur Gleichgewichtsverteilung konvergiert. Wir wollen an dieser Stelle
die Standardargument zum Beweis dieser Konvergenz anfuhren. Der Beweis
soll in zwei Schritten erfolgen. Dazu zeigen wir als erstes die Positivitat
des Operators H , welcher durch (2.9) deniert ist. Aufgrund der negativen
Denitheit des Laplace-Operators bzgl. des L2 -Skalarprodukts1 erhalten wir
fur die Denitheit von H
Z
Z
y(x)Hy(x)dvol(X ) = y(x)(;D4 + V (x))y(x)dvol(X )
X
X Z
Z
2
= D (ry(x)) dvol(X ) + y(x)V (x)y(x)dvol(X ) ;
X
1
X
Mit L2 wird der Hilbertraum der quadratisch integrierbaren Funktionen bezeichnet.
2.1. DIE BOLTZMANN-STRATEGIE
23
wobei dvol(X ) die Volumenform auf X bezeichnet. Damit bestimmt allein
der Erwartungswert der neuen Fitness V die Denitheit des Operators und
wir erhalten als hinreichende Bedingung
(rF )2 > 4F :
(2.12)
2
Das bedeutet aber, da die Krummung des Graphen der Fitnessfunktion2,
dargestellt durch 4F , kleiner als das Quadrat des Gradienten sein mu.
Diese Bedingung deniert eine Untermenge von X auf der der Operator H
positiv ist.
Als nachstes denieren wir ein positives, monoton fallendes Funktional,
das als Liapunov-Funktional [51] bezeichnet wird. Es wird durch folgende
Gleichung deniert:
d y(~x; t) = ; L(y; ry) :
(2.13)
dt
y
Wir erhalten in unserem konkreten Fall
L(y; ry) =
Z
X
L(y; ry) dvol(X ) ;
(2.14)
L(y; ry) = D2 (ry)2 + 12 V y2
mit den Eigenschaften L 0 und L_ 0. Mit Hilfe der Gleichung (2.13) und
der Positivitat des Operators H konnen diese Relationen veriziert werden.
Insbesondere korrespondiert das Minimum L = 0 des Funktionals L zu
(2.15)
y0 = exp(; 21 F (x)) ;
was gleichbedeutend mit der Gleichgewichtsverteilung
P0(~x) exp[;F (~x)]
(2.16)
ist, die auch zum Eigenwert 0 korrespondiert. Das bedeutet aber, da die
Gleichgewichtsverteilung um das globale Minimum von F lokalisiert ist, da
dieser Extremwert von F gleichzeitig das Maximum von P0(x) ist. Wir haben
damit gezeigt, da jede Anfangsverteilung P (~x; 0) im Grenzwert t ! 1 zur
Gleichgewichtsverteilung konvergiert.
2
Der Graph der Fitnessfunktion wird auch als Fitnesslandschaft bezeichnet.
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
24
2.2 Die Darwin-Strategie
Diese Strategie unterscheidet sich grundlegend von der Boltzmann-Strategie.
Wahrend die Boltzmann-Strategie nur mit einem Sucher auskommt, so ist
im Falle einer Darwin-Strategie gerade der Fakt wichtig, da ein Ensemble
von Suchern verwendet wird. Fur dieses Ensemble spielen die drei Prozesse
Mutation\ und "Selektion\ die herausragende Rolle.
"Reproduktion\,
"
Im folgenden wollen wir ein einfaches Modell betrachten, das alle wichtigen oben genannten Gesichtspunkte enthalt, das Fisher-Eigen-Modell. Erstmals durch Fisher 1930 untersucht [52], wurde es von Eigen als Standardmodell fur Systeme mit Konkurrenz und Selektion formuliert [53]. Kennzeichnend fur das Fisher-Eigen-Modell ist eine tnessproportionale Vermehrung
der Individuen bei konstanter Populationsgroe [21]. Evolutionare Strategien, die dies erfullen, wollen wir mit Ebeling Darwin-Strategien nennen
[26].
Um dieses Modell zu illustrieren, geben wir eine heuristische Erklarung
desselben. Dazu verwenden wir das Bild der chemischen Reaktionen, d.h. ein
Sucher mit einer festen Fitness sei "Sorte\ A wahrend ein anderer Sucher mit
einer anderen Fitness als C bezeichnet wird. Dann wird die Mutation durch
den U bergang A ! C beschrieben. Der Reproduktionsproze ist dabei durch
F
die Reaktion A !
2A mit der Fitness F des Suchers A als U bergangsrate gegeben. Aus der Forderung, da die Anzahl der Sucher wahrend der Evolution
konstant bleibt, erhalten wir das A quivalent zum Selektionsdruck. Diese drei
einfachen Reaktionen konnen unter der Annahme, da die Mutation durch
die Diusion realisiert wird, als folgende kompakte Gleichung
@ P (~x; t) = [< F > ;F (~x)]P (~x; t) + D4P (~x; t) ;
(2.17)
@t
R F (x)P (~x; t)dx
< F > (t) = R P (~x; t)dx
beschrieben werden3 . Nach dieser vereinfachten Herleitung der Darwin-Strategie
wollen wir ein Schema zur Realisierung derselben angeben, das nicht nur auf
Gleichung (2.17) fuhrt, sondern sich auch fur die Simulation eignet. Wir
lehnen uns dabei an den Artikel [50] an. Aufgrund der Unabhangigkeit der
Mutation von den beiden anderen Prozessen teilen wir die Ableitung der
Gleichung in zwei Schritte auf.
3
Auch diese Gleichungen beschreiben die Minimierung von F .
2.2. DIE DARWIN-STRATEGIE
25
Der erste Schritt bei der Herleitung von (2.17) besteht in der Herleitung
der Fisher-Eigen-Gleichung [21]
@ P (x; t) = (hF i ; F (x))P (x; t) ;
@t
welche nur die Dynamik des Reproduktions- und Selektionsprozesses beschreibt. Nach Schimansky-Geier [54] betrachten wir dazu 2-Teilchenreaktionen,
d.h., wir wahlen zwei Sucher x und y. Ist die Fitness F (x) von x kleiner als
die mittlere Fitness hF i, dann kopiert man den Sucher x auf y. Im anderen
Fall stirbt der Sucher x und y wird reproduziert. Damit ergeben sich folgende
2-Teilchenreaktionen fur das Paar (x; y)
8 f (x)j
< j;!
(x; y) : jf (x)j (x; x) : f (x) > 0
;! (y; y) : f (x) < 0
mit der tnessproportionalen Rate
f (x) := ( hF i ) ; F (x) ; hF i :=
Z
F (x) P (x) dx :
(2.18)
(2.19)
Der Grund fur die Wahl dieser Raten ist im Artikel [55] zu nden, wo wir
festgestellt haben, da damit eine sehr gute U bereinstimmung zwischen den
analytischen und numerischen Losungen schon fur kleine Ensemble gegeben
ist. Naturlich gibt es auch andere U bergangsraten, welche die Gleichung
(2.17) simulieren. Nun betrachten wir die Dynamik der Verteilung P (x; t),
die durch die U bergange (2.18) deniert wird. Solche Dynamiken werden
durch die Mastergleichung [4, 54]
@ P (x; y; t) = Z W (x; x; y) P (x; y) ; W (x; x; y) P (x; y) dx
@t
Z
+ W (y; y; x) P (x; y) ; W (y; y; x) P (x; y) dy (2.20)
in Bezug auf die 2-Teilchenverteilung P (x; y; t) beschrieben. Die Wahl einer 2-Teilchenverteilung ist, wie oben schon erwahnt, fur die Beschreibung
der Wechselwirkung zwischen zwei Suchern notwendig. Die entsprechenden
Raten zu den U bergangen (2.18) sind durch
W (x; x; y) := W ((x; y) ! (x; y)) = (x;y) (jf (x)j (;f (x)) + f (y) (f (y)))
(2.21)
26
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
gegeben. Wir bemerken den wichtigen Fakt, da W ((x; y) ! (x; y)) nur fur
x = y verschieden von Null ist, was in U bereinstimmung mit den Raten
(2.18) steht. Zusammen mit den nutzlichen Abkurzungen
A(x) := jf (x)j (;f (x)) ; B (x) := f (x) (f (x)) ; P (x) =
erhalten wir fur (2.20)
Z
P (x; y) dy
(2.22)
@ P (x; y; t) = (x ; y) Z A(x) P (x; y) dx + B (y) P (y) ; ( A(x) + B (y) ) P
@t
Z
+ (y ; x)
A(y) P (x; y) dy + B (x) P (x) ; ( A(y) + B (x) ) P :
Als nachstes vernachlassigen wir die Korrelationen zwischen zwei Suchern,
was durch die Forderung P (x; y) = P (x)P (y) ausgedruckt wird. So gelangen
wir zur Fisher-Eigen-Gleichung
@ P (x; t) = ( h2 A ; jf ji + 2 B ; jf j ) P (x) = f (x) P (x) ;
(2.23)
@t
wobei die Beziehungen 2 A ; jf j = ;f ; 2 B ; jf j = f ; hf i = 0 benutzt
wurden. Der Mutationsproze wird nun einfach durch Addition einer symmetrischen Rate WD mit
WD (x; y) = WD (y; x) = WD (y; r) ; r = x ; y
zu den Raten (2.18) dargestellt. Entsprechend ([4] S. 214) erhalten wir die
Mastergleichung
@ P (x; t) = Z W (x ; r; r)P (x ; r; t)dr ; P (x; t) Z W (x; ;r)dr ; (2.24)
D
D
@t
welche einen solchen Proze beschreibt. Unter der Annahme kleiner "Sprunge\
und kleiner Variation der Losung P (x; t) bei diesen Sprungen konnen wir genauso wie im vorherigen Abschnitt eine Taylorentwicklung des Integranden
in (2.24) um r = 0 bis zur zweiten Ordnung vornehmen. Dabei wird wieder
der Term erster Ordnung durch die Symmetrie von WD eliminiert. Wenn wir
Z
2D = r2WD (x; r)dr = const.
2.2. DIE DARWIN-STRATEGIE
27
ansetzen, erhalten wir aus (2.24) die Diusionsgleichung [4]. Damit haben wir
unter der Annahme kleiner Mutationsschritte r die Darwin-Strategie (2.17)
reproduziert.
Nach der Herleitung von (2.17) wollen wir nun die Eigenschaften dieser Gleichung studieren, welche spater zur Berechnung expliziter Losungen
gebraucht werden. Dazu betrachten wir den Ansatz
2Zt
3
P (~x; t) = exp 4 < F > (t0 )dt05 y(~x; t) ;
0
(2.25)
der die Nichtlinearitat in der Gleichung beseitigt. Wir bekommen so die
parabolische Gleichung
d y(~x; t) = ;Hy(~x; t) = (D4 ; F (~x))y(~x; t)
(2.26)
dt
und nach Separation der Zeit und Ortsvariable erhalten wir unter der Annahme eines diskreten Spektrums die Losung
X
y(~x; t) = aie;it i (~x) ;
(2.27)
i
d.h. die Dynamik reduziert sich auf eine stationare Schrodingergleichung
ahnlich zu (2.9)
;H i(~x) = [D4 ; F (~x)] i (~x) = ;i i (~x)
(2.28)
wobei i der Eigenwert und i (~x) die Eigenfunktion ist. Damit erhalten wir
das wichtige Ergebnis, da die Dynamik der Boltzmann- und der DarwinStrategie durch die Losungen einer stationaren Schrodingergleichung bestimmt
sind. Der Unterschied zwischen beiden Strategien lat sich nun dadurch
beschreiben, da in der Eigenwertgleichung (2.9) eine transformierte Fitnessfunktion (2.10) auftritt.
Wie im vorherigen Abschnitt kann fur die Gleichung (2.26) auch ein
Liapunov-Funktional, welches der Gleichung (2.13) genugt, gefunden werden. Man erhalt das positive Funktional
Z
L = D2 (rP )2 + 12 (F )P 2 dvol(X ) ;
(2.29)
X
welches auch die stationare Verteilung als Extremum hat. Weiterhin wollen wir noch bemerken, da die A hnlichkeit der Gleichung (2.26) mit der
28
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
Schrodingergleichung eine andere Beschreibung der Losung nahelegt. Wie
Feynman [1] zeigte, lat sich die Losung der Schrodingergleichung und der
Gleichung (2.26) durch ein Funktionalintegral ausdrucken. In unserem Fall
erhalten wir
Z
y(~x; t) = Dx(t) exp(;S )
(2.30)
mit der "klassischen\ Wirkung
0
1
!2
1
dx
S = d @ 4D d ; F (x( ))A :
0
Zt
(2.31)
Durch eine Sattelpunktsapproximation von (1.3) erhalt man die Bewegungsgleichung
d2x = ;2DrF ;
(2.32)
dt2
die gleichzeitig auch die Trajektorie mit der minimalen Wirkung (2.31) ist.
Wie man leicht sieht, sind die stationaren Punkte dieser Dynamik mit den
kritischen Punkten der Fitnessfunktion identisch. Weiterhin erhalt man aus
der Sattelpunktsapproximation, da der grote Beitrag zur Losung y(~x; t) der
Gleichung (2.26) durch die Trajektorien von (2.32) erbracht wird. Das bedeutet aber, da sich die meisten Sucher entlang dieser Trajektorien bewegen.
Zum Verstandnis des Verhaltens der Darwin-Strategie bzw. der BoltzmannStrategie ist also die Kenntnis der Losung von (2.32) wichtig. Diese Tatsache
hatten wir in der Einleitung zu diesem Kapitel benutzt, um die Beschreibung
einer evolutionaren Strategie einzufuhren.
Am Ende wollen wir noch auf die hauptsachlichen Unterschied zwischen
der Darwin-Strategie und der Quantenmechanik eingehen. In der Quantenmechanik ist die Menge der Funktionen exp(it) eine Basis des Hilbertraums
der t-abhangigen Funktionen. Im Falle von Gleichung (2.26) erzeugt der
zeitabhangige Teil exp(;t) keine solche Basis.
2.3 Die Gemischte Strategie
Die Boltzmann- und die Darwin-Strategie besitzen einige Vor- und Nachteile,
die bezuglich einer fest gewahlten Fitness genau entgegengesetzt zueinander
sind. Mathematisch manifestiert sich dieser Umstand in der Transformation
(2.10). Eine genaue Diskussion des Einusses dieser Transformation auf das
2.3. DIE GEMISCHTE STRATEGIE
29
Verhalten der Boltzmann-Strategie wird im nachsten Kapitel durchgefuhrt.
Es scheint daher ganz naturlich, die Vor- und Nachteile beider Strategie
durch Mischung derselben zu verbinden. So gelangen wir zur Gemischten
Strategie. Ursprunglich wurde die Gemischte Strategie durch Computersimulationen [26, 27, 29] entdeckt, die eine deutliche Geschwindigkeitssteigerung dieser Strategie gegenuber der Darwin- und Boltzmann-Strategie zeigen. Fur die mathematische Realisierung dieser Idee addieren wir einfach
die beiden Gleichungen (2.6) und (2.17) und bezeichnen die entsprechenden
Diusionskonstanten mit DB bzw. mit DD . So denieren wir die Dynamik
der Gemischten Strategie durch
@ P (~x; t) = (D + D )4P (~x; t) + D r(P rF )
(2.33)
B
D
B
@t
+ [< F > ;F (~x)]P (~x; t)
mit den beiden positiven Parametern > 0 und > 0. Naturlich erhalten wir auch wieder die Grenzfalle der reinen Strategien durch eine spezielle
Wahl beider Parameter. So ergibt sich fur = 0 und DD = 0 die BoltzmannStrategie und fur DB = 0 und = 0 die Darwin-Strategie. Die Wahl zweier
Parameter erscheint seltsam, aber der Grund dafur liegt einfach in der Reproduktion der Grenzfalle. Als einzige Schwierigkeit stellt sich der Fall T ! 0
(bzw. ! 1) dar. Bei diesem Fall folgt die Boltzmann-Strategie nur
dem Gradienten. Durch die Mischung mit der Darwin-Strategie werden aber
trotzdem noch Mutationen und Selektionen ausgefuhrt. Der Grenzubergang
! 1 spiegelt dieses Verhalten nicht wieder. Als ersten Ausweg aus diesem Dilemma bietet sich ein simultaner Grenzubergang der Form ! 1,
DB ! 0 mit DB = const: an. Als weiteren Ausweg mussen wir Gleichung (2.35) umformulieren. Dazu schauen wir uns noch einmal Gleichung
(2.6) genauer an. Multiplizieren wir in dieser Gleichung beide Seiten mit der
Temperatur T und fuhren eine neue Zeitskala t ! t=T ein, so erhalten wir
@ P (~x; t) = TD4P + Dr(P rF ) :
@t
Diese Gleichung ist frei von den Schwierigkeiten beim Grenzubergang T ! 0.
Damit erhalten wir fur die Gemischte Strategie die neue Gleichung
@ P (~x; t) = (TD + D )4P (~x; t) + D r(P rF )
(2.34)
B
D
B
@t
+ [< F > ;F (~x)]P (~x; t) :
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
30
Im folgenden geben wir aus rechentechnischen Grunden der folgenden Gleichung (2.35) den Vorzug. Wir erhalten somit eine 3-parametrige Familie
(; ; DD )4 von Strategien, welche die Grenzfalle enthalten. Eine schematische Darstellung der Parameterabhangigkeit im Falle der 2 Parameter (; )
ist in Abbildung (2.1) gegeben. Anschlieend wollen wir uns starker auf die-
γ
Darwin strategy
.
P=DD∆P + γ (<F>-F)
1
.
P=(DB+DD) ∆ P +γ (<F>-F) +Dβ(∆FP+gradF gradP )
mixed strategies
Boltzmann strategy
β
.
P=DB∆P +D β(∆FP+gradF gradP )
Abbildung 2.1: Parameterabhangigkeit der Gemischten Strategie
se 2-parametrige Familie konzentrieren und fuhren zu diesem Zweck nur eine
Diusionskonstante durch die Gleichung
@ P (~x; t) = D4P (~x; t) + Dr(P rF )
@t
+ [< F > ;F (~x)]P (~x; t)
(2.35)
ein. Dann ist es moglich, durch eine einfache Kombination der Ansatze in
der Form
2 Zt
3
1
P (~x; t) = exp 4 < F > dt0 ; 2 F (~x)5 y(~x; t)
(2.36)
0
Bei den Diusionskonstanten ist es ausreichend, nur eine zu betrachten, da nur das
relative Verhaltnis von DD zu DB interessant ist.
4
2.4. DIE ADAPTIVE DARWIN-STRATEGIE
31
wieder zur Umwandlung des ursprunglichen Problems in ein Eigenwertproblem
0 = D4 i(~x) + [i ; E (~x; ; )] i(~x)
(2.37)
2
E (~x; ; ) = F (~x) + V (~x) = F ; D
4
F
+ D (rF ) (rF ()2.38)
2
4
zu kommen. Die Einfuhrung eines Hamiltonoperators der Form
H (; ) = ;D4 + E (~x; ; )
(2.39)
erzeugt eine 2-parametrige Familie von stationaren Schrodingergleichungen.
Eine ausfuhrliche Diskussion der Eigenschaften dieser Gleichung ndet sich
im nachsten Kapitel.
2.4 Die adaptive Darwin-Strategie
Wir wollen uns nun dem Problem der automatischen Anpassung von Fortschrittsgeschwindigkeiten wahrend des Simulationslaufs zuwenden. Schwefel [30] schlug dafur eine Strategie vor, welche die Schrittweite jedes Suchers ebenfalls mutiert und selektiert. Die Idee besteht darin, den Nachteil
der Evolutionsstrategie - an Stellen, die weit vom Optimum entfernt sind,
genauso schnell zu sein, wie an den interessanten Stellen nahe des Optimum
- zu beseitigen.
Wie oben schon kurz erwahnt besteht eine Losung dieses Problems darin,
da man die Schrittweite als zusatzliche Variable betrachtet, die in den
Selektionsproze einbezogen wird. In der bisherigen Darwin-Strategie wurde die Schrittweite, ausgedruckt durch die Diusionskonstante D, konstant
gehalten. Nun erweitern wir den Suchraum X um eine Koordinate, und es
ergibt sich (~x; ) 2 X IR. Die Mutation der Schrittweite erfolgt durch eine
log-normalverteilte Zufallszahl, die durch die Transformation = exp() mit
als normalverteilte Zufallszahl dargestellt werden kann.Um die entsprechende Gleichung aus diesen Vorstellungen zu erhalten, werden wir auf einen von
Schimansky-Geier [54] entwickelten Formalismus zuruckgreifen. Dazu betrachtet man zwei Sucher, die durch die Paare (x; x) und (y; y ) beschrieben
werden. Sei F (x) die zu minimierende Fitnessfunktion und f (x) = hF i;F (x)
die Fitness oberhalb des zeitabhangigen Mittelwertes. In einem Schritt des
Algorithmus' wird die Selektion fur x mit der Rate und die fur x mit
32
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
der Rate in Abhangigkeit von f (x) ausgefuhrt. So erhalten wir dafur die
folgenden U bergange:
8 jf (x)j
>
;!
>
>
jf (x)j
< ;!
(x; x; y; y ) > jf (x)j
;!
>
>
jf (x)j
: ;!
(x; x; x; y )
(y; x; y; y )
(x; x; y; x)
(x; y ; y; y )
:
:
:
:
f (x) > 0
f (x) < 0 :
f (x) > 0
f (x) < 0
(2.40)
Die ersten beiden U bergange beschreiben die Selektion in x-Richtung, wahrend
die nachsten zwei U bergange die Selektion der Schrittweite bewirken. Um
die zeitliche A nderung von P (x; t) durch die U bergange (2.40) zu beschreiben, betrachtet man die Mastergleichung [4]. Dazu konstruiert man aus den
U bergangen die entsprechenden Raten W (u; u; v) := W ((u; v) ! (u; v)) mit
u = (x; x ) und v = (y; y ). Dann ist die Mastergleichung durch
@ P (u; v; t) = Z W (u; u; v) P (u; u; t) ; W (u; u; v) P (u; v; t) du
@t
Z
+ W (v; v; u) P (u; v) ; W (v; v; u) P (u; v; t) dv (2.41)
gegeben, wobei wir die Zweiteilchenverteilung P (u; v; t) zu betrachten haben,
da unser Selektionsschema eine Wechselwirkung zwischen zwei Suchern darstellt. Aus den vorherigen Abschnitten wissen wir, da der Mutationsproze
von den beiden anderen Prozessen Selektion und Reproduktion unabhangig
ist. Deshalb zerlegen wir die Raten W in zwei Raten W = Wm + Wrs fur
die Mutation Wm und die verbleibenden Prozesse Wrs. Fur die erste Rate
nehmen wir an:
Wm ((x0 ; 0) ! (x; ta)) = N (x0 ; x; exp(0 ; )) N (0 ; ; 1) (2.42)
Wm ((x; ) ! (x0 ; 0)) = N (x ; x0 ; exp( ;!0)) N ( ; 0; 1) (2.43)
2
mit N (x; ) = p 1 exp ; 2x2
2
und konnen dadurch die U bergange
x ! x0 = x + ! 0 = + '
beschreiben, wobei eine Gausche Zufallszahl mit Standardabweichung
2.4. DIE ADAPTIVE DARWIN-STRATEGIE
33
exp() und ' ebenfalls eine solche Zufallszahl, jedoch mit der Standardabweichung 1, ist. Zusammen mit diesen Raten erhalten wir die Mastergleichung
@ P (x; ; t) = Z (N (x0 ; x; exp(0))N (0 ; ; 1)P (x0; 0; t)
@t
; N (x ; x0 ; exp())N ( ; 0; 1)P (x; ; t)) dx0 d0 (:2.44)
Entsprechend [4] nehmen wir wiederum an, da nur kleine Sprunge auftreten,
so da ein > 0 und ein > 0 existieren mit
Wm ((x0; 0) ! (x; )) = W ((x0; 0); r; ) 0
W ((x0 + x; 0 + ); r; ) W ((x0 ; 0; r; )
fur jrj > jj > ;
fur jxj < jj < :
Weiterhin nehmen wir wieder an, da die Losung P (x; ; t) nur schwach in
Bezug auf x und variiert. Dann entwickeln wir unter der Annahme x0 =
x + r und 0 = + den Integranden der Mastergleichung um r = 0 und
= 0 bis zur zweiten Ordnung. Wir erhalten somit
N (r; exp( + ))N (; 1)P (x + r; + ; t) ; N (r; exp())N (; 1)P (x; ; t) N (r; exp())N (; 1) r@xP (x; ; t) + @ P (x; ; t) + 21 r2@x2 P (x; ; t)
1
1
2
2
3
3
+ 2 @ P (x; ; t) + 2 @x@ P (x; ; t) + O(r ) + O( )
1
2
2
+ N (; 1)P (x; ; t) @ N (r; exp()) + @ N (r; exp()) :
2
Zusammen mit den Beziehungen
Z
Z
rN (r; exp())dr = 0
N (; 1)d = 0
Z
Z
r2N (r; exp())dr = exp()
2 N (; 1) = 1
sieht der erste Teil der Entwicklung wie folgt aus:
1 exp()@ 2 P (x; ; t) + 1 @ 2 P (x; ; t) ;
x
2
2 wahrend der weitere Teil den Ausdruck
1 P (x; ; t) Z (r4 exp(;4) + 1 ; 4r2 exp(;2))N (r; exp())dr = 3 P (x; ; t)
2
2
34
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
produziert. Wenn wir wie bei der Darwin-Strategie die tnessproportionale
Vermehrung annehmen, so erhalten wir
@ P (x; ; t) = F (x) + 3 P (x; ; t) + 1 exp()@ 2 P (x; ; t) + 1 @ 2 P (x; ; t) :
x
@t
2
2
2 (2.45)
Den Selektionsterm konnen wir einfach aus der Forderung nach der Erhaltung
der Normierung von P (x; ; t) gewinnen. Dies ist naturlich aquivalent zur
konstanten Anzahl von Suchern wahrend des dynamischen Prozesses. Wir
erhalten nun das Endergebnis
@ P (x; ; t) = (F (x) ; hF i) P (x; ; t) + 1 e 4 P (x; ; t) + 1 4 P (x; ; t) ;
@t
2 x
2 (2.46)
welches alle Prozesse, d.h. Mutation, Selektion und Reproduktion, berucksichtigt. Wie wir teilweise in [56] gezeigt haben, besitzt diese Strategie das
gewunschte Verhalten der Geschwindigkeitssteuerung. Weitere Untersuchungen benden sich in [30, 11, 12, 36] sowie in der angegebenen Literaturliste.
2.5 Die Selfannealing-Strategie
Diese Strategie wurde von Rose [31] entwickelt, um das Problem der richtigen Wahl eines \cooling schedule" zu losen. Durch Simulationen wurde diese
Strategie mit den vorher beschriebenen verglichen, wobei sich eine Vergroerung der Geschwindigkeit gegenuber den anderen Strategien zeigt. Die Idee
ist genau die gleiche wie bei der adaptiven Darwin-Strategie. Wir gehen von
einem Ensemble von Boltzmannsuchern aus, wobei jeder Sucher ein eigenes
besitzt. Damit wird die Temperatur in die Selektion einbezogen. Dies
druckt sich in der Tatsache aus, da wir eine Rate fur die Temperaturselektion wahlen mussen. Desweiteren wird naturlich auch die Temperatur jedes
Suchers mutiert. Mathematisch erhalten wir, da in jedem Schritt des Algorithmus' die Selektion fur die x-Richtung (Rate ) und fur die x-Richtung
(Rate ) jeweils mit f (x) = hF i ; F (x) multipliziert wird. Damit ergeben
sich die U bergange
8 jf (x)j
>
;! (x; x; x; y ) : f (x) > 0
>
>
jf (x)j
< ;!
(x; x; y; y ) > jf (x)j (y; x; y; y ) : f (x) < 0 :
(2.47)
;!
(
x;
;
y;
)
:
f
(
x
)
>
0
>
x
x
>
jf (x)j
: ;!
(x; y ; y; y ) : f (x) < 0
2.6. EINHEITLICHE BESCHREIBUNG
35
Diese U bergange lassen sich mit (2.40) vergleichen, wobei die ersten beiden U bergange die alleinige x-Selektion und die letzten beiden die alleinige x-Selektion beschreiben. In der Mastergleichung ergibt sich fur die ersten beiden U bergange wieder der bekannte Ausdruck (2.23). Wegen der
Unabhangigkeit der letzten beiden U bergange von x leisten diese keinen
Beitrag. Das ist aus physikalischer Sicht auch verstandlich, da die Interpretation von als reziproke Temperatur zeigt, da bei dieser Strategie kein
Warmeaustausch erfolgt und daher auch keine Veranderung von durch den
Selektionsterm erfolgen kann. Wir wollen an dieser Stelle nicht die Rechnung wiederholen, da sie sich aus den Herleitungen in Abschnitt 2.1 und 2.2
zusammensetzen lassen. Damit ergibt sich die Dynamik der SelfannealingStrategie
@ P (x; ; t) = f P + D @ (P @ f ) + D @ 2 P + D @ 2 P : (2.48)
x
x
x
@t
Die Anpassung von steuert allein der Term D @x (P @x f ), wobei die Mutationsstarke durch D gegeben ist. Die Selfannealing-Strategie umfat alle
drei oben behandelten Strategien und erweitert diese durch die Steuerung
von .
2.6 Einheitliche Beschreibung
Angesichts der Fulle verschiedener Strategien fragt man sich naturlich, ob es
moglich ist, diese Vielfalt unter einem bestimmten Gesichtspunkt zusammenzufassen. Dazu nehmen wir an, da wir eine Fitnessfunktion F : X ! IR uber
einen Raum X mit Metrik gij deniert haben. Die grundsatzliche Struktur
aller Gleichungen ist einfach durch
d P (~x; t) = ;HP (~x; t) ;
(2.49)
dt
wobei H ein Operator der Form
X
(2.50)
H = ; p1g @i(gij pg @j ) + V (F (x); rF; 4F )
i;j
mit g = det(gij ) ist, gegeben. Die Losung von (2.49) lat sich formal durch
P (~x; t) = exp(;tH )P (~x; 0)
(2.51)
36
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
mit exp(;tH ) als Warmeleitungskern (Heat-Kernel) ausdrucken. Die genaue
Auswertung dieses Ausdrucks werden wir im Kapitel 4 behandeln, wo auch
eine Klassikation fur solche Arten von Gleichungen bzgl. ihres Losungsverhaltens vorgeschlagen wird. An dieser Stelle wollen wir uns nur auf die
Ableitung aller vorher besprochenen Strategien konzentrieren. Dazu legen
wir die Funktion V sowie die Metrik gij auf X bzgl. der gewahlten Koordinaten fest. Desweiteren lassen wir noch eine Transformation der Verteilungsfunktion P (x; t) zu, um die Gleichung auf die Normalform zu bringen.
Der Einfachheit halber wahlen wir einen 2-dimensionalen Raum IR2 als unterliegenden Raum. Dann ist die Strategie durch die Angabe der Metrik, der
Funktion V sowie der Transformation von P eindeutig bestimmt. Im folgenden werden die Symbole x; y als Koordinaten des Phanotypraums und bzw.
zur Beschreibung der Schrittweite benutzt. Fur die einzelnen Strategien
erhalten wir:
Boltzmann-Strategie (Gleichung (2.6))
Koordinaten (x; y)
Transformation
P (x; y; t) ! exp(F (x; y)=2)P (x; y; t)
Metrik gxx = gyy = 1
D
2
Funktion V V = D 4F (x; y) ; D (rF )2
2
4
Darwin-Strategie (Gleichung (2.17))
Koordinaten (x; y)
Transformation 0
1
P (x; y; t) ! exp @; hF i( )d A P (x; y; t)
Zt
0
Metrik gxx = gyy = 1
D
Funktion V V = F (x; y)
Gemischte Strategie (Gleichung (2.35))
Koordinaten
(x; y)
2.6. EINHEITLICHE BESCHREIBUNG
37
Transformation 0
1
Zt
P (x; y; t) ! exp @; hF i( )d + 2 F (x; y)A P (x; y; t)
0
Metrik gxx = gyy = D1
2
Funktion V V = D 4F (x; y) ; D (rF )2 + F (x; y)
2
4
Adaptive Darwin-Strategie (Gleichung (2.46))
Koordinaten (x; )
Transformation 0
1
Zt
P (x; ; t) ! exp @; hF i( )d + 4 A P (x; ; t)
0
Metrik gxx = exp(;) g = 1
Funktion V V = F (x) ; 1
16
Selfannealing-Strategie (Gleichung (2.48))
Koordinaten (x; )
Transformation:
P (x; ; t) ! exp(F (x)=4)P (x; ; t)
Metrik
gxx = exp(F (x)=4)=D g = exp(;F (x)=4)=D
Funktion V
2
V = D 2 @x2 F (x; y) ; D 4 (@xF )2 ; D F 2(x)=2
Aufbauend auf dieser Aufstellung konnen wir nun eine geometrische Darstellung fur die adaptiven Strategien liefern. Bei jeder dieser Strategien ist
die Komponente der Metrik, die den Abstand zwischen zwei Phanotypen
bestimmt, explizit von der Schrittweitenkoordinate abhangig. Das bedeutet
aber wiederum, da bei einer Anpassung der Schrittweite der Abstand zwischen den Phanotypen deformiert wird. Wir erhalten damit das gewunschte
Verhalten.
38
KAPITEL 2. EIN PHYSIKALISCHER ZUGANG ZU DEN EA
Im nachsten Kapitel werden wir uns vorerst auf die Frage nach der Geschwindigkeit einer Strategie konzentrieren, um im ubernachsten Kapitel eine Klassikation aller Strategien entsprechend der einheitlichen Darstellung
(2.49) vorzuschlagen.
Kapitel 3
Der Vergleich von Strategien
\Unter allen Disziplinen der Mathematik ist die Theorie der Dierentialgleichungen die Wichtigste. Alle
Zweige der Physik stellen uns Probleme, die auf die Integration von Dierentialgleichungen hinauskommen.
Es gibt ja uberhaupt die Theorie der Dierentialgleichungen den Weg zur Erklarung von Naturphanomen,
die Zeit brauchen."
Sophus Lie (1894)
Der Vergleich der im vorherigen Kapitel denierten Strategien soll unter Berucksichtigung zweier Gesichtspunkte erfolgen. Als erstes werden dazu
zwei Groen angegeben, die eine adaquate Wiederspiegelung der Geschwindigkeit der Strategie darstellen. Die Berechnung dieser Geschwindigkeiten in
Abhangigkeit von der Strategie zeigt fur die Parabel das erwartete Ergebnis. Fur den Fall einer zu uberwindenden Barriere fuhren wir eine weitere
Groe ein, die die Wahrscheinlichkeit fur das Aunden eines Suchers auf der
anderen Seite der Barriere darstellt. Mit Hilfe dieser Groe werden wir die
einzelnen Strategien vergleichen.
39
40
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
3.1 Vergleichsmae fur die Strategien
3.1.1 Denition der Mae
Am Ende des letzten Kapitels hatten wir eine allgemeine Gleichung (2.49)
angegeben, die alle oben beschriebenen Typen von Strategien enthalt. Die
Losung dieser Gleichung widerspiegelt naturlich das wahre Verhalten der
Strategie, lat sich aber beim konkreten Problem schwer bzw. gar nicht berechnen. Auerdem werden bei der konkreten Realisierung der Strategien
nicht die partiellen Dierentialgleichungen, sondern deren stochastische Entsprechungen benutzt. Deshalb suchen wir nach Groen, die sich wahrend des
Simulationslaufs leicht bestimmen lassen, aber trotzdem eine gewisse Aussagekraft bzgl. des Verhaltens besitzen.
Als einfachste Variante einer solchen Groe betrachten wir den Erwartungswert hF (x)i der Fitnessfunktion bzgl. der Verteilung der Sucher. Die
zeitliche A nderung dieser Groe
v(1) = ; dtd hF (x)i
(3.1)
ist die Geschwindigkeit der Strategie auf der Fitnesslandschaft. Naturlich
gibt es noch die Moglichkeit, eine zweite Geschwindigkeit der Form
(3.2)
vk(2) = ; dtd hxk i
zu denieren, leider besitzt diese Groe aufgrund des unbestimmten Vorzeichens keine so groe Aussagekraft. Stattdessen betrachten wir besser die
Fitnessvarianz
F2 = h(F (x) ; hF (x)i)2i = hF 2 ; hF (x)i2i ;
(3.3)
welche die "Breite\ der Verteilung auf der Fitnesslandschaft angibt. Erste
Aussagen uber diese Groen sind mit Hilfe der entsprechenden Gleichungen
moglich. Fur den Vergleich der Strategien am Beispiel eines Doppeltopfes
werden noch zwei weitere Groen eine Rolle spielen. Wir denieren diese
Groen durch die Beziehungen
(x0 ; t) =
Z1
x0
P (x; t) dx
(3.4)
Z1
_(x0 ; t) = d (x0 ; t) = d P (x; t) dx
dt
x dt
0
 DIE STRATEGIEN
3.1. VERGLEICHSMASSE FUR
41
wobei x0 > 0 den Punkt kennzeichnet, den die Strategie "uberwinden\ mu.
Die erste Groe (x0 ; t) gibt die Wahrscheinlichkeit dafur an, den Sucher
im Intervall [x0; 1] zu nden, wahrend die zeitliche Ableitung dieser Wahrscheinlichkeit der Strom von Suchern durch die Barriere ist.
Die Einfuhrung eines vollig anderen Maes fur die Geschwindigkeit einer Strategie ist durch die einheitliche Beschreibung aller Strategien mittels
der Gleichung (2.49) angeregt worden. Aufgrund der A hnlichkeit mit (1.4)
besitzen wir damit eine explizite Beschreibung der Losung von (2.49) durch
ein Funktionalintegral der Form (1.3) mit der Wirkung (1.2). Naturlich ist
die Berechnung des Funktionalintegrals genauso schwierig wie die Losung von
(2.49). Wie wir aber schon im Abschnitt 2.2 durch eine Sattelpunktsapproximation gezeigt haben, bewegen sich die Sucher im Mittel auf der klassischen
Trajektorie. Betrachten wir nur die Boltzmann- und Darwin-Strategie, so
erhalten wir aus der Gleichung (2.49) zusammen mit dem Operator (2.50)
die folgende Wirkung
0
1
!2
1
dx
S [x(t)] = d @ 4D d ; V (x( ))A ;
0
Zt
(3.5)
aus der sich durch Variation die klassische Trajektorie
d2 x(t) = ;2DrV
(3.6)
dt2
ergibt. Als Geschwindigkeit fur die Strategie denieren wir die zeitliche Ableitung der Trajektorie x(t)
(3.7)
vcl (t) = dtd x(t) :
Die nachste Naherung in der Sattelpunktsapproximation ist durch die Entwicklung der Wirkung um die klassische Trajektorie xcl bis zum quadratischen Glied gegeben. Wir erhalten einfach
X 2
S [x(t)] Scl + x x S [x] (xi ; (xcl )i)(xj ; (xcl )j ) + O(x3) (3.8)
i j
i;j
x=xcl
mit den Komponenten xi von x und daraus fur das Funktionalintegral (1.3)
2 0
! 1;1=2 3
2
P (x; t) exp(;Scl ) 641 + @det xx S [x] A 75 :
i j
x=xcl
(3.9)
42
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
Eine explizite Berechnung dieses Ausdrucks erlaubt uns die Berechnung der
anderen Geschwindigkeiten v(1) und vi(2) . An dieser Stelle konnte man sich
naturlich fragen, ob die bisherigen Mae fur die Geschwindigkeit einer Strategie schon ausreichend sind. Um diese Frage erschopfend zu beantworten,
betrachten wir noch einmal die einheitliche Beschreibung aller Strategien in
der Form (2.49)
d P (~x; t) = ;HP (~x; t) ;
dt
wobei H ein positiv deniter, selbstadjungierter Operator (2.50) ist. Als
formale Losung ergibt sich
P (~x; t) = exp(;tH )P (~x; 0)
mit exp(;tH ) als Warmeleitungskern. Dieser Warmeleitungskern lat sich
wie folgt denieren:
Z
exp(;tH )P (~x; 0) = pt(~x; ~y)P (~y; 0)dny
B
(3.10)
mit dem Kern pt (~x; ~y), welcher folgende asymptotische Entwicklung [57] besitzt:
1
exp(;jj~x ; ~yjj2=4t) X
pt(~x; ~y) = 2 q
tii (~x; ~y)
(3.11)
n
(4t) ;(n=2 + 1) i=0
mit den Warmeleitungskernkoezienten i(~x; ~y), die Funktionen von F und
deren Ableitungen sind. Ausgehend von dieser allgemeinen Entwicklung erhalten wir in Form dieser Koezienten eine Menge neuer Groen. Der Nachteil besteht nur darin, da mit fortschreitender Zeit t der Einu der schwer
zu berechnenden Koezienten i(~x; ~y) starker wird. Deshalb eignet sich diese Methode nur zur Analyse kleiner Zeitschritte. Der Ausweg besteht darin,
die Entwicklung der Losung nach den Eigenfunktionen der stationaren Gleichung (siehe z.B. die Formeln (2.9) und (2.11)) durchzufuhren. Dadurch bekommen wir Aussagen uber das asymptotische Verhalten der Strategie. So
bestimmt der Abstand der Eigenwerte der stationaren Gleichung entscheidend die Geschwindigkeit der Strategie. Im ersten Abschnitt des nachsten
Kapitels werden wir uns diesen Fragen widmen. Dort werden wir die Beziehungen zwischen der A nderung von Autokorrelationsfunktionen und dem
Spektrum herstellen. Auch solche Groen lassen sich wahrend der Simulation
leicht bestimmen.
 DIE STRATEGIEN
3.1. VERGLEICHSMASSE FUR
43
3.1.2 Die Boltzmann-Strategie
Im folgenden wollen wir fur jede im vorherigen Kapitel denierte Strategie die Geschwindigkeiten unter Ausnutzung der entsprechenden Gleichung
berechnen. Als erste Strategie wurde die Boltzmann-Strategie behandelt.
Zusammen mit der Gleichung (2.6) erhalten wir fur die Geschwindigkeiten
v(1) = ; dtd hF i = D hrF rF i ; Dh4F i ;
vk(2) = D hrxk rF i :
(3.12)
(3.13)
Die Geschwindigkeit v(1) hangt von der Krummung und dem Gradienten der
Fitnesslandschaft ab. Als hinreichende Bedingung fur die Positivitat der
Geschwindigkeit erhalten wir die lokale Bedingung
(rF )2 > 4F ;
(3.14)
welche bis auf einen Faktor dieselbe wie Bedingung (2.12) ist. Setzen wir
eine konkrete Fitnessfunktion F (x) ein, so konnen wir aus dieser Bedingung
eine Einschrankung des Raumes X auf einen Unterraum berechnen, fur den
die Geschwindigkeit v(1) immer positiv ist.
3.1.3 Die Darwin-Strategie
Die Berechnung der Geschwindigkeiten fur die Darwin-Strategie geschieht
nach demselben Muster und wir erhalten mit Hilfe von Gleichung (2.17)
v(1) = hF 2i ; hF i2 ; Dh4F i ;
vk(2) = hxk F i ; hxk ihF i :
(3.15)
(3.16)
Wie im Falle der Boltzmann-Strategie konnen wir aus der Positiviatsforderung fur v(1) eine hinreichende Bedingung der Form
F 2
F D
< F > > 1 + < F >4 < F >
ableiten.
(3.17)
44
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
3.1.4 Weitere Strategien
Aufgrund der starken A hnlichkeit in der Berechnung wollen wir fur die anderen Strategien die Geschwindigkeiten nur auisten.
Gemischte Strategie
Gleichung (2.35)
v(1) = D hrF rF i + (hF 2i ; hF i2) ; Dh4F i (3.18)
vk(2) = D hrxk rF i + (hxk F i ; hxk ihF i)
(3.19)
adaptive Darwin-Strategie
Gleichung (2.46)
v(1) = hF 2i ; hF i2 ; Dhey 4F i
vk(2) = hxk F i ; hxk ihF i
(3.20)
(3.21)
Selfannealing-Strategie
Gleichung (2.48)
v(1) = Dh rF rF i + (hF 2i ; hF i2) ; Dh4F i (3.22)
vk(2) = Dh rxk rF i + (hxk F i ; hxk ihF i)
(3.23)
3.2 Vergleich der Boltzmann- und DarwinStrategie
Um das Verhalten der Strategien besser zu verstehen, sollen in diesem Abschnitt anhand einiger Beispiele die Gemeinsamkeiten und Unterschiede der
einzelnen Strategien untersucht werden. Dabei stehen naturlich die Boltzmannund die Darwin-Strategie im Vordergrund des Interesses. Fur diese beiden
Falle ndet man entsprechende Untersuchungen in [41] und einschlielich der
Simulation des Algorithmus' in [58]. Als Beispiele fur den Vergleich wahlen
wir die zwei elementarsten Falle: das unimodale Problem (Parabel) und das
bimodale Problem (Doppeltopf).
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 45
3.2.1 Topologie von Fitnesslandschaften
Wir betrachten eine Optimierungsaufgabe, die durch die Angabe des d-dimensionalen Phanotypraums B IRn und der Fitnessfunktion F : B ! IR
bestimmt ist. Weiterhin wollen wir voraussetzen, da die Fitness F eine
multimodale Funktion ist. Dann konnen wir diese Funktion um die kritischen
Punkte ~x(0) , d.h.
@ F (x)
(3.24)
x=x = 0 fur alle i ;
@xi
mittels einer Taylorentwicklung bis zur quadratischen Ordnung entwickeln
und erhalten fur die Fitnessfunktion
d
X
2
Fq (x) := F (x) = F (x(0) ) + 21
Hij (xi ; x(0)
(3.25)
i )
i=1;j =1
(0)
mit der Hesseschen Matrix
!
2 F @
:
(Hij ) = @x @x i j x=x
(0)
Ist die Hessesche Matrix nicht ausgeartet (det Hij 6= 0), so nennt man Fq
auch Morsefunktion. Wird diese Bedingung nicht erfullt, so gibt es einen
Unterraum N B des Phanotypraums, auf dem die ersten Ableitungen von
F verschwinden. Der Grund dafur besteht darin, da die Matrix (Hij ) symmetrisch und damit diagonalisierbar ist. Verschwindet nun die Determinante
dieser Matrix, so mu mindestens ein Eigenwert der Matrix verschwinden.
Die Anzahl dieser verschwindenden Eigenwerte (oder auch die Dimension des
Kerns ker H der Matrix) gibt die Dimension dieses Unterraumes N an. Solche "Korridore\ gehoren zu den Standardbeispielen der Evolutionsstrategien.
Im folgenden wollen wir annehmen, da die Matrix (Hij ) nicht ausgeartet
ist. Wie Morse [59] zeigen konnte (Lemma von Morse), ndet man immer
ein Koordinatensystem (y1; : : : ; yd) in der Umgebung des kritischen Punktes
x(0) = p, wo die Funktion F durch
F (y) = F (p) ; (y1)2 ; : : : ; (y)2 + (y+1)2 + : : : + (yd)2
gegeben ist. Dahinter steckt einfach die Tatsache, da die Hessesche Matrix
diagonalisiert wird. Die Zahl wird Index des kritischen Punktes p genannt.
46
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
Sei C die Anzahl der kritischen Punkte vom Index , so ergeben sich die
Morse-Ungleichungen [60] b (B ) C mit den Betti-Zahlen b (B ), die nur
von der Topologie von B abhangen. Weiterhin gilt noch die Beziehung
X
X
(B ) = (;1)b (B ) = (;1) C
(3.26)
mit der Euler-Charakteristik (B ) von B . In Tabelle 3.1 sind diese Zahlen fur einige Beispiele berechnet worden. Aus Sicht der OptimierungstheoBezeichnung
Phanotypraum
Betti-Zahlen
Euler-Charakteristik
d
d-Ball
B
b0 = 1; bi = 0
1
8i > 0
d-Sphare
@B d+1 = S d
b0 = 1; bd = 1;
1 + (;1)d
bi = 0 8(i 6= d)
k-te-Einschrankung B d nLk
b0 = 1 + dk;1
1 + (;1)d;k;1
bd;l;1 = lk
d
mehrfache EinB n(Lk t Ll ) b0 = 1 + 1k + 1l
1 + 1k + 1l +
schrankung ohne
bd;k;1 = 1 + lk ;
(;1)d;k;1 (1+ lk)+
Schnitt
bd;l;1 = 1 + lk
(;1)d;l;1 (1 + lk )
d
k
l
mehrfache EinB n(Lk ? Ll ) b0 = 1 + 1 + 21
1 + 1k + 21l +
schrankung mit
bd;k;1 = 1 + 3lk ;
(;1)d;k;1 (1 + 3lk )
k
Schnitt
bd;l;1 = 1 + 3l
+(;1)d;l;1 (1+3lk )
Tabelle 3.1: Betti-Zahlen und Euler-Charakteristik einiger Phanotypraume
(die Bezeichnungen sind in Anhang A erklart)
rie lassen sich die Betti-Zahlen wie folgt interpretieren: Eine Neben- bzw.
Zwangsbedingung des Optimierungsproblems auert sich darin, da ein oder
mehrere Unterraume, die durch Bedingungen bestimmt sind, aus dem Phanotypraum "ausgeschnitten\ werden. Die Betti-Zahl b ist die Anzahl der dimensionalen, ausgeschnittenen Unterraume. Die beiden Zahlen C0 und Cd
reprasentieren die Anzahl der Minima bzw. Maxima. Unter der Pramisse,
da die Fitnessfunktion F multimodal ist und mit B = IRd erhalten wir das
System von Bedingungen
1 C0
0 C
Xk 1 k d
1 = (;1) C
aus dem wir zusammen mit Tabelle 3.1 folgende drei Aussage treen konnen.
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 47
1. Eine Erhohung der Anzahl von Maxima und Minima (Cd und C0) ist
mit einer Erhohung der Anzahl der Sattelpunkte verbunden.
2. Die Anzahl der Sattelpunkte C zum Index 0 < < d ; 1 kann erhoht
werden, falls gleichzeitig die Anzahl der Sattelpunkte C+1 um denselben Betrag erhoht wird.
3. Durch die Berucksichtigung von Neben- bzw. Zwangsbedingungen wird
die Anzahl der Sattelpunkte erhoht.
Die erste Aussage bendet sich in U bereinstimmung mit dem Resultat in [61].
An dieser Stelle wollen wir die topologischen Untersuchungen der Struktur
von Fitnesslandschaften verlassen und verweisen auf weitere Arbeiten [62,
63], die im Zusammenhang mit dem biologischen Hintergrund stehen, sowie
auf eine Untersuchung der allgemeinen Struktur solcher Landschaften (siehe
dazu z.B. [64]) fur verschiedene Probleme in der Dissertation von Rose [39].
3.2.2 Gemeinsamkeiten
Auf einer Fitnesslandschaft gibt es zwei wichtige Situationen, die i.a. immer
auftreten. Die erste Situation ist der Gradientenabstieg in ein lokales Minimum, wahrend die andere Situation das U berspringen einer Barriere ist. Es
ist anschaulich klar, da der Gradientenabstieg eine Situation darstellt, auf
die alle Strategien auf die gleiche Art zu reagieren haben. Damit haben wir
die Gemeinsamkeiten umrissen. Im Gegensatz dazu stellt die U berwindung
einer Barriere eine Situation dar, auf die jede Strategie verschieden reagieren wird. Deshalb habe wir diesen Fall im nachsten Abschnitt dargelegt.
Wir konnen das eben gesagte auch in die Form bringen, da die unimodalen Probleme die Gemeinsamkeiten zwischen den Strategien unterstreichen,
wahrend die bimodalen die Unterschiede starker betonen.
Im folgenden wollen wir uns auf das einfachste Beispiel einer unimodalen
Fitnessfunktion beschranken, welche die 3 Falle: Maximum, Minimum und
Sattel enthalt. Dieses Beispiel ist durch eine quadratische Funktion der Form
Fq = Fmin + a1 (x1 ; (x(0) )1)2 + a2(x2 ; (x(0) )2)2
(3.27)
mit ~x = (x1 ; x2) gegeben. Nach dem Lemma von Morse wissen wir, da
eine solche Darstellung immer moglich ist. Andererseits besitzt diese Separation der Richtungen den entscheidenden Vorteil, da die Losung der
48
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
Darwin-Strategie und der Boltzmann-Strategie auf ein 1-dimensionales Problem zuruckgefuhrt werden kann.
Die drei moglichen Falle werden wie folgt behandelt. Als erstes untersuchen wir den Fall des Minimums, um dann durch eine Transformation der
Parameter a1 und a2 die anderen Falle zu erhalten.
Minimum
Wir beginnen mit der Untersuchung des Minimums, welches durch die Bedingungen a1 ; a2 > 0 charakterisiert ist. Sowohl fur die Boltzmann- als auch fur
die Darwin-Strategie erhalten wir nach den entsprechenden Umformungen
(2.8) und (2.25) sowie einer Koordinatentransformation die zeitabhangige
Gleichung
!
@ y(~x; t) = D @ 2 + @ 2 y(~x; t) + (A ; A x2 ; A x2 )y(~x; t) ; (3.28)
0
1 1
2 2
@t
@x21 @x22
wobei fur die Boltzmann-Strategie
P (~x; t) = exp(;Fq =2)y(~x; t) ;
A0 = D(a1 + a2) ; A1 = D 2(a1)2 ; A2 = D 2(a2 )2 (3.29)
mit der Koordinatentransformation xi ! (xi + (x(0) )i) gilt, wahrend die
Darwin-Strategie bezuglich derselben Koordinatentransformation durch
Zt
P (~x; t) = exp(; hFq i( )d )y(~x; t) ;
=0
A0 = Fmin ; A1 = ja1 j ; A2 = ja2j
(3.30)
dargestellt wird. Durch den Separationsansatz y(~x; t) = y1(x1 ; t)y2(x2 ; t)
erhalten wir zwei 1-dimensionale Gleichungen. Fur den Fall A1 ; A2 > 0
wollen wir nun die Greensche Funktion G(x; x0; t), die durch
!
@ ; D4 + ax2 ; a G (x; x0 ; t) = (x ; x0 )
(3.31)
0 1
@t
deniert ist, berechnen. Diese Greensche Funktion bezeichnet man auch als
Warmeleitungskern. Die Berechnung von G(x; x0; t) fur a > 0 ist durch zwei
Methoden moglich: Erstens durch das Feynman'sche Pfadintegral [1, 2]
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 49
und zweitens mittels der Formel von Mehler [57]. Die Rechnung ist in der
angegebenen Literatur nachzulesen und soll an dieser Stelle nicht angefuhrt
werden. Fur die Losung des Problems (3.31) erhalten wir
q
pa(cosh(2tpDa)(x2 + (x0)2 ) ; 2xx0 ) !
a t
a=De
p
p
G1 (x; x0; t) = q
:
p exp ;
2 D sinh(2t Da)
2 sinh(2t Da)
(3.32)
Damit konnen wir fur eine beliebige Anfangsverteilung P (x; 0) die Losung
durch ein Integral der Form
Z
P (x; t) = G1(x; x0 ; t)P (x0; 0)dx0
4
0
berechnen. Fur die Geschwindigkeit erhalten wir
Z
@ P (x; t) = ; Z Z ax2 @ G (x; x0 ; t)P (x0; 0)dx0 dx :
v(1) = ; dtd hax2 i = ; ax2 @t
@t 1
Im Falle der speziellen Anfangsverteilung P (x; 0) = (x ; x0 ) ist es einfach,
die Geschwindigkeit explizit zu berechnen, und wir erhalten
p
p
p
p
2
p
)p; aD cosh(t 2Da)(3.33)
v(1) = ; dtd hax2 i = Da 2a (x0 ) sinh(t 2Da
3
cosh (t 2Da)
(siehe [41, 58]). Naturlich ist fur das 2-dimensionale Problem (3.27) die Gesamtgeschwindigkeit die Summe der Geschwindigkeiten zu A1 und A2 . Aus
(3.30) erhalten wir fur die Geschwindigkeit der Darwin-Strategie in Bezug
auf die Anfangsverteilung P (x; 0) = (x1 ; (x0 )1)(x2 ; (x0 )2) und die Fitnessfunktion Fq
v(1) = ; dtd hFq i
q
q
q
2 Djai j( 2jai j=D (x0 ; x(0) )2i sinh(t 2Djaij) ; cosh(t 2Djaij))
X
q
=
(3.34)
;
cosh3(t 2Djaij)
i=1
welche in Abbildung 3.1 fur die Fitnessfunktion Fq = ax2 dargestellt ist.
Die Form der Geschwindigkeitskurve lat sich bei diesem Beispiel auch anschaulich verstehen. Im ersten Teil der Kurve wird die anfangliche DeltaVerteilung verbreitert, d.h., innerhalb der Population steigt die Variabilitat.
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
50
5.0
8.0
Geschwindigkeit
Geschwindigkeit
7.0
6.0
5.0
a=1
a=2
a=5
4.0
3.0
2.0
4.0
3.0
x0=1
x0=2
x0=5
2.0
1.0
1.0
0.0
0.0
1.0
2.0
3.0
4.0
5.0
Zeit t
6.0
7.0
8.0
9.0
10.0
0.0
0.0
1.0
2.0
3.0
4.0
5.0
Zeit t
6.0
7.0
8.0
9.0
Abbildung 3.1: Darstellung der Geschwindigkeit zum Erreichen eines Minimums fur die Darwin-Strategie, das rechte Bild zeigt den Einu der
Krummung a in Fq , wahrend das linke Bild die Variation des Anfangspunkts
x0 darstellt.
Etwas anders ausgedruckt nimmt die Standardabweichung der Verteilung
erst zu, wobei sich das Maximum der Verteilung kaum verschiebt. Der Abschlu dieser Phase ist mit dem Maximum in der Geschwindigkeit erreicht.
Danach beginnt sich die Population zu bewegen, wobei sie sich aufgrund des
Selektionsterms wieder zusammenzieht. A ndert sich die Geschwindigkeit fast
nicht mehr, so hat der grote Teil der Population das Minimum der Fitness
erreicht.
Fur die Boltzmann-Strategie mussen wir entsprechend der Bedingung
(3.29), die Verteilungsfunktion um einen Faktor korrigieren. Wir erhalten
nach einer Standardrechnung fur die Geschwindigkeit den Ausdruck
v(1) =
2
X
i=1
(2Djaij ; 16D (ai)2(x0 )2i ) exp(;4Dt jaij) ;
(3.35)
welche in Abbildung 3.2 fur die Fitnessfunktion Fq = ax2 dargestellt ist.
Auch diese Kurven lassen sich theoretisch sehr gut verstehen. Durch den
Driftterm in der Gleichung (2.6) besitzt diese Strategie ein vollig anderes
Verhalten als die Darwin-Strategie. In Abhangigkeit von der reziproken Temperatur wird die Starke des Driftterms gesteuert. Je groer dieser Term ist,
desto schneller erreicht die Strategie das Minimum, da sich dann die Stra-
10.0
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 51
30.0
25.0
40.0
Geschwindigkeit
Geschwindigkeit
50.0
a=1
a=2
a=5
30.0
20.0
10.0
0.0
0.0
β=1
β=2
β=5
20.0
15.0
10.0
5.0
1.0
2.0
3.0
4.0
5.0
Zeit t
6.0
7.0
8.0
9.0
10.0
0.0
0.0
1.0
2.0
3.0
4.0
5.0
Zeit t
6.0
7.0
8.0
9.0
10.0
Abbildung 3.2: Darstellung der Geschwindigkeit fur die Boltzmann-Strategie,
das rechte Bild zeigt den Einu der Krummung a in Fq , wahrend das linke
Bild die Variation der reziproken Temperatur darstellt.
tegie nur in Richtung des Minimums bewegt. Die Kurven in Abbildung 3.2
geben genau dieses Verhalten wieder.
Maximum
Vom mathematischen Standpunkt aus gesehen mu die Formel (3.35) fur die
Boltzmann-Strategie nicht viel verandert werden. Es andert sich lediglich der
Vorfaktor bei der Bedingung (3.29). Nach einer kurzen Rechnung erhalten
wir die Formel
v(1) =
2
X
i=1
(16D (ai)2(x0 )2i + 2Djaij) exp(4Dt jaij) ;
(3.36)
welche in Abbildung 3.3 fur die Fitnessfunktion Fq = ;ax2 dargestellt ist.
Da die Boltzmann-Strategie die Fitness minimiert und die beiden Minima der
Fitnessfunktion Fq = ;ax2 bei +1 bzw. ;1 liegen, mu die Verteilung der
Sucher immer ausgebreiteter werden. Dabei steigt die Varianz der Verteilung,
was in den obigen Abbildungen dargestellt ist.
Im Gegensatz zur Boltzmann-Strategie mussen wir bei der Darwin-Strategie
ein neues Problem
!
@ ; D4 ; ax2 ; a G (x; x0 ; t) = (x ; x0 )
(3.37)
0 2
@t
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
1000.0
1000.0
900.0
900.0
800.0
800.0
Geschwindigkeit
Geschwindigkeit
52
700.0
600.0
a=1
a=2
a=5
500.0
400.0
300.0
200.0
100.0
0.0
0.0
700.0
β=1
β=2
β=5
600.0
500.0
400.0
300.0
200.0
100.0
1.0
2.0
3.0
4.0
5.0
Zeit t
6.0
7.0
8.0
9.0
0.0
0.0
10.0
1.0
2.0
3.0
4.0
5.0
Zeit t
6.0
7.0
8.0
9.0
10.0
Abbildung 3.3: Darstellung der Geschwindigkeit fur die Boltzmann-Strategie,
das rechte Bild zeigt den Einu der Krummung a in Fq , wahrend das linke
Bild die Variation der reziproken Temperatur darstellt.
losen, welches aus dem Problem (3.31) durch eine Variablentransformation
der Form a ! ;a entsteht. Fur die Greensche Funktion G2 (x; x0 ; t) erhalten wir auf formale Art aus der Variablentransformation anstatt (3.32) den
Ausdruck
q
pa(cos(2tpDa)(x2 + (x0 )2) ; 2xx0 ) !
a t
a=De
p
p
G2(x; x0 ; t) = q
(3.38)
:
p exp( ;
2 D sin(2t Da)
2 sin(2t Da)
4
0
Daraus kann die Geschwindigkeit leicht berechnet werden, und wir erhalten
p
p
p
p
2
p
v(1) = dtd hax2 i = Da aD cos(t 2Da) 3; p2a (x0) sin(t 2Da) (3.39)
cos (t 2Da)
in Bezug auf die Anfangsverteilung P (x; 0) = (x ; x0). Wir wollen an dieser Stelle nur bemerken, da obige Greensche Funktion fast mit der Greenschen Funktion des harmonischen Oszillators in der Quantenmechanik ubereinstimmt [2]. Sowohl die Greensche Funktion (3.38) als auchp die Geschwindigkeit
p (3.39) weisen eine Singularitat an den Zeitpunkten 2t Da = n bzw.
t 2Da = (n + 1=2) auf. Der Grund fur das Auftreten der Singularitaten
liegt in der Nichtkompaktheit des Operators (3.37). Da die Darwin-Strategie
die Tendenz besitzt, nach +1 bzw. ;1 zu gelangen, wachst die Greensche
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 53
Funktion nach einer endlichen Zeit uber alle Grenzen. Wir konnen dies dadurch verhindern, da wir den Phanotypraum begrenzen (und damit auch
den Trager der Greenschen Funktion). Deshalb gelangt die Darwin-Strategie
in endlicher Zeit an die Grenze des Raumes, was gleichzeitig auch das Ziel
ist. In Abbildung 3.4 ist die entsprechende Geschwindigkeitskurve dargestellt. Wie man aus dieser Abbildung leicht ersehen kann, gleichen sich die
50.0
500.0
30.0
Geschwindigkeit
Geschwindigkeit
450.0
40.0
a=1
a=2
a=5
20.0
10.0
400.0
350.0
x0=1
x0=2
x0=5
300.0
250.0
200.0
150.0
100.0
50.0
0.0
0.0
0.3
0.5
0.8
Zeit t
1.0
1.3
1.5
0.0
0.0
0.5
1.0
1.5
Zeit t
2.0
2.5
Abbildung 3.4: Darstellung der Geschwindigkeit des Maximums fur die
Darwin-Strategie, das rechte Bild zeigt den Einu der Krummung a in Fq ,
wahrend das linke Bild die Variation des Anfangspunkts x0 darstellt.
Darwin- und Boltzmann-Strategie bzgl. ihres Verhaltens auf einem Minimum
oder Maximum. Der Unterschied ist allein im funktionalen Ausdruck fur die
Geschwindigkeit zu ersehen, welcher die unterschiedliche Dynamik reprasentiert. Aus diesem Grunde erwarten wir naturlich, da sich beide Strategien
auf einem Sattel auch gleichartig bewegen.
Sattel
Um das Verhalten auf einem Sattel zu studieren, mussen wir naturlich nur
die Ausdrucke fur die Geschwindigkeit auf dem Maximum bzw. Minimum
addieren. Da die Geschwindigkeit auf dem Maximum dominant ist, sollte dies
auch die Geschwindigkeit auf dem Sattel bestimmen. Wie in Abbildung 3.5
dargestellt, beobachtet man genau dieses Verhalten. Die Erklarung fur ein
solches Verhalten lat sich wie folgt angeben. Zuerst bewegt sich die Strategie
3.0
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
1000.0
50.0
900.0
45.0
800.0
40.0
Geschwindigkeit
Geschwindigkeit
54
700.0
600.0
a=1
a=2
a=5
500.0
400.0
300.0
200.0
100.0
0.0
0.0
35.0
30.0
a=1
a=2
a=5
25.0
20.0
15.0
10.0
5.0
0.5
1.0
1.5
Zeit t
2.0
2.5
3.0
0.0
0.0
0.3
0.5
0.8
Zeit t
1.0
1.3
Abbildung 3.5: Darstellung der Geschwindigkeit auf einem Sattel fur die
Boltzmann Strategie (linkes Bild) und fur die Darwin-Strategie (rechtes Bild)
auf das Minimum zu, um dann durch eine Mutation die Richtung zu andern
und sich auf einem Ast des Maximums abwarts zu bewegen. Wie wir anhand
dieser Erklarung sehen, ist die einzige Minderung der Geschwindigkeit durch
die Richtungsanderung gegeben.
Zusammen mit dem oben beschriebenen Resultat in [61] erhalten wir das
folgende Ergebnis dieses Abschnitts:
1. In Landschaften mit vielen Maxima und Minima gibt es viele Sattel.
2. Ein Sattel beeinut die Geschwindigkeit der Strategie kaum.
3. Die Boltzmann- und Darwin-Strategie verhalten sich fur die Fitnessfunktion (3.27) qualitativ gleich.
Alle gewonnen Ergebnisse lassen sich auch mit einer anderen Methode erhalten, indem man die Eigenwertgleichungen (2.9) und (2.28) lost, wobei sich
mittels (2.27) die Losung ergibt. In dem Artikel [41] wurde dieser Weg eingeschlagen. Um diesen Abschnitt zu vervollstandigen, wird eine Sammlung
der entsprechenden Formeln im Anhang B aufgefuhrt.
3.2.3 Unterschiede
Die bimodale Fitnessfunktion, d.h. eine Funktion mit 2 Minima bzw. Maxima, stellt das nachstschwierigere Problem dar und zeigt gleichzeitig auch
1.5
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 55
die Unterschiede zwischen den Strategien. Bei einer solchen Funktion mu
die Strategie eine Barriere uberspringen, um das globale Optimum zu nden. Dabei ist zu vermuten, da die Unterschiede und Gemeinsamkeiten der
Boltzmann- und Darwin-Strategie durch die Transformation (2.10) gegeben
sind. Um dies zu zeigen, untersuchen wir 2 bimodale Fitnessfunktionen. Als
Ma fur die Geschwindigkeit, mit der eine Barriere uberwunden wird, verwenden wir die Wahrscheinlichkeit (3.4). Im ersten Beispiel konzentrieren
wir uns auf ein 2-Kasten-Potential und verwenden eine Darwin-Strategie.
Dieses Beispiel dient zur Illustration des grundsatzlichen Vorgangs der U berwindung einer Barriere. Das zweite Beispiel einer stuckweise, quadratischen
Funktion ist fur einen direkten Vergleich zwischen Boltzmann- und DarwinStrategie gedacht. In der Literatur gibt es viele Beispiele [65, 66, 67, 68, 69]
zur naherungsweisen Berechnung des Doppeltopfes. Hier wollen wir jedoch
starker auf eine explizite Berechnung wert legen.
Doppeltopf-Potential
Im folgenden wollen wir nur 1-dimensionale Probleme betrachten, da deren
Komplexitat zur Analyse ausreichend ist. Dazu beginnen wir mit dem einfachsten Beispiel einer solchen Funktion, die durch
8
>
1
x < ;b
>
>
< ;F0 ;b < x < ;a
F (x) = > 0 ;a < x < a
>
;F a < x < b
>
: 11
b<x
(3.40)
mit (x) als Heaviside-Funktion gegeben ist. Der Abstand zwischen beiden
Kasten ist gleich 2a, wahrend die Breite der Kasten durch b ; a sowie die
Tiefe durch die Parameter F0 bzw. F1 bestimmt sind. In Abbildung 3.6
ist ein Beispiel fur ein solches Potential dargestellt, wobei wir im folgenden
F0 < F1 annehmen wollen. Um dieses Problem von allen Seiten zu beleuchten, wollen wir sowohl die Greensche Funktion als auch die Eigenfunktionen
explizit angeben. Im folgenden wollen wir am Beispiel der Darwin-Strategie
die U berwindung der Barriere genauer verstehen, wobei wir nicht nur die
Greenschen Funktionen sondern auch das Spektrum bestimmen.
Zunachst konzentrieren wir uns aber auf die Berechnung der Greenschen
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
56
2a
F0
F1
|b-a|
Abbildung 3.6: 2-Kasten-Potential
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 57
Funktion und der Wahrscheinlichkeit (3.4). Wir betrachten also das Problem
@ P (x; t) = D4 P (x; t) ; F (x)P (x; t)
(3.41)
x
@t
mit dem stuckweise gegebenen Potential (3.40). Es ist klar, da die Greensche
Funktion ebenfalls eine stuckweise Funktion ist. Eine einfache Rechnung
ergibt den Ausdruck
8
>
>
0 (x;x0 )
x < ;b
>
1
=
2
; 4Dt ; F 0t ;b < x < ;a
>
< (4Dt) exp
1
=
2
(x;x0 )
0
Gd(x; x ; t) =
(4Dt) exp
;
;a < x < a : (3.42)
4Dt
>
0
1
=
2
(
x
;
x
)
>
a<x<b
(4Dt) exp ; 4Dt ; F1t
>
>
:
0
b<x
Fur jede Anfangsverteilung P (x; 0) erhalten wir durch Integration die zeitliche Entwicklung dieser Verteilungsfunktion. Um das Verhalten der Strategie
explizit zu zeigen, betrachten wir die Anfangsverteilung P (x; 0) = (x ; x0 )
mit x0 2 [;b; ;a], d.h., wir starten im lokalen Minimum (der eine Topf) und
wollen das globale Minimum (der andere Topf) erreichen. Fur die zeitliche
Entwicklung P (x; t) der Anfangsverteilung erhalten wir nach der Integration
fur kleine Zeiten t die einfache Beziehung
!
2
(
x
;
x
)
0
1
=
2
P (x; t) = (4Dt) exp ; 4Dt ; F0 t :
(3.43)
Analog ergibt sich aus der Integration die einfache Beziehung P (x; t) =
NGd (x; x0 ; t) zwischen der Losung P (x; t) und der Greenschen Funktion
(3.42) mit dem noch zu bestimmenden Normierungsfaktor. Aus der Bedingung
2
2
2
1=
Z1
;1
P (x; t)dx = N
Z1
;1
Gd (x; x0 ; t)dx
errechnen wir den Normierungsfaktor
!
1 = exp(;F t) erf bp+ x0 ; erf
0
N
4Dt !
!
+ erf ap; x0 + erf ap+ x0 +
4Dt
4!Dt
+ exp(;F1 t) erf bp; x0 ; erf
4Dt
ap+ x0
4Dt
ap; x0
4Dt
!!
!!
+
:
(3.44)
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
58
Dann ist die Wahrscheinlichkeit (3.4), einen Sucher im Intervall [a; 1] zu
nden durch
(a; t) =
Za
;1
P (x; t)dx
!
!!
N
b
;
x
a
;
x
0
0
= 1 ; p exp(;F1 t) erf p
; erf p4Dt (3.45)
4Dt
4Dt
gegeben. Der Flu beschreibt die Veranderung in der Anzahl der Sucher,
die die Barriere uberwinden. Es ist nicht schwierig eine explizite Formel aus
der oben gegebenen Formel zu gewinnen, aber wir wollen stattdessen die
Abhangigkeit der Wahrscheinlichkeit von den Parametern des Doppeltopfes
diskutieren. Dabei konnen wir feststellen, da (a; t) stark von der Dierenz F0 ; F1 abhangt. Eine Vergroerung dieser Dierenz bewirkt zuerst
eine Verlangsamung der Strategie, bis der Punkt x = a erreicht ist. Danach
steigt die Geschwindigkeit wieder an. Der Einu der Parameter a (halber
Abstand zwischen den Topfen), D (Mutationsstarke bzw. Diusionskonstante) und x0 (Startpunkt aller Sucher) ist sicherlich anschaulich klar und soll
hier nur durch die Folge von Abbildungen 3.7 dargestellt werden. Eine Besonderheit gibt es aber bei allen Abbildungen. Die Wahrscheinlichkeit steigt
erst an, um dann wieder abzufallen. Der Grund fur dieses Verhalten liegt in
der Behandlung des Randes. Jeder Sucher, der die Barriere uberquert und
in den anderen Topf gelangt, wird an der Wand reektiert und kehrt wieder zu seinem Ausgangspunkt zuruck. Damit gibt das Maximum von (a; t)
den Zeitpunkt an, wo der Sucher mit der entsprechenden Wahrscheinlichkeit durch die Barriere gelangt ist. Andererseits konnen wir die Groe auch
so deuten, da sie den prozentualen Anteil der Sucher angibt, die auf der
anderen Seite der Barriere sind. Den starksten Einu auf (a; t) ubt die
Variation des Abstands 2a zwischen den Topfen, gefolgt vom Hohenunterschied F0 ; F1 der Topfe aus. Dagegen spielt die Breite des Topfs kaum eine
Rolle. Bei der Darstellung der Wahrscheinlichkeit wurde ein fester Parametersatz (F0 = 1; F1 = 2; a = 1; b = 2; D = 1; x0 = ;1:5) benutzt, bei dem
jeweils eine Groe variiert wurde.
Zur Illustration des oben Gesagten wollen wir zum Abschlu dieses Unterabschnittes das Eigenwertproblem fur das Doppeltopf-Potential F (x) diskutieren. Die Berechnung des Eigenwertproblems
2
;y(x) = D dxd 2 y(x) ; F (x)y(x)
(3.46)
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 59
Wahrscheinlichkeit
Wahrscheinlichkeit
4.00e-02
5.000e-02
3.00e-02
D=0.01
D=0.1
D=1
D=5
2.00e-02
F1 =1
F1=10
F1=2
F1=50
4.000e-02
3.000e-02
2.000e-02
1.00e-02
1.000e-02
0.00e+00
0.0
1.0
2.0
3.0
4.0
0.000e+00
0.0
2.0
4.0
Zeit t
Wahrscheinlichkeit
8.0
10.0
Wahrscheinlichkeit
4.00e-02
8.000e-03
3.00e-02
6.000e-03
a =0.5
a=1
a=1.5
a=2
2.00e-02
b=0.5
b=1
b=2
4.000e-03
1.00e-02
0.00e+00
0.0
6.0
Zeit t
2.000e-03
1.0
2.0
Zeit t
3.0
4.0
0.000e+00
0.0
1.0
2.0
3.0
Zeit t
Abbildung 3.7: Parameterabhangigkeit von (a; t)
4.0
5.0
60
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
stellt ein Standardbeispiel der Quantenmechanik dar, und fur die Einzelheiten verweisen wir auf [70]. Fur die Eigenwerte in jedem Kasten erhalten wir
naherungsweise
m = (m2 2D)=b ; F0
(3.47)
n = (n22 D)=b ; F1 m; n 2 ZZ ;
(3.48)
wobei durch die Losung der Gleichung
0 cot(0(a ; b)) cot(ka) + k = 0 cot(0(a ; b)) + k cot(ka) (3.49)
1 cot(1 (a ; b)) cot(ka) ; k k cot(ka) ; 1 cot(1(a ; b))
q
p
p
mit Di = ; Fi fur i = 0; 1 und k = =D eine Entartung des Spektrums erzeugt wird, die sich physikalisch als Kopplung beider Topfe interpretieren lat. Durch die Angabe von 4 Zahlen (F0 ; F1; a; b) wird eine Losung
von (3.49) parametrisiert. Desweiteren erhalten wir aus der negativen Denitheit des Operators in (3.46) die Positivitat des Eigenwertes 0. Neben dieser Kopplung zwischen den beiden Topfen gibt es fur die Eigenwerte
> F1 wieder ein einheitliches Spektrum mit
n = (n22 D)=b :
(3.50)
Die Rechnungen in diesem Unterabschnitt bezogen sich auf das Verhalten
der Darwin-Strategie in einer kastenformigen Fitnesslandschaft. Interessanter ware es nun, wenn man fur dieses Problem einen Vergleich zwischen der
Darwin- und Boltzmann-Strategie durchfuhren konnte. Die fehlende Dierenzierbarkeit der Fitnessfunktion (3.40) erschwert dieses Vorhaben gewaltig.
Deshalb wollen wir auf ein einfacheres Problem ausweichen, da aber im wesentlichen dasselbe Verhalten implizieren sollte.
Das stuckweise, quadratische Potential
Anknupfend an den Abschnitt (3.2.2) wollen wir nun den Fall einer bimodalen
Fitnessfunktion betrachten, die aus quadratischen Funktionen zusammengesetzt ist. Ziel soll es dabei sein, die Boltzmann- und die Darwin-Strategie
miteinander zu vergleichen. Dazu starten wir mit der stuckweise gegebenen
Funktion
( 2
a2 x + s x 0 ;
F (x) = ab1 xx2 +
(3.51)
1 + b2 x + s x 0
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 61
die stetig bei x = 0 ist. Aus der Formel (3.32) mit a = a1 und a0 =
(a2 )2=(4a1) ; s erhalten wir die Greensche Funktion G1(x ; a2 =(2a1); x0; t)
als Losung des Problems fur x 0 und beim Austausch ai ! bi auch die
entsprechende Greensche Funktion fur x 0. Die Berechnung der Wahrscheinlichkeit (0; t) kann nun auf genau dieselbe Weise wie im vorherigen
Unterabschnitt durchgefuhrt werden. Auf die Einzelheiten der Berechnung
sowie auf die expliziten Ausdrucke soll an dieser Stelle nicht eingegangen
werden. Eine Zusammenstellung der entsprechenden Formeln ist im Anhang C zu nden. Stattdessen konzentrieren wir uns auf die Diskussion der
Parameterabhangigkeit von (0; t). In den Abbildungen 3.8 sind die wichtigsten Falle aufgefuhrt. Im Gegensatz zum vorherigen Beispiel werden diesmal
Wahrscheinlichkeit
Wahrscheinlichkeit
a2=1
a2=2
a2=3
a2=4
8.0e-01
6.0e-01
8.0e-01
4.0e-01
4.0e-01
2.0e-01
2.0e-01
0.0e+00
0.0
2.0
4.0
6.0
b1=1
b1=2
b1=3
b1=4
6.0e-01
8.0
10.0
0.0e+00
0.0
2.0
Zeit t
4.0
6.0
8.0
10.0
Zeit t
Abbildung 3.8: Parameterabhangigkeit von (0; t) fur die Darwin-Strategie
die Sucher nicht reektiert, sondern gelangen in das andere Minimum, wo
sie auch bleiben. Bevor wir die Ergebnisse der Berechnungen diskutieren,
mussen wir noch den Hohenunterschied F0 ; F1 zwischen den Minima sowie
deren Abstand l angeben. Wir erhalten nach einer kurzen Rechnung
2
2
F0 ; F1 = 4bb2 ; 4aa2
1
1
a
b
l = 2b2 ; 2a2 :
1
1
Bei einer Variation eines Parameters andern sich damit sowohl der Abstand l als auch der Hohenunterschied F0 ; F1 . Da die Abhangigkeit des
Hohenunterschieds von den Parametern a2 ; b2 quadratisch ist, konnen wir
62
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
bei einer kleinen Variation dieser Parameter die A nderung von F0 ; F1 vernachlassigen. Ein Blick auf die Abbildungen 3.8 zeigt, da das Verhalten
der Darwin-Strategie empndlich von der Krummung des lokalen Minimums
(b1 -Abhangigkeit) beeinut wird. Die A nderung der anderen Parameter
beeinut das Verhalten der Strategie auf genau dieselbe Weise, wie dies
im Falle des 2-Topf-Potentials schon dargelegt wurde. Eine Vergroerung
des Abstands bzw. des Hohenunterschieds fuhrt zu einer Verzogerung beim
Hinuberwechseln zum anderen Topf. In einigen Fallen ist sogar zu erkennen,
da die Strategie gar nicht in den anderen Topf gelangt. Die Parameter wurden wieder einzeln um die Standardeinstellung a1 = 1; a2 = 1; b1 = 1; b2 =
;3; a1 = 1; s = 4; x0 = ;0:5; D = 1 variiert.
Im folgenden wollen wir dieselbe Rechnung fur die Boltzmann-Strategie
durchfuhren. Dazu benutzen wir aus Kapitel 2 die Transformation (2.10) zusammen mit dem Ansatz (2.8). Fur die transformierte Fitness V (x) erhalten
wir
(
1 x + Da2 =2)2 ; Da1 x 0 :
V (x) = ((Da
(3.52)
Db1x + Db2=2)2 ; Db1 x 0
Um die Stetigkeit dieser Funktion im Punkt x = 0 zu sichern, mussen wir
noch die Bedingung
(a2 ; b2 ) = 4(a1 ; b1 )
(3.53)
erfullen. Bei freier Wahl der Koezienten ai ; bi konnen wir so eine reziproke Temperatur ausrechnen, welche die Stetigkeit der transformierte Fitness
V (x) in x = 0 impliziert. Bis auf diesen singularen Fall mussen wir die
Bedingung als Einschrankung an die Koezienten verstehen. Ein Koezientenvergleich zwischen (3.51) und (3.52) zeigt den Unterschied zwischen
beiden Strategien. Bei der Boltzmann-Strategie wird die Krummung der
Topfe mit sinkender Temperatur groer, d.h., eine Abkuhlung fuhrt zum
Hangenbleiben der Strategie im lokalen Optimum. Trotzdem besitzt die
Boltzmann-Strategie die Eigenschaft, da nach unendlich langer Zeit die stationare Verteilung (2.16) angenommen wird. Deshalb wird bei der Wahrscheinlichkeit in den Abbildungen 3.9 nie der Wert 1 erreicht. Die Variation
der Parameter erfolgt wiederum ausgehend von einer Standardeinstellung
a1 = 1; a2 = 2; b1 = 1; b2 = ;3; s = 4; x0 = ;0:5; D = 1; = 0:1 durch
Veranderung nur eines Wertes genau auf dieselbe Weise wie fur die DarwinStrategie. Den starksten Einu auf die Geschwindigkeit der Strategie ubt
3.2. VERGLEICH DER BOLTZMANN- UND DARWIN-STRATEGIE 63
Wahrscheinlichkeit
Wahrscheinlichkeit
5.00e-01
4.00e-01
4.00e-01
3.00e-01
3.00e-01
a2=1
a2=2
a2=3
a2=4
2.00e-01
1.00e-01
0.00e+00
0.0
10.0
20.0
30.0
b1=1
b1=2
b1=3
b1=4
2.00e-01
1.00e-01
40.0
0.00e+00
0.0
50.0
10.0
20.0
Zeit t
30.0
40.0
50.0
Zeit t
Wahrscheinlichkeit
4.00e-01
3.00e-01
2.00e-01
β=0.1
β=1
β=10
1.00e-01
0.00e+00
0.0
10.0
20.0
30.0
40.0
50.0
Zeit t
Abbildung 3.9: Parameterabhangigkeit von (0; t) fur die BoltzmannStrategie
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
64
die Variation von aus. Weiterhin sei noch bemerkt, da die Zeitskala fur
die Veranderung der Wahrscheinlichkeit im Falle der Boltzmann-Strategie
um den Faktor 5 gegenuber der Darwin-Strategie gestreckt ist. Als weitere
Besonderheit konnen wir aus den Abbildungen die Tatsache ableiten, da
die Erniedrigung der Krummung der Topfe keinen groen Einu auf das
Verhalten der Strategie ausubt. Genau dies steht aber im Gegensatz zur
Darwin-Strategie. Um dieses Resultat noch einmal explizit zu unterstreichen, betrachten wir die Variation der Krummung des tieferen Topfes. Die
Abbildung 3.10 spiegelt diese Situation wieder. Wie wir erkennen konnen,
1.0
20.0
Boltzmann b1=1
Boltzmann b1=2
Darwin b1=1
Darwin b1=2
0.8
Wahrscheinlichkeit
15.0
Fitness
0.9
b1=1
b1=2
10.0
5.0
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
−5.0
−3.0
−1.0
1.0
Phaenotyp
3.0
5.0
0.0
0.0
5.0
10.0
15.0
Zeit t
20.0
25.0
30.0
Abbildung 3.10: Vergleich zwischen Boltzmann- und Darwin-Strategie
kommt in beiden Fallen die Boltzmann-Strategie problemlos in den anderen
Topf, wahrend die Darwin-Strategie im Falle einer kleinen Krummung keinen
Erfolg hat. Beide Strategien scheinen also bezuglich der Krummung und des
Hohenunterschieds zwischen den Minima genau gegenlauges Verhalten zu
besitzen. Diese Tatsache motiviert die Mischung zwischen beiden Strategien,
die durch Computersimulationen [26, 27, 28, 29, 40] gestutzt wird.
3.3 Die Gemischte Strategie
Wie wir in den vorherigen Abschnitten dieses Kapitels an einigen Beispielen
gezeigt haben, besitzen die Boltzmann- und die Darwin-Strategie genau entgegengesetztes Verhalten. Wie Ebeling et al. [26] als erste bemerkten, ist
3.3. DIE GEMISCHTE STRATEGIE
65
es daher naturlich, beide Strategien zu mischen. Die Folgerungen aus diesem
Ansatz sollen in diesem Abschnitt studiert werden.
3.3.1 Diskussion des Verhaltens
Die Gute einer Strategie ist oft schwer zu ermitteln. Andererseits ist jede
Fitnesslandschaft uber einem kontinuierlichen Raum aus zwei grundlegenden
Stucken aufgebaut: der Fitnessfunktion mit einem kritischen Punkt (Parabel) und der Fitnessfunktion mit zwei kritischen Punkten (Doppeltopf). Alle
anderen Falle lassen sich aus diesen grundlegenden Stucken zusammenfassen.
Deshalb wurden diese Beispiele ausgewahlt. Auch in diesem Abschnitt werden wir die Beispiele verwenden, da wir dadurch einen direkten Vergleich mit
den anderen Strategien bekommen.
Gemeinsamkeiten zur Boltzmann- und Darwin-Strategie
Als erstes wollen wir den wenig spektakularen Fall eines parabolischen Potentials (3.25) behandeln. Hierbei mu sich wieder dasselbe Verhalten wie fur
die Boltzmann- und Darwin-Strategie zeigen. Dazu benutzen wir die Greensche Funktion (3.32) und setzen die entsprechenden Parameter ein. Nach
Benutzung des Ansatzes (2.36) und der Transformation der Fitnessfunktion
(2.38) erhalten wir fur die Parameter
P (~x; t) = exp(;
Zt
=0
hFq i( )d ; =2Fq )y(~x; t)
A0 = D(a1 + a2) + Fmin
A1 = D 2a21 + ja1 j A2 = D 2a22 + ja2j :
(3.54)
Die Formel fur die Geschwindigkeit der Gemischten Strategie ist etwas komplizierter als fur die reinen Strategien. Deshalb wollen wir nur die Formel fur
die Geschwindigkeit des Minimums angeben.
q
q
(1)
2
v = ; aD ( aD + )D sinh(4t aD( 2aD + )) 2a2 D + a
(3.55)
+2x20 a3 4D + 2x20 a2 2 + 4x20DA 2 + 2x20 s 2
q
+ ) 4D(x a )2 + 4x2a + ; cosh(2t aD( 2aD + )) a( aD
0
0
D
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
q
q
2
2
2
2
2
2
+ +2Da + 8x0D + a Da(aD + ) + 4x0 Da(aD + )
q
q
2
2
cosh (2t aD( aD + )) cosh2(2t aD( 2aD + ))(8a2D2 4+
q
q
+8a 2D + 2 ) ; Da(aD 2 + ) sinh(4t aD( 2aD + ))(4a 2D + 2 )
;1
q
q
2
3
2
2
4
2
2
;6 Da + 2Da aD ( aD + ) sinh(4t aD( aD + )) + D a 66
Die restlichen Formeln sind im Anhang D zusammengestellt. An dieser Stelle wollen wir uns vor allem fur die A nderung des Parameters sowie die
Krummung der Parabel (3.25) a1; a2 interessieren. Der Einfachheit halber
haben wir uns auf den 1-dimensionalen Fall beschrankt. In der Abbildung
3.11 ist die Variation dieser beiden Parameter dargestellt. Dazu gehen wir
100.0
3.0
2.5
a=1
a=2
a=5
60.0
Geschwindigkeit
Geschwindigkeit
80.0
40.0
20.0
0.0
0.0
γ=1
γ=2
γ=5
2.0
1.5
1.0
0.5
2.0
4.0
6.0
Zeit t
8.0
10.0
0.0
0.0
2.0
4.0
6.0
8.0
10.0
Zeit t
Abbildung 3.11: Geschwindigkeit der Gemischten Strategie auf einem Minimum fur
die Variation der Krummung a (links) und bei Variation des Mischungsparameters
(rechts)
von einem festen Parametersatz = 1; a = 1; D = 0:1; x0 = 2; = 1 aus
und verandern nur jeweils einen Parameter, d.h. entweder die Krummung a
oder den Mischungsparameter . Wie wir sehr gut erkennen konnen, wird
die Geschwindigkeit der Strategie mit steigendem Mischungsparameter sowie mit steigender Krummung groer. Naturlich setzt sich das Verhalten der
gesamten Strategie aus dem Verhalten der einzelnen Strategien zusammen.
Im Falle des parabolischen Potentials (3.25) ist das Verhalten der Boltzmann
und der Darwin-Strategie gleich. Daher erleben wir keine U berraschung bei
der Betrachtung der Kurven.
3.3. DIE GEMISCHTE STRATEGIE
67
Nehmen wir ein Maximum als Fitnessfunktion an, so konnen wir genauso
wie bei der Darwin-Strategie eine formale Transformation t ! it ansetzen.
Dadurch kann die Formel vom Minimum ubernommen werden. Die Formel
bendet sich wiederum im Anhang D, wahrend die entsprechenden Kurven in
Abbildung 3.12 dargestellt sind. Die Parameterabhangigkeit der Geschwin100.0
100.0
80.0
a=1
a=2
a=5
60.0
40.0
20.0
0.0
0.0
Geschwindigkeit
Geschwindigkeit
80.0
γ=1
γ=2
γ=5
60.0
40.0
20.0
0.2
0.4
Zeit t
0.0
0.0
0.2
0.4
0.6
0.8
Zeit t
Abbildung 3.12: Geschwindigkeit der Gemischten Strategie auf einem Maximum fur
die Variation der Krummung a (links) und bei Variation des Mischungsparameters
(rechts)
digkeit bleibt auch fur diesen Fall gleich. Als wichtigster Unterschied ist nur
das unbeschrankte Anwachsen der Geschwindigkeit aufzufuhren. Der Grund
ist physikalisch verstandlich und liegt, mathematisch gesehen, in der fehlenden Unitaritat der Transformation. Dadurch verliert die Formel oberhalb des
dargestellten Zeitpunktes ihre Gultigkeit. In einem fruheren Abschnitt hatten wir eine Moglichkeit der Reparatur angegeben, die zu einem aquivalenten
Ergebnis fuhrt: der unterliegende Raum mu kompakt sein. Diese Fragen
werden uns im ersten Abschnitt des nachsten Kapitels starker beschaftigen.
Zum Schlu sei noch kurz auf den Fall eines Sattels eingegangen. Die
Form der Kurven soll an dieser Stelle nicht angegeben werden, da sie sich
aus der Addition der Geschwindigkeit des Maximums und des Minimums ergeben. Wie wir leicht aus den Abbildungen 3.11 und 3.12 entnehmen konnen,
wird das Verhalten vorrangig durch das Maximum bestimmt. Auf anschauliche Art und Weise konnen wir dieses Verhalten als ein "Passieren des Sattels
ohne Zeitverlust\ deuten. Ein Vergleich mit der Boltzmann- bzw. DarwinStrategie zeigt die erwartete U bereinstimmung im Ergebnis.
68
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
Unterschiede
In diesem Unterabschnitt wollen wir auf ein entscheidendes Problem eingehen, das fast immer fur Fitnesslandschaften auftritt: Wie wird eine Barriere, die zwei lokale Minima trennt, ubersprungen? Als eine Groe, die
diesen Vorgang gut charakterisiert, hat sich die Wahrscheinlichkeit (0; t)
(3.4) erwiesen. Wie wir im Unterabschnitt 3.2.3 festgestellt haben, zeigen die Boltzmann und Darwin-Strategie ein unterschiedliches Verhalten
bei der U berwindung der Barriere. Soll sich der Gedanke der Mischung
beider Strategien als tragfahig erweisen, so mu die Gemischte Strategie
in allen Fallen uber die Barriere gelangen. Dazu untersuchen wir wiederum die Variation der Parameter ausgehend von einem festen Parametersatz
a1 = 1; a2 = 2; b1 = 1; b2 = ;3; s = 4; x0 = ;0:5; D = 1; = 0:1; = 1 durch
Variation jeweils eines Parameters. Die Folge von Bildern in Abbildung 3.13
zeigt das Ergebnis. An dieser Stelle soll auf zwei Besonderheiten eingegangen
werden, welche diese Strategie auf grundsatzliche Weise von den beiden Strategien unterscheidet. Anschaulich wurden wir erwarten, da die Erhohung
des Mischungsparameters eine Erhohung der Wahrscheinlichkeit zur Folge
hat, da die Darwin-Strategie besser uber Barrieren kommt. Das dies nicht
immer der Fall ist, zeigt die Abbildung rechts unten. Fur diesen Parametersatz besitzt die Darwin-Strategie die Tendenz hangenzubleiben. Erstaunlich
ist nun, da die weitere Erhohung des Mischungsparameters die Wahrscheinlichkeit wieder erhoht. Damit erhalten wir ein Parameterfenster fur den
Mischungsparameter in Abhangigkeit von der reziproken Temperatur . Die
Gemischte Strategie bleibt also nicht immer "hangen\. Als weiteren groen
Unterschied zur Darwin-Strategie erhalten wir die Tatsache, da immer ein
gewisser Anteil an Suchern auf die andere Seite gelangt und dort bleibt. Der
Grund ist einfach durch den Einu der Boltzmann-Strategie gegeben, die als
stationare Losung exp(;F (x)) hat. Die anderen Parameterabhangigkeiten
sind genauso wie bei der Boltzmann- bzw. Darwin-Strategie, was durch das
gleichartige Verhalten beider Strategien gegenuber solchen Parameteranderungen begrundbar ist.
3.3.2 Wahl der Parameter
Hier wollen wir uns der Frage zuwenden, wie der Mischungsparameter und
die reziproke Temperatur sowie die Diusionskonstante D zu wahlen sind.
Dabei sollen zwei Gesichtspunkte im Mittelpunkt stehen: Zuerst konnen
69
0.9
0.9
0.8
0.8
Wahrscheinlichkeit
Wahrscheinlichkeit
3.3. DIE GEMISCHTE STRATEGIE
0.7
0.6
0.5
0.4
a2=1
a2=2
a2=3
a2=4
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
b1=1
b1=2
b1=3
b1=4
0.7
0.6
0.5
0.4
0.3
0.2
0.1
8.0
9.0 10.0
0.0
0.0
1.0
2.0
3.0
Zeit t
5.0
6.0
7.0
8.0
9.0 10.0
Zeit t
0.9
Wahrscheinlichkeit
4.0
0.8
0.7
0.6
γ=0.01
γ=0.1
γ=1
γ=10
0.5
0.4
0.3
0.2
0.1
0.0
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
Zeit t
Abbildung 3.13: Parameterabhangigkeit von (0; t) fur die Gemischte Strategie
70
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
die Parameter fest eingestellt und desweiteren wahrend des Simulationslaufs
angepat werden.
Im folgenden wollen wir uns der ersten Herangehensweise zuwenden. Naturlich
konnen wir bei einer festen Parametereinstellung nur Heuristiken fur die Wahl
der Parameter angeben. Dazu fassen wir noch einmal die bisherigen Erkenntnisse zusammen.
Fur die Darwin-Strategie ist die Hohe der Barriere nicht so entscheidend
wie der Abstand der Minima und deren Hohenunterschied. In Abbildung
3.10 haben wir die Situation fur den Extremfall eines kleinen Hohenunterschieds aufgezeigt. Nur die Boltzmann Strategie erreicht nach langerer Zeit
das richtige Minimum, wahrend die Darwin-Strategie wieder umkehrt. Daher
erscheint es einleuchtend, da eine Gemischte Strategie diese Schwierigkeiten
uberwinden sollte. Die Abbildung 3.14 zeigt dies eindrucksvoll am selben
Beispiel wie Abbildung 3.10. Wie wir schon fruher vermutet haben, gibt es
1.0
0.9
0.8
0.7
0.6
b1=1,γ=0.1
b1=2,γ=0.1
b1=1,γ=1
b1=2,γ=1
0.5
0.4
0.3
0.7
0.6
0.5
0.4
0.3
0.2
0.2
0.1
0.1
0.0
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
Zeit t
Boltzmann b1=1
Boltzmann b1=2
Darwin b1=1
Darwin b1=2
0.8
Wahrscheinlichkeit
Wahrscheinlichkeit
0.9
0.0
0.0
5.0
10.0
15.0
Zeit t
20.0
25.0
30.0
Abbildung 3.14: Vergleich zwischen Boltzmann-, Darwin- (rechts) und der
Gemischten Strategie (links)
Parametersatze, fur welche die Gemischte Strategie schneller als die einzelnen
Strategien ist. Um diese Idee zu untermauern, betrachten wir die Abhangigkeit der Wahrscheinlichkeit von und , wie es in Abbildung 3.15 dargestellt
ist. Im Fall einer groen Temperatur (kleinem ) nimmt die Fahigkeit, uber
die Barriere zu springen, erst mit steigendem ab, um dann ganz abrupt
wieder anzusteigen. Beim anderen Fall einer kleinen Temperatur hangt das
Verhalten fur kleine Mischungsverhaltnisse nicht von diesem Verhaltnis ab.
3.3. DIE GEMISCHTE STRATEGIE
γ=8
γ=8.5
γ=9
γ=9.5
0.8
0.7
0.6
0.9
Wahrscheinlichkeit
Wahrscheinlichkeit
0.9
0.5
0.4
0.3
0.2
0.1
0.0
71
γ=0.001
γ=0.01
γ=0.1
γ=1
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
10.0
20.0
30.0
Zeit t
40.0
50.0
60.0
0.0
0.0
10.0
20.0
30.0
Zeit t
40.0
50.0
60.0
Abbildung 3.15: Darstellung der Wahrscheinlichkeit (0; t) in Abhangigkeit
vom Mischungsparameter fur = 0:1 (links) und fur = 1 (rechts)
In jedem Fall wird die Barriere mit einer gewissen Wahrscheinlichkeit uberwunden. Anhand dieser Tatsache konnen wir folgende Regeln formulieren:
Auf stark zerklufteten Fitnesslandschaften mu bei groer Temperatur
der Mischungsparameter vergroert werden. Im anderen Fall hangt
die Strategie kaum von ab. Die Groe der Population, die sich auf
der anderen Seite bendet, hangt dann von ab. Die Fitnessfunktion
zu dieser Landschaft besitzt groe erste und zweite Ableitungen. Meist
sind die zugehorigen Probleme frustriert, d.h., es werden gleichzeitig
widerstrebende Groen optimiert.
Auf Fitnesslandschaften, die kaum Niveauunterschiede der lokalen Mi-
nima aufweisen, mu der Mischungsparameter bei kleiner Temperatur
ebenfalls verkleinert werden. Andernfalls mu unbedingt vergroert
werden. Die zugehorige Fitnessfunktion besitzt kleine erste und zweite Ableitungen, d.h., sie variiert nur schwach mit der A nderung des
Phanotyps. Meist sind die entsprechenden Probleme in Teilprobleme
zerlegbar, die unabhangig voneinander sind.
Beachten wir diese Regeln, dann sollte die Einstellung der Parameter moglich
sein. Leider lassen sich solche Regeln nicht genauer formulieren, weil dazu die
Aufdeckung der Struktur aller Probleme notig ist. Leichter ist es dagegen, die
Steuerung der Strategieparameter durch die Dynamik selbst vorzunehmen.
Dazu benutzen wir Formel (3.18) und setzen einfach die Geschwindigkeit
72
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
v(1) = v als konstant an. Dadurch erhalten wir eine Relation
v = D hrF rF i + (hF 2i ; hF i2) ; Dh4F i = const
(3.56)
zwischen den Groen , und D. Wahrend eines Simulationslaufs konnen
wir die entsprechenden Mittelwerte auf einfache Weise bestimmen. Da wir
andererseits voraussetzen, da wegen der kleinen Mutationsschritte die Strategie lokal arbeitet, so konnen wir in guter Naherung den Fall einer quadratisch abfallenden bzw. zunehmenden Fitnessfunktion ansetzen. Daraus lat
sich eine Abschatzung fur einen Parameter durch die Vorgabe der beiden
anderen Parameter angeben. Dazu xieren wir die Geschwindigkeit v und
stellen die Formel (3.56) nach der gesuchten Groe um. Als Beispiel wahlen
wir den Mischungsparameter aus und erhalten
F rF i + Dh4F i :
= (t; D; ; v) = v ; D hr
(3.57)
(hF 2i ; hF i2)
Dadurch bekommen wir eine Funktion (t; D; ; v) in welche die Groe der
Geschwindigkeit v eingeht. Ist diese Geschwindigkeit v positiv, so minimiert die Strategie die Fitnessfunktion. Diese Bewegung der Strategie ist
der Fortschritt, da Gebiete mit einer guten Fitness erreicht werden. Ist die
Geschwindigkeit negativ, so hat sich die Fitness der meisten Sucher in der
Population verschlechtert. Es ist klar, da als kritischer Wert der Fall v = 0
mit keiner Verbesserung bzw. Verschlechterung auftritt. Der Wert des Mischungsparameters mu groer als der kritische Wert krit = (t; D; ; 0)
sein, um eine Verbesserung hervorzurufen. Wie wir aus der Formel (3.57)
leicht ersehen konnen, spielt fur das Verhalten von die Veranderung der
Fitnessvarianz F = hF 2i ; hF i2 die wichtigste Rolle. Wahlen wir als Beispiel die quadratische Fitness, die als lokaler Fall schon erwahnt wurde, so
stellen wir fest, da die Fitnessvarianz als Nenner von (t; D; ; v) mit hx4 i,
d.h. starker als der Zahler, variiert. Damit erhalten wir die einfachen Regeln:
Die Wahl des Mischungsparameters ist wahrend des Simulationslaufs
umgekehrt proportional zur Fitnessvarianz F zu wahlen.
Eine Erhohung bzw. Erniedrigung des Parameters zieht eine Erniedrigung bzw. Erhohung des Mischungsparameters nach sich.
Diese Regeln geben naturlich nur einen groben Rahmen fur die Wahl des
Parameters an. Viel wichtiger ist die Formel (3.57) sowie der kritische Wert
krit, die leicht wahrend eines Simulationslaufs ermittelt werden konnen.
3.4. SIMULATION DER STRATEGIEN
73
Bevor wir die Simulation der Strategien darlegen wollen, mussen wir uns
vorher noch fragen, in welchem Sinne die Gemischte Strategie besser als die
Darwin- und Boltzmann-Strategie ist. Diese Frage ist eng mit der Frage
verwandt, wann die Strategie anhalt, d.h., wann wird entschieden, da der
angelaufene Punkt das globale Minimum ist. In den vorangegangenen Abschnitten hatten wir als Haltekriterium fur die Strategie das Verhalten des
groten Teils der Population gewahlt. Bendet sich mehr als die Halfte der
Sucher in der Umgebung eines Punktes und verandert sich die Verteilung
dieser Sucher kaum noch, dann bezeichnen wir diesen Punkt als globales
Minimum. Ein Vergleich von Strategien wurde genau in diesem Sinne durchgefuhrt, und auch nur in diesem Sinne ist die Gemischte Strategie besser als
die Darwin- und Boltzmann-Strategie. Fur einen groen Parameterbereich
ndet diese Strategie fast immer das globale Minimum. Die Bearbeitung der
verschiedensten Optimierungsaufgaben [] beweist dieses theoretische Resultat eindrucksvoll.
Am Schlu sei noch kurz auf die Bedeutung de Wahrscheinlichkeit (3.4)
eingegangen. Wie Rudolph in seiner Arbeit [36] auf Seite 206 bemerkte, sei
es mittels dieser Beschreibung nicht moglich, eine Aussage uber die Konvergenz von Evolutionaren Algorithmen mit endlicher Population zu gewinnen.
Dies ist nach dem bisher Gesagtem nicht richtig. Die Groe (3.4) beschreibt
namlich nicht nur die Dichte der Sucher auf der anderen Seite der Barriere
sondern auch die Wahrscheinlichkeit einen Sucher dort zu nden. Multiplizieren wir die Wahrscheinlichkeit mit der Groe der Population, so erhalten
wir die Dichte der Sucher auf der anderen Seite der Population. Legen wir
weiterhin eine Schwelle bzgl. der Anzahl von Suchern, die sich auf der anderen Seite der Barriere benden fest, so konnen wir die Zeit zur Erreichung
dieser Schwelle bestimmen. Genau diese Groe wurde in [36] berechnet.
3.4 Simulation der Strategien
In diesem Abschnitt wollen wir die stochastische Realisierung der Boltzmannund Darwin-Strategie diskutieren. Dabei halten wir uns eng an den Artikel
[58] und erklaren nur kurz die entsprechenden Algorithmen zur Simulation
beider Strategien. Alle Simulationen wurden von Rose durchgefuhrt und
ergaben eine sehr gute U bereinstimmung mit der Theorie.
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
74
3.4.1 Die Boltzmann-Strategie
Zur Simulation der Boltzmann-Strategie (2.6) gibt es zwei Moglichkeiten.
Als erstes betrachten wir die U bergangswahrscheinlichkeit
(
1
pxy = exp ; F (y);F (x) T
wenn F (y) > F (x)
sonst
;
(3.58)
wobei T die Temperatur kennzeichnet. Im Kapitel 2 wurde die entsprechende
Herleitung der Gleichung (2.6) aus dieser Rate vorgefuhrt. Dabei trat das
Problem auf, da der Algorithmus nur kleine Schritte zurucklegen darf, um
in der Diusionsnaherung von Gleichung (2.6) zu bleiben. Dieser Nachteil
kann durch die zweite Moglichkeit der Simulation der Boltzmann-Strategie
behoben werden. Dazu benutzt man Brownsche Teilchen im uberdampften
Fall, die sich entlang des Gradienten der Fitnessfunktion F (~x) bewegen. Wir
erhalten also die Langevin-Gleichung
d ~x = ;D rF + p2D (t) ;
(3.59)
dt
wobei (t) Gausches weies Rauschen mit
h (t)i = 0
h (t0) (t)i
= (t0 ; t) :
ist, D bezeichnet die Diusionskonstante und die reziproke Temperatur.
Die entsprechende Fokker-Planck-Gleichung [4], die zur Langevin-Gleichung
korrespondiert, ist mit Gleichung (2.6) identisch. Zur Simulation der LangevinGleichung benutzen wir das folgende Diskretisierungsschema
p
; F (x(t) ; x) t (3.60)
x(t + 1) = x(t) + 2Dt (t) ; D F (x(t) + x)2
x
mit dem Zeitschritt t und der Kastenlange x.
Den Vergleich zwischen der analytischen Losung der Boltzmann Strategie
und der stochastischen Realisierung in Form einer Langevin-Gleichung wollen
wir anhand einer Parabel F (x) = x2 mit dem Minimum bei x = 0 und dem
Doppeltopf F (x) = 0:16 + (0:0278x2(0:16667x ; 0:9)(0:16667x + 0:8)) mit
den Minima x ;3:4; 3:8 durchfuhren. In [58] wurde Zeitentwicklung der
Wahrscheinlichkeitsverteilung im Falle der Parabel fur verschiedene Zeiten
3.4. SIMULATION DER STRATEGIEN
75
dargestellt, wobei die Populationsgroe N = 10000 betrug. Die entsprechenden Verteilungen gleichen den theoretischen Losungen. Wichtiger als
diese zeitliche Entwicklung sind die oben denierten Geschwindigkeiten bzw.
deren Integrale. Im Artikel [58] wurde die mittlere Fitness hF i sowie die
Fitnessvarianz hF 2i;hF i2 mit den theoretischen Resultaten verglichen. Zur
Vereinfachung geben wir noch einmal die entsprechenden Formeln im Falle
der Parabel fur die Boltzmann Strategie an. Als Anfangsverteilung wahlen
wir P (x; 0) = (x ; x0 ), d.h. wir starten mit allen Suchern im Punkt x0 .
Dann erhalten wir
2 := hF 2i ; hF i2 = 2 1 2 ((2x20 ; 1)(e;2t ; e;4Dt) + 1 ; e;2Dt(3.61)
)
hF i = 21 (x20 ; 1) exp(;D2t) :
(3.62)
Es ergab sich eine gute U bereinstimmung zwischen Theorie und Simulation
fur die Parameter D = 0:1; x0 = ;5 bei verschiedenen -Werten. Nur fur
kleine Temperaturen weichen die Ergebnisse aufgrund der kleinen Populationsgroe etwas ab.
Nun wollen wir uns noch dem nachstschwierigeren Problem widmen, dem
Doppeltopf. Wir verwenden dabei genau dieselben Parameter wie fur die Parabel. Da die Gleichung (2.6) fur diesen Fall nicht losbar ist, hatten wir die
entsprechende partielle Dierentialgleichung numerisch integriert. Die Verteilung P (x; t) zeigt eine gute U bereinstimmung zwischen der simulierten und
integrierten Losung fur verschiedene Temperaturen. Das entsprechende Verhalten wurde schon im vorherigen Unterabschnitt geschildert. Desweiteren
ist im Artikel [58] eine ausfuhrliche Diskussion dieses Verhaltens enthalten.
Genau wie aus der theoretischen Losung zu erwarten war, ist die Strategie
stark von der Temperatur abhangig, und wir erhalten dasselbe Verhalten wie
fur das stuckweise gegebene Potential (3.51).
3.4.2 Die Darwin-Strategie
Um diese Strategie zu simulieren, erinnern wir an die Herleitung der DarwinStrategie (2.17) mit Hilfe der U bergangsraten (2.18). Damit reduziert sich
die Simulation der Darwin-Strategie auf die Simulation der entsprechenden
Mastergleichung. Als eektiver Algorithmus bietet sich die Simulation der
Wartezeitverteilung [71, 72, 73, 74, 75] bzw. der Gillispie-Algorithmus an.
Die Idee besteht darin, da in der Dynamik des Prozesses die haugste Zeit
76
KAPITEL 3. DER VERGLEICH VON STRATEGIEN
kein U bergang stattndet. Kennen wir nun die Zeit, wann der nachste U bergang garantiert ausgefuhrt werden mu, so konnen wir einfach die Zeitskala
des Prozesses verandern und den U bergang ausfuhren. Diese Zeit wird als
Wartezeit bezeichnet. Der Vorteil der Methode liegt in einer starken Geschwindigkeitssteigerung des Algorithmus'. Fur die Einzelheiten verweisen
wir wieder auf den Artikel [58]. p
Als Mutation wahlen wir einen Diusionsproze mit der Bedingung hri = 2 D t fur jeden Mutationsschritt r. Der
gesamte Algorithmus lat sich nun in folgendem Schema mit der gleichverteilten Zufallszahl z, der exponentiell verteilten Zahl und der normal-verteilten
Zahl fur N Schritte zusammenfassen:
t0 = t + hN i i = z1 2 f1; :::;qN g
x(t0 ) = x(t)+ 2 D (t ; t0 ) z2 2 0; h1i
wenn z2 < jWs = F (x) ; hF i j
j = z3 2 f1; :::; i ; 1; i + 1; :::; N g
y = x : Ws > 0
x = y : Ws < 0.
Wiederum wollen wir die Dynamik des Algorithmus' mit der analytischen
Losung der Darwin-Strategie fur dieselben Fitnessfunktionen Parabel und
Doppeltopf vergleichen. Im Falle der Parabel bendet sich die Zeitentwicklung fur die Verteilungsfunktion in guter U bereinstimmung mit der theoretischen Losung, wie die entsprechende Abbildung in [58] beweist. Fur die
theoretische Formel der mittleren Fitness erhalten wir in diesem Fall den
Ausdruck
!
2
p
p
1
x
0
hF i = 2 2D tanh(t 2D) ; 2 cosh2 (tp2D) ;
(3.63)
falls dieselbe Anfangsverteilung P (x; 0) = (x ; x0 ) benutzt wird. Wie aus
der Simulation zu ersehen ist, haben die Fluktuationen keinen so groen Einu auf die Ergebnisse und werden mit wachsender Populationsgroe kleiner.
Es sei bemerkt, da der Grund dafur in der Wahl der U bergangsraten als Differenz F (x) ; hF i liegt. Auch fur den Doppeltopf nden wir eine sehr gute
U bereinstimmung zwischen der numerischen Losung der partiellen Dierentialgleichung (2.17) und der Simulation von N = 10000 Individuen.
Kapitel 4
Die Mathematische
Untersuchung der
Schrodinger-Operatoren
\Wenn uns die Beantwortung eines mathematischen
Problems nicht gelingen will, so liegt haug der Grund
darin, da wir noch nicht den allgemeineren Gesichtpunkt erkannt haben, von dem aus das vorgelegte Problem nur als Glied einer Kette verwandter Probleme
erscheint."
David Hilbert
In diesem Kapitel schaen wir die mathematischen Grundlagen zur weiteren Untersuchung der Strategien. Eine Anwendung dieser Resultate auf
die Klassikation der Strategien erfolgt im nachsten Kapitel. Im ersten Abschnitt werden die spektralen Eigenschaften von Schrodinger-Operatoren diskutiert. Die weiteren Abschnitte enthalten eine neue Theorie der SchrodingerOperatoren, die auf dem Studium der Zerlegung dieser Operatoren beruht.
Bevor wir zu den mathematischen Einzelheiten der Konstruktion kommen, wollen wir noch andere Anwendungen dieser Theorie kurz diskutieren. Als erste wichtige Anwendung sei auf die enge Beziehung zwischen der
Darwin-Strategie und der Schrodingergleichung hingewiesen. Bezuglich des
stationaren Problems gleichen sich beide Zugange vollstandig, wahrend sie
sich in der Zeitabhangigkeit unterscheiden. Da die Klassikation auch uber
77
78
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
den Kern des Hamiltonoperators Aussagen trit, erhalten wir damit auch
eine Klassikation des Grundzustandes. Weiterhin erhalten wir dadurch ein
Verfahren zur eektiven Konstruktion von Wechselwirkungstermen. In der
Mathematik fuhrt diese Herangehensweise zu einer Beziehung zwischen der
Singularitatstheorie algebraischer Varitaten und der K-Theorie. Nun ist es
moglich, auf andere Art und Weise die Generatoren einer K-Theorie zu konstruieren.
4.1 Spektrale Eigenschaften
In diesem Abschnitt werden wir, aufbauend auf die Ergebnisse der vorherigen
Abschnitte die allgemeinen Eigenschaften der Operatoren vom SchrodingerTyp studieren. Dabei stehen sowohl Fragen nach der Form des Spektrums
als auch nach der Reproduzierbarkeit desselben wahrend eines Simulationslaufs im Mittelpunkt. Dieser Abschnitt dient vor allem zur Vorbereitung der
nachsten Abschnitte.
4.1.1 Die Eigenschaften des Spektrums
Wir wollen in diesem Abschnitt auf die grundlegenden Denitionen und Satze
aus der Spektraltheorie linearer Operatoren in Hilbertraumen eingehen. Dabei werden wir uns starker an die mathematische Denition anlehnen, um
die entsprechenden Ergebnisse in kompakter Form darzulegen.
Sei H ein unendlich-dimensionaler, vollstandiger, separabler Hilbertraum
und A : H ! H ein linearer Operator uber H mit dem Wertebereich D(A) H.
Denition 1 Sei 2 C eine xierte, komplexe Zahl. Die Resolvente R (A)
des Operators A ist durch
R(A) = (A ; 11);1
mit der identischen Abbildung 11 deniert. Die Menge 4(A) mit
4(A) = fyj9x 2 D(A) mit (A ; 11)x = yg
ist der Denitionsbereich von R (A). Die Zahl heit regularer Wert, falls
1. R (A) existiert,
4.1. SPEKTRALE EIGENSCHAFTEN
79
2. die Vervollstandigung von 4(A) der gesamte Hilbertraum H ist und
3. R (A) beschrankt ist.
Alle nicht-regularen Werte des Operators A bilden das Spektrum (A) von
A.
An dieser Stelle sei bemerkt, da die Punkte 2 und 3 in der Denition des
regularen Wertes an die unendliche Dimension des Hilbertraums gebunden
sind. Diese Feststellung ist nur die aquivalente Formulierung des Fakts, da
lineare Operatoren (bzw. Matrizen) uber endlich-dimensionalen Vektorraumen nur ein diskretes Spektrum besitzen. Die Verletzung des Punktes 1 in der
Denition des regularen Wertes deniert das Punktspektrum P (A), wahrend
im Falle von Punkt 3 das kontinuierliche Spektrum C (A) sowie bei Punkt
2 das Restspektrum R (A) eingefuhrt wird. Fur das Spektrum ergeben sich
folgende Eigenschaften:
1. Das Spektrum (A) ist eine abgeschlossene Teilmenge der komplexen
Zahlen C.
2. Das Spektrum ist die disjunkte Vereinigung des Punkt-, kontinuierlichen sowie des Restspektrums, d.h.
(A) = P (A) t C (A) t R (A) :
3. Fur einen stetigen, linearen Operator A ist (A) nicht leer und kompakt. Der Spektralradius ist durch
r(A) := supfjj : 2 (A)g
deniert und es gilt:
qn
n
r(A) := nlim
!1 jjA jj jjAjj ;
d.h., das Spektrum des Operators A liegt in einem Kreis mit Radius
jjAjj um den Nullpunkt.
4. Ist der Operator A auf einem Hilbertraum deniert, so gilt:
(AT ) = (A)
(A? ) = (A)
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
80
5. Ist A ein selbstadjungierter Operator (A = A? ), so besitzt A kein Restspektrum (R (A) = ;) und das Spektrum besteht nur aus reellen Zahlen ((A) IR).
Fur den Spezialfall eines kompakten1 , selbstadjungierten, linearen Operators
A uber einem Hilbertraum haben Hilbert und Schmidt gefunden, da die
Menge der Eigenvektoren ein Orthonormalsystem des Hilbertraums bildet.
Explizit lautet dieser Satz folgendermaen.
Satz 1 Fur jeden kompakten, selbstadjungierten, linearen Operator A im
Hilbertraum H existiert ein othonormiertes System fng von Eigenvektoren,
so da jedes Element 2 H eindeutig in der Form
=
X
k
ck k + 0
mit einem Vektor 0 2 ker A dargestellt werden kann. Dabei gilt
A =
X
k
k ck k ;
wobei k der k entsprechende Eigenwert ist. Ist das System fng unendlich,
so gilt
nlim
!1 n = 0 :
Fur einen Beweis dieses Satzes verweisen wir auf [76]. Insbesondere bedeutet
dieser Satz, da fur den kompakte Fall das kontinuierliche Spektrum nicht
existiert.
Bevor wir uns dem konkreten Fall eines Operators vom Schrodinger-Typ
zuwenden, wollen wir noch kurz auf die Behandlung des kontinuierlichen
Spektrums im Falle eines selbstadjungierten Operators eingehen. In der Physik wird dafur immer die Diracsche Darstellung in Form von -Funktionen
gewahlt. Diese Art der Darstellung birgt aber einige Schwierigkeiten, die vor
allem mit dem Konvergenzbegri zusammenhangen. An dieser Stelle wollen
wir daher der mathematischen Darstellung in Form einer Spektralschar den
Vorzug geben.
Jede beschrankte Folge (un ) in D(A) besitzt eine Teilfolge (vn ), so da (Avn ) konvergent ist.
1
4.1. SPEKTRALE EIGENSCHAFTEN
81
Denition 2 Ein linearer Operator P : H ! H mit P 2 = P heit Projektionsoperator. Unter einer Spektralschar fEg verstehen wir eine Familie
von stetigen Projektionsoperatoren E : H ! H , so da fur alle u 2 X und
; 2 IR gilt:
EE = E E = E fur (i)
lim E u = 0
!;1 lim E u = u
!+1 lim E u = E u :
!;0 und
(ii)
(iii)
Der Teilraum H = fxjx 2 H ; Ex = xg ist der Projektionsraum von E .
Aufbauend auf dieser Denition fand Hilbert 1906 fur beschrankte Operatoren, den folgenden Satz, der 1929 durch von Neumann auf allgemeine
selbstadjungierte Operatoren ausgedehnt wurde.
Satz 2 Zu jedem selbstadjungierten Operator A gibt es genau eine Spektralschar, so da
D(A) = fu 2 H j
Z1
;1
und
(Au; v) =
jj2 d(Eu; u) < 1g
Z1
;1
d(E u; v)
fur alle u; v 2 D(A) gilt, wobei ( : ; : ) das Skalarprodukt in H bezeichnet. Die
Integrale sind dabei im Sinne von Lebesgue-Stieltjes zu verstehen. Symbolisch
schreiben wir dafur auch
A=
Z1
;1
dE :
Dieser Satz bedeutet, da jeder selbstadjungierte Operator als Linearkombination von Projektionsoperatoren darstellbar ist. Damit ist der Projektionsoperator der "einfachste\ selbstadjungierte Operator.
Wie im letzten Abschnitt von Kapitel 2 gezeigt wurde, konnen alle Strategien auf eine Gleichung der Form (2.49) zuruckgefuhrt werden. Nun wollen wir uns den spektralen Eigenschaften des Operators (2.50), welche die
82
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
Eigenschaften des Warmeleitungskerns (2.51) entscheidend beeinussen, zuwenden. Darunter zahlen solche Groen wie Spektraldichte und die Zeitentwicklung des Warmeleitungskerns. Dabei werden wir uns eng an das Buch
[57] halten.
Gegeben sei die verallgemeinerte Warmeleitungsgleichung (2.49) mit H
als verallgemeinertem Laplace-Operator uber einem n-dimensionalen Raum
B . Entsprechend [57] existiert eine Entwicklung des Warmeleitungskerns
bezuglich der Zeit
1
2 =4t) X
2
exp(
;jj
~
x
;
~
y
jj
i (~x; ~y)
q
pt(~x; ~y) =
t
i
(4t)n;(n=2 + 1) i=0
(4.2)
mit den Warmeleitungskernkoezienten i(~x; ~y), die Funktionen von F und
deren Ableitungen sind. Fur eine beliebige Anfangsverteilung P (x; 0) erhalten wir durch das Integral
Z
P (~x; t) = pt(~x; ~y)P (~y; 0)dny
B
(4.3)
eine Losung der Gleichung (2.49). Entsprechend [57] ist es moglich eine
Rekursionsformel zur Berechnung der Koezienten i(~x; ~y) anzugeben. Wir
wollen uns an dieser Stelle auf den Fall einer euklidischen Metrik beschranken
und erhalten mit 0 (~y; ~y) = 1 die Formel ([57], Theorem 2.26)
Z1
i+1 (~x; ~y) = ; siH i(exp(sx); ~y)ds :
0
(4.4)
Aufgrund der Fulle von Anwendungen in der Quantenfeldtheorie und Dierentialtopologie wurde einige Muhe auf die Berechnung dieser Koezienten
aufgewendet. Die entsprechenden Resultate bis einschlielich des 5. Koezienten nden wir in [77]. Wir wollen diese Technik dazu benutzten, Aussagen
uber die Spektraldichte zu bekommen. Wie aus der Algebra bekannt, ist
die Spur einer Matrix gleich der Summe der Eigenwerte und damit von der
Darstellung unabhangig. Benutzen wir nun eine geeignete Funktion des Operators, so gibt es zwischen der Spur dieses Ausdrucks und der Spektraldichte
eine Beziehung. In unserem Fall enthalt die Spur des Warmeleitungskerns die
Informationen uber das Spektrum von H . Zur Illustration dieses Gedankens
geben wir ein Theorem von Weyl wieder.
4.1. SPEKTRALE EIGENSCHAFTEN
83
Satz 3 Seien i die Eigenwerte des kompakten, selbstadjungierten Operators
H , der uber den kompakten Raum B gegeben ist. Fur t ! 0 erhalten wir
folgende Formel
X
i
e;ti = (4volt()Bn=)2 + O(t;n=2+1)
fur die Laplace-Transformierte des Spektralmaes von H .
Mit Hilfe eines geeigneten, positiven Maes () auf dem Spektrum konnte
Karamata ([57], Theorem 2.42) die Formel
lim
t
t!0
Z1
0
f (e;t )e;t d() =
C Z1f (e;t)t;1 e;t dt
;() 0
mit den positiven Konstanten ; C sowie der auf dem Intervall [0; 1] stetigen
Funktion f (x), herleiten. Durch eine geschickte Wahl der Funktion konnen
wir das Integral uber die Zustandsdichte des Spektrums bestimmen, d.h. die
Anzahl N () der Eigenwerte, die kleiner als sind.
Satz 4 Sei N () die Anzahl der Eigenwerte von H die kleiner als sind,
dann gilt
(B )
n=2
N () (4)n=vol
(4.5)
2 ;(n=2 + 1) :
Diese Formel ist in der Tat erstaunlich, da in keiner Weise die konkrete
Struktur des Operators H eine Rolle spielt. Alle Eigenwerte liegen in einer n=2-dimensionalen Kugel mit dem Radius . Die Dichte der Eigenwerte
nimmt mit steigendem Wert ab. Wie aus der Diskussion der Geschwindigkeiten im Zusammenhang mit dem Spektrum (siehe Anhang B.1) ersichtlich ist,
bestimmt die Dichte der Eigenwerte in starkem Mae die Geschwindigkeit.
Aus der Formel (4.5) sehen wir aber, da zwischen den einzelnen, in Kapitel
2 aufgefuhrten Strategien keine groen Unterschiede bestehen konnen. Diese Aussage gilt naturlich nur fur eine Mittelung uber eine groe Klasse von
Fitnessfunktionen. Im Einzelfall sind wohl Unterschiede festzustellen. Der
Grund fur diese Universalitat in der Form des Spektrums liegt im Auftreten des Laplace-Operators in H . Wie wir spater sehen werden, andert sich
das Verhalten der Strategie dramatisch bei einer Veranderung der Mutation.
Zu genau denselben Schlufolgerungen ist Engel in seiner Diplomarbeit gelangt [78]. Dort gab er eine problemabhangige Formel fur die U bergangszeit
84
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
zu einem anderen lokalen Optimum an. Wir wollen an dieser Stelle nicht die
Argumentation wiederholen, bemerken aber, da die Ursache fur die Problemunabhangigkeit dieser Formel genau durch das Resultat (4.5) gegeben
ist.
4.1.2 Eigenwerte und Korrelationsfunktionen
Nachdem wir die Eigenschaften des Spektrums sowie deren Einu auf die
Geschwindigkeit der Strategien studiert haben, bleibt noch die Frage zu
klaren, wie wir wahrend eines Simulationslaufs diese Information bekommen
konnen. Die Messung der Geschwindigkeit (3.1) sowie der Fitnessvarianz
(3.3) wahrend einer Simulation stellt keine Schwierigkeit dar. Gerade fur
physikalische Anwendungen sind wir aber an der vollen Gestalt des Spektrums interessiert.
Dazu beginnen wir mit der Anwendung der linearen Response-Theorie
auf das Eigenwertproblem. Wir denieren die Groe E (t)
Z
E (t) = HP (x; t) dx
(4.6)
in Bezug auf den Operator (2.50). Da die Verteilung P (x; t) genugend schnell
im Unendlichen abklingen soll, ergibt sich
Z
E (t) = FP (x; t) dx = hF i :
(4.7)
Zur Fixierung der Notation geben wir noch einmal die wichtigsten Gleichungen an. Das zeitabhangige Problem
@ P (x; t) = ;HP (x; t)
@t
besitzt zusammen mit der Eigenwertgleichung
H i(x) = i i (x)
die Losung
P (x; t) =
1
X
i=0
e;i t i(x) :
Der Operator H ist positiv, deshalb sind die Eigenwerte i auch positiv.
O.B.d.A. ordnen wir die Eigenwerte entsprechend ihrer Groe 0 1 : : :.
4.1. SPEKTRALE EIGENSCHAFTEN
85
Desweiteren ergibt sich aus der Forderung nach der Normierung von P (x; t)
das Verschwinden des kleinsten Eigenwertes 0 = 0. Dann besitzt die Losung
das allgemeine Verhalten, da mit groer werdender Zeit die Beitrage der
Eigenfunktionen zu hoheren Eigenwerten verschwinden. Im Grenzfall t ! 1
bleibt nur noch die Eigenfunktion 0 (x) zum kleinsten Eigenwert ubrig. Fur
groe Zeiten konnen die Beitrage der hoheren Eigenfunktionen als kleine
Storung (x; t)
P (x; t) = 0 (x; t) + (x; t)
angesehen werden. Fur E (t) ergibt sich dann
Z
E (t) = F (x)P (x; t) dx = E0 + E (t) :
Nun betrachten wir die Autokorrelationsfunktion hE (t)E (t + )i der A nderungen. Aus der Denition des Warmeleitungskerns (3.10) ersehen wir, da
der Operator H der Generator der Zeitverschiebung ist2. Fur die Zeitentwicklung der Storung erhalten wir dann
(x; t + ) = exp((E0 ; H ) ) (x; t)
(4.8)
und damit fur die Autokorrelationsfunktion
Z
dx dx0 (H )(x; t)(H )(x0; t + )
(4.9)
= exp((E0 ; E1 ) )h(E (x; t))2i + O(e(E ;E ) ) ) ;
hE (t)E (t + )i =
Z
0
2
wobei h i als zeitliche Mittelung verstanden wird. Fur den Eigenwert E1
erhalten wir den Ausdruck
!
1
h
E
(
t
)
E
(
t
+
)
i
E1 = E0 ; lim
(4.10)
!1 ln
h(E (x; t))2i :
Ausgehend von diesem Resultat konnen wir nun eine Hierarchie von Korrelationsfunktionen aufstellen, die uns die anderen Eigenwerte liefert. Die
Idee besteht darin, da wir nicht nur eine Zeit einfuhren, sondern gleich
Vom formalen Standpunkt aus gesehen, kann die Schrodinger-Gleichung als ReaktionsDiusions-Gleichung in imaginarer Zeit angesehen werden. Damit ist die gesamte Operatortheorie der Quantenmechanik unter Berucksichtigung der Transformation t ! it auf
diese Systeme anwendbar.
2
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
86
eine geordnete Menge 0 > 1 > : : : von solchen Zeiten. Diese Zeiten wurden so gewahlt, da immer ein weiterer Eigenwert in der Zeitentwicklung der
Storung auftritt, d.h.
(x; t + 0 ) = exp((E0 ; H )1) (x; t)
(x; t + 1) = exp((E1 ; H )2) (x; t) :
Nun fuhren wir eine Autokorrelationsfunktion der Form
C3(0 ; 1) = hE (t)E (t + 0 )E (t + 1 )i
(4.11)
ein und erhalten mittels obiger Zeitentwicklung
C3(0 ; 1) = exp((E0 ; E1)0 + (E1 ; E2)1 )h(E (x; t))3i + O(e(E ;E ) )) :
Eine einfache Umstellung sowie der Grenzubergang 0 ; 1 ! 1 bei xierter
Dierenz 0 ; 1 fuhrt zum Ausdruck
!
0 1
C
(
;
)
0
3
0
1
E2 = ;lim!1 E0 + E1 1 ; ; ln h(E (x; t))3i ; (4.12)
1
1
1
; const.
0
0
0
3
1
1
1=
woraus leicht auf den allgemeinen Fall geschlossen werden kann. Wir nehmen
also an, da die Eigenwerte E0; E1 ; : : : ; En;1 schon gegeben sind und fragen
nun nach dem n-ten Eigenwert En. Dazu geben wir uns wiederum eine
geordnete Menge von Zeiten 0 > 1 > : : : > n;1 vor. Wir erhalten die
allgemeine Zeitentwicklung der Storung
(x; t + i) = exp((Ei ; H )i) (x; t)
(4.13)
mit i = 0; 1; : : : ; n ; 1. Die Korrelationsfunktion
Cn(0 ; 1 ; : : : ; n;1 ) = hE (t)E (t + 0 )E (t + 1 ) E (t + n;1 )i (4.14)
reduziert sich auf den Ausdruck
Cn(0 ; 1 ; : : : ; n;1) = exp
nX
;1
i=0
!
(Ei ; Ei+1 )i h(E (x; t))ni + O(e(E ;En)n; ) ) ;
woraus wir fur den n-ten Eigenwert
0
1
!
1
C
n (0 ; 1 ; : : : ; n;1 )
i
En = En;1 + lim
(Ei ; Ei+1)
i !1
n;1 ; n;1 ln
h(E (x; t))ni (4.15)
i ;i const. i=0
nX
;2
+1 =
4.1. SPEKTRALE EIGENSCHAFTEN
87
erhalten. Die Abschatzung fur die Abstande i ; i+1 zwischen den Zeiten
kann durch die Spektraldichte (4.5) erfolgen. Dazu wahlen wir in der Umgebung eines vorgegebenen Eigenwertes einen weiteren Eigenwert. Aus der
Spektraldichte konnen wir die Wahrscheinlichkeit dafur berechnen, da dieser
Eigenwert auch realisiert wird.
Wie wir schon fruher festgestellt haben, verlieren die hoheren Eigenwerte im Laufe der Zeit ihre Bedeutung fur die Gesamtlosung des Problems.
Bezogen auf die Formel (4.15) bedeutet dies, da die Korrelationen mit zunehmender Zeit immer schwacher werden. Der Evolutionare Algorithmus
verliert wahrend des Simulationslaufs die Information uber schon erreichte
lokale Optima.
4.1.3 Deformation der Fitnessfunktion
In diesem Abschnitt wollen wir der Frage nachgehen, welche Auswirkungen eine kleine Deformation der Fitnessfunktion auf den Algorithmus besitzen. Dabei werden wir vor allem zeigen, da qualitativ gleich aussehende
Fitnessfunktionen zu einem qualitativ gleichem Verhalten des Algorithmus'
fuhren.
Aus der Formel (4.4) ist ersichtlich, da die Koezienten in der Warmeleitungskernentwicklung die Funktionen der Fitnessfunktion und deren Ableitungen sind. Verandern sich die Ableitungen der Fitnessfunktion, so andert
sich auch das Langzeitverhalten der Strategie grundlegend. Anschaulich
konnen wir uns diese Tatsache uber die Sattelpunktsapproximation des Pfadintegrals (1.3) uberlegen. Wie schon im Kapitel 2 dargelegt wurde, bewegt
sich das Maximum der Verteilung entlang der klassischen Trajektorie (1.1)
~x_ = ~v
~v_ = ;rF :
Eine Deformation der Fitnessfunktion, welche die kritischen Punkte der Fitnessfunktion nicht andert, fuhrt auch zum selben qualitativen Verhalten, da
die Fixpunkte dieselben sind. Nun entwickeln wir die Fitnessfunktion um
den Punkt ~x0
F (~x) = F (~x0) + rF jx=x (~x ; ~x0 ) +
2
1
@
+ 2 @x @x F jx=x (~x ; ~x0 )i(~x ; ~x0 )k + O((~x ; ~x0 )3 )
0
i
k
0
88
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
und setzen voraus, da dieser Punkt ein kritischer Punkt der Fitnessfunktion
ist. Fur das klassische System erhalten wir in der Umgebung dieses Punktes
x_i = vi
2
@
v_i = ; @x @x F jx=x (~x ; ~x0 )k :
i k
Wird die Umgebung dieses Punktes noch kleiner gewahlt, so reicht der lineare Term aus. Dieser Ansatz ist nur bei nicht-entarteten, kritischen Punkten anzuwenden, da sonst die Ableitung 4F verschwindet. Im Falle eines
entarteten, kritischen Punktes erhalten wir ein vollig anderes Verhalten in
der Umgebung von ~x0 . Das wird schon aus der unterschiedlichen Losung
ersichtlich. Die Besonderheit des entarteten, kritischen Punktes ist aber
die Instabilitat gegenuber Deformationen bzw. Transformationen der Fitnessfunktion. Damit tritt er als wichtiger Bifurkationspunkt in Erscheinung,
der unterschiedliche Losungen voneinander separiert.
Nach dieser rein klassischen Betrachtung wollen wir uns nun fragen, ob
sich dieses Verhalten auf die gesamte Dynamik (2.49) ubertragt. Die Antwort
lat sich einfach dadurch gewinnen, da die Storung der Fitnessfunktion eine
unitare Transformation des Operators H zur Folge hat. Entsprechend [79]
andern sich unter solchen Transformationen die Haufungspunkte des Spektrums nicht. Wenn wir nun noch wissen, da diese Haufungspunkte zu den
Fixpunkten der Dynamik (1.1) korrespondieren, so erhalten wir: Alle Transformationen des Operators H , die durch Funktionen mit nicht-ausgearteten,
kritischen Punkten erzeugt werden, erzeugen ein qualitativ gleiches Verhalten, sofern kein kritischer Punkt erzeugt wird.
Die letzte Erkenntnis zeigt den groen Einu von nicht-ausgearteten
Funktionen auf die Dynamik des Systems. Damit erhalten wir eine Methode,
die Losungen der Gleichung (2.49) einzuteilen.
0
4.2 Konstruktion des Losungsraumes
Im folgenden wollen wir uns auf die abstrakte Darstellung und Untersuchung
der Strategien beschranken, wie sie in Abschnitt 2.6 dargestellt wurden. Dabei soll von der konkreten Realisierung abgesehen werden. Wir erhalten dann
die Eigenschaften von Schrodinger-Operatoren in Abhangigkeit von der Form
des Potentials.

4.2. KONSTRUKTION DES LOSUNGSRAUMES
89
Sei B IRn ein kompakter, n-dimensionaler Unterraum des n-dimensionalen
reellen Raumes IRn, welcher auch als Phanotypraum bezeichnet wird. Weiterhin wollen wir annehmen, da der Rand von B homoomorph zur n ; 1dimensionalen Sphare S n;1 ist. Weiterhin sei eine glatte Funktion F : B !
IR uber B gegeben. Entsprechend Kapitel 2 interessiert uns die Gleichung
d P (~x; t) = ;HP (~x; t)
(4.16)
dt
mit dem positiven, selbstadjungierten Operator H
2
X
(4.17)
H = aij @x@@x + F (~x) :
i j
i;j
Die formale Losung ist durch (5.3) mit dem Warmeleitungskern exp(;tH )
gegeben. Andererseits kann die Losung auch durch ein Eigenwertproblem
der Form (5.4) mittels der Reihe (5.5) ausgedruckt werden. Entsprechend
der Theorie der selbstadjungierten Operatoren H vom Sturm-Liouville Typ
bilden die Eigenfunktionen i einen Hilbertraum L2 (B ), der gleichzeitig auch
der Losungsraum von Gleichung (2.49) ist. Fur relevante bzw. praktische
Probleme ist diese Darstellung der Losung schwierig zu berechnen (z.B. Doppeltopf). Deshalb suchen wir nach einer anderen Beschreibung des Losungsraumes. Andererseits kann jede glatte Funktion in einer geeigneten Umgebung eines Punktes durch eine Taylorentwicklung dargestellt werden. Nun
konnten wir diese Umgebung derart wahlen, da der kubische Term der Entwicklung eine Korrektur in Bezug auf den quadratischen Term ist. Leider
erweist sich dieser Weg als nicht gangbar, da wir dann eine Transformation
des Operators H erhalten, die wiederum auf ein nicht losbares Problem fuhrt.
Als Ausweg aus diesem Dilemma wahlen wir die stuckweise Approximation.
Jede glatte Funktion kann durch eine stuckweise, quadratische Funktion approximiert werden. In welchem Sinne diese Approximation zu verstehen ist,
beantwortet die folgende Denition.
Denition 3 Sei F : B ! IR eine glatte Funktion mit p nicht-entarteten,
kritischen Punkten x1 ; : : : ; xp und s entarteten, kritischen Punkten xp+1 ; : : : ; xp+s .
In der Umgebung jedes nicht-entarteten, kritischen Punktes xl mit 1 l p vom Index r existiert nach dem Satz von Morse ein Koordinatensystem
y1; : : : ; yd, so da in der Umgebung des kritischen Punktes die Funktion F
durch die quadratische Funktion
F (y) = F (xl ) ; (y1)2 ; : : : ; (yr )2 + (yr+1)2 + : : : + (yd)2
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
90
dargestellt wird. Sei (Hij )jx=xl p die Hessesche Matrix der Funktion F im
Punkt xl+p, der ein entarteter, kritischer Punkt ist. Der Rank dieser Matrix
rk(Hij )jx=xl p = k < d ist eine Zahl k die kleiner als der maximal mogliche
Rank ist. Besitzt der kritische Punkt xl+p den Index r so existiert wiederum
ein Koordinatensystem y1; : : : ; yd, so da in der Umgebung des kritischen
Punktes die Funktion F durch die quadratische Funktion
+
+
F (y) = F (xl ) ; (y1)2 ; : : : ; (yr )2 + (yr+1)2 + : : : + (yk )2
dargestellt wird. Die stuckweise, quadratische Funktion f , die aus den quadratischen Funktionen um die kritischen Punkte zusammen mit der Transformation der Umgebungen Ui mit 1 i p + s ineinander derart gegeben
ist, da die Funktion f stetig wird, heit quadratische Approximation.
Aus der quadratischen Approximation f konnen wir mit Hilfe der Transformationen Ui ! Uj mit Ui \ Uj 6= ; einen neuen unterliegenden Raum M ,
der durch die Umgebungen Ui uberdeckt wird, erzeugen. Wir wollen diese
Umgebungen als polynomiale Umgebung N vom Grad 2 bezeichnen, wobei
der Radius der Umgebung ist. Entsprechend der Homotopietheorie gibt es
eine stetige Transformation B ! M , die den Raum M der quadratischen
Approximation mit dem Phanotypraum B identiziert. Im folgenden wollen
wir nur noch mit der quadratischen Approximation f der Fitnessfunktion F
arbeiten.
Denition 4 Zwei glatte Funktionen F1 und F2 heien aquivalent, falls sie
dieselbe quadratische Approximation besitzen.
Diese A quivalenzrelation wird dadurch gerechtfertigt, da sich entsprechend
der Sattelpunktapproximation der Wirkung (1.2) das Maximum der Verteilung auf der klassischen Trajektorie (3.6) bewegt. Auch fur die Optimierung
ist die quadratische Approximation die eigentliche Information, die wichtig ist. Deshalb wollen wir im folgenden die A quivalenzklassen von solchen
Funktionen F betrachten.
Bevor wir das Problem (2.49) in der groten Allgemeinheit untersuchen
werden, wollen wir den speziellen Fall einer polynomialen Umgebung N vom
Grad 2 studieren. Dazu mussen wir die Gleichung
@ P = D4P ; (F (x~ ) + rF (x~ )(~x ; x~ ) + 1 4F (x~ )(~x ; x~ )2 )P (4.18)
0
0
0 2
0
0
@t

4.2. KONSTRUKTION DES LOSUNGSRAUMES
91
betrachten. Als erstes transformieren wir die obige quadratische Funktion in
eine Normalform
rF (x~0 ))2 ;
F (x) ! F~ (~x) = 12 4F (x~0)~x2 + 42FF((x~x~0)) ; ((4
F (x~0))2
0
die durch die lineare Transformation
rF (x~0 )
x ! x~ = x + 4
(4.19)
F (x~0)
gegeben ist. Dadurch wird aber die prinzipielle Form der Gleichung (4.18)
nicht geandert und wir erhalten mit
@ P = D4P ; F~ (~x)P
(4.20)
@t
eine Gleichung, die sowohl in den Ableitungen als auch im Ort quadratisch
ist.
Als nachstes wollen wir die Symmetrien der Gleichung (4.20) untersuchen.
Dazu vereinfachen wir die obige Gleichung zu
0p
1
n
X
@ P = 4P + @X
x2i ;
x2k A P
@t
i=1
k=p+1
(4.21)
und spalten die rechte Seite wie folgt auf:
!
!
p
n
@ 2 + x2 P + X
@ 2 ; x2 P :
@P =X
i
k
2
2
@t
i=1 @xi
k=p+1 @xk
(4.22)
Die Menge der Transformationen, die (4.22) invariant lassen, wird durch
die Gruppe O(p) O(n ; p) aufgespannt. Fuhren wir weiterhin eine xierte Orientierung auf N ein, so reduziert sich diese Gruppe auf G =
SO(p) SO(n ; p). Die Wirkung dieser Symmetriegruppe G auf die Dierentialgleichung lat sich auf naturliche Weise auf den Losungsraum ausdehnen.
Ein anderer Weg, dieses Problem zu beschreiben, ist durch eine quadratische Form
0n
1
p
n
X
X
@ P = @X
p2i + x2i ;
x2k A P
@t
i=1
i=1
k=p+1
(4.23)
92
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
uber der Algebra, die durch pk = @=@xk und xk mit [pk ; xl ] = kl erzeugt
wird, gegeben. Spater werden wir diese Art der Beschreibung nutzen, um
die Eigenschaften des Losungsraumes durch algebraische Relationen auszudrucken.
Nun denieren wir eine oene U berdeckung des Phanotypraums B durch
einen Atlas von polynomialen Umgebungen vom Grad 2 (N)i mit
[
B = (N)i
i2I
und (N)i \ (N)j 6= ; wenn (N)i und (N)i benachbart sind. Fur jede Umgebung (N)i gibt es einen Hilbertraum der quadratisch integrierbaren Funktionen L2 ((N)i), welcher durch die Ergebnisse von Kapitel 3 bestimmt ist.
Wahlen wir diesen Hilbertraum als Faser uber der Umgebung bzw. Karte,
so erhalten wir ein Bundel P von Hilbertraumen. Es gilt folgendes Lemma.

Lemma 1 In Bezug auf Gleichung (2.49) und die oene Uberdeckung
von
2
B tragt sowohl der Losungsraum L (B ) als auch B die Struktur einer Man
nigfaltigkeit mit Ubergangsfunktionen
gij : (N)i \ (N)j ! (N)i \ (N)j mit
(N)i \ (N)j 6= ;, die durch Gleichung (2.49) erzeugt werden. Die Abbildung
P ! B L2 (B ) ist ein Isomorphismus von Hilbertraumbundeln.
Beweis: Die Behauptung, da B eine Mannigfaltigkeit ist, ist trivial. Weiterhin denieren wir durch die Gleichung (2.49) erzeugte U bergangsfunktionen gij : (N)i \ (N)j ! (N)i \ (N)j . Zu diesem Zweck betrachten wir
eine Zerlegung der Eins, d.h. eine Familie f g2A von Pstetigen Funktionen
: X ! [0; 1] mit einem Trager supp = (N) und (x) = 1. Damit
konnen wir die lokale Funktion F zur globalen Funktion F zusammenkleben.
Die lokale Funktion F uber (N) ist derart deniert, da
X
F = F
gilt. Die U bergangsfunktion gij ist nun so deniert, da Fi = gij (Fj ) fur alle
x 2 (N)i \ (N)j gelten mu. Mit Hilfe der (Standard-)Gruppenwirkung
der SO(n) auf B , konnen wir die U bergangsfunktion gij durch eine neue
U bergangsfunktion g~ij : (N)i \ (N)j ! SO(n) ersetzen. Der Zusammenhang zwischen beiden ist einfach durch gij (x) = g~ij (x) x, wobei die Gruppenwirkung kennzeichnet, gegeben. Dadurch wird mittels der Beziehung
f (x) = h(~gij x) = g(gij (x)) fur alle x 2 (N)i \ (N)j , f 2 L2 ((N)i)

4.3. DIE EIGENSCHAFTEN DES LOSUNGSRAUMES
93
und h 2 L2 ((N)j ) eine Transformation f = T (h) von Hilbertraumen erzeugt. Zu jedem Gruppenelement g 2 SO(n) gibt es eine Transformation
T 2 Aut(L2 (N)), welche die Beziehung f = T (h) erfullt. Auf diese Weise haben wir ein Aut(L2(N))-Hauptfaserbundel erzeugt, das zum Hilbertraumbundel assoziiert ist. Zwei Hauptfaserbundel sind isomorph gdw. die
Basisraume homotopieaquivalent sind. Wegen der Kontrahierbarkeit von B
sind die entsprechenden Hauptfaserbundel zu P und B L2 (B ) isomorph
und so auch die Bundel selbst.
q.e.d.
Im Gegensatz zu diesem Ergebnis steht die Einschrankung von P auf den
Rand @B n = S n;1 von B n. Wir erhalten folgendes Lemma:
Lemma 2 Die Einschrankung P j@B von P auf den Rand @B von B kann als
ein nicht-triviales Bundel realisiert werden, d.h. es ist i.a. nicht isomorph
zu @B L2 (@B ).
Beweis: Wir betrachten wiederum das Hauptfaserbundel P zur Einschrankung
P j@B mit der Strukturgruppe Gl, die der direkte Limes von Gln(IR) ist. Entsprechend Steenrod [80] sind die Isomorphismusklassen von P durch die
Homotopiegruppe n;2(Gl) bestimmt. Mit Hilfe der Homotopie von LieGruppen [60, 81] sowie durch die Bott-Periodizitat [82] erhalten wir die Isomorphismen
8
>
< 0 n = 0; 4; 6; 7 mod 8
n;2 (Gl) (
O
)
(
O
)
=
ZZ n = 1; 5 mod 8
= n;2 = n+6
>
: ZZ2 n = 2; 3 mod 8
mit O als direkter Limes der Gruppe der orthogonalen Transformationen.
Daraus ersehen wir, da in den Dimensionen 1; 2; 3; 5 mod 8 nichttriviale
Bundel auftreten konnen.
q.e.d.
4.3 Die Eigenschaften des Losungsraumes
Im vorherigen Abschnitt haben wir mit Hilfe einer geeigneten Zerlegung des
Phanotypraums einen aquivalenten Losungsraum konstruiert, der einfacher
zu untersuchen ist. Nun wollen wir die Eigenschaften dieses Raumes mit den
Mitteln der algebraischen Topologie analysieren. Dabei steht der Begri der
94
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
Stabilitat\ im Mittelpunkt des Interesses. Um die Bedeutung dieses Begris
"genau
abzustecken, zitieren wir hier die Denition von J. Adams [83]
some phenomenon is stable, if it can occur in any di" ... We orsayinthat
mension,
any suciently large dimension, provided perhaps that the
dimension is suciently large...\
Aus der Sicht der Evolutionstheorie interessieren uns genau solche Eigenschaften, die in allen Dimensionen auftreten. Dadurch ist es moglich eine
Generalisierung der Ergebnisse vorzunehmen.
Nach der rein analytischen Beschreibung des Losungsraumes in Form des
Hilbertraums L2 (B ) sowie der geometrischen Beschreibung in Form eines
Faserbundels P wollen wir nun eine algebraische Beschreibung konstruieren
deren A quivalenzklassen bzgl. der Stabilitat mit den entsprechenden A quivalenzklassen von P ubereinstimmen. Dazu fuhren wir die Weyl-Algebra
ein.
Denition 5 Sei V ein Vektorraum uber dem Korper K mit Basis fpi; qig
i; j = 1; : : : n. Die Weyl-Algebra An ist als der Quotient der Tensor-Algebra
des Vektorraums nach dem Ideal I , welches durch die Elemente
pi qj ; qj pi ; ij
pi pj ; pj pi
qi qj ; qj qi
erzeugt wird, deniert.
Damit konnen wir den Hamilton-Operator H uber N, welcher durch (2.50)
eingefuhrt wurde, mit Hilfe der Darstellung pi = @=@xi und qi = xi durch
H=;
n
X
p2i + Q(x)
i=1
(4.24)
mit Q(x) als quadratische Form angeben. Eine solche Form lat sich einfach durch eine symmetrische n n-Matrix S 2 M (n; IR) mit Werten in IR
ausdrucken. Sei x = (x1 ; : : : ; xn) 2 IRn ein Vektor, so gilt Q(x) = xSxT .
Im allgemeinen ist die Form Q(x) nicht diagonal. Nun betrachten wir das
Bundel P (An) von Weyl-Algebren An uber B . Im folgenden sind wir an den
stabilen Eigenschaften des Bundels P (An) interessiert. Gerade diese Eigenschaften spiegeln aber auch die dimensionsunabhangigen Eigenschaften von

4.3. DIE EIGENSCHAFTEN DES LOSUNGSRAUMES
95
Gleichung (2.49) wieder. Diese Idee lat sich dadurch realisieren, da wir
dieselbe Eigenschaft der Gleichung sowohl im n-dimensionalen Raum B n als
auch im (n + 1)-dimensionalen Raum B n+1 nden, wobei die U bertragung
der Eigenschaft auf letzteren durch die Einbettung B n ,! B n+1 erfolgt. In
der Bundeltheorie tritt diese "Stabilitat\ in Form einer algebraischen Bedingung auf. Dazu betrachten wir die Menge der stabilen A quivalenzklassen,
die auch als K-Theorie bezeichnet wird. Fur die entsprechenden Denitionen
verweisen wir hier auf die Standardliteratur [84, 85].
An dieser Stelle werden wir die allgemeine Theorie auf unseren konkreten
Fall spezialisieren. Dazu bemerken wir als erstes, da die Weyl-Algebra eine
reelle C -Algebra (siehe [86]) ist, d.h.
Denition 6 Eine reelle C -Algebra A ist eine Banach -Algebra uber IR,
welche -isometrisch isomorph zu einer bzgl. der Norm abgeschlossenen Unteralgebra der Operatoralgebra L(HIR) der linearen Operatoren auf einem reellen Hilbertraum HIR ist.
Lemma 3 Zusammen mit den Involutionen p = ;p und q = q ist die
Weyl-Algebra eine -Algebra. Weiterhin existiert eine Darstellung der Algebra als Unteralgebra von L(HIR) mit HIR = ff 2 L2 (IR)jf = f g, die diese
Algebra zu einer reellen C -Algebra macht.
Beweis: Das Ideal I der Tensoralgebra uber V ist in Bezug auf die Involution invariant, d.h.
(p q ; q p ; 1) = q p ; p q ; 1 = p q ; q p ; 1 :
Als nachstes konstruieren wir eine Norm aus dem Skalarprodukt des Hilbertraums HIR, welches durch
h ji =
Z
IR
(x)(x)dx
deniert ist. Zusammen mit der Darstellung p = @=@x und q = x erhalten
wir fur die Involution
h jpi = hp ji = ;hp ji
=) p = ;p
h jqi = hq ji = hq ji
=) q = q
96
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
und damit letztlich
jjppjj = h jpp i = hp jp i = jjpjj2
jjqqjj = h jqq i = hq jq i = jjqjj2 ;
die Eigenschaft einer -Algebra. Fur den zweiten Teil des Lemmas mussen
wir entsprechend [87] nur zeigen, da 1 + pp = 1 ; p2 und 1 + q q = 1 + q2
invertierbar sind. Dies ist aber oensichtlich.
q.e.d.
Nun betrachten wir ein lokal triviales Banachraumbundel, dessen Fasern endlich erzeugte, projektive Moduln uber einer reellen, unitalen C -Algebra An:
ein An-Bundel uber B , sind. Die Klassikation solcher Bundel, d.h. die
Bestimmung und Charakterisierung von Isomorphismusklassen, erfolgt auf
zwei Weisen. Als erstes ist die Klassikation durch die Homotopieklassen
[B; BG] von Abbildungen vom Basisraum B in das universelle Bundel BG
gegeben. Letzteres lat sich allgemein aus der Strukturgruppe G = Aut(An)
konstruieren. Fur eine detailierte Konstruktion dieses Raumes verweisen
wir auf [88]. Der zweite Zugang benutzt eine rein algebraischen Sichtweise. Dazu betrachten wir die Menge aller Schnitte ;(B; P (An))) des Bundels
P (An), welche ein endlich erzeugter, projektiver C (B; An)-Modul ist. Die
Menge C (B; An) bezeichnet die C -Algebra aller stetigen An-wertigen Abbildungen f : B ! An, welche im Unendlichen verschwinden. Zusammen
mit der Operation bildet der projektive C (B; An)-Modul ;(B; P (An)))
eine Halbgruppe. Durch die Grothendieck-Konstruktion konnen wir diese
Halbgruppe zu einer Gruppe K (C (B; An)) (siehe [85, 86, 89]) erganzen, die
auch als K-Theorie bezeichnet wird. Auch die Menge der Banachraumbundel
ist durch die Whitney-Summe eine Halbgruppe, und die entsprechende
Gruppe wird mit K (B; An) bezeichnet. Entsprechend einem Theorem von
Swan [90] sind beide Gruppen isomorph zueinander. Desweiteren ist die Untergruppe K~ (B; An) von Bundeln gleicher Faserdimension isomorph zu den
Homotopieklassen [B; BG] mit G = Aut(An).
In unserem konkreten Fall erhalten wir unter Beachtung der Homotopieinvarianz der K-Theorie folgende Isomorphismen (siehe [91])
K (An) := K (f?g; An) = K (B n; An)
Kp(An) := K (IRp; An) = K (B p; S p;1; An) = K (B p; @B p ; An)
mit dem ein-punktigen Raum f?g. Die Gruppe Kp(An) bezeichnet die KTheorie der C -Algebra An (siehe [86, 89]). Die wichtigste Eigenschaft der K-

4.3. DIE EIGENSCHAFTEN DES LOSUNGSRAUMES
97
Theorie ist die Periodizitat, welche mit wichtigen Eigenschaften von CliordAlgebren im Zusammenhang steht. Entsprechend [85, 91] erhalten wir den
Isomorphismus
Kp(An) = Kp+8(An) :
Die Gruppe K (B n; An) beschreibt die Isomorphismusklassen von An-Bundeln
uber B n wahrend die Gruppe K (B n; S n;1; An) die Isomorphismusklassen solcher Bundel in Bezug auf den Rand @B n = S n;1 von B n beschreibt. Entsprechend Lemma 2 ist das Bundel uber den Rand von B in manchen Dimensionen nichttrivial, wobei auch hier eine 8er Periodizitat in der Dimension
auftritt. Spater werden wir zeigen, da die Randbedingungen des Problems
(2.49) die Verwendung der Gruppe K (B n; S n;1; An) anstatt K (B n ; An) rechtfertigen werden.
Seien Aut(An) = Gln(An) die Automorphismen der Algebra. Mit Hilfe
der Inklusion Gln(An) Gln+1(An+1) denieren wir den induktiven Limes
der Automorphismusgruppe durch Gl(A). Nach [91] erhalten wir den Isomorphismus
Kp(A) = p;1 (Gl(A)) = [S n;1; Gl(A)]
fur den induktiven Limes A von An. Dies sind genau die stabilen Eigenschaften der Algebra. Um zu unserem Ausgangsproblem (2.49) zuruckzukommen,
mussen wir uns auf die quadratischen Formen uber An konzentrieren. Dadurch konnen wir alle Hamiltonoperatoren der Form (4.24) darstellen und
damit auch alle Gleichungen (4.22). Dabei spielt aber die quadratische Form,
die durch die qi erzeugt wird, die entscheidende Rolle, da die von pi erzeugte
Form sich nicht verandert. Sei Qn der Raum aller von qi erzeugten, quadratischen Formen. Nun kommen wir zum zentralen Begri dieses Kapitels,
der eine Klassikation uberhaupt erst moglich macht: das quadratische
Bundel. Ein quadratisches Bundel P (Qn) uber P (An) ist wie folgt deniert:
Denition 7 Ein quadratisches Bundel P (Qn) uber P (An) ist ein lokal triviales Faserbundel mit Faser Qn, welches dieselbe Trivialisierung wie das
Hilbertraumbundel P besitzt.
Jeder Schnitt in P (Qn) erzeugt eine Funktion F : B n ! IR, d.h., die Menge
der Schnitte ;(P (Q)) ist aquivalent zur Menge der glatten Funktionen F :
B n ! IR. Wir erhalten folgendes Lemma:
98
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG

Lemma 4 Fur eine feste Uberdeckung
von B n mit polynomialen Nachbar-
schaften N vom Grad 2 stellt das quadratische Bundel die Menge der moglichen Gleichungen (2.49) dar. Weiterhin gibt es fur eine Nachbarschaft N
eine GNS-Darstellung von P (Qn)jN , so da der entsprechende Hilbertraum
mit L2 (N ) ubereinstimmt.
Beweis: Der Beweis besteht im wesentlichen im Einsetzen der Denitionen. Der Operator H in Gleichung (2.49) ist entsprechend der Denition
in Bezug auf den Generator pi diagonal. Jeder Schnitt in P (Qn) ist lokal
eine Abbildung x 2 U1 7! Q(x) 2 Qn mit der polynomialen Nachbarschaft
U1. Es ist klar, da die quadratische Form Q(x) die Gestalt des Operators
H vollstandig bestimmt. In Bezug auf die feste U berdeckung von Bn erhalten wir alle moglichen Gleichungen auf diesen Nachbarschaften. Der zweite
Teil des Lemmas ist ebenfalls einfach zu zeigen. Auf der Algebra An und
auf Qn gibt es ein naturliches positives Funktional entsprechend Lemma 3.
Dieses Funktional erzeugt durch die GNS-Darstellung [86, 89] einen Hilbertraum. Die quadratischen Formen sind Bilinearformen Q(x) = xT Qx mit
den Vektoren x. Wenn wir die Form Q(x) als Erwartungswert des Operators
Q auassen, so kann die entsprechende Konstruktion auf den Operator H
ausgedehnt werden. So erhalten wir den Hilbertraum der quadratisch, integrierbaren Funktionen.
q.e.d.
Damit haben wir eine rein algebraische Konstruktion des Losungsraumes
erhalten. Nun wollen wir die stabilen A quivalenzklassen solcher Bundel untersuchen.
Lemma 5 Sei F : B n ! IR eine xierte Funktion, die das Problem (2.49)
deniert. Weiterhin seien P1 (Qn ) und P2 (Qn ) zwei quadratische Bundel
zusammen mit einer Menge von polynomialen Nachbarschaften (N )1 bzw.
(N)2 , die B uberdecken. Beide Bundel sind isomorph zueinander, falls beide


Uberdeckungen
homotop zueinander sind. Jede Aquivalenzklasse
in Kn(A) ist
homotopieinvariant und kennzeichnet die Isomorphieklasse eines A-Bundels.
Beweis: Die Menge der Abbildungen P1(Qn) ! P2(Qn) ist durch die
Menge der Schnitte im Hom(P1(Qn); P2(Qn))-Bundel gegeben (siehe [92]
Satz 3.10). Sei f : (N)1 I ! (N)2 die Homotopie der Nachbarschaften mit I = [0; 1] als Einheitsintervall. Wir wahlen die Abbildung f derart, da f (:; 0)P2 (Qn) = P2(Qn) und f (:; 1)P2(Qn) = P1 (Qn) ist. Sei

4.3. DIE EIGENSCHAFTEN DES LOSUNGSRAUMES
99
: (N)1 I ! (N)1 die Projektion, dann sind die Bundel f P2(Qn) und
f (:; t) P2(Qn) uber (N)1 ftg isomorph, da sie gleich f (:; t)P2(Qn) sind.
Nach dem Erweiterungssatz von Tietze ist das Bundel f (:; t)P2 (Qn) auch
fur eine Umgebung Ut von t isomorph uber (N)1 Ut . Die Isomorphieklasse
von f (:; t)P2(Qn) ist lokal konstant und wegen des Zusammenhanges von I
uberhaupt konstant. Aus der Denition des K-Funktors erhalten wir erst einmal die Homotopieinvarianz [84, 85]. Zur Konstruktion der Isomorphieklasse
nutzen wir die Beziehung
Kn(A) = K (B n; @B n ; A)
aus. Entsprechend [88, 93] gibt es zu jeder Gruppe A ein universelles Bundel
E A uber dem universellen Raum B A, welches bis auf Homotopie eindeutig ist, so da die Isomorphieklassen von quadratischen Bundeln durch die
Homotopieklassen
[B n =@B n; B A] = [S n; B A] = n(B A)
gegeben sind. Durch die Isomorphismen [84, 85]
K (B n; @B n ; A) = K (S n; A) = n(B A) ZZ
erhalten wir einfach Kn(A) = n(B A) ZZ und damit sind die Isomorphieklassen von quadratischen Bundeln durch die K-Theorie gegeben. q.e.d.
Wir erhalten ein ahnliches Ergebnis wie fur gewohnliche Faserbundel. Die
Isomorphismusklasse fur das quadratische Bundel ergibt sich analog als KTheorie Kn(P (Q)), wobei die Strukturgruppen durch Aut(Q) mit Q als Menge der quadratischen Formen gegeben ist. Fur diese K-Theorie erhalten wir
durch das folgende Lemma eine Beziehung zur Kn(A).
Lemma 6 Fur die K-Gruppen erhalten wir den folgenden Isomorphismus
Kp(P (Q)) = Kp(An Qn) = Kp(An) K0(Qn).
Beweis: Als erstes bemerken wir, da das quadratische Bundel P (Q) zum
Bundel E (q) An mit E (Q) als Bundel von quadratischen Formen E (Q)
isomorph ist. Mittels des Thom'schen Isomorphismus erhalten wir fur die
K-Theorie Kp(P (Q)) = Kp(An Qn). Die K-Theorie von Qn ist einfach
durch K0(Qn) gegeben, die auch als Witt-Ring bezeichnet wird. Alle anderen Gruppen sind trivial. Nun betrachten wir die Spektralsequenz E2pq =
100
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
Kp(An) Kq (Qn) und Eipq = 0 fur i > 2. Wir erhalten E2pq = 0 fur q 6= 0
und damit nach den allgemeinen Eigenschaften von Spektralsequenzen [81],
das Ergebnis Kp(P (Q)) = E1p0 q.e.d.
= E2p0.
Die Haupteigenschaft der oben denierten K-Theorie mit weitreichenden
Konsequenzen fur die spatere Klassikation manifestiert sich in folgendem
Satz.
Satz 5 Sei nun P (Q) ein quadratisches Bundel, das durch fpi; qig erzeugt
wird. Es gibt einen Isomorphismus
Kp(P (Q)) = Kp+4(P (Q)) ;
welcher durch das Cup-Produkt mit dem Generator von K (B 4 ; S 3; A) erzeugt
wird.
Beweis: Die Abbildung
i : An ;! An Q2n
a 7;! a 112n
induziert in der K-Theorie die mod2-Abbildung
i : K (An) ;! K (An Q2n) :
[a] 7;!
2[a]
Entsprechend [85, 91] besitzt die K-Theorie einer reellen Algebra eine Periodizitat von 8 bzw.
Kp(An) = Kp+4(An) mod 2
induziert durch i . Nach [85] Theorem 2.11 wird dieser Isomorphismus durch
das cup-Produkt mit dem Generator K (B 4; S 3; A) erzeugt.
q.e.d.
Als Konsequenz erhalten wir aus diesem Satz, da der Raum B in 4-dimensionale
Unterraume aufspaltet, die unabhangig voneinander sind. Dies folgt aus der
Denition der hoheren K-Gruppen zusammen mit der exakten Sequenz fur
die relative K-Theorie und wir erhalten einfach
Kp(An) = K (B p; @B p; An) = K (B p+4 ; @B p+4; An) = Kp+4(An) :
Das bedeutet aber, da fur eine genugend groe Zahl n die stabilen A quivalenzklassen von Losungen nur von den Eigenschaften des Raumes L2 (B 4 )
abhangen. Etwas anders ausgedruckt spaltet der Losungsraum fur Gleichung
(2.49) lokal immer in L2 (B 4 )-Unterraume auf. Im nachsten Abschnitt wollen
wir diese stabilen Klassen in Beziehung zur Funktion F bringen.
4.4. BESCHREIBUNG DURCH STABILE FUNKTIONENKEIME
101
4.4 Beschreibung durch stabile Funktionenkeime
Im vorherigen Abschnitt haben wir bewiesen, da die A quivalenzklassenbildung zu einer Aufspaltung des Raumes B in 4-dimensionale Teilraume fuhrt.
Deshalb konnen wir uns auf die 4-dimensionalen Probleme beschranken. Aufgrund der A quivalenz zwischen den Schnitten von P (Q) und den Funktionen
F , bleibt nun noch die Beantwortung der Frage, welche Art von Klassen
die stabilen A quivalenzklassen auf dem Raum der Funktionen F implizieren. Im folgenden werden wir diese Frage mit Hilfe der Singularitatstheorie
beantworten.
Seien P1(Q) und P2(Q) zwei quadratische Bundel, die schon oben deniert
wurden. Der Begri "stabile A quivalenz\ bedeutet nun, da es zwei triviale,
quadratische Bundel n und m vom Rank n bzw. m gibt, so da die beiden
Bundel P1(Q) n und P2(Q) m isomorph zueinander sind. Die Menge
dieser A quivalenzklassen besitzt die Struktur einer Gruppe, die isomorph zur
K-Theorie K (An Q2n ) (siehe Lemma 6 und [85, 91]) ist. Um eine Beziehung
zwischen der K-Theorie und der Menge der Schnitte ;(P (Q)) herzustellen,
mussen wir eine andere Beschreibungsweise dieser Menge entwickeln.
Ein Element von ;(P (Q)) ist im wesentlichen ein konkretes Potential F ,
welches das Problem (2.49) bis auf die Randbedingungen eindeutig festlegt.
An dieser Stelle wollen wir die Menge der Schnitte durch das rein algebraische
Konzept der Garben und Funktionenkeime beschreiben. Diese Art der Beschreibung besitzt den entscheidenden Vorteil, da jede Funktion lokal durch
ein Polynom approximiert wird, das nicht nur quadratisch sein mu. Mit dem
folgenden Satz wollen wir die A quivalenzrelation auf der Menge der Schnitte
angeben, die von der stabilen A quivalenz auf der Menge der quadratischen
Bundel induziert wird.
Satz 6 Zwischen der Pragarbe ;(P (Q)) und der Garbe On der glatten Funktionen B n ! IR gibt es einen Isomorphismus i. Sei O der direkte Limes der
Garben und f; g 2 O zwei Keime mit f : B p ! IR und g : B q ! IR. Weiterhin seien P1 (Q) und P2 (Q) zwei quadratische Bundel, die zu den Keimen f
und g uber den Isomorphismus i korrespondieren. Sind die beiden Bundel in
Bezug auf die trivialen Bundel n und m mit p + n = q + m stabil aquivalent,
dann sind die zwei Keime f; g auch stabil aquivalent, d.h. es gibt die Relation
f (x1; : : : ; xp) x2p+1 : : : x2p+n = g(x1; : : : ; xq ) x2q+1 : : : x2q+m :
102
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
Beweis: Der Beweis des ersten Teils des Satzes ist eine funktorielle Kon-
struktion, die in [94, 95, 96] zu nden ist. Jede Funktion lat sich durch
Deformation aus einer stuckweise, quadratischen Funktion gewinnen. Das
bedeutet, da wir ein quadratisches Bundel aus einem Funktionskeim f durch
die entsprechende stuckweise, quadratische Funktion f~ erzeugen konnen, welche durch Lemma 5 bis auf Isomorphie eindeutig ist. Das triviale, quadratische Bundel ist durch eine global denierte, quadratische Funktion gegeben.
Sind die beiden Bundel P1 (Q) und P2(Q) stabil aquivalent so konnen wir
entsprechende triviale, quadratische Bundel 1; 2 addieren mit P1 (Q) 1 =
P2(Q) 2. Nach Denition und vorheriger Betrachtung fuhrt dies auf die
Relation
f (x1; : : : ; xp) x2p+1 : : : x2p+n = g(x1; : : : ; xq ) x2q+1 : : : x2q+m ;
wobei die beiden Keime f; g durch die entsprechenden quadratischen Funktionen angenahert werden.
q.e.d.
Als nachstes mussen wir die Homotopieeigenschaften der Bundel in eine
entsprechende Beziehung zwischen den Keimen uberfuhren. Im folgenden
Lemma wird genau diese Beziehung hergestellt.
Lemma 7 Seien f; g 2 On zwei Keime, die zu den quadratischen Bundeln
P1(Q) bzw. P2(Q) korrespondieren. Wenn P1 (Q) isomorph zu P2(Q) ist dann
sind die beiden Keime durch eine lineare Funktion miteinander verbunden,
d.h.
f (x1 ; : : : ; xn) = g(x1; : : : ; xn) + a1 x1 + : : : + an xn
mit den Konstanten a1 ; : : : ; an.
Beweis: Als Folgerung aus Lemma 5 erhalten wir, da beide Bundel nur
dann aquivalent sind, wenn die Anzahl der kritischen Punkte gleich ist. Andernfalls mute die Homotopie einen solchen Punkt erzeugen, was aufgrund
der Denition einer festen Zerlegung nicht moglich ist. Damit bleibt nur
noch die linearen Storungen als einzige Veranderung der Funktionenkeime
f; g.
q.e.d.
Durch Betrachtung beider A quivalenzrelationen erhalten wir, da eine A quivalenzklasse von Keimen ein Polynom mindestens 3. Grades sein mu. Entsprechend [97] bildet die Menge der stabilen Funktionenkeime eine dichte
Untermenge der Menge der Funktionen B n ! IR. Um diese Klassen zu

4.5. DIE KLASSIFIKATION DES LOSUNGSVERHALTENS
103
bestimmen, wollen wir von den Eigenschaften der Menge der stabilen, quadratischen Bundel ausgehen.
Vom vorherigen Abschnitt wissen wir, da die Menge der stabilen, quadratischen Bundel bzgl. der Dimension des unterliegenden Raumes periodisch
ist. Kennen wir die quadratischen Bundel bis Dimension 4 so konnen wir alle A quivalenzklassen von quadratischen Bundeln beschreiben. Daher mussen
wir auch nur die stabilen A quivalenzklassen von Keimen bis Dimension 4 betrachten. Eine Untersuchung dieser Klassen wird uns im nachsten Abschnitt
zu einer stabilen Klassikation des Problems (2.49) fuhren.
4.5 Die Klassikation des Losungsverhaltens
In diesem Abschnitt wollen wir die Hauptresultate der vorherigen Abschnitte kombinieren, um die angekundigte Klassikation zu vollenden. Als erstes
erhalten wir aus der Periodizitat der K-Theorie den Fakt, da wir nur einen
4-dimensionalen Raum B 4 zu betrachten brauchen. Weiterhin konzentrieren
wir uns auf die stabilen Funktionenkeime B 4 ! IR, d.h. solche Keime, die
der Relation von Satz 6 genugen. Nun konnten wir uns fragen, ob es fur
diesen Raum der stabilen Funktionenkeime vielleicht einfach zu beschreibende Generatoren gibt. Glucklicherweise gibt es eine Klasse von Singularitaten
und deren Entfaltungen, die dicht im Raum der Funktionenkeime liegen und
damit die gesuchten Generatoren sind. Das Ziel dieses Abschnittes ist es,
den folgenden Satz zu beweisen.

Satz 7 Sei G4 der Ring der stabilen Aquivalenzklassen
von Keimen B 4 ! B 4
vom einfachen Typ. Es gibt einen Isomorphismus zwischen der Sequenz von
K-Theorien K(P (Q)) quadratischer Bundel uber B 4 und dem Ring G4 .
Bevor wir zum Beweis dieses Satzes kommen, wollen wir zuerst den Ring
G4 genauer charakterisieren. Die Menge C (B 4 ; IR) der glatten Funktionen
B 4 ! IR besitzt eine naturliche durch IR induzierte Ringstruktur3. Entsprechend [97] liegen die Morse-Funktionen, als stabile Funktionen betrachtet,
in der Menge dieser Funktionen dicht. Diese Klasse von Funktionen liefert
aber nur eine Teilantwort auf die Frage nach einer Charakterisierung der
Klassen in K(P (Q)), da die erzeugenden Funktionenkeime stabil aquivalent
sind, wenn sie sich um eine Morse-Funktion unterscheiden. Was wir aber
3
Diese Menge ist sogar eine Algebra, was wir an dieser Stelle aber nicht benotigen
104
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
bei der Charakterisierung der A quivalenzklassen in K (P (Q)) vergessen haben, ist die Einbeziehung der U bergangsabbildungen. Dazu geben wir uns
zwei Teilmengen U; V B 4 mit U \ V 6= ; vor. Die U bergangsabbildung
g : U ! V mu ebenfalls stabil sein. Damit hat sich aber das Bild grundlegend geandert. Nun mussen wir nach den stabilen A quivalenzklassen von
Funktionenkeimen g : U ! V suchen. U ber die Relation fV = fU g erhalten
wir so wieder einen stabilen Keim fV aus dem Keim fU . Entsprechend [97]
sind diese Abbildungen durch (x1 ; x2 ; x3; x4 ) 7! (x1 ; x2; x3 ; f (x1; x2 ; x3; x4 ))
darstellbar, wobei f eine der 7 Thomschen Katastrophen ist. Bekanntlich
gibt es zu jeder Singularitat den lokalen Ring dieser Singularitat. Als G4 denieren wir nun die direkte Summe aller lokalen Ringe der 7 Katastrophen.
Der Satz 7 druckt dann die Tatsache aus, da es einen Ringhomomorphismus
G4 ! K (P (Q)) geben mu. Da die Menge der Gleichungen (2.49) durch die
Schnitte im Bundel P (Q) gegeben sind und die K-Theorie K(P (Q)) die
Klassikation solcher Bundel darstellt, charakterisieren die Katastrophen in
G4 das Losungsverhalten von Gleichung (2.49).
Denition 8 Sei Cx1 der Ring der Funktionenkeime in x 2 B d mit der
durch IR induzierten Ringstruktur. Mit Mx bezeichnen wir das maximale
Ideal, d.h. die Menge der Keime, die in x verschwinden. Sei f : (B d ; x) !
(B d; y) ein Funktionenkeim. Der lokale Ring R(f ) von f ist der Quotientenring Cx1=Cx1f My .
Ist die Dimension des unterliegenden Raumes d = 4, so erhalten wir entsprechend [97] die folgenden stabilen Funktionenkeime als A quivalenzklassen:
Satz 8 Die einzigen stabilen Singularitaten in Dimension 4 sind auer dem
parabolischen Nabel die 6 Thomschen Katastrophen.
Nun haben wir alle Teile zusammen, um den Satz 7 zu beweisen.
Beweis: (Satz 7)
Sei P (Q) ein quadratisches Bundel zusammen mit einem System von Nachbarschaften fNig auf denen Funktionenkeime fi deniert sind. Jeder stabile
Funktionenkeim auf einer Nachbarschaft ist zu einer Morse-Funktion aquivalent. Die U bergangsabbildung gij : Ni \ Nj ! Ni \ Nj verbindet die
beiden Funktionenkeime fi und fj auf den Karten, d.h. es gilt fj = fi gij .
Entsprechend [97] mu damit die U bergangsabbildung ebenfalls stabil sein.
Andererseits ist bis auf A quivalenz jede Klasse in K (P (Q)) durch ein System fgij g von U bergangsfunktionen gegeben. Aufgrund der Periodizitat

4.5. DIE KLASSIFIKATION DES LOSUNGSVERHALTENS
105
entsprechend Satz 5 brauchen wir nur den Ring
K (P (Q)) = K0 (P (Q)) K1(P (Q)) K2 (P (Q)) K3 (P (Q))
zu betrachten, da alle anderen Gruppen zu diesem isomorph sind. Sei G4 ein
Ring, der die stabilen A quivalenzklassen von Funktionenkeimen B 4 ! B 4
als Generatoren besitzt. Jede Folge von U bergangsfunktionen, die ein nichttriviales quadratisches Bundel beschreiben, lassen sich aus stabilen Funktionen aufbauen. Jeder Generator einer stabilen A quivalenzklasse von Funktionenkeimen erzeugt ein nichttriviales Bundel (nach Satz 6 und Lemma 7).
Damit gibt es eine Einbettung
i : G4 ;! K(P (Q)) ;
die jedem Generator in G4 einen Generator in K(P (Q)) zuordnet. Wir
mussen nun noch zeigen, da K (P (Q)) genauso viele Generatoren wie G4
besitzt. Dazu konstruieren wir eine Abbildung k von der Weyl-Algebra Ad
auf den Tangentialraum Te Hd der Heisenberg-Gruppe [91] an der Einheit.
Diese Abbildung ist einfach die Identikation der Generatoren beider Gruppen. Dadurch wird ein Isomorphismus in der rationalen K-Theorie
k : Ki (An) Q ! KOi(THn) Q = KOi(Hn) Q
mit i = 0; 1; 2; 3 erzeugt [85, 91]. Entsprechend [91] sind die ersten 4 KGruppen durch:
(
= 0; 3
KOi(Hn) = QQ2 ii =
1; 2
gegeben. Weil damit die Anzahl der Generatoren von K (P (Q)) nach Satz 8
gleich der Anzahl der Generatoren von G4 ist, mu i ein Isomorphismus sein.
q.e.d.
Nach diesem wichtigen Satz wollen wir nun auf die Folgerungen eingehen.
Dazu bemerken wir als erstes, da jedem Schnitt im quadratischen Bundel
uber B d ein Hamilton-Operator zugeordnet ist, den wir bis auf stabile A quivalenz eindeutig festlegen konnen. Um die A quivalenzklassenbildung auf den
Losungsraum auszudehnen, mussen wir eine Entsprechung fur den Begri
stabile A quivalenz nden.
Denition 9 Zwei Dynamiken (2.49) heien aquivalent, falls die Kerne der
entsprechenden Hamilton-Operatoren (2.50) durch einen Isomorphismus auseinander hervorgehen.
106
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
Als notwendige Voraussetzung fur die Existenz dieses Isomorphismus konnen
wir die A quivalenz der Losungsraume der Dynamik ansehen. Dieser Losungsraum stimmt aber entsprechend Lemma 4 mit der GNS-Darstellung des quadratischen Bundels uberein. Weiterhin wollen wir bemerken, da der Kern
durch alle Verteilungen erzeugt wird, die sich um die kritischen Punkte von
F konzentrieren. Die Bifurkationen von F sind nichts weiter als die Singularitaten und deren Entfaltungen. Wir erhalten die folgende Schlufolgerung.

Schlu"sfolgerung 1 Die Aquivalenzklassen
von Dynamiken (2.49) sind durch
den Ring G4 gegeben.
Beweis: Jeder Losungsraum der Dynamik korrespondiert auf eindeutige
Art und Weise zur GNS-Darstellung eines Schnitts in einem quadratischen
Bundel P (Q). Sind die kritischen Punkte von F fur 2 Hamiltonoperatoren
gleich, so sind die Kerne aquivalent. Die dimensionsunabhangigen Eigenschaften der Dynamik korrespondieren zu den stabilen Klassen in K(P (Q))
(nach Lemma 4 und 5). Nach Satz 7 erhalten wir daraus die Beziehung zu
den stabilen Funktionenkeimen, wodurch der Kern des Operators ebenfalls
festgelegt ist.
q.e.d.
Am Ende wollen wir noch die konkreten Ausdrucke fur die stabilen Funktionenkeime unter Berucksichtigung von Lemma 7 angeben. Dazu wahlen
wir fur den Hamilton Operator aij = ij und bi = 0, d.h. wir benutzen die
euklidische Metrik. Dann erhalten wir die Schlufolgerung.
Name der Katastrophe Formel
Falte
Spitze
Schwalbenschwanz
Schmetterling
hyperbolischer Nabel
elliptischer Nabel
Dimension
Raum Parameter
x31 + u1x1
1
1
4
2
x1 + x2 x1 + u1x1
2
1
5
3
2
x1 + x2 x1 + x3 x1 + u1x1
3
1
x61 + x2 x41 + x3 x31 + x4 x21 + u1x1 4
1
3
3
x1 + x2 + x3 x1 x2
3
2
;u1 x1 ; u2x2
x31 ; x1 x22 + x3 (x21 + x22 )
3
2
;u1 x1 ; u2x2
Schlu"sfolgerung 2 Die Realisierung von G4 ist durch die Funktionen in

Tabelle 4.5 gegeben. Jede Aquivalenzklasse
von Funktionen F (aquivalent im
Sinne der Denition 4) in (2.50) lat sich in eine Folge dieser Funktionen

zerlegen, die eindeutig die Aquivalenzklasse
der Dynamik festlegen.

4.5. DIE KLASSIFIKATION DES LOSUNGSVERHALTENS
107
Beweis: Entsprechend [97] und Satz 7 gibt es 6 generische Abbildungen
der Form gij : (x1 ; x2 ; x3; x4 ) ! (x1 ; x2 ; x3; f (x1; x2 ; x3; x4 )) fur die U ber-
gangsabbildungen, die zusammen mit den Morse-Funktionen auf jeder Karte
des quadratischen Bundels die Funktion F von (2.50) erzeugen. Als Beispiel
betrachten wir die Singularitat x3 und deren Entfaltung x3 + xy. Diese Abbildung tritt als generische Abbildung einer 2-Mannigfaltigkeit auf sich auf und
wird als Falte bezeichnet. Nach Lemma 7 kann y keine Koordinate, sondern
nur ein Parameter sein. Damit erhalten wir die erste Funktion x3 + u1x aus
4.5. Auf analoge Art ergeben sich die anderen Ausdrucke. Weiterhin liegen
diese Funktionen im Raum der Funktionen B 4 ! B 4 dicht, d.h. jede Funktion g liegt in einer Umgebung von einer Folge dieser Funktionen bezuglich
der Whitney-Topologie von C (B 4 ; B 4). Durch Komposition f g mit einer
Morse-Funktion erhalten wir das Ergebnis.
q.e.d.
Damit haben wir die Klassikation abgeschlossen. Danach verhalten sich
zwei Dynamiken der Form (2.49) mit aij = ij und bi = 0 gleich, wenn
die Funktionen F die gleiche Folge von Funktionen aus Tabelle 4.5 besitzen. Damit ist das Verhalten der Darwin-Strategie durch die Funktionen
aus Tabelle 4.5 klassiziert. Sie liefern auch die Antwort auf die Frage, welche Fitnessfunktionen in einem Optimierungsproblem die schwierigen Falle
darstellen.
108
KAPITEL 4. MATHEMATISCHE UNTERSUCHUNG
Kapitel 5
Die Klassikation der
Strategien
\Zu oft wird in der Physik der Zustandsraum als ein
linearer Raum gewahlt, obwohl die nichtlineare Struktur des Problems in naturlicher Weise auf eine Mannigfaltigkeit als Zustandsraum fuhrt. Das erschwert
die mathematische Behandlung."
Stephen Smale
5.1 Der Weg zur Klassikation
Am Anfang dieses Kapitels wird ein kurzer Ausblick auf die wichtigsten Ideen
und Resultate des letzten Abschnitts gegeben, wobei wir uns eng an die
Arbeit [98] halten. Das hauptsachliche Ziel besteht darin, die folgende Frage
zu beantworten: Was ist ein schwieriges Problem fur die Strategie? Dazu
betrachten wir die Darwin-, Boltzmann- und Gemischte Strategie in einem
kontinuierlichen Suchraum B d der Dimension d. Eine Zusammenstellung der
entsprechenden Untersuchungen zu diesen 3 Strategien kann in den Kapiteln
2 und 3 gefunden werden. In [41] wurden sowohl die Boltzmann-Strategie
als auch die Darwin-Strategie auf eine einheitliche Grundlage gestellt. Beide
Strategien konnten nach entsprechenden Transformationen auf die Gleichung
d P (~x; t) = ;HP (~x; t)
(5.1)
dt
109
110
KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN
zuruckgefuhrt werden, wobei H ein positiv deniter, selbstadjungierter Operator der Form
2
X
X
H = aij @x@@x + bi @x@ + F (~x)
(5.2)
i j
i
i;j
i
ist und F (~x) die Fitnessfunktion F : B ! IR uber den Raum B darstellt.
Als formale Losung ergibt sich
P (~x; t) = exp(;tH )P (~x; 0)
(5.3)
mit exp(;tH ) als Warmeleitungskern. Andererseits konnen wir die Losung
von (2.49) uber die Eigenwerte des Operators H (siehe Kapitel 2 und Anhang
B.1) darstellen, d.h.
Hi(~x) = ii(~x) ;
(5.4)
woraus sich die Losung
P (~x; t) =
X
i
i(~x) exp(;i t)
(5.5)
ergibt. Im letzten Abschnitt von Kapitel 2 nden wir auch die entsprechenden Transformationen um alle anderen Strategien auf die oben beschriebene
Form zuruckzufuhren.
Wie sich schon im letzten Abschnitt des vorherigen Kapitels andeutete,
sind die entarteten Punkte fur das Verstandnis der Dynamik sehr wichtig.
Diese Punkte sowie die zugehorigen Funktionen lassen sich als Bifurkationen
der Dynamik (5.1) bezuglich der Fitnessfunktion verstehen. Vom abstrakten
Standpunkt aus gesehen sind alle Dynamiken dieses Typs eindeutig durch die
Fitnessfunktion bestimmt. Wir interessieren uns nun fur die A quivalenzklasse von Fitnessfunktionen, so da die Dynamik in allen Dimensionen ein ahnliches Verhalten aufweist. Eine genauere Denition dieser A quivalenzrelation
werden wir spater geben. Die Herangehensweise ist die folgende: Als erstes
wird die Struktur des Losungsraumes untersucht, da hier die Eigenschaften
der Dynamik kodiert sind. Durch die verschiedenen Arten der Beschreibung
erhalten wir sowohl eine geometrische Beschreibung uber Kartenzerlegungen
als auch eine rein algebraische Beschreibung uber quadratische Formen. Es
wird sich zeigen, da auf dem Losungsraum eine Periodizitat existiert, die zu
einer Einteilung des Raums der Fitnessfunktionen fuhrt. Durch diese Einteilung der Fitnessfunktionen wird die Klassikation erhalten. Bevor wir mit
5.1. DER WEG ZUR KLASSIFIKATION
111
die mathematischen Satze des letzten Kapitels anwenden, wollen wir diese
zwei Schritte im Beweis etwas genauer erklaren.
Entsprechend der Sturm-Liouville Theorie bilden die Eigenfunktionen
i(~x) einen Hilbertraum, der gleichzeitig der Losungsraum der Gleichung
(2.49) ist. Leider hat dieser Losungsraum einen entscheidenden Nachteil:
Um ihn zu bestimmen mussen wir das vollstandige Eigenwertproblem (5.4)
losen. Fur die meisten Probleme ist das aber nicht moglich, und wir mussen
uns eine praktikablere Beschreibung fur diesen Losungsraum uberlegen. Wir
bemerken dazu, da jede hinreichend glatte Fitnessfunktionen (Potentiale)
F (~x) immer in eine Potenzreihe
F (~x) = F (x~0) + rF (x~0)(~x ; x~0 ) + 12 4F (x~0(~x ; x~0 )2 + : : :
(5.6)
entwickeln werden kann. Sei weiterhin der Phanotypraum B IRn eine ndimensionale kompakte Untermenge des IRn mit @B homoomorph zu S n;1.
Dann nden wir eine Zerlegung von B in oene Untermengen Ui , so da
F (~x) ein Polynom vom Grad p ist (naturlich bis auf einen kleinen Fehler).
Die Untermengen Ui und Uj , die benachbart sind, mussen sich uberlappen,
d.h., wir erhalten eine oene U berdeckung von B mit Karten Ui. Es ist klar,
da diese Zerlegung vom Grad des Polynoms abhangt. Fur die Konstruktion
des Losungsraumes wahlen wir p = 2, da wir dann eine explizite Losung fur
das Eigenwertproblem (5.4) bzw. fur die gesamte Gleichung (2.49) besitzen.
Dadurch bekommen wir uber jeder Karte Ui einen Hilbertraum L2 (Ui). Aufgrund der U berlappung zwischen zwei Karten sind diese Hilbertraume nicht
unabhangig voneinander. Man kann nun zeigen, da der Losungsraum eine
Blatterung uber B mit den Hilbertraumen L2 (Ui) als Blattern ist. Abbildung
5.1 zeigt eine Beispielsituation.
Wir wollen nun die Grundidee fur die Klassikation vorstellen. Sei F
die oben beschriebene Blatterung und fUigi2I die oene U berdeckung von
B . Wir betrachten 3 Karten Ui, Uj und Uk mit Ui \ Uj \ Uk 6= ; (siehe
Abbildung 5.2). Auf jeder Karte ist die Losung des Problems bekannt, aber
die gegenseitige Beziehung zwischen den Losungen ist noch nicht klar. Dazu
wahlen wir eine Transformation von einer Karte zur anderen, die auch als
U bergangsabbildung bezeichnet wird. Bezeichne Uij den U berlapp Ui \ Uj
zwischen Ui und Uj . Die Verklebung zweier Teillosungen auf den Karten
erfolgt durch die Festlegung einer Funktion gij : Uij ! GL(n; IR) (analog fur
die anderen Kartenubergange) auf die Gruppe der linearen Transformationen. Aufgrund der Gruppenstruktur der GL(n; IR) mu gij = gik gkj gelten.
KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN
112
2
L (Ui )
Ui
Uj
2
L (Uj )
Abbildung 5.1: Blatterung uber B
Uj
Ujk
Uk
Uijk
Uij
Uki
Ui
Abbildung 5.2: Darstellung von 3 Karten in B
5.1. DER WEG ZUR KLASSIFIKATION
113
Wir bemerken, da die Wahl der Gruppe keine Einschrankung darstellt, da
wir immer noch die Freiheit haben, auf die Karten noch beliebige dierenzierbare Kartentransformationen anzuwenden. Wir sprechen von einer trivialen Transformation gij , wenn zwei Funktionen fi : Ui ! GL(n; IR) und
fj : Uj ! GL(n; IR) existieren, so da gij = fi;1fj gilt. Dann sind namlich
die beiden Losungen auf den Karten voneinander unabhangig. Die Menge der nichttrivialen Transformationen gij wird mit H 1(fUigi2I ; GL(n; IR))
bezeichnet und heit 1. C echsche Kohomologie mit Werten in GL(n; IR).
Mittels algebraischer Methoden (K-Theorie [84], rationale Homotopietheorie
[99]) kann diese Menge untersucht werden (siehe z.B. [100] fur die Verbindung
zu Fredholm-Operatoren). Entscheidend ist nun die Tatsache, da wir lokal
den Operator H als quadratische Form darstellen konnen, und die Losungen
des Operators eng mit dieser Darstellung verknupft sind. Die stabile Klassikation dieser lokal denierten, quadratischen Formen erzeugt eine Einteilung
des unterliegenden Raumes in 4-dimensionale Teilraume. Da jeder Operator
durch die Wahl der Fitnessfunktion gegeben ist, ubertragt sich diese Einteilung auf den Raum der Fitnessfunktionen. Das bedeutet aber, da wir eine
Aufspaltung der Fitness in der Form:
F (x1; : : : x8 ) ;! F~ (x1 ; : : : ; x4 ) + F~ (x5 ; : : : ; x8)
und damit eine Zerlegung des Eigenwertproblems (5.4) in zwei 4-dimensionale
Probleme erhalten. Um die Klassikation abzuschlieen, mu nun noch
die Abhangigkeit des Eigenwertproblems von einer 4-dimensionalen Fitness
untersucht werden. Dazu stellen wir erst einmal fest, da eine zweimaldierenzierbare Transformation des Operators H zu einer stetigen A nderung
des Spektrums fuhrt. Der Laplace-Operator andert dabei das Verhalten nicht
so sehr wie die Fitness F (~x). Wie ist nun aber der Raum der Fitnessfunktionen, d.h. der Raum der Funktionen B ! IR, aufgebaut? Die Antwort
lat sich mit der Singularitatstheorie [97] geben: Der Raum wird durch 6
Thomsche Katastrophen aufgespannt (Thom-Boardman-Stratizierung),
d.h. diese Katastrophen liegen dicht im Raum der Funktionen IR4 ! IR. Wir
erhalten diese 6 Katastrophen als die stabilen A quivalenzklassen von Funktionen IR4 ! IR4 , die sich als (x1 ; x2; x3 ; x4) ! (x1 ; x2 ; x3; F (x1; x2 ; x3 ; x4))
darstellen lassen.
Als Schlufolgerung aus den mathematischen Betrachtungen des letzten
Kapitels erhalten wir:
Zwei Dynamiken (5.1) sind aquivalent, falls die Kerne der Schrodinger-
114
KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN
Operatoren durch eine lineare Transformation auseinander hervorgehen. Die

Aquivalenzklassen
von Darwin-Strategien enthalten als Generatoren die 6 Katastrophen aus Tabelle 5.2. Zwei aquivalente Fitnessfunktionen (im Sinne der
Denition 4, Kapitel 4) die aus den gleichen Katastrophen bestehen, erzeugen aquivalente Dynamiken.
Die weiteren Schlufolgerungen aus den mathematischen Ergebnissen des
letzten Kapitels werden in den folgenden Abschnitten gezogen.
5.2 Die Klassikation der Darwin-Strategie
Im folgenden wollen wir uns auf die Darwin-Strategie beschranken. Danach
gehen wir noch kurz auf die anderen Strategien vom Typ (5.1) ein. Andere
Mutationen mit groerer Schrittweite werden spater behandelt, da sie eine
andere Methodik erfordern.
Sei B IRn ein kompakter, n-dimensionaler Unterraum des n-dimensionalen
reellen Raumes IRn, welcher auch als Phanotypraum bezeichnet wird. Weiterhin wollen wir annehmen, da der Rand von B homoomorph zur n ; 1dimensionalen Sphare S n;1 ist. Die glatte Funktion F : B ! IR ist die Fitnessfunktion des Optimierungsproblems. Entsprechend Kapitel 2 lassen sich
die bisherigen Strategien auf einheitliche Art und Weise durch die Gleichung
(5.1) mit dem positiven, selbstadjungierten Operator H (5.2) beschreiben.
Die formale Losung ist durch (5.3) mit dem Warmeleitungskern exp(;tH )
gegeben. Andererseits kann die Losung auch durch ein Eigenwertproblem
der Form (5.4) mittels der Reihe (5.5) ausgedruckt werden. Entsprechend
der Theorie der selbstadjungierten Operatoren H vom Sturm-Liouville
Typ bilden die Eigenfunktionen i einen Hilbertraum L2 (B ), der gleichzeitig auch der Losungsraum von Gleichung (2.49) ist. Fur relevante bzw.
praktische Probleme ist diese Darstellung der Losung schwierig zu berechnen
(z.B. Doppeltopf). Deshalb suchen wir nach einer anderen Beschreibung des
Losungsraumes. Vom vorherigen Kapitel wissen wir, da die quadratische
Fitnessfunktion ein exakt losbares Problem darstellt. Andererseits kann jede
glatte Funktion in einer geeigneten Umgebung eines Punktes durch eine Taylorentwicklung dargestellt werden. Nun konnten wir diese Umgebung derart
wahlen, da der kubische Term der Entwicklung eine Korrektur in Bezug
auf den quadratischen Term ist. Leider erweist sich dieser Weg als nicht
gangbar, da wir dann eine Transformation des Operators H erhalten, die
wiederum auf ein nicht losbares Problem fuhrt. Als Ausweg aus diesem Di-
5.2. DIE KLASSIFIKATION DER DARWIN-STRATEGIE
115
lemma wahlen wir die stuckweise Approximation. Jede glatte Funktion kann
durch eine stuckweise, quadratische Funktion approximiert werden. Die entsprechende Denition 3 im Kapitel 4 klart genau die Frage, in welchem Sinne
diese Approximation zu verstehen ist. Jetzt konnen wir sozusagen als "Ersatz\ fur unseren alten Phanotypraum B einen neuen Raum M konstruieren,
der nur die kritischen Punkte der Fitnessfunktion einschlielich einer kleinen
Umgebung um diese enthalt. Diese Information ist aber genau die wichtige
Information fur die Optimierungstheorie. Deshalb wollen wir die folgende
A quivalenzrelation einfuhren (siehe Denition 4 Kapitel 4).
Denition 10 Zwei Fitnessfunktionen F1 und F2 heien aquivalent, falls
sie dieselbe quadratische Approximation besitzen.
Als weiteren Schritt erhalten wir aus der Periodizitat der K-Theorie den
Fakt, da wir nur einen 4-dimensionalen Raum B 4 zu betrachten brauchen.
Weiterhin konzentrieren wir uns auf die stabilen Eigenschaften der Losung,
d.h. diejenigen Eigenschaften, welche in allen Dimensionen vorkommen. Als
mathematisch aquivalente Formulierung erhalten wir das Problem, die stabilen Funktionenkeime B 4 ! B 4 zu betrachten. Entsprechend [97] sind dies
die folgenden stabilen Funktionenkeime (siehe Satz 8):
Die einzigen stabilen Singularitaten in Dimension 4 sind auer dem parabolischen Nabel die 6 Thomschen Katastrophen.
Satz 7 kombiniert nun die Aussage uber die stabilen Funktionenkeime mit
den Eigenschaften der Dynamik (5.1).
Um diese Aussage nicht nur abstrakt zu belassen, wollen wir noch ein
physikalisches Argument angeben, das dieses Ergebnis plausibel erscheinen
lat. Dazu betrachten wir die Gleichung (2.49) mit dem Operator H =
;4 + F und konstruieren als Losung das Pfadintegral
0 Z
1
P (~x; t) = D~x exp @; (x_ 2 + F )dnxA :
Z
B
(5.7)
Vom mathematischen Standpunkt betrachtet, existiert dieses Integral nicht,
da das Ma Dx nicht richtig deniert ist. Im folgenden sowie in den vorangegangenen Betrachtungen haben wir mit diesem Integral immer die formale
Approximation durch eine Diskretisierung gemeint. In diesem Sinne konnen
wir durch die Sattelpunktsapproximation zeigen, da der grote Beitrag zu
116
KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN
diesem Integral durch den Pfad
d2 ~x = ;rF (~x)
(5.8)
dt2
erbracht wird. Damit erhalten wir ein Gradientensystem, welches gleichzeitig
das Standardbeispiel fur Thom's Katastrophentheorie ist.
Doch nun zuruck zum konkreten Aussehen der Thomschen Katastrophen.
Im Gegensatz zu Thom betrachten wir keine Entfaltungen, d.h., wir teilen
nicht die Variablen in Parameter und Ort auf. Stattdessen betrachten wir
bis auf die linearen Terme alle Parameter auch als Ortsvariable. Betrachtet
man z.B. die Entfaltung x3 ; ux der Katastrophe x3 , so bleibt u ein Parameter wahrend im Fall des Doppeltopfs x4 ; yx2 die Variablen x; y einen Ort
bezeichnen. Dadurch ergeben sich Katastrophen in 1,2,3 und 4 Dimensionen. Andererseits kann die zweidimensionale Katastrophe x4 ; yx2 auch in 4
Dimensionen auftreten. Dazu mussen einfach die anderen Richtungen durch
quadratische Terme "aufgefullt\ werden (stabile A quivalenz in der Singularitatstheorie). Wegen der Einfachheit geben wir noch einmal die einzelnen
Falle an.
Name der Katastrophe Formel
Falte
Spitze
Schwalbenschwanz
Schmetterling
hyperbolischer Nabel
elliptischer Nabel
Dimension
Raum Parameter
x31 + u1x1
1
1
4
2
x1 + x2 x1 + u1x1
2
1
x51 + x2 x31 + x3 x21 + u1x1
3
1
6
4
3
2
x1 + x2 x1 + x3 x1 + x4 x1 + u1x1 4
1
3
3
x1 + x2 + x3 x1 x2
3
2
;u1 x1 ; u2x2
x31 ; x1 x22 + x3 (x21 + x22 )
3
2
;u1 x1 ; u2x2
Damit konnen wir die Hauptaussage dieses Kapitels treen:
Zwei Fitnesslandschaften (aquivalent mittels Denition 4 und 10) sind bzgl.
der Darwin-Strategie gleich, falls sie aus genau denselben Katastrophen in
Tabelle 5.2 bestehen. Evolutionare Algorithmen lassen sich durch die Katastrophentheorie bzgl. ihres Verhaltens klassizieren.
Um eine Vorstellung von der Form der Fitnessfunktionen zu bekommen, wollen wir noch kurz auf diese Katastrophen eingehen. In Abbildung 5.3 sind
5.3. DIE AUSDEHNUNG DER KLASSIFIKATION
117
die einzelnen Falle dargestellt, wobei die Darstellung der hoherdimensionalen
Katastrophen (ab Dimension 3) durch Projektion auf 2 Dimensionen erhalten wurde. Die ersten beiden Falle (Falte und Spitze) stellen die einfachste
Form einer Fitnessfunktion dar, bei der die Strategie eine Barriere uberspringen mu. Diese Art von Problemen tritt in vielen Fallen am haugsten auf
(z.B. Rastriginfunktion). Desweiteren konnen naturlich Probleme existieren,
welche die lokal arbeitende Strategie "tauschen\. So folgt der Algorithmus in
den meisten Fallen der Richtung, die die grote Verbesserung verspricht. Das
kann aber genau die falsche Richtung sein, wenn wir das globale Optimum
nden wollen. In diese zweite Klasse von Problemen fallen die anderen Falle.
Sie reprasentieren die einfachsten Moglichkeiten fur solche "irrefuhrenden\
Probleme.
5.3 Die Ausdehnung der Klassikation
Die im vorherigen Abschnitt beschriebene Klassikation wurde nur fur den
Fall einer Darwin-Strategie dargelegt. An dieser Stelle konnen wir uns naturlich
fragen, ob eine Ausdehnung auf die anderen Strategien moglich ist. In diesem
Abschnitt werden wir zeigen, in welchem Sinne diese Frage zu beantworten
ist.
Dazu erinnern wir an den Abschnitt 2.6, wo die einheitliche Beschreibung
aller Strategien auf der Basis von Gleichung (2.49) ausgefuhrt wurde. Dabei erhielten wir explizite Formeln fur die Transformation der Metrik sowie
der Fitnessfunktion. Die Frage ist nun, ob wir diese Ergebnisse verwenden konnen, um die Klassikation auch auf diese Falle auszudehnen. Dazu
schauen wir noch einmal auf den Beweis. Dort wurde das Problem in viele Teilprobleme aufgeteilt, deren gegenseitige Beziehung untersucht wurde.
Das Problem der verschiedenen Metrik kann einfach durch die Tatsache gelost
werden, da jede Metrik zumindest lokal diagonal und konstant ist. Deshalb
erhalten wir lokal wieder eine quadratische Form uber der Weyl-Algebra als
Reprasentant des Operators (2.50). Auch der Vorfaktor vor der Losung der
Gleichung (2.49) stort die weitere Argumentation nicht. Als einziger Unterschied bleibt nur die Transformation der Fitnessfunktion. Dadurch entstand
in allen Fallen wieder eine Gleichung vom Typ einer Darwin-Strategie, fur
die die Klassikation gilt. Damit erhalten wir aber genau die Regel, um
die obige Klassikation auf alle Strategien auszudehnen. Betrachten wir als
118
KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN
4
2
0
-2
-4
-2
-3
-1
-2
-1
0
0
y
x
1
1
2
3
Falte
2
3
2
1
0
5
-1
4
3
2
-2
-3
1
-2
-1
Spitze
0
x
y
0
-1
-2
2 -3
1
4
2
0
5
-2
4
3
2
1
-4
-2
-1
0
x
0
-1
-2
-3
2
1
Schwalbenschwanz
15
10
5
0
-5
-10
-15
5
4
3
2
1
y
0
-1
-2
-3 -2
-1
0
x
1
2
y
5.3. DIE AUSDEHNUNG DER KLASSIFIKATION
119
Beispiel die transformierte Fitness der Boltzmann-Strategie (2.10)
2
V (~x) = 4 DrF rF ; 2 D4F :
Dieser Ausdruck mu nun gleich einer Katastrophe sein. Durch Losung der
Dierentialgleichung erhalten wir die Fitnessfunktion als Losung. So kann
fur jede Strategie eine Liste von solchen Normalformen aufgestellt werden.
Eine Besonderheit sei hier noch angemerkt. Bei den adaptiven Strategien
war zusatzlich eine Transformation der Metrik erforderlich. Die Katastrophen gehen aber von einer euklidischen Metrik aus. Deshalb mussen die
Katastrophen in diesem Fall auf die neue Metrik transformiert werden und
dann gleich der transformierten Fitness gesetzt werden.
120
KAPITEL 5. DIE KLASSIFIKATION DER STRATEGIEN
Kapitel 6
Variation der
Mutationsverteilung
\Gibst du auf die kleinen Dinge nicht acht,
wirst du Groeres verlieren. "
Menander
6.1 Einfuhrung
In den bisherigen Algorithmen zur Simulation von Evolutionaren Algorithmen mute immer eine Nebenbedingung eingebaut werden, welche die Diusionsnahrerung sicherstellt. Wenn man diese Bedingung fallenlat, so wechselt auch die Beschreibung des Algorithmus'. Wir erhalten anstatt einer partiellen Dierentialgleichung 2.Ordnung vom parabolischen Typ eine IntegroDierentialgleichung, die die kontinuierliche Verallgemeinerung der Mastergleichung darstellt.
Als erstes betrachten wir einen Proze der Form
x(t + t) = x(t) + ;
(6.1)
wobei eine Zufallszahl, die entsprechend der Verteilung N (x) gezogen wurde, ist. Diesen Zufallsproze wollen wir im folgenden so wahlen, da wir den
Proze "Mutation\ erhalten. Da Mutationen ungerichtet sind, mu die Verteilung isotrop sein, d.h. fur den Prozesse (6.1) x = x(t) ! x(t + t) = x0
erhalten wir als U bergangsrate den symmetrischen Ausdruck W (x; x0 ) =
121
122
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
W (x ; x0) = N (jx ; x0 j) = W (x0; x). Die Beschreibung dieses Prozesse
im Bild der Verteilungsfunktion P (x; t) fuhrt entsprechend [4] zur Mastergleichung
@ P (x; t) = Z W (x ; x0 )(P (x0; t) ; P (x; t))dx0 :
(6.2)
@t
Die Losung P (x; t) einer solchen Gleichung kann auf zweierlei Art erfolgen.
Als erstes erhalten wir durch eine Laplace-Transformation der Zeitvariablen
eine inhomogene Fredholmsche Integralgleichung 2.Art
Z
sP~ (x; s) ; P (x; 0) = W (x ; x0 )(P~ (x0 ; s) ; P~ (x; s))dx0 ; (6.3)
wobei P~ (x; s) die transformierte Verteilung bezeichnet. Andererseits wird
durch eine Fourier-Transformation der x-Variablen die Mastergleichung in
eine gewohnliche Dierentialgleichung umgewandelt. Um dieses Resultat
herzuleiten, bemerken wir, da wir die Gleichung (6.2) auch in die Form
@ P (x; t) = (W P )(x; t) ; P (x; t) Z W (x)dx
(6.4)
@t
unter zu Hilfenahme der Faltung
Z
(W P )(x; t) = W (x ; x0)(P (x0; t)dx0
umschreiben konnen. Bezeichnen wir die Fouriertransformierte einer Funktion F (x) mit F^ (k), so erhalten wir
@ P^ (k; t) = W^ (k)P^ (k; t) ; W P^ (k; t)
(6.5)
@t
R
mit W = W (x)dx und daraus die Losung
P^ (k; t) = P^ (k; 0) exp (W^ (k) ; W )t :
(6.6)
Das Problem bei diesem Ansatz besteht nur darin, da wir die Rucktransformation nden mussen.
Bevor wir uns diesen Rechnungen zuwenden wollen, werden wir noch
den umgekehrten Fall behandeln. Dazu geben wir uns eine Verteilungsfunktion P (x; t) vor und fragen nach der U bergangsrate W (x). Durch die
Fourier-Transformation der Mastergleichung konnen wird dieses Problem auf

6.1. EINFUHRUNG
123
einfache Art und Weise losen. Sei F ( ) die Bezeichnung fur die FourierTransformation, so erhalten wir
0 @ 1
F P
W (x) = F ;1 @ F (@tP ) A (x)
(6.7)
als Losung des Problems. Betrachten wir nun noch zwei Beispiele zur Illustration. Beim ersten Beispiel geben wir uns die Gau-Verteilung
2 !
1
x
P (x; t) = p
exp ; 4Dt
4Dt
vor und erhalten fur die Fourier-Transformierte der U bergangsrate
F (W )(k) = ;Dk2 :
Durch die Rucktransformation
@ 2 (x)
W (x) = D @x
2
dieses Ausdrucks erhalten wir fur die Mastergleichung
@ P (x; t) = D @ 2 P (x; t) :
@t
@x2
Im zweiten Beispiel wollen wir uns der Cauchy-Verteilung
1
P (x; t) = t x2 +
t2
zuwenden. Dieselbe oben beschriebene Prozedur fuhrt uns auf die Mastergleichung
@ P (x; t) = Z P (x0; t) ; P (x; t) dx0 ;
@t
(x ; x0 )2
die nun eine singulare Integralgleichung geworden ist. Die Auswahl der Beispiele ist kein Zufall, da beide Verteilungen eine groe Rolle in der Theorie
stochastischer Prozesse spielen. Nach dem Satz von Moivre-Laplace [101],
der auch als zentraler Grenzwertsatz bezeichnet wird, ist die Grenzverteilung
einer Folge von zufalligen Ereignissen unter bestimmten Voraussetzungen die
124
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
Gau-Verteilung. Levy erweiterte 1925 [102] die Grenzwertsatze auch auf
Verteilungen, deren Momente nicht zu existieren brauchen. Er betrachtete
eine Folge von Zufallsvariablen, die einer bestimmten Verteilung genugen.
Der Grenzwert dieser Folge bzw. die Grenzverteilung existiert wiederum nur
unter bestimmten Bedingungen. Levy mute dabei den Begri der stabilen
Verteilung einfuhren. Die Gau- und die Cauchy-Verteilung sind stabile Verteilungen. Desweiteren gehort jede stabile Verteilung zum "Anziehungsbereich\ der Gau- oder Cauchy-Verteilung, d.h., eine Folge dieser Verteilungen
konvergiert gegen die Gau- oder Cauchy-Verteilung. Vom Standpunkt der
Grenzverteilungen her gesehen, gibt es also nur zwei Moglichkeiten. Nach
diesem kleinen Exkurs in die Theorie stochastischer Prozesse wollen wir uns
nun der Losung der Mastergleichung unter Einbeziehung der Prozesse "Reproduktion\ und "Selektion\ zuwenden.
6.2 Gau-verteilte Mutationen
Im folgenden wollen wir annehmen, da die Mutationen durch Gau-verteilte
U bergange gegeben sind. Die Unabhangigkeit der Mutation von den Prozessen Reproduktion und Selektion bzgl. einer Fitness F (x) erlaubt die Addition
der entsprechenden Raten zur Mutationsrate. Wir wollen an dieser Stelle auf
die Herleitung der Gleichung verzichten, da sie analog zu den Rechnungen in
Kapitel 2 ist. Als Ergebnis erhalten wir
@ P (x; t) = (hF i ; F (x))P (x; t) + Z N (x ; x0 ; )(P (x0; t) ; P (x; t))dx0(6.8)
@t
mit
2!
x
1
N (x; ) = p exp ; 42
4
als Gau-Verteilung. Durch denselben Ansatz (2.25) wie fur die DarwinStrategie konnen wir wiederum den Term hF i eliminieren und durch die
Vorschrift nach Normerhaltung fur die Losung P (x; t) ersetzen. Der Vorteil bei der Beschreibung durch Integralgleichungen besteht darin, da der
Integraloperator bei einem Kern mit hochstens abzahlbar vielen Unstetigkeitsstellen immer kompakt ist [76, 79]. Diese Eigenschaft erleichtert die
Untersuchungen sehr stark. Aufgrund der Isotropie der Mutationen ist der
6.2. GAUSS-VERTEILTE MUTATIONEN
125
Kern des Integraloperators in (6.2) symmetrisch, was zur Selbstadjungiertheit des Integraloperators fuhrt. Aus der Theorie solcher Operatoren folgt
dann, da das Spektrum dieses Operators immer diskret ist.
Bevor wir zur Berechnung einiger konkreter Beispiele kommen, wollen wir
einige Eigenschaften der Integralgleichung
@ P (x; t) = ;F (x)P (x; t) + Z W (x ; x0 )(P (x0; t) ; P (x; t))dx0 (6.9)
@t
angeben, wobei der Ansatz (2.25) zur Linearisierung schon benutzt wurde.
Zuerst verwenden wir einen Separationsansatz fur den Raum- und Zeitanteil
der Funktion P (x; t), um eine Eigenwertgleichung fur den Integraloperator
zu erhalten. Sei der entsprechende Eigenwert, so konnen wir die Eigenwertgleichung durch die Transformation
(6.10)
K (x; y) = a1 F (x) + RWW(x(x;;y)y)dy ; in eine Fredholmsche Integralgleichung 2.Art
Z
P (x) = a K (x; y)P (y) dy
(6.11)
umwandeln. Fredholm hat solche Gleichungen auf ein Problem der linearen Algebra zuruckgefuhrt [103]. Aufbauend auf diesen Ergebnissen konnte
Hilbert eine Losungstheorie fur lineare Integralgleichungen aufstellen [104].
Die Analogie mit der Algebra ist exemplarisch fur die daraus entstandene
Funktionalanalysis geworden. Die Methode zur Losung der Gleichung (6.11)
baut auf den Begri des iterierten Kerns auf, der gema
Z
K1(x; y) = K (x; y)
Kn+1(x; y) = Kn(x; z)K (z; y) dz (6.12)
deniert ist. Die Gleichung (6.11) lat sich nun als Iterationsgleichung
Z
Pn(x) = a Kn(x; y)Pn;1(y) dy
auassen. Als Startverteilung fur die Iteration wahlen wir die Delta-Funktion
P0(x) = (x ; x0 ). Dann erhalten wir die Losung
Pn(x) = an Kn(x; x0) :
(6.13)
126
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
Die Theorie von Fredholm und Hilbert sichert, da diese Iteration konvergiert, d.h. gegen die Losung von (6.11) strebt. Als weitere Information
enthalten die iterierten Kerne den ersten (und groten) Eigenwert, der durch
eine Grenzwertbildung gewonnen werden kann. Dazu denieren wir die Groe
Z
vn = Kn2 (x; y) dx dy
und erhalten
vn;1 :
a21 = nlim
!1 v
(6.14)
n
Fur die zweite Moglichkeit einer naherungsweisen Bestimmung
von a1 geben
R
2
wir uns eine beliebige, stetige Funktion u(x) mit u (x)dx = 1 vor und
bekommen die Ungleichung
Z
K (x; y)u(x)u(y) dx dy 1 :
(6.15)
ja1j
Naturlich gibt es die Moglichkeit, die Gleichung (6.9) auf andere Art zu
losen. Als eine Moglichkeit bietet sich die Fourier-Transformation an. Ist die
Fitnessfunktion ein Polynom, so erhalten wir eine Dierentialgleichung im
Fourier-Raum, die aber meist viel schwieriger als das ursprungliche Problem
ist. Daher werden wir bis auf eine Ausnahme im folgenden nur die Methode
des iterierten Kerns benutzen.
Beginnen wir mit der einfachsten Fitnessfunktion F (x) = bx2 , dann erhalten wir durch die Benutzung des Ansatzes (2.25) die Gleichung
@ y(x; t) = (;bx2 )y(x; t) + Z N (x ; x0 ; )(y(x0; t) ; y(x; t))dx0 ; (6.16)
@t
woraus wir den Kern K (x; y)
exp ; (x4;y)
1
p
K (x; y) =
(6.17)
4 bx2 + 1 ; berechnen. Der Parameter a wird im folgenden weggelassen, da er aus der
Losung (6.13) immer herausfallt. Wir beginnen nun damit, die erste Ordnung
zu berechnen, was uns auf das Integral
2
2
(x +y ) Z1 z ;z(x+y) exp
; 4
exp ; 2
1
K2 (x; y) = 4
2 bx2 + 1 ; 2 + 1 ; dz
bz
;1
2
2
2
2
2
(6.18)
6.2. GAUSS-VERTEILTE MUTATIONEN
127
fuhrt. Eine Entwicklung des Integrals um den Punkt x+y sowie die gliedweise
Integration fuhrt auf den Ausdruck
0
0s
11
Z1 exp ; z ;2z(x+y) 2!
e
j
1
;
j
(
x
+
y
)
@
@
A
A
exp
;
2 + 1 ; dz qj1 ; j2b 2 1 ; erf
2
4
bz
2
b
24
;1
2
2
welcher im Bereich jx + yj < 7 in guter Naherung das Integral approximiert.
Bis auf eine kleine Umnormierung der Vorfaktoren kommt qualitativ derselbe
Kern heraus. Damit erhalten wir nach jedem Rekursionsschritt bis auf Konstanten denselben Ausdruck. Daraus konnen wir schlieen, da das Ergebnis
eine Gau-Verteilung mit einem -abhangigen Maximum ist. Die stationare
Verteilung ( = 0) konzentriert sich um das Minimum x = 0. Bevor wir zum
nachsten Beispiel kommen, wollen wir uns die Zeitabhangigkeit der Losung
anschauen. Dazu wenden wir eine Laplace-Transformation bzgl. der Zeit
t auf die Gleichung (6.9) an. Bezeichne P~ (x; s) die Transformierte, dann
erhalten wir die Gleichung
Z
P~ (x; s) = f (x; s) + K (x; y; s)P~ (y; s) dy
mit
(6.19)
f (x; s) = F (xP)(+x; 10)+ s ;
(x ; y) :
K (x; y; s) = FW
(x) + s + 1
Auf genau dieselbe Weise erhalten wir durch eine Rekursion die Losung
1
1 Z
X
X
P~ (x; s) = f (x; s) + H~ (n; x; s) = f (x; s) +
Kn(x; y; s)f (y; s) dy(6.20)
n=1
n=1
mit dem iterierten Kern Kn. Wegen der Additivitat der Laplace-Transformation
konnen wir jedes Glied der Reihe extra behandeln. Fur den ersten Term erhalten wir
f (x; s) ;! f (x; t) = P (x; 0) exp(;(F (x) + 1)t) :
(6.21)
Zur Berechnung der weiteren Terme benotigen wir naturlich die konkreten
Ausdrucke fur K (x; y; s) und f (x; s). Fur unser Beispiel F (x) = bx2 erhalten
128
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
wir in Bezug auf die Anfangsverteilung P (x; 0) = (x ; x0) fur die ersten
beiden Terme
P (x; t) (x ; x0 ) exp(;(bx2 + 1)t) + tN (x ; x0 ) exp(;(bx2 + 1)t) :(6.22)
Die Anfangsverteilung wird also exponentiell mit der Zeit abgebaut. Die
Laplace-Transformierte des Integrals (6.18) sowie die Iteration desselben, ergeben naherungsweise fur das n-te Glied der Losung
n x0 )2 !
(
x
;
t
n=
2
;
3
=
2
2
H (n; x; t) = t
exp ;(bx + 1)t ;
(6.23)
22
wobei n > 1 ist. Mit fortschreitender Zeit konvergiert jedes Glied der Reihe
gegen eine Verteilung um den Punkt x = 0.
Als ein zweites Beispiel betrachten wir den Doppeltopf F (x) = x4 ; x3 ;
x2 . Da wir die Methode des iterierten Kerns anwenden mussen, spielt es
naturlich keine Rolle, wie kompliziert die Fitnessfunktion ist. Wir konzentrieren uns auf die zeitabhangige Losung und betrachten dazu wieder die
Laplace-Transformierte der Gleichung (6.9) mit dem Kern
(x;y) exp
;
K (x; y; s) = p 1 s + x4 ; x3 4; x2 + 1 :
(6.24)
4
Auch dieses Problem ist einer naherungsweisen Losung zuganglich und wir
erhalten fur den n-ten iterierten Kern
exp(;(x ; y)2=2n)
Kn(x; y; s) ((x4 ; x3 ; x2 )2 + s)(((
n
x ; y)4 ; (x ; y)3 ; (x ; y)2)2 + s)(6.25)
woraus nach der Rucktransformation
;(x ; y)2=2n)
Kn(x; y; t) (((x ; y)4 ; (x ; exp(
(6.26)
y)3 ; (x ; y)2)2 ; (x4 ; x3 ; x2 )2)n
" nX
;1
4
3
22
4
3
22kk
1 ; (((x ; y) ; (x ; y) ; (x ;k! y) ) ; (x ; x ; x ) ) t
k=0
i
exp(;((x ; y)4 ; (x ; y)3 ; (x ; y)2)2 t)
wird. Um eine Vorstellung von der Losung zu bekommen, haben wir fur
verschiedene Zeitpunkte die Kurven in Abbildung 6.1 dargestellt. Wie wir
am Kurvenverlauf erkennen konnen, uberspringt die Strategie leicht die Barriere. Die Beschrankung der Schrittweite auf die Diusionsnaherung ist also
eine Ursache fur die Probleme der Darwin-Strategie beim U berspringen einer
Barriere.
2
2
6.3. CAUCHY-VERTEILTE MUTATIONEN
129
2.0
Verteilung P
1.0
0.0
Fitness
t=1
t=2
t=3
-1.0
-2.0
-1.5
-1.0
-0.5
0.0
0.5
Phaenotyp x
1.0
1.5
Abbildung 6.1: Losung fur die Gau-verteilten Schritten im Falle des Doppeltopfes
6.3 Cauchy-verteilte Mutationen
Im Gegensatz zum vorherigen Abschnitt werden wir in diesem Abschnitt Eigenschaften einer Darwin-Strategie kennenlernen, die anders geartet sind, als
fur Gausche Mutationen. Neben diesen theoretischen Ausarbeitungen wurden Simulationen durchgefuhrt, die in [105] zu nden sind. Sie ergaben in
einem groen Parameterbereich eine deutliche Beschleunigung des Algorithmus.
Die Gleichung zur Beschreibung der Dynamik von P (x; t) ist von der
gleichen Struktur wie (6.8). Wahlen wir die U bergangsraten als CauchyVerteilung
W (x) = x2 +1 2
(6.27)
mit der Breite , so erhalten wir
@ P (x; t) = (hF i ; F (x))P (x; t) + Z P (x0; t) ; P (x; t) dx0 : (6.28)
@t
(x ; x0 )2 + 2
Es ist klar, da auch hier der Ansatz (2.25) zur Linearisierung der Gleichung
verwendet werden kann. Die Eigenschaften der Integralgleichung bleiben fur
130
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
diesen Fall dieselben wie bei den Gau-verteilten Mutationen. Deshalb wollen
wir sofort mit der Berechnung des konkreten Problems F (x) = ax2 beginnen.
Dabei werden wir die Losung auf zwei Wegen erhalten: durch eine Fouriertransformation der Integralgleichung und Losung der Dierentialgleichung
im Fourier-Raum sowie durch die Methode des iterierten Kerns.
Mit dem Ansatz (2.25) erhalten wir die Gleichung
@ y(x; t) = (;ax2 )y(x; t) + Z y(x0; t) ; y(x; t) dx0
(6.29)
@t
(x ; x0 )2 + 2
und nach der Fouriertransformation y~(k; t) = F (y)(k; t)
@ y~(k; t) = a @ 2 y~(k; t) + exp(;k)~y(k; t) ; y~(k; t) :
(6.30)
@t
@k2
Die Losung dieser Gleichung wird entsprechend der im Kapitel 2 beschriebenen Prozedur ermittelt. Als Ergebnis erhalten wir
!
X
2
y(k; t) = exp(; t)J p exp(;k=2)
(6.31)
mit = (=2)2 ; = und J ( ) als Besselfunktion. Die Rucktransformation liefert das Ergebnis
y(x; t) =
X
exp(; t)R (x)
mit
R (x) = <
(3)ix= p
(6.32)
!
1
(=2 + ix=) :
(6.33)
Im Gegensatz zur Darwin-Strategie mit kleinen Schrittweiten (2.17) erhalten
wir ein quadratisches Spektrum, d.h., die Cauchy-verteilten Schrittweiten
nden schneller das Optimum. Diese Tatsache ist nicht weiter erstaunlich,
da die Wahrscheinlichkeit fur einen groen Schritt viel groer ist als bei der
Darwin-Strategie (2.17). Schaut man auf die ersten Eigenfunktionen (siehe
Abbildung 6.2), so sehen wir leicht, da diese Funktionen auch viel starker
oszillieren als die entsprechenden Eigenfunktionen (Hermitesche Polynome)
der Losung (B.1). Nach dieser Analyse des Eigenwertproblems wollen wir
uns nun der Losung zuwenden, die mit der Methode des iterierten Kerns
6.3. CAUCHY-VERTEILTE MUTATIONEN
131
Verteilung P
150.0
λ=4
λ=1
λ=0
100.0
50.0
0.0
-50.0
-100.0
-3.0
-2.0
-1.0
0.0
1.0
Phaenotyp x
2.0
3.0
Abbildung 6.2: Darstellung der Eigenfunktion fur die Fitness F (x) = ;x2
und Cauchy-verteilten Mutationen
132
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
erhalten werden kann. Dabei wollen wir uns sofort auf den zeitabhangigen
Fall konzentrieren. Fur den Kern der Integralgleichung (6.19) ergibt sich
(6.34)
K (x; y; s) = (x ; y1)2 + 2 bx2 +11 + s :
Das Problem der Iteration des Kerns fuhrt uns auf die Berechnung des Integrals
Z1
2
1
1
K2(x; y; s) = 2 bx2 + 1 + s ((x ; z)2 + 2dz
2 + 2 ) bz 2 + 1 + s :
)((
y
;
z
)
;1
Diese Art von Integralen kann sehr gut mit dem Residuenkalkul behandelt
werden, da die komplexe Erweiterung des Integranden eine in der oberen
Halbebene H = f z 2 C j =z > 0 g meromorphe Funktion darstellt. Wir
denieren die meromorphe Funktion
h(z) = h 1(z) = ((x ; z)2 + 2)((y ; 1z)2 + 2 )(bz2 + 1 + s) ; (6.35)
1
wobei z 2 C und b; c > 0 ist. Nach dem Residuensatz mu nun gelten
1 Z h(z) dz = Res h(z) = 1
(6.36)
dh (z )
z z
2i H
0
=z>
dz
= 0
0
2
mit den Nullstellen
q
z0 = i (1 + s)=b ; ;x + i ; ;y + i
von h1 (z) in H . Nun stellen wir die obere Halbebene H durch ein neues
Gebiet D dar, das in Abbildung 6.3 dargestellt ist. Fur das Integral (6.36)
ergibt sich dann
0
1
R
Z
Z
Z
1 h(z) dz = lim B 1
1 h(z) dz C : (6.37)
h
(
z
)
dz
+
@
A
R!1 2
2i H
2
i
;R
(R)
Das erste Integral lat sich durch den Ausdruck
Z
h(z) dz (bR2 + 1 + 1s)(R2 + 2 )2
(R)
6.3. CAUCHY-VERTEILTE MUTATIONEN
133
Im z
γ(R)
-R
D
z0
R
Re z
Abbildung 6.3: Darstellung der Integrationswege in der oberen Halbebene H
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
134
abschatzen, welcher fur R ! 1 gegen 0 strebt. Damit erhalten wir die
geschlossene Formel1
Z1
;1
dz
dz = 2i Res
z=z h(z ) : (6.38)
((x ; z)2 + 2)((y ; z)2 + 2 )(bz2 + 1 + s)
=z>00
Naturlich hatten wir auch den alternativen Weg einer Partialbruchzerlegung
wahlen konnen, welcher aber langwieriger ist. Die Auswertung des entsprechenden Ausdrucks sowie die Rucktransformation sind relativ lang und wurden teilweise numerisch durchgefuhrt. Deshalb wollen wir uns nur auf die
Ergebnisse konzentrieren. In Abbildung 6.4 sind die entsprechenden genaherten Verteilungsfunktionen fur verschiedene Zeitpunkte dargestellt. Der Ver2.0
1.8
1.6
Verteilung P
1.4
1.2
1.0
0.8
stationaer
t=10
t=3
t=1
0.6
0.4
0.2
0.0
−2.0
−1.5
−1.0
−0.5
0.0
0.5
1.0
1.5
2.0
Phaenotyp x
Abbildung 6.4: zeitabhangige Losung fur die Parabel fur Cauchy-verteilte
Mutationen
Es wurde implizit vorausgesetzt, da die Formel gleichmaig stetig vom Winkel arg(z )
abhangt. Genau dies ist fur die Berechnung der Gauschen Integrale nicht erfullt.
1
6.3. CAUCHY-VERTEILTE MUTATIONEN
135
lauf ist nicht sehr uberraschend und erinnert stark an die Kurven bei Gauverteilten Mutationen. Die Geschwindigkeit ist auch nicht groer als bei den
anderen Mutationsverteilungen, was durch die Einfachheit des Problems zu
erklaren ist.
Ein wesentlich interessanteres Problem ist dagegen der Doppeltopf. Das
Verfahren zur Berechnung dieser genaherten zeitabhangigen Verteilung bleibt
dasselbe, nur die Ausdrucke werden noch komplizierter. Das Problem reduziert sich auf die Betrachtung der Laplace-Transformierten des Integralkerns
K (x; y; s) = (x ; y1)2 + 2 x4 ; x3 ;1x2 + 1 + s :
(6.39)
und die Berechnung des iterierten Kerns
2 = 2 Z1
1
K2 (x; y; s) = bx2 + 1 + s ((x ; z)2 + 2dz
2
2
4
3
2+1+s:
)((
y
;
z
)
+
)
z
;
z
;
z
;1
Die anschlieende Laplace-Rucktransformation von s nach t liefert das entsprechende Ergebnis fur die genaherte Verteilungsfunktion. In Abbildung 6.5
sind die genaherten Verteilungsfunktionen dargestellt. Hier sehen wir einen
entscheidenden Unterschied zu den Gau-verteilten Mutationen. Wahrend
die Verteilung im Falle von Gau entsprechend Abbildung 6.1 in allen Zwischenschritten nur eine bimodale Verteilungsfunktion besitzt, zeigen die Cauchyverteilten Mutationen ein komplexeres Verhalten. In einem Zwischenschritt
besitzt die Verteilung 3 Maxima, was im Gegensatz zur Strategie mit Gauverteilten Mutationen steht. Die Erklarung lat sich einfach dadurch geben,
da die Cauchy-Verteilung lange Sprunge starker bevorzugt als die GauVerteilung. Deshalb ist die Wahrscheinlichkeit, einen Sucher in der Umgebung der Barriere zu nden, viel groer. Damit erscheint es gunstig, in stark
zerklufteten Fitnesslandschaften groe Schrittweiten zu verwenden. Als weiteren Unterschied zu den Gau-verteilten Mutationen konnen wir aus der Abbildung 6.5 entnehmen, da die stationare Verteilung eine unimodale Funktion um das globale Optimum bildet. Im Gegensatz dazu zeigen die anderen
Strategien ein davon verschiedenes Verhalten, da sie eine unimodale Funktion als stationare Verteilung besitzen. Auf die weitere Beziehung zwischen
der Struktur der Fitnesslandschaft und der Wahl der Mutationsverteilung
soll an dieser Stelle nicht eingegangen werden.
136
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
1.4
Verteilung P
1.2
1.0
stationaer
t=3
t=10
0.8
0.6
0.4
0.2
0.0
-2.0 -1.5 -1.0 -0.5 0.0 0.5
Phaenotyp x
1.0
1.5
2.0
Abbildung 6.5: zeitabhangige Losung fur den Doppeltopf x4 ; x3 ; x2 fur
Cauchy-verteilte Mutationen
6.4 Einheitliche Beschreibung
Bisher haben wir nur Strategien mit Darwin-Selektion und anderen Mutationsverteilungen studiert. Naturlich mu es auch moglich sein, alle anderen
Strategien in eine Integro-Dierentialgleichung einzubetten.
Ausgangspunkt fur eine solche Betrachtung bilden die Artikel [106, 107]
von Lebowitz und Bergmann. Dort wurde ein Hamiltonsches System
im Warmebad betrachtet. Durch die Ankopplung des Warmebades gibt
es U bergange innerhalb des Systems, die zu einer Veranderung der Verteilungsfunktion, die auf dem Phasenraum deniert ist, fuhren. Die LiouvilleGleichung fur die Verteilungsfunktion wird zu einer Integro-Dierentialgleichung.
In den Artikeln wurde untersucht, wie die durch das Bad verursachten U bergange
des einen Zustandes in einen anderen Zustand zu wahlen sind, damit eine
stationare Verteilung existiert, die der kanonische Verteilung entspricht. Sei
E (x) die Energie des Zustands x und T die Temperatur des Bades, so ist die
U bergangsrate K (x; x0 ) vom Zustand x in den Zustand x0 durch
K (x; x0 ) = exp(;E (x)=T )L(x; x0 )
mit dem symmetrischen Kern L(x; x0 ) = L(x0 ; x) gegeben. Fur ein evoluti-
6.4. EINHEITLICHE BESCHREIBUNG
137
onares System besitzt die Fitnessfunktion die Eigenschaften einer Energie,
wahrend das Warmebad die Mutationen kennzeichnet. Daraus erhalten wir
die Gleichung
@ P (x; t) = Z (exp(;F (x0))P (x0; t) ; exp(;F (x))P (x; t))L(x; x0 )dx(6.40)
0
@t
mit als reziproker Temperatur, woraus sich entsprechend Kapitel 2 im
Grenzfall kleiner Schrittweiten die Boltzmann-Strategie (2.6) ergibt. Die
Verallgemeinerung auf den Fall einer zusatzlichen Reproduktion und Selektion liefert den Ausdruck
@ P (x; t) = Z (exp(;F (x0 ))P (x0; t) ; exp(;F (x))P (x; t))L(x; x0 )dx0
@t
+ (hF i ; F (x))P (x; t) ;
welcher im selben Grenzfall auf die Gemischte Strategie (2.35) fuhrt. Auch
der Fall einer Schrittweitensteuerung bereitet bezuglich der Gleichungen keine Probleme. Sei der Schrittweitenparameter, den wir als zusatzliche Koordinate zu den Phanotypkoordinaten hinzunehmen, dann fuhrt dies auf eine
Gleichung der Form
@ P (x; ; t) = Z (P (x0; ; t) ; P (x; ; t))L(x; x0 ; )dx0 + (hF i ; F (x))P (x; ; t)
@t
Z
+ (P (x; 0; t) ; P (x; ; t))L(; 0 ) d0 ;
was die adaptive Darwin-Strategie (2.46) ergibt. Auf gleiche Weise erhalten
wir das Analogon zur Selfannealing Strategie (2.48)
@ P (x; ; t) = Z (exp(;F (x0 ))P (x0; ; t) ; exp(;F (x))P (x; ; t))L(x; x0)dx0
@t
Z
(P (x; 0; t) ; P (x; ; t))L(; 0) d0 + (hF i ; F (x))P (x; ; t) :
Alle aufgefuhrten Integro-Dierentialgleichungen zeigen aufgrund ihrer ahnlichen Struktur auch ein ahnliches Verhalten. So sind alle Integraloperatoren
kompakt, woraus wir ein diskretes Spektrum erhalten. Desweiteren sind die
Gleichungen linear und fuhren damit zu Losungen, die auf einen Hilbertraum
dargestellt werden konnen. In den Losungen der Standardprobleme wie Parabel und Doppeltopf gibt es groe Unterschiede, die sich aus den Eigenschaften
des Integraloperators begrunden lassen.
138
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
Im strengen Sinne widerspricht die Beschreibung Evolutionarer Algorithmen durch Dierentialgleichungen dem Gedanken der Evolution. Die Evolution ist ein globaler Vorgang, der eine globale Kopplung zwischen den Individuen einfuhrt. Damit erscheint es ganz naturlich, da die adaquate Beschreibung der Evolution durch Integralgleichungen zu erfolgen hat. Fuhren wir
neben dieser globalen Kopplung noch eine andere Art der Wechselwirkung
ein, so kommen wir zu nichtlinearen Integralgleichungen. Eine interessante Klasse solcher Integralgleichungen sind die Lotka-Volterra-Systeme.
Leider kann an dieser Stelle nicht weiter auf solche Fragen eingegangen werde.
6.5 Ansatze zur Klassikation
Bevor wir dieses Kapitel beenden, sollen noch ein paar Gedanken zu einer
moglichen Klassikation der Integralgleichungen dargelegt werden, die einen
ahnlichen Charakter wie die Klassikation in Kapitel 4 haben soll. Dazu
stellen wir als erstes fest, da die grundsatzliche Struktur aller vorher beschriebenen Gleichungen durch
@ P (x; t) = ;IP (x; t)
@t
mit dem Integraloperator
Z
IP (x; t) = ; (F ; hF i)P ; (W (x; y)P (y; t) ; W (y; x)P (x; t)) dy
gegeben ist, wobei die Koordinaten einschlielich der Schrittweitenparameter
betrachtet werden. Genauso wie in Kapitel 4 betrachten wir eine Zerlegung
der Fitnessfunktion in berechenbare Probleme. Leider haben wir hier das
Problem, da die Operatoren bzgl. der Zerlegung keine quadratischen Formen uber einer bestimmten Algebra sind. Dadurch wird dieser Fall viel komplizierter als fur Schrodinger-Operatoren. Glucklicherweise gibt es aber eine
Eigenschaft des Operators I , die fur alle relevanten Fitnessfunktionen erfullt
ist. Der Operator I ist ein Fredholm-Operator, d.h. die Raume ker I und
ker I mit I als adjungierten Operator sind endlich-dimensionale Raume.
Die Dierenz beider Dimensionen ist der Index, der invariant unter Storungen mit einem kompakten Operator ist. An dieser Stelle ist zu vermuten, da
diese Eigenschaft wesentlich fur die Klassikation werden wird. Im Kapitel
4 haben wir die Menge der quadratischen Formen uber dem Phanotypraum

6.5. ANSATZE
ZUR KLASSIFIKATION
139
betrachtet. Die stabilen A quivalenzklassen solcher quadratischen Formen
uber einem Ring R korrespondieren zum Witt-Ring W (R), welcher nichts
weiter als die algebraische K-Theorie K0(R) von R ist. Die unterschiedlichen Indizes in der K-Theorie der quadratischen Bundel uber dem Raum B d
hangen mit den dimensionsabhangigen Eigenschaften der Bundel zusammen.
An dieser Stelle sind wir mit Hilfe des Theorems von Swan von der algebraischen K-Theorie zur topologischen K-Theorie gewechselt. Dieses Verfahren
funktioniert im Fall des Integraloperators nicht. Betrachten wir den Integraloperator im anschaulichen Sinne als Folge von Schrodinger-Operatoren
der Form (2.50), so mussen wir uns zur Charakterisierung dieser Folge nicht
auf den Ring R konzentrieren, sondern deren Automorphismen Aut(R) studieren. Eine entsprechende stabile Klassikation dieses Ringes fuhrt uns auf
die K1(R). An dieser Stelle wollen wir explizit betonen, da die K-Theorie
im algebraischen Sinne verstanden wird. Der groe Unterschied zwischen der
topologischen und der algebraischen K-Theorie ist vor allem durch die fehlende Bott-Periodizitat gegeben. Wenn wir also im Falle der Integraloperatoren
in die algebraische K-Theorie gelangen, so bedeutet dies einen Verlust an
Struktur. An dieser Stelle ist aber zu hoen, da eine Ausdehnung der durch
Aut(R) gegebenen lokalen Eigenschaften auf den gesamten Raum B d moglich
ist. Bisher gibt es leider nur Ansatze, aber durch die Entwicklung der simplizialen Homotopietheorie in den letzten Jahren ist eine Losung vielleicht
bald in Sicht.
140
KAPITEL 6. VARIATION DER MUTATIONSVERTEILUNG
Kapitel 7
Zusammenfassung
Im Kapitel 2 geben wir einen U berblick uber alle Evolutionaren Algorithmen
mit der oben beschriebenen Reproduktion und Selektion. Als Mutation haben wir einen Diusionsproze angenommen. Im eigentlichen Sinne zahlt die
zuerst behandelte Boltzmann-Strategie nicht zu den Evolutionaren Strategien, da es im engerem Sinne keine Reproduktion und Selektion gibt. Aufgrund
der ahnlichen Struktur der dynamischen Gleichungen wird sie aber im erweiterten Sinne mit dazugezahlt. Danach fuhren wir die Darwin-Strategie ein,
welche ein klassisches Beispiel fur eine evolutionare Strategie ist. Eine Analyse dieser beiden Strategien hat ein gegenlauges Verhalten beim U berwinden
einer Barriere ergeben. Da dieser Fall eine Standardsituation auf Fitnesslandschaften ist, fuhren wir eine Mischung der Darwin- und Boltzmann-Strategie
ein. Dabei entsteht die Gemischte Strategie, die sich schon in vielen Computerexperimenten bewahrt hat.
In den nachsten beiden Abschnitten behandeln wir die Frage nach einer
Anpassung der Mutationsstarke (aquivalent mit der Schrittweite) und leiten erstmalig die Gleichung fur die Veranderung der Schrittweite bei einer
Darwin-Strategie her. Die Grundidee fur diese adaptive Darwin-Strategie
stammt von Schwefel, der sie in der Folgezeit ausgiebig untersucht hat.
Ein ahnliches Problem tritt auch bei der Boltzmann-Strategie auf, die als
freien Parameter fur die Schrittweite eine reziproke Temperatur besitzt. Eine "Abkuhlung\ fuhrt zu einem Hangenbleiben der Strategie in den lokalen
Minima. Dabei setzen wir voraus, da die Abkuhlung so langsam vor sich
geht, da dabei das globale Minimum gefunden wird. Diese Strategie wird
als "simulated annealing\ bezeichnet. Wie wir uns denken, ist die Wahl der
Abkuhlung das eigentliche Problem. Rose fand einen evolutionaren Ausweg
141
142
KAPITEL 7. ZUSAMMENFASSUNG
aus diesem Dilemma, indem er jedem Individuum der Gemischten Strategie eine Temperatur gab, die auch der Selektion ausgesetzt wurde. Dadurch
konnte die Strategie ihre Abkuhlungskurve selbst nden.
Im letzten Abschnitt dieses Kapitels gehen wir noch der Frage nach einer
einheitlichen Darstellung der dynamischen Gleichung nach. Dabei ergibt
sich eine verallgemeinerte Warmeleitungsgleichung, die auf einem metrischen
Raum deniert ist. Die Wahl der Metrik und Koezienten listen wir fur
alle Strategien auf. Die Bedeutung dieses Ergebnisses liegt in der spateren
Klassikation begrundet.
Den groten Teil der Arbeit bildet das Kapitel 3, welches sich mit dem
Vergleich der Strategien beschaftigt. Dazu fuhren wir verschiedene Mae
zur Messung von Geschwindigkeiten der Strategien ein. Diese Mae bestehen vorrangig aus Kombinationen der Erwartungswerte von Polynomen
der Fitnessfunktion sowie deren zeitliche Ableitungen. Wir behandeln und
berechnen diese Groen anhand von zwei Beispielen: der Parabel und des
Doppeltopfes. Beide Falle stellen zugleich die einfachsten Probleme fur eine
Optimierung dar. Fur die Parabel ist es wichtig, da wir die Geschwindigkeit
der Strategie messen. Die einfachste Groe, die dies beschreibt, ist die zeitliche A nderung des Erwartungswerts der Fitness. Sie ist die Geschwindigkeit
der Strategie auf der Fitnesslandschaft.
Als weitere interessante Groe betrachten wir die Varianz der Verteilungsfunktion der Individuen auf der Fitnesslandschaft. Sie gibt Auskunft uber
die Variabilitat der Individuen bezuglich der Fitness. Diese beiden Groen
werden im Fall der Parabel fur die Boltzmann- und Darwin-Strategie explizit
berechnet. Dabei ergeben sich ahnliche Ergebnisse, die fur diesen Fall nicht
erstaunlich sind, da die Strategie immer dem Gradienten der Fitnessfunktion
folgen.
Das zweite Beispiel ist der Doppeltopf. Hierbei interessiert uns vor allem die Wahrscheinlichkeit, da die Strategie von einem Topf in den anderen
wechselt. Dazu starten wir im lokalen Minimum und versuchen in das globalen Minimum zu gelangen. Die Wahrscheinlichkeit dafur ist durch das
Integral uber die Wahrscheinlichkeitsverteilung1 gegeben. Deren zeitliche
Ableitung lat sich als Strom von Suchern durch die Barriere interpretieren.
Eine Untersuchung dieser Groen fur die Boltzmann-und Darwin-Strategie
erbringt das Ergebnis, da die Boltzmann-Strategie auf achen FitnesslandIn gewissem Sinne stellt diese Groe das 0.Moment bezuglich der Erwartungswerte
der Fitness dar.
1
143
schaften schneller als die Darwin-Strategie ist. Andererseits ist die DarwinStrategie auf stark zerklufteten Landschaften schneller als die BoltzmannStrategie. Das gegenlauge Verhalten beider Strategien beim Problem des
Doppeltopfes legt die Idee der Mischung der Strategien nahe. Nun fragen wir
uns naturlich, ob eine Mischung wirklich den gewunschten Erfolg zeigt. Im
nachsten Abschnitt wird daher erneut der Doppeltopf behandelt. Dabei zeigen wir, da die gemischte Strategie fur fast alle Parametersatze das globale
Minimum ndet. Desweiteren werden Kriterien fur die Wahl des Mischungsparameters angegeben. Im letzten Abschnitt dieses Kapitels beschreiben wir
die Simulationsalgorithmen der Boltzmann- und Darwin-Strategie.
Im Kapitel 4 beschaftigen wir uns mit den mathematischen Eigenschaften von Schrodinger-Operatoren. Dabei steht der Zugang uber das Spektrum
zusammen mit den Eigenschaften des sogenannten Warmeleitungskerns am
Anfang im Mittelpunkt des Interesses. Wir zeigen, da die Geschwindigkeit
der Strategie mit solchen Eigenschaften wie Spektraldichte im Zusammenhang steht. Andererseits ist das Spektrum auch in der Quantenmechanik
anwendbar. Durch die Bestimmung der A nderung der Autokorrelationsfunktion in Bezug auf die Erwartungswerte der Fitness wird uber eine Hierarchie
das gesamte Spektrum aufgebaut. Eine Diskussion des Einusses einer Deformation der Fitnessfunktion auf das Spektrum rundet diesen ersten Abschnitt
ab. Gerade die Diskussion dieser Beziehung zu den Korrelationen sowie die
Diskussion der Deformation der Fitnessfunktion sind neu. Der Hauptteil des
Kapitels ist der Klassikation von Schrodinger-Operatoren durch die Untersuchung der topologischen Eigenschaften des Losungsraums gewidmet.
Zuerst fuhren wir das Problem auf ein algebraisches Problem zuruck, was
gleichzeitig eine Vereinfachung der ursprunglichen Fragestellung bedeutet.
Eine Charakterisierung der A quivalenzklassen ist mit Hilfe der Singularitatstheorie moglich. Dabei treten als kleinste Einheiten der Fitnesslandschaft 6
Singularitaten auf, d.h. falls zwei Fitnesslandschaften die gleiche Zerlegung
der Landschaft bezuglich der Singularitaten besitzen, so verhalten sich die
Strategien ebenfalls gleich. Damit ist ein Zusammenhang zwischen der Struktur der Fitnesslandschaft und dem Verhalten der Strategien gefunden. Als
weitere Anwendung dieses Ergebnisses erhalten wir eine Charakterisierung
des Grundzustandes von Schrodinger-Operatoren.
Aufbauend auf den mathematischen Ergebnissen des letzten Kapitels wird
in Kapitel 5 die Klassikation der Strategien durchgefuhrt. Dabei erhalten
wir das wichtige Resultat, da zwei Fitnesslandschaften, die lokal aus den
gleichen Singularitaten (siehe Tabelle 4.5) bestehen dasselbe Verhalten der
144
KAPITEL 7. ZUSAMMENFASSUNG
Evolutionaren Strategie implizieren. Dieses Ergebnis wurde zuerst nur fur
die Darwin-Strategie erhalten, um es dann auch auf die anderen behandelten
Strategien auszudehnen.
Im letzten Kapitel der Arbeit wird noch der Frage nach der Veranderung
der Mutationsverteilung nachgegangen. Bisher haben wir dafur eine Diffusionsnaherung benutzt, die aber im allgemeinen in Computerexperimenten nicht verwendet wird. Lassen wir diese Einschrankung fallen, so wechselt die Beschreibungsweise von partiellen Dierentialgleichungen zu IntegroDierentialgleichungen. Eine Angabe der Losung ist uber die Methode des
iterierten Kerns moglich. Am Beispiel der Gau- bzw. Cauchy-Verteilung
werden die Standardprobleme Parabel und Doppeltopf studiert. Die Ergebnisse erbrachten fur die Gau-Verteilung ein ahnliches Ergebnis wie fur
die Diusionsnaherung. Dagegen sind die Eigenschaften der Losung fur die
Cauchy-Verteilung im Falle des Doppeltopfes von denen der Gau-Verteilung
verschieden. Eine Darstellung der einheitlichen Beschreibung dieser Strategien sowie ein Ansatz zur Klassikation beenden das letzte Kapitel.
Am Schlu der Arbeit benden sich 4 Anhange, welche die umfangreichen
Rechnungen und Formeln enthalten. Im Anhang A berechnen wir eine wichtige Invariante von Fitnesslandschaften, die uber den Einu von Zwangsbedingungen auf die Optimierung die Aussagen treen. Danach analysieren wir
im Anhang B die Eigenwertprobleme der Boltzmann- und Darwin-Strategie,
um eine alternative Moglichkeit zu den Berechnungen des Kapitels 3 zu erhalten. Der Anhang C ist der vollstandigen Berechnung des Stromes fur den
Fall eines stuckweise quadratischen Doppeltopfes gewidmet. Im Anhang D
schlielich ist eine Zusammenstellung der Formeln fur die Gemischte Strategie am Beispiel der Parabel und des Doppeltopfs zu nden.
Anhang A
Berechnung der Betti-Zahlen
von Fitnesslandschaften
Um die Darstellung der topologischen Eigenschaften von Fitnesslandschaften
in Kapitel 3 zu vervollstandigen, wollen wir an dieser Stelle die Berechnung
der Betti-Zahlen an einigen Beispielen durchfuhren. Dabei konzentrieren
wir uns vor allem auf die Berechnung der Beispiele in Tabelle 3.1. Als Zugang wahlen wir eine axiomatische Betrachtungsweise und klammern die rein
topologischen Aspekte fast vollig aus, da andernfalls der Umfang dieses Anhangs betrachtlich groer ware. Fur eine leicht verstandliche Darstellung des
topologischen Hintergrundes verweisen wir auf das Buch [108].
A.1 Axiomatische Einfuhrung der Homologie
An dieser Stelle wollen wir die Homologietheorie durch eine Reihe von Axiomen einfuhren. Die exakte mathematische Axiomatik benutzt die Kategorientheorie. Aus Grunden der Einfachheit modizieren wir diesen Zugang.
Denition 11 Als Homologietheorie wollen wir eine 1-parametrige Familie
von Vorschriften Hp( ) auassen, die jedem topologischen Raum einen Vektorraum IRn zuordnet. Die Dimension des Vektorraums zur Vorschrift Hp( )
heit p-te Betti-Zahl bp. Weiterhin sollen noch folgende Axiome erfullt sein:
1. Dimensionsaxiom:
H q (Punkt) = 0 und H 0(Punkt) = IR , d.h. jedem Punkt wird die BettiZahl b0 = 1 zugeordnet. Alle anderen Betti-Zahlen verschwinden.
145
ANHANG A. BERECHNUNG DER BETTI-ZAHLEN
146
2. Homotopieaxiom:
Seien X; Y zwei topologische Raume und gibt es weiterhin eine stetige
Abbildung f : X ! Y , so sind alle Betti-Zahlen von X gleich den
Betti-Zahlen von Y .
3. Mayer-Vietoris-Sequenz:
Sei X ein topologischer Raum und seien U; V X oene Teilmengen
mit X = U [ V . Dann ist die Folge
@q
@q
j
j
i
: : : ;!
Hq (U \V ) ;!
Hq (U )Hq (V ) ;!
Hq (X ) ;!
Hq;1(U \V ) ;!
:::
mit j (x) = (x; ;x), i(x; y) = x + y und @ @q+1 = 0 exakt, d.h.
im j = ker i, im i = ker @q und im @q = ker j .
+1
Insbesondere das letzte Axiom ermoglicht uberhaupt erst die explizite Berechnung der Betti-Zahlen. Die folgenden Beispiele sollen dies illustrieren.
A.2 Einfache Einschrankungen
Wir beginnen zuerst mit der Berechnung der Betti-Zahlen des gesamten
Raumes B d . Dieser Raum lat sich mit Hilfe einer stetigen Abbildung auf
einen Punkt abbilden. Nach dem Homotopieaxiom sind Betti-Zahlen bp(B d )
durch die Betti-Zahlen eines Punktes gegeben, d.h.
b0 (B d) = 1 ; bp(B d) = 0 8p 1 :
Nun nehmen wir aus dem Inneren von B d eine abgeschlossene Menge A
heraus. Es ist anschaulich klar, da dabei ein Gebilde entsteht, welches
stetig auf eine Sphare S d;1 abgebildet werden kann. Durch eine Induktion
uber die Dimension d konnen wir mit Hilfe der Mayer-Vietoris-Sequenz die
Betti-Zahlen berechnen. Dazu beginnen wir mit B 1 (eine Strecke endlicher
Lange) und nehmen ein Stuck aus dem Inneren heraus. Dadurch entstehen 2
Strecken bzw. mittels einer stetigen Abbildung 2 Punkte. Das ist genau die
S 0, welche aus den Punkten P1 und P2 zusammengesetzt ist. Wir erhalten
die Mengen P1 [ P2 = S 0 und P1 \ P2 = ;. Da alle hoheren Homologien
verschwinden (siehe Dimensionsaxiom), brauchen wir nur die Teilsequenz fur
H0 zu betrachten. Es gilt
j
@
i
0 = H0(P1 \ P2) ;!
H0(P2 ) H0 (P1) ;!
H0(S 0) ;!
0
0

A.2. EINFACHE EINSCHRANKUNGEN
147
Aus der Exaktheit der Sequenz erhalten wir im j = 0 = ker i und ker @0 =
H0(S 0 ) = im i, d.h. i ist ein Isomorphismus. Es gilt also H0(S 0 ) = H0(P2) H0(P1 ) = IR IR = IR2 . Damit bekommen wir die Betti-Zahlen
b0 (S 0) = 2 ; bp(B d ) = 0 8p 1 :
Als nachstes wenden wir uns dem Fall d = 1 zu. Als U berdeckung des Kreises
nehmen wir 2 Halbkreise U; V mit U [ V = S 1 und U \ V = S 0. Die beiden
Halbkreise sind naturlich nichts weiter als 2 Strecken B 1. Damit erhalten wir
die Mayer-Vietoris-Sequenz
j
@
@
i
0 ;! H1(S 1) ;!
H0(U \ V ) ;!
H0(U ) H0(V ) ;!
H0(S 1 ) ;!
0:
1
0
Es gilt ker @1 = 0, H1 (S 1) = im @1 = ker j , im j = ker i und ker @0 =
H0(S 1 ) = im i. Setzen wir die vorherigen Ergebnisse ein, so erhalten wir
fur die Abbildung j : IR2 ! IR2 mit j ((x; y)) = (x; ;x). Daraus erhalten
wir ker j = IR bzw. H1 (S 1) = IR. Da entsprechend der linearen Algebra
dim ker j + dim im j = dim H0(U \ V ) = 2 sein mu, erhalten wir ker i = IR
und damit auch H0 (S 1) = IR. Deshalb folgt fur die Betti-Zahlen der S 1
b0 (S 1) = b1 (S 1) = 1 ; bp(S 1) = 0 8p 2 :
Auf analoge Weise konnen wir die d-Sphare in eine Nord- und eine Sudhalbkugel zerlegen, d.h. S d = U [ V mit U \ V = S d;1. Mittels einer Induktion uber
die Dimension der Sphare erhalten wir durch eine Mayer-Vietoris-Sequenz die
Betti-Zahlen1
b0 (S d ) = bd (S d) = 1 :
Damit haben wir den Fall einer kompakten Nebenbedingung erschopfend
behandelt.
Sei Lk eine k-dimensionale Hyperache und B d nLk die Schnittmenge.
Diese Hyperache reprasentiert eine Zwangsbedingung, die durch k Groen
parametrisiert wird. Um eine anschauliche Vorstellung von der Menge B dnLk
zu bekommen, betrachten wir den Fall B 3 mit den beiden moglichen Zwangsbedingungen L1 und L2 . Die Menge B 3nL2 stellt einfach die disjunkte Vereinigung von zwei B 3 dar. Damit erhalten wir fur die Betti-Zahlen
b0 (B 3 nL2) = 2 :
1
Im folgenden wollen wir nur die nichtverschwindenden Betti-Zahlen angeben.
ANHANG A. BERECHNUNG DER BETTI-ZAHLEN
148
Fur den anderen Fall B 3nL1 wollen wir wiederum eine stetige Abbildung auf
einen schon bekannten Raum konstruieren. Dazu verdicken wir die herrausgeschnittenen Linien L1 durch eine stetige Transformation und schrumpfen
gleichzeitig das Komplement B 3 nL1. Dadurch entsteht ein Zylinder, der wiederum durch eine stetige Transformation auf einen Kreis deformiert werden
kann. Fur die Betti-Zahlen erhalten wir daher
b0 (B 3 nL1) = b1 (B 3 nL1) = 1 :
Auf analoge Weise konnen wir nun die anderen Falle behandeln. Fur k = d;1
erhalten wir
b0 (B dnLd;1 ) = 2
und sonst
b0 (B dnLk ) = 1; bd;k;1 (B dnLk ) = 1 :
Damit erzeugt jede Einschrankung i.a. einen zusatzlichen Sattel im Sinne
der Morse-Theorie.
A.3 Mehrfache Einschrankungen
Am Ende dieses Anhangs wollen wir noch kurz auf den Fall einer mehrfachen
Einschrankung eingehen. Darunter verstehen wir im topologischen Sinne die
Komplementmenge B dn(Lk tLl ), wobei Lk tLl die disjunkte Vereinigung2 ist.
Aufgrund der Separabilitat der Einschrankungen konnen wir die Falle B d nLk
und B dnLl unabhangig behandeln und einfach die Betti-Zahlen addieren. Es
ergibt sich
b0 (B d n(Lk t Ll )) = 1 + 1k + 1l
bd;k;1(B d n(Lk t Ll )) = 1 + lk
bd;l;1 (B d n(Lk t Ll )) = 1 + lk
mit dem Kronecker-Symbol lk . Analog erhalten wir die entsprechenden
Betti-Zahlen fur mehr als 2 Einschrankungen.
Zum Schlu wollen wir noch den Fall betrachten, da die Einschrankungen keine disjunkte Vereinigung sind, sondern sich schneiden, wobei wir
2
Die disjunkte Vereinigung ist durch: Lk t Ll = Lk [ Ll mit Lk \ Ll = ; deniert.

A.3. MEHRFACHE EINSCHRANKUNGEN
149
topologisch immer die Situation eines transversalen Schnittes herbeifuhren
konnen. Wir bezeichnen mit Lk ? Ll die Vereinigung der beiden Einschrankungen unter Beachtung des Schnittes. An dieser Stelle wollen wir
nur die Betti-Zahlen angeben, ohne auf die Einzelheiten einzugehen. Es folgt
b0 (B d n(Lk ? Ll )) = 1 + 1k + 21l
bd;k;1(B d n(Lk ? Ll )) = 1 + 3lk
bd;l;1 (B d n(Lk ? Ll )) = 1 + 3lk :
Fur eine komplexe Schnittmenge steigt die kombinatorische Vielfalt schnell
an. Das Prinzip bleibt aber bei allen Fallen dasselbe:
Die Anzahl der Sattel auf einer Fitnesslandschaft wird durch Zwangsbedingungen erhoht.
150
ANHANG A. BERECHNUNG DER BETTI-ZAHLEN
Anhang B
Eigenwertproblem fur die
Parabel
B.1 Boltzmann-Strategie
Im folgenden werden wir die Losungen fur das Eigenwertproblem (2.6) im
Fall der Fitne (3.25) behandeln. Die Resultate dieses Anhangs sind in [41]
veroentlicht worden. Nach langerer Rechnung erhalten wir die Eigenwerte
n :::nd = Umin +
1
d
X
i=1
aiD (ni + 1)
ni = 0; 1; 2; : : :
und die Eigenfunktionen
n1 :::nd (x1 ; : : : ; xd ) =
Yd
i=1
ni (xi )
1
! 0s
a
a
i 2
@ i xi A ;
ni (xi ) = exp ;
4 xi Hni
2
was zur Losung
P (~x; t) =
q
X
i=n1 +:::+nd
ci
Yd h
k=1
i
exp(;k2 )Hnk (k ) exp(;i t)
(B.1)
mit k = xk ak =2 und Hn( ) als Hermitesche Polynome, fuhrt. Als
nachstes wollen wir die Anfangsbedingungen xieren und starten mit einer
151
152
 DIE PARABEL
ANHANG B. EIGENWERTPROBLEM FUR
Delta-Funktion
P (~x; 0) =
Durch die Relation
Z
Yd
i=1
(xi ; x(0)
i ):
p
exp(; 2)Hn( )Hm( )d = mn Nn = mn 2n(n!) (B.2)
erhalten wir fur die Koezienten in der Losung (B.1)
q
2
(0)
ck = N a Hni ai2xi
i=1 ni i
Yd
(B.3)
mit k = n1 + n2 + : : : + nd . Im Falle einer vollkommen symmetrischen
Parabel a = a1 = a2 = : : : = ad mussen wir Kugelkoordinaten benutzen und
bekommen die Eigenwerte
= aDd (k + 1)
mit d als Dimension der Landschaft. Damit bekommen wir die einfache
Regel, da die Erhohung der Dimension zu einer Reskalierung der Diusionskonstante der Form D ! Dd aquivalent ist.
Fur die beiden Falle ai > 0 bzw. ai < 0 erhalten wir kleine Unterschiede
in den Eigenwertproblemen, so da die Geschwindigkeiten durch
1. ai > 0
v(1) = 2 cc2 2 exp(;2 t)
(B.4)
1
s
(2)
(B.5)
vk = a2 cc1 1 exp(;1 t)
k 0
2. ai < 0
1
d
X
Yd H2ki +1(bj )
H2k+3(bi )
2 X
c2k e(; k t) 2k (2k+1)(2
(B.6)
v(1) = N
k+2)(2k+3) j i6 j
(2k+1)
1 k=0
i=1
k :::kd k
s
1
d
X
H2ki +1(bj(B.7)
)
2k+3 (bi ) Y
vi(2) = a2 N1 c2k+1e(; k t) 2k+1 (2Hk+2)(2
k+3)
(2k+1)
2
=1 =
=
1+
k
1 k=0
2 +1
j =1 i6=j
k1 +:::kd =k
B.2. DARWIN-STRATEGIE
mit
N1 =
1
X
k=0
153
c2k exp(;2k t)
q
Yd H2ki+1 (bi)
(2k+1)
i=1
k1 +:::kd =k
als Normierungsfaktor und bi = 2Um =ai als Intervallange, gegeben sind.
B.2 Darwin-Strategie
Nun wollen wir das Eigenwertproblem (2.17) fur die Fitne (3.25) losen. Fur
den Fall ai > 0 bekommen wir die Eigenwerte
n :::nd = Umin +
1
2ai D ni + 21
d q
X
i=1
ni = 0; 1; 2; : : :
und die Eigenfunktionen
n1 :::nd (x1 ; : : : ; xd ) =
Yd
i=1
r
ni (xi )
r ai ai 2
ni (xi ) = exp ;
4D xi Hni 2D xi
4
welche zur Losung
#
2!
k
(B.8)
P (~x; t) =
ci
exp ; 2 Hnk (k ) exp(;i t)
i=n +:::+nd k=1
q
mit k = xk ak =(2D) fuhren.
Der Fall ai < 0 ist ein wenig komplizierter und im Fall einer Dimension
erhalten wir einfach
r ai
;
i=
4
(B.9)
i (xi ) = D;iBi ;
2D e xi
p
mit Bi = i=(2 Dai) und Dk (x) als parabolische Besselfunktion, welche vom
Parameter Bi abhangt. In der Praxis konnen wir immer die Fitnessfunktion
positiv wahlen. Diese Einschrankung fuhrt zu einer Einschrankung qdes Suchraums X auf einen d-dimensionalen Wurfel der Kantenlange bi = 2Um =ai.
Auf dem Rand dieses Wurfels soll die Losung verschwinden. Genau diese
X
Yd "
1
4
1
2
4
 DIE PARABEL
ANHANG B. EIGENWERTPROBLEM FUR
154
Einschrankung erzeugt ein diskretes Spektrum, welches sich als Losung der
Gleichung
1 q2 ; 1 ; arccosh = (;qAk )3=2
(B.10)
ki
4 ki ki
6 U2pma+inDi
darstellt,
wobei die Koezienten Ak in [109] stehen und die Nullstellen uber
p
c = 2 ai deniert sind. Fur die Eigenwerte k in (2.28) erhalten wir
n =
d
X
i=1
n1 +:::nd =n
s
U
m D
ni = 2 a ; Um
i
ki
ni
:
(B.11)
Nach einer langeren Rechnung bekommen wir fur die Geschwindigkeiten die
Ausdrucke
1. ai > 0 (Minimum)
s
mit
!
d Da X
1
1 X
i
2k (2k ; 1)!!(4k + 1)c2k 2k e; k t (B.12)
N
2 k=1
s 1 i=1 X
!
1
2
D
3
(2)
k
+1
vi = a N
2 (2k + 1)!!c2k+12k+1 exp(;2k+1 t)(B.13)
i 1 k=0
v(1) =
4
N1 =
2
1
X
k=0
(2k (2k ; 1)!!)dc2k exp(;2k t)
(B.14)
als Normierung, wobei (2k ; 1)!! das Produkt uber alle ungeraden Zahlen ist.
2. ai < 0 (Maximum)
v(1) = N1
2
vk(2) = N1
2
mit
0v 1
s
1 X
d
d u
Y
u
;(
+
ib
=
2)
i
kj
nent @t ;( 43 + ib =2) A Ik (k2) D j2a(B.15)
i
n
i=1
k=1
4
:::nd n
v
0 3
s
1
1
d u
X
Y
u
2;(
+
ib
=
2)
j
i
nent @t ;( 14 + ib =2) Ii()A Ik (k ) j2aDk(B.16)
i
n
i=1
4
1
X
n1 +
=1
=
4
=1
n1 +:::nd =n
Ik (k ) =
Zuk
;uk
k y1(k )dk
Ik ( 2) =
k
Zuk
;uk
k2y2(k )dk
(B.17)
B.2. DARWIN-STRATEGIE
Ik () =
N =
Zuk
;uk
y1(k )dk
1
X
n=1
n1 +:::nd =n
155
s
uk = 2jaUmj j2aDk j bk = qnk (B.18)
k
2 Djak j
4
0v 1
1
d u
u
Y
;(
+
ib
=
2)
k
ent @t ;( 43 + ib =2) Ik () A
k
i=1
4
(B.19)
und den Funktionen y1(); y2(), welche in ([109], S.692) als Reihen
4
2 1
k
2
y1(k ) = 1 + bk 2! + bk ; 2 4!k + : : :
5
3 3
k
2
y2(k ) = k + bk 3! + bk ; 2 5!k + : : :
deniert sind.
(B.20)
(B.21)
156
 DIE PARABEL
ANHANG B. EIGENWERTPROBLEM FUR
Anhang C
Berechnung des Doppeltopfes
An dieser Stelle sollen die Ergebnisse der Untersuchungen zum Problem des
Doppeltopfes fur beide Strategien aufgelistet werden. Der Weg zur Gewinnung des Resultats wird entsprechend des Kapitels 3 durchlaufen. Der Rechenweg ist fur beide Strategien bis auf die Koezienten derselbe. Als Anfangsverteilung wurde eine -Funktion um x0 angenommen.
C.1 Darwin-Strategie
Aus der Formel (3.32) erhalten wir die stuckweise gegebene Losung fur die
Anfangsverteilung P (x; 0) = (x ; x0 )
(
a1); x0; t) x 0
P (x; t) = GG1((xx ;; ab2 ==(2
1
2 (2b1 ); x0 ; t) x 0
(C.1)
mit G1( ) als Greensche Funktion (3.32) und a = a1 ; a0 = (a2 )2=(4a1 ) ; s bzw.
a = b1 ; a0 = (b2 )2 =(4b1) ; s fur die Konstanten in der Greenschen Funktion.
Die Berechnung der Wahrscheinlichkeit (0; t) erfolgt durch die Formel
R0 P (x; t) dx
(0; t) = ;1
R1 P (x; t) dx :
(C.2)
;1
Da die Rechnung nicht schwierig aber langwierig ist, wollen wir an dieser
Stelle nur das Ergebnis angeben. Wenn wir mit erf die Fehlerfunktion be157
158
ANHANG C. BERECHNUNG DES DOPPELTOPFES
zeichnen, dann erhalten wir den Ausdruck
(C.3)
(0; t) = +Db
Db
Da
mit
2 r
0 2
!2 1
q
a
x
a
a
1
2
0
pDa ) A
Da = exp 4; 4D coth(2t Da1) @ 4a22 + x20 ; 2a + p
a
cosh(2
t
1
1
1
1
#
2
a2x0 p
1
+ a2 t q
; 2a pD sinh(2
t Da1) 4a1 cosh(2tpDa1 )
1
2
0
13
!s r
q
x
a
a
0 p
1 coth(2t Da )A5
41 ; erf @ 2 + p
2
1
4a1 2 a1 cosh(2t Da1)
4D
0 2
2 s
!21
q
b
b
b
x
0 p
A
Db = exp 4; 4D1 coth(2t Db1) @ 4b22 + x20 ; 2b2 + p
b1 cosh(2t Db1)
1
1
2t #
b
x
b
2
0
; 2b pD sinh(2tpDb ) + 42b q 1 p
1 cosh(2t Db1 )
1
1
2
0
13
s
u
!v
q
u
x0 p
t2 b1 coth(2t Db1)CA75 :
641 + erf B@ b2 + p
4b1 2 b1 cosh(2t Db1 )
4D
Die entsprechende Parameterabhangigkeit wurde in Kapitel 3 diskutiert.
C.2 Boltzmann-Strategie
Der Unterschied zur Darwin-Strategie besteht nur in der Umbenennung der
Konstanten. Wir erhalten wieder fur die Anfangsverteilung P (x; 0) = (x ;
x0 ) die Losung
(
; (a1x2 + a2 x + s)=2)G1(x ; a2=(2a1); x0; t) x 0(C.4)
P (x; t) = exp(
exp(; (b1 x2 + b2 x + s)=2)G1(x ; b2=(2b1); x0 ; t) x 0
mit G1 ( ) als Greensche Funktion (3.32) und a = D2 2a21 ; a0 = Da1 bzw.
a = D2 2b21 ; a0 = Db1 fur die Konstanten in der Greenschen Funktion. Mit
Hilfe des allgemeinen Ausdrucks (C.2) erhalten wir die Wahrscheinlichkeit
(0; t) = +Bb
(C.5)
Bb
Ba
C.2. BOLTZMANN-STRATEGIE
mit
Ba
159
"
2 a1 x2 !
a
= exp ; coth(2tDa1 ) 8a 2 + 2 0 + Dta1 ; p a2x0
2a1 D sinh(2tDa1 ) 3
1
!2
1
2
x
0
5
p
8a1 (coth(2tDa1 ) + 1) a2 coth(2tDa1 ) + D sinh(2tDa1 ) ; a1
1q
1
qp
1 ; erf 2 2a1 (coth(2tDa1 ) + 1)
D(coth(2tDa1 ) + 1) sinh(2tDa1 )
0
113
2x
;
Da
a2 coth(2tDa1 ) + pD sinh(2
1
tDa )
AA5
@
2a1 (coth(2tDa1 ) + 1)
"
2 b1 x2 !
b
= exp ; coth(2tDb1 ) 8b 2 + 2 0 + Dtb1 ; p b2 x0
2b1 D sinh(2tDb1 )
1
!2 3
1
2
x
0
5
p
8b1 (coth(2tDb1 ) + 1) b2 coth(2tDb1 ) + D sinh(2tDb1 ) ; Db1
q
1
qp
1 + erf 12 2b1 (coth(2tDb1 ) + 1)
D(coth(2tDb1 ) + 1) sinh(2tDb1 )
0
113
2x
b2 coth(2tDb1 ) + pD sinh(2
;
Db1
tDb
)
@
AA5 :
2b1 (coth(2tDb1 ) + 1)
0
1
Bb
0
1
Fur die entsprechenden Graphen bei Variation der Parameter siehe Kapitel
3.
160
ANHANG C. BERECHNUNG DES DOPPELTOPFES
Anhang D
Gemischte Strategie
D.1 Maximum, Minimum, Sattel
Das Verfahren zur Gewinnung der Geschwindigkeiten wurde ausfuhrlich in
Kapitel 3 dargelegt, auf welches wir an dieser Stelle qverweisen. Dazu benutzen wir die Greensche Funktion (3.32) mit a = D2 2a21 + a1 ; a0 =
Da1 ; s + a22 =(4a1). Fur das Minimum erhalten wir
v(1) =
q
q
; aD ( 2aD + )D sinh(4t aD( 2aD + )) 2a2 D + a
+2x20 a3 4D + 2x20 a2 2 + 4x20DA 2 + 2x20 s 2
q
; cosh(2t aD( 2aD + )) a( aD + ) 4D(x0a )2 + 4x20a + (D.1)
D
q
q
2
2
2
2
2
2
+ +2Da + 8x0 D + a Da(aD + ) + 4x0 Da(aD + )
q
q
2
2
cosh (2t aD( aD + )) cosh2 (2t aD( 2aD + ))(8a2 D2 4+
q
q
2
2
2
+8a D + ) ; Da(aD + ) sinh(4t aD( 2aD + ))(4a 2D + 2 )
;1
q
q
2
3
2
2
4
2
2
;6 Da + 2Da aD ( aD + ) sinh(4t aD( aD + )) + D a ;
wahrend nach einer Transformation t ! it fur das Maximum
q
q
v(1) = ; aD ( 2aD + )D sin(4t aD( 2aD + )) 2a2 D + a
+2x20 a3 4D + 2x20 a2 2 + 4x20DA 2 + 2x20 161
(D.2)
162
ANHANG D. GEMISCHTE STRATEGIE
s 2
q
+ ) 4D(x a )2 + 4x2 a + ; cos(2t aD( 2aD + )) a( aD
0
0
D
q
q
+ +2Da 2 + 8x20D + a 2 Da(aD 2 + ) + 4x20 Da(aD 2 + )
q
q
cos2(2t aD( 2aD + )) cos2 (2t aD( 2aD + ))(8a2D2 4+
q
q
+8a 2D + 2 ) ; Da(aD 2 + ) 2 (4t aD( 2aD + ))(4a 2D + 2 )
;1
q
q
;6 2Da + 2Da 3 aD ( 2aD + ) 2 (4t aD( 2aD + )) + D2a2 4
gilt. Die letzte Geschwindigkeit besitzt Singularitaten, die durch die fehlenden Unitaritat der Transformation bedingt sind. Durch ein Abschneiden
nach einer gewissen Zeit kann dieser Artefakt behoben werden.
D.2 Barriere
Die Ausdrucke fur diese Strategie ergeben sich durch Kombination der vorherigen Strategien. Wir erhalten fur die Anfangsverteilung P (x; 0) = (x ; x0 )
die Losung
(
; (a1 x2 + a2x + s)=2)G1(x ; a2=(2a1 ); x0; t) x 0 (D.3)
P (x; t) = exp(
exp(; (b1x2 + b2 x + s)=2)G1(x ; b2 =(2b1); x0 ; t) x 0
q
mit G1 ( ) als Greensche Funktion
(3.32)
und
a
=
D2 2a21 + a1 ; a0 =
q
Da1 ; s + a22 =(4a1 ) bzw. a = D2 2b21 + b1; a0 = Db1 ; s + b22 =(4b1 )
fur die Konstanten in der Greenschen Funktion. Mit Hilfe des allgemeinen
Ausdrucks (C.2) erhalten wir fur die Wahrscheinlichkeit
(D.4)
(0; t) = +Mb
Mb
Ma
mit
"
q 2
2 a1 x2 !
2t
a
a
2
0
2
2
Ma = exp ; coth(2t D a1 + a1 D) 8a + 2 + Dta1 + 4a2
1
1
a
x
2
0
q
; p
2a1 D sinh(2t D2a21 2 + a1D)
D.2. BARRIERE
163
1q
+ q2 2
8 a + a1 =D coth(2t D2a21 2 + a1 D) + a1 q1
q
a2 a21 2 + a1=D coth(2t D2a21 2 + a1D)=a1
123
q2x0 2
; a1A 75
+p
2
2
D sinh(2t D a1 + a1D)
q 2
D2a1 2 + a1 D
rp q
q
q
D( a21 2 + a1=D coth(2t D2a21 2 + a1 D) + a1 ) sinh(2t D2a21 2 + a1D)
"
r q
q
1
1 ; erf 2 2( a21 2 + a1=D coth(2t D2a21 2 + a1D) + a1 )
q 2
0 q2 2
113
2x
2 a1 2 + a1 D)=a1 + p
p
a
+
a
=D
coth(2
t
D
;
a
a
1
1
2
1
CCCC77
BB
D sinh(2t D a +a D)
q 2
q2 2
AA5
@
2 a1 + a1 =D(coth(2t D2 a1 2 + a1 D) + a1 )
"
q
2 b1 x2 !
2t
b
2
2
2
2
= exp ; coth(2t D b1 + b1 D) 8b 2 + 2 0 + Dtb1 + b
4b1
1
bq2 x0
; p
2b1 D sinh(2t D2 b21 2 + b1 D)
1q
q2 2
8 b1 + b1 =D coth(2t D2b21 2 + b1 D) + b1 q
q
b2 b21 2 + b1 =D coth(2t D2 b21 2 + b1 D)=b1
12 3
q2x0 2
; b1A 75
+p
2
2
D sinh(2t D b1 + b1 D)
q 2
D2b1 2 + b1 D
rp q
q
q
D( b21 2 + b1 =D coth(2t D2b21 2 + b1 D) + b1 ) sinh(2t D2b21 2 + b1 D)
"
r q
q
1
2
2
2( b1 + b1 =D coth(2t D2b21 2 + b1 D) + b1 )
1 ; erf
2
0
2 2 2
1
Mb
1
164
ANHANG D. GEMISCHTE STRATEGIE
q 2
0 q2 2
113
2
x
2
2
p
p
;
b
b
b
+
b
=D
coth(2
t
D
b
+
b
D
)
=b
+
1 CC7
1
1
1
1
BB 2 1
D sinh(2t D b +b D)
CACA75 :
q
q
@
2
2
2
2
2
2 b1 + b1 =D(coth(2t D b1 + b1 D) + b1 )
0
2 2
1
2
1
Die entsprechenden Graphen fur die Wahrscheinlichkeit in Abhangigkeit von
den Parametern sind in Kapitel 3 dargestellt.
Literaturverzeichnis
[1] R.P. Feynman. Space-time approach to non-relativistic quantum mechanics. Rev. Mod. Phys., 20:267, 1948.
[2] R.P. Feynman and Hibbs. Quantum mechanics and path integrals. Int.
Series in Pure and Applied Physics. McGraw-Hill, Inc., 1965.
[3] I. Prigogine. Introduction To Thermodynamics of Irreversible Processes. Wiley Interscience, New York, 1967.
[4] N.G. van Kampen. Stochastic processe in physics and chemistry. NorthHolland Publishing Company, Amsterdam-New York-Oxford, 1981.
[5] Ch. Darwin. The origin of species. Crowell-Collier Publishing Company, Toronto/Ontario 1962, 1859.
[6] S. Kirkpatrick, C.D. Gelatt Jr., and M.P. Vecchi. Optimization by
simulated annealing. Science, 220:671{680, 1983.
[7] P.J.M. Laarhoven and E.H.C. Aarts. Simulated Annealing: Theory and
Applications. Reidel, Dordrecht, 1987.
[8] I. Rechenberg. Evolutionsstrategien - Optimierung technischer Systeme
nach Prinzipien der biologischen Information. Friedrich Frommann
Verlag (Gunther Holzboog K.G.), Stuttgart - Bad Cannstatt, 1973.
[9] H.-P. Schwefel. Numerische Optimierung von Computer-Modellen mittels der Evolutionsstrategie, volume 26 of Interdisciplinary system research. Birkhauser Verlag, Basel, 1977.
[10] T. Back and H.-P. Schwefel. An overview of evolutionary algorithms
for parameter optimization. Evolutionary Computation, 1:1, 1993.
165
166
LITERATURVERZEICHNIS
[11] H.P. Schwefel. Evolution and optimum seeking. Wiley, New York, 1995.
[12] Th. Back. Evolutionary Algorithms in Theory and Practice. Oxford
University Press, Oxford, 1996.
[13] J.H. Holland. Outline for a logical theory of adaptive systems. Journal
of the Association for Computer Machinery, 3:297{314, 1962.
[14] J.H. Holland. Adaptation in natural and articial systems. The University of Michigan Press, Ann Arbor (MI), 1975.
[15] J.H. Holland. Genetic algorithms. Scientic American, 267:44{50,
1992.
[16] L.J. Fogel, A.J. Owens, and M.J. Walsh. Articial Intelligence through
Simulated Evolution. Wiley, New York, 1966.
[17] D. B. Fogel. System identication through simulated evolution: A Machine Learning Approach to Modeling. Ginn Press, Needham Heights,
1991.
[18] D.B. Fogel. Evolutionary computation { toward a new philosophy of
machine intelligence. IEEE Press, Piscataway NJ, 1995.
[19] J.R. Koza. Hierarchical genetic algorithms operating on populations of
computer programs. In N.S. Sridharan, editor, Eleventh International
Joint Conference on Articial Intelligence (IJCAI-89), Palo Alto (CA),
1989. Morgan Kaufman.
[20] J.R. Koza. Genetic programming: On the programming of computers
by means of natural selection. MA. MIT Press, Cambridge, 1992.
[21] W. Ebeling and R. Feistel. Physik der Selbstorganisation und Evolution.
Akademie-Verlag, Berlin, 1982.
[22] R. Feistel and W. Ebeling. Evolution of Complex Systems. Kluwer
Academic Publ., Dordrecht, 1989.
[23] W. Ebeling, A. Engel, and R. Feistel. Physik der Evolutionsprozesse.
Akademie-Verlag, Berlin, 1990.
LITERATURVERZEICHNIS
167
[24] R. Feistel and W. Ebeling. Models of Darwinian processes and evolutionary principles. BioSystems, 15:291 { 299, 1982.
[25] W. Ebeling and A. Engel. Models of evolutionary systems and their
application to optimization problems. Syst. Anal. Model. Simul., 3:377{
385, 1986.
[26] T. Boseniuk, W. Ebeling, and A. Engel. Boltzmann and Darwin Strategies in Complex Optimization. Phys. Lett., 125:307{310, 1987.
[27] T. Boseniuk and W. Ebeling. Optimization of NP-vomplete problems
by Boltzmann-Darwin strategies including life cycles. Europhysics Letters, 6:107{112, 1988.
[28] T. Boseniuk and W. Ebeling. Evolution strategies in complex optimization: The travelling salesman problem. System Analysis - Modeling
- Simulation, 5:413{422, 1988.
[29] T. Boseniuk and W. Ebeling. Boltzmann- , Darwin- and Haeckelstrategies in optimization problems. In PPSN Dortmund, 1990.
[30] H.-P. Schwefel. Numerical Optimization of Computer Models. Wiley,
New York, 1981.
[31] H. Rose. Von Boltzmann und Darwin zum Self Annealing - Strategien evolutionarer Optimierung. In Jan A. Freund, editor, Dynamik,
Evolution, Strukturen. Verlag Dr. Koster, Berlin, 1996.
[32] A. Einstein. Grundlage der allgemeinen Relativitatstheorie. Ann.
Phys.(Leipzig), 49:769{822, 1916.
[33] H. Weyl. Eine neue Erweiterung der Relativitatstheorie. Ann.
Phys.(Leipzig), 59:101{133, 1919.
[34] H. Weyl. Elektron und Gravitation. Z. Phys., 56:330{352, 1929.
[35] J. Milnor and J. Stashe. Characteristic Classes. Ann. Math. Studies,76. Princeton Univ. Press, Princeton, N.J., 1974.
[36] G. Rudolph. Convergence Properties of Evolutionary Algorithms. Doktorarbeit, Universitat Dortmund, Fachbereich Informatik, 1996.
168
LITERATURVERZEICHNIS
[37] V. Buchholtz and T. Poschel. Adaptive evolutionary optimization of
team work. Int. J. Bifurkation and Chaos, 7:751{757, 1997.
[38] F.-M. Dittes. Optimization on rugged landscapes: a new general purpose monte carlo approach. Phys. Rev. Lett., 76:4651 { 4655, 1996.
[39] H. Rose. Evolutionare Strategien und Multitome Optimierung. Doktorarbeit, Humboldt Universitat, Berlin, 1998.
[40] H. Rose F. Schweitzer, W. Ebeling and O. Weiss. Network optimization
using evolutionary strategies. In PPSN, 1996.
[41] T. Asselmeyer and W. Ebeling. Unied description of evolutionary
strategies over continous parameter spaces. BioSystems, 41:167{178,
1996.
[42] N. Metropolis, A. Rosenbluth, M. Rosenbluth, A. Teller, and E. Teller.
Equation of state calculations by fast computing machines. J. Chem.
Phys., 21:1087{1092, 1953.
[43] S. Schaer. Unconstrained global optimization using stochastic integral equations. Optimization, 35:43{60, 1995.
[44] H. Szu and R. Hartley. Fast simulated annealing. Phys. Lett. A,
122:157, 1987.
[45] L. Ingber. Very fast simulated annealing. J. Math. Comp. Modelling,
12:967, 1989.
[46] B. Andresen. Finite-time thermodynamics and simulated annealing.
In Proceedings of the Fourth International Conference on Irreversible
Processes and Selforganization, Rostock, 1989.
[47] P. Sibiani, K.M. Pedersen, K.H. Homann, and P. Salamon. Monte
carlo dynamics of optimization: A scaling description. Phys. Rev., A
42:7080, 1990.
[48] B. Andresen and J.M. Gordon. Analytic constant thermodynamic
speed-cooling strategies in simulated annealing. Open Sys. and Inf.
Dyn., 2:1{12, 1993.
LITERATURVERZEICHNIS
169
[49] B. Andresen and J.M. Gordon. Constant thermodynamic speed for
minimizing entropy production in thermodynamic processes and simulated annealing. Phys. Rev. E, 50:4346{4351, 1994.
[50] T. Asselmeyer, W. Ebeling, and H. Rose. Smoothing representation of
tness landscapes - the genotype-phenotype map of evolution. BioSystems, 39:63{76, 1996.
[51] G. Jetschke. Mathematik der Selbstorganisation. Deutscher Verlag der
Wissenschaften, Berlin, 1989.
[52] R.A. Fisher. The Genetical Theory of Natural Selection. Oxford University Press, Oxford, 1930.
[53] M. Eigen. The selforganization of matter and the evolution of biological
macromolecules. Naturwiss., 58:465, 1971.
[54] L. Schimansky-Geier. Beschreibung evolutionarer Algorithmen durch
2-Teilchenreaktionen. Vortrag im Montagsseminar, 1996.
[55] T. Asselmeyer, W. Ebeling, and H. Rose. Analytical and numerical investigations of Evolutionary Algorithms in continous spaces. In PPSN,
1996.
[56] T. Asselmeyer. Analytische und numerische Untersuchungen zur adaptiven Fisher-Eigen-Strategie. interner EVOALG-Bericht, 1996.
[57] N. Berline, M. Vergne, and E. Getzler. Heat kernels and Dirac Operators. Springer Verlag, New York, 1992.
[58] T. Asselmeyer, W. Ebeling, and H. Rose. Evolutionary Strategies of
Optimization. Phys. Rev. E, 56:1171{1180, 1996.
[59] M. Morse. The calculus of variation in the large. AMS, New York,
1934.
[60] J. Milnor. Morse theory. Ann. of Mathematical Study 51. Princeton
Univ. Press, Princeton, 1963.
[61] M. Conrad and W Ebeling. M.V. Volkenstein, evolutionary thinking
and the structue of tness landscapes. BioSystems, 27:125, 1992.
170
LITERATURVERZEICHNIS
[62] M.V. Volkenstein. Physical Approaches to Biological Evolution. Springer Verlag, Berlin, 1994.
[63] P.F. Stadler. Towards a theory of landscapes. In Complex Systems
and Binary Networks (Proceeding of the Guanajuato Lectures 1995).
Springer-Verlag, 1996.
[64] E.D. Weinberger. Fourier and Taylor series on tness landscapes. Biological Cybernetics, 65:321{330, 1991.
[65] B.V. Petukhov and V.L. Pokrovski. Quantum and classical motion of
dislocations in a Peierls potential relief. Soviet Physics JETP, 36:336{
342, 1973.
[66] E.M. Harrell. Double wells. Commun. Math. Phys., 75:239{261, 1980.
[67] U. Weiss, H. Grabert, P. Hanggi, and P. Riseborough. Incoherent
tunneling in a double well. Phys. Rev. B, 35:9535{9551, 1987.
[68] A. Ranfagni and D. Mugnai. Stochastic model for tunnelling processes:
The question of superluminal behavior. Phys. Rev. E, 52:1128{1134,
1995.
[69] V.I. Yukalov and E.P. Yukalov. Asymptotic properties of eigenvalues
in variational calculations for double-well oscillators. J. Phys. A: Math.
Gen., 29:6429{6442, 1996.
[70] L.D. Landau and E.M. Lifschitz. Lehrbuch der Theoretischen Physik,
Band 3: Quantenmechanik, Akademie-Verlag, Berlin 1983.
[71] D.T. Gillespie. A general method for numerically simulating the stochastic time evolution of coupled chemical reactions. J. Comp. Phys.,
22:403{434, 1976.
[72] R. Feistel. Betrachtung der Realsierung stochastischer Prozesse aus automatentheoretischer Sicht. Wiss. Z. W. Pieck Univ. Rostock, 26:663,
1977.
[73] D.T. Gillespie. Monte carlo simulation of random walks with residence
time dependent transition probability rates. J. of Comp. Phys., 28:435{
450, 1978.
LITERATURVERZEICHNIS
171
[74] R.L. Stratonovich. Topics in the theory of random noise, volume 1.
Gordon & Breach, New York, 1963.
[75] I. Matheson, D.F. Walls, and C.W. Gardiner. J. stat. phys., 12:21,
1975.
[76] A.N. Kolmogorov and S.V. Fomin. Reelle Funktionen und Funktionalanlysis. Deutscher Verlag der Wissenschaften, Berlin, 1975.
[77] P.B. Gilkey. Invariance, the heat equation and the Atiyah-Singer index
theorem. Publish or Perish, Washington, 1984.
[78] A. Engel. Selektion und Diusion in stochastischen Feldern. Diplomarbeit, Humboldt Universitat, Berlin, 1983.
[79] F. Riesz and B. Sz.-Nagy. Vorlesungen uber Funktionalanalysis. Deutscher Verlag der Wissenschaften, Berlin, 1982.
[80] N. Steenrod. The Topology of Fiber Bundles. Princeton University
Press, Princeton, N.J., 1951.
[81] R. Bott and L.W. Tu. Dierential Forms in Algebraic Topology. Graduate Texts in Mathematics 82. Springer-Verlag, 1995.
[82] R. Bott. An application of the Morse theory to the topology of Liegroups. Bull. Soc. Math. France, 84:251 { 281, 1956.
[83] J.F. Adams. Stable homotopy and generalised homology. Chicago Lectures in Mathematics. The University of Chicago Press, Chicago and
London, 1974.
[84] M. Atiyah. K-Theory. W.A. Benjamin, New York{Amsterdam, 1967.
[85] M. Karoubi. K-Theorie - An Introduction, Grundlehren der Mathematischen Wissenschaften Band 226. Springer Verlag, Berlin - Heidelberg
- New York 1978.
[86] G.J. Murphy. C -Algebras and Operator Theory. Academic Press Inc.,
San Diego, 1990.
[87] T.W. Palmer. Real C -algebras. Pac. J. Math., 35:195 { 204, 1970.
172
LITERATURVERZEICHNIS
[88] J. Milnor. Construction of universal bundles I. Ann. Math., 63:272 {
284, 1956.
[89] B.E. Blakadar. K-theory for Operators. Springer Verlag, New York Berlin, 1986.
[90] R. Swan. Vector bundles and projective modules. Trans. Amer. Math.
Soc., 105:264 { 277, 1962.
[91] H. Schroder. K-theory for real C -algebras and application. Longman
Scientic & Technical, Harlow, 1993. Copublished in The United States
with John Wiley & Sons, Inc., New York.
[92] T. tom Dieck. Topologie. Walter de Gruyter, Berlin-New York, 1991.
[93] J. Milnor. Construction of universal bundles II. Ann. Math., 63:430 {
436, 1956.
[94] R. Kultze. Garbentheorie. B.G. Teubner, Stuttgart, 1970.
[95] G. Eisenreich. Vorlesung uber Funktionentheorie mehrer Variabler.
Teubner Texte zur Mathematik. BSB B.G. Teubner Verlagsgesellschaft,
Leipzig, 1980.
[96] B. Iversen. Cohomology of Sheaves. Springer, Berlin, 1990.
[97] M. Golubitsky and V. Guillemin. Stable Mappings and their Singularities. Graduate Texts in Mathematics 14. Springer Verlag, New
York-Heidelberg-Berlin, 1973.
[98] T. Asselmeyer. Losungsklassen Evolutionarer Algorithmen und Quantenstatistik. In J. Freund, editor, Dynamik, Evolution, Strukturen.
Verlag Dr. Koster, Berlin, 1996.
[99] P.A. Griths and J.W. Morgan. Rational homotopy theory and dierential forms. Birkhauser, Boston, 1981.
[100] D.S. Freed. An index theorem for families of Fredholm operators parametrized by a group. Topology, 27:279{300, 1988.
[101] P.S. Laplace. Oeuvres. Gauthier-Villars, Paris, 1878-1912.
LITERATURVERZEICHNIS
173
[102] P. Levy. Calcul des probabilites. Gauthier-Villars, Paris, 1925.
[103] I. Fredholm. Sur une classe d'equations fonctionnelles. Act. Math.,
27:365{390, 1903.
[104] D. Hilbert. Grundzuge einer allgemeinen Theorie der linearen Integralgleichungen. Teubner, Leipzig, 1912.
[105] C. Kappler. Are evolutionary strategies improved by large mutations?
In H.-M. Voigt et al., editors, Proceedings of PPSNIV, Int. Conf. on
Evolutionary Computation, Berlin, 1996. Springer.
[106] P.G. Bergmann and J.L. Lebowitz. New approach to nonequilibrium
processes. Phys. Rev., 99:578{587, 1955.
[107] J.L. Lebowitz and P.G. Bergmann. Irreversible Gibbsian ensembles.
Ann Phys. (NY), 1:1{23, 1957.
[108] R. Stocker and H. Zieschang. Algebraische Topologie. B.G. Teubner,
Stuttgart, 1988.
[109] Milton Abramowitz and Irene A. Stegun. Handbook of Mathematical
Functions with Formulas, Graphs, and Mathematical Tables. Applied
Mathematical Series 55. National Bureau of Standards, December 1972.
Danksagung
An dieser Stelle mochte ich meinem Betreuer Prof. W. Ebeling fur die Zusammenarbeit danken. Er hat mir trotz unterschiedlicher Meinungen immer
zur Seite gestanden. Vor allem akzeptierte er die Vorlieben seines Schutzlings
und unterstutzte sie an einigen Stellen.
Es ist fur mich schwierig, meinen Dank an Helge und Udo richtig auszudrucken. Ihr seid fur mich nicht nur die besten Diskussionspartner und
Kritiker in allen wissenschaftlichen Fragen, sondern auch sehr gute Freunde. Habt Dank fur die schonen vergangenen und zukunftigen Stunden und
naturlich fur die Unterstutzung und das Verstandnis beim Schreiben dieser
Arbeit. Gerade in der Phase der Fertigstellung war es sicherlich nicht einfach
mit mir umzugehen.
Fur die vielen Diskussionen mathematischer Fragen mochte ich meinem
Freund Thomas und Prof. Nietzsch danken. Ich war sicherlich kein einfacher
Diskussionspartner, trotzdem brachten Sie immer viel Verstandnis fur mich
auf.
Den Mitarbeitern des Lehrstuhls Statistische Physik und Nichtlineare
Dynamik\ sowie den Mitstreitern beim" Projekt EVOALG danke ich fur viele
Diskussionen. Diese Arbeit ist im Rahmen des Projektes EVOALG entstanden, welches vom BMBF unterstutzt wurde.
Ein besonderer Dank an meine Eltern fur Ihre bedingungslose Unterstutzung
LITERATURVERZEICHNIS
175
meiner Arbeit.
Die Phase der Fertigstellung erforderte viel Verstandnis fur meine Gefuhlsschwankungen, die Du, liebe Andrea, aushalten mutest. Dafur mochte ich
Dir danken.
Herunterladen