Einf¨uhrung in die MATHEMATISCHE SPIELTHEORIE Ulrich Faigle

Werbung
Einführung in die
MATHEMATISCHE SPIELTHEORIE
Ulrich Faigle
Skriptum zur Vorlesung
WS 2007/8
Universität zu Köln
Universität zu Köln
Mathematisches Institut
Zentrum für Angewandte Informatik
Weyertal 80
[email protected]
www.zaik.uni-koeln.de/AFS
Inhaltsverzeichnis
Kapitel 1.
1.
2.
3.
4.
5.
Abstrakte Spiele, kombinatorische Spiele
und Zahlen
Der Strukturgraph eines Spiels
Kombinatorische Spiele
Neutrale Spiele
Spiele und Zahlen
Färbungsspiele
1
3
3
6
11
21
27
KAPITEL 1
Abstrakte Spiele, kombinatorische Spiele
und Zahlen
Wir gehen hier davon aus, dass ein Spiel G aus einer Menge N von Spielern besteht, die sich mit Konfigurationen beschäftigen. Dabei können die
Spieler (in diskreten Zeitschritten t) eine Konfiguration in eine andere überführen. Mit Ct bezeichnen wir eine zum Zeitpunkt t mögliche Konfiguration.
Das Spiel beginnt in einer Anfangskonfiguration C0 . Wir nehmen weiter
an, dass es gewisse Endkonfigurationen gibt, bei denen das Spiel aufhört.
Bei einer Endkonfiguration ist markiert, welcher Spieler wieviel gewon”
nen“ hat. Letzteres modellieren wir durch einen Auszahlungsvektor x ∈
RN , dessen Komponente xi den Gewinn von Spieler i ∈ N angibt. (xi kann
auch negativ sein, was als Verlust“ des Betrags |xi | interpretiert werden
”
kann.)
B EMERKUNGEN :
• Im Prinzip kann der Übergang von einer Konfiguration zu einer
anderen auch vom Zufall bestimmt sein (z.B. bei Würfelspielen).
• Ein Spiel muss nicht unbedingt nach endlich vielen Schritten aufhören (z.B. kann Schach durch Hin- und Herbewegen der Figuren
im Prinzip unbegrenzt lange gespielt werden).
In diesem Rahmen sind Spiele im allgemeinen sehr(!) schwer zu analysieren. Wir werden uns deshalb oft auf Spiele mit Zusatzregeln beschränken
müssen, die eine einfachere Analyse gestatten.
1. Der Strukturgraph eines Spiels
Dem Spiel G ordnet man einen Strukturgraphen Γ = Γ(G) zu. Die Knoten
von Γ bestehen aus allen (zeitindizierten) Konfigurationen Ct . Eine Kante
0
(Ct , Ct+1
) existiert dann, wenn man zum Zeitpunkt t aus der Konfiguration
C in die Konfiguration C 0 übergehen kann. Die Anfangskonfiguration C0
bildet den Wurzelknoten von Γ.
3
4
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
In diesem allgemeinen graphentheoretischen Kontext ist eine konkrete Ausführung des Spiels G ein bei der Wurzel C0 beginnender Weg im Strukturgraphen Γ:
C0 → C10 → C200 → C3000 → · · ·
Man beachte:
• Nicht jeder Weg in Γ muss einem konkreten Spiel entsprechen.
Welche Wege in Γ möglich sind, wird durch die Spielregeln von Γ
bestimmt.
B EMERKUNG. Da wir die Knoten Ct mit der Zeit t indiziert sind, ist klar, dass Γ
keine gerichteten Kreise enthalten kann.
1.1. Spiele in extensiver Form. Wir nehmen nun an, dass in jeder
Konfiguration Ct genau ein Spieler am Zug ist“ (d.h. die nächste Konfi”
0
guration Ct+1
nach gewissen Regeln bestimmen kann).
B EISPIEL 1.1. Bei Schach ist Weiss“ am Zug, wenn t gerade ist. Ansonsten
”
zieht Schwarz“.
”
Der Strukturgraph Γ(G) ist dann die sog. extensive Form des Spiels G. Eine
0
ermittelt,
Strategie eines Spielers i ∈ N ist eine Regel, nach der er Ct+1
wenn er in der Konfiguration Ct am Zug ist.
B EMERKUNG. Natürlich will ein Spieler optimal“ spielen. Es ist aber nicht klar,
”
was das mathematische heissen soll. Soll die Chance auf einen maximalen Gewinn
gewahrt bleiben? Soll ein möglichst grosser Mindestgewinn garantiert werden? etc.
Selbst wenn der Begriff optimal“ mathematisch bestimmt ist, ist nicht un”
bedingt klar, wie man eine optimale Strategie erhält.
B EISPIEL 1.2. Schach ist zu komplex, um die extensive Form in der Praxis zur Verfügung zu haben. Schachprogramme weisen deshalb Konfigurationen Ct nach gewissen (heuristischen) Regeln Bewertungszahlen zu und
0
wählen als Folgekonfiguration Ct+1
eine möglichst hoch bewertete.
1.2. Maxmin-Strategien. Bei einer Maxmin-Strategie besteht das Optimalitätskriterium darin, dass der Spieler i ∈ N das Ziel verfolgt, sich
einen möglichst hohen Mindestgewinn zu garantieren – egal wie die anderen Spieler auch vorgehen mögen.
Bei Spielen in endlicher extensiver Form kann man Maxmin-Strategien ausrechnen.
S ATZ 1.1. Sei G ein Spiel mit endlicher extensiver Form Γ. Dann kann man
für jeden Spieler i ∈ N eine optimale Minmax-Strategie rekursiv berechnen.
1. DER STRUKTURGRAPH EINES SPIELS
5
Beweis. Wir konstruieren rekursiv ( von unten nach oben“) Knotenbewertungen,
”
aus denen Spieler i seine Strategie ermitteln kann. Wenn Γ nur aus Endknoten
besteht, ist die Behauptung trivial. Ansonsten gibt es (wegen der Endlichkeit von
Γ) mindestens einen Knoten Ct−1 , der selber noch kein Endknoten ist aber nur zu
Endknoten führt. Seien Ct1 , . . . , Ctk diese von Ct−1 erreichbaren Endknoten mit
Auszahlungsvektoren x(1) , . . . , x(k) . Wir ordnen Ct nun den Vektor x ∈ RN zu
mit den Komponenten

(j)
wenn i in Ct am Zug ist
 max xi
1≤j≤k
xi =
 min x(j)
sonst.
i
1≤j≤k
Nun markieren wir Ct−1 als neuen Endknoten und wiederholen die Konstruktion,
bis schliesslich die Wurzel C0 als Endknoten markiert ist.
Sei x0 der für die Wurzel C0 so berechnete Auszahlungsvektor. Dann kann sich
Spieler i ∈ N mit folgender Strategie den Wert x0i garantieren:
0
• Wenn i in Ct am Zug ist, wählt i eine Konfiguration Ct+1
mit möglichst grossem Parameterwert x0i .
Offenbar ist ein Spielverlauf denkbar, bei dem i nicht mehr als x0i erhält. Also ist
diese Strategie optimal.
1.3. Nullsummenspiele. G ist ein sog. Nullsummenspiel, wenn für die
Auszahlungsvektoren x der Endzustände gilt:
X
xi = 0.
i∈N
Bei einem 2-Personenspiel (d.h. |N | = 2) bedeutet dies, dass der eine Spieler immer genau das verliert, was der andere gewinnt. Haben die Auszahlungsvektoren x = (x1 , x2 ) die Komponenten xi ∈ {0, ±1}, so können wir
xi = +1 als (für i) gewonnen“ und xi = −1 als verloren“ interpretieren.
”
”
xi = 0 bedeutet remis“ (unentschieden). Aus Satz 1.1 ergibt sich dann:
”
KOROLLAR 1.1. Sei G ein Nullsummenspiel mit endlichem Strukturgraphen Γ, 2 abwechselnd ziehenden Spielern und Auszahlungsvektoren x mit
Komponenten x1 , x2 ∈ {0, 1}. Dann gilt genau eine der Aussagen:
(a) Jeder der beiden Spieler kann den anderen zu einem Remis zwingen.
(b) Für genau einen der Spieler existiert eine Gewinnstrategie.
1.4. Deterministische und nichtdeterministische Spiele. . Ein Spiel
heisst deterministisch, wenn schon von Beginn an genau feststeht, welche
Zugmöglichkeiten der Spieler i aus der Position Ci besitzt. Ansonsten ist
das Spiel nichtdeterministisch.
6
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
In diesem Sinn ist z.B. Schach deterministisch. Würfel- und Kartenspiele
sind typischerweise nichtdeterministisch, da die erlaubten Züge von Zufallselementen (z.B. Kartenverteilung oder einer zu gewürfelnden Augenzahl) abhängen.
Was oben nicht genau gesagt wurde, sei hier nachgeholt:
• Satz 1.1 und Korollar 1.1 setzen voraus, dass das jeweilige Spiel
deterministisch ist. (Sonst könnte eine Maxmin-Strategie ja gar
nicht berechnet werden!)
2. Kombinatorische Spiele
Kombinatorische Spiele sind Spiele, wie man sie auch als Gesellschaft”
spiele“ zur Unterhaltung spielt. Der Begriff kombinatorisch“bezieht sich
”
auf die Annahme, dass die einzelnen Züge eines Spiels darin bestehen, aus
einer gegebenen kombinatorischen Konfiguration heraus eine andere kombinatorische Konfiguration (gemäss der Spielregeln) herbeizuführen. Typischerweise wird ein Spiel nur endlich viele verschiedene Konfigurationen
erlauben.
Annahmen. Wir beschränken uns hier von vornherein auf kombinatorische
Spiele, die spezielle Bedingungen erfüllen:
1. Es gibt genau 2 Spieler: L ( Links“) und R ( Rechts“).
”
”
2. Die Spieler ziehen abwechselnd.
3. Beide Spieler haben zu jedem Zeitpunkt vollständige Information
über das Spiel.
4. Die Züge und Konfigurationen hängen nicht von Zufallsentscheidungen (z.B. Würfeln oder Kartenmischen) ab.
5. Wer nicht mehr ziehen kann, wenn er am Zug wäre, hat verloren.
6. Die Spielregeln stellen sicher, dass das Spiel nach endlich vielen
Zügen endet.
Eigenschaft 3 bedeutet, dass beide Spieler die gegenwärtige Spielkonfiguration vollständig kennen (und folglich nach den Spielregeln daraus die gleichen Schlüsse ziehen können). Ein Spiel mit Eigenschaft 5 heisst normal.
(Schach ist z.B. nicht normal in diesem Sinn, da ein Patt“ möglich ist, was
”
zu einem Remis führt.)
B EMERKUNG (M IS ÈRE ). Ein Spiel heisst misère, wenn statt der Normalitätsbedingung 5. die Regel besteht:
5.’ Wer als letzter gezogen hat, hat verloren.
Ein kombinatorisches Spiel ist ein Nullsummenspiel mit 2 Personen, bei
dem die Auszahlungskoeffizienten xi in {−1, +1} gewählt sind. Der Strukturbaum eines kombinatorischen Spieles ist nicht unbedingt endlich – aber
2. KOMBINATORISCHE SPIELE
7
gestattet keine unendlich langen Wege von der Wurzel. Trotzdem gilt auch
hier:
S ATZ 1.2. In einem kombinatorischen Spiel G besitzt genau einer der Spieler (L oder R) eine Gewinnstrategie.
Beweis. Wir nehmen an, der Satz wäre falsch und wollen daraus die Existenz eines
unendlich langen Spielgangs ableiten, was im Widerspruch zu Eigenschaft 6 steht.
OBdA nehmen wir an, dass R anzieht.
Wir betrachten die von R erreichbaren Söhne v der Wurzel r im Strukturgraphen
Γ. Jedes solche v kann als Wurzel eines kombinatorischen Spiels G(v) aufgefasst
werden, in dem nun L aus der entsprechenden Konfiguration das Spiel beginnt.
Mindestens ein solcher Sohn v 0 gestattet keine Gewinnstrategie für L (sonst besässe
L ja generell eine Gewinnstrategie!). G(v 0 ) kann allerdings auch keine Gewinnstrategie für R gestatten (sonst könnte R sofort zu v 0 ziehen und generell gewinnen!)
Dasselbe Argument zeigt nun, dass es mindestens einen Sohn v 00 von v 0 geben
muss, aus dem heraus weder L noch R eine Gewinnstrategie haben usw. Also
könnte man ein unendlich langes Spiel
r → v 0 → v 00 → . . .
spielen.
B EMERKUNG. Satz 1.2 ist nur“ ein Existenzsatz. Ist der Graph Γ unendlich,
”
kann man nicht wie in Satz 1.1 eine optimale Strategie ausrechnen.
B EISPIEL 1.3 (Frösche und Kröten). Ein Frosch und eine Kröte sitzen auf
den Positionen 0 und 11 einer natürlichen Zahlenskala. Beide dürfen 1 oder
2 Felder gegeneinander springen (aber sich nicht überspringen). Verloren
hat, wer nicht mehr springen kann. Wer gewinnt?
Was, wenn sie 1,2 oder 3 Felder springen können?
2.1. Optionen und Bewertungen. Bei der Analyse eines kombinatorischen Spiels G ist es oft geschickter, nicht den allgemeinen Strukturgraphen
zu untersuchen sondern speziellere Darstellungen zu wählen.
2.1.1. Optionen. Wir bezeichnen mit a, b, . . . die möglichen (kombinatorischen) Konfigurationen des Spiels G. In der Konfiguration k ergeben
dann die Spielregeln eine Liste von möglichen Folgekonfigurationen, aus
denen der Spieler, der gerade am Zug ist, eine auswählt. Wir notieren die
möglichen Optionen der Spieler als
hki = {a, b, c, . . . | d, e, f, . . .} .
8
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
(Links stehen die aus k möglichen Optionen a, b, c, . . . für L und rechts die
entsprechenden Optionen d, e, f, . . . für R. Z.B. ist
hki = {a |}
eine Endkonfiguration für R. Wäre R nun am Zug, hätte er (nach der Normalitätseigenschaft 5) das Spiel verloren. In der Konfiguration
hki = {|}
hat der anziehende Spieler verloren.
2.1.2. Bewertungen. Wir suchen Bewertungen der Konfigurationen k
eines Spiels, die Aussagen darüber gestatten, ob eine Konfiguration besser
(und vielleicht sogar um wieviel besser) als eine andere sei. Den Wertebereich, aus dem wir die Bewertungen wählen, lassen wir im Moment noch
offen.
Notation. Die folgende Notation ist gebräuchlich geworden (wobei eine
positive“ Einschätzung sich auf die Sicht des Spielers L bezieht):
”
k > 0 :⇐⇒ L gewinnt immer
k < 0 :⇐⇒ R gewinnt immer
k = 0 :⇐⇒ der zweite Spieler gewinnt
kk0 :⇐⇒ der erste (anziehende) Spieler gewinnt
B EMERKUNG (U NSCH ÄRFE ). Fall kk0 heisst die Konfiguration k unscharf 1.
Weiter definiert man
≥“ :⇔ >“ oder =“ ,
.“ :⇔ k“ oder >“ .
”
”
”
”
”
”
N OTA B ENE . Um den Notationsaufwand geringer zu halten, bezeichnen wir
mit k“ nicht nur die Konfiguration sondern auch ihre Bewertung.
”
B EISPIEL 1.4 (Unscharfes Spiel). Im dem (normalen) Spiel O := {|} ohne echte
Zugmöglichkeiten verliert trivialerweise immer der anziehende Spieler. Also gilt in
der obigen Notation:
O=0.
Der anziehende Spieler gewinnt deshalb immer das Spiel
∗ := {O|O} ,
d.h.
∗ k0 .
2.2. Spielalgebra. Mit der oben eingeführten Notation kann man auf
der Menge der kombinatorischen Spiele in einem verallgemeinerten Sinne
rechnen“.
”
1
fuzzy auf englisch
2. KOMBINATORISCHE SPIELE
9
2.2.1. Negation. Wir definieren die Negation −G eines Spiels G, indem wir die Rollen von L und R vertauschen. Für die Bewertung der Spielpositionen ergibt sich also:
k = {a, b, . . . | c, d, . . .} ↔ −k = {−c, −d, . . . | −a, −b, . . .} .
Damit gelten die Rechenregeln
k > 0 ⇐⇒ −k < 0
k = 0 ⇐⇒ −k = 0
kk0 ⇐⇒ −kk0
2.2.2. Addition. Sind G und H zwei kombinatorische Spiele, so definiert man die Summe G + H als das Spiel das entsteht, wenn die Spieler
ihren Zug jedesmal selber entscheiden dürfen, ob sie ihren Zug bzgl. G
oder bzgl. H ausführen. Die Konfigurationen von G + H sind also Paare
von Konfigurationen:
k = (kG , kH ) (kG und kH Konfiguration von G bzw. H) .
Ist z.B.
hkG i = {aG , bG , . . . | cG , dG , . . .} , hkH i = {aH , bH , . . . | cH , dH . . .} ,
dann haben wir
hki = {(aG , kH ), (bG , kH ), . . . | (kG , cH ), (kG , dH ), . . .} .
B EISPIEL 1.5 (Frösche und Kröten). Wir haben 2 Exemplare des Frosch-Krötenspiels. Spieler L bewegt die Frösche und Spieler R die Kröten.
B EMERKUNG. Man kann leicht Beispiele von endlichen Spielen G und H finden,
die zu einem potentiell unendlich langen Spielverlauf auf G + H führen.
Da G ≥ 0 bedeutet, dass L immer gewinnt, wenn R anzieht, sieht man
sofort:
G ≥ 0 und H ≥ 0 =⇒ G + H ≥ 0
L EMMA 1.1 (Nullspiellemma). Ist der Strukturgraph von G endlich, dann
gilt:
G + (−G) = 0
Beweis. Das Lemma behauptet, dass der zweite Spieler eine Strategie besitzt, mit
der er immer gewinnt. Die Gewinnstrategie ist simpel: Er imitiert jeweils den Zug
des ersten Spielers auf dem anderen Spiel.
10
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
2.2.3. Dominanz. Wichtig ist die folgende Beobachtung:
L EMMA 1.2 (Dominanzlemma).
G−H ≥0
=⇒
(H > 0 ⇒ G > 0)
Beweis. Wir nehmen H > 0 an und betrachten die Möglichkeiten für G.
Im Fall G ≤ 0 kann R als anziehender Spieler auf −H ziehen, das er gewinnt.
G kann er deshalb als zweiter Spieler absolvieren und somit insgesamt gewinnen,
d.h. G − H ≥ 0 ist verletzt.
Im Fall Gk0 (d.h. der anziehende Spieler gewinnt G) zieht R als anziehender Spieler auf G, das er gewinnt, da er ja für −H eine sichere Gewinnstrategie hat. D.h.
wieder ist G − H ≥ 0 verletzt.
Damit haben wir gezeigt: Wenn G − H ≥ 0 erfüllt ist, so muss mit H > 0 auch
G > 0 gelten.
Ist das kombinatorische Spiel G beispielsweise in der Situation
hki = {a, b, . . . | c, d, . . .}
und L ist am Zug, dann ergibt ein Zug nach a oder b die Spiele G(a) bzw.
G(b), in denen R anzieht. Im Fall
G(a) − G(b) ≥ 0
ist der Zug k → a für L mindestens so gut wie der Zug k → b. Hat L
nämlich eine Gewinnstrategie bei k → b, dann sicherlich auch bei k → a.
Man sagt, dass a die Konfiguration b dominiert, wenn gilt
G(a) − G(b) ≥ 0 .
2.2.4. Äquivalenz. Wir nennen zwei Spiele G und H äquivalent, wenn
sie (aus der Sicht von L) strategisch äquivalent“ sind, d.h.
”
G ∼ H :⇐⇒ G − H = 0
⇐⇒ G − H ≥ 0 und H − G ≥ 0
Z.B. besagt das Nullspiellemma 1.1 für das Spiel O = {|}:
G−G∼O .
L EMMA 1.3. Seien G und H beliebige (endliche, normale, kombinatorische) Spiele. Dann gilt
H=0
=⇒
G+H ∼ G.
3. NEUTRALE SPIELE
11
Beweis. Wir betrachten das Spiel
K =G+H −G=G−G+H .
Nach Voraussetzung gewinnt der zweite Spieler immer H. Er gewinnt aber auch
immer G − G (Nullspiellemma). Also folgt K = 0.
2.2.5. Vergleichen. Um die Spiele G und H (bzgl. der Gewinnmöglichkeiten von L) zu vergleichen, definiert man gemäss der Dominanzrelation
G≥H
:⇐⇒
G + (−H) ≥ 0 .
Aus der Definition erhält man sofort die Transitiviätseigenschaft des Spielvergleichs:
G ≥ H und H ≥ K =⇒ G ≥ K
Denn wir haben allgemein:
G + (−K) ∼ G + (−K) + O
∼ G + (−K) + H + (−H)
∼ [G + (−H)] + [H + (−K)] .
Aus G + (−H) ≥ 0 und H + (−K) ≥ 0 folgt somit sofort die behauptete
Transitivität.
Auf die gleiche Weise erschliesst man die Richtigkeit der Tabelle:
H ∼ K H > K H < K HkK
G ∼ H G ∼ K G > K G < K GkK
G > H G > K G > K G?K G . K
GkH
GkK
G . K K . G G?K
( ?“ bedeutet, dass die Relation nicht eindeutig bestimmt ist.)
”
3. Neutrale Spiele
Das kombinatorische Spiel G heisst neutral, wenn in jeder Konfiguration k
beiden Spielern dieselben Optionen zu Folgekonfigurationen zur Verfügung
stehen, d.h.
hki = {a, b, c, . . . | a, b, c, . . .} .
Das Spiel G ist also identisch mit seiner Negation −G und wir erhalten
G+G=0
12
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
3.1. Subtraktionsspiele. Ein typisches Beispiel eines neutralen Spiels
ist ein Subtraktionsspiel. Die Konfigurationen sind N -Tupel natürlicher Zahlen
κ = (n1 , n2 , . . . , nN ) (ni ∈ N) .
Gegeben ist eine weitere Subtraktionsmenge, d.h. eine Menge natürlicher
Zahlen
D = {d1 , . . . , ds } mit dj ≥ 1 .
Wir bezeichnen das zugehörige Subtraktionsspiel mit
S = S(D) = S(d1 , . . . , ds ) .
Ein Zug in dem durch S gegebenen Spiel besteht darin, dass der Spieler
eine Komponente i von κ und eine Zahl dj ∈ D auswählt und subtrahiert:
ni → ni − dj
falls ni − dj ≥ 0 .
B EISPIEL 1.6 (Frösche und Kröten). Auf den ersten Blick scheint das Spiel mit
Fröschen und Kröten kein neutrales Spiel zu sein, da die Tiere in entgegengesetzte
Richtungen springen. Tatsächlich liegt hier im Grunde ein Subtraktionsspiel vor
mit
D = {1, 2} (oder D = {1, 2, 3, } usw.)
Ein Frosch kann dj Felder springen genau dann, wenn es die Kröte gegenüber
kann.
3.1.1. Nim. Subtraktionsspiele mit D = {d ∈ N | d ≥ 1} heissen
Nim-Spiele.
Im Fall N = 1 (d.h. nur einer Komponente) wird es so formuliert: Von
einem Haufen mit ursprünglich n Streichhölzern nehmen die Spieler abwechselnd (beliebig viele) Streichhölzer weg, bis nichts mehr da ist.
B EMERKUNG. Im Fall N = 1 gibt es immer eine triviale Gewinnstrategie für den
anziehenden Spieler bei n ≥ 1: Er entfernt alle n Streichhölzer. Der zweite Spieler
kann dann natürlich nicht mehr ziehen. Im Fall n = 0 verliert der erste Spieler.
Bezeichnen wir (im Fall N = 1) eine Konfiguration mit n Streichhölzern
mit ∗n (zur Unterscheidung von der natürlichen Zahl n), dann haben wir
∗0
∗1
∗2
..
.
∗n
= {|} = 0
= {∗0 | ∗0} = {0 | 0} (= ∗)
= {∗0, ∗1 | ∗0, ∗1} = {0, ∗ | 0, ∗}
= {∗0, ∗1, . . . , ∗(n − 1) | ∗0, ∗1, . . . , ∗(n − 1)}.
3. NEUTRALE SPIELE
13
B EMERKUNG (N IMBERS ). Im humorigen Englischen heissen die Zahlen“ ∗n
”
auch Nimbers. Da Deutsche weniger witzig sind, wollen wir sie einfach NimZahlen nennen.
Obwohl die Nimspiele mit N = 1 für alle n ≥ 1 gleichwertig zu sein scheinen (der anziehende Spieler hat eine triviale Gewinnstrategie: er nimmt
alles), sind die Spiele nicht(!) (strategisch) äquivalent im Sinne unserer
früheren Definition:
m 6= n
⇐⇒
∗m 6∼ ∗n
Denn sei z.B. n > m. Dann kann der anziehende Spieler das Spiel ∗n + ∗m
auf ∗m + ∗m reduzieren, das er (als hernach zweiter Spieler) gewinnt. D.h.
wir haben
(1)
n 6= m
⇐⇒
∗n + ∗m k 0 .
3.2. S PRAGUE -G RUNDY-Theorie. Eine für die Analyse neutraler Spiele wichtige Beobachtung ist diese:
L EMMA 1.4. Sei G ein neutrales Spiel und m ∈ N derart, dass G ∼ ∗m.
Dann gilt:
(0) m = 0 =⇒ der erste Spieler verliert G.
(i) m ≥ 1 =⇒ der erste Spieler gewinnt G.
Beweis. Sei m = 0. Dann kann keiner der Spieler einen Zug in ∗0 = {|}
ausführen. Also sagt die Voraussetzung G = 0, d.h. der zweite Spieler gewinnt.
Bei m ≥ 1 kann der zweite Spieler keine Gewinnstrategie für G besitzen. Denn
sonst würde der erste Spieler im Summenspiel G + ∗m im ersten Zug ∗m auf
{|} reduzieren - und wäre dann in G der zweite Spieler. Somit würde er G +∗ m
gewinnen – im Widerspruch zur Annahme G − ∗m = 0.
Die Theorie neutraler Spiele von S PRAGUE und G RUNDY basiert auf der
Einsicht, dass jedes neutrale Spiel zu einem Nim-Spiel der Form ∗m äquivalent ist.
D EFINITION . Eine Zahl m ∈ N mit G ∼ ∗m heisst Nimzahl des neutralen
Spiels G. Diese Zahl wird auch als der Grundywert m = G(G) von G
bezeichnet.
Aus (1) ersieht man, dass die Nimzahl (bzw. der Grundywert) eines neutralen Spieles eindeutig bestimmt ist. Es soll nun gezeigt werden, dass jedes
neutrale Spiel eine Nimzahl hat.
14
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
Seien a, b, c, . . . , t (endlich viele) beliebige natürliche Zahlen. Dann lässt
sich das Nim-Spiel formal zu dem Spiel
G = {∗a, ∗b, ∗c, . . . , ∗t | ∗a, ∗b, ∗c, . . . , ∗t}
verallgemeinern. Tatsächlich ist G jedoch äquivalent zu dem Nimspiel ∗m,
wobei
(2)
m = mex{a, b, c, . . . , t} := min {g ≥ 0 | g ∈
/ {a, b, c, . . . , t}}
B EMERKUNG. mex“ bedeutet minimal ausgeschlossen ( minimal excluded“).
”
”
Um die Richtigkeit der Behauptung G ∼ ∗m einzusehen, müssen wir uns
davon überzeugen, dass der zweite Spieler immer das Summenspiel G+∗m
gewinnt, d.h.
G + ∗m = 0 .
Wählt der anziehende Spieler z.B. ∗m und zieht auf eine der Optionen von
∗m = {∗0, ∗1, . . . , ∗(m − 1) | ∗0, ∗1, . . . , ∗(m − 1)} ,
so kann der zweite Spieler kontern, indem er in G auf die gleiche Position zieht (die ihm ja nach der Definition von m zur Verfügung steht). Als
zweiter Spieler gewinnt er dann.
Wählt der erste Spieler G und dort z.B. die Position ∗a, so kann der zweite
Spieler im Fall a > m die Konfiguration ∗a auf ∗m reduzieren (und dann
gewinnen) oder im Fall a < m die Konfiguration ∗m auf ∗a reduzieren (und
dann gewinnen).
B EMERKUNG. Bei neutralen Spielen ist der Begriff der strategischen Äquivalenz
besonders einsichtig. Im Fall von G ∼ ∗m kann der erste Spieler sofort auf eine
Option von ∗m ziehen. Der zweite Spieler kann dies, sobald er am Zug ist. Die
Gewinnmöglichkeiten in G und in ∗m sind also identisch.
Damit kommen wir zum Hauptsatz über neutrale Spiele:
S ATZ 1.3 (S PRAGUE (1936), G RUNDY (1939)). Zu jedem endlichen neutralen Spiel
G = {A, B, C, . . . , T | A, B, C, . . . , T }
gibt es eine natürliche Zahl m = G(G) derart, dass G strategisch äquivalent zu dem Nim-Spiel ∗m ist. Zudem kamm m rekursiv berechnet werden:
G(G) = mex{G(A), G(B), G(C), . . . , G(T )}.
3. NEUTRALE SPIELE
15
Beweis. Wir beweisen den Satz per Induktion über den Strukturgraphen von G.
Offenbar gilt die Behauptung im Fall, wo dieser nur aus einer Wurzel besteht. Seien
nun a, b, c, . . . , t die Nimzahlen der Optionen A, B, C, . . . , T und
G0 = {∗a, ∗b, ∗c, . . . , ∗t | ∗a, ∗b, ∗c, . . . , ∗t}.
Um den Induktionsschritt zu etablieren, genügt es die Äquivalenz G + G0 = 0
einzusehen. (Denn dann folgt wegen G0 + ∗m = 0 auch G + ∗m = 0.)
Das ist aber klar: Zieht der erste Spieler im Spiel G z.B. auf die Position A, so
zieht der zweite auf Position ∗a im Spiel G0 . Damit ist G + G0 auf A + ∗a = 0,
das der zweite Spieler dann gewinnt.
B EISPIEL 1.7 (Frösche und Kröten). Wir nehmen an, dass die Tiere anfänglich n
Felder voneinander getrennt sind und 1, 2 oder 3 Felder springen dürfen. Dieses
Spiel bezeichnen wir mit F K(n) = F K(n; 1, 2, 3). Die Optionen sind dann
F K(n − 1), F K(n − 2), F K(n − 3) .
Bezeichnet G(n) die entsprechende Nimzahl, so haben wir
G(n) = mex{G(n − 1), G(n − 2), G(n − 3)}
und können aus dieser Rekursion leicht eine Tabelle erstellen:
0 1 2 3 4 5 6 7 8 9 10
n
G(n) 0 1 2 3 0 1 2 3 0 1 2
Man beachte die Periodizität der Nimzahlen in diesem Beispiel!
P- und N -Positionen.2 Da bei neutralen Spielen kein struktureller Unterschied zwischen L und R besteht, unterscheidet man hier besser zwischen
dem anziehenden (oder ersten) Spieler und dem zweiten Spieler. Eine Position mit positivem G RUNDY-Wert m > 0 heisst P-Position und eine Position mit G RUNDY-Wert m = 0 N -Position. Also:
P-Position = anziehender Spieler gewinnt“
”
N -Position = zweiter Spieler gewinnt“
”
G EWINNSTRATEGIE AUS P -P OSITION :
• Der anziehende Spieler zieht auf eine N -Position.
2
In der Literatur wird P und N oft in der entgegengesetzten Bedeutung verwendet
16
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
3.3. Periodizität. Wir betrachten eine Klasse von Spielen, in der ein
einzelnes Spiel durch den Parameter n spezifiziert ist. Damit erhalten wir
die Folge
G(0), G(1), . . . , G(n), . . .
von entsprechenden G RUNDY-Werten. Die Folge ist periodisch mit Periode
p, wenn es ein n0 gibt mit der Eigenschaft
G(n + p) = G(n)
für jedes n ≥ n0 .
Nicht jedes Spiel (d.h. eigentlich: Klasse von Spielen) hat eine periodische
G RUNDY-Folge. Z.B. hat das (mit einem Haufen gespielte) Nimspiel die
Folge
0, 1, . . . , n, . . .
3.3.1. Endliche Subtraktionsspiele. Wir wollen nun einsehen, dass jedes Subtraktionsspiel
S = (d1 , . . . , ds )
mit einer endlichen Subtraktionsmenge D = {d1 , . . . , ds } periodisch ist.
Die Folge G(n) erhält man rekursiv nach der Mex-Regel aus s natürlichen
Zahlen:
G(n) = mex {G(n − d1 ), G(n − d2 ), . . . , G(n − ds )} ≤ s ,
da mex von s natürlichen Zahlen höchstens s ist. Wir betrachten nun alle
möglichen Teilsequenze n der festen Länge d = max{d1 , . . . , ds }:
G(n), G(n + 1), . . . , G(n + d) .
Wegen der Beschränktheit der G RUNDY-Werte gibt es nur endlich viele verschiedene solcher Folgen. Also existiert ein n0 und ein p > d mit der Eigenschaft
G(n0 + j) = G(n0 + p + j)
(j = 0, . . . , d) .
Nach der Konstruktion der G(n) gilt dann natürlich auch
G(n + p) = G(n)
für alle n ≥ n0 + d .
3.4. Nim-Addition natürlicher Zahlen. Unter der Nim-Summe a ⊕ b
der Zahlen a, b ∈ N verstehen wir die Nimzahl des Summenspiels ∗a + ∗b:
a ⊕ b := G(∗a + ∗b) ,
d.h.
∗ a + ∗b = ∗(a ⊕ b) .
Die Optionen des Nim-Summenspiels ∗a+∗b bestehen aus den Nim-Positionen
∗a0 + ∗b und
∗ a + ∗b0
(a0 < a, b0 < b) .
Also kann man a ⊕ b rekursiv nach der Mex-Regel (2)berechnen:
a ⊕ b = mex{a ⊕ b0 , a0 ⊕ b | a0 < a, b0 < b}
3. NEUTRALE SPIELE
17
Man überzeugt sich leicht von der Gültigkeit des Kommutativ- und Assoziativgesetzes:
a⊕a
=
0
a⊕b
=
b⊕a
(a ⊕ b) ⊕ c = a ⊕ (b ⊕ c)
Um zu einer direkten Rechenregel für Nimaddition zu kommen, machen
wir eine Reihe von Beobachtungen über G RUNDY-Werte.
(NS.0) Ist a eine Option des neutralen Spiels G, so gilt G(a) 6= G(G) .
(NS.1) Für alle Zahlen a, b ∈ N sind die Nimzahlen
a ⊕ 0, a ⊕ 1, . . . , a ⊕ b
paarweise verschieden.
(NS.0) ist eine Konsequenz der Mex-Regel, die G(a) für G(G) aussschliesst. Da
bei i < j das Spiel ∗a + ∗i eine Option des Spiels ∗a + ∗j ist, folgt (NS.1) sofort
aus (NS.0).
(NS.2) a, b < 2p
(NS.3) a < 2p
=⇒
=⇒
a ⊕ b < 2p .
a ⊕ 2p = a + 2p .
Wir beweisen die Regeln (NS.2) und (NS.3) per Induktion über p, wobei der Fall
p = 0 trivial ist. Wir nehmen nun die Gültigkeit beider Regeln für p − 1 an und
zeigen zuerst (NS.2) im Fall p.
Im Fall a, b < 2p−1 folgt a ⊕ b < 2p−1 < 2p aus der Induktionsvoraussetzung.
Im Fall a < 2p−1 ≤ b < 2p schreiben wir b = 2p−1 + b0 mit b0 < 2p−1 . Da (NS.2)
und (NS.3) für p − 1 gelten, finden wir
a ⊕ b = a ⊕ (2p−1 + b0 ) = a ⊕ 2p−1 ⊕ b0
= a ⊕ b0 ⊕ 2p−1 = a ⊕ b0 + 2p−1 < 2p .
Im Fall 2p−1 ≤ a, b < 2p schreiben wir a = 2p−1 + a0 . Ganz analog zum eben
diskutierten Fall finden wir dann (unter Benutzung von 2p−1 ⊕ 2p−1 = 0):
a ⊕ b = 2p−1 ⊕ a0 ⊕ 2p−1 ⊕ b0 = 0 ⊕ a0 ⊕ b0 < 2p−1 < 2p .
Nun beweisen wir (NS.3) für den Fall p per Induktion über a. Die G RUNDY-Werte
der Optionen des Summenspiels ∗a + ∗2p zerfallen in die Klassen A und B, wobei
A = {0 ⊕ 2p , . . . , (a − 1) ⊕ 2p }
= {0 + 2p , . . . , (a − 1) + 2p } (nach Voraussetzung)
B = {a ⊕ 0, . . . , a ⊕ (2p − 1)}
Nach (NS.2) sind die Zahlen in B alle kleiner als 2p und nach (NS.1) alle verschieden. Also gilt
B = {0, 1, . . . , 2p − 1}
und damit mex (A ∪ B) = a + 2P p .
18
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
Aus den Rechenregeln erkennt man leicht, wie man die Nim-Summe über
binäre Addition berechnet. Sei etwa a, b < 2p . Dann erhalten wir aus der
Binärdarstellung mit den Ziffern αi , βi ∈ {0, 1}:
a=
p−1
X
i=0
i
αi 2 und
b=
p−1
X
i=0
i
βi 2
=⇒
a⊕b=
p−1
X
(αi ⊕ βi )2i
i=0
B EISPIEL 1.8 (Frösche und Kröten). Wir spielen nun das Spiel mit 2 Fröschen
und 2 Kröten, die maximal 3 Felder springen dürfen. Die Tiere seien in 2 Bahnen
jeweils gegenüber plaziert. Die Abstände (Leerfelder) zwischen den Tieren seien 7
und 10. Wer gewinnt aus dieser Position?
Nach B SP. 1.7 sind die G RUNDY-Werte der beiden Einzelspiele (auf den Bahnen)
G(7) = 3 und G(10) = 2. Das Gesamtspiel ist die Summe der Einzelspiele und hat
folglich den G RUNDY-Wert
3 ⊕ 2 = (1 · 20 + 1 · 21 ) ⊕ (0 · 20 + 1 · 21 ) = 1 · 20 + 0 · 21 = 1 .
Also liegt eine P-Position vor: der anziehende Spieler gewinnt.
3.5. Verallgemeinerungen. Die Resultate des vorangegangenen Abschnitts wurden unter der Prämisse abgeleitet, dass die fraglichen Spiele
endlich sind. Dennoch gelten sie auch oft für scheinbar allgemeinere Spiele,
wenn diese auf endliche Spiele zurückgeführt werden können.
B EISPIEL 1.9 (N ORTHCOTTs Spiel). Wir erlauben den Tieren im Frosch-Krötenspiel auch das eventuelle Zurückweichen um die erlaubte Anzahl von Feldern. Damit ist das Spiel potientiell unendlich. Trotzdem ändert sich an den Gewinnchancen
nichts.
Nehmen wir an, die Frösche haben eine Gewinnstrategie in der alten Form des
Spiels. Wenn nun eine Kröte um x Felder zurückweicht, wird der entsprechende
Frosch sofort um x Felder vorrücken. Da die Kröte nicht unendlich weit zurückweichen kann, hilft ihr dieser Zug im Endeffekt nichts. Er verlängert nur die Spieldauer
ein wenig.
B EACHTE : Der Spieler mit der Gewinnstrategie braucht nie zurückweichen.
B EISPIEL 1.10 (Misère-Nim). Bei der misère Variante von Nim hat verloren, wer
den letzten Zug durchgeführt hat. Das Spiel ist also nicht normal. Man erhält es
als normales Spiel, wenn man im Nim-Spiel die Option ∗0 verbietet.
Das Spiel ist neutral und besitzt dem Satz von S PRAGUE -G RUNDY zufolge eine
Nim-Zahl als Grundy-Wert, die ausgerechnet werden kann.
3. NEUTRALE SPIELE
19
3.5.1. Take-and-Break. Hier handelt es sich um Nim-artige Spiele, bei
denen nicht nur etwas weggenommen werden darf ( take“), sondern mögli”
cherweise etwas zerteilt werden darf ( break“). Allerdings sind auch diese
”
Spiele neutral, sodass Gewinnstrategien über die zugeordneten G RUNDYWerte berechnet werden können.
B EISPIEL 1.11 (Kayles). Hier stehen n Kegel in einer Reihe. Ein Spieler darf in
einem Zug entweder einen Kegel oder zwei nebeneinanderstehende Kegel weg”
schiessen“. (Durch das Wegschiessen wird eine Kegelreihe durch einen Zug möglicherweise in zwei Teilreihen aufgebrochen.)
B EISPIEL 1.12 (L ASKER-Nim). Zusätzlich zu den Wegnehmzügen von Nim hat
man beim L ASKER-Nim die Zugmöglichkeit, einen Haufen in zwei nichtleere Haufen zu unterteilen.
B EISPIEL 1.13 (G RUNDY-Nim). Im Gegensatz zu L ASKER-Nim darf man hier nur
den Zug ausführen, der einen Haufen in zwei verschieden grosse Haufen unterteilt.
B EMERKUNG. Es wird vermutet, dass die Folge von G RUNDY-Werten bei G RUN DY -Nim periodisch ist. Ob die Vermutung richtig ist, ist eines der bekanntesten offenen Fragen der kombinatorischen Spieltheorie. Mein weiss nicht einmal, ob die
Werte beschränkt sind.
3.5.2. Oktale Spiele. Viele take-and-break-artige Spiele werden mit Haufen von Spielsteinen“gespielt und haben Regeln, die man durch (mögli”
cherweise unendliche) (0, 1)-Matrizen
D = [dij ] i=0,1,...
j=0,1,...
(dij ∈ {0, 1})
spezifiziert. Dabei bedeutet dij = 1 die Regel:
Man darf einen beliebigen Haufen auswählen, dort i Steine
entfernen und den Resthaufen in j nichtleere Teilhaufen zerlegen.
Meistens werden die Zeilensummen in der Regelmatrix D endlich sein.
Dann ist es üblich, die Zeilen binär zu kodieren, d.h. die folgenden Zahlen anzugeben:
X
di =
dij 2j .
j≥0
Die gibt man dann als Typ d des Spiels an, wobei
d = 0 · d0 d1 d2 . . . di . . . .
Das Spiel vom Typ d heisst oktal, wenn 0 ≤ di ≤ 7 für alle i erfüllt ist.
20
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
B EMERKUNG. Wegen di ≤ 7 darf in einem Oktalspiel ein Haufen nie in mehr als
2 Teilhaufen zerlegt werden.
L EMMA 1.5. Die Subtraktionsspiele sind genau die Spiele vom Typ
d = 0 · d0 d1 d2 . . . di . . .
mit
di ∈ {0, 3} .
Beweis. Darf man im Subtraktionsspiel nie i Steine wegnehmen, dann gilt natürlich
di = 0. Im Fall, wo man i Steine entfernen darf, bleibt danach entweder kein Haufen übrig (d.h. man darf in 0 Haufen zerlegen) oder es bleibt genau ein Haufen
übrig. Also hat man
di = 1 · 20 + 1 · 21 + 0 · 22 = 3 .
(Grosse) Vermutung:
Jedes oktale Spiel vom Typ
d = 0 · d0 d1 d2 . . . dn−1 dn
besitzt eine periodische G RUNDY-Folge.
3.5.3. (Grünes) Hackenbusch. Gespielt wird auf einem Graphen G =
(V, E) mit der Menge V von Knoten und der Menge E von “grünen“ Kanten. Eine Menge W ⊆ V von Knoten ist als Wurzelmenge ausgezeichnet.
In einem Spielzug entfernt ein Spieler eine Kante. Übrig bleiben dann alle
Kanten, die noch zu einer Wurzel verbunden sind.
B EMERKUNG. Beim blau-roten Hackenbusch (s. Abschnitt 5) sind die Kanten
von G rot und blau gefärbt. Spieler R darf nur rote und Spieler L nur blaue Kanten
abhacken. Im Gegensatz zum grünen Hackenbusch ist dieses Spiel im allgemeinen
nicht neutral.
Ein Pfad der Länge n (d.h. n Kanten) und Anfangsknoten ( Wurzel“) w0 ,
”
w0 − v1 − . . . − vn ,
erlaubt n Optionen (nämlich die Teilpfade entsprechender Länge von w0
aus). Also ist n der G RUNDY-Wert des Pfads. N disjunkte Pfade der Längen
n1 , . . . , nN haben folglich den G RUNDY-Wert
n1 ⊕ n2 ⊕ . . . ⊕ nN .
Für das Hackenbusch-Spiel macht es offensichtlich keinen Unterschied aus,
wenn wir die Anfangspunkte der N Pfade zu einer gemeinsamen Wurzel w0
zusammenheften.
Sei nun T ein Wurzelbaum mit Wurzel w0 . Seien v1 , . . . , vN die Söhne
von w0 und T1 , . . . , TN die entsprechenden bei den Söhnen verwurzelten
4. SPIELE UND ZAHLEN
21
Teilbäume von T . Dann ergibt sich für den G RUNDY-Wert eine rekursive
Beziehung:
(3)
G(T ) = [1 + G(T1 )] ⊕ . . . ⊕ [1 + G(TN )]
Um (3) einzusehen, ersetzen wir in Gedanken jeden Teilbaum Ti durch
einen Pfad der Länge
ni = G(Ti ) .
Offensichtlich ist das Spiel nach dieser Ersetzung äquivalent zum Ausgangsspiel: jede Option bzgl. Ti entspricht ja per Definition einer Option
im Nimspiel ∗ni !
Zur Wurzel w0 fortgedacht haben diese N Pfade die Längen
1 + ni
(i = 1, . . . , N ) .
Somit folgt aus der obigen Überlegung, dass sich G(T ) tatsächlich wie behauptet rekursiv berechnen lässt:
G(T ) = (1 + n1 ) ⊕ . . . ⊕ (1 + nN ) .
R ECHENMETHODIK . Zur Berechnung von G(T ) arbeitet man den Baum T von
den Blättern zu der Wurzel ( von unten nach oben“) ab: Jeder Knoten erhält einen
”
Wert, der aus den Werten seiner Söhne ermittelt wird – völlig analog zur Vorgehensweise bei der Berechnung einer Maxmin-Strategie aus dem Strukturgraphen.
4. Spiele und Zahlen
Kehren wir nun wieder zu den Spielern L und R zurück, die ein nicht notwendigerweise neutrales Spiel G spielen. Jeder Spielzug zu einer Option
kann als der Beginn eines neuen Spiels mit der entsprechenden Startposition verstanden worden. Wir betrachten deshalb G als rekursive definiert,
L
G = {g1L , . . . , gm
| g1R , . . . , gnR } ,
wobei die Optionen g L und g R selber wieder Spiele sind.
B EMERKUNG. Da G nicht als neutral vorausgesetzt wird, können wir G natürlich
auch keine Nim-Zahl als G RUNDY-Wert zuordnen. Es sei aber an die allgemein
schon eingeführten Spielbewertungen
G = 0, G > 0, G < 0, Gk0
erinnert.
Wir wollen nun systematisch diese Spiele erzeugen und beginnen mit dem
Spiel
0 := {|}
22
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
und sagen, es sei am Tag null erschaffen. Am Tag eins werden die Spiele
erschaffen, deren Optionen schon am Tag null erschaffen wurden, d.h.
{0 |}, {| 0}, {0 | 0} .
B EMERKUNG. 0 und {0 | 0} sind Nim-Spiele, {0 |} und {| 0} jedoch nicht. Wir
schreiben zur Abkürzung
∗0 := {|} und
∗ := {0 | 0} .
Zur weiteren Abkürzung setzen wir
1 := {0 |} und
− 1 := {| 0}
und bemerken, dass -1“genau die Negation des Spiels 1“ ist, da hier die Optionen
”
”
von L und R vertauscht sind.
Allgemein erschafft man am Tag n alle möglichen Spiele
mit den Optionen, die schon am Tag n − 1
als Spiele zur Verfügung standen
So erhalten wir z.B. die Spiele
n := {0, 1, . . . , n − 1 |}
und
− n := {| 0, −1, . . . , −(n − 1)} .
Am Tag n erschaffen wir u.a. nicht nur das Spiel n und sein Negatives −n
sondern auch das Nimspiel
∗n = {∗0, . . . , ∗(n − 1) | ∗0, . . . , ∗(n − 1)} .
Dies sind nicht die einzigen Typen von Spielen. Am zweiten Tag entstehen
z.B. die Spiele
↑:= {0 | ∗}, ↓:= {∗ | 0}, ±1 := {1 | −1} .
4.1. Vergleichen von Spielen. Seien nun G und H Spiele, die nach
dem obigen Kreationsprinzip erschaffen wurden. Wir definieren nun analog
zu unserer früheren Begriffsbildung:
G>H
G<H
G≥H
G≤H
:⇐⇒
:⇐⇒
:⇐⇒
:⇐⇒
L gewinnt G − H
R gewinnt G − H
L gewinnt G − H, wenn R anzieht
R gewinnt G − H, wenn L anzieht
Entsprechend nennen wir G positiv, wenn G > 0 gilt und negativ im Fall
G < 0. Definitionsgemäss gewinnt also L das Spiel G genau dann, wenn G
positiv ist (unabhängig davon, wer anzieht) usw.
4. SPIELE UND ZAHLEN
23
B EMERKUNG. Da bekanntlich das Spiel G − G immer ein Gewinnspiel für den
zweiten Spieler ist, gilt
G ≥ G und G ≤ G .
L EMMA 1.6. Sei g L eine linke und g R eine rechte Option des Spiels G.
Dann gilt
g L 6≥ G und g R 6≤ G .
Beweis. Wir zeigen, dass g L ≥ G unmöglich ist. Wählt R nämlich im Spiel g L −G
das Spiel −G und zieht dort auf −g L , so geht das Spiel über in das Spiel
gL − gL ,
das genau dann von L gewonnen wird, wenn L nicht anzieht.
B EMERKUNG. Sei G ≥ 0 und H ≥ 0. Dann gilt auch G + H ≥ 0. Zieht nämlich
R z.B. auf G an so erwidert L mit seiner dortigen Gewinnstrategie, bis R auf H
umsteigt. Aber auch dann kann L nach Voraussetzung mit einer Gewinnstrategie
kontern.
L EMMA 1.7 (Transitivität). Für alle Spiele G, H, K gilt:
Aus G ≥ H und H ≥ K folgt G ≥ K .
Beweis. Wie früher (s.a. die vorangehende Bemerkung).
Ordnungen und Präordnungen. Wir sagen, eine Menge M sei durch die
binäre Relation ≤ geordnet3, wenn für alle a, b, c ∈ M gilt
(O.1) a ≤ b;
(O.2) a ≤ b und b ≤ a impliziert a = b;
(O.3) a ≤ b und b ≤ c impliziert a ≤ c.
Die Menge aller Spiele erfüllt (O.1) und (O.3) – aber nicht notwendigerweise
(O.2). Deshalb ist die Menge aller Spiele nicht geordnet sondern (nur) prägeordnet.
Von diesem Problem“ kann man sich befreien, indem man zu einer Äquivalenzre”
lation auf der Menge der Spiele übergeht und definiert
G ∼ H (bzw. G = “ H) :⇐⇒ G ≥ H und G ≤ H .
”
G = H bedeutet dann, dass G − H (bzw. H − G) immer vom zweiten Spieler
gewonnen wird. M.a.W.
G=H
3
streng genommen. halbgeordnet
⇐⇒
G−H ∼0.
24
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
B EISPIEL 1.14 ({1|3} = 2). Wir betrachten {1|3} − 2 = {1|3} + {| 0, −1}.
Offensichtlich gewinnt hier L, wenn R anzieht, d.h.
{1|3} − 2 ≥ 0 .
Ebenso sieht man
2 − {1|3} = {| 0, −1} + {−3 | −1} ≥ 0
d.h. {1|3} ∼ 2 .
4.2. Zahlen. Wir haben schon gesehen, dass man mit den Nimzahlen
rechnen kann. Aber auch mit vielen anderen der gerade erschaffenen Spiele
kann man rechnen, als ob es sich um richtige Zahlen“ handelte. Z.B. erhält
”
man die ganzen Zahlen:
B EISPIEL 1.15 ( n“ + 1“ = n + 1“). Es gilt n + 1 − (n + 1) = 0, d.h. der zweite
”
”
”
Spieler gewinnt immer das Spiel
{0, 1, . . . , n − 1 |} + {0|} + {| 0, −1, . . . , −n}.
Denn beiden stehen n + 1 Züge zur Verfügung. Der zweite Spieler kann also immer
auf einen Zug des ersten Spielers antworten.
Mit den Spielen erschafft man aber auch Brüche:
B EISPIEL 1.16 ({0|1} = 1/2). Wir vergleichen die Summe {0|1} + {0|1} mit dem
Spiel 1 = {0|}. Das Spiel
{0|1} + {0|1} − 1 = {0|1} + {0|1} + {|0}
wird immer vom zweiten Spieler gewonnen4. Also haben wir
{0|1} + {0|1} ∼ 1 und setzen deshalb {0|1} := 1/2 .
Welche Spiele sollte man nun als Zahlen“ ansehen? Sicher sollte
”
G = {|} = 0
eine Zahl sein. Motiviert von den reellen Zahlen würden wir dann erwarten,
dass Zahlen immer vergleichbar sein sollten. Ausserdem sollten Zahlen aus
schon vorhandenen Zahlen erschaffen sein.
Wir nennen deshalb ein Spiel
L
6 0
| g1R , . . . , gnR } =
G = {g1L , . . . , gm
eine Zahl, wenn gilt
1. Alle linken und rechten Optionen g L und g R sind Zahlen.
2. Es gibt keine zwei Optionen g L und g R mit g L ≥ g R .
4
Ausarbeitung der Details als Übung dem Leser überlassen!
4. SPIELE UND ZAHLEN
25
B EMERKUNG . Eigenschaft 2. erkärt sich aus der Forderung, dass Zahlen einerseits vergleichbar sein sollten, andererseits aber g L ≥ G ≥ g R nicht möglich ist
(Lemma 1.6). Aus der Definition folgt sofort, dass 0 die einzige Nimzahl ist, die
auch eine Zahl“ ist.
”
S ATZ 1.4. Ist G eine Zahl mit der linken Option g L und der rechten Option
g R , dann gilt
gL < G < gR .
Beweis. Wir zeigen g L < G (d.h. L gewinnt das Spiel G − g L ). Zieht L an, so
kann L in G auf g L ziehen und gewinnt danach als nunmehr zweiter Spieler das
resultierende Spiel g L − g L . Es ist also nur noch der Fall zu betrachten, wo R
anzieht. Wir argumentieren per Induktion über den Erschaffungstag des Spiels.
Wenn R z.B. G spielt, auf eine Position g R zieht und dann gewinnt, so heisst das,
dass beim Anzug von L das Spiel g R − g L vom Spieler R gewonnen wird. M.a.W.:
gL ≥ gR ,
was bei Zahlen G definitionsgemäss nicht sein kann. Zieht R auf eine Position
−g LL und gewinnt, dann folgt beim nunmehrigen Zug von L auf g L (im Spiel G)
ebenso
g L − g LL ≤ 0 , d.h. g L ≤ g LL ,
was (per Induktion) schon ausgeschlossen ist.
KOROLLAR 1.2. Für je zwei Zahlen X und Y gilt:
entweder X ≤ Y oder Y ≤ X .
Beweis. Wir nehmen X 6≤ Y an, d.h. R gewinnt nicht notwendigerweise das
Spiel X − Y , wenn L anzieht. Es gibt also entweder ein xL (im Spiel X) mit
der Eigenschaft xL − Y ≥ 0 oder ein −y R (im Spiel −Y ) mit der Eigenschaft
X − y R ≥ 0. Aus Satz 1.4 schliessen wir deshalb
X > xL ≥ Y oder X ≥ y R ≥ Y .
B EISPIEL 1.17 (Positive Nichtzahlen). Da ∗ = {0|0} keine Zahl ist, ist auch das
Spiel ↑= {0|∗} keine Zahl. Aber es gilt
↑> 0,
denn es gewinnt offenbar L. (Auch Nimzahlen sind typischerweise positiv.)
L EMMA 1.8. Für jede Zahl X gilt:
X + ∗ = {X | X}.
26
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
Beweis. Die Behauptung ist richtig im Fall X = 0:
0 + ∗ = ∗ = {0 | 0} .
Sei nun X = {xL | xR }. Wir argumentieren nun per Induktion (Erschaffung der
Zahlen!) und wollen zeigen, dass der zweite Spieler immer das Spiel
X − {X | X} + ∗ = X + {−X | −X} + ∗
gewinnt. Wir nehmen oBdA R als ersten Spieler an. Spielt R dann {−X | −X}
oder ∗, so kann L die Konfiguration
X −X +0=X −X =0
erzielen, die er als zweiter Spieler gewinnt. Spielt R das Spiel X, so kontert L mit
dem Zug auf −X und erreicht die Konfiguration
xR − X + ∗ ,
die er wegen xR − X > 0 (Satz 1.4) gewinnt.
Nehmen wir (in Fortführung von B SP. 1.16) an, dass die Zahl
1
1
= 0 | n−1 > 0 .
2n
2
schon definiert ist. Wir behaupten
1
1
X = 0 | n = n+1
2
2
und müssen dazu zeigen:
1
1
1
1
= {0 | n } + {0 | n } + {− n−1 | 0} = 0 .
n
2
2
2
2
In der Tat, zieht R an, dann führt die Option 0 zum Gewinn von L, da 0
unscharf ist und die beiden anderen Spiel positiv sind, d.h. ohnehin immer
von L gewonnen werden . Ebenso führt aber auch Rs Wahl der Option 1/2n
zum Gewinn von L. Denn mit Hilfe von Satz 1.4 folgert man
X +X −
1
1
1
1
1
} + n − n = {0 | n } + 0 = {0 | n } > 0 .
n
2
2
2
2
2
Zieht L an und wählt z.B. die Option 0, dann erhält man die Konfiguration
{0 |
0 + {0 |
1
1
}− n ,
n
2
2
die nun R reduzieren kann auf
0+
1
1
− n =0
n
2
2
5. FÄRBUNGSSPIELE
27
und somit (als dann zweiter Spieler) gewinnt. Wählt L die Option −1/2n−1 ,
so etabliert mit der Option 1/2n die für R gewinnbringende Konfiguration
{0 |
1
1
1
1
1
} + n − n−1 = {0 | n } − n−1 < 0
n
2
2
2
2
2
(vgl. Satz 1.4) .
Allgemein kann man auf diese Weise zeigen:
2p + 1
p p+1
=
| n
2n+1
2n
2
Wir erhalten also insbesondere alle Binärbrüche als Zahlen“.
”
B EMERKUNG. Die Resultate in diesem Abschnitt deuten an, dass man den
gesamten Aufbau der reellen Zahlen auch spieltheoretisch begründen kann.
Da die Theorie z.B. der Nimzahlen nicht unter die Arithmetik des reellen
Zahlkörpers fällt, erkennt man diese Konstruktionen als viel allgemeiner
als die des üblichen Aufbaus der reellen Zahlen.
Literatur: J.H. C ONWAY. On Numbers and Games. A.K. Peters, 2001
5. Färbungsspiele
Viele kombinatorische Optimierungsprobleme kann man als Färbungsprobleme auf Graphen auffassen. Wir wollen hier ein paar wenige dieser Probleme in einer spieltheoretischen Form ansprechen, um die Ideen der vorangegangenen Abschnitte zu illustrieren.
5.1. Blau-rotes Hackenbusch. Wie beim grünen Hackenbusch liegt
uns ein Graph G mit einer als Wurzeln“ markierten Teilmenge von Knoten
”
vor. Die Kanten sind allerdings nun blau oder rot gefärbt. Spieler L darf nur
blaue und Spieler R ausschliesslich rote Kanten entfernen.
Welchen (Spiel-)Wert sollten wir z.B. einem von einer Wurzel w0 ausgehenden Pfad mit n Kanten zuordnen, der nur blaue Kanten hat? Hier darf
nur L den Pfad zerhacken. Also finden wir:
(n = 0) ∼ {|} = 0
(n = 1) ∼ {0 |} = 1
(n = 2) ∼ {1 |} = 2
usw.
Das Spiel auf dem blauen Pfad ist also äquivalent zu dem Spiel n“. Das
”
Spiel auf einem roten Pfad mit n Kanten wäre analog äquivalent mit dem
Spiel −n“.
”
28
1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN
B EISPIEL 1.18. Beim Hackenbuschspiel auf dem Pfad mit den 2 Kanten
w0 − b − r
kann R nur die rote Kante abhacken. Der Zug von L entfernt jedoch alle Kanten,
d.h. der Spielwert ist
1
{0 | 1} = .
2
(Das kann man so sehen: Gegenüber der Situation w0 − b mit Wert {1|0} = 1 hat
zwar R keine bessere Gewinnchance (R verliert garantiert). R kann aber das Spiel
in die Länge ziehen. Die Position von L ist also weniger stark.)
5.2. Knotenfärben. L und R färben die Knoten eines Graphen G abwechselnd blau bzw. rot derart, dass benachbarte Knoten immer verschieden gefärbt sind. Verloren hat, wer nicht mehr zulässig färben kann, wenn
er am Zug ist.
L EMMA 1.9. Sei k die momentane Färbungskonfiguration auf dem Graphen G, k L eine linke und k R eine rechte Option. Dann gilt
kL + ∗ ≤ k ≤ kR + ∗
(mit ∗ = {0|0}) .
Beweis. Um beispielsweise k ≤ k R + ∗ zu erhalten, müssen wir beweisen:
k R + ∗ + (−k) = (k R + ∗) + (−k) ≥ 0 .
Dazu bemerken wir, dass die Addition von ∗ zu einer Konfiguration äquivalent ist
mit der Hinzufügung eines bislang ungefärbten isolierten Knotens zu G. v sei der
Knoten, in dem sich k von k R unterscheidet (und der deshalb bzgl. k R rot gefärbt
ist). Mit dem isolierten Knoten kann L die Färbung von v kompensieren, wenn R
anzieht:
L übt nämlich bzgl. −k die Rolle von R beim Färben von G aus (und umgekehrt).
L kann deshalb die Züge, die R auf (k R + ∗) bzw. (−k) ausführt, allemal auf (−k)
bzw. (k R + ∗) imitieren und gewinnt somit als zweiter Spieler.
Angenommen, wir wissen schon ( per Induktion“), dass alle Optionen k L
”
und k R aus der Konfiguration k heraus immer von der Form
Zahl oder
Zahl + ∗
sind. Gilt dann k = k L + ∗ oder k = k R + ∗, so ist auch k von dieser Form,
denn es gilt ja generell
∗+∗=0.
Im andern Fall haben wir immer gemäss Lemma 1.9 die strikte Dominanzrelation
kL + ∗ < k < kR + ∗ .
5. FÄRBUNGSSPIELE
29
Wegen z.B. k R − k + ∗ > 0 schliessen wir dann auch
k R − k = (k R − k + ∗) + ∗ > 0
d.h. wir erhalten somit ebenso
kL < k < kR .
P ROPOSITION 1.1. Beim Knotenfärbungsspiel ist der Wert jeder Konfiguration von der Form
z
oder z∗ := z + ∗ , wobei z eine Zahl ist .
Beweis. Per Induktion nehmen wir an, dass der Wert jeder Option von z entweder
eine Zahl oder eine Zahl plus ∗ ist. Wir nennen die (vom Zahlenanteil her) besten
linken Optionen x oder x∗ und die besten rechten Optionen y oder y∗. Nach der
vorangehenden Diskussion ist nur noch der Fall
x<k<y
( ←→
x∗ < k < y∗ )
zu untersuchen. Wir beobachten nun z ∼ {x, x∗ | x, y∗} ∼ {x | y}, d.h.
{x, x + ∗ | y, y + ∗} − {x | y} = {x, x + ∗ | y, y + ∗} + {−y | −x} = 0 .
Folglich ist z eine Zahl.
B ODLAENDERs Spiel. Auch hier färben die Spieler abwechselnd die Knoten eines Graphen unter der Vorgabe, dass benachbarte Knoten verschieden
gefärbt werden müssen. L und R bedienen sich nun aber aus einem Vorrat
von c verschiedenen Farben. L hat gewonnen“, wenn der Graph vollständig
”
gefärbt vorliegt. Wird diese Situation nicht erreicht, geht das Spiel an R.
Eine interessante Frage ist hier: Was ist die spielchromatische Zahl“ (näm”
lich das kleinste c, das L eine Gewinnstrategie garantiert) des Graphen?
Herunterladen