Einführung in die MATHEMATISCHE SPIELTHEORIE Ulrich Faigle Skriptum zur Vorlesung WS 2007/8 Universität zu Köln Universität zu Köln Mathematisches Institut Zentrum für Angewandte Informatik Weyertal 80 [email protected] www.zaik.uni-koeln.de/AFS Inhaltsverzeichnis Kapitel 1. 1. 2. 3. 4. 5. Abstrakte Spiele, kombinatorische Spiele und Zahlen Der Strukturgraph eines Spiels Kombinatorische Spiele Neutrale Spiele Spiele und Zahlen Färbungsspiele 1 3 3 6 11 21 27 KAPITEL 1 Abstrakte Spiele, kombinatorische Spiele und Zahlen Wir gehen hier davon aus, dass ein Spiel G aus einer Menge N von Spielern besteht, die sich mit Konfigurationen beschäftigen. Dabei können die Spieler (in diskreten Zeitschritten t) eine Konfiguration in eine andere überführen. Mit Ct bezeichnen wir eine zum Zeitpunkt t mögliche Konfiguration. Das Spiel beginnt in einer Anfangskonfiguration C0 . Wir nehmen weiter an, dass es gewisse Endkonfigurationen gibt, bei denen das Spiel aufhört. Bei einer Endkonfiguration ist markiert, welcher Spieler wieviel gewon” nen“ hat. Letzteres modellieren wir durch einen Auszahlungsvektor x ∈ RN , dessen Komponente xi den Gewinn von Spieler i ∈ N angibt. (xi kann auch negativ sein, was als Verlust“ des Betrags |xi | interpretiert werden ” kann.) B EMERKUNGEN : • Im Prinzip kann der Übergang von einer Konfiguration zu einer anderen auch vom Zufall bestimmt sein (z.B. bei Würfelspielen). • Ein Spiel muss nicht unbedingt nach endlich vielen Schritten aufhören (z.B. kann Schach durch Hin- und Herbewegen der Figuren im Prinzip unbegrenzt lange gespielt werden). In diesem Rahmen sind Spiele im allgemeinen sehr(!) schwer zu analysieren. Wir werden uns deshalb oft auf Spiele mit Zusatzregeln beschränken müssen, die eine einfachere Analyse gestatten. 1. Der Strukturgraph eines Spiels Dem Spiel G ordnet man einen Strukturgraphen Γ = Γ(G) zu. Die Knoten von Γ bestehen aus allen (zeitindizierten) Konfigurationen Ct . Eine Kante 0 (Ct , Ct+1 ) existiert dann, wenn man zum Zeitpunkt t aus der Konfiguration C in die Konfiguration C 0 übergehen kann. Die Anfangskonfiguration C0 bildet den Wurzelknoten von Γ. 3 4 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN In diesem allgemeinen graphentheoretischen Kontext ist eine konkrete Ausführung des Spiels G ein bei der Wurzel C0 beginnender Weg im Strukturgraphen Γ: C0 → C10 → C200 → C3000 → · · · Man beachte: • Nicht jeder Weg in Γ muss einem konkreten Spiel entsprechen. Welche Wege in Γ möglich sind, wird durch die Spielregeln von Γ bestimmt. B EMERKUNG. Da wir die Knoten Ct mit der Zeit t indiziert sind, ist klar, dass Γ keine gerichteten Kreise enthalten kann. 1.1. Spiele in extensiver Form. Wir nehmen nun an, dass in jeder Konfiguration Ct genau ein Spieler am Zug ist“ (d.h. die nächste Konfi” 0 guration Ct+1 nach gewissen Regeln bestimmen kann). B EISPIEL 1.1. Bei Schach ist Weiss“ am Zug, wenn t gerade ist. Ansonsten ” zieht Schwarz“. ” Der Strukturgraph Γ(G) ist dann die sog. extensive Form des Spiels G. Eine 0 ermittelt, Strategie eines Spielers i ∈ N ist eine Regel, nach der er Ct+1 wenn er in der Konfiguration Ct am Zug ist. B EMERKUNG. Natürlich will ein Spieler optimal“ spielen. Es ist aber nicht klar, ” was das mathematische heissen soll. Soll die Chance auf einen maximalen Gewinn gewahrt bleiben? Soll ein möglichst grosser Mindestgewinn garantiert werden? etc. Selbst wenn der Begriff optimal“ mathematisch bestimmt ist, ist nicht un” bedingt klar, wie man eine optimale Strategie erhält. B EISPIEL 1.2. Schach ist zu komplex, um die extensive Form in der Praxis zur Verfügung zu haben. Schachprogramme weisen deshalb Konfigurationen Ct nach gewissen (heuristischen) Regeln Bewertungszahlen zu und 0 wählen als Folgekonfiguration Ct+1 eine möglichst hoch bewertete. 1.2. Maxmin-Strategien. Bei einer Maxmin-Strategie besteht das Optimalitätskriterium darin, dass der Spieler i ∈ N das Ziel verfolgt, sich einen möglichst hohen Mindestgewinn zu garantieren – egal wie die anderen Spieler auch vorgehen mögen. Bei Spielen in endlicher extensiver Form kann man Maxmin-Strategien ausrechnen. S ATZ 1.1. Sei G ein Spiel mit endlicher extensiver Form Γ. Dann kann man für jeden Spieler i ∈ N eine optimale Minmax-Strategie rekursiv berechnen. 1. DER STRUKTURGRAPH EINES SPIELS 5 Beweis. Wir konstruieren rekursiv ( von unten nach oben“) Knotenbewertungen, ” aus denen Spieler i seine Strategie ermitteln kann. Wenn Γ nur aus Endknoten besteht, ist die Behauptung trivial. Ansonsten gibt es (wegen der Endlichkeit von Γ) mindestens einen Knoten Ct−1 , der selber noch kein Endknoten ist aber nur zu Endknoten führt. Seien Ct1 , . . . , Ctk diese von Ct−1 erreichbaren Endknoten mit Auszahlungsvektoren x(1) , . . . , x(k) . Wir ordnen Ct nun den Vektor x ∈ RN zu mit den Komponenten (j) wenn i in Ct am Zug ist max xi 1≤j≤k xi = min x(j) sonst. i 1≤j≤k Nun markieren wir Ct−1 als neuen Endknoten und wiederholen die Konstruktion, bis schliesslich die Wurzel C0 als Endknoten markiert ist. Sei x0 der für die Wurzel C0 so berechnete Auszahlungsvektor. Dann kann sich Spieler i ∈ N mit folgender Strategie den Wert x0i garantieren: 0 • Wenn i in Ct am Zug ist, wählt i eine Konfiguration Ct+1 mit möglichst grossem Parameterwert x0i . Offenbar ist ein Spielverlauf denkbar, bei dem i nicht mehr als x0i erhält. Also ist diese Strategie optimal. 1.3. Nullsummenspiele. G ist ein sog. Nullsummenspiel, wenn für die Auszahlungsvektoren x der Endzustände gilt: X xi = 0. i∈N Bei einem 2-Personenspiel (d.h. |N | = 2) bedeutet dies, dass der eine Spieler immer genau das verliert, was der andere gewinnt. Haben die Auszahlungsvektoren x = (x1 , x2 ) die Komponenten xi ∈ {0, ±1}, so können wir xi = +1 als (für i) gewonnen“ und xi = −1 als verloren“ interpretieren. ” ” xi = 0 bedeutet remis“ (unentschieden). Aus Satz 1.1 ergibt sich dann: ” KOROLLAR 1.1. Sei G ein Nullsummenspiel mit endlichem Strukturgraphen Γ, 2 abwechselnd ziehenden Spielern und Auszahlungsvektoren x mit Komponenten x1 , x2 ∈ {0, 1}. Dann gilt genau eine der Aussagen: (a) Jeder der beiden Spieler kann den anderen zu einem Remis zwingen. (b) Für genau einen der Spieler existiert eine Gewinnstrategie. 1.4. Deterministische und nichtdeterministische Spiele. . Ein Spiel heisst deterministisch, wenn schon von Beginn an genau feststeht, welche Zugmöglichkeiten der Spieler i aus der Position Ci besitzt. Ansonsten ist das Spiel nichtdeterministisch. 6 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN In diesem Sinn ist z.B. Schach deterministisch. Würfel- und Kartenspiele sind typischerweise nichtdeterministisch, da die erlaubten Züge von Zufallselementen (z.B. Kartenverteilung oder einer zu gewürfelnden Augenzahl) abhängen. Was oben nicht genau gesagt wurde, sei hier nachgeholt: • Satz 1.1 und Korollar 1.1 setzen voraus, dass das jeweilige Spiel deterministisch ist. (Sonst könnte eine Maxmin-Strategie ja gar nicht berechnet werden!) 2. Kombinatorische Spiele Kombinatorische Spiele sind Spiele, wie man sie auch als Gesellschaft” spiele“ zur Unterhaltung spielt. Der Begriff kombinatorisch“bezieht sich ” auf die Annahme, dass die einzelnen Züge eines Spiels darin bestehen, aus einer gegebenen kombinatorischen Konfiguration heraus eine andere kombinatorische Konfiguration (gemäss der Spielregeln) herbeizuführen. Typischerweise wird ein Spiel nur endlich viele verschiedene Konfigurationen erlauben. Annahmen. Wir beschränken uns hier von vornherein auf kombinatorische Spiele, die spezielle Bedingungen erfüllen: 1. Es gibt genau 2 Spieler: L ( Links“) und R ( Rechts“). ” ” 2. Die Spieler ziehen abwechselnd. 3. Beide Spieler haben zu jedem Zeitpunkt vollständige Information über das Spiel. 4. Die Züge und Konfigurationen hängen nicht von Zufallsentscheidungen (z.B. Würfeln oder Kartenmischen) ab. 5. Wer nicht mehr ziehen kann, wenn er am Zug wäre, hat verloren. 6. Die Spielregeln stellen sicher, dass das Spiel nach endlich vielen Zügen endet. Eigenschaft 3 bedeutet, dass beide Spieler die gegenwärtige Spielkonfiguration vollständig kennen (und folglich nach den Spielregeln daraus die gleichen Schlüsse ziehen können). Ein Spiel mit Eigenschaft 5 heisst normal. (Schach ist z.B. nicht normal in diesem Sinn, da ein Patt“ möglich ist, was ” zu einem Remis führt.) B EMERKUNG (M IS ÈRE ). Ein Spiel heisst misère, wenn statt der Normalitätsbedingung 5. die Regel besteht: 5.’ Wer als letzter gezogen hat, hat verloren. Ein kombinatorisches Spiel ist ein Nullsummenspiel mit 2 Personen, bei dem die Auszahlungskoeffizienten xi in {−1, +1} gewählt sind. Der Strukturbaum eines kombinatorischen Spieles ist nicht unbedingt endlich – aber 2. KOMBINATORISCHE SPIELE 7 gestattet keine unendlich langen Wege von der Wurzel. Trotzdem gilt auch hier: S ATZ 1.2. In einem kombinatorischen Spiel G besitzt genau einer der Spieler (L oder R) eine Gewinnstrategie. Beweis. Wir nehmen an, der Satz wäre falsch und wollen daraus die Existenz eines unendlich langen Spielgangs ableiten, was im Widerspruch zu Eigenschaft 6 steht. OBdA nehmen wir an, dass R anzieht. Wir betrachten die von R erreichbaren Söhne v der Wurzel r im Strukturgraphen Γ. Jedes solche v kann als Wurzel eines kombinatorischen Spiels G(v) aufgefasst werden, in dem nun L aus der entsprechenden Konfiguration das Spiel beginnt. Mindestens ein solcher Sohn v 0 gestattet keine Gewinnstrategie für L (sonst besässe L ja generell eine Gewinnstrategie!). G(v 0 ) kann allerdings auch keine Gewinnstrategie für R gestatten (sonst könnte R sofort zu v 0 ziehen und generell gewinnen!) Dasselbe Argument zeigt nun, dass es mindestens einen Sohn v 00 von v 0 geben muss, aus dem heraus weder L noch R eine Gewinnstrategie haben usw. Also könnte man ein unendlich langes Spiel r → v 0 → v 00 → . . . spielen. B EMERKUNG. Satz 1.2 ist nur“ ein Existenzsatz. Ist der Graph Γ unendlich, ” kann man nicht wie in Satz 1.1 eine optimale Strategie ausrechnen. B EISPIEL 1.3 (Frösche und Kröten). Ein Frosch und eine Kröte sitzen auf den Positionen 0 und 11 einer natürlichen Zahlenskala. Beide dürfen 1 oder 2 Felder gegeneinander springen (aber sich nicht überspringen). Verloren hat, wer nicht mehr springen kann. Wer gewinnt? Was, wenn sie 1,2 oder 3 Felder springen können? 2.1. Optionen und Bewertungen. Bei der Analyse eines kombinatorischen Spiels G ist es oft geschickter, nicht den allgemeinen Strukturgraphen zu untersuchen sondern speziellere Darstellungen zu wählen. 2.1.1. Optionen. Wir bezeichnen mit a, b, . . . die möglichen (kombinatorischen) Konfigurationen des Spiels G. In der Konfiguration k ergeben dann die Spielregeln eine Liste von möglichen Folgekonfigurationen, aus denen der Spieler, der gerade am Zug ist, eine auswählt. Wir notieren die möglichen Optionen der Spieler als hki = {a, b, c, . . . | d, e, f, . . .} . 8 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN (Links stehen die aus k möglichen Optionen a, b, c, . . . für L und rechts die entsprechenden Optionen d, e, f, . . . für R. Z.B. ist hki = {a |} eine Endkonfiguration für R. Wäre R nun am Zug, hätte er (nach der Normalitätseigenschaft 5) das Spiel verloren. In der Konfiguration hki = {|} hat der anziehende Spieler verloren. 2.1.2. Bewertungen. Wir suchen Bewertungen der Konfigurationen k eines Spiels, die Aussagen darüber gestatten, ob eine Konfiguration besser (und vielleicht sogar um wieviel besser) als eine andere sei. Den Wertebereich, aus dem wir die Bewertungen wählen, lassen wir im Moment noch offen. Notation. Die folgende Notation ist gebräuchlich geworden (wobei eine positive“ Einschätzung sich auf die Sicht des Spielers L bezieht): ” k > 0 :⇐⇒ L gewinnt immer k < 0 :⇐⇒ R gewinnt immer k = 0 :⇐⇒ der zweite Spieler gewinnt kk0 :⇐⇒ der erste (anziehende) Spieler gewinnt B EMERKUNG (U NSCH ÄRFE ). Fall kk0 heisst die Konfiguration k unscharf 1. Weiter definiert man ≥“ :⇔ >“ oder =“ , .“ :⇔ k“ oder >“ . ” ” ” ” ” ” N OTA B ENE . Um den Notationsaufwand geringer zu halten, bezeichnen wir mit k“ nicht nur die Konfiguration sondern auch ihre Bewertung. ” B EISPIEL 1.4 (Unscharfes Spiel). Im dem (normalen) Spiel O := {|} ohne echte Zugmöglichkeiten verliert trivialerweise immer der anziehende Spieler. Also gilt in der obigen Notation: O=0. Der anziehende Spieler gewinnt deshalb immer das Spiel ∗ := {O|O} , d.h. ∗ k0 . 2.2. Spielalgebra. Mit der oben eingeführten Notation kann man auf der Menge der kombinatorischen Spiele in einem verallgemeinerten Sinne rechnen“. ” 1 fuzzy auf englisch 2. KOMBINATORISCHE SPIELE 9 2.2.1. Negation. Wir definieren die Negation −G eines Spiels G, indem wir die Rollen von L und R vertauschen. Für die Bewertung der Spielpositionen ergibt sich also: k = {a, b, . . . | c, d, . . .} ↔ −k = {−c, −d, . . . | −a, −b, . . .} . Damit gelten die Rechenregeln k > 0 ⇐⇒ −k < 0 k = 0 ⇐⇒ −k = 0 kk0 ⇐⇒ −kk0 2.2.2. Addition. Sind G und H zwei kombinatorische Spiele, so definiert man die Summe G + H als das Spiel das entsteht, wenn die Spieler ihren Zug jedesmal selber entscheiden dürfen, ob sie ihren Zug bzgl. G oder bzgl. H ausführen. Die Konfigurationen von G + H sind also Paare von Konfigurationen: k = (kG , kH ) (kG und kH Konfiguration von G bzw. H) . Ist z.B. hkG i = {aG , bG , . . . | cG , dG , . . .} , hkH i = {aH , bH , . . . | cH , dH . . .} , dann haben wir hki = {(aG , kH ), (bG , kH ), . . . | (kG , cH ), (kG , dH ), . . .} . B EISPIEL 1.5 (Frösche und Kröten). Wir haben 2 Exemplare des Frosch-Krötenspiels. Spieler L bewegt die Frösche und Spieler R die Kröten. B EMERKUNG. Man kann leicht Beispiele von endlichen Spielen G und H finden, die zu einem potentiell unendlich langen Spielverlauf auf G + H führen. Da G ≥ 0 bedeutet, dass L immer gewinnt, wenn R anzieht, sieht man sofort: G ≥ 0 und H ≥ 0 =⇒ G + H ≥ 0 L EMMA 1.1 (Nullspiellemma). Ist der Strukturgraph von G endlich, dann gilt: G + (−G) = 0 Beweis. Das Lemma behauptet, dass der zweite Spieler eine Strategie besitzt, mit der er immer gewinnt. Die Gewinnstrategie ist simpel: Er imitiert jeweils den Zug des ersten Spielers auf dem anderen Spiel. 10 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN 2.2.3. Dominanz. Wichtig ist die folgende Beobachtung: L EMMA 1.2 (Dominanzlemma). G−H ≥0 =⇒ (H > 0 ⇒ G > 0) Beweis. Wir nehmen H > 0 an und betrachten die Möglichkeiten für G. Im Fall G ≤ 0 kann R als anziehender Spieler auf −H ziehen, das er gewinnt. G kann er deshalb als zweiter Spieler absolvieren und somit insgesamt gewinnen, d.h. G − H ≥ 0 ist verletzt. Im Fall Gk0 (d.h. der anziehende Spieler gewinnt G) zieht R als anziehender Spieler auf G, das er gewinnt, da er ja für −H eine sichere Gewinnstrategie hat. D.h. wieder ist G − H ≥ 0 verletzt. Damit haben wir gezeigt: Wenn G − H ≥ 0 erfüllt ist, so muss mit H > 0 auch G > 0 gelten. Ist das kombinatorische Spiel G beispielsweise in der Situation hki = {a, b, . . . | c, d, . . .} und L ist am Zug, dann ergibt ein Zug nach a oder b die Spiele G(a) bzw. G(b), in denen R anzieht. Im Fall G(a) − G(b) ≥ 0 ist der Zug k → a für L mindestens so gut wie der Zug k → b. Hat L nämlich eine Gewinnstrategie bei k → b, dann sicherlich auch bei k → a. Man sagt, dass a die Konfiguration b dominiert, wenn gilt G(a) − G(b) ≥ 0 . 2.2.4. Äquivalenz. Wir nennen zwei Spiele G und H äquivalent, wenn sie (aus der Sicht von L) strategisch äquivalent“ sind, d.h. ” G ∼ H :⇐⇒ G − H = 0 ⇐⇒ G − H ≥ 0 und H − G ≥ 0 Z.B. besagt das Nullspiellemma 1.1 für das Spiel O = {|}: G−G∼O . L EMMA 1.3. Seien G und H beliebige (endliche, normale, kombinatorische) Spiele. Dann gilt H=0 =⇒ G+H ∼ G. 3. NEUTRALE SPIELE 11 Beweis. Wir betrachten das Spiel K =G+H −G=G−G+H . Nach Voraussetzung gewinnt der zweite Spieler immer H. Er gewinnt aber auch immer G − G (Nullspiellemma). Also folgt K = 0. 2.2.5. Vergleichen. Um die Spiele G und H (bzgl. der Gewinnmöglichkeiten von L) zu vergleichen, definiert man gemäss der Dominanzrelation G≥H :⇐⇒ G + (−H) ≥ 0 . Aus der Definition erhält man sofort die Transitiviätseigenschaft des Spielvergleichs: G ≥ H und H ≥ K =⇒ G ≥ K Denn wir haben allgemein: G + (−K) ∼ G + (−K) + O ∼ G + (−K) + H + (−H) ∼ [G + (−H)] + [H + (−K)] . Aus G + (−H) ≥ 0 und H + (−K) ≥ 0 folgt somit sofort die behauptete Transitivität. Auf die gleiche Weise erschliesst man die Richtigkeit der Tabelle: H ∼ K H > K H < K HkK G ∼ H G ∼ K G > K G < K GkK G > H G > K G > K G?K G . K GkH GkK G . K K . G G?K ( ?“ bedeutet, dass die Relation nicht eindeutig bestimmt ist.) ” 3. Neutrale Spiele Das kombinatorische Spiel G heisst neutral, wenn in jeder Konfiguration k beiden Spielern dieselben Optionen zu Folgekonfigurationen zur Verfügung stehen, d.h. hki = {a, b, c, . . . | a, b, c, . . .} . Das Spiel G ist also identisch mit seiner Negation −G und wir erhalten G+G=0 12 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN 3.1. Subtraktionsspiele. Ein typisches Beispiel eines neutralen Spiels ist ein Subtraktionsspiel. Die Konfigurationen sind N -Tupel natürlicher Zahlen κ = (n1 , n2 , . . . , nN ) (ni ∈ N) . Gegeben ist eine weitere Subtraktionsmenge, d.h. eine Menge natürlicher Zahlen D = {d1 , . . . , ds } mit dj ≥ 1 . Wir bezeichnen das zugehörige Subtraktionsspiel mit S = S(D) = S(d1 , . . . , ds ) . Ein Zug in dem durch S gegebenen Spiel besteht darin, dass der Spieler eine Komponente i von κ und eine Zahl dj ∈ D auswählt und subtrahiert: ni → ni − dj falls ni − dj ≥ 0 . B EISPIEL 1.6 (Frösche und Kröten). Auf den ersten Blick scheint das Spiel mit Fröschen und Kröten kein neutrales Spiel zu sein, da die Tiere in entgegengesetzte Richtungen springen. Tatsächlich liegt hier im Grunde ein Subtraktionsspiel vor mit D = {1, 2} (oder D = {1, 2, 3, } usw.) Ein Frosch kann dj Felder springen genau dann, wenn es die Kröte gegenüber kann. 3.1.1. Nim. Subtraktionsspiele mit D = {d ∈ N | d ≥ 1} heissen Nim-Spiele. Im Fall N = 1 (d.h. nur einer Komponente) wird es so formuliert: Von einem Haufen mit ursprünglich n Streichhölzern nehmen die Spieler abwechselnd (beliebig viele) Streichhölzer weg, bis nichts mehr da ist. B EMERKUNG. Im Fall N = 1 gibt es immer eine triviale Gewinnstrategie für den anziehenden Spieler bei n ≥ 1: Er entfernt alle n Streichhölzer. Der zweite Spieler kann dann natürlich nicht mehr ziehen. Im Fall n = 0 verliert der erste Spieler. Bezeichnen wir (im Fall N = 1) eine Konfiguration mit n Streichhölzern mit ∗n (zur Unterscheidung von der natürlichen Zahl n), dann haben wir ∗0 ∗1 ∗2 .. . ∗n = {|} = 0 = {∗0 | ∗0} = {0 | 0} (= ∗) = {∗0, ∗1 | ∗0, ∗1} = {0, ∗ | 0, ∗} = {∗0, ∗1, . . . , ∗(n − 1) | ∗0, ∗1, . . . , ∗(n − 1)}. 3. NEUTRALE SPIELE 13 B EMERKUNG (N IMBERS ). Im humorigen Englischen heissen die Zahlen“ ∗n ” auch Nimbers. Da Deutsche weniger witzig sind, wollen wir sie einfach NimZahlen nennen. Obwohl die Nimspiele mit N = 1 für alle n ≥ 1 gleichwertig zu sein scheinen (der anziehende Spieler hat eine triviale Gewinnstrategie: er nimmt alles), sind die Spiele nicht(!) (strategisch) äquivalent im Sinne unserer früheren Definition: m 6= n ⇐⇒ ∗m 6∼ ∗n Denn sei z.B. n > m. Dann kann der anziehende Spieler das Spiel ∗n + ∗m auf ∗m + ∗m reduzieren, das er (als hernach zweiter Spieler) gewinnt. D.h. wir haben (1) n 6= m ⇐⇒ ∗n + ∗m k 0 . 3.2. S PRAGUE -G RUNDY-Theorie. Eine für die Analyse neutraler Spiele wichtige Beobachtung ist diese: L EMMA 1.4. Sei G ein neutrales Spiel und m ∈ N derart, dass G ∼ ∗m. Dann gilt: (0) m = 0 =⇒ der erste Spieler verliert G. (i) m ≥ 1 =⇒ der erste Spieler gewinnt G. Beweis. Sei m = 0. Dann kann keiner der Spieler einen Zug in ∗0 = {|} ausführen. Also sagt die Voraussetzung G = 0, d.h. der zweite Spieler gewinnt. Bei m ≥ 1 kann der zweite Spieler keine Gewinnstrategie für G besitzen. Denn sonst würde der erste Spieler im Summenspiel G + ∗m im ersten Zug ∗m auf {|} reduzieren - und wäre dann in G der zweite Spieler. Somit würde er G +∗ m gewinnen – im Widerspruch zur Annahme G − ∗m = 0. Die Theorie neutraler Spiele von S PRAGUE und G RUNDY basiert auf der Einsicht, dass jedes neutrale Spiel zu einem Nim-Spiel der Form ∗m äquivalent ist. D EFINITION . Eine Zahl m ∈ N mit G ∼ ∗m heisst Nimzahl des neutralen Spiels G. Diese Zahl wird auch als der Grundywert m = G(G) von G bezeichnet. Aus (1) ersieht man, dass die Nimzahl (bzw. der Grundywert) eines neutralen Spieles eindeutig bestimmt ist. Es soll nun gezeigt werden, dass jedes neutrale Spiel eine Nimzahl hat. 14 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN Seien a, b, c, . . . , t (endlich viele) beliebige natürliche Zahlen. Dann lässt sich das Nim-Spiel formal zu dem Spiel G = {∗a, ∗b, ∗c, . . . , ∗t | ∗a, ∗b, ∗c, . . . , ∗t} verallgemeinern. Tatsächlich ist G jedoch äquivalent zu dem Nimspiel ∗m, wobei (2) m = mex{a, b, c, . . . , t} := min {g ≥ 0 | g ∈ / {a, b, c, . . . , t}} B EMERKUNG. mex“ bedeutet minimal ausgeschlossen ( minimal excluded“). ” ” Um die Richtigkeit der Behauptung G ∼ ∗m einzusehen, müssen wir uns davon überzeugen, dass der zweite Spieler immer das Summenspiel G+∗m gewinnt, d.h. G + ∗m = 0 . Wählt der anziehende Spieler z.B. ∗m und zieht auf eine der Optionen von ∗m = {∗0, ∗1, . . . , ∗(m − 1) | ∗0, ∗1, . . . , ∗(m − 1)} , so kann der zweite Spieler kontern, indem er in G auf die gleiche Position zieht (die ihm ja nach der Definition von m zur Verfügung steht). Als zweiter Spieler gewinnt er dann. Wählt der erste Spieler G und dort z.B. die Position ∗a, so kann der zweite Spieler im Fall a > m die Konfiguration ∗a auf ∗m reduzieren (und dann gewinnen) oder im Fall a < m die Konfiguration ∗m auf ∗a reduzieren (und dann gewinnen). B EMERKUNG. Bei neutralen Spielen ist der Begriff der strategischen Äquivalenz besonders einsichtig. Im Fall von G ∼ ∗m kann der erste Spieler sofort auf eine Option von ∗m ziehen. Der zweite Spieler kann dies, sobald er am Zug ist. Die Gewinnmöglichkeiten in G und in ∗m sind also identisch. Damit kommen wir zum Hauptsatz über neutrale Spiele: S ATZ 1.3 (S PRAGUE (1936), G RUNDY (1939)). Zu jedem endlichen neutralen Spiel G = {A, B, C, . . . , T | A, B, C, . . . , T } gibt es eine natürliche Zahl m = G(G) derart, dass G strategisch äquivalent zu dem Nim-Spiel ∗m ist. Zudem kamm m rekursiv berechnet werden: G(G) = mex{G(A), G(B), G(C), . . . , G(T )}. 3. NEUTRALE SPIELE 15 Beweis. Wir beweisen den Satz per Induktion über den Strukturgraphen von G. Offenbar gilt die Behauptung im Fall, wo dieser nur aus einer Wurzel besteht. Seien nun a, b, c, . . . , t die Nimzahlen der Optionen A, B, C, . . . , T und G0 = {∗a, ∗b, ∗c, . . . , ∗t | ∗a, ∗b, ∗c, . . . , ∗t}. Um den Induktionsschritt zu etablieren, genügt es die Äquivalenz G + G0 = 0 einzusehen. (Denn dann folgt wegen G0 + ∗m = 0 auch G + ∗m = 0.) Das ist aber klar: Zieht der erste Spieler im Spiel G z.B. auf die Position A, so zieht der zweite auf Position ∗a im Spiel G0 . Damit ist G + G0 auf A + ∗a = 0, das der zweite Spieler dann gewinnt. B EISPIEL 1.7 (Frösche und Kröten). Wir nehmen an, dass die Tiere anfänglich n Felder voneinander getrennt sind und 1, 2 oder 3 Felder springen dürfen. Dieses Spiel bezeichnen wir mit F K(n) = F K(n; 1, 2, 3). Die Optionen sind dann F K(n − 1), F K(n − 2), F K(n − 3) . Bezeichnet G(n) die entsprechende Nimzahl, so haben wir G(n) = mex{G(n − 1), G(n − 2), G(n − 3)} und können aus dieser Rekursion leicht eine Tabelle erstellen: 0 1 2 3 4 5 6 7 8 9 10 n G(n) 0 1 2 3 0 1 2 3 0 1 2 Man beachte die Periodizität der Nimzahlen in diesem Beispiel! P- und N -Positionen.2 Da bei neutralen Spielen kein struktureller Unterschied zwischen L und R besteht, unterscheidet man hier besser zwischen dem anziehenden (oder ersten) Spieler und dem zweiten Spieler. Eine Position mit positivem G RUNDY-Wert m > 0 heisst P-Position und eine Position mit G RUNDY-Wert m = 0 N -Position. Also: P-Position = anziehender Spieler gewinnt“ ” N -Position = zweiter Spieler gewinnt“ ” G EWINNSTRATEGIE AUS P -P OSITION : • Der anziehende Spieler zieht auf eine N -Position. 2 In der Literatur wird P und N oft in der entgegengesetzten Bedeutung verwendet 16 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN 3.3. Periodizität. Wir betrachten eine Klasse von Spielen, in der ein einzelnes Spiel durch den Parameter n spezifiziert ist. Damit erhalten wir die Folge G(0), G(1), . . . , G(n), . . . von entsprechenden G RUNDY-Werten. Die Folge ist periodisch mit Periode p, wenn es ein n0 gibt mit der Eigenschaft G(n + p) = G(n) für jedes n ≥ n0 . Nicht jedes Spiel (d.h. eigentlich: Klasse von Spielen) hat eine periodische G RUNDY-Folge. Z.B. hat das (mit einem Haufen gespielte) Nimspiel die Folge 0, 1, . . . , n, . . . 3.3.1. Endliche Subtraktionsspiele. Wir wollen nun einsehen, dass jedes Subtraktionsspiel S = (d1 , . . . , ds ) mit einer endlichen Subtraktionsmenge D = {d1 , . . . , ds } periodisch ist. Die Folge G(n) erhält man rekursiv nach der Mex-Regel aus s natürlichen Zahlen: G(n) = mex {G(n − d1 ), G(n − d2 ), . . . , G(n − ds )} ≤ s , da mex von s natürlichen Zahlen höchstens s ist. Wir betrachten nun alle möglichen Teilsequenze n der festen Länge d = max{d1 , . . . , ds }: G(n), G(n + 1), . . . , G(n + d) . Wegen der Beschränktheit der G RUNDY-Werte gibt es nur endlich viele verschiedene solcher Folgen. Also existiert ein n0 und ein p > d mit der Eigenschaft G(n0 + j) = G(n0 + p + j) (j = 0, . . . , d) . Nach der Konstruktion der G(n) gilt dann natürlich auch G(n + p) = G(n) für alle n ≥ n0 + d . 3.4. Nim-Addition natürlicher Zahlen. Unter der Nim-Summe a ⊕ b der Zahlen a, b ∈ N verstehen wir die Nimzahl des Summenspiels ∗a + ∗b: a ⊕ b := G(∗a + ∗b) , d.h. ∗ a + ∗b = ∗(a ⊕ b) . Die Optionen des Nim-Summenspiels ∗a+∗b bestehen aus den Nim-Positionen ∗a0 + ∗b und ∗ a + ∗b0 (a0 < a, b0 < b) . Also kann man a ⊕ b rekursiv nach der Mex-Regel (2)berechnen: a ⊕ b = mex{a ⊕ b0 , a0 ⊕ b | a0 < a, b0 < b} 3. NEUTRALE SPIELE 17 Man überzeugt sich leicht von der Gültigkeit des Kommutativ- und Assoziativgesetzes: a⊕a = 0 a⊕b = b⊕a (a ⊕ b) ⊕ c = a ⊕ (b ⊕ c) Um zu einer direkten Rechenregel für Nimaddition zu kommen, machen wir eine Reihe von Beobachtungen über G RUNDY-Werte. (NS.0) Ist a eine Option des neutralen Spiels G, so gilt G(a) 6= G(G) . (NS.1) Für alle Zahlen a, b ∈ N sind die Nimzahlen a ⊕ 0, a ⊕ 1, . . . , a ⊕ b paarweise verschieden. (NS.0) ist eine Konsequenz der Mex-Regel, die G(a) für G(G) aussschliesst. Da bei i < j das Spiel ∗a + ∗i eine Option des Spiels ∗a + ∗j ist, folgt (NS.1) sofort aus (NS.0). (NS.2) a, b < 2p (NS.3) a < 2p =⇒ =⇒ a ⊕ b < 2p . a ⊕ 2p = a + 2p . Wir beweisen die Regeln (NS.2) und (NS.3) per Induktion über p, wobei der Fall p = 0 trivial ist. Wir nehmen nun die Gültigkeit beider Regeln für p − 1 an und zeigen zuerst (NS.2) im Fall p. Im Fall a, b < 2p−1 folgt a ⊕ b < 2p−1 < 2p aus der Induktionsvoraussetzung. Im Fall a < 2p−1 ≤ b < 2p schreiben wir b = 2p−1 + b0 mit b0 < 2p−1 . Da (NS.2) und (NS.3) für p − 1 gelten, finden wir a ⊕ b = a ⊕ (2p−1 + b0 ) = a ⊕ 2p−1 ⊕ b0 = a ⊕ b0 ⊕ 2p−1 = a ⊕ b0 + 2p−1 < 2p . Im Fall 2p−1 ≤ a, b < 2p schreiben wir a = 2p−1 + a0 . Ganz analog zum eben diskutierten Fall finden wir dann (unter Benutzung von 2p−1 ⊕ 2p−1 = 0): a ⊕ b = 2p−1 ⊕ a0 ⊕ 2p−1 ⊕ b0 = 0 ⊕ a0 ⊕ b0 < 2p−1 < 2p . Nun beweisen wir (NS.3) für den Fall p per Induktion über a. Die G RUNDY-Werte der Optionen des Summenspiels ∗a + ∗2p zerfallen in die Klassen A und B, wobei A = {0 ⊕ 2p , . . . , (a − 1) ⊕ 2p } = {0 + 2p , . . . , (a − 1) + 2p } (nach Voraussetzung) B = {a ⊕ 0, . . . , a ⊕ (2p − 1)} Nach (NS.2) sind die Zahlen in B alle kleiner als 2p und nach (NS.1) alle verschieden. Also gilt B = {0, 1, . . . , 2p − 1} und damit mex (A ∪ B) = a + 2P p . 18 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN Aus den Rechenregeln erkennt man leicht, wie man die Nim-Summe über binäre Addition berechnet. Sei etwa a, b < 2p . Dann erhalten wir aus der Binärdarstellung mit den Ziffern αi , βi ∈ {0, 1}: a= p−1 X i=0 i αi 2 und b= p−1 X i=0 i βi 2 =⇒ a⊕b= p−1 X (αi ⊕ βi )2i i=0 B EISPIEL 1.8 (Frösche und Kröten). Wir spielen nun das Spiel mit 2 Fröschen und 2 Kröten, die maximal 3 Felder springen dürfen. Die Tiere seien in 2 Bahnen jeweils gegenüber plaziert. Die Abstände (Leerfelder) zwischen den Tieren seien 7 und 10. Wer gewinnt aus dieser Position? Nach B SP. 1.7 sind die G RUNDY-Werte der beiden Einzelspiele (auf den Bahnen) G(7) = 3 und G(10) = 2. Das Gesamtspiel ist die Summe der Einzelspiele und hat folglich den G RUNDY-Wert 3 ⊕ 2 = (1 · 20 + 1 · 21 ) ⊕ (0 · 20 + 1 · 21 ) = 1 · 20 + 0 · 21 = 1 . Also liegt eine P-Position vor: der anziehende Spieler gewinnt. 3.5. Verallgemeinerungen. Die Resultate des vorangegangenen Abschnitts wurden unter der Prämisse abgeleitet, dass die fraglichen Spiele endlich sind. Dennoch gelten sie auch oft für scheinbar allgemeinere Spiele, wenn diese auf endliche Spiele zurückgeführt werden können. B EISPIEL 1.9 (N ORTHCOTTs Spiel). Wir erlauben den Tieren im Frosch-Krötenspiel auch das eventuelle Zurückweichen um die erlaubte Anzahl von Feldern. Damit ist das Spiel potientiell unendlich. Trotzdem ändert sich an den Gewinnchancen nichts. Nehmen wir an, die Frösche haben eine Gewinnstrategie in der alten Form des Spiels. Wenn nun eine Kröte um x Felder zurückweicht, wird der entsprechende Frosch sofort um x Felder vorrücken. Da die Kröte nicht unendlich weit zurückweichen kann, hilft ihr dieser Zug im Endeffekt nichts. Er verlängert nur die Spieldauer ein wenig. B EACHTE : Der Spieler mit der Gewinnstrategie braucht nie zurückweichen. B EISPIEL 1.10 (Misère-Nim). Bei der misère Variante von Nim hat verloren, wer den letzten Zug durchgeführt hat. Das Spiel ist also nicht normal. Man erhält es als normales Spiel, wenn man im Nim-Spiel die Option ∗0 verbietet. Das Spiel ist neutral und besitzt dem Satz von S PRAGUE -G RUNDY zufolge eine Nim-Zahl als Grundy-Wert, die ausgerechnet werden kann. 3. NEUTRALE SPIELE 19 3.5.1. Take-and-Break. Hier handelt es sich um Nim-artige Spiele, bei denen nicht nur etwas weggenommen werden darf ( take“), sondern mögli” cherweise etwas zerteilt werden darf ( break“). Allerdings sind auch diese ” Spiele neutral, sodass Gewinnstrategien über die zugeordneten G RUNDYWerte berechnet werden können. B EISPIEL 1.11 (Kayles). Hier stehen n Kegel in einer Reihe. Ein Spieler darf in einem Zug entweder einen Kegel oder zwei nebeneinanderstehende Kegel weg” schiessen“. (Durch das Wegschiessen wird eine Kegelreihe durch einen Zug möglicherweise in zwei Teilreihen aufgebrochen.) B EISPIEL 1.12 (L ASKER-Nim). Zusätzlich zu den Wegnehmzügen von Nim hat man beim L ASKER-Nim die Zugmöglichkeit, einen Haufen in zwei nichtleere Haufen zu unterteilen. B EISPIEL 1.13 (G RUNDY-Nim). Im Gegensatz zu L ASKER-Nim darf man hier nur den Zug ausführen, der einen Haufen in zwei verschieden grosse Haufen unterteilt. B EMERKUNG. Es wird vermutet, dass die Folge von G RUNDY-Werten bei G RUN DY -Nim periodisch ist. Ob die Vermutung richtig ist, ist eines der bekanntesten offenen Fragen der kombinatorischen Spieltheorie. Mein weiss nicht einmal, ob die Werte beschränkt sind. 3.5.2. Oktale Spiele. Viele take-and-break-artige Spiele werden mit Haufen von Spielsteinen“gespielt und haben Regeln, die man durch (mögli” cherweise unendliche) (0, 1)-Matrizen D = [dij ] i=0,1,... j=0,1,... (dij ∈ {0, 1}) spezifiziert. Dabei bedeutet dij = 1 die Regel: Man darf einen beliebigen Haufen auswählen, dort i Steine entfernen und den Resthaufen in j nichtleere Teilhaufen zerlegen. Meistens werden die Zeilensummen in der Regelmatrix D endlich sein. Dann ist es üblich, die Zeilen binär zu kodieren, d.h. die folgenden Zahlen anzugeben: X di = dij 2j . j≥0 Die gibt man dann als Typ d des Spiels an, wobei d = 0 · d0 d1 d2 . . . di . . . . Das Spiel vom Typ d heisst oktal, wenn 0 ≤ di ≤ 7 für alle i erfüllt ist. 20 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN B EMERKUNG. Wegen di ≤ 7 darf in einem Oktalspiel ein Haufen nie in mehr als 2 Teilhaufen zerlegt werden. L EMMA 1.5. Die Subtraktionsspiele sind genau die Spiele vom Typ d = 0 · d0 d1 d2 . . . di . . . mit di ∈ {0, 3} . Beweis. Darf man im Subtraktionsspiel nie i Steine wegnehmen, dann gilt natürlich di = 0. Im Fall, wo man i Steine entfernen darf, bleibt danach entweder kein Haufen übrig (d.h. man darf in 0 Haufen zerlegen) oder es bleibt genau ein Haufen übrig. Also hat man di = 1 · 20 + 1 · 21 + 0 · 22 = 3 . (Grosse) Vermutung: Jedes oktale Spiel vom Typ d = 0 · d0 d1 d2 . . . dn−1 dn besitzt eine periodische G RUNDY-Folge. 3.5.3. (Grünes) Hackenbusch. Gespielt wird auf einem Graphen G = (V, E) mit der Menge V von Knoten und der Menge E von “grünen“ Kanten. Eine Menge W ⊆ V von Knoten ist als Wurzelmenge ausgezeichnet. In einem Spielzug entfernt ein Spieler eine Kante. Übrig bleiben dann alle Kanten, die noch zu einer Wurzel verbunden sind. B EMERKUNG. Beim blau-roten Hackenbusch (s. Abschnitt 5) sind die Kanten von G rot und blau gefärbt. Spieler R darf nur rote und Spieler L nur blaue Kanten abhacken. Im Gegensatz zum grünen Hackenbusch ist dieses Spiel im allgemeinen nicht neutral. Ein Pfad der Länge n (d.h. n Kanten) und Anfangsknoten ( Wurzel“) w0 , ” w0 − v1 − . . . − vn , erlaubt n Optionen (nämlich die Teilpfade entsprechender Länge von w0 aus). Also ist n der G RUNDY-Wert des Pfads. N disjunkte Pfade der Längen n1 , . . . , nN haben folglich den G RUNDY-Wert n1 ⊕ n2 ⊕ . . . ⊕ nN . Für das Hackenbusch-Spiel macht es offensichtlich keinen Unterschied aus, wenn wir die Anfangspunkte der N Pfade zu einer gemeinsamen Wurzel w0 zusammenheften. Sei nun T ein Wurzelbaum mit Wurzel w0 . Seien v1 , . . . , vN die Söhne von w0 und T1 , . . . , TN die entsprechenden bei den Söhnen verwurzelten 4. SPIELE UND ZAHLEN 21 Teilbäume von T . Dann ergibt sich für den G RUNDY-Wert eine rekursive Beziehung: (3) G(T ) = [1 + G(T1 )] ⊕ . . . ⊕ [1 + G(TN )] Um (3) einzusehen, ersetzen wir in Gedanken jeden Teilbaum Ti durch einen Pfad der Länge ni = G(Ti ) . Offensichtlich ist das Spiel nach dieser Ersetzung äquivalent zum Ausgangsspiel: jede Option bzgl. Ti entspricht ja per Definition einer Option im Nimspiel ∗ni ! Zur Wurzel w0 fortgedacht haben diese N Pfade die Längen 1 + ni (i = 1, . . . , N ) . Somit folgt aus der obigen Überlegung, dass sich G(T ) tatsächlich wie behauptet rekursiv berechnen lässt: G(T ) = (1 + n1 ) ⊕ . . . ⊕ (1 + nN ) . R ECHENMETHODIK . Zur Berechnung von G(T ) arbeitet man den Baum T von den Blättern zu der Wurzel ( von unten nach oben“) ab: Jeder Knoten erhält einen ” Wert, der aus den Werten seiner Söhne ermittelt wird – völlig analog zur Vorgehensweise bei der Berechnung einer Maxmin-Strategie aus dem Strukturgraphen. 4. Spiele und Zahlen Kehren wir nun wieder zu den Spielern L und R zurück, die ein nicht notwendigerweise neutrales Spiel G spielen. Jeder Spielzug zu einer Option kann als der Beginn eines neuen Spiels mit der entsprechenden Startposition verstanden worden. Wir betrachten deshalb G als rekursive definiert, L G = {g1L , . . . , gm | g1R , . . . , gnR } , wobei die Optionen g L und g R selber wieder Spiele sind. B EMERKUNG. Da G nicht als neutral vorausgesetzt wird, können wir G natürlich auch keine Nim-Zahl als G RUNDY-Wert zuordnen. Es sei aber an die allgemein schon eingeführten Spielbewertungen G = 0, G > 0, G < 0, Gk0 erinnert. Wir wollen nun systematisch diese Spiele erzeugen und beginnen mit dem Spiel 0 := {|} 22 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN und sagen, es sei am Tag null erschaffen. Am Tag eins werden die Spiele erschaffen, deren Optionen schon am Tag null erschaffen wurden, d.h. {0 |}, {| 0}, {0 | 0} . B EMERKUNG. 0 und {0 | 0} sind Nim-Spiele, {0 |} und {| 0} jedoch nicht. Wir schreiben zur Abkürzung ∗0 := {|} und ∗ := {0 | 0} . Zur weiteren Abkürzung setzen wir 1 := {0 |} und − 1 := {| 0} und bemerken, dass -1“genau die Negation des Spiels 1“ ist, da hier die Optionen ” ” von L und R vertauscht sind. Allgemein erschafft man am Tag n alle möglichen Spiele mit den Optionen, die schon am Tag n − 1 als Spiele zur Verfügung standen So erhalten wir z.B. die Spiele n := {0, 1, . . . , n − 1 |} und − n := {| 0, −1, . . . , −(n − 1)} . Am Tag n erschaffen wir u.a. nicht nur das Spiel n und sein Negatives −n sondern auch das Nimspiel ∗n = {∗0, . . . , ∗(n − 1) | ∗0, . . . , ∗(n − 1)} . Dies sind nicht die einzigen Typen von Spielen. Am zweiten Tag entstehen z.B. die Spiele ↑:= {0 | ∗}, ↓:= {∗ | 0}, ±1 := {1 | −1} . 4.1. Vergleichen von Spielen. Seien nun G und H Spiele, die nach dem obigen Kreationsprinzip erschaffen wurden. Wir definieren nun analog zu unserer früheren Begriffsbildung: G>H G<H G≥H G≤H :⇐⇒ :⇐⇒ :⇐⇒ :⇐⇒ L gewinnt G − H R gewinnt G − H L gewinnt G − H, wenn R anzieht R gewinnt G − H, wenn L anzieht Entsprechend nennen wir G positiv, wenn G > 0 gilt und negativ im Fall G < 0. Definitionsgemäss gewinnt also L das Spiel G genau dann, wenn G positiv ist (unabhängig davon, wer anzieht) usw. 4. SPIELE UND ZAHLEN 23 B EMERKUNG. Da bekanntlich das Spiel G − G immer ein Gewinnspiel für den zweiten Spieler ist, gilt G ≥ G und G ≤ G . L EMMA 1.6. Sei g L eine linke und g R eine rechte Option des Spiels G. Dann gilt g L 6≥ G und g R 6≤ G . Beweis. Wir zeigen, dass g L ≥ G unmöglich ist. Wählt R nämlich im Spiel g L −G das Spiel −G und zieht dort auf −g L , so geht das Spiel über in das Spiel gL − gL , das genau dann von L gewonnen wird, wenn L nicht anzieht. B EMERKUNG. Sei G ≥ 0 und H ≥ 0. Dann gilt auch G + H ≥ 0. Zieht nämlich R z.B. auf G an so erwidert L mit seiner dortigen Gewinnstrategie, bis R auf H umsteigt. Aber auch dann kann L nach Voraussetzung mit einer Gewinnstrategie kontern. L EMMA 1.7 (Transitivität). Für alle Spiele G, H, K gilt: Aus G ≥ H und H ≥ K folgt G ≥ K . Beweis. Wie früher (s.a. die vorangehende Bemerkung). Ordnungen und Präordnungen. Wir sagen, eine Menge M sei durch die binäre Relation ≤ geordnet3, wenn für alle a, b, c ∈ M gilt (O.1) a ≤ b; (O.2) a ≤ b und b ≤ a impliziert a = b; (O.3) a ≤ b und b ≤ c impliziert a ≤ c. Die Menge aller Spiele erfüllt (O.1) und (O.3) – aber nicht notwendigerweise (O.2). Deshalb ist die Menge aller Spiele nicht geordnet sondern (nur) prägeordnet. Von diesem Problem“ kann man sich befreien, indem man zu einer Äquivalenzre” lation auf der Menge der Spiele übergeht und definiert G ∼ H (bzw. G = “ H) :⇐⇒ G ≥ H und G ≤ H . ” G = H bedeutet dann, dass G − H (bzw. H − G) immer vom zweiten Spieler gewonnen wird. M.a.W. G=H 3 streng genommen. halbgeordnet ⇐⇒ G−H ∼0. 24 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN B EISPIEL 1.14 ({1|3} = 2). Wir betrachten {1|3} − 2 = {1|3} + {| 0, −1}. Offensichtlich gewinnt hier L, wenn R anzieht, d.h. {1|3} − 2 ≥ 0 . Ebenso sieht man 2 − {1|3} = {| 0, −1} + {−3 | −1} ≥ 0 d.h. {1|3} ∼ 2 . 4.2. Zahlen. Wir haben schon gesehen, dass man mit den Nimzahlen rechnen kann. Aber auch mit vielen anderen der gerade erschaffenen Spiele kann man rechnen, als ob es sich um richtige Zahlen“ handelte. Z.B. erhält ” man die ganzen Zahlen: B EISPIEL 1.15 ( n“ + 1“ = n + 1“). Es gilt n + 1 − (n + 1) = 0, d.h. der zweite ” ” ” Spieler gewinnt immer das Spiel {0, 1, . . . , n − 1 |} + {0|} + {| 0, −1, . . . , −n}. Denn beiden stehen n + 1 Züge zur Verfügung. Der zweite Spieler kann also immer auf einen Zug des ersten Spielers antworten. Mit den Spielen erschafft man aber auch Brüche: B EISPIEL 1.16 ({0|1} = 1/2). Wir vergleichen die Summe {0|1} + {0|1} mit dem Spiel 1 = {0|}. Das Spiel {0|1} + {0|1} − 1 = {0|1} + {0|1} + {|0} wird immer vom zweiten Spieler gewonnen4. Also haben wir {0|1} + {0|1} ∼ 1 und setzen deshalb {0|1} := 1/2 . Welche Spiele sollte man nun als Zahlen“ ansehen? Sicher sollte ” G = {|} = 0 eine Zahl sein. Motiviert von den reellen Zahlen würden wir dann erwarten, dass Zahlen immer vergleichbar sein sollten. Ausserdem sollten Zahlen aus schon vorhandenen Zahlen erschaffen sein. Wir nennen deshalb ein Spiel L 6 0 | g1R , . . . , gnR } = G = {g1L , . . . , gm eine Zahl, wenn gilt 1. Alle linken und rechten Optionen g L und g R sind Zahlen. 2. Es gibt keine zwei Optionen g L und g R mit g L ≥ g R . 4 Ausarbeitung der Details als Übung dem Leser überlassen! 4. SPIELE UND ZAHLEN 25 B EMERKUNG . Eigenschaft 2. erkärt sich aus der Forderung, dass Zahlen einerseits vergleichbar sein sollten, andererseits aber g L ≥ G ≥ g R nicht möglich ist (Lemma 1.6). Aus der Definition folgt sofort, dass 0 die einzige Nimzahl ist, die auch eine Zahl“ ist. ” S ATZ 1.4. Ist G eine Zahl mit der linken Option g L und der rechten Option g R , dann gilt gL < G < gR . Beweis. Wir zeigen g L < G (d.h. L gewinnt das Spiel G − g L ). Zieht L an, so kann L in G auf g L ziehen und gewinnt danach als nunmehr zweiter Spieler das resultierende Spiel g L − g L . Es ist also nur noch der Fall zu betrachten, wo R anzieht. Wir argumentieren per Induktion über den Erschaffungstag des Spiels. Wenn R z.B. G spielt, auf eine Position g R zieht und dann gewinnt, so heisst das, dass beim Anzug von L das Spiel g R − g L vom Spieler R gewonnen wird. M.a.W.: gL ≥ gR , was bei Zahlen G definitionsgemäss nicht sein kann. Zieht R auf eine Position −g LL und gewinnt, dann folgt beim nunmehrigen Zug von L auf g L (im Spiel G) ebenso g L − g LL ≤ 0 , d.h. g L ≤ g LL , was (per Induktion) schon ausgeschlossen ist. KOROLLAR 1.2. Für je zwei Zahlen X und Y gilt: entweder X ≤ Y oder Y ≤ X . Beweis. Wir nehmen X 6≤ Y an, d.h. R gewinnt nicht notwendigerweise das Spiel X − Y , wenn L anzieht. Es gibt also entweder ein xL (im Spiel X) mit der Eigenschaft xL − Y ≥ 0 oder ein −y R (im Spiel −Y ) mit der Eigenschaft X − y R ≥ 0. Aus Satz 1.4 schliessen wir deshalb X > xL ≥ Y oder X ≥ y R ≥ Y . B EISPIEL 1.17 (Positive Nichtzahlen). Da ∗ = {0|0} keine Zahl ist, ist auch das Spiel ↑= {0|∗} keine Zahl. Aber es gilt ↑> 0, denn es gewinnt offenbar L. (Auch Nimzahlen sind typischerweise positiv.) L EMMA 1.8. Für jede Zahl X gilt: X + ∗ = {X | X}. 26 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN Beweis. Die Behauptung ist richtig im Fall X = 0: 0 + ∗ = ∗ = {0 | 0} . Sei nun X = {xL | xR }. Wir argumentieren nun per Induktion (Erschaffung der Zahlen!) und wollen zeigen, dass der zweite Spieler immer das Spiel X − {X | X} + ∗ = X + {−X | −X} + ∗ gewinnt. Wir nehmen oBdA R als ersten Spieler an. Spielt R dann {−X | −X} oder ∗, so kann L die Konfiguration X −X +0=X −X =0 erzielen, die er als zweiter Spieler gewinnt. Spielt R das Spiel X, so kontert L mit dem Zug auf −X und erreicht die Konfiguration xR − X + ∗ , die er wegen xR − X > 0 (Satz 1.4) gewinnt. Nehmen wir (in Fortführung von B SP. 1.16) an, dass die Zahl 1 1 = 0 | n−1 > 0 . 2n 2 schon definiert ist. Wir behaupten 1 1 X = 0 | n = n+1 2 2 und müssen dazu zeigen: 1 1 1 1 = {0 | n } + {0 | n } + {− n−1 | 0} = 0 . n 2 2 2 2 In der Tat, zieht R an, dann führt die Option 0 zum Gewinn von L, da 0 unscharf ist und die beiden anderen Spiel positiv sind, d.h. ohnehin immer von L gewonnen werden . Ebenso führt aber auch Rs Wahl der Option 1/2n zum Gewinn von L. Denn mit Hilfe von Satz 1.4 folgert man X +X − 1 1 1 1 1 } + n − n = {0 | n } + 0 = {0 | n } > 0 . n 2 2 2 2 2 Zieht L an und wählt z.B. die Option 0, dann erhält man die Konfiguration {0 | 0 + {0 | 1 1 }− n , n 2 2 die nun R reduzieren kann auf 0+ 1 1 − n =0 n 2 2 5. FÄRBUNGSSPIELE 27 und somit (als dann zweiter Spieler) gewinnt. Wählt L die Option −1/2n−1 , so etabliert mit der Option 1/2n die für R gewinnbringende Konfiguration {0 | 1 1 1 1 1 } + n − n−1 = {0 | n } − n−1 < 0 n 2 2 2 2 2 (vgl. Satz 1.4) . Allgemein kann man auf diese Weise zeigen: 2p + 1 p p+1 = | n 2n+1 2n 2 Wir erhalten also insbesondere alle Binärbrüche als Zahlen“. ” B EMERKUNG. Die Resultate in diesem Abschnitt deuten an, dass man den gesamten Aufbau der reellen Zahlen auch spieltheoretisch begründen kann. Da die Theorie z.B. der Nimzahlen nicht unter die Arithmetik des reellen Zahlkörpers fällt, erkennt man diese Konstruktionen als viel allgemeiner als die des üblichen Aufbaus der reellen Zahlen. Literatur: J.H. C ONWAY. On Numbers and Games. A.K. Peters, 2001 5. Färbungsspiele Viele kombinatorische Optimierungsprobleme kann man als Färbungsprobleme auf Graphen auffassen. Wir wollen hier ein paar wenige dieser Probleme in einer spieltheoretischen Form ansprechen, um die Ideen der vorangegangenen Abschnitte zu illustrieren. 5.1. Blau-rotes Hackenbusch. Wie beim grünen Hackenbusch liegt uns ein Graph G mit einer als Wurzeln“ markierten Teilmenge von Knoten ” vor. Die Kanten sind allerdings nun blau oder rot gefärbt. Spieler L darf nur blaue und Spieler R ausschliesslich rote Kanten entfernen. Welchen (Spiel-)Wert sollten wir z.B. einem von einer Wurzel w0 ausgehenden Pfad mit n Kanten zuordnen, der nur blaue Kanten hat? Hier darf nur L den Pfad zerhacken. Also finden wir: (n = 0) ∼ {|} = 0 (n = 1) ∼ {0 |} = 1 (n = 2) ∼ {1 |} = 2 usw. Das Spiel auf dem blauen Pfad ist also äquivalent zu dem Spiel n“. Das ” Spiel auf einem roten Pfad mit n Kanten wäre analog äquivalent mit dem Spiel −n“. ” 28 1. ABSTRAKTE SPIELE, KOMBINATORISCHE SPIELE UND ZAHLEN B EISPIEL 1.18. Beim Hackenbuschspiel auf dem Pfad mit den 2 Kanten w0 − b − r kann R nur die rote Kante abhacken. Der Zug von L entfernt jedoch alle Kanten, d.h. der Spielwert ist 1 {0 | 1} = . 2 (Das kann man so sehen: Gegenüber der Situation w0 − b mit Wert {1|0} = 1 hat zwar R keine bessere Gewinnchance (R verliert garantiert). R kann aber das Spiel in die Länge ziehen. Die Position von L ist also weniger stark.) 5.2. Knotenfärben. L und R färben die Knoten eines Graphen G abwechselnd blau bzw. rot derart, dass benachbarte Knoten immer verschieden gefärbt sind. Verloren hat, wer nicht mehr zulässig färben kann, wenn er am Zug ist. L EMMA 1.9. Sei k die momentane Färbungskonfiguration auf dem Graphen G, k L eine linke und k R eine rechte Option. Dann gilt kL + ∗ ≤ k ≤ kR + ∗ (mit ∗ = {0|0}) . Beweis. Um beispielsweise k ≤ k R + ∗ zu erhalten, müssen wir beweisen: k R + ∗ + (−k) = (k R + ∗) + (−k) ≥ 0 . Dazu bemerken wir, dass die Addition von ∗ zu einer Konfiguration äquivalent ist mit der Hinzufügung eines bislang ungefärbten isolierten Knotens zu G. v sei der Knoten, in dem sich k von k R unterscheidet (und der deshalb bzgl. k R rot gefärbt ist). Mit dem isolierten Knoten kann L die Färbung von v kompensieren, wenn R anzieht: L übt nämlich bzgl. −k die Rolle von R beim Färben von G aus (und umgekehrt). L kann deshalb die Züge, die R auf (k R + ∗) bzw. (−k) ausführt, allemal auf (−k) bzw. (k R + ∗) imitieren und gewinnt somit als zweiter Spieler. Angenommen, wir wissen schon ( per Induktion“), dass alle Optionen k L ” und k R aus der Konfiguration k heraus immer von der Form Zahl oder Zahl + ∗ sind. Gilt dann k = k L + ∗ oder k = k R + ∗, so ist auch k von dieser Form, denn es gilt ja generell ∗+∗=0. Im andern Fall haben wir immer gemäss Lemma 1.9 die strikte Dominanzrelation kL + ∗ < k < kR + ∗ . 5. FÄRBUNGSSPIELE 29 Wegen z.B. k R − k + ∗ > 0 schliessen wir dann auch k R − k = (k R − k + ∗) + ∗ > 0 d.h. wir erhalten somit ebenso kL < k < kR . P ROPOSITION 1.1. Beim Knotenfärbungsspiel ist der Wert jeder Konfiguration von der Form z oder z∗ := z + ∗ , wobei z eine Zahl ist . Beweis. Per Induktion nehmen wir an, dass der Wert jeder Option von z entweder eine Zahl oder eine Zahl plus ∗ ist. Wir nennen die (vom Zahlenanteil her) besten linken Optionen x oder x∗ und die besten rechten Optionen y oder y∗. Nach der vorangehenden Diskussion ist nur noch der Fall x<k<y ( ←→ x∗ < k < y∗ ) zu untersuchen. Wir beobachten nun z ∼ {x, x∗ | x, y∗} ∼ {x | y}, d.h. {x, x + ∗ | y, y + ∗} − {x | y} = {x, x + ∗ | y, y + ∗} + {−y | −x} = 0 . Folglich ist z eine Zahl. B ODLAENDERs Spiel. Auch hier färben die Spieler abwechselnd die Knoten eines Graphen unter der Vorgabe, dass benachbarte Knoten verschieden gefärbt werden müssen. L und R bedienen sich nun aber aus einem Vorrat von c verschiedenen Farben. L hat gewonnen“, wenn der Graph vollständig ” gefärbt vorliegt. Wird diese Situation nicht erreicht, geht das Spiel an R. Eine interessante Frage ist hier: Was ist die spielchromatische Zahl“ (näm” lich das kleinste c, das L eine Gewinnstrategie garantiert) des Graphen?