Bayerische Julius-Maximilians-Universität Würzburg Erste Staatsprüfung für das Lehramt an Realschulen Frühjahr 2008 Schriftliche Hausarbeit Thema: „Kombinatorische Spieltheorie am Beispiel von Nim und Euklid“ eingereicht von: Stefanie Hofmann Fach: Mathematik eingereicht am: 30.11.2006 Dozent: Prof. Dr. Jörn Steuding Das Abenteuergefühl ist ein Element des Spiels. Wir setzen uns der Ungewissheit des Schicksals aus und erleben, wie wir es durch unsere eigene Tätigkeit in den Griff bekommen. Spielautor Alex Randolph 2 Inhaltsübersicht 1. Einleitung ........................................................................................................ 5 2. Spieltheorie und Arten von Spielen .................................................................. 6 2.1. Das Spiel................................................................................................... 6 2.2. Die Motivation zum Spiel.......................................................................... 7 2.3. Arten von Spielen...................................................................................... 7 2.4. Mathematik im Spiel ................................................................................. 9 2.5. Geschichte der Spieltheorie ..................................................................... 12 2.6. Kurzbiographien der Begründer der Spieltheorie ..................................... 13 3. Kombinatorische Spieltheorie ........................................................................ 16 3.1. Kombinatorische Spiele........................................................................... 16 3.2. Zugwahl und Zermelos Bestimmtheitssatz............................................... 17 3.3. Strategie und Minimax ............................................................................ 18 3.4. Gerechtigkeit im Spiel............................................................................. 24 4. Nim................................................................................................................ 26 4.1. Geschichte............................................................................................... 26 4.2. Standard-Nim.......................................................................................... 28 4.2.1. Spielregeln ....................................................................................... 28 4.2.2. Analyse ............................................................................................ 29 4.3. Lasker-Nim ............................................................................................. 32 4.3.1. Spielregel ......................................................................................... 32 4.3.2. Analyse ............................................................................................ 33 4.4. Schwarz-Weiß-Nim................................................................................. 41 4.4.1. Spielregel ......................................................................................... 41 4.4.2. Analyse ............................................................................................ 43 4.5. Misère-Spiel............................................................................................ 56 5. Kettenbrüche und das Nim-artige Spiel Euklid............................................... 58 5.1. Kettenbrüche ........................................................................................... 58 5.1.1. Endliche Kettenbrüche...................................................................... 58 5.1.2. Unendliche Kettenbrüche.................................................................. 63 5.2. Der Goldene Schnitt ................................................................................ 65 3 5.3. Das Spiel Euklid...................................................................................... 68 5.3.1. Spielregeln ....................................................................................... 68 5.3.2. Gewinnstrategien.............................................................................. 69 5.3.3. Gewinnstrategie über den Goldenen Schnitt...................................... 71 5.3.2. Gewinnstrategie über Kettenbrüche .................................................. 80 5.3.3. Wie oft hat Spieler 1 eine Gewinnstrategie?...................................... 85 5.3.4. Die Länge des Spiels ........................................................................ 86 5.3.5. Das Spiel Euklid und der Calkin-Wilf-Baum .................................... 90 6. Anhang .......................................................................................................... 92 6.1. Literaturverzeichnis................................................................................. 92 7. Danksagungen................................................................................................ 94 8. Erklärung ....................................................................................................... 95 4 1. Einleitung Diese schriftliche Hausarbeit handelt von der kombinatorischen Spieltheorie. Diese wird insbesondere an den Spielen Nim und Euklid dargestellt. Zunächst wird dem Leser ein Überblick über die Spieltheorie in ihrer ganzen Schönheit geboten. Dabei werden die verschiedenen Spielarten besprochen und ein Blick in die noch relativ kurze Vergangenheit der Spieltheorie geworfen. Die Kurzbiographien einzelner Spieltheoretiker zeigen, dass es nicht nur Mathematiker sind, die sich mit diesem interessanten Thema befassen. Im dritten Kapitel wird dann der eigentliche Inhalt meiner Arbeit besprochen, nämlich die kombinatorische Spieltheorie. Hier werden die allgemeinen Eigenschaften kombinatorischer Spiele sowie grundlegende Elemente der kombinatorischen Spieltheorie angesprochen. Das vierte Kapitel handelt von Nim-Spielen. Nach einem kurzen Ausflug in die Geschichte des Nim-Spiels werden vier verschiedene Nim-Arten vorgestellt und analysiert: Standard-Nim, Lasker-Nim, Schwarz-Weiß-Nim sowie das MisèreSpiel. Im fünften Kapitel wird das Nim-artige Spiel Euklid mit seinen beiden Gewinnstrategien vorgestellt. Da die eine Gewinnstrategie über Kettenbrüche ermittelt wird, die andere über den Goldenen Schnitt, werden in einem Vorspann diese beiden Aspekte genauer vorgestellt. 5 2. Spieltheorie und Arten von Spielen 2.1. Das Spiel Schon das Wort Spiel hat eine sehr vielschichtige Bedeutung. Es gibt zum einen Unterhaltungsspiele. Dazu gehören Brett-, Würfel-, Karten- und Glücksspiele, aber auch Murmelspiele, Bowling und Boccia und noch viele andere mehr. Hierzu zählt auch der Sport als mildere Form eines Kampfspiels. Man spricht aber auch vom Leben als eine Art Spiel und bezeichnet die natürliche Neugierde als Spieltrieb. Die Herkunft des Substantivs „Spiel“, mittelhochdeutsch und althochdeutsch „spil“, niederländisch „spel“ und des zugehörigen Verbs „spielen“, ist unbekannt. Das Nomen bewahrte seine Grundbedeutung „Tanz, tänzerische Bewegung“ bis in die mittelhochdeutsche Zeit, doch bedeutete es von Beginn an häufig „Kurzweil, unterhaltende Beschäftigung, fröhliche Übung“. Länger als das Nomen hielt sich beim Verb spielen (mittelhochdeutsch „spiln“, althochdeutsch „spilon“, niederländisch „spelen“, altenglisch „spilian“) seine älteste Bedeutung „sich lebhaft bewegen, tanzen“, die natürlich vom heutigen Sprachgefühl als „sich spielerisch bewegen“ empfunden wird.1 Unterhaltungsspiele gab es schon im Altertum in Ägypten. Das wohl berühmteste Spiel, nämlich das kombinatorische Spiel Schach, stammt aus Indien oder China und erhielt schon im 6. Jahrhundert nach Christus die Form, in der das Schachspiel heute noch gespielt wird. Es wird ein kombinatorisches Spiel genannt, weil es bei diesem Spiel auf die Kombinationen von Spielzügen ankommt. Das Schachspiel verbreitete sich über das oströmische Reich und über das arabische Spanien nach Europa. Dieses Spiel ist von da an wesentlicher Bestandteil aller Kulturen sowie auch der menschlichen Entwicklung.2 1 Vgl.: Klosa, Annette / Scholze-Stubenrecht, Werner / Wermke, Matthias (Hrsg.): „Duden: Etymologie“. Dudenverlag. Mannheim/Leipzig/Wien/ Zürich. 1997 (Der Duden; Band 7). S. 691 2 Vgl.: Schlee, Walter: „Einführung in die Spieltheorie“. Vieweg. Braunschweig/ Wiesbaden. 2004. S. 1 6 2.2. Die Motivation zum Spiel Warum spielen wir? Was bewegt uns dazu, immer wieder und oft stundenlang zu spielen? Warum können wir das gleiche Spiel immer wieder spielen, ohne dass Langeweile aufkommt? Aber ist es auch immer das gleiche Spiel oder ist jedes neue Spiel für sich etwas Einzigartiges? Stellt nicht jeder Gegner uns vor neue Anforderungen und kann nicht auch derselbe Gegner eine neue Herausforderung sein, wenn er seine Strategie ändert? Welchen Einfluss hat der Gegner überhaupt? Welche Rolle spielt der Zufall? Welche Bedeutung hat das Anzugsrecht? Bei jedem neuen Spielbeginn ist ungewiss, wer gewinnen wird, wie das Spiel verläuft. Oft haben wir es erlebt, dass sich bei eindeutig besseren Gewinnchancen des Gegners das Blatt plötzlich gewendet hat. Ist es nicht auch gerade die Chance des Gewinnens - neben der Unterhaltung durch das Spielen - , die die Spannung während eines Spiels aufrecht erhält? Selbst wenn wir wissen, dass die Gewinnwahrscheinlichkeit gering ist, wie z.B. bei Lotto, packt uns die Sehnsucht nach Gewinn so stark, dass wir mitspielen. Ist diese Hoffnung auf Gewinn vielleicht auch der Auslöser für die genaue Analyse von Gesellschaftsspielen? Menschen machten sich schon immer Gedanken über die Umstände, die zum Gewinn führen. 2.3. Arten von Spielen Prinzipiell gibt es drei Typen von Ursachen, die den Gewinn herbeiführen und die Spieler im Ungewissen über den Spielverlauf lassen. 1. Der Zufall ist eine mögliche Ursache. Er tritt beispielsweise beim Würfeln oder beim Kartenmischen auf. Der Verlauf des Spiels hängt in diesem Fall sowohl von den Entscheidungen des Spielers sowie auch vom Zufall ab. Bei Glücksspielen wie Roulett oder Lotto überwiegt eindeutig der Einfluss des Zufalls gegenüber den Entscheidungen des Spielers. 7 2. Spiele, bei denen der Gewinn wesentlich von den vielfältigen Kombinationen der Zugmöglichkeiten abhängt, werden kombinatorische Spiele genannt. Während des Spielverlaufs bekommen die Spieler in genau festgelegten Situationen die Gelegenheit zu handeln. Dabei stehen bestimmte, durch die Spielregeln fixierte Handlungsmöglichkeiten zur Verfügung. Man nennt einen Spielabschnitt, der genau eine solche Handlungsmöglichkeit umfasst, einen Zug. Bei manchen Spielen wie Schach haben wir nach wenigen Zügen die Situation, dass sich die erlaubten Zugmöglichkeiten zu einer kaum noch überschaubaren Vielfalt kombinieren, so dass die Konsequenzen eines einzelnen Zuges kaum mehr zu erkennen sind. Schach, Mühle, Go, Dame, Nim, Halma und Euklid sind einige prominente Vertreter der kombinatorischen Spiele. 3. Eine dritte Ursache entsteht, wenn die Spieler unterschiedlich informiert sind über den aktuellen Spielstand. Bei Poker, Skat, Sechsundsechzig, Schnauz oder Bridge muss der Spieler seine Entscheidungen treffen, ohne das Blatt seiner Gegner zu kennen. Ebenso weiß der Spieler von Schere-Stein-Papier nicht, welchen Zug sein Gegenüber plant. Er ist also über den Spielstand nicht vollständig informiert. Solche Spiele mit verdeckter Information nennt man strategische Spiele. Natürlich gibt es noch weitere mögliche Ursachen, die den Spielverlauf beeinflussen. Geschicklichkeit spielt z.B. beim Mikado eine große Rolle. Es könnte auch sein, dass die Spielregeln nicht klar sind. Dann hat der Spieler in der Lernphase deutliche Nachteile. Ein unvollkommenes Gedächtnis kann beim Memory oder bei Kartenspielen zum Verhängnis werden. Dies sind aber alles keine typischen oder objektiven Ursachen für die Ungewissheit bei Spielen und werden daher vernachlässigt. 8 2.4. Mathematik im Spiel Alle drei Arten von Spielen, Glücksspiele, kombinatorische Spiele und Strategiespiele, können mit Hilfe mathematischer Methoden untersucht werden. Die mathematische Analyse von Spielen wurde durch den Gebrauch von Computern stark vorangetrieben und hat enorme Fortschritte erzielt. Auf dem Gebiet der mathematischen Analyse von Gesellschaftsspielen stellen sich zum Beispiel folgende Fragen: Hat der Spieler die Aussicht auf Gewinn und wie groß ist sie? Lässt sie sich quantifizieren und falls ja, wie? Welcher der möglichen Züge ist der beste? Kann man die Züge überhaupt objektiv vergleichen? Wie lassen sich die einzelnen Arten von Spielen analysieren? Glücksspiele können mit der Wahrscheinlichkeitsrechnung analysiert werden. Diese mathematische Methode, die heute oft in Naturwissenschaft und Wirtschaftswissenschaft sowie in den Sozialwissenschaften Anwendung findet, verdankt ihre Entwicklung im 17. Jahrhundert dem Wunsch, die Gewinnchancen bei Glückspielen berechnen zu können. Der Ausgangspunkt der Wahrscheinlichkeitsrechnung beruht auf Fragen nach den Gewinnchancen der einzelnen Spieler sowie nach der Wahrscheinlichkeit, welche als Maß für die Gewissheit interpretiert werden kann, mit der ein zufälliges Ereignis eintritt. Bei Glücksspielen interessiert uns besonders, mit welcher Wahrscheinlichkeit ein Ereignis eintritt, das uns den Gewinn beschert. Dabei muss neben der Gewinnchance auch die Höhe des Gewinns mit berücksichtigt werden. Man muss somit sowohl den durchschnittlichen Gewinn sowie das damit verbundene Risiko berechnen. Ein Spiel muss auch nicht immer vollständig analysiert werden, oft müssen nur verschiedene Zugmöglichkeiten gegeneinander abgewägt werden. Besonders komplizierte Analysen ergeben sich bei Spielen wie dem Leiterspiel, bei dem ein Spielstein wieder zurückfallen kann. Aber auch bei Spielen wie Monopoly, bei dem bestimmte Felder bevorzugt angefahren werden, braucht man komplexere Berechnungstechniken. 9 Für die kombinatorischen Spiele gibt es keine einheitliche Theorie. Jedoch können mit Hilfe mathematischer Methoden sowohl prinzipielle als auch im Einzelfall konkrete Aussagen getroffen werden. Diese Methoden stellt uns die kombinatorische Spieltheorie zur Verfügung. Allgemein steht weniger der Gewinn des Spiels im Mittelpunkt, sondern die Art und Weise, wie sich Zugmöglichkeiten zu Partien kombinieren können. Untersucht werden zum Beispiel Zweipersonen-Spiele, die frei von Einflüssen des Zufalls sind und deren aktuelle Position beiden Personen gleichermaßen bekannt ist. Eine Position wird dadurch bestimmt, zu welchen Positionen von ihr aus der eine Spieler ziehen kann und zu welchen der andere. Verlierer bei dem Spiel ist der Spieler, der als erster nicht mehr ziehen kann. Manchmal wird das Spiel auch nach der umgekehrten Regel gespielt, wobei dann der Spieler gewinnt, der als erster nicht mehr ziehen kann. Man spricht in diesem Fall von einem Misère-Spiel. Diese kombinatorischen Spiele, zu denen auch Euklid und Nim gehören, gelten als Spiele mit hohem intellektuellen Anspruch. Schon in der Anfangsphase der kombinatorischen Spieltheorie wuchs der Wunsch in Rechenmaschinen und heute Computern ebenbürtige Spielgegner zu entwickeln. Das geschieht, indem man den Computer den besten aller Züge berechnen lässt. Kann aber die Güte eines Zuges immer auf diese Art und Weise eindeutig festgelegt werden oder hängt sie nicht auch vom weiteren Verlauf des Spiels ab? Der Computer muss also noch viel weiter vorausrechnen können, er muss mögliche Antworten des Gegners einplanen. Dies geschieht mittlerweile in solch einer Komplexität, dass selbst die besten Schachspieler fast keine Chance mehr gegen die Rechner haben. Für viele andere Spiele konnten Gewinnstrategien gefunden werden, bei anderen Spielen kann nur ausgemacht werden, welcher Spieler theoretisch gewinnen kann, ohne dass eine konkrete Gewinnstrategie bekannt ist und vielleicht auch nie entdeckt wird. Auch im Falle strategischer Spiele können Vorhersagen mathematischer Natur getroffen werden. Spiele fungieren bei strategischen Vorgängen häufig auch als Modelle, auf deren Basis interaktive, ökonomische Prozesse in Abhängigkeit von getroffenen Entscheidungen untersucht werden. Am Anfang jeden Spiels steht 10 eine mathematisch formale Definition eines Spiels. Charakterisiert wird ein Spiel durch seine Regeln, welche folgende Angaben umfassen: Die Anzahl der Spieler, zu jedem Spielstand die Aussage darüber, wer am Zug ist und welche Zugmöglichkeiten sich für den betreffenden Spieler ergeben und auf Basis welcher Informationen er seine Entscheidung treffen muss. Für beendete Partien gibt es eine Aussage darüber, wer gewonnen hat und bei Zufallszügen, wie wahrscheinlich ein mögliches Ereignis ist. Diese Art von Spielen ist vorrangig im Hinblick auf ökonomische Prozesse interessant. (Ausführliche Informationen zu Glücksspielen, kombinatorischen Spielen und strategischen Spielen findet man im Buch „Glück, Logik und Bluff: Mathematik im Spiel – Methoden, Ergebnisse und Grenzen“ von Jörg Bewersdorff.) Fazit: „Die Spieltheorie ist ein Teilgebiet der Mathematik, das sich mit der Modellierung und Untersuchung von Gesellschaftsspielen, von im weitesten Sinn gesellschaftsspielähnlichen Interaktionssystemen sowie mit den in diesen eingesetzten Spielstrategien beschäftigt. Die Spieltheorie ist dabei weniger eine zusammenhängende Theorie als mehr ein Satz von Analyseinstrumenten.“ 3 Sie liefert uns Techniken, Gesellschaftsspiele, egal ob Glücks-, Strategiespiele oder kombinatorische Spiele zu analysieren und so beispielsweise die Gewinnstrategie beziehungsweise die Gewinnaussichten oder bestmögliche Spielzüge zu ermitteln. Interessant sind vor allem auch wirtschaftliche Problemstellungen sowie die Behandlung von Interaktionen in Politik, Soziologie und Biologie. In Modellen für reale Abläufe findet die Spieltheorie hauptsächlich ihre Anwendung. Auf dem Gebiet der Wirtschaftswissenschaften gewannen spieltheoretische Beobachtungen 1994 den Nobelpreis und dadurch die gesamte Spieltheorie ihre Anerkennung. Wegen der ökonomischen Anwendung wird die Spieltheorie von Wirtschaftswissenschaftlern häufig auch als „interaktive Entscheidungstheorie“ bezeichnet, da es sich bei wirtschaftlichen Problemstellungen häufig um 3 http://www.wikipedia.de (Stand: 14.07.2006) 11 Entscheidungsprozesse handelt. Oft wird die Untersuchung strategischer Spiele als Klassische Spieltheorie bezeichnet. 2.5. Geschichte der Spieltheorie Schon im babylonischen Talmud findet man eine Vorschrift über die Aufteilung des Vermögens eines verstorbenen Mannes an dessen Frauen. Die älteste wissenschaftliche Abhandlung über Spiele stammt aus einem Schriftwechsel von Bernoulli von 1713. Im 18. Jahrhundert gab es bereits eine Vorschrift über Kartenspiele. Zu Beginn des 19. Jahrhunderts erschienen zwei Arbeiten von Borel zum Thema Spieltheorie. Cournot hat 1838 in wirtschaftlicher Hinsicht den ersten und noch immer bedeutenden Beitrag geleistet. Es existiert eine Aufschrift von Ernst Zermelo aus dem Jahr 1913 über die Anwendung der Mengenlehre auf die Theorie des Schachspiels. Im Jahre 1928 beschäftigte sich John von Neumann mit der Analyse von Gesellschaftsspielen. Er setzte dann 1944 mit Oskar Morgenstern den Anfang der modernen Spieltheorie als eigenständige mathematische Wissenschaft mit dem Erscheinen ihres Buches „Spieltheorie und wirtschaftliches Verhalten“. Die Analysen vor Neumann stellten nämlich nur Antworten auf spezielle Fragen dar, ohne dass eine allgemeine Theorie zur Analyse strategischer Spiele daraus entstanden ist. Die Spieltheorie ist also eine relativ junge Wissenschaft. Stackelberg hat sich zeitgleich mit Neumann mit Gleichgewichtspunkten im wirtschaftlichen Bereich beschäftigt. Dieser Beitrag von Stackelberg fügt sich in die spieltheoretischen Ansätze ein. In den fünfziger Jahren des zwanzigsten Jahrhunderts nutzten Melvin Dresher und Merrill Flood das Gefangenendilemma experimentell und John Nash entwickelte in seinen Arbeiten über Gleichgewichtszustände in 2-Personen-Spielen das „Nash-Equilibrium“. Der Anwendung der Spieltheorie in den Wirtschaftswissenschaften hat Reinhard Selten 1965 mit seinem Buch „Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit“ neuen Antrieb verschafft. John Maynard Smith entwickelte 1974 das Konzept der „Evolutionary Stable Strategy“. Dieses 12 Konzept brachte die evolutionäre Spieltheorie einen großen Schritt vorwärts. Robert Axelrod trug 1984 mit dem Buch „The Evolution of Cooperation“ zur Popularisierung des Gefangenendilemmas und den Implementationen von Strategien mit sehr einfachen Computerprogrammen bei. Endgültig wissenschaftlich anerkannt wurde die Spieltheorie 1994, als John Nash, John C. Harsanyi und Reinhard Selten für ihre bahnbrechenden Beiträge zur Spieltheorie den Nobelpreis für Wirtschaftswissenschaften erhielten. 1996 schrieben Holler und Illig in ihrem Buch „Einführung in die Spieltheorie“, dass viele Wirtschaftswissenschaftler die Spieltheorie als die formale Sprache der ökonomischen Theorie ansehen. Speziell die kombinatorische Spieltheorie ist ein von John Horton Conway ca. 1970 gegründeter Zweig der Spieltheorie, der sich mit kombinatorischen ZweiPersonen Spielen wie Nim und Euklid befasst. Die Anfänge der „Glückspieltheorie“ sind hingegen im siebzehnten Jahrhundert mit Bernoulli und dem Beginn der Wahrscheinlichkeitsrechnung zu datieren. 2.6. Kurzbiographien der Begründer der Spieltheorie John von Neumann Johann von Neumann, wie sein ursprünglicher Name war, wurde am 3. Dezember 1903 in Budapest geboren und starb am 8. Februar 1957 in Washington, D.C.. Er studierte in Berlin und Zürich Chemie und schloss sein Studium 1926 mit Diplom ab. Noch im gleichen Jahr promovierte er in Budapest mit einer Arbeit über Mengenlehre. Von 1926 bis 1929 war er Privatdozent in Berlin. Die Zeit bis 1930 verbrachte er in Hamburg. Anschließend wechselte er zur Princeton University und erhielt dort 1931 eine Professur. Neben den beiden Werken, mit denen er die Spieltheorie begründete, veröffentlichte er auch bedeutende Arbeiten in reiner Mathematik und in Physik. 13 Oskar Morgenstern Oskar Morgenstern wurde am 24. Januar 1902 in Görlitz geboren und ist am 26. Juli 1977 in Princeton gestorben. Morgenstern lehrte an der Universität Wien von 1929 bis 1938, an der Princeton University von 1938 bis 1970 und an der New York University von 1970 bis 1977. Sein Arbeitsgebiet war die Ökonometrie. In diesem Gebiet veröffentlichte er auch einige Bücher. John Forbes Nash John Nash wurde am 13. Juni 1928 in Bluefield im Bundesstaat Virginia, geboren, absolvierte seine Studien in Princeton als Schüler Albert W. Tuckers. Über das MIT (Massachusetts Institute of Technology) kehrte er später als Professor wieder nach Princeton zurück. Nach einem viel versprechenden Beginn seiner mathematischen Karriere, erkrankte er mit dreißig Jahren an Schizophrenie und erholte sich erst wieder in den neunziger Jahren davon. Nashs Geschichte ist Ende 2001 durch den Hollywood-Film „A Beautiful Mind“ bekannt geworden. Der Film wurde mit vier Oscars ausgezeichnet. Reinhard Selten Am 10. Oktober 1930 in Breslau geboren, fühlte sich Selten frühzeitig zur Mathematik hingezogen. Die Studienjahre verbrachte er in Frankfurt. Dort verfasste er bei Ewald Burger seine Magisterarbeit über ein Thema aus der kooperativen Spieltheorie. Nach ersten Arbeiten auf dem Gebiet der experimentellen Ökonomie etablierte sich Selten binnen kürzester Zeit als einer der innovativsten Forscher in Sachen Spieltheorie. Er bekam zuerst Professuren in Berlin und Bielefeld, daraufhin folgte 1984 die Berufung auf den Lehrstuhl für wirtschaftliche Universität Staatswissenschaften, Bonn. Besonders insbesondere bemerkenswert ist Wirtschaftstheorie der Seltens zur Neigung wissenschaftlichen Kooperation sowie seine durch zahlreiche Arbeiten auf dem Gebiet der Politologie, der Biologie Interdisziplinarität. 14 und der Psychologie erprobte John Harsanyi John Harsanyi wurde am 29. Mai 1920 in Budapest geboren und ist im August 2000 gestorben. In den Wirren der Nachkriegszeit musste er als politischer Flüchtling das Land verlassen und ging nach Australien. Er studierte in Australien und danach an der Universität Stanford Ökonomie. Dort erwarb er 1959 seinen Doktortitel. Er war Professor an der Wayne State University in Detroit und wurde 1964 nach Berkeley an die University of California berufen. Zu seinen wichtigsten Forschungsgebieten zählen einerseits die Verhandlungstheorie und andererseits die nutzentheoretisch begründbare Ethik, die beide auf der Spieltheorie beruhen. 4 John Horton Conway John Horton Conway wurde am 26. Dezember 1937 in Liverpool geboren. Als englischer Mathematiker betreute er die mathematische Kolumne der Zeitschrift Scientific American (Spektrum der Wissenschaft). Er erfand viele mathematische Spiele, zum Beispiel das berühmte Game of Life und das Spiel Sprouts. Er erfand oder entdeckte, wie manche es bezeichnen, die surrealen Zahlen. John H. Conway ist insbesondere bekannt für seine Arbeiten zur kombinatorischen Spieltheorie, wozu er unter anderem die Bücher „On Numbers and Games“5 und „Winning Ways For Your Mathematical Plays“6 zusammen mit Elwyn R. Berlekamp und Richard K. Guy geschrieben hat. Conway rief auch die Doomsday-Methode, mit deren Hilfe sich der Wochentag einfach berechnen lässt, ins Leben. Die nach ihm benannte Conway-Folge ist auch auf ihn zurückzuführen. 1987 wurde ihm als erstem in der Geschichte der Pólya-Preis verliehen für herausragende Leistung auf dem Gebiet der Mathematik.7 4 Vgl.: Schlee, Walter: „Einführung in die Spieltheorie“. Vieweg. Braunschweig/ Wiesbaden. 2004. S. 2f 5 deutsch „Über Zahlen und Spiele“ 6 deutsch „Gewinnen: Strategien für Mathematische Spiele“ 7 Vgl.: http://www.wikipedia.de (Stand: 14.07.2006) 15 3. Kombinatorische Spieltheorie 3.1. Kombinatorische Spiele Die kombinatorische Spieltheorie beschäftigt sich mit Spielen, die folgende fünf Eigenschaften erfüllen: 1. Das Spiel wird von zwei Personen gespielt (meist als Schwarz und Weiß oder als Rechts und Links bezeichnet). 2. Der Gewinn des einen Spielers ist gleich dem Verlust des anderen Spielers. Bezeichnet man Verlust als negativen Gewinn, so hat man immer Spielausgänge wie (-1, 1), (1, -1) und (0, 0). (-1, 1) bezeichnet die Position in der Rechts oder Schwarz verloren und Links oder Weiß gewonnen hat, (1, -1) stellt einen Gewinn für Rechts oder Schwarz dar und einen Verlust für Links bzw. Weiß. (0, 0) wird als Unentschieden interpretiert. Es könnte aber auch ein Doppelgewinn (2, -2) auftreten. Das bedeutet die Gewinnsumme ist bei jedem Spiel 0, weshalb man diese Spiele auch als Nullsummenspiel bezeichnet. Bei einem Nullsummenspiel verfolgen beide Gegner völlig konträre Interessen. 3. Jede Partie endet nach einer endlichen Anzahl von Zügen und jeder Spieler hat immer nur begrenzt viele Zugmöglichkeiten. Durch diese Bedingung werden endlose Spiele ausgeschlossen. 4. Es gibt keinen Zufallseinfluss. Das heißt aber auch, dass gleichzeitiges Ziehen wie bei Schere-Stein-Papier ausgeschlossen ist. Die Spieler ziehen stets abwechselnd. 5. Es gibt keine verborgenen Informationen (etwa wie bei Schiffe versenken oder Kartenspielen). Jeder Spieler ist also vollständig über den aktuellen Spielstand informiert. 16 3.2. Zugwahl und Zermelos Bestimmtheitssatz Bei den kombinatorischen Spielen müssen wir zukünftige Züge abwägen, Zufall oder verdeckte Informationen kommen nicht vor. Wir suchen uns also den für uns besten Zug heraus. Allerdings müssen wir nicht nur unseren Zug bedenken, sondern auch mögliche Antworten des Gegners. Generell müssen wir dabei immer mit dem Schlimmsten rechnen, also mit Zügen, die für uns am ungünstigsten sind. Ein Zug ist für uns gut oder sogar der beste, wenn er zum erwünschten Ergebnis, zum Sieg oder (für Bescheidenere) zum Unentschieden führt. Solche nachträglichen Kriterien sind für Spieler allerdings oft nicht sehr hilfreich. Als Spieler benötigt man Kriterien, mit denen man von vornherein Züge objektiv und absolut bewerten kann ohne Bezug auf das weitere Spiel des Gegners zu nehmen. Hier wiederum ist es sinnvoll, die Züge nicht mit Worten wie gut, ausgezeichnet, nicht zu empfehlen et cetera zu charakterisieren, sondern mit Hilfe von Zahlen. Die Güte eines Zuges soll also berechenbar zu sein. Somit ist es nicht verwunderlich, dass Computerprogramme oder Spielautomaten zum Teil als unbesiegbare Gegner auftreten. Bei der Berechnung der Güte eines Zuges geht es also darum, den Wert einer Spielposition mathematisch-objektiv zu bestimmen, ohne dass auf subjektive Dinge wie die des guten oder schlechten Spielers Bezug genommen werden muss. Zermelos Bestimmtheitssatz: Die Positionen der kombinatorischen Spiele (gemeint sind alle Spiele, die die oben genannten fünf Punkte erfüllen) sind alle bestimmt, das heißt, sie erfüllen stets eine der drei folgenden Eigenschaften: - Weiß kann unabhängig von den Zügen von Schwarz einen Sieg erzwingen (Gewinnposition für Weiß). - Schwarz kann, egal wie Weiß sich verhält, einen Sieg erzwingen (Gewinnposition für Schwarz). - Beide Spieler können unabhängig von den Zügen des anderen mindestens ein Unentschieden erreichen (ausgeglichene Position). 17 Wenn kein Spieler einen Fehler macht, so dass er sein Ziel, das er sicher erreichen müsste, verfehlt, dann steht das Ergebnis jeder Position fest. Diese Feststellung erlaubt es, für manche Spiele optimale Strategien und die dazugehörigen Gewinnaussichten explizit zu bestimmen. Bei anderen Spielen kann man die Gewinnaussichten angeben, ohne die optimale Strategie zu kennen. Die Ausgänge der kombinatorischen Spiele stehen also bei beidseitig optimalem, fehlerfreiem Spiel von Beginn an fest, das heißt das Spiel ist strikt determiniert. Allerdings sagt die prinzipielle Möglichkeit, die Positionen in drei Gruppen einteilen zu können, noch nichts darüber, wie sie sich konkret vollzieht, gerade bei komplexen Spielen wie Schach. Strikte Determiniertheit bedeutet aber auch, dass ein Ergebnis wie (-1, 1), (1, -1), (0, 0) oder (-2, 2) immer erreicht wird. Jeder Spieler kann so spielen, dass ihm mindestens der entsprechende Spielausgang sicher ist. Andererseits kann das Spiel nicht besser für jeden der Spieler ausgehen, wenn auch der Gegner seine Möglichkeiten komplett ausschöpft. 3.3. Strategie und Minimax Der Bestimmheitssatz lässt sich noch präziser mit dem Begriff der Strategie formulieren. Definition: Strategie Eine Strategie ist eine vollständige Handlungsanweisung für einen Spieler, die für jede Position des Spiels, in der der betreffende Spieler ziehen muss, einen bestimmten Zug vorsieht. Dass diese Strategien wahnsinnig viele Informationen enthalten können und ihre Beschreibung daher extrem umfangreich ist, vernachlässigen wir momentan in unseren theoretischen Überlegungen. Wir können auch das Spiel so abändern, dass die Spieler schon vor der Partie ihre Strategie festlegen müssen. Dabei gibt es wiederum mehrere Möglichkeiten, mit welchem Informationsstand über die 18 gegnerische Strategie die Entscheidung des Spielers über die eigene Strategie gefällt werden muss. Beide Spieler geben ihre Strategie gleichzeitig an oder ein Spieler darf sich für seine Strategie erst dann entscheiden, nachdem sein Gegenüber sich bereits auf eine Strategie festgelegt hat. Die erste Variante entspricht im Wesentlichen dem ursprünglichen Spiel. Dass die Spieler sich schon von Anfang an auf ihre Strategie festlegen müssen, ändert nichts an ihren Chancen, da es für eine zu treffende Entscheidung egal ist, ob die Situation, in der die Entscheidung getroffen wird, schon eingetreten ist oder nicht. Hier ist nur wichtig, dass jede Zugentscheidung an genau dem Informationsstand ausgerichtet wird, wie er sich für den ziehenden Spieler in einer realen Partie ergibt. Die zweite Variante ändert die für die Entscheidung vorhandene Informationsbasis. Dem Spieler, der seine Strategie als zweiter preisgeben darf, ist es möglich, speziell die gegnerische Strategie bei seiner Entscheidung zu berücksichtigen und deren Schwächen gegebenenfalls für sich auszunutzen. Dieser Spieler hat damit gegenüber dem Orginal-Spiel einen höheren Informationsstand. Er weiß, wie sich sein Gegenüber im Spiel verhält. Ist Weiß derjenige Spieler, der sich als erster für eine Strategie entscheiden muss, wird er für sich eine Strategie wählen, die unabhängig von den Zügen von Schwarz einen möglichst hohen Gewinn ergibt. Der Spieler muss dabei mit dem Schlimmsten rechnen, also damit, dass Schwarz mit seinen Zügen versucht, den Gewinn von Weiß möglichst klein ausfallen zu lassen. Weiß entscheidet sich also für eine Strategie, bei der dieses Minimum am größten ausfällt. Der so gesicherte Gewinn heißt Maximin-Wert. Ist Schwarz im anderen Fall der Spieler, der zuerst seine Strategie festlegen muss, so muss er davon ausgehen, dass Weiß so spielt, dass dessen Gewinn am größten ausfällt. Schwarz wird daher eine Strategie wählen, die dieses Maximum am kleinsten ausfallen lässt. Dies wird als Minimax-Wert bezeichnet. Somit hat Weiß also eine Strategie, bei der er mindestens den Maximin-Wert als Gewinn bekommt, und Schwarz kann diesen Gewinn von Weiß bestenfalls auf den Minimax-Wert beschränken. Also ist der Minimax-Wert einer Partie größer oder gleich dem Maximin-Wert. Deshalb spricht man auch von oberem oder unterem Wert eines Spiels. Bei Schere-Stein-Papier sind die beiden Werte 19 unterschiedlich, nämlich 1 und -1. Anders sieht es bei den kombinatorischen Spielen aus. Zermelos Bestimmtheitssatz lässt sich, bezieht man sich auf Minimax- und Maximin-Wert, nämlich auch folgendermaßen formulieren: Zermelos Bestimmtheitssatz: Der Maximin-Wert ist bei kombinatorischen Spielen gleich dem Minimax-Wert. Diese Größe wird dann als Wert des Spiels bezeichnet. Zermelos Satz nennt man deshalb auch häufig Minimax-Satz. Beweis des Bestimmtheitssatzes mittels Induktion: Induktionsanfang: Die Behauptung ist für die Zugzahl n = 0 richtig, da die Spielregel eines solchen Torso-Spiels, also eines Spiels, bei dem kein Zug möglich ist, allein darin besteht, wer wie viel von wem gewinnt. Induktionsannahme: Wir nehmen an, der Bestimmtheitssatz ist für alle Spiele gültig, die höchstens n Züge dauern. Induktionsschritt: Wir betrachten den ersten Zug eines höchstens n + 1 Züge dauernden Spiels. Aufgrund der Symmetrie kann angenommen werden, dass Weiß anzieht. Jedes Endspiel, das sich an den ersten Zug anschließt, ist, da es höchstens n Züge dauert, im Sinne des Bestimmtheitssatzes strikt determiniert, das bedeutet, der Maximin-Wert ist stets gleich dem Minimax-Wert (Induktionsannahme). Wir wollen den größten dieser Werte mit g bezeichnen; er ist, wie im Folgenden gezeigt wird, gleich dem Wert des Gesamtspiels: 20 Weiß zieht im ersten Zug zu einem Endspiel mit dem Wert g. Weiß kann sich anschließend einen Gewinn in der Höhe von g in diesem Endspiel sichern. Schwarz erfährt aufgrund der vollständigen Information in diesem Spiel den Zug, mit dem Weiß das Spiel eröffnet hat. Deshalb wird sich Schwarz im erreichten Endspiel so verteidigen, wie er sich in dem Spiel einzeln verhalten würde. Damit gewinnt Weiß maximal den Wert des erreichten Endspiels, also höchstens den Wert vom Betrag g. Die Behauptung des Bestimmtheitssatzes folgt aus Induktionsanfang und Induktionsschritt. □ Bei kombinatorischen Spielen bilden die Minimax-Strategien eine Art Gleichgewicht, das kein Spieler zu seinen Gunsten verschieben kann. Eine geometrische Interpretation findet man, indem man die von den aufeinandertreffenden Strategien abhängenden Gewinne in ein räumliches Koordinatensystem einträgt: Schwarz Weiß Balkendiagramm8 8 Bewersdorff, Jörg: „Glück, Logik und Bluff: Mathematik im Spiel - Methoden, Ergebnisse und Grenzen“. Vieweg. Braunschweig/Wiesbaden. 1998. S.102 21 Hier kann man mit etwas Phantasie einen Sattel erkennen. In einer Richtung ist kein Gewinn höher, in der anderen keiner niedriger. Der Sattelpunkt liegt bei Weiß = b – d und Schwarz = q – r. Maximin- und Minimax-Strategien bilden also zusammen mit dem entsprechenden Gewinn einen Sattelpunkt. Deshalb spricht man auch von Sattelpunktstrategien, Minimax- oder Maximin- oder optimalen Strategien. Ein Spieler, der die optimale Strategie spielt, kann sie ohne Nachteile zu befürchten schon vor der Partie preisgeben. Der Wert eines Spiels kann rekursiv bestimmt werden. Dazu minimiert und maximiert man Zug für Zug. Zieht Weiß, ist der Wert gleich dem maximalen Wert unter den Nachfolgepositionen, ist Schwarz am Zug so ist der Wert gleich dem minimalen Wert unter den Nachfolgepositionen. Diesen Maximin-Prozess im Spiel kann man anschaulich in einem Spielbaum darstellen. Positionen werden dabei als Knoten, Züge durch Kanten repräsentiert. Der Spielverlauf ist von oben nach unten, was durch die Spielbaum-Wurzel oben angezeigt wird. Die Endknoten entsprechen den verschiedenen Endpositionen und sind deshalb mit den dazugehörigen Spielresultaten gekennzeichnet. Ein Spielbaum mit drei Zügen ist in folgender Abbildung dargestellt: Weiß zieht Schwarz zieht p q r t s 3 Weiß zieht b a -1 c -2 2 1 d 0 Spielbaum 22 Der Wert des Spiels kann nun von unten nach oben durch abwechselnde Minimierung und Maximierung bestimmt werden. Ausgehend von den Endpositionen in den Endknoten und den sich dort für Weiß ergebenden Gewinnen geht man stufenweise nach oben. Dabei wird auf der Basis der für das nächstniedriegere Niveau bekannten Wert maximiert, wenn Weiß am Zug ist, und minimiert, wenn Schwarz an der Reihe ist. So findet man dann im Dreizüge-Spiel von oben die folgende Zugfolge, die für beide Spieler optimal ist. 0 maximieren -1 0 minimieren 3 -1 0 2 1 maximieren -2 0 Die optimale Zugfolge Anhand dieses Beispiels kann man auch nochmals den Strategiebegriff gut erklären. Entscheidet sich nämlich Weiß dazu, mit Zug a das Spiel zu beginnen, braucht er für den Rest des Spiels keine weiteren Pläne. Eröffnet Weiß allerdings mit b, so muss er sich überlegen, wie er nach dem Zug von Schwarz nach r weitermachen will. Weiß muss also darüber nachdenken, ob für ihn c oder d geschickter ist. Für Weiß gibt es also insgesamt drei Strategien: a, b - c oder b - d. Für Schwarz gibt es insgesamt sechs mögliche Strategien, nämlich p - r, p - s, p - t, q - r, q - s oder q - t. Je nachdem, ob Weiß nach a oder b zieht, muss sich Schwarz also auf zwei 23 verschiedenen Positionen gefasst machen. Trägt man zu jeder möglichen Kombination von schwarzer und weißer Strategie die Spielergebnisse in eine Tabelle ein, so erhält man die sogenannte Normalform. In der Praxis funktioniert das allerdings nur bei Spielen, die ähnlich einfach sind wie unser Dreizüger. In der folgenden Tabelle sind sowohl die optimalen Strategien als auch der dazugehörige Sattelpunkt hervorgehoben. Dabei ist deutlich die Stabilität des Sattelpunktes zu erkennen. Ausgehend vom Sattelpunkt kann sich nämlich kein Spieler verbessern, indem er seine Strategie ändert. Der Sattelpunkt ist in nachstehender Abbildung hervorgehoben. Normalform des Dreizügers9 Man erkennt auch leicht, dass das oben aufgeführte Balkendiagramm einer Darstellung der Normalform entspricht. 3.4. Gerechtigkeit im Spiel Die meisten Zwei-Personen-Nullsummenspiele, so sagt der Satz von Zermelo, sind entweder ausgewogen oder einer der beiden Spieler besitzt eine Gewinnstrategie. Sollte darum ein Spiel nicht ausgewogen sein oder ist sein Wert nicht bekannt, was in der Praxis wohl am ehesten der Fall sein wird, so kann man versuchen, die Chancen gerecht auszugleichen. Dabei kann man zum Beispiel so vorgehen: Der erste Zug wird ausgelost oder man spielt zwei Partien, wobei das Anzugsrecht wechselt. 9 Bewersdorff, Jörg: „Glück, Logik und Bluff: Mathematik im Spiel - Methoden, Ergebnisse und Grenzen“. Vieweg. Braunschweig/Wiesbaden. 1998. S.101 24 Der Nachteil bei der ersten Variante ist, dass das Spiel dann zufällige Elemente eines Glücksspiels enthält, auch wenn diese nur am Anfang vorkommen. Bei nicht ausgeglichenen Spielen ist der Einfluss des Zufalls dann sogar entscheidend für das Spiel. Die zweite Variante hat diesen Nachteil nicht. Die Vorteile, die der eine Spieler in der ersten Partie hat, werden durch die Nachteile in der zweiten Partie gerechterweise kompensiert. Es gibt allerdings noch eine dritte Methode, die Gerechtigkeit schaffen soll, nämlich die sogenannte Kuchenregel. Sie folgt dem Prinzip, wie man Kuchen gerecht an zwei Kinder verteilt. Das eine Kind teilt den Kuchen, das andere darf sich ein Stück aussuchen. Genauso ist es im Spiel: Ein Spieler zieht an, der andere Spieler darf sich aussuchen, ob er die Seite wechselt oder nicht. Hier ist Gerechtigkeit nur dann gewährleistet, wenn der Eröffnungszug zu einer Position mit dem Wert 0 führt. Alles andere wäre auch Unsinn, denn zöge der Anziehende zu einer Position mit positivem Wert, so tauschte der Gegner die Seite, bei negativem Wert hätte er sofort eine Gewinnstrategie. (Für mehr Informationen zum Thema kombinatorische Spieltheorie verweise ich auf das Buch „Glück, Logik und Bluff: Mathematik im Spiel – Methoden, Ergebnisse und Grenzen“ von Jörg Bewersdorff, Seite 94 - 234.) 25 4. Nim 4.1. Geschichte Nim wurde als erstes von Charles Bouton 1902 untersucht. Er untersuchte dabei verschiedene Positionen sowie die sich daraus ergebenden Zugmöglichkeiten der einzelnen Spieler. Nim ist das erste Spiel, das auf diese Weise untersucht wurde. Bouton nahm an, dass das Spiel Nim in ganz Amerika gespielt wurde und von den Chinesen Fan-Tan genannt wurde. Später erkannte er, dass die Identifikation mit Fan-Tan falsch war. Er gab zu, er habe das Wort Nim auf das deutsche Wort „nimm“, den Imperativ Singular von nehmen, zurückgeführt. Interessanterweise soll es auch einen chinesischen Cartoon-Charakter „nian“ geben, der auf Kantonesisch „nim“ genannt wird, was soviel heißt wie „aufnehmen“ oder „nehmen“. (Die kantonesische Sprache oder Yue ist übrigens eine chinesische Sprache, die vor allem im Süden Chinas, in der autonomen Provinz Guangxi, Wuzhou und in den Provinzen Guangdong (ehemals Kanton, daher kantonesisch), Hong Kong und Macao gesprochen wird. Weiterhin wird der drittgrößte chinesische Dialekt unter anderem von ausgewanderten Minderheiten in Singapur, Malaysia und Vietnam gesprochen.10) Zwischen diesen beiden Worten scheint aber keine historische Verknüpfung vorzuliegen.11 Gespielt wird Nim in der Standard-Version mit Steinen, die zu mehreren Haufen gruppiert sind. Jeder Spieler muss, wenn er am Zug ist, sich einen Haufen aussuchen und mindestens einen Stein (aber auch mehrere Steine) von diesem und nur von diesem Haufen wegnehmen. Bouton fand eine einfache Formel, mit der ein Spieler mit Gewinnstrategie einen entsprechenden Gewinnzug finden kann. 10 Vgl.: http://www.wikipedia.de (Stand: 14.07.2006) 11 Vgl.: Singmaster, David: Queries on oriental sources in recreational mathematics. http://www.eldar.org/~problemi/singmast/chinarec.html (Stand: 10.08.2006) 26 Diese Formel benutzt das binäre Zahlensystem. Aus diesem Grund gelang es 1940 eine Maschine vorzustellen, die Nim einwandfrei und ohne Fehler spielen konnte. Gewinnstrategien für Nim wurden in den dreißiger Jahren unabhängig voneinander von Roland Sprague und Patrick Michael Grundy gefunden. Wesentlicher Bestandteil der theoretischen Betrachtung sind Methoden, mit denen die Gewinnaussichten von zusammengesetzten Positionen aus Daten der Teilpositionen berechnet werden können. Bei Nim sind die Zugmöglichkeiten unabhängig davon, wer am Zug ist. Diese für gewöhnliche Spiele eher seltsame Einschränkung beseitigte um 1970 der Mathematiker John Horton Conway, der durch seine Beiträge zur Gruppen- und Knotentheorie bekannt wurde. Seine Theorie brachte bemerkenswerte Beziehungen zwischen Zahlen und Spielen hervor. Zahlen erschienen in Conways Theorie als Spezialfälle von Spielen. Dabei können Größenvergleiche zwischen Zahlen als Vergleich von Gewinnaussichten und die Addition von Zahlen als Aneinanderreihen von Positionen interpretiert werden. Zusammen mit Richard Guy und Elwyn Berlekamp untersuchte Conway viele Spiele und veröffentlichte seine Erkenntnisse in den Büchern „Gewinnen“ und „Über Zahlen und Spiele“. Bei der von Conway untersuchten Art von Spielen gewinnt derjenige Spieler, der als letzter zieht.12 Nim ist, da es vollständig analysiert werden kann (und das allein mit Papier und Bleistift), in der kombinatorischen Spieltheorie von großer Bedeutung. 12 Vgl.: Bewersdorff, Jörg: Go und Mathematik. http://www.bewersdorff-online.de/go/ (Stand: 10.09.2006) 27 4.2. Standard-Nim 4.2.1. Spielregeln Dadurch, dass das Spiel Nim so bekannt ist, gibt es auch die unterschiedlichsten Spielweisen. Eines haben aber alle Standard-Nim-Spielweisen gemein: Gespielt wird dieses Nullsummenspiel immer zu zweit, gezogen wird abwechselnd. Man hat bei allen Varianten einen oder mehrere Haufen von Steinen und muss sich einen Haufen aussuchen und von diesem mindestens einen Stein nehmen. Maximal kann man den ganzen Haufen abräumen. Es gibt keine zufälligen Einflüsse, beide Spieler sind vollständig informiert und das Spiel endet nach endlich vielen Zügen. Der Spieler, der den letzten Stein nimmt, gewinnt. Ich möchte mich jetzt zuerst auf folgende Spielregel von Nim festlegen: Wir haben drei Haufen, die aus 6, 7 und 8 Steinen bestehen. Gezogen wird abwechselnd. Bei jedem Zug dürfen Steine von einem Haufen genommen werden. Bei jedem Zug muss mindestens ein Stein genommen werden, es dürfen allerdings beliebig viele Steine weggenommen werden, aber immer nur von dem einen ausgewählten Haufen. Später werde ich das Spiel auf mehrere Haufen unterschiedlicher Größe erweitern. Gewonnen hat derjenige Spieler, der den letzten Stein nimmt. Spielt man das Spiel oft genug, kommt der Spieler wahrscheinlich zu der Erkenntnis, dass man, wenn man gewinnen möchte, zu Beginn von dem größten Haufen sieben Steine holt. Diese Lösung entspricht der 1902 von Charles Bouton gefundenen Lösung des Problems. 28 Beispiel: Wir haben drei Haufen mit 6, 7 und 8 Steinen, kurz die Position (6, 7, 8). Der erfahrene Spieler 1 weiß, dass sein Gewinnzug darin besteht, vom dritten Haufen 7 Steine zu nehmen. Wir bekommen die Position (6, 7, 1). Spieler 2 nimmt nun alle Steine des Haufens mit 7 Steinen. Spieler 1 zieht in der Position (6, 0, 1) beziehungsweise (6, 1). (Da der mittlere Haufen ja nicht mehr existiert, darf er in der Notation weggelassen werden.) Spieler 1 nimmt von dem Haufen mit 6 Steinen 5 Steine. Es entsteht die Position (1, 1). Spieler 2 muss einen der beiden Haufen entfernen. Daraufhin zieht Spieler 1 von (1, 0) beziehungsweise (1) zu (0) und hat gewonnen. 4.2.2. Analyse Von Charles Bouton wurde eine Lösung des Nim-Spiels entdeckt. Diese besagt, dass der nachziehende Spieler genau dann eine Gewinnstrategie hat, wenn die „Nim-Summe“ der Haufengrößen gleich 0 ist. Die sogenannte Nim-Summe wird mittels Nim-Addition berechnet. Die NimAddition ist eine übertragslose „Addition“ im binären Zahlensystem. Das intuitiv gefundene Ergebnis den Haufen mit acht Steinen im ersten Zug auf einen zu reduzieren, ergibt für Spieler 2 die Position mit Haufen von 6 und 7 Steinen und einem Stein, also eine Gewinnposition für den nachziehenden Spieler, also wieder Spieler 1. Dies lässt sich mit Boutons Regel bestätigen. Wir übersetzten 6, 7 und 1 ins Zweiersystem: 6 entspricht 110, 7 der Binärzahl 111 und 1 bleibt 1. 29 Jetzt Addieren wir die drei Zahlen schriftlich untereinander, wobei wir jedes Mal die Überträge weglassen: 22 21 20 1 1 0 1 1 1 1 +2 0 0 0 Wir addieren bei den Einern (20) 1 und 1, das ergibt im Binärsystem 0 Übertrag 1 zu den Zweiern (21). Wir lassen den Übertrag in der Nim-Addition weg, schreiben nur die 0 bei den Einern ins Ergebnis und gehen über zu den Zweiern. Dort addieren wir 1 und 1, was wieder 0 ergibt. Der Übertrag wird wieder weggelassen. In der 3. Spalte bei den Vierern (22) geschieht dasselbe. Das Ergebnis ist folglich 0. Dass es sich bei dieser Addition nicht um die richtige Addition handelt, wird durch die tiefgestellte Zwei hinter dem Pluszeichen deutlich gemacht. Die Nim-Addition erfüllt insbesondere aber die meisten Eigenschaften, die auch die übliche Addition besitzt. Sie ist kommutativ, assoziativ und Null ist das neutrale Element. Negative Zahlen werden allerdings nicht gebraucht, da eine Zahl nim-addiert mit sich selbst null ergibt. Das bedeutet, jede Zahl ist invers zu sich selbst. Vergleicht man die gewöhnliche Addition mit der Nim-Addition, so stellt man fest, dass die Nim-Summe nie größer ist als die Summe, die bei normaler Addition gebildet wird, das heißt a +2 b ≤ a + b. Bei der Nim-Addition werden sämtliche Überträge vernachlässigt, was den Unterschied zwischen den beiden Summen bedingt. 30 Hat man einmal die Gewinnstrategie verstanden, kann man sie auf eine beliebige Anzahl von Haufen und die verschiedensten Haufengrößen anwenden. Soll nämlich in einem Nim-Spiel mit beliebig vielen Haufen mit den Haufengrößen a, b, c… ein Gewinnzug ermittelt werden, so bildet man zunächst einmal die Nim-Summe s = a +2 b +2 c +2 …. Nur wenn diese Nim-Summe ungleich 0 ist, gibt es einen Gewinnzug in dieser Position. Ist die Nim-Summe 0, so hat der nachziehende Spieler eine Gewinnstrategie. Nehmen wir aber jetzt einmal an, die erhaltene Summe ist ungleich null, das heißt, wir haben eine Gewinnstrategie. Wie nutzen wir diese dann am besten? Von welchem Haufen sind wie viele Steine zu nehmen? Einen Haufen von dem man Steine nehmen kann, erkennt man daran, dass sich seine Größe bei der Nim-Summation mit s verkleinert. Man kann, wenn zum Beispiel a +2 s < a, vom ersten Haufen (mit Haufengröße a) Steine nehmen. Bei diesem Zug muss man allerdings so viele Steine nehmen, dass noch ein Rest von a +2 s Steinen übrig ist. Gemäß der Lösung von Bouton besitzt dann die dadurch entstehende Position die Nim-Summe (a +2 s) +2 b +2 c +2 …= s +2 s = 0. Verdeutlichen wir uns das nochmals anhand unseres Anfangsbeispiels für ein Nim-Spiel. Wir hatten drei Haufen mit 6, 7 und 8 Steinen. Nim-addiert man die Zahlen, so bekommt man 1001, was umgerechnet in das Zehnersystem 23 + 20 = 9 ergibt. 23 1 22 21 20 1 1 0 1 1 1 0 0 0 0 0 1 +2 1 Nim-addiert man nun den erhaltenen Wert zu jedem einzelnen Haufen, so erhält man beim ersten Haufen 110 +2 1001 = 1111, was 15 im Zehnersystem entspricht, beim zweiten Haufen 111 +2 1001 = 1110, was 14 im Zehnersystem entspricht, und beim dritten Haufen 1000 +2 1001 = 1, was 1 im Zehnersystem entspricht. 31 Nur beim letzten Haufen liegt also eine Verkleinerung vor, da die Nim-Summe der Haufengröße und der Gesamtsumme 1 ist und 1 ist kleiner als die Haufengröße des letzten Haufens. Wir müssen also nach obiger Überlegung, um zu gewinnen, vom letzten Haufen genau sieben Steine nehmen. Dies ist hier auch der einzige Gewinnzug. Dass Boutons Regel wirklich immer funktioniert, beruht auf zwei Eigenschaften der Nim-Summen von Positionen. Es existiert für jede Position mit positiver NimSumme mindestens ein Zug, bei dem eine Nim-Summe von 0 erreicht wird. Und umgekehrt kann niemals von einer Position mit Nim-Summe 0 wieder eine Position mit Nim-Summe 0 erzeugt werden. Wegen dieser zwei Eigenschaften wird ein Spiel, dessen Anfangsposition eine positive Nim-Summe aufweist, vom Anziehenden in eine Position mit NimSumme 0 überführt. Dieser kann dann nur so ziehen, dass wiederum eine Position mit positiver Nim-Summe entsteht. Dies geht dann so lange immer weiter, bis der letzte Stein gezogen wird. Es entsteht nach dem letzten Zug eine Position mit Nim-Summe 0, also eine für den zweiten Spieler niemals erreichbare Position. Durch diese einfache Berechnung im Zweiersystem erscheint es nicht verwunderlich, dass Nim das erste von Computern beherrschte Spiel ist. 4.3. Lasker-Nim 4.3.1. Spielregel Diese Variante des Nim-Spiels wurde von dem Schachweltmeister und Mathematiker Emanuel Lasker (1868-1941) erfunden und ist nach ihm benannt. 32 Die Spieler ziehen beim Lasker-Nim abwechselnd. Der ziehende Spieler sucht sich einen Haufen aus und nimmt entweder von diesem Steine oder zerlegt ihn in zwei Haufen (nicht notwendig von derselben Größe). Es gibt keine zufälligen Einflüsse. Beide Spieler sind perfekt informiert. Es gewinnt auch hier der Spieler, der den letzten Stein nimmt. Beispiel: Wir haben eine Position, die aus einem Haufen mit einem Stein, einem Haufen mit 3, einem Haufen mit 5 und einem Haufen mit 8 Steinen besteht. Kurz: Wir haben die Position (1, 3, 5, 8) vorliegen. Spieler 1 zieht an und zerlegt den zweiten Haufen in zwei Haufen mit 2 Steinen und einem Stein. Es entsteht die Position (1, 2, 1, 5, 8). Spieler 2 zieht daraufhin zur Position (1, 2, 1, 5, 0) beziehungsweise (1, 2, 1, 5), indem er den Haufen mit 8 Steinen wegnimmt. (Die Null kann einfach weggelassen werden, da ein Haufen mit 0 Steinen nicht existiert.) Spieler 1 reduziert den Haufen mit 5 Steinen auf 2 Steine. Spieler 2 sieht sich der Position (1, 2, 1, 2) gegenüber und nimmt einen Haufen mit 2 Steinen weg. In der Position (1, 2, 1) zieht Spieler 1 zur Position (1, 1), indem er den Haufen mit 2 Steinen entfernt. Spieler 2 nimmt einen Stein, es entsteht die Position (1, 0). Spieler 1 zieht von (1) zu (0) durch Wegnehmen des letzten Steines. Spieler 1 gewinnt. 4.3.2. Analyse Lasker hat dieses Spiel auch analysiert. Er versucht dabei die Einteilung aller Positionen in Gewinn- und Verlustpositionen von dem Standard-Nim auf seine und andere Varianten zu übertragen. Eine Position wird dabei aus der Perspektive des Spielers gewertet, der als nächstes am Zug ist. Das bedeutet, eine Position ist genau dann eine Gewinnposition, wenn sie dem nächsten ziehenden Spieler eine Gewinnstrategie bietet. Kann man also von einer bestimmten Position durch einen möglichen Zug in eine Verlustposition übergehen, so handelt es sich bei dieser 33 Position um eine Gewinnposition; kann man von einer Position durch Ziehen nur in eine Gewinnposition übergehen, so handelt es sich um eine Verlustposition. Auch hier ist es nicht notwendig, die Spieler zu unterscheiden, da ihre Zugmöglichkeiten in der jeweiligen Position übereinstimmen. Lasker geht bei seiner Spielanalyse folgendermaßen vor: Er analysiert eine Position, indem er die Haufen, aus denen die Position besteht, vorher schon klassifiziert. Er betrachtet also eine Position aus lauter zuvor klassifizierten Haufen, das heißt aus Haufen, deren Gewinncharakter (Gewinn- oder Verlustposition) bereits bekannt ist. Er stellt fest: Zwei Verlustpositionen aneinandergefügt, ergeben wieder eine Verlustposition. Dies einzusehen, ist nicht weiter schwer. Der Spieler, der in der aus zwei Verlustpositionen zusammengesetzten Position am Zug ist, zieht in einer der beiden Verlustpositionen so, als ob die andere gar nicht vorhanden wäre. Er wandelt somit die eine Verlustposition in eine Gewinnposition um. Der zweite Spieler kann dann in der Gewinnposition so ziehen, als ob die nicht gespielte Verlustposition gar nicht vorhanden wäre. Auf diese Art und Weise nimmt der zweite Spieler den letzten Stein und gewinnt das Spiel. Aus dieser Überlegung heraus folgt auch direkt, dass eine Verlustposition mit einer Gewinnposition gekoppelt eine Gewinnposition ergibt. Der in dieser Position ziehende Spieler, wandelt die Gewinn- zu einer Verlustposition. Für den nachziehenden Spieler entsteht damit eine Verlustposition zusammengesetzt aus zwei Verlustpositionen. Fassen wir diese Erkenntnisse zu folgender Aussage zusammen: Wir können zu jeder Position eine Verlustposition hinzufügen, ohne dass sich dadurch ihr Gewinncharakter ändert. Was geschieht allerdings, wenn man zwei Gewinnpositionen aneinanderfügt? Wir haben zwei Gewinnpositionen, nämlich 1 und 2. Allerdings ist die gekoppelte Position (1, 1) eine Verlustposition, die Position (1, 2) eine Gewinnposition. Man kann also keine pauschale Aussage über den Gewinncharakter einer Position, die aus zwei Gewinnpositionen zusammengesetzt ist, treffen. 34 Lasker stellt zur weiteren Untersuchung den Begriff der Äquivalenz von Positionen auf. Zunächst kann man sagen, dass zwei Gruppen von Haufen äquivalent sind, wenn sie in einer Verlustposition gegeneinander ausgetauscht werden können, ohne dass dies den Gewinncharakter verändert. Zwei äquivalente Positionen zusammengelegt, ergeben eine Verlustposition. Umgekehrt sind zwei Positionen nach Lasker äquivalent, wenn sie zusammengelegt eine Verlustposition ergeben. Äquivalente Positionen besitzen natürlich auch immer den gleichen Gewinncharakter. Es ist im Übrigen auch so, dass alle Verlustpositionen zueinander äquivalent sind. Die Gewinnpositionen lassen sich allerdings in Klassen von untereinander äquivalenten Positionen untergliedern. Mit diesem Konzept äquivalenter Positionen, kann man eine Position dadurch klassifizieren, dass man sie zu einer besonders einfachen äquivalenten Position vereinfacht. Diese besonders einfachen Positionen nennt Lasker „prime Haufen“. Definition: Prime Haufen Haufen, die nicht äquivalent zu Gruppen von kleineren Haufen sind, nennt man prime Haufen. Die primen Haufen haben 1, 2, 3, 7, 15, 31 Steine und so weiter. Bis auf die 2 sind das alles die um 1 reduzierten Zweierpotenzen. Lasker findet, dass jeder beliebige Haufen entweder zu einem dieser Haufen oder zu einer Gruppe dieser Haufen äquivalent ist. Nehmen wir als Beispiel den Haufen mit 4 Steinen. Er ist äquivalent zu der Position aus den zwei primen Haufen 1 und 2. Ein Haufen mit 5 Steinen ist äquivalent zu (1, 3). 6 ist äquivalent zu (2, 3) und 8 zu (1, 2, 3). Umfangreiche Spielpositionen lassen sich auf diese Weise rasch vereinfachen, denn jede Position ist äquivalent zu einem primen Haufen oder einer Gruppe primer Haufen. 35 Betrachten wir die Position (1, 3, 5, 8). Diese Position kann man vereinfachen zu (1, 3, 1, 3, 1, 2, 3). Und diese Position kann wiederum zu (1, 2, 3) vereinfacht werden. ((1, 3, 1, 3) ist Verlustposition und ihr Weglassen ändert nichts am Charakter der Position, denn sie ist ja äquivalent zu der leeren Position.) Durch Teilen des letzten Haufens in der Position (1, 2, 3) entsteht die Verlustposition (1, 2, 1, 2). Somit muss es sich bei der Position (1, 2, 3) um eine Gewinnposition gehandelt haben. So wie diese Position ist auch jede andere Position äquivalent zu einem primen Haufen oder mehreren primen Haufen. Eine Verlustposition zu erhalten, ist nicht so einfach: Würde aus einer nicht leeren Menge primer Haufen eine Verlustposition entstehen, ergäbe sich eine Äquivalenz zwischen diesen Haufen. Das würde bedeuten, dass der größte Haufen nicht prim wäre. Das heißt, einzig die leere Position ergibt eine Verlustposition, wenn man eine Position zu primen Haufen gruppiert. Das ist auch ein Grund, warum die zu (1, 2, 3) äquivalente Position keine Verlustposition sein kann. Zusammenfassend lässt sich zur Analyse von Lasker-Nim sagen: Jeder Haufen einer Spielposition wird durch äquivalente prime Haufen ersetzt. Eine Verlustposition liegt nur dann vor, wenn jeder prime Haufen in einer geraden Anzahl vorkommt. Diese Methode ist allerdings verglichen mit Boutons Kriterium wesentlich schwerfälliger. Eine Verbesserung gelang voneinander unabhängig 1935 Roland Sprague und 1939 Patrick Michael Grundy. Ihr Fortschritt gegenüber Lasker besteht hauptsächlich darin, dass sie eine Verbindung zwischen dem StandardNim und den verallgemeinerten Varianten gefunden haben. Es stellte sich heraus, dass die Variationen von Nim mehr das spielerische Erscheinungsbild als die mathematische Substanz betreffen. Heute bezeichnet man die von Sprague und Grundy untersuchten Spiele als neutral. 36 Definition: neutrale Spiele Neutrale Spiele haben folgende Eigenschaften: (Viele dieser Eigenschaften werden dem aufmerksamen Leser von den allgemeinen kombinatorischen Spielen her bekannt vorkommen. Ich hab sie der Vollständigkeit halber hier nochmals aufgeschrieben.) - Sie sind zufallsfrei. - Es gibt zwei Spieler. - Beide Spieler verfügen über vollständige Information. - Es wird abwechselnd gezogen, beginnend mit einer festgelegten Anfangsposition. - Der Spieler, der den letzten Stein nimmt und damit den letzten Zug macht, gewinnt. - Das Spiel ist endlich und endet nach einer begrenzten Anzahl von Zügen. - Die Zugmöglichkeiten sind in jeder Position unabhängig davon, welcher Spieler gerade am Zug ist. Deshalb ist auch die Bezeichnung dieser Spiele als neutral angebracht. - Fügt man mehrere Positionen G, H, L,… zu einer neuen Gesamtposition zusammen, dann geschieht dies in Form einer sogenannten disjunktiven Summe G + H + L + …. Ein Spieler zieht in einer disjunktiven Summe, indem er eine Komponente aussucht und dort nach den gültigen Regeln zieht. Disjunktive Summen können auch von Positionen anderer Nim-Varianten gebildet werden. Damit kann der Äquivalenzbegriff auf beliebige Positionen der analysierten Spiele ausgedehnt werden. Die Kernaussage der Theorie von Sprague und Grundy ist, dass bei jedem neutralen Spiel, bei dem der Spieler, der den letzten Stein nimmt, gewinnt, jede Position zu einem Haufen des Standard-Nims äquivalent ist. 37 Definition: Grundy-Wert Die Größe des Haufens des Standard-Nims, zu dem eine Position eines neutralen Spiels, bei dem der Spieler, der den letzten Stein nimmt, gewinnt, äquivalent ist, heißt Grundy-Wert. Er charakterisiert die vorliegende Position. Der GrundyWert hat zwei Eigenschaften, die seine Berechnung stark vereinfachen: - Der Grundy-Wert einer Spielposition ist gleich der kleinsten natürlichen Zahl, die unter den Grundy-Werten der darauf folgenden Positionen nicht vorkommt. Die darauf folgenden Positionen werden als Nachfolger bezeichnet. - Der Grundy-Wert einer disjunktiven Summe von Positionen ist gleich der aus den Grundy-Werten der einzelnen Komponenten gebildeten NimSumme. Ein Spieler muss versuchen, einen Zug zu einer Position mit Grundy-Wert Null zu machen, wenn er gewinnen will. Eine Position mit Grundy-Wert Null ist nämlich äquivalent zu einer leeren Position, somit findet der nachziehende Spieler eine Verlustposition vor. Wir können den Grundy-Wert mit Hilfe der oben genannten Eigenschaften in zwei Schritten berechnen. Zuerst wird die Folge der Grundy-Werte g(1), g(2), g(3)… der Positionen aus jeweils nur einem Haufen hintereinander bestimmt. Aus diesen ergeben sich dann mit der Nim-Addition die Grundy-Werte der Positionen mit mehreren Haufen. Bei dem Lasker-Nimspiel sieht das so aus: Der Haufen ohne jegliche Steine hat keinen Nachfolger, daher ist sein GrundyWert die kleinste natürliche Zahl, also ist g(0) = 0. Unter den natürlichen Zahlen verstehen wir hier Ν 0+ , also die positiven ganzen Zahlen und Null. Für den Grundy-Wert des Haufens mit einem Stein bekommen wir g(1) = 1. Sein einziger Nachfolger ist der leere Haufen. Liegt ein Haufen mit zwei Steinen vor, so gibt es drei mögliche Züge: Wir können einen oder zwei Steine entfernen oder den Haufen in zwei Haufen zu je einem Stein teilen. Die Nachfolger haben also die Grundy-Werte 1, 0, oder aber 1 +2 1 = 0. Somit ist g(2) = 2. 38 Bei einem Haufen mit drei Steinen gibt es vier mögliche Züge. Man kann einen, zwei oder drei Steine nehmen oder aber den Haufen teilen. Die Nachfolger haben demnach die Grundy-Werte 2, 1, 0 und 1 +2 2 = 3. Damit hat der Grundy-Wert eine Höhe von g(3) = 4. Allgemein können die Grundy-Werte des Lasker-Nims rekursiv nach folgender Formel berechnet werden: g(n) = min(Ν − {g(0), g(1),.., g(n − 1)} − {g(1) + 2 g(n − 1), g(2) + 2 g(n − 2),...}) . N bezeichnet hier die Menge der natürlichen Zahlen. Im Prinzip ist in dieser Formel kurz zusammengefasst, was wir die ganze Zeit schon gemacht haben. Wir haben die kleinste natürliche Zahl bestimmt, die größer ist als alle möglichen Nachfolger, also sowohl die Nachfolger, die durch Wegnehmen von Steinen entstehen, als auch die, die durch Haufenteilung entstehen. Die Grundy-Werte des Lasker-Nim sind für die ersten Zahlen in folgender Tabelle dargestellt: Haufengröße Grundy-Wert n g(n) 0 0 1 1 2 2 3 4 4 3 5 5 6 6 7 8 8 7 9 9 10 10 11 12 12 11 39 Betrachtet man die Werte in der Tabelle, so kann man eine gewisse Regelmäßigkeit feststellen. Der Grundy-Wert eines Haufens ist immer um jeweils 4 größer als der GrundyWert des 4 Steine kleineren Haufens, das heißt g(n) = g(n - 4) + 4. Mit dieser Erkenntnis kann man die Tabelle beliebig fortsetzen. Wie aber mit Hilfe der Grundy-Werte konkret Gewinnzüge gefunden werden können, soll am Beispiel der oben schon untersuchten Position (1, 3, 5, 8) demonstriert werden. Der Grundy-Wert dieser Position ergibt sich aus der NimSumme der Grundy-Werte der einzelnen Haufen, also g(1) +2 g(3) +2 g(5) +2 g(8) = 1 +2 4 +2 5 +2 7 = 7. Ein Gewinnzug für die Position (1, 3, 5, 8) im Lasker-Nim ist jetzt analog einem Zug im Standard-Nim für die Position (1, 4, 5, 7) auszuführen. Mit Hilfe der Grundy-Werte erreicht man also eine Transformation einer Position des Lasker-Nims in eine Position des Standard-Nims. In dieser speziellen Position hat man nun drei verschiedene Möglichkeiten, einen Gewinnzug durchzuführen: - Im Standard-Nim kann man von (1, 4, 5, 7) nach (1, 3, 5, 7) ziehen. Es wird dabei ein Stein vom zweiten Haufen entfernt. Beim Lasker-Nim teilt man dann, um den Grundy-Wert des zweiten Haufens von 4 auf 3 zu reduzieren, den zweiten Haufen. - Ein weiterer Gewinnzug im Standard-Nim ist von (1, 4, 5, 7) nach (1, 4, 2, 7) zu ziehen. Entsprechend kann man im Lasker-Nim von den fünf Steinen des dritten Haufens drei wegnehmen. Der übrig bleibende Haufen enthält zwei Steine, hat also den Grundy-Wert 2. - Der letztmögliche Gewinnzug im Standard-Nim ist von (1, 4, 5, 7) nach (1, 4, 5, 0). Dementsprechend kann man auch beim Lasker-Nim den letzten Haufen ganz leeren, was dem Grundy-Wert Null entspricht. Man erkennt, dass diese Variante des Nim-Spiels fast so einfach zu gewinnen ist wie die Standard-Version. 40 4.4. Schwarz-Weiß-Nim 4.4.1. Spielregel Schwarz-Weiß-Nim wird mit Türmen aus schwarzen und weißen Dame-Steinen gespielt. Zwei Spielern ziehen abwechselnd. Bei jedem Zug wählt der ziehende Spieler einen Stein seiner Farbe und entfernt ihn aus dem Turm zusammen mit den darüberliegenden Steinen. Der Spieler, der den letzten Stein nimmt, gewinnt. Dadurch, dass jeder Spieler nur Steine seiner Farbe abräumen darf (und die jeweils darüberliegenden Steine), ist dieses Nim-Spiel im Vergleich zu den in 4.2. und 4.3. betrachteten Varianten nicht neutral. Die Zugmöglichkeiten hängen also hier wesentlich davon ab, ob Weiß oder Schwarz am Zug ist. Abgesehen davon, sind die im Kapitel 4.3. gestellten Voraussetzungen auch beim Schwarz-Weiß-Nim erfüllt: - Es ist zufallsfrei. - Es gibt zwei Spieler. - Beide Spieler verfügen über vollständige Information. - Es wird abwechselnd gezogen beginnend mit einer festgelegten Ausgangsposition. - Der Spieler, der den letzten Stein nimmt und damit als letzter zieht, gewinnt. - Das Spiel ist endlich und endet nach einer begrenzten Anzahl von Zügen. - Fügt man mehrere Positionen G, H, L,… zu einer neuen Gesamtposition zusammen, so erhält man eine sogenannte disjunktive Summe G + H + L + …. Ein Spieler zieht in einer disjunktiven Summe, indem er eine Komponente aussucht und dort nach den gültigen Regeln zieht. Beispiele: (1) Ausgangsposition: Schwarz beginnt und nimmt den schwarzen Stein. Daraufhin nimmt Weiß den weißen und damit letzten Stein. Weiß hat gewonnen. 41 Beginnt Weiß, nimmt er den weißen Stein. Schwarz nimmt den schwarzen Stein daraufhin und gewinnt. Bei dieser Ausgangsposition gewinnt immer der Nachziehende. (2) Ausgangsposition: Weiß zieht an und nimmt den im Turm ganz unten liegenden Stein und alle Steine darüber und gewinnt. Schwarz als Anziehender würde den zweiten Stein von oben aus dem Turm nehmen und den weißen Stein darüber mitnehmen. Als nächstes ist Weiß am Zug und nimmt den im Turm ganz unten liegenden Stein und die darüber liegenden Steine und gewinnt. Bei dieser Ausgangsposition gewinnt Weiß als An- und auch als Nachziehender. (3) Ausgangsposition: In dieser Position kann Weiß als Anziehender einen weißen Stein aus dem Turm mit drei weißen Steinen nehmen. Schwarz räumt den Turm mit dem einen schwarzen Stein ab. Weiß nimmt daraufhin wieder einen Stein von dem Turm mit den zwei weißen Steinen und gewinnt, da er den letzten Zug gemacht hat. Es ist zwar noch ein weißer Stein übrig, aber Schwarz darf nur Steine seiner Farbe nehmen. Zieht Schwarz an, so kann er den Turm mit dem einen schwarzen Stein wegnehmen. Es bleibt der Turm mit 3 weißen Steinen. Weiß nimmt einen Stein aus diesem Turm und hinterlässt eine Position mit einem Turm aus 2 weißen 42 Steinen. Auch hier kann Schwarz keinen Zug mehr machen. Weiß gewinnt, da er den letzten Zug gemacht hat. Hier gewinnt immer Weiß. 4.4.2. Analyse Solche Spiele wurden in den siebziger Jahren systematisch von John Horton Conway untersucht. Er erweiterte damit die Theorie des ursprünglichen NimSpiels auf nicht-neutrale Spiele. Teilaspekte wurden schon 1953 von John Milnor und 1959 von Olof Hanner gefunden. Ihre Ergebnisse schienen kaum Beachtung gefunden zu haben und wurden erst nach Conways Analysen wieder entdeckt. Untersucht werden auch bei nicht-neutralen Spielen die Positionen. Bei nicht-neutralen Spielen muss man sich allerdings immer beide Spiele anschauen, das eine, in dem Weiß beginnt, und das andere, in dem Schwarz zuerst zieht. Die verallgemeinerte Theorie handelt im Wesentlichen davon, Gewinnstrategien für eine als disjunktive Summe gegebene Position dadurch zu finden, dass man ihre Komponenten analysiert. Dies geschieht wiederum in zwei Schritten. Zuerst versucht man die einzelnen Komponenten disjunktiver Summen durch gleichwertige, aber weniger komplexe zu ersetzen. Als nächstes versucht man, die Gewinnaussichten der disjunktiven Summe möglichst einfach zu bestimmen. Wir haben oben gesehen, dass bei neutralen Spielen Verlustpositionen einfach aus der disjunktiven Summe entfernt werden können, ohne dass dies etwas am Gewinncharakter der Gesamtheit ändert. Bei nicht-neutralen Spielen müssen die Gewinnaussichten für beide Spielvarianten berücksichtigt werden, da es einen Unterschied macht, ob Weiß oder Schwarz anzieht. Es liegt allerdings eine sogenannte Nullposition vor, wenn der nachziehende Spieler egal ob Schwarz oder Weiß eine Gewinnstrategie besitzt. Eine Nullposition H kann man zu jeder beliebigen Position G hinzufügen, ohne dass sich deren Charakter ändert. Wenn also ein Spieler als An- oder Nachziehender das Spiel G bei beiderseits optimalem 43 Spiel gewinnt, so gewinnt er auch G + H bei gleichem Anzugsrecht und beiderseits optimalem Spiel. Verfügt beispielsweise ein Spieler als Nachziehender über eine Gewinnstrategie in G, so kann er im Spiel G + H seine Züge stets so wählen, dass er jeden Zug des anziehenden Spielers in der betreffenden Komponente so kontert, als wäre die andere gar nicht vorhanden. Besitzt dagegen ein Spieler als Anziehender in G eine Gewinnstrategie, so gewinnt er auch die Position G + H dadurch, dass er zuerst den Gewinnzug in G wählt. Dadurch erreicht er dann die eben schon untersuchte Situation. Eine sehr einfache Nullposition ist die mit 0 bezeichnete Position, bei der keine Spielsteine mehr vorhanden sind und somit kein Spieler mehr ziehen kann. Eine Nullposition entsteht zum Beispiel auch immer, wenn man eine Position G mit ihrer inversen Position -G zusammenfügt. Eine inverse Position -G entsteht dadurch, dass die in G spielenden Gegner ihre Rollen tauschen. Rollentausch bedeutet dabei, dass die Züge, die Weiß zugedacht sind, jetzt von Schwarz zu ziehen sind und umgekehrt. Dabei bleiben allerdings die möglichen Zugfolgen unverändert. Bei Schwarz-Weiß-Nim entsteht also eine inverse Position zu einer Position G, indem in G die schwarzen Steine gegen weiße und die weißen gegen schwarze Steine ausgetauscht werden. Wenn man die Summe G + (-G) bildet so entsteht für den Nachziehenden eine Gewinnstrategie durch ein Kopieren der Züge des anziehenden Spielers in der jeweils anderen Komponente. Wir haben also eine Nullposition. Ein Beispiel für eine Position und der dazu inversen Position ist in folgender Abbildung gegeben: eine Position G die zu G inverse Position -G zusammen eine Nullposition 44 Ein weiteres Beispiel für eine Nullposition ist folgendes: Egal wer nachzieht, seine Chance auf Gewinn ist bei beiderseits optimalem Spiel gleich 0. Zieht Weiß an, so gibt es nur einen Zug, da es egal ist, welchen Turm der beiden gleichen Türme er abräumt. Es entsteht folgende Position: Spielt Schwarz optimal, so nimmt er den schwarzen Stein des linken Turms. Weiß nimmt daraufhin den weißen Stein. Schwarz nimmt den letzten schwarzen Stein und gewinnt. Eröffnet allerdings Schwarz das Spiel, so könnte er einen der oberen Steine der Zweiertürme nehmen. Das ist in diesem Fall der beste Zug für Schwarz. Es entsteht durch diesen Zug folgende Position: Doch Weiß wird in dieser Situation, um seinen Gewinn zu sichern, den mittleren Turm nehmen und Schwarz wird verlieren. Solche Nullpositionen, bei denen es sich wie im eben betrachteten Beispiel um eine Summe von Positionen handelt, können dazu verwendet werden, um Positionen zu vereinfachen. Ist beispielsweise H + L eine Nullposition, so sind dann die Positionen H und -L in jeder Summe von Positionen gegeneinander austauschbar, ohne dass sich dabei der Gewinncharakter der Summe ändert. Es gilt für eine beliebige Position G, dass G + (-L) die gleichen Gewinnchancen bietet wie G + (-L) + H + L (denn H + L ist Nullposition) und damit auch wie G + H (L und -L sind zueinander invers, ergeben also auch eine Nullposition). Weil die Positionen H und -L gleichwertig sind, werden sie auch hier als äquivalent bezeichnet, man schreibt H = -L. 45 Wie man auf diese Art Positionen vereinfachen kann, soll anhand des folgenden Beispiels gezeigt werden: Zunächst einmal können wir die „einfarbigen Türme“ zerlegen in lauter einzelne Steine: Ein Paar aus einem schwarzen und einem weißen Stein ergibt eine Nullposition. =0 Diese Paare können folglich entfernt werden. Von den zwei „einfarbigen Türmen“ (gemeint sind der Turm aus vier schwarzen Steinen und der Turm aus 3 weißen Steinen) bleibt also nur ein schwarzer Stein nach der Vereinfachung übrig. Die zwei rechten Türme sind äquivalent zu einer Position mit einem einzigen weißen Stein: Dieser weiße Stein ergibt wieder zusammen mit dem schwarzen Stein, der bei der Vereinfachung der beiden ersten Türme übrig geblieben ist, eine Nullposition. 46 Was nach der Vereinfachung noch übrig bleibt, ist folgender Turm: Betrachten wir diesen Turm, so erkennen wir, dass Weiß sowohl als Anziehender als auch als Nachziehender gewinnt. Auf diese Weise kann auch jede andere Schwarz-Weiß-Nim-Position analysiert werden. Es gilt nämlich folgender Satz. Satz: Jede beliebige Position des Schwarz-Weiß-Nim ist äquivalent zu einer Summe der Türme folgender Gestalt: … S0 W0 W1 W2 W3 W4 …. Dabei gilt die Beziehung Wi = Wi+1 + Wi+1. Für eine eher intuitive Bestätigung dieser Äquivalenz von Wi und Wi+1 + Wi+1 kann man mittels Zuganalyse nachweisen, dass deren Differenz, also Wi – (Wi+1 + Wi+1), eine Nullposition ergibt. Wenn man die einzelnen Türme einer gegebenen Position als Summe von Türmen aus der gerade gegebenen Auswahl ausdrückt, dann kann man die Summe einfach berechnen. Wir wollen zur Verdeutlichung folgendes Beispiel analysieren: 47 Dabei gilt folgendes: =W1 = W4 = S0 + W2 + W3 Es gilt somit insgesamt W1 + W4 + S0 + W2 + W3 = -W4. Mancher Leser wundert sich jetzt vielleicht, wie es zur Zerlegung des dritten Turmes in die drei angegebenen Türme kommen kann. Um die Gleichheit von S0 + W2 + W3 und dem dritten Turm nachvollziehen zu können, wird er wahrscheinlich die Differenz der beiden Positionen, die gleichgesetzt sind, bilden und mittels Zuganalyse eine Nullposition nachweisen. Aber dieses Verfahren mit sämtlichen Turmkombinationen der obigen Auswahl durchzuführen bis schließlich die richtige dabei ist, ist recht mühsam. Es muss also noch einen einfacheren Weg geben, der am Ende des Kapitels gezeigt wird. Bei neutralen Spielen hat es völlig ausgereicht, zwischen Gewinn- und Verlustposition zu differenzieren. Bei einem nicht-neutralen Spiel wie SchwarzWeiß-Nim gibt es vier verschiedene Klassen von Positionen, da es ja für jede Position, je nachdem, ob Weiß oder Schwarz am Zug ist, zwei mögliche Züge gibt. Definition: positive Position, negative Position, unscharfe Position, Nullposition - Eine Position wird als positiv bezeichnet, wenn Weiß unabhängig vom Anzugsrecht gewinnt. - Eine Position heißt negativ, wenn Schwarz, egal wer den ersten Zug macht, gewinnt. - In der Nullposition hat der nachziehende Spieler eine Gewinnstrategie. - In einer Position, die als unscharf bezeichnet wird, hat der anziehende Spieler eine Gewinnstrategie. Die Möglichkeit der Einteilung der Positionen in vier Klassen ergibt sich direkt aus dem Zermeloschen Bestimmtheitssatz. 48 Hier sind einige einfache Beispiele für jede der vier Positionen: Position G Gewinnstrategie Weiß Schwarz Nachziehender Anziehender Typ positiv negativ Nullposition unscharf G>0 G<0 G=0 G || 0 Da es im Schwarz-Weiß-Nim keine unscharfen Positionen gibt, greifen wir für unser Beispiel auf das Standard-Nim zurück. Der Spielstein mit schwarz-weißer Schraffur ist ein Stein aus dem Standard-Nim. Er darf von beiden Spielern genommen werden. Im Kasten wird bei der Angabe des Gewinntyps immer ein Vergleich mit der Endposition 0 hinzugezogen. Solche Vergleiche können auch auf beliebige Positionen angewandt werden. Auf diese Weise können die Gewinnaussichten einer Position noch differenzierter betrachtet werden. Danach bedeutet G > H so viel wie G – H > 0, G < H bedeutet G – H < 0, G = H entspricht G – H = 0 und G || H meint dasselbe wie G – H || 0. Wie dies im Spiel zu interpretieren ist, wird an folgendem Beispiel illustriert: =G =H > 0. Es gilt G > H, da G – H = 49 Die Positionen G und H sind beide größer als Null. Sie stellen für Weiß sowohl als An- als auch als Nachziehenden eine Gewinnstrategie dar. Jedoch kann die Position G manchmal günstiger sein als die Position H, wenn sie als Komponente einer disjunktiven Summe auftritt. Tritt sie zum Beispiel mit L = auf, so ist G + L > 0, aber H + L = 0. In Position G + L kann Weiß als Anziehender und Nachziehender gewinnen, in Position H + L hat der Nachziehende eine Gewinnstrategie. Bei H + L verliert Weiß somit als Anziehender. Es können auch kombinierte Vergleiche gezogen werden wie G ≥ 0, was so viel heißt wie G = 0 oder G > 0. G ≥ 0 bedeutet, dass Weiß als Nachziehender eine Gewinnstrategie hat, G ≤ 0 meint eine Gewinnstrategie für Schwarz als Nachziehenden. G ||> 0 heißt, dass Weiß als Anziehender eine Gewinnstrategie besitzt, G <|| 0 drückt eine Gewinnstrategie für Schwarz als Anziehenden aus. Sieht man einmal von dem etwas ungewöhlichen Symbol „ || “ ab, so kann man mit den Gleich-, Größer- oder Kleiner-Zeichen so arbeiten, wie man es von ihrer herkömmlichen Bedeutung für reelle Zahlen gewohnt ist. Wenn bei G < H auf einer Seite die Nullposition L addiert wird, so ändert das nichts an der KleinerRelation: G + L < H. Addiert man zwei positive Positionen G und H, so ist die disjunktive Summe wiederum positiv. Aus G > 0 und H > 0 folgt somit G + H > 0. Für die Größer-Relation gilt wie bei der ursprünglichen Größer-Relation die Transitivität: Aus G > H und H > M folgt G > M. Man kann auch die Positionen G und H in einer Gesamtposition vergleichen. Es sei L eine beliebige Position. G = H bedeutet, G + L ist genauso günstig wie H + L. G ≥ H bedeutet, G + L ist für Weiß mindestens so günstig wie H + L. Und G ≤ H bedeutet, H + L ist mindestens so günstig für Weiß wie G + L. 50 Für G || H kann keine allgemeine Aussage getroffen werden, welche der Positionen G + L oder H + L günstiger ist für Weiß. Hier kommt es darauf an, wie L beschaffen ist und wer zuerst ziehen darf. Wir stellen fest, dass wir mit den Symbolen =, >, <, ≤, ≥, +, - und 0 rechnen können, wie wir es gewohnt sind. Das ist auch nicht verwunderlich, denn viele Positionen, darunter alle Positionen des Schwarz-Weiß-Nims, lassen sich als Zahlen deuten. So entsprechen die oben behandelten Positionen S0, W0, W1, W2, W3, W4,… den Zahlen -1, 1, 1 1 1 , , , 2 4 8 1 ,…. 16 Dass die Operationen von Positionen und den ihnen zugeordneten Zahlen übereinstimmende Ergebnisse liefern und daher einen Homomorphismus zwischen geordneten Gruppen darstellen, liegt an den beiden Gleichungen Wi = Wi+1 + Wi+1 und S0 = -W0. Definition: Homomorphismus „Ein Homomorphismus (…) ist eine Abbildung zwischen zwei Strukturen, durch die Teile der einen Struktur auf ‚bedeutungsgleiche’ Teile der anderen Struktur eindeutig abgebildet werden (‚Strukturerhaltend’).“13 Deuten kann man den Wert einer Position als den Vorteil, den Weiß gegenüber Schwarz hat, das heißt: Je größer der Zahlenwert, desto mehr ist Weiß im Vorteil und je kleiner der Zahlenwert (insbesondere bei negativen Zahlen), desto benachteiligter ist Weiß. Wir wollen dazu einige Beispiele ansehen. 13 http://www.wikipedia.de (Stand: 14.07.2006) 51 Die Position ist gleich 2. Hier kann Weiß zweimal mehr ziehen als Schwarz, also ist Weiß im Vorteil. Die folgende Position 1 hat den Wert - . Weiß ist somit im Nachteil. Wir können vier solche Türme 4 addieren und bekommen eine Summe, die einem einzelnen schwarzen Stein entspricht. Auch Positionen, die nicht durch eine Zahl darstellbar sind, können durchaus Größer-Beziehungen erfüllen, wie zum Beispiel der Stein aus dem Standard-Nim, der wie alle Grundpositionen neutraler Nim-Spiele zu keiner Zahl äquivalent ist: > Allerdings dürfen diese Werte nicht mit den Grundy-Werten verwechselt werden. Damit man Positionen auf abstrakterem Niveau untersuchen kann, werden diese in der Form ({G, H,…}, {P, Q,}) oder kürzer {G, H,…| P, Q,…} geschrieben. Hierbei sind G, H,… die Positionen, zu denen Weiß ziehen kann, und P, Q… die Positionen, zu denen Schwarz ziehen kann. Man kann darauf verzichten, zwischen äquivalenten Positionen zu unterscheiden, da sie für Spieler gleich günstig sind. Daher ist es einfacher, die Positionen durch entsprechende Zahlen zu kennzeichnen. 52 Statt ={ | __ } , mit einem waagrechten Strich „__“ für eine leere Position zu schreiben, ist folgende Schreibweise mit Zahlen einfacher: - 1 1 = {- , -1 | 0}. 4 2 Bei einfachen Aussagen wie { | }=0 {0 | } = 1 {1 | } = 2 { | 0} = -1 {0 | 1} = 1 2 ist der Vorteil dieser Schreibweise kaum merkbar. Erst bei komplexen Positionen ist er deutlich erkennbar. Das gilt insbesondere für die „Rechenregeln“: Bei einer solchen Zahlen-Darstellung ist schnell ersichtlich, welcher Zug der möglichen Züge der günstigste ist. Die im Vergleich zu diesem eher ungünstigen Züge können weggelassen werden. Haben wir zwei Positionen G und H zur Auswahl, zu denen Weiß ziehen kann, und es gilt G ≤ H, dann können wir G vernachlässigen und in unserer Schreibweise weglassen. Es ist also {G, H,…| P,…} = {H,…| P,…}. Genau dasselbe machen wir bei Zahlen-Darstellungen, wobei für Schwarz die kleinste und für Weiß die größte Zahl übrig bleibt. Es ist also = und 1 2 i +1 1 1 1 1 = {0 | i , i −1 ,...,1} = {0 | i } . i +1 2 2 2 2 53 Auf diese Weise kann man Brüche als Spielpositionen repräsentieren. Man kann auch für Brüche wie Wir stellen 3 eine einfache Darstellung finden. 4 3 zunächst als disjunktive Summe dar: 4 3 1 1 1 = + ={0 | 1} + {0 | }. 4 2 4 2 Daraus ergeben sich jeweils zwei Zugmöglichkeiten für jeden Spieler und zwar 3 1 1 1 1 1 = {0 + , + 0 | 1+ , + }, was nach Streichung der nicht so 4 4 2 4 2 2 günstigen Züge 3 1 = { | 1} ergibt. 4 2 Genau so kann man jeden Bruch mit Zweierpotenz als Nenner durch ein Paar von Zugmöglichkeiten darstellen. Es gilt für ganze Zahlen n, k mit n ≥ 0: 2k + 1 k k +1 = { n | n } . Diese Gleichung bildet mit 0 = { | }, n+1 = {n | } und n +1 2 2 2 -(n+1) = { | -n} einen kompletten Satz von Standard-Darstellungen der im Schwarz-Weiß-Nim vorkommenden Zahlen. Der Einfachheitssatz hilft, eine gegebene Position auf eine solche Form bringen zu können. Einfachheitssatz: „Ist eine Zahl als Position in der Form {G | H} mit den Zahlen G < H darstellbar, dann ergibt sich diese Zahl auch für alle Positionen {P | Q}, deren Zugmöglichkeiten P und Q den Bedingungen G ≤ P <|| {G | H} <|| Q ≤ H genügen.“14 Die häufigste Anwendung dieses recht abstrakten Satzes lässt sich vereinfacht wie folgt formulieren: Eine Position {P | Q} mit P < Q ist gleich der „einfachsten“ Zahl s, mit s zwischen P und Q. 14 Bewersdorff, Jörg: „Glück, Logik und Bluff: Mathematik im Spiel - Methoden, Ergebnisse und Grenzen“. Vieweg. Braunschweig/Wiesbaden. 1998. S.132 54 Eine Zahl ist umso einfacher, je früher sie in nachfolgender Aufzählung vorkommt: 0, 1, -1, 2, -2, …, 1 1 3 3 1 1 3 3 5 5 ,- , , - , …, , - , , - , , - … 2 2 2 2 4 4 4 4 4 4 Wir wollen, um den Zusammenhang zu der abstrakten Version des Einfachheitssatzes zu erkennen, eine gegebene Position {P | Q} mit der StandardDarstellung s = {G | H} vergleichen. 3 3 3 3 Es ist {- | - } = {-2 | 0} = -1, wegen -2 ≤ - < -1 < - ≤ 0, 2 4 2 4 und { 9 29 1 3 1 9 3 29 ≤ ≤ 1, | } = { | 1}= , wegen < < 16 32 2 4 2 16 4 32 und {{0 | 0} | 1 1 ≤ 1. } = {-1 | 1} = 0, wegen -1 ≤ {0 | 0} || 0 < 2 2 In anderen Worten, liegt eine Zahl in Form einer Position vor, so ergibt sich diese Zahl auch dann, wenn die Zugmöglichkeiten beider Spieler oder eines Spielers geringfügig verbessert werden. Dazu sind für Weiß insbesondere die Züge erlaubt, die kleiner als die sich ergebende Zahl sind, und für Schwarz die Züge, die größer als die sich ergebende Zahl sind. Mit Hilfe des eben Gelernten können wir nun beliebige Türme des SchwarzWeiß-Nims analysieren. Man geht dabei von unten nach oben vor und untersucht alle Türme der Reihe nach, die sich aus dem Turm ergeben könnten: {0| }=1 {0|1}= 1 2 {0, 1 3 | 1}= 2 4 {0, 55 5 1 3 |1, }= 2 4 8 {0, 9 1 3 5 |1, , }= 2 4 8 16 Auch das obige Beispiel, bei dem sich mancher Leser gewundert haben dürfte, kann jetzt auf diese Weise analysiert werden: { |0}=-1 {-1|0}= - 1 2 1 2 {-1|0, - }= - 3 4 3 4 1 2 {-1, - |0, - }= - 5 8 Hieraus folgt auch, warum man diesen Turm mit S0 + W2 + W3 gleichsetzen darf, denn S 0 + W2 + W3 = −1 + 1 1 5 + = − . Das ist derselbe Wert wie der Wert dieses 4 8 8 Turmes. Man kann also das Schwarz-Weiß-Nim auf folgende Art und Weise untersuchen: Sind die zahlenmäßigen Werte bekannt, die aus einer Position durch alle möglichen Züge entstehen können, so ergibt sich der zahlenmäßige Wert der Position nach dem Einfachheitssatz. Wenn eine Position als disjunktive Summe vorliegt, so wendet man das Verfahren auf jede einzelne Komponente an und addiert anschließend die gefundenen Werte und erhält so den Wert für die Summe. 4.5. Misère-Spiel Es gibt auch noch das sogenannte Misère-Nim. Hier gelten die gleichen Kriterien wie bei der Standard-Version von Nim mit Ausnahme davon, dass der Spieler, der den letzten Zug macht, nicht gewinnt sondern verliert. Dabei zieht der Spieler, der auf Gewinn steht, zu einer Position mit Nim-Summe 0, außer wenn durch den Zug eine Position entsteht mit Haufen aus jeweils einem Stein. In diesem Ausnahmefall zieht der Spieler dann zu einer Position, die aus einer ungeraden Zahl von Einser-Haufen besteht. 56 Dann verläuft der Rest des Spiels unter Zugzwang bis zum Gewinn des Spielers mit Gewinnstrategie. Beispiel: Wir haben die Position (2, 1). Der anziehende Spieler 1 zieht zu (1), indem er den Haufen mit 2 Steinen wegnimmt. Darauf zieht Spieler 2 zur Position (0). Spieler 2 nimmt also den letzten Stein und verliert. An diesem Beispiel kann man auch nochmals schön die Gewinnstrategie in diesem Spiel erklären. Wir haben mit (2, 1) eine Gewinnposition für Spieler 1 vorliegen, da die Nim-Summe ungleich 0 ist. Spieler 1 könnte nun zur Position (1, 1) ziehen, die die Nim-Summe 0 hat. Hier gilt aber die Ausnahmeregelung, da eine Position aus lauter Haufen mit je einem Stein durch diesen Zug entstünde: Spieler 1 soll in diesem Fall zu einer Position mit einer ungeraden Anzahl von Haufen mit je einem Stein ziehen, auch wenn dort die Nim-Summe ungleich 0 ist. Das ist in diesem Fall der einzige Gewinnzug. Wenn Spieler 1 zu (1, 1) zöge, hätte Spieler 2 eine Gewinnstrategie. (Tiefergehende Informationen zum Nim-Spiel und seinen Varianten (es gibt NimVarianten en masse) findet man im Buch „Glück, Logik, Bluff: Mathematik im Spiel – Methoden, Ergebnisse und Grenzen“ von Jörg Bewersdorff, Seite 110-136 und Seite 165ff.) 57 5. Kettenbrüche und das Nim-artige Spiel Euklid 5.1. Kettenbrüche Kettenbrüche sind eine eindeutige Darstellungsform der reellen Zahlen. Man unterscheidet endliche und unendliche Kettenbrüche. 5.1.1. Endliche Kettenbrüche Definition: endlicher Kettenbruch „Ein endlicher Kettenbruch ist ein Bruch der Form: 1 a0 + 1 a1 + 1 a2 + 1 a3 + a4 + 1 O 1 a n −2 + 1 a n −1 + 1 an in welchem a0, a1, …, an reelle Zahlen darstellen, die – mit Ausnahme möglicherweise von a0 – alle positiv sind. Die Zahlen a0, a1, …, an heißen Teilnenner des Bruchs. Der Kettenbruch heißt einfacher Kettenbruch, wenn alle ai ganze Zahlen sind.“15 Jeder endliche einfache Kettenbruch kann zu einer rationalen Zahl verdichtet werden. Umgekehrt kann jede rationale Zahl als endlicher einfacher Kettenbruch geschrieben werden. Dies lässt sich mit dem Euklidischen Algorithmus realisieren. 15 Burton, David / Dalkowski, Heinz: „Handbuch der elementaren Zahlentheorie“. Heldermann Verlag. Lemgo. 2005. S.334 58 Exkurs: Euklidischer Algorithmus Der Euklidische Algorithmus ist ein Algorithmus aus dem mathematischen Teilgebiet der Zahlentheorie. Mit ihm lässt sich der größte gemeinsame Teiler zweier natürlicher Zahlen berechnen. Das Verfahren ist nach dem griechischen Mathematiker Euklid benannt, der es in seinem Werk „Die Elemente“ beschrieben hat. „Der Algorithmus basiert auf der wiederholten Anwendung einer Division mit Rest. Beispiel: ggT (12, 80) 80 : 12 = 6 Rest 8 12 : 8 = 1 Rest 4 8 : 4 = 2 Rest 0 Der größte gemeinsame Teiler von 12 und 80 ist ggT (12, 80) = 4. Man beginnt mit der „Division“ der größeren durch die kleinere Zahl. In jedem Schritt ist der Divisor des vorhergehenden Schritts der Dividend und der Rest des vorhergehenden Schritts der Divisor.“16 Auch wenn dies die gängige Schreibweise für den Euklidischen Algorithmus ist, gibt es mathematisch gesehen, Probleme mit dieser Notation. Daher verwendet man den Euklidischen Algorithmus häufig in folgender Schreibweise: 80 = 12 . 6 + 8 12 = 8 . 1 + 4 8=4.2+0 16 Appell, Kristina: Skript zur Vorlesung „Aufbau des Zahlensystems“ im WS 2005/06 59 Wir wollen nun mit Hilfe des Euklidischen Algorithmus den Bruch a als b Kettenbruch darstellen. Wir beginnen mit dem allgemeinen Schema des Euklidischen Algorithmus für a > b: a = q0 . b + r2 b = q1 . r2 + r3 r2 = q2 . r3 + r4 … rn = qn . rn+1 + rn+2 … ro = qo . ro+1 + 0 Dabei handelt es sich, wie wir sehen werden, bei q0, q1… qo um die Teilnenner des Kettenbruches. Der Bruch a wird nun auf folgende Weise in einen Kettenbruch umgewandelt: b a = q0 . b + r2 | :b ( oder besser: r a 1 = q 0 + 2 = q 0 + ). b b b r2 Wir behandeln nun jede einzelne Zeile gemäß a = q0 . b + r2 | :b und erhalten: r a 1 1 = q0 + 2 = q0 + = q0 + = ... b r3 b b q1 + r2 r2 Wir wollen das Ganze nochmals an einem Beispiel betrachten: Der Bruch 13 soll als Kettenbruch geschrieben werden. 5 Zuerst kommt der Euklidische Algorithmus zur Anwendung: 13 = 2 . 5 + 3 5 =1.3+2 3 =1.2+1 2 =2.1+0 Danach wird der Bruch in einen Kettenbruch umgewandelt. 60 13 3 1 1 1 1 = 2+ = 2+ = 2+ = 2+ = 2+ . 5 2 1 1 5 5 1+ 1+ 1+ 3 1 3 3 1+ 2 2 Eine alternative Schreibweise für Kettenbrüche sieht so aus: [q0, q1, q2, q3,…]. Sie ist beim Aufschreiben und Drucken eines Kettenbruches handlicher. In dieser Schreibweise würde unser obiges Beispiel 13 als [2, 1, 1, 2] 5 aufgeschrieben werden, was im Vergleich zur obigen Kettenbruchschreibweise wesentlich kompakter ist. Weil jede rationale Zahl zwei Kettenbruchdarstellungen (und dies sind auch die einzigen beiden) hat, ist eine Einigung notwendig, um eine eindeutige Darstellung zu bekommen. Ist nämlich der letzte Teilnenner an eine Zahl, die größer als 1 ist, so gilt: 1 an = (an - 1) + 1=(an - 1) + . Es ist also an = [an – 1, 1]. 1 Die zwei Kettenbrüche [a0, a1, a2,…, an-1, an] und [a0, a1, a2,…, an-1, an -1, 1] sind somit gleich. Hat man allerdings an = 1 vorliegen, dann gilt a n −1 + 1 1 = a n −1 + = a n −1 + 1 , also ist dann auch [an-1, 1] = an-1 + 1 und an 1 [a0, a1, a2,…, an-1, an] = [a0, a1, a2,…, an-2, an-1 + 1]. Häufig wird wegen der Eindeutigkeit der Darstellung an ≠ 1 festgelegt. Definition: Fibonacci-Zahlen Die durch u0 = 0, u1 = 1 und un+1 = un + un-1 definierten Zahlen un ( n ∈ N ) heißen Fibonacci-Zahlen. Die ersten Fibonacci-Zahlen sind also 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377. Die unendliche Zahlenfolge der Fibonacci-Zahlen geht auf den 61 Mathematiker Leonardo da Pisa, genannt Fibonacci, zurück. Die jeweils nächste Zahl in dieser Folge erhält man rekursiv als die Summe der beiden Vorgänger. Wir wollen nun die Fibonacci-Zahlen betrachten und uns den Quotienten zweier aufeinanderfolgender Fibonacci-Zahlen anschauen, also die rationale Zahl u n +1 . un Wenden wir auf sie den Euklidischen Algorithmus an, so erhalten wir die folgenden n - 1 Gleichungen un+1 = 1 . un + un-1 un = 1 . un-1 + un-2 … u4 = 1 . u3 + u2 u3 = 2 . u2 + 0. Wir bekommen demnach den Kettenbruch u n +1 = 1,1,1,...,1,1,1 . = 1, 1,1...,1 ,2 23 142 4 43 4 un (n1 −3) − mal n − mal Wie wir oben gesehen haben sind die beiden Schreibweisen gleichwertig. In der zweiten Darstellung haben wir einen Kettenbruch mit n Einsen vorliegen. Der Quotient zweier aufeinanderfolgender Fibonacci-Zahlen ergibt also einen ganz besonderen Kettenbruch, der eine führende 1 und n - 1 weitere Einsen hat. Definition: k-te Konvergente oder k-ter Näherungsbruch „Der Kettenbruch, der aus dem Kettenbruch [a0, a1, …, an] durch Abbruch nach dem k-ten Teilnenner hervorgeht, heißt k-te Konvergente oder k-ter Näherungsbruch des gegebenen Kettenbruches und wird mit Ck bezeichnet. In Symbolen: Ck = [a0, a1,…, ak], 1 ≤ k ≤ n. Unter der 0-ten Konvergente C0 versteht man die Zahl a0. Aus dieser Definition folgt ein einfacher, aber wichtiger Umstand. Ist k < n und wird ak durch ak +1 ersetzt, dann erhält man statt der Konvergente Ck die a k +1 Konvergente Ck+1: 62 [a0, a1,…, ak-1, ak+ 1 a k +1 ] = [a0, a1, …, ak-1, ak, ak+1] = Ck+1. “17 Dass Cn die durch den Kettenbruch ausgedrückte rationale Zahl selbst darstellt, ist kaum erwähnenswert. Unter diesem Aspekt wollen wir uns nochmals unser Beispiel 13 anschauen: 5 Der zugehörige Kettenbruch war [2, 1, 1, 2]. Die Konvergenten sind 1 13 1 1 1 = 2 , C3 = 2+ = . C0 = 2, C1 = 2+ =3, C2 = 2+ 1 1 1 2 5 1+ 1+ 1 1 1+ 2 Die Konvergenten sind abwechselnd kleiner und größer als von C3, der den exakten Wert 13 mit Ausnahme 5 13 13 hat, wobei jede Konvergente dichter an liegt 5 5 als die vorhergehende. Dies ist grundsätzlich so, nicht nur in diesem Beispiel. 5.1.2. Unendliche Kettenbrüche In diesem Unterkapitel beschränken wir uns auf die Untersuchung unendlicher einfacher Kettenbrüche. Ein solcher unendlicher einfacher Kettenbruch hat die Form: 1 a0 + 1 a1 + a2 + 1 a3 +O Das Wort einfach hat dieselbe Bedeutung wie bei den endlichen Kettenbrüchen. Es meint nämlich, dass alle Teilnenner a0, a1, a2, … eine unendliche Folge ganzer Zahlen bilden, die alle – bis auf möglicherweise a0 – positiv sind. 17 Burton, David / Dalkowski, Heinz: „Handbuch der elementaren Zahlentheorie“. Heldermann Verlag. Lemgo. 2005. S.349 63 Wir wollen in Anlehnung an endliche Kettenbrüche die kürzere Schreibweise [a0, a1, a2, …] benutzen, um einen solchen Kettenbruch aufzuschreiben. Definition: unendlicher einfacher Kettenbruch „ Ist a0, a1, a2,… eine unendliche Folge ganzer Zahlen, in der alle Glieder – bis auf möglicherweise das erste Glied a0 – positiv sind, dann versteht man unter dem Wert des unendlichen einfachen Kettenbruches [a0, a1, a2,…] den Wert lim[a 0 , a 1 , a 2 ,..., a n ] .“18 n →∞ Das wohl einfachste Beispiel eines unendlichen einfachen Kettenbruches ist [1, 1, 1, 1,…]. Aus Kapitel 5.1.1. ist uns bekannt, dass die n-te Konvergente Cn = [1, 1, 1,…, 1], in der die 1 genau (n + 1)-mal vorkommt, eine Darstellung durch einen Quotienten aus zwei aufeinander folgenden Fibonacci-Zahlen hat, und zwar ist Cn = u n +1 , wobei n ≥ 0. un Wenn wir den Wert des Kettenbruches [1, 1, 1, …] mit x bezeichnen, dann folgt u n +2 n →∞ u n +1 x = lim C n = lim n →∞ u n +1 + u n 1 1 1 = lim = lim 1 + =1+ = 1+ . n →∞ n →∞ u n +1 u u n +1 x lim n +1 n →∞ u un n Und dies ist nichts anderes als die quadratische Gleichung x 2 − x − 1 = 0 , deren einzige positive Lösung x = 1+ 5 1+ 5 ist. Daher gilt [1, 1, 1,…] = . Dieser 2 2 Wert wird als Goldener Schnitt bezeichnet. Enthält ein Kettenbruch einen Block von Teilnennern b1, b2,…, bn, der sich periodisch unendlich oft wiederholt, so nennt man diesen Bruch periodischen Kettenbruch. 18 Burton, David / Dalkowski, Heinz: „Handbuch der elementaren Zahlentheorie“. Heldermann Verlag. Lemgo. 2005 64 Ein periodischer Kettenbruch hat die Form [a 0 , a 1 ,..., a m , b1 ,..., b n , b1 ,..., b n , b1 ,...] [ ] oder kompakter a 0 , a 1 ,..., a m , b1 ,..., b n . Die Periode kann also, wie aus der Dezimalbruchentwicklung bekannt, mit der Überstreichung der sich ständig wiederholenden Elemente gekennzeichnet werden. Der Block b1, b2,…, bn heißt Periode, n ist die Periodenlänge. Der Wert eines jeden unendlichen einfachen Kettenbruches ist eine irrationale Zahl und jede irrationale Zahl besitzt eine konvergente unendliche einfache Kettenbruchentwicklung. Wenn für zwei unendliche Kettenbrüche die Gleichheit [a 0 , a 1 , a 2 ,...] = [b 0 , b1 , b 2 ,...] gilt, dann ist an = bn für alle n ≥ 0. 5.2. Der Goldene Schnitt Zwei Strecken stehen im Verhältnis des Goldenen Schnittes, wenn sich die größere zur kleineren verhält wie die Summe aus beiden zur größeren. Dieses Verhältnis wird meist in der mathematischen Literatur mit dem griechischen Buchstaben Φ oder τ bezeichnet. Bezeichnet man die längere Strecke mit a und die kürzere mit b, dann gilt 2 a a+b a a = bzw. a 2 − ab − b 2 = 0 oder − − 1 = 0 . b a b b Daraus folgt für das Verhältnis a zu b Φ= a 1+ 5 = = 1,618033988... b 2 Die Herleitung des Zahlenwertes wurde bereits in Kapitel 5.1.2. besprochen. Die quadratische Gleichung x 2 − x − 1 = 0 hat allerdings neben dem Goldenen Schnitt noch eine zweite Lösung. Die zweite Lösung der quadratischen Gleichung ist die negative Zahl Φ= 1− 5 1 = 1− Φ = − . 2 Φ 65 Es gibt mathematische Zusammenhänge, die sich unter gleichzeitiger Verwendung von Φ und Φ in besonders symmetrischer Weise schreiben lassen. Stetige Teilung Subtrahiert man die kürzere der beiden Strecken b von der längeren a, so erhält man eine Strecke a - b, zu der die ursprünglich kürzere b wiederum im Verhältnis des Goldenen Schnittes steht. Der Begriff stetige Teilung soll ausdrücken, dass dieser Vorgang beliebig oft wiederholbar ist und dabei stets dasselbe Verhältnis, nämlich den Goldenen Schnitt, liefert. Zusammenhang mit den Fibonacci-Zahlen In einem engen Zusammenhang zum Goldenen Schnitt steht die unendliche Zahlenfolge der Fibonacci-Zahlen. Für das Verhältnis zweier aufeinander folgender Fibonacci-Zahlen gilt: u n +1 u n + u n −1 u = = 1 + n −1 . un un un Das bedeutet, dass das Verhältnis zweier aufeinander folgender Fibonacci-Zahlen gegen den Goldenen Schnitt strebt, je weiter man in der Folge geht. Wenn die Folge dieser Verhältnisse gegen einen Grenzwert Φ konvergiert, muss daher für ihn gelten Φ = 1 + 1 . Φ Diese Beziehung gilt aber gerade für den Goldenen Schnitt, wie wir festgestellt haben. Die Beziehung gilt also auch für allgemeine Fibonacci-Folgen mit zwei beliebigen Anfangsgliedern. Zum Beispiel bestehen zwischen Nachbarn der ersten zehn Glieder 1, 1, 2, 3, 5, 8, 13, 21, 34, 55… jeweils die Verhältnisse 1, 2, 1.5, 1.666…, 1.6, 1.625, 1.615…, 1.619…, 1.617…, …. Der Goldene Schnitt ist damit auf drei Nachkommastellen genau bestimmt. 66 Die Glieder der Fibonacci-Folge lassen sich auch über die geschlossenen Formel an = (Φ 5 1 n −Φ n ) berechnen. Der Goldene Schnitt als die irrationalste und nobelste aller Zahlen Der Goldene Schnitt ist eine irrationale Zahl. Er lässt sich also nicht als Bruch zweier ganzer Zahlen darstellen. Von großer Bedeutung für seine besondere Rolle in Kunst und Natur ist seine ganz besondere Eigenschaft, in gewissem Sinne die irrationalste aller Zahlen zu sein. Das äußert sich darin, dass er sich sehr schwer durch rationale Zahlen durch einen Kettenbruch annähern lässt. In einem Kettenbruch erscheint vor jedem Pluszeichen eine ganze Zahl, ein sogenannter Teilnenner. Je größer diese Zahl ist, umso kleiner ist der Bruch, in dessen Nenner sie steht, und umso kleiner ist daher auch der Fehler, der entsteht, wenn der unendliche Kettenbruch vor eben diesem Bruch abgebrochen wird. Kehrt man diese Argumentation um, so folgt, dass die Approximation besonders schlecht ist, wenn der Teilnenner besonders klein ist. Die kleinste zulässige Zahl in einem einfachen Kettenbruch ist aber die 1. Der einfache Kettenbruch, dessen Teilnenner nur Einsen sind, hält aus diesem Grund von allen rationalen Zahlen maximal Abstand und ist in diesem Sinn die irrationalste aller Zahlen. 1 . Φ Für den Goldenen Schnitt gilt aber Φ = 1 + Daraus ergibt sich durch wiederholte Anwendung dieser Gleichung Φ = 1+ 1 1 = 1+ = ... = 1 + 1 Φ 1+ 1+ Φ 1+ 1 1 1 1 1+ 1 1+ 1+ 1 1 + ... Daher ist der Goldene Schnitt Φ die irrationalste Zahl aller Zahlen. 67 Bricht man seine Kettenbruchzerlegung an einer beliebigen Stelle ab, so erhält man einen Bruch aus zwei aufeinander folgenden Fibonacci-Zahlen. Das heißt, der Bruch aus zwei aufeinanderfolgender Fibonacci-Zahlen stellt stets eine Approximation von Φ dar. Die Approximation für den Goldenen Schnitt verläuft dabei so langsam wie für keine andere Zahl. Zahlen, deren unendliche Kettenbruchdarstellung ab irgendeiner Stelle nur noch Einsen enthält, nennt man noble Zahlen. Der Goldene Schnitt ist somit auch die nobelste aller Zahlen. (Mehr interessante Informationen zum Goldenen Schnitt findet man auf der Seite http://www.wikipedia.de (Stand: 14.07.2006).) 5.3. Das Spiel Euklid 5.3.1. Spielregeln Das Nim-artige Spiel Euklid wird von zwei Personen gespielt. Eine Position besteht aus einem Paar (a, b) mit positiven ganzen Zahlen a und b. Die Spieler ziehen abwechselnd. Ein Zug besteht darin, die größere Zahl in der aktuellen Position um ein Vielfaches der kleineren Zahl zu vermindern, so lange das Ergebnis noch positiv bleibt. Der erste Spieler, der nicht mehr ziehen kann, verliert. Auch hier gibt es keine zufälligen Elemente, beide Spieler sind vollständig informiert über den Spielstand und über die möglichen nachfolgenden Züge. Das Spiel endet nach einer endlichen Zahl von Zügen. Es gibt auch noch eine eingeschränkte Version des Spiels. Bei dieser EuklidVersion ist eine Menge natürlicher Zahlen Λ gegeben. Ein Zug vermindert hier die größere Zahl in der aktuellen Position um ein Vielfaches λ ∈ Λ der kleineren Zahl, so lange das Ergebnis eben positiv bleibt. 68 Das Spiel wurde von Cole und Davie eingeführt.19 Ich möchte im Folgenden die Gewinnstrategien sowie die Berechnung der Spiellänge zeigen. Hierbei nehme ich optimales Spiel beider Spieler an. 5.3.2. Gewinnstrategien Vorbemerkung: Bevor wir zu den Gewinnstrategien kommen, möchte ich, dass Sie als Leser selbst einmal Euklid spielen und dabei versuchen, eine Gewinnstrategie zu finden. Nehmen Sie sich ein beliebiges Zahlenpaar (a, b) und es kann losgehen. Beispiele: (1) Wir nehmen als Ausgangsposition das Zahlenpaar (86, 35). Spieler 1 zieht, indem er die kleinere von der größeren Zahl abzieht. In der neuen Position wird die größere Zahl durch das Ergebnis der Differenz 86 - 35 ersetzt: Die Position (86 - 35, 35) = (51, 35) entsteht. Spieler 2 zieht darauf zu (16, 35), indem auch er die kleinere von der größeren Zahl subtrahiert. Darauf wählt Spieler 1 einen Zug zu (16, 19). Hier wurde 16 von 35 abgezogen. Der nächste Zug von Spieler 2 führt zur Position (16, 3), wobei er 16 von 19 subtrahiert. Spieler 1 zieht zu (4, 3), indem er das Vierfache von 3 von 16 abzieht. Es entsteht die neue Position (16 – 4 . 3, 3) = (4, 3). Spieler 2 zieht von (4, 3) zu (4 - 3, 3) = (1, 3). Spieler 1 macht den letzten Zug von (1, 3) zu (1, 3 – 2 . 1) = (1, 1) und gewinnt. (2) Wir nehmen die Ausgangssituation (73, 65). Spieler 1 zieht zu (8, 65). Spieler 2 macht seinen Zug zu (8, 9), indem er das Siebenfache von 8 von 65 abzieht. Daraufhin geht der Zug von Spieler 1 zu (8, 1) und Spieler 2 macht den letzten Zug zu (1, 1) und gewinnt. 19 Cole, A. J. / Davie, A. J. T.: „A game based on the Euclidean algorithm and a winning strategy for it“. The Mathematical Gazette 53 (1969): S. 354 - 357 69 Spielen Sie mehrerer Male und mit verschiedenen Zahlenpaaren. Erkennen Sie eine Gewinnstrategie? Viele werden merken, dass es gar nicht so trivial ist, eine Gewinnstrategie für dieses Spiel zu bestimmen. Ich habe selbst mehrere Versuche mit Schülern unternommen, die die Gewinnstrategie nicht kannten, und sie waren verblüfft, dass ich mit Kenntnis der Gewinnstrategie in jedem Spiel gegen Sie gewinnen konnte. Die Schüler sind allerdings nicht auf die Gewinnstrategie gekommen, auch nicht mit Hilfestellungen. Wenn ich bei Ihnen nun eine gewisse Sensibilität für die Schwierigkeit, eine Gewinnstrategie zu bestimmen, erreicht habe, können Sie weiterlesen und Sie werden überrascht sein, wie leicht man gewinnen kann. Es gibt in diesem Spiel kein Unentschieden und das Spiel ist endlich, das heißt einer der Spieler muss eine Gewinnstrategie haben für jede Startposition (a, b). Wir haben zwei äquivalente Möglichkeiten zum Finden der Gewinnstrategie: einmal über die Betrachtung des Kettenbruches von b und einmal durch den a Vergleich mit dem Goldenen Schnitt. Dabei ist unser Ziel, die Paare (a, b) zu bestimmen, bei denen der Spieler, der als erstes zieht, bei optimalem Spiel gewinnt. Bei der ersten Möglichkeit wird für Λ = Λ k = {1,2,3,..., k}, k ≥ 2 der anziehende Spieler gewinnen, wenn der erste Teilquotient, der von 1 verschieden ist, in der in Kapitel 5.1.1. beschriebenen Kurzform der Kettenbruchentwicklung [a0, a1, a2,…, an] von b , wobei b > a ist, an einer Position ai mit geradem Index i vorkommt. a Taucht der erste Teilquotient, der von 1 verschieden ist, an einer Position mit ungeradem Index i auf, so hat der nachziehende Spieler eine Gewinnstrategie. Andererseits (und das ist die zweite Möglichkeit) liegt eine Gewinnposition vor, wenn das Verhältnis b , wobei b > a ist, größer als der Goldene Schnitt a 70 Φ= 1+ 5 b 1+ 5 ist. Ist das Verhältnis , wobei b > a ist, kleiner als Φ = , so 2 2 a hat der nachziehende Spieler eine Gewinnstrategie. 5.3.3. Gewinnstrategie über den Goldenen Schnitt Satz von Cole und Davie:20 Seien a und b positive ganze Zahlen mit b > a. Spieler 1 hat genau dann eine Gewinnstrategie, wenn das Verhältnis der größeren zu der kleineren Zahl, der Ausgangsposition größer als Φ = b , in a 1+ 5 ist. 2 Mit Spieler 1 wird immer der anziehende und mit Spieler 2 der nachziehende Spieler bezeichnet. Beispiel: Beim Paar (3, 2) hat Spieler 2 eine Gewinnstrategie, weil 3 < Φ ist. 2 Der Spieler 1 muss zu (1, 2) ziehen, Spieler 2 zieht daraufhin zu (1, 1) und Spieler 1 verliert, weil er nicht mehr ziehen kann. (Der Zug von (1, 1) zu (0, 0) ist nicht möglich, da 0 nicht positiv ist!) Beim Paar (5, 2) hat Spieler 1 eine Gewinnstrategie, weil 5 > Φ ist. 2 Spieler 1 wird zu (3, 2) ziehen, nur mit diesem Zug kann er seine Gewinnstrategie sichern. Zöge Spieler 1 zu (1, 2), was nicht optimal wäre, so sähe sich Spieler 2 einem Verhältnis größer Φ gegenüber, er hätte somit eine Gewinnstrategie. Spieler 2 würde dann zu (1, 1) ziehen und hätte gewonnen. 20 Cole, A. J. / Davie, A. J. T.: „A game based on the Euclidean algorithm and a winning strategy for it“. The Mathematical Gazette 53 (1969). S. 356 71 In unserem optimalen Spiel aber kann dann Spieler 2 nicht anders als von (3, 2) zu (1, 2) zu ziehen und Spieler 1 macht den letzten Zug zu (1, 1). Die Gewinnstrategie kann beschrieben werden in Form der Mengen W und W ′ mit W ′ = {(x, y) | x, y > 0, y y 1 ≥ Φ} und W = {(x, y) | x, y > 0, ≤ } sowie der x x Φ Menge L = {(x, y) | x, y > 0, 1 y < < Φ} . Φ x Man kann zeigen, dass für jedes Paar in W ∪ W' genau ein Zug existiert, der ein Paar in L ergibt, und für jedes Paar in L lassen alle zulässigen Züge ein Paar in W ∪ W' für den nächsten Spieler zurück. Ohne Einschränkung der Allgemeinheit können wir annehmen, dass a < b in der Startposition (a, b) ist. Ansonsten vertauschen wir eben a und b in allen Ausdrücken, in denen a > b ist, so dass die erste Zahl immer kleiner ist als die zweite, solange die Zahlen unterschiedlich sind. (Wenn die Zahlen allerdings gleich wären, wäre das Spiel trivial. Es gäbe keinen einzigen Zug und der nachziehende Spieler hätte gewonnen.) Wir haben also, wenn wir a und b in diesen Fällen tauschen, eine Gewinnstrategie für Spieler 1 genau dann, wenn b > Φ ist. a Geometrischer Beweis: Wir betrachten den offenen Kegel definiert durch L = (x, y) | x, y > 0, 1 y < < Φ Φ x Man kann sich (x, y) als Punkte im Koordinatensystem und den Kegel als Bereich zwischen den zwei Geraden y = 1 x und y = Φ ⋅ x im ersten Quadranten Φ vorstellen. Das Ziel des Spiels ist es, zur Diagonale y = x zu ziehen. Wir haben zwei Fälle (beziehungsweise Bereiche im Koordinatensystem): Entweder (a, b) ist in L oder eben nicht. 72 Figur 1 Figur 2 Figur 3 Figuren 1-321 Die folgenden zwei Sachverhalte werden in Figur 1 bis 3 dargestellt. (1) Für jedes Paar (a, b), a ≠ b, gibt es genau eine Richtung (horizontal oder vertikal), in welche der Spieler einen zulässigen Zug machen kann. Wenn a > b, kann der Spieler nur ein Vielfaches von b von a abziehen, also geht der Zug in horizontaler Richtung. Wenn allerdings b > a, dann wird ein Vielfaches von a von b weggenommen und wir haben einen vertikalen Zug. Von einer beliebigen Position (a, b) ∈ L gibt es nur einen legalen Zug und der führt zu einer Position außerhalb von L. (2) Für jedes a gibt es genau a Punkte in L mit x = a. Deshalb gibt es für a < b ein einziges ganzzahliges Vielfaches von a, sagen wir d = λ a , welches b um d vermindert und das neue Paar (a, b - d) in L platziert, vorausgesetzt (a, b) ∉ L . Die erste Figur zeigt, dass (a, b) mit a < b einen Zug nach unten erzwingt, während wir nach links ziehen müssen, wenn a > b ist. Der Fall (a, b) mit a > b kann reduziert werden auf den Fall mit a < b mit einer Spiegelung an der ersten Winkelhalbierenden x = y. Wenn (a, b) ∈ L , a < b, dann ist a < b < 2a und daher ist (a, b - a) der einzige zugelassene Zug von (a, b) (vergleiche Figur 2). Es ist einfach zu erkennen, dass a > Φ ist. Das ergibt sich auch aus Sachverhalt (1). b−a 21 Lengyel, Tamás: A nim-type game and continued fractions. http://employees.oxy.edu/lengyel/papers/FQCf2344.pdf (Stand: 20.09.2006). S.2 73 Eigenschaft (2) ist in Figur 3 illustriert. Für jede ganze Zahl a gibt es genau a Punkte mit ganzzahligen Koordinaten auf dem Abschnitt, den der Kegel L aus der Gerade x = a „herausschneidet“, also der Abschnitt der Gerade, der im Kegel L liegt. Das folgt aus der Beobachtung, dass die Gerade x = a aus L einen Abschnitt der Länge Φ ⋅ a − 1 ⋅ a = a ausschneidet. Φ Wenn (a, b) ∉ L , dann gibt es wegen der Irrationalität von Φ genau einen Zug, der zu einem Punkt (a, b ′) ∈ L für eine ganze Zahl b ′ führt. Es gilt also (a, b) ∉ L und a < b. Wir wollen zeigen, dass (a, b ′) ∈ L gilt, wegen der Irrationalität von Φ. Dazu müssen wir sowohl Existenz als auch Eindeutigkeit eines solchen Paares nachweisen. Dazu zunächst ein Beispiel: Gegeben sei die Position (11, 37). Mögliche Züge sind (11, 26), (11, 15), (11, 4). Der einzige Zug, der zu einer Position in L führt, ist der Zug zu (11, 15). Im nachfolgenden Beweis ist [z ] = max{m ∈ Z : m ≤ z} , wobei Z die Menge aller ganzen Zahlen ist. Für 37 4 = 3+ ist zum Beispiel 11 11 Ansatz: b ′ = b − d ⋅ a mit 1 ≤ d < 37 11 = 3 . b b , das sind viele Möglichkeiten für d; je a a zwei von den b ′ = b − d ⋅ a haben eine Differenz, die ein Vielfaches von a ist. Das heißt in jedem Intervall der Länge a gibt es ein b ′ = b − d ⋅ a für ein passendes d. Der Schnitt von {(x, y) : x = a}mit L enthält a ganzzahlige Punkte. Also gibt es b ′ mit (a, b ′) ∈ L . (Existenz) Angenommen, es gibt b ′ mit (a, b ′) ∈ L und b ′′ mit (a, b ′′) ∈ L . Dann gilt b ′′ − b ′ = a oder b ′′ − b ′ = 0 . Angenommen es ist b ′′ − b ′ = a . Dann müssten, 74 weil der Schnitt von L und {(x, y) : x = a} genau die Länge a ⋅ Φ − a 1 = a hat, die Φ beiden Punkte (a, b ′) und (a, b′′) auf den Randgeraden liegen. Auf den Randgeraden können allerdings aufgrund der Irrationalität von Φ für ganze Zahlen a nur irrationale Zahlen b liegen, was der Voraussetzung, dass a und b ganze Zahlen sind, widerspricht. Es gilt also b ′′ − b ′ = 0 und somit b ′′ = b ′ . (Eindeutigkeit) Im Fall (a, b) ∈ L dagegen gibt es nur einen einzigen zulässigen Zug und zwar zu einem Punkt außerhalb L (siehe Figur 2). Im Falle eines optimalen Spiels hat der Verlierer nur einen zulässigen Zug, der ihm jedes Mal, wenn er am Zug ist, zur Verfügung steht. Das bedeutet seine Züge sind ihm auferzwungen und er kann nicht einmal die Länge des Spiels beeinflussen. □ Figur 4 zeigt zwei typische Spiele: Die Startpositionen (9, 2) und (11, 8) ergeben eine Gewinnstrategie für Spieler 1 im ersten Fall beziehungsweise eine Gewinnstrategie für Spieler 2 im zweiten Spiel. Figur 4 Zwei Spiele mit Startpositionen (11, 8) und (9, 2)22 22 Lengyel, Tamás: A nim-type game and continued fractions. http://employees.oxy.edu/lengyel/papers/FQCf2344.pdf (Stand: 20.09.2006). S.3 75 Hier ist ein Anfang eines Baums für alle Spiele: (1,1) … (1,2) (3,1) (4,1) … (3,2) … (3,11) (3,8) (3,5) (5,2) (7,2) (9,2) … (11,8) … (11,30) (11,19) (19,8) (27,8) … Baum für „alle“ Spiele Man kann sich den Baum sowohl bei vielen Knoten nach unten als auch nach rechts und links fortgesetzt denken, was ich der Überschaubarkeit halber weggelassen habe. Der Baum scheint also schnell unübersichtilich zu werden. Wir werden deshalb später noch einen Baum betrachten, der für das Spiel Euklid geeigneter ist als dieser. Trotzdem sieht man hier das Spiel mit Startposition (9, 2), dessen Pfad mit kurzen Strichen markiert ist, und das Spiel mit Ausgangsposition (11, 8), von dem ein 76 Teil des Pfades mit längeren Strichen markiert ist und dessen Pfad ab Position (3, 2) den gleichen Pfad nimmt wie das Spiel (9, 2). Anmerkung: (Beweis nach Cole und Davie) Man kann den Satz von Cole und Davie auch durch Induktion beweisen. Wir nehmen dem Induktionsbeweis allerdings Lemma 1 und 2 vorweg, was den eigentlichen Beweis von Satz 1 wesentlich kompakter und übersichtlicher macht. Ausgegangen wird von dem Anfangspaar (a, b) mit b > a. Lemma 1: Es seien a und b positive ganze Zahlen, so dass (1) a < 1 2 ( 5 − 1 b impliziert b − a > (2) a > 1 2 ( 5 − 1 b impliziert b − a < 1 b < a < b . Dann gilt folgendes: 2 ) 1 2 ( 5 − 1 a und ) 1 2 ( 5 −1 a . ) ) Beweis: Implikation (1): Aus a < Ungleichung 1 2 ( 1 2 ( 1 2 ( ) 5 − 1 b folgt durch Division mit 1 2 ( ) 5 − 1 die ) 5 + 1 a < b . Subtrahiert man auf beiden Seiten a, kommt ) 5 + 1 a − a < b − a heraus. Vereinfacht man die Ungleichung, so kommt man zur obigen Ungleichung b − a > 1 2 ( ) 5 −1 a . Analog wird Implikation (2) bewiesen. Lemma 2: Seien a, b positive ganze Zahlen, so dass a nicht b teilt mit 2a < b und sei n > 1 die größte ganze Zahl, für die n.a < b gilt. Dann gilt entweder b − n ⋅a > 1 2 77 ( ) 5 −1 a oder a> 1 2 ( ) 5 − 1 (b − (n − 1) a ) . Beweis: Sei a < 1 2 ( ) 5 − 1 (b − (n − 1) a ) dann folgt nach Division durch Ungleichung erhält man 1 2 1 2 ( ( 1 2 ( ) 5 − 1 die ) 5 + 1 a < (b − (n − 1) a ) . Subtrahiert man a auf beiden Seiten, so ) 5 + 1 a − a < b − na . Vereinfachen ergibt 1 2 ( ) 5 − 1 a < b − na . Ich führe nochmals zur Erinnerung den Satz von Cole und Davie auf: Satz von Cole und Davie: Seien a und b positive ganze Zahlen mit b > a. Spieler 1 hat genau dann eine Gewinnstrategie, wenn das Verhältnis der größeren zu der kleineren Zahl der Ausgangsposition größer als Φ = b in a 1+ 5 ist. 2 Mit Spieler 1 wird immer der anziehende und mit Spieler 2 der nachziehende Spieler bezeichnet. Der Beweis ist etwas leichter zu verstehen, wenn man den Satz von Cole und Davie geringfügig umformuliert, wobei an seiner Aussage nichts verändert wird: Seien a und b positive ganze Zahlen mit b > a. Spieler 1 hat genau dann eine Gewinnstrategie, wenn a < 1 2 ( ) 5 − 1 b ist (was dasselbe bedeutet wie oben b 1+ 5 ). > a 2 78 Beweis durch Induktion: Induktionsanfang: Für b = 2 ist der Wert für a trivial, nämlich 1, da es der einzige zulässige Wert für a ist (da ja b > a, a und b positiv, ganzzahlig). Für b = 3 gibt es zwei mögliche Spiele, das eine ist (3, 1) das andere (3, 2). Im Spiel (3, 1) gewinnt Spieler 1, im Spiel (3, 2) Spieler 2. Induktionsannahme: Wir nehmen nun an, dass der Satz von Cole und Davie für alle b < B und alle mit diesen b korrespondierenden zulässigen a gilt. Induktionsschritt: Betrachten wir den Fall (A, B), wobei 0 < A < B. Wenn B = n A für eine ganze Zahl n gilt, dann kann Spieler 1 in einem Zug gewinnen. Wir nehmen an, dass B ≠ n A. Wenn 1 B < A < B ist, dann hat Spieler 1 nur 2 einen einzigen möglichen Zug, nämlich von (B, A) zu (A, B – A) und wegen der Induktionsannahme und Lemma 1, hat Spieler 2 genau dann eine Gewinnstrategie, wenn A > 1 2 ( ) 5 − 1 B. Spieler 1 hat genau dann eine Gewinnstrategie, wenn A < Nehmen wir nun an, dass 0 < A < 1 2 ( ) 5 − 1 B. 1 B ist und n die größte ganze Zahl, für die 2 gilt, dass n . A < B ist. Dann kann sich Spieler 1 aussuchen, ob er zu Position (B – (n – 1) . A, A) oder zu Position (A, B – n . A) ziehen will. Wegen Lemma 2 und der Induktionsannahme führt einer der beiden Züge zu einer Verlustposition für B. Der Behauptung in dem Satz von Cole und Davie folgt nun aus Induktionsanfang und Induktionsschritt. □ 79 5.3.2. Gewinnstrategie über Kettenbrüche Kettenbrüche und eine deterministische Version Zuerst wechseln wir zu einer deterministischen Version des Spiels. Die Spieler ziehen abwechselnd und jeder Zug reduziert die in der aktuellen Position größere der beiden Zahlen um den Wert der kleineren, solange das Ergebnis positiv ist. Der Spieler, der zuerst nicht mehr ziehen kann, verliert. Der Grund für die Einführung dieser Version ist, zu verstehen, wie einfach Kettenbrüche dazu beitragen, dieses und das Original-Spiel zu analysieren. Tatsächlich basiert die Notation der Kettenbrüche auf dem Prozess der kontinuierlichen abwechselnden Subtraktion. Rationale Zahlen können als Kettenbrüche dargestellt werden, indem der Euklidische Algorithmus angewandt wird. Zuerst nehmen wir die endliche einfache Kettenbruchentwicklung von b = [a 0 , a 1 , a 2 ,..., a n ] . Die natürliche Zahl ai nennt man den i-ten Teilnenner (oder a die i-te Kettenbruchstelle) von b . Beachtet werden muss, dass wir bei i = 0 a beginnen. Diese Form stellt uns eine Repräsentation der Spielzüge zur Verfügung. Wenn b = q . a + r ist, mit ganzen Zahlen q und r, wobei 0 ≤ r < a, dann ist q = a0. Nach a0 fortlaufenden Subtraktionen von a von b, das heißt b - a0 . a, wird der Rest r kleiner als a. Wir tauschen deren Rollen23 und subtrahieren kontinuierlich weiter bis r = 0, bis zu dem Punkt, an dem a = b ist. Die Zahl der zulässigen Züge in diesem Spiel ist also a0 + a1 + … + an-1; somit gewinnt Spieler 1 genau dann, n wenn ∑a i gerade ist. Beachtet werden muss, dass wir hier immer die Kurzform i =0 der Kettenbruchdarstellung mit an ≠ 1 benutzen. 23 Für genauere Ausführungen zum Euklidischen Algorithmus empfehle ich vor diesem Unterkapitel Kapitel 5.1 zu lesen. 80 n Die Spiellänge beträgt L ′(a, b) = ∑ a i − 1 . (Eins wird subtrahiert, da der Zug von i=0 (n, n) zu (0, 0) nicht mehr stattfindet. Er ist allerdings im Kettenbruch mit dabei.) Gewinnstrategie basierend auf Kettenbrüchen Wir können auch die Gewinnstrategie für das Originalspiel in Form von Teilquotienten ai von Wenn b , a < b, beschreiben. a b = [a 0 , a 1 , a 2 ,..., a n , a n +1 ] = [1,1,1,...,1,1] ist, das heißt ai = 1 für jedes i = 0, a 1,…, n + 1, dann wechseln wir zur Kurzform [a 0 , a 1 , a 2 ,..., a n −1 ,2] mit ai = 1, i = 0, 1,…, n - 1. (Das passiert übrigens nur, wenn man zwei aufeinander folgende Fibonacci-Zahlen durcheinander dividiert!) Auf diese Weise können wir garantieren, dass mindestens einer der Teilquotienten von 1 verschieden ist. Die Spieler werden eindeutig gezwungen die kleinere von der größeren Zahl abzuziehen, solange ai = 1, i = 0, 1,…, k - 1. Wenn der nächste Teilquotient ak ≠ 1 ist, dann sagen wir, dass ak die erste von 1 verschiedene Stelle ist. Für jede Position (a, b) mit a < b und b = [a 0 , a 1 ,..., a n ] a kann der aktuelle Zug, bei dem man λ ⋅ a von b abzieht, festgelegt werden mit dem positiven ganzzahligen Multiplikator λ . Die entstehende Position kann mit dem Bruch [a 1 , a 2 ,..., a n ] beschrieben werden, wenn λ = a 0 ist, oder mit [a 0 − λ, a 1 ,..., a n ] , wenn λ < a 0 ist. Jeder Zug betrifft eindeutig nur die erste Kettenbruchstelle. 81 Satz von Richard E. Schwarz: Sei [a 0 , a 1 ,..., a n ] mit an ≥ 2 die Kettenbruchentwicklung von b für die a Startposition (a, b) mit a < b. Spieler 1 hat genau dann eine Gewinnstrategie, wenn der erste Teilquotient ai, der von 1 verschieden ist, an einer Stelle mit einem geraden Index auftaucht. Mit anderen Worten: Der erste Spieler, der einen nicht-erzwungenen Zug machen kann, hat eine Gewinnstrategie. Dieser Satz ist die explizite Darlegung von Spitznagel, der bemerkte, dass der Gegner von jemandem, der der Gewinnstrategie folgt, wahrscheinlich bemerkt, dass seine Züge bei jedem Mal, wenn er am Zug ist, auferzwungen sind. Und von dieser Beobachtung aus müsste es ihm möglich sein, festzustellen, was die Strategie sein muss. Ich möchte nochmals betonen, dass durch die Kurzform des Kettenbruchs mit an ≠ 1 garantiert ist, dass es eine von 1 verschiedene Stelle gibt. Wir benutzen im Folgenden die Schreibweise e k +1 = [a k +1 , a k + 2 ,..., a n ] . Beweis: (In diesem Beweis beziehen wir uns häufig auf den Satz von Cole und Davie und dessen Beweis.) Wenn ak ≥ 2 ist, dann gewinnt der Spieler, der bei dem Verhältnis b′ = [a k ,..., a n ] a′ am Zug ist. Das bedeutet, wenn ein Spieler einmal einen Teilnenner verschieden von 1 antrifft, kann er gewinnen und der andere Spieler wird in jedem folgenden Schritt eine 1 antreffen (ansonsten wäre ja eine Umkehrung der Strategie möglich). Nehmen wir an, wir hätten schon alle führenden Einsen von der Entwicklung entfernt und es ist k < n. 82 Wir werden sehen, Kettenbruchentwicklung dass folgt das optimale durch Spiel Verarbeitung geschlossen und der Entfernung aufeinanderfolgender Stellen. Man braucht einen oder zwei Züge (einen für jeden Spieler), um die aktuelle Kettenbruchstelle zu entfernen. Wir müssen zwei Fälle unterscheiden: (i) Wenn e k +1 < Φ , dann kann der (ziehende) Spieler a k ⋅ a ′ von b ′ wegnehmen und y = e k +1 für den nachziehenden Spieler übriglassen, mit 1 < 1 < e k +1 < Φ . Beachten Sie, dass a k +1 = 1 folgt. Wenn nämlich Φ 1 < e k +1 < Φ , kann der Ganzteil von e k +1 , den a k +1 = 1 darstellt, nichts anderes als 1 sein. In diesem Fall gibt es einen einzigen Zug, der benutzt wird, um a k aus der Kettenbruchdarstellung zu entfernen, um dann zur Position (a ′′, b ′′) zu gelangen mit dem Verhältnis [a k +1 , a k + 2 ,..., a n ] = [1, a k + 2 ,..., a n ] . (ii) Im 2. Fall ist e k +1 > Φ und der Spieler nimmt nur (a k − 1) ⋅ a ′ von b ′ und lässt somit [1, a k +1 , a k + 2 ,..., a n ] dem anderen Spieler. Wieder einmal haben wir y < Φ für 1 1 1 < 1 < y = 1+ < 1 + = Φ . Das Φ e k +1 Φ Paar (a ′′, b ′′) , das für den anderen Spieler hinterlassen wurde, hat das Verhältnis y = b ′′ < Φ . Mit y hat der nachziehende Spieler eine a ′′ Kettenbruchentwicklung, die mit 1 anfängt. Somit ist für ihn der einzige mögliche Zug, a ′′ von b ′′ zu nehmen. In diesem Fall benötigt man zwei Züge um a k aus der Kettenbruchdarstellung zu entfernen. In jedem Fall bekommen wir, nachdem der Zug des anderen Spielers beendet ist, b ′′ − a ′′ b ′′ 1 = − 1 < Φ − 1 = . Wir setzten b ′′′ = a ′′ und a ′′′ = b ′′ − a ′′ , vertauschen a ′′ a ′′ Φ Zähler und Nenner und bekommen das daraus resultierende Verhältnis 83 b ′′′ > Φ. a ′′′ Mit d als dem Ganzteil des Verhältnisses, der größer oder gleich 1 ist, können wir b ′′′ 1 = d + > Φ schreiben. Tatsächlich ist d = a k + 2 und z = [a k +3 , a k + 4 ,..., a n ] , a ′′′ z wenn wir (i) folgen, während d = a k +1 ist und z = [a k + 2 , a k + 3 ,..., a n ] , wenn wir Fall (ii) benutzen. Der Fall d ≥ 2 kann reduziert werden auf den Fall, dass a k ≥ 2 ist. Wenn d = 1 ist, dann ist 1 1 > Φ − 1 = , das heißt z < Φ , und wir verfahren genau z Φ wie in (i), wobei hier z die Rolle von e k +1 spielt. Wir können das fortsetzen bis k zu n wird, wenn der Spieler das (an - 1)-fache der kleineren Zahl von der größeren nehmen kann und gleiche Zahlen dem anderen Spieler hinterlässt, der keinen Zug mehr machen kann. □ Fazit: Wir wenden also wiederholt die einfache Tatsache an, dass 1 + 1 >Φ z genau dann ist, wenn z < Φ ist. Der Spieler mit der Gewinnstrategie kann also keinen Fehler machen, wenn er gewinnen will. Zusammenfassend kann man sagen, dass er immer y = [1, u 0 , u 1 ,..., u m ] mit u = [u 0 , u 1 ,..., u m ] > Φ für den anderen Spieler hinterlassen muss. Dabei ist y < Φ und diese Tatsache zwingt den nachziehenden Spieler, die in der aktuellen Position kleinere Zahl von der größeren abzuziehen. Der Reihe nach wird der Spieler, der die Gewinnstrategie hat, einer Position mit einem „sicheren Bruch“ mit u > Φ gegenüberstehen, das heißt einer Position außerhalb L. Bemerkung: Der Satz von Cole und Davie und der Satz von Richard E. Schwarz geben beide eine notwendige und hinreichende Bedingung für eine Gewinnstrategie von Spieler 1. Damit geben diese also äquivalente Bedingungen wieder. 84 Auf diese Weise erhalten wir, dass die Bedingung, dass x = [a0, a1, a2,…, an] größer als Φ ist, gleichwertig ist zu der Lokalisation der ersten Kettenbruchstelle ai, die von 1 verschieden ist, an einem geradzahligen Index i. Dies stimmt mit der Tatsache überein, dass Φ = [1] ist und die Konvergenten abwechselnd über oder unter dem exakten Wert liegen. (Jeder endliche Bruch ∉ Z hat nämlich irgendwo ai ungleich 1. Hier bezeichnet Z die Menge der ganzen Zahlen.) 5.3.3. Wie oft hat Spieler 1 eine Gewinnstrategie? Das Spiel Euklid bevorzugt Spieler 1. Tatsächlich hat Spieler 1 mehr als 60% Gewinnchance. Genau genommen beträgt die Gewinnchance 1 für Spieler 1. Φ Beweis: Wir haben (in unserer geometrischen Betrachtung) drei Bereiche: W’ L = {(x, y) | x, y > 0, L 1 y < < Φ} , Φ x W ′ = {(x, y) | x, y > 0, W W = {(x, y) | x, y > 0, y ≥ Φ} und x y 1 ≤ }. x Φ Wir wissen, dass Spieler 1 eine Gewinnstrategie hat, wenn (a, b) ∈ (W ∪ W ′) . Wir betrachten zunächst alle möglichen Paare (a, b) ∈ Ν 2 mit a, b ≤ N . Dann ist die Wahrscheinlichkeit (im Sinne eines Laplace-Experimentes), dass Spieler 1 bei der Ausgangssituation (a, b) gewinnt: ξ= Anzahl der für Spieler 1 günstigen Positionen Anzahl aller Positionen 85 2 #{(a, b) ∈ Ν 2 : 1 ≤ a, b ≤ N, b ≤ = N2 1 a} Φ . In diesem Ausdruck ist # {(a, b) ∈ Ν 2 : 1 ≤ a, b ≤ N, b ≤ 1 a} die Anzahl der Φ Positionen in W mit Koordinaten ≤ N . Da W ′ eine gleich große Anzahl an Positionen wie W enthält, multiplizieren wir mit 2. Die Anzahl aller Positionen ist gleich der Anzahl der Positionen in (W ∪ W ′ ∪ L) geschnitten mit (0,N]2, also (0,N]2, und diese ist offensichtlich N2. Es gilt # {(a, b) ∈ Ν 2 : 1 ≤ a, b ≤ N, b ≤ N =∑ N N ∑1 = ∑ a =1 b =1 1 b≤ a Φ a =1 1 a} Φ ∑1 1 1≤ b ≤ a Φ N 1 N 1 = ∑ a ≈ ∑ a a =1 Φ a =1 Φ = 1 N 1 1 N ⋅ (N + 1) a= ∑ Φ a =1 Φ2 = 1 (N 2 + N ) . 2Φ Somit ist die Wahrscheinlichkeit, dass Spieler 1 gewinnt: 1 2⋅ (N 2 + N) 1 (N 2 + N) 1 2Φ = Φ ξ= N → . →∞ 2 2 Φ N N □ 5.3.4. Die Länge des Spiels Wenn man optimales Spiel beider Spieler annimmt, so sind dem Spiel im Bezug auf die Länge enge Grenzen gesetzt. 86 Satz 1: Sei [a 0 , a 1 ,..., a n ] mit an ≥ 2 die Kettenbruchentwicklung von b für die a Startposition (a, b) mit a < b. Für die Anzahl der Spielschritte L(a, b) bekommen wir n + 1 ≤ L(a, b) = n + 1 + ∑1 ≤ 2n + 1. a k ≥2 [a k +1,...,a n ]> Φ Die untere Grenze wird genau dann erreicht, wenn die Teilnenner gleich 1 sind an allen geraden oder an allen ungeraden Positionen. Die obere Grenze wird genau dann erreicht, wenn alle Teilnenner mindestens den Wert 2 haben. Man beachte auch hier, dass die Kurzschreibweise des Kettenbruchs benutzt wird. Zum Beispiel hat die Position (5, 13) das Verhältnis 13 = [2, 1, 1, 2] . Also wird 5 die untere Grenze nicht erreicht laut Satz 1. ∑1 = 3 + 1 + 1 = 5 . Tatsächlich ist L(5,13) = n + 1 + a k ≥2 [a k +1,...,a n ]> Φ Dies ergibt die Zugfolge bei beiderseits optimalem Spiel: (5,13) (5, 8) (5, 3) (2, 3) (2, 1) (1, 1). Also haben wir 5 Spielschritte. Spieler 1 gewinnt, wie wir schon vorher wussten, da 13 > Φ einerseits beziehungsweise die 0-te 5 Kettenbruchstelle (also eine gerade) ungleich 1 ist. Die lange Kettenbruchschreibweise 13 = [2, 1, 1, 1, 1] genügt nicht dem Satz. 5 Beweis: Der Beweis basiert auf dem Beweis des Satzes von Richard E. Schwarz. Die untere Grenze erreicht man, wenn es nur einfache Züge gibt, das heißt es wird entweder eine 1 aus der Kettenbruchentwicklung weggenommen oder (i) wird benutzt. 87 Im zweiten Fall muss, wenn für einige k und m > k gilt, dass ak ≠ 1, ak+1 =…= am-1 = 1 und am ≠ 1 ist, m – k gerade sein, um zu garantieren, dass ek+1 < Φ ist wegen der Bemerkung zu dem Satz von Richard E. Schwarz. Die Gleichung für L(a, b) folgt aus der Beobachtung, dass ein extra Zug gemacht wird, wenn ein Spieler (ii) anwendet, das heißt wenn die Bedingungen ak ≥ 2 und ek+1 > Φ erfüllt sind. Um die obere Grenze zu erreichen, reicht die Bedingung ak ≥ 2 für k = 0, 1, …, n aus. In diesem Fall sind das Spiel Euklid und der Euklidische Algorithmus sich sehr ähnlich im folgenden Sinn: An jeder Posititon (a, b) nimmt Spieler 1 (q – 1)mal (eher als q mal) a von b weg, wenn b = q . a + r, q ≥ 2, 0 ≤ r < a. Wenn r = 0 ist, dann ist das Spiel aus. Anderenfalls hat der andere Spieler keine andere Möglichkeit als a von b - (q - 1).a abzuziehen für a < b – (q – 1)a < 2a. Wenn das ursprüngliche Verhältnis b = [a 0 , a 1 ,..., a n ] ist, dann wird Spieler 1 bei a jedem Zug a0 - 1, a1 - 1,… mal die in der aktuellen Position kleinere Zahl von der größeren abziehen, während Spieler 2 immer die kleinere von der größeren Zahl subtrahiert (und aufhört, wenn die beiden Zahlen gleich sind). Man beachte, dass Spieler 1 eine Gewinnstrategie hat, wenn die obere Grenze erreicht wird. □ Beispiel: Zur Illustration möchte ich nochmals die in Figur 4 vorgestellten Beispiele auf die Länge hin untersuchen. 88 Das Spiel (9, 2) hat die Länge 3 für 9 9 = [4,2] , besser noch = [4 + ,2] . (Das 2 2 tiefgestellte Pluszeichen hinter einem Teilnenner bedeutet, dass zwei Züge gebraucht werden, um diesen Teilnenner abzuräumen.) Mit der Formel ergibt sich für n = 1: ∑1 = 1 + 1 + 1 = 3 ≤ 2 + 1 = 3. 2 = 1 + 1 ≤ L(9,2) = 1 + 1 + a k ≥2 [a k +1,...,a n ]> Φ Das Spiel (11, 8) hat die Länge 4 für 11 = [1,2,1,2] . 8 Mit der Formel ergibt sich für n = 3: 4 = 3 + 1 ≤ L(11,8) = 3 + 1 + ∑1 = 3 + 1 + 0 = 4 ≤ 6 + 1 = 7. a k ≥2 [a k +1,...,a n ]> Φ Bemerkungen: 1. Beim Spiel (9, 2) sind alle Teilnenner mindestens 2, daher wird die obere Grenze in der Formel aus Satz 1 erreicht. Man könnte also auch gleich nach Betrachtung des Kettenbruchs die Länge des Spiels als 2n + 1 ausrechnen. 2. Beim Spiel (11, 8) haben wir an allen geraden Stellen Einsen. Hier wird die untere Grenze der Formel in Satz 1 erreicht. Auch hier könnte man die Länge des Spiels sofort bei Betrachtung des Kettenbruchs als n + 1 ausrechnen. (Weitere Informationen zum Spiel Euklid findet man in dem Artikel „A nim-type game and continued fractions“ von Tamás Lengyel.) 89 5.3.5. Das Spiel Euklid und der Calkin-Wilf-Baum Wie wir oben gesehen haben, ist der Spiel-Baum unzureichend zur Beschreibung des Spiels Euklid. Der Calkin-Wilf-Baum24 hingegen ist der richtige Baum, um die Zugmöglichkeiten des Spiels Euklid zu beschreiben. Neil Calkin and Herbert Wilf fanden im Calkin-Wilf-Baum eine Abzählung der rationalen Zahlen, wobei kein Bruch doppelt vorkommt. Die Brüche werden in der Calkin-und-Wilf-Folge durch Iteration erzeugt und in einem Baum aufgezählt. Dabei gilt folgende Regel. Der Baum startet mit dem Bruch 1 i . Jeder Knoten hat zwei Kinder, das linke Kind hat die Form , das 1 i+ j rechte Kind i+ j . Diese Iteration wird unendlich fortgesetzt für jeden so j entstehenden Knoten. Der Anfang des Baums ist hier gezeigt: 1/1 1/2 2/1 3/2 1/3 1/4 24 4/3 3/5 2/3 5/2 2/5 3/1 5/3 3/4 Calkin, N. / Wilf, H. S.: „Recounting the rationals“. American Methematical Monthly 107 (2000). S. 360-363 90 4/1 Wir betrachten die Brüche als Verhältnisse der beiden Zahlen a und b in der Ausgangssituation (a, b). Man sieht hier leicht, dass sich alle möglichen Nachfolgepositionen einer bestimmten Positon (a, b) auf dem direkten Pfad von der Position (a, b) zu der Wurzel befinden. Ein Pfad ausgehend von der Position (4, 1) geht über (3, 1), (2, 1) zur Wurzel (1, 1). In diesem Beispiel wird auch schnell die Einschränkung „mögliche“ Nachfolgepositionen deutlich. Jeder Spieler, der dem Verhältnis (4, 1) gegenübersteht wird gleich zu (1, 1) ziehen. Es muss somit nicht jede mögliche Nachfolgeposition auch angenommen werden. Ein anderes Beispiel ist die Position (5, 3). Von dort geht der einzige Zug zum darüberstehenden Knoten (3, 2), und von (3, 2) zieht man zu (1, 2) und von dort zu (1, 1). Hier wird jede mögliche Nachfolgeposition angenommen. 91 6. Anhang 6.1. Literaturverzeichnis Appell, Kristina: Skript zur Vorlesung „Aufbau des Zahlensystems“ im WS 2005/06 Becker, Michael: Fibonacci-Zahlen. http://www.ijon.de/mathe/fibonacci/index.html (Stand: 20.10.2006) Bewersdorff, Jörg: Analyse von (Bei-)Spielen. http://www.galoistheorie.de/pdf/bei-spiele.pdf (Stand: 10.09.2006) Bewersdorff, Jörg: Die Mathematik der Gesellschaftsspiele. http://www.galois-theorie.de/pdf/ruedlingen.pdf (Stand: 10.09.2006) Bewersdorff, Jörg: „Glück, Logik und Bluff: Mathematik im Spiel Methoden, Ergebnisse und Grenzen“. Vieweg. Braunschweig/Wiesbaden. 1998 Bewersdorff, Jörg: Go und Mathematik. http://www.bewersdorffonline.de/go/ (Stand: 10.09.2006) Bewersdorff, Jörg: Spiele aus mathematischer Sicht. http://www.galoistheorie.de/pdf/mt2000.pdf (Stand: 10.09.2006) Bronstein, I. N. / Mühlig, H. / Musiol, G. / Semendjajew, K.A.: „Taschenbuch der Mathematik“. Verlag Harri Deutsch. Thun/Frankfurt am Main. 2001 Burton, M. David / Dalkowski, Heinz: „Handbuch der elementaren Zahlentheorie“. Heldermann Verlag. Lemgo. 2005 Calkin, N. / Wilf, H. S.: „Recounting the rationals“. American Methematical Monthly 107 (2000). S. 360-363 Cole, A. J. / Davie A. J. T.: „A game based on the Euclidean algorithm and a winning strategy for it“. The Mathematical Gazette 53 (1969). S. 354 - 357 Conway, John H.: „On numbers and games“. Academic Press. London. 1976 92 Dobrowolski, Manfred: Kombinatorische Spieltheorie. http://www.mathematik.uni-wuerzburg.de/~dobro/sam/samc/c2.pdf (Stand: 22.07.2006) Friedrich, Judith / Rosentritt, Daniel / Sterz, Ludwig: Ausarbeitung zur Anwendung von Bäumen im Proseminar Graphentheorie SS 2006. http://www.mathematik.uni-wuerzburg.de/~steuding/graph.htm (Stand: 05.09.2006) Klosa, Annette / Scholze-Stubenrecht, Werner / Wermke, Matthias (Hrsg.): „Duden: Etymologie“. Dudenverlag. Mannheim/Leipzig/Wien/ Zürich. 1997 (Der Duden; Band 7) Lengyel, Tamás: A nim-type game and continued fractions. http://employees.oxy.edu/lengyel/papers/FQCf2344.pdf (Stand: 20.09.2006) Schlee, Walter: „Einführung in die Spieltheorie“. Vieweg. Braunschweig/ Wiesbaden. 2004 Singmaster, David: Queries on oriental sources in recreational mathematics. http://www.eldar.org/~problemi/singmast/chinarec.html (Stand: 10.08.2006) Thelen, Tobias: Geschichte der Spieltheorie. http://www.ikw.uniosnabrueck.de/~nntthele/ipd/spiel2.html (Stand: 04.08.06) Waldmann, Johannes: Kombinatorische Spieltheorie. http://www.imn.htwkleipzig.de/~waldmann/edu/ancient/ws01/kst/kst-pub.pdf (Stand: 10.09.2006) Weisstein, Eric: Continued Fraction. http://mathworld.wolfram.com/ContinuedFraction.html (Stand: 17.09.2006) http://www.wikiludia.de (Stand: 03.09.2006) http://www.wikipedia.de (Stand: 14.07.2006) 93 7. Danksagungen Mein Dank gilt vor allem Herrn Prof. Dr. Steuding, der immer ein offenes Ohr für meine Fragen hatte und mich mit Literatur unterstütze. 94 8. Erklärung Hiermit versichere ich, dass ich diese Arbeit in allen Teilen selbständig gefertigt und keine anderen als die in der Arbeit angegebenen Hilfsmittel benutzt habe. Die Zeichnungen und bildlichen Darstellungen habe ich selbst gefertigt. __________________________________________________________________ Würzburg, den Stefanie Hofmann 95 Der Mensch spielt nur, wo er in voller Bedeutung des Wortes Mensch ist, und er ist nur da ganz Mensch, wo er spielt. Friedrich Schiller 96