Spiele in extensiver Form Vorlesung: Nicht-kooperative Spieltheorie Teil 5: Spiele in extensiver Form Dr. Thomas Krieger Wintertrimester 2009 und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 1 Spiele in extensiver Form Das Steuer-Spiel nach Selten (1) Informelle Beschreibung der Konfliktsituation: Finanzamt (Spieler 1) steht einem Steuerpflichtigen (Spieler 2) gegenüber. Steuerpflichtiger ist möglicherweise unehrlich und kann eine Steuerhinterziehung von 10 Geldeinheiten erwägen. Das Finanzamt weiss, dass im Mittel 20% aller Steuerpflichtigen Steuern in Höhe von 10 Geldeinheiten hinterziehen, falls die Situation dafür günstig ist (potentieller Betrüger). Das Finanzamt kann zunächst eine oberflächliche Überprüfung (K) durchführen, an die eine gründlichere (N) angeschlossen wird, falls sich Anhaltspunkte für einen Steuerbetrug ergeben haben. Die oberflächliche Überprüfung belastet das Finanzamt mit Kosten in Höhe von 1 und die gründlichere mit zusätzlichen Kosten in Höhe von 4. Falls tatsächlich Steuern hinterzogen werden, wird bei einer oberflächlichen Überprüfung immer ein Anzeichen des Steuerbetruges entdeckt und eine eventuelle anschließende gründliche Untersuchung deckt den Betrug immer auf. Im Falle der Aufdeckung muß das Zweieinhalbfache des hinterzogenen Betrages, also 25, vom Steuerpflichtigen an das Finanzamt entrichtet werden. Anzeichen für einen Steuerbetrug können sich bei der oberflächlichen Überprüfung mit Wahrscheinlichkeit 0.25 auch dann ergeben, wenn keine Steuern hinterzogen werden. Jedoch stellt die genaue Nachprüfung dann klar, daß keine Steuerhinterziehung vorliegt. Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 2 Spiele in extensiver Form Das Steuer-Spiel nach Selten (2) ¼ ¾ ¼ ¼ ½ ½ Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 3 Spiele in extensiver Form Das Steuer-Spiel nach Selten (3) Erläuterungen zur letzten Folie: Finanzamt ist Spieler 1 Steuerpflichtiger ist Spieler 2 Zufallszug ist Spieler 0 B: Betrugsversuch des Steuerpflichtigen B̄: Kein Betrugsversuch des Steuerpflichtigen K : Oberflächliche Überprüfung des Finanzamtes K̄ : Keine Überprüfung des Finanzamtes N: Genaue Nachprüfung durch das Finanzamt N̄: Keine Nachprüfung durch das Finanzamt und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 4 Spiele in extensiver Form Vorbereitung (1) Ein gerichteter Graph besteht aus einer – hier stets endlichen – Menge K von Knoten und einer Menge E ⊂ K × K von Kanten (u, v ) vom Knoten u zum Knoten v . Ein Pfad von u nach v ist eine Folge u0 , u1 , . . . , un von Knoten, n ≥ 0, so daß (ui , ui+1 ) Kante des Graphen ist, i = 0, . . . , n − 1, mit u0 = u, un = v . Ein Baum ist ein gerichteter Graph mit einem ausgezeichneten Knoten, Wurzel genannt, so daß gilt (siehe z.B. Knuth 1968): (i) Zu der Wurzel geht keine, zu jedem anderen Knoten genau eine Kante, und (ii) von der Wurzel gibt es zu jedem Knoten einen Pfad. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 5 Spiele in extensiver Form Vorbereitung (2) Für eine Kante (u, v ) des Baumes heißt u Vater von v und v Sohn von u. Für einen Pfad von u nach v heißt v Nachfahr von u (auch für u = v ). Ein Knoten ohne Söhne heißt Blatt, sonst innerer Knoten. Der Baum heißt geordnet, wenn unter Brüdern, d.h. den Söhnen jedes inneren Knotens, stets eine Reihenfolge / " festgelegt ist,z.B. von links nach rechts bei der graphischen (Darstellung. / $ heißt % a(x ) " ( Dabei Anzahl derSöhne von x und G % ( D $" 1 / , l) l-ter Sohn x , l ∈ { 1, . . . , a(x ) }. (S(x % von ! 7 6 * " 8 ' " ( $ D ! $ D )" Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 6 Spiele in extensiver Form Definition extensives Spiel (1) Definition 28 Ein n-Personen-Spiel in extensiver Form ist ein 5-Tupel (K , h, P, w , U) mit den folgenden Komponenten: K ist ein endlicher geordneter Baum; x ∈ K steht für “x ist ein Knoten des Baumes”. Einen inneren Knoten nennen wir Entscheidungspunkt, ein Blatt einen Spielausgang. Die Menge der inneren Knoten sei I, die Menge der Blätter (Endknoten) sei E genannt. h ist eine Funktion, die jedem Spielausgang z ∈ E einen Wert im Rn zuordnet. Die i-te Komponente von h für i ∈ { 1, . . . , n }, heißt die Auszahlung an Spieler i. P ordnet jedem Entscheidungspunkt x ∈ I einen Wert aus 0, 1, . . . , n zu. P(x ) ist der Spieler, der in x am Zug ist, Spieler 0 heißt der Zufall. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 7 Spiele in extensiver Form Definition extensives Spiel (2) Definition 28- Fortführung w bestimmt für jeden Knoten x mit P(x ) = 0 eine Wahrscheinlichkeitsverteilung auf seinen Söhnen. U ist eine Partition der Menge I der Entscheidungspunkte, wobei für jede Klasse A ∈ U gilt: (i) In A ist nur ein Spieler i, bezeichnet mit P(A), am Zug, d.h. P(x ) = i für alle x ∈ A falls P(A) = i. Dann heißt A Informationsbezirk für Spieler i. (ii) Alle Knoten in A haben gleich viele, etwa k Söhne. Die Zahl k der Auswahlen von A heißt a(A). (iii) Für l ∈ { 1, . . . , a(A) } sei Nl (A) := {y ∈ K | y Nachfahr von S(x , l) für ein x ∈ A}. Dann ist jedes B ∈ U mit P(B) = P(A) entweder in der Menge Nl (A) enthalten oder aber zu ihr disjunkt. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 8 Spiele in extensiver Form Reine Strategien Bearbeiten Sie Aufgabe 1 und 2 des Übungsblattes 5. Definition 29 Eine reine Strategie si des Spielers i, i ∈ { 1, . . . , n }, in einem extensiven n-Personenspiel (K , h, P, w , U) ist eine Funktion, die jedem Informationsbezirk A ∈ U des Spielers i (d.h. mit P(A) = i) genau einen Zug, d.h. eine Zahl zwischen 1 und a(A) zuordnet, also si (A) ∈ { 1, . . . a(A) }. Anschaulich kann eine reine Strategie als ein vollständiger Verhaltensplan beschrieben werden, der einem Spieler i genau vorschreibt, was er in jeder überhaupt nur denkbaren Situation zu tun hat. (Wozu braucht man das?) Menge der reinen Strategien im Steuerspiel: SFinanzamt = { K N, K N, K N, KN } und SSteuerpflichtiger = { B, B }. Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 9 Spiele in extensiver Form Erwartete Auszahlung (1) Zu jeder reinen Strategienkombination s = (s1 , . . . , sn ) gehört eine Menge von Endpunkten Z (s), die mit positiver Wahrscheinlichkeit erreicht werden können, falls s gespielt wird. z.B. für s = (KN, B̄) erhalten wir im Steuerspiel die Endpunktmenge Z (s) = { z2 , z4 , z9 , z11 }. Die Wahrscheinlichkeit, mit der jeder der Endpunkte z ∈ Z (s) erreicht wird, falls s gespielt wird, ist nichts anderes als das Produkt aller Wahrscheinlichkeiten von Zufallszügen auf dem Pfad von der Wurzel nach z. Wir bezeichnen diese Wahrscheinlichkeit mit p(z). und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 10 Spiele in extensiver Form Erwartete Auszahlung (2) Auszahlungsbeiträge Endpunkt p(z) z1 z2 z3 z4 z5 z6 z7 z8 z9 z10 z11 0.2 0.15 0.05 0.05 0.2 0.2 0.2 0.8 0.6 0.2 0.2 p(z) · h1 (z) p(z) · h2 (z) 0 −0.15 −0.05 −0.25 −2 −2.2 4 0 −0.6 −0.2 −1 0 0 0 0 2 2 −5 0 0 0 0 Allgemein gilt für jede reine Strategienkombination s (ohne Beweis): X p(z) = 1 . z∈Z (s) und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 11 Spiele in extensiver Form Erwartete Auszahlung (3) Definition 30 Die Erwartungsauszahlung oder kurz Auszahlung Hi (s) des Spielers i für s ist der Erwartungswert von hi (z), falls s gespielt wird. Dies ist die Summe der Beiträge p(z) · hi (z) mit z ∈ Z (s), wobei Z (s) die Menge der Endpunkte ist, die für s erreicht wird, X Hi (s) = p(z) · hi (z) . z∈Z (s) Die Auszahlungsfunktion H ordnet jedem s ∈ S den zugehörigen Auszahlungsvektor H(s) = (H1 (s), . . . , Hn (s)) zu. Achtung: wenn es einen Zufallszug im Spiel G gibt und zusätzlich gemischte Strategien betrachtet werden, findet eine zweifache Erwartungswertbildung für jeden Spieler statt! und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 12 Spiele in extensiver Form Zurück zum Steuer-Spiel (1) Für das Steuerspiel erhalten wir mit Definition 30 Reine Strategien s1 s2 KN B KN B̄ B K N̄ K N̄ B̄ K̄ N B K̄ N B̄ K̄ N̄ B K̄ N̄ B̄ realisierte Endpunktmenge Z (s) z7 , z9 , z11 z2 , z4 , z9 , z11 z6 , z9 , z10 z2 , z3 , z9 , z10 z5 , z8 z1 , z8 z5 , z8 z1 , z8 Erwartungsauszahlung H1 (s) H2 (s) 2.4 −5 −2 0 −3 2 −1 0 −2 2 0 0 −2 2 0 0 und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 13 Spiele in extensiver Form Zurück zum Steuer-Spiel (2) Die reinen Strategienmengen { K N, K N, K N, KN } für das Finanzamt und { B, B } für den Steuerpflichtigen bilden zusammen mit der auf der letzten Folie angegebenen Auszahlungsfunktion H die Normalform G = ({1, 2}, (S1 , S2 ); H) des Steuer-Spiels: # ! > > > > > !, ) ! ! . ! ! # ! 5 5 5 5 ! 5 5 ' !"# Bestimmen Sie alle + Nash-Gleichgewichte des Steuer-Spiels. ( ( ( : ( " * ( J / ( B G D !$ D D " und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 14 Spiele in extensiver Form Verallgemeinerung dieses Vorgehens Die reinen Strategienmengen S1 , . . . , Sn bilden zusammen mit der in Definition 30 angegebenen Auszahlungsfunktion H die Normalform G = (S1 , . . . , Sn ; H) eines extensiven Spieles (K , h, P, w , U). Auch hier können nun gemischte Strategien betrachtet werden und der Satz von Nash garantiert, dass jedes extensive Spiel ein Nash-Gleichgewicht in gemischten Strategien besitzt. Weiteres Strategiekonzept: Eine Verhaltensstrategie bi für Spieler i ordnet jedem Informationsbezirk A mit P(A) = i eine Wahrscheinlichkeitsverteilung auf der Menge {1, . . . , a(A)} der Auswahlen zu. Bei Einsatz von bi wählt i die Alternative l, l ∈ { 1, . . . , a(A) }, mit der Wahrscheinlichkeit bi (A, l). und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 15 Spiele in extensiver Form Teilspiele 1 52 Definition 31 ! *! %!9 0, h 0 , P 0 , 0 in extensiver 12 # # (K ' # )! 9 Ein n-Personen-Spiel w 0,# U Form heißt 12 + ! < Teilspiel eines Spieles (K , h, P, w , U), wenn gilt ¼ ¼ ¼ ¼ ¼ ¼ ¼ ¼ # 4 von & > die (i) K 0 ist Teilbaum K , d.h. K 0 hat als Knotenmenge ,'. > "# ' 0! # ! eines Knotens # & o ∈ ,.# Menge aller Nachfahren K (und damit o 0 ' # als Wurzel) sowiedie entsprechenden und ! + Kanten die gleiche 1 2 K Reihenfolge der Nachfahren; ! 4 5 # ¼ ¼ ¼ ¼ ¼ ¼ ¼ ¼ # " /3 12# ! 9 ! (ii) h0 , P 0 , w 0 sind Einschränkungen von h, P, w auf K 0; ¼ (iii) 1 2# ! ¼ > ¼ > " U 0 ist# genau die Menge der%! in K 0enthaltenen Informationsbezirke aus U. 6 =3 ! > 1 2 1 1 2 1 1 und '( Vorlesung: >Nicht-kooperative 12 Dr. Thomas Krieger Spieltheorie 16 Spiele in extensiver Form Ein Existenzsatz Ein Spiel in extensiver Form ohne Teilspiel ist das Steuer-Spiel. Theorem 32 Jedes extensive Spiel (K , h, P, w , U) mit vollkommener Information, d.h. |A| = 1 für alle A ∈ U, und endlichem Spielbaum K hat einen Gleichgewichtspunkt in reinen Strategien. Der Beweis wird z.B. in Burger (1966) oder Rauhut et al. (1979) geführt. Welche Gesellschaftspiele erfüllen die Forderung nach vollkommener Information? Welche Beziehung besteht zwischen dem Konzept der perfekten Erinnerung (perfect recall) und dem Konzept der vollkommener Information? Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie und 17 Spiele in extensiver Form Teilspielperfekte Gleichgewichte (1) Für extensive Spiele mit vollkommener Information können Nash-Gleichgewichte in reinen Strategien mittels Rückwärtsinduktion gefunden werden, vgl. die beiden Beispiele auf den nächsten beiden Folien: „Hundertfüsslerspiel“ (strenge Forderung an Rationalität): Spieltheorie Jörg Naeve 1 2 1 2 1 ! 1 1 ! 0 3 ! 2 2 ! 1 4 3 3 SoSe 2003 1 ! 2 1 2 97 ! 100 100 ! ! ! ! 98 97 99 98 98 100 99 101 Abbildung 3.11: Extensivform des Hundertfüßerspiels Die mittels Rückwärtsinduktion gefundenen Nash-Gleichge• Im letzten Knoten wird Spielerin 2 Stop“ sagen, weil sie dadurch 101 Euro erhält, ” wichte haben die Eigenschaft, dass deren Einschränkung auf während sie bei Weiter“ lediglich 100 Euro erhielte. jedes Teilspiel” auch ein Nash-Gleichgewicht im betrachteten • In vorletzten Runde antizipiert Spielerin 1, dass Spielerin 2 in der letzten Runde Teilspiel ist (daher: teilspielperfekt). Stop“ sagen wird. Sie bekommt demnach 98 Euro, wenn sie W wählt, aber 99 Euro, ” Dr. Also Thomas Krieger Vorlesung: Spieltheorie wenn sie Stop“ sagt. wählt Spielerin 1 in derNicht-kooperative vorletzten Runde S. und 18 Spiele in extensiver Form Teilspielperfekte Gleichgewichte (2) Berechnen Sie Nash-Gleichgewichte in reinen Strategien des abgebildeten extensiven Spiels durch Rückwärstinduktion und über die Transformation in Normalform. Was fällt Ihnen auf? und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 19 Spiele in extensiver Form Literatur R. Avenhaus: Vorlesungen über Nicht-kooperative Spieltheorie, Vorlesungsskript, Universität der Bundeswehr München, Frühjahr 1999. D. E. Knuth: Fundamental Algorithms. The Art of Computer Programming Vol. I. Addison-Wesley, Reading Mass., 1968. R. Selten: Einführung in die Theorie der Spiele mit unvollständiger Information. Schriften des Vereins für Socialpolitik, Gesellschaft für Wirtschafts- und Sozialwissenschaften. Neue Folge Bd. 126: Information in der Wirtschaft, 1982, S. 81–147. H. W. Kuhn: Extensive games and the problem of information. Annals of Math. Studies 28, 1953, S. 193–216. B. Rauhut, N. Schmitz, E.-W. Zachow: Spieltheorie: Einführung in die mathematische Theorie strategischer Spiele. Teubner-Verlag, Stuttgart, 1979. E. Burger: Einführung in die Theorie der Spiele. de Gruyter, 1966. T. Arnold, J. Naeve, U. Schwalbe: Spieltheorie. Vorlesungsskript, Universität Hohenheim, Sommersemester 2003. und Dr. Thomas Krieger Vorlesung: Nicht-kooperative Spieltheorie 20