Rational Choice Theory Rational Choice and Rationale Entscheidung ist eine Sammelbezeichnung f ür verschiedene Ansätze in den Wirtschafts- und Sozialwissenschaften. Generell schreiben diese Ans ätze handelnden Subjekten rationales Verhalten zu, wobei diese Subjekte aufgrund gewisser Pr äferenzen ein nutzenmaximierendes (oder kostenminimierendes) Verhalten zeigen. Ziel und Methode Historisch orientieren sich die Theorien der Rationalen Entscheidung an der klassischen Ökonomie Adam Smiths und der erklärenden Soziologie Max Webers. Sie versuchen, komplexe soziale Handlungen mit Hilfe möglichst einfacher Modellannahmen zu fassen. Das angestrebte Ziel der Theoretiker liegt darin, soziale Gesetze zu finden, die einfach und klar wie die der Newtonschen Physik sind. Darüber, wie dieses Ziel zu erreichen ist, herrscht Uneinigkeit. Menschenbilder der Rationalen Entscheidung reichen vom klassischen Homo oeconomicus bis zum PREEM (Restricted Rational Expecting Evaluating Maximising Man) der modernen Soziologie. Über den Rationalitätsbegriff des rationalen Entscheiders gibt es ebenso wie über die Gewichtung und Entstehung der Präferenzen keine Einigkeit. Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 1.23 Umstrittene Punkte Während Rationale Entscheidung in den Wirtschaftswissenschaften das dominante Paradigma ist, ist sie in Soziologie und Politikwissenschaft stärker umstritten. Einer der Hauptstreitpunkte ist der verwendete methodologische Individualisimus; es ist in der Debatte, ob sich soziales Verhalten und soziale Gesetze wirklich durch das Verhalten vieler einzelner Individuen bestimmen l ässt, oder ob das soziale eigene Gesetzmäßigkeiten vorweist. Eine schwächere Version dieser Kritik wirft dem Ansatz der Rationalen Entscheidung vor, soziale Probleme strukturell bedingt unterkomplex zu fassen. Zum anderen steht die starke Modellhaftigkeit des Ansatzes in der Kritik: es l ässt sich empirisch einfach beweisen, dass Menschen nur begrenzt rational handeln. Die meisten Theoretiker der Rationalen Entscheidung räumen das ein, machen aber geltend, dass rationale Nutzenmaximierung eine plausible Grundannahme darstellt, von der aus die Modelle bestimmten Situationen angepasst werden können. Trotz den teilweise sehr heftigen Diskussionen ist aber unübersehbar, dass Ansätze, die auf Rationaler Entscheidung basieren, einen immer stärkeren Einfluss sowohl auf die globalen als auch auf die deutschen Sozialwissenschaften haben. Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 1.24 Darstellung eines Spiels in Normalform G n si s s−i Si S S−i ui U ∆(Si) = (n, S, U ) Anzahl der Spieler Strategie von Spieler i, i ∈ {1, . . . , n} Strategietupel: s = (s1, . . . , sn) Strategientupel der Gegenspieler von i, s−i = (s1, . . . , si−1 , si+1, . . . , sn) Wir schreiben: s = (si, s−i ) Strategieraum (Menge der möglichen Strategien) für Spieler i = S1 × . . . × S n , s ∈ S = S1 × . . . × Si−1 × Si+1 × Sn, s−i ∈ S−i Nutzenfunktion von Spieler i ui : S → IR = (u1, . . . , un) = Menge der gemischten Strategien des Spielers i Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 1.18 2. Nash Equilibria Situation: n Spieler 1, . . . , n spielen ein (einzügiges) Spiel. Si 1 ≤ i ≤ n ist die Menge der Strategien (= Aktionen) von Spieler i. ui : S1 × . . . × Sn → IR ist die Nutzenfunktion für Spieler i. Das Spiel kann dann beschrieben werden durch G = (n, S1, . . . Sn, u1, . . . , un). Definition 2.1: Es sei G = (n, S1, . . . , Sn, u1, . . . , un) ein Spiel. Ein n-Tupel (s1, . . . , sn) ∈ S1 × . . . × Sn ist im Nash Equilibrium, falls für alle i ∈ {1, . . . , n} gilt: 0 0 ∀si ∈ Si : ui(s1, . . . , si−1 , si, si+1, . . . , sn) ≥ ui(s1, . . . , si−1 , si, si+1 , . . . , sn) Im Nash Equilibrium will kein Spieler seine Strategie ändern, solange die anderen Spieler bei ihrer gewählten Strategie bleiben ⇒ stabiler Zustand Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.1 Beispiele: (Bi-)Matrixspiele Bach-Stravinsky Mozart-Mahler s21 2,1 0,0 s21 2,2 0,0 s11 s12 s21 0,0 1,2 s11 s12 2 Nash-Equilibria Gefangenendilemma s21 0,0 1,1 Minderwertiges Nash-Equilibrium L G L 1,1 0,5 G 5,0 4,4 eindeutiges Nash-Equilibrium Münzseiten K Z K 1,-1 -1,1 Z -1,1 1,-1 kein Nash-Equilibrium Stein-Schere-Papier St Sch P Monien/Bleischwitz Universität Paderborn St 0,0 -1,1 1,-1 Sch 1,-1 0,0 -1,1 P -1,1 1,-1 0,0 Algorithmische Spieltheorie kein Nash-Equilibrium 2.2 Gemischte Strategien Die Menge der gemischten Strategien für einen Spieler mit zwei reinen Strategien ist 2 2 S := {π ∈ IR | π1 + π2 = 1, πi ≥ 0} Die Menge der gemischten Strategien für einen Spieler mit drei reinen Strategien ist 3 3 S := {π ∈ IR | π1 + π2 + π3 = 1, πi ≥ 0} x3 y2 X Y x1 y1 x2 2 S ist Strecke von (1, 0) nach (0, 1). S 3 ist Fläche zwischen (0, 0, 1), (0, 1, 0), (1, 0, 0) Der (n − 1)-dimensionale (Standard-) Simplex S n ist definiert als n n T S n := {x ∈ IRn | x = 1, x ≥ 0} = {x ∈ I R | 1 1 x = 1, xi ≥ 0}. i i i=1 Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.3 Gemischte Nash Equilibria • Für einen Spieler i sei Si := {si1 , . . . , sik } • Dann definiert πi = (πi1 , . . . , πik ) ∈ S k eine gemischte Strategie für Spieler i, in der er die Strategie sij mit Wahrscheinlichkeit πij wählt. • Der erwartete Nutzen von Spieler i, wenn die gemischten Strategien aller Spieler durch (π1, . . . , πn) definiert sind, ist dann: n ui (Π1, . . . , Πn) = Πk (sk ) (s1 ,...,sn )∈S1 ×...×Sn ui(s1, . . . , sn) k=1 Definition 2.2: Es sei G = (n, S1, . . . , Sn, u1, . . . , un) ein Spiel. Ein n-Tupel (Π1, . . . , Πn) ist im gemischten Nash-Equilibrium, falls für alle i ∈ {1, . . . , n} gilt: 0 0 ∀Πi ∈ ∆(Si) : ui(Π1, . . . , Πi−1 , Πi, Πi+1 , . . . , Πn) ≥ ui(Π1, . . . , Πi−1 , Πi , Πi+1, . . . , Πn) Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.4 Beispiel Gemischtes Nash Equilibrium A= 2 3 1 0 , B= S2 = {s21, s22} S1 = {s11, s12}, 4 1 0 4 (π1, π2) mit • π1 = (3/7, 4/7) und • π2 = (1/2, 1/2) ist ein gemischtes Nash Equilibrium. Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.5 2.1 Existenz von Nash Equilibria Satz 2.1: (J. Nash, 1951) Es existiert immer ein gemischtes Nash-Equilibrium. Sperner’s Lemma Brouwer’s Fixpunksatz Kakutani’s Fixpunktsatz Nash’s Theorem Brouwer’s Fixpunktsatz: Es sei f : S n → S n eine stetige Funktion. Dann existiert ein Punkt x∗ ∈ S n mit f (x∗) = x∗, ein sogenannter Fixpunkt. Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.6 2.2 Aufwand zur Bestimmung von Nash-Equilibrien Der Satz von Nash garantiert die Existenz eines gemischten Nash-Equilibriums. Aber: Betrachte das folgende Problem: MIXED-2-NE: geg.: Ein Spiel G = (2, S1, S2, u1, u2), S1, S2 endlich. ges.: Ein gemischtes Nash-Equilibrium (Π1(S1), Π2(S2)) für G . Es ist bis heute offen, ob MIXED-2-NE in P ist. MIXED-2-NE is PPAD-vollständig (Chen, Deng: Settling the Complexity of 2-Player NashEquilibrium. Electronic Colloquium on Computational Complexity, 2005). Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.7 2.3 2-Personen Matrix Spiele 2-Personen Matrix Spiele sind Spiele der Form G = (2, (S1, S2), (u1, u2)) mit • S1 = {s11, . . . , s1m }, S2 = {s21, . . . , s2n}. • u1, u2 sind gegeben als Matrizen A ∈ ZZ m×n und B ∈ ZZ m×n , mit u1(s1i , s2j ) = Ai,j und u2(s2i , s2j ) = Bi,j , für 1 ≤ i ≤ m, 1 ≤ j ≤ n. • Jeder Spieler maximiert seinen Nutzen. Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.8 Bemerkung 2.1: Es sei x ∈ X = ∆(S1) eine gemischte Strategie für Spieler 1, y ∈ Y = ∆(S2) eine gemischte Strategie für Spieler 2. Dann ist der erwartete Nutzen u1(x, y) = xT Ay und u2(x, y) = xT By. Definition 2.3: a) Es sei y ∈ Y fest. x ∈ X heißt beste Antwort auf y ⇔ xT (Ay) ist maximal über X . b) Es sei x ∈ X fest. y ∈ Y heißt beste Antwort auf x ⇔ (xT B)y ist maximal über Y . Bemerkung 2.2: a) Eine beste Antwort x (y ) ist eine gemischte Strategie mit dem größten erwarteten Nutzen für Spieler 1 (2), wenn Spieler 2 (1) die gemischte Strategie y (x) spielt. b) Ein Nash Equilibrium (x, y) ist dann ein Paar von wechselseitig besten Antworten x und y . Satz 2.2: Es sei y eine gemischte Strategie von Spieler 2. Eine gemischte Strategie x ist beste Antwort auf y genau dann, wenn Spieler 1 nur reine Strategien si mit positiver Wahrscheinlichkeit spielt, die beste Antworten sind. Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.9 Beispiele: (Bi-)Matrixspiele B= 1 0 4 0 2 3 , 6 5 3 S2 = {4, 5} 0 2 3 A= S1 = {1, 2, 3}, 1 2 3 4 0,1 2,0 3,4 5 6,0 5,2 3,3 G hat reines Nash-Equilibrium (3, 4) (Spaltenmaximum in A und Zeilenmaximum in B ) s1 1 1 2 2 3 s2 4 5 4 5 4 3 5 Bemerkung Spieler 1 → 3 Spieler 2 → 4 Spieler 1 → 3 Spieler 1 → 1 Nash Equilibrium mit Nutzen u1 (3, 4) = A3,1 = 3, u2 (3, 4) = B3,1 = 4 Spieler 1 → 1 Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.10 Nash Equilibria i=1 xi = 1 , Monien/Bleischwitz Universität Paderborn 1 2 2 = {s1 , . . . , sm } , S2 = {s1 , . . . , sn } x = (x1 , . . . , xm ) , xi ∈ [0, 1] y = (y1 , . . . , yn ) , yi ∈ [0, 1] m 1 S1 n i=1 yi = 1 T1 = {i ∈ {1, . . . , m} ; xi > 0} T2 = {j ∈ {1, . . . , n} ; yj > 0} Algorithmische Spieltheorie 2.11 Linear Complementary Problem (LCP) (x, y) ist NE ⇔ ∃ α, β ∈ IR mit (x, y) ist NE ⇔ ∃ α, β ∈ IR mit x ∈ S m, y ∈ S n x, y ≥ 0 11 x T = 1 11 y T = 1 Ay ≤ 11 α B x ≤ 11 β x (11 α − A y) = 0 T = 0 n Aij yj = α ∀ i ∈ T1 j=1 n Aij yj ≤ α ∀i ∈ {1, . . . , m} j=1 T m Bij xi = β T ∀ j ∈ T2 i=1 T y (11 β − B x) m Bij xi ≤ β ∀j ∈ {1, . . . , n} i=1 Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.12 Eigennützige Schritte Definition: Sei (s1, ..., sn) ∈ S = S1 × ... × Sn, i ∈ [1, n], s0i ∈ Si. Ein Übergang (s1, ..., sn) 7→ (s1, ..., si−1 , s0i, si+1 , ..., sn) heißt eigennütziger Schritt falls ui(s1, ..., sn) < ui (s1, ..., si−1 , s0i, si+1 , ..., sn). Selfish Step Algorithmus: while (s1, ..., sn) ist kein Nash Equilibrium perform eigennützigen Schritt Definition: GS = (S, ES ) mit ES = {(s, s); s, s ∈ S, s 7→ s ist eigennütziger Schritt} heißt Nash-Graph. Beachte: (a) Ein reines Nash Equilibrium entspricht einem Knoten in GS mit Ausgangsgrad 0. (b) Hat GS keine gerichteten Kreise so existiert ein reines Nash Equilibrium. (c) GS kann Pfade exponentieller Länge enthalten. Monien/Bleischwitz Universität Paderborn Algorithmische Spieltheorie 2.13 Beispiel: Routing Spiel 7 Spieler, 3 Kanten, Spieler i hat Gewicht wi si = {1, 2, 3}∀i = 1, ..., 7 ui(s1, ..., s7) = s =s wj j i 1 2 4 1 2 2 1 2 2 2 2 2 1 2 2 2 4 3 4 2 Monien/Bleischwitz Universität Paderborn 3 4 4 3 4 Algorithmische Spieltheorie 4 3 4 2.14