20 Multiagenten-Logik - Institut für Informatik Augsburg

Werbung
20 MULTIAGENTEN-LOGIK
20
87
Multiagenten-Logik
In diesem Kapitel wollen wir zeigen, dass sich mit unseren Mitteln auch Glaubens- und Wissenslogiken darstellen
lassen, wie sie in Multiagenten-Systemem verwendet werden.
Sie sind alle spezielle modale Logiken.
Die wichtigsten Formen sind:
•
•
•
epistemische Logik: Logik des Wissens
doxastische Logik: Logik des Glaubens
deontische Logik: Logik der Verpichtungen und des Erlaubten
Als Beispiel betrachten wir die epistemische Logik.
20.1
Das Rätsel der drei Weisen
Wir illustrieren die Logik anhand eines kleinen Ratsels.
• Ein K
onig will seine drei Weisen prufen.
• Sie m
ussen sich auf drei Stuhle so hintereinander setzen, dass alle in die gleiche Richtung blicken.
• Der K
onig setzt nun jedem der drei einen roten oder schwarzen Hut auf,
• so dass keiner seinen eigenen Hut sehen kann, sondern nur die H
ute der Manner vor ihm.
• Der K
onig teilt ihnen mit, dass zumindest einer der Hute rot ist.
• Er fragt den hintersten Weisen, ob er seine Hutfarbe wei, was dieser verneint.
• Dann fragt er den mittleren Weisen das Gleiche; der verneint ebenfalls.
• Nun sagt er zum Vordersten: Wenn du wirklich weise bist, solltest du jetzt die Farbe deines Hutes wissen.\
"
Wie konnen wir derartige Sachverhalte modellieren und formal etwas daruber ableiten?
Wir fassen die Weisen als Multiagentensystem auf.
• Die Agenten eines solchen Systems werden fortlaufend durchnummeriert.
• Der Wissensstand von Agenten wird durch spezielle Formeln ausgedr
uckt.
• Die Formel Kj ϕ bedeutet, dass der Agent j wei, dass die Formel ϕ wahr ist (K steht f
ur knows\).
"

• Ahnlich bedeutet Eϕ, dass alle Agenten wissen, dass ϕ wahr ist (E steht f
ur everyone knows\).
"
• Oft ist es aber auch wichtig, den Wissensstand anderer Agenten zu kennen, z.B. Ki Kj ϕ.
• Schlielich dr
uckt man mit Cϕ aus, dass jeder wei dass jeder weiss dass ... jeder ϕ wei (C steht fur
common knowledge\).
"
• Sei nun ri die Aussage, dass der Hut des Weisen i rot ist.
• Dabei seien die Weisen von hinten nach vorn, d.h. in der Reihenfolge ihrer Befragung nummeriert.
• Dann lassen sich aus dem Ratsel folgende Formeln gewinnen:
• Jeder Weise kann nur die H
ute vor ihm sehen:
C(ri → Kj ri )
• Wenigstens ein Hut ist rot:
Algebraische Semantik
C(¬ri → Kj ¬ri )
(i > j)
C(r1 ∨ r2 ∨ r3 )
c B. Moller 2009
20 MULTIAGENTEN-LOGIK
88
• Da alle h
oren, was gesagt wird, gilt nach der Befragung
C(¬Ki ri ∧ ¬Ki ¬ri )
(i = 1, 2)
• Die Frage ist nun, ob wir den Wahrheitswert von K3 r3 daraus ableiten k
onnen.
20.2
Modellierung von Wissen: Epistemische Modallogik
Grundlage fur die klassische Semantik von Modallogiken sind Kripke-Strukturen.
moglicher Welten

und Zugangs- oder Ubergangsrelationen
zwischen solchen Welten.
Die von einer Welt w aus damit erreichbaren Welten heien die Nachbarwelten oder kurz Nachbarn von
• Sie bestehen jeweils aus einer Menge
•
•
w.
• Die Formeln einer Modallogik charakterisieren Teilmengen von m
oglichen Welten.
• Box und Diamant sind All- bzw. Existenzquantor u
ber die Nachbarn von Welten.
In der Wissens- oder epistemischen Logik trit man nun folgende Vereinbarung:
• Eine Formel ϕ zahlt zum
Wissen einer Welt w, wenn kein Nachbar von w sie bestreitet.
• Diese Tatsache wird durch die Formel Kϕ ausgedr
uckt.
• Demgema gilt Kϕ in der Welt w genau dann, wenn ϕ in allen Nachbarwelten von w gilt.
• Damit zeigt K das Verhalten eines Box-Operators.
• In Multiagentensystemen kann jeder Agent seine eigene Zugangsrelation mit zugeh
origem Box-Operator
Ki haben.
• Dann bedeutet Ki ϕ, dass ϕ zum Wissen von Agent i geh
ort.
• Der zugeh
orige Diamant Pi wird wie ublich dual deniert:
def
Pi ϕ ⇔ ¬Ki ¬ϕ
• Das bedeutet, dass Agent i die Aussage ϕ f
ur moglich halt (P steht fur \possibly").
Um dem Charakter einer Wissensaussage gerecht zu werden, fordert man meistens zusatzliche Eigenschaften
fur die K-Operatoren:
(1) Ki ϕ → ϕ
wenn i ϕ wei, ist ϕ auch wahr (Reexivitat)
(2) Ki ϕ → Ki Ki ϕ
wenn i ϕ wei, wei er auch, dass er ϕ wei
(positive Introspektion)
(3) ¬Ki ϕ → Ki ¬Ki ϕ wenn i ϕ nicht wei, wei er auch, dass er
ϕ nicht wei (negative Introspektion)
• Es zeigt sich, dass (1) genau dann gilt, wenn die zugeh
orige Zugangsrelation reexiv ist,
• und (2) genau dann, wenn sie transitiv ist.
• Auch zu (3) gibt es eine entsprechende, allerdings weniger bekannte Eigenschaft: Die Zugangsrelation muss
euklidisch sein.
• Wir werden im nachsten Abschnitt sehen, was das bedeutet.
• In vielen Anwendungen ist (3) auch gar nicht n
otig.
Algebraische Semantik
c B. Moller 2009
20 MULTIAGENTEN-LOGIK
20.3
89
Algebraische Darstellung
Die Grundidee fur die algebraische Modellierung der Wissenslogik ist wie im Fall der temporalen Logik:
• Wir abstrahieren von Zugangsrelationen und verwenden stattdessen Elemente ai eines allgemeinen mo-
dalen Halbrings;
• Mengen m
oglicher Welten werden durch Tests charakterisiert;
• Ki und Pi durch |ai ] und |ai i.
• Damit stehen sofort alle unsere Eigenschaften der Modaloperatoren zur Verf
ugung und brauchen nicht
eigens durch Axiome gefordert zu werden.
• Insbesondere sind unsere Operatoren normal, d.h. sie erf
ullen
Ki 1 = 1
Ki (p → q) ≤ Ki p → Ki q
Die Eigenschaft Ki (p → q) ≤ Ki p → Ki q ist nach der Rangierregel aquivalent zu
Ki (p → q) ∧ Ki p ≤ Ki q ,
weshalb sie auch modaler Modus Ponens heit.
Man kann sie aber auch noch anders umformen, indem man zunachst die Denition von → einsetzt,
Ki (¬p ∨ q) ≤ ¬Ki p ∨ Ki q ,
dann ¬p durch r ersetzt,
Ki (r ∨ q) ≤ ¬Ki ¬r ∨ Ki q ,
und schlielich wieder die Rangierregel anwendet:
Ki (q ∨ r) ∧ ¬Ki q ≤ ¬Ki ¬r .
Diese Form hei auch modaler Modus Tollens.
Die speziellen Forderungen an Wissensoperatoren drucken sich nun als Ungleichungen aus, die wir jeweils auch
dualisiert mit den P-Operatoren angeben:
Ki p ≤ p
Ki p ≤ Ki Ki p
¬Ki p ≤ Ki ¬Ki p
p ≤ Pi p
Pi Pi p ≤ Pi p
Pi ¬Pi p ≤ ¬Pi p
Wir werden spater sehen, welche dieser Eigenschaften tatsachlich fur die Losung des Ratsels der Weisen notig
sind.
Wir wollen das Postulat der negativen Instrospektion noch etwas genauer ansehen. In ausfuhrlicher Schreibweise
lautet es
¬||ai ]p ≤ |ai ]¬||ai ]p
Nun schaen wir die Negationszeichen zugunsten von Diamanten weg (mit Substitution q =df ¬p):
|ai iq ≤ |ai ]||ai iq
Jetzt konnen wir die Umklappregel aus Abschnitt 9.2 anwenden und erhalten
hai | |ai iq ≤ |ai iq
Das zeigt nun, was der Begri euklidisch\ fur Zugangselemente bedeutet: Je zwei Nachbarn einer Welt mussen
"
auch Nachbarn von einander sein.
Als nachstes modellieren wir gemeinsames Wissen.
Algebraische Semantik
c B. Moller 2009
20 MULTIAGENTEN-LOGIK
90
• Die beteiligten Agenten seien charakterisiert durch ihre Nummern i ∈ I = {1, . . . , n}.
• Eine
Agentengruppe ist dann eine Teilmenge G
⊆ I.
• Wir wollen nun die bereits erwahnten Operatoren E und C algebraisch f
ur Agentengruppen denieren:
• EG p: Jeder in der Gruppe G wei p.
• CG p: Jeder in G wei, dass jeder in G wei, dass . . . jeder p wei.
Dazu nutzen wird die Gesetze fur die Modaloperatoren aus.
Fur G = {k1 , . . . , km} ergibt sich nach der informellen Denition
EG p =
=
=
=
Kk1 p ∧ · · · ∧ Kkm p
|ak1 ]p ∧ · · · ∧ |akm ]p
|ak1 + · · · + akm ]p
|aG ]p
wobei aG =df ak1 + · · · + akm .
Fur CG erhalten wir
Daher denieren wir
CG p
=
=
=
≈
≈
EG p ∧ EG EG p ∧ EG EG EG p · · ·
|aG ]p ∧ |aG ]||aG ]p ∧ |aG ]||aG ]||aG ]p ∧ · · ·
|aG ]p ∧ |aG · aG ]p ∧ |aG · aG · aG ]p ∧ · · ·
|aG + a2G + a3G + · · ·]p
| a+
G ]p
CG p =df |a+
G ]p
wenn der zugrunde liegende Halbring sogar eine modale Kleene-Algebra ist.
Insgesamt liefert das eine algebraische Version der Multiagentenlogik KT45n .
Nun leiten wir aus den allgemeinen Box-Gesetzen einige Regeln zur Nutzung gemeinsamen Wissens ab. Zur
Vereinfachung lassen wir jeweils den Index G weg und schreiben kurz a, C und E.
Da akj ≤ a ≤ a+ , erhalten wir mit der Antitonie von Box
Cp ≤ Ep ≤ Kkj p
und
Cp ≤ CKkj p
Aus der ersten Eigenschaft folgt: Sind alle Kkj reexiv, so auch E und C.
Als nachstes betrachten wir die iterierte Anwendung von C.
• Wegen a+ · a+ ≤ a+ , der Antitonie von Box im ersten Argument und der Modalitatseigenschaft erhalten
wir
Cp = |a+ ]p ≤ |a+ · a+ ]p = |a+ ]||a+ ]p = CCp ,
• d.h., C ist transitiv im Sinne der Wissensoperatoren:
Cp ≤ CCp .
Daraus ergeben sich zwei weitere nutzliche Eigenschaften:
Cp ∧ Cq ≤ C(Cp ∧ Cq)
Cp ∧ Cq ≤ C(Cp ∧ q)
Sie folgen aus der Konjunktivitat und der eben bewiesenen Transitivitat von C:
• Cp ∧ Cq = C(p ∧ q) ≤ CC(p ∧ q) = C(Cp ∧ Cq)
Algebraische Semantik
c B. Moller 2009
20 MULTIAGENTEN-LOGIK
91
• Cp ∧ Cq ≤ CCp ∧ Cq = C(Cp ∧ q) .
Schlielich liefert uns Kor. 13.15 eine Induktionsregel fur C:
q ≤ E(p · q) ⇒ q ≤ Cp
Beweis:
q ≤ Cp
⇔ [ Denition C ]
q ≤ |a+ ]p
⇔ [ Denition + ]
q ≤ |a∗ · a]p
⇔ [ Modalitat ]
q ≤ |a∗ ]||a]p
⇐ [ Kor. 13.15 ]
q ≤ |a]p · |a]q
⇔ [ Konjunktivitat von |a] ]
q ≤ |a](p · q)
f
f
f
f
f
g
g
g
g
g
20.4
Lösung des Rätsels der Weisen
Jetzt wollen wir das Ratsel um die drei Weisen mit unseren algebraischen Mitteln losen.
Die Hauptbeweismittel sind Iso-/Antitonie und die Rangierregel.
Wie in Kapitel 18 denieren wir Gultigkeit fur Tests p durch
def
|= p ⇔ 1 ≤ p
Insbesondere gilt p ≤ q ⇔ |= p → q.
Wir wiederholen zunachst die Annahmen aus Abschnitt 19.1:
|= C(ri → Kj ri )
|= C(r1 ∨ r2 ∨ r3 )
|= C(¬Ki ri ∧ ¬Ki ¬ri )
|= C(¬ri → Kj ¬ri )
(j < i)
(i = 1, 2)
Die Form der Annahmen deutet auf Anwendbarkeit des modalen Modus Tollens hin.
Dazu schlieen wir wie folgt, fur beliebige Tests p, q und beliebigen Agenten i:
C(p ∨ q) ∧ C(¬Ki p) ∧ C(¬Ki ¬q → q)
[ zweimal C-Regeln ]
C(C(p ∨ q) ∧ ¬Ki p ∧ (¬Ki ¬q → q))
≤ [ Wissensnutzung und Isotonie von C ]
C(Ki (p ∨ q) ∧ ¬Ki p ∧ (¬Ki ¬q → q))
≤ [ modaler Modus Tollens und Isotonie von C ]
C(¬Ki ¬q ∧ (¬Ki ¬q → q))
≤ [ Boolesche Algebra (Modus Ponens) und Isotonie von C ]
C(q) .
≤
f
f
f
f
g
g
g
g
Speziell haben wir
Algebraische Semantik
c B. Moller 2009
20 MULTIAGENTEN-LOGIK
92
C(r1 ∨ r2 ∨ r3 ) ∧ C(¬K1 r1 )
f[ Wissensnutzung ]g
f[ vorige Herleitung ]g
≤
CK1 (r1 ∨ r2 ∨ r3 ) ∧ C(¬K1 r1 )
≤
C(r2 ∨ r3 )
Analog erhalt man
C(r2 ∨ r3 ) ∧ C(¬K2 r2 ) ≤ C(r3 ) ≤ K3 (r3 )
und wir sind fertig.
Man beachte, dass keine der Zusatzannahmen fur die Wissenslogik verwendet wurde.
Die Argumentation lasst sich verallgemeinern: Fur Agentengruppen G und H ⊆ G gilt
C(
_
rj ) ∧ C(
j∈G
^
¬Ki ri ) ∧ C(
i∈H
^
^
rj → Ki rj ) ≤ C(
i∈H j∈G−H
_
rj )
j∈G−H
Es gibt eine ganze Reihe von Ratseln mit ahnlicher Struktur, fur die die obige Technik wiederverwendbar ist:
• Die schmutzigen Kinder
• Das Paradoxon der unerwarteten Hinrichtung
• Das Ratsel von Mr. S und Mr. P
20.5
Ausblick: Weitere modale Logikfamilien
Modale Logiken sprechen mit Diamant und Box uber Moglichkeit und Notwendigkeit, jeweils auf die Nachbarwelten einer Welt bezogen:
• Gilt etwas in allen Nachbarwelten, dann wird es als notwendig angesehen,
• gilt es in wenigstens einer Nachbarwelt, dann als m
oglich.
In der doxastischen Logik haben wir folgende Entsprechungen:
glaubt, dass ϕ gilt;
Agent i halt ϕ fur moglich.
• |ai ]ϕ =
b Agent i
• |ai iϕ =
b
• Da ein Glaube auch falsch sein kann, wird hier Reexivitat von |ai ] nicht gefordert, sondern nur Transiti-
vitat.
In der deontischen Logik hat man dagegen:
(gesetzlich, moralisch,...) verpichtend oder geboten;
|ai iϕ =
b ϕ ist f
ur Agent i erlaubt.
Wiederum wird Reexivitat von |ai ] nicht gefordert, sondern Transitivitat und Serialitat
• |ai ]ϕ =
b ϕ ist f
ur Agent i
•
•
|ai ]ϕ → |ai iϕ
Das bedeutet: Was geboten ist, muss auch erlaubt sein.
Algebraische Semantik
c B. Moller 2009
Herunterladen