Bayes`sche Netzwerke

Werbung
A
B
C
Bayes‘sche Netzwerke
Einsatz Bayes‘scher Netzwerke
zur Identifikation von
Kundenwünschen
Inhaltsübersicht - Rohfassung


Problemstellung
Grundlagen der Wahrscheinlichkeitsrechnung




Unbedingte / Bedingte Wahrscheinlichkeiten
Totale Wahrscheinlichkeit / Bayes‘scher Satz
Kleines Rechenbeispiel „Interview“
Bayes‘sche Netzwerke









Geschichtliches
Was ist ein Bayes‘sches Netzwerk / Definition
Netzwerkbeispiele
Evidenzen
D-Separation
Kettenregel für Bayes‘sche Netzwerke
Beispielrechnung „Startproblem“
Bucket Elimination
Einsatzgebiete





Allgemein
Identifikation von Kundenwünschen bei Daimler-Benz
Bewertung
Das Programm „Bayesware“
Quellenangabe
Grundlagen - Unbedingte/Bedingte WSK


Unbedingte Wahrscheinlichkeit: P(A)
Bedingte Wahrscheinlichkeit: P(B|A)

die Wahrscheinlichkeit des Ereignisses
B
unter der Bedingung, dass A bereits eingetreten ist
 Es gelten folgende Rechenregeln:
 Bezeichnet



P( B | A)  P( A  B) P( A)
Allgemeiner Multiplikationssatz für 2 Ereignisse:
P A  B  P A PB | A  PB P A | B
Allgemeiner Multiplikationssatz für n Ereignisse:
 n 
P  Ai   P A1   P A2 | A1   P A3 | A1  A2   P An | A1    An1 
 i 1 
Grundlagen – Totale WSK / BayesSatz

Formel der totalen Wahrscheinlichkeit:
n
PB    PB | Ai   P( Ai )
i 1

Der Bayes‘sche Satz:
PB | Ak   P Ak 
PB | Ak   P Ak 
P Ak | B  
 n
P B 
 PB | Ai  P Ai 
i 1
Grundlagen - Beispielaufgabe
3 Fahrzeuge der Gruppe I (Auto I) mit je 2 männlichen und 2 weiblichen Personen und 2 Fahrzeugen
der Gruppe II (Auto II) mit je 1 männlichen und 2 weiblichen Personen stehen zur Verfügung.
a) Es wird ein Fahrzeug ausgewählt und daraus eine Person befragt, subjektive Bevorzugung
ausgeschlossen. Man ermittle die Wahrscheinlichkeit, dass die befragte Person eine Frau ist.
b) Wie groß ist im Fall der Wahl einer weiblichen Person die Wahrscheinlichkeit, dass diese aus
einem Fahrzeug der Gruppe II stammt.
P(A)
P(B|A)
Auto I
Auto II
Auto I
0,600
Mann
0,500
0,333
Auto II
0,400
Frau
0,500
0,666
a) Formel der totalen Wahrscheinlichkeit:
PFrau   P AutoI  PFrau | AutoI   P AutoII  PFrau | AutoII   0.600  0.500  0.400  0.666  0.566
b) Bayes‘scher Satz:
P AutoI | Frau  
P AutoII   PFrau | AutoII 
0.400  0.666

 0.470
P AutoI   PFrau | AutoI   P AutoII   PFrau | AutoII  0.600  0.500  0.400  0.666
Kettenregel für Bayes‘sche Netzwerke
Sei BN ein Bayes‘sches Netzwerk über U  A1 ,..., An 
(vollständiges Ereignissystem). Dann ist die
Verbundwahrscheinlichkeitsverteilung P(U) das Produkt
aller in BN spezifizierten Potentiale.
PU    P Ai | pa Ai 
i
pa Ai  ist die Menge aller Elternknoten von Ai .
Bayes‘sche Netze - Geschichtliches




Thomas Bayes, ein Priester, schuf mit
seinem Werk: „An essay towards
solving a problem in the doctrine of
chances„ 1763 die Grundlagen
Die Konzepte für die heutige
Bayes‘schen Netze (kausale
Netzwerke, d-connection, d-separation)
kann man auf Judea Pearl
zurückführen
In der ersten Hälfte der 1980er wurden
Bayes‘sche Netze in das Feld der
Expertensysteme eingeführt
Erst am Ende der 1980er existieren
erste Real-World-Anwendungen
Thomas Bayes
1702-1761
Bayes‘sche Netze - Definition




Werden auch als bayesian belief networks,
probabilistic networks, causal networks oder als
kausalprobabilistische Netze bezeichnet
Bestehen aus einer Menge von Zufallsvariablen
und gerichteten Kanten zwischen den Variablen,
die zusammen einen gerichteten azyklischen
Graphen (DAG) bilden
Jede Variable hat eine endliche Anzahl von sich
gegenseitig ausschließenden Zuständen
Jeder Knoten hat eine Tabelle mit den bedingten
Wahrscheinlichkeiten (CPT), die den Einfluss
der Elternknoten quantifizieren
Bayes‘sches Netz - Struktur I
Ohne Tabellen der bedingten Wahrscheinlichkeiten
a)
b)
Bayes‘sches Netz II
Mit Tabellen der bedingten Wahrscheinlichkeiten
P ( Zündkerzen )
P ( Treibstoff? )
P ( Tankanzeige | Treibstoff? )
P ( Startet | Treibstoff? , Zündkerzen )
D-Separation - Begriff / Definition
D-Separation erlaubt eine allgemeine Aussage darüber, ob eine
Knotenmenge X unabhängig von einer Knotenmenge Y ist,
gegeben eine Evidenzknotenmenge E.

Zwei verschiedene Variablen X und Y sind d-separated
(direction-dependent-separated), falls auf allen Pfaden
zwischen X und Y eine Variable Z existiert, so dass
entweder ...



die Verbindung serial oder diverging und Z ein Evidenzknoten
ist oder …
die Verbindung converging und weder Z noch Z‘s Nachfahren
Evidenzknoten sind
Sind zwei Knoten nicht d-separated, werden sie auch als
d-connected bezeichnet
D-Separation - Fallüberblick
Folgende drei Verbindungsarten existieren:
X
Z
(1) Serial Connection
Z
(2) Diverging Connection
Z
(3) Converging Connection
Y
D-Separation - Beispiel
A
F
C
B
G
D
H
E
Wahre Aussagen:
Falsche Aussagen:
- F d-separated von H bei geg. G
- C d-separated von G bei geg. F
- F d-separated von E bei geg. C
- A d-separated von B bei geg. D
- A d-separated von B
- D d-separated von F bei geg. C, G
Bayes‘sche Netze - Einsatzgebiete


Medizinische Diagnose (größter Bereich),
Erlernen eines Grundrisses oder einer Sprache
und als Grundlage für die heuristischen Suche
Die ersten wirklichen Anwendungen in denen
Bayes‘sche Netze eingesetzt wurden:
(Andreassen 1989) – dient zur Diagnose von
neuromuskulären Krankheiten
 PATHFINDER (Heckermann 1992) – deckt ca. 60
Lymphknotenkrankheiten und 100 Symptome und
Testergebnisse ab
 MUNIN
Bayes‘sche Netze - Bewertung

Vorteile:
 Kann
sehr gut zur Darstellung von
unsicherem Wissens genutzt werden

Nachteile:

Woher weiß man die Wahrscheinlichkeiten?
Von Experten schätzen lassen (unsicher!)
 Netz mit Testdaten trainieren

Herunterladen