A B C Bayes‘sche Netzwerke Einsatz Bayes‘scher Netzwerke zur Identifikation von Kundenwünschen Inhaltsübersicht - Rohfassung Problemstellung Grundlagen der Wahrscheinlichkeitsrechnung Unbedingte / Bedingte Wahrscheinlichkeiten Totale Wahrscheinlichkeit / Bayes‘scher Satz Kleines Rechenbeispiel „Interview“ Bayes‘sche Netzwerke Geschichtliches Was ist ein Bayes‘sches Netzwerk / Definition Netzwerkbeispiele Evidenzen D-Separation Kettenregel für Bayes‘sche Netzwerke Beispielrechnung „Startproblem“ Bucket Elimination Einsatzgebiete Allgemein Identifikation von Kundenwünschen bei Daimler-Benz Bewertung Das Programm „Bayesware“ Quellenangabe Grundlagen - Unbedingte/Bedingte WSK Unbedingte Wahrscheinlichkeit: P(A) Bedingte Wahrscheinlichkeit: P(B|A) die Wahrscheinlichkeit des Ereignisses B unter der Bedingung, dass A bereits eingetreten ist Es gelten folgende Rechenregeln: Bezeichnet P( B | A) P( A B) P( A) Allgemeiner Multiplikationssatz für 2 Ereignisse: P A B P A PB | A PB P A | B Allgemeiner Multiplikationssatz für n Ereignisse: n P Ai P A1 P A2 | A1 P A3 | A1 A2 P An | A1 An1 i 1 Grundlagen – Totale WSK / BayesSatz Formel der totalen Wahrscheinlichkeit: n PB PB | Ai P( Ai ) i 1 Der Bayes‘sche Satz: PB | Ak P Ak PB | Ak P Ak P Ak | B n P B PB | Ai P Ai i 1 Grundlagen - Beispielaufgabe 3 Fahrzeuge der Gruppe I (Auto I) mit je 2 männlichen und 2 weiblichen Personen und 2 Fahrzeugen der Gruppe II (Auto II) mit je 1 männlichen und 2 weiblichen Personen stehen zur Verfügung. a) Es wird ein Fahrzeug ausgewählt und daraus eine Person befragt, subjektive Bevorzugung ausgeschlossen. Man ermittle die Wahrscheinlichkeit, dass die befragte Person eine Frau ist. b) Wie groß ist im Fall der Wahl einer weiblichen Person die Wahrscheinlichkeit, dass diese aus einem Fahrzeug der Gruppe II stammt. P(A) P(B|A) Auto I Auto II Auto I 0,600 Mann 0,500 0,333 Auto II 0,400 Frau 0,500 0,666 a) Formel der totalen Wahrscheinlichkeit: PFrau P AutoI PFrau | AutoI P AutoII PFrau | AutoII 0.600 0.500 0.400 0.666 0.566 b) Bayes‘scher Satz: P AutoI | Frau P AutoII PFrau | AutoII 0.400 0.666 0.470 P AutoI PFrau | AutoI P AutoII PFrau | AutoII 0.600 0.500 0.400 0.666 Kettenregel für Bayes‘sche Netzwerke Sei BN ein Bayes‘sches Netzwerk über U A1 ,..., An (vollständiges Ereignissystem). Dann ist die Verbundwahrscheinlichkeitsverteilung P(U) das Produkt aller in BN spezifizierten Potentiale. PU P Ai | pa Ai i pa Ai ist die Menge aller Elternknoten von Ai . Bayes‘sche Netze - Geschichtliches Thomas Bayes, ein Priester, schuf mit seinem Werk: „An essay towards solving a problem in the doctrine of chances„ 1763 die Grundlagen Die Konzepte für die heutige Bayes‘schen Netze (kausale Netzwerke, d-connection, d-separation) kann man auf Judea Pearl zurückführen In der ersten Hälfte der 1980er wurden Bayes‘sche Netze in das Feld der Expertensysteme eingeführt Erst am Ende der 1980er existieren erste Real-World-Anwendungen Thomas Bayes 1702-1761 Bayes‘sche Netze - Definition Werden auch als bayesian belief networks, probabilistic networks, causal networks oder als kausalprobabilistische Netze bezeichnet Bestehen aus einer Menge von Zufallsvariablen und gerichteten Kanten zwischen den Variablen, die zusammen einen gerichteten azyklischen Graphen (DAG) bilden Jede Variable hat eine endliche Anzahl von sich gegenseitig ausschließenden Zuständen Jeder Knoten hat eine Tabelle mit den bedingten Wahrscheinlichkeiten (CPT), die den Einfluss der Elternknoten quantifizieren Bayes‘sches Netz - Struktur I Ohne Tabellen der bedingten Wahrscheinlichkeiten a) b) Bayes‘sches Netz II Mit Tabellen der bedingten Wahrscheinlichkeiten P ( Zündkerzen ) P ( Treibstoff? ) P ( Tankanzeige | Treibstoff? ) P ( Startet | Treibstoff? , Zündkerzen ) D-Separation - Begriff / Definition D-Separation erlaubt eine allgemeine Aussage darüber, ob eine Knotenmenge X unabhängig von einer Knotenmenge Y ist, gegeben eine Evidenzknotenmenge E. Zwei verschiedene Variablen X und Y sind d-separated (direction-dependent-separated), falls auf allen Pfaden zwischen X und Y eine Variable Z existiert, so dass entweder ... die Verbindung serial oder diverging und Z ein Evidenzknoten ist oder … die Verbindung converging und weder Z noch Z‘s Nachfahren Evidenzknoten sind Sind zwei Knoten nicht d-separated, werden sie auch als d-connected bezeichnet D-Separation - Fallüberblick Folgende drei Verbindungsarten existieren: X Z (1) Serial Connection Z (2) Diverging Connection Z (3) Converging Connection Y D-Separation - Beispiel A F C B G D H E Wahre Aussagen: Falsche Aussagen: - F d-separated von H bei geg. G - C d-separated von G bei geg. F - F d-separated von E bei geg. C - A d-separated von B bei geg. D - A d-separated von B - D d-separated von F bei geg. C, G Bayes‘sche Netze - Einsatzgebiete Medizinische Diagnose (größter Bereich), Erlernen eines Grundrisses oder einer Sprache und als Grundlage für die heuristischen Suche Die ersten wirklichen Anwendungen in denen Bayes‘sche Netze eingesetzt wurden: (Andreassen 1989) – dient zur Diagnose von neuromuskulären Krankheiten PATHFINDER (Heckermann 1992) – deckt ca. 60 Lymphknotenkrankheiten und 100 Symptome und Testergebnisse ab MUNIN Bayes‘sche Netze - Bewertung Vorteile: Kann sehr gut zur Darstellung von unsicherem Wissens genutzt werden Nachteile: Woher weiß man die Wahrscheinlichkeiten? Von Experten schätzen lassen (unsicher!) Netz mit Testdaten trainieren