Klausur Künstliche Intelligenz Semester: Bearbeitungszeit: AI 7, IN 1 90 Minuten Wintersemester 07/08, Hilfsmittel: 31.1.2008 Alle ohne prog. C Bitte verwenden Sie nach Möglichkeit nur die ausgegebenen Blätter Aufgabe 1 (8 Punkte) Gegeben sei P (A, B) = 0.7. Bestimmen Sie dazu die Verteilung P(A, B) = (p1 , p2 , p3 , p4 ) = (P (A, B), P (A, ¬B), P (¬A, B), P (¬A, ¬B)) mit maximaler Entropie. Berechnen oder begründen Sie Ihre Lösung. 1 Aufgabe 2 (8 Punkte (4,4)) Gegeben sei ein Bayesnetz mit den binären Variablen A, B, D und den angegebenen CPTs. D w f P(A) 0.5 0.9 A a) Berechnen Sie P (A, B). b) Beweisen Sie, dass A und B nicht unabhängig sind. 2 D P(D) 0.2 B D w f P(B) 0.7 0.5 Aufgabe 3 (8 Punkte) Konstruieren Sie für das 8-Puzzle vom Startknoten 1 7 5 2 4 8 3 6 zum Zielknoten 1 4 7 2 5 8 3 6 den Suchbaum mit A*-Suche und markieren Sie den Lösungspfad farbig. Verwenden Sie als Heuristik den Manhatten-Abstand und vermeiden Sie triviale Zyklen der Länge 2. Geben Sie zu jedem Knoten das Tripel (g, h, f ) an. 3 Aufgabe 4 (12 Punkte (2,2,4,4)) Gegeben sei der folgende Entscheidungsbaum und je eine Tabelle mit Trainings- und Testdaten. Trainingsdaten S w f T w f U w f w w f f S w w w f f f T w f w f f w U f f w w f w Klasse w w f f f w Testdaten S T U w w f w f f f w f f f w Klasse w w f f a) Geben Sie die Fehlerrate des Baumes auf den Trainings- und Testdaten an. b) Geben Sie eine zu dem Baum äquivalente aussagenlogische Formel an. c) Führen Sie auf dem Baum das Pruning durch, zeichnen Sie den resultierenden Baum und geben Sie seine Fehlerrate auf den Trainings- und Testdaten an. d) Bestimmen Sie den Informationsgewinn des Attributs S auf den Trainingsdaten. 4 Aufgabe 5 (5 Punkte) Wenden Sie den Nearest-Neighbour-Algorithmus zum hierarchischen Clustering auf folgende Datenmenge an: 0 4 2 1 1 0 2 4 , x6 = 3 , x5 = 2 , x4 = 1 , x3 = 0 , x2 = x1 = 5 4 5 4 1 0 Verwenden Sie zur Berechnung des Abstandes von zwei Vektoren die Maximumnorm d∞ (x , y ) = max |xi − yi | i=1,...,n und geben Sie in jedem Schritt des Algorithmus die Menge der Cluster als Liste von Listen von Vektoren, z.B. ((x 1 , x 2 , x 3 ), (x 4 , x 5 , x 6 )) an. Aufgabe 6 (7 Punkte (3,4)) Neuronale Netze sind, im Unterschied zur Wahrscheinlichkeitslogik, nicht geeignet, um basierend auf Daten und Expertenwissen ein hybrides Expertensystem wie Lexmed zu erstellen. a) Welches der in Kapitel 8 im Buch genannten Lernverfahren würde sich hierfür eignen? (nur eine Nennung ist erlaubt!) b) Wie würde hier die Integration des aus den Daten gewonnenen Wissens und des Expertenwissens erfolgen? 5