Universität Augsburg, Institut für Informatik Prof. Dr. W. Kießling F. Wenzel, L. Rudenko SS 2015 15. Mai. 2015 Übungsblatt 5 Suchmaschinen Aufgabe 1: Komplexe Ranking-Präferenz Gegeben ist folgende aus der Vorlesung bekannte Relation mit dom(ident) = {Maggie, Bart, Homer, Selma, Smithers, Skinner}, dom(color) = {white, yellow, red} und inf age = 10, supage = 60. oldtimer ident Maggie Bart Homer Selma Smithers Skinner color white white yellow red red yellow age 29 19 35 40 43 51 Ferner sind folgende Präferenzen gegeben: a) P1 = P OS/P OS(color, {white}; {yellow}), P2 = AROUND(age, 40) b) P1 = BET W EEN5 (age, [30, 33]), P2 = P OS/NEG(color, {white}; {yellow}) Da alle gezeigten Basispräferenzen Subkonstruktoren der SCORE-Präferenz sind, lassen sich diese jeweils auf eine SCORE-Präferenz mit entsprechender (im Skript definierter) SCORE Funktion f abbilden. Diese bilden wiederum die Grundlage für die komplexe Ranking-Präferenz. Bestimmen Sie jeweils getrennt für a) und b) das BMO-Set bezüglich oben gezeigter Relation mit einer Ranking-Funktion F (f1 (x1 ), f2 (x2 )) = f1 (x1 ) + f2 (x2 ). Vergleichen Sie anschließend das Ergebnis für a) mit den Ergebnissen für eine Pareto bzw. Priorisierungs-Präferenz anstelle der RankF Präferenz. Aufgabe 2: Modellierung komplexer Präferenzen Modellieren Sie folgende natürlichsprachlichen Aussagen als komplexe Präferenzterme. Verwenden Sie für Ihre Präferenzen geeignete Domänen und falls notwendig passende Extremwerte (Infimum, Supremum). a) Gabi möchte ein Mobiltelefon kaufen. Dabei ist ihr das Betriebssystem (OS) am wichtigsten, welches am liebsten ”Android” sein sollte. An zweiter Stelle wäre für Gabi auch noch ein Gerät mit ”Symbian OS” von Interesse. Entspricht das Betriebssystem den Vorstellungen, so werden gleichberechtigt der Preis (price) und der Speicher (disk) als Kriterium bemüht, wobei der Preis so niedrig wie möglich und der Speicher bei etwa 32 GB liegen sollte. b) Gabi möchte mit Tim einen Ausflug machen und sucht deshalb eine gemeinsame Wandertour. Dabei sind ihr die Gesamtdistanz (distance) sowie die Aussicht (view) gleich wichtig. Die Gesamtdistanz sollte zwischen 20 und 30 Kilometern liegen, die Aussicht sollte nicht ”karg” und wenn möglich ”schön” sein. Tim bevorzugt eine maximale Gesamtdistanz, dies ist ihm wesentlich wichtiger als die Aussicht, die nur nicht ”karg” sein sollte. Insgesamt sind die Meinungen von Gabi und Tim gleich wichtig. 1 c) Tim möchte ein Auto kaufen. Dieses sollte möglichst viele PS (power) haben, wobei ein Unterschied von 10 PS nicht berücksichtigt werden soll. Gleichberechtigt dazu ist die Farbe (color), die rot sein sollte. Nach rot sind gelb und schwarz alternative Farben. Am wenigsten interessant sind Autos der Farbe lila. Nur wenn aufgrund von PS-Leistung und Farbe keine Entscheidung getroffen werden kann, spielen die Attribute Preis (price) und Marke (make) eine Rolle. Dabei ist der Preis wichtiger als die Marke und sollte minimal sein, Unterschiede von 200 Euro werden nicht berücksichtigt. Als Marken bevorzugt Tim ”Audi” und ”BMW”. Aufgabe 3: Modellierung und Auswertung von Präferenzen Gegeben sei folgende Instanz einer Relation Song ohne Angabe der Domänen: Song ID 1 2 3 4 5 6 7 Album Talking Book Talking Book Miles Smiles Help Maiden Voyage Moby 18 Moby 18 Titel Sunshine Superstition Orbits Help! Maiden Voyage 18 Fireworks Künstler Stevie Wonder Stevie Wonder Miles Davis Beatles Herbie Hancock Moby Moby Dauer 2,97 4,43 4,60 2,30 7,95 4,47 2,20 Plattenfirma Motown Motown Columbia Capitol Blue Note EMI EMI Jahr 1972 1972 1967 1965 1965 2004 2004 1) Setzen Sie folgende Anfragen in Ausdrücke in Preference SQL um. a) “Ich suche Album und Titel der Songs, deren Dauer möglichst zwischen 3 Minuten und 3,8 Minuten liegt.” b) “Ich möchte alle Künstler, die bevorzugt ein Album um das Jahr 1970 veröffentlicht haben. Abweichungen von 5 Jahren sind für mich gleich gut. Die Plattenfirma sollte ’Motown’ sein, aber möglichst nicht ’Capitol’. Dies ist mir weniger wichtig als das Jahr.” c) “Ich möchte alle Titel haben, die möglichst lange dauern, aber auf gar keinen Fall länger als 10 Minuten sind. Das Album sollte ’Talking Book’ oder ’Moby 18’ sein, wobei beide gleich gut sind (reguläre SV-Semantik). Beide Wünsche sind mir gleich wichtig.” d) ”Ich suche Titel der Künstler ’Stevie Wonder’ und ’Ringo Star’. Wenn es keine Titel dieser Künstler gibt, bevorzuge ich Titel von ’Roger Waters’ und ’David Gilmour’, danach die von ’Miles Davis’ und anschließend die von ’Herbie Hancock’. ’Moby’ soll definitiv nicht im Ergebnis erscheinen.“ 2) Betrachten Sie die Song-Relation von oben. Bestimmen Sie das Ergebnis (IDs) der Präferenzselektion folgender Präferenzen, basierend auf den angegebenen Daten. Das Infimum von Dauer sei 0. a) P1 := P OS(Album, {Moby 18, Talking Book}) ⊗ LOW EST4 (Dauer) b) P2 := P OS(Album, {Moby 18, Talking Book}, T RIV IAL) ⊗ LOW EST4 (Dauer, T RIV IAL) 2 Aufgabe 4: Erstellen eines Datenbankaccounts Damit Sie die Preference SQL Übungsaufgaben direkt auf der Oracle-Datenbank ausführen können, benötigen Sie einen Datenbank-Account. Gehen Sie zum Erstellen Ihres persönlichen Accounts wie folgt vor: 1. Öffnen Sie den Oracle SQL-Developer (installiert auf den PCs im Datenbankraum) 2. Rechts-Klick auf Verbindungen → Neue Verbindung 3. Tragen Sie folgende Daten ein: • Verbindungsname: SuMa-OracleAccount • Benutzername: student • Kennwort: student • Hostname: gemini.informatik.uni-augsburg.de • Port: 1521 • SID: db 4. Stellen Sie eine Verbindung zur Datenbank her. 5. Führen Sie im SQL-Worksheet folgenden Befehl aus CALL create suma user(’BENUTZER’, ’PASSWORT’); Dabei müssen Sie als Benutzer und Passwort ihre Matrikelnummer verwenden, z.B. CALL create suma user(’0815’, ’0815’); 6. Melden Sie sich anschließend wieder ab. Hinweise: • Benutzen Sie den Account student nicht für Ihre Übungsaufgaben. Der Account wird nach Ablauf eines gewissen Zeitfensters gesperrt. • Der Datenbank-Account dient nur für die Übungen zur Vorlesung. Alle Accounts werden zum Ende des Sommersemesters gelöscht. 3