Suchmaschinen - Institut für Informatik

Werbung
Universität Augsburg, Institut für Informatik
Prof. Dr. W. Kießling
F. Wenzel, L. Rudenko
SS 2015
15. Mai. 2015
Übungsblatt 5
Suchmaschinen
Aufgabe 1: Komplexe Ranking-Präferenz
Gegeben ist folgende aus der Vorlesung bekannte Relation mit dom(ident) = {Maggie, Bart, Homer, Selma, Smithers, Skinner}, dom(color) = {white, yellow, red} und inf age = 10, supage = 60.
oldtimer
ident
Maggie
Bart
Homer
Selma
Smithers
Skinner
color
white
white
yellow
red
red
yellow
age
29
19
35
40
43
51
Ferner sind folgende Präferenzen gegeben:
a) P1 = P OS/P OS(color, {white}; {yellow}), P2 = AROUND(age, 40)
b) P1 = BET W EEN5 (age, [30, 33]), P2 = P OS/NEG(color, {white}; {yellow})
Da alle gezeigten Basispräferenzen Subkonstruktoren der SCORE-Präferenz sind, lassen sich diese
jeweils auf eine SCORE-Präferenz mit entsprechender (im Skript definierter) SCORE Funktion f
abbilden. Diese bilden wiederum die Grundlage für die komplexe Ranking-Präferenz.
Bestimmen Sie jeweils getrennt für a) und b) das BMO-Set bezüglich oben gezeigter Relation
mit einer Ranking-Funktion F (f1 (x1 ), f2 (x2 )) = f1 (x1 ) + f2 (x2 ). Vergleichen Sie anschließend
das Ergebnis für a) mit den Ergebnissen für eine Pareto bzw. Priorisierungs-Präferenz anstelle der
RankF Präferenz.
Aufgabe 2: Modellierung komplexer Präferenzen
Modellieren Sie folgende natürlichsprachlichen Aussagen als komplexe Präferenzterme. Verwenden Sie für Ihre Präferenzen geeignete Domänen und falls notwendig passende Extremwerte (Infimum, Supremum).
a) Gabi möchte ein Mobiltelefon kaufen. Dabei ist ihr das Betriebssystem (OS) am wichtigsten,
welches am liebsten ”Android” sein sollte. An zweiter Stelle wäre für Gabi auch noch ein Gerät
mit ”Symbian OS” von Interesse. Entspricht das Betriebssystem den Vorstellungen, so werden
gleichberechtigt der Preis (price) und der Speicher (disk) als Kriterium bemüht, wobei der Preis
so niedrig wie möglich und der Speicher bei etwa 32 GB liegen sollte.
b) Gabi möchte mit Tim einen Ausflug machen und sucht deshalb eine gemeinsame Wandertour.
Dabei sind ihr die Gesamtdistanz (distance) sowie die Aussicht (view) gleich wichtig. Die Gesamtdistanz sollte zwischen 20 und 30 Kilometern liegen, die Aussicht sollte nicht ”karg” und
wenn möglich ”schön” sein. Tim bevorzugt eine maximale Gesamtdistanz, dies ist ihm wesentlich wichtiger als die Aussicht, die nur nicht ”karg” sein sollte. Insgesamt sind die Meinungen
von Gabi und Tim gleich wichtig.
1
c) Tim möchte ein Auto kaufen. Dieses sollte möglichst viele PS (power) haben, wobei ein Unterschied von 10 PS nicht berücksichtigt werden soll. Gleichberechtigt dazu ist die Farbe (color),
die rot sein sollte. Nach rot sind gelb und schwarz alternative Farben. Am wenigsten interessant
sind Autos der Farbe lila. Nur wenn aufgrund von PS-Leistung und Farbe keine Entscheidung
getroffen werden kann, spielen die Attribute Preis (price) und Marke (make) eine Rolle. Dabei ist der Preis wichtiger als die Marke und sollte minimal sein, Unterschiede von 200 Euro
werden nicht berücksichtigt. Als Marken bevorzugt Tim ”Audi” und ”BMW”.
Aufgabe 3: Modellierung und Auswertung von Präferenzen
Gegeben sei folgende Instanz einer Relation Song ohne Angabe der Domänen:
Song
ID
1
2
3
4
5
6
7
Album
Talking Book
Talking Book
Miles Smiles
Help
Maiden Voyage
Moby 18
Moby 18
Titel
Sunshine
Superstition
Orbits
Help!
Maiden Voyage
18
Fireworks
Künstler
Stevie Wonder
Stevie Wonder
Miles Davis
Beatles
Herbie Hancock
Moby
Moby
Dauer
2,97
4,43
4,60
2,30
7,95
4,47
2,20
Plattenfirma
Motown
Motown
Columbia
Capitol
Blue Note
EMI
EMI
Jahr
1972
1972
1967
1965
1965
2004
2004
1) Setzen Sie folgende Anfragen in Ausdrücke in Preference SQL um.
a) “Ich suche Album und Titel der Songs, deren Dauer möglichst zwischen 3 Minuten und 3,8
Minuten liegt.”
b) “Ich möchte alle Künstler, die bevorzugt ein Album um das Jahr 1970 veröffentlicht haben.
Abweichungen von 5 Jahren sind für mich gleich gut. Die Plattenfirma sollte ’Motown’ sein,
aber möglichst nicht ’Capitol’. Dies ist mir weniger wichtig als das Jahr.”
c) “Ich möchte alle Titel haben, die möglichst lange dauern, aber auf gar keinen Fall länger als
10 Minuten sind. Das Album sollte ’Talking Book’ oder ’Moby 18’ sein, wobei beide gleich
gut sind (reguläre SV-Semantik). Beide Wünsche sind mir gleich wichtig.”
d) ”Ich suche Titel der Künstler ’Stevie Wonder’ und ’Ringo Star’. Wenn es keine Titel dieser
Künstler gibt, bevorzuge ich Titel von ’Roger Waters’ und ’David Gilmour’, danach die von
’Miles Davis’ und anschließend die von ’Herbie Hancock’. ’Moby’ soll definitiv nicht im
Ergebnis erscheinen.“
2) Betrachten Sie die Song-Relation von oben. Bestimmen Sie das Ergebnis (IDs) der Präferenzselektion folgender Präferenzen, basierend auf den angegebenen Daten. Das Infimum von Dauer
sei 0.
a) P1 := P OS(Album, {Moby 18, Talking Book}) ⊗
LOW EST4 (Dauer)
b) P2 := P OS(Album, {Moby 18, Talking Book}, T RIV IAL) ⊗
LOW EST4 (Dauer, T RIV IAL)
2
Aufgabe 4: Erstellen eines Datenbankaccounts
Damit Sie die Preference SQL Übungsaufgaben direkt auf der Oracle-Datenbank ausführen können,
benötigen Sie einen Datenbank-Account. Gehen Sie zum Erstellen Ihres persönlichen Accounts
wie folgt vor:
1. Öffnen Sie den Oracle SQL-Developer (installiert auf den PCs im Datenbankraum)
2. Rechts-Klick auf Verbindungen → Neue Verbindung
3. Tragen Sie folgende Daten ein:
• Verbindungsname: SuMa-OracleAccount
• Benutzername: student
• Kennwort: student
• Hostname: gemini.informatik.uni-augsburg.de
• Port: 1521
• SID: db
4. Stellen Sie eine Verbindung zur Datenbank her.
5. Führen Sie im SQL-Worksheet folgenden Befehl aus
CALL create suma user(’BENUTZER’, ’PASSWORT’);
Dabei müssen Sie als Benutzer und Passwort ihre Matrikelnummer verwenden, z.B.
CALL create suma user(’0815’, ’0815’);
6. Melden Sie sich anschließend wieder ab.
Hinweise:
• Benutzen Sie den Account student nicht für Ihre Übungsaufgaben. Der Account wird nach
Ablauf eines gewissen Zeitfensters gesperrt.
• Der Datenbank-Account dient nur für die Übungen zur Vorlesung. Alle Accounts werden
zum Ende des Sommersemesters gelöscht.
3
Herunterladen