5. Probabilistische Retrievalmodelle 1 5. Probabilistische Retrievalmodelle Norbert Fuhr Notationen 5. Probabilistische Retrievalmodelle Notationen 3 Notationen Q αQ Q βQ QD ρ rel. R IR judg. D αD q ∈ Q Anfrage/Info-bed. D βD dm ∈ D Dokument d ∈ D Dokumentrepräs. q ∈ Q Anfragerepräs. qD ∈ QD Anfragebeschr. R Relevanzskala DD D dm ∈ D D Dokumentbeschr. % Retrievalfunktion IR Retrievalwert Binary-Independence-Retrieval-Modell Retrievalfunktionen für binäre Indexierung Probabilistische Grundlagen des BIR-Modells Anwendung des BIR-Modells 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Retrievalfunktionen für binäre Indexierung 5 Retrievalfunktionen für binäre Indexierung repräsentiere Anfragen und Dokumente als Mengen von Termen T = {t1 , . . . , tn } Menge der Terme in einer Kollektion q ∈ Q: Anfragerepräsentation q T : Menge von Fragetermen Dokumentrepräsentation T : Menge von dm Dokumenttermen dm ∈ D: 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Retrievalfunktionen für binäre Indexierung 5 Retrievalfunktionen für binäre Indexierung repräsentiere Anfragen und Dokumente als Mengen von Termen T = {t1 , . . . , tn } Menge der Terme in einer Kollektion q ∈ Q: Anfragerepräsentation dm ∈ D: q T : Menge von Fragetermen T : Menge von dm Dokumentrepräsentation Dokumenttermen einfache Retrievalfunktion: Coordination level match T %COORD (q, dm ) = |q T ∩ dm | 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Retrievalfunktionen für binäre Indexierung 5 Retrievalfunktionen für binäre Indexierung repräsentiere Anfragen und Dokumente als Mengen von Termen T = {t1 , . . . , tn } Menge der Terme in einer Kollektion q ∈ Q: Anfragerepräsentation q T : Menge von Fragetermen dm ∈ D: T : Menge von dm Dokumentrepräsentation Dokumenttermen einfache Retrievalfunktion: Coordination level match T %COORD (q, dm ) = |q T ∩ dm | Binary-Independence-Retrieval-Modell (BIR): weise Fragetermen Gewichte zu X %BIR (q, dm ) = ci T ti ∈q T ∩dm 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells Probabilistische Grundlagen des BIR-Modells Grundlegende mathematische Techniken zur Herleitung der probabilistischen Retrievalmodelle: 1 Benutzung von Chancen statt Wahrscheinlichkeiten, wobei O(y ) = P(y ) P(y ) = . P(ȳ ) 1 − P(y ) 6 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells Probabilistische Grundlagen des BIR-Modells Grundlegende mathematische Techniken zur Herleitung der probabilistischen Retrievalmodelle: 1 Benutzung von Chancen statt Wahrscheinlichkeiten, wobei O(y ) = 2 P(y ) P(y ) = . P(ȳ ) 1 − P(y ) Anwendung des Bayes’schen Theorems: P(a|b) = P(a, b) P(b|a) · P(a) = , P(b) P(b) 6 Szene aus „The Big Bang Theory“ S04E02 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells Herleitung des BIR-Modells T) Abschätzung von O(R|dm T = Chance, dass ein Dokument mit einer Menge von Termen dm relevant zur Anfrage q ist 8 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 8 Herleitung des BIR-Modells T) Abschätzung von O(R|dm T = Chance, dass ein Dokument mit einer Menge von Termen dm relevant zur Anfrage q ist Repräsentation des Dokumentes dm als binären Vektor ~x = (x1 , . . . , xn ) mit xi = T 1, falls ti ∈ dm 0, sonst 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 8 Herleitung des BIR-Modells T) Abschätzung von O(R|dm T = Chance, dass ein Dokument mit einer Menge von Termen dm relevant zur Anfrage q ist Repräsentation des Dokumentes dm als binären Vektor ~x = (x1 , . . . , xn ) mit T O(R|dm ) = O(R|~x ) = xi = P(R|~x ) P(R̄|~x ) T 1, falls ti ∈ dm 0, sonst 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 9 Anwenden des Bayes’schen Theorems O(R|~x ) = P(R|~x ) P(R̄|~x ) = P(R) P(~x |R) P(~x ) · · P(R̄) P(~x |R̄) P(~x ) P(R) W., dass ein arbiträres Dokument relevant ist zur Anfrage P(~x |R) W., dass ein arbiträres, relevantes Dokument den Termvektor ~x besitzt P(~x |R̄) W., dass ein arbiträres, nicht-relevantes Dokument den Termvektor ~x besitzt 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 10 Beispiel dm d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 r (dm ) R R R R N R R R R N N P(R) = x1 1 1 1 1 1 1 1 1 1 1 1 12 20 x2 1 1 1 1 1 0 0 0 0 0 0 P(R|~x ) 0.80 0.67 P(1, 1|R) = dm d12 d13 d14 d15 d16 d17 d18 d19 d20 4 12 r (dm ) R R R N N N R N N x1 0 0 0 0 0 0 0 0 0 P(1, 1|R̄) = x2 1 1 1 1 1 1 0 0 0 1 8 P(R|~x ) 0.50 0.33 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells Annahme der “Linked dependence”: P(~x |R) P(~x |R̄) ≈ n Y P(xi |R) i=1 P(xi |R̄) 11 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 11 Annahme der “Linked dependence”: P(~x |R) P(~x |R̄) ≈ O(R|~x ) = n Y P(xi |R) i=1 P(xi |R̄) P(R) P(~x |R) · P(R̄) P(~x |R̄) ≈ O(R) n Y P(xi |R) i=1 P(xi |R̄) 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 11 Annahme der “Linked dependence”: P(~x |R) P(~x |R̄) ≈ O(R|~x ) = n Y P(xi |R) i=1 P(xi |R̄) P(R) P(~x |R) · P(R̄) P(~x |R̄) ≈ O(R) n Y P(xi |R) i=1 P(xi |R̄) Aufteilen nach Vorkommen/Fehlen von Termen im aktuellen Dokument: Y P(xi =1|R) Y P(xi =0|R) O(R|~x ) = O(R) · . P(xi =1|R̄) x =0 P(xi =0|R̄) x =1 i i 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 11 Annahme der “Linked dependence”: P(~x |R) P(~x |R̄) ≈ O(R|~x ) = n Y P(xi |R) i=1 P(xi |R̄) P(R) P(~x |R) · P(R̄) P(~x |R̄) ≈ O(R) n Y P(xi |R) i=1 P(xi |R̄) Aufteilen nach Vorkommen/Fehlen von Termen im aktuellen Dokument: Y P(xi =1|R) Y P(xi =0|R) O(R|~x ) = O(R) · . P(xi =1|R̄) x =0 P(xi =0|R̄) x =1 i i pi = P(xi =1|R) Wahrscheinlichkeit, dass ti in einem arbiträren relevanten Dokument vorkommt si = P(xi =1|R̄) Wahrscheinlichkeit, dass ti in einem arbiträren nicht-relevanten Dokument vorkommt 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells Annahme, dass pi = si für alle ti ∈ / qT 12 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 12 Annahme, dass pi = si für alle ti ∈ / qT Y pi T O(R|dm ) = O(R) · si T T ti dm ∩q Y = O(R) T ∩q T ti dm · Y T ∩q T ti dm = O(R) pi · si 1 − pi · 1 − si Y T ∩q T ti dm 1 − pi 1 − si Y T ti q T \dm Y T ∩q T ti dm Y T ti q T \dm 1 − si 1 − pi 1 − pi 1 − si pi (1 − si ) Y 1 − pi · si (1 − pi ) 1 − si T ti q 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells 12 Annahme, dass pi = si für alle ti ∈ / qT Y pi T O(R|dm ) = O(R) · si T T ti dm ∩q Y = O(R) T ∩q T ti dm · Y T ∩q T ti dm = O(R) pi · si 1 − pi · 1 − si Y T ∩q T ti dm 1 − pi 1 − si Y T ti q T \dm Y T ∩q T ti dm Y T ti q T \dm 1 − si 1 − pi 1 − pi 1 − si pi (1 − si ) Y 1 − pi · si (1 − pi ) 1 − si T ti q Nur das erste Produkt ist bezüglich einer gegebenen Anfrage q für unterschiedliche Dokumente nicht konstant −→ Betrachte daher nur dieses Produkt für das Ranking 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells T O(R|dm ) = O(R) 13 Y T ∩q T ti dm pi (1 − si ) Y 1 − pi · si (1 − pi ) 1 − si T ti q Übergang zum Logarithmus (ordnungserhaltend): ci = log pi (1 − si ) si (1 − pi ) 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Probabilistische Grundlagen des BIR-Modells T O(R|dm ) = O(R) 13 Y T ∩q T ti dm pi (1 − si ) Y 1 − pi · si (1 − pi ) 1 − si T ti q Übergang zum Logarithmus (ordnungserhaltend): ci = log pi (1 − si ) si (1 − pi ) Retrievalfunktion: %BIR (q, dm ) = X T ∩q T ti dm ci 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells Anwendung des BIR-Modells Parameterabschätzung für si si = P(xi =1|R̄): (Wahrscheinlichkeit, dass ti in einem arbiträren nicht-relevanten Dokument vorkommt) 14 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells Anwendung des BIR-Modells Parameterabschätzung für si si = P(xi =1|R̄): (Wahrscheinlichkeit, dass ti in einem arbiträren nicht-relevanten Dokument vorkommt) Annahme: Anzahl der nicht-relevanten Dokumente ≈ Größe der Kollektion 14 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells Anwendung des BIR-Modells Parameterabschätzung für si si = P(xi =1|R̄): (Wahrscheinlichkeit, dass ti in einem arbiträren nicht-relevanten Dokument vorkommt) Annahme: Anzahl der nicht-relevanten Dokumente ≈ Größe der Kollektion N – Kollektionsgröße ni – # Dokumente mit dem Term ti si = nNi 14 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells Parameterabschätzung für pi pi = P(xi =1|R): (Wahrscheinlichkeit, dass ti in einem arbiträren relevanten Dokument vorkommt) 15 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells Parameterabschätzung für pi pi = P(xi =1|R): (Wahrscheinlichkeit, dass ti in einem arbiträren relevanten Dokument vorkommt) 1. benutze globalen Wert p für alle pi s −→ Termgewichtung nach inverser Dokumentenhäufigkeit (IDF) ci p 1 − si + log 1−p si N − ni = cp + log ni = log 15 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells 15 Parameterabschätzung für pi pi = P(xi =1|R): (Wahrscheinlichkeit, dass ti in einem arbiträren relevanten Dokument vorkommt) 1. benutze globalen Wert p für alle pi s −→ Termgewichtung nach inverser Dokumentenhäufigkeit (IDF) ci p 1 − si + log 1−p si N − ni = cp + log ni = log %IDF (q, dm ) = P T (cp ti ∈q T ∩dm i + log N−n ni ) oft benutzt: p = 0.5 −→ cp = 0 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells 2. Relevance Feedback: initiale Rangordnung nach IDF-Formel präsentiere höchstgerankte Dokumente dem Benutzer (etwa 10 . . . 20) Benutzer gibt binäre Relevanzurteile ab: relevant/nicht-relevant 16 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells 16 2. Relevance Feedback: initiale Rangordnung nach IDF-Formel präsentiere höchstgerankte Dokumente dem Benutzer (etwa 10 . . . 20) Benutzer gibt binäre Relevanzurteile ab: relevant/nicht-relevant r : # als relevant beurteilte Dokumente zur Anfrage q ri : # relevante Dokumente mit dem Term ti pi = P(ti |R) ≈ ri r 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells 16 2. Relevance Feedback: initiale Rangordnung nach IDF-Formel präsentiere höchstgerankte Dokumente dem Benutzer (etwa 10 . . . 20) Benutzer gibt binäre Relevanzurteile ab: relevant/nicht-relevant r : # als relevant beurteilte Dokumente zur Anfrage q ri : # relevante Dokumente mit dem Term ti pi = P(ti |R) ≈ ri r verbesserte Abschätzungen: pi ≈ ri + 0.5 r +1 5. Probabilistische Retrievalmodelle Binary-Independence-Retrieval-Modell Anwendung des BIR-Modells 17 Beispiel für BIR dm d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 r (dm ) R R R R N R R R R N N x1 1 1 1 1 1 1 1 1 1 1 1 x2 1 1 1 1 1 0 0 0 0 0 0 P(R|~x ) 0.80 0.67 BIR 0.76 0.69 dm d12 d13 d14 d15 d16 d17 d18 d19 d20 r (dm ) R R R N N N R N N x1 0 0 0 0 0 0 0 0 0 x2 1 1 1 1 1 1 0 0 0 P(R|~x ) BIR 0.50 0.48 0.33 0.40 BM25 5. Probabilistische Retrievalmodelle BM25 19 BM25 heuristische Erweiterung des BIR-Modells von binärer auf gewichtete Indexierung (Berücksichtigung der Vorkommenshäufigkeit tf ) umi 1 tfmi 5. Probabilistische Retrievalmodelle BM25 20 Übergang zu gewichteter Indexierung lm al tfmi : b k Dokumentlänge (# laufende Wörter in dm ) durchschnittliche Dokumentlänge in D Vorkommenshäufigkeit (Vkh) von ti in dm . Gewichtung der Längennormalisierung, 0 ≤ b ≤ 1 Gewichtung der Vorkommenshäufigkeit Längennormalisierung: B = lm (1 − b) + b al normalisierte Vorkommenshäufigkeit: ntfmi = tfmi /B BM25-Gewicht: umi = = ntfmi k + ntfmi tfmi k (1 − b) + b lalm + tfmi 5. Probabilistische Retrievalmodelle BM25 Einfluss von k 21 5. Probabilistische Retrievalmodelle BM25 Einfluss von B 22 5. Probabilistische Retrievalmodelle BM25 23 BM25-Retrievalfunktion %BM25 (q, dm ) = X umi · ci T ∩q T ti dm = X T ∩q T ti dm tfmi pi (1 − si ) log lm si (1 − pi ) k((1 − b) + b al ) + tfmi Statistische Sprachmodelle Sprachmodell von Zhai und Lafferty Ähnlichkeit von Wahrscheinlichkeitsverteilungen 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle 25 Statistische Sprachmodelle Nachteil bisher vorgestellter Modelle: keine theoretisch fundierte Berechnung der Indexierungsgewichte Statistische Sprachmodelle: betrachten Sprache (Folge von Wörtern) als statistischen Prozess Sprachmodell θ ist definiert als Wahrscheinlichkeitsverteilung X θ = {(ti , P(ti |θ)|ti ∈ T )} mit P(ti |θ) = 1 ti ∈T Wahrscheinlichkeit Qm für einen Dokumenttext d = t1 t2 t3 . . . tm : P(d |θ) = j=1 P(tj |θ) Retrievalfunktion: betrachte Wahrscheinlichkeit, dass Frage und Dokument vom selben Sprachmodell generiert wurden 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Sprachmodell von Zhai und Lafferty 26 Sprachmodell von Zhai und Lafferty W., dass Anfrage vom Sprachmodell des Dokumentes generiert wurde: P(q|d ) ≈ Y ti P(ti |d ) ⊆q T Y = ti ∈q T ∩d T Y Ps (ti |d ) ti ∈q T −d T Pu (ti |d ) 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Sprachmodell von Zhai und Lafferty 26 Sprachmodell von Zhai und Lafferty W., dass Anfrage vom Sprachmodell des Dokumentes generiert wurde: P(q|d ) ≈ Y ti Y = ti = P(ti |d ) ⊆q T ∈q T ∩d T Y ti ∈q T ∩d T Y Ps (ti |d ) ti Pu (ti |d ) ∈q T −d T Ps (ti |d ) Y Pu (ti |d ) Pu (ti |d ) T ti ∈q Ps (ti |d ) W. dass das Dokument über ti ist, falls ti ∈ d T Pu (ti |d ) W. dass das Dokument über ti ist, falls ti ∈ / dT 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Sprachmodell von Zhai und Lafferty Parameterschätzung: Schätzung von Ps (ti |d ): Problem aufgrund spärlicher Daten N Anzahl Token der Kollektion tf (t, d ) Vorkommenshäufigkeit von t in d l (d ) Dokumentlänge (Anzahl Token) von d cf (t) Kollektionshäufigkeit von t (# Vorkommen) 27 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Sprachmodell von Zhai und Lafferty Parameterschätzung: Schätzung von Ps (ti |d ): Problem aufgrund spärlicher Daten N Anzahl Token der Kollektion tf (t, d ) Vorkommenshäufigkeit von t in d l (d ) Dokumentlänge (Anzahl Token) von d cf (t) Kollektionshäufigkeit von t (# Vorkommen) tf (t, d ) cf (t) Pavg (t) = PML (t|d ) = N l (d ) 27 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Sprachmodell von Zhai und Lafferty Parameterschätzung: Schätzung von Ps (ti |d ): Problem aufgrund spärlicher Daten N Anzahl Token der Kollektion tf (t, d ) Vorkommenshäufigkeit von t in d l (d ) Dokumentlänge (Anzahl Token) von d cf (t) Kollektionshäufigkeit von t (# Vorkommen) tf (t, d ) cf (t) Pavg (t) = PML (t|d ) = N l (d ) schätze Ps (ti |d ) = (1 − λ)PML (t|d ) + λPavg (t) Pu (ti |d ) = αd Pavg (t) 0 ≤ λ ≤ 1: Glättungsfaktor (Jelinek-Mercer) P 1 − ti ∈qT ∩d T Pavg (t) P αd = 1 − ti ∈qT ∩d T PML (t|d ) 27 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Ähnlichkeit von Wahrscheinlichkeitsverteilungen Ähnlichkeit von Wahrscheinlichkeitsverteilungen alternative Retrievalfunktion: Kullback-Leibler Divergence misst die Unähnlichkeit zweier statistischer Sprachmodelle 28 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Ähnlichkeit von Wahrscheinlichkeitsverteilungen Ähnlichkeit von Wahrscheinlichkeitsverteilungen alternative Retrievalfunktion: Kullback-Leibler Divergence misst die Unähnlichkeit zweier statistischer Sprachmodelle Dokument-Sprachmodell θd (wie oben) Anfrage-Sprachmodell θq (z.B. als PML (t|q)) 28 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Ähnlichkeit von Wahrscheinlichkeitsverteilungen 28 Ähnlichkeit von Wahrscheinlichkeitsverteilungen alternative Retrievalfunktion: Kullback-Leibler Divergence misst die Unähnlichkeit zweier statistischer Sprachmodelle Dokument-Sprachmodell θd (wie oben) Anfrage-Sprachmodell θq (z.B. als PML (t|q)) Idee: messe relative Information Information eines Terms: − log P(t|θ) P(t|θ ) Differenz der Information: log P(t|θq ) − log P(t|θd ) = log P(t|θq ) d 5. Probabilistische Retrievalmodelle Statistische Sprachmodelle Ähnlichkeit von Wahrscheinlichkeitsverteilungen 28 Ähnlichkeit von Wahrscheinlichkeitsverteilungen alternative Retrievalfunktion: Kullback-Leibler Divergence misst die Unähnlichkeit zweier statistischer Sprachmodelle Dokument-Sprachmodell θd (wie oben) Anfrage-Sprachmodell θq (z.B. als PML (t|q)) Idee: messe relative Information Information eines Terms: − log P(t|θ) P(t|θ ) Differenz der Information: log P(t|θq ) − log P(t|θd ) = log P(t|θq ) d anschließend Gewichtung entsprechend der relativen Häufigkeit des Terms: D(θq ||θd ) = n X i=1 P(ti |θq ) log P(ti |θq ) P(ti |θd ) Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Das Probability-Ranking-Principle (PRP) Perfektes Retrieval: ordne alle relevanten Dokumenten vor allen nicht-relevanten an bezieht sich auf die Retrievalobjekte selbst, und ist nur bei vollständiger Relevanzbeurteilung der Kollektion moglich 30 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Das Probability-Ranking-Principle (PRP) Perfektes Retrieval: ordne alle relevanten Dokumenten vor allen nicht-relevanten an bezieht sich auf die Retrievalobjekte selbst, und ist nur bei vollständiger Relevanzbeurteilung der Kollektion moglich Optimales Retrieval: bezieht sich auf die Repräsentationen (wie jedes IR-System) 30 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Das Probability-Ranking-Principle (PRP) Perfektes Retrieval: ordne alle relevanten Dokumenten vor allen nicht-relevanten an bezieht sich auf die Retrievalobjekte selbst, und ist nur bei vollständiger Relevanzbeurteilung der Kollektion moglich Optimales Retrieval: bezieht sich auf die Repräsentationen (wie jedes IR-System) Probability Ranking Principle (PRP) definiert optimales Retrieval für probabilistische Modelle: ordne die Dokumente nach der absteigenden Wahrscheinlichkeit der Relevanz 30 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Entscheidungstheoretische Rechtfertigung des PRP C̄ : Kosten für Retrieval eines nicht-relevanten Dokumentes C : Kosten für Retrieval eines relevanten Dokumentes 31 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Entscheidungstheoretische Rechtfertigung des PRP C̄ : Kosten für Retrieval eines nicht-relevanten Dokumentes C : Kosten für Retrieval eines relevanten Dokumentes erwartete Kosten für das Retrieval eines Dokuments dj : EC (q, dj ) = C · P(R|q, dj ) + C̄ (1 − P(R|q, dj )) 31 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Entscheidungstheoretische Rechtfertigung des PRP C̄ : Kosten für Retrieval eines nicht-relevanten Dokumentes C : Kosten für Retrieval eines relevanten Dokumentes erwartete Kosten für das Retrieval eines Dokuments dj : EC (q, dj ) = C · P(R|q, dj ) + C̄ (1 − P(R|q, dj )) Gesamtkosten für das Retrieval: (angenommen, der Benutzer betrachtet die ersten l Dokumente, wobei l nicht im Voraus bekannt ist) r (i): Ranking-Funktion, bestimmt den Index des Dokuments für den Rang i 31 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Entscheidungstheoretische Rechtfertigung des PRP C̄ : Kosten für Retrieval eines nicht-relevanten Dokumentes C : Kosten für Retrieval eines relevanten Dokumentes erwartete Kosten für das Retrieval eines Dokuments dj : EC (q, dj ) = C · P(R|q, dj ) + C̄ (1 − P(R|q, dj )) Gesamtkosten für das Retrieval: (angenommen, der Benutzer betrachtet die ersten l Dokumente, wobei l nicht im Voraus bekannt ist) r (i): Ranking-Funktion, bestimmt den Index des Dokuments für den Rang i 31 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Entscheidungstheoretische Rechtfertigung des PRP C̄ : Kosten für Retrieval eines nicht-relevanten Dokumentes C : Kosten für Retrieval eines relevanten Dokumentes erwartete Kosten für das Retrieval eines Dokuments dj : EC (q, dj ) = C · P(R|q, dj ) + C̄ (1 − P(R|q, dj )) Gesamtkosten für das Retrieval: (angenommen, der Benutzer betrachtet die ersten l Dokumente, wobei l nicht im Voraus bekannt ist) r (i): Ranking-Funktion, bestimmt den Index des Dokuments für den Rang i 31 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Minimierung der Gesamtkosten EC (q, l ) = EC (q, dr (1) , dr (2) , . . . , dr (l) ) = l X i=1 EC (q, dr (i) ) 32 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Minimierung der Gesamtkosten EC (q, l ) = EC (q, dr (1) , dr (2) , . . . , dr (l) ) = l X EC (q, dr (i) ) i=1 P Mimimale Gesamtkosten → minimiere li=1 EC (q, dr (i) ) → r (i) sollte Dokumente nach aufsteigenden Kosten sortieren 32 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP 33 Entscheidungstheoretische Regel: EC (q, dr (i) ) ≤ EC (q, dr (i+1) ) 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP 33 Entscheidungstheoretische Regel: EC (q, dr (i) ) ≤ EC (q, dr (i+1) ) ⇐⇒ C · P(R|q, dr (i) ) + C̄ (1 − P(R|q, dr (i) )) ≤ C · P(R|q, dr (i+1) ) + C̄ 1 − P(R|q, dr (i+1) ) 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP 33 Entscheidungstheoretische Regel: EC (q, dr (i) ) ≤ EC (q, dr (i+1) ) ⇐⇒ C · P(R|q, dr (i) ) + C̄ (1 − P(R|q, dr (i) )) ≤ C · P(R|q, dr (i+1) ) + C̄ 1 − P(R|q, dr (i+1) ) ⇐⇒ P(R|q, dr (i) ) C − C̄ + C̄ ≤ P(R|q, dr (i+1) ) C − C̄ + C̄ 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP 33 Entscheidungstheoretische Regel: EC (q, dr (i) ) ≤ EC (q, dr (i+1) ) ⇐⇒ C · P(R|q, dr (i) ) + C̄ (1 − P(R|q, dr (i) )) ≤ C · P(R|q, dr (i+1) ) + C̄ 1 − P(R|q, dr (i+1) ) ⇐⇒ P(R|q, dr (i) ) C − C̄ + C̄ ≤ P(R|q, dr (i+1) ) C − C̄ + C̄ ⇐⇒ (da C < C̄ ): P(R|q, dr (i) ) ≥ P(R|q, dr (i+1) ). 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP 33 Entscheidungstheoretische Regel: EC (q, dr (i) ) ≤ EC (q, dr (i+1) ) ⇐⇒ C · P(R|q, dr (i) ) + C̄ (1 − P(R|q, dr (i) )) ≤ C · P(R|q, dr (i+1) ) + C̄ 1 − P(R|q, dr (i+1) ) ⇐⇒ P(R|q, dr (i) ) C − C̄ + C̄ ≤ P(R|q, dr (i+1) ) C − C̄ + C̄ ⇐⇒ (da C < C̄ ): P(R|q, dr (i) ) ≥ P(R|q, dr (i+1) ). ordne Dokumente nach der absteigenden Wahrscheinlichkeit der Relevanz! 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Zusamenfassung PRP Minimale Kosten bei Ordnung nach fallender Relevanzwahrscheinlichkeit (Kosten als Optimierungskriterium für Retrieval) PRP: Ordnung nach fallender Relevanzwahrscheinlichkeit liefert optimales Retrieval 34 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Zusamenfassung PRP Minimale Kosten bei Ordnung nach fallender Relevanzwahrscheinlichkeit (Kosten als Optimierungskriterium für Retrieval) PRP: Ordnung nach fallender Relevanzwahrscheinlichkeit liefert optimales Retrieval Dadurch theoretische Rechtfertigung für probabilistisches Retrieval 34 5. Probabilistische Retrievalmodelle Das Probability-Ranking-Principle (PRP) Entscheidungstheoretische Rechtfertigung des PRP Zusamenfassung PRP Minimale Kosten bei Ordnung nach fallender Relevanzwahrscheinlichkeit (Kosten als Optimierungskriterium für Retrieval) PRP: Ordnung nach fallender Relevanzwahrscheinlichkeit liefert optimales Retrieval Dadurch theoretische Rechtfertigung für probabilistisches Retrieval Für andere Modelle lässt sich dieser Zusammenhang nicht beweisen (z.B. bei Ranking nach fallender Ähnlichkeit beim VRM oder „optimales Relevance Feedback“ gibt es keinen direkten Zusammenhang mit Retrievalqualität) 34 IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Ansatz Das Modell Anwendungsmöglichkeiten Zusammenfassung IIR-PRP 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Das klassische PRP Ranking nach fallender Relevanzwahrscheinlichkeit liefert optimale Retrievalqualität 36 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Das klassische PRP Ranking nach fallender Relevanzwahrscheinlichkeit liefert optimale Retrievalqualität Annahmen: Aufgabe: finde relevante Dokumente Relevanz eines Dokumentes zu einer Anfrage ist unabhängig von anderen Dokumenten Durchsehen der Ergebnisliste ist die Hauptaufgabe des Benutzers (und die einzige berücksichtigte Aktivität) 36 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Das klassische PRP Ranking nach fallender Relevanzwahrscheinlichkeit liefert optimale Retrievalqualität Annahmen: Aufgabe: finde relevante Dokumente Relevanz eines Dokumentes zu einer Anfrage ist unabhängig von anderen Dokumenten Durchsehen der Ergebnisliste ist die Hauptaufgabe des Benutzers (und die einzige berücksichtigte Aktivität) 36 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Das klassische PRP Ranking nach fallender Relevanzwahrscheinlichkeit liefert optimale Retrievalqualität Annahmen: Aufgabe: finde relevante Dokumente Relevanz eines Dokumentes zu einer Anfrage ist unabhängig von anderen Dokumenten Durchsehen der Ergebnisliste ist die Hauptaufgabe des Benutzers (und die einzige berücksichtigte Aktivität) 36 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Einwände gegen die PRP-Annahmen Relevanz hängt von den Dokumenten ab, die der Benutzer bereits gesehen hat. Relevanzbeurteilung ist nicht die aufwändigste Aktivität des Benutzers TREC interactive Track: Systeme mit unterschiedlicher Retrievalqualität sind bei interaktivem Retrieval gleich gut [Turpin & Hersh 01] Benutzer können Qualitätsunterschiede beim Ranking leicht kompensieren 37 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Einwände gegen die PRP-Annahmen Relevanz hängt von den Dokumenten ab, die der Benutzer bereits gesehen hat. Relevanzbeurteilung ist nicht die aufwändigste Aktivität des Benutzers TREC interactive Track: Systeme mit unterschiedlicher Retrievalqualität sind bei interaktivem Retrieval gleich gut [Turpin & Hersh 01] Benutzer können Qualitätsunterschiede beim Ranking leicht kompensieren 37 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Einwände gegen die PRP-Annahmen Relevanz hängt von den Dokumenten ab, die der Benutzer bereits gesehen hat. Relevanzbeurteilung ist nicht die aufwändigste Aktivität des Benutzers TREC interactive Track: Systeme mit unterschiedlicher Retrievalqualität sind bei interaktivem Retrieval gleich gut [Turpin & Hersh 01] Benutzer können Qualitätsunterschiede beim Ranking leicht kompensieren 37 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Einwände gegen die PRP-Annahmen Relevanz hängt von den Dokumenten ab, die der Benutzer bereits gesehen hat. Relevanzbeurteilung ist nicht die aufwändigste Aktivität des Benutzers TREC interactive Track: Systeme mit unterschiedlicher Retrievalqualität sind bei interaktivem Retrieval gleich gut [Turpin & Hersh 01] Benutzer können Qualitätsunterschiede beim Ranking leicht kompensieren 37 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Interaktives Retrieval Benutzer haben vielfältige Interaktionsmöglichkeiten (Re)formulierung der Anfrage Dokumentauswahl anhand von Summaries unterschiedlicher Granularität Auswahl verwandter Suchterme aus einer Liste Verfolgen von Dokument-Links Relevanzbeurteilung Informationsbedürfnis ändert sich während der Suche Keine theoretische Fundierung für die Konstruktion von Systemen für interaktives IR 38 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Interaktives Retrieval Benutzer haben vielfältige Interaktionsmöglichkeiten (Re)formulierung der Anfrage Dokumentauswahl anhand von Summaries unterschiedlicher Granularität Auswahl verwandter Suchterme aus einer Liste Verfolgen von Dokument-Links Relevanzbeurteilung Informationsbedürfnis ändert sich während der Suche Keine theoretische Fundierung für die Konstruktion von Systemen für interaktives IR 38 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Motivation Interaktives Retrieval Benutzer haben vielfältige Interaktionsmöglichkeiten (Re)formulierung der Anfrage Dokumentauswahl anhand von Summaries unterschiedlicher Granularität Auswahl verwandter Suchterme aus einer Liste Verfolgen von Dokument-Links Relevanzbeurteilung Informationsbedürfnis ändert sich während der Suche Keine theoretische Fundierung für die Konstruktion von Systemen für interaktives IR 38 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Anforderungen an ein IIR-PRP Berücksichtigung der vollständigen Interaktion zwischen Mensch und Computer Spezifische Kosten für unterschiedliche Aktivitäten Mögliche Änderungen des Informationsbedürfnisses berücksichtigen 39 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Anforderungen an ein IIR-PRP Berücksichtigung der vollständigen Interaktion zwischen Mensch und Computer Spezifische Kosten für unterschiedliche Aktivitäten Mögliche Änderungen des Informationsbedürfnisses berücksichtigen 39 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Anforderungen an ein IIR-PRP Berücksichtigung der vollständigen Interaktion zwischen Mensch und Computer Spezifische Kosten für unterschiedliche Aktivitäten Mögliche Änderungen des Informationsbedürfnisses berücksichtigen 39 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Grundlegende Annahmen Fokussiere auf die funktionalen Aspekte der Interaktion (Usability hier nicht berücksichtigt) System präsentiert dem Benutzer Auswahlliste Benutzer beurteilt die Vorschläge in der angezeigten Reihenfolge Nur positive Entscheidungen (Annahme von Vorschlägen) helfen dem Benutzer 40 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Grundlegende Annahmen Fokussiere auf die funktionalen Aspekte der Interaktion (Usability hier nicht berücksichtigt) System präsentiert dem Benutzer Auswahlliste Benutzer beurteilt die Vorschläge in der angezeigten Reihenfolge Nur positive Entscheidungen (Annahme von Vorschlägen) helfen dem Benutzer 40 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Grundlegende Annahmen Fokussiere auf die funktionalen Aspekte der Interaktion (Usability hier nicht berücksichtigt) System präsentiert dem Benutzer Auswahlliste Benutzer beurteilt die Vorschläge in der angezeigten Reihenfolge Nur positive Entscheidungen (Annahme von Vorschlägen) helfen dem Benutzer 40 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Grundlegende Annahmen Fokussiere auf die funktionalen Aspekte der Interaktion (Usability hier nicht berücksichtigt) System präsentiert dem Benutzer Auswahlliste Benutzer beurteilt die Vorschläge in der angezeigten Reihenfolge Nur positive Entscheidungen (Annahme von Vorschlägen) helfen dem Benutzer 40 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Beispiele für Auswahllisten Rangliste von Dokumenten Liste von Summaries Liste von Dokument-Clustern KWIC-Liste Liste von Termen zur Frage-Expansion Links zu verwandten Dokumenten ... 41 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Abstraktion: Situationen mit Auswahllisten 42 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Abstraktion: Situationen mit Auswahllisten 42 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Abstraktion: Situationen mit Auswahllisten 42 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Ansatz Abstraktion: Situationen mit Auswahllisten 42 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Grundlegende Ideen Benutzer bewegt sich von einer Situation zur nächsten In jeder Situation si wird dem Benutzer eine Liste von (binären) Vorschlägen < ci1 , ci2 , . . . , ci,ni > präsentiert Benutzer beurteilt die Vorschläge in der angezeigten Reihenfolge Die erste positive Entscheidung bringt den Benutzer in eine neue Situation sj 43 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Grundlegende Ideen Benutzer bewegt sich von einer Situation zur nächsten In jeder Situation si wird dem Benutzer eine Liste von (binären) Vorschlägen < ci1 , ci2 , . . . , ci,ni > präsentiert Benutzer beurteilt die Vorschläge in der angezeigten Reihenfolge Die erste positive Entscheidung bringt den Benutzer in eine neue Situation sj 43 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Grundlegende Ideen Benutzer bewegt sich von einer Situation zur nächsten In jeder Situation si wird dem Benutzer eine Liste von (binären) Vorschlägen < ci1 , ci2 , . . . , ci,ni > präsentiert Benutzer beurteilt die Vorschläge in der angezeigten Reihenfolge Die erste positive Entscheidung bringt den Benutzer in eine neue Situation sj 43 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Grundlegende Ideen Benutzer bewegt sich von einer Situation zur nächsten In jeder Situation si wird dem Benutzer eine Liste von (binären) Vorschlägen < ci1 , ci2 , . . . , ci,ni > präsentiert Benutzer beurteilt die Vorschläge in der angezeigten Reihenfolge Die erste positive Entscheidung bringt den Benutzer in eine neue Situation sj 43 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Ein probabilistisches Modell für einzelne Situationen 44 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Erwarteter Nutzen eines Vorschlages pij Wahrscheinlichkeit, dass der Nutzer Vorschlag cij akzeptiert eij < 0: Aufwand zur Beurteilung des Vorschlages cij aij > 0: resultierender Nutzen einer positiven Entscheidung 45 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Erwarteter Nutzen eines Vorschlages pij Wahrscheinlichkeit, dass der Nutzer Vorschlag cij akzeptiert eij < 0: Aufwand zur Beurteilung des Vorschlages cij aij > 0: resultierender Nutzen einer positiven Entscheidung Erwarteter Nutzen des Vorschlages cij E (cij ) = eij + pij aij 45 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Beispiel Web-Suche: ’Java’ → n0 =290 Mio. Treffer 46 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Beispiel Web-Suche: ’Java’ → n0 =290 Mio. Treffer System schlägt Terme zur Frageerweiterung vor: term program blend island ni 195 Mio 5 Mio 2 Mio 46 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Beispiel Web-Suche: ’Java’ → n0 =290 Mio. Treffer System schlägt Terme zur Frageerweiterung vor: term program blend island ni 195 Mio 5 Mio 2 Mio pij 0.67 0.02 0.01 46 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Beispiel Web-Suche: ’Java’ → n0 =290 Mio. Treffer System schlägt Terme zur Frageerweiterung vor: term program blend island ni 195 Mio 5 Mio 2 Mio Nutzen aij = log nn0i pij 0.67 0.02 0.01 aij 0.4 4.0 4.9 46 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Beispiel Web-Suche: ’Java’ → n0 =290 Mio. Treffer System schlägt Terme zur Frageerweiterung vor: term program blend island ni 195 Mio 5 Mio 2 Mio Nutzen aij = log nn0i pij 0.67 0.02 0.01 aij 0.4 4.0 4.9 pij aij 0.268 0.08 0.049 46 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Auswahllisten Situation si mit Liste von Vorschlägen ri =< ci1 , ci2 , . . . , ci,ni > 47 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Auswahllisten Situation si mit Liste von Vorschlägen ri =< ci1 , ci2 , . . . , ci,ni > Erwarteter Nutzen einer Auswahlliste: E (ri ) = ei1 + pi1 ai1 + (1 − pi1 ) (ei2 + pi2 ai2 + (1 − pi2 ) (ei3 + pi3 ai3 + ... (1 − pi,n−1 ) (ein + pin ain ) )) 47 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Auswahllisten Situation si mit Liste von Vorschlägen ri =< ci1 , ci2 , . . . , ci,ni > Erwarteter Nutzen einer Auswahlliste: E (ri ) = ei1 + pi1 ai1 + (1 − pi1 ) (ei2 + pi2 ai2 + (1 − pi2 ) (ei3 + pi3 ai3 + ... (1 − pi,n−1 ) (ein + pin ain ) )) ! j−1 n X Y = (1 − pik ) (eij + pij aij ) j=1 k=1 47 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Erwarteter Nutzen einer Auswahlliste E (ri ) = n X j−1 Y j=1 k=1 ! (1 − pik ) (eij + pij aij ) 48 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell 49 Ranking von Vorschlägen Betrachte zwei aufeinanderfolgende Vorschläge cil und ci,l+1 E (ri ) = n X j−1 Y j=1 k=1 l6=j6=l+1 ! (1 − pik ) (eij + pij aij ) + til,l+1 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell 49 Ranking von Vorschlägen Betrachte zwei aufeinanderfolgende Vorschläge cil und ci,l+1 E (ri ) = n X j−1 Y j=1 k=1 ! (1 − pik ) (eij + pij aij ) + til,l+1 l6=j6=l+1 wobei til,l+1 = (eil + pil ail ) l−1 Y (1 − pik ) + k=1 (ei,l+1 + pi,l+1 ai,l+1 ) l Y k=1 (1 − pik ) 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell 49 Ranking von Vorschlägen Betrachte zwei aufeinanderfolgende Vorschläge cil und ci,l+1 E (ri ) = n X j−1 Y j=1 k=1 ! (1 − pik ) (eij + pij aij ) + til,l+1 l6=j6=l+1 wobei til,l+1 = (eil + pil ail ) l−1 Y (1 − pik ) + k=1 (ei,l+1 + pi,l+1 ai,l+1 ) l Y k=1 analog til+1,l für < . . . , ci,l+1 , cil, , . . . > (1 − pik ) 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Differenz zwischen alternativen Rangfolgen til,l+1 − til+1,l Ql−1 k=1 (1 − pik ) = eil + pil ail + (1 − pil )(ei,l+1 + pi,l+1 ai,l+1 ) − dil,l+1 = ei,l+1 + pi,l+1 ai,l+1 + (1 − pi,l+1 )(eil + pil ail ) = pi,l+1 (eil + pil ail ) − pil (ei,l+1 + pi,l+1 ai,l+1 ) 50 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell Differenz zwischen alternativen Rangfolgen til,l+1 − til+1,l Ql−1 k=1 (1 − pik ) = eil + pil ail + (1 − pil )(ei,l+1 + pi,l+1 ai,l+1 ) − dil,l+1 = ei,l+1 + pi,l+1 ai,l+1 + (1 − pi,l+1 )(eil + pil ail ) = pi,l+1 (eil + pil ail ) − pil (ei,l+1 + pi,l+1 ai,l+1 ) ! Für dil,l+1 ≥ 0 ergibt sich ail + ei,l+1 eil ≥ ai,l+1 + pil pi,l+1 50 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell PRP für Interaktives IR ail + ei,l+1 eil ≥ ai,l+1 + pil pi,l+1 51 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell PRP für Interaktives IR ail + ei,l+1 eil ≥ ai,l+1 + pil pi,l+1 IIR-PRP Ordne Vorschläge nach fallenden Werten von %(cij ) = ail + eil pil 51 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell 52 Erwarteter Nutzen: Einzelner Vorschlag vs. Liste Erwarteter Nutzen: E (cij ) = pij aij + eij eil Ranking-Kriterium: %(cij ) = ail + pil Beispiel: Vorschlag c1 c2 pij 0.5 0.25 aij 10 16 eij -1 -1 E (cij ) 4 3 %(cij ) 8 12 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell 52 Erwarteter Nutzen: Einzelner Vorschlag vs. Liste Erwarteter Nutzen: E (cij ) = pij aij + eij eil Ranking-Kriterium: %(cij ) = ail + pil Beispiel: Vorschlag c1 c2 pij 0.5 0.25 aij 10 16 eij -1 -1 E (cij ) 4 3 E (< c1 , c2 >) = 4 + 0.5 · 3 = 5.5 E (< c2 , c1 >) = 3 + 0.75 · 4 = 6 %(cij ) 8 12 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell IIR-PRP vs. PRP ail + ei,l+1 eil ≥ ai,l+1 + pil pi,l+1 Sei eij = −C̄ , C̄ > 0 und ail = C > 0: C̄ pil ⇒ pil C− ≥ C− C̄ pi,l+1 ≥ pi,l+1 53 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell IIR-PRP vs. PRP ail + ei,l+1 eil ≥ ai,l+1 + pil pi,l+1 Sei eij = −C̄ , C̄ > 0 und ail = C > 0: C̄ pil ⇒ pil C− ≥ C− C̄ pi,l+1 ≥ pi,l+1 Klassisches PRP weiterhin gültig! 53 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell IIR-PRP: Beobachtungen Ordne Vorschläge nach aij + eij pij 54 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Das Modell IIR-PRP: Beobachtungen Ordne Vorschläge nach aij + eij pij pij ’Relevanzwahrscheinlichkeit’ immer noch involviert Tradeoff zwischen Aufwand eij und Nutzen aij Unterschied zwischen PRP und IIR-PRP aufgrund der variablen Werte für eij und aij IIR-PRP betrachtet nur die erste positive Entscheidung 54 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten Anwendungsmöglichkeiten 1 Auswahlwahrscheinlichkeit pij : Gegenstand vieler IR-Modelle, aber Bedarf an Modellen für dynamische Informationsbedürfnisse 55 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten Anwendungsmöglichkeiten 1 Auswahlwahrscheinlichkeit pij : Gegenstand vieler IR-Modelle, aber Bedarf an Modellen für dynamische Informationsbedürfnisse 2 Aufwandsparameter eij : größter Forschungsbedarf 55 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten Anwendungsmöglichkeiten 1 Auswahlwahrscheinlichkeit pij : Gegenstand vieler IR-Modelle, aber Bedarf an Modellen für dynamische Informationsbedürfnisse 2 Aufwandsparameter eij : größter Forschungsbedarf Nutzen aij : 3 Wert der Information? Eingesparter Aufwand (s.u.) 55 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten Eingesparter Aufwand Methoden zur Schätzung der Anzahl rq relevanter Dokumente zur Anfrage q 56 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten Eingesparter Aufwand Methoden zur Schätzung der Anzahl rq relevanter Dokumente zur Anfrage q lineare Recall-Precision-Kurve: P(R) := P 0 · (1 − R) 56 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten 56 Eingesparter Aufwand Methoden zur Schätzung der Anzahl rq relevanter Dokumente zur Anfrage q lineare Recall-Precision-Kurve: P(R) := P 0 · (1 − R) Position des ersten relevanten Dokumentes: nq = rq P 0 (rq −1) 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten 56 Eingesparter Aufwand Methoden zur Schätzung der Anzahl rq relevanter Dokumente zur Anfrage q lineare Recall-Precision-Kurve: P(R) := P 0 · (1 − R) Position des ersten relevanten Dokumentes: nq = rq P 0 (rq −1) Annahme: Auswahl des Benutzers transformiert aktuelle Anfrage q 0 in verbesserte Anfrage q 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten 56 Eingesparter Aufwand Methoden zur Schätzung der Anzahl rq relevanter Dokumente zur Anfrage q lineare Recall-Precision-Kurve: P(R) := P 0 · (1 − R) Position des ersten relevanten Dokumentes: nq = rq P 0 (rq −1) Annahme: Auswahl des Benutzers transformiert aktuelle Anfrage q 0 in verbesserte Anfrage q P(q|q 0 ): W., dass ein zufälliges Dokument aus der Ergebnisliste zu q auch in der Liste zu q 0 auftritt 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten 56 Eingesparter Aufwand Methoden zur Schätzung der Anzahl rq relevanter Dokumente zur Anfrage q lineare Recall-Precision-Kurve: P(R) := P 0 · (1 − R) Position des ersten relevanten Dokumentes: nq = rq P 0 (rq −1) Annahme: Auswahl des Benutzers transformiert aktuelle Anfrage q 0 in verbesserte Anfrage q P(q|q 0 ): W., dass ein zufälliges Dokument aus der Ergebnisliste zu q auch in der Liste zu q 0 auftritt nq0 = rq P(q|q 0 )P 0 (rq −1) 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten 56 Eingesparter Aufwand Methoden zur Schätzung der Anzahl rq relevanter Dokumente zur Anfrage q lineare Recall-Precision-Kurve: P(R) := P 0 · (1 − R) Position des ersten relevanten Dokumentes: nq = rq P 0 (rq −1) Annahme: Auswahl des Benutzers transformiert aktuelle Anfrage q 0 in verbesserte Anfrage q P(q|q 0 ): W., dass ein zufälliges Dokument aus der Ergebnisliste zu q auch in der Liste zu q 0 auftritt nq0 = rq P(q|q 0 )P 0 (rq −1) Nutzen durch den Übergang von q 0 zu q: nq0 − nq . 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Anwendungsmöglichkeiten 57 Eingesparter Aufwand: Beispiel %ij = (nq0 − nq ) + eij = −1 term program blend island ni 195M 5M 2M eij pij pij 0.67 0.02 0.01 aij 0.4 4.0 4.9 pij aij 0.268 0.08 0.049 nq 0 3 116 290 %ij -0.5 56 145 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Zusammenfassung IIR-PRP Zusammenfassung IIR-PRP Heutigen IIR-Systemen fehlt eine theoretische Fundierung Interaktives IR als Fällen von Entscheidungen Nutzer bearbeitet lineare Auswahlliste positive Entscheidungen bringen den Nutzer in eine neue Situation, mit (möglicherweise) neuer Auswahlliste Modell beschränkt sich auf einzelne Situationen, keine Aussagen über Interaktionspfade IIR-PRP ist Generalisierung des klassischen PRP Einführung zusätzlicher Parameter Parameterschätzung ist Gegenstand zukünftiger Forschung 58 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Zusammenfassung IIR-PRP Zusammenfassung IIR-PRP Heutigen IIR-Systemen fehlt eine theoretische Fundierung Interaktives IR als Fällen von Entscheidungen Nutzer bearbeitet lineare Auswahlliste positive Entscheidungen bringen den Nutzer in eine neue Situation, mit (möglicherweise) neuer Auswahlliste Modell beschränkt sich auf einzelne Situationen, keine Aussagen über Interaktionspfade IIR-PRP ist Generalisierung des klassischen PRP Einführung zusätzlicher Parameter Parameterschätzung ist Gegenstand zukünftiger Forschung 58 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Zusammenfassung IIR-PRP Zusammenfassung IIR-PRP Heutigen IIR-Systemen fehlt eine theoretische Fundierung Interaktives IR als Fällen von Entscheidungen Nutzer bearbeitet lineare Auswahlliste positive Entscheidungen bringen den Nutzer in eine neue Situation, mit (möglicherweise) neuer Auswahlliste Modell beschränkt sich auf einzelne Situationen, keine Aussagen über Interaktionspfade IIR-PRP ist Generalisierung des klassischen PRP Einführung zusätzlicher Parameter Parameterschätzung ist Gegenstand zukünftiger Forschung 58 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Zusammenfassung IIR-PRP Zusammenfassung IIR-PRP Heutigen IIR-Systemen fehlt eine theoretische Fundierung Interaktives IR als Fällen von Entscheidungen Nutzer bearbeitet lineare Auswahlliste positive Entscheidungen bringen den Nutzer in eine neue Situation, mit (möglicherweise) neuer Auswahlliste Modell beschränkt sich auf einzelne Situationen, keine Aussagen über Interaktionspfade IIR-PRP ist Generalisierung des klassischen PRP Einführung zusätzlicher Parameter Parameterschätzung ist Gegenstand zukünftiger Forschung 58 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Zusammenfassung IIR-PRP Zusammenfassung IIR-PRP Heutigen IIR-Systemen fehlt eine theoretische Fundierung Interaktives IR als Fällen von Entscheidungen Nutzer bearbeitet lineare Auswahlliste positive Entscheidungen bringen den Nutzer in eine neue Situation, mit (möglicherweise) neuer Auswahlliste Modell beschränkt sich auf einzelne Situationen, keine Aussagen über Interaktionspfade IIR-PRP ist Generalisierung des klassischen PRP Einführung zusätzlicher Parameter Parameterschätzung ist Gegenstand zukünftiger Forschung 58 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Zusammenfassung IIR-PRP Zusammenfassung IIR-PRP Heutigen IIR-Systemen fehlt eine theoretische Fundierung Interaktives IR als Fällen von Entscheidungen Nutzer bearbeitet lineare Auswahlliste positive Entscheidungen bringen den Nutzer in eine neue Situation, mit (möglicherweise) neuer Auswahlliste Modell beschränkt sich auf einzelne Situationen, keine Aussagen über Interaktionspfade IIR-PRP ist Generalisierung des klassischen PRP Einführung zusätzlicher Parameter Parameterschätzung ist Gegenstand zukünftiger Forschung 58 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Zusammenfassung IIR-PRP Zusammenfassung IIR-PRP Heutigen IIR-Systemen fehlt eine theoretische Fundierung Interaktives IR als Fällen von Entscheidungen Nutzer bearbeitet lineare Auswahlliste positive Entscheidungen bringen den Nutzer in eine neue Situation, mit (möglicherweise) neuer Auswahlliste Modell beschränkt sich auf einzelne Situationen, keine Aussagen über Interaktionspfade IIR-PRP ist Generalisierung des klassischen PRP Einführung zusätzlicher Parameter Parameterschätzung ist Gegenstand zukünftiger Forschung 58 5. Probabilistische Retrievalmodelle IIR-PRP: Probabilistisches Ranking-Prinzip für Interaktives IR Zusammenfassung IIR-PRP Zusammenfassung IIR-PRP Heutigen IIR-Systemen fehlt eine theoretische Fundierung Interaktives IR als Fällen von Entscheidungen Nutzer bearbeitet lineare Auswahlliste positive Entscheidungen bringen den Nutzer in eine neue Situation, mit (möglicherweise) neuer Auswahlliste Modell beschränkt sich auf einzelne Situationen, keine Aussagen über Interaktionspfade IIR-PRP ist Generalisierung des klassischen PRP Einführung zusätzlicher Parameter Parameterschätzung ist Gegenstand zukünftiger Forschung 58