Visualisierung von mehrwertigen Attributen Uni Duisburg ‐ Lehrstuhl für Informationssysteme Prof. Dr.‐Ing. Norbert Fuhr Dipl.‐Inform. Anne Wolter André Erlinghagen , Gunnar Meyer, Sergey Tarassenko, Christian Wiacker ‐ 07.05.2008 Gliederung 1. Einleitung Motivation Ziel Anforderungen 2. Die Netzwerkvisualisierung Idee Realisierung Integration in DAFFODIL P bl Probleme & Verbesserungen &V b 3. Programmdemo & Diskussion 3. Programmdemo & Diskussion Abschlusspräsentation Visatt: WS07/08 2 / 22 Gliederung 1. Einleitung Motivation Ziel Anforderungen 2. Die Netzwerkvisualisierung Idee Realisierung Integration in DAFFODIL Probleme & Verbesserungen 3. Programmdemo & Diskussion Abschlusspräsentation Visatt: WS07/08 3 / 22 Einleitung: Motivation & Ziel Motivation: Ergebnisse aus dem Web, digitalen Bibliotheken oder IR‐Systemen liefern oft mehrwertige Attribute Beispiele: Dokumente d(1), d(5), d(15) ( ), ( ), ( ) wurden von Autoren Tick, Trick , und Track verfasst Dokumente d(1), d(3), d(9) erhalten (gemeinsame) Schlüsselwörter Entenhausen, Dollar und Dagobert Für diese mehrwertigen Attribute existieren nur wenige Visualisierungsansätze Für diese mehrwertigen Attribute existieren nur wenige Visualisierungsansätze Ziel: Abschlusspräsentation Auf Basis der Ergebnisse, die das am Lehrstuhl entwickelte System DAFFODIL liefert, einen Visualisierungs‐Prototypen für mehrwertige Attribute entwerfen und implementieren. di l ti Visatt: WS07/08 4 / 22 Einleitung: Anforderungen Der Prototyp sollte die folgenden Anforderungen erfüllen: Informationsgehalt Übersichtlichkeit /Skalierbarkeit Intuitiv verständlich, geringer Lernaufwand Implementierbarkeit Abschlusspräsentation Leicht erweiterbar und gut einbindbar (z.B. in DAFFODIL) Verständlichkeit/Einfachheit Handling von großen Datenmengen Erweiterbarkeit Alle sinnvolle Informationen werden visualisiert oder durch Operationen zugänglich gemacht In der vorgegebenen Zeit mit den zur Verfügung stehenden Teilnehmern realisierbar Visatt: WS07/08 5 / 22 Gliederung 1. Einleitung Motivation Ziel Anforderungen 2 Di N t 2. Die Netzwerkvisualisierung k i li i Idee Realisierung I Integration in DAFFODIL i i DAFFODIL Probleme & Verbesserungen g 3. Programmdemo & Diskussion Abschlusspräsentation Visatt: WS07/08 6 / 22 Die Netzwerkvisualisierung: Idee Idee: Bilde Schlüsselwörter auf Knoten ab und ordne diese kreisförmig an Verbinde Schlüsselwörter/Knoten falls diese Schlüsselwortkombination Verbinde Schlüsselwörter/Knoten falls diese Schlüsselwortkombination existiert Knoten sind um so dicker, desto öfter der Term vor kommt Führe Operationen aus, um Informationen zu extrahieren p , Wähle einen Schwellenwert Wähle einen Slider Wert Der angibt ob Paare , Tripel etc. visualisiert werden sollen Schlüsselwörter sollen ein‐/ausgeblendet und zusammengefasst werden können Abschlusspräsentation der aussagt, dass nur Schlüsselwörter visualisiert werden, die häufiger als der Schwellenwert vorkommen Schwellenwert vorkommen z.B.: model und models Visatt: WS07/08 7 / 22 Die Netzwerkvisualisierung: Idee Abschlusspräsentation Visatt: WS07/08 8 / 22 Die Netzwerkvisualisierung: Realisierung Realisierung: Entnommen aus: Interaktive Systeme von Prof.Dr.–Ing. Jürgen Ziegler 1. Daten (.xml) einlesen/parsen 2. Informationen extrahieren und Objekte instanziieren (z.B.: Dokumente‐ & Schlüsselwortobjekte) 3. Visualisierungsobjekte erzeugen (prefuse) 4. Visualisierungsobjekte rendern OPERATIONEN* Abschlusspräsentation Visatt: WS07/08 9 / 22 Die Netzwerkvisualisierung: Realisierung Daten 1. lese/parse gegeben DAFFODIL Datei (.xml) Nutzbarer XML‐Inhalt: Nutzbarer XML Inhalt: Menge von Dokumenten (Titel, Erscheinungsjahr, Autoren, Abstract) Menge von Schlüsselwörtern Verwendete Techniken/Bibliotheken : SAX, JDOM/DOM Analytische Daten 2. filtere wichtige Daten heraus instanziiere Java Objekte (Schlüsselwörter, Dokumente) führe eigene Berechnung für die Vorkommenshäufigkeit durch Visualisierungsobjekte 3. Erzeuge Visualisierungsobjekte (Knoten, Kanten) g g j ( , ) Verwendete Techniken/Bibliotheken: Abschlusspräsentation Prefuse.org Visatt: WS07/08 10 / 22 Die Netzwerkvisualisierung: Realisierung Änderungen: Abschlusspräsentation Verbindungen zwischen Schlüsselwörtern durch Kombinationsknoten realisiert Liniendicke (statt Knotengröße) symbolisiert Vorkommenshäufigkeit Visatt: WS07/08 11 / 22 Die Netzwerkvisualisierung: Realisierung Operationen der Visualisierung: Abschlusspräsentation Knoten verschieben (Drag&Drop) Schlüsselwörter/Kombinationen löschen (Popup) Schlüsselwörter/Kombinationen löschen (Popup) Highlighting (Mouseover) Zooming (Mausrad) T lti (Mouseover) Tooltip (M ) Suche (Textfeld) Visatt: WS07/08 12 / 22 Die Netzwerkvisualisierung: Realisierung Weitere Operationen: Slider Einstellung der Kombinationstiefe (Slider) Hier: Visualisiere nur Kombinationen, welche mindestens 2 und maximal 4 Terme Hier: Visualisiere nur Kombinationen, welche mindestens 2 und maximal 4 Terme symbolisieren Anpassung der minimalen Vorkommenshäufigkeit (Slider) Hier: Visualisiere nur Kombinationen die mindestens 24 mal vorkommen 2er Kombination 3er Kombination 4er Kombination Abschlusspräsentation Visatt: WS07/08 13 / 22 Die Netzwerkvisualisierung: Realisierung Weitere Operationen: Term/Schlüsselwortliste Sortierungg Schlüsselwort (ein‐/ausblenden) Zu Favoriten hinzufügen Schlüsselwörter zusammenfassen/lösen Schlüsselwörter anzeigen/verstecken Abschlusspräsentation Visatt: WS07/08 14 / 22 Die Netzwerkvisualisierung: Realisierung Weitere Operationen: Favoritenliste Abschlusspräsentation Favorisierte Schlüsselwörter können in einer Liste zusammengefasst werden Liste kann abgespeichert und bei zukünftigen Visualisierungen hinzu geladen Liste kann abgespeichert und bei zukünftigen Visualisierungen hinzu geladen werden Mehre Listen können zusammengefasst werden Operationen der Termliste p sind über ein Popup zugänglich (z.B.: Terme p p g g ( zusammenfassen) Visatt: WS07/08 15 / 22 Die Netzwerkvisualisierung: Realisierung Weitere Operationen: Dokumentenexport Zu einzelnen Schlüsselwörtern oder Schlüsselwortkombinationen können p ( ) Dokumentlisten exportiert werden (.XML) Die Schlüsselwörter werden farbig markiert (im Titel und Abstract) und in ihre Kontextumgebung abgebildet (KWIC) Einzelnen Dokumente können deselektiert werden und sind dann nicht mehr T il d Teil der exportierten .XML‐Datei i XML D i Abschlusspräsentation So können Dokumente aus unterschiedlichen Suchprozessen zu einer Menge von Dokumenten zusammengefasst werden (Berry‐Pick) Visatt: WS07/08 16 / 22 Die Netzwerkvisualisierung: Realisierung Abschlusspräsentation Visatt: WS07/08 17 / 22 Die Netzwerkvisualisierung: Integration Daffodil Personal Library: Favoritenintegration Dokumentenliste unverändert Visualisierungs Tab Abschlusspräsentation Visatt: WS07/08 Terme & Kombinationslisten 18 / 22 Die Netzwerkvisualisierung: Probleme & Verbesserungen Unübersichtlichkeit & überdecket Knoten Knoten überdecken sich teilweise Bei großer Datenbasis wird der Graph unübersichtlich Netz muss per D&D manuell aufgeräumt werden Focus & Kontextechnik: Hyperbolic yp Browser Direkte Manipulation & Performance Wünschenswert wäre, wenn sich der Graph kontinuierlich mit den Wünschenswert wäre wenn sich der Graph kontinuierlich mit den Slidereinstellungen aktualisiert Abschlusspräsentation Ist auf Grund der langsamen Performance leider nicht umsetzbar Bei ungünstigen Slidereinstellungen (z.B. große Kombinationsspanne & kleine minimale Vorkommenhäufigkeit) benötigt das Programm viel Rechenzeit Algorithmus optimieren Ungünstige Werte abfangen Visatt: WS07/08 19 / 22 Die Netzwerkvisualisierung: Probleme & Verbesserungen Ungenauigkeit & keine bzw. zu wenig Informationen Es wird nur unterschieden ob ein Schlüsselwort im Dokumente vorhanden ist oder nicht (Boolesches‐Retrieval). Diese Werte stützen sich nur auf Titel und d i ht (B l h R t i l) Di W t tüt i h f Tit l d Abstract Einbindung von externen Quellen um weitere Informationen zu erhalten z.B.: Einbindung von Webservices oder Datenbanken die Inhaltsverzeichnis o.ä. Inhalte liefern (möglich durch XML‐Cocoon) Vektorraum‐Retrieval Exportierung Die Dokumentenlisten werden momentan in XML ausgegeben Abschlusspräsentation Durch XSLT kann hier in weitere Formate (z.B. html, pdf…) exportiert werden D h XSLT k hi i i F ( B h l df ) i d Weitere Dokumentinformationen können durch XML‐Cocoon eingebunden werden Visatt: WS07/08 20 / 22 Die Netzwerkvisualisierung: Probleme & Verbesserungen Weiteres Das Zusammenfassen von Schlüsselwörter ist momentan nur in der Termliste möglich. Intuitiver ist allerdings das Zusammenfassen im Graphen ö li h I t iti i t ll di d Z f i G h z.B. mit D&D „Zurück Funktion“ (vgl. Browser) die aktuelle Änderung rückgängig macht Erweitere das Konzept durch weitere Attribute (DA) Abschlusspräsentation Autoren Veröffentlichungsjahr Visatt: WS07/08 21 / 22 Gliederung 1. Einleitung Motivation Ziel Anforderungen 2. Die Netzwerkvisualisierung Idee Realisierung Integration in DAFFODIL Probleme & Verbesserungen 3. Programmdemo & Diskussion g Abschlusspräsentation Visatt: WS07/08 22 / 22