Visualisierung von mehrwertigen Attributen

Werbung
Visualisierung von mehrwertigen Attributen
Uni Duisburg ‐ Lehrstuhl für Informationssysteme
Prof. Dr.‐Ing. Norbert Fuhr
Dipl.‐Inform. Anne Wolter
André Erlinghagen , Gunnar Meyer, Sergey Tarassenko, Christian Wiacker ‐ 07.05.2008
Gliederung
ƒ
ƒ
ƒ
1. Einleitung
ƒ
Motivation
ƒ
Ziel
ƒ
Anforderungen
2. Die Netzwerkvisualisierung
ƒ
Idee
ƒ
Realisierung
ƒ
Integration in DAFFODIL
ƒ
P bl
Probleme & Verbesserungen
&V b
3. Programmdemo & Diskussion
3. Programmdemo & Diskussion
Abschlusspräsentation
Visatt: WS07/08
2 / 22
Gliederung
ƒ
1. Einleitung
ƒ
ƒ
ƒ
ƒ
ƒ
Motivation
Ziel
Anforderungen
2. Die Netzwerkvisualisierung
ƒ
Idee
ƒ
Realisierung
ƒ
Integration in DAFFODIL
ƒ
Probleme & Verbesserungen
3. Programmdemo & Diskussion
Abschlusspräsentation
Visatt: WS07/08
3 / 22
Einleitung: Motivation & Ziel
ƒ
Motivation:
ƒ
Ergebnisse aus dem Web, digitalen Bibliotheken oder IR‐Systemen liefern oft mehrwertige Attribute
ƒ
Beispiele:
ƒ
ƒ
ƒ
Dokumente d(1), d(5), d(15)
( ), ( ), ( ) wurden von Autoren Tick, Trick
,
und Track verfasst
ƒ
Dokumente d(1), d(3), d(9) erhalten (gemeinsame) Schlüsselwörter Entenhausen, Dollar und Dagobert
Für diese mehrwertigen Attribute existieren nur wenige Visualisierungsansätze
Für diese mehrwertigen Attribute existieren nur wenige Visualisierungsansätze
Ziel:
ƒ
Abschlusspräsentation
Auf Basis der Ergebnisse, die das am Lehrstuhl entwickelte System DAFFODIL liefert, einen Visualisierungs‐Prototypen für mehrwertige Attribute entwerfen und implementieren.
di l
ti
Visatt: WS07/08
4 / 22
Einleitung: Anforderungen
ƒ
Der Prototyp sollte die folgenden Anforderungen erfüllen:
ƒ
Informationsgehalt ƒ
ƒ
Übersichtlichkeit /Skalierbarkeit
ƒ
ƒ
Intuitiv verständlich, geringer Lernaufwand
Implementierbarkeit
ƒ
Abschlusspräsentation
Leicht erweiterbar und gut einbindbar (z.B. in DAFFODIL)
Verständlichkeit/Einfachheit ƒ
ƒ
Handling von großen Datenmengen
Erweiterbarkeit ƒ
ƒ
Alle sinnvolle Informationen werden visualisiert oder durch Operationen zugänglich gemacht
In der vorgegebenen Zeit mit den zur Verfügung stehenden Teilnehmern realisierbar
Visatt: WS07/08
5 / 22
Gliederung
ƒ
ƒ
1. Einleitung
ƒ
Motivation
ƒ
Ziel
ƒ
Anforderungen
2 Di N t
2. Die Netzwerkvisualisierung
k i li i
ƒ
ƒ
ƒ
ƒ
ƒ
Idee
Realisierung
I
Integration in DAFFODIL
i i DAFFODIL
Probleme & Verbesserungen
g
3. Programmdemo & Diskussion
Abschlusspräsentation
Visatt: WS07/08
6 / 22
Die Netzwerkvisualisierung: Idee
ƒ
Idee:
ƒ
ƒ
ƒ
ƒ
Bilde Schlüsselwörter auf Knoten ab und ordne diese kreisförmig an
Verbinde Schlüsselwörter/Knoten falls diese Schlüsselwortkombination
Verbinde Schlüsselwörter/Knoten falls diese Schlüsselwortkombination existiert
Knoten sind um so dicker, desto öfter der Term vor kommt
Führe Operationen aus, um Informationen zu extrahieren
p
,
ƒ
Wähle einen Schwellenwert
ƒ
ƒ
Wähle einen Slider Wert
ƒ
ƒ
Der angibt ob Paare , Tripel etc. visualisiert werden sollen
Schlüsselwörter sollen ein‐/ausgeblendet und zusammengefasst werden können
ƒ
Abschlusspräsentation
der aussagt, dass nur Schlüsselwörter visualisiert werden, die häufiger als der Schwellenwert vorkommen
Schwellenwert vorkommen
z.B.: model und models
Visatt: WS07/08
7 / 22
Die Netzwerkvisualisierung: Idee
Abschlusspräsentation
Visatt: WS07/08
8 / 22
Die Netzwerkvisualisierung: Realisierung
ƒ
Realisierung:
Entnommen aus: Interaktive Systeme von Prof.Dr.–Ing. Jürgen Ziegler
1. Daten (.xml) einlesen/parsen
2. Informationen extrahieren und Objekte instanziieren (z.B.: Dokumente‐ & Schlüsselwortobjekte)
3. Visualisierungsobjekte erzeugen (prefuse)
4. Visualisierungsobjekte rendern
OPERATIONEN*
Abschlusspräsentation
Visatt: WS07/08
9 / 22
Die Netzwerkvisualisierung: Realisierung
Daten
1.
lese/parse gegeben DAFFODIL Datei (.xml)
ƒ
ƒ
Nutzbarer XML‐Inhalt:
Nutzbarer XML
Inhalt:
ƒ
ƒ
Menge von Dokumenten (Titel, Erscheinungsjahr, Autoren, Abstract)
Menge von Schlüsselwörtern
Verwendete Techniken/Bibliotheken :
ƒ
ƒ
SAX, JDOM/DOM
Analytische Daten
2.
filtere wichtige Daten heraus
instanziiere Java Objekte (Schlüsselwörter, Dokumente)
führe eigene Berechnung für die Vorkommenshäufigkeit durch
ƒ
ƒ
ƒ
Visualisierungsobjekte
3.
Erzeuge Visualisierungsobjekte (Knoten, Kanten)
g
g j
(
,
)
Verwendete Techniken/Bibliotheken:
ƒ
ƒ
ƒ
Abschlusspräsentation
Prefuse.org
Visatt: WS07/08
10 / 22
Die Netzwerkvisualisierung: Realisierung
Änderungen:
ƒ
ƒ
ƒ
Abschlusspräsentation
Verbindungen zwischen Schlüsselwörtern durch Kombinationsknoten realisiert
Liniendicke (statt Knotengröße) symbolisiert Vorkommenshäufigkeit
Visatt: WS07/08
11 / 22
Die Netzwerkvisualisierung: Realisierung
Operationen der Visualisierung:
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
Abschlusspräsentation
Knoten verschieben (Drag&Drop)
Schlüsselwörter/Kombinationen löschen (Popup)
Schlüsselwörter/Kombinationen löschen (Popup)
Highlighting (Mouseover)
Zooming (Mausrad)
T lti (Mouseover)
Tooltip
(M
)
Suche (Textfeld)
Visatt: WS07/08
12 / 22
Die Netzwerkvisualisierung: Realisierung
Weitere Operationen: Slider
ƒ
Einstellung der Kombinationstiefe (Slider)
ƒ
ƒ
Hier: Visualisiere nur Kombinationen, welche mindestens 2 und maximal 4 Terme Hier:
Visualisiere nur Kombinationen, welche mindestens 2 und maximal 4 Terme
symbolisieren
Anpassung der minimalen Vorkommenshäufigkeit (Slider)
ƒ
ƒ
Hier: Visualisiere nur Kombinationen die mindestens 24 mal vorkommen
2er Kombination
3er Kombination
4er Kombination
Abschlusspräsentation
Visatt: WS07/08
13 / 22
Die Netzwerkvisualisierung: Realisierung
ƒ
Weitere Operationen: Term/Schlüsselwortliste
Sortierungg
Schlüsselwort
(ein‐/ausblenden)
Zu Favoriten hinzufügen
Schlüsselwörter zusammenfassen/lösen
Schlüsselwörter anzeigen/verstecken
Abschlusspräsentation
Visatt: WS07/08
14 / 22
Die Netzwerkvisualisierung: Realisierung
Weitere Operationen: Favoritenliste
ƒ
ƒ
ƒ
ƒ
ƒ
Abschlusspräsentation
Favorisierte Schlüsselwörter können in einer Liste zusammengefasst werden
Liste kann abgespeichert und bei zukünftigen Visualisierungen hinzu geladen
Liste kann abgespeichert
und bei zukünftigen Visualisierungen hinzu geladen
werden
Mehre Listen können zusammengefasst werden
Operationen der Termliste
p
sind über ein Popup zugänglich (z.B.: Terme p p g g
(
zusammenfassen)
Visatt: WS07/08
15 / 22
Die Netzwerkvisualisierung: Realisierung
Weitere Operationen: Dokumentenexport
ƒ
Zu einzelnen Schlüsselwörtern oder Schlüsselwortkombinationen können p
(
)
Dokumentlisten exportiert werden (.XML)
Die Schlüsselwörter werden farbig markiert (im Titel und Abstract) und in ihre Kontextumgebung abgebildet (KWIC)
Einzelnen Dokumente können deselektiert werden und sind dann nicht mehr T il d
Teil der exportierten .XML‐Datei
i
XML D i
ƒ
ƒ
ƒ
ƒ
Abschlusspräsentation
So können Dokumente aus unterschiedlichen Suchprozessen zu einer Menge von Dokumenten zusammengefasst werden (Berry‐Pick)
Visatt: WS07/08
16 / 22
Die Netzwerkvisualisierung: Realisierung
Abschlusspräsentation
Visatt: WS07/08
17 / 22
Die Netzwerkvisualisierung: Integration Daffodil
Personal Library: Favoritenintegration
Dokumentenliste unverändert
Visualisierungs Tab
Abschlusspräsentation
Visatt: WS07/08
Terme & Kombinationslisten
18 / 22
Die Netzwerkvisualisierung: Probleme & Verbesserungen
ƒ
Unübersichtlichkeit & überdecket Knoten
ƒ
Knoten überdecken sich teilweise
ƒ
ƒ
Bei großer Datenbasis wird der Graph unübersichtlich
ƒ
ƒ
Netz muss per D&D manuell aufgeräumt werden
Focus & Kontextechnik: Hyperbolic
yp
Browser
Direkte Manipulation & Performance
ƒ
Wünschenswert wäre, wenn sich der Graph kontinuierlich mit den Wünschenswert
wäre wenn sich der Graph kontinuierlich mit den
Slidereinstellungen aktualisiert
ƒ
ƒ
Abschlusspräsentation
Ist auf Grund der langsamen Performance leider nicht umsetzbar
Bei ungünstigen Slidereinstellungen (z.B. große Kombinationsspanne & kleine minimale Vorkommenhäufigkeit) benötigt das Programm viel Rechenzeit
ƒ
Algorithmus optimieren
ƒ
Ungünstige Werte abfangen
Visatt: WS07/08
19 / 22
Die Netzwerkvisualisierung: Probleme & Verbesserungen
ƒ
Ungenauigkeit & keine bzw. zu wenig Informationen
Es wird nur unterschieden ob ein Schlüsselwort im Dokumente vorhanden ist oder nicht (Boolesches‐Retrieval). Diese Werte stützen sich nur auf Titel und d
i ht (B l h R t i l) Di
W t tüt
i h
f Tit l d
Abstract
ƒ
ƒ
Einbindung von externen Quellen um weitere Informationen zu erhalten
ƒ
ƒ
ƒ
z.B.: Einbindung von Webservices oder Datenbanken die Inhaltsverzeichnis o.ä. Inhalte liefern (möglich durch XML‐Cocoon) Vektorraum‐Retrieval
Exportierung
Die Dokumentenlisten werden momentan in XML ausgegeben
ƒ
ƒ
ƒ
Abschlusspräsentation
Durch XSLT kann hier in weitere Formate (z.B. html, pdf…) exportiert werden
D
h XSLT k
hi i
i
F
( B h l df )
i
d
Weitere Dokumentinformationen können durch XML‐Cocoon eingebunden werden
Visatt: WS07/08
20 / 22
Die Netzwerkvisualisierung: Probleme & Verbesserungen
ƒ
Weiteres
ƒ
Das Zusammenfassen von Schlüsselwörter ist momentan nur in der Termliste
möglich. Intuitiver ist allerdings das Zusammenfassen im Graphen
ö li h I t iti
i t ll di
d Z
f
i G h
ƒ
z.B. mit D&D
ƒ
„Zurück Funktion“ (vgl. Browser) die aktuelle Änderung rückgängig macht
ƒ
Erweitere das Konzept durch weitere Attribute (DA)
Abschlusspräsentation
ƒ
Autoren
ƒ
Veröffentlichungsjahr
Visatt: WS07/08
21 / 22
Gliederung
ƒ
ƒ
ƒ
1. Einleitung
ƒ
Motivation
ƒ
Ziel
ƒ
Anforderungen
2. Die Netzwerkvisualisierung
ƒ
Idee
ƒ
Realisierung
ƒ
Integration in DAFFODIL
ƒ
Probleme & Verbesserungen
3. Programmdemo & Diskussion
g
Abschlusspräsentation
Visatt: WS07/08
22 / 22
Herunterladen