CoCoVIS - Final Report

Werbung
CoCoVIS - Final Report
Jakob Hirschl∗
Lukas Moshuber†
Jakob Moosbrugger‡
a1209758
a1226124
a1401768
Z USAMMENFASSUNG
In dieser Arbeit präsentieren wir CoCoVIS, ein VisualisierungsTool für die Daten, die von CoConUT produziert werden. CoCoVIS
basiert auf Tableau und die verwendeten interaktiven Diagramme
wurden durch die Analyse der Daten und den Wünschen von Experten erstellt. Ziel ist es, eine visuelle Interpretation von bei Feldstudien gesammelten Daten zu ermöglichen. Die verwendeten Diagramme werden detailliert, mit dem Zweck den sie erfüllen sollen,
vorgestellt. Anschließend werden auch Beispiele näher gebracht,
wie diese verwendet werden können, um die Daten zu analysieren.
Um die Visualisierung zu verifizieren, wurde eine Usability Studie
um das Interface zu analysieren und eine weitere Studie die genauer auf die Funktionalität der Diagramme einging durchgeführt.
Zuletzt werden die Ergebnisse der Studie sowie die Erkenntnisse
aus den Testdaten aufgelistet und die Anwendung nochmal kritisch
beleuchtet.
1
M OTIVATION
1.1
CoConUT APP
Die Applikation CoConUT wurde im Wintersemester 15/16 im
Rahmen einer Bachelorarbeit entwickelt. Sie fokussiert sich auf das
Sammeln von Daten bei Feldstudien im Bereich Mobile-HCI und
ist im Augenblick für Android verfügbar. Es werden unter anderem
GPS Daten gesammelt, um den Ort und die Geschwindigkeit zu erfassen. Um die Daten auszuwerten, gibt es in der Applikation noch
keine wirklich effiziente Lösung. Eine sehr einfache, überladene Visualisierung (für das eher kleine Smartphone Display) ist bisher implementiert. Die Motivation besteht darin, eine ordentliche Visualisierung für diese durchaus interessanten und wichtigen Daten zu
ermöglichen.
1.2
Problemstellung und Ziele
Wie im Teil CoConUT APP weiter ausgeführt wird, sind die bisherigen Visualisierungen der Daten nur wenig hilfreich (schlechte Usability), überladen (zu viele Daten auf kleinem Platz) und zu
simpel um die Daten auf eine angemessene Art lesen zu können.
Das Ziel ist es, die Daten auf eine angemessene, für den Forscher
hilfreiche und übersichtliche Art darzustellen. Dafür müssen einige
Probleme bewältigt werden:
• Die Daten werden von Sensoren des Smartphones gesammelt. Diese sind teilweise sehr noisy“ und müssen unbedingt
”
geglättet werden, um eine sinnvolle Auswertung der Daten zu
ermöglichen. Es ist geplant, dies mit Hilfe eines benutzerdefinierten Moving Average zu lösen.
• Die Daten sind in einer MongoDB (Datenbank, die mit JSON
Objekten arbeitet) gespeichert. Es muss ein Weg gefunden
werden, diese auf guten Weg zur Verfügung zu stellen, zum
∗ e-mail:
[email protected]
[email protected]
‡ e-mail: [email protected]
† e-mail:
Beispiel über die Anbindung einer Datenbank oder das Herunterladen der Daten in ein Excel-File.
• Die Daten sind schwer interpretierbar und leicht fehlerhaft zu
verstehen. Sie müssen also auf eine Art dargestellt werden, die
dies auch kommuniziert und dabei trotzdem eine gute visuelle
Interpretation ermöglicht.
1.3 Aufgaben der Visualisierung
Um das Ziel zu erreichen, muss die Anwendung bestimmte Aufgaben lösen können. Folgende Tasks muss das Tool erfüllen, damit
eine Zielperson die Kontaktdaten analysieren kann:
• Overview: Einen Überblick über die Daten bekommen. Wie
viele Sessions, User Studies, etc. gibt es? Wie ist der ungefähre Trend der Messwerte? Sind alle Sessions gleich lange?
• Zoom: Möglichkeit in Studien herein und heraus zu zoomen.
• Filter: Uninteressante Studien, Sessions etc. ausblenden oder
auch nach Ort und Zeit zu filtern.
• Detail: Möglichkeit unterschiedliche Detailgrade der Messwerte zu betrachten.
• Relate: Einen Zusammenhang zwischen zwei Sensoren finden
oder z.B. Studien miteinander vergleichen zu können.
1.4 Zielpersonen
Zielpersonen dieser Visualisierung sind alle, die CoConUT verwenden, um Kontextdaten bei der Benutzung des Mobilgerätes
zu sammeln. Dabei liegt unser Fokus bei Forschern aus dem Bereich (Mobile) HCI (Human Computer Interaction), die Feldstudien
durchführen um mehr Wissen über den Einfluss von Kontextdaten
bei verschiedensten Applikationen zu erhalten. Die Visualisierung
soll aber auch für andere hilfreich sein, die ähnliche Daten zu einem anderen Zweck analysieren wollen (wie z.B. die Messung von
Licht und Lautstärke an bestimmten Orten).
1.5 Daten
Die Daten von CoConUT sind in Form eines JSON Objektes abgespeichert. Dieses beinhaltet Metadaten, welche Informationen über
die Aufnahmesession an sich beinhalten und Messwerte der Sensoren inklusive Timestamp. Folge Metadaten sind vorhanden:
• id: Eindeutige Identifikation der Session (wird automatisch
erstellt).
• deviceID: Eindeutige Identifikation des Mobilgerätes.
• deviceType: Typ des Mobilgerätes (z.B. SM-G900F entspricht Samsung Galaxy S5).
• sessionID: Eindeutige Identifikation der Session am Mobilgerät (wird automatisch erstellt) nicht eindeutig wenn mehrere Mobilgeräte verwendet werden.
• sessionComment: Kommentar des Users zur Session (z.B.
Tag1, Regen, etc.).
• userStudy: Bezeichnung der Studie (wird vom User gewählt).
• androidVersion: Android Version (sdk, z.B. 21).
Folgende Messdaten werden aufgezeichnet:
• Timestamp: Unix-Timestamp
• GPS, eine Messung bestehend aus:
– Geschwindigkeit
– Längengrad (Longitude)
– Breitengrad (Latitude)
– Genauigkeit (Accuracy)
• Bluetooth: Anzahl der Bluetooth-Geräte, die zum Zeitpunkt
der Messung in der Nähe waren, um ein ungefähres Bild über
den sozialen Kontext zu erhalten
• Interaction: Anzahl der Touch-Interaktionen seit der letzten
Messung
• Light: Lichtstärke in Lux
• Noise: Lautstärke in Dezibel (sehr ungenaue Messwerte)
Bei den Messdaten handelt es sich also ausschließlich um Ortund Zeit-bezogene quantitative Daten, während die Metadaten
hauptsächlich aus kategorischen Daten bestehen.
2
V ERWANDTE A RBEITEN
Auch andere wissenschaftliche Arbeiten haben sich bereits mit der
Visualisierung von Kontextdaten näher auseinandergesetzt. In [4]
wird eine Methode vorgestellt, Sensordaten mit Ort- und Zeitinformationen darzustellen, in diesem Paper wurde dies mittels gestackten Graphen über einer 2D-Karte gelöst. Diese Technik wird
in [1] verwendet um Daten von diversen Sensoren darzustellen.
Im Gegensatz zu diesen Arbeiten werden die Daten bei CoCoVIS
nicht als 3D-Maps dargestellt, sondern in separaten Diagrammen.
Ähnlich zu [3], werden ebenfalls mehrere Datensätze entweder separated oder grouped dargestellt. Wobei die Daten nicht in einem
großen Diagramm dargestellt werden, sondern auf mehrere Diagramme aufgeteilt werden.
3
A NSATZ
Von Anfang an wurden die Daten analysiert und Prototypen für Diagramme erstellt, welche die Daten möglichst gut und auf verschiedene Arten darstellen. Dabei haben wir uns an folgende Vorgaben
der Zielpersonen gehalten:
• Zeit und Ort sind besonders wichtige Faktoren, Rückschlüsse
auf den Ort müssen bei jedem Sensor leicht möglich sein.
• Es sollen einzelne Sessions betrachtet werden können, um sie
untereinander zu vergleichen.
• Es sollen alle Sessions als Gruppe betrachtet werden können,
um Mittelwerte einfach und schnell ermitteln zu können.
• Eine Glättung der Kurven (Moving Average) muss einfach
einstellbar sein, um Trends besser herauslesen zu können.
• Das Tool wird für kleinere Studien verwendet werden, in Zahlen etwa 10 bis 15 Sessions, das bedeutet, die Liste soll diese
Anzahl gut sichtbar und übersichtlich abbilden.
Die Diagramm-Prototypen wurden evaluiert und die aussagekräftigsten wurden ausgewählt. Für den ersten Prototyp wurde der
Fehler gemacht, dass zu viele Diagramme in verschiedenen Tabs
mit teilweise zu wenig oder redundanter Information dargestellt
wurden. Auch die Interaktionen waren unschlüssig und teilweise
unnötig (z.B. Wechseln zwischen Tabs, Auswahl der Kategorien in
Tab 1 mit Auswirkung auf die anderen Tabs oder ein Scatterplot
mit Auswahl der darzustellenden Werte). Durch Gespräche mit den
Lehrveranstaltungsleitern wurde ein zweiter Prototyp erstellt, dessen Ziel es war, möglichst effizient, ohne Wiederholung der Informationen und vor allem in einem einzelnen Tab, alle Daten zu kommunizieren. Dafür wurden die verschiedenen Diagramme durch intuitive Interaktionen ersetzt und die Diagramme selbst kompakter
dargestellt (z.B. Scatterplot Matrix anstatt einem Scatterplot der
zusätzliche Informationen benötigt).
3.1
Beschreibung der Visualisierung
Die finale Visualisierung besteht aus 4 unterschiedlichen Diagrammen:
1. Tabellendiagramm: Die Tabelle zum Auswählen einzelner
Untergruppierungen oder einzelner Sessions. Der Balken auf
der rechten Seite zeigt, wie lange der Datensatz ist (nachdem
einzelne Sessions verschieden lang sein können) (Abbildung
4).
2. Scatterplot Matrix: Die Scattermatrix, in der alle gemessenen Sensoren gegeneinander aufgetragen werden, um explorativ nach Korrelationen und Abhängigkeiten zu suchen. Zum
Beispiel, ob die Helligkeit Einfluss auf die Anzahl der Interaktionen mit dem Smartphone hatte. Als Unterstützung wurde
eine Regressionsgerade hinzugefügt, um Korrelationen besser
zu finden und auch deren statistische Signifikanz (Abbildung
5).
3. Sensor Plots: Mehrere Linienplots, in denen jeweils ein Sensor in Abhängigkeit der Zeit aufgetragen ist. Zu sehen sind
immer alle ausgewählten Sessions. Abhängigkeiten zwischen
Zeit und Ort können über die Karte einfach nachverfolgt werden. Gewechselt kann zwischen der Ansicht aller Sessions
einzeln, sowie der Ansicht einer Untergruppe von Sessions
gruppiert (mit dem Mittelwert der gemessenen Daten). Einzelne Sessions können im Liniendiagramm ausgewählt werden, um sie hervorzuheben und leichter mit dem Rest der Sessions vergleichen zu können (Abbildung 6, 7).
4. Karte: Die Linienplots mit einer markierten Session. In diesem Beispiel (siehe Abbildung 6, 7) wird gerade überprüft,
an welchem Ort der Einbruch der Geschwindigkeit passiert.
Auf der Karte wird mit einem Punkt angezeigt, wo sich die
ausgewählte Stelle im zeitlichen Verlauf örtlich befindet.
Außerdem gibt es noch ein Interface um bestimmte Diagramme
zu manipulieren (Abbildung 2, 3):
• Die beiden Listen in Abbildung 2 ermöglichen es die beiden
Kategorien, nach der die Tabelle sortiert ist, zu verändern.
• Die “Single Choice“ Liste in Abbildung 3 ermöglicht es beim
Sensor Plot entweder nach Kategorie 1 aus Abbildung 2 zu
gruppieren, oder alle einzelnen Teile von Kategorie 2 anzuzeigen.
• Der Schieberegler direkt darunter in Abbildung 3 ermöglicht
es das Zeitfenster, über dem mit dem Moving Average
geglätteten Sensoren Plot, zu vergrößern.
• Zuletzt in Abbildung 3 befindet sich eine Farblegende.
3.2 Begründung für die Visualisierung
Wie bereits beschrieben hat es länger gebraucht, bis wir die Daten
vollständig verstanden hatten. Das gesammelte Verständnis und die
vorher erwähnten Vorgaben der Zielpersonen haben uns, unterstützt
von den Lehrveranstaltungsleitern, zu diesem Ergebnis gebracht.
Die Tabelle soll als Übersicht und bei der Filterung der verschiedenen Kategorien helfen, während das Kartendiagramm und das Sensoren Diagramm zusammen mit ihrer wechselseitigen Interaktion
die Abhängigkeit von Ort und Zeit näher bringt. Die Glättung mittels Moving Average war auch explizit gewünscht. Mit den Filtern
und mit der Scatterplot Matrix ist es letztendlich möglich, Sessions
einzeln oder in der Gruppe zu betrachten.
4 I MPLEMENTIERUNG
4.1 Plattform
Zur Implementierung wurde Tableau verwendet, daher waren keine
weiteren Toolkits oder Plattformen notwendig.
4.2 Herausforderungen
Tableau setzt leider einige feste Grenzen, wodurch in diesem Projekt einige Probleme und Herausforderungen aufgetreten sind. Leider konnten nicht alle davon gemeistert werden.
• Datenbank-Kommunikation: Tableau hat nur Möglichkeiten
sich mit einem SQL basierten Server zu verbinden. Da die Daten in einer MongoDB gespeichert sind, ist diese nicht kompatibel mit Tableau. Auch das standardisierte Format JSON
kann von Tableau nicht gelesen werden. Die Kommunikation hätte also nur mit einem Web Data Connector von Tableau vom JSON Format in ein Excelformat umgebaut werden
können. Da diese Kommunikation nicht verschlüsselt werden konnte, wurde die Methode wieder zur Seite gelegt. Diese Herausforderung konnte nicht gelöst werden. Die Daten
mussten mit einem Hilfsprogramm ins Excelformat konvertiert werden.
• Kategoriewechsel und Gruppierung: Es hat sehr lange gebraucht, bis eine Möglichkeit gefunden wurde um einen
Wechsel zwischen Kategorien und einem Wechseln der Darstellung anderer Diagramme zwischen verschiedenen Kategorien zu ermöglichen. Vor allem im ersten Prototypen waren
die verschiedenen Tabs ein großes Hindernis. Die Herausforderung konnte mit Hilfe von Parametern in Tableau und dem
Wechsel auf eine einzige Seite gelöst werden.
• Kommunikation von örtlichen Daten: Es war ursprünglich geplant, die Daten auf der Karte nicht als Folge von Punkten,
sondern als Pfad darzustellen. Tableau bietet an dieser Stelle leider keine Möglichkeit (oder sie wurde nicht gefunden).
Dieses Problem konnte leider nicht gelöst werden.
• Tableau-Aktionen: Die Möglichkeiten der Aktionen in Tableau sind sehr begrenzt. Es gibt eigentlich nur Filterung und
Hervorhebung. Das Projekt konnte aber trotz der sehr eingeschränkten Möglichkeiten mit etwas komplexeren Lösungen
realisiert werden.
5 E RGEBNISSE
5.1 Verwendungsszenarien der Implementierung
Die Verwendungsszenarien sind durch die Vielfältigkeit der Daten
sehr verschieden. Die Zieltasks sind in der Motivation beschrieben, jedoch nicht nur auf diese beschränkt. Jeder Benutzer wird die
Visualisierung vermutlich unterschiedlich verwenden, da jeder die
Daten anders betrachten möchte. In Folge werden zwei Szenarien
beschrieben, die bei einer visuellen Interpretation der Daten vorkommen können.
5.1.1
Szenario 1:
1. Betrachten der Daten im Sensor Plot (Abbildung 8).
2. Daten glätten, um einen besseren Blick auf Trends zu bekommen (Abbildung 9).
3. Markieren der auffälligen Stelle, an der es deutlich heller ist
(Abbildung 10).
4. Betrachten der Daten im Kartendiagramm, um den Grund für
die Helligkeit zu finden (Abbildung 11).
5.1.2
Szenario 2:
1. Filtern der Session von Interesse im Tabellendiagramm (Abbildung 12).
2. Betrachten der Scatterplot Matrix
Abhängigkeiten zu finden (Abbildung 13).
um
mögliche
3. Genauere Analyse der statistischen Signifikanz mit Hilfe der
Regressionsgerade (Abbildung 14).
5.2
Performance des ’High-Fidelity’ Prototypen
Im Allgemeinen läuft der Prototyp schnell und effizient. Die wenigsten Dinge benötigen mehr als 1-2 Sekunden bis sie durchgeführt wurden. Lediglich der Tausch von Kategorien kann sehr
lange dauern (abhängig von Kategorie zu der gewechselt wird), da
teilweise die komplette Struktur der Daten in Tableau geändert werden muss.
5.3
Usability Studie
Für die Evaluierung der Usability wurde eine kleine Studie mit 5
Personen durchgeführt. Diese waren nicht Teil der Zielgruppe und
sollten ausschließlich die Usability des Prototypen evaluieren, ohne näheres Verständnis für die Daten zu haben. Sie kannten sich
meist gut mit Design im Allgemeinen aus, aber nicht mit Visualisierung und Feldstudien. Nach einer kurzen Erklärung der Anwendung, wurden den Testpersonen mehrere Aufgaben bezüglich
der Verständlichkeit des Interface gestellt. So wurden sie zum Beispiel darum gebeten, die Sensorwerte zu glätten oder einen gewissen Filter zu aktivieren. Dabei ist aufgefallen, dass Tableau selbst
das hauptsächliche Problem der Testpersonen war. So wussten einige nicht, wie man in Tableau einen Filter deaktiviert. Nach einer
kurzen Einschulung in Tableau schlugen sie sich deutlich besser.
Die einzigen Probleme, die recht häufig aufgetreten sind, waren die
Suche nach einer Möglichkeit die Kategorien zu ändern (sie haben
versucht dies direkt im Diagramm zu lösen anstatt auf die rechte
Leiste zu achten) und bei der Verwendung des Moving Average, da
sie das Konzept der Glättung nicht verstanden haben. Alle anderen
Aufgaben wurden mit Leichtigkeit oder nach einer kurzen Suche
geschafft. Die Testpersonen bewerten die Anwendung im Allgemeinen als hilfreich (mit der Anmerkung nicht für mich aber für
”
Fachpersonen“) und effizient. Sie merkten auch an, dass die Menge an für sie unverständlichen Daten verwirrend war. Die restliche
Kritik betraf Dinge, die in Tableau nicht anders umsetzbar sind, wie
zum Beispiel die Art der Selektion und die verzögerte Anzeige von
bereits erledigten Aktionen.
Nach Auswertung des Ergebnisses, wurde die Interface Leiste auf die linke Seite verschoben, damit diese schneller gefunden
werden kann. Die Probleme der Testpersonen mit Tableau konnten
natürlich nicht behoben werden, diese sind aber nach einer kurzen
Einschulung kaum mehr aufgetreten. Auch das Unverständnis vom
Moving Average wurde nicht weiter betrachtet, da das Verstehen
gewisser Konzepte Voraussetzung für die Verwendung der Anwendung ist.
5.4 Funktionalitätsstudie
Im Anschluss wurde die Visualisierung noch 3 Personen vorgestellt, die bereits Feldstudien durchgeführt haben und ein tieferes
Verständnis der Daten und Visualisierung im Allgemeinen (auch
mit Tableau) haben. Die Form der Studie war deutlich lockerer als
die Usability Studie. Es gab keinen konkreten Fragebogen, es handelte sich mehr um ein Gespräch über die Daten und was die Visualisierung leisten kann und soll. Dabei wurde Kritik als auch Lob
vom Testleiter festgehalten. Im Allgemeinen wurde die Visualisierung als angenehm, hilfreich und überzeugend beschrieben. Es gab
aber natürlich auch einige Kritikpunkte:
• Die Scatterplot Matrix ist zwar sehr hilfreich und sagt viel
über die Daten aus, ist aber zu klein um Details zu erkennen. Die Teilnehmenden würden sich einen Zoom auf Teile
der Matrizen wünschen (Mouseover ist bei dieser Gelegenheit
öfter gefallen), um besonders interessante Teile der Daten genauer betrachten zu können.
Stärken:
• Die Visualisierung zeigt sehr gut den örtlichen und zeitlichen
Zusammenhang der Daten.
• Zusammenhänge lassen sich mit der Scatterplot Matrix und
den Regressionsgeraden meist leicht nachvollziehen.
• Der Kategoriewechsel und die Filterung nach diesen funktioniert sehr gut.
• Der Zoom in einzelne Überkategorien ist sehr hilfreich, um
fehlerhafte Daten zu finden.
• Die Interaktion von Sensor Plots zur Karte ist nützlich um für
Auffälligkeiten in den Daten ein Gebiet zu finden. So können
wiederum leicht örtliche Zusammenhänge hergestellt werden.
Schwächen:
• Die Teilnehmer sind nicht ganz zufrieden mit dem wechselseitigen Filter. So fänden sie es deutlich nützlicher wenn, egal
wo selektiert wird, der Filter auf beide Diagramme (Sensor
Plot und Karte) wirkt. Außerdem fanden sie bei Selektierungen im Kartendiagramm die Werte etwas irritierend. Nach einer kurzen Erklärung haben sie die Bedeutung des Filters gut
verstanden. Sie meinten dennoch, dass sie wohl nur den Filter
in die andere Richtung (durch Sensor Plots die Karte) verwenden würden.
• Es fehlen einige Interaktionen und Filter, die für die Analyse
der Daten sehr hilfreich wären (z.B. leichtes Filtern von fehlerhaften Daten).
• Sie würden sich auf der Karte eher Pfade anstatt der Punkte
wünschen, da es so nicht sehr leicht möglich ist mehr als einen
Pfad zu folgen.
Insgesamt halten die Zielpersonen die Visualisierung für gelungen
und hilfreich für die Analyse der Daten, die mit CoConUT produziert werden.
Es gab aber auch positive Kommentare:
6.2 Erkenntnisse
Gemeinsam mit den Experten konnten einige sehr interessante Erkenntnisse über die Daten gewonnen werden:
• Das Tabellendiagramm mit der Möglichkeit des Kategoriewechsels wurde gelobt. Die Testpersonen empfanden die Selektion verschiedener Kategorien als intuitiv und leicht. Beim
Kategoriewechsel wurde großteils angemerkt, dass dies eine
tolle Möglichkeit bietet um verschiedene Blickwinkel auf die
Daten zu ermöglichen. Die teilweise lange Dauer des Kategoriewechsels ist nicht sehr negativ aufgefallen.
• Die Regressionsgeraden in der Scatterplot Matrix sind eine
große Hilfe um die Daten korrekt zu interpretieren. So gab
es bei der Interpretation der Daten nicht nur Bestätigung von
Vermutungen, sondern auch einige sehr überraschende Erkenntnisse (siehe Kapitel Erkenntnisse).
• Auch wenn die Testpersonen nicht besonders vom Kartendiagramm begeistert waren, so lobten sie die Möglichkeit
beim Sensor Plot einen örtlichen Zusammenhang über das
Kartendiagramm erhalten zu können. Das half ihnen, um
Auffälligkeiten in den Daten zu bewerten.
• Den Wechsel zwischen Grouped und Separated fanden die
Experten äußerst hilfreich. Der Grund dafür war, dass man
dadurch nicht nur die Möglichkeit hat zu vergleichen, sondern auch die Möglichkeit hat, in einzelne, in diesem Fall, Tage einen detaillierten Einblick zu bekommen, um gravierende
Abweichungen zwischen den einzelnen Personen feststellen
zu können. Damit könnten diese zum Beispiel herausgefiltert
werden.
6 D ISKUSSION
6.1 Stärken und Schwächen der Implementierung
Wie die meisten komplexeren Visualisierungen hat auch diese ihre
Stärken und Schwächen. Diese konnten sehr gut in der Funktionalitätsstudie gefunden werden.
• Ein Zoom auf die Diagramme wäre sehr hilfreich, um die Daten genau zu betrachten.
• Die Karte erfüllt nicht alle Zwecke, für die sie ursprünglich
gedacht war.
• Zusammenhang zwischen Geschwindigkeit und Interaktionen: Basierend auf der Studie [2] war die Erwartung auch hier
eher einen Zusammenhang ohne Anstieg zu erkennen. Gleichzeitig gab es auch die Vermutung, dass dies wegen der geringeren Anzahl an Interaktionen im höheren Bereich, keine sehr
starke Aussage sein kann. Durch die Visualisierung konnte
das bestätigt werden. So liegt der p-value deutlich über dem
Signifikanzniveau (0,05) bei 0,42 (Daten aus der Berechnung
der Regressionsgerade durch Tableau).
• Helligkeit: Am zweiten Tag war es auf einer ganz bestimmten
Strecke deutlich heller. Nach einer Filteraktion und der Betrachtung der Karte war klar, dass es sich bei dieser Strecke
um die Sensengasse handelte.
• Anzahl der Bluetooth-Geräte: Es wurde festgestellt, dass
am ersten Tag insgesamt mehr Bluetooth-Geräte gemessen
wurden. Hier war die Erwartung, dass am zweiten Tag der
Bluetooth-Sensor eventuell nicht funktioniert hat. Nach einer
genaueren Betrachtung der einzelnen Daten, konnte das Gegenteil festgestellt. Am ersten Tag hat der Sensor ein Mal keine Messungen aufgezeichnet. Die Unterschiede zwischen Tag
1 und 2 sind also noch deutlich größer.
• Einfluss von Bluetooth-Geräten auf Geschwindigkeit und Interaktionen: Durch die Scatterplot Matrix wurde festgestellt,
dass die Anzahl der Bluetooth-Geräte fast keinen Einfluss auf
die Geschwindigkeit oder die Anzahl der Interaktionen hat.
So kann mit hoher Wahrscheinlichkeit gesagt werden, dass
Geschwindigkeit und Interaktionen bei mehreren BluetoothGeräten fast konstant bleiben (p-value von 0,002 und 0,001).
Die Experten haben noch deutlich mehr Information aus den Daten gewonnen. Diese waren jedoch auch ohne Daten bekannt (z.B.
kein Zusammenhang zwischen Licht und Lautstärke), mehr Kommentare als Erkenntnisse (z.B. Moving Average ist eine große Hilfe
um Trends beim Vergleich zu erkennen) oder sehr leicht feststellbar (z.B. am zweiten Tag waren 2 Personen merkbar langsamer).
Durch die Studie konnte auch ein genaueres Verständnis über den
Blick der Zielpersonen auf die Daten gewonnen werden.
• Wie erwartet verwenden die Experten ausschließlich die Scatterplot Matrix um den Zusammenhang zwischen zwei Sensoren zu finden. Der Sensorenplot hat hier kaum Einsatz gefunden.
• Die Karte wird nicht verwendet um Pfade der Testpersonen
nachzuempfinden, sondern fast ausschließlich um zu erkennen, an welcher Stelle auffallende Messwerte auftreten. Als
Antwort auf die Frage, warum sie das nicht versuchen, kam
die Antwort: ”Die Route kenne ich ja schon”.
• Der Sensor Plot wird hauptsächlich dazu verwendet, um die
gruppierten Linien unterschiedlicher Studien zu vergleichen,
oder um Unterschiede innerhalb der Studien zu erkennen, genau dafür war er auch konzipiert.
• Die Tabelle wird fast ausschließlich verwendet, um einzelne
Studien zu betrachten. Keine Zielperson hat einzelne Sessions
gewählt.
• Das Glätten über den Moving Average wurde ausgiebig genutzt. Meistens haben die Zielpersonen jedoch öfter höhere
Werte verwendet, da sie die lokalen Schwankungen eher weniger interessiert haben.
Insgesamt konnte einiges über die Daten herausgefunden werden. Noch viel interessanter war jedoch der Blick auf diese durch
die Zielpersonen. Es konnte festgestellt werden, dass alle Diagramme außer der Karte den ihnen zugedachten Zweck erfüllt haben.
Die Karte wurde anders verwendet als ursprünglich geplant. Insgesamt erfüllt aber die Visualisierung ihren Zweck und wird von der
Zielgruppe sehr positiv angenommen. Dennoch ist die Arbeit an der
Visualisierung noch nicht beendet. Es gibt immer Möglichkeiten etwas zu verbessern und wir sind definitiv bemüht, das auch weiterhin
zu tun.
L ITERATUR
[1] K. Häb, A. Middel, B. L. Ruddell, and H. Hagen. Travis - a visualization framework for mobile transect data sets in an urban microclimate
context. In 2015 IEEE Pacific Visualization Symposium (PacificVis),
pages 167–174, April 2015.
[2] J. Hirschl. Bursted attention: Collecting context and interaction data
in mobile field studies. Bachelor’s thesis (Studienarbeit), University of
Vienna, Austria, June 2016.
[3] D. Spretke, P. Bak, H. Janetzko, B. Kranstauber, F. Mansmann, and
S. Davidson. Exploration through enrichment: A visual analytics approach for animal movement. In Proceedings of the 19th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems, GIS ’11, pages 421–424, New York, NY, USA, 2011.
ACM.
[4] C. Tominski, H. Schumann, G. Andrienko, and N. Andrienko.
Stacking-based visualization of trajectory attribute data. IEEE Transactions on Visualization and Computer Graphics, 18(12):2565–2574,
Dec 2012.
7
A NHANG
Abbildung 1: Überblick über alle Teile des Diagrams
Abbildung 2: Oberer Teil des Interfaces
Abbildung 4: Tabellendiagram
Abbildung 3: Unterer Teil des Interfaces
Abbildung 5: Scatterplot Matrix
Abbildung 6: Karte
Abbildung 7: Sensor Plots
Abbildung 8: Daten des Sensor Plots mit auffälliger Stelle
Abbildung 9: Glätten
Abbildung 10: Auffällige Stelle markieren
Abbildung 11: Zugehöriges Kartendiagramm
Abbildung 13: Scatterplot Matrix mit gefilterten Werten
Abbildung 12: Filterung im Tabellendiagram
Abbildung 14: Analyse der Zusammenhänge zwischen Geschwindigkeit und Interaktionen
Herunterladen