Aufgabenblatt – WEKA - emsp.tu

Werbung
Aufgabenblatt – WEKA
Vorbereitung: Nehmen Sie mit den bereitgestellten Aktimetern jeweils einen Datensatz auf der aus
3-4 Aktivitäten à 30sek-1min besteht. Auf die genauen Aktivitäten und Messabläufe einigen wir uns
am Anfang des Termins.
Mögliche Aktivitäten (je nach Temperatur): Gehen, Laufen, Treppe hoch, Treppe runter, Seilspringen,
Jonglieren, . . . weitere Vorschläge willkommen
Aufgabe 1
Überlegen Sie sich und diskutieren Sie 20 Features (Attribute) von denen Sie sich eine gute Trennung
der drei Aktivitäten erhoffen. Einfache Beispiele hierfür wären z.B. Mittelwert von Kanal X,
Standartabweichung des Z-Kanals oder Maximaler Frequenzanteil im Y-Kanal. Und speichern sie
diese zusammen mit den 2 Klassen Aktivität und Name im WEKA ARF-Format. Benutzen Sie hierzu die
gegebene GUI und ergänzen Sie ihre Features in der Datei GetFeatures.m.
Hinweis: Das ARF-Format sieht folgendermaßen aus:
@RELATION
@ATTRIBUTE
@ATTRIBUTE
@ATTRIBUTE
@ATTRIBUTE
accData
accx_min
accy_max
name
activity
@DATA
1, 2, Maik, activity1
4, 5, Steffen, activity3
6, 5, Maik, activity2
% Name des Datensatzes
NUMERIC
% Verschiedene Attribute bzw. Messgrößen
NUMERIC
% Nominal Attribute können Werte aus
{Steffen,Maik)
% den angegebenen Klassen annehmen
{activity1, activity2, activity3}
% Die Daten sind einfache CSVs
% Jede Zeile entspricht einer neuen Instance
% bzw. Abtastung / Realisierung
Aufgabe 2
Laden Sie die Daten im WEKA-Explorer und betrachten Sie die einzelnen Attribute. Können Sie
einzelne Attribute identifizieren, mit denen die einzelnen Aktivitäten eines Datensatzes einer Person
unterschieden werden können.
Aufgabe 3
Verwenden Sie die Klassifikatoren J48 (trees), Naive Bayes (bayes) und Multilayer Perceptron
(functions) im Tab Classify mit den Standardeinstellungen um die verschiedenen Aktivitäten zu
unterscheiden. Wie schneiden sie im Vergleich zueinander ab? Welche Attribute werden verwendet?
Visualisieren Sie die verschiedenen Klassifikatoren. Speichern Sie die Ergebnisse.
Aufgabe 4
Unter „Test options“ im Tab Classify sind verschiedene Aufteilungen in Trainings- und Testdatensätze
möglich, recherchieren und erläutern Sie diese kurz.
Aufgabe 5
Wählen Sie im Tab „Select attributes“ die beiden Evaluators „InfoGainAttributEval“ und
„FilteredSubsetEval“ aus und akzeptieren Sie die beiden vorgeschlagenen Methoden („Greedy“ bzw.
„Ranker“) wozu dienen diese Evaluatoren?
Welche Attribute schlagen die beiden Algorithmen vor? Entfernen Sie alle Attribute bis auf die
vorgeschlagenen (FilteredSubset.) / bis auf die ersten n (n variable, GainRation.) vergleichen Sie die
neuen Ergebnisse der 3 Klassifikatoren. Wurden die gleichen Attribute vorgeschlagen? Speichern Sie
die Ergebnisse.
Aufgabe 6
Nun soll zusätzlich zu den verschiedenen Aktivitäten auch zwischen den einzelnen Personen die diese
Aktivitäten ausgeführt haben unterschieden werden.
Ergänzen Sie das ARFF-File um die Daten von mindestens 2 weiteren Personen und führen Sie die
Klassifikationen nach Aktivität und zusätzlich nach Namen durch.
Welche Attribute werden hier verwendet? Vergleichen Sie diese mit den Ergebnissen und Attributen
aus Aufgabe 3. (Hinweis: WEKA zeigt die Ergebnisse aller vergangenen Experimente in der Result list
an. Sollten Sie nicht mehr verfügbar sein können sie die gespeicherten Werte laden)
Können hier alle Algorithmen das Attribut „name“ für die Bestimmung der Aktivität verwenden?
Warum könnte dies Problematisch sein? Welche Algorithmen können dies?
Speichern Sie die Ergebnisse.
Aufgabe 7
Neben der Möglichkeit der Klassifikation mit Neuronalen Netzen können diese auch verwendet
werden um verschiedene Features zu schätzen. Hierzu können Sie unter ‚Classify‘ / ‚More options‘
einen Haken bei ‚Output predictions‘ setzen. Betrachten sie die Schätzungen verschiedener Features.
Wie gut sind die Korrelationen. Sind die Schätzungen für alle Features gleich gut?
Aufgabe 8
Als finaler Test sollen die Messdaten aller Kursteilnehmer gesammelt und nach Aktivität und Name
klassifiziert werden. Wie gut schneiden die Klassifikatoren mit den von Ihnen gewählten Features ab?
Speichern Sie ihre Ergebnisse.
Abgabe: Speichern Sie alle modifizierten Skripte zusammen mit allen gespeicherten Ergebnissen in
einem Archiv und schreiben sie ein kurzes Protokoll zu den Fragen der Aufgaben 1-8.
Herunterladen