Wissensentdeckung in Datenbanken

Werbung
Wissensentdeckung in Datenbanken
Nr.: 048201
Spezialvorlesung
Dozenten:
Morik , Weihs
Termin:
dienstags 10:15 - 12:00
donnerstags 14:15 -16:00
SoSe 2009
Raum :
Raum :
HS 2 Hörsaalgebäude I
HS 2 Hörsaalgebäude I
Die Vorlesung gibt einen Überblick über das Zusammenspiel von Datenmanagement und
Datenanalyse in großen Datenbanken. Der Prozess der Datenanalyse wird anhand des
CRISP-Modells vorgestellt, eine Unterstützung der Vorverarbeitungs- und Lernschritte bietet
das System Yale.
Für die einzelnen Schritte des Datenanalyseprozesses werden jeweils typische Verfahren
vermittelt. Die Verfahren reichen von einfachen Datenbankoperationen, wie z.B. SQLAnfragen an die Datenbank, bis zu komplexen Datenanalyseverfahren aus Statistik oder
Maschinellem Lernen. Als besonders wichtige Data Mining Methoden werden Klassifikationsund Clustering-Verfahren eingeführt, darunter die k-means-Methode, das Bestimmen von
Entscheidungsbäumen, Assoziationsregeln und die Stützvektormethode. Einen Schwerpunkt
bildet auch die Abschätzung der Glaubwürdigkeit der Ergebnisse mit Hilfe von geeigneten
Testdesigns wie z.B. Kreuzvalidierung oder Bootstrapping.
In den Übungen wird Datenmanagement und Datenanalyse anhand von Daten aus der
Praxis eingeübt.
Interdisziplinäre Veranstaltung
Diese Veranstaltung finden im interdisziplinären Rahmen zusammen mit dem Fachbereich
Statistik statt.
Empfohlene Literatur wird in der Vorlesung bekannt gegeben
U.a.:
Hastie, T., Tibshirani, R., Friedman, J. (2001). The Elements of Statistical Learning. Springer.
Hand, D., Mannila, H., Smyth, P. (2001). Principles of Data Mining. MIT Press.
Witten, I.H., Frank, E. (2001): Data Mining ? Praktische Werkzeuge und Techniken für das
maschinelle Lernen.
Mitchell, Tom (1997): Machine Learning, McGraw Hill, 1997
Skript: Ja (teilweise als Folien)
Erwünschte Mitarbeit der Studierenden:
- Zu jeder Vorlesungsstunde kommen und zuhören!
- Nachbereiten, indem Materialien gelesen und Fragen in der Gruppe diskutiert werden.
Lernziele:
- Verstehen der verschiedenen Fachsprachen
- Kennen der wichtigsten Verfahren
- Überblick über den gesamten Prozess der Wissensentdeckung
- Handhabung verschiedener Werkzeuge
Studiengänge:
Diplom (Element X, XI), Bachelor, Master (Modul Wissensentdeckung)
Sinnvolles Bearbeiten der Übungsaufgaben
Bemerkungen:
Gemeinsame Veranstaltung mit dem Fachbereich Statistik
Erforderliche Kenntnisse:
Vordiplom Informatik
Herunterladen