Data Mining in Forschung und Lehre

Werbung
Data Mining in Forschung und Lehre
– Status Quo und Entwicklungstendenzen –
25. Juli 2002
Dr. Matthias Meyer
[[email protected]]
EFOplan - Seminar für Empirische Forschung und Quantitative Unternehmensplanung
Ludwig-Maximilians-Universität München
Department für Betriebswirtschaft / Munich School of Management
Kaulbachstr. 45 / I • D-80539 München
Tel.: +49-89 - 2180-5640 • Fax: +49-89 - 2180-5651 • eMail: [email protected]
www.efoplan.de
1
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Agenda
Data Mining in der Forschung
Wie viele Lehrstühle beschäftigen sich mit Data Mining?
Aus welchen Fachgebieten kommen die Wissenschaftler?
In welchen Richtungen wird geforscht?
der Lehre
Welchen Stellenwert hat das Data Mining in der Lehre?
Wie sind Lehrveranstaltungen aufgebaut?
Welche Methoden und welche Tools werden behandelt?
Data Mining in Lehre&Forschung ... &Praxis
Fließen Aufgabenstellungen aus der Praxis in Forschung&Lehre ein?
Wie könnten Forschung und Praxis kooperieren?
Künftige Entwicklung
2
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Forschung – Begriffe
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Definitionen
Knowledge Discovery in Databases (KDD): Der gesamte Prozess der interaktiven
und iterativen Entdeckung und Interpretation von nützlichem Wissen aus
Daten.
Data Mining: Anwendung von Algorithmen
zur Extraktion von Mustern
Interpretation/
Evaluation
aus Daten.
Data Mining
Wissen
Datenvorverarbeitung
Datenaufbereitung
Muster
Datenauswahl
Aufbereitete
Daten
Vorverarbeitete
Daten
Ausgewählte
Daten
Daten
3
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Forschung – Anzahl Lehrstühle
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Vorgehen zur Bestimmung des Status Quo in Forschung und Lehre
Internet-Recherche im Hochschulbereich
Betrachtung der Angaben zu Forschung, Lehre und Projekten
In Deutschland beschäftigen sich ca. 40 Lehrstühle aus Betriebswirtschaft, Informatik
und Wirtschaftsinformatik mit Fragestellungen des Data Mining, Web Mining und
KDD.
Data Mining hat sich als Disziplin etabliert, ist aber in den meisten Fällen nicht der
alleinige Forschungsschwerpunkt.
4
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Forschung – Überblick
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Die Betrachtungen beschränken sich auf Lehrstühle aus
Betriebswirtschaft/Wirtschaftswissenschaften (inkl. Statistik),
Informatik und
Wirtschaftsinformatik
Nicht betrachtet wurden
Lehrstühle aus z. B. Medizin,
Biologie, Physik und
Astronomie.
5
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
zunehmend theoriegestützt
Data Mining in der Forschung – „Aufeinandertreffen von Welten“
Experimentelle Forschung
Deskriptive
Forschung
Generierung
Hypothesen
Data Mining
Validierung
Explorative Forschung
Expertenbefragung
Literatursichtung und
Sekundärforschung
zunehmend datengestützt
6
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Forschung – Lehrstühle
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
U. Güntzer, Uni Tübingen
S. Rachev, TU Karlsruhe
R. Reiss, Uni Siegen
A. Unwin, Uni Augsburg
U. Rendtel, Uni Frankfurt
H. Degen, Uni Düsseldorf
B. Erichson, Uni Magdeburg
R. Decker, Uni Bielefeld
L. De Raedt, Uni Freiburg
G. Palm, Uni Ulm
M. Richter, Uni Kaiserslautern
D. Keim, Uni Konstanz
FORWISS, TU München
J. Buhmann, Uni Bonn
H. Kriegel, LMU München
R. Bergmann, Uni Hildesheim
W. Dilger, TU Chemnitz
W. Brauer, TU München
S. Wrobel, Uni Bonn
F. Wysotzki, TU Berlin
R. Studer, TU Karlsruhe
P. Lockemann, TU Karlsruhe
K. Morik, Uni Dortmund
F. Klawonn, FH Emden
M. Schwaiger, LMU München
O. Opitz, Uni Augsburg
K. D. Wilde, KU Eichstätt
W. Gaul, TU Karlsruhe
R. Kruse, Uni Magdeburg
A. Ultsch, Uni Marburg
U. Küsters, KU Ingolstadt
GMD, Team Knowledge Discovery
H. Lenz, HU Berlin
H. Appelrath, Uni Oldenburg
P. Chamoni, Uni Duisburg
M. Spiliopoulou, Uni Leipzig
J. Ruhland, Uni Jena
R. Thome, Uni Würzburg
R. Gabriel, Uni Bochum
P. Mertens, Uni Erlangen
7
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Forschung – Forschungsgebiete/-schwerpunkte
DM in der Forschung
Kapitalmarktforschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung Customer Relationship
Maschinelles Lernen
Multimedia Mining
Management
Bilderkennung
Scannerdatenanalyse
Genomanalysen
Visual Mining
Responseanalyse
Mustererkennung
Cross-/Up-Selling
Graphische Modelle
Kundenwert
Information Retrieval
Web Mining
Data Warehouse/OLAP
8
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Forschung – Forschungsgebiete/-schwerpunkte
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Die Auswahl der Forschungsgebiete ist willkürlich.
Name
P. Chamoni, Uni
Duisburg
R. Gabriel, Uni
Bochum
P. Mertens, Uni
Erlangen
LS-Bezeichnung
Wirtschaftsinformatik und OR
Wirtschaftsinformatik
Angebotssysteme und One-to-One-Marketing
Data Mining
J. Ruhland, Uni Jena
Wirtschaftsinformatik
Knowledge Discovery
in Databases
Database Marketing
Web Usage Mining
(Hyper-)Text Mining
Wirtschaftsinformatik
M. Spiliopoulou, Uni Wirtschaftsinformatik des E-Business
Leipzig
9
25.07.2002
DM-Thema 1
Data Warehouses
R. Thome, Uni
Würzburg
Wirtschaftsinformatik
K. Wilde, KU
Ingolstadt
Wirtschaftsinformatik
DM-Thema 2
OLAP
DM-Thema 3
Homepage nicht aufrufbar (21.7.)
Customer Relationship Web Mining
Management
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining und
Künstliche Intelligenz
Data Mining
Data Mining in der Forschung – Forschungsgebiete/-schwerpunkte
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
10
25.07.2002
Die Auswahl der Forschungsgebiete ist willkürlich.
Name
H. Appelrath, Uni
Oldenburg
R. Bergmann, Uni
Hildesheim
LS-Bezeichnung
Informationssysteme
DM-Thema 1
Data Warehouses
DM-Thema 2
OLAP
Daten und Wissensmanagement
Wissensmanage-ment Fallbasiertes Schließen E-Commerce
W. Brauer, TU
München
Theoretische Informatik und
Grundlagen der KI
Künstliche Intelligenz
J. Buhmann, Uni
Bonn
L. De Raedt, Uni
Freiburg
Mustererkennung und Bildverarbeitung Neuronale Netze
Künstliche Intelligenz
Maschinelles Lernen und
Natürlichsprachliche Systeme
Maschinelles Lernen
Bioinformatik Prediction of Chemical
Carcinogenicity
W. Dilger, TU
Chemnitz
Künstliche Intelligenz
Maschinelles Lernen / Intelligente Agenten
Data Mining
FORWISS, TU
München
Bayerisches Forschungszentrum für
Wissensbasierte Systeme
Raster Data
Management
GMD, Team Knowledge Discovery
Visuelles Data Mining Multimedia Mining
Theoretische
Informatik
U. Güntzer, Uni
Tübingen
D. Keim, Uni
Konstanz
Datenbanken und Informationssysteme Information Retrieval
Datenbanken und Visualisierung
Visuelles Data Mining Informationsvisualisierung
F. Klawonn, FH
Emden
Datenanalyse und Mustererkennung
Fuzzy-Systeme
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
DM-Thema 3
KDD
Assoziationsanalysen
Neuronale Netze
Video/Image
segmentation
Text Mining
Unsicherheit
Clusteranalyse
Data Mining in der Forschung – Forschungsgebiete/-schwerpunkte
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Die Auswahl der Forschungsgebiete ist willkürlich.
Name
H. Kriegel, LMU
München
LS-Bezeichnung
Datenbanksysteme
DM-Thema 1
Knowledge Discovery
in Databases
DM-Thema 2
Zugriffsmethoden für
hochdimensionale
Datenräume
DM-Thema 3
Integration
heterogener
Datenbanken und quellen
R. Kruse, Uni
Magdeburg
Neuronale Netze und Fuzzy-Systeme
Data Mining with
Graphical Models
Fuzzy-Datenanalyse
Neuro-Fuzzy-Systeme
P. Lockemann, TU
Karlsruhe
Systeme der Informationsverwaltung
Wissengewinnung in
Datenbanken
Interaktives
Information Retrieval
Unscharfe Daten in
Produktion, Handel
und Verkehr
K. Morik, Uni
Dortmund
G. Palm, Uni Ulm
Künstliche Intelligenz
Neuroinformatik
Maschinelles Lernen
und Text
Neuroinformatik
Wissensentdeckung in
Datenbanken
Data Mining
M. Richter, Uni
Kaiserslautern
Wissensbasierte Systeme und
Künstliche Intelligenz
Image Mining
Information Retrieval
R. Studer, TU
Karlsruhe
Wissensmanagement
Conceptual Knowledge German Text
Discovery
Exploitation and
Search System
A. Ultsch, Uni
Marburg
Neuro-Informatik und Künstliche
Intelligenz
Data Mining mit
Data Mining mit
neuronalen Methoden Artificial Life
S. Wrobel, Uni Bonn Wissensentdeckung und Maschinelles
Lernen
F. Wysotzki, TU
Methoden der Künstlichen Intelligenz
Berlin
11
25.07.2002
Wissensentdeckung
Maschinelles Lernen
Entscheidungsbäume
und Neuronale Netze
Induktive Konstruktion
v. merkmalsbasierten
und logischen
Klassifikatoren
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Integrated Knowledge
Management
Data Mining in der Forschung – Forschungsgebiete/-schwerpunkte
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
12
25.07.2002
Die Auswahl der Forschungsgebiete ist willkürlich.
Name
R. Decker, Uni
Bielefeld
LS-Bezeichnung
DM-Thema 1
Betriebswirtschaftslehre und Marketing Marketing
DM-Thema 2
Fehlende Werte
DM-Thema 3
KNN
B. Erichson, Uni
Magdeburg
W. Gaul, TU
Karlsruhe
Marketing
Marktforschung
Entscheidungstheorie und
Unternehmensforschung
Data Mining
Multivariate
Analyseverfahren
Web Mining
E-Commerce
H. Lenz, HU Berlin
Produktion, Wirtschaftsinformatik und
Operations Research
Statistische
Datenbanken
O. Opitz, Uni
Augsburg
Statistik und Mathematische
Wirtschaftstheorie
Marktforschung
Prognose
Stochastik
M. Schwaiger, LMU
München
Empirische Forschung und Quantitative Data Mining
Unternehmensplanung
H. Degen, Uni
Düsseldorf
Statistik & Ökonometrie
Data Warehouse
OLAP
U. Küsters, KU
Ingolstadt
Statistik und quantitative Methoden der Data Mining Methoden Computational
Wirtschaftswissenschaften
Statistics
S. Rachev, TU
Karlsruhe
Ökonometrie und Statistik
R. Reiss, Uni Siegen
Initiative für Statistik und Data Mining
U. Rendtel, Uni
Frankfurt
Statistik
A. Unwin, Uni
Augsburg
Rechnerorientierte Statistik und
Datenanalyse
Computational
Statistics
Stochastic,
Econometric and
Statistical Models of
Financial Markets
Visuelles Data Mining Assoziationsanalysen
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Statistische
Prognoseverfahren
Data Mining in der Forschung – Bsp. Forschungsgebiete
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Bsp. Web Mining
Untersuchung des Verhaltens auf Websites
Schaffung einer Basis für adaptive Websites
Verbesserung des Informationsangebots
Bsp. Kapitalmarktforschung
Analyse von Aktienorders auf Kapitalmärkten im Zusammenhang mit
Unternehmensmeldungen und gesamtwirtschaftlichen Faktoren
Bsp. Marketing/Customer Relationship Management
Bestimmung von Cross-/Up-Selling-Potenzialen
Ermittlung des Kundenwerts
Untersuchung des Kauf-/Bestell- oder Beschwerdeverhaltens
13
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Lehre – allgemeine Aussagen
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Umfang
typischerweise VL mit 2 SWS oder VL+Üb mit 2+2 SWS
Themenschwerpunkte
Behandlung ausgewählter Data Mining-Methoden
Zugang oftmals ausgehend von „klassischen“ Informatik-Gebieten
(Datenbanken, Data Warehouses, Maschinelles Lernen, Informationsmanagement, Information Retrieval)
Software-Einsatz
Software wird überwiegend nicht eingesetzt, ansonsten begleitend zur
Vertiefung der VL-Inhalte
eingesetzt wird u. a. SAS Enterprise Miner, SPSS, S-Plus
Praxisbezug
Methoden-Anwendung auf reale Daten findet selten bzw. nicht statt
Datensätze sind überwiegend künstlich und enthalten relativ wenige
Beobachtungen
in einige Veranstaltungen werden Praxisvorträge integriert (vorwiegend bei
Betriebswirtschaftslehre und Wirtschaftsinformatik)
14
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Lehre – Übersicht Lehrveranstaltungen
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Name
P. Chamoni, Uni
Duisburg
R. Gabriel, Uni
Bochum
P. Mertens, Uni
Erlangen
LS-Bezeichnung
Wirtschaftsinformatik und OR
Wirtschaftsinformatik
Lehre 1
Lehre 2
Lehre 3
Homepage nicht aufrufbar (21.7.)
Wirtschaftsinformatik
VL
Informationsmanage
ment
J. Ruhland, Uni Jena Wirtschaftsinformatik
Data Mining und
Künstliche Intelligenz
VL Computergestützte
Unternehmensplanun
g und -kontrolle
M. Spiliopoulou, Uni Wirtschaftsinformatik des E-Business VL Knowledge
VL Knowledge Sharing Sem. Knowledge
Leipzig
Discovery for Ein the Organisation
Management
Business Applications
R. Thome, Uni
Würzburg
Wirtschaftsinformatik
VL Grundlagen der
Kolloquium: Data
Web Programmierung Warehousing und
Business Intelligence
K. Wilde, KU
Ingolstadt
Wirtschaftsinformatik
VL Data Mining / Web VL eCRM
Mining im Marketing
Die Lehrveranstaltungen wurden
willkürlich aus Veranstaltungen
der letzen 1-2 Jahre ausgewählt.
15
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Lehre – Übersicht Lehrveranstaltungen
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Name
H. Appelrath, Uni
Oldenburg
R. Bergmann, Uni
Hildesheim
LS-Bezeichnung
Informationssysteme
Lehre 1
Lehre 2
Lehre 3
Daten und Wissensmanagement
VL Grundlagen des
Wissensmanagement
W. Brauer, TU
München
Theoretische Informatik und
Grundlagen der KI
VL Data Mining und
Knowledge Discovery
J. Buhmann, Uni
Bonn
L. De Raedt, Uni
Freiburg
Mustererkennung und
Bildverarbeitung
Maschinelles Lernen und
Natürlichsprachliche Systeme
W. Dilger, TU
Chemnitz
Künstliche Intelligenz
FORWISS, TU
München
Bayerisches Forschungszentrum für
Wissensbasierte Systeme
Lehre 4
VL Neuronale Netze
VL Mustererkennung
VL Bildverarbeitung
VL Foundations of AI
VL Machine Learning
and Data Mining
VL Probabilistic
Models in Artificial
Intelligence
VL Data Mining
VL Künstliche
Intelligenz
VL Konnektionistische VL Maschinelles
Wissensverarbeitung Lernen
Sem. Databases and
Data Mining in
Bioinformatics
GMD, Team Knowledge Discovery
U. Güntzer, Uni
Tübingen
D. Keim, Uni
Konstanz
Datenbanken und
Informationssysteme
Datenbanken und Visualisierung
Information Retrieval Datenbanken
F. Klawonn, FH
Emden
Datenanalyse und Mustererkennung VL Fuzzy-Datenanalyse VL Neuronale Netze
Sem. Visualisierung
und Data Mining
SS2001
Praktikum Data
Mining /
Informationsvisualisie
rung SS2001
VL Genetische
Algorithmen
Die Lehrveranstaltungen wurden willkürlich aus Veranstaltungen der letzen 1-2 Jahre ausgewählt.
16
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Lehre – Übersicht Lehrveranstaltungen
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Name
H. Kriegel, LMU
München
LS-Bezeichnung
Datenbanksysteme
Lehre 1
Lehre 2
VL+Üb Knowledge
VL DBS und
Discovery in DB (KDD) Visualisierung
R. Kruse, Uni
Magdeburg
Neuronale Netze und Fuzzy-Systeme VL Neuronale Netze
P. Lockemann, TU
Karlsruhe
Systeme der Informationsverwaltung VL+Üb Informations- VL
Sem. Semantic Web
Informationsintegrati und
und
Wissensmanagement on und Web-Portale
Informationsintegrati
on
K. Morik, Uni
Dortmund
G. Palm, Uni Ulm
Künstliche Intelligenz
M. Richter, Uni
Kaiserslautern
Sem.Information
Mining in
heterogenen
Datenbeständen
Lehre 3
VL Unsicherheit und
Vagheit in
wissensbasierten
Systemen
VL Künstliche
Intelligenz
VL+Üb Data Mining
VL Maschinelles
Lernen
VL Theorie Neuronaler
Netze I+II
Wissensbasierte Systeme und
Künstliche Intelligenz
VL Knowledge
management for ecommerce
VL Information
Retrieval
R. Studer, TU
Karlsruhe
Wissensmanagement
Sem. Knowledge
Discovery
VL Intelligente
Systeme im World
Wide Web
Sem. E-Business und
Intelligent Web
A. Ultsch, Uni
Marburg
Neuro-Informatik und Künstliche
Intelligenz
VL Knowledge
Discovery
Sem. Aktuelle
Methoden des DataMining
VL Neuronale Netze
VL Maschinelles
Lernen
Sem.
Mustererkennung und
Klassifikation
Neuroinformatik
S. Wrobel, Uni Bonn Wissensentdeckung und
Maschinelles Lernen
F. Wysotzki, TU
Methoden der Künstlichen
Berlin
Intelligenz
Lehre 4
VL Informations- und
Wissensmanagement
Die Lehrveranstaltungen wurden willkürlich aus Veranstaltungen der letzen 1-2 Jahre ausgewählt.
17
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Lehre – Übersicht Lehrveranstaltungen
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Name
R. Decker, Uni
Bielefeld
LS-Bezeichnung
Betriebswirtschaftslehre und
Marketing
Lehre 1
VL
Marketingforschung
und Data Mining
B. Erichson, Uni
Magdeburg
W. Gaul, TU
Karlsruhe
Marketing
VL Multivariate
Analyseverfahren
VL Web Mining
H. Lenz, HU Berlin
Produktion, Wirtschaftsinformatik
und Operations Research
VL Data Warehousing
und Data Mining
O. Opitz, Uni
Augsburg
Statistik und Mathematische
Wirtschaftstheorie
VL+Üb Methoden der
Marktforschung
M. Schwaiger, LMU
München
Empirische Forschung und
Üb Data Mining
Quantitative Unternehmensplanung
H. Degen, Uni
Düsseldorf
Statistik & Ökonometrie
U. Küsters, KU
Ingolstadt
Statistik und quantitative Methoden VL Grundlagen der
der Wirtschaftswissenschaften
Daten- und
Regressionsanalyse
VL Ausgewählte
Prognosemethoden
S. Rachev, TU
Karlsruhe
Ökonometrie und Statistik
VL Data Mining
(Nakhaeizadeh)
Sem. Data and
Information Quality
R. Reiss, Uni Siegen
Initiative für Statistik und Data
Mining
Statistik
VL Data Mining mit
SAS Enterprise Miner
Sem. Data Mining in
Business und Finance
Sem. Data Mining
VL Data Mining
U. Rendtel, Uni
Frankfurt
A. Unwin, Uni
Augsburg
Entscheidungstheorie und
Unternehmensforschung
Rechnerorientierte Statistik und
Datenanalyse
Lehre 2
Lehre 3
VL Multivariate
Verfahren in der
Marketingforschung
VL Datenanalyse
Multivariate
Ökonometrie
Statistische Verfahren
VL+Üb Modellbildung
in der Statistik
Sem. Web Mining
Die Lehrveranstaltungen wurden willkürlich aus Veranstaltungen der letzen 1-2 Jahre ausgewählt.
18
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Lehre – Bsp. Lehrinhalte/-konzepte
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
19
25.07.2002
VL (2 SWS) TU München, SS2001
Einführung: Ziel, Definitionen, Schritte der Knowledge Discovery (KDD)
Datenquellen, -charakteristika und Fehlerquellen
Datenvorverarbeitung und -filterung
Datenvisualisierung
Projektionen
Hauptachsentransformation
mehrdimensionale Skalierung
Sammon-Methode
selbstorganisierende Karten
Datentransformationen und Merkmalsgenerierung
Datenanalyse
Korrelationsanalyse und Scheinkorrelationen
Regression
Klassifikation (Entscheidungsbäume, ID3)
Clustering (SAHN, HCM, FCM, GK, FCL, FCE, ACE, RBF, LVQ, FGLVQ)
Regeln (scharf, unscharf, lokale Modelle)
Sequenzen und zeitliche Verläufe
Anwendungsbeispiele
Papierindustrie
Bildverarbeitung: Mammographie
Hausgerätetechnik
Straßenverkehrstechnik
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Lehre – Bsp. Lehrinhalte/-konzepte
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
VL+Üb (3+1 SWS) Uni Ulm, SS2001
Verfahren des maschinellen Lernens:
Entscheidungstabellen/-bäume
Assoziationsregeln
Clustering
Klassifikation
Prognose
Datenrepräsentation: Konzepte, Instanzen, Attribute
Visualisierung
Kombination von Modellen
Anwendungen in JAVA
20
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in der Lehre – Bsp. Lehrinhalte/-konzepte
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
21
25.07.2002
Üb (2 SWS) LMU München, SS2002
Grundlagen
Data Mining und KDD
Data Warehouse
Einführung in den SAS Enterprise Miner
Assoziationsregeln
Grundlagen
Anwendung des SAS Enterprise Miner
Clusteranalyse (Nearest Neighbour)
Grundlagen
Anwendung des SAS Enterprise Miner
Entscheidungsbäume
Grundlagen
Anwendung des SAS Enterprise Miner
Exkurs: Teilnahme am Data Mining Cup 2002
(ein Teilnehmer unter den besten 10, einer unter den besten 20, alle anderen unter den ersten 60
von 120 Einreichungen)
(KNN: nur Grundlagen)
Behandlung von Fehlwerten
Vorträge
Herr Botsch (HypoVereinsbank)
Herr Wunderlich (SAS Institute)
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Data Mining in Forschung&Lehre ... &Praxis
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Formen
Praxisvorträge innerhalb und außerhalb von Lehrveranstaltungen
Projektseminare
Forschungskooperationen
Wettbewerbe (Data Mining Cup)
Diplomarbeiten
Einige erfolgreiche Beispiele
Diplomarbeit zur Bestimmung des Kundenwerts und Cross-Selling-Potenzials
bei einem Finanzdienstleister.
Diplomarbeit zum Web Mining bei einem Online-Shop.
Data Mining Cup (Auswertung anonymisierter Kundendaten); sehr gut zur
Integration in Lehrveranstaltungen mit Software-Einsatz geeignet!
Vorträge von SAS Institute, HypoVereinsbank, CSC Ploenzke, Dymatrix
Consulting Group
„Wunschliste“ an die Praxis
Bereitstellung von Daten für Forschungsvorhaben oder Lehrveranstaltungen
gemeinsame Durchführung von Diplomarbeiten und Projektseminaren
22
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Künftige Entwicklung in Forschung&Lehre
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
23
25.07.2002
Forschung
Data Mining/KDD dürfte sich als Disziplin etablieren
die Thematik wird überwiegend auf Grund des breiten Anwendungsspektrums
in die Forschungsarbeit aufgenommen werden
Betriebswirtschaftslehre/Wirtschaftsinformatik
hier wird Data Mining in größere Gebiete (CRM, Wissensmanagement,
E-Commerce) integriert werden
Informatik/Statistik
Data Mining wird verstärkt mit „klassischen“ Disziplinen (Datenbanken,
Maschinelles Lernen, explorative Statistik) verbunden
die Arbeit wird sich auf neue Algorithmen (Bildverarbeitung, Multimedia,
geogr. Informationen) und Effizienzverbesserungen konzentrieren
auch weiterhin Koexistenz von datengetriebener und theoriegetriebener
Forschung
Lehre
die Lücke zwischen stark methodisch ausgerichteten und stark
anwendungsbezogenen Veranstaltungen gibt es auf Grund unterschiedlicher
Zielsetzungen und „Prägungen“ der Dozenten auch weiterhin
das Label „Data Mining“ bzw. „KDD“ findet weitere „Anhänger“ und dürfte
gelegentlich zum „Aufpolieren“ von herkömmlichen Veranstaltungen dienen
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Künftige Entwicklung in Forschung – „Zusammenführung der Welten“
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
general context
Individual
context
Sequence
New law
(precautions for retirement)
Life insurance
Conclude contract
Cancel contract
time
Marketing activity for ...
Car insurance
Conclude contract
Cancel contract
Marketing activity for ...
Health insurance Conclude contract
Cancel contract
Marketing activity for ...
Quelle: Folien zum eingeladenen Vortrag „Sequence Mining in Marketing“, GfKl-Tagung 2001
24
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Fazit
DM in der Forschung
DM in der Lehre
Forschung&Lehre ...
&Praxis
Künftige Entwicklung
Data Mining hat sich in Forschung&Lehre als Disziplin etabliert.
Die meisten Lehrstühle kommen aus der Informatik, Betriebswirtschaftslehre,
Statistik oder Wirtschaftsinformatik.
Data Mining stellt oftmals eine Ergänzung/Fortsetzung der bisherigen Arbeit in
Forschung&Lehre dar.
Oftmals werden theoretische Grundlagen ausführlich vermittelt, während die
Anwendung der Methoden zu kurz kommt.
Data Mining dürfte über die erste Euphorie-Phase hinaus sein; mittlerweile wird
verstärkt an der Benutzerunterstützung z. B. zur besseren Ergebnisinterpretation
gearbeitet.
Insbesondere das Visual Mining und die Verarbeitung von Video-/Bildinformationen
scheint künftig von Interesse zu sein.
Einige Lehrstühle befassen sich zudem verstärkt mit dem Text Mining, wobei dies
noch nicht in die Lehre einfließt.
25
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
EFOplan – Ludwig-Maximilians-Universität München
www.efoplan.de
EFOplan - Seminar für Empirische Forschung und Quantitative Unternehmensplanung
Unsere Mission
Wir vermitteln Know-how zur Lösung betriebswirtschaftlicher Entscheidungsprobleme durch
Anwendung quantitativer Methoden und
zielgerichtete Interpretation der Anwendungsergebnisse.
Wir wollen auf dem Gebiet der Datenbeschaffung, -aufbereitung und -auswertung
Spezialisten sein, um damit Informationen, also entscheidungsrelevantes Wissen für
betriebswirtschaftliche Probleme zur Verfügung zu stellen.
Die fundierte Methodenkenntnis versetzt uns ferner in die Lage, Resultate im Sinne der
Problemstellung kritisch zu interpretieren und damit Entscheidungsrisiken zu minimieren.
Dr. Matthias Meyer
Studium der Wirtschaftsinformatik an der TU Braunschweig
Wissenschaftlicher Mitarbeiter am Lehrstuhl für Wirtschaftsinformatik der KU Eichstätt
Wissenschaftlicher Assistent bei EFOplan an der LMU München
Herausgeber der Buchreihe „Information Networking“
Mit-Herausgeber des „Handbuchs Data Mining im Marketing“
Co-Autor des Buches „Kundenmanagement in der Network Economy“
Herausgeber des Buches „CRM-Systeme mit EAI“
Forschungs- und Beratungstätigkeit in den Bereichen Information Networking, Data Mining und CRM
26
25.07.2002
Ludwig-Maximilians-Universität München
Dr. Matthias Meyer
Herunterladen