Informatik Verbund Stuttgart der Universität Stuttgart Newsletter 5 2002 Inhalt Editorial Terminkalender Bericht: Vortrag „Java, SQL und web-basierte Anwendungen“ Bericht: Workshop „XML – Einführung mit praktischer Übung“ Bericht: Veranstaltung „Fussballroboter“ Bericht: Vortrag „Engineering Management in Japan's Software Factories“ Bericht: Vortrag „DV-Sicherheit“ Bericht: Mitgliederversammlung 2002 Bericht: Bachelor-Studiengang „Wirtschaftsinformatik“ Aktuelles Schlagwort: „Data Mining“ Vorstellung: Lehrstuhl für Systemtheorie und Signalverarbeitung Verschiedenes Editorial Liebe IVS-Mitglieder, der noch jungen Tradition folgend, stellt sich im vorliegenden Newsletter wiederum ein neues Mitglied im IVS vor. Diesmal handelt es sich um den Lehrstuhl für Systemtheorie und Signalverarbeitung (Prof. B. Yang). Darüber hinaus wird über den seit Wintersemester 2001/2002 laufenden Bachelor-Studiengang Wirtschaftsinformatik berichtet. Kurze Beschreibungen und Bewertungen der vom IVS kürzlich durchgeführten Veranstaltungen und ein Ausblick auf kommende Veranstaltungen im IVS vermitteln einen aktuellen Einblick in die attraktive Angebotspalette des IVS. Am Erstsemesterabend wurde der IVS-Award 2002 an drei studentische Arbeiten verliehen. Die Rubrik „Aktuelles Schlagwort“ greift das Thema „Data Mining“ auf. Kurzinformationen zur Mitgliederversammlung ergänzen den Berichtsteil. Dieses Mal musste die Mitgliederversammlung wieder einen neuen Vorstand wählen. Das bisherige Vorstandsmitglied Prof. Roos wurde zum neuen Vorstandssprecher gewählt, Prof. Mitschang als Vorstandsmitglied bestätigt, und Prof. Resch wird neu in den Vorstand gewählt und ersetzt damit Prof. Göhner, der sich nicht mehr zur Wiederwahl stellte und damit nach sechsjähriger Tätigkeit aus dem Vorstand ausscheidet. Unser besonderer Dank gilt Prof. Göhner für seine intensive Mitarbeit und seine zahlreichen Initiativen während seiner Tätigkeit im IVS-Vorstand. Abschließend möchte ich Ihnen allen im Namen des IVS-Vorstands ein gesegnetes Weihnachtsfest und ein gutes Neues Jahr wünschen. Mit freundlichen Grüßen Prof. Dr.-Ing. habil. B. Mitschang Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 2 des IVS-Newsletter 5/2002 Terminkalender 30.01.2003 Panelveranstaltung „Simulation & Modellierung“ Februar 2003 Panelveranstaltung „Web-Design“ Sommersemester 2003 Panelveranstaltung „Softwarepatente“ Mai 2003 Tages-Kurs „Java“ Juni 2003 Tages-Kurs „Web-Programmierung“ Weitere und jeweils aktualisierte Informationen zu den Veranstaltungen finden Sie auf den IVS-Webseiten: http://www.informatik.uni-stuttgart.de/ivs/ Bericht: Vortrag „Java, SQL und web-basierte Anwendungen“ Am 18. Juli 2002 referierte Herr Prof. Dr.-Ing. Stefan Deßloch von der Universität Kaiserslautern über das Thema „Java, SQL und web-basierte Anwendungen - Standardisierung und Industrietrends“. Er stellte die aktuellen Entwicklungen im Bereich Java (J2EE, Enterprise JavaBeans) und Datenbanken (SQL99, JDBC/SQLJ) vor. Behandelt wurden auch die im Entstehen begriffenen Standards in Zusammenhang mit XML: XQuery zur Abfrage von XMLDokumenten und XML-Datenbanken sowie SQL/XML, welches SQL und XML integrieren soll. Dem Vortrag schloss sich eine interessante Diskussion um den Sinn und die technische Realisierung von XML-Datenbanken an. Bericht: Workshop „XML – Einführung mit praktischer Übung“ Veranstalter: Michael Großmann, Uwe Heinkel, Daniela Nicklas, Thomas Schwarz; Abteilung Anwendersoftware, Institut für Parallele und Verteilte Systeme (Prof. Mitschang) Ziel des eintägigen IVS-Workshops "Einführung in XML" war es, den Teilnehmern einen möglichst breiten Überblick über die XML-Techonologie zu geben. Gleichzeitig sollte anhand von Rechner-Übungen auch einsetzbare, praktische Erfahrung vermittelt werden. Daher wurde ein vielseitiges, anspruchsvolles Programm angeboten: zu XML, DTDs, XPath, DOM, SAX und XSLT wurden Vorträge und Übungen geboten, weitere Technologien wie XML Schema, XLink und XPointer oder SOAP wurden zumindest zur Einordnung kurz angesprochen, um etwas Licht in den Dschungel der vielseitigen XML-Sprachen zu bringen. Die Veranstaltung konnte hilfreiche Kenntnisse für die praktische Arbeit vermitteln. Nach Aussage der Teilnehmer war der Kurs sehr gut dafür geeignet, einen komprimierten Überblick über XML zu erhalten, als Ausgangspunkt für eigene, tiefergehende Studien, die sich dann gezielt an den Bedürfnissen der eigenen XML-Projekte orientieren. Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 3 des IVS-Newsletter 5/2002 Bericht: Veranstaltung „Fussballroboter“ Am 14.11.2002 wurde im Anschluss an die Mitgliederversammlung ein Vortrag von Prof. Dr. rer. nat. habil. Paul Levi, Leiter der Abteilung Bildverstehen des Instituts für Parallele und Verteilte Systeme der Universität Stuttgart gehalten. Der Vortrag stellte sehr anschaulich die Prinzipien, Funktionsweisen, Strategien und Regelements von Fußballrobotern und Turnieren mit Fußballrobotern vor. Er zeigte die vielfältigen Probleme, die in diesem Zusammenhang zu lösen sind und die von robuster Hardware bis hin zur Bilderkennung reichen. Prof. Levi zeigte auch andere Anwendungsfälle für die bei Fußballrobotern untersuchten und entwickelten Problemlösungen. So können autonome Roboter z.B. auch zur Rettung von Verletzten in schwer zugänglichem Umfeld eingesetzt werden. Prof. Levi vermittelte auch einen Eindruck von den Kosten, die mit der Entwicklung und dem Aufbau von Fussballrobotern verbunden sind. Bericht: Vortrag „Engineering Management in Japan's Software Factories“ Am 05.12.2002 hielt Dr. Eng. Yoshihiro Matsumoto einen Vortrag zum Thema „Engineering Management in Japan's Software Factories“. Herr Matsumoto war Gastprofessor am Institutsverbund für Informatik und beschäftigte sich vor seiner Lehrtätigkeit lange Zeit bei Toshiba in Japan mit dem Aufbau von Software Factories. Bericht: Vortrag „DV-Sicherheit“ Herr Oliver Göbel, der Leiter des RUS-CERT (Rechenzentrum Universität Stuttgart Computer Emergency Response Team), stellte am 12.12.2002 im Rahmen einer Informationsveranstaltung seine Einrichtung und deren vielfältigen Aufgaben vor. Das RUS-CERT ist für die DVSicherheit an der Universität Stuttgart zuständig. Verantwortlich für die DV-Sicherheit sind allerdings die Administratoren der einzelnen Institute. Zur schnellen Kontaktaufnahme bei Sicherheitsproblemen pflegt das RUS-CERT auch eine Datenbank mit Ansprechpartnern. Dabei ist wichtig, dass die Institute der Universität aktiv Veränderungen bei ihren Ansprechpartnern an das RUS-CERT melden. Zu den Aufgaben des RUS-CERT zählen weiterhin u.a. der Betrieb der Firewall, die Verkehrsanalyse und ein Advisory-Dienst. Der Advisory-Dienst unter http://cert.uni-stuttgart.de/ticker/ berichtet über aktuelle Sicherheitslücken bei häufig eingesetzter Software sowie deren Behebung oder Umgehung. Der Vortrag war begleitet von einer regen Diskussion. Bericht: Mitgliederversammlung 2002 Bei der Mitgliederversammlung am 14.11.2002 konnte eine neues Mitglied im IVS begrüßt werden: das Institut für Netzwerk- und Systemtheorie, Lehrstuhl für Netzwerk- und Systemtheorie von Prof. Yang. Das Institut für Elektrische Maschinen und Antriebe, das in das Institut für Energieübertragung und Hochspannungstechnik integriert wurde, schied aus dem IVS aus. Ein wichtiger Tagesordnungspunkt der diesjährigen Mitgliederversammlung war die Wahl des Vorstands, die laut Satzung alle 2 Jahre stattfindet. Herr Prof. Göhner stand auf eigenen Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 4 des IVS-Newsletter 5/2002 Wunsch nicht mehr für den Vorstand zur Verfügung. Auch die Position des Sprechers stand turnusgemäß zum Wechsel an. Die Mitgliederversammlung wählte daraufhin den Vorstand in folgender Zusammensetzung: Prof. Roos (MPA) als Sprecher, Prof. Mitschang (IPVS) und Prof. Dr. Resch (RUS) als Stellvertreter. Die Mitgliederversammlung beschloss außerdem die Nutzung des IVS-E-Mail-Verteilers zur Bekanntgabe von Einzelveranstaltung, die für IVS-Mitglieder von Interesse sind. Herr Prof. Mitschang teilte mit, dass der Vorstand und die Geschäftsstelle jederzeit für Hinweise zu Veranstaltungsthemen aus dem Kreis der Mitglieder offen sind. Auch Informationen, die für IVS-Mitglieder von Interesse sein könnten, können über die Geschäftsstelle verteilt werden. Die Geschäftsstelle kann auf Initiative eines Mitgliedsinstituts bei der Vermittlung von Kontakten helfen und die Initiierung von Kooperationen unterstützen. Bericht: Bachelor-Studiengang „Wirtschaftsinformatik“ Das Fach Wirtschaftsinformatik beschäftigt sich mit dem Einsatz von Informations- und Kommunikationstechnologien in Unternehmen und in der Verwaltung. Dabei stehen (1) die Architektur betrieblicher computergestützter Informationssysteme (2) die Planung und Organisation, sowie die Methoden der Systementwicklung inklusive Programmierung von Anwendungen und (3) das Management der Ressource „Information“ im Mittelpunkt. Informations- und Kommunikationssysteme werden hierbei als soziotechnische („MenschMaschine-“) Systeme beschrieben, die menschliche und maschinelle Komponenten (Teilsysteme) umfassen und zum Ziel der optimalen Bereitstellung von Information und Kommunikation nach wirtschaftlichen Kriterien eingesetzt werden. Wirtschaftsinformatik steht somit zwischen Informatik und Betriebswirtschaftslehre. Neben anderen Disziplinen wendet sie insbesondere die in der Informatik entwickelten Architekturen, Methoden, Kommunikationsnetze sowie die entsprechende Software an. Aufgrund der fortschreitenden Nutzung von Computern erwartet die Praxis Absolvierende, die Informations- und Kommunikationstechnologien und Anwendungen sowohl aus betriebswirtschaftlicher als auch technischer Sicht betrachten. Die gute Verbindung von Betriebswirtschaftslehre und Informatik erhöht die Kompetenz der Absolvierenden und verbessert die Chancen auf dem Arbeitsmarkt. Der berufsqualifizierende Abschluss nach sechs Semestern, der „Bachelor of Science in Information Systems“, ermöglicht zugleich einen frühen Einstieg in den Beruf. Wirtschaftsinformatiker(innen) finden ihre Arbeitsgebiete insbesondere in der Informationsverarbeitung oder in Fachabteilungen mit starkem Bezug zur Informationsverarbeitung. Dabei sind zwei Schwerpunkte denkbar: - - Zum einen ist es möglich, sich auf den Prozess der Gestaltung von Informationssystemen mit eher DV-techniknahen Berufen wie z.B. Systemanalytiker, Datenbankspezialist und Software-Ingenieur zu konzentrieren. Zum anderen kann der Schwerpunkt auf der betriebswirtschaftlichen Anwendung von Informationssystemen und dem Management der Ressource Information liegen, mit informaEine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 5 des IVS-Newsletter 5/2002 tiknahen und betriebswirtschaftlichen Berufen wie z.B. Anwendungsbetreuer, Datenverarbeitungskoordinator in den Fachabteilungen oder Unternehmensberater. Das Lehrangebot des Bachelorstudiums erstreckt sich über sechs Fachsemester. In den ersten beiden Semestern werden die notwendigen Grundlagen für ein wissenschaftlich fundiertes Studium der Wirtschaftsinformatik vermittelt. Die folgenden beiden Semester dienen der Verbreiterung der Kenntnisse, dem Umgang mit Werkzeugen und dem Erlernen eines methodischen Instrumentariums. Die letzten beiden Semester vertiefen das Gelernte und üben durch ein umfangreiches Abschlussprojekt persönlichkeitsfördernde Fähigkeiten und berufstypische Vorgehensweisen ein. Die nachfolgende Tabelle fasst diese Informationen und auch einige weitere interessante Daten zu diesem Bachelor-Studium an der Universität Stuttgart zusammen. Studieninhalte 1. – 2. Semester Grundkenntnisse aus den Bereichen Informatik, Wirtschafts- und Sozialwissenschaften, Mathematik/Statistik sowie Kerngebiete der Wirtschaftsinformatik 3. – 4. Semester Verbreiterung der Grundkenntnisse 5. – 6. Semester Vertiefung der Themenbereiche und Hinzunehme weiterer Kerngebiete der Wirtschaftsinformatik (E-Business, Informationsmanagement, Informatikrecht) sowie ein Abschlussprojekt; Wahlbereiche in Informatik sowie Wirtschafts- und Sozialwissenschaften Praktikum Berufspraktische Tätigkeiten von mind. 8 Wochen Anzahl der Studienplätze für Studienanfänger/-innen 60 Eignungsfeststellungsverfahren Nur bei hohen Bewerbungszahlen Zulassungsbeschränkung: - für 1. Fachsemester Ja - für höhere Fachsemester Zur Zeit noch keine Zulassung. Regelstudienzeit 6 Semester Abschluss Bachelor of Science in Information Systems Das Studium endet mit einem Abschlussprojekt, das Teamarbeit der Studierenden, berufstypisches Vorgehen, intensive Betreuung und enge Zusammenarbeit mit der Praxis verbindet. Der „Bachelor of Science in Information Systems“ ist ein berufsqualifizierender Abschluss. Er bietet die Möglichkeit, bereits nach drei Jahren akademischen Studiums in den Beruf einzusteigen. Zugleich eröffnet er den Weg zum Master-Studium überall in der Welt. Als weitere Besonderheit bleibt hervorzuheben, dass der Studiengang von drei Fakultäten an zwei Universitäten getragen wird. Von der Universität Hohenheim ist die Fakultät V Wirtschaftswissenschaften beteiligt, und von der Universität Stuttgart sind die Fakultät 5 (Informatik, Elektrotechnik und Informationstechnik) und die Fakultät 10 (Wirtschafts- und Sozialwissenschaften) beteiligt. Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 6 des IVS-Newsletter 5/2002 Die nachstehende Übersicht zeigt den von den Fakultäten der beteiligten Universitäten aufgestellten Studienplan zum Bachelor-Studium der Wirtschaftsinformatik. Mehr Informationen zum Studium der Wirtschaftsinformatik an der Universität Stuttgart findet man unter: http://www.uni-stuttgart.de/studienberatung/studiengaenge/wirtschinformatik/index.html Die am Bachelor-Studiengang Wirtschaftsinformatik beteiligten Fakultäten arbeiten momentan an einem ersten Entwurf zu einem konsekutiven Master-Studium. Dabei sollen zum einen die vielfältigen Vertiefungsmöglichkeiten in den zugehörigen Instituten Berücksichtigung finden. Zum anderen sollen aber auch andere Institute die Möglichkeit haben, Vertiefungsangebote in angrenzenden Themenbereichen anbieten zu können. Damit soll dem Charakter und der Kompetenz der beteiligten Universitäten und damit auch der Wirtschaftsregion Stuttgart Rechnung getragen werden und ein attraktiver Master-Studiengang entstehen. Studienplan Bachelor- Wirtschaftsinformatik Semester Informatik Wirtschaftsinformatik Wirtschafts- und Mathematik/ SozialwissenStatistik schaften 1. Sem. Einführung in die Informatik I Einführung in die Wirtschaftsinformatik (H) Entsch.-/Problem.orient. BWL Tech. d. betriebl. ReWe I Mathem. I 2. Sem. Einführung in die Informatik II Informationsverarbeitungspraktikum Produktionsmanag. Tech. d. betriebl. ReWe II Mathem. II Statistik II 3. Sem. Einführung in die Softwaretechnik Informations- und Komm.Architekturen I Programmentwicklungspraktikum Quantitative Methoden der Wirtschaftsinformatik Invest. u. Finanzierung Betr. ReWe BGB 1 Alternatives Fach (z.B. Einf. in die Psych. oder Soz. (H), Einf. Pol. Wiss., Einf. VWL ) Softwarepraktikum Projektmanagement Entwurf betrieblicher Informationssysteme Informations- und Komm.Architekturen II 4. Sem. Formale Methoden Statistik I Personalmanagement und Organisationsgest Marketing BGB 2 5. Sem. Grundlagen der Datenbanken oder Grundlagen der Anwendungssysteme E-Business I (Gesch.mod.) Wahlbereich (2 SWS) E-Business II Informationsmanagement Informatikrecht Abschlussprojekt Teil 1 (H oder S oder P) 2V, 2S 6. Sem. Grundlagen der Abschlussprojekt Teil 2 Wahlbereich (4 Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 7 des IVS-Newsletter 5/2002 Verteilten Systeme oder Grundlagen der Anwendungssysteme (10SWS) SWS) Aktuelles Schlagwort: „Data Mining“ “Now that we have gathered so much data, what do we do with it?” Durch die rasante Entwicklung der Informationstechnologie und des Internets hat die Menge elektronisch verfügbarer Daten in den letzten Jahren stark zugenommen. Gleichzeitig sind auch die Kosten für deren Fayyad Speicherung gesunken, sodass sämtliche in einem Unternehmen anfallenden Daten kostengünstig gespeichert und archiviert werden können. Diese meist enorm großen Datenmengen können wertvolle Informationen enthalten, die zum Verständnis von wichtigen Zusammenhängen innerhalb der Daten beitragen können oder die Entscheidungsträger innerhalb eines Unternehmens bei wichtigen Entscheidungen unterstützen können. Diese Information ist jedoch nicht explizit aus den Rohdaten ersichtlich, sondern erfordert entsprechende Analyseverfahren. Ein Ansatz, der auf der Ableitung von Mustern und Regeln basiert, die auch Prognosen über den im Datenbestand repräsentierten Zeitraum hinaus ermöglichen, ist das Data Mining. Während andere Ansätze den Anwender bei der Überprüfung bereits aufgestellter Hypothesen unterstützen sollen, liegt der Schwerpunkt bei den Verfahren des Data Mining auf der möglichst selbstständigen Suche nach neuen Hypothesen und deren Überprüfung. Das Data Mining ist eigentlich eine interdisziplinäre Forschungsrichtung, zu deren Entstehung und Entwicklung insbesondere die Forschungsgebiete Maschinelles Lernen, Mustererkennung, Datenbanksysteme und Statistische Datenanalyse beigetragen haben. Daher sind auch die Anwendungsgebiete recht breit gefächert. Der KDD-Prozess Data Mining wird nicht selten mit „knowledge discovery in databases“ (KDD) gleichgesetzt, obwohl Data Mining eigentlich nur ein Teil des KDD-Prozesses ist. In der nachfolgenden Abbildung ist der gesamte KDD-Prozess von den Rohdaten bis hin zum Wissen, das daraus extrahiert wird, dargestellt. Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 8 des IVS-Newsletter 5/2002 Es werden die folgenden Schritte unterschieden: • Datenselektion: Auswahl einer relevanten Teilmenge der Rohdaten, die als Basis für das weitere Vorgehen dient. • Daten(be)reinigung: Identifikation und Behandlung von Fehlern und Rauschen in den Daten. • Datentransformation: Transformation, Konsolidierung und Aufteilung der Daten: Durch Zusammenfassen der Inhalte von mehreren Tabellen zu einer einzigen und durch Aggregation der Daten wird die Datenmenge weiter eingeschränkt und auf eine für das folgende Data Mining geeignete Form gebracht; anschließend erfolgt die Aufteilung in Trainings- und Testdaten. • Data-Mining: Auswahl der Data-Mining-Methoden bzw. -Algorithmen und deren Einsatz zur Identifikation von Mustern auf der Basis des vorbereiteten Datenbestandes. • Evaluation und Interpretation: Interpretation und Visualisierung der entdeckten Muster: Überflüssige oder irrelevante Muster werden entfernt und die wirklich interessanten und nützlichen in einer für den Benutzer verständlichen Weise dargestellt. Die Datenquelle ist meist ein Data Warehouse, d.h. eine Datenbank, die auf einem mehrdimensionalen Datenmodell basiert und den Anforderungen genügt, die sich aus der Verarbeitung von teilweise mehreren Giga- bis Terabyte umfassenden und ständig wachsenden Datenbeständen ergeben. Diese Datenbestände werden wiederum aus operativen Systemen oder externen Datenquellen, wie beispielsweise dem Internet, gewonnen und für die Speicherung im Data Warehouse aufbereitet. Data Mining Methoden und deren Klassifizierung Data-Mining-Algorithmen bestehen meist aus einem spezifischen Mix dreier Komponenten: • Das Modell: Das Modell setzt sich zusammen aus der gewählten Methode (z.B. Klassifikation) und einer entsprechenden Repräsentation des Modells (z.B. Entscheidungsbäume). Die Parameter, die das Modell genau spezifizieren, werden aus den zu analysierenden Daten gewonnen. Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 9 des IVS-Newsletter 5/2002 • Das Präferenzkriterium: Dieses Kriterium bestimmt die Präferenz eines Modells bzw. einer Menge von Parametern gegenüber anderen Modellen bzw. Parametern, abhängig von der gegebenen Datenmenge. D.h. das Präferenzkriterium ist eine Funktion, die die Güte des Modells bezüglich der gegebenen Datenmenge ermittelt und verhindert, dass ein Modell zu viele Freiheitsgrade hat oder überbestimmt (overfitted) ist. • Der Suchalgorithmus: Der Suchalgorithmus soll für eine gegebene Datenmenge, eine gewählte Modellfamilie und ein passendes Modell bzw. passende Modellparameter finden. Leider wird die Klassifizierung der Algorithmen und Methoden in der Literatur nicht einheitlich gehandhabt; so kann es passieren, dass die Zahl der Klassen bzw. deren Bezeichnung von Autor zu Autor unterschiedlich ist. Die im folgenden vorgestellte Klassifizierung orientiert sich an Han [1][2]. Die Methoden des Data Mining lassen sich grob in beschreibende (descriptive) und vorhersagende (predictive) einteilen. Die beschreibenden Methoden versuchen – wie der Name schon sagt – die Daten zu beschreiben; d.h. die Daten werden aufgrund ihrer Attributwerte charakterisiert und dabei die generellen Eigenschaften, Regelmäßigkeiten und Besonderheiten herausgearbeitet. Zu den beschreibenden Methoden gehören: • Charakterisierung und Vergleich (Datengeneralisierung, Klassen-/Konzeptvergleich, Attributrelevanzanalyse) • Assoziationsregeln (einfache und mehrdimensionale Assoziationsregeln) • Clustering (partitionierend, hierarchisch, dichtebasiert, gitterbasiert und modellbasiert) • Erkennung von Ausreißern (statistikbasiert, abstandsbasiert und abweichungsbasiert). Die vorhersagenden Methoden analysieren die Daten, um ein Modell oder eine Menge von Modellen zu erzeugen, die Vorhersagen über die Klassenzugehörigkeit oder von bestimmten Werten zukünftiger Datentupel ermöglichen. Zur Erstellung des Modells werden Trainingsdaten benötigt, bei denen die vorherzusagenden Werte bekannt und daher schon enthalten sind. Ist das Modell erstellt, dann kann es auf neue, bisher nicht analysierte Objekte angewandt werden. Zu den vorhersagenden Methoden gehören: • Klassifikation (Basierend auf Entscheidungsbäumen, basierend auf dem Theorem von Bayes, basierend auf neuronalen Netzen und basierend auf Assoziationsregeln) • Vorhersage von Werten / Regression (Lineare, multiple und nichtlineare). Eine weitere Gruppe von Methoden dient der Analyse von Zeitserien und Sequenzdaten, beispielsweise der Sequenz von Web-Seiten, die eine Person besucht hat. Diese Methoden lassen sich schlecht in die beiden obigen Gruppen einteilen, da sie eigentlich eine besondere Art von Daten und deren Problematik behandeln und teilweise sowohl zur Beschreibung als auch zur Vorhersage benutzt werden. Zu dieser Gruppe gehören die Trend-Analyse, die Suche nach ähnlichen Sequenzen, die Suche nach sequentiellen Mustern und die Periodizitätsanalyse. Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 10 des IVS-Newsletter 5/2002 Ausblick Hinter Data Mining steht eigentlich die Vision eines Analysewerkzeugs, dem man seine Datenquellen als Eingabe übergibt und das dann ohne weitere Interaktion mit dem Benutzer völlig autonom sämtliche relevanten und interessanten Muster findet. In der Realität sind die derzeitig verfügbaren Data-Mining-Werkzeuge jedoch weit von dieser Vision entfernt. Der Erfolg des Einsatzes von Data-Mining-Werkzeugen hängt meist von der Auswahl der zu analysierenden Datenmenge, der Auswahl einer geeigneten Data-Mining-Methode und – meist entscheidend – von der Einstellung der Parameter ab. Nur eine günstige Auswahl dieser Komponenten, die eigentlich eine etwas genauere Kenntnis der zu analysierenden Datenmenge und das Wissen, welche Bereiche innerhalb dieser Datenmenge überhaupt interessant und erfolgversprechend sind und nicht zuletzt viel Erfahrung bei der Wahl der Parameterwerte voraussetzt, führt zum erwarteten Erfolg. Der Schwerpunkt der Forschung und Entwicklung im Bereich Business Intelligence (BI) liegt derzeit auf der Integration von Data-Mining-Modellen und -Algorithmen in Datenbanksysteme. Des weiteren stellt sich die Frage, ob und wie sich Data Mining mit anderen Ansätzen, z.B. OLAP, sinnvoll verknüpfen lässt. Auch die Zahl der Anwendungsgebiete wächst ständig und stellt neue Anforderungen an das Data Mining, beispielsweise ist mit der Bioinformatik ein neues interessantes Anwendungsgebiet hinzugekommen. Literatur [1] J. Han. Data Mining in J. Urban and P. Dasgupta (eds.), Encyclopedia of Distributed Computing, Kluwer Academic Publishers, 1999. [2] J. Han, M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001. [3] U. Fayyad, G. Piatetsky-Shapiro, P. Smyth. Knowledge Discovery and Data Mining: Towards a Unifying Framework. In Proceeding of The Second Int. Conference on Knowledge Discovery and Data Mining, pages 82-88, 1996. [4] Communications of the ACM. Volume 39, Number 11, pages 24-68. ACM Press, November 1996. Tobias Kraft Universität Stuttgart Institut für Parallele und Verteilte Systeme (IPVS) E-Mail: [email protected] Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 11 des IVS-Newsletter 5/2002 Vorstellung: Lehrstuhls für Systemtheorie und Signalverarbeitung Der Lehrstuhl für Systemtheorie und Signalverarbeitung ist einer der beiden Lehrstühle des Instituts für Systemtheorie und Bildschirmtechnik der Fakultät für Informatik, Elektrotechnik und Informationstechnik. Das Institut hat eine lange Tradition. 1921 wurde von Prof. Dr. Fritz Emde das Institut der Theorie der Elektrotechnik gegründet. In der damaligen Zeit stammten die meisten theoretischen Aufgaben aus dem Gebiet der elektromagnetischen Felder und den Anwendungen bei elektrischen Generatoren und Motoren. 1939 wurde Prof. Dr. Ing. habil. W. Bader zum Nachfolger Emdes berufen. Wilhelm Bader hat der Feldtheorie das Arbeitsgebiet der Netzwerktheorie und dabei insbesondere der Synthese elektrischer Netzwerke hinzugefügt. Nach seiner Emeritierung wurden die Lehr- und Forschungsgebiete auf zwei Institute aufgeteilt. Prof. Dr. rer. nat. Günther Lehner übernahm 1972 das Gebiet der Feldtheorie im zugehörigen Institut für Theorie der Elektrotechnik, während ab 1971 Prof. Dr. Ing. habil. E. Lüder im neugegründeten Institut für Netzwerk- und Systemtheorie die Arbeiten im Bereich der elektrischen Netzwerke weiterführte. Ernst Lüder hat in die Lehr- und Forschungstätigkeit die Systemtheorie aufgenommen, die mit mathematischen Methoden das zeitliche und frequenzabhängige Verhalten von Systemen untersucht. 1971 wurde im Institut ein Labor für Dünn- und Dickschichttechnik aufgebaut, das sich im Lauf der Zeit immer weiter entwickelte zur Fertigung von Dünnschichttransistoren auf Glassubstraten für die Ansteuerung der einzelnen Bildelemente von flachen Flüssigkristallbildschirmen. Als Prof. Lüder 1999 sich zur Ruhe setzte, wurde das Institut für Netzwerk- und Systemtheorie in zwei Lehrstühle aufgeteilt. Während Prof. Dr.-Ing. Norbert Frühauf März 2001 den neu gegründeten Lehrstuhl für Bildschirmtechnik übernahm, leitet Prof. Dr.-Ing. Bin Yang seit Oktober 2001 den Lehrstuhl für Netzwerk- und Systemtheorie. Im Rahmen der neuen Universitätsgrundordnung ab 01.10.2002 wurden dieser Lehrstuhl in „Lehrstuhl für Systemtheorie und Signalverarbeitung“ und das Institut in „Institut für Systemtheorie und Bildschirmtechnik“ umbenannt. Prof. B. Yang hat sowohl in der Lehre als auch in der Forschung der Systemtheorie das neue Arbeitsgebiet der Digitalsignalverarbeitung hinzugefügt. Die neue Ausrichtung hat das Ziel, Methoden zur digitalen Verarbeitung gemessener Signale zu erforschen, erproben, implementieren und in verschiedenen Anwendungen einzusetzen. Der Schwerpunkt in der Lehre ist die Systemtheorie mit deterministischen und stochastischen Signalen sowie die Digitalsignalverarbeitung. Derzeit bietet der Lehrstuhl die folgenden 6 Vorlesungen für den Diplom-Studiengang an: Systemtheorie I Theorie zeitkontinuierlicher Signale und Systeme Digital signal processing (in englisch) Theorie zeitdiskreter Signale und Systeme Systemtheorie II Theorie stochastischer Signale Statistische und adaptive Signalverarbeitung Methoden und Algorithmen zur statistischen und adaptiven Signalverarbeitung Entwurf digitaler Filter Methoden und Algorithmen zum Entwurf digitaler Filter Algorithmen und Schaltungen für Digitalsignalverarbeitung Implementierungsaspekte der Digitalsignalverarbeitung Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 12 des IVS-Newsletter 5/2002 Darüber hinaus bietet der Lehrstuhl zwei englischsprachige Vorlesungen für den InfoTechStudiengang an: System theory Digital signal processing Neben der Mitbetreuung des Grundlagenpraktikums der Fakultät bietet der Lehrstuhl außerdem sowohl den Diplom- als auch den InfoTech-Studierenden das englischsprachige Fachpraktikum Digital signal processing an. Der Schwerpunkt der Forschung ist die Digitalsignalverarbeitung und ihre verschiedenste Anwendungen. Sie widmet sich der Erforschung von neuen Methoden, Algorithmen und Schaltungen für die digitale Verarbeitung von Signalen und deren Einsatzes in der Praxis zur Lösung wissenschaftlicher und technischer Probleme. Dabei steht die Verarbeitung stochastischer Signale besonders im Vordergrund, weil die meisten natürlichen Signale (Sprache, Audio, Bild, Video, Geräusch usw.) von stochastischer Natur sind. Auch die Untersuchung zur praxisgerechten Implementierung der entwickelten Signalverarbeitungsalgorithmen auf Signalprozessoren spielt eine wichtige Rolle. Derzeit fokussieren wir auf die folgenden Anwendungsgebiete der Signalverarbeitung: Signalverarbeitung für Kommunikationstechnik Erforschung von Methoden und Algorithmen zur Verarbeitung von Kommunikationssignalen (Kanalschätzung und Kanalentzerrung, Dekodierung und Demodulation, Synchronisation, MIMO-Systeme, Space-Time-Code, Mehrträgersysteme, …) Sprachverarbeitung Erforschung von Methoden und Algorithmen zur Verarbeitung von akustischen Signalen (akustische Echounterdrückung, Geräuschkompensation, Qualitätsverbesserung, Spracherkennung und Kombinationen davon) Antennensignalverarbeitung Erforschung von Methoden und Algorithmen zur Verarbeitung von Signalen aus einer Sensorgruppe (z.B. intelligente Antennen für zukünftige Kommunikationssysteme, KfZ-Radar, Mikrophone-Array) Adaptive Algorithmen und Systeme Erforschung von allgemeinen Methoden und Algorithmen für adaptive Filter und Systeme Anschrift und nähere Information: Lehrstuhl für Systemtheorie und Signalverarbeitung Prof. Dr.-Ing. Bin Yang Pfaffenwaldring 47 70550 Stuttgart Tel. 0711/685-7332 Fax. 0711/685-7311 [email protected] www.uni-stuttgart.de/ins Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/ Seite 13 des IVS-Newsletter 5/2002 Verschiedenes IVS-Award 2002 Beim Avete Academici-Abend am 22. Oktober 2002 wurde zum dritten Mal der IVS-Award verliehen. Herr Dominique Dudkowski wurde ausgezeichnet für seine Studienarbeit Ereignisse im Nexus-Lokationsdienst. Die Studienarbeit wurde vom 01.08.01 bis zum 31.01.02 am Institut für Parallele und Verteilte Höchstleistungsrechner, Abteilung Verteilte Systeme durchgeführt und mit sehr gut (1,0) bewertet. Herr Thomas Klein wurde ausgezeichnet für seine Studienarbeit Simulation von Fluiden für computergraphische Anwendungen zusammen mit Herrn Mike Eißele für seine Studienarbeit Hardwareunterstütze hochqualitative Darstellung von Fluidoberflächen. Beide Studienarbeiten wurden im Projekt "Fluider" vom 02.12.01 bis zum 03.06.02 am Institut für Informatik, Abteilung Visualisierung und Interaktive Systeme, durchgeführt und jeweils mit sehr gut (1,0) bewertet. Impressum Herausgeber: Informatik Verbund Stuttgart der Universität Stuttgart Redaktion: Prof. Dr.-Ing. B. Mitschang (verantwortlich), Dipl.-Ing. Th. Strobel Anschrift: Informatikverbund Stuttgart, Pfaffenwaldring 47, 70550 Stuttgart, Tel. 0711/6857292, -7301, Fax 0711/685-7302, E-Mail [email protected] Newsletter online: http://www.informatik.uni-stuttgart.de/ivs/ Eine Arbeitsgemeinschaft von Instituten der Universität Stuttgart Vorstand: Prof. Dr.-Ing. habil. Bernhard Mitschang (Sprecher), Prof. Dr.-Ing. Dr. h. c. Peter Göhner, Prof. Dr.-Ing. habil. Eberhard Roos IVS-Geschäftsstelle: Dipl.-Ing. Th. Strobel, Pfaffenwaldring 47, 70550 Stuttgart, Tel: 0711/685-7292/-7301, Fax: -7302, E-Mail: [email protected] http://www.informatik.uni-stuttgart.de/ivs/