Intelligente Anwendungen im Internet Seminar WS 2007/8 Prof. Dr. Katharina Morik Lehrstuhl für Künstliche Intelligenz Fachbereich Informatik Universität Dortmund http://www-ai.cs.uni-dortmund.de [email protected] Was machen wir heute? Einführung Anforderungen für einen Schein Vorstellung der Themen Referatvergabe Suchmaschinen 1990: Archie, Veronica Suche auf ftp-Servern nach Programmen und Dateien, Erstellung eines Katalogs 1993: WWW und erste WebCrawler, die das Web durchlaufen 1994: Suchmaschinen Lycos, Yahoo, ... 1998: Google – erste Suchmaschine mit Lernalgorithmus (PageRank) Suchmaschinen geben auf eine Anfrage eine geordnete Liste von URLs zurück. Defizite üblicher Suchmaschinen Keine Verwendung von Wissen über einen Sachbereich Keine Rückkopplung durch Benutzerinteraktion Keine Anpassung an bestimmte Benutzer (Personalisierung) Die Dynamik des Webs wird wenig berücksichtigt Die URL-Listen werden unstrukturiert zurückgegeben Neue Zusammenarbeitsformen (p2p) werden nicht unterstützt ... Forschungsthemen Neue Suchmaschinen Änderungsverfolgung Personalisierung Web Usage Mining (untersuchen, was Benutzer mit dem Web tun) Web Mining (untersuchen, was im Web steht) Clustering ... Scheine Referat zu einem Thema halten – alle Fachbegriffe im Text verstehen, ggf. dazu weitere Literatur lesen – Seminarteilnehmern das Thema ansprechend vermitteln Schriftliche Ausarbeitung, bei der – alle anderen Vorträge in Bezug zu dem eigenen Thema gesetzt werden, – richtige Literatur richtig zitiert wird! Im Text: [1] oder [Jatowt et al. 2004], im Literaturverzeichnis: A. Jatowt, K.K. Bun, M. Ishizuka (2004) Change Summarization in Web Collections, Procs. of the 17th international conference on Innovations in Applied Artificial Intelligence, 653 - 662 Gutachtengarantie So viele Tage, wie Sie nach dem Semester brauchen, um Ihre Ausarbeitung fertigzustellen, So viele Tage habe ich danach, um das Gutachten zu machen. Es liegt also an Ihnen, wann Sie Ihren Schein bekommen! Referatvergabe 16.10. McCallum et al. (1999), Vorwissen: Viterbi Algorithmus 23.10. Menczer (2002), Vorwissen: Neuronale Netze, Multiagentensysteme, Information Retrieval evtl. 2-3 Studierende 30.10. Joachims (2002) Vorwissen: SVM 6.11. Jatowt et al (2004) Vorwissen: Co-citation evtl. 16.10., jedenfalls nur ½ Sitzung Joachims et al. (1995) Vorwissen: nearest neighbor 13.11. Kappel et al. (2001) evtl. 2 Studierende continued 20.11. Cooley et al. (1999) Vorwissen: frequent set mining 27.11.Büchner/Mulvenna (1998) Vorwissen: data cubes 4.12. Paganelli/Paterno (2002) evtl. streichen Bonchi et al. (2001) Vorwissen: frequent set mining, Decision tree learning, SQL 11.12. Kosala/Blockeel (2000) Vorwissen: Information extraction, Latent Semantic Indexing, HIT/PageRank, Wrapper Induction evtl. streichen 18.12. Liu et al (2006) Vorwissen: Statistik continued 8.1. Agarwal et al. (2006) Vorwissen: Naive Bayes, (transductive) SVM, Expectation Minimization, Dichtefunktion 15.1. Charikar et al. (1997) Vorwissen:Komplexitätstheorie 22.1. Mobasha et al. (1999) evtl. streichen Vorwissen: frequent set mining, 29.1. Wurst et al. (2006) Vorwissen: clustering 5.2. Abschlussbesprechung