ppt

Werbung
Intelligente Anwendungen im
Internet
Seminar WS 2007/8
Prof. Dr. Katharina Morik
Lehrstuhl für Künstliche Intelligenz
Fachbereich Informatik
Universität Dortmund
http://www-ai.cs.uni-dortmund.de
[email protected]
Was machen wir heute?




Einführung
Anforderungen für einen Schein
Vorstellung der Themen
Referatvergabe
Suchmaschinen

1990: Archie, Veronica Suche auf ftp-Servern nach
Programmen und Dateien, Erstellung eines Katalogs
 1993: WWW und erste WebCrawler, die das Web
durchlaufen
 1994: Suchmaschinen Lycos, Yahoo, ...
 1998: Google – erste Suchmaschine mit
Lernalgorithmus (PageRank)
Suchmaschinen geben auf eine Anfrage eine geordnete
Liste von URLs zurück.
Defizite üblicher Suchmaschinen







Keine Verwendung von Wissen über einen
Sachbereich
Keine Rückkopplung durch Benutzerinteraktion
Keine Anpassung an bestimmte Benutzer
(Personalisierung)
Die Dynamik des Webs wird wenig berücksichtigt
Die URL-Listen werden unstrukturiert zurückgegeben
Neue Zusammenarbeitsformen (p2p) werden nicht
unterstützt
...
Forschungsthemen

Neue Suchmaschinen
 Änderungsverfolgung
 Personalisierung
 Web Usage Mining (untersuchen, was Benutzer mit
dem Web tun)
 Web Mining (untersuchen, was im Web steht)
 Clustering
 ...
Scheine

Referat zu einem Thema halten
– alle Fachbegriffe im Text verstehen, ggf. dazu weitere
Literatur lesen
– Seminarteilnehmern das Thema ansprechend
vermitteln

Schriftliche Ausarbeitung, bei der
– alle anderen Vorträge in Bezug zu dem eigenen
Thema gesetzt werden,
– richtige Literatur richtig zitiert wird! Im Text: [1] oder
[Jatowt et al. 2004], im Literaturverzeichnis: A. Jatowt,
K.K. Bun, M. Ishizuka (2004) Change Summarization in
Web Collections, Procs. of the 17th international
conference on Innovations in Applied Artificial
Intelligence, 653 - 662
Gutachtengarantie



So viele Tage, wie Sie nach dem Semester brauchen,
um Ihre Ausarbeitung fertigzustellen,
So viele Tage habe ich danach, um das Gutachten zu
machen.
Es liegt also an Ihnen, wann Sie Ihren Schein
bekommen!
Referatvergabe





16.10. McCallum et al. (1999),
Vorwissen: Viterbi Algorithmus
23.10. Menczer (2002),
Vorwissen: Neuronale Netze, Multiagentensysteme,
Information Retrieval
evtl. 2-3 Studierende
30.10. Joachims (2002) Vorwissen: SVM
6.11. Jatowt et al (2004) Vorwissen: Co-citation
evtl. 16.10., jedenfalls nur ½ Sitzung
Joachims et al. (1995) Vorwissen: nearest neighbor
13.11. Kappel et al. (2001) evtl. 2 Studierende
continued





20.11. Cooley et al. (1999)
Vorwissen: frequent set mining
27.11.Büchner/Mulvenna (1998)
Vorwissen: data cubes
4.12. Paganelli/Paterno (2002) evtl. streichen
Bonchi et al. (2001)
Vorwissen: frequent set mining, Decision tree
learning, SQL
11.12. Kosala/Blockeel (2000)
Vorwissen: Information extraction, Latent Semantic
Indexing, HIT/PageRank, Wrapper Induction
evtl. streichen
18.12. Liu et al (2006)
Vorwissen: Statistik
continued





8.1. Agarwal et al. (2006)
Vorwissen: Naive Bayes, (transductive) SVM,
Expectation Minimization, Dichtefunktion
15.1. Charikar et al. (1997)
Vorwissen:Komplexitätstheorie
22.1. Mobasha et al. (1999) evtl. streichen
Vorwissen: frequent set mining,
29.1. Wurst et al. (2006)
Vorwissen: clustering
5.2. Abschlussbesprechung
Herunterladen