PG Intelligence Service Gezielte Suche im Internet Forschung Praxis Lehrstuhl für künstliche Intelligenz Informationen im Internet • Suchmaschinen: – Es werden nur Dokumente geliefert, die den Suchbegriff enthalten. – Die Seiten sind von sehr unterschiedlicher Qualität. – Vorwissen über zuverlässige Seiten und ihre Struktur wird nicht ausgenutzt. Intelligence Service • Zusammenhänge zwischen Dokumenten: – Firmen wollen ihre Konkurrenz beobachten. – Anleger wollen eine Entwicklung verfolgen. – Bürger wollen wissen, wie es zu einer Entscheidung in der Politik kam. • Direkte Fragebeantwortung: – Innerhalb des Dokuments muss die betreffende Textstelle gefunden werden! Forschungsthema Named Entity Recognition! 16.Wahlperiode, Drucksache, Antrag Drs-Nr. Typ Fraktion 16.Wahlperiode, Drucksache, Antrag Drs-Nr. Typ Person 16.Wahlperiode, 57. Sitzung, 19.10.2006, TOP 5 16/2790 16/267 Direkte Fragebeantwortung • Der Antrag der FDP zur Entsorgung radioaktiven Abfalls wurde abgelehnt. • Der Antrag der Grünen zur ergebnisoffenen Standortwahl für Endlagerung radioaktiven Mülls wurde an Ausschüsse verwiesen. Für diese Antworten braucht man manuell 7 Stunden PG-Arbeit • Gezielte Recherche gemäß der Struktur bestimmter Webserver (Suchanfragen) • Indexierung gemäß bestimmter Entitäten: Themen, Personen, Orte, Firmen... • Named Entity Recognition: – Einige Dokumente nach Entitäten annotieren, – maschinell Annotationsregeln lernen – Annotationsregeln anwenden • Informationen zu den Entitäten zusammenstellen Ausführliche PG-Vorstellung Dienstag, 22.05.2007 10.15 Uhr Raum 110 GB IV Fragen an [email protected]