Kurzvorstellung

Werbung
PG
Intelligence Service
Gezielte Suche im Internet
Forschung
Praxis
Lehrstuhl für künstliche Intelligenz
Informationen im Internet
• Suchmaschinen:
– Es werden nur Dokumente geliefert, die den
Suchbegriff enthalten.
– Die Seiten sind von sehr unterschiedlicher
Qualität.
– Vorwissen über zuverlässige Seiten und ihre
Struktur wird nicht ausgenutzt.
Intelligence Service
• Zusammenhänge zwischen Dokumenten:
– Firmen wollen ihre Konkurrenz beobachten.
– Anleger wollen eine Entwicklung verfolgen.
– Bürger wollen wissen, wie es zu einer
Entscheidung in der Politik kam.
• Direkte Fragebeantwortung:
– Innerhalb des Dokuments muss die betreffende
Textstelle gefunden werden! Forschungsthema
Named Entity Recognition!
16.Wahlperiode, Drucksache, Antrag
Drs-Nr.
Typ
Fraktion
16.Wahlperiode, Drucksache, Antrag
Drs-Nr.
Typ
Person
16.Wahlperiode, 57. Sitzung, 19.10.2006, TOP 5
16/2790
16/267
Direkte Fragebeantwortung
• Der Antrag der FDP zur Entsorgung radioaktiven
Abfalls wurde abgelehnt.
• Der Antrag der Grünen zur ergebnisoffenen
Standortwahl für Endlagerung radioaktiven Mülls
wurde an Ausschüsse verwiesen.
Für diese Antworten braucht man manuell 7
Stunden
PG-Arbeit
• Gezielte Recherche gemäß der Struktur
bestimmter Webserver (Suchanfragen)
• Indexierung gemäß bestimmter Entitäten:
Themen, Personen, Orte, Firmen...
• Named Entity Recognition:
– Einige Dokumente nach Entitäten annotieren,
– maschinell Annotationsregeln lernen
– Annotationsregeln anwenden
• Informationen zu den Entitäten
zusammenstellen
Ausführliche PG-Vorstellung
Dienstag, 22.05.2007
10.15 Uhr
Raum 110 GB IV
Fragen an [email protected]
Herunterladen