1. Wettbewerb Datenfusion Informationsintegration

Werbung
1. Wettbewerb
Datenfusion
Informationsintegration
SoSe 2012
Aufgabenstellung
Schreiben Sie ein Programm in Java/C++/Perl,
welches nach Eingabe eines Autors, den HirschIndex für diesen Autor ermittelt
Hirsch Index - Definition
Wikipedia:
Ein Wissenschaftler hat einen Hirsch-Index
h, wenn h von seinen insgesamt N
Publikationen mindestens h-mal, die
restlichen (N – h) Publikationen höchstens
h-mal zitiert wurden.
Hirsch Index - Beispiel
-
Beitrag A: 5 Mal zitiert
Beitrag B: 2 Mal zitiert
Beitrag C: 3 Mal zitiert
Beitrag D: 1 Mal zitiert
Beitrag E: 3 Mal zitiert
=> Sortierung: 5,3,3,2,1
- Hirsch-Index=3
Ressourcen
- Citeseer: http://citeseerx.ist.psu.edu
- Keine anderen Quellen ...
Eingabeformat
- Namen können durch den Benutzer von
eurem Programm in folgenden Formaten
eingegeben werden
- Nachame, Vorname
- Vorname Nachname
Hinweis
- Es gibt keine eindeutige Lösung – oder
zumindest wird keine erwartet!
- Wichtig ist, dass ihr eure Heuristiken
(Duplikateeliminierung, Namensbehandlung)
sinnvoll erklären könnt
Wettbewerb
- Ranking basierend auf der Berechnungdauer
(+ „Korrektheit“)
- Wettbewerbspunkte:
- 1. Gruppe: 5 Punkte
- 2. Gruppe: 3 Punkte
- 3. Gruppe: 2 Punkte
Abgabe
- Bis 06.05.2012 per Mail an Sebastian Wandelt
- Bestandteil der Mail
- Quelltext
- Kurze Anleitung zur Kompilierung/Ausführung/
Benutzung
- Euer berechneter Hirsch-Index für „Keijzer,
Maarten“ und die Berechnungsdauer
- Euer berechneter Hirsch-Index für „Franz Baader“
und die Berechnungsdauer
Herunterladen