Zentralität und Sichtbarkeit . 1 / 44

Werbung
. Zentralität und Sichtbarkeit
Bernhard Rieder
Université de Paris VIII – Vincennes Saint Denis
Laboratoire Paragraphe / Département Hypermédia
Zentralität und Sichtbarkeit
Mathematik als Hierarchisierungsinstrument am Beispiel der
frühen Bibliometrie
Vor Google - Suchmaschinen im analogen Zeitalter
Universität Wien
11 / 10 / 2008
. 1 / 44
Titel
. Zentralität und Sichtbarkeit
Der Kontext dieser Präsentation
Der Wandel einer Disziplin reflektiert den Wandel im Umgang mit
Information: von der Bibliothekswissenschaft zur Dokumentation zur
Informationswissenschaft.
Hand in Hand geht der Wandel zu modernen, weitgehend auf
Mathematik aufbauenden Suchverfahren.
Die historische Betrachtung als die Suche nach Suchkonzepten in
Suchmaschinen.
. 2 / 44
Kontext
. Zentralität und Sichtbarkeit
Aufbau dieser Präsentation
1) Informationsflut und zwei bekannte Lösungsansätze
2) Der Science Citation Index
3) Zentralität und Sichtbarkeit
. 3 / 44
Aufbau
. Zentralität und Sichtbarkeit
1
Die Kontrollrevolution
"Die kommerzielle Revolution schafft die Voraussetzungen für die industrielle Revolution.
[…] Die Industrialisierung stellt ihrerseits, von den 1840ern bis zu den 1880ern, die
Kontrolle des Systems in Frage und startet eine Revolution in Bereich der
Informationsverarbeitung und Kommunikation die bis heute andauert." [ Beninger, 1986,
The Control Revolution ]
Laut Beninger führt die Beschleunigung in Güterproduktion und transport zu hohem Innovationsdruck im Bereich der
Informationsverarbeitung. Diese bedingt eine Beschleunigung aller
anderen Gesellschaftsbereiche, insb. der Wissenschaft.
. 4 / 44
I - Historischer Kontext
. Zentralität und Sichtbarkeit
Zwei Pioniere, zwei Ansätze
"Es gibt einen wachsenden Berg von Forschungen. Aber gleichzeitig wird zunehmend
klar, dass wir uns in einer immer stärkeren Spezialisierung festfahren. Der Forschende ist
überwältigt durch die Ergebnisse und Schlussfolgerungen tausender anderer
Arbeitender." [ Bush, 1945, As We May Think ]
Zwei Lösungsansätze:
1) Ordnung: Paul Otlet ( 1868-1944 )
2) Assoziation: Vannevar Bush ( 1890-1974 )
. 5 / 44
I - Zwei Pioniere, zwei Ansätze
. Zentralität und Sichtbarkeit
Lösung I : Ordnung
Paul Otlet und Henri Lafontaine publizieren 1905 die universelle
Dezimalklassifikation ( UDC ) und schaffen 1895 mit dem Mundaneum
die "totale Bibliothek".
Die "analoge Suchmaschine" [ Wright, 2007 ] durchsucht 15M
Indexkarten ( 1934 ), behandelt 1500 "Suchanfragen" pro Jahr.
. 6 / 44
I - Lösung I : Ordnung
. Zentralität und Sichtbarkeit
. 7 / 44
IMAGE: L'univers => la science
. Zentralität und Sichtbarkeit
. 8 / 44
IMAGE: L'UDC
. Zentralität und Sichtbarkeit
. 9 / 44
IMAGE: Fichiers
. Zentralität und Sichtbarkeit
. 10 / 44
SCREEN: dmoz.org
. Zentralität und Sichtbarkeit
Lösung II : Assoziation
"Es ist vor allem die Künstlichkeit der Indizierungssysteme, die es erschwert, Zugang zu
den Aufzeichnungen zu bekommen. Egal, welche Daten man in ein Archiv aufnimmt, sie
werden alphabetisch oder numerisch abgelegt, und die Information wird (wenn
überhaupt) wieder gefunden, indem man Unterabteilung für Unterabteilung durchgeht.
Die jeweilige Information kann sich nur an einem Ort befinden, es sei denn, es werden
Duplikate benutzt. Zum Auffinden mittels Pfad braucht man Regeln, und diese sind
umständlich." [ Bush, 1945, As We May Think ]
"Stellen Sie sich ein künftiges Arbeitsgerät zum persönlichen Gebrauch vor, das eine Art
mechanisierten privaten Archivs oder Bibliothek darstellt." [ ibid. ]
. 11 / 44
I - Lösung II : Assoziation
. Zentralität und Sichtbarkeit
. 12 / 44
IMAGE: Memex Machine
. Zentralität und Sichtbarkeit
Welchen Platz für Bushs Vision?
"[Bush] ist am besten bekannt im Bereich der Informationssuche, obwohl seine Systeme
wohl kaum funktioniert hätten, seine Ideen nicht neu waren, er nicht wirklich verstand
worüber er sprach und er die Vorgängerschaft anderer zu ignorieren entschied." [
Buckland, History of Science Information Systems, 1998 ]
Bush ist der "Ingenieur des amerikanischen Jahrhunderts"
[ Zachary, 1999 ] und eine zentrale Figur in der Finanzierung von
Wissenschaft ab 1939. Eine Referenz zu "As We May Think" ist eine
Form Legitimität zu konstruieren.
Was Bush "assoziatives Indizieren" nennt ist persönliches
Informationsmanagement, keine Suchmaschine.
. 13 / 44
I - Welchen Platz für Bush?
. Zentralität und Sichtbarkeit
. 14 / 44
SCREEN: concept map
. Zentralität und Sichtbarkeit
. 15 / 44
SCREEN: delicious.com
. Zentralität und Sichtbarkeit
2
Eugene Garfield ( 1925- )
Garfield ist Chemiker, stolpert in ein
medizinisches Indizierungsprojekt.
"Eine wirkliche Flut an Literatur wird jedes Jahr
publiziert und sie wächst jedes Jahr nach geometrischen Proportionen."
[ Garfield, 1952, The Crisis in Chemical Literature ]
"Unvollständige Erfassung der Literatur, ein Mangel an Aktualität und die Zeit die für die
Indizierung der extrahierten Information benötigt wird."
[ Garfield, 1952, Machine Methods ]
"Schnelligkeit, essentiell für Wissenschaftler, wurde komplett geopfert um die für
Bibliothekare so wichtige Suchfunktion zu verbessern." [ Garfield, 2002, Origins of
Citation Indexing ]
. 16 / 44
II - Eugene Garfield
. Zentralität und Sichtbarkeit
. 17 / 44
IMAGE : Scientific Papers
. Zentralität und Sichtbarkeit
. 18 / 44
IMAGE : Scientific Abstracts
. Zentralität und Sichtbarkeit
Ein dritter Weg: Zitate als Assoziationswege
In der Common Law Tradition fehlt die enzyklopädische Referenz eines
feingliedrigen Gesetzeskorpus, Jurisprudenz dominiert
Gerichtsentscheidungen, aber die Suche nach Präzedenzfällen
benötigt viel Zeit.
Seit 1873 dokumentiert Shepard‘s Citations die Bezüge zwischen
Gerichtsurteilen in einer Zitationsdatenbank.
1953 kontaktiert W. C. Adair Garfield, dieser schreibt 1954 einen Text
mit dem Titel "Shepardizing the Scientific Literature".
. 19 / 44
II - Ein dritter Weg
. Zentralität und Sichtbarkeit
Wissenschaftliche Zitationsindizes
Garfield verbindet :
- ein konzeptuelles Prinzip
- ein numerisches Kodierungsverfahren
- mechanische Verarbeitungsmethoden
- ein funktionierendes Geschäftsmodell
1955:
Citation Indexes for Science: A New Dimension in Documentation
Association of Ideas. Science
1960:
Gründung des Institute for Scientific Information (ISI)
1961:
Index Chemicus
1963:
Science Citation Index (SCI)
1972:
Social Sciences Citation Index
2008:
Web of Science indiziert 9300 Journals ab 1900
. 20 / 44
II - Wissenschaftliche Zitationsindizes
through
. Zentralität und Sichtbarkeit
Wie funktioniert der Science Citation Index (SCI)?
Erscheint zum ersten mal 1963 in fünf gedruckten Bänden und indiziert
613 Journals und 1.4M Zitate aus dem Jahr 1961.
Für jeden Quellartikel und jedes Zitat wir eine Indexkarte erstellt und
diese werden mechanisch in drei Indizes sortiert:
Patent Index:
Listet alle zitierten Patente und ihre Zitationsquellen.
Source Index:
Listet für jeden erfassten Artikel die zitierten Papers.
Citation Index:
Listet für alle zitierten Papers die zitierenden Artikel.
Der SCI ist in erster Linie als Suchwerkzeug gedacht.
. 21 / 44
II - Wie funktioniert der SCI?
. Zentralität und Sichtbarkeit
. 22 / 44
IMAGE: Citation Index
. Zentralität und Sichtbarkeit
Der SCI als Suchmaschine
Die prinzipielle Idee: Zitate sind inhaltlich signifikant.
Jedes Paper ist ein Einstieg in das Zitationsnetzwerk.
Von einem Paper kann in der Zeit nach vorne ( Citation Index ) und
zurück ( Source Index ) gesucht werden : "cycling".
"Bibliographic coupling" verbindet nicht verbundene Artikel.
Der Automatic Subject Citation Alert ( ASCA ) benachrichtigt
Abonnenten wöchentlich über Zitierungen einzelner Papers.
. 23 / 44
II - Der SCI als Suchmaschine
. Zentralität und Sichtbarkeit
Die Vorteile des SCI
Passt sich wissenschaftlichen Veränderungen an da kein kontrolliertes
Vokabular angepasst werden muss.
Die Indizierung benötigt kein Expertenwissen, das Wissen steckt in der
Zitierungspraxis der Autoren.
Kennt keine Disziplingrenzen.
Ist leicht zu erweitern und verbindet Altes mit Neuem.
Basiert auf einer kompletten Codierung. (20 bit !)
. 24 / 44
II - Die Vorteile des SCI
. Zentralität und Sichtbarkeit
Der SCI als Datenbestand
Zitationsindizes sind potentiell Objekte für unterschiedliche Zähl- und
Analyseverfahren. ("Bibliometrie", Pritchard, 1969)
Garfield sprich schon 1955 von einem "impact factor" als
Hilfsinstrument für die Wissenschaftsgeschichte.
Der hohe Grad der Formalisierung des SCI erleichtert statistische
Analysen.
. 25 / 44
II - Der SCI als Datenbestand
. Zentralität und Sichtbarkeit
Derek J. de Solla Price ( 1922-83 )
Der Historiker de Solla Price studiert das
Wachstum und die Halbwertszeit von Papers
und analysiert den SCI mit unterschiedlichen
Methoden.
Publiziert zur Verteilung von Zitaten und Publikationen, erstellt
Wachstumsmodelle und beginnt mit graphentheoretischen
Analyseverfahren zu arbeiten.
. 26 / 44
II - Derek J. de Solla Price
. Zentralität und Sichtbarkeit
. 27 / 44
STAT: Skalenfreies Netzwerk
. Zentralität und Sichtbarkeit
Ein dreifacher Paradigmenwechsel
Enzyklopädie => Exploration
Enzyklopädie: Produktion von Metainformationen über Inhalte
Exploration: Extraktion von Metainformationen aus Inhalten
Klassifizieren => Zählen
Klassifizieren: "subjektives" Beschreiben
Zählen: "objektives" Beschreiben
Kartographie => Graphentheorie
Kartographie: eine Geographie des Wissens
Graphentheorie: verschieden Projektionen des Wissens
. 28 / 44
II - Ein dreifacher Paradigmenwechsel
. Zentralität und Sichtbarkeit
Vom Netzwerk zur Graphentheorie
Ralph Garner zeigt 1967 dass sich Zitationsnetzwerke komplett als
Graphen formalisieren lassen.
Damit werden sehr anspruchsvolle Analysen möglich.
"Die Möglichkeit ein Zitationsnetzwerk in einen Graphen der Beeinflussung zwischen
Autoren zu verwandeln, erlaubt, mit Hilfe der Graphentheorie, die Analyse der
Interaktionen zwischen Autoren. Sie erlaubt z.B. festzustellen welche Autoren eine
'unsichtbare Universität' bilden. Darüber hinaus liefert sie ein quantitatives Maß der
Integriertheit ( cohesiveness ) einer Gruppe von Autoren." [ Garner, 1967, Computer
Oriented Graph Theoretic Analysis of Citation Index Structures ]
. 29 / 44
II - Graphentheorie
. Zentralität und Sichtbarkeit
. 30 / 44
IMAGE: L'UDC
. Zentralität und Sichtbarkeit
. 31 / 44
IMAGE: Citation Graph
. Zentralität und Sichtbarkeit
3
Zentralität im Netzwerk
"Dieser Beitrag ist der Versuch die Natur des gesamten Weltnetzwerks wissenschaftlicher
Artikel zu beschreiben. Wir werden versuchen ein Bild zu zeichnen von dem Netzwerk
das entsteht wenn man jeden einzelnen Artikel mit all jenen verbindet mit denen er direkt
assoziiert ist." [ de Solla Price, 1965, Networks of Scientific Papers ]
"Mit einer solchen Topographie könnte man vielleicht die Überschneidung und relative
Wichtigkeit von Journals, und sogar Nationen, Autoren oder individuellen Artikeln
bestimmen, bedingt durch den Platz den diese in den Karten einnehmen; und durch
deren Zentralität in einem bestimmten Strang." [ ibid. ]
. 32 / 44
III - Zentralität im Netzwerk
. Zentralität und Sichtbarkeit
Der omnipräsente "impact factor"
Gross & Gross stellen 1927 eine auf Zitationszählungen basiert
Methode vor, die zur Entscheidungshilfe bei der Anschaffung
wissenschaftlicher Journals für Bibliotheken helfen soll.
Der impact factor ( Zitate / Artikel ) wird progressiv zum wichtigsten
Bewertungsinstrument wissenschaftlicher Produktivität und Qualität.
. 33 / 44
III - Impact Factor
. Zentralität und Sichtbarkeit
. 34 / 44
IMAGE: Most cited journal articles
. Zentralität und Sichtbarkeit
. 35 / 44
STAT: Skalenfreies Netzwerk
. Zentralität und Sichtbarkeit
. 36 / 44
IMAGE: Times ranking history journals
. Zentralität und Sichtbarkeit
. 37 / 44
SCREEN: Google
. Zentralität und Sichtbarkeit
Ein vierter Paradigmenwechsel
"Die Aufgabe ist nicht Systeme zur Informationsverteilung zu konzipieren
sondern intelligente Systeme zur Informationsfilterung." [ Simon, 1968,
Sciences of the Artificial ]
Vom Mangel zum Überfluss, vom Finden zum Filtern:
- Klassifikation versucht in erster Linie dabei zu helfen etwas
zu einem Thema zu finden.
- Moderne Zählverfahren dienen vor allem zum Filtern und
Ordnen nach Wichtigkeit, Relevanz, Einfluss, etc.
Von Suchmaschinen zu Maschinen der Sichtbarkeit!
. 38 / 44
III - Ein vierter Paradigmenwechsel
. Zentralität und Sichtbarkeit
Die Sichtbarkeitslogik des preferential attachment
Zentralität bedingt Sichtbarkeit bedingt Zentralität
Hoher impact factor => hohe Sichtbarkeit => viele Zitate
Matthäus-Effekt [Merton, The Mathew Effect in Science, 1968]
"Denn wer da hat, dem wird gegeben werden."
[ Matthäus 25,29 ]
Zitationsbasierte Zählverfahren verschärfen das Starsystem.
. 39 / 44
III - Die Logik des preferential attachment
. Zentralität und Sichtbarkeit
PageRank: eine Methode der Sichtbarkeitsmodulation
PR(A) = ( 1-d ) + d ( PR(T1) / C(T1) + ... + PR(Tn) / C(Tn) )
"PageRank nimmt eine objektive Bewertung der Wichtigkeit von Webseiten vor. Dabei
wird eine Gleichung mit 500 Millionen Variablen und über 2 Milliarden Begriffen
berechnet. Anstatt die direkten Links zu zählen, interpretiert Page Rank im Wesentlichen
einen Link von Seite A auf Seite B als 'Votum' von Seite A für Seite B. PageRank
bewertet dann die Wichtigkeit einer Seite nach den erzielten Voten."
[ http://www.google.de/corporate/tech.html ]
PageRank unterscheidet sich vom 'normalen' impact factor durch eine
rekursive Bewertung: ein Zitat ( Link ) von einem viel zitierten Text (
Webpage ) ist mehr wert. Aber: je mehr ausgehende Zitate, desto
weniger Wert wird transferiert.
. 40 / 44
III - PageRank
. Zentralität und Sichtbarkeit
Eine Kultur der Zahlen
"Die Tendenz zu mehr Transparenz und Verantwortlichkeit in der akademischen Welt hat
eine 'Kultur der Zahlen' geschaffen in der Institutionen und Individuen glauben dass faire
Entscheidungen durch algorithmische Bewertung statistischer Daten getroffen werden
können. Unfähig Qualität zu messen ( das ultimative Ziel ), ersetzen
Entscheidungsträger Qualität durch messbare Zahlen." [ Adler et al., 2008, Citation
Statistics, IMU ]
Zählverfahren sind notwendigerweise partiell, gerichtet, selektiv, stark
interpretationsbedürftig und anfällig für Verfälschungen.
Gleichzeitig werden diese Verfahren immer dominanter.
. 41 / 44
III - Eine Kultur der Zahlen
. Zentralität und Sichtbarkeit
Eine Kultur der Zahlen ohne Zahlenkultur
Wir leben in einer Kultur die von komplexen Ordnungs- und
Zählverfahren dominiert wird, aber unsere kritische Kultur ist
gleichzeitig "atechnisch" und "anumerisch".
Wie kann eine geisteswissenschaftliche Kritik moderner Zählverfahren
aussehen?
Sichtbarkeitslogiken dechiffrieren! Macht beschreiben!
. 42 / 44
III - Eine Kultur der Zahlen ohne Zahlenkultur
. Zentralität und Sichtbarkeit
Schlussfolgerungen
Die Rückführung moderner Techniken auf historische Formen ist
notwendig und notwendigerweise partiell.
Der Umgang mit Information verändert sich im 20.Jh radikal.
Die Informationswissenschaft darf nicht Informatik werden!
. 43 / 44
Schlussfolgerungen
. Zentralität und Sichtbarkeit
Danke für Ihre Aufmerksamkeit!
[email protected]
http://bernhard.rieder.fr
http://thepoliticsofsystems.net
. 44 / 44
Ende
Herunterladen