. Zentralität und Sichtbarkeit Bernhard Rieder Université de Paris VIII – Vincennes Saint Denis Laboratoire Paragraphe / Département Hypermédia Zentralität und Sichtbarkeit Mathematik als Hierarchisierungsinstrument am Beispiel der frühen Bibliometrie Vor Google - Suchmaschinen im analogen Zeitalter Universität Wien 11 / 10 / 2008 . 1 / 44 Titel . Zentralität und Sichtbarkeit Der Kontext dieser Präsentation Der Wandel einer Disziplin reflektiert den Wandel im Umgang mit Information: von der Bibliothekswissenschaft zur Dokumentation zur Informationswissenschaft. Hand in Hand geht der Wandel zu modernen, weitgehend auf Mathematik aufbauenden Suchverfahren. Die historische Betrachtung als die Suche nach Suchkonzepten in Suchmaschinen. . 2 / 44 Kontext . Zentralität und Sichtbarkeit Aufbau dieser Präsentation 1) Informationsflut und zwei bekannte Lösungsansätze 2) Der Science Citation Index 3) Zentralität und Sichtbarkeit . 3 / 44 Aufbau . Zentralität und Sichtbarkeit 1 Die Kontrollrevolution "Die kommerzielle Revolution schafft die Voraussetzungen für die industrielle Revolution. […] Die Industrialisierung stellt ihrerseits, von den 1840ern bis zu den 1880ern, die Kontrolle des Systems in Frage und startet eine Revolution in Bereich der Informationsverarbeitung und Kommunikation die bis heute andauert." [ Beninger, 1986, The Control Revolution ] Laut Beninger führt die Beschleunigung in Güterproduktion und transport zu hohem Innovationsdruck im Bereich der Informationsverarbeitung. Diese bedingt eine Beschleunigung aller anderen Gesellschaftsbereiche, insb. der Wissenschaft. . 4 / 44 I - Historischer Kontext . Zentralität und Sichtbarkeit Zwei Pioniere, zwei Ansätze "Es gibt einen wachsenden Berg von Forschungen. Aber gleichzeitig wird zunehmend klar, dass wir uns in einer immer stärkeren Spezialisierung festfahren. Der Forschende ist überwältigt durch die Ergebnisse und Schlussfolgerungen tausender anderer Arbeitender." [ Bush, 1945, As We May Think ] Zwei Lösungsansätze: 1) Ordnung: Paul Otlet ( 1868-1944 ) 2) Assoziation: Vannevar Bush ( 1890-1974 ) . 5 / 44 I - Zwei Pioniere, zwei Ansätze . Zentralität und Sichtbarkeit Lösung I : Ordnung Paul Otlet und Henri Lafontaine publizieren 1905 die universelle Dezimalklassifikation ( UDC ) und schaffen 1895 mit dem Mundaneum die "totale Bibliothek". Die "analoge Suchmaschine" [ Wright, 2007 ] durchsucht 15M Indexkarten ( 1934 ), behandelt 1500 "Suchanfragen" pro Jahr. . 6 / 44 I - Lösung I : Ordnung . Zentralität und Sichtbarkeit . 7 / 44 IMAGE: L'univers => la science . Zentralität und Sichtbarkeit . 8 / 44 IMAGE: L'UDC . Zentralität und Sichtbarkeit . 9 / 44 IMAGE: Fichiers . Zentralität und Sichtbarkeit . 10 / 44 SCREEN: dmoz.org . Zentralität und Sichtbarkeit Lösung II : Assoziation "Es ist vor allem die Künstlichkeit der Indizierungssysteme, die es erschwert, Zugang zu den Aufzeichnungen zu bekommen. Egal, welche Daten man in ein Archiv aufnimmt, sie werden alphabetisch oder numerisch abgelegt, und die Information wird (wenn überhaupt) wieder gefunden, indem man Unterabteilung für Unterabteilung durchgeht. Die jeweilige Information kann sich nur an einem Ort befinden, es sei denn, es werden Duplikate benutzt. Zum Auffinden mittels Pfad braucht man Regeln, und diese sind umständlich." [ Bush, 1945, As We May Think ] "Stellen Sie sich ein künftiges Arbeitsgerät zum persönlichen Gebrauch vor, das eine Art mechanisierten privaten Archivs oder Bibliothek darstellt." [ ibid. ] . 11 / 44 I - Lösung II : Assoziation . Zentralität und Sichtbarkeit . 12 / 44 IMAGE: Memex Machine . Zentralität und Sichtbarkeit Welchen Platz für Bushs Vision? "[Bush] ist am besten bekannt im Bereich der Informationssuche, obwohl seine Systeme wohl kaum funktioniert hätten, seine Ideen nicht neu waren, er nicht wirklich verstand worüber er sprach und er die Vorgängerschaft anderer zu ignorieren entschied." [ Buckland, History of Science Information Systems, 1998 ] Bush ist der "Ingenieur des amerikanischen Jahrhunderts" [ Zachary, 1999 ] und eine zentrale Figur in der Finanzierung von Wissenschaft ab 1939. Eine Referenz zu "As We May Think" ist eine Form Legitimität zu konstruieren. Was Bush "assoziatives Indizieren" nennt ist persönliches Informationsmanagement, keine Suchmaschine. . 13 / 44 I - Welchen Platz für Bush? . Zentralität und Sichtbarkeit . 14 / 44 SCREEN: concept map . Zentralität und Sichtbarkeit . 15 / 44 SCREEN: delicious.com . Zentralität und Sichtbarkeit 2 Eugene Garfield ( 1925- ) Garfield ist Chemiker, stolpert in ein medizinisches Indizierungsprojekt. "Eine wirkliche Flut an Literatur wird jedes Jahr publiziert und sie wächst jedes Jahr nach geometrischen Proportionen." [ Garfield, 1952, The Crisis in Chemical Literature ] "Unvollständige Erfassung der Literatur, ein Mangel an Aktualität und die Zeit die für die Indizierung der extrahierten Information benötigt wird." [ Garfield, 1952, Machine Methods ] "Schnelligkeit, essentiell für Wissenschaftler, wurde komplett geopfert um die für Bibliothekare so wichtige Suchfunktion zu verbessern." [ Garfield, 2002, Origins of Citation Indexing ] . 16 / 44 II - Eugene Garfield . Zentralität und Sichtbarkeit . 17 / 44 IMAGE : Scientific Papers . Zentralität und Sichtbarkeit . 18 / 44 IMAGE : Scientific Abstracts . Zentralität und Sichtbarkeit Ein dritter Weg: Zitate als Assoziationswege In der Common Law Tradition fehlt die enzyklopädische Referenz eines feingliedrigen Gesetzeskorpus, Jurisprudenz dominiert Gerichtsentscheidungen, aber die Suche nach Präzedenzfällen benötigt viel Zeit. Seit 1873 dokumentiert Shepard‘s Citations die Bezüge zwischen Gerichtsurteilen in einer Zitationsdatenbank. 1953 kontaktiert W. C. Adair Garfield, dieser schreibt 1954 einen Text mit dem Titel "Shepardizing the Scientific Literature". . 19 / 44 II - Ein dritter Weg . Zentralität und Sichtbarkeit Wissenschaftliche Zitationsindizes Garfield verbindet : - ein konzeptuelles Prinzip - ein numerisches Kodierungsverfahren - mechanische Verarbeitungsmethoden - ein funktionierendes Geschäftsmodell 1955: Citation Indexes for Science: A New Dimension in Documentation Association of Ideas. Science 1960: Gründung des Institute for Scientific Information (ISI) 1961: Index Chemicus 1963: Science Citation Index (SCI) 1972: Social Sciences Citation Index 2008: Web of Science indiziert 9300 Journals ab 1900 . 20 / 44 II - Wissenschaftliche Zitationsindizes through . Zentralität und Sichtbarkeit Wie funktioniert der Science Citation Index (SCI)? Erscheint zum ersten mal 1963 in fünf gedruckten Bänden und indiziert 613 Journals und 1.4M Zitate aus dem Jahr 1961. Für jeden Quellartikel und jedes Zitat wir eine Indexkarte erstellt und diese werden mechanisch in drei Indizes sortiert: Patent Index: Listet alle zitierten Patente und ihre Zitationsquellen. Source Index: Listet für jeden erfassten Artikel die zitierten Papers. Citation Index: Listet für alle zitierten Papers die zitierenden Artikel. Der SCI ist in erster Linie als Suchwerkzeug gedacht. . 21 / 44 II - Wie funktioniert der SCI? . Zentralität und Sichtbarkeit . 22 / 44 IMAGE: Citation Index . Zentralität und Sichtbarkeit Der SCI als Suchmaschine Die prinzipielle Idee: Zitate sind inhaltlich signifikant. Jedes Paper ist ein Einstieg in das Zitationsnetzwerk. Von einem Paper kann in der Zeit nach vorne ( Citation Index ) und zurück ( Source Index ) gesucht werden : "cycling". "Bibliographic coupling" verbindet nicht verbundene Artikel. Der Automatic Subject Citation Alert ( ASCA ) benachrichtigt Abonnenten wöchentlich über Zitierungen einzelner Papers. . 23 / 44 II - Der SCI als Suchmaschine . Zentralität und Sichtbarkeit Die Vorteile des SCI Passt sich wissenschaftlichen Veränderungen an da kein kontrolliertes Vokabular angepasst werden muss. Die Indizierung benötigt kein Expertenwissen, das Wissen steckt in der Zitierungspraxis der Autoren. Kennt keine Disziplingrenzen. Ist leicht zu erweitern und verbindet Altes mit Neuem. Basiert auf einer kompletten Codierung. (20 bit !) . 24 / 44 II - Die Vorteile des SCI . Zentralität und Sichtbarkeit Der SCI als Datenbestand Zitationsindizes sind potentiell Objekte für unterschiedliche Zähl- und Analyseverfahren. ("Bibliometrie", Pritchard, 1969) Garfield sprich schon 1955 von einem "impact factor" als Hilfsinstrument für die Wissenschaftsgeschichte. Der hohe Grad der Formalisierung des SCI erleichtert statistische Analysen. . 25 / 44 II - Der SCI als Datenbestand . Zentralität und Sichtbarkeit Derek J. de Solla Price ( 1922-83 ) Der Historiker de Solla Price studiert das Wachstum und die Halbwertszeit von Papers und analysiert den SCI mit unterschiedlichen Methoden. Publiziert zur Verteilung von Zitaten und Publikationen, erstellt Wachstumsmodelle und beginnt mit graphentheoretischen Analyseverfahren zu arbeiten. . 26 / 44 II - Derek J. de Solla Price . Zentralität und Sichtbarkeit . 27 / 44 STAT: Skalenfreies Netzwerk . Zentralität und Sichtbarkeit Ein dreifacher Paradigmenwechsel Enzyklopädie => Exploration Enzyklopädie: Produktion von Metainformationen über Inhalte Exploration: Extraktion von Metainformationen aus Inhalten Klassifizieren => Zählen Klassifizieren: "subjektives" Beschreiben Zählen: "objektives" Beschreiben Kartographie => Graphentheorie Kartographie: eine Geographie des Wissens Graphentheorie: verschieden Projektionen des Wissens . 28 / 44 II - Ein dreifacher Paradigmenwechsel . Zentralität und Sichtbarkeit Vom Netzwerk zur Graphentheorie Ralph Garner zeigt 1967 dass sich Zitationsnetzwerke komplett als Graphen formalisieren lassen. Damit werden sehr anspruchsvolle Analysen möglich. "Die Möglichkeit ein Zitationsnetzwerk in einen Graphen der Beeinflussung zwischen Autoren zu verwandeln, erlaubt, mit Hilfe der Graphentheorie, die Analyse der Interaktionen zwischen Autoren. Sie erlaubt z.B. festzustellen welche Autoren eine 'unsichtbare Universität' bilden. Darüber hinaus liefert sie ein quantitatives Maß der Integriertheit ( cohesiveness ) einer Gruppe von Autoren." [ Garner, 1967, Computer Oriented Graph Theoretic Analysis of Citation Index Structures ] . 29 / 44 II - Graphentheorie . Zentralität und Sichtbarkeit . 30 / 44 IMAGE: L'UDC . Zentralität und Sichtbarkeit . 31 / 44 IMAGE: Citation Graph . Zentralität und Sichtbarkeit 3 Zentralität im Netzwerk "Dieser Beitrag ist der Versuch die Natur des gesamten Weltnetzwerks wissenschaftlicher Artikel zu beschreiben. Wir werden versuchen ein Bild zu zeichnen von dem Netzwerk das entsteht wenn man jeden einzelnen Artikel mit all jenen verbindet mit denen er direkt assoziiert ist." [ de Solla Price, 1965, Networks of Scientific Papers ] "Mit einer solchen Topographie könnte man vielleicht die Überschneidung und relative Wichtigkeit von Journals, und sogar Nationen, Autoren oder individuellen Artikeln bestimmen, bedingt durch den Platz den diese in den Karten einnehmen; und durch deren Zentralität in einem bestimmten Strang." [ ibid. ] . 32 / 44 III - Zentralität im Netzwerk . Zentralität und Sichtbarkeit Der omnipräsente "impact factor" Gross & Gross stellen 1927 eine auf Zitationszählungen basiert Methode vor, die zur Entscheidungshilfe bei der Anschaffung wissenschaftlicher Journals für Bibliotheken helfen soll. Der impact factor ( Zitate / Artikel ) wird progressiv zum wichtigsten Bewertungsinstrument wissenschaftlicher Produktivität und Qualität. . 33 / 44 III - Impact Factor . Zentralität und Sichtbarkeit . 34 / 44 IMAGE: Most cited journal articles . Zentralität und Sichtbarkeit . 35 / 44 STAT: Skalenfreies Netzwerk . Zentralität und Sichtbarkeit . 36 / 44 IMAGE: Times ranking history journals . Zentralität und Sichtbarkeit . 37 / 44 SCREEN: Google . Zentralität und Sichtbarkeit Ein vierter Paradigmenwechsel "Die Aufgabe ist nicht Systeme zur Informationsverteilung zu konzipieren sondern intelligente Systeme zur Informationsfilterung." [ Simon, 1968, Sciences of the Artificial ] Vom Mangel zum Überfluss, vom Finden zum Filtern: - Klassifikation versucht in erster Linie dabei zu helfen etwas zu einem Thema zu finden. - Moderne Zählverfahren dienen vor allem zum Filtern und Ordnen nach Wichtigkeit, Relevanz, Einfluss, etc. Von Suchmaschinen zu Maschinen der Sichtbarkeit! . 38 / 44 III - Ein vierter Paradigmenwechsel . Zentralität und Sichtbarkeit Die Sichtbarkeitslogik des preferential attachment Zentralität bedingt Sichtbarkeit bedingt Zentralität Hoher impact factor => hohe Sichtbarkeit => viele Zitate Matthäus-Effekt [Merton, The Mathew Effect in Science, 1968] "Denn wer da hat, dem wird gegeben werden." [ Matthäus 25,29 ] Zitationsbasierte Zählverfahren verschärfen das Starsystem. . 39 / 44 III - Die Logik des preferential attachment . Zentralität und Sichtbarkeit PageRank: eine Methode der Sichtbarkeitsmodulation PR(A) = ( 1-d ) + d ( PR(T1) / C(T1) + ... + PR(Tn) / C(Tn) ) "PageRank nimmt eine objektive Bewertung der Wichtigkeit von Webseiten vor. Dabei wird eine Gleichung mit 500 Millionen Variablen und über 2 Milliarden Begriffen berechnet. Anstatt die direkten Links zu zählen, interpretiert Page Rank im Wesentlichen einen Link von Seite A auf Seite B als 'Votum' von Seite A für Seite B. PageRank bewertet dann die Wichtigkeit einer Seite nach den erzielten Voten." [ http://www.google.de/corporate/tech.html ] PageRank unterscheidet sich vom 'normalen' impact factor durch eine rekursive Bewertung: ein Zitat ( Link ) von einem viel zitierten Text ( Webpage ) ist mehr wert. Aber: je mehr ausgehende Zitate, desto weniger Wert wird transferiert. . 40 / 44 III - PageRank . Zentralität und Sichtbarkeit Eine Kultur der Zahlen "Die Tendenz zu mehr Transparenz und Verantwortlichkeit in der akademischen Welt hat eine 'Kultur der Zahlen' geschaffen in der Institutionen und Individuen glauben dass faire Entscheidungen durch algorithmische Bewertung statistischer Daten getroffen werden können. Unfähig Qualität zu messen ( das ultimative Ziel ), ersetzen Entscheidungsträger Qualität durch messbare Zahlen." [ Adler et al., 2008, Citation Statistics, IMU ] Zählverfahren sind notwendigerweise partiell, gerichtet, selektiv, stark interpretationsbedürftig und anfällig für Verfälschungen. Gleichzeitig werden diese Verfahren immer dominanter. . 41 / 44 III - Eine Kultur der Zahlen . Zentralität und Sichtbarkeit Eine Kultur der Zahlen ohne Zahlenkultur Wir leben in einer Kultur die von komplexen Ordnungs- und Zählverfahren dominiert wird, aber unsere kritische Kultur ist gleichzeitig "atechnisch" und "anumerisch". Wie kann eine geisteswissenschaftliche Kritik moderner Zählverfahren aussehen? Sichtbarkeitslogiken dechiffrieren! Macht beschreiben! . 42 / 44 III - Eine Kultur der Zahlen ohne Zahlenkultur . Zentralität und Sichtbarkeit Schlussfolgerungen Die Rückführung moderner Techniken auf historische Formen ist notwendig und notwendigerweise partiell. Der Umgang mit Information verändert sich im 20.Jh radikal. Die Informationswissenschaft darf nicht Informatik werden! . 43 / 44 Schlussfolgerungen . Zentralität und Sichtbarkeit Danke für Ihre Aufmerksamkeit! [email protected] http://bernhard.rieder.fr http://thepoliticsofsystems.net . 44 / 44 Ende