PPT - KoLaWiss

Werbung
Allianz AG Forschungsdaten
- Auf dem Weg zu einer Policy
im Umgang mit Forschungsdaten
Eine persönliche Sicht von
Hans Pfeiffenberger
Alfred-Wegener-Institut für Polar- und Meeresforschung, Helmholtz Gemeinschaft
KoLaWiss-Workshop 2009-01-27, Göttingen
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
1
Agenda

Die Initiative Digitale Information der „Allianz“

Handlungsfeld „Forschungsprimärdaten“

Andere „Policies“ und vergleichbare Initiativen
=> Disziplinübergreifende, wenig technische Fragestellungen


Zentrale Fragestellungen

Industrielle Datenproduktion vs. „Manufaktur“

Lebenzyklus der Manufaktur

Offener Zugang oder ????

Dauerhafte Bewahrung / Zugang und Kostenstrukturen

Einbettung in die Kultur der Disziplinen und der Wissenschaft
Zusammenfassung
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
2
Allianz der Wissenschaftsorganisationen


11.Juni 2008: Initiative Digitale Information

5 Aktionsfelder, darunter Forschungsdaten:

... Es ist unbestreitbar, dass viele dieser Daten nach einer relativ
kurzen Phase der Auswertung durch Einzelne oder kleine
Gruppen dem Vergessen oder gar dem Verfall ausgesetzt sind.
Hier sehen alle Wissenschaftseinrichtungen einen dringenden
Handlungsbedarf hinsichtlich der systematischen Sicherung,
Archivierung und Bereitstellung dieser Daten für die Nachnutzung
durch Dritte.
AG Forschungsdaten

Momentane Aufgabe: Entwurf einer „Policy im Umgang mit Forschungsdaten“
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
3
ESF / EuroHORCs European Research Area Vision



Starkes Statement der europäischen Forschungsförderer
Bedeutung des Zugangs zum „Output“, insb. Daten,
gleichrangig mit „research institutions“
Erstmals (?) Beschränkung auf qualitätsgesicherte Daten
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
4
Weitere Policies... Institutionen und Gremien

DFG-„Regeln guter wissenschaftlicher Praxis“, Empfehlung 7, 1998

Berliner Erklärung, 2003

OECD Principles and Guidelines for Access to Research Data from Public
Funding, 2007

Policies der Britischen Research Councils

NIH Data Sharing Policy and Implementation Guidance, 2003
--------------------------------------------------------------------------------------

JISC Data Curation Centre (im Rahmen eScience Programm)

.....

Board on Research Data and Information;
Policy and Global Affairs Division, The National Academies, 2009
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
5
Nationale Aktivitäten

Ausschüsse und Kommissionen der DFG

DFG-„Rundgespräche“
=> Disziplinspezifische, „technische“, konkrete Regeln und Empfehlungen

Was bleibt zu tun für die Allianz?
=> Disziplinübergreifende Grundsätze und Themen
=> „Politische“ Aussagen
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
6
Zentrale Fragestellungen


Zielsetzung: Nachvollziehbarkeit und Nachnutzung
Kann es dazu einheitliche Grundsätze oder Empfehlungen geben,
unabhängig von Disziplin und Art der Daten?

Offener Zugang

Einbettung der Regeln in die Kultur der Disziplinen
bzw. die Kultur des wissenschaftlichen Arbeiten? („gute wiss. Praxis“)

Notwendigkeit und Art (neuer) Infrastrukturen

Organisation und Finanzierung
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
7
Offener Zugang zu allen Daten??

Wahrung der (subjektiven) Rechte der „Urheber“


Geldgeber fordert Einnahmen, „Geschäftsmodelle“


Für Daten oder Betrieb der Infrastrukturen
Schutz personenbezogener Daten, „Privacy“


Z.B. Moratorien, Zitierung, bei Datenprodukten: Ko-Autorenschaft
Anonymisierung, „Autorisierter Zugang“
Schutz gefährdeter Arten

„Selective Availability“ (Genauigkeit nicht für Alle)
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
8
Industrielle Datenproduktion / Forderungen der Geldgeber
Well known
instruments
ESA / other gov.
agencies as
stewards
Elaborate technical
infrastructure
(Grid)
Well documented
procedures
Well defined
products

Fusco, L., J. Linford, W.J. Som de Cerff, C. Boone, C. Leroy and M. Petitdidier, Earth Observation Applications
Approach to Data and Metadata Deployment on the European DataGrid Testbed
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
9
Manufaktur: Historische Ozonprofile aus der Antarktis
König-Langlo, G. and Gernandt, H.: Compilation of ozonesonde profiles from the Antarctic GeorgForster-Station from 1985 to 1992, Earth Syst. Sci. Data, 1, 1-5, 2009


Ozon „soundings“ (Ballon-getragene Sonden) aus den Jahren, in denen sich das
„Ozonloch“ entwickelte
Publizierter, qualitätsgesicherter, offen zugänglicher Datensatz
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
10
Handling of Ozone data as State of the Art




These two “datasets” exemplify the two prevailing modes of handling data at
present:
Either at the “Petascale”, where largely homogeneous mounds of data are
handled in an industrial fashion, and collated into one super-dataset,
comparable to a book holding the work of a lifetime
Or at the “Megascale”, where large numbers of heterogeneous datasets are
handled as in a factory (manufaktur), by a craftsperson or an artisan.
They are communicated on demand through mail or via obscure ftp-server,
comparable to the letter from scholar to scholar.
There is almost no in-between, yet, to handle the bulk of information at the
Giga- to Terascale, which would need to be
comparable to the system of academic journals for textual information.
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
11
Klassifizierung von Zugangsdomänen
Domäne der 1998er DFG Empfehlungen
zur Nachvollziehbarkeit ??
????
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
Domäne neuer Empfehlungen
zur Nachnutzung ??
12
Infrastruktur LZA : Organisation – Ressourcenbedarf
Zugänge
Bestand
Zugriffe = Erfolg !
Personal
Hardware
OAIS Model
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
13
Zusammenfassung (1)
Preservation and (Open) Access to Data
Aim: Reuse &
Reproduce
Quality Assessment
Persistent (and Open)
Access, Licensing
Data provided and described
by researchers
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
Digital Longterm
Preservation
Basic and advanced data
infrastructure, provided by ???
14
Zusammenfassung (2)

Zugänglichkeit (OA?):


Unterschiede der wissenschaftlichen Disziplinen


Formen und Bedingungen des Zugangs disziplinspezifisch
Form, Menge und Vielfalt, Lebenszyklen und Nutzungsszenarien
Wissenschaftliche Anerkennung

Bereitstellung von Forschungsdaten zur weiteren Nutzung
Bestandteil wissenschaftlicher Leistung

Lehre und Qualifizierung

Verwendung von Standards, Entwicklung von Infrastrukturen

Zusammenarbeit zwischen Wissenschaftlern und Informationsspezialisten
(DataNet Ausschreibung NSF)

in internationale und interdisziplinäre Netzwerke interoperabel einbinden
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
15
Today‘s Data Reuse, Citation and Quality Control
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
16
Reuse, Citation and Quality Assessment with ESSD
H. Pfeiffenberger, KoLaWiss Workshop, Göttingen, 2008-01-27
17
Herunterladen