Archivierung von Daten aus relationalen Datenbanken im

Werbung
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Archivierung von Daten aus
relationalen Datenbanken im
Schweizerischen Bundesarchiv
13. Tagung des Arbeitskreises "Archivierung von Unterlagen aus
digitalen Systemen" vom 27./28. April im Staatsarchiv St. Gallen
28. April 2009 – Dr. Krystyna W. Ohnesorge
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Zur Orientierung
ƒ GEVER Programm des Bundes und die digitale
Archivierung im BAR
ƒ SIARD Format und SIARD Suite für die Archivierung
von relationale Datenbanken
ƒ Digitale Archivierung im BAR – Ausblick 2009
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
2
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Zur Orientierung
ƒ GEVER Programm des Bundes und die digitale
Archivierung im BAR (Programm ARELDA)
ƒ SIARD Format und SIARD Suite für die Archivierung
von relationale Datenbanken
ƒ Digitale Archivierung im BAR – Ausblick 2009
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
3
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Programm GEVER Bund - Zeitplan
2007
2008
2009
Bericht &
Bericht &
Aktionsplan
Aktionsplan
2010
2011
M1
Leitung und Steuerung GEVER-Programm Bund (GSK, BAR)
Leitung und Steuerung GEVER-Programm Bund (GSK, BAR)
M2
Parlamentarische
(weitere BR- und
Parlamentarische
(weitere BR- und
…
Vorstösse
Parlamentsgeschäfte
…
Vorstösse
Parlamentsgeschäfte
Bundesrats- und Parlamentsgeschäfte auf elektronischer Basis
M3
(Laufende
GEVER-Projekte)
GEVER-Projekte in den Departementen und in der Bundeskanzlei
GEVER-Projekte in den Departementen und in der Bundeskanzlei
M4
Führungsleitfaden
Führungsleitfaden
Records Management
Records Management
M5
Einführung
Realisierung und
der Digitalen Archivierung (ARELDA)
Startphase Betrieb Digitale Archivierung
Startphase Betrieb Digitale Archivierung
Vorstudie
Vorstudie
M6
Konzept
Konzept
Zentrales Verzeichnis der Akten, Daten und Dokumente
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
4
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
E-Archiv – Statistik per Ende 2008
ƒ Grösse des digitalen Archivguts
~ 12.5 TB
ƒ Anzahl digitaler Ablieferungen
~ 250 (davon 21 DB)
ƒ Grösse der Ablieferungen
ƒ kleinste, grösste
ƒ Median
122 KB, 3.5 TB
15 MB
ƒ Anzahl Files pro Ablieferung
ƒ kleinste, grösste
ƒ Median
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
1,
400
400’000
5
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Information Data Life Cycle
Vermittlung
Enstehungszeitraum
Schutzfrist
10 Jahre +
20 Jahre +
1989
50
30 Jahre
bis 10 Jahre
1999
ewig
Ablieferung ans BAR
2009
2029
2049
Abgabe spätestens
nach 10 Jahren
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
6
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Digitales Archivgut
Digitales Dossier
Datenbank
Datei-Sammlungen
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
7
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Strategisches Programm ARELDA
2007
2008
M5
Einführung
Realisierung und
der Digitalen Archivierung (ARELDA)
2009
2010
2011
Startphase Betrieb Digitale Archivierung
Startphase Betrieb Digitale Archivierung
ƒ Digitale Dossiers aus GEVER
ƒ Daten aus relationalen Datenbanken
ƒ Datei-Sammlungen
ƒ Ab 2009 wird ein Standard-Archivierungsprozess für digitale
Unterlagen etabliert
ƒ Das BAR ist ein zuverlässiger Partner für die digitale
Archivierung und den nachhaltigen Zugang zum Archivgut
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
8
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Schwerpunkt Realisierung ARELDA
Aktenführende
Ämter
Gever
Systeme
Bundesarchiv
Benutzer
Management
Archiv
Schnittstellen
Gever für BAR
Planungstool
analoge
Unterlagen
Archiv Information Management
Office
Automation
ERP
Systeme
Findmittel
AIS
Suchen
Verzeichniseinheiten
Akzessionen
Dossierinformationen
etc.
in der
Archivtektonik
Themenorientiertes
Suchen
(DWH)
Textorientiertes
Suchen
(Search Engine)
Zugang
Replikation
Gever
Aufbereitung
Gever
Öffentlichkeit
Magazin
andere
digitale
Unterlagen
Digitales Magazin
Textdokumente
Präsentationen
Bilder
Tonaufnahmen
Preservation Planning
Aufbereitung
Dokumente
GIS
Metadata
Data
Management
Dissipation
Workbench
Internet
Portal
Fachanwendungen
Submission
Workbench
Digitales Magazin
Analoges
Magazin
Zentrale
Geverablage
Metadata
Fachanwendung DIR
GIS ?
Ingest
Access
Dokumenten
Staging
Datenbanken
Aufbereitung
Datenbanken
Archival
Storage
AIP
eMails
IDC
AIP
IDC
Ämter
Digital
Information
Repository
Datenbank
Plattform
(RDBMS,
SQL-Tools)
Administration
Web
Sites
Intranet
Portal
Datenbanken
WebSites ?
Infrastruktur Digitale
Archivierung
Workflow/
Transaktionen
Infrastrukturdienste
Digitale
Zertifikate
IDA
BAR Applikationslandschaft
basic components
Version 0.3
BAR_Applikationslandsschaft_20001119.vsd
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
9
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Mit ARELDA per 31.12.08 erreicht
PackageHandler: Ein
Werkzeug, um SIPs lesen,
deren Metadaten editieren
und im Fall von File
Ablieferungen auch SIPs
erstellen zu können.
DIR: Eine Anwendung zur
Einlagerung, Verwaltung
und Auslagerung von
SIPs in einem digitalen
Archiv.
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
10
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Archivtaugliche Dateiformate
ƒ Die vom BAR als archivtauglich definierten Dateiformate
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
ƒ
Textdaten (unstrukturiert)
Druckbare Dokumente
Tabellarische Daten
Relationale Datenbanken
Rasterbilder
Audiodaten
Videodaten
TEXT
PDF/A
CSV
SIARD
TIFF
WAVE
MPEG/4
Merkblatt des BAR „Archivfachliche Dateiformate – Standards für die Archivierung digitaler Unterlagen“
(Stand: Juli 2007): http://www.bar.admin.ch/dienstleistungen/00516/00517/index.html?lang=de
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
11
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Pilotprojekt Dap – 2005 / 2006
Beratung &
Bewertung
ƒ
ƒ
ƒ
ƒ
Übernahme
Bewirtschaftung
(Zurück-)
Vermittlung
DAp: Datenbank Archivierungsprozess
Zusammenarbeit mit verschiedenen Ämter
(Schwerpunkt EJPD)
Einsatz des Software-Prototyps SIARD
Archivierung von relationalen Datenbanken:
ƒ über 20 Datenbanken behandelt (inkl. Beratung) und
davon 8 archiviert
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
12
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Pilotprojekte GAp – 2008
ƒ GAp: GEVER Archivierungsprozess
ƒ Zusammenarbeit mit GS-EVD und Fabasoft
ƒ Design und Prototyp der Archivschnittstelle für Fabasoft
ƒ Zusammenarbeit mit BIT:
ƒ Design der Archivschnittstelle für GEVER Office
ƒ 2007: Proof of Concept Projekt: Zusammenarbeit mit ISB
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
13
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Zur Orientierung
ƒ GEVER Programm des Bundes und die digitale
Archivierung im BAR
ƒ SIARD Format und SIARD Suite für die Archivierung
von relationale Datenbanken
ƒ Digitale Archivierung im BAR – Ausblick 2009
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
14
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Archivierung von relationalen DB
ƒ Heutzutage werden in der schweizerischen Bundesverwaltung Fachanwendungen hauptsächlich mit relationalen
Datenbanken eingesetzt
ƒ Das Schweizerische Bundesarchiv hat eine normative
Beschreibung eines Datenformat für die langfristige Erhaltung
von relationalen Datenbanken entwickelt – SIARD Format
ƒ Das SIARD Format wurde im Mai 2008 als das offizielle Format
des EU-Projektes Planets angenommen: www.planets-project.eu
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
15
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Das SIARD Format
ƒ Das SIARD Format ist nur das Langzeitspeicherformat für eine
spezielle Sorte von Datenbanken – von relationalen DB
ƒ Es ist unabhängig von Paketstruktur wie SIP (Submission
Information Package), AIP (Archival Information Package) und
DIP (Dissemination Information Package) des OAIS Modells
ƒ Eine DB im SIARD Format kann als Teil eines Archivpakets
zusammen mit anderen Unterlagen (Dokumentation,
Datenmodell, etc.) archiviert werden
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
16
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Das SIARD Format
ƒ Das SIARD Format beruht im Wesentlichen auf den ISO
Standards SQL:1999, XML und UNICODE sowie dem
Industriestandard ZIP
ƒ Eine im SIARD Format archivierte relationale DB wird als eine
einzige Datei abgelegt – als ein einziges unkomprimiertes ZIPArchiv (ZIP)
ƒ Sämtliche DB-Inhalte werden in einer Kollektion von XML-Dateien
gespeichert. Einzige Ausnahme sind grosse BLOB- und CLOBDaten, die in separaten binären Dateien gespeichert aber in den
XML-Dateien referenziert werden
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
17
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Archivierung von relationalen DB
ƒ Wenn Struktur und Inhalt einer DB ins SIARD-Format übersetzt
werden, wird es später jederzeit möglich sein, auf die DBDaten zuzugreifen, selbst wenn die ursprüngliche DB-Software
nicht mehr verfügbar oder nicht mehr lauffähig sein wird
ƒ Im Rahmen des Projektees ARELDA wurde die Anwendung
SIARD Suite entwickelt, welche Inhalte relationaler
Datenbanken archiviert
ƒ Das offene SIARD-Datenbankformat kann unabhängig von der
Anwendung SIARD Suite verwendet werden
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
18
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Das SIARD Format und die SIARD Suite
SiardFromDb
(upload)
SIARD
Suite
SiardEdit
(examine and edit meta data)
SiardToDb
(download)
DB
SIARD file
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
19
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Voraussetzungen
ƒ SIARD Suite ist platformunabhängig
ƒ Lauffähig unter Windoms, Linux, Mac…
ƒ Korrekt installiertes JAVA 1.5 und höher
ƒ Installation
ƒ SIARD Suite kann jederzeit ab USB Stick, CD-ROM oder
Netzwerklaufwerk gestartet werden
ƒ Ohne spezielles Installationprogramm
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
20
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Voraussetzungen
ƒ SIARD Suite ist vorzugsweise für die folgenden
Datenbanktypen konzipiert
& weitere…
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
21
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Beschränkungen
SIARD Format unterliegt folgenden Beschränkungen:
ƒ Die Grösse der SIARD Datei kann ca. 18 ExaBytes nicht
überschreiten (ZIP64-Beschränkung)
ƒ Die Anzahl der Dateien kann ca. 4 Milliarden nicht
überschreiten (ZIP64-Beschränkung)
ƒ Die Gesamtheit der Metadaten der DB muss im JAVASpeicher Platz haben
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
22
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Zur Orientierung
ƒ GEVER Programm des Bundes und die digitale
Archivierung im BAR (Programm ARELDA)
ƒ SIARD Format und SIARD Suite für die Archivierung
von relationale Datenbanken
ƒ Digitale Archivierung im BAR – Ausblick 2009
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
23
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Digitale Archivierung – Ausblick 2009
ƒ Projekt ARELDA wird im Sommer 2009 abgeschlossen Æ
Betriebsorganisation „Dienst Digitale Archivierung“ etabliert
ƒ Stabilisierung und Weiterentwicklung der IT Lösung und
Ausbau des Vermittlungsteils
ƒ September 2009: Durchführung der 1. Ausbildung digitale
Archivierung für die BV: http://www.bar.admin.ch/dienstleistungen/00516/00714/index.html?lang=de
ƒ Mai - Dezember 2009: Durchführung einer Veranstaltungsreihe
zum Thema digitale Archivierung:
http://www.bar.admin.ch/aktuell/00568/00781/index.html?lang=de
ƒ Vorstudie Archivierung von GIS-Daten (Zusammenarbeit mit
Swisstopo; Abschluss im Oktober 2009)
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
24
Eidgenössisches Departement des Innern EDI
Schweizerisches Bundesarchiv BAR
Ressort Innovation und Erhaltung
Danke für die Aufmerksamkeit!
Archivierung von relationalen Datenbanken – Lösungsansätze des BAR
St. Gallen, 28. April 2009 – Dr. Krystyna W. Ohnesorge, BAR
25
Herunterladen