Jena 2007 DB2 Data Archive Expert

Werbung
®
IBM Software Group
Archivierung im IBM DB2 HOST Bereich
Hans-Jürgen Schmidt
[email protected]
Tel. 07034-15-3282 Mobile 0160-8812236
© 2007 IBM Corporation
IBM Software Group
Agenda
 Warum Archivierung
 Definition Archivierung
 Wie werden Daten heute archiviert ?
 Terminologie
 DB2 Data Archive Expert for z/OS
 IBM SAP Archivierungs Lösung
2
IBM Software Group
Warum Archivierung
 In den IT Bereichen wächst das Datenvolumen überdurchschnittlich
 Die Anzahl der Datenbanken wächst expotential
Gale Research Inc.
3
IBM Software Group
Warum Archivierung
 Inaktive Daten existieren überall
 Transaktionen
 Data Warehouses
 e-mail
 etc.
 Inaktive Daten werden noch benötigt, nur die
Zugriffswahrscheinlichkeit ist geringer als bei aktiven Daten
 Warum sollen inaktive Daten gehalten werden ?
 Gesetzliche Gründe
 Geschäftliche Gründe
 Trend Analysen
 Auswertungen von Vergangenheitsdaten
 Reaktivierung
4
IBM Software Group
Warum Archivierung
 Es ist ein Phänomen, dass bei steigendem Datenvolumen auch der
Prozentsatz der inaktiven Daten überprozentual zunimmt
*Inmon, Bill. Webinar on data warehousing and
dormant data. http://archive.mshow.com/61039
10 GB
10 % inaktiv
100 GB
40 % inaktiv
2 TB
70 % inaktiv
50 TB
85 % inaktiv
5
IBM Software Group
Warum Archivierung
 Das Problem  inaktive Daten erzeugen Kosten
 Wachsende Besorgnis der IT Manager : wie gehe ich mit steigendem
Datenvolumen um
 Kapazitätserweiterung ist nicht immer der effizienteste Weg mit Wachstum
umzugehen
 Ungezügeltes Datenwachstum beeinträchtigt das IT Umfeld in folgenden
Bereichen :
 Performance
 Kosten für Prozessor, Speicher
 Handhabung / Wartung
6
IBM Software Group
Warum Archivierung
 Wo liegen die Kosten ?
 Performance
 Zusätzliche I/O Operationen
 Zusätzliche Prozessor Operationen
 Hardware Kosten
 Prozessor
 Platten
– Datenredundanz (eingeschränkte Normalisierung)
– Indexorganisation
– Handhabung / Wartung
 REORG / UNLOAD / BUILD INDEX etc.
 Beeinträchtigung Batch Window
 Unzufriedenheit externer/interner Kunden
 Antwortzeitverhalten der Anwendung
7
IBM Software Group
Definition der Archivierung
 Transfer von inaktiven Daten zu einem Archiv, auf das bei Bedarf schnell
zugegriffen werde kann
 Archive/Retrieve Prozesse
 Häufig ist die Archivierung ein Bestandteil in der Backup/Recovery Strategie
eines Unternehmens
 Unterschied Archive / Backup
 Archiv enthält selektive Daten
 Archive sind Anwendungs orientiert
 Backup ist Datenspeicher orientiert
 Mit DB2 z/OS V8 wurde BACKUP/RESTORE in die DB2 Engine übernommen
 Anforderungen
 Selektionskriterium soll kompletter SQL Umfang sein
 Schneller Retrieve Prozess
 Welche Kosten werden akzeptiert ?
 Probleme
 Strukturänderungen der Daten
 Neue Versionen der Anwendung
8
IBM Software Group
Wie werden Daten heute archiviert ?
 Meistens mit Eigenentwicklungen
 Zugeschnitten für jede einzelne Anwendung
 Wartung sehr teuer
 Einige Firmen archivieren keine Daten
 Daten werden gelöscht und es wird darauf vertraut dass sie nicht mehr
benötigt werden
 Es werden immer mehr Ressourcen zur Verfügung gestellt
 Kostenexplosion bei der IT Infrastruktur
 Die gesetzlichen Regularien zur Datenaufbewahrung erfordern eine
stabile Archivierungs Lösung
 Archivierung läuft unter Kontrolle der Anwendungen
 System Programmierer / DBA’s stellen die Infrastruktur zur Verfügung
9
IBM Software Group
Wie werden Daten heute archiviert ?
 Ergebnisse aus Umfragen
 Von 479 Befragten haben 63 % eine Archivinfrastruktur installiert, von den
37 % die mit Nein antworteten befassen sich 80 % mit dem Thema
 Neben gesetzlichen Vorgaben spielen auch interne Überlegungen
(Fachabteilungen) eine Rolle bei der Archivierung
 Verwaltung/Personal/Vertrieb : 41 %
 Produktion/Entwicklung : 34 %
 Finanz : 19 %
 Gemeinsamer Request : 6 %
 Medium für Archive
 Bestehende Archive : Platte = 38 %, Band = 39 %
 Neue Archive : Platte = 53 %, Band = 25 %
 Bedeutung Optischer Speicher : Rückgang von 23 % auf 16 %
 Kosten : Platte = 25-35 US $, Band = 3-5 US $, Optisch = 5 US $
 Mehr als 50 % der Befragten schätzt die Grösse ihres Archivs auf über
1 Terabyte
10
IBM Software Group
Terminologie
 Terminologie
Active
Data
archive
retrieve
 Aktive Daten
 Archivierte Daten
Temp
Archive
Data
retrieve
(most
common)
 Typen von Archiven
 Archivierungs Tabellen: direkter Zugriff via SQL
 Archivierungs Dateien
– Flat Files (kein DB2 Format)
– WORM (write once read multiple)
– Speicherung : Platte, Band, Optisches Medium
 Archiv Metadaten – Daten über das Archiv
 Wer, Wann, Wohin (Speichermedium), Was (SQL WHERE Clause),
Warum (manuell, periodisch, geplant)
 Pro Archiv
11
IBM Software Group
DB2 Data Archive Expert for z/OS
S
M
S
Storage
Management
System
HSM
TSM
12
IBM Software Group
DB2 Data Archive Expert for z/OS
 Components
 An ISPF interface
 Specifications
 Execution
 A callable Application Programming Interface (API)
 Archive metadata
 DB2 Grouper
13
IBM Software Group
DB2 Data Archive Expert for z/OS
 Archive
 To table
 Retain SQL access
 Save disk space (by not requiring fast index access to archived data):
100GB
Index
40GB
Saved 20% in disks costs!
(if 50% of the data is inactive)
Data
After
60GB Archive
<table_name>
Index
Data
<table_name>
20
30
Data
30
<arc_table>
 Archive is a copy and a delete operation
– The deletes can be deferred
– Product insures that no data is deleted that is not safely in the archive
14
IBM Software Group
DB2 Data Archive Expert for z/OS
 Archive
 To file
 No SQL access, but cheaper media options available
– Consider media format when upgrading storage devices
– Tape is still about 5 times cheaper than disk
 Can use products like a 4GL to access data directly
 DFHSM can be used to automatically migrate files to cheaper storage
media
 Like archive tables, rows are timestamped in order to know when they
were archived
 WORM support
15
IBM Software Group
DB2 Data Archive Expert for z/OS
 Archive
 To both (table and then file)!
 Multi-tier archive:
Active
Data
91-364
day
archive
(table)
>364
day
archive
(file)
High
Low
Very Low
16
IBM Software Group
DB2 Data Archive Expert for z/OS
 Retrieve
 To temporary table or source
 Usually on demand -- could be programmatically controlled
 Selective from
 Single archive
 Multiple archives
 Keeps track of the archives (metadata)
 When (timestamp)
 Who (userid)
 What (What was archived)
 SQL WHERE clause
 Definitions (DDL)
 Where (Location of the archived data)
 Why (Scheduled, periodic, or manual)
 How (via DB2 Unload)
17
IBM Software Group
DB2 Data Archive Expert for z/OS
 By allowing data to be archived to tables, apps can access the archive
 Limitations apply; not for everyone
 Uses UNION in VIEW function in DB2 for z/OS Version 7
Application still reads
from <table_name>
Application reads need to
supply a date_col predicate to
avoid access to <arc_table>
Updates need to point to the
act_table
Prevent updates to arc _table
Index
Data
Data
<act_table>
<arc_table>
CREATE VIEW <table_name> AS
SELECT * FROM <act_table>
WHERE DATE_COL >= (CURRENT_DATE-365 DAYS)
UNION ALL
SELECT * FROM <arc_table>
WHERE DATE_COL < (CURRENT_DATE-365 DAYS)
18
IBM Software Group
DB2 Grouper
 A common component of several DB2 IBM
Tools, first delivered in Data Archive Expert
 The problem
 There are many relationships between DB2
objects, such as tables, in a business
application -- Some of these relationships
can be discovered easily, while others
cannot be easily found
 The objective
 Enable the location, augmentation, and
management of this information as the basis
for consistent data management activities
 The solution
 Grouper is a component for discovering,
recording, and managing groups of related
objects (tables) that comprise a business
application
19
IBM Software Group
DB2 Grouper
 Maintain sets of groupings
 Specify global relationships (nonenforced RI)
 Kick off dynamic (Units of work)
relationship discoveries
 Specify input values to the group
discovery process

Group discovery scope (starting
points)

Boundary objects

Additional relationships
 Launch the group discovery process
 Browse through the groupings
20
IBM Software Group
Interfaces
 Interfaces
 ISPF: Create/work with specifications
 Callable programming interface (SQL CALL statement): stored procedures
21
IBM Software Group
IBM’s DB2 for z/OS Tools Produkt Portfolio
Application Management
Database Administration
Utilities
DB2 Administration Tool
DB2 Object Compare
DB2 Utilities Suite
DB2 High Performance Unload
DB2 Automation Tool
Performance Management
DB2 Bind Manager
DB2 Data Archive Expert
DB2 Path Checker
DB2 Table Editor
DB2 Test Database Generator
DB2 Web Query Tool
DB2 and IMS Encryption
Recovery
DB2 Performance Manager
DB2 Bufferpool Analyzer
DB2 Performance Expert
DB2 Query Monitor
DB2 SQL Performance Analyzer
DB2 Archive Log Accelerator
DB2 Change Accumulation Tool
DB2 Log Analysis Tool
DB2 Object Restore Tool
Replication
DB2 Data Propagator
DB2 II Classic Federation
22
IBM Software Group

SG24-7080
 Authors: Paolo Bruni, Walter Huth,
Ernie Mancill, Iain Warnock
23
Herunterladen