 
                                Oracle Warehouse Technologie Single-Engine-Based-Data-Warehouse Phasen der Data Warehouse Entwicklung mit Oracle Warehouse Builder 10g R2 (OWB) Alfred Schlaucher Leitender Berater Business Integration & Data Warehouse ORACLE Deutschland GmbH Tel.: 040 / 89091-132 Email: [email protected] Stichpunkte zu Ressourcen – schonenden Techniken mit dem Oracle – basierten Data Warehouse business intelligence & data warehouse Themen    Oracle Warehouse Builder 10g R2 (OWB) - allgemein Phasen der Data Warehouse Entwicklung - unterstützt durch OWB Weitere Informationen und Umsetzung business intelligence & data warehouse Themen    Oracle Warehouse Builder 10g R2 (OWB) - allgemein Phasen der Data Warehouse Entwicklung - unterstützt durch OWB Weitere Informationen und Umsetzung Aufbau und Verwaltung von Data Warehouse-Umgebungen Verwaltung und Dokumentation Metadaten Ownerschaften Grid Control Effiziente Datenhaltung Speichertechnik ILM Hardware ASM OLAP Datenintegration schnelles Bereitstellen DB-basiertes Laden MDM QualitätsETL-Option management Data Profiling Data Auditing Daten-Zugriff Security Mandanten BI-Anwendungen Standard-Berichte Interaktive Berichte Data Mining Komplexe Analysen Oracle Warehouse Builder  Design des kompletten Data Warehouse Systems Logisches Design und Beschreibungsinformationen Physisches Oracle Datenbank Design Fast alle Datenbankobjekte von Oracle 10g  Bereitstellung der Datenbeschaffungsroutinen  Runtime – System  Universelles Metadatenrepository  Automatisiertes ETL durch Scriptsprache  Data Quality / Data Profiling  Zugang zu allen EAI – Komponenten von Oracle 10g Neue Anforderungen an Datenintegration und Datenmanagement Immer mehr Anwender benutzen Daten Die Anzahl der Systeme und damit der Schnittstellen steigt Die Bereitsstellungszeit der Daten wird zunehmend kürzer Datenmengen wachsen Herausforderungen für Datenintegration und Datenmanagement Datenintegrations- und Datenmanagementaufgaben  Zusammenführen von Daten aus heterogenen Systemen  Korrigieren von Daten Garantieren von Datenqualität  Datenmigration von System zu System  Harmonisieren von Datenbeständen Inhaltliches Angleichen  Synchronisieren z. B. Abstimmung von verschiedenen Schlüsseln  Zuliefern von Daten Benutzergerechtes Bereitstellen  Verwalten von Datenbeständen z. B. Historisieren / Archivieren / ILM „Lösungen“ der Vergangenheit  Programmierung von Hand Zerstreute Programm-Sourcen Fehler bei der Entwicklung Unnötige Doppelarbeit  Schlechte oder fehlende Dokumentation Schlechte Wartbarkeit Enorme Folgekosten   Unkündbare „Inselexperten“ Immer wieder „Katastrophen“ im Echtbetrieb Wie war das nur? Die Geschichte der ETL-Tools geht in Richtung integrierter Werkzeuge 1992 1996 2000 2005 Datenbankbasierte ETL-Werkzeuge Separate Engine-gestützte ETL-Werkzeuge Programmgeneratoren Handprogrammierung Schnittstellenkomponenten Oracle Data Warehouse In Memory nn JCA COM+ SOAP WSIF & JBI Enterprise Service Bus Routing QOS BPEL Transform Rules FlatFile Oracle (Remote) Log XML FlatFile XML Port FTP Port SAP Int. DB2 OS390, UDB Sybase, Informix, SQL-Server... Ext. Table Streams tcp Access/Excel MessageBroker Peoplesoft CDC UTL_FILE Gateway ODBC DB-Link Queue Adapter SQL Loader Webservices FlatFile PL/SQL XML DB-Link XML Queue Tabellen View Sequenz Index Cube MView Procedure Function Siebel eMail Warehouse Datenbank XML A1 Metadaten gestützte Steuerungslogik für das Data Warehouse Repository Steuertabellen Workflow / BPEL Variablen Variablen Datenbank-basiertes Laden Datenbank – basiertes ETL  SQL basiert, d. h. die Oracle Datenbank wird ausgenutzt Möglichkeit primär mengenbasierte Operationen durchzuführen Wesentlich höhere Performance Automatisiertes Datenbankgeregelte Parallelisieren Datenbankgestütztes Ressources - Management  Unterstützung aller aktuellen Datenbank – ETL – Funktionen wie Multiple Inserts Merge (Insert/Update) Direct Path Load Table Functions Partition Exchange and Load Datenbank – basiertes ETL   Vollständige Hints – Bibliothek Verwendung aller Datenbank – Funktionen, z. B. auch analytische Funktionen Im Gegensatz zu den von 3. Herstellern nachgebildeten z. T. unvollständigen Funktionen (Beispiel SQL CASE, Decode)  Datennahes Entwickeln Leichtes performantes und mengenbasiertes Updaten von Sätzen Ausnutzen temporärere Strukturen Temp – Tables Cache – Tables Ausnutzen besonders schneller Tabellen – Objekte Index – Based Tables Direkter Zugriff auf Tabelleninhalte Datenbank - basiertes ETL  Nähe zu Katalogstrukturen Alle Informationen stehen sofort zur Verfügung  Komplett – Definition aller physikalischen Objekte im Data Warehouse (Tables, Index, Materialised Views, Partitioning ...) Datenbank – basiertes ETL im Zusammenhang mit OWB  ETL - Integriertes Data Quality Data Cleansing / Data Profiling     ETL – Makro – Bildung / Experts Integrierte datenbankbasierte Workflow – Umgebung Web – basiertes Auswerten von Metadaten und Laufzeitergebnissen Unterstützung der Datenbank – Near Realtime – Funktionalität wie Queues, Streams, CDC, Web Services Workflow-Steuerung 4 – Schichten Prozessverwaltung GesamtProzess TeilProzess TabellenMapping Column Transformation Es gibt 3 Hauptgründe für den Einsatz von OWB 1. 2. 3. Performance Effizientere Warehouse Architekturen Preis Komponenten OWB Control Center Change Manager Datenmodeller Scheduler Data Viewer Mapper Repository Browser Runtime Audit Experts-Macros Rules Editor Dependencies Process Editor Data Profiler Das OWB Entwicklungs – Szenario Unified Repository Design Metadaten OWB-Modelle OWB Runtime Metadaten (Deploys) Design Modul Bestelldaten Modul Warehouse Deploy SRC Bestellung WH_ Transaktionen Oracle 9i /10g Location LOC_SRC Tabellen Quell-Systeme Oracle 9i/10g Location LOC_DWH My_Project Warehouse Warehouse Bestellung tabellen tabellen DWH PL/SQL Tabellen Datenfluss Warehouse Warehouse WH_Transtabellen tabellen aktionen Ziel-System Schnittstellenkomponenten Oracle Data Warehouse In Memory nn JCA COM+ SOAP WSIF & JBI Enterprise Service Bus Routing QOS BPEL Transform Rules FlatFile Oracle (Remote) Log XML FlatFile XML Port FTP Port SAP Int. DB2 OS390, UDB Sybase, Informix, SQL-Server... Ext. Table Streams tcp Access/Excel MessageBroker Peoplesoft CDC UTL_FILE Gateway ODBC DB-Link Queue Adapter SQL Loader Webservices FlatFile PL/SQL XML DB-Link XML Queue Tabellen View Sequenz Index Cube MView Procedure Function Siebel eMail Warehouse Datenbank XML business intelligence & data warehouse Themen    Oracle Warehouse Builder 10g R2 (OWB) - allgemein Phasen der Data Warehouse Entwicklung - unterstützt durch OWB Weitere Informationen und Umsetzung Data Profiling Reverse Engineering Prozessmodell Objektmodell Quellenstudium Systementwurf Bebauungspläne Komponenten ZielDatenmodelle Prozessanalyse 3NF Dimensional Mdimensional Datenbankentwurf Info FA fehlerhafte Prozesse DDL / DML Knowledge Metadaten Datentransport Info FA Jobmanagement ETL Laufzeitmanagement Testdaten Weiter Hinterlegung fachlicher Beschreibungen Zurück Analyse der Quelldaten - Data Profiling Zurück Zrück Das gesamte System modellieren Zurück Datenmodelle entwerfen Zurück Komplette Definition von Tabellen Zurück Transformationen mit Mappings Zusätzliche Hilfsfenster des Mappingeditors Operatoren des Mappingeditors Zurück Testdatengenerierung Zurück Zusammenfassen von Mappings zu Prozessen Prozesssteuerung z. B. mit Schleifen und Variablen Reporting über stattgefundene Ladeläufe Zurück Abhängigkeits- und Auswirkungsanalyse Zurück Individuelle Listenreports über Metadaten HTMLDB Zurück business intelligence & data warehouse Themen    Oracle Warehouse Builder 10g R2 (OWB) - allgemein Phasen der Data Warehouse Entwicklung - unterstützt durch OWB Weitere Informationen und Umsetzung Weitere Infos http://www.oracle.com/technology/products/warehouse/index.html Die neue Software OWB 10G R2 (Paris) kann über OTN bezogen werden. http://www.oracle.com/technology/software/products/warehouse/index.html Neue Projekte sollten nur mit diesem Release beginnen. Step By Step kann bestellt werden bei: Email: [email protected] oder Tel.: 040 / 89091-132 Vorgehensweise Entwickeln Multidimensionale Strukturen mit OWB Data Object Editor Control Center Mapping Editor Control Center Binding / Ableitung Relationale Tabellen Generierung Dimensions und Tabellen Definition Mappings Dim + Fakten Generierung Mappings (PLSQL) Zuweisen Analytical Workspace + Def. Aggregationen Generierung Dimensionale Objekte in Analytical Workspace Definition 1 Mapping Cube Generierung Mappings Cube DML Definition Dimensionen und Fakten business intelligence & data warehouse Themen  Einführung: Multidimensionale Modelle   im Oracle Data Warehouse Oracle Warehouse Builder 10g R2 (OWB) - allgemein Erstellen multidimensionaler Modelle mit OWB Beispielscreens: Wizard zur Erstellung einer Zeitdimension Data Object Editor Deployment Control Center Der Mapping Editor Ableiten EUL für Discoverer  Weitere Aspekte OWB  Umsetzung Verschiedene Arten der Erstellung der Zeitdimension Storage Type ROLAP / MOLAP Festlegen Anzahl Jahre Auswahl Hierarchie-Level Übersicht generierte Objekte zum Aufbau der Zeitdimension Mapping Dimensional Table Table Sequence Generiertes Mapping zum Laden der Kalenderdaten Ergebnisdaten (DatenViewer) business intelligence & data warehouse Themen  Einführung: Multidimensionale Modelle   im Oracle Data Warehouse Oracle Warehouse Builder 10g R2 (OWB) - allgemein Erstellen multidimensionaler Modelle mit OWB Beispielscreens: Wizard zur Erstellung einer Zeitdimension Data Object Editor Deployment Control Center Der Mapping Editor Ableiten EUL für Discoverer  Weitere Aspekte OWB  Umsetzung Data Objekt Editor Eine Dimension definieren - Dimensionsattribute Eine Dimension definieren - Dimensionslevel Eine Dimension definieren - Dimensionshierarchie Eine Dimension definieren - Speicherart SparsityEigenschaften definieren Die Art der Vorberechnungen für die Kennzahlen festlegen business intelligence & data warehouse Themen  Einführung: Multidimensionale Modelle   im Oracle Data Warehouse Oracle Warehouse Builder 10g R2 (OWB) - allgemein Erstellen multidimensionaler Modelle mit OWB Beispielscreens: Wizard zur Erstellung einer Zeitdimension Data Object Editor Deployment Control Center Der Mapping Editor Ableiten EUL für Discoverer  Weitere Aspekte OWB  Umsetzung Control Center Generierter Code zur Definition eines Würfels business intelligence & data warehouse Themen  Einführung: Multidimensionale Modelle   im Oracle Data Warehouse Oracle Warehouse Builder 10g R2 (OWB) - allgemein Erstellen multidimensionaler Modelle mit OWB Beispielscreens: Wizard zur Erstellung einer Zeitdimension Data Object Editor Deployment Control Center Der Mapping Editor Ableiten EUL für Discoverer  Weitere Aspekte OWB  Umsetzung Mapping zum Befüllen einer Zwischentabelle Operatoren des Mappingeditors Einfaches Mapping zur Befüllung eines Würfels - Eingeblendet ist die OLAP-Sicht business intelligence & data warehouse Themen  Einführung: Multidimensionale Modelle   im Oracle Data Warehouse Oracle Warehouse Builder 10g R2 (OWB) - allgemein Erstellen multidimensionaler Modelle mit OWB Beispielscreens: Wizard zur Erstellung einer Zeitdimension Data Object Editor Deployment Control Center Der Mapping Editor Ableiten EUL für Discoverer  Weitere Aspekte OWB  Umsetzung business intelligence & data warehouse Themen  Einführung: Multidimensionale Modelle   im Oracle Data Warehouse Oracle Warehouse Builder 10g R2 (OWB) - allgemein Erstellen multidimensionaler Modelle mit OWB Beispielscreens: Wizard zur Erstellung einer Zeitdimension Data Object Editor Deployment Control Center Der Mapping Editor Ableiten EUL für Discoverer  Weitere Aspekte OWB  Umsetzung Process-Editor Metadaten-Dependency-Manager Metadaten-Browser (Web) Job-Kontrolle im Web