Data Warehouse Performance mit flexibler Quellen

Werbung
BUSINESS INTELLIGENCE
EINSATZBEREITE LÖSUNG
«stark wachsende Datenvolumen
erfordern innovative Lösungen ...»
Data Warehouse Performance
mit flexibler Quellen Integration
Flexible und schnelle Datenaufbereitung mit
SQL Parallel Boost und ETLight bei comparis.ch
Die Lösung
Der Internet-Vergleichsdienst
comparis.ch hat infolge des zunehmenden Datenvolumens und
den sich rasch ändernden Anforderungen die bestehende Data
Warehouse Umgebung
etappenweise erneuert.
Durch eine konsequente Parallelisierung der einzelnen Datenaufbereitungsschritte, sowie der
einzelnen (datenverändernden)
Teilschritte kann die Dauer der
Data Warehouse Ladezyklen
massiv verkürzt werden.
Über die Lösungskomponenten
SQL Parallel Boost und ETLight
konnten so in kurzer Zeit kosteneffiziente best-practice Lösungen
in Betrieb genommen werden.
Neue Anforderungen können
dank der Definitionslogik von
ETLight rascher und einfacher
umgesetzt werden.
Unsere Leistung
 Implementierung
 Performance Tuning
 Betriebsunterstützung
Eingesetzte Technologie
 SQL Parallel Boost
 ETLight
auf technischer Basis von
Microsoft SQL Server
comparis.ch ist der führende Internet-Vergleichsdienst der Schweiz. Konsumenten können
auf www.comparis.ch einfach und schnell Tarife und Leistungen von Krankenkassen, Versicherungen, Banken, Telecom-Anbietern, Immobilien, Autos und Motorrädern vergleichen.
Das Unternehmen wurde 1996 gegründet und vermittelt jährlich mehrere 100‘000 Kontakte
zwischen verschiedenen Anbietern und Nutzern. Das Unternehmen mit Sitz in Zürich zählt
heute mehr als 80 Angestellte.
Integrierte Daten als zentrale Grundlage für Kundendienstleistungen und Marketing
Durch die verschiedenen Dienstleistungen mit einer wachsenden Zahl unterschiedlicher
Anwendungen und applikationseigenen Datenbanken war es früher sehr aufwendig und
teilweise sogar unmöglich, aus den vorhandenen Daten zeitgerecht die gewünschten
Informationen zu gewinnen. Die Herstellung einer einheitlichen und integrierten Sicht über
die verschiedenen Dienstleistungsbereiche war zuweilen nur zeitlich befristet und mit jeweils
grossem Aufwand möglich.
Mit der Zielsetzung einer vereinfachten, einheitlichen und raschen Auswertbarkeit aller
Dienstleistungsbereiche hat man 2003 den Aufbau einer eigenen Data Warehouse Umgebung initiiert. Damit wurde unter anderem die Grundlage für eine vereinfachte Ermittlung
der bevölkerungsweiten Sparpotentiale, einer konsolidierten Sicht und Analyse des
Nutzungsverhaltens, sowie einer gezielteren Kontaktpflege zu den Kunden geschaffen.
Auf Basis des sogenannten „BI Framework“ (Vorversion von ETL Xpert der Firma ibax AG) hat
man in den kommenden Monaten erfolgreich die Daten aus über 45 unterschiedlichen
Quellsystemen in das Data Warehouse integriert. Über das Data Warehouse werden so den
Endanwendern aktuelle und qualitativ verbesserte Daten in einer konsistenten und einheitlich
strukturierten Form zur Verfügung gestellt. Je nach Anwendungssituation werden die Daten
mit unterschiedlichen Front-End Anwendungen über sogenannte Datenwürfel (Cubes;
Analysis Services), vorgefertigte Abfragestrukturen (Datenbank-Views) oder Datenextrakte
(Datenbank-Tabellen) genutzt.
Vereinfachung der Aufbereitungsprozesse
Kritische Dauer der Aufbereitungszeiten
Infolge des Unternehmenswachstums der comparis.ch und den gleichzeitigen Erweiterungen
in den verschiedenen Quellsystemen hat sich das zu verarbeitende Datenvolumen im Data
Warehouse binnen weniger Jahre nahezu verzehnfacht. Trotz einem starken Ausbau der
Serverkapazitäten (Rechenleistung und Datenspeicher) beanspruchte ein vollständiger
Ladezyklus teilweise über 30 Stunden.
Zur Verkürzung der kritisch langen Ladezeiten bei gleichzeitig besserer Ausnutzung der verfügbaren Server-Ressourcen hat das Data Warehouse Team der comparis.ch im Jahr 2009 die
ibax Lösungskomponente SQL Parallel Boost eingeführt.
WE TRANSFER DATA
TO KNOWLEDGE
Durch die in SQL Parallel Boost
enthaltene Parallelisierungslogik kann
die Datenverarbeitungsleistung von
Microsoft SQL Server um bis zu Faktor
10 (!) gesteigert werden.
Gleichzeitig konnte dadurch der
Speicherplatzbedarf der DatenbankLogfiles reduziert und dieser zu
Gunsten neuer, zusätzlicher Daten
genutzt werden.
Unter der Projektleitung des Head of Data Warehouse der comparis.ch und der technischen
Unterstützung der ibax AG wurde binnen weniger Tage SQL Parallel Boost umfassend in den
bestehenden Ladeprozess integriert. Die Dauer eines vollständigen Ladezyklus konnte so
rasch und effektiv auf wenige Stunden reduziert werden. Die gesamte Datenverarbeitung
kann über integrierte Monitoring- und Analyseberichte überwacht und ausgewertet werden.
»Dank der Einführung von
SQL Parallel Boost konnte die
Dauer der Ladezyklen massiv
verkürzt werden. Durch die bessere
Ausnutzung der bestehenden
Server-Ressourcen konnten wir so
auf einen vorzeitigen Hardwareausbau verzichten.
Die aktuelle Migration auf die
neue Definitions- und Prozesslogik
von ETLight erlaubt uns zudem
neue Anforderungen rascher
umzusetzen.
Trotz stetig zunehmendem
Datenvolumen erlauben uns die
beiden Lösungskomponenten der
ibax AG eine Datenaufbereitung
in angenehmen Rekordzeiten.«
Pascal Ziegler
Head of Data Warehouse
bei comparis.ch
ibax AG
Enterprise Business Intelligence
Talweg 74
CH-8707 Uetikon am See
Tel: +41 44 796 14 15
[email protected]
www.ibax.ch
Vereinfachte und raschere Integration neuer Datenquellen
Die bestehende Data Warehouse Umgebung hat sich während den letzten 9 Jahren als zuverlässige Plattform bewährt. Das „BI Framework“ wurde über die Jahre seit seiner Ersteinführung auf Basis von SQL Server 2000 bereits zweimal erfolgreich, zuerst auf SQL Server
2005 und später auf SQL Server 2008 R2, migriert. Im Jahr 2012 hat man sich entschieden,
das Data Warehouse auf den neusten Stand der technischen Möglichkeiten auszurichten.
Hierbei wollte man das unternehmensinterne Warehouse Modell unter Berücksichtigung der
gemachten Praxiserfahrungen mit folgenden Zielsetzungen auf eine neue Basis stellen.

Verschlankung der Ladeprozess-Funktionalität zu Gunsten einer vereinfachten und
rascheren Integration und Anpassung von Datenquellen, sowie kürzeren Ladezeiten.

Gewährleistung der Möglichkeit die Ladeprozesse um eigene
objektspezifische Verarbeitungsschritte zu erweitern.

Verbesserte Ausschöpfung des
Leistungspotentials der
bestehenden Ressourcen (ServerHardware und DatenbankSoftware).
Nach dem Motto „reduce to the max“ hat sich comparis.ch entschieden, anstelle auf die
umfassende funktionale Folgelösung von ETL Xpert zu migrieren, die Ladeprozesse neu über
die Lösungskomponente ETLight der Firma ibax AG abzubilden.
ETLight unterstützt hierbei ebenso eine performance-optimierte Datenverarbeitung. Dank
integriertem Warteschlangenkonzept können alle Teilschritte nahezu uneingeschränkt
parallel ausgeführt werden. Das schlanke Prozessmodell von ETLight erlaubt zudem über
vordefinierte Schnittstellen beliebige individuelle Code-Erweiterungen in den Ladeprozess
einzubinden. Unverändert bildet dabei SQL Parallel Boost einen integralen Bestandteil der
neu realisierten Prozesslogik.
Die serverseitige Basisinstallation von ETLight und technische Einführung des Data Warehouse Teams wurde mit Unterstützung der Firma ibax AG in weniger als drei Arbeitstage
abgeschlossen. Die darauffolgende Migration der bestehenden Umgebung konnte binnen
weniger Wochen umgesetzt werden. Spezielle Aufbereitungsschritte (Datenbereicherung,
Slowly Changing Dimension Logik, etc.) konnten rasch und unkompliziert über individuelle
Code-Erweiterungen integriert werden.
Seit der Einführung von ETLight können neue Anforderungen in weniger als 30-50% der
ursprünglich benötigten Zeit umgesetzt werden. Die Datenaufbereitungszeiten der
Ladezyklen konnten zudem um weitere 25-30% reduziert werden.
© 2012 ibax AG. ibax und aito sind geschützte Warenzeichen der ibax AG. Alle anderen Produktnamen
sind Warenzeichen der jeweiligen Hersteller. Technische Änderungen und Irrtum vorbehalten.
Herunterladen