Geschäftsprobleme mit SQL Server 2005 Analysis

Werbung
Geschäftsprobleme mit SQL Server 2005
Analysis Services lösen
Autor: Craig Utley
Veröffentlichung: April 2005
Zusammenfassung: Dieses Dokument untersucht eine Reihe von häufigen
Geschäftsproblemen und weist auf, wie diese Probleme mit SQL Server 2005 Analysis
Services auf einfache und wenig aufwändige Art gelöst werden können. Die
besprochenen Arten von Geschäftsproblemen sind die folgenden: Eine einfache,
integrierte Datensicht, Konsolidierung von Data Mart- und Nischenanwendungen,
intelligente Datensichten, Probleme der Lokalisierung und Echtzeit-BI-Daten. Diese
Probleme waren üblicherweise mit anderen Data Warehousing-Produkten schwierig oder
gar nicht zu lösen. Microsoft jedoch ermöglicht den Unternehmen die Problemlösungen
in einem einfachen, aber wirkungsvollen Paket.
Copyright
Dies ist ein vorläufiges Dokument und kann vor der endgültigen kommerziellen Veröffentlichung der hier beschriebenen
Software noch wesentliche Veränderungen erfahren.
Die in diesem Dokument enthaltenen Informationen repräsentieren die augenblickliche Meinung der Microsoft Corporation
zu den diskutierten Themen zum Zeitpunkt der Publikation. Da Microsoft den wechselnden Ansprüchen des Marktes
entsprechen muss, sollte dieses Dokument nicht als eine Haftung seitens Microsoft interpretiert werden, und Microsoft
kann nicht für die Genauigkeit jeglicher gegebener Information nach dem Datum der Veröffentlichung garantieren.
Dieses Whitepaper dient nur der Information. MICROSOFT GIBT IN DIESEM DOKUMENT KEINE GARANTIEN,
AUSDRÜCKLICHE ODER ANGEDEUTETE.
Es liegt in der Verantwortung des Benutzers, allen maßgeblichen Urheberrechtsbestimmungen zu entsprechen. Kein Teil
dieses Dokuments kann reproduziert werden, in einem Verteilersystem gespeichert oder in ein Verteilersystem eingespeist
werden oder in irgendeiner Form auf irgendeine Art übertragen werden (elektronisch, mechanisch, durch Photokopieren
Aufnehmen oder ähnliches), aus irgendeinem Grund, ohne die ausdrückliche schriftliche Genehmigung der Microsoft
Corporation.
Microsoft kann Patente, Patentanmeldungen, Schutzmarken, Urheberrechte oder andere Rechte geistigen Eigentums
haben, die in diesem Dokument behandelte Gegenstände betreffen. Soweit nicht eine ausdrückliche schriftliche
Lizenzgenehmigung seitens Microsoft vorliegt, gibt die Ausstattung mit diesem Dokument Ihnen keinerlei Lizenz über
Patente, Schutzmarken, Urheberrechte oder andere geistige Eigentümer.
 2005 Microsoft Corporation. Alle Rechte vorbehalten.
Microsoft, ActiveX, SharePoint, Visual Basic, Visual C#, Visual Studio, Windows, Windows Server, und Windows Server
System sind entweder eingetragene Handelsmarken oder Handelsmarken der Microsoft Corporation in den Vereinigten
Staaten und/oder anderen Ländern.
Die Namen von in diesem Dokument erwähnten realen Unternehmen und Produkten können Handelsmarken der
betreffenden Eigentümer darstellen.
2
Inhaltsverzeichnis
Einführung ........................................................................................................ 1
Eine Untersuchung der Geschäftsprobleme ...................................................... 2
Problem 1: Einfache, integrierte Ansicht von Daten .......................................... 3
Lösung: Getrennte semantische Sicht ................................................................ 3
Problem 2: Data Mart- und Nischen-Anwendungs-Konsolidierung .................... 4
Data Mart-Konsolidierung ................................................................................ 4
Lösung: Die eine Version der Wahrheit .............................................................. 5
Nischen-Applikationen ..................................................................................... 5
Lösung: Das eine Modell des UDM ..................................................................... 6
Problem 3: Eine intelligente Geschäftssicht der Daten ...................................... 7
Lösung: Fortgeschrittenes dimensionales Modellieren .......................................... 8
Problem 4: Die Analyse lokalisieren .................................................................. 9
Lösung: Eingebaute Daten- und Metadatenübersetzungen und
Währungsumrechnungen ................................................................................. 9
Problem 5: Echtzeit-BI .................................................................................... 10
Lösung: Richtige Information, richtiges Format, richtige Zeit .............................. 11
Zusammenfassung .......................................................................................... 11
i
Einführung
Nur zu häufig stellen Unternehmen fest, dass ihre Investition in erstklassige
Anwendungen zu Informations-Silos führt, die schwierig zu integrieren und analysieren
sind. Dies wiederum bedeutet, dass das Versprechen informierterer und pünktlicherer
Entscheidungen häufig unerfüllt bleibt. Unternehmen haben unzählige Versuche
unternommen, diese verstreuten Systeme effektiv zu analysieren: Das Austauschen
eines Systems zur relationalen Berichterstellung gegen ein anderes, Extrahieren und
Transformieren der Daten und Erstellen eines Data Warehouses oder Erwerben neuer
Systeme, die bessere Berichterstellung versprechen. Jede dieser Lösungen hat
Nachteile, von der Verwendung unpassender Werkzeuge für die Annäherung an das
Problem bis zu benötigten neuen und aufwändigen Projekten zur Datenkonsolidierung.
Diese, von vielen Unternehmen erfahrenen, Schwierigkeiten sind nicht neu.
Beispielsweise kaufen viele Unternehmen Softwareprodukte wie SAP für ihre
Geschäftsaktivitäten. Unglücklicherweise verfügen diese Produkte häufig über komplexe
Datenstrukturen, die es erschweren, effektive Analysen zu tätigen. Ein Unternehmen
kann über eine CRM (customer relationship management)- und eine SCM (supply chain
management)-Anwendung verfügen, die vollkommen getrennt voneinander sind, aber
beide wichtige Informationen enthalten, um strategische Entscheidungen für das
Unternehmen zu treffen. Auch haben Unternehmen eine große Bandbreite von
Anwendungen und Datenspeichern produziert, um den Ansprüchen an Berichterstellung
und Analyse gerecht zu werden, und um die verschiedenen und wechselnden
Bedürfnisse ihrer Analytiker, Informationsarbeiter und Benutzer zufrieden zustellen.
Um diese Probleme anzugehen beschäftigt sich Microsoft seit Jahren damit, den
Übergang zu Business Intelligence (BI) zu erleichtern. Mit der Veröffentlichung von
Microsoft® SQL Server™ 2005 Analysis Services hebt Microsoft die Messlatte bedeutend
höher. Organisationen verfügen nun über eine einzelne, einheitliche Lösung, um Berichte
auf Grund von OLTP (online transaction processing)- oder OLAP (online analytical
processing)-Datenspeichern zu erstellen. SQL Server 2005 Analysis Services reduziert
erheblich den Aufwand, um eine einheitliche Sicht der Daten, die aus vielzähligen
Anwendungen und Formaten stammen, zu bieten. Worin auch immer das Ziel bestehen
mag: der Integration von Daten aus vielen verschiedenen Anwendungen in ein
einheitliches Format, der Analyse von Daten aus einer Vielzahl von Quellen, der
Berichterstellung unter Verwendung einer Vielzahl von Formaten und Techniken, dem
Data Mining zum Aufdecken von Datenbeziehungen oder der Vorhersage zukünftiger
Ergebnisse mit vorhersagender Analyse. SQL Server 2005 Analysis Services bietet einen
Satz hoch integrierter Werkzeuge, um Unternehmen dabei zu unterstützen, die ganzen
Vorteile des Spektrums von BI in Anspruch zu nehmen.
1
Dieses Dokument wird eine Reihe von häufigen Geschäftsproblemen untersuchen und
aufweisen, wie diese Probleme mit SQL Server 2005 Analysis Services auf einfache und
wenig aufwändige Art gelöst werden können. Die in diesem Dokument besprochenen
Probleme:

Einfache, integrierte Sicht der Daten. Viele Unternehmen unterhalten eine
Vielzahl von Anwendungen für Aufgaben wie ERP (enterprise resource planning),
CRM, SCM, Human Resources usw. Microsoft SQL Server 2005 Analysis Services geht
diese Probleme durch die Verwendung von Datenquellensichten an, eine Technologie,
die den Entwurf eines Analysemodells der existierenden Datenstrukturen ermöglicht.

Data Mart-Konsolidierung. Organisationen erstellen Data Marts für jeden
Funktionsbereich und stellen dann fest, dass eine Konsolidierung dieser Marts in ein
Data Warehouse schwierig bis unmöglich ist. Microsoft SQL Server 2005 Analysis
Services führt das Unified Dimensional Model und Perspektiven ein, um eine Version
der Wahrheit zu schaffen und sie als virtuelle Data Marts den einzelnen Abteilungen
zur Verfügung zu stellen.

Intelligente Sicht der Daten. Viele der heutigen Warehousing-Produkte erstellen
strenge hierarchische Strukturen, um Analytikern und Wissensarbeitern
Drilldown/Drillup durch die Daten zu ermöglichen. Obwohl effektiv, ist das nicht die
einzige Art, eine Analyse auszuführen. Microsoft SQL Server 2005 Analysis Services
ermöglicht es Unternehmen, Lösungen zu erstellen, die flexible Hierarchien
unterstützen, m:n-Beziehungen und andere Dimensionstypen, die fortgeschrittenere
Analyse ermöglichen als andere erhältliche Lösungen.

Lokalisierung der Analyse. Unternehmen, deren Operationen auch Sprache
umfassen, müssen Daten in einer einzelnen Sprache und Währung konsolidieren, um
eine gültige Analyse zu ermöglichen. Dies macht es für weltweite Unternehmen
schwieriger, die Lösung zu verwenden. Dank einem Feature namens Übersetzungen
ermöglicht es Microsoft SQL Server 2005 Analysis Services Unternehmen, eine
einzige Lösung zu erstellen, die Werte abhängig vom Standort des Benutzers
während der Übertagung lokalisiert.

Echtzeit-BI. Die meisten BI- und Data Warehousing-Lösungen stellen einen
zeitlichen Snapshot dar, der jede Nacht oder einmal pro Woche aktualisiert wird.
Echtzeit-BI-Lösungen existieren zwar, doch sie sind – im Vergleich zu Snapshots –
sehr langsam. Microsoft SQL Server 2005 Analysis Services ermöglicht Unternehmen
Echtzeit-BI oder annähernd Echtzeit-BI, mit der Geschwindigkeit von Snapshots und
minimaler Auswirkung auf die Produktionssysteme.
Eine Untersuchung der Geschäftsprobleme
Um die Probleme, die durch SQL Server 2005 Analysis Services gelöst werden können,
zu untersuchen, bietet es sich an, wirkliche Probleme zu erkunden, mit denen sich eine
große Bandbreite von Unternehmen heutzutage konfrontiert sieht. Dies stellt unter
keinen Umständen eine erschöpfende Liste jener Probleme dar, die mittels SQL Server
BI-Werkzeugen angegangen werden können. Dieses Dokument bietet einen Überblick
der häufigen Probleme dar, die SQL Server 2005 Analysis Services effizient und
kosteneffektiv löst. Der Fokus von Microsoft liegt darauf, Unternehmen eine schnellere
Integration und Analyse ihrer Daten zu ermöglichen, sowie eine schnellere
Berichterstellung, und das unabhängig davon, wo diese Organisation angesiedelt ist.
2
Dies reduziert gewaltig die TCO (total cost of ownership), während die Zeit, die es
benötigt, informierte Entscheidungen auf Grund von Daten aus einer großen Bandbreite
von Anwendungen zu treffen, verringert wird. Tabelle 1 bietet einen Überblick der
Geschäftsprobleme und deren Lösung.
Tabelle 1: SQL Server 2005 Analysis Services-Features und die von ihnen
angegangenen Geschäftsprobleme
Geschäftsproblem
SQL Server 2005 Analysis ServicesFeature, das dieses Problem angeht
Einfache, integrierte Datensicht
UDM Datenquellensichten
Konsolidierung von Data Mart und
Nischenanwendung
UDM Perspektiven
Intelligente Geschäftssicht der Daten
UDM m:n-Dimensionen, Dimensionen mit
unterschiedlichen Rollen, referenzierte
Dimensionen und Faktendimensionen
Lokalisierung der Analyse
UDM Übersetzungen und
Währungsumrechnungs-Assistent
Echtzeit-BI
UDM Proaktives Zwischenspeichern
Problem 1: Einfache, integrierte Ansicht von
Daten
Die meisten Organisationen haben ihre Daten über verschieden Systeme wie ERP, CRM,
und SCM verteilt. Diese Systeme können von verschiedenen Anbietern stammen und
verschiedene Terminologien, Datenschemas und sogar Datenbankmodule verwenden.
Trotzdem müssen Entscheidungsträger die Daten aus all diesen Quellen betrachten, um
informierte Entscheidungen zu treffen.
Heterogene Daten, abgespeichert in unterschiedlichen Formaten, erfordern ETL
(Extraktion, Transformation und Laden)-Routinen von verschiedener Komplexität, um
die Daten zum Zweck einer Analyse zu konsolidieren. Selbst, wenn eine Organisation nur
eine einzelne Quelle wie die CRM-Anwendung analysieren möchte, müssen die Daten in
einen Betriebsdatenspeicher oder Data Mart transformiert werden (üblicherweise in Form
eines Stern-Schemas), um Cubes zu erstellen und fortgeschrittene Analyseanwendungen
zu verwenden.
Lösung: Getrennte semantische Sicht
Die neuen Fähigkeiten von SQL Server 2005 Analysis Services ermöglichen
fortgeschrittene Analysen der Daten in den bereits bestehenden Systemen eines
Unternehmens mit wesentlich weniger Aufwand als früher. Mit dem Microsoft UDM
(Unified Dimensional Model) können Organisationen eine ganzheitliche Sicht der
ungleichen Daten erstellen, einschließlich relationaler Datenbanken, OLTP-Datenbanken,
Flatfiles und sogar Webdiensten. Das UDM ermöglicht es Unternehmen, komplexe
Datenstrukturen aus einer Vielzahl von Quellen zu modellieren, um anschließend
relationale Berichterstellung oder multidimensionale Analyse auszuführen. Das stattet
3
Unternehmen mit den Vorzügen relationaler Berichterstellung aus, die von OLAPAggregationen profitiert, während zugleich leistungsstarke Analysemöglichkeiten
geboten werden.
SQL Server 2005 Analysis Services kann UDM-Cubes erstellen, ohne als Zwischenschritt
ein Stern-Schema-Data Warehouse erstellen zu müssen. Das UDM unterstützt
Unternehmen dabei, Berichterstellungsanwendungen direkt für ein Produktionssystem zu
erstellen und erfordert nicht wie in der Vergangenheit als Zwischenschritt ein Data
Warehouse. Das UDM erfordert keine Daten in einem Stern- oder SchneeflockenSchema, sondern kann zu jeder Datenquelle Verbindung aufnehmen, deren Daten in
einer dritten Normalform gespeichert sind. Unbeachtet der Herangehensweise bietet SQL
Server 2005 Analysis Services die Möglichkeit, ein komplexes Schema auf einem bereits
bestehenden Schema zu entwerfen, einschließlich berechneter Spalten, SQLAnweisungen, die sich wie Tabellen verhalten, und mehr. Diese Schemas können als
Basis zur Cubeerstellung dienen. Da der Cube einen separaten Speicher darstellt, hat er
keine Auswirkung auf die Leistung der zu Grunde liegenden Datenquelle. Das bedeutet,
dass die Produktions-OLTP-Systeme weiter mit Höchstgeschwindigkeit laufen, und so
dem Unternehmen Zugriff auf Möglichkeiten zur fortgeschrittenen Analyse ermöglichen
und, wenn gewünscht, nahezu Echtzeit-Analyse.
SQL Server 2005 Analysis Services bietet diese leistungsstarke Möglichkeit unter
Verwendung einer Technologie namens Datenquellensichten. Datenquellensichten helfen
dem technologischen Mitarbeiterstab, auf bereits bestehenden Schemas komplexe
analytische Modelle zu erstellen egal, ob es sich um OLTP- oder Stern-Schemas handelt.
Dies ermöglicht die Erstellung von komplexen Schemas, die berechnete Spalten
beinhalten, SQL-Abfragen, die wie Tabellen verwendet werden können, freundliche
Namen und virtuelle Beziehungen. Ein großer Vorteil von Datenquellensichten besteht
darin, dass sie von Analytikern erstellt werden können, die über keine CREATEBerechtigung auf der Datenbank verfügen. Nach ihren Erstellungen können auf diesen
Datenquellensichten Cubes gestellt werden, was es ermöglicht, Cubes auf Grund eines
reichhaltigeren Schemas zu erstellen unter der Hinzufügung der Möglichkeit zur
fortgeschrittenen Analyse der Produktionssysteme, ohne im Gegenzug diese wichtigen
Anwendungen zu beeinflussen.
Problem 2: Data Mart- und NischenAnwendungs-Konsolidierung
Data Mart-Konsolidierung
Eine der Hauptstrategien, die Unternehmen verwenden, um ein Data Warehouse zu
erstellen, besteht darin, Data Marts zu erstellen, kleinere Warehouses also, entworfen
für einzelne Abteilungen des Unternehmens oder zur Lösung bestimmter Probleme, wie
etwa der Analyse von Finanzdokumenten oder Warenkorbanalysen.
Der Unterhalt vieler Data Marts bedeutet verschiedene Schwierigkeiten. Es kann
aufwändig sein, eine Reihe von Data Marts über das Unternehmen verteilt zu
unterhalten, die viele Aktualisierungen aus den selben Datenquellen erfordern.
Zusätzlich kann es schwierig sein, diese ungleichen Marts zu einer kleineren Anzahl von
Marts oder in ein einziges Data Warehouse zu konsolidieren.
4
Einige dieser Data Marts zu entfernen kann von Vorteil für die TOC sein. Durch die
verringerte Anzahl von Marts wird unnötiger Aufwand vermieden und Datenreplikation
sowie ETL reduziert. Durch die Unterbindung überflüssiger Datenspeicherung wird auch
der benötigte Speicherplatz reduziert. Auch wird der Aufwand für Datensynchronisation
gesenkt. Gefahren für die Datenintegrität werden reduziert, da die Notwendigkeit,
verschiedenste Data Marts einheitlich zu halten, beseitigt wird.
Lösung: Die eine Version der Wahrheit
Microsoft ist dieses Problem angegangen und hat ein Konstrukt namens UDM (Unified
Dimensional Model) eingeführt. Ein UDM ist ein Ort, an dem ein Unternehmen sowohl die
Geschäftslogik (Dimensionen, Measures) konsolidieren kann, als auch KPIs (Key
Performance Indicators) und Daten, die eine „Version der Firmenwahrheit“ präsentieren.
SQL Server 2005 Analysis Services geht dieses Problem an, indem es ermöglicht wird,
dass ein einzelnes UDM – ausgehend von dem Benutzer, der es betrachtet – verschieden
aussieht; diese verschiedenen Sichten werden Perspektiven genannt. Diese Perspektiven
ermöglichen die Unterteilung eines UDM, basierend auf den Ansprüchen verschiedener
Abteilungen des Unternehmens. Das verhindert die Notwendigkeit eines eigenen Marts
für jede Abteilung und bedeutet somit Beseitigung überflüssiger Datenspeicherung,
überflüssiger ETL-Prozesse und überflüssigen Synchronisationsaufwandes. Probleme der
Datenintegrität und -vereinheitlichung werden beseitigt, da es nur eine physikalische
Kopie des Cubes gibt.
Nischen-Applikationen
Viele Organisationen erstellen viele einzelne Anwendungen, um einer großen Bandbreite
von Berichterstellungs- und Analyseansprüchen gerecht zu werden. Ein Unternehmen
kann separate Lösungen für relationale Berichterstellung, Analyse, Scorecards,
Dashboards usw. erstellen. Diese verteilten Anwendungen werden häufig aus
verschiedenen Datenspeichern heraus betrieben; ein Werkzeug zur relationalen
Berichterstellung arbeitet in der Regel mit einer normalisierten OLTP-Struktur, während
eine Analyseanwendung typischerweise Daten aus einem OLAP-Cube bezieht, der aus
einem Stern-Schema errichtet wurde.
Separate Anwendungen, die eine Vielzahl von Datenspeichern verwenden, bedeuten eine
Vielzahl potentieller Probleme. Die Datenintegrität ist schwieriger aufrecht zu erhalten,
und es gibt nicht nur eine Version der Wahrheit. Satt dessen bieten OLTP- und OLAPSysteme zwei Versionen der Wahrheit, ungeachtet der Tatsache, dass OLTP-Systeme
während eines ETL-Prozesses üblicherweise nicht bereinigt wurden. Separate
Datenspeicher benötigen auch mehr Speicherplatz und tendieren dazu, Daten-Silos zu
fördern, das Gegenteil des einen Speichers, nach dem in Warehousing-Lösungen
gestrebt wird. Dazu kommt, dass Berichterstellungs- und Analyseanwendungen häufig
als separate Anwendungen gesehen werden, die aus getrennten Datenspeichern
gespeist werden und vollkommen unterschiedliche Ansprüche haben. Deshalb bieten
viele Analyseanwendungen von Dritten keinerlei Unterstützung für relationale
Berichterstellung und nur begrenzte Möglichkeiten für die Produktion jeglicher HardcopyAusgabe analytischer Daten.
5
Lösung: Das eine Modell des UDM
Um die Wucherung von Nischenanwendungen anzugehen hat Microsoft einen
dramatischen Wechsel in den herkömmlichen Weisheiten BI betreffend eingeleitet. In
der Vergangenheit war die Trennung von OLTP und OLAP klar: Unternehmen
extrahierten Daten aus einer oder mehreren OTLP-Datenquellen, transformierten die
Daten in einen einheitlichen und konsolidierten Zustand, luden die Daten in eine SternSchema-Datenbank und errichteten dann Cubes auf Grund dieses Stern-Schemas. Dies
bedeutete, dass Analytiker die Daten anhand von Hochleistungs-Cubes untersuchen
konnten oder Berichte auf Grund relationaler Daten erstellen, aber die Datenstrukturen
waren anders, die Werkzeuge zur Analyse und Berichterstellung waren anders, und
sogar die Sprachen zur Abfrage der Daten waren erheblich andere. Jetzt sind diese
Probleme, dank des UDM (Unified Dimensional Model), beseitigt.
Das UDM verbindet die Anforderungen an die relationale Berichterstellung auf Grund von
OLTP-Quellen mit den Anforderungen an Analysen von OLAP-Quellen in einem einzigen
Berichterstellungsmodell. Durch die Verwendung des UDM greifen sowohl Analyse- als
auch Berichterstellungsanwendungen auf die gleichen Datenspeicher zu. OLAP-Cubes
werden ohne zeitliche Verzögerung errichtet und unterhalten und bieten kraftvolle
Analysemöglichkeiten, kombiniert mit annähernden Echtzeit-Aktualisierungen der Cubes.
Die Geschwindigkeit von Berichterstellungsanwendungen profitiert von der OLAPZwischenspeicherung, die von dem UDM vorgenommen wird.
Da unterschiedliche Datenmodelle für OLTP und OLAP jetzt überflüssig sind, stellen sich
eine Reihe von Vorteilen ein. Die Bemühungen um Datenintegrität können auf eine
einzige Stelle gerichtet werden, anstatt auf viele Datenspeicher. Daten werden nicht
länger in einer Reihe von Daten-Silos gespeichert sondern an einem zentralen Ort, der
sowohl für relationale, als auch OLAP-Berichterstellung verwendet wird. Die
Notwendigkeit von Nischenanwendungen und separaten Datenspeichern wird verringert,
da es Werkzeugen ermöglicht wird, auf einen gemeinsamen Datenspeicher zuzugreifen
und die Daten entweder relational, oder im Cube-Format zu betrachten.
Eine weitere Bereicherung des UDM und aller Berichterstellungs- und
Analyseanwendungen stellt die Fähigkeit dar, KPIs durch das KPI-Framework zu
erstellen. Dies erlaubt es Unternehmen, die Schlüssel-Metriken ihres Geschäfts zu
definieren, sodass diese Definitionen an einem einzigen Ort erstellt und gespeichert
werden, und alle Anwendungen auf diese eine Version der Wahrheit zugreifen können.
KPIs können durch die Verwendung einfacher, aber aussagkräftiger Grafiken wie Ampeln
oder Trendmaßstäbe angezeigt werden. So können Entscheidungsträger auf einen Blick
den Zustand der Schlüsselfaktoren ihres Geschäfts erfassen.
6
Abbildung 1: Gemischte Berichte
Problem 3: Eine intelligente Geschäftssicht
der Daten
Eines der leistungsstärksten Features analytischer Anwendungen ist die Möglichkeit,
einen Drilldown auszuführen. Dies ermöglicht den Benutzern den iterativen Prozess der
Datenuntersuchung, des Aufstellens einer Hypothese und des anschließenden weiteren
Untersuchens der Daten. Indem es allen Benutzern ermöglicht wird, einen Drilldown
durchzuführen, haben Organisationen allen Benutzern die Daten eröffnet, damit sie ihre
eigenen Fragen danach, was den von ihnen betrachteten Daten zu Grunde liegt,
beantworten können. Auf diese Art müssen sich die Benutzer nicht mehr an die
technischen Mitarbeiter wenden, und ständig nach Berichten mit ausführlicheren DetailEbenen fragen, sondern können ihre eigenen Analysen ausführen.
Obwohl der Drilldown ein leistungsstarkes Konzept ist, werden dadurch doch nicht alle
Fragen beantwortet. Einige Anwendungen ermöglichen alternative Analysen, aber sie
werden durch die Möglichkeiten des zu Grunde liegenden Datenbankmoduls beschränkt.
Diese Beschränkungen erschweren einige Arten der Analyse.
Benutzer müssen, neben einem Drilldown, vor allem in der Lage sein, von einer
Dimension zur anderen navigieren zu können. Wenn ein Analytiker beispielsweise eine
Produkt-Dimension betrachtet, muss er möglicherweise die Kunden, die diese Produkte
7
bestellt haben, sehen können, oder die Zulieferer, von denen das Produkt erworben
wurde. Analytiker müssen beispielsweise Werte vergleichen, wie etwa Bestelldaten mit
Auslieferungsdaten, anstatt sich auf einzelne Werte zu beschränken. Unternehmen
müssen eventuell komplexere Beziehungen als einfache Hierarchien definieren, wie
beispielsweise einen Autoren, der mehr als ein Buch schreibt, und ein Buch von mehr als
einem Autoren verfasst wird. Data Warehousing-Module können Schwierigkeiten damit
haben, so komplexe Szenarien zu modellieren, was es nahezu unmöglich macht, mittels
solcher Strukturen Analysen auszuführen oder Berichte zu erstellen.
Lösung: Fortgeschrittenes dimensionales
Modellieren
SQL Server 2005 Analysis Services geht diese Probleme durch eine Reihe von neuen
Features an, die einen Reichtum neuer Analysemöglichkeiten eröffnen. Eines dieser
Features sind die attributbasierten Dimensionen. Heutige OLAP-Produkte tendieren dazu,
für Dimensionen sehr strenge hierarchische Strukturen zu erzwingen. Das bedeutet,
dass sich Wirtschaftsanalytiker von Produktgruppe zu Produktfamilie bis zur
Identifikationsnummer herunterarbeiten. Allerdings gibt es häufig zusätzliche Attribute
der Dimension, wie Größe, Farbe, Gewicht usw. Diese zusätzlichen Attribute werden
häufig an eine bestimmte Identifikationsnummer gebunden, aber es stellt sich als
schwierig heraus, einen Drilldown zu Farbe als ein Dimensionslevel auszuführen.
Attributbasierte Dimensionen umgehen dieses Problem, indem sie Dimensionen auf
Attribute als eine strenge Hierarchie konzentrieren. Alle Attribute können für DrilldownVorgänge verwendet und gefiltert werden, was das Erstellen jeder Kombination von
Hierarchien ohne Zeitverzögerung ermöglicht.
SQL Server 2005 Analysis Services führt auch das Konzept der m:n-Beziehungen ein.
Traditionelle Data Warehousing-Lösungen ermöglichen nur die Knüpfung eines Fakts an
nur ein einzelnes Dimensionselement, was bedeutet, dass ein bestimmter
Faktendatensatz in der Produkt-Dimension nur an ein einziges Produkt geknüpft werden
kann. In der wirklichen Welt aber sind die Zustände nicht immer so eindeutig. Eine
Gesellschaft kann über Kunden verfügen und über Bankkonten, in denen ein Kunde
verschiedene Konten hat (Girokonto, Sparkonto, Tagesgeldkonto usw.), und jedes Konto
kann verschiedenen Kunden gehören (das Sparkonto von Max und Sabine Mustermann).
SQL Server 2005 unterstützt diese komplexe Beziehung, in der ein einzelner Datensatz
auf vielen Dimensionsdatensätzen abgebildet werden kann, was komplexere und
wirkungsvollere Analyse mit leichterem Modellieren der Daten ermöglicht.
Viele Data Warehouse-Module machen es nötig, dass pro auszuführender Analyse-Art
Cubes mit einer Dimension erstellt werden. Eine Firma kann zum Beispiel Bestellungen
anhand des Bestelldatums oder des Auslieferungsdatums analysieren wollen. Anstatt
zwei separate Dimensionen zu erstellen ermöglicht es SQL Server 2005 Analysis
Services dem Warehouse-Entwickler, eine einzelne Zeit-Dimension zu entwerfen und die
selbe Dimension dann sowohl als generische Zeitdimension, als auch als
Bestellungsdatums- oder Auslieferungsdimension zu verwenden. Die Möglichkeit, dass
eine Dimension verschiedene Rollen haben kann, bezeichnet man als Dimensionen mit
unterschiedlichen Rollen, und diese Dimensionen helfen, Festplattenspeicher zu
reduzieren und Verarbeitungszeit zu reduzieren, da sie Daten nur einmal speichern, es
aber ermöglichen, dass die Dimension den Analytikern und anderen Benutzern als viele
verschiedene Dimensionen angezeigt werden kann.
8
Manchmal werden Daten in einer Faktentabelle gespeichert, die in keiner
Dimensionstabelle enthalten ist. SQL Server 2005 Analysis Services ermöglicht es, diese
Daten herauszuziehen und eine 1:1-Dimension zu der Faktentabelle zu erstellen, die
üblicherweise als degenerierte Dimension bezeichnet wird und in SQL Server 2005
Analysis Services Faktendimension heißt. Das bedeutet, dass es einfach gemacht wird,
eine Dimension zu haben, die nur verwendet wird, um einen bestimmten
Faktendatensatz zu betrachten oder alle Werte zu identifizieren, die eine aggregierte
Zelle ergeben.
Problem 4: Die Analyse lokalisieren
Einer der Hauptvorteile von Data Warehouses besteht darin, dass sie Daten in einem
einheitlichen Zustand konsolidieren. Die Verkäufe in verschiedenen Ländern werden
beispielsweise in der betreffenden örtlichen Währung erfasst. Allerdings macht es keinen
Sinn, Britische Pfund und Japanische Yen zu addieren; stattdessen verfügt der BIAssistent über ein Feature, das es ermöglicht, dass Regeln zur Währungsumrechnung
direkt im UDM definiert werden. Auf ähnliche Weise können Zeichenketten von einer
Sprache in die andere übertragen werden, Maßeinheiten von Englisch in metrisch und so
weiter.
Die Vorteile einer Umwandlung der Daten in ein einheitliches Format sind offensichtlich:
Die Vergleiche zwischen verschiedenen Ländern sind nicht gültig, solange die Daten
nicht in ein einheitliches lokales Format gebracht wurden. Dies ermöglicht die Analyse
von Daten innerhalb des Unternehmens, ungeachtet des Landes ihrer Herkunft. Der
Nachteil besteht darin, dass den Analytikern in der Tokioter Niederlassung im Fall einer
Konsolidierung der Daten zu US Dollar nun ein englischsprachiges Warehouse angezeigt
wird, das schwierig zu verwenden sein kann. Das Unternehmen kann entscheiden, ob
viele Kopien des Warehouses erstellt werden sollen und für jede Niederlassung
lokalisiert, oder ob ein einzelnes Warehouse in einer einzigen Sprache ausreichend ist.
Lösung: Eingebaute Daten- und
Metadatenübersetzungen und
Währungsumrechnungen
Unternehmen haben nun, Dank SQL Server 2005 Analysis Services, eine zusätzliche
Wahl, die darin besteht, das Warehouse in einer einzelnen Sprache zu erstellen, den
Benutzern aber lokalisierte Versionen der Daten anzuzeigen. Das bedeutet: Ein einziges
konsolidiertes Warehouse mit für den US-Markt formatierten Daten kann Analytikern und
Informationsarbeitern in anderen Ländern in ihrer lokalen Währung, sowie numerischenund Textformaten angezeigt werden.
Diese Herangehensweise hat zwei primäre Vorteile. Erstens beseitigt sie die
Notwendigkeit, eine Anzahl von lokalisierten Warehouses zu erstellen und reduziert
Speicheraufwand und Erstellungszeit. Zweitens ermöglich sie es Organisationen,
Analysen auf das gesamte Unternehmen auszuweiten, da jedes Land nun seine
lokalisierte Analyse bekommt.
Die Möglichkeit, lokalisierte Sichten eines bestimmten Cubes bereitzustellen, stammt
von einem neuen Feature in SQL Server 2005 Analysis Services, den Übersetzungen.
Übersetzungen ermöglichen die unmittelbare Übersetzung von sowohl Metadaten, als
9
auch Daten in das lokale Format, was den Benutzern eine lokalisierte Erfahrung mit
einem Minimum an Aufwand ermöglicht, im Gegensatz zum Erstellen separater
physikalischer Cubes für jeden Standort.
Abbildung 2 Mehrfachübersetzung
Problem 5: Echtzeit-BI
Typische BI-Lösungen teilen sich eine Menge gemeinsamer Attribute: Die Daten sind
konsolidiert, einheitlich, schreibgeschützt und historisch. „Historisch“ meint nicht nur,
dass die Daten sich auf einen zurückliegenden Zeitpunkt beziehen, sondern auch, dass
sie nicht vollständig aktuell sind. Entscheidungsträger in Unternehmen treffen selbst mit
einem Warehouse, das jede Nacht aktualisiert wird, Entscheidungen, die auf
Informationen des Vortages beruhen. In Situationen, die von schnell wechselnden
Märkten und Bedingungen geprägt sind, können die Informationen von gestern eventuell
nicht gut genug sein.
Echtzeit-BI-Lösungen oder Lösungen nahe der Echtzeit, gibt es seit einiger Zeit, doch
diese Lösungen haben typische Probleme. Diese Lösungen haben häufiger Probleme mit
der Leistung, da sie nicht in der Lage sind, Analysedaten im optimalen Format zu
speichern. Zusätzlich haben diese Lösungen eine negative Auswirkung auf die Leistung
des OLTP-Systems, von dem sie Daten beziehen, da sie permanent auf diese Systeme
zugreifen, um die neuesten Daten zu erhalten.
10
Lösung: Richtige Information, richtiges
Format, richtige Zeit
Microsoft SQL Server 2005 Analysis Services bietet Unternehmen die Möglichkeit,
annähernde Echtzeit-BI zu praktizieren, Analysen auszuführen, ohne auf tägliche oder
wöchentliche Aktualisierungen warten zu müssen. Zusätzlich ermöglicht die Struktur der
Lösung die Ausführung der Analyse, welche die Leistung der BI-Lösung nicht
beeinträchtigt. Zu guter Letzt: die Leistung des OLTP-Systems erfährt trotz der in
annähernd Echtzeit arbeitenden BI-Lösung eine geringe bis gar keine Beeinträchtigung.
SQL Server 2005 Analysis Services erreicht diese Funktionalität nahe der Echtzeit durch
ein neues Feature, das proaktives Zwischenspeichern genannt wird. Durch proaktives
Zwischenspeichern können Cubeersteller bestimmen, wie und wann der Cube aktualisiert
wird. So kann beispielsweise Echtzeitanalyse ermöglicht werden; durch eine Einstellung
des Zwischenspeichers wird beim Auftreten einer neuen Transaktion in der relationalen
Datenbank eine Benachrichtigung an das UDM gesendet. Dies löst im Hintergrund eine
Aktualisierung des Cubes aus, um den Cube weiterhin mit der zu Grunde liegenden
Datenquelle zu synchronisieren. Alternativ kann der Cube so eingestellt werden, dass er
auf einer zeitlichen Basis aktualisiert wird, wie etwa jede halbe Stunde.
Ein großer Nutzen dieser Vorgehensweise besteht darin, dass Unternehmen Analysen in
Echtzeit, oder nahe der Echtzeit, ermöglicht werden, unter Beibehaltung eines
vollständig verarbeiteten Data Warehouse-Cubes. Administratoren können das
Zwischenspeichern konfigurieren, um die Wartezeit und Aktualisierungsfrequenz zu
kontrollieren. Proaktives Zwischenspeichern ermöglicht Abfragen gegen einen Cube,
nicht nur, bevor er bestückt wurde, sondern auch während und nach einer
Aktualisierung. Wenn eine Abfrage eintrifft, bevor die Aktualisierung abgeschlossen
wurde, wird Analysis Services 2005 von einem MOLAP- in einen ROLAP-Modus wechseln,
um die Abfrage zu beantworten. Microsoft hat Echtzeit-BI etabliert, unter Beibehaltung
der Leistung, die früher voll verarbeiteten, historischen Data Warehouse-Cubes
vorbehalten war.
Zusammenfassung
Viele Probleme haben BI-Implementationen seit Jahren geplagt. Beispielsweise befinden
sich viele Unternehmensdaten in einer Reihe von Silos, sei es in CRM, SCM, ERP oder
einer anderen Anwendung mit ihrem eigenen Schema und Datenformat. Das UDM
ermöglicht Unternehmen komplexe Analysen und Berichterstellungen anhand großer
Datenmengen, sogar zwischen heterogenen Datenquellen.
BI-Lösungen stellen häufig historische Snapshots dar, die zum Zeitpunkt einer
getätigten Analyse veraltet sind. Manche BI-Produkte unterstützen Analysen nahe der
Echtzeit, kranken aber an schlechter Leistung und signifikanter Verzögerung.
Viele BI-Lösungen kranken auch daran, weit verstreute Data Marts in einem
konsistenten Data Warehouse zu konsolidieren. Andere BI-Lösungen leiden an einem
Mangel an Flexibilität, wenn es darum geht, hierarchische Strukturen zu analysieren
oder komplexe Beziehungen zwischen verschiedenen Dimensionen zu modellieren.
Abschließend: Warehousing Produkte arbeiten unzureichend, wenn es darum geht,
Daten in lokalisierten Sprachen und numerischen Formaten auszuliefern, während
zeitgleich das Konzept der Berichterstattung vom Konzept der Analyse getrennt wird.
11
Dies bedeutet häufig vielzählige Datenspeicher in verschiedenen Formaten, die alle für
verschiedene Zwecke verwendet werden.
SQL Server 2005 Analysis Services geht diese Belange mit eingebauten Lösungen für
diese beharrliche Data Warehousing-Probleme an. Data Warehouses können direkt auf
relationalen Schemas errichtet werden, die in CRM, SCM und anderen Datensilos
gefunden werden können, ohne dass zuerst ein Stern-Schema erstellt werden muss und
mit kleinen bis gar keinen Auswirkungen auf die Produktions-Anwendungen. Analysis
Services führt eine Technologie ein, um OLAP-Cubes in nahezu Echtzeit aktualisieren zu
können, mit minimalen Auswirkungen auf die Quelldatenbank, während zeitgleich die
relationale Berichterstellung auf Grund der selben Quelle beschleunigt wird.
Analysis Services ermöglicht es auch, dass ein einzelnes Warehouse erstellt wird und
dann den Abteilungen und Benutzern innerhalb der Organisation als eine Reihe von
separaten Data Marts dargestellt wird. Dies ermöglicht es jeder Abteilung, weiterhin ihre
Datenteilmengen zu analysieren, ohne eine Reihe von Marts erstellen und verteilen zu
müssen. Weiterhin kann dieses eine Warehouse in einem lokalisierten Format präsentiert
werden, ohne die Notwendigkeit einzelne lokalisierte Versionen erstellen zu müssen.
Abschließend verbindet das Microsoft UDM die Nutzen von OLTP und OLAPDatenspeichern in einem Modell. OLAP-Cubes werden unmittelbar erstellt und in nahezu
Echtzeit aktualisiert. Es ist kein separates Stern-Schema erforderlich.
Berichterstellungsanwendungen profitieren vom zum Unterhalt der Cubes verwendeten
Zwischenspeichern, das schnellere Berichterstellung auf Grund OLTP-Datenbank
ermöglicht.
Microsoft hat anhaltenden Einsatz demonstriert, um Organisationen jeder Größe
unglaublich leistungsstarke BI- und Analysefeatures zu bringen. Durch die Verwendung
dieser Features können Unternehmen leistungsfähigere, flexiblere und kosteneffektivere
BI-Lösungen entwerfen, die von einer größeren Zahl von Benutzern und Werkzeugen als
jemals zuvor verwendet werden können.
Craig Utley ist der Vize-Präsident für Entwicklung von KiZAN Technologies LLC, wo er ein
Team leitet, das sich auf Business Intelligence-Lösungen und den Entwurf und die
Entwicklung von Unternehmens-Anwendungen konzentriert. Seit ihrer Einführung
arbeitet er mit Microsoft Business Intelligence-Produkten und erarbeitete BI- und Data
Warehousing-Lösungen für Unternehmen in den ganzen USA. Er ist Autor, Sprecher auf
Konferenzen und ein ausgewähltes MVP.
Dieses Dokument wurde in Zusammenarbeit mit A23 Consulting entworfen.
12
Herunterladen