Geschäftsprobleme mit SQL Server 2005 Analysis Services lösen Autor: Craig Utley Veröffentlichung: April 2005 Zusammenfassung: Dieses Dokument untersucht eine Reihe von häufigen Geschäftsproblemen und weist auf, wie diese Probleme mit SQL Server 2005 Analysis Services auf einfache und wenig aufwändige Art gelöst werden können. Die besprochenen Arten von Geschäftsproblemen sind die folgenden: Eine einfache, integrierte Datensicht, Konsolidierung von Data Mart- und Nischenanwendungen, intelligente Datensichten, Probleme der Lokalisierung und Echtzeit-BI-Daten. Diese Probleme waren üblicherweise mit anderen Data Warehousing-Produkten schwierig oder gar nicht zu lösen. Microsoft jedoch ermöglicht den Unternehmen die Problemlösungen in einem einfachen, aber wirkungsvollen Paket. Copyright Dies ist ein vorläufiges Dokument und kann vor der endgültigen kommerziellen Veröffentlichung der hier beschriebenen Software noch wesentliche Veränderungen erfahren. Die in diesem Dokument enthaltenen Informationen repräsentieren die augenblickliche Meinung der Microsoft Corporation zu den diskutierten Themen zum Zeitpunkt der Publikation. Da Microsoft den wechselnden Ansprüchen des Marktes entsprechen muss, sollte dieses Dokument nicht als eine Haftung seitens Microsoft interpretiert werden, und Microsoft kann nicht für die Genauigkeit jeglicher gegebener Information nach dem Datum der Veröffentlichung garantieren. Dieses Whitepaper dient nur der Information. MICROSOFT GIBT IN DIESEM DOKUMENT KEINE GARANTIEN, AUSDRÜCKLICHE ODER ANGEDEUTETE. Es liegt in der Verantwortung des Benutzers, allen maßgeblichen Urheberrechtsbestimmungen zu entsprechen. Kein Teil dieses Dokuments kann reproduziert werden, in einem Verteilersystem gespeichert oder in ein Verteilersystem eingespeist werden oder in irgendeiner Form auf irgendeine Art übertragen werden (elektronisch, mechanisch, durch Photokopieren Aufnehmen oder ähnliches), aus irgendeinem Grund, ohne die ausdrückliche schriftliche Genehmigung der Microsoft Corporation. Microsoft kann Patente, Patentanmeldungen, Schutzmarken, Urheberrechte oder andere Rechte geistigen Eigentums haben, die in diesem Dokument behandelte Gegenstände betreffen. Soweit nicht eine ausdrückliche schriftliche Lizenzgenehmigung seitens Microsoft vorliegt, gibt die Ausstattung mit diesem Dokument Ihnen keinerlei Lizenz über Patente, Schutzmarken, Urheberrechte oder andere geistige Eigentümer. 2005 Microsoft Corporation. Alle Rechte vorbehalten. Microsoft, ActiveX, SharePoint, Visual Basic, Visual C#, Visual Studio, Windows, Windows Server, und Windows Server System sind entweder eingetragene Handelsmarken oder Handelsmarken der Microsoft Corporation in den Vereinigten Staaten und/oder anderen Ländern. Die Namen von in diesem Dokument erwähnten realen Unternehmen und Produkten können Handelsmarken der betreffenden Eigentümer darstellen. 2 Inhaltsverzeichnis Einführung ........................................................................................................ 1 Eine Untersuchung der Geschäftsprobleme ...................................................... 2 Problem 1: Einfache, integrierte Ansicht von Daten .......................................... 3 Lösung: Getrennte semantische Sicht ................................................................ 3 Problem 2: Data Mart- und Nischen-Anwendungs-Konsolidierung .................... 4 Data Mart-Konsolidierung ................................................................................ 4 Lösung: Die eine Version der Wahrheit .............................................................. 5 Nischen-Applikationen ..................................................................................... 5 Lösung: Das eine Modell des UDM ..................................................................... 6 Problem 3: Eine intelligente Geschäftssicht der Daten ...................................... 7 Lösung: Fortgeschrittenes dimensionales Modellieren .......................................... 8 Problem 4: Die Analyse lokalisieren .................................................................. 9 Lösung: Eingebaute Daten- und Metadatenübersetzungen und Währungsumrechnungen ................................................................................. 9 Problem 5: Echtzeit-BI .................................................................................... 10 Lösung: Richtige Information, richtiges Format, richtige Zeit .............................. 11 Zusammenfassung .......................................................................................... 11 i Einführung Nur zu häufig stellen Unternehmen fest, dass ihre Investition in erstklassige Anwendungen zu Informations-Silos führt, die schwierig zu integrieren und analysieren sind. Dies wiederum bedeutet, dass das Versprechen informierterer und pünktlicherer Entscheidungen häufig unerfüllt bleibt. Unternehmen haben unzählige Versuche unternommen, diese verstreuten Systeme effektiv zu analysieren: Das Austauschen eines Systems zur relationalen Berichterstellung gegen ein anderes, Extrahieren und Transformieren der Daten und Erstellen eines Data Warehouses oder Erwerben neuer Systeme, die bessere Berichterstellung versprechen. Jede dieser Lösungen hat Nachteile, von der Verwendung unpassender Werkzeuge für die Annäherung an das Problem bis zu benötigten neuen und aufwändigen Projekten zur Datenkonsolidierung. Diese, von vielen Unternehmen erfahrenen, Schwierigkeiten sind nicht neu. Beispielsweise kaufen viele Unternehmen Softwareprodukte wie SAP für ihre Geschäftsaktivitäten. Unglücklicherweise verfügen diese Produkte häufig über komplexe Datenstrukturen, die es erschweren, effektive Analysen zu tätigen. Ein Unternehmen kann über eine CRM (customer relationship management)- und eine SCM (supply chain management)-Anwendung verfügen, die vollkommen getrennt voneinander sind, aber beide wichtige Informationen enthalten, um strategische Entscheidungen für das Unternehmen zu treffen. Auch haben Unternehmen eine große Bandbreite von Anwendungen und Datenspeichern produziert, um den Ansprüchen an Berichterstellung und Analyse gerecht zu werden, und um die verschiedenen und wechselnden Bedürfnisse ihrer Analytiker, Informationsarbeiter und Benutzer zufrieden zustellen. Um diese Probleme anzugehen beschäftigt sich Microsoft seit Jahren damit, den Übergang zu Business Intelligence (BI) zu erleichtern. Mit der Veröffentlichung von Microsoft® SQL Server™ 2005 Analysis Services hebt Microsoft die Messlatte bedeutend höher. Organisationen verfügen nun über eine einzelne, einheitliche Lösung, um Berichte auf Grund von OLTP (online transaction processing)- oder OLAP (online analytical processing)-Datenspeichern zu erstellen. SQL Server 2005 Analysis Services reduziert erheblich den Aufwand, um eine einheitliche Sicht der Daten, die aus vielzähligen Anwendungen und Formaten stammen, zu bieten. Worin auch immer das Ziel bestehen mag: der Integration von Daten aus vielen verschiedenen Anwendungen in ein einheitliches Format, der Analyse von Daten aus einer Vielzahl von Quellen, der Berichterstellung unter Verwendung einer Vielzahl von Formaten und Techniken, dem Data Mining zum Aufdecken von Datenbeziehungen oder der Vorhersage zukünftiger Ergebnisse mit vorhersagender Analyse. SQL Server 2005 Analysis Services bietet einen Satz hoch integrierter Werkzeuge, um Unternehmen dabei zu unterstützen, die ganzen Vorteile des Spektrums von BI in Anspruch zu nehmen. 1 Dieses Dokument wird eine Reihe von häufigen Geschäftsproblemen untersuchen und aufweisen, wie diese Probleme mit SQL Server 2005 Analysis Services auf einfache und wenig aufwändige Art gelöst werden können. Die in diesem Dokument besprochenen Probleme: Einfache, integrierte Sicht der Daten. Viele Unternehmen unterhalten eine Vielzahl von Anwendungen für Aufgaben wie ERP (enterprise resource planning), CRM, SCM, Human Resources usw. Microsoft SQL Server 2005 Analysis Services geht diese Probleme durch die Verwendung von Datenquellensichten an, eine Technologie, die den Entwurf eines Analysemodells der existierenden Datenstrukturen ermöglicht. Data Mart-Konsolidierung. Organisationen erstellen Data Marts für jeden Funktionsbereich und stellen dann fest, dass eine Konsolidierung dieser Marts in ein Data Warehouse schwierig bis unmöglich ist. Microsoft SQL Server 2005 Analysis Services führt das Unified Dimensional Model und Perspektiven ein, um eine Version der Wahrheit zu schaffen und sie als virtuelle Data Marts den einzelnen Abteilungen zur Verfügung zu stellen. Intelligente Sicht der Daten. Viele der heutigen Warehousing-Produkte erstellen strenge hierarchische Strukturen, um Analytikern und Wissensarbeitern Drilldown/Drillup durch die Daten zu ermöglichen. Obwohl effektiv, ist das nicht die einzige Art, eine Analyse auszuführen. Microsoft SQL Server 2005 Analysis Services ermöglicht es Unternehmen, Lösungen zu erstellen, die flexible Hierarchien unterstützen, m:n-Beziehungen und andere Dimensionstypen, die fortgeschrittenere Analyse ermöglichen als andere erhältliche Lösungen. Lokalisierung der Analyse. Unternehmen, deren Operationen auch Sprache umfassen, müssen Daten in einer einzelnen Sprache und Währung konsolidieren, um eine gültige Analyse zu ermöglichen. Dies macht es für weltweite Unternehmen schwieriger, die Lösung zu verwenden. Dank einem Feature namens Übersetzungen ermöglicht es Microsoft SQL Server 2005 Analysis Services Unternehmen, eine einzige Lösung zu erstellen, die Werte abhängig vom Standort des Benutzers während der Übertagung lokalisiert. Echtzeit-BI. Die meisten BI- und Data Warehousing-Lösungen stellen einen zeitlichen Snapshot dar, der jede Nacht oder einmal pro Woche aktualisiert wird. Echtzeit-BI-Lösungen existieren zwar, doch sie sind – im Vergleich zu Snapshots – sehr langsam. Microsoft SQL Server 2005 Analysis Services ermöglicht Unternehmen Echtzeit-BI oder annähernd Echtzeit-BI, mit der Geschwindigkeit von Snapshots und minimaler Auswirkung auf die Produktionssysteme. Eine Untersuchung der Geschäftsprobleme Um die Probleme, die durch SQL Server 2005 Analysis Services gelöst werden können, zu untersuchen, bietet es sich an, wirkliche Probleme zu erkunden, mit denen sich eine große Bandbreite von Unternehmen heutzutage konfrontiert sieht. Dies stellt unter keinen Umständen eine erschöpfende Liste jener Probleme dar, die mittels SQL Server BI-Werkzeugen angegangen werden können. Dieses Dokument bietet einen Überblick der häufigen Probleme dar, die SQL Server 2005 Analysis Services effizient und kosteneffektiv löst. Der Fokus von Microsoft liegt darauf, Unternehmen eine schnellere Integration und Analyse ihrer Daten zu ermöglichen, sowie eine schnellere Berichterstellung, und das unabhängig davon, wo diese Organisation angesiedelt ist. 2 Dies reduziert gewaltig die TCO (total cost of ownership), während die Zeit, die es benötigt, informierte Entscheidungen auf Grund von Daten aus einer großen Bandbreite von Anwendungen zu treffen, verringert wird. Tabelle 1 bietet einen Überblick der Geschäftsprobleme und deren Lösung. Tabelle 1: SQL Server 2005 Analysis Services-Features und die von ihnen angegangenen Geschäftsprobleme Geschäftsproblem SQL Server 2005 Analysis ServicesFeature, das dieses Problem angeht Einfache, integrierte Datensicht UDM Datenquellensichten Konsolidierung von Data Mart und Nischenanwendung UDM Perspektiven Intelligente Geschäftssicht der Daten UDM m:n-Dimensionen, Dimensionen mit unterschiedlichen Rollen, referenzierte Dimensionen und Faktendimensionen Lokalisierung der Analyse UDM Übersetzungen und Währungsumrechnungs-Assistent Echtzeit-BI UDM Proaktives Zwischenspeichern Problem 1: Einfache, integrierte Ansicht von Daten Die meisten Organisationen haben ihre Daten über verschieden Systeme wie ERP, CRM, und SCM verteilt. Diese Systeme können von verschiedenen Anbietern stammen und verschiedene Terminologien, Datenschemas und sogar Datenbankmodule verwenden. Trotzdem müssen Entscheidungsträger die Daten aus all diesen Quellen betrachten, um informierte Entscheidungen zu treffen. Heterogene Daten, abgespeichert in unterschiedlichen Formaten, erfordern ETL (Extraktion, Transformation und Laden)-Routinen von verschiedener Komplexität, um die Daten zum Zweck einer Analyse zu konsolidieren. Selbst, wenn eine Organisation nur eine einzelne Quelle wie die CRM-Anwendung analysieren möchte, müssen die Daten in einen Betriebsdatenspeicher oder Data Mart transformiert werden (üblicherweise in Form eines Stern-Schemas), um Cubes zu erstellen und fortgeschrittene Analyseanwendungen zu verwenden. Lösung: Getrennte semantische Sicht Die neuen Fähigkeiten von SQL Server 2005 Analysis Services ermöglichen fortgeschrittene Analysen der Daten in den bereits bestehenden Systemen eines Unternehmens mit wesentlich weniger Aufwand als früher. Mit dem Microsoft UDM (Unified Dimensional Model) können Organisationen eine ganzheitliche Sicht der ungleichen Daten erstellen, einschließlich relationaler Datenbanken, OLTP-Datenbanken, Flatfiles und sogar Webdiensten. Das UDM ermöglicht es Unternehmen, komplexe Datenstrukturen aus einer Vielzahl von Quellen zu modellieren, um anschließend relationale Berichterstellung oder multidimensionale Analyse auszuführen. Das stattet 3 Unternehmen mit den Vorzügen relationaler Berichterstellung aus, die von OLAPAggregationen profitiert, während zugleich leistungsstarke Analysemöglichkeiten geboten werden. SQL Server 2005 Analysis Services kann UDM-Cubes erstellen, ohne als Zwischenschritt ein Stern-Schema-Data Warehouse erstellen zu müssen. Das UDM unterstützt Unternehmen dabei, Berichterstellungsanwendungen direkt für ein Produktionssystem zu erstellen und erfordert nicht wie in der Vergangenheit als Zwischenschritt ein Data Warehouse. Das UDM erfordert keine Daten in einem Stern- oder SchneeflockenSchema, sondern kann zu jeder Datenquelle Verbindung aufnehmen, deren Daten in einer dritten Normalform gespeichert sind. Unbeachtet der Herangehensweise bietet SQL Server 2005 Analysis Services die Möglichkeit, ein komplexes Schema auf einem bereits bestehenden Schema zu entwerfen, einschließlich berechneter Spalten, SQLAnweisungen, die sich wie Tabellen verhalten, und mehr. Diese Schemas können als Basis zur Cubeerstellung dienen. Da der Cube einen separaten Speicher darstellt, hat er keine Auswirkung auf die Leistung der zu Grunde liegenden Datenquelle. Das bedeutet, dass die Produktions-OLTP-Systeme weiter mit Höchstgeschwindigkeit laufen, und so dem Unternehmen Zugriff auf Möglichkeiten zur fortgeschrittenen Analyse ermöglichen und, wenn gewünscht, nahezu Echtzeit-Analyse. SQL Server 2005 Analysis Services bietet diese leistungsstarke Möglichkeit unter Verwendung einer Technologie namens Datenquellensichten. Datenquellensichten helfen dem technologischen Mitarbeiterstab, auf bereits bestehenden Schemas komplexe analytische Modelle zu erstellen egal, ob es sich um OLTP- oder Stern-Schemas handelt. Dies ermöglicht die Erstellung von komplexen Schemas, die berechnete Spalten beinhalten, SQL-Abfragen, die wie Tabellen verwendet werden können, freundliche Namen und virtuelle Beziehungen. Ein großer Vorteil von Datenquellensichten besteht darin, dass sie von Analytikern erstellt werden können, die über keine CREATEBerechtigung auf der Datenbank verfügen. Nach ihren Erstellungen können auf diesen Datenquellensichten Cubes gestellt werden, was es ermöglicht, Cubes auf Grund eines reichhaltigeren Schemas zu erstellen unter der Hinzufügung der Möglichkeit zur fortgeschrittenen Analyse der Produktionssysteme, ohne im Gegenzug diese wichtigen Anwendungen zu beeinflussen. Problem 2: Data Mart- und NischenAnwendungs-Konsolidierung Data Mart-Konsolidierung Eine der Hauptstrategien, die Unternehmen verwenden, um ein Data Warehouse zu erstellen, besteht darin, Data Marts zu erstellen, kleinere Warehouses also, entworfen für einzelne Abteilungen des Unternehmens oder zur Lösung bestimmter Probleme, wie etwa der Analyse von Finanzdokumenten oder Warenkorbanalysen. Der Unterhalt vieler Data Marts bedeutet verschiedene Schwierigkeiten. Es kann aufwändig sein, eine Reihe von Data Marts über das Unternehmen verteilt zu unterhalten, die viele Aktualisierungen aus den selben Datenquellen erfordern. Zusätzlich kann es schwierig sein, diese ungleichen Marts zu einer kleineren Anzahl von Marts oder in ein einziges Data Warehouse zu konsolidieren. 4 Einige dieser Data Marts zu entfernen kann von Vorteil für die TOC sein. Durch die verringerte Anzahl von Marts wird unnötiger Aufwand vermieden und Datenreplikation sowie ETL reduziert. Durch die Unterbindung überflüssiger Datenspeicherung wird auch der benötigte Speicherplatz reduziert. Auch wird der Aufwand für Datensynchronisation gesenkt. Gefahren für die Datenintegrität werden reduziert, da die Notwendigkeit, verschiedenste Data Marts einheitlich zu halten, beseitigt wird. Lösung: Die eine Version der Wahrheit Microsoft ist dieses Problem angegangen und hat ein Konstrukt namens UDM (Unified Dimensional Model) eingeführt. Ein UDM ist ein Ort, an dem ein Unternehmen sowohl die Geschäftslogik (Dimensionen, Measures) konsolidieren kann, als auch KPIs (Key Performance Indicators) und Daten, die eine „Version der Firmenwahrheit“ präsentieren. SQL Server 2005 Analysis Services geht dieses Problem an, indem es ermöglicht wird, dass ein einzelnes UDM – ausgehend von dem Benutzer, der es betrachtet – verschieden aussieht; diese verschiedenen Sichten werden Perspektiven genannt. Diese Perspektiven ermöglichen die Unterteilung eines UDM, basierend auf den Ansprüchen verschiedener Abteilungen des Unternehmens. Das verhindert die Notwendigkeit eines eigenen Marts für jede Abteilung und bedeutet somit Beseitigung überflüssiger Datenspeicherung, überflüssiger ETL-Prozesse und überflüssigen Synchronisationsaufwandes. Probleme der Datenintegrität und -vereinheitlichung werden beseitigt, da es nur eine physikalische Kopie des Cubes gibt. Nischen-Applikationen Viele Organisationen erstellen viele einzelne Anwendungen, um einer großen Bandbreite von Berichterstellungs- und Analyseansprüchen gerecht zu werden. Ein Unternehmen kann separate Lösungen für relationale Berichterstellung, Analyse, Scorecards, Dashboards usw. erstellen. Diese verteilten Anwendungen werden häufig aus verschiedenen Datenspeichern heraus betrieben; ein Werkzeug zur relationalen Berichterstellung arbeitet in der Regel mit einer normalisierten OLTP-Struktur, während eine Analyseanwendung typischerweise Daten aus einem OLAP-Cube bezieht, der aus einem Stern-Schema errichtet wurde. Separate Anwendungen, die eine Vielzahl von Datenspeichern verwenden, bedeuten eine Vielzahl potentieller Probleme. Die Datenintegrität ist schwieriger aufrecht zu erhalten, und es gibt nicht nur eine Version der Wahrheit. Satt dessen bieten OLTP- und OLAPSysteme zwei Versionen der Wahrheit, ungeachtet der Tatsache, dass OLTP-Systeme während eines ETL-Prozesses üblicherweise nicht bereinigt wurden. Separate Datenspeicher benötigen auch mehr Speicherplatz und tendieren dazu, Daten-Silos zu fördern, das Gegenteil des einen Speichers, nach dem in Warehousing-Lösungen gestrebt wird. Dazu kommt, dass Berichterstellungs- und Analyseanwendungen häufig als separate Anwendungen gesehen werden, die aus getrennten Datenspeichern gespeist werden und vollkommen unterschiedliche Ansprüche haben. Deshalb bieten viele Analyseanwendungen von Dritten keinerlei Unterstützung für relationale Berichterstellung und nur begrenzte Möglichkeiten für die Produktion jeglicher HardcopyAusgabe analytischer Daten. 5 Lösung: Das eine Modell des UDM Um die Wucherung von Nischenanwendungen anzugehen hat Microsoft einen dramatischen Wechsel in den herkömmlichen Weisheiten BI betreffend eingeleitet. In der Vergangenheit war die Trennung von OLTP und OLAP klar: Unternehmen extrahierten Daten aus einer oder mehreren OTLP-Datenquellen, transformierten die Daten in einen einheitlichen und konsolidierten Zustand, luden die Daten in eine SternSchema-Datenbank und errichteten dann Cubes auf Grund dieses Stern-Schemas. Dies bedeutete, dass Analytiker die Daten anhand von Hochleistungs-Cubes untersuchen konnten oder Berichte auf Grund relationaler Daten erstellen, aber die Datenstrukturen waren anders, die Werkzeuge zur Analyse und Berichterstellung waren anders, und sogar die Sprachen zur Abfrage der Daten waren erheblich andere. Jetzt sind diese Probleme, dank des UDM (Unified Dimensional Model), beseitigt. Das UDM verbindet die Anforderungen an die relationale Berichterstellung auf Grund von OLTP-Quellen mit den Anforderungen an Analysen von OLAP-Quellen in einem einzigen Berichterstellungsmodell. Durch die Verwendung des UDM greifen sowohl Analyse- als auch Berichterstellungsanwendungen auf die gleichen Datenspeicher zu. OLAP-Cubes werden ohne zeitliche Verzögerung errichtet und unterhalten und bieten kraftvolle Analysemöglichkeiten, kombiniert mit annähernden Echtzeit-Aktualisierungen der Cubes. Die Geschwindigkeit von Berichterstellungsanwendungen profitiert von der OLAPZwischenspeicherung, die von dem UDM vorgenommen wird. Da unterschiedliche Datenmodelle für OLTP und OLAP jetzt überflüssig sind, stellen sich eine Reihe von Vorteilen ein. Die Bemühungen um Datenintegrität können auf eine einzige Stelle gerichtet werden, anstatt auf viele Datenspeicher. Daten werden nicht länger in einer Reihe von Daten-Silos gespeichert sondern an einem zentralen Ort, der sowohl für relationale, als auch OLAP-Berichterstellung verwendet wird. Die Notwendigkeit von Nischenanwendungen und separaten Datenspeichern wird verringert, da es Werkzeugen ermöglicht wird, auf einen gemeinsamen Datenspeicher zuzugreifen und die Daten entweder relational, oder im Cube-Format zu betrachten. Eine weitere Bereicherung des UDM und aller Berichterstellungs- und Analyseanwendungen stellt die Fähigkeit dar, KPIs durch das KPI-Framework zu erstellen. Dies erlaubt es Unternehmen, die Schlüssel-Metriken ihres Geschäfts zu definieren, sodass diese Definitionen an einem einzigen Ort erstellt und gespeichert werden, und alle Anwendungen auf diese eine Version der Wahrheit zugreifen können. KPIs können durch die Verwendung einfacher, aber aussagkräftiger Grafiken wie Ampeln oder Trendmaßstäbe angezeigt werden. So können Entscheidungsträger auf einen Blick den Zustand der Schlüsselfaktoren ihres Geschäfts erfassen. 6 Abbildung 1: Gemischte Berichte Problem 3: Eine intelligente Geschäftssicht der Daten Eines der leistungsstärksten Features analytischer Anwendungen ist die Möglichkeit, einen Drilldown auszuführen. Dies ermöglicht den Benutzern den iterativen Prozess der Datenuntersuchung, des Aufstellens einer Hypothese und des anschließenden weiteren Untersuchens der Daten. Indem es allen Benutzern ermöglicht wird, einen Drilldown durchzuführen, haben Organisationen allen Benutzern die Daten eröffnet, damit sie ihre eigenen Fragen danach, was den von ihnen betrachteten Daten zu Grunde liegt, beantworten können. Auf diese Art müssen sich die Benutzer nicht mehr an die technischen Mitarbeiter wenden, und ständig nach Berichten mit ausführlicheren DetailEbenen fragen, sondern können ihre eigenen Analysen ausführen. Obwohl der Drilldown ein leistungsstarkes Konzept ist, werden dadurch doch nicht alle Fragen beantwortet. Einige Anwendungen ermöglichen alternative Analysen, aber sie werden durch die Möglichkeiten des zu Grunde liegenden Datenbankmoduls beschränkt. Diese Beschränkungen erschweren einige Arten der Analyse. Benutzer müssen, neben einem Drilldown, vor allem in der Lage sein, von einer Dimension zur anderen navigieren zu können. Wenn ein Analytiker beispielsweise eine Produkt-Dimension betrachtet, muss er möglicherweise die Kunden, die diese Produkte 7 bestellt haben, sehen können, oder die Zulieferer, von denen das Produkt erworben wurde. Analytiker müssen beispielsweise Werte vergleichen, wie etwa Bestelldaten mit Auslieferungsdaten, anstatt sich auf einzelne Werte zu beschränken. Unternehmen müssen eventuell komplexere Beziehungen als einfache Hierarchien definieren, wie beispielsweise einen Autoren, der mehr als ein Buch schreibt, und ein Buch von mehr als einem Autoren verfasst wird. Data Warehousing-Module können Schwierigkeiten damit haben, so komplexe Szenarien zu modellieren, was es nahezu unmöglich macht, mittels solcher Strukturen Analysen auszuführen oder Berichte zu erstellen. Lösung: Fortgeschrittenes dimensionales Modellieren SQL Server 2005 Analysis Services geht diese Probleme durch eine Reihe von neuen Features an, die einen Reichtum neuer Analysemöglichkeiten eröffnen. Eines dieser Features sind die attributbasierten Dimensionen. Heutige OLAP-Produkte tendieren dazu, für Dimensionen sehr strenge hierarchische Strukturen zu erzwingen. Das bedeutet, dass sich Wirtschaftsanalytiker von Produktgruppe zu Produktfamilie bis zur Identifikationsnummer herunterarbeiten. Allerdings gibt es häufig zusätzliche Attribute der Dimension, wie Größe, Farbe, Gewicht usw. Diese zusätzlichen Attribute werden häufig an eine bestimmte Identifikationsnummer gebunden, aber es stellt sich als schwierig heraus, einen Drilldown zu Farbe als ein Dimensionslevel auszuführen. Attributbasierte Dimensionen umgehen dieses Problem, indem sie Dimensionen auf Attribute als eine strenge Hierarchie konzentrieren. Alle Attribute können für DrilldownVorgänge verwendet und gefiltert werden, was das Erstellen jeder Kombination von Hierarchien ohne Zeitverzögerung ermöglicht. SQL Server 2005 Analysis Services führt auch das Konzept der m:n-Beziehungen ein. Traditionelle Data Warehousing-Lösungen ermöglichen nur die Knüpfung eines Fakts an nur ein einzelnes Dimensionselement, was bedeutet, dass ein bestimmter Faktendatensatz in der Produkt-Dimension nur an ein einziges Produkt geknüpft werden kann. In der wirklichen Welt aber sind die Zustände nicht immer so eindeutig. Eine Gesellschaft kann über Kunden verfügen und über Bankkonten, in denen ein Kunde verschiedene Konten hat (Girokonto, Sparkonto, Tagesgeldkonto usw.), und jedes Konto kann verschiedenen Kunden gehören (das Sparkonto von Max und Sabine Mustermann). SQL Server 2005 unterstützt diese komplexe Beziehung, in der ein einzelner Datensatz auf vielen Dimensionsdatensätzen abgebildet werden kann, was komplexere und wirkungsvollere Analyse mit leichterem Modellieren der Daten ermöglicht. Viele Data Warehouse-Module machen es nötig, dass pro auszuführender Analyse-Art Cubes mit einer Dimension erstellt werden. Eine Firma kann zum Beispiel Bestellungen anhand des Bestelldatums oder des Auslieferungsdatums analysieren wollen. Anstatt zwei separate Dimensionen zu erstellen ermöglicht es SQL Server 2005 Analysis Services dem Warehouse-Entwickler, eine einzelne Zeit-Dimension zu entwerfen und die selbe Dimension dann sowohl als generische Zeitdimension, als auch als Bestellungsdatums- oder Auslieferungsdimension zu verwenden. Die Möglichkeit, dass eine Dimension verschiedene Rollen haben kann, bezeichnet man als Dimensionen mit unterschiedlichen Rollen, und diese Dimensionen helfen, Festplattenspeicher zu reduzieren und Verarbeitungszeit zu reduzieren, da sie Daten nur einmal speichern, es aber ermöglichen, dass die Dimension den Analytikern und anderen Benutzern als viele verschiedene Dimensionen angezeigt werden kann. 8 Manchmal werden Daten in einer Faktentabelle gespeichert, die in keiner Dimensionstabelle enthalten ist. SQL Server 2005 Analysis Services ermöglicht es, diese Daten herauszuziehen und eine 1:1-Dimension zu der Faktentabelle zu erstellen, die üblicherweise als degenerierte Dimension bezeichnet wird und in SQL Server 2005 Analysis Services Faktendimension heißt. Das bedeutet, dass es einfach gemacht wird, eine Dimension zu haben, die nur verwendet wird, um einen bestimmten Faktendatensatz zu betrachten oder alle Werte zu identifizieren, die eine aggregierte Zelle ergeben. Problem 4: Die Analyse lokalisieren Einer der Hauptvorteile von Data Warehouses besteht darin, dass sie Daten in einem einheitlichen Zustand konsolidieren. Die Verkäufe in verschiedenen Ländern werden beispielsweise in der betreffenden örtlichen Währung erfasst. Allerdings macht es keinen Sinn, Britische Pfund und Japanische Yen zu addieren; stattdessen verfügt der BIAssistent über ein Feature, das es ermöglicht, dass Regeln zur Währungsumrechnung direkt im UDM definiert werden. Auf ähnliche Weise können Zeichenketten von einer Sprache in die andere übertragen werden, Maßeinheiten von Englisch in metrisch und so weiter. Die Vorteile einer Umwandlung der Daten in ein einheitliches Format sind offensichtlich: Die Vergleiche zwischen verschiedenen Ländern sind nicht gültig, solange die Daten nicht in ein einheitliches lokales Format gebracht wurden. Dies ermöglicht die Analyse von Daten innerhalb des Unternehmens, ungeachtet des Landes ihrer Herkunft. Der Nachteil besteht darin, dass den Analytikern in der Tokioter Niederlassung im Fall einer Konsolidierung der Daten zu US Dollar nun ein englischsprachiges Warehouse angezeigt wird, das schwierig zu verwenden sein kann. Das Unternehmen kann entscheiden, ob viele Kopien des Warehouses erstellt werden sollen und für jede Niederlassung lokalisiert, oder ob ein einzelnes Warehouse in einer einzigen Sprache ausreichend ist. Lösung: Eingebaute Daten- und Metadatenübersetzungen und Währungsumrechnungen Unternehmen haben nun, Dank SQL Server 2005 Analysis Services, eine zusätzliche Wahl, die darin besteht, das Warehouse in einer einzelnen Sprache zu erstellen, den Benutzern aber lokalisierte Versionen der Daten anzuzeigen. Das bedeutet: Ein einziges konsolidiertes Warehouse mit für den US-Markt formatierten Daten kann Analytikern und Informationsarbeitern in anderen Ländern in ihrer lokalen Währung, sowie numerischenund Textformaten angezeigt werden. Diese Herangehensweise hat zwei primäre Vorteile. Erstens beseitigt sie die Notwendigkeit, eine Anzahl von lokalisierten Warehouses zu erstellen und reduziert Speicheraufwand und Erstellungszeit. Zweitens ermöglich sie es Organisationen, Analysen auf das gesamte Unternehmen auszuweiten, da jedes Land nun seine lokalisierte Analyse bekommt. Die Möglichkeit, lokalisierte Sichten eines bestimmten Cubes bereitzustellen, stammt von einem neuen Feature in SQL Server 2005 Analysis Services, den Übersetzungen. Übersetzungen ermöglichen die unmittelbare Übersetzung von sowohl Metadaten, als 9 auch Daten in das lokale Format, was den Benutzern eine lokalisierte Erfahrung mit einem Minimum an Aufwand ermöglicht, im Gegensatz zum Erstellen separater physikalischer Cubes für jeden Standort. Abbildung 2 Mehrfachübersetzung Problem 5: Echtzeit-BI Typische BI-Lösungen teilen sich eine Menge gemeinsamer Attribute: Die Daten sind konsolidiert, einheitlich, schreibgeschützt und historisch. „Historisch“ meint nicht nur, dass die Daten sich auf einen zurückliegenden Zeitpunkt beziehen, sondern auch, dass sie nicht vollständig aktuell sind. Entscheidungsträger in Unternehmen treffen selbst mit einem Warehouse, das jede Nacht aktualisiert wird, Entscheidungen, die auf Informationen des Vortages beruhen. In Situationen, die von schnell wechselnden Märkten und Bedingungen geprägt sind, können die Informationen von gestern eventuell nicht gut genug sein. Echtzeit-BI-Lösungen oder Lösungen nahe der Echtzeit, gibt es seit einiger Zeit, doch diese Lösungen haben typische Probleme. Diese Lösungen haben häufiger Probleme mit der Leistung, da sie nicht in der Lage sind, Analysedaten im optimalen Format zu speichern. Zusätzlich haben diese Lösungen eine negative Auswirkung auf die Leistung des OLTP-Systems, von dem sie Daten beziehen, da sie permanent auf diese Systeme zugreifen, um die neuesten Daten zu erhalten. 10 Lösung: Richtige Information, richtiges Format, richtige Zeit Microsoft SQL Server 2005 Analysis Services bietet Unternehmen die Möglichkeit, annähernde Echtzeit-BI zu praktizieren, Analysen auszuführen, ohne auf tägliche oder wöchentliche Aktualisierungen warten zu müssen. Zusätzlich ermöglicht die Struktur der Lösung die Ausführung der Analyse, welche die Leistung der BI-Lösung nicht beeinträchtigt. Zu guter Letzt: die Leistung des OLTP-Systems erfährt trotz der in annähernd Echtzeit arbeitenden BI-Lösung eine geringe bis gar keine Beeinträchtigung. SQL Server 2005 Analysis Services erreicht diese Funktionalität nahe der Echtzeit durch ein neues Feature, das proaktives Zwischenspeichern genannt wird. Durch proaktives Zwischenspeichern können Cubeersteller bestimmen, wie und wann der Cube aktualisiert wird. So kann beispielsweise Echtzeitanalyse ermöglicht werden; durch eine Einstellung des Zwischenspeichers wird beim Auftreten einer neuen Transaktion in der relationalen Datenbank eine Benachrichtigung an das UDM gesendet. Dies löst im Hintergrund eine Aktualisierung des Cubes aus, um den Cube weiterhin mit der zu Grunde liegenden Datenquelle zu synchronisieren. Alternativ kann der Cube so eingestellt werden, dass er auf einer zeitlichen Basis aktualisiert wird, wie etwa jede halbe Stunde. Ein großer Nutzen dieser Vorgehensweise besteht darin, dass Unternehmen Analysen in Echtzeit, oder nahe der Echtzeit, ermöglicht werden, unter Beibehaltung eines vollständig verarbeiteten Data Warehouse-Cubes. Administratoren können das Zwischenspeichern konfigurieren, um die Wartezeit und Aktualisierungsfrequenz zu kontrollieren. Proaktives Zwischenspeichern ermöglicht Abfragen gegen einen Cube, nicht nur, bevor er bestückt wurde, sondern auch während und nach einer Aktualisierung. Wenn eine Abfrage eintrifft, bevor die Aktualisierung abgeschlossen wurde, wird Analysis Services 2005 von einem MOLAP- in einen ROLAP-Modus wechseln, um die Abfrage zu beantworten. Microsoft hat Echtzeit-BI etabliert, unter Beibehaltung der Leistung, die früher voll verarbeiteten, historischen Data Warehouse-Cubes vorbehalten war. Zusammenfassung Viele Probleme haben BI-Implementationen seit Jahren geplagt. Beispielsweise befinden sich viele Unternehmensdaten in einer Reihe von Silos, sei es in CRM, SCM, ERP oder einer anderen Anwendung mit ihrem eigenen Schema und Datenformat. Das UDM ermöglicht Unternehmen komplexe Analysen und Berichterstellungen anhand großer Datenmengen, sogar zwischen heterogenen Datenquellen. BI-Lösungen stellen häufig historische Snapshots dar, die zum Zeitpunkt einer getätigten Analyse veraltet sind. Manche BI-Produkte unterstützen Analysen nahe der Echtzeit, kranken aber an schlechter Leistung und signifikanter Verzögerung. Viele BI-Lösungen kranken auch daran, weit verstreute Data Marts in einem konsistenten Data Warehouse zu konsolidieren. Andere BI-Lösungen leiden an einem Mangel an Flexibilität, wenn es darum geht, hierarchische Strukturen zu analysieren oder komplexe Beziehungen zwischen verschiedenen Dimensionen zu modellieren. Abschließend: Warehousing Produkte arbeiten unzureichend, wenn es darum geht, Daten in lokalisierten Sprachen und numerischen Formaten auszuliefern, während zeitgleich das Konzept der Berichterstattung vom Konzept der Analyse getrennt wird. 11 Dies bedeutet häufig vielzählige Datenspeicher in verschiedenen Formaten, die alle für verschiedene Zwecke verwendet werden. SQL Server 2005 Analysis Services geht diese Belange mit eingebauten Lösungen für diese beharrliche Data Warehousing-Probleme an. Data Warehouses können direkt auf relationalen Schemas errichtet werden, die in CRM, SCM und anderen Datensilos gefunden werden können, ohne dass zuerst ein Stern-Schema erstellt werden muss und mit kleinen bis gar keinen Auswirkungen auf die Produktions-Anwendungen. Analysis Services führt eine Technologie ein, um OLAP-Cubes in nahezu Echtzeit aktualisieren zu können, mit minimalen Auswirkungen auf die Quelldatenbank, während zeitgleich die relationale Berichterstellung auf Grund der selben Quelle beschleunigt wird. Analysis Services ermöglicht es auch, dass ein einzelnes Warehouse erstellt wird und dann den Abteilungen und Benutzern innerhalb der Organisation als eine Reihe von separaten Data Marts dargestellt wird. Dies ermöglicht es jeder Abteilung, weiterhin ihre Datenteilmengen zu analysieren, ohne eine Reihe von Marts erstellen und verteilen zu müssen. Weiterhin kann dieses eine Warehouse in einem lokalisierten Format präsentiert werden, ohne die Notwendigkeit einzelne lokalisierte Versionen erstellen zu müssen. Abschließend verbindet das Microsoft UDM die Nutzen von OLTP und OLAPDatenspeichern in einem Modell. OLAP-Cubes werden unmittelbar erstellt und in nahezu Echtzeit aktualisiert. Es ist kein separates Stern-Schema erforderlich. Berichterstellungsanwendungen profitieren vom zum Unterhalt der Cubes verwendeten Zwischenspeichern, das schnellere Berichterstellung auf Grund OLTP-Datenbank ermöglicht. Microsoft hat anhaltenden Einsatz demonstriert, um Organisationen jeder Größe unglaublich leistungsstarke BI- und Analysefeatures zu bringen. Durch die Verwendung dieser Features können Unternehmen leistungsfähigere, flexiblere und kosteneffektivere BI-Lösungen entwerfen, die von einer größeren Zahl von Benutzern und Werkzeugen als jemals zuvor verwendet werden können. Craig Utley ist der Vize-Präsident für Entwicklung von KiZAN Technologies LLC, wo er ein Team leitet, das sich auf Business Intelligence-Lösungen und den Entwurf und die Entwicklung von Unternehmens-Anwendungen konzentriert. Seit ihrer Einführung arbeitet er mit Microsoft Business Intelligence-Produkten und erarbeitete BI- und Data Warehousing-Lösungen für Unternehmen in den ganzen USA. Er ist Autor, Sprecher auf Konferenzen und ein ausgewähltes MVP. Dieses Dokument wurde in Zusammenarbeit mit A23 Consulting entworfen. 12