Microsoft® SQL Server™ 2005: Datenintegrationslösungen für Stammdatenverwaltung Autoren: Elizabeth Vitt Intellimentum Hitachi Consulting Mitwirkende: Donald Farmer Microsoft Corporation Stacia Misner Hitachi Consulting Januar 2006 Zusammenfassung: In diesem wird beschrieben, wie Anwendungsentwickler die Funktionalität von Microsoft® SQL Server™ 2005 Integration Services einsetzen können, um Probleme der Datenintegration von Anwendungen für Stammdatenverwaltung anzugehen. Inhalt: Einführung 2 Überblick der SSIS-Lösung 2 Anforderungen der MDM-Datenintegration 2 SSIS-Datenintegration für MDM 3 Auf verschiedene Datenquellen zugreifen 4 Lösung 4 Eindeutige Bezeichner verwalten 5 Lösung 5 SSIS-Beispiel 6 Bereinigungs-Attribute 8 Lösung 9 SSIS-Beispiel 9 Einheiten-Aktivitäten kategorisieren 11 Lösung 12 SSIS-Beispiel 12 Attribute Extrahieren 13 Lösung 14 SSIS-Beispiel 15 Schlussfolgerung 16 Die Autoren 17 Elizabeth Vitt, Intellimentum 17 Hitachi Consulting 17 Einführung Datenverwaltung ist eine der komplexesten und teuersten Herausforderungen, mit denen sich das bewegliche Unternehmen konfrontiert sieht. Frustriert von der Schwierigkeit und Ungenauigkeit des manuellen Zusammensetzens uneinheitlicher, redundanter und veralteter Daten suchen viele Unternehmen eine neue Generation von Datenverwaltungs-Lösungen, um nahtlos Hunderte von Datenquellen in wirkungsvolle Daten zu konvertieren, die vom gesamten Unternehmen gemeinsam verwendet werden können. Um ihren Bemühungen um Datenverwaltung eine Richtung zu geben, übernehmen viele Unternehmen Stammdatenverwaltung – auch MDM (Master Data Management) - , eine umfassende Strategie, um ausgedehntes Datenkapital zu erstellen, zu organisieren und zu verwalten, und das für das gesamte Unternehmen. Stammdatenverwaltungs-Lösungen erstellen ein Hauptsystem von Datensätzen für eine bestimmte Unternehmenseinheit und veröffentlichen anschließend diese Stammdatensicht an eine Auswahl von Consumeranwendungen. Stammdatenverwaltungs-Lösungen können virtuell um jede Dateneinheit gebildet werden – Kunden, Partner, Produkte, Anbieter, Angestellte, etc. – wo auch immer eine Stammdatensicht benötigt wird. Viele Stammdatenverwaltungs-Lösungen haben eindeutigen Namen, um ihren Wirkungsbereich zu beschreiben. Beispielweise wird PIM (Product Information Management) verwendet, um Produktfokussierte Stammdatenverwaltungs-Lösungen zu beschreiben, und CDI (Customer Data integration) wird verwendet, um Kunden-fokussierte Anwendungen zu beschreiben. Da StammdatenverwaltungsLösungen eine große Spanne von geschäftlichen und technischen Funktionen umfassen, erfordert das Erstellen einer Stammdatenverwaltungs-Lösung eine multidisziplinäre Herangehensweise an die Datenverwaltung, die Datenintegration, Datenmodellierung, Datenveröffentlichung und Datensynchronisierung einschließt. Von all diesen Komponenten ist Datenintegration immer noch der kritischste und aufwändigste Aspekt einer Stammdatenverwaltungs-Lösung. Stammdatensichten werden durch die Integration von Daten aus verschiedenen internen Quellen wie ERP (Enterprise Resource Planning), CRM (Customer Relationship Management), BI (Business Intelligence) und veralteten Systemen erstellt, sowie integrierten externen Daten von Partnern oder Lieferanten. Die Probleme, die solche Integrationsprozesse häufig mit sich bringen, können in hohen Entwicklungskosten und verlängerten Zeitmargen der Projekte resultieren. Um diese Probleme kosteneffektiv zu lösen, benötigt die ITAbteilung eine flexible Datenintegrations-Architektur, die einen breitgefächerten Satz von Technologien und Werkzeugen liefert, um benutzerdefinierte Integrationslösungen zu erstellen. Microsoft SQL Server Integration Services (SSIS) 2005 bietet eine voll ausgestattete Datenintegrations-Plattform für Unternehmen und eine reichhaltige Entwicklungsumgebung, um unternehmensweit umfassendes Datenkapital zu erstellen, es zu organisieren und zu verwalten, das spezifisch für Stammdatenverwaltungslösungen eingesetzt werden kann. SSIS verfügt auch über ein ausgedehntes System von Partnern, die spezialisierte Stammdatenverwaltungs (MDM)-Lösungen im Herzen der SQL Server-Plattform erstellt haben. Mit der Verwendung von SSIS 2005 kann ein Unternehmen erfolgreich eine große Spannbreite von Datenintegrations-Lösungen erstellen, die Hauptgeschäftssichten unterstützen, schnell Probleme der Datenverwaltung bewältigen und die Gesamtkosten der Stammdatenverwaltung reduzieren. Überblick der SSIS-Lösung Anforderungen der MDM-Datenintegration Obwohl jede MDM-Lösung bei der Datenintegration wahrscheinlich andere geschäftliche und technische Anforderungen hat, werden Sie doch auf drei generelle Datenkategorien stoßen: Eindeutige Bezeichner, Attribute und Transaktionen. Jede dieser drei Datenkategorien hat ihre eigenen, besonderen Probleme bei der Datenintegration, die Sie beim Erstellen Ihrer MDM-Lösung bewältigen müssen. Eindeutige Bezeichner – Eindeutige Bezeichner bilden die Grundbausteine beim Definieren eines Stammsystems von Datensätzen für eine Geschäftseinheit. Wenn Sie Daten aus vielen Datenquellen zusammenbringen, müssen Sie einen einheitlichen Mechanismus haben, um eine Einheit eindeutig innerhalb verschiedener Geschäftsfunktionen zu identifizieren. Unglücklicherweise gibt es nicht immer einen gemeinsamen eindeutigen Bezeichner, der eine bestimmte Einheit immer in der gleichen Art innerhalb der gesamten Quellsysteme identifiziert. Sie können beispielsweise beim Erstellen einer Angestellten-MDM-Anwendung feststellen, dass das HR-System Ihrer Organisation, das Vertriebssystem, das Verkaufsvorhersagensystem, Active Directory und CRM-System alle verschiedene eindeutige Bezeichner für Außendienstmitarbeiter verwenden. Um die MDM-Lösung zu erstellen, müssen Sie eine andere Methode etablieren, um die Daten erfolgreich zu kombinieren, ohne sie zu duplizieren. Das Duplizieren von Daten mag sich nach etwas anhören, das leicht zu vermeiden ist; tatsächlich werden Sie aber feststellen, dass manche Typen duplizierter Daten schwerer zu entdecken sind, als andere. Attribute- Wenn Sie den eindeutigen Bezeichner für eine Einheit festgelegt haben, können Sie der Einheit Attribute hinzufügen, die einen aussagekräftigen Geschäftskontext darstellen, die Geschäftseinheit in eine oder mehrere Gruppen unterteilen und Beziehung der Einheit zu anderen Einheiten beschreiben. Diese Attribute können direkt aus den Quellsystemen stammen. Sie können beispielsweise Attribute für Angestelltenprofile von Ihrem HR-System mit E-MailAdressen von Angestellten aus dem Active Directory Ihres Unternehmens zusammenbringen. Es können aber auch Attribute abgeleitet werden, nachdem die Daten kombiniert wurden. Wenn Sie Attribute kombinieren, müssen Sie Konflikte zwischen Attributen aus verschiedenen Systemen bewältigen. Sie können beispielsweise über Informationen zu Angestellten-Adressen verfügen, die innerhalb der verschiedenen Quellsysteme variieren. Um dieses Problem zu beheben, müssen Sie Geschäftsregeln definieren, die bestimmen, welche Adresse den besten Datensatz für jeden Angestellten liefert. Transaktionen –Transaktionen beschreiben die Aktivitäten, in die eine bestimmte Geschäftseinheit involviert ist. Beispielsweise kann ein Außendienstmitarbeiter in Absatzchancen, Verkaufstransaktionen und Verkaufsvorhersagen involviert sein. Innerhalb von MDMAnwendungen benötigen Transaktionsdaten wiederholt ein gewisses Maß an Aggregation, um die Quelldetails in einem aussagekräftigen Format zu vereinen. Nach der Aggregation können Transaktionsdaten dazu verwendet werden, Attribute abzuleiten, die eine Einheit basierend auf ihrer Tätigkeit oder der Abwesenheit von Tätigkeit zu charakterisieren SSIS-Datenintegration für MDM SQL Server 2005 Integration Services (SSIS), der Nachfolger von SQL Server 2000 Data Transformation Services, ist eine Datenintegrations-Plattform für eine neue Generation von Lösungen, die schnell große Datenmengen aus verschiedenen Datenquellen mit komplexen Transformationen und mit Bereinigung integrieren müssen. Hinter den Kulissen enthält die hoch leistungsfähige Architektur von SSIS zwei wirkungsvolle Module: Paralleles Laufzeitmodul – Das Laufzeitmodul koordiniert die Ablaufsteuerung zwischen Tasks in SSIS. Schnelles, effizientes Datenflussmodul– Das Datenflussmodul extrahiert Daten aus einer oder mehreren Datenquellen, führt jede nötige Transformation an den Daten aus, und liefert die Daten dann an ein Ziel oder mehrere Ziele. Um die Effizienz zu maximieren, profitiert das Datenflussmodul von Verarbeitung im Arbeitspeicher, um die Mehrlast, die normalerweise durch das physikalische Kopieren und Stagen der Daten in Tabellen an verschiedenen Punkten des Integrationsprozesses entsteht, zu eliminieren. Durch die Bearbeitung der Daten im Arbeitspeicher, während sie von Quelle zu Ziel gebracht werden, reduziert das Datenflussmodul die für das Daten- Staging benötigten manuellen Schritte, spart Verarbeitungszeit und hilft Ihnen, Integrationsprobleme in kürzeren Datenverarbeitungsfenstern zu lösen. Um eine große Bandbreite von Datenansprüchen für MDM-Lösungen zu unterstützen, bietet SSIS die folgenden Möglichkeiten der Datenintegration: Breite Möglichkeiten zur Datenverbindung – SSIS bietet für die Integration verschiedener Daten Zugriff auf eine Vielzahl von Datensystemen, Strukturen und Formaten, die einen eindeutigen Bezeichner zur Verfügung stellen, sowie Attribute und Transaktionen für MDMAnwendungen. Stabile Datenbereinigung – Um sicherzugehen, das Daten in einer aussagekräftigen Art kombiniert werden, bietet SSIS Werkzeuge zur Datenbereinigung, die eingesetzt werden können, um häufige MDM-Datenintegrationsprobleme wie das Ableiten eindeutiger Bezeichner und das Behandeln von Attribut-Konflikten anzugehen. Flexible Datentransformationen – Um die Datenbereinigung zu unterstützen, bietet SSIS eine Vielzahl von Datentransformationen, die verwendet werden können, um aussagekräftige Attribute von Quelldaten abzuleiten und Transaktionsdaten zu aggregieren. Die folgenden Abschnitte beschreiben, wie Sie die Fähigkeiten von SSIS zur Datenintegration nutzen können, um häufige Probleme von MDM-Anwendungen zu lösen. Auf verschiedene Datenquellen zugreifen Für viele Unternehmen bringt das Zusammenfügen von Stammdaten aus CRM, ERP und BISystemen das Vereinheitlichen von Daten aus Dutzenden, vielleicht sogar Hunderten von verschiedenen Datenquellen mit sich. In einem CDI-Szenario beispielsweise müssen Sie die folgenden Daten zusammen bringen: CRM-Daten aus einem RDBMS (relational database management system), Verkaufsdaten aus Mainframe-Datenextrakten, Kundenaufteilungsdaten aus Excel und demographische Daten von Dritten über Webdienste. Das Sammeln von Kundendaten aus diesen verschiedenen Quellen erfordert eine Integrations-Lösung, die erfolgreich auf Daten zugreifen kann und ihre verschiedenen Schnittstellen, Strukturen und Datentypen interpretieren kann. Lösung SSIS ermöglicht den Zugriff auf eine Vielzahl verschiedener Datenquellen, einschließlich Datenbanken, Flatfiles, Arbeitsblätter, gepackten Anwendungen und XML-Daten, unter Einbeziehung von OLE DB-, ODBC-, und .NET-Providern, geliefert von Microsoft und Drittanbietern. SSIS kann auch XML-Daten unter Verwendung einer XSD (XML Schema Definition)-Datei für inlineSchemas interpretieren und übersetzen. Zusätzlich kann SSIS unter Verwendung von Proxy-Klassen und der Webdienst-Unterstützung des .NET-Framework Daten aus Webdiensten konsumieren. Mit dieser eingebauten Unterstützung für XML und Webdienste kann SSIS effektiv an der SOA (Service Oriented Architecture) eines Unternehmens teilnehmen, um lose verbundene DatenintegrationsLösungen zu erstellen. Um Verbindung zu Quellen und Zielen aufzunehmen, für die ein Provider nicht erreichbar ist, kann die Verbindungsfähigkeit von SSIS durch das Erstellen von benutzerdefinierten Datenquellen mit skripterstellten Quellkomponenten oder wiederverwendbaren Adaptern auf einfache Art erweitert werden. Sie können die SSIS-Funktionalität für Datenzugriff auch unterstützen, indem Sie die Verbindungsfähigkeit anderer Microsoft Datenintegrations-Technologien einsetzen, wie etwa die von Host Integration Server für die Mainframe-Verbindungsfähigkeit oder Microsoft BizTalk Server für B2B-Datenaustausch. Ein einzigartiges und wertvolles Feature zur Verbindungsfähigkeit von SSIS ist die flexible Definition eines Datenziels. Ein Ziel kann ein Datenspeicher oder eine Datenbank sein, aber es kann auch ein ADO .NET-DataReader sein, der auf Befehl an Downstream-Anwendungen gegeben werden kann, ohne die Notwendigkeit eines Verbleibens der Daten in einem Datenspeicher. In den folgenden Abschnitten werden Sie einige Beispiele dafür finden, wie SSIS Verbindung zu einer Reihe von Quellen herstellt, um Daten für MDM-Lösungen zusammenzubringen. Eindeutige Bezeichner verwalten Während Daten-Verbindungsfähigkeit den Mechanismus bietet, um Zugriff auf Stammdaten in verschiedenen Quellsystemen zu erhalten, stellt die Datenbereinigung sicher, dass die Stammdaten erfolgreich integriert werden, mit einem hohen Grad an Datenqualität und Einheitlichkeit. Um die Ansprüche von MDM an Datenbereinigung zu unterstützen, bietet SSIS stabile Funktionalität um Ihnen dabei zu helfen, eindeutige Bezeichner innerhalb der Datenquellen zu verwalten. Wenn Sie eine MDM-Lösung erstellen, die Daten aus vielen Datenquellen kombiniert, können Sie Schwierigkeiten dabei bekommen, die Daten zu vereinigen, wenn es keinen gemeinsamen eindeutigen Bezeichner gibt, der von den Systemen gemeinsam verwendet wird. Diese Situation tritt für gewöhnlich auf, wenn jedes Quellsystem seine eigene Art hat, eine Geschäftseinheit zu repräsentieren und sie zu identifizieren. Nehmen Sie das folgende Beispiel. Das CRM-System Ihrer Organisation, das Vertriebssystem, das Kunden-Selbstbedienungs-System und das Call Center-System verwenden alle unterschiedliche Bezeichner, um Kunden eindeutig zu identifizieren. In Ermangelung eines gemeinsamen eindeutigen Bezeichners müssen Sie daran denken, eine andere Methode zu verwenden, um Datensätze zwischen den Systemen zu verbinden. In diesem bestimmten Szenario enthält jedes System eine Instanz des Vor- und Nachnamens des Kunden. Auf den ersten Blick könnte man meinen, dass die Kombination von Vor- und Nachnamen den perfekten eindeutigen Bezeichner darstellt; allerdings stellen Sie bei näherer Untersuchung fest, das nur 20% der Daten exakt mit dem Vor- oder Nachnamen übereinstimmen. Während nur ein geringer Prozentsatz der Datensätze übereinstimmt, kann es noch doppelt geführte Kunden geben, deren Namen entweder falsch geschrieben wurden nur geringfügig verschieden sind, abhängig davon, wie der Name in jedes Quellsystem eingegeben wurde. Beispielsweise kann eine Kundin im CRM-Verkaufs-System als Terry Ramos identifiziert werden; im Verkaufs-System aber ist sie als Theresa G. Ramos identifiziert. Obwohl es Terry Ramos nicht genau mit Theresa G. Ramos übereinstimmt, beziehen sich die verschiedenen Repräsentationen auf die selbe Person. Obwohl Sie manche dieser unpräzisen Duplikate unter Verwendung manueller Methoden identifizieren können, brauchen Sie doch eher eine systematischere und stabilere Lösung, die auf einen gesamten Datensatz angewendet werden kann, um eindeutige und doppelte Datensätze zu identifizieren. Lösung Für diese Lösung bietet SSIS Datenbereinigungs-Funktionen, die Sie kombinieren können, um eindeutige Bezeichner in einer Vielzahl von Szenarien zu verwalten. In einem idealen Szenario wird ein stabiler eindeutiger Bezeichner von vielen Datenquellen gemeinsam verwendet. In diesem Fall können Sie einen SSIS-Datenfluss erstellen, um Daten zusammenzubringen, unter Verwendung von Gleichheitsverknüpfungen oder Suchen für Gleichheitsverknüpfungen. In komplexeren Szenarien, die keine Gleichheitsverknüpfungen zulassen, können Sie Fuzzy-Logik einsetzen, um die bestmögliche Datenübereinstimmung zu identifizieren. Fuzzy-Logik ermöglicht die Ausführung eines Mechanismus, um unpräzise Datenübereinstimmungen anzugleichen. In SSIS gibt es zwei Transformationen, die Fuzzy-Logik verwenden: Fuzzysuchen und Fuzzygruppierung. Fuzzysuchen – Fuzzysuchen sind eine großartige Einrichtung, um schmutzigen Quelldaten an einen bekannten Satz von bereinigten, standardisierten Daten, wie eine Referenz-Tabelle etwa, anzugleichen. Wenn SSIS die Fuzzysuche ausführt, zeigen Ähnlichkeits- und VertraulichkeitsIndexe die Qualität der Datenübereinstimmung an. Die Schwellenwerte für Ähnlichkeit zeigen an, wie genau die Eingabedaten der vorgegebenen Übereinstimmung ähneln. Ein Ähnlichkeitswert von eins zeigt eine identische Übereinstimmung an. Je näher der Wert an eins, desto größer die Übereinstimmung. Zur Unterstützung des Schwellenwertes beschreibt die Verlässlichkeit die Ebene der Gewissheit, dass SSIS die Übereinstimmung gefunden hat. Wenn beispielsweise drei verschiedene Menschen den gleichen Namen haben, wird SSIS einen Verlässlichkeitsindex verwenden, um seine Sicherheit anzuzeigen, dass es die richtige Person für die Übereinstimmung gefunden hat. Fuzzygruppierung – Wenn keine standardisierten Referenzdaten zur Verfügung stehen, entwickelt Fuzzygruppierung einen Stammdatensatz von eindeutigen Daten, der eine Kombination von eindeutigen und duplizierten Daten enthält. Wenn Sie mit der Entwicklung einer MDM-Anwendung beginnen, ist das Erstellen eines Stammdatensatzes häufig ihre erste Herausforderung in der Datenintegration. Um dieses Datensatz-System zu entwerfen, untersucht Fuzzygruppierung Quelldaten und leitet einen Referenzsatz eindeutiger, kanonischer Datensätze ab. Alle Daten in dem Datensatz werden mit diesen abgeleiteten Referenzdatensatz auf potentielle Übereinstimmungen hin verglichen. Fuzzygruppierung erstellt auch zwei zusätzliche Felder, key_in und key_out, um Ihnen bei der Bestimmung eindeutiger und duplizierter Datensätze zuhelfen. Die key_in-Spalte speichert eine SSIS-generierte, einzigartige ID für jeden Datensatz im Eingabedatensatz. Wenn die Transformation für Fuzzygruppierung Übereinstimmungen sucht, speichert die key_out-Spalte die ID der möglichen gefundenen Übereinstimmungen. Sie können Vergleiche zwischen den key_in- und key_out-Feldern anstellen, um herauszufinden, ob ein Eintrag Teil des Referenzdatensatzes ist, oder nicht. Beispielsweise verfügen die Datensätze im abgeleiteten Referenzsatz über eine key_in-ID, die der the key_out-ID gleicht. Wie bei der Fuzzysuche zeigen Ähnlichkeitsschwellenwerte die Qualität der vorgeschlagenen Übereinstimmung. Die Transformationen für Fuzzysuchen und Fuzzygruppiererungen bilden nicht nur das Kernstück der Funktionalität für das Verwalten eindeutiger Bezeichner, sie können auch in Verbindungen mit anderen SSIS-Transformationen verwendet werden, um eine umfassende Datenintegrations-Lösung zu erstellen. Die Transformation für Bedingtes Teilen etwa ermöglicht es Ihnen, einen Eingabedatensatz in viele Ausgaben aufzuteilen, basierend auf Ihrer Geschäftslogik. Mit Hilfe dieser Transformation können Sie Datensätze abhängig von ihrem Inhalt an ein Ziel oder mehrere Ziele routen. SSIS-Beispiel Abbildung 1 zeigt eine SSIS-Lösung, die eine Transformation für Fuzzygruppierung verwendet, um eindeutige Bezeichner für Kunden innerhalb einer Vielzahl von Datenquellen zu verwalten. Abbildung 1 – Eindeutige Bezeichner Verwalten Die SSIS-Lösung führt die folgenden Schritte zum Verwalten eindeutiger Bezeichner aus: 1. Datenquellen – Als erstes wird für alle vier Datenquellen Verbindungsfähigkeit festgelegt: Eine CRM OLE DB-Datenquelle, eine Verkäufe-OLE DB-Datenquelle, eine Call Center-Flatfile und eine Kundenselbstbedienungs-xml-Datei. Für jede Datenquelle werden die Spalten der eindeutigen Bezeichner für Vornamen, Nachnamen und das Quellsystem extrahiert. Die Spalten für Vor- und Nachnamen werden die primären Eingaben der Datenbereinigungs-Logik sein. Auch, wenn sie von den Quellen nicht gemeinsam verwendet werden, wurden die eindeutigen Bezeichner des Quellsystems extrahiert, um Verknüpfungen zurück zur jeweiligen Quelle eines jeden Datensatzes zu unterhalten. Diese Bezeichner werden durch alle Schritte des Datenflusses hindurch unverändert bleiben. 2. Union All – Die Quelldaten werden anschließend in einem einzigen Datensatz unter Verwendung der Transformation für Union All kombiniert. An diesem Punkt enthält der Datensatz eine Mischung aus duplizierten und eindeutigen Daten. 3. Fuzzygruppierung – Die Transformation für Fuzzygruppierung konsumiert die gemischten Quelldaten, definiert einen Referenz-Datensatz aus den Vor- und Nachnamen und versucht dann, Datensätze an diesen Verweisdatensatz anzugleichen. Fuzzygruppierung an sich wurde dahingehend konfiguriert, Datensätze mit einem Mindestschwellenwert für Ähnlichkeit unter 0,25 zu ignorieren. Dieser Schwellenwert muss, basierend auf den spezifischen Eigenschaften Ihrer Quelldaten, neu eingestellt werden. 4. Bedingtes Teilen – Die Ausgabe der Transformation für Fuzzygruppierung wird dann an eine Transformation für bedingtes Teilen gesendet, welche die Daten unter Identifizierung dreier Datensätze bedingt ausführen wird. Gruppe 1 – Referenz-Datensätze. Dies sind die Datensätze, in denen das key_in-Feld gleich dem key_out-Feld ist. Alle anderen Quelldatensätze wurden gegen diesen Verweisdatensatz ausgewertet. Gruppe 2 – Duplizierte Datensätze. Dies sind Datensätze, die enge Übereinstimmungen mit dem Referenz-Datensatz aufweisen. Eine enge Übereinstimmung ist eine Ähnlichkeit von > 0,9. Sie haben die Möglichkeit, den Schwellenwert basierend auf Ihrem besonderen Datensatz zu spezifizieren. Gruppe 3 – Eindeutige Datensätze. Dies sind Datensätze, die keine enge Übereinstimmung zum Referenz-Datensatz aufweisen, sie haben eine Ähnlichkeit von weniger als 0,9. Aus Gründen der Abstimmungsflexibilität kann der Wert von 0,9 in diesem Beispiel von einer Variablen definiert werden, die von einer XML-Konfigurationsdatei bevölkert wird. Indem Sie den Schwellenwert getrennt von der Lösung unterhalten, können Sie einfacher die SSIS-Lösung einstellen, nachdem Sie die Ergebnisse jeder Ausführung eingesehen haben. 5. Datenziele – Aus Gründen der Veranschaulichung wurde jede der von der Transformation für bedingtes Teilen erstellten Gruppen in ein anderes Ziel geladen. Im einem realen Szenario würden Sie die Referenz-Datensätze verbinden, um eine Stammliste von eindeutigen Kundendatensätzen zu erstellen. Bereinigungs-Attribute Während eindeutige Bezeichner Ihnen dabei helfen, duplizierte Datensätze zu bereinigen, werden Sie wahrscheinlich auch Funktionalität benötigen, um Ihre Datenattribute zu bereinigen. In vielen Situationen müssen Sie Datenbereinigung ausführen, um widersprüchliche Attribute innerhalb verschiedener Datenquellen zu verwalten. Betrachten Sie das folgende Beispiel. Sie beginnen mit dem Erstellen einer Partner-DMDLösung, die Partnerdaten aus Ihrem CRM-System integriert, Vertriebssystem und dem Profilsystem. Jedes System enthält verschiedene Attribute, die sowohl den Partner beschreiben, als auch überschneidende Attribute, die sich widersprechen. Ein solches Attribut ist die Industrieklassifizierung des Partners. Jedes Quellsystem enthält eine Industrieklassifizierung für einen Partner, die in vielen Fällen von System zu System anders ist. Beispielsweise hat Contoso, eine Große Hotelkette, eine Industrieklassifizierung Gastronomie im Vertriebssystem, eine Klassifizierung Einzelhandel im Partnerprofil und keine Klassifizierung im Partner-CRM-System. Um mit diesen sich überschneidenden Attributen umzugehen, werden Geschäftsregeln gebraucht, die spezifizieren, wie die Konflikte gelöst werden sollen. Beispielsweise können Geschäftsregeln die Ordnung einer Rangfolge eines Quellsystems wie folgt definieren: Vertrieb – Wenn eine Vertriebsindustrieklassifizierung für den Partner besteht, sollte Sie als Hauptklassifizierung Vorrang erhalten. Partner-Profil – Wenn die Vertriebsindustrieklassifizierung leer ist, sollte die Partner-Profil-Industrie verwendet werden. CRM – Wenn die beiden vorhergehenden Klassifizierungen leer sind, sollte die CRMIndustrie verwendet werden. Um widersprüchliche Attribute aufzulösen, sollten Sie eine Integrationslösung erstellen, die Daten aus den CRM-, Vertriebs-, und Partner-Systemen vermischt, verschiedene Attribute aus jedem System erhält und dann Geschäftsregeln anwendet, um die widersprüchlichen Industrieklassifizierungen zu bewältigen. Lösung SSIS bietet eine große Bandbreite von Möglichkeiten, um Geschäftsregeln für die Bereinigung von Attributsdaten anzuwenden. Eine Transformation, die Transformation für Abgeleitete Spalten, beweist vor allen anderen eine hohe Flexibilität im Anwenden von Geschäfts-Logik. Die Transformation für Abgeleitete Spalten wird unter Verwendung eines Ausdrucks definiert. Dieser Ausdruck, der benutzerdefiniert werden kann, kann eine Kombination von Operatoren, Funktionen und Variablen enthalten, um die Quelldaten zu bearbeiten. Im eigentlichen Sinne kann die Transformation für Abgeleitete Spalten wirklich als eine Konsolidierung von vielen verschiedenen Transformationstypen in einer leicht verwendbaren Einheit betrachtet werden. Wenn Sie Attributsdaten bereinigen, werden Sie einen Satz bedingter Geschäftsregeln implementieren wollen, um den bestmöglichen Datensatz festzulegen. Im Partner-MDMSzenario wird der Ausdruck der abgeleiteten Spalten die bedingten Geschäftsregeln enthalten, die bestimmen, welche Industrieklassifizierung angewendet werden sollte. Wenn die Geschäftsregel durch einen Ausdruck definiert wurde, können Sie entweder die abgeleiteten Spalten verwenden, um eine Spalte in den Quelldaten zu ersetzen, oder eine neue Spalte dem Datenfluss hinzufügen. Im Partenr-MDM-Szenario wird eine neue Spalte, genannt Stammindustrieklassifizierung, dem Datenfluss hinzugefügt werden. Obwohl eine neue Stammspalte hinzugefügt wurde, um die Konflikte zu lösen, werden die Industrieklassifizierungen der Quellsysteme weiterhin in separaten Spalten gespeichert werden, um ein komplettes Datensatz-System zu ermöglichen. SSIS-Beispiel Abbildung 2 zeigt eine beispielhafte SSIS-Lösung, die eine Transformation für Abgeleitete Spalten verwendet, um Attributsdaten zu bereinigen. In diesem Beispiel einer Partner-MDM-Lösung müssen Sie Geschäftsregeln anwenden, die jedem Partner eine Stammindustrieklassifizierung zuweisen. Im Gegensatz zum vorhergegangenen Beispiel besteht bereits eine universelle Partner-ID, damit Sie auf einfache Art Daten aus verschiedenen Systemen zusammenbringen können. Abbildung 2 – Attribute bereinigen Die SSIS-Lösung verwendet die folgenden Schritte zur Bereinigung von Attributen: 1. Quelldaten-Verbindungsfähigkeit – Anfangs werden Partnerdaten aus einer CRM-OLE DBDatenquelle, einer Vertriebs-OLE DB-Datenquelle und einer Partner-Profil-Flatfile extrahiert. In diesem Beispiel werden nur die Partner ID und Industrieklassifizierung in den Datenfluss extrahiert. In einem realen Szenario würden Sie die Möglichkeit wahrscheinlich dafür nutzen, zusätzliche benötigte Datenattribute aus jedem der Quellsysteme zu extrahieren. 2. Zusammenführungsverknüpfung – Die Daten aus jeder Datenquelle werden dann unter Verwendung der Transformation für Zusammenführungsverknüpfung verknüpft. Um einen kompletten Partner-Datensatz zu erhalten wird innerhalb der Systeme eine volle äußere Verknüpfung verwendet. Zusammenführungsverknüpfungen werden detaillierter in dem Beispiel Kategorisierung von Einheiten-Aktivitäten beschrieben. 3. Abgeleitete Spalte –Angewendet auf einen kompletten Datensatz verwendet die Transformation für Abgeleitete Spalten bedingte Logik, um eine neue Stammindustrieklassifizierung zu erstellen. Der Ausdruck für dieses Beispiel könnte so aussehen: ISNULL ([SalesIndustry])? ISNULL ([CRMIndustry])? [PartnerProfileIndustry]: [CRMIndustry]: [SalesIndustry] Obwohl die Geschäftsregeln spezifizieren, wie die Stammindustrieklassifizierung zu erstellen ist, ist ein neues Problem aufgetaucht. Die Industrieklassifizierungen innerhalb der Systeme verwenden leicht abweichende Benennungsstandards und produzieren so eine höchst ungleiche Liste von Industrien. Beispielsweise kann die Industrie-Liste die folgenden Werte haben: Banking, Financial Services – Banking, and FinServ_Banking. Um eine einheitliche Liste von Industrien zu produzieren, können Sie die Transformation für Fuzzysuche verwenden, um die Liste zu bereinigen. 4. Fuzzysuche – Um die Benennungsprobleme zu lösen, vergleicht die Transformation die Stammindustrieklassifizierung mit einer Verweisliste von Industrien. 5. Bedingtes Teilen – Die Ausgabe der Transformation für Fuzzysuche wird dann an eine Transformation für Bedingtes Teilen gesendet, die zwei Datengruppen produziert, basierend auf dem Schwellenwert für Ähnlichkeit: Gruppe 1 – Enge Übereinstimmung. Diese Datensätze haben einen Schwellenwert von > 0,9 und zeigen so an, dass eine enge Übereinstimmung zwischen den Quelldaten und der Industrie-Verweistabelle erfolgt ist. Gruppe 2 – Keine enge Übereinstimmung. Diese Datensätze haben einen Schwellenwert von <0,9 und zeigen so an, dass keine enge Übereinstimmung gefunden wurde. In diesem Szenario würden die Stammindustrieklassifikationen bleiben, wie sie sind. 6. Datenziele - In diesem Beispiel wurde jede der Gruppen in ein anderes Ziel geladen. In der realen Welt könnten Sie Bedingtes Teilen durch eine andere Transformation für Abgeleitete Spalten ersetzen, welche die Stammindustrieklassifizierung jedes mal, wenn eine enge Übereinstimmung besteht, aktualisiert. Einheiten-Aktivitäten kategorisieren Wie Sie bereits gesehen haben, bedeutet das Erstellen einer Stammgeschäftseinheit typischerweise Konsolidierung von Daten aus verschiedensten Quellsystemen. Wenn Sie einen Mechanismus identifiziert haben, um Daten zu überbrücken und zu bereinigen, können Sie damit beginnen, die Einheit zu kategorisieren, basierend darauf, in welche Typen von Transaktionen oder Aktivitäten die Einheit involviert ist. Beispielsweise können typische Aktivitäten von Wiederverkäufern das Verkaufen von Produkten und die Teilnahme an Wiederverkäufer-Partnerprogrammen bedeuten. Das Kategorisieren von Wiederverkäufern auf Grund ihrer Einbindung in eine oder beide dieser Aktivitäten kann Ihnen helfen, Marketing-Investitionen zu optimieren, Wachstumschancen zu identifizieren und bessere Beziehungen zu Ihren Wiederverkäufern und Kunden zu etablieren. In vielen Unternehmen geschehen diese Kategorisierungen in einem Data Warehouse. Wenn Sie diese Informationen bereits in einem Data Warehouse gespeichert haben, können Sie dieses Data Warehouse einfach als eine weitere Datenquelle für Ihre MDMAnwendung übernehmen. Wenn Sie diese Informationen nicht bereits verfügbar haben, können Sie Logik in Ihre SSIS-Datenflüsse aufnehmen, um Daten basierend auf Ihren Bedürfnissen zu aggregieren und zu kategorisieren. In diesem speziellen Szenario bestehen die Anforderungen darin, Wiederverkäufer unter Verwendung der folgenden Logik zu kategorisieren: Teilnehmen und Verkaufen – Wiederverkäufer, die an dem Programm teilnehmen und in den letzten 12 Monaten Verkäufe tätigten. Teilnehmen und Nicht Verkaufen – Wiederverkäufer, die an dem Programm teilnehmen und in den letzten 12 Monaten keinen Verkauf tätigten. Kein Teilnehmen und Verkaufen – Wiederverkäufer, die nicht an dem Programm teilnehmen und keine Verkäufe in den letzten 12 Monaten tätigten. Lösung Wenn Sie mit Transaktionsdaten arbeiten, werden Sie häufig die Daten aggregieren müssen, bevor Sie sie in Ihre MDM-Anwendung aufnehmen. Innerhalb von SSIS gibt es eine Transformation für Aggregieren, die Funktionalität bietet, um Datensätze unter Verwendung von Funktionen wie sum, min, max, average, und distinct count zu summieren. Sie können auch die Detail-Ebene konfigurieren, auf der SSIS die Aggregation ausführen soll, indem Sie Gruppen nach Feldern spezifizieren. Zusätzlich zur Aggregation werden Sie auch darauf große Aufmerksamkeit verwenden müssen, wie Sie Daten innerhalb Ihres Quellsystems verknüpfen, um sicherzustellen, dass sie den korrekten Datensatz erhalten. Wenn Sie Daten in SSIS verknüpfen, werden Sie häufig die Transformation für Zusammenführungsverknüpfung verwenden. Zusammenführungsverknüpfungen können eine Vielzahl von Verknüpfungstypen ausführen, wie innere Verknüpfungen, rechte äußere Verknüpfungen, linke äußere Verknüpfungen und vollständige äußere Verknüpfungen. In diesem bestimmten Szenario verwenden Sie eine volle äußere Verknüpfung, um eine komplette Liste der Wiederverkäufer aus beiden Quellsystemen zu erstellen. Wenn Sie eine Gleichheitsverknüpfung oder innere Verknüpfung zwischen zwei Quellen erstellen würden, bekämen Sie nur die Wiederverkäufer zurück, die sich in beiden Systemen befinden. Wie in den Geschäftsregeln festgelegt, verfügen nicht alle Wiederverkäufer im Wiederverkäufer-Programm über Verkaufstransaktionen und umgekehrt. Eine volle äußere Verknüpfung ermöglicht es Ihnen, den kompletten Datensatz für die weitere Verarbeitung wiederzubringen. SSIS-Beispiel Abbildung 3 zeigt das Beispiel einer SSIS-Lösung, das zeigt, wie Sie die Transformationen für Aggregieren und Zusammenführungsverknüpfung verwenden können, um Wiederverkäufer basierend auf Transaktionsdaten zu kategorisieren. Abbildung 3 – Einheiten-Aktivitäten kategorisieren Die SSIS-Lösung verwendet die folgenden Schritte, um die Einheiten-Aktivitäten zu kategorisieren. 1. Datenquellen – Zu Beginn werden die Wiederverkäuferdaten aus einer VertriebsOLE DB-Datenquelle und einer Liste von Teilnehmenden Wiederverkäufern in Flatfiles extrahiert. 2. Aggregieren – Da sich die Verkaufsdaten im Quellsystem auf Transaktionsebene befinden, sind sie granulierter als für diese Lösung erforderlich. Um die Detailebene einzustellen, nimmt die Transformation für Aggregieren die Verkaufsdaten der letzten 12 Monate und summiert sie nach Wiederverkäufer. 3. Zusammenführungsverknüpfung –Eine volle Zusammenführungsverknüpfung bringt die teilnehmenden Wiederverkäufer mit den Wiederverkäufern des Vertriebssystems zusammen. Die Daten werden unter Verwendung einer Wiederverkäufer-ID verknüpft, die von beiden Systemen gemeinsam verwendet wird. Als Ausgabe der vollständigen äußeren Verknüpfung werden zwei Felder eine wichtige Rolle bei der Kategorisierung der Wiederverkäufer spielen: Das Wiederverkäufer-ID-Feld des Vertriebssystems und das Wiederverkäufer-ID-Feld aus der Wiederverkäufer-Programmdatei. Diese beiden Felder werden die gleichen Werte haben, wenn Wiederverkäufer in sowohl den Verkaufsdaten, als auch den Wiederverkäufer-Programmdaten gefunden werden. Die Verkäufe-WiederverkäuferID wird NULL sein, wenn ein Wiederverkäufer an dem Programm teilnimmt, aber keine Verkäufe hat. Die Programm-Wiederverkäufer-ID wird NULL sein, wenn ein Wiederverkäufer Verkäufe hat, aber an dem Programm teilnimmt. 4. Bedingtes Teilen – Bedingtes Teilen leitet die Wiederverkäufer an eine der drei Gruppen, basierend auf den Ergebnissen der Zusammenführungsverknüpfung: Gruppe 1 – Teilnehmen und Verkaufen – Diese Wiederverkäufer haben NOT NULL-Werte für die Verkäufe-Wiederverkäufer-ID und die ProgrammWiederverkäufer-ID. Gruppe 2 – Teilnehmen und Nicht Verkaufen– Diese Wiederverkäufer haben einen NULL-Wert für die Verkäufe-Wiederverkäufer-ID und einen NOT NULL-Wert für die Programm-Wiederverkäufer-ID. Gruppe 3 – Nicht Teilnehmen und Verkaufen- Diese Wiederverkäufer haben einen NOT NULL-Wert für die Verkäufe-Wiederverkäufer-ID und einen NULL-Wert für die Programm-Wiederverkäufer-ID. 5. Datenziele – Wie in den vorhergegangenen Beispielen wird jede Gruppe nur zu Demonstrationszwecken in ein anderes Ziel geladen. In einem echten Szenario können Sie die Transformation für Bedingtes Teilen durch eine einfache Transformation für Abgeleitete Spalten ersetzen, welche die gleiche bedingte Logik enthält wie sie in Schritt 4 spezifiziert wird, um eine neue Kategorisierungs-Spalte in die Datenausgabe aufzunehmen. Attribute Extrahieren Zusätzlich zum Ableiten interessanter Attribute von Transaktionsdaten zur Erfüllung der Ansprüche mancher MDM-Anwendungen, ist es eventuell nötig, dass Sie Attribute extrahieren müssen, die in einen Text oder eine Datenquelle eingebettet sind. Beispielsweise können Sie Produkt-Feedback extrahieren, das in der Bemerkungen- Spalte eines Fehlersuchsystems enthalten ist, oder Informationen über Fähigkeiten, die in Lebensläufen von Angestellten enthalten sind. Um diese Art von Informationen zu extrahieren benötigt es einen stabilen Mechanismus, um effizient feststellen zu können, ob Attribute von Bedeutung sind. Betrachten wir das folgende Beispiel. Ein Kundensystem eines Call Centers enthält die Probleme, Klagen und generelle Fragen von Kunden, die Produkte und Dienstleistungen betreffen. Als Teil des standardisierten Kunden-Support-Prozesses erstellt jeder Supportmitarbeiter ein Kundenprofil und verfolgt alle mit dem Kundenanruf verbundenen Aktivitäten nach. Beispielsweise erstellen die Mitarbeiter ein Profil für eine Kundenunterstützung unter Verwendung von strukturierten Attributen wie des fraglichen Produkts oder der fraglichen Dienstleistung, die Art des Problems und die Priorität des Problems. Um diese strukturierten Attribute zu vervollständigen verwenden sie auch ein Textfeld für Freitext, um andere relevante Informationen wie einen Kommentar, eine spezifische Kundenrückmeldung, besondere Umstände des Anlasses für die Hilfesuche oder generelle Beobachtungen zu speichern. Das manuelle Ableiten bedeutender Informationen aus dem Kommentarfeld kann sich als schwierig erweisen, angesichts der potentiell großen Datenmengen im Textfeld, der heterogenen Natur seines Inhalts und der Unmöglichkeit, diese Informationen mit einer erfolgreichen oder missglückten Support-Aktivität zu verknüpfen. Deshalb brauchen Sie eine systematische Lösung, die potentiell aussagkräftige Attribute entdecken kann. Lösung Um Ihnen dabei zu helfen, die Probleme, die mit dem Extrahieren von Attributen aus Textdaten verbunden sind, zu beseitigen, bietet SSIS Text Mining-Funktionalität, damit Sie Geschäftsbegriffe aus Textfeldern extrahieren können. Genauer gesagt bietet SSIS zwei Transformationen, die Text Mining-Funktionalität verwenden: Ausdruckssuche und Ausdrucksextrahierung. Ausdruckssuche ist hilfreich, wenn Sie eine bestehende Liste von Verweisausdrücken haben, nach denen Sie in Ihrem Quelldatensatz suchen möchten. Um die Bedeutung zu beurteilen, verfügt die Transformation für Ausdruckssuche über einen Häufigkeitswert, der die Anzahl von Erscheinungen eines Referenzausdrucks in den Quelldaten wiedergibt. Abhängig von Ihrem Szenario möchten Sie vielleicht Datensätze bedingt ausführen, basierend auf ihrem Häufigkeitswert. Beispielsweise ist es möglich, dass Sie nur Ausdrücke akzeptieren, die mehr als zwei mal erscheinen. Ausdrucksextrahierung ist nützlich, wenn Sie nicht bereits über eine Liste von Ausdrücken verfügen, aber ein Wörterbuch mit Ausdrucks-Kandidaten erstellen möchten, nach denen sie später suchen werden. Um diese Kandidaten zu entdecken, teilt die Transformation für Ausdrucksextrahierung als erstes den Textdaten in Ausdrücke auf und zählt anschließend die Anzahl der Erscheinungen für jeden Ausdruck. Um die Ausdrucksextrahierung anzupassen, können Sie konfigurieren, wie SSIS einen Ausdruck definiert, ob es Nomen berücksichtigen soll, Nominalphrasen, oder beides, und Sie können konfigurieren, welche Schlüsselbegriffe ausgeschlossen werden sollen. Sie können auch andere Parameter, die SSIS verwendet, um Muster zu finden, konfigurieren, wie etwa die nötige Anzahl der Erwähnungen, bis ein Ausdruck extrahiert wird. Um die Qualität der entdeckten Muster anzuzeigen, verwendet die Transformation für Ausdrucksextrahierung ein Ergebnis, um die Anzahl der Erscheinungen eines Ausdrucks in den Quelldaten zu beschreiben. Dieses Ergebnis kann als reine Häufigkeit ausgedrückt werden oder als normalisierter Wert. Abhängig von den Eigenschaften Ihrer Quelldaten werden Sie wahrscheinlich einige Iterationen der Transformation für Ausdrucksextrahierung ausführen, um zu bestimmen, ob ein Attribut wirklich aussagekräftig ist. Um Attribute wie in dem beschriebenen Call Center-Szenario aus einem Kommentarfeld zu extrahieren, werden Sie die Transformation für Ausdrucksextrahierung verwenden, um zusätzliche Charakteristiken zur Profilerstellung zu entdecken. SSIS-Beispiel Abbildung 4 zeigt eine SSIS-Lösung, welche die Transformation für Ausdrucksextrahierung verwendet, um potentiell interessante Muster in einem Kommentarfeld zu entdecken. Abbildung 4 –Attribute extrahieren Die SSIS-Lösung führt die folgenden Schritte aus, um neue Attribute zu entdecken: 1. Quelldaten – Zu Anfang werden die Call Center-Textdaten aus einer OLE DBDatenquelle geladen. 2. Ausdrucksextrahierung – Die Transformation für Ausdrucksextrahierung wird auf die Bemerkungen-Spalte angewendet und produziert zwei Ausgaben: Ausdruck und Ergebnis. Die Transformation wurde wie folgt konfiguriert: Extrahieren von Nomen und Phrasen. Zählen der Ausdrucks-Häufigkeit. Extrahieren der Ausdrücke, die einen Schwellenwert von zwei oder mehr Erscheinungen treffen oder übersteigen. Ausschließen bekannter Wörter oder “Störwörter“. Für dieses Szenario können die folgenden Störwörter identifiziert werden: Kunde, Projekt, Lösung und Möglichkeit. 3. Bedingtes Teilen – Basierend auf dem abgeleiteten Ergebnis der Transformation für Ausdrucksextrahierung werden zwei Datengruppen erstellt – Gruppe 1 enthält Ausdrücke, die häufig erscheinen, und Gruppe 2 enthält selten erscheinende Ausdrücke. In diesem Szenario wurde ein häufig wiederkehrender Begriff mit einem Ergebnis von 5 oder mehr identifiziert. Gruppe 2 enthält Ausdrücke, die ein Ergebnis von 2 bis 4 haben. 4. Datenziel – Zum Zwecke der Veranschaulichung wurde jede der Ausdrucksgruppen in ein anderes Ziel geladen. Anhand der Identifizierung von Ausdrücken mit häufiger Erwähnung können Sie diese Ausdrücke weitergehend untersuchen, um zu bestimmen, ob sie aussagekräftige Attribute darstellen. In diesem Szenario könnten Sie beispielsweise feststellen, dass die Namen gewisser Zulieferer häufig in einem Bemerkungsfeld erscheinen. Da Informationen über Zulieferer augenblicklich über kein eigenes Profil in Ihrem Call Center-System verfügen, möchten Sie eventuell ein neues Attribut zur Profilerstellung schaffen, das Einbeziehung von Partnern heißt, um Drittanbieter nach zu verfolgen, die an Supportereignis teilhaben. Der Wert von SSIS-Transformationen für Text Mining besteht in der Leichtigkeit, mit der sie einfach in die regulären Aktivitäten der Datenintegration einer jeden MDM-Lösung eingebaut werden können. Um das Call Center-Szenario noch etwas zu erweitern, können Sie die neuen Attribute zur Einbeziehung von Partnern in den folgenden MDMLösungen verwenden: Als Bestandteil einer Kunden-MDM-Lösung können Sie die Beziehungen zwischen Kunden und Partnern in einem Profil erfassen. Als Bestandteil einer Produkt-MDM-Lösung können Sie die Beziehungen zwischen Produkten und unterstützenden Partnern identifizieren. Als Bestandteil einer Partner-MDM-Lösung können Sie solche Partner identifizieren, die in erfolgreiche und fehlgeschlagene Ereignisse der Kundenunterstützung involviert sind. Schlussfolgerung SSIS bietet eine umfassende Plattform zur Datenintegration, um effektiv und effizient die Integrationsprobleme von MDM-Anwendungen zu lösen. Dies wird erreicht durch: Bereitstellen einer großen Bandbreite von Datentransformations- und BereinigungsFunktionalität, um eindeutige Bezeichner, Attribute und Transaktionsdaten zu verwalten. Bereitstellen einer umfassenden, stabilen und skalierbaren Plattform und einem Satz von Entwicklungswerkzeugen, um großskalierte Integrationslösungen zu entwerfen und zu verwalten. Maximieren der ROI durch die niedrigsten Gesamtanschaffungskosten im Vergleich mit konkurrenzfähigen Plattformen. Die Autoren Elizabeth Vitt, Intellimentum Elizabeth Vitt verfügt über eine zehnjährige Erfahrung in Unternehmensentwicklung, Projektmanagement und Schulung von Business Intelligence. Ihre Erfahrungen in der Industrie beinhalten BI-Implementierungen im Handel, der verarbeitenden Industrie und Finanzdienstleistungen. Sie verfügt über spezialisierte Erfahrung als Ausbilderin in Data Warehousing, ETL, und OLAP-Entwurf und Implementierung. Frau Vitt ist Autorin für Microsoft Official Curriculum-Kurse für Microsoft Business Intelligence-Produkte, sowie für Microsoft Press, Business Intelligence: Making Better Decisions Faster. Im Zuge der Veröffentlichung von SQL Server 2005 hat Frau Vitt SQL Server 2005 für Early Adopter-Unternehmen erfolgreich implementiert. Hitachi Consulting Hitachi Consulting, das globale Beratungsunternehmen von Hitachi, Ltd. (NYSE: HIT), ist führend als Lieferant von Unternehmens- und IT-Lösungen an Global 2000-Unternehmen aus den verschiedensten Industrien. Hitachi Consulting setzt seine jahrzehntelangen Erfahrungen in Unternehmensprozessen, vertikaler Industrie und neuesten Technologien ein, um die ganz speziellen geschäftlichen Bedürfnisse eines jeden Unternehmens zu verstehen. Von der Entwicklung von Unternehmensstrategien bis zur Anwendungsbereitstellung widmen sich die Hitachi-Berater dem Ziel, ihren Klienten dabei zu helfen, schnell messbare Unternehmenswerte wahrzunehmen und eine zukunftsfähige Kapitalrendite zu erreichen. Hitachi Consulting ist ein Microsoft Certified Gold Partner für Business Intelligence und ein exklusiver Anbieter von Lehrplänen und Schulungspersonal für das Microsoft SQL Server 2005 Business Intelligence Ascend Trainingsprogramm. Hitachi Consulting ist auch ein erfahrener Systemintegrator und hat SQL Server 2005 BI erfolgreich bei Firmen, die an dem Microsoft Technology Adoption Program (TAP) teilnehmen, implementiert. Hitachi Consulting bietet eine kundenorientierte, gemeinschaftliche Herangehensweise und vollzieht in jedem Engagement Wissenstranfers. Für weiter Informationen besuchen Sie bitte www.hitachiconsulting.com. Hitachi Consulting—Inspiring your next success®