Überblick der SSIS-Lösung

Werbung
Microsoft® SQL Server™ 2005:
Datenintegrationslösungen für
Stammdatenverwaltung
Autoren:
Elizabeth Vitt
Intellimentum
Hitachi Consulting
Mitwirkende:
Donald Farmer
Microsoft Corporation
Stacia Misner
Hitachi Consulting
Januar 2006
Zusammenfassung: In diesem wird beschrieben, wie Anwendungsentwickler die Funktionalität von
Microsoft® SQL Server™ 2005 Integration Services einsetzen können, um Probleme der
Datenintegration von Anwendungen für Stammdatenverwaltung anzugehen.
Inhalt:
Einführung
2
Überblick der SSIS-Lösung
2
Anforderungen der MDM-Datenintegration
2
SSIS-Datenintegration für MDM
3
Auf verschiedene Datenquellen zugreifen 4
Lösung
4
Eindeutige Bezeichner verwalten
5
Lösung
5
SSIS-Beispiel
6
Bereinigungs-Attribute
8
Lösung
9
SSIS-Beispiel
9
Einheiten-Aktivitäten kategorisieren
11
Lösung
12
SSIS-Beispiel
12
Attribute Extrahieren 13
Lösung
14
SSIS-Beispiel
15
Schlussfolgerung
16
Die Autoren 17
Elizabeth Vitt, Intellimentum
17
Hitachi Consulting
17
Einführung
Datenverwaltung ist eine der komplexesten und teuersten Herausforderungen, mit denen sich das
bewegliche Unternehmen konfrontiert sieht. Frustriert von der Schwierigkeit und Ungenauigkeit des
manuellen Zusammensetzens uneinheitlicher, redundanter und veralteter Daten suchen viele
Unternehmen eine neue Generation von Datenverwaltungs-Lösungen, um nahtlos Hunderte von
Datenquellen in wirkungsvolle Daten zu konvertieren, die vom gesamten Unternehmen gemeinsam
verwendet werden können.
Um ihren Bemühungen um Datenverwaltung eine Richtung zu geben, übernehmen viele
Unternehmen Stammdatenverwaltung – auch MDM (Master Data Management) - , eine umfassende
Strategie, um ausgedehntes Datenkapital zu erstellen, zu organisieren und zu verwalten, und das für
das gesamte Unternehmen. Stammdatenverwaltungs-Lösungen erstellen ein Hauptsystem von
Datensätzen für eine bestimmte Unternehmenseinheit und veröffentlichen anschließend diese
Stammdatensicht an eine Auswahl von Consumeranwendungen. Stammdatenverwaltungs-Lösungen
können virtuell um jede Dateneinheit gebildet werden – Kunden, Partner, Produkte, Anbieter,
Angestellte, etc. – wo auch immer eine Stammdatensicht benötigt wird. Viele
Stammdatenverwaltungs-Lösungen haben eindeutigen Namen, um ihren Wirkungsbereich zu
beschreiben. Beispielweise wird PIM (Product Information Management) verwendet, um Produktfokussierte Stammdatenverwaltungs-Lösungen zu beschreiben, und CDI (Customer Data integration)
wird verwendet, um Kunden-fokussierte Anwendungen zu beschreiben. Da StammdatenverwaltungsLösungen eine große Spanne von geschäftlichen und technischen Funktionen umfassen, erfordert
das Erstellen einer Stammdatenverwaltungs-Lösung eine multidisziplinäre Herangehensweise an die
Datenverwaltung, die Datenintegration, Datenmodellierung, Datenveröffentlichung und
Datensynchronisierung einschließt.
Von all diesen Komponenten ist Datenintegration immer noch der kritischste und aufwändigste
Aspekt einer Stammdatenverwaltungs-Lösung. Stammdatensichten werden durch die Integration von
Daten aus verschiedenen internen Quellen wie ERP (Enterprise Resource Planning), CRM
(Customer Relationship Management), BI (Business Intelligence) und veralteten Systemen erstellt,
sowie integrierten externen Daten von Partnern oder Lieferanten. Die Probleme, die solche
Integrationsprozesse häufig mit sich bringen, können in hohen Entwicklungskosten und verlängerten
Zeitmargen der Projekte resultieren. Um diese Probleme kosteneffektiv zu lösen, benötigt die ITAbteilung eine flexible Datenintegrations-Architektur, die einen breitgefächerten Satz von
Technologien und Werkzeugen liefert, um benutzerdefinierte Integrationslösungen zu erstellen.
Microsoft SQL Server Integration Services (SSIS) 2005 bietet eine voll ausgestattete
Datenintegrations-Plattform für Unternehmen und eine reichhaltige Entwicklungsumgebung, um
unternehmensweit umfassendes Datenkapital zu erstellen, es zu organisieren und zu verwalten, das
spezifisch für Stammdatenverwaltungslösungen eingesetzt werden kann. SSIS verfügt auch über ein
ausgedehntes System von Partnern, die spezialisierte Stammdatenverwaltungs (MDM)-Lösungen im
Herzen der SQL Server-Plattform erstellt haben. Mit der Verwendung von SSIS 2005 kann ein
Unternehmen erfolgreich eine große Spannbreite von Datenintegrations-Lösungen erstellen, die
Hauptgeschäftssichten unterstützen, schnell Probleme der Datenverwaltung bewältigen und die
Gesamtkosten der Stammdatenverwaltung reduzieren.
Überblick der SSIS-Lösung
Anforderungen der MDM-Datenintegration
Obwohl jede MDM-Lösung bei der Datenintegration wahrscheinlich andere geschäftliche und
technische Anforderungen hat, werden Sie doch auf drei generelle Datenkategorien stoßen:
Eindeutige Bezeichner, Attribute und Transaktionen. Jede dieser drei Datenkategorien hat ihre
eigenen, besonderen Probleme bei der Datenintegration, die Sie beim Erstellen Ihrer MDM-Lösung
bewältigen müssen.



Eindeutige Bezeichner – Eindeutige Bezeichner bilden die Grundbausteine beim Definieren
eines Stammsystems von Datensätzen für eine Geschäftseinheit. Wenn Sie Daten aus vielen
Datenquellen zusammenbringen, müssen Sie einen einheitlichen Mechanismus haben, um eine
Einheit eindeutig innerhalb verschiedener Geschäftsfunktionen zu identifizieren.
Unglücklicherweise gibt es nicht immer einen gemeinsamen eindeutigen Bezeichner, der eine
bestimmte Einheit immer in der gleichen Art innerhalb der gesamten Quellsysteme identifiziert.
Sie können beispielsweise beim Erstellen einer Angestellten-MDM-Anwendung feststellen, dass
das HR-System Ihrer Organisation, das Vertriebssystem, das Verkaufsvorhersagensystem,
Active Directory und CRM-System alle verschiedene eindeutige Bezeichner für
Außendienstmitarbeiter verwenden. Um die MDM-Lösung zu erstellen, müssen Sie eine andere
Methode etablieren, um die Daten erfolgreich zu kombinieren, ohne sie zu duplizieren. Das
Duplizieren von Daten mag sich nach etwas anhören, das leicht zu vermeiden ist; tatsächlich
werden Sie aber feststellen, dass manche Typen duplizierter Daten schwerer zu entdecken sind,
als andere.
Attribute- Wenn Sie den eindeutigen Bezeichner für eine Einheit festgelegt haben, können Sie
der Einheit Attribute hinzufügen, die einen aussagekräftigen Geschäftskontext darstellen, die
Geschäftseinheit in eine oder mehrere Gruppen unterteilen und Beziehung der Einheit zu
anderen Einheiten beschreiben. Diese Attribute können direkt aus den Quellsystemen stammen.
Sie können beispielsweise Attribute für Angestelltenprofile von Ihrem HR-System mit E-MailAdressen von Angestellten aus dem Active Directory Ihres Unternehmens zusammenbringen. Es
können aber auch Attribute abgeleitet werden, nachdem die Daten kombiniert wurden. Wenn Sie
Attribute kombinieren, müssen Sie Konflikte zwischen Attributen aus verschiedenen Systemen
bewältigen. Sie können beispielsweise über Informationen zu Angestellten-Adressen verfügen,
die innerhalb der verschiedenen Quellsysteme variieren. Um dieses Problem zu beheben,
müssen Sie Geschäftsregeln definieren, die bestimmen, welche Adresse den besten Datensatz
für jeden Angestellten liefert.
Transaktionen –Transaktionen beschreiben die Aktivitäten, in die eine bestimmte
Geschäftseinheit involviert ist. Beispielsweise kann ein Außendienstmitarbeiter in Absatzchancen,
Verkaufstransaktionen und Verkaufsvorhersagen involviert sein. Innerhalb von MDMAnwendungen benötigen Transaktionsdaten wiederholt ein gewisses Maß an Aggregation, um
die Quelldetails in einem aussagekräftigen Format zu vereinen. Nach der Aggregation können
Transaktionsdaten dazu verwendet werden, Attribute abzuleiten, die eine Einheit basierend auf
ihrer Tätigkeit oder der Abwesenheit von Tätigkeit zu charakterisieren
SSIS-Datenintegration für MDM
SQL Server 2005 Integration Services (SSIS), der Nachfolger von SQL Server 2000 Data
Transformation Services, ist eine Datenintegrations-Plattform für eine neue Generation
von Lösungen, die schnell große Datenmengen aus verschiedenen Datenquellen mit
komplexen Transformationen und mit Bereinigung integrieren müssen.
Hinter den Kulissen enthält die hoch leistungsfähige Architektur von SSIS zwei
wirkungsvolle Module:
 Paralleles Laufzeitmodul – Das Laufzeitmodul koordiniert die Ablaufsteuerung
zwischen Tasks in SSIS.
 Schnelles, effizientes Datenflussmodul– Das Datenflussmodul extrahiert Daten
aus einer oder mehreren Datenquellen, führt jede nötige Transformation an den
Daten aus, und liefert die Daten dann an ein Ziel oder mehrere Ziele. Um die Effizienz
zu maximieren, profitiert das Datenflussmodul von Verarbeitung im Arbeitspeicher,
um die Mehrlast, die normalerweise durch das physikalische Kopieren und Stagen der
Daten in Tabellen an verschiedenen Punkten des Integrationsprozesses entsteht, zu
eliminieren. Durch die Bearbeitung der Daten im Arbeitspeicher, während sie von
Quelle zu Ziel gebracht werden, reduziert das Datenflussmodul die für das Daten-
Staging benötigten manuellen Schritte, spart Verarbeitungszeit und hilft Ihnen,
Integrationsprobleme in kürzeren Datenverarbeitungsfenstern zu lösen.
Um eine große Bandbreite von Datenansprüchen für MDM-Lösungen zu unterstützen, bietet SSIS die
folgenden Möglichkeiten der Datenintegration:
 Breite Möglichkeiten zur Datenverbindung – SSIS bietet für die Integration verschiedener
Daten Zugriff auf eine Vielzahl von Datensystemen, Strukturen und Formaten, die einen
eindeutigen Bezeichner zur Verfügung stellen, sowie Attribute und Transaktionen für MDMAnwendungen.
 Stabile Datenbereinigung – Um sicherzugehen, das Daten in einer aussagekräftigen Art
kombiniert werden, bietet SSIS Werkzeuge zur Datenbereinigung, die eingesetzt werden können,
um häufige MDM-Datenintegrationsprobleme wie das Ableiten eindeutiger Bezeichner und das
Behandeln von Attribut-Konflikten anzugehen.
 Flexible Datentransformationen – Um die Datenbereinigung zu unterstützen, bietet SSIS eine
Vielzahl von Datentransformationen, die verwendet werden können, um aussagekräftige Attribute
von Quelldaten abzuleiten und Transaktionsdaten zu aggregieren.
Die folgenden Abschnitte beschreiben, wie Sie die Fähigkeiten von SSIS zur Datenintegration nutzen
können, um häufige Probleme von MDM-Anwendungen zu lösen.
Auf verschiedene Datenquellen zugreifen
Für viele Unternehmen bringt das Zusammenfügen von Stammdaten aus CRM, ERP und BISystemen das Vereinheitlichen von Daten aus Dutzenden, vielleicht sogar Hunderten von
verschiedenen Datenquellen mit sich. In einem CDI-Szenario beispielsweise müssen Sie die
folgenden Daten zusammen bringen: CRM-Daten aus einem RDBMS (relational database
management system), Verkaufsdaten aus Mainframe-Datenextrakten, Kundenaufteilungsdaten aus
Excel und demographische Daten von Dritten über Webdienste. Das Sammeln von Kundendaten aus
diesen verschiedenen Quellen erfordert eine Integrations-Lösung, die erfolgreich auf Daten zugreifen
kann und ihre verschiedenen Schnittstellen, Strukturen und Datentypen interpretieren kann.
Lösung
SSIS ermöglicht den Zugriff auf eine Vielzahl verschiedener Datenquellen, einschließlich
Datenbanken, Flatfiles, Arbeitsblätter, gepackten Anwendungen und XML-Daten, unter Einbeziehung
von OLE DB-, ODBC-, und .NET-Providern, geliefert von Microsoft und Drittanbietern.
SSIS kann auch XML-Daten unter Verwendung einer XSD (XML Schema Definition)-Datei für inlineSchemas interpretieren und übersetzen. Zusätzlich kann SSIS unter Verwendung von Proxy-Klassen
und der Webdienst-Unterstützung des .NET-Framework Daten aus Webdiensten konsumieren. Mit
dieser eingebauten Unterstützung für XML und Webdienste kann SSIS effektiv an der SOA (Service
Oriented Architecture) eines Unternehmens teilnehmen, um lose verbundene DatenintegrationsLösungen zu erstellen.
Um Verbindung zu Quellen und Zielen aufzunehmen, für die ein Provider nicht erreichbar ist, kann
die Verbindungsfähigkeit von SSIS durch das Erstellen von benutzerdefinierten Datenquellen mit
skripterstellten Quellkomponenten oder wiederverwendbaren Adaptern auf einfache Art erweitert
werden. Sie können die SSIS-Funktionalität für Datenzugriff auch unterstützen, indem Sie die
Verbindungsfähigkeit anderer Microsoft Datenintegrations-Technologien einsetzen, wie etwa die von
Host Integration Server für die Mainframe-Verbindungsfähigkeit oder Microsoft BizTalk Server für
B2B-Datenaustausch.
Ein einzigartiges und wertvolles Feature zur Verbindungsfähigkeit von SSIS ist die flexible Definition
eines Datenziels. Ein Ziel kann ein Datenspeicher oder eine Datenbank sein, aber es kann auch ein
ADO .NET-DataReader sein, der auf Befehl an Downstream-Anwendungen gegeben werden kann,
ohne die Notwendigkeit eines Verbleibens der Daten in einem Datenspeicher.
In den folgenden Abschnitten werden Sie einige Beispiele dafür finden, wie SSIS
Verbindung zu einer Reihe von Quellen herstellt, um Daten für MDM-Lösungen
zusammenzubringen.
Eindeutige Bezeichner verwalten
Während Daten-Verbindungsfähigkeit den Mechanismus bietet, um Zugriff auf
Stammdaten in verschiedenen Quellsystemen zu erhalten, stellt die Datenbereinigung
sicher, dass die Stammdaten erfolgreich integriert werden, mit einem hohen Grad an
Datenqualität und Einheitlichkeit. Um die Ansprüche von MDM an Datenbereinigung zu
unterstützen, bietet SSIS stabile Funktionalität um Ihnen dabei zu helfen, eindeutige
Bezeichner innerhalb der Datenquellen zu verwalten.
Wenn Sie eine MDM-Lösung erstellen, die Daten aus vielen Datenquellen kombiniert, können Sie
Schwierigkeiten dabei bekommen, die Daten zu vereinigen, wenn es keinen gemeinsamen
eindeutigen Bezeichner gibt, der von den Systemen gemeinsam verwendet wird. Diese Situation tritt
für gewöhnlich auf, wenn jedes Quellsystem seine eigene Art hat, eine Geschäftseinheit zu
repräsentieren und sie zu identifizieren.
Nehmen Sie das folgende Beispiel. Das CRM-System Ihrer Organisation, das Vertriebssystem, das
Kunden-Selbstbedienungs-System und das Call Center-System verwenden alle unterschiedliche
Bezeichner, um Kunden eindeutig zu identifizieren. In Ermangelung eines gemeinsamen eindeutigen
Bezeichners müssen Sie daran denken, eine andere Methode zu verwenden, um Datensätze
zwischen den Systemen zu verbinden. In diesem bestimmten Szenario enthält jedes System eine
Instanz des Vor- und Nachnamens des Kunden. Auf den ersten Blick könnte man meinen, dass die
Kombination von Vor- und Nachnamen den perfekten eindeutigen Bezeichner darstellt; allerdings
stellen Sie bei näherer Untersuchung fest, das nur 20% der Daten exakt mit dem Vor- oder
Nachnamen übereinstimmen. Während nur ein geringer Prozentsatz der Datensätze übereinstimmt,
kann es noch doppelt geführte Kunden geben, deren Namen entweder falsch geschrieben wurden
nur geringfügig verschieden sind, abhängig davon, wie der Name in jedes Quellsystem eingegeben
wurde.
Beispielsweise kann eine Kundin im CRM-Verkaufs-System als Terry Ramos identifiziert werden; im
Verkaufs-System aber ist sie als Theresa G. Ramos identifiziert. Obwohl es Terry Ramos nicht genau
mit Theresa G. Ramos übereinstimmt, beziehen sich die verschiedenen Repräsentationen auf die
selbe Person. Obwohl Sie manche dieser unpräzisen Duplikate unter Verwendung manueller
Methoden identifizieren können, brauchen Sie doch eher eine systematischere und stabilere Lösung,
die auf einen gesamten Datensatz angewendet werden kann, um eindeutige und doppelte
Datensätze zu identifizieren.
Lösung
Für diese Lösung bietet SSIS Datenbereinigungs-Funktionen, die Sie kombinieren können, um
eindeutige Bezeichner in einer Vielzahl von Szenarien zu verwalten.
In einem idealen Szenario wird ein stabiler eindeutiger Bezeichner von vielen Datenquellen
gemeinsam verwendet. In diesem Fall können Sie einen SSIS-Datenfluss erstellen, um Daten
zusammenzubringen, unter Verwendung von Gleichheitsverknüpfungen oder Suchen für
Gleichheitsverknüpfungen. In komplexeren Szenarien, die keine Gleichheitsverknüpfungen zulassen,
können Sie Fuzzy-Logik einsetzen, um die bestmögliche Datenübereinstimmung zu identifizieren.
Fuzzy-Logik ermöglicht die Ausführung eines Mechanismus, um unpräzise Datenübereinstimmungen
anzugleichen. In SSIS gibt es zwei Transformationen, die Fuzzy-Logik verwenden: Fuzzysuchen und
Fuzzygruppierung.
 Fuzzysuchen – Fuzzysuchen sind eine großartige Einrichtung, um schmutzigen Quelldaten an
einen bekannten Satz von bereinigten, standardisierten Daten, wie eine Referenz-Tabelle etwa,
anzugleichen. Wenn SSIS die Fuzzysuche ausführt, zeigen Ähnlichkeits- und VertraulichkeitsIndexe die Qualität der Datenübereinstimmung an. Die Schwellenwerte für Ähnlichkeit zeigen an,
wie genau die Eingabedaten der vorgegebenen Übereinstimmung ähneln. Ein Ähnlichkeitswert
von eins zeigt eine identische Übereinstimmung an. Je näher der Wert an eins, desto größer die
Übereinstimmung. Zur Unterstützung des Schwellenwertes beschreibt die Verlässlichkeit die
Ebene der Gewissheit, dass SSIS die Übereinstimmung gefunden hat. Wenn beispielsweise drei
verschiedene Menschen den gleichen Namen haben, wird SSIS einen Verlässlichkeitsindex
verwenden, um seine Sicherheit anzuzeigen, dass es die richtige Person für die
Übereinstimmung gefunden hat.
 Fuzzygruppierung – Wenn keine standardisierten Referenzdaten zur Verfügung stehen,
entwickelt Fuzzygruppierung einen Stammdatensatz von eindeutigen Daten, der eine
Kombination von eindeutigen und duplizierten Daten enthält. Wenn Sie mit der Entwicklung einer
MDM-Anwendung beginnen, ist das Erstellen eines Stammdatensatzes häufig ihre erste
Herausforderung in der Datenintegration.
Um dieses Datensatz-System zu entwerfen, untersucht Fuzzygruppierung Quelldaten und leitet
einen Referenzsatz eindeutiger, kanonischer Datensätze ab. Alle Daten in dem Datensatz
werden mit diesen abgeleiteten Referenzdatensatz auf potentielle Übereinstimmungen hin
verglichen. Fuzzygruppierung erstellt auch zwei zusätzliche Felder, key_in und key_out, um
Ihnen bei der Bestimmung eindeutiger und duplizierter Datensätze zuhelfen. Die key_in-Spalte
speichert eine SSIS-generierte, einzigartige ID für jeden Datensatz im Eingabedatensatz. Wenn
die Transformation für Fuzzygruppierung Übereinstimmungen sucht, speichert die key_out-Spalte
die ID der möglichen gefundenen Übereinstimmungen. Sie können Vergleiche zwischen den
key_in- und key_out-Feldern anstellen, um herauszufinden, ob ein Eintrag Teil des
Referenzdatensatzes ist, oder nicht. Beispielsweise verfügen die Datensätze im abgeleiteten
Referenzsatz über eine key_in-ID, die der the key_out-ID gleicht. Wie bei der Fuzzysuche zeigen
Ähnlichkeitsschwellenwerte die Qualität der vorgeschlagenen Übereinstimmung.
Die Transformationen für Fuzzysuchen und Fuzzygruppiererungen bilden nicht nur das Kernstück der
Funktionalität für das Verwalten eindeutiger Bezeichner, sie können auch in Verbindungen mit
anderen SSIS-Transformationen verwendet werden, um eine umfassende Datenintegrations-Lösung
zu erstellen. Die Transformation für Bedingtes Teilen etwa ermöglicht es Ihnen, einen
Eingabedatensatz in viele Ausgaben aufzuteilen, basierend auf Ihrer Geschäftslogik. Mit Hilfe dieser
Transformation können Sie Datensätze abhängig von ihrem Inhalt an ein Ziel oder mehrere Ziele
routen.
SSIS-Beispiel
Abbildung 1 zeigt eine SSIS-Lösung, die eine Transformation für Fuzzygruppierung
verwendet, um eindeutige Bezeichner für Kunden innerhalb einer Vielzahl von
Datenquellen zu verwalten.
Abbildung 1 – Eindeutige Bezeichner Verwalten
Die SSIS-Lösung führt die folgenden Schritte zum Verwalten eindeutiger Bezeichner aus:
1. Datenquellen – Als erstes wird für alle vier Datenquellen Verbindungsfähigkeit festgelegt: Eine
CRM OLE DB-Datenquelle, eine Verkäufe-OLE DB-Datenquelle, eine Call Center-Flatfile und
eine Kundenselbstbedienungs-xml-Datei. Für jede Datenquelle werden die Spalten der
eindeutigen Bezeichner für Vornamen, Nachnamen und das Quellsystem extrahiert. Die Spalten
für Vor- und Nachnamen werden die primären Eingaben der Datenbereinigungs-Logik sein. Auch,
wenn sie von den Quellen nicht gemeinsam verwendet werden, wurden die eindeutigen
Bezeichner des Quellsystems extrahiert, um Verknüpfungen zurück zur jeweiligen Quelle eines
jeden Datensatzes zu unterhalten. Diese Bezeichner werden durch alle Schritte des Datenflusses
hindurch unverändert bleiben.
2. Union All – Die Quelldaten werden anschließend in einem einzigen Datensatz unter Verwendung
der Transformation für Union All kombiniert. An diesem Punkt enthält der Datensatz eine
Mischung aus duplizierten und eindeutigen Daten.
3. Fuzzygruppierung – Die Transformation für Fuzzygruppierung konsumiert die gemischten
Quelldaten, definiert einen Referenz-Datensatz aus den Vor- und Nachnamen und versucht
dann, Datensätze an diesen Verweisdatensatz anzugleichen. Fuzzygruppierung an sich wurde
dahingehend konfiguriert, Datensätze mit einem Mindestschwellenwert für Ähnlichkeit unter 0,25
zu ignorieren. Dieser Schwellenwert muss, basierend auf den spezifischen Eigenschaften Ihrer
Quelldaten, neu eingestellt werden.
4. Bedingtes Teilen – Die Ausgabe der Transformation für Fuzzygruppierung wird dann an eine
Transformation für bedingtes Teilen gesendet, welche die Daten unter Identifizierung dreier
Datensätze bedingt ausführen wird.
 Gruppe 1 – Referenz-Datensätze. Dies sind die Datensätze, in denen das key_in-Feld
gleich dem key_out-Feld ist. Alle anderen Quelldatensätze wurden gegen diesen
Verweisdatensatz ausgewertet.
 Gruppe 2 – Duplizierte Datensätze. Dies sind Datensätze, die enge Übereinstimmungen
mit dem Referenz-Datensatz aufweisen. Eine enge Übereinstimmung ist eine Ähnlichkeit von

> 0,9. Sie haben die Möglichkeit, den Schwellenwert basierend auf Ihrem besonderen
Datensatz zu spezifizieren.
Gruppe 3 – Eindeutige Datensätze. Dies sind Datensätze, die keine enge Übereinstimmung
zum Referenz-Datensatz aufweisen, sie haben eine Ähnlichkeit von weniger als 0,9.
Aus Gründen der Abstimmungsflexibilität kann der Wert von 0,9 in diesem Beispiel
von einer Variablen definiert werden, die von einer XML-Konfigurationsdatei
bevölkert wird. Indem Sie den Schwellenwert getrennt von der Lösung unterhalten,
können Sie einfacher die SSIS-Lösung einstellen, nachdem Sie die Ergebnisse jeder
Ausführung eingesehen haben.
5. Datenziele – Aus Gründen der Veranschaulichung wurde jede der von der Transformation für
bedingtes Teilen erstellten Gruppen in ein anderes Ziel geladen. Im einem realen Szenario
würden Sie die Referenz-Datensätze verbinden, um eine Stammliste von eindeutigen
Kundendatensätzen zu erstellen.
Bereinigungs-Attribute
Während eindeutige Bezeichner Ihnen dabei helfen, duplizierte Datensätze zu
bereinigen, werden Sie wahrscheinlich auch Funktionalität benötigen, um Ihre
Datenattribute zu bereinigen. In vielen Situationen müssen Sie Datenbereinigung
ausführen, um widersprüchliche Attribute innerhalb verschiedener Datenquellen zu
verwalten.
Betrachten Sie das folgende Beispiel. Sie beginnen mit dem Erstellen einer Partner-DMDLösung, die Partnerdaten aus Ihrem CRM-System integriert, Vertriebssystem und dem
Profilsystem. Jedes System enthält verschiedene Attribute, die sowohl den Partner
beschreiben, als auch überschneidende Attribute, die sich widersprechen. Ein solches
Attribut ist die Industrieklassifizierung des Partners. Jedes Quellsystem enthält eine
Industrieklassifizierung für einen Partner, die in vielen Fällen von System zu System
anders ist. Beispielsweise hat Contoso, eine Große Hotelkette, eine
Industrieklassifizierung Gastronomie im Vertriebssystem, eine Klassifizierung
Einzelhandel im Partnerprofil und keine Klassifizierung im Partner-CRM-System. Um mit
diesen sich überschneidenden Attributen umzugehen, werden Geschäftsregeln
gebraucht, die spezifizieren, wie die Konflikte gelöst werden sollen.
Beispielsweise können Geschäftsregeln die Ordnung einer Rangfolge eines Quellsystems
wie folgt definieren:

Vertrieb – Wenn eine Vertriebsindustrieklassifizierung für den Partner besteht, sollte
Sie als Hauptklassifizierung Vorrang erhalten.

Partner-Profil – Wenn die Vertriebsindustrieklassifizierung leer ist, sollte die
Partner-Profil-Industrie verwendet werden.

CRM – Wenn die beiden vorhergehenden Klassifizierungen leer sind, sollte die CRMIndustrie verwendet werden.
Um widersprüchliche Attribute aufzulösen, sollten Sie eine Integrationslösung erstellen,
die Daten aus den CRM-, Vertriebs-, und Partner-Systemen vermischt, verschiedene
Attribute aus jedem System erhält und dann Geschäftsregeln anwendet, um die
widersprüchlichen Industrieklassifizierungen zu bewältigen.
Lösung
SSIS bietet eine große Bandbreite von Möglichkeiten, um Geschäftsregeln für die
Bereinigung von Attributsdaten anzuwenden. Eine Transformation, die Transformation
für Abgeleitete Spalten, beweist vor allen anderen eine hohe Flexibilität im Anwenden
von Geschäfts-Logik.
Die Transformation für Abgeleitete Spalten wird unter Verwendung eines Ausdrucks
definiert. Dieser Ausdruck, der benutzerdefiniert werden kann, kann eine Kombination
von Operatoren, Funktionen und Variablen enthalten, um die Quelldaten zu bearbeiten.
Im eigentlichen Sinne kann die Transformation für Abgeleitete Spalten wirklich als eine
Konsolidierung von vielen verschiedenen Transformationstypen in einer leicht
verwendbaren Einheit betrachtet werden.
Wenn Sie Attributsdaten bereinigen, werden Sie einen Satz bedingter Geschäftsregeln
implementieren wollen, um den bestmöglichen Datensatz festzulegen. Im Partner-MDMSzenario wird der Ausdruck der abgeleiteten Spalten die bedingten Geschäftsregeln
enthalten, die bestimmen, welche Industrieklassifizierung angewendet werden sollte.
Wenn die Geschäftsregel durch einen Ausdruck definiert wurde, können Sie entweder die
abgeleiteten Spalten verwenden, um eine Spalte in den Quelldaten zu ersetzen, oder
eine neue Spalte dem Datenfluss hinzufügen. Im Partenr-MDM-Szenario wird eine neue
Spalte, genannt Stammindustrieklassifizierung, dem Datenfluss hinzugefügt werden.
Obwohl eine neue Stammspalte hinzugefügt wurde, um die Konflikte zu lösen, werden
die Industrieklassifizierungen der Quellsysteme weiterhin in separaten Spalten
gespeichert werden, um ein komplettes Datensatz-System zu ermöglichen.
SSIS-Beispiel
Abbildung 2 zeigt eine beispielhafte SSIS-Lösung, die eine Transformation für
Abgeleitete Spalten verwendet, um Attributsdaten zu bereinigen.
In diesem Beispiel einer Partner-MDM-Lösung müssen Sie Geschäftsregeln anwenden,
die jedem Partner eine Stammindustrieklassifizierung zuweisen. Im Gegensatz zum
vorhergegangenen Beispiel besteht bereits eine universelle Partner-ID, damit Sie auf
einfache Art Daten aus verschiedenen Systemen zusammenbringen können.
Abbildung 2 – Attribute bereinigen
Die SSIS-Lösung verwendet die folgenden Schritte zur Bereinigung von Attributen:
1. Quelldaten-Verbindungsfähigkeit – Anfangs werden Partnerdaten aus einer CRM-OLE DBDatenquelle, einer Vertriebs-OLE DB-Datenquelle und einer Partner-Profil-Flatfile extrahiert. In
diesem Beispiel werden nur die Partner ID und Industrieklassifizierung in den Datenfluss
extrahiert. In einem realen Szenario würden Sie die Möglichkeit wahrscheinlich dafür nutzen,
zusätzliche benötigte Datenattribute aus jedem der Quellsysteme zu extrahieren.
2. Zusammenführungsverknüpfung – Die Daten aus jeder Datenquelle werden dann unter
Verwendung der Transformation für Zusammenführungsverknüpfung verknüpft. Um einen
kompletten Partner-Datensatz zu erhalten wird innerhalb der Systeme eine volle äußere
Verknüpfung verwendet. Zusammenführungsverknüpfungen werden detaillierter in dem Beispiel
Kategorisierung von Einheiten-Aktivitäten beschrieben.
3. Abgeleitete Spalte –Angewendet auf einen kompletten Datensatz verwendet die Transformation
für Abgeleitete Spalten bedingte Logik, um eine neue Stammindustrieklassifizierung zu erstellen.
Der Ausdruck für dieses Beispiel könnte so aussehen:
ISNULL ([SalesIndustry])? ISNULL ([CRMIndustry])? [PartnerProfileIndustry]: [CRMIndustry]:
[SalesIndustry]
Obwohl die Geschäftsregeln spezifizieren, wie die Stammindustrieklassifizierung zu erstellen ist,
ist ein neues Problem aufgetaucht. Die Industrieklassifizierungen innerhalb der Systeme
verwenden leicht abweichende Benennungsstandards und produzieren so eine höchst ungleiche
Liste von Industrien. Beispielsweise kann die Industrie-Liste die folgenden Werte haben: Banking,
Financial Services – Banking, and FinServ_Banking. Um eine einheitliche Liste von Industrien zu
produzieren, können Sie die Transformation für Fuzzysuche verwenden, um die Liste zu
bereinigen.
4. Fuzzysuche – Um die Benennungsprobleme zu lösen, vergleicht die Transformation die
Stammindustrieklassifizierung mit einer Verweisliste von Industrien.
5. Bedingtes Teilen – Die Ausgabe der Transformation für Fuzzysuche wird dann an eine
Transformation für Bedingtes Teilen gesendet, die zwei Datengruppen produziert, basierend auf
dem Schwellenwert für Ähnlichkeit:
 Gruppe 1 – Enge Übereinstimmung. Diese Datensätze haben einen Schwellenwert von >
0,9 und zeigen so an, dass eine enge Übereinstimmung zwischen den Quelldaten und der
Industrie-Verweistabelle erfolgt ist.
 Gruppe 2 – Keine enge Übereinstimmung. Diese Datensätze haben einen Schwellenwert
von <0,9 und zeigen so an, dass keine enge Übereinstimmung gefunden wurde. In diesem
Szenario würden die Stammindustrieklassifikationen bleiben, wie sie sind.
6. Datenziele - In diesem Beispiel wurde jede der Gruppen in ein anderes Ziel geladen. In der
realen Welt könnten Sie Bedingtes Teilen durch eine andere Transformation für Abgeleitete
Spalten ersetzen, welche die Stammindustrieklassifizierung jedes mal, wenn eine enge
Übereinstimmung besteht, aktualisiert.
Einheiten-Aktivitäten kategorisieren
Wie Sie bereits gesehen haben, bedeutet das Erstellen einer Stammgeschäftseinheit
typischerweise Konsolidierung von Daten aus verschiedensten Quellsystemen. Wenn Sie
einen Mechanismus identifiziert haben, um Daten zu überbrücken und zu bereinigen,
können Sie damit beginnen, die Einheit zu kategorisieren, basierend darauf, in welche
Typen von Transaktionen oder Aktivitäten die Einheit involviert ist. Beispielsweise
können typische Aktivitäten von Wiederverkäufern das Verkaufen von Produkten und die
Teilnahme an Wiederverkäufer-Partnerprogrammen bedeuten. Das Kategorisieren von
Wiederverkäufern auf Grund ihrer Einbindung in eine oder beide dieser Aktivitäten kann
Ihnen helfen, Marketing-Investitionen zu optimieren, Wachstumschancen zu
identifizieren und bessere Beziehungen zu Ihren Wiederverkäufern und Kunden zu
etablieren.
In vielen Unternehmen geschehen diese Kategorisierungen in einem Data Warehouse.
Wenn Sie diese Informationen bereits in einem Data Warehouse gespeichert haben,
können Sie dieses Data Warehouse einfach als eine weitere Datenquelle für Ihre MDMAnwendung übernehmen. Wenn Sie diese Informationen nicht bereits verfügbar haben,
können Sie Logik in Ihre SSIS-Datenflüsse aufnehmen, um Daten basierend auf Ihren
Bedürfnissen zu aggregieren und zu kategorisieren.
In diesem speziellen Szenario bestehen die Anforderungen darin, Wiederverkäufer unter
Verwendung der folgenden Logik zu kategorisieren:

Teilnehmen und Verkaufen – Wiederverkäufer, die an dem Programm
teilnehmen und in den letzten 12 Monaten Verkäufe tätigten.

Teilnehmen und Nicht Verkaufen – Wiederverkäufer, die an dem Programm
teilnehmen und in den letzten 12 Monaten keinen Verkauf tätigten.

Kein Teilnehmen und Verkaufen – Wiederverkäufer, die nicht an dem
Programm teilnehmen und keine Verkäufe in den letzten 12 Monaten tätigten.
Lösung
Wenn Sie mit Transaktionsdaten arbeiten, werden Sie häufig die Daten aggregieren
müssen, bevor Sie sie in Ihre MDM-Anwendung aufnehmen. Innerhalb von SSIS gibt es
eine Transformation für Aggregieren, die Funktionalität bietet, um Datensätze unter
Verwendung von Funktionen wie sum, min, max, average, und distinct count zu
summieren. Sie können auch die Detail-Ebene konfigurieren, auf der SSIS die
Aggregation ausführen soll, indem Sie Gruppen nach Feldern spezifizieren.
Zusätzlich zur Aggregation werden Sie auch darauf große Aufmerksamkeit verwenden
müssen, wie Sie Daten innerhalb Ihres Quellsystems verknüpfen, um sicherzustellen,
dass sie den korrekten Datensatz erhalten. Wenn Sie Daten in SSIS verknüpfen, werden
Sie häufig die Transformation für Zusammenführungsverknüpfung verwenden.
Zusammenführungsverknüpfungen können eine Vielzahl von Verknüpfungstypen
ausführen, wie innere Verknüpfungen, rechte äußere Verknüpfungen, linke äußere
Verknüpfungen und vollständige äußere Verknüpfungen. In diesem bestimmten Szenario
verwenden Sie eine volle äußere Verknüpfung, um eine komplette Liste der
Wiederverkäufer aus beiden Quellsystemen zu erstellen. Wenn Sie eine
Gleichheitsverknüpfung oder innere Verknüpfung zwischen zwei Quellen erstellen
würden, bekämen Sie nur die Wiederverkäufer zurück, die sich in beiden Systemen
befinden. Wie in den Geschäftsregeln festgelegt, verfügen nicht alle Wiederverkäufer im
Wiederverkäufer-Programm über Verkaufstransaktionen und umgekehrt. Eine volle
äußere Verknüpfung ermöglicht es Ihnen, den kompletten Datensatz für die weitere
Verarbeitung wiederzubringen.
SSIS-Beispiel
Abbildung 3 zeigt das Beispiel einer SSIS-Lösung, das zeigt, wie Sie die
Transformationen für Aggregieren und Zusammenführungsverknüpfung verwenden
können, um Wiederverkäufer basierend auf Transaktionsdaten zu kategorisieren.
Abbildung 3 – Einheiten-Aktivitäten kategorisieren
Die SSIS-Lösung verwendet die folgenden Schritte, um die Einheiten-Aktivitäten zu
kategorisieren.
1. Datenquellen – Zu Beginn werden die Wiederverkäuferdaten aus einer VertriebsOLE DB-Datenquelle und einer Liste von Teilnehmenden Wiederverkäufern in Flatfiles
extrahiert.
2. Aggregieren – Da sich die Verkaufsdaten im Quellsystem auf Transaktionsebene
befinden, sind sie granulierter als für diese Lösung erforderlich. Um die Detailebene
einzustellen, nimmt die Transformation für Aggregieren die Verkaufsdaten der letzten
12 Monate und summiert sie nach Wiederverkäufer.
3. Zusammenführungsverknüpfung –Eine volle Zusammenführungsverknüpfung
bringt die teilnehmenden Wiederverkäufer mit den Wiederverkäufern des
Vertriebssystems zusammen. Die Daten werden unter Verwendung einer
Wiederverkäufer-ID verknüpft, die von beiden Systemen gemeinsam verwendet
wird. Als Ausgabe der vollständigen äußeren Verknüpfung werden zwei Felder eine
wichtige Rolle bei der Kategorisierung der Wiederverkäufer spielen: Das
Wiederverkäufer-ID-Feld des Vertriebssystems und das Wiederverkäufer-ID-Feld aus
der Wiederverkäufer-Programmdatei. Diese beiden Felder werden die gleichen Werte
haben, wenn Wiederverkäufer in sowohl den Verkaufsdaten, als auch den
Wiederverkäufer-Programmdaten gefunden werden. Die Verkäufe-WiederverkäuferID wird NULL sein, wenn ein Wiederverkäufer an dem Programm teilnimmt, aber
keine Verkäufe hat. Die Programm-Wiederverkäufer-ID wird NULL sein, wenn ein
Wiederverkäufer Verkäufe hat, aber an dem Programm teilnimmt.
4. Bedingtes Teilen – Bedingtes Teilen leitet die Wiederverkäufer an eine der drei
Gruppen, basierend auf den Ergebnissen der Zusammenführungsverknüpfung:

Gruppe 1 – Teilnehmen und Verkaufen – Diese Wiederverkäufer haben NOT
NULL-Werte für die Verkäufe-Wiederverkäufer-ID und die ProgrammWiederverkäufer-ID.

Gruppe 2 – Teilnehmen und Nicht Verkaufen– Diese Wiederverkäufer haben
einen NULL-Wert für die Verkäufe-Wiederverkäufer-ID und einen NOT NULL-Wert
für die Programm-Wiederverkäufer-ID.

Gruppe 3 – Nicht Teilnehmen und Verkaufen- Diese Wiederverkäufer haben
einen NOT NULL-Wert für die Verkäufe-Wiederverkäufer-ID und einen NULL-Wert
für die Programm-Wiederverkäufer-ID.
5. Datenziele – Wie in den vorhergegangenen Beispielen wird jede Gruppe nur zu
Demonstrationszwecken in ein anderes Ziel geladen. In einem echten Szenario
können Sie die Transformation für Bedingtes Teilen durch eine einfache
Transformation für Abgeleitete Spalten ersetzen, welche die gleiche bedingte Logik
enthält wie sie in Schritt 4 spezifiziert wird, um eine neue Kategorisierungs-Spalte in
die Datenausgabe aufzunehmen.
Attribute Extrahieren
Zusätzlich zum Ableiten interessanter Attribute von Transaktionsdaten zur Erfüllung der
Ansprüche mancher MDM-Anwendungen, ist es eventuell nötig, dass Sie Attribute
extrahieren müssen, die in einen Text oder eine Datenquelle eingebettet sind.
Beispielsweise können Sie Produkt-Feedback extrahieren, das in der Bemerkungen-
Spalte eines Fehlersuchsystems enthalten ist, oder Informationen über Fähigkeiten, die
in Lebensläufen von Angestellten enthalten sind. Um diese Art von Informationen zu
extrahieren benötigt es einen stabilen Mechanismus, um effizient feststellen zu können,
ob Attribute von Bedeutung sind.
Betrachten wir das folgende Beispiel. Ein Kundensystem eines Call Centers enthält die
Probleme, Klagen und generelle Fragen von Kunden, die Produkte und Dienstleistungen
betreffen. Als Teil des standardisierten Kunden-Support-Prozesses erstellt jeder
Supportmitarbeiter ein Kundenprofil und verfolgt alle mit dem Kundenanruf verbundenen
Aktivitäten nach. Beispielsweise erstellen die Mitarbeiter ein Profil für eine
Kundenunterstützung unter Verwendung von strukturierten Attributen wie des fraglichen
Produkts oder der fraglichen Dienstleistung, die Art des Problems und die Priorität des
Problems. Um diese strukturierten Attribute zu vervollständigen verwenden sie auch ein
Textfeld für Freitext, um andere relevante Informationen wie einen Kommentar, eine
spezifische Kundenrückmeldung, besondere Umstände des Anlasses für die Hilfesuche
oder generelle Beobachtungen zu speichern.
Das manuelle Ableiten bedeutender Informationen aus dem Kommentarfeld kann sich
als schwierig erweisen, angesichts der potentiell großen Datenmengen im Textfeld, der
heterogenen Natur seines Inhalts und der Unmöglichkeit, diese Informationen mit einer
erfolgreichen oder missglückten Support-Aktivität zu verknüpfen. Deshalb brauchen Sie
eine systematische Lösung, die potentiell aussagkräftige Attribute entdecken kann.
Lösung
Um Ihnen dabei zu helfen, die Probleme, die mit dem Extrahieren von Attributen aus
Textdaten verbunden sind, zu beseitigen, bietet SSIS Text Mining-Funktionalität, damit
Sie Geschäftsbegriffe aus Textfeldern extrahieren können. Genauer gesagt bietet SSIS
zwei Transformationen, die Text Mining-Funktionalität verwenden: Ausdruckssuche und
Ausdrucksextrahierung.

Ausdruckssuche ist hilfreich, wenn Sie eine bestehende Liste von
Verweisausdrücken haben, nach denen Sie in Ihrem Quelldatensatz suchen möchten.
Um die Bedeutung zu beurteilen, verfügt die Transformation für Ausdruckssuche
über einen Häufigkeitswert, der die Anzahl von Erscheinungen eines
Referenzausdrucks in den Quelldaten wiedergibt. Abhängig von Ihrem Szenario
möchten Sie vielleicht Datensätze bedingt ausführen, basierend auf ihrem
Häufigkeitswert. Beispielsweise ist es möglich, dass Sie nur Ausdrücke akzeptieren,
die mehr als zwei mal erscheinen.

Ausdrucksextrahierung ist nützlich, wenn Sie nicht bereits über eine Liste von
Ausdrücken verfügen, aber ein Wörterbuch mit Ausdrucks-Kandidaten erstellen
möchten, nach denen sie später suchen werden. Um diese Kandidaten zu entdecken,
teilt die Transformation für Ausdrucksextrahierung als erstes den Textdaten in
Ausdrücke auf und zählt anschließend die Anzahl der Erscheinungen für jeden
Ausdruck. Um die Ausdrucksextrahierung anzupassen, können Sie konfigurieren, wie
SSIS einen Ausdruck definiert, ob es Nomen berücksichtigen soll, Nominalphrasen,
oder beides, und Sie können konfigurieren, welche Schlüsselbegriffe ausgeschlossen
werden sollen. Sie können auch andere Parameter, die SSIS verwendet, um Muster
zu finden, konfigurieren, wie etwa die nötige Anzahl der Erwähnungen, bis ein
Ausdruck extrahiert wird. Um die Qualität der entdeckten Muster anzuzeigen,
verwendet die Transformation für Ausdrucksextrahierung ein Ergebnis, um die
Anzahl der Erscheinungen eines Ausdrucks in den Quelldaten zu beschreiben. Dieses
Ergebnis kann als reine Häufigkeit ausgedrückt werden oder als normalisierter Wert.
Abhängig von den Eigenschaften Ihrer Quelldaten werden Sie wahrscheinlich einige
Iterationen der Transformation für Ausdrucksextrahierung ausführen, um zu
bestimmen, ob ein Attribut wirklich aussagekräftig ist.
Um Attribute wie in dem beschriebenen Call Center-Szenario aus einem Kommentarfeld
zu extrahieren, werden Sie die Transformation für Ausdrucksextrahierung verwenden,
um zusätzliche Charakteristiken zur Profilerstellung zu entdecken.
SSIS-Beispiel
Abbildung 4 zeigt eine SSIS-Lösung, welche die Transformation für
Ausdrucksextrahierung verwendet, um potentiell interessante Muster in einem
Kommentarfeld zu entdecken.
Abbildung 4 –Attribute extrahieren
Die SSIS-Lösung führt die folgenden Schritte aus, um neue Attribute zu entdecken:
1. Quelldaten – Zu Anfang werden die Call Center-Textdaten aus einer OLE DBDatenquelle geladen.
2. Ausdrucksextrahierung – Die Transformation für Ausdrucksextrahierung wird auf
die Bemerkungen-Spalte angewendet und produziert zwei Ausgaben: Ausdruck und
Ergebnis. Die Transformation wurde wie folgt konfiguriert:

Extrahieren von Nomen und Phrasen.

Zählen der Ausdrucks-Häufigkeit.

Extrahieren der Ausdrücke, die einen Schwellenwert von zwei oder mehr
Erscheinungen treffen oder übersteigen.

Ausschließen bekannter Wörter oder “Störwörter“. Für dieses Szenario können
die folgenden Störwörter identifiziert werden: Kunde, Projekt, Lösung und
Möglichkeit.
3. Bedingtes Teilen – Basierend auf dem abgeleiteten Ergebnis der Transformation für
Ausdrucksextrahierung werden zwei Datengruppen erstellt – Gruppe 1 enthält
Ausdrücke, die häufig erscheinen, und Gruppe 2 enthält selten erscheinende
Ausdrücke. In diesem Szenario wurde ein häufig wiederkehrender Begriff mit einem
Ergebnis von 5 oder mehr identifiziert. Gruppe 2 enthält Ausdrücke, die ein Ergebnis
von 2 bis 4 haben.
4. Datenziel – Zum Zwecke der Veranschaulichung wurde jede der Ausdrucksgruppen
in ein anderes Ziel geladen. Anhand der Identifizierung von Ausdrücken mit häufiger
Erwähnung können Sie diese Ausdrücke weitergehend untersuchen, um zu
bestimmen, ob sie aussagekräftige Attribute darstellen. In diesem Szenario könnten
Sie beispielsweise feststellen, dass die Namen gewisser Zulieferer häufig in einem
Bemerkungsfeld erscheinen. Da Informationen über Zulieferer augenblicklich über
kein eigenes Profil in Ihrem Call Center-System verfügen, möchten Sie eventuell ein
neues Attribut zur Profilerstellung schaffen, das Einbeziehung von Partnern heißt, um
Drittanbieter nach zu verfolgen, die an Supportereignis teilhaben.
Der Wert von SSIS-Transformationen für Text Mining besteht in der Leichtigkeit, mit der
sie einfach in die regulären Aktivitäten der Datenintegration einer jeden MDM-Lösung
eingebaut werden können. Um das Call Center-Szenario noch etwas zu erweitern,
können Sie die neuen Attribute zur Einbeziehung von Partnern in den folgenden MDMLösungen verwenden:

Als Bestandteil einer Kunden-MDM-Lösung können Sie die Beziehungen zwischen
Kunden und Partnern in einem Profil erfassen.

Als Bestandteil einer Produkt-MDM-Lösung können Sie die Beziehungen zwischen
Produkten und unterstützenden Partnern identifizieren.

Als Bestandteil einer Partner-MDM-Lösung können Sie solche Partner
identifizieren, die in erfolgreiche und fehlgeschlagene Ereignisse der
Kundenunterstützung involviert sind.
Schlussfolgerung
SSIS bietet eine umfassende Plattform zur Datenintegration, um effektiv und effizient
die Integrationsprobleme von MDM-Anwendungen zu lösen. Dies wird erreicht durch:

Bereitstellen einer großen Bandbreite von Datentransformations- und BereinigungsFunktionalität, um eindeutige Bezeichner, Attribute und Transaktionsdaten zu
verwalten.

Bereitstellen einer umfassenden, stabilen und skalierbaren Plattform und einem Satz
von Entwicklungswerkzeugen, um großskalierte Integrationslösungen zu entwerfen
und zu verwalten.

Maximieren der ROI durch die niedrigsten Gesamtanschaffungskosten im Vergleich
mit konkurrenzfähigen Plattformen.
Die Autoren
Elizabeth Vitt, Intellimentum
Elizabeth Vitt verfügt über eine zehnjährige Erfahrung in Unternehmensentwicklung,
Projektmanagement und Schulung von Business Intelligence. Ihre Erfahrungen in der Industrie
beinhalten BI-Implementierungen im Handel, der verarbeitenden Industrie und
Finanzdienstleistungen. Sie verfügt über spezialisierte Erfahrung als Ausbilderin in Data
Warehousing, ETL, und OLAP-Entwurf und Implementierung. Frau Vitt ist Autorin für Microsoft
Official Curriculum-Kurse für Microsoft Business Intelligence-Produkte, sowie für Microsoft Press,
Business Intelligence: Making Better Decisions Faster. Im Zuge der Veröffentlichung von SQL Server
2005 hat Frau Vitt SQL Server 2005 für Early Adopter-Unternehmen erfolgreich implementiert.
Hitachi Consulting
Hitachi Consulting, das globale Beratungsunternehmen von Hitachi, Ltd. (NYSE: HIT), ist
führend als Lieferant von Unternehmens- und IT-Lösungen an Global 2000-Unternehmen
aus den verschiedensten Industrien. Hitachi Consulting setzt seine jahrzehntelangen
Erfahrungen in Unternehmensprozessen, vertikaler Industrie und neuesten Technologien
ein, um die ganz speziellen geschäftlichen Bedürfnisse eines jeden Unternehmens zu
verstehen. Von der Entwicklung von Unternehmensstrategien bis zur
Anwendungsbereitstellung widmen sich die Hitachi-Berater dem Ziel, ihren Klienten
dabei zu helfen, schnell messbare Unternehmenswerte wahrzunehmen und eine
zukunftsfähige Kapitalrendite zu erreichen.
Hitachi Consulting ist ein Microsoft Certified Gold Partner für Business Intelligence und
ein exklusiver Anbieter von Lehrplänen und Schulungspersonal für das Microsoft SQL
Server 2005 Business Intelligence Ascend Trainingsprogramm. Hitachi Consulting ist
auch ein erfahrener Systemintegrator und hat SQL Server 2005 BI erfolgreich bei
Firmen, die an dem Microsoft Technology Adoption Program (TAP) teilnehmen,
implementiert.
Hitachi Consulting bietet eine kundenorientierte, gemeinschaftliche Herangehensweise
und vollzieht in jedem Engagement Wissenstranfers. Für weiter Informationen besuchen
Sie bitte www.hitachiconsulting.com.
Hitachi Consulting—Inspiring your next success®
Herunterladen