Integration Services – Übersicht Integration Services – Übersicht Integration Services stellt umfangreiche integrierte Tasks, Container, Transformationen und Datenadapter für die En twicklung von Geschäftsanwendungen bereit. Ohne eine einzige Codezeile zu schreiben, können Sie SSIS -Lösungen erstellen, die komplexe Geschäftsprobleme mithilfe von ETL und Business Intelligence lösen, SQL Server -Datenbanken verwalten und SQL Server-Objekte zwischen Instanzen von SQL Server k opieren. Zusammenführen von Daten aus heterogenen Datenspeichern Auffüllen von Data Warehouses und Data Marts Cleanup und Standardisierung von Da ten Integrieren von Business Intelligence in einen Datentransformationsprozess Automatisieren administrativer Funktionen und des Vorgangs zum Laden von D aten Typische Verwendungen von SQL Server Integration Services Integration Services stellt umfangreiche integrierte Tasks, Container, Transformationen und Datenadapter für die Entwicklung von Geschäftsanwendungen bereit. Ohne eine einzige Codezeile zu schreiben, können Sie SSIS-Lösungen erstellen, die komplexe Geschäftsprobleme mithilfe von ETL und Business Intelligence lösen, SQL Server-Datenbanken verwalten und SQL Server-Objekte zwischen Instanzen von SQL Server kopieren. Die folgenden Szenarien beschreiben typische Verwendungen von SSIS -Paketen. Zusammenführen von Daten aus heterogenen Datenspeichern Daten werden in der Regel in vielen ver- Quellen und das Zusammenführen zu einem schiedenen Datenspeichersystemen gespei- einzelnen, konsistenten Dataset ist eine Her- chert. Das Extrahieren von Daten aus diesen ausforderung. Für diese Situation gibt es verschiedene Ursachen. Beispiel: Viele Organisationen archivieren Informationen, die in LegacyDatenspeicherungssystemen gespeichert sind. Diese Daten mögen für alltägliche Geschäftsabläufe keine Rolle spielen. Für die Trendanalyse, bei der Daten über einen langen Zeitraum gesammelt werden müssen, können sie allerdings wichtig sein. Die Abteilungen einer Organisation verwenden verschiedene Datenspeicherungstechnologien zum Speichern der Betriebsdaten. Das Paket muss möglicherweise Da- ten aus Kalkulationstabellen sowie relationalen Datenbanken extrahieren, damit die Daten zusammengeführt werden können. Die Daten sind möglicherweise in Datenbanken gespeichert, die für dieselben Daten verschiedene Schemas verwenden. Das Paket muss möglicherweise den Datentyp einer Spalte ändern oder Daten aus mehreren Spalten zu einer einzelnen Spalte zusammenfassen, damit die Daten zusammengeführt werden können. Integration Services kann auf ein breites Dateien und Analysis Services-Projekte mög- Spektrum von Datenquellen zugreifen, ein- lich. schließlich mehrerer Quellen in einem ein- Integration Services schließt Quellkompo- zelnen Paket. Ein Paket kann mithilfe von nenten .NET- und OLE DB-Anbietern auf relationale Kalkulationstabellen, XML-Dokumenten so- Datenbank zugreifen und mithilfe von ODBC- wie Tabellen und Sichten in relationalen Da- Treibern auf viele Legacydatenbanken. Au- tenbank Daten aus der Datenquelle extrahie- ßerdem ist der Zugriff auf Flatfiles, Excel- ren, auf die das Paket zugreift. ein, die aus Flatfiles, Excel- Im nächsten Schritt werden die Daten meist angewendet wurden, werden die Daten in mithilfe der Transformationen von Integrati- der Regel in mindestens ein Ziel geladen. on Services transformiert. Nachdem die Da- Integration Services schließt Ziele zum Laden ten in kompatible Formate transformiert von Daten in Flatfiles, Rohdateien und relati- wurden, können sie physisch zu einem ein- onale Datenbanken ein. Die Daten können zelnen Dataset zusammengeführt werden. außerdem in ein Recordset im Arbeitsspei- Nachdem die Daten erfolgreich zusammen- cher geladen und von anderen Paketelemen- geführt und Transformationen auf die Daten ten abgerufen werden. Auffüllen von Data Warehouses und Data Marts Die Daten in Data Warehouses und Data tenquelle einen separaten Prozess zu ver- Marts werden normalerweise häufig aktuali- wenden. siert, und die typische Arbeitsauslastung ist Das Aktualisieren von Daten in Data Wa- sehr hoch. Integration Services schließt einen Task ein, rehouses und Data Marts kann komplex sein. der Daten per Massenladen direkt aus einer lerweise langsam veränderliche Dimensio- Flatfile in SQL Server-Tabellen und -Sichten nen, die mit einem Datentransformations- lädt. Darüber hinaus ist eine Zielkomponente prozess möglicherweise schwierig zu verwal- vorhanden, die als letzten Schritt eines ten sind. Der Assistent für langsam veränder- Transformationsprozesses Daten per Mas- liche Dimensionen automatisiert die Unter- senkopieren in eine SQL Server-Datenbank stützung für langsam veränderliche Dimensi- lädt. onen. Mit diesem Assistenten werden die Ein SSIS-Paket kann so konfiguriert werden, SQL-Anweisungen dynamisch erstellt, die dass es erneut gestartet werden kann. Das Datensätze einfügen und aktualisieren, ver- heißt, das Paket kann von einem vordefinier- bundene Datensätze aktualisieren und Tabel- ten Prüfpunkt aus (ein Task oder ein Contai- len neue Spalten hinzufügen. ner im Paket) ausgeführt werden. Die Mög- Darüber hinaus können Tasks und Transfor- lichkeit des Neustarts eines Pakets kann viel mationen in Integration Services-Paketen Zeit sparen, insbesondere wenn das Paket Cubes und Dimensionen von Analysis Ser- Daten aus sehr vielen Quellen verarbeitet. vices verarbeiten. Wenn das Paket Tabellen Mithilfe von SSIS-Paketen können Sie die in der Datenbank aktualisiert, auf der ein Dimensions- und Faktentabellen in der Da- Cube basiert, können Sie mit Tasks und tenbank laden. Falls die Quelldaten für eine Transformationen von Integration Services Dimensionstabelle in mehreren Datenquel- den Cube automatisch verarbeiten sowie len gespeichert sind, kann das Paket die Da- Dimensionen verarbeiten. Durch das auto- ten zu einem einzelnen Dataset zusammen- matische Verarbeiten der Cubes und Dimen- führen und die Dimensionstabelle in einem sionen sind die Daten für Benutzer in beiden einzelnen Prozess laden, statt für jede Da- Umgebungen stets auf dem aktuellen Stand: Beide Datenspeichertypen enthalten norma- Für Benutzer, die auf Informationen in den nen gespeichert sind, kann das SSIS-Paket Cubes und Dimensionen zugreifen, und für Funktionen berechnen, wie z. B. SUM, AVG Benutzer, die auf Daten in einer relationalen und COUNT. Eine SSIS-Transformation kann Datenbank zugreifen. relationale Daten pivotieren und in ein weni- Integration Services kann außerdem Funkti- ger normalisiertes Format transformieren, onen berechnen, bevor die Daten in das Ziel das mit der Tabellenstruktur im Data Wa- geladen werden. Falls in den Data Warehou- rehouse kompatibler ist. ses und Data Marts aggregierte Informatio- Cleanup und Standardisierung von Daten Für Daten ist unabhängig davon, ob sie in eine OLTP (Online Transaction Processing)- oder eine OLAP-Datenbank (Online Analytic Processing), eine Excel-Kalkulationstabelle oder eine Datei geladen werden, vorher ein Cleanup und eine Standardisierung erforderlich. Das Update von Daten kann aus folgenden Gründen erforderlich sein: Daten stammen aus mehreren Abteilungen einer Organisation, die jeweils unterschiedliche Konventionen und Standards verwenden. Bevor die Daten verwendet werden können, müssen sie möglicherweise umformatiert werden. Beispielsweise kann es sein, dass der Vor- und Nachname in einer einzelnen Spalte zusammengefasst werden muss. Die Daten sind gemietet oder gekauft. Bevor die Daten verwendet werden können, ist möglicherweise eine Standardisierung und ein Cleanup erforderlich, um Unternehmensstandards zu erfüllen. Dies trifft beispielsweise zu, wenn eine Organisation überprüfen möchte, ob in allen Datensätzen die gleichen Abkürzungen für den Staat oder die gleichen Produktnamen verwendet werden. Daten sind gebietsschemaspezifisch. Beispielsweise können in den Daten verschiedene Formate für Datum/Uhrzeit und Zahlen verwendet werden. Wenn Daten von unterschiedlichen Gebietsschemas zusammengeführt werden, müssen sie vor dem Laden in ein einzelnes Gebietsschema konvertiert werden, um die Beschädigung der Daten zu vermeiden. integrierte ständigen Namen verketten und anschlie- Transformationen ein, die Sie Paketen hinzu- ßend die Zeichen in Großbuchstaben ändern. Integration Services schließt fügen können, um ein Cleanup und eine Ein Paket von Integration Services kann au- Standardisierung von Daten vorzunehmen, ßerdem ein Cleanup für Daten ausführen, die Groß-/Kleinschreibung von Daten zu än- indem die Werte in Spalten durch Werte aus dern, Daten in einen anderen Datentyp oder ein anderes Format zu konvertieren oder neue Spaltenwerte basierend auf Ausdrü- einer Verweistabelle ersetzt werden, wobei mithilfe einer genauen Suche oder einer Fuzzysuche nach Werten in einer Verweista- cken zu erstellen. Beispielsweise könnte das belle gesucht wird. Paket die Spalten für Vorname und Nachna- Häufig wendet ein Paket zunächst eine ge- me zu einer einzelnen Spalte mit dem voll- naue Suche an. Falls ein Fehler gemeldet wird, wird dann eine Fuzzysuche ausgeführt. Eine andere Transformation führt ein Beispielsweise versucht das Paket zuerst Cleanup für Daten aus, indem ähnliche Wer- mithilfe des Primärschlüsselwerts des Pro- te in einem Dataset gruppiert werden. Hier- dukts einen Produktnamen in der Verweista- mit können doppelte Datensätze identifiziert belle zu suchen. Wenn bei dieser Suche kein werden, die nicht ohne weitere Auswertung Produktname zurückgegeben wird, wird die in die Datenbank eingefügt werden sollten. Suche erneut ausgeführt, dieses Mal jedoch Wenn z. B. Adressen in Kundendatensätzen mithilfe der Fuzzyübereinstimmung für den verglichen werden, werden möglicherweise Produktnamen. doppelte Kunden identifiziert. Integrieren von Business Intelligence in einen Datentransformationsprozess Für einen Datentransformationsprozess ist mengefasst, konvertiert und verteilt werden. integrierte Logik erforderlich, um dynamisch Dabei kann es sogar sein, dass Daten basie- auf die zugegriffenen und verarbeiteten Da- rend auf einer Bewertung von Spaltenwerten ten zu reagieren. Möglicherweise müssen die abgelehnt werden müssen. Daten basierend auf Datenwerten zusamZu diesem Zweck muss die Logik im SSIS -Paket möglicherweise die folgenden Aufgaben ausführen: Zusammenführen von Daten aus mehreren Datenquellen. Auswerten von Daten und Anwenden von Datenkonvertierungen. Teilen eines Datasets in mehrere Datasets basierend auf Datenwerten. Anwenden unterschiedlicher Aggregationen auf verschiedene Teilmengen eines Datasets. Laden von Datenteilmengen in verschiedene oder mehrere Ziele. Integration Services stellt Container, Tasks Business Intelligence in Pakete integrieren. und Transformationen zum Integrieren von Beispielsweise können mit dem Wert eines Business Intelligence in SSIS-Pakete bereit. Container unterstützen die Wiederholung Eingabeparameters die Daten gefiltert wer- von Workflows durch Aufzählen für Dateien Transformationen können Ausdrücke aus- oder Objekte und durch Auswerten von Aus- werten und dann basierend auf den Ergeb- drücken. Ein Paket kann Daten auswerten nissen Zeilen in einem Dataset an verschie- und Workflows basierend auf Ergebnissen dene Ziele senden. Nachdem die Daten ge- wiederholen. Wenn z. B. die Daten vom ak- teilt wurden, kann das Paket verschiedene tuellen Monat stammen, führt das Paket Transformationen auf jede Teilmenge des bestimmte Tasks aus; andernfalls werden Datasets anwenden. Beispielsweise kann ein andere Tasks ausgeführt. Tasks, die Eingabe- Ausdruck eine Datumsspalte auswerten, die parameter verwenden, können ebenfalls Verkaufsdaten für den entsprechenden Zeit- den, die ein Task abruft. raum hinzufügen und anschließend nur die Transformationsgruppe die Daten zusam- Zusammenfassungsinformationen speichern. menfassen, während eine andere Transfor- Sie können auch ein Dataset an mehrere mationsgruppe die Daten erweitert, indem Ziele senden und dann verschiedene Grup- Werte in Verweistabellen gesucht und Daten pen von Transformationen auf dieselben aus anderen Quellen hinzugefügt werden. Daten anwenden. Beispielsweise kann eine Automatisieren administrativer Funktionen und des Vorgangs zum Laden von Daten Administratoren automatisieren häufig ad- nachdem Sie Transformationen auf die Spal- ministrative Funktionen. Dazu zählen das tendaten angewendet haben. Sichern und Wiederherstellen von Daten- Mit einem Integration Services-Paket können banken, das Kopieren von SQL Server- andere Pakete ausgeführt werden. Eine Da- Datenbanken und den darin enthaltenen tentransformationslösung, die viele admi- Objekten, das Kopieren von SQL Server- nistrative Funktionen einschließt, kann in Objekten sowie das Laden von Daten. Hierzu mehrere Pakete aufgeteilt werden, um das können Pakete von Integration Services ver- Verwalten und Wiederverwenden der Pakete wendet werden. Integration Services enthält speziell entwor- zu vereinfachen. fene Tasks für das Kopieren von SQL Server- nen auf verschiedenen Servern ausführen Datenbankobjekten, wie z. B. Tabellen, Sich- müssen, können Sie Pakete verwenden. Ein ten und gespeicherten Prozeduren; für das Paket kann mithilfe von Schleifen eine Enu- Kopieren von SQL Server-Objekten, wie z. B. meration für die Server ausführen und die- Datenbanken, Anmeldenamen und Statisti- selben Funktionen auf mehreren Computern ken; und für das Hinzufügen, Ändern und ausführen. Zur Unterstützung der Administ- Löschen von SQL Server-Objekten und - ration von SQL Server wird in Integration Daten Services ein Enumerator bereitgestellt, der mithilfe von Transact-SQL- Falls Sie dieselben administrativen Funktio- Anweisungen. eine Iteration für SMO-Objekte (SQL Server Die Administration einer OLTP- oder OLAP- Management Objects) ausführt. Beispiels- Datenbankumgebung schließt oft das Mas- weise kann ein Paket mithilfe des SMO- senladen von Daten ein. Integration Services Enumerators enthält mehrere Tasks, die das Massenkopie- Funktionen für jeden Auftrag in der Jobs- ren von Daten vereinfachen. Mit einem Task Auflistung einer Installation von SQL Server können Sie Daten aus Textdateien direkt in ausführen. SQL Server-Tabellen und -Sichten laden. Mit SSIS-Pakete können außerdem mithilfe von einer Zielkomponente können Sie Daten in Aufträgen des SQL Server-Agents geplant SQL Server-Tabellen und -Sichten laden, werden. dieselben administrativen Comelio GmbH Goethestraße 34 13086 Berlin Tel.: 030-8145622-00 | Fax: 030-8145622-10 Web: www.comelio.com | E -Mail: [email protected]