A LT R A N , G LO BA L L EA D E R I N I N N OVAT I O N DATENQUALITÄT UND DATENBEREINIGUNG Februar 2017 1 DQS Beschreibung DQS Prozess Data Quality Services Ihre geschäftlichen Entscheidungen sind von vertrauenswürdigen Daten abhängig. Ungültige Datenwerte, Inkonsistenzen und doppelte Geschäftsentitäten, aber auch einfach nur unterschiedliche Schreibweisen können zu Fehlern in Reporting und Analyse führen. Wir helfen Ihnen bei der Sicherstellung der notwendigen Datenqualität! 2 Vorgehensweise Altran auf einen Blick Portfolio Kontakt DQS Beschreibung DQS Prozess Vorgehensweise Altran auf einen Blick Portfolio Datenqualität und Datenbereinigung Wir unterscheiden zwischen: • Data Quality Services ◦ Data Cleansing ◦ Data Matching • Master Data Services Beispiel: Es gibt drei unterschiedliche Adressen für einen Kunden • Data Quality Services stellen sicher, dass es tatsächliche, valide Adressen sind ◦ wie zB, dass Stadt x tatsächlich in Bundesland y ist • Master Data Services sagen mir in welcher der drei Städte der Kunde tatsächlich wohnt • Master Data Services operieren an der jeweiligen Entität ◦ das ist die definitive Version von dieser Entität • Data Quality Services operieren auf Spaltenebene und validieren mir ob das korrekte Werte sind 3 Kontakt DQS Beschreibung DQS Prozess Vorgehensweise Altran auf einen Blick Portfolio Das Data Quality Problem • Geschäftliche Entscheidungen sind von vertrauenswürdigen Daten abhängig • Probleme in der Datenqualität können zu falschem Reporting und Analysen führen ◦ Ungültige Daten Werte (zB „Oberöstereich“) ◦ Inkonsistenzen (zB „Oberösterreich“ und „OÖ“) ◦ Doppelte „Business Entities“ (zB „Thomas Renner“, „Tom Renner“, „T Renner“) • Data Quality Services ist eine knowledge-base Lösung für ◦ Data Cleansing (neu, ungültig, korrigiert, richtig) ◦ Data Matching (exakte Übereinstimmung, näherungsweise Übereinstimmung) 4 Kontakt DQS Beschreibung DQS Prozess Vorgehensweise Altran auf einen Blick Knowledge Bases und Domains • Knowledge Base: ◦ Ein Data Steward der die Daten versteht und weiß ob Werte valide sind oder was typische Fehler sind (zB St. Plöten > St. Pölten) ◦ Knowledge Discovery – Hilfe beim Erkennen der Daten und dadurch beim Regel erstellen ◦ Domain validation rules (zB Postleitzahl hat 4 Stellen in Österreich und 5 in Deutschland) ◦ Domain correction rules(zB OÖ = Oberösterreich) ◦ Matching rules (Wie wird Gleichheit von Datensätzen erkannt) • Domains: ◦ Spezifisch für ein Datenfeld (typischerweise Spalten) ◦ Enthält Werte und Validierungsregeln − valid (zB „Oberösterreich“ und „OÖ“ für ein Bundesland) − invalid (zB „3100“ für eine Stadt) −Error ( zB „Oberöstereich“ für ein Bundesland) ◦ Definiert Regeln um Werte zu führenden Werten zu korrigieren 5 Portfolio Kontakt DQS Beschreibung DQS Prozess Vorgehensweise Altran auf einen Blick Data Cleansing Projekte 1. 2. 3. 4. Knowledege base aussuchen Daten Spalten mit Domains verbinden Vorschläge und Korrekturen überprüfen Ergebnisse exportieren Wenn Daten regelmäßig importiert werden ist auch eine Integration in den Importprozess der SQL Server Integration Services (SSIS) möglich DQS Cleansing Task 6 Portfolio Kontakt DQS Beschreibung DQS Prozess Vorgehensweise Altran auf einen Blick Portfolio Kontakt Data Matching • Definieren von „matching rules“ für Geschäfts-Entitäten in einer „matching policy“ ◦ Hier kann man mögliche Übereinstimmungen mit einer Wahrscheinlichkeit bewerten und gemäß definierter Schwellwerten auswerfen • Regeln vergleichen Entitäten mit Domains ◦ Similarity: Ähnliche oder exakte Übereinstimmungen ◦ Weight: Prozentsatz wenn es eine Übereinstimmung gibt ◦ Prerequisites: obligatorische Übereinstimmungsregel zwischen Domäne und Entität Wenn die kombinierte Gewichtung von allen Übereinstimmungen einen definierten Schwellenwert übersteigt dann sind die Entitäten Duplikate! 7 DQS DQS Prozess 8 Beschreibung DQS Prozess Vorgehensweise Altran auf einen Blick Portfolio Kontakt DQS Beschreibung DQS Prozess Vorgehensweise Altran auf einen Blick Portfolio Vorgehensweise / Projektstruktur Projektmanagement 9 Infrastruktur Kickoff Workshop Ist Situation erheben Projekt planen Möglichkeiten aufzeigen Projekt controlling Projekt abschließen Analyse Knowledge Base Konzeption Implementierung Use Cases definieren Datenzugriff implementieren Domains definieren Data Quality KPIs festlegen Datenkorrektur implementieren Infrastruktur Entscheidung getroffen Referenzdaten aufbauen Reports definieren Reports erstellen Infrastruktur ausbauen Knowledge Discovery durchführen Rollenbeschreibungen erstellen Infrastruktur betreiben Analyse abgeschlossen aufbauen Kontakt DQS Beschreibung DQS Prozess Altran auf einen Blick Vorgehensweise Portfolio Kontakt Altran auf einen Blick Altran ist ein globaler Leader in Innovation und High-Tech-Engineering. Die Mission des Konzerns ist es, Unternehmen beim Entwickeln neuer Produkte und Services zu unterstützen. Als strategischer Partner unterstützt Altran die globalen Projekte seiner Kunden während gleichzeitig auf die lokale Betreuung Wert gelegt wird. EUROPA — ASIEN — AMERIKA — Österreich, Belgien, Deutschland, Frankreich, Italien, Luxemburg, Niederlande, Norwegen, Portugal, Schweden, Schweiz, Spanien, Vereinigtes Königreich China, Indien, Malaysia, Mittlerer Osten Kanada, Mexiko, Vereinigte Staaten von Amerika, IN N OVATION über 10 10 30 Jahre Erfahrung für eine bessere Zukunft IN N OVATION MAKERS* 30.000 *MitarbeiterInnen der Altran Gruppe DQS Beschreibung DQS Prozess Vorgehensweise Altran auf einen Blick Portfolio Portfolio B usine s s I nt ellige n c e & Adv a nc ed Ana ly t ic s Digit a le Tra nsfo rm a t io n STRATEGIE- & UNTERNEHMENSBERATUNG Bewusstsein schaffen für digitale Transformation Entwicklung organisatorischer Strategien und Taktiken zum Umgang mit digitaler Transformation Begleitung und Umsetzung von Projekten zur digitalen Transformation 11 VONUNTERNEHMENS-DATEN ZU GESCHÄFTSRELEVANTEN INFORMATIONEN Big Data Reporting Dashboards Predictive Analysis Data Warehouse / Cubes Data & Text Mining Machine Learning Visualization Data Quality Services Azure Cognitive Services Datenbanken DATENMANAGEMENT & DATENINTEGRATION Digit a l Wo rk pla c e ALLE WERKZEUGE FÜR ZUSAMMENARBEIT IM UNTERNEHMEN Datenbank Administration Intranet und Extranet Lösungen zur Unterstützung von Performance Tuning Geschäftsprozessen mit SharePoint ETL (Extract – Transform – (Wissens-, Dokumenten-, Projekt- und Load) Angebotsmanagement, etc.) OLAP (Online Datenbankgestützte Analytical Processing) (Web)Applikationen mit APEX Migrationen Campus Online Sizing Flexible Bereitstellung on premise oder über Clouddienste (Office 365, Azure, Oracle Cloud) Kontakt DQS Beschreibung DQS Prozess Vorgehensweise Kontaktdaten Mag. Thomas Renner Business Development Manager Altran Concept Tech GmbH Niederlassung Wien BahnhofCity Wien Westbahnhof Europaplatz 2/1/2 A-1150 Wien Mobile: +43 (664) 809 351 88 [email protected] www.altran.at 12 Altran auf einen Blick Portfolio Kontakt INNOVATION MAKERS