Data Quality Service Dienstleistungsangebot

Werbung
A LT R A N , G LO BA L L EA D E R
I N I N N OVAT I O N
DATENQUALITÄT UND DATENBEREINIGUNG
Februar
2017
1
DQS
Beschreibung
DQS Prozess
Data Quality Services
Ihre geschäftlichen Entscheidungen
sind von vertrauenswürdigen Daten
abhängig.
Ungültige Datenwerte,
Inkonsistenzen und doppelte
Geschäftsentitäten, aber auch
einfach nur unterschiedliche
Schreibweisen können zu Fehlern in
Reporting und Analyse führen.
Wir helfen Ihnen bei der
Sicherstellung der notwendigen
Datenqualität!
2
Vorgehensweise
Altran auf einen
Blick
Portfolio
Kontakt
DQS
Beschreibung
DQS Prozess
Vorgehensweise
Altran auf einen
Blick
Portfolio
Datenqualität und Datenbereinigung
Wir unterscheiden zwischen:
• Data Quality Services
◦ Data Cleansing
◦ Data Matching
• Master Data Services
Beispiel: Es gibt drei unterschiedliche Adressen für einen Kunden
• Data Quality Services stellen sicher, dass es tatsächliche, valide Adressen sind
◦ wie zB, dass Stadt x tatsächlich in Bundesland y ist
• Master Data Services sagen mir in welcher der drei Städte der Kunde tatsächlich wohnt
• Master Data Services operieren an der jeweiligen Entität
◦ das ist die definitive Version von dieser Entität
• Data Quality Services operieren auf Spaltenebene und validieren mir ob das korrekte Werte sind
3
Kontakt
DQS
Beschreibung
DQS Prozess
Vorgehensweise
Altran auf einen
Blick
Portfolio
Das Data Quality Problem
• Geschäftliche Entscheidungen sind von vertrauenswürdigen Daten abhängig
• Probleme in der Datenqualität können zu falschem Reporting und Analysen führen
◦ Ungültige Daten Werte (zB „Oberöstereich“)
◦ Inkonsistenzen (zB „Oberösterreich“ und „OÖ“)
◦ Doppelte „Business Entities“ (zB „Thomas Renner“, „Tom Renner“, „T Renner“)
• Data Quality Services ist eine knowledge-base Lösung für
◦ Data Cleansing (neu, ungültig, korrigiert, richtig)
◦ Data Matching (exakte Übereinstimmung, näherungsweise Übereinstimmung)
4
Kontakt
DQS
Beschreibung
DQS Prozess
Vorgehensweise
Altran auf einen
Blick
Knowledge Bases und Domains
• Knowledge Base:
◦ Ein Data Steward der die Daten versteht und weiß ob Werte valide sind
oder was typische Fehler sind (zB St. Plöten > St. Pölten)
◦ Knowledge Discovery – Hilfe beim Erkennen der Daten und dadurch beim
Regel erstellen
◦ Domain validation rules (zB Postleitzahl hat 4 Stellen in Österreich und 5 in
Deutschland)
◦ Domain correction rules(zB OÖ = Oberösterreich)
◦ Matching rules (Wie wird Gleichheit von Datensätzen erkannt)
• Domains:
◦ Spezifisch für ein Datenfeld (typischerweise Spalten)
◦ Enthält Werte und Validierungsregeln
− valid (zB „Oberösterreich“ und „OÖ“ für ein Bundesland)
− invalid (zB „3100“ für eine Stadt)
−Error ( zB „Oberöstereich“ für ein Bundesland)
◦ Definiert Regeln um Werte zu führenden Werten zu korrigieren
5
Portfolio
Kontakt
DQS
Beschreibung
DQS Prozess
Vorgehensweise
Altran auf einen
Blick
Data Cleansing Projekte
1.
2.
3.
4.
Knowledege base aussuchen
Daten Spalten mit Domains verbinden
Vorschläge und Korrekturen überprüfen
Ergebnisse exportieren
Wenn Daten regelmäßig importiert werden ist auch eine Integration in den
Importprozess der SQL Server Integration Services (SSIS) möglich
DQS Cleansing Task
6
Portfolio
Kontakt
DQS
Beschreibung
DQS Prozess
Vorgehensweise
Altran auf einen
Blick
Portfolio
Kontakt
Data Matching
• Definieren von „matching rules“ für Geschäfts-Entitäten in einer „matching policy“
◦ Hier kann man mögliche Übereinstimmungen mit einer Wahrscheinlichkeit bewerten und gemäß
definierter Schwellwerten auswerfen
• Regeln vergleichen Entitäten mit Domains
◦ Similarity: Ähnliche oder exakte Übereinstimmungen
◦ Weight: Prozentsatz wenn es eine Übereinstimmung gibt
◦ Prerequisites: obligatorische Übereinstimmungsregel zwischen Domäne und Entität
Wenn die kombinierte Gewichtung von allen Übereinstimmungen einen definierten Schwellenwert
übersteigt dann sind die Entitäten Duplikate!
7
DQS
DQS Prozess
8
Beschreibung
DQS Prozess
Vorgehensweise
Altran auf einen
Blick
Portfolio
Kontakt
DQS
Beschreibung
DQS Prozess
Vorgehensweise
Altran auf einen
Blick
Portfolio
Vorgehensweise / Projektstruktur
Projektmanagement
9
Infrastruktur
Kickoff
Workshop
Ist Situation
erheben
Projekt planen
Möglichkeiten
aufzeigen
Projekt
controlling
Projekt
abschließen
Analyse
Knowledge
Base
Konzeption
Implementierung
Use Cases
definieren
Datenzugriff
implementieren
Domains
definieren
Data Quality
KPIs festlegen
Datenkorrektur
implementieren
Infrastruktur
Entscheidung
getroffen
Referenzdaten
aufbauen
Reports
definieren
Reports
erstellen
Infrastruktur
ausbauen
Knowledge
Discovery
durchführen
Rollenbeschreibungen
erstellen
Infrastruktur
betreiben
Analyse
abgeschlossen
aufbauen
Kontakt
DQS
Beschreibung
DQS Prozess
Altran auf einen
Blick
Vorgehensweise
Portfolio
Kontakt
Altran auf einen Blick
Altran ist ein globaler Leader in Innovation und High-Tech-Engineering. Die Mission des Konzerns ist es, Unternehmen beim
Entwickeln neuer Produkte und Services zu unterstützen. Als strategischer Partner unterstützt Altran die globalen Projekte seiner
Kunden während gleichzeitig auf die lokale Betreuung Wert gelegt wird.
EUROPA
—
ASIEN
—
AMERIKA
—
Österreich, Belgien, Deutschland,
Frankreich, Italien, Luxemburg,
Niederlande, Norwegen, Portugal,
Schweden, Schweiz, Spanien,
Vereinigtes Königreich
China, Indien,
Malaysia, Mittlerer Osten
Kanada, Mexiko,
Vereinigte Staaten von Amerika,
IN N OVATION
über
10
10
30 Jahre
Erfahrung für eine bessere Zukunft
IN N OVATION MAKERS*
30.000
*MitarbeiterInnen der Altran Gruppe
DQS
Beschreibung
DQS Prozess
Vorgehensweise
Altran auf einen
Blick
Portfolio
Portfolio
B usine s s
I nt ellige n c e &
Adv a nc ed
Ana ly t ic s
Digit a le
Tra nsfo rm a t io n
STRATEGIE- &
UNTERNEHMENSBERATUNG
 Bewusstsein schaffen für
digitale Transformation
 Entwicklung
organisatorischer Strategien
und Taktiken zum Umgang
mit digitaler Transformation
 Begleitung und Umsetzung
von Projekten zur digitalen
Transformation
11
VONUNTERNEHMENS-DATEN ZU
GESCHÄFTSRELEVANTEN
INFORMATIONEN










Big Data
Reporting
Dashboards
Predictive Analysis
Data Warehouse / Cubes
Data & Text Mining
Machine Learning
Visualization
Data Quality Services
Azure Cognitive Services
Datenbanken
DATENMANAGEMENT &
DATENINTEGRATION
Digit a l
Wo rk pla c e
ALLE WERKZEUGE FÜR
ZUSAMMENARBEIT IM
UNTERNEHMEN
 Datenbank Administration  Intranet und Extranet Lösungen zur
Unterstützung von
 Performance Tuning
Geschäftsprozessen mit SharePoint
 ETL (Extract – Transform –
(Wissens-, Dokumenten-, Projekt- und
Load)
Angebotsmanagement, etc.)
 OLAP (Online
 Datenbankgestützte
Analytical Processing)
(Web)Applikationen mit APEX
 Migrationen
 Campus Online
 Sizing
 Flexible Bereitstellung on premise
oder über Clouddienste (Office 365,
Azure, Oracle Cloud)
Kontakt
DQS
Beschreibung
DQS Prozess
Vorgehensweise
Kontaktdaten
Mag. Thomas Renner
Business Development Manager
Altran Concept Tech GmbH
Niederlassung Wien
BahnhofCity Wien Westbahnhof
Europaplatz 2/1/2
A-1150 Wien
Mobile: +43 (664) 809 351 88
[email protected]
www.altran.at
12
Altran auf einen
Blick
Portfolio
Kontakt
INNOVATION MAKERS
Herunterladen