MatchUp® Object

Werbung
Eliminiert Dubletten und beseitigt
unnötige Daten
DUPLETTEN ENTDECKEN
Löschen Sie doppelte Datensätze aus Ihrer Datenbank, so
dass sie eine einzige umfassende Sicht auf Ihre Kunden
erhalten. Die 12 Matching-Algorithmen von MatchUp
Object eliminieren Dubletten aus Ihren Dateien. So
verbessern Sie Vertrieb, Marketing und Analyse.
MatchUp® Object
Identifiziert und entfernt Dubletten
Melissa Data ist seit fast drei Jahrzehnten weltweit führender Partner zahlreicher Fortune 500
Nutzen:
Unternehmen bei der Kontaktdatenüberprüfung. Unsere fachspezifischen Kenntnisse haben
MatchUp® zu einer leistungsstarken API zur Bereinigung von Dubletten
(zusammenführen/bereinigen) in Daten und Adressen gemacht. Dabei nutzt sie verschiedene
• Reduzieren der durch Dubletten
entstehenden Kosten
Wege, um Dubletten zu identifizieren. MatchUp eliminiert Dubletten, die in unterschiedlichen
Formaten und unterschiedlichen Namens-, Adress- und Stadt/Land/ZIP™-Strukturen vorliegen,
ohne dass Sie die Formate zeitaufwändig vereinheitlichen müssen.
• Genauere, umfassende Ansicht
Ihrer Kundendaten
Fuzzy Algorithms
Fuzzy-Matching ist ein fortschrittlicher Prozess, mit dem schwer erkennbare Dubletten, die
nicht 100 % übereinstimmen, identifiziert werden. MatchUp verwendet mehr als ein
Dutzend unterschiedliche Algorithmen während des Fuzzy-Matching-Prozesses:
• Phonetisches Matching. Verwendet den phonetischen Algorithmus für eine
unscharfe Suche – auch bekannt als „Double Metaphone“-Methode. Erkennt gleich
klingende Wörter.
• N-Gramm- oder Q-Gramm-basierender Algorithmus. Die linearen auf N-gramm
bzw. Q-Gramm basierenden Algorithmen-Modelle werden hauptsächlich bei der
statistischen Aufbereitung der natürlichen Sprache genutzt. Ein N-Gramm ist eine
Teilsequenz von „n Elementen“ einer vorhandenen Sequenz, das können Phoneme,
Silben, Buchstaben, Wörter oder Basenpaare sein.
• Jaro-Winkler-Algorithmus. Die Jaro-Winkler-Distanz gibt den Grad der Ähnlichkeit
zwischen zwei Zeichenketten wieder. Er wird in erster Linie im Bereich der
Datensatzverbindung zur Dublettenerkennung verwendet.
• MD Keyboard. Ein von Melissa Data entwickelter Algorithmus, der falsche
Tastatureingaben zählt. Hierbei kommt es zu einem gewichteten Abzug auf Grundlage
der Unterschiedlichkeit der falschen und korrekten Eingabe und es wird ein Prozentsatz
für Ähnlichkeit der verglichenen Zeichenfolgen bestimmt.
• Containment. Führt Datensätze zusammen, bei denen eine Komponente Bestandteil
eines anderen ist. Beispielsweise ist „Smith“ Bestandteil von „Smithfield“.
• Identifizieren mehrerer Datensätze,
die zu einer Adresse gehören
• Schnelle Verarbeitung: 10–50
Millionen Datensätze pro Stunde
• Einfach zu verwenden – beseitigt
regelbasierte Zuordnung
Probieren Sie MatchUp noch heute kostenlos aus!
MatchUp wurde mit fachspezifischem Wissen über Kontaktdaten entwickelt. Wir haben
unsere Erfahrung aus den letzten fast drei Jahrzehnten Arbeit mit Adressen und Namen
genutzt, um kontaktspezifische Regeln zu erstellen. Diese Arbeit können Sie sich sparen.
>> HIER BEKOMMEN SIE EINE KOSTENFREIE TESTVERSION: www.MelissaData.com/match-de
Fuzzy Algorithmen – Fortsetzung
• Frequency. Die Zeichen in einer Datensatz-Komponente entsprechen den Zeichen
in einer anderen, ohne dass dabei die Reihenfolge berücksichtigt wird. Zum Beispiel
“abcdef” würde mit “badcfe” übereinstimmen.
• Fast Near. Ein typografischer Matching-Algorithmus. Dieser funktioniert am besten
Funktionen:
beim Abgleich von Wörtern, die aufgrund typografischer Fehler nicht
übereinstimmen. Eine Skala von 1 bis 4 definiert, wie viele Fehler erlaubt sind
(1 liefert das genaueste Ergebnis).
• Multiplattformfähig (Windows,
Linux, Solaris, AIX, HPUX)
• Accurate Near. Ein typografischer Matching-Algorithmus, der bessere Ergebnisse
als Fast Near erzielt, dafür aber langsamer ist.
• Frequency Near. Ähnlich wie das Zuordnen über Frequency, außer dass Sie bei
diesem Algorithmus definieren können, mit wie vielen Buchstaben sich die
• Verarbeitet Dateien mit unter
schiedlichen Feldstrukturen
Komponenten unterscheiden dürfen.
• Vowels Only. Es werden nur Vokale verglichen. Konsonanten werden aus den
Suchkriterien gelöscht.
• Native, Java-, Ruby-, Perl-, Python-,
PHP-Integration
• Consonants Only. Es werden nur Konsonanten verglichen. Vokale werden aus den
Suchkriterien gelöscht.
• Alphas Only. Es werden nur Buchstaben verglichen.
• Numerics Only. Es werden nur Zahlen verglichen. Dezimalzahlen und Vorzeichen
• Vergibt Prioritäten für die
Dublettenentfernung
werden als numerische Zeichen betrachtet.
Matching-Szenarien
• Haushalt. Gruppiert Daten über vordefinierte Kriterien, z. B. alle Bewohner eines
Haushalts werden als eine Gruppe gezählt.
• Proximity Matching. Gruppiert Datensätze, die geografisch eng beieinander liegen.
• Listeüberschneidungen/-unterdrückung. Findet alle gemeinsamen Daten mehrerer
Listen und findet Daten, die einmalig in einzelnen Listen vorkommen.
• Flexible Matching. Bearbeitet über 35 vordefinierte Datentypen wie Adresse,
E-Mail-Adresse, Sozialversicherungsnummer usw. und erlaubt bis zu 16 kaskadierende
Regelsätze.
• Point Of Entry/Batch. Beobachtet eingehende Datensätze in Echtzeit, so dass Sie
einmalige akzeptieren und Dubletten ablehnen können.
• Geschwindigkeit/Skalierbarkeit. MatchUp ist mehrfach sicher und für jede Dateigröße
skalierbar
Fachspezifisches Wissen
MatchUp stützt sich auf die jahrelange Erfahrung von Melissa Data bei der Arbeit mit
zahlreichen Kontaktdaten und deren Eigenheiten. Dies hat dazu beigetragen, dass wir
Regeln und Logiken erstellen können, mit denen Adress-Unklarheiten, Spitznamen,
Abkürzungen und unterschiedliche Formatierungen gehandhabt werden können.
• Teilt Felder mit Namen, Adressen
und Stadt/Land/Zip® auf
Drei Möglichkeiten, Dubletten aus Ihren Kontaktdaten zu entfernen:
1. Lesen/Schreiben-Dublettenentfernung – Vergleicht Datensätze in einer oder mehreren
Datenbanken gleichzeitig. Jede einzelne Gruppe erhält einen Datensatz, der einen
„Output“-Status erhält. Die anderen passenden Datensätze erhalten einen
„Dubletten“-Status. Eignet sich ideal für das Zusammenführen, Bereinigen und
Unterdrücken bestehender Daten in der Stapelverarbeitung.
MatchUp
Object
Input Datenbanken
Output
Dubletten
2. Inkrementelle Dublettenentfernung – Vergleicht jeden eingehenden Datensatz mit
einer Datenbank, die bereits verarbeitete Datensätze beinhaltet. Eignet sich ideal für die
Dateneingabe in Echtzeit. Wenn der eingehende Datensatz neu ist, wird er der bestehenden
Datenbank hinzugefügt.
Über Melissa Data Corp.
Melissa Data ist seit 1985 ein
führender Anbieter von
Call Center
Datenqualitäts- und
MatchUp
Object
Adressmanagementlösungen. Die
Datenqualitätslösungen,
Cloud-Services und
Webformulare
Datenbanken
3. Hybride Dublettenentfernung – Gibt Ihnen die Flexibilität, den Prozess dann
anzupassen, wenn in Ihrer Umgebung eine interne Schlüsselspeicherung oder kleinere
Einheiten von Datensätzen verglichen werden müssen. Ideal für Dateneingabe in
Echtzeit oder zur Verarbeitung ganzer Listen im Stapel.
Datenintegrationskomponenten
von Melissa Data untersuchen,
standardisieren, konsolidieren,
erweitern und aktualisieren
amerikanische sowie weltweite
Kontaktdaten, inklusive Adressen,
Telefonnummern und
E-Mail-Adressen. Anwender können
Webformulare
Datenbanken
Call Center
MatchUp
Object
so ihre Kommunikation und ihren
ROI verbessern. Mehr als 10.000
Unternehmen verlassen sich auf
Melissa Data, um eine genauere,
Datensätze gruppieren
umfassende und sichere Ansicht
auf kritische Informationsbestände
Matchcode Editor
MatchUp bietet mit Matchcode Editor auch eine separate grafische Benutzerschnittstelle,
mit der eine persönliche Matchcode-Datenbank eingerichtet werden kann. Haben Sie
einmal benutzerspezifische Matchcodes entwickelt, die gut mit Ihren Daten
funktionieren, können diese jederzeit und kontinuierlich genutzt werden.
Systemanforderungen
Multiplattform-fähige API - Bibliothek verfügbar für Windows 2003/2008 7/8.x; Red Hat;
Solaris: SPARC; AIX: Power, rs/6000, PPC; HPUX: PA-RISC und Itanium.
Cloud Web Service - unterstützt mehrere Protokolle, inclusive JSON, SOAP, XML und REST
zu erzielen und zu verwalten.
1-800-MELISSA
www.MelissaData.com
Find us on:
Twitter: @melissadata
Facebook.com/melissadata
linkedin.com/company/melissa-data
© 2015 Melissa Data Corp. 071415
Herunterladen