CONTENT ANALYTICS: VON UNSTRUKTURIERTEN INHALTEN

Werbung
SOFTWAREENTWICKLUNG
ALLE INDUSTRIEN
BUSINESS SOLUTION
CONTENT ANALYTICS: VON
UNSTRUKTURIERTEN INHALTEN
ZU WERTVOLLEM WISSEN
BUSINESS SOLUTION
WAS IST CONTENT ANALYTICS? Content Analytics, auf Deutsch die
«Analyse von Inhalten», beschreibt die Anwendung von Business-Intelligence-Verfahren und Analyse-Methoden auf digitale Inhalte.
Die sinnvolle Nutzung von Content ist heutzutage eine unumgängliche
Voraussetzung, da im Durchschnitt geschätzt 80% der täglich verwalteten Informationen in einer Organisation in unstrukturierter Form vorliegen – wie Textdokumente, Bilder, Audio- oder Videoinhalte. Da die
Mehrheit solcher Informationen entweder als Text entwickelt wurde
oder zu Text konvertiert wird, ist die automatische, computergestützte
Verarbeitung natürlicher Sprache – das «Natural Language Processing»
(NLP) – ein Schlüsselfaktor für Content Analytics.
›› NLP ist eine Disziplin, die seit mehr als 50 Jahren entwickelt wird und
die künstliche Intelligenz, Linguistik und Statistik kombiniert. Verteidigungsinstitutionen trieben NLP voran, da gerade in diesem Gebiet die
Fähigkeit sehr wichtig ist, menschliche Interaktion möglichst schnell
durchsuchen, transkribieren, zusammenfassen und übersetzen zu können. Heutzutage wird die NLP-Technologie in vielen Branchen und
Bereichen angewendet, z.B. im Digitalen Marketing, im Finanzbereich,
in Call-Centern etc.
›› Mit umfassenden wahrscheinlichkeitstheoretischen Ansätzen und
numerischen Evaluationsmetriken erschliesst NLP die verborgene
Semantik/Bedeutung unstrukturierter Informationsquellen, das können unter anderem Freitextdokumente, Mikroblogs oder Telefongespräche sein. In anderen Worten bietet NLP den Schlüssel, um Daten
von unterschiedlichen Herkunftsquellen in Wissen zu konvertieren,
d.h. in verwert- und umsetzbares Wissen («actionable intelligence»).
›› Und das ist nur ein Teil der Geschichte: Dank der Möglichkeiten,
gesprochene Sprache zu verstehen, ist es auch möglich, den Inhalt,
das Geschlecht und die Identität eines Sprechers aufgrund von Multimediadateien, zum Beispiel Audiodateien, zu identifizieren.
›› Auch gescannte Dokumente können verarbeitet werden, indem sie mithilfe der optischen Zeichenerkennung («Optical Character Recognition», OCR) maschinenlesbar gemacht werden. Bildverarbeitende Techniken werden für die Gesichtserkennung von Foto- und Videomaterial
angewendet («closed-circuit television», CCTV).
«Mit ihrem umfangreichen
Wissen im Umfeld von NLP,
Suchtechnologien und statistischen Herangehensweisen
hilft ELCA Unternehmen,
unstrukturierte Informationen
sinnvoll zu nutzen – von internen Dokumenten über soziale
Netzwerke bis hin zu Audiodateien.»
Silvia Quarteroni, Manager und NLP-Expertin von ELCA
SOFTWAREENTWICKLUNG
ALLE INDUSTRIEN
WAS UNSERE LÖSUNG IHNEN BIETET
Mit ihrem umfangreichen Wissen und Erfahrungen im Umfeld von
NLP, Suchtechnologien und verwandten Lösungen, unterstützt ELCA
Unternehmen dabei, die Content-Analytics-Technologie wirksam einzusetzen und so alle Arten von unstrukturierten Informationen nutzen zu
können.
DIE KUNDEN UND ANWENDER unserer Lösungen sind Organisationen, die unstrukturierte Daten analysieren und in verwertbare Informationen und konkretes Wissen umwandeln müssen. NLP ist eine
wertvolle Kompetenz für Unternehmen, die beispielsweise viele interne
Dokumente für das Records-Management oder interne Berichte (Banken, Versicherungen, öffentliche Verwaltung) lesen bzw. prüfen müssen oder für Unternehmen, die einen bestimmten Markt im Auge
behalten sowie schnell auf Kunden-Feedback (B2C) reagieren müssen.
Die neue Applikation von ELCA für die Analyse von sozialen Netzwerken ist zudem speziell auf den öffentlichen Sektor sowie Nichtstaatliche- und Non-Profit-Organisationen ausgerichtet.
DAS ELCA-DASHBOARD für Content Analytics aggregiert Informationen von News-Websites und sozialen Netzwerken in suchbasierte
Applikationen, einschliesslich:
›› Freitextsuche in News, Blogs und Tweets
›› automatisches Extrahieren von Personen, Plätzen und Organisationen,
die dynamische Such- und Navigationsfilter werden
›› effektive Visualisierung von Themen, Einheiten und Beziehungen via
Tag-Clouds und Netzwerk-Grafiken
›› Sentiment-Analyse auf Twitter in Echtzeit
Monitoring/Profiling sozialer Netzwerke
Viele Institutionen sind daran interessiert,
Nutzer sozialer Netzwerken zu analysieren –
beispielsweise jene User, die ein gemeinsames Interesse für eine bestimmte Organisation, Person oder Thematik haben (z. B.
«Personen, die Beiträge zu Big Data verfassen», «Personen, die @BarackObama erwähnen oder entsprechende Tweets weiterverbreiten»).
Mit der «Social-Networking-Profiling»-Applikation von ELCA können Sie Folgendes beobachten und bestimmen:
›› die aktivsten Follower eines bestimmten
Profils
›› das wahrscheinlichste «Sentiment» (Bewertung des Themas, z.B. nach positiv, neutral,
negativ), den Ort, die Altersgruppe und das
Geschlecht eines Nutzers
›› die Evolution von Themen im zeitlichen
Verlauf
›› periodisch Berichte über interessante Profile erhalten mit detaillierten Informationen
über die Follower, Meinungsführer und einflussreiche Social-Media-Nachrichten und
-Botschaften.
Automatische Kategorisierung
Automatische Klassifikation/
Gruppierung von Textinhalten.
Analyse sozialer Netzwerke
Monitoring und Analyse über Themen und
Inhalte in sozialen Netzwerken.
Verstehen gesprochener Sprache
Spracherkennung von Audiodateien,
Identifikation wesentlicher Stichwörter,
Transkription des Texts und Suchfunktion.
Beantwortung von Fragen
Präzise Antworten auf Fragen, ohne
persönliche relevante Dokumente.
Analyse von Bildern
Texterkennung auch in mangelhaft
gescannten Dokumenten,
Gesichtserkennung in Bildern usw.
Automatische Übersetzung
Suche nach Informationen in
verschiedenen Sprachen.
CONTENT
ANALYTICS
DOC
Enterprise Search
Effiziente und sachgemässe Suche auch für
den Inhalt unstrukturierter Dokumente.
All-source connectors
Verbindung aller Informationsquellen wie Dateisysteme,
Webseiten, Netzwerke, Datenbanken usw.,
um Inhalte zu sammeln.
Named Entity Recognition
Identifikation von Personen, Orten und Organisationen, die erwähnt werden – keine Listen
erforderlich!
GIS und Geo-Codierung
Auswertung und Darstellung geografischer Daten und Koordinaten auf
Karten.
Extraktion von Themen/Stichwörtern
Rasches Erfassen, Kennzeichnen und Zusammenfassen von Dokumenten, den wichtigsten Wörtern, Ausdrücken oder Themen.
Erkennen von Beziehungen
Erkennung und visuelle Darstellung von Beziehungen zwischen Einheiten,
innerhalb von Dokumenten und übergreifend; Nutzung des Semantic Web.
MASSGESCHNEIDERTE APPLIKATIONEN Für die Anforderungen
bestimmter Geschäftsszenarien bietet ELCA massgeschneiderte Lösungen und Anwendungen an, die die folgenden Bausteine kombinieren:
ELCA Informatique SA
Lausanne 021 613 21 11
Genève 022 307 15 11
›› Konnektoren zu Twitter, News, RSS-Feeds
›› Semantic-Web-Ressourcen wie DbPedia, GeoNames
ELCA Informatik AG
Zürich 044 456 32 11
Bern 031 556 63 11
›› Sprachanalyse (POS-Tagging, Chunking, Syntaxanalyse, N-Gram
Ex­traction)
www.elca.ch
›› Audio-Analyse (Spracherkennung, Keyword-Spotting, Speech-to-TextTranskription)
›› Bildanalyse (optische Zeichenerkennung, Gesichtserkennung)
›› Extrahieren von Informationen, Entdecken von Beziehungen, grafische
Visualisierungen
›› Suchmaschinen (u.a. Solr, Elasticsearch, Exalead)
›› Clustering und Klassifizierung mit Hilfe von Deep-Learning-Techniken
Clustering &
Klassifizierung
Spracherkennung,
Speech-to-Text
Bild­analyse
Sprach­
analyse
Verstehen von
gesprochener
Sprache
Semantik­
analyse
POS-Tagging/Chunking/
Syntaxanalyse
Named Entity Recognition
Extraktion von Beziehungen
DOC
Konnektoren
Solr, Exalead
Maschinelles Lernen
Soziale
Netze
Strukturierte
Daten
Datei­systeme
Webseiten
Über ELCA ­ELCA ist eines der grössten
Schweizer IT-Unternehmen und führend auf
den Gebieten Softwareentwicklung, Systemintegration, Business Consulting und Application Management. ELCA beschäftigt mehr
als 700 Mitarbeitende. Der Hauptsitz des
Unternehmens ist Lausanne, darüber hinaus
unterhält es Niederlassungen in Zürich,
Genf, Bern, Paris, Madrid und Ho-Chi-MinhStadt (Offshore-Entwicklung).
Q9/2013
OCR, Gesichtserkennung
Such­
maschinen
Herunterladen