SOFTWAREENTWICKLUNG ALLE INDUSTRIEN BUSINESS SOLUTION CONTENT ANALYTICS: VON UNSTRUKTURIERTEN INHALTEN ZU WERTVOLLEM WISSEN BUSINESS SOLUTION WAS IST CONTENT ANALYTICS? Content Analytics, auf Deutsch die «Analyse von Inhalten», beschreibt die Anwendung von Business-Intelligence-Verfahren und Analyse-Methoden auf digitale Inhalte. Die sinnvolle Nutzung von Content ist heutzutage eine unumgängliche Voraussetzung, da im Durchschnitt geschätzt 80% der täglich verwalteten Informationen in einer Organisation in unstrukturierter Form vorliegen – wie Textdokumente, Bilder, Audio- oder Videoinhalte. Da die Mehrheit solcher Informationen entweder als Text entwickelt wurde oder zu Text konvertiert wird, ist die automatische, computergestützte Verarbeitung natürlicher Sprache – das «Natural Language Processing» (NLP) – ein Schlüsselfaktor für Content Analytics. ›› NLP ist eine Disziplin, die seit mehr als 50 Jahren entwickelt wird und die künstliche Intelligenz, Linguistik und Statistik kombiniert. Verteidigungsinstitutionen trieben NLP voran, da gerade in diesem Gebiet die Fähigkeit sehr wichtig ist, menschliche Interaktion möglichst schnell durchsuchen, transkribieren, zusammenfassen und übersetzen zu können. Heutzutage wird die NLP-Technologie in vielen Branchen und Bereichen angewendet, z.B. im Digitalen Marketing, im Finanzbereich, in Call-Centern etc. ›› Mit umfassenden wahrscheinlichkeitstheoretischen Ansätzen und numerischen Evaluationsmetriken erschliesst NLP die verborgene Semantik/Bedeutung unstrukturierter Informationsquellen, das können unter anderem Freitextdokumente, Mikroblogs oder Telefongespräche sein. In anderen Worten bietet NLP den Schlüssel, um Daten von unterschiedlichen Herkunftsquellen in Wissen zu konvertieren, d.h. in verwert- und umsetzbares Wissen («actionable intelligence»). ›› Und das ist nur ein Teil der Geschichte: Dank der Möglichkeiten, gesprochene Sprache zu verstehen, ist es auch möglich, den Inhalt, das Geschlecht und die Identität eines Sprechers aufgrund von Multimediadateien, zum Beispiel Audiodateien, zu identifizieren. ›› Auch gescannte Dokumente können verarbeitet werden, indem sie mithilfe der optischen Zeichenerkennung («Optical Character Recognition», OCR) maschinenlesbar gemacht werden. Bildverarbeitende Techniken werden für die Gesichtserkennung von Foto- und Videomaterial angewendet («closed-circuit television», CCTV). «Mit ihrem umfangreichen Wissen im Umfeld von NLP, Suchtechnologien und statistischen Herangehensweisen hilft ELCA Unternehmen, unstrukturierte Informationen sinnvoll zu nutzen – von internen Dokumenten über soziale Netzwerke bis hin zu Audiodateien.» Silvia Quarteroni, Manager und NLP-Expertin von ELCA SOFTWAREENTWICKLUNG ALLE INDUSTRIEN WAS UNSERE LÖSUNG IHNEN BIETET Mit ihrem umfangreichen Wissen und Erfahrungen im Umfeld von NLP, Suchtechnologien und verwandten Lösungen, unterstützt ELCA Unternehmen dabei, die Content-Analytics-Technologie wirksam einzusetzen und so alle Arten von unstrukturierten Informationen nutzen zu können. DIE KUNDEN UND ANWENDER unserer Lösungen sind Organisationen, die unstrukturierte Daten analysieren und in verwertbare Informationen und konkretes Wissen umwandeln müssen. NLP ist eine wertvolle Kompetenz für Unternehmen, die beispielsweise viele interne Dokumente für das Records-Management oder interne Berichte (Banken, Versicherungen, öffentliche Verwaltung) lesen bzw. prüfen müssen oder für Unternehmen, die einen bestimmten Markt im Auge behalten sowie schnell auf Kunden-Feedback (B2C) reagieren müssen. Die neue Applikation von ELCA für die Analyse von sozialen Netzwerken ist zudem speziell auf den öffentlichen Sektor sowie Nichtstaatliche- und Non-Profit-Organisationen ausgerichtet. DAS ELCA-DASHBOARD für Content Analytics aggregiert Informationen von News-Websites und sozialen Netzwerken in suchbasierte Applikationen, einschliesslich: ›› Freitextsuche in News, Blogs und Tweets ›› automatisches Extrahieren von Personen, Plätzen und Organisationen, die dynamische Such- und Navigationsfilter werden ›› effektive Visualisierung von Themen, Einheiten und Beziehungen via Tag-Clouds und Netzwerk-Grafiken ›› Sentiment-Analyse auf Twitter in Echtzeit Monitoring/Profiling sozialer Netzwerke Viele Institutionen sind daran interessiert, Nutzer sozialer Netzwerken zu analysieren – beispielsweise jene User, die ein gemeinsames Interesse für eine bestimmte Organisation, Person oder Thematik haben (z. B. «Personen, die Beiträge zu Big Data verfassen», «Personen, die @BarackObama erwähnen oder entsprechende Tweets weiterverbreiten»). Mit der «Social-Networking-Profiling»-Applikation von ELCA können Sie Folgendes beobachten und bestimmen: ›› die aktivsten Follower eines bestimmten Profils ›› das wahrscheinlichste «Sentiment» (Bewertung des Themas, z.B. nach positiv, neutral, negativ), den Ort, die Altersgruppe und das Geschlecht eines Nutzers ›› die Evolution von Themen im zeitlichen Verlauf ›› periodisch Berichte über interessante Profile erhalten mit detaillierten Informationen über die Follower, Meinungsführer und einflussreiche Social-Media-Nachrichten und -Botschaften. Automatische Kategorisierung Automatische Klassifikation/ Gruppierung von Textinhalten. Analyse sozialer Netzwerke Monitoring und Analyse über Themen und Inhalte in sozialen Netzwerken. Verstehen gesprochener Sprache Spracherkennung von Audiodateien, Identifikation wesentlicher Stichwörter, Transkription des Texts und Suchfunktion. Beantwortung von Fragen Präzise Antworten auf Fragen, ohne persönliche relevante Dokumente. Analyse von Bildern Texterkennung auch in mangelhaft gescannten Dokumenten, Gesichtserkennung in Bildern usw. Automatische Übersetzung Suche nach Informationen in verschiedenen Sprachen. CONTENT ANALYTICS DOC Enterprise Search Effiziente und sachgemässe Suche auch für den Inhalt unstrukturierter Dokumente. All-source connectors Verbindung aller Informationsquellen wie Dateisysteme, Webseiten, Netzwerke, Datenbanken usw., um Inhalte zu sammeln. Named Entity Recognition Identifikation von Personen, Orten und Organisationen, die erwähnt werden – keine Listen erforderlich! GIS und Geo-Codierung Auswertung und Darstellung geografischer Daten und Koordinaten auf Karten. Extraktion von Themen/Stichwörtern Rasches Erfassen, Kennzeichnen und Zusammenfassen von Dokumenten, den wichtigsten Wörtern, Ausdrücken oder Themen. Erkennen von Beziehungen Erkennung und visuelle Darstellung von Beziehungen zwischen Einheiten, innerhalb von Dokumenten und übergreifend; Nutzung des Semantic Web. MASSGESCHNEIDERTE APPLIKATIONEN Für die Anforderungen bestimmter Geschäftsszenarien bietet ELCA massgeschneiderte Lösungen und Anwendungen an, die die folgenden Bausteine kombinieren: ELCA Informatique SA Lausanne 021 613 21 11 Genève 022 307 15 11 ›› Konnektoren zu Twitter, News, RSS-Feeds ›› Semantic-Web-Ressourcen wie DbPedia, GeoNames ELCA Informatik AG Zürich 044 456 32 11 Bern 031 556 63 11 ›› Sprachanalyse (POS-Tagging, Chunking, Syntaxanalyse, N-Gram Ex­traction) www.elca.ch ›› Audio-Analyse (Spracherkennung, Keyword-Spotting, Speech-to-TextTranskription) ›› Bildanalyse (optische Zeichenerkennung, Gesichtserkennung) ›› Extrahieren von Informationen, Entdecken von Beziehungen, grafische Visualisierungen ›› Suchmaschinen (u.a. Solr, Elasticsearch, Exalead) ›› Clustering und Klassifizierung mit Hilfe von Deep-Learning-Techniken Clustering & Klassifizierung Spracherkennung, Speech-to-Text Bild­analyse Sprach­ analyse Verstehen von gesprochener Sprache Semantik­ analyse POS-Tagging/Chunking/ Syntaxanalyse Named Entity Recognition Extraktion von Beziehungen DOC Konnektoren Solr, Exalead Maschinelles Lernen Soziale Netze Strukturierte Daten Datei­systeme Webseiten Über ELCA ­ELCA ist eines der grössten Schweizer IT-Unternehmen und führend auf den Gebieten Softwareentwicklung, Systemintegration, Business Consulting und Application Management. ELCA beschäftigt mehr als 700 Mitarbeitende. Der Hauptsitz des Unternehmens ist Lausanne, darüber hinaus unterhält es Niederlassungen in Zürich, Genf, Bern, Paris, Madrid und Ho-Chi-MinhStadt (Offshore-Entwicklung). Q9/2013 OCR, Gesichtserkennung Such­ maschinen