Projekt Nr. 1002306 Marktreport Voice Business 2007 der Version: 1.0 Mit freundlicher Unterstützung der Autoren: Bernhard Steimel, Sebastian Paulke, Jens Klemann Ein Studie von Mind Business Consultants / STRATECO Düsseldorf / Bad Homburg 1. Juni 2007 MARKTREPORT Voice Business 2007 © Mind | STRATECO Inhaltsverzeichnis A B Allgemeines .......................................................................................................3 A.1 Über diesen Marktreport ................................................................................................................ 3 A.2 Über die Autoren .......................................................................................................................... 3 A.3 Über die Herausgeber ................................................................................................................... 4 A.4 Glossar ......................................................................................................................................... 4 A.5 Abbildungsverzeichnis ................................................................................................................... 9 A.6 Literaturverzeichnis ......................................................................................................................10 A.7 Fallbeispielverzeichnis ..................................................................................................................10 Management Summary .................................................................................. 11 B.1 Kernaussagen ..............................................................................................................................11 B.2 Kennzahlen .................................................................................................................................14 C Einleitung: Vorurteile und Fehleinschätzungen im Voice Business ............... 15 D Status Quo: Sprachautomatisierung in der Wirtschaft .................................. 17 E D.1 Einsatzziele: Warum Sprachautomatisierung? ................................................................................17 D.2 Die Kunden: Erfolgskennziffern aus Betreibersicht..........................................................................23 D.3 Nutzerakzeptanz: Vernunftehe statt Liebeshochzeit ........................................................................28 D.4 Anbietermarkt: Eine Branche konsolidiert sich................................................................................31 Die Zukunft des Voice Business ..................................................................... 36 E.1 Trends im Voice Business .............................................................................................................36 E.2 Serviceorganisation der Zukunft ....................................................................................................39 E.3 Mobile Trends: Treiber des Voice Business ....................................................................................41 E.4 „On demand“-Services .................................................................................................................46 E.5 Voice Business 2.0 .......................................................................................................................50 Marktreport VB07 Vers 1 0 (2).doc Seite 2 von 50 Nr. 1002306 MARKTREPORT A Voice Business 2007 © Mind | STRATECO Allgemeines A.1 Über diesen Marktreport Sprachdialogsysteme erobern langsam aber sicher unseren Alltag. Dennoch bestehen in der Öffentlichkeit wie bei Entscheidern nach wie vor viele Vorbehalte gegenüber dieser Technologie. Der „Marktreport Voice Business 2007“ richtet sich an alle Interessenten an der Sprachtechnologie, die erfahren wollen, in welchen Einsatzfeldern sie sich bereits bewährt hat und mit welchen Resultaten. Er bietet seinen Lesern einen konzentrierten Einblick in Marktzahlen, Entwicklungsstand und die neuesten Trends im Voice Business. Der „Marktreport Voice Business 2007“ konsolidiert die Ergebnisse unserer vierjährigen Marktforschung und –analyse und baut auf folgenden Studien auf: » „Praxisreport: Ist Deutschland sprachlos?“, Heitzig Consult/STRATECO 2003 » „Testbericht: VOICE Award 2005 – die besten deutschsprachigen Sprachapplikationen“, DFKI/Mind/STRATECO, 2005 » „Testbericht: VOICE Award 2006 – die besten deutschsprachigen Sprachapplikationen“ DFKI/Mind/STRATECO, 2006 » „Akzeptanz von Sprachapplikationen in Deutschland 2006“, Fraunhofer IAO/Initiative VOICE BUSINESS, 2006 Weitere Materialien stammen aus der VOICE Community: Die dort erhobenen Umfrageergebnisse zusammen mit Best Practice Cases und den redaktionellen Forumsbeiträgen liefern viele wertvolle Informationen aus der Praxis des Voice Business, die in diesen Marktreport Eingang fanden. Zudem fanden Fakten und Zahlen aus anderen Quellen Verwendung. Der vorliegende Marktreport beleuchtet zunächst den Status Quo im Voice Business. Aktuelle Daten zu Marktbedeutung, Kundensicht und Nutzerakzeptanz werden anhand zahlreicher Beispiele und belastbarer Fakten analysiert. Dann werden aktuelle Markttrends beleuchtet – im Fokus steht hier die allgemeine Marktentwicklung, Technologie-Trends sowie die Entwicklung der Enterprise-, Service Provider- und Mobile Märkte. Das abschließende Fazit bietet einen Ausblick auf die Zukunft des Voice Business im deutschsprachigen Raum. A.2 Über die Autoren Bernhard Steimel, Inhaber, mind Business Consultants Bernhard Steimel ist Inhaber der MIND Business Consultants mit Sitz in Düsseldorf. Seit Mai 2000 ist er als Unternehmensberater in zahlreichen Projekten für Service Provider, Softwareunternehmen und Systemintegratoren tätig geworden. Ein Beratungsschwerpunkt ist Business Development. Bernhard Steimel ist u.a. Autor der Studie „Sprachapplikationen auf dem Prüfstand“, Mitbegründer der Initiative VOICE BUSINESS und verantwortlich für die Durchführung der VOICE Awards. Als Herausgeber der VOICE Community ist er Autor zahlreicher Fachartikel zum Voice Business. Zuvor hatte er als Marketingleiter der Düsseldorfer DIALOG Software + Telekommunikations AG eine neue Beratungsproduktlinie konzipiert und im Markt etabliert. Bei o.tel.o war Bernhard Steimel im Key Account Management Vertrieb Handel tätig, wohin er nach einer Tätigkeit als Berater der Eutelis Consult in Ratingen gekommen war. Bernhard Steimel erwarb das Diplom der Wirtschaftswissenschaften an der Bergischen Universität GH Wuppertal und den Bachelor's Degree in Economic Sciences an der Université de Paris, Sorbonne. Marktreport VB07 Vers 1 0 (2).doc Seite 3 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Sebastian Paulke, Analyst, mind Business Consultants Sebastian Paulke ist seit Anfang 2003 als Analyst und Redakteur im Themenfeld Sprachtechnologie tätig und beobachtet seither die im deutschen Markt betriebenen Sprachanwendungen. Als leitender Redakteur der Initiative VOICE BUSINESS sowie der VOICE Community hat er aktiv zur positiven öffentlichen Wahrnehmung der Sprachtechnologie in den Medien beigetragen und mit zahlreichen Veröffentlichungen den Wissenstransfer aus der Fachwelt in die Laien-Öffentlichkeit befördert. Die von Sebastian Paulke konzeptionell mitentwickelte und inhaltlich mitgestaltete VOICE Community gilt als der führende Brancheninformationsdienst für Sprachtechnologie im deutschsprachigen und europäischen Raum. Fachbeiträge zur Sprachautomatisierung publizierte absatzwirtschaft, CallCenter Profi, funkschau und TeleTalk. Sebastian Paulke u.a. in Sebastian Paulke studierte Maschinenbau und Philosophie in Duisburg und Düsseldorf. Jens W. Klemann Jens Klemann ist geschäftsführender Gesellschafter der STRATECO GmbH & Ko. KG, Strategie- und Management-Beratungsgesellschaft mit Sitz in Bad Homburg. Er ist dort verantwortlich für die Bereiche Marketing und Business-Development und besitzt langjährige Branchenerfahrung im ITK-Markt. Neben seiner Rolle als Autor und Herausgeber verschiedener Markstudien – unter anderem des jährlichen Branchen-Barometers „Contact Center-Trends 200x“ – ist er CoHerausgeber der „www.voice-community.de“ sowie Gründer der „Initiative VOICE BUSINESS“, der sich mittlerweile nahezu alle führenden Hersteller von Sprachtechnologie angeschlossen haben. Vor STRATECO war er – zunächst als Geschäftsführer später als Vorstand – in der LogoGruppe, Frankfurt, zuständig für die Bereiche IT und Telekommunikation und baute dort neben einem eigenen Contact Center den Geschäftsbereich Contact Center-Consulting auf. Jens Klemann erwarb seinen Abschluss als Diplom-Kaufmann an der Goethe-Universität in Frankfurt mit den Studienschwerpunkten Marketing und Logistik. Er unterrichtete in dieser Zeit an mehreren Lehrstühlen. A.3 Über die Herausgeber VOICE Community Die VOICE Community ist das Kompetenz-Netzwerk für Sprachdialogsysteme im deutschsprachigen Raum und richtet sich an alle, die sich für den Einsatz von Sprachautomatisierung und neuen sprachgesteuerten Mehrwertdiensten interessieren. Das kostenlose Angebot umfasst alles, was man für den Einstieg ins Voice Business braucht: News-Channel, Best Practice Beispiele, Fachbeiträge von Top-Experten sowie Marktberichte und Analysen. Alle Informationsangebote dienen der Informationsvermittlung und dem Wissensaustausch und sind frei von Werbeinhalten. Unterstützt wird die VOICE Community von Alcatel-Lucent, Genesys, Nuance und T-Com. Herausgeber sind die Unternehmensberatungen Mind und STRATECO. www.voice-community.de A.4 Glossar Begriff Erklärung Marktreport VB07 Vers 1 0 (2).doc Seite 4 von 50 Nr. 1002306 MARKTREPORT Begriff Voice Business 2007 © Mind | STRATECO Erklärung 24/7 Service bedeutet in diesem Zusammenhang die ständige Verfügbarkeit von ServiceAngeboten: 24 Stunden am Tag, sieben Tage die Woche. ACD Automated Call Distribution ist ein Telefonsystem im Call Center, das ankommende Anrufe zu Mitarbeitern des Call Centers leitet und ausführliche Statistiken (z. B. über Anrufaufkommen, Dauer und Wartezeit) erstellt. In Allgemeinen als „ACD-Anlage“ bezeichnet, beschreibt dieses Akronym eine Technologie, die es einem Call Center gestattet, eingehende Anrufe nach bestimmten Regeln zu organisieren und an zur Verfügung stehende Call Center Agenten weiterzuleiten, so dass eine möglichst hohe Auslastung herbeigeführt wird. Active Grammar aktives Grammatiksystem. Wird von einem Spracherkenner genutzt und regelt die Verwendung des aktiven Wortschatzes eines Sprachdialogsystems. Application Life Cycle Management ist das Ändern, Anpassen und Managen des Designs, des Aufbaus, des Angebots und der Inhalte einer Anwendung und dient der schnellen, Kosten günstigen Optimierung bzw. Modifikation der Applikationen z.B. bei Kampagnenänderung. ARPU Average Revenue Per User (ARPU) ist der durchschnittliche Umsatz pro Kunde ASR Automated Speech Recognition wird mit "Spracherkennung" übersetzt und beschreibt die automatische Interpretation menschlicher Sprache von einer Maschine, also die Umsetzung von gesprochener Sprache in Text ("Speech to Text"). Audiotex-Plattformen ist ein anderer Begriff für Tastaturwahl-Systeme, der bei den Telefongesellschaften ähnliche Verbreitung hat wie -> IVR bei Telefonanlagen-Herstellern, mit dem Unterschied, dass Audiotex-Systeme für den Hochlastbetrieb am Telekommunikationsnetz konzipiert sind. Authentifizierung ist ein Prozess, bei dem die Identität des Anrufers durch einen Vergleich des tatsächlichen Stimmbeispieles mit dem Stimmabdruck des Benutzers überprüft wird. -> Sprachbiometrie Automated Attendant (oder Auto-Attendant) ist die Bezeichnung für einen automatischen, sprachgesteuerten Telefonvermittlungsplatz und ist der digitale "Ersatz" für einen menschlichen Telefonisten, der Anrufe (beispielsweise in einem Call Center) annimmt, Anfragen behandelt und dabei auf die Stimme des Anrufers oder Tastentöne reagiert. Automatisierungsrate Die Automatisierungsrate (Call Completion Rate) gibt den Anteil der Anrufe wieder, die erfolgreich durch die Sprachapplikation abgewickelt wurden und damit das Anliegen des Anrufenden lösen konnten. Die Automatisierungsrate ist nicht zu verwechseln mit der Erkennungsgenauigkeit der Spracherkennung. Ein erneutes Nachfragen der Sprachapplikation nach dem Anliegen des Anrufenden führt nicht zu einer Verringerung der Automatisierungsrate. Wenn der Anrufende hingegen aufgrund mehrfacher Nichterkennung seines Anliegens an einen Agenten übergeben werden muss, verringert sich die Automatisierungsrate. Backend-Systeme bezeichnen die physische Ebene, also die Maschinen, auf der die einer Anwendung dienenden Daten und Funktionen gespeichert sind. Barge-in ist die Möglichkeit für Benutzer von Sprachapplikationen, Eingabeaufforderungen zu unterbrechen und eine Antwort zu geben, bevor die Eingabeaufforderung vollständig abgespielt wurde. Dazu ist Echo-Elimination erforderlich, durch die die Ausgabe der Maschine vom eingehenden Datenstrom entfernt wird. Durch Barge-in verändert sich typischerweise das Initiativverhalten der Anwendung. Billing-Systeme Abrechnungssysteme Built-in Grammar ist ein vordefiniertes Set verschiedener Grammatiken, die eine schnellere Entwicklung von Sprachapplikationen ermöglichen soll. VoiceXML 2.0 bietet beispielsweise folgende Standardgrammatiken: Boolean, Date, Digit, Currency, Number, Phone und Time. Call Completion Rate engl. für Automatisierungsrate, d.h. die Zahl der erfolgreich über das System abgeschlossenen Anrufe. Call Time Unter der durchschnittlichen Anrufdauer (Call Time) ist die Zeit zu verstehen, die jemand aktiv mit einer Sprachapplikation telefoniert. CapEx Capital Expenditure ist die Kennzahl für die Kosten beim Kauf einer Netzwerk- und Infrastrukturlösung. -> OpEx Carrier GradePlattformen Systeme mit mehr als 500 Ports, die hohe Verfügbarkeit, Skalierbarkeit und Ausfallsicherheit für Netzbetreiber gewährleisten. CPC Costs per Call ist die Bezeichnung für die Kosten, die dem Unternehmen pro Gespräch entstehen. Die Costs per Call berechnen sich aus der Summe der Gesamtkosten eines Call Centers (Telefongebühren, Personalkosten, Bereitstellungskosten) dividiert durch die Gesamtzahl der eingegangenen Anrufe innerhalb eines bestimmten Zeitintervalls. CRM Customer Relationship Management (CRM) „… is a business strategy to select and manage customers to optimize long-term value. CRM requires a customer-centric business philosophy and culture to support effective marketing, sales and service processes. CRM applications can enable effective CRM, provided that an enterprise Marktreport VB07 Vers 1 0 (2).doc Seite 5 von 50 Nr. 1002306 MARKTREPORT Begriff © Mind | STRATECO Voice Business 2007 Erklärung has the right leadership, strategy, and culture.“ (CRMGuru.com) CTI Computer-Telefonie-Integration Customer Interaction Management ist die Planung, Durchführung und Steuerung von Interaktionsprozessen mit dem Kunden. Der Begriff wird technisch oft verwendet im Sinne der Nutzung verschiedener Kommunikationskanäle. Customer Value Management ist die Klassifizierung der Kunden auf Basis der Daten der Auftraggebern nach Wert und Potenzial, auf deren Basis dann das entsprechend defininerte Call Routing erfolgt. Dialog Navigation/Dialog Führung ermöglicht die "freie" Navigation durch ein sprachgesteuertes Angebot, unabhängig von starren Menus und unabhängig vom Initiativverhalten der Applikation. -> Mixed Initiative Directory Assistants bieten den sprachgesteuerten Adressbücher DTMF Dual Tone Multi Frequency (DTMF) wird auch als Touch Tone- oder Push ButtonVerfahren bezeichnet. Mehrfrequenzwahlverfahren, bei dem das Telefonnetzwerk auf die vom Anrufer eingegebenen Tonsignale reagiert. DTMF ist eine gebräuchliche Schnittstelle zum Abrufen von Informationen aus automatisierten Systemen (in der Regel IVR-Systeme). DTMF war ursprünglich eine eingetragene Marke von AT&T. Dynamic Grammar ist eine Grammatik, die von einer Sprachapplikation während des Betriebs erweitert und korrigiert werden kann. Dynamic VoiceXML beschreibt eine von der W3C definierte Funktionalität, mit der auf einfache Weise VoiceXML Applikationen erstellt werden können. Earcon Kurze, prägnante Sounds mit spezifischer, unterscheidbarer Bedeutung. Vergleichbar mit Icons im visuellen Bereich. eingebettete Systeme "Embedded Systems", englischer Fachbegriff für eingebettete (Computer-)Systeme, die – weitestgehend unsichtbar – ihren Dienst in einer Vielzahl von Anwendungsbereichen und Geräten versehen, wie z.B. in Flugzeugen, Autos, Fernsehern, DVD-Playern oder allgemein Geräten der Unterhaltungselektronik. „Embedded Systems“ vereinigen daher durch ihre oftmals sehr hardwarenahe Konstruktion die große Flexibilität von Software mit der Leistungsfähigkeit der Hardware. Einzelworterkennung Die sogenannte "diskrete Einzelworterkennung" identifiziert einzelne, vorgegebene Wörter. Die diskrete Einzelworterkennung wird von der kontinuierlichen -> (Schlüssel-) Worterkennung unterschieden, bei der Schlüsselworte aus ganzen Sätzen heraus erkannt werden. Effektivität Ein Dialog ist Aufgaben angemessen, wenn er den Benutzer unterstützt, seine Arbeitsaufgabe schnell und zielführend zu erledigen. Erwartungskonformität Ein Dialog ist erwartungskonform, wenn er konsistent ist und den Merkmalen des Benutzers entspricht, z.B. seinen Kenntnissen in dem Arbeitsgebiet, seiner Ausbildung und seiner Erfahrung sowie den allgemein anerkannten Konventionen." eskalierendes Prompting ist die z.B. im Errorhandling eingesetzte Methode, bei wiederholten Fehleingaben den Nutzer durch immer spezifischere Hinweise zu unterstützen. EVA Enterprise Voice Applications sind Sprachdialogsysteme, die von ihrem Leistungsumfang her für Unternehmenskunden, in Abgrenzung zu -> Carrier GradeSystemen, konfiguriert sind. Fallabschlussrate -> Call Completion Rate Fall Back bezeichnet das "Zurückgehen" einer Sprachapplikation zu einem vorhergehenden Punkt, z.B. wenn Spracheingaben an einem bestimmten Punkt nicht erkannt werden konnten. Fehlertoleranz Ein Dialog ist fehlertolerant, wenn das beabsichtigte Arbeitsergebnis trotz Fehlererkennungen entweder mit keinem oder mit minimalem Korrekturaufwand seitens des Benutzers erreicht werden kann. First Call Resolution Lösung eines Kundenproblems bereits beim ersten Anruf, so dass erstens der Kunde zufrieden ist und zweitens keine weiteren Follow-up Calls nötig sind. Voraussetzung ist ein Support Agent, der die nötige Problem-Lösungs-Kompetenzen hat. Hear&Feel ist die akustische Anwendung. Hosting hier: Das Betreiben einer Sprachdialogplattform für Dritte. Hosting Platform Eine Plattform, die das technische Vorhalten von Anwendungen und Inhalten auf Internetservern ermöglicht. Hot Word Recognition / Schlüsselworterkennung engl. für Schlüsselworterkennung. Spezielle Form der Spracherkennung, bei der ein System die Äußerung eines Anrufers auf bestimmte Schlüsselworte (oder Schlüsselphrasen) überprüft und erst nach deren Vorkommen aktiv wird. Marktreport VB07 Vers 1 0 (2).doc Analogie Zugriff zum Seite 6 von 50 auf persönliche "Look&Feel", zum Telefon- und/oder Erscheinungsbild einer Nr. 1002306 MARKTREPORT Begriff Voice Business 2007 © Mind | STRATECO Erklärung Human Factor Im Allgemeinen dient der Ausdruck der Beschreibung eines Designs, das an den Menschen angepasst wird und die Leistung des Menschen in Bezug auf die Maschine unterstützt oder sogar verbessert. Das Gegenteil davon ist ein Design, bei dem der Benutzer besondere Leistungen erbringen muss, um erfolgreich mit der Oberfläche oder dem Gerät zu interagieren (da er andernfalls den Vorgang abbrechen muss). Bei Sprachapplikationen müssen bei der Erstellung des -> VUI und beim Dialogdesign die den Benutzer betreffenden Faktoren berücksichtigt werden. IDE Integrated Development Environment (IDE) ist ein Begriff der Kelsey Group für Entwicklungswerkzeuge für Sprachapplikationen (Development Tools), die in der Regel integraler Bestandteil einer “Laufzeit-Umgebung” sind. IN-Dienste sind im -> Intelligenten Netz angebotene Dienstleistungen. Intelligentes Netz Das Intelligente Netz (IN) ist kein eigenes physikalisches Netz, sondern ein diensteorientiertes zentrales System, das auf ein vorhandenes Telefonnetz (z.B. ISDN) aufsetzt. Ein IN erweitert ein Telefonnetz um intelligente Netzkomponenten und zusätzliche Leistungsmerkmale. Im Vordergrund stehen dabei Mehrwertdienste für Festnetztelefonie, Mobilfunk und Telefax. Es ist nicht erforderlich, dass INBetreiber gleichzeitig Netzbetreiber sein müssen; sie können ihr Angebot über vorhandene Netze realisieren. Durch eine IN-Nummer wird das zentrale System des IN-Betreibers adressiert, der Service Control Point. In diesem können dann die Daten des Anrufs mit verschiedenen Parametern (wie z.B. Ursprung des Anrufs, Uhrzeit, Wochentag) verknüpft und flexibel gestalt- und beeinflussbare Dienste angeboten werden. Infotainment Services sind Dienste, die sowohl informierenden als auch unterhaltenden Inhalts sind. Lernförderlichkeit Ein Dialog ist lernförderlich, wenn er den Benutzer beim Erlernen des Dialogsystems unterstützt und anleitet. Mehrwertdienste Im Allgemeinen Bezeichnung für Dienstleistungen der Anbieter, die über die reine Übertragungsleistung hinausgehen. Im Telefondienst z.B. eine im Netz angebotene Sprachbox oder ein Informationsdienst im Rufnummernbereich (0)900 gegebenenfalls bis hin zum kompletten Call-Center. Mixed Initiative bezeichnet man einen Dialogablauf, der sich dynamisch an die Bedürfnisse des Anrufers anpasst und zwischen Maschinenerfordernissen und menschlichem Dialogverhalten angesiedelt ist. Verbundworterkennung Auch kontinuierliche (Schlüssel-)Worterkennung. Hier werden Schlüsselworte aus einer Folge mehrerer Worte heraus erkannt. (Bsp.: „Mit dem Jugendamt!“ -> führt beim Bürgeramt Augsburg zur Ausgabe der Informationen zum Jugendamt der Stadt). Multi Slot Model wird auch Semantic Slot Model genannt. Äußerungen des Anrufers werden in einem semantischen Modell erfasst und zugeordnet. Bestimmte Schlüsselworte (z.B. from, to, date, time) können so mit weiteren Eingaben kombiniert werden, ohne dass diese in einer bestimmten Reihenfolge gesprochen werden müssen. Das Multi Slot Modell wird beim -> Mixed Initiative Ansatz verwendet. Multi Persona Design bezeichnet einen Ansatz im Dialog Design, der nicht nur eine -> Persona im System bereitstellt, sondern dem Anrufer gleich mehrere virtuelle Persönlichkeiten anbietet, gegebenenfalls gleichzeitig. N-Best List gehört zum Error Handling einer Applikation. Dabei werden mögliche Lösungen mit der N-Best Liste verglichen. Die höchste Trefferwahrscheinlichkeit (N=1) ist meist die korrekte Antwort auf eine vom Anrufer gestellte Frage. Allerdings kann das System im Rahmen des Semantischen Modells feststellen, ob die "beste" Lösung unlogisch oder ausserhalb des Kontextes liegt. In diesem Fall werden nachfolgende Vorschläge aus der N-Best List verglichen und auf deren Plausibilität geprüft, bevor die Antwort gegeben wird. NLU Natural Language Understanding (NLU) ermöglicht dem Anrufenden, in ganzen Sätzen mit der Sprachapplikation zu sprechen. Dabei werden nicht nur die einzelnen Worte erkannt, sondern auch ihre eventuell unterschiedliche Bedeutung in Abhängigkeit von ihrer Stellung im Satz. No Input Ein Zustand, der eintritt, wenn ein Anrufer vom System zu einer Eingabe aufgefordert wird und keine Eingabe erfolgt. Non Speech Audio nichtsprachliche Klänge, die mit passenden Hintergrundgeräusche den Dialog auflockern (z.B. Tastaturgeräusche während einer Datenbankabfrage). No Match Ein Zustand, der eintritt, wenn ein Anrufer vom System zu einer Eingabe aufgefordert wird und eine unlogische oder kontextuell unpassende Eingabe erfolgt (die von der hinterlegten -> Grammatik erkannt wird). OpEx Operating Expenditure sind die Kosten für Betrieb und Wartung einer ITInfrastruktur. -> CapEx Persona Die Persona – der "Charakter" oder die "Persönlichkeit" – einer Sprachapplikation könnte als "die Stimme des Systems" beschrieben werden. Anrufer können allein anhand der Stimme genaue Schätzungen über soziale Parameter machen. Die Marktreport VB07 Vers 1 0 (2).doc Seite 7 von 50 Nr. 1002306 MARKTREPORT Begriff Voice Business 2007 © Mind | STRATECO Erklärung Auswahl eines bestimmten Sprachtalents und die Beschreibung der sozialen Eigenschaften und des Lebenstiles der Persona sind daher nötig, um ein konsistentes Design auch im Hinblick auf die "Corporate Identity" zu ermöglichen. Personalisierung Personalisierungsfunktionen sind z.B. dann gegeben, wenn man den Sprachdialog der Anwendung individuell gestalten kann. Plattform Hosting & Content Billing ist das skalierbare Bereitstellung von Ports (Sprachverarbeitung und -erkennung) mit Zugang zu dem Netz eines oder mehrer Netzbetreiber und der Möglichkeit, die Nutzung verbrauchsgerecht abzurechnen. Port Ressource, die zur Verarbeitung eines Anrufs benötigt wird. Ein System mit 30 Ports kann 30 gleichzeitige Anrufe verarbeiten. Prompt Gesprochene Maschinenausgabe, die dem Benutzer signalisiert, dass er seine Eingabe machen kann. Bei Eingabeaufforderungen handelt es sich um Hinweise, durch die der Benutzer dazu veranlasst wird, zu sprechen oder eine Eingabe zu machen. Sie können auch Informationen darüber enthalten, welche Eingabe bei diesen Zuständen zulässig ist. Es gibt bestimmte Arten von Eingabeaufforderungen, die gesondert behandelt werden: Anweisungen – Informationen zu Funktionen der Applikation. Hilfe – Ein separater Zustand zur Unterstützung des Benutzers. Feedback – Informationen für den Benutzer zum Zustand eines direkt folgenden Ereignisses. Prosodik auch Prosodie: Gesamtheit sprachlicher Eigenschaften wie Akzent, Intonation, Quantität und Sprechpausen. Sie beziehen sich in Allgemeinen auf Einheiten, die größer sind als ein einzelnes Phonem. Zur Prosodie zählt auch die Untersuchung von Sprechgeschwindigkeit, Rhythmus und Sprechpausen. Qualität der Spracherkennung Darunter ist die Sprecherunabhängigkeit, die Geräuschtoleranz sowie die Anzahl der erkannten Worte zu verstehen. Randomised Prompting ist die z.B. im Errorhandling eingesetzte Methode, bei sich wiederholenden Prompts wechselnde Formulierungen zu verwenden. ROI-Treiber nennt man die Faktoren, die maßgeblich die Amortisierungsdauer beeinflussen. ROI steht für Return On Investment Say Anything Ein Nuance-spezifischer Ausdruck für eine Technologie, bei der stochastische Sprachmodelle für die Anrufweitervermittlung werden bzw. ein NLU-System, das auch auf stark variierende Eingaben zu reagieren vermag. Schlüsselworterkennung erkennt aus Wortfolgen bestimmte vorher hinterlegte (Schlüssel-) Worte. Sprachapplikation ist eine Applikation, die in Dialogen und Interaktionen auf eine bestimmte Aufgabe oder bestimmte Arbeitsabläufe abzielt. Die Interaktion zwischen Benutzer und System erfolgt dabei nur über das Telefon. Ein solches System nutzt Spracherkennung für das "Verstehen" der Instruktionen des Benutzers. Sprachapplikationen benötigen ein bestimmtes Dialogdesign für die effiziente Interaktion über ein -> VUI. Sprachbiometrie (Speaker Verification) Durch Speaker Verification kann man in Zukunft aufgrund eines Voice Prints, den man zuvor vom Anrufenden genommen hat, diesen anhand seiner Sprache authentifizieren. Der Anrufer wird zur -> Authentifizierung gebeten, eine zufällige Zahlenfolge oder Wörter nachzusprechen. Sprachportale Sprachportale ähneln den Web-Portalen und bieten dem Anrufer unter einer Telefonnummer eine größere Auswahl an Sprachapplikationen. Sprachportale sind anfangs weitestgehend auf einen Zweck ausgerichtet, der seine Stärke in der Informationsbandbreite hat: Sprachportale bieten synergetische Informationsdienste und Commerce-Anwendungen. Dabei stehen die Aspekte Unterhaltung, Service und persönliches Zeitmanagement im Vordergrund. Sprachsynthese (Text to Speech, TTS) Erfolgen die Systemantworten über Sprachsynthesesoftware bzw. durch Text to Speech, können auch nicht vorgegebene Inhalte wiedergegeben werden. Z.B. kommt diese Technik zum Einsatz, wenn es sich um Abfragen aus großen Datenbanken handelt. Die Ergebnisse der Abfrage werden dann von der Sprachsynthesesoftware vorgelesen. Ein Einsatz von Prerecorded Voice Files ist in diesem Fall nicht möglich, da dies nicht nur zu aufwendig wäre, sondern auch weil der Inhalt der Datenbanken sich ständig ändert. sprecherunabhängig verhalten sich Spracherkenner, deren Vokabular von jeder beliebigen Person ohne Training verwendet werden kann. Es gibt drei Arten: Einzelworterkenner, kontinuierliche Spracherkenner und Phonem basierte Spracherkennung. Stand Alone IVRLösungen sind eigenständige, oft auch proprietäre IVR-Lösungen, bei der alle notwendigen Komponenten zu einem Gesamtsystem zusammengefasst sind und die nicht in die TK-Infrastruktur integriert sind. Steuerbarkeit Ein Dialog ist steuerbar, wenn der Benutzer in der Lage ist, den Dialogablauf zu starten sowie seine Richtung und Geschwindigkeit zu beeinflussen, bis das Ziel erreicht ist. Task Completion Rate -> Call Completion Rate Marktreport VB07 Vers 1 0 (2).doc Seite 8 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 Begriff © Mind | STRATECO Erklärung Unique User bezeichnet die Anzahl der Menschen, die eine Sprachapplikation zumindest einmal benutzt haben. Verbosität Verbosität entsteht, wenn ein Text länger als nötig ist und mehr Worte benutzt werden, als idealerweise nötig wären. Verständlichkeit Ein Dialog ist selbstbeschreibungsfähig, wenn jeder einzelne Dialogschritt durch Rückmeldung des Dialogsystems unmittelbar verständlich ist oder dem Benutzer auf Anfrage erklärt wird. Voice Automation Sprachapplikationen als Unternehmens-Dienste mit Fokus auf (Service-) Automatisierung als wesentlichem Treiber: Sprachapplikationen dienen als Zugang zu Customer Service-Leistungen, internen Auskunfts- und Vermittlungsdiensten und der Workflow-Automatisierung. Voice Business sind als Mehrwert-Dienste mit dem Fokus auf Umsatz und Kundenwert angelegte Sprachapplikationen. Diese sprachaktivierten Mehrwertdienste dienen hier als Zugang zu Bezahldiensten, der Produktdifferenzierung und Neukundengewinnung. Beide Anwendungsgebiete von Sprachapplikationen unterscheiden sich heute noch zumeist in technischer Hinsicht: Während Lösungen für Unternehmen meist über lokal installierte Sprachintelligenz verfügen, liegt die Sprachverarbeitung bei Mehrwertdiensten im Netz. voiceXML Voice eXtendable Markup Language (voiceXML) ist eine "vereinfachte" Version der Standard Generalized Markup Language (SGML). VUI Voice User Interface (VUI) nennt man das Audioäquivalent zum GUI (Graphical User Interface) im visuellen Bereich. Ein VUI implementiert die gesprochenen Interaktionen zwischen Personen und Computern über ein (Telefon-) Netzwerk mit Hilfe von Spracherkennung, Sprachsynthese und Sprachauthentifizierung. Quelle: Testbericht: VOICE Award 2006 – die besten deutschsprachigen Sprachapplikationen [3] A.5 Abbildungsverzeichnis Tab.: Kennzahlen des Voice Business .............................................................................................................. 14 Abb.: Kommunikationskanäle ......................................................................................................................... 18 Abb.: IVR-Ports in Deutschland ...................................................................................................................... 19 Abb.: Anwendungstypen ................................................................................................................................ 20 Abb.: Branchenspektrum ................................................................................................................................ 22 Abb.: Effizienz von Sprachsteuerung ............................................................................................................... 23 Abb.: Automatisierungsraten .......................................................................................................................... 24 Abb.: Integrationstiefe ................................................................................................................................... 25 Abb.: ROI - Return on Investment .................................................................................................................. 27 Abb.: Kosten je Anruf .................................................................................................................................... 28 Abb.: Nutzungsbereitschaft ............................................................................................................................ 29 Abb.: Serviceverfügbarkeit ............................................................................................................................. 30 Abb.: Kostenbewusstsein ............................................................................................................................... 31 Abb.: Marktgröße EU ..................................................................................................................................... 32 Abb.: Weltmarkt ....................................................................................................................................... 33 Abb.: VXML ist Standard ................................................................................................................................ 33 Abb.: ASR-Anteil ....................................................................................................................................... 34 Abb.: Marktkonsolidierung.............................................................................................................................. 35 Abb.: Applikationsfelder ................................................................................................................................. 36 Abb: Trends im Anbietermarkt........................................................................................................................ 37 Abb.: Entwicklungstrends ............................................................................................................................... 38 Abb.: Markterfolgsfaktoren ............................................................................................................................. 38 Abb.: Kundenservice-Trends........................................................................................................................... 40 Abb.: Multimedia-Access ................................................................................................................................ 42 Marktreport VB07 Vers 1 0 (2).doc Seite 9 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Abb.: Anwendungsgebiete für Voice ............................................................................................................... 44 Abb.: Service Provider Geschäft ...................................................................................................................... 46 Abb.: Sales- und Customer Care Solutions....................................................................................................... 49 A.6 Literaturverzeichnis Studien / Marktforschung [1] Praxisreport: Sprachapplikationen auf dem Prüfstand, Bernhard Steimel, Jens Klemann; Heitzig Consult, STRATECO; Brilon, Bad Homburg, 2003 [2] Testbericht: VOICE Award 2005 – die besten deutschsprachigen Sprachapplikationen, Bernhard Steimel, Prof. Anthony Jameson, Sebastian Paulke, Kerstin Klöckner; DFKI, Mind, Strateco; Düsseldorf, Saarbrücken, 2005 [3] Testbericht: VOICE Award 2006 – die besten deutschsprachigen Sprachapplikationen, Bernhard Steimel, Prof. Anthony Jameson, Sebastian Paulke, Kerstin Klöckner; DFKI, Mind, Strateco; Düsseldorf, Saarbrücken, 2006 [4] Branchenbarometer 2006 der VOICE Community, Bernhard Steimel, Sebastian Paulke; VOICE Community, Düsseldorf, 2006 [5] Contact Center-Trends 2007, Jens Klemann; Aspect, STRATECO; Bad Homburg, 2007 [6] Akzeptanz von Sprachapplikationen in Deutschland 2006, Matthias Peißner, Bernhard Steimel; Fraunhofer IAO/Initiative VOICE BUSINESS; Bad Homburg, Stuttgart, 2006 [7] Testbericht: VOICE Award 2004 – die besten deutschsprachigen Sprachapplikationen: Bernhard Steimel, Prof. Anthony Jameson, Sebastian Paulke, Kerstin Klöckner; mind, DFKI; Düsseldorf, Saarbrücken, 2004 Fachartikel » Vorurteile und Fehleinschätzungen im Voice Business, Sebastian Paulke, erschienen in: VOICE Community, 2007 » Voice-„Fusionitis“: Ein Markt wird erwachsen, Sebastian Paulke, erschienen in: VOICE Community, 2007 » 3GSM-Barcelona: Total multimodal!, Sebastian Paulke, erschienen in: VOICE Community, 2007 » Medienübergreifendes Publizieren – Voice, das "fünfte Element"?, Sebastian Paulke, erschienen in: VOICE Community, 2006 » Business Process Routing – Beginnt nun die Industrialisierung der Verwaltung?, Sebastian Paulke, erschienen in: VOICE Community, 2007 » Anwendungsoptimierung mit Customer Behaviour Intelligence und Voice Stream Analysis, Sebastian Paulke, erschienen in: VOICE Community, 2007 » Voice Module – der Baukasten für Sprachanwendungen?, Sebastian Paulke, erschienen in: VOICE Community, 2006 » Standardanwendungen – Sprachdialogsysteme vom Fließband, Sebastian Paulke, erschienen in funkschau 10/2006 » VOICE Community-Interview mit David Nahamoo, Sebastian Paulke, erschienen in: VOICE Community, 2006 A.7 Fallbeispielverzeichnis 1. FC Köln Poldi, DB Dialog Bahnauskunft, E-Plus „Holiday Special 2006" , O2 Tarifmanager, Postbank Telefonbanking, Speak-up RTL Radio Stimme deiner Stadt, T-Com Sprachportal für Vertrieb, Kundenbetreuung und Service, T-Com Rückruf bei ‚besetzt’, T-Mobile Service Manager , Viasuisse Verkehrsauskunft Weitere Fallbeispiele unter www.voice-community.de/beispiele Marktreport VB07 Vers 1 0 (2).doc Seite 10 von 50 Nr. 1002306 MARKTREPORT B Voice Business 2007 © Mind | STRATECO Management Summary B.1 Kernaussagen Einsatzziele: Warum Sprachautomatisierung? Serviceautomatisierung und Kostensenkung sind die wichtigsten Gründe (notwendige Bedingung) im Entscheidungsprozess für eine Sprachapplikation. Eine Verbesserung der Kundenbindung und eine Engpassbehebung im Call Center sind die zweitwichtigsten Ziele (hinreichende Bedingung), die ein Unternehmen durch die Einführung einer Sprachapplikation erreichen will. Seit dem Jahr 2004 wurden hierzulande über 50.000 neue Sprachports in Deutschland installiert, aktuell werden in Deutschland knapp über 300.000 Sprachports betrieben. Rechnet man die Zahl der Ports hoch auf das darüber abgewickelte automatisierte Kontaktvolumen, so kann man von mehr als 38 Mio. automatisierten Anrufen pro Tag ausgehen. Anwendungen zur Serviceautomatisierung dominieren klar, Mehrwertdienste und Kampagnen spielen noch eine untergeordnete Rolle. Der Bereich der Service-Automatisierung zeigt ein erstaunlich breites Anwendungsspektrum, mit einer starken Fokussierung auf einfache, häufig wiederkehrende und gut standardisierbare Anfragen, aber auch mit kompletten Self ServiceAngeboten innerhalb von Voice Portalen. Sichtbar wird schließlich ein deutlicher Zuwachs an komplexen Auskunftsdiensten. Sprachcomputer als Mehrwertdienst ermöglichen neue Wettbewerbsstrategien und Produkte. Besonders viel versprechend scheinen den Anbietern von Mehrwertdiensten Auskunftsdienste in Verbindung mit zusätzlichen Infotainment-Angeboten zu sein. Es braucht noch Zeit, um den Sprachkanal als wertschöpfendes Element der Markenbildung und -kommunikation und damit in den Marketing-Budgets der Unternehmen zu etablieren. Die Vorteile liegen jedoch auf der Hand: Der Sprachkanal ist ein neues, stark emotionalisierendes und hoch interaktives Medium für die Zielgruppenkommunikation im Marketing. Den Telefongesellschaften kommt nach wie vor eine besondere Bedeutung bei der Heranführung breiter Bevölkerungsschichten an das neue Medium und für die Nutzerakzeptanz von Sprachapplikationen zu. Das liegt einerseits daran, dass diese Unternehmen beim Einsatz von Sprachapplikationen durch Kostensenkungspotenziale im Dienst für Millionen Kunden am deutlichsten profitieren und sich ihnen anderseits durch sprachgesteuerte Informations- und Kommunikationsdienste neue Einnahmequellen bieten. Das Branchenspektrum ist insgesamt deutlich breiter geworden. Erfolgskennziffern aus Betreibersicht Sprachautomatisierung schafft dort den höchsten Nutzen, wo Geschäftsvorfälle nicht auf anderem Wege automatisierbar sind oder die automatisierte Anwendung den Nutzern einen hohen Mehrwert liefert. Je höher der von den Verbrauchern empfundene Kundennutzen ist, desto größer ist auch die Akzeptanz eines Sprachdialogsystems. Erfolg und Leistungsfähigkeit einer Sprachanwendung ebenso wie der erzielbare ROI hängen also unmittelbar von den Faktoren Anwenderverhalten und Business Rules der Anwendung ab. Die Integration mit ACD-, CTI- und CRM-Systemen schafft die Voraussetzungen für eine „intelligente“ Verknüpfung von automatisierten Diensten und qualifizierten Agenten-Services in der Kundeninteraktion im Sinne eines umfassenden Customer Value Managements. Über ein Drittel aller Anwendungen, die am VOICE Award 2006 teilnahmen, amortisierte sich den Teilnehmern zufolge innerhalb von sechs Monaten, weitere knapp 20% rechneten sich bereits nach spätestens elf Monaten. 25% der Teilnehmer gaben Amortisierungszeiträume von einem bis maximal zwei Jahren an. Diese Amortisierungszahlen sind einzigartig für ITK-Projekte. Ein durchschnittlicher ROI von knapp 10 Monaten ist eine beeindruckende Zahl – und beweist: Für Unternehmen mit hohem Kundenkontaktaufkommen zahlen sich Sprachapplikationen aus, und zwar im wahrsten Sinne des Wortes! Sprachanwendungen senken die Transaktionskosten gegenüber Call Centern massiv. Marktreport VB07 Vers 1 0 (2).doc Seite 11 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Durchschnittliche Transaktionskosten von unter 20 Cent sollten vor allem Unternehmen mit vielen wiederkehrenden Anrufen motivieren, zur Automatisierung geeignete Prozesse zu identifizieren und sie in einem Sprachdialogsystem abzubilden. Der VOICE Award 2006 zeigt aber auch, dass neuere Systeme tendenziell eine niedrigere Fallabschlussrate aufweisen als alte, „gut eingespielte“ Systeme. Nutzerakzeptanz: Vernunftehe statt Liebeshochzeit Die Bekanntheit von Sprachapplikationen ist in den vergangenen Jahren deutlich gestiegen. Trotz der generell relativ geringen Zufriedenheit der Nutzer mit den von ihnen am häufigsten genutzten Sprachapplikationen besteht überwiegend eine hohe Bereitschaft, diese Applikationen auch in der Zukunft zu nutzen. Im Vergleich zu anderen Kommunikationsmöglichkeiten ist die Nutzung von Sprachapplikationen insgesamt nicht besonders beliebt, jedoch bevorzugen die meisten Befragten sie in bestimmten Situationen selbst gegenüber einem persönlichen Kontakt: 1. Zeitersparnis: Schon bei einer relativ kurzen Wartezeit auf Ansprechpartner erscheint die Alternative Sprachapplikation attraktiver einen persönlichen 2. Erreichbarkeit und 24 Stunden Verfügbarkeit 3. Kostenvorteil: Ebenso deutlich werden Sprachapplikationen dann bevorzugt, wenn für einen persönlichen Telefonkontakt zusätzliche Gebühren anfallen Anbietermarkt: Eine Branche konsolidiert sich Der deutsche Markt für Sprachanwendungen ist der am schnellsten wachsende in Europa: 21% jährliches Wachstum zeigen, dass das Voice Business boomt. Die Marktkonsolidierung der letzten zwei Jahren und die Übernahme neuer Sprachtechnologien in die Portfolios von Microsoft, SAP, Google & Co. beweist eine gewisse Reife sowohl des Marktes als auch der Technologie. Zugleich schafft der Markteintritt der neuen Player die Grundlagen für eine Neuordnung der Preis- und Kostenstrukturen in der Branche: Das könnte den Anfang vom Ende der Port-basierten Kosten für Sprachtechnologie zugunsten von Arbeitsplatz- oder transaktionsbezogenen Kosten bedeuten. Es ist zu erwarten, dass die neuen großen Player dazu beitragen, dass Sprachtechnologie zur Commodity wird – denn wenn ein Unternehmen wie Microsoft Sprachtechnologie voll in seine Produkte von Betriebssystemen bis hin zu Office-Anwendungen integriert und diese zugleich mit einem Diensteangebot á la Hotmail (für Voice auf Basis der neuerworbenen TellMe-Plattform) in ein umfassendes Eco-System einbindet, spätestens dann wird Voice ebenso Mainstream sein wie heute eMail. Trends im Voice Business Folgende Top-Themen hat das Branchenbarometer der VOICE Community im Herbst 2006 für die nächsten zwei Jahre identifiziert: Erstens wird die Sprachautomatisierung (im Call Center Umfeld) durch Kontaktqualifizierung getrieben. Zweitens wird das Auftreten neuer Player wie Google, Microsoft & Co. die Spielregeln grundlegend verändern. Und drittens sind StandardApplikationen, Managed Services und VoIP-Integration die wichtigsten Innovationen. Erfolgsfaktor Nr. 1 bleibt das Voice User Interface. Das wird gleichzeitig auch als wichtigster Stolperstein gesehen. Serviceorganisation der Zukunft Das Call Center wird zu einer Art „Kampfstern Galactica“ und darf nicht als triviale Managementaufgabe betrachtet werden. Es ist ein Kristallisationspunkt für die technologische Entwicklung im gesamten Unternehmen und wird zur größten technologischen Herausforderung der nächsten Jahre. Provokant gesagt: Das ganze Unternehmen wird zum Call Center! Zugleich wird die Automatisierung des Kundenkontakts fortschreiten und sich vertiefen – mehr Geschäftseinheiten des Unternehmens der Zukunft werden in Call Center-Prozesse integriert, ebenso wie die Geschäftsprozesse quer durchs Unternehmen z.B. durch intelligentes Routing zunehmend automatisiert werden. Die Geschwindigkeit des Fortschritts im Kundenkontakt hängt somit zunehmend von der Prozessinnovation ab. Marktreport VB07 Vers 1 0 (2).doc Seite 12 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Mobile Trends: Treiber des Voice Business Voice ist die Klammer, die die zukünftige konvergente IP-Welt umschließt – in einer Welt konvergenter IP-Netzwerkinfrastrukturen kann das Telefon zur konventionellen Mensch-zuMensch-Kommunikation ebenso genutzt werden wie als sprachgesteuerter Dienst oder als Sprachsteuerung für verschiedenste Endgeräte (wie z.B. dem Fernseher oder der MovieDownload-Settopbox). Sprachtechnologie erweitert die Steuerungsmöglichkeiten mobiler, multimodaler Dienste, bietet einen zusätzlichen Kanal für die Datenein- und -ausgabe und ermöglicht eine nahtlose Interaktion von Dienst und Nutzer. Nach der Call Center-Automatisierung wird die Welt der Mobilen Dienste zum nächsten großen Treiber für das Voice Business! „On demand“-Services Das Voice Business entwickelt sich zur „enabling Technology“ für Mehrwertdienste, die von den Mobilfunkbetreibern zunehmend in Self Service Angebote integriert werden, da erst durch Sprachsteuerung eine komfortable, Endgeräte unabhängige Nutzung von neuen Mehrwertdiensten und Inhalten für viele Verbraucher möglich wird. Ein breites Angebot an Standardanwendungen kann dem Markt für Sprachanwendungen eine neue Dimension eröffnen – Sprachanwendungen werden für eine Vielzahl von Unternehmen oder Unternehmenseinheiten attraktiv, die bisher Entwicklungskosten, den Aufbau von Betriebskompetenz und die laufende Wartung/Administrierung von Inhouse- oder individuellen Hostinglösungen scheuen. Auch für Unternehmen mit kleineren und mittleren Anruferzahlen kommt so eine Sprachautomatisierung wirtschaftlich in Betracht. Die Service Provider verfügen über eine einzigartige Marktstellung, um für Unternehmenskunden komplette Kundeninteraktionsprozesse „end-to-end“ auszulagern. Mit Business Process Outsourcing Services positionieren sie sich heute schon als die Kundenkontaktservice-Outsourcer der Zukunft und treten in direkte Konkurrenz mit Call Centern „alter Schule“: Aufgrund ihrer Nähe zu den Intelligenten Netzen, ihrer Erfahrung im Handling und der Automatisierung von Massenkundenkontakten und ihrer Prozesskompetenz insbesondere auch in der Anbindung disparater Backend-Systeme sind sie ideal aufgestellt, durch die Übernahme geschlossener Prozessketten neue Märkte für sich zu schaffen. Marktreport VB07 Vers 1 0 (2).doc Seite 13 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 B.2 Kennzahlen VOICE Award 2006 Fokusbranchen Nr. 1 in % Nr. 2 in % Nr. 3 in % VOICE Award 2005 20% Telekommunikation 17% Transport, Logistik und Verkehr 12% Finanzen HC/Strateco Studie 2003 29% Medien und Unterhaltung 24,1% Finanzen 20% Transport, Logistik und Verkehr 17% Telekommunikation Anwendungsschwerpunkte %-Anteil Enterprise Service 76% Transaktionsdienste 71% Transaktionsdienste %-Anteil Mehrwertdienste /Kampagnen 24% Mehrwertdienste 29% Mehrwertdienste %-Anteil B2C-Anwendungen 93% B2C 91% B2C 87% ServiceVerbesserung 17,3% ServiceVerbesserung 69% Automatisierung 17,3% Automatisierung 67% Kundenbindung 16,7% Kostensenkung Betriebswirtschaftliche Ziele (Rangordnung) Nr. 1 in % Nr. 2 in % Nr. 3 in % 16,9% Transport und Logistik 13,3% Telekommunikation 60,2% Transaktionsdienste 28% Mehrwertdienste 85,5% B2C 68,7% Automatisierung 66,3% Kostensenkung 47% Kundenbindung Reichweite, Nutzungsquote und Effizienz Ø Anzahl der Unique User 43.333 User 83.125 User 115.000 User 1.201 Anrufe/Tag 2.111 Anrufe/Tag 8.500 Anrufe/Tag 97 Sekunden 92 Sekunden 120 Sekunden 86,13% Call Completion 90,56% Call Completion 75% Call Completion 5 Monate 3,81 Monate 6 Monate Ø Investitionskosten (Capex) 141.667 EUR 92.105 EUR 314.000 EUR Ø Amortisierungsdauer 9,85 Monate 9,53 Monate 8 Monate 79,53 EUR/Monat 532,90 EUR/Monat Opex: nicht erhoben 0,19 EUR/Anruf 0,21 EUR/Anruf Kosten: nicht erhoben 209.091 EUR 110.000 EUR nicht erhoben 58 58 165 89% 83% 50% 100% mehr als 2 89% mehr als 2 20% mehr als 2 Ø Call Volumen pro Tag Ø Dauer pro Anruf Ø Fallabschlussrate (Call Completion) Time-to-Market und ROI Ø Realisierungsdauer in Monaten Ø Betriebskosten (Opex) Ø Kosten je Anrufer Ø Ersparnis Technische Leistungsmerkmale Ø Anzahl der installierten Ports %-Anteil VerbundwortErkennung und mehr Integrationstiefe zwei Schnittstellen und mehr in % Tab.: Kennzahlen des Voice Business Die Entwicklung im Voice Business veranschaulicht der Vergleich wichtiger Kennzahlen, die in den vergangenen vier Jahren im Rahmen unserer Marktstudien erhoben wurden. Die dieser Tabelle zugrundeliegenden Kennzahlen stammen aus den Studien [1], [2] und [3]. Marktreport VB07 Vers 1 0 (2).doc Seite 14 von 50 Nr. 1002306 MARKTREPORT C Voice Business 2007 © Mind | STRATECO Einleitung: Vorurteile und Fehleinschätzungen im Voice Business Der Markt für Sprachdialogsysteme hat mit einer besonderen Problematik zu kämpfen: Manche Vorurteile halten sich trotz gewaltiger Entwicklungssprünge hartnäckig und verzerren das Bild der Technologie in den Medien und beim Verbraucher, aber auch bei Entscheidern. Gleichzeitig leidet die Branche selber in manchen Punkten schlicht an Selbstüberschätzung: Der Technologie werden Leistungen zugesprochen, die gar nicht erfüllbar sind. Die wichtigsten dieser Vorurteile und Fehleinschätzungen sind: Vorurteil: Das Investment in ein Sprachportal lohnt nicht. Sachlage: Auf den ersten Blick erscheinen die Investitionssummen für eigenbetriebene Sprachlösungen den Entscheidern oft sehr hoch; insbesondere im Vergleich zu Web-Lösungen. Dabei werden jedoch nachgewiesene ROI-Ergebnisse ignoriert: So war der ROI der ca. 40 für den VOICE Award 2006 [3] getesteten Anwendungen im Durchschnitt schon nach 10 Monaten erreicht. Vorurteil: Sprachlösungen sind teuer. Sachlage: Das mag in absoluten Zahlen durchaus so sein. Noch in 2005 lagen die Investitionskosten der für die VOICE Awards 2005 getesteten Lösungen im Durchschnitt bei ca. 100.000 EUR. Es gibt aber heute deutlich preiswertere Lösungen und auch das wachsende Angebot an Hosting-Lösungen trägt dazu bei, das Investitionsrisiko zu senken. Vor dem Hintergrund hoher Call Volumen, hoher Call Resolution Raten und hoher Kundenzufriedenheit geht die Rechnung jedoch im Allgemeinen zugunsten der Sprachanwendung aus: Laut Testbericht „Testbericht VOICE Award 2006 – die besten deutschsprachigen Sprachapplikationen“ [3] liegen die durchschnittlichen Einsparungen mit den getesteten Anwendungen bei 200.000 EUR. Vorurteil: Sprachanwendungen können nur stupide Prozesse automatisieren. Sachlage: Der Stand der Technik und millionenfach erprobte, komplexe Anwendungen zum Beispiel für Self Service oder Entertainment beweisen, dass auch vielschichtige, tief in die ITInfrastruktur und die Geschäftsprozesse integrierte Prozesse gut abgebildet und automatisiert werden können. So hat etwa die Telekom mittlerweile über 400 Prozesse mit ihren Sprachdialogsystemen automatisiert, manche state-of-the-art-Bankinganwendungen decken gut und gerne 100 Prozesse ab. Fehleinschätzung: Man kann alle Kundenkontaktprozesse mit Sprachdialogsystemen automatisieren. Sachlage: Sprachautomatisierung funktioniert nur dann, wenn der Kunde sie annimmt. Selbst wenn man jeden Prozess automatisieren könnte – lohnen wird es sich nur dann, wenn die Nutzer die Sprachlösung in Massen nutzen. Denn der wirtschaftliche Erfolg hängt von der Nutzungshäufigkeit ab. Hochkomplexe Anwendungen verursachen im Allgemeinen auch hohe Entwicklungs- und Betriebskosten; die lassen sich nur rechtfertigen, wenn entsprechende Nutzungs- und Automatisierungsquoten dem entgegenstehen. Vorurteil: Sprachcomputer verschrecken Kunden – die wollen persönlichen Service. Sachlage: Grundsätzlich ist die Aussage richtig, insbesondere wenn die Kunden ohne Begründung und ohne erkennbaren Nutzen auf Sprachcomputer stoßen. Studien wie die Akzeptanzstudie 2006 der Initiative VOICE BUSINESS und dem Fraunhofer IAO [6] weisen aber nach, dass Kunden unter bestimmten Voraussetzungen sogar lieber den Sprachkanal wählen: Wenn es z.B. um sensible Themen (Inkasso/Abfrage negativer Kontostände) geht oder der Nutzen hoch ist (keine Wartezeit, 24/7-Service, niedrige Transaktionskosten). Vorurteil: Ältere Benutzer kommen mit dem Sprachcomputer nicht zurecht. Sachlage: Faktisch ist genau das Gegenteil der Fall. Senioren machen ihre kognitiven „Schwächen“ (im Vergleich zu jungen Nutzern) durch geübte Problemlösungsstrategien mehr als wett: Fachleute berichten, dass gerade bei geführten Voice User Interfaces (kurz VUI) wie z.B. in Banking-Applikationen die Senioren sich oft schneller in der Anwendung zurechtfinden als die impulsiver agierenden „Youngsters“. Zudem nehmen die Senioren den Sprachcomputer auch mit weniger Vorbehalten an: Sie akzeptieren das VUI, lassen sich auf die Hilfestellungen im Dialog ein und wickeln so ihre Anliegen vergleichsweise erfolgreich ab. Marktreport VB07 Vers 1 0 (2).doc Seite 15 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Vorurteil: Bekannte Werbe- oder Radiosprecher sind ideal, um die Prompts einer Sprachanwendung aufzunehmen. Sachlage: Gerade professionelle Radiomoderatoren oder auf Werbung spezialisierte Sprecher tun sich im Studio oft schwer, die besondere Melodieführung ihres Metiers abzulegen. Das führt dazu, dass die Persona als „gekünstelt“ und überemotionalisiert empfunden wird. Viele Nutzer fühlen sich von solch melodischen, „singenden“ Personas in Wirklichkeit nicht besonders angesprochen. Vorurteil: Eine gute Persona (die Stimme der Applikation) muss sich an den Sprachgewohnheiten der Zielgruppe orientieren. Sachlage: Eher das Gegenteil ist der Fall: Junge Nutzergruppen empfinden auf jugendlich getrimmte Personas oft als „anbiedernd“ – und ziehen tatsächlich eher seriöse, geradlinige den „coolen“ Personas vor. Diese Erfahrung deckt sich mit Studien aus dem Banking-Bereich, die klar nachweisen, dass der szenige Jugendliche eher zum Schalter mit dem seriösen Angestellten als zum trendig gekleideten Azubi geht. Fehleinschätzung: Das Voice User Interface ist die natürlichste und beste Schnittstelle für die Mensch/Maschine-Kommunikation. Sachlage: Die Sprachschnittstelle ist nur eine von vielen Schnittstellen und konkurriert mit dem Internetkanal, dem Agentenkontakt und auch der Tastaturwahl. Welcher Kanal für welche Interaktionsform der beste ist, entscheidet jedoch zuerst der Kunde auf Basis der zur Verfügung stehenden Kanäle. Für PIN-Eingaben z.B. ist DTMF oft besser geeignet und wird dementsprechend auch bevorzugt. Für die Banküberweisung kann online-Banking einfacher sein als der Sprachkanal. Daher betonen Fachleute auch stets, dass der Sprachkanal vor allem im Kanalmix seine Stärken ausspielen kann – wenn beispielsweise der online-Zugang nicht verfügbar oder die Warteschleife zum Agenten zu lang ist. Vorurteil: Tastatursysteme (DTMF) bieten mehr Effizienz als Sprachsteuerung. Sachlage: Entscheidend ist, wie die Portierung von der DTMF-Lösung auf den Sprachkanal erfolgt: Stehen den Nutzern ausreichende Hilfestellungen zur Verfügung, mit denen sie schnell den richtigen Umgang mit der Sprachanwendung erlernen können? Denn wenn der Nutzer sich erst in die Sprachanwendung einfinden, Abkürzungen (sogenannte Short Cuts) in der Dialogführung mühsam selber entdecken muss, dann kann DTMF tatsächlich schneller sein. Vergleicht man aber die Bedienungszeiten von modernen NLU-Lösungen1 mit der Navigation in DTMF-Menus durch jeweils geübte Nutzer, dann ist die Sprachsteuerung die effizientere Lösung. Vorurteil: Dialekte und Akzente bringen Sprachanwendungen an ihre Grenzen. Sachlage: Sowohl Dialekte als auch Akzente werden von state-of-the-art-Systemen problemlos verarbeitet: Akzente können durch die Erfassung der akzenttypischen Aussprachevarianten, Dialekte durch die Integration des dialekttypischen Vokabulars sehr gut abgebildet werden. Anwendungen z.B. in der Schweiz machen deutlich: Akzente, Dialekte, Mehrsprachigkeit sind keine Problemstellung mehr für ein modernes Sprachdialogsystem. Vorurteil: Sprachauthentifizierung scheitert, wenn der Sprecher krank ist oder seine Stimme „verloren“ hat. Sachlage: Unabhängig von der „Tagesform“ einer Stimme erfasst die Spracherkennung die unveränderlichen Charakteristika eines typischen Sprachmusters. Heiserkeit o.ä. beeinträchtigt die Funktion einer sprachbiometrischen Lösung nicht so, dass ihre Funktionalität leidet. Fehleinschätzung: Die Implementierung einer Sprachanwendung ist kein Problem. Sachlage: Oft ergibt sich erst im Projekt die Komplexität der Backend-Anbindung, der Prozessstrukturierung und des Anwendungsbetriebs. Anbieter, die hier den Mund zu voll nehmen, können im Projektverlauf auf Schwierigkeiten stoßen, die mit dem vereinbarten Budget nicht mehr abgedeckt sind. 1 NLU = Natural Language Understanding, vgl. auch Glossar Marktreport VB07 Vers 1 0 (2).doc Seite 16 von 50 Nr. 1002306 MARKTREPORT D Voice Business 2007 © Mind | STRATECO Status Quo: Sprachautomatisierung in der Wirtschaft Dieses Kapitel beleuchtet den gegenwärtigen Markt für das Voice Business aus Betreibersicht. Die wichtigsten Fragen in diesem Zusammenhang sind: » Welche Ziele verfolgen Unternehmen mit dem Einsatz von Sprachdialogsystemen? » Welchen Stellenwert nehmen Sprachdialogsysteme heute unter den Kommunikationskanälen im Contact Center ein? Welche Anrufvolumina werden damit sprachautomatisiert abgewickelt? » Was sind die wichtigsten Einsatzfelder für Sprachdialogsysteme? » Welche Branchen setzen besonders auf die Automatisierung des Kundenkontakts per Sprachdialogsystem? Die zugrundeliegenden Daten wurden erhoben im Rahmen des Leistungstests zum VOICE Award 2006 [3]. D.1 Einsatzziele: Warum Sprachautomatisierung? Welche Motive und Ziele entscheiden maßgeblich über die Einführung von Sprachapplikationen? Ausschlaggebend für die Einführung einer Sprachapplikation sind laut dem „Praxisreport: Sprachapplikationen auf dem Prüfstand“ [1] meist betriebswirtschaftliche Überlegungen, aber auch ein gewisser Handlungs- und „Leidensdruck“, also die Kundenanforderungen in einem wettbewerbsorientierten Marktumfeld. Die wichtigsten betriebswirtschaftlichen Argumente für die Einführung einer Sprachapplikation sind die Serviceautomatisierung und Kostensenkungen. Eine Verbesserung der Kundenbindung und eine Engpassbehebung im Call Center sind die zweitwichtigsten Ziele, die ein Unternehmen durch die Einführung einer Sprachapplikation erreichen will. Diese beiden Ziele richten sich eher auf eine Verbesserung der Kundenzufriedenheit und damit auch der Loyalität der Kunden. Serviceautomatisierung und Kostensenkung hingegen bringen unmittelbar Ersparnisse mit sich. Von untergeordneter Bedeutung sind die Realisierung zusätzlicher Umsätze über den Voice Service. Fallbeispiele: Sprachportale für Serviceautomatisierung und Kostensenkung Das T-Com Sprachportal für Vertrieb, Kundenbetreuung und Service dient der Vorqualifzierung von Kundenanliegen und gleichzeitig dem Aussortieren sogenannter „Blind Calls“, die eigentlich einem anderen Unternehmen der Deutschen Telekom gelten. Das Endkunden-Sprachportal hat mit den größten Traffic in Europa und bietet dank des Eliminierens von Blindverkehr und „Junk Calls“ besonders hohe Kosteneinsparpotentiale. Auf ca. 1.500 Ports des Voice Web Portals, der Managed Service-Sprachdialogplattform von T-Com, nutzen bis zu 300.000 Anrufer täglich das Portal und formulieren in sprachgesteuerten Dialogen ihre Anliegen, bevor sie mittels intelligentem Routing zum richtigen Call Center-Agenten durchgestellt werden. Das Postbank Telefonbanking-Sprachdialogsystem erlaubt das Ausführen einer Vielzahl von Diensten (über 100), wie zum Beispiel der Abfrage des Kontostands, der getätigten Kontoumsätze und Wertpapierpreise sowie dem Tätigen von Überweisungen, der Einrichtung von Daueraufträgen oder dem Abruf allgemeiner Produktinformationen per Tonwahl und per Sprache. Die Menuführung fasst die Themen (Konto bezogene und Sales Themen) zusammen und schafft einen guten Dialogfluss innerhalb der Themenbereiche. Täglich werden unter den Nummern 0180-30 40 500, 600 und -700 über 100.000 Anrufe abgewickelt. Ohne (externen) „Leidensdruck“ und klare betriebswirtschaftliche Vorteile lassen sich die Investitionen in Sprachdialogsysteme nicht rechtfertigen. Serviceautomatisierung und Kostensenkung sind die wichtigsten Gründe (notwendige Bedingung) im Entscheidungsprozess für eine Sprachapplikation. Eine Verbesserung der Kundenbindung und eine Engpassbehebung im Call Center sind die zweitwichtigsten Ziele (hinreichende Bedingung), die ein Unternehmen durch die Einführung einer Sprachapplikation erreichen will. Marktreport VB07 Vers 1 0 (2).doc Seite 17 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Kundenkontaktformen: Die Dominanz des Sprachkanals Der Sprachkanal ist der wichtigste Kontaktkanal im Contact Center - niemand kann darauf verzichten, seinen Kunden am Telefon zur Verfügung zu stehen, auch wenn fast 90% bzw. 80% aller befragten Contact Center [5] den Fax- und den eMail-Kanal anbieten. Denn der Sprachkanal macht zur Zeit 85% des gesamten Kontaktaufkommens in den befragten Contact Centern aus. Zwar ist die Verwendung von eMails im Vorjahresvergleich um 28 Prozent gestiegen, macht aber nur etwa ein Zwölftel (8,5 Prozent) aller Kundenkontakte aus. Da gleichzeitig das Kontaktaufkommen bei den Kanälen Briefpost (–30% im Vergleich zum Vorjahr) und Fax (–22% im Vergleich zum Vorjahr) deutlich rückläufig ist, bleibt der Sprachkanal der dominierende Kanal im Kundenkontakt. Kommunikationskanäle im Contact-Center • Der Sprachkanal ist das wichtigste Kontaktmedium (in % der Befragten) 120 100 100 87,3 79,2 80 55,5 60 40 19,1 20 12,5 0 Sprache Fax Post E-Mail WebInteraktion SMS/MMS Quelle: Contact Center Trends 2006 © 2007 voice-community.de Abb.: Kommunikationskanäle Entsprechend groß ist das Bestreben der Call Center, einfache und standardisierbare Kontaktprozesse zu automatisieren. Einen Eindruck von der zunehmenden Automatisierung des Kundenkontakts liefert die Anzahl der installierten Sprachports (Vgl. Grafik - IVR-Ports), der Telefon-„Leitungen“, die für eine Automatisierung des Dialogs mit dem Anrufer eingerichtet sind: Aktuell werden laut Datamonitor knapp über 300.000 Sprachports in Deutschland betrieben. Seit dem Jahr 2004 wurden hierzulande über 50.000 neue Sprachports installiert. Rechnet man die Zahl der Ports hoch auf das darüber abgewickelte automatisierte Kontaktvolumen, so kann man von mehr als 38 Mio. automatisierten Anrufen pro Tag ausgehen. Marktreport VB07 Vers 1 0 (2).doc Seite 18 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Sprachcomputer auf dem Vormarsch • Mehr als 38 Mio. automatisierte Service-Anrufe pro Tag in 2006* Installierte Basis IVR-Ports in Deutschland in tausend (2004-2009). 400 350 300 251 262 2004 2005 280 301 324 350 250 200 150 100 50 0 2006 2007 2.008 2.009 * Eigene-Schätzung auf Basis von Datamonitor © 2007 voice-community.de Abb.: IVR-Ports in Deutschland Anwendungstypen: Wo lohnt Sprachautomatisierung besonders? Bei der Einführung von Sprachapplikationen zur Sprachautomatisierung von Kundenkontaktprozessen lassen sich zwei grundsätzlich unterschiedliche Zielrichtungen identifizieren: Der erste Ansatz beim Einsatz von Sprachapplikationen zielt darauf ab, die Automatisierungsund Rationalisierungspotenziale der Kundenselbstverwaltung zu mobilisieren: Kostensenkung, Effizienzsteigerung und Call Center-Optimierung sind hier die Argumente für den Einsatz von Sprachapplikationen. So lassen sich Personalkosten senken, Auslastungsspitzen verringern und beim Aufbau eines kostengünstigeren „24/7-Services“ erhebliche Einsparungen realisieren (in einem Verhältnis von bis zu 1:10 im Vergleich zum Call Center-Betrieb). Zugleich profitieren die Organisationen von effizienteren Prozessen und einer Erhöhung der „Call Resolution Rate“. Im Hinblick auf die Call Center-Optimierung bringen Sprachapplikationen bessere Ressourcennutzung und höhere Mitarbeiterzufriedenheit. Fallbeispiele: Automatisierungs- und Rationalisierungspotenziale der Kundenselbstverwaltung Das neue Auskunftssystem der Deutschen Bahn bietet bundesweite Fahrplanauskünfte über alle Zugverbindungen der Deutschen Bahn und Verbindungen zu den wichtigsten europäischen Bahnhöfen. Es kennt insgesamt 7.000 Haltepunkte im In- und weitere 1.000 im Ausland. Über 1 Millionen Kunden haben den Sprachcomputer seit dem Relaunch im Mai 2006 bereits angerufen. Der Service Manager von T-Mobile unterstützt die Kunden bei einer Fülle von Geschäftsvorfällen: Abrufen von Produktinformationen und Dienstleistungen, Tarifwechsel und Wechsel der Optionen innerhalb eines Tarifs, Änderung der Grundeinstellungen und Durchführen von Sonderaktionen. Der Kunde kann zudem aus dem Service Manager heraus einen Agenten zu Hilfe rufen. Auch bietet der Service Manager eine Guided Tour, die das Ausprobieren der angebotenen Dienste erlaubt. Die Anwendung wickelt über 20.000 Anrufe am Tag ab. Beim zweiten Ansatz geht es darum, das Umsatzpotenzial des Voice User Interfaces für eine neue Generation an Mehrwertdiensten zu nutzen: Netzintegrierte Sprachapplikationen ermöglichen eine komfortable, Endgeräte-unabhängige Nutzung von neuen Mehrwertdiensten und Inhalten. Mehrwertdienste stehen damit als Trägerdienste mit flexiblen AbrechnungsProzessen für verschiedenste Anwendungen zur Verfügung. Auch als Voice Gateway zu WebInformationen haben Sprachapplikationen Potenzial, sofern die richtige Verknüpfung zu anderen Mehrwertdiensten gefunden wird. Zudem ist ein Voice-Portal als Plattform für Dritte nutzbar, bestehende Inhalte können hierüber mehrfach und cross-medial vermarktet werden. Marktreport VB07 Vers 1 0 (2).doc Seite 19 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Auch als Tool für Marketing-Kampagnen verschiedenster Art wird Sprachtechnologie zunehmend eingesetzt. Fallbeispiele: Netzintegrierte Sprachapplikationen für die Nutzung von Mehrwertdiensten oder für Marketingkampagnen komfortable, Endgeräte-unabhängige Viasuisse ist eine dreisprachige Verkehrsauskunft über den Zustand auf dem Schweizer Straßennetz. Anrufer können mit diesem System sehr schnell die Verkehrslage auf einer bestimmten Autobahn und u.a. die Befahrbarkeit von Alpenpässen eruieren. Viasuisse wickelt laut Betreiber rund 1.000.000 Anrufer pro Jahr ab. In Spitzenzeiten nutzen über 120.000 Anrufer pro Woche diesen Dienst. Die Task Completion Rate von über 90% beweist, dass das System Anrufer aus drei Sprachfamilien „narrensicher“ informiert. Mit einer Investition von unter 100.000 EUR und Aktualisierungskosten von unter 2.500 EUR im Jahr ist Viasuisse ein Dienst, der zu überschaubaren Kosten vielen Autofahrern täglich die schnelle Entscheidung über die beste Route zum Ziel abnimmt. Der 1. FC Köln nutzte in einer zeitlich begrenzten Aktion ein interaktives sprachgesteuertes Gewinnspiel mit der Stimme von Lukas Podolski. Ziel war die Emotionalisierung der Marke „1. FC Köln“ und die Generierung von Kundenprofilen und -bindung. Der Erfolg des Dienstes hat verschiedene Ursachen: Podolski hat einfallsreiche Ansagetexte aufgesprochen, die gute, aber auch kritische Dialoge zwischen Fans und Star ermöglichen, der Dienst wirkt lebendig und das einfach aufgebaute Gewinnspiel sorgte dafür, dass alle Anrufer auf den Gewinn, ein Abendessen mit Lukas Podolski, hoffen durften. Obwohl die Nummer des „Poldi-Phons“ nur auf den Tablettunterlagen der Kölner MacDonalds-Restaurants beworben wurde, hinterließen einige Tausend 1. FC Köln-Fans ihre Kontaktdaten und legten mit dem guten Gefühl auf, persönlich mit ihrem Star gesprochen zu haben. Gemeinsamer Nenner beider Zielrichtungen ist die Kundenbindung. Sprachapplikationen sollen schnellere und bessere Dienstleistungen ermöglichen – Erfolgsfaktoren sind hierfür eine hohe Nutzerakzeptanz des Dialogs und eine hohe Service-Verfügbarkeit. des Leuchtturmcharakters der dort teilnehmenden, getesteten und dokumentierten Seit drei Jahren wird im Rahmen des VOICE Awards2 regelmäßig eine Bestandsaufnahme durchgeführt und ein Test von Sprachapplikationen durchgeführt. Dieser einzigartige jährliche Benchmark gibt einen guten Überblick über Anwendungstypen und die auf Sprachautomatisierung setzenden Branchen im deutschsprachigen Raum: TOP3 - Auskunft, Self-Service und Vorqualizierung n = 31 Quelle: Testbericht – Voice Award 2006 © 2007 voice-community.de Abb.: Anwendungstypen 2 Vgl. www.voice-award.de Marktreport VB07 Vers 1 0 (2).doc Seite 20 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Ca. 75% aller für den VOICE Award 2006 angemeldeten Services fielen in die Kategorie Voice Automation. Die wichtigsten Anwendungsgebiete sind hier automatisierte Auskunftssysteme und Directory Assistance (insgesamt 27%), Self Service-Systeme (18%) und das Call Routing per Sprachsteuerung (14%). Daneben waren aber auch Bestellsysteme (5%), Authentifizierungslösungen (5%), Help Desk- (3%) sowie Track & Trace-Anwendungen (3%) vertreten. Damit ergibt sich im Bereich Voice Automation ein erstaunlich breites Anwendungsspektrum, mit einer starken Fokussierung auf einfache, häufig wiederkehrende und gut standardisierbare Anfragen, aber auch mit kompletten Self Service-Angeboten innerhalb von Voice-Portalen. Sichtbar wird im Vergleich zum letzten Jahr auch ein deutlicher Zuwachs an komplexen Auskunftsdiensten. Nur knapp ein Viertel aller Teilnehmer an den VOICE Awards bewarb sich mit TelefonMehrwertdiensten oder Marketing-Kampagnen via Sprachportal. Dominierend unter diesen Mehrwertdiensten waren beim VOICE Award 2006 die Infotainment-Angebote. Neue Wettbewerber um die VOICE Awards sind Sprachanwendungen für den Einsatz im Marketing. Diese innovative Anwendungskategorie stellt bereits knapp 16% aller Bewerbungen. Der Einstieg in dieses Anwendungsszenario erfolgt logischerweise zunächst über einfache Dienste und Gewinnspiele, da diese dem Endverbraucher einen klar erkennbaren Nutzen bieten und so eine schnelle Gewöhnung an das neue Medium ermöglichen. Mobile Dienste dominieren. Die Bewerbung von leicht einprägsamen Kurzwahl-Nummern ist ein Schlüssel zum Erfolg, um Reichweite für diese innovativen Dienste und damit mehr Akzeptanz bei Werbetreibenden für das neue Medium zu schaffen. Ein hohes Potenzial für die Generierung von Mehrwerten bietet auch die Sprachaktivierung von einfachen Kommunikationsfunktionen im Netz, die bislang nur über komplizierte Endgerätefunktionen bedient werden konnten. Leider tut sich in diesem Feld derzeit wenig Neues. Es ist aber zu erwarten, dass im Rahmen der geplanten Infrastruktur-Projekte (Stichwort: IP) und den Investitionen in die Erweiterung des „Intelligenten Netzes“ durch Telekom & Co. die Sprachsteuerung von Netzfunktionen ein zentrales Element sein wird. Fallbeispiel: Sprachaktivierung von Netzfunktionen Das Leistungsmerkmal „Rückruf bei ‚besetzt’“ steht allen T-Com Kunden an ihrem T-Net- oder T-ISDN-Anschluss bereits als Regelleistung ohne Zusatzkosten zur Verfügung. Seit Februar 2005 können T-Com-Kunden, die am analogen Anschluss bisher durch Drücken der R-Taste sowie anschließend von *37# den Rückruf-Vorgang einleiteten, zusätzlich per Sprachsteuerung Rückruf bei ‚besetzt’ aktivieren. Die neue Technik mittels Sprachsteuerung soll das Merkmal nun vor allem für Kunden mit einfachen Telefonen ohne Display-Steuerung vereinfachen. T-ComKunden werden im Besetztfall nach dem dritten Besetztton gefragt, ob sie verbunden werden wollen, sobald die Leitung frei ist. Sobald die Einzelworterkennung das "Ja" des Anrufers sicher versteht, wird „Rückruf bei ‚besetzt’“ aktiviert. Ist der Besetztzustand beendet, wird dies dem Anrufer signalisiert und er wird automatisch verbunden. Derzeit werden laut T-Com etwa 350.000 Rückrufe am Tag mit dem System aktiviert, das entspricht zehn Prozent aller Anrufer, die auf besetzte Leitungen stoßen. Bei 65 Prozent der Rückrufwünsche kommt auch eine erfolgreiche Verbindung zustande - das bedeutet zusätzliche Umsätze für das Unternehmen. Anwendungen zur Serviceautomatisierung dominieren klar, Mehrwertdienste und Kampagnen spielen noch eine untergeordnete Rolle. Der Bereich der Service-Automatisierung zeigt ein erstaunlich breites Anwendungsspektrum, mit einer starken Fokussierung auf einfache, häufig wiederkehrende und gut standardisierbare Anfragen, aber auch mit kompletten Self Service-Angeboten innerhalb von Voice-Portalen. Sichtbar wird auch ein deutlicher Zuwachs an komplexen Auskunftsdiensten. Sprachcomputer als Mehrwertdienst ermöglichen neue Wettbewerbsstrategien und Produkte. Besonders viel versprechend scheinen den Anbietern von Mehrwertdiensten Auskunftsdienste in Verbindung mit zusätzlichen Infotainment-Angeboten zu sein. Es braucht noch Zeit, um den Sprachkanal als wertschöpfendes Element der Markenbildung und -kommunikation und damit in den Marketing-Budgets der Unternehmen zu etablieren. Die Vorteile liegen jedoch auf der Hand: Der Sprachkanal ist ein neues, stark emotionalisierendes und hoch interaktives Medium für die Zielgruppenkommunikation im Marketing. Marktreport VB07 Vers 1 0 (2).doc Seite 21 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Branchen, Geschäftsmodelle und Anwendungsfelder: Erfolg mit Sprachapplikationen Aus der Teilnehmerstruktur der VOICE Awards 2006, die zwar nicht repräsentativ ist, aber im Vergleich mit den Vorjahren einen wertvollen Benchmark zu Entwicklungstrends und aktuellen Deployments bietet [3], lassen sich Antworten auf folgende Fragen ableiten: » Welches sind die treibenden Branchen für den Einsatz von Sprachtechnologie, welche neuen Branchen setzen auf Sprachanwendungen? » Welche Relevanz haben sprachgesteuerte Telefon-Mehrwertdienste und innovative Marketing-Kampagnen unter Einsatz des Sprachkanals gegenüber Self Service-Angeboten, welche Rolle spielt also Umsatzgenerierung gegenüber angestrebten Kostenreduktionen? » Welche Prozesse automatisiert? und Services werden am erfolgreichsten mit Sprachtechnologie Knapp 50% der Teilnehmer des VOICE Awards 2006 kamen aus den Pionier-Branchen Telekommunikation, Transport, Logistik und Verkehr sowie den Banken, Finanzdienstleistern und Versicherungen. Auffällig ist auch der Trend zur Sprachautomatisierung in der öffentlichen Hand – 9% aller teilnehmenden Anwendungen kamen aus dem öffentlichen Bereich. Das Branchenspektrum ist insgesamt deutlich breiter geworden, fast alle relevanten Gebiete sind dieses Jahr vertreten wie etwa IT- und Technologieunternehmen (8%), die PharmaBranche (5%), Call Center-Betreiber (5%) sowie Energie- und Versorgungsunternehmen (3%). Erstmals haben auch Unternehmen aus der produzierenden Industrie (6%) am VOICE Award teilgenommen. Deutlich breiteres Branchenspektrum n = 42 Quelle: Testbericht – Voice Award 2006 © 2007 voice-community.de Abb.: Branchenspektrum Den Telefongesellschaften kommt nach wie vor eine besondere Bedeutung bei der Heranführung breiter Bevölkerungsschichten an das neue Medium und für die Nutzerakzeptanz von Sprachapplikationen zu. Das liegt einerseits daran, dass diese Unternehmen beim Einsatz von Sprachapplikationen durch Kostensenkungspotenziale im Dienst für Millionen Kunden am deutlichsten profitieren und sich ihnen anderseits durch sprachgesteuerte Informations- und Kommunikationsdienste neue Einnahmequellen bieten. Das Branchenspektrum ist insgesamt deutlich breiter geworden. [3] Marktreport VB07 Vers 1 0 (2).doc Seite 22 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 D.2 Die Kunden: Erfolgskennziffern aus Betreibersicht Ein Sprachdialogsystem rechnet sich überall dort, wo tagtäglich eine Vielzahl von Kundenkontakten stattfindet. Den größten Nutzen bringen Sprachcomputer einem Unternehmen da, wo die Sprachanwendung den Nutzern einen zusätzlichen Mehrwert bietet oder Geschäftsvorfälle nicht auf anderem Weg automatisierbar sind. Gerade wenn schon Web Self Service im Einsatz ist oder die Prozesse im Call Center vollständig im EDV-System abgebildet sind, ist es nur noch ein vergleichsweise kleiner Schritt, zumindest die einfachen Vorgänge auch per Sprache zu automatisieren. In diesem Kapitel beleuchten wir, warum die Sprachautomatisierung dem Tonwahlverfahren vorzuziehen ist, welche Automatisierungsraten mit Sprachdialogsystemen in der Unternehmenspraxis erzielt werden und warum die Integrationstiefe eines Sprachdialogsystems mit für seinen betriebswirtschaftlichen Erfolg entscheidend ist. Sprachautomatisierung leistungsfähiger als Tonwahlverfahren In 2004 bewältigten Sprachdialogsysteme durchschnittlich etwa 360.000 Anrufe im Monat [7]. Ca. 35% davon wurden mit dem Touchtone-Verfahren, immerhin gut 25% per Sprachsteuerung fallabschließend abgewickelt. Diese Automatisierungsraten drehten sich in den Folgejahren im Zuge der technologischen Entwicklung und der zunehmenden Erfahrung mit dem Design des Voice User Interfaces: Heute wickeln Sprachcomputert durchschnittlich 1 Mio. Anrufe pro Monat ab – davon fast 60% fallabschließend per Sprachsteuerung gegenüber nur noch unter 30% per Tastaturwahlverfahren. Sprachbefehl effizienter als “Drücken Sie…” • Sprachdialogsysteme schaffen bessere Automatisierungsraten 1,200,000 70% Speech Control 1,000,000 60% 50% 800,000 40% 600,000 Touch tone 400,000 200,000 30% 20% 10% 2004 2005 2006 0 0% Average monthly call volumes Percentage of calls automated and handled completely in a DTMF IVR system Quelle: Datamonitor Percentage of calls automated and handled completely in a speech-enabled IVR system © 2007 voice-community.de Abb.: Effizienz von Sprachsteuerung Dies belegt, was Branchenkenner schon lange behaupten: Mit Sprachsteuerung lassen sich wesentlich bessere Automatisierungsraten erzielen als mit dem umständlichen Tastaturwahlverfahren, das vom Nutzer größere Konzentration auf die Menusteuerung erfordert als die Sprachsteuerung. Zur Feststellung der Automatisierungsraten von Sprachdialogsystemen wird üblicherweise die Call Completion Rate herangezogen: Sie gibt den Anteil der Anrufe wieder, die erfolgreich durch die Sprachapplikation abgewickelt wurden und damit das Anliegen des Anrufers lösen konnten. Hohe Automatisierungsraten sind wichtig, da sie Treiber für einen schnellen ROI und ein positives Indiz für einen hohen Nutzen der Anwendung sind. Marktreport VB07 Vers 1 0 (2).doc Seite 23 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Zwei Randbedingungen bestimmen maßgeblich die Automatisierungspotenziale: Einerseits definieren das Medienverhalten, die Motivation (d.h. der von den Nutzern erkannte Mehrwert einer Sprachanwendung) und die Nutzungshäufigkeit der Zielgruppe einer Sprachanwendung den Erfolg eines Dienstes. Zum anderen setzt die in den Business Rules zum Ausdruck kommende Unternehmenspolitik die wesentlichen Rahmenbedingungen für den Umsetzungserfolg einer Sprachanwendung. Die Ergebnisse des VOICE Award 2006 [3] machen deutlich, wie sehr Sprachanwendungen in den vergangenen Jahren verbessert werden konnten und wie gut sie inzwischen gerüstet sind, die Anliegen der Anrufer auch tatsächlich abzuwickeln: 85% aller teilnehmenden Anwendungen verzeichnen Fallabschlussraten von über 75% – ein klarer Beleg dafür, dass eine Vielzahl von Prozessen erfolgreich automatisiert werden kann. 38% der Teilnehmer gaben sogar an, dass ihre Anwendungen 90% und mehr der Anrufe fallabschließend behandeln. Dass noch 2005 nur 51% der Anwendungen solche Call Resolution Raten aufwiesen, zeigt, dass die neuen, „jungfräulichen“ Systeme immer auch einen gewissen Tuningbedarf haben – Sprachanwendungen werden eben wie guter Wein mit der Zeit immer besser! Grundsätzlich läßt sich festhalten, dass alle Fallabschlussraten von über 50% vor dem Hintergrund des Kundennutzen und der Business Rules als erfolgreich angesehen werden können – auch beim VOICE Award 2006 erreichten wieder deutlich über 90% aller Anwendungen diese und höhere Quoten. Allerdings soll in diesem Zusammenhang darauf hingewiesen werden, dass die Teilnehmer am VOICE Award die „Leuchttürme“ der Branche sind und die erreichten Fallabschlussraten durch die hinter diesen Anwendungen stehende Erfahrung gegebenenfalls höher sein können als im Durchschnitt über alle hierzulande betriebenen Anwendungen. 86% „Erfolgsquote“ in der fallabschließenden Bearbeitung n = 42 Quelle: Testbericht – Voice Award 2006 © 2007 voice-community.de Abb.: Automatisierungsraten Sprachautomatisierung schafft dort den höchsten Nutzen, wo Geschäftsvorfälle nicht auf anderem Wege automatisierbar sind oder die automatisierte Anwendung den Nutzern einen hohen Mehrwert liefert. Je höher der von den Verbrauchern empfundene Kundennutzen ist, desto größer ist auch die Akzeptanz eines Sprachdialogsystems. Erfolg und Leistungsfähigkeit einer Sprachanwendung ebenso wie der erzielbare ROI hängen also unmittelbar von den Faktoren Anwenderverhalten und Business Rules der Anwendung ab. Die eigentliche Anruflänge ist nur vor dem Hintergrund des Anrufer-Anliegens relevant – man kann nicht pauschal sagen, Anrufer würden einen längeren Dialog mit dem System verweigern. Marktreport VB07 Vers 1 0 (2).doc Seite 24 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Der VOICE Award 2006 zeigt aber auch, dass neuere Systeme tendenziell eine niedrigere Fallabschlussrate aufweisen als alte, „gut eingespielte“ Systeme. Auch dass die Betreiber sich dessen bewusst sind und offensichtlich den VOICE Award dazu nutzen, Verbesserungspotenziale zu erkennen und umzusetzen, spricht für das gewachsene Verständnis dafür, dass eine sehr gute Anwendung eben auch sehr gut getunt und eingestellt sein muss – und das braucht immer etwas Zeit und Erfahrungen mit dem Live-System. Höhere Integrationstiefe schafft zusätzliche Mehrwerte Die Analyse der Schnittstellen der Sprachdialogsysteme zu anderen Systemen gibt einen guten Eindruck über die Tiefe der Integration der Sprachapplikation in die umgebende, vorhandene Informationstechnologie der Unternehmen. Die Integrationstiefe der für den VOICE Award 2006 getesteten Anwendungen hat gegenüber dem Vorjahr in fast allen Bereichen signifikant zugenommen: Durchschnittlich verfügen die teilnehmenden Dienste über vier Schnittstellen. Alle untersuchten Services sind mindestens an zwei andere Systeme angeschlossen. Besonders im Trend liegt für die Unternehmen die Integration von Webdiensten (17,2% gegenüber 9,9%) und Telefonie (ACD 16,1% gegenüber 12,3%; CTI 14% gegenüber 9,3%). Integration in Call Center und Backend-Systeme immer wichtiger. n = 42 Quelle: Testbericht – Voice Award 2006 © 2007 voice-community.de Abb.: Integrationstiefe Das zeigt, dass Sprachanwendungen gut in die Geschäftsprozesse der Betreiber integriert werden können und innerhalb ihres Anwendungsszenarios mit den vorhandenen BackendSystemen harmonieren. Offene Architekturen und ein niedrigerer Integrationsaufwand lassen die Bedeutung von Webdiensten steigen. Um Sprachcomputer besser mit den Agenten im Call Center zu verknüpfen, helfen entsprechend die ACD- und CTI-Schnittstellen. Sprachanwendungen bilden heute nicht nur vollständige Geschäftsvorfälle ab und erlauben den Anrufern, Transaktionen komplett im Dialog mit dem System durchzuführen. Sie werden auch immer mehr mit Agenten-basierten Services verknüpft, um in einem Mix aus Automatisierung und menschlichem Kontakt die bestmögliche Kundenbetreuung zu gewährleisten. Unternehmen trauen Sprachdialogsystemen immer offensichtlicher zu, auch komplexe Interaktionen in Sprachanwendungen umzusetzen und zu automatisieren: Die Integration mit Produkt- und Kundendatenbanken, Warenwirtschaft, Billing und ERP-Systemen schafft die Voraussetzungen für umfassenden Self Service. Marktreport VB07 Vers 1 0 (2).doc Seite 25 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Die Integration mit ACD-, CTI- und CRM-Systemen schafft die Voraussetzungen für eine „intelligente“ Verknüpfung von automatisierten Diensten und qualifizierten Agenten-Services in der Kundeninteraktion im Sinne eines umfassenden Customer Value Managements. Das Interesse an der Backend-Integration von Sprachanwendungen ist vor allem getrieben von dem Wunsch nach der Realisierung von Geschäftspotenzialen: Durch intelligente Integration lassen sich Dialogverläufe optimieren und Kosten im Anwendungsbetrieb und bei der Agentengesprächszeit senken. Eine Personalisierung wirkt sich gleichzeitig sehr positiv auf die Kundenzufriedenheit aus. Zudem könnten Kundenwertpotenziale durch geeignete Cross- und Upselling-Strategien gehoben werden, die ohne die Informationen, die CRM-Systeme der Sprachanwendung in Echtzeit zur Verfügung stellen, nicht erkannt würden. Und natürlich interessieren sich viele Betreiber angesichts der von ihren Kunden genutzten Kontaktkanäle um eine Multi-Channel-Integration ihres Call Centers, um so eine kanalübergreifende, durchgängige Kundenerfahrung zu schaffen. Doch die Integration von CRM-Systemen, Rechnungslegung, Warenwirtschaft und Workflowmanagement in ein Sprachportal sowie der anderen Kontaktformen mit dem Sprachkanal ist nicht trivial. So müssen im Unternehmen entsprechende Datenverarbeitungssysteme vorhanden sein: Je mehr Informationen ein Call Center über seine Kunden besitzt und je besser diese Daten dokumentiert und strukturiert sind, desto bessere Ergebnisse wird eine Integration zeitigen. Aus Sicherheitsgründen empfiehlt sich, nicht direkt auf die zugrundeliegenden Datenbanken zuzugreifen, sondern einen zusätzlichen Weblayer einzuziehen, der dann über Standardschnittstellen (z.B. per XML oder SOAP) die benötigten Daten in der Sprachanwendung bereitstellt. Im nächsten Schritt müssen die vorhandenen Daten so repräsentiert werden, dass sie auch zu der Sprachapplikation passen: Errorhandling, Bestätigungsstrategie und Reparaturtechniken sind hier die Stichworte, die für eine sichere Verarbeitung der von den Backend-Systemen bereitgestellten Daten in der Sprachanwendung berücksichtigt werden müssen. Für die Ausgabe dynamischer Daten aus Backend-Systemen ist zusätzlich zu den prerecorded Prompts ein TTS erforderlich. Die Vorteile einer tiefen Integration von Backend-Systemen und Kontaktkanälen in Sprachanwendungen für Call Center liegen auf der Hand: Sie ermöglichen vor allem eine schnellere, zielführendere Gestaltung der Dialoge, eine Verbesserung der Anruferzufriedenheit und eine Verbesserung von Vertriebsergebnissen. Insbesondere Call Center, die über gut strukturierte Kundendaten verfügen, können durch den Einsatz dieses Wissens im Sprachdialogsystem schnell profitieren. Dennoch zeigte die Call Center World, dass die Call Center-Branche erst am Beginn einer systematischen Integration ihrer Datenbestände zur Sprachautomatisierung von Kundenkontaktprozessen steht. Eine tiefe Integration von Sprachanwendungen in andere Systeme erlaubt zudem das gezielte Erfassen und Analysieren von Daten über die Sprachanwendung und ihre Nutzung durch Voice Analytics: Hintergrundwissen: Voice Analytics Um die optimale Performance ihrer Systeme sicherzustellen und um mehr Informationen über ihre Kunden zu gewinnen, nutzen immer Unternehmen „Voice Analytics“. Voice Analytics unterteilt sich in zwei Bereiche: Application Analytics für die Analyse der Anwendungsperformance und Speech Analytics für die Analyse des Anruferverhaltens. Mit Application Analytics Tools, wie sie zum Beispiel Clickfox, Telenet oder Nuance anbieten, lassen sich eine Vielzahl von Informationen z.B. für Tuningvorhaben ableiten. Diese Tools liefern Parameter und Werte für die Bewertung der Performance, verringern den Aufwand für das Tuning von Sprachdialogsystemen signifikant und wirken sich positiv auf die Effizienz von Sprachanwendungen aus. Zugleich liefert Application Analytics wichtige Informationen über das Anruferverhalten. Zum Beispiel können Unternehmen, die ihre Kunden segmentiert haben, herausfinden, wie die verschiedenen Kundensegmente mit der Sprachanwendung interagieren und Aufschlüsse z.B. über das Verhalten der Premium Kunden im Vergleich mit anderen gewinnen, mit denen sich Kampagnenstrategien für das Cross- und Upselling gestalten lassen. Marktreport VB07 Vers 1 0 (2).doc Seite 26 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Bei Speech Analytics, die erst in ihren Anfängen stehen und beispielsweise von Nuance angeboten werden, geht es um die Analyse der Gespräche auf Basis einer automatisierten Transkription. Die Gespräche werden laufend aufgezeichnet und transkribiert, die entstehenden Texte mithilfe entsprechender Algorithmen analysiert: So kann ein Unternehmen z.B. schnell herausfinden, welcher Konkurrent von den Anrufern besonders oft genannt wird. Die Analyse der Gesprächsprotokolle bietet sich an, wenn ein Unternehmen mehr über die eigenen Produkte, den Wettbewerb und das Marketing erfahren möchte – aus den Äußerungen der Kunden lassen sich wertvolle Rückschlüsse für die Produktentwicklung ebenso wie für das Marketing ziehen. Zudem kann durch die Analyse der Häufigkeit bestimmter Worte auf die Zufriedenheit oder den Verärgerungsgrad der Anrufer geschlossen werden. Derzeit wird diese Form der Business Intelligence bisher nur von wenigen Vorreitern im Telco und Banking-Bereich eingesetzt. Es scheint im Markt noch kein breites Bewusstsein zu geben für die Vorteile von Voice Analytics, auch bieten derzeit erst einige wenige Anbieter passende Lösungen an, die tief in das Sprachdialogsystem integriert sind, aber komfortabel z.B. im Web von ihren Nutzern bedient werden können. Amortisierungsdauer Die Amortisierungsdauer ergibt sich aus dem Zeitraum, der vergeht, bis die anfänglichen Investitionen durch Kostenersparnisse bzw. zusätzlich generierte Gewinne wieder erwirtschaftet wurden. In Zeiten knapper Kassen ist dies ein entscheidendes Argument, insbesondere weil man nachweisen kann, dass Sprachdialogsysteme durch Kostenersparnisse, Kundenbindungseffekte und Gewinnsteigerungen ihre Investitionen innerhalb kurzer Zeit wieder einspielen! ROI in 9,8 Monate n = 42 Quelle: Testbericht – Voice Award 2006 © 2007 voice-community.de Abb.: ROI - Return on Investment Über ein Drittel aller Anwendungen, die am VOICE Award 2006 teilnahmen, amortisierte sich den Teilnehmern zufolge innerhalb von sechs Monaten, weitere knapp 20% rechneten sich bereits nach spätestens elf Monaten. 25% der Teilnehmer gaben Amortisierungszeiträume von einem bis maximal zwei Jahren an. Diese Amortisierungszahlen sind einzigartig für ITKProjekte: Ein durchschnittlicher ROI von knapp 10 Monaten ist eine beeindruckende Zahl – und beweist: Für Unternehmen mit hohem Kundenkontaktaufkommen zahlen sich Sprachapplikationen aus, und zwar im wahrsten Sinne des Wortes! Anrufkosten Die im Vergleich zu Agenten besonders niedrigen Transaktionskosten eines automatisierten Kundenkontakts sind ein wesentlicher Treiber für den Einsatz von Sprachanwendungen. Die im Rahmen des VOICE Award 2006 erhobenen Daten machen deutlich, wie sehr Marktreport VB07 Vers 1 0 (2).doc Seite 27 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Sprachdialogsysteme die Kosten der Kundenkommunikation senken können: 67% der getesteten Anwendungen verursachen Transaktionskosten von unter 0,25 EUR, weitere 27% liegen immer noch bei unter 50 Cent pro fallabschließend abgewickeltem Anruf. Vergleicht man diese Kosten mit denen, die Agenten im Kundenkontaktcenter verursachen (mind. 1 EUR/Gesprächsminute), dann wird deutlich, welches betriebswirtschaftliche Potenzial im Einsatz von Sprachanwendungen liegt. Durchschnittliche Kosten unter 20 Cent je Anruf n = 42 Quelle: Testbericht – Voice Award 2006 © 2007 voice-community.de Abb.: Kosten je Anruf Sprachanwendungen senken die Transaktionskosten gegenüber Call Centern massiv. Durchschnittliche Transaktionskosten von unter 20 Cent sollten vor allem Unternehmen mit vielen wiederkehrenden Anrufen motivieren, zur Automatisierung geeignete Prozesse zu identifizieren und sie in einem Sprachdialogsystem abzubilden. D.3 Nutzerakzeptanz: Vernunftehe statt Liebeshochzeit Hinsichtlich der Nutzerakzeptanz von Sprachanwendungen gibt es eine Reihe von Vorurteilen und Fehleinschätzungen – aber wenig wissenschaftlich aussagekräftige Zahlen, Daten und Fakten. In einer umfangreichen telefonischen Befragung von mehr als 1000 Teilnehmern hat das Fraunhofer-Institut für Arbeitswirtschaft und Organisation im Herbst 2006 in Zusammenarbeit mit der Initiative VOICE BUSINESS eine Akzeptanzstudie zur Nutzung von automatischen Sprachsystemen in Deutschland erstellt [6]. Dabei wurde nicht nur der allgemeine Bekanntheitsgrad von Sprachautomation nachgefragt, sondern auch Nutzungsverhalten und typische Einstellungen von potenziellen und tatsächlichen Benutzern erfasst. Im folgenden Kapitel gehen wir zunächst auf das gebräuchlichste Vorurteile zu Sprachdialogsystemen ein und diskutieren im Anschluss die Nutzerakzeptanz von Sprachdialogsystemen, wie sie im Rahmen der Akzeptanzstudie nachgewiesen werden konnte. Keine generelle Abneigung gegen Sprachdialogsysteme Es gibt keine per se gute oder schlechte Applikation. Niemand würde z.B. behaupten, dass DVD-Rekorder „kinderleicht“ zu bedienen seien oder DTMF besonders praktisch wäre bei der Voice Mailbox-Abfrage. Und doch stiften diese Produkte einen hohen Nutzwert. Marktreport VB07 Vers 1 0 (2).doc Seite 28 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Gleiches gilt für die Welt der Sprachdialogsysteme: Vor die Wahl gestellt, 5 Minuten in der Warteschleife zu verbringen oder ein Anliegen direkt per Sprachcomputer zu erledigen, werden viele Nutzer den Sprachcomputer wählen. Insofern hängt die Nutzerakzeptanz auch stark vom „Leidensdruck“ (und den Alternativen), der Verbreitung und der damit einhergehenden Gewöhnung an Sprachdialogsysteme ab. Die Ergebnisse aus empirischen Befragungen wie auch aus Experteninterviews haben bestätigt: Es gibt keine generelle Abneigung der Deutschen gegen Sprachdienste, außer bei Entscheidern, die über deren Einsatz befinden. Ähnlich wie bei Markenprodukten gilt auch hier: „Auf die Verpackung kommt es an“, das heißt in in diesem Falle auf das Hörerlebnis, das eine Applikation vermittelt, und den Nutzen: Je höher der Nutzwert, den ein Dienst bietet, desto niedriger ist die Bedeutung des Bedienungskomforts (Verpackung). Fakten zur Nutzerzufriedenheit Die Studienergebnisse [6] zeigen im Vergleich zu der Befragung aus dem Jahr 2003 [1] deutlich positivere Einstellungen der Befragten. Auch die Bekanntheit von Sprachapplikationen ist in den vergangenen Jahren deutlich gestiegen. 70 Prozent der Befragten gaben 2006 zu Protokoll, Sprachapplikationen zu kennen, während es im Oktober 2003 noch lediglich 54 Prozent waren. Ebenso ist die Anzahl derer deutlich gestiegen, die bereits Sprachapplikationen nutzen, und zwar auf 32 Prozent gegenüber 20 Prozent vor drei Jahren. Von dieser positiven Entwicklung, die auch auf komfortableren Systemen basiert, profitieren insbesondere die Branchen Telekommunikation, Banken und Finanzen, Transport, Verkehr und Logistik. Trotz der generell relativ geringen Zufriedenheit der Nutzer mit den von ihnen am häufigsten genutzten Sprachapplikationen besteht überwiegend eine hohe Bereitschaft, diese Applikationen auch in der Zukunft zu nutzen. Nur etwa 28% stehen einer zukünftigen wiederholten Nutzung ablehnend gegenüber. Damit hat sich die Nutzungsbereitschaft gegenüber 2003 hoch signifikant erhöht. Die folgende Tabelle zeigt diese positive Entwicklung anhand des Vergleichs mit den Daten aus der 2003 von Fraunhofer IAO durchgeführten Akzeptanzstudie. Insbesondere der Anteil derer, die angeben, die Sprachapplikation „auf keinen Fall“ noch einmal zu nutzen, ist drastisch gesunken: Nutzungsbereitschaft • Nur jeder 4. ist nicht bereit Sprachapplikation wieder zu verwenden. 35% 30% 25% 20% 15% 10% 5% 0% uf ,a Ja n de je ll Fa j er Eh a ils Te ils /te E rn he n ei k uf ,a n ei N ei n ne ll Fa W ß ei t/k ch ni . .A n = 420 Quelle: Fraunhofer © 2007 voice-community.de Abb.: Nutzungsbereitschaft Allerdings ist die hohe Nutzungsbereitschaft in vielen Fällen (76%) darauf zurückzuführen, dass keine geeigneten Alternativen zur Verfügung stehen, um in der jeweiligen Situation die gewünschte Dienstleistung in Anspruch zu nehmen. Marktreport VB07 Vers 1 0 (2).doc Seite 29 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Motivationsfaktor: Der schnellere gewinnt! In vielen Fällen konkurrieren Sprachapplikationen mit anderen Zugangsmöglichkeiten zu Informationen und Transaktionen. Neben dem persönlichen Kontakt mit einem Mitarbeiter bieten sich beispielsweise tastengesteuerte Handy Services (DTMF), eMail, Webseiten und der traditionelle Postweg für typische Anwendungsbereiche von Sprachapplikationen an. Inzwischen hat sich auch die Vorqualifizierung von Kundenanrufen durch eine Sprachapplikation mit anschließender Weiterleitung zu einem persönlichen Telefonkontakt zu einem wichtigen Kommunikationskanal entwickelt. Im Vergleich zu anderen Kommunikationsmöglichkeiten ist die Nutzung von Sprachapplikationen insgesamt nicht besonders beliebt. Sowohl für die Abfrage von Informationen als auch zur Durchführung von Transaktionen wird nach wie vor ein persönlicher Kontakt bevorzugt. Telefondienste, die per Spracherkennung oder per DTMF bedient werden, schneiden bei einer vergleichenden Bewertung nach dem Schulnotensystem (1: „sehr gut“ bis 6: „ungenügend“) in diesen beiden Fällen am schlechtesten ab. In bestimmten Situationen jedoch bevorzugen die meisten Befragten Sprachapplikationen selbst gegenüber einem persönlichen Kontakt. Sprachapplikationen – der schnelle Weg zum Service • Über 60% entscheiden sich für den Sprachcomputer, wenn sie mehr als 1 Minute auf Agent-Service warten müssen. 50% 40% 30% 20% 10% Nutz er 0% W al er ig n e 0 s3 Nicht-Nutz er k. se s Bi zu 1 m . in s Bi zu 3 m . in s Bi zu 5 m . in er ng Lä s al 5 m . in W ei ß ch ni . .A t/k n = 929 Quelle: Fraunhofer © 2007 voice-community.de Abb.: Serviceverfügbarkeit Entsprechend dem am häufigsten genannten Vorteil der Zeitersparnis erscheint schon bei einer relativ kurzen Wartezeit auf einen persönlichen Ansprechpartner die Alternative einer Sprachapplikation attraktiver. Etwa 60% der Anrufer ziehen bereits eine Sprachapplikation gegenüber einem persönlichen Kontakt vor, wenn sie dafür länger als 1 Minute in einer Warteschleife warten müssen. Bei Wartezeiten ab 3 Minuten sind es bereits knapp 90%. In dieser Einschätzung gibt es keinen signifikanten Unterschied zwischen Nutzern und NichtNutzern. Marktreport VB07 Vers 1 0 (2).doc Seite 30 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Kostenbewusstsein der Verbraucher Sprachapplikationen – der kostengünstigere Service • Über 80% entscheiden sich für den Sprachcomputer, wenn der Agent-Service mehr als 14 Cent kostet. 50% 40% 30% 20% 10% Nutz er 0% Nicht-Nutz er in Ne s Bi zu 14 nt Ce o pr Bi M sz in u . 50 nt Ce pr o M Bi in sz . u 1 Eu ro o pr M . in M r eh al s1 Eu ro pr o . in M W ei ß ch ni . .A t/k Quelle: Fraunhofer/IVB n = 929 © 2007 voice-community.de Abb.: Kostenbewusstsein Ebenso deutlich werden Sprachapplikationen dann bevorzugt, wenn für einen persönlichen Telefonkontakt zusätzliche Gebühren anfallen. Schon bei Gebühren von mehr als 14 Cent pro Minute bevorzugen etwa 80% der Anrufer eine Sprachapplikation. Bei Kosten ab 50 Cent pro Minute sind es bereits 94%. Auch hier besteht kein statistisch bedeutsamer Unterschied zwischen Nutzern und Nicht-Nutzern. Die Bekanntheit von Sprachapplikationen ist in den vergangenen Jahren deutlich gestiegen. Trotz der generell relativ geringen Zufriedenheit der Nutzer mit den von ihnen am häufigsten genutzten Sprachapplikationen besteht überwiegend eine hohe Bereitschaft, diese Applikationen auch in der Zukunft zu nutzen: Im Vergleich zu anderen Kommunikationsmöglichkeiten ist die Nutzung von Sprachapplikationen insgesamt nicht besonders beliebt, jedoch bevorzugen die meisten Befragten sie in bestimmten Situationen selbst gegenüber einem persönlichen Kontakt: 1. Zeitersparnis: Schon bei einer relativ kurzen Wartezeit auf Ansprechpartner erscheint die Alternative Sprachapplikation attraktiver einen persönlichen 2. Erreichbarkeit und 24 Stunden Verfügbarkeit 3. Kostenvorteil: Ebenso deutlich werden Sprachapplikationen dann bevorzugt, wenn für einen persönlichen Telefonkontakt zusätzliche Gebühren anfallen D.4 Anbietermarkt: Eine Branche konsolidiert sich Der Anbietermarkt für Voice Technologie und Sprachdialogsysteme in Deutschland war lange sehr zersplittert. Das hatte Konsequenzen auch für die Marktentwicklung: Neben der innovativen Wirkung vieler kleiner, oft hoch spezialisierter Anbieter stand dieser unüberschaubare Anbietermarkt zugleich für Orientierungsprobleme bei Kunden und Interessenten: Nur wenige Experten sahen sich überhaupt in der Lage, die Angebotslandschaft zu überblicken und Lösungen miteinander zu vergleichen – zukünftige Betreiber von Sprachdialogsystemen mussten häufig auf externe Expertise zurückgreifen, um zukunftssichere Investitionsentscheidungen treffen zu können. In den vergangenen Jahren hat die Branche sich jedoch konsolidiert, zugleich gerieten proprietäre Lösungen gegenüber standardkonformen VoiceXML-Plattformen und -Lösungen ins Marktreport VB07 Vers 1 0 (2).doc Seite 31 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Hintertreffen. Branchenevents wie die jährlichen VOICE Days schufen eine Plattform für den intensiven Vergleich des Marktangebots. Brancheninformationsdienste wie die VOICE Community beschleunigen den Wissenstransfer aus der Branche hin zur interessierten Fachöffentlichkeit und ermöglichen auch Einsteigern den schnellen Einstieg ins Voice Business. Im folgenden Kapitel geht es um Zahlen, Daten und Fakten des Voice Business in Deutschland: Wir beschreiben die allgemeine Marktentwicklung in Deutschland im europäischen Vergleich und geben einen Ausblick auf das hierzulande zu erwartende Marktwachstum. Zudem dokumentieren wir den Siegeszug des VoiceXML-Standards und das Vordringen der Sprachsteuerung bei der Kontaktautomatisierung. Schließlich analysieren wir die gegenwärtige Marktkonsolidierung und ihre Auswirkungen auf die weitere Marktentwicklung. Marktbedeutung und Wachstum In den vergangenen drei Jahren wuchs der Markt für Sprachdialogsysteme in Deutschland, Frankreich und Großbritannien von 240 Mio. US$ in 2005 auf fast 350 Mio. US$ in 2007. Der deutsche Markt, der 2005 noch ein Volumen von 75 Mio. US$ hatte, wird dieses Jahr das erste Mal die 100-Millionen-Marke knacken. Bis 2010 rechnen die Analysten von Datamonitor mit einer weiteren Verdopplung des Marktes auf fast 200 Mio. US$. Damit ist Deutschland der zweitgrößte Markt für Sprachdialogsysteme (hinter GB) in Europa. Deutschland zweitgrößter Markt in EU • Mehr als 100 Mio. Umsatz – CAGR 21,5% ab 2007 in Deutschland Umsätze in D, F und GB (in US$) 300 254 250 210 200 170 150 100 97 118 69 75 84 91 140 100108 121131 162 148 198 181 50 0 2005 2006 2007 UK France 2008 2009 2010 Germany Quelle: Datamonitor © 2007 voice-community.de Abb.: Marktgröße EU Der deutsche Markt für Sprachanwendungen ist der am schnellsten wachsende Markt in Europa: 21,5% jährliches Wachstum zeigen, dass das Voice Business boomt. Marktreport VB07 Vers 1 0 (2).doc Seite 32 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 VOICE ist ein Wachstumsmarkt - CAGR 27% • Voice-Hosting attraktives Geschäftsfeld für Telefongesellschaften Umsätze in $ Weltweit 1.200 1.000 471 800 367 600 Service provider Enterprise 286 400 135 200 218 171 253 317 402 204 2005 2006 2007 2008 509 638 2009 2010 Quelle: Datamonitor © 2007 voice-community.de Abb.: Weltmarkt Das weltweite Marktvolumen für Sprachdialogsysteme wird von Datamonitor mit 535 Mio. US$ für das Jahr 2007 beziffert. Davon werden knapp 320 Mio. US$ im Enterprise-Markt umgesetzt. Fast 220 Mio. US$, also etwa 40% davon entfallen auf die Service Provider-Branche. Bereits im Jahr 2010 soll der Weltmarkt laut Datamonitor die Milliardengrenze überschreiten. Von diesem Wachstum profitiert vor allem der Service Provider-Markt, dessen Marktanteil in 2010 bereits auf 46% angestiegen sein wird. VoiceXML – De facto-Standard nicht nur für Sprachapplikationen • Der Übergang zu Voice-XML Plattformen ist Ausdruck der Migration zu Webzentrischen IP-Architekturen Verkaufte IVR Ports (in tsd.) 800 700 600 500 400 300 200 100 0 754 594 405 402 216 2005 388 451 347 367 333 264 2006 2007 Traditional IVR 2008 2009 288 2010 Voice-XML Quelle: Datamonitor © 2007 voice-community.de Abb.: VXML ist Standard Das starke Wachstum des Voice-Marktes ist auch dem allgemeinen Trend hin zu IP-basierten Architekturen geschuldet, wie die Abbildung zeigt: Wurden in 2006 weltweit nur 264.000 VXMLPorts verkauft (gegenüber 405.000 traditionellen, nicht VXML-gerechten), so wird schon in 2008 die Installationsbasis für VXML-Ports erstmals die für nicht standardkonforme übertreffen. Marktreport VB07 Vers 1 0 (2).doc Seite 33 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Datamonitor erwartet für 2008 über 451.000 Verkaufseinheiten bei VXML-Ports gegenüber nur noch knapp 367.000 traditionellen Ports. Das gesamte Marktwachstum wird ab 2008 auch nur noch von VXML-Ports getrieben; die Verkaufszahlen traditioneller Ports sinken in den kommenden Jahren immer schneller. ASR verdrängt Touchtone Diese Zahlen spiegeln sich auch in der Call Center-Praxis wider: IVR Systeme gehören gerade in größeren Contact Centern mittlerweile zum Standard. Laut der aktuellen, jährlich erscheinenden Studie „Contact Center-Trends“ [5] haben insgesamt bereits rund 46% der Befragten derartige Systeme im Einsatz, weitere 4% planen die Neueinführung in 2007. Dies ist eine glatte Umkehrung der Verhältnisse gegenüber 2005, die den oben postulierten Zusammenhang zwischen dem Trend hin zur IP-Telefonie und dem Einsatz von VXML-basierter Sprachtechnolgie stützt: VoIP schafft eine ideale Basis für die Integration von Sprachverarbeitung und Call-Handling auf Basis des VXML-Standards. Der Trend zur IP-Infrastruktur schafft so auch mehr Nutzerfreundlichkeit: Die Systeme werden durch den vermehrten Einsatz benutzerfreundlicher Spracherkennung auch zunehmend kundenfreundlicher, weil der Anteil der veralteten und umständlichen „Touchtone“-Systeme mit DTMF-Eingaben ständig sinkt. Entwicklung ASR-Anteil bei IVR-Systemen • ASR-DTMF Verhältnis hat sich innerhalb von 2 Jahren gedreht. ASR-Anteil bei IVR-Systemen 70,00% 60,87% 60,34% 60,00% 55,56% 50,00% 44,44% 40,00% 39,66% 39,13% ASR DTMF 30,00% 20,00% 10,00% 0,00% 2005 2006 2007 Quelle: Contact Center Trends 2007 © 2007 voice-community.de Abb.: ASR-Anteil Marktkonsolidierung bestätigt Marktreife Die globale Voice-Branche hat sich in den vergangenen ein, zwei Jahren stark verändert. Entlang der gesamten Wertschöpfungskette haben Fusionen und Übernahmen zu einer Konsolidierung des Marktes geführt: Plattformanbieter Genesys kaufte VoiceGenie und beherrscht nun gut 50% des Weltmarktes für VXML-Plattformen. Scansoft übernahm Nuance und wurde mit 90% Marktanteil Weltmarktführer für Spracherkennung und -ausgabe. Anbieter von Voice-IDEs, also Entwicklungs- oder Managementumgebungen für Sprachanwendungen wie VoiceInt und VoiceObjects wurden OEM-Partner von Genesys respektive SAP, Cisco erwarb Audium. Schließlich kaufte die „neue“ Nuance in USA den Hostinganbieter BeVocal - und Microsoft verleibte sich den amerikanischen Hostinganbieter Tellme ein. Marktreport VB07 Vers 1 0 (2).doc Seite 34 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Eine starke Konsolidierung erfolgte auch bei der Hardware: Hier fusionierten Brooktrout mit Exel zur Cantata, Eicon und die Signalling-Sparte von Intel zur Dialogic. Bei den Spracherkennern sucht vor allem Marktführer Nuance (ex-Scansoft, -Speechify, -BeVocal et.al.) durch Mergers und Akquisitionen seine Position auszubauen. Vergleichsweise ruhig ist der Markt für proprietäre IVR-Systeme, der allgemeine Trend zu VXML spricht besonders gegen zukünftige Fusionen in diesem Marktsegment. Bei den Plattformanbietern ist wieder mehr Konsolidierungsaktivität zu verzeichnen: Cisco erwarb erst unlängst den IDE-Spezialisten Audium. Bei den Anbietern von Mehrwertdiensten konnte D+S sich durch entsprechende Zukäufe (dtms, dtms solutions, mobile view) unter den etablierten Anbietern T-Com, Arcor und Legion etablieren. Keine M&As konnten bei den als „Berater“ klassifizierten Unternehmen verzeichnet werden: Diese innovativen „Schnellboote“ der Branche können mit ihrer Expertise offensichtlich ihre Auftragsbücher füllen, auch ohne fusionieren zu müssen. Aktuell engagieren sich etwa 120 Unternehmen mit ca. 10.000 Mitarbeitern im deutschen Voice Business. Der (fragmentierte) Voice Markt – die Player Marktkonsolidierung entlang der Wertschöpfung setzt sich fort! ca. 120 Unternehmen, die Dienstleistungen, Software und Hardware anbieten mit rund 10.000 Beschäftigten* Spezifikation Beispiele Hardware (Telefoniekarten, Server) Aculab, AVM, Cantata (Brooktrout + Exel Switch) , Dialogics (Eicon + Intel), NMS Software (ASR, TTS, Verifizierung) ASR*: IBM, Loquendo, Nuance, Telisma TTS*: Acapela, IBM, Loquendo, Nuance, Telisma Verifizierung: IBM, Loquendo, Nuance, VoiceTrust Proprietäre IVR Systeme COMplan + Service (VoiceRobots), Flintec, TE-System, Voxtron, IVR mit VoiceXML Schnittstelle Aastra, Aspect, Avaya-Tenovis, Crealog, IBM, Intervoice, Nortel, Sikom, Telenet reine VoiceXML Plattformen Alcatel, Cisco, Genesys (VoiceGenie), HP, Nuance, Microsoft, Voxpilot IDE – Entwicklungswerkzeuge Hersteller-Individuelle Lösungen - siehe Plattformanbieter Management-Systeme Cisco (Audium), Fluency, VoiceObjects Reines Hosting Arcor, BT, Colt, Net-mobile, Map telecom, Verizon, Voxpilot Komplette Mehrwertdienste D+S Solutions, Legion, T-Systems, T-Com, Excelsis Beratung (Dialog-Designer, VUI / Kommunikation) 8hertz, Excelsis, HFN Medien, Speak-Up, Sympalog, SematicEdge, Voiceandvision Systemintegratoren (Prozesse / IT / Backend) Alcatel, Cap Gemini, IBM, NextiraOne, Nortel, Siemens IT Solutions, Softlab, T-Systems, Telenet, TietoEnator *Eigene Schätzung © 2007 voice-community.de Abb.: Marktkonsolidierung Die Marktkonsolidierung der letzten zwei Jahren und die Übernahme neuer Sprachtechnologien in die Portfolios von Microsoft, SAP, Google & Co. beweist eine gewisse Reife sowohl des Marktes als auch der Technologie. Der Markteintritt der „Big Player“ wird die Grundlagen für eine Neuordnung der Preis- und Kostenstrukturen in der Branche schaffen: Das könnte den Anfang vom Ende der Port-basierten Kosten für Sprachtechnologie zugunsten von Arbeitsplatz- oder transaktionsbezogenen Kosten bedeuten. Auch werden diese Unternehmen dazu beitragen, dass Sprachtechnologie zur Commodity wird. Wenn ein Unternehmen wie Microsoft Sprachtechnologie voll in seine Produkte von Betriebssystemen bis hin zu Office-Anwendungen integriert und diese zugleich mit einem Diensteangebot á la Hotmail (für Voice auf Basis der neuerworbenen TellMe-Plattform) in ein umfassendes Eco-System einbindet, spätestens dann wird Voice ebenso Mainstream sein wie heute eMail. Marktreport VB07 Vers 1 0 (2).doc Seite 35 von 50 Nr. 1002306 MARKTREPORT E © Mind | STRATECO Voice Business 2007 Die Zukunft des Voice Business Zur Darstellung der Marktentwicklung des Voice Business in den kommenden zwei Jahren untersuchen wir in den folgenden Abschnitten diese Fragestellungen: » Welche Entwicklungen sehen die Praktiker? » Wie wird die Serviceorganisation der Zukunft aussehen? » Treiben Mobile Trends auch das Voice Business? » Welches Potenzial haben „on demand“-Services? » Wie wird das Voice Business 2.0 aussehen? Die Antworten auf diese Fragestellungen beruhen auf den regelmäßigen Hintergrundgesprächen, den redaktionellen Veröffentlichungen sowie den Umfragen der VOICE Community Redaktion in 2006 und 2007. E.1 Trends im Voice Business Im kommenden Jahr wird der Markt vor allem durch Sprachautomatisierung in der Kundenkontaktqualifizierung weiter getrieben, so die 116 Teilnehmer an dem „Branchenbarometer der VOICE Community“ [4] im Herbst 2006. Sprachautomatisierung durch Kontaktqualifizierung getrieben Frage: Welche Anwendungsbereiche werden die weitere Verbreitung von Sprachanwendungen maßgeblich vorantreiben? (wichtig+sehr wichtig in %) Outbound (Notifikation) 48% Marketing-Kampagne 48% Authentifizierung und Sicherheitsservices 48% Help-Desk Service 50% Infotainment- und Entertainment-Dienste 55% Kommunikationsdienste im Netz 58% Automatisierte Telefonzentrale 68% Workflow-Systeme 73% Track & Trace-Systeme 73% Bestellsysteme 73% Auskunft und Informationsdienste 85% Self Service-Portale 88% Vorqualifizierung 93% Quelle: VOICE Community - Branchenbarometer n = 116 © 2007 voice-community.de Abb.: Applikationsfelder 92,5% der Umfrage-Teilnehmer sind der Ansicht, dass das sprachgesteuerte Call Routing den größten Einfluss auf die Marktentwicklung nehmen wird, gefolgt von Self Service-Portalen (87,5%), Auskunfts- und Infodiensten (85%) sowie Workflow-Systemen, Track & TraceDiensten und Bestellsystemen (je 72,5%). Auch der automatisierten Telefonzentrale gestehen 67,5% der Befragten Marktbedeutung zu. Weniger Einfluss auf die Marktentwicklung haben der Umfrage zufolge Help Desk-Services (50%), Authentifizierungsdienste, Voice-Kampagnen und automatisierte Outbound-Dienste (47,5%). Marktreport VB07 Vers 1 0 (2).doc Seite 36 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Auftreten neuer Player verändert die Spielregeln Frage: Welche Entwicklungen im Anbietermarkt werden die Spielregeln im Markt maßgeblich verändern? (Veränderungen hoch+sehr hoch in %) Auftreten neuer Player wie Microsoft, Google & Co. 70% Neue Lizenz- und Preispolitik (wie z.B. pay-per-use) 53% Auftreten neuer Hosting/ManagedService Provider 48% Konsolidierung im Bereich Spracherkenner (wie z.B. der Nuance/Scansoft Merger) 48% Konsolidierung im Bereich Plattformen (z.B. Übernahme von VoiceGenie durch Genesys) 38% Quelle: VOICE Community - Branchenbarometer n = 116 © 2007 voice-community.de Abb: Trends im Anbietermarkt Im Anbietermarkt wird die größte Rolle bei der Marktentwicklung nach dieser Umfrage das Auftreten neuer Player wie Microsoft oder Google spielen, so 70% der Befragten. Ebenfalls bedeutsam seien neue Lizenz- und Preismodelle wie z.B. Pay-per-use (52,5%), die Marktkonsolidierung im Spracherkennermarkt und das Auftreten neuer Hosting-Anbieter (je 47,5%). Eine Marktkonsolidierung bei den Voice Plattformen sehen nur 37,5% der Befragten als wichtig an für die weitere Marktentwicklung. In der Umfrage wurde auch die Bedeutung von Innovation bezogen auf die nächsten fünf Halbjahre bis Winter/Frühjahr 2009 nachgefagt: Anfang 2007 werden demnach StandardApplikationen (22,5%), Managed Services (20%) und die Integration von VoIP (17,5%) die wichtigsten Rollen bei der Marktentwicklung spielen. Im ersten Halbjahr 2007 erwarten 42,5% der Befragten einen Marktschub durch Standardapplikationen. VoIP-Integration, Managed Services und multimodalen Diensten sprachen je etwa 20% der Befragten innovative Bedeutung zu. Eine unerwartet kleine Rolle messen die befragten Experten der Biometrie zu (12,5%). Zwischen Sommer 2007 und 2008 werde die Marktentwicklung ebenso von Managed Services und der VoIP-Integration ausgehen (37,5% und 32,5%), auch die Authentifizierung setze sich dann besser am Markt durch (27,5%). Dass über 60% der befragten Profis aus der VOICE Community erwarten, dass Standardanwendungen im kommenden Jahr die für die Marktentwicklung bedeutsamste Innovation sein werden, ist ein sicherer Hinweis darauf, dass bei den verschiedensten Anbietern Standardanwendungen kurz vor dem Roll-out stehen. Erstaunlich ist, dass Managed Services eine höhere Marktbedeutung erst in ein bis zwei Jahren zugesprochen wird – dies verwundert angesichts der im Markt bereits vorhandenen Voice Hosting-Angebote und deren Akzeptanz bei den Betreibern. Multimodale und biometrische Anwendungen werden in absehbarer Zeit keine größere Rolle spielen; kaum einer rechnet damit, dass sich hier in den kommenden zwei Jahren viel tun wird. Die durch die Umstellung auf VoIP entstehenden Marktchancen werden in den kommenden zwei Jahren weiter zunehmen. Marktreport VB07 Vers 1 0 (2).doc Seite 37 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Top-Trends: Standard-Applikationen, Managed Services und VoIPIntegration Frage: Welchen Innovationen messen Sie für die nächsten 12 Monate eine große Bedeutung für die Marktentwicklung bei? Standard-Applikationen 65,0% Managed Services 40,0% VoIP-Integration 37,5% Multimodale Anwendungen 20,0% Biometrie 12,5% Quelle: VOICE Community - Branchenbarometer n = 116 © 2007 voice-community.de Abb.: Entwicklungstrends Bei der Frage, welche Stolpersteine die Marktentwicklung hemmen könnten, zeigte sich, dass das Voice User Interface aus Branchensicht nach wie vor Erfolgsfaktor No. 1 ist; ganze 80% der Befragten sahen hierin das nach wie vor größte Problem für die zukünftige Marktentwicklung. Auch die Akzeptanz von Sprachdialogsystemen bei Entscheidern sei weiter verbesserungswürdig, so 52,5% der Interviewteilnehmer, ebenso wie die Qualität der Spracherkennung, die 50% für erfolgskritisch halten. Die Kosten sind ähnlich der Integration keine Hürde mehr, nur 17,5% sahen hierin eine Problemstellung. Erfolgsfaktor Nr. 1 - Voice User Interface Frage: Welche Faktoren können die Marktdurchdringung beschleunigen? (Hierarchie - Rang 1+2) Fokus auf nutzer-zentrische Dialoggestaltung 78% Kostengünstige Standard-Lösungen 35% Hosted- & Managed Service Angebote 33% Best Practice-Kommunikation 33% Entwicklung von Qualitätsstandards 23% Quelle: VOICE Community - Branchenbarometer n = 116 © 2007 voice-community.de Abb.: Markterfolgsfaktoren Marktreport VB07 Vers 1 0 (2).doc Seite 38 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Und was sind in den Augen der VOICE Community-Members die „Turbos“ für den Voice-Markt? Als wichtigster Erfolgsfaktor für Sprachdialogsysteme gilt nach wie vor die richtige Gestaltung des Dialogs: 77,5% bezeichnen als primären Faktor für eine schnelle Marktdurchdringung die nutzerzentrische Dialoggestaltung, flankiert von einem Angebot an Standardanwendungen (35%) und Managed Services (32,5%). Die Entwicklung von Qualitätsstandards hingegen sahen nur 22,5% als notwendig für eine beschleunigte Marktdurchdringung an. Die wichtigsten Trends für die nächsten 24 Monate sind: Erstens die Sprachautomatisierung (im Call Center Umfeld) wird durch Kontaktqualifizierung getrieben. Zweitens wird das Auftreten neuer Player wie Google, Microsoft & Co. die Spielregeln grundlegen verändern. Und drittens sind Standard-Applikationen, Managed Services und VoIP-Integration die wichtigsten Innovationen. Erfolgsfaktor Nr. 1 bleibt das Voice User Interface. Das wird gleichzeitig auch als wichtigster Stolperstein gesehen. E.2 Serviceorganisation der Zukunft Im Enterprise Markt hat der Kundenservice mittlerweile einen der industriellen Fertigung vergleichbaren Organisationsgrad erreicht. Doch diese Entwicklung dauerte mehrere Jahrzehnte: Ganz am Anfang der „Industrialisierung des Kundenkontakts“ stand die Ausgliederung des Kundenerstkontakts an Call Center, die mehr oder weniger vollständig isoliert vom beauftragenden Unternehmen „auf der grünen Wiese“ standen. Im nächsten Schritt konnten durch die Möglichkeiten des ISDN-Netzes erste Geschäftsprozesse mit dem Auftraggeber integriert werden wie etwa die Weiterleitung eines Anrufers an den entsprechenden Sachbearbeiter im Unternehmen. Mit dem Aufkommen „intelligenter“ Kommunikationsnetze lässt sich die Integration aller Kanäle, also auch Fax, eMail und SMS ebenso wie die Sprachautomatisierung im Netz erreichen. In den vergangen 10-15 Jahren konnten Unternehmen so sukzessive Vertriebs- und Kundenserviceaufgaben im Call Center zusammenführen und durch den Einsatz von IT und Telekommunikation eine moderne Form der Fließband-Arbeit am Telefon erschaffen. Während sich in diesen Kundenkontakt-Zentralen die Arbeit durch Prozessorganisation, intelligente Zuweisung von Echtzeit-Anfragen und die durchgängige Vorgangsbearbeitung - über unterschiedliche Kommunikationskanäle hinweg - grundlegend geändert hat, stecken in der Organisation der dahinter liegenden Verwaltungsabläufe noch enorme Effizienzpotenziale. Unternehmen beginnen nun, ihre Contact Center in die Gesamtstruktur des restlichen Unternehmens zu integrieren. Diese Eingliederung stellt eine Revolution in der Bearbeitung von Kundenabläufen (der Verwaltung) dar, denn moderne Plattformen erlauben, das Routen von eingehenden Kundenkontakten über den Sprachanruf hinaus zu organisieren: eMail, Fax und Brief werden mit einbezogen in die (teil-) automatisierte Verteilung der Arbeitsschritte im Unternehmen. Damit eröffnen sich Unternehmen neue Wege der Kundeninteraktion und der Verwaltungsprozesssteuerung. Hintergrundwissen: Die Integration des Back Office Unternehmen versuchen die Abgrenzung zwischen Back Office und Contact Center aufzuheben - das Unternehmen soll als „homogener Organismus“ mit dem Kunden interagieren, die Abläufe im Back Office transparent und durchorganisiert werden wie im Call Center. Dazu ist allerdings eine systematische Neustrukturierung der internen Geschäftsprozesse nötig, um die Aufgabenverteilung automatisieren zu können und entsprechend in der Prozessstruktur des Back Offices abbildbar zu machen. Das geht nur mit einer engen Einbindung und voller Unterstützung der Fachabteilungen sowie des Managements. Ein Beispiel bieten Versicherungsgesellschaften. Hier werden Schäden heutzutage meist von einer Person bearbeitet. Dies gewährleistet zwar eine gewisse Kontinuität und Bearbeitungskonstanz, jedoch bringt es auch Nachteile mit sich. Durch die Aufteilung der Aufgaben eines Schadenfalles in ein bestimmtes Raster im Gegensatz zur Zuteilung zu einer einzigen Bearbeitungsperson kann der Prozess in seine einzelnen Bestandteile gegliedert werden. Verschiedene Aufgaben können an verschieden qualifizierte Personen weitergeleitet werden. Eine einzige Kontaktstelle steuert und bearbeitet Kundenkontakte sowie Aufgaben innerhalb eines Geschäftsablaufes. Zusammen ergeben diese Kontakte und Aufgaben die „Kundenservice-Kette“, in der Kundenanfragen oder -aufträge erledigt werden. Marktreport VB07 Vers 1 0 (2).doc Seite 39 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Durch die Aufteilung von Kundenabläufen in die einzelnen Bestandteile können individuelle Aufgaben gleich an den dafür geeignetsten Bearbeiter weitergeleitet werden. Gleichzeitig können Aufgaben an Dritte weitergegeben werden, um daraus einen größeren Geschäftsnutzen zu ziehen – seien dies niedrigere Kosten oder kürzere Bearbeitungszeiten. Auch können Ablaufzeiten für die einzelnen Prozessschritte festgelegt und die termingerechte Verteilung der bearbeiteten und weiterzubearbeitenden Aufgaben automatisiert werden. Sprachtechnologie ist ein integrativer Bestandteil von „Business Process Routing“: Neben der interaktiven Anruferqualifizierung im Sprachportal kommt Sprachverarbeitung insbesondere beim Klassifizieren eingesandter Dokumente zum Tragen, deren Inhalt mit OCR Technologie erfasst werden muss, um das Dokument automatisiert an den richtigen Sachbearbeiter weiterleiten zu können. Weitere Einsatzfelder für Voice im Business Process Routing wären z.B. Erinnerungsanrufe (Outbound) oder Statusanfragen (Inbound). Der für eine Integration des Back Offices zu treibende Aufwand lohnt: Laut Expertenansicht bietet sie den Unternehmen das größte Geschäftspotenzial der nächsten Jahre. Medien- und Prozessbrüche in der Bearbeitung von Kundenanliegen könnten geschlossen werden (z.B. wenn Auftragsannahme und Versand bereits optimiert sind, aber Schwächen im Rechnungswesen bestehen). Mass-Calls würden besser steuer- und handhabbar und das Back Office der Unternehmen letztlich transparenter und anhand tatsächlicher Geschäftsprozesse rationalisierter und höher automatisierbar. Fachleute sprechen daher von der Industrialisierung der Verwaltung durch Wissensmanagement: Individuelle Kontakte werden in standardisierte Verfahren überführt, Bearbeitungszeiten verkürzt und so die Kundeninteraktionskosten signifikant gesenkt. Das Call Center der Zukunft ist die wichtigste Schnittstelle zwischen Unternehmen und Verbrauchern: Die Qualität des Kundenkontaktes ist die Visitenkarte des Unternehmens. Denn in Zeiten von austauschbaren Produkten und Dienstleistungen, wie es bei Banken, Versicherungen oder der Automobilindustrie oft der Fall ist, spielt das KundenkontaktManagement eine elementare Rolle, um sich im Wettbewerb gegen Konkurrenten durchzusetzen. Voice Verkauf Verkauf Bestellung Bestellung Portal Alerts Presence Skills Universal Queue Routing Abwicklung Abwicklung Dashboards Agent Desktop WFM Agent Services Web EMail Chat Contact Services Callback Interaction Management CRM MDM ZahlungsZahlungseingang eingang Rechnung Rechnung Voice Contact Center ERP Information Web Email Chat Enterprise Market, Die eCare Perspektive – The real Beast SCM Analytics ODS EDW ECM UIM Search QAM KPIs KM RTA Quelle: mind Business Consultants © 2007 voice-community.de Abb.: Kundenservice-Trends Man braucht dafür die richtige Technologie, die richtige Hardware, die richtigen Applikationen und das richtige Verständnis von der Betriebsorganisation. Wichtig sind zudem intelligente Interfaces für den Benutzer. Hier geht es um hochkomplexe Fragen, die Systemintegrationskompetenz, Beratungs- und Prozessleistungen erfordern. Auf der Prozessebene, und zwar nicht nur im Verhältnis zum Kunden, sondern auch mit allen anderen Systemen und Abteilungen im Unternehmen, die für den Kundenservice wichtig sind, wird sich in Zukunft der Erfolg des Kundenkontakts manifestieren. Das Call Center wird zu einer Art „Kampfstern Galactica“ und darf nicht als triviale Managementaufgabe betrachtet werden. Es ist ein Kristallisationspunkt für die technologische Entwicklung im gesamten Unternehmen und wird zur größten technologischen Herausforderung der nächsten Jahre. Provokant gesagt: Das ganze Unternehmen wird zum Call Center! Marktreport VB07 Vers 1 0 (2).doc Seite 40 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Zugleich wird die Automatisierung des Kundenkontakts fortschreiten und sich vertiefen – mehr Geschäftseinheiten des Unternehmens der Zukunft werden in Call Center-Prozesse integriert, ebenso wie die Geschäftsprozesse quer durchs Unternehmen z.B. durch intelligentes Routing zunehmend automatisiert werden. Die Geschwindigkeit des Fortschritts im Kundenkontakt hängt somit zunehmend von der Prozessinnovation ab. E.3 Mobile Trends: Treiber des Voice Business Die Entwicklung im Voice-Markt der vergangenen Jahre war geprägt von der Call CenterAutomatisierung und den damit einhergehenden Problemstellungen, die neue Technologien und eine hohe Lösungskompetenz im Anbietermarkt hervorbrachten. Innerhalb weniger Jahre wurde so eine Lernkurve durchschritten, die die wirtschaftlich erfolgreiche Automatisierung einer großen Bandbreite von Prozessen in den verschiedensten Anwendungsfeldern im Call CenterUmfeld ermöglichte. Der nächste wichtige Treiber für die Weiterentwicklung der Sprachtechnologie und des Voice Business ist der entstehende Markt für Mobile Services. Die massenhafte Vermarktung von Mobile Services erfordert den möglichst freien Informationsabruf, die kanalübergreifende Bereitstellung von Multimedia-Inhalten sowie kanalübergreifende Transaktionssysteme. Schlüssel für den Erfolg von Mobile Services sind die folgenden Trends: » die Konvergenz von netzbasierten und im Endgerät integrierten Services » die ubiquitäre Verfügbarkeit von Informationen » das Vermögen, medienunabhängig in alle vorhandenen Kanäle zu publizieren » Bedienbarkeit für personalisierten Multimedia-Service und komplexe „Smart“ Phones » das Handy als Werbe- und Verkaufskanal im Marketing-Mix zu integrieren Im Folgenden untersuchen wir diese Trends auf ihre Interdependenz mit der Sprachtechnologie und leiten die Bedeutung des Mobile Business für das Voice Business ab. Konvergenz von geräte- und netzbasierten Diensten Der derzeit wichtigste Technologie-Trend heißt Konvergenz: Getrieben von der wachsenden Bedeutung des mobilen Internets wird die Sprachtechnologie für unterschiedliche Einsatzzwecke mit anderen Interaktions-Medien zusammengeführt. Spracherkennung und Sprachausgabe, ob netzbasiert oder im Endgerät eingebaut als Bedienfunktion, soll mit grafischen Benutzerschnittstellen sinnvoll zusammenwirken. Dafür müssen technologische Kompetenzen aus unterschiedlichen Fachgebieten der Sprachtechnologie zusammengeführt werden, wie das Erkennen großer Wortschätze beim Diktieren, das sinnvolle Interpretieren von Antworten auf offene Fragen und das Suchen in einem semantischen Kontext. Erst wenn das gelingt, könnn die Visionen der Anbieter Wirklichkeit werden und auch komplexe Such-Services wie Google ihre Macht im Voice-Web entfalten. Die Verarbeitung von Spracheingaben ist mittlerweile hoch konvergent. Neueste Handys bieten eine „One Button Voice Control“: Drückt man den „Voice-Knopf“, schreibt die „embedded“ Sprachsteuerung ähnlich wie Nuance Dragon am PC direkt in den Cursor oder liest bei einem anderen Kommando das gerade offene Display vor. Dies erleichtert zum Beispiel die Nutzung von Messaging-Anwendungen wie eMail oder SMS: Wer eine eMail empfangen und gelesen hat, drückt einfach den Voice-Knopf, befiehlt: „Antworten“, das Handy öffnet die Antwort-Mail, der Cursor springt in die Adresszeile usw. usf. Oder man drückt den Voice-Knopf, öffnet mit „Börsenkurse“ die gewünschte Applikation, nennt das Nasdaq-Kürzel der Aktie und schon sendet der Server die Kursdaten als übersichtlichen Chart aufs Handy-Display. Marktreport VB07 Vers 1 0 (2).doc Seite 41 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Neuartige hybride Lösungen ermöglichen es, Sprachverarbeitung im Handy mit netzbasierten Services zu kombinieren, um z.B. in Verzeichnissen mit Millionen Einträgen zu suchen: Dabei wird die Spracheingabe im Handy „embedded“ erfasst, die Analyseergebnisse per Datenstream an den Server geschickt, der die Ergebnisse der Suchabfrage an das Display des Endgerätes sendet, wo die Ergebnisse, geordnet nach Parametern wie z.B. der Nachfrage, übersichtlich mit den genannten Informationen aufgelistet werden. Selbstverständlich lassen sich die Einträge dann wieder per embedded Sprachsteuerung vorlesen und auswählen, womit der Download initiiert wird. Auch die Bereitstellung der Mobile Contents ist von Konvergenz geprägt: Moderne VXMLPlattformen bieten eine Dialogfähigkeit, die über den Sprachdialog hinausgeht und Audio/Grafik/Video mit einbezieht. So genannte „Interactive Video Response Plattformen“ ermöglichen auf der Basis der Sprachplattform des Unternehmens die Verknüpfung und die Vermarktung von Sprachsteuerung mit Audio- und Videoinhalten. Eine Applikationslogik – viele Wege Modulare, distribuierte Architektur Grafisch (PC, …) Präsentation ApplikationsLogik Datenspeicher HTML Telefon TCP/IP und Web Protokolle voiceXML Beispiel: Client/ServerAnwendung Multimodal (PDA, …) SALT Multimediale Nutzungen In Anlehnung an Intel (2002) © 2003 HC / STRATECO Abb.: Multimedia-Access Zugleich verfügen auch Content- und Applikationsanbieter inzwischen über Content Management Systeme, die ihnen erlauben, ihre Inhalte nur einmal in eine Datenbankanwendung einzupflegen, sie aber beliebig im Web, per WAP, als SMS/MMS oder als Sprachanwendung anzubieten. Unabhängig vom Datenformat werden die nur einmal vorgehaltenen Inhalte dann von Internetbrowsern, WAP-Browsern, Fernsehern, PDA/Smart Phones oder TTS-Systemen verarbeitet. Durch die zunehmende Konvergenz von Endgeräten, Diensteabruf und Contentbereitstellung, für deren Entstehen Sprachtechnologie eine wichtige Rolle spielt, entsteht eine Infrastruktur für die massenhafte Verbreitung von Mobile Services. Information überall verfügbar Ein Schlüssel für den Erfolg der neuen Internetstrategien der Mobilfunkanbieter ist die Internetsuche. Eine effiziente Websuche auf dem Handy ist daher eine für die Mobilfunkprovider “strategische” Applikation: T-Mobile und Vodafone sind nicht umsonst Kooperationen mit Google respektive Yahoo eingegangen. Handango.com geht gleich einen Schritt weiter: Auf der Handy-Tuning-Webseite des Unternehmens können Verbraucher die nutzerunabhängige Nuance-Sprachsuche und -steuerung (One Button Voice Control) für das Handy für 6 $/Monat als Dienst erwerben. Marktreport VB07 Vers 1 0 (2).doc Seite 42 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Spracherkennung in Kombination mit Text- und grafischer Eingabe (Tastatur, Touchscreen/Maus) erlaubt die natürliche, geräteunabhängige Steuerung von Diensten und ermöglicht eine flexiblere, schnellere Eingabe von Informationen sowie eine sichere Bedienung von Endgeräten unabhängig von Typ und Marke. Die Ausgabe von Informationen oder Bereitstellung von Diensten erfolgt kanalunabhängig und medienübergreifend auf jedes beliebige Endgerät im entsprechend geeigneten Medienformat, wie z.B. als Audio, Bild, Film oder Text. Transaktionen werden einfacher und können nahtlos über verschiedene Modalitäten abgebildet werden. Insbesondere im mobilen Bereich entstehen durch sprachgesteuerte multimodale Interfaces Anwendungsfelder für Mobile Dienste, die mit herkömmlichen Nutzerinterfaces vom Verbraucher aufgrund nicht zureichender Usability vielleicht nicht angenommen würden. Neben der Vereinfachung des Zugangs zu Mobilen Diensten wird Sprachtechnologie zunehmend wichtiger für die Erhebung von Daten über die Anwendungs-Performance selber. Unter dem Stichwort “Audiomining” erheben Betreiber von Sprachanwendungen mit Sprachtechnologie die für die Anwendungsoptimierung erforderlichen Daten. So lassen sich die Dialoge von Sprachanwendungen durch Voice Stream Analysen gezielt optimieren: Die im System laufend erhobenen Daten werden strukturiert in einer Datenbankanwendung gespeichert und aufbereitet. In Verbindung mit Business Intelligence Tools entsteht eine Senkung des Personalaufwands für Monitoring, Reporting und Tuning von Sprachdialogsystemen von bis zu 80%, weil die strukturierte Erfassung der Dialogdaten auf der Sprachplattform laufend Echtzeitdaten über bis zu 50 Key Performance Indikatoren liefert. Zugleich lassen sich aus der Voice Stream Analyse auch wichtige Daten für die Entwicklung von geeigneten Modellen für “Open Grammar” Strategien ableiten, die Sprachportale intuitiver und schneller bedienbarer machen sollen. Hier geht es darum, dem Nutzer einen möglichst freien Dialog mit der Anwendung zu ermöglichen. Bei Open Grammars verfolgt man den Ansatz, aus den freien Eingaben des Nutzers auf deren Bedeutung zu schließen, indem Schlüsselworte identifiziert werden, die Rückschlüsse auf den Bedeutungskontext liefern. Dazu werden in der Grammatik anstatt starrer Vokabularien Bedeutungskonzepte hinterlegt, also mathematische Modelle über die Wahrscheinlichkeit verschiedener Interpretationsmöglichkeiten der Eingabe. Die Genauigkeit der mathematischen Modelle steigt mit der Datenqualität, die ihrer Entwicklung zugrunde liegt. Die automatisierte Erfassung und Analyse Tausender von Gesprächen ist ein Weg, diese Daten zu erheben und die wachsende Komplexität Mobiler Dienste durch Sprachsteuerung verfügbar zu machen: Anstelle immer umfangreicherer Grammatiken treten immer bessere mathematische Modelle in den Vordergrund, die dem Nutzer die intuitive Steuerung von Diensten auch ohne lange Menus erlauben. Sprachverarbeitung wird zum entscheidenden Faktor für den Zugang zu Informationen – für den Verbraucher ebenso wie für den Anbieter Mobiler Services. Medienübergreifendes Publizieren Content- und Applikationsanbieter wollen ihre Inhalte medienneutral anbieten, damit Endverbraucher sie unabhängig vom Zugangstool konsumieren können. Medienübergreifendes Publizieren bietet Contentanbietern und Mobile Providern neue, spannende Marktchancen: Einerseits eröffnen sich durch die Bereitstellung von Inhalten und Diensten (aus einem CMS) im Sprachkanal neue Zielgruppen, die bisher nicht erreichbar waren, weil sie z.B. das Internet gar nicht nutzen. Zum anderen werden aber auch neue Produkte und Dienste möglich: In der Pipeline sind z.B. Handelsinformationssysteme für den „Point of Sales“, die für jedes Produkt im Supermarkt alle Produktinformationen per Telefonnummer sprachgesteuert verfügbar machen. Oder Anwendungen, die dem Anrufer erlauben, sich am Telefon z.B. aus einem Webangebot die Inhalte zu einem „Podcast“ zusmmenzustellen, der dann automatisch auf das Handy versandt und hörbar gemacht wird. Der Sprachkanal wird dank moderner Content medienübergreifendes Publizieren auch ins Telefon Vertriebsweg für Content Anbieter. Marktreport VB07 Vers 1 0 (2).doc Seite 43 von 50 Management Systeme, die ein erlauben, zu einem zusätzlichen Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Bessere Bedienbarkeit für personalisierte Multimedia-Service und „Smart Phones“ Viele Mobile Services scheitern bisher an der Bedienungskomplexität der modernen Mobilfunkendgeräte, die manche Verbraucher von einer Dienstenutzung abhält oder gar ausschließt. Mithilfe von Spracherkennung wird die Einrichtung und Administration komplexer Dienste sowie die Pflege von Benutzerprofilen um ein Vielfaches komfortabler als die meisten der bisher genutzten Medien, wie Formulare, Call Center oder die Administration per Tastatur übers Internet. Ohne leistungsfähige und komfortable Sprachdienste werden die Netzbetreiber keine Kundenakzeptanz für personalisierte Services erreichen und die Nutzung dieser Dienste weiterhin auf die online-Generation und Heavy-User-Technologiefreaks begrenzen. Technologische Trends Ausdehnung der Anwendungsgebiete durch die Konvergenz Quelle: Nuance © 2007 voice-community.de Abb.: Anwendungsgebiete für Voice Voice ist die Klammer, die die zukünftige konvergente IP-Welt umschließt – in einer Welt konvergenter IP-Netzwerkinfrastrukturen kann das Telefon zur konventionellen Mensch-zuMensch-Kommunikation ebenso genutzt werden wie als sprachgesteuerter Dienst oder als Sprachsteuerung für verschiedenste Endgeräte (wie z.B. dem Fernseher oder der MovieDownload-Settopbox). Sprachtechnologie erweitert die Steuerungsmöglichkeiten mobiler, multimodaler Dienste, bietet einen zusätzlichen Kanal für die Datenein- und -ausgabe und ermöglicht eine nahtlose Interaktion von Dienst und Nutzer. Nach der Call Center-Automatisierung wird die Welt der Mobilen Dienste zum nächsten großen Treiber für das Voice Business! Mobile Marketing: Die “last Mile” zum Kunden Ein anderer Mobile Trend ist Mobile Marketing. Das Handy wird zunehmend zur Schaltzentrale für Mobile Services, für die Experten in Europa im Jahr 2008 ein Marktvolumen von 1,5 Mrd. EUR erwarten. Davon werden etwa 60% auf Klingeltondownloads entfallen, 23% auf Spiele, 12% auf Logos und Bilder und 10% auf Mailboxansagen, Bildchirmschoner, Mobile Videos und sonstige mobile Dienste. Marktreport VB07 Vers 1 0 (2).doc Seite 44 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Bereits in 2005 setzten in Westeuropa die Mobilfunkunternehmen etwa 8 Mio. EUR mit Mobile Commerce Transaktionen um. SMS-Marketing, schon in 2005 mit 90 Mio. EUR in Europa ein spannender Markt, soll schon in 2011 etwa ein Marktvolumen von 430 Mio. EUR bedienen. Die zunehmende Bedeutung von Mobile Marketing für die Portefeuilles der Mobilfunker unterstreicht auch die Agenturszene: 32% der jeweils 30 größten Werbe-, Dialogmarketing-, Media- und Multimediaagenturen Deutschlands haben Mobile Marketing im Angebot. Wirkliche Kompetenz für Marketing-Kampagnen im Sprachkanal jedoch gibt es erst wenig: Einige wenige Agenturen verfügen hier über relevante Referenzen und Expertise – und gewinnen so die Pitches. Voice im Marketing: “Stimme deiner Stadt” Das erste interaktive Voice Casting Deutschlands Stimme deiner Stadt von Speak Up für RTL Radio, Lübbe Audio, McDonalds und hlx.com sucht sprachautomatisiert die erotischste Stimme Berlins − erreichbar unter 22456 in allen deutschen Mobilfunknetzen. Dies ist die erste Mobile Premium Voice Anwendung (0,69 Cent/Min.) in Kombination mit etablierten Medienformaten. Durch die Verlängerung des Radioformates über die Sendezeit hinaus in den Telefonkanal schafft dieser Dienst einen innovativen Ansatz zur Kundenansprache und -bindung für Radiosender und Werbetreibende. In der Verknüpfung von Radio, Web und Telefon sowie den integrierten Community-Elementen geht Speak Up vollständig neue Wege. Es nutzt erstmalig in Deutschland die Handy-Kurzwahl 22456 aus allen deutschen Mobilfunknetzen. Die auf über 200 Ports laufende Anwendung kann bis zu 20.000 Anrufe pro Tag abwickeln, in der Praxis wurden laut Betreiber etwa 90 Prozent der tatsächlich eingehenden Anrufe fallabschließend behandelt. Ein weiterer Trend in der Mobilfunk-Branche ist die Personalisierung von Geräten und Diensten. Verbraucher wollen individuelle Ring-Back-Töne ebenso wie auf sie angepasste Services. Bei der Gerätepersonalisierung wird Voice vor allem bei der Auswahl und Durchführung von Kauftransaktionen wie Klingeltönen etc. zum Einsatz kommen. Bei den Diensten sind die intelligente Vorqualifizierung und die personalisierte Anpassung von Menus in Sprachportalen das Stichwort. Eine gewisse Bedeutung für das weitere Vordringen von Sprachanwendung haben auch die fünfstelligen Mobilfunkkurzwahlnummern, die, noch bevor sie überhaupt flächendeckend zum Einsatz gekommen sind, bereits vergriffen sind. Die Betreiber der Kurzwahlnummern versprechen sich eine gute Kommunizierbarkeit und ein einfacheres Marketing für diese Nummern und die darüber erreichbaren Dienste, was für bessere Response-Quoten sorgen sollte. Für die Nutzer liegt ein Vorteil dieser fünfstelligen Nummern auch in der Kostentransparenz zum Beispiel gegenüber 0900er-Nummern im Festnetz. Trotz dieser günstigen Randbedingungen werden diese Kurzwahlnummern bisher noch nicht zur Zufriedenheit der Provider auch genutzt – sicher besteht hier ein Zusammenhang zwischen dem Nutzungskomfort dieser Dienste und ihrer Nutzungsfrequenz: Viele Mobile Services scheitern schlicht an der Bedienungskomplexität der modernen Mobilfunkendgeräte, die manche Verbraucher von einer Nutzung abhält oder gar ausschließt. Mithilfe von Spracherkennung würde die Einrichtung und Administration komplexer Dienste sowie die Pflege von Benutzerprofilen um ein Vielfaches komfortabler als die meisten der bisher genutzten Medien, wie Formulare, Call Center oder die Administration per Tastatur übers Internet. Marktreport VB07 Vers 1 0 (2).doc Seite 45 von 50 Nr. 1002306 MARKTREPORT E.4 © Mind | STRATECO Voice Business 2007 „On demand“-Services Telefongesellschaften und Service Provider profitieren mit am meisten von den Kostensenkungspotenzialen im Customer Care beim Einsatz von Sprachapplikationen. Zudem bieten sich ihnen durch sprachaktivierte Mehrwertdienste Möglichkeiten, profitable Last auf das Netz zu holen, das heißt, gleichzeitig eine Steigerung des „Average Revenue per User“ (ARPU) und eine Senkung der Anzahl der „Uncompleted Calls“ zu erzielen. Schließlich bietet ihnen das Prozess Outsourcing im Großkundengeschäft interessante Perspektiven.3 Aus Sicht der Service Provider gibt es somit drei Kerngeschäftsfelder: » Den Massenmarkt mit eigenen Services zu bedienen, » Business-Kunden zu helfen, Mehrwerte über vorkonfigurierte Standard-Lösungen zu nutzen sowie » als Prozess Outsourcer Umsätze (im Großkundengeschäft) zu generieren. Die Service Provider Perspektive Geschäftsfelder im Voice Business Massenmarkt Unternehmen • Nachrichten & Entertainment • Sales & Customer Care Lösungen • Interaktive Dienste & Home Shopping • (Micro) Content Payment • Media Interactive • Smart Communication & Messaging-Dienste • Auskunfts- & Vermittlungsdienste • Netzzentrische Anwendungen für Millionen ASP/Outsourcing • Platform Hosting • Managed Services • Application Development • Eine Plattform, viele Dienste ( Audiotex-Dienste) • Konfigurierbare Standard-Lösungen f. B2B2C Quelle: Marktstudie „Sprachapplikationen auf dem Prüfstand, Mind/Strateco 2003 © 2007 voice-community.de Abb.: Service Provider Geschäft Im folgenden Abschnitt untersuchen wir diese drei Szenarien im Hinblick auf Ihre Bedeutung für die Entwicklung des Voice Business im Service Provider Markt in Deutschland. Mehrwertdienste: Viel Potenzial im Massenmarkt? Es liegt noch nicht lange zurück, da gaben die Mobilfunkprovider in der Hoffnung, auf dieser Infrastruktur mit Mehrwertdiensten einen Massenmarkt aufbauen zu können, Milliarden Euro für UMTS-Lizenzen aus. Nachdem sich der Markt für Mehrwertdienste inzwischen als deutlich weniger dynamisch und profitabel für die Mobilfunkprovider erwiesen hat als erwartet, gehen die Anbieter nun den Weg, Mehrwertdienste in Self Service Angebote für ihre Kundschaft zu integrieren und so das Umsatzpotenzial des Voice User Interfaces für eine neue Generation an Mehrwertdiensten zu nutzen. 3 Die Telekomkonzerne betreiben die größten Call Center in Europa und sind auch die wichtigsten Kunden der großen Call Center-Outsourcer Marktreport VB07 Vers 1 0 (2).doc Seite 46 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Diese Strategie fußt auf der Einsicht, dass nur solche Dienste eine Chance im Markt haben, die aus Endkundensicht einen hohen Nutzwert bieten, der sich auch messen lässt und zudem klar kommunizierbar ist. Da Self Service Angebote einen hohen Nutzwert bieten und von den Verbrauchern eher angenommen werden, bietet die Integration von Mehrwertdiensten in die Self Service Applikation echte Chancen, die Kunden auch für die Nutzung kostenpflichtiger Mehrwertdienste zu interessieren. Das wird positive Auswirkungen auch für Anbieter im Voice Business zeitigen, wie wir schon im Testbericht VOICE Award 2006 [3] prognostizierten: „Netzintegrierte Sprachapplikationen ermöglichen eine komfortable, endgeräteunabhängige Nutzung von neuen Mehrwertdiensten und Inhalten. Mehrwertdienste stehen damit als Trägerdienste mit flexiblen Abrechnungsprozessen für verschiedenste Anwendungen zur Verfügung. Auch als Voice Gateway zu Web-Informationen haben Sprachapplikationen Potenzial, sofern die richtige Verknüpfung zu anderen Mehrwertdiensten gefunden wird. Zudem ist ein Voice Portal als Plattform für Dritte nutzbar; bestehende Inhalte können hierüber mehrfach und cross-medial vermarktet werden.“ Fallbeispiele aus dem Diensteangebot der Service Provider: Der unter der Kurzwahl 1414 aus dem Netz des Mobilfunkanbieters erreichbare O2 Tarifmanager bietet Vertragskunden umfangreiche Möglichkeiten, Änderungen an ihren Tarifen vorzunehmen. Der Tarifmanager ist per Sprache, alternativ auch über die Tastatur des Telefons steuerbar. Für einen Wechsel der Homezone kann sich der Kunde wahlweise an seinem derzeitigen Aufenthaltsort lokalisieren lassen und erhält so die nächste Adresse mitgeteilt, an der Genion verfügbar ist. Die gewünschte Adresse kann auch per Sprache eingegeben werden. Weitere Services des O2 Tarifmanagers sind Optionswechsel- und Taktungswechsel-Aktivierung und die Änderung von Servicepacks (wie SMS Pack, Surf & Email Pack, Data-Packs,..), der Fax und Daten-Option, des Tonindikators sowie der UMTS Option. Kunden von E-Plus konnten mit „Holiday Special 2006" günstige Roaming-Konditionen für ihre Reisen in Europa freischalten lassen. Gleichzeitig dient diese Anwendung als Marketing-Kampagne von E-Plus. Wer will, kann Freunde und Bekannte auf den Dienst aufmerksam machen, die dann per SMS benachrichtigt werden. Dies erfolgt automatisch, ohne Einbindung von Agenten. Die Klangwelt in den Audios wurde speziell an das Thema „SummerFeeling“ angepasst und die unterlegte Musik eigens für diese Promotion erstellt. Insgesamt ist die Anwendung für den Anwender intuitiv zu verstehen und die Registrierung bereitet dank der Verbundwort-Erkennung keine Probleme – Fallabschlussraten von über 75% sprechen für sich. Leider lassen sich die Systemansagen nicht unterbrechen, man muss mit dem Sprechen warten, bis das System eine Ja/Nein-Frage gestellt und den Benutzer aufgefordert hat, bitte „Ja“ oder „Nein“ zu sagen, oder die Unterbrechung der Hintergrundmusik anzeigt, dass man sprechen kann. Das Voice Business entwickelt sich zur „enabling Technology“ für Mehrwertdienste, die zunehmend in Self Service Angebote integriert werden, da erst durch Sprachsteuerung eine komfortable, endgeräteunabhängige Nutzung von neuen Mehrwertdiensten und Inhalten für viele Verbraucher möglich wird. Standardanwendungen: Mischen sie den Voice Markt auf? Im Geschäftskundenumfeld setzen die Service Provider auch auf die Vermarktung von Standardanwendungen, die sie auf ihren Voice Plattformen hosten und den Geschäftskunden als Managed Services zur Verfügung stellen. Laut dem Branchenbarometer 2006 der VOICE Community erwarten 60% der befragten Profis aus der Voice Branche, dass Standardanwendungen im kommenden Jahr die für die Marktentwicklung bedeutsamste Innovation sein werden – Standardanwendungen stehen „in den Startlöchern“, auch wenn es im Markt und bei den Interessenten oft noch nicht hinreichend bekannt ist. Es gibt mittlerweile ein zunehmendes Angebot von Standardanwendungen oder „Baukästen“ für Sprachdialogsysteme, die die Zusammenstellung einfacher, aber auch hochkomplexer Anwendungen aus einer Kombination verschiedener Module ermöglichen und mit dazu beitragen, dass Unternehmen heute kostengünstiger an robustere Sprachanwendungen kommen als je zuvor. Daneben gibt es auch erste „richtige“ Standardanwendungen, die Hosting-Anbieter und Anwendungsentwickler ihren Kunden als „Fertig-Produkte“ anbieten. Marktreport VB07 Vers 1 0 (2).doc Seite 47 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO Hintergrundwissen: Voice Module – der Baukasten für Sprachanwendungen? Die meisten Sprachanwendungen wickeln Prozesse oder Business-Logiken ab, die auch an anderer Stelle zum Einsatz kommen: So fragen sie Postleitzahlen ab, nehmen Kontonummern auf oder erfassen Straßennamen. Diese Prozesse werden von Modulen innerhalb des Gesamtsystems durchgeführt, die die Grammatik, die Prompts und die Dialogführung für den behandelten Prozess beinhalten und so in eine Anwendung integriert werden, wie sie das betreibende Unternehmen benötigt. Für den Anrufer auf einem solchen System ist nicht zu erkennen, dass er in einer bestimmten Dialogphase ein eigenständiges Modul bedient; er empfindet die Anwendung als monolitisch. Eine Wiederverwendung von Anwendungsmodulen, die für eine bestimmte Aufgabe entwickelt wurden, trägt natürlich dazu bei, dass das „Rad nicht immer wieder neu erfunden“ werden muss, sie spart Entwicklungsaufwand und Kosten und schafft einen höheren Reifegrad und eine robustere Performance, da bereits entwickelte und im Betrieb optimierte Module den Debugging-Aufwand reduzieren und entsprechend höhere Betriebssicherheit bieten. Es gibt aber auch sogenannte „packaged Applications“, die durchaus auch aus den beschriebenen Modulen bestehen können, aber typischerweise weitere Eigenschaften haben wie Plattformunabhängigkeit, Konfigurationsmöglichkeiten, Standardkompatibilität und die das gesamte Voice User Interface beinhalten. Carrier, TelCos oder IT Services-Anbieter können mit Standardanwendungen neue Zielgruppen ansprechen und ihre Voice Plattformen besser auslasten, ohne sich hohe Administrations- und Implementierungsaufwand „aufzuhalsen“, da Standardanwendungen vorkonfiguriert und vom Kunden selber administriert werden. Attraktive Geschäftsmodelle entstehen aus der Kopplung der Vermarktung des Services (durch Einmalzahlungen und monatliche Grundgebühren) einerseits und des dadurch entstehenden Traffics an Telefonminuten (pay-per-use) andererseits. Hintergrundwissen: Standardanwendungen bei Service Providern Genesys bietet Carriern, die Standard-Sprachanwendungen vermarkten wollen, mit ihrem Genesys Customer Interaction Portal (GCIP) die dazu geeignete Plattform an. Das Unternehmen behauptet, dass mit dem GCIP Carrier, TelCos oder Großunternehmen kostengünstig einfache, standardisierte Sprachanwendungen auch für kleinere und mittlere Anrufvolumina bereitstellen können. Auf Basis von Templates, die einzelnen Sprachmodulen entsprechen, und Rollen, die die Zusammenstellung der Templates und deren Bedienung definieren, können verschiedenste Prozesse sprachautomatisiert werden. Die Bedienung des GCIP erfolge (auf Anbieter- wie Nutzerseite) per Browser im Web. Besonders attraktiv für Carrier sind laut Gennesys die operationellen Freiheitsgrade des GCIP und die frei definierbaren Pricing-Modelle: Möglich sei zum Beispiel die kostenlose Bereitstellung des Portals bei Berechnung des Traffics, eine monatliche „Subscription Fee“ oder die paketierte Berechnung. Auch ein „Feature Based Pricing“, das Templates (Vermittlung, Umfrage etc.) oder Funktionalitäten (TTS, Barge-In, etc.) berechnet, ist wie eventbasiertes Pricing abbildbar. Interessant wird das GCIP für Unternehmen aus dem Carrierumfeld, weil es erlaubt, sehr viele Anwendungen zu hosten, ohne deren Administration mit leisten (und berechnen) zu müssen. Ist eine Anwendung für einen Kunden erst einmal kostengünstig per Webbrowser auf der Plattform eingerichtet, kann er die weitere Administration seiner Anwendung auf einer passwortgeschützten Seite selber vornehmen. T-Com, mit über 3.600 auf dem Voice Web Portal installierten Ports Betreiber einer der großen Voice Plattformen in Deutschland, bietet seit Januar 2007 zwei Standardanwendungen an, den „Voice Navigator“ und das „Customer Feedback“. Mit dem Voice Navigator können Unternehmen alle eingehenden Anrufe schon im Netz vorselektieren und Kunden trotz einer Vielzahl verschiedener Anliegen immer direkt mit dem richtigen Ansprechpartner verbinden. Über einen Webbrowser steuert das Unternehmen den Sprachdialog flexibel im Netz und kann auch auf unerwartete Veränderungen im Haus kurzfristig reagieren. Mit dem Customer Feedback können Unternehmen im Internet ihren individuellen Sprachdialog zur Ermittlung der Kundenzufriedenheit über eine leicht bedienbare Oberfläche erstellen und ihre Anrufer nach dem Gespräch mit einem Mitarbeiter automatisiert zu ihrer Kundenzufriedenheit befragen. Call Centern bietet diese Anwendung eine kostengünstige Möglichkeit, ad hoc-Qualitätssicherung zu betreiben und dadurch sowohl den Kundenservice zu verbessern als auch dem Auftraggeber jederzeit Statistiken über die Call Center Performance zur Verfügung stellen zu können. Beide Dienste werden für eine einmalige Einrichtungsgebühr aufgesetzt, danach fallen eine monatliche Grundgebühr plus handelsübliche Minutenpreise für die entstehenden Anrufvolumina an. Ein breites Angebot an Standardanwendungen kann dem Markt für Sprachanwendungen eine neue Dimension eröffnen – Sprachanwendungen werden für eine Vielzahl von Unternehmen oder Unternehmenseinheiten attraktiv, die bisher Entwicklungskosten, den Aufbau von Betriebskompetenz und die laufende Wartung/Administrierung von Inhouse- oder individuellen Hostinglösungen scheuen. Auch für Unternehmen mit kleineren und mittleren Anruferzahlen kommt so eine Sprachautomatisierung wirtschaftlich in Betracht. Die Betreiber laststarker Systeme profitieren von der hohen Skalierbarkeit (z.B. auf den 3.600 Ports des T-Com-Angebots). Sie erschließen sich neue Geschäftsmodelle und neue Zielgruppen. Alle Kunden werden die hohe Betriebssicherheit und schnelle Time-to-Market dieser Standardanwendungen schätzen. Marktreport VB07 Vers 1 0 (2).doc Seite 48 von 50 Nr. 1002306 MARKTREPORT © Mind | STRATECO Voice Business 2007 Wenn Applikationsentwickler zudem weitere attraktive Standardanwendungen wie LocationFinder, Vermittlungszentralen oder Bestelldienste schaffen, wird auf Basis flexibler PricingModelle schnell eine relevante Marktnachfrage für einfache, vorgefertigte Sprachdienste entstehen. Der Sprachcomputer, heute vielfach noch eine Spezialanfertigung, wird dann zum industriell multiplizierbaren Produkt ähnlich einer Virenschutzsoftware oder einem CRM-System. ASP und Outsourcing: Chancen im Solution-Geschäft Die Service Provider verfügen über eine einzigartige Marktstellung, um für Unternehmenskunden komplette Kundeninteraktionsprozesse „End-to-End“ auszusourcen. So können Anbeiter wie T-Com oder D+S ihren Kunden heute das Outsourcing der kompletten Prozesskette anbieten. Dieses Kundenkontaktprozess-Outsourcing beginnt mit der Zuweisung einer Servicerufnummer, die bundesweit alle das Unternehmen betreffenden Anrufe unter einer Nummer bündelt. Durch die Abwicklung dieser Anrufe im Intelligenten Netz können die Anrufe schon im Netz intelligent geroutet werden – nach Bedarf zu bestimmten Call Centern, aber auch in Sprachportale und lokale ACD-Systeme, die eine weitere Vorqualifizierung des Anrufes leisten und die ensprechende Weiterleitung an das zuvor definierte Ziel auslösen. Dort werden auf Kundenwunsch die Anrufe (wahlweise per Sprachportal oder Agentenkontakt) angenommen und das Anliegen des Anrufers erfüllt, wobei die Integration des Sprachportals/Call Centers in die Backend-Prozesse des Kunden ermöglicht, zum Beispiel einen Warenversand auszulösen oder eine Tarifänderung direkt in den Systemen des Kunden vorzunehmen und die Kosten dafür direkt im Billing des Kunden zu verbuchen. Die Service Provider Perspektive Beispiel: Sale & Customer Care Solutions Agent Agent Service Service Anrufer Anrufer wählt wählt Service Service Ruf-Nr Ruf-Nr Intelligentes Intelligentes Netz Netz VorVorQualifizierQualifizierung ung Anliegen Anliegen Routing Routing Assisted Assisted Service Service Abrechnung Abrechnung der der Leistung Leistung Self Self Service Service © 2007 voice-community.de Abb.: Sales- und Customer Care Solutions Die Service Provider verfügen über eine einzigartige Marktstellung, um für Unternehmenskunden komplette Kundeninteraktionsprozesse „End-to-End“ auszulagern. Mit Business Process Outsourcing Services positionieren sie sich heute schon als die Kundenkontaktservice-Outsourcer der Zukunft und treten in direkte Konkurrenz mit Call Centern „alter Schule“: Aufgrund ihrer Nähe zu den Intelligenten Netzen, ihrer Erfahrung im Handling und der Automatisierung von Massenkundenkontakten und ihrer Prozesskompetenz insbesondere auch in der Anbindung disparater Backend-Systeme sind sie ideal aufgestellt, durch die Übernahme geschlossener Prozessketten neue Märkte für sich zu schaffen. Marktreport VB07 Vers 1 0 (2).doc Seite 49 von 50 Nr. 1002306 MARKTREPORT Voice Business 2007 © Mind | STRATECO E.5 Voice Business 2.0 Der Einsatz von sprachverarbeitenden Systemen wird in den kommenden Jahren weiter zunehmen. David Nahamoo, Department Group Manager und Chief Strategist Voice, IBM Research, sagte im Interview mit der VOICE Community: „In 10 Jahren werden wir Sprachtechnologie unbewusst einsetzen. Sie wird uns zur zweiten Natur, und zwar so weit, dass in 10 Jahren alle Geräte ein sprachgesteuertes Nutzerinterface haben werden, wir die Nutzung dieser Schnittstelle jedoch von der Umgebung abhängig machen: So würde ich z.B. in einem Konferenzraum keine Notizen mit der Sprachschnittstelle machen. Auf der anderen Seite könnte ich, das Einverständnis meines Gesprächspartners vorausgesetzt, Unterhaltungen aufzeichnen und automatisch transkribieren lassen, so dass ich später jederzeit Details dieser Diskussionen recherchieren könnte. Auch meine Interaktion im Auto wird zukünftig definitiv automatisierter sein als heute - wir werden Sprachsteuerung nutzen für Navigation, für die Kommunikation im Autor wie z.B. Downloads von E-Mails und natürlich zur Auswahl der Musik, die wir hören wollen. Zuhause könnte ich mir vorstellen, beim Abendessen zum Beispiel das sprachgesteuerte Lexikon aufzuschlagen und einen strittigen Begriff sofort zu klären.“ Das alles ist noch Zukunftsmusik. Welche Trends Sie bis 2010 erwarten dürfen, beschreiben wir im folgenden Abschnitt. Der Sprachkanal im neuen Kleid Ein Zukunftstrend, der sich bereits abzeichnet, ist sicherlich die Industrialisierung des Dienstleistungssektors: Personalisierte, telefonische Self Services werden für die kommunikationsintensiven Branchen zum wichtigsten Kundenkontaktkanal. Hier bietet sich den Unternehmen laut Expertenansicht das größte Geschäftspotenzial der nächsten Jahre: Medien- und Prozessbrüche in der Bearbeitung von Kundenanliegen können geschlossen werden (z.B. wenn Auftragsannahme und Versand bereits optimiert sind, aber Schwächen im Rechnungswesen bestehen). Mass-Calls werden besser steuer- und handhabbar und letztlich wird das Back Office der Unternehmen transparenter und lässt sich anhand der tatsächlichen Geschäftsprozesse rationalisieren und automatisieren. Fachleute sprechen daher von der Industrialisierung der Verwaltung durch Wissensmanagement: Individuelle Kontakte werden in standardisierte Verfahren überführt, Bearbeitungszeiten verkürzt und so die Kundeninteraktionskosten signifikant gesenkt. In vielen Industriebereichen liegt das Verhältnis von Front- und Back Office-Personal bei 1:3 oder sogar höher. Jeder Leser kann sich selber ausmalen, welche Verbesserungen der Produktivität und Einsparungen bei den Personalkosten möglich wären, wenn die Effizienz und Beständigkeit von Kundenabläufen im Back Office genauso hoch wäre wie im Contact Center. Ein anderer Zukunftstrend, der schon sichtbar ist, ist die Sprachsteuerung für multimediale und multimodale Telefonbedienung. Integrierte Kommunikationsdienste (Unified Communications) als dritte Generation von Telefondiensten werden auf der Sprachsteuerung als wesentlicher Benutzerschnittstelle aufbauen. Im Bereich Mobile Services zeigt sich die Zukunft in den aktuellen Content Management Systemen, die das medienübergreifende Publizieren in alle Kanäle von Print über Web bis Sprache ermöglichen. Content Anbieter können so neue interaktive Kundenkanäle erschließen und neue Absatzwege für ihre Inhalte schaffen. Schließlich darf damit gerechnet werden, dass nach dem großen Erfolg der Internet Service Provider mit dem Web Hosting nun das Voice Hosting als Geschäftsmodell der Telefongesellschaften den Festnetz-Diensten neue Impulse geben werden. Marktreport VB07 Vers 1 0 (2).doc Seite 50 von 50 Nr. 1002306 m|i|n|d BUSINESS CONSULTANTS STRATECO GMBH & CO. KG Gesellschaft für strategisches Consulting Düsseldorfer Strasse 25a 40545 Düsseldorf Kaiser-Friedrich-Promenade 45 61348 Bad Homburg v. d. Höhe Fon: +49 (0) 211 98 96 95 - 70 Fax: +49 (0) 211 98 96 95 - 55 Fon: +49 (0) 6172 9959 - 500 Fax: +49 (0) 6172 9959 - 599 www.mind-consult.net www.strateco.de Copyright 2007, mind Business Consultants Alle Rechte vorbehalten. Kein Teil dieser Studie darf in irgendeiner Form (Druck, Fotokopie oder einem anderen Verfahren) ohne schriftliche Genehmigung von Bernhard Steimel, mind Business Consultants, reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.