Marktreport Voice Business 2007 der

Werbung
Projekt Nr. 1002306
Marktreport Voice Business 2007 der
Version: 1.0
Mit freundlicher Unterstützung der
Autoren: Bernhard Steimel, Sebastian Paulke, Jens Klemann
Ein Studie von
Mind Business Consultants / STRATECO
Düsseldorf / Bad Homburg
1. Juni 2007
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Inhaltsverzeichnis
A
B
Allgemeines .......................................................................................................3
A.1
Über diesen Marktreport ................................................................................................................ 3
A.2
Über die Autoren .......................................................................................................................... 3
A.3
Über die Herausgeber ................................................................................................................... 4
A.4
Glossar ......................................................................................................................................... 4
A.5
Abbildungsverzeichnis ................................................................................................................... 9
A.6
Literaturverzeichnis ......................................................................................................................10
A.7
Fallbeispielverzeichnis ..................................................................................................................10
Management Summary .................................................................................. 11
B.1
Kernaussagen ..............................................................................................................................11
B.2
Kennzahlen .................................................................................................................................14
C
Einleitung: Vorurteile und Fehleinschätzungen im Voice Business ............... 15
D
Status Quo: Sprachautomatisierung in der Wirtschaft .................................. 17
E
D.1
Einsatzziele: Warum Sprachautomatisierung? ................................................................................17
D.2
Die Kunden: Erfolgskennziffern aus Betreibersicht..........................................................................23
D.3
Nutzerakzeptanz: Vernunftehe statt Liebeshochzeit ........................................................................28
D.4
Anbietermarkt: Eine Branche konsolidiert sich................................................................................31
Die Zukunft des Voice Business ..................................................................... 36
E.1
Trends im Voice Business .............................................................................................................36
E.2
Serviceorganisation der Zukunft ....................................................................................................39
E.3
Mobile Trends: Treiber des Voice Business ....................................................................................41
E.4
„On demand“-Services .................................................................................................................46
E.5
Voice Business 2.0 .......................................................................................................................50
Marktreport VB07 Vers 1 0 (2).doc
Seite 2 von 50
Nr. 1002306
MARKTREPORT
A
Voice Business 2007
© Mind | STRATECO
Allgemeines
A.1 Über diesen Marktreport
Sprachdialogsysteme erobern langsam aber sicher unseren Alltag. Dennoch bestehen in der
Öffentlichkeit wie bei Entscheidern nach wie vor viele Vorbehalte gegenüber dieser Technologie.
Der „Marktreport Voice Business 2007“ richtet sich an alle Interessenten an der
Sprachtechnologie, die erfahren wollen, in welchen Einsatzfeldern sie sich bereits bewährt hat
und mit welchen Resultaten. Er bietet seinen Lesern einen konzentrierten Einblick in
Marktzahlen, Entwicklungsstand und die neuesten Trends im Voice Business.
Der „Marktreport Voice Business 2007“ konsolidiert die Ergebnisse unserer vierjährigen
Marktforschung und –analyse und baut auf folgenden Studien auf:
»
„Praxisreport: Ist Deutschland sprachlos?“, Heitzig Consult/STRATECO 2003
»
„Testbericht: VOICE Award 2005 – die besten deutschsprachigen Sprachapplikationen“,
DFKI/Mind/STRATECO, 2005
»
„Testbericht: VOICE Award 2006 – die besten deutschsprachigen Sprachapplikationen“
DFKI/Mind/STRATECO, 2006
»
„Akzeptanz von Sprachapplikationen in Deutschland 2006“, Fraunhofer IAO/Initiative VOICE
BUSINESS, 2006
Weitere Materialien stammen aus der VOICE Community: Die dort erhobenen
Umfrageergebnisse zusammen mit Best Practice Cases und den redaktionellen Forumsbeiträgen
liefern viele wertvolle Informationen aus der Praxis des Voice Business, die in diesen
Marktreport Eingang fanden. Zudem fanden Fakten und Zahlen aus anderen Quellen
Verwendung.
Der vorliegende Marktreport beleuchtet zunächst den Status Quo im Voice Business. Aktuelle
Daten zu Marktbedeutung, Kundensicht und Nutzerakzeptanz werden anhand zahlreicher
Beispiele und belastbarer Fakten analysiert. Dann werden aktuelle Markttrends beleuchtet – im
Fokus steht hier die allgemeine Marktentwicklung, Technologie-Trends sowie die Entwicklung
der Enterprise-, Service Provider- und Mobile Märkte. Das abschließende Fazit bietet einen
Ausblick auf die Zukunft des Voice Business im deutschsprachigen Raum.
A.2 Über die Autoren
Bernhard Steimel, Inhaber, mind Business Consultants
Bernhard Steimel ist Inhaber der MIND Business Consultants mit Sitz in Düsseldorf. Seit
Mai 2000 ist er als Unternehmensberater in zahlreichen Projekten für Service Provider,
Softwareunternehmen und Systemintegratoren tätig geworden. Ein Beratungsschwerpunkt ist Business Development.
Bernhard Steimel ist u.a. Autor der Studie „Sprachapplikationen auf dem Prüfstand“,
Mitbegründer der Initiative VOICE BUSINESS und verantwortlich für die Durchführung der
VOICE Awards. Als Herausgeber der VOICE Community ist er Autor zahlreicher
Fachartikel zum Voice Business.
Zuvor hatte er als Marketingleiter der Düsseldorfer DIALOG Software + Telekommunikations AG eine neue Beratungsproduktlinie konzipiert und im Markt etabliert. Bei
o.tel.o war Bernhard Steimel im Key Account Management Vertrieb Handel tätig, wohin
er nach einer Tätigkeit als Berater der Eutelis Consult in Ratingen gekommen war.
Bernhard Steimel erwarb das Diplom der Wirtschaftswissenschaften an der Bergischen
Universität GH Wuppertal und den Bachelor's Degree in Economic Sciences an der
Université de Paris, Sorbonne.
Marktreport VB07 Vers 1 0 (2).doc
Seite 3 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Sebastian Paulke, Analyst, mind Business Consultants
Sebastian Paulke ist seit Anfang 2003 als Analyst und Redakteur im Themenfeld
Sprachtechnologie tätig und beobachtet seither die im deutschen Markt betriebenen
Sprachanwendungen.
Als leitender Redakteur der Initiative VOICE BUSINESS sowie der VOICE Community hat
er aktiv zur positiven öffentlichen Wahrnehmung der Sprachtechnologie in den Medien
beigetragen und mit zahlreichen Veröffentlichungen den Wissenstransfer aus der
Fachwelt in die Laien-Öffentlichkeit befördert. Die von Sebastian Paulke konzeptionell
mitentwickelte und inhaltlich mitgestaltete VOICE Community gilt als der führende
Brancheninformationsdienst für Sprachtechnologie im deutschsprachigen und
europäischen Raum.
Fachbeiträge
zur
Sprachautomatisierung
publizierte
absatzwirtschaft, CallCenter Profi, funkschau und TeleTalk.
Sebastian
Paulke
u.a.
in
Sebastian Paulke studierte Maschinenbau und Philosophie in Duisburg und Düsseldorf.
Jens W. Klemann
Jens Klemann ist geschäftsführender Gesellschafter der STRATECO GmbH & Ko. KG,
Strategie- und Management-Beratungsgesellschaft mit Sitz in Bad Homburg. Er ist dort
verantwortlich für die Bereiche Marketing und Business-Development und besitzt
langjährige Branchenerfahrung im ITK-Markt.
Neben seiner Rolle als Autor und Herausgeber verschiedener Markstudien – unter
anderem des jährlichen Branchen-Barometers „Contact Center-Trends 200x“ – ist er CoHerausgeber der „www.voice-community.de“ sowie Gründer der „Initiative VOICE
BUSINESS“, der sich mittlerweile nahezu alle führenden Hersteller von Sprachtechnologie
angeschlossen haben.
Vor STRATECO war er – zunächst als Geschäftsführer später als Vorstand – in der LogoGruppe, Frankfurt, zuständig für die Bereiche IT und Telekommunikation und baute dort
neben einem eigenen Contact Center den Geschäftsbereich Contact Center-Consulting
auf.
Jens Klemann erwarb seinen Abschluss als Diplom-Kaufmann an der Goethe-Universität
in Frankfurt mit den Studienschwerpunkten Marketing und Logistik. Er unterrichtete in
dieser Zeit an mehreren Lehrstühlen.
A.3 Über die Herausgeber
VOICE Community
Die VOICE Community ist das Kompetenz-Netzwerk für Sprachdialogsysteme im
deutschsprachigen Raum und richtet sich an alle, die sich für den Einsatz von
Sprachautomatisierung und neuen sprachgesteuerten Mehrwertdiensten interessieren.
Das kostenlose Angebot umfasst alles, was man für den Einstieg ins Voice Business braucht:
News-Channel, Best Practice Beispiele, Fachbeiträge von Top-Experten sowie Marktberichte und
Analysen.
Alle Informationsangebote dienen der Informationsvermittlung und dem Wissensaustausch und
sind frei von Werbeinhalten. Unterstützt wird die VOICE Community von Alcatel-Lucent,
Genesys, Nuance und T-Com. Herausgeber sind die Unternehmensberatungen Mind und
STRATECO.
www.voice-community.de
A.4 Glossar
Begriff
Erklärung
Marktreport VB07 Vers 1 0 (2).doc
Seite 4 von 50
Nr. 1002306
MARKTREPORT
Begriff
Voice Business 2007
© Mind | STRATECO
Erklärung
24/7 Service
bedeutet in diesem Zusammenhang die ständige Verfügbarkeit von ServiceAngeboten: 24 Stunden am Tag, sieben Tage die Woche.
ACD
Automated Call Distribution ist ein Telefonsystem im Call Center, das ankommende
Anrufe zu Mitarbeitern des Call Centers leitet und ausführliche Statistiken (z. B. über
Anrufaufkommen, Dauer und Wartezeit) erstellt. In Allgemeinen als „ACD-Anlage“
bezeichnet, beschreibt dieses Akronym eine Technologie, die es einem Call Center
gestattet, eingehende Anrufe nach bestimmten Regeln zu organisieren und an zur
Verfügung stehende Call Center Agenten weiterzuleiten, so dass eine möglichst hohe
Auslastung herbeigeführt wird.
Active Grammar
aktives Grammatiksystem. Wird von einem Spracherkenner genutzt und regelt die
Verwendung des aktiven Wortschatzes eines Sprachdialogsystems.
Application Life Cycle
Management
ist das Ändern, Anpassen und Managen des Designs, des Aufbaus, des Angebots und
der Inhalte einer Anwendung und dient der schnellen, Kosten günstigen Optimierung
bzw. Modifikation der Applikationen z.B. bei Kampagnenänderung.
ARPU
Average Revenue Per User (ARPU) ist der durchschnittliche Umsatz pro Kunde
ASR
Automated Speech Recognition wird mit "Spracherkennung" übersetzt und
beschreibt die automatische Interpretation menschlicher Sprache von einer
Maschine, also die Umsetzung von gesprochener Sprache in Text ("Speech to Text").
Audiotex-Plattformen
ist ein anderer Begriff für Tastaturwahl-Systeme, der bei den Telefongesellschaften
ähnliche Verbreitung hat wie -> IVR bei Telefonanlagen-Herstellern, mit dem
Unterschied, dass Audiotex-Systeme für den Hochlastbetrieb am Telekommunikationsnetz konzipiert sind.
Authentifizierung
ist ein Prozess, bei dem die Identität des Anrufers durch einen Vergleich des
tatsächlichen Stimmbeispieles mit dem Stimmabdruck des Benutzers überprüft wird.
-> Sprachbiometrie
Automated Attendant
(oder Auto-Attendant)
ist
die
Bezeichnung
für
einen
automatischen,
sprachgesteuerten
Telefonvermittlungsplatz und ist der digitale "Ersatz" für einen menschlichen
Telefonisten, der Anrufe (beispielsweise in einem Call Center) annimmt, Anfragen
behandelt und dabei auf die Stimme des Anrufers oder Tastentöne reagiert.
Automatisierungsrate
Die Automatisierungsrate (Call Completion Rate) gibt den Anteil der Anrufe wieder,
die erfolgreich durch die Sprachapplikation abgewickelt wurden und damit das
Anliegen des Anrufenden lösen konnten. Die Automatisierungsrate ist nicht zu
verwechseln mit der Erkennungsgenauigkeit der Spracherkennung. Ein erneutes
Nachfragen der Sprachapplikation nach dem Anliegen des Anrufenden führt nicht zu
einer Verringerung der Automatisierungsrate. Wenn der Anrufende hingegen
aufgrund mehrfacher Nichterkennung seines Anliegens an einen Agenten übergeben
werden muss, verringert sich die Automatisierungsrate.
Backend-Systeme
bezeichnen die physische Ebene, also die Maschinen, auf der die einer Anwendung
dienenden Daten und Funktionen gespeichert sind.
Barge-in
ist die Möglichkeit für Benutzer von Sprachapplikationen, Eingabeaufforderungen zu
unterbrechen und eine Antwort zu geben, bevor die Eingabeaufforderung vollständig
abgespielt wurde. Dazu ist Echo-Elimination erforderlich, durch die die Ausgabe der
Maschine vom eingehenden Datenstrom entfernt wird. Durch Barge-in verändert sich
typischerweise das Initiativverhalten der Anwendung.
Billing-Systeme
Abrechnungssysteme
Built-in Grammar
ist ein vordefiniertes Set verschiedener Grammatiken, die eine schnellere
Entwicklung von Sprachapplikationen ermöglichen soll. VoiceXML 2.0 bietet
beispielsweise folgende Standardgrammatiken: Boolean, Date, Digit, Currency,
Number, Phone und Time.
Call Completion Rate
engl. für Automatisierungsrate, d.h. die Zahl der erfolgreich über das System
abgeschlossenen Anrufe.
Call Time
Unter der durchschnittlichen Anrufdauer (Call Time) ist die Zeit zu verstehen, die
jemand aktiv mit einer Sprachapplikation telefoniert.
CapEx
Capital Expenditure ist die Kennzahl für die Kosten beim Kauf einer Netzwerk- und
Infrastrukturlösung. -> OpEx
Carrier GradePlattformen
Systeme mit mehr als 500 Ports, die hohe Verfügbarkeit, Skalierbarkeit und
Ausfallsicherheit für Netzbetreiber gewährleisten.
CPC
Costs per Call ist die Bezeichnung für die Kosten, die dem Unternehmen pro
Gespräch entstehen. Die Costs per Call berechnen sich aus der Summe der
Gesamtkosten
eines
Call
Centers
(Telefongebühren,
Personalkosten,
Bereitstellungskosten) dividiert durch die Gesamtzahl der eingegangenen Anrufe
innerhalb eines bestimmten Zeitintervalls.
CRM
Customer Relationship Management (CRM) „… is a business strategy to select and
manage customers to optimize long-term value. CRM requires a customer-centric
business philosophy and culture to support effective marketing, sales and service
processes. CRM applications can enable effective CRM, provided that an enterprise
Marktreport VB07 Vers 1 0 (2).doc
Seite 5 von 50
Nr. 1002306
MARKTREPORT
Begriff
© Mind | STRATECO
Voice Business 2007
Erklärung
has the right leadership, strategy, and culture.“ (CRMGuru.com)
CTI
Computer-Telefonie-Integration
Customer Interaction
Management
ist die Planung, Durchführung und Steuerung von Interaktionsprozessen mit dem
Kunden. Der Begriff wird technisch oft verwendet im Sinne der Nutzung
verschiedener Kommunikationskanäle.
Customer Value
Management
ist die Klassifizierung der Kunden auf Basis der Daten der Auftraggebern nach Wert
und Potenzial, auf deren Basis dann das entsprechend defininerte Call Routing
erfolgt.
Dialog
Navigation/Dialog
Führung
ermöglicht die "freie" Navigation durch ein sprachgesteuertes Angebot, unabhängig
von starren Menus und unabhängig vom Initiativverhalten der Applikation. -> Mixed
Initiative
Directory Assistants
bieten den sprachgesteuerten
Adressbücher
DTMF
Dual Tone Multi Frequency (DTMF) wird auch als Touch Tone- oder Push ButtonVerfahren bezeichnet. Mehrfrequenzwahlverfahren, bei dem das Telefonnetzwerk auf
die vom Anrufer eingegebenen Tonsignale reagiert. DTMF ist eine gebräuchliche
Schnittstelle zum Abrufen von Informationen aus automatisierten Systemen
(in der Regel IVR-Systeme). DTMF war ursprünglich eine eingetragene Marke von
AT&T.
Dynamic Grammar
ist eine Grammatik, die von einer Sprachapplikation während des Betriebs erweitert
und korrigiert werden kann.
Dynamic VoiceXML
beschreibt eine von der W3C definierte Funktionalität, mit der auf einfache Weise
VoiceXML Applikationen erstellt werden können.
Earcon
Kurze, prägnante Sounds mit spezifischer, unterscheidbarer Bedeutung. Vergleichbar
mit Icons im visuellen Bereich.
eingebettete Systeme
"Embedded Systems", englischer Fachbegriff für eingebettete (Computer-)Systeme,
die – weitestgehend unsichtbar – ihren Dienst in einer Vielzahl von
Anwendungsbereichen und Geräten versehen, wie z.B. in Flugzeugen, Autos,
Fernsehern, DVD-Playern oder allgemein Geräten der Unterhaltungselektronik.
„Embedded Systems“ vereinigen daher durch ihre oftmals sehr hardwarenahe
Konstruktion die große Flexibilität von Software mit der Leistungsfähigkeit der
Hardware.
Einzelworterkennung
Die sogenannte "diskrete Einzelworterkennung" identifiziert einzelne, vorgegebene
Wörter. Die diskrete Einzelworterkennung wird von der kontinuierlichen ->
(Schlüssel-) Worterkennung unterschieden, bei der Schlüsselworte aus ganzen
Sätzen heraus erkannt werden.
Effektivität
Ein Dialog ist Aufgaben angemessen, wenn er den Benutzer unterstützt, seine
Arbeitsaufgabe schnell und zielführend zu erledigen.
Erwartungskonformität
Ein Dialog ist erwartungskonform, wenn er konsistent ist und den Merkmalen des
Benutzers entspricht, z.B. seinen Kenntnissen in dem Arbeitsgebiet, seiner
Ausbildung und seiner Erfahrung sowie den allgemein anerkannten Konventionen."
eskalierendes
Prompting
ist die z.B. im Errorhandling eingesetzte Methode, bei wiederholten Fehleingaben
den Nutzer durch immer spezifischere Hinweise zu unterstützen.
EVA
Enterprise Voice Applications sind Sprachdialogsysteme, die von ihrem
Leistungsumfang her für Unternehmenskunden, in Abgrenzung zu -> Carrier GradeSystemen, konfiguriert sind.
Fallabschlussrate
-> Call Completion Rate
Fall Back
bezeichnet das "Zurückgehen" einer Sprachapplikation zu einem vorhergehenden
Punkt, z.B. wenn Spracheingaben an einem bestimmten Punkt nicht erkannt werden
konnten.
Fehlertoleranz
Ein Dialog ist fehlertolerant, wenn das beabsichtigte Arbeitsergebnis trotz
Fehlererkennungen entweder mit keinem oder mit minimalem Korrekturaufwand
seitens des Benutzers erreicht werden kann.
First Call Resolution
Lösung eines Kundenproblems bereits beim ersten Anruf, so dass erstens der Kunde
zufrieden ist und zweitens keine weiteren Follow-up Calls nötig sind. Voraussetzung
ist ein Support Agent, der die nötige Problem-Lösungs-Kompetenzen hat.
Hear&Feel
ist die akustische
Anwendung.
Hosting
hier: Das Betreiben einer Sprachdialogplattform für Dritte.
Hosting Platform
Eine Plattform, die das technische Vorhalten von Anwendungen und Inhalten auf
Internetservern ermöglicht.
Hot Word Recognition /
Schlüsselworterkennung
engl. für Schlüsselworterkennung. Spezielle Form der Spracherkennung, bei der ein
System die Äußerung eines Anrufers auf bestimmte Schlüsselworte (oder
Schlüsselphrasen) überprüft und erst nach deren Vorkommen aktiv wird.
Marktreport VB07 Vers 1 0 (2).doc
Analogie
Zugriff
zum
Seite 6 von 50
auf
persönliche
"Look&Feel",
zum
Telefon-
und/oder
Erscheinungsbild
einer
Nr. 1002306
MARKTREPORT
Begriff
Voice Business 2007
© Mind | STRATECO
Erklärung
Human Factor
Im Allgemeinen dient der Ausdruck der Beschreibung eines Designs, das an den
Menschen angepasst wird und die Leistung des Menschen in Bezug auf die Maschine
unterstützt oder sogar verbessert. Das Gegenteil davon ist ein Design, bei dem der
Benutzer besondere Leistungen erbringen muss, um erfolgreich mit der Oberfläche
oder dem Gerät zu interagieren (da er andernfalls den Vorgang abbrechen muss).
Bei Sprachapplikationen müssen bei der Erstellung des -> VUI und beim
Dialogdesign die den Benutzer betreffenden Faktoren berücksichtigt werden.
IDE
Integrated Development Environment (IDE) ist ein Begriff der Kelsey Group für
Entwicklungswerkzeuge für Sprachapplikationen (Development Tools), die in der
Regel integraler Bestandteil einer “Laufzeit-Umgebung” sind.
IN-Dienste
sind im -> Intelligenten Netz angebotene Dienstleistungen.
Intelligentes Netz
Das Intelligente Netz (IN) ist kein eigenes physikalisches Netz, sondern ein
diensteorientiertes zentrales System, das auf ein vorhandenes Telefonnetz (z.B.
ISDN) aufsetzt. Ein IN erweitert ein Telefonnetz um intelligente Netzkomponenten
und zusätzliche Leistungsmerkmale. Im Vordergrund stehen dabei Mehrwertdienste
für Festnetztelefonie, Mobilfunk und Telefax. Es ist nicht erforderlich, dass INBetreiber gleichzeitig Netzbetreiber sein müssen; sie können ihr Angebot über
vorhandene Netze realisieren. Durch eine IN-Nummer wird das zentrale System des
IN-Betreibers adressiert, der Service Control Point. In diesem können dann die Daten
des Anrufs mit verschiedenen Parametern (wie z.B. Ursprung des Anrufs, Uhrzeit,
Wochentag) verknüpft und flexibel gestalt- und beeinflussbare Dienste angeboten
werden.
Infotainment Services
sind Dienste, die sowohl informierenden als auch unterhaltenden Inhalts sind.
Lernförderlichkeit
Ein Dialog ist lernförderlich, wenn er den Benutzer beim Erlernen des Dialogsystems
unterstützt und anleitet.
Mehrwertdienste
Im Allgemeinen Bezeichnung für Dienstleistungen der Anbieter, die über die reine
Übertragungsleistung hinausgehen. Im Telefondienst z.B. eine im Netz angebotene
Sprachbox oder ein Informationsdienst im Rufnummernbereich (0)900
gegebenenfalls bis hin zum kompletten Call-Center.
Mixed Initiative
bezeichnet man einen Dialogablauf, der sich dynamisch an die Bedürfnisse des
Anrufers anpasst und zwischen Maschinenerfordernissen und menschlichem
Dialogverhalten angesiedelt ist.
Verbundworterkennung
Auch kontinuierliche (Schlüssel-)Worterkennung. Hier werden Schlüsselworte aus
einer Folge mehrerer Worte heraus erkannt. (Bsp.: „Mit dem Jugendamt!“ -> führt
beim Bürgeramt Augsburg zur Ausgabe der Informationen zum Jugendamt der
Stadt).
Multi Slot Model
wird auch Semantic Slot Model genannt. Äußerungen des Anrufers werden in einem
semantischen Modell erfasst und zugeordnet. Bestimmte Schlüsselworte (z.B. from,
to, date, time) können so mit weiteren Eingaben kombiniert werden, ohne dass diese
in einer bestimmten Reihenfolge gesprochen werden müssen. Das Multi Slot Modell
wird beim -> Mixed Initiative Ansatz verwendet.
Multi Persona Design
bezeichnet einen Ansatz im Dialog Design, der nicht nur eine -> Persona im System
bereitstellt, sondern dem Anrufer gleich mehrere virtuelle Persönlichkeiten anbietet,
gegebenenfalls gleichzeitig.
N-Best List
gehört zum Error Handling einer Applikation. Dabei werden mögliche Lösungen mit
der N-Best Liste verglichen. Die höchste Trefferwahrscheinlichkeit (N=1) ist meist die
korrekte Antwort auf eine vom Anrufer gestellte Frage. Allerdings kann das System
im Rahmen des Semantischen Modells feststellen, ob die "beste" Lösung unlogisch
oder ausserhalb des Kontextes liegt. In diesem Fall werden nachfolgende Vorschläge
aus der N-Best List verglichen und auf deren Plausibilität geprüft, bevor die Antwort
gegeben wird.
NLU
Natural Language Understanding (NLU) ermöglicht dem Anrufenden, in ganzen
Sätzen mit der Sprachapplikation zu sprechen. Dabei werden nicht nur die einzelnen
Worte erkannt, sondern auch ihre eventuell unterschiedliche Bedeutung in
Abhängigkeit von ihrer Stellung im Satz.
No Input
Ein Zustand, der eintritt, wenn ein Anrufer vom System zu einer Eingabe
aufgefordert wird und keine Eingabe erfolgt.
Non Speech Audio
nichtsprachliche Klänge, die mit passenden Hintergrundgeräusche den Dialog
auflockern (z.B. Tastaturgeräusche während einer Datenbankabfrage).
No Match
Ein Zustand, der eintritt, wenn ein Anrufer vom System zu einer Eingabe
aufgefordert wird und eine unlogische oder kontextuell unpassende Eingabe erfolgt
(die von der hinterlegten -> Grammatik erkannt wird).
OpEx
Operating Expenditure sind die Kosten für Betrieb und Wartung einer ITInfrastruktur. -> CapEx
Persona
Die Persona – der "Charakter" oder die "Persönlichkeit" – einer Sprachapplikation
könnte als "die Stimme des Systems" beschrieben werden. Anrufer können allein
anhand der Stimme genaue Schätzungen über soziale Parameter machen. Die
Marktreport VB07 Vers 1 0 (2).doc
Seite 7 von 50
Nr. 1002306
MARKTREPORT
Begriff
Voice Business 2007
© Mind | STRATECO
Erklärung
Auswahl eines bestimmten Sprachtalents und die Beschreibung der sozialen
Eigenschaften und des Lebenstiles der Persona sind daher nötig, um ein konsistentes
Design auch im Hinblick auf die "Corporate Identity" zu ermöglichen.
Personalisierung
Personalisierungsfunktionen sind z.B. dann gegeben, wenn man den Sprachdialog
der Anwendung individuell gestalten kann.
Plattform Hosting &
Content Billing
ist das skalierbare Bereitstellung von Ports (Sprachverarbeitung und -erkennung) mit
Zugang zu dem Netz eines oder mehrer Netzbetreiber und der Möglichkeit, die
Nutzung verbrauchsgerecht abzurechnen.
Port
Ressource, die zur Verarbeitung eines Anrufs benötigt wird. Ein System mit 30 Ports
kann 30 gleichzeitige Anrufe verarbeiten.
Prompt
Gesprochene Maschinenausgabe, die dem Benutzer signalisiert, dass er seine
Eingabe machen kann. Bei Eingabeaufforderungen handelt es sich um Hinweise,
durch die der Benutzer dazu veranlasst wird, zu sprechen oder eine Eingabe zu
machen. Sie können auch Informationen darüber enthalten, welche Eingabe bei
diesen Zuständen zulässig ist. Es gibt bestimmte Arten von Eingabeaufforderungen,
die gesondert behandelt werden: Anweisungen – Informationen zu Funktionen der
Applikation. Hilfe – Ein separater Zustand zur Unterstützung des Benutzers.
Feedback – Informationen für den Benutzer zum Zustand eines direkt folgenden
Ereignisses.
Prosodik
auch Prosodie: Gesamtheit sprachlicher Eigenschaften wie Akzent, Intonation,
Quantität und Sprechpausen. Sie beziehen sich in Allgemeinen auf Einheiten, die
größer sind als ein einzelnes Phonem. Zur Prosodie zählt auch die Untersuchung von
Sprechgeschwindigkeit, Rhythmus und Sprechpausen.
Qualität der
Spracherkennung
Darunter ist die Sprecherunabhängigkeit, die Geräuschtoleranz sowie die Anzahl der
erkannten Worte zu verstehen.
Randomised Prompting
ist die z.B. im Errorhandling eingesetzte Methode, bei sich wiederholenden Prompts
wechselnde Formulierungen zu verwenden.
ROI-Treiber
nennt man die Faktoren, die maßgeblich die Amortisierungsdauer beeinflussen. ROI
steht für Return On Investment
Say Anything
Ein Nuance-spezifischer Ausdruck für eine Technologie, bei der stochastische
Sprachmodelle für die Anrufweitervermittlung werden bzw. ein NLU-System, das
auch auf stark variierende Eingaben zu reagieren vermag.
Schlüsselworterkennung
erkennt aus Wortfolgen bestimmte vorher hinterlegte (Schlüssel-) Worte.
Sprachapplikation
ist eine Applikation, die in Dialogen und Interaktionen auf eine bestimmte Aufgabe
oder bestimmte Arbeitsabläufe abzielt. Die Interaktion zwischen Benutzer und
System erfolgt dabei nur über das Telefon. Ein solches System nutzt
Spracherkennung für das "Verstehen" der Instruktionen des Benutzers.
Sprachapplikationen benötigen ein bestimmtes Dialogdesign für die effiziente
Interaktion über ein -> VUI.
Sprachbiometrie
(Speaker Verification)
Durch Speaker Verification kann man in Zukunft aufgrund eines Voice Prints, den
man zuvor vom Anrufenden genommen hat, diesen anhand seiner Sprache
authentifizieren. Der Anrufer wird zur -> Authentifizierung gebeten, eine zufällige
Zahlenfolge oder Wörter nachzusprechen.
Sprachportale
Sprachportale ähneln den Web-Portalen und bieten dem Anrufer unter einer
Telefonnummer eine größere Auswahl an Sprachapplikationen. Sprachportale sind
anfangs weitestgehend auf einen Zweck ausgerichtet, der seine Stärke in der
Informationsbandbreite hat: Sprachportale bieten synergetische Informationsdienste
und Commerce-Anwendungen. Dabei stehen die Aspekte Unterhaltung, Service und
persönliches Zeitmanagement im Vordergrund.
Sprachsynthese (Text to
Speech, TTS)
Erfolgen die Systemantworten über Sprachsynthesesoftware bzw. durch Text to
Speech, können auch nicht vorgegebene Inhalte wiedergegeben werden. Z.B.
kommt diese Technik zum Einsatz, wenn es sich um Abfragen aus großen
Datenbanken handelt. Die Ergebnisse der Abfrage werden dann von der
Sprachsynthesesoftware vorgelesen. Ein Einsatz von Prerecorded Voice Files ist in
diesem Fall nicht möglich, da dies nicht nur zu aufwendig wäre, sondern auch weil
der Inhalt der Datenbanken sich ständig ändert.
sprecherunabhängig
verhalten sich Spracherkenner, deren Vokabular von jeder beliebigen Person ohne
Training verwendet werden kann. Es gibt drei Arten: Einzelworterkenner, kontinuierliche Spracherkenner und Phonem basierte Spracherkennung.
Stand Alone IVRLösungen
sind eigenständige, oft auch proprietäre IVR-Lösungen, bei der alle notwendigen
Komponenten zu einem Gesamtsystem zusammengefasst sind und die nicht in die
TK-Infrastruktur integriert sind.
Steuerbarkeit
Ein Dialog ist steuerbar, wenn der Benutzer in der Lage ist, den Dialogablauf zu
starten sowie seine Richtung und Geschwindigkeit zu beeinflussen, bis das Ziel
erreicht ist.
Task Completion Rate
-> Call Completion Rate
Marktreport VB07 Vers 1 0 (2).doc
Seite 8 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
Begriff
© Mind | STRATECO
Erklärung
Unique User
bezeichnet die Anzahl der Menschen, die eine Sprachapplikation zumindest einmal
benutzt haben.
Verbosität
Verbosität entsteht, wenn ein Text länger als nötig ist und mehr Worte benutzt
werden, als idealerweise nötig wären.
Verständlichkeit
Ein Dialog ist selbstbeschreibungsfähig, wenn jeder einzelne Dialogschritt durch
Rückmeldung des Dialogsystems unmittelbar verständlich ist oder dem Benutzer auf
Anfrage erklärt wird.
Voice Automation
Sprachapplikationen als Unternehmens-Dienste mit Fokus auf (Service-) Automatisierung als wesentlichem Treiber: Sprachapplikationen dienen als Zugang zu
Customer Service-Leistungen, internen Auskunfts- und Vermittlungsdiensten und der
Workflow-Automatisierung.
Voice Business
sind als Mehrwert-Dienste mit dem Fokus auf Umsatz und Kundenwert angelegte
Sprachapplikationen. Diese sprachaktivierten Mehrwertdienste dienen hier als
Zugang zu Bezahldiensten, der Produktdifferenzierung und Neukundengewinnung.
Beide Anwendungsgebiete von Sprachapplikationen unterscheiden sich heute noch
zumeist in technischer Hinsicht: Während Lösungen für Unternehmen meist über
lokal installierte Sprachintelligenz verfügen, liegt die Sprachverarbeitung bei
Mehrwertdiensten im Netz.
voiceXML
Voice eXtendable Markup Language (voiceXML) ist eine "vereinfachte" Version der
Standard Generalized Markup Language (SGML).
VUI
Voice User Interface (VUI) nennt man das Audioäquivalent zum GUI (Graphical User
Interface) im visuellen Bereich. Ein VUI implementiert die gesprochenen
Interaktionen zwischen Personen und Computern über ein (Telefon-) Netzwerk mit
Hilfe von Spracherkennung, Sprachsynthese und Sprachauthentifizierung.
Quelle:
Testbericht: VOICE Award 2006 – die besten deutschsprachigen Sprachapplikationen
[3]
A.5 Abbildungsverzeichnis
Tab.: Kennzahlen des Voice Business .............................................................................................................. 14
Abb.: Kommunikationskanäle ......................................................................................................................... 18
Abb.: IVR-Ports in Deutschland ...................................................................................................................... 19
Abb.: Anwendungstypen ................................................................................................................................ 20
Abb.: Branchenspektrum ................................................................................................................................ 22
Abb.: Effizienz von Sprachsteuerung ............................................................................................................... 23
Abb.: Automatisierungsraten .......................................................................................................................... 24
Abb.: Integrationstiefe ................................................................................................................................... 25
Abb.: ROI - Return on Investment .................................................................................................................. 27
Abb.: Kosten je Anruf .................................................................................................................................... 28
Abb.: Nutzungsbereitschaft ............................................................................................................................ 29
Abb.: Serviceverfügbarkeit ............................................................................................................................. 30
Abb.: Kostenbewusstsein ............................................................................................................................... 31
Abb.: Marktgröße EU ..................................................................................................................................... 32
Abb.: Weltmarkt
....................................................................................................................................... 33
Abb.: VXML ist Standard ................................................................................................................................ 33
Abb.: ASR-Anteil
....................................................................................................................................... 34
Abb.: Marktkonsolidierung.............................................................................................................................. 35
Abb.: Applikationsfelder ................................................................................................................................. 36
Abb: Trends im Anbietermarkt........................................................................................................................ 37
Abb.: Entwicklungstrends ............................................................................................................................... 38
Abb.: Markterfolgsfaktoren ............................................................................................................................. 38
Abb.: Kundenservice-Trends........................................................................................................................... 40
Abb.: Multimedia-Access ................................................................................................................................ 42
Marktreport VB07 Vers 1 0 (2).doc
Seite 9 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Abb.: Anwendungsgebiete für Voice ............................................................................................................... 44
Abb.: Service Provider Geschäft ...................................................................................................................... 46
Abb.: Sales- und Customer Care Solutions....................................................................................................... 49
A.6 Literaturverzeichnis
Studien / Marktforschung
[1] Praxisreport: Sprachapplikationen auf dem Prüfstand, Bernhard Steimel, Jens Klemann; Heitzig Consult,
STRATECO; Brilon, Bad Homburg, 2003
[2] Testbericht: VOICE Award 2005 – die besten deutschsprachigen Sprachapplikationen, Bernhard Steimel,
Prof. Anthony Jameson, Sebastian Paulke, Kerstin Klöckner; DFKI, Mind, Strateco; Düsseldorf, Saarbrücken, 2005
[3] Testbericht: VOICE Award 2006 – die besten deutschsprachigen Sprachapplikationen, Bernhard
Steimel, Prof. Anthony Jameson, Sebastian Paulke, Kerstin Klöckner; DFKI, Mind, Strateco; Düsseldorf, Saarbrücken,
2006
[4] Branchenbarometer 2006 der VOICE Community, Bernhard Steimel, Sebastian Paulke; VOICE Community,
Düsseldorf, 2006
[5] Contact Center-Trends 2007, Jens Klemann; Aspect, STRATECO; Bad Homburg, 2007
[6] Akzeptanz von Sprachapplikationen in Deutschland 2006, Matthias Peißner, Bernhard Steimel; Fraunhofer
IAO/Initiative VOICE BUSINESS; Bad Homburg, Stuttgart, 2006
[7] Testbericht: VOICE Award 2004 – die besten deutschsprachigen Sprachapplikationen: Bernhard Steimel,
Prof. Anthony Jameson, Sebastian Paulke, Kerstin Klöckner; mind, DFKI; Düsseldorf, Saarbrücken, 2004
Fachartikel
»
Vorurteile und Fehleinschätzungen im Voice Business, Sebastian Paulke, erschienen in: VOICE Community,
2007
»
Voice-„Fusionitis“: Ein Markt wird erwachsen, Sebastian Paulke, erschienen in: VOICE Community, 2007
»
3GSM-Barcelona: Total multimodal!, Sebastian Paulke, erschienen in: VOICE Community, 2007
»
Medienübergreifendes Publizieren – Voice, das "fünfte Element"?, Sebastian Paulke, erschienen in: VOICE
Community, 2006
»
Business Process Routing – Beginnt nun die Industrialisierung der Verwaltung?, Sebastian Paulke,
erschienen in: VOICE Community, 2007
»
Anwendungsoptimierung mit Customer Behaviour Intelligence und Voice Stream Analysis, Sebastian
Paulke, erschienen in: VOICE Community, 2007
»
Voice Module – der Baukasten für Sprachanwendungen?, Sebastian Paulke, erschienen in: VOICE
Community, 2006
»
Standardanwendungen – Sprachdialogsysteme vom Fließband, Sebastian Paulke, erschienen in funkschau
10/2006
»
VOICE Community-Interview mit David Nahamoo, Sebastian Paulke, erschienen in: VOICE Community, 2006
A.7 Fallbeispielverzeichnis
1. FC Köln Poldi, DB Dialog Bahnauskunft, E-Plus „Holiday Special 2006" , O2 Tarifmanager, Postbank
Telefonbanking, Speak-up RTL Radio Stimme deiner Stadt, T-Com Sprachportal für Vertrieb,
Kundenbetreuung und Service, T-Com Rückruf bei ‚besetzt’, T-Mobile Service Manager , Viasuisse
Verkehrsauskunft
Weitere Fallbeispiele unter www.voice-community.de/beispiele
Marktreport VB07 Vers 1 0 (2).doc
Seite 10 von 50
Nr. 1002306
MARKTREPORT
B
Voice Business 2007
© Mind | STRATECO
Management Summary
B.1 Kernaussagen
Einsatzziele: Warum Sprachautomatisierung?
Serviceautomatisierung und Kostensenkung sind die wichtigsten Gründe (notwendige
Bedingung) im Entscheidungsprozess für eine Sprachapplikation. Eine Verbesserung der
Kundenbindung und eine Engpassbehebung im Call Center sind die zweitwichtigsten Ziele
(hinreichende Bedingung), die ein Unternehmen durch die Einführung einer Sprachapplikation
erreichen will. Seit dem Jahr 2004 wurden hierzulande über 50.000 neue Sprachports in
Deutschland installiert, aktuell werden in Deutschland knapp über 300.000 Sprachports
betrieben. Rechnet man die Zahl der Ports hoch auf das darüber abgewickelte automatisierte
Kontaktvolumen, so kann man von mehr als 38 Mio. automatisierten Anrufen pro Tag
ausgehen.
Anwendungen zur Serviceautomatisierung dominieren klar, Mehrwertdienste und Kampagnen
spielen noch eine untergeordnete Rolle. Der Bereich der Service-Automatisierung zeigt ein
erstaunlich breites Anwendungsspektrum, mit einer starken Fokussierung auf einfache, häufig
wiederkehrende und gut standardisierbare Anfragen, aber auch mit kompletten Self ServiceAngeboten innerhalb von Voice Portalen. Sichtbar wird schließlich ein deutlicher Zuwachs an
komplexen Auskunftsdiensten. Sprachcomputer als Mehrwertdienst ermöglichen neue
Wettbewerbsstrategien und Produkte. Besonders viel versprechend scheinen den Anbietern von
Mehrwertdiensten Auskunftsdienste in Verbindung mit zusätzlichen Infotainment-Angeboten zu
sein. Es braucht noch Zeit, um den Sprachkanal als wertschöpfendes Element der
Markenbildung und -kommunikation und damit in den Marketing-Budgets der Unternehmen zu
etablieren. Die Vorteile liegen jedoch auf der Hand: Der Sprachkanal ist ein neues, stark
emotionalisierendes und hoch interaktives Medium für die Zielgruppenkommunikation im
Marketing.
Den Telefongesellschaften kommt nach wie vor eine besondere Bedeutung bei der
Heranführung breiter Bevölkerungsschichten an das neue Medium und für die Nutzerakzeptanz
von Sprachapplikationen zu. Das liegt einerseits daran, dass diese Unternehmen beim Einsatz
von Sprachapplikationen durch Kostensenkungspotenziale im Dienst für Millionen Kunden am
deutlichsten profitieren und sich ihnen anderseits durch sprachgesteuerte Informations- und
Kommunikationsdienste neue Einnahmequellen bieten. Das Branchenspektrum ist insgesamt
deutlich breiter geworden.
Erfolgskennziffern aus Betreibersicht
Sprachautomatisierung schafft dort den höchsten Nutzen, wo Geschäftsvorfälle nicht auf
anderem Wege automatisierbar sind oder die automatisierte Anwendung den Nutzern einen
hohen Mehrwert liefert. Je höher der von den Verbrauchern empfundene Kundennutzen ist,
desto größer ist auch die Akzeptanz eines Sprachdialogsystems. Erfolg und Leistungsfähigkeit
einer Sprachanwendung ebenso wie der erzielbare ROI hängen also unmittelbar von den
Faktoren Anwenderverhalten und Business Rules der Anwendung ab. Die Integration mit ACD-,
CTI- und CRM-Systemen schafft die Voraussetzungen für eine „intelligente“ Verknüpfung von
automatisierten Diensten und qualifizierten Agenten-Services in der Kundeninteraktion im Sinne
eines umfassenden Customer Value Managements.
Über ein Drittel aller Anwendungen, die am VOICE Award 2006 teilnahmen, amortisierte sich
den Teilnehmern zufolge innerhalb von sechs Monaten, weitere knapp 20% rechneten sich
bereits nach spätestens elf Monaten. 25% der Teilnehmer gaben Amortisierungszeiträume von
einem bis maximal zwei Jahren an. Diese Amortisierungszahlen sind einzigartig für ITK-Projekte.
Ein durchschnittlicher ROI von knapp 10 Monaten ist eine beeindruckende Zahl – und beweist:
Für Unternehmen mit hohem Kundenkontaktaufkommen zahlen sich Sprachapplikationen aus,
und zwar im wahrsten Sinne des Wortes! Sprachanwendungen senken die Transaktionskosten
gegenüber Call Centern massiv.
Marktreport VB07 Vers 1 0 (2).doc
Seite 11 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Durchschnittliche Transaktionskosten von unter 20 Cent sollten vor allem Unternehmen mit
vielen wiederkehrenden Anrufen motivieren, zur Automatisierung geeignete Prozesse zu
identifizieren und sie in einem Sprachdialogsystem abzubilden. Der VOICE Award 2006 zeigt
aber auch, dass neuere Systeme tendenziell eine niedrigere Fallabschlussrate aufweisen als
alte, „gut eingespielte“ Systeme.
Nutzerakzeptanz: Vernunftehe statt Liebeshochzeit
Die Bekanntheit von Sprachapplikationen ist in den vergangenen Jahren deutlich gestiegen.
Trotz der generell relativ geringen Zufriedenheit der Nutzer mit den von ihnen am häufigsten
genutzten Sprachapplikationen besteht überwiegend eine hohe Bereitschaft, diese Applikationen
auch in der Zukunft zu nutzen. Im Vergleich zu anderen Kommunikationsmöglichkeiten ist die
Nutzung von Sprachapplikationen insgesamt nicht besonders beliebt, jedoch bevorzugen die
meisten Befragten sie in bestimmten Situationen selbst gegenüber einem persönlichen Kontakt:
1. Zeitersparnis: Schon bei einer relativ kurzen Wartezeit auf
Ansprechpartner erscheint die Alternative Sprachapplikation attraktiver
einen
persönlichen
2. Erreichbarkeit und 24 Stunden Verfügbarkeit
3. Kostenvorteil: Ebenso deutlich werden Sprachapplikationen dann bevorzugt, wenn für einen
persönlichen Telefonkontakt zusätzliche Gebühren anfallen
Anbietermarkt: Eine Branche konsolidiert sich
Der deutsche Markt für Sprachanwendungen ist der am schnellsten wachsende in Europa: 21%
jährliches Wachstum zeigen, dass das Voice Business boomt. Die Marktkonsolidierung der
letzten zwei Jahren und die Übernahme neuer Sprachtechnologien in die Portfolios von
Microsoft, SAP, Google & Co. beweist eine gewisse Reife sowohl des Marktes als auch der
Technologie. Zugleich schafft der Markteintritt der neuen Player die Grundlagen für eine
Neuordnung der Preis- und Kostenstrukturen in der Branche: Das könnte den Anfang vom Ende
der Port-basierten Kosten für Sprachtechnologie zugunsten von Arbeitsplatz- oder
transaktionsbezogenen Kosten bedeuten.
Es ist zu erwarten, dass die neuen großen Player dazu beitragen, dass Sprachtechnologie zur
Commodity wird – denn wenn ein Unternehmen wie Microsoft Sprachtechnologie voll in seine
Produkte von Betriebssystemen bis hin zu Office-Anwendungen integriert und diese zugleich mit
einem Diensteangebot á la Hotmail (für Voice auf Basis der neuerworbenen TellMe-Plattform) in
ein umfassendes Eco-System einbindet, spätestens dann wird Voice ebenso Mainstream sein
wie heute eMail.
Trends im Voice Business
Folgende Top-Themen hat das Branchenbarometer der VOICE Community im Herbst 2006 für
die nächsten zwei Jahre identifiziert: Erstens wird die Sprachautomatisierung (im Call Center
Umfeld) durch Kontaktqualifizierung getrieben. Zweitens wird das Auftreten neuer Player wie
Google, Microsoft & Co. die Spielregeln grundlegend verändern. Und drittens sind StandardApplikationen, Managed Services und VoIP-Integration die wichtigsten Innovationen.
Erfolgsfaktor Nr. 1 bleibt das Voice User Interface. Das wird gleichzeitig auch als wichtigster
Stolperstein gesehen.
Serviceorganisation der Zukunft
Das Call Center wird zu einer Art „Kampfstern Galactica“ und darf nicht als triviale
Managementaufgabe betrachtet werden. Es ist ein Kristallisationspunkt für die technologische
Entwicklung im gesamten Unternehmen und wird zur größten technologischen Herausforderung
der nächsten Jahre. Provokant gesagt: Das ganze Unternehmen wird zum Call Center!
Zugleich wird die Automatisierung des Kundenkontakts fortschreiten und sich vertiefen – mehr
Geschäftseinheiten des Unternehmens der Zukunft werden in Call Center-Prozesse integriert,
ebenso wie die Geschäftsprozesse quer durchs Unternehmen z.B. durch intelligentes Routing
zunehmend automatisiert werden. Die Geschwindigkeit des Fortschritts im Kundenkontakt hängt
somit zunehmend von der Prozessinnovation ab.
Marktreport VB07 Vers 1 0 (2).doc
Seite 12 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Mobile Trends: Treiber des Voice Business
Voice ist die Klammer, die die zukünftige konvergente IP-Welt umschließt – in einer Welt
konvergenter IP-Netzwerkinfrastrukturen kann das Telefon zur konventionellen Mensch-zuMensch-Kommunikation ebenso genutzt werden wie als sprachgesteuerter Dienst oder als
Sprachsteuerung für verschiedenste Endgeräte (wie z.B. dem Fernseher oder der MovieDownload-Settopbox).
Sprachtechnologie erweitert die Steuerungsmöglichkeiten mobiler, multimodaler Dienste, bietet
einen zusätzlichen Kanal für die Datenein- und -ausgabe und ermöglicht eine nahtlose
Interaktion von Dienst und Nutzer. Nach der Call Center-Automatisierung wird die Welt der
Mobilen Dienste zum nächsten großen Treiber für das Voice Business!
„On demand“-Services
Das Voice Business entwickelt sich zur „enabling Technology“ für Mehrwertdienste, die von den
Mobilfunkbetreibern zunehmend in Self Service Angebote integriert werden, da erst durch
Sprachsteuerung eine komfortable, Endgeräte unabhängige Nutzung von neuen
Mehrwertdiensten und Inhalten für viele Verbraucher möglich wird.
Ein breites Angebot an Standardanwendungen kann dem Markt für Sprachanwendungen eine
neue Dimension eröffnen – Sprachanwendungen werden für eine Vielzahl von Unternehmen
oder Unternehmenseinheiten attraktiv, die bisher Entwicklungskosten, den Aufbau von
Betriebskompetenz und die laufende Wartung/Administrierung von Inhouse- oder individuellen
Hostinglösungen scheuen. Auch für Unternehmen mit kleineren und mittleren Anruferzahlen
kommt so eine Sprachautomatisierung wirtschaftlich in Betracht.
Die Service Provider verfügen über eine einzigartige Marktstellung, um für
Unternehmenskunden komplette Kundeninteraktionsprozesse „end-to-end“ auszulagern. Mit
Business Process Outsourcing Services positionieren sie sich heute schon als die
Kundenkontaktservice-Outsourcer der Zukunft und treten in direkte Konkurrenz mit Call Centern
„alter Schule“: Aufgrund ihrer Nähe zu den Intelligenten Netzen, ihrer Erfahrung im Handling
und der Automatisierung von Massenkundenkontakten und ihrer Prozesskompetenz
insbesondere auch in der Anbindung disparater Backend-Systeme sind sie ideal aufgestellt,
durch die Übernahme geschlossener Prozessketten neue Märkte für sich zu schaffen.
Marktreport VB07 Vers 1 0 (2).doc
Seite 13 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
B.2 Kennzahlen
VOICE Award 2006
Fokusbranchen
Nr. 1 in %
Nr. 2 in %
Nr. 3 in %
VOICE Award 2005
20% Telekommunikation
17% Transport, Logistik
und Verkehr
12% Finanzen
HC/Strateco Studie 2003
29% Medien und
Unterhaltung
24,1% Finanzen
20% Transport, Logistik
und Verkehr
17% Telekommunikation
Anwendungsschwerpunkte
%-Anteil Enterprise Service
76% Transaktionsdienste
71% Transaktionsdienste
%-Anteil Mehrwertdienste
/Kampagnen
24% Mehrwertdienste
29% Mehrwertdienste
%-Anteil B2C-Anwendungen
93% B2C
91% B2C
87% ServiceVerbesserung
17,3% ServiceVerbesserung
69% Automatisierung
17,3% Automatisierung
67% Kundenbindung
16,7% Kostensenkung
Betriebswirtschaftliche
Ziele
(Rangordnung)
Nr. 1 in %
Nr. 2 in %
Nr. 3 in %
16,9% Transport und
Logistik
13,3% Telekommunikation
60,2%
Transaktionsdienste
28% Mehrwertdienste
85,5% B2C
68,7% Automatisierung
66,3% Kostensenkung
47% Kundenbindung
Reichweite, Nutzungsquote
und Effizienz
Ø Anzahl der Unique User
43.333 User
83.125 User
115.000 User
1.201 Anrufe/Tag
2.111 Anrufe/Tag
8.500 Anrufe/Tag
97 Sekunden
92 Sekunden
120 Sekunden
86,13% Call
Completion
90,56% Call
Completion
75% Call
Completion
5 Monate
3,81 Monate
6 Monate
Ø Investitionskosten (Capex)
141.667 EUR
92.105 EUR
314.000 EUR
Ø Amortisierungsdauer
9,85 Monate
9,53 Monate
8 Monate
79,53 EUR/Monat
532,90 EUR/Monat
Opex: nicht erhoben
0,19 EUR/Anruf
0,21 EUR/Anruf
Kosten: nicht erhoben
209.091 EUR
110.000 EUR
nicht erhoben
58
58
165
89%
83%
50%
100% mehr als 2
89% mehr als 2
20% mehr als 2
Ø Call Volumen pro Tag
Ø Dauer pro Anruf
Ø Fallabschlussrate (Call
Completion)
Time-to-Market und ROI
Ø Realisierungsdauer in
Monaten
Ø Betriebskosten (Opex)
Ø Kosten je Anrufer
Ø Ersparnis
Technische
Leistungsmerkmale
Ø Anzahl der installierten
Ports
%-Anteil VerbundwortErkennung und mehr
Integrationstiefe zwei
Schnittstellen und mehr in %
Tab.: Kennzahlen des Voice Business
Die Entwicklung im Voice Business veranschaulicht der Vergleich wichtiger Kennzahlen, die in
den vergangenen vier Jahren im Rahmen unserer Marktstudien erhoben wurden.
Die dieser Tabelle zugrundeliegenden Kennzahlen stammen aus den Studien [1], [2] und [3].
Marktreport VB07 Vers 1 0 (2).doc
Seite 14 von 50
Nr. 1002306
MARKTREPORT
C
Voice Business 2007
© Mind | STRATECO
Einleitung: Vorurteile und Fehleinschätzungen im Voice Business
Der Markt für Sprachdialogsysteme hat mit einer besonderen Problematik zu kämpfen: Manche
Vorurteile halten sich trotz gewaltiger Entwicklungssprünge hartnäckig und verzerren das Bild
der Technologie in den Medien und beim Verbraucher, aber auch bei Entscheidern. Gleichzeitig
leidet die Branche selber in manchen Punkten schlicht an Selbstüberschätzung: Der Technologie
werden Leistungen zugesprochen, die gar nicht erfüllbar sind. Die wichtigsten dieser Vorurteile
und Fehleinschätzungen sind:
Vorurteil: Das Investment in ein Sprachportal lohnt nicht. Sachlage: Auf den ersten
Blick erscheinen die Investitionssummen für eigenbetriebene Sprachlösungen den Entscheidern
oft sehr hoch; insbesondere im Vergleich zu Web-Lösungen. Dabei werden jedoch
nachgewiesene ROI-Ergebnisse ignoriert: So war der ROI der ca. 40 für den VOICE Award 2006
[3] getesteten Anwendungen im Durchschnitt schon nach 10 Monaten erreicht.
Vorurteil: Sprachlösungen sind teuer. Sachlage: Das mag in absoluten Zahlen durchaus
so sein. Noch in 2005 lagen die Investitionskosten der für die VOICE Awards 2005 getesteten
Lösungen im Durchschnitt bei ca. 100.000 EUR. Es gibt aber heute deutlich preiswertere
Lösungen und auch das wachsende Angebot an Hosting-Lösungen trägt dazu bei, das
Investitionsrisiko zu senken. Vor dem Hintergrund hoher Call Volumen, hoher Call Resolution
Raten und hoher Kundenzufriedenheit geht die Rechnung jedoch im Allgemeinen zugunsten der
Sprachanwendung aus: Laut Testbericht „Testbericht VOICE Award 2006 – die besten
deutschsprachigen Sprachapplikationen“ [3] liegen die durchschnittlichen Einsparungen mit den
getesteten Anwendungen bei 200.000 EUR.
Vorurteil: Sprachanwendungen können nur stupide Prozesse automatisieren.
Sachlage: Der Stand der Technik und millionenfach erprobte, komplexe Anwendungen zum
Beispiel für Self Service oder Entertainment beweisen, dass auch vielschichtige, tief in die ITInfrastruktur und die Geschäftsprozesse integrierte Prozesse gut abgebildet und automatisiert
werden können. So hat etwa die Telekom mittlerweile über 400 Prozesse mit ihren
Sprachdialogsystemen automatisiert, manche state-of-the-art-Bankinganwendungen decken gut
und gerne 100 Prozesse ab.
Fehleinschätzung: Man kann alle Kundenkontaktprozesse mit Sprachdialogsystemen
automatisieren. Sachlage: Sprachautomatisierung funktioniert nur dann, wenn der Kunde
sie annimmt. Selbst wenn man jeden Prozess automatisieren könnte – lohnen wird es sich nur
dann, wenn die Nutzer die Sprachlösung in Massen nutzen. Denn der wirtschaftliche Erfolg
hängt von der Nutzungshäufigkeit ab. Hochkomplexe Anwendungen verursachen im
Allgemeinen auch hohe Entwicklungs- und Betriebskosten; die lassen sich nur rechtfertigen,
wenn entsprechende Nutzungs- und Automatisierungsquoten dem entgegenstehen.
Vorurteil: Sprachcomputer verschrecken Kunden – die wollen persönlichen Service.
Sachlage: Grundsätzlich ist die Aussage richtig, insbesondere wenn die Kunden ohne
Begründung und ohne erkennbaren Nutzen auf Sprachcomputer stoßen. Studien wie die
Akzeptanzstudie 2006 der Initiative VOICE BUSINESS und dem Fraunhofer IAO [6] weisen aber
nach, dass Kunden unter bestimmten Voraussetzungen sogar lieber den Sprachkanal wählen:
Wenn es z.B. um sensible Themen (Inkasso/Abfrage negativer Kontostände) geht oder der
Nutzen hoch ist (keine Wartezeit, 24/7-Service, niedrige Transaktionskosten).
Vorurteil: Ältere Benutzer kommen mit dem Sprachcomputer nicht zurecht.
Sachlage: Faktisch ist genau das Gegenteil der Fall. Senioren machen ihre kognitiven
„Schwächen“ (im Vergleich zu jungen Nutzern) durch geübte Problemlösungsstrategien mehr
als wett: Fachleute berichten, dass gerade bei geführten Voice User Interfaces (kurz VUI) wie
z.B. in Banking-Applikationen die Senioren sich oft schneller in der Anwendung zurechtfinden
als die impulsiver agierenden „Youngsters“. Zudem nehmen die Senioren den Sprachcomputer
auch mit weniger Vorbehalten an: Sie akzeptieren das VUI, lassen sich auf die Hilfestellungen
im Dialog ein und wickeln so ihre Anliegen vergleichsweise erfolgreich ab.
Marktreport VB07 Vers 1 0 (2).doc
Seite 15 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Vorurteil: Bekannte Werbe- oder Radiosprecher sind ideal, um die Prompts einer
Sprachanwendung aufzunehmen. Sachlage: Gerade professionelle Radiomoderatoren
oder auf Werbung spezialisierte Sprecher tun sich im Studio oft schwer, die besondere
Melodieführung ihres Metiers abzulegen. Das führt dazu, dass die Persona als „gekünstelt“ und
überemotionalisiert empfunden wird. Viele Nutzer fühlen sich von solch melodischen,
„singenden“ Personas in Wirklichkeit nicht besonders angesprochen.
Vorurteil: Eine gute Persona (die Stimme der Applikation) muss sich an den
Sprachgewohnheiten der Zielgruppe orientieren. Sachlage: Eher das Gegenteil ist der
Fall: Junge Nutzergruppen empfinden auf jugendlich getrimmte Personas oft als „anbiedernd“ –
und ziehen tatsächlich eher seriöse, geradlinige den „coolen“ Personas vor. Diese Erfahrung
deckt sich mit Studien aus dem Banking-Bereich, die klar nachweisen, dass der szenige
Jugendliche eher zum Schalter mit dem seriösen Angestellten als zum trendig gekleideten Azubi
geht.
Fehleinschätzung: Das Voice User Interface ist die natürlichste und beste
Schnittstelle
für
die
Mensch/Maschine-Kommunikation.
Sachlage:
Die
Sprachschnittstelle ist nur eine von vielen Schnittstellen und konkurriert mit dem Internetkanal,
dem Agentenkontakt und auch der Tastaturwahl. Welcher Kanal für welche Interaktionsform
der beste ist, entscheidet jedoch zuerst der Kunde auf Basis der zur Verfügung stehenden
Kanäle. Für PIN-Eingaben z.B. ist DTMF oft besser geeignet und wird dementsprechend auch
bevorzugt. Für die Banküberweisung kann online-Banking einfacher sein als der Sprachkanal.
Daher betonen Fachleute auch stets, dass der Sprachkanal vor allem im Kanalmix seine Stärken
ausspielen kann – wenn beispielsweise der online-Zugang nicht verfügbar oder die
Warteschleife zum Agenten zu lang ist.
Vorurteil: Tastatursysteme (DTMF) bieten mehr Effizienz als Sprachsteuerung.
Sachlage: Entscheidend ist, wie die Portierung von der DTMF-Lösung auf den Sprachkanal
erfolgt: Stehen den Nutzern ausreichende Hilfestellungen zur Verfügung, mit denen sie schnell
den richtigen Umgang mit der Sprachanwendung erlernen können? Denn wenn der Nutzer sich
erst in die Sprachanwendung einfinden, Abkürzungen (sogenannte Short Cuts) in der
Dialogführung mühsam selber entdecken muss, dann kann DTMF tatsächlich schneller sein.
Vergleicht man aber die Bedienungszeiten von modernen NLU-Lösungen1 mit der Navigation in
DTMF-Menus durch jeweils geübte Nutzer, dann ist die Sprachsteuerung die effizientere
Lösung.
Vorurteil: Dialekte und Akzente bringen Sprachanwendungen an ihre Grenzen.
Sachlage: Sowohl Dialekte als auch Akzente werden von state-of-the-art-Systemen problemlos
verarbeitet: Akzente können durch die Erfassung der akzenttypischen Aussprachevarianten,
Dialekte durch die Integration des dialekttypischen Vokabulars sehr gut abgebildet werden.
Anwendungen z.B. in der Schweiz machen deutlich: Akzente, Dialekte, Mehrsprachigkeit sind
keine Problemstellung mehr für ein modernes Sprachdialogsystem.
Vorurteil: Sprachauthentifizierung scheitert, wenn der Sprecher krank ist oder seine
Stimme „verloren“ hat. Sachlage: Unabhängig von der „Tagesform“ einer Stimme erfasst
die Spracherkennung die unveränderlichen Charakteristika eines typischen Sprachmusters.
Heiserkeit o.ä. beeinträchtigt die Funktion einer sprachbiometrischen Lösung nicht so, dass ihre
Funktionalität leidet.
Fehleinschätzung: Die Implementierung einer Sprachanwendung ist kein Problem.
Sachlage: Oft ergibt sich erst im Projekt die Komplexität der Backend-Anbindung, der
Prozessstrukturierung und des Anwendungsbetriebs. Anbieter, die hier den Mund zu voll
nehmen, können im Projektverlauf auf Schwierigkeiten stoßen, die mit dem vereinbarten
Budget nicht mehr abgedeckt sind.
1
NLU = Natural Language Understanding, vgl. auch Glossar
Marktreport VB07 Vers 1 0 (2).doc
Seite 16 von 50
Nr. 1002306
MARKTREPORT
D
Voice Business 2007
© Mind | STRATECO
Status Quo: Sprachautomatisierung in der Wirtschaft
Dieses Kapitel beleuchtet den gegenwärtigen Markt für das Voice Business aus Betreibersicht.
Die wichtigsten Fragen in diesem Zusammenhang sind:
»
Welche Ziele verfolgen Unternehmen mit dem Einsatz von Sprachdialogsystemen?
»
Welchen Stellenwert nehmen Sprachdialogsysteme heute unter den Kommunikationskanälen
im Contact Center ein? Welche Anrufvolumina werden damit sprachautomatisiert
abgewickelt?
»
Was sind die wichtigsten Einsatzfelder für Sprachdialogsysteme?
»
Welche Branchen setzen besonders auf die Automatisierung des Kundenkontakts per
Sprachdialogsystem?
Die zugrundeliegenden Daten wurden erhoben im Rahmen des Leistungstests zum VOICE
Award 2006 [3].
D.1 Einsatzziele: Warum Sprachautomatisierung?
Welche Motive und Ziele entscheiden maßgeblich über die Einführung von Sprachapplikationen?
Ausschlaggebend für die Einführung einer Sprachapplikation sind laut dem „Praxisreport:
Sprachapplikationen auf dem Prüfstand“ [1] meist betriebswirtschaftliche Überlegungen, aber
auch ein gewisser Handlungs- und „Leidensdruck“, also die Kundenanforderungen in einem
wettbewerbsorientierten Marktumfeld.
Die wichtigsten betriebswirtschaftlichen Argumente für die Einführung einer Sprachapplikation
sind die Serviceautomatisierung und Kostensenkungen. Eine Verbesserung der Kundenbindung
und eine Engpassbehebung im Call Center sind die zweitwichtigsten Ziele, die ein Unternehmen
durch die Einführung einer Sprachapplikation erreichen will. Diese beiden Ziele richten sich eher
auf eine Verbesserung der Kundenzufriedenheit und damit auch der Loyalität der Kunden.
Serviceautomatisierung und Kostensenkung hingegen bringen unmittelbar Ersparnisse mit sich.
Von untergeordneter Bedeutung sind die Realisierung zusätzlicher Umsätze über den Voice
Service.
Fallbeispiele: Sprachportale für Serviceautomatisierung und Kostensenkung
Das T-Com Sprachportal für Vertrieb, Kundenbetreuung und Service dient der Vorqualifzierung von
Kundenanliegen und gleichzeitig dem Aussortieren sogenannter „Blind Calls“, die eigentlich einem anderen
Unternehmen der Deutschen Telekom gelten. Das Endkunden-Sprachportal hat mit den größten Traffic in Europa
und bietet dank des Eliminierens von Blindverkehr und „Junk Calls“ besonders hohe Kosteneinsparpotentiale. Auf ca.
1.500 Ports des Voice Web Portals, der Managed Service-Sprachdialogplattform von T-Com, nutzen bis zu 300.000
Anrufer täglich das Portal und formulieren in sprachgesteuerten Dialogen ihre Anliegen, bevor sie mittels intelligentem
Routing zum richtigen Call Center-Agenten durchgestellt werden.
Das Postbank Telefonbanking-Sprachdialogsystem erlaubt das Ausführen einer Vielzahl von Diensten (über 100),
wie zum Beispiel der Abfrage des Kontostands, der getätigten Kontoumsätze und Wertpapierpreise sowie dem Tätigen
von Überweisungen, der Einrichtung von Daueraufträgen oder dem Abruf allgemeiner Produktinformationen per
Tonwahl und per Sprache. Die Menuführung fasst die Themen (Konto bezogene und Sales Themen) zusammen und
schafft einen guten Dialogfluss innerhalb der Themenbereiche. Täglich werden unter den Nummern 0180-30 40 500, 600 und -700 über 100.000 Anrufe abgewickelt.
Ohne (externen) „Leidensdruck“ und klare betriebswirtschaftliche Vorteile lassen sich die
Investitionen in Sprachdialogsysteme nicht rechtfertigen.
Serviceautomatisierung und Kostensenkung sind die wichtigsten Gründe (notwendige
Bedingung) im Entscheidungsprozess für eine Sprachapplikation. Eine Verbesserung der
Kundenbindung und eine Engpassbehebung im Call Center sind die zweitwichtigsten Ziele
(hinreichende Bedingung), die ein Unternehmen durch die Einführung einer Sprachapplikation
erreichen will.
Marktreport VB07 Vers 1 0 (2).doc
Seite 17 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Kundenkontaktformen: Die Dominanz des Sprachkanals
Der Sprachkanal ist der wichtigste Kontaktkanal im Contact Center - niemand kann darauf
verzichten, seinen Kunden am Telefon zur Verfügung zu stehen, auch wenn fast 90% bzw. 80%
aller befragten Contact Center [5] den Fax- und den eMail-Kanal anbieten. Denn der
Sprachkanal macht zur Zeit 85% des gesamten Kontaktaufkommens in den befragten Contact
Centern aus. Zwar ist die Verwendung von eMails im Vorjahresvergleich um 28 Prozent
gestiegen, macht aber nur etwa ein Zwölftel (8,5 Prozent) aller Kundenkontakte aus. Da
gleichzeitig das Kontaktaufkommen bei den Kanälen Briefpost (–30% im Vergleich zum Vorjahr)
und Fax (–22% im Vergleich zum Vorjahr) deutlich rückläufig ist, bleibt der Sprachkanal der
dominierende Kanal im Kundenkontakt.
Kommunikationskanäle im Contact-Center
•
Der Sprachkanal ist das wichtigste Kontaktmedium
(in % der Befragten)
120
100
100
87,3
79,2
80
55,5
60
40
19,1
20
12,5
0
Sprache
Fax
Post
E-Mail
WebInteraktion
SMS/MMS
Quelle: Contact Center Trends 2006
© 2007 voice-community.de
Abb.: Kommunikationskanäle
Entsprechend groß ist das Bestreben der Call Center, einfache und standardisierbare
Kontaktprozesse zu automatisieren.
Einen Eindruck von der zunehmenden Automatisierung des Kundenkontakts liefert die Anzahl
der installierten Sprachports (Vgl. Grafik - IVR-Ports), der Telefon-„Leitungen“, die für eine
Automatisierung des Dialogs mit dem Anrufer eingerichtet sind:
Aktuell werden laut Datamonitor knapp über 300.000 Sprachports in Deutschland betrieben.
Seit dem Jahr 2004 wurden hierzulande über 50.000 neue Sprachports installiert. Rechnet man
die Zahl der Ports hoch auf das darüber abgewickelte automatisierte Kontaktvolumen, so kann
man von mehr als 38 Mio. automatisierten Anrufen pro Tag ausgehen.
Marktreport VB07 Vers 1 0 (2).doc
Seite 18 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Sprachcomputer auf dem Vormarsch
•
Mehr als 38 Mio. automatisierte Service-Anrufe pro Tag in 2006*
Installierte Basis IVR-Ports in Deutschland in tausend (2004-2009).
400
350
300
251
262
2004
2005
280
301
324
350
250
200
150
100
50
0
2006
2007
2.008
2.009
* Eigene-Schätzung auf Basis von Datamonitor
© 2007 voice-community.de
Abb.: IVR-Ports in Deutschland
Anwendungstypen: Wo lohnt Sprachautomatisierung besonders?
Bei der Einführung von Sprachapplikationen zur Sprachautomatisierung von Kundenkontaktprozessen lassen sich zwei grundsätzlich unterschiedliche Zielrichtungen identifizieren:
Der erste Ansatz beim Einsatz von Sprachapplikationen zielt darauf ab, die Automatisierungsund Rationalisierungspotenziale der Kundenselbstverwaltung zu mobilisieren: Kostensenkung,
Effizienzsteigerung und Call Center-Optimierung sind hier die Argumente für den Einsatz von
Sprachapplikationen. So lassen sich Personalkosten senken, Auslastungsspitzen verringern und
beim Aufbau eines kostengünstigeren „24/7-Services“ erhebliche Einsparungen realisieren (in
einem Verhältnis von bis zu 1:10 im Vergleich zum Call Center-Betrieb). Zugleich profitieren die
Organisationen von effizienteren Prozessen und einer Erhöhung der „Call Resolution Rate“. Im
Hinblick auf die Call Center-Optimierung bringen Sprachapplikationen bessere Ressourcennutzung und höhere Mitarbeiterzufriedenheit.
Fallbeispiele: Automatisierungs- und Rationalisierungspotenziale der Kundenselbstverwaltung
Das neue Auskunftssystem der Deutschen Bahn bietet bundesweite Fahrplanauskünfte über alle
Zugverbindungen der Deutschen Bahn und Verbindungen zu den wichtigsten europäischen Bahnhöfen. Es kennt
insgesamt 7.000 Haltepunkte im In- und weitere 1.000 im Ausland. Über 1 Millionen Kunden haben den
Sprachcomputer seit dem Relaunch im Mai 2006 bereits angerufen.
Der Service Manager von T-Mobile unterstützt die Kunden bei einer Fülle von Geschäftsvorfällen: Abrufen von
Produktinformationen und Dienstleistungen, Tarifwechsel und Wechsel der Optionen innerhalb eines Tarifs, Änderung
der Grundeinstellungen und Durchführen von Sonderaktionen. Der Kunde kann zudem aus dem Service Manager
heraus einen Agenten zu Hilfe rufen. Auch bietet der Service Manager eine Guided Tour, die das Ausprobieren der
angebotenen Dienste erlaubt. Die Anwendung wickelt über 20.000 Anrufe am Tag ab.
Beim zweiten Ansatz geht es darum, das Umsatzpotenzial des Voice User Interfaces für eine
neue Generation an Mehrwertdiensten zu nutzen: Netzintegrierte Sprachapplikationen
ermöglichen eine komfortable, Endgeräte-unabhängige Nutzung von neuen Mehrwertdiensten
und Inhalten. Mehrwertdienste stehen damit als Trägerdienste mit flexiblen AbrechnungsProzessen für verschiedenste Anwendungen zur Verfügung. Auch als Voice Gateway zu WebInformationen haben Sprachapplikationen Potenzial, sofern die richtige Verknüpfung zu anderen
Mehrwertdiensten gefunden wird. Zudem ist ein Voice-Portal als Plattform für Dritte nutzbar,
bestehende Inhalte können hierüber mehrfach und cross-medial vermarktet werden.
Marktreport VB07 Vers 1 0 (2).doc
Seite 19 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Auch als Tool für Marketing-Kampagnen verschiedenster Art wird Sprachtechnologie
zunehmend eingesetzt.
Fallbeispiele: Netzintegrierte Sprachapplikationen für die
Nutzung von Mehrwertdiensten oder für Marketingkampagnen
komfortable,
Endgeräte-unabhängige
Viasuisse ist eine dreisprachige Verkehrsauskunft über den Zustand auf dem Schweizer Straßennetz. Anrufer können
mit diesem System sehr schnell die Verkehrslage auf einer bestimmten Autobahn und u.a. die Befahrbarkeit von
Alpenpässen eruieren. Viasuisse wickelt laut Betreiber rund 1.000.000 Anrufer pro Jahr ab. In Spitzenzeiten nutzen
über 120.000 Anrufer pro Woche diesen Dienst. Die Task Completion Rate von über 90% beweist, dass das System
Anrufer aus drei Sprachfamilien „narrensicher“ informiert. Mit einer Investition von unter 100.000 EUR und
Aktualisierungskosten von unter 2.500 EUR im Jahr ist Viasuisse ein Dienst, der zu überschaubaren Kosten vielen
Autofahrern täglich die schnelle Entscheidung über die beste Route zum Ziel abnimmt.
Der 1. FC Köln nutzte in einer zeitlich begrenzten Aktion ein interaktives sprachgesteuertes Gewinnspiel mit der
Stimme von Lukas Podolski. Ziel war die Emotionalisierung der Marke „1. FC Köln“ und die Generierung von
Kundenprofilen und -bindung. Der Erfolg des Dienstes hat verschiedene Ursachen: Podolski hat einfallsreiche
Ansagetexte aufgesprochen, die gute, aber auch kritische Dialoge zwischen Fans und Star ermöglichen, der Dienst
wirkt lebendig und das einfach aufgebaute Gewinnspiel sorgte dafür, dass alle Anrufer auf den Gewinn, ein
Abendessen mit Lukas Podolski, hoffen durften. Obwohl die Nummer des „Poldi-Phons“ nur auf den Tablettunterlagen
der Kölner MacDonalds-Restaurants beworben wurde, hinterließen einige Tausend 1. FC Köln-Fans ihre Kontaktdaten
und legten mit dem guten Gefühl auf, persönlich mit ihrem Star gesprochen zu haben.
Gemeinsamer Nenner beider Zielrichtungen ist die Kundenbindung. Sprachapplikationen sollen
schnellere und bessere Dienstleistungen ermöglichen – Erfolgsfaktoren sind hierfür eine hohe
Nutzerakzeptanz des Dialogs und eine hohe Service-Verfügbarkeit. des Leuchtturmcharakters
der dort teilnehmenden, getesteten und dokumentierten
Seit drei Jahren wird im Rahmen des VOICE Awards2 regelmäßig eine Bestandsaufnahme
durchgeführt und ein Test von Sprachapplikationen durchgeführt. Dieser einzigartige jährliche
Benchmark gibt einen guten Überblick über Anwendungstypen und die auf
Sprachautomatisierung setzenden Branchen im deutschsprachigen Raum:
TOP3 - Auskunft, Self-Service und Vorqualizierung
n = 31
Quelle: Testbericht – Voice Award 2006
© 2007 voice-community.de
Abb.: Anwendungstypen
2
Vgl. www.voice-award.de
Marktreport VB07 Vers 1 0 (2).doc
Seite 20 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Ca. 75% aller für den VOICE Award 2006 angemeldeten Services fielen in die Kategorie Voice
Automation. Die wichtigsten Anwendungsgebiete sind hier automatisierte Auskunftssysteme
und Directory Assistance (insgesamt 27%), Self Service-Systeme (18%) und das Call Routing
per Sprachsteuerung (14%). Daneben waren aber auch Bestellsysteme (5%),
Authentifizierungslösungen (5%), Help Desk- (3%) sowie Track & Trace-Anwendungen (3%)
vertreten.
Damit ergibt sich im Bereich Voice Automation ein erstaunlich breites Anwendungsspektrum,
mit einer starken Fokussierung auf einfache, häufig wiederkehrende und gut standardisierbare
Anfragen, aber auch mit kompletten Self Service-Angeboten innerhalb von Voice-Portalen.
Sichtbar wird im Vergleich zum letzten Jahr auch ein deutlicher Zuwachs an komplexen
Auskunftsdiensten.
Nur knapp ein Viertel aller Teilnehmer an den VOICE Awards bewarb sich mit TelefonMehrwertdiensten oder Marketing-Kampagnen via Sprachportal. Dominierend unter diesen
Mehrwertdiensten waren beim VOICE Award 2006 die Infotainment-Angebote.
Neue Wettbewerber um die VOICE Awards sind Sprachanwendungen für den Einsatz im
Marketing. Diese innovative Anwendungskategorie stellt bereits knapp 16% aller Bewerbungen.
Der Einstieg in dieses Anwendungsszenario erfolgt logischerweise zunächst über einfache
Dienste und Gewinnspiele, da diese dem Endverbraucher einen klar erkennbaren Nutzen bieten
und so eine schnelle Gewöhnung an das neue Medium ermöglichen. Mobile Dienste dominieren.
Die Bewerbung von leicht einprägsamen Kurzwahl-Nummern ist ein Schlüssel zum Erfolg, um
Reichweite für diese innovativen Dienste und damit mehr Akzeptanz bei Werbetreibenden für
das neue Medium zu schaffen.
Ein hohes Potenzial für die Generierung von Mehrwerten bietet auch die Sprachaktivierung von
einfachen Kommunikationsfunktionen im Netz, die bislang nur über komplizierte
Endgerätefunktionen bedient werden konnten. Leider tut sich in diesem Feld derzeit wenig
Neues. Es ist aber zu erwarten, dass im Rahmen der geplanten Infrastruktur-Projekte
(Stichwort: IP) und den Investitionen in die Erweiterung des „Intelligenten Netzes“ durch
Telekom & Co. die Sprachsteuerung von Netzfunktionen ein zentrales Element sein wird.
Fallbeispiel: Sprachaktivierung von Netzfunktionen
Das Leistungsmerkmal „Rückruf bei ‚besetzt’“ steht allen T-Com Kunden an ihrem T-Net- oder T-ISDN-Anschluss
bereits als Regelleistung ohne Zusatzkosten zur Verfügung. Seit Februar 2005 können T-Com-Kunden, die am
analogen Anschluss bisher durch Drücken der R-Taste sowie anschließend von *37# den Rückruf-Vorgang
einleiteten, zusätzlich per Sprachsteuerung Rückruf bei ‚besetzt’ aktivieren. Die neue Technik mittels Sprachsteuerung
soll das Merkmal nun vor allem für Kunden mit einfachen Telefonen ohne Display-Steuerung vereinfachen. T-ComKunden werden im Besetztfall nach dem dritten Besetztton gefragt, ob sie verbunden werden wollen, sobald die
Leitung frei ist. Sobald die Einzelworterkennung das "Ja" des Anrufers sicher versteht, wird „Rückruf bei ‚besetzt’“
aktiviert. Ist der Besetztzustand beendet, wird dies dem Anrufer signalisiert und er wird automatisch verbunden.
Derzeit werden laut T-Com etwa 350.000 Rückrufe am Tag mit dem System aktiviert, das entspricht zehn Prozent
aller Anrufer, die auf besetzte Leitungen stoßen. Bei 65 Prozent der Rückrufwünsche kommt auch eine erfolgreiche
Verbindung zustande - das bedeutet zusätzliche Umsätze für das Unternehmen.
Anwendungen zur Serviceautomatisierung dominieren klar, Mehrwertdienste und Kampagnen
spielen noch eine untergeordnete Rolle.
Der Bereich der Service-Automatisierung zeigt ein erstaunlich breites Anwendungsspektrum, mit
einer starken Fokussierung auf einfache, häufig wiederkehrende und gut standardisierbare
Anfragen, aber auch mit kompletten Self Service-Angeboten innerhalb von Voice-Portalen.
Sichtbar wird auch ein deutlicher Zuwachs an komplexen Auskunftsdiensten.
Sprachcomputer als Mehrwertdienst ermöglichen neue Wettbewerbsstrategien und Produkte.
Besonders viel versprechend scheinen den Anbietern von Mehrwertdiensten Auskunftsdienste in
Verbindung mit zusätzlichen Infotainment-Angeboten zu sein.
Es braucht noch Zeit, um den Sprachkanal als wertschöpfendes Element der Markenbildung und
-kommunikation und damit in den Marketing-Budgets der Unternehmen zu etablieren. Die
Vorteile liegen jedoch auf der Hand: Der Sprachkanal ist ein neues, stark emotionalisierendes
und hoch interaktives Medium für die Zielgruppenkommunikation im Marketing.
Marktreport VB07 Vers 1 0 (2).doc
Seite 21 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Branchen, Geschäftsmodelle und Anwendungsfelder: Erfolg mit Sprachapplikationen
Aus der Teilnehmerstruktur der VOICE Awards 2006, die zwar nicht repräsentativ ist, aber im
Vergleich mit den Vorjahren einen wertvollen Benchmark zu Entwicklungstrends und aktuellen
Deployments bietet [3], lassen sich Antworten auf folgende Fragen ableiten:
»
Welches sind die treibenden Branchen für den Einsatz von Sprachtechnologie, welche neuen
Branchen setzen auf Sprachanwendungen?
»
Welche Relevanz haben sprachgesteuerte Telefon-Mehrwertdienste und innovative
Marketing-Kampagnen unter Einsatz des Sprachkanals gegenüber Self Service-Angeboten,
welche Rolle spielt also Umsatzgenerierung gegenüber angestrebten Kostenreduktionen?
»
Welche Prozesse
automatisiert?
und
Services
werden
am
erfolgreichsten
mit
Sprachtechnologie
Knapp 50% der Teilnehmer des VOICE Awards 2006 kamen aus den Pionier-Branchen
Telekommunikation, Transport, Logistik und Verkehr sowie den Banken, Finanzdienstleistern
und Versicherungen.
Auffällig ist auch der Trend zur Sprachautomatisierung in der öffentlichen Hand – 9% aller
teilnehmenden Anwendungen kamen aus dem öffentlichen Bereich.
Das Branchenspektrum ist insgesamt deutlich breiter geworden, fast alle relevanten Gebiete
sind dieses Jahr vertreten wie etwa IT- und Technologieunternehmen (8%), die PharmaBranche (5%), Call Center-Betreiber (5%) sowie Energie- und Versorgungsunternehmen (3%).
Erstmals haben auch Unternehmen aus der produzierenden Industrie (6%) am VOICE Award
teilgenommen.
Deutlich breiteres Branchenspektrum
n = 42
Quelle: Testbericht – Voice Award 2006
© 2007 voice-community.de
Abb.: Branchenspektrum
Den Telefongesellschaften kommt nach wie vor eine besondere Bedeutung bei der
Heranführung breiter Bevölkerungsschichten an das neue Medium und für die Nutzerakzeptanz
von Sprachapplikationen zu. Das liegt einerseits daran, dass diese Unternehmen beim Einsatz
von Sprachapplikationen durch Kostensenkungspotenziale im Dienst für Millionen Kunden am
deutlichsten profitieren und sich ihnen anderseits durch sprachgesteuerte Informations- und
Kommunikationsdienste neue Einnahmequellen bieten. Das Branchenspektrum ist insgesamt
deutlich breiter geworden. [3]
Marktreport VB07 Vers 1 0 (2).doc
Seite 22 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
D.2 Die Kunden: Erfolgskennziffern aus Betreibersicht
Ein Sprachdialogsystem rechnet sich überall dort, wo tagtäglich eine Vielzahl von
Kundenkontakten stattfindet. Den größten Nutzen bringen Sprachcomputer einem Unternehmen
da, wo die Sprachanwendung den Nutzern einen zusätzlichen Mehrwert bietet oder
Geschäftsvorfälle nicht auf anderem Weg automatisierbar sind. Gerade wenn schon Web Self
Service im Einsatz ist oder die Prozesse im Call Center vollständig im EDV-System abgebildet
sind, ist es nur noch ein vergleichsweise kleiner Schritt, zumindest die einfachen Vorgänge auch
per Sprache zu automatisieren.
In diesem Kapitel beleuchten wir, warum die Sprachautomatisierung dem Tonwahlverfahren
vorzuziehen ist, welche Automatisierungsraten mit Sprachdialogsystemen in der
Unternehmenspraxis erzielt werden und warum die Integrationstiefe eines Sprachdialogsystems
mit für seinen betriebswirtschaftlichen Erfolg entscheidend ist.
Sprachautomatisierung leistungsfähiger als Tonwahlverfahren
In 2004 bewältigten Sprachdialogsysteme durchschnittlich etwa 360.000 Anrufe im Monat [7].
Ca. 35% davon wurden mit dem Touchtone-Verfahren, immerhin gut 25% per Sprachsteuerung
fallabschließend abgewickelt. Diese Automatisierungsraten drehten sich in den Folgejahren im
Zuge der technologischen Entwicklung und der zunehmenden Erfahrung mit dem Design des
Voice User Interfaces: Heute wickeln Sprachcomputert durchschnittlich 1 Mio. Anrufe pro Monat
ab – davon fast 60% fallabschließend per Sprachsteuerung gegenüber nur noch unter 30% per
Tastaturwahlverfahren.
Sprachbefehl effizienter als “Drücken Sie…”
•
Sprachdialogsysteme schaffen bessere Automatisierungsraten
1,200,000
70%
Speech
Control
1,000,000
60%
50%
800,000
40%
600,000
Touch
tone
400,000
200,000
30%
20%
10%
2004
2005
2006
0
0%
Average monthly call volumes
Percentage of calls automated and handled completely in a DTMF IVR system
Quelle: Datamonitor
Percentage of calls automated and handled completely in a speech-enabled IVR system
© 2007 voice-community.de
Abb.: Effizienz von Sprachsteuerung
Dies belegt, was Branchenkenner schon lange behaupten: Mit Sprachsteuerung lassen sich
wesentlich bessere Automatisierungsraten erzielen als mit dem umständlichen
Tastaturwahlverfahren, das vom Nutzer größere Konzentration auf die Menusteuerung erfordert
als die Sprachsteuerung.
Zur Feststellung der Automatisierungsraten von Sprachdialogsystemen wird üblicherweise die
Call Completion Rate herangezogen: Sie gibt den Anteil der Anrufe wieder, die erfolgreich durch
die Sprachapplikation abgewickelt wurden und damit das Anliegen des Anrufers lösen konnten.
Hohe Automatisierungsraten sind wichtig, da sie Treiber für einen schnellen ROI und ein
positives Indiz für einen hohen Nutzen der Anwendung sind.
Marktreport VB07 Vers 1 0 (2).doc
Seite 23 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Zwei Randbedingungen bestimmen maßgeblich die Automatisierungspotenziale: Einerseits
definieren das Medienverhalten, die Motivation (d.h. der von den Nutzern erkannte Mehrwert
einer Sprachanwendung) und die Nutzungshäufigkeit der Zielgruppe einer Sprachanwendung
den Erfolg eines Dienstes. Zum anderen setzt die in den Business Rules zum Ausdruck
kommende
Unternehmenspolitik
die
wesentlichen
Rahmenbedingungen
für
den
Umsetzungserfolg einer Sprachanwendung.
Die Ergebnisse des VOICE Award 2006 [3] machen deutlich, wie sehr Sprachanwendungen in
den vergangenen Jahren verbessert werden konnten und wie gut sie inzwischen gerüstet sind,
die Anliegen der Anrufer auch tatsächlich abzuwickeln: 85% aller teilnehmenden Anwendungen
verzeichnen Fallabschlussraten von über 75% – ein klarer Beleg dafür, dass eine Vielzahl von
Prozessen erfolgreich automatisiert werden kann. 38% der Teilnehmer gaben sogar an, dass
ihre Anwendungen 90% und mehr der Anrufe fallabschließend behandeln. Dass noch 2005 nur
51% der Anwendungen solche Call Resolution Raten aufwiesen, zeigt, dass die neuen,
„jungfräulichen“ Systeme immer auch einen gewissen Tuningbedarf haben – Sprachanwendungen werden eben wie guter Wein mit der Zeit immer besser!
Grundsätzlich läßt sich festhalten, dass alle Fallabschlussraten von über 50% vor dem
Hintergrund des Kundennutzen und der Business Rules als erfolgreich angesehen werden
können – auch beim VOICE Award 2006 erreichten wieder deutlich über 90% aller
Anwendungen diese und höhere Quoten. Allerdings soll in diesem Zusammenhang darauf
hingewiesen werden, dass die Teilnehmer am VOICE Award die „Leuchttürme“ der Branche sind
und die erreichten Fallabschlussraten durch die hinter diesen Anwendungen stehende Erfahrung
gegebenenfalls höher sein können als im Durchschnitt über alle hierzulande betriebenen
Anwendungen.
86% „Erfolgsquote“ in der fallabschließenden Bearbeitung
n = 42
Quelle: Testbericht – Voice Award 2006
© 2007 voice-community.de
Abb.: Automatisierungsraten
Sprachautomatisierung schafft dort den höchsten Nutzen, wo Geschäftsvorfälle nicht auf
anderem Wege automatisierbar sind oder die automatisierte Anwendung den Nutzern einen
hohen Mehrwert liefert. Je höher der von den Verbrauchern empfundene Kundennutzen ist,
desto größer ist auch die Akzeptanz eines Sprachdialogsystems. Erfolg und Leistungsfähigkeit
einer Sprachanwendung ebenso wie der erzielbare ROI hängen also unmittelbar von den
Faktoren Anwenderverhalten und Business Rules der Anwendung ab. Die eigentliche Anruflänge
ist nur vor dem Hintergrund des Anrufer-Anliegens relevant – man kann nicht pauschal sagen,
Anrufer würden einen längeren Dialog mit dem System verweigern.
Marktreport VB07 Vers 1 0 (2).doc
Seite 24 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Der VOICE Award 2006 zeigt aber auch, dass neuere Systeme tendenziell eine niedrigere
Fallabschlussrate aufweisen als alte, „gut eingespielte“ Systeme. Auch dass die Betreiber sich
dessen bewusst sind und offensichtlich den VOICE Award dazu nutzen, Verbesserungspotenziale zu erkennen und umzusetzen, spricht für das gewachsene Verständnis dafür, dass
eine sehr gute Anwendung eben auch sehr gut getunt und eingestellt sein muss – und das
braucht immer etwas Zeit und Erfahrungen mit dem Live-System.
Höhere Integrationstiefe schafft zusätzliche Mehrwerte
Die Analyse der Schnittstellen der Sprachdialogsysteme zu anderen Systemen gibt einen guten
Eindruck über die Tiefe der Integration der Sprachapplikation in die umgebende, vorhandene
Informationstechnologie der Unternehmen.
Die Integrationstiefe der für den VOICE Award 2006 getesteten Anwendungen hat gegenüber
dem Vorjahr in fast allen Bereichen signifikant zugenommen: Durchschnittlich verfügen die
teilnehmenden Dienste über vier Schnittstellen. Alle untersuchten Services sind mindestens an
zwei andere Systeme angeschlossen.
Besonders im Trend liegt für die Unternehmen die Integration von Webdiensten (17,2%
gegenüber 9,9%) und Telefonie (ACD 16,1% gegenüber 12,3%; CTI 14% gegenüber 9,3%).
Integration in Call Center und Backend-Systeme immer wichtiger.
n = 42
Quelle: Testbericht – Voice Award 2006
© 2007 voice-community.de
Abb.: Integrationstiefe
Das zeigt, dass Sprachanwendungen gut in die Geschäftsprozesse der Betreiber integriert
werden können und innerhalb ihres Anwendungsszenarios mit den vorhandenen BackendSystemen harmonieren. Offene Architekturen und ein niedrigerer Integrationsaufwand lassen
die Bedeutung von Webdiensten steigen. Um Sprachcomputer besser mit den Agenten im Call
Center zu verknüpfen, helfen entsprechend die ACD- und CTI-Schnittstellen.
Sprachanwendungen bilden heute nicht nur vollständige Geschäftsvorfälle ab und erlauben den
Anrufern, Transaktionen komplett im Dialog mit dem System durchzuführen. Sie werden auch
immer mehr mit Agenten-basierten Services verknüpft, um in einem Mix aus Automatisierung
und menschlichem Kontakt die bestmögliche Kundenbetreuung zu gewährleisten.
Unternehmen trauen Sprachdialogsystemen immer offensichtlicher zu, auch komplexe
Interaktionen in Sprachanwendungen umzusetzen und zu automatisieren: Die Integration mit
Produkt- und Kundendatenbanken, Warenwirtschaft, Billing und ERP-Systemen schafft die
Voraussetzungen für umfassenden Self Service.
Marktreport VB07 Vers 1 0 (2).doc
Seite 25 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Die Integration mit ACD-, CTI- und CRM-Systemen schafft die Voraussetzungen für eine
„intelligente“ Verknüpfung von automatisierten Diensten und qualifizierten Agenten-Services in
der Kundeninteraktion im Sinne eines umfassenden Customer Value Managements.
Das Interesse an der Backend-Integration von Sprachanwendungen ist vor allem getrieben von
dem Wunsch nach der Realisierung von Geschäftspotenzialen: Durch intelligente Integration
lassen sich Dialogverläufe optimieren und Kosten im Anwendungsbetrieb und bei der
Agentengesprächszeit senken. Eine Personalisierung wirkt sich gleichzeitig sehr positiv auf die
Kundenzufriedenheit aus. Zudem könnten Kundenwertpotenziale durch geeignete Cross- und
Upselling-Strategien gehoben werden, die ohne die Informationen, die CRM-Systeme der
Sprachanwendung in Echtzeit zur Verfügung stellen, nicht erkannt würden. Und natürlich
interessieren sich viele Betreiber angesichts der von ihren Kunden genutzten Kontaktkanäle um
eine Multi-Channel-Integration ihres Call Centers, um so eine kanalübergreifende, durchgängige
Kundenerfahrung zu schaffen.
Doch die Integration von CRM-Systemen, Rechnungslegung, Warenwirtschaft und
Workflowmanagement in ein Sprachportal sowie der anderen Kontaktformen mit dem
Sprachkanal
ist
nicht
trivial.
So
müssen
im
Unternehmen
entsprechende
Datenverarbeitungssysteme vorhanden sein: Je mehr Informationen ein Call Center über seine
Kunden besitzt und je besser diese Daten dokumentiert und strukturiert sind, desto bessere
Ergebnisse wird eine Integration zeitigen. Aus Sicherheitsgründen empfiehlt sich, nicht direkt
auf die zugrundeliegenden Datenbanken zuzugreifen, sondern einen zusätzlichen Weblayer
einzuziehen, der dann über Standardschnittstellen (z.B. per XML oder SOAP) die benötigten
Daten in der Sprachanwendung bereitstellt. Im nächsten Schritt müssen die vorhandenen Daten
so repräsentiert werden, dass sie auch zu der Sprachapplikation passen: Errorhandling,
Bestätigungsstrategie und Reparaturtechniken sind hier die Stichworte, die für eine sichere
Verarbeitung der von den Backend-Systemen bereitgestellten Daten in der Sprachanwendung
berücksichtigt werden müssen. Für die Ausgabe dynamischer Daten aus Backend-Systemen ist
zusätzlich zu den prerecorded Prompts ein TTS erforderlich.
Die Vorteile einer tiefen Integration von Backend-Systemen und Kontaktkanälen in
Sprachanwendungen für Call Center liegen auf der Hand: Sie ermöglichen vor allem eine
schnellere, zielführendere Gestaltung der Dialoge, eine Verbesserung der Anruferzufriedenheit
und eine Verbesserung von Vertriebsergebnissen. Insbesondere Call Center, die über gut
strukturierte Kundendaten verfügen, können durch den Einsatz dieses Wissens im
Sprachdialogsystem schnell profitieren. Dennoch zeigte die Call Center World, dass die Call
Center-Branche erst am Beginn einer systematischen Integration ihrer Datenbestände zur
Sprachautomatisierung von Kundenkontaktprozessen steht.
Eine tiefe Integration von Sprachanwendungen in andere Systeme erlaubt zudem das gezielte
Erfassen und Analysieren von Daten über die Sprachanwendung und ihre Nutzung durch Voice
Analytics:
Hintergrundwissen: Voice Analytics
Um die optimale Performance ihrer Systeme sicherzustellen und um mehr Informationen über ihre Kunden zu
gewinnen, nutzen immer Unternehmen „Voice Analytics“. Voice Analytics unterteilt sich in zwei Bereiche: Application
Analytics für die Analyse der Anwendungsperformance und Speech Analytics für die Analyse des Anruferverhaltens.
Mit Application Analytics Tools, wie sie zum Beispiel Clickfox, Telenet oder Nuance anbieten, lassen sich eine Vielzahl
von Informationen z.B. für Tuningvorhaben ableiten. Diese Tools liefern Parameter und Werte für die Bewertung der
Performance, verringern den Aufwand für das Tuning von Sprachdialogsystemen signifikant und wirken sich positiv
auf die Effizienz von Sprachanwendungen aus. Zugleich liefert Application Analytics wichtige Informationen über das
Anruferverhalten. Zum Beispiel können Unternehmen, die ihre Kunden segmentiert haben, herausfinden, wie die
verschiedenen Kundensegmente mit der Sprachanwendung interagieren und Aufschlüsse z.B. über das Verhalten der
Premium Kunden im Vergleich mit anderen gewinnen, mit denen sich Kampagnenstrategien für das Cross- und
Upselling gestalten lassen.
Marktreport VB07 Vers 1 0 (2).doc
Seite 26 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Bei Speech Analytics, die erst in ihren Anfängen stehen und beispielsweise von Nuance angeboten werden, geht es
um die Analyse der Gespräche auf Basis einer automatisierten Transkription. Die Gespräche werden laufend
aufgezeichnet und transkribiert, die entstehenden Texte mithilfe entsprechender Algorithmen analysiert: So kann ein
Unternehmen z.B. schnell herausfinden, welcher Konkurrent von den Anrufern besonders oft genannt wird. Die
Analyse der Gesprächsprotokolle bietet sich an, wenn ein Unternehmen mehr über die eigenen Produkte, den
Wettbewerb und das Marketing erfahren möchte – aus den Äußerungen der Kunden lassen sich wertvolle
Rückschlüsse für die Produktentwicklung ebenso wie für das Marketing ziehen. Zudem kann durch die Analyse der
Häufigkeit bestimmter Worte auf die Zufriedenheit oder den Verärgerungsgrad der Anrufer geschlossen werden.
Derzeit wird diese Form der Business Intelligence bisher nur von wenigen Vorreitern im Telco und Banking-Bereich
eingesetzt. Es scheint im Markt noch kein breites Bewusstsein zu geben für die Vorteile von Voice Analytics, auch
bieten derzeit erst einige wenige Anbieter passende Lösungen an, die tief in das Sprachdialogsystem integriert sind,
aber komfortabel z.B. im Web von ihren Nutzern bedient werden können.
Amortisierungsdauer
Die Amortisierungsdauer ergibt sich aus dem Zeitraum, der vergeht, bis die anfänglichen
Investitionen durch Kostenersparnisse bzw. zusätzlich generierte Gewinne wieder erwirtschaftet
wurden. In Zeiten knapper Kassen ist dies ein entscheidendes Argument, insbesondere weil
man
nachweisen
kann,
dass
Sprachdialogsysteme
durch
Kostenersparnisse,
Kundenbindungseffekte und Gewinnsteigerungen ihre Investitionen innerhalb kurzer Zeit wieder
einspielen!
ROI in 9,8 Monate
n = 42
Quelle: Testbericht – Voice Award 2006
© 2007 voice-community.de
Abb.: ROI - Return on Investment
Über ein Drittel aller Anwendungen, die am VOICE Award 2006 teilnahmen, amortisierte sich
den Teilnehmern zufolge innerhalb von sechs Monaten, weitere knapp 20% rechneten sich
bereits nach spätestens elf Monaten. 25% der Teilnehmer gaben Amortisierungszeiträume von
einem bis maximal zwei Jahren an. Diese Amortisierungszahlen sind einzigartig für ITKProjekte:
Ein durchschnittlicher ROI von knapp 10 Monaten ist eine beeindruckende Zahl – und beweist:
Für Unternehmen mit hohem Kundenkontaktaufkommen zahlen sich Sprachapplikationen aus,
und zwar im wahrsten Sinne des Wortes!
Anrufkosten
Die im Vergleich zu Agenten besonders niedrigen Transaktionskosten eines automatisierten
Kundenkontakts sind ein wesentlicher Treiber für den Einsatz von Sprachanwendungen. Die im
Rahmen des VOICE Award 2006 erhobenen Daten machen deutlich, wie sehr
Marktreport VB07 Vers 1 0 (2).doc
Seite 27 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Sprachdialogsysteme die Kosten der Kundenkommunikation senken können: 67% der
getesteten Anwendungen verursachen Transaktionskosten von unter 0,25 EUR, weitere 27%
liegen immer noch bei unter 50 Cent pro fallabschließend abgewickeltem Anruf. Vergleicht man
diese Kosten mit denen, die Agenten im Kundenkontaktcenter verursachen (mind. 1
EUR/Gesprächsminute), dann wird deutlich, welches betriebswirtschaftliche Potenzial im Einsatz
von Sprachanwendungen liegt.
Durchschnittliche Kosten unter 20 Cent je Anruf
n = 42
Quelle: Testbericht – Voice Award 2006
© 2007 voice-community.de
Abb.: Kosten je Anruf
Sprachanwendungen senken die Transaktionskosten gegenüber Call Centern massiv.
Durchschnittliche Transaktionskosten von unter 20 Cent sollten vor allem Unternehmen mit
vielen wiederkehrenden Anrufen motivieren, zur Automatisierung geeignete Prozesse zu
identifizieren und sie in einem Sprachdialogsystem abzubilden.
D.3 Nutzerakzeptanz: Vernunftehe statt Liebeshochzeit
Hinsichtlich der Nutzerakzeptanz von Sprachanwendungen gibt es eine Reihe von Vorurteilen
und Fehleinschätzungen – aber wenig wissenschaftlich aussagekräftige Zahlen, Daten und
Fakten.
In einer umfangreichen telefonischen Befragung von mehr als 1000 Teilnehmern hat das
Fraunhofer-Institut für Arbeitswirtschaft und Organisation im Herbst 2006 in Zusammenarbeit
mit der Initiative VOICE BUSINESS eine Akzeptanzstudie zur Nutzung von automatischen
Sprachsystemen in Deutschland erstellt [6]. Dabei wurde nicht nur der allgemeine
Bekanntheitsgrad von Sprachautomation nachgefragt, sondern auch Nutzungsverhalten und
typische Einstellungen von potenziellen und tatsächlichen Benutzern erfasst.
Im folgenden Kapitel gehen wir zunächst auf das gebräuchlichste Vorurteile zu
Sprachdialogsystemen ein und diskutieren im Anschluss die Nutzerakzeptanz von
Sprachdialogsystemen, wie sie im Rahmen der Akzeptanzstudie nachgewiesen werden konnte.
Keine generelle Abneigung gegen Sprachdialogsysteme
Es gibt keine per se gute oder schlechte Applikation. Niemand würde z.B. behaupten, dass
DVD-Rekorder „kinderleicht“ zu bedienen seien oder DTMF besonders praktisch wäre bei der
Voice Mailbox-Abfrage. Und doch stiften diese Produkte einen hohen Nutzwert.
Marktreport VB07 Vers 1 0 (2).doc
Seite 28 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Gleiches gilt für die Welt der Sprachdialogsysteme: Vor die Wahl gestellt, 5 Minuten in der
Warteschleife zu verbringen oder ein Anliegen direkt per Sprachcomputer zu erledigen, werden
viele Nutzer den Sprachcomputer wählen. Insofern hängt die Nutzerakzeptanz auch stark vom
„Leidensdruck“ (und den Alternativen), der Verbreitung und der damit einhergehenden
Gewöhnung an Sprachdialogsysteme ab. Die Ergebnisse aus empirischen Befragungen wie auch
aus Experteninterviews haben bestätigt:
Es gibt keine generelle Abneigung der Deutschen gegen Sprachdienste, außer bei Entscheidern,
die über deren Einsatz befinden. Ähnlich wie bei Markenprodukten gilt auch hier: „Auf die
Verpackung kommt es an“, das heißt in in diesem Falle auf das Hörerlebnis, das eine
Applikation vermittelt, und den Nutzen: Je höher der Nutzwert, den ein Dienst bietet, desto
niedriger ist die Bedeutung des Bedienungskomforts (Verpackung).
Fakten zur Nutzerzufriedenheit
Die Studienergebnisse [6] zeigen im Vergleich zu der Befragung aus dem Jahr 2003 [1] deutlich
positivere Einstellungen der Befragten. Auch die Bekanntheit von Sprachapplikationen ist in den
vergangenen Jahren deutlich gestiegen. 70 Prozent der Befragten gaben 2006 zu Protokoll,
Sprachapplikationen zu kennen, während es im Oktober 2003 noch lediglich 54 Prozent waren.
Ebenso ist die Anzahl derer deutlich gestiegen, die bereits Sprachapplikationen nutzen, und
zwar auf 32 Prozent gegenüber 20 Prozent vor drei Jahren. Von dieser positiven Entwicklung,
die auch auf komfortableren Systemen basiert, profitieren insbesondere die Branchen
Telekommunikation, Banken und Finanzen, Transport, Verkehr und Logistik.
Trotz der generell relativ geringen Zufriedenheit der Nutzer mit den von ihnen am häufigsten
genutzten Sprachapplikationen besteht überwiegend eine hohe Bereitschaft, diese Applikationen
auch in der Zukunft zu nutzen. Nur etwa 28% stehen einer zukünftigen wiederholten Nutzung
ablehnend gegenüber. Damit hat sich die Nutzungsbereitschaft gegenüber 2003 hoch
signifikant erhöht. Die folgende Tabelle zeigt diese positive Entwicklung anhand des Vergleichs
mit den Daten aus der 2003 von Fraunhofer IAO durchgeführten Akzeptanzstudie.
Insbesondere der Anteil derer, die angeben, die Sprachapplikation „auf keinen Fall“ noch einmal
zu nutzen, ist drastisch gesunken:
Nutzungsbereitschaft
•
Nur jeder 4. ist nicht bereit Sprachapplikation wieder zu verwenden.
35%
30%
25%
20%
15%
10%
5%
0%
uf
,a
Ja
n
de
je
ll
Fa
j
er
Eh
a
ils
Te
ils
/te
E
rn
he
n
ei
k
uf
,a
n
ei
N
ei
n
ne
ll
Fa
W
ß
ei
t/k
ch
ni
.
.A
n = 420
Quelle: Fraunhofer
© 2007 voice-community.de
Abb.: Nutzungsbereitschaft
Allerdings ist die hohe Nutzungsbereitschaft in vielen Fällen (76%) darauf zurückzuführen, dass
keine geeigneten Alternativen zur Verfügung stehen, um in der jeweiligen Situation die
gewünschte Dienstleistung in Anspruch zu nehmen.
Marktreport VB07 Vers 1 0 (2).doc
Seite 29 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Motivationsfaktor: Der schnellere gewinnt!
In vielen Fällen konkurrieren Sprachapplikationen mit anderen Zugangsmöglichkeiten zu
Informationen und Transaktionen. Neben dem persönlichen Kontakt mit einem Mitarbeiter
bieten sich beispielsweise tastengesteuerte Handy Services (DTMF), eMail, Webseiten und der
traditionelle Postweg für typische Anwendungsbereiche von Sprachapplikationen an. Inzwischen
hat sich auch die Vorqualifizierung von Kundenanrufen durch eine Sprachapplikation mit
anschließender Weiterleitung zu einem persönlichen Telefonkontakt zu einem wichtigen
Kommunikationskanal entwickelt.
Im Vergleich zu anderen Kommunikationsmöglichkeiten ist die Nutzung von
Sprachapplikationen insgesamt nicht besonders beliebt. Sowohl für die Abfrage von
Informationen als auch zur Durchführung von Transaktionen wird nach wie vor ein persönlicher
Kontakt bevorzugt. Telefondienste, die per Spracherkennung oder per DTMF bedient werden,
schneiden bei einer vergleichenden Bewertung nach dem Schulnotensystem (1: „sehr gut“ bis
6: „ungenügend“) in diesen beiden Fällen am schlechtesten ab.
In bestimmten Situationen jedoch bevorzugen die meisten Befragten Sprachapplikationen selbst
gegenüber einem persönlichen Kontakt.
Sprachapplikationen – der schnelle Weg zum Service
•
Über 60% entscheiden sich für den Sprachcomputer, wenn sie mehr als 1 Minute auf
Agent-Service warten müssen.
50%
40%
30%
20%
10%
Nutz er
0%
W
al
er
ig
n
e
0
s3
Nicht-Nutz er
k.
se
s
Bi
zu
1
m
.
in
s
Bi
zu
3
m
.
in
s
Bi
zu
5
m
.
in
er
ng
Lä
s
al
5
m
.
in
W
ei
ß
ch
ni
.
.A
t/k
n = 929
Quelle: Fraunhofer
© 2007 voice-community.de
Abb.: Serviceverfügbarkeit
Entsprechend dem am häufigsten genannten Vorteil der Zeitersparnis erscheint schon bei einer
relativ kurzen Wartezeit auf einen persönlichen Ansprechpartner die Alternative einer
Sprachapplikation attraktiver. Etwa 60% der Anrufer ziehen bereits eine Sprachapplikation
gegenüber einem persönlichen Kontakt vor, wenn sie dafür länger als 1 Minute in einer
Warteschleife warten müssen. Bei Wartezeiten ab 3 Minuten sind es bereits knapp 90%. In
dieser Einschätzung gibt es keinen signifikanten Unterschied zwischen Nutzern und NichtNutzern.
Marktreport VB07 Vers 1 0 (2).doc
Seite 30 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Kostenbewusstsein der Verbraucher
Sprachapplikationen – der kostengünstigere Service
•
Über 80% entscheiden sich für den Sprachcomputer, wenn der Agent-Service mehr
als 14 Cent kostet.
50%
40%
30%
20%
10%
Nutz er
0%
Nicht-Nutz er
in
Ne
s
Bi
zu
14
nt
Ce
o
pr
Bi
M
sz
in
u
.
50
nt
Ce
pr
o
M
Bi
in
sz
.
u
1
Eu
ro
o
pr
M
.
in
M
r
eh
al
s1
Eu
ro
pr
o
.
in
M
W
ei
ß
ch
ni
.
.A
t/k
Quelle: Fraunhofer/IVB
n = 929
© 2007 voice-community.de
Abb.: Kostenbewusstsein
Ebenso deutlich werden Sprachapplikationen dann bevorzugt, wenn für einen persönlichen
Telefonkontakt zusätzliche Gebühren anfallen. Schon bei Gebühren von mehr als 14 Cent pro
Minute bevorzugen etwa 80% der Anrufer eine Sprachapplikation. Bei Kosten ab 50 Cent pro
Minute sind es bereits 94%. Auch hier besteht kein statistisch bedeutsamer Unterschied
zwischen Nutzern und Nicht-Nutzern.
Die Bekanntheit von Sprachapplikationen ist in den vergangenen Jahren deutlich gestiegen.
Trotz der generell relativ geringen Zufriedenheit der Nutzer mit den von ihnen am häufigsten
genutzten Sprachapplikationen besteht überwiegend eine hohe Bereitschaft, diese Applikationen
auch in der Zukunft zu nutzen: Im Vergleich zu anderen Kommunikationsmöglichkeiten ist die
Nutzung von Sprachapplikationen insgesamt nicht besonders beliebt, jedoch bevorzugen die
meisten Befragten sie in bestimmten Situationen selbst gegenüber einem persönlichen Kontakt:
1. Zeitersparnis: Schon bei einer relativ kurzen Wartezeit auf
Ansprechpartner erscheint die Alternative Sprachapplikation attraktiver
einen
persönlichen
2. Erreichbarkeit und 24 Stunden Verfügbarkeit
3. Kostenvorteil: Ebenso deutlich werden Sprachapplikationen dann bevorzugt, wenn für einen
persönlichen Telefonkontakt zusätzliche Gebühren anfallen
D.4 Anbietermarkt: Eine Branche konsolidiert sich
Der Anbietermarkt für Voice Technologie und Sprachdialogsysteme in Deutschland war lange
sehr zersplittert. Das hatte Konsequenzen auch für die Marktentwicklung: Neben der
innovativen Wirkung vieler kleiner, oft hoch spezialisierter Anbieter stand dieser
unüberschaubare Anbietermarkt zugleich für Orientierungsprobleme bei Kunden und
Interessenten: Nur wenige Experten sahen sich überhaupt in der Lage, die Angebotslandschaft
zu überblicken und Lösungen miteinander zu vergleichen – zukünftige Betreiber von
Sprachdialogsystemen mussten häufig auf externe Expertise zurückgreifen, um zukunftssichere
Investitionsentscheidungen treffen zu können.
In den vergangenen Jahren hat die Branche sich jedoch konsolidiert, zugleich gerieten
proprietäre Lösungen gegenüber standardkonformen VoiceXML-Plattformen und -Lösungen ins
Marktreport VB07 Vers 1 0 (2).doc
Seite 31 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Hintertreffen. Branchenevents wie die jährlichen VOICE Days schufen eine Plattform für den
intensiven Vergleich des Marktangebots. Brancheninformationsdienste wie die VOICE
Community beschleunigen den Wissenstransfer aus der Branche hin zur interessierten
Fachöffentlichkeit und ermöglichen auch Einsteigern den schnellen Einstieg ins Voice Business.
Im folgenden Kapitel geht es um Zahlen, Daten und Fakten des Voice Business in Deutschland:
Wir beschreiben die allgemeine Marktentwicklung in Deutschland im europäischen Vergleich
und geben einen Ausblick auf das hierzulande zu erwartende Marktwachstum. Zudem
dokumentieren wir den Siegeszug des VoiceXML-Standards und das Vordringen der
Sprachsteuerung bei der Kontaktautomatisierung. Schließlich analysieren wir die gegenwärtige
Marktkonsolidierung und ihre Auswirkungen auf die weitere Marktentwicklung.
Marktbedeutung und Wachstum
In den vergangenen drei Jahren wuchs der Markt für Sprachdialogsysteme in Deutschland,
Frankreich und Großbritannien von 240 Mio. US$ in 2005 auf fast 350 Mio. US$ in 2007. Der
deutsche Markt, der 2005 noch ein Volumen von 75 Mio. US$ hatte, wird dieses Jahr das erste
Mal die 100-Millionen-Marke knacken. Bis 2010 rechnen die Analysten von Datamonitor mit
einer weiteren Verdopplung des Marktes auf fast 200 Mio. US$. Damit ist Deutschland der
zweitgrößte Markt für Sprachdialogsysteme (hinter GB) in Europa.
Deutschland zweitgrößter Markt in EU
•
Mehr als 100 Mio. Umsatz – CAGR 21,5% ab 2007 in Deutschland
Umsätze in D, F und GB (in US$)
300
254
250
210
200
170
150
100
97
118
69 75
84 91
140
100108
121131
162
148
198
181
50
0
2005
2006
2007
UK
France
2008
2009
2010
Germany
Quelle: Datamonitor
© 2007 voice-community.de
Abb.: Marktgröße EU
Der deutsche Markt für Sprachanwendungen ist der am schnellsten wachsende Markt in
Europa: 21,5% jährliches Wachstum zeigen, dass das Voice Business boomt.
Marktreport VB07 Vers 1 0 (2).doc
Seite 32 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
VOICE ist ein Wachstumsmarkt - CAGR 27%
•
Voice-Hosting attraktives Geschäftsfeld für Telefongesellschaften
Umsätze in $ Weltweit
1.200
1.000
471
800
367
600
Service provider
Enterprise
286
400
135
200
218
171
253
317
402
204
2005
2006
2007
2008
509
638
2009
2010
Quelle: Datamonitor
© 2007 voice-community.de
Abb.: Weltmarkt
Das weltweite Marktvolumen für Sprachdialogsysteme wird von Datamonitor mit 535 Mio. US$
für das Jahr 2007 beziffert. Davon werden knapp 320 Mio. US$ im Enterprise-Markt umgesetzt.
Fast 220 Mio. US$, also etwa 40% davon entfallen auf die Service Provider-Branche.
Bereits im Jahr 2010 soll der Weltmarkt laut Datamonitor die Milliardengrenze überschreiten.
Von diesem Wachstum profitiert vor allem der Service Provider-Markt, dessen Marktanteil in
2010 bereits auf 46% angestiegen sein wird.
VoiceXML – De facto-Standard nicht nur für Sprachapplikationen
•
Der Übergang zu Voice-XML Plattformen ist Ausdruck der Migration zu Webzentrischen IP-Architekturen
Verkaufte IVR Ports (in tsd.)
800
700
600
500
400
300
200
100
0
754
594
405
402
216
2005
388
451
347
367
333
264
2006
2007
Traditional IVR
2008
2009
288
2010
Voice-XML
Quelle: Datamonitor
© 2007 voice-community.de
Abb.: VXML ist Standard
Das starke Wachstum des Voice-Marktes ist auch dem allgemeinen Trend hin zu IP-basierten
Architekturen geschuldet, wie die Abbildung zeigt: Wurden in 2006 weltweit nur 264.000 VXMLPorts verkauft (gegenüber 405.000 traditionellen, nicht VXML-gerechten), so wird schon in 2008
die Installationsbasis für VXML-Ports erstmals die für nicht standardkonforme übertreffen.
Marktreport VB07 Vers 1 0 (2).doc
Seite 33 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Datamonitor erwartet für 2008 über 451.000 Verkaufseinheiten bei VXML-Ports gegenüber nur
noch knapp 367.000 traditionellen Ports. Das gesamte Marktwachstum wird ab 2008 auch nur
noch von VXML-Ports getrieben; die Verkaufszahlen traditioneller Ports sinken in den
kommenden Jahren immer schneller.
ASR verdrängt Touchtone
Diese Zahlen spiegeln sich auch in der Call Center-Praxis wider: IVR Systeme gehören gerade in
größeren Contact Centern mittlerweile zum Standard. Laut der aktuellen, jährlich erscheinenden
Studie „Contact Center-Trends“ [5] haben insgesamt bereits rund 46% der Befragten derartige
Systeme im Einsatz, weitere 4% planen die Neueinführung in 2007. Dies ist eine glatte
Umkehrung der Verhältnisse gegenüber 2005, die den oben postulierten Zusammenhang
zwischen dem Trend hin zur IP-Telefonie und dem Einsatz von VXML-basierter Sprachtechnolgie
stützt:
VoIP schafft eine ideale Basis für die Integration von Sprachverarbeitung und Call-Handling auf
Basis des VXML-Standards. Der Trend zur IP-Infrastruktur schafft so auch mehr
Nutzerfreundlichkeit: Die Systeme werden durch den vermehrten Einsatz benutzerfreundlicher
Spracherkennung auch zunehmend kundenfreundlicher, weil der Anteil der veralteten und
umständlichen „Touchtone“-Systeme mit DTMF-Eingaben ständig sinkt.
Entwicklung ASR-Anteil bei IVR-Systemen
•
ASR-DTMF Verhältnis hat sich innerhalb von 2 Jahren gedreht.
ASR-Anteil bei IVR-Systemen
70,00%
60,87%
60,34%
60,00%
55,56%
50,00%
44,44%
40,00%
39,66%
39,13%
ASR
DTMF
30,00%
20,00%
10,00%
0,00%
2005
2006
2007
Quelle: Contact Center Trends 2007
© 2007 voice-community.de
Abb.: ASR-Anteil
Marktkonsolidierung bestätigt Marktreife
Die globale Voice-Branche hat sich in den vergangenen ein, zwei Jahren stark verändert.
Entlang der gesamten Wertschöpfungskette haben Fusionen und Übernahmen zu einer
Konsolidierung des Marktes geführt: Plattformanbieter Genesys kaufte VoiceGenie und
beherrscht nun gut 50% des Weltmarktes für VXML-Plattformen. Scansoft übernahm Nuance
und wurde mit 90% Marktanteil Weltmarktführer für Spracherkennung und -ausgabe. Anbieter
von Voice-IDEs, also Entwicklungs- oder Managementumgebungen für Sprachanwendungen wie
VoiceInt und VoiceObjects wurden OEM-Partner von Genesys respektive SAP, Cisco erwarb
Audium. Schließlich kaufte die „neue“ Nuance in USA den Hostinganbieter BeVocal - und
Microsoft verleibte sich den amerikanischen Hostinganbieter Tellme ein.
Marktreport VB07 Vers 1 0 (2).doc
Seite 34 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Eine starke Konsolidierung erfolgte auch bei der Hardware: Hier fusionierten Brooktrout mit Exel
zur Cantata, Eicon und die Signalling-Sparte von Intel zur Dialogic. Bei den Spracherkennern
sucht vor allem Marktführer Nuance (ex-Scansoft, -Speechify, -BeVocal et.al.) durch Mergers
und Akquisitionen seine Position auszubauen. Vergleichsweise ruhig ist der Markt für proprietäre
IVR-Systeme, der allgemeine Trend zu VXML spricht besonders gegen zukünftige Fusionen in
diesem Marktsegment.
Bei den Plattformanbietern ist wieder mehr Konsolidierungsaktivität zu verzeichnen: Cisco
erwarb erst unlängst den IDE-Spezialisten Audium. Bei den Anbietern von Mehrwertdiensten
konnte D+S sich durch entsprechende Zukäufe (dtms, dtms solutions, mobile view) unter den
etablierten Anbietern T-Com, Arcor und Legion etablieren.
Keine M&As konnten bei den als „Berater“ klassifizierten Unternehmen verzeichnet werden:
Diese innovativen „Schnellboote“ der Branche können mit ihrer Expertise offensichtlich ihre
Auftragsbücher füllen, auch ohne fusionieren zu müssen.
Aktuell engagieren sich etwa 120 Unternehmen mit ca. 10.000 Mitarbeitern im deutschen Voice
Business.
Der (fragmentierte) Voice Markt – die Player
Marktkonsolidierung entlang der Wertschöpfung setzt sich fort!
ca. 120 Unternehmen, die Dienstleistungen, Software und Hardware anbieten mit rund 10.000 Beschäftigten*
Spezifikation
Beispiele
Hardware (Telefoniekarten, Server)
Aculab, AVM, Cantata (Brooktrout + Exel Switch) , Dialogics (Eicon + Intel), NMS
Software (ASR, TTS, Verifizierung)
ASR*: IBM, Loquendo, Nuance, Telisma
TTS*: Acapela, IBM, Loquendo, Nuance, Telisma
Verifizierung: IBM, Loquendo, Nuance, VoiceTrust
Proprietäre IVR Systeme
COMplan + Service (VoiceRobots), Flintec, TE-System, Voxtron,
IVR mit VoiceXML Schnittstelle
Aastra, Aspect, Avaya-Tenovis, Crealog, IBM, Intervoice, Nortel, Sikom, Telenet
reine VoiceXML Plattformen
Alcatel, Cisco, Genesys (VoiceGenie), HP, Nuance, Microsoft, Voxpilot
IDE – Entwicklungswerkzeuge
Hersteller-Individuelle Lösungen - siehe Plattformanbieter
Management-Systeme
Cisco (Audium), Fluency, VoiceObjects
Reines Hosting
Arcor, BT, Colt, Net-mobile, Map telecom, Verizon, Voxpilot
Komplette Mehrwertdienste
D+S Solutions, Legion, T-Systems, T-Com, Excelsis
Beratung (Dialog-Designer, VUI /
Kommunikation)
8hertz, Excelsis, HFN Medien, Speak-Up, Sympalog, SematicEdge, Voiceandvision
Systemintegratoren (Prozesse / IT / Backend)
Alcatel, Cap Gemini, IBM, NextiraOne, Nortel, Siemens IT Solutions, Softlab, T-Systems, Telenet,
TietoEnator
*Eigene Schätzung
© 2007 voice-community.de
Abb.: Marktkonsolidierung
Die Marktkonsolidierung der letzten zwei Jahren und die Übernahme neuer Sprachtechnologien
in die Portfolios von Microsoft, SAP, Google & Co. beweist eine gewisse Reife sowohl des
Marktes als auch der Technologie.
Der Markteintritt der „Big Player“ wird die Grundlagen für eine Neuordnung der Preis- und
Kostenstrukturen in der Branche schaffen: Das könnte den Anfang vom Ende der Port-basierten
Kosten für Sprachtechnologie zugunsten von Arbeitsplatz- oder transaktionsbezogenen Kosten
bedeuten. Auch werden diese Unternehmen dazu beitragen, dass Sprachtechnologie zur
Commodity wird.
Wenn ein Unternehmen wie Microsoft Sprachtechnologie voll in seine Produkte von
Betriebssystemen bis hin zu Office-Anwendungen integriert und diese zugleich mit einem
Diensteangebot á la Hotmail (für Voice auf Basis der neuerworbenen TellMe-Plattform) in ein
umfassendes Eco-System einbindet, spätestens dann wird Voice ebenso Mainstream sein wie
heute eMail.
Marktreport VB07 Vers 1 0 (2).doc
Seite 35 von 50
Nr. 1002306
MARKTREPORT
E
© Mind | STRATECO
Voice Business 2007
Die Zukunft des Voice Business
Zur Darstellung der Marktentwicklung des Voice Business in den kommenden zwei Jahren
untersuchen wir in den folgenden Abschnitten diese Fragestellungen:
»
Welche Entwicklungen sehen die Praktiker?
»
Wie wird die Serviceorganisation der Zukunft aussehen?
»
Treiben Mobile Trends auch das Voice Business?
»
Welches Potenzial haben „on demand“-Services?
»
Wie wird das Voice Business 2.0 aussehen?
Die
Antworten
auf
diese
Fragestellungen
beruhen
auf
den
regelmäßigen
Hintergrundgesprächen, den redaktionellen Veröffentlichungen sowie den Umfragen der VOICE
Community Redaktion in 2006 und 2007.
E.1 Trends im Voice Business
Im kommenden Jahr wird der Markt vor allem durch Sprachautomatisierung in der
Kundenkontaktqualifizierung weiter getrieben, so die 116 Teilnehmer an dem
„Branchenbarometer der VOICE Community“ [4] im Herbst 2006.
Sprachautomatisierung durch Kontaktqualifizierung getrieben
Frage: Welche Anwendungsbereiche werden die weitere Verbreitung von
Sprachanwendungen maßgeblich vorantreiben? (wichtig+sehr wichtig in %)
Outbound (Notifikation)
48%
Marketing-Kampagne
48%
Authentifizierung und Sicherheitsservices
48%
Help-Desk Service
50%
Infotainment- und Entertainment-Dienste
55%
Kommunikationsdienste im Netz
58%
Automatisierte Telefonzentrale
68%
Workflow-Systeme
73%
Track & Trace-Systeme
73%
Bestellsysteme
73%
Auskunft und Informationsdienste
85%
Self Service-Portale
88%
Vorqualifizierung
93%
Quelle: VOICE Community - Branchenbarometer
n = 116
© 2007 voice-community.de
Abb.: Applikationsfelder
92,5% der Umfrage-Teilnehmer sind der Ansicht, dass das sprachgesteuerte Call Routing den
größten Einfluss auf die Marktentwicklung nehmen wird, gefolgt von Self Service-Portalen
(87,5%), Auskunfts- und Infodiensten (85%) sowie Workflow-Systemen, Track & TraceDiensten und Bestellsystemen (je 72,5%). Auch der automatisierten Telefonzentrale gestehen
67,5% der Befragten Marktbedeutung zu. Weniger Einfluss auf die Marktentwicklung haben der
Umfrage zufolge Help Desk-Services (50%), Authentifizierungsdienste, Voice-Kampagnen und
automatisierte Outbound-Dienste (47,5%).
Marktreport VB07 Vers 1 0 (2).doc
Seite 36 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Auftreten neuer Player verändert die Spielregeln
Frage: Welche Entwicklungen im Anbietermarkt werden die Spielregeln im Markt maßgeblich
verändern? (Veränderungen hoch+sehr hoch in %)
Auftreten neuer Player wie Microsoft,
Google & Co.
70%
Neue Lizenz- und Preispolitik (wie
z.B. pay-per-use)
53%
Auftreten neuer Hosting/ManagedService Provider
48%
Konsolidierung im Bereich
Spracherkenner (wie z.B. der
Nuance/Scansoft Merger)
48%
Konsolidierung im Bereich
Plattformen (z.B. Übernahme von
VoiceGenie durch Genesys)
38%
Quelle: VOICE Community - Branchenbarometer
n = 116
© 2007 voice-community.de
Abb: Trends im Anbietermarkt
Im Anbietermarkt wird die größte Rolle bei der Marktentwicklung nach dieser Umfrage das
Auftreten neuer Player wie Microsoft oder Google spielen, so 70% der Befragten. Ebenfalls
bedeutsam seien neue Lizenz- und Preismodelle wie z.B. Pay-per-use (52,5%), die
Marktkonsolidierung im Spracherkennermarkt und das Auftreten neuer Hosting-Anbieter (je
47,5%). Eine Marktkonsolidierung bei den Voice Plattformen sehen nur 37,5% der Befragten als
wichtig an für die weitere Marktentwicklung.
In der Umfrage wurde auch die Bedeutung von Innovation bezogen auf die nächsten fünf
Halbjahre bis Winter/Frühjahr 2009 nachgefagt: Anfang 2007 werden demnach StandardApplikationen (22,5%), Managed Services (20%) und die Integration von VoIP (17,5%) die
wichtigsten Rollen bei der Marktentwicklung spielen.
Im ersten Halbjahr 2007 erwarten 42,5% der Befragten einen Marktschub durch
Standardapplikationen. VoIP-Integration, Managed Services und multimodalen Diensten
sprachen je etwa 20% der Befragten innovative Bedeutung zu. Eine unerwartet kleine Rolle
messen die befragten Experten der Biometrie zu (12,5%).
Zwischen Sommer 2007 und 2008 werde die Marktentwicklung ebenso von Managed Services
und der VoIP-Integration ausgehen (37,5% und 32,5%), auch die Authentifizierung setze sich
dann besser am Markt durch (27,5%).
Dass über 60% der befragten Profis aus der VOICE Community erwarten, dass
Standardanwendungen im kommenden Jahr die für die Marktentwicklung bedeutsamste
Innovation sein werden, ist ein sicherer Hinweis darauf, dass bei den verschiedensten Anbietern
Standardanwendungen kurz vor dem Roll-out stehen.
Erstaunlich ist, dass Managed Services eine höhere Marktbedeutung erst in ein bis zwei Jahren
zugesprochen wird – dies verwundert angesichts der im Markt bereits vorhandenen Voice
Hosting-Angebote und deren Akzeptanz bei den Betreibern. Multimodale und biometrische
Anwendungen werden in absehbarer Zeit keine größere Rolle spielen; kaum einer rechnet
damit, dass sich hier in den kommenden zwei Jahren viel tun wird. Die durch die Umstellung
auf VoIP entstehenden Marktchancen werden in den kommenden zwei Jahren weiter
zunehmen.
Marktreport VB07 Vers 1 0 (2).doc
Seite 37 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Top-Trends: Standard-Applikationen, Managed Services und VoIPIntegration
Frage: Welchen Innovationen messen Sie für die nächsten 12 Monate
eine große Bedeutung für die Marktentwicklung bei?
Standard-Applikationen
65,0%
Managed Services
40,0%
VoIP-Integration
37,5%
Multimodale Anwendungen
20,0%
Biometrie
12,5%
Quelle: VOICE Community - Branchenbarometer
n = 116
© 2007 voice-community.de
Abb.: Entwicklungstrends
Bei der Frage, welche Stolpersteine die Marktentwicklung hemmen könnten, zeigte sich, dass
das Voice User Interface aus Branchensicht nach wie vor Erfolgsfaktor No. 1 ist; ganze 80% der
Befragten sahen hierin das nach wie vor größte Problem für die zukünftige Marktentwicklung.
Auch die Akzeptanz von Sprachdialogsystemen bei Entscheidern sei weiter verbesserungswürdig, so 52,5% der Interviewteilnehmer, ebenso wie die Qualität der Spracherkennung, die
50% für erfolgskritisch halten. Die Kosten sind ähnlich der Integration keine Hürde mehr, nur
17,5% sahen hierin eine Problemstellung.
Erfolgsfaktor Nr. 1 - Voice User Interface
Frage: Welche Faktoren können die Marktdurchdringung beschleunigen?
(Hierarchie - Rang 1+2)
Fokus auf nutzer-zentrische
Dialoggestaltung
78%
Kostengünstige Standard-Lösungen
35%
Hosted- & Managed Service
Angebote
33%
Best Practice-Kommunikation
33%
Entwicklung von Qualitätsstandards
23%
Quelle: VOICE Community - Branchenbarometer
n = 116
© 2007 voice-community.de
Abb.: Markterfolgsfaktoren
Marktreport VB07 Vers 1 0 (2).doc
Seite 38 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Und was sind in den Augen der VOICE Community-Members die „Turbos“ für den Voice-Markt?
Als wichtigster Erfolgsfaktor für Sprachdialogsysteme gilt nach wie vor die richtige Gestaltung
des Dialogs: 77,5% bezeichnen als primären Faktor für eine schnelle Marktdurchdringung die
nutzerzentrische Dialoggestaltung, flankiert von einem Angebot an Standardanwendungen
(35%) und Managed Services (32,5%). Die Entwicklung von Qualitätsstandards hingegen sahen
nur 22,5% als notwendig für eine beschleunigte Marktdurchdringung an.
Die wichtigsten Trends für die nächsten 24 Monate sind: Erstens die Sprachautomatisierung
(im Call Center Umfeld) wird durch Kontaktqualifizierung getrieben. Zweitens wird das Auftreten
neuer Player wie Google, Microsoft & Co. die Spielregeln grundlegen verändern. Und drittens
sind Standard-Applikationen, Managed Services und VoIP-Integration die wichtigsten
Innovationen. Erfolgsfaktor Nr. 1 bleibt das Voice User Interface. Das wird gleichzeitig auch als
wichtigster Stolperstein gesehen.
E.2 Serviceorganisation der Zukunft
Im Enterprise Markt hat der Kundenservice mittlerweile einen der industriellen Fertigung
vergleichbaren Organisationsgrad erreicht. Doch diese Entwicklung dauerte mehrere
Jahrzehnte:
Ganz am Anfang der „Industrialisierung des Kundenkontakts“ stand die Ausgliederung des
Kundenerstkontakts an Call Center, die mehr oder weniger vollständig isoliert vom
beauftragenden Unternehmen „auf der grünen Wiese“ standen.
Im nächsten Schritt konnten durch die Möglichkeiten des ISDN-Netzes erste Geschäftsprozesse
mit dem Auftraggeber integriert werden wie etwa die Weiterleitung eines Anrufers an den
entsprechenden Sachbearbeiter im Unternehmen. Mit dem Aufkommen „intelligenter“
Kommunikationsnetze lässt sich die Integration aller Kanäle, also auch Fax, eMail und SMS
ebenso wie die Sprachautomatisierung im Netz erreichen.
In den vergangen 10-15 Jahren konnten Unternehmen so sukzessive Vertriebs- und
Kundenserviceaufgaben im Call Center zusammenführen und durch den Einsatz von IT und
Telekommunikation eine moderne Form der Fließband-Arbeit am Telefon erschaffen. Während
sich in diesen Kundenkontakt-Zentralen die Arbeit durch Prozessorganisation, intelligente
Zuweisung von Echtzeit-Anfragen und die durchgängige Vorgangsbearbeitung - über
unterschiedliche Kommunikationskanäle hinweg - grundlegend geändert hat, stecken in der
Organisation der dahinter liegenden Verwaltungsabläufe noch enorme Effizienzpotenziale.
Unternehmen beginnen nun, ihre Contact Center in die Gesamtstruktur des restlichen
Unternehmens zu integrieren. Diese Eingliederung stellt eine Revolution in der Bearbeitung von
Kundenabläufen (der Verwaltung) dar, denn moderne Plattformen erlauben, das Routen von
eingehenden Kundenkontakten über den Sprachanruf hinaus zu organisieren: eMail, Fax und
Brief werden mit einbezogen in die (teil-) automatisierte Verteilung der Arbeitsschritte im
Unternehmen. Damit eröffnen sich Unternehmen neue Wege der Kundeninteraktion und der
Verwaltungsprozesssteuerung.
Hintergrundwissen: Die Integration des Back Office
Unternehmen versuchen die Abgrenzung zwischen Back Office und Contact Center aufzuheben - das Unternehmen
soll als „homogener Organismus“ mit dem Kunden interagieren, die Abläufe im Back Office transparent und
durchorganisiert werden wie im Call Center. Dazu ist allerdings eine systematische Neustrukturierung der internen
Geschäftsprozesse nötig, um die Aufgabenverteilung automatisieren zu können und entsprechend in der
Prozessstruktur des Back Offices abbildbar zu machen. Das geht nur mit einer engen Einbindung und voller
Unterstützung der Fachabteilungen sowie des Managements.
Ein Beispiel bieten Versicherungsgesellschaften. Hier werden Schäden heutzutage meist von einer Person bearbeitet.
Dies gewährleistet zwar eine gewisse Kontinuität und Bearbeitungskonstanz, jedoch bringt es auch Nachteile mit sich.
Durch die Aufteilung der Aufgaben eines Schadenfalles in ein bestimmtes Raster im Gegensatz zur Zuteilung zu einer
einzigen Bearbeitungsperson kann der Prozess in seine einzelnen Bestandteile gegliedert werden. Verschiedene
Aufgaben können an verschieden qualifizierte Personen weitergeleitet werden. Eine einzige Kontaktstelle steuert und
bearbeitet Kundenkontakte sowie Aufgaben innerhalb eines Geschäftsablaufes. Zusammen ergeben diese Kontakte
und Aufgaben die „Kundenservice-Kette“, in der Kundenanfragen oder -aufträge erledigt werden.
Marktreport VB07 Vers 1 0 (2).doc
Seite 39 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Durch die Aufteilung von Kundenabläufen in die einzelnen Bestandteile können individuelle Aufgaben gleich an den
dafür geeignetsten Bearbeiter weitergeleitet werden. Gleichzeitig können Aufgaben an Dritte weitergegeben werden,
um daraus einen größeren Geschäftsnutzen zu ziehen – seien dies niedrigere Kosten oder kürzere Bearbeitungszeiten.
Auch können Ablaufzeiten für die einzelnen Prozessschritte festgelegt und die termingerechte Verteilung der
bearbeiteten und weiterzubearbeitenden Aufgaben automatisiert werden. Sprachtechnologie ist ein integrativer
Bestandteil von „Business Process Routing“: Neben der interaktiven Anruferqualifizierung im Sprachportal kommt
Sprachverarbeitung insbesondere beim Klassifizieren eingesandter Dokumente zum Tragen, deren Inhalt mit OCR
Technologie erfasst werden muss, um das Dokument automatisiert an den richtigen Sachbearbeiter weiterleiten zu
können. Weitere Einsatzfelder für Voice im Business Process Routing wären z.B. Erinnerungsanrufe (Outbound) oder
Statusanfragen (Inbound).
Der für eine Integration des Back Offices zu treibende Aufwand lohnt: Laut Expertenansicht bietet sie den
Unternehmen das größte Geschäftspotenzial der nächsten Jahre. Medien- und Prozessbrüche in der Bearbeitung von
Kundenanliegen könnten geschlossen werden (z.B. wenn Auftragsannahme und Versand bereits optimiert sind, aber
Schwächen im Rechnungswesen bestehen). Mass-Calls würden besser steuer- und handhabbar und das Back Office
der Unternehmen letztlich transparenter und anhand tatsächlicher Geschäftsprozesse rationalisierter und höher
automatisierbar. Fachleute sprechen daher von der Industrialisierung der Verwaltung durch Wissensmanagement:
Individuelle Kontakte werden in standardisierte Verfahren überführt, Bearbeitungszeiten verkürzt und so die
Kundeninteraktionskosten signifikant gesenkt.
Das Call Center der Zukunft ist die wichtigste Schnittstelle zwischen Unternehmen und
Verbrauchern: Die Qualität des Kundenkontaktes ist die Visitenkarte des Unternehmens. Denn
in Zeiten von austauschbaren Produkten und Dienstleistungen, wie es bei Banken,
Versicherungen oder der Automobilindustrie oft der Fall ist, spielt das KundenkontaktManagement eine elementare Rolle, um sich im Wettbewerb gegen Konkurrenten
durchzusetzen.
Voice
Verkauf
Verkauf
Bestellung
Bestellung
Portal
Alerts
Presence
Skills
Universal Queue
Routing
Abwicklung
Abwicklung
Dashboards
Agent Desktop
WFM
Agent Services
Web
EMail
Chat
Contact Services
Callback
Interaction Management
CRM
MDM
ZahlungsZahlungseingang
eingang
Rechnung
Rechnung
Voice
Contact Center
ERP
Information
Web
Email
Chat
Enterprise Market, Die eCare Perspektive – The real Beast
SCM
Analytics
ODS
EDW
ECM
UIM
Search
QAM
KPIs
KM
RTA
Quelle: mind Business Consultants
© 2007 voice-community.de
Abb.: Kundenservice-Trends
Man braucht dafür die richtige Technologie, die richtige Hardware, die richtigen Applikationen
und das richtige Verständnis von der Betriebsorganisation. Wichtig sind zudem intelligente
Interfaces für den Benutzer. Hier geht es um hochkomplexe Fragen, die
Systemintegrationskompetenz, Beratungs- und Prozessleistungen erfordern. Auf der
Prozessebene, und zwar nicht nur im Verhältnis zum Kunden, sondern auch mit allen anderen
Systemen und Abteilungen im Unternehmen, die für den Kundenservice wichtig sind, wird sich
in Zukunft der Erfolg des Kundenkontakts manifestieren.
Das Call Center wird zu einer Art „Kampfstern Galactica“ und darf nicht als triviale
Managementaufgabe betrachtet werden. Es ist ein Kristallisationspunkt für die technologische
Entwicklung im gesamten Unternehmen und wird zur größten technologischen Herausforderung
der nächsten Jahre. Provokant gesagt: Das ganze Unternehmen wird zum Call Center!
Marktreport VB07 Vers 1 0 (2).doc
Seite 40 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Zugleich wird die Automatisierung des Kundenkontakts fortschreiten und sich vertiefen – mehr
Geschäftseinheiten des Unternehmens der Zukunft werden in Call Center-Prozesse integriert,
ebenso wie die Geschäftsprozesse quer durchs Unternehmen z.B. durch intelligentes Routing
zunehmend automatisiert werden. Die Geschwindigkeit des Fortschritts im Kundenkontakt hängt
somit zunehmend von der Prozessinnovation ab.
E.3 Mobile Trends: Treiber des Voice Business
Die Entwicklung im Voice-Markt der vergangenen Jahre war geprägt von der Call CenterAutomatisierung und den damit einhergehenden Problemstellungen, die neue Technologien und
eine hohe Lösungskompetenz im Anbietermarkt hervorbrachten. Innerhalb weniger Jahre wurde
so eine Lernkurve durchschritten, die die wirtschaftlich erfolgreiche Automatisierung einer
großen Bandbreite von Prozessen in den verschiedensten Anwendungsfeldern im Call CenterUmfeld ermöglichte.
Der nächste wichtige Treiber für die Weiterentwicklung der Sprachtechnologie und des Voice
Business ist der entstehende Markt für Mobile Services. Die massenhafte Vermarktung von
Mobile Services erfordert den möglichst freien Informationsabruf, die kanalübergreifende
Bereitstellung von Multimedia-Inhalten sowie kanalübergreifende Transaktionssysteme.
Schlüssel für den Erfolg von Mobile Services sind die folgenden Trends:
»
die Konvergenz von netzbasierten und im Endgerät integrierten Services
»
die ubiquitäre Verfügbarkeit von Informationen
»
das Vermögen, medienunabhängig in alle vorhandenen Kanäle zu publizieren
»
Bedienbarkeit für personalisierten Multimedia-Service und komplexe „Smart“ Phones
»
das Handy als Werbe- und Verkaufskanal im Marketing-Mix zu integrieren
Im Folgenden untersuchen wir diese Trends auf ihre Interdependenz mit der Sprachtechnologie
und leiten die Bedeutung des Mobile Business für das Voice Business ab.
Konvergenz von geräte- und netzbasierten Diensten
Der derzeit wichtigste Technologie-Trend heißt Konvergenz: Getrieben von der wachsenden
Bedeutung des mobilen Internets wird die Sprachtechnologie für unterschiedliche Einsatzzwecke
mit anderen Interaktions-Medien zusammengeführt. Spracherkennung und Sprachausgabe, ob
netzbasiert oder im Endgerät eingebaut als Bedienfunktion, soll mit grafischen
Benutzerschnittstellen sinnvoll zusammenwirken. Dafür müssen technologische Kompetenzen
aus unterschiedlichen Fachgebieten der Sprachtechnologie zusammengeführt werden, wie das
Erkennen großer Wortschätze beim Diktieren, das sinnvolle Interpretieren von Antworten auf
offene Fragen und das Suchen in einem semantischen Kontext. Erst wenn das gelingt, könnn
die Visionen der Anbieter Wirklichkeit werden und auch komplexe Such-Services wie Google ihre
Macht im Voice-Web entfalten.
Die Verarbeitung von Spracheingaben ist mittlerweile hoch konvergent. Neueste Handys bieten
eine „One Button Voice Control“: Drückt man den „Voice-Knopf“, schreibt die „embedded“
Sprachsteuerung ähnlich wie Nuance Dragon am PC direkt in den Cursor oder liest bei einem
anderen Kommando das gerade offene Display vor. Dies erleichtert zum Beispiel die Nutzung
von Messaging-Anwendungen wie eMail oder SMS: Wer eine eMail empfangen und gelesen hat,
drückt einfach den Voice-Knopf, befiehlt: „Antworten“, das Handy öffnet die Antwort-Mail, der
Cursor springt in die Adresszeile usw. usf. Oder man drückt den Voice-Knopf, öffnet mit
„Börsenkurse“ die gewünschte Applikation, nennt das Nasdaq-Kürzel der Aktie und schon
sendet der Server die Kursdaten als übersichtlichen Chart aufs Handy-Display.
Marktreport VB07 Vers 1 0 (2).doc
Seite 41 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Neuartige hybride Lösungen ermöglichen es, Sprachverarbeitung im Handy mit netzbasierten
Services zu kombinieren, um z.B. in Verzeichnissen mit Millionen Einträgen zu suchen: Dabei
wird die Spracheingabe im Handy „embedded“ erfasst, die Analyseergebnisse per Datenstream
an den Server geschickt, der die Ergebnisse der Suchabfrage an das Display des Endgerätes
sendet, wo die Ergebnisse, geordnet nach Parametern wie z.B. der Nachfrage, übersichtlich mit
den genannten Informationen aufgelistet werden. Selbstverständlich lassen sich die Einträge
dann wieder per embedded Sprachsteuerung vorlesen und auswählen, womit der Download
initiiert wird.
Auch die Bereitstellung der Mobile Contents ist von Konvergenz geprägt: Moderne VXMLPlattformen
bieten eine Dialogfähigkeit, die über den Sprachdialog hinausgeht und
Audio/Grafik/Video mit einbezieht. So genannte „Interactive Video Response Plattformen“
ermöglichen auf der Basis der Sprachplattform des Unternehmens die Verknüpfung und die
Vermarktung von Sprachsteuerung mit Audio- und Videoinhalten.
Eine Applikationslogik – viele Wege
Modulare, distribuierte Architektur
Grafisch
(PC, …)
Präsentation
ApplikationsLogik
Datenspeicher
HTML
Telefon
TCP/IP und
Web Protokolle
voiceXML
Beispiel:
Client/ServerAnwendung
Multimodal
(PDA, …)
SALT
Multimediale Nutzungen
In Anlehnung an Intel (2002)
© 2003 HC / STRATECO
Abb.: Multimedia-Access
Zugleich verfügen auch Content- und Applikationsanbieter inzwischen über Content
Management Systeme, die ihnen erlauben, ihre Inhalte nur einmal in eine
Datenbankanwendung einzupflegen, sie aber beliebig im Web, per WAP, als SMS/MMS oder als
Sprachanwendung anzubieten. Unabhängig vom Datenformat werden die nur einmal
vorgehaltenen Inhalte dann von Internetbrowsern, WAP-Browsern, Fernsehern, PDA/Smart
Phones oder TTS-Systemen verarbeitet.
Durch die zunehmende Konvergenz von Endgeräten, Diensteabruf und Contentbereitstellung,
für deren Entstehen Sprachtechnologie eine wichtige Rolle spielt, entsteht eine Infrastruktur für
die massenhafte Verbreitung von Mobile Services.
Information überall verfügbar
Ein Schlüssel für den Erfolg der neuen Internetstrategien der Mobilfunkanbieter ist die
Internetsuche. Eine effiziente Websuche auf dem Handy ist daher eine für die Mobilfunkprovider
“strategische” Applikation: T-Mobile und Vodafone sind nicht umsonst Kooperationen mit
Google respektive Yahoo eingegangen. Handango.com geht gleich einen Schritt weiter: Auf der
Handy-Tuning-Webseite des Unternehmens können Verbraucher die nutzerunabhängige
Nuance-Sprachsuche und -steuerung (One Button Voice Control) für das Handy für 6 $/Monat
als Dienst erwerben.
Marktreport VB07 Vers 1 0 (2).doc
Seite 42 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Spracherkennung in Kombination mit Text- und grafischer Eingabe (Tastatur,
Touchscreen/Maus) erlaubt die natürliche, geräteunabhängige Steuerung von Diensten und
ermöglicht eine flexiblere, schnellere Eingabe von Informationen sowie eine sichere Bedienung
von Endgeräten unabhängig von Typ und Marke. Die Ausgabe von Informationen oder
Bereitstellung von Diensten erfolgt kanalunabhängig und medienübergreifend auf jedes
beliebige Endgerät im entsprechend geeigneten Medienformat, wie z.B. als Audio, Bild, Film
oder Text. Transaktionen werden einfacher und können nahtlos über verschiedene Modalitäten
abgebildet werden. Insbesondere im mobilen Bereich entstehen durch sprachgesteuerte
multimodale Interfaces Anwendungsfelder für Mobile Dienste, die mit herkömmlichen
Nutzerinterfaces vom Verbraucher aufgrund nicht zureichender Usability vielleicht nicht
angenommen würden.
Neben der Vereinfachung des Zugangs zu Mobilen Diensten wird Sprachtechnologie zunehmend
wichtiger für die Erhebung von Daten über die Anwendungs-Performance selber. Unter dem
Stichwort “Audiomining” erheben Betreiber von Sprachanwendungen mit Sprachtechnologie die
für die Anwendungsoptimierung erforderlichen Daten.
So lassen sich die Dialoge von Sprachanwendungen durch Voice Stream Analysen gezielt
optimieren: Die im System laufend erhobenen Daten werden strukturiert in einer
Datenbankanwendung gespeichert und aufbereitet. In Verbindung mit Business Intelligence
Tools entsteht eine Senkung des Personalaufwands für Monitoring, Reporting und Tuning von
Sprachdialogsystemen von bis zu 80%, weil die strukturierte Erfassung der Dialogdaten auf der
Sprachplattform laufend Echtzeitdaten über bis zu 50 Key Performance Indikatoren liefert.
Zugleich lassen sich aus der Voice Stream Analyse auch wichtige Daten für die Entwicklung von
geeigneten Modellen für “Open Grammar” Strategien ableiten, die Sprachportale intuitiver und
schneller bedienbarer machen sollen. Hier geht es darum, dem Nutzer einen möglichst freien
Dialog mit der Anwendung zu ermöglichen. Bei Open Grammars verfolgt man den Ansatz, aus
den freien Eingaben des Nutzers auf deren Bedeutung zu schließen, indem Schlüsselworte
identifiziert werden, die Rückschlüsse auf den Bedeutungskontext liefern. Dazu werden in der
Grammatik anstatt starrer Vokabularien Bedeutungskonzepte hinterlegt, also mathematische
Modelle über die Wahrscheinlichkeit verschiedener Interpretationsmöglichkeiten der Eingabe.
Die Genauigkeit der mathematischen Modelle steigt mit der Datenqualität, die ihrer Entwicklung
zugrunde liegt. Die automatisierte Erfassung und Analyse Tausender von Gesprächen ist ein
Weg, diese Daten zu erheben und die wachsende Komplexität Mobiler Dienste durch
Sprachsteuerung verfügbar zu machen: Anstelle immer umfangreicherer Grammatiken treten
immer bessere mathematische Modelle in den Vordergrund, die dem Nutzer die intuitive
Steuerung von Diensten auch ohne lange Menus erlauben.
Sprachverarbeitung wird zum entscheidenden Faktor für den Zugang zu Informationen – für
den Verbraucher ebenso wie für den Anbieter Mobiler Services.
Medienübergreifendes Publizieren
Content- und Applikationsanbieter wollen ihre Inhalte medienneutral anbieten, damit
Endverbraucher sie unabhängig vom Zugangstool konsumieren können.
Medienübergreifendes Publizieren bietet Contentanbietern und Mobile Providern neue,
spannende Marktchancen: Einerseits eröffnen sich durch die Bereitstellung von Inhalten und
Diensten (aus einem CMS) im Sprachkanal neue Zielgruppen, die bisher nicht erreichbar waren,
weil sie z.B. das Internet gar nicht nutzen. Zum anderen werden aber auch neue Produkte und
Dienste möglich: In der Pipeline sind z.B. Handelsinformationssysteme für den „Point of Sales“,
die für jedes Produkt im Supermarkt alle Produktinformationen per Telefonnummer
sprachgesteuert verfügbar machen. Oder Anwendungen, die dem Anrufer erlauben, sich am
Telefon z.B. aus einem Webangebot die Inhalte zu einem „Podcast“ zusmmenzustellen, der
dann automatisch auf das Handy versandt und hörbar gemacht wird.
Der Sprachkanal wird dank moderner Content
medienübergreifendes Publizieren auch ins Telefon
Vertriebsweg für Content Anbieter.
Marktreport VB07 Vers 1 0 (2).doc
Seite 43 von 50
Management Systeme, die ein
erlauben, zu einem zusätzlichen
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Bessere Bedienbarkeit für personalisierte Multimedia-Service und „Smart Phones“
Viele Mobile Services scheitern bisher an der Bedienungskomplexität der modernen
Mobilfunkendgeräte, die manche Verbraucher von einer Dienstenutzung abhält oder gar
ausschließt.
Mithilfe von Spracherkennung wird die Einrichtung und Administration komplexer Dienste sowie
die Pflege von Benutzerprofilen um ein Vielfaches komfortabler als die meisten der bisher
genutzten Medien, wie Formulare, Call Center oder die Administration per Tastatur übers
Internet.
Ohne leistungsfähige und komfortable Sprachdienste werden die Netzbetreiber keine
Kundenakzeptanz für personalisierte Services erreichen und die Nutzung dieser Dienste
weiterhin auf die online-Generation und Heavy-User-Technologiefreaks begrenzen.
Technologische Trends
Ausdehnung der Anwendungsgebiete durch die Konvergenz
Quelle: Nuance
© 2007 voice-community.de
Abb.: Anwendungsgebiete für Voice
Voice ist die Klammer, die die zukünftige konvergente IP-Welt umschließt – in einer Welt
konvergenter IP-Netzwerkinfrastrukturen kann das Telefon zur konventionellen Mensch-zuMensch-Kommunikation ebenso genutzt werden wie als sprachgesteuerter Dienst oder als
Sprachsteuerung für verschiedenste Endgeräte (wie z.B. dem Fernseher oder der MovieDownload-Settopbox).
Sprachtechnologie erweitert die Steuerungsmöglichkeiten mobiler, multimodaler Dienste, bietet
einen zusätzlichen Kanal für die Datenein- und -ausgabe und ermöglicht eine nahtlose
Interaktion von Dienst und Nutzer.
Nach der Call Center-Automatisierung wird die Welt der Mobilen Dienste zum nächsten großen
Treiber für das Voice Business!
Mobile Marketing: Die “last Mile” zum Kunden
Ein anderer Mobile Trend ist Mobile Marketing. Das Handy wird zunehmend zur Schaltzentrale
für Mobile Services, für die Experten in Europa im Jahr 2008 ein Marktvolumen von 1,5 Mrd.
EUR erwarten. Davon werden etwa 60% auf Klingeltondownloads entfallen, 23% auf Spiele,
12% auf Logos und Bilder und 10% auf Mailboxansagen, Bildchirmschoner, Mobile Videos und
sonstige mobile Dienste.
Marktreport VB07 Vers 1 0 (2).doc
Seite 44 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Bereits in 2005 setzten in Westeuropa die Mobilfunkunternehmen etwa 8 Mio. EUR mit Mobile
Commerce Transaktionen um. SMS-Marketing, schon in 2005 mit 90 Mio. EUR in Europa ein
spannender Markt, soll schon in 2011 etwa ein Marktvolumen von 430 Mio. EUR bedienen.
Die zunehmende Bedeutung von Mobile Marketing für die Portefeuilles der Mobilfunker
unterstreicht auch die Agenturszene: 32% der jeweils 30 größten Werbe-, Dialogmarketing-,
Media- und Multimediaagenturen Deutschlands haben Mobile Marketing im Angebot.
Wirkliche Kompetenz für Marketing-Kampagnen im Sprachkanal jedoch gibt es erst wenig:
Einige wenige Agenturen verfügen hier über relevante Referenzen und Expertise – und
gewinnen so die Pitches.
Voice im Marketing: “Stimme deiner Stadt”
Das erste interaktive Voice Casting Deutschlands Stimme deiner Stadt von Speak Up für RTL Radio, Lübbe
Audio, McDonalds und hlx.com sucht sprachautomatisiert die erotischste Stimme Berlins − erreichbar unter 22456 in
allen deutschen Mobilfunknetzen. Dies ist die erste Mobile Premium Voice Anwendung (0,69 Cent/Min.) in
Kombination mit etablierten Medienformaten. Durch die Verlängerung des Radioformates über die Sendezeit hinaus in
den Telefonkanal schafft dieser Dienst einen innovativen Ansatz zur Kundenansprache und -bindung für Radiosender
und Werbetreibende. In der Verknüpfung von Radio, Web und Telefon sowie den integrierten Community-Elementen
geht Speak Up vollständig neue Wege. Es nutzt erstmalig in Deutschland die Handy-Kurzwahl 22456 aus allen
deutschen Mobilfunknetzen. Die auf über 200 Ports laufende Anwendung kann bis zu 20.000 Anrufe pro Tag
abwickeln, in der Praxis wurden laut Betreiber etwa 90 Prozent der tatsächlich eingehenden Anrufe fallabschließend
behandelt.
Ein weiterer Trend in der Mobilfunk-Branche ist die Personalisierung von Geräten und Diensten.
Verbraucher wollen individuelle Ring-Back-Töne ebenso wie auf sie angepasste Services. Bei der
Gerätepersonalisierung wird Voice vor allem bei der Auswahl und Durchführung von
Kauftransaktionen wie Klingeltönen etc. zum Einsatz kommen. Bei den Diensten sind die
intelligente Vorqualifizierung und die personalisierte Anpassung von Menus in Sprachportalen
das Stichwort.
Eine gewisse Bedeutung für das weitere Vordringen von Sprachanwendung haben auch die
fünfstelligen Mobilfunkkurzwahlnummern, die, noch bevor sie überhaupt flächendeckend zum
Einsatz gekommen sind, bereits vergriffen sind. Die Betreiber der Kurzwahlnummern
versprechen sich eine gute Kommunizierbarkeit und ein einfacheres Marketing für diese
Nummern und die darüber erreichbaren Dienste, was für bessere Response-Quoten sorgen
sollte. Für die Nutzer liegt ein Vorteil dieser fünfstelligen Nummern auch in der
Kostentransparenz zum Beispiel gegenüber 0900er-Nummern im Festnetz. Trotz dieser
günstigen Randbedingungen werden diese Kurzwahlnummern bisher noch nicht zur
Zufriedenheit der Provider auch genutzt – sicher besteht hier ein Zusammenhang zwischen dem
Nutzungskomfort dieser Dienste und ihrer Nutzungsfrequenz:
Viele Mobile Services scheitern schlicht an der Bedienungskomplexität der modernen
Mobilfunkendgeräte, die manche Verbraucher von einer Nutzung abhält oder gar ausschließt.
Mithilfe von Spracherkennung würde die Einrichtung und Administration komplexer Dienste
sowie die Pflege von Benutzerprofilen um ein Vielfaches komfortabler als die meisten der bisher
genutzten Medien, wie Formulare, Call Center oder die Administration per Tastatur übers
Internet.
Marktreport VB07 Vers 1 0 (2).doc
Seite 45 von 50
Nr. 1002306
MARKTREPORT
E.4
© Mind | STRATECO
Voice Business 2007
„On demand“-Services
Telefongesellschaften und Service Provider profitieren mit am meisten von den
Kostensenkungspotenzialen im Customer Care beim Einsatz von Sprachapplikationen. Zudem
bieten sich ihnen durch sprachaktivierte Mehrwertdienste Möglichkeiten, profitable Last auf das
Netz zu holen, das heißt, gleichzeitig eine Steigerung des „Average Revenue per User“ (ARPU)
und eine Senkung der Anzahl der „Uncompleted Calls“ zu erzielen. Schließlich bietet ihnen das
Prozess Outsourcing im Großkundengeschäft interessante Perspektiven.3
Aus Sicht der Service Provider gibt es somit drei Kerngeschäftsfelder:
»
Den Massenmarkt mit eigenen Services zu bedienen,
»
Business-Kunden zu helfen, Mehrwerte über vorkonfigurierte Standard-Lösungen zu nutzen
sowie
»
als Prozess Outsourcer Umsätze (im Großkundengeschäft) zu generieren.
Die Service Provider Perspektive
Geschäftsfelder im Voice Business
Massenmarkt
Unternehmen
•
Nachrichten &
Entertainment
•
Sales & Customer
Care Lösungen
•
Interaktive Dienste &
Home Shopping
•
(Micro) Content Payment
•
Media Interactive
•
Smart Communication
& Messaging-Dienste
•
Auskunfts- & Vermittlungsdienste
•
Netzzentrische
Anwendungen für
Millionen
ASP/Outsourcing
•
Platform Hosting
•
Managed Services
•
Application
Development
•
Eine Plattform,
viele Dienste
( Audiotex-Dienste)
•
Konfigurierbare
Standard-Lösungen
f. B2B2C
Quelle: Marktstudie „Sprachapplikationen auf dem Prüfstand, Mind/Strateco 2003
© 2007 voice-community.de
Abb.: Service Provider Geschäft
Im folgenden Abschnitt untersuchen wir diese drei Szenarien im Hinblick auf Ihre Bedeutung für
die Entwicklung des Voice Business im Service Provider Markt in Deutschland.
Mehrwertdienste: Viel Potenzial im Massenmarkt?
Es liegt noch nicht lange zurück, da gaben die Mobilfunkprovider in der Hoffnung, auf dieser
Infrastruktur mit Mehrwertdiensten einen Massenmarkt aufbauen zu können, Milliarden Euro für
UMTS-Lizenzen aus.
Nachdem sich der Markt für Mehrwertdienste inzwischen als deutlich weniger dynamisch und
profitabel für die Mobilfunkprovider erwiesen hat als erwartet, gehen die Anbieter nun den Weg,
Mehrwertdienste in Self Service Angebote für ihre Kundschaft zu integrieren und so das
Umsatzpotenzial des Voice User Interfaces für eine neue Generation an Mehrwertdiensten zu
nutzen.
3
Die Telekomkonzerne betreiben die größten Call Center in Europa und sind auch die wichtigsten Kunden der großen
Call Center-Outsourcer
Marktreport VB07 Vers 1 0 (2).doc
Seite 46 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Diese Strategie fußt auf der Einsicht, dass nur solche Dienste eine Chance im Markt haben, die
aus Endkundensicht einen hohen Nutzwert bieten, der sich auch messen lässt und zudem klar
kommunizierbar ist. Da Self Service Angebote einen hohen Nutzwert bieten und von den
Verbrauchern eher angenommen werden, bietet die Integration von Mehrwertdiensten in die
Self Service Applikation echte Chancen, die Kunden auch für die Nutzung kostenpflichtiger
Mehrwertdienste zu interessieren.
Das wird positive Auswirkungen auch für Anbieter im Voice Business zeitigen, wie wir schon im
Testbericht VOICE Award 2006 [3] prognostizierten:
„Netzintegrierte Sprachapplikationen ermöglichen eine komfortable, endgeräteunabhängige Nutzung von neuen Mehrwertdiensten und Inhalten. Mehrwertdienste
stehen damit als Trägerdienste mit flexiblen Abrechnungsprozessen für verschiedenste
Anwendungen zur Verfügung. Auch als Voice Gateway zu Web-Informationen haben
Sprachapplikationen Potenzial, sofern die richtige Verknüpfung zu anderen
Mehrwertdiensten gefunden wird. Zudem ist ein Voice Portal als Plattform für Dritte
nutzbar; bestehende Inhalte können hierüber mehrfach und cross-medial vermarktet
werden.“
Fallbeispiele aus dem Diensteangebot der Service Provider:
Der unter der Kurzwahl 1414 aus dem Netz des Mobilfunkanbieters erreichbare O2 Tarifmanager bietet
Vertragskunden umfangreiche Möglichkeiten, Änderungen an ihren Tarifen vorzunehmen. Der Tarifmanager ist per
Sprache, alternativ auch über die Tastatur des Telefons steuerbar. Für einen Wechsel der Homezone kann sich der
Kunde wahlweise an seinem derzeitigen Aufenthaltsort lokalisieren lassen und erhält so die nächste Adresse
mitgeteilt, an der Genion verfügbar ist. Die gewünschte Adresse kann auch per Sprache eingegeben werden. Weitere
Services des O2 Tarifmanagers sind Optionswechsel- und Taktungswechsel-Aktivierung und die Änderung von
Servicepacks (wie SMS Pack, Surf & Email Pack, Data-Packs,..), der Fax und Daten-Option, des Tonindikators sowie
der UMTS Option.
Kunden von E-Plus konnten mit „Holiday Special 2006" günstige Roaming-Konditionen für ihre Reisen in Europa
freischalten lassen. Gleichzeitig dient diese Anwendung als Marketing-Kampagne von E-Plus. Wer will, kann Freunde
und Bekannte auf den Dienst aufmerksam machen, die dann per SMS benachrichtigt werden. Dies erfolgt
automatisch, ohne Einbindung von Agenten. Die Klangwelt in den Audios wurde speziell an das Thema „SummerFeeling“ angepasst und die unterlegte Musik eigens für diese Promotion erstellt. Insgesamt ist die Anwendung für den
Anwender intuitiv zu verstehen und die Registrierung bereitet dank der Verbundwort-Erkennung keine Probleme –
Fallabschlussraten von über 75% sprechen für sich. Leider lassen sich die Systemansagen nicht unterbrechen, man
muss mit dem Sprechen warten, bis das System eine Ja/Nein-Frage gestellt und den Benutzer aufgefordert hat, bitte
„Ja“ oder „Nein“ zu sagen, oder die Unterbrechung der Hintergrundmusik anzeigt, dass man sprechen kann.
Das Voice Business entwickelt sich zur „enabling Technology“ für Mehrwertdienste, die
zunehmend in Self Service Angebote integriert werden, da erst durch Sprachsteuerung eine
komfortable, endgeräteunabhängige Nutzung von neuen Mehrwertdiensten und Inhalten für
viele Verbraucher möglich wird.
Standardanwendungen: Mischen sie den Voice Markt auf?
Im Geschäftskundenumfeld setzen die Service Provider auch auf die Vermarktung von
Standardanwendungen, die sie auf ihren Voice Plattformen hosten und den Geschäftskunden
als Managed Services zur Verfügung stellen. Laut dem Branchenbarometer 2006 der VOICE
Community erwarten 60% der befragten Profis aus der Voice Branche, dass
Standardanwendungen im kommenden Jahr die für die Marktentwicklung bedeutsamste
Innovation sein werden – Standardanwendungen stehen „in den Startlöchern“, auch wenn es
im Markt und bei den Interessenten oft noch nicht hinreichend bekannt ist.
Es gibt mittlerweile ein zunehmendes Angebot von Standardanwendungen oder „Baukästen“ für
Sprachdialogsysteme, die die Zusammenstellung einfacher, aber auch hochkomplexer
Anwendungen aus einer Kombination verschiedener Module ermöglichen und mit dazu
beitragen, dass Unternehmen heute kostengünstiger an robustere Sprachanwendungen
kommen als je zuvor. Daneben gibt es auch erste „richtige“ Standardanwendungen, die
Hosting-Anbieter und Anwendungsentwickler ihren Kunden als „Fertig-Produkte“ anbieten.
Marktreport VB07 Vers 1 0 (2).doc
Seite 47 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
Hintergrundwissen: Voice Module – der Baukasten für Sprachanwendungen?
Die meisten Sprachanwendungen wickeln Prozesse oder Business-Logiken ab, die auch an anderer Stelle zum Einsatz
kommen: So fragen sie Postleitzahlen ab, nehmen Kontonummern auf oder erfassen Straßennamen. Diese Prozesse
werden von Modulen innerhalb des Gesamtsystems durchgeführt, die die Grammatik, die Prompts und die
Dialogführung für den behandelten Prozess beinhalten und so in eine Anwendung integriert werden, wie sie das
betreibende Unternehmen benötigt. Für den Anrufer auf einem solchen System ist nicht zu erkennen, dass er in einer
bestimmten Dialogphase ein eigenständiges Modul bedient; er empfindet die Anwendung als monolitisch.
Eine Wiederverwendung von Anwendungsmodulen, die für eine bestimmte Aufgabe entwickelt wurden, trägt natürlich
dazu bei, dass das „Rad nicht immer wieder neu erfunden“ werden muss, sie spart Entwicklungsaufwand und Kosten
und schafft einen höheren Reifegrad und eine robustere Performance, da bereits entwickelte und im Betrieb
optimierte Module den Debugging-Aufwand reduzieren und entsprechend höhere Betriebssicherheit bieten.
Es gibt aber auch sogenannte „packaged Applications“, die durchaus auch aus den beschriebenen Modulen bestehen
können, aber typischerweise weitere Eigenschaften haben wie Plattformunabhängigkeit, Konfigurationsmöglichkeiten,
Standardkompatibilität und die das gesamte Voice User Interface beinhalten.
Carrier, TelCos oder IT Services-Anbieter können mit Standardanwendungen neue Zielgruppen
ansprechen und ihre Voice Plattformen besser auslasten, ohne sich hohe Administrations- und
Implementierungsaufwand „aufzuhalsen“, da Standardanwendungen vorkonfiguriert und vom
Kunden selber administriert werden. Attraktive Geschäftsmodelle entstehen aus der Kopplung
der Vermarktung des Services (durch Einmalzahlungen und monatliche Grundgebühren)
einerseits und des dadurch entstehenden Traffics an Telefonminuten (pay-per-use)
andererseits.
Hintergrundwissen: Standardanwendungen bei Service Providern
Genesys bietet Carriern, die Standard-Sprachanwendungen vermarkten wollen, mit ihrem Genesys Customer
Interaction Portal (GCIP) die dazu geeignete Plattform an. Das Unternehmen behauptet, dass mit dem GCIP
Carrier, TelCos oder Großunternehmen kostengünstig einfache, standardisierte Sprachanwendungen auch für kleinere
und mittlere Anrufvolumina bereitstellen können. Auf Basis von Templates, die einzelnen Sprachmodulen entsprechen,
und Rollen, die die Zusammenstellung der Templates und deren Bedienung definieren, können verschiedenste
Prozesse sprachautomatisiert werden. Die Bedienung des GCIP erfolge (auf Anbieter- wie Nutzerseite) per Browser im
Web. Besonders attraktiv für Carrier sind laut Gennesys die operationellen Freiheitsgrade des GCIP und die frei
definierbaren Pricing-Modelle: Möglich sei zum Beispiel die kostenlose Bereitstellung des Portals bei Berechnung des
Traffics, eine monatliche „Subscription Fee“ oder die paketierte Berechnung. Auch ein „Feature Based Pricing“, das
Templates (Vermittlung, Umfrage etc.) oder Funktionalitäten (TTS, Barge-In, etc.) berechnet, ist wie eventbasiertes
Pricing abbildbar. Interessant wird das GCIP für Unternehmen aus dem Carrierumfeld, weil es erlaubt, sehr viele
Anwendungen zu hosten, ohne deren Administration mit leisten (und berechnen) zu müssen. Ist eine Anwendung für
einen Kunden erst einmal kostengünstig per Webbrowser auf der Plattform eingerichtet, kann er die weitere
Administration seiner Anwendung auf einer passwortgeschützten Seite selber vornehmen.
T-Com, mit über 3.600 auf dem Voice Web Portal installierten Ports Betreiber einer der großen Voice Plattformen in
Deutschland, bietet seit Januar 2007 zwei Standardanwendungen an, den „Voice Navigator“ und das „Customer
Feedback“. Mit dem Voice Navigator können Unternehmen alle eingehenden Anrufe schon im Netz vorselektieren und
Kunden trotz einer Vielzahl verschiedener Anliegen immer direkt mit dem richtigen Ansprechpartner verbinden. Über
einen Webbrowser steuert das Unternehmen den Sprachdialog flexibel im Netz und kann auch auf unerwartete
Veränderungen im Haus kurzfristig reagieren. Mit dem Customer Feedback können Unternehmen im Internet ihren
individuellen Sprachdialog zur Ermittlung der Kundenzufriedenheit über eine leicht bedienbare Oberfläche erstellen
und ihre Anrufer nach dem Gespräch mit einem Mitarbeiter automatisiert zu ihrer Kundenzufriedenheit befragen. Call
Centern bietet diese Anwendung eine kostengünstige Möglichkeit, ad hoc-Qualitätssicherung zu betreiben und
dadurch sowohl den Kundenservice zu verbessern als auch dem Auftraggeber jederzeit Statistiken über die Call
Center Performance zur Verfügung stellen zu können. Beide Dienste werden für eine einmalige Einrichtungsgebühr
aufgesetzt, danach fallen eine monatliche Grundgebühr plus handelsübliche Minutenpreise für die entstehenden
Anrufvolumina an.
Ein breites Angebot an Standardanwendungen kann dem Markt für Sprachanwendungen eine
neue Dimension eröffnen – Sprachanwendungen werden für eine Vielzahl von Unternehmen
oder Unternehmenseinheiten attraktiv, die bisher Entwicklungskosten, den Aufbau von
Betriebskompetenz und die laufende Wartung/Administrierung von Inhouse- oder individuellen
Hostinglösungen scheuen. Auch für Unternehmen mit kleineren und mittleren Anruferzahlen
kommt so eine Sprachautomatisierung wirtschaftlich in Betracht.
Die Betreiber laststarker Systeme profitieren von der hohen Skalierbarkeit (z.B. auf den 3.600
Ports des T-Com-Angebots). Sie erschließen sich neue Geschäftsmodelle und neue Zielgruppen.
Alle Kunden werden die hohe Betriebssicherheit und schnelle Time-to-Market dieser
Standardanwendungen schätzen.
Marktreport VB07 Vers 1 0 (2).doc
Seite 48 von 50
Nr. 1002306
MARKTREPORT
© Mind | STRATECO
Voice Business 2007
Wenn Applikationsentwickler zudem weitere attraktive Standardanwendungen wie LocationFinder, Vermittlungszentralen oder Bestelldienste schaffen, wird auf Basis flexibler PricingModelle schnell eine relevante Marktnachfrage für einfache, vorgefertigte Sprachdienste
entstehen. Der Sprachcomputer, heute vielfach noch eine Spezialanfertigung, wird dann zum
industriell multiplizierbaren Produkt ähnlich einer Virenschutzsoftware oder einem CRM-System.
ASP und Outsourcing: Chancen im Solution-Geschäft
Die Service Provider verfügen über eine einzigartige Marktstellung, um für
Unternehmenskunden komplette Kundeninteraktionsprozesse „End-to-End“ auszusourcen. So
können Anbeiter wie T-Com oder D+S ihren Kunden heute das Outsourcing der kompletten
Prozesskette anbieten.
Dieses Kundenkontaktprozess-Outsourcing beginnt mit der Zuweisung einer Servicerufnummer,
die bundesweit alle das Unternehmen betreffenden Anrufe unter einer Nummer bündelt. Durch
die Abwicklung dieser Anrufe im Intelligenten Netz können die Anrufe schon im Netz intelligent
geroutet werden – nach Bedarf zu bestimmten Call Centern, aber auch in Sprachportale und
lokale ACD-Systeme, die eine weitere Vorqualifizierung des Anrufes leisten und die
ensprechende Weiterleitung an das zuvor definierte Ziel auslösen. Dort werden auf
Kundenwunsch die Anrufe (wahlweise per Sprachportal oder Agentenkontakt) angenommen
und das Anliegen des Anrufers erfüllt, wobei die Integration des Sprachportals/Call Centers in
die Backend-Prozesse des Kunden ermöglicht, zum Beispiel einen Warenversand auszulösen
oder eine Tarifänderung direkt in den Systemen des Kunden vorzunehmen und die Kosten dafür
direkt im Billing des Kunden zu verbuchen.
Die Service Provider Perspektive
Beispiel: Sale & Customer Care Solutions
Agent
Agent
Service
Service
Anrufer
Anrufer
wählt
wählt
Service
Service Ruf-Nr
Ruf-Nr
Intelligentes
Intelligentes
Netz
Netz
VorVorQualifizierQualifizierung
ung
Anliegen
Anliegen
Routing
Routing
Assisted
Assisted
Service
Service
Abrechnung
Abrechnung
der
der
Leistung
Leistung
Self
Self
Service
Service
© 2007 voice-community.de
Abb.: Sales- und Customer Care Solutions
Die Service Provider verfügen über eine einzigartige Marktstellung, um für
Unternehmenskunden komplette Kundeninteraktionsprozesse „End-to-End“ auszulagern. Mit
Business Process Outsourcing Services positionieren sie sich heute schon als die
Kundenkontaktservice-Outsourcer der Zukunft und treten in direkte Konkurrenz mit Call Centern
„alter Schule“: Aufgrund ihrer Nähe zu den Intelligenten Netzen, ihrer Erfahrung im Handling
und der Automatisierung von Massenkundenkontakten und ihrer Prozesskompetenz
insbesondere auch in der Anbindung disparater Backend-Systeme sind sie ideal aufgestellt,
durch die Übernahme geschlossener Prozessketten neue Märkte für sich zu schaffen.
Marktreport VB07 Vers 1 0 (2).doc
Seite 49 von 50
Nr. 1002306
MARKTREPORT
Voice Business 2007
© Mind | STRATECO
E.5 Voice Business 2.0
Der Einsatz von sprachverarbeitenden Systemen wird in den kommenden Jahren weiter
zunehmen. David Nahamoo, Department Group Manager und Chief Strategist Voice, IBM
Research, sagte im Interview mit der VOICE Community:
„In 10 Jahren werden wir Sprachtechnologie unbewusst einsetzen. Sie wird uns zur
zweiten Natur, und zwar so weit, dass in 10 Jahren alle Geräte ein sprachgesteuertes
Nutzerinterface haben werden, wir die Nutzung dieser Schnittstelle jedoch von der
Umgebung abhängig machen: So würde ich z.B. in einem Konferenzraum keine Notizen
mit der Sprachschnittstelle machen. Auf der anderen Seite könnte ich, das
Einverständnis meines Gesprächspartners vorausgesetzt, Unterhaltungen aufzeichnen
und automatisch transkribieren lassen, so dass ich später jederzeit Details dieser
Diskussionen recherchieren könnte. Auch meine Interaktion im Auto wird zukünftig
definitiv automatisierter sein als heute - wir werden Sprachsteuerung nutzen für
Navigation, für die Kommunikation im Autor wie z.B. Downloads von E-Mails und
natürlich zur Auswahl der Musik, die wir hören wollen. Zuhause könnte ich mir
vorstellen, beim Abendessen zum Beispiel das sprachgesteuerte Lexikon aufzuschlagen
und einen strittigen Begriff sofort zu klären.“
Das alles ist noch Zukunftsmusik. Welche Trends Sie bis 2010 erwarten dürfen, beschreiben wir
im folgenden Abschnitt.
Der Sprachkanal im neuen Kleid
Ein Zukunftstrend, der sich bereits abzeichnet, ist sicherlich die Industrialisierung des
Dienstleistungssektors:
Personalisierte, telefonische Self Services werden für die kommunikationsintensiven Branchen
zum wichtigsten Kundenkontaktkanal. Hier bietet sich den Unternehmen laut Expertenansicht
das größte Geschäftspotenzial der nächsten Jahre: Medien- und Prozessbrüche in der
Bearbeitung von Kundenanliegen können geschlossen werden (z.B. wenn Auftragsannahme und
Versand bereits optimiert sind, aber Schwächen im Rechnungswesen bestehen). Mass-Calls
werden besser steuer- und handhabbar und letztlich wird das Back Office der Unternehmen
transparenter und lässt sich anhand der tatsächlichen Geschäftsprozesse rationalisieren und
automatisieren.
Fachleute
sprechen
daher
von
der
Industrialisierung
der
Verwaltung
durch
Wissensmanagement: Individuelle Kontakte werden in standardisierte Verfahren überführt,
Bearbeitungszeiten verkürzt und so die Kundeninteraktionskosten signifikant gesenkt. In vielen
Industriebereichen liegt das Verhältnis von Front- und Back Office-Personal bei 1:3 oder sogar
höher. Jeder Leser kann sich selber ausmalen, welche Verbesserungen der Produktivität und
Einsparungen bei den Personalkosten möglich wären, wenn die Effizienz und Beständigkeit von
Kundenabläufen im Back Office genauso hoch wäre wie im Contact Center.
Ein anderer Zukunftstrend, der schon sichtbar ist, ist die Sprachsteuerung für multimediale und
multimodale Telefonbedienung. Integrierte Kommunikationsdienste (Unified Communications)
als dritte Generation von Telefondiensten werden auf der Sprachsteuerung als wesentlicher
Benutzerschnittstelle aufbauen.
Im Bereich Mobile Services zeigt sich die Zukunft in den aktuellen Content Management
Systemen, die das medienübergreifende Publizieren in alle Kanäle von Print über Web bis
Sprache ermöglichen. Content Anbieter können so neue interaktive Kundenkanäle erschließen
und neue Absatzwege für ihre Inhalte schaffen.
Schließlich darf damit gerechnet werden, dass nach dem großen Erfolg der Internet Service
Provider mit dem Web Hosting nun das Voice Hosting als Geschäftsmodell der
Telefongesellschaften den Festnetz-Diensten neue Impulse geben werden.
Marktreport VB07 Vers 1 0 (2).doc
Seite 50 von 50
Nr. 1002306
m|i|n|d BUSINESS CONSULTANTS
STRATECO GMBH & CO. KG
Gesellschaft für strategisches
Consulting
Düsseldorfer Strasse 25a
40545 Düsseldorf
Kaiser-Friedrich-Promenade 45
61348 Bad Homburg v. d. Höhe
Fon: +49 (0) 211 98 96 95 - 70
Fax: +49 (0) 211 98 96 95 - 55
Fon: +49 (0) 6172 9959 - 500
Fax: +49 (0) 6172 9959 - 599
www.mind-consult.net
www.strateco.de
Copyright 2007, mind Business Consultants
Alle Rechte vorbehalten. Kein Teil dieser Studie darf in irgendeiner Form (Druck, Fotokopie oder einem anderen
Verfahren) ohne schriftliche Genehmigung von Bernhard Steimel, mind Business Consultants, reproduziert oder unter
Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.
Herunterladen