Sprachsteuerung, Spracherkennung, Justiz, Gesundheit, Sicherheit
Wirtschaft/Technologie/Sprachautomatisierung
Von NeueNachricht veröffentlicht am 23/09/2009 - Keine Kommentare
NeueNachricht: Gibt es wirklich Neues zur Sprachsteuerung zu berichten, oder ist das Thema mit seinen technischen Möglichkeiten weitestgehend ausgeschöpft?
Michael Bommer: Sprachsteuerung ist auf dem Vormarsch, von Stillstand kann keine Rede sein. Zum Beispiel findet sich im Gesundheitswesen mittlerweile einer der hauptsächlichen Treiber für die Innovation von Sprachtechnologie. Heute hat ein Radiologe in Deutschland eine sprecherabhängige Transkriptionssoftware, die zu 100 Prozent verfügbar ist. Anstatt selbst einen Bericht oder Text zu schreiben, kann er mit seinem Gerät sprechen. Dieses transkribiert die Aussagen in einen Bericht. Damit steht sofort ein digitales Word-Dokument zur Verfügung, das per Sprachsteuerung direkt an einen Server geschickt werden kann. Wir haben hierbei Erkennungsraten von fast 100 Prozent, da die Transkriptionssoftware auf den Benutzer trainiert ist. In Norwegen hat das dazu geführt, dass das gesamte klinische Personal auf dem Rechner ein Transkriptionswerkzeug zur Verfügung hat. Mittlerweile ist die medizinische Transkription der größte Einzelgeschäftsbereich von Nuance. In Amerika wird unsere Transkription in rund 3000 Kliniken eingesetzt und von etwa 400.000 Ärzten und klinischem Personal verwendet. Das ist einer der größten Geschäftsbereiche von Nuance, mit dem wir vergangenes Jahr 350 Millionen Dollar Umsatz gemacht haben. In diesem Jahr werden wir wohl die 400 Millionen Dollar-Grenze durchbrechen.
NeueNachricht: Und was ist aus den langangekündigten Projekten der Justiz geworden? Wird dort mittlerweile Transkriptionssoftware eingesetzt?
Bommer: Es gibt mehrere Justizministerien, die landesweit Projekte umsetzen oder schon umgesetzt haben. Ministerien in Hessen und Baden-Württemberg haben Lizenzen für ihre Richter oder Staatsanwälte erstanden. In Nordrhein-Westfalen haben wir gerade ein Pilotprojekt mit 600 Arbeitsplätzen ausgerollt, wo man standardisiert Transkriptionssoftware einsetzt. Dort erwartet man zwei Effekte: Zum Einen möchte man natürlich Zeit sparen. Wenn etwas geschrieben wird, dauert es im Gericht teilweise Tage oder Wochen, bis eine Transkription mit der zugehörigen Akte bei einer Assistentin ankommt. Sie schreibt es ab, vergleicht es mit den Akten. Bis es an seinem Bestimmungsort ankommt, dauert es. Das kann man mit einer sofortigen Transkription wesentlich verkürzen. Man hat aber auch erkannt, dass Richter und Staatsanwälte davon profitieren, wenn sie die Transkription gleich selber durchführen und Korrekturen im eigenen Dokument einpflegen. Ein Richter bearbeitet gleichzeitig mehrere Hundert Fälle. Wenn er das Dokument nach mehreren Wochen zurückerhält, ist die Einarbeitung in den Fall ein erheblicher Zeitfaktor.
NeueNachricht: Das ist bestimmt auch ein Thema für behinderte Menschen. Wie realistisch ist der Einsatz von Spracherkennung für sie am Arbeitsplatz?
Bommer: Laut Informationen der Polizei arbeiten dort etwa 9800 schwer behinderte Mitarbeiter. Die Polizeigewerkschaft ist nicht wirklich zufrieden, wie mit diesen Mitarbeitern umgegangen wird. Oftmals ist es so, dass jemand komplett aus dem Prozess herausgenommen wird, wenn er eine stärkere Behinderung bekommt. Das ist nicht sinnvoll. Wenn ein Mensch durch eine Behinderung nicht mehr schreiben kann, sind sein Geist und seine Fähigkeit zu sprechen, geblieben. Die Parkinson-Krankheit ist ein typisches Beispiel. Ein Professor aus Freiburg berichtete auf einer Nuance Veranstaltung zum Beispiel, wie er trotz seiner Parkinson Krankheit und der Tatsache, dass er nicht mehr tippen kann, weiterhin Texte veröffentlichen kann. Dies war immer ein wesentlicher Bestandteil seiner Arbeit. .Veröffentlichungen erledigt er nun komplett über seine Sprachfähigkeit, da diese von Parkinson nicht in Mitleidenschaft gezogen ist. Behinderten Menschen zu gewährleisten, im Arbeitsprozess einsetzbar zu sein, wird in Deutschland immer stärker diskutiert. Ein wichtiges Thema, auch für uns.
NeueNachricht: Und wie sieht es mit der Sprachbiometrie aus?. Zunächst wurde der fälschungssichere digitale Fingerabdruck bejubelt, jetzt soll die Stimme noch sicherer sein.
Bommer: Für einen wirklich fälschungssichern Fingerabdruck wird ein sehr hochwertiges Lesegerät benötigt. Bei den einfachen Lesegeräten, wie sie in den PCs zu finden sind, benötigt man lediglich einen Wachsabdruck des Daumens, um das Gerät auszutricksen. Davon abgesehen ist es unheimlich aufwändig, überall dort, wo eine Autorisierung gebraucht wird, die Geräte anzubringen. Ein einfaches Beispiel: Angenommen, ein Arzt möchte von zu Hause, aus dem Büro oder an irgendeinem anderen Ort arbeiten. Man müsste an allen Stellen einen sicheren Zugang gestalten, was irgendwann einfach zu teuer wird. Der Vorteil der stimmbasierten Identifikation ist, dass sie sich überall und jederzeit per Telefon autorisieren können. Es geht also nicht nur um die Fälschungssicherheit, sondern auch um den einfachen Zugang zu Daten.
NeueNachricht: Der Datenschutzbeauftragte klagt, dass jeder Bundesbürger durchschnittlich 12 PINs, TANs und Passwörtern sein Eigen nennt und sich diese oft notiert, weil es anders nicht zu handhaben ist. Wie möchte man das mit Sprachbiometrie lösen?
Bommer: Beim elektronischen Personalausweis geht das System davon aus, dass sich der Ausweis und die dazu gehörige sechsstellige Nummer bei mir befinden, und es deshalb sicher sei. Und genau das ist das große Problem. Wir haben es vergangenes Jahr erlebt, dass in Call Centern von dem dortigen Personal Sicherheitsfragen mitgeschrieben wurden. Sobald eine Person in dem Authentifizierungs-Prozess involviert ist, entsteht eine potentielle Unsicherheit. Genau dort setzt Sprachbiometrie an, denn sie erkennt sowohl den Inhalt als auch, wer es gesprochen hat. Das bedeutet also eine mehrstufige biometrische Sicherheit, weil es individuelles Wissen mit der Stimmauthentifizierung verbindet. Es wird also geprüft, ob das angewandte Wissen mit der konkreten Person verbunden ist. Die Kombination von Spracherkennung und Sprachbiometrie ist also ein mehrstufiges Authentifizierungsverfahren.
NeueNachricht: Sprachdialogsysteme genießen keinen guten Ruf. War man in der Vergangenheit zu ambitioniert?
Bommer: Ich denke, dass man nicht zu ambitioniert, sondern zu taktisch war. Man hat eine Automatisierungsmöglichkeit gefunden und versucht, sie sehr schnell umzusetzen. Wichtig ist, dass man Self Service im Gesamtzusammenhang betrachten muss und nicht nur die reine Sprachapplikation. Die Frage ist, wo administriert der Kunde selbst, und wo wird er administriert. Wenn er es selbst tut, gibt es drei Komponenten: Den sprachgesteuerten, den webgesteuerten und in der Zukunft immer mehr den Device-Self Service. Man muss insgesamt viel strategischer über Self Service nachdenken und diese drei Komponenten miteinander verbinden. Ohne Anpassung und Integrierung wird kein optimales Ergebnis erzielt. Die sprachgesteuerte Selbstbedienung ist kein leichtes Unterfangen. Im ersten Schritt muss die Kundenfrage, also der Wunsch, schnell und klar identifiziert werden. Wenn dann die Identifikation des Kunden selbst stattgefunden hat, kann man mit dem eigentlichen Kundenwunsch klar umgehen.
Bisher hat niemand diese Seite kommentiert.
RSS Feed für die Kommentare auf dieser Seite | RSS feed für alle Kommentare