Aktuelles

Hochschule Niederrhein. Dein Weg.

BMBF gefördertes Projekt zur robusten Spracherkennung

Im Rahmen eines von Prof. Dr. Hirsch geleiteten Projekts sollen Spracherkennungssysteme verbessert werden, indem verschiedene Ansätze zur Erhöhung der Robustheit kombiniert werden.

Die Leistungsfähigkeit heutiger Systeme zur automatischen Spracherkennung ist immer noch deutlich niedriger als die des Menschen. Einer der Hauptgründe ist eine hohe Empfindlichkeit der Erkennungssysteme gegenüber den akustischen Bedingungen bei der Spracheingabe. Beispielsweise verschlechtert das Vorhandensein von Hintergrundstörungen oder eine Spracheingabe im Freisprechmodus in einer räumlichen Umgebung die Erkennungsraten meist deutlich. Es gibt eine Vielzahl von Ansätzen, um die Erkennung in gestörten Umgebungen zu verbessern. Zwei grundsätzliche Ansätze bestehen in einer Bestimmung robuster akustischer Merkmale sowie einer Adaption der Referenzmuster auf die jeweilige Störsituation. In verschiedenen Untersuchungen konnte gezeigt werden, dass die Anwendung jedes der beiden Ansätze in einem einzelnen System zu einer Steigerung der Erkennungsrate führt.

Das Ziel des Projekts ist die Kombination der bisher getrennt betrachteten Ansätze zur Verbesserung der Leistungsfähigkeit eines Erkennungssystems, in dem beide Ansätze integriert werden. Für die Untersuchungen werden Störeinflüsse betrachtet, die sich an den Störbedingungen in konkreten Anwendungssituationen orientieren. So werden Spracheingaben im Freisprechmodus in einem fahrenden Kraftfahrzeug, wie sie beispielsweise zur Steuerung eines Navigationssystems oder eines Telefons benötigt werden, und Spracheingaben im Freisprechmodus in einer räumlichen Umgebung, wie sie zur Steuerung elektronischer Geräte im Wohnzimmer benötigt werden, betrachtet.

Projekt: Robuste Spracherkennung in gestörter Umgebung durch die Kombination einer robusten Merkmalsextraktion und einer Adaption der Referenzmuster

Leitung: Prof. Dr. Hans-Günter Hirsch