Schattenblick →INFOPOOL →NATURWISSENSCHAFTEN → TECHNIK

INFORMATIONSTECHNOLOGIE/614: Sprachtechnologie - TV-Sendungen werden automatisch zu Text und durchsuchbar (idw)


European Media Laboratory GmbH - 27.10.2009

Sprachtechnologie: TV-Sendungen werden automatisch zu Text und durchsuchbar

Kooperation zwischen Bayerischem Rundfunk und European Media Laboratory - Automatische Verschriftung von Sendungen des "BR-Alpha Forums"


Heidelberg/München. Die automatische Umwandlung von gesprochener Sprache in Text, die Transkription, hat in den letzten Jahren große Fortschritte erzielt. Gründe dafür liegen in den kontinuierlich verbesserten Erkennungsalgorithmen, der wachsenden Rechnerleistung und der Möglichkeit, riesige Datenmengen zu verarbeiten. So haben beispielsweise die Sprachtechnologen des European Media Laboratory (EML) ein Transkriptionssystem entwickelt, mit dem Fernsehsendungen automatisch verschriftet werden können. Um dieses System aber auch in der Praxis nutzen zu können, muss es auf den jeweiligen Bereich, die sogenannte Sprachdomäne, angepasst werden.

In einem neuen Projekt gemeinsam mit dem Bayerischen Rundfunk (BR) wird das Transkriptionssystem an die Sendung "BR Alpha Forum" angepasst. "BR Alpha Forum" ist eine tägliche Sendung, in der Persönlichkeiten aus Politik und Wirtschaft, Wissenschaft und Gesellschaft, Religion und Kultur in 45 Minuten ausführlich zu Wort kommen. Im Forschungsprojekt wird das Transkriptionssystem mit bereits ausgestrahlten Sendungen von BR Alpha Forum gefüttert. Es "lernt" wie ein Schüler anhand der Manuskripte das Vokabular, das in dieser Sendung verwendet wird. Außerdem "hört" es den Sprechern genau zu und trainiert so die akustische Spracherkennung.

"Es handelt sich hier nicht um Künstliche Intelligenz, sondern um intelligente Sprachtechnologie", erklärt EML-Forschungs- und Entwicklungsleiter Dr. Siegfried Kunzmann. "Wir trainieren die Spracherkennungssysteme mit vielen Texten und gesprochenen Aufnahmen der entsprechenden Domäne." Erkennungsfehler werden mit grammatikalischer Analyse und Korrektur verbessert und "nicht-gesprochene" Satzzeichen eingefügt. Damit erreichen die Forscher eine verbesserte Textdarstellung und -strukturierung. Als Ergebnis der automatischen Transkription liegen dann sowohl der gesprochene Text mit Zeichensetzung als auch die Zeitzuordnung für jedes Wort vor.

Das Pilotprojekt von EML und Bayerischem Rundfunk hat zum Ziel, die BR Alpha Forum-Gespräche automatisch zu transkribieren und in Vortragsmanuskripte umzuwandeln. "Außerdem soll die Suche und Wiedergabe von Sendungen im Video-Archiv über freie Suchbegriffe möglich werden", so Herbert Tillmann, Direktor Produktion und Technik beim Bayerischen Rundfunk. Und zuletzt soll es möglich sein, die Sendung und den transkribierten Text innerhalb eines Internet-Browsers oder auch als Videosendung mit eingeblendeter Text-Informationen zu zeigen.

Das Projekt wurde von der gemeinnützigen Klaus Tschira Stiftung als Maßnahme zum Technologietransfer in Auftrag gegeben und wird sechs Monate dauern.

Weitere Informationen unter:
http://www.eml-development.de/deutsch/presse/presseberichte.php?we_objectID=369
Pressemitteilung des EML

Kontaktdaten zum Absender der Pressemitteilung unter:
http://idw-online.de/pages/de/institution413


*


Quelle:
Informationsdienst Wissenschaft e. V. - idw - Pressemitteilung
European Media Laboratory GmbH, Dr. Peter Saueressig, 27.10.2009
WWW: http://idw-online.de
E-Mail: service@idw-online.de


veröffentlicht im Schattenblick zum 29. Oktober 2009