O-Töne aus Radio- oder Videoaufzeichnungen herauszusuchen, ist für Journalisten und Redakteure meist eine langwierige Angelegenheit. Mit dem Audio-Mining-System des Fraunhofer IAIS lassen sich Ton- und Videospuren gezielt nach O-Tönen durchsuchen. Dazu werden Radio- oder Fernsehbeiträge mit Deep Learning in Textdateien transkribiert.
Mit Hilfe des Sprecher-Clusterings und der Sprechererkennung ist es außerdem möglich, Personen voneinander zu unterscheiden und so gezielt zu finden. Im praktischen Einsatz ist das Tool unter anderem bei den Sendern der ARD. Mit der Fraunhofer-Technologie analysieren die Rundfunkanstalten täglich rund 2.000 Stunden an Archivmaterial.
Das Team des Fraunhofer IAIS forscht derzeit an der Weiterentwicklung seiner Sprachtechnologien in Richtung Dialogsysteme. So soll das System bald schon auf gesprochene Fragen antworten können – als eine Art intelligenter Assistent für Radio und Fernsehen.
www.iais.fraunhofer.de
www.idmt.fraunhofer.de