FKTG Online-Seminar zu Sprachverständlichkeit von Audiomischungen

Fraunhofer IDMT stellt einen auf neuronalen Netzen basierenden Ansatz vor

Mit der Modellierung der Sprachverständlichkeit von Audiomischungen befasst sich ein FKTG Online-Seminar, das am 24. November 2020 um 16 Uhr stattfindet. Referentin ist Hannah Baumgartner vom Fraunhofer IDMT.

Quelle: FKTG

Bereits im Jahr 2014 gab die ARD/ZDF-Fernsehbetriebsleiterkonferenz die Broschüre „Sprachverständlichkeit im Fernsehen" in Auftrag. Doch mangelnde Sprachverständlichkeit von Broadcast-Inhalten ist häufig ein Problem.

Das Fraunhofer IDMT stellt einen auf neuronalen Netzen basierenden Ansatz vor, um die Sprachverständlichkeit eines O-Tons oder einer Mischung objektiv messbar und sichtbar zu machen. Dabei wird ein System zur automatischen Spracherkennung verwendet, dessen „Unsicherheit" bei der Erkennung von gestörter Sprache durch ein geeignetes Maß quantifiziert wird. Das Modellmaß zeigt eine hohe Korrelation mit den gemittelten subjektiven Bewertungen aus Probandenversuchen.

Die Methode ist referenzsignalfrei und beruht auf der Auswertung von Phonem-Wahrscheinlichkeiten bzw. Posteriorgrammen, die bei Spracherkennersystemen erzeugt werden. Das potentielle Einsatzgebiet des Algorithmus liegt nicht nur im Bereich der Postproduktion zur Visualisierung und Überwachung der Sprachverständlichkeit von Audiomischungen, auch bei der Aufnahme am Set können Tonmeister von einem objektiven Analyseinstrument für Sprachverständlichkeit profitieren - zum Beispiel, wenn es gilt, die Audio-Experten-Einschätzung der Aufnahme gegen „Pro Nuscheln"-Regie-Entscheidungen zu verteidigen.

Der Vortrag veranschaulicht die Theorie und Funktionsweise des Verfahrens anhand von Hörbeispielen und einer Live-Demo.

https://www.fktg.org/node/15173

 

 

 

 

 

Newsletter
Ja, ich möchte den Newsletter von FKT abonnieren