Die Sprachqualität und -verständlichkeit ist trotz neuer Technologien und Codecs in vielen Fällen und Anwendungen unseres täglichen Lebens oft noch unzureichend, etwa bei Online-Meetings (der Kollege mit altem Headset), Radio/Podcasts (die Zuschaltung von Interviewgästen) oder auch bei der Kommunikation in schwierigen oder kritischen Situationen (im Auto, Einsatzfahrzeug oder Flugzeug). Schwierig ist die Aufzeichnung von hochqualitativen Sprachaufnehmen vor allem für Menschen, die kein optimales Audioequipment verwenden können, z.B. hochwertige Mikrofone und ein Aufnahmestudio, oder die Tonaufzeichnungen in suboptimalen Situationen produzieren müssen, z.B. mit Hintergrundgeräuschen in einer Außenaufnahme oder im Fußballstadion.
Dieses Problem hat sich das Berliner Startup ai|coustics zur Aufgabe gemacht und entwickelt dafür Sprachverbesserungsmodelle auf Basis von Künstlicher Intelligenz. Mit Hilfe eines eintrainierten Verständnisses von Sprachqualität auf Basis von großen Datenmengen können KI-Sprachverbesserungsmodelle Artefakte im Audiosignal beheben, die mit klassischen Signalverarbeitungsmethoden bisher nicht zu bearbeiten sind. Dazu gehören beispielsweise Hintergrundgeräusche, Datenkompressionsartefakte, Bandbegrenzungen, Hall und Raumresonanzen sowie Übersteuern und Clipping. Die KI-Sprachverbesserungsmodelle können in Echtzeit eingesetzt und in vielerlei Software- und Hardwareanwendungen integriert werden. Die Möglichkeiten dieser Technologie haben das Potential, die Sprachsignalverarbeitung zu revolutionieren und den Weg zu neuartigen und vorher undenkbaren Anwendungen zu ebnen.
Lesen Sie mehr zu dem Thema: Was KI mit Cocktail-Partys zu tun hat.
Thema: Wie KI-Algorithmen die Sprachverarbeitung revolutionieren
Veranstalter: Regionalgruppe Berlin-Brandenburg
Wann: 21. Juni 2023, 18:00 Uhr
Wo: RBB - Haus des Rundfunks
Masurenallee 14
14057 Berlin
Referent: Fabian Seipel, Fachgebiet Audiokommunikation (TU Berlin) und Geschäftsführer ai|coustics