11.03.2020 | Ausgabe 03/2020

AUTOMATISCHE SPRACHERKENNUNG FÜR GESANG

Ein einzelnes Neuron eines neuronalen Netzes [26]

Die Suche nach Musikstücken auf Basis ihrer gesungenen Textinhalte kann im Privat-, Broadcast- und Forschungsbereich eine große Unterstützung sein. Mit ihrer Hilfe können z. B. Lieder in bestimmten Sprachen oder mit bestimmten gesungenen Themen gefunden werden. Trotz der zunehmenden Verbreitung von Spracherkennungstechnologien in den letzten Jahren gibt es bisher aber fast noch keine Möglichkeiten, diese auch für Gesang einzusetzen. In diesem Artikel wird aufgezeigt, was dabei die größten Hindernisse sind und wie diese sich lösen lassen. Vorgestellt werden Ansätze für die Erkennung der Landessprache von Musikstücken, für die Schlagwortsuche, für die automatische Zuordnung von bekanntem Text zu Gesangsaufnahmen sowie für die Suche von Musikstücken anhand von gesungenen Ausschnitten. Den Ausgangspunkt dafür bildet die Erkennung von Lauten (Phonemen), welche auf Technologien des maschinellen Lernens beruht.

Searching for musical pieces on the basis of their sung lyrics can be helpful for private users, broadcasters, and researchers. Such search methods allow finding songs in certain languages or about certain topics. Despite the widespread use of speech recognition technologies in recent years, there are few advances in their application to singing. This article summarizes the largest obstacles to this and how to overcome them. Presented applications include language recognition in musical pieces, keyword spotting, automatic lyrics-to-audio alignment, and retrieval of songs by sung excerpts. These technologies are based on the recognition of phonemes, which is implemented via machine learningmethods.

---

5 Seiten


 

Newsletter
Ja, ich möchte den Newsletter von FKT abonnieren