03.07.2019 | Ausgabe 7/2019

Automatische Kamerapfadgenerierung aus 360°-Video mit Deep-Learning-Methoden

Visualisiertes Resultat der Extraktion von Szenenobjekten für ein Einzelbild eines 360°-Videos / Quelle: der Autor

Deep Learning ist eine disruptive Technologie und sehr wertvoll für die Extraktion semantischer Informationen aus Videoinhalten. In diesem Beitrag beschreiben wir einen neuartigen Algorithmus zur automatischen Erzeugung eines konventionellen Videos (für den passiven Konsum, ohne Interaktion) aus einem 360°-Video basierend auf semantischer Information, die mit Deep-Learning- Methoden gewonnen wurde. Des Weiteren wird die Deep-Learning-basierte Methode zur automatischen Extraktion der Szenenobjekte (Personen, Tiere, Autos usw.) beschrieben, die im Algorithmus verwendet wird.

Einführung    360°-Video ist in letzter Zeit sehr populär geworden, weil es dem Betrachter ermöglicht den Inhalt in einer sehr unmittelbaren und eindringlichen Art zu erleben. Es wird typischerweise interaktiv konsumiert, indem der Betrachter aktiv navigiert, um jenen Ausschnitt des Videos zu wählen, den er gerade betrachten möchten. Allerdings verfügen nicht alle Geräte über Möglichkeiten zur interaktiven Navigation. Ältere Fernsehgeräte aus der Ära vor Smart TV stellen natürlich keinen interaktiven Player für 360°-Video zur Verfügung.

----

3 Seiten


Newsletter
Ja, ich möchte den Newsletter von FKT abonnieren