02.11.2019 | Ausgabe 11/2019

Warum sich die Medienindustrie der Künstlichen Intelligenz nicht verschließen sollte

KI – wieso?

Quelle: Gerd Altmann auf Pixabay

Ein neues Buzzword erhält Eintritt in das Umfeld der professionellen Bewegtbildverwertung und manch einer migriert gerade noch von SD nach HD. Vermutlich hat die Branche noch nie so viele Trendwechsel und neue Ideen erlebt, wie in den letzten Jahren. Auch der Autor referierte vor vier Jahren noch über 3D und heute fragt keiner mehr danach. Der Artikel beschäftigt sich kurz und knapp mit der Frage, ob uns das Gleiche mit der Nutzung von künstlicher Intelligenz bevorsteht oder ob die Anwendungsfälle breiter gestreut sind und daher eine erfolgreiche Nutzung wahrscheinlicher.

Primär herrscht im allgemeinen technischen Sprachgebrauch ein Missverständnis, wie die Worte Künstliche Intelligenz (Artifical Intelligence), Maschinenlernen (Machine Learning) und Deep Learning zu verstehen sind.

Abbildung 1 – Übersicht über die Bezüge zwischen AI, ML und DL / Quelle: LOGIC media solutions

Abbildung 1 zeigt eine einfache Übersicht, wie die drei Begriffe zusammenhängen. Künstliche Intelligenz ist der Überbegriff aller computerbasierender Intelligenz, welche die Fähigkeiten eines menschlichen Verstands imitieren oder gar ersetzen könnten und wurde bereits 1956 das erste Mal erwähnt. Das dies rein fiktional ist, bedarf hier keiner gesonderter Erläuterung und kann bei Bedarf unter Zuhilfenahme von muskulösen Österreichern in Hollywood recherchiert werden. Alles, was eine Teilaufgabe dessen, welche von Menschenhand programmiert wurde und diesen Regeln folgt, nennt man grob Maschinenlernen oder aufgrund der Internationalität der Branche Machine Learning.

Dies ist bereits recht etabliert und weit verbreitet. Machine Learning funktioniert sehr gut, kommt aber an seine Belastungsgrenzen, wenn die Daten, die es zur Verbesserung benötigt, zu viel werden.

Im Jahr 2020 erwarten Schätzungen eine Datenansammlung von 44 Zetabyte auf diesem Planeten. Je mehr Daten beim Machine Learning vorliegen, desto besser die Ergebnisse, jedoch steigt zeitgleich auch die Dauer, die eine Berechnung benötigt, da alle Daten „geparst“ werden müssen.

Hier bringt Deep Learning Abhilfe, da es sich nicht an von Menschenhand vorgegebenen Formen und Formeln orientiert, sondern sich selbst stetig weiter trainiert und sich anhand von vorhandenen Daten eigenmächtig weiterentwickelt. Klingt wieder nach „I’ll be back“ und wird auch zurecht kontrovers diskutiert. Da dies jedoch eine philosophische Komponente hat, gehört es eher in ein Philosophie-Magazin oder zu den Verschwörungstheoretikern und soll hier nicht weiter beleuchtet werden.

Die Themen, die die Branche aktuell primär interessieren sind, wer nutzt schon was, wo und wie. „Wer“ ist recht einfach beantwortet und kann schnell beantwortet werden – nahezu alle. Nur wissen die meisten Abteilungen untereinander davon gar nichts oder man kann sich nicht vorstellen, dass man diese Technik auch in seinem Umfeld anwenden kann.

Abbildung 2 zeigt eine Übersicht von neun Anwendungsfällen / Quelle: LOGIC media solutions

Aber was kann man genau mit KI im Broadcast anstellen?
Es sollen neun (Abbildung 2) unterschiedliche Anwendungsfälle sehr kurz und knapp erläutert werden, sodass der Leser bewerten kann, ob dieses Thema interessant sein könnte.

1. Monetarisierung des Archivs
Ganz klar ist die Monetarisierung von Archiven die aktuell am Einfachsten zu erklärende Anwendung, die auch jeder nachvollziehen kann. Durch die Nutzung von Künstlicher Intelligenz lassen sich Material verschlagworten und nahezu unendlichen Metadaten erzeugen, die solch eine granularer Suche zulassen, dass jeder noch so kleine Videoschnipsel gefunden, wiederverwertet oder verkauft werden kann. Eine Suche nach Personen in Kombination mit anderen Bildinhalten und ausgewähltem gesprochenen Wort kann die Dauer einer Suche durch den Archivar oder Redakteur drastisch verringern oder gar Material liefern, von dessen Existenz keiner mehr wusste.

2. Transkripte von Material
Mittlerweile existieren viele gute Engines, die in der Lage sind, diverse Sprachen in einem Video in ein Transskript zu wandeln. Diese Transskripte kann natürlich wieder in dem in Punkt 1. erwähnten Kontext sinnvoll eingesetzt werden.

3. Multilingualität vergrößert Reichweite
Durch künstliche Intelligenz kann das zuvor erstellte Transkript in guter Qualität in andere Sprachen übersetzt werden, sodass lokales Material unmittelbar in Länder mit anderen Muttersprachen durch passenden Untertitel zugänglich gemacht werden kann.

4. Empfehlungen
Die Auswertungen von Sehgewohnheiten registrierter Zuschauer kann dafür genutzt werden, dass diese passende und für sie interessante Clips präsentiert bekommen können. Künstliche Intelligenz kann vergleichbaren Zuschauern untereinander Empfehlungen zeigen, wie man sie aus dem Online Shopping schon lange kennt („Zuschauer, die A gesehen haben, schauten auch B). Künstliche Intelligenz kann auch durch Bildanalyse – bereits bevor ein neuer Clip veröffentlicht wurde – bewerten, ob diese schematisch in das vom Zuschauer normalerweise angesehene Material passt.

5. Kostenfreies vs. bezahltes Material
Was schauen oder lesen die Besucher der Mediatheken am meisten und was kommt weniger gut an? Durch Hinzunahme von Künstlicher Intelligenz kann der Betreiber der Mediathek die Wahrscheinlichkeit bewerten, ob ein Clip für das Gros seiner Zuschauer oder Leser interessant ist – um diesen Clip oder Artikel dann gegebenenfalls im kostenpflichtigen Teil zu platzieren.

6. Automatische Sendestraßen
Es existieren Lösungen, die auf Basis von YouTube oder ähnlichem Material eine komplette Sendestraße unter Zuhilfenahme von künstlicher Intelligenz realisieren. Hierzu werden vom Anwender die zu berücksichtigenden Kanäle auf den Sozialen Netzwerken bestimmt und vom System geparst. Anhand von Klickzahlen, Kommentaren, Bildinhalten etc. wertet die KI die passenden Clips aus und setzt eine Playliste auf.

7. Stimmungsbezogene Trailer
Künstliche Intelligenz ist mittlerweile so weit fortgeschritten, dass sie selbstständig Video Trailer anhand von Vorgaben wie traurig, lustig, düster, fröhlich etc. erstellen kann. Videoschnitt gelingt bereits sehr gut, bei Audio gibt es jedoch noch Nachbesserungsbedarf. Wer allerdings sieht, mit welcher Geschwindigkeit sich dieses Thema entwickelt, weiß, dass das nur eine Frage von ein oder zwei Jahren ist.

8. Sportauswertungen
Auch vor einem der größten Umsatzgeneratoren im Live TV, dem Sport, macht die Künstliche Intelligenz selbstverständlich keinen Halt. Hier wertet die KI das Bildmaterial aus und findet Tore, Körbe, Verwarnungen, Auswechslungen, Pausen oder gar Kurioses. Es liegt auf der Hand, was dadurch möglich wird. Das Erstellen von Highlights wird so unfassbar beschleunigt und für jegliche Sportart und in der Liga möglich. Zukünftige Zusammenfassungen von jedem Kreisligaspiel, dass zu einer KI gestreamt wird, ist ein mögliches Resultat.

9. Roboter-Journalismus
Während alle acht Themengebiete zuvor auf die Technik abzielen, ist der Punkt 9 ein Hinweis, dass sich ein riesiges Feld im Bereich des Journalismus aktuell ebenfalls auftut, dessen Umfang noch gar nicht abzuschätzen ist. Dass geschriebene Wettervorhersagen oder Fußballspielberichte zu Oberligaspielen bereits heute möglich sind, ist bekannt. Dass dies jedoch nur der Anfang ist, ist ebenfalls klar, denn durch Natural Language Processing und immer besser werdende Grafiksysteme steht der Einsatz von computerbasierten Moderatoren auch in Europa bevor. Jedoch gilt auch hier – wie bei nahezu aller journalistischer Anwendung von künstlicher Intelligenz – dass sie primär für die Generierung von zusätzlichem Material eingesetzt wird und nicht für den Ersatz von Personal.

Es sei zudem kurz erwähnt, dass künstliche Intelligenz bereits heute recht vielsprechend Personen aus unfassbar vielen Bildern aus dem Internet rendern kann. Auf der Seite https://thispersondoesnotexist.com kann man einen Einblick bekommen, wie eine KI aus Internetbildern teilweise täuschend echt künstliche Personen (Abbildung 3) erzeugt.

Abbildung 3 zeigt zwölf Personen, die nicht existieren. / Quelle: https://thispersondoesnotexist.com/

Wie kann man das umsetzen?
Viele fragen sich auch, ob sie eine eigene Künstliche Intelligenz aufsetzen sollen oder eine von einem öffentlichen Anbieter. Die Antwort ist nicht einfach zu geben, da sie viele Facetten hat. Die wichtigste ist vermutlich die Zeit, die man investieren möchte, um eine Künstliche Intelligenz zu trainieren. Denn dies verbraucht mit Abstand die meiste Zeit, die durch die Nutzung einer öffentlichen Engine umgangen werden kann. Allerdings muss man sich auch die Frage stellen, ob die öffentliche Engine überhaupt über die Metadaten verfügt, die für einen relevant sind, wie zum Beispiel regionale Persönlichkeiten. Unsere Empfehlung ist aktuell, dass man sich mit der öffentlichen Engine für den Anfang auseinandersetzt und dann, wenn der Business Case durchgerechnet ist, in einem Workshop über den Aufbau einer eigenen Engine informiert.

Fazit
Künstlicher Intelligenz kann man sich nicht verschließen. Will man zukünftig in Bezug auf Schnelligkeit konkurrenzfähig sein, ist jetzt genau der Zeitpunkt, sich mit der Thematik in einem Proof of Concept auseinanderzusetzen.

Generell gilt, dass KI uns die Möglichkeit bietet, mehr von dem, was wir heute nur begrenzt schaffen können, zu realisieren. Mehr Material mit der gleichen Personenstärke in besserer Qualität ist denkbar – denn dadurch, dass die KI die „minderwichtigen“ Materialien produziert, hat der Mensch mehr Zeit für qualitativ höchst anspruchsvolles Material.

Was jedoch nicht außer Acht gelassen werden soll: Die KI braucht einen Menschen, der sie überwacht, denn man möchte ein solch wichtiges Thema wie Meinungsbildung durch zum Beispiel Materialempfehlungen oder eben den Qualitätsjournalismus nicht dauerhaft einem Computer überlassen. Sonst brauchen wir doch irgendwann Arnold für die Abschaltung von Cyberdyne Systems.


Newsletter
Ja, ich möchte den Newsletter von FKT abonnieren