Prozess-Integration von KI-Systemen

FKT Magazin 7/2021
AI
Artificial intelligence
Systemintegration
Condat AG

Moderne KI-Systeme sind für viele Aufgaben zunehmend ausgereift und werden auch in der Medienbranche für Routinetätigkeiten etwa im Bereich der Textanalyse und -generierung, bei der Bildklassifikation, der Foren-Moderation oder der Topic Detection eingesetzt. Neben Fragen im technischen Bereich stellen sich bei der Einführung von KI-Systemen vor allem Fragen zur Prozess-Integration, die so früh wie möglich mitgedacht und beantwortet werden müssen.

Einleitung
Projekte im KI-Bereich erfordern eine sehr intensive Zusammenarbeit mit dem Kunden und insbesondere den involvierten Fachabteilungen, da meist Aufgaben, die vorher Menschen erledigt haben, zum Teil von den einzuführenden KI-Systemen übernommen werden sollen.

Dadurch können sich Arbeitsweisen erheblich ändern und es entstehen neue Mensch-Maschine-Schnittstellen. Lernende Systeme benötigen Trainingsmaterial, welches wiederum von den Fachexperten aufbereitet und zur Verfügung gestellt werden muss. Mit ihnen müssen Ziele definiert und Ergebnisse bewertet werden, insbesondere, um die KI-Systeme durch Nachtraining kontinuierlich verbessern zu können. Für diese Aufgaben und auch zum Abbau von Vorbehalten gegenüber künstlichen Systemen, müssen die Fachanwender speziell geschult werden. 

Um das Potential für KI-basierte Lösungen bestmöglich auszuschöpfen und Synergie-Effekte zu erkennen, lohnt sich ein bewusst geweiteter Blick auf die zentralen Geschäftsprozesse im Haus. Auch wenn ein Bedarf häufig auf der Ebene konkreter Arbeitsprozesse identifiziert wird, ist es hilfreich, gezielt aktiv nach ähnlich gelagerten Problemstellungen zu suchen und in die Evaluation mit einzubeziehen. Am besten gelingt dies, wenn das Thema Künstliche Intelligenz auf strategischer Ebene angesiedelt ist, und sich ein definierter Personenkreis eine grundlegende Wissensbasis in diesem Bereich erarbeitet. Abbildung 1 visualisiert den grundlegenden Ablauf eines KI-Projekts, der in den folgenden Abschnitten beschrieben wird. 

Modell- und Datenauswahl
Die Einführung von KI-basierten Systemen ist eine komplexe Aufgabe, die im Vergleich zur Beschaffung von Standardanwendungen ein hohes Maß an konzeptioneller Vorarbeit erfordert. Die meisten Einsatzgebiete sind eng mit Art und Beschaffenheit der Daten verknüpft, die vom System verarbeitet werden sollen – im Vorfeld ist daher eine umfangreiche Analyse der Ist-Situation nötig. Neben der erwähnten Verankerung von grundlegender KI-Kompetenz auf strategischer Ebene ist die Einbindung der involvierten Fachabteilungen von Beginn an unerlässlich. Ihnen obliegt zunächst die Aufgabe, die zu verarbeitenden Daten zu beschaffen und zu klassifizieren. Der Systemanbieter bzw. KI-Berater wählt dann ein geeignetes Machine-Learning( ML)-Modell für den konkreten Anwendungsfall aus, evaluiert es und lässt die Fachanwender die erzielten Ergebnisse beurteilen.

Ist das ML-Modell ausgewählt und exemplarisch umgesetzt, kann im nächsten Schritt mit dem Training des KI-Systems auf der Basis geeigneten Beispielmaterials aus dem konkreten Arbeitskontext begonnen werden. Auch wenn in einigen Fällen bereits ein passfähiges vortrainiertes Modell bzw. ein darauf aufsetzender Service existiert, ist ein Finetuning für ein optimales Ergebnis immer erforderlich. Insbesondere in Bereichen, in denen in großen Datenmengen, z. B. einem Content-Archiv, nach bestimmten Inhalten gesucht werden soll, ist es wichtig, im Training sowohl erwünschtes als auch unerwünschtes Material zu verarbeiten. Letzteres sollte dabei sogar zahlenmäßig überwiegen, da dies die Trennschärfe der KI-Verfahren erhöht. Es gibt in der Regel wesentlich mehr unterschiedliche Arten von „Negativ-Inhalten“ als Arten von „Positiv-Inhalten”. Ganz wesentlich ist auch der Einsatz von Transfer-Learning, also die Verwendung eines vortrainierten Modells, etwa in der Bild-Klassifikation, um die Anzahl erforderlich Trainingsdaten wesentlich reduzieren zu können. Wir haben hier sehr gute Erfahrungen mit dem VGG-19-Modell [1] gemacht.

MLOps
Wenn die ausgewählten ML-Modelle initial trainiert wurden und für den Einsatz bereitstehen, müssen sie technisch in die bestehende IT-Landschaft des Kunden integriert werden. Dies betrifft sowohl die Services für dieses Training als auch Services für die eigentliche Verwendung des Modells (Prediction durch KI-Agent). Bekannte DevOps-Mechanismen müssen um ML-spezifische Aspekte erweitert werden, und werden so zu „MLOPs“. Essentiell ist dabei die strikte Trennung von Wissensbasen (Modellen), die für das Training verwendet werden, und den KI-Agenten, die für Vorhersagen unbekannter Daten verwendet werden. Ist beim Kunden beispielsweise bereits das Automatisierungs-Tool Kubernetes im Einsatz, bietet sich für MLOps-Aufgaben die Kubernetes-Erweiterung Kubeflow [2] an.  

Zu beachten sind auch die meist unterschiedlichen Hardware-Anforderungen bei Training und Predictions sowie die oft unterschiedlichen Verfügbarkeitsanforderungen. Das Training läuft in der Regel nur zu bestimmten Zeiten oder nach Aufforderung ab, während die Predictions zu den normalen Bürozeiten oder im 24/7-Betrieb erforderlich sind. Dies und auch eine Kostenbetrachtung wirft konkrete Fragen auf, die mit der IT-Abteilung des Kunden rechtzeitig abzustimmen sind.

Workflow-Einbindung
Um in den involvierten Fachabteilungen einen hohen Nutzungsgrad der eingeführten KI-Systeme zu erzielen, reicht es nicht aus, lediglich ein gut trainiertes und funktionierendes System bereitzustellen. Erst die möglichst nahtlose Einbindung in zentrale Workflows und gewohnte Tools der Anwender führen zur Realisierung versprochener Vorteile und damit zu einer breiten Akzeptanz in der täglichen Arbeit. Bereits in der Konzeptphase sollte daher intensiv über die Einbindung in die bestehende Anwendungslandschaft nachgedacht werden, um eine möglichst nahtlose Integration in Arbeitsabläufe zu erreichen.  

In vielen Fällen ist z. B. noch gar kein Workflow-Tool im Einsatz und es wird händisch mit Excel-Listen o. ä. gearbeitet. Bei halbautomatischen Verfahren ist aber eine solche Tool-Unterstützung besonders sinnvoll und der Kunde sollte intensiv darüber beraten werden. Eine genaue Spezifikation, welche Prozesse des Kunden mittels KI-Verfahren automatisiert werden sollen und welche (noch) nicht, ist erforderlich. In Workshops sollte über die Möglichkeiten einer Bearbeiter- und Status-basierten Arbeitsweise mit Hilfe von Vorgängen aufgeklärt werden und es sind Fragen zum User Interface, zur Ersetzung alter Dokument-basierter Ansätze, zur Automatisierung der Berichterzeugung oder des E-Mail-Versands und zur Umgestaltung von statistischen Auswertungen zu klären.

Zielstellung
Für die erfolgreiche Verwendung von modernen KI-Systemen ist es enorm wichtig, beim Kunden ein grundlegendes Verständnis für den Zielkonflikt zwischen Precision und Recall [3] zu erzeugen. Ist es wichtiger möglichst viele Dinge zu erkennen (hoher Recall) oder sollen die erkannten Dinge möglichst wenige Fehler aufweisen (hohe Precision). Gemeinsam muss erarbeitet werden, wo die Prioritäten liegen bzw. was ein ausgewogenes Verhältnis darstellen würde. Hierbei sollte auch die Erwartungshaltung des Kunden „geschult“ werden. Auch wenn moderne KI-Systeme in Teilbereichen die Leistungsfähigkeit von Menschen erreichen oder sogar übertreffen, arbeiten sie niemals fehlerfrei. In der Regel wird man deshalb halbautomatische Workflows integrieren, in denen KI-Agenten eine gute Vorauswahl treffen, die letztendliche Entscheidung aber beim Fachanwender liegt. Hauptziel ist immer die Unterstützung der Mitarbeiter, die Entlastung von Routineaufgaben und damit das Ermöglichen von effizienteren Arbeitsweisen.

Nachtraining
Die Chance auf kontinuierliche Verbesserung der ML-Modelle sollte man nicht vergeben und von Anfang an durch Bewertungen und Rückmeldungen der Anwender in den Workflow integrieren. Dies ist häufig leicht, da der Anwender ohnehin eine Ergebnis-Kontrolle vornimmt. Wenn die Maschine z. B. eine falsche Klassifikation eines Bildes vorgenommen hat, kann die Korrektur direkt als neues Trainingsmaterial verwendet werden. Manchmal ist aus technischen Gründen das „Klassifikationsschema“ des Kunden aber ein anderes als das des KI-Agenten und es findet dazwischen noch ein zusätzliches Mapping statt. Das Feedback des Anwenders muss aber zwingend „auf dem Schema“ der KI erfolgen, zumindest wenn es kein inverses Mapping gibt, sonst kann das Feedback nicht für das Training verwendet werden. Auch hier ist tiefergehendes Verständnis über die KI, mindestens bei Super-Usern des Kunden, erforderlich. Abbildung 2 zeigt schematisch die Hauptkomponenten und die Akteure des letztendlichen Systems im Betrieb. Ein grundsätzliches Problem stellt die Behandlung von “False Negatives” dar, die der Fachanwender wegen ihrer großen Anzahl in der Regel nicht mehr zu sehen bekommt. Deshalb sollten in größeren Zeitabständen Kontrollen vorgenommen werden, es kann zusätzliches Trainingsmaterial eingebunden werden und die Evaluierung der Verfahren sollte wiederholt werden. Dies kann durchaus dazu führen, dass aufgrund geänderter Datenlage andere KI-Verfahren sich nun besser für die Aufgaben eignen.  

Fazit
Moderne KI-Systeme sind in der praktischen Nutzung erfolgreich angekommen und halten auch im Medienbereich in immer mehr Bereichen Einzug. Um KI-Projekte erfolgreich zu machen, sind bei Einführung und Nutzung allerdings einige wichtige Aspekte zu beachten.  Bereits im Auswahlprozess sollte berücksichtigt werden, dass im Projekt ein großer Dienstleistungsanteil enthalten sein wird und eine enge und kontinuierliche Abstimmung zwischen Fachanwendern und KI-Beratern notwendig ist. Eine vertrauensvolle, kooperative Zusammenarbeit zwischen Kunden und Dienstleister ist daher unerlässlich. Darüber hinaus ist zu berücksichtigen, dass der Kunde – anders als bei der Einführung von Standardsoftware – ein Verständnis für die prinzipielle Funktionsweise eines KI-Systems entwickeln sollte. Dies ist zum einen notwendig, um eine realistische Erwartungshaltung in Bezug darauf zu erlangen, was das künftige Tool leisten kann und wo seine Grenzen liegen. Zum anderen ist es für den Kunden wichtig zu verstehen, wie zentral seine Mitarbeit bei der Auswahl geeigneter Trainingsdaten ist, und dass sein kontinuierliches Feedback unerlässlich ist, um die erzielten Ergebnisse weiter zu verbessern.

Schließlich muss bei der Einführung KI-basierter Systeme immer auch mit Vorbehalten und Ängsten von Anwendern gerechnet werden, die es auszuräumen gilt. Als hilfreich hat es sich erwiesen, Anwender so früh wie möglich in die Einführung einzubeziehen und auf Einwände detailliert einzugehen. Dabei sollte stets klargestellt werden, dass selbst komplexe KI-Anwendungen und Algorithmen lediglich als Unterstützung und Arbeitserleichterung dienen, und qualifizierte Arbeitskräfte weder ersetzen können noch sollen.

ERROR: Content Element with uid "23469" and type "dce_dceuid2" has no rendering definition!