THINK Blog DACH
Ein unerwartetes Jahr liegt hinter uns. Oft kommt das Wort „entschleunigt“ auf, wenn man auf das Corona-Jahr zurückblickt, doch im Bereich der Künstlichen Intelligenz kann man von keiner...
Ein unerwartetes Jahr liegt hinter uns. Oft kommt das Wort „entschleunigt“ auf, wenn man auf das Corona-Jahr zurückblickt, doch im Bereich der Künstlichen Intelligenz kann man von keiner Pause sprechen. Die Technologie entwickelt sich weltweit, befeuert durch die branchenübergreifende Digitalisierung, zur Schlüsseltechnologie – und das letzte Jahr hat beachtliche Neuerungen in der KI-Entwicklung hervorgebracht.
Trotzdem sind deutsche Unternehmen der KI gegenüber noch immer zurückhaltend: Laut einer Untersuchung des Bundesministeriums für Wirtschaft und Energie, Stand März 2020, nutzen erst 5,8 Prozent der Unternehmen Künstliche Intelligenz. Die jüngsten KI-Entwicklungen versprechen nun einen breiteren Einsatz, inklusive mehr Transparenz und Vertrauen.
Denn eine Tatsache wird eben doch oft vergessen: KI ist nicht gleich KI und es gibt nicht die eine Künstliche Intelligenz, die alles kann. Die bekannten Chatbots in Callcentern oder KI-Assistenzsysteme in Autos sind nur eine Vorstufe dessen, was uns in naher Zukunft erwartet. Welche KI-Entwicklungen können wir erwarten und welche Trends werden die kommenden Jahre in diesem Bereich nachhaltig beeinflussen?
Trend #1 der KI-Entwicklung: Reading Comprehension in Zeiten von Big Data
Wir bei IBM erfahren eine große Nachfrage in den Bereichen Natural Language Processing (NLP), der Computer Vision (also der Bilderkennung) sowie für den Bereich Predictive Analytics.
Um die Technologie und ihre Fortschritte hinter KI-Lösungen besser zu verstehen, muss man sich erst einmal bewusstwerden, von welchem Anwendungsbereich gesprochen wird. Im Bereich Spracherkennung (NLP) hat sich beispielsweise im letzten Jahr in der KI-Entwicklung enorm viel getan. So sorgte der Generative Pretrained Transformer 3 (GPT-3) im Sommer letzten Jahres für einen Durchbruch, aber auch für viel Aufruhr in der Branche: Das bis dato größte Sprachmodell für die Textgenerierung GPT-3 erzeugte Texte, die nicht von Menschen geschriebenen Texten zu unterscheiden waren. Das teilweise zufällig miterlernte Wissen des GPT-3 zeigt gewisse Abstrahierungsfähigkeiten der Modelle, welche die Gedanken in Richtung generelle Künstliche Intelligenz wandern lassen.
Auch IBM entwickelte mit Project Debater ein mächtiges Sprachmodell, das zu komplexen Themen in Echtzeit debattieren kann. Dass der Algorithmus die Mitdebattierenden versteht, auf deren Argumente eingeht und komplexe Sachverhalte verargumentieren kann, zeigt, wie weit wir schon in diesem Bereich sind. Beim Thema Natural Language Processing werden noch große Sprünge zu erwarten sein, insbesondere, wenn man bedenkt, dass solche innovativen Technologien wie Reading Comprehension in Produkten wie IBM Watson Discovery aufgenommen werden, und so vortrainierte und vor allem marktführende Sprach-KI mühelos zur Verfügung steht.
Was ist Readling Comprehension? Die neue KI-Funktion wird zukünftig dabei helfen, präzisere Antworten auf natürlich-sprachliche Anfragen aus riesigen Mengen komplexer Unternehmensdokumente zu finden, ohne dass das Modell speziell darauf trainiert werden muss. Das war bislang noch nicht möglich. Anwendungsfälle sind virtuelle Assistenten im Bereich Customer oder Employee Care oder ganz aktuell als Agent Assist, um Mitarbeiter*innen im Kundenservice während des direkten Kundenkontakts alle relevanten Informationen vorzubereiten – so kann die Qualität des Kundendienstes verbessert oder allgemein der Rechercheaufwand minimiert werden.
Trend #2: Bilderkennung – Gebäudeerkennung in Luftbildern mit Computer Vision und Abgleich mit Kastasterdaten
Auch im Bereich der Computer Vision tut sich einiges. Waren es in der Vergangenheit vornehmlich noch typische Klassifizierung, also die Frage, ob man auf dem Bild beispielsweise einen Hund sieht, so sind wir mittlerweile viel weiter: Neu sind nun vortrainierte oder anpassbare Modelle für Object Detection. Ein Beispiel: IBM und das Landesamt für Geoinformation und Landesvermessung Niedersachsen arbeiten gemeinsam in einem Projekt, um Gebäude in Luftbildern mit Computer Vision zu erkennen.
Die Teams von LGLN und IBM haben einen Workflow basierend auf Künstlicher Intelligenz entwickelt, um Millionen von Gebäuden im Bundesland Niedersachsen in Luftbildern zu erkennen. Zum Vergleich: Ein menschlicher Katasteramts-Experte bräuchte 30 Jahre, um alle Gebäude in Niedersachsen zu erkennen, während die KI dafür fünf Tage benötigt. Eine besondere Herausforderung ist es, die Gebäudepositionen automatisch mit dem Amtlichen Liegenschaftskataster-Informationssystem (ALKIS) abzugleichen.
Es wurde eine maßgeschneiderte Lösung mit den derzeit leistungsfähigsten tiefen neuronalen Netzwerken in der IBM Cloud unter Verwendung von Watson Machine Learning aufgebaut. Ein besonderer Fokus lag auf der Skalierbarkeit und Performanz der KI-Lösung. Die Teams kreierten eine graphische Benutzeroberfläche (UI), die mit Feedback von Experten verschiedener Kataster-Regionaldirektionen in Niedersachsen iterativ verbessert wurde. Für diese Arbeiten hat das Team den IBM Outstanding Technical Achievement Award 2020 (OTAA) gewonnen. Dieser globale Preis ist eine Anerkennung für IBMer für bahnbrechende technologische Arbeiten, die eine große Wirkung über das Projekt hinaus haben. Der OTAA ist einer der prestigeträchtigsten Preise innerhalb der IBM.
Trend #3: Neue Trainingsmethoden – Multimodale KI und Federated Learning
Ein weiterer bemerkenswerter Fortschritt in der KI-Entwicklung sind multimodale Modelle: Das sind neuronale Netzwerke die lernen, nicht nur einen einzelnen Input-Kanal sondern mehrere zu verarbeiten. Im Bereich der Medizin können multimodale Modelle etwa bei der Auswertung von Röntgen-Bildern unterstützen. Das ist erstmal nichts neues, KI ist bereits sehr gut in der Erkennung von Anomalien. Die Herausforderung war bislang, dass eine enorme Menge an Trainingsmaterial eingespeist werden musste. Das Novum nun: Zu den Trainingsbildern wird parallel eine Einschätzung der Ärzte im Textformat (Beispiel „oben rechts, schwarzer Punkt auffällig“) eingepflegt, ein neuronales Netzwerk kann nun auf Basis einer Bild-Text-Kombination multimodal – und das heißt vor allem effizienter – lernen.
Eine letzte sehr spannende Entwicklung ist das sogenannte Federated Learning also zu Deutsch Föderales Lernen. Gerade für sehr regulierte oder kompetitive Branchen wie zum Beispiel der Finanzbranche oder dem Gesundheitswesen kann dieser Trend zukünftig noch vieles vorantreiben. Beim Thema Patientendaten könnten verschiedene Krankenhäuser ihre Daten in einem Ökosystem zur Verfügung stellen und eine gemeinsame zentrale KI trainieren – so beispielsweise bei sensiblen Patientendaten. Bei sehr seltenen Krankheiten fehlt es den einzelnen Krankenhäusern an genügend Trainingsmaterial. Der neue föderale Ansatz bedeutet nun, dass Daten aus verschiedenen Quellen temporär, also ohne, dass die Daten irgendwo abgelegt werden müssen, über eine zentrale Plattform in ein Maschine-Learning-Modell eingepflegt werden. Durch diesen „Privacy by Design“ Ansatz können datenschutzrechtliche Problematiken einfacher vermieden werden.
Die KI-Entwicklung werden noch einiges voranbringen
Die Anwendungsmöglichkeiten von KI sind bei weitem nicht ausgeschöpft, von der Automatisierung wiederkehrender Prozesse bis hin zu neuen Geschäftsmodellen. Eine Herausforderung stellten bis dato die limitierten Trainingsdaten sowie Trainingsressourcen dar. Einen großen Sprung für den breiteren KI-Einsatz in naher Zukunft stellen Entwicklungen wie das multimodale oder föderale Lernen dar. Aber auch solche Fortschritte wie die Reading Comprehension offenbaren viele neue Möglichkeiten in einer Zeit der wachsenden Datenmengen.
IBM versteht sich als führender Partner für das Thema KI und gehört zu den Vorreitern bei der KI-Entwicklung. Was damals mit der Schach-KI DeepBlue als kaum greifbares, wissenschaftliches Thema begann, wird jetzt bereits als vortrainiertes Modell mit den aktuellsten Neuerungen Unternehmen zur Verfügung gestellt. Hierfür bietet IBM eine ganze Toolbox an Anwendungen an, die die neuen KI-Funktionen wie Reading Comprehension für IBM Watson Discovery oder verbesserte Absichtsklassifizierung (Intent classification) für Watson Assistant umfassen.