THINK Blog DACH
„Den Datenschatz heben“ gehört bereits seit vielen Jahren zu den Leitsätzen in der Unternehmenswelt. Allerdings hat sich die Bedeutung dieses Leitsatzes stark gewandelt. Ging es früher noch...
„Den Datenschatz heben“ gehört bereits seit vielen Jahren zu den Leitsätzen in der Unternehmenswelt. Allerdings hat sich die Bedeutung dieses Leitsatzes stark gewandelt. Ging es früher noch primär um die Informationen, die in den Daten selbst stecken, steht heute vermehrt im Vordergrund, große Datenmengen zum Trainieren von Künstlicher Intelligenz (KI) zu nutzen. Insbesondere in der Banken- und Versicherungsbranche setzen viele Unternehmen bereits seit Jahren auf Machine-Learning-Projekte. Beispielsweise um Preistendenzen zu antizipieren, Risiken zu kalkulieren oder neue Geschäftsmodelle zu entwickeln. Die IT-Systeme unterstützen dabei die Data Scientists und Aktuare. Auch KPMG setzt mit IBM auf den Einsatz künstlicher Intelligenz.
Beim Einsatz von KI kann es allerdings ab einem gewissen Punkt Schwierigkeiten geben: Dann nämlich, wenn nicht mehr nachvollzogen werden kann, wie die vom Algorithmus ersonnenen Modelle tatsächlich entstanden oder maschinell getroffene automatische Entscheidungen zustande gekommen sind. In diesen Fällen zeigen Aufsichtsbehörden wie die FINMA oder die BaFin den so entstandenen Systemen gerne die rote Karte. Auch für Machine-Learning-Modelle der neuesten Generation gilt eine Dokumentationspflicht. Auf diese Weise haben Endkunden das „Recht auf Erklärung“ der über sie automatisch getroffenen Entscheidungen. Dies ist inzwischen sogar Teil des Datenschutzgesetzes (kurz: DSGVO).
KPMG hat sich dieses Problems angenommen und das „AI in Control“ entwickelt, ein Framework an Kriterien, innerhalb dessen sich der Algorithmus bewegen muss. Diese Kriterien lauten:
- Integrität: Auf welche Datenquellen darf der Algorithmus zugreifen und sind diese valide?
- Robustheit: Hält der Algorithmus Cyberangriffen stand und kann er in verschiedenen Umgebungen laufen?
- Fairness: Ist sichergestellt, dass der Algorithmus keine potenziell diskriminierenden Schlüsse zieht?
- Erklärbarkeit: Lässt sich jeder einzelne Schritt, den der Algorithmus auf dem Weg zur Lösung gegangen ist, nachvollziehen?
Jedes der vier Kriterien hat seine besonderen Herausforderungen. Aus technischer Sicht ist allerdings die „Erklärbarkeit“ die härteste Nuss, da neuere Deep-Learning-Modelle aufgrund der Vielschichtigkeit und der Anzahl an möglichen Variablen als „Black Box“ gelten. Hier setzt KPMG auf Open Source und IBM Watson Technologie aus der IBM Cloud. Dank IBM Watson lassen sich die Ergebnisse künstlicher Intelligenz im gesamtem Lebenszyklus nachvollziehen, messen und steuern, und so letztlich erklärbar machen.
Verwendung finden die von KPMG in Zusammenarbeit mit IBM konzipierten Systeme eher auf Kundenseite, weniger im Kerngeschäft der Wirtschaftsprüfung. Diese erfolgt nach wie vor durch den Prüfer. IT-Systeme unterstützen hier lediglich. Etwa bei der Auswertung von Daten oder beim Abgleich von Verträgen, wie sie beispielsweise bei Änderungen in den Bilanzierungsregeln notwendig sind. KPMG hilft dabei, entsprechende Systeme in Unternehmen zu implementieren oder aber bestehende Systeme anhand des „AI in Control“-Frameworks zu auditieren.
Je nachdem, wo sich das betreffende Unternehmen innerhalb seiner Machine-Learning-Journey befindet, kann das Framework bereits bei der Konzeption herangezogen werden und so das klassische, kleinteilige Proof-of-Concept-Vorgehen (PoC) ergänzen oder gar ersetzen. PoC-Ansätze haben nämlich häufig die Schwierigkeit, dass sie auf Basis von zu wenigen Daten umgesetzt werden und die Ergebnisse folglich nicht den gewünschten Grad an Validität aufweisen. Die Alternative ist ein Machine-Learning-Modell, das beispielsweise in der IBM Watson Studio-Umgebung trainiert wird. So vorgegangen, verfügt das Modell bereits vom Start an über eine breite, integre Datenbasis, um in der weiteren Entwicklung bereits auf validen Erfahrungen aufsetzen zu können.
Weitere Informationen zur Verwendung von Open Source basierten Data-Science- und Machine-Learning-Plattformen gibt es in diesem Whitepaper.