THINK Blog DACH
Es fehlt in den Bereichen Materialwissenschaft und Chemie nicht an klugen Köpfen. Es fehlt nicht an Kompetenz. Aber es ist zumeist noch so mühsam wie im 20. Jahrhundert. Wo fängt die...
Es fehlt in den Bereichen Materialwissenschaft und Chemie nicht an klugen Köpfen. Es fehlt nicht an Kompetenz. Aber es ist zumeist noch so mühsam wie im 20. Jahrhundert. Wo fängt die Forschungsarbeit an, wenn die Kunden oder der Markt eine neue Anforderung haben? Wenn etwa ein besseres Material für ein neues Produkt gesucht ist, das z.B. umweltfreundlicher oder günstiger herzustellen wäre? Oder so schnell wie möglich ein Impfstoff gegen COVID-19 benötigt wird? Wieviel Forschungsliteratur müsste man lesen, um sich einigermaßen sicher zu sein, dass man nicht den entscheidenden verborgenen Hinweis in der Flut der Veröffentlichungen und Patente übersehen hat? Wie leicht ist es, den Wissensschatz zu erschließen, den sich ein Unternehmen über Jahrzehnte aufgebaut hat? In den Köpfen, in den Daten und Berichten verteilt auf Myriaden von digitalen Verzeichnissen?
Die Herausforderung
Es ist unmöglich, all das zu lesen und die Verknüpfungen zwischen nicht offensichtlichen Zusammenhängen zu erfassen, die zu einer neuen Entdeckung, der nächsten großen Produktinnovation führen könnten.
Der Grund? Die digitale Transformation der Forschungs- und Entwicklungsarbeit steht in der Materialwissenschaft und Chemie vielfach noch am Anfang. Oft sind die Produktionsmethoden bereits in höherem Maße digitalisiert und automatisiert als die Forschungsarbeit. Versuchseinheiten sind nicht durchgängig digitalisiert, selten vernetzt. Datenbanken zur Unterstützung von Compliance-Anforderungen über Jahre gewachsen und schwer wartbar geworden. Die Dokumentation von Abteilung zu Abteilung, von Land zu Land verschieden gehandhabt. Die Daten gut geschützt – aber eben auch nicht miteinander verbunden und nicht organisationsübergreifend zugänglich.
Im Folgenden geben wir einen Überblick, wie IBM bereits heute Forschungs- und Entwicklungsabteilungen (F&E) führender Unternehmen z.B. in der Chemie, Spezialchemie, Automobilbranche, oder Medizin unterstützt.
„Accelerated Discovery“ in der Materialwissenschaft und Chemie
IBM Research hat eine lange Tradition in den Materialwissenschaften und steht vor der gleichen Herausforderung wie die F&E-Abteilungen unserer Kunden. Aufgrund unserer Kompetenz im Supercomputing und Künstlicher Intelligenz lag es nahe, sich Methoden und Werkzeuge zu schaffen, die die Entdeckung neuer Materialien oder Substanzen im Forschungs- und Entwicklungsprozess beschleunigen. „Accelerated Discovery“ ist daher seit geraumer Zeit ein eigener Forschungsschwerpunkt von IBM Research. Eine ganze Reihe von Erfolgen wurden erzielt, wie die Entdeckung eines grundlegend neuen Batterietyps, der ohne Schwermetalle auskommt, schwer entflammbar ist und neuartige Materialien nutzt, die aus Seewasser gewonnen werden können.
Einige dieser Innovationen treibt IBM gemeinsam mit Partnern bis zur Marktreife voran, im Fall der Batterien z.B. mit Mercedes-Benz Research & Development. Einige Innovationen hat IBM als Open Source veröffentlicht oder als Anwendung öffentlich verfügbar gemacht. In Summe macht ein erfahrenes Team in Deutschland all die grundlegenden Methoden, Werkzeuge und KI-Modelle im Rahmen von Innovationspartnerschaften und Serviceprojekten zugänglich. Mehr dazu in den nächsten Abschnitten.
Knowledge Graphs und Intellectual Property (IP) Management
Ein wesentliches Element von „Accelerated Discovery“ ist die Fähigkeit, Patente, Forschungsartikel und intern verfügbare Wissensressourcen effizient zu analysieren. Der erste Schritt ist die Verarbeitung von PDF-Dateien oder gescannten Dokumenten, die Extraktion der wesentlichen Elemente wie Text, Tabellen, Bildern und Strukturmerkmalen. Der nächste ist die Anreicherung des digital erschlossenen Dokuments mit Hilfe von Natural Language Processing und Klassifikationsalgorithmen zur Extraktion relevanter Fakten und Beziehungen zwischen Fakten. Danach werden die digitalisierten und angereicherten Texte in einem Wissensgraphen oder „Knowledge Graphen“ recherchierbar gemacht. IBM Watson Discovery mit „Smart Document Understanding“ und Assets von IBM Research („Cognitive Processing Service“) bilden die Grundlage für den Aufbau eines unternehmenseigenen Wissensgraphen, der das Knowhow des Teams sichert und auf intuitive Weise für das tägliche Arbeiten verfügbar macht. Die durchgängige Tool-Chain ermöglicht die kontinuierliche Erweiterung der Wissensgraphen durch das Einspielen zusätzlicher Dokumente. Der Vorteil des Knowledge Graphen ist, dass er flexibel und effizient um zusätzliche Fakten und Beziehungen erweitert werden kann. Den Aufbau des unternehmensspezifischen Knowledge Graphen treiben Berater und Data Scientists von IBM Services mit Unternehmen aus der Chemie und Materialforschung voran.
Speziell für die Analyse von Patenten bietet IBM den Watson IP Advisor via Cloud als Software-as-a-Service-Lösung an. Erweiterungen aus IBM Research für die Patentrecherche (mit besonderem Fokus auf chemischen Formeln) können ebenfalls verfügbar gemacht werden.
KI zur Vorhersage
Klassischerweise werden in der Materialwissenschaft und Chemie Simulationen und High-Performance Computing genutzt, um Hypothesen zu prüfen, ehe man kostspielige und aufwendige Experimente startet. Aber auch Simulationen sind zeitaufwändig in der Modellbildung und erfordern den Einsatz immer leistungsfähigerer Rechenkapazität. Setzt man nur auf Simulation, gelangt man unweigerlich in Grenzbereiche dessen, was sich heute mit Supercomputing berechnen lässt. Einen Ausweg verspricht Quantum Computing, wie die Arbeit mit Daimler zu neuen Batterietypen zeigt.
Künstliche Intelligenz mit tiefen neuronalen Netzwerken eröffnet hier Möglichkeiten, mit weniger Rechnerleistung zu neuen Einsichten zu kommen, die dann weiter durch Simulation oder Experiment überprüft werden können. IBM Research hat KI-Architekturen entwickelt, die die gängigen Anwendungsfälle in der Chemischen Industrie oder in den Materialwissenschaften abdecken:
- Die Vorhersage von Reaktionen oder der Retro-synthese für die anorganische Chemie
- Die Vorhersage von Formulierungen (Rezepturen) oder Materialeigenschaften unter Berücksichtigung von Randbedingungen (Verfahrenstechnik, Testbedingungen)
Die Vorhersage einer chemischen Reaktion für die Synthese oder Retro-Synthese ist für jeden frei zugänglich über IBM RXN for Chemistry. Mit über 90 Prozent Top-1-Accuracy ist es noch immer eines der besten daten-getriebenen KI Modelle für die Reaktionsvorhersage. Über die IBM RXN Website wurden bis heute über 2,3 Millionen Reaktionen vorhergesagt. Der Code von IBM Research ist zwar als Open Source veröffentlicht – aber nicht jede F&E-Einheit in der chemischen Industrie mag sich in der Lage sehen, die Anwendung für im Unternehmen vorhandene Daten neu zu trainieren oder spezifische Erweiterungen vorzunehmen. Diese Unternehmen unterstützt IBM bei der beschleunigten Einführung und Adaption, um ihnen einen Wettbewerbsvorteil zu ermöglichen.
Für die Vorhersage von Formulierungen (wie beispielsweise von Düften, Legierungen, Shampoos oder Polymeren) oder Eigenschaften dieser Formulierungen, d.h. für Endprodukte, die aus einer Mischung von Grundsubstanzen unter spezifischen Prozessbedingungen erzeugt werden, braucht es einen alternativen Ansatz. Die von IBM Research entwickelte Deep-Learning-Lösungsarchitektur wurde bereits mehrfach bei Chemieunternehmen wie z.B. Nagase und einem deutschen Unternehmen sowie im Kontext von Metalllegierungen eingesetzt.
Im Kontext von Düften kommt die zusätzliche Dimension der menschlichen Wahrnehmung und Präferenzen ins Spiel, die eine spezifische Ausprägung der KI erfordert. Symrise hat diese kreative Aufgabe mit Hilfe von KI 2019 gelöst und z.B. den Duft Berlin 3.0 mit dem System Philyra kreiert.
KI zur Lab Automation
Hat die KI bereits einen Vorschlag entwickelt, aus welchen Ausgangsstoffen eine chemische Substanz synthetisiert werden kann, dann fehlt noch die Schritt-für-Schritt Anleitung, wie die Synthese gelingt.
Hierfür hat IBM Research einen ausreichend umfangreichen Korpus an Beschreibungen für den Syntheseprozess generiert und die KI trainiert, rein datengetrieben einen spezifischen Verarbeitungsprozess für die Synthese vorzuschlagen. Der Vorteil ist, dass sich das Modell einfach durch Einspeisen neuer Daten, in diesem Fall durch Beschreibungen der Synthese, weiter verbessern lässt. Das Ergebnis wird so aufbereitet, dass es als Eingabe in einer Anlage zur Laborautomation verwendet werden kann. Damit lässt sich ein großer Teil des chemischen Forschungs- und Entwicklungsprozesses durch KI und Automation beschleunigen: das System wird mit der Zielvorgabe einer zu synthetisierenden Substanz gefüttert, um KI-basiert eine Hypothese zu entwickeln und zu testen. Die nachfolgende Abbildung veranschaulicht den Prozess an einem Beispiel. Für einen weitergehenden und gut lesbaren Überblick siehe auch den Blog von Teodoro Laino, der die Prinzipien mit einem Augenzwinkern allgemeinverständlich am Beispiel einer Gourmet Pizza erläutert.
Vorhersage der Synthese
Wir haben die in diesem Blog erwähnten Technologien und KI-Architekturen bereits mehrfach weltweit und insbesondere auch bei deutschen Unternehmen erfolgreich implementiert. Mit unserem erfahrenen Team möchten wir gerne noch mehr tun für Forschung und Entwicklung in der Materialmaterialwissenschaft und Chemie am Innovationsstandort Deutschland. Sprechen Sie uns an.