THINK Blog DACH

IBM und die NASA stellen das umfangreichste georäumliche KI-Basismodell als Open Source auf Hugging Face zur Verfügung
By | Writer
August 07, 2023
Blog_Nasa

Das Ziel ist es, den Zugriff auf Daten von NASA-Satelliten zu erweitern und klimabezogene Entdeckungen zu beschleunigen. In diesem Sommer herrscht in vielen Teilen der Welt extreme Hitze, was die...

Das Ziel ist es, den Zugriff auf Daten von NASA-Satelliten zu erweitern und klimabezogene Entdeckungen zu beschleunigen.

 

In diesem Sommer herrscht in vielen Teilen der Welt extreme Hitze, was die Gefahr von Waldbränden und Dürre erhöht. Eine Bestandsaufnahme der Nachwirkungen dieser Ereignisse kann Communities dabei helfen, zu prognostizieren, welche Gegenden künftig am stärksten gefährdet sein werden. Und es soll helfen zu planen, worauf sich Anpassungsmaßnahmen konzentrieren sollten.

 

Der Klimawandel bringt zahlreiche Risiken mit sich. Die Notwendigkeit, schnell und klar zu begreifen, wie sich die Landschaft der Erde verändert, ist einer der Gründe, warum IBM vor sechs Monaten in Zusammenarbeit mit der NASA ein KI-Modell entwickelt hat, das die Analyse von Satellitenbildern beschleunigen und wissenschaftliche Entdeckungen fördern könnte. Ein weiterer Beweggrund war der Wunsch, mehr Menschen fast 250.000 Terabyte an Daten zugänglich zu machen, die im Rahmen von NASA-Missionen erhoben wurden.

 

Zur Umsetzung beider Ziele macht IBM nun sein Basismodell über die Open Source KI-Plattform Hugging Face öffentlich verfügbar. Damit handelt es sich um das umfangreichste georäumliche Modell, das auf Hugging Face gehostet wird, und um das erste quelloffene KI-Basismodell, das in Zusammenarbeit mit der NASA entwickelt wurde. Außerdem ist es nach Schätzungen1 von IBM in der Lage, Geodaten bis zu viermal schneller zu analysieren als technologisch ausgereifte Deep-Learning-Modelle, und das mit der halben Menge von beschrifteten Daten.

 

Eine kommerzielle Version des Modells, das Teil der IBM eigenen KI- und Datenplattform watsonx ist, wird im Laufe des Jahres über die IBM Environmental Intelligence Suite (EIS) verfügbar sein.

 

„KI ist nach wie vor ein wissenschaftsgesteuertes Fachgebiet und die Wissenschaft kann nur durch gemeinsame Nutzung von Informationen und durch Zusammenarbeit Fortschritte erzielen“, so Jeff Boudier, Leiter Product & Growth bei Hugging Face. „Aus diesem Grund sind Open-Source-KI und die offene Freigabe von Modellen und Datenbeständen von so wesentlicher Bedeutung für den anhaltenden Fortschritt der Künstlichen Intelligenz und auch dafür, dass die Technologie möglichst vielen Menschen zugutekommt.“

 

IBM hat das Modell so optimiert, dass Benutzer das Ausmaß vergangener Überschwemmungen und Waldbrände in den USA kartieren können, wobei diese Messungen zur Vorhersage künftiger Risikogebiete herangezogen werden können. Mit zusätzlicher Feinabstimmung könnte das Modell jedoch für andere Aufgaben eingesetzt werden, etwa zur Verfolgung der Entwaldung, zur Vorhersage von Ernteerträgen oder zur Ermittlung und Überwachung von Treibhausgasen.

 

„KI-Basismodelle für Erdbeobachtungen bergen ein enormes Potenzial, um komplexe wissenschaftliche Probleme anzugehen und den breiteren Einsatz von KI über verschiedene Anwendungen hinweg zu beschleunigen“, sagt Rahul Ramachandran, Manager der Kompetenzgruppe IMPACT (Inter Agency Implementation and Advanced Concepts Team) und leitender Forschungswissenschaftler bei Marshall. „Wir rufen die Communitys rund um Geowissenschaften und Geoanwendungen dazu auf, dieses erste HLS-Basismodell für eine Vielzahl von Anwendungszwecken auszuwerten und uns Feedback zu geben.“

 

Basismodelle sind äußerst vielseitig und von der Open-Source-Bereitstellung dieses Modells erhoffen sich Hugging Face, NASA und IBM, dass Forscher auf der ganzen Welt dazu angespornt werden, Verbesserungen an ihm vorzunehmen und andere Geodatenmodelle und -anwendungen zu entwickeln. So arbeiten IBM und Forscher der NASA gegenwärtig mit der Clark University zusammen, um das Modell für andere Anwendungen wie Zeitreihensegmentierung und Ähnlichkeitssuche anzupassen.

 

Umsetzung von Pixeln zu Erkenntnissen

 

Als Grundlage für alle Basismodelle dient der Transformer, eine KI-Architektur, die Unmengen an Rohdaten – Text, Audio oder in diesem Fall Satellitenbilder – zu einer komprimierten Darstellung umwandeln kann, in der die Basisstruktur der Daten erfasst ist. Ausgehend von diesem Wissensgerüst kann ein Basismodell mit einem gewissen Umfang an zusätzlichen beschrifteten Daten und weiterer Optimierung auf eine breite Palette von Aufgaben zugeschnitten werden.

 

Bisher war die Analyse von Satellitendaten ein mühseliger und langwieriger Vorgang, weil menschliche Experten viel Zeit benötigten, um in jedem Satellitenbild Features wie Kulturpflanzen und Bäume mit Annotationen zu versehen. Durch Basismodelle wird ein Großteil dieses manuellen Aufwands überflüssig, denn sie extrahieren die Struktur von unbearbeiteten und wirklichkeitsgetreuen Aufnahmen in einer Art und Weise, dass eine geringe Anzahl beschrifteter Beispiele benötigt wird. 

 

Schon früh erkannte die NASA in dieser Technologie das Potenzial zur Verbesserung des Zugriffs auf eine erdrückende Menge von Missionsdaten. Im Januar begann IBM im Rahmen einer NASA Space Act-Vereinbarung mit dem Training eines Basismodells auf einem kleinen Ausschnitt des Harmonized Landsat Sentinel-2-Datenbestands (HLS) der NASA, der alle zwei bis drei Tage eine vollständige Ansicht der Erde bietet. Mit einer Auflösung von 30 Metern pro Pixel sind die HLS-Bilder so genau, dass Änderungen in der Landnutzung erkennbar sind, zugleich aber nicht detailliert genug, als dass einzelne Bäume erkennbar wären.

 

Das Modell, das sich auf eine Architektur aus einem Vision Transformer für die Bilderkennung und einem maskierten Autoencoder (MAE) stützt, wurde für die Verarbeitung von Satellitenbildern so angepasst, dass bei seinem raumbezogenen Aufmerksamkeitsmechanismus die Zeit berücksichtigt wurde. IBM trainierte das Modell auf seinem KI-Supercomputer Vela und setzte PyTorch sowie Ökosystem-Bibliotheken zum Trainieren und Optimieren anhand beschrifteter Aufnahmen von Überschwemmungen, Brandflecken und Brandflächen durch Waldbrände ein. Bei Tests konnten Forscher eine um 15 % höhere Genauigkeit im Vergleich zu technologisch ausgereiften Deep-Learning-Modellen bei der Zuordnung von Überschwemmungen und Bränden verzeichnen.

 

Das Projekt fällt mit dem Jahr der offenen Wissenschaft zusammen, einer Initiative der NASA, des Weißen Hauses und anderer US-amerikanischer Bundesbehörden, in deren Rahmen die Vorteile und Erfolge gefeiert werden sollen, die durch den offenen Austausch von Daten, Informationen und Wissen entstehen. Das Projekt ist auch Teil der jahrzehntelangen Open-Source-Wissenschaftsinitiative der NASA, die das Ziel verfolgt, eine leichter zugängliche, stärker integrative und vermehrt interaktive wissenschaftliche Gemeinschft aufzubauen.

 

Die Entscheidung von IBM, das Modell als Open Source bereitzustellen, folgt auf ein langjähriges Engagement mit der Zielsetzung, KI für jedermann zugänglich zu machen – angefangen bei der Unterstützung von Red Hat OpenShift, durch das portierbares Cloud-Computing ermöglicht wird, bis hin zur Zusammenarbeit mit den Ray- und PyTorch-Communitys, um KI-Workflows zu koordinieren und zu optimieren.

 

►Probieren Sie das Geomodell auf Hugging Face noch heute aus.

 

English Version of blog is here. Further information in this IBM Press Release.

 


 

1Die Pläne, Richtungen und Absichten von IBM können sich nach dem Ermessen von IBM jederzeit und ohne Vorankündigung ändern oder zurückgenommen werden. Informationen über potenzielle zukünftige Produkte und Verbesserungen werden bereitgestellt, um eine allgemeine Vorstellung von den Zielen und Absichten von IBM zu vermitteln, und sollten nicht als Grundlage für eine Kaufentscheidung dienen. IBM ist nicht verpflichtet, auf der Grundlage dieser Informationen Material, Code oder Funktionen bereitzustellen. Diese Erklärung ersetzt alle früheren Erklärungen zu diesem Thema.

 

Article Categories