THINK Blog DACH

Optimale IT-Infrastruktur für Deep Learning: High-Speed-Netzwerke und flexible IBM Storage Lösungen von IBM-Business-Partner SVA
October 13, 2020

Das Auto wandelt sich heute schnell von einem isolierten, weitgehend mechanischen Gerät zu einer der hochentwickeltsten und vernetztesten Plattformen der Welt. Das Entscheidende in diesem Prozess...

Das Auto wandelt sich heute schnell von einem isolierten, weitgehend mechanischen Gerät zu einer der hochentwickeltsten und vernetztesten Plattformen der Welt. Das Entscheidende in diesem Prozess sind die Daten. Mit Deep Learning und den richtigen Daten können Automobile lernen und somit das Fahrerlebnis personalisieren. In Zukunft können sie möglicherweise hochkomplexe Fahrsituationen selbstständig erkennen und bewerten, und auf der Grundlage dieser Bewertungen Entscheidungen treffen.

Das Auto von morgen: vernetzt, autonom und datenintensiv

Diese Art von Connected-Car-Initiativen kann einen Speicherbedarf von etwa 200 Exabyte täglich erzeugen. Der Lernprozess kann Wochen oder sogar Monate dauern. Das Entscheidende ist in diesem Fall die Datenspeicherlösung. Sie muss sowohl neue Big Data, als auch traditionelle Applikationen mit Sicherheit, Zuverlässigkeit und hoher Leistung unterstützen. Unternehmen, die in der Lage sind, diese Dateneinsichten schneller zu liefern und gleichzeitig das schnelle Wachstum der Infrastruktur zu bewältigen, werden die Industrieführer der Zukunft sein. Zulieferer Continental vertraut dabei auf ein High-Speed-Netzwerk und flexiblen IBM Storage, geliefert von IBM-Business-Partner SVA System Vertrieb Alexander GmbH.

Optimale IT-Infrastruktur für Deep Learning: Autonomes Fahren im Training bei Continental

Autor Daniel Löber von SVA fasst die Erfolgsgeschichte zusammen:

Die Zukunftsvision von Continental ist klar: Durch den Einsatz von autonom fahrenden Fahrzeugen sollte es keine Verkehrstoten mehr geben. Das Supercomputer-Projekt des Zulieferers dient zum Entwickeln und Trainieren von neuronalen Netzwerken, die Verkehrssituationen erkennen und auf sie reagieren. Um die Zeit pro Training zu reduzieren, die Anzahl an Trainings pro Zeiteinheit zu erhöhen und somit letztendlich das autonome Fahren deutlich schneller zu verbessern, wurde die optimale IT-Infrastruktur benötigt.

IBM_SVA_DeepLearning_500px

High Speed Network

Für eine hohe Deep Learning Performance ist ein kosteneffizientes, hochskalierbares Netzwerk wichtig, mit hoher Bandbreite bei geringer Latenz für die Inter-GPU-Node-Kommunikation. Jüngste Infiniband-HDR-Technologie, NVIDIA-DGX-Systeme und Mellanox/NVIDIA Switche bieten hier eine GPU-Cluster-Lösung. Optimal konzipiert und aufbauoptimiert installiert mit klar strukturierter Architektur, ist sie einfach zu warten und leicht modular erweiterbar bei vergleichsweise geringen Kosten.

Flexibler und erprobter Storage

Continental war außerdem auf der Suche nach einer skalierbaren, hoch performanten Storage-Plattform, um die NVIDIA-DGX-Systeme mit Daten für Deep Learning zu versorgen.  Ein Proof-of-Concept-Workshop auf Basis von Software Defined Storage (SDS) konnte die Funktionen und Möglichkeiten der IBM Spectrum Scale Technologie erfolgreich testen. Mit IBM ESS3000 Storage mit schnellen NVMe Drives wurde eine Lösung implementiert, die extreme Performance mit geringen Latenzzeiten schon bei kleinen Kapazitäten liefert und sofort funktionsfähig ist. Sie ist modular erweiterbar und verfügt initial über hohe Speicherkapazitäten, die nebenläufige Lesezugriffe auf Dateien in einer hohen Bandbreite bedienen kann.

Starke Partner für Deep Learning

Zukunftssichere Technologie braucht hohe Expertise und starke Partner. Mit dem Systemhaus SVA System Vertrieb Alexander GmbH wurde ein technisch exzellenter Partner ins Boot geholt, dessen Experten gemeinsam mit IBM die Gesamtintegration der Storage-Lösung im Cluster, Installation, Deployment, Konfiguration, Inbetriebnahme sowie die Schulung für Betrieb und Administration hervorragend umsetzte. Continental ist absolut überzeugt von der neuen Lösung, die die Trainingszeiten sofort von Wochen auf Tage reduzieren konnte und somit verteiltes Lernen aus Verkehrsvideodaten optimiert.

Article Categories