HPC + Mass Storage = KI Genesis Cloud und Vast gehen Hand in Hand

Von Dr. Dietmar Müller 4 min Lesedauer

Anbieter zum Thema

Genesis Cloud nutzt künftig die Vast Data Platform für die Speicherung der Unmenge an Daten, die beim KI-Training anfallen. CloudComputing-Insider sprach mit Vast-Gründer Jeff Denworth und dem Genesis Cloud-CTO Dave Hughes über gemeinsame neue Hochleistungs-Services, die mittelfristig auch in eine Suchmaschine für unstrukturierte Daten münden sollen.

Genesis Cloud nutzt künftig die Vast Data Platform für die Speicherung der Unmenge an Daten, die beim KI-Training anfallen. (Bild:  frei lizenziert, geralt / Pixabay)
Genesis Cloud nutzt künftig die Vast Data Platform für die Speicherung der Unmenge an Daten, die beim KI-Training anfallen.
(Bild: frei lizenziert, geralt / Pixabay)

Genesis Cloud (GC) – nicht zu verwechseln mit Genesys Cloud, einem US-amerikanischen Provider mit Schwerpunkt auf Contact-Center-Produkte und deutschem Hauptsitz ebenfalls in München – ist ein vergleichsweise junges Unternehmen, das Infrastructure-as-a-Service (IaaS) für GPU-basierte Clouds offeriert. So etwas wird beispielsweise im High-Performance-Umfeld benötigt, vor allem aber um Large Language Model (LLMs) zu trainieren. Dabei fallen enorme Mengen an Daten an, die künftig auf der Datenplattformen von Vast abgelegt werden. Gerade haben beide Firmen ihre Partnerschaft bekanntgegeben.

Mit vereinten Kräften könne man nun auch Enterprise-Kunden vollumfänglich bedienen, so Dave Hughes im Gespräch mit CloudComputing-Insider. Er ist Vice President of Engineering bei GC – eine Art CTO, wie er selber sagt – und zeichnet entsprechend für die Bereiche Forschung und Entwicklung, Produkte, Infrastruktur und Operations verantwortlich. Er arbeitet vorzugsweise von England aus – GC ist zwar ein deutsches Unternehmen, aber sehr international aufgestellt.

Dave Hughes im Gespräch mit CloudComputing-Insider per Zoom. Er ist Vice President of Engineering bei Genesis Cloud. (Bild:  Müller)
Dave Hughes im Gespräch mit CloudComputing-Insider per Zoom. Er ist Vice President of Engineering bei Genesis Cloud.
(Bild: Müller)

Besser als die Hyperscaler?

„Mit Storage auf der Vast Data Platform sind wir in der Lage, eine hochautomatisierte Infrastruktur mit außergewöhnlicher Leistung auf Augenhöhe mit den Hyperscalern anzubieten“, so Hughes. Wieso sollten Anwender dann nicht gleich einen Hyperscaler wählen? „Unser Angebot ist günstiger, flexibler, schneller einsatzbereit und vor allem besteht nicht die Gefahr eines Vendor-Lock-ins“, erläutert Hughes. „Darüber hinaus hat der Kunde beim Design alle Freiheiten“, assistiert Jeff Denworth, Mitbegründer von Vast und dort für Technical Sales & Marketing verantwortlich.

Die gemeinsame Plattform von GC und Vast sei darüber hinaus multi-tenant, über die Public Cloud können also mehreren, unterschiedlichen Anwender auf den Datenspeicher zugreifen. „Versuchen Sie das Mal mit S3“, gibt Denworth zu bedenken. Um Daten in S3 mandantenfähig zu machen, müssten diese auf Buckets und Schlüssel verteilt werden. Auch verfüge jede AWS-Speichertechnologie über eine eigene Sammlung von Partitionierungsmodellen. Die Datenparallelität der VAST Data Platform partitioniere und kennzeichne Daten dagegen automatisch über mehrere Protokolle hinweg. „Kurz: Die beim KI-Training anfallenden Massendaten wollen Sie garantiert nicht auf S3 ablegen“, so Denworth.

Jeff Denworth, Mitbegründer von Vast, in einer Videokonferenz mit CloudComputing-Insider. (Bild:  Müller)
Jeff Denworth, Mitbegründer von Vast, in einer Videokonferenz mit CloudComputing-Insider.
(Bild: Müller)

Wie genau wollen die Partner kooperieren?

„Auf Basis unserer Plattform können Namespaces erstellt werden, die sich über mehrere Locations erstrecken können“, erläutert der Vast-Gründer weiter. „Das passt haargenau zur Technologie von GC, die in einem Namespace ein virtuelles Cluster mit Zugriffskontrollen und Ressourcen wie internen DNS-Namen, Pods und Services bereitstellen“, so Denworth.

Zudem seien die Cluster von Genesis mit ihren ein, zwei oder auch dreitausend GPUs aktuell „State of the Art“, GC habe keine Unmenge an veraltetem Equipment am Start, so Denworths Urteil über seinen neuen Partner. Die frisch eingerichteten und vergleichsweise super-stromsparenden Rechenzentren von GC stehen in Island und Norwegen. Sie verfügen über eine nicht blockierende Leaf-Spine-Architektur, die auf High-End-Switches basiert. Jeder Server ist über Netzwerkkarten mit den Switches verbunden, und jedes Konto verfügt über ein eigenes isoliertes virtuelles Netzwerk für zusätzlichen Datenschutz und Sicherheit. Die GPU-Cluster nutzen beispielsweise die nagelneue Nvidia H100 Tensor Core-GPU. So mache das Training von LLMs Sinn, anders als in Rechenzentren mit jeder Menge Legacy, so Denworth.

Auch Vast schleppt keinerlei Legacy-was-auch-immer mit sich herum. Kein Wunder, ist die Firma doch sogar noch jünger als Genesis Cloud – 2019 wurde sie u.a. von Denworth gegründet. Sie offeriert eine Infrastruktur, die von Grund auf für Deep Learning und GPU-beschleunigte Rechenzentren und Clouds konzipiert wurde. So gesehen passt GC zu Vast tatsächlich wie die Faust aufs Auge.

Mittelstand und Enterprise als neue Kunden

Hughes seinerseits berichtete weiter, dass man zum Start von Genesis Cloud vor allem mit günstigen Preisen punkten musste, denn die Kunden bestanden überwiegend aus enthusiastischen, aber eher unterfinanzierten Anwendern. Mit dem Abheben der KI-Entwicklung habe sich dies grundlegend geändert, mehr und mehr würden GPU-Cluster von mittleren und großen Firmen eingesetzt. Und für die benötigt Hughes, wie gesagt, eine stabile und schnelle Storage-Plattform, die auch noch zur Technologie der Genesis Cloud passt.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Diese gemeinsame Plattform wird nach Ansicht von Hughes und Denworth Daten in bislang nicht vorstellbaren Dimensionen bewältigen müssen. Und was beide darüber hinaus planen, hört sich sehr spannend an: Gemeinsam möchte man nichts weniger, als all die unstrukturierten Daten im Netz erfassen und klassifiziert abspeichern. Bekanntermaßen besteht das Internet zu 90 Prozent daraus, „doch keine Datenbank der Welt konnte bislang beispielsweise Informationen aus einem Zoom-Meeting ziehen“, gibt Denworth zu bedenken. Das gemeinsame Ziel der Partnerschaft sei es, dies mittels KI möglich zu machen. Ganz konkret plant man die Entwicklung einer Suchmaschine für unstrukturierte Daten. Das wäre tatsächlich revolutionär, wir behalten das im Auge.

(ID:49888729)