Suchen

Welche Systemarchitektur eignet sich am besten? Analytics in der Hybrid Cloud

| Autor / Redakteur: Brian Wood* / Elke Witmer-Goßner

Hybrid Clouds sind in Deutschland auf dem Vormarsch. Der „Nutanix Enterprise Cloud Index 2019“ belegt, dass 55 Prozent der befragten deutschen IT-Entscheider hybride Clouds als ihr bevorzugtes Infrastrukturmodell für die nächsten drei bis fünf Jahre sehen. In diesem Zeitraum wird für hybride Clouds ein Wachstum von 44 Prozent erwartet.

Ein Schlüsselaspekt bei der Planung einer hybriden Cloud-Architektur ist die Datenbewegung zwischen den Clouds und der On-Premises-Umgebung.
Ein Schlüsselaspekt bei der Planung einer hybriden Cloud-Architektur ist die Datenbewegung zwischen den Clouds und der On-Premises-Umgebung.
(Bild: © sitthiphong - stock.adobe.com)

Kurz zur Begriffsdefinition: Eine Hybrid Cloud besteht aus einer On-Premise-Lösung und einer oder mehreren Cloud-Anwendungen. Eine Multi-Cloud-Lösung verwendet mindestens zwei Cloud-Anwendungen desselben Typs – von verschiedenen Anbietern. In der Regel setzen Unternehmen sowohl hybride als auch Multi-Cloud-Architekturen ein.

In der Diskussion um IT-Infrastrukturen mit Hybrid Cloud und/oder Multi-Cloud sind dies die häufigsten grundsätzlichen Anforderungen der Anwender:

  • Die Möglichkeit, die jeweils beste Cloud-Lösung für einen bestimmten IT-Workload zu nutzen.
  • Keine Abhängigkeit von einem einzelnen Anbieter (Vendor Lock-In).
  • Die Herausforderung meistern, dass der Service eines Cloud-Anbieters nicht an allen Standorten verfügbar ist.
  • Einige Workloads müssen vor Ort bleiben, andere können in die Cloud migriert werden.

Unternehmen müssen sich daher überlegen, wie sie Workloads und Daten zwischen Cloud und On-Premises verschieben. Es läuft alles auf eine Frage hinaus: Wie soll die Analytics-Architektur für die hybride Cloud aussehen?

Datentransfer in hybriden Cloud-Umgebungen

Zunächst sollten Unternehmen die Vor- und Nachteile von hybriden Cloud- oder Multi-Cloud-Umgebungen betrachten und gegeneinander abwägen:

Die Vor- und Nachteile von Hybrid- bzw. Multi-Cloud-Umgebungen
Vorteile Nachteile
Clouds für spezielle Anwendungen (Special Purpose Clouds), z.B. Salesforce oder SAP Datenbewegungen zwischen Cloud und On-Premises können langsam und teuer sein
Besserer Zugang zu einer regionalen Cloud Unterschiedliche Stacks und proprietäre Technologie in der jeweiligen Cloud
Best-in-class Cloud für spezifischen Workload Unterschiedliche Kosten und Abrechnung
Besserer Preis für spezifischen Workload Fachwissen zu verschiedenen Cloud-Anbietern erforderlich

Ein Schlüsselaspekt bei der Planung einer hybriden Cloud-Architektur ist die Datenbewegung zwischen den Cloud-Anwendungen und der On-Premise-Lösung. Während das Verschieben von Daten in die Cloud kostenlos ist, kann das Verschieben von Daten aus der Cloud teuer werden. Darüber hinaus kann die Kommunikation in und aus der Cloud zu erheblichen Latenzzeiten führen, was sich auf die Leistung der Anwendung und das Benutzererlebnis auswirkt.

Ein analytisches Ökosystem beginnt bei den Datenquellen und endet bei den Anwendern. Das Analytics-Ökosystem selbst besteht aus drei Ebenen:
Empfangen: Hier landen die Rohdaten, die dann standardisiert und bereinigt werden.
Analysieren: Auf dieser Ebene erfolgen das Reporting, das Modelltraining und die Modellbewertung.
Bereitstellen: Hier liegen die Datenprodukte in einem verbrauchsfertigen Format vor.

Abb. 1: Der kostengünstigste Datentransfer zwischen den Clouds findet zwischen der Bereitstellungsebene und den Endanwendern statt.
Abb. 1: Der kostengünstigste Datentransfer zwischen den Clouds findet zwischen der Bereitstellungsebene und den Endanwendern statt.
(Bild: Teradata)

Die Abbildung 1 zeigt das analytische Ökosystem mit den beschriebenen Ebenen. Die Dicke der Pfeile kennzeichnet die Datenmenge, die sich zwischen den Ebenen bewegt: Das Schema zeigt, dass der kostengünstigste Datentransfer zwischen den Clouds (oder zwischen On-Premise und der Cloud) zwischen der Bereitstellungsebene und den Endanwendern stattfindet. Die Bandbreitenauslastung zwischen der Analyse- und der Bereitstellungs-Ebene der Daten ist die zweitniedrigste.

Unterschiedliche analytische Ökosysteme

Abb. 2: Im ersten Beispiel sind die Datenquellen operative Systeme sowohl vor Ort, als auch in der Salesforce-Cloud. Die Ebenen, die Daten empfangen, analysieren und bereitstellen, befinden sich alle in der Microsoft Azure Cloud.
Abb. 2: Im ersten Beispiel sind die Datenquellen operative Systeme sowohl vor Ort, als auch in der Salesforce-Cloud. Die Ebenen, die Daten empfangen, analysieren und bereitstellen, befinden sich alle in der Microsoft Azure Cloud.
(Bild: Teradata)

Im Folgenden sollen zwei Beispiele für Ökosystem-Architekturen die Datenbewegung zwischen der Bereitstellungsebene und den Endanwendern veranschaulichen. Im ersten Beispiel (Abb. 2) sind die Datenquellen operative Systeme sowohl vor Ort als auch in der Salesforce-Cloud. Die Ebenen, die Daten empfangen, analysieren und bereitstellen, befinden sich alle in der Microsoft Azure Cloud. Die Nutzung erfolgt vor Ort: Die Übertragung in die Cloud verbraucht viel Bandbreite, doch die Cloud-Anbieter berechnen dies nicht. Die ausgehende Bandbreitennutzung wird minimiert, da nur die Ergebnisse an den Verbraucher vor Ort übertragen werden.

Abb. 3: Genauso wie bei der in Abb. 2 beschriebenen Systemarchitektur findet auch bei diesem Modell die Bandbreitennutzung für die Datenübertragung außerhalb der Cloud statt, so dass die Kosten minimiert werden.
Abb. 3: Genauso wie bei der in Abb. 2 beschriebenen Systemarchitektur findet auch bei diesem Modell die Bandbreitennutzung für die Datenübertragung außerhalb der Cloud statt, so dass die Kosten minimiert werden.
(Bild: Teradata)

Im zweiten Beispiel (Abb. 3) wird die Datenanalyse zum größten Teil vor Ort durchgeführt; die Datenquellen (mit Ausnahme der Salesforce-Lösung) und die Endanwender sind ebenfalls On-Premise angebunden. Darüber hinaus gibt es in der Cloud ein System zur Einhaltung gesetzlicher Vorschriften für Anwendungsfälle, bei denen Zugriff auf historische Daten erforderlich ist, die im Analytics-System nicht mehr verfügbar sind. Genauso wie bei der oben beschriebenen Systemarchitektur findet auch bei diesem Modell die Bandbreitennutzung für die Datenübertragung außerhalb der Cloud statt, so dass die Kosten minimiert werden.

Bewährte Verfahren für hybride Cloud-Analyse

Aus den beiden Architekturmodellen für eine hybride Cloud-Umgebung lassen sich Best Practices für den Aufbau des analytischen Ökosystems ableiten:

Best Practices für den Aufbau des analytischen Ökosystems
Best Practices Kommentar
Datentransfer zwischen den unterschiedlichen Clouds minimieren Ausgang von Daten ist teuer, Bandbreite ist begrenzt
Zeitkritische Abhängigkeiten zwischen den Clouds vermeiden Latenz verzögert die Kommunikation
As-a-Service-Anwendungen in der Cloud nutzen Salesforce, Office 365, SAP Financials
Führende, etablierte Public Clouds einsetzen AWS, Azure, Google Cloud
Durchgehend konsistente Governance-Regeln anwenden Datensilos und Schatten-IT vermeiden
Dedizierte Verbindungen zu und zwischen den Cloud-Anwendungen verwenden Bietet geringere Latenzzeiten und garantierte Bandbreiten zur Datenübertragung
Portierbare Services nutzen Data Warehouse, SQL Analytics, Machine Learning (ML)
Kundenspezifischen Code in Containern bereitstellen DevOps, unabhängiger, cloud-fähig

Aus diesen Beispielen für die System-Architektur ergibt sich als wichtigste Empfehlung: Das Analytics-Ökosystem kann durchaus aus mehreren Clouds in Kombination mit On-Premises-Lösungen bestehen.

Brian Wood, Teradata.
Brian Wood, Teradata.
(Bild: Teradata)

Die Core Analytics sollten jedoch entweder in einer einzelnen Cloud oder on-premises durchgeführt werden. Unternehmen müssen im Cloud-Kontext auf Datenzentriertheit und auf eine gemeinsame Toolchain für die Datenanalyse achten. Dieser Architekturansatz wird die beste Performance für die Datenanalyse bieten und die Hybrid-Cloud zu einem Erfolgsmodell für die kommenden Jahre machen.

* Der Autor Brian Wood ist Director und Cloud Advocate für Teradata.

(ID:46905657)