Suchen

Resilienz und Cloud Voraussetzungen für mehr Elastizität und Zuverlässigkeit in IT-Umgebungen

| Autor / Redakteur: Robert Meiners* / Elke Witmer-Goßner

Immer mehr geht es darum, IT-Umgebungen so zu gestalten, dass sie möglichst elastisch, skalierbar flexibel und vor allen zuverlässig sind. Die Resilienz im Datacenter ist das angestrebte Ziel. Einige Technologien dafür existieren bereits. Mit Hilfe dieser „intelligenten“ Systeme lässt sich die Resilienz weitgehend automatisiert erreichen.

Firmen zum Thema

Die Herstellung von Resilienz ist ein fundamentaler Prozess beim IT-Betrieb – nicht nur unternehmensseitig sondern auch in einer Public Cloud.
Die Herstellung von Resilienz ist ein fundamentaler Prozess beim IT-Betrieb – nicht nur unternehmensseitig sondern auch in einer Public Cloud.
(Bild: © Deyan Georgiev - stock.adobe.com)

Spannend wird es, Resilienz nicht nur im eigenen Rechenzentrum, das man komplett unter Kontrolle hat, zu realisieren, sondern auch in der Public Cloud oder sogar in der Kombination aus beiden.

Bei der Resilienz geht es darum, den fortlaufenden Geschäftsbetrieb zu garantieren. Dazu haben bisher einzelne Lösungen in den Bereichen der Business Continuity, Data Safety oder Security gehört.

Nun etabliert sich seit neuestem ein Prinzip, das weit über die bisherigen Mechanismen und Konzepte hinausgeht und den sicheren Geschäftsablauf und die Ausfallsicherheit der IT in einem wesentlich größeren Umfang zusammenfasst: Resilienz. Darüber hinaus will man in heutigen Zeiten die Resilienz über alle Systeme hinweg erreichen, also im eigenen Rechenzentrum, in einer Private beziehungsweise Hybrid Cloud und vor allem auch im Zusammenhang mit Diensten von Public-Cloud-Anbietern.

Das Prinzip der Resilienz baut auf vier Stufen auf:

  • Die erste Stufe der Resilienz beschreibt, dass sich IT-Systeme von einem Ausfall erholen und zwar so weit wie möglich selbstständig.
  • Auf Stufe zwei der Resilienz steht die Fähigkeit, Störfälle zu absorbieren, im Mittelpunkt.
  • Die dritte Stufe der Resilienz beschreibt die Fähigkeit auch am Rande der Systemgrenzen zu funktionieren.
  • Stufe vier beinhaltet die nachhaltige Anpassungsfähigkeit von Systemen beispielsweise mit Hilfe von Künstlicher Intelligenz (KI).

Resilienz und Cloud passen gut zusammen

Das Schöne an der Cloud ist, dass sie per se einen großen Teil der Resilienz systemimmanent mit sich bringt. Bei der Nutzung von externen Cloud-Diensten bucht man nicht wie beim klassischen Colocation einen einzelnen und dedizierten Rechner, sondern ein ganzes virtuelles System, das sich in einem größeren Verbund befindet. Da die Cloud hoch redundant ist, ist die Stufe eins der Resilienz bereits erfüllt.

Die Stufe zwei, die Absorption von Störanfällen, ist durch die Cloud ebenfalls automatisch gegeben. Wenn ein System ausfallen sollte, sorgt die Cloud dafür, dass es auf den restlichen verfügbaren Ressourcen weiterläuft. Im Grunde existiert diese Stufe bei der Nutzung der Cloud nicht, da theoretisch keine Begrenzung der Ressourcen existiert. Inhouse ließe sich eine Reserve, welche die Cloud anbietet, realistisch nicht verwirklichen. In der Cloud bekommt ein Unternehmen immer die gebuchte Kapazität garantiert zur Verfügung gestellt, ganz gleich welche Störungen der Cloud-Anbieter im Hintergrund innerhalb der extrem hohen Redundanz zu managen hat.

Selbstständigkeit als Königsdisziplin

Auch der Betrieb am Rande der Systemgrenzen ist in der Cloud kein Problem, da die Ressourcen weit über dem benötigten Niveau eines Einzelnen liegen. Allerdings liegen bestimmte Entscheidungen beim Kunden. Hat das Unternehmen eine bestimmte Ressource gebucht, wird diese auch zur Verfügung gestellt. Sollte allerdings ein Problem im System auftreten, muss nach wie vor der Kunde reagieren und darüber entscheiden, welches System wichtiger ist. Der Administrator muss im Falle einer exorbitanten Belastung wissen, welche Systeme er zugunsten anderer reduziert oder sogar abschaltet.

Dies kann der Cloud-Provider nur in begrenztem Umfang für den Kunden entscheiden, es sei denn man hat innerhalb der SLAs definiert, welche Systeme Vorrang haben. Dann ist die Cloud selbstständig in der Lage, die Ressourcen auch am Rande der Systemgrenzen automatisch und dynamisch zu balancieren. Doch längst nicht jeder Cloud-Provider bietet einen solchen Dienst bereits heute an und hier muss man auch mit entsprechend hohen Budgets für die Nutzung der Cloud rechnen.

Resilienz bedeutet aber auch, dass sich das System nachhaltig und selbstständig anpasst. Prinzipiell können dies unternehmensinterne oder public-cloud-basierte Umgebungen nur dann, wenn man ihnen ein intelligentes System an die Seite stellt, welches im Idealfall selbstständig und im laufenden Betrieb lernt und viele kleine Informationen zu einem großen Ganzen kumuliert. Diese Systeme sind – sofern gut angelernt – in der Lage, selbstständig die gesamte Umgebung nachhaltig zu optimieren und gegen Störanfälle zu schützen. Einige wenige Cloud-Anbieter, insbesondere im Bereich der Webserver, bieten die Stufe vier der Resilienz an und sorgen für die nachhaltige und selbstständige Anpassung des Systems je nach Bedürfnissen oder Vorfällen.

Entlastung durch die Teilung der „Macht“

Während ein Unternehmen die Resilienz im eigenen Rechenzentrum komplett selbstständig aufbauen und garantieren müsste, besteht in der Verbindung aus einem internen Rechenzentrum beziehungsweise einer internen Private Cloud-Umgebung und der Public Cloud eine Teilung von Aufgaben und Verantwortlichkeiten. Den Rechenzentrumsbetrieb, die Konnektivität, die Elastizität, die Skalierbarkeit, die Verfügbarkeit und der Betrieb am Rande der Systemgrenzen werden vom externen Cloud-Anbieter (innerhalb der vereinbarten SLAs) garantiert. Die entscheidende Frage besteht darin, genau zu definieren, an welcher Stelle das Unternehmen selbstständig eingreifen muss, um die Resilienz seines Gesamtsystems zu erreichen.

Die Aufteilung der Verantwortung hilft Unternehmen enorm, bei der Resilienz größtenteils auf den Cloud-Anbieter zu vertrauen. Das Unternehmen muss nur dann einschreiten, wenn es um seine Daten geht – sprich bei den Applikationen und Datenbanken, bei einem Großteil der Security oder beim inhaltlichen Verwalten von Daten. Hier sind dem Cloud-Anbieter Grenzen gesetzt, denn es ist nicht sein Geschäft, für die ordnungsgemäße Verwaltung der Daten und deren Sicherheit auf Kundenseite zu sorgen. Daher muss die Stelle des Übergangs der Verantwortung vom Cloud-Anbieter zum Kunden exakt definiert sein, damit im Zweifelsfall keine Grauzone entsteht, die im Prinzip bei der Resilienz nicht vorgesehen ist.

Robert Meiners, MTI Technology.
Robert Meiners, MTI Technology.
(Bild: MTI)

An diesem Punkt kann eine Dreiteilung der Macht sinnvoll werden, indem ein Partner mit der benötigten Erfahrung genau die Stelle des Kontrollübergangs von der Public Cloud zum Kunden erstmals definiert und auch bei Systemänderungen kontinuierlich prüft und feinjustiert. Resilienz ist keine Lösung, die man „installiert“ und die dann selbstständig läuft.

* Der Autor Robert Meiners ist Team Lead PreSales Germany bei MTI Technology.

(ID:46752091)