Die IT-Infrastruktur eines Unternehmens kann überwältigen. Sie besteht aus einem Gewächs großer Cloud-Systeme, einer steigenden Anzahl Microservices und zusätzlich bringt das Homeoffice neue Schnittstellen. Mike Tria von Atlassian hat drei Schlüsselfaktoren für zukunftssichere Cloud-Plattformen identifiziert.
Bei SaaS-Anbietern braucht es ein Umdenken, wie sie ihren Kunden zuverlässige und sichere Cloud-Infrastrukturen zur Verfügung stellen.
Bei SaaS-Anbietern braucht es ein Umdenken, wie sie ihren Kunden zuverlässige und sichere Cloud-Infrastrukturen zur Verfügung stellen. Unternehmen müssen daher einen neuen Standard bei sich anlegen, um die Erwartungen ihrer Kunden erfüllen zu können, denn nur zuverlässige Systeme ermöglichen eine erfolgreiche Service-Bereitstellung.
Im Umkehrschluss bedeutet das allerdings, dass Entwickler noch mehr leisten. Als Head of Platform Engineering bei Atlassian konnte der Autor diese Erfahrungen mit seinem eigenen Team machen und drei Schlüsselfaktoren herausfiltern, um zukunftssichere, skalierbare und zuverlässige Cloud-Plattformen aufzubauen.
1. Auf Microservices setzen
Das Herzstück einer jeden SaaS-Cloud-Plattform ist die Komplexität. Komplexität kann auf zwei Arten verwaltet werden: Zentral oder verteilt. Ein zentralisiertes System ist ein Monolith, bei dem die gesamte Komplexität in einem einzigen System lebt, das eine einzige Schnittstelle zur Außenwelt darstellt.
Ein verteiltes System wird oft mit Hilfe von Microservices aufgebaut, bei denen die Komplexität in einzelne Dienste aufgeteilt wird, die wiederum miteinander kommunizieren. Auf den ersten Blick scheint das auf Microservices basierende System brüchiger zu sein, da es mehr Schnittstellen und damit mehr Möglichkeiten für Fehler gibt.
Das Gegenteil ist jedoch der Fall: Durch die Verwendung von Service Level Objectives (SLOs) für jeden Microservice und zusätzliche Alerts an relevante Teams wird eine „Tiefenverteidigung“ im System geschaffen. Einige Unternehmen setzen bereits SLOs ein, allerdings nur in den äußeren Schichten ihres Systems.
Atlassian zum Beispiel setzt auf diese Tiefenverteidigung und nutzt über 1.400 Microservices. Eben diese Microservices mit angehängten SLOs, die mit Alerts verknüpft sind, sind der Schlüssel zu einem zuverlässigen Großsystem.
2. Automation überall nutzen, wo es möglich ist
Würden bereits fünf Prozent der Issue Services ihren Job nicht mehr machen, wäre alle Zuverlässigkeit dahin. Durch Automation an allen möglichen Stellen kann jedoch sichergestellt werden, dass die Zuverlässigkeit bei fast 100 Prozent liegt. Ein separates Tool überwacht alle vorhandenen Microservices, verknüpft Warnungen bei Anomalien einzelner SLOs und leitet sie an die entsprechenden Teams weiter, damit diese übernehmen können.
Dieses Tool sollte weiterhin mit einem Incident Management System gekoppelt werden – so wird jeder Protokoll-Verstoß direkt gemeldet und kann umgehend behoben werden. Zudem lässt sich ein Microservice-System damit effektiv skalieren, was letztendlich auch weitere Engineering-Ressourcen für anspruchsvolle Arbeiten eröffnet.
3. Ein Fehlerbudget einführen
Damit die Zuverlässigkeit von Services einwandfrei bewertet werden kann, sollte zukünftig ein internes „Fehlerbudget“ eingeführt werden. Dieses Konzept wird von modernen Software-Unternehmen bereits seit zwei bis drei Jahren genutzt.
Ein großer Vorteil von Fehlerbudgets ist, dass sie den Teams Spielraum geben. Solange der Dienst innerhalb seines Fehlerbudgets liegt, kann das Team wie gewohnt arbeiten. Erst wenn das Fehlerbudget überschritten wird, sollte das Team zu einer Notfalltaktik übergehen.
Als Beispiel: Das Berechtigungsteam bekommt die Aufgabe, dass der Service in 99,99 Prozent innerhalb einer Sekunde reagieren muss. Die Anzahl der Minuten, in denen diese Zahl nicht erreicht wird, ist dann das Fehlerbudget. Angenommen, aus der Berechnung ergibt sich, dass 52 Minuten des Jahres Fehlerbudget sind. Geht etwas schief und das Team braucht einmal zwei Minuten, um zu reagieren, ist das innerhalb des Budgets und erfordert keine weitere Aktion.
Zuvor wurden bei Atlassian alle Fehler gleichbehandelt, mit der Nutzung eines Fehlerbudgets und SLOs ist das anders – Fehler werden bewertet und sind jetzt skalierbar. Bei Atlassian erhalten alle Services diese Einordnung standardmäßig.
Zuverlässigkeit ist der Grundstock für erfolgreiche Service-Bereitstellung
Ohne Kunde kein Service und ohne zuverlässigen Service kein Kunde. Doch um solche Dienste zu etablieren, kommen die meisten Unternehmen nicht um eine Überarbeitung ihrer internen Service-Struktur herum. Mit einer Umstellung auf Microservices, einer zentralen Plattform für deren Verwaltung sowie der Nutzung eines Fehlerbudgets legen sie damit den idealen Grundstein, um auch den Kunden fortlaufend zuverlässige und skalierbare Dienste anbieten zu können.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
* Mike Tria ist Head of Platform Engineering bei Atlassian.