Durchblick in cloud-nativen Umgebungen Woher der „Zwang“ zur Observability kommt

Autor / Redakteur: Michael Rudrich* / Elke Witmer-Goßner

Wir leben in einer Zeit rasanter Umbrüche. Das gilt insbesondere auch für IT-Infrastrukturen und Anwendungen, die immer automatisierter in der Cloud laufen. Doch es ist nicht einfach, komplexe Multi-Cloud-Landschaften weiter zu entwickeln und zu überwachen.

Firmen zum Thema

Mit neuen cloud-nativen Lösungen für Observability können DevOps-Teams die Performance digitaler Dienste überwachen und verwalten.
Mit neuen cloud-nativen Lösungen für Observability können DevOps-Teams die Performance digitaler Dienste überwachen und verwalten.
(Bild: gemeinfrei© Gerd Altmann / Pixabay )

Gleichzeitig müssen Inhouselösungen zuverlässig betrieben werden. Unternehmen benötigen dazu einen vollständigen Einblick in alle IT-Plattformen. Observability, als übergreifendes Monitoring, bietet hierfür einen neuen Ansatz.

Angesichts der gestiegenen Komplexität der modernen Infrastrukturen und der unbestrittenen Notwendigkeit einer besseren Überwachung, sowohl höher im Stack als auch tiefer im System, steigt der Bedarf an umfassendem Monitoring. Allerdings kann es für Unternehmen eine echte Herausforderung sein, die Transparenz für die dynamischen, hybriden, cloud-nativen Umgebungen aufrechtzuerhalten, deren Anzahl und Komplexität im Zuge der digitalen Transformation kontinuierlich steigen. Denn diese Umgebungen lassen sich von Natur aus schwer monitoren. Sowohl herkömmliche Monitoring-Lösungen als auch die Verantwortlichen sind damit inzwischen häufig überfordert.

Observability zeigt DevOps-Teams die Stärken und Schwächen ihrer mehrschichtigen Architekturen. Damit können die IT-Experten sehen, welche Bereiche langsam sind oder gar nicht mehr laufen und welche Aktionen nötig sind, um die Leistung des Systems zu verbessern. Mit neuen cloud-nativen Lösungen lässt sich die Performance von digitalen Diensten überwachen und verwalten. Sonst sind Unternehmen dem wachsenden Risiko ausgesetzt, dass sie von unvorhergesehenen Problemen und den daraus resultierenden Konsequenzen überrumpelt werden.

Den IT-Lärm abstellen

Unternehmen erhalten auf herkömmliche Weise Visibilität, indem sie verschiedene Tools für einen vordefinierten Satz von Problemen einsetzen. Diese werden erkannt, wenn die Leistung und Verfügbarkeit von Komponenten innerhalb ihres IT-Ökosystems nachlassen. Das funktionierte zwar mit den relativ statischen Architekturen der Vergangenheit, ist aber für die dynamisch skalierenden und unvorhersehbaren Umgebungen von heute völlig ungeeignet.

Durch eine immer größer werdende Anzahl an IT-Monitoring-Tools steigt auch das Volumen täglicher Alerts, die DevOps-Teams bewältigen müssen. Diese Flut an falsch-positiven Meldungen, den sogenannten Symptom Alerts, wird auch als IT-Lärm bezeichnet. Dabei geht es um täglich bis zu zehntausend Benachrichtigungen. IT-Teams, die Fehlerquellen schnell identifizieren und Probleme lösen, sparen ihren Unternehmen tausende Euros und Klicks.

Drei Säulen der Observability

Die Herausforderung für IT-Teams besteht darin, das Unbekannte zu identifizieren und auch diejenigen Störungen vorherzusehen, die nur ein einziges Mal auftreten können. Die Observability bietet hierfür einen neuen und besseren Ansatz. Dabei werden Daten aus allen Systemkomponenten gesammelt, um eine vollständige, nahtlose Transparenz über dynamische Cloud-native Umgebungen hinweg zu gewährleisten. Dies lässt sich erreichen, indem man sich auf die Sammlung von drei Hauptdatentypen konzentriert – Metriken, Logs und Traces.

Auch wenn die allgemeine Einführung noch aussteht, gibt es bereits erste Lösungen, um cloud-native Software und Infrastruktur durch Observability zu analysieren. Ein Beispiel ist das OpenTelemetry-Projekt, das von der Cloud Native Computing Foundation (CNCF) geleitet wird.

KI und Automatisierung lichten den Datenwald

Die meisten Ansätze zur Observability liefern leider noch mehr Daten in die Dashboards. Daher müssen Entwickler diese Daten manuell bearbeiten, um Erkenntnisse daraus zu ziehen. Damit die Observability ein wirklich effektiver Ansatz für den Umgang mit der aktuellen Menge und der Dynamik der Cloud-Native-Umgebungen ist, müssen die Erkennung und Instrumentierung aller IT-Komponenten über den gesamten Stack hinweg sowie die Sammlung und Analyse von Daten überall im Unternehmen automatisiert werden. Die Daten sind in einem gemeinsamen Datenmodell zu analysieren, um Silos zu beseitigen und den vollständigen Kontext der Anomalien inklusive ihrer Auswirkungen auf das Business aufzudecken.

Auch Künstliche Intelligenz (KI) ist dafür ein entscheidender Bestandteil. KI versetzt IT-Teams in die Lage, automatisch einen Ausgangswert festzulegen. Wenn sich ihre Umgebung verändert, können sie kontinuierlich nachvollziehen, wie „normales“ Verhalten aussieht und Probleme sofort erkennen, wenn sie auftreten. Darüber hinaus stellt KI die Observability sicher, um präzise Antworten zu liefern. Dadurch können IT-Teams sofort reagieren und Probleme lösen, bevor die Nutzer davon beeinträchtigt werden.

Auswahl von Observabiliy-Lösungen

Laut dem aktuellen ISG Provider Lens Cloud Native Container Services Report 2020 haben es Unternehmen schwer, Anbieter von Observability-Lösungen zu finden, die die volle Komplexität der Funktionsweise von cloud-nativen Anwendungen beherrschen und ihnen ein vollständiges Bild von deren Leistungsfähigkeit liefern können. Entscheidend sind umfassende Funktionalitäten, damit Unternehmen die Performance von Cloud-Native- und Legacy-Anwendungen besser verstehen. Wichtig ist der Einblick über eine konsolidierende Lösung (Single-Pane-of-Glass-Experience), damit Unternehmen schnell vom Erkennen eines Problems zur Ursachenanalyse kommen. Dabei werden beispielsweise Anwendungs-Workloads, IT-Infrastruktur und digitale Experiences in einem Insight verbunden.

Obwohl die Observability viel effektiver ist als herkömmliche Monitoringmethoden, werden die Daten oftmals noch in Silos gesammelt und gespeichert. So ist es schwierig, den Kontext hinter den Anomalien zu verstehen. Es reicht nicht aus, Daten einfach nur in Silos zu monitoren – Organisationen müssen sie konsolidieren, um kontextbezogene Erkenntnisse zu gewinnen und damit bessere Geschäftsergebnisse zu erzielen.

Michael Rudrich, VP CE, Dynatrace.
Michael Rudrich, VP CE, Dynatrace.
(Bild: Dynatrace)

Der Übergang von Visibilität zur Observability ist der nächste entscheidende Schritt für Unternehmen, um ihre sich dynamisch verändernden IT-Umgebungen zu beherrschen. In Kombination mit KI und Automatisierung bieten Observability-Ansätze die Grundlage dafür, dass Unternehmen komplexe IT-Umgebungen effektiv monitoren und steuern können.

* Der Autor Michael Rudrich ist Vice President Central Europe für Dynatrace.

(ID:47048383)