Massenmigration der Datenbanksysteme Cloud-Krieg um die Daten
Anbieter zum Thema
Datenströme des laufenden Geschäfts sprengen schnell die Kapazitäten einer On-Premises-Bereitstellung. Auch Analytics-Arbeitslasten kommen hier leicht an den Anschlag. Die schwerfällige Integration herkömmlicher Anwendungen macht den Umgang mit Daten auch nicht einfacher. Also auf geht es in die Cloud!

Die Datenflut ist selbst den Digitalvorreitern schon lange über den Kopf hinausgewachsen. Der Markt für Datenbanksysteme steht „vor der größten Metamorphose seiner Geschichte“, urteilen die Analysten von Gartner. Eine massive Migration von Altlasten-Datenbanken in die Cloud steht der IT-Industrie kurz bevor.
Bis zum Jahr 2022 sollen drei Viertel (75 %) aller Datenbanken auf einer Cloud-Plattform bereitgestellt werden, während die Befragten nur 5 Prozent ihrer Systeme jemals für eine Rückführung zu On-Premises in Betracht gezogen haben sollen. Viele Unternehmen sind mit der Administration und Skalierung von RDBMS-Systemen in klassischen On-Premises-Umgebungen vollauf überfordert; die Integration von Data Warehouses und Data Lakes als ein Beharrlichkeitstest bringt auch die Hartnäckigsten an ihre Grenzen.
Cloud-Anbieter haben in diesen Herausforderungen eine Chance gewittert, um mit innovativen Diensten bei Neu- und Bestandskunden zu punkten. Die Zukunft des Datenbank-Marktes liege in der Cloud, prognostiziert Gartner.
Am Anfang war... DMSA!
Umfragen bei Gartner-Kunden sollen gezeigt haben, dass Unternehmen „immer häufiger neue Anwendungen [gleich] in der Cloud entwickelten und implementierten“ und dass sie dann auch ihre Bestandsdaten in die Cloud verlagern würden, enthüllte Donald Feinberg, Distinguished Research Vice President bei Gartner. Dieser Trend werde aus einer Sicht weiterhin an Zugkraft gewinnen.
Die Datenmigration in die Cloud beginne typischerweise mit Systemen für DMSA-Anwendungsfälle (kurz für Data Management Solutions for Analytics). Gemeint sind hierbei Data Warehousing, Data Lakes und andere Daten-Stores, welche Analytics- und KI-Arbeitslasten sowie maschinellem Lernen zu Grunde liegen. Im nächsten Schritt würden sich dann auch zunehmend jene IT-Systeme des operativen Geschäfts in die Cloud verlagern. Dies sei insbesondere im Zusammenhang mit einer Umstellung auf das SaaS-Anwendungsmodell zu beobachten.
Cloud-übergreifendes Datenmanagement
Gartner verfolge die Marktentwicklungen in diesem Bereich und habe die Entstehung ganzer Cloud-Ökosysteme der Datenverwaltung beobachtet und analysiert. Diese Cloud-Ökosysteme würden sich – anders als On-Premises-Lösungen – nicht auf einen einzelnen Anbieter beschränkten. Es sei vielmehr Cloud-übergreifendes Datenmanagement im Kommen.
Bei dem On-Premises-Ansatz sei eher das Gegenteil gang und gäbe. Einzelne Produkte mögen hier oft mehrere Aufgaben erfüllen, aber nur selten böten sie Unterstützung für die Integration mit komplementären Produkten innerhalb der On-Premises-Bereitstellungsumgebung, jedenfalls nicht aus freien Stücken. Die Integration von On-Premises-Lösungen für Datenmanagement und -Analyse ist in der Praxis voller Stolperfallen.
Es gebe zwar laut Gartner auch „ein gewisses Wachstum“ im Markt für On-Premises-Systeme für das Datenmanagement und -Analyse, aber dieses Wachstum ließe sich nur selten auf neue Implementierungen zurückführen. Hier seien die treibenden Kräfte für Wachstum vielmehr Preiserhöhungen und erzwungene Upgrades, die Unternehmen zähneknirschend zur Risikominderung durchführten.
Im Magic Quadrant stuft Gartner Anbieter nach ihrer Fähigkeit zur Umsetzung und Vollständigkeit der Vision ein und ordnet sie hierzu in eine von vier Kategorien ein: Marktführer (herausragend in Vision und Ausführung), Visionäre (exzellente Vision, aber mit Schwächen in der Ausführung), Herausforderer (gute Ausführung, aber Vision mit Schwächen), Nischenanbieter (mit schwächerer Vision und Ausführung).
Im Magic Quadrant for Cloud Database Management Systems identifizierte Gartner insgesamt acht Marktführer, knapp vier Visionäre, gerade einmal zwei Herausforderer und ebenfalls zwei Nischenanbieter. Ausgereifte Dienste gibt es in Hülle und Fülle. Aspirierende Nutzer haben die Qual der Wahl.
Datendienste von AWS: hochverfügbar, aber kaum integrationsfreundlich
Der Cloud-Riese Amazon (AWS) hat in Gartners Magic Quadrant für Cloud-Datenbankmanagementsysteme die Goldmedaille für die Ausführung eingeheimst. Doch im Hinblick auf die Vollständigkeit konnte AWS erst den vierten Platz erklimmen. AWS ist mit einem Umsatz von 35 Milliarden US-Dollar der weltgrößte Cloud-Service-Anbieter.
Amazon Relational Database Service (RDS), Amazon Aurora (eine Managed-Version von MySQL oder PostgreSQL) und Amazon DynamoDB (ein proprietäres NoSQL-Angebot) zielen auf Anwendungsfälle des operativen Geschäfts ab. Für Aufgabenstellungen im Bereich der Analytik hat AWS die Dienste Amazon Redshift (ein Data Warehouse), Amazon Athena (ein serverloser interaktiver SQL-Abfrageservice für Big Data in Amazon S3) und Amazon EMR (auf der Basis quelloffener Technologien wie Apache Spark, Apache Hive und Presto) im Köcher. Amazon Neptune ist auf Graphen-Anwendungsfälle ausgerichtet. Amazon DocumentDB adressiert dokumentenbasierte Nutzungsszenarien. Amazon Timestream meistert die Verwaltung von Zeitreihendaten. Amazon Keyspaces bietet Kompatibilität mit Apache Cassandra.
Laut Gartner hat AWS eine bessere Erfolgsbilanz im Hinblick auf die Verfügbarkeit und Zuverlässigkeit als alle anderen Hyperscaler. Doch im Hinblick auf die Unterstützung von Multi-Cloud-Szenarien hinke AWS sowohl einigen anderen Hyperscalern als auch „der Mehrheit unabhängiger Service-Provider“ noch deutlich hinterher. Kurz auf den Punkt gebracht: AWS ist nicht daran interessiert, das Cloud-Geschäft mit Daten mit seinen Mitbewerbern zu teilen.
Rundum-Sorglos-Paket oder Groschengrab: Microsoft Azure
Microsoft Azure rangiert im Magic Quadrant von Gartner auf dem zweiten Platz für Execution und auf Platz sechs für Vollständigkeit der Vision. Das 143-Milliarden-Dollar-Unternehmen ist der zweitgrößte Cloud-Anbieter nach Umsatz. Microsofts breite Palette an Cloud-Datenbankmanagementsystemen deckt nahezu alle Anwendungsfälle ab, wahlweise mit proprietären oder mit quelloffenen Technologien. Microsoft ist da längst nicht mehr dogmatisch.
Azure Synapse Analytics verbindet Datenintegration, Data-Warehousing der Enterprise-Klasse und Big-Data-Analytik zu einem „unermesslichen“ Analysedienst. Die „Unermesslichkeit“ soll wohl die unbeschränkte Skalierbarkeit dieses Dienstes zum Ausdruck bringen. Für reine SQL-Arbeitslasten stehen den Nutzern Azure SQL Database und Azure SQL Managed Instance zur Auswahl. Beiden liegt eine gemeinsame Code-Basis von SQL Server (Enterprise Edition) zu Grunde.
Azure SQL Database ist ein vollständig verwalteter Datenbankservice mit automatisierten Updates, Ressourcenprovisionierung und Backups, der mit unbeschränkter Skalierbarkeit aufwartet. Der Dienst kann auf Serverless- und/oder Hyperscale-Storage-Dienste auf der Basis der SQL Server Database Engine zurückgreifen. Azure SQL Managed Instance maximiert die Kompatibilität mit bestehenden On-Premises-Bereitstellungen. Der Dienst ermöglicht den Nutzern einer On-Premises-Variante von Microsofts SQL Server die Migration seiner Anwendungen in die Azure-Cloud im „Lift-and-shift“-Verfahren unter Verwendung des Azure Data Migration Service, mit nur minimalen Änderungen. Azure SQL Managed Instance trumpft außerdem durch vollständige Isolation und nativen VNet-Support. Nutzer von quelloffenen SQL-Datenbanken können ihre Daten und Anwendungen einem Azure-Dienst namens Azure Database für PostgreSQL, MySQL oder MariaDB anvertrauen.
Für die Verwaltung unstrukturierter Daten bietet Microsoft auf Azure zwei sehr unterschiedliche Lösungen: die hauseigene Cosmos DB und den Dienst Azure HDInsight. Azure Cosmos DB ist Microsofts proprietärer, global verteilter Multi-Modell-Datenbankdienst für die Verwaltung von Daten „im planetaren Maßstab". Er ist schemaagnostisch, horizontal skalierbar und wird allgemein als NoSQL-Datenbank klassifiziert. Bei Azure HDInsight handelt es sich um eine Cloud-native Distribution von quelloffenen Hadoop-Komponenten mit Spark und Kafka.
Trotz der Rundumglücklich-Ausführung von Datenmanagement- und -Analysediensten auf Microsoft Azure bestehen für die Nutzer einige Gefahren. Die Umstellung unternehmenseigener Datenbanken auf Azure soll bei vielen der von Gartner befragten Organisationen unterm Strich teurer ausgefallen sein als der Weiterbetrieb der On-Premises-Implementierungen. Die Analysten führen den Umstand zum Teil auf die Kostenstruktur von Microsoft Azure, zum Teil aber auf den vermeintlichen „Mangel an Reife in Bezug auf allgemeine Finanz-Governance-Praktiken bei den Endnutzern“.
In anderen Worten: Wer seinen Geldbeutel nicht eng genug zuzuschnüren weiß und sich auf Azure einlässt, kriegt an der Kasse womöglich einen Schrecken (siehe dazu auch den Beitrag Kostenkontrolle ist (fast) keine Hexerei).
Kopf an Kopf: Oracle und Google
Die goldene Medaille für die beste Vision ging an Oracle. Im Hinblick auf die Ausführung hinkt Oracle demnach drei anderen Anbietern hinterher. Insgesamt konnte sich Oracle knapp neben Google auf der Gartner-Matrix einnisten.
Oracles DBMS ist in der cloud-basierten Edition Autonomous Database identisch mit der On-Premises-Variante. Darüber hinaus verfügt Oracle mit der ExaCC Private Cloud über eine komplette hybride Umgebung für die Verwaltung von Datenbeständen und die Migration in die Cloud. Die größte Schwachstelle des visionären Nachzüglers sehen die Gartner-Analysten in Oracles Ansatz, der sich am besten mit den Worten „auf eigenem Mist gewachsen“ bezeichnen ließe. Die einzigen verwalteten DBMS-Services in der Oracle Cloud sind eigene DBMS-Lösungen und Oracles Big Data Service. Oracle unterstützt nicht einmal Oracle RAC (Oracle Real Application Clusters) auf Clouds anderer Anbieter.
Google rangiert im Gartners Magic Quadrant auf Platz zwei für die Vision und auf Platz drei für die Ausführung. Die Google Cloud Platform (GCP) unterstützt viele Datenbankplattformen im As-a-Service-Bereitstellungsmodell, von vollständig verwalteten Editionen diverser Produkte seiner Mitbewerber bis hin zu Google-eigenen Lösungen Cloud SQL, Cloud Spanner, Cloud Bigtable, BigQuery, Dataproc, Cloud Firestore und Firebase Realtime Database. Google hat Kunden jeder Größe und in allen Branchen.
Gartner-Analysten fehlt bei Google der rote Faden. Google müsse seine bestehenden Angebote – von Datenbanken bis hin zu Analysen – in eine einzige Lösung integrieren. Der Anbieter müsse sich außerdem dazu aufraffen, den Endbenutzern eine „Workbench“ und einen Metadatenkatalog zu vergönnen.
Herausforderer und Visionäre
Als weitere Marktführer konnten sich unter anderem IBM, die deutsche SAP und Teradata qualifizieren. Die Daten-Cloud Snowflake hat Gartner neben Redis Labs als einen Herausforderer anerkannt. Keiner der „Visionäre“ – weder Intersystems noch Databricks noch MarkLogic – konnten im Übrigen vergleichbar große Visionen beweisen, wie die ersten sieben der insgesamt acht designierten Marktführer.
Im Gegensatz zu den hinkenden „Visionären“ und den zwei einsamen „Herausforderern“ blieben einige sehr viel versprechende Anbieter im Gartners Quadrant für Cloud-Datenbankmanagementsysteme außen vor, sei es auf Grund der geringen Unternehmensgröße oder auf Grund einer leicht anderen Ausrichtung.
So zum Beispiel Cohesity, einer der Vorreiter im Gartners Magic Quadrant für Datencenterbackup (aktuelle Marktvaluierung 3.7 Milliarden USD), Anbieter der Multi-Cloud-Daten-Plattform Helios. Das Unternehmen hat sich die Abschaffung der Datenfragmentierung auf die Fahnen geschrieben und konnte bereits Kunden wie Cisco, U.S. Air Force und Siemens überzeugen. Ein Unternehmen der Verizon-Gruppe konnte beispielsweise mit Cohesity Helios die Personalstunden im Zusammenhang mit Datenfragmentierung um 80 Prozent reduzieren. Gartner hat Cohesity im Jahre 2021 mit der Auszeichnung „Erste Wahl unserer Kunden“ in „Voice of the Customer“ in der Kategorie „Verteilte Dateisysteme und Objektspeicher“ gewürdigt.
Migration in die Cloud – ein Muss
Der Markt für Datenbanksysteme steht vor der größten Metamorphose seiner Geschichte. Analysten prognostizieren: Die Zukunft der Daten liegt in der Cloud. Ausgereifte Dienste gibt es ja auch bereits in Hülle und Fülle. Aspirierende Cloud-Nutzer haben die Qual der Wahl.
* Das Autorenduo Anna Kobylinska und Filipe Pereira Martins arbeitet für McKinley Denali Inc. (USA).
(ID:47457567)