Definition: Cloud-basierte Variante des Data Warehouses Was ist ein Cloud Data Warehouse?

Anbieter zum Thema

Das Cloud Data Warehouse ist die cloud-basierte Variante des Data Warehouses. Die für das Data Warehouse benötigten Software- und Hardwarekomponenten werden von einem Anbieter auf einer Cloud-Computing-Plattform betrieben, gemanagt und bereitgestellt.

Bei einem Cloud Data Warehouse bzw. Data-Warehouse-as-a-Service (DWaaS) betreibt, konfiguriert und managt ein Cloud-Anbieter die für das Data Warehouse benötigten Software- und Hardwareressourcen auf einer Cloud-Computing-Plattform.
Bei einem Cloud Data Warehouse bzw. Data-Warehouse-as-a-Service (DWaaS) betreibt, konfiguriert und managt ein Cloud-Anbieter die für das Data Warehouse benötigten Software- und Hardwareressourcen auf einer Cloud-Computing-Plattform.
(Bild: frei lizenziert / Pixabay / Pixabay)

Das Data Warehouse ist als Service über ein öffentliches oder privates Netzwerk zugänglich und nutzbar. Wie ein on-premises realisiertes Data Warehouse stellt es ein zentrales Datenlager für strukturierte oder halb strukturierte Daten zu Verfügung.

Was ist ein Cloud Data Warehouse?

Cloud Data Warehouse ist die Bezeichnung für die cloud-basierte Variante eines Data Warehouses. Was den Leistungsumfang und die Funktionen angeht, ist es mit einem on-premises betriebenen Data Warehouse vergleichbar. Es stellt ein zentrales Datenbanksystem für eine große Menge strukturierter oder halb strukturierter Daten zur Verfügung und ist für Datenanalysen im Unternehmen einsetzbar. Die Daten stammen aus verschiedenen heterogenen Datenquellen. Sie sind bis zu einem gewissen Grad verdichtet und aufbereitet. Das Data Warehouse versorgt nachgelagerte Analysesysteme mit den benötigten Daten. Der Zugriff auf die Daten ist über Business-Intelligence-Tools, SQL-Schnittstellen und Analyseanwendungen möglich.

Bei der cloud-basierten Variante des Data Warehouses betreibt, konfiguriert und managt ein Cloud-Anbieter die für das Data Warehouse benötigten Software- und Hardwareressourcen auf einer Cloud-Computing-Plattform. Der Kunde benötigt keine eigene Infrastruktur für das Data Warehouse und bezieht die Leistung als Service aus der Cloud. Das Cloud Data Warehouse wird daher auch als Data-Warehouse-as-a-Service (DWaaS) bezeichnet.

Der Data-Warehouse-Service ist über ein öffentliches oder privates Netzwerk zugänglich und nutzbar. Die Leistungen werden nutzungsbasiert in einem Abo-Modell abgerechnet. Typische Einsatzbereiche eines Cloud Data Warehouses sind Geschäftsanalysen, Reporting, Business Intelligence und die datenbasierte Unterstützung von Entscheidungsprozessen.

Durch den vermehrten Einsatz des Cloud-Computings in Unternehmen haben Cloud Data Warehouses in den letzten Jahren stark an Bedeutung gewonnen. Mittlerweile haben alle großen Player im Cloud-Computing-Umfeld wie Microsoft, Amazon, Google, IBM, Oracle, SAP, Snowflake und viele mehr entsprechende Produkte und Cloud-Services in ihrem Portfolio. Cloud Data Warehouses erfordern keine Vorabinvestitionen in eine eigene Data-Warehouse-Infrastruktur sind in großem Umfang skalierbar. Sie sind flexibel nutzbar und sorgen für Kostentransparenz.

Die Entwicklung vom Data Warehouse zum Cloud Data Warehouse

Die Idee des Data Warehouses ist schon vor vielen Jahren entstanden. Den Begriff prägte Dr. Barry Devlin Ende der 1980er-Jahre. Er gilt als einer der Pioniere des Data Warehousings und war maßgeblich für die Definition der Data-Warehouse-Architektur von IBM verantwortlich.

Eine allgemeingültige, einheitliche Definition eines Data Warehouses existiert bis heute nicht. Das Data Warehouse lässt sich aber mit diesen Merkmalen beschreiben:

  • es führt auf verschiedene heterogene Datenquellen verteilte Daten zu einem gemeinsamen Datenbestand zusammen,
  • die Daten sind bis zu einem gewissen Grad verdichtet und aufbereitet,
  • das Data Warehouse ermöglicht eine globale Sicht auf den Datenbestand,
  • auf die Daten kann komfortabel zugegriffen werden,
  • das Data Warehouse stellt Daten für nachgelagerte Analysesysteme zur Verfügung.

Data Warehouses wurden viele Jahre in unternehmenseigenen On-Premises-Rechenzentren oder in Rechenzentren von Dienstleistern realisiert und betrieben. Mit dem Aufkommen des Cloud-Computings entstand die Möglichkeit, Data Warehouses als Service aus der Cloud zu beziehen. Unternehmen müssen für ein Data Warehouse keine eigene Hard- oder Software mehr installieren und betreiben, sondern beziehen die Leistung voll gemanagt von einem Cloud-Anbieter. Die Daten des Cloud Data Warehouses stammen nach wie vor aus vielen heterogenen Quellen. Sie werden von firmeneigenen Anwendungen oder Servern, aber auch von anderen cloudbasierten Anwendungen bereitgestellt und in das Data Warehouse geladen.

Abgrenzung der Begriffe Cloud Data Warehouse, Cloud Data Lake und Cloud Data Mart

Im Zusammenhang mit dem Data Warehouse werden häufig die Begriffe Data Lake und Data Mart genannt. Alle drei Lösungen lassen sich wie das Cloud Data Warehouse cloud-basiert realisieren, unterscheiden sich aber in ihren Eigenschaften. Während das Data Warehouse strukturierte und halb strukturierte Daten verschiedener Quellen in relationalen Datenbanksystemen mit vorgegebenen Schemata für spätere Datenanalysen und strukturierte SQL-Abfragen sammelt, ist der Data Lake ein zentrales Repository für alle Arten von Daten. Sie können strukturiert, halb strukturiert oder völlig unstrukturiert sein.

Der Data Lake hat kein vordefiniertes Schema und speichert Daten in ihrem nativen Format. Für die Realisierung von Data Lakes kommen häufig Big-Data-Frameworks wie Apache Hadoop zum Einsatz. Bei einem Data Mart handelt es sich um eine Teilmenge eines Data Warehouses. Der Data Mart hält Daten in definiertem Schema für einen bestimmten Geschäftsbereich oder eine bestimmte Anwendung bereit. Data Marts können abhängig oder unabhängig von einem Data Warehouse realisiert sein.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Aufbau und Funktionsweise eines Cloud Data Warehouse

Was den grundsätzlichen Aufbau und die bereitgestellten Funktionen angeht, unterscheidet sich das Cloud Data Warehouse nicht von einem On-Premises Data Warehouse. Die Basis für das Data Warehouse bilden relationale Datenbanksysteme für strukturierte oder halb strukturierte Daten. Die Daten sind in Tabellen mit Spalten und Zeilen organisiert. Die von anderen Datenquellen in das Data Warehouse geladene Daten werden diesem Schema angepasst. Die wichtigsten Komponenten eines Cloud Data Warehouses sind:

  • Datenbankmanagementsystem (DBMS),
  • Data-Storage-Hardware,
  • Software für das Daten- und Metadatenmanagement,
  • Datenpipelines für ETL-Prozesse (Extract, Transform, Load),
  • Analyse-Schnittstellen und -Werkzeuge,
  • Reporting-Tools.

Sämtliche Hard- und Software-Ressourcen und Komponenten des Cloud Data Warehouses werden von einem Cloud-Provider installiert, betrieben, gemanagt und bereitgestellt. Die Cloud-Computing-Plattform ist für riesige Datenmengen, große Input-/Output-Lasten und viele parallele Abfragen ausgelegt. Das Data Warehouse lässt sich in großem Umfang skalieren. Organisiert ist das Data Warehouse in einer mehrstufigen Architektur. Die unterste Stufe bilden die Datenbankserver. Darüber befindet sich eine Analyse-Engine. Sie ermöglicht strukturierte Datenabfragen und führt die erhaltenen Daten weiteren Analyseprozessen zu. Die oberste Stufe stellt der Front-End-Client dar, der als Benutzerschnittstelle fungiert. Über ihn lassen sich Ad-hoc-Datenanalysen anstoßen, Ergebnisse abrufen und Berichte präsentieren.

Anwendungsmöglichkeiten eines Cloud Data Warehouses

Das Cloud Data Warehouse kann in vielen Bereichen zum Einsatz kommen. Es ist ein unternehmensweit nutzbares Instrument und stellt die Datengrundlage für Unternehmenskennzahlen, für Kosten- und Ressourcenermittlungen, für die Analyse von Geschäfts- oder Produktionsprozessen, für die datenbasierte Entscheidungsfindung, für das Reporting, für benutzerdefinierte Ad-hoc-Analysen, für Anwendungen der künstlichen Intelligenz und des maschinellen Lernens und für vieles mehr zur Verfügung.

Vorteile eines Cloud Data Warehouses

Neben den allgemeinen Vorteilen des Data Warehouses, wie der Bereitstellung einer globalen Sicht auf Daten unterschiedlicher Datenbestände, bietet das Cloud Data Warehouse gegenüber einem On-Premises betriebenen Data Warehouse folgende Vorteile:

  • keine eigene Data-Warehouse-Infrastruktur zu installieren und zu betreiben,
  • keine Vorabinvestition in Hardware oder Software notwendig,
  • voll gemanagte Lösung mit transparentem Pricing,
  • schnelle Bereitstellung,
  • in großem Umfang skalierbar,
  • für riesige Datenmengen und große Analyse-Workloads geeignet,
  • von beliebigen Orten aus verfügbar und nutzbar,
  • große Flexibilität und Agilität,
  • umfangreiche Integrationsmöglichkeiten in andere Cloud-Services.

Nachteile des Cloud Data Warehouse

Neben diesen Vorteilen bringt das cloud-basierte Data Warehouse einige Nachteile mit sich. Zu diesen Nachteilen zählen:

Es kann eine gewisse Abhängigkeit zu einem Cloud-Provider und seiner Plattform entstehen.

  • Keine volle Kontrolle mehr über die Daten.
  • Unter Umständen problematisch bei strengen Vorgaben hinsichtlich des Datenschutzes, der Datensicherheit und der Compliance.
  • Über die öffentliche Cloud bereitgestellte Data Warehouses bieten eine größere Angriffsfläche für Cyberbedrohungen.
  • Für den Zugriff auf das Data Warehouse und die Nutzung des Services ist eine stabile und schnelle Netzwerkverbindung (Internetverbindung) notwendig.
  • Es können Verzögerungen beim Datenzugriff oder bei der Datenübertragung und Latenz-Probleme auftreten.
  • Die Verfügbarkeit des Data Warehouses ist von der Verfügbarkeit der Cloud-Computing-Plattform eines Anbieters abhängig.
Public, Private, Hybrid & Co.: Definitionen rund um Cloud Computing

Definitionen rund um Cloud ComputingAlle relevanten Schlagworte aus dem Bereich Cloud Computing finden Sie auch gut erklärt in unseren Definitionen. Ganz im Sinne eines kleinen, aber feinen Glossars lesen Sie hier leicht verständliche Erklärungen zu den wichtigsten Begriffen. Als Service für Sie haben wir die hier erklärten Begriffe in unseren Beiträgen auch direkt mit den zugehörigen Lexikoneinträgen verlinkt. So können Sie die wichtigsten Begriffe direkt dort nachschlagen, wo sie im Text auftauchen.  

Zum Special: Definitionen rund um Cloud Computing

(ID:49201720)