Das Cloud Data Warehouse ist die cloud-basierte Variante des Data Warehouses. Die für das Data Warehouse benötigten Software- und Hardwarekomponenten werden von einem Anbieter auf einer Cloud-Computing-Plattform betrieben, gemanagt und bereitgestellt.
Bei einem Cloud Data Warehouse bzw. Data-Warehouse-as-a-Service (DWaaS) betreibt, konfiguriert und managt ein Cloud-Anbieter die für das Data Warehouse benötigten Software- und Hardwareressourcen auf einer Cloud-Computing-Plattform.
Das Data Warehouse ist als Service über ein öffentliches oder privates Netzwerk zugänglich und nutzbar. Wie ein on-premises realisiertes Data Warehouse stellt es ein zentrales Datenlager für strukturierte oder halb strukturierte Daten zu Verfügung.
Was ist ein Cloud Data Warehouse?
Cloud Data Warehouse ist die Bezeichnung für die cloud-basierte Variante eines Data Warehouses. Was den Leistungsumfang und die Funktionen angeht, ist es mit einem on-premises betriebenen Data Warehouse vergleichbar. Es stellt ein zentrales Datenbanksystem für eine große Menge strukturierter oder halb strukturierter Daten zur Verfügung und ist für Datenanalysen im Unternehmen einsetzbar. Die Daten stammen aus verschiedenen heterogenen Datenquellen. Sie sind bis zu einem gewissen Grad verdichtet und aufbereitet. Das Data Warehouse versorgt nachgelagerte Analysesysteme mit den benötigten Daten. Der Zugriff auf die Daten ist über Business-Intelligence-Tools, SQL-Schnittstellen und Analyseanwendungen möglich.
Bei der cloud-basierten Variante des Data Warehouses betreibt, konfiguriert und managt ein Cloud-Anbieter die für das Data Warehouse benötigten Software- und Hardwareressourcen auf einer Cloud-Computing-Plattform. Der Kunde benötigt keine eigene Infrastruktur für das Data Warehouse und bezieht die Leistung als Service aus der Cloud. Das Cloud Data Warehouse wird daher auch als Data-Warehouse-as-a-Service (DWaaS) bezeichnet.
Der Data-Warehouse-Service ist über ein öffentliches oder privates Netzwerk zugänglich und nutzbar. Die Leistungen werden nutzungsbasiert in einem Abo-Modell abgerechnet. Typische Einsatzbereiche eines Cloud Data Warehouses sind Geschäftsanalysen, Reporting, Business Intelligence und die datenbasierte Unterstützung von Entscheidungsprozessen.
Durch den vermehrten Einsatz des Cloud-Computings in Unternehmen haben Cloud Data Warehouses in den letzten Jahren stark an Bedeutung gewonnen. Mittlerweile haben alle großen Player im Cloud-Computing-Umfeld wie Microsoft, Amazon, Google, IBM, Oracle, SAP, Snowflake und viele mehr entsprechende Produkte und Cloud-Services in ihrem Portfolio. Cloud Data Warehouses erfordern keine Vorabinvestitionen in eine eigene Data-Warehouse-Infrastruktur sind in großem Umfang skalierbar. Sie sind flexibel nutzbar und sorgen für Kostentransparenz.
Die Entwicklung vom Data Warehouse zum Cloud Data Warehouse
Die Idee des Data Warehouses ist schon vor vielen Jahren entstanden. Den Begriff prägte Dr. Barry Devlin Ende der 1980er-Jahre. Er gilt als einer der Pioniere des Data Warehousings und war maßgeblich für die Definition der Data-Warehouse-Architektur von IBM verantwortlich.
Eine allgemeingültige, einheitliche Definition eines Data Warehouses existiert bis heute nicht. Das Data Warehouse lässt sich aber mit diesen Merkmalen beschreiben:
es führt auf verschiedene heterogene Datenquellen verteilte Daten zu einem gemeinsamen Datenbestand zusammen,
die Daten sind bis zu einem gewissen Grad verdichtet und aufbereitet,
das Data Warehouse ermöglicht eine globale Sicht auf den Datenbestand,
auf die Daten kann komfortabel zugegriffen werden,
das Data Warehouse stellt Daten für nachgelagerte Analysesysteme zur Verfügung.
Data Warehouses wurden viele Jahre in unternehmenseigenen On-Premises-Rechenzentren oder in Rechenzentren von Dienstleistern realisiert und betrieben. Mit dem Aufkommen des Cloud-Computings entstand die Möglichkeit, Data Warehouses als Service aus der Cloud zu beziehen. Unternehmen müssen für ein Data Warehouse keine eigene Hard- oder Software mehr installieren und betreiben, sondern beziehen die Leistung voll gemanagt von einem Cloud-Anbieter. Die Daten des Cloud Data Warehouses stammen nach wie vor aus vielen heterogenen Quellen. Sie werden von firmeneigenen Anwendungen oder Servern, aber auch von anderen cloudbasierten Anwendungen bereitgestellt und in das Data Warehouse geladen.
Abgrenzung der Begriffe Cloud Data Warehouse, Cloud Data Lake und Cloud Data Mart
Im Zusammenhang mit dem Data Warehouse werden häufig die Begriffe Data Lake und Data Mart genannt. Alle drei Lösungen lassen sich wie das Cloud Data Warehouse cloud-basiert realisieren, unterscheiden sich aber in ihren Eigenschaften. Während das Data Warehouse strukturierte und halb strukturierte Daten verschiedener Quellen in relationalen Datenbanksystemen mit vorgegebenen Schemata für spätere Datenanalysen und strukturierte SQL-Abfragen sammelt, ist der Data Lake ein zentrales Repository für alle Arten von Daten. Sie können strukturiert, halb strukturiert oder völlig unstrukturiert sein.
Der Data Lake hat kein vordefiniertes Schema und speichert Daten in ihrem nativen Format. Für die Realisierung von Data Lakes kommen häufig Big-Data-Frameworks wie Apache Hadoop zum Einsatz. Bei einem Data Mart handelt es sich um eine Teilmenge eines Data Warehouses. Der Data Mart hält Daten in definiertem Schema für einen bestimmten Geschäftsbereich oder eine bestimmte Anwendung bereit. Data Marts können abhängig oder unabhängig von einem Data Warehouse realisiert sein.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Aufbau und Funktionsweise eines Cloud Data Warehouse
Was den grundsätzlichen Aufbau und die bereitgestellten Funktionen angeht, unterscheidet sich das Cloud Data Warehouse nicht von einem On-Premises Data Warehouse. Die Basis für das Data Warehouse bilden relationale Datenbanksysteme für strukturierte oder halb strukturierte Daten. Die Daten sind in Tabellen mit Spalten und Zeilen organisiert. Die von anderen Datenquellen in das Data Warehouse geladene Daten werden diesem Schema angepasst. Die wichtigsten Komponenten eines Cloud Data Warehouses sind:
Datenbankmanagementsystem (DBMS),
Data-Storage-Hardware,
Software für das Daten- und Metadatenmanagement,
Datenpipelines für ETL-Prozesse (Extract, Transform, Load),
Analyse-Schnittstellen und -Werkzeuge,
Reporting-Tools.
Sämtliche Hard- und Software-Ressourcen und Komponenten des Cloud Data Warehouses werden von einem Cloud-Provider installiert, betrieben, gemanagt und bereitgestellt. Die Cloud-Computing-Plattform ist für riesige Datenmengen, große Input-/Output-Lasten und viele parallele Abfragen ausgelegt. Das Data Warehouse lässt sich in großem Umfang skalieren. Organisiert ist das Data Warehouse in einer mehrstufigen Architektur. Die unterste Stufe bilden die Datenbankserver. Darüber befindet sich eine Analyse-Engine. Sie ermöglicht strukturierte Datenabfragen und führt die erhaltenen Daten weiteren Analyseprozessen zu. Die oberste Stufe stellt der Front-End-Client dar, der als Benutzerschnittstelle fungiert. Über ihn lassen sich Ad-hoc-Datenanalysen anstoßen, Ergebnisse abrufen und Berichte präsentieren.
Anwendungsmöglichkeiten eines Cloud Data Warehouses
Das Cloud Data Warehouse kann in vielen Bereichen zum Einsatz kommen. Es ist ein unternehmensweit nutzbares Instrument und stellt die Datengrundlage für Unternehmenskennzahlen, für Kosten- und Ressourcenermittlungen, für die Analyse von Geschäfts- oder Produktionsprozessen, für die datenbasierte Entscheidungsfindung, für das Reporting, für benutzerdefinierte Ad-hoc-Analysen, für Anwendungen der künstlichen Intelligenz und des maschinellen Lernens und für vieles mehr zur Verfügung.
Vorteile eines Cloud Data Warehouses
Neben den allgemeinen Vorteilen des Data Warehouses, wie der Bereitstellung einer globalen Sicht auf Daten unterschiedlicher Datenbestände, bietet das Cloud Data Warehouse gegenüber einem On-Premises betriebenen Data Warehouse folgende Vorteile:
keine eigene Data-Warehouse-Infrastruktur zu installieren und zu betreiben,
keine Vorabinvestition in Hardware oder Software notwendig,
voll gemanagte Lösung mit transparentem Pricing,
schnelle Bereitstellung,
in großem Umfang skalierbar,
für riesige Datenmengen und große Analyse-Workloads geeignet,
von beliebigen Orten aus verfügbar und nutzbar,
große Flexibilität und Agilität,
umfangreiche Integrationsmöglichkeiten in andere Cloud-Services.
Nachteile des Cloud Data Warehouse
Neben diesen Vorteilen bringt das cloud-basierte Data Warehouse einige Nachteile mit sich. Zu diesen Nachteilen zählen:
Es kann eine gewisse Abhängigkeit zu einem Cloud-Provider und seiner Plattform entstehen.
Keine volle Kontrolle mehr über die Daten.
Unter Umständen problematisch bei strengen Vorgaben hinsichtlich des Datenschutzes, der Datensicherheit und der Compliance.
Über die öffentliche Cloud bereitgestellte Data Warehouses bieten eine größere Angriffsfläche für Cyberbedrohungen.
Für den Zugriff auf das Data Warehouse und die Nutzung des Services ist eine stabile und schnelle Netzwerkverbindung (Internetverbindung) notwendig.
Es können Verzögerungen beim Datenzugriff oder bei der Datenübertragung und Latenz-Probleme auftreten.
Die Verfügbarkeit des Data Warehouses ist von der Verfügbarkeit der Cloud-Computing-Plattform eines Anbieters abhängig.
Public, Private, Hybrid & Co.: Definitionen rund um Cloud Computing
Alle relevanten Schlagworte aus dem Bereich Cloud Computing finden Sie auch gut erklärt in unseren Definitionen. Ganz im Sinne eines kleinen, aber feinen Glossars lesen Sie hier leicht verständliche Erklärungen zu den wichtigsten Begriffen. Als Service für Sie haben wir die hier erklärten Begriffe in unseren Beiträgen auch direkt mit den zugehörigen Lexikoneinträgen verlinkt. So können Sie die wichtigsten Begriffe direkt dort nachschlagen, wo sie im Text auftauchen.