Cloud Data Warehouse von Snowflake Eine Wolke für Daten jeglicher Couleur

Autor Dr. Stefan Riedl

Ein extra für die Cloud entwickeltes Data Warehouse für eigene strukturierte und unstrukturierte Daten in Kombination mit einem Drittanbieter-Datenmarktplatz. Das versteht der Anbieter Snowflake unter einer „Datenwolke“.

Anbieter zum Thema

Snowflake, auf Platz 1 der diesjährigen Forbes Cloud-100-Liste gerankt, stellt eine Datenwolke bereit.
Snowflake, auf Platz 1 der diesjährigen Forbes Cloud-100-Liste gerankt, stellt eine Datenwolke bereit.
(Bild: steheap - stock.adobe.com)

Analysten von IDC gehen davon aus, dass bis zum Jahr 2025 satte 80 Prozent der Daten weltweit unstrukturiert sein werden. Das sind Daten, die nicht in normalisierter Datenstruktur vorliegen, wie beispielsweise Datensätze von Bestandskunden. Vielmehr sind damit beispielsweise Texte, Bilder oder Audio- und Videodateien gemeint. Im Big-Data-Umfeld haben unstrukturierte Daten eine wachsende Bedeutung. Und dann wären da noch die „halbstrukturierten Daten“, die nicht in Zellen oder Spalten gegliedert vorliegen, jedoch Elemente enthalten, die beim Auswerten das Trennen von Feldern und Datensätzen erleichtern. Dies können Kommas oder Doppelpunkte oder andere Separatorenzeichen sein, die zu diesem Zwecke eingefügt wurden. Snowflake hat vor diesem Hintergrund seine Datenwolke „aufgepimpt“: Neben den leichter zu verwertenden strukturierten und halb-strukturierten Daten will Snowflake künftig, auch besagte unstrukturierte handhaben können.

Kunden werden demnächst – so die Ankündigung – auch diese Daten orchestrieren können. Ihnen soll eine granulare Verwaltung unstrukturierter Dateien und Metadaten ermöglicht werden. Diese Funktion befindet sich derzeit im „Private Preview“-Status.

Zeilenzugriffsrichtlinien

Noch im Laufe dieses Jahres soll eine andere Funktion in den „Private-Preview“-Status – also eine Art Early-Access-Option für interessierte Nutzer – kommen: Zeilenzugriffsrichtlinien. Damit können Snowflake-Kunden einschränken, wer ausgegebene Ergebnismengen bei der Ausführung von Datenabfragen sehen kann. Richten Kunden übergreifende Richtlinien zur Zugriffsbeschränkung ein, brauchen sie sich nicht mehr bei jeder Einzelabfrage um die betreffenden Einschränkungen zu kümmern. Sicherheitsverantwortliche können sicherstellen, dass die Richtlinien auf alle auf der Plattform ausgeführten Arbeitslasten angewendet werden. Beispielsweise kann das Sicherheitsteam eines Unternehmens problemlos eine Richtlinie implementieren, die den Vertriebsmitarbeitern im Unternehmen nur die Zeilen mit Kundendaten zurückgibt, die sie sehen müssen. Und nicht Kundendaten, die mit anderen Vertriebsmitarbeitern verknüpft sind. Mit Zeilenzugriffsrichtlinien sollen auch Datenschutzbestimmungen besser eingehalten werden können.

Neue Datendienste

Der Snowflake Data Marketplace ermöglicht es Nutzern, auf Datensätze von rund 100 Drittanbietern zuzugreifen, ohne Dateien kopieren oder die Daten verschieben zu müssen. Ab sofort umfasst der Marktplatz auch Angebote von Data Service Providern. Nutzer des Data Marketplace können sich einen bidirektionalen Live-Zugriff auf die Daten einrichten, die sie von einem Data Service Provider verarbeitet haben möchten. Data Service Provider können dann Datenanreicherungen durchführen. Dabei geht es um Predictive-Analytics-Vorhersagen, wie beispielsweise Risikobewertungen von Kunden oder die Erweiterung von Datensätzen durch Verhaltens-Scoring, etwa um potenzielle Kündigerkandidaten von Bestandsverträgen zu eruieren.

Datennetzwerkeffekt

Viele Verantwortliche haben Schwierigkeiten damit, die Daten ihres Unternehmens so zu mobilisieren, dass sie sich einen Vorteil verschaffen, sagt Benoit Dageville, Snowflake-Mitgründer. Dank eigener Daten und jener kommerziellen Datenanbietern, entstünde „ein starker Datennetzwereffekt, der es Unternehmen ermöglicht, Innovationen voranzutreiben und sich neue Einnahmequellen zu erschließen.“

(ID:47002126)