Suchen

Trifacta und Google bereiten Daten auf GCP auf Google Cloud Dataprep vorgestellt

Autor / Redakteur: Dirk Srocke / Dipl.-Ing. (FH) Andreas Donner

Gemeinsam mit Trifacta entwickelt Google einen Dienst zur Datenaufbereitung. Mit dem Google Cloud Dataprep genannten Angebot sollen Analysten verschiedenartige Datasets für ein breites Spektrum an Downstream-Einsätzen aufbereiten.

Firmen zum Thema

Der Dienst bereitet als CSV, JSON oder Tabellenformat vorliegende Daten zur Analyse auf.
Der Dienst bereitet als CSV, JSON oder Tabellenformat vorliegende Daten zur Analyse auf.
(Bild: Google/ YouTube)

Mit Google Cloud Dataprep können Nutzer strukturierte und unstrukturierte Daten für die weitere Analyse aufbereiten – ein Vorgang der üblicherweise fast 80 Prozent der eigentlichen Zeit für Datenauswertungen in Anspruch nehme. Die gemeinsam mit Trifacta entwickelte Lösung soll diesen Prozess beschleunigen.

Als Quellen akzeptiere der Dienst dabei Datenbestände beliebiger Größe und in gängigen Formaten, darunter CSV, JSON oder relationale Tabellenformate. Nutzer können die Daten dann per Webbrowser visuell erkunden, säubern und für die Weiterverarbeitung vorbereiten – sei es für Analytics, maschinelles Lernen oder sonstige Anwendungen. Dataprep unterstützte Nutzer dabei auch mit automatisierten Funktionen und spürt selbstständig Datenanomalien auf.

Google Cloud Dataprep nutzt eine von Trifacta stammende Benutzeroberfläche sowie das Photon Compute Framework. Der Dienst ist nahtlos mit Google Cloud Dataflow intergiert und ermögliche so eine serverlose, selbst skalierende Ausführung bewährter Datenaufbereitungsverfahren.

Aktuell ist Dataprep als geschlossene Beta verfügbar, ausgewählte Teilnehmer müssen während der Testphase lediglich für die genutzten Ressourcen von Cloud Dataflow, BigQuery und Cloud Storage zahlen. Details und Anmeldung finden Interessenten direkt bei Google.

(ID:44572005)