Suchen

Amazon Web Service Data Pipeline als Beta gestartet EC2-Instanzen und AWS für Big Data

| Autor / Redakteur: Dirk Srocke / Elke Witmer-Goßner

Mit dem jetzt von Amazon angekündigten Dienst AWS Data Pipeline sollen Kunden Daten automatisiert zwischen verschiedenen Services und Speichern austauschen. Zudem gibt es zwei weitere EC2 Instance Types.

Firma zum Thema

Zur Definition einer Pipeline gehören Datenquellen, Voraussetzungen, Ziele, Prozessschritte und ein Ablaufplan.
Zur Definition einer Pipeline gehören Datenquellen, Voraussetzungen, Ziele, Prozessschritte und ein Ablaufplan.
(Bild: AWS)

Neben dem Data Warehouse Service Redshift hat Amazon auf der Nutzerkonferenz re:Invent einen weiteren Amazon Web Service vorgestellt: Der AWS Data Pipeline soll Anwendern helfen, Datenworkflows zwischen verschiedenen Speichern und Diensten einzurichten.

Zur Definition einer Pipeline gehören dabei Datenquellen, Voraussetzungen, Ziele, Prozessschritte und ein Ablaufplan. Konkret können Anwender damit also Daten verschiedenster Quellen und Formate zusammenstellen, bearbeiten und zurückschreiben. Der Service überwacht Vorbedingungen auch selbstständig und führt die Aktionen dann automatisiert durch.

Amazon positioniert den Service als Werkzeug für das Data Mining und wirft die Schlagworte "Big Data" und "Business Intelligence" in den Raum. Anwender sollen etwa in Webserver-Logs, relationalen Datenbanken oder NoSQL-Datenbanken nach verborgenen Informationszusammenhängen suchen. AWS Data Pipeline läuft auf EC2-Instanzen, Elastic MapReduce Clusters oder physischen Systemen. Derzeit befindet sich der Dienst allerdings noch in einer geschlossenen Beta. Weitere Details gibt es bei AWS.

Des Weiteren hat Amazon zwei weitere EC2-Instanztypen vorgestellt: Der für In-Memory-Anwendungen gedachte Cluster High Memory Instance Type (cr1.8xlarge) beinhaltet 240 GByteRAM sowie zwei SSDs mit je 120 GByte. Speziell für umfangreiche Analysen und Hadoop-Anwendungen offeriert Amazon den High Storage Instance Type (hs1.8xlarge) mit 117 GByte RAM und 48 TByte Festplattenspreicher (24 Laufwerke mit je 2 TByte).).

(ID:37108270)