Amazon Web Service Data Pipeline als Beta gestartet

EC2-Instanzen und AWS für Big Data

| Autor / Redakteur: Dirk Srocke / Elke Witmer-Goßner

Zur Definition einer Pipeline gehören Datenquellen, Voraussetzungen, Ziele, Prozessschritte und ein Ablaufplan.
Zur Definition einer Pipeline gehören Datenquellen, Voraussetzungen, Ziele, Prozessschritte und ein Ablaufplan. (Bild: AWS)

Mit dem jetzt von Amazon angekündigten Dienst AWS Data Pipeline sollen Kunden Daten automatisiert zwischen verschiedenen Services und Speichern austauschen. Zudem gibt es zwei weitere EC2 Instance Types.

Neben dem Data Warehouse Service Redshift hat Amazon auf der Nutzerkonferenz re:Invent einen weiteren Amazon Web Service vorgestellt: Der AWS Data Pipeline soll Anwendern helfen, Datenworkflows zwischen verschiedenen Speichern und Diensten einzurichten.

Zur Definition einer Pipeline gehören dabei Datenquellen, Voraussetzungen, Ziele, Prozessschritte und ein Ablaufplan. Konkret können Anwender damit also Daten verschiedenster Quellen und Formate zusammenstellen, bearbeiten und zurückschreiben. Der Service überwacht Vorbedingungen auch selbstständig und führt die Aktionen dann automatisiert durch.

Amazon positioniert den Service als Werkzeug für das Data Mining und wirft die Schlagworte "Big Data" und "Business Intelligence" in den Raum. Anwender sollen etwa in Webserver-Logs, relationalen Datenbanken oder NoSQL-Datenbanken nach verborgenen Informationszusammenhängen suchen. AWS Data Pipeline läuft auf EC2-Instanzen, Elastic MapReduce Clusters oder physischen Systemen. Derzeit befindet sich der Dienst allerdings noch in einer geschlossenen Beta. Weitere Details gibt es bei AWS.

Des Weiteren hat Amazon zwei weitere EC2-Instanztypen vorgestellt: Der für In-Memory-Anwendungen gedachte Cluster High Memory Instance Type (cr1.8xlarge) beinhaltet 240 GByte RAM sowie zwei SSDs mit je 120 GByte. Speziell für umfangreiche Analysen und Hadoop-Anwendungen offeriert Amazon den High Storage Instance Type (hs1.8xlarge) mit 117 GByte RAM und 48 TByte Festplattenspreicher (24 Laufwerke mit je 2 TByte).).

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 37108270 / Datenbanken / Big Data)