:quality(80)/images.vogel.de/vogelonline/bdb/1779100/1779152/original.jpg)
„Big Data ist kein Zauberstab.“ Big-Data-Analysen - die Tools komplex, das Know-how gering
Rapid-I bietet Open-Source-Lösungen für Data- und Text-Mining sowie für die Prädiktive Analyse. Radoop wiederum ist die zum Unternehmen gewordene Ausgründung der University of Technology and Economics in Budapest. Die beiden Firmen haben sich zusammen getan und bieten nun eine Möglichkeit, Datenvolumen im Terabyte- und Petabyte-Bereich zu analysieren. Mehr dazu im Interview.

Big Data ist für viele per Definition eine Open-Source-Thema. Zugleich steht der Bedarf an neuen Anwendungen, die den Schatz, der in Rohdaten, Daten aus Sozialen Netzen, Maschinendaten, Textdaten verborgen liegt, heben können, außer Frage. Mit Rapid-I und Radoop haben sich zwei Open-Source-Spezialisten gefunden, die antreten, genau das zu tun.
Dem Interview stellten sich Ingo Mierswa, Geschäftsführer von Rapid-I und Zoltán Prekopcsák, Geschäftsführer von Radoop. Sie erläutern nicht nur, was die Anwender von ihrer Zusammenarbeit erwarten dürfen, sondern auch, wo es im Big-Data-Umfeld noch hakt.
Wie kam die Zusammenarbeit zwischen Radoop und Rapid-I zustande?
Zoltan Prekopcsák: Wir sind langjährige Anwender von RapidMiner und haben tolle Gespräche mit Rapid-I-Leuten bei Business-Intelligence-Konferenzen und bei den RCOMM-Konferenzen geführt. Beide Arbeitsteams haben einen akademischen Hintergrund und wir teilen eine Begeisterung für Datentechnologien, was die Zusammenarbeit sehr leicht gemacht hat.
Eines der ersten Ergebnisse dieser Zusammenarbeit war die Rapid-Miner-Extension Radoop. Was bietet diese Extension ihren Anwendern?
Ingo Mierswa: Radoop verbindet die Stärken von Rapid Miner und Hadoop. Das Ergebnis ist eine Rapid-Miner-Extension für die Aufbereitung und die Durchführung von ETL, Datenanalysen und Prozessen des maschinellen Lernens über Hadoop. Radoop integriert die hochoptimierten Datenanalysefähigkeiten von „Hive“ und „Mahout“ eng in die benutzerfreundliche Rapid-Miner-Oberfläche. Entstanden ist dadurch eine leistungsfähige und bedienungsfreundliche Datenanalyse-Lösung für Hadoop.
Zoltan Prekopcsák:: Radoop ermöglicht es Rapid-Miner-Anwendern, auf die in Hadoop-Clustern gespeicherten großen Daten zuzugreifen und diese zu analysieren. Jetzt ist es möglich, auch Terabyte und Petabyte von Daten von derselben intuitiven Oberfläche aus zu analysieren. Man kann ETL und Data-Mining-Prozesse konstruieren, die auf dem Hadoop-Cluster laufen, sowie Beispieldaten in Rapid-Miner visualisieren.
Wir haben begonnen, komplizierte verteilte Technologien wie Hadoop einzusetzen, aber die Arbeit damit hat sich als sehr schwierig erwiesen. Wir wollten diese Lücke mit Radoop füllen und gleichzeitig die Leistungsstärke verteilter Systeme und eine bedienungsfreundliche Oberfläche zur Verfügung stellen.
Welche Auswirkung wird dieses Produkt auf Big-Data-Analysen haben?
Ingo Mierswa: Während andere Unternehmen noch von Big Data und der Überwindung damit verbundener Probleme sprechen, freuen wir uns, bereits die Lösung für die einfache Konstruktion von Datentransformationen und analytischen Prozessen auf Basis von Hadoop bekannt geben zu können.
Zoltan Prekopcsák:: Sehe ich auch so. Big-Data-Tools sind heute äußerst kompliziert, müssen manuell definiert werden und erfordern zudem Programmierkenntnisse. Experten sind also schwer zu finden. Mit ihrer grafischen Drag&Drop-Benutzeroberfläche zur Definition von Workflows erleichtern Radoop und Rapid Miner Big-Data-Analysen erheblich. Viele Unternehmen haben bereits den einen oder anderen Big-Data-Experten, aber die sind dann die einzigen, die auf Daten zugreifen und diese analysieren können. Mit Radoop soll dies noch vielen Analysten – auch Nichttechnikern – ermöglicht werden.
Ingo Mierswa: Unternehmen, die Big Data noch nicht analysieren, bekommen hier eine Gelegenheit dazu. Dank der Einfachheit von Radoop können sie ihre ersten Schritte auf diesem Gebiet machen, ohne für diese Aufgabe extra Experten anstellen zu müssen. Auch wenn die Auswirkung für Big-Data-Anfänger am größten sein könnte, bietet Radoop so viele Funktionalitäten und Abkürzungen für typische Aufgaben an, dass auch Experten viel produktiver werden.
(ID:36561910)