Hadoop Summit 2015

Wachsendes Interesse am Big Data Framework Hadoop

Seite: 2/2

Firmen zum Thema

ODP soll Verbreitung fördern

In Brüssel haben Hortonworks, IBM und die EMC-Tochter Pivotal rund 60 Tage nach der Ankündigung der „Open-Data-Platform“-Initiative (ODP) bekannt gegeben, dass ihre jeweiligen, auf Hadoop basierenden Plattformprodukte jetzt auf einem gemeinsamen ODP-Kern von Apache Hadoop 2.6 (inklusive HDFS, YARN und MapReduce) sowie auf Apache Ambari 2.0 basieren. Die Harmonisierung von Hortonworks Data Platfom 2.2, IBM Open Platform 4.0 mit Apache Hadoop und Pivotal HD 3.0 soll Kompatibilitätsprobleme verringern und Unternehmenskunden das Testen und Validieren erleichtern.

Dazu Shaun Connolly, Vice President of Corporate Strategy bei Hortonworks: „Wir bei Hortonworks sind davon überzeugt, dass Innovationen nicht isoliert entstehen, sondern durch Zusammenarbeit. Die Harmonisierung um einen gemeinsamen Kern von Apache Hadoop herum verringert die Komplexität und dient zum Aufbau von Interoperabilität im gesamten Hadoop-Ökosystem. Wir freuen uns, dass die ODP in weniger als 60 Tagen nach ihrer Gründung die Standardisierung zwischen den Plattformen von Hortonworks, IBM und Pivotal in der Industrie voranbringt. Indem wir den Einsatz von Apache Hadoop verbessern, beschleunigen wir den Innovationsprozess und letztendlich auch das Wachstum dieses Marktes.“

Weitere Mitglieder der jungen Brancheninitiative sind GE, Infosys, SAS, Attiscale, Capgemini, CenturyLink, EMC, PLDT, Splunk, Teradata, Verizon, VMware sowie WANdisco. Sowohl Cloudera als auch MapR fehlen und derzeit sieht es nicht so aus, als ob sich die Unternehmen der ODP-Initiative anschließen wollen.

Umfangreiche Verbesserungen bei HDP

Auf dem Summit hat Hortonworks eine Reihe von Verbesserungen und Weiterentwicklungen rund um die Hortonworks Data Platform vorgestellt. Kernstück der Neuerungen in Version 2.2 ist das Provisioning- und Management-Tool für Hadoop-Cluster „Ambari“, das kürzlich in Version 2.0 erschienen ist.

Ambari 2.0 bietet rollierende Upgrades: Administratoren können Downtimes verringern, indem sie ihre Hadoop Cluster automatisiert mithilfe von Ambari oder bereits im Unternehmen vorhandenen Standard-Scripting-Tools aktualisieren. Darüber hinaus profitieren Anwender jetzt von einer zentralisierten Verwaltung von Alarmen und Metriken.

Auch bei der Sicherheit bietet HDP 2.0 eine Reihe von wesentlichen Verbesserungen: So enthält die jüngste Version ein einfacheres Authentifizierung-Setup, das auf Kerberos zurückgreift und sich mit wenigen Klicks konfigurieren lässt. Zugleich laufen Installation und Konfiguration von Apache Ranger, dem Sicherheitsmanagement-Tool für Hadoop, jetzt vollautomatisch ab, sodass es für Administratoren ein Leichtes ist, Sicherheitsrichtlinien zentral zu verwalten.

Apache Spark

Die HDP 2.2 enthält jetzt auch Apache Spark in der stabilen Version 1.2.1 und bietet damit Spark-Anwendungsentwicklern eine Plattform für die lokale Entwicklung oder für Spark-Anwendungen in der Cloud.

Trusted Governance in der Apache Community

Auf dem Brüsseler Summit wurden Neuigkeiten rund um die Data Governance Initiative (DGI) bekannt: Die Initiative hat Zuwachs bekommen – Entwickler von JPMorgan Chase und von Schlumberger haben sich der Initiative angeschlossen und arbeiten nun mit Entwicklern von Hortonworks, Aetna, Merck, Target und SAS zusammen, um die Anforderungen von Großunternehmen an eine umfassende Data Governance innerhalb der Apache Open Source Community voranzubringen.

Im Bereich Data Governance wurde der Apache Software Foundation in diesem Zusammenhang ein neues Projekt vorgeschlagen – „Apache Atlas“. Dieses zielt darauf ab, Datenklassifizierung, ein zentralisiertes Prüfungswesen, Suchfunktionen und Informationen zur Datenherkunft in Kombination mit einer Sicherheits- und Richtlinien-Engine bereitzustellen.

(ID:43347073)