Hortonworks
Das rund 300 Mitarbeiter starke Unternehmen und Hersteller der gleichnamigen Hadoop-Distribution aus Palo Alto hat im Februar eine Strategie-Allianz mit Red Hat bekannt gegebenen, woran sich unschwer erkennen lässt, dass derzeit alle IT- und Open-Source-Schwergewichte in der einen oder anderen Weise massiv in Big Data investieren. Auch mit Microsoft gibt es seit 2011 eine Zusammenarbeit.

In deren Rahmen setzen die Redmonder Hortonworks-Technik in ihrer eigenen Hadopp-Distribution für Windows Azure und Windows Server ein. Ebenfalls im Februar hat Hortonworks die Verfügbarkeit der Beta-Version seiner „Hortonworks Data Platform for Windows“ angekündigt, die unter anderem Fundament der in gleichem Monat angekündigten Preview-Version von Windows „Azure HDInsight“ist, das erstmals „Hadoop 2.2“ (YARN) in Azure verfügbar macht.
Auch die Zusammenarbeit mit Red Hat sieht vor, dass beiden Unternehmen ihre Produktlinien besser aufeinander abstimmen und gemeinsame Lösungen auf den Markt bringen. Beide Unternehmen haben im Februar das Beta-Programm des Hortonworks Data Platform (HDP) Plugins für Red Hat Storage angekündigt. Den aktuellen Stand der Zusammenarbeit haben beiden Unternehmen auf dem im vergangenen Monat über die Bühne gegangenen Red Hat Summit demonstriert.
Hortonworks, als vollständig quelloffen erhältliches Framework orientiert sich zudem möglichst am Hadoop-Standard. Zudem fließen sämtliche von Hortonworks voran getriebenen Weiterentwicklungen unmittelbar in das Open-Source-Projekt der Apache Software Foundation ein. Laut Hortonworks` Vice President Coporate Strategy verstehe das Unternehmen seine Distribution primär als Ergänzung zur konventionellen Datenhaltung. Das mache es für Partnerunternehmen wie Microsoft und Red Hat relativ leicht, die „Hortonworks Data Platform“ (HDP) zu integrieren beziehungsweise als OEM-Produkt zu vermarkten.
Denn Hortonworks paketiert und versioniert im Wesentlichen den Hadoop-Core und die verschiedenen Tools aus dem Hadoop-Universum. Die Installation erfolgt bei Hortonworks im Gegensatz zu Cloudera vorwiegend manuell, ist aber sehr gut dokumentiert und eine Web-basierte Cluster-Vewaltung ist mit „Apache Ambari“ inzwischen ebenfalls möglich.
Features für die Echtzeitanalyse
Eine Echtzeitanalyse, wie in Cloudera bereits enthalten, können Hortonworks-Nutzer mit dem auf „Apache Lucene“ basierenden Projekt „Elasticsearch“ realisieren. Elasticsearch muss allerdings manuell parallel zu Hortonworks installiert werden und kann Daten aus CRM- und ERP-Systemen auswerten, sowie Click-Streams und Log-Informationen.
Prominente Hortonworks-Nutzer sind zum Beispiel XING, WD oder Bloomberg. Das Unternehmen Hortonworks ist zudem auch die treibende Kraft hinter dem Hadoop-2.0-Standard YARN. Auch wenn für Hortonworks selbst keine Lizenzgebühren zu bezahlen sind, verdient das Unternehmen sein Geld mit Support-Gebühren (Enterprise Hadoop) für Hadoop, die nach der Größe des Hadoop-Clusters gestaffelt sind.
Artikelfiles und Artikellinks
(ID:42695649)