Visuelles Data Mining und Predictive Analytics Business Intelligence mit BIRT Analytics von Actuate

Autor / Redakteur: Wilfried Platten / Florian Karlstetter

BIRT Analytics verspricht die schnelle, grafikgestützte Analyse großer Datenmengen für Fachanwender ohne die Expertise eines Data Scientists.

Firmen zum Thema

BIRT Analytics von Actuate verbindet visuelles Data Mining mit Predictive Analytics und ermöglicht so Analysen großer Datenmengen.
BIRT Analytics von Actuate verbindet visuelles Data Mining mit Predictive Analytics und ermöglicht so Analysen großer Datenmengen.
(© carlos castilla - Fotolia.com)

Actuate ist Hersteller von Business-Intelligence- und Reporting-Software, und zudem Gründer des Open Source Projects BIRT. Aus diesem Projekt ist jetzt das jüngste Angebot von Actuate erwachsen: BIRT Analytics, ein Tool für visuelles Data Mining und Predictive Analytics. Es soll jeden Aspekt der Datenanalyse beschleunigen, von der Daten-Konnektivität und dem Laden der Daten bis zum Verarbeiten der Resultate von analytischen Abfragen.

Über alle Stufen

Hinter den Kulissen arbeitet BIRT Analytics ohne die typischen ETL- und OLAP-Stufen mit den Laden und der Modellierung der Daten. Es erfolgt also kein Pre-Processing und auch keine Würfelbildung (Cubes). Damit wird auch kein Data Warehouse im herkömmlichen Sinne erstellt. Im Hintergrund laufen natürlich verwandte Prozesse ab, diese sind aber für den Anwender unsichtbar. Und mehr verrät Actuate darüber auch nicht.

Bildergalerie
Bildergalerie mit 5 Bildern

Wir befinden uns mit dem Programm also sofort in der dritten und letzten Stufe des datenanalytischen Prozesses. Üblicherweise braucht man dafür Spezialisten, häufig als Data Scientists bezeichnet, denen als „Collateral-Profiteure der Big Data Welle“ eine glänzende Zukunft prognostiziert wurde und wird. Doch damit könnte es schnell vorbei sein, denn Actuate verspricht, dass für sein Analyse-Tool solche Experten nicht benötigt werden.

Selbstbedienung

In typisch amerikanischer Euphorie berichtet Jeff Morris, Vice President Product Marketing von Actuate, von begeisterten Anwendern, die mit BIRT Analytics zum ersten Mal ganz alleine die komplette Datenbasis analytisch durchforsten: „Oh mein Gott, da sind ja all meine Daten!“. So sollen die Mitarbeiter aus Fachabteilungen auch große und komplexe Datenbestände selbstständig analysieren, und so neue Erkenntnisse aus ihren Daten gewinnen können. Stimmt das, dann wird dadurch die Schnelligkeit und Flexibilität gesteigert, mit der Fachanwender ihre eigenen Analysen erstellen können. Die durch die Inanspruchnahme von Experten zwangsläufig entstehenden, mehr oder minder langen Warteschleifen entfallen. Möglich wird das durch eine Oberfläche, die die intuitive Korrelation von Daten per Drag & Drop gestattet. Damit lassen sich dann, ebenfalls per Drag & Drop, KPIs (Key Performance Indicators), Scorecards, Dashboards und Reports füttern, die dann über die ActuateOne-Plattform im gesamten Unternehmen zur Verfügung stehen.

Big Data

Trotzdem gestattet BIRT Analytics den Zugriff auf unterschiedlichste Datenquellen: Hadoop, NoSQL, NewSQL, Cloud, Social Media, Unternehmensanwendungen, Dokumentenarchive, Druckdaten, Data Warehouses oder Live Data Feeds.

Das riecht natürlich verdächtig nach Big Data – und in der Tat sieht sich Actuate hier gut aufgestellt. Zu den Data Mining Funktionen gehören unter anderem die Generierung von Venn-Diagramme (stellen Relationen wie Differenz- oder Vereinigungsmenge zwischen betrachteten Mengen dar) und Pareto-Verteilungen. Und die Erstellung von Zeitreihen-Extrapolationen gestattet einen mehr oder minder validen Blick in die Zukunft.

Open Source Projekt

Jeff Morris, Vice President Product Marketing von Actuate.
Jeff Morris, Vice President Product Marketing von Actuate.
(Bid: Actuate)
BIRT basiert auf einem Eclipse Open Source Projekt. Gegenüber Konkurrenten, etwa Pentaho, die wie Actuate und BIRT in dem Forrester-Quadranten „Open Source BI Wave“ auftauchen, sieht Morris eine ganze Reihe von Differenzierungsmerkmalen: “Wir stehen nicht in direkter Konkurrenz zu Pentaho. Und das aus mehreren Gründen. Erstens, wir konzentrieren uns auf große Projekte in sehr großen Unternehmen. Zweitens, bei uns ist nur das Kernprodukt Open Source, ergänzt durch kommerzielle Angebote. Und drittens konzentrieren wir uns mit BIRT auf ein singuläres Open Source Projekt. Es wird von über 2 Millionen Entwicklern weltweit genutzt und ist die Basis für unsere ActuateOne-Plattform, mit der Entwickler maßgeschneiderte Anwendungen für Business Analytics und Kundenkommunikation schnell aufsetzen können.“

Multitalent

Die Hauptmerkmale von BIRT Analytics im Überblick:

  • Die BI-Lösung generiert Pareto-Verteilungen, Venn-Diagrammen, Vorhersagen, Trendlinien und Prognosen, ohne dass Nutzer eine besondere Abfragesprache wie R oder SAS beherrschen müssen.
  • Sie skaliert bis zu Milliarden von Datensätzen und funktioniert mit allen Arten von Daten ohne Vor-Modellierung oder Stichproben.
  • Sie setzt keine spezifische Datenstruktur oder Schemata voraus, sondern bietet eine flexible Daten-Architektur.
  • Sie greift auf Web- und Social Media-Datenquellen wie Facebook, Twitter, Salesforce, Google Analytics und CheetahMail zu.
  • Sie kann die Daten und Ergebnisse mit allen ActuateOne-Modulen (Dashboards, Scorecards, interaktiven Reportings und mobilen Darstellungen) teilen, um sie anderen Fachanwendern zur Verfügung zu stellen

Secure Data Room

Die Sicherheitsfunktionen erstrecken sich über verschiedene Stufen auf Nutzer- und Datei-Level: „Wir können sogar den Zugang zu einzelnen Seiten in einem Dokument regeln. Ein bestimmter Anwender darf dann eben aus einem 500 Seiten-Dokument nur die Seiten 30 bis 40 in unserem interaktiven Viewer sehen. Genauso kann geregelt werden, ob der Anwender sie nur sehen, oder auch verändern darf. Das können wir in ActuateOne einstellen“, so Jeff Morris. Mit dieser Zugangs- und Zugriffsvergabe können laut Morris in ActuateOne sogar Secure Data Rooms eingerichtet werden.

Die BIRT Analytics Lizenz besteht aus einer Kombination einer Basis-Lizenz und der Anzahl der analysierten Datenzeilen und Endanwender.

(ID:38270550)