Azure Data Catalog Metadaten über die Cloud bereitstellen

Autor / Redakteur: Thomas Joos / Elke Witmer-Goßner

In vielen Unternehmen werden wichtige Daten an verschiedenen Stellen gespeichert und mit unterschiedlichen Werkzeugen analysiert. Dabei bleiben viele Informationen ungenutzt und Unternehmen müssen zahlreiche verschiedene Werkzeuge zur Verfügung stellen. Azure Data Catalog soll die Unternehmensdaten bündeln und sicher zentral zur Verfügung stellen.

Firma zum Thema

Daten sind heutzutage für Unternehmen wertvoll wie bare Münze und sollten mit entsprechenden Werkzeugen stets verfügbar gehalten werden.
Daten sind heutzutage für Unternehmen wertvoll wie bare Münze und sollten mit entsprechenden Werkzeugen stets verfügbar gehalten werden.
(Bild: Imagewll10, Fotolia)

Die Analyse von Daten ist derzeit einer der Bereiche, die bei Microsoft im Fokus stehen. Die Redmonder bieten zahlreiche neue Dienste an, mit denen Unternehmen ihre Daten wesentlich besser analysieren können, als mit herkömmlichen Mitteln. Die meisten der neuen Werkzeuge konzentrieren sich auf die Cloud, vor allem auf Microsoft Azure. Aber auch der neue persönliche Assistent „Cortana“ von Windows 10 sowie die Integration von Office 365 spielen eine wichtige Rolle.

In den meisten Unternehmen gibt es zahlreiche verschiedene Datenquellen, die sich für eine gemeinsame Analyse nur schwer vereinen lassen. Hier setzt Microsoft mit Azure Data Catalog an. In dem verwalteten Cloud-Dienst bündeln Verantwortliche die verschiedenen Datenquellen im Unternehmen. Dazu werden im Assistenten von Azure Data Catalog zunächst die verschiedenen Quellen angebunden.

Danach lassen sich Benutzer festlegen, die das Recht haben die Daten auszuwerten. Auf die Daten kann mit Excel, SQL-Tools oder andere Analyse-Tools zugegriffen werden. Die Benutzer werden über Azure Active Directory authentifiziert. Arbeiten diese mit Windows 10, lassen sich deren Rechner direkt über das Betriebssystem anbinden. Mit entsprechender Berechtigung können auch Anwender Daten integrieren und für andere Benutzer freigeben.

Einsatzszenarien

Die meisten Unternehmen nutzen verschiedene Datenquellen, die aber nicht von allen Anwendern zugreifbar sind. Was zum Beispiel Geschäftsführer interessieren dürfte, ist die Frage: „Wo finde ich die belastbaren Verkaufszahlen des letzten Jahres?“ Oder auch: „Stimmen die Zahlen in diesem Bericht?“ Benutzer können verschiedene Datenquellen in Azure Data Catalog registrieren und für andere Benutzer freigeben. Alle Anwender können freigegebene Daten auf Basis ihrer Berechtigung nutzen, verifizieren und vergleichen. Dabei spielt es keinerlei Rolle, aus welcher Quelle die Daten stammen, solange die Datenquelle verifiziert und mit Azure Data Catalog verbunden ist.

Bildergalerie

Anstatt auf Berichte von Fachabteilungen zu warten, können sich berechtigte Anwender auf Basis von Self Service Business Intelligence eigene Berichte erstellen, die produktive Daten nutzen, aber die Datenquellen nicht beeinträchtigen. Bei Self Service Business Intelligence muss die Oberfläche leicht verständlich und schnell umsetzbar sein, unabhängig davon woher die Daten stammen.

Sobald Administratoren die einzelnen Datenquellen an Azure Data Catalog angebunden, die Rechte verteilt, und die Umgebung konfiguriert haben, können Anwender den Cloud-Dienst nutzen und die Unternehmensdaten effizient analysieren. Neben der Möglichkeit mit Power Query zu arbeiten, bietet Azure Data Catalog auch die Möglichkeit an, sich mit Power BI zu verbinden, der Business-Intelligence-Lösung in Office 365. Die Daten lassen sich filtern, auch im Webportal, und mit verschiedenen Werkzeugen weiter verarbeiten.

Bildergalerie

Der Vorteil der Metadaten-Lösung ist die zentrale Oberfläche und Sammelstelle, um alle Arten von Unternehmen zu filtern, zu sammeln und zu analysieren. Neben Quellen in Microsoft Azure lassen sich auch lokale Datenbanken anbinden. Dabei muss es sich nicht unbedingt um SQL-Server handeln, sondern auch Oracle-Datenbanken und andere Quellen stehen zur Verfügung.

Datenquelle anbinden

Die Anbindung der Datenquellen läuft über einen Assistenten. Sobald Administratoren zum Beispiel einen Datenbank-Server angebunden haben, lässt sich genau festlegen welche Datenbanken und welche Objekte in den Datenbanken in Azure Data Catalog integriert werden sollen. Bei den Objekten lassen sich die einzelnen Datenbanken bis auf Tabellen und Sichten herunterbrechen. Außerdem lässt sich festlegen, welcher Benutzerkreis die aktuelle Datenquelle nutzen darf.

Nur die Verweise zu den Datenquellen, inklusive der Berechtigungen, werden in der Cloud gespeichert. Die Daten selbst bleiben immer in der Datenquelle gespeichert und werden nicht beeinträchtigt, repliziert oder sonst wie übertragen. Das erhöht die Sicherheit der Daten und Anwender arbeiten immer mit aktuellen Daten, da die produktive Quelle ständig auch aktuell ist. Die Datenquellen können in Microsoft Azure gespeichert sein oder auf lokalen Servern im Unternehmen. Woher die Daten stammen, spielt für die Anwender keine Rolle, denn diese arbeiten nur noch mit dem Datenkatalog in Azure.

Daten analysieren

Sobald die Datenquellen hinterlegt sind, können Administratoren in Microsoft Azure umfangreiche Filter anlegen, mit Tags arbeiten und Anwender können Daten filtern und analysieren. Die Daten aus der Datenquelle sind sofort verfügbar. Anwender können die einzelnen Datenquellen und deren Objekte mit Beschreibungen und Metadaten konfigurieren und auf diesem Weg besser mit anderen Daten zusammen analysieren. Microsoft hat darauf Wert gelegt, dass sich die einzelnen Daten leicht durchsuchen und filtern lassen. Dazu steht in der Weboberfläche ein Assistent zur Verfügung (siehe Abb. 1).

Wie dieser bedient wird, zeigt Microsoft in einem Online-Video. Die Daten lassen sich mit beliebigen Clientanwendungen analysieren. Die Standardprogramme Excel und Visual Studio stehen natürlich ebenfalls zur Verfügung, genauso wie die Analysewerkzeuge in Office 365 und Microsoft Azure. Die Verbindung zu den Clientanwendungen kann direkt über das Azure-Portal erfolgen. Anwender müssen also keine komplizierten Verbindungen zwischen ihrem Rechner und der Cloud konfigurieren. Azure Data Catalog zeigt aber auch Verbindungs-URLs an, mit denen sich Anwender über jedes kompatible Tool mit dem Katalog verbinden können. Verantwortliche Anwender können wiederum festlegen, welche anderen Anwender Zugriff auf die einzelnen Datenquellen erhalten sollen.

Wie alle Dienste in Microsoft Azure, wird auch Azure Data Catalog nach Nutzung abgerechnet. Unternehmen können mit 50 Anwendern den Dienst kostenlos testen. Um später den Dienst optimal zu nutzen, müssen Unternehmen pro 100 Benutzer mit aktuell 42 Euro pro Monat rechnen. Die maximale Anzahl an Katalogobjekten ist bei der kostenlosen Version 5.000 und bei der kostenpflichtigen Standard-Version 100.000. Die kostenlose Version reicht für erste Tests problemlos aus.

Bildergalerie

Erste Schritte und Tests

Um Azure Data Catalog zu testen, reicht ein kostenloses Probe-Abonnement von Microsoft Azure aus. Für die Anbindung eigener Datenquellen stellt Microsoft eine Beispieldatenbank zur Verfügung. Die ersten Schritte können sich Administratoren über ein Lernprogramm selbst beibringen. Für den produktiven Einsatz von Azure Data Catalog benötigen Unternehmen ein Verzeichnis in Azure Active Directory. Denn hier werden die Anmeldedaten der Benutzer verwaltet, die Zugriff auf die Datenquellen erhalten sollen. Sobald ein Azure-Abonnement vorliegt, kann eine Anmeldung an Azure Data Catalog erfolgen. Über einen Assistenten lässt sich der Katalog einrichten (siehe Abb. 2).

Die Cortana Analytics Suite soll die verschiedenen Cloud-Dienste in Microsoft Azure bündeln und auf Wunsch auch mit dem persönlichen Assistenten in Windows 10 zur Verfügung stellen. Dieser kann in diesem Bereich auch auf andere Daten zugreifen, auch auf Informationen in SharePoint Online und Exchange Online aus Office 365. Cortana Analytics Suite fasst die Dienste Power BI, Azure Machine Learning, Azure HDInsight, Azure Stream Analytics, Azure Data Lake, Azure SQL Data Warehouse, Azure Data Factory, Azure Data Catalog, Azure Event Hubs und weitere zu einem zentralen Werkzeug zusammen.

Note „Empfehlenswert“

Azure Data Catalog stellt ein weiteres Analysewerkzeug dar, mit dem Unternehmen in heterogenen Umgebungen besser Daten analysieren können. Anstatt sich mit Replikations- und Synchronisierungsmechanismen, Berechtigungen, veralteten Daten und anderen Problemen herumzuschlagen, müssen Administratoren die gewünschten Quellen nur anbinden und Anwendern zur Verfügung stellen. Dadurch lassen sich Unternehmensdaten einfacher, kostensparender und effizienter analysieren. Da der Katalog kostenlos getestet werden kann, auch mit produktiven Daten, sollten sich Unternehmen die Möglichkeiten von Azure Data Catalog ansehen. Der Katalog ist in wenigen Minuten einsatzbereit und erfordert keinerlei Verwaltungsaufgaben.

Bildergalerie

(ID:43666736)