Data Factory – skalierte Datendienste in Microsoft Azure
Mit Data Factory lassen sich wiederum Datendienste erstellen, planen und überwachen. Das ermöglicht das Verwenden von Pipelines, über die von verschiedenen Quellen Daten in Microsoft Azure eingehen und entsprechend analysiert werden. Data Factory kann den Status der Datenpipeline überwachen und visualisieren. Das ist vor allem daher sinnvoll, da Entwickler Quellen aus der Cloud und von lokalen Servern anbinden können. Vor allem beim Einsatz sehr vieler verschiedener Datenquellen ist es sinnvoll, diese erst in eine Art Ordnung zu bringen, für die Analyse vorzubereiten, gegebenenfalls zu transformieren und zu analysieren und danach für die weitere Analyse zu verwenden.
Bildergalerie
Data Factory bindet, einfach ausgedrückt, zahlreiche Quellen an und kann auf Wunsch bestimmte Daten auch gleich an beliebige Speicherorte für die Weiterbearbeitung verschieben (Data Movement-as-a-Service). Im Rahmen der Vorgänge lassen sich die Daten auch gleich transformieren und analysieren.
Die Daten lassen sich in HDInsight integrieren oder in Machine Learning anbinden. Dadurch lassen sich zahlreiche verschiedene Datenquellen effizient orchestrieren und in einer Pipeline einbinden. Die gesammelten Rohdaten werden über Pipelines an beliebige BI-Tools weitergegeben.
Alle Daten werden in einem zentralen Instrument visualisiert und sind auf diesem Weg auch überwachbar. Außerdem lassen sich zahlreiche Automatismen einbinden, welche die Verarbeitung der Daten noch verbessern.
Microsoft Azure Data Catalog
Azure Data Catalog hat ebenfalls die Aufgabe, verschiedene Datenquellen im Unternehmen oder der Cloud anzubinden und zur Analyse zur Verfügung zu stellen. Außerdem lässt sich festlegen, welche Anwender das Recht erhalten sollen, die verschiedenen Quellen zu analysieren. Auf die angebundenen Datenquellen können nicht nur Serverdienste zur Analyse zugreifen, sondern auch Anwender mit Excel und anderen Tools.
Auch Azure Data Catalog zeichnet sich dadurch aus, dass der Dienst mit anderen Diensten in Microsoft Azure zusammen funktioniert, aber auch Daten nach extern liefern kann, zum Beispiel zu PowerBI. Entwickler können die Daten jederzeit filtern lassen und mehrere Datenquellen zusammenfassen, mit Data Factory in Pipelines zusammenfassen und danach Anwendern zur Verfügung stellen. Data Factory bietet die Unterstützung für zahlreiche Quellen und kann dabei auch sehr detailliert vorgehen. Anwender müssen nicht unbedingt Zugriff auf eine komplette Datenbank erhalten oder alle Tabellen, Zeilen, Spalten oder Sichten. Administratoren können festlegen, welche Daten durch Anwender gelesen werden dürfen.
Im Gegensatz zu Data Factory kann Data Catalog aber keine Daten verschieben. Alle Daten bleiben in den Quellen, die an Data Catalog angebunden sind, nur die Konfiguration zur Anbindung der Datenquellen wird in der Cloud gespeichert. Anwender verbinden sich aber wiederum mit der Schnittstelle von Data Catalog in der Cloud. Im Hintergrund findet dann die authentifizierte und abgesicherte Verbindung zum entsprechenden Dienst statt, der die Daten tatsächlich speichert.
SQL Database Elastic Pool
Datenbanken im SQL Database Elastic Pool werden automatisch gesichert und bei der Wiederherstellung im gleichen Pool integriert. Die Elastic Pools in SQL Azure bieten die Möglichkeit, die Speichergrößen und Leistung für einen Pool an Datenbanken festzulegen. Administratoren können im laufenden Betrieb Datenbanken zu den Pools hinzufügen oder aus diesen entfernen. Entwickler und Administratoren können Datenbanken und deren Inhalt in Microsoft Azure verschlüsseln, wie Datenbanken auf lokalen SQL-Servern mit SQL Server 2014.
Die Verschlüsselung wird jetzt auch in Azure Storage unterstützt. Bei Azure SQL Data Warehouse handelt es sich um einen Data-Warehouse-as-a-Service-Dienst. Azure SQL Data Warehouse stellt seine Daten auch anderen Diensten zur Verfügung, kann aber auch aus den anderen Diensten Daten erhalten. Sinnvolle Beispiele dafür sind neben PowerBI in Office 365 auch HDInsight, Azure Machine Learning und Azure Data Factory.
Fazit
In Microsoft Azure gibt es zahlreiche Dienste, welche die Verarbeitung von Big Data deutlich effizienter gestalten, ohne auf eigene Hardware setzen zu müssen. Da die Dienste getrennt buchbar sind, können Unternehmen sehr flexibel darauf reagieren, welche Dienste sie einsetzen wollen. Um effizient Daten mit Microsoft Azure zu analysieren, sind also nicht alle Dienste auf einmal notwendig. Außerdem müssen die Daten weder in der Cloud gespeichert, noch in die Cloud übertragen werden. Alle Dienste arbeiten auch mit lokalen Serverdiensten zusammen, auch von anderen Herstellern.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.