OCR mit Azure Batch und Functions im Eigenbau

Ein Anwendungsbeispiel für Azure Batch OCR mit Azure Batch und Functions im Eigenbau

04.05.2022 Von Dipl. -Ing. Thomas Drilling 6 min Lesedauer

Mit Azure Batch lassen sich unter anderem umfangreiche, auf Parallelverarbeitung ausgelegte HPC-Batchaufträge (High Performance Computing) in Azure ausführen. Entwickler können so z. B. SaaS-Anwendungen oder Client-Apps erstellen, für die große Mengen von Ausführungen benötigt werden.

Für dieses Beispiel benötigen wir ein Batch-Konto auf Microsoft Azure.(Bild: Drilling / Microsoft) — Für dieses Beispiel benötigen wir ein Batch-Konto auf Microsoft Azure.
(Bild: Drilling / Microsoft)

Vom Grundsatz her gestaltet sich die Arbeitsweise mit dem Plattform-Dienst so, dass Azure Batch vollkommen automatisch einen Pool mit Compute-Knoten (VMs) bereitstellt. Dort werden die gewünschten Anwendungen installiert und schließlich deren Ausführung als Aufträge auf den Compute-Knoten eingeplant.

Populäre Beispiele für den Einsatz von Batch-Processing sind Monte-Carlo-Risikosimulationen, die häufig von Finanzdienstleistern eingesetzt werden, oder allgemein das Erstellen von Diensten zur Verarbeitung großen Mengen von Bildern. Auch für so genannte eng gekoppelte Workloads wie FE-Analyse, Strömungssimulation oder das KI-Training mit mehreren Knoten eignet sich Azure Batch gut. Darüber hinaus unterstützt Azure Batch größere Mengen von Rendering-Workloads mit Rendering-Tools wie beispielsweise Autodesk Maya, 3ds Max oder V-Ray.

Haupteinsatzzweck ist aber sicher die Ausführung intrinsisch paralleler Workloads – also Anwendungen, die einerseits unabhängig voneinander ausgeführt werden, bei denen aber jede Instanz quasi nur einen Teil der Arbeit erledigt. Beliebte Beispiele für intrinsisch parallele Workloads, die sich mit Azure Batch ausführen lassen sind neben der bereits erwähnten Bildanalyse und -verarbeitung und der Modellierung von Finanzrisiken mit Monte Carlo-Simulationen, Medientranscodierung, die Datenerfassung-/Verarbeitung im Rahmen von ETL-Vorgängen, die Analyse genetischer Sequenzen, das Ausführen von Softwaretest oder die optische Zeichenerkennung (OCR). Letzte eignet sich im Rahmen dieses Beitrags gut für eine kurze Demo.

Grundlegende Konzepte von Azure Batch

Zuerst müssen wir ein Batch-Konto anlegen.(Bild: Drilling / Microsoft) — Zuerst müssen wir ein Batch-Konto anlegen.
(Bild: Drilling / Microsoft)

Um erste Workloads mir Azure Batch erstellen zu können, ist ein grundlegendes Verständnis für die beteiligen Konzepte Batch-Konto, Knoten und Pools sowie Aufträge und Aufgaben vonnöten. Zunächst wird ein Azure-Batch-Konto benötigt. Darunter versteht Microsoft eine eindeutig identifizierbare Entität innerhalb des Batch-Diensts. Da die weitaus meisten Batch-Lösungen Azure Storage zur Speicherung von Ressourcen- und Ausgabedateien nutzen, ist jedem Azure Batch-Konto in der Regel ein entsprechenden Speicherkonto zugeordnet. Die Zuordnung kann bereits beim Anlegen des Batch-Account erfolgen. Pro Region ist es möglich, ein Batch-Konto anzulegen.

Wurde das Batch-Konto erstellt, können User im Abschnitt „Features / Pools“ die benötigten Pools und Knoten erstellen. Prinzipiell lassen sich durchaus mehrere Batch-Workloads in einem einzelnen Batch-Konto ausführen, falls gewünscht aber auch auf mehrere Batch-Konten verteilen, sofern sich diese im gleichen Abonnement (dann aber in verschiedenen Azure-Regionen) befinden.

Pools

Nun erstellen wir einen neuen Pool mit dem Namen „ocr-pool“, wählen bei „Imagetyp“ den Eintrag „Marketplace“ und als „Herausgeber“ den Eintrag „canonical“. Optional stehen als Images „debian“, „microsoftwindowsserver“ oder „microsoft-azure-batch“ zur Verfügung, aber für dieses Beispiel benötigen wir ein einfaches „Linux“-System. Als „Angebot“ nutzen wir daher „ubuntuserver“ und als SKU „18.04-lts“.

Im Abschnitt „Knotengröße“ legen wir zunächst die gewünschte VM-Größe fest. Dies verhält sich ähnlich wie beim Azure Kubernetes Service (AKS). Es handelt sich zwar im Prinzip um normale Azure-VMs, diese tauchen aber ausschließlich im Kontext von Azure Batch auf“. Im Normalfall empfiehlt sich bei Batch-Workloads ein Hardware-Typ, der besonders für HPC-Workloads geeignet ist, etwa ein System aus der F-Serie wie z. B. „Standard_f2s_v2“. Für unser einfaches Beispiel genügt aber auch ein System aus der A-, B- oder D-Serie für Allzweck-Workloads.

Verantwortlich für die letztlich erzielbare Performance ist nicht nur die Anzahl Kerne der gewählten Compute-Hardware, sondern auch die Anzahl der Konten im Pool. Dabei besteht die Wahl zwischen einer festen Größe des Pools und Autoscaling: Bei einer festen Knotenzahl sind drei Knoten sicherlich ein vernünftiger Ausgangspunkt; aus Kostengründen genügt für das Nachvollziehen dieser Demo auch ein Knoten.

Ein Start-Task initialisiert die Knoten nach Wunsch.(Bild: Drilling / Microsoft) — Ein Start-Task initialisiert die Knoten nach Wunsch.
(Bild: Drilling / Microsoft)

Entscheidend für unser Beispiel ist aber, dass Sie im Abschnitt „Starttask“ einen Startsequenz angeben, die auf jedem einzelnen Compute-Knoten ausgeführt wird, sobald dieser dem Pool hinzugefügt oder wenn der Knoten neu gestartet wird. Da wir es hier mit Linux-Instanzen zu tun haben, dient für dieses Beispiel folgendes Bash-Skript als Starttask:

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

/bin/bash -c
"sudo update-locale LC_ALL=C.UTF-8 LANG=C.UTF-8; sudo apt-get update; sudo apt-get -y install ocrmypdf"

Ein vorhandener Knoten-Pool.(Bild: Drilling / Microsoft) — Ein vorhandener Knoten-Pool.
(Bild: Drilling / Microsoft)

An der Installation des Linux-Paketes „ocrmypdf“ lässt sich erahnen, dass die später zu verwendende Azure-Function, die beim Upload eines scanntes Dokumentes in ein Speicherkonto, einen OCR-Vorgang anstoßen soll, das gleichnamige Open-Source-Tool verwenden wird. Alle übrigen Einstellungen verbleiben für dieses Beispiel auf den Default-Werten. Wurde der Pool erstellt, wird er mitsamt der zugewiesenen dedizierten Knotenzahl im Abschnitt „Pools“ des Batch-Accounts angezeigt.

Das Erstellen eines Auftrags.(Bild: Drilling / Microsoft) — Das Erstellen eines Auftrags.
(Bild: Drilling / Microsoft)

Ist das erledigt, können wir im Abschnitt „Features / Aufträge“ einen Auftrag erstellen. Der benötigt erst einmal nur eine Auftrags-ID, z. B. „ocr-job“. Außerdem gilt es, den zu verwendenden Pool auszuwählen.

Speicherkonten und Azure Functions

Jetzt wechseln wir in das mit dem Batch-Account verknüpfte Speicherkonto und erstellen zwei Blob-Container mit dem Namen „input“ und „output“. Der Container „input“ dient dem Upload gescannter Dokumente und damit als Ereignis-Trigger für eine Azure-Function, die dann den ocr-Batch auslöst. Derweil dient „output“ als Ziel-Container für die per ORC analysierten Dokument. Wie man Container erstellt, haben wie Ihnen schon in verschiedenen Artikel gezeigt.

Das Erstellen einer Shared Access Signature (SAS).(Bild: Drilling / Microsoft) — Das Erstellen einer Shared Access Signature (SAS).
(Bild: Drilling / Microsoft)

Für den sicheren anonymen Schreibzugriff auf den Ziel-Container „output“ erzeugen Sie noch eine SAS (Shared Access Signature), also eine signierte URL. Dies gelingt am einfachsten im Azure Storage Explorer. Durch einen Rechtsklick auf den gewünschten Container können Sie dann einfach den Eintrag „Shared Access Signature abrufen“ nutzen.

Die Gültigkeit der SAS, nebst den gewünschten Berechtigungen.(Bild: Drilling / Microsoft) — Die Gültigkeit der SAS, nebst den gewünschten Berechtigungen.
(Bild: Drilling / Microsoft)

Sie benötigen die Berechtigung „Schreiben“ und einen gewünschten Bereich für die Dauer der SAS-Gültigkeit. Wurde die SAS abgerufen, kopieren Sie SAS-URL und Abfragezeichenfolge in die Zwischenablage, da Sie Diese später zum Autorisieren der Azure-Function benötigen.

Danach erstellen Sie im Azure-Portal eine neue Azure Function (Function App) mit serverlosen Verbrauchsplan. Wie das geht, haben wie bereits in verschiedenen Artikeln demonstriert (Link). Verwenden Sie diesmal .NET als Laufzeitstapel. Die für dieses Beispiel verwendete Function ist in C# geschrieben, um das Azure-Batch .NET SDK nutzen zu können. Wenn Sie den serverlosen Verbrauchsplan gewählt haben müssen Sie im Abschnitt „Hosting“ des Bereitstellungsassistenten das Speicherkonto angeben, das Sie oben erstellt und welches Sie mit der Azure Function verknüpfen möchten.

Der Hosting-Plan für die Function App benötig benötigt ein verknüpftes Speicherkonto.(Bild: Drilling / Microsoft) — Der Hosting-Plan für die Function App benötig benötigt ein verknüpftes Speicherkonto.
(Bild: Drilling / Microsoft)

Wurde die Function-App erstellt, müssen Sie nur noch im Abschnitt „Funktionen“ einen neuen Trigger für Blob-Speicherkonten erstellen. Wählen Sie bei „Entwicklungseinstellungen“ den Eintrag „im Portal entwickeln“. Im Abschnitt „Vorlagendetails“ wählen Sie bei „neue Funktion“ einen beliebigen Namen für Ihren Trigger, und bei „Pfad“ ersetzen im Vorschlag „samples-workitems/{name}“ dem Eintrag „samples-workitems“ durch den Namen Ihres Eingangs-Containers, in unserem Beispiel „input“. Bei „Speicherkontoverbindung“ handelt es sich um den Namen der App-Einstellung, welche dann die Verbindungszeichenfolge für Ihr Speicherkonto enthält. Hier ist der Eintrag „AzureWebJobsStorage“ korrekt.

Das Konfigurieren eines Blob-Triggers.(Bild: Drilling / Microsoft) — Das Konfigurieren eines Blob-Triggers.
(Bild: Drilling / Microsoft)

Haben Sie den Trigger erstellt, können Sie den eigentlichen Funktionscode einfügen. Wählen Sie dazu im Abschnitt „Funktionen“ den Eintrag „Funktionen“ und klicken dort auf den Link mit dem Namen Ihres Blob-Triggers. Klicken Sie dann auf „Programmieren und testen“ und laden durch einen weiteren Klick auf „Hochladen“ oder mittels Copy&Paste Ihren Funktionscode in die Datei „run.csx“ hoch.

Den Demo-Code für diese Anwendung stellt Microsoft auf Github zur Verfügung. Außerdem benötigen Sie noch eine Projekt-Datei. Auch deren Content ist auf Github zu finden, allerdings ist die Datei „function.proj“ im Azure-Portal standardmäßig nicht vorhanden, diese muss erst angelegt werdem. Darin sind die externen Bibliotheken im Funktionscode wie z. B. das Batch .NET SDK referenziert. Die folgenden Schritte haben wir der Übersicht halber in der Bildergalerie zusammengefasst.

Bildergalerie

Aus dem Batch-Account unter „Eigenschaften“ benötigen wir folgende Informationen: Batch-URL, Batch-Account-ID und primären Batch-Account-Schlüssel.(Bild: Drilling / Microsoft)

In der „run.csx“ ersetzen wir die Platzhalter in der Funktion „Run()“ in der Zeile 25 (BatchSharedKeyCredentials) mit den eben extrahierten Werten.(Bild: Drilling / Microsoft)

Außerdem gilt es, in den folgenden Zeilen 27, 28 und 29 noch die Speicherkonto-Verbindungszeichenfolge, den Namen des Input-Containers und die oben anlegte SAS für den Ausgabe-Container („output“) zu ergänzen(Bild: Drilling / Microsoft)

Ist alles erledigt, kann man ein gescanntes Dokument in den Container „input“ hochladen und findet nach wenigen Sekunden das dekodierte Dokument im Container „output“. Das Ergebnis der Batch-Verarbeitung liefert das dekodierte Dokument in den Ziel-Container aus.(Bild: Drilling / Microsoft)

Bildergalerie mit 8 Bildern

(ID:48104866)