Suchen

Bilder automatisch auswerten Google startet Beta der Cloud Vision API

Autor / Redakteur: Dirk Srocke / Florian Karlstetter

Mit einer jetzt allgemein verfügbaren Betaversion der Google Cloud Vision API können Entwickler den Inhalt von Fotos automatisch auswerten – die Lösung erkennt unter anderem Objekte, Stimmungen und Texte.

Firmen zum Thema

Google demonstriert das Potenzial der Cloud-Schnittstelle spielerisch mit einem GoPiGo-Roboter, der seine Umwelt wahrnimmt und darauf reagiert.
Google demonstriert das Potenzial der Cloud-Schnittstelle spielerisch mit einem GoPiGo-Roboter, der seine Umwelt wahrnimmt und darauf reagiert.
(Bild: Google/YouTube)

Nachdem Google bereits im Dezember eine begrenzte Preview der Cloud Vision API gestartet hatte, ist eine Betaversion der Bilderkennungsschnittstelle für die Google Cloud Platform nun allgemein verfügbar. Zugleich hat der Anbieter auch weitere Funktionen und seine Preisvorstellungen vorgestellt.

Die Google Cloud Vision API wertet ihr übergebene Bilder aus und greift laut Anbieter auf die gleichen Techniken wir Google Photos zurück. So erkenne die Lösung eine Vielzahl verschiedener Objekte – angefangen von Blumen bis hin zu Sehenswürdigkeiten. Auf Basis von Google SafeSearch spüre die Lösung zudem unangemessene Inhalte auf, beispielsweise Darstellungen nicht jugendfreier oder gewalttätiger Szenen. Des Weiteren erkennt die API menschliche Gefühlsausdrücke für Freude, Sorge oder Zorn. Nicht zuletzt könne die Technik auch Logos aufspüren und Texte entziffern (Optical Character Recognition, OCR). Neu hinzugekommen ist die Fähigkeit, die vorherrschende Farbe eines Bildes zu erkennen.

In einem Demovideo präsentiert Google die API zusammen mit einem Roboter, der auf seine Umgebung reagiert. Nichtsdestotrotz rät der Anbieter davon ab, die Lösung für geschäftskritische Echtzeitanwendungen zu verwenden. Die aktuell gültige Quota pro Nutzer und Monat beträgt 20 Millionen Bilder – das entspricht knapp acht API-Aufrufen pro Sekunde.

Künftig will Google das Angebot kognitiver Tools erweitern. Der visuellen Cloud Vision API soll beispielsweise eine Schnittstelle folgen, die Töne interpretiert.

Zu den Preisen: Für eine "Label Detection" bei 1.000 Bildern verlangt Google zwei US-Dollar; eine OCR über 1.000 Bilder kostet 0,60 US-Dollar.

(ID:43897160)