Bilder automatisch auswerten

Google startet Beta der Cloud Vision API

| Autor / Redakteur: Dirk Srocke / Florian Karlstetter

Google demonstriert das Potenzial der Cloud-Schnittstelle spielerisch mit einem GoPiGo-Roboter, der seine Umwelt wahrnimmt und darauf reagiert.
Google demonstriert das Potenzial der Cloud-Schnittstelle spielerisch mit einem GoPiGo-Roboter, der seine Umwelt wahrnimmt und darauf reagiert. (Bild: Google/YouTube)

Mit einer jetzt allgemein verfügbaren Betaversion der Google Cloud Vision API können Entwickler den Inhalt von Fotos automatisch auswerten – die Lösung erkennt unter anderem Objekte, Stimmungen und Texte.

Nachdem Google bereits im Dezember eine begrenzte Preview der Cloud Vision API gestartet hatte, ist eine Betaversion der Bilderkennungsschnittstelle für die Google Cloud Platform nun allgemein verfügbar. Zugleich hat der Anbieter auch weitere Funktionen und seine Preisvorstellungen vorgestellt.

Die Google Cloud Vision API wertet ihr übergebene Bilder aus und greift laut Anbieter auf die gleichen Techniken wir Google Photos zurück. So erkenne die Lösung eine Vielzahl verschiedener Objekte – angefangen von Blumen bis hin zu Sehenswürdigkeiten. Auf Basis von Google SafeSearch spüre die Lösung zudem unangemessene Inhalte auf, beispielsweise Darstellungen nicht jugendfreier oder gewalttätiger Szenen. Des Weiteren erkennt die API menschliche Gefühlsausdrücke für Freude, Sorge oder Zorn. Nicht zuletzt könne die Technik auch Logos aufspüren und Texte entziffern (Optical Character Recognition, OCR). Neu hinzugekommen ist die Fähigkeit, die vorherrschende Farbe eines Bildes zu erkennen.

In einem Demovideo präsentiert Google die API zusammen mit einem Roboter, der auf seine Umgebung reagiert. Nichtsdestotrotz rät der Anbieter davon ab, die Lösung für geschäftskritische Echtzeitanwendungen zu verwenden. Die aktuell gültige Quota pro Nutzer und Monat beträgt 20 Millionen Bilder – das entspricht knapp acht API-Aufrufen pro Sekunde.

Künftig will Google das Angebot kognitiver Tools erweitern. Der visuellen Cloud Vision API soll beispielsweise eine Schnittstelle folgen, die Töne interpretiert.

Zu den Preisen: Für eine "Label Detection" bei 1.000 Bildern verlangt Google zwei US-Dollar; eine OCR über 1.000 Bilder kostet 0,60 US-Dollar.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43897160 / Technologien)