Toms Wochentipp: OpenAI-Bildmodell allgemein verfügbar GPT-Image-2 in Microsoft Foundry nutzen

Von Thomas Joos 2 min Lesedauer

Anbieter zum Thema

OpenAIs Bildmodell GPT-image-2 ist in Microsoft Foundry allgemein verfügbar. Das Modell unterstützt Auflösungen bis 4K, fünf zusätzliche Sprachen und einen Routing-Layer mit zwei Auswahlmodi. Pro Prompt liefert es bis zu zehn kontextuell verbundene Bildvarianten.

Microsoft integriert GPT Image 2 in seine KI-Plattform Foundry.(Bild:  Joos - Microsoft)
Microsoft integriert GPT Image 2 in seine KI-Plattform Foundry.
(Bild: Joos - Microsoft)

Microsoft positioniert die Integration als Werkzeug für Entwickler- und Designteams, die Bildmaterial in passenden Plattformformaten ausliefern müssen. Den Mehrwert sieht Microsoft in höherer Detailtreue, lesbarer Schrift in Bildern und einer Routing-Logik, die Größenwahl und Token-Verbrauch automatisiert. Die Freigabe in Foundry erfolgte unmittelbar nach der OpenAI-Ankündigung des Modells unter dem Produktnamen ChatGPT Images 2.0.

Auflösung, Pixelbudget und Sprachen

GPT-image-2 erzeugt Bilder in 4K und in den Formaten 1024x1024, 1536x1024 sowie 1024x1536 Pixel. Jede Kantenlänge muss ein Vielfaches von 16 sein. Das obere Pixelbudget liegt bei 8.294.400, das untere bei 655.360 Pixel je Ausgabe. Anfragen oberhalb der Schwelle skaliert der Dienst automatisch herunter. Der Wissensstand reicht bis Dezember 2025.

Hinzu kommt eine als Thinking bezeichnete Funktion, die laut OpenAI Web-Recherche, Eigenkontrolle der Ausgabe und Mehrfach-Generierung aus einem einzigen Prompt umfasst. Damit lassen sich bis zu zehn zusammenhängende Bilder erzeugen, zum Beispiel Sequenzen mit konsistenten Figuren über mehrere Panels hinweg. Auch kleine Schrift, Icons und feine Details rendert das Modell nach Herstellerangaben verlässlicher als der Vorgänger.

Routing-Layer in zwei Modi

Der Routing-Layer entscheidet ohne explizit gesetzte Größenangabe über die Konfiguration. Modus 1 wählt zwischen den Legacy-Stufen smimage, image und xlimage. Modus 2 greift auf sechs Token-Buckets mit den Werten 16, 24, 36, 48, 64 und 96 zurück. Die niedrigen Buckets entsprechen smimage, die mittleren der Standardstufe image, die beiden höchsten decken xlimage ab. Eine feinere Abstufung ermöglicht die Optimierung zwischen Ausgabequalität und Token-Verbrauch je Anfrage.

Preise und Sicherheitsschicht

Microsoft führt GPT-image-2 im Tarif Standard Global. Für Bild-Tokens berechnet der Anbieter 8 US-Dollar je 1 Million Input-Tokens, 2 US-Dollar je 1 Million gecachter Input-Tokens und 30 US-Dollar je 1 Million Output-Tokens. Bei Text-Tokens gelten 5, 1,25 und 10 US-Dollar in derselben Reihenfolge. Den Sicherheitsunterbau liefern OpenAI-eigene Mitigations sowie Azure AI Content Safety mit Filtern und Klassifikatoren für sensible Inhalte.

Verfügbarkeit über zwei Kanäle

Parallel zur Foundry-Freigabe verteilt OpenAI das Modell unter dem Namen ChatGPT Images 2.0 an ChatGPT, Codex und die OpenAI-API. Daraus ergeben sich zwei Zugangswege. Der eine führt über die OpenAI-Endpunkte. Der andere bindet GPT-image-2 über Microsoft Foundry in Azure-Workloads ein und ergänzt es um Governance- und Compliance-Mechanismen der Plattform. Für Unternehmen mit bestehenden Azure-Verträgen vereinfacht der Foundry-Pfad die Abrechnung, das Identitätsmanagement und die Audit-Anbindung.

(ID:50835669)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung