Toms Wochentipp: Text-to-Speech Avatar in Azure Fotorealistische Avatare in der Microsoft-Cloud nutzen

Von Thomas Joos 1 min Lesedauer

Anbieter zum Thema

Microsoft stellt in Azure den neuen, auf künstlicher Intelligenz (KI) basierenden Dienst „Text-to-Speech Avatar“ zur Verfügung. Damit lassen sich fotorealistische Avatare in der Microsoft-Cloud erstellen, die natürliche Stimme nutzen können.

Der Microsoft.Azure-Dienst „Text-to-Speech Avatar“ ermöglicht die Programmierung eines KI-basierten, fotorealistischen Avatars.(Bild:  Joos - Microsoft)
Der Microsoft.Azure-Dienst „Text-to-Speech Avatar“ ermöglicht die Programmierung eines KI-basierten, fotorealistischen Avatars.
(Bild: Joos - Microsoft)

Mit Text-to-Speech Avatar (TTS Avatar) stellt Microsoft einen weiteren KI-Dienst in seiner Cloud zur Verfügung. Entwickler können auf Basis von Vorlagen für eigene Programme schnell eigene, fotorealistische Avatare erstellen, die auch eine KI-basierte Stimme bereitstellen. Neben Vorlagen lassen sich mit dem Dienst aber auch eigene Stimmen erstellen.

Vorlagenkatalog und Testmöglichkeit

Entwickler können den Dienst mit dem Azure KI Studio testen. Hier sind auch die Vorlagen für Stimmen des Text-to-Speech-Avatars zur Verfügung. Der Dienst selbst lässt sich ebenfalls kostenlos testen. Dazu steht das Speech Studio im Azure KI Studio zur Verfügung.

TTS Avatar bietet eine Vielzahl vorgefertigter Avatare und ermöglicht die Erstellung benutzerdefinierter synthetischer Stimmen durch Azure Custom Neural Voice. Die Avatare lassen sich an das Branding eines Unternehmens anpassen und in Echtzeit oder im Batch-Modus generieren. Der Zugriff auf benutzerdefinierte Avatare ist eingeschränkt und erfordert eine Registrierung sowie die Zustimmung des Avatar-Darstellers.

Bild- und Stimmvorlagen aus dem Katalog, der in Azure KI Studio zur Verfügung steht.(Bild:  Joos - Microsoft)
Bild- und Stimmvorlagen aus dem Katalog, der in Azure KI Studio zur Verfügung steht.
(Bild: Joos - Microsoft)

Nutzer können aus verschiedenen fotorealistischen Avataren ihr Modell wählen und anpassen.(Bild:  Joos - Microsoft)
Nutzer können aus verschiedenen fotorealistischen Avataren ihr Modell wählen und anpassen.
(Bild: Joos - Microsoft)

Sicherheits- und Transparenzfunktionen wie unsichtbare Wasserzeichen und Content-Sicherheitsmaßnahmen sind integriert, um den Missbrauch des Dienstes zu verhindern. Azure AI Content Safety unterstützt die Textmoderation während der Batch-Synthese, um schädliche Inhalte zu vermeiden. Entwickler können den Dienst über APIs und SDKs in ihre Anwendungen integrieren und damit die Kundenbindung verbessern sowie neue, innovative Lösungen entwickeln.

Verschiedene Unternehmen, darunter KPMG, Fujifilm, MAPFRE, und Coca Cola, nutzen bereits den TTS Avatar, um personalisierte und innovative Kundenerlebnisse zu schaffen. Der Dienst wird auch im E-Commerce und bei der Content-Erstellung eingesetzt, um Interaktionen zu personalisieren und sprachliche Barrieren zu überwinden.

(ID:50168364)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung