Toms Wochentipp: Wan2.1-Serie frei verfügbar Alibaba Cloud veröffentlicht Video-KI-Modelle als Open Source

Von Thomas Joos 1 min Lesedauer

Anbieter zum Thema

Die Cloud-Computing-Sparte von Alibaba hat seine KI-Modelle für die Videogenerierung als Open Source veröffentlicht. Mit der Offenlegung der Wan2.1-Modelle senkt Alibaba Cloud die Einstiegshürde für Unternehmen und Forschungseinrichtungen, die leistungsstarke KI-Modelle für die Videogenerierung nutzen wollen.

Alibaba Cloud stellt seine Video-KI kostenlos zur Verfügung. (Bild:  Joos - Alibaba Cloud)
Alibaba Cloud stellt seine Video-KI kostenlos zur Verfügung.
(Bild: Joos - Alibaba Cloud)

Alibaba Cloud stellt vier Modelle der neuesten Generation ihres Video-Foundation-Modells Tongyi Wanxiang (Wan) frei zur Verfügung. Dazu gehören die Versionen T2V-14B, T2V-1.3B, I2V-14B-720P und I2V-14B-480P.

Die neuen KI-Modelle, die sowohl auf Text- als auch auf Bild-Eingaben basieren, sind auf Plattformen wie Model Scope und Hugging Face verfügbar. Damit erhalten Forscher, akademische Institutionen und Unternehmen weltweit Zugang zu leistungsfähigen Werkzeugen zur Generierung hochwertiger Videos und Bilder.

Bereits im August 2023 wurde das erste Open-Source-Modell Qwen-7B veröffentlicht. Die Qwen-Familie hat mittlerweile über 100.000 derivative Modelle hervorgebracht.

Spitzenplatzierung auf dem VBench Leaderboard

Als erstes Open-Source-Modell unter den führenden fünf KI-Videogenerierungsmodellen auf der Benchmark-Plattform VBench hat sich Wan2.1 mit einer Gesamtbewertung von 86,22 Prozent als Spitzenreiter positioniert. Besonders in Bereichen wie dynamische Darstellung, Farbqualität und Mehr-Objekt-Interaktion überzeugt das Modell.

Die verschiedenen Versionen der Wan2.1-Serie bieten auch unterschiedliche Einsatzmöglichkeiten. Das T2V-14B-Modell eignet sich besonders für aufwendige Bewegungsanimationen, das T2V-1.3B-Modell bietet eine ausgewogene Kombination aus Generierungsqualität und geringerem Rechenaufwand. Dadurch können auch Entwickler mit herkömmlichen Laptops kurze Videos mit 480p-Auflösung innerhalb von wenigen Minuten erstellen. Die I2V-Modelle mit 720p- und 480p-Auflösung ermöglichen auch die Erweiterung statischer Bilder in dynamische Sequenzen. Nutzer können ein Bild und eine kurze Textbeschreibung eingeben, um realistische Videos zu erzeugen.

(ID:50387012)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung