Toms Wochentipp: Mulitlinguales LLM aus Deutschland OpenGPT-X veröffentlicht Teuken-7B

Von Thomas Joos 1 min Lesedauer

Anbieter zum Thema

Das Forschungsprojekt OpenGPT-X hat das neue Open-Source-Sprachmodell Teuken-7B veröffentlicht. Das Modell umfasst 7 Milliarden Parameter und wurde mit 24 Amtssprachen der EU trainiert.

Trainingsbasis von Teuken-7B sind die 24 Amtssprachen der EU.(Bild:  frei lizenziert Adrian /  Pixabay)
Trainingsbasis von Teuken-7B sind die 24 Amtssprachen der EU.
(Bild: frei lizenziert Adrian / Pixabay)

Das Sprachmodell Teuken-7B von OpenGPT-X lässt sich kostenlos herunterladen. Das Forschungsprojekt OpenGPT-X steht unter Leitung des Fraunhofer-Instituts.

Multilinguale KI aus der EU

Teuken-7B ist ein multilinguales Large Language Model mit 7 Milliarden Parametern. Es wurde mit 4 Billionen Tokens in allen 24 offiziellen EU-Sprachen vortrainiert und anschließend für spezifische Aufgaben optimiert. Das Modell basiert auf einer Transformer-Architektur und richtet sich an kommerzielle und wissenschaftliche Anwender, die präzise und kulturell angepasste Antworten in europäischen Kontexten benötigen.

Teuken-7B zeichnet sich durch seine Stabilität über mehrere Sprachen hinweg aus und spiegelt europäische Werte stärker wider als Englisch-zentrierte Modelle. Es ist besonders geeignet für mehrsprachige Anwendungen, jedoch nicht für mathematische oder programmiertechnische Aufgaben ausgelegt.

Entwickelt wurde das Modell vor allem von Fraunhofer, dem Forschungszentrum Jülich, der TU Dresden und dem DFKI, mit Unterstützung des Bundesministeriums für Wirtschaft und Klimaschutz. Die Nutzung erfolgt über eine optimierte Prompt-Vorlage, wobei eine Integration in bestehende Workflows über Bibliotheken wie Transformers und vLLM möglich ist.

Das multilinguale Sprachmodell Teuken-7B steht in zwei Varianten zur Verfügung. Eine Version ist für Forschungszwecke gedacht, während die zweite für den kommerziellen Einsatz gedacht ist. Diese Version steht unter der Apache-2.0-Lizenz. Damit können Entwickler sofort Teuken-7B in eigene Anwendungen einbinden.

(ID:50281834)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung