Generative KI-Modelle für Geschäftsanwendungen bewerten Salesforce führt LLM-Benchmark für CRM ein

Von Martin Hensel 2 min Lesedauer

Anbieter zum Thema

Ein neuer LLM-Benchmark („Large Language Models“) von Salesforce ermöglicht die Bewertung von generativen KI-Modellen für Geschäftsanwendungen. Im Mittelpunkt stehen Vertriebs- und Service-Anwendungsfälle sowie die Evaluierung nach Genauigkeit, Kosten, Geschwindigkeit, Vertrauen und Sicherheit.

Salesforce will mit einem Benchmark seine Unternehmenskunden bei der Wahl des richtigen LLMs unterstützen.(Bild:  Gerd Altmann /  Pixabay)
Salesforce will mit einem Benchmark seine Unternehmenskunden bei der Wahl des richtigen LLMs unterstützen.
(Bild: Gerd Altmann / Pixabay)

„Die größten, leistungsfähigsten Modelle sind oftmals zu kostspielig und liefern mehr, als eigentlich benötigt wird“, erklärt Salesforce-AI-CEO Clara Shih. In vielen Fällen seien Open-Source- oder kleinere Modelle zu geringeren Kosten ebenso gut geeignet. Geschwindigkeit und Benutzerfreundlich bereiten zudem Kopfzerbrechen. Auch die Datensicherheit sorgt für Sorgenfalten, wenn vertrauliche Daten in ein LLM eingespeist werden. Das exponenzielle Wachstum in der Modelllandschaft erschwert zusätzlich die Übersicht.

Der Salesforce-LLM-Benchmark ist speziell auf Szenarien im Vertrieb und Kundenservice optimiert. Dies schließt beispielsweise Anwendungsfälle wie Zusammenfassungen von Verkaufschancen, Interessentengewinnung, Vorfallsberichte oder wissensbasierte Empfehlungen für Supportantworten mit ein. Andere Benchmarks sind aufgrund anderer Zielsetzung oder fehlender Aspekte für Unternehmen oft nicht relevant. Der Salesforce-Benchmark umfasst auch ein öffentliches Leaderboard, das bei der Beurteilung der Effektivität generativer, KI-gestützter CRM-Lösungen helfen soll.

Kontinuierliche Weiterentwicklung

Der Benchmark wird als dynamisches Framework kontinuierlich weiterentwickelt und ausgebaut. Er soll Unternehmen fundierte Entscheidungen ermöglichen: Erscheint zum Bespiel ein Modell bei der Mehrzahl der Kriterien für einen Anwendungsfall geeignet, kann es im Hinblick auf die Genauigkeit durch Techniken wie Prompt Engineering und Feinabstimmung verbessert werden. Die „Einstein 1“-Plattform von Salesforce erlaubt Kunden die Wahl aus bestehenden LLMs oder den Einsatz eigener Modelle für individuelle Anforderungen. Der Benchmark unterstützt sie dabei, schneller einen effizienten Einsatz KI-gestützter Lösungen zu erreichen.

„Unternehmen setzen auf KI, um schneller zu wachsen, Kosten zu senken und personalisierte Kundenerfahrungen zu liefern – nicht um einen Kindergeburtstag zu planen oder Othello zusammenzufassen“, so Shih. Salesforce-Kunden hätten nach einer zielgerichteten Methode gefragt, um die Vielzahl neuer KI-Modelle zu bewerten und das richtige für ihre Anforderungen auszuwählen. „Unser erster LLM-Benchmark für CRM hilft ihnen, sich in der komplexen Landschaft der Modelle zurechtzufinden. Angelegt als sich dynamisch entwickelndes Framework, ermöglicht es Unternehmen, fundierte Entscheidungen zu treffen und ihre Erwartungen an Genauigkeit, Kosten, Geschwindigkeit und Vertrauen gegeneinander abzuwägen“, verdeutlicht die Salesforce-AI-Chefin.

(ID:50111938)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung