Toms Wochentipp: Eigene Inhalte vor KI-Zugriffen schützen KI-Bots mit Cloudflare blockieren

Von Thomas Joos 1 min Lesedauer

Anbieter zum Thema

Kunden von Cloudflare können den Zugriff von KI-Bots blockieren. Dadurch lassen sich eigene Webinhalte vor Zugriffen von KI-Bots schützen. Der Schutz ist auch in den kostenlosen Plänen enthalten.

KI-Nutzung ja, aber bitte nicht mit meinen Daten trainieren!(Bild:  frei lizenziert Michal Jarmoluk /  Pixabay)
KI-Nutzung ja, aber bitte nicht mit meinen Daten trainieren!
(Bild: frei lizenziert Michal Jarmoluk / Pixabay)

Unternehmen, die ihre Webseiten durch Cloudflare schützen lassen, können jetzt auch KI-Bots blockieren und dadurch sicherstellen, dass KI-Dienste nicht die Daten abgreifen und für das Training von KI-Diensten nutzen. Dieses Verfahren mit der Bezeichnung Scraping ermöglicht Entwicklern von Large-Language-Modells (LLM) das Training von Seiten im Internet. Laut Cloudflare will der größte Teil der Kunden den Zugriff von KI-Bots blockieren.

LLMs müssen trainieren, aber es sollte Grenzen geben

LLMs benötigen zwar Zugriffe auf externe Daten, allerdings übertreiben viele LLM-Entwickler damit. Erst vor kurzem wurde Google zu einer Strafe von 250 Millionen Euro verdonnert, weil der Konzern von französischen Medienhäuser in zu großem Umfang Daten für das Training abgegriffen hat.

Bei den KI-Bots geht es auch nicht nur um LLMs von Open-Source-Entwicklern oder Unternehmen wie Google oder OpenAI. Auch Konzerne wie Bytedance (TikTok) sammeln Daten im großen Stil. Nach einer Analyse von Cloudflare sind Bytespider, Amazonbot, ClaudeBot und GPTBot die vier wichtigsten KI-Crawler.

Cloudflare ermöglicht jetzt seinen Kunden das Blockieren von KI-Bots.(Bild:  Joos - Cloudflare)
Cloudflare ermöglicht jetzt seinen Kunden das Blockieren von KI-Bots.
(Bild: Joos - Cloudflare)

Bei der Verwendung von Cloudflare lässt sich das mit wenigen Klicks verhindern. Zur Aktivierung klicken Anwender dazu einfach im Cloudflare-Dashboard bei „Security -> Bots“ auf die Option „AI Scrapers and Crawlers“ und aktivieren die Funktion. Der dazugehörige Dienst wird weiterentwickelt und lernt Fingerprints von neuen KI-Bots kennen, um diese zuverlässig blockieren zu können.

(ID:50138007)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung