Toms Wochentipp: KI-Training mit Entwicklerinteraktionen GitHub ändert Datennutzung für Copilot

Von Thomas Joos 2 min Lesedauer

Anbieter zum Thema

GitHub hat die Nutzung von Interaktionsdaten für das Training von KI-Modellen erweitert. Jetzt greift eine automatische Aktivierung, die Eingaben, Codekontext und Feedback einbezieht. Anwender müssen aktiv widersprechen, um eine Verarbeitung zu verhindern.

GitHub Copilot ist der KI-Programmierer von Microsoft/GitHub. (Bild:  Joos - GitHub)
GitHub Copilot ist der KI-Programmierer von Microsoft/GitHub.
(Bild: Joos - GitHub)

GitHub integriert Interaktionsdaten aus der täglichen Nutzung der Plattform systematisch in die Weiterentwicklung seiner KI-Modelle. Betroffen sind sämtliche Nutzungsformen von Copilot in den Varianten Free, Pro und Pro+. Die Änderung trat am 24. April 2026 in Kraft und gilt seitdem ohne vorherige Zustimmung.

Umfang und Struktur der Datenerfassung

Die neue Regelung erfasst ein breites Spektrum an Interaktionsdaten, die direkt aus der Entwicklungsarbeit stammen. Dazu zählen akzeptierte oder modifizierte Vorschläge, Eingaben an Copilot inklusive übertragener Codefragmente sowie der unmittelbare Codekontext rund um die aktuelle Cursorposition. Auch Kommentare, technische Dokumentation, Dateinamen und Repository-Strukturen fließen in die Auswertung ein.

Navigation innerhalb von Projekten sowie Interaktionen mit Chat- und Vorschlagsfunktionen werden ebenfalls analysiert. Ergänzend berücksichtigt GitHub Feedbackmechanismen, bei denen Anwender Vorschläge bewerten oder anpassen. Diese Daten bilden eine Grundlage zur Optimierung von Modellverhalten, insbesondere bei kontextabhängigen Codevorschlägen und Fehlererkennung.

Abgrenzung von Enterprise-Umgebungen

Nicht alle Nutzergruppen unterliegen dieser Datennutzung. Instanzen von Copilot Business und Copilot Enterprise sind aktuell von der Datennutzung noch ausgeschlossen. Gleiches gilt für unternehmenseigene Repository-Daten, sofern sie nicht aktiv durch Copilot verarbeitet werden.

Zusätzlich bleiben bestehende Einstellungen bestehen. Wer zuvor die Nutzung von Daten zur Produktverbesserung deaktiviert hat, nimmt automatisch nicht am KI-Training teil. Diese Logik gilt auch für explizite Einschränkungen innerhalb der Copilot-Konfiguration.

Opt-out-Mechanismus und technische Umsetzung

Die Teilnahme erfolgt standardmäßig, wodurch ein Opt-out erforderlich wird. Die entsprechende Option befindet sich in den Privatsphäre-Einstellungen der Plattform. Erst nach manueller Deaktivierung unterbleibt die Weitergabe von Interaktionsdaten an Trainingsprozesse.

Technisch betrachtet verarbeitet Copilot weiterhin aktiv Code aus privaten Repositories, sobald eine Interaktion erfolgt. Diese Verarbeitung ist notwendig für die Funktion des Dienstes. Die daraus resultierenden Daten können in Trainingspipelines einfließen, sofern keine Einschränkung konfiguriert ist.

Datenweitergabe innerhalb des Konzerns

GitHub gibt an, dass die erfassten Daten innerhalb verbundener Unternehmen genutzt werden. Dazu zählt insbesondere Microsoft als Mutterkonzern. Eine Weitergabe an externe KI-Anbieter oder unabhängige Dienstleister erfolgt laut Angaben nicht. Die Datenverarbeitung bleibt somit innerhalb der eigenen Infrastruktur und Organisationsstruktur.

Die Integration realer Nutzungsdaten folgt einem Ansatz, der bereits intern Anwendung findet. GitHub nutzt seit einiger Zeit Interaktionsdaten von Microsoft-Mitarbeitern zur Modelloptimierung und verzeichnet dabei steigende Akzeptanzraten von Vorschlägen in mehreren Programmiersprachen.

(ID:50828520)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Cloud Computing

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung