Wouter Hoeffnagel - 04 december 2023

Onderzoekers laten ChatGPT trainingsdata delen

Onderzoekers zijn erin geslaagd ChatGPT te laten vertellen welke trainingsdatum het heeft gebruikt. Door een bepaald woord eindeloos door de AI-chatbot te laten herhalen, wisten de onderzoekers meer dan 10.000 unieke trainingsvoorbeelden te achterhalen. Opvallend is dat tussen deze voorbeelden ook persoonsgegevens zitten.

Artificial intelligence Data

Onderzoekers laten ChatGPT trainingsdata delen image

In een paper delen de onderzoekers van diverse universiteiten en Google DeepMind hun bevindingen. Zij stellen voor een budget van minder dan 200 dollar erin te zijn geslaagd de trainingsvoorbeelden te achterhalen. Dit deden zij door de chatbot het woord 'poem' oneindig te laten herhalen.

Details in trainingsgegevens gebruiken

Het chatmodel moest hierdoor terugvallen op zijn 'oorspronkelijke doelstelling voor taalmodellering'. Hiervoor moest het gebruik maken van details in zijn trainingsgegevens. Dit leidde er in de praktijk toe dat de chatbot data die onderdeel uitmaakt van zijn trainingsset deelt.

De paper is op 30 augustus met OpenAI gedeeld en nu pas openbaar gemaakt. De aanval zou inmiddels dan ook niet meer werken. Wel melden de onderzoekers dat het onderliggende probleem niet is opgelost.

Tip de redactie