Wouter Hoeffnagel - 04 december 2023

Onderzoekers laten ChatGPT trainingsdata delen

Onderzoekers zijn erin geslaagd ChatGPT te laten vertellen welke trainingsdatum het heeft gebruikt. Door een bepaald woord eindeloos door de AI-chatbot te laten herhalen, wisten de onderzoekers meer dan 10.000 unieke trainingsvoorbeelden te achterhalen. Opvallend is dat tussen deze voorbeelden ook persoonsgegevens zitten.

Onderzoekers laten ChatGPT trainingsdata delen image

In een paper delen de onderzoekers van diverse universiteiten en Google DeepMind hun bevindingen. Zij stellen voor een budget van minder dan 200 dollar erin te zijn geslaagd de trainingsvoorbeelden te achterhalen. Dit deden zij door de chatbot het woord 'poem' oneindig te laten herhalen.

Details in trainingsgegevens gebruiken

Het chatmodel moest hierdoor terugvallen op zijn 'oorspronkelijke doelstelling voor taalmodellering'. Hiervoor moest het gebruik maken van details in zijn trainingsgegevens. Dit leidde er in de praktijk toe dat de chatbot data die onderdeel uitmaakt van zijn trainingsset deelt.

De paper is op 30 augustus met OpenAI gedeeld en nu pas openbaar gemaakt. De aanval zou inmiddels dan ook niet meer werken. Wel melden de onderzoekers dat het onderliggende probleem niet is opgelost.

Leanix BW 19 febr tm 17 maart 2024 Schneider Electric BN BW start week 27 tm week 29
Netgear banner liggend start week 14

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!