Witold Kepinski - 05 mei 2026

Meta laat AI-agenten eigen trainingsdata ontwerpen

Meta (het moederbedrijf van Facebook) heeft ‘Autodata’ gepresenteerd: een methode waarbij AI-agenten fungeren als autonome data scientists. Het systeem bouwt, controleert en verbetert zelfstandig trainingsdata voor nieuwe AI-modellen. Door deze ‘agentic’ aanpak kan Meta de rekenkracht van computers direct omzetten in hogere datakwaliteit, waardoor menselijke tussenkomst minder noodzakelijk wordt.

Ai Ai agents Autonomie Data science Agentic

Meta laat AI-agenten eigen trainingsdata ontwerpen image

De grootste uitdaging bij het trainen van moderne AI is de behoefte aan hoogwaardige data. Hoewel synthetische (door computers gegenereerde) data al langer bestaat, kampt deze vaak met een gebrek aan complexiteit of variatie. Meta’s nieuwe Autodata-systeem pakt dit aan door een AI-agent de volledige cyclus van een menselijke wetenschapper te laten nabootsen: het genereren van data, het handmatig inspecteren van voorbeelden, het meten van prestaties en het aanpassen van de strategie.

Agentic Self-Instruct

In een eerste praktische studie, genaamd Agentic Self-Instruct, liet Meta de AI-agent trainingsmateriaal ontwikkelen voor complexe wetenschappelijke vraagstukken. De agent stuurt hierbij vier sub-agenten aan: een ‘uitdager’ die opdrachten verzint, een ‘zwakke’ oplosser, een ‘sterke’ oplosser en een jury-model.

De kern van de methode is het vinden van de zogeheten ‘gap’. Het systeem is pas tevreden als het een trainingsopdracht heeft geformuleerd die de sterke AI wél kan oplossen, maar waar de zwakke AI op vastloopt. Dit zorgt ervoor dat de gegenereerde data uitdagend genoeg is om modellen echt iets nieuws te leren. Terwijl standaardmethoden vaak data produceren die óf te makkelijk óf te moeilijk zijn, vergrootte de Autodata-loop het prestatieverschil tussen modellen van 1,9 naar maar liefst 34 procentpunten.

De AI-wetenschapper optimaliseren

Wat Autodata uniek maakt, is de ‘outer loop’ of meta-optimalisatie. De AI-agent die de data maakt, wordt zelf ook voortdurend getraind om een betere data scientist te worden. Het systeem analyseert zijn eigen fouten — zoals het per ongeluk weggeven van het antwoord in de vraagstelling — en past zijn eigen broncode of instructies aan om dergelijke fouten in de toekomst te voorkomen.

Tijdens experimenten met computerwetenschappelijke papers steeg het slagingspercentage van de agent door deze zelfcorrectie van 12,8% naar 42,4%. De AI ontdekte zelfstandig dat het bijvoorbeeld specifieke JSON-formaten moest gebruiken om parsing-fouten te voorkomen en dat negatieve beoordelingscriteria vaak contraproductief werkten.

De toekomst van AI-training

Meta benadrukt dat deze ontwikkeling de manier waarop AI gebouwd wordt fundamenteel kan veranderen. In plaats van maandenlang menselijke labels te verzamelen, kunnen onderzoekers hun rekenkracht inzetten om agenten te laten ‘onderzoeken’ welke data een model het beste vooruithelpt.

Hoewel Meta waarschuwt voor risico's — zoals agenten die proberen te ‘valsspelen’ door de zwakke AI simpelweg te instrueren om domme antwoorden te geven — biedt Autodata een krachtig vooruitzicht. Het uiteindelijke doel is ‘co-improvement’, waarbij menselijke experts en AI-agenten samenwerken aan de volgende generatie superintelligente en veilige modellen.

Tip de redactie

Gartner IT Symposium Barcelona 06-2026 AI BW + BN

Over Witold Kepinski

Witold Kepinski (1969) is Bestuurder, Editor-in-Chief en Director Content van Dutch IT Channel en Dutch IT Leaders. Witold Kepinski is 25 jaar actief in de IT Media en Tech Business branche

Witold Kepinski geeft met een gespecialiseerd team van redacteuren, bloggers en videomakers inzicht in tech business trends en toepassingen waarmee IT-beslissers en Channel Partners impact maken.

Auteur pagina

Meta laat AI-agenten eigen trainingsdata ontwerpen

Agentic Self-Instruct

De AI-wetenschapper optimaliseren

De toekomst van AI-training

Dutch IT events

Meer over ai

Over Witold Kepinski

Wil jij dagelijkse updates?