AI helpt Bellingcat bij filteren van oorlogsdata uit Oekraïne
Onderzoekscollectief Bellingcat heeft met succes een innovatieve methode getest waarbij machine learning wordt ingezet om incidenten van burgerslachtoffers en schade aan civiele infrastructuur sneller op te sporen. Door de inzet van een speciaal getraind algoritme wist de organisatie de zoektijd in gigantische hoeveelheden socialmedia-data drastisch te verkorten. Hierdoor kunnen onderzoekers zich sneller richten op het daadwerkelijke verificatieproces.
Tussen februari 2022 en september 2025 verzamelden medewerkers en vrijwilligers van Bellingcat meer dan 2.500 handmatig geverifieerde incidenten van burgerslachtoffers na de grootschalige Russische invasie in Oekraïne. Het platform Telegram bleek daarbij een cruciale, maar overweldigende bron van informatie. Om de enorme stroom aan berichten hanteerbaar te maken, bouwden Bellingcat-onderzoekers Miguel Ramalho en Nick Waters een op maat gemaakt voorspellingsmodel.
Van tekst en emoji's naar data
Voor het trainen van het model gebruikten de data-analisten een dataset van 5.848 geverifieerde Telegram-berichten waarin sprake was van burgerslachtoffers, aangevuld met ruim 48.000 controleberichten zonder relevante incidenten.
Om de expertise van menselijke onderzoekers te vertalen naar computationele data, paste Bellingcat zogeheten 'feature engineering' toe. Teksten en metadata werden omgezet in numerieke waarden. Hierbij werd onder meer gekeken naar specifieke Oekraïense en Russische trefwoorden (zoals "Shahed" of "geleide zweefbom"), het aantal weergaven, interacties én het gebruik van specifieke emoji’s. Uit de analyse bleek dat een hoge frequentie van de huilende emoji (😭) een van de sterkste indicatoren was voor een relevant incident. Daarnaast werd gebruikgemaakt van geavanceerde taalmodellen (uit de BERT-familie) om de semantische betekenis en context van berichten te analyseren.
XGBoost presteert beter dan LLM's
Bellingcat testte vier verschillende machine learning-algoritmen om de data te analyseren: Logistic Regression, Random Forest, LightGBM en XGBoost. Na een strenge testfase op basis van 'precision' (nauwkeurigheid) en 'recall' (de mate waarin relevante berichten worden herkend), kwam XGBoost als de absolute winnaar uit de bus.
Opvallend is dat Bellingcat de dataset achteraf ook als test voorlegde aan verschillende commerciële Large Language Models (LLM's), waaronder Google DeepMinds Gemma 3 en Gemini-modellen. Hoewel de LLM's in staat waren om waardevolle patronen te herkennen, presteerden zij verscheidene malen minder dan het specifiek getrainde XGBoost-model als het ging om het minimaliseren van het aantal gemiste incidenten.
Ethische voordelen en trauma-beperking
Naast de enorme tijdwinst levert de inzet van AI volgens Bellingcat ook een belangrijk ethisch en mentaal voordeel op. Onderzoekers die handmatig urenlang oorlogsplatforms moeten doorspitten, worden blootgesteld aan grote hoeveelheden schokkende en traumatiserende beelden en teksten. Het algoritme filtert de ruis vooraf weg en presenteert onderzoekers een interface waarin berichten zijn gerangschikt van meest naar minst waarschijnlijk relevant. Dit verlaagt de psychologische druk op het onderzoeksteam aanzienlijk.
Bellingcat benadrukt dat het model een hulpmiddel blijft en dat de uiteindelijke verificatie en beoordeling van het bewijsmateriaal altijd mensenwerk is om algoritmische vooroordelen (algorithmic bias) te voorkomen.
Hoewel dit specifieke prototype is ontwikkeld voor het conflict in Oekraïne en gericht is op Telegram, is de achterliggende technische structuur generiek. Volgens Ramalho en Waters kan de methodologie eenvoudig worden aangepast voor het monitoren van andere lopende conflicten met grote aantallen burgerslachtoffers, zoals in Soedan en het Midden-Oosten, mits de data van socialmediaplatforms toegankelijk blijft voor onderzoekers.