Witold Kepinski - 06 mei 2025

Salesforce AI Research zet nieuwe maatstaven voor intelligente en betrouwbare AI-agents

Salesforce AI Research heeft een reeks nieuwe benchmarks, richtlijnen en modellen onthuld die de weg vrijmaken voor de ontwikkeling van toekomstige AI-agents die intelligenter, betrouwbaarder en veelzijdiger zijn. De focus ligt op het overbruggen van de kloof tussen de ruwe intelligentie van grote taalmodellen (LLM's) en hun consistente prestaties in de complexe realiteit van bedrijfsomgevingen, een uitdaging die bekend staat als 'jagged intelligence'.

Salesforce AI Research zet nieuwe maatstaven voor intelligente en betrouwbare AI-agents image

Salesforce AI Research hanteert drie kernpijlers om dit probleem aan te pakken: fundamenteel onderzoek, klantincubatie en productinnovatie. Door middel van een iteratief proces van onderzoeken, testen met klanten in realistische simulatieomgevingen en het omzetten van prototypes naar enterprise-ready oplossingen, streeft Salesforce ernaar AI-agents te creëren die naadloos integreren in workflows, complexe taken aankunnen en met grotere betrouwbaarheid presteren.

Belangrijke ontwikkelingen die werden aangekondigd zijn:

  • SIMPLE dataset: Een nieuwe publieke benchmark om 'jaggedness' in AI te kwantificeren.
  • SFR-Embedding: Een geavanceerd model voor het omzetten van tekst naar gestructureerde data, dat toonaangevend is op de MTEB-benchmark voor informatie retrieval en clustering.
  • SFR-Embedding-Code: Een gespecialiseerde familie van code-embedding modellen voor efficiënte en accurate code retrieval en generatie voor ontwikkelaars.
  • CRMArena: Een nieuw framework om het vermogen van enterprise AI-agents te testen in realistische CRM-scenario's.
  • SFR-Guard: Een familie van modellen die de betrouwbaarheid van AI-agents in bedrijfsprocessen versterken door middel van verbeterde detectie van schadelijke input en naleving van instructies.
  • ContextualJudgeBench: Een nieuwe benchmark om de nauwkeurigheid en contextuele relevantie van AI-gegenereerde antwoorden te beoordelen.
  • xLAM (Large Action Model) upgrade: Verbeterde actiemodellen met multi-turn conversatieondersteuning en kleinere, efficiëntere varianten voor snellere taakuitvoering.
  • TACO: Een multimodale actiemodellenfamilie die complexe, meerstaps problemen aanpakt door middel van 'chains of thought-and-action'.

Deze innovaties onderstrepen Salesforce's toewijding aan het leveren van betrouwbare AI-oplossingen die voldoen aan de strenge eisen van bedrijfsomgevingen en klanten in staat stellen slimmer te werken en hun klanten effectiever te bedienen.

DIC Security Day BW tm 1 juli 2025 EGP 06/05/2025 t/m 03/06/2025 BW
DIC Security Day BN + BW tm 1 juli

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!