Witold Kepinski - 08 juni 2026

Pega maakt einde aan dure tokens voor AI-agents

Pegasystems, leverancier van enterprise AI-software voor bedrijfskritische processen, lanceert tijdens PegaWorld een alternatief voor de zogenaamde 'AI-tokentax'. Binnen het nieuwe Pega Infinity 26 kunnen organisaties voortaan agentic workflows ontwerpen, bouwen en uitvoeren zonder per token te hoeven afrekenen. De nieuwe Pega Predictable AI-architectuur verplaatst het zware AI-redeneerwerk naar de ontwerpfase. Pega tackelt hiermee de twee grootste obstakels voor het opschalen van AI-agents: de snel oplopende tokenkosten en onvoorspelbare resultaten op de werkvloer.

Pega maakt einde aan dure tokens voor AI-agents image

Marktcontext: AI-experimenten krijgen een prijskaartje

Nu organisaties hun eerste experimenten met AI-agents willen opschalen naar volwaardige productieomgevingen, veranderen de spelregels bij LLM-aanbieders. Ze stappen massaal over van vaste abonnementen naar variabele tarieven per token. Nu de eerste tokenfacturen binnenstromen, schrikken veel organisaties van de hoogte van de bedragen.

Achter de schermen worden bij traditionele AI-agents namelijk enorme hoeveelheden 'redeneertokens' verbruikt. Hoe complexer een verzoek van een gebruiker of klant is, hoe meer redeneerstappen de AI moet zetten. Dit jaagt niet alleen de kosten op, maar vergroot ook de kans op een onvolledig of inconsistent antwoord.

Een nadere blik: de AI-architectuur van Pega

Pega kiest voor een fundamenteel andere benadering en zet AI-redenering vooral in tijdens de ontwerpfase (design time). Hier voegt de technologie de meeste waarde toe bij het opnieuw inrichten van bestaande processen en systemen. Met behulp van tools zoals Pega Blueprint AI en het nieuwe Pega Infinity Studio kunnen organisaties slimme workflows ontwerpen voor bedrijfskritische processen, zoals het afhandelen van klantverzoeken, het goedkeuren van leningen, het beoordelen van verzekeringsclaims of het optimaliseren van patiënttrajecten.

Zodra deze workflows operationeel zijn, schakelt Pega in de uitvoeringsfase (runtime) over naar een lichtere en efficiëntere vorm van AI om miljoenen gebruikersverzoeken consistent en snel te verwerken. In plaats van bij elk nieuw binnengekomen verzoek het hele proces opnieuw te analyseren, bepaalt de agent met behulp van AI de intentie van de gebruiker. Vervolgens selecteert de agent de juiste Pega-workflow en voert deze stap voor stap uit.

Mocht er voor een specifieke stap toch een zwaarder taalmodel (LLM) nodig zijn – bijvoorbeeld om een ingewikkeld document te analyseren of een interactie samen te vatten – dan krijgt de AI hiervoor gerichte instructies binnen zeer duidelijke kaders.

Voorspelbare kosten en resultaten

Deze architectonische keuze levert volgens Pega organisaties twee grote voordelen op:

Voorspelbare resultaten: Het telkens opnieuw laten redeneren van workflows door een open-einde AI kan leiden tot inconsistente en onvoorspelbare uitkomsten. Agents binnen de Pega-architectuur volgen daarentegen altijd vooraf goedgekeurde en vastgelegde workflows. Dit is essentieel voor streng gereguleerde sectoren, maar is in feite relevant voor elke organisatie die grip wil houden op haar processen.

Voorspelbare kosten: Omdat Pega het zware AI-redeneerwerk eenmalig tijdens de ontwerpfase inzet, in plaats van dit continu te herhalen tijdens de dagelijkse uitvoering, kunnen agents processen vele malen efficiënter uitvoeren. Afhankelijk van de complexiteit en de schaal van de workflows kunnen de operationele kosten hiermee tot wel twintig keer lager uitvallen.

Interactieve Token Calculator

Om organisaties direct inzicht te geven in deze financiële voordelen, introduceert de softwarebouwer de AI Token Cost Calculator. Deze interactieve tool schat de potentiële besparingen in door de methode van Pega te vergelijken met traditionele alternatieven die per token afrekenen. De berekening wordt gemaakt op basis van het volume en de complexiteit van de workflows die een organisatie verwerkt.

Betalen voor uitgevoerd werk, niet voor nadenken

Met deze introductie breekt Pega ook met traditionele verdienmodellen; er wordt afgerekend per voltooide 'case' in plaats van per softwarelicentie of verbruikte token. Een case staat hierbij voor een specifieke taak die van begin tot eind succesvol wordt afgerond. Wanneer een klant bijvoorbeeld via een AI-agent een bestaande bestelling wijzigt of een claim indient, geldt die volledige interactie als één case.

"Bedrijven realiseren zich inmiddels dat 'tokenmaxxing' geen houdbare strategie is. Het leidt onder de streep tot onbeheersbare kosten en onvoorspelbare resultaten", stelt Alan Trefler, oprichter en CEO van Pegasystems. "AI voegt pas echt waarde toe wanneer het op grote schaal betrouwbare resultaten oplevert. Daarom rekenen wij klanten niet af op basis van het aantal tokens dat zij verbruiken, maar op het werk dat daadwerkelijk wordt uitgevoerd. Dankzij onze ingebouwde governance en architectuur bieden we organisaties de flexibiliteit om AI-agents nu écht effectief en rendabel in te zetten."

Beschikbaarheid

Pega Infinity 26 is vanaf het derde kwartaal (Q3) van dit jaar wereldwijd beschikbaar. Klanten betalen vanaf de lancering een vast tarief per afgeronde case, ongeacht de hoeveelheid Pega AI die er achter de schermen is ingezet om de taak te voltooien.

Fundaments Overheid 360 BW + BN Gartner IT Symposium Barcelona 06-2026 sessions BW + BN
Fundaments Overheid 360 BW + BN

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!