AWS introduceert supersnel opschalende AI-engine
Amazon Web Services (AWS) heeft de volgende generatie van Amazon OpenSearch Serverless gepresenteerd. De volledig beheerde zoek- en vectorengine is specifiek ontworpen voor ontwikkelaars die AI-agents bouwen. Door een drastisch verbeterde schaalbaarheid en de mogelijkheid om bij inactiviteit volledig naar nul te schalen, belooft de techgigant kostenbesparingen tot wel 60 procent.
Amazon Web Services (AWS) heeft de volgende generatie van Amazon OpenSearch Serverless gepresenteerd. De volledig beheerde zoek- en vectorengine is specifiek ontworpen voor ontwikkelaars die AI-agents bouwen. Door een drastisch verbeterde schaalbaarheid en de mogelijkheid om bij inactiviteit volledig naar nul te schalen, belooft de techgigant kostenbesparingen tot wel 60 procent.
De lancering volgt op een eerdere reeks infrastructuur-updates van AWS, die allemaal in het teken staan van de alsmaar stijgende cloudkosten door AI-gebruik. Waar menselijke gebruikers databases met pauzes bevragen, kunnen AI-agents duizenden verzoeken per seconde genereren. De nieuwe generatie van OpenSearch Serverless is hierop ingericht: het systeem schaalt razendsnel mee van nul naar duizenden verzoeken per seconde, en direct weer terug naar nul zodra de agents stoppen met werken.
Razendsnelle configuratie
Naast de kostenbesparing heeft AWS de snelheid van het platform zelf flink opgeschroefd. De engine creƫert nieuwe resources binnen enkele seconden en kan de capaciteit tot twintig keer sneller opschalen dan de voorgaande generatie.
Om het ontwikkelaars makkelijker te maken, introduceert AWS native integraties met populaire AI-ontwikkelplatforms zoals Vercel en Kiro. Via de console van Vercel kunnen programmeurs nu direct een OpenSearch-collectie aanmaken of koppelen. Dit maakt het mogelijk om binnen enkele minuten een productie-ready zoek- en vector-backend voor AI-agents op te zetten, zonder dat daar complex infrastructuurbeheer voor nodig is.
Bovendien is het platform compatibel met moderne AI-coderingstools zoals Claude Code en Cursor. AWS levert hierbij zogeheten 'OpenSearch Agent Skills'. Dit is een bibliotheek met kant-en-klare vaardigheden die OpenSearch-intelligentie rechtstreeks naar de AI-agent brengt. Elke skill bevat domeinkennis en logica voor specifieke workflows, waardoor een agent niet alleen resultaten ophaalt, maar ook de context begrijpt.
Direct beschikbaar
Het aanmaken van een nieuwe databasecollectie kan via de AWS-console met de optie 'Express create', waarbij beveiligingsinstellingen automatisch correct worden toegepast. Ontwikkelaars die de voorkeur geven aan code, kunnen de clusters configureren via de AWS Command Line Interface (AWS CLI) of SDK's. Bij de lancering worden twee collectietypen ondersteund: reguliere zoekopdrachten (SEARCH) en vectorzoekopdrachten (VECTORSEARCH), die essentieel zijn voor het langetermijngeheugen van AI-modellen. Voor bestaande projecten blijft de optie beschikbaar om handmatig terug te schakelen naar de klassieke serverless infrastructuur.
De nieuwe generatie van Amazon OpenSearch Serverless is per direct beschikbaar in alle commerciƫle AWS-regio's waar de serverless-dienst al werd aangeboden. AWS factureert op basis van het werkelijke computergebruik in OpenSearch Compute Units (OCUs) voor indexering, zoeken en GPU-acceleratie, terwijl data-opslag apart per gigabyte per maand wordt afgerekend.