ElevenLabs krijgt turbo-injectie van Google en NVIDIA
De grens tussen menselijke spraak en kunstmatige intelligentie vervaagt in sneltreinvaart. ElevenLabs, de marktleider in AI-audiotechnologie, heeft een meerjarige strategische samenwerking aangekondigd met Google Cloud. Door de inzet van de allernieuwste NVIDIA Blackwell-chips moet de vertraging in AI-gesprekken definitief tot het verleden behoren.
De deal, die gisteren officieel werd gemaakt, markeert een belangrijke stap in de 'wapenwedloop' om de meest natuurlijke digitale assistent. ElevenLabs gaat op grote schaal gebruikmaken van de infrastructuur van Google Cloud om haar spraakmodellen te trainen en uit te rollen.
De kracht van Blackwell
Het hart van deze samenwerking wordt gevormd door de nieuwe G4-virtual machines van Google, die worden aangedreven door de NVIDIA RTX PRO 6000 Blackwell-GPU's. Voor de gemiddelde consument klinkt dit als technisch jargon, maar voor de industrie is het een doorbraak. De Blackwell-architectuur is specifiek ontworpen om de enorme rekenkracht die nodig is voor generatieve AI efficiënter en sneller te verwerken.
"Met de kracht van NVIDIA Blackwell verleggen we de grenzen van onze multimodale modellen," zegt Mati Staniszewski, mede-oprichter van ElevenLabs. "Dit betekent snellere inferentie (de snelheid waarmee de AI reageert), betere betrouwbaarheid en onmiddellijke antwoorden in meer dan 70 talen."
Slimmer praten dankzij Gemini
Naast de brute rekenkracht van de hardware, integreert ElevenLabs ook de slimme software van Google. De Gemini-modellen worden direct gekoppeld aan het platform van ElevenLabs. Hierdoor kunnen de spraakassistenten niet alleen praten, maar ook beter 'redeneren' en complexe taken plannen. Een AI-klantenservicemedewerker begrijpt hierdoor niet alleen wát de klant zegt, maar kan ook de context van een meerstaps probleem beter doorgronden.
Daarnaast wordt Google's videomodel Veo toegevoegd aan het creatieve platform van ElevenLabs. Hiermee kunnen mediabedrijven en marketingteams in recordtempo volledige multimedia-content genereren: van een natuurlijk klinkende voice-over tot de bijbehorende videobeelden.
AI-Agenten op schaal
Waar AI-stemmen voorheen vaak als speeltje werden gezien voor YouTubers of hobbyisten, richt deze samenwerking zich vol op de zakelijke markt. Grote ondernemingen in de financiële sector, retail en telecom gebruiken de technologie al voor:
- Real-time klantenservice: AI-agenten die menselijk reageren zonder de bekende robotachtige haperingen.
- Lokalisatie: Het razendsnel vertalen en nasynchroniseren van grote videobibliotheken in 70+ talen met behoud van de originele emotie.
- Brand Voices: Het creëren van een unieke, consistente stem voor een merk die overal ter wereld hetzelfde klinkt.
Vereenvoudigde toegang
Door de lancering van ElevenLabs op de Google Cloud Marketplace wordt de drempel voor grote bedrijven verlaagd. Facturering en naleving van regelgeving (compliance) lopen via de vertrouwde Google-omgeving, waardoor IT-afdelingen de nieuwe spraaktechnologie sneller kunnen implementeren.
"Deze samenwerking stelt bedrijven in staat om op wereldwijde schaal natuurlijke en boeiende ervaringen voor hun klanten te creëren," aldus Matt Renner van Google Cloud. Het doel is helder: een wereld waarin praten met een computer net zo vloeiend en persoonlijk voelt als een gesprek met een mens.