IBM lanceert Spyre Accelerator voor commerciële beschikbaarheid
IBM heeft de aanstaande algemene beschikbaarheid van de IBM Spyre Accelerator aangekondigd. Dit is een AI-accelerator die low-latency inferencing mogelijk maakt ter ondersteuning van Generatieve en Agentic AI-toepassingen, terwijl de veiligheid en veerkracht van de kern-workloads prioriteit krijgen.
Eerder dit jaar kondigde IBM al aan dat de Spyre Accelerator beschikbaar zou komen in de systemen IBM z17, LinuxONE 5 en Power11. Spyre is nu algemeen beschikbaar vanaf 28 oktober voor IBM z17 en LinuxONE 5 systemen, en begin december voor Power11 servers.
Verschuiving naar Agentic AI
Het IT-landschap verschuift van traditionele logica-workflows naar Agentic AI inferencing. AI-agenten vereisen een lage latentie voor inferentie en real-time responsiviteit van het systeem. IBM erkende de noodzaak voor mainframes en servers om AI-modellen te draaien naast de meest veeleisende bedrijfsworkloads zonder in te leveren op doorvoer.
Om aan deze vraag te voldoen, hebben klanten AI-inferencing hardware nodig die Generatieve en Agentic AI ondersteunt, maar tegelijkertijd de beveiliging en veerkracht van kritieke data, transacties en applicaties waarborgt. De accelerator is bovendien ontworpen om klanten in staat te stellen missiekritieke data on-premise te houden om risico's te beperken en operationele en energie-efficiëntie te verbeteren.
"Een van onze belangrijkste prioriteiten is het bevorderen van infrastructuur om te voldoen aan de eisen van nieuwe en opkomende AI-workloads," aldus Barry Baker, COO, IBM Infrastructure & GM, IBM Systems. "Met de Spyre Accelerator breiden we de mogelijkheden van onze systemen uit ter ondersteuning van multi-model AI – inclusief generatieve en agentic AI. Deze innovatie stelt klanten in staat om hun AI-ondersteunde missiekritieke workloads op te schalen met compromisloze beveiliging, veerkracht en efficiëntie, terwijl ze de waarde van hun bedrijfsdata ontsluiten."
Van onderzoek tot commercieel product
De IBM Spyre Accelerator is een direct resultaat van IBM's research-to-product pijplijn, waarbij innovatie van het IBM Research AI Hardware Center gecombineerd wordt met de ontwikkeling van enterprise-niveau door IBM Infrastructure. Wat begon als een prototype-chip, is verfijnd door snelle iteratie en testen.
De Spyre Accelerator is geëvolueerd naar een commercieel system-on-a-chip met 32 individuele accelerator-cores en 25,6 miljard transistors. De chip is geproduceerd met behulp van 5nm-knooptechnologie en elke Spyre is gemonteerd op een 75-watt PCIe-kaart. Dit maakt het mogelijk om tot 48 kaarten in een IBM Z of LinuxONE systeem, of 16 kaarten in een IBM Power systeem te clusteren om de AI-capaciteiten op te schalen.
Verbeterde beveiliging en prestaties
Voor IBM-klanten biedt de Spyre Accelerator snelle, beveiligde verwerking met on-prem AI-acceleratie. Dit is volgens IBM een belangrijke mijlpaal die bedrijven in staat stelt AI op schaal in te zetten, terwijl de data op de IBM Z, LinuxONE en Power systemen blijft.
In IBM Mainframe systemen: In combinatie met de Telum II-processor voor IBM Z en LinuxONE, biedt Spyre verbeterde beveiliging, lage latentie en een hoge verwerkingssnelheid voor transacties. Dit maakt het mogelijk om meerdere AI-modellen op te schalen voor voorspellende toepassingen, zoals geavanceerde fraudedetectie en retailautomatisering.
In IBM Power systemen: Klanten kunnen profiteren van een catalogus van AI-diensten, wat end-to-end AI voor enterprise-workflows mogelijk maakt. De combinatie van de Spyre Accelerator met een on-chip accelerator (MMA) versnelt de dataconversie voor generatieve AI en levert een hoge doorvoer voor diepe procesintegraties.
Met deze prestaties, gecombineerd met IBM's software-stack, beveiliging, schaalbaarheid en energie-efficiëntie, ondersteunt Spyre klanten in hun traject om generatieve AI-frameworks in hun bedrijfsworkloads te integreren, zo besluit IBM.