Open Compute Project versnelt uitrol van next-gen AI-clusters
De Open Compute Project Foundation (OCP), de non-profitorganisatie die hyperscale innovaties voor iedereen toegankelijk maakt, heeft vandaag aangekondigd een belangrijke stap te zetten in haar positionering als de toonaangevende open organisatie die de uitrol van open systemen voor AI versnelt. Dit gebeurt met de opening van een AI-portaal op de OCP Marketplace. Deze centrale plek biedt ontwerpers en bouwers van AI-clusters alle benodigde informatie, waaronder de nieuwste beschikbare AI-infrastructuurproducten, whitepapers over aankomende innovaties en standaarden, best practice documenten en referentiemateriaal voor het succesvol ontwerpen en bouwen van AI-clusters. Bij de lancering toont het OCP Marketplace AI-portaal al een aanzienlijk aanbod van AI-producten van diverse leveranciers, een waardevolle bron voor de bouwers van AI-clusters.

Nu hyperscale operators ongekende uitdagingen ervaren op het gebied van compute-dichtheid, stroomdistributie, interconnectie en koeling bij de bouw van AI-clusters die tot wel 1 MW per rack verbruiken, ontwikkelt de collaboratieve OCP-community van meer dan 400 bedrijfsleden en 6.000 actieve engineers open standaarden om bottlenecks aan te pakken die de groei van AI-infrastructuur dreigen te belemmeren.
"Vooruitkijkend streeft OCP ernaar de toonaangevende organisatie te blijven voor AI-infrastructuur door zich te richten op drie pijlers: (1) het standaardiseren van silicium, stroom, koeling en interconnecties; (2) het ondersteunen van de ontwikkeling van complete open systemen; en (3) het bieden van educatie via technische workshops, de OCP Marketplace en Academy. Nu AI en HPC de computervereisten blijven herdefiniëren, lijkt de rol van OCP in het bevorderen van de ontwikkeling van open, duurzame en schaalbare infrastructuur steeds vitaler voor het vermogen van de industrie om het transformatieve potentieel van AI te realiseren en tegelijkertijd de impact op het milieu te beheersen," aldus George Tchaparian, CEO van de Open Compute Project Foundation.
De OCP Community werkt aan significante gedeelde problemen, waaronder het standaardiseren van rackarchitecturen die vermogensenveloppen van 250 kW tot 1 MW ondersteunen, het definiëren van geavanceerde koeloplossingen (bijv. vloeistofkoeling) voor nodes met hoge dichtheid, het bouwen van hoogspannings- en hoogefficiënte stroomdistributiesystemen, het mogelijk maken van meerdere, evoluerende scale-up en scale-out interconnect fabrics voor prestaties, en uitgebreide management frameworks voorNear-autonome operaties. De OCP Community tracht met haar strategische initiatief Open Systems for AI deze uitdagingen aan te gaan en heeft recentelijk een Blueprint for Scalable AI Infrastructure gepubliceerd en een workshop gehouden over AI Physical Infrastructure.
NVIDIA
Naast de opening van het AI-portaal op de OCP Marketplace heeft Meta de specificatie voor zijn Catalina AI Compute Shelf bijgedragen. Deze is specifiek geconfigureerd voor het leveren van een AI-systeem met hoge dichtheid dat NVIDIA GB200 ondersteunt. Catalina is gebaseerd op ORv3 en ondersteunt tot 140 kW, inclusief de Meta Wedge fabric switches voor de NVIDIA NVL72 architectuur. Deze bijdrage van Meta vult de eerdere bijdrage van NVIDIA aan van haar MGX-gebaseerde GB200-NVL72 Platform, dat (1) haar versterkte OCP ORv3 rackarchitectuur en (2) haar 1RU vloeistofgekoelde MGX compute- en switchtrays omvat.
Het strategische initiatief OCP Open Systems for AI werd in januari 2024 gelanceerd, in de erkenning dat AI vandaag de meest prominente datacenter use case is die innovaties aandrijft, gevolgd door HPC en de opkomende edge. De grootste kracht van OCP is haar community-gedreven model. Door leiders, innovators en experts uit het hele technologiespectrum samen te brengen, pakt OCP de multidimensionale ontwerpuitdagingen van AI-infrastructuur aan. Dit initiatief brengt het werk van de OCP Community samen om de volgende generatie datacenters en IT-apparatuur te leveren die voldoen aan de schaal en workload diversiteit van AI.
"De uitrol van AI-datacenters bevindt zich nu in het derde jaar, waarbij systemen van de eerste generatie worden geïmplementeerd en de volgende generatie op de tekentafel ligt. Vanwege de snelheid waarmee de markt moest bewegen, werden de systemen van de eerste generatie grotendeels in silo's ontworpen, wat resulteerde in hogere kosten als gevolg van fragmentatie. Het is het juiste moment voor een organisatie als OCP om een community te faciliteren om gemeenschappelijke kenmerken te bepalen die kunnen leiden tot standaarden die de markt voor toekomstige generaties AI-clusterimplementaties kunnen versnellen," aldus Ashish Nadkarni, Group Vice President en General Manager, Worldwide Infrastructure bij IDC.
Aankomende OCP-evenementen die de nieuwste AI-clusterinnovaties van de OCP Community zullen presenteren, zijn: (1) OCP AI Strategic Initiative Technical Workshop Series, (2) OCP Canada Tech Day, (3) OCP Southeast Asia Tech Day, (4) OCP APAC Summit, en (5) OCP Global Summit.