Amazon Web Services bude první cloudovou společností, která ve své službě nabídne superčipy GH200 Grace Hopper od Nvidie.
Společnost nabídne kombinované CPU a GPU přes instance Amazon Elastic Compute Cloud (Amazon EC2) propojené se sítí Amazon EFA. Bude podporován virtualizací AWS Nitro System a hyperškálovacími službami Amazon EC2 UltraClusters.
AWS také nabídne čipy GH200 NVL32 přes Nvidia DGX Cloud, vlastní službu Nvidie, kterou provozuje nad ostatními cloudovými poskytovateli.
Hyperscaleři v podstatě pronajímají servery Nvidie a nasazují je jako cloud v rámci svého cloudu, který může Nvidia prodávat podnikům, které hledají velké superpočítače s GPU.
„To, co dělá toto oznámení DGX Cloud zvláštním, je to, že se bude jednat o první DGX Cloud poháněný Grace Hopperem od Nvidie,” řekl Ian Buck, viceprezident společnosti Nvidia pro hyperscale a HPC.
„Je to nová architektura GPU v rackovém měřítku pro éru generativní umělé inteligence.”
GH200 s rackovou architekturou NVL32 poskytuje největší sdílenou paměť v jediné instanci cloudové služby, uvedla Nvidia a podporuje velké jazykové modely, které mohou dosáhnout více než 1 bilionu parametrů.
Na stejné konferenci AWS re:Invent obě společnosti oznámily „Project Ceiba“, plán na vybudování největšího světového cloudového superpočítače s umělou inteligencí na AWS, který budou používat interní týmy Nvidie.
Zdroj: datacenterdynamics.com