AWS jako první nabízí superčipy GH200 na EC2 a DGX Cloud společnosti Nvidia

NVIDIA DGX Cloud

Amazon Web Services bude první cloudovou společností, která ve své službě nabídne superčipy GH200 Grace Hopper od Nvidie.

Společnost nabídne kombinované CPU a GPU přes instance Amazon Elastic Compute Cloud (Amazon EC2) propojené se sítí Amazon EFA. Bude podporován virtualizací AWS Nitro System a hyperškálovacími službami Amazon EC2 UltraClusters.

AWS také nabídne čipy GH200 NVL32 přes Nvidia DGX Cloud, vlastní službu Nvidie, kterou provozuje nad ostatními cloudovými poskytovateli.

Hyperscaleři v podstatě pronajímají servery Nvidie a nasazují je jako cloud v rámci svého cloudu, který může Nvidia prodávat podnikům, které hledají velké superpočítače s GPU.

„To, co dělá toto oznámení DGX Cloud zvláštním, je to, že se bude jednat o první DGX Cloud poháněný Grace Hopperem od Nvidie,” řekl Ian Buck, viceprezident společnosti Nvidia pro hyperscale a HPC.

„Je to nová architektura GPU v rackovém měřítku pro éru generativní umělé inteligence.”

GH200 s rackovou architekturou NVL32 poskytuje největší sdílenou paměť v jediné instanci cloudové služby, uvedla Nvidia a podporuje velké jazykové modely, které mohou dosáhnout více než 1 bilionu parametrů.

Na stejné konferenci AWS re:Invent obě společnosti oznámily „Project Ceiba“, plán na vybudování největšího světového cloudového superpočítače s umělou inteligencí na AWS, který budou používat interní týmy Nvidie.

Zdroj: datacenterdynamics.com

Související články

Leave a Comment