Rostoucí nároky AI na výpočetní výkon tlačí firmy k hledání alternativ mimo tradiční hyperscalery typu AWS, Google Cloud nebo Azure. Vedle klasického cloudu se proto stále častěji zmiňují decentralizovaná tržiště, která propojují poptávku po GPU s nabídkou nevyužitého hardwaru napříč různými provozovateli. Cílem je nabídnout flexibilnější kapacity (například pro trénování modelů, inferenci nebo 3D rendering) a často i nižší cenu, protože trh dokáže „vytěžit“ výkon, který by jinak ležel ladem. Mezi sledovanými projekty se objevuje Argentum AI, které se snaží přiblížit pronájem GPU logice finančních trhů. Výpočetní úlohy zde fungují…
ČÍST DÁLE...Štítek: GPU
Alibaba Cloud tvrdí, že dokáže snížit využití GPU o 82 % pomocí poolingového systému
Čínská cloudová společnost Alibaba Cloud představila optimalizační systém pro využití GPU, který podle jejích tvrzení dokáže snížit potřebu čipů až o 82 procent. Společnost sdílela recenzovanou studii na sympoziu ACM o operačních systémech (SOSP) 2025 v Soulu, kde vysvětlila, jak její poolingový systém GPU s názvem Aegaeon dokáže snížit množství potřebných GPU při zpracování „sporadických a nepředvídatelných požadavků v souběžných inferenčních úlohách s dedikovanými GPU instancemi“. Studie uvádí, že zatímco stávající řešení pro obsluhu více modelů používají „pooling GPU a serverless computing ke zlepšení efektivity zdrojů“, jsou účinná pouze pro…
ČÍST DÁLE...Sektor neocloudů roste tempem 82 % ročně díky poptávce po AI infrastruktuře
Podle zprávy The Rise of Neocloud Infrastructure společnosti JLL zaznamenal segment tzv. neocloudů od roku 2021 složenou roční míru růstu příjmů (CAGR) 82 %. Rychlou expanzi pohání globální poptávka po výpočetní kapacitě a GPU zdrojích pro umělou inteligenci, přičemž na trh vstoupilo již téměř 200 nových provozovatelů mimo hlavní hyperscalery, jako jsou CoreWeave, Nebius nebo Crusoe. Jen v roce 2025směřovalo do neocloudového sektoru více než 10 miliard dolarů investic. Akcie společnosti CoreWeave po jejím březnovém vstupu na burzu téměř ztrojnásobily hodnotu, což podtrhuje růstový potenciál tohoto odvětví. Výhodou neocloudů je…
ČÍST DÁLE...Nvidia představuje nové Spectrum-XGS, které propojí datová centra do jednoho „AI super-GPU“
Nvidia představila síťovou technologii Spectrum-XGS Ethernet, navrženou pro propojení více datových center a vytvoření jednotného prostředí pro úlohy umělé inteligence. Oznámení zaznělo na konferenci Hot Chips 2025 a navazuje na platformu Spectrum-X uvedenou v roce 2024. Novinka využívá přepínače SN5600 s architekturou Spectrum-4, DPU BlueField-3 a nové síťové adaptéry ConnectX-8 SuperNIC s rychlostí 800 Gb/s. Podle společnosti technologie téměř dvojnásobně zvyšuje výkon komunikační knihovny Nvidia NCCL a nabízí 1,6násobnou hustotu šířky pásma oproti běžným ethernetovým řešením. Dave Salvator z Nvidie uvedl: „Výsledkem je, že různá datová centra mohou fungovat v…
ČÍST DÁLE...Poskytovatel AI cloudu Ori Industries nasazuje GPU v zařízení Kao Data
Poskytovatel AI cloudu Ori nasadil GPU ve svém zařízení Kao Data v Harlow. Společnost uvedla, že koncem minulého roku nasadí GPU Nvidia H200 ve Velké Británii, ale nezveřejnila, kterého poskytovatele datových center využije. „Jsme potěšeni, že můžeme spolupracovat s Kao Data na naší expanzi ve Velké Británii. Jejich kampus v Harlow nám nabízí dokonalou kombinaci vysoce výkonné infrastruktury datového centra, obnovitelné energie a blízkosti k Londýnu a Cambridge, kde se nachází prosperující ekosystémy AI a technologií,“ uvedl Mahdi Yahya, zakladatel a generální ředitel Ori. – Kao Data prostřednictvím LinkedIn. „S…
ČÍST DÁLE...Jak poskytovatelé cloudu řeší nedostatek GPU pomocí vlastních čipů
GPU jsou páteří výpočetní techniky pro umělou inteligenci, ale protože poptávka převyšuje nabídku, poskytovatelé cloudu přicházejí s kreativními řešeními. Místo čekání na další GPU, jak uvádí Network World, vytvářejí vlastní čipy, které jsou přizpůsobeny specifickým úlohám. Tyto čipy poskytují rychlejší a efektivnější výpočetní výkon a zároveň pomáhají udržet náklady pod kontrolou. Konkurenční boj se stupňuje. Na konferenci Ignite, kterou pořádal Microsoft na začátku prosince 2024, společnost představila dva nové čipy navržené ke zvýšení výkonu své platformy Azure. Všechny oči se nyní upírají na AWS, který připravuje vlastní portfolio čipů na…
ČÍST DÁLE...Confidential Computing vrací důvěru v cloud
Přesunutím IT do cloudu mohou společnosti ušetřit náklady. Avšak důvěra společností v cloudové aplikace stále není příliš vysoká kvůli obavám z neautorizovaného přístupu k důvěrným datům. Řešením tohoto problému je Confidential Computing: izolované hardwarové prostředí. Veškerý software a související data, které zde běží, jsou chráněny před přístupem jiného softwaru či hardwaru. Confidential Computing (CC) umožňuje end-to-end ochranu citlivých dat – od opuštění firemního prostředí až po vstup do cloudové infrastruktury. Stačí tak důvěřovat pouze procesorům a jejich výrobcům, protože přístup k nešifrovaným datům nemají poskytovatelé služeb a správci cloudu ani…
ČÍST DÁLE...