Proč se z provozu AI stává byznys

Proč se z provozu AI stává byznys

AI modely se posouvají od jednoduchých odpovědí k vícekrokovému uvažování a používání nástrojů, což zvyšuje počet generovaných tokenů na jeden dotaz. Právě inference, tedy samotný provoz modelů, se podle dostupných informací stává jedním z hlavních motorů nákladů na výpočetní výkon a současně i klíčovým bodem, kde se v praxi vytváří hodnota. Do hry vstupuje nezávislý benchmark InferenceMAX v1 od SemiAnalysis, který má měřit celkové náklady napříč reálnými scénáři a porovnávat více platforem na běžných modelech a pracovních zátěžích. Výsledky v podkladu staví platformu NVIDIA Blackwell do pozice lídra kombinací výkonu…

ČÍST DÁLE...

Nvidia hlásí výjimečné výsledky, boom datových center pro AI pokračuje navzdory obavám z bubliny

Nvidia hlásí výjimečné výsledky

Tržby společnosti Nvidia vzrostly meziročně o 62 procent na 57 miliard dolarů v tomto čtvrtletí, čímž překonaly odhady Wall Street. Prudký nárůst prodejů, vedený objednávkami GPU pro datová centra zaměřená na AI, přišel navzdory rostoucím obavám trhu z bubliny kolem umělé inteligence. Prodeje specificky zaměřené na datová centra vzrostly o 66 procent na 51 miliard dolarů, přičemž generální ředitel Jensen Huang tvrdí, že „prodeje Blackwell jsou mimo všechny grafy a cloudové GPU jsou vyprodané.“ Finanční ředitelka Colette Kress dodala: „V současné době máme přehled o 0,5 bilionu dolarů v příjmech…

ČÍST DÁLE...

Telus spustil první suverénní AI továrnu v Kanadě

Telus spustil první suverénní AI továrnu v Kanadě

Kanadský telekomunikační operátor Telus otevřel v Rimouski (Québec) první plně suverénní AI továrnu v zemi. Nové zařízení poskytuje domácí výpočetní kapacitu pro trénink, doladění a nasazování modelů umělé inteligence při zachování úplné suverenity dat na území Kanady. Zařízení je poháněno grafickými procesory Nvidia a architekturou od společnosti HPE, která zajišťuje vysoký výkon a efektivní provoz. Telus uvedl, že AI továrna je navržena tak, aby reagovala na rostoucí obavy o kontrolu nad daty. Všechny výpočetní a datové procesy zůstávají v Kanadě a infrastruktura je postavena, vlastněna i provozována Kanaďany. „Podniky, výzkumníci…

ČÍST DÁLE...

IREN zdvojnásobuje kapacitu AI cloudu na 23 000 GPU, přidává čipy Nvidia Blackwell a AMD

IREN zdvojnásobuje kapacitu AI cloudu na 23 000 GPU, přidává čipy Nvidia Blackwell a AMD

Společnost IREN, známá také jako Iris Energy, oznámila výrazné rozšíření své AI cloudové infrastruktury. Nové objednávky čipů Nvidia a AMD zdvojnásobí kapacitu společnosti na celkem 23 000 GPU. Do svého portfolia IREN přidává 7 100 GPU Nvidia B300, 4 200 GPU Nvidia B200 a 1 100 GPU AMD MI350X v celkové hodnotě 674 milionů dolarů. Nové jednotky budou postupně instalovány v datovém kampusu Prince George v kanadské Britské Kolumbii, kde se aktuálně staví 10MW instalace s kapalinovým chlazením schopná pojmout více než 4 500 GPU GB300. „S rostoucí poptávkou po…

ČÍST DÁLE...

OpenAI uzavírá s Oracle cloudovou smlouvu za 300 miliard USD

OpenAI uzavírá s Oracle cloudovou smlouvu za 300 miliard USD

OpenAI podepsala s Oracle smlouvu v hodnotě 300 miliard USD na zajištění výpočetního výkonu od roku 2027. Podle Wall Street Journal jde o jednu z největších cloudových dohod v historii. Pětiletý kontrakt je součástí projektu Stargate, v jehož rámci OpenAI, Oracle a SoftBank investují 500 miliard USD do vybudování infrastruktury pro umělou inteligenci. Stargate má zahrnovat výstavbu datových center o výkonu 4,5 GW, což představuje dosud největší projekt svého druhu v odvětví. OpenAI zároveň pracuje na diverzifikaci hardwaru – plánuje spolupráci s Broadcomem v hodnotě 10 miliard USD na vývoj…

ČÍST DÁLE...

IREN rozšiřuje flotilu GPU o Nvidia B300 a GB300 pro AI cloud

IREN rozšiřuje flotilu GPU o Nvidia B300 a GB300 pro AI cloud

Společnost IREN (dříve Iris Energy), která provozuje datová centra a původně se zaměřovala na těžbu kryptoměn, oznámila další významný nákup grafických procesorů Nvidia. Do své flotily přidává 1 200 vzduchem chlazených karet B300 a 1 200 kapalinou chlazených GB300 v hodnotě zhruba 168 milionů USD. Celkový počet GPU ve vlastnictví firmy tak vzrostl na 10 900 kusů. Nově zakoupené jednotky budou instalovány v kampusu společnosti v kanadském Prince George, kde vzniká nové kapalinou chlazené datové centrum s IT kapacitou 10 MW. Toto zařízení má pojmout více než 4 500 systémů…

ČÍST DÁLE...

Crusoe Cloud přidává Nvidia GB200 NVL72 v datacentru na Islandu

Oklo a RPower spolupracují na nasazení hybridního modelu jaderné a zemního plynu pro datová centra

Crusoe Cloud nasadil systém Nvidia GB200 NVL72 v islandském datacentru atNorth ICE02 a zpřístupnil jej přes plně virtualizovanou platformu. Jde o první nasazení s kapalinovým chlazením v tomto zařízení a součást rozšíření kapacity o 24 MW z konce léta; lokalita nyní hostí také další GPU generací Blackwell a Hopper. Společnost vstoupila do islandského regionu na konci roku 2023 s 33 MW, využívá čisté zdroje energie a rozšiřuje evropskou nabídku v regionu eu-iceland1-a. Crusoe, původně známé využitím zplynovaného odpadu z ropných polí pro mobilní výpočetní kontejnery, se přeorientovalo na trvalá datacentra…

ČÍST DÁLE...

Nvidia představuje nové Spectrum-XGS, které propojí datová centra do jednoho „AI super-GPU“

Nvidia představuje nové Spectrum-XGS, které propojí datová centra do jednoho „AI super-GPU“

Nvidia představila síťovou technologii Spectrum-XGS Ethernet, navrženou pro propojení více datových center a vytvoření jednotného prostředí pro úlohy umělé inteligence. Oznámení zaznělo na konferenci Hot Chips 2025 a navazuje na platformu Spectrum-X uvedenou v roce 2024. Novinka využívá přepínače SN5600 s architekturou Spectrum-4, DPU BlueField-3 a nové síťové adaptéry ConnectX-8 SuperNIC s rychlostí 800 Gb/s. Podle společnosti technologie téměř dvojnásobně zvyšuje výkon komunikační knihovny Nvidia NCCL a nabízí 1,6násobnou hustotu šířky pásma oproti běžným ethernetovým řešením. Dave Salvator z Nvidie uvedl: „Výsledkem je, že různá datová centra mohou fungovat v…

ČÍST DÁLE...

Německo bude hostit největší evropské průmyslové centrum pro výpočetní techniku AI

Německo bude hostit největší evropské průmyslové centrum pro výpočetní techniku AI

Evropské továrny se chystají stát se podstatně inteligentnějšími. Oznámení společnosti NVIDIA o masivním průmyslovém AI cloudovém zařízení v Německu znamená, že výrobci v Evropě budou brzy mít přístup k výpočetnímu výkonu rovnocennému tisícům superpočítačů, což jim pomůže rychleji navrhovat produkty, předpovídat poruchy strojů ještě před jejich vznikem a optimalizovat výrobu způsoby, které byly před několika lety nemožné. Průmyslová AI cloud iniciativa Nvidia, odhalená na GTC v Paříži během VivaTech, jde nad rámec tradiční cloudové výpočetní techniky tím, že vytváří to, co generální ředitel Jensen Huang popisuje jako „AI továrnu“ specificky…

ČÍST DÁLE...

Alibaba Cloud potvrzuje plány na globální expanzi v hodnotě 52,7 miliardy dolarů

Alibaba Cloud potvrzuje plány na globální expanzi v hodnotě 52,7 miliardy dolarů

Generální ředitel Alibaba, Eddie Wu, znovu potvrdil plány na globální expanzi Alibaba Cloud. Na firemní akci minulý týden Wu sdělil účastníkům, že společnost má v úmyslu vybudovat „sjednocenou globální cloudovou síť“ a investovat do toho 380 miliard jüanů (52,7 miliardy dolarů). Jak informoval deník South China Morning Post, který patří Alibabě, společnost chce „urychlit“ budování své cloudové sítě v Japonsku, Jižní Koreji, jihovýchodní Asii, na Blízkém východě, v Evropě a v Americe. Cílem je poskytnout čínským firmám konzistentní služby AI infrastruktury jak v domovské zemi, tak v zahraničí. V současnosti…

ČÍST DÁLE...

AWS dosáhl tržeb 29,3 miliardy dolarů za 1. čtvrtletí 2025, meziroční nárůst o 17 %

AWS dosáhl tržeb 29,3 miliardy dolarů za 1. čtvrtletí 2025, meziroční nárůst o 17 %

Amazon Web Services (AWS) přinesl v prvním čtvrtletí 2025 tržby ve výši 29,3 miliardy dolarů, což představuje meziroční nárůst o 17 procent. I když je to více než 28,8 miliardy dolarů z předchozího čtvrtletí, jedná se o nejpomalejší růst, jaký společnost za poslední rok zaznamenala. Jak bylo odhaleno během nedávného hovoru k výsledkům společnosti, generální ředitel Amazonu Andy Jassy a finanční ředitel Brian Olsavsky zůstávají ohledně výkonu cloudového segmentu pozitivní a uvádějí, že AWS je aktuálně na cestě k ročnímu obratu 117 miliard dolarů. Provozní zisk AWS činil 11,5 miliardy…

ČÍST DÁLE...

Nvidia B200 jsou nyní obecně dostupné prostřednictvím AWS

Nvidia B200s jsou nyní obecně dostupné prostřednictvím AWS

Amazon Web Services (AWS) spustil instance Elastic Cloud Compute (EC2) vybavené GPU Nvidia B200. Instance P6-B200 jsou obecně dostupné od 15. května 2025 a jsou navrženy pro AI, strojové učení a vysoce výkonné výpočetní úlohy (HPC) – zejména pro rozsáhlý distribuovaný trénink a inferenci základních modelů umělé inteligence. Každá instance obsahuje osm GPU Nvidia B200 a má 1 440 GB vysoce propustné paměti GPU, procesory 5. generace Intel Xeon Scalable, 2 TiB systémové paměti a 30 TB lokálního NVMe úložiště. Podle AWS nabízejí tyto instance až o 125 procent vyšší…

ČÍST DÁLE...

Treasure Global Inc. vyvíjí AI cloudovou infrastrukturu v Malajsii

Treasure Global Inc. vyvíjí AI cloudovou infrastrukturu v Malajsii

Treasure Global Inc. plánuje vyvinout a nasadit cloudovou infrastrukturu pro umělou inteligenci v Malajsii. Malajsijská technologická společnost odhalila své plány 24. března 2025 a zaměřuje se na vývoj platformy schopné podporovat AI modely až do jednoho bilionu parametrů. Vývoj platformy již začal a bude probíhat ve fázích během roku 2025. Datová centra, ve kterých bude GPU cloudová nabídka hostována, nebyla specifikována. Tento projekt zahrnuje nasazení GPU a bude optimalizován pro velkoobjemové, multimodální AI pracovní zátěže a bude postaven na technologii DeepSeek. GPU, které společnost plánuje nasadit, nebyly zveřejněny, ale bylo…

ČÍST DÁLE...

Nvidia investovala 1 miliardu dolarů do AI společností v roce 2024

Nvidia investovala 1 miliardu dolarů do AI společností v roce 2024

Podle zprávy Financial Times (FT), která cituje firemní dokumenty a výzkum společnosti Dealroom, Nvidia investovala do 50 investičních kol startupů a firemních obchodů během roku 2024, což představuje 15% nárůst oproti 872 milionům dolarů, které společnost utratila v rámci 39 investičních kol v roce 2023. FT po analýze dat uvedl, že Nvidia primárně investovala do AI společností s velkými požadavky na výpočetní infrastrukturu, včetně organizací, které zakoupily čipy Nvidia pro provoz svých pracovních zátěží. Ačkoli se Nvidia účastnila více investičních kol než Amazon a Microsoft, Google všechny tři společnosti překonal…

ČÍST DÁLE...