Proč se z provozu AI stává byznys

Proč se z provozu AI stává byznys

AI modely se posouvají od jednoduchých odpovědí k vícekrokovému uvažování a používání nástrojů, což zvyšuje počet generovaných tokenů na jeden dotaz. Právě inference, tedy samotný provoz modelů, se podle dostupných informací stává jedním z hlavních motorů nákladů na výpočetní výkon a současně i klíčovým bodem, kde se v praxi vytváří hodnota. Do hry vstupuje nezávislý benchmark InferenceMAX v1 od SemiAnalysis, který má měřit celkové náklady napříč reálnými scénáři a porovnávat více platforem na běžných modelech a pracovních zátěžích. Výsledky v podkladu staví platformu NVIDIA Blackwell do pozice lídra kombinací výkonu…

ČÍST DÁLE...

Ionstream zpřístupňuje Nvidia B200s prostřednictvím GPU cloudu

Ionstream zpřístupňuje Nvidia B200s prostřednictvím GPU cloudu

Společnost prostřednictvím příspěvku na LinkedIn oznámila, že úspěšně nasadila Blackwell B200 GPU od Nvidie, které jsou nyní dostupné prostřednictvím GPU cloudu Ionstream. Tyto GPU nabízejí 12x lepší energetickou účinnost než Nvidia H100 a A100, mají 192 GB HBM3e na GPU s šířkou pásma 8 TB/s. B200s jsou propojeny pomocí 5. generace NVLink & NVSwitch pro škálování více GPU a jsou k dispozici na vyžádání od 2,40 USD za hodinu. V samostatném příspěvku na LinkedIn zakladatel a generální ředitel Ionstream Jeff Hinkle napsal: „Firmy využívající AI si uvědomují její rychlý vývoj…

ČÍST DÁLE...