Novinky

NVIDIA představila procesor Vera navržený pro agentní AI a další novinky

Společnost NVIDIA představila procesor Vera navržený pro potřeby agentní AI. Ve srovnání s univerzálními serverovými procesory by měla novinka přinést dvojnásobnou efektivitu a o polovinu vyšší rychlost pro zpracování dat, trénování AI a inferenci AI agentů. Brzy se Vera stane také součástí specializovaných rackových řešení.

František Doupal
Zdroj: NVIDIA
  • 19. 3. 2026
  • 4 min
NVIDIA představila procesor Vera navržený pro agentní AI a další novinky

Procesory NVIDIA Vera staví na úspěchu modelu NVIDIA Grace. Organizacím všech velikostí napříč odvětvími umožní budovat „AI továrny“, které zpřístupňují agentní AI ve velkém měřítku. Díky vysokému jednovláknovému výkonu a propustnosti na jedno jádro představuje Vera novou, specializovanou třídu CPU, která bude mít do budoucna stále větší význam.

Navrženo pro agentní škálování

Díky kombinaci vysoce výkonných a energeticky úsporných CPU jader, paměťového subsystému s vysokou šířkou pásma a technologie NVIDIA Scalable Coherency Fabric druhé generace přinese platforma Vera rychlejší reakce agentů v extrémních podmínkách vytížení, které jsou typické pro agentní umělou inteligenci a tzv. posíleného učení (reinforcement learning).

Vera obsahuje 88 customizovaných jader typu ARM s architekturou Olympus navržených společností NVIDIA, která poskytují vysoký výkon pro agentní AI, kompilátory, runtime enginy a orchestrační služby. Každé jádro může díky technologii NVIDIA Spatial Multithreading zpracovávat dvě úlohy současně, čímž je zajištěn konzistentní a předvídatelný výkon ideální řešení pro multi-tenantní AI továrny, kde běží mnoho úloh najednou.

Vera je také prvním CPU na trhu, které nativně podporuje datový formát FP8. To umožňuje procesoru přímo se podílet na odvozování (inferenci) a zpracování dat v AI pipelines.

Novinkou je také inovativní prediktor větvení (Neural Branch Predictor), který využívá neurální sítě a dokáže vyhodnotit dvě větve kódu v jednom cyklu, což dramaticky zrychluje kompilaci a běh skriptovacích nástrojů.

Pro další zvýšení energetické účinnosti zavádí Vera druhou generaci nízkoenergetického paměťového subsystému, který je postavený na pamětech LPDDR5X a nabízí propustnost až 1,2 TB/s při poloviční spotřebě ve srovnání s univerzálními procesory.

NVIDIA Vera CPU Rack

Současně s novými procesory představila NVIDIA také nové rackové řešení, který integruje 256 kapalinou chlazených CPU Vera. Tento systém dokáže v jednu chvíli provozovat více než 22 500 souběžných CPU prostředí, z nichž každé běží nezávisle a při plném výkonu. AI továrny tak mohou rychle nasadit a škálovat desítky tisíc simultánních instancí a agentních nástrojů v jediném racku.

Nový rack je postaven na modulární referenční architektuře NVIDIA MGX, kterou již podporuje 80 partnerů z celého světa. Díky integraci s ethernetovou sítí Spectrum-X udržují CPU racky Vera prostředí CPU v AI datacentru vždy pečlivě synchronizovaná. Společně s výpočetními GPU racky poskytují CPU základ pro agentickou AI a učení s posilováním ve velkém měřítku – přičemž Vera přináší výsledky dvakrát efektivněji a o 50 % rychleji než tradiční CPU.

Partneři společnosti NVIDIA v blízké budoucnosti nabídnou konfigurace serverů s jedním i dvěma procesorovými sloty vhodné pro pracovní zátěže, jako jsou učení s posilováním, agentní inferenční výpočty, zpracování dat, orchestrace, správa úložišť, cloudové aplikace a vysoce výkonné výpočty (HPC).

NVIDIA Vera Rubin NVL72 Rack

Díky integraci 72 grafických procesorů Rubin a 36 procesorů Vera propojených technologií NVLink 6, spolu s kartami ConnectX-9 SuperNIC a procesory BlueField-4 DPU přinese platforma Vera Rubin NVL72 další výrazný posun v efektivitě při práci s agentní AI i dalšími formami umělé inteligence. Podle společnosti NVIDIA tak bude možné například trénovat rozsáhlé modely typu „mixture-of-experts“ se čtvrtinovým počtem GPU ve srovnání s platformou NVIDIA Blackwell a dosahovat až 10× vyšší propustnosti inferenčních operací na watt při desetině nákladů na jeden token.

Procesory Vera jsou s GPU propojeny prostřednictvím technologie NVIDIA NVLink-C2C s koherentní propustností 1,8 TB/s (což představuje sedminásobek šířky pásma rozhraní PCIe Gen 6). Rychlé a stabilní propojení napříč obrovskými GPU klastry pak zajistí kombinace síťových prvků Quantum-X800 InfiniBand a Spectrum-X Ethernet. Díky tomu se zkrátí doba potřebná na trénování AI modelů a další operace a sníží se celkové náklady na vlastnictví.

Již jsme zmiňovali, že ve všech konfiguracích budou zahrnuty karty NVIDIA ConnectX SuperNIC a procesory NVIDIA BlueField-4 (DPU) pro zrychlení činností souvisejících se síťovými operacemi, úložišti a zabezpečením, což jsou klíčové prvky pro agentní umělou inteligenci. To zákazníkům umožní optimalizovat jejich systémy pro konkrétní pracovní zátěže a zachovat jednotnou softwarovou architekturu napříč platformou NVIDIA.

Dostupnost

Procesory NVIDIA Vera a platforma Vera Rubin budou dostupné ve druhé polovině roku 2026.