NVIDIA GTC 2025: Reálná AI, reálné problémy, reálná řešení

21. 3. 2025. (redaktor: František Doupal, zdroj: NVIDIA)
Konference NVIDIA GTC (GPU Technology Conference) je jedním z klíčových globálních setkání zaměřených na umělou inteligenci a technologie grafických procesorů a s nimi spojený ekosystém produktů, řešení a služeb. Pojďme si proto ty nejzajímavější novinky, které mají potenciál ovlivnit dění v celém odvětví, na následujících řádcích přiblížit.

Letošní ročník NVIDIA GTC byl s ohledem na rychlý vývoj v oblasti AI, na rostoucí konkurenci i klíčovou roli, kterou v tomto segmentu NVIDIA hraje, netrpělivě očekáván. Novinek přímo od společnosti NVIDIA nebo jejích technologických partnerů, bylo opět představeno obrovské množství, alespoň ty nejdůležitější se vám nyní pokusíme představit.

Nejdůležitější novinky a vize společnosti jako obvykle představil během své key note zakladatel a generální ředitel společnosti NVIDIA Jensen Huang. O čem se tedy v jejím průběhu hovořilo?

Huang zahájil konferenci prohlášením, že AI se nachází v „bodě zlomu“ a že poptávka po GPU neustále stoupá. Předpověděl, že příjmy společnosti NVIDIA z datové infrastruktury by do roku 2028 mohly dosáhnout bilionu dolarů. Tento odhad je podpořen také rostoucím zaváděním AI v různých odvětvích a zvyšující se složitostí modelů AI, které vyžadují stále výkonnější infrastrukturu. Představil také koncept „továren na umělou inteligenci“ (AI factories) a zdůraznil potřebu extrémního výpočetního výkonu a efektivity pro inferenci AI.

Podle jeho slov se AI zároveň posouvá směrem k uvažování a agentní AI, což vyžaduje podstatně více výpočetních zdrojů. Huang rovněž oznámil roční cyklus pro vývoj AI infrastruktury, na jehož základě budou každoročně představovány nové GPU, CPU a pokroky v akceleraci výpočtů. Zdůraznil také, že fyzická AI pro průmyslové a robotické aplikace představuje příležitost v hodnotě 50 bilionů dolarů.

Nástup nové generace hardwaru

Blackwell Ultra

Nejnovější generaci grafické architektury pojmenovala NVIDIA jako Blackwell Ultra a prozradila, že na trh by se měla dostat ve druhé polovině roku 2025. V porovnání s předchozí generací (Hopper) má novinka nabízet až 11× vyšší výkon AI pro inferenci a 4× rychlejší trénování. Architektura je navržena pro škálování inferencí v době testování a pro akceleraci aplikací využívajících AI pro uvažování, agentní AI i fyzickou AI.

Systém GB300 NVL72 bude obsahovat 72 GPU Blackwell Ultra, 36 CPU Grace a 288 GB paměti HBM3e. Podle tvrzení společnosti NVIDIA dosahuje toto řešení výkonu 15 PFLOPS v operacích FP4 a přinese 1,5× vyšší výkon než předchozí model B200.

Vera Rubin

NVIDIA dále představila architekturu Rubin Ultra, která má nabídnout zvýšenou šířku pásma a rychlost a koncem roku 2026 nahradí generaci Blackwell Ultra.

Architekturu Rubin při uvedení na trh doplní vylepšené procesory „Vera“. První systém Vera Rubin NVL144 má slibovat 3,3× vyšší výkon než systém GB300. Pro rok 2027 je plánován Rubin Ultra NVL576, který má nabídnout až 14× vyšší výkon než GB300.

Rubin má obsahovat dvojici výpočetních jader vyrobených 3nm procesem TSMC s výkonem 50 PFLOPS v operacích FP4 a 288 GB paměti HBM4. CPU Vera bude vybavena 88 zakázkovými ARM jádry a NVLink konektivitou. Rubin Ultra je navržen tak, aby do jednoho racku s příkonem 600 kW vměstnal 576 GPU jader. V roce 2027 by měla dorazit také vylepšená generace Rubin Ultra s pamětí HDM4e.

Někdy v roce 2028 by pak měla následovat generace Feynman s pamětí HBM5.

Systémy DGX

Společnost NVIDIA představila také „osobní desktopové AI superpočítače“ DGX Spark a DGX Station založené na platformě Grace Blackwell.

Další kategorií zařízení jsou systémy DGX GB300, které budou obsahovat čipy Grace Blackwell Ultra (36 CPU Grace a 72 GPU Blackwell Ultra). 

Například DGX SuperPOD se systémy DGX GB300 bude schopen škálovat až na desítky tisíc čipů.


NVIDIA Blackwell RTX PRO

NVIDIA na GTC 2025 představila i nové profesionální desktopové grafické procesory z rodiny Blackwell RTX PRO. Novinky založené na architektuře Blackwell nesou označení RTX Pro, aby se odlišily od předchozích generací (Ada Lovelace, Ampere a Turing) a od běžných spotřebitelských modelů. Nejvýkonnější modely nabídnou 96 GB paměti ECC GDDR7 a výkon až 4 000 AI TOPS (dvojnásobek, co zvládne dřívější výkonnostní šampion RTX 6000 a čtyřnásobek výkonu nejlepšího grafického procesoru na spotřebitelském trhu RTX 5090).

Představeny byly také o něco hůře vybavené modely Pro 5000, Pro 4500 a Pro 4000. V neposlední řadě byly prezentovány také ekvivalentní varianty čipů pro přenosné počítače (jejich nabídce bude dominovat model RTX Pro 5000 Blackwell s 24GB pamětí GDDR7). Tyto novinky by měly být k dispozici během května a června letošního roku.

Tyto karty budou dále k dispozici i ve variantě „Server Edition“ určené pro nasazení v datových centrech.

Budoucnost AI infrastruktury

Společnost NVIDIA na konferenci GTC 2025 představila svou vizi budoucnosti infrastruktury umělé inteligence, která zahrnuje řešení a systémy jako:

  • AI Factories (továrny na umělou inteligenci): Přechod od tradičních datových center k specializovaným prostředím určeným pro generování inteligence AI ve velkém měřítku. AI factories představují posun směrem k účelově navrženým prostředím určeným k efektivnímu využívání různých forem AI.
  • Spectrum-X Photonics: Nový síťový přepínač založený na křemíkové fotonice nabízející propustnost 1,6 terabitů za sekundu na port. Vyznačuje se výrazným snížením spotřeby energie a zlepšením odolnosti signálu a hodí se pro nasazení v AI Factories.
  • AI Data Platform (platforma pro data AI): Přizpůsobitelný referenční návrh pro podnikovou infrastrukturu určenou pro hostování AI agentů.
  • Inovace v oblasti sítí: Zaměření na pokročilá síťová řešení, jako jsou NVIDIA Quantum-X800 InfiniBand a Spectrum-X Ethernet pro zlepšení škálovatelnosti a efektivity AI.
  • Úložiště optimalizovaná pro AI: Zdůraznění potřeby přehodnotit úložiště pro podporu pracovních zátěží AI s posunem směrem k sémanticky založeným systémům pro vyhledávání.


Novinky v oblasti softwaru pro AI

NVIDIA Dynamo

Dynamo je open-source software určený pro akceleraci a škálování AI modelů uvažování (reasoning) v systémech typu AI Factory. Zjednodušeně řečeno, NVIDIA Dynamo řeší otázku efektivního nasazení a škálování modelů AI pro uvažování, které jsou stále složitější a náročnější. Novinka, která nahradí řešení NVIDIA Triton Inference Server, orchestruje a urychluje komunikaci inferencí napříč tisíci GPU a rozděluje zpracování a generování velkých jazykových modelů na různých GPU. Například při práci s AI modely Llama by mělo být možné dosáhnout až dvounásobného výkonu.

AI-Q Blueprint a modely Llama Nemotron Reasoning

Open-source softwarová knihovna AI-Q Blueprint je určena pro budování komplexních agentních AI služeb. Dále byla oznámena rodina otevřených modelů NVIDIA Llama Nemotron Reasoning s vylepšenými schopnostmi uvažování pro budování pokročilých AI agentů, která je součástí kolekce NIMs a je spustitelná na jakékoli platformě.

Představení AI-Q Blueprint a modelů Llama Nemotron Reasoning signalizuje závazek společnosti NVIDIA umožnit vývoj sofistikovaných AI agentů schopných uvažovat a interagovat se světem komplexnějším způsobem. Tyto nástroje poskytují vývojářům stavební kameny pro vytváření AI systémů, které přesahují jednoduché rozpoznávání vzorů a mohou provádět abstraktnější úkoly vyžadující porozumění, plánování a rozhodování.

NVIDIA Isaac GR00T N1 a Newton

NVIDIA Isaac GR00T N1 je první otevřený a plně přizpůsobitelný základní model pro generalizované uvažování a dovednosti humanoidních robotů. Model využívá dvousystémovou architekturu inspirovanou principy lidské kognice (rychle myslící akční model a pomalu myslící model pro rozhodování), je trénován na lidských i syntetických datech generovaných platformou NVIDIA Omniverse a měl by být schopen generalizovat běžné úkoly a provádět víceúrovňové úkoly vyžadující dlouhý kontext a kombinace obecných dovedností. Je přizpůsobitelný pro specifické roboty nebo úkoly prostřednictvím dodatečného trénování. Model je dostupný jako open-source na GitHubu.

Společnost také představila například open-source fyzikální engine Newton určený pro vývoj robotů vyvíjený ve spolupráci s Google DeepMind a Disney Research.

Digitální dvojčata a průmyslové aplikace

NVIDIA Omniverse se stává klíčovou platformou pro průmyslovou digitalizaci, umožňující vytváření vysoce věrných digitálních dvojčat pro různé aplikace, od návrhu produktů po automatizaci továren. Nyní se tento ekosystém pro vytváření a spolupráci v oblasti fyzikálně přesných 3D simulací a digitálních dvojčat dále rozšiřuje. Na konferenci byla představena řada spoluprací v této oblasti:

  • Siemens: Integrace technologie NVIDIA Grace Blackwell a rozhraní API Omniverse pro vytváření pohlcujících digitálních dvojčat. Fotorealistická vizualizace Teamcenter poháněná Omniverse je nyní obecně dostupná.
  • Ansys: Využití NVIDIA Omniverse Blueprint pro CAE s využitím CUDA, Modulus a Omniverse pro vytváření a nasazování digitálních dvojčat.
  • Omron: Demonstrace propojení inspekčních a automatizačních technologií s NVIDIA Omniverse pro zlepšení provozní efektivity ve vývoji průmyslové automatizace.
  • Coca-Cola Consolidated: Využití monitorování v reálném čase, spolupráce a fyzikálně založené vizualizace poháněné Azure IoT, NVIDIA Omniverse cloud APIs, OpenUSD a řešeními Sight Machine.
  • Rockwell Automation: Využití Emulate3D, OpenUSD a Omniverse Cloud APIs pro simulace digitálních dvojčat továren.
  • BMW Group: Využití avatarů v Omniverse pro interaktivní pozorování a dotazování v montážních stanicích baterií.


Iniciativy v oblasti autonomního řízení

Společnost NVIDIA pokračuje ve svých iniciativách v oblasti autonomního řízení, přičemž na konferenci GTC 2025 oznámila:

  • Partnerství s General Motors (GM): Vývoj zakázkových AI systémů pro autonomní vozidla a integrace „AI do auta“ s využitím NVIDIA DRIVE AGX založené na architektuře Blackwell.
  • NVIDIA DRIVE AGX: Platforma využívaná většinou společností zabývajících se autonomním řízením.
  • NVIDIA Halos: Nový komplexní bezpečnostní systém pro autonomní vozidla.
  • Simulace a syntetická data: Využití Omniverse a Cosmos pro generování realistických jízdních prostředí pro trénování autonomních vozidel.
  • Rozšíření ekosystému: Spolupráce se společnostmi Magna, Lenovo, Volvo Cars, Gatik, Uber Freight, Plus, Foretellix, CARLA a Nuro v oblasti autonomního řízení.


Kvantové výpočty

Společnost během letošního ročníku GTC oznámila založení výzkumného centra NVIDIA Accelerated Quantum Computing Research Center (NVAQC) zaměřeného na bádání v oblasti kvantového hardwaru a algoritmů. NVAQC bude vybaven „superpočítačem“ s 576 GPU Blackwell, určeným pro rozsáhlé simulace kvantových algoritmů a hardwaru.

Vstup společnosti NVIDIA do výzkumu kvantového počítání signalizuje strategii zaměřenou na zkoumání a potenciální integraci kvantových technologií se stávajícími odbornými znalostmi společnosti v oblasti akcelerovaného počítání a AI. Přestože je kvantové počítání stále v rané fázi vývoje, společnost NVIDIA si uvědomuje jeho potenciál řešit složité problémy, které přesahují možnosti klasických počítačů, a zřízením výzkumného centra a spoluprací s akademickými institucemi, jako je MIT, se NVIDIA snaží etablovat jako lídr v tomto nově vznikajícím oboru.

Video : 

Podobné články

Celosvětové příjmy z prodeje polovodičů v roce 2024 vzrostly o 18 %

10. 2. 2025. (redaktor: František Doupal, zdroj: Gartner)
Podle společnosti Gartner dosáhly celosvětové tržby z prodeje polovodičů v roce 2024 celkem 626 miliard dolarů, což představuje meziroční nárůst o 18,1 %. V roce 2025 se předpokládají příjmy ve výši 705 miliard USD. Čtěte více

GIGABYTE uvádí na trh grafické karty GeForce RTX 5050

8. 7. 2025. (redaktor: František Doupal, zdroj: Gigabyte)
Společnost GIGABYTE uvedla na trh nové řady grafických karet GeForce RTX 5050. Mezi novinky se řadí modely GAMING OC, WINDFORCE OC a také nízkoprofilová varianta, která uživatelům nabízejí možnost osazení do různých typů sestav. Čtěte více

Novinky společnosti AMD: Mainstreamová grafika i hardware pro profesionály

26. 5. 2025. (redaktor: František Doupal, zdroj: AMD, www.tomshardware.com)
Společnost AMD představila nové grafické karty (Radeon AI PRO R9700) a procesory (Ryzen Threadripper řady 9000) pro výkonné počítače a pracovní stanice. Obě novinky jsou připraveny na nejnáročnější pracovní zátěže v oblasti vývoje softwaru, umělé inteligence a tvorby obsahu. Kromě toho AMD uvedlo na trh i cenově dostupnou grafiku Radeon RX 9060 XT pro spotřebitele. Čtěte více

ROG, Bethesda a id Software vytvořili grafiku ROG Astral GeForce RTX 5080 DOOM Edition

8. 5. 2025. (redaktor: František Doupal, zdroj: ASUS)
Značka ASUS Republic of Gamers (ROG) oznámila spolupráci se společnostmi Bethesda a id Software na očekávaném titulu DOOM: The Dark Ages. Spolupráce je součástí probíhajících oslav 30. výročí grafických karet ASUS a je poctou kultovní sérii PC her DOOM. Čtěte více