GTC Taipei Keynote速览:全栈芯片机柜组合、CPU、PC是核心看点0601
(国泰海通通通信)
全栈AI基础设施芯片能力。大会展示了VeraRubinCompute Tray, Switch Tray, CPU Tray、 Spx-6CPO switch tray, Groq 3 LPX Tray, BF4 STXStorage Tray等机柜产品,并且表示Vera Rubin已经处于full production状态。
Vera Rubin NVL72: 10x Lower Cost per TokenVera CPU: 1.8x the agentic sandbox performanceof x86 CPUs;
Groq 3 LPX: 35x higher throughput at low latency
with vera rubin NVL72;
Vera BF-4 STX: 5x higher tokens per second;
Spectrum-X 6 SPX Ethernet: 1.6x higher Alnetwork performance;视频提及TSMC、Foxconn、Lumentum、SPIL、TFC等供应商;
Vera CPU:AI时代的CPU。CPU原来是为人类做的,现在为Agent而生。CPU在rubin用在三个地方,一个是verarubin computetrav 有2个CPU.用来组织和管理GPU,kvcache,处理软件和运行;一个是在BF-4有2个进行应用,快速的连接存储;还有一个是CPU Tray。Agent四代,CPU成为GPU利用率的瓶颈,需要在效能和带宽间取得平衡。
Vera CPU: 88 Olympus Core, PCle Gen 6CSL3.1; 164MB L3 Cache; 3.4TB/s Core-to-CoreBisection Bandwidth; 1.5TB LPDDR5X Memory;NVLink-C2C 1.8TB/s Coherent CPU0CPU和CPU-GPU连接界面;
口
早期使用者为OpenAI,Anthropic,SpaceX
重新发明电脑。Nvidia和微软一起重新发明电脑,主要发布了并采用了RTXSpark,包含Blackwell RTXGPU芯片,采用了3nm工艺,700亿个电晶体;同时与MTK定义的20核Grace CPU;128GB统一内存,600GBNvlinkC2C连接,然后可以支持英伟达全栈工具: CUDA, Tensor RT, NVFP4, Ray Tracing,DLSS等;与Dell、微软、联想等电脑厂商一起合作笔记本,以及工作站等。
包括Chip Design Super Agent (与Cadence等合作);发布Nemotron 3Ultra模型(550B);COSMOs模型继续推介来满足AI数据不足的要求;机器人方面发布了Isaac GROOT Reference HumanoidRobot板载计算和全栈GR00T软件套装,包括与Unitree合作身体控制,和GR00T1.7模型等。
