📋 全文总结 本次汇报围绕“Agentic AI时代异构计算架构的崛起”这一主题展开,核心观点是: AI正从以LLM和GPU主导的第一阶段(2023-2025年)过渡到以Agentic AI驱动、异构架构为特征的第二阶段(2026年起),不同种类的芯片将在特定应用场景中发挥各自优势,而英伟达通过前瞻性收


  • 自2023年起,AI驱动的第五次工业革命开启,将前四次工业革命的成果(能源、数据、芯片、互联、内存等)浓缩于一体。
  • 黄仁勋提出的“AI五层蛋糕”概念:底层为能源与芯片基础设施(GPU、CPU、内存、互联、液冷等),中层为模型训练,上层输出Token(推理结果)。Token本身已成为有收入的产出,而非无回报的投入。
  • 2023-2025年(第一阶段): 以LLM和GPU为主导,强调高吞吐量的训练,GPU被视为“one size fits all”的AI芯片,主要依赖英伟达的三大壁垒:高性价比算力、NVLink互联生态、CUDA软件生态。
  • 2026年起(第二阶段): Agentic AI商业化元年到来,硬件需求从单一转向多元。黄仁勋在CES(6种芯片)和GTC(7种芯片)上展示了英伟达异构平台战略,标志着异构计算架构的崛起。每类芯片具备最佳适配的应用负载。
  • GPU: 仍为高吞吐量训练与推理的最佳选择。
  • CPU(GPU + CPU协同): Agentic AI需要更多串行计算与任务统筹,CPU因此迎来“文艺复兴”。英伟达推出Vera CPU,可独立部署或与内存、网络安全等工作协同。
  • GQ(LPU): 英伟达于2025年12月收购GQ公司,推出针对极低延迟推理的GQ LPU芯片,专为Agentic AI的decode环节设计。其核心优势有二:① SRAM内存(片上内存,速度远快于HBM),每颗芯片集成500MB,256颗并联共128GB;② 编译器主导的确定性时延,数据从A到B的时间精确可控,进一步加速推理。
  • Google对标方案: 推出第八代TPU(分为训练与推理专用版本)、Arm架构CPU(对标Vera CPU)、以及与Marvell合作的MPU(Memory PU,对标GQ LPU)。Google拥有涵盖云、芯片、软件、模型、应用的“全栈王国”优势。
  • Arm架构: 英伟达(Vera CPU)和Google(Axion CPU)均采用Arm架构,低功耗优势突出。
  • x86架构: 英特尔与AMD紧随。英特尔制程已追赶至18A(相当于2nm,含RibbonFET与PowerVia技术),有望承接台积电外溢的先进封装与晶圆代工需求。英伟达与Google均已参股或合作英特尔,x86 CPU在AI时代有望重新获得席位。
  • 科技巨头的资本开支仍在持续攀升,硬件投资未见停歇。
  • Agentic AI推动芯片种类百花齐放,英伟达的异构平台战略不仅旨在延续第一阶段GPU的主导地位,更力求在第二阶段定义并主导整个AI计算生态。
  • GPU: 仍为高吞吐量训练和推理的最佳选择。
  • CPU: 迎来“文艺复兴”。Agent越多,需要统筹的事情越多,CPU在串行计算和任务统筹方面重新占据重要席位。英伟达推出Vera CPU,可独立部署,也可与内存、网络安全等工作协同。
  • 互联芯片: NVLink、ConnectX、Spectrum等,都是围绕数据中心互联,缩短数据在芯片之间的传输时间,提升算力。
  • GQ LPU: 专门针对Agentic AI的极低延迟推理。Agentic AI今年才是商业化元年,英伟达已非常前瞻性地布局了这一时代。

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。