🔍Evercore ISI

作者AI财经

2026年5月19日 21:01

🔍Evercore ISI
📌2026 年第一季度 AI 渠道调研:GPU 与 ASIC

🌐 我们询问了 50 多位 AI 工程师以及与 AI 基础设施领域各公司合作的专家,探讨了 AI 基础设施的竞争格局。
💡 主要主题包括:1)AI 工作负载正在从训练主导转向推理主导(到 2026 年底);2)对每代币成本、投资回报率和总拥有成本的关注日益增加,这正在加速超大规模企业对自研 ASIC 和其他加速器的投入;3)英伟达拥有广泛的生态系统护城河,但其市场份额在超大规模企业 / 前沿实验室层面正受到考验;4)推理场景下异构计算环境的可能性似乎越来越大;5)随着小型语言模型的改进,”边缘推理” 的兴趣日益浓厚。
📊 推理成为主流:渠道调研显示,从训练繁重的 2025 年转向推理占主导的 2026 年,多位受访者预计到 2026 年底,推理需求将占到 50% 至 60%,且随着时间推移还会大幅增长。(参见《查找图书 文艺复兴演进》)
📉 ROI 压力挤压 XPU 利润率:推理工作负载将购买标准从 “最大吞吐量 / 带宽” 转向 “每代币成本、功耗、散热、利用率”。
⚠️ 英伟达声称的 35 倍性能提升并未引起共鸣,超大规模企业认为英伟达的 GPU 价格过高,愿意使用 ASIC 或 “足够好” 的替代方案来提高经济效益。
📈 英伟达训练份额依然高企,推理份额到 2028 年降至 50%:专家预计英伟达在训练领域将保持领先(长期份额 > 70%),但推理份额预计到 2028 年将降至 50%,因为 AMD、TPU、Trainium、Maia、SRAM 芯片都在改进。
✅ Vera Rubin 进展顺利 – B300 交货周期延长:调研显示,没有严重的供应链问题,超大规模企业在第二季度收到机架,企业级 ODM/Neocloud 在第三季度收到。
📉 Blackwell 的需求 vs 初期预期较低,对 Rubin 的兴趣更大。
⏳ B300 的交货周期从上季度的 12 周延长至 16 周。
🤖 代理驱动解码特定芯片:调研显示,解码可能需要与传统 GPU/HBM 中心化架构不同的硅架构(例如英伟达、Groq LPU、Cerebras)。

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。