📋 全文总结 本次国产AI芯片产业近况更新会议,由资深行业专家围绕互联网大厂(字节、阿里、腾讯、百度)的AI芯片采购格局、数据中心建设瓶颈、推理架构优化(PD分离)、Token消耗结构、AI云涨价趋势、超节点技术壁垒、自研芯片策略及国产芯片与英伟达的性能差距等核心议题进行了全面深入的分享。核心要点如下:


  • 大厂AI芯片存量与选型策略分化明显:字节AI芯片存量达百万级(训练卡约20万,推理卡约80万),阿里约70万(训练10-12万,推理约60万),腾讯约50万,百度约35万。各家选型各有侧重——字节以寒武为主、升腾为辅;阿里大力押注自研芯片(目标三年内自研占比超50%);腾讯和百度则更多依赖第三方国产芯片。
  • 数据中心建设四大瓶颈排序:①电力供给(高密度机柜需求激增,液冷成为必需);②网络带宽(英伟达NVLink已达数TB级别,国产仅数百G,影响千卡集群性能);③机房液冷改造(传统机架改造为高密度液冷方案成本较高);④芯片本身(HBM显存短缺、先进制程产能被AI芯片挤占,以及软件适配算子库的漫长周期)。
  • PD分离与推理架构优化成为大厂竞争焦点:阿里通过自研芯片和超节点、For KV动态配比技术将调度延迟从十几秒压缩至1秒以内;腾讯采用TP与EP结合极致的工程优化,以64张H20跑出15800 token/秒;字节通过MOE稀疏架构与专家并行提升效率。各家核心目标一致:提升每秒Token产出、压缩推理链路延迟。
  • Token消耗结构揭示AI应用正在深化:Agent工作流占比最高(40%-45%),其次是企业级API/MaaS(20%-25%)、多模态应用(15%-18%)、对话搜索(12%-15%)。复杂Agent任务(数百至上千步调度)占比将持续提升,进一步拉动Token消耗。预计至2026年底,头部大厂日均Token消耗合计将接近千万亿级别。
  • AI云进入涨价周期:自2026年Q1起,大厂迫于供不应求压力陆续提价——弹性计算涨价5%-8%,存储类数据库涨价30%,自研芯片涨价30%。涨价逻辑核心是算力有限、需求旺盛,头部客户因AI服务迁移成本高被锁定,腰部客户选择性涨价,长尾客户自然淘汰。
  • 超节点壁垒高、市场有限:超节点高密度计算设备主要服务于汽车仿真训练、互联网大模型训练等特定场景,仅占数据中心10%-15%的部署比例。真正能稳定对外供货的仅有华为和阿里,其他厂商仍需时间打磨。核心壁垒在于:长期运行稳定性、并行计算效率、底层工具链成熟度及万卡扩展能力。
  • 国产芯片与英伟达的差距及追赶节奏:当前多数国产芯片定位推理场景,训练场景仅有华为升腾950和阿里M890具备初步能力。差距核心在于算子库覆盖率——华为约70%,预计2026年Q4可提升至90%。阿里自研芯片预计还需2-3个季度才能实现万卡级训练替代。其他国产芯片(寒武海光壁仞等)仍以推理为主。
  • 芯片初创公司进入大厂供应链需9个月以上严苛验证:三个阶段——64卡硬件基础测试(约3个月)→128卡模型推理稳定性验证(约3个月)→千卡级大规模并发稳定性测试(约3个月)。通过后进入供应商名单,逐步从小批量向公有云规模化供货过渡。

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。