国金计算机&科技国产大模型持续迭代…

【国金计算机&科技】国产大模型持续迭代：模型能力升级与商业化加速形成共振

☀️【智谱发布GLM-5.1高速版，推理效率刷新行业纪录】
5月22日，智谱发布GLM-5.1 HighSpeed API，输出速度达到400 Tokens/s，在保持旗舰模型能力基础上实现极致低延迟。背后依托自研TileRT推理引擎，通过编译期静态优化、Persistent Kernel及KV Cache调度优化，大幅降低推理过程中的调度与通信开销。随着Coding Agent、实时交互及企业级Agent快速发展，推理速度正逐步成为影响用户体验及商业化落地的重要指标。

☀️【MiniMax发布M3，Coding/Agent与原生多模态能力全面升级】
6月1日，MiniMax发布新一代基础模型M3，采用456B参数MoE架构、45.9B激活参数，成为少数同时具备顶级Coding能力、100万Token上下文及原生多模态能力的开源模型。在SWE-Bench Verified、BrowseComp、MCP Atlas等核心评测中达到全球领先水平。通过自研MSA稀疏注意力架构，M3在100万Token上下文场景下实现Prefill提速9.7倍、Decoding提速15.6倍，在提升模型能力的同时显著降低Agent运行成本。

☀️【ARR高速增长，商业化进入加速期】
智谱3月ARR已达到2.5亿美元，此前目标年底ARR10亿美元，近期模型连续更新如适配龙虾的GLM-5-Turbo，GLM-5.1高速版，商业化进程有望大幅加速。
MiniMax 2月ARR已超过1.5亿美元，管理层表示4月ARR较2月增长超100%，预计M3及Hailuo 3发布后将进一步带动Coding、Agent及多模态需求增长，同时具备进一步提价及毛利率提升空间。

🌹我们认为国产大模型展现出极强的持续迭代能力和全球竞争力，正同时在模型能力、Agent、多模态、推理系统及商业化等多个维度持续突破，已从Benchmark竞争逐步演进为综合能力竞争，看好国产大模型商业化进展持续加速。

国金计算机&科技国产大模型持续迭代…

作者AI财经

作者 AI财经