【国金计算机&科技】国产大模型持续迭代:模型能力升级与商业化加速形成共振
☀️【智谱发布GLM-5.1高速版,推理效率刷新行业纪录】
5月22日,智谱发布GLM-5.1 HighSpeed API,输出速度达到400 Tokens/s,在保持旗舰模型能力基础上实现极致低延迟。背后依托自研TileRT推理引擎,通过编译期静态优化、Persistent Kernel及KV Cache调度优化,大幅降低推理过程中的调度与通信开销。随着Coding Agent、实时交互及企业级Agent快速发展,推理速度正逐步成为影响用户体验及商业化落地的重要指标。
☀️【MiniMax发布M3,Coding/Agent与原生多模态能力全面升级】
6月1日,MiniMax发布新一代基础模型M3,采用456B参数MoE架构、45.9B激活参数,成为少数同时具备顶级Coding能力、100万Token上下文及原生多模态能力的开源模型。在SWE-Bench Verified、BrowseComp、MCP Atlas等核心评测中达到全球领先水平。通过自研MSA稀疏注意力架构,M3在100万Token上下文场景下实现Prefill提速9.7倍、Decoding提速15.6倍,在提升模型能力的同时显著降低Agent运行成本。
☀️【ARR高速增长,商业化进入加速期】
智谱3月ARR已达到2.5亿美元,此前目标年底ARR10亿美元,近期模型连续更新如适配龙虾的GLM-5-Turbo,GLM-5.1高速版,商业化进程有望大幅加速。
MiniMax 2月ARR已超过1.5亿美元,管理层表示4月ARR较2月增长超100%,预计M3及Hailuo 3发布后将进一步带动Coding、Agent及多模态需求增长,同时具备进一步提价及毛利率提升空间。
🌹我们认为国产大模型展现出极强的持续迭代能力和全球竞争力,正同时在模型能力、Agent、多模态、推理系统及商业化等多个维度持续突破,已从Benchmark竞争逐步演进为综合能力竞争,看好国产大模型商业化进展持续加速。
