智谱GLM5.1提速不降智,推理工程优化提升模型竞争力【东吴传媒互联网张良卫团队】
事件:今日,智谱面向部分企业客户提供GLM-5.1高速版API”GLM-5.1-highspeed”。模型输出速度达到400 tokens/s,刷新当前全球大模型厂商API的速度上限。GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景,现已面向智谱MaaS平台部分企业客户开放服务。
——在过去,”快”往往意味着”小”,高速模型几乎总是轻量级模型。GLM-5.1高速版打破了这一行业惯例,首次在国产大模型中,将旗舰级能力与极致低延迟同时带入生产环境,无需再为响应速度牺牲模型质量。
——GLM-5.1高速版API”GLM-5.1-highspeed”由智谱GLM团队与TileRT团队联合打造,在推理引擎、调度系统与底层基础设施三个层面进行了系统级优化。
观点重申:
1、DeepSeek V4 Pro 的综合能力领先,并未撼动 GLM-5.1 在 Coding Agent 场景下的位置。Coding Agent 与单一模型的综合智商指标并非同一维度的竞争。前者考察的是长程多轮任务中的稳定性、工具调用的可靠性、错误回收的鲁棒性,依赖的是工程沉淀和数据飞轮,而不仅是底层模型能力的天花板。智谱自 GLM-4.5 起即将 Coding 锁定为核心方向,连续多代版本在该方向上专门优化,形成了较厚的工程护城河。Artificial Analysis 此次测评结果验证了这一判断。
2、智谱 GLM 自 5 系列发布以来已多次上调 API 价格,期间调用量不降反升,表明价格弹性较低;Anthropic 虽未调整面值价格,但通过收紧每周使用额度、调整 tokenizer 计数口径等方式,隐性抬升单位token定价。整个行业实际处于一轮隐性提价周期,DeepSeek 的阶段性折扣更接近单点事件,不代表模型环节系统性降价。Token 整体仍处于供不应求状态。
3、国内模型公司的 ARR 仍处于早期阶段。 参照 Anthropic 的 ARR 增长曲线(23年底/24年底/25年底的ARR分别为 1/10/90 亿美元,26年5月初ARR超440亿美元),国内头部模型公司目前仍处于该曲线的起步段。非对称优势在于:海外头部模型短期内难以直接进入中国大陆市场,而国内模型则凭借性价比优势快速渗透海外市场。这意味着国内模型的市场空间,同时来自a)国内付费订阅渗透率提升+b)海外平价替代。
投资建议:我们看好智谱作为中国大模型代表性公司参与全球竞争的潜力,并认为其 Coding、Agent 与长周期任务能力将随模型迭代持续提升。后续关注:算力合作进展、模型进展、纳入恒科指数及港股通等。
风险提示:模型竞争加剧;算力供应不足;地缘政治风险。
资料来源:人民财讯,BlockBeats,Artificial Analysis
联系人:张良卫/周良玖/张文雨
