智谱GLM5.1提速不降智…

智谱GLM5.1提速不降智，推理工程优化提升模型竞争力【东吴传媒互联网张良卫团队】

事件：今日，智谱面向部分企业客户提供GLM-5.1高速版API”GLM-5.1-highspeed”。模型输出速度达到400 tokens/s，刷新当前全球大模型厂商API的速度上限。GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景，现已面向智谱MaaS平台部分企业客户开放服务。
——在过去，”快”往往意味着”小”，高速模型几乎总是轻量级模型。GLM-5.1高速版打破了这一行业惯例，首次在国产大模型中，将旗舰级能力与极致低延迟同时带入生产环境，无需再为响应速度牺牲模型质量。
——GLM-5.1高速版API”GLM-5.1-highspeed”由智谱GLM团队与TileRT团队联合打造，在推理引擎、调度系统与底层基础设施三个层面进行了系统级优化。

观点重申：
1、DeepSeek V4 Pro 的综合能力领先，并未撼动 GLM-5.1 在 Coding Agent 场景下的位置。Coding Agent 与单一模型的综合智商指标并非同一维度的竞争。前者考察的是长程多轮任务中的稳定性、工具调用的可靠性、错误回收的鲁棒性，依赖的是工程沉淀和数据飞轮，而不仅是底层模型能力的天花板。智谱自 GLM-4.5 起即将 Coding 锁定为核心方向，连续多代版本在该方向上专门优化，形成了较厚的工程护城河。Artificial Analysis 此次测评结果验证了这一判断。
2、智谱 GLM 自 5 系列发布以来已多次上调 API 价格，期间调用量不降反升，表明价格弹性较低；Anthropic 虽未调整面值价格，但通过收紧每周使用额度、调整 tokenizer 计数口径等方式，隐性抬升单位token定价。整个行业实际处于一轮隐性提价周期，DeepSeek 的阶段性折扣更接近单点事件，不代表模型环节系统性降价。Token 整体仍处于供不应求状态。
3、国内模型公司的 ARR 仍处于早期阶段。参照 Anthropic 的 ARR 增长曲线（23年底/24年底/25年底的ARR分别为 1/10/90 亿美元，26年5月初ARR超440亿美元），国内头部模型公司目前仍处于该曲线的起步段。非对称优势在于：海外头部模型短期内难以直接进入中国大陆市场，而国内模型则凭借性价比优势快速渗透海外市场。这意味着国内模型的市场空间，同时来自a)国内付费订阅渗透率提升+b)海外平价替代。

投资建议：我们看好智谱作为中国大模型代表性公司参与全球竞争的潜力，并认为其 Coding、Agent 与长周期任务能力将随模型迭代持续提升。后续关注：算力合作进展、模型进展、纳入恒科指数及港股通等。

风险提示：模型竞争加剧；算力供应不足；地缘政治风险。
资料来源：人民财讯，BlockBeats，Artificial Analysis
联系人：张良卫/周良玖/张文雨

智谱GLM5.1提速不降智…

作者AI财经

作者 AI财经