[庆祝]【智谱GLM-5.2】开源并发布技术blog,代码能力全球前三
☀️事件:北京时间6月17日,智谱旗舰模型GLM-5.2正式开源并发布技术blog,Coding BenchMark全球前三,开源模型第一。
☀️模型能力
【提升1:编程主流测试集得分全球前三】
GLM-5.2在标准代码Benchmark上较GLM-5.1大幅提升(Terminal-Bench 2.1 81.0 vs. 63.5;SWE-bench Pro 62.1 vs. 58.4)。GLM-5.2在Terminal-Bench 2.1上已接近Opus 4.8的85.0和GPT-5.5的84.0;在SWE-bench Pro上仍低于Opus 4.8的69.2,高于GPT-5.5 (58.6)和Gemini 3.1 Pro (54.2);Arena.ai前端网页编程得分1595仅落后于Fable 5 (1654)。各项编程主流测试集得分全球前三,开源模型第一。
【提升2:架构优化为百万上下文筑基】
GLM-5.2为支撑百万上下文引入索引共享(IndexShare),在稀疏注意力中让每4层Transformer共享一个轻量索引器,减少其中3层的索引点积和topk选择计算;官方称在100万上下文长度下,索引共享可将单token浮点计算量降低2.9倍。同时,GLM-5.2改进多token预测(MTP),将MTP接受长度从4.56提升到5.47,提升约20%。架构升级显著降低模型计算开销并优化长程Agent任务吞吐。
【提升3:百万无损上下文支持长程任务】
在FrontierSWE、PostTrainBench、SWE-Marathon等长程工程Benchmark中,GLM-5.2得分74.4/34.3/13.0,仅落后于Claude Opus系列前沿模型。新架构减少了每个token的计算浮点运算量,但并未按比例降低每个token的KV缓存大小,使百万无损上下文能更稳定支持长程任务。
【其他亮点:引入思考档位机制】
GLM-5.2还引入了effort level(思考档位)控制,用户可自行在能力、速度、成本之间做出平衡。在相近的token预算下,GLM-5.2的Coding能力大致位于Opus 4.7与Opus 4.8之间。
☀️国产芯片适配
据公司官方微信公众号,GLM-5.2的线上推理依托多个国产算力平台,已在Day 0完成与华为昇腾、平头哥、摩尔线程、寒武、昆仑芯、沐曦、海光、壁仞等国产算力平台的推理适配,在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。公司预计下半年昇腾 950 超节点上市后,也将成为GLM-5.2强劲的算力底座。
========================
🌹欢迎联系中信计算机团队
