5封禁/GLM-5.2发布点评-0614
❶本周六美国商务部要求暂停对所有外国公民提供Fable/Mythos的访问,原因是美国政府认为已发现一种绕过或”越狱” Fable 5 安全护栏的方法,Anthropic对政府提供的越狱证据表示其缺乏通用性,且这类已知的小型 jailbreak/ 漏洞在其他公开大模型中也存在,不足以过度反应到以国家安全为由进行出口管制。目前事态还在发展中。
❷ 据此前开发者反馈,Fable 5在多模态理解、前端开发、3D可视化/仿真,超长程任务、one-shot完整应用上的表现SOTA。尤其是从给定网页、APP、游戏Demo进行逆向还原的能力显著提升,Opus 4.7/4.8被诟病的长任务偷懒/Tool-use翻车的问题在Fable 5上也得到大幅改善。但极强昂贵的使用成本、远高于5%的模型降级触发率被用户诟病较多,对业余开发者性能溢出的反馈也较为普遍。总体符合我们初见的判断,Anthropic更多将重心放在了高价值、长周期的复杂任务上。Fable 5是现有能力的纵深,而非范式上的创新。利好企业安全相关IT预算投入,对ARR直接拉动有限。
❸GPT-5.6有望于近期发布,OpenAI正考虑通过降低API价格应对与Anthropic的竞争(利好应用落地);此外Gemini 3.5 Pro也计划于6月发布,届时北美御三家的竞争将会加剧。但Fable 5的下架风波可能会对上述发布时间带来扰动。
❹ 智谱本周末发布GLM-5.2,代码能力在推理模式max下可接近Opus 4.8推理模式high(默认中档)的水平,Token消耗甚至比Opus 4.8更低(toyamanao评测);上下文从200k提升到1M,与海外SOTA齐平;长程任务的不懒惰性较5.1提升显著;对Claude Code Harness的适配度佳;实测在Claude Code代码反压缩、广域调研、Python后端服务重写为Rust任务下表现接近Opus 4.8,领先一众国产大模型。API和聊天机器人服务将于下周上线。该模型也将于下周在 MIT 许可下正式开源。
❺目前GLM-5.2在国产大模型中领先了一个身位,Fable引发的北美监管”红旗”又强行缩小了国模与北美SOTA的差距。当前智谱与北美所提供的模型能力差距已经缩小到了3个月以内,这可能是自25年初的DeepSeek R1时刻后中美顶尖模型能力差距最接近的一次。我们认为资本市场还尚未充分认知到GLM-5.2的重要性,并且伴随下半年算力供给的增加,智谱在ARR上的表现有望继续超预期。
❻国产模型将占据更多Token增量空间。一方面,GLM-5.1已经抢占了部分Opus 4.7和4.8在负优化质疑、高成本背景下的增量空间。另一方面,Fable 5的合规封禁叙事背景下将给GLM更多收入和份额空间。虽然Qwen 3.7 max综合表现不弱于GLM 5.2,但智谱计划开放权重并采用 MIT 许可证、进一步降低了企业级部署门槛,将在成本、性能和生态上的优势将进一步释放国产模型和算力的红利空间,保证开源模型的三方部署也能有较好的缓存命中率表现。
DJN
