华泰互联网传媒夏路路Jonos团队】腾讯混元3(Hy3 Preview)发布:差距收敛,但仍未跻身第一梯队

AI 基模与头部差距收敛,混元3本次迭代后,进步程度符合预期,泛C端的实用性上进步显著,同时Agent性价比较佳。我们测评显示仍落后于第一梯队。当前代际差距约 6个月,2H仍有望缩窄(微信生态和内部数据优势)。混元3采用 295B 中等参数量级,融合快慢双路径的设计,有效提升算力利用效率。

混元3的核心亮点:

1️⃣长上下文能力、图片与文档识别增强:我们测评发现,复杂纪要和长文本场景中,混元3能够较好识别隐含的项目细节与重点信息,亦能较好识别图片、excel中的信息,适配开会信息整理等场景

2️⃣代码与 Agent 能力提升:混元3的评测表现明显提升,但整体仍弱于 GLM-5 与 Kimi 2.5。我们的测试显示,混元3在WorkBuddy中的效果有一定改善,但其在工具调用过程中对错误的修复能力仍有不足。

3️⃣ C 端交互体验持续优化,对用户模糊意图的理解能力更强,回复风格亦更为生动

4️⃣主打高性价比,可承接高频、非复杂需求,32K 以下的输入输出价格为0.23、0.94 美元。对比MiniMax 2.7 为0.3、1.2 美元,GLM-5.1为 1.4、4.4 美元

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。