[庆祝]【KIMI K2.6发布】更强Agent能力,向长程复杂任务继续迈进 |中信计算机

[太阳]事件:北京时间4月20日晚间,Moonshoot AI发布KIMI K2.6模型。

[太阳]提升1【coding能力国内领先,国际一流】
K2.6 coding BenchMark表现优异(SWE-bench Pro 58.6%; SWE-bench Verified 80.2%; SWE-bench Multilingual 76.7%),相比K2.5分别+7.9/+3.4/+3.7 pcts,其中SWE-bench Pro超过GLM-5.1、Qwen-3.6 plus,后两项超过Qwen-3.6 plus。但相比Opus 4.6/4.7(Claude Opus 4.7上述三项分别64.3%/87.6%/80.5%)仍有差距。

[太阳]提升2【Agent Swarms智能体集群大幅升级】
工具调用BenchMark大幅提升(HLE-Full w/tools 54.0%; BrowseComp 83.2%; Terminal-Bench 66.7%),相比K2.5分别+3.8/+8.3/+15.9 pcts。

[太阳]提升3【视觉理解能力升级,从前端走向全栈】
K2.6 在通用多模态理解与图表、科研视觉问答两项BenchMark上均实现提升(MMMU-Pro 79.4%; CharXiv (RQ) 80.4%),相比K2.5分别+0.9/+2.9 pcts。在通过简单提示词生成带有丰富动画效果网页的基础上,

========================
[玫瑰]欢迎联系中信计算机团队⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。