[庆祝]【KIMI K2.6发布】更强Agent能力,向长程复杂任务继续迈进 |中信计算机
[太阳]事件:北京时间4月20日晚间,Moonshoot AI发布KIMI K2.6模型。
[太阳]提升1【coding能力国内领先,国际一流】
K2.6 coding BenchMark表现优异(SWE-bench Pro 58.6%; SWE-bench Verified 80.2%; SWE-bench Multilingual 76.7%),相比K2.5分别+7.9/+3.4/+3.7 pcts,其中SWE-bench Pro超过GLM-5.1、Qwen-3.6 plus,后两项超过Qwen-3.6 plus。但相比Opus 4.6/4.7(Claude Opus 4.7上述三项分别64.3%/87.6%/80.5%)仍有差距。
[太阳]提升2【Agent Swarms智能体集群大幅升级】
工具调用BenchMark大幅提升(HLE-Full w/tools 54.0%; BrowseComp 83.2%; Terminal-Bench 66.7%),相比K2.5分别+3.8/+8.3/+15.9 pcts。
[太阳]提升3【视觉理解能力升级,从前端走向全栈】
K2.6 在通用多模态理解与图表、科研视觉问答两项BenchMark上均实现提升(MMMU-Pro 79.4%; CharXiv (RQ) 80.4%),相比K2.5分别+0.9/+2.9 pcts。在通过简单提示词生成带有丰富动画效果网页的基础上,
========================
[玫瑰]欢迎联系中信计算机团队
