【国联民生计算机火线速递】KIMI K2.6发布:行业领先的代码、长程任务执行和 Agent 集群能力

[]Ki K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升,其中在博士级难度的完整版人类最后的考试(Humanity’s Last Exam)、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩,持平或优于 GPT-5.4、Claude Opus 4.6 和 Geni 3.1 Pro等闭源模型。

[]Ki K2.6 是我们迄今最强的代码模型,其长程编码能力也得到显著提升,在测试中可以不间断编码 13 小时,编写或修改超过 4000 行代码,完成复杂系统的开发和优化。通过将代码与视觉能力的深度融合,K2.6 将代码驱动的设计能力提升到了新高度,可以交付极具设计创意的专业级 Web 应用。

[]Ki K2.6 大幅增强了 Agent 自主化执行能力,帮助我们进一步扩展 Agent 的能力范围:由 K2.6 模型驱动的「Agent 集群」架构迎来一次大升级,现在支持 300 个子 Agent 完成 4000 个协作步骤,实现更大规模的化,同时任务完成度和交付质量相比于 K2.5 有显著提升;针对 OpenClaw、Hermes Agent 等主动式 Agent 框架,K2.6 展现出极强的自动化任务处理能力,支持长达 5 天的持续自主运行。

免责声明:基于公开资料整理,可能存在信息滞后或更新不及时,任何情况下不构成投资建议

联系人:国联民生计算机吕伟/白青瑞

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。