🔥Claude 4.7发布,重回榜首,且token又通胀了(0417)@华泰计算机

🌟Claude 4.7提升点集中,长链路 coding、多步 agent、视觉理解、指令遵循、复杂任务执行。4.7 更换了 tokenizer,同样一段输入,

🌟和Mythos的关系,算是其“缩水版。Opus 4.7 是当前广泛可用的最强版本,相比最强的Mythos模型,在 cyber 能力上做了定向收缩,加了新的护栏。

🌟为什么4.7有些分数比 4.6 还低?4.7 这次优化的重点放在 长流程完成率、工具纪律、稳定性,有些 benchmark 不会整齐上涨。此外,有些评测本身有噪音,例如这次分数降低的BrowseComp测评,Anthropic 曾说过 BrowseComp 的污染问题,公开网页泄漏答案会扭曲结果。所以略有分数波动属于正常。

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。