OpenAI发布GPT-5.6 Sol
☀️多维度基准测试对比,GPT-5.6 Sol与Anthropic Mythos系列模型互有胜负,现有评测基准中二者整体表现大致持平。医疗专业、漏洞挖掘专项场景Mythos优势突出,终端运维、网络攻防基准GPT-5.6 Sol小幅领先;同时GPT-5.6 Sol推理开销更优,ExploitBench测试仅需120k输出token达成73.5%得分,对比Mythos Preview所需335k token文本效率显著更高。
☀️专用推理硬件配套落地提速,OpenAI官宣将于7月在Cerebras算力硬件上部署GPT-5.6 Sol,硬件推理吞吐速度可达每秒750个token,服务初期定向面向特定企业客户开放,高吞吐专用硬件可大幅优化长文本、批量推理类业务的运行效率。
