:我们的看法(0425)@华泰计算机

这两天仔细研读了DeepSeek-V4的论文,还是惊叹于其算法和infra创新,让人甚至忘了同一天GPT-5.5也发布了。做了详细的笔记, 。

1)模型能力:通用知识仅落后Gemini-3.1-Pro等海外头部模型,推理能力开源领先/匹敌闭源,代码Agent与 K2.6 和 GLM-5.1 相当(说明Coding确实有数据飞轮,这波小龙虾DeepSeek没怎么赶上)。DeepSeek官方承认, 。

2)创新:最核心的bet是 ,实现的主要方法依然是国内擅长的 。其实海外闭源御三家都实现了1M,国内做的相对比较少,可能还是出于成本考虑。这次DeepSeek把长上下文的成本也打下来了,V4以2x以上国内其他模型的参数,实现了基本持平的价格。

3)产业影响: ,后续只会加强。存算方面,确实 ,但是我们依然坚持杰文斯悖论, 。而且周五的美股大家也看到, ,CPU、光、存储、NV依然强劲。对于国内的 来说,周五跌幅较大,但是我们认为大模型渗透到各行各业的趋势并没改变, ,都有很大进步空间。

4)模型未来:这次DeepSeek没有出多模态,其实有点低于预期,但是论文中提了, 。年初讨论比较多的以存代算Engram算法这次也没实现,不过论文也提了,未来 。另外随着长文本的实现, 、长任务/多轮次Agent也在加强中。方向很明确了。

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。