DeepSeek-V4 ：我们的看法（0425）@华泰计算机

：我们的看法（0425）@华泰计算机

这两天仔细研读了DeepSeek-V4的论文，还是惊叹于其算法和infra 创新，让人甚至忘了同一天GPT-5.5也发布了。做了详细的笔记，。

1）模型能力：通用知识仅落后Gemini-3.1-Pro等海外头部模型，推理能力开源领先/匹敌闭源，代码Agent与 K2.6 和 GLM-5.1 相当（说明Coding确实有数据飞轮，这波小龙虾DeepSeek没怎么赶上）。DeepSeek官方承认，。

2）创新：最核心的bet是，实现的主要方法依然是国内擅长的。其实海外闭源御三家都实现了1M，国内做的相对比较少，可能还是出于成本考虑。这次DeepSeek把长上下文的成本也打下来了，V4以2x以上国内其他模型的参数，实现了基本持平的价格。

3）产业影响：，后续只会加强。存算方面，确实，但是我们依然坚持杰文斯悖论，。而且周五的美股大家也看到，，CPU、光、存储、NV依然强劲。对于国内的来说，周五跌幅较大，但是我们认为大模型渗透到各行各业的趋势并没改变，，都有很大进步空间。

4）模型未来：这次DeepSeek没有出多模态，其实有点低于预期，但是论文中提了，。年初讨论比较多的以存代算Engram算法这次也没实现，不过论文也提了，未来。另外随着长文本的实现，、长任务/多轮次Agent也在加强中。方向很明确了。