🔥【DeepSeek-V4】迈向百万上下文,实现开源SOTA | 中信计算机

[礼物]【模型发布】
2026年4月24日,DeepSeek-V4 预览版本正式上线并同步开源,其拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。

[礼物]【模型版本】
1)DeepSeek-V4-Pro:总参数量1.6T,激活参数49B,预训练数据33T;
2)DeepSeek-V4-Flash:总参数量284B,激活参数13B,预训练数据32T;
上下文均为1M,开源并提供API服务,网页/APP版本访问方式为专家模式/快速模式;

[礼物]【模型性能:比肩顶级闭源模型】
1)Agent 能力大幅提高:在Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。
2)丰富的世界知识:DeepSeek-V4-Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。
3)世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

[礼物]【三大核心技术升级方向:混合注意力、mHC、Muon】
1)混合注意力:融合压缩稀疏注意力(CSA)与重度压缩注意力(HCA),大幅提升长上下文处理效率。
2)mHC(流形约束超连接):优化传统残差连接,强化模型特征传递与性能表现。
3)Muon优化器:加快模型训练收敛速度,同时提升训练过程的稳定性。

[礼物]【Agent 能力专项优化】
DeepSeek-V4 针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。

[礼物]【API定价】
DeepSeek-V4-Pro:1M上下文输入(缓存命中)/输入(缓存未命中)/输出价格分别1/12/24元;
DeepSeek-V4-Flash:1M上下文输入(缓存命中)/输入(缓存未命中)/输出价格分别0.2/1/2元;
***DeepSeek表示,受限于高端算力,目前Pro版吞吐十分有限,预计下半年昇腾950上市后Pro价格会大幅下调。

[礼物]【算力优化】
融合压缩稀疏注意力(CSA)与重度压缩注意力(HCA),在 token 维度进行压缩,结合 DSA 稀疏注意力,大幅提升长上下文处理效率,并且相比于传统方法大幅降低了对计算和显存的需求。如V4-Pro 的单 token 推理 FLOPs 仅为 V3.2 的 27%,V4-Flash 仅为 10%,大幅降低了超长上下文的推理延迟;V4-Pro 的 KV Cache 仅为前代 V3.2 的 10%,其中 CSA 贡献了核心的 4 倍基础压缩,与 HCA 的 128 倍压缩、量化优化形成叠加收益,让百万 token 上下文的 KV Cache 从 51GB 降至 5GB 以内。算力消耗的下降将使得百万token实时推理成为标配,推理需求爆发式增长下以超节点为代表的算力需求有望持续高增。

[红包]【观点总结】
DeepSeek-V4模型整体符合预期,其达到了比肩顶级闭源及开源SOTA水平。其开源了万亿参数规模模型,并全面支持百万上下文,模型能力尤其在Agent能力、世界知识、顶级推理方向显著提升,并继续加强对算力优化,中国模型携手走向世界。其对主流Agent产品做出优化,并加强与国产芯片适配,有望全面带动国产AI产业链生态繁荣。

1)算力及Infra:海光浪潮信息金山云深信服华丰科技富联网宿科技星环科技达梦数据海天瑞声等;

2)AI应用:金山办公金蝶国际税友股份合合信息聚水潭万兴科技阜博集团范式智能北森控股京东健康同花顺讯飞医、卓易信息等;

3)模型厂商:中国模型携手走向世界,智谱、MiniMax

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。