🔥【DeepSeek-V4迈向百万上下文，实现开源SOTA

🔥【DeepSeek-V4】迈向百万上下文，实现开源SOTA | 中信计算机

[礼物]【模型发布】
2026年4月24日，DeepSeek-V4 预览版本正式上线并同步开源，其拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。

[礼物]【模型版本】
1）DeepSeek-V4-Pro：总参数量1.6T，激活参数49B，预训练数据33T；
2）DeepSeek-V4-Flash：总参数量284B，激活参数13B，预训练数据32T；
上下文均为1M，开源并提供API服务，网页/APP版本访问方式为专家模式/快速模式；

[礼物]【模型性能：比肩顶级闭源模型】
1）Agent 能力大幅提高：在Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平，据评测反馈使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式，但仍与 Opus 4.6 思考模式存在一定差距。
2）丰富的世界知识：DeepSeek-V4-Pro 在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。
3）世界顶级推理性能：在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。

[礼物]【三大核心技术升级方向：混合注意力、mHC、Muon】
1）混合注意力：融合压缩稀疏注意力（CSA）与重度压缩注意力（HCA），大幅提升长上下文处理效率。
2）mHC（流形约束超连接）：优化传统残差连接，强化模型特征传递与性能表现。
3）Muon优化器：加快模型训练收敛速度，同时提升训练过程的稳定性。

[礼物]【Agent 能力专项优化】
DeepSeek-V4 针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化，在代码任务、文档生成任务等方面表现均有提升。

[礼物]【API定价】
DeepSeek-V4-Pro：1M上下文输入（缓存命中）/输入（缓存未命中）/输出价格分别1/12/24元；
DeepSeek-V4-Flash：1M上下文输入（缓存命中）/输入（缓存未命中）/输出价格分别0.2/1/2元；
***DeepSeek表示，受限于高端算力，目前Pro版吞吐十分有限，预计下半年昇腾950上市后Pro价格会大幅下调。

[礼物]【算力优化】
融合压缩稀疏注意力（CSA）与重度压缩注意力（HCA），在 token 维度进行压缩，结合 DSA 稀疏注意力，大幅提升长上下文处理效率，并且相比于传统方法大幅降低了对计算和显存的需求。如V4-Pro 的单 token 推理 FLOPs 仅为 V3.2 的 27%，V4-Flash 仅为 10%，大幅降低了超长上下文的推理延迟；V4-Pro 的 KV Cache 仅为前代 V3.2 的 10%，其中 CSA 贡献了核心的 4 倍基础压缩，与 HCA 的 128 倍压缩、量化优化形成叠加收益，让百万 token 上下文的 KV Cache 从 51GB 降至 5GB 以内。算力消耗的下降将使得百万token实时推理成为标配，推理需求爆发式增长下以超节点为代表的算力需求有望持续高增。

[红包]【观点总结】
DeepSeek-V4模型整体符合预期，其达到了比肩顶级闭源及开源SOTA水平。其开源了万亿参数规模模型，并全面支持百万上下文，模型能力尤其在Agent能力、世界知识、顶级推理方向显著提升，并继续加强对算力优化，中国模型携手走向世界。其对主流Agent产品做出优化，并加强与国产芯片适配，有望全面带动国产AI产业链生态繁荣。

1）算力及Infra：海光、浪潮信息、金山云、深信服、华丰科技、富联、网宿科技、星环科技、达梦数据、海天瑞声等；

2）AI应用：金山办公、金蝶国际、税友股份、合合信息、聚水潭、万兴科技、阜博集团、范式智能、北森控股、京东健康、同花顺、讯飞医、卓易信息等；

3）模型厂商：中国模型携手走向世界，智谱、MiniMax

🔥【DeepSeek-V4迈向百万上下文，实现开源SOTA | 中信证券计算机

作者AI财经

作者 AI财经