中信互联网DeepSeek V4观点速评_20260424

【中信互联网】DeepSeek V4观点速评_20260424

[红包]

4/24 DeepSeek正式发布V4预览版并同步开源，分Pro（1.6T参数/激活49B）与Flash（284B/激活13B）两个版本，1M上下文全面标配，长上下文场景下推理FLOPs降至V3.2的27%、KV Cache压缩至10%，推理效率大幅跃升。Flash/Pro版本API分别定价输入约1/12元/MTok，输出2/24元/Mtok。此外V4实现与国产芯片（华为昇腾、寒武）day0适配。

[玫瑰]

）架构创新驱动Agent基础设施加速推广

训练侧，V4在万亿参数规模下同时解决了降本和维稳两大核心难题；推理侧，V4独创混合注意力架构，用极小的内存和算力跑通了百万级超长文本。此外V4随模型一起开源了底层算子库（MegaMoE）和高并发沙盒基础设施（DSec），开发者可以直接复用这套低成本基建。V4已针对Claude Code、OpenClaw等主流Agent产品做了专项适配，Agent侧的基础设施条件进一步成熟。

）头部厂商Agent竞争已形成差异化格局

据评测反馈，V4使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式，但仍与Opus 4.6思考模式存在一定差距。跑分来看， 5.1、Kimi K2.6等国内头部模型也仍有差距。各家模型厂商已形成相对稳定且明确的迭代方向和差异化能力定位，竞争格局趋于有序，不必过度担忧单一模型发布对格局的冲击。

）国产芯片适配，推理侧供给瓶颈有望逐步缓解

V4实现与寒武、华为昇腾适配，意味着国内AI推理侧需求或将逐步降低对N卡供给波动的依赖。伴随国产芯片产能ramp up，云厂商的供给扩容能力将逐步改善，推理侧供需关系有望迎来好转。

）云计算仍是确定性需求

开源模型能力水位线的持续抬升降低了AI应用的使用门槛，Agent侧架构创新（长上下文、推理分级、工具调用优化）加速落地场景拓展，二者共振驱动Token消耗持续爆发。同时模型侧迭代加速本身也利好云平台——模型越多、迭代越快，

[红包]）有明确商业化方向和差异化迭代能力的模型厂商；2）具备全栈云服务能力的头部云厂商；3）在模型普惠下加速AI赋能自身业务的垂类龙头。

[玫瑰]欢迎联系中信互联网团队廖原/徐航/丁晓月/王悦如/张苡铭

中信互联网DeepSeek V4观点速评_20260424

作者AI财经

作者 AI财经