【中信互联网】DeepSeek V4观点速评_20260424
[红包]
4/24 DeepSeek正式发布V4预览版并同步开源,分Pro(1.6T参数/激活49B)与Flash(284B/激活13B)两个版本,1M上下文全面标配,长上下文场景下推理FLOPs降至V3.2的27%、KV Cache压缩至10%,推理效率大幅跃升。Flash/Pro版本API分别定价输入约1/12元/MTok,输出2/24元/Mtok。此外V4实现与国产芯片(华为昇腾、寒武)day0适配。
[玫瑰]
)架构创新驱动Agent基础设施加速推广
训练侧,V4在万亿参数规模下同时解决了降本和维稳两大核心难题;推理侧,V4独创混合注意力架构,用极小的内存和算力跑通了百万级超长文本。此外V4随模型一起开源了底层算子库(MegaMoE)和高并发沙盒基础设施(DSec),开发者可以直接复用这套低成本基建。V4已针对Claude Code、OpenClaw等主流Agent产品做了专项适配,Agent侧的基础设施条件进一步成熟。
)头部厂商Agent竞争已形成差异化格局
据评测反馈,V4使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。跑分来看, 5.1、Kimi K2.6等国内头部模型也仍有差距。各家模型厂商已形成相对稳定且明确的迭代方向和差异化能力定位,竞争格局趋于有序,不必过度担忧单一模型发布对格局的冲击。
)国产芯片适配,推理侧供给瓶颈有望逐步缓解
V4实现与寒武、华为昇腾适配,意味着国内AI推理侧需求或将逐步降低对N卡供给波动的依赖。伴随国产芯片产能ramp up,云厂商的供给扩容能力将逐步改善,推理侧供需关系有望迎来好转。
)云计算仍是确定性需求
开源模型能力水位线的持续抬升降低了AI应用的使用门槛,Agent侧架构创新(长上下文、推理分级、工具调用优化)加速落地场景拓展,二者共振驱动Token消耗持续爆发。同时模型侧迭代加速本身也利好云平台——模型越多、迭代越快,
[红包])有明确商业化方向和差异化迭代能力的模型厂商;2)具备全栈云服务能力的头部云厂商;3)在模型普惠下加速AI赋能自身业务的垂类龙头。
[玫瑰]欢迎联系中信互联网团队 廖原/徐航/丁晓月/王悦如/张苡铭
