【财通计算机】DeepSeek发布DeepSeek-V4
1⃣ type=”web” href=”https%3A%2F%2Fapi-docs.deepseek.com%2Fquick_start%2Fpricing” title=”Models%20%26%20Pricing%20%7C%20DeepSeek%20API%20Docs” />
2⃣ Token场景下,V4-Pro单Token推理FLOPs仅为V3.2的27%、KV Cache仅为10%;核心在于CSA+HCA混合注意力架构推动Attention与KV Cache效率持续优化,百万上下文实际可用性明显增强。
3⃣ xHigh、Opus-4.6 Max等海外前沿模型的差距进一步收窄。
4⃣ Cache滑窗/压缩等架构优化与国产芯片协同推进,进一步释放Agent和Coding场景推理效率。昇腾950/A3超节点通过融合kernel、多流并行和量化优化提升吞吐、降低时延,国产卡在大模型推理部署中的工程化能力和供给价值正在加速凸显。
