MiniMax深度…

MiniMax深度：M3开源领跑，MSA重构长上下文性价比

海外模型技术路线与ARR：大模型技术路线收敛，竞争从”找路径”转向”卷效率”。主流基座模型逐步收敛至Decoder-Only+MoE架构，后续核心在中后训练、推理侧优化、长上下文、Agent和工具调用能力。海外大模型商业化加速跑通，OpenAI2026年3月ARR超过250亿美元，Anthropic2026年5月达到450亿美元级别ARR，B端/API/编程工具成为核心驱动。

M3发布与模型定位：MiniMax6月发布并开源M3，定位面向Agent推理、工具调用、Coding、原生多模态输入与1M长上下文任务。我们认为，M3的重点不是单纯堆参数，而是在长上下文、Agent和Coding场景中，用”小MoE+MSA”路线提升性价比、响应效率和部署友好度。

报告亮点MSA架构：MSA是建立在GQA上的分块稀疏注意力机制，本质是在百万级上下文中先找准、再高效算。其IndexBranch先对KVblock打分并选取top-k，MainBranch只在命中的block上做标准注意力。相比固定滑窗/全局token等稀疏方式，MSA对内容相关性更敏感；相比DSA（DeepSeek）偏选哪些token/KV、MoBA（Kimi）偏选哪些块，MSA更强调怎么精细分块、怎么连续读块、怎么让GPU高效计”。因此其差异化不只是算法稀疏，而是把稀疏注意力进一步做到算子与访存效率层面。

性价比与真实用量：M3具备部署简单、可跨GPU部署、已有模型训练可迁移等特点，对B端客户和开发者生态更友好。OpenRouter上，M3在100K-1M上下文区间Token消耗量上线后持续排名第一，全球总量和编程领域表现也位居前列，说明其长上下文和Coding能力已在真实调用中得到验证。

投资建议：首次覆盖给予”买入”评级，目标市值2152亿元人民币。预计2026-2028E收入4.50/10.55/21.10亿美元，同比增长469%/135%/100%。后续催化重点关注M3大参数版本上线，以及Hailuo等多模态模型迭代带来的ARR增长。

深度报告及近期跟踪欢迎联系：互联网传媒团队

作者AI财经

作者 AI财经