MiniMax深度…

作者AI财经

2026年6月30日 08:52

MiniMax深度:M3开源领跑,MSA重构长上下文性价比

海外模型技术路线与ARR:大模型技术路线收敛,竞争从”找路径”转向”卷效率”。主流基座模型逐步收敛至Decoder-Only+MoE架构,后续核心在中后训练、推理侧优化、长上下文、Agent和工具调用能力。海外大模型商业化加速跑通,OpenAI2026年3月ARR超过250亿美元,Anthropic2026年5月达到450亿美元级别ARR,B端/API/编程工具成为核心驱动。

M3发布与模型定位:MiniMax6月发布并开源M3,定位面向Agent推理、工具调用、Coding、原生多模态输入与1M长上下文任务。我们认为,M3的重点不是单纯堆参数,而是在长上下文、Agent和Coding场景中,用”小MoE+MSA”路线提升性价比、响应效率和部署友好度。

报告亮点MSA架构:MSA是建立在GQA上的分块稀疏注意力机制,本质是在百万级上下文中先找准、再高效算。其IndexBranch先对KVblock打分并选取top-k,MainBranch只在命中的block上做标准注意力。相比固定滑窗/全局token等稀疏方式,MSA对内容相关性更敏感;相比DSA(DeepSeek)偏选哪些token/KV、MoBA(Kimi)偏选哪些块,MSA更强调怎么精细分块、怎么连续读块、怎么让GPU高效计”。因此其差异化不只是算法稀疏,而是把稀疏注意力进一步做到算子与访存效率层面。

性价比与真实用量:M3具备部署简单、可跨GPU部署、已有模型训练可迁移等特点,对B端客户和开发者生态更友好。OpenRouter上,M3在100K-1M上下文区间Token消耗量上线后持续排名第一,全球总量和编程领域表现也位居前列,说明其长上下文和Coding能力已在真实调用中得到验证。

投资建议:首次覆盖给予”买入”评级,目标市值2152亿元人民币。预计2026-2028E收入4.50/10.55/21.10亿美元,同比增长469%/135%/100%。后续催化重点关注M3大参数版本上线,以及Hailuo等多模态模型迭代带来的ARR增长。

深度报告及近期跟踪欢迎联系:互联网传媒团队

作者 AI财经

AI财经提供的财经数据以及其他资料均来自互联网其他第三方,仅作为用户获取信息之目的,并不构成投资建议。
AI财经以及其他第三方不为本页面提供信息的错误、残缺、延迟或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎。