【申万tmt】Fable 5出口管制,看好M3超长上下文、极简部署抢占份额
🧧美国政府对Fable 5出口管制,国产模型可能获得更多份额。MiniMax作为国产上市大模型有稀缺性,特色是性价比、全模态。当前全球大模型格局未定,在牌桌上、有持续迭代能力和前沿竞争力更加重要。我们预计MiniMax后续将发布更大参数规模的旗舰模型,吸引不同行业(如法律、金融等对超长上下文、多模态有需求)、多元化场景的B端用户。公司已于6.5进入恒生科技指数,预计7月解禁(短期或有波动),8月纳入港股通。
🌹MiniMax开源M3模型MSA架构(技术论文https://arxiv.org/pdf/2606.13392v1),提出MSA,一种最小化的、可加速的块级稀疏注意力机制,支持从头预训练和从 GQA 检查点近无损转换。在109B MoE模型上,MSA保持Full Attention基线的能力水平,同时在1M 上下文下将每token注意力计算量降低28.4×,实测prefill 加速 14.2×、decode加速 7.6×。
🌹MiniMax M3解决超长上下文的计算和部署问题,对B端客户更友好。我们认为,M3模型对B端友好,在1M超长上下文,算力有限、场景多元基础上,109B总参/6B激活的小MOE+MSA的极简部署与性价比对B端客户有吸引力:1)部署简单,kernel设计保持简洁,可以跨GPU部署;2)训练可迁移,已有模型不需要从头训练;3)多模态原生。
