🔥 M3模型发布,长程任务能力显著提高
🌟性能:和GPT-5.5 和 Gemini 3.1 Pro互有来回,接近Opus 4.7。 (从 Step 0 开始进行多模态混合训练),支持图片和视频的输入,并能操作电脑桌面。是,也是目前唯一的开源模型。
🌟技术:再再再证明, ,M3采用的就是前几天放出来的全新注意力架构 MSA (MiniMax Sparse Attention ), 1M 超长上下文。在 100 万上下文下,M3 每 token 计算量仅为上代模型的1/20。在 prefilling 阶段,实现了 ,在 decoding 阶段有。数据上,文本和图像或其他模态在序列中交替自然排列,对训练模型有性能提升, 。
🌟Long Horizon:长程任务是目前衡量模型性能的金指标。1) ,复现了一篇paper的结果,全程自主产出 18 次 commit 与 23 张实验图表,并跑通了核心实验。2),实现资深团队 1–2 周的集中投入进行的H卡FP8 矩阵乘(GEMM)kernel,共完成 147 次 benchmark 提交、1959 次工具调用。3)M3能够。
🌟定价: M3短文本(≤512k)原价是M2.7的2x,目前5折优惠;长文本相比于M2.7提升为4x价格。
