2026年6月1日,国产大模型领域迎来了一场重大的技术革新。国内顶尖AI企业MiniMax正式推出了新一代旗舰通用模型——MiniMax M3。这款模型不仅打破了海外闭源模型在顶尖大模型能力上的垄断,还成为了全球首个集齐“前沿编程与智能体能力”、“100万超长上下文”以及“原生多模态”三项核心能力并全面开源的划时代产品。
自研MSA架构,算力成本骤降80% 支撑M3实现百万级超长上下文的核心,是其底层自研的MiniMax Sparse Attention(MSA)稀疏注意力架构。传统大模型在处理长文本时,计算复杂度会呈平方级增长,导致成本高昂且效率低下。而MSA架构通过精准的KV分块和算子层优化,成功将计算复杂度降至接近线性,显著提升了成本效益和处理效率。

这一底层突破带来了惊人的效率飞跃:在100万上下文的规模下,M3的单token计算量仅为上一代模型的1/20,预填充(prefilling)阶段加速超过9倍,解码(decoding)阶段加速更是高达15倍以上。这意味着企业在处理百万级长文档、大规模代码库分析时,算力成本可以降低80%以上,真正让长上下文从“炫技”变成了可以规模化落地的生产力工具。
编程与多模态能力,硬刚国际顶尖闭源模型 在核心能力的实测中,M3展现出了与国际头部闭源产品(如GPT-5.5、Claude 3 Opus等)正面硬刚的实力。在衡量软件工程能力的权威评测SWE-Bench Pro中,M3得分59.0%,超越了GPT-5.5和Gemini 3.1 Pro,直逼行业顶尖的Opus 4.7。

更令人惊叹的是M3的长程自主执行能力。官方曾让M3独立复现一篇ICLR 2025的杰出论文,它连续自主运行近12小时,全程无人干预,自主产出18次代码提交与23张实验图表,并成功跑通了核心实验。此外,M3还是从训练第一步就开始进行文本、图片、视频混合训练的原生多模态模型,不仅能看懂复杂的论文图表,甚至具备桌面操作能力,可以在复杂的跨应用环境中执行任务。