国产大模型迎来里程碑！MiniMax M3首发：百万上下文+原生多模态全面开源

2026-06-01

2026年6月1日，国产大模型领域迎来了一场重大的技术革新。国内顶尖AI企业MiniMax正式推出了新一代旗舰通用模型——MiniMax M3。这款模型不仅打破了海外闭源模型在顶尖大模型能力上的垄断，还成为了全球首个集齐“前沿编程与智能体能力”、“100万超长上下文”以及“原生多模态”三项核心能力并全面开源的划时代产品。

自研MSA架构，算力成本骤降80% 支撑M3实现百万级超长上下文的核心，是其底层自研的MiniMax Sparse Attention（MSA）稀疏注意力架构。传统大模型在处理长文本时，计算复杂度会呈平方级增长，导致成本高昂且效率低下。而MSA架构通过精准的KV分块和算子层优化，成功将计算复杂度降至接近线性，显著提升了成本效益和处理效率。

这一底层突破带来了惊人的效率飞跃：在100万上下文的规模下，M3的单token计算量仅为上一代模型的1/20，预填充（prefilling）阶段加速超过9倍，解码（decoding）阶段加速更是高达15倍以上。这意味着企业在处理百万级长文档、大规模代码库分析时，算力成本可以降低80%以上，真正让长上下文从“炫技”变成了可以规模化落地的生产力工具。

编程与多模态能力，硬刚国际顶尖闭源模型 在核心能力的实测中，M3展现出了与国际头部闭源产品（如GPT-5.5、Claude 3 Opus等）正面硬刚的实力。在衡量软件工程能力的权威评测SWE-Bench Pro中，M3得分59.0%，超越了GPT-5.5和Gemini 3.1 Pro，直逼行业顶尖的Opus 4.7。

更令人惊叹的是M3的长程自主执行能力。官方曾让M3独立复现一篇ICLR 2025的杰出论文，它连续自主运行近12小时，全程无人干预，自主产出18次代码提交与23张实验图表，并成功跑通了核心实验。此外，M3还是从训练第一步就开始进行文本、图片、视频混合训练的原生多模态模型，不仅能看懂复杂的论文图表，甚至具备桌面操作能力，可以在复杂的跨应用环境中执行任务。

国产大模型迎来里程碑！MiniMax M3首发：百万上下文+原生多模态全面开源

最新文章