🦾AI 资讯

MiniMax 刚刚发布了 428B 开源模型，专为智能体打造。数字难以忽视。

作者 Sammy·2026-06-12·4 分钟阅读

⭐ 精选

MiniMax 刚刚发布了 M3——一个 4280 亿参数的开放权重模型，已上传到 HuggingFace。它不仅大；而且从底层就是为智能体和编码而设计的。基准测试结果把它放到了非常严肃的位置。

以下是实际内容。

架构：总量大，活跃高效

M3 使用混合专家设计：总参数 428B，但每次推理只激活 23B。这和让 GPT-4 运行成本远低于原始参数数量所暗示的技巧相同——大部分模型在任何给定请求中都处于休眠状态。

结果是一个在计算效率上超常发挥的模型。你获得了超大模型的表示能力，而无需在推理时支付全部成本。

MiniMax 在主打智能体和编码结果，理由充分。

在 SWE-Bench Pro——软件工程基准的最难版本，使用真实 GitHub issues——M3 得分为 59.0%。对于开放权重模型来说，这是一个强劲的结果，将其置于主导该排行榜的前沿闭源模型之列。

Terminal Bench 2.1，测试模型在实际终端环境中操作的能力（写命令、读输出、调整），得分为 66.0%。这正是编码智能体所关心的那类基准。

在 MCP Atlas——一个专门围绕模型上下文协议设计的基准，测试工具使用和智能体协调——M3 得分为 74.2%。MCP 正迅速成为连接 AI 模型与外部工具的标准接口，这里的专门基准分数值得注意。

M3 扩展到 100 万 token 上下文窗口，使用 MiniMax 自有的稀疏注意力实现达成。100 万上下文作为标题数字已不再新鲜，但重要之处在于实现方式——稀疏注意力保持计算可行，而不是随上下文长度平方增长。

对于需要保存长项目历史、阅读大型代码库或在扩展任务中保持上下文的智能体来说，真正的 100 万上下文确实有用。

权重现在已在 HuggingFace 上线。但有一个时间说明：技术报告和完整权重发布大约在10 天后。目前可用的是模型权重下载，完整文档将随后发布。

MiniMax 同时推出 MiniMax Code——基于 M3 构建的编码工具——以及一个 API 平台，这样你可以通过 API 访问 M3 而无需自行运行。

过去一年 AI 领域的模式是：闭源模型先发布令人印象深刻的东西，然后开源在几个月内赶上。M3 是朝这个方向的又一个数据点——一个拥有前沿级智能体基准分数的模型，以开放权重形式提供。

这对任何在 AI 上构建的人来说都很重要。开放权重意味着你可以本地运行、为你的场景微调、避免 API 速率限制、不被单一供应商的定价束缚。对于智能体工作负载尤其如此——你可能每个任务要发出数百或数千次调用——成本结构非常重要。

OpenClaw 被设计为使用领先的 AI 模型——而不断扩大的高性能开源模型直接关联到什么是可能的。

随着像 M3 这样的模型成熟及其工具生态稳定，运行在 OpenClaw 上的智能体受益于更广泛的高性能、高性价比选项池。一个在 SWE-Bench Pro 上得分 59%、在 MCP Atlas 上得分 74% 的模型不是实验品——它是生产级智能体工作负载的严肃选项。

开源 AI 生态系统变得更强，意味着更多选择、更多价格竞争、以及最终对每个在这种基础设施上构建的人来说更好的智能体。