← 返回博客

MiniMax 刚刚发布了 428B 开源模型,专为智能体打造。数字难以忽视。

⭐ 精选

MiniMax 刚刚发布了 428B 开源模型,专为智能体打造。数字难以忽视。

MiniMax 刚刚发布了 M3——一个 4280 亿参数的开放权重模型,已上传到 HuggingFace。它不仅大;而且从底层就是为智能体和编码而设计的。基准测试结果把它放到了非常严肃的位置。

以下是实际内容。

架构:总量大,活跃高效

M3 使用混合专家设计:总参数 428B,但每次推理只激活 23B。这和让 GPT-4 运行成本远低于原始参数数量所暗示的技巧相同——大部分模型在任何给定请求中都处于休眠状态。

结果是一个在计算效率上超常发挥的模型。你获得了超大模型的表示能力,而无需在推理时支付全部成本。

值得关注的基准数据

MiniMax 在主打智能体和编码结果,理由充分。

SWE-Bench Pro——软件工程基准的最难版本,使用真实 GitHub issues——M3 得分为 59.0%。对于开放权重模型来说,这是一个强劲的结果,将其置于主导该排行榜的前沿闭源模型之列。

Terminal Bench 2.1,测试模型在实际终端环境中操作的能力(写命令、读输出、调整),得分为 66.0%。这正是编码智能体所关心的那类基准。

MCP Atlas——一个专门围绕模型上下文协议设计的基准,测试工具使用和智能体协调——M3 得分为 74.2%。MCP 正迅速成为连接 AI 模型与外部工具的标准接口,这里的专门基准分数值得注意。

百万 token 上下文

M3 扩展到 100 万 token 上下文窗口,使用 MiniMax 自有的稀疏注意力实现达成。100 万上下文作为标题数字已不再新鲜,但重要之处在于实现方式——稀疏注意力保持计算可行,而不是随上下文长度平方增长。

对于需要保存长项目历史、阅读大型代码库或在扩展任务中保持上下文的智能体来说,真正的 100 万上下文确实有用。

开放权重,但有个附带说明

权重现在已在 HuggingFace 上线。但有一个时间说明:技术报告和完整权重发布大约在10 天后。目前可用的是模型权重下载,完整文档将随后发布。

MiniMax 同时推出 MiniMax Code——基于 M3 构建的编码工具——以及一个 API 平台,这样你可以通过 API 访问 M3 而无需自行运行。

为什么开源在这里很重要

过去一年 AI 领域的模式是:闭源模型先发布令人印象深刻的东西,然后开源在几个月内赶上。M3 是朝这个方向的又一个数据点——一个拥有前沿级智能体基准分数的模型,以开放权重形式提供。

这对任何在 AI 上构建的人来说都很重要。开放权重意味着你可以本地运行、为你的场景微调、避免 API 速率限制、不被单一供应商的定价束缚。对于智能体工作负载尤其如此——你可能每个任务要发出数百或数千次调用——成本结构非常重要。

对 OpenClaw 用户的意义

OpenClaw 被设计为使用领先的 AI 模型——而不断扩大的高性能开源模型直接关联到什么是可能的。

随着像 M3 这样的模型成熟及其工具生态稳定,运行在 OpenClaw 上的智能体受益于更广泛的高性能、高性价比选项池。一个在 SWE-Bench Pro 上得分 59%、在 MCP Atlas 上得分 74% 的模型不是实验品——它是生产级智能体工作负载的严肃选项。

开源 AI 生态系统变得更强,意味着更多选择、更多价格竞争、以及最终对每个在这种基础设施上构建的人来说更好的智能体。

开始免费试用 →