NVIDIA 刚刚让 8 个 AI 智能体通宵运营了一个机器人实验室——无需人类
大多数 AI 智能体在软件中工作:浏览网页、写代码、发邮件。NVIDIA 的 GEAR 实验室刚刚做了一些不同的事——他们构建了一个系统,AI 智能体控制物理机器人,给它们 GPU 算力和 token 预算,让它们彻夜工作。没有任何人类在闭环中。
这个系统叫 ENPIRE。结果值得关注。
什么是 ENPIRE?
ENPIRE 是一个物理自主研究系统——缩写很拗口,但想法很简单:不是让一个 AI 智能体在软件中单独工作,而是让8 个 AI 智能体,每个控制一台真实的机器人手臂,全部并行工作,执行相同的物理任务。
每台机器人获得自己的 GPU 和一个 token 预算——本质上是智能体可以使用多少算力的支出限额。智能体持续运行,完成以下任务:
- 分拣细针(需要毫米级精度)
- 紧固扎带
- 将 GPU 安装到计算机中
这些不是玩具演示。分拣细针和安装硬件是那种需要精细操作的任务——机器人手臂移动太快就可能同时损坏硬件和自身。
智能体如何工作
每个智能体建立在 Codex——OpenAI 编码导向的模型——之上,并被赋予一个固定目标。智能体决定如何实现它,通过机器人手臂执行物理动作,并从有效的方法中学习。
NVIDIA 团队实时监控三件事:机器人利用率(机器人是否真的在做事情,还是只是在等待?)、Token 利用率(智能体花费算力预算的效率如何?)和 GPU 利用率。他们还追踪两个结果指标:Token-到-成功(完成任务需要多少成本)和时间-到-成功(需要多长时间)。
奖励信号——本质上是算作「成功」的标准——来自一个观察机器人动作的视觉分类器。关键是,这个分类器在实验开始前就被固定和冻结了。这是故意的:如果奖励函数可以在运行期间更新,聪明的智能体可能会找到看起来成功而实际并未完成任务的方法。冻结它防止了这种情况。
硬件层面的安全
让 AI 智能体通宵控制机器人手臂确实是全新的领域。NVIDIA 在 ENPIRE 中构建了两层物理保护:
- 硬动作限制——机器人手臂被物理限制在特定范围内移动,无论智能体发出什么指令
- 力矩限制夹爪——夹爪只能施加最大限度的力,所以即使智能体出错,也不会损坏硬件或环境
这两者都是硬件控制,不是软件控制。软件可以被聪明的智能体绕过;硬件限制不能。这是对一个真实问题的深思熟虑的方法。
他们的发现
头条结果:8 个并行工作的智能体探索解空间的速度显著快于单个智能体单独工作。 这在事后看来显而易见——更多机器人意味着更多尝试,更多尝试意味着更快发现——但这是一个重要的确认,说明并行性在物理空间中的运作方式与软件中相同。
NVIDIA 团队还发现,他们追踪的指标(token 效率、成功时间)能有意义地预测哪些方法会泛化。系统不仅在完成任务;它在生成关于如何高效完成任务的数据。
ENPIRE 将被开源,这意味着其他研究团队可以在这个基础上继续建设。这意义重大:物理自主研究历来缓慢且昂贵,因为机器人很贵,而人类必须监督。一个可复制、开源的系统,用于在物理实验室中运行 AI 智能体,改变了这个计算。
对 OpenClaw 用户的意义
ENPIRE 是一个研究系统,不是产品——你不会马上把它接入你的工作流。但它展示了一些对任何构建 AI 智能体的人来说很重要的东西。
让 ENPIRE 工作的那些属性——算力预算、固定奖励信号、并行执行、以及无需监督运行的能力——正是让任何 AI 智能体系统在生产中有用的属性。
当你在 OpenClaw 上运行一个智能体时,它在类似的约束下工作:一个明确的目标、追踪的资源使用、以及在你睡觉时持续取得进展的能力。物理机器人实验室只是同一原则的更戏剧化版本:让智能体工作,监控重要指标,然后回来获取结果。
聊天界面和智能体之间的区别始终是,智能体会持续前进。ENPIRE 展示了当任务是物理的、预算是真实的、实验室是黑暗的时,「持续前进」是什么样子。