NVIDIA 研究团队近日开源发布了 NitroGen——一个以“玩游戏”为核心训练目标的基础模型,覆盖 1000 多款不同类型的游戏,包括 RPG、平台跳跃、吃鸡、赛车,以及 2D / 3D 等多种形态。
但其目标并非打造“更强的游戏 AI”,而是探索一种更具普适性的具身智能训练范式:在大规模模拟环境中,学习跨物理规则的通用运动控制能力。
研究团队发现,最初为机器人场景设计的 GR00T N1.5 架构,在几乎不做结构性修改的情况下,就可以迁移到游戏环境中,并适配机制差异极大的任务。这一结果再次验证了“苦涩教训(Bitter Lesson)”在具身智能领域的有效性:
一、一个 4 万+ 小时、高质量、来自真实世界的公开视频游戏数据集;
二、一个用于连续运动控制、能力极强的基础模型;
三、一个 Gym API,可以把任何游戏二进制程序封装起来跑 rollout。
其中,数据集本身也是 NitroGen 的关键底座之一:该数据集规模庞大且种类繁多——包含 800 多款游戏,每款游戏的数据时长均超过 1 小时;另有 15 款游戏的数据时长均超过 1000 小时。游戏类型涵盖动作角色扮演、平台跳跃、动作冒险、体育、类银河战士恶魔城、Roguelike 等。
值得注意的是,NitroGen完全开源:包括预训练权重、完整动作数据集、训练与推理代码,以及一份技术细节充分的白皮书。
在更宏观的视角下,研究者提出了一个颇具挑衅意味的判断:“今天,机器人学几乎是所有困难 AI 问题的‘超集’;明天,它可能只是具身 AGI 巨大潜在空间中的一个子集。 ”
如果这一判断成立,未来的机器人控制,或许将不再是手工设计的系统工程,而更像是一次“prompt”:按需生成、即取即用。