2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。
LaMMA-P 首次将大型语言模型与 PDDL 规划器深度融合,解决了异构多机器人系统中长时任务的自动分解与分配难题,大幅提升多机器人协同规划的智能水平。该技术在全新基准数据集上经过大量模拟实验验证,相比现有最先进方法 SMART-LLM,任务成功率提高105%,执行效率提升36%,在复杂长程任务规划上取得了突破性进展,为异构多机器人协同完成复杂任务提供了全新解决方案。
技术亮点:语言模型与经典规划算法融合,支撑通用异构多机器人长时协同任务
面对复杂长时任务和异构多机器人系统,LaMMA-P 首创性地将大语言模型的语义理解能力与 PDDL 规划器的严谨性结合,不仅解决了传统方法在任务分解和资源分配上的瓶颈,还显著提升了任务成功率与执行效率。通过全面开源的代码与 MAT-THOR 基准数据集,LaMMA-P 为多机器人协同规划开辟了新的技术路径:
一.研究背景
随着多机器人系统在搜救、仓储、家庭服务等场景中日益普及,让多台异构机器人协同执行复杂任务成为机器人领域的重要课题。在现实应用中,长时任务通常需要被分解为一系列关联的子任务,并合理分配给具备不同能力的机器人个体协同完成。例如家庭助理机器人需要合作完成 “整理房间” 这样的复杂指令,其中包含搬运物品、清洁、整理等多个步骤。然而,长时任务的自动分解与多机器人分工极具挑战:如何让机器人队伍理解人类的高层意图,将其细化为可执行的子任务清单,并根据每台机器人的能力进行最佳分配,是当前智能体协作面临的难点。
传统的多机器人任务规划方法往往依赖预先定义的规则或启发式算法,在任务规模和复杂度较小时尚能奏效,但面对具有长时间跨度、复杂依赖关系的任务时往往力不从心。这类方法缺乏对自然语言指令语义的深入理解,难以及时调整规划来应对动态环境和任务变化。此外,基于大型语言模型的机器人任务规划虽然在单机器人的简单任务上取得了一定进展,但在多机器人协同的长程任务上依然存在成功率低、效率差、难以泛化等问题。为了解决上述瓶颈,研究人员开始探索将新兴的大语言模型与经典人工智能规划技术相结合,试图兼顾两者优势来提升多机器人系统的自主协同能力。LaMMA-P正是在这样的背景下应运而生。
二.研究方法
大型语言模型和启发式搜索规划器共同驱动的多机器人规划框架
面对异构多机器人长时任务规划难题,LaMMA-P 提出了融合大型语言模型与 PDDL 规划的创新框架。首先,系统利用大语言模型强大的推理与文本解析能力来理解复杂的自然语言指令,从中抽取高层任务目标和约束,并生成初步的任务分解方案。接着,LaMMA-P 将任务分解结果转换为形式化的 PDDL 表述,由经典规划器执行全局搜索与最优子任务规划,找出满足约束的最优执行序列和分配方案。在这个过程中,大语言模型负责语义理解和高层决策,PDDL 规划器保证了规划结果的严谨性和完备性。通过人机指令理解和形式规划求解的结合,LaMMA-P 实现了对长时任务既能清楚理解又能精确计算。
整个框架采用模块化设计,包括指令解析模块、任务规划模块、执行仿真模块等。指令解析模块由预训练的大型语言模型实现,输出任务结构图和初步分配建议;任务规划模块基于 PDDL,通过迭代深化搜索得到任务分配的具体行动序列;执行模块在仿真环境中验证并反馈执行结果用于可能的调整。各模块解耦的设计使得增加机器人数量或更改任务类型时无需更改框架主体逻辑,只需调整相应的任务描述和机器人能力配置,体现出高度的灵活性和通用性。
三.实验结果
性能全面超越现有方案
研究团队构建了MAT-THOR数据集来评估 LaMMA-P 的有效性。MAT-THOR 基准涵盖了在家庭场景下多机器人协作完成长时任务的多种情况,包括简单的顺序任务和复杂的并行任务,模拟真实家庭环境中的多样挑战。实验在不同数量机器人(包括 2 台及更多)和不同任务复杂度组合下进行,并将 LaMMA-P 与当前最新的多机器人任务规划方法SMART-LLM进行了对比。实验从性能对比模块消融可视化分析三个方面系统展示了 LaMMA-P 的优势。
1. 性能对比
LaMMA-P 在任务成功率、效率以及机器人利用率等多个核心指标上均大幅领先当前最优方法SMART-LLM (GPT-4o)
关键发现:
2. 模块消融分析
通过消融不同模块,验证了 LaMMA-P 各模块对整体性能的关键贡献:
关键发现:
3. 可视化分析
通过 AI2-THOR 仿真环境可视化展示,直观体现 LaMMA-P 优化的任务规划效果:
关键发现:
四.总结与展望
多机器人协同规划新范式
LaMMA-P 的提出为多机器人长时任务协同规划提供了全新的思路:它成功地将大模型的智能推理与经典 PDDL 规划有机结合,弥补了各自的短板,显著提升了复杂任务的自动化程度和执行可靠性。这一成果标志着异构多机器人自主协作迈出了关键一步。在未来工作中,研究团队计划进一步探索端到端的优化(例如使语言模型与规划器联结形成可微分闭环),以及引入多模态感知信息(如视觉、语音)来丰富指令理解,不断提升系统在真实环境中的适应性和鲁棒性。随着代码、数据集和交互式演示的开源发布,更多研究者和开发者可以基于 LaMMA-P 框架进行拓展创新,加速多机器人协同领域的技术演进。可以预见,LaMMA-P 所代表的 “大模型驱动规划” 新范式有望在未来走出实验室,应用到智能制造、家庭服务等众多场景,推动多机器人系统朝着更加高效、智能的方向发展。