豆包大模型团队发布并开源UI-TARS-1.5
创始人
2025-04-17 22:47:08

4月17日,豆包大模型团队发布并开源UI-TARS-1.5——一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。

上证报中国证券网讯 4月17日,豆包大模型团队发布并开源UI-TARS-1.5——一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。

豆包大模型团队称,UI-TARS-1.5已在7个典型的GUI图形用户界面评测基准中取得SOTA表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。

据介绍,UI-TARS-1.5基于团队此前提出的原生智能体方案UI-TARS,通过强化学习进一步增强了模型的高阶推理能力,使模型能够在“行动”前先进行“思考”。

对于推理能力的优化,显著提升了模型在面对未知环境和任务时的泛化能力,这使得UI-TARS-1.5在多项主流评测基准上较此前领域最优模型取得了更好表现。

此外,在1.5版本的模型中,豆包大模型团队希望以游戏为载体来增强基础模型的推理能力。

据悉,与数学、编程等领域相比,游戏更多依赖直观的、常识性的推理,并较少依赖专业知识,因此,游戏通常是评估和提升未来模型通用能力的理想测试场景。(郑维汉)

相关内容

热门资讯

第六届蒙西春季农机展开展 (来源:内蒙古日报)转自:内蒙古日报3月20日,第六届蒙西春季农机展在巴彦淖尔市火热进行,当地农户正...
习近平五四青年节演讲稿最新或2...  各位同学,各位老师,同志们:  今天是五四青年节,很高兴来到北京大学同大家见面,共同纪念五四运动9...
最新或2023(历届)高中生五...  光阴荏苒,物换星移。时间之河川流不息,每一代青年都有自己的际遇和机缘,都要在自己所处的时代条件下谋...
最新或2023(历届)中学生感...   尊敬的各位老师,同学们:  大家早上好,今天我演讲的题目是《浓情五月,感恩母亲》。  总有一个人...
最新或2023(历届)感恩母亲... 亲爱的老师,同学们:  唐代诗人孟郊的《游子吟》中写到:“谁言寸草心,报得三春晖。”美国“9.11”...