2025年7月26日,世界人工智能大会期间,荣耀正式发布魔法大模型家族新成员——MagicGUI大模型,并宣布开源。这款参数规模达70亿的模型主要负责多模态感知和自动化执行,更成为其首个GUI开源大模型。目前,该模型的技术报告已登陆GitHub平台,模型参数和荣耀测试集将于近期上线,向广大软硬件开发者开放。
该模型在比肩SOTA模型的同时,荣耀创新性使用继续预训练、强化微调的两阶段训练方法,突破行业技术瓶颈,在大模型支持场景的通用和泛化上取得了突破性进展。这一创新不仅标志着荣耀在 AI 底层技术领域的阶段性突破,更折射出智能终端行业在通用人工智能浪潮下的生态化转型思路。
与传统偏重“知识生成”的语言大模型不同,MagicGUI大模型聚焦“屏幕感知+行为执行”核心能力,直指“AI智能体(Agent)”这一更为复杂的技术赛道——通过多模态感知解析屏幕内容、以自动化执行完成操作指令,实现从用户意图到任务结果的闭环。
以上突破使得单智能体执行向多智能体协同完成复杂任务成为可能,正如荣耀MagicOS首席产品官王皑所言,MagicOS已具备“多模态感知、个性化推理、生态化工具和自动化执行”全链路的智能体能力。
作为荣耀今年提出的“阿尔法战略”的关键里程碑,MagicGUI大模型的发布并开源承载着重要战略意义。该战略旨在推动荣耀从智能手机制造商向AI终端生态公司转型,而MagicGUI构建的技术基座,既为自身智能体业务提供底层支撑——如已在Magic V5旗舰机上实现“万事找YOYO”的全新智能体体验,也为跨设备协同、多场景融合、AI生态繁荣奠定基础,助力“构筑智慧生态”的战略第二步落地,加速实现“让AI走进生活”的核心目标。
破解智能体落地场景适配难题
荣耀MagicGUI大模型的推出,建立在对智能体实用化痛点的深刻洞察之上。在移动互联网生态中,应用场景碎片化、交互逻辑差异化一直是制约智能体规模化落地的核心瓶颈。传统大模型往往依赖特定场景的数据训练,在面对未覆盖的应用界面或操作流程时,容易出现理解偏差或执行失效。
针对这一行业共性难题,MagicGUI大模型采用全新的双阶段数据训练方法实现技术突破。正如荣耀MagicOS首席产品官王皑所说:“当我们大模型在遇到一个没有经过预训练的新场景时,它依然能够很好地适配和支持。这突破了以往的技术瓶颈。” 第一阶段通过大规模通用界面数据训练,构建基础交互逻辑框架;第二阶段引入场景迁移学习机制,使模型能够从已知场景中提炼规律,快速适配陌生界面环境。这种训练模式使模型在未经过专项训练的应用场景中仍能保持高适配性,较传统方法实现显著提升。
在技术验证层面,MagicGUI 大模型已在多项通用数据测试中达到行业领先水准。王皑表示:“MagicGUI大模型在一些通用数据集的测试当中,已经达到了比肩 SOTA 行业领先水准的技术验证。” 更具实践价值的是,该模型已成功应用于荣耀最新折叠旗舰机型 Magic V5,支撑起 “万事找 YOYO” 这一现象级功能。
王皑认为,用户通过自然语言指令,即可让智能体完成从打车比价、酒店预订到文档处理的复杂任务,实现了从 “人适应机器” 到 “机器理解人” 的人机交互范式转变。“以前可能是人去适应机器,但是现在更多的是机器需要去学习人。”
多模态融合能力是 MagicGUI 大模型的另一技术亮点。不同于单一模态的语言或图像模型,该模型实现了视觉理解与操作执行的深度协同,这与王皑提到的 “AI 智能体的平台应用能力上,基本上具备了多模态感知、个性化推理、生态化工具和自动化执行全链路能力” 相契合。通过视觉大模型解析屏幕内容结构,识别按钮、输入框等交互元素;借助强化学习算法生成最优操作路径;最终通过模拟点击等方式完成自动化执行。这种端到端的处理能力,使智能体能够应对页面布局和内容多变、操作流程多变的复杂场景,在 Magic V5 的实际使用中展现出高效的任务完成能力。
荣耀选择将 MagicGUI 大模型开源,也是技术自信的体现。
“我们在构建MagicOS第一天就设想构筑成为开放的平台,既可以让行业优秀的智能体更好地融入到我们的MagicOS系统当中来,同时也可以把我们优秀的大模型的能力开放出去,与全球伙伴共同来构筑更繁荣的AI生态。”王皑认为,在当前智能体技术加速迭代的窗口期,单一企业的闭环研发难以覆盖千行百业的场景需求。通过开源,荣耀正在构建一个由软硬件开发者、行业解决方案提供商共同参与的创新共同体。
从技术共享维度看,MagicGUI大模型的开源内容将包含模型架构、模型参数、荣耀测试集等,开发者可基于 MagicGUI 大模型进行二次训练,针对特定行业场景优化模型参数,例如智能家居厂商可训练模型识别家电控制界面,金融机构能定制化开发理财产品操作流程。这种模块化的开源策略,既保留了核心技术的通用性,又为垂直领域创新预留了空间。
生态协同效应在跨设备场景中尤为显著。据了解,荣耀 MagicOS 已实现多系统互联互通,而 MagicGUI大模型的开源将进一步打破设备间的操作壁垒。 “从单智能体的调度到多智能的协同来完成复杂的任务成为了可能” 。在王皑看来,未来用户家里的冰箱、空调、汽车都可以做到无缝的流转——这就是未来繁荣生态的一个最好体现。这种无缝流转的背后,是统一的界面理解与操作执行标准,而开源正是推动这一标准形成的有效路径。
此外,第三方开发者的参与正在丰富生态的应用维度。王皑提到,“很多服务,比如出行、生活、美食、美妆等业务,作为业务的真正提供者是三方。我们要为用户服务,但用户的需求一定是多元化的。所以我们一定要把这些三方纳入到我们的生态体系里面来,通过我们的 YOYO 智能体把它整合起来,然后提供最优的体验给到我们的用户。” 这一理念正通过 MagicGUI 大模型的开源得以实践,吸引众多行业伙伴加入,共同拓展应用场景,提升用户体验。
重塑智能终端的竞争格局
“我们希望的是为用户提供极致简约的、以意图识别为基础的人机交互体验。”王皑说。
MagicGUI 大模型的推出与开源,正在引发智能终端行业的连锁反应。在手机领域,人机交互的竞争已从硬件参数比拼升级为智能体能力较量。Magic V5 “一语解千愁”,通过自然语言指令直接调用复杂功能,这种效率提升正在重新定义旗舰机型的用户体验标准,推动行业向更智能、更便捷的交互方式演进。
跨设备协同领域的变革更为深刻。荣耀提出的 “智慧生态” 构想,将 AI 能力从手机延伸至冰箱、汽车、穿戴设备等全场景硬件,这是阿尔法战略第二步的重要内容:要构筑一个智慧生态,把 AI 的能力能够赋能到更多的硬件。MagicGUI 大模型作为这一构想的技术基座,解决了不同设备界面语言不统一的难题,实现了设备间的无缝协同,让跨场景服务流转成为可能。
通用人工智能(AGI)的发展趋势下,MagicGUI 大模型的布局具有前瞻性。王皑认为:“AI 技术其实是日新月异,未来一定会发展到通用人工智能。通用人工智能的特点是什么?就是它更加接近于人类,更多地像人类一样去思考问题,去做一些自主的决策。”荣耀阿尔法战略的 “三步走” 规划显示了清晰的发展路径,而 MagicGUI 大模型正是这一路线图的关键支撑 —— 其持续进化的理解与执行能力,将为智能体从工具属性向伙伴属性升级提供技术储备。
行业竞争的焦点正在发生转移。荣耀通过开源MagicGUI大模型,实际上掌握了生态建设的主动权,正如王皑所强调的生态共建理念,参与其中的硬件厂商、应用开发者越多,基于该模型的技术生态就越稳固。这种以技术标准为核心的竞争,将推动行业向更开放、更协同的方向发展。
不过尽管进展显著,GUI大模型也面临多重挑战。个性化意图理解是当前的核心瓶颈,王皑坦言:“最大的挑战,我们提供的‘千人千面’,其实每个人使用习惯不一样,使用手机的习惯也不一样,每个人的 IP 属性也不一样。举个例子,这种个人化的意图理解,我认为是最大的挑战。” 同一指令在不同用户语境下可能存在差异,如何准确理解并满足每个用户的个性化需求,是 MagicGUI大模型及相关智能体技术需要持续突破的难点。
从智能工具到数字伙伴
跨行业融合的深化,正为 MagicGUI 大模型开辟着广阔的增长空间。
从机遇维度看,随着模型理解能力的提升,其应用场景将从工具操作向决策支持延伸,正如王皑所展望的,未来 YOYO 智能体将“成为一个有情绪价值陪伴的伙伴。他不仅是工作好搭子、生活好搭子,也是在用户情绪有波动的时候能够提供情绪价值、给予鼓励的小伙伴。” 这种从执行层面向认知层面的跨越,可能催生全新的智能服务形态,为用户带来更全面、更贴心的体验。
与此同时,MagicGUI 大模型的开源为各行业提供了智能技术基础,将推动 AI 在工业、教育、医疗等领域的深度应用,正如王皑所言:“AI 技术突破如何支撑 MagicOS 与智能体发展,以及荣耀是如何让 AI 走进生活场景的。” 这种跨行业的融合应用,不仅拓展了模型的商业价值,也为行业数字化转型提供了新工具,推动整个社会向智能化方向发展。
基于这个策略,荣耀也制定了面向未来的阿尔法战略。
“第一步,其实我们就是希望在荣耀的每一款产品里面都打造具备 YOYO 智能体能力的智能手机,为每一位荣耀的用户提供极致便捷的人机交互。第二步,构筑一个智慧生态。第三步,其实我们就是如果真正未来世界达到了一种通用人工智能的时代,那么我们的 YOYO 智能体也会同步进化到可能是我们更好的一个数字伙伴,甚至是更懂你的数字分身。”王皑说。
短期来看,模型将聚焦于提升复杂任务的处理能力,进一步优化多轮对话中的意图修正、跨应用操作的容错机制等,让智能体更准确、更可靠地完成用户意图的理解,提升用户体验的稳定性与流畅性。通过持续的技术迭代,使 MagicGUI 大模型在各种场景下都能保持高效的处理能力,更好地支撑 YOYO 智能体的可持续演进。
中期目标是实现情绪感知与共情响应,使智能体在执行任务的同时,能理解用户的情绪状态,提供情感支持。这种情绪价值的注入,将是智能体从工具向伙伴进化的关键标志,让用户在使用过程中获得更温暖、更贴心的体验。
长期而言,随着通用人工智能技术的成熟,在魔法大模型的驱动下,YOYO智能体会逐步演进成为用户的 “数字分身”。这个时候智能体就相当于是我们手机里的助理和真实的人类共生共存,从而我们整个的智慧世界就会发生一些很大的变化、具备更大的想象空间它将熟悉用户的行为习惯、价值偏好,甚至能模仿用户的思维方式处理事务,帮助用户完成各种个人化任务,重新定义人与数字世界的关系。
生态规模的扩大可能带来质的飞跃。由千万参与者共同塑造的智能未来,将推动 AI 技术真正走进生活的方方面面,为用户带来更智慧、更便捷、更富有人情味的智能体验。
在智能体技术从概念走向现实的过程中,MagicGUI 大模型的开源实践提供了可行路径的先行示范。它证明:真正的智能不是某家企业的专属品,而是全行业协同创新的产物。当技术的门槛被降低,当创新的边界被打破,智能时代的红利才能真正惠及每一个人,这或许是荣耀此次开源行动的深层意义所在,也是推动整个 AI 行业健康发展的重要方向。