专家指出,GUI路线属于科技创新范式,与API路线只是不同的技术选择,并不是非此即彼。无论哪种路线,均需要妥善处理安全风险
文丨樊朔
针对豆包手机存在安全漏洞的争议,2月27日,豆包手机助手团队发布声明称,截至目前,并未收到豆包手机助手漏洞的详细报告,也未接到网络安全相关监管部门的通报。网传的漏洞演示视频,需要用户主动要求豆包手机助手查看恶意邮件或恶意短信,才会触发攻击。如果没有用户指令,手机助手并不会自动执行高风险操作。针对视频演示的攻击方法,豆包手机助手已升级了相应的防护措施。
仅仅一天前,在三星Galaxy全球新品发布会上,三星 Galaxy S26 搭载谷歌 Gemini AI 亮相,展示了自动订餐、叫车等跨应用操作能力。中兴努比亚总裁倪飞指出,该方案与豆包手机一致,均采用 GUI(图形界面识别)路线。
与一些厂商所推崇的、依赖标准化接口的 API 路线不同,GUI 路线利用大模型“读懂”屏幕并模拟点击。对于由此引发的封号争议,豆包手机助手团队声明称,其权限调用经用户主动授权且公开透明,是行业实现代办功能的通用路径。
对此,北京航空航天大学人工智能研究院教授沙磊认为,当前手机智能体行业处于早期探索阶段,企业均在从用户利益最大化角度积极探索可行的方式,隐私、合规和责任是所有技术路线都应该遵守的,并无路线之分。GUI和API路线都需要获得用户授权,均需要妥当保护用户数据、符合国家法律法规要求。
如何实现智能体快速应用
沙磊表示,GUI路线属于科技创新范式。这一路线在实现用户意图、解决长尾问题上具有显著的突破性,通过对屏幕信息的读取,利用智能体能力拆解用户需求,并在用户授权下完成任务。在实现过程中向用户直观体现智能体从意图理解、任务分解、任务执行及校验到最终完成用户需求的全方位能力,帮助用户体会到人工智能带来的便利。尤其是,对涉及多方服务协同的多重复杂任务,GUI路线在当下可以有效帮助用户在其授权范围内实现生产力的解放和数据流通,同时还可以向用户展示更丰富的能力和促使更多“小而美”的服务提供者获得更多的行业资源,促进整体AI经济的发展。
沙磊指出,美国各巨头也在积极探索GUI路线,OpenAI、微软等都有相关论文、产品DEMO来佐证其在GUI方向的探索。使用GUI路线有利于厂商抢占规则制定的优先机会,利用其在生态中的主导地位形成既定事实,从而使其在AI竞争中占据更有利地位。
在国内,豆包手机助手优先探索出GUI的实现方式,也有相关厂商跟随并开源类似能力。通过技术上打破相关壁垒,同时解决API短期较难实现的长尾问题,实现人工智能的快速应用,有效促进生态的更好融合,为用户提供更好的服务,通过更繁荣的应用生态实现人工智能经济的发展。
安全风险并不取决于路线选择
沙磊认为,GUI路线完全有能力充分尊重并保护用户隐私。
第一,确保所有操作均通过用户授权,任务拆解及执行过程均向用户展示,用户可以实时感知并接管。
第二,对涉及的用户数据在传输、存储等处理过程中进行加密,对涉及的用户个人信息采取脱敏或匿名化手段保护用户隐私。
第三,企业可组织专业技术团队开展PIA评估、隐私合规检测等多重防护,降低用户隐私泄露风险。
此外,《中华人民共和国个人信息保护法》也明确了数据最小化原则和目的限定原则,即只处理为实现特定目的所必需的最少量的个人信息,处理个人信息应当具有明确、合理的目的,且处理活动应当与处理目的直接相关。
沙磊建议,手机智能体能够通过努力落实相关原则,来提升对用户权利的保障。
其中包括:用户知情,通过隐私政策、权限清单等,充分告知用户相关功能用途、权限调用情况;事前授权, Al操作手机经用户主动同意、根据用户的指示进行行动;事中感知,Al操作期间会持续通过屏幕光晕、灵动岛等提示用户,用户也可以随时暂停行动;事中控制,对敏感操作,如确认协议、登录、支付等,均交由用户接管控制;事后管理,任务完成后,主动呈现操作记录,保障用户知情权;数据最小化及目的限定,首先,大部分数据处理均发生在用户本地设备上,另外,部分功能受限于终端设备的算力,部分模型推理需在服务端执行,服务端仅在执行用户指令所需的最短时间内临时处理数据,完成后及时自动删除原始数据,不会用于其他目的;再有就是安全加密,针对端云协同场景,设计可靠的安全加密方案,保证用户对数据的控制。
沙磊认为,API和GUI是不同的技术路线,并不是非此即彼。API路线受限于协议对接、商业考量、合作模式等多方因素落地缓慢,特定封闭生态也在制约API路线的实现,当前仅能与自有生态环境中的服务打通,短期内可能造成更大的生态孤岛。
同时,API路线与GUI路线一样,在AI的意图识别、任务拆解等多个必要环节面临相同的安全风险,而这是手机AI助手发展过程中需要各方关注的重点。