11月18日,蚂蚁集团正式发布全模态通用AI助手“灵光”,开创性地在移动端实现“自然语言30秒生成小应用”,并且可编辑可交互可分享。“灵光”也是业内首个全代码生成多模态内容的AI助手,首批上线三大功能——“灵光对话”“灵光闪应用”“灵光开眼”,支持3D、音视频、图表、动画、地图等全模态信息输出,对话更生动,交流更高效。目前,“灵光”已同步登陆安卓与苹果应用商店。
图为11月18日“灵光”App上架应用商店
“灵光对话”突破传统文字问答模式,不是堆砌文字,而是像策展一样设计每次对话:通过结构化思维,让AI回答逻辑清晰、表达简练;通过生成可视化内容,如动态3D模型、可交互地图、音视频等,让内容呈现更生动;最终以优质的信息组织方式,让用户“秒懂”知识。这种兼具逻辑张力和信息美感的设计,也体现了“灵光”的产品理念:让复杂变简单。
比如在教育场景下,用户咨询“灵光”知识性问题,“灵光”能够洞察并提炼知识点,有逻辑有层次地展示,并能生成3D实物动图、可互动的示意表格等,让复杂信息一目了然。
图为“灵光”对话界面
这种可秒级生成、又极简多元的可互动回答,背后是“灵光”实现了基于全代码生成的多模态输出能力,所有呈现的结果,包括图表、动画,小应用等组件,都是由模型根据对话情境即时生成并呈现给用户。同时,“灵光”构建了多智能体协作的Agentic架构,能够动态调度图像、3D、动画等专用Agent与工具,实时协作,为用户提供更完整、更丰富、更沉浸的视图体验。
值得一提的是,“灵光”开创性地面向普通用户推出了“闪应用”功能。用户在对话中说出或输入一句话,“灵光”在1分钟以内、最快30秒就能生成一款AI应用。无论是健身计划工具、旅行规划器还是健康食谱生成器,均可实现一句话生成、参数自定义、即用即分享。这种快速生成日常生活小应用的功能,让普通人也能零门槛享受AI Coding带来的生产力变革。
如用户咨询“溏心蛋要煮多久?”“灵光”可生成一个“溏心蛋时间计算器”,用户可根据实际情况自行选择“鸡蛋大小”“要求的熟度”等条件,自行调整出最符合个人需求的答案;用户想知道怎样养车最划算,“灵光”可以生成一个“养车成本计算器”,用户可自由选择里程、油费等参数,组合出极具个性化的养车方案。
值得一提的是,“灵光”生成的闪应用不只是静态前端页面,而是可以直接调用大模型等后端能力,让应用不仅能展示结果,更能实时与外部进行交互,显著拓宽可实现的场景边界。
作为一款全模态通用AI助手,“灵光开眼”功能搭载了AGI相机技术,通过实时视频流解析实现对物理世界的观察和理解,并支持文生图/视频、图生图/视频等多种创作模式。比如,在旅游场景下,用户用“灵光”对准想了解的建筑,“灵光”可以实时“看见”并提供讲解。
作为蚂蚁集团AGI(通用人工智能)战略的产品级探索,“灵光”精准把握2025年AI应用市场向场景化生产力工具转型的趋势,其核心理念“让复杂变简单”,通过将应用开发嵌入日常对话,重新定义了通用型AI助手的生产力边界。
据悉,蚂蚁集团2025年以来加速AGI布局,已发布AI医疗管家AQ、布局具身智能公司灵波科技,蚂蚁百灵大模型也跻身于万亿参数模型阵营。“灵光”的推出,进一步展现了蚂蚁在通用人工智能领域从技术突破到场景落地的全链路能力。
来源:经济参考网
作者: 蔡岢