即拍即存、智能管理……如今,这种对图像的一站式服务已经实现!6月10日,在百度AI Day开放日上,百度网盘与文库联合发布了行业内首个具备全模态输入、处理、输出的系统化完整交付AI能力,并推出行业首个“拍存管一体”的“AI相机”,成为覆盖场景最广泛、功能最全面的全模态超级入口。
上海证券报记者注意到,AI相机已在百度网盘App上线,点击首页“相机”图标即可使用。同时,AI相机也已接入百度文库App。
文库、网盘AI能力各有侧重
据介绍,AI相机实现了对生活、学习、工作全场景的深度覆盖。例如,在生活场景中,用户可借助AI相机进行人像的即时修图与存储,享受包括美化、添加模板等在内的最全面修图功能;还能“拍摄万物”,借助AI技术自动识别物体并推荐相关知识百科;用户甚至可以将简单画作转化为创意涂鸦作品,举办线上画展,分享艺术灵感。
在学习场景中,用户可“拍完即学”,充分利用拍照解题、错题举一反三、试卷去手写等实用功能,并将学习内容直接存储于网盘,方便随时回顾。
在工作场景中,AI相机则提供了文件、票据的智能扫描、拍照翻译、图片转表格等高效功能,可将纸质文件快速转化为电子版,并支持文件格式的自由转换。
此次文库和网盘的合作,引起了业内的关注。在吉林大学通信工程学院硕士生导师刘振泽看来,百度网盘与文库联合发布的AI相机,是其AI布局在全模态闭环、数据反哺、生态升维的关键落子,其本质是“生态杠杆”驱动的战略升维:以多模态交互为触点,串联网盘流量、文库内容、大模型技术,构建“数据采集-智能处理-场景交付”的内容智能闭环。
记者注意到,更多业内人士将目光聚焦在网盘和文库各自在AI能力上的“发力”点。对此,百度副总裁,文库事业部、网盘事业部负责人王颖对上证报记者表示,文库和网盘的使命是一致的,希望它们能成为用户全模态输入、处理和输出的平台。不过目前来看,二者各有侧重点。
百度副总裁,文库事业部、网盘事业部负责人 王颖
王颖进一步表示,以文库为例,它在内容创作方面,在AI领域的探索起步较早、涉足较深。其架构可分为几层:数据层是文库和网盘共建的,数据分别嵌入公域和私域,并且双方都有基于自身需求的工具库;基建层同样是共建的,像自研的阅读器、编辑器、播放器,在Agent能力层,文库在文档能力上已经深耕许久,基本实现了全面覆盖。而网盘在富媒体方面,比如视频以及图片处理上积累了诸多能力。
“我们期望文库和网盘都能实现全模态输入、处理和输出。文库侧重从图文接入,网盘侧重从图片、视频接入,最终让整体能力更加完备。对于用户而言,无论从文库进入还是从网盘进入,都能体验到这套完整的能力。”王颖说。
解决描述难、等待久、交付差三大问题
在业内人士看来,AI产品如今仍面临着两大核心挑战。一是消费、创作的各环节断裂,用户从创作、消费到再创作仍然需要在多个产品、平台间来回切换;二是完整交付能力上存在瓶颈,大部分用户通常需要图文并茂的文章、有专业图表的PPT、带声音的视频,以及这些内容的组合,对于大部分AI产品,用户拿到的都是原材料或者是半成品,需要做很多后续工作。
当日活动上,百度文库还宣布多智能体协作能力“GenFlow超能搭子”升级至2.0版本,将很快全面上线。该版本展现百度文库在全模态处理与输出上的领先优势,成为首个实现全场景适配、全链路覆盖的多智能体协作应用。
“一直以来,我们在文库和网盘领域持续推进AI升级工作,致力于让AI为用户生成的内容达到可交付水平。然而,交付差的问题在整个行业长期未得到妥善解决。”百度文库产品负责人钟昊对上证报记者表示,如今GenFlow超能搭子升级与以往最大的区别就在于着力解决描述难、等待久、交付差三大问题,为用户打造真正好用的多智能体协作产品。
“在AI相机的产品设计上,我们基于大量用户调研,做的是用户真正需要的AI相机,即相机与相册的结合,用户拍完照片后可直接进行存储。虽然可能有很多AI相机产品,但它们无法满足用户对相机的完整需求,而只是满足了其中一部分。”百度网盘产品负责人吴天昊对上证报记者表示。
吴天昊透露,AI相机解决了用户“储存空间不足”的痛点。“用户可以直接在网盘通过AI相机拍摄,只要网盘存储空间足够,照片就会直接存到网盘,保存在云端,同时也免去了从本地再上传的过程。”
截至目前,百度文库AI MAU已达9700万,拥有14亿专业内容资源;在最新发布的AI产品榜应用榜上,百度网盘App MAU超1.5亿,位列中国第一。AI重构后百度网盘、百度文库的全面融合和能力共建,打通了从“创编存管”到“找看用享”全流程环节。
作者:刘暄