刚在今年春晚看到机器人打醉拳,当下OpenClaw出现又带动全民“养虾”,AI技术正以前所未有的速度渗透到大众视野与产业应用中。当行业普遍聚焦于大模型迭代与算力竞赛,一家以手机为核心的智能终端企业,该如何在AI时代确立长期战略,构筑可持续的竞争优势?这一行业命题,vivo在博鳌亚洲论坛上给出了答案。
日前,vivo总裁、首席运营官,vivo中央研究院院长胡柏山在博鳌亚洲论坛上的主题演讲,系统阐述了vivo面向AI时代的战略布局,明确表示vivo基于“影像+AI”的双核驱动,正在构建一套完整的感知体系。
vivo明确提出,AI只有走出云端,走进千千万万普通生活场景里,才能蓬勃发展。AI下半场的决胜点,在于对物理世界的理解和感知。而影像则是AI与物理世界交互的“眼睛”。依托这一路径,vivo将持续投入资源深耕感知能力,为手机行业下一个十年构建核心竞争力。
影像是AI之眼,构建感知新赛道
当前AI技术能力持续突破,但行业普遍面临着同一瓶颈:AI仍停留在云端运算与被动指令执行阶段,缺乏对真实物理世界的深度感知与理解,难以真正走进生活场景、服务现实需求。显然,AI想要从虚拟世界走向现实,首要任务是先建立一套完整的感知体系,具备“看见”世界、理解场景的能力。
vivo给出的解决方案,是以影像为桥梁,实现AI与物理世界的高效交互。在手机、机器人、MR头显等各类智能终端中,影像都承担着最核心的感知入口作用,是连接虚拟与现实的关键纽带。
现阶段AI虽具备基础视觉能力,可识别图像与视频内容,但这种识别是被动的,需要等待指令;而感知是主动的,可以观察环境的亮度、空间的纵深、甚至是人际的距离,最后基于理解,完成与物理世界的交互,解决真实问题。胡柏山在演讲中指出,“AI要真正感知和改变物理世界,关键能力在于影像。”影像通过光学系统、成像处理、空间计算等全链路能力,完成物理世界的数字化投射与三维场景重建,是AI看懂真实环境、理解场景逻辑、感知情绪状态、预判行为趋势的基础。
这一判断并未追随当下流行的大模型叙事,而是回归终端产业本质,坚持在底层技术上持续深耕。在vivo的视角里,大模型利用的是互联网上积累下来的数字资产,并不能解决对当前物理世界认知的能力。而影像+AI,可以把看到的现实记录下来,再转化为认知,以及预测行动。
因此,vivo今年正式在内部成立感知赛道,基于影像+AI的双核驱动,通过传感器融合视觉、听觉、触觉等多模态信息,结合感知大模型,将物理世界的信号转化为可理解、可应用的有效数据,为AI落地物理世界筑牢技术根基。据透露,vivo AI团队已深耕近十年,规模接近千人。
算力不是壁垒,感知才是护城河
在手机行业里,vivo一贯秉持“少押注、压重注”的战略智慧,一旦确定赛道方向,便以长期投入换取确定性落地。此次将感知作为一级技术支撑赛道,正是其对AI行业长期趋势的关键判断,也是布局未来的关键一步。
未来智能设备的核心壁垒,短期内看也许是算力,但算力的领先容易被追赶,从长期视角来看,感知才是护城河。胡柏山认为,AI下半场的决胜点,不在于算力与参数堆叠,而在于对物理世界的感知与理解能力。真正让设备“懂你”的,不是运算速度,而是对环境、场景与人的理解能力。
在感知技术的支撑下,手机镜头将实现从“被动记录”到“主动感知”的升级。当镜头对准一只猫,不仅能识别出“猫”,更能理解其运动轨迹、潜在行为与情绪状态;同时,镜头会主动感知环境亮度、空间纵深、人际距离,并基于理解提供更贴合场景的解决方案,让手机从“等待指令”转向“主动服务”,实现智能化升级。
感知体系串起多智能终端,机器人是独立长期赛道
基于影像+AI构建的感知体系,vivo把“第一落点”选择在手机端。胡柏山判断,手机将从现在的Smart Phone进化为Agent Phone。通俗点讲,就是让手机不再是等待接收指令、完成操作的工具,而是可以看见、思考、并行动的伙伴。据了解,vivo即将发布的X300 Ultra和X300s搭载的影像Agent,可以根据对环境的理解,为用户推荐最佳的构图、调整参数,用户一键就可以拍出高质量内容。同时,vivo还会针对用户高频场景,为不同产品系列定制差异化的Agent化体验,如出行Agent、办公Agent、游戏Agent等,重塑手机体验。
vivo打造的感知体系,并非只服务于手机这一单一终端,而是可贯穿具身智能、智能头显等多品类终端,为全场景智能体验提供底层能力支撑,构建起“同一个视觉+大脑、多终端复用”的生态格局。
去年博鳌论坛期间,vivo正式宣布成立机器人Lab。胡柏山介绍,如今经过一年的推进,该业务保持独立研发节奏与技术路径。机器人与手机在用户场景、技术要求、硬件规格上存在显著差异,属于长期布局的终极智能形态。
“机器人我们是从零开始,在服务人群方面,vivo的目标是先为年轻人做点事情,做好以后,能力可以泛化,目前团队还在推进这个事情中。”他表示,vivo的资源仍将集中在用户场景最关键的技术点上,以“沿途下蛋、稳步落地”的节奏推进研发,更贴合产业落地的真实规律,确保每一步都能真正解决用户需求。
直面行业周期波动,新品类或将年底推出
尽管博鳌亚洲论坛中采访焦点在这套影像+AI构建的感知体系,但作为手机头部厂商,记者也非常关注存储芯片涨价对vivo的影响。面对存储芯片涨价超预期的行业挑战,胡柏山坦言,外部环境对所有品牌公平,考验的是企业产品力与经营定力。市场短期波动不可避免,企业更应回归用户需求,把影像等核心体验做深做透,以产品竞争力穿越周期,才是长期经营的关键。
在用户关注的云台相机新品上,vivo同样坚持长期主义与体验优先。被问及云台相机进展时,胡柏山表示,该产品源于用户视频拍摄的真实痛点:手机拍摄时易被消息打断,需要专注的视频拍摄设备。vivo希望以更人性化、更贴近用户体验的全新设计推进研发,目前研发仍存在一定挑战,但将争取在年底推向市场,为用户提供更优质的拍摄体验。
长期主义穿越周期:在快时代,做技术赛道的长跑者
从行业发展规律来看,科技产业的真正突破,从来不是靠短期造势,而是来自长期、连续、重资源的投入。vivo在感知体系的布局,同样遵循这一逻辑:不追求短平快的概念落地,而是把感知能力作为基座,以十年维度做投入,以影像+AI为纽带,连接手机、头显、机器人、生态终端,逐步搭建完整的智能生态。
胡柏山在演讲中强调:“科技的高度,终须回归人的尺度。”这句话既是vivo的技术伦理,也是其长期主义的注脚。AI的终极价值不是参数与算力,而是服务于人、落地于场景。在行业追求速度与流量的当下,vivo的选择看似是一个“慢跑者”,但本质上是选择做技术赛道的“长跑者”——耐住周期、守住底层、聚焦用户、长期投入。
随着AI逐步进入物理世界落地的深水区,感知能力的价值将持续凸显。vivo以影像为基础、以端侧为核心、以长期投入为支撑的路径,不仅为自身构建起差异化壁垒,也为行业提供了一种参考:在快时代里,慢即是快;在喧嚣浪潮中,长期主义才是穿越周期的确定性力量。