来源:伯虎财经
作者 | 楷楷
苹果想造的AI手机,却被豆包抢先一步落地。
近日,豆包手机助手技术预览版正式亮相,是基于豆包大模型、与手机厂商在操作系统层面深度合作的AI助手,能够像人类一样,真正理解并操作手机完成任务。
在演示视频里,用户只需开口下令,手机便能自动调用不同APP,完成比价、订餐、规划行程等一连串复杂操作,与当初IPhone16提到的AI手机概念有异曲同工之妙,甚至更强大。
目前,由中兴通讯和字节跳动共同开发,搭载该功能的努比亚M153工程样机已同步开售,官方售价为3499元,但已有不少用户在二手平台加价出售。
有意思的是,尽管外界称其为“豆包手机”,字节却明确表示,目前并无自研手机计划,而是正与多家手机厂商洽谈助手合作。
从猛攻大模型,到试水自研AI硬件,再到以“生态合作”模式嵌入终端,字节的探索路径,也是全球科技巨头在AI时代争夺“超级入口”的缩影。
至于这个下一代入口,究竟会诞生自哪来,由谁来定义和掌控,答案仍在激烈博弈中。
“绕过APP”的AI助手
去年9月,苹果率先诠释了什么叫“AI手机”,包括一键调用AI能力、让Siri制订旅游计划、订机票等。
不过,目前国行iPhone还未能用上这些功能,像自动整理通话录音、智能行程规划等部分功能也尚未完全上线,就连苹果高层也在今年初表示,首版AI Siri表现不如预期 。
苹果还在努力,豆包却已落子成局,毕竟在AI时代,时间就是最宝贵的时机。
近日,豆包团队发布了豆包手机助手技术预览版,它绕过了APP,直接嵌入到手机操作系统底层,调动手机系统资源和所有APP,做到“模拟人一样操作手机”。
如果说苹果AI更侧重“辅助交互”,核心是让手机变聪明,减少用户使用各项功能时的摩擦;那么豆包手机助手则是从“听懂”到“看懂”,能够直接模拟用户点击操作,相当于重新定义了人机交互方式。
在豆包发布的演示视频里,用户只要输入“帮我在各个电商平台比价下单某款商品”,豆包就会自动检索各大电商平台并筛选出最低价,只在敏感的支付环节等待用户确认。
另外,在很多场景中,用户只要给豆包一句语音指令,它就能很好执行各种任务,包括提交出差申请、预订机票、定时打卡签到等。
豆包甚至还有记忆功能,在即将推出的Pro模式中,如果用户打开了记忆,就不用在每一次执行任务时反复交代细节,整个操作过程会更丝滑。
而且,Pro模式的推理能力还会进一步增强,在演示视频中,用户要到巴黎旅游,要求豆包标记出其在社交平台上收藏的餐厅,同时整理他喜欢的展览会信息并预定机票,豆包也能打开多个APP进行一系列的复杂操作,整体耗时8分钟左右。
当然,豆包手机助手所展现的能力,在概念层面并不算新鲜,自ChatGPT崭露头角以来,这类“AIAgent”的跨应用任务执行能力就开始被广泛讨论。
只是,目前大多数手机厂商仍停留在“展示阶段”,在真正能量产落地的手机中,豆包手机助手的表现是最全面的。而豆包之所以能够先拔头筹,关键在于两大突破:
首先是系统级的深度嵌入,豆包手机助手能够获得安卓系统的底层权限,打通应用之间的壁垒,进行跨应用的连贯操作,大大提高了整个操作体验的“丝滑感”。
相较之下,目前市面上不少智能体都在尝试执行预订机票、执行报销等“拟人操作”,但由于这个过程涉及多个独立应用的无缝跳转与数据传递,很多时候只有定制的企业级智能体,才能真正打通航空公司、公司报销流程等数据,完成商业闭环。
其次则是豆包大模型在多模态能力上的积累。基于字节的短视频基因,豆包对视觉、语音和场景有着深度的理解能力,使其能将多模态感知能力无缝迁移至手机交互,让豆包助手能够像人类一样“看懂”手机画面并进行操作。
虽然豆包没有直接“造手机”,但它却以软件定义硬件的方式,改造了现有的入口系统。只是,当豆包守住入口,其他应用就只能沦为软件服务商,“超级入口”争夺战一触即发。
软硬兼施,曲线布局
事实上,字节一直有个“硬件梦”。早期,其通过Pico布局AR/XR领域;从去年开始,其陆续布局AI耳机、AI玩具等领域,甚至不止一次传出要自研AI手机。
只是,无论是Pico团队的裁撤,还是上市一年在天猫、京东两个电商平台累计销量仅为1-2万台的AI耳机“Ola Friend”,都可以看出AI硬件赛道不好闯。
可即便如此,AI硬件赛道却持续火热,因为大模型这个“灵魂”,终究需要一个“肉身”。
唯有将AI功能嵌入到手机、耳机、汽车等真实载体中,AI才能渗透到日常生活的不同场景中,接触到更真实的数据、更直接的用户需求,并与硬件能力进行深度整合。
这也是为什么越来越多互联网大厂、汽车厂商,都在为自己贴上“AI科技公司”标签,因为未来的超级入口将不仅仅是一个应用、一台手机,而是跨设备、跨场景、持续演进的AI智能体,谁能更贴近用户,支配更多的终端,拥有更多有权限调用入口,谁就能掌握生态主动权。
目前来看,在寻找合适的硬件载体这条路上,各巨头所选择的路径并不一致。
阿里、字节、小米等大厂都率先选择了自研模式。阿里推出了夸克AI眼镜;谷歌的两个AI眼镜项目已进入小批量试产阶段;甚至理想汽车也在近日宣布要推出AI眼镜Livis。
自研模式的优势在于能够完全掌握数据采集、系统调用和用户交互的全流程,实现软硬件协同的快速迭代,大厂也能在定义下一代交互入口的过程中,拥有更多的主动权。
不过,字节还尝试了更灵活的模式,通过与手机厂商合作,重构手机操作系统的主控逻辑,以AI为纽带赋能整个终端生态,相当于用另一种形式掌握生态入口的话语权。
在这之前,谷Gemini与三星手机也采取了类似中兴与豆包的合作模式,本质是“各取所需”。
站在手机厂商的角度,尽管近年不少厂商都在推进自研大模型,但实际落地的AI功能主要集中在生图、摘要等消费者能够直接感知的体验上,跟头部大模型在落地速度和深度上仍有明显的代际差异。
跟豆包此类强势的AI助手合作,既能为手机产品带来更多的用户流量,也能快速补齐大模型能力这一短板。
站在大模型企业的角度,AI硬件特别是手机行业的竞争早已是一片红海,但其作为AI的重要载体,却是绕不开的入口,与二三线手机厂商以及代工厂合作,则能“借船出海”。
虽然大家的目的不同,但目标却是一致的,当AI已经将“手”伸向了物理世界,大家要做的则是尽快握住“这双手”,从单纯的模型能力军备竞赛,转向软硬件融合的智能终端“渗透战”。
谁能成为最后赢家?
不过,豆包手机助手想要全面铺开推广,也并不容易。
首先,豆包手机助手的实用性与预期仍有差距。《晚点latepost》对努比亚M153工程样机进行了实测,要求其打开各个外卖平台,选出最低价外卖并下单。
跟真人操作相比,手机操作还略显“笨拙”,整个过程耗时近2分钟,比手动操作慢了1分钟左右,也存在误读信息的可能。豆包团队也提到,模型能力仍需要优化。
其次,豆包的竞争对手,也不会坐以待毙。目前,华为、小米、OPPO、vivo等主流手机厂商都有自己的自研大模型,或许它们目前的模型能力不如豆包,但市场竞争压力也会推动它们通过收购、合作等模式来提升模型能力。
一个明显的趋势是,这些厂商正在集体拥抱另一个选择,接入像DeepSeek这样的高性能开源模型,将大脑外包出去,但系统的“命门”则必须掌握自己手里。
还有各大电商和社交应用,也不会甘心沦为“服务商”,毕竟用户数据、流量入口、内容生态是整个商业模式的根本,一旦这些内容都变成了冷冰冰的“数据”,那么被颠覆的将不仅是大厂自身的商业护城河,更是整个以平台为中心的互联网秩序。
最后,豆包还要过手机操作系统厂商这一关。近年,谷歌、苹果等传统操作系统巨头也早已启动了面向AI的升级,虽然苹果的AI化进程不如预期,但它们也绝不会坐视自身被AI助手“架空”,寄生在它们之上的豆包,又何尝不是被捏住了咽喉。
因此,豆包助手目前演示的流畅操作,更多是建立在理想化的合作前提下,现实中的商业博弈,会让这条路布满荆棘。
而且,当豆包试图以软件重新定义硬件时,其也无法摆脱硬件本身的制约。专业手机厂商在芯片调校、多摄协同、端侧推理优化等方面的积累,不是单纯靠一个系统级助手就能跨越的。
目前,豆包和努比亚都强调这款AI手机主要面向开发者和科技极客,首销备货量约为50万台,距离主流旗舰机动辄200万~300万台的出货量仍有明显差距。
如果豆包想跟更多手机厂商合作,那么其就不能只是做一台“样板机”,能否找到属于字节的“赛力斯”,将会成为接下来拓展生态合作模式的关键。
不过,大部分手机厂商也仍在观望,有手机厂商内部人士透露,需要观察豆包的下一个技术方案,目前这款产品更像是测试版,而不是一款真正意义上的消费电子产品。
但对字节而言,首款AI手机能够收获多少订单并非关键,重要的是将以往分散的大模型、应用、硬件等AI布局深度整合起来,形成一种连贯、可用、可闭环的智能服务体系。
未来,这一智能服务体系不仅能部署在手机上,还能覆盖眼镜、耳机、智能家电甚至是智能车机等更多终端设备,目前,已有奔驰、赛力斯等车企的智能车机搭载了豆包大模型。
不少硬件创业者都对豆包手机表达了赞誉。锤子科技创始人罗永浩就表示,“字节尝试走出这第一步,是非常了不起的,必须点个赞。”
字节怀揣“硬件梦”多年,却一直未能圆梦,如今,借着豆包杀了一个回马枪。虽然字节也未必能赢下整盘棋,但它已经创造了一种新的可能,也为“入口争夺战”加入了新的博弈因素。
在AI定义体验的时代,不会做硬件的软件公司,和没有AI灵魂的硬件公司,都有可能出局。因此,要成为新的“超级入口”,科技大厂还需要找到更多新的筹码。
特别声明:以上内容仅代表作者本人的观点或立场,不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的,请于上述内容发布后的30天内进行。
下一篇:香港政府:取消三部日本电影放映