► 文 观察者网 张广凯
2025年,是百度证明自己的关键一年。
年初DeepSeek掀起的开源热潮,以及推理模型的范式变革,都把大模型竞赛推向了一个全新维度。每一轮技术迭代往往也伴随着行业格局重新洗牌,历史积累的优势,稍有倦怠就会被颠覆一空。
百度是国内大模型行业的先发者。2023年,百度率先推出的文心大模型,证明了中国企业完全有能力跟OpenAI掰一掰手腕;2024年,百度又把精力更多投入在AI落地,助推中国繁荣的应用生态。
应用为王,固然是结硬寨、打呆仗的稳健之举,但在2025这个变革之年,外界对百度更大的期待,是进攻,是重新拿出SOTA级别的模型能力。
好在2025年刚开年,百度进取的步伐重新快了起来。3月16日,百度时隔一年多,终于发布了大版本升级的文心4.5,以及文心大模型X1;而刚过了一个多月,在今天的百度create大会上,百度就将两个模型双双升级到Turbo版。
与此同时,还有应用向的进展。伴随着今天高说服力数字人、通用超级智能体心响APP、内容操作系统沧舟OS等多款AI应用集中发布,百度找回了激情,用模型和应用的双击,再一次向外界展示了自己技能库之全面。
放眼中国AI江湖,百度是少有的在芯片、框架、模型、应用四层架构都有强大能力的玩家,如果未来AI时代要诞生一个超级入口,这样的全面性势必让百度成为一个不容忽视的候选人。
最强+最便宜,百度迭代加速
“当下大部分主流大模型的API调用价格,都已经比满血版DeepSeek更低,速度也更快。”
4月25日的百度create开发者大会上,百度创始人李彦宏开场就做出上述判断。
这个判断背后,是如今全球大模型竞赛中“速度为王”的鲜明趋势。
这既是指迭代速度:2025年第一季度,新发布的大模型数量已经达到55个,较过去两年明显提升。
另一方面,低成本、快速调用的能力,也成为AI应用落地中最关键的竞争力。
在这两个维度上,百度都在提速。
百度文心一言4.0发布于2023年10月,2024年8月更新至4.0 Turbo。
直到今年3月,百度在宣布开源的同时,一下子就带来了文心4.5和X1两个全新模型。今天的开发者大会上,又迅速迭代至更强大、成本更低的文心4.5Turbo和文心X1Turbo。
其中,文心4.5 Turbo每百万token的输入价格仅为0.8元,输出价格3.2元,相比文心4.5,价格下降80%,仅为DeepSeek-V3的40%。
文心大模型X1 Turbo,输入价格为每百万token1元,输出价格4元,相比文心X1,性能提升的同时价格再降50%,仅为DeepSeek-R1的25%。
李彦宏认为,当前开发者做AI应用的一大阻碍,就是大模型成本高、用不起。成本降低后,开发者和创业者们才可以放心大胆地做开发,企业才能够低成本地部署大模型,最终推动各行各业应用的爆发。
此外,百度把多模态作为了自己独特的竞争优势之一,基于RAG、iRAG技术,延续低幻觉优势。在多个基准测试集中,文心4.5 Turbo多模态能力与GPT 4.1持平、优于GPT 4o。
李彦宏指出,“多模态将成为未来基础模型的标配,纯文本模型的市场会越变越小,多模态模型的市场会越来越大”。
文心大模型X1 Turbo则是基于4.5 Turbo的深度思考模型,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强,整体效果领先DeepSeek R1、V3最新版。
多模态和推理,都是眼下大模型最重要的发展方向,也是应用落地需求最旺盛的场景,再加上文心5.0也将在年内发布,今年注定将是百度的进攻之年,有望在基础模型能力上重新跻身第一梯队。
最锋利的矛:秒哒、心响、数字人
2024年,李彦宏就多次强调,智能体是未来AI应用落地的关键。今年,以Manus为代表的智能体爆火,无疑证明了李彦宏的判断。
在各类智能体中,代码智能体Coding Agent,是最近半年AI应用进展最快、最火的赛道。海外的Cursor,字节的Coze,都快速积累了大量用户,逐渐颠覆传统的人工编程方式。
不过,Cursor和Coze都属于低代码编程工具,也就是说,用户仍然需要基本的代码编程知识,才能较好地使用。它们能够服务的用户,仍然以程序员为主。
但是去年就开始预告的百度秒哒,从一开始就定位于无代码编程Agent。
所谓无代码编程,是指用户无需任何代码知识,只要用自然语言描述自己的需求,Agent就能自主完成代码开发工作,给出交付即可用的产品。
李彦宏表示,全球只有不到3000万程序员,有80亿人,当技术的门槛逐渐消失,每个人都可以具备程序员的能力。
今年3月,秒哒已经向全社会开放,任何人都可以通过秒哒,一句话生成应用。就连一位退休师傅,都能利用秒哒,为小区创建一个可以进行车位、访客、维修登记和社区活动公告的居民服务应用;一位陕西的果农,做了一个能卖苹果、自动算账的应用……
而今天的开发者大会上,最大的感动也来自一位秒哒用户——一位视觉障碍的程序员钟科,牵着导盲犬站在了主舞台上。
或许会令人感到惊讶,中国视障人群的第二大就业岗位,竟然是IT行业。但是钟科介绍说,视觉障碍者的天然缺陷,让他们无法完全理解模块化内容。无代码编程不仅是普通人提升自己的得力工具,更有可能成为弱势人群的生存倚仗。
今天,百度还发布了类似于Manus的“通用超级智能体”心响。心响可以一站式解决用户复杂问题。目前,心响已覆盖知识解析、旅游规划、学习办公等场景中200个任务类型。
以租房维权为例,心响会理清事件关键问题,寻找专家律师AI分身,从不同的角度提供专业建议,最后生成可下载的法律分析报告,并给出详细维权步骤。
百度今天带来的另一个“炫技”,来自数字人。
由于直播带货这个庞大应用场景的存在,数字人已经成为国内大模型竞争的红海,但是百度今天发布的“高说服力数字人”,仍然给人极大惊喜。
在一段演示视频中,一位数字人主播不仅表情、语气、手势非常自然,甚至可以拿起桌面上的书本直接向观众介绍,端起茶杯做出喝茶的动作。
这是因为在多模态大模型的加持下,高说服力数字人拥有“剧本生成”能力,能够做到表情、语气、动作都匹配台词内容实时调整,让数字人拥有了超越真人的表现力,迎来数字人的“DeepSeek时刻”。
同时,高说服力数字人的成本也极大下降。百度慧播星已上线“一键克隆”功能,用户只需录制一条最短2分钟的视频上传训练,即可拥有自己的专属数字人,人人都能做主播。
过去一年,慧播星数字人主播数量累计超过10 万,其展现出来的高说服力也带来了显著的收益,大盘来看数字人直播转化率提升了31%,降低了80%的开播成本。
随着用户对于AI应用落地的需求日益明确,相较于基础模型能力,智能体正在成为最容易攻占用户心智的武器。如果说两大基础模型的升级,保障了百度AI能力的下限,那么高说服力数字人、秒哒、心响这样的智能体工具,或许更能够撑起百度的上限,成为百度在应用市场攻城略地最锋利的矛。
在2025这个智能体元年,百度又一次成为起跑最快的玩家。
AI时代,百度仍是最全面的一个
包括上述模型、智能体等在内,百度在本次开发者大会上带来一系列产品技术发布,再一次证明了自己深厚的技术积累和全面性。
大模型技术可以分为芯片、框架、模型、应用四层架构,百度是国内乃至全球少有的全面布局企业。从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有关键自研技术。
相比于直接面向用户的模型和应用,百度在基础设施层面的优势更加明显。
芯片层是中国AI产业最薄弱的环节,而在本次大会上,百度正式宣布基于昆仑芯,点亮3万卡GPU集群。这是国内首个国产自研三万卡集群,意义格外重大。
李彦宏在年初谈到,“创新是不能被计划的。你不知道创新何时何地到来,你所能做的是,营造一个有利于创新的环境。”
在社会层面如此,在企业层面同样如此。一家企业无法保证自己的创新总是能够成功,总是能够站在行业前沿,但是从概率上来说,基础设施更完备的企业,总是拥有更大的成功可能性。
由此而言,百度今年产品发布节奏的加速,正是多年投入基础设施的回报。
百度的基础设施能力,也意味着它可以不陷于大模型之间的竞争,而是拥有“卖铲子”的能力。在本次开发者大会上,百度也专门设置了DeepSeek分会场,因为DeepSeek应用落地的“最后一公里”,同样需要依赖百度这样的算力服务商。
面向未来,大模型研发的重投入属性,注定了群雄混战格局不会长期持续,无论是技术能力,还是用户使用习惯,都将向头部玩家收敛,最终可能仅剩与互联网时代类似的少数几个超级入口。
今年以来百度技术和产品的迭代加速,证明在这场入口之争中,百度产品布局的全面性,将会长期成为一个不容小觑的重要优势。
继DeepSeek之后,百度正在引领新一波AI势能。上午发布会后,百度港股股价午盘涨近5%。
来源|观察者网