7月28日,2025年世界人工智能大会(WAIC)在上海落幕,超过7万平方米的展区、800余家企业,以及一度被炒至3000元的单日票价,都彰显着这场盛会前所未有的热度。
与往年相比,本届WAIC大会呈现出两条愈发清晰的产业路径:一方面,以华为、中科曙光、神州数码为代表的硬件厂商,正将算力基础设施的竞赛推向新的性能高峰;另一方面,以百望股份、阶跃星辰为代表的模型与应用厂商,则集体将目光从技术参数转向了商业场景的深度落地。
这种“一体两面”的态势在大会现场随处可见。比如,记者在华为展台了解到,该公司首次在线下展出的昇腾384超节点(Atlas 900 A3 SuperPoD),单集群算力高达300PFLOPS(每秒30京次浮点运算)。这种在冰冷的机柜里奔腾的澎湃算力,构成了本届大会最“火热”的一面,但在展馆的另一端,下游从业者的冷静思考,也为这股热潮提供了另一个维度的注脚。
“大模型的价值不在于技术工具,而在场景落地的深度。”7月27日,百望股份CEO付英波在接受经济观察报记者采访时如此强调。他的观点代表了业界的另一种声音,在算力竞赛之外,如何将AI转化为真实商业价值同样至关重要。
算力“新基建”继续升维
“面向AI领域,我们已累计投放80亿元,用于支持数据中心、算力租赁等基础设施。”7月27日,在一场以“产业金融联手AI新势力”为主题的分论坛上,芯鑫租赁总裁夏源表示。
据夏源介绍,作为国内唯一专注服务集成电路等战略性新兴产业的金融服务平台,芯鑫租赁成立近十年来,已累计向集成电路产业投放资金2100亿元,此次针对AI基建的80亿元投放,正是其支持“打造自主可控的AI产业链”战略的延伸。
以芯鑫租赁为代表的产业金融力量,正为这场日趋昂贵的算力竞赛提供着持续的资本支撑。在大会现场,记者还看到了一个清晰的趋势:这场算力竞赛,正从对单一性能指标的追逐,演变为一场必须依次解决性能、兼容、存力乃至能效等一系列连锁挑战的“系统工程”。
在对极致性能的追逐方面,华为在本次大会上提供了一个最直观的样本。记者在现场了解到,其首次在线下展出的昇腾384超节点(Atlas 900 A3 SuperPoD),通过全对等(Peer-to-Peer)UB总线和无阻塞Clos架构,将384颗NPU与192颗鲲鹏CPU高效互联,其单集群高达300PFLOPS的算力输出,共同指向一个目标——构建当前最强的算力引擎。
如果说,对极致性能的追求定义了算力竞赛的高度,那么对不同应用场景的深度理解,则决定了这场竞赛的广度。
“市场的需求正在演进,我们观察到两个明显趋势:一是企业出于数据安全考虑,对大模型的‘私有化部署’需求在增长;二是‘训练’与‘推理’的场景正在分化,不同场景需要不同性价比的算力方案。”神州数码信创业务集团副总裁、研发中心总经理周川在接受经济观察报记者采访时如是表示。
基于这一判断,神州数码旗下的神州鲲泰在本次大会上发布了业界首款基于鲲鹏技术路线的大模型训推一体服务器KunTai R624 K2及推理服务器KunTai R622 K2。神州数码信创业务集团产品专家孙亚楠向记者介绍称,KunTai R624 K2最多可支持10张主流AI加速卡,计算效能较以往产品提升2倍;而KunTai R622 K2则在2U空间内实现了业界最高的算力密度。
更值得关注的是其“开放”策略,周川对记者强调:“在适配强大的华为鲲鹏加昇腾生态的同时,我们的产品也兼容国内外主流AI加速卡。我们的初衷,就是用更高性能、更具性价比的产品,打破硬件兼容壁垒,让每个行业都能真正用得上、用得起大模型。”
如果说,CPU和AI加速卡是算力的“大脑”,那么存储系统就是其“供血心脏”。算力再强,如果数据“喂”不进去,一切都是空谈。
“我们观察到,当前数据中心普遍存在‘数据看不全、理不顺、用不好’三大难题。”曙光存储总裁何振向记者表示,“不同厂商的系统不兼容,数据形成孤岛,这是‘看不全’;海量数据(维权)价值难以快速定位和跨域流通,这是‘理不顺’;东西部数据调用延迟高,体验差,这是‘用不好’。”
作为在AI存储市场连续两年份额第一的厂商,曙光存储正试图打通这条“数据命脉”。
在本次大会上,中国移动与曙光存储联合落地国内首个全局统一文件存储系统,启动了智能存力调度平台。该平台率先覆盖长三角、成渝等四大国家级枢纽节点,旨在服务“东数西算”国家战略。
“不能让GPU等数据。”曙光存储副总裁张新凤用一个生动的比喻解释了存算协同的重要性。她对记者表示,通过上下文存储、GDS(GPU Direct Storage)等技术,让数据绕过CPU直达GPU,可以显著提升推理效率,将每秒生成的tokens(可理解为AI处理的字词单位)数量从数百提升至2000-3000的水平。
“我们测算过,每在存力上投入一块钱,算力成本可以节约10块钱。”张新凤补充说。
曙光存储副总裁杨志雷则向记者强调了“跨域无感”的技术挑战:“在数据跨域调度的过程中,既要保证业务不停,又要保证多节点并发访问时的数据强一致性,这对存储系统的元数据管理能力和网络延迟都提出了巨大挑战。”他表示,曙光存储的解决方案在底层芯片到上层软件都做了加速,并考虑了隐私计算和可信计算的要求,为未来的数据安全做好了布局。
这场算力竞赛带来的另一个直接物理挑战,则是与性能一同飙升的功耗。在大会现场,这一挑战也催生了新的解决方案。
记者在超云数字技术集团展台了解到,该公司在本次大会上首次发布了其全栈液冷智算服务器R8429 L13。据相关工作人员介绍,当单机柜功率超过20kW时,液冷已成为关键散热方案,而该产品正是为应对大模型时代数据中心日益严峻的能耗问题而设计。
从资本的注入,到性能的狂飙,再到对开放、协同、效能的回归,一场围绕算力“新基建”的立体化、多维度的竞逐,正在中国AI产业的赛道上激烈上演。
大模型步入产业深水区
如果说算力基建是“修路”,那么模型与应用就是路上跑的“车”。
在大会现场,记者观察到,模型厂商们正集体“走下云端”,告别单纯的参数比拼和技术“炫技”,一头扎进产业的“深水区”,寻找场景,构建生态,开启一场将技术转化为商业价值的探索。
商汤科技董事长兼CEO徐立在主论坛的演讲上就指出,人工智能的进化,在学习了人类标注的数据(感知AI)和互联网上的文本数据(生成式AI)之后,正面临新的数据瓶颈。
“当书本与互联网知识穷尽时,下一代的智能将从何处获取?”徐立如此发问。他认为,答案在于走向物理世界,通过“具身智能”与“世界模型”,让AI像人类一样,在与现实世界的交互探索中获得成长。
这一判断,也解释了为何众多AI企业正在不遗余力地推动模型与产业场景的深度融合,因为只有在真实场景中,AI才能接触到新的、高质量的、包含物理规律的数据,从而实现更高维度的进化。
“产业已进入‘回归客户需求,立足真实应用场景’的阶段。”阶跃星辰CEO姜大昕亦在大会现场如是表示。他同时强调,行业必须回答“模型性能是否完全等同于模型价值”这一产业之问。
基于此,阶跃星辰发布的新一代基模Step 3,核心目标就是“降本增效”。阶跃星辰相关工作人员介绍,该模型在国产芯片上的推理效率最高可达DeepSeek-R1的3倍,与此同时,阶跃星辰选择“交朋友”,联合华为昇腾、沐曦等近10家芯片厂商发起“模芯生态创新联盟”,试图从底层打通软硬协同,降低整个产业的应用成本。
而打造平台,为开发者赋能,则是另一种“交朋友”的方式。
“我们的定位是AI基础设施,旨在为科学家和产业开发者减负增效,通过提供易用的工具,让AI成为‘隐形助手’。”无限光年启智平台工程负责人肖允锋对记者表示,其“启智Inspire平台”正致力于构建一个“全链路算力基座”,让开发者能“从技术琐碎中抽离,专注科学本质和业务创新”。
当模型厂商开始“交朋友”、平台厂商开始“递工具”,一个更具体的追问随之而来:AI的价值,究竟如何在千行百业的具体场景中被“压榨”出来?对此,一批深耕垂直领域的企业,给出了自己的答案。
“我们的核心竞争力,在于十余年来积累的、总交易额达953.5万亿元的‘交易数据金矿’。”百望股份CEO付英波向记者详细阐述了他的商业逻辑。他认为,通用开源模型提供了技术底座,但只有与百望这样深度的行业数据相结合,才能训练出真正懂得业务逻辑、能解决企业财税合规等刚需问题的“业务大脑”。
付英波同时表示,百望股份正积极与阿里通义千问、零一万物等模型厂商,以及沐曦等芯片企业合作,共同推进“开源模型+行业场景”的落地路径。
在文娱等创意产业,AIGC(AI生成内容)也正在重塑生产流程。
“AI并非创意人士的替代品,而是‘超级助手’,其存在允许创作者跳出繁琐流程、投身核心环节。”数字王国执行董事孙大千博士对记者表示。该公司在WAIC上发布了“AI DOMAIN”一站式影像创作平台,集成了文生图、图生频、智能扩图等七大核心功能。
根据数字王国中国区总经理刘红杰的介绍,数字王国还联合香港科技大学、上海电影、沐曦等成立了“数字视觉创新联盟”,旨在“开拓智能化、规模化的内容生产渠道”,推动短视频、短剧等内容的量产。
当视线从产业端拉回到消费者个体,AI的落地则体现为更贴近生活的产品形态。
根据出门问问展台工作人员的介绍,该公司新推出的TicNote AI录音笔,通过内置的“Shadow AI”,将记录、总结、分析、创作等复杂AI能力,封装进一个消费者可用的软硬结合产品中,致力于成为用户的“随身AI思考伙伴”。
无论是赋能企业决策的“业务大脑”,还是辅助内容创作的“超级助手”,抑或是服务个人用户的“思考伙伴”,所有算力的竞逐和模型的探索,最终都指向了同一个目标——
正如道通科技董事长李红京在大会论坛致辞中所引述的观点,“AI的归宿不是‘看起来多聪明’,而是推动社会、行业与国家的真实GDP的增长。”