三套万卡集群同时上线,开放架构正在重塑中国算力版图
创始人
2026-02-05 22:28:41

在全球AI大模型和科学智能加速演进的当下,算力基础设施正从幕后走向决定竞争格局的台前。而中国在这一轮超大规模算力集群的升级中,正通过万卡级超集群的集中落地,完成从“补短板”到“建体系”的关键跨越。这之中,通过国家超算互联网与国产万卡集群部署中的scaleX三套万卡超集群的同时上线,

2月5日,中科曙光提供的3套scaleX万卡超集群在国家超算互联网核心节点同时上线试运行,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池。从中我们不难看到,基于开放架构与打造系统工程化能力,正在成为国产算力快速成型、规模复制、产业共振的底层逻辑。

从千卡到万卡,中国超节点与超集群建设进入新阶段

回顾中国智算基础设施的发展历程,我们可以清晰看到一个由浅入深的演进轨迹。

在最初阶段,产业的核心目标是补齐“有没有”的短板。在该阶段中彼时,围绕高性能计算超算中心和人工智能计算智算中心建设,大量以千卡规模为主的集群在各地落地,为科研和部分行业应用提供了基础支撑。而这一阶段的重点是解决算力供给不足的问题。

此后,随着大模型技术的快速突破,这一逻辑开始发生变化。具体表现为模型参数规模呈指数级增长,训练过程需要的并行度不断提高,算力需求从“可选项”变成“刚需项”。与此同时,越来越多的行业开始探索大模型应用落地,算力不再只服务于少数科研机构,而是面向更广泛的产业用户。

正是在这一背景下,此前单纯增加服务器数量的方式逐渐显露出局限性,例如规模越大,系统复杂度越高;节点越多,通信瓶颈越突出;集群越大,运维和调度难度越高。基于此,超节点和万卡级超集群成为新的发展方向。

放眼全球,美国国家实验室体系、头部科技公司自建AI集群,均在向这一方向演进。其共性是围绕高速互联网络、统一调度体系和高效能耗控制,构建能够支撑数万千乃至数十万加速卡器协同工作的计算系统。而具体到中国,在这一赛道也呈加速追赶赶超之势,并集中体现在全国一体化算力网络和国家超算互联网的推进,而国家超算互联网核心节点正是承担全国算力资源汇聚、调度和服务枢纽的角色。

正是在这样的定位之下,3套scaleX万卡超集群同时上线试运行的意义,由中科曙光提供的三套scaleX万卡超集群系统于2月5日在国家超算互联网郑州核心节点同时上线试运行,成为全国首个实现3万卡级国产AI算力实际部署并投入运营的算力平台,其意义已不再停留于“规模领先”层面,而更多体现为一是种系统工程化能力是否成熟与否的验证。换言之,这并非一次单点项目的成功,而是中国能否是否具备持续建设、稳定运行并可复制超大规模扩展万卡级智算系统能力的一次集中检验。

而从结果看,三套万卡超集群能够在国家级算力平台上实现同步建设、同步上线、同步对外提供服务,表明国产超大规模算力基础设施正在完成从“示范工程”向“产业一线生产级系统”的跨越。其背后所体现的,是国产算力体系开始具备平台化供给能力,即算力不再以项目为单位交付,而是以持续服务能力的形态融入国家算力网络体系之中。

scaleX率先落地三套万卡,从系统级能力工程到开放体系的积淀与演进

众所周知,建设和部署万卡超集群是一场对系统极限的挑战,而在众多算力方案中,scaleX之所以能率先实现三套万卡超集群同步落地,并成为国家级算力枢纽平台的核心支撑底座,并非源于单一指标的“偏科领先”,而是长期围绕系统工程级能力+开放架构能力的积淀与演进。

以物理形态与能效层面的极致压缩为例,scaleX万卡超集群以640卡超节点为基础,首创凭借单机柜集成640张AI加速卡的高密度单柜方案,通过超高密度刀片设计配合浸没相变液冷,将单机柜算力密度提升到传统模式的约20倍,PUE压低至接近1.04的高效水平,使万卡规模在机房空间与电力成本上真正可落地、可持续。具体到郑州核心节点,scaleX万卡超集群以高密度超节点为基础,通过高速互联网络构建单套万卡级AI计算系统,三套系统叠加形成超3万卡规模的国产AI算力池,全面覆盖万亿参数模型训练、高通量推理以及AI for Science等大规模计算场景,并已进入实际运营阶段。

又如在高速互联网络对大规模协同效率保障方面,面向在万亿参数大模型训练和大规模并行推理场景下,决定整体效率上限的,往往并非单卡峰值算力,而是节点之间的通信效率与稳定性。对此,业内普遍的共识是,当集群规模跨越万卡门槛后,网络延迟与带宽利用率将成为制约训练效率的首要瓶颈。

基于此,scaleX成功在架构层面选择以原生RDMA高速网络作为核心互联方式,并结合国产400G网络设备,构建起高带宽、低时延、可扩展的集群互联体系,使万卡规模下的通信效率能够保持在可控区间。更重要的是,这一网络体系在设计之初即面向十万卡、百万卡级扩展预留空间,避免在规模继续放大时出现“推倒重来”的架构瓶颈。而这种前置式系统工程设计,是万卡集群能够从一次性工程走向长期演进平台进入国家级核心枢纽的关键前提。

最后是在“存、算、传”全链路紧耦合优化对系统效率的拉升方面,鉴于当下大模型训练并非单点算力之争,而是存储带宽、计算性能和数据传输能力的“系统平衡”,scaleX通过从芯片级、系统级到应用级的多级数据传输协同设计,构建起“存、算、传”紧耦合的架构,使万卡并发读写时仍能满足极致带宽需求。

在实际应用中,scaleX万卡超集群已支持万亿参数模型整机训练与容错恢复;在高通量推理场景,持续服务多家头部互联网企业的核心智能化业务,并通过联合深度优化不断提升推理效能;在AI for Science领域,支撑国内某材料研发大模型登顶国际权威榜单,助力某顶级科研团队将蛋白质研究效率提升3—6个数量级。

此外,从更深的层面看,scaleX率先落地的背后,是从高性能计算到智能计算的路径迁移,即企业在传统超级计算机领域积累的大规模系统设计、集群管理、可靠性保障经验,被系统性迁移到AI场景,通过数字孪生、智能运维和智能调度,实现对万级节点、十万级用户的精细化管理和每秒万级作业的调度能力,使集群长期可用性达到或接近“电力级”的稳定水平。具体到国家超算互联网郑州核心节点,其需要的不是“实验室样机”,是可7×24稳定输出算力服务的基础设施,而scaleX在这方面的工程成熟度,是其能获得三套万卡超集群订单并完成同步上线获得国家级算力枢纽认可的关键差异化所在。

值得一提的是,在架构原则上,scaleX基于AI计算开放架构设计,可兼容CUDA等主流软件生态,支持多品牌国产AI加速卡混合部署,并已针对大量主流大模型、世界模型完成适配优化,为国家级平台在模型选择与芯片路线选择上保留了更高灵活度。

开放架构放大产业合力,国产算力走向规模化应用的关键

如果说万卡级集群在表层呈现的是算力规模的跃迁,那么真正决定中国算力产业未来走向的是“其背后开放架构+协同生态”所释放的产业激活能力和协同增效能力。而在这一点上,三套scaleX三套万卡超集群的同步落地,实际上可被视为中国算力产业从追赶式发展迈向体系化构建的一个分水岭,并通过技术组织、产业供给方式和应用创新效率等方面得以体现。

例如从技术组织方式看,开放架构首先打破了“算力孤岛”。众所周知,过去不同芯片厂商、系统厂商和应用开发者各自封闭演进,导致国产算力生态呈现碎片化格局,适配成本高、重复建设多,严重制约了大规模集群的成型速度。

相比之下,AI计算开放架构通过分层解耦和统一接口,将芯片、系统、框架和应用拆解到各自最适合发力的层次,比如芯片厂商专注算力与能效;系统厂商专注集群架构与网络设计;软件与应用厂商专注算法与场景创新。而scaleX万卡超集群支持多品牌加速卡和主流计算生态的能力,本质上体现的就是这一分层协同的开放逻辑。

至于产业供给方式,开放架构正在把算力,从资本密集型资产加速转化为普惠型服务。具体表现为,依托国家超算互联网,郑州核心节点的三套scaleX万卡集群以算力服务的方式面向社会开放,面向大模型训练、高通量推理、AI for Science、金融风控、地质能源勘探等多元场景提供普惠算力。这对中小企业,意味着其不再需要自建昂贵的集群即可获得万卡级算力资源;对科研机构,则可以按需调用高性能算力,而不必承担长期的硬件折旧压力。正所谓算力使用成本在技术进步和生态协同作用下被“踝斩”,其才真正具备了类似水电气的基础设施属性。

最后从应用创新效率方面看,开放架构带来的协同增效已经在郑州核心节点体现为可量化的收益逐步显现。例如依托scaleX万卡超集群,已完成400多个主流大模型与世界模型的适配优化,并通过国家超算互联网可接入上千款应用,实现“算力+应用”一体化交付,应用开发效率实现倍数级大幅提升,算力使用成本显著下降,创新迭代周期持续缩短。

更值得关注的是,当我们站在更高的维度,3三套万卡超集群同步落地的意义,不仅在于一次性把中国国产AI算力规模推到新的高度,更是用工程化可复制的方式,为未来十万卡、百万卡级超集群奠定了技术和生态范式。

写在最后:综上,我们认为,3套scaleX三套万卡超集群的同步落地,不仅是一次中国国产算力在规模和工程化能力上的集中展示,更是开放架构在产业层面产业激活和协同增效能力的样本,标志着中国算力竞赛已经从单点技术追赶转向系统能力与生态能力的综合比拼,也预示着在开放架构与国家级算力网络的双重牵引下,中国将有望在十万卡、百万卡级超集群时代,把算力真正建设成支撑大模型、科学智能和千行百业智能化升级的国家级数字底座。

相关内容

热门资讯

食品机械与管理专业就业前景,就... 食品机械与管理专业就业方向与就业前景分析我们对于相关企事业单位对食品质量与安全专业人才的知识结构和能...
食品生物技术专业就业前景,就业... 食品生物技术专业就业方向与就业前景分析食品生物技术专业学生主要学习化学基础、微生物学基础、食品工程原...
食品加工及管理专业就业前景,就... 食品加工及管理专业就业方向与就业前景分析根据现代食品企业的特点和现代化食品加工厂对一线技术工作的技能...
发酵技术专业就业前景,就业方向... 发酵技术专业就业方向与就业前景分析发酵技术是一级学科轻工技术与工程专业下的二级学科。发酵技术专业是我...
印刷图文信息处理专业就业前景,... 印刷图文信息处理专业就业方向与就业前景分析印刷图文信息处理专业学生主要学习电脑排版技术、图象处理、图...