转自:中国移动通信集团有限公司
随着新一轮科技革命与产业变革的深入推进,人工智能已从赋能千行百业提质增效的辅助工具,跃升为全面使能经济社会转型发展的核心能力,智算中心作为新型信息基础设施,是“AI+”战略转型与数字经济发展的重要底座。中国移动作为中央企业,认真履行“三大责任”,积极发挥“三个作用”,依托战新百大工程,将国家算力基础设施高质量发展行动计划与AI+行动要求做深做实。
2024年,中国移动勇担智算中心建设的“开拓者”、AI+战略转型的第一批“践行者”、行业智算技术方案的“引领者”,秉持“公共普惠、创新领先、绿色低碳、自主可控”的原则,启动了超大规模国产化智算中心项目建设。在项目推进过程中,中国移动以“科技攻关、产业带动、价值贡献”为指引,聚焦工程建设与技术创新双轨道同步发力,为全球AI产业发展注入了新活力。
夯实智算资源底座,铸就全球卓越算力
中国移动在呼和浩特和哈尔滨高效率建成了两个全球运营商“最大”智算中心。其中,全球运营商最大单体智算中心(呼和浩特节点),智能算力规模达1.9万卡,采用了业界先进的计算、存储和网络架构,并首次实现了异构算力、GPU池化、扣卡模组、冷板式液冷等先进技术,成功入选“2023年度央企十大超级工程”。全球运营商最大单集群智算中心(哈尔滨节点),单集群超过1.8万张AI加速卡,规模应用智算服务器互联的高性能无损网络、全调度以太网以及融合分级存储等多项创新技术,搭载移动云智算平台和智管平台,超长稳训(千卡稳训25天、万卡稳训14天)、断点续训(千卡任务恢复时间30分钟)、异构混训(百卡级)能力业界领先,支撑完成“九天”万亿大模型以及头部行业客户千亿模型训练。这两个智算中心的建成,标志着我国国产芯片商用部署达到了新的水平,进一步缩小了与国际先进水平的差距。
强化技术创新引领,突破智算关键瓶颈
在构建超万卡智算集群方面,中国移动主导提出“机间互联”GSE全调度以太网技术和标准体系,对标国际主流的IB和UEC方案,解决超大规模智算集群服务器之间高效组网的难题;主导提出“卡间互联”OISA全向智感互联技术及标准体系,建立OISA协同创新平台,有效提升国产GPU卡间互联带宽及规模;自研智算平台,具备万卡并行训练、断点自动续训、算存网一站式调度等能力,确保AI大模型训得好、训得快、训得稳。自研“芯合”异构混训系统,构建了跨架构混合训练平台原型系统,打通了生态竖井。这些“系统级”技术创新思路与成果有效弥补了我国单点技术不足,通过产业合作将极大地推动国内智算产业整体升级。
推动产业联合创新,提升全球竞争实力
人工智能已成为国家战略的重要组成部分,中国移动建设的超大规模智算中心工程有助于形成国家人工智能重大科学装置,加速人工智能领域技术突破,带动产业联合创新。对标国际大模型演进趋势及国际AI科技巨头十万卡超级集群建设,中国移动勇当“AI+”新时代的“基础设施提供者、场景应用汇聚者、技术算法驱动者、智能生态构建者”,将大力推进智能算力布局建设和人工智能领域技术创新,积极投入十万卡超级智算集群技术研究,与行业合作伙伴加强基础设施共建、自主可控技术共创、创新研发能力共享,促进智算领域自主技术成熟升级,推进智算自主可控产品迭代应用,发挥中国移动产业链“链长”融通带动作用,推动国产智算产业链成熟,进一步提升我国在全球AI产业中的科技竞争实力。
面向“AI+时代”,中国移动将继续肩负起推动AI普惠发展、创新突破的重要使命,大力实施“AI+”行动计划,为我国人工智能产业的发展持续提供强大的算力支撑,也为全球AI技术的进步贡献出更多中国智慧和中国方案。
【责任编辑:张任田慧】