原创 “福特汽车时刻”降临:AI工厂引领基础设施新范式
创始人
2025-07-29 09:44:09
0

大洋彼岸,《AI行动计划》横空出世,传递出大力发展AI基建、产业效率优先的强烈信号;黄浦江畔,世界人工智能大会(WAIC 2025)隆重举办,新一代国产人工智能基础设施建设成为核心议题。

这不是简单的时点巧合,而是人工智能革命迈向规模化、系统化新阶段的重要标志。从某种意义上讲,此刻堪比当年福特汽车工厂迅猛崛起的“决定性瞬间”,一场由技术突围到规模化生产的关键跨越即将达成。

在福特汽车工厂诞生前,工业革命主要聚焦于蒸汽机、纺织机等单一机器的效率提升,而“福特制”首次将生产视为整体系统,通过流水线整合标准化零件、专用机床与能源网络,实现人、机、物料、工序的精准协同。管理学大师彼得·德鲁克认为,福特制开创了新的范式,即以系统思维重塑现代化生产体系。

当下,人工智能革命也恰好处于“第二次飞跃”的起点。伴随生成式AI的加速渗透,大模型更新迭代的周期越来越短,多模态演化的趋势愈发显著,千行万业拥抱AI应用的热情颇为高涨,这对建设新一代AI基础设施提出了迫切需求。单点的技术突破显然已无法适应AGI如飞的脚步,系统级创新才能构建最坚实强劲的“跳板”。

令人欣喜的是,在世界人工智能大会(WAIC 2025)期间,摩尔线程开创性地提出“AI工厂”理念,致力于通过系统级工程创新,打造生产先进模型的“超级工厂”——从底层芯片架构创新到集群整体架构优化,再到软件算法调优和资源调度系统升级,以全方位蜕变的计算基础设施,推动AI训练和推理迈向更高境界。

摩尔线程创始人兼CEO张建中

摩尔线程创始人兼CEO张建中认为,“AI工厂”的产能由五大要素共同决定,其公式可概括为“AI工厂生产效率=加速计算通用性×单芯片有效算力×单节点效率×集群效率×集群稳定性”。这个公式与“福特制”倡导的系统性变革范式不谋而合。作为国内全功能GPU的翘楚,摩尔线程能否上演率先垂范的戏码,让新型的AI工厂扮演类似福特汽车工厂的角色,成为驱动人工智能惠及天下的核心基石?

以全功能GPU与自研MUSA架构打造“AI工厂”坚实底座

在构建“AI工厂”的宏伟蓝图中,GPU无疑是算力核心,倘若缺乏性能优异的算力芯片,整个AI工厂的顺畅运行就无从谈起。不过,目前市面上的GPU技术路线各异,若只提供功能单一的计算能力,则无法承担重任。

纵观GPU的演进轨迹,会发现从上世纪90年代至今,GPU经历了图形加速与处理、深度学习和AI早期探索、感知AI爆发及生成式AI浪潮等多个发展阶段,始终是算力进化的最佳引擎,其价值绝非仅是在单一功能或特定场景与AI进行“适配”。

不难看出,计算功能的完备性与精度完整性是GPU施展拳脚的必要条件。摩尔线程深谙此道,以自主研发的全功能GPU为核心构建通用性底座。基于MUSA架构的突破性设计,其GPU单芯片即可集成AI计算加速、图形渲染、物理仿真及超高清视频编解码等能力,满足AI训推、具身智能、AIGC、科学计算等应用场景的多元化需求。

如果说“功能完备”是GPU开疆扩土的利器,那么更完整的计算精度则是其提升效率的法宝。摩尔线程支持从FP64至INT8的全精度谱系,并借助FP8混合精度技术,在主流前沿大模型训练中达成20%~30%的效能跃升,树立起国产GPU算力效率的新标杆。通用性底座与精度变革双剑合璧,可为世界模型和新兴AI架构的演化提供前瞻性支撑,促进人工智能落地生根。

为了进一步增强AI工厂高效运转的能力,多管齐下改善芯片的有效算力至关重要。摩尔线程采用多引擎、可伸缩GPU架构,通过硬件资源池化及动态资源调度技术,构建全局共享的计算、内存与通信资源池。这种开创先河的设计思路在保障通用性的同时大幅提升资源利用率,而可伸缩架构更能针对不同市场需求快速调整芯片配置,显著降低新品的开发成本。

在计算层面,摩尔线程FP8技术通过快速格式转换、动态范围智能适配和高精度累加器等创新设计,使Transformer计算性能提升约30%;在内存系统层面,借助多精度近存规约引擎、低延迟Scale-Up、通算并行资源隔离等技术,实现50%的带宽节省和60%的延迟降低;在通信和互联层面,独创的ACE异步通信引擎减少15%的计算资源损耗,MTLink2.0互联技术提供高出业界平均水平60%的带宽,为大规模集群部署奠定根基。

以软硬协同和系统级创新探索崭新路径

詹姆斯·沃麦克在其著作《流水线:一部关于新工业革命的诗篇》中指出,福特模式不只是“造车更快”,而是通过“流水线+供应链+管理”的系统级重组实现规模效率的质变。从AI工厂的视角来看,单个GPU的进化亦不足以达成智能时代的远大目标,唯有依循软硬协同与系统级创新路径,才能完成从单节点到大规模集群的跃迁。

这条道路挑战重重,摩尔线程选择迎难而上,以MUSA全栈系统软件为核心突破口,不断提升单节点计算效率,持续释放KUAE集群潜能,推动AI工厂迈上更高台阶。

据摩尔线程GPU计算软件开发总监吴庆透露,MUSA全栈系统软件主要从三个维度擢升KUAE集群的核心竞争力:一是构建高效的计算驱动和运行时库,借助深度优化的软硬件任务调动性能,促使用户的Kernel launch开销大幅缩减;二是算子库不仅追求极致性能,还顾及覆盖广度和兼容性,性能突出的muDNN、更易用的MUTLASS以及MUSA AI Tensor Engine开源推理算子库能满足不同类型需求;三是基于高性能集合通信库及通算并行,避免抢占计算核心资源,在集群环境实现多重目标。

显而易见,全栈系统软件对集群运行能力的提升发挥着举足轻重的作用,而随着大模型训练和推理的全面爆发,打造适应多场景的混合精度训推方案,也日益成为国产GPU集群的“基本修养”。摩尔线程副总裁王华认为,在大模型训练中识别出对精度要求不高的操作,将其替换为以FP8为代表的低精度计算渐成业界共识。摩尔线程能提供包括FP8在内的全精度算力,构建支持多种不同数据类型的混合精度训练方案,可以满足大规模智能生产的更高要求。

尤值一提的是,虽然能力增强与效率优先是AI工厂引领基础设施变革的核心抓手,但集群的稳定性与可靠性同样不容忽视,各种故障导致的生产中断会造成巨大损失。正是在这样的背景下,摩尔线程的零中断容错技术应运而生,故障发生时仅隔离受影响节点组,其余节点继续训练,备机无缝接入,使KUAE集群有效训练时间占比超99%;同时,基于多维度训练洞察体系实现动态监测与智能诊断,促进异常处理效率提升50%,为AI工厂的行稳致远保驾护航。

AI超级工厂加速人工智能全面落地进程

埃森哲最新发布的研究报告显示,53%的中国企业正在通过AI连接和融合多个流程,比全球平均水平高11个百分点。这表明AI逐步从工具属性向全场景深度部署转变,人工智能在中国市场的落地进程明显加快。

面对时钟加速转动的新局面,AI工厂既需高效训练大模型,又要具备强大的推理验证能力,进而为AGI的开花结果创造必要条件。摩尔线程通过构建覆盖LLM、视觉、生成类模型的全流程推理解决方案,实现“训练-验证-部署”的无缝衔接——MT Transformer、TensorX自研推理引擎与vLLM-MUSA推理框架协同发力,为打通“最后一公里”扫除了障碍。

在WAIC 2025现场,摩尔线程以全功能GPU为核心构建的“云边端”全栈AI产品和解决方案集中亮相,夸娥智算集群及各行业应用案例尤为吸睛。基于在专业图形渲染、大模型训推、具身智能、物理仿真、AI for Science等领域积累的雄厚实力,摩尔线程深度赋能创娱教育、智能制造、智慧医疗、智能驾驶、数字服务等纷繁场景,充分展现了AI工厂驱动产业变革的无限潜能。

站在更开阔的视角,国产GPU生态系统的完善还有很长的路要走,吸引更多开发者参与其间是必由之径。摩尔线程今年特别开设了线上与线下相结合的“摩尔学院”,并将于10月在北京举办首届MUSA开发者大会,有望驱动国产GPU新生态早日成型。有了良好生态系统的加持,中国的AI工厂必将进化为“超级物种”,在全球舞台赢得更多的话语权,赋予“世界工厂”全新的内涵。

相关内容

热门资讯

淮北矿业(集团)有限责任公司原... 转自:中安在线淮北矿业(集团)有限责任公司原党委书记、董事长王明胜涉嫌严重违纪违法,目前正接受安徽省...
上海打造“张江种谷”聚焦生物育... 新华财经上海7月29日电(记者杨有宗、张梦洁)29日,上海孙桥农业科创中心(张江种谷)开工奠基,预计...
春兴精工控股股东孙洁晓1.7亿... 春兴精工(002547)发布公告,控股股东孙洁晓持有的公司股份1.54亿股和1554万股,共计1.7...
微芯生物今日大宗交易折价成交1... 7月29日,微芯生物大宗交易成交189.94万股,成交额5812.16万元,占当日总成交额的3.75...
王东堂已任中粮集团党组副书记,... 近日,中粮集团有限公司官网“管理团队”栏目更新显示,王东堂现已担任中粮集团党组副书记。此前,王东堂长...