DeepSeek后中国AI又传重磅消息,中国AI骄傲!百度宣布点亮自研万卡集群
创始人
2025-02-06 06:50:55

据介绍,无论是硬件还是软件,国产昆仑芯万卡集群以及未来三万卡集群的建设所面临的技术挑战是全方位的。而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型训练、模型推理四大方面,能为企业提供“多、快、稳、省”的AI基础设施,在万卡集群的建设中发挥了至关重要的作用。

首先,突破硬件扩展性瓶颈,如卡间互联的拓扑限制,避免通信带宽成为瓶颈;同时,围绕芯片及集群功耗基于万卡规模常规方案功耗可达十兆瓦或更高,采用创新性散热方案,从而解决万卡集群的能效与散热问题;完善模型的分布式训练优化,采用高效并行化任务切分策略,训练主流开源模型的集群MFU提升至58%;在提升稳定性方面,提供容错与稳定性机制,避免由于单卡故障率随规模指数上升而造成的万卡集群有效性大幅下降,保障有效训练率达到98%;最后,针对机间通信带宽需求,建设超大规模HPN高性能网络,优化拓扑结构,从而降低通信瓶颈,带宽有效性达到90%以上

同时,昆仑芯作为国内自研的AI芯片,凭借其独特的技术优势,在百舸4.0的能力加持下,在生成式人工智能时代展现出了巨大的竞争力。

据专家介绍,未来一年,将是各种AI原生应用爆发的黄金时期。自研芯片和万卡集群的建成带来了强大的算力支持,同时有效提升百度和客户的资源整体利用率,降低大模型训练成本,推动了模型降本的趋势,为整个行业提供了新的思路和方向。

随着国产大模型的兴起,万卡集群已从单纯算力供给逐渐向“有效”算力供给过渡,通过模型优化、并行策略、有效训练率提升、动态资源分配等手段,智能调度任务,将训练、微调、推理任务混合部署,最大化提升集群综合利用率,降低单位算力成本,从而真正发挥算力效能。而随着本次万卡集群点亮和应用落地,相信国产昆仑芯万卡集群以及未来三万卡集群将会持续为企业提供源源不断的稳定、高效的算力动能。

相关内容

热门资讯

数说“新”变化丨生态优先、绿色... 本文转自【天山网】; 据统计,新疆森林面积达1.25亿亩,森林覆盖率为5.07%。面对这笔宝贵的绿色...
科创001|财报数据创新高,小... 深圳商报·读创客户端首席记者 陈小慧 3月24日,小米发布了2025年Q4及全年财报。财报数据显示,...
“锅底洼”如何长成“梦里水乡”... 在江苏省泰州市兴化市,有这么一座乡村,它静卧在里下河湿地腹地,坐拥独有的垛田地貌,河网交织、湖荡密布...
​左海会客厅丨“星妈”张秀丽:...   左海会客厅丨近日,“星妈”张秀丽获评2025年“感动福建”十大人物。她为一群“星星”点亮了前行的...
“速效救心丸”搜索量激增30倍... 3月25日 有电商买药平台数据显示 速效救心丸、硝酸甘油、 硝酸甘油舌下片等心脏用药品类 相...