2025年世界电信和信息社会日智算产业创新发展专题研讨会,华为昇腾计算业务副总裁王庆文发表“共筑坚实智算底座,加速行业智能化”主题演讲,深度解读AI产业趋势、运营商算力基础设施建设与行业智能化发展路径。
当前,AI推理市场需求呈现爆发式增长。Gartner预测,未来两年80%中国企业将部署生成式AI,60%会将AI融入产品服务,标志着企业AI应用从通用场景向核心生产场景渗透的“奇点时刻”到来,企业AI部署已进入全面深化阶段。运营商凭借领先的泛在多级训推资源,既能满足中小企业的灵活需求,也能支撑大型企业核心业务及海量用户场景,并通过多租户部署技术,保障大租户资源独立、中小租户性能提升的同时全方位确保数据安全。
昇腾从基础硬件、算子到推理系统全面创新,面向不同的推理场景需求,为包含运营商在内的客户及伙伴提供集高性能、高可靠、易部署、开源开放于一体的推理解决方案。
面向大型企业、C端超级应用等需要大规模推理算力资源的场景,高并发、低时延下的吞吐性能是关键。昇腾国内首创大规模专家并行集群推理方案:通过将MoE模型的多专家权重数据分散部署到更多的卡上,降低单卡权重加载时延,让模型解码输出更快;单卡内存容量占用的降低,也能够支持更大用户并发所需的KV缓存,实现系统的更大吞吐性能,平均单卡吞吐性能提升3倍以上,大幅降低每Token推理成本,帮助运营商构筑高性能的AI算力基础设施,为行业客户带来更优的业务体验。
面向中小企业、学校和医院等机构需要快速部署、快速落地AI应用的需求,昇腾使能运营商打造大模型应用一体机。打包量化、调优等工具链显著提升50%部署效率,通过MLA(Multi-Head Latent Attention)亲和等特性,提升吞吐性能90%,从模型部署到应用上线实现“即开即用”,降低AI部署门槛,帮助运营商赋能千行万业智能化转型。目前已有超140家合作伙伴基于昇腾发布大模型应用一体机产品,为各行业场景提供广泛的智能应用。
算力正从技术要素转化为产业升级的核心驱动力。“单木不成林,众木自成春”,昇腾将致力于打造坚实的算力底座,携手运营商及ISV等产业伙伴破解算力供给与场景落地的关键挑战,加速AI在千行万业的落地应用,为产业融合升级注入强劲动能。