国君计算机|DeepSeek开源技术提高硬件利用率
创始人
2025-03-03 22:06:14

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

投资建议:DeepSeek连续开源的FlashMLA和DeepEP技术显著提升了现有GPU利用效率,降低了AI应用开发和部署成本。技术开源将使提供GPU云服务的厂商将直接受益,其服务器利用率和单位算力产出有望提升;专注于AI应用开发的公司也将受益于开发成本降低和应用场景拓展;同时,国产大模型厂商有机会借鉴这些优化思路,加速自身技术迭代,缩小与国际领先水平的差距。

FlashMLA和DeepEP展现了对硬件资源的极致利用。FlashMLA针对Hopper架构深度优化,在H800 SXM5实现3000 GB/s内存带宽和580 TFLOPS计算能力。DeepEP则是为混合专家模型(MoE)和专家并行(EP)设计的通信库,支持高吞吐量且低延迟的all-to-all GPU内核。软件优先的思路在高端AI芯片供应受限环境下尤为重要,通过算法和软件优化提升现有硬件效能,为国内AI基础设施建设提供了可行的替代路径,展示了资源约束下实现技术突破的可能性。

AI应用开发门槛降低,高效训练和推理能力不再是大型机构的专利。FlashMLA优化解码阶段内核,专门针对可变长度序列进行了优化,直指大模型处理长序列效率低下的核心痛点。DeepEP则提供了针对非对称域带宽转发的优化内核,并创新性地提出hook-based通信-计算重叠方法,不占用任何SM资源,让GPU在传输数据的同时能继续计算。这些技术使开发者能够在有限计算资源上构建更高效的AI系统,大幅降低了AI应用开发的技术和资源门槛。

开源策略体现了真正的技术共享精神,打破技术被少数机构垄断的局面。DeepSeek将新技术完全开源,源代码在GitHub上公开,任何开发者都可自由使用和改进,打破了前沿技术被大型科技公司垄断的局面,为整个行业注入新活力,也为行业建立了更健康的技术共享机制,促进知识自由流动和技术迭代,因此产业变革有望加速。

风险提示:技术迭代不及硬件迭代速度、技术路线对其他GPU架构适配情况尚不明确,以及商业落地不及预期的风险。

 文章来源 

本文摘自:2025年3月3日发布的《DeepSeek开源技术提高硬件利用率》

李博伦,资格证书编号:S0880520020004

伍   巍,资格证书编号:S0880123070157

钟明翰,资格证书编号:S0880124070047

更多国君研究和服务

亦可联系对口销售获取

相关内容

热门资讯

揭秘:郭嘉临死前真的预言了司马... 今天趣历史小编就给大家带来郭嘉的故事,希望能对大家有所帮助。郭嘉此人,独具慧眼,拥有远见。郭嘉早期并...
多尔衮拥戴顺治当上皇帝,为什么... 今天趣历史小编就给大家带来顺治的故事,希望能对大家有所帮助。在历史上,权臣与皇帝的关系往往十分紧张,...
他是武则天的力助手,因野心太大... 很多人都不了解来俊臣,接下来跟着趣历史小编一起欣赏。武则天在寺庙里被李治接回宫中后,其实武则天也是一...
如果徐惠没有早逝,武则天还能称... 很多人都不了解徐惠,接下来跟着趣历史小编一起欣赏。在真正的历史上,这个徐慧真名叫做徐惠,是南北朝时期...
蒙古与明朝决战,30万蒙古军队... 公元1368年,朱元璋在南京正式称帝,成立了大明王朝。而正在这个时候,明朝的大将军徐达正率领着明军精...