榨干每一块 GPU!DeepSeek 开源第二天,送上降本增效神器
创始人
2025-02-25 15:50:35

今天 DeepSeek 带来了 DeepEP,一个专为混合专家系统(MoE)和专家并行(EP)定制的通信库。

它的设计灵感来自 DeepSeek-V3 论文里的群组限制门控算法(group-limited gating),这个算法能帮助大模型更高效地分配任务给不同的「专家」, 降本增效从未如此简单

DeepEP 的 亮点颇多:

高效优化的全员协作通道

专为训练和推理预填充设计的高吞吐核心

专为推理解码设计的低延迟核心

原生支持FP8智能压缩传输

灵活调控GPU资源,实现边计算边传输

DeepEP 在 Mixture-of-Experts (MoE) 模型的通信技术上有所突破,特别是在 GPU 内核优化方面。它显著提升 MoE 模型的性能和效率,适用于大规模 AI 训练和推理。

DeepSeek 开源周,APPSO 将持续带来最新动态和解读,

相关内容

热门资讯

志高机械:6月29日获融资买入... 6月29日,志高机械跌1.94%,成交额707.45万元。两融数据显示,当日志高机械获融资买入额48...
奥美森:6月29日获融资买入5... 6月29日,奥美森涨1.27%,成交额942.69万元。两融数据显示,当日奥美森获融资买入额53.5...
森麒麟:摩洛哥工厂未满产却要在... 投资者提问:董秘你好,本公司摩洛哥工厂还没满产 就要在欧洲快速建厂处于什么原因?董秘回答(森麒麟SZ...
南特科技:6月29日获融资买入... 6月29日,南特科技涨2.89%,成交额2748.04万元。两融数据显示,当日南特科技获融资买入额9...
美德乐:6月29日获融资买入6... 6月29日,美德乐跌1.83%,成交额2194.00万元。两融数据显示,当日美德乐获融资买入额68....