DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM
创始人
2025-02-26 10:19:02

鞭牛士 2月26日消息,DeepSeek公布开源周第三天的开源项目——DeepGEMM。

据介绍,DeepGEMM是一个支持密集型和混合专家(MoE)通用矩阵乘法(GEMM)运算的 FP8 通用矩阵乘法库,它为V3/R1模型的训练和推理提供支持。

DeepGEMM在英伟达Hopper系列GPU上可实现高达1350以上的FP8每秒万亿次浮点运算(TFLOPS);完全即时编译;核心逻辑代码约300行——但在大多数矩阵规模下,其性能超过了经过专家优化调整的内核;支持密集型布局以及两种混合专家(MoE)布局。

相关内容

热门资讯

志高机械:6月29日获融资买入... 6月29日,志高机械跌1.94%,成交额707.45万元。两融数据显示,当日志高机械获融资买入额48...
奥美森:6月29日获融资买入5... 6月29日,奥美森涨1.27%,成交额942.69万元。两融数据显示,当日奥美森获融资买入额53.5...
森麒麟:摩洛哥工厂未满产却要在... 投资者提问:董秘你好,本公司摩洛哥工厂还没满产 就要在欧洲快速建厂处于什么原因?董秘回答(森麒麟SZ...
南特科技:6月29日获融资买入... 6月29日,南特科技涨2.89%,成交额2748.04万元。两融数据显示,当日南特科技获融资买入额9...
美德乐:6月29日获融资买入6... 6月29日,美德乐跌1.83%,成交额2194.00万元。两融数据显示,当日美德乐获融资买入额68....