DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM
创始人
2025-02-26 10:19:02

鞭牛士 2月26日消息,DeepSeek公布开源周第三天的开源项目——DeepGEMM。

据介绍,DeepGEMM是一个支持密集型和混合专家(MoE)通用矩阵乘法(GEMM)运算的 FP8 通用矩阵乘法库,它为V3/R1模型的训练和推理提供支持。

DeepGEMM在英伟达Hopper系列GPU上可实现高达1350以上的FP8每秒万亿次浮点运算(TFLOPS);完全即时编译;核心逻辑代码约300行——但在大多数矩阵规模下,其性能超过了经过专家优化调整的内核;支持密集型布局以及两种混合专家(MoE)布局。

相关内容

热门资讯

中山红色预警生效! 转自:中山发布今天是元旦假期最后一天中山市气象台2026年1月3日9时37分将全市森林火险预警信号升...
某医院护士带男朋友进医院配药室... 新京报讯 据青岛市卫生健康委员会消息,针对网传“青岛某医院护士带男朋友进医院配药室”事宜,我委第一时...
上新!娄底舰来了! 人民海军又一艘052D型导弹驱逐舰亮相!娄底舰,舷号176作为我国052D型导弹驱逐舰家族的“新成员...
华为申请多模态图文数据组构建方... 国家知识产权局信息显示,深圳华为云计算技术有限公司申请一项名为“一种多模态图文数据组的构建方法及数据...
很多人突然收到短信!能退费了?... (来源:鞍山云客户端)12315不就是消费者投诉 【下载黑猫投诉客户端】举报热线吗?这“官方”的公告...