DeepSeek开源第三弹:开源FP8通用矩阵乘法库DeepGEMM
创始人
2025-02-26 10:19:02
0

鞭牛士 2月26日消息,DeepSeek公布开源周第三天的开源项目——DeepGEMM。

据介绍,DeepGEMM是一个支持密集型和混合专家(MoE)通用矩阵乘法(GEMM)运算的 FP8 通用矩阵乘法库,它为V3/R1模型的训练和推理提供支持。

DeepGEMM在英伟达Hopper系列GPU上可实现高达1350以上的FP8每秒万亿次浮点运算(TFLOPS);完全即时编译;核心逻辑代码约300行——但在大多数矩阵规模下,其性能超过了经过专家优化调整的内核;支持密集型布局以及两种混合专家(MoE)布局。

相关内容

热门资讯

全球最快高铁列车CR450,惊... 日前,第十二届世界高速铁路大会在北京举办。在本届大会上,最吸引眼球的就是“复兴号”家族的新车型CR4...
微信又上新功能!网友:太有趣了 左右滑动查看安卓用户还能通过这里进入:二:好看的点赞看双击屏幕,点赞更自由。以前:精准找到右下角的小...
受降雨影响 广东、黑龙江等地1... 转自:央视新闻客户端记者从水利部了解到,7月11日8时至12日8时,受降雨影响,广东东江支流古竹水、...
跨境网购成香港市民消费新常态 来源:人民网-人民日报海外版 工作人员在香港一快递包裹自提点忙碌。今年“618”期间,内地电商平台在...
云南愿与泰国加深合作 共庆中泰... 中新网昆明7月12日电 (陈静)由云南省人民政府外事办公室、云南省人民对外友好协会、泰王国驻昆明总领...