DeepSeek开源第三弹:300行DeepGEMM代码
创始人
2025-02-26 10:49:06

三言科技 2月26日消息,DeepSeek正式启动“开源周”,将陆续开源5个代码库。前两个开源代码库分别为FlashMLA、DeepEP。

今天,DeepSeek官方推出开源第三弹:DeepGEMM。

DeepGEMM:一个支持dense和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 训练和推理提供支持。Hopper GPU 上最高可达1350+ FP8 TFLOPS。

DeepGEMM可以做到:

1、没有过多的依赖,像教程一样简洁

2、完全即时编译

3、核心逻辑约为 300 行 - 但在大多数矩阵大小上均优于专家调优的内核

4、支持dense布局和两种MoE布局

相关内容

热门资讯

“十五五”国网公司投资加码至4... ◎记者 王文嫣 1月15日中午,国家电网公司(下称“国网公司”)发布消息称,“十五五”期间,公司固定...
山西华翔集团股份有限公司关于使... 证券代码:603112 证券简称:华翔股份 公告编号:2026-003山西华翔集团股份有限公司关于...
中国南方航空股份有限公司202... 证券代码:600029 证券简称:南方航空 公告编号:临2026-002中国南方航空股份有限公司2...
中国国际航空股份有限公司202... 证券代码:601111 股票简称:中国国航 公告编号:2026-003中国国际航空股份有限公司20...
四川路桥建设集团股份有限公司2... 证券代码:600039 证券简称:四川路桥 公告编号:2026-003四川路桥建设集团股份有限公司...