DeepSeek“开源周”启动
创始人
2025-02-24 14:17:10

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。

上证报中国证券网讯(记者 谭镕)2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。

DeepSeek称,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000GB/s的内存带宽以及580TFLOPS的计算性能。”DeepSeek表示。

据介绍,MLA(Multi-Layer Attention,多层注意力机制)是一种改进的注意力机制,旨在提高Transformer模型在处理长序列时的效率和性能‌。MLA通过多个头(head)的并行计算,让模型能够同时关注文本中不同位置和不同语义层面的信息,从而更全面、更深入地捕捉长距离依赖关系和复杂语义结构‌。

相关内容

热门资讯

志高机械:6月29日获融资买入... 6月29日,志高机械跌1.94%,成交额707.45万元。两融数据显示,当日志高机械获融资买入额48...
奥美森:6月29日获融资买入5... 6月29日,奥美森涨1.27%,成交额942.69万元。两融数据显示,当日奥美森获融资买入额53.5...
森麒麟:摩洛哥工厂未满产却要在... 投资者提问:董秘你好,本公司摩洛哥工厂还没满产 就要在欧洲快速建厂处于什么原因?董秘回答(森麒麟SZ...
南特科技:6月29日获融资买入... 6月29日,南特科技涨2.89%,成交额2748.04万元。两融数据显示,当日南特科技获融资买入额9...
美德乐:6月29日获融资买入6... 6月29日,美德乐跌1.83%,成交额2194.00万元。两融数据显示,当日美德乐获融资买入额68....