寒武纪已适配DeepSeek-V3.2-Exp,同步开源推理引擎vLLM-MLU
创始人
2025-09-30 09:16:28

IT之家 9 月 30 日消息,DeepSeek 昨日正式发布了 DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。IT之家注意到,寒武纪当天宣布,已同步实现对深度求索公司最新模型 DeepSeek-V3.2-Exp 的适配,并开源大模型推理引擎 vLLM-MLU 源代码。

寒武纪称,一直高度重视大模型软件生态建设,支持以 DeepSeek 为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对 DeepSeek-V3.2-Exp 这一全新实验性模型架构的 day 0 适配和优化。

针对本次的 DeepSeek-V3.2-Exp 新模型架构,寒武纪通过 Triton 算子开发实现了快速适配,利用 BangC 融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。依托 DeepSeek-V3.2-Exp 带来的全新 DeepSeek Sparse Attention 机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。

vLLM-MLU DeepSeek-V3.2-Exp 适配的源码:

相关内容

热门资讯

宇树京东定制人形机器人亮相,语... 近日,在AWE2026展会上,京东与宇树科技联合打造的宇树R1蓝白色JoyInside独家定制版人形...
华林证券高层职务调整:梁仁栋转...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 中访网数据  华林证...
贵州茅台高级管理人员蒋焰被实施... 中访网数据  贵州茅台酒股份有限公司于2026年3月13日发布公告称,公司收到遵义市监察委员会通知,...
最新或2023(历届)315晚... 最新或2023(历届)3·15晚会近期启动,剧组开通投诉渠道之后,接到全国消费者的大量投诉,晚会将陆...
最新或2023(历届)315晚...   3·15晚会“虚拟观众坐席”3月14日开抢啦!你希望你的头像出现在晚会现场吗?你希望你的观点和更...