DeepSeek发布Prover-V2模型,参数量达6710亿
创始人
2025-04-30 18:58:22

  Hehson科技讯 4月30日下午消息,DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。

  据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。

  在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

相关内容

热门资讯

英国暴发超级流感疫情! 转自:中安在线据参考消息援引新加坡《联合早报》网站12月13日报道,英国卫生官员警告,英国正面临一波...
3人以拍摄教育片为名上传儿童不... 近日,我局接部分网友举报,称网站“西边的风”存在大量猥亵女童的视频。接报后,我局高度重视,迅速组织网...
最新或2023(历届)世界足球... 最新或2023(历届)世界足球先生候选大名单8月17日 国际足联官方公布了最新或2023(历届)最佳...
原创 如... 家人们谁懂啊!买红枣这事儿,简直是当代吃货的 “扫雷大赛”。 明明看着红彤彤、亮闪闪,回家一吃又酸又...
乐视网法定代表人变更为梁军 正... 孙宏斌(左)和梁军(右)乐视创始人贾跃亭正式卸任乐视网(300104)法定代表人。8月17日,乐视网...