DeepSeek-R1模型升级 推理能力显著提升
创始人
2025-06-05 10:42:59
0

  本报讯 5月29日,深度求索(DeepSeek)宣布完成旗下核心模型DeepSeek-R1的小版本升级,最新版本为DeepSeek-R1-0528(以下简称“R1升级版”)。用户可通过官方网站、APP或小程序进入对话界面,开启“深度思考”功能体验新版本,同时API接口已同步更新,调用方式保持不变。

  据DeepSeek开发团队介绍,R1升级版模型基于2024年12月发布的DeepSeek V3Base模型,通过加大后训练阶段的算力投入,重点强化了模型的思维深度与推理能力。升级后的模型在数学、编程、通用逻辑等关键领域的基准测评中表现亮眼,整体性能已接近o3和Gemini-2.5-Pro,成为当前国内推理能力领先的AI模型之一。

  在复杂推理任务中,R1升级版的进步尤为显著。以数学领域权威测试集AIME 2025为例,旧版模型准确率为70%,新版提升至87.5%。这一提升源于模型思维链的深度优化:旧版平均每题消耗12K tokens,新版则增至23K tokens,表明其在解题过程中进行了更详尽的逻辑推导和多步验证,显著减少了跳跃性思维导致的错误。

  此外,DeepSeek开发团队通过蒸馏R1升级版的思维链后训练Qwen3-8B Base,进一步训练出轻量级模型DeepSeek-R1-0528-Qwen3-8B。该模型在AIME 2024测试中表现优异,准确率仅次于原版R1模型,超越同参数规模的Qwen3-8B模型10%,并与百亿参数级的Qwen3-235B模型相当。这一成果为学术界的推理模型研究和工业界的小模型开发提供了重要参考,证明了通过思维链蒸馏提升小模型性能的可行性。

  除推理能力外,R1升级版在幻觉控制和创意写作领域也实现了关键突破。针对AI模型常见的“幻觉”问题,新版模型在改写润色、总结摘要、阅读理解等场景中,幻觉率较旧版降低45%~50%,输出内容的准确性和可靠性大幅提升,尤其适合对事实严谨性要求高的办公、教育等场景。R1升级版对议论文、小说、散文等文体进行了专项优化,可生成篇幅更长、结构更完整的长篇作品。例如,在模拟创作任务中,新版模型输出的小说段落平均字数较旧版增加30%,且情节连贯性、人物刻画细腻度更贴近人类写作偏好,展现出更强的内容生成能力。

  R1升级版标志着国产大模型在推理能力上的快速进步。其思维链蒸馏技术为小模型性能提升提供了新路径,有望降低企业在特定场景下的AI部署成本。同时,模型在多领域的均衡表现,也为智能办公、教育辅导、代码开发等落地场景提供了更可靠的技术支撑。开发团队表示,未来将持续投入算力与数据优化模型能力,推动国产大模型在通用智能领域的探索。 (潇栋)

相关内容

热门资讯

美团无人机香港首条常态化航线开... 转自:北京日报客户端美团无人机6日宣布,在香港低空经济监管沙盒框架下,公司首条常态化航线正式投入运营...
普邦股份选举樊瑞兰为职工代表董... 普邦股份(002663)发布公告,公司于2025年6月6日召开职工大会,选举樊瑞兰为公司职工代表董事...
北证专精特新指数将于6月30日... 6月6日,北京证券交易所和中证指数有限公司发布公告,将于2025年6月30日正式发布北证专精特新指数...
辽源公安多措并举为高考提供服务... 为给广大高考考生营造安全、有序、和谐的考试环境,辽源市公安局精心部署、积极行动,采取一系列有力举措,...
完整版 | 余永定:投资驱动还... 转自:中国金融四十人论坛“➤在讨论“投资驱动”还是“消费驱动”的选择时,首先要明确我们所讨论的是长期...
港股公告精选|广汽集团5月销量... 转自:财联社财联社6月6日讯(编辑 冯轶)财联社为您带来今日港股重要公告1)公司要闻广汽集团(022...
首开股份:两个银行账户资金被冻... 观点网讯:6月6日,北京首都开发股份有限公司发布公告,披露公司银行账户部分资金被冻结的情况。首开股份...
全国首批,武汉入选 转自:武汉发布6月5日,商务部等5部门发布《关于公布第一批全国零售业创新提升试点城市名单的通知》。根...
湖北广电:中信国安拟减持不超1... 湖北广电6月7日发布公告,持股5%以上股东中信国安信息产业股份有限公司计划减持公司股份。截至公告披露...
“驱逐+没收”!班农“献计”,... 【文/观察者网 邵昀】 美国总统特朗普和昔日盟友马斯克之间的“口水战”愈演愈烈,当地时间5日,特朗普...
中国石油全资子公司新增一项43... (转自:快查一企业中标了)快查APP显示,中国石油相关公司蓝海新材料(通州湾)有限责任公司于2025...
【环球财经】南共体官员:应重新... 转自:新华社新华财经哈拉雷6月6日电(记者 许正)南部非洲发展共同体(南共体)执行秘书埃利亚斯·马戈...
新股消息 | 晶澳科技(002... 6月6日,中国证监会公布境外发行上市备案补充材料要求(2025年5月30日至2025年6月5日),其...
全国学生资助管理中心发布预警:... 转自:千龙网据教育部新闻办微信公众号,近日,全国学生资助管理中心发布2025年第2号预警,提醒广大学...
调研速递|国义招标接受银河证券... 6月5日,国义招标股份有限公司接待了银河证券、深圳纽富斯投资管理有限公司等24家机构及个人投资者的调...
重庆武隆开展环保宣传进企业、进... 转自:中国环境网为更广泛动员社会公众参与生态文明建设、践行绿色生产生活方式,重庆市武隆区生态环境局近...
南博会前瞻——“旅居云南”馆开... 原标题:南博会前瞻——“旅居云南”馆开启深度之旅作为本届南博会新增的场馆之一,“旅居云南”馆总展览面...
中国银行在香港举办“2025年... 新华财经香港6月6日电(记者李柏涛)6日,中国银行在香港举办“2025年人民币国际化论坛”,来自政府...
【环球财经】下游叫苦 钱包“失... 新华财经北京6月6日电(记者 闫洁)美国白宫日前宣布将进口自除英国外所有贸易对象的钢铝产品关税从目前...
演员叶以萌被曝凌晨逝世!曾在西... 转自:扬子晚报6月6日,据博主《1982西游记》爆料,演员叶以萌于6月4日凌晨2点38分因病医治无效...