国联民生证券-传媒行业点评研究：DeepSeek R1更新，Agent生态有望加速演进-250602_热点

国联民生证券-传媒行业点评研究：DeepSeek R1更新，Agent生态有望加速演进-250602

创始人

2025-06-02 11:07:07

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

（转自：研报虎）

行业事件

　　DeepSeek于5月29日完成小版本升级，当前版本为DeepSeek-R1-0528（下称“新版R1”），官网、App及API均已同步更新。

深度思考能力提升：接近o3、Gemini-2.5-Pro

　　新版R1模型深度思考能力进一步提升：基座模型仍使用2024年12月发布的DeepSeek V3 Base，但在后训练过程中投入了更多算力，显著提升了模型的思维深度与推理能力。新版R1模型在数学、编程与通用逻辑等多个基准测评中位于国产模型领先水平，接近OpenAI o3、Gemini-2.5-Pro水平。其中在数学测试AIME2025中，新版R1准确率从旧版的70%提升至87.5%，平均每题使用的token数量从旧版的12K提升至23K，背后系模型在解题过程中进行了更为深入的思考，进而提升准确率。此外，用新版R1蒸馏后的思维链训练的Qwen3-8B表现也较为出色，在AIME 2024测试中仅次于新版R1，有望推动AI小模型的开发与应用。

文字处理能力提升：幻觉改善、写作优化

　　在文字处理及生成方面，新版R1进行持续优化：1）幻觉改善：针对“幻觉”问题进行优化，在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了45-50%，能更有效地提供更为准确、可靠的结果；2）创意写作：针对议论文、小说、散文等文体实现进一步优化，能够输出篇幅更长、结构内容更为完整的长篇作品，同时呈现出更加贴近人类偏好的写作风格。

复杂任务处理能力提升：工具调用及代码水平增强

　　据新智元、机器之心及我们一手测评，新版R1在调用工具、编写代码等类Agent功能上也实现提升。如在“构建一个词评分系统”“将小球碰撞实验可视化”“在线生成游戏、网页”等需要较强的深度理解能力、代码能力的任务中，新版R1的表现显著优于旧版，且接近OpenAI o3、Claude-4-Sonnet等海外头部推理模型水平。

投资建议：强于大市

　　我们认为：1）模型角度看，自2025年初DeepSeek R1开源、性能居于全球前列，国产AI大模型和海外差距逐步缩小。此次新版R1发布虽然仅为版本更新，但在性能跑分及实际使用中均提升显著，关注DeepSeek下一代R2模型发布节奏。2）应用角度看，2025年系AI应用落地之年，而AIAgent作为AI应用的重要落地方向，已成为全球科技巨头的共识。其中海外市场，基于底层模型推理能力提升，Anthropic Claude、OpenAIGPT等头部应用逐步从chatbot向Agent形态进化，Cursor等专业Agent商业化进程加速；国内市场，腾讯、阿里巴巴、字节跳动等互联网大厂相继布局Agent类产品，有望基于模型能力提升以及国内广大C端用户生态，孵化全民级别的AI应用。关注头部企业Agent类产品发布节奏。建议关注AI模型&应用布局较早的公司：恺英网络、昆仑万维（维权）、巨人网络、盛天网络、奥飞娱乐、上海电影、美图公司。

　　风险提示：技术发展缓慢，AI应用落地缓慢，政策监管趋严的风险。

上一篇：诵林公家训赢文创好礼

下一篇：以军称过去一天袭击加沙数十个军事目标

国联民生证券-传媒行业点评研究：DeepSeek R1更新，Agent生态有望加速演进-250602

相关内容

热门资讯