国联民生证券-传媒行业点评研究:DeepSeek R1更新,Agent生态有望加速演进-250602
创始人
2025-06-02 11:07:07

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(转自:研报虎)

行业事件

  DeepSeek于5月29日完成小版本升级,当前版本为DeepSeek-R1-0528(下称“新版R1”),官网、App及API均已同步更新。

深度思考能力提升:接近o3、Gemini-2.5-Pro

  新版R1模型深度思考能力进一步提升:基座模型仍使用2024年12月发布的DeepSeek V3 Base,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。新版R1模型在数学、编程与通用逻辑等多个基准测评中位于国产模型领先水平,接近OpenAI o3、Gemini-2.5-Pro水平。其中在数学测试AIME2025中,新版R1准确率从旧版的70%提升至87.5%,平均每题使用的token数量从旧版的12K提升至23K,背后系模型在解题过程中进行了更为深入的思考,进而提升准确率。此外,用新版R1蒸馏后的思维链训练的Qwen3-8B表现也较为出色,在AIME 2024测试中仅次于新版R1,有望推动AI小模型的开发与应用。

文字处理能力提升:幻觉改善、写作优化

  在文字处理及生成方面,新版R1进行持续优化:1)幻觉改善:针对“幻觉”问题进行优化,在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45-50%,能更有效地提供更为准确、可靠的结果;2)创意写作:针对议论文、小说、散文等文体实现进一步优化,能够输出篇幅更长、结构内容更为完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

复杂任务处理能力提升:工具调用及代码水平增强

  据新智元、机器之心及我们一手测评,新版R1在调用工具、编写代码等类Agent功能上也实现提升。如在“构建一个词评分系统”“将小球碰撞实验可视化”“在线生成游戏、网页”等需要较强的深度理解能力、代码能力的任务中,新版R1的表现显著优于旧版,且接近OpenAI o3、Claude-4-Sonnet等海外头部推理模型水平。

投资建议:强于大市

  我们认为:1)模型角度看,自2025年初DeepSeek R1开源、性能居于全球前列,国产AI大模型和海外差距逐步缩小。此次新版R1发布虽然仅为版本更新,但在性能跑分及实际使用中均提升显著,关注DeepSeek下一代R2模型发布节奏。2)应用角度看,2025年系AI应用落地之年,而AIAgent作为AI应用的重要落地方向,已成为全球科技巨头的共识。其中海外市场,基于底层模型推理能力提升,Anthropic Claude、OpenAIGPT等头部应用逐步从chatbot向Agent形态进化,Cursor等专业Agent商业化进程加速;国内市场,腾讯、阿里巴巴、字节跳动等互联网大厂相继布局Agent类产品,有望基于模型能力提升以及国内广大C端用户生态,孵化全民级别的AI应用。关注头部企业Agent类产品发布节奏。建议关注AI模型&应用布局较早的公司:恺英网络、昆仑万维(维权)、巨人网络、盛天网络、奥飞娱乐、上海电影、美图公司。

  风险提示:技术发展缓慢,AI应用落地缓慢,政策监管趋严的风险。

相关内容

热门资讯

最新或2023(历届)中国历史...   裔式娟,1929年出生于江苏盐城,在旧社会只读过一年书,后到资本家的工厂里当最苦最累的养成工。1...
最新或2023(历届)中国各年...   时传祥  甘当人民勤务员的掏粪工人——时传祥  时传祥,是一位“宁肯一人臭,换来万户香”的掏粪工...
最新或2023(历届)劳动节了...   什么是劳模精神  社会学家艾君认为,劳模精神,实际它折射出一个时代的人文精神,反映出一个民族在某...
最新或2023(历届)美国的劳...   劳动节起源于美国。19世纪80年代,美国资产阶级为了进行资本积累,对工人阶级进行残酷的剥削压榨,...
最新或2023(历届)五一手抄...   手抄报版面设计边框图案是最能生动形象表现的方式,眼看五一就要到了,你准备怎么好了吗?五一手抄报版...