DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限
创始人
2025-10-21 10:22:54
0

10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。

据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。

该模型核心由DeepEncoder与DeepSeek3B-MoE-A570M解码器构成:DeepEncoder能够在高分辨率输入条件下保持低激活状态,实现高压缩比并生成适量的视觉token;解码器则负责将这些视觉token准确转化为文本信息。

实验数据显示,当文本token数量控制在视觉token的10倍以内(压缩率<10 x )时,OCR识别精度可达97%;即使压缩率提升至20×,模型准确率仍能维持在60%左右。

研究团队表示,这一成果为长上下文压缩技术以及大语言模型的记忆与遗忘机制研究提供了新的思路与方向。

【来源:快科技】

相关内容

热门资讯

《沉默的荣耀》中出演谷正文出圈... 谍战剧《沉默的荣耀》刚在央视八套收官,剧集又在北京卫视接续播出。在这档收获了超高国民度的剧集中,演员...
安倍遇刺案,有新进展! 日本奈良地方法院今天(10月21日)公布了对2022年日本前首相安倍晋三遭枪击身亡案被告人山上彻也的...
优化营商环境服务再升级!台江区... “如何让公司管理更规范?” “怎样降低经营风险?” “新修订的《中华人民共和国公司法》又有哪些关...
最新或2023(历届)继续教育...  为贯彻落实《国家中长期人才发展规划纲要(20xx-20xx)》和《关于加强专业技术人员继续教育工作...
最新或2023(历届)教师继续... 度教师继续教育学习总结  通过本学期继续教育培训的学习,使我在教育思想,教育理论及业务能力等方面受益...