DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限
创始人
2025-10-21 10:22:54

10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。

据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。

该模型核心由DeepEncoder与DeepSeek3B-MoE-A570M解码器构成:DeepEncoder能够在高分辨率输入条件下保持低激活状态,实现高压缩比并生成适量的视觉token;解码器则负责将这些视觉token准确转化为文本信息。

实验数据显示,当文本token数量控制在视觉token的10倍以内(压缩率<10 x )时,OCR识别精度可达97%;即使压缩率提升至20×,模型准确率仍能维持在60%左右。

研究团队表示,这一成果为长上下文压缩技术以及大语言模型的记忆与遗忘机制研究提供了新的思路与方向。

【来源:快科技】

相关内容

热门资讯

瑾妃不得慈禧喜爱,为什么后来在... 光绪一生有三个女人,一个是慈禧的外甥女隆裕皇后,一个是最得光绪宠爱的珍妃,还有一个就是慈禧不疼光绪不...
瑾妃不得慈禧喜爱,为什么后来在... 光绪一生有三个女人,一个是慈禧的外甥女隆裕皇后,一个是最得光绪宠爱的珍妃,还有一个就是慈禧不疼光绪不...
她是清朝晋升速度最快的皇后,可... 传宗接代在古代是件很重要的事情,皇室妃嫔如果没有生子想要晋升并不容易,不过偶尔也会有例外,例如:道光...
父亲节感谢信用语 父亲节感谢信...   天气变得真快,气温变得真坏,出门外套要带,睡觉被子要盖,多吃水果青菜,好好保持心态!老爸节日快乐...
拜访公司感谢信格式 拜访公司感...   尊敬的__________,   我们于__________[日期]拜访了贵公司,您的热情款待让...