欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版
创始人
2025-03-14 17:41:33
0

就在刚刚,那个曾经开源了首个 MoE 模型的欧洲初创公司 Mistral AI 在沉寂一段时间之后又出新活。

Mistral 团队发布了一个号称“全世界最好的 OCR”的产品 —— Mistral OCR,旨在将一些 AI 难以直接识别的粗糙且复杂的文件进行整理,便于 AI 操作识别。

帖子一经发出,评论区瞬间充满了各种夸夸言论,但在一众赞美声中,也不乏一些真正用过产品的网友的理智发言。

就比如有网友对 Mistral OCR 的产品能力表示认同,但却有点接受不了它的产品定价,觉得有点太贵,并且期待中国 AI 公司早点发布一个类似的开源版本,把价格打下来。

同时也有网友亲自上手,上传扫描了手写板的内容,但最后识别出的文字结果正确率并不是很高。

除此之外,还有被 Mistral 所宣传的“可以识别超多种语言”噱头吸引过来的网友,但使用后却失望的发现它无法识别自己所用语言。

尽管 Mistral OCR 目前还存在着一定的局限性,但它的出现确实是一次从字符识别到场景智能的跨越。

从图文到结构化数据的一大步

与传统的 OCR API 不同,Mistral OCR 是一款多模态 API,它不仅可以识别文本中是否嵌入了插图或照片,还会为这些图形元素创建边界框,并将它们包含在输出中。

从 Mistral AI 团队放出的 Demo 视频可以看出,Mistral OCR 能够将图文混排的 PDF 文件转换成结构清晰的 Markdown 格式文件。

例如表格+数字的 PDF 组合。

PDF 图片中数学公式的转换。

PDF 宣传图片中的印地语。

拍得并不方正的论文照片。

甚至带有水印的文字也可以轻松识别。

从字符识别到场景智能的一大步

除了直观的 Demo 外,Mistral AI 团队还列举了 6 点 Mistral OCR 的绝对优势:

卓越的复杂文档解析能力:Mistral OCR 在理解复杂文档结构方面表现出色,能够精准解析交错的图像、数学公式、表格以及 LaTeX 等高级排版格式。这使其在处理包含图表、图形、公式和插图的科学论文等富文本文档时更具优势。

原生支持多语言与多模态:Mistral OCR 自带多语言和多模态处理能力,能够灵活应对不同语言以及多种类型的内容,无需额外适配。

行业领先的基准测试表现:在多项行业基准测试中,Mistral OCR 均取得优异成绩,充分展示了其强劲的性能和高准确度。

同类产品中处理速度最快:Mistral OCR 采用轻量化架构,处理速度远超同类产品,单节点每分钟可解析高达 2000 页文档。无论在高负载环境还是大规模数据处理中,它都能保持高效运行,确保稳定性能。

创新性的“文档即提示”结构化输出:Mistral OCR 率先引入“文档即提示”概念,使用户能够直接使用文档作为指令,以获取更加精准和定制化的结果。它还能输出 JSON 等结构化格式,便于与后续任务或自动化流程衔接,实现更智能的内容提取。

可选的自托管部署方案:针对数据隐私要求严格的企业或机构,Mistral OCR 提供自托管部署选项,确保敏感信息始终存储在本地基础设施内,满足合规性与安全性需求。

团队还将 Mistral OCR 将 Google Document AI、Azure OCR、Gemini 系列模型以及 GPT-4o 的产品性能进行对比。

最终的结果表明,Mistral OCR 在总体准确率、数学公式识别等方面表现优异,特别是在 2503 版本中,各项指标均大幅提升,达到了新的高度。

在多语言处理方面,得出的数据更是远远优于 Google Document AI 和 Azure OCR。

欧洲也有自己的“DeepSeek”

Mistral AI 是一家位于法国的初创公司,凭借其 AI 助手 Le Chat 和多个基础模型,已被官方视为法国最具前途的科技公司之一,并被认为是唯一有潜力与 OpenAI 竞争的欧洲企业。

Mistral AI 的三位创始人都拥有在全球顶级科技公司中积累的丰富 AI 研究经验。首席执行官 Arthur Mensch 曾在谷歌 DeepMind 部门工作,首席技术官 Timothée Lacroix 和首席科学家 Guillaume Lample 则曾是 Meta 的核心成员。凭借着强大的技术背景,Mistral AI 的创始团队带领公司迅速发展。

值得一提的是,雷峰网得知自 2023 年成立以来,Mistral AI 在筹集资金方面取得了显著成绩,目标是将前沿 AI 技术普及给每个人,虽然这一目标并未直接挑战 OpenAI,但它强调了公司对于 AI 开放性的坚定支持。

相关内容

热门资讯

东华软件携手华安鑫创深化AI技... 人民财讯5月9日电,近日,东华软件(002065)与华安鑫创(300928)正式签署战略合作框架协议...
阿里云ECS 第九代Intel... 随着AI技术渗透千行百业,算力已成为驱动企业创新发展的核心引擎。英特尔® 至强® 6处理器的推出,正...
谷歌AI出击:冒充客服等骗局减... 5 月 9 日消息,谷歌公司今天(5 月 9 日)发布博文,详细介绍其搜索功能遏制诈骗的最新成果外,...
佳都科技发布交通佳鸿操作系统 ... 5月8日,以“开源•智联•共生”为主题的开放原子“园区行”(深圳站)在深圳龙岗区举办。佳都科技重磅发...
AI“魔改”怎么看 最近,在人工智能技术加持下,一段“回答我”的幽默台词让教科书上的历史人物画像“活”起来了。短视频里,...
魅族Note 16系列将搭载独... 【CNMO科技消息】5月9日,星纪魅族继续在官微对新机魅族Note 16系列进行预热。星纪魅族官方表...
《绝密较量》直到赵亚苧被抓,才... 正在热播的《绝密较量》是一部国家安全反间谍剧。于《人世间》里扮演冯化成的成泰燊在《绝密较量》当中饰演...
百亿影后马丽,哭惨了 男频的爽文里,名不见经传的小人物偶然获得机缘,一路凭借宝物、贵人逆袭,便是故事的爽点所在。现实世界里...
一把年纪还打打杀杀,黄宗泽陈豪... 文案 |十四北编辑 |南枫在追完了《蛮好的人生》后,本以为电视剧市场会就此消沉一段时间。没想到裤家又...
《人世间》后王阳是真火了,这半... 都说男演员越老越吃香,看今年47岁的王阳就知道了,从低调实力派逆袭成“叔圈顶流”,年轻时不瘟不火,4...
今夏第一双凉鞋,跪求你买这双!... 作为一个汗脚,天气越来越热之后我已经开始慢慢穿不住鞋了。尤其是这种全封闭的运动鞋什么的,好看是好看,...
重温《橘子红了》:才明白为何秀... “不论你白天去哪了,我都不希望再有第二次,做人要有良心,要懂得感激”自从秀禾进到容府里面,恩情两个字...
重温《悬崖》:才明白周乙身份暴... 高彬作为剧中的一个反派角色,是个很典型的大汉奸,对组织的地下情报网产生很大的威胁。而这个最大的特点就...
开播第一天热度破19000!一... 文案|一十三编辑|苏打水今年国产剧市场上的都市剧,能撑起排面的只有一部《蛮好的人生》,虽然口碑两极分...
漫威剧集《钢铁之心》6月24日... IT之家 5 月 9 日消息,漫威电影宇宙(MCU)以 17 年前小罗伯特・唐尼那套传奇战甲拉开序幕...
《狮城山海》中的女演员大放异彩... 在电视剧《狮城山海》的精彩画卷中,一众女性角色宛如璀璨星辰,照亮了以南洋华人帮派兴衰为背景的故事舞台...
何超仪用命守护赘婿:豪门最贵不... 在现代社会,有一种看似不可能存在的爱情,它可能没有多少波澜壮阔的浪漫,却无时无刻不在悄悄打动你——那...
AI芯片出口政策转弯?特朗普政... 据路透社等外媒报道,美国商务部发言人当地时间7日表示,美国总统特朗普计划取消并修改拜登政府对先进人工...
美国四大AI高管国会作证:要想... 凤凰网科技讯 北京时间5月9日,据路透社报道,美国AI巨头OpenAI、微软、AMD以及人工智能云服...
任素汐、高伟光《无尽的尽头》8... 当各大平台热播剧集轮番轰炸热搜时,《无尽的尽头》却以一种近乎"隐形"的方式悄然上线。没有铺天盖地的营...