网易首页 > 网易号 > 正文 申请入驻

性能超越DeepSeek-OCR2,百度发布并开源新一代SOTA OCR模型

0
分享至

1月29日,百度正式发布并开源新一代文档解析模型PaddleOCR-VL-1.5。该模型以仅0.9B参数的轻量架构,在全球权威文档解析评测榜单OmniDocBench V1.5中取得全球综合性能第一成绩,整体精度达到94.5,超过Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2等模型。

值得关注的是,PaddleOCR-VL-1.5 全球首次实现OCR模型的“异形框定位”能力,使机器能够精准识别倾斜、弯折、拍照畸变等非规则文档形态,首次让“歪文档”实现稳定、可规模化解析。该技术解决了传统OCR模型在移动拍照、扫描件变形、复杂光照等真实场景中因文档形变导致的识别失败问题,可广泛应用于金融票据处理、档案数字化、政务文档流转等场景。

PaddleOCR-VL-1.5 基于文心大模型进行开发,在 OmniDocBench V1.5多个关键指标上取得领先表现。其中,表格结构理解(92.8 分)和阅读顺序预测(95.8 分)两项核心指标上均位列第一,分别领先 Gemini-3-Pro、DeepSeek-OCR 等主流模型 2–5 分不等。在文档阅读顺序预测任务中,其版面逻辑解析错误率仅为同类其他模型约一半。这表明,PaddleOCR-VL-1.5 在复杂文档结构还原与版面逻辑理解方面具备更高稳定性,在合同、财报等高复杂度业务场景中拥有更高可用性。



2025年10月16日,百度首次发布并开源 PaddleOCR-VL模型,在 OmniDocBench V1.5 榜单中取得全球SOTA成绩,并连续五天登顶 HuggingFace全球模型总趋势榜与ModelScope全球模型总趋势榜双榜第一。

相比于上代,在功能层面,PaddleOCR-VL-1.5 进一步集成印章识别、文本检测与识别等任务能力,关键指标持续领跑;同时针对特殊场景与多语种识别进行系统优化,在生僻字、古籍文献、多语种表格、下划线与复选框等复杂结构识别方面显著提升,并新增对藏语、孟加拉语等语种的支持。模型还支持跨页表格自动合并与跨页段落标题识别,有效解决长文档解析中的结构断裂问题。

近半年来,全球主流模型厂商密集布局 OCR 领域。1月27日,深度求索发布新一代 OCR 模型 DeepSeek-OCR-2,引入“因果流查询”机制,并将语言模型融入视觉编码,在OmniDocBench V1.5中实现91.09%精度。与此同时,Mistral AI、字节跳动、腾讯等企业也相继推出新一代 OCR 模型,行业竞争持续加剧。

业内分析认为,随着大模型加速进入金融、政务、制造等高复杂度业务流程,文档解析能力正从“能用”走向“稳定可规模化落地”。PaddleOCR-VL-1.5 在精度、复杂场景适应性与工程化能力上的系统突破,有望进一步降低产业应用门槛,推动 OCR 技术在真实生产环境中的深度落地。

目前,PaddleOCR-VL-1.5 已全面开源,开发者可通过GitHub、Hugging Face获取,并在 PaddleOCR 官网进行在线体验或通过百度智能云千帆平台调用API接口。

  • 在线使用/API:https://www.paddleocr.com
  • 开源项目地址:https://github.com/PaddlePaddle/PaddleOCR
  • 模型下载地址:https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
直冲24℃!浙江升温时间定了

直冲24℃!浙江升温时间定了

浙江之声
2026-02-17 10:57:40
日本“色情业”怪相:店开不下去,大久保公园却生意更好了

日本“色情业”怪相:店开不下去,大久保公园却生意更好了

这里是东京
2026-02-17 16:20:51
原来他才是毁掉刘翔真凶!因贪1200万被审判,让刘翔背负多年骂名

原来他才是毁掉刘翔真凶!因贪1200万被审判,让刘翔背负多年骂名

小熊侃史
2026-02-11 12:52:08
软件崩完物流崩!AI正在血洗股市,普通人只剩这一条活路

软件崩完物流崩!AI正在血洗股市,普通人只剩这一条活路

侃故事的阿庆
2026-02-16 22:18:13
北京男子张先生去世,年仅38岁,儿女上小学,误诊20多天错过治疗

北京男子张先生去世,年仅38岁,儿女上小学,误诊20多天错过治疗

法老不说教
2025-12-25 13:40:58
想跑没门!新疆富豪夫妇套现7亿,没等钱到账,老板娘先被带走了

想跑没门!新疆富豪夫妇套现7亿,没等钱到账,老板娘先被带走了

白浅娱乐聊
2026-01-30 16:29:01
还不如日本!除夕当天赖清德春节贺词:全英文对“中国”只字不提

还不如日本!除夕当天赖清德春节贺词:全英文对“中国”只字不提

秘密即将揭晓
2026-02-17 22:55:52
春晚宇树G1机器人8.5万元热度飙升 销售人员:非春晚同款功能 无二次开发仅可行走等

春晚宇树G1机器人8.5万元热度飙升 销售人员:非春晚同款功能 无二次开发仅可行走等

封面新闻
2026-02-17 20:37:07
太意外!38岁中国教练率意大利击败中国队夺金牌,曾婉拒回国执教

太意外!38岁中国教练率意大利击败中国队夺金牌,曾婉拒回国执教

云景侃记
2026-02-12 19:49:07
少子化+AI,正在杀死延续了70年的选拔游戏

少子化+AI,正在杀死延续了70年的选拔游戏

格致君
2026-02-14 09:21:44
红果短剧狂赚150亿,豆包反超同行,字节凭啥总能后来居上?

红果短剧狂赚150亿,豆包反超同行,字节凭啥总能后来居上?

老特有话说
2026-02-09 23:31:54
为娶英国公主,莫齐抛弃华裔未婚妻,如今岳父丢爵位,家里一团糟

为娶英国公主,莫齐抛弃华裔未婚妻,如今岳父丢爵位,家里一团糟

冷紫葉
2025-10-28 20:31:09
刚刚,全球最大对冲基金最新持仓来了

刚刚,全球最大对冲基金最新持仓来了

格隆汇
2026-02-18 00:50:14
中戏风波再升级!3人自首,4任领导落马,闫学晶没想到会连累他

中戏风波再升级!3人自首,4任领导落马,闫学晶没想到会连累他

胡一舸南游y
2026-02-14 19:11:55
人不会无缘无故患带状疱疹!研究发现:得带状疱疹,离不开这3点

人不会无缘无故患带状疱疹!研究发现:得带状疱疹,离不开这3点

荷兰豆爱健康
2026-02-15 18:21:06
刚刚!石油、黄金、白银,集体跳水!

刚刚!石油、黄金、白银,集体跳水!

中国基金报
2026-02-17 22:52:21
电车剩余3%电量寻找充电桩,车主意外遭遇无桩可用!

电车剩余3%电量寻找充电桩,车主意外遭遇无桩可用!

一丝不苟的法律人
2026-02-17 16:06:56
0.09秒绝杀!中国队创冬奥会历史,首次登上领奖台,队员哭成泪人

0.09秒绝杀!中国队创冬奥会历史,首次登上领奖台,队员哭成泪人

侃球熊弟
2026-02-18 07:14:42
笑哭!比亚迪月销21万辆,网上哀嚎遍野,内部人士:没见过世面

笑哭!比亚迪月销21万辆,网上哀嚎遍野,内部人士:没见过世面

小李车评李建红
2026-02-17 09:00:03
赵今麦,每个男人都想拥有的女孩样板。

赵今麦,每个男人都想拥有的女孩样板。

野狐馋师
2026-02-17 08:50:46
2026-02-18 08:47:00
贝克街探案官 incentive-icons
贝克街探案官
洞察科技和商业领域的一切秘密
308文章数 851关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

湘潭黄氏家族坚持9年办春节联欢会 今年200人以上参加

头条要闻

湘潭黄氏家族坚持9年办春节联欢会 今年200人以上参加

体育要闻

维尼修斯进球后罢赛 向穆帅投诉对手歧视

娱乐要闻

春节档电影首波口碑出炉!

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

教育
旅游
家居
公开课
军事航空

教育要闻

求梯形面积?五年级压轴题

旅游要闻

人头攒动年味足 无棣古城喜迎开门红

家居要闻

中古雅韵 乐韵伴日常

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国国务卿鲁比奥发表农历新年祝福

无障碍浏览 进入关怀版