网易首页 > 网易号 > 正文 申请入驻

性能超越DeepSeek-OCR2,百度发布并开源新一代SOTA OCR模型

0
分享至

1 月 29 日,百度正式发布并开源新一代文档解析模型 PaddleOCR-VL-1.5。该模型以仅 0.9B 参数的轻量架构,在全球权威文档解析评测榜单 OmniDocBench V1.5 中取得全球综合性能第一成绩,整体精度达到 94.5%,超过 Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2 等模型。

值得关注的是,PaddleOCR-VL-1.5 全球首次实现 OCR 模型的“异形框定位”能力,使机器能够精准识别倾斜、弯折、拍照畸变等非规则文档形态,首次让“歪文档”实现稳定、可规模化解析。该技术解决了传统 OCR 模型在移动拍照、扫描件变形、复杂光照等真实场景中因文档形变导致的识别失败问题,可广泛应用于金融票据处理、档案数字化、政务文档流转等场景。

PaddleOCR-VL-1.5 基于文心大模型进行开发,在 OmniDocBench V1.5 多个关键指标上取得领先表现。其中,表格结构理解(92.8 分)和阅读顺序预测(95.8 分)两项核心指标上均位列第一,分别领先 Gemini-3-Pro、DeepSeek-OCR 等主流模型 2–5 分不等。在文档阅读顺序预测任务中,其版面逻辑解析错误率仅为同类其他模型约一半。这表明,PaddleOCR-VL-1.5 在复杂文档结构还原与版面逻辑理解方面具备更高稳定性,在合同、财报等高复杂度业务场景中拥有更高可用性。


2025 年 10 月 16 日,百度首次发布并开源 PaddleOCR-VL 模型,在 OmniDocBench V1.5 榜单中取得全球 SOTA 成绩,并连续五天登顶 HuggingFace 全球模型总趋势榜与 ModelScope 全球模型总趋势榜双榜第一。

相比于上代,在功能层面,PaddleOCR-VL-1.5 进一步集成印章识别、文本检测与识别等任务能力,关键指标持续领跑;同时针对特殊场景与多语种识别进行系统优化,在生僻字、古籍文献、多语种表格、下划线与复选框等复杂结构识别方面显著提升,并新增对藏语、孟加拉语等语种的支持。模型还支持跨页表格自动合并与跨页段落标题识别,有效解决长文档解析中的结构断裂问题。

近半年来,全球主流模型厂商密集布局 OCR 领域。1 月 27 日,深度求索发布新一代 OCR 模型 DeepSeek-OCR-2,引入“因果流查询”机制,并将语言模型融入视觉编码,在 OmniDocBench V1.5 中实现 91.09% 精度。与此同时,Mistral AI、字节跳动、腾讯等企业也相继推出新一代 OCR 模型,行业竞争持续加剧。

业内分析认为,随着大模型加速进入金融、政务、制造等高复杂度业务流程,文档解析能力正从“能用”走向“稳定可规模化落地”。PaddleOCR-VL-1.5 在精度、复杂场景适应性与工程化能力上的系统突破,有望进一步降低产业应用门槛,推动 OCR 技术在真实生产环境中的深度落地。

目前,PaddleOCR-VL-1.5 已全面开源,开发者可通过 GitHub、Hugging Face 获取,并在 PaddleOCR 官网进行在线体验或通过百度智能云千帆平台调用 API 接口。

  • 在线使用/API:
    https://www.paddleocr.com
  • 开源项目地址
    https://github.com/PaddlePaddle/PaddleOCR
  • 模型下载地址:
    https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
铁了心对付中国?暴跌58%,俄罗斯大幅加税,中国汽车出口骤降

铁了心对付中国?暴跌58%,俄罗斯大幅加税,中国汽车出口骤降

卷史
2026-02-02 12:01:46
湘潭黄氏家族坚持9年办春节联欢会 从4岁孩童到90岁老人,都将登上舞台

湘潭黄氏家族坚持9年办春节联欢会 从4岁孩童到90岁老人,都将登上舞台

红星新闻
2026-02-16 21:49:11
23岁懒死家中,“中国第一懒人”杨锁到底有多懒,守着肉菜被饿死

23岁懒死家中,“中国第一懒人”杨锁到底有多懒,守着肉菜被饿死

荷兰豆爱健康
2026-02-15 23:40:22
尽管全明星赛前战绩好,但湖人本赛季表现却比史上大多数球队怪异

尽管全明星赛前战绩好,但湖人本赛季表现却比史上大多数球队怪异

好火子
2026-02-18 03:54:55
黄金又跌价了26年2月17日金条降价,国内黄金、足金、金条新价格

黄金又跌价了26年2月17日金条降价,国内黄金、足金、金条新价格

户外钓鱼哥阿旱
2026-02-17 10:29:59
一夫一妻制度会让男性阴茎骨退化,还会导致智力下降?

一夫一妻制度会让男性阴茎骨退化,还会导致智力下降?

宇宙时空
2026-02-17 09:00:16
金牌难产,一天多个夺金点落空,预测中国队首金在19日诞生

金牌难产,一天多个夺金点落空,预测中国队首金在19日诞生

真理是我亲戚
2026-02-17 09:59:44
王晶没撒谎!退出春晚、和沈腾决裂,性格大变的贾玲印证他说的话

王晶没撒谎!退出春晚、和沈腾决裂,性格大变的贾玲印证他说的话

胡一舸南游y
2026-01-25 14:54:04
哪些抵债方式让你出乎意料?网友:她没有再提,临走悄悄给了两万

哪些抵债方式让你出乎意料?网友:她没有再提,临走悄悄给了两万

夜深爱杂谈
2026-01-23 20:20:15
你干过哪些阴暗龌龊的事?网友:最后一个真的好炸裂好真实

你干过哪些阴暗龌龊的事?网友:最后一个真的好炸裂好真实

带你感受人间冷暖
2026-02-17 01:00:24
哈登交易后遗症显露 5投0中原形毕露 影响最大之人竟是他

哈登交易后遗症显露 5投0中原形毕露 影响最大之人竟是他

林子说事
2026-02-18 03:51:14
三兄弟一起过年不买菜后续: 父母含泪要求分家,当事人发声

三兄弟一起过年不买菜后续: 父母含泪要求分家,当事人发声

观察鉴娱
2026-02-17 16:23:38
母亲再嫁进豪门,王楚然乔欣蓝盈莹改变人生,1人联姻2人受热捧

母亲再嫁进豪门,王楚然乔欣蓝盈莹改变人生,1人联姻2人受热捧

喜欢历史的阿繁
2026-02-16 12:36:42
紫络:一种光谱边缘的私语

紫络:一种光谱边缘的私语

疾跑的小蜗牛
2026-02-17 23:42:49
杨丞琳大年初一秀恩爱,与李荣浩亲自下厨,年夜饭十二道菜很丰盛

杨丞琳大年初一秀恩爱,与李荣浩亲自下厨,年夜饭十二道菜很丰盛

星星跌入梦里中
2026-02-17 02:28:17
川普再发声:如果被绑架的老人死亡,将处决绑匪

川普再发声:如果被绑架的老人死亡,将处决绑匪

大洛杉矶LA
2026-02-17 03:23:47
小区楼上天天晚上都有女的大声叫。。。

小区楼上天天晚上都有女的大声叫。。。

微微热评
2025-12-24 00:26:04
易梦玲一双金灿灿的大灯,明艳晃眼

易梦玲一双金灿灿的大灯,明艳晃眼

吃瓜党二号头目
2026-02-13 08:13:30
年初一晚上!汪小菲带孩子们去放烟花,小玥儿画爱心,逗笑马筱梅

年初一晚上!汪小菲带孩子们去放烟花,小玥儿画爱心,逗笑马筱梅

圆梦的小老头
2026-02-18 00:43:38
十几年前波士顿动力机器人就会翻跟斗了,中国的机器人厉害在哪里

十几年前波士顿动力机器人就会翻跟斗了,中国的机器人厉害在哪里

狐狸先森讲升学规划
2026-02-17 12:12:04
2026-02-18 08:51:00
开源中国 incentive-icons
开源中国
每天为开发者推送最新技术资讯
7596文章数 34501关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

湘潭黄氏家族坚持9年办春节联欢会 今年200人以上参加

头条要闻

湘潭黄氏家族坚持9年办春节联欢会 今年200人以上参加

体育要闻

维尼修斯进球后罢赛 向穆帅投诉对手歧视

娱乐要闻

春节档电影首波口碑出炉!

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

健康
教育
家居
手机
军事航空

转头就晕的耳石症,能开车上班吗?

教育要闻

求梯形面积?五年级压轴题

家居要闻

中古雅韵 乐韵伴日常

手机要闻

Google I/O 2026定档5月19日 Gemini AI将再度占据核心舞台

军事要闻

美国国务卿鲁比奥发表农历新年祝福

无障碍浏览 进入关怀版