网易首页 > 网易号 > 正文 申请入驻

在 NVIDIA NGC 上体验一键 PDF 转 Word

0
分享至


PaddleOCR 发版 v2.6,带来全新升级的 PP-StructureV2 智能文档分析系统,实现一键 PDF 转 Word。欢迎广大开发者使用 NVIDIA 与飞桨共同深度适配的 NGC 飞桨容器在 NVIDIA GPU 上体验!

1. PaddleOCR v2.6 版本升级

随着企业数字化进程不断加速,PDF 转 Word 的功能、纸质文本的电子化存储、文件复原与二次编辑、信息检索等应用都有着强烈的企业需求。目前市面上已有一些软件,但普遍需要繁琐的安装注册操作,大多还存在额度限制。此外,最终转换效果也依赖于版面形态,无法做到针对性适配。

针对开发者的需求,飞桨文字识别套件 PaddleOCR全新发布 PP-StructureV2 智能文档分析系统,支持一行命令实现 PDF 转 Word 功能,文字、表格、标题、图片都可完整恢复,一键实现 PDF 编辑自由!

文档分析示例

PP-StructureV2 智能文档分析系统升级点包括以下 2 方面:

  • 系统功能升级:新增图像矫正和版面复原模块,支持标准格式 PDF 和图片格式 PDF 解析!
  • 系统性能优化:
  • 版面分析:发布轻量级版面分析模型,速度提升 11 倍,平均 CPU 耗时仅需 41ms!
  • 表格识别:设计 3 大优化策略,预测耗时不变情况下,模型精度提升 6%。
  • 关键信息抽取:设计视觉无关模型结构,语义实体识别精度提升 2.8%,关系抽取精度提升超过 9.1%。

GitHub 传送门:

https://github.com/PaddlePaddle/PaddleOCR

1.1 PP-StructureV2 智能文档分析系统优化策略概述

PP-StructureV2 系统流程图如下所示,文档图像首先经过图像矫正模块,判断整图方向并完成转正,随后可以完成版面信息分析与关键信息抽取 2 类任务。

在版面分析任务中,图像首先经过版面分析模型,将图像划分为文本、表格、图像等不同区域,随后对这些区域分别进行识别,如,将表格区域送入表格识别模块进行结构化识别,将文本区域送入 OCR 引擎进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的 Word 或者 PDF 格式的文件。

在关键信息抽取任务中,首先使用 OCR 引擎提取文本内容,然后由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。

从算法改进思路来看,对系统中的 3 个关键子模块,共进行了 8 个方面的改进:

  • 版面分析
  • PP-PicoDet:轻量级版面分析模型
  • FGD:兼顾全局与局部特征的模型蒸馏算法

  • 表格识别
  • PP-LCNet: CPU 友好型轻量级骨干网络
  • CSP-PAN:轻量级高低层特征融合模块
  • SLAHead:结构与位置信息对齐的特征解码模块

  • 关键信息抽取
  • VI-LayoutXLM:视觉特征无关的多模态预训练模型结构
  • TB-YX:考虑阅读顺序的文本行排序逻辑
  • UDML:联合互学习知识蒸馏策略

最终,与 PP-StructureV1 相比:

  • 版面分析模型参数量减少 95%,推理速度提升 11 倍,精度提升 0.4%;
  • 表格识别预测耗时不变,模型精度提升 6%,端到端 TEDS 提升 2%;
  • 关键信息抽取模型速度提升 2.8 倍,语义实体识别模型精度提升 2.8%;关系抽取模型精度提升 9.1%。

PP-StructureV2 优化详细策略解析三日课回放,可以扫描下方二维码,加入 PaddleOCR 官方交流群获取。除此之外,入群福利还包括:社区开发者基于 PP-StructureV2 开发的 PDF2Word 应用程序、《动手学 OCR》电子书、10 个 OCR 场景应用垂类模型等。

PP-StructureV2 技术报告:

https://arxiv.org/abs/2210.05391v2

2. NGC 飞桨容器介绍

如果您希望体验 PaddleOCRv2.6 的新特性,欢迎使用 NGC 飞桨容器。NVIDIA 与百度飞桨共同开发了 NGC 飞桨容器,将最新版本的飞桨与最新的 NVIDIA 的软件栈(如 CUDA)进行了无缝的集成与性能优化,最大程度的释放飞桨框架在 NVIDIA 最新硬件上的计算能力。这样,用户不仅可以快速开启 AI 应用,专注于创新和应用本身,还能够在 AI 训练和推理任务上获得飞桨+NVIDIA 带来的飞速体验。

最佳的开发环境搭建工具 - 容器技术。

  1. 容器其实是一个开箱即用的服务器。极大降低了深度学习开发环境的搭建难度。例如你的开发环境中包含其他依赖进程(redis,MySQL,Ngnix,selenium-hub等等),或者你需要进行跨操作系统级别的迁移。

  2. 容器镜像方便了开发者的版本化管理

  3. 容器镜像是一种易于复现的开发环境载体

  4. 容器技术支持多容器同时运行

最好的 PaddlePaddle 容器

NGC 飞桨容器针对 NVIDIA GPU 加速进行了优化,并包含一组经过验证的库,可启用和优化 NVIDIA GPU 性能。此容器还可能包含对 PaddlePaddle 源代码的修改,以最大限度地提高性能和兼容性。此容器还包含用于加速 ETL (DALI, RAPIDS)、训练(cuDNN, NCCL)和推理 (TensorRT)工作负载的软件。

PaddlePaddle 容器具有以下优点:

  1. 适配最新版本的 NVIDIA 软件栈(例如最新版本 CUDA),更多功能,更高性能。

  2. 更新的 Ubuntu 操作系统,更好的软件兼容性

  3. 按月更新

  4. 满足 NVIDIA NGC 开发及验证规范,质量管理

通过飞桨官网快速获取

环境准备

使用 NGC 飞桨容器需要主机系统(Linux)安装以下内容:

  • Docker 引擎

  • NVIDIA GPU 驱动程序

  • NVIDIA 容器工具包

有关支持的版本,请参阅NVIDIA 框架容器支持矩阵NVIDIA 容器工具包文档

不需要其他安装、编译或依赖管理。无需安装 NVIDIA CUDA Toolkit。

NGC 飞桨容器正式安装:

要运行容器,请按照 NVIDIA Containers For Deep Learning Frameworks User’s Guide 中Running A Container一章中的说明发出适当的命令,并指定注册表、存储库和标签。有关使用 NGC 的更多信息,请参阅 NGC 容器用户指南。如果您有 Docker 19.03 或更高版本,启动容器的典型命令是:

*详细安装介绍《NGC 飞桨容器安装指南》

https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html

*详细产品介绍视频

【飞桨开发者说|NGC 飞桨容器全新上线 NVIDIA 产品专家全面解读】

https://www.bilibili.com/video/BV16B4y1V7ue?share_source=copy_web&vd_source=266ac44430b3656de0c2f4e58b4daf82

3. 飞桨与 NVIDIA NGC 合作介绍

目前飞桨已拥有超过 470 万的开发者。而在过去五年,飞桨与 NVIDIA 团队紧密合作,双方深度融合,做了大量适配工作,如下图所示。

今年,NVIDIA 在国内也已经设立了专门的工程团队支持,赋能飞桨生态。

而为了让更多的开发者能用上基于 NVIDIA 最新的高性能硬件和软件栈。当前,NVIDIA 团队正在进行全新一代 GPU 的适配工作,以及提高飞桨对 CUDA Operation API 的使用率,让飞桨的开发者拥有优秀的用户体验及极致性能。

以上的各种适配,仅仅是让飞桨的开发者拥有高性能的推理训练成为可能。但是,这些离行业开发者还很远,门槛还很高,难度还很大。

为此,我们将刚刚这些集成和优化工作,整合到三大产品线中。其中 NGC 飞桨容器最为闪亮。

NVIDIA NGC Container – 最佳的飞桨开发环境,集成最新的 NVIDIA 工具包(例如 CUDA)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
喜报!祝贺山东14名学霸提前被清华大学选中,来自这7所优质学校

喜报!祝贺山东14名学霸提前被清华大学选中,来自这7所优质学校

一口娱乐
2024-06-15 18:44:47
80后女员工示爱60后副行长,40秒表白视频被误发工作群,银行回应

80后女员工示爱60后副行长,40秒表白视频被误发工作群,银行回应

小何专栏
2024-06-15 20:55:11
一轮下岗潮来了,这三大行业将成为失业重灾区,你是否在其中?

一轮下岗潮来了,这三大行业将成为失业重灾区,你是否在其中?

莫将离
2024-06-13 22:40:03
国足18强赛分档确定,避开日韩跟两支送分童子一组,出线指日可待

国足18强赛分档确定,避开日韩跟两支送分童子一组,出线指日可待

罗掌柜体育
2024-06-15 19:30:47
北京全女团爬山出事后,最忘恩负义的事情出现了

北京全女团爬山出事后,最忘恩负义的事情出现了

英伦圈
2024-06-15 19:43:39
32岁,欧洲杯首秀进球!皇马功臣创历史,10年夺25冠,非浪得虚名

32岁,欧洲杯首秀进球!皇马功臣创历史,10年夺25冠,非浪得虚名

阿超他的体育圈
2024-06-16 02:36:47
黑龙江轿车与货车相撞致5死,网传含4名学生,知情者披露大量隐情

黑龙江轿车与货车相撞致5死,网传含4名学生,知情者披露大量隐情

求实者
2024-06-15 20:06:38
闹大了!女子被豪车别车后遭车主死亡威胁,武汉公安评论区沦陷!

闹大了!女子被豪车别车后遭车主死亡威胁,武汉公安评论区沦陷!

娱乐圈见解说
2024-06-15 17:13:40
世联赛最新排名出炉,中国女排第六,三球队争最后一个总决赛席位

世联赛最新排名出炉,中国女排第六,三球队争最后一个总决赛席位

湘楚风云
2024-06-16 02:19:01
别笑话俄军,苏联红军更拉胯:576万投降德军,斯大斯欲割地求和

别笑话俄军,苏联红军更拉胯:576万投降德军,斯大斯欲割地求和

雪中风车
2024-06-15 08:16:31
拜铁头“一泡尿”所赐:多名中国公民被遣返,日本收紧6类人审查

拜铁头“一泡尿”所赐:多名中国公民被遣返,日本收紧6类人审查

大风文字
2024-06-10 11:06:37
事发在广州一出租屋内,整栋楼住户紧急撤离!

事发在广州一出租屋内,整栋楼住户紧急撤离!

小南看城市
2024-06-15 16:31:29
蔡斌:我们从来没怀疑过奥运资格,朱婷对比赛节奏的把握非常老道

蔡斌:我们从来没怀疑过奥运资格,朱婷对比赛节奏的把握非常老道

直播吧
2024-06-15 09:04:27
王思聪当爸后续!黄一鸣公开让娃叫爸,用大葱打码内涵满满

王思聪当爸后续!黄一鸣公开让娃叫爸,用大葱打码内涵满满

懂瓜瓜
2024-06-15 19:39:31
罗甸县中医医院党委书记张林接受纪律审查和监察调查

罗甸县中医医院党委书记张林接受纪律审查和监察调查

鲁中晨报
2024-06-15 16:07:01
老百姓傻眼了?全国铁饭碗人数加起来都不到一个亿!

老百姓傻眼了?全国铁饭碗人数加起来都不到一个亿!

娱乐洞察点点
2024-06-15 16:37:29
大陆划出红线不到48小时,66架美国军机奔赴台湾,誓死保卫赖清德

大陆划出红线不到48小时,66架美国军机奔赴台湾,誓死保卫赖清德

葛剑生
2024-06-11 10:35:06
公司组织中学生赴大凉山“支教”7天收费万元,被指为营利和作秀,教育部门严查

公司组织中学生赴大凉山“支教”7天收费万元,被指为营利和作秀,教育部门严查

极目新闻
2024-06-14 21:00:42
同样是押运,为什么运钞车配的是霰弹枪,而押送高考卷配的是步枪

同样是押运,为什么运钞车配的是霰弹枪,而押送高考卷配的是步枪

小lu侃侃而谈
2024-06-14 22:22:24
上海这两家医院又成为临床医学院,意味着什么?

上海这两家医院又成为临床医学院,意味着什么?

医学界
2024-06-15 18:50:39
2024-06-16 06:28:49
NVIDIA英伟达中国
NVIDIA英伟达中国
英伟达(中国)官方账号
2401文章数 1284关注度
往期回顾 全部

科技要闻

TikTok开始找退路了?

头条要闻

欧洲杯-23秒丢球破纪录 意大利2-1逆转阿尔巴尼亚

头条要闻

欧洲杯-23秒丢球破纪录 意大利2-1逆转阿尔巴尼亚

体育要闻

莱夫利,让困难为我让路

娱乐要闻

江宏杰秀儿女刺青,不怕刺激福原爱?

财经要闻

新情况!高层对人民币的态度180°转弯

汽车要闻

东风奕派eπ008售21.66万元 冰箱彩电都配齐

态度原创

家居
教育
数码
公开课
军事航空

家居要闻

空谷来音 朴素留白的侘寂之美

教育要闻

情侣高考后办订婚宴后续,当事人回应原因,网友:升学宴还办吗?

数码要闻

低至 5747 元,爱普生 CH-TW6280T 真 4K 投影仪京东大促

公开课

近视只是视力差?小心并发症

军事要闻

普京提停火和谈条件 美防长迅速回应

无障碍浏览 进入关怀版