金融界2025年7月4日消息,国家知识产权局信息显示,北京奇艺世纪科技有限公司申请一项名为“文档内容的提取方法、装置及相关设备”的专利,公开号CN120257974A,申请日期为2025年03月。
专利摘要显示,本发明实施例提供了一种文档内容的提取方法、装置及相关设备,方法包括:对待处理文档的文档内容进行分类,得到多个数据集合;根据待处理文档匹配的目标配置文件确定每一数据集合对应的提取规则和处理规则;针对每一数据集合,根据提取规则和处理规则进行处理,得到第二文本内容;将多个数据集合对应的第二文本内容进行组合,得到目标提取文本。本申请通过格式类型对待处理文档的文档内容进行分类,得到多个数据集合,根据目标配置文件确定分别对多个数据集合进行处理的提取规则和处理规则,完成对多个数据集合的文本提取和筛选,得到目标提取文本,从而实现了对待处理文档中多个格式的识别,提高了文档内容的提取效果。
天眼查资料显示,北京奇艺世纪科技有限公司,成立于2010年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本230000万美元。通过天眼查大数据分析,北京奇艺世纪科技有限公司共对外投资了2家企业,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可7个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.