国家知识产权局信息显示,哈尔滨思和信息技术股份有限公司申请一项名为“一种处理PDF中跨页表格的内容提取方法及系统”的专利,公开号CN121564742A,申请日期为2025年9月。
专利摘要显示,本发明公开了一种处理PDF中跨页表格的内容提取方法及系统,涉及PDF文件处理技术领域,将PDF文档中的每一页转换为图像,提取图像的正文区域;检测正文区域中不同页面的表格区域,记录其位置信息与边界框;检测跨页表格关键词,并识别相邻页中是否具备结构延续关系;若具备结构延续关系,则依据上下页表格边界框空间对齐关系,执行表格图像拼接与元数据合并,并保留原始合并单元格关系与逻辑顺序;解析合并后表格的层级结构,将结构化表格数据输出为下游可复用格式。本发明从原始PDF文件中自动完成图像转换、表格检测、结构解析与格式化输出,生成可复用的结构化数据文件,通过系统化流程实现从PDF文件到结构化表格数据的高效转换。
天眼查资料显示,哈尔滨思和信息技术股份有限公司,成立于1995年,位于哈尔滨市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本8434万人民币。通过天眼查大数据分析,哈尔滨思和信息技术股份有限公司共对外投资了12家企业,参与招投标项目1642次,财产线索方面有商标信息226条,专利信息58条,此外企业还拥有行政许可26个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.