金融界2025年6月3日消息,国家知识产权局信息显示,北京羽乐创新科技有限公司申请一项名为“一种网页商户信息智能采集和解析的方法及系统”的专利,公开号CN120086427A,申请日期为2025年05月。
专利摘要显示,本发明公开了一种网页商户信息智能采集和解析的方法及系统,通过智能网页抓取、智能字段识别、地址信息精确解析、智能商户分组和自动页面发现五个主要步骤实现商户信息的自动化采集。本发明摒弃了传统基于规则的提取方法,利用上下文语义分析和模式识别技术自动识别网页中的商户名称、电话号码和地址等信息,通过动态权重多维相似度计算方法实现字段的精准关联分组,并利用自动页面发现机制无需人工指定采集路径即可持续发现和采集商户信息。本发明突破了传统方法需针对不同网站编写特定规则、难以应对网页结构变化、无法处理多商户信息分组等技术瓶颈,适应各类网页结构变化,大幅提高了商户信息采集的自动化程度、准确性和效率。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.