金融界2025年7月16日消息,国家知识产权局信息显示,浪潮软件科技有限公司申请一项名为“基于大语言模型和Jaccard相似系数的科技项目申报书查重方法及系统”的专利,公开号CN120316243A,申请日期为2025年04月。
专利摘要显示,本发明公开了基于大语言模型和Jaccard相似系数的科技项目申报书查重方法及系统,属于自然语言处理技术领域,本发明要解决的技术问题为如何提高科技项目申报书查重的准确性和效率,技术方案为:提取文档核心内容:通过已经经过若干科技项目数据训练完成的大语言模型提取待查重科技项目文档的核心内容;拆分文档片段:基于自然语言处理技术将文档核心内容拆分为多个文档片段;文档向量化存储:通过文本嵌入模型将文档片段转换为向量,并将向量存储在向量数据库中;计算向量距离和检索历史项目:计算待查重项目文档片段的向量与历史项目文档片段向量的欧式距离或余弦相似度,提取距离最近的topK个历史项目;计算Jaccard相似系数;聚合文档相似度;生成查重结果。
天眼查资料显示,浪潮软件科技有限公司,成立于2020年,位于济南市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本380000万人民币。通过天眼查大数据分析,浪潮软件科技有限公司共对外投资了75家企业,参与招投标项目4010次,专利信息826条,此外企业还拥有行政许可14个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.