国家知识产权局信息显示,中国石油天然气股份有限公司申请一项名为“一种大语言模型训练数据集溯源标记方法”的专利,公开号CN121479746A,申请日期为2024年8月。
专利摘要显示,本发明提供一种大语言模型训练数据集溯源标记方法,涉及模型数据安全性领域,解决了大语言模型训练数据集被盗取后难以被溯源证明该数据集的原始归属的问题;方法包括:构造特定的标识数据内容,在维持原始训练数据集对模型训练具备正面影响的基础上,将特定的标识数据内容混入原始训练数据集中,得到标识性训练数据集;对标识性训练数据集进行信息摘要算法处理,得到标识信息并关联存储,在预设范围内公示;获取待溯源核查的大语言模型及公示的标识信息,使用标识信息作为该大语言模型的输入,对该大语言模型的输出进行验证,实现对原始训练数据集的溯源;本发明可以有效保护训练数据集的知识产权,提升训练数据集的安全性和可信度。
天眼查资料显示,中国石油天然气股份有限公司,成立于1999年,位于北京市,是一家以从事石油和天然气开采业为主的企业。企业注册资本18302097万人民币。通过天眼查大数据分析,中国石油天然气股份有限公司共对外投资了1298家企业,参与招投标项目443次,财产线索方面有商标信息38条,专利信息5000条,此外企业还拥有行政许可168个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.