金融界2025年2月21日消息,国家知识产权局信息显示,创云融达信息技术(天津)股份有限公司申请一项名为“一种文档归类方法、系统、计算机设备及存储介质”的专利,公开号CN 119493861 A,申请日期为2025年1月。
专利摘要显示,本发明提供了一种文档归类方法,属于数据分类领域,包括:从多个渠道收集不同语言的原始文档,将不同语言的文本转换为统一的语言表示形式;提取转换语言后的文档中的关键词,计算每个关键词在对应文档中的词频和逆文档频率,采用逆文档频率对词频加权得到多个TF‑IDF权值,并将多个TF‑IDF权值转换为多个词嵌入特征;同时将原始文档中与多个词嵌入特征相似的文本数据进行标注;将多个词嵌入特征输入自然语言处理模型对模型进行训练,再通过标注后的文档数据对训练后的模型进行再次训练,得到语义编码器;将待归类的不同语言的文档输入语义编码器,输出归类结果。本发明采用两个层次训练的模型能够对不同语言的文档进行精确的归类,提高了文档归类的效率。
天眼查资料显示,创云融达信息技术(天津)股份有限公司,成立于2018年,位于天津市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本2110万人民币,实缴资本2110万人民币。通过天眼查大数据分析,创云融达信息技术(天津)股份有限公司共对外投资了3家企业,参与招投标项目70次,知识产权方面有商标信息5条,专利信息34条,此外企业还拥有行政许可2个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.