国家知识产权局信息显示,忆生科技(深圳)有限公司申请一项名为“一种多模态文档内容识别模型的训练方法及内容识别方法”的专利,公开号CN121564739A,申请日期为2025年11月。
专利摘要显示,本发明提供一种多模态文档内容识别模型的训练方法及内容识别方法,该模型训练方法包括:获取多模态文档图像集;人工标注部分图像;根据人工标注结果以及预设指令输入至视觉语言大模型中,得到思维链;根据第一图像及其对应的思维链和人工标注信息,对教师模型进行训练;利用训练好的教师模型,对其他图像进行自动标注处理;将人工标注结果和教师模型识别结果合并成新的数据集,并对学生模型进行训练,得到多模态文档内容识别模型。本发明采用教师模型蒸馏和思维链自动标注方案,仅需少量高精度人工标注样本,即可自动扩展大规模高质量训练数据,极大降低了人工标注的工作量和成本,为模型持续优化和落地应用提供经济高效的数据基础。
天眼查资料显示,忆生科技(深圳)有限公司,成立于2023年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本123.0887万人民币。通过天眼查大数据分析,忆生科技(深圳)有限公司共对外投资了2家企业,财产线索方面有商标信息9条,专利信息3条,此外企业还拥有行政许可5个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.