金融界2025年3月26日消息,国家知识产权局信息显示,深绎未来科技(广东横琴)有限公司申请一项名为“一种多语言大模型训练方法、装置及相关设备”的专利,公开号 CN 119670847 A,申请日期为2024年11月。
专利摘要显示,本发明公开了一种多语言大模型训练方法、装置及相关设备,所述方法包括:获取平行语料数据,并基于子任务类型对其进行格式转换,得到与多个子任务类型对应的数据格式;将平行语料数据和数据格式输入初始多语言大模型,该模型包括子网络层,子网络层与子任务类型一一对应;计算每个子网络层的损失τ;根据每个子网络层的损失τ,计算全局损失L;利用该L对模型进行更新,得到更新后的多语言大模型。采用本发明可以提高平行语料数据的利用效率,并在不影响多语言大模型的能力的基础上提高其对低资源语种的理解能力。
天眼查资料显示,深绎未来科技(广东横琴)有限公司,成立于2024年,位于珠海市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本100万人民币。通过天眼查大数据分析,深绎未来科技(广东横琴)有限公司共对外投资了1家企业,专利信息2条,此外企业还拥有行政许可2个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.