金融界2024年11月14日消息,国家知识产权局信息显示,北京字跳网络技术有限公司申请一项名为“模型训练方法及设备”的专利,公开号CN 118940852 A,申请日期为2023年5月。
专利摘要显示,本公开实施例提供一种模型训练方法及设备,该方法包括:获取训练样本,并将所述训练样本分别输入学生模型和教师模型,获得第一输出值和第二输出值,根据第一输出值、第二输出值和真值标签确定真值损失函数和蒸馏损失函数,确定自适应调节参数,根据真值损失函数、蒸馏损失函数和自适应调节参数,确定总损失函数,根据总损失函数对学生模型进行训练。本实施例提供的模型训练方法,通过确定并加入自适应调节参数,使得真值损失函数和蒸馏损失函数的权重能够在训练过程中进行自适应调节,提高训练效率,避免复杂的权重调节过程,降低了成本。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.