金融界2025年6月11日消息,国家知识产权局信息显示,海棠元镜(天津)科技有限公司申请一项名为“一种降低深度学习模型响应时延的方法、装置及存储介质”的专利,公开号CN120123093A,申请日期为2025年03月。
专利摘要显示,本发明涉及一种降低深度学习模型响应时延的方法、装置及存储介质,应用于人工智能技术领域,包括:通过滑动窗口采样获取历史负载,基于历史负载使用动态联合预测机制获取初始负载预测数据,通过对应的负载实际数据序列获取误差补偿值,通过对初始负载预测数据进行误差补偿,得到最终负载预测数据;基于最终负载预测数据序列确定未来一段时间所需的实例总数;通过调整当前正在运行的实例数量以匹配未来一段时间所需的实例总数,从而降低大规模深度学习模型推理工作的响应时延;本申请通过精确的工作负载预测和资源调度,能够有效减少模型推理的响应时延,提高服务水平目标的达成率,并降低服务成本。
天眼查资料显示,海棠元镜(天津)科技有限公司,成立于2024年,位于天津市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本10万人民币。通过天眼查大数据分析,海棠元镜(天津)科技有限公司共对外投资了1家企业,专利信息1条,此外企业还拥有行政许可1个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.