国家知识产权局信息显示,清华大学、杭州阿里云飞天信息技术有限公司申请一项名为“视频问答任务的执行方法、装置以及电子设备”的专利,公开号CN121210709A,申请日期为2025年8月。
专利摘要显示,本发明提供一种视频问答任务的执行方法、装置以及电子设备,涉及人工智能技术领域。其中,视频问答任务的执行方法包括:获取待提取视频和包含视频问答任务的问题文本;利用多模态大模型,根据问题文本,从待提取视频中提取与视频问答任务匹配的视频片段;其中,多模态大模型是利用第一训练数据集和第二训练数据集对初始多模态大模型进行继续训练得到的,第一训练数据集由第一样本数据构成,第二训练数据集由第一样本数据和第二样本数据构成;第一样本数据携带定位标签和答案标签,第二样本数据携带答案标签,且不携带定位标签。本发明可以有效提升多模态大模型在视频问答任务中的定位精度与解答多样性,以克服现有多模态大模型在时序信息理解、泛化能力及多解探索方面的局限性。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.