网易首页 > 网易号 > 正文 申请入驻

揭秘多模态大模型:像人类一样“回看”视频思考,阿里ReWatch刷新SOTA

0
分享至

阿里巴巴未来生活实验室的研究团队针对多模态大模型视频推理痛点推出解决方案,相关论文已被ICLR 2026录用。


研究团队指出,数学推理与视频推理存在任务性质的根本差异,前者是纯文本空间的逻辑推导,后者需要在视觉内容与文本逻辑间反复穿梭验证,直接套用文本思维链易导致模型产生臆测与幻觉。

为解决这一问题,研究团队构建了高质量视频推理数据集ReWatch,并推出可像人类一样“回看”视频思考的SOTA模型ReWatch-R1。

ReWatch数据集包含1万条视频、17万组问答对和13.5万条思维链,针对现有训练数据视频描述粗糙、问答过于简单、思维链依赖文本常识而非视频内容的痛点,具备三大核心优势:一是通过分层字幕生成方法制作高保真时序字幕,为长视频生成带精确时间戳的详细事件描述;二是采用“摘要vs精读”对比生成策略与三层过滤机制打造高难度视频问答,确保问题需依赖视频细节解答;三是首创多智能体ReAct框架生成视频接地的思维链,通过“推理智能体”与“观察智能体”协作,记录“去视频哪里看”与“看到了什么”的推理轨迹。

在模型训练方面,研究团队采用SFT+RL范式,核心为带过程奖励的强化学习。该机制将推理过程拆解为视频+问题→观察+推理→答案,针对中间环节设置观察奖励与推理奖励:观察奖励将模型生成的观察结果与数据集中的高保真字幕比对,匹配度越高奖励越高;推理奖励验证模型能否仅凭自身观察结果推导出正确答案,以此抑制推理幻觉,让模型学会基于视频证据进行过程导向的思考。

实验结果显示,ReWatch-R1在五个主流视频推理基准上,平均性能显著超越所有同量级开源模型,取得SOTA成绩。研究团队还发现,监督微调阶段“思考模式”性能未能超越“直接回答”模式,而经过强化学习阶段后,“思考模式”性能实现飞跃,证明强化学习是释放模型思考潜力的关键。

该研究通过智能体合成数据方法解决了高质量视频推理数据稀缺的瓶颈,借助过程奖励强化学习教会模型基于视频证据深度思考,为高阶视频智能发展提供了可行路径。

市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:观察君

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小舅子群里安排过年聚餐,我秒回:房已卖,正和你姐飞马尔代夫

小舅子群里安排过年聚餐,我秒回:房已卖,正和你姐飞马尔代夫

晓艾故事汇
2026-01-10 09:09:29
就2个人住 一年却用了400多吨水?民警调查发现老人儿子是诈骗案嫌疑人

就2个人住 一年却用了400多吨水?民警调查发现老人儿子是诈骗案嫌疑人

闪电新闻
2026-01-31 14:04:11
大哥还是大哥!各大品牌因为奔驰140岁生日,团结在了一起

大哥还是大哥!各大品牌因为奔驰140岁生日,团结在了一起

AutoBusiness
2026-01-30 16:06:31
水贝黄金店门口排长队,宝妈们押上全部积蓄,却连本金都拿不回来

水贝黄金店门口排长队,宝妈们押上全部积蓄,却连本金都拿不回来

王二哥老搞笑
2026-01-31 01:01:04
突发!全球金融巨震

突发!全球金融巨震

魏家东
2026-01-31 11:59:19
金晨拿出手术记录,给不相信的人看看,娱乐圈不是没有先例

金晨拿出手术记录,给不相信的人看看,娱乐圈不是没有先例

乐悠悠娱乐
2026-01-31 11:19:14
58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

锋哥与八卦哥
2026-01-25 13:26:51
完胜!山东女排3-1力克江苏,攻手多点开花,吴梦洁35分独木难支

完胜!山东女排3-1力克江苏,攻手多点开花,吴梦洁35分独木难支

骑马寺的少年
2026-01-31 20:00:19
再夺澳网冠军!中国金花手握五星红旗庆祝 重返世界前10 激动相拥

再夺澳网冠军!中国金花手握五星红旗庆祝 重返世界前10 激动相拥

侃球熊弟
2026-01-31 10:25:12
澳媒:中国已拥有可击败美军的战斗机!但美军拥有至关重要的王牌

澳媒:中国已拥有可击败美军的战斗机!但美军拥有至关重要的王牌

沧海旅行家
2026-01-27 18:06:02
特朗普提名凯文沃什任美联储主席

特朗普提名凯文沃什任美联储主席

新京报
2026-01-30 19:53:37
高铁上女子崩溃大哭:“我妈妈没了”;同车厢乘客关掉手机声安静陪伴,列车工作人员第一时间上前安抚

高铁上女子崩溃大哭:“我妈妈没了”;同车厢乘客关掉手机声安静陪伴,列车工作人员第一时间上前安抚

环球网资讯
2026-01-31 08:33:10
凯瑟琳・奥哈拉离世,《小鬼当家》主演隔空喊妈,好莱坞众星致哀

凯瑟琳・奥哈拉离世,《小鬼当家》主演隔空喊妈,好莱坞众星致哀

译言
2026-01-31 05:32:53
她一生“风流成性、老少通吃”,撩汉无数,现如今56岁却依旧单身

她一生“风流成性、老少通吃”,撩汉无数,现如今56岁却依旧单身

青橘罐头
2026-01-28 11:57:14
国米多重意外之喜!迪迪发威胜强敌,锋线再现2+2轮换体系!

国米多重意外之喜!迪迪发威胜强敌,锋线再现2+2轮换体系!

肥强侃球
2026-01-30 23:03:00
“废掉”一个孩子,就让ta待在家里,一天到晚待在家里

“废掉”一个孩子,就让ta待在家里,一天到晚待在家里

行者马生的笔记
2026-01-27 21:15:41
冯玉祥在河南驻军时下达军令:妓女必须全部嫁给和尚做老婆

冯玉祥在河南驻军时下达军令:妓女必须全部嫁给和尚做老婆

旧时楼台月
2026-01-30 17:21:17
华为宣布:最高降4000元!此前苹果开启大降价

华为宣布:最高降4000元!此前苹果开启大降价

每日经济新闻
2026-01-29 18:19:05
为什么大多数中国家长无法独立带娃?网友的分享犹如醍醐灌顶

为什么大多数中国家长无法独立带娃?网友的分享犹如醍醐灌顶

另子维爱读史
2026-01-31 20:12:55
山东懵了,河南看呆,江苏又拿下一个“全国首单”

山东懵了,河南看呆,江苏又拿下一个“全国首单”

音乐时光的娱乐
2026-01-31 15:18:52
2026-01-31 21:23:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 545850关注度
往期回顾 全部

科技要闻

SpaceX申请部署百万卫星 打造太空数据中心

头条要闻

"天安门墙绘"创作者带17位村民登上长城 老人激动落泪

头条要闻

"天安门墙绘"创作者带17位村民登上长城 老人激动落泪

体育要闻

新时代得分王!东皇37+三双刷7纪录怒吼释放

娱乐要闻

李维嘉、吴昕、汪涵现身魏文彬追悼会

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

游戏
时尚
本地
健康
手机

《上古卷轴5》设计师:属性系统的精简至关重要

10个瞬间,回顾这一年

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

耳石症分类型,症状大不同

手机要闻

iQOO 15 Ultra手机搭载29根环绕天线并新增N79频段

无障碍浏览 进入关怀版