网易首页 > 网易号 > 正文 申请入驻

AI 技术获全球顶级学术会议认可,小米 2 篇论文入选 ICCV 2025

0
分享至

IT之家 7 月 8 日消息,据小米技术消息,计算机视觉国际大会 ICCV 2025 论文录用结果公布,小米两篇论文凭借创新性研究成果成功入选:视频理解大模型核心技术 Q-Frame,推出行业首个动态帧选择与分辨率自适应框架,实现即插即用;持续学习框架 Analytic Subspace Routing (Any-SSR),成功解决大语言模型在持续学习领域的核心难题「灾难性遗忘」问题

据介绍,计算机视觉国际大会 ICCV 与国际计算机视觉与模式识别会议 CVPR、欧洲计算机视觉国际会议 ECCV 并称为计算机领域世界三大顶级学术会议,每两年举办一次。其中,ICCV 2025 年投稿量达 11239 篇,录用率为 24%。上述两篇论文代表了小米 AI 团队在基座大模型领域的最新探索成果,其中视频理解大模型核心技术 Q-Frame 由小米 AI 团队全面自研,大模型持续学习框架 Any-SSR 由小米 AI 团队联合华南理工大学攻关

全自研视频理解大模型核心技术 Q-Frame

在视频理解大模型(Video-LLMs)的研究中,小米 AI 团队针对传统“均匀帧采样”处理方式存在时间碎片化信息丢失、盲目采样及算力浪费等问题痛点,推出全自研的 Q-Frame 核心技术,该成果以论文《Q-Frame: Query-aware Frame Selection and Multi-Resolution Adaptation for Video-LLMs》入选 ICCV 2025。

Q-Frame 作为视频理解大模型核心技术,是行业首个动态帧选择与分辨率自适应框架,也是首个无需训练,市面上各类视频理解大模型基座均可即插即用的算法框架。Q-Frame 拥有三大行业首次创新,能够精准理解视频内容与用户问题,通过精准捕捉跟用户问题最相关的视频关键内容,将有效信息量提升 5 倍:

  • 跨模态查询检索(Cross-modal Query Retrieval, CQR)
  • 查询感知帧选择(Query-aware Frame Selection, QFS)
  • 多分辨率自适应(Multi-Resolution Adaptation, MRA)

在 MLVU 评测集上,Q-Frame 使 Qwen2-VL 的理解准确率从 55.5% 提升至 65.4%;在 LongVideoBench 上,让 GPT-4o 的准确率从 53.3% 提升到 58.6% 。此外,其多分辨率自适应特性可根据内容重要性和查询需求动态调整帧分辨率,避免算力浪费。

通过采用动态查询感知帧选择和多分辨率自适应,Q-Frame 还有效解决了「均匀帧采样」策略下时间碎片化的信息丢失、问题无感知的盲目采样和分辨率一刀切的算力浪费三大难题。与传统均匀选帧、统一处理方式不同,在有限计算资源下,Q-Frame 可使模型更高效准确理解视频。

此外,Q-Frame 具有即插即用(plug-and-play)的特点,可与市场上现有的各类视频理解大模型兼容,无论是开源模型还是闭源模型,无需对模型进行额外的训练或微调。以 VILA-V1.5 和 Qwen2-VL 等开源模型为例,在集成 Q-Frame 后,这些模型在视频理解任务上的性能均得到了显著提升。同样,对于闭源的 GPT-4o 模型,Q-Frame 也展现出了良好的兼容性,进一步证明了其广泛的适用性。

Q-Frame 在小米「人车家全生态」战略中有着多元的应用场景,目前正在持续探索和落地:小米 YU7 发布时提到的哨兵模式中,能够分清楚普通的风吹草动和可能带来剐蹭、碰撞的危险行为;智能家居中,能够在监控画面中找到最关键的画面,帮助用户解答问题;在小爱视频问答场景中,可以直接定位到视频中能够解答问题的片段开始播放等。

大模型持续学习框架 Any-SSR

在大语言模型(LLMs)持续学习(Continual Learning, CL)领域,往往会因新任务的学习而导致对旧任务知识的遗忘,即灾难性遗忘问题。小米 AI 团队联合华南理工大学针对这一难题开展研究,其成果《Analytic Subspace Routing: How Recursive Least Squares Works in Continual Learning of Large Language Model》成功入选 ICCV 2025。

Any-SSR 框架作为行业首个将递归最小二乘法(Recursive Least Squares, RLS)引入大语言模型持续学习的技术框架,通过分析路由机制,动态地把不同任务分配到独立子空间学习,避免任务间知识干扰,创新性解决了大语言模型持续学习中灾难性遗忘问题。同时,利用低秩适应(Low-Rank Adaptation, LoRA)与分析路由相结合的方式,实现了新旧知识的无缝整合与动态学习。

在一系列技术创新的基础上,Any-SSR 方法实现了“近乎完美”的知识保留(即不遗忘),同时能无缝地学习新知识。在实验中,Any-SSR 在 TRACE 基准测试上的表现显著优于其他方法,包括多任务学习(MTL)等,不仅在整体性能(OP)上取得了优异成绩,还实现了零反向知识转移(BWT)

IT之家从小米技术获悉,过去五年,小米集团研发投入约 1020 亿元,在 2025 年的 300 亿研发投入中,大约有四分之一将被用于 AI 相关方向。未来五年(2026-2030 年),小米还将在核心技术赛道再投入 2000 亿元。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
朱玲玲最欣慰的不是生仨儿子,而是离婚后,前夫竟没给孩子找后妈

朱玲玲最欣慰的不是生仨儿子,而是离婚后,前夫竟没给孩子找后妈

以茶带书
2026-03-22 23:05:27
白宫晚宴摇滚乐,高市当场“发疯”?日本网友炸锅了!

白宫晚宴摇滚乐,高市当场“发疯”?日本网友炸锅了!

华山穹剑
2026-03-21 20:58:02
湖州风向突然变了!以前爱搭不理的西边,现在要让你高攀不起!

湖州风向突然变了!以前爱搭不理的西边,现在要让你高攀不起!

朗威谈星座
2026-03-23 01:35:48
史诗级封杀!2000万网红“听风的蚕”彻底凉了

史诗级封杀!2000万网红“听风的蚕”彻底凉了

互联网品牌官
2026-02-12 01:17:23
伊朗外长致函联合国 谴责美以袭击核设施

伊朗外长致函联合国 谴责美以袭击核设施

新华社
2026-03-23 04:10:04
德黑兰市区传出密集爆炸巨响

德黑兰市区传出密集爆炸巨响

财联社
2026-03-23 01:37:19
伊朗公布停战条件,特朗普下最后通牒:48小时内开放霍尔木兹,否则摧毁其各类发电厂,伊朗回应:若遭打击美国在该地区所有能源基础设施都将成为打击目标

伊朗公布停战条件,特朗普下最后通牒:48小时内开放霍尔木兹,否则摧毁其各类发电厂,伊朗回应:若遭打击美国在该地区所有能源基础设施都将成为打击目标

每日经济新闻
2026-03-22 11:33:08
离谱!中甲队连续2轮举报 致对手外援无法登场 开赛前1分钟被叫走

离谱!中甲队连续2轮举报 致对手外援无法登场 开赛前1分钟被叫走

我爱英超
2026-03-22 16:12:44
俄罗斯战略专家:“伊朗这一战,直接打出了未来50年的国运”

俄罗斯战略专家:“伊朗这一战,直接打出了未来50年的国运”

农夫史记
2026-03-21 20:35:17
男子用2条毒蛇泡酒,12年后打开本想品尝美酒,谁知出现惊人现象

男子用2条毒蛇泡酒,12年后打开本想品尝美酒,谁知出现惊人现象

诡谲怪谈
2025-04-01 17:37:59
儿子这3个特征,90%遗传自妈妈,对比后,心里就有底了

儿子这3个特征,90%遗传自妈妈,对比后,心里就有底了

艾米儿育儿
2026-03-18 12:15:58
足坛疯狂夜:曼城完虐阿森纳,热刺13轮不胜,巴萨5连胜

足坛疯狂夜:曼城完虐阿森纳,热刺13轮不胜,巴萨5连胜

春日筆記
2026-03-23 04:20:46
美军增兵、特朗普下通牒 伊朗称地面部队处于战备“巅峰状态”

美军增兵、特朗普下通牒 伊朗称地面部队处于战备“巅峰状态”

环球网资讯
2026-03-22 20:09:56
中国农民倒了什么血霉,被这样的人研究

中国农民倒了什么血霉,被这样的人研究

多村来信
2026-03-18 16:29:30
美参议院47-37否决限战法案,特朗普连下三道命令

美参议院47-37否决限战法案,特朗普连下三道命令

米师傅安装
2026-03-23 02:37:22
别划走!网传41岁张继科要搭档王曼昱,冲2029全运会混双!

别划走!网传41岁张继科要搭档王曼昱,冲2029全运会混双!

小光侃娱乐
2026-03-22 15:30:06
1979年开战前,广州军区副司令被军委免职,许世友:此乃兵家大忌

1979年开战前,广州军区副司令被军委免职,许世友:此乃兵家大忌

墨说古今
2026-03-15 23:43:17
汪小菲直播摊牌!新妻带儿回京,小玥儿处境太扎心

汪小菲直播摊牌!新妻带儿回京,小玥儿处境太扎心

动物奇奇怪怪
2026-03-22 21:30:29
中央电视台录播2026年3月23日至29日乒乓球比赛

中央电视台录播2026年3月23日至29日乒乓球比赛

乒乓球球
2026-03-23 00:17:30
中央发布2个重要文件,有关退休人员待遇!文件讲了什么,看看!

中央发布2个重要文件,有关退休人员待遇!文件讲了什么,看看!

天气观察站
2026-03-22 09:42:59
2026-03-23 05:11:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
335399文章数 607086关注度
往期回顾 全部

科技要闻

嫌台积电太慢 马斯克要把芯片产能飙升50倍

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

体育要闻

46岁生日快乐!巴萨全队穿10号致敬小罗

娱乐要闻

47岁“国际章”身材走样?让嘲笑她的人闭嘴

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

房产
家居
旅游
游戏
公开课

房产要闻

全城狂送1000杯咖啡!网易房产【早C计划】,即刻启动!

家居要闻

时空交织 空间绮梦

旅游要闻

这么近那么美 京津冀“周末串门游”走起

《龙之信条2》发售两周年 Steam版还有D加密

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版