网易首页 > 网易号 > 正文 申请入驻

AI 技术获全球顶级学术会议认可,小米 2 篇论文入选 ICCV 2025

0
分享至

IT之家 7 月 8 日消息,据小米技术消息,计算机视觉国际大会 ICCV 2025 论文录用结果公布,小米两篇论文凭借创新性研究成果成功入选:视频理解大模型核心技术 Q-Frame,推出行业首个动态帧选择与分辨率自适应框架,实现即插即用;持续学习框架 Analytic Subspace Routing (Any-SSR),成功解决大语言模型在持续学习领域的核心难题「灾难性遗忘」问题

据介绍,计算机视觉国际大会 ICCV 与国际计算机视觉与模式识别会议 CVPR、欧洲计算机视觉国际会议 ECCV 并称为计算机领域世界三大顶级学术会议,每两年举办一次。其中,ICCV 2025 年投稿量达 11239 篇,录用率为 24%。上述两篇论文代表了小米 AI 团队在基座大模型领域的最新探索成果,其中视频理解大模型核心技术 Q-Frame 由小米 AI 团队全面自研,大模型持续学习框架 Any-SSR 由小米 AI 团队联合华南理工大学攻关

全自研视频理解大模型核心技术 Q-Frame

在视频理解大模型(Video-LLMs)的研究中,小米 AI 团队针对传统“均匀帧采样”处理方式存在时间碎片化信息丢失、盲目采样及算力浪费等问题痛点,推出全自研的 Q-Frame 核心技术,该成果以论文《Q-Frame: Query-aware Frame Selection and Multi-Resolution Adaptation for Video-LLMs》入选 ICCV 2025。

Q-Frame 作为视频理解大模型核心技术,是行业首个动态帧选择与分辨率自适应框架,也是首个无需训练,市面上各类视频理解大模型基座均可即插即用的算法框架。Q-Frame 拥有三大行业首次创新,能够精准理解视频内容与用户问题,通过精准捕捉跟用户问题最相关的视频关键内容,将有效信息量提升 5 倍:

  • 跨模态查询检索(Cross-modal Query Retrieval, CQR)
  • 查询感知帧选择(Query-aware Frame Selection, QFS)
  • 多分辨率自适应(Multi-Resolution Adaptation, MRA)

在 MLVU 评测集上,Q-Frame 使 Qwen2-VL 的理解准确率从 55.5% 提升至 65.4%;在 LongVideoBench 上,让 GPT-4o 的准确率从 53.3% 提升到 58.6% 。此外,其多分辨率自适应特性可根据内容重要性和查询需求动态调整帧分辨率,避免算力浪费。

通过采用动态查询感知帧选择和多分辨率自适应,Q-Frame 还有效解决了「均匀帧采样」策略下时间碎片化的信息丢失、问题无感知的盲目采样和分辨率一刀切的算力浪费三大难题。与传统均匀选帧、统一处理方式不同,在有限计算资源下,Q-Frame 可使模型更高效准确理解视频。

此外,Q-Frame 具有即插即用(plug-and-play)的特点,可与市场上现有的各类视频理解大模型兼容,无论是开源模型还是闭源模型,无需对模型进行额外的训练或微调。以 VILA-V1.5 和 Qwen2-VL 等开源模型为例,在集成 Q-Frame 后,这些模型在视频理解任务上的性能均得到了显著提升。同样,对于闭源的 GPT-4o 模型,Q-Frame 也展现出了良好的兼容性,进一步证明了其广泛的适用性。

Q-Frame 在小米「人车家全生态」战略中有着多元的应用场景,目前正在持续探索和落地:小米 YU7 发布时提到的哨兵模式中,能够分清楚普通的风吹草动和可能带来剐蹭、碰撞的危险行为;智能家居中,能够在监控画面中找到最关键的画面,帮助用户解答问题;在小爱视频问答场景中,可以直接定位到视频中能够解答问题的片段开始播放等。

大模型持续学习框架 Any-SSR

在大语言模型(LLMs)持续学习(Continual Learning, CL)领域,往往会因新任务的学习而导致对旧任务知识的遗忘,即灾难性遗忘问题。小米 AI 团队联合华南理工大学针对这一难题开展研究,其成果《Analytic Subspace Routing: How Recursive Least Squares Works in Continual Learning of Large Language Model》成功入选 ICCV 2025。

Any-SSR 框架作为行业首个将递归最小二乘法(Recursive Least Squares, RLS)引入大语言模型持续学习的技术框架,通过分析路由机制,动态地把不同任务分配到独立子空间学习,避免任务间知识干扰,创新性解决了大语言模型持续学习中灾难性遗忘问题。同时,利用低秩适应(Low-Rank Adaptation, LoRA)与分析路由相结合的方式,实现了新旧知识的无缝整合与动态学习。

在一系列技术创新的基础上,Any-SSR 方法实现了“近乎完美”的知识保留(即不遗忘),同时能无缝地学习新知识。在实验中,Any-SSR 在 TRACE 基准测试上的表现显著优于其他方法,包括多任务学习(MTL)等,不仅在整体性能(OP)上取得了优异成绩,还实现了零反向知识转移(BWT)

IT之家从小米技术获悉,过去五年,小米集团研发投入约 1020 亿元,在 2025 年的 300 亿研发投入中,大约有四分之一将被用于 AI 相关方向。未来五年(2026-2030 年),小米还将在核心技术赛道再投入 2000 亿元。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
婚前非处率超82%:当代年轻人的婚姻,大多是“玩够了再上岸”

婚前非处率超82%:当代年轻人的婚姻,大多是“玩够了再上岸”

舒山有鹿
2026-06-02 10:36:38
U19国足土伦杯首败!媒体人热议:该换门将了,没进攻没爆点

U19国足土伦杯首败!媒体人热议:该换门将了,没进攻没爆点

奥拜尔
2026-06-02 23:13:23
基辅高官人人自危!俄军包了一个“大饺子”:乌军四个旅见死不救

基辅高官人人自危!俄军包了一个“大饺子”:乌军四个旅见死不救

影孖看世界
2026-05-31 23:19:30
东北华北等地有强对流 南方地区将有较强降水

东北华北等地有强对流 南方地区将有较强降水

中国气象局
2026-06-02 08:08:07
伊朗媒体新发布最高领袖穆杰塔巴·哈梅内伊照片

伊朗媒体新发布最高领袖穆杰塔巴·哈梅内伊照片

环球网资讯
2026-06-02 11:52:10
郑州一渣土车与两轮电动车相撞致3人死亡,河南省安委会挂牌督办

郑州一渣土车与两轮电动车相撞致3人死亡,河南省安委会挂牌督办

澎湃新闻
2026-06-02 13:24:26
穆迪首席经济学家:若一周左右特朗普还无法解决美伊冲突 恐致美国经济衰退

穆迪首席经济学家:若一周左右特朗普还无法解决美伊冲突 恐致美国经济衰退

财联社
2026-06-02 11:04:18
青岛城阳区委书记主动投案,距离前任落马仅月余

青岛城阳区委书记主动投案,距离前任落马仅月余

据说无据
2026-06-02 18:22:56
苏州一对情侣,谈了7年,女子提了18次分手,分手后在街头痛哭!

苏州一对情侣,谈了7年,女子提了18次分手,分手后在街头痛哭!

川渝视觉
2026-04-17 22:13:14
CBA场均仅2.9分之人屡进国家队!他真有潜力还是郭士强夹带私货?

CBA场均仅2.9分之人屡进国家队!他真有潜力还是郭士强夹带私货?

大嘴爵爷侃球
2026-05-31 12:10:16
一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

路医生健康科普
2026-05-31 20:15:03
养老金上涨正式敲定!新标准出炉,快看看你每月多领多少?

养老金上涨正式敲定!新标准出炉,快看看你每月多领多少?

新国学文化
2026-06-01 19:33:28
宋庆龄晚年:人民英雄永垂不朽,其实是毛主席给自己写的墓志铭

宋庆龄晚年:人民英雄永垂不朽,其实是毛主席给自己写的墓志铭

历史图鉴
2026-06-02 18:43:28
没想到,“割四赔五”风波9天后,崔培军凭一番话,赚足农民口碑

没想到,“割四赔五”风波9天后,崔培军凭一番话,赚足农民口碑

削桐作琴
2026-06-02 20:05:30
斯诺克榜单更新!赵心童入围,成历史第12人,新赛季冲世界第1!

斯诺克榜单更新!赵心童入围,成历史第12人,新赛季冲世界第1!

刘姚尧的文字城堡
2026-06-02 11:38:39
房东“电话被打爆,谁约都不见”!上海二手房迎来超长“小阳春”,5月成交量创近6年新高

房东“电话被打爆,谁约都不见”!上海二手房迎来超长“小阳春”,5月成交量创近6年新高

每日经济新闻
2026-06-02 14:06:09
恭喜!王梦洁入选,张常宁在列,大名单公布,女排有四人

恭喜!王梦洁入选,张常宁在列,大名单公布,女排有四人

跑者排球视角
2026-06-02 23:31:32
马上评|严惩造谣者,不让实干者流汗再流泪

马上评|严惩造谣者,不让实干者流汗再流泪

澎湃新闻
2026-06-02 12:12:26
80岁不管存款多少,记得提前给自己准备4样东西,建议了解

80岁不管存款多少,记得提前给自己准备4样东西,建议了解

小谈食刻美食
2026-04-27 07:57:04
波兰要求泽连斯基道歉

波兰要求泽连斯基道歉

参考消息
2026-06-02 15:25:20
2026-06-03 02:59:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
347579文章数 607266关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

手机
家居
亲子
艺术
军事航空

手机要闻

华为畅享100 Pro Max被曝立项:代号叶问,真的要打十个了!

家居要闻

流线型轮廓 包容多元身形

亲子要闻

这才是新手爸妈应该刷到的儿童急救知识!

艺术要闻

抖音砸60个亿,要盖一座“不像医院”的医院?

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版