网易首页 > 网易号 > 正文 申请入驻

何恺明评审,谢赛宁获奖!牛津华人博士生拿下CVPR 2025最佳论文

0
分享至

  新智元报道

  编辑:犀牛 好困

  【新智元导读】CVPR 2025奖项重磅揭晓!华人博士生王建元凭借创新论文摘得最佳论文奖。Hao Su、谢赛宁获年轻研究者奖。本届大会投稿量激增13%,接收率22.1%,全球超9000名学者齐聚,学术盛况空前。

  就在刚刚,CVPR 2025大会最佳论文等奖项发布!

  今年共有14篇论文入围最佳论文角逐,最终5篇脱颖而出:1篇摘得最佳论文奖,4篇获得最佳论文荣誉提名。

  此外,还有1篇最佳学生论文和1篇最佳学生论文荣誉提名。

  大会官方统计,今年的投稿量再创新高!

  来自全球4万多名作者的13008篇论文蜂拥而至,比去年(11532篇)增长了13%。

  最终,2872篇论文被接收,每篇论文由3位审稿人和1位领域主席评审,总体接收率为22.1%。

  其中,96篇(3.3%)入选Oral报告,387篇(13.7%)被选为Highlight展示。

  投稿作者、审稿人和领域主席(AC)的数量都创下了历史新高。

  现场参会人数也相当壮观,超过9000名学者从70多个国家和地区赶来。

  CVPR 2025官方还公布了各细分领域的论文接收情况:图像与视频生成领域的接收数量最多,而多视角/传感器3D和单图像3D领域的接收率最高。

  审稿人质量统计显示,学术界审稿人中有70.4%达到预期水平,PhD学生和产业界审稿人分别有24.9%和24.1%的表现超出预期,展现了较高水平的评审能力。

  低于预期的比例则相对较低,学术界为6.9%、PhD学生为4.6%、产业界为6.8%,表明整体审稿质量较为稳定。

  值得一提的是,最佳论文奖评审委员会中还有我们熟悉的AI大牛——ResNet的作者何恺明!

  年轻研究员奖

  本次大会颁发了两个年轻研究者奖,获奖者分别是加州大学圣迭戈分校的副教授Hao Su和纽约大学计算机科学助理教授谢赛宁。

  这个奖项每年都会颁给在计算机视觉领域有突出研究贡献的年轻学者,但获奖者拿到博士学位的时间不能超过七年。

  Hao Su,北大航空航天大学应用数学博士,斯坦福大学数学与计算机科学博士,现在是加州大学圣迭戈分校的副教授(兼职)。

  他的研究方向很广,覆盖了计算机视觉、计算机图形学、机器学习、通用人工智能和机器人技术。

  去年,他还参与创立了一家叫Hillbot的机器人公司,担任CTO。

  谢赛宁,2013年从上海交通大学本科毕业,2018年在加州大学圣迭戈分校计算机科学与工程系拿到了博士学位,研究方向主要是深度学习和计算机视觉。

  之后,他加入了Facebook人工智能研究室(FAIR)做研究科学家。

  2022年,他和William Peebles一起发表了DiT论文,首次把Transformer和扩散模型结合了起来。

  荣誉提名

  获得荣誉提名的是Ishan Misra,在Meta的GenAI团队担任研究科学家主任,领导视频生成模型的研究工作。

  在此之前,他在Meta的FAIR团队,专注于计算机视觉的自监督学习和多模态学习。

  他在卡内基梅隆大学拿到了博士学位。2024年,因为在计算机视觉和机器学习方面的研究贡献,获得了卡内基梅隆大学颁发的近期校友成就奖。

  最佳论文

  VGGT: Visual Geometry Grounded Transformer

  作者:Jianyuan Wang,Minghao Chen,Nikita Karaev,Andrea Vedaldi,Christian Rupprecht,David Novotny

  机构:牛津大学,Meta AI

  论文地址:https://arxiv.org/abs/2503.11651

  代码模型:https://github.com/facebookresearch/vggt

  本次CVPR 2025最佳论文来自牛津大学、Meta AI,提出了一种前馈神经网络,能够从场景的单个、少量或数百个视图中直接推断出其所有关键三维属性,包括相机参数、点图、深度图和三维点轨迹。

  在三维计算机视觉领域,模型通常仅限于并专用于单一任务,而这种方法代表了该领域的一大进步。

  它还兼具简洁与高效的特点,能在一秒内完成图像重建,并且其性能优于那些需要采用视觉几何优化技术进行后处理的替代方案。

  该网络在多项三维任务中均取得了当前最佳SOTA成果,包括相机参数估计、多视图深度估计、密集点云重建以及三维点跟踪。

  文中还证明,使用预训练的VGGT作为特征主干网络,能显著增强下游任务的性能,例如非刚性点跟踪和前馈式新视角合成。

  论文第一作者Jianyuan Wang为Facebook AI Research和牛津大学视觉几何组(VGG)的联合博士研究生。

  他的博士研究专注于打造创新的端到端几何推理框架,主导开发了PoseDiffusion、VGGSfM,以及本次提出的通用3D基础模型VGGT。

  同样是Jianyuan Wang作为第一作者的VGGSfM研究被CVPR 2024接收,并入选Highlight论文。

  另一位华人作者Minghao Chen是牛津大学的博士生,导师是Andrea Vedaldi教授和Iro Laina博士。同时,也在Meta GenAI进行研究科学家实习。

  此前,他曾在石溪大学攻读博士学位,师从Haibin Ling教授。期间在微软亚洲研究院实习,合作导师为Houwen Peng博士。

  他分别在哥伦比亚大学获得硕士学位,在北京航空航天大学获得学士学位。

  最佳学生论文

  Neural Inverse Rendering from Propagating Light

  作者:Anagh Malik,Benjamin Attal,Andrew Xie,Matthew O’Toole,David B. Lindell

  机构:多伦多大学,Vector Institute,卡内基梅隆大学

  论文地址:https://arxiv.org/pdf/2506.05347

  最佳学生论文来自多伦多大学、Vector Institute以及CMU,提出了基于物理的神经逆渲染,利用多视角视频中的光传播进行处理。

  该方法依赖于神经辐射缓存的时序扩展技术——这种技术通过存储从任意方向到达任意点的无限次反射辐射来加速逆渲染。

  由此生成模型能精确模拟直接和间接光传输效应,结合闪光激光雷达系统的捕捉数据,即使在强间接光环境下也能实现顶尖的3D重建。

  此外,本文展示了光传播的视图合成、自动分解捕捉数据为直接和间接分量,以及对捕获场景进行多视图时间分辨重新照明等新功能。

  本文的时间分辨渲染器结合基于物理的主射线渲染和神经渲染的间接辐射缓存,计算传感器像素处的入射辐射。优化场景外观和几何形状,确保渲染与捕获测量一致。

  与基线相比,本文中的方法能够恢复更准确的法线以及相似或更优的强度图像(见激光雷达帧插图中的箭头)。

  荣誉提名

  最佳论文提名

  论文1:MegaSaM: Accurate, Fast and Robust Structure and Motion from Casual Dynamic Videos

  作者:Zhengqi Li,Richard Tucker,Forrester Cole,Qianqian Wang,Linyi Jin,Vickie Ye,Angjoo Kanazawa,Aleksander Holynski,Noah Snavely

  机构:Google DeepMind,加州大学伯克利分校,密歇根大学

  论文地址:https://arxiv.org/abs/2412.04463

  论文2:Navigation World Models

  作者:Amir Bar,Gaoyue Zhou,Danny Tran,Trevor Darrell,Yann LeCun

  机构:Meta,纽约大学,伯克利AI研究院

  论文地址:https://arxiv.org/abs/2412.03572

  论文3:Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models

  作者:Matt Deitke,Christopher Clark,Sangho Lee,Rohun Tripathi,Yue Yang,Jae Sung Park,Reza Salehi,Niklas Muennighoff,Kyle Lo,Luca Soldaini,Jiasen Lu,Taira Anderson,Erin Bransom,Kiana Ehsani,Huong Ngo,Yen-Sung Chen,Ajay Patel,Mark Yatskar,Chris Callison-Burch,Andrew Head,Rose Hendrix,Favyen Bastani,Eli VanderBilt,Nathan Lambert,Yvonne Chou,Arnavi Chheda-Kothary,Jenna Sparks,Sam Skjonsberg,Michael Schmitz,Aaron Sarnat,Byron Bischoff,Pete Walsh,Christopher Newell,Piper Wolters,Tanmay Gupta,Kuo-Hao Zeng,Jon Borchardt,Dirk Groeneveld,Crystal Nam,Sophie Lebrecht,Caitlin Wittlif,Carissa Schoenick,Oscar Michel,Ranjay Krishna,Luca Weihs,Noah A. Smith,Hannaneh Hajishirzi,Ross Girshick,Ali Farhadi,Aniruddha Kembhavi

  机构:艾伦人工智能研究所,华盛顿大学,宾夕法尼亚大学

  论文地址:https://arxiv.org/abs/2409.17146

  论文4:3D Student Splatting and Scooping

  作者:Jialin Zhu,Jiangbei Yue,Feixiang He,He Wang

  机构:伦敦大学学院

  论文地址:https://arxiv.org/abs/2503.10148

  最佳学生论文提名

  论文:Generative Multimodal Pretraining with Discrete Diffusion Timestep Tokens

  作者:Kaihang Pan,Wang Lin,Zhongqi Yue,Tenglong Ao,Liyu Jia,Wei Zhao,Juncheng Li,Siliang Tang,Hanwang Zhang

  机构:浙江大学,南洋理工大学,北京大学,华为新加坡研究所

  论文地址:https://arxiv.org/abs/2504.14666

  最佳论文候选

  国内高校机构云集

  可以说,在整个最佳论文的候选名单中,不仅有大量的华人作者,还有很多来自国内的高校和机构。

  比如浙江大学,西湖大学,香港中文大学,香港科技大学(广州),湖南大学,华中科技大学,南京大学,以及商汤等等。

  完整名单:https://cvpr.thecvf.com/virtual/2025/events/AwardCandidates2025

  PAMI-TC奖

  Thomas Huang纪念奖

  Thomas S. Huang纪念奖表彰的是在科研、教学与指导以及为计算机视觉学术社区服务方面堪为楷模的研究人员。每年授予一名博士毕业至少7年的研究者,处于职业生涯中期(博士毕业不超过25年)的学者将获优先考虑。

  该奖设立于CVPR 2020,自2021年起每年颁发一次,旨在纪念已故的Thomas S. Huang教授。

  今年获奖的Kristen Grauman在FAIR担任研究科学家,同时也是德克萨斯大学奥斯汀分校计算机科学系的教授。

  她于2006年获得了麻省理工学院的博士学位,是IEEE Fellow、AAAI Fellow、斯隆学者,并荣获了「计算机与思想奖」。

  她的研究方向为计算机视觉与机器学习,专注于视觉识别、视频分析、第一人称视角感知和具身智能。

  Longuet-Higgins奖

  Longuet-Higgins奖以理论化学家和认知科学家H. Christopher Longuet-Higgins的名字命名,授予的是在10年前发表且对计算机视觉研究产生重大影响的CVPR论文。

  今年获得该奖的论文共有两篇。

  论文1:Going deeper with convolutions

  作者:Christian Szegedy,Wei Liu,Yangqing Jia,Pierre Sermanet,Scott Reed,Dragomir Anguelov,Dumitru Erhan,Vincent Vanhoucke,Andrew Rabinovich

  机构:谷歌,北卡罗来纳大学教堂山分校,密歇根大学

  论文2:Fully Convolutional Networks for Semantic Segmentation

  作者:Jonathan Long,Evan Shelhamer,Trevor Darrell

  机构:加州大学伯克利分校

  参考资料:

  https://x.com/CVPR/status/1933525241877442670

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
几十个家庭垄断一座城:县城婆罗门的闭环游戏,正在逼走年轻人

几十个家庭垄断一座城:县城婆罗门的闭环游戏,正在逼走年轻人

黑噪音
2026-03-21 19:33:08
疯了!孙怡《乘风2026》封神现场:盘腿坐喝奶茶怼刘芸

疯了!孙怡《乘风2026》封神现场:盘腿坐喝奶茶怼刘芸

小椰的奶奶
2026-04-06 18:18:30
欧美高管访华后集体失眠:中国凭什么让百年巨头慌了?

欧美高管访华后集体失眠:中国凭什么让百年巨头慌了?

奇思妙想生活家
2026-04-07 03:12:08
不惜一切!东契奇赴欧“黑科技”疗伤,干细胞+高压氧,真拼了啊

不惜一切!东契奇赴欧“黑科技”疗伤,干细胞+高压氧,真拼了啊

球童无忌
2026-04-07 01:30:06
不说话,不吃植入零食,偶像包袱又重,他上《五哈6》干嘛来了?

不说话,不吃植入零食,偶像包袱又重,他上《五哈6》干嘛来了?

往史过眼云烟
2026-04-05 16:45:07
一年亏损四千万,全国陷“关停潮”,曾经的金饭碗如今正惨遭抛弃

一年亏损四千万,全国陷“关停潮”,曾经的金饭碗如今正惨遭抛弃

忠于法纪
2026-04-06 15:10:31
大快人心!国家出手擒下3名华人首富,他们干的事,根本不能饶恕

大快人心!国家出手擒下3名华人首富,他们干的事,根本不能饶恕

墨印斋
2026-03-24 21:34:56
1-0胜南美劲旅,中国男足在法国获国际赛事第7名,刘凯源远程炮制胜

1-0胜南美劲旅,中国男足在法国获国际赛事第7名,刘凯源远程炮制胜

侧身凌空斩
2026-04-06 18:17:35
销量超一半出口海外!中国“智”造,全球爆单

销量超一半出口海外!中国“智”造,全球爆单

中国能源网
2026-04-07 10:44:08
女演员晒出多张亲密照!从马略卡游艇到沙发,知情人士:没抓马

女演员晒出多张亲密照!从马略卡游艇到沙发,知情人士:没抓马

观察鉴娱
2026-04-07 11:35:13
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
于谦被曝成老赖,坐拥北京 60 亩马场,巨额债务真相藏不住了

于谦被曝成老赖,坐拥北京 60 亩马场,巨额债务真相藏不住了

橙星文娱
2026-04-06 13:09:46
曹智跨市履新宿迁市委常委、市政府党组副书记

曹智跨市履新宿迁市委常委、市政府党组副书记

环球网资讯
2026-04-06 14:32:44
震惊!约在星巴克见面,女生喝冰咖啡后在厕所报警,怀疑男方下药

震惊!约在星巴克见面,女生喝冰咖啡后在厕所报警,怀疑男方下药

火山詩话
2026-04-06 07:26:53
Deepseek提醒:从小允许玩手机和禁止玩的孩子,长大后差距明显!

Deepseek提醒:从小允许玩手机和禁止玩的孩子,长大后差距明显!

户外阿毽
2026-04-06 18:09:59
张万年傅全有等站两边,中间那位老人是谁?

张万年傅全有等站两边,中间那位老人是谁?

文史茶馆2020
2026-03-31 17:08:36
抓紧将“鼓励生育”确立为基本国策,对公职人员带头生育列入考核

抓紧将“鼓励生育”确立为基本国策,对公职人员带头生育列入考核

星空区块链
2026-04-06 19:57:31
印媒:巴基斯坦,再次进口70架歼10CE,凑齐100架编队?

印媒:巴基斯坦,再次进口70架歼10CE,凑齐100架编队?

万里繁华
2026-04-06 11:23:16
少跟孩子生气,因为这一世的相遇,背后藏着你看不见的因果

少跟孩子生气,因为这一世的相遇,背后藏着你看不见的因果

杏花烟雨江南的碧园
2026-04-03 15:15:03
业绩暴增!300821,“20cm”涨停

业绩暴增!300821,“20cm”涨停

数据宝
2026-04-07 10:43:16
2026-04-07 12:19:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14915文章数 66754关注度
往期回顾 全部

教育要闻

学校的校规真的可以这么离谱吗?

头条要闻

北京侨商会:沉痛悼念深切缅怀陈丽华会长

头条要闻

北京侨商会:沉痛悼念深切缅怀陈丽华会长

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

张艺上浪姐惹争议 黄景瑜前妻发文内涵

财经要闻

2026年,全国租房市场还有波降价潮

科技要闻

年化营收300亿美元!Anthropic砸算力大单

汽车要闻

广汽电池独立战,背后的产业链博弈

态度原创

艺术
本地
时尚
亲子
公开课

艺术要闻

美丽风光看不尽

本地新闻

跟着歌声游安徽,听古村回响

今年最火的4双平底鞋,配白裙子穿好看又松弛!

亲子要闻

为什么说养孩子等于“毁容”?看看前后对比照,宝妈们的辛酸泪

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版