网易首页 > 网易号 > 正文 申请入驻

他在同济学汽车,今年拿下CVPR最佳学生论文奖

0
分享至

梦晨 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

从汽车动力学“转行”智能视觉感知,3年斩获2篇CVPR论文。

其中一篇,还是今年CVPR论文的最佳学生论文奖。

奖项颁了二十多届,今年第一次颁给来自中国高校的学生一作,打败了哈佛大学博士生&谷歌的另一篇论文研究。

这是同济大学在读二年级硕士、阿里达摩院实习生陈涵晟的真实经历。

转方向前,他对汽车动力学同样兴趣十足,曾经加入过赛车队,主导空气动力学开发,最终团队在大学生国际赛事上获了奖;

读研第一年,论文就入选了CVPR,但却因为理论不够充分,转而继续深入研究,才有了今年这篇最佳学生论文奖。

在与陈涵晟同学的交流中,我们了解了更多关于他的故事。

本科第五年才转型自动驾驶

陈涵晟就读的同济汽车学院,本科是五年制。

一入学他就参加了同济翼驰车队。这是一个上百人组成的学生社团,在学校、学院和赞助商支持下,每年都会设计、制造赛车并参加国内和国际比赛。

在车队里陈涵晟负责的是空气动力学开发,主要涉及仿真计算、曲面建模等技术。

他渐渐成为车队的骨干,还助力团队在2018年的日本大学生方程式赛车上拿了最佳空气动力学奖。

其实汽车和计算机都是陈涵晟从小开始就有的爱好,他表示自己也搞不清楚更喜欢哪个,另外数学也是他一直感兴趣的学科。

高考后他也曾考虑过计算机专业,不过最终还是选择了汽车。

到毕业那年,他看到一个把这些爱好更紧密结合起来的新道路。

智能汽车、自动驾驶的大潮来了。

当时,同济刚成立不久的智能汽车研究所也在招生,他的毕业设计就选择了自动驾驶方向。

  • 有机遇,就想尝试一下新东西。

陈涵晟加入了熊璐教授的课题组开始学习新知识,熊璐老师也将成为他后来在研究生阶段的导师。

熊璐现任同济大学新能源汽车工程中心副主任,长期从事汽车底盘控制、分布式驱动电动汽车动力学控制相关科研工作,

在研究生阶段陈涵晟还有一位副指导老师,同济大学汽车学院助理教授田炜,他主要研究智能驾驶的环境目标感知技术和轨迹预测技术。

转方向、学习交叉学科压力会很大吗?陈涵晟认为对他来讲并不会很累,反而两个领域的碰撞总能让他产生更多灵感。

  • 毕业那年是这些年来最舒服最轻松的那年,完全地去学习新知识,有很大的收获感。
不满足炼丹要搞懂理论,一连斩获2篇CVPR

到了研一,田炜老师给他布置的课题方向是在传统模型中中加入概率和不确定性。

陈涵晟将之与自己感兴趣的3D物体位姿问题结合起来,发表了他的第一篇CVPR。

虽然中了顶会,不过陈涵晟还是觉得差了些什么。

  • 这篇文章是根据经验设计的,虽然模型效果好但我不明白他为什么效果好,也无法用数学理论去证明这个方法就是最优的。

这次获奖的第二篇论文与之前相比最大的突破点,陈涵晟认为在于“从理论出发去解决问题”。

  • 我们把各种方法都统一起来,套在一个大框架里面。
  • 然后又从这个框架里找到了一个更通用、效果更好的方法,第二篇论文就诞生了。

陈涵晟的这两篇CVPR论文,具体来说研究的都是通过单张2D图像估计3D物体位姿的问题。

对于人类来说,通过一张2D照片,判断里面各物体大致的位置很简单。

但对于计算机来说,这是个颇为复杂的问题,像下面这些车在它看来,并没有远/近的距离感:

因此,如何让计算机学会通过2D照片估计3D物体的位置和朝向,就变成了一个需要解决的问题,像自动驾驶(用摄像头估计车辆位置)、AR(判断虚拟物体距离)等领域都要用到:

然而,现有的两类解决方法几何推理深度学习,都有一定缺陷。

几何推理,最常见的就是PnP(Perspective-n-Point)算法,具体指通过已知的n个3D空间点(c1、c2、c3、c4)的坐标、对应2D平面上点的坐标,结合相机内参来反推相机的位姿。

本质上来说,就是找到3D空间点的坐标系w以及相机坐标系c的对应关系,来推导出相机和这些3D点的空间距离:

△PnP图示,来源OpenCV文档

这个方法非常简洁,原理也好理解,然而必须得有一大堆参数(3D、2D坐标和对应的相机内参)才能计算出结果。现实是往往只能用一张2D照片做估计,没有对应的3D坐标。

深度学习方法倒是不需要这么多参数,直接用AI搞预测就行。

但这样问题又来了,不仅模型可解释性差,预测结果不一定准确,而且数据集样本量少的时候,还非常容易过拟合。

他的第一篇论文,便是在PnP算法中引入了不确定性,在此基础上提出MonoRUn检测算法。

相比用自监督方法直接学习位姿,这篇论文先用自监督方法学习2D和3D坐标之间的关系,再用PnP算法求解。

论文估计了坐标预测结果的不确定性,并用不确定性PnP算法,让模型学会关注不确定性较低的前景点(检测对象的点)。

MonoRUn做出来后,效果很好,不需要提前知道物体的几何形状,就能预测3D位姿,直接登上CVPR 2021。

但这却让陈涵晟有点懵:为啥用不确定性PnP算法,效果就这么好?

这一方向上继续深入研究之后,他最终发现了“盲点”:PnP算法本质上在某些点是不可导的。

也就是说,上一篇论文把不确定性引入PnP算法,虽然效果很好,但本质上将PnP视为确定性这一操作并不可导。

这会导致PnP算法求解得到模糊的位姿解,从而导致反向传播(收敛过程)不稳定。

一番思索后,陈涵晟突然意识到,为什么不将这种确定性问题转化成概率密度的问题呢?

也就是说,将PnP的输出视为位姿的概率密度函数,这样问题就从不可导变成了可导,这便是End-to-end Probabilistic Perspective-n-Points(EPro-PnP)算法的由来。

这次的模型做出来后,灵活性和可解释性都得到了很大的提升,收敛也稳定多了,最终在CVPR 2022中获得最佳学生论文奖。

据陈涵晟介绍,第二篇论文是他在阿里达摩院做研究型实习生期间完成的。

达摩院的研究氛围很好,与他同期的一组实习生虽然做的都是不同方向,但经常和带他们的几位老师在一起讨论问题。

  • 论文里面虽然没有挂上那么多人的名字,但很多细节都是在平时的讨论中获得灵感,再完善出来。

相比之下,今年疫情封校期间他一直待在宿舍,“缺少了和人的交流,研究灵感反而少了很多”。

陈涵晟还提到了实习期间“算力充足”的快乐——

搞这项研究期间,达摩院的导师王丕超还特意帮他多申请了一台服务器,才能顺利完成整个模型的研究训练。

还以为比较冷门,没想到能够获奖

这次成果能获奖,陈涵晟和导师、达摩院的几位合作者都没有预料到。

  • 我原来以为这篇论文可能比较冷门,因为太偏数学,没想到能够获奖。

整个作者团队没有人在美国新奥尔良的CVPR现场,领奖还是远程接入的。

不过从这届CVPR整体风格来看,确实更倾向于基础理论而不是更热门的模型结构调整方向。

像最佳论文奖,也是颁给了一项用神经网络解决传统几何问题的研究。

就陈涵晟观察,CVPR的评委可能更多的是在鼓励理论上具有突破传统范式的贡献。

对于获奖时有什么想法,陈涵晟的回答很实在:

  • 最大的感触就是以后的路更好走了。

如今面临研究生毕业,陈涵晟对未来的打算很明确,想继续做科研。

  • 不过以后不一定是做自动驾驶领域的科研,可能还会尝试新东西,主要还是按自己的兴趣去做。

在交流中,我们观察到兴趣是陈涵晟做事最大的驱动力,一旦开始做事他就会非常投入。

有达摩院的同事爆料他推导公式时不时会拍自己大腿,甚至吓到周围的人。

陈涵晟觉得可能是因为自己太专注了,成功或者出错都会情不自禁表达一下激动或沮丧的心情。

除了专注,他还擅长把不同兴趣结合起来。

他在本科时参加了合唱团,那时他也会利用编程创作音乐作品、或者用计算机模拟管风琴。

最后,我们问了问他对于做科研有什么心得。

陈涵晟认为独立思考是最值得一说的。

很多时候他面对一个课题不是先把领域内的文章通通看一遍,而是自己先尝试,有了比较完善的想法之后再去读论文。

  • 如果有人做的话,至少说明我的思路是正确的。如果没有人做的话,有可能我发现了一个新的东西。

论文链接:
https://arxiv.org/abs/2203.13254

参考链接:
[1]https://cvpr2022.thecvf.com/cvpr-2022-paper-awards
[2]https://wap.peopleapp.com/article/6767948/6638309
[3]https://arxiv.org/abs/2103.12605
[4]https://weibo.com/2027586097/Gyx9dp8lN

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄罗斯宣布:芬兰已成核打击目标!

俄罗斯宣布:芬兰已成核打击目标!

看看新闻Knews
2026-07-03 13:09:37
我,15年670万卖掉上海房子,送儿子去美国留学,如今损失2000万

我,15年670万卖掉上海房子,送儿子去美国留学,如今损失2000万

人间百态大全
2026-07-03 06:35:04
他若不死,国民党不会败退台湾!蒋介石痛悔亲手杀了这个人

他若不死,国民党不会败退台湾!蒋介石痛悔亲手杀了这个人

历史人文2
2026-07-02 20:30:03
苏亚雷斯:下半场因为两个失误,我们付出了比较沉重的代价

苏亚雷斯:下半场因为两个失误,我们付出了比较沉重的代价

懂球帝
2026-07-05 00:26:02
1995年看露天电影时,邻家嫂子偷偷摸了一下我的手,示意我跟她走

1995年看露天电影时,邻家嫂子偷偷摸了一下我的手,示意我跟她走

千秋文化
2026-07-02 19:32:08
西安赛格事件升级!消费者晒票据:7000送7000,会员都参与拆分单

西安赛格事件升级!消费者晒票据:7000送7000,会员都参与拆分单

社会日日鲜
2026-07-04 06:39:59
日元再崩!多家巨头预测,美元兑日元或冲205!兑人民币跌至3.5!在日华人要注意了

日元再崩!多家巨头预测,美元兑日元或冲205!兑人民币跌至3.5!在日华人要注意了

东京在线
2026-07-04 22:15:39
阿媒:阿根廷战埃及首发或换三处,梅西锋线搭档再成疑问

阿媒:阿根廷战埃及首发或换三处,梅西锋线搭档再成疑问

懂球帝
2026-07-05 06:40:06
每年消耗两千吨扑克,澳门赌场宁愿高价海外采购,也不用国产的?

每年消耗两千吨扑克,澳门赌场宁愿高价海外采购,也不用国产的?

科技故事聚焦
2026-07-03 21:31:20
名古屋亚运会还没开,日本主办方已经先急眼了

名古屋亚运会还没开,日本主办方已经先急眼了

阿振观点
2026-07-04 19:16:05
一觉醒来,WTT美国大满贯,国乒传来三大振奋人心的好消息!

一觉醒来,WTT美国大满贯,国乒传来三大振奋人心的好消息!

田先生篮球
2026-07-04 06:54:57
德尚:因为怕姆巴佩被铲伤,我让最强壮的两名球员去把他围住

德尚:因为怕姆巴佩被铲伤,我让最强壮的两名球员去把他围住

懂球帝
2026-07-05 07:42:08
上海人马上自查!这些“囤货”赶紧扔,没过期也不能要!黄梅天最要警惕

上海人马上自查!这些“囤货”赶紧扔,没过期也不能要!黄梅天最要警惕

新浪财经
2026-07-05 07:08:00
保险卖不动了,700万人集体离场。

保险卖不动了,700万人集体离场。

流苏晚晴
2026-07-04 18:54:07
终于弄明白为啥开空调蚊子就不咬了:不是蚊子被冻着了,也不是蚊子不想咬,而是蚊子的“导航系统”失灵了!

终于弄明白为啥开空调蚊子就不咬了:不是蚊子被冻着了,也不是蚊子不想咬,而是蚊子的“导航系统”失灵了!

犀利辣椒
2026-07-05 06:20:51
美媒:中国每年800万大学生,精英少得可怜,理科天才都入了美籍

美媒:中国每年800万大学生,精英少得可怜,理科天才都入了美籍

荆楚寰宇文枢
2026-07-04 22:59:18
恭喜!47岁李晨官宣喜讯,赠豪车,公开晒结婚照,网友:新婚快乐

恭喜!47岁李晨官宣喜讯,赠豪车,公开晒结婚照,网友:新婚快乐

素衣读史
2026-07-05 05:05:15
你被骗了几十年!地球不是飘在太空,它已经往下掉了46亿年

你被骗了几十年!地球不是飘在太空,它已经往下掉了46亿年

观察宇宙
2026-07-03 17:52:58
面对只会哭泣和抱怨的“巨婴”,中国太难了

面对只会哭泣和抱怨的“巨婴”,中国太难了

大树乡谈
2026-07-04 23:57:56
黄有龙澳洲赌债案一审落槌:2.8亿输光、2.7亿还清,亿元利息主张

黄有龙澳洲赌债案一审落槌:2.8亿输光、2.7亿还清,亿元利息主张

天气观察站
2026-07-02 14:42:09
2026-07-05 09:27:00
量子位 incentive-icons
量子位
追踪人工智能动态
12893文章数 176510关注度
往期回顾 全部

教育要闻

老师都没想到,同学错了一大半

头条要闻

浙江商人用23年从身无分文穷小子 变佛得角总理座上宾

头条要闻

浙江商人用23年从身无分文穷小子 变佛得角总理座上宾

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

科技要闻

韬定律论文V2版,充工程细节和实测数据

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

游戏
旅游
教育
公开课
军事航空

韩版“全境封锁”PC配置降低 内存改为32GB起步

旅游要闻

轻旅居成文旅新时尚,上海参事:一日外滩打卡,能否变“一周栖居”?

教育要闻

河南高考历史类420分,想学动物医学和中医针灸按摩,这样报志愿

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京宣布俄军“完全解放”卢甘斯克

无障碍浏览 进入关怀版