网易首页 > 网易号 > 正文 申请入驻

CVPR 2021 | TPCN 点云就是这么美妙

0
分享至

  CVPR 2021 文章专题

  第·3·期

  本文 将分享香港科技大学发表于CVPR 2021的工作:TPCN:用于运动预测的时间点云网络

  本文提出了时间点云网络 (TPCN),这是一种新颖、灵活、能联合时空学习的轨迹预测框架。与将代理商和地图信息栅格化为2D图像或以图形表示形式运行的现有方法不同,该方法将点云学习与动态时间学习的思想扩展到了通过将轨迹预测分为空间和时间维度来捕获空间和时间信息的思想。

  在空间维度上,代理可以看作是无序的点集,因此可以直接将点云学习技术应用于代理位置的建模。虽然空间维度未考虑运动学和运动信息,但本文进一步提出了动态时间学习来模拟随时间变化的智能体运动。

  论文链接:

  https://arxiv.org/pdf/2103.03067.pdf

  后台回复【210318】可直接下载论文PDF~

  一、引 言

  随着自动驾驶的深入,planning以及prediction成为越来越关键的任务。以往的方法,其实大致可以分为三种,一种是ruled based的方式,通过运动学模型以及高精度地图进行约束;第二种是纯learning based的model;第三种就是planning + learning的方式,通过一个传统的prediction或者planning模块提供高质量的proposal,然后通过learning的方式进行refine以及classification,有点像RCNN。对于纯learning based的方式,根据输入的representation也可以分为rasterization image (MultiPath, ChauffeurNet等),vector representation (VectorNet),以及以laneconv为代表的图卷积神经网络。

  总体来说,prediction任务,其实是一个时间加空间信息相关的任务 (给定地图信息以及一系列agent历史的轨迹,推测agent未来的轨迹):

  时间信息可以提供运动信息比如速度加速度,

  空间信息更多的强调跟周围环境(地图)或者物体的交互信息。

  时间空间在这个任务里都是非常重要的部分,缺一不可。

  
二、研究动机

  对于这项任务,其实输入的就是离散的点,即使地图的车道线也可以离散化成地图点,同时这些点在空间上又具有稀疏性、离散稀疏、permutation invariant、尺度不变性,这几个属性其实就是点云数据的属性,只不过这些点有些带了时序信息,比如同一个agent在不同时刻的位置。因此,点云处理的想法应用在这个任务上非常有潜力,只不过我们得通过额外的处理手段去提取时序信息。因此,我们提出了TPCN,这是一个用来处理prediction问题中时序空间信息以及二者信息融合的灵活且同一的框架。

  总体来说,TPCN核心包含了两个模块:

  Dual-representation Spatial Learning

  Dynamic Temporal Learning

  三、主要观点
1. Dual-representation Spatial Learning.

  在点云任务中,PVCNN、PVRCNN等提出也论证了多视角、多种表征方式在点云特征学习的重要性,因此我们也采用了这种方式。本质上来说,这些方式其实都维护了不同表征下同一个点的一对一的索引关系,这里我们称之为indexing系统,有了这种一对一的mapping,我们可以很简单地完成point-level的融合。在这种想法的引导下,其实空间跟时间的点在这个任务其实也存在一对一的映射关系,因此我们也可以建立一套空间点到时间点的一对一的映射关系,我们称为Instance Time Indexing的系统。图2展示了一个简单的例子。

  2. Dynamic Temporal Learning.

  一旦有了一套Instance Time Indexing,我们就可以非常方便在时间和空间两个作用域进行point-level features的propagation,也可以进行时间跟空间上的point-level features的融合。这里之所以成为dynamic,是因为相比以前的方法,LaneConv是需要把所有的agents pad到固定的时间长度,然后处理的时间需要做masking,而我们的方式是没有任何冗余的特征表示形式。在此基础上,我们借鉴了PSPNet,利用GPU上的scatter、gather、unique等操作 (从代码的实现角度来说,也有不少的成熟库实现了相关的操作,比如pytorch_scatter),实现了多尺度的时间上的Multi-interval Learning以及Instance Pooling,具体操作可以参考文章的Sec.3.2。

  3. Joint Learning

  有了时序特征以及空间特征,我们在point-level的基础上就可以从时间转换到空间,也可以从空间转换到时间,时序特征以运动信息为主,空间信息关注地图、agent之间的交互,最后达到了一个统一灵活的学习框架。

  四、一些有用的技巧

  1. Displacement Prediction and Learning.

  因为prediction任务的多模态性质,很多时候网络会输出多条轨迹以及各自的概率,训练的过程中,一般是选择当前mFDE最小的轨迹进行反传,但是这个时候如果有两条的轨迹相当接近真值,其实也只会有一条进行反传,其实这是不合理的。因此,受到IoU Loss的启发,我们不预测概率而是预测displacement error,这样一来,在分类的loss branch,所有的样本以及预测的displacement都可以进行反传。这里不涉及到label的分配,把分类问题转化为回归问题,变成了一个类似于soft label的regression problem。实验证明,displacement loss优于分类的loss。

  2. Data augmentation

  同时对数据的分布的统计,我们也做一些data augmentation,比如随机缩放、random point drop这些小的trick对于最后模型性能也存在一定的提升

  
五、实验结果

  最后,我们在argoverse上面的验证集以及测试集验证了我们方法的有效性,包含了各个模块的消融实验。

  最后,在argoverse测试集的成绩,证明我们的TPCN有效提高的SOTA~

  六、结 论

  对于TPCN的时空模块来说,我们使用了sparse conv这种相比于rasterization image的方式,可以节省更多的内存,也是更compact的一种特征表达方式。

  对于TPCN来说,类似的idea其实可以拓展到很多领域,比如更多视角的点云空间的学习,其实也就是indexing系统,存在不同视角或者不同表征方式,我们只要能够找到一对一的mapping或者indexing关系,那么我们就可以完成point-level的融合以及特征层面上面的融合,而现有的代码scatter、gather、hashing、unique之类的函数都能够非常容易帮我们完成这一过程

  PointCloud learning is all you need.

  ref:

  [1] TNT: Target-driveN Trajectory Prediction

  [2] Learning Lane Graph Representations for Motion Forecasting

  [3] MultiPath: Multiple Probabilistic Anchor Trajectory Hypotheses

  [4] VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized Representation

  [5] ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst

  Illustration byIvan Haidutski from Icons8

  -The End-

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2-1!中超夺冠热门诞生:升班马奇迹登上榜首,5轮不败狂揽11分

2-1!中超夺冠热门诞生:升班马奇迹登上榜首,5轮不败狂揽11分

足球狗说
2026-04-11 20:58:02
伊朗人士:伊美谈判“不是面对面”

伊朗人士:伊美谈判“不是面对面”

新华社
2026-04-11 21:03:39
68岁赵本山现身海南悠闲逛街,打扮很潮流!买好几袋奢侈品好惬意

68岁赵本山现身海南悠闲逛街,打扮很潮流!买好几袋奢侈品好惬意

娱乐团长
2026-04-11 15:28:06
闫闯 被问买问界M6和Model Y哪个好? 被旁边大哥一句话干沉默了

闫闯 被问买问界M6和Model Y哪个好? 被旁边大哥一句话干沉默了

周哥一影视
2026-04-11 03:19:35
向太劝醒年轻人:没200万存款别买车!自己只开二手车钱全投房产

向太劝醒年轻人:没200万存款别买车!自己只开二手车钱全投房产

观鱼听雨
2026-04-11 20:38:34
郑丽文想要的,大陆给得很爽快,随行人员有惊喜,蓝营一姐发话了

郑丽文想要的,大陆给得很爽快,随行人员有惊喜,蓝营一姐发话了

阿伧说事
2026-04-11 05:56:00
2026苏超常州队大名单出炉,黄紫昌留队,苏超主题曲MV遭吐槽

2026苏超常州队大名单出炉,黄紫昌留队,苏超主题曲MV遭吐槽

第五才子
2026-04-11 17:08:35
赵子琪回应《乘风2026》被淘汰:我一点都不难过,不会再来;此前孙怡队长对决输给阚清子,赵子琪垫底出局

赵子琪回应《乘风2026》被淘汰:我一点都不难过,不会再来;此前孙怡队长对决输给阚清子,赵子琪垫底出局

鲁中晨报
2026-04-11 09:36:09
“十多年没遇到过这样的!”浙江房东崩溃,租客两年藏近千斤尿液在房间,柜子全被塞满……

“十多年没遇到过这样的!”浙江房东崩溃,租客两年藏近千斤尿液在房间,柜子全被塞满……

扬子晚报
2026-04-10 11:06:50
广西一小学生在闹市独自驾车行驶,被群众和交警拦下,知情人:偷拿老师车钥匙开车出来

广西一小学生在闹市独自驾车行驶,被群众和交警拦下,知情人:偷拿老师车钥匙开车出来

台州交通广播
2026-04-11 18:34:55
医院为啥抢着开“国际部”?不是老外多了,是医疗资源要重新分配

医院为啥抢着开“国际部”?不是老外多了,是医疗资源要重新分配

茶余饭好
2026-04-10 19:01:58
这一次,“宠女无度”的贾平凹被扒了个底朝天,王朔的评价是对的

这一次,“宠女无度”的贾平凹被扒了个底朝天,王朔的评价是对的

揽星河的笔记
2026-04-10 20:02:37
《权游》35岁男星因渐冻症去世,红发巨人的告别留言太通透了

《权游》35岁男星因渐冻症去世,红发巨人的告别留言太通透了

仰卧撑FTUer
2026-04-11 07:29:33
4月还未过半,50岁撒贝宁高调官宣喜讯,再次证明李白的选择没错

4月还未过半,50岁撒贝宁高调官宣喜讯,再次证明李白的选择没错

墨印斋
2026-04-11 14:56:51
哈萨克斯坦2000万吨稀土转卖美日,签完协议发现,还是绕不开中国

哈萨克斯坦2000万吨稀土转卖美日,签完协议发现,还是绕不开中国

蔡蔡说史
2026-04-11 04:25:53
乌度卡透露最终战轮休主力!无缘前4因三分命门 火记提前展望夏天

乌度卡透露最终战轮休主力!无缘前4因三分命门 火记提前展望夏天

颜小白的篮球梦
2026-04-11 13:12:32
郑丽文女保镖火了!她的眼神让全场震惊。

郑丽文女保镖火了!她的眼神让全场震惊。

小猫娱乐叭叭
2026-04-09 21:03:31
中央定调,6月1日起全国统一执行,家家户户用水迎来5大变化

中央定调,6月1日起全国统一执行,家家户户用水迎来5大变化

小谈食刻美食
2026-04-11 10:08:38
霍尔木兹海峡的深水主航道在阿曼一侧,波斯凭什么能主张收费

霍尔木兹海峡的深水主航道在阿曼一侧,波斯凭什么能主张收费

历史摆渡
2026-04-09 22:35:03
8888奔驰陪葬当事人已经认识到错误,他也确实非常有钱

8888奔驰陪葬当事人已经认识到错误,他也确实非常有钱

映射生活的身影
2026-04-10 19:15:23
2026-04-11 22:47:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2340文章数 596关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

霍尔木兹海峡突传大消息 特朗普最新发声

头条要闻

霍尔木兹海峡突传大消息 特朗普最新发声

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

郑钧回应儿子走路:会监督他挺直腰板

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

艺术
家居
亲子
旅游
时尚

艺术要闻

花6亿,烂尾12年,福建一处“顶奢别墅”,野草都长到三楼了

家居要闻

复古风格 自然简约

亲子要闻

糖果套圈圈想吃哪个套哪个

旅游要闻

火出圈!成都人民公园相亲角被老外包围了

普通人穿衣其实很简单!构造腰线、一衣多穿,大方舒适又自然

无障碍浏览 进入关怀版