NVIDIA 带来知乎精彩问答甄选系列,将为您精选知乎上有关 NVIDIA 产品的精彩问答。
本期为问答甄选第二十期 —— 分享自动驾驶相关精彩问题
添加图片注释,不超过 140 字(可选)
以下两个知乎甄选问答将为您了解自动驾驶相关内容带来更加精彩的解答!
Q:自动驾驶训练所需的复杂场景在现实生活中很难收集,现在有什么方法可以解决这一问题吗?
A:
在近期发布的一篇论文中,NVIDIA Research 展示了一种基于神经辐射场(NeRF)的新方法——EmerNeRF 及其如何使用自监督学习准确生成动态场景。通过自监督方法训练,EmerNeRF 在动静态场景重建上的表现超越了之前其他 NeRF 方法。
相比其他 NeRF 重建方法,EmerNeRF 的动态场景重建准确率高出 15%,静态场景高出 11%,新视角合成的准确率也高出 12%。
EmerNeRF 使用的是自监督学习,而非人工注释或外部模型,这使得它能够避开之前方法所遇到的难题。
EmerNeRF 将场景分解成动态和静态元素。在场景分解的同时,EmerNeRF 还能估算出动态物体(如汽车和行人)的流场,并通过聚合流场在不同时间的特征以进一步提高重建质量。其他方法会使用外部模型提供此类光流数据,但通常会引入偏差。
通过将静态场、动态场和流场结合在一起,EmerNeRF 能够充分表达高密度动态场景,这不仅提高了重建精度,也方便扩展到其他数据源。
EmerNeRF 的表现还优于专门用于静态场景的方法。这表明将场景分解为静态和动态元素的自监督分解既能够改善静态重建,还能够改善动态重建。
与以前的方法相比,EmerNeRF 能够更准确地表现和重建动态场景,而且无需人工监督或外部模型。这样就能大规模地重建和编辑复杂的驾驶数据,解决目前自动驾驶汽车训练数据集的不平衡问题。
Q:如何使 AI 生成的交通仿真更加接近真实世界的复杂程度?
A:
无论是突然加塞(cut-in),还是无意地 U 形掉头,人类驾驶员的行为通常难以预测。行为的不可预测性源自人类决策过程的天然复杂性, 往往受多种因素的影响,而且在不同的运行设计域(ODD)和国家也会有所不同,因此很难在仿真中模拟驾驶行为。
但自动驾驶汽车(AV)的开发人员需要有把握地开发和部署能够在不同 ODD 环境以及多样的交通行为下运行的驾驶系统。NVIDIA Research 团队最近发表的论文BITS: Bi-Level Imitation for Traffic Simulation 中概述了一种仿真现实世界交通行为的新方法,该方法可以帮助开发人员做到这一点。
交通仿真 Bi-Level 模仿(BITS)是一种交通模型,该模型能够以惊人的逼真度还原现实世界的复杂性,而且性能超过了以往的方法。在该论文详细介绍的一个试验中,BITS 的覆盖范围和多样性较性能次佳的模型分别提高了 64% 和 118%,失败率降低了 36%。
BITS 能达到高保真度和多样性,要归功于其层次化的模型结构。
该模型的两个分支均基于现实世界的交通日志上训练而成。High-level 分支用于预测车辆的潜在目标,Low-level 分支用于生成实现潜在目标的策略。通过任务分解,从而将为不同轨迹建模的任务交给 High-level 分支,而目标导向的 Low-level 策略生成能够更加高效地运行。
BITS 还包含一个预测与规划模块,有助于在新环境和大跨度的时间内稳定模型表现。为此,该模块会评估模型的可能轨迹并选择那些遵循合理驾驶行为规则的轨迹,降低了偏离合理行为的风险。
在仿真中模仿现实交通行为的能力对于开发强大的自动驾驶技术至关重要。通过优化保真度和多样性,BITS 使 AI 生成的交通仿真更加接近真实世界的复杂程度。NVIDIA 的目标是进一步开发和完善 BITS,并最终将其集成到 NVIDIA DRIVE Sim 的生产管线中。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.