网易首页 > 网易号 > 正文 申请入驻

首尔大学突破:LiDAR实现自动驾驶中人机交互精准识别能力提升

0
分享至


在自动驾驶技术快速发展的今天,如何让汽车准确识别行人的各种动作成为了一个至关重要的安全问题。当你在街头看到有人骑自行车、推着婴儿车或者打着雨伞走路时,这些看似简单的场景对自动驾驶汽车来说却是极具挑战性的识别任务。最近,由首尔大学智能感知与人工智能研究所以及电子与计算机工程系联合开展的一项突破性研究,为这一技术难题提供了全新的解决方案。

这项研究由Daniel Sungho Jung、Dohee Cho和Kyoung Mu Lee等研究人员完成,发表于2026年3月的arXiv预印本平台,论文编号为arXiv:2603.16343v1。研究团队开发了一个名为HOIL(Human-Object Interaction Learning)的创新框架,专门用于从LiDAR点云数据中准确估计人体姿态,特别是在人与物体发生互动的复杂场景中。

要理解这项研究的重要性,我们首先需要了解什么是LiDAR技术。LiDAR就像是汽车的"超级眼睛",它通过发射激光束来感知周围环境,形成由无数个点组成的三维空间图像,这些点被称为"点云"。相比传统摄像头,LiDAR能够提供精确的距离和深度信息,即使在光线昏暗或恶劣天气条件下也能正常工作,因此成为自动驾驶汽车的重要传感器。

然而,现有的LiDAR人体姿态估计技术面临着两个关键挑战。第一个挑战可以比作在一堆混合的积木中分辨不同颜色的块。当人与物体接触时,比如手握雨伞把手或脚踩自行车踏板,LiDAR获得的点云数据会将人体部位和物体表面混合在一起,形成"空间模糊性"问题。就像你试图在黑暗中分辨紧贴在一起的两个物体一样,系统很难准确判断哪些点属于人体,哪些点属于物体。

第二个挑战则像是在人群中寻找少数几个特定的人。在LiDAR数据中,人体与物体接触最频繁的部位——手部和脚部,由于体积相对较小,获得的点云数据非常稀少。相比身躯或背景区域动辄成千上万个数据点,手脚部位可能只有几十个点,形成严重的"类别不平衡"问题。这就好比在一个有一千人的体育场里,只有几个人穿着红色衣服,系统很容易忽视这些重要但稀少的信息。

为了解决这些难题,研究团队开发了HOIL框架,它就像一位经验丰富的侦探,专门善于在复杂线索中找到关键信息。HOIL的工作原理可以用一个精心设计的学习过程来理解:它首先在五个不同的人机交互数据集上进行"预训练",这些数据集包括BEHAVE、CHAIRS、HODome、OMOMO和InterCap,涵盖了人与各种物体(如椅子、自行车、日常用品等)的22,000到921,000个不同的交互样本。

HOIL的核心创新在于两个关键技术组件。第一个是"人机交互感知对比学习"(HOICL),这就像训练一个专门的图像识别专家,让它能够准确区分紧密接触的不同物体。通过对比学习的方式,系统学会了在特征空间中将人体点和物体点明确分离开来,特别是在手脚等接触区域。这个过程类似于训练一个品酒师,让他能够在混合的味道中准确识别出每种成分。

第二个核心技术是"接触感知的部位引导池化"(CPPool),这个组件就像一个智能的资源分配系统。在传统的处理方法中,所有区域都被平等对待,就像一个不分轻重缓急的工作分配方式。而CPPool能够识别出哪些区域是人机接触的重要部位,然后给这些区域分配更多的"注意力"和计算资源。具体来说,它会压缩那些信息过度丰富的非接触区域(如身躯和背景),同时保留和增强那些稀少但关键的接触区域信息。

研究团队还设计了一个可选的"基于接触的时间细化"模块,这就像给系统增加了一个时间记忆功能。当系统在某一帧中对手脚位置的判断不够准确时,它会回顾前后几帧的信息,利用接触状态的连续性来修正错误。这种方法类似于我们在看模糊的连环画时,会结合前后几页的内容来理解当前页面的情况。

在实际测试中,HOIL展现出了显著的性能提升。在Waymo数据集上,HOIL的平均关节位置误差(MPJPE)达到了48.83毫米,相比之前的最佳方法DAPT的51.59毫米有了明显改善。在关键点正确率方面,HOIL在PCK-3指标上达到98.51%,在PCK-5指标上达到99.14%,都超越了现有的先进方法。这些数字背后意味着什么呢?简单来说,就是系统能够更准确地预测人体关节的位置,特别是在人与物体互动的复杂场景中。

研究团队通过详细的消融实验证明了各个组件的有效性。关于人机交互感知对比学习的实验显示,当逐步加入全局对比学习、频繁交互区域对比学习和接触对比学习时,系统性能逐步提升,其中接触对比学习的贡献最为显著,带来了2.16%的性能提升。这说明在接触区域确实存在严重的空间模糊性问题,而HOICL能够有效解决这个问题。

在接触感知的部位引导池化方面,实验结果表明,当同时考虑部位信息和接触信息时,系统的PCK-5指标超过了99%,相比基础版本有了显著提升。最大的性能增益来自于接触信息的加入,这验证了研究团队关于接触区域存在严重类别不平衡问题的假设。

为了更直观地展示HOIL的优势,研究团队提供了大量的定性结果。在处理一个人打着雨伞行走的场景时,传统的DAPT方法因为雨伞造成的空间模糊性而错误预测了手部位置,而HOIL准确地识别出了正确的手部姿态。在自行车骑行场景中,DAPT错误地将骑行者预测为站立姿态,而HOIL成功识别出了正确的坐姿。这些实际案例清楚地展示了HOIL在复杂人机交互场景中的优越性。

研究还深入分析了空间模糊性问题的影响。通过研究分割准确性与人体姿态估计误差之间的相关性,团队发现两者之间存在-0.59的相关系数,这强有力地证明了准确区分人体点和物体点对于姿态估计的重要性。同时,对不同身体部位误差的分析显示,手腕和脚踝等频繁交互部位的误差确实显著高于其他部位,验证了类别不平衡问题的存在。

从计算效率角度来看,HOIL在保持高精度的同时也维持了合理的计算开销。模型包含5300万个参数,在推理时消耗8435MB GPU内存,运行速度达到155.52 Hz,相当于每处理一个点云场景仅需6.43毫秒。这样的性能表现使得HOIL能够满足自动驾驶等实时应用的需求。

这项研究的意义远远超出了技术层面的提升。在自动驾驶领域,准确识别行人的各种行为对于确保交通安全至关重要。当系统能够准确判断一个人是在推婴儿车、骑自行车还是携带其他物品时,汽车就能更好地预测行人的下一步行为,从而做出更加安全的驾驶决策。这不仅能够减少交通事故的发生,还能提升乘客和行人的安全感。

除了自动驾驶,这项技术还有着广泛的应用前景。在智能监控系统中,它能够帮助识别异常行为或安全威胁。在人机协作机器人领域,准确的人体姿态识别有助于机器人更好地理解人类的意图和动作。在虚拟现实和增强现实应用中,这种技术能够提供更加自然和准确的人体动作捕捉。

然而,研究团队也诚实地指出了当前方法的一些局限性。首先,HOIL目前仅依赖LiDAR数据,没有融合RGB图像信息。虽然LiDAR提供了精确的几何信息,但RGB图像包含丰富的语义和上下文信息,两者结合可能会带来更好的效果。其次,由于LiDAR的扫描特性,距离传感器较远的人体获得的点云数据会更加稀疏,这在一定程度上限制了系统的性能。

另一个重要限制是训练数据的多样性。虽然研究使用了五个不同的人机交互数据集,但某些重要的交互场景(如骑摩托车)在数据中相对较少,这可能影响系统在这些场景中的表现。未来的研究可能需要更加丰富和多样化的训练数据来进一步提升系统的泛化能力。

说到底,首尔大学的这项研究代表了LiDAR人体姿态估计领域的一个重要进步。通过巧妙地解决空间模糊性和类别不平衡两个核心问题,HOIL为自动驾驶和其他智能系统提供了更加可靠的人体理解能力。这不仅是技术上的突破,更是朝着更安全、更智能的未来交通系统迈出的重要一步。

虽然距离完全解决所有相关挑战还有很长的路要走,但这项研究无疑为后续的科学探索奠定了坚实的基础。随着技术的不断发展和完善,我们有理由相信,未来的自动驾驶汽车将能够更好地理解和预测人类行为,从而创造一个更加安全和便利的交通环境。对于普通人来说,这意味着我们距离真正安全可靠的自动驾驶技术又近了一步,而这种技术进步最终将使我们所有人受益。

有兴趣深入了解这项研究技术细节的读者,可以通过arXiv:2603.16343v1查询完整论文,或关注首尔大学智能感知与人工智能研究所的后续研究进展。

Q&A

Q1:HOIL框架是什么技术?

A:HOIL是首尔大学开发的人机交互学习框架,专门用于从LiDAR点云数据中准确估计人体姿态。它的核心能力是在人与物体互动的复杂场景中,准确区分人体部位和物体表面,解决传统方法容易混淆的空间模糊性问题。

Q2:LiDAR人体姿态估计有什么实际应用?

A:主要应用于自动驾驶汽车的行人检测和行为预测,帮助车辆准确识别行人是否在骑车、推车或携带物品,从而做出更安全的驾驶决策。此外还可用于智能监控、人机协作机器人和虚拟现实等领域。

Q3:HOIL技术相比传统方法有什么优势?

A:HOIL在复杂人机交互场景中表现更准确,特别是在处理手脚等接触部位时。在Waymo数据集测试中,其关键点正确率超过98%,明显优于现有方法,能够准确识别骑车、打伞等复杂动作场景。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CCTV5直播巴萨vs皇马:巴萨不败就夺冠 皇马内讧难阻死敌卫冕

CCTV5直播巴萨vs皇马:巴萨不败就夺冠 皇马内讧难阻死敌卫冕

智道足球
2026-05-10 10:50:48
7分5板2助!又一个塔克诞生,哈登说得对,阿特金森该让他首发了

7分5板2助!又一个塔克诞生,哈登说得对,阿特金森该让他首发了

画夕
2026-05-10 20:52:11
茶叶是血糖的“加速器”?医生忠告:不想血糖升高,少喝4种茶

茶叶是血糖的“加速器”?医生忠告:不想血糖升高,少喝4种茶

阿莱美食汇
2026-05-10 19:59:18
男人过了60岁,永远不要在女人面前,说这5句话

男人过了60岁,永远不要在女人面前,说这5句话

风起见你
2026-05-11 01:01:37
贺希宁:重回四强来之不易,三年前被浙江绝杀成就了今天的我们

贺希宁:重回四强来之不易,三年前被浙江绝杀成就了今天的我们

懂球帝
2026-05-10 23:29:40
消失的美嘉生私生子了

消失的美嘉生私生子了

毒舌扒姨太
2026-05-10 22:36:37
马云:王中军是我见过中国最懒的CEO

马云:王中军是我见过中国最懒的CEO

时事娱闻杂记
2026-05-09 19:45:15
有出息的孩子,童年都有信号:出现这3种表现说明父母养对了

有出息的孩子,童年都有信号:出现这3种表现说明父母养对了

木言观
2026-05-04 07:08:52
巴尔韦德:“他们在荒谬的情况下进球了”

巴尔韦德:“他们在荒谬的情况下进球了”

绿茵情报局
2026-05-11 01:22:37
阿尔特塔确认本·怀特伤退:情况不乐观

阿尔特塔确认本·怀特伤退:情况不乐观

绿茵狂热者
2026-05-11 04:01:33
斯洛特下课倒计时?罗马诺最新爆料,利物浦锁定传奇主帅

斯洛特下课倒计时?罗马诺最新爆料,利物浦锁定传奇主帅

澜归序
2026-05-11 03:02:04
乌克兰击沉里海舰队导弹舰!摧毁全俄最大的两座炼油厂

乌克兰击沉里海舰队导弹舰!摧毁全俄最大的两座炼油厂

项鹏飞
2026-05-08 19:30:06
“你要收费我就卸载”,全网最离不开的AI不装了,口碑大反转

“你要收费我就卸载”,全网最离不开的AI不装了,口碑大反转

果壳
2026-05-09 12:33:57
190元白嫖榴莲被刑拘后,女子再迎三大噩耗,恐将变刑事审判

190元白嫖榴莲被刑拘后,女子再迎三大噩耗,恐将变刑事审判

北纬的咖啡豆
2026-05-10 09:37:00
一旦装上心脏支架,还能活多少年?医生不再隐瞒,说出了实话

一旦装上心脏支架,还能活多少年?医生不再隐瞒,说出了实话

医学原创故事会
2026-05-01 23:20:56
云南一交管大队队长被举报在KTV违规饮酒与女子举止亲密,本人称喝的茶水,女子突然靠近我下意识推了她;官方:初步调查举报不实

云南一交管大队队长被举报在KTV违规饮酒与女子举止亲密,本人称喝的茶水,女子突然靠近我下意识推了她;官方:初步调查举报不实

大象新闻
2026-05-10 08:42:28
两分半钟全部售完!广州楼市“日光盘”出现

两分半钟全部售完!广州楼市“日光盘”出现

爱看剧的阿峰
2026-05-10 13:46:54
撒贝宁一家现身重庆!蹲地上给女儿拍照超宠爱,妻子李白长腿吸睛

撒贝宁一家现身重庆!蹲地上给女儿拍照超宠爱,妻子李白长腿吸睛

青梅侃史啊
2026-05-10 07:41:59
宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

快科技
2026-05-09 20:16:11
算命先生坦言:头上有两个旋的孩子,多半是这种命,很准

算命先生坦言:头上有两个旋的孩子,多半是这种命,很准

青青会讲故事
2025-10-23 16:45:08
2026-05-11 04:48:49
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
8282文章数 563关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

特朗普看完伊朗回应发帖:不喜欢 完全不可接受

头条要闻

特朗普看完伊朗回应发帖:不喜欢 完全不可接受

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

艺术
数码
家居
房产
健康

艺术要闻

这些美人体摄影,简直美得让人窒息!

数码要闻

你昂贵的DDR5内存可能是假货:穿着三星的马甲 心里却是SK海力士

家居要闻

菁英人居 全能豪宅

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

干细胞能让人“返老还童”吗

无障碍浏览 进入关怀版