网易首页 > 网易号 > 正文 申请入驻

首尔大学团队破解AI识别人脚接触地面难题

0
分享至


这项由首尔大学智能感知与AI实验室以及电子与计算机工程系的Daniel Sungho Jung和Kyoung Mu Lee教授领导的研究发表于2025年11月的arXiv预印本平台,论文编号为arXiv:2511.22184v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当我们走路时,脚与地面的接触看起来是如此自然和简单。但对于人工智能来说,要从一张照片中准确判断出人的脚部哪些区域正在接触地面,却是一个异常复杂的挑战。就像让一个从未见过雨天的人仅凭照片判断地面是否湿滑一样困难。

这个问题的复杂性远超我们的想象。当你穿着不同款式的鞋子——运动鞋、高跟鞋、靴子或拖鞋——站在不同材质的地面上时,脚部与地面的接触模式会发生巨大变化。更让人工智能头疼的是,鞋子的外观千变万化,颜色、材质、款式各不相同,而地面往往看起来单调乏味,很难提取有用的特征信息。这就像让机器在一堆看起来差不多的灰色石头中找出哪块石头下面有宝藏一样困难。

传统的方法通常采用一种简单粗暴的解决方案,类似于"如果脚不动,那就是在接触地面"的零速度约束假设。但这种方法只能判断脚部关节是否接触,无法捕捉脚部表面与地面的精细接触分布。这就像用温度计只能告诉你今天是热还是冷,却无法描绘出一天中温度的详细变化曲线。

首尔大学的研究团队提出了一个名为FECO(FEet COntact estimation,足部接触估计)的创新框架。这个框架的核心思想是让AI学会两项关键技能:一是不被鞋子的外观所迷惑,专注于真正重要的结构信息;二是学会理解和利用地面的几何特性来做出更准确的判断。

关键的突破在于鞋子外观不变性学习。研究团队意识到,AI系统经常会被鞋子的外观所误导。比如在训练数据中,如果穿运动鞋的人经常做滑板运动,AI就可能错误地将运动鞋的外观与特定的接触模式联系起来,而不是基于真正的物理接触进行判断。为了解决这个问题,团队设计了一套对抗训练机制,使用外部鞋子数据集来强化模型的鞋款无关性。

这个过程可以比作训练一个医生。一个优秀的医生不应该因为病人穿着名牌衣服就判断他更健康,而应该专注于真正的医学指标。同样,FECO学会了忽略鞋子的品牌、颜色和款式,专注于脚部的姿态、角度和与地面的空间关系。

同时,研究团队还开发了地面感知学习机制。地面通常看起来平淡无奇,但实际上包含着丰富的几何信息。FECO学会了从图像中推断每个像素点的高度信息,就像建立一个精细的地形图。此外,它还能估算地面的法向量(垂直方向),这相当于理解地面的倾斜程度和方向。

这种地面感知能力的重要性在于,脚与地面的接触本质上是一个几何问题。脚只能与其高度位置相同或更低的表面发生接触。通过理解地面的三维几何结构,AI就能做出更合理的接触判断,就像一个有经验的建筑工人能够凭借对地形的理解来判断建筑物的稳定性一样。

为了训练和验证这个系统,研究团队收集了一个包含10个不同数据集的庞大训练库,涵盖了各种场景:室内场景、人与物体交互、人与地面交互、甚至人与人之间的交互。这些数据集总共包含超过1400万张图像,为AI提供了丰富多样的学习素材。

更重要的是,团队还手工标注了一个新的数据集COFE,包含超过3万张来自真实世界的图像。这些图像来自OpenPose、InstaVariety、PennAction和MPII等知名数据集,覆盖了从日常行走到极限运动的各种场景。每张图像都被精心标注了脚部关键点的接触状态,为模型提供了高质量的训练标准。

在技术实现上,FECO采用了一个多阶段的处理流程。首先,系统对输入图像进行低级风格随机化处理,这类似于给图像添加各种"滤镜",让模型不会过度依赖特定的纹理或光照条件。接着,进行鞋子风格内容随机化,这个过程就像让模型在看到各种不同鞋子的同时,学会提取它们共同的结构特征。

随后,地面特征学习模块开始工作,分析图像中的地面几何信息。这个过程包括预测像素高度图和地面法向量,相当于为AI构建一个详细的地面3D模型。最后,空间注意机制将鞋子风格不变特征和地面感知特征进行智能融合,输出最终的足部接触预测结果。

整个训练过程采用端到端的方式,使用多个损失函数来优化不同的组件。主要损失函数关注接触预测的准确性,风格损失确保模型不过度依赖外观信息,对抗损失强化风格不变性,掩码损失提高足部分割的精度,地面损失优化几何信息的预测。这种多目标优化策略确保了模型在各个方面都能达到最佳性能。

实验结果显示,FECO在多个标准数据集上都取得了显著的性能提升。在MMVP数据集上,FECO达到了0.577的F1分数,相比之前最好的方法DECO的0.409有了大幅提升。在其他数据集上,FECO同样表现出色,在BEHAVE数据集上达到0.768的F1分数,在Hi4D数据集上达到0.783。

更令人印象深刻的是,FECO甚至在关节级别的足部接触估计任务上也超越了专门设计的方法。尽管这些传统方法可以利用视频序列中的时间信息,而FECO只能使用单张图像,它仍然在COFE数据集上取得了最高的精确率、召回率和F1分数。

研究团队还进行了详细的消融实验,验证了每个组件的贡献。低级风格随机化将F1分数提升了4个百分点,鞋子风格内容随机化的组合策略带来了最好的精确率召回率平衡,地面感知学习显著提升了整体性能。这些结果证明了设计思路的正确性和各个模块的有效性。

在不同主干网络的对比实验中,基于Vision Transformer的架构普遍优于卷积神经网络,其中ViT-H取得了最佳性能。这反映了Transformer架构在捕捉长程依赖关系方面的优势,这对于理解足部与地面的空间关系特别重要。

计算效率方面,FECO支持从轻量级到高性能的多种配置。最轻量的ResNet-18配置只需要不到5GB的训练内存,推理速度超过40帧每秒,适合实时应用。而最高性能的ViT-H配置虽然需要34GB训练内存,但提供了最佳的准确性,适合对精度要求较高的应用场景。

这项研究的意义远超学术价值。在体育分析领域,精确的足部接触信息可以帮助分析运动员的技术动作,优化训练方案,预防运动损伤。在康复医学中,详细的步态分析能够帮助医生评估患者的恢复情况,制定个性化的治疗计划。在增强现实和虚拟现实应用中,准确的足部接触估计可以提升虚拟角色的真实感,创造更沉浸式的体验。

在自动驾驶和机器人领域,这项技术也有着重要价值。自动驾驶系统可以更好地理解行人的行为意图,机器人可以学习更自然的行走方式。甚至在电影特效和游戏开发中,这项技术也能帮助创造更真实的角色动画。

值得注意的是,这项研究还揭示了一个重要的数据集偏差问题。现有的3D动作捕捉数据集往往偏向于非接触状态,而COFE数据集提供了更均衡的接触分布,这对于训练鲁棒的模型至关重要。这提醒我们在构建AI系统时,数据的多样性和代表性同样重要。

研究团队诚实地指出了当前方法的局限性。FECO主要在脚部裁剪图像上工作,当脚部完全被遮挡时可能无法提供有效信息。此外,虽然时间信息对于足部接触估计很有帮助,但当前的方法主要关注单帧处理。未来的研究方向包括整合时序信息、处理全身图像、以及与密集人体接触估计方法的结合。

从社会影响角度来看,这项技术在隐私保护、安全应用和可持续发展方面都需要谨慎考虑。研究团队强调,任何数据收集都应该在用户同意的基础上进行,处理应该尽可能在设备本地完成,并且该方法不应被用作医疗诊断工具而需要专业监督。

总的来说,FECO框架代表了计算机视觉领域在理解人体动作方面的一个重要进展。通过巧妙地结合鞋子风格不变性学习和地面感知技术,这项研究不仅解决了一个具有挑战性的技术问题,更为未来的人机交互、健康监测和虚拟现实应用奠定了重要基础。随着相关代码的开源发布,这项技术有望被更广泛地应用和改进,推动整个领域的发展。

Q&A

Q1:FECO框架是如何解决鞋子外观多样性问题的?

A:FECO通过鞋子风格内容随机化技术解决这个问题,类似于训练医生不被病人的穿着影响诊断。系统使用外部鞋子数据集进行对抗训练,学会忽略鞋子的颜色、材质、款式等外观特征,专注于脚部的真实姿态和与地面的空间关系,从而避免被外观信息误导。

Q2:地面感知学习是如何提升足部接触估计准确性的?

A:地面感知学习让AI能够理解地面的三维几何结构,包括预测每个像素的高度信息和地面法向量。就像建筑工人通过了解地形来判断建筑稳定性一样,AI通过理解地面几何特性,能够更准确地判断脚部与地面的物理接触关系,而不仅仅依赖表面纹理信息。

Q3:FECO框架的实际应用领域有哪些?

A:FECO框架应用前景广泛,包括体育分析中的运动员技术动作评估、康复医学的步态分析、增强现实和虚拟现实的角色动画、自动驾驶系统的行人行为理解、机器人的自然行走学习,以及电影特效和游戏开发中的真实角色动画制作。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗谈判细节,表示同意不发展核武器,“伊朗不希望发生战争”

伊朗谈判细节,表示同意不发展核武器,“伊朗不希望发生战争”

铁锤简科
2026-02-02 23:20:04
男子转账800元被认定嫖娼拘留,他起诉警方却两度败诉!

男子转账800元被认定嫖娼拘留,他起诉警方却两度败诉!

没有偏旁的常庆
2026-02-01 20:14:55
人活多久,看脖子就知道?寿命长的人,脖子一般有这5个特征

人活多久,看脖子就知道?寿命长的人,脖子一般有这5个特征

大象新闻
2026-01-08 14:05:04
青岛知名民企迈出重组关键一步,昔日“山东首富”退出股东名单

青岛知名民企迈出重组关键一步,昔日“山东首富”退出股东名单

山东财经报道
2026-02-02 12:21:32
整天开会有啥必要啊?

整天开会有啥必要啊?

北京老付
2026-01-20 10:59:33
太狠了!趁着极寒天气下死手?泽连斯基下令宣布能源紧急状态!

太狠了!趁着极寒天气下死手?泽连斯基下令宣布能源紧急状态!

妙知
2026-02-02 18:23:54
又惹麻烦!赵睿,你可是中国男篮队长,咋啥话都敢说,让老郭咋办

又惹麻烦!赵睿,你可是中国男篮队长,咋啥话都敢说,让老郭咋办

萌兰聊个球
2026-02-02 13:32:35
31分+56分+34分!历史首人!这就是他能拿5年2.7亿顶薪美金的原因

31分+56分+34分!历史首人!这就是他能拿5年2.7亿顶薪美金的原因

篮球扫地僧
2026-02-02 23:52:46
“彩电一哥”康佳崩了!巨亏126亿,发生了什么?

“彩电一哥”康佳崩了!巨亏126亿,发生了什么?

说财猫
2026-02-02 20:37:08
上海男篮拒绝输球!全力击败广东宏远,李添荣回归,央视直播

上海男篮拒绝输球!全力击败广东宏远,李添荣回归,央视直播

体坛瞎白话
2026-02-02 14:58:21
大S雕像邻居是高以翔!石碑「藏具俊晔催泪告白」 设计理念曝光

大S雕像邻居是高以翔!石碑「藏具俊晔催泪告白」 设计理念曝光

ETtoday星光云
2026-02-02 16:20:05
爱泼斯坦派对被曝出过人命,已故知名主持人遭指控勒死年轻女孩

爱泼斯坦派对被曝出过人命,已故知名主持人遭指控勒死年轻女孩

译言
2026-02-01 05:56:46
3天反转大戏!伊朗官宣军演遭美军警告,转头否认:媒体写错了

3天反转大戏!伊朗官宣军演遭美军警告,转头否认:媒体写错了

老马拉车莫少装
2026-02-02 19:29:52
西部排名又乱了:快船创NBA奇迹,火箭收大礼,4队排名互换

西部排名又乱了:快船创NBA奇迹,火箭收大礼,4队排名互换

篮球大视野
2026-02-02 16:20:17
央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

西门老爹
2025-12-16 15:35:31
在农村见过最离谱的事情是什么?男女关系的开放程度让人目瞪口呆

在农村见过最离谱的事情是什么?男女关系的开放程度让人目瞪口呆

夜深爱杂谈
2026-01-06 20:51:44
上海飞迪拜一航班滑行前数名乘客接连下机,飞机延误2小时后起飞,乘客称听到广播“有人身体不适”

上海飞迪拜一航班滑行前数名乘客接连下机,飞机延误2小时后起飞,乘客称听到广播“有人身体不适”

黄河新闻网吕梁频道
2026-02-02 09:19:11
本命年不穿红,祸事找上门"2026属马人需慎穿,只因老祖宗早已解释

本命年不穿红,祸事找上门"2026属马人需慎穿,只因老祖宗早已解释

古怪奇谈录
2026-02-02 10:06:33
随着山东5分败天津!广厦输吉林6分,2弱旅爆冷,最新积分榜大变

随着山东5分败天津!广厦输吉林6分,2弱旅爆冷,最新积分榜大变

老吴说体育
2026-02-02 21:48:02
属狗人,近期将会有望好运缠身,福禄双全,正财大旺,偏财大好!

属狗人,近期将会有望好运缠身,福禄双全,正财大旺,偏财大好!

糖逗在娱乐
2026-02-02 15:50:34
2026-02-03 03:43:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7098文章数 548关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

江苏在建大桥垮塌致2死3失联 现场画面公布

头条要闻

江苏在建大桥垮塌致2死3失联 现场画面公布

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

健康
亲子
教育
本地
军事航空

耳石症分类型,症状大不同

亲子要闻

萌娃哄生气的妈妈,人小鬼大逗得妈妈生不起气来了

教育要闻

俞敏洪说“一大半老师不合格”?别急着骂,先听他说完

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版