网易首页 > 网易号 > 正文 申请入驻

IROS 2025 | 大连理工等提出STG-Avatar:25分钟训练,单目视频实时生成高保真数字人

0
分享至

文章来源:我爱计算机视觉(ID:aicvml)

最近,数字人领域因为3D高斯溅射(3D Gaussian Splatting)技术的出现,又热闹了起来。这项技术大大加快了渲染速度,让实时高保真渲染成为了可能。不过,挑战依然存在,尤其是在处理衣服、快速运动的肢体等这些“软”的、动态的细节时,效果总是不尽如人意。

今天,CV君想和大家聊一篇刚被机器人顶会IROS 2025接收的论文《STG-Avatar: Animatable Human Avatars via Spacetime Gaussian》。这篇工作来自大连理工大学、复旦大学等机构的研究者们,他们提出了一个名为STG-Avatar的全新框架,旨在解决上述痛点。简单来说,只用一段普通单目视频,它就能在25分钟内训练出一个细节丰富、可实时动画的数字人分身,并能以60 FPS的丝滑帧率进行渲染。



  • 论文标题 : STG-Avatar: Animatable Human Avatars via Spacetime Gaussian

  • 作者 : Guangan Jiang, Tianzi Zhang, Dong Li, Zhenjun Zhao, Haoang Li, Mingrui Li, Hongyu Wang

  • 机构 : 大连理工大学、复旦大学、澳门大学、萨拉戈萨大学、香港科技大学(广州)

  • 论文地址 : https://arxiv.org/abs/2510.22140

  • 项目主页(尚未开源) : https://github.com/jiangguangan/STG-Avatar

背景:数字人动画,快与好难两全

创建逼真的可动数字人,无论是在人机交互、VR/AR还是机器人远程呈现等领域,都有着巨大的应用价值。传统方法,比如基于NeRF(神经辐射场)的技术,虽然能生成高质量的数字人,但训练和渲染速度都太慢,动辄需要几十个小时训练,渲染一帧也要好几秒,离“实时”相去甚远。

3D高斯溅射(3DGS)的出现像一股清流,它用成千上万个“高斯球”来显式地表示三维场景,渲染速度极快。然而,当面对一个活生生的人时,3DGS也遇到了麻烦。现有的基于3DGS的方法通常使用经典的线性混合蒙皮(Linear Blend Skinning, LBS)模型来驱动人体的骨骼运动。LBS擅长处理刚性的骨骼和关节运动,但对于衣服的褶皱、头发的飘动这类非刚性变形,就显得力不从心,导致细节丢失或产生不自然的“穿模”现象。

如何才能既保留LBS带来的高效实时骨骼控制,又能精准捕捉那些微妙的非刚性动态细节呢?这正是STG-Avatar试图解决的核心问题。

方法:刚柔并济,时空高斯巧补细节

STG-Avatar的核心思想是“刚柔并济”。它巧妙地将LBS和一种名为“时空高斯(Spacetime Gaussian, STG)”的技术结合起来,形成了一个刚-非刚耦合的变形框架。


整个流程可以分为三个阶段:

  1. SMPL引导的初始化 :首先,利用SMPL人体参数化模型对时空高斯进行初步的位置设定。

  2. 刚-非刚协同优化 :这是最关键的一步。LBS负责驱动人体总体的、刚性的姿态变化,保证了动画的实时性和骨骼运动的准确性。而STG则在此基础上,对3D高斯球进行时空维度的自适应优化,专门捕捉和补偿LBS无法处理的非刚性变形,比如衣服的褶皱和摆动。

  3. 动态感知的神经渲染 :最后,通过一个轻量级的MLP(多层感知机)进行颜色解码和渲染。

亮点一:光流引导的自适应加密

为了更好地捕捉高速运动区域的细节,作者们还引入了一个非常聪明的策略:用光流(Optical Flow)来识别哪些区域正在快速运动。


上图展示了未使用光流引导(左)和使用后(右)的对比。可以清晰地看到,在手部、面部这些细节丰富且动态的区域,完整模型的重建效果有了显著提升。当检测到某个区域(比如挥舞的手臂)运动剧烈时,框架就会自动地、有针对性地在该区域增加3D高斯球的密度。这样一来,计算资源就被用在了“刀刃上”,既能精准还原动态细节,又避免了全局加密带来的巨大计算开销。

实验:效果与效率双双领先

口说无凭,实验为证。研究者们在ZJU-MoCap和THUman4.0这两个主流的单目视频人体动作捕捉数据集上,将STG-Avatar与当前最先进的方法(SOTA)进行了全面对比。

定量对比

从上表数据可以看出,在PSNR、SSIM(越高越好)和LPIPS(越低越好)这三项关键的图像质量评估指标上,STG-Avatar都取得了最优或次优的成绩,全面超越了HumanNeRF、GauHuman和3DGS-Avatar等方法。特别是在动态区域,其PSNR比3DGS-Avatar提升了1.5dB,衣物褶皱的LPIPS误差降低了23%

定性对比

上图是在ZJU-MoCap数据集上的效果对比,可以直观地看到,相比其他方法,STG-Avatar(Ours)在重建衣服褶皱、身体轮廓等非刚性部分的细节上要清晰和真实得多。


在难度更高的THUman4.0数据集上,STG-Avatar同样表现出色,无论是衣服的纹理、褶皱还是面部特征,都还原得惟妙惟肖。

效率对比

效率是STG-Avatar的另一大杀手锏。在单张RTX 4090显卡上,训练时间仅需25分钟,而渲染速度则达到了惊人的60 FPS,真正实现了实时交互。相比之下,NeRF类方法需要数天训练,而其他3DGS方法要么训练更慢,要么效果稍逊。

消融实验

为了验证框架中各个模块的有效性,作者还进行了消融研究。结果表明,无论是光流引导的采样,还是STG模块,都对最终的性能提升起到了至关重要的作用。

总结

CV君认为,STG-Avatar的巧妙之处在于它没有试图用一个“万能模型”去解决所有问题,而是将刚性运动和非刚性细节这两个不同性质的问题解耦,并用最适合的技术(LBS和STG)分别应对,最后通过光流进行智能化的资源调配。这种“分而治之”的哲学,在资源有限的情况下,实现了效果和效率的最佳平衡。

大家对这个方法怎么看?欢迎在评论区留下你的看法!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
邵佳一当选中国男足国家队主教练,听听媒体专家怎么说,勇气可嘉

邵佳一当选中国男足国家队主教练,听听媒体专家怎么说,勇气可嘉

曦言说
2025-11-05 17:31:48
放弃首富做“首善”,41岁黄峥无偿捐出1000亿,功成身退令人羡慕

放弃首富做“首善”,41岁黄峥无偿捐出1000亿,功成身退令人羡慕

牛牛叨史
2025-11-06 15:47:03
女同事上班穿丁字裤被拍发网上爆火!这拍到的倒三角大家看是穿反了吗?

女同事上班穿丁字裤被拍发网上爆火!这拍到的倒三角大家看是穿反了吗?

经典段子
2025-11-05 22:36:41
女子70元卖7盒精神药品被判贩毒:买家自称有瘾购药后报警,申诉被驳回

女子70元卖7盒精神药品被判贩毒:买家自称有瘾购药后报警,申诉被驳回

澎湃新闻
2025-11-06 14:02:36
突发!澳洲两所大学被列为“野鸡大学”!教育部不再承认学历,留学圈炸开了...

突发!澳洲两所大学被列为“野鸡大学”!教育部不再承认学历,留学圈炸开了...

澳洲红领巾
2025-11-06 13:22:20
全运女篮开打!首日6赛,李梦首秀冲开门红,广东没悬念 山东硬仗

全运女篮开打!首日6赛,李梦首秀冲开门红,广东没悬念 山东硬仗

萌兰聊个球
2025-11-06 11:41:37
中央定调!2025年70岁以上老人,可享受这几项优待,农民也有份

中央定调!2025年70岁以上老人,可享受这几项优待,农民也有份

社保小达人
2025-10-19 11:30:07
新闻多一度丨神二十推迟返回 空间碎片影响有多大?

新闻多一度丨神二十推迟返回 空间碎片影响有多大?

新京报
2025-11-05 18:11:09
貂皮水洗退货后续:警方介入,宝妈身份被扒已社死,商家还有后手

貂皮水洗退货后续:警方介入,宝妈身份被扒已社死,商家还有后手

卷史
2025-11-06 17:09:43
中国首例五胞胎终于长大了,父亲因劳累去世,母亲直言后悔生下他们

中国首例五胞胎终于长大了,父亲因劳累去世,母亲直言后悔生下他们

等风来育儿联盟
2025-08-01 12:21:35
98年他花5万买下上海弄堂破阁楼,邻居都笑他痴,20年后全都闭嘴了

98年他花5万买下上海弄堂破阁楼,邻居都笑他痴,20年后全都闭嘴了

温情邮局
2025-10-21 11:41:22
CBA官宣重罚广东男篮,广厦官宣续约总决赛MVP,北京全运会两连败

CBA官宣重罚广东男篮,广厦官宣续约总决赛MVP,北京全运会两连败

中国篮坛快讯
2025-11-06 18:35:35
神二十航天员,回家时间定了!

神二十航天员,回家时间定了!

学申论的谈妹
2025-11-04 12:58:03
神二十3名航天员、4鼠乘组将夜间返回地球,为何不延期白天回家?

神二十3名航天员、4鼠乘组将夜间返回地球,为何不延期白天回家?

环球科学猫
2025-11-04 11:29:07
为什么钱在骗子那里不会被冻结呢?

为什么钱在骗子那里不会被冻结呢?

流苏晚晴
2025-11-06 18:12:30
国锦赛:赵心童三连鞭绝杀塞尔比,新科世界冠军强势闯进半决赛

国锦赛:赵心童三连鞭绝杀塞尔比,新科世界冠军强势闯进半决赛

世界体坛观察家
2025-11-06 18:30:01
山西王阎锡山的妹妹,没来得及跟哥哥逃到台湾,她的结局如何?

山西王阎锡山的妹妹,没来得及跟哥哥逃到台湾,她的结局如何?

鹤羽说个事
2025-11-04 16:56:07
章泽天瘦得惊人,烫了头发后更放飞自我,和杜海涛摆拍

章泽天瘦得惊人,烫了头发后更放飞自我,和杜海涛摆拍

乡野小珥
2025-10-26 06:59:35
幸亏中国没中标!泰国高铁选择日本人建设,建成后让泰国欲哭无泪

幸亏中国没中标!泰国高铁选择日本人建设,建成后让泰国欲哭无泪

百态人间
2025-11-06 15:27:41
不识时务,郑丽文真面目曝光?统一还能寄望国民党吗?

不识时务,郑丽文真面目曝光?统一还能寄望国民党吗?

谛听骨语本尊
2025-11-06 17:05:47
2025-11-06 20:12:49
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5212文章数 64595关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

女子因插足他人婚姻被打 打人原配8年内2次被警方逮捕

头条要闻

女子因插足他人婚姻被打 打人原配8年内2次被警方逮捕

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

教育
时尚
本地
家居
军事航空

教育要闻

100题!!100题!!100题!!!写到发狂!!写到忘我!!!写到上岸为止!!!

复古的“绗缝”大衣,现在穿刚好!

本地新闻

这届干饭人,已经把博物馆吃成了食堂

家居要闻

别样府院 畅享诗意生活

军事要闻

美国发射洲际弹道导弹 俄方回应

无障碍浏览 进入关怀版