网易首页 > 网易号 > 正文 申请入驻

一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025

0
分享至

一张图就能创建上半身动作视频,方法还入选了ICCV 2025!

来自清华大学、IDEA(粤港澳大湾区数字经济研究院)的研究人员提出新框架GUAVA,不需要多视角视频、不需要针对不同个体单人训练,仅需0.1秒就能从单图创建一个上半身3D化身

通常来说,创建逼真且富有表现力的上半身人体化身(如包含细致面部表情和丰富手势),在电影、游戏和虚拟会议等领域具有重要价值。

但截至目前,仅凭单张图像实现这一目标仍然是一个重大挑战,而且同时还需要易于创建和支持实时渲染。

而GUAVA,作为第一个从单张图像创建可驱动上半身3D高斯化身的框架,与需要多视图视频或单人训练的3D方法不同——可以在秒级时间内完成推理重建,并支持实时动画和渲染

与基于扩散模型的2D方法相比,GUAVA使用3D高斯来确保更好的ID一致性和实时渲染。而且还引入一种富有表现力的人体模型EHM,解决了现有模型在捕捉细致面部表情方面的局限性。

此外,它还利用逆纹理映射技术以准确地预测高斯纹理,并结合一个神经渲染器来提高渲染质量。

实验结果显示,GUAVA在渲染质量和效率方面优于现有2D和3D方法。

下面详细来看GUAVA所采用的方法。

具体方法

3DGS的兴起催生了许多3D化身重建方法,然而这些方法仍然存在一些局限性:

  • 逐ID练:每个个体都需要单独训练;
  • 训练复杂性:该过程耗时,需要标定的多视图或单目视频;
  • 表现力有限:头部重建方法缺乏身体动作表示,而全身方法则忽略了细致的面部表情。

另外,扩散模型在视频生成方面取得了显著成果。一些工作通过添加额外条件,如关键点或SMPLX渲染图,来引导扩散模型的生成过程,扩展了模型在生成可控人体动画视频上的应用。

但问题是,虽然这些方法实现了良好的视觉效果,其局限性却依旧存在:

  • ID一致性:难以保持一致的ID,尤其是在姿势发生大变化时;
  • 效率:高计算成本和多步去噪导致推理速度慢,阻碍了实时应用;
  • 视点控制:2D方法无法轻松调整相机姿势,从而限制了视点控制。

而GUAVA则通过以下举措进行了改进。

(1)EHM模型与精确跟踪

为了解决SMPLX模型在捕捉面部表情上的不足,GUAVA引入了EHM(Expressive Human Model)

EHM结合了SMPLX和FLAME模型,能够实现更准确的面部表情表示。

同时,研究人员设计了对应的两阶段追踪方法,实现从单张图像到姿态的准确估计——首先利用预训练模型进行粗略估计,然后使用2D关键点损失进行精细优化,从而为重建提供精确的姿势和表情参数。

(2)快速重建与双分支模型

GUAVA基于追踪后的图像,通过单次前向推理方式完成化身的重建。

它包含两个分支:一个分支根据EHM顶点和投影特征预测粗略的“模板高斯”,另一个分支则通过“逆纹理映射”技术,将屏幕特征映射到UV空间,生成捕捉精细细节的“UV高斯”。

这两种高斯组合成完整的Ubody高斯,从而在保持几何结构的同时,捕捉丰富的纹理细节。

(3)实时动画与渲染

重建完成后,Ubody高斯可以根据新的姿势参数进行变形和动画。

最后,通过神经细化器对渲染的图像进行优化,以增强细节和渲染质量。

实验环节

实验设置方面,研究人员从YouTube、OSX和HowToSign收集视频数据集,主要关注人体上半身视频

其中训练集包含超过62万帧,测试集包含58个ID。

为确保评估的全面性,实验采用了多种指标:

  • 自重演(self-reenactment)场景下,通过PSNR、L1、SSIM和LPIPS评估动画结果的图像质量;
  • 跨重演(cross-reenactment)场景下,使用ArcFace计算身份保留分数(IPS)以衡量ID一致性。

评估中与MagicPose、Champ、MimicMotion等2D方法以及GART、GaussianAvatar和ExAvatar 3D方法进行比较。

定量结果如下:

(1)Self-reenactment

与2D方法相比,GUAVA在所有指标(PSNR, L1, SSIM, LPIPS)上均表现最佳,并在动画和渲染速度上达到约50 FPS,而其他方法仅为每秒几帧。

与3D方法相比,GUAVA的重建时间仅为0.1秒左右,而其他方法需要数分钟到数小时

(2)Cross-reenactment

GUAVA在身份保留分数(IPS)上显著优于其他所有2D方法,证明了其在不同姿势下保持ID一致性的能力。

定性结果显示,尽管2D方法能生成高质量图像,但它们在保持ID一致性和准确恢复复杂手势及面部表情方面存在不足。

例如,Champ的手部模糊 ,MagicPose存在失真 ,而MimicMotion则无法保持ID一致性。

3D方法在处理精细的手指和面部表情方面存在困难,也缺乏泛化能力,在未见区域或极端姿势下会产生伪影。

GUAVA则能对未见区域生成合理的结果,在极端姿势下表现出更好的鲁棒性,并提供更准确、更细致的手部和面部表情

为了验证方法中各个部分的有效性,论文还进行了充分的消融实验。

小结一下,论文所提出的GUAVA,是一个用于从单张图像重建可动画、具有细腻表现力上半身3D化身的快速框架。

研究通过引入EHM模型及其精确跟踪方法,增强了面部表情、形状和姿势的捕捉能力,并通过UV高斯和模板高斯的两个推理分支共同构建一个上半身高斯。

实验结果表明,GUAVA在渲染质量和效率方面均优于现有方法。它实现了约0.1秒的重建时间,并支持实时动画和渲染。

目前相关代码已开源,感兴趣可以进一步关注。

论文地址: https://arxiv.org/pdf/2505.03351
项目主页:https://eastbeanzhang.github.io/GUAVA/
开源代码:https://github.com/Pixel-Talk/GUAVA
视频Demo: https://www.bilibili.com/video/BV1k45AzaEpW/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拦不住了!日本公然插手俄乌冲突,中方硬气表态:必须坚决反对

拦不住了!日本公然插手俄乌冲突,中方硬气表态:必须坚决反对

策前论
2026-06-25 18:43:33
美机构预估委内瑞拉强震遇难人数在1万至10万;当地中国公民发声:当时地面剧烈晃动,非常恐怖,有12层居民楼倒塌;现场画面曝光

美机构预估委内瑞拉强震遇难人数在1万至10万;当地中国公民发声:当时地面剧烈晃动,非常恐怖,有12层居民楼倒塌;现场画面曝光

极目新闻
2026-06-25 11:09:12
博主怒批《抓特务》:整个电影都是私货堆起来的,怎么过审的?

博主怒批《抓特务》:整个电影都是私货堆起来的,怎么过审的?

小徐讲八卦
2026-06-25 16:41:12
香港演员苗金凤去世,享年81岁!《女人俱乐部》成最后作品

香港演员苗金凤去世,享年81岁!《女人俱乐部》成最后作品

TVB剧评社
2026-06-25 21:39:08
《妻旅》格格不入的夫妻:懒、不上道、脾气大,还没孙杨这对舒服

《妻旅》格格不入的夫妻:懒、不上道、脾气大,还没孙杨这对舒服

一娱三分地
2026-06-25 19:09:02
16岁女生举报江西财大男学生:被PUA控制,强迫性关系,细节披露

16岁女生举报江西财大男学生:被PUA控制,强迫性关系,细节披露

李晚书
2026-06-25 19:08:55
19岁网红“钟美美”被波士顿大学录取引争议,网友到底在“酸”什么?

19岁网红“钟美美”被波士顿大学录取引争议,网友到底在“酸”什么?

新民周刊
2026-06-25 16:19:30
韩红被质疑“走到哪,哪就是她的老家”,央媒报道显示,其生于西藏昌都,两岁时前往成都,后定居北京,祖籍山东德州,并非在西藏长大

韩红被质疑“走到哪,哪就是她的老家”,央媒报道显示,其生于西藏昌都,两岁时前往成都,后定居北京,祖籍山东德州,并非在西藏长大

大风新闻
2026-06-25 14:15:08
韩国爆冷输球揪出头号罪人!雪藏孙兴慜惹众怒:出线主帅也得滚蛋

韩国爆冷输球揪出头号罪人!雪藏孙兴慜惹众怒:出线主帅也得滚蛋

法老不说教
2026-06-25 16:16:07
8换2大交易!森林狼获三球搭档华子冲冠 黄蜂获里德+多个选秀权

8换2大交易!森林狼获三球搭档华子冲冠 黄蜂获里德+多个选秀权

醉卧浮生
2026-06-25 21:35:42
男子驾驶大客车运毒近87公斤,在昆明西收费站被公安机关当场抓获,一审被判死缓,检察机关以量刑畸轻抗诉,终审改判死刑

男子驾驶大客车运毒近87公斤,在昆明西收费站被公安机关当场抓获,一审被判死缓,检察机关以量刑畸轻抗诉,终审改判死刑

政知新媒体
2026-06-25 12:20:13
月薪2万吃不起的称重快餐,大规模倒闭!

月薪2万吃不起的称重快餐,大规模倒闭!

新浪财经
2026-06-25 00:45:41
凉山小伙首回合KO日本拳手夺冠 本人回应:赛前曾遭对手挑衅 他小时候曾是放牛娃

凉山小伙首回合KO日本拳手夺冠 本人回应:赛前曾遭对手挑衅 他小时候曾是放牛娃

红星新闻
2026-06-25 20:23:49
快讯!一声令下,所有正在发往美国的货,必须立刻停下!

快讯!一声令下,所有正在发往美国的货,必须立刻停下!

故事终将光明磊落
2026-06-25 12:46:17
多支球队全力追逐三球!美媒排名5大潜在下家:火箭2换2抢他?

多支球队全力追逐三球!美媒排名5大潜在下家:火箭2换2抢他?

罗说NBA
2026-06-25 19:35:16
两个总统同时发声,强震突袭!委内瑞拉天塌了,美国这回管不管?

两个总统同时发声,强震突袭!委内瑞拉天塌了,美国这回管不管?

战友老邓
2026-06-25 14:57:49
又有纸尿裤送检后被检测出甲酰胺,涉及Babycare品牌,检测机构还在部分婴幼儿血液、尿液中检出该物质;检测机构:有一份正在复测

又有纸尿裤送检后被检测出甲酰胺,涉及Babycare品牌,检测机构还在部分婴幼儿血液、尿液中检出该物质;检测机构:有一份正在复测

大象新闻
2026-06-25 19:09:57
门店全部关闭!欠款上亿!“后续也不会再开”!昔日行业巨头再爆雷,多方发声

门店全部关闭!欠款上亿!“后续也不会再开”!昔日行业巨头再爆雷,多方发声

南方都市报
2026-06-25 09:22:01
当“太妹”遇到“穷鬼”,于是就有了“13岁女孩被强奸却不立案”

当“太妹”遇到“穷鬼”,于是就有了“13岁女孩被强奸却不立案”

刘既济
2026-06-25 16:20:45
中国菲律宾在黄岩岛发生武装对峙

中国菲律宾在黄岩岛发生武装对峙

凤眼论
2026-06-25 18:45:27
2026-06-25 22:07:00
量子位 incentive-icons
量子位
追踪人工智能动态
12841文章数 176502关注度
往期回顾 全部

科技要闻

宇树机器人大降价

头条要闻

赖清德呼吁大陆放弃"武力攻台" 国防部表态

头条要闻

赖清德呼吁大陆放弃"武力攻台" 国防部表态

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

又有纸尿裤送检后被检测出甲酰胺!

汽车要闻

138.8万元!东方豪华天花板?尊界S800 Grand Design典藏大观上市

态度原创

家居
手机
数码
旅游
公开课

家居要闻

绿意盎然 自然之境

手机要闻

努比亚Neo 5 Max现身MWC上海:7.5英寸巨屏比肩小平板

数码要闻

AMD锐龙7 5800X3D处理器十周年版上市,2599元

旅游要闻

云南普者黑4万余亩荷花进入盛放期

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版