网易首页 > 网易号 > 正文 申请入驻

Large Avatar Model:单图打造写实3D交互数字人,跨平台驱动渲染

0
分享至



论文作者来自阿里巴巴通义实验室的 3D 团队。第一作者何益升,本科毕业于武汉大学,博士毕业于香港科技大学;通讯作者原玮浩,本科毕业于浙江大学,博士毕业于香港科技大学;团队 Leader 董子龙,本科博士均毕业于浙江大学。

三维数字头像的建模、驱动和渲染是计算机图形学与计算机视觉的重要课题之一,在虚拟会议、影视制作、游戏开发等领域有广泛应用。传统方法依赖多视角数据或视频序列训练,存在计算成本高、输入条件难、泛化能力弱等问题。

近年来,基于神经辐射场(NeRF)和 3D 高斯溅射(Gaussian Splatting)的技术虽提升了建模质量,但仍面临多视角/视频输入训练的依赖以及神经后处理导致的渲染效率低的问题。

LAM(Large Avatar Model)的提出,旨在通过单张图像实现实时可驱动的 3D 高斯头像生成,突破传统方法对视频数据或复杂后处理的依赖,为轻量化、跨平台的 3D 数字人应用提供新思路。



  • 论文标题:LAM:Large Avatar Model for One-shot Animatable Gaussian Head
  • 论文地址:https://arxiv.org/abs/2502.17796
  • 项目主页: https://aigc3d.github.io/projects/LAM
  • 代码库:https://github.com/aigc3d/LAM
  • 国外 Demo:https://huggingface.co/spaces/3DAIGC/LAM
  • 国内 Demo:https://www.modelscope.cn/studios/Damo_XR_Lab/LAM_Large_Avatar_Model



核心亮点:

单图秒级生成超写实 3D 数字人

WebGL 跨平台超实时驱动渲染,手机跑满 120FPS

低延迟实时交互对话数字人 SDK 已全开源

方法

LAM 的核心目标是:单图输入、一次前向传播生成可驱动的 3D 高斯头像,无需后处理网络,并兼容传统图形渲染管线实现跨平台实时渲染。其技术框架围绕以下核心突破展开:



规范化空间的三维高斯球生成

  • 人头模型先验引导:LAM 基于 FLAME 头部模板的顶点来初始化高斯球位置,结合形状混合形变(Blendshapes)与骨骼线性蒙皮(LBS)的驱动机制,将三维头像的生成置于规范化空间(Canonical Space),统一不同表情与姿态的几何表达,降低生成复杂度。

  • 多模态特征交互 Transformer:LAM 利用预训练的 DinoV2 提取输入图像的多层级特征,通过堆叠式交叉注意力模块(Cross-Attention)让 3D 空间中的点特征与 2D 空间中的图像特征进行交互,预测 3D 高斯球的位置、颜色、透明度等属性,并引入形变偏移(Offset)优化人头的几何形状(如头发、饰品等)。

  • 细分网格增强细节:FLAME 原始顶点数只有 5023 个,表达能力有限,LAM 通过网格细分算法(Mesh Subdivision)增加点密度(默认两次细分达 81424 点),从而提升头发、胡须等细节的建模能力。使用不同的细分程度,也可以在模型生成质量与渲染速度之间进行平衡。

无需神经后处理的驱动与渲染

  • 传统动画驱动机制直接迁移:生成的规范空间中的 3D 高斯人头,可直接使用骨骼线性混合蒙皮(LBS)与形状混合形变(Blendshapes)参数,驱动表情与姿态变化,无需额外神经网络参与动画或渲染计算,达到超实时的渲染效率。

  • 海量视频数据训练:传统 3D 数字人的训练数据要求苛刻,有时甚至需要多视角视频数据,难以 scale up,而 LAM 的模型架构使其可以在普通的单目视频上进行训练,从而可以很轻易地 scale up。在模型训练中,一段视频中取任意一帧作为输入图片,生成 3D 高斯人头,然后基于视频检测得到的头部姿态和面部表情,渲染不同帧的图片,与真值之间求损失来优化生成网络。

跨平台超实时渲染架构

  • 轻量化 3D 高斯表达:LAM 的驱动和渲染没有任何神经网络的参与,是直接使用传统动画驱动 + 三维高斯溅射渲染,因此可以直接兼容传统图形管线。

  • WebGL 渲染:LAM 基于 WebGL 实现了表情、动作驱动和三维高斯溅射的渲染,天然支持跨平台的特性,可以在不同设备如电脑、手机、电视、大屏等设备上进行直接驱动和渲染,效率达到超实时,如 8W 点模型可以在 Macbook 上轻松跑满屏幕上限 120FPS,2W 点模型甚至能在移动端跑到 120FPS。



实验

定量结果

论文在 VFHQ(高分辨率视频人脸数据集)与 HDTF(高清对话视频数据集)上验证 LAM 性能,对比对象包括 NeRF 方法及 3D 高斯溅射方法,指标涵盖重建质量、身份一致性、动画精度与渲染效率。



从结果来看,LAM 以超写实的图像质量刷新记录,以无神经网络的超轻量模型击败之前的重网络模型。

更多应用

LAM 不仅限于单图生成,也可以结合图像大模型进行实现跨模态艺术创作:

  • 文本驱动生成

结合文生图模型,用户输入提示词(如「戴帽子的卡通男性」)生成任意风格的人头图像,LAM 可以直接转换为可驱动三维高斯模型。如图所示,生成的头像可准确保留提示中的服饰元素(帽子)与艺术风格(卡通化):



  • 3D 风格迁移

通过图像编辑模型对输入图像进行年龄、妆容等编辑,LAM 可以同步更新高斯属性。例如将真人头像转化为油画风格时,模型保留几何结构仅调整颜色与纹理等:



交互对话数字人解决方案

以 LAM 为基础,通义实验室构建了完整的智能交互对话数字人解决方案,融合通义千问大语言模型、通义语音算法、通义数字人驱动算法,构建成熟、鲁棒的完整工程方案,实现轻量化、低成本、低延迟、跨平台的端侧渲染,支持智能客服、情感陪伴、教育培训等产品。

目前,完整的解决方案均已开源,包括整个链路中的各个模块。即使用开源的代码库,就可以实现输入一张图片,生成超写实 3D 数字人,进行实时的对话聊天。


https://mp.weixin.qq.com/s/41mpwUeWFARsXRWuDrCBZA

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
演都不演了?李连杰、洪金宝变化突出,疑“血液净化”,牵连成龙

演都不演了?李连杰、洪金宝变化突出,疑“血液净化”,牵连成龙

动物奇奇怪怪
2025-11-12 09:28:26
烟台被压宝马车女司机真容曝光,有2个孩子,写得一手好字

烟台被压宝马车女司机真容曝光,有2个孩子,写得一手好字

魔都姐姐杂谈
2025-11-13 15:31:52
湖南省郴州市委原常委、统战部原部长黄峥嵘被决定逮捕,曾被通报跑官买官、私德不修

湖南省郴州市委原常委、统战部原部长黄峥嵘被决定逮捕,曾被通报跑官买官、私德不修

鲁中晨报
2025-11-13 16:19:01
雷军大变脸,小米车主遭背刺,天塌了

雷军大变脸,小米车主遭背刺,天塌了

新浪财经
2025-11-13 20:48:47
李诞直播徐志胜私事,难堪话题引多人围观,徐志胜的回击很有水平

李诞直播徐志胜私事,难堪话题引多人围观,徐志胜的回击很有水平

娱乐独家内幕
2025-11-14 03:30:59
副院长与门诊副主任不雅照,背后的警示?

副院长与门诊副主任不雅照,背后的警示?

小小一米月儿
2025-11-08 08:57:20
越来越不对劲,小县城的工资开始崩塌了

越来越不对劲,小县城的工资开始崩塌了

诗意世界
2025-11-13 10:25:43
藤校进入9万美元时代!美国大学的学费已经快把中产家长逼疯了

藤校进入9万美元时代!美国大学的学费已经快把中产家长逼疯了

留学生日报
2025-11-12 21:27:28
新人称婚宴后茅台“集体”失踪:准备近百瓶,酒店仅返还3个空瓶,自己又从窗帘后找出三箱;酒店否认藏匿:已报警,还在协调中

新人称婚宴后茅台“集体”失踪:准备近百瓶,酒店仅返还3个空瓶,自己又从窗帘后找出三箱;酒店否认藏匿:已报警,还在协调中

极目新闻
2025-11-13 07:49:46
高市早苗首次提出对台海出兵,日本高层的反应,果然不出中国所料

高市早苗首次提出对台海出兵,日本高层的反应,果然不出中国所料

普览
2025-11-13 00:31:54
特讯!泰国国王和王后抵京,获中方高规格接待,引爆国际舆论

特讯!泰国国王和王后抵京,获中方高规格接待,引爆国际舆论

青风点评
2025-11-13 23:09:17
特斯拉不能玩另类了!新国标出炉:单踏板、屏幕换挡将被禁用

特斯拉不能玩另类了!新国标出炉:单踏板、屏幕换挡将被禁用

鞭牛士
2025-11-13 18:33:04
果然开始上强度了,055大驱率队抵近日本九州岛,高市早苗慌了

果然开始上强度了,055大驱率队抵近日本九州岛,高市早苗慌了

丁丁鲤史纪
2025-11-13 16:28:33
小燕子前夫黄有龙的表弟佘智江被引渡回国,涉案高达2.77万亿元

小燕子前夫黄有龙的表弟佘智江被引渡回国,涉案高达2.77万亿元

17谭
2025-11-13 06:10:41
刚开播就骂声一片!央八力挺却差评如潮,戏混子扎堆撑不起场面

刚开播就骂声一片!央八力挺却差评如潮,戏混子扎堆撑不起场面

白面书誏
2025-11-12 17:39:34
小客车限行首周,广州地铁客运成绩出炉,车主们确实不爱坐地铁

小客车限行首周,广州地铁客运成绩出炉,车主们确实不爱坐地铁

林子说事
2025-11-14 00:30:02
全运会男子800米自由泳:小将张展硕再破纪录,强势拿下第3金

全运会男子800米自由泳:小将张展硕再破纪录,强势拿下第3金

全景体育V
2025-11-13 19:15:55
2-0,24岁萨卡无敌凌空斩,英格兰豪取世预赛7连胜,太强了

2-0,24岁萨卡无敌凌空斩,英格兰豪取世预赛7连胜,太强了

侧身凌空斩
2025-11-14 05:40:34
善恶终有报!连娶三徒弟,毁掉奥运冠军前途的金炜,终究难逃"反噬"

善恶终有报!连娶三徒弟,毁掉奥运冠军前途的金炜,终究难逃"反噬"

小熊侃史
2025-11-14 00:05:51
房贷利率又降了!

房贷利率又降了!

新浪财经
2025-11-14 00:21:19
2025-11-14 07:59:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11712文章数 142504关注度
往期回顾 全部

科技要闻

美国蓝色起源"新格伦"火箭实现推进器回收

头条要闻

泉州公安依法悬赏"台独"帮凶 两人曾上演"狗咬狗"戏码

头条要闻

泉州公安依法悬赏"台独"帮凶 两人曾上演"狗咬狗"戏码

体育要闻

跟豪门传了十年绯闻,他却偏要“择一队终老”

娱乐要闻

王鹤棣孟子义真要搭?

财经要闻

源峰25亿赌局!汉堡王中国"卖身"求生

汽车要闻

具备高阶辅助驾驶功能 欧拉5预售价10.98万起

态度原创

本地
旅游
艺术
健康
教育

本地新闻

云游安徽 | 江声浩荡阅千年,文脉相承看芜湖

旅游要闻

这个大集火爆出圈!

艺术要闻

十年数学研究员转身画画:她说,艺术才是人生的“最优解”!

血液科专家揭秘白血病七大误区

教育要闻

父母的嘴,是孩子一生的风水!这3句毁孩子的口头禅

无障碍浏览 进入关怀版