网易首页 > 网易号 > 正文 申请入驻

面向具身场景的生成式渲染器TC-Light来了,代码已开源

0
分享至



TC-Light 是由中科院自动化所张兆翔教授团队研发的生成式渲染器,能够对具身训练任务中复杂和剧烈运动的长视频序列进行逼真的光照与纹理重渲染,同时具备良好的时序一致性和低计算成本开销,使得它能够帮助减少 Sim2Real Gap 以及实现 Real2Real 的数据增强,帮助获得具身智能训练所需的海量高质量数据。

它是如何实现的呢?本文将为你揭秘 TC-Light 背后的黑科技!本工作已中稿 NeurIPS2025,论文与代码均已公开,欢迎大家试用和体验,也欢迎大家到 Project Page 体验 Video Demo。



  • 论文题目:TC-Light: Temporally Coherent Generative Rendering for Realistic World Transfer
  • 项目主页: https://dekuliutesla.github.io/tclight/
  • 论文链接: https://arxiv.org/abs/2506.18904
  • 代码链接: https://github.com/Linketic/TC-Light

研究背景

光线及其与周围环境的交互共同塑造了人类以及具身智能体感知数字世界和现实世界的基本方式,在不同光照条件下对世界的观测使得我们理解光线与物质的交互关系,使得我们形成对周边环境物质和几何属性的基本判断,并且也使得我们能够在不同的光照条件下都能够鲁棒且正确地完成与世界的交互。

然而,在现实环境中采集不同光照与场景条件下的数据代价高昂,而仿真环境中尽管可以获得近乎无限的数据,但受限于算力资源,通常需要对光线的多次折射衍射以及纹理精度进行近似和简化,使得视觉真实性无可避免地受到损失,在视觉层面产生 Sim2Real Gap。而如果能够借助生成式模型根据所需的光照条件对现实或仿真环境下采集到的视频数据进行重渲染,不仅能够帮助获得增加已有真实数据的多样性,并且能够弥合计算误差带来的 CG 感,使得从仿真器中得到视觉上高度真实的传感器数据,包括 RL-CycleGAN 在内的许多工作已经证实,这一策略能够帮助减少将具身模型迁移到真实环境中所需微调的数据量和训练量。

尽管这一任务意义重大,但实际解决过程面临许多挑战。用于训练的视频数据往往伴随复杂的运动以及前景物体的频繁进出,同时视频序列有着较长的长度以及较高的分辨率。我们的定量和定性实验证据(参见论文实验部分及 Project Page)表明,在这些复杂且困难的输入条件下,已有的算法要么受制于训练所用视频数据的分布(如 COSMOS-Transfer1,Relighting4D),要么难以承受巨大的计算开销(如 Light-A-Video, RelightVid),要么难以保证良好的时序一致性(如 VidToMe, RAVE 等)。



图 1 TC-Light 效果展示

为了推动这一问题的解决,我们提出了 TC-Light 算法,在提升视频生成模型计算效率的同时,通过两阶段在线快速优化提升输出结果的一致性,如图 1 和视频Demo所示所示,本算法在保持重渲染真实性的同时,时序一致性和真实性相比于已有算法取得了显著提高。下面对算法细节进行详细介绍。

二、TC-Light 算法介绍

零样本时序模型扩展

TC-Light 首先使用视频扩散模型根据文本指令对输入视频进行初步的重渲染。这里我们基于预训练好的 SOTA 图像模型 IC-Light 以及 VidToMe 架构进行拓展,同时引入我们所提出的 Decayed Multi-Axis Denoising 模块增强时序一致性。具体而言,VidToMe 在模型的自注意力模块前后分别对来自不同帧的相似 token 进行聚合和拆分,从而增强时序一致性并减少计算开销;如图 2 中 (a) 所示,类似 Slicedit,Decayed Multi-Axis Denoising 模块将输入视频分别视作图像 (x-y 平面) 的序列和时空切片(y-t 平面)的序列,分别用输入的文本指令和空文本指令进行去噪,并对两组噪声进行整合,从而使用原视频的运动信息指导去噪过程。不同于 Slicedit,我们在 AIN 模块对两组噪声的统计特性进行了对齐,同时时空切片部分的噪声权重随去噪步数指数下降,从而避免原视频光照和纹理分布对重渲染结果的过度影响。



图 2 TC-Light 管线示意图

两阶段时序一致性优化策略

尽管通过引入前一小节的模型,视频生成式重渲染结果的一致性得到了有效改善,但输出结果仍然存在纹理和光照的跳变。因此我们进一步引入两阶段的时序一致性优化策略,这同时也是 TC-Light 的核心模块。在第一阶段,如图 2 中 (b) 所示,我们为每一帧引入 Appearance Embedding 以调整曝光度,并根据 MemFlow 从输入视频估计的光流或仿真器给出的光流优化帧间一致性,从而对齐全局光照。这一阶段的优化过程非常快速,A100 上 300 帧 960x540 分辨率只需要数十秒的时间即可完成。





三、实验与分析



表 1 与主流算法的定量性能比较,其中 VidToMe 和 Slicedit 的基模型都换成了 IC-Light 以进行公平比较。Ours-light 指不用 Multi-Axis Denoising 模块的结果,相当于对 VidToMe 直接应用两阶段优化算法。

为了验证算法在长动态序列的重渲染表现,我们从 CARLA、Waymo、AgiBot-DigitalWorld、DROID 等数据集收集了 58 个序列进行综合评测,结果如表 1 所示。可以看到我们的算法克服了已有算法在时序一致性和计算开销等方面的问题,取得了最佳的综合性能表现。图 3 的可视化对比也表明,我们的算法在保持内容细节的同时得到了高质量的重渲染性能表现。



图 3 一致性与生成质量可视化对比。TC-Light 避免了 (a) 中像 Slicedit 和 COSMOS-Transfer1 那样不自然的重渲染结果和 (b) 中展现出的模糊失真,或 (c) 中像 IC-Light 和 VidToMe 那样的时序不一致性。

此外,我们也在有 GT 数据的仿真数据集 Virtual KITTI 上进行了比较,从而可以使用 SSIM 和 LPIPS 等指标替换 CLIP-T 等代理指标获得更客观的性能评估。表 2 的结果同样表明,我们的算法很好地取得了计算开销和性能之间的平衡,取得了最佳的重渲染效果。



表 2 Virtual KITTI 数据集上与主流算法的定量性能比较

四、总结

TC-Light 作为一种新的生成式渲染器,克服了具身环境下视觉传感器数据重渲染面对的时序一致性和长序列计算开销两大挑战,在性能表现上优于现有技术,不仅为 Sim2Real 和 Real2Real 数据扩展带来了新的思路,也为视频编辑领域带来了新的模型范式。TC-Light 的论文和代码均已开源,希望能够相关领域带来不同的思考和启发。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人大代表:鸭子是对付福寿螺的高手,但农民告诉我,在上海养鸭子很麻烦,各种部门、各种证、各种规定

人大代表:鸭子是对付福寿螺的高手,但农民告诉我,在上海养鸭子很麻烦,各种部门、各种证、各种规定

新民晚报
2026-02-05 09:09:09
町田主帅:对申花将尽力踢出我们自己的比赛风格,争取带3分回国

町田主帅:对申花将尽力踢出我们自己的比赛风格,争取带3分回国

懂球帝
2026-02-10 00:41:18
赛季报销,格拉利什晒术后照:本不想这个赛季就这样结束

赛季报销,格拉利什晒术后照:本不想这个赛季就这样结束

懂球帝
2026-02-10 05:26:05
亚冠成都蓉城VS武里南联:茹萨坐镇,罗慕洛领衔,中超姆巴佩出击

亚冠成都蓉城VS武里南联:茹萨坐镇,罗慕洛领衔,中超姆巴佩出击

零度眼看球
2026-02-10 07:12:12
固始新娘避坑后续:本人道歉甩锅,男方同学曝料:娶她花了近百万

固始新娘避坑后续:本人道歉甩锅,男方同学曝料:娶她花了近百万

米师傅安装
2026-02-09 02:58:22
哈兰德:年初到现在我进球不多,我知道自己需要提高

哈兰德:年初到现在我进球不多,我知道自己需要提高

懂球帝
2026-02-10 09:23:08
刚被勇士交易就爆发!16分钟砍两双,本赛季联盟最快,科尔太坑了

刚被勇士交易就爆发!16分钟砍两双,本赛季联盟最快,科尔太坑了

你的篮球频道
2026-02-09 10:22:41
海哈金喜住上300平大房子,家中摆着李嫣的画,还给李亚鹏补裤子

海哈金喜住上300平大房子,家中摆着李嫣的画,还给李亚鹏补裤子

疯说时尚
2026-02-09 16:01:04
14亿人都不会忘却!揭开核酸大王张核子的真面具:权力变现大公

14亿人都不会忘却!揭开核酸大王张核子的真面具:权力变现大公

大鱼简科
2026-02-07 09:52:29
尚界汽车辟谣Z7冬测图片为AI生成:均为实拍

尚界汽车辟谣Z7冬测图片为AI生成:均为实拍

界面新闻
2026-02-09 13:20:39
现货黄金向下跌破5000美元,日内下跌1.32%

现货黄金向下跌破5000美元,日内下跌1.32%

每日经济新闻
2026-02-10 07:25:04
黎智英判囚20年,看似轻判实则无期,娱乐圈大毒瘤被彻底铲除了

黎智英判囚20年,看似轻判实则无期,娱乐圈大毒瘤被彻底铲除了

娱乐E君
2026-02-09 17:59:56
哈登鸠占鹊巢,湖人拒绝续约!詹皇疯狂示好库里格林,目的很明显

哈登鸠占鹊巢,湖人拒绝续约!詹皇疯狂示好库里格林,目的很明显

嘴炮体坛
2026-02-09 22:14:41
河南小伙在非洲16年,当地一夫多妻制,男人只用玩,女人挣钱养家

河南小伙在非洲16年,当地一夫多妻制,男人只用玩,女人挣钱养家

大鱼简科
2026-02-07 16:50:52
深圳东门网红,只要脸皮厚月入过万?揭秘真实生态

深圳东门网红,只要脸皮厚月入过万?揭秘真实生态

小陆搞笑日常
2026-02-09 21:25:16
美国交通部警告经过霍尔木兹海峡的美国籍船舶,尽量远离伊朗领海

美国交通部警告经过霍尔木兹海峡的美国籍船舶,尽量远离伊朗领海

AI商业论
2026-02-10 08:39:47
4枪已开打,特朗普收割中国资产,还逼中方交出武器,俄希望谈判

4枪已开打,特朗普收割中国资产,还逼中方交出武器,俄希望谈判

墨兰史书
2026-02-06 09:30:08
雷锋因公牺牲后,宋任穷质问:雷锋为何没被提干部?吕清一语道破

雷锋因公牺牲后,宋任穷质问:雷锋为何没被提干部?吕清一语道破

墨兰史书
2026-02-09 23:10:31
你发现没有?2026年还坚持买油车的人,基本都逃不出这4种情况

你发现没有?2026年还坚持买油车的人,基本都逃不出这4种情况

蜉蝣说
2026-02-09 15:26:57
两位富婆网红被封杀,曾公开自己内裤4万元,调查发现全是假人设

两位富婆网红被封杀,曾公开自己内裤4万元,调查发现全是假人设

新游戏大妹子
2026-02-09 12:45:53
2026-02-10 09:43:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12275文章数 142564关注度
往期回顾 全部

科技要闻

Claude搅动硅谷,AI开始抢企业软件饭碗了?

头条要闻

牛弹琴:想营造有利于"拜鬼"的环境 高市早苗是在妄想

头条要闻

牛弹琴:想营造有利于"拜鬼"的环境 高市早苗是在妄想

体育要闻

不会打篮球,如何入选詹娜前男友第一阵容

娱乐要闻

央视电影活动名场面!明星站位太讲究

财经要闻

退保黑灰产仍在“隐秘角落”顶风接单

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

房产
游戏
旅游
本地
公开课

房产要闻

海南又一千亿级赛道出现,京东、华润、中石化等巨头率先杀入!

愤怒了!《如龙 极3》删除跨性别支线引玩家不满

旅游要闻

新春走基层丨山东郓城:铁花映灯彩 好汉城里年味浓

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版