网易首页 > 网易号 > 正文 申请入驻

腾讯胡文博:引领 3D 视频世界模型新趋势丨GAIR 2025

0
分享至



胡文博已经在图形学和视觉国际期刊和会议发表20余篇论文。

作者丨代聪飞

编辑丨马晓宁


2025年 12 月 12-13 日,由 GAIR 研究院与雷峰网联合主办的「第八届 GAIR 全球人工智能与机器人大会」,将在深圳南山·博林天瑞喜来登酒店举办。

今年大会,将开设三个主题论坛,聚焦大模型、算力变革、世界模型等多个议题,描绘 AI 最前沿的探索群像,折射学界与产业界共建的智能未来。

腾讯 ARC 实验室高级研究员胡文博也将莅临 12 月 13 日《世界模型》论坛,带来《Towards 3D-aware Video World Models 》(《迈向三维感知的视频世界模型》)的主题分享。

过去一年多,Sora为代表的视频生成模型,成为继大语言模型(LLM)后新的学术热点。本质上讲,当下火爆的视频生成模型,是一种世界模型,其核心目的是生成一段逼真、连贯的视频。

要达到这样的目的,模型必须在一定程度上理解这个世界的运作方式(比如水往低处流、物体碰撞后的运动、人的合理动作等)。

胡文博正是世界模型研究领域近两年的绝对新锐。

2022年,胡文博获得香港中文大学计算机科学与工程博士学位。至今,胡文博已经在图形学和视觉国际期刊和会议发表20余篇论文。

01

深耕视频生成模型,Tri-MipR一鸣惊人

1996年出生的胡文博已经在世界模型领域深耕数年。

2018年,胡文博从大连理工大学毕业,还获得了辽宁省优秀毕业生的殊荣。对计算机充满热忱的胡文博并没有选择直接工作,而是奔赴香港中文大学攻读计算机博士学位。

求学期间,胡文博曾先后在大疆、阿里巴巴达摩院、腾讯AI Lab等知名企业实习。

2022年后,从香港中文大学博士毕业的胡文博,选择加入字节跳动PICO混合现实团队,担任研究员。也是这一阶段,胡文博发表了《Tri-MipRF: Tri-Mip Representation for Efficient Anti-Aliasing Neural Radiance Fields》(以下简称《Tri-MipRF》)。这篇论文受到极大关注,入围ICCV'2023最佳论文决赛,并荣获CVPR'2025 PixFoundation研讨会最佳论文奖.

《Tri-MipRF》提出一种新颖的Tri-Mip编码(类似于“mipmap”),即Tri-MipRF,实现神经辐射场的即时重建和抗锯齿高保真渲染。

《Tri-MipRF》指出,尽管神经辐射场 (NeRF) 取得了巨大的进步,但我们仍然面临着质量和效率之间的权衡困境。MipNeRF 可以呈现精细的细节和抗锯齿的渲染效果,但训练需要数天时间; Instant-ngp 可以在几分钟内完成重建,却忽略了采样区域,在渲染时会出现模糊或锯齿。

Tri-MipRF的关键在于将预滤波后的3D特征空间分解为三个正交的mipmap。这样就可以利用预滤波后的2D特征图高效地进行3D区域采样,从而在不牺牲效率的前提下显著提升渲染质量。《Tri-MipRF》通过大量实验表明,其实现了最先进的渲染质量和重建速度。与Instant-ngp相比,Tri-MipRF模型大小减少了25%。

2023年11月,胡文博加入腾讯担任高级研究员,继续在生成式世界模型深耕细作,不断探索 3D 视频世界模型的新边界。

02

视频世界模型迈向三维空间

流媒体视频生成作为交互式世界模型和神经游戏引擎的一个基本组成部分,旨在生成高质量、低延迟且时间上连贯的长视频流。

胡文博今年9月发表的论文《Rolling Forcing: Autoregressive Long Video Diffusion in Real Time》,分享了他们在这一领域的最新研究成果。

他们设计了 “滚动强制”(Rolling Forcing)这一新型视频生成技术,从而实现以最小的误差累积来流式生成长视频的目的。

“滚动强制” 有三项新颖的设计。

首先 ,“滚动强制”设计了一种联合去噪方案,可以同时对多个噪声水平逐渐增加的帧进行去噪;其次,“滚动强制”将注意力汇聚机制引入到长时流式视频生成任务中,使得模型能够将初始帧的键值状态作为全局上下文锚点,增强长期全局一致性;最后,“滚动强制”设计了一种高效的训练算法,能够在大幅扩展的去噪窗口上进行少步蒸馏。

大量实验表明,“滚动强制” 能够在单块 GPU 上实时流式生成长达数分钟的视频,同时显著减少误差累积。

胡文博也曾经分享他对视频生成模型的场景演变的理解。

胡文博认为,当下的视频生成模型展现出了强大的内容生成能力,有潜力作为世界模拟器。但是由于其本质是在2D空间上的建模,所以不能保证3D合理性与一致性。

为此,胡文博提出,精确相机可控是视频生成模型进化为世界模拟器的重要一环,并在这个方向做了深入研究,提出ViewCrafter和TrajectoryCrafter的解决方案。

ViewCrafter能够从单张图片或者稀疏的多视角图片进行高质量的新视角合成,从而实现静态场景的生成。

TrajectoryCrafter延续这一思想,并将其拓展到了4D场景生成,允许用户使用想要的相机轨迹来重新“拍摄”输入视频,从而实现探索视频背后的4D世界。

作为世界模型领域的先锋力量,胡文博的研究正引领 AI 从 2D 视频生成迈向三维空间理解的新时代。

12 月 13 日下午 9:30 - 10:00 的世界模型分论坛上,胡文博将带来《Towards 3D-aware Video World Models 》(《迈向三维感知的视频世界模型》)的主题演讲,分享他在视频世界模型领域的最新研究成果。

在这个乍暖还寒的季节,让我们共同期待胡文博的最新演讲,憧憬迈向三维感知的模型世界。

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老房子可原拆原建,引爆地产股!万科、碧桂园集体涨停!

老房子可原拆原建,引爆地产股!万科、碧桂园集体涨停!

说财猫
2026-05-29 13:46:05
前调查记者揭矿难黑幕:逃生者被老板雇人砸回矿井里,因为死了比救治重伤赔得少

前调查记者揭矿难黑幕:逃生者被老板雇人砸回矿井里,因为死了比救治重伤赔得少

可达鸭面面观
2026-05-28 16:52:14
可怕:猪肉抗生素超标38倍,鸡蛋药物超标69倍!

可怕:猪肉抗生素超标38倍,鸡蛋药物超标69倍!

仕道
2026-05-29 11:58:11
37岁车手翻车身亡!家人炮轰组委会:黄金时间救援推诿 还我公道

37岁车手翻车身亡!家人炮轰组委会:黄金时间救援推诿 还我公道

念洲
2026-05-29 21:00:37
首进大满贯16强!王曦雨2-0连赢八局横扫 豪取6连胜一盘未丢

首进大满贯16强!王曦雨2-0连赢八局横扫 豪取6连胜一盘未丢

醉卧浮生
2026-05-29 19:04:00
突发!以色列宣布:已打死阿马德·哈桑·哈辛·阿斯利姆

突发!以色列宣布:已打死阿马德·哈桑·哈辛·阿斯利姆

每日经济新闻
2026-05-29 18:57:13
ESG新变局:茅台的关键一跃,背后是一场全球化能力“大考”

ESG新变局:茅台的关键一跃,背后是一场全球化能力“大考”

智谷趋势
2026-05-29 11:04:40
中国佛教协会对刘应成(释永信)案判决结果的声明

中国佛教协会对刘应成(释永信)案判决结果的声明

新京报政事儿
2026-05-29 22:14:55
耿同学又爆新料!多所985名校顶刊论文集体沦陷

耿同学又爆新料!多所985名校顶刊论文集体沦陷

网易新闻出品
2026-05-29 19:29:43
美方将落实中美经贸磋商成果

美方将落实中美经贸磋商成果

环球网资讯
2026-05-28 06:49:15
白养了!2儿子非亲生后续:大儿子狂骂姜洪涛,连法官都看不下去

白养了!2儿子非亲生后续:大儿子狂骂姜洪涛,连法官都看不下去

不似少年游
2026-05-29 09:42:48
电车,是时候交养路费了

电车,是时候交养路费了

第一财经资讯
2026-05-29 10:11:25
广东严打重点车辆超载疲劳驾驶等!已查处交通违法超三千起

广东严打重点车辆超载疲劳驾驶等!已查处交通违法超三千起

南方都市报
2026-05-29 21:58:15
襄阳割四赔五纠纷结局!讹人大妈被两次约谈,向农机手退款并道歉

襄阳割四赔五纠纷结局!讹人大妈被两次约谈,向农机手退款并道歉

垛垛糖
2026-05-29 12:19:10
贾庆林,接见211大学书记、校长

贾庆林,接见211大学书记、校长

双一流高校
2026-05-29 00:11:33
涉案金额过亿,释永信一审被判有期徒刑24年

涉案金额过亿,释永信一审被判有期徒刑24年

界面新闻
2026-05-29 19:31:49
割四赔五后续:农民跪地拦车,老太已道歉赔钱,官方下场拉下帷幕

割四赔五后续:农民跪地拦车,老太已道歉赔钱,官方下场拉下帷幕

奇思妙想草叶君
2026-05-29 17:43:38
唐嫣现身女儿艺术节,一身行头价格超百万,罗晋贴心陪同好低调

唐嫣现身女儿艺术节,一身行头价格超百万,罗晋贴心陪同好低调

一娱三分地
2026-05-29 17:10:35
航天员黎家盈年收入多少?回来后享受什么待遇?

航天员黎家盈年收入多少?回来后享受什么待遇?

混沌录
2026-05-26 22:05:52
非必要不做CT?医生强调:只要做过CT,患者一定多加关注这4点!

非必要不做CT?医生强调:只要做过CT,患者一定多加关注这4点!

垚垚分享健康
2026-05-29 11:10:14
2026-05-30 01:11:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7319文章数 20754关注度
往期回顾 全部

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

健康
艺术
教育
亲子
家居

尝试干细胞疗法如何避免踩坑?

艺术要闻

吴湖帆小品册页

教育要闻

山东省家庭教育志愿服务总队公益大讲堂胶州巡讲落幕

亲子要闻

为了让孩子变“超模脸”,每天徒手扩颚、暴力正颌?外国妈妈卷疯了!

家居要闻

云栖 舒展如流云

无障碍浏览 进入关怀版