网易首页 > 网易号 > 正文 申请入驻

腾讯胡文博:引领 3D 视频世界模型新趋势丨GAIR 2025

0
分享至



胡文博已经在图形学和视觉国际期刊和会议发表20余篇论文。

作者丨代聪飞

编辑丨马晓宁


2025年 12 月 12-13 日,由 GAIR 研究院与雷峰网联合主办的「第八届 GAIR 全球人工智能与机器人大会」,将在深圳南山·博林天瑞喜来登酒店举办。

今年大会,将开设三个主题论坛,聚焦大模型、算力变革、世界模型等多个议题,描绘 AI 最前沿的探索群像,折射学界与产业界共建的智能未来。

腾讯 ARC 实验室高级研究员胡文博也将莅临 12 月 13 日《世界模型》论坛,带来《Towards 3D-aware Video World Models 》(《迈向三维感知的视频世界模型》)的主题分享。

过去一年多,Sora为代表的视频生成模型,成为继大语言模型(LLM)后新的学术热点。本质上讲,当下火爆的视频生成模型,是一种世界模型,其核心目的是生成一段逼真、连贯的视频。

要达到这样的目的,模型必须在一定程度上理解这个世界的运作方式(比如水往低处流、物体碰撞后的运动、人的合理动作等)。

胡文博正是世界模型研究领域近两年的绝对新锐。

2022年,胡文博获得香港中文大学计算机科学与工程博士学位。至今,胡文博已经在图形学和视觉国际期刊和会议发表20余篇论文。

01

深耕视频生成模型,Tri-MipR一鸣惊人

1996年出生的胡文博已经在世界模型领域深耕数年。

2018年,胡文博从大连理工大学毕业,还获得了辽宁省优秀毕业生的殊荣。对计算机充满热忱的胡文博并没有选择直接工作,而是奔赴香港中文大学攻读计算机博士学位。

求学期间,胡文博曾先后在大疆、阿里巴巴达摩院、腾讯AI Lab等知名企业实习。

2022年后,从香港中文大学博士毕业的胡文博,选择加入字节跳动PICO混合现实团队,担任研究员。也是这一阶段,胡文博发表了《Tri-MipRF: Tri-Mip Representation for Efficient Anti-Aliasing Neural Radiance Fields》(以下简称《Tri-MipRF》)。这篇论文受到极大关注,入围ICCV'2023最佳论文决赛,并荣获CVPR'2025 PixFoundation研讨会最佳论文奖.

《Tri-MipRF》提出一种新颖的Tri-Mip编码(类似于“mipmap”),即Tri-MipRF,实现神经辐射场的即时重建和抗锯齿高保真渲染。

《Tri-MipRF》指出,尽管神经辐射场 (NeRF) 取得了巨大的进步,但我们仍然面临着质量和效率之间的权衡困境。MipNeRF 可以呈现精细的细节和抗锯齿的渲染效果,但训练需要数天时间; Instant-ngp 可以在几分钟内完成重建,却忽略了采样区域,在渲染时会出现模糊或锯齿。

Tri-MipRF的关键在于将预滤波后的3D特征空间分解为三个正交的mipmap。这样就可以利用预滤波后的2D特征图高效地进行3D区域采样,从而在不牺牲效率的前提下显著提升渲染质量。《Tri-MipRF》通过大量实验表明,其实现了最先进的渲染质量和重建速度。与Instant-ngp相比,Tri-MipRF模型大小减少了25%。

2023年11月,胡文博加入腾讯担任高级研究员,继续在生成式世界模型深耕细作,不断探索 3D 视频世界模型的新边界。

02

视频世界模型迈向三维空间

流媒体视频生成作为交互式世界模型和神经游戏引擎的一个基本组成部分,旨在生成高质量、低延迟且时间上连贯的长视频流。

胡文博今年9月发表的论文《Rolling Forcing: Autoregressive Long Video Diffusion in Real Time》,分享了他们在这一领域的最新研究成果。

他们设计了 “滚动强制”(Rolling Forcing)这一新型视频生成技术,从而实现以最小的误差累积来流式生成长视频的目的。

“滚动强制” 有三项新颖的设计。

首先 ,“滚动强制”设计了一种联合去噪方案,可以同时对多个噪声水平逐渐增加的帧进行去噪;其次,“滚动强制”将注意力汇聚机制引入到长时流式视频生成任务中,使得模型能够将初始帧的键值状态作为全局上下文锚点,增强长期全局一致性;最后,“滚动强制”设计了一种高效的训练算法,能够在大幅扩展的去噪窗口上进行少步蒸馏。

大量实验表明,“滚动强制” 能够在单块 GPU 上实时流式生成长达数分钟的视频,同时显著减少误差累积。

胡文博也曾经分享他对视频生成模型的场景演变的理解。

胡文博认为,当下的视频生成模型展现出了强大的内容生成能力,有潜力作为世界模拟器。但是由于其本质是在2D空间上的建模,所以不能保证3D合理性与一致性。

为此,胡文博提出,精确相机可控是视频生成模型进化为世界模拟器的重要一环,并在这个方向做了深入研究,提出ViewCrafter和TrajectoryCrafter的解决方案。

ViewCrafter能够从单张图片或者稀疏的多视角图片进行高质量的新视角合成,从而实现静态场景的生成。

TrajectoryCrafter延续这一思想,并将其拓展到了4D场景生成,允许用户使用想要的相机轨迹来重新“拍摄”输入视频,从而实现探索视频背后的4D世界。

作为世界模型领域的先锋力量,胡文博的研究正引领 AI 从 2D 视频生成迈向三维空间理解的新时代。

12 月 13 日下午 9:30 - 10:00 的世界模型分论坛上,胡文博将带来《Towards 3D-aware Video World Models 》(《迈向三维感知的视频世界模型》)的主题演讲,分享他在视频世界模型领域的最新研究成果。

在这个乍暖还寒的季节,让我们共同期待胡文博的最新演讲,憧憬迈向三维感知的模型世界。

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
演员朱珠疑似塌房?照片流出,惊呆网友!

演员朱珠疑似塌房?照片流出,惊呆网友!

大眼妹妹
2025-12-15 10:39:19
评论 | 吴孟克:孟青年领袖遇刺,为何引爆孟印关系危机?

评论 | 吴孟克:孟青年领袖遇刺,为何引爆孟印关系危机?

南亚研究通讯
2025-12-24 23:23:12
国家在号召符合条件的退役士兵可以再次入伍,外交部:警钟已敲响

国家在号召符合条件的退役士兵可以再次入伍,外交部:警钟已敲响

百态人间
2025-12-24 16:40:00
为什么抑郁率最低的是广西?评论区笑翻天了

为什么抑郁率最低的是广西?评论区笑翻天了

另子维爱读史
2025-12-16 21:25:55
有人问方博:在国家队的时候,最佩服孙颖莎的是啥是她的球技吗?

有人问方博:在国家队的时候,最佩服孙颖莎的是啥是她的球技吗?

小光侃娱乐
2025-12-25 20:20:03
昆明安宁学校教师被禁入校,数百学生自习成谜!

昆明安宁学校教师被禁入校,数百学生自习成谜!

眼界看视野
2025-12-24 16:35:40
生态环境部部长黄润秋赴河南省调研大气污染防治工作

生态环境部部长黄润秋赴河南省调研大气污染防治工作

生态环境部
2025-12-25 23:21:43
老了才明白:尽量不要跟身边任何人,包括你的儿女,分享这5件事

老了才明白:尽量不要跟身边任何人,包括你的儿女,分享这5件事

朗威谈星座
2025-12-25 10:51:58
朱元璋的姐夫是聪明人,朱元璋当皇帝后问他要啥官,他回了8个字

朱元璋的姐夫是聪明人,朱元璋当皇帝后问他要啥官,他回了8个字

长风文史
2025-12-23 21:14:32
果然成熟的男人是会给自己找台阶的!网友:好离谱,笑死

果然成熟的男人是会给自己找台阶的!网友:好离谱,笑死

夜深爱杂谈
2025-12-07 21:07:55
疑与城管队员起争执,老人被推倒后离世?城管局:涉事队员被停职,警方正侦办

疑与城管队员起争执,老人被推倒后离世?城管局:涉事队员被停职,警方正侦办

大风新闻
2025-12-25 14:26:05
380亿天价罚单狠狠砸下!吃准苹果要撤离中国,印度直接不装了

380亿天价罚单狠狠砸下!吃准苹果要撤离中国,印度直接不装了

知识TNT
2025-12-25 10:55:20
欧洲历史十大足球运动员发布!哈维 布冯落选!齐达内第四

欧洲历史十大足球运动员发布!哈维 布冯落选!齐达内第四

体坛八点半的那些事儿
2025-12-25 18:38:24
塔利班终于给了中国交代,替中国讨回一笔血债,现场只留一个活口

塔利班终于给了中国交代,替中国讨回一笔血债,现场只留一个活口

混沌录
2025-12-24 22:50:07
多地党委主要领导调整!前任升副部后,他调任州委书记

多地党委主要领导调整!前任升副部后,他调任州委书记

上观新闻
2025-12-25 18:32:07
54岁于和伟演毛主席,这一次,他让唐国强和整个娱乐圈沉默了!

54岁于和伟演毛主席,这一次,他让唐国强和整个娱乐圈沉默了!

温读史
2025-08-08 23:40:18
日本和美国早已禁种,那中国为何依然大力种植?背后的原因不简单

日本和美国早已禁种,那中国为何依然大力种植?背后的原因不简单

扶苏聊历史
2025-12-24 15:05:50
今年圣诞为啥不热闹了?跟抵制洋节无关,这3个原因,太现实了

今年圣诞为啥不热闹了?跟抵制洋节无关,这3个原因,太现实了

振华观史
2025-12-25 18:04:58
统一刻不容缓!特朗普帮了中国大忙,中国错失机会要再等10年

统一刻不容缓!特朗普帮了中国大忙,中国错失机会要再等10年

潮鹿逐梦
2025-12-21 10:58:57
堪称疯狂!涨停板封单远超甚至总股本,资金疯抢锋龙股份!午后仍有46亿元资金排队,优必选重磅出手,锋龙股份要复制上纬新材10倍涨幅?

堪称疯狂!涨停板封单远超甚至总股本,资金疯抢锋龙股份!午后仍有46亿元资金排队,优必选重磅出手,锋龙股份要复制上纬新材10倍涨幅?

金融界
2025-12-25 14:45:19
2025-12-26 01:44:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7024文章数 20717关注度
往期回顾 全部

科技要闻

小米17Ultra发布,徕卡2亿像素 ,6999元起

头条要闻

韩国"最毒"财阀千金被捕 韩国人称"经过她身边就会死"

头条要闻

韩国"最毒"财阀千金被捕 韩国人称"经过她身边就会死"

体育要闻

约基奇有多喜欢马?

娱乐要闻

朱孝天把阿信好意当球踢!

财经要闻

新规来了,年化超24%的小贷被即刻叫停

汽车要闻

速来!智界在上海西岸准备了年末潮流盛典

态度原创

时尚
教育
游戏
手机
家居

冬季穿衣别显得太臃肿!大衣收腰、搭配围巾,有质感又高级

教育要闻

从“畏难”到“追着学”:西北中学的物理课为何让学生着迷?

逆水寒顶流主播沉迷倩女!三界的魅力藏不住了

手机要闻

行业唯一徕卡2亿像素连续光变长焦!小米17 Ultra星空绿图赏

家居要闻

经典弥新 品味浪漫居所

无障碍浏览 进入关怀版