网易首页 > 网易号 > 正文 申请入驻

少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了

0
分享至



本文作者来自上海交通大学、英国曼彻斯特大学与香港中文大学。团队成员包括:徐博、王钰超、乐心怡(上海交通大学,自动化系),郭宇鹄、王昌凌(英国曼彻斯特大学,机械与航空航天工程学院),王文婷、任扬(香港中文大学,机械与自动化工程学系)。

表面重建的核心挑战,在于在少量视角下同时兼顾几何准确性、细节还原与结构完整性。现有神经隐式路线,在样本稀疏时容易出现跨视角对应不稳、边界发糊、局部缺失等现象;当可见区域有限、纹理不明显、遮挡复杂时,这些问题会被进一步放大。

为了补救,不少工作尝试引入单目深度、法线或稠密视角序列等外部几何线索,但这通常意味着额外的采集成本和不稳定的噪声来源,一旦误差被带入,反而会破坏原本已经较为准确的几何。

另一条思路是通过更复杂的网络结构或强先验来提升稳定性,可迁移性与训练成本却随之上升,且在真实场景下的鲁棒性并不总是稳定。

归根到底,稀疏视角的难点在于覆盖不足导致的匹配不稳定与形辐射歧义:同一结构在不同视角里的局部片段难以可靠对应,优化过程容易迷失在局部最优。

直观经验却告诉我们,只要把同一物体的 “对应部分” 对齐,形状就会变得清晰。基于这一朴素而有效的直觉,作者提出SERES(Semantic-Aware Reconstruction from Sparse Views),在不改动主干框架的前提下,把跨视角的语义一致性变成一种训练期先验注入到模型里,用低成本的方法去解决高价值的歧义问题,让少量视角也能得到清晰而完整的几何。



该工作来自上海交通大学,曼彻斯特大学和香港中文大学的团队,目前已被 IEEE Transactions on Visualization and Computer Graphics(TVCG)接收



  • 论文标题:SERES: Semantic-Aware Neural Reconstruction from Sparse Views
  • 论文主页:https://seres0.github.io/
  • 论文链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=11197045

方法概览

SERES 的设计围绕两条主线展开:语义匹配先验与区域级正则。整体以训练期插件的方式接入常见主干,如 NeuS 或 Neuralangelo,不改变体渲染与隐式表面的基本表达,仅在训练中提供额外的线索与约束。



图 1 SERES 方法流程

语义匹配先验

首先是语义匹配先验。直观地说,作者让 “来自他视角的提醒” 在训练中始终存在。具体做法是,从每张输入图像中自动提取一组稳定的语义块与几何原语。语义块侧重于外观与语义的一致性,几何原语则对应更具结构意义的区域。随后,对这些语义块提取图像级特征,并在多视角之间进行交互式的对齐与聚合,让不同视角中 “看似相似” 的部分彼此对上号。这样得到的先验信息被作为额外输入喂给重建主干,使得主干在每一次更新时,都能显式感知来自其他视角的对应关系。



图 2 语义匹配质量对重建质量的影响

这种做法的好处在于,模型不再孤立地依赖单一视角的证据,而是在训练的每一步都被提醒哪些细节需要被保留、哪些边界应当对齐、哪些区域存在歧义需要更谨慎地处理。对于稀疏视角尤其是极少视角的情况,这份提醒能显著减少错配带来的形状扭曲与边界模糊。

点提示引导的区域级正则

仅有像素级误差往往不足以约束形状的全局一致性,尤其在纹理稀薄或反射复杂的区域,像素级监督容易放大噪声。SERES 在图像空间引入了可解释的区域一致性。基于前述的几何原语,作者为每张图像得到一组覆盖关键部件的区域分割与掩膜。在训练过程中,这些可解释的区域与模型渲染得到的语义分布进行对齐,形成面向区域的一致性约束。它鼓励模型在真实边界处给出更清晰、稳定的表面表达,在容易产生歧义的部分尽量减少破碎或漂移。与仅依赖像素损失不同,区域级正则在结构层面提供了 “形状应该如何对齐” 的强信号,能有效抑制噪声碎片,让最终的网格更干净、曲面更连贯。



图 3 语义属性体渲染结果

从工程实现角度看,SERES 的两条主线都只在训练期生效,不改变推理流程。语义先验分解为稳定分块、特征提取与跨视角聚合三步,接口简单;区域级正则以可解释的掩膜为锚,和主干的渲染分布对齐即可。整体额外计算开销小,训练时间仅有小幅增加,对不同主干的适配也无需侵入式改造。

消融实验表明(见实验部分),缺失语义匹配先验时,跨视角错配与形变明显增多;去掉区域级正则时,网格易出现噪声与断裂;而使用未优化或质量不高的先验,同样会拖累最终几何。

实验

在 DTU 的稀疏多视角设置中,SERES 作为训练期插件显著提升了重建质量与新视角合成质量。与主流基线相比,画面质量指标在多组场景中全面优于对应的原始主干,同时几何误差在从极少到较少视角的范围内稳定下降。随着视角数从极少逐步增加,误差的下降趋势依旧保持,说明这套先验与正则对不同稀疏程度都有稳定收益。





图 4 DTU 重建效果



图 5 视角数变化的影响

在 BlendedMVS 以及多种真实场景(高反射、复杂拓扑、低纹理) 中,SERES 输出更完整、更干净的几何,在难匹配区域有效减少断裂与噪声,体现出良好的鲁棒性与通用性。

与仅依赖像素级误差不同,区域级正则的价值在真实边界处更为直观。很多难例,如重复纹理、细杆与枝类的复杂拓扑,往往在像素层面难以稳定监督。区域级约束将这些区域包裹起来,以更高层次的一致性去牵引优化,使得模型对边界位置的判断更果断,对结构连贯性的把握更稳定,从而减少边缘糊、壳体破洞以及不必要的表面漂移。对少视角训练而言,这种结构层面的 “拉紧” 尤为关键,它相当于给优化过程加上了可靠的护栏。



图 6 BMVS 重建效果



图 7 实拍场景重建效果

消融实验显示,缺失语义匹配先验或区域级正则都会明显拉低重建质量,这两者是互补且必要的。



图 8 消融实验结果

结论

SERES 把跨视角的语义一致性与结构层面的区域约束,变成一种低成本、可解释、可复用的训练期先验。它以即插即用的方式接入现有的隐式重建框架,不需要额外传感器或复杂改造,即便在很少的视角下,也能恢复边界清晰、结构完整、细节可靠的表面。面对更大规模场景、更复杂材质与光照等现实挑战,这一思路仍有充分拓展空间。对工程团队而言,SERES 的接口简单、迁移门槛低、真实场景友好,适合直接集成到当前的稀疏三维重建工作流中,用更少的视角获得更高保真的几何重建。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全部抢空,人山人海!浙江第一波人出动了!马上席卷全国

全部抢空,人山人海!浙江第一波人出动了!马上席卷全国

上观新闻
2025-11-12 06:38:11
曝恩比德或将离开费城,76人已经有新的领袖,乔治也被人遗忘了

曝恩比德或将离开费城,76人已经有新的领袖,乔治也被人遗忘了

只扣篮的教练
2025-11-12 16:41:58
高市拒绝撤回谬论,不到48小时,中方深切哀悼,日本重要人物逝世

高市拒绝撤回谬论,不到48小时,中方深切哀悼,日本重要人物逝世

博览历史
2025-11-12 16:50:23
雷军坚称小米SU7无抄袭被打脸!网友:不是抄,是全部搬运

雷军坚称小米SU7无抄袭被打脸!网友:不是抄,是全部搬运

麦大人
2025-11-11 20:43:26
赖清德发话:国民党若现在不保沈伯洋,大陆下一个对付的就是你们

赖清德发话:国民党若现在不保沈伯洋,大陆下一个对付的就是你们

云鹏叙事
2025-11-12 10:54:43
双11彻底凉了?满屏套路加口袋空空,消费降级,年轻人买不动了?

双11彻底凉了?满屏套路加口袋空空,消费降级,年轻人买不动了?

眼光很亮
2025-11-12 15:45:55
广东:女子给男性剪发,穿着难以想象,网友:正经吗?

广东:女子给男性剪发,穿着难以想象,网友:正经吗?

心轩专栏
2025-11-02 21:59:42
65岁倪萍医美后美炸天!优雅时髦,没有皱纹,年轻的像20岁!

65岁倪萍医美后美炸天!优雅时髦,没有皱纹,年轻的像20岁!

大龄女一晓彤
2025-09-23 19:35:20
一夜消息:比尔赛季报销,老詹复出倒计时,独行侠考虑重建

一夜消息:比尔赛季报销,老詹复出倒计时,独行侠考虑重建

冷月小风风
2025-11-13 09:52:59
德国民调:快让他下台!默茨支持率崩至25%,极右翼伺机夺权

德国民调:快让他下台!默茨支持率崩至25%,极右翼伺机夺权

霁寒飘雪
2025-11-13 09:11:00
非洲土皇帝王垚:丰臀辣妹当助理,生活奢靡为何还多次被官媒表扬

非洲土皇帝王垚:丰臀辣妹当助理,生活奢靡为何还多次被官媒表扬

禾寒叙
2025-11-10 22:27:04
泰国男星嫁给50岁意大利富商,正式退出娱乐圈

泰国男星嫁给50岁意大利富商,正式退出娱乐圈

下水道男孩
2025-11-11 23:51:55
震惊硅谷!37岁华裔理工男靠“喂数据”身家1200亿,成最年轻富豪

震惊硅谷!37岁华裔理工男靠“喂数据”身家1200亿,成最年轻富豪

青眼财经
2025-11-12 14:42:01
被特斯拉Model Y长续航点燃的车市:上市首天卖出上海超级工厂三周产能

被特斯拉Model Y长续航点燃的车市:上市首天卖出上海超级工厂三周产能

小李子体育
2025-11-13 08:00:59
朝鲜战争中,美军原本已接近击败中国,却碰上了志愿军决死的师长

朝鲜战争中,美军原本已接近击败中国,却碰上了志愿军决死的师长

知鉴明史
2025-11-09 17:15:03
真不能怪祖院长,就曾医生这颜值、这才华和魅力,谁遭的住?

真不能怪祖院长,就曾医生这颜值、这才华和魅力,谁遭的住?

吃瓜局
2025-11-11 16:23:49
我过了70岁才发现:拼搏半生换来的房子和存款,却成了一种负担

我过了70岁才发现:拼搏半生换来的房子和存款,却成了一种负担

蝉吟槐蕊
2025-11-07 10:29:57
32岁女教师跳楼身亡!俩娃没了妈,最大8岁,丈夫提2诉求却遭网暴

32岁女教师跳楼身亡!俩娃没了妈,最大8岁,丈夫提2诉求却遭网暴

揽星河的笔记
2025-11-12 15:29:49
上海市委决定:董依雯履新

上海市委决定:董依雯履新

鲁中晨报
2025-11-12 18:19:02
头等大事、重中之重!吉林成立省级领导小组、组建办公机构

头等大事、重中之重!吉林成立省级领导小组、组建办公机构

政知新媒体
2025-11-12 22:35:56
2025-11-13 10:43:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11701文章数 142505关注度
往期回顾 全部

科技要闻

深夜重磅!GPT-5.1发布,奥特曼大谈情商

头条要闻

号称3招追回欠款 男子冒用律师身份"套路"多名农民工

头条要闻

号称3招追回欠款 男子冒用律师身份"套路"多名农民工

体育要闻

消磨你上千小时的足球游戏,走过第20年

娱乐要闻

一场演唱会,戳穿岳云鹏圈中地位

财经要闻

源峰25亿赌局!汉堡王中国"卖身"求生

汽车要闻

具备高阶辅助驾驶功能 欧拉5预售价10.98万起

态度原创

艺术
本地
游戏
房产
公开课

艺术要闻

黄君璧:仿古山水册

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

V社公开三款新硬件:游戏PC、手柄与VR 扩展Steam硬件生态

房产要闻

海垦城建·鹿城壹号品牌发布会暨美学示范区璀璨启幕

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版