网易首页 > 网易号 > 正文 申请入驻

少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了

0
分享至



本文作者来自上海交通大学、英国曼彻斯特大学与香港中文大学。团队成员包括:徐博、王钰超、乐心怡(上海交通大学,自动化系),郭宇鹄、王昌凌(英国曼彻斯特大学,机械与航空航天工程学院),王文婷、任扬(香港中文大学,机械与自动化工程学系)。

表面重建的核心挑战,在于在少量视角下同时兼顾几何准确性、细节还原与结构完整性。现有神经隐式路线,在样本稀疏时容易出现跨视角对应不稳、边界发糊、局部缺失等现象;当可见区域有限、纹理不明显、遮挡复杂时,这些问题会被进一步放大。

为了补救,不少工作尝试引入单目深度、法线或稠密视角序列等外部几何线索,但这通常意味着额外的采集成本和不稳定的噪声来源,一旦误差被带入,反而会破坏原本已经较为准确的几何。

另一条思路是通过更复杂的网络结构或强先验来提升稳定性,可迁移性与训练成本却随之上升,且在真实场景下的鲁棒性并不总是稳定。

归根到底,稀疏视角的难点在于覆盖不足导致的匹配不稳定与形辐射歧义:同一结构在不同视角里的局部片段难以可靠对应,优化过程容易迷失在局部最优。

直观经验却告诉我们,只要把同一物体的 “对应部分” 对齐,形状就会变得清晰。基于这一朴素而有效的直觉,作者提出SERES(Semantic-Aware Reconstruction from Sparse Views),在不改动主干框架的前提下,把跨视角的语义一致性变成一种训练期先验注入到模型里,用低成本的方法去解决高价值的歧义问题,让少量视角也能得到清晰而完整的几何。



该工作来自上海交通大学,曼彻斯特大学和香港中文大学的团队,目前已被 IEEE Transactions on Visualization and Computer Graphics(TVCG)接收



  • 论文标题:SERES: Semantic-Aware Neural Reconstruction from Sparse Views
  • 论文主页:https://seres0.github.io/
  • 论文链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=11197045

方法概览

SERES 的设计围绕两条主线展开:语义匹配先验与区域级正则。整体以训练期插件的方式接入常见主干,如 NeuS 或 Neuralangelo,不改变体渲染与隐式表面的基本表达,仅在训练中提供额外的线索与约束。



图 1 SERES 方法流程

语义匹配先验

首先是语义匹配先验。直观地说,作者让 “来自他视角的提醒” 在训练中始终存在。具体做法是,从每张输入图像中自动提取一组稳定的语义块与几何原语。语义块侧重于外观与语义的一致性,几何原语则对应更具结构意义的区域。随后,对这些语义块提取图像级特征,并在多视角之间进行交互式的对齐与聚合,让不同视角中 “看似相似” 的部分彼此对上号。这样得到的先验信息被作为额外输入喂给重建主干,使得主干在每一次更新时,都能显式感知来自其他视角的对应关系。



图 2 语义匹配质量对重建质量的影响

这种做法的好处在于,模型不再孤立地依赖单一视角的证据,而是在训练的每一步都被提醒哪些细节需要被保留、哪些边界应当对齐、哪些区域存在歧义需要更谨慎地处理。对于稀疏视角尤其是极少视角的情况,这份提醒能显著减少错配带来的形状扭曲与边界模糊。

点提示引导的区域级正则

仅有像素级误差往往不足以约束形状的全局一致性,尤其在纹理稀薄或反射复杂的区域,像素级监督容易放大噪声。SERES 在图像空间引入了可解释的区域一致性。基于前述的几何原语,作者为每张图像得到一组覆盖关键部件的区域分割与掩膜。在训练过程中,这些可解释的区域与模型渲染得到的语义分布进行对齐,形成面向区域的一致性约束。它鼓励模型在真实边界处给出更清晰、稳定的表面表达,在容易产生歧义的部分尽量减少破碎或漂移。与仅依赖像素损失不同,区域级正则在结构层面提供了 “形状应该如何对齐” 的强信号,能有效抑制噪声碎片,让最终的网格更干净、曲面更连贯。



图 3 语义属性体渲染结果

从工程实现角度看,SERES 的两条主线都只在训练期生效,不改变推理流程。语义先验分解为稳定分块、特征提取与跨视角聚合三步,接口简单;区域级正则以可解释的掩膜为锚,和主干的渲染分布对齐即可。整体额外计算开销小,训练时间仅有小幅增加,对不同主干的适配也无需侵入式改造。

消融实验表明(见实验部分),缺失语义匹配先验时,跨视角错配与形变明显增多;去掉区域级正则时,网格易出现噪声与断裂;而使用未优化或质量不高的先验,同样会拖累最终几何。

实验

在 DTU 的稀疏多视角设置中,SERES 作为训练期插件显著提升了重建质量与新视角合成质量。与主流基线相比,画面质量指标在多组场景中全面优于对应的原始主干,同时几何误差在从极少到较少视角的范围内稳定下降。随着视角数从极少逐步增加,误差的下降趋势依旧保持,说明这套先验与正则对不同稀疏程度都有稳定收益。





图 4 DTU 重建效果



图 5 视角数变化的影响

在 BlendedMVS 以及多种真实场景(高反射、复杂拓扑、低纹理) 中,SERES 输出更完整、更干净的几何,在难匹配区域有效减少断裂与噪声,体现出良好的鲁棒性与通用性。

与仅依赖像素级误差不同,区域级正则的价值在真实边界处更为直观。很多难例,如重复纹理、细杆与枝类的复杂拓扑,往往在像素层面难以稳定监督。区域级约束将这些区域包裹起来,以更高层次的一致性去牵引优化,使得模型对边界位置的判断更果断,对结构连贯性的把握更稳定,从而减少边缘糊、壳体破洞以及不必要的表面漂移。对少视角训练而言,这种结构层面的 “拉紧” 尤为关键,它相当于给优化过程加上了可靠的护栏。



图 6 BMVS 重建效果



图 7 实拍场景重建效果

消融实验显示,缺失语义匹配先验或区域级正则都会明显拉低重建质量,这两者是互补且必要的。



图 8 消融实验结果

结论

SERES 把跨视角的语义一致性与结构层面的区域约束,变成一种低成本、可解释、可复用的训练期先验。它以即插即用的方式接入现有的隐式重建框架,不需要额外传感器或复杂改造,即便在很少的视角下,也能恢复边界清晰、结构完整、细节可靠的表面。面对更大规模场景、更复杂材质与光照等现实挑战,这一思路仍有充分拓展空间。对工程团队而言,SERES 的接口简单、迁移门槛低、真实场景友好,适合直接集成到当前的稀疏三维重建工作流中,用更少的视角获得更高保真的几何重建。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
意外!奥斯卡在上港多年一直生龙活虎,为何回到巴西心脏就出问题

意外!奥斯卡在上港多年一直生龙活虎,为何回到巴西心脏就出问题

懂个球
2025-11-12 17:00:58
空警-3000横空出世,B-21或未服役即落后,全球无对手!

空警-3000横空出世,B-21或未服役即落后,全球无对手!

阿淫记录生活日常
2025-11-10 18:17:35
算命老先生说,明天开始财运迎风来,好运加持横财铺路

算命老先生说,明天开始财运迎风来,好运加持横财铺路

人閒情事
2025-11-13 13:12:46
南京一波区划调整!步子能否再大点?

南京一波区划调整!步子能否再大点?

南京买房惠
2025-11-13 13:01:23
支持统一被赖清德封杀后,赖岳谦宣布一项重大决定,竟和大陆相关

支持统一被赖清德封杀后,赖岳谦宣布一项重大决定,竟和大陆相关

温读史
2025-11-12 17:38:38
哈佛教授惊呼三连:没见过!没想到!中国发展太快了!

哈佛教授惊呼三连:没见过!没想到!中国发展太快了!

青途历史
2025-11-11 20:12:17
眼科主任面带桃花:前一秒甜美养眼,后一秒大尺度画面太辣眼

眼科主任面带桃花:前一秒甜美养眼,后一秒大尺度画面太辣眼

公子麦少
2025-11-08 16:20:48
古埃及历史真实情况:中国考古破开一角,西方历史果然可疑

古埃及历史真实情况:中国考古破开一角,西方历史果然可疑

小豫讲故事
2025-11-09 06:00:03
陈梦力克蒯曼,对手感叹,采访中却坦言不足

陈梦力克蒯曼,对手感叹,采访中却坦言不足

阿嚼影视评论
2025-11-13 15:35:32
1957年的裸体与热吻,老外偷拍中国的那些照片,集齐了不易

1957年的裸体与热吻,老外偷拍中国的那些照片,集齐了不易

霹雳炮
2025-11-04 23:30:25
陪玩陪睡不够!集体开嫖、舔手指、目无王法,阴暗面彻底藏不住了

陪玩陪睡不够!集体开嫖、舔手指、目无王法,阴暗面彻底藏不住了

好贤观史记
2025-11-09 21:58:39
她最后是活活臭死的,大小便失禁,躺在自己的屎尿里,浑身烂疮

她最后是活活臭死的,大小便失禁,躺在自己的屎尿里,浑身烂疮

瑶卿文史
2025-10-29 22:05:37
110岁的年纪、80岁的骨龄!杭州最年长老人之一的他,每天必吃鸡蛋羹、维生素,如今还有两大爱好:看电视、聊八卦

110岁的年纪、80岁的骨龄!杭州最年长老人之一的他,每天必吃鸡蛋羹、维生素,如今还有两大爱好:看电视、聊八卦

都市快报橙柿互动
2025-11-12 15:35:43
一个人有两个老婆是啥体验?网友:等有钱了我准备养三个老公

一个人有两个老婆是啥体验?网友:等有钱了我准备养三个老公

带你感受人间冷暖
2025-09-30 00:15:06
广西壮族自治区政协原副主席潘鸿权逝世,享年83岁

广西壮族自治区政协原副主席潘鸿权逝世,享年83岁

澎湃新闻
2025-11-13 10:24:30
11月13日全运会乒乓球直播表:CCTV5节目单及赛程安排

11月13日全运会乒乓球直播表:CCTV5节目单及赛程安排

吴猖旅行ing
2025-11-13 09:40:26
终于有个日本将军,把窗户纸给捅破了:再打仗,日本可能就没了

终于有个日本将军,把窗户纸给捅破了:再打仗,日本可能就没了

李子橱
2025-11-06 21:30:03
日本投降后,躲进长白山的2万日军和1万妇女,他们最终结局如何?

日本投降后,躲进长白山的2万日军和1万妇女,他们最终结局如何?

兴趣知识
2025-11-12 08:29:13
匈牙利超模维多利亚·瓦尔加,近日以一身性感造型亮相社交平台

匈牙利超模维多利亚·瓦尔加,近日以一身性感造型亮相社交平台

星耀国际足坛
2025-11-13 00:39:40
15岁男孩被骗柬埔寨后续:园区态度嚣张,赎人条件曝光,父母崩溃

15岁男孩被骗柬埔寨后续:园区态度嚣张,赎人条件曝光,父母崩溃

以茶带书
2025-11-12 15:54:54
2025-11-13 16:19:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11706文章数 142505关注度
往期回顾 全部

科技要闻

深夜重磅!GPT-5.1发布,奥特曼大谈情商

头条要闻

男模同时交往2位富婆 46岁女友借款900万:他付过真心

头条要闻

男模同时交往2位富婆 46岁女友借款900万:他付过真心

体育要闻

保罗,看看你对马刺干的好事!

娱乐要闻

一场演唱会,戳穿岳云鹏圈中地位

财经要闻

源峰25亿赌局!汉堡王中国"卖身"求生

汽车要闻

具备高阶辅助驾驶功能 欧拉5预售价10.98万起

态度原创

数码
旅游
教育
亲子
军事航空

数码要闻

4kg 铜质厚重:Keychron 推 Q1 HE Copper Edition 三模磁轴键盘

旅游要闻

关键词读懂“十五五”| 锚定旅游强国目标 推动入境游、“中国购”持续升温

教育要闻

初中竞赛题,a²+b²=3250,求a+b

亲子要闻

产后肛裂痛了3年,两次手术都搞唔掂!真凶竟系“排便角度”?

军事要闻

美国在委内瑞拉海岸动用无人机和F-35

无障碍浏览 进入关怀版