网易首页 > 网易号 > 正文 申请入驻

浙大提出SSGaussian:注入语义与结构灵魂的3D风格迁移,让高斯溅射场景化身艺术品

0
分享至

将梵高的《星夜》“画”在一个三维场景上,是一种怎样的体验?近年来,随着NeRF和3D高斯溅射(3D Gaussian Splatting)等三维神经表示技术的兴起,3D风格迁移成为了一个热门研究方向。然而,现有的方法往往只能机械地“粘贴”纹理,却难以理解和传递风格图像中高层次的艺术“灵魂”——比如,天空应该有漩涡,而不是简单地涂成蓝色。同时,风格化后的三维场景常常显得模糊混乱,物体与物体之间界限不清。

为了解决这些问题,来自浙江大学的研究团队提出了一种全新的3D风格迁移管线——SSGaussian。这个名字本身就揭示了其核心目标:Semantic-Aware (语义感知)Structure-Preserving (结构保持)。通过巧妙地利用强大的2D扩散模型先验,SSGaussian成功地将风格的“神韵”与场景的“筋骨”完美结合,生成了前所未有的、兼具艺术美感与结构清晰度的3D风格化世界。



  • 论文标题:SSGaussian: Semantic-Aware and Structure-Preserving 3D Style Transfer

  • 作者团队:Jimin Xu, Bosheng Qin, Tao Jin, Zhou Zhao, Zhenhui Ye, Jun Yu, Fei Wu

  • 所属机构:浙江大学

  • 论文地址:https://arxiv.org/abs/2509.04379

  • 项目主页:https://jm-xu.github.io/SSGaussian

  • 代码地址:https://github.com/jm-xu/SSGaussian

研究背景:3D风格迁移的“形似”与“神似”之困

当前的3D风格迁移方法,虽然能够将风格图像的颜色、笔触等低级模式应用到三维场景中,并保持多视角的一致性,但它们往往在两个更深层次的方面表现不佳:

  1. 缺乏语义理解:模型无法真正“看懂”风格图像。它不知道梵高的《星夜》中,漩涡状的笔触是用来描绘天空的,因此可能会错误地将这种风格应用到建筑或地面上,导致风格错配。

  2. 破坏场景结构:风格化过程常常会模糊场景中不同物体之间的边界,使得整个场景看起来像一锅“五彩粥”,失去了原有的结构感和深度感,难以分辨独立的物体实例。

SSGaussian正是为了解决“神韵不准”和“筋骨不清”这两大痛点而设计的。

SSGaussian:两阶段“升维”的艺术创作法

SSGaussian的核心是一种创新的两阶段管线,它没有直接对复杂的三维场景进行风格化,而是采取了一种更聪明的“先降维,后升维”的策略。


SSGaussian 整体管线示意图

第一阶段:利用扩散模型,对2D关键视角进行高质量风格化。首先,从原始的3D高斯场景中选取几个有代表性的“关键视角”,渲染出它们的2D图像。然后,借助强大的预训练2D扩散模型(如Stable Diffusion),将参考风格应用到这些2D图像上。

第二阶段:将风格化的2D关键视角“升维”迁移回3D高斯表示。在获得了一组高质量、风格一致的2D图像后,再将这些图像上的风格信息精准地迁移回完整的三维高斯场景中。


两阶段风格化流程图解

为了实现这一流程,作者设计了两大核心创新模块:

创新一:跨视角风格对齐 (Cross-View Style Alignment, CVSA)

在第一阶段,如何保证多个关键视角的风格化结果是相互一致的?如果独立地对每张图进行风格化,很可能出现“左边视角的天是蓝色,右边视角的天是绿色”的矛盾情况。为此,作者在扩散模型的U-Net结构中引入了跨视角注意力机制。这使得在为某个视角生成图像时,模型能够“参考”其他视角的信息,从而确保所有关键视角的风格化结果在语义和细节上都保持高度一致。


CVSA模块显著提升了多视角间的风格一致性

创新二:实例级风格迁移 (Instance-level Style Transfer, IST)

在第二阶段,如何将2D风格迁移回3D场景,同时保持物体的独立性和结构感?作者提出了实例级风格迁移。该方法能够识别并利用不同关键视角中相同的物体实例(例如,同一栋建筑在不同视角下的样子),并将风格作为一个整体应用到这个三维物体上。这保证了风格不会“溢出”到邻近的物体上,从而使得最终的3D场景结构清晰,层次分明。


IST方法有效减少了模糊和视觉伪影,使场景结构更清晰

实验结果:全方位超越SOTA

SSGaussian在各种场景(包括前视场景和更具挑战性的360度场景)下,与现有的SOTA方法进行了全面的定性和定量比较。

从定性结果来看,SSGaussian生成的场景不仅风格更贴近参考图的“神韵”,而且物体边缘清晰,结构感强,艺术表现力远超其他方法。


在前视场景(LLFF数据集)上的定性对比


在360度场景(Tanks and Temples数据集)上的定性对比

定量指标也同样印证了其优越性。无论是在衡量多视角一致性的LPIPS和RMSE指标上,还是在衡量风格/内容损失的指标上,SSGaussian都取得了最佳或接近最佳的成绩。


一致性指标定量对比


渲染质量指标定量对比

此外,用户研究表明,认为SSGaussian的风格化结果在整体上优于其他方法也居于多数,显示了其在主观视觉感受上的巨大优势。


用户研究结果

SSGaussian为3D风格迁移领域带来了一股清新的空气。它没有沿着老路去直接优化三维表示,而是巧妙地借助了2D扩散模型强大的先验知识,通过“2D生成->3D迁移”的两阶段管线,成功地解决了语义感知和结构保持两大核心难题。

其提出的跨视角风格对齐(CVSA)实例级风格迁移(IST)两个创新模块,为保证多视角一致性和场景结构清晰度提供了行之有效的解决方案。

这项工作不仅显著提升了3D风格迁移的艺术表现力和视觉质量,也为未来如何将强大的2D生成先验知识应用于三维内容创作提供了宝贵的思路和范例。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
雷军预判了苹果的所有预判

雷军预判了苹果的所有预判

源媒汇
2025-09-16 17:40:37
生态环境部发布会上提到广东这条河,督察助力黑臭河变生态河

生态环境部发布会上提到广东这条河,督察助力黑臭河变生态河

南方都市报
2025-09-19 14:53:14
电影《731》导演让刚出生女儿出演剖腹取婴镜头,镜头中仿真娃娃效果差,导演妻子李善玉:为了电影我们值得

电影《731》导演让刚出生女儿出演剖腹取婴镜头,镜头中仿真娃娃效果差,导演妻子李善玉:为了电影我们值得

观威海
2025-09-19 11:05:02
“给钱也不卖中国”!日德联合断供高铁车轮,被中国规则彻底打脸

“给钱也不卖中国”!日德联合断供高铁车轮,被中国规则彻底打脸

刘森森
2025-09-19 11:53:13
工商银行,突发!

工商银行,突发!

券商中国
2025-09-19 13:20:20
刘永好和上海孩子的午餐生意

刘永好和上海孩子的午餐生意

融资中国
2025-09-19 13:39:35
超美女生被闺蜜用菜刀砍头缝11针,发长文曝对方卖“原味丝袜”细节我大开眼界

超美女生被闺蜜用菜刀砍头缝11针,发长文曝对方卖“原味丝袜”细节我大开眼界

浪花妈妈
2025-09-18 23:51:15
中方担心的发生了,300辆列车滞留边境,白俄增兵,中欧班列已断

中方担心的发生了,300辆列车滞留边境,白俄增兵,中欧班列已断

壹知眠羊
2025-09-16 19:30:06
宋伊人新片遭抵制!长相平平却资源逆天,于正对她的评价一针见血

宋伊人新片遭抵制!长相平平却资源逆天,于正对她的评价一针见血

古希腊掌管月桂的神
2025-09-19 14:53:33
凌晨有了结果!14票赞成,被美国一票否决,决议未通过!中方:非常失望

凌晨有了结果!14票赞成,被美国一票否决,决议未通过!中方:非常失望

每日经济新闻
2025-09-19 08:44:00
西贝老板这么笨,是如何成为亿万富豪的?说白了就是胆大、运气好

西贝老板这么笨,是如何成为亿万富豪的?说白了就是胆大、运气好

水晶的视界
2025-09-18 20:55:18
【关注】官媒发声:调整公立医院分配制度,医务人员收入应为公务员2倍以上

【关注】官媒发声:调整公立医院分配制度,医务人员收入应为公务员2倍以上

魏子柠说
2025-09-17 00:12:47
2-13!中国队实力弱 创12年尴尬纪录 出线难度大 亚足联帮不上忙

2-13!中国队实力弱 创12年尴尬纪录 出线难度大 亚足联帮不上忙

侃球熊弟
2025-09-19 00:20:03
王小雨突然杀入港股!大跌原因找到了,券商压盘现象重现...

王小雨突然杀入港股!大跌原因找到了,券商压盘现象重现...

金石随笔
2025-09-19 00:07:32
中央巡视组进驻后,三厅官被查

中央巡视组进驻后,三厅官被查

鲁中晨报
2025-09-19 15:29:49
哈马斯发布强硬声明

哈马斯发布强硬声明

政知新媒体
2025-09-19 16:35:27
某羽毛球品牌涉嫌辱华,国人当自强!

某羽毛球品牌涉嫌辱华,国人当自强!

杨晨大神
2025-09-18 12:23:07
氢氟酸夺命后续:家属撒谎事发非散步,现场照片流出,谎言被戳穿

氢氟酸夺命后续:家属撒谎事发非散步,现场照片流出,谎言被戳穿

八斗小先生
2025-09-19 14:09:05
王朔:越没本事的人越喜欢学人情世故,酒桌怎么敬酒,怎么发烟

王朔:越没本事的人越喜欢学人情世故,酒桌怎么敬酒,怎么发烟

清风拂心
2025-09-19 14:15:05
湖底惊现39年前失踪的运钞车,钞箱毫发无损,撬开后却傻眼了

湖底惊现39年前失踪的运钞车,钞箱毫发无损,撬开后却傻眼了

青青会讲故事
2025-09-17 11:32:38
2025-09-19 17:32:49
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5084文章数 64587关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

55岁农妇"辱骂"法官被罚10万 涉事法院:撤销罚款决定

头条要闻

55岁农妇"辱骂"法官被罚10万 涉事法院:撤销罚款决定

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

美联储降息落地 对市场有何影响

汽车要闻

零跑D19定档10月16日,旗舰SUV全球首秀

态度原创

家居
艺术
手机
时尚
军事航空

家居要闻

公共艺术 限时体验打造

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

手机要闻

苹果线下店展出iPhone 17 Pro真机:已满身划痕!铝合金机身被吐槽质感差

今秋这件“瘦瘦衫”必穿!巨in巨洋气,上身瘦十斤!

军事要闻

卫星图像显示以军坦克集结加沙城周围

无障碍浏览 进入关怀版