网易首页 > 网易号 > 正文 申请入驻

剑桥大学定义图形世界:神经网络让纹理压缩像画家调色一样自然

0
分享至


在数字图形的世界里,纹理就像是给3D模型穿上的衣服,让原本光秃秃的几何体变得生动逼真。然而,这些"衣服"往往非常占用存储空间和计算资源,就像一个衣柜里堆满了厚重的冬装。剑桥大学计算机科学技术系的研究团队在2026年2月发表的这项研究(论文编号arXiv:2602.02354v1),就像是发明了一种神奇的压缩技术,能够把厚重的冬装变成同样保暖但轻薄如丝的材料。

这项研究的核心在于探索一种全新的纹理表示方法——隐式神经表示(Implicit Neural Representation,简称INR)。传统的纹理存储方式就像是用数码相机拍照,每个像素点都要单独记录颜色信息,数据量庞大。而INR技术则更像是训练一位画家的大脑,让神经网络学会根据坐标位置直接"想象"出该处应该是什么颜色,从而用极少的参数就能重现复杂的纹理图案。

研究团队选择了四种不同的神经网络架构来完成这项"画家训练计划"。第一种是最基础的多层感知机(MLP),就像是刚入门的画家,只掌握了基本的绘画技巧。第二种加入了正弦激活函数的SIREN网络,如同天赋异禀的画家,天生对曲线和波浪有着敏锐的感知。第三种则配备了傅里叶位置编码的MLP,相当于给画家配了一副特殊眼镜,能够更清晰地捕捉到高频细节。第四种虽然实现了多分辨率哈希编码,但由于纹理分辨率限制,研究团队认为它在此场景下优势不明显。

为了验证这些"画家"的能力,研究团队从包含5640张图像、47个不同类别的可描述纹理数据集中精心挑选了25张最具代表性的样本。这个选择过程就像是为画家选择最具挑战性的题材,研究人员使用拉普拉斯方差作为衡量标准,这个指标能够反映图像的复杂程度和清晰度,确保选出的样本能够全面考验不同网络的表现能力。

在实际的"绘画比赛"中,研究团队发现每种网络都有着独特的"绘画风格"和擅长领域。最基础的MLP就像是用模糊的画笔作画,总是产生朦胧的效果,虽然有时这种朦胧美反而适合某些场景,但整体上缺乏细节表现力。SIREN网络则展现出了对曲线的天赋,能够很好地表现波浪、云朵等自然纹理,但在处理直线和几何图案时却显得力不从心,经常产生一些"波浪状"的意外效果。

最令人印象深刻的是配备傅里叶编码的MLP,它就像是戴上了高倍显微镜的画家,能够捕捉到极其精细的纹理细节。在感知质量评估中,这种网络几乎达到了与原始纹理难以区分的程度。然而,它也有自己的"个人风格"——偶尔会在画面中添加一些细微的颗粒感,特别是在处理大面积单一颜色区域时。

研究过程中,团队还发现了一个有趣的现象:优化器的选择对"画家"的表现有着决定性影响。Adam优化器就像是一位耐心的绘画老师,能够稳定地指导网络学习,而Rprop优化器虽然有时能带来惊喜,但整体表现不够稳定,经常让画家在学习过程中走弯路。

为了让这些"数字画家"更加实用,研究团队还探索了多级纹理(mipmap)的处理能力。在传统的图形系统中,为了在不同距离下显示合适的纹理细节,需要预先生成多个不同分辨率的版本,就像为同一幅画准备不同尺寸的复印件。而神经网络画家们学会了根据一个额外的"距离参数"来调整绘画的精细程度,就像真正的画家能够根据观看距离调整笔触粗细一样。

在与传统压缩技术ASTC的比较中,神经网络方法展现出了明显的优势。ASTC就像是用印刷机批量生产图像,虽然压缩率很高,但质量损失明显,特别是在感知质量方面。而神经网络方法更像是让画家用记忆重新绘制,虽然可能在某些像素级别的细节上有微小差异,但整体的视觉效果和艺术感受却能很好地保持。

研究团队甚至尝试了一个更加前卫的想法——在神经网络的参数空间中进行"创作"。他们训练了一个生成模型来学习不同纹理对应的网络参数模式,就像是培养一位能够模仿不同画家风格的超级画家。虽然这个方向的结果还不够完美,但已经展示出了令人兴奋的可能性。

为了将这项技术真正应用到实际的图形渲染中,研究团队将他们的方法集成到了Mitsuba 3渲染器中。这个集成过程就像是为专业的艺术工作室配备了这些"数字画家",让它们能够实时参与到3D场景的渲染过程中。虽然目前的渲染速度还不能满足实时游戏的需求,但对于电影制作、建筑可视化等对质量要求更高的应用场景来说,这种技术已经显示出了巨大的潜力。

在训练效率方面,这些"画家"的学习过程相对迅速,在配备RTX 5080Ti显卡的设备上,大约只需要50到200秒就能完成一个纹理的学习过程。这个速度虽然不能用于实时应用,但对于内容创作者来说已经相当实用了。

研究团队还详细分析了不同网络架构的内存占用情况。相比传统的纹理存储方式,神经网络方法的内存占用要小得多,特别是对于高分辨率纹理来说,这种优势更加明显。这就像是用一小段乐谱就能让音乐家演奏出完整的交响曲,而不需要存储每一个音符的录音。

通过大量的实验和评估,研究团队证明了神经网络在纹理表示方面的巨大潜力。在多个评价指标中,特别是在LPIPS(学习感知图像块相似性)这个更贴近人类视觉感受的指标上,神经网络方法都表现出了显著的优势。这意味着即使在技术细节上可能有微小差异,但人眼看到的效果几乎与原始纹理无异。

这项研究不仅仅是一个技术验证,更像是为未来的数字内容创作开启了一扇新的大门。随着游戏画面越来越逼真,虚拟现实体验越来越丰富,对纹理质量和存储效率的要求也越来越高。传统的纹理压缩技术就像是用更小的相框装更大的画,总是要在质量和大小之间做出妥协。而神经网络方法则提供了一种全新的思路——让计算机学会"理解"纹理的本质,然后用这种理解来重现纹理,而不是简单地存储像素信息。

当然,这项技术目前还有一些限制。比如对于每种纹理都需要单独训练网络,这个过程虽然不算太长,但也不能做到即时完成。另外,在处理某些特定类型的纹理时,不同的网络架构会表现出明显的偏好,需要根据具体应用场景来选择最合适的方法。

展望未来,这项技术有着广阔的应用前景。在游戏开发中,它能够显著减少游戏包的大小,同时保持高质量的视觉效果。在虚拟现实应用中,它能够在有限的硬件资源下提供更丰富的视觉体验。在电影和动画制作中,它为创作者提供了新的工具来表现复杂的材质效果。

研究团队在论文的最后部分还提出了许多值得探索的未来方向。比如如何更智能地选择网络超参数,如何处理各向异性过滤,如何将多个相似纹理压缩到同一个网络中等等。这些方向就像是为这幅宏大的技术蓝图添加了更多精彩的细节,等待着后续的研究者去填充和完善。

说到底,这项来自剑桥大学的研究就像是在数字世界中重新定义了"记忆"的概念。传统的纹理存储方式是"死记硬背",每个像素都要精确记录。而神经网络方法更像是"理解记忆",通过学习纹理的内在规律和模式,用更少的信息重现更丰富的视觉效果。这种从量变到质变的转换,不仅仅是技术上的进步,更代表了我们对数字内容表示方式的全新思考。

对于普通用户来说,虽然可能不会直接接触到这些底层技术,但它们带来的改变却会悄无声息地影响我们的数字生活体验。未来的游戏可能会更小但更精美,虚拟现实体验可能会更流畅但更逼真,这一切的背后,都有着像这项研究一样的基础技术创新在默默支撑。有兴趣深入了解技术细节的读者可以通过论文编号arXiv:2602.02354v1查询完整的研究报告。

Q&A

Q1:神经网络纹理压缩技术与传统JPEG压缩有什么区别?

A:传统的JPEG压缩就像用印刷机复制图像,通过删减信息来减小文件大小,但会造成明显的质量损失。而神经网络纹理压缩更像是训练一位画家的大脑,让网络学会根据坐标位置直接"想象"出该处的颜色,用极少的参数就能重现复杂纹理,在大幅减少存储空间的同时保持极高的视觉质量。

Q2:SIREN网络在处理纹理时有什么特殊优势?

A:SIREN网络使用正弦激活函数,就像天赋异禀的画家对曲线和波浪有着敏锐感知。它特别擅长表现自然纹理如波浪、云朵等,能够很好地捕捉这些图案的周期性特征。但在处理直线和几何图案时却显得力不从心,经常会产生一些意外的波浪状效果。

Q3:这项纹理压缩技术什么时候能应用到实际游戏中?

A:目前这项技术的训练过程需要50-200秒,渲染速度还不能满足实时游戏需求。但对于电影制作、建筑可视化等对质量要求更高的应用场景已经显示出巨大潜力。随着硬件性能提升和算法优化,未来几年内很可能会在游戏开发中看到这项技术的应用,特别是在减少游戏包大小方面。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卡扎菲儿子在家被暗杀身亡!4名蒙面人员闯入住所,切断监控、激烈交火

卡扎菲儿子在家被暗杀身亡!4名蒙面人员闯入住所,切断监控、激烈交火

红星新闻
2026-02-04 12:14:13
大S雕像仪式刚结束,葛斯齐深夜爆其猛料,许雅钧表现逆转口碑!

大S雕像仪式刚结束,葛斯齐深夜爆其猛料,许雅钧表现逆转口碑!

古希腊掌管月桂的神
2026-02-03 10:20:14
笑不活!350万页档案查无川普,川黑白左的脸肿成猪头

笑不活!350万页档案查无川普,川黑白左的脸肿成猪头

壹家言
2026-02-04 00:48:53
A股:刚刚,大消息传来,释放一信号,牛市将迎更大级别的行情!

A股:刚刚,大消息传来,释放一信号,牛市将迎更大级别的行情!

云鹏叙事
2026-02-04 15:37:20
初中和高中的区别:初中即使每次都考第一名,到高中都可能变倒数

初中和高中的区别:初中即使每次都考第一名,到高中都可能变倒数

好爸育儿
2026-02-04 22:18:57
爱国者硬刚锆石!乌克兰创下高超音速拦截新纪录

爱国者硬刚锆石!乌克兰创下高超音速拦截新纪录

老马拉车莫少装
2026-02-03 22:55:29
明珍珍临死前怕了,端碗的手发抖,眼神涣散流下恐惧的泪

明珍珍临死前怕了,端碗的手发抖,眼神涣散流下恐惧的泪

子芫伴你成长
2026-02-03 19:02:42
老泄残精,人穷寿尽!医生提醒:63岁之后,男性要守好这三道关

老泄残精,人穷寿尽!医生提醒:63岁之后,男性要守好这三道关

健康科普365
2026-01-30 21:26:44
北京拟立规管理帐篷露营地:夜间住宿应登记注册

北京拟立规管理帐篷露营地:夜间住宿应登记注册

北京商报
2026-02-04 17:05:05
​亏损超5.5亿,中美观众都不买账,2026年第一票房惨案诞生了‍

​亏损超5.5亿,中美观众都不买账,2026年第一票房惨案诞生了‍

靠谱电影君
2026-02-02 21:12:28
夫妻网购娃娃菜中毒大反转!是丈夫投毒,对妻子灭口,商家被坑惨

夫妻网购娃娃菜中毒大反转!是丈夫投毒,对妻子灭口,商家被坑惨

离离言几许
2026-02-03 15:12:39
中国地震台网自动测定:2月4日18时39分在新西兰克马德克群岛附近(南纬29.57度,西经178.58度)发生6.1级左右地震

中国地震台网自动测定:2月4日18时39分在新西兰克马德克群岛附近(南纬29.57度,西经178.58度)发生6.1级左右地震

每日经济新闻
2026-02-04 19:01:06
S家洗白失败!韩国综艺锤了小S忽视姐姐病情,推卸责任甩锅给大S

S家洗白失败!韩国综艺锤了小S忽视姐姐病情,推卸责任甩锅给大S

萌神木木
2026-02-04 19:05:07
韩国歌手当众大骂张兰母子!具俊晔联手韩媒,汪小菲在韩的店恐凉

韩国歌手当众大骂张兰母子!具俊晔联手韩媒,汪小菲在韩的店恐凉

离离言几许
2026-02-04 16:35:22
央企核电龙头牛市走熊,股价跌破回购均价逼近社保基金会认购价

央企核电龙头牛市走熊,股价跌破回购均价逼近社保基金会认购价

每日经济新闻
2026-02-04 18:18:04
不要再随意猜测杨兰兰的身份了,释放的信号很明显了

不要再随意猜测杨兰兰的身份了,释放的信号很明显了

李昕言温度空间
2025-08-20 15:01:53
上春晚的人形机器人,公布了!

上春晚的人形机器人,公布了!

青年家
2026-01-28 20:13:36
莫迪跪了,普京心碎,特朗普以为胜券在握,结果中国根本不吃这套

莫迪跪了,普京心碎,特朗普以为胜券在握,结果中国根本不吃这套

墨兰史书
2026-02-04 18:55:31
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
文旅部:坚决拥护党中央决定

文旅部:坚决拥护党中央决定

新京报政事儿
2026-02-03 23:09:04
2026-02-05 04:44:49
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7138文章数 549关注度
往期回顾 全部

科技要闻

太烦人遭投诉!元宝红包链接被微信屏蔽

头条要闻

女子痛斥爱泼斯坦:我一次又一次被强奸 他禽兽不如

头条要闻

女子痛斥爱泼斯坦:我一次又一次被强奸 他禽兽不如

体育要闻

哈登回应交易:不想让自己拖累快船的未来

娱乐要闻

春晚主持人阵容曝光,5位都是老面孔

财经要闻

白银,突然暴涨

汽车要闻

综合续航1730km 5座中级电混SUV吉利银河M7官图发布

态度原创

手机
时尚
教育
健康
亲子

手机要闻

苹果即将强制App使用iOS 26 SDK构建,微信要适配液态玻璃了?

60岁的刘嘉玲、章小蕙太美了!港女的魅力从不是少女感

教育要闻

数学提分,往往从复盘开始

耳石症分类型,症状大不同

亲子要闻

麻腮风疫苗到底要不要给孩子打?听听儿科医生怎么说

无障碍浏览 进入关怀版