来源:市场资讯
(来源:科技行者)
![]()
在数字图形的世界里,纹理就像是给3D模型穿上的衣服,让原本光秃秃的几何体变得生动逼真。然而,这些"衣服"往往非常占用存储空间和计算资源,就像一个衣柜里堆满了厚重的冬装。剑桥大学计算机科学技术系的研究团队在2026年2月发表的这项研究(论文编号arXiv:2602.02354v1),就像是发明了一种神奇的压缩技术,能够把厚重的冬装变成同样保暖但轻薄如丝的材料。
这项研究的核心在于探索一种全新的纹理表示方法——隐式神经表示(Implicit Neural Representation,简称INR)。传统的纹理存储方式就像是用数码相机拍照,每个像素点都要单独记录颜色信息,数据量庞大。而INR技术则更像是训练一位画家的大脑,让神经网络学会根据坐标位置直接"想象"出该处应该是什么颜色,从而用极少的参数就能重现复杂的纹理图案。
研究团队选择了四种不同的神经网络架构来完成这项"画家训练计划"。第一种是最基础的多层感知机(MLP),就像是刚入门的画家,只掌握了基本的绘画技巧。第二种加入了正弦激活函数的SIREN网络,如同天赋异禀的画家,天生对曲线和波浪有着敏锐的感知。第三种则配备了傅里叶位置编码的MLP,相当于给画家配了一副特殊眼镜,能够更清晰地捕捉到高频细节。第四种虽然实现了多分辨率哈希编码,但由于纹理分辨率限制,研究团队认为它在此场景下优势不明显。
为了验证这些"画家"的能力,研究团队从包含5640张图像、47个不同类别的可描述纹理数据集中精心挑选了25张最具代表性的样本。这个选择过程就像是为画家选择最具挑战性的题材,研究人员使用拉普拉斯方差作为衡量标准,这个指标能够反映图像的复杂程度和清晰度,确保选出的样本能够全面考验不同网络的表现能力。
在实际的"绘画比赛"中,研究团队发现每种网络都有着独特的"绘画风格"和擅长领域。最基础的MLP就像是用模糊的画笔作画,总是产生朦胧的效果,虽然有时这种朦胧美反而适合某些场景,但整体上缺乏细节表现力。SIREN网络则展现出了对曲线的天赋,能够很好地表现波浪、云朵等自然纹理,但在处理直线和几何图案时却显得力不从心,经常产生一些"波浪状"的意外效果。
最令人印象深刻的是配备傅里叶编码的MLP,它就像是戴上了高倍显微镜的画家,能够捕捉到极其精细的纹理细节。在感知质量评估中,这种网络几乎达到了与原始纹理难以区分的程度。然而,它也有自己的"个人风格"——偶尔会在画面中添加一些细微的颗粒感,特别是在处理大面积单一颜色区域时。
研究过程中,团队还发现了一个有趣的现象:优化器的选择对"画家"的表现有着决定性影响。Adam优化器就像是一位耐心的绘画老师,能够稳定地指导网络学习,而Rprop优化器虽然有时能带来惊喜,但整体表现不够稳定,经常让画家在学习过程中走弯路。
为了让这些"数字画家"更加实用,研究团队还探索了多级纹理(mipmap)的处理能力。在传统的图形系统中,为了在不同距离下显示合适的纹理细节,需要预先生成多个不同分辨率的版本,就像为同一幅画准备不同尺寸的复印件。而神经网络画家们学会了根据一个额外的"距离参数"来调整绘画的精细程度,就像真正的画家能够根据观看距离调整笔触粗细一样。
在与传统压缩技术ASTC的比较中,神经网络方法展现出了明显的优势。ASTC就像是用印刷机批量生产图像,虽然压缩率很高,但质量损失明显,特别是在感知质量方面。而神经网络方法更像是让画家用记忆重新绘制,虽然可能在某些像素级别的细节上有微小差异,但整体的视觉效果和艺术感受却能很好地保持。
研究团队甚至尝试了一个更加前卫的想法——在神经网络的参数空间中进行"创作"。他们训练了一个生成模型来学习不同纹理对应的网络参数模式,就像是培养一位能够模仿不同画家风格的超级画家。虽然这个方向的结果还不够完美,但已经展示出了令人兴奋的可能性。
为了将这项技术真正应用到实际的图形渲染中,研究团队将他们的方法集成到了Mitsuba 3渲染器中。这个集成过程就像是为专业的艺术工作室配备了这些"数字画家",让它们能够实时参与到3D场景的渲染过程中。虽然目前的渲染速度还不能满足实时游戏的需求,但对于电影制作、建筑可视化等对质量要求更高的应用场景来说,这种技术已经显示出了巨大的潜力。
在训练效率方面,这些"画家"的学习过程相对迅速,在配备RTX 5080Ti显卡的设备上,大约只需要50到200秒就能完成一个纹理的学习过程。这个速度虽然不能用于实时应用,但对于内容创作者来说已经相当实用了。
研究团队还详细分析了不同网络架构的内存占用情况。相比传统的纹理存储方式,神经网络方法的内存占用要小得多,特别是对于高分辨率纹理来说,这种优势更加明显。这就像是用一小段乐谱就能让音乐家演奏出完整的交响曲,而不需要存储每一个音符的录音。
通过大量的实验和评估,研究团队证明了神经网络在纹理表示方面的巨大潜力。在多个评价指标中,特别是在LPIPS(学习感知图像块相似性)这个更贴近人类视觉感受的指标上,神经网络方法都表现出了显著的优势。这意味着即使在技术细节上可能有微小差异,但人眼看到的效果几乎与原始纹理无异。
这项研究不仅仅是一个技术验证,更像是为未来的数字内容创作开启了一扇新的大门。随着游戏画面越来越逼真,虚拟现实体验越来越丰富,对纹理质量和存储效率的要求也越来越高。传统的纹理压缩技术就像是用更小的相框装更大的画,总是要在质量和大小之间做出妥协。而神经网络方法则提供了一种全新的思路——让计算机学会"理解"纹理的本质,然后用这种理解来重现纹理,而不是简单地存储像素信息。
当然,这项技术目前还有一些限制。比如对于每种纹理都需要单独训练网络,这个过程虽然不算太长,但也不能做到即时完成。另外,在处理某些特定类型的纹理时,不同的网络架构会表现出明显的偏好,需要根据具体应用场景来选择最合适的方法。
展望未来,这项技术有着广阔的应用前景。在游戏开发中,它能够显著减少游戏包的大小,同时保持高质量的视觉效果。在虚拟现实应用中,它能够在有限的硬件资源下提供更丰富的视觉体验。在电影和动画制作中,它为创作者提供了新的工具来表现复杂的材质效果。
研究团队在论文的最后部分还提出了许多值得探索的未来方向。比如如何更智能地选择网络超参数,如何处理各向异性过滤,如何将多个相似纹理压缩到同一个网络中等等。这些方向就像是为这幅宏大的技术蓝图添加了更多精彩的细节,等待着后续的研究者去填充和完善。
说到底,这项来自剑桥大学的研究就像是在数字世界中重新定义了"记忆"的概念。传统的纹理存储方式是"死记硬背",每个像素都要精确记录。而神经网络方法更像是"理解记忆",通过学习纹理的内在规律和模式,用更少的信息重现更丰富的视觉效果。这种从量变到质变的转换,不仅仅是技术上的进步,更代表了我们对数字内容表示方式的全新思考。
对于普通用户来说,虽然可能不会直接接触到这些底层技术,但它们带来的改变却会悄无声息地影响我们的数字生活体验。未来的游戏可能会更小但更精美,虚拟现实体验可能会更流畅但更逼真,这一切的背后,都有着像这项研究一样的基础技术创新在默默支撑。有兴趣深入了解技术细节的读者可以通过论文编号arXiv:2602.02354v1查询完整的研究报告。
Q&A
Q1:神经网络纹理压缩技术与传统JPEG压缩有什么区别?
A:传统的JPEG压缩就像用印刷机复制图像,通过删减信息来减小文件大小,但会造成明显的质量损失。而神经网络纹理压缩更像是训练一位画家的大脑,让网络学会根据坐标位置直接"想象"出该处的颜色,用极少的参数就能重现复杂纹理,在大幅减少存储空间的同时保持极高的视觉质量。
Q2:SIREN网络在处理纹理时有什么特殊优势?
A:SIREN网络使用正弦激活函数,就像天赋异禀的画家对曲线和波浪有着敏锐感知。它特别擅长表现自然纹理如波浪、云朵等,能够很好地捕捉这些图案的周期性特征。但在处理直线和几何图案时却显得力不从心,经常会产生一些意外的波浪状效果。
Q3:这项纹理压缩技术什么时候能应用到实际游戏中?
A:目前这项技术的训练过程需要50-200秒,渲染速度还不能满足实时游戏需求。但对于电影制作、建筑可视化等对质量要求更高的应用场景已经显示出巨大潜力。随着硬件性能提升和算法优化,未来几年内很可能会在游戏开发中看到这项技术的应用,特别是在减少游戏包大小方面。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.