近年来,隐式神经表示(Implicit Neural Representations, INR)技术大放异彩,特别是像NeRF这样能够用一个小小的神经网络来表示复杂三维场景的方法,让大家惊叹不已。在这些方法背后,有一类基于周期激活函数(比如sin函数)的INR网络,如SIREN和FINER,它们在表示高频细节方面表现出色。
然而,这些看似强大的网络内部却存在着一个“浪费”的问题——特征冗余。简单来说,同一层网络里的很多神经元,其实在干着重复的活儿。这极大地限制了网络的表达能力。
最近,来自卡内基梅隆大学(CMU)和谷歌的研究者们,从经典的信号处理理论中汲取灵感,提出了一个简单而又极其有效的改进方法。在他们的新论文 《FM-SIREN & FM-FINER: Nyquist-Informed Frequency Multiplier for Implicit Neural Representation with Periodic Activation》 中,他们介绍了一种全新的频率分配策略,让每个神经元都能“各司其职”,从而将特征冗余降低了近 50%!![]()
论文标题 : FM-SIREN & FM-FINER: Nyquist-Informed Frequency Multiplier for Implicit Neural Representation with Periodic Activation
作者 : Mohammed Alsakabi, Wael Mobeirek, John M. Dolan, Ozan K. Tonguz
机构 : 卡内基梅隆大学、谷歌
论文地址 : https://arxiv.org/abs/2509.23438
要理解这个问题,我们得先简单了解一下SIREN这类网络的工作原理。它们的核心是使用sin函数作为激活函数,即 sin(ω * x + b)。这里的 ω 是一个频率乘子,它决定了神经元对输入信号的敏感频率。在SIREN和FINER中,同一层的所有神经元都共享一个 固定的、需要手动调节的频率乘子 ω 。
这就好比一个交响乐队,指挥家却让所有小提琴手都用完全相同的音高和节奏来演奏。结果可想而知,声音会很单调,很多乐手的能力被浪费了,因为他们都在做同样的事情。在网络中,这就导致了不同的神经元却在捕获重叠的频率成分,造成了严重的特征冗余。
奈奎斯特的智慧:为每个神经元分配专属频率
如何解决这个问题?新提出的 FM-SIREN 和 FM-FINER 框架,其核心思想是打破这种“一刀切”的模式,为 每一个神经元分配一个独特的、专属的频率乘子。
更妙的是,这些专属频率不是随便给的,而是基于经典的 奈奎斯特定理(Nyquist Theorem) 和离散正弦变换(DST)的原理来确定的。这保证了分配给不同神经元的频率能够均匀且有效地覆盖整个信号的频谱范围,就像让乐队里的乐手们分别负责高、中、低等不同音区,协同演奏出和谐丰富的乐章。
这个改动非常简洁,但效果却立竿见影:
无需调参 :频率是根据网络结构自动计算的,省去了繁琐的超参数调整。
无需加深网络 :在不增加任何网络深度和参数量的情况下,提升了模型的表达能力。
频率多样性 :从根本上引入了频率的多样性,让每个神经元都专注于自己负责的频率范围。
这个简单的改动带来了多大的提升呢?首先,从理论上,研究者通过计算网络隐藏层特征的协方差矩阵,直观地证明了新方法的有效性。
![]()
在上图中,颜色越“冷”(蓝色),代表神经元之间的相关性越低。可以看到,FM-SIREN和FM-FINER的协方差图明显比原始版本“更冷”,整体的协方差范数(图中右上角的数字)也显著降低。这表明神经元之间的特征冗余确实大大减少了。
在实际应用中,这种改进转化为了实实在在的性能提升。无论是一维音频、二维图像、三维形状重建,还是NeRF,FM-SIREN和FM-FINER都全面超越了它们的基线版本。
图像重建
在图像重建任务中,新方法生成的图像明显更清晰,细节更丰富,PSNR值也更高。
![]()
音频重建
在音频信号拟合任务中,FM-SIREN和FM-FINER重建的波形与真实波形的误差(MSE)显著低于基线方法。
![]()
3D形状与NeRF
在三维重建和NeRF任务中,新方法同样表现出色,能够恢复出更精细的几何细节。
![]()
跨多个任务的定量结果也一致地证明了新方法的优越性。
![]()
这项工作最亮眼的地方在于它的简洁与深刻。它没有堆砌复杂的模块,而是回归到信号处理的本源,用一个充满智慧的简单修改,就解决了现有INR网络的一个核心缺陷。这种“古为今用”、跨学科获取灵感的思路,非常值得我们学习。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.