网易首页 > 网易号 > 正文 申请入驻

代码:⾃扩展神经⽹络 Self-Expanding

0
分享至

https://github.com/ml-research/self-expanding-neural-networks

抽象 https://arxiv.org/pdf/2307.04526.pdf

训练神经⽹络的结果在很⼤程度上取决于所选的架构;即使仅修改⽹络的⼤⼩,⽆论多么⼩, 通常都需要重新启动训练过程。与此相反,我们开始使⽤⼩型架构进⾏训练,仅根据问题需要 增加其容量,并避免⼲扰之前的优化。因此,我们引⼊了⼀种基于⾃然梯度的⽅法,该⽅法直 观地扩展了神经⽹络的宽度和深度,这可能会⼤⼤减少假设的收敛训练损失。我们证明了添 加神经元的“速率”的上限,以及扩展分数的计算成本低的下限。我们说明了这种⾃扩展神经 ⽹络在分类和回归问题中的好处,包括那些适当的架构⼤⼩先验基本上不确定的问题。

Self-Expanding Neural Networks 目录:

How to add: expanding without changing the overall function

When to add: deciding whether more capacity is useful

What to add: determining the initial value of new neurons

Where to add: completing the algorithm

Bounds on convergence of expansion

Efficiently computing a lower bound on score increase

简介:

正确地调整模型的能⼒以适应任意任务是极具挑战性的,特别是当后者尚未得到充分研究时。这个挑战可以通过 选择⼀个太⼤的架构来回避,这样⼀个糟糕的解决⽅案不太可能出现[19],例如由于双下降现象。然⽽,由于很难 预测什么尺⼨⾜够⼤,这在实践中通常需要使⽤⼤量过度参数化的⽹络[22] [12] [11]。当然可以检测到⽹络现有 容量不⾜,并在需要的时间和地点添加更多神经元吗?事实上,⽣物神经⽹络是通过神经发⽣过程向现有⽹络添加新神经元⽽⽣⻓的。热⻔评论[9]讨论了这⼀相对较新的发现,即这⼀过程在成年哺乳动物⼤脑中仍然活跃[23],并且[13] [5]将其确定为⽀撑终⾝学习的关键能⼒。受此启发,我们提出了⼀种类似的过程,在训练期间将神经元 和层添加到⼈⼯神经⽹络中,该过程基于从与⾃然梯度密切相关的第⼀原理衍⽣的“⾜够容量”的局部概念[1] [17]。

任何⼈⼯神经发⽣⽅法都必须回答三个问题,以避免局部容量不⾜的问题[6]。它必须确定当前容量何时不⾜,因 此必须添加神经元。它必须确定这些神经元应该被引⼊到哪⾥。最后,它必须选择适合这些神经元的初始化。这些 问题,如果在⽂献中得到解决的话,通常是零碎的或以临时的⽅式解决的。例如,很少有⽅法解决“什么”的问题 [6] [26]。通过假设预定的时间表[26] [21]或等待训练损失收敛[27] [25]来回答何时,这两种⽅法都⽆法提供有关位置的信息。

From a mathematical perspective, these degrees of freedom available to the optimizer are given by the image of the parameter space under the Jacobian, and the derivative with respect to the loss in function space will not in general lie in this subspace. It is however possible to project this derivative onto that subspace, and the natural gradient, F −1g, is exactly the change in parameters which changes the function according to this projection. In order to measure the size of that projection for a given parameterization, we introduce the natural expansion score η = g TF −1g. Specifically, the capacity of a neural network is locally insufficient when this score is small for the current parameterization. We therefore add neurons when this substantially increases η, where they will maximally increase η, and choose what initialization to use for the new parameters according to how it increases η. To summarize,

our contributions are:

  1. We introduce the natural expansion score which measures the increase in rate of loss reduction under natural gradient descent when width or depth is added to a neural network.

  2. 2. We show how such additions may be made during training without altering the function represented by the network. Our neurogenesis inspired Self-Expanding Neural Networks (SENN) thus avoid interfering with previous optimization or requiring restarts of training.

  3. 3. We prove that the number of neurons added simultaneously in SENN is bounded. We further introduce a computationally efficient approximation as a provable lower bound to increases in natural expansion score resulting from additions.

  4. 4. We demonstrate SENN’s effectiveness for regression and classification. In the remainder of this paper, we proceed as follows: In section 2 we summarize existing growth methods, in section 3 we then describe SENN, and in section 4 we illustrate its operation in practice.

Any method for artificial neurogenesis must answer three questions to avoid the problem of locally insufficient capacity [6]. It must determine when the current capacity is insufficient and that neuron(s) must therefore be added. It must identify where these neurons should be introduced. Finally, it must choose what initialization is appropriate for these neurons. These questions, if they are addressed at all in the literature, are normally addressed piecemeal or in ad-hoc ways. For example, very few methods address the question of what [6] [26]. When is answered either by assuming predetermined schedules [26] [21], or by waiting for the training loss to converge [27] [25], neither of which are informative about where。

We argue that by inspecting the degrees of freedom of the optimizer in function space, one may not only strike faster in answer to when, but answer where and what in the same stroke.

完整内容请参考原论文。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
贝隆:如今科技发展,球员都能踢到很大岁数,但梅西还是令人惊叹

贝隆:如今科技发展,球员都能踢到很大岁数,但梅西还是令人惊叹

兰亭墨未干
2026-07-03 15:14:11
Codex 的办公能力被严重低估了,Word、Excel、PPT、PDF 全都能进工作流了

Codex 的办公能力被严重低估了,Word、Excel、PPT、PDF 全都能进工作流了

Ai学习的老章
2026-07-03 21:09:44
2026车市最大骗局:省油电车全亏钱,烂大街油车才是真赢家

2026车市最大骗局:省油电车全亏钱,烂大街油车才是真赢家

民间胡扯老哥
2026-05-24 13:40:40
一涂一抹、10分钟起效!全球首款ED凝胶入华在即,业内却泼冷水

一涂一抹、10分钟起效!全球首款ED凝胶入华在即,业内却泼冷水

果壳
2026-07-02 16:23:09
扛不住了?日本通告全球:无法接受中方第二轮对日出口管控

扛不住了?日本通告全球:无法接受中方第二轮对日出口管控

顾秋韵
2026-07-04 03:48:56
苏有朋现身巴黎,这直接堪称"换脸"啊,走在街上都不敢认了!

苏有朋现身巴黎,这直接堪称"换脸"啊,走在街上都不敢认了!

美芽
2026-07-03 19:59:40
布朗直播开火:我赢得了尊重,凯尔特人欠我一个解释

布朗直播开火:我赢得了尊重,凯尔特人欠我一个解释

赛场速报局
2026-07-04 01:51:10
过气演员到底多可怜?从拒拍裸戏,到近乎全裸拍戏,太心酸

过气演员到底多可怜?从拒拍裸戏,到近乎全裸拍戏,太心酸

悠悠说世界
2026-05-15 13:50:20
1岁半男童被生父女友踢死案新进展:生父称愿撤销谅解后疑失联;男童生母称其说谎太多,没到真正撤销那一刻都不会相信

1岁半男童被生父女友踢死案新进展:生父称愿撤销谅解后疑失联;男童生母称其说谎太多,没到真正撤销那一刻都不会相信

大象新闻
2026-07-03 17:50:06
狄波拉凌晨护儿媳,狠话曝光对王菲态度

狄波拉凌晨护儿媳,狠话曝光对王菲态度

孤城落日
2026-07-03 13:20:53
少林寺新任方丈释印乐,就任仅10个月,寺里就被曝出少了800多万

少林寺新任方丈释印乐,就任仅10个月,寺里就被曝出少了800多万

人生录
2026-07-02 16:19:01
索尼官宣实体版停产后装死24小时 上次装死72小时

索尼官宣实体版停产后装死24小时 上次装死72小时

游民星空
2026-07-03 10:17:26
韩红再次回应传闻:善款理财,利益输送,高价工资,网友不买账!

韩红再次回应传闻:善款理财,利益输送,高价工资,网友不买账!

眼光很亮
2026-07-03 08:05:06
大众重组风暴:杜卡迪或出售、兰博基尼欲上市

大众重组风暴:杜卡迪或出售、兰博基尼欲上市

薛定谔的BUG
2026-07-03 03:54:51
驴友夫妇痛骂国内医院,8天花1471元?3年后美国车祸花60余万美元

驴友夫妇痛骂国内医院,8天花1471元?3年后美国车祸花60余万美元

贱议你读史
2026-05-31 16:19:12
唐嫣案判了!罗晋近况曝光,难堪一幕发生,原来他和辛柏青同病相怜

唐嫣案判了!罗晋近况曝光,难堪一幕发生,原来他和辛柏青同病相怜

情感大头说说
2026-07-03 16:56:13
日本人乘坐中国高铁后,愤怒说出三大“缺点”,让人无力反驳

日本人乘坐中国高铁后,愤怒说出三大“缺点”,让人无力反驳

快乐彼岸
2026-07-02 06:21:59
美腿的日常:那不是天生,是每一步都算数的修行

美腿的日常:那不是天生,是每一步都算数的修行

疾跑的小蜗牛
2026-07-03 21:54:41
重磅!正式加盟76人!一亿射手搭档杰伦布朗

重磅!正式加盟76人!一亿射手搭档杰伦布朗

技巧君侃球
2026-07-03 17:22:07
摩根大通警告:若美联储提前加息,金价可能再次跌破4000甚至测试3500-3600

摩根大通警告:若美联储提前加息,金价可能再次跌破4000甚至测试3500-3600

华尔街见闻官方
2026-07-04 00:25:41
2026-07-04 08:16:49
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1485文章数 20关注度
往期回顾 全部

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

头条要闻

巴黎副市长:天气越热水质越好 因为阳光起到杀菌作用

头条要闻

巴黎副市长:天气越热水质越好 因为阳光起到杀菌作用

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

手机
房产
艺术
家居
教育

手机要闻

荣耀新机曝光,骁龙8 Elite+内置风扇

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

艺术要闻

这位女子,在画坛默默无闻,作品清新质朴

家居要闻

传奇筑 日常诗

教育要闻

分期销售问题,一个视频学透彻!

无障碍浏览 进入关怀版