网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

深度学习优化的几何本质：隐式正则化如何塑造模型

2026-05-14 06:34:32　来源: 摸鱼算法

北京举报

0

分享至

神经网络训练从不收敛到唯一解，却总能泛化良好——这个悖论困扰学界多年。最新研究指出，答案藏在优化算法的几何轨迹中。

随机梯度下降（SGD）的迭代路径并非随机漫步。其隐式偏置使模型自动偏好低复杂度解，即使损失函数平坦如高原，优化器仍会滑向特定"峡谷"。这种隐式正则化效应，解释了为何过参数化网络不会过拟合。

研究揭示关键机制：梯度流的几何曲率与参数空间的黎曼结构相互作用，形成天然的复杂度惩罚项。不同于显式正则化（如L2），这种约束内生于优化动态本身。

该框架统一了多个经验观察——批量大小影响泛化、学习率调度改变解的性质、动量加速隐式偏好平坦极小值。理论预测与大规模实验吻合。

工程启示：优化器设计即模型先验。选择Adam还是SGD，本质是在选择不同的隐式归纳偏置。这为重写训练范式提供了新视角。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

CVPR 2026 | 从视觉Token内在变化量出发，实现VLM无损加速1.87倍

机器之心Pro 2026-03-16 11:56:33
0 跟贴 0
不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

新智元 2026-05-14 13:08:29
11 跟贴 11

国产GPU首获全球顶级推理框架「原生门票」：MUSA合入SGLang主线

机器之心Pro 2026-05-14 16:03:08
0 跟贴 0

不更新参数就能强化学习！翁家翌新范式：决策只需AI写个.py文件

量子位 2026-05-09 16:05:57
1 跟贴 1
赌自己会失业！田渊栋八人天团狂揽44亿元，杀入「递归进化」赛道

新智元 2026-05-14 13:08:07
1 跟贴 1

一张4090就能爆改！面壁智能MiniCPM-V 4.6，1B多模态卷出新高度

机器之心Pro 2026-05-13 14:18:42
0 跟贴 0

北大团队提出 SHINE：任意文本转化大模型 LoRA，仅一次前向传播

机器之心Pro 2026-03-23 15:46:38
0 跟贴 0
波斯湾的美军航母，为啥被逼出“威慑悖论”？沦为摆设？

深蓝航迹 2026-05-12 16:45:18
0 跟贴 0

神经计算机横空出世：AI不再调用软件，而是直接长成一台计算机

DeepTech深科技 2026-05-03 18:24:37
30 跟贴 30
Cyber天花板被打穿！AISI实测Mythos能力正以4.5月翻倍速冲向ASI

新智元 2026-05-14 20:15:56
0 跟贴 0
打破推理同质化！阿里达摩院新作让RLVR从重复采样走向有效探索

机器之心Pro 2026-05-14 13:44:05
0 跟贴 0
Monet：赋予多模态大模型如人类一般的抽象视觉思考能力

机器之心Pro 2026-04-20 21:05:03
0 跟贴 0
1+1=1？这种奇怪的数学每天都在用

硬核实验室哦 2026-05-14 10:01:28
0 跟贴 0
九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
2879 跟贴 2879
离开Meta后，田渊栋刚刚官宣创业了

机器之心Pro 2026-05-14 09:38:28
0 跟贴 0
光轮智能与谷歌、英伟达共同定义物理AI仿真标准

机器之心Pro 2026-05-12 20:21:07
0 跟贴 0
挑战扩散自回归！字节提出视觉生成第三种路线，让模型边画边改

量子位 2026-05-13 21:52:31
2 跟贴 2
训练数据枯竭怎么办？首篇「数据价值密度」综述理清思路

机器之心Pro 2026-05-14 18:10:09
0 跟贴 0
高效智能体幕后推手是谁？一篇综述带你从记忆×工具学习×规划看透

机器之心Pro 2026-01-27 15:24:36
0 跟贴 0
8个AI顶流科学家，300亿估值：他们要让AI自我进化

DeepTech深科技 2026-05-14 17:51:57
0 跟贴 0
男子理发付款，魔鬼算法把老板娘绕进去，最后竟然还赚钱了

豆荚看生活 2026-05-12 10:20:09
0 跟贴 0
颠覆认知！时空竟是量子记忆矩阵，一举一动皆被宇宙记录存档

80后房车生活 2026-05-14 14:46:51
0 跟贴 0
Codex免费两个月！AI编程工具价格战开打，山姆·奥特曼下场抢人

雷科技 2026-05-14 20:31:41
0 跟贴 0
国产GPU组了个开源局，把SGLang等核心开发者都摇来了！

量子位 2026-05-14 17:49:23
0 跟贴 0
将多教师冲突转化为动态约束，破解多模态大模型推理对齐难题

机器之心Pro 2026-05-14 13:39:30
0 跟贴 0
为了逃避考试，他发明了最好的压缩算法，zip的历史可谓一波三折

量子位 2026-04-29 06:41:21
0 跟贴 0
论文写作 Skills 来了，从选题到投稿 Claude Code 流水线

Ai学习的老章 2026-05-14 20:24:44
0 跟贴 0
微软被曝考虑收购大模型创企，SpaceX也看上了同一家

智东西 2026-05-14 20:37:16
0 跟贴 0
“小马云”范小勤成年后直播首秀，在线人数突破7万，礼物刷屏

星视频 2026-05-14 15:29:30
228 跟贴 228
法国新法落地：归还 “260万被抢文物”有多艰难？｜重建现场

新京报动新闻 2026-05-11 01:46:32
921 跟贴 921
战甲迭代封神，钢铁侠战力一路飙升

兔子王追剧 2026-05-13 11:14:14
1 跟贴 1
《星露谷》作者硬刚AI：创意不该外包给算法

山月不知2 2026-05-14 20:07:03
0 跟贴 0
大轮盘带动弹簧往复运动，看似永动机，实则巧妙机械模型

木子奇趣 2026-05-13 10:48:00
4 跟贴 4
美国机器人三巨头特斯拉、Figure、1X，正在把竞争带向“Physical AI”

钛媒体APP 2026-05-14 15:40:12
3 跟贴 3
颠覆认知！物理学家发现新粒子，我们对宇宙的理解全错了

和海看日出 2026-05-14 08:11:15
2 跟贴 2
科学家用活体神经元完成计算任务，脑机融合迈出惊人一步

DeepTech深科技 2026-04-05 19:24:24
0 跟贴 0
老人拄着拐杖走来，无缘无故打了狗狗一下，主人愤怒上前理论！

苍狗爱搞笑 2026-05-10 20:13:30
2 跟贴 2
解读平行宇宙，它可能存在的形式有哪些？

宇宙时空 2026-05-11 22:15:04
0 跟贴 0
俄总统新闻秘书：只要美国不再把经贸合作与乌克兰问题挂钩，俄愿同美开展商业往来

极目新闻 2026-05-14 09:58:58
1084 跟贴 1084
ReconVLA：具身智能研究首次获得AI顶级会议最佳论文奖

机器之心Pro 2026-01-26 13:51:30
0 跟贴 0

长得太美被导演占为己有，25岁生下3个孩子，如今个个都给她争光

长得太美被导演占为己有，25岁生下3个孩子，如今个个都给她争光

揽星河的笔记

2026-05-13 13:26:24

昨晚内环，SUV撞移隔离墩致双向严重拥堵

昨晚内环，SUV撞移隔离墩致双向严重拥堵

上观新闻

2026-05-14 18:35:03

正国级接机，外交礼仪的顶配

阜成门六号院

2026-05-14 18:10:50

俄罗斯发动全面战争以来最大规模空袭，超1400架无人机袭击乌克兰

俄罗斯发动全面战争以来最大规模空袭，超1400架无人机袭击乌克兰

山河路口

2026-05-14 16:31:39

停更3年，千万粉丝网红改名宣布回归，4小时涨粉240万

停更3年，千万粉丝网红改名宣布回归，4小时涨粉240万

天津生活通

2026-05-14 10:34:09

笑不活！国际足联秘书长抵达中国，目的说得高大上，一定达成协议

笑不活！国际足联秘书长抵达中国，目的说得高大上，一定达成协议

阿纂看事

2026-05-14 11:22:20

河北无极县一男子持刀将女子杀害！警方通报，知情人发声，引热议

河北无极县一男子持刀将女子杀害！警方通报，知情人发声，引热议

乌娱子酱

2026-05-14 16:35:03

中方为特朗普举行欢迎宴会现场全是中国元素

中方为特朗普举行欢迎宴会现场全是中国元素

看看新闻Knews

2026-05-14 20:04:03

路透：联想、富士康获准为英伟达H200在中国分销商联想确认

路透：联想、富士康获准为英伟达H200在中国分销商联想确认

格隆汇

2026-05-14 14:58:08

特朗普来华，外交学院专家脸被打肿了

特朗普来华，外交学院专家脸被打肿了

吃瓜体

2026-05-14 13:37:12

性，已成为职场流通的硬资源！

灯锦年

2026-05-14 00:10:06

天津一女高中生被男同学偷拍私密视频并传播致遭霸凌抑郁？家长称警方已行政立案，校方回应

天津一女高中生被男同学偷拍私密视频并传播致遭霸凌抑郁？家长称警方已行政立案，校方回应

大风新闻

2026-05-14 19:59:33

在北京，“一打亿万富翁变游客”：马斯克转圈拍视频，库克比耶，黄仁勋赞：棒极了

在北京，“一打亿万富翁变游客”：马斯克转圈拍视频，库克比耶，黄仁勋赞：棒极了

红星新闻

2026-05-14 16:45:13

价格大跳水，跌至“谷底”！广深出发最高降76%！酒店房价也腰斩，网友：好心动

价格大跳水，跌至“谷底”！广深出发最高降76%！酒店房价也腰斩，网友：好心动

南方都市报

2026-05-14 20:56:16

售罄！女歌手演唱会门票低至40元！网友热议

售罄！女歌手演唱会门票低至40元！网友热议

深圳晚报

2026-05-14 18:32:02

彻底撕破脸！央视硬刚天价转播费后，资本报复手段简直不堪入目

彻底撕破脸！央视硬刚天价转播费后，资本报复手段简直不堪入目

素衣读史

2026-05-14 20:17:25

马斯克：空军一号上只有我和黄仁勋！网友：全球最有钱的和全球市值最高的才有机会坐

马斯克：空军一号上只有我和黄仁勋！网友：全球最有钱的和全球市值最高的才有机会坐

大白聊IT

2026-05-14 00:58:40

大连女子带狗撸串事件再升级！正脸全曝光竟是惯犯，店铺惨遭停业

大连女子带狗撸串事件再升级！正脸全曝光竟是惯犯，店铺惨遭停业

奇思妙想草叶君

2026-05-13 21:13:03

瞬间成为百万富翁！有网友用AI某找回含有5枚比特币的钱包密码，激动的疯狂爆粗

瞬间成为百万富翁！有网友用AI某找回含有5枚比特币的钱包密码，激动的疯狂爆粗

西游日记

2026-05-14 10:46:28

美国历代总统访华都爱吃些啥？这几道菜，让他们放下刀叉拿筷子

美国历代总统访华都爱吃些啥？这几道菜，让他们放下刀叉拿筷子

青烟小先生

2026-05-14 19:26:33

致力于用最前沿的AI技术，换取更多发呆时间的三十岁青年。

2731文章数 26关注度

往期回顾全部

科技要闻

马斯克说会谈很顺利黄仁勋点赞库克比耶

头条要闻

重庆"萌感"佛头意外走红雕刻者：不是文物且尚未完工

头条要闻

重庆"萌感"佛头意外走红雕刻者：不是文物且尚未完工

体育要闻

争议抽象天王山，和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸！全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕启境GT7内饰发布

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戏

亲子

艺术

军事航空

本地新闻

用苏绣的方式，打开江西婺源

任天堂发布会重磅猛料！马上就来官方页面曝光

亲子要闻

监控下的幼儿园小可爱，主动帮老师搬桌开门，逻辑超在线

艺术要闻

美国务卿鲁比奥点赞中式美学，实景令人惊叹！

军事要闻

美以伊战争期间以总理密访阿联酋

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版