网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

别吵了，这张图把大模型能力说清了

2026-05-06 00:00:51　来源: 像素与芯片

北京举报

0

分享至

斯坦福和清华的研究者最近干了一件事：他们画了一张图，把"大模型有没有智能"这个吵了五年的问题，拆成了五层。看完你会发现，两边吵的人根本不在同一个频道。

第一层：测量幻觉

很多"突然变聪明"的现象，换个尺子量就消失了。Schaeffer等人2023年的实验很直白：用"完全匹配"这种非线性指标，模型能力看起来是阶跃式爆发；换成"逐词准确率"这种连续指标，曲线立刻变平滑。

这不是模型真的顿悟了，是你的评分标准在演戏。

这类"涌现"被归为L0——度量伪象。论文里的原话是："A measurement illusion."

第二层：结构真的长出来了

但有些东西确实不是幻觉。Anthropic 2022年发现的"归纳头"（induction heads）是个硬证据：20亿参数以下，这玩意儿不存在；一过阈值，突然冒出来，而且训练损失曲线同步出现相变。

更关键的是你能动手干预。港大、复旦、腾讯2025年的"定位-操控-改进"范式，已经能直接修改这些内部结构，进而改变模型行为。

这是L1——结构涌现。物理上可验证，不是数字游戏。

第三层：功能意外解锁

结构变化带来能力溢出。Othello GPT是教科书案例：训练目标只是"根据文本序列预测合法落子"，完全没有棋盘状态的标注。但线性探针一插，发现中间层自发构建了完整的8×8棋盘表示。

训练目标被梯度下降自动拆解成了"棋盘状态→合法落子"。没人教它这么做。

这是L2——功能涌现。局限在于：封闭世界、规则明确。棋盘是固定的，规则是写死的。

第四层：真正的争议地带

L3才是战场。它要求两样东西：训练分布外的泛化能力，以及因果推理而非统计关联。

原文在这里断掉了。但框架已经够用了——它解释了为什么两派人永远吵不完：说"有智能"的通常指L0-L2，说"没有"的盯着L3-L4。一个看的是"能做什么"，一个看的是"怎么做到的"。

这个五层框架的价值，是把"有没有"变成"到哪一层"。下次再有人争论大模型智能，你可以先问：你说的哪一层？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

剥夺大模型执行权！港中文开源Agent治理内核，高危拦截率达92.95%

新智元 2026-05-09 12:08:54
0 跟贴 0
上线仅一天！复旦大学最新 Nature 被质疑

生物学霸 2026-05-09 17:17:57
0 跟贴 0

36项供给+11项需求成都青羊区发布场景创新供需双清单

每日经济新闻 2026-05-09 15:20:09
0 跟贴 0

弃双马弃车，小鬼坐龙庭，绝地翻盘，棋仙一句话让对手当场掀棋盘

街边福 2026-05-08 03:06:32
1 跟贴 1
气大爷掀棋盘第2局，两个小卒竟然那么厉害，大师也被难住了

猴哥象棋 2026-05-08 18:23:41
0 跟贴 0

最好的防守那压根就不是防守，而是疯狂进攻！猛得能把棋盘都震碎

苏小宇的棋 2026-05-08 03:56:16
0 跟贴 0

掀棋盘277局，三个小卒折腾了老半天，大师拿下也太不容易

猴哥象棋 2026-05-09 19:26:33
0 跟贴 0
掀棋盘278局，双车竟然拿不下几个小卒，大师也是费尽了周折

猴哥象棋 2026-05-09 20:19:41
0 跟贴 0

气大爷掀棋盘第3局，四兵拿下双车，高人排山倒海的杀法厉害

猴哥象棋 2026-05-09 19:08:06
0 跟贴 0
气大爷掀棋盘第1局，单车滑炮巧妙取胜，大师的手段实在是高明

猴哥象棋 2026-05-07 18:25:01
0 跟贴 0
“被约谈”名单是假的！8家车企集体辟谣，中汽协也回应了，AI大模型竟是幕后推手

每日经济新闻 2026-05-09 20:41:23
0 跟贴 0
《异环》抽卡看着良心？我算完200抽的账后，发现成本藏在棋盘里

峡谷一级保护废物 2026-05-09 06:03:47
1 跟贴 1
NTE抽卡机制实测：200抽保底时装，棋盘设计让人上头

峡谷一级保护废物 2026-05-08 11:11:52
0 跟贴 0
棋盘上的“楚河汉界”，源自这条真实的鸿沟

大象新闻 2026-05-05 11:14:06
0 跟贴 0
郑州：在医疗、教育、物流、防灾减灾等领域打造一批大模型典型示范形成“AI＋千行百业”全场景体系

科创板日报 2026-05-09 19:54:04
0 跟贴 0
棋风迥异，子力千面：深度解析围棋思维中的价值差异

听全天下看 2026-05-09 14:25:03
0 跟贴 0
3.6亿，大模型第一股买了个楼

财天COVER 2026-05-09 16:22:08
0 跟贴 0
规则漏洞被利用，杜卡迪优势惨遭终结

暖阳喵 2026-05-09 10:36:31
1 跟贴 1
AI突现首例自我复制！横跨4国160小时无限繁殖

新智元 2026-05-09 18:31:30
0 跟贴 0
天舟飞船为什么不回收而是坠入大海？专家：增加返回功能会挤占运货空间，飞船大部分结构烧蚀气化，少量残骸不会造成威胁

极目新闻 2026-05-08 21:58:00
5617 跟贴 5617
外卖小哥冒死冲进火场救火被物业收取50元“灭火器使用费”

闪电新闻 2026-05-09 09:31:06
6939 跟贴 6939
媒体：沙特被美国激怒海湾国家或将深化与中国关系

澎湃新闻 2026-05-08 17:48:29
3929 跟贴 3929
AI模型是个黑箱，这家公司造了一把能打开它的钥匙

DeepTech深科技 2026-05-07 13:37:16
0 跟贴 0
OpenAI翁家翌：梯度之外，下一个AI训练范式有着落了？

机器之心Pro 2026-05-09 11:45:42
0 跟贴 0
“排队3小时，打卡1分钟”，多景区迎“泼天流量”

澎湃新闻 2026-05-06 00:04:10
3885 跟贴 3885
男子晒车上老物件，竟是18年前黑科技，这玩意儿太牛了

嘻哈搞笑局 2026-05-09 07:01:47
1 跟贴 1
金包银当黄金，卖日本人骗400多万，这算不算曲线复仇？

好汉笑场 2026-05-08 14:23:08
1 跟贴 1
Claude Code之父：我们公司已没真人写代码了

智东西 2026-05-09 20:46:17
0 跟贴 0
茶颜悦色，装不下去了

中国新闻周刊 2026-05-07 22:15:57
299 跟贴 299
Markdown不行了？Agent时代，老掉牙的HTML正在逆袭

雷科技 2026-05-09 20:35:53
0 跟贴 0
河北多地漫天杨絮似大雪纷飞省绿办：多年前曾定下治理时间表每年都有打药等防治措施

闪电新闻 2026-05-09 12:40:08
204 跟贴 204
广西壮族自治区计划生育协会常务副会长苏英权接受审查调查

上观新闻 2026-05-09 18:03:27
10 跟贴 10
微软Office终身版降到90美元，订阅制时代还有多久？

闪存猎手 2026-05-09 17:57:24
0 跟贴 0
玩家十年没清空过电脑回收站！一看容量当场傻眼了

游民星空 2026-05-09 17:26:24
1 跟贴 1
一半模型巧解小学几何

天天数理学习分享 2026-05-08 16:04:22
1 跟贴 1
中国超算破解黄石火山谜题：想造地球数字孪生体

全栈遛狗员 2026-05-07 05:33:35
0 跟贴 0
生成式Critic重新定义LLM强化学习信用分配

机器之心Pro 2026-05-09 14:52:19
0 跟贴 0
误差如何被数学控制住：范数与 Banach 空间 | 泛函分析第五讲

集智俱乐部 2026-05-09 14:35:16
0 跟贴 0
iOS 26.5下周正式推送，一口气上线五大新功能

环球网资讯 2026-05-08 10:49:06
542 跟贴 542
海关总署：前4个月中国货物贸易进出口总值增长14.9%

财联社 2026-05-09 10:57:06
1645 跟贴 1645

挂号费最高涨近一倍！主治医师成“香饽饽”，便民门诊不够“便民”？

挂号费最高涨近一倍！主治医师成“香饽饽”，便民门诊不够“便民”？

今日养生之道

2026-05-09 18:21:29

不得不说，广东队现在变成了“四不像”球队！

不得不说，广东队现在变成了“四不像”球队！

体育哲人

2026-05-09 20:42:37

莫拉致歉+解约大让步，邓卓翔临危再受命

莫拉致歉+解约大让步，邓卓翔临危再受命

足球报

2026-05-09 11:33:04

DeepSeek、阿里：谈崩了

DeepSeek、阿里：谈崩了

云头条

2026-05-09 09:47:28

没有坦克、没有青少年预备役：俄乌对峙下的俄罗斯胜利日阅兵

没有坦克、没有青少年预备役：俄乌对峙下的俄罗斯胜利日阅兵

红星新闻

2026-05-09 11:39:08

深度长文：食草动物明明能反抗，为何面对食肉动物总选择逃跑？

深度长文：食草动物明明能反抗，为何面对食肉动物总选择逃跑？

宇宙时空

2026-05-08 12:03:57

转账5千要查祖宗，内鬼卷走1800万却一路绿灯！银行双标太离谱了

转账5千要查祖宗，内鬼卷走1800万却一路绿灯！银行双标太离谱了

今朝牛马

2026-05-06 21:00:56

西媒：皇马计划下周二至周三敲定与穆里尼奥签约

西媒：皇马计划下周二至周三敲定与穆里尼奥签约

懂球帝

2026-05-09 19:45:20

伦敦世乒赛：半决赛开门红！孙颖莎3:0击败世界亚军，旗开得胜

伦敦世乒赛：半决赛开门红！孙颖莎3:0击败世界亚军，旗开得胜

国乒二三事

2026-05-09 19:59:58

别只吃鸡蛋！高蛋白食物新排名：豆腐第4，牛奶第3，第1名想不到

别只吃鸡蛋！高蛋白食物新排名：豆腐第4，牛奶第3，第1名想不到

全球军事记

2026-05-08 21:21:30

相差15岁姐弟恋！00后体育生爱上重庆单亲妈妈，喜欢叫对方姐姐

相差15岁姐弟恋！00后体育生爱上重庆单亲妈妈，喜欢叫对方姐姐

那年秋天

2026-05-03 11:50:10

绝了！梅西接班人亚马尔！67天姐弟恋！网友：这也太飘了！

绝了！梅西接班人亚马尔！67天姐弟恋！网友：这也太飘了！

罗氏八卦

2026-05-09 18:40:03

纳瓦尔：不要去管别人，只管早睡、运动和读书

纳瓦尔：不要去管别人，只管早睡、运动和读书

书窗小记

2026-05-06 21:38:32

痛悼！经全力抢救无效，何同原不幸离世，年仅58岁

痛悼！经全力抢救无效，何同原不幸离世，年仅58岁

阿芒娱乐说

2026-05-09 17:07:58

泪目了！河南三门峡24岁女子上午领结婚证，下午丈夫就出车祸瘫痪

泪目了！河南三门峡24岁女子上午领结婚证，下午丈夫就出车祸瘫痪

社会日日鲜

2026-05-02 10:24:30

特朗普：若伊朗同意协议将开放霍尔木兹海峡，否则轰炸就会开始，且规模和强度将远超以往，伊朗称正在审阅美方提案

特朗普：若伊朗同意协议将开放霍尔木兹海峡，否则轰炸就会开始，且规模和强度将远超以往，伊朗称正在审阅美方提案

每日经济新闻

2026-05-07 00:33:15

夏天穿这个颜色，显白高级太好看了

夏天穿这个颜色，显白高级太好看了

七柒时尚笔记

2026-05-09 19:05:31

7800亿军购案通过，韩国瑜窜访欧洲被打脸，赵少康再向郑丽文开火

7800亿军购案通过，韩国瑜窜访欧洲被打脸，赵少康再向郑丽文开火

DS北风

2026-05-09 16:10:04

圆明园地下大反转，大火烧掉的仅是圆明园的表皮

圆明园地下大反转，大火烧掉的仅是圆明园的表皮

混沌录

2026-04-24 21:02:11

孩子都是奔着妈妈来的！网友：我媳妇梦到的是大白蛇钻到她肚子里

孩子都是奔着妈妈来的！网友：我媳妇梦到的是大白蛇钻到她肚子里

带你感受人间冷暖

2026-03-14 00:10:08

像素与芯片

有态度网友ytd

3475文章数 23关注度

往期回顾全部

科技要闻

美国政府强力下场苹果英特尔达成代工协议

头条要闻

香港富豪孙女被绑架绑匪拿到2800万后逃跑8人花11万

头条要闻

香港富豪孙女被绑架绑匪拿到2800万后逃跑8人花11万

体育要闻

成立128年后，这支升班马首夺顶级联赛冠军

娱乐要闻

50岁赵薇脸颊凹陷沧桑得认不出！

财经要闻

多地号召，公职人员带头缴纳物业费

汽车要闻

轴距加长/智驾拉满阿维塔07L定位大五座SUV

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

本地

手机

数码

旅游

亲子要闻

萌星秀秀：请欣赏小萌星排练歌曲

本地新闻

用苏绣的方式，打开江西婺源

手机要闻

消息称今年市场除华为Pura X Max外，还有3台阔折叠即将发布

数码要闻

升级TMR魔晶磁轴Plus，CHERRY XTRFY K5 Ultra键盘公布

旅游要闻

告别“打卡式”旅游境外游客来杭15分钟即可换证自驾

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版