网易首页 > 网易号 > 正文 申请入驻

大模型超能力真智能还是幻术?科学家为此吵翻天,别被涌现迷惑了

0
分享至

哈喽,大家好,我是小今。咱们来聊聊大模型的“涌现超能力”,看着神乎其神,可科学家却说这未必是真智能?这里头争议可不小!

打开GPT-4解出复杂数学题、自动写出能运行的代码,不少人都觉得AI好像突然“开窍”了,有了超越机器的本事。这就是大家常说的“涌现”?可科学家们却吵翻了天:这到底是真的新型能力,还是靠堆数据堆出来的“假象”?更关键的是,能力变强了,就等于变聪明了吗?咱们用大白话把这事捋明白。





“涌现”:不只是AI的专属词儿

要聊清楚大模型的事儿,咱们得先搞明白“涌现”这个词。它可不是AI火了之后才蹦出来的。在复杂的科学系统里,这个概念早就有了。最简单的理解就是:“凑够数量,就出新品性。”就像物理学家安德森说的那句:“多者异也。”意思是,东西一旦多了,整体的性质就可能完全不一样了。

咱们用最日常的例子来说吧:水。单个的水分子,它哪有什么“流动”的概念?孤零零的一个,顶多就是个小粒子。但如果把亿万个水分子凑在一起,它们就开始流淌了,有了潮起潮落,有了水流冲击石头的那股劲儿。你看,这就是典型的“涌现”,从没有到有,从个体到整体,突然就冒出了新的特性。





真涌现,得学会“化繁为简”

不过,你可别觉得只要是“突然变厉害”就算涌现了。这里面,其实还有一个很关键的门槛:它得能“化繁为简”。啥意思呢?就像咱们看一条大河奔腾,你根本不需要去盯着每一个水分子的轨迹,去研究它往哪儿跑、速度多快。你只要知道这条河的流速、水压这些关键指标,就能大致预判水流的方向和力量。

这种能抛开微观的无数细节,直接抓住核心规律的能力,才是涌现的真正精髓。科学界对此也设定了一些判断标准:比如,构成系统的规模够不够大?有没有突然的性能飞跃?能不能把大量信息压缩成更简洁的模式?有没有形成新的底层逻辑?

以及,最重要的一点,它能不能应对以前没见过的新情况?大模型那些所谓的“超能力”,其实就卡在这几个标准上,争议一直不断。





“数据堆砌的魔术”:性能飙升的真相

那大模型现在表现出来的“涌现”,到底是个啥情况呢?说实话,很多时候,它更像是一场精心编排的“数据魔术”。

比如,一个60亿参数的模型,算三位数加法的准确率才1%,参数涨到130亿,准确率爬到8%,可当参数飙到1750亿的时候,准确率直接跳到了80%!这种“嗖”一下的突变,当时让不少人都觉得:“哇,这不就是涌现来了嘛!”



但很快,就有细心的科学家站出来“拆穿”了:他们换了个更细致的评估方式,把测试题的难度更均匀地分布开来,结果发现,那种“突然爆发”的现象就没了。

性能其实是慢慢地、稳步地在提升,根本没有想象中那么戏剧化。说白了,有时候,我们看到的“涌现”,可能只是我们的评估方法或者测试设计,给我们造成的错觉。





是“理解”棋局,还是“背熟”套路?

当然,也有一些例子看上去挺像那么回事儿的。比如,有个叫OthelloGPT的下棋模型,没人特意教它围棋的规则,它自己竟然“摸透”了棋盘上的逻辑,还在内部形成了一种简化的表示方式。这听起来,似乎挺符合“化繁为简”的涌现标准,挺有那么点儿意思的。

可质疑声一样没停:这会不会只是模型把海量的棋谱、棋路给总结了一遍,然后形成了一堆“下棋套路”,而不是真的形成了什么新颖的底层逻辑?而且,这种内部结构的变化,跟它实际的下棋表现之间,究竟是不是因果关系,还没有一个特别清晰的解释,也可能只是一种巧合。

更关键的是,很多所谓的“涌现能力”,往往经不起换场景的考验,它在熟悉的任务里表现得特别好,一旦你稍微换个说法、变个场景,它就歇菜了。这本质上,还是它把数据里的模式“记熟”了,而不是真的“懂”了规律。





能力强大 ≠ 真正智能

在这里,咱们必须把一个核心区别给分清楚:拥有“涌现能力”,不等于就拥有了“涌现智能”。这就像咱们的计算器,它能算加减乘除,能开方,能积分,功能是不是够强大?绝对够强大!

但没人会说计算器有智能吧?因为它只是按照预设的算法干活,不会举一反三,更不会创造新的计算方法。它只是一个工具,一个高效的计算工具。



而真正的涌现智能,它的核心是“用最少的本事办最多的事儿”。人类就是最好的例子。咱们学会了“杠杆原理”,不用教,马上就能灵活地用到撬石头、玩跷跷板、平衡天平上,咱们听懂了几句指令,就能明白一个复杂的任务,快速调整思路,根本不需要反复试错。这是一种触类旁通、举一反三的本事。

但大模型不行。它要想掌握类似的迁移能力,往往得在训练数据里见过成千上万个相似的案例。少一个,它可能就翻车了。麻省理工的科学家就一针见血地指出,人类智能靠的是“凭少量原则理解世界”,而大模型,目前更像是一个“找数据规律的机器”,它更多是记住模式,而不是真的理解了这些模式背后的原理。





现状:一个庞大的“专用计算器集合”

所以,现在学术界的共识,其实已经比较明确了:大模型确实展现出了一些“涌现”的苗头,尤其是那些能形成内部简化表征的情况,这些是值得我们深入研究的。但绝大多数我们看到的,仅仅是靠着堆参数、堆数据换来的性能提升,都够不上真正涌现智能的标准。

它更像是一个超级庞大的“专用计算器集合”,每个“计算器”都负责一个特定的任务。它能靠暴力拟合,把海量数据里的模式“硬套”出来,从而实现各种功能。但离人类那种“以简驭繁”,用最少的知识解决最多问题的智能境界,还有着不小的距离。





语言:是“世界密码”还是“思维镜子”?

这关于大模型智能的争论,核心还绕不开一个非常关键的问题:语言,在训练过程中到底扮演了什么角色?这个问题,直接决定了大模型的能力上限。

有人觉得,语言本身就是压缩了的世界密码,里面藏着物理、社会的所有规律,只要模型学会了语言,就等于掌握了世界的秘密。也有人说,语言是“思维的镜子”,它反映了人类的思考逻辑和认知结构。

还有人觉得,语言就只是一种编程语言,训练模型,本质上就是在给它写程序。如果语言真的包含了所有信息,那模型再大,也只是个“拷贝知识”的机器,谈不上真正的涌现和创造。





未来的路:撬开“黑箱”,寻找“概念”

那么,未来我们应该怎么研究,才能更好地理解大模型的智能潜力呢?我觉得,光盯着模型的测试分数高不高、任务完成得好不好,已经不够了。更重要的是,我们得想办法“撬开”这个“黑箱子”,看看它内部到底有没有形成类似人类“概念”的东西。

这些“概念”能不能像人类一样,彼此关联起来,形成更高级的认知结构?它能不能实现那种“一点就通”的顿悟式学习,而不是非得看过无数例子才能学会?毕竟,真正的智能,从来都不是靠单纯地堆数据、堆参数就能实现的。它更需要精准的抽象能力和高效的简化能力,用最少的成本,解决最多的问题。

说到底,我们现在纠结的,不仅仅是“大模型有没有涌现”这么一个技术问题。更深层次地,我们其实是在追问一个更宏大的哲学命题:我们现在到底是在造一个更强大、更高效的工具,还是在无意中孕育一个真正有智慧的生命?这个问题的答案,我想,就藏在“堆数量”和“找本质”这两种截然不同的路径所带来的巨大差距里。



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张柏芝和三个儿子机场被偶遇,谢振南比哥哥谢振轩高了,侧颜很帅

张柏芝和三个儿子机场被偶遇,谢振南比哥哥谢振轩高了,侧颜很帅

丁丁鲤史纪
2026-01-22 16:54:34
金玟哉谈红牌:我确实拉拽了对手,这是一次犯规

金玟哉谈红牌:我确实拉拽了对手,这是一次犯规

懂球帝
2026-01-22 08:10:04
青岛市黄岛区人民政府党组成员、副区长夏鹏接受纪律审查和监察调查

青岛市黄岛区人民政府党组成员、副区长夏鹏接受纪律审查和监察调查

天下泉城
2026-01-22 16:32:07
初高中的区别:初中认真学,成绩就不差;高中没天赋,课都听不懂

初高中的区别:初中认真学,成绩就不差;高中没天赋,课都听不懂

好爸育儿
2026-01-21 22:16:05
伊朗神权崩塌前夜:9000万高知青年与内战危机

伊朗神权崩塌前夜:9000万高知青年与内战危机

夏至陌离殇
2026-01-14 15:34:27
A股:尾盘传来两个信息,明天,周五或要这样走了!

A股:尾盘传来两个信息,明天,周五或要这样走了!

明心
2026-01-22 16:34:41
晚上23点,中国队决战日本队!邵佳一传来喜讯:7人将补充到国足

晚上23点,中国队决战日本队!邵佳一传来喜讯:7人将补充到国足

何老师呀
2026-01-22 14:38:03
奶奶把270万补偿款全给堂哥,我辞职卖房出国,除夕夜她发短信

奶奶把270万补偿款全给堂哥,我辞职卖房出国,除夕夜她发短信

小秋情感说
2026-01-22 15:15:37
夫妻性生活中的“小动作”技巧:让妻子“爽”到骨子里的四个秘诀

夫妻性生活中的“小动作”技巧:让妻子“爽”到骨子里的四个秘诀

精彩分享快乐
2025-12-04 13:26:44
中央纪委国家监委通报2025年对纪检监察干部监督检查审查调查情况:对纪检监察干部立案4119人,处分3763人

中央纪委国家监委通报2025年对纪检监察干部监督检查审查调查情况:对纪检监察干部立案4119人,处分3763人

每日经济新闻
2026-01-22 14:52:01
1981年,堂哥逃婚,我被他未婚妻当场点名:“他不娶,你娶”

1981年,堂哥逃婚,我被他未婚妻当场点名:“他不娶,你娶”

云端小院
2026-01-22 09:15:46
娱乐圈又丢人!嫣然医院捐款名单曝光,年入上亿明星“集体沉默”

娱乐圈又丢人!嫣然医院捐款名单曝光,年入上亿明星“集体沉默”

说历史的老牢
2026-01-21 15:16:44
字母哥爆了!正式和里弗斯翻脸,拒绝沟通不理教练!想走就别装了

字母哥爆了!正式和里弗斯翻脸,拒绝沟通不理教练!想走就别装了

嘴炮体坛
2026-01-22 14:19:10
终于封海!“正式交锋”已打响,中国人民解放军不再口头警告

终于封海!“正式交锋”已打响,中国人民解放军不再口头警告

爱吃醋的猫咪
2026-01-17 21:54:38
伊朗抗议者遗体被收费:家属按子弹数交钱领回

伊朗抗议者遗体被收费:家属按子弹数交钱领回

桂系007
2026-01-22 00:23:18
《阿凡达3》开始盈利,全球票房近百亿,《阿凡达4》稳了

《阿凡达3》开始盈利,全球票房近百亿,《阿凡达4》稳了

影视高原说
2026-01-21 18:15:27
大结局要来?高市安排身后事,辞职条件已确定,中国73岁老将出山

大结局要来?高市安排身后事,辞职条件已确定,中国73岁老将出山

凡知
2026-01-21 09:48:40
王鹤棣妈妈的油炸店确认转让,棣爸回应:照顾儿子,没办法兼顾生意

王鹤棣妈妈的油炸店确认转让,棣爸回应:照顾儿子,没办法兼顾生意

封面新闻
2026-01-22 16:01:04
深圳多区有人被查!警方提醒

深圳多区有人被查!警方提醒

深圳晚报
2026-01-21 20:57:47
博主说老公3次哭求她把帕金森婆婆接来家里!结果人一来博主就跑

博主说老公3次哭求她把帕金森婆婆接来家里!结果人一来博主就跑

夜深爱杂谈
2026-01-20 19:19:28
2026-01-22 19:59:00
感恩每日相伴
感恩每日相伴
遇见即是上上签,感恩每日相伴
58文章数 204关注度
往期回顾 全部

科技要闻

几千亿只是开胃菜,AI基建还得再砸几万亿

头条要闻

"光速升迁"的朝鲜副总理被罢免 金正恩讽刺"羊拉牛车"

头条要闻

"光速升迁"的朝鲜副总理被罢免 金正恩讽刺"羊拉牛车"

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

车银优赚800亿 涉嫌逃税200亿!

财经要闻

潘功胜:继续实施好适度宽松的货币政策

汽车要闻

配备多块娱乐屏 极氪8X内饰曝光

态度原创

本地
时尚
手机
艺术
公开课

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

2026大预测!这4件衣服今年必火

手机要闻

真我realme手机今年4月全面接入OPPO售后服务

艺术要闻

一场雪,飘进了唐诗

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版