大模型超能力真智能还是幻术？科学家为此吵翻天，别被涌现迷惑了|原理

大模型超能力真智能还是幻术？科学家为此吵翻天，别被涌现迷惑了

分享至

哈喽，大家好，我是小今。咱们来聊聊大模型的“涌现超能力”，看着神乎其神，可科学家却说这未必是真智能？这里头争议可不小！

打开GPT-4解出复杂数学题、自动写出能运行的代码，不少人都觉得AI好像突然“开窍”了，有了超越机器的本事。这就是大家常说的“涌现”？可科学家们却吵翻了天：这到底是真的新型能力，还是靠堆数据堆出来的“假象”？更关键的是，能力变强了，就等于变聪明了吗？咱们用大白话把这事捋明白。

“涌现”：不只是AI的专属词儿

要聊清楚大模型的事儿，咱们得先搞明白“涌现”这个词。它可不是AI火了之后才蹦出来的。在复杂的科学系统里，这个概念早就有了。最简单的理解就是：“凑够数量，就出新品性。”就像物理学家安德森说的那句：“多者异也。”意思是，东西一旦多了，整体的性质就可能完全不一样了。

咱们用最日常的例子来说吧：水。单个的水分子，它哪有什么“流动”的概念？孤零零的一个，顶多就是个小粒子。但如果把亿万个水分子凑在一起，它们就开始流淌了，有了潮起潮落，有了水流冲击石头的那股劲儿。你看，这就是典型的“涌现”，从没有到有，从个体到整体，突然就冒出了新的特性。

真涌现，得学会“化繁为简”

不过，你可别觉得只要是“突然变厉害”就算涌现了。这里面，其实还有一个很关键的门槛：它得能“化繁为简”。啥意思呢？就像咱们看一条大河奔腾，你根本不需要去盯着每一个水分子的轨迹，去研究它往哪儿跑、速度多快。你只要知道这条河的流速、水压这些关键指标，就能大致预判水流的方向和力量。

这种能抛开微观的无数细节，直接抓住核心规律的能力，才是涌现的真正精髓。科学界对此也设定了一些判断标准：比如，构成系统的规模够不够大？有没有突然的性能飞跃？能不能把大量信息压缩成更简洁的模式？有没有形成新的底层逻辑？

以及，最重要的一点，它能不能应对以前没见过的新情况？大模型那些所谓的“超能力”，其实就卡在这几个标准上，争议一直不断。

“数据堆砌的魔术”：性能飙升的真相

那大模型现在表现出来的“涌现”，到底是个啥情况呢？说实话，很多时候，它更像是一场精心编排的“数据魔术”。

比如，一个60亿参数的模型，算三位数加法的准确率才1%，参数涨到130亿，准确率爬到8%，可当参数飙到1750亿的时候，准确率直接跳到了80%！这种“嗖”一下的突变，当时让不少人都觉得：“哇，这不就是涌现来了嘛！”

但很快，就有细心的科学家站出来“拆穿”了：他们换了个更细致的评估方式，把测试题的难度更均匀地分布开来，结果发现，那种“突然爆发”的现象就没了。

性能其实是慢慢地、稳步地在提升，根本没有想象中那么戏剧化。说白了，有时候，我们看到的“涌现”，可能只是我们的评估方法或者测试设计，给我们造成的错觉。

是“理解”棋局，还是“背熟”套路？

当然，也有一些例子看上去挺像那么回事儿的。比如，有个叫OthelloGPT的下棋模型，没人特意教它围棋的规则，它自己竟然“摸透”了棋盘上的逻辑，还在内部形成了一种简化的表示方式。这听起来，似乎挺符合“化繁为简”的涌现标准，挺有那么点儿意思的。

可质疑声一样没停：这会不会只是模型把海量的棋谱、棋路给总结了一遍，然后形成了一堆“下棋套路”，而不是真的形成了什么新颖的底层逻辑？而且，这种内部结构的变化，跟它实际的下棋表现之间，究竟是不是因果关系，还没有一个特别清晰的解释，也可能只是一种巧合。

更关键的是，很多所谓的“涌现能力”，往往经不起换场景的考验，它在熟悉的任务里表现得特别好，一旦你稍微换个说法、变个场景，它就歇菜了。这本质上，还是它把数据里的模式“记熟”了，而不是真的“懂”了规律。

能力强大 ≠ 真正智能

在这里，咱们必须把一个核心区别给分清楚：拥有“涌现能力”，不等于就拥有了“涌现智能”。这就像咱们的计算器，它能算加减乘除，能开方，能积分，功能是不是够强大？绝对够强大！

但没人会说计算器有智能吧？因为它只是按照预设的算法干活，不会举一反三，更不会创造新的计算方法。它只是一个工具，一个高效的计算工具。

而真正的涌现智能，它的核心是“用最少的本事办最多的事儿”。人类就是最好的例子。咱们学会了“杠杆原理”，不用教，马上就能灵活地用到撬石头、玩跷跷板、平衡天平上，咱们听懂了几句指令，就能明白一个复杂的任务，快速调整思路，根本不需要反复试错。这是一种触类旁通、举一反三的本事。

但大模型不行。它要想掌握类似的迁移能力，往往得在训练数据里见过成千上万个相似的案例。少一个，它可能就翻车了。麻省理工的科学家就一针见血地指出，人类智能靠的是“凭少量原则理解世界”，而大模型，目前更像是一个“找数据规律的机器”，它更多是记住模式，而不是真的理解了这些模式背后的原理。

现状：一个庞大的“专用计算器集合”

所以，现在学术界的共识，其实已经比较明确了：大模型确实展现出了一些“涌现”的苗头，尤其是那些能形成内部简化表征的情况，这些是值得我们深入研究的。但绝大多数我们看到的，仅仅是靠着堆参数、堆数据换来的性能提升，都够不上真正涌现智能的标准。

它更像是一个超级庞大的“专用计算器集合”，每个“计算器”都负责一个特定的任务。它能靠暴力拟合，把海量数据里的模式“硬套”出来，从而实现各种功能。但离人类那种“以简驭繁”，用最少的知识解决最多问题的智能境界，还有着不小的距离。

语言：是“世界密码”还是“思维镜子”？

这关于大模型智能的争论，核心还绕不开一个非常关键的问题：语言，在训练过程中到底扮演了什么角色？这个问题，直接决定了大模型的能力上限。

有人觉得，语言本身就是压缩了的世界密码，里面藏着物理、社会的所有规律，只要模型学会了语言，就等于掌握了世界的秘密。也有人说，语言是“思维的镜子”，它反映了人类的思考逻辑和认知结构。

还有人觉得，语言就只是一种编程语言，训练模型，本质上就是在给它写程序。如果语言真的包含了所有信息，那模型再大，也只是个“拷贝知识”的机器，谈不上真正的涌现和创造。

未来的路：撬开“黑箱”，寻找“概念”

那么，未来我们应该怎么研究，才能更好地理解大模型的智能潜力呢？我觉得，光盯着模型的测试分数高不高、任务完成得好不好，已经不够了。更重要的是，我们得想办法“撬开”这个“黑箱子”，看看它内部到底有没有形成类似人类“概念”的东西。

这些“概念”能不能像人类一样，彼此关联起来，形成更高级的认知结构？它能不能实现那种“一点就通”的顿悟式学习，而不是非得看过无数例子才能学会？毕竟，真正的智能，从来都不是靠单纯地堆数据、堆参数就能实现的。它更需要精准的抽象能力和高效的简化能力，用最少的成本，解决最多的问题。

说到底，我们现在纠结的，不仅仅是“大模型有没有涌现”这么一个技术问题。更深层次地，我们其实是在追问一个更宏大的哲学命题：我们现在到底是在造一个更强大、更高效的工具，还是在无意中孕育一个真正有智慧的生命？这个问题的答案，我想，就藏在“堆数量”和“找本质”这两种截然不同的路径所带来的巨大差距里。

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

大模型超能力真智能还是幻术？科学家为此吵翻天，别被涌现迷惑了

几千亿只是开胃菜，AI基建还得再砸几万亿

"光速升迁"的朝鲜副总理被罢免 金正恩讽刺"羊拉牛车"

"光速升迁"的朝鲜副总理被罢免 金正恩讽刺"羊拉牛车"

跑个步而已，他们在燃什么？

车银优赚800亿 涉嫌逃税200亿！

潘功胜：继续实施好适度宽松的货币政策

配备多块娱乐屏 极氪8X内饰曝光

态度原创

云游中国｜格尔木的四季朋友圈，张张值得你点赞

2026大预测！这4件衣服今年必火

真我realme手机今年4月全面接入OPPO售后服务

一场雪，飘进了唐诗

"光速升迁"的朝鲜副总理被罢免金正恩讽刺"羊拉牛车"

"光速升迁"的朝鲜副总理被罢免金正恩讽刺"羊拉牛车"

车银优赚800亿涉嫌逃税200亿！

配备多块娱乐屏极氪8X内饰曝光