网易首页 > 网易号 > 正文 申请入驻

斯坦福大学揭秘」大型语言模型"涌现能力"真相:或许只是统计把戏

0
分享至

本文为936字,建议阅读2分钟

大型语言模型展现出"涌现能力" —— 即较小规模的模型所没有的能力,会在模型规模增大到一定程度时突然出现。这种突现能力引人注目,有两个原因:一是它的突兀性,从无到有似乎是一夜之间发生的转变;二是它的难以预测性,这些能力会在看似难以预料的模型规模下突然浮现

NeurIPS 杰出论文奖得主,斯坦福大学研究人员的论文《大型语言模型的涌现能力是海市蜃楼吗?(作者:@RylanSchaeffer , @BrandoHablando , @sanmikoyejo )

研究了大型语言模型的涌现特性,并得出结论:

对于特定任务和模型系列,所谓的涌现能力其实是由研究人员选择的评估指标造成的,而不是由于大规模导致的模型行为发生了根本变化。具体来说,非线性或不连续的指标会产生明显的涌现能力现象,而线性或连续的指标则会显示出模型性能的平滑、连续和可预测的提升

研究人员用一个简单的数学模型阐述了他们的解释,并通过三种方式对此进行了验证:

(1)使用OpenAI的InstructGPT/GPT-3模型系列在此前被认为存在涌现能力的任务上进行实证测试,发现改变评估指标就能消除这种现象

(2)对BenchBig等公开数据集上的突现能力现象进行元分析,也验证了指标的选择是关键因素

(3)通过有意识地改变指标,在多个视觉任务上的不同深度网络中人为诱发从未见过的"涌现能力"

通过以上三种分析,研究人员提供了证据,表明所谓的涌现能力在改变评估指标或使用更好的统计方法后就会消失,它可能不是人工智能模型进阶的一个根本性特征

该论文的作者指出,他们的发现有几个重要含义:

一是在构建基准测试时,任务本身和评估指标是两个有意义的选择

二是在选择指标时,需要考虑其对单词误差率的影响,并相应地调整评估过程,避免得出无效的科学结论

三是在声称大规模模型具有某些新能力时,需要做适当控制以避免多重比较问题

四是公开模型和输出结果,有助于科学界进行独立审视和评估

结语

吴恩达对这项研究的评论:当我们实现 AGI 时,它将会慢慢到来,而不是一蹴而就

当很多人突然意识到某项技术(也许是发展已久的技术)时,公众的认知会出现不连续性,从而带来惊喜。但人工智能能力的增长比人们想象的更加持续。 这就是为什么我们期望通往 AGI 的道路是一条包含无数前进步骤的道路,从而逐步提高我们系统的智能程度

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世界上最烧钱的十项运动,没钱你真玩不起!

世界上最烧钱的十项运动,没钱你真玩不起!

马拉松跑步健身
2026-02-28 11:37:18
小米事故炸翻37万车主,雷军左右为难!

小米事故炸翻37万车主,雷军左右为难!

鸣金网
2026-02-28 10:45:03
中国不当冤大头了!中科院停付国际期刊发表费,老外专家也急了

中国不当冤大头了!中科院停付国际期刊发表费,老外专家也急了

青青子衿
2026-02-27 20:32:03
江西女子用公驴器官泡酒,三个月后给丈夫喝,不料发生意外

江西女子用公驴器官泡酒,三个月后给丈夫喝,不料发生意外

古怪奇谈录
2025-06-28 13:49:02
伊朗呼吁民众警惕敌人的心理战

伊朗呼吁民众警惕敌人的心理战

财联社
2026-03-01 03:56:08
6分钟19个导弹连全军覆没,82架战机被击落,此战给我们敲响警钟

6分钟19个导弹连全军覆没,82架战机被击落,此战给我们敲响警钟

混沌录
2026-02-04 22:25:03
伊朗的投降王牌:只要美国松绑,出卖中国利益绝不会有半点犹豫

伊朗的投降王牌:只要美国松绑,出卖中国利益绝不会有半点犹豫

老范谈史
2026-02-28 06:45:51
太扎心!过了40岁已经死了,只是没人埋,80后发千字肺腑之言…

太扎心!过了40岁已经死了,只是没人埋,80后发千字肺腑之言…

慧翔百科
2026-02-28 08:52:23
意外:台湾56岁女主持吴中纯昏迷3天去世,死因曝光

意外:台湾56岁女主持吴中纯昏迷3天去世,死因曝光

悠悠说世界
2026-03-01 02:52:25
网传张禹珍询问裁判退赛是否有积分后未果,随后离场治疗

网传张禹珍询问裁判退赛是否有积分后未果,随后离场治疗

懂球帝
2026-02-28 16:06:22
18连胜!孙颖莎4-2击败早田希娜!赛后日本媒体集体陷入惊恐,发出一阵阵哀鸣

18连胜!孙颖莎4-2击败早田希娜!赛后日本媒体集体陷入惊恐,发出一阵阵哀鸣

寒律
2026-03-01 02:01:28
伯克希尔2025年净利润超4500亿元!现金储备超2.5万亿元,巴菲特已正式退休,卸任公司CEO

伯克希尔2025年净利润超4500亿元!现金储备超2.5万亿元,巴菲特已正式退休,卸任公司CEO

每日经济新闻
2026-02-28 22:56:28
一场2-3,上演极限绝杀,英超土豪倒下,7亿豪阵也没用

一场2-3,上演极限绝杀,英超土豪倒下,7亿豪阵也没用

足球狗说
2026-03-01 01:27:54
开火了!承诺放弃核材料不到一天,美国翻脸,联手以色列轰炸伊朗

开火了!承诺放弃核材料不到一天,美国翻脸,联手以色列轰炸伊朗

派大星纪录片
2026-02-28 16:53:27
起死回生!伊朗唯一能抗衡美国和以色列的,就剩下一招

起死回生!伊朗唯一能抗衡美国和以色列的,就剩下一招

起喜电影
2026-03-01 02:54:00
瓜帅:塞门约在很多方面都发挥了作用;希望哈兰德尽快回来

瓜帅:塞门约在很多方面都发挥了作用;希望哈兰德尽快回来

懂球帝
2026-03-01 04:07:13
美方报道的中国大使馆被炸事件,中国军事顾问团遭重创,秘而不宣

美方报道的中国大使馆被炸事件,中国军事顾问团遭重创,秘而不宣

干史人
2025-10-22 20:10:03
巴拿马终于发现,强吞中国18亿资产,竟是在自掘坟墓

巴拿马终于发现,强吞中国18亿资产,竟是在自掘坟墓

聚焦真实瞬间
2026-03-01 02:52:14
中国已经提前收到了消息,伊朗这次基本上难逃此劫了

中国已经提前收到了消息,伊朗这次基本上难逃此劫了

音乐时光的娱乐
2026-03-01 03:02:48
吴宜泽从1-4追到4-4,打丢关键黑球出局!赵心童的含金量还在上升

吴宜泽从1-4追到4-4,打丢关键黑球出局!赵心童的含金量还在上升

球场没跑道
2026-03-01 01:51:22
2026-03-01 04:28:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1034文章数 396关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

伊朗媒体公布反击美军军事行动结果

头条要闻

伊朗媒体公布反击美军军事行动结果

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

冲突爆发 市场变天?

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

本地
房产
教育
艺术
公开课

本地新闻

津南好·四时总相宜

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

教育要闻

初三不安排春假,最多可连休10天!一地率先公布!

艺术要闻

惊艳!这位天使般的女子与油画让人心动不已!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版