网易首页 > 网易科技 > 网易科技 > 正文

周枫谈大语言模型:三项根本性新能力最为关键

0
分享至

【网易科技4月23日报道】近日,网易有道CEO周枫在个人公众号发文,探讨大语言模型技术带来的三项根本性新能力。他指出,在大模型带来的新能力中,涌现能力、作为基座模型支持多元应用的能力和支持对话作为统一入口的能力最为关键,可能给业界和产品带来长期影响,值得重点关注。

以下为内容全文:

基于大语言模型技术的ChatGPT推出已经有4个月了,更多同类产品还在快速出现。比如,前天谷歌更新了Bard,将辅助编程能力支持的语言数量扩展到20种。

然而,对大模型技术的重要性也出现了质疑,前段时间,吴军老师就评价ChatGPT不算新技术革命,带不来什么新的机会,他认为大模型仍然存在很多限制,不像大家追捧的那样有吸引力。这篇文章发布后,网上也出现了多篇反驳文章。我不太关注这些争论,但我认为有一个问题没有被充分讨论,那就是大模型带来的新能力中,哪些是最为关键的,最有可能带来长期影响的。

我认为,与之前众多的自然语言处理技术相比,大语言模型至少具有三项根本性新能力,这些新能力在学术界已经被广泛讨论,甚至被视为常识,但是在产业界和产品团队中却缺乏足够的关注。实际上,这些大模型技术的特点已经改变了我们对业务和产品规划的思考方式,也会改变很多产品的经济模型。因此,产品经理和业务负责人需要更多地关注和深入思考这些新能力的应用场景。

能力一:涌现能力(emergent abilities)

涌现能力指的是在小型模型中并不存在,但在大模型中“突然出现”的能力,其中包括常识推理、问答、翻译、数学、摘要等(详见下图)。如果仅依靠小型模型的能力做线性外推,往往无法预测出涌现能力的出现和其强度。OpenAI的首席技术官Ilya Sutskever在接受采访时反复强调,尽管表面上看来,语言模型只是在预测下一个词元(token),但当模型足够大,transformer技术的建模能力足够强时,基于内部表示的推理能力就会出现。因此,模型会呈现出与规模较小时完全不同的行为,涌现全新的能力。

涌现能力之所以重要,不仅因为它们是大模型出现后才有的新能力,而且由大模型涌现出来的多数是非常重要的能力。例如,常识推理能力一直是AI领域的重大难题,而大模型的出现使得常识推理取得了重大进展。此外,大模型还有机会进一步获得更多能力。例如,一旦“推理”能力涌现,“思维链提示”(Chain of Thought Prompting)策略就可以用来解决多步推理的难题。因此,涌现能力的出现,是大模型带来的一项根本性变化。

能力二:作为基座模型支持多元应用的能力

在2021年,斯坦福大学等多所高校的研究人员提出了基座模型(foundation model)的概念,这更清晰地描述了之前学界所称的预训练模型的作用。这是一种全新的AI技术范式,借助于海量无标注数据的训练,获得可以适用于大量下游任务的大模型(单模态或者多模态)。这样,多个应用可以只依赖于一个或少数几个大模型进行统一建设。


上图展示了基座模型的结构,基座模型集中化了多模态数据,并且可以适配多元化的下游任务。

大语言模型是这个新模式的典型例子,使用统一的大模型可以极大地提高研发效率,相比于分散的模型开发方式,这是一项本质上的进步。大型模型不仅可以缩短每个具体应用的开发周期,减少所需人力投入,也可以基于大模型的推理、常识和写作能力,获得更好的应用效果。因此,大模型可以成为AI应用开发的大一统基座模型,这是一个一举多得、全新的范式,值得大力推广。

能力三:支持对话作为统一入口的能力

让大语言模型真正火爆的契机,是基于对话聊天的ChatGPT。事实上,业界很早就发现了用户对于对话交互的特殊偏好,陆奇在微软期间2016年就推进“对话即平台(conversation as a platform)”的战略。此外,苹果Siri、亚马逊Echo等基于语音对话的产品也非常受欢迎,反映出互联网用户对于聊天和对话这种交互模式的偏好。虽然之前的聊天机器人存在各种问题,但大型语言模型的出现再次让聊天机器人这种交互模式可以重新想象。用户愈发期待像钢铁侠中“贾维斯”一样的人工智能,无所不能、无所不知。这引发我们对于智能体(Agent)类型应用前景的思考,Auto-GPT、微软Jarvis等项目已经出现并受到关注,相信未来会涌现出很多类似的以对话形态让助手完成各种具体工作的项目。


图为微软最新项目Jarvis的工作流程,Jarvis将通过任务规划、模型选择、任务执行、生成响应四个步骤,结合HuggingFace上的众多模型,完成多模态的复杂AI任务。

随着大型语言模型技术越来越受欢迎,我们可以期待它带来更多的惊喜,特别是考虑到上面讨论的这些大型模型带来的关键新能力,周明等人所预测的语言智能黄金十年(2020-2030)很可能会成为现实,这正是一个令人兴奋的时代。

相关推荐
热点推荐
广东3消息!徐杰最新伤情,杜锋批评年轻球员,胡明轩令人失望

广东3消息!徐杰最新伤情,杜锋批评年轻球员,胡明轩令人失望

多特体育说
2025-12-15 00:20:48
刘威没想到,31年前“抛弃”他,嫁给许亚军的何晴,晚年如此痛苦

刘威没想到,31年前“抛弃”他,嫁给许亚军的何晴,晚年如此痛苦

知法而形
2025-12-14 16:03:20
他不服文革判决,越狱流亡3万里,居然活着熬到平反

他不服文革判决,越狱流亡3万里,居然活着熬到平反

瑾瑜聊情感
2025-08-21 23:50:34
“我斯坦福毕业,学计算机的,实在找不到工作,就来NBA试试”

“我斯坦福毕业,学计算机的,实在找不到工作,就来NBA试试”

后体工队长
2025-12-15 10:34:18
本周,高中签率新股来了

本周,高中签率新股来了

新浪财经
2025-12-15 07:59:37
就是这个汤,喉咙痛、刀片嗓,百试百灵!真管用

就是这个汤,喉咙痛、刀片嗓,百试百灵!真管用

江江食研社
2025-11-27 10:30:06
张贤亮:性、政治和权力

张贤亮:性、政治和权力

尚曦读史
2025-12-12 09:01:03
林徽因落选的国徽方案,网友看后感叹:审美确实一绝,但真不合适

林徽因落选的国徽方案,网友看后感叹:审美确实一绝,但真不合适

元哥说历史
2025-12-03 11:25:03
惨了!广西一工厂3员工工作造成机台设备损坏,每人罚款5460元…

惨了!广西一工厂3员工工作造成机台设备损坏,每人罚款5460元…

火山詩话
2025-12-15 04:30:30
重磅:欧文即将回归浓眉哥不走了,独行侠组成三巨头冲击季后赛

重磅:欧文即将回归浓眉哥不走了,独行侠组成三巨头冲击季后赛

姜大叔侃球
2025-12-14 19:35:19
北京终于“暖回来了”!最新天气——

北京终于“暖回来了”!最新天气——

BRTV新闻
2025-12-15 09:01:52
澳洲海滩枪案凶嫌和夺枪“勇士”竟惊人相似……

澳洲海滩枪案凶嫌和夺枪“勇士”竟惊人相似……

吃瓜体
2025-12-15 12:09:23
全球震怒!美国都忍不住了!以色列竟然针对中国,真是作死!

全球震怒!美国都忍不住了!以色列竟然针对中国,真是作死!

嫹笔牂牂
2025-12-15 14:33:59
罕见!东莞一棵荔枝树在12月结果

罕见!东莞一棵荔枝树在12月结果

新快报新闻
2025-12-13 22:23:15
活久见!全网最有种的儿媳!偷走婆婆43万,带闺蜜去KTV挥霍一空

活久见!全网最有种的儿媳!偷走婆婆43万,带闺蜜去KTV挥霍一空

火山詩话
2025-12-13 17:04:04
【动力图】上海男篮揭幕战万人观赛创纪录,逆转吉林迎开门红

【动力图】上海男篮揭幕战万人观赛创纪录,逆转吉林迎开门红

上观新闻
2025-12-15 15:47:16
因长得帅被越南女兵俘虏,1979年对越战争中,一男兵的神奇经历

因长得帅被越南女兵俘虏,1979年对越战争中,一男兵的神奇经历

史记趣闻
2024-11-30 20:20:03
有海外居留权,银行账户会被冻结?!余额全变0,澳男吓出一身冷汗

有海外居留权,银行账户会被冻结?!余额全变0,澳男吓出一身冷汗

澳洲红领巾
2025-12-15 11:11:20
授予上将与晋升上将,有什么区别?

授予上将与晋升上将,有什么区别?

袁老师说历史
2025-12-13 15:13:17
外接显卡要成潮流?扩展坞不足千元,很多电脑已提供接口

外接显卡要成潮流?扩展坞不足千元,很多电脑已提供接口

数评时代
2025-12-15 10:48:58
2025-12-15 16:39:00

科技要闻

平价数码产品,要和我们说再见了?

头条要闻

上周有菲方人员持刀威胁中方执法海警 外交部回应

头条要闻

上周有菲方人员持刀威胁中方执法海警 外交部回应

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

黄绮珊在何晴去世首发,10年悄悄祈福

财经要闻

新农合涨到400元 农民断缴背后的扎心真相

汽车要闻

主驾配按摩还可选6座 新款捷途X90PRO售13.59万起

态度原创

健康
艺术
游戏
家居
公开课

甲状腺结节到这个程度,该穿刺了!

艺术要闻

369米!中国第三大民企的全球运营总部,网传三个设计方案

《FF7:永恒危机》爱丽丝性感联动服装遭修改引不满

家居要闻

温暖色调 大空间不冷清

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×