网易首页 > 网易号 > 正文 申请入驻

让ChatGPT长“手”!Meta爆火新论文,让语言模型学会自主用工具

0
分享至

鱼羊 Pine 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT爆火,Meta也坐不住了。

微软和谷歌正在搜索引擎那边刺刀拼刺刀呢,谁想Meta冷不防抛出一篇新论文,顿时吸引全场目光:

瞄准ChatGPT的“软肋”,让大语言模型自行学会了使用工具

简单来说,基于Meta的这个思路,ChatGPT这些大语言模型可以缺啥补啥:

不会算数,就自己掏出计算器计算;需要最新信息,就自己连接搜索引擎搜索……

是不是有点AI自己操作自己内味儿了?

论文一出,不少AI研究者就将其视作“过去几周里最重要的论文”。

这篇论文给人们打开了思路,让大语言模型未来可以成为所有事情的起点。

还有网友表示:我老婆原本不太关心AI,听说Meta这论文都惊了。普通人真的得好好想想这事儿了。

自学工具用法的大语言模型

这一回,Meta给这个会使工具的语言模型起名Toolformer

Toolformer的内核逻辑,总结下来很简单,就是:

专业的任务交给专业的工具来做。

在生成文本的过程中,遇到特定的任务,Toolformer会直接调用所需工具的API。

比如说,在执行这个任务:1400名参与者,有400人通过了测试,占多大比例?(为了让ChatGPT掌握数学运算,OpenAI可没少折腾)

Toolformer丝毫不慌,直接“掏出”计算器,现场计算得出结果:29%

又或者说,想要备注个事情,只知道是周五,具体日期还不知道?

没关系,翻出日历查一下就好了。

甚至翻译任务也可以直接丢给它,各国语言都能够识别并翻译,直接省去了在软件切换语言的工夫。

除了这些工具之外,Toolformer还能够调用Q&A以及搜索引擎等工具。

这时,就已经有网友开始畅想未来了:

现在,ChatGPT版必应能帮你比较酒店价格,那未来有了Toolformer,预定性价比高的酒店岂不是也可以甩给AI去做了。

不过话说回来,Toolformer面对不同的任务都能行云流水般地调用对应的工具,它是怎么做到的呢?

一言以蔽之,Toolformer经过训练,能够在生成文本中插入API调用,直接将任务外包出去。

在这其中,训练的过程是以自监督的方式完成的。这意味着无需大量人类标注好的数据,Toolformer只需要少量演示就能学会调用API。

具体来说,先给Toolformer提供少量已经手动标注好的例子,然后让语言模型在实践中生成一个更大的包含示例的数据集

这个过程主要分成三步:

首先是取样,通俗点讲就是看输入的文本提示中,哪个地方需要调用哪种工具,然后直接将“调用的API”插入到对应的地方;

其次是执行,执行上一步的“调用API”任务,将生成的文本直接插入进去;

最后是过滤,上一步中工具生成的文本如果对输入文本来说用处不大的话,就可以直接pass掉,保留对文本有用的地方。

这样一来,基于这些有用的数据集,Toolformer便可以对预先训练好的大语言模型进行微调。

讲了这么多,Toolformer的真实效果到底如何,有没有一个横向的数据对比?

论文将Toolformer和多个其他大语言模型,包括GPT-J,OPT(66B)以及GPT-3(175B)进行了对比,比较了它们在数学、Q&A以及机器翻译等方面的能力。

结果显示,在学习使用工具后,GPT-J的零样本学习性能的到了显著的提高。

△Toolformer:是在GPT- J上微调,并加强了CCNet子集中的API调用/ Toolformer (disabled):同上,但解码期间禁用API调用

并且在大多数任务上性能都有明显提高,在一些下游任务中Toolformer甚至已经超过了GPT-3。

“未来大语言模型发展的重要分支”

说到这里,不知道你怎么看这件事儿。

有不少网友是已经按捺不住,想着去拔AI电源了。

而引发更多讨论的,是这样一种观点:Toolformer可能是未来LLM(大语言模型)发展的一个重要分支。

大语言模型进化出使用工具的能力,知道应该在何时、使用何种工具来实现需求,也就意味着许多在今天还需要人类和AI协作完成的工作,未来AI都能自己搞定了。

比如现在还多少有些“人工智障”的语音助手,如果背后有ChatGPT+Toolformer的技术能力支撑,那么从挑选符合需求的餐厅,到直接订座,这一系列动作都可以被丝滑地串联起来。

又比如微软的必应搜索接入ChatGPT。如果这些大语言模型能充分调用各种API、使用UI,那它不仅能帮人们完成搜索,还能完全改变人们操作网页的方式——一切输入都可以化简为自然语言。

甚至,ChatGPT这样的模型,借助各种API重写自己的代码,也将成为可能。

事实上,让AI掌握工具的使用方法这个研究方向,也并不只有Meta在做。

比如谷歌即将嵌入到搜索中的Bard,背后模型LaMDA就内置了一套工具箱,包括计算器、翻译器和访问搜索引擎获取外部信息的接口。

还有开源项目LangChain,也致力于将大语言模型与外部的计算、知识来源相结合,以开发真正可用的应用程序。

而现在,Meta又使大模型对工具的使用“熟练度”、“自主性”,更上一层楼。

不过,也有网友指出,Toolformer所展现出的“自学”能力,还是一个初级、“狭义”的版本。

这些模型本身仍然是纯粹的函数:给定相同的输入(包括采样时的随机值),它将总是产生相同的输出。
有点像是在说,一个大语言模型能学会将特定领域的语言作为其自然语言的一部分,以此纳入来自外部工具的知识。

One More Thing

Meta新论文炸场,还挑动了人类的“反思”神经。

这不,新鲜梗图已经出炉:

人类在沉迷,而机器在学习。

论文地址:
https://arxiv.org/abs/2302.04761
参考链接:
[1] https://twitter.com/timo_schick/status/1624058382142345216
[2] https://twitter.com/mathemagic1an/status/1624870248221663232
[3] https://twitter.com/Tisoga/status/1624543837745192960

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

细说职场
2026-06-20 15:03:51
世界杯新军又出门神 37岁老将单场15次扑救创纪录 曾是张玉宁队友

世界杯新军又出门神 37岁老将单场15次扑救创纪录 曾是张玉宁队友

我爱英超
2026-06-21 10:04:23
售83.8万起 蔚来ET9地平线特别版“极境逐光”上市 全球限量99台

售83.8万起 蔚来ET9地平线特别版“极境逐光”上市 全球限量99台

太平洋汽车
2026-06-21 19:49:06
特朗普:普京一个“昏招”葬送闪电战战果,罪魁祸首或已不在人世

特朗普:普京一个“昏招”葬送闪电战战果,罪魁祸首或已不在人世

生活魔术专家
2026-06-20 15:43:34
美伊谈判、霍尔木兹海峡,突传大消息!特朗普:若与伊朗不能达成协议,美或收取通行费!

美伊谈判、霍尔木兹海峡,突传大消息!特朗普:若与伊朗不能达成协议,美或收取通行费!

证券时报
2026-06-21 08:26:08
8场4球!7场0球!身价8500万欧却成阿根廷队武磊,接班梅西恐无望

8场4球!7场0球!身价8500万欧却成阿根廷队武磊,接班梅西恐无望

大卫的篮球故事
2026-06-21 16:10:46
山东省940万退休人员将迎养老金调整,看一看过去三年的变化情况

山东省940万退休人员将迎养老金调整,看一看过去三年的变化情况

云鹏叙事
2026-06-21 15:54:33
“卖7.9元手机壳被索赔38万元?” 荣耀被曝密集起诉手机壳小店“商标侵权”,网友调侃“吃相难看”

“卖7.9元手机壳被索赔38万元?” 荣耀被曝密集起诉手机壳小店“商标侵权”,网友调侃“吃相难看”

新浪财经
2026-06-20 17:14:52
1930年,白崇禧与副官未婚妻生子,妻子马佩璋赶至南宁当面质问

1930年,白崇禧与副官未婚妻生子,妻子马佩璋赶至南宁当面质问

唠叨说历史
2026-06-18 15:46:16
同事求我接他妹,高铁站却来七口人,我笑问谁骑共享单车?

同事求我接他妹,高铁站却来七口人,我笑问谁骑共享单车?

晓艾故事汇
2026-06-16 15:43:25
公开辟谣!哈珀父亲否认向马刺索要首发:位置是靠自己打出来的

公开辟谣!哈珀父亲否认向马刺索要首发:位置是靠自己打出来的

罗说NBA
2026-06-21 08:34:11
孙艺珍晒一家三口出游靓照,玄彬把小甜豆抱在怀里,满屏好幸福

孙艺珍晒一家三口出游靓照,玄彬把小甜豆抱在怀里,满屏好幸福

看尽落尘花q
2026-06-21 11:33:57
赖清德天塌了!大陆突然出手,两大工程落地,2300万台湾民众受益

赖清德天塌了!大陆突然出手,两大工程落地,2300万台湾民众受益

芳芳历史烩
2026-06-21 17:40:13
7只半导体个股股东减持套现逾67亿,多路资金集体兑现

7只半导体个股股东减持套现逾67亿,多路资金集体兑现

第一财经资讯
2026-06-21 16:37:11
洪秀柱直言敲打:既然不愿扛起统一大旗,何必身居国民党主席之位

洪秀柱直言敲打:既然不愿扛起统一大旗,何必身居国民党主席之位

谁将主宰未来
2026-06-21 09:57:43
晚饭七分饱被推翻了?医生:过了65岁,吃饭尽量要做到这5点

晚饭七分饱被推翻了?医生:过了65岁,吃饭尽量要做到这5点

健康科普365
2026-06-14 18:10:08
乌克兰一夜被炸醒!乌军终于明白:战术再精妙,也敌不过绝对火力

乌克兰一夜被炸醒!乌军终于明白:战术再精妙,也敌不过绝对火力

面包夹知识
2026-06-17 14:22:49
这辆日本SUV在悄悄改写“长期主义”的规则

这辆日本SUV在悄悄改写“长期主义”的规则

像素与芯片
2026-06-21 00:31:35
太阳报:贝克汉姆世界杯期间靠广告赚约1900万英镑

太阳报:贝克汉姆世界杯期间靠广告赚约1900万英镑

懂球帝
2026-06-21 11:48:11
世界杯最魔幻时刻:同一个“国家”,四支球队奏四种国歌

世界杯最魔幻时刻:同一个“国家”,四支球队奏四种国歌

勇哥读史
2026-06-19 11:07:47
2026-06-21 20:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
12823文章数 176502关注度
往期回顾 全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

体育要闻

德国的超级替补,10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

蔚来的“暗战”时刻

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

本地
旅游
数码
公开课
军事航空

本地新闻

龙腾资江 韵动邵阳

旅游要闻

河南:多彩民俗迎端午 沉浸体验活力足丨乐享端午

数码要闻

英特尔与AMD推出ACE扩展:为x86架构加入AI指令集

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

时隔44年试射洲际导弹 现场照片传递三个重磅信息

无障碍浏览 进入关怀版