网易首页 > 网易号 > 正文 申请入驻

让ChatGPT长“手”!Meta爆火新论文,让语言模型学会自主用工具

0
分享至

鱼羊 Pine 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT爆火,Meta也坐不住了。

微软和谷歌正在搜索引擎那边刺刀拼刺刀呢,谁想Meta冷不防抛出一篇新论文,顿时吸引全场目光:

瞄准ChatGPT的“软肋”,让大语言模型自行学会了使用工具

简单来说,基于Meta的这个思路,ChatGPT这些大语言模型可以缺啥补啥:

不会算数,就自己掏出计算器计算;需要最新信息,就自己连接搜索引擎搜索……

是不是有点AI自己操作自己内味儿了?

论文一出,不少AI研究者就将其视作“过去几周里最重要的论文”。

这篇论文给人们打开了思路,让大语言模型未来可以成为所有事情的起点。

还有网友表示:我老婆原本不太关心AI,听说Meta这论文都惊了。普通人真的得好好想想这事儿了。

自学工具用法的大语言模型

这一回,Meta给这个会使工具的语言模型起名Toolformer

Toolformer的内核逻辑,总结下来很简单,就是:

专业的任务交给专业的工具来做。

在生成文本的过程中,遇到特定的任务,Toolformer会直接调用所需工具的API。

比如说,在执行这个任务:1400名参与者,有400人通过了测试,占多大比例?(为了让ChatGPT掌握数学运算,OpenAI可没少折腾)

Toolformer丝毫不慌,直接“掏出”计算器,现场计算得出结果:29%

又或者说,想要备注个事情,只知道是周五,具体日期还不知道?

没关系,翻出日历查一下就好了。

甚至翻译任务也可以直接丢给它,各国语言都能够识别并翻译,直接省去了在软件切换语言的工夫。

除了这些工具之外,Toolformer还能够调用Q&A以及搜索引擎等工具。

这时,就已经有网友开始畅想未来了:

现在,ChatGPT版必应能帮你比较酒店价格,那未来有了Toolformer,预定性价比高的酒店岂不是也可以甩给AI去做了。

不过话说回来,Toolformer面对不同的任务都能行云流水般地调用对应的工具,它是怎么做到的呢?

一言以蔽之,Toolformer经过训练,能够在生成文本中插入API调用,直接将任务外包出去。

在这其中,训练的过程是以自监督的方式完成的。这意味着无需大量人类标注好的数据,Toolformer只需要少量演示就能学会调用API。

具体来说,先给Toolformer提供少量已经手动标注好的例子,然后让语言模型在实践中生成一个更大的包含示例的数据集

这个过程主要分成三步:

首先是取样,通俗点讲就是看输入的文本提示中,哪个地方需要调用哪种工具,然后直接将“调用的API”插入到对应的地方;

其次是执行,执行上一步的“调用API”任务,将生成的文本直接插入进去;

最后是过滤,上一步中工具生成的文本如果对输入文本来说用处不大的话,就可以直接pass掉,保留对文本有用的地方。

这样一来,基于这些有用的数据集,Toolformer便可以对预先训练好的大语言模型进行微调。

讲了这么多,Toolformer的真实效果到底如何,有没有一个横向的数据对比?

论文将Toolformer和多个其他大语言模型,包括GPT-J,OPT(66B)以及GPT-3(175B)进行了对比,比较了它们在数学、Q&A以及机器翻译等方面的能力。

结果显示,在学习使用工具后,GPT-J的零样本学习性能的到了显著的提高。

△Toolformer:是在GPT- J上微调,并加强了CCNet子集中的API调用/ Toolformer (disabled):同上,但解码期间禁用API调用

并且在大多数任务上性能都有明显提高,在一些下游任务中Toolformer甚至已经超过了GPT-3。

“未来大语言模型发展的重要分支”

说到这里,不知道你怎么看这件事儿。

有不少网友是已经按捺不住,想着去拔AI电源了。

而引发更多讨论的,是这样一种观点:Toolformer可能是未来LLM(大语言模型)发展的一个重要分支。

大语言模型进化出使用工具的能力,知道应该在何时、使用何种工具来实现需求,也就意味着许多在今天还需要人类和AI协作完成的工作,未来AI都能自己搞定了。

比如现在还多少有些“人工智障”的语音助手,如果背后有ChatGPT+Toolformer的技术能力支撑,那么从挑选符合需求的餐厅,到直接订座,这一系列动作都可以被丝滑地串联起来。

又比如微软的必应搜索接入ChatGPT。如果这些大语言模型能充分调用各种API、使用UI,那它不仅能帮人们完成搜索,还能完全改变人们操作网页的方式——一切输入都可以化简为自然语言。

甚至,ChatGPT这样的模型,借助各种API重写自己的代码,也将成为可能。

事实上,让AI掌握工具的使用方法这个研究方向,也并不只有Meta在做。

比如谷歌即将嵌入到搜索中的Bard,背后模型LaMDA就内置了一套工具箱,包括计算器、翻译器和访问搜索引擎获取外部信息的接口。

还有开源项目LangChain,也致力于将大语言模型与外部的计算、知识来源相结合,以开发真正可用的应用程序。

而现在,Meta又使大模型对工具的使用“熟练度”、“自主性”,更上一层楼。

不过,也有网友指出,Toolformer所展现出的“自学”能力,还是一个初级、“狭义”的版本。

这些模型本身仍然是纯粹的函数:给定相同的输入(包括采样时的随机值),它将总是产生相同的输出。
有点像是在说,一个大语言模型能学会将特定领域的语言作为其自然语言的一部分,以此纳入来自外部工具的知识。

One More Thing

Meta新论文炸场,还挑动了人类的“反思”神经。

这不,新鲜梗图已经出炉:

人类在沉迷,而机器在学习。

论文地址:
https://arxiv.org/abs/2302.04761
参考链接:
[1] https://twitter.com/timo_schick/status/1624058382142345216
[2] https://twitter.com/mathemagic1an/status/1624870248221663232
[3] https://twitter.com/Tisoga/status/1624543837745192960

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不建议50+男人留的发型!以为洋气,实际“大叔味”很重,太油腻

不建议50+男人留的发型!以为洋气,实际“大叔味”很重,太油腻

潮人志Fashion
2024-04-14 08:29:52
终于出手了?中国停止对美友好,事关美债,给了拜登当头一棒

终于出手了?中国停止对美友好,事关美债,给了拜登当头一棒

康海河说
2024-04-26 14:56:31
浙江暴雨冲出大量黄金,村民们捡都捡不完,竟是来自无底黄金洞

浙江暴雨冲出大量黄金,村民们捡都捡不完,竟是来自无底黄金洞

游史微鉴
2024-04-26 00:15:03
离婚28年后,两人在酒店相遇,男人是新郎,女人是洗碗工

离婚28年后,两人在酒店相遇,男人是新郎,女人是洗碗工

小月文史
2024-04-24 16:53:55
65个国家都收到了“邀请函”,却唯独没有中国,中方正式表态

65个国家都收到了“邀请函”,却唯独没有中国,中方正式表态

慢聊的历史
2024-04-26 14:21:34
大批美军空降乌克兰,美方警告中方不准帮俄!普京紧急下达军令!

大批美军空降乌克兰,美方警告中方不准帮俄!普京紧急下达军令!

绝对军评
2024-04-25 11:19:59
终于有中国球员打NBA!等了整整8年!杨瀚森真比不上人家……

终于有中国球员打NBA!等了整整8年!杨瀚森真比不上人家……

篮球实战宝典
2024-04-25 19:01:13
我78岁风流才子和妙龄少妇同居两年后,她怀孕还发财了

我78岁风流才子和妙龄少妇同居两年后,她怀孕还发财了

叶天辰故事会
2024-04-23 22:26:35
上海严禁对已出示本人有效身份证件的旅客进行“强制刷脸”核验|中国交通新闻

上海严禁对已出示本人有效身份证件的旅客进行“强制刷脸”核验|中国交通新闻

蛙斯基娱乐中
2024-04-25 12:31:55
31分14板5助!班凯罗太狠了,一战刷爆多项NBA纪录,打爆最矮双枪

31分14板5助!班凯罗太狠了,一战刷爆多项NBA纪录,打爆最矮双枪

世界体育圈
2024-04-26 10:42:20
决战上海海港之前 申花遭遇致命坏消息 天公不作美 胜算大大降低

决战上海海港之前 申花遭遇致命坏消息 天公不作美 胜算大大降低

零度眼看球
2024-04-26 17:08:02
广东20岁女孩相亲被5人看中,完胜6位大龄女子,网友:很识货

广东20岁女孩相亲被5人看中,完胜6位大龄女子,网友:很识货

户外阿崭
2024-04-26 09:24:09
上海出台电动自行车集中充电和停放场所设计标准,10月实施

上海出台电动自行车集中充电和停放场所设计标准,10月实施

南方都市报
2024-04-26 13:54:05
直播带货行业将迎来大地震

直播带货行业将迎来大地震

搞笑的阿万
2024-04-26 06:59:37
2024年养老金迎来增长,退休人员养老金收入提高,有人能涨好几千

2024年养老金迎来增长,退休人员养老金收入提高,有人能涨好几千

社保小达人
2024-04-26 13:38:45
军中色虎谷俊山,贪污300亿,无人敢动,背靠两大保护伞,被判死缓

军中色虎谷俊山,贪污300亿,无人敢动,背靠两大保护伞,被判死缓

天闻地知
2024-04-25 17:15:16
新华社快讯:以色列25日宣布,美国在加沙地带开工建设码头,以军提供“安全和后勤支持”。

新华社快讯:以色列25日宣布,美国在加沙地带开工建设码头,以军提供“安全和后勤支持”。

新华社
2024-04-26 03:39:06
布林肯再批中国支援俄罗斯,中国也不惯着,直接送他3份大礼

布林肯再批中国支援俄罗斯,中国也不惯着,直接送他3份大礼

绝密探照灯
2024-04-22 15:39:01
2017年他花3万英镑买下1辆旧坦克,结果居然在油箱找到25公斤黄金

2017年他花3万英镑买下1辆旧坦克,结果居然在油箱找到25公斤黄金

梦里大唐
2024-04-25 17:52:24
日媒:中国汽车越成功,就离世界越远

日媒:中国汽车越成功,就离世界越远

阿珂谈汽车
2024-04-26 14:13:20
2024-04-26 18:24:49
量子位
量子位
追踪人工智能动态
9321文章数 175242关注度
往期回顾 全部

科技要闻

中国车企“五常”激战北京车展

头条要闻

北漂12年男子:晚上住轿车里 周末于太原北京双城通勤

头条要闻

北漂12年男子:晚上住轿车里 周末于太原北京双城通勤

体育要闻

库里当选最佳关键球员 10项数据联盟第一

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

本地
旅游
亲子
家居
军事航空

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

旅游要闻

白俄,中国人的快乐福地?

亲子要闻

网友拍下自家宝宝,表示就浅浅的期待一下夏天吧。

家居要闻

光影之间 空间暖意打造生活律动

军事要闻

以军称已完成对拉法地面军事行动准备工作

无障碍浏览 进入关怀版