网易首页 > 网易号 > 正文 申请入驻

搞科研新姿势:让GPT-3给你打下手

0
分享至

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

搞科研的最新姿势,被一位华人小哥解锁了——

告诉AI你的研究目标,再把数据集“投喂”进去,完事。

这就是来自伯克利的博士生Zhong Ruiqi等人的最新研究,把从海量数据集中繁琐的“取证”过程,统统交给GPT-3来解决:

他们还发现,这种用AI搞科研的方法不仅效率高,而且还能得出人类没有想到的“意外惊喜”。

让GPT-3帮你搞科研

那么小哥他们为什么突发奇想地要用这种方式搞科研呢?

这是因为他们发现,对大型语料库做深入的挖掘确实能得到一些有用的结果,但这个过程要是让人类来搞,那简直就太费时费力了。

因此,他们便决定把这个繁琐的过程交给GPT-3来处理,并把这个任务命名为“D5”

  • GoalDrivenDiscovery ofDistributionalDifferences via LanguageDescriptions.
  • 通过语言描述,实现目标驱动的分布式差异的发现。

“D5”任务的过程,简单来说就是两个动作:

  • 输入研究目标
  • 输入两个语料库

例如在上面这个案例中,小哥先是给AI输进去了两个语料库:

  • 语料库A:服用药物A后患者的反应报告
  • 语料库B:服用药物B后患者的反应报告

然后再向AI确定自己的研究目标,即“我想了解一下药物A的副作用”。

在AI收到任务后,立刻开始执行分析工作,最后得出了它的结论:

语料库A中的样本,有更多的患者会提到“妄想症”(paranoia)。

不过试想一下,若让人类科研人员做这项工作,光是了解语料库A和B就需要花费大量的时间,更别提还得进一步做对比分析等工作了。

而D5任务之所以能够做得如此丝滑,是因为小哥他们在此背后还做了不少工作。

例如构建OpenD5元数据集,它包含符合D5任务的675个开放式问题,所涉及领域涵盖商业、社会科学、人文科学、健康和机器学习等。

并且每个开放式问题都会对应一个语料库对儿(语料库A和语料库B),平均有17000个样本。

小哥还把每个语料库中的50%作为研究部分,另外50%则是拿来做验证。

基于此,小哥他们再构建了一个“D5系统”,它的工作原理和人类从数据库中获取发现类似,分为两个阶段,即创造性地提出一个假设,再在数据集上严格验证这个假设。

按照这种思路,研究人员接下来用GPT-3做了次实验。

他们先是向GPT3展示研究目标和每个语料库中的一些样本,然后让它提出一个假设列表。

最终实验发现,GPT-3可以使用目标描述来提出更相关、更新颖、更有意义的假设。

也正因为OpenD5数据集所涵盖的领域众多,因此小哥表示他们的D5系统具备应用范围广的特点。

也存在一些缺陷

但对于这套D5系统,小哥也直言不讳地道出了它的缺陷。

例如,若是语料库中含有较多的俚语、俗语或者带有情绪的词汇,那么AI所给出的“发现”就会存在偏差。

简而言之,就是AI对于特定情况的词汇或描述产生了错误的理解和分析。

除此之外,小哥也表示更灵活的语料库、更具扩展性的系统,也是他们在未来重点研究的方向。

不过似乎这项研究让小哥也是兴奋不已,毕竟离他“构建一个用AI稿科研”的梦想更近了一步。

[1] https://arxiv.org/abs/2302.14233
[2] https://twitter.com/ZhongRuiqi/status/1631109680859865089?s=20

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
洛夫顿与卢伟发生口角后续!半场已沟通解决,赛后更衣室氛围很好

洛夫顿与卢伟发生口角后续!半场已沟通解决,赛后更衣室氛围很好

篮球资讯达人
2026-03-31 23:16:46
虎跳峡遇难独生子后续!遗体肉眼可见,还没捞上来,不是不想捞

虎跳峡遇难独生子后续!遗体肉眼可见,还没捞上来,不是不想捞

阿纂看事
2026-03-31 17:32:23
乞丐为何很少生病?道正一语道破:他们少了三样俗物,百邪不近身

乞丐为何很少生病?道正一语道破:他们少了三样俗物,百邪不近身

千秋文化
2026-02-13 18:55:13
奥运冠军“拉拉链露胸”,让耐克绷不住了!

奥运冠军“拉拉链露胸”,让耐克绷不住了!

品牌营销报
2026-02-23 11:31:10
郑钦文直接入围,世界第一萨巴再次开启卫冕之旅!

郑钦文直接入围,世界第一萨巴再次开启卫冕之旅!

网球之家
2026-03-31 22:23:21
唯一被灭亡的世界级宗教,曾在中国盛极一时,不少人知道它的名字

唯一被灭亡的世界级宗教,曾在中国盛极一时,不少人知道它的名字

凡人侃史
2026-03-31 12:20:37
特朗普放话“结束战争” 黄金涨破4600美元 美油跌破100美元

特朗普放话“结束战争” 黄金涨破4600美元 美油跌破100美元

每日经济新闻
2026-03-31 10:01:54
美媒爆料:伊朗打坏的E3不是一架而是俩

美媒爆料:伊朗打坏的E3不是一架而是俩

观察者网
2026-03-31 18:11:09
美联储,降息大消息!金银油,集体上涨!

美联储,降息大消息!金银油,集体上涨!

鲁中晨报
2026-03-31 15:49:02
中国石油董事长谈中东局势:通过霍尔木兹海峡进口的原油、天然气,约占公司经营总量的10%左右,因此公司油、气产业链能够保持稳定运营

中国石油董事长谈中东局势:通过霍尔木兹海峡进口的原油、天然气,约占公司经营总量的10%左右,因此公司油、气产业链能够保持稳定运营

潇湘晨报
2026-03-31 18:54:36
从迪拜回来,我才敢说:那里的富豪生活,跟你想的完全不一样

从迪拜回来,我才敢说:那里的富豪生活,跟你想的完全不一样

千秋文化
2026-03-30 20:41:04
SpaceX猎鹰重型炸场:3台发动机同时熄火,马斯克说「太美了」

SpaceX猎鹰重型炸场:3台发动机同时熄火,马斯克说「太美了」

野生运营
2026-03-31 07:36:59
“直接崩了,一天掉了一百多元!”有人疯狂抛售,国际巨头接连发布新技术……格局将被改变?

“直接崩了,一天掉了一百多元!”有人疯狂抛售,国际巨头接连发布新技术……格局将被改变?

都市快报橙柿互动
2026-03-29 12:26:05
上海男篮14连胜,卢伟赛后发言体现智慧,洛夫顿引卢伟不满被喷!

上海男篮14连胜,卢伟赛后发言体现智慧,洛夫顿引卢伟不满被喷!

中国篮坛快讯
2026-04-01 00:02:30
无缘世界杯的最贵球星:哈兰德2亿欧登顶,奥斯梅恩遗憾在列

无缘世界杯的最贵球星:哈兰德2亿欧登顶,奥斯梅恩遗憾在列

乐道足球
2026-03-31 17:38:59
广西岑溪市委书记上场踢“县超”,还佩戴了队长袖标

广西岑溪市委书记上场踢“县超”,还佩戴了队长袖标

澎湃新闻
2026-03-31 10:22:29
“黄毛的爹,酗酒的妈”,上海三口之家火了,只有孩子看着不叛逆

“黄毛的爹,酗酒的妈”,上海三口之家火了,只有孩子看着不叛逆

妍妍教育日记
2026-03-29 07:40:03
盘点:战争满30日,伊朗被斩首高官全名单!下一个会是谁?

盘点:战争满30日,伊朗被斩首高官全名单!下一个会是谁?

大江看潮
2026-03-30 10:03:00
鲁山舅舅娶亡姐大结局!新华社通报调查结果,这次终于真相大白了

鲁山舅舅娶亡姐大结局!新华社通报调查结果,这次终于真相大白了

青橘罐头
2026-03-31 07:11:50
石油还能用多久?人类每年消耗50亿吨,按照这个速度还够用吗?

石油还能用多久?人类每年消耗50亿吨,按照这个速度还够用吗?

蜉蝣说
2026-03-31 14:42:14
2026-04-01 02:51:00
量子位 incentive-icons
量子位
追踪人工智能动态
12386文章数 176434关注度
往期回顾 全部

科技要闻

华为2025年销售收入8809亿,净利润680亿元

头条要闻

伊朗总统:愿意结束战争 前提是诉求得到满足

头条要闻

伊朗总统:愿意结束战争 前提是诉求得到满足

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

《月鳞绮纪》空降 鞠婧祎却被举报偷税

财经要闻

油价暴涨 我们的生活成本会飙升多少?

汽车要闻

腾势Z9GT到底GT在哪?

态度原创

本地
时尚
游戏
公开课
军事航空

本地新闻

用Color Walk的方式解锁城市春日

「性治疗室」里的00后,男多女少

上一秒还在嘲笑瓦学弟,下一秒就去“抗癌”了

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:即使霍尔木兹海峡仍关闭 也愿意结束战争

无障碍浏览 进入关怀版