网易首页 > 网易号 > 正文 申请入驻

ChatGPT修bug横扫全场,准确率达78%!网友:程序员要开心了

0
分享至

金磊 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT到底有多会修bug?

这事终于有人正儿八经地搞研究了——

来自德国、英国的研究人员,专门搭了个“擂台”来检验ChatGPT的这项本领。

除了ChatGPT之外,研究人员还找来了其它三位修bug的“AI猛将”,分别让它们修复40个错误代码。

结果真是不比不知道,一比吓一跳。

ChatGPT准确修复了其中31个bug,遥遥领先第二名(21个),直接拿下“AI修bug界”的SOTA成绩!

于是乎,这项研究引来了众多网友的围观和讨论,Reddit上发布此帖的标题更是用上了“小心”“注意”这样的字眼:

但事实上,这真的会让程序员“危”吗?

我们不妨先来看下这项研究。

很会修bug的ChatGPT

虽然ChatGPT并非是为了专门修改bug而生,但自打它问世以来,不少网友们都发现它是具备这项能力的。

因此研究人员为了摸清ChatGPT到底能修改bug到什么程度,便引入了标准的错误修复基准集QuixBugs来进行评估。

以及与它同台竞技的AI选手,分别是CodeXCoCoNutStandard APR

研究人员从QuixBugs中挑了40个问题,分别让它们来修复bug。

让ChatGPT来修bug的方法,就是在对话框里向它提问:

这个代码有什么错误吗?

在第一轮较量过后,结果如下:

从第一轮battle结果来看,ChatGPT修复了19个,CodeX修复了21个,CoCoNut修复了19个,Standard APR则是7个。

而且研究人员还发现,ChatGPT的答案与CodeX最为相似;这是因为它俩是来自同一个语言模型家族。

这时候就会有小伙伴要问了,“ChatGPT不是还没有CodeX厉害吗”。

别急,不要忘了,ChatGPT的一个特点就是越问越“上道”。

例如在这个基准集中,有一个叫bitcount的问题,ChatGPT在刚才第一轮修复过程中是给出了错误的答案:

原本ChatGPT应该将第7行的 n ^ = n - 1 改为 n & = n - 1。

但在第一轮中它的回答是:

如果没有更多关于预期行为和导致问题的输入信息,我无法判断程序是否存在错误。

于是在给予它更多信息之后,ChatGPT便答对了这个问题。

以此类推,在对第一轮没答对的问题进行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:

最终,ChatGPT在QuixBugs的40个问题里答对了31个。

网友忧喜参半

对于这样的实验结果,网友们对ChatGPT修bug拿下SOTA这事产生的态度却不太一样。

有网友认为这事不应该让程序员感到危机,而是会让他们觉得开心才对。

言外之意,便是程序员们有了这么好用的工具,干活儿就会变得事半功倍。

不过也有人对此给出了不一样的看法:

工作变得简单,不也就意味着需要的人力更少了吗?

但还有网友觉得,活儿是干不完的:

即使AI能把开发时间缩短一个数量级,也只是意味着程序员将更快处理下一个工作。

整体来看,ChatGPT很会修bug,并不会给程序员带来什么致命伤害。

但若是把目光放到OpenAI其他的行动中呢?

全球招外包训练ChatGPT写代码

在此之前,OpenAI就表示过ChatGPT的重要用途之一是帮助程序员检查代码

换言之,它被定位可用的辅助工具

相比“ChatGPT带来威胁”的看法,等ChatGPT能力彻底进化,程序员都不用再怕写bug了。

OpenAI布局的棋盘上,可不只有改bug偷塔程序员岗位这一件事。

为了让它更大更强,OpenAI被曝在拉美和东欧等地区,提供了1000个外包岗位

外包员工的主要工作是标注数据,以及训练ChatGPT写代码

这1000人中,40%是程序员,他们为OpenAI的模型创建数据,用来学习软件工程任务。

一直以来,OpenAI的训练数据是从GitHub上抓取的。

现在外包程序员们新手搓的数据集,不仅包括代码行,还包括代码行背后的人类思考逻辑步骤

有位南美的软件开发人员爆料,他为OpenAI完成了五小时的无偿编码测试。

整个过程中,他的任务分为两部分。

  • 用书面英语解释如何处理一个编码问题;
  • 提供解决方案。

如果发现bug,OpenAI会向他详细询问bug的具体情况,并请教如何修正。

程序员需要展示思考问题的每个步骤,他据此猜测OpenAI很可能想为ChatGPT提供非常具体的训练数据。

特斯拉前AI主管Andrej Karpathy在推特上调侃:

最新的热门编程语言是英语。

不过话说回来,ChatGPT修bug能力强是好事,要真能搞进化到可以完成代码里死记硬背的部分,也是好事。

毕竟OpenAI成立时对外宣称的宗旨,就是希望“确保通用人工智能可以造福全人类”。

虽然乍一看它这些年做的事,有点像在致力于用一部分人的努力,让更多人失业

从Dota2赛场上碾压人类,到GPT-3、DALL-E2、ChatGPT的闪耀表现,它带来的新产品总是伴随着“快要让xxx失业了”的议论声。

但无论如何,商业却一直对它青睐有加。

就目前而言,OpenAI的主要商业模式是API费用、token费用和软件许可。

OpenAI近期还发布了ChatGPT的付费版ChatGPT Pro,每月费用42美元(约合285元人民币)。

虽然机器人对话初创公司如雨后春笋般冒出,但诸多迹象表明市场对OpenAI的持续看好。

微软刚刚宣布将向OpenAI加码投资数十亿美元,并将OpenAI的模型融入微软必应等消费级和企业级产品中。

根据知情人士透露,此次追加投资数额约为100亿美元。

与此同时,WSJ披露的消息显示,1月初,亿万富翁Peter Thiel创立的风投基金Founders Fund正在就投资OpenAI进行谈判。

据悉,融资金额将至少达3亿美元

One More Thing

在第一轮实验中,ChatGPT并没有解决QuixBugs数据集的bitcount问题。

但若是你现在再重头问一次这个问题,就会发现ChatGPT可以“一遍过”:

那么这是否意味着ChatGPT已经从这次研究过程中学会求解了呢?

[1] https://arxiv.org/abs/2301.08653
[2] https://www.pcmag.com/news/watch-out-software-engineers-chatgpt-is-now-finding-fixing-bugs-in-code
[3] https://www.reddit.com/r/technology/comments/10oaw6n/watch_out_software_engineers_chatgpt_is_now/
[4] https://en.wi.bwl.uni-mainz.de/dominik-sobania/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陕西省地级(含)以上市现任书记、市长

陕西省地级(含)以上市现任书记、市长

久念娱乐
2023-03-31 00:24:22
撤档避开阿凡达,成龙吴京新片再定档4月7日,结果又撞好莱坞新片

撤档避开阿凡达,成龙吴京新片再定档4月7日,结果又撞好莱坞新片

惊奇电影局
2023-03-29 13:52:14
值得同情吗?台妹长文哭诉:霍华德说他在台湾只有我一个宝贝

值得同情吗?台妹长文哭诉:霍华德说他在台湾只有我一个宝贝

鳄鱼的分享
2023-03-29 20:58:03
亲热时总有噗噗声,蒙圈了

亲热时总有噗噗声,蒙圈了

荷兰豆爱健康
2023-03-30 23:54:47
乌纠集20万人欲反攻,普京反手下令增产核战轰,已做好硬仗准备

乌纠集20万人欲反攻,普京反手下令增产核战轰,已做好硬仗准备

霹雳火军事
2023-03-27 23:56:53
联合国前秘书长潘基文要求中国管管朝鲜, 不要“挑衅”韩国!

联合国前秘书长潘基文要求中国管管朝鲜, 不要“挑衅”韩国!

甜城王小坤
2023-03-30 11:27:57
北大金融师弟频繁发“腹肌照”,师姐无奈拉黑,公司处理结果来了

北大金融师弟频繁发“腹肌照”,师姐无奈拉黑,公司处理结果来了

雯雯教育说
2023-03-30 12:44:44
独行侠不敌76人队后,欧文说我会充分利用休假时间考虑自己的未来

独行侠不敌76人队后,欧文说我会充分利用休假时间考虑自己的未来

天羽看球
2023-03-31 02:30:42
拜登心都碎了!美企相继翻脸,中国正式表态后,ASML赢麻了

拜登心都碎了!美企相继翻脸,中国正式表态后,ASML赢麻了

地铁音乐分享
2023-03-31 00:42:56
我怀疑宋冬野吸毒把脑子吸坏了

我怀疑宋冬野吸毒把脑子吸坏了

奶一口烦恼
2023-03-30 10:20:02
深圳最惨赌狗!赌拆迁,2年时间亏掉600万!

深圳最惨赌狗!赌拆迁,2年时间亏掉600万!

萝妹看社会
2023-03-31 00:04:23
丁俊晖剑指冠军,狂轰单杆满分147分,塞尔比9-5豪夺4个赛点

丁俊晖剑指冠军,狂轰单杆满分147分,塞尔比9-5豪夺4个赛点

全能体育柳号
2023-03-31 05:42:26
俄不愿退步,向世界宣布对中国“下手”,中国计划被迫中断

俄不愿退步,向世界宣布对中国“下手”,中国计划被迫中断

常高俊April
2023-03-29 09:15:02
女孩遭到男上司潜规则,男上司:脱你裤子,只是想试试能不能睡你

女孩遭到男上司潜规则,男上司:脱你裤子,只是想试试能不能睡你

社会故事集
2023-03-30 11:07:28
涅波姆尼亚奇:俄罗斯队值得找中国队热身,中国队水平不及日韩

涅波姆尼亚奇:俄罗斯队值得找中国队热身,中国队水平不及日韩

直播吧
2023-03-30 09:51:05
匈牙利这个总统比欧尔班强太多了

匈牙利这个总统比欧尔班强太多了

凡事一定有办法13119
2023-03-30 12:10:59
“手贱把系统改成了阿拉伯文,然后什么东西都是从右往左了!”

“手贱把系统改成了阿拉伯文,然后什么东西都是从右往左了!”

相声段子超市
2023-03-30 07:31:15
上楼梯被野生的「三上悠亚」挡住!超性感蕾丝露「水蜜桃」爆击!

上楼梯被野生的「三上悠亚」挡住!超性感蕾丝露「水蜜桃」爆击!

冯新明说说
2023-03-30 19:53:07
沈腾北京豪宅曝光,14万一平俯瞰东直门,装修豪华被吐槽没烟火气

沈腾北京豪宅曝光,14万一平俯瞰东直门,装修豪华被吐槽没烟火气

盖饭娱乐官方号
2023-03-30 22:24:11
王思聪:餐厅与老板娘合影!军人站姿太抢镜,亲密合影脸羞得通红

王思聪:餐厅与老板娘合影!军人站姿太抢镜,亲密合影脸羞得通红

花生米的影视
2023-03-28 08:43:22
2023-03-31 09:24:49
量子位
量子位
追踪人工智能动态
7687文章数 171887关注度
往期回顾 全部

科技要闻

再分拆两公司上市 刘强东将"手握"7家上市公司

头条要闻

媒体:蔡英文窜美被羞辱 下飞机时的红毯仅有四五米长

头条要闻

媒体:蔡英文窜美被羞辱 下飞机时的红毯仅有四五米长

体育要闻

FIFA游戏的无解bug 究竟是何方神圣?

娱乐要闻

女星红毯再比美:李小冉杨超越谁赢?

财经要闻

汽车要闻

MG7上市售11.98万起 2.0T+9AT/零百加速6.5s

态度原创

时尚
艺术
本地
家居
手机

原来中国风还能玩出这些花样?!

艺术要闻

“佐临奖”四年后再颁奖,徐峥现场提议增加新奖项

本地新闻

财神殿前长跪不起的年轻人,人均带身份证开光

家居要闻

打通隔断引光入室,赋予家光的灵魂

手机要闻

小米13 Ultra下周预热,上半年最强拍照手机要来了?

无障碍浏览 进入关怀版