网易首页 > 网易号 > 正文 申请入驻

哈佛博士用一万篇Nature论文训练GPT-2写摘要,网友直呼生成的太假了!

0
分享至

新智元报道

来源:Nature

编辑:LRS

【新智元导读】Reddit上又一个论文自动生成的帖子火了!哈佛一个博士用一万篇Nature论文训练GPT-2模型来自动生成摘要,还发布了一个小游戏Engima,允许用户判断两个摘要哪个是生成的,有网友觉得一眼假,还有网友认为生物领域根本看不懂!

哈佛一个小哥用GPT-2模型训练了一万篇Nature论文来写论文的摘要。

根据这个模型生成的摘要,开发了一个小游戏Enigma,让用户来判断哪个是真实的摘要,哪个是生成的。

这个字谜游戏的名字取自恩尼格玛密码机,它是对二战时期纳粹德国使用的一系列相似的转子机械加解密机器的统称。

游戏的模式分为Easy和Hard。

例如下面这个Hard例子,左面的是真实的论文摘要,而右面的则是生成的,你看出来了吗?

由于论文涉及的领域大多数是Nature相关的,区分真实和虚假依赖于领域知识,而GPT-2生成的文本大多在逻辑上可能会有一些问题,所以对于行外人来说这个游戏大多等于随机猜。

切换到Easy模式也并没有觉得变简单。。

作者在网页中也说明,Hard模式使用更大的模型,生成的摘要也更加有信服度。

有Reddit网友也表示,希望有一些机器学习相关的摘要,生物领域实在是看不懂!网友表示赞同,熟悉这个领域的太容易看出来是假的了!

还有网友说这游戏太离谱了,越像胡说八道的,越是学术界写出来的论文:

这个小游戏的作者是Stefan Zukin,从哈佛大学毕业的博士生,主要研究领域为化学生物。

论文自动生成

早在2005年,论文自动生成器SCIgen就开始研究这个课题,它能够自动生成无意义的英文计算机科学研究论文,并且包含图片、表格、流程图和参考文献等。这个程序使用用户定制的上下文无关文法来生成论文的各类组成元素。

在当时还没有强大的深度学习模型,只能依靠手工规则。

SCIgen由美国麻省理工学院计算机科学与人工智能实验室的三位研究生杰里米·斯特里布林(Jeremy Stribling)、马克斯·克伦(Max Krohn)和达纳·阿瓜约(Dan Aguayo)编写,源代码以GPL协议发布。

2005年,SCIgen的编写者们将他们使用这个工具生成的Rooter: A Methodology for the Typical Unification of Access Points and Redundancy一文投往该年度的World Multiconference on Systemics, Cybernetics and Informatics,WMSCI,被成功录用为未经同行评审文章,并且作者被邀请到会议上发言。

后来,伦斯勒理工学院、华盛顿大学等的研究人员开发的PaperRobot,提供从产生 idea、写摘要、写结论到写 “未来研究” 的一站式服务!甚至它还能为你写出下一篇论文的题目,从此论文无忧。

PaperRobot: Incremental Draft Generation of Scientific Ideas这篇论文在ACL2019一发表,就引起了大量关注。

谷歌大脑科学家 David Ha (hardmaru) 评价:「May a thousand (incremental) ideas bloom. 」

PaperRobot 的工作流程包括:

(1) 对目标领域的大量人类撰写的论文进行深入的理解,并构建全面的背景知识图 (knowledge graphs, KGs);

(2) 通过结合从图注意力 (graph attention) 和上下文文本注意力 (contextual text attention),从背景知识库 KG 中预测链接,从而产生新想法;

(3) 基于 memory-attention 网络,逐步写出一篇新论文的一些关键要素:从输入标题和预测的相关实体,生成一篇摘要;从摘要生成结论和未来工作;最后从未来工作生成下一篇论文的标题。

研究者对这个 AI 论文生产机还进行了图灵测试:

PaperRobot 生成生物医学领域论文的摘要、结论和未来工作部分,同时展示人类写作的同领域论文,要求一名生物医学领域的专家进行比较。结果显示,分别就摘要、结论和未来工作部分而言,在30%、24% 和12% 的情况下人类专家认为 AI 生成的比人类写作的更好。

至于这批 AI 研究人员为什么选择生物医学领域来做实验,原因很简单:生物医学论文很多,非常多!他们尝试了用自己领域 (NLP) 来做实验,结果并不理想 (NLP 的论文语料还不够多)。

参考资料:

https://stefanzukin.com/enigma/

https://www.reddit.com/r/MachineLearning/comments/nb9ifz/p_enigma_gpt2_trained_on_10k_nature_papers_and_an/

听Bengio讲深度学习!图灵奖得主David Patterson等200+AI领袖分享!| 2021智源大会来了

MIT发布首个贝叶斯「数据清洗」机器人!8小时洗200万条数据

责任编辑:曹逸群_NB19194

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
长征结束后,徐海东请毛主席吃饭,主席看到饭菜:你们日子真壕

长征结束后,徐海东请毛主席吃饭,主席看到饭菜:你们日子真壕

历来纵横
2026-06-17 16:35:13
水泥封杀丈夫,强酸融情夫命根,勾魂夺命“黑寡妇”有何致命魅力

水泥封杀丈夫,强酸融情夫命根,勾魂夺命“黑寡妇”有何致命魅力

易玄
2026-07-03 02:07:16
西班牙6月上千人因高温死亡!中国空调、电扇企业加班赶订单

西班牙6月上千人因高温死亡!中国空调、电扇企业加班赶订单

山西晚报
2026-07-02 12:46:16
78岁张廷玉被抄家,36万两白银被搜出,不久后乾隆:快,还回去

78岁张廷玉被抄家,36万两白银被搜出,不久后乾隆:快,还回去

芊芊子吟
2026-07-04 09:05:13
我升任连长后,部队女通讯员向我表白,结婚后才发现她的真实身份

我升任连长后,部队女通讯员向我表白,结婚后才发现她的真实身份

千秋文化
2026-07-03 19:10:55
1951年,戴笠独子被处决,蒋介石两年后下令:他的子孙全接回台湾

1951年,戴笠独子被处决,蒋介石两年后下令:他的子孙全接回台湾

古书记史
2025-12-11 17:37:45
电影口碑扑街,导演凌晨发文甩锅,实在本末倒置

电影口碑扑街,导演凌晨发文甩锅,实在本末倒置

草莓解说体育
2026-07-04 14:57:26
内塔尼亚胡时代恐结束!以色列前总参谋长参选,对华态度已曝光

内塔尼亚胡时代恐结束!以色列前总参谋长参选,对华态度已曝光

董董历史烩
2026-07-04 13:25:18
中俄都来吊唁,但最该来的人没来,伊朗知道这时候必须稳住阵脚

中俄都来吊唁,但最该来的人没来,伊朗知道这时候必须稳住阵脚

小杨历史
2026-07-04 10:31:46
中国44年来首次试射洲际导弹,全球反应堪比好莱坞大片

中国44年来首次试射洲际导弹,全球反应堪比好莱坞大片

烽火三月佳人三千
2026-06-25 14:21:42
0时0分准时生效,中国领空收费,日本财政恐爆雷,高市开始自救

0时0分准时生效,中国领空收费,日本财政恐爆雷,高市开始自救

小兰聊历史
2026-07-04 10:22:32
给泰山安装刀片刺网,在古代要被砍头

给泰山安装刀片刺网,在古代要被砍头

黔有虎
2026-07-03 16:49:25
对日稀土管制重拳落地,日本企业面临停产?中国底牌在手何须动武

对日稀土管制重拳落地,日本企业面临停产?中国底牌在手何须动武

月下守候
2026-07-04 14:27:00
张兰带玥儿逛三里屯,搂着玥儿高兴的合不拢嘴,玥儿新发型很好看

张兰带玥儿逛三里屯,搂着玥儿高兴的合不拢嘴,玥儿新发型很好看

阿废冷眼观察所
2026-07-04 00:41:55
虽败犹荣!佛得角40岁门将彻底封神,阿根廷主教练赛后评价太真实

虽败犹荣!佛得角40岁门将彻底封神,阿根廷主教练赛后评价太真实

伴史缘
2026-07-04 10:56:14
家庭存款300万,2026年处于什么层次?能 “躺平”吗?

家庭存款300万,2026年处于什么层次?能 “躺平”吗?

平说财经
2026-07-02 23:02:32
真正淘汰赛来了!世界杯16强全部出炉:阿根廷上上签,法国闯难关

真正淘汰赛来了!世界杯16强全部出炉:阿根廷上上签,法国闯难关

衣衫褴褛的文人
2026-07-04 12:54:06
开窍最快的方式,是去做这7件事

开窍最快的方式,是去做这7件事

洞见
2026-07-03 10:19:58
世界杯16强出炉(附对阵图、比赛时间)

世界杯16强出炉(附对阵图、比赛时间)

南方都市报
2026-07-04 12:01:37
佩林卡这手太脏了!送走艾顿换来哈迪,一石三鸟把浓眉老詹全算尽

佩林卡这手太脏了!送走艾顿换来哈迪,一石三鸟把浓眉老詹全算尽

涵有话说
2026-07-04 13:40:03
2026-07-04 15:48:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15603文章数 66945关注度
往期回顾 全部

教育要闻

复读薅奖金高考被玩出新花样

头条要闻

投资4000万游乐园被拆设备拉走 原为当地招商引资项目

头条要闻

投资4000万游乐园被拆设备拉走 原为当地招商引资项目

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

最富女歌手霉霉完婚 在纽约设宴庆贺

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

科技要闻

韬定律论文V2版,充工程细节和实测数据

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

房产
本地
游戏
公开课
军事航空

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

本地新闻

国内足球之旅?这座小城给你高分答案

《GTA6》PS联动仅一周下架!停盘争议连累宣发?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京宣布俄军“完全解放”卢甘斯克

无障碍浏览 进入关怀版