网易首页 > 网易号 > 正文 申请入驻

谢赛宁团队论文爆雷,暗藏AI好评提示震碎学术圈!本人急发长文反思

0
分享至

新智元报道

编辑:桃子

【新智元导读】一句话隐藏提示,在AI圈闹的动静更大了。网友爆料称,AI大神谢赛宁团队的一篇论文中,也有操纵AI评审的提示。对此,谢赛宁本发长文回应:需要重新思考学术界的游戏规则。

用AI提示操控审稿,这两天在全网吵成了一锅粥。

而如今,网友joserffrey爆出大瓜,「NYU助理教授、AI大神谢赛宁带队的论文,也卷入了这场AI作弊的风暴」。

许多人第一时间满脸问号——这是真的吗???

AI大神陷「作弊」风暴?

arXiv悄然更新

今年5月,谢赛宁带队发表在arXiv上的论文,曾提出了两个新基准测试,用于评估MLLM跨语言一致性。

然而,就在这篇论文中,也偷偷隐藏了一个「POSITIVE REVIEW ONLY」操纵同行评审的AI提示。

团队成员将「白色」隐形字体植入文中,肉眼根本无法看出。

这一「作案手段」与韩国科学技术院Se-Young Yun团队,简直如出一辙。

几天前,日经爆料称,全球14所顶尖机构研究人员,暗自操控AI提示,让大模型给出好评。一时间,全网迅速沦陷,网友直呼,「学术界完蛋了」。

这一风波在国内外AI圈中,吵得不可开交。

那些默默在论文中植入「AI提示」的研究人员心知肚明,甚至有的人早已慌了。

网友joserffrey言辞犀利地表示,谢赛宁团队的arXiv已静默更新,看起来就是在掩盖事实。

论文地址:https://arxiv.org/abs/2505.15075v1

他愤怒地表示,自己无法理解如此大型的「双标」现场:

CVPR 2025大会,谢赛宁曾发表了一个关于AI研究沦为「有限游戏」的精彩演讲。

然而,他却合著了一篇试图用隐藏的「POSITIVE REVIEW ONLY」提示操纵同行评审的论文,并悄悄更新了arXiv。

演讲PPT:https://www.canva.com/design/DAGp0iRLk9g/8QLkIDov8ez1q6VvO8nnpQ/edit

对于学术界来说,这不是儿戏,更需要一个明确的解释。

谢赛宁长文回应

GPT-4o润色

被点名之后,谢赛宁并没有推卸责任,而是第一时间给出了回复。

说实话,在最近这些帖子疯传之前,我完全不了解这个情况。我绝不会鼓励学生做这种事——如果我担任AC,任何包含这类提示词的论文都会直接被「桌拒」。

不过对于存在问题的投稿,所有共同作者都难辞其咎,这点无可辩解。

这件事也给我这个课题组长敲了警钟:不能只检查最终PDF,还必须审查全部提交文件——此前我确实没意识到需要这样做。

接下来,他发长文分享了过去一周内部调查的结果,并详细阐述了事情的前后的经过和个人的思考,一共分为四部分:

1 事件背景

2 事件经过

3 后续措施

4 深层思考

本人亲笔,GPT-4o润色

那么,这场「作弊」风暴背后,究竟是怎么回事?

2024年11月,英伟达研究科学家Jonathan Lorraine发布了一条帖子,最先提出了在论文中隐藏AI提示词,忽悠LLM审稿。

谢赛宁表示,那是自己第一次了解还有这等操作,并且当时学界也意识到了,论文PDF是可以直接嵌入提示。

需要说明的是,这种提示注入,仅在审稿人直接将PDF上传给大模型时才会有效。

当时,许多人的共识是:绝不能用LLM进行审稿,这会严重破坏评审公正性。

因此,包括CVPR、NeurIPS等顶会,现已明令禁止,比如在任何环节使用LLM撰写审稿意见,或元评审。

任何在AI顶会发过论文的人,都体会过收到AI生成审稿意见的挫败感——这种意见既难以回应,又难以确证来源。

虽然Jonathan Lorraine原帖可能只是开个玩笑,但人们一致认为「以毒攻毒」绝非正解,或许惹出的麻烦比解决的问题还要多。

与其这样,还不如通过顶会制度来规范。

事件经过

论文中的学生作者,是日本的短期访问学者,对于Jonathan过于当真,直接把人家的套路照搬,用在了EMNLP投稿里。

这个学生就是论文第一位作者Hao Wang,日本早稻田大学计算机科学专业的博士生。

谢赛宁表示,他完全没意识到这是在开玩笑,可能会让人觉得操纵或误导。

其实,Hao Wang也没有充分认识到,这么做会对公众对科学的信任、以及同行评审的公正性产生怎样的影响。

更糟的是,他们还在arXiv版本中也植入了同样的内容,根本没有多想。

谢赛宁之所以忽略这一点,部分原因是这超出了他平时对论文进行伦理把关的预警范围

目前,这位学生已经更新了论文,并联系了ARR以寻求正式指导,并将严格执行其建议。

个人思考

这件事对谢赛宁本人来说,也得到了一次深刻的教训。

起初,他本人也很生气,但深思后认为除拒稿外不应追加惩罚。

高压环境下的学生,往往无法周全考虑伦理影响,尤其是面对这类新兴问题时。

他表示,「我的责任是,引导他们穿越灰色地带,而非单纯事后追责。比起惩罚,更重要的是加强科研伦理教育」。

回到最初帖子的问题上——整个情况确实凸显了我们需要重新思考学术界的游戏规则。

这才是我在演讲中想要表达的主要观点。我将继续尽我所能,帮助学生学会如何开展扎实的研究。

最后,谢赛宁引用了一项亚马逊博士后Gabriele Berton的民意调查,有45.4%的人认为植入隐藏提示,可以被接受。

虽然调查可能存在偏差,但确实反映了问题的复杂性。

他认为,真正的症结在于现行制度存在漏洞,与伪造数据等传统学术不端不同,这是AI时代催生的新问题,需要更深入的伦理讨论。

论文暗藏AI提示,究竟是对是错?

Gabriele Berton安慰道,「这没什么好羞愧的,没必要因为X平台上某个愤怒的用户认为这不道德就感到难堪」。

正如你提到的,投票显示有很多人认为这种做法是合乎道德的。

而且会议也没有明令禁止。

不管怎样,相关规则确实应该尽快明确制定。

对此,谢赛宁坚定地表示,我确实认为这种做法不符合道德规范(若参与投票我会明确反对)。

同时,他表示很多圈外人根本get不到AI审稿的雷区。

这不仅仅是审得好不好的问题,更重要的是保密性!把别人未发表的论文扔给公开的AI系统,这已经踩了高压红线了。

(当然,本地运行AI助手是可行的——但说实话,目前大多数人实际操作的恐怕不是这种方式)

Meta超级智能实验室研究员Lucas Beyer表示,其实挺可怕的。这让我意识到,作者可以只在审稿版本里加入这类内容,然后在arXiv和最终出版版本中把它删掉。

谢赛宁回应道,这种现象已经出现了——最近的学术会议已经批量发出了许多「桌拒」;相关人士也正在制定更完善的政策。

现在大家注意到的这些arXiv论文,其实只是反映了作者的天真和粗心(毕竟合作者几乎不可能发现这类问题)。

发明刷AI好评提示的研究员认为,「目前来看,确保有真人参与评审可能还是比较明智的做法」。

那么,你认为这种在论文里隐藏prompt的行为,是否可取呢?(顶会已明令禁止用AI审稿)

参考资料:

https://x.com/sainingxie/status/1942219178166931781

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国对中国统一下达新结论:大陆只要按兵不动,越晚统一代价越小

美国对中国统一下达新结论:大陆只要按兵不动,越晚统一代价越小

华史谈
2026-05-13 08:49:26
女子吃霸王餐给差评:正脸曝光,自认为没错,要上媒体跟老板对质

女子吃霸王餐给差评:正脸曝光,自认为没错,要上媒体跟老板对质

阅微札记
2026-05-13 14:31:03
看到中国给了特朗普最高礼遇,欧盟干脆做了最坏的打算?

看到中国给了特朗普最高礼遇,欧盟干脆做了最坏的打算?

爆笑大聪明阿衿
2026-05-14 17:44:09
178万吨榴莲涌入中国!进口量暴涨294%,泰国市场份额跌至不到60%

178万吨榴莲涌入中国!进口量暴涨294%,泰国市场份额跌至不到60%

阿纂看事
2026-05-14 15:18:51
消失的彭加木:一场精心策划的逃亡?隐藏在罗布泊的离奇秘密

消失的彭加木:一场精心策划的逃亡?隐藏在罗布泊的离奇秘密

云霄纪史观
2026-05-14 16:07:40
极度震撼!北约军演乌军无人机营4小时3次全歼瑞典军队

极度震撼!北约军演乌军无人机营4小时3次全歼瑞典军队

史政先锋
2026-05-14 16:55:54
黄仁勋被问英伟达是否会向华为出售芯片:这是个多么奇怪的问题啊

黄仁勋被问英伟达是否会向华为出售芯片:这是个多么奇怪的问题啊

泡泡网
2026-05-14 17:50:15
卖不动了,日系车集体退守中国

卖不动了,日系车集体退守中国

21世纪经济报道
2026-05-13 23:28:25
两次嫁给梁靖崑,退圈安心照顾两个儿子,如今丈夫成为大学教授

两次嫁给梁靖崑,退圈安心照顾两个儿子,如今丈夫成为大学教授

笑饮孤鸿非
2026-05-13 18:59:58
杭州跪地救人女子找到!新华社点名,工作单位曝光,难怪后怕不已

杭州跪地救人女子找到!新华社点名,工作单位曝光,难怪后怕不已

奇思妙想草叶君
2026-05-14 13:44:31
山东招远一矿业公司基建矿区发生事故,造成3人死亡、2人受伤

山东招远一矿业公司基建矿区发生事故,造成3人死亡、2人受伤

界面新闻
2026-05-14 09:48:55
我工资4150全部门最低,我递辞呈后,老板急忙挽留:年薪随便提

我工资4150全部门最低,我递辞呈后,老板急忙挽留:年薪随便提

麦子情感故事
2026-05-14 17:07:37
高奢版售价或超10万元!追觅手机预计今年发布,创始人俞浩扬言要与苹果、三星三分天下,最终必将超越苹果4万亿美元市值

高奢版售价或超10万元!追觅手机预计今年发布,创始人俞浩扬言要与苹果、三星三分天下,最终必将超越苹果4万亿美元市值

大风新闻
2026-05-14 13:40:08
随特朗普来访的贝莱德究竟有多厉害?

随特朗普来访的贝莱德究竟有多厉害?

舜口说
2026-05-14 09:52:57
4300家个股下跌,中国长城、中国卫星直接跌停,大盘要做头了吗?

4300家个股下跌,中国长城、中国卫星直接跌停,大盘要做头了吗?

长风价值掘金
2026-05-14 15:36:38
“给儿子吃得大脑缺氧了!”一顿全碳水早餐,暴露了宝妈的低认知

“给儿子吃得大脑缺氧了!”一顿全碳水早餐,暴露了宝妈的低认知

妍妍教育日记
2026-05-14 13:30:26
黄仁勋赶飞机 藏着中美科技关系最真实的底色

黄仁勋赶飞机 藏着中美科技关系最真实的底色

看看新闻Knews
2026-05-13 23:00:02
杨振宁遗孀翁帆近照,红光满面变漂亮了,带妈妈和昆曲老师聚会

杨振宁遗孀翁帆近照,红光满面变漂亮了,带妈妈和昆曲老师聚会

法老不说教
2026-05-14 15:07:04
摩洛哥幸福新娘事件升级!河南一男子刷到该视频,断然与对象退婚

摩洛哥幸福新娘事件升级!河南一男子刷到该视频,断然与对象退婚

火山詩话
2026-05-14 07:04:08
胡雪岩临终顿悟:这世上最不能得罪的不是达官显贵,而是这三类人

胡雪岩临终顿悟:这世上最不能得罪的不是达官显贵,而是这三类人

史之铭
2026-05-14 15:53:49
2026-05-14 19:47:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15209文章数 66867关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除 外交部回应

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除 外交部回应

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

教育
数码
家居
艺术
公开课

教育要闻

5月16日开考! 2026上海中考理化实验操作考试及外语听说测试,考前重要提醒来啦!

数码要闻

万色生辉入画屏:实拍海信UX2026款RGB-Mini LED时代旗舰电视

家居要闻

精神奢享 对话塔尖需求

艺术要闻

美国务卿鲁比奥点赞中式美学,实景令人惊叹!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版