网易首页 > 网易号 > 正文 申请入驻

AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%

0
分享至

  除论文格式调整与绘图外,内容全程无人工参与。

  大模型的发展落地日新月异,就在年初,业界还在担心AI生产的学术垃圾充斥论文库,年中,AI生成的论文已经可以被顶会认可了。

  5月29日,海外初创公司Intology 宣布,他们的“AI科学家”Zochi的论文被顶会ACL主会议录用,成为首个独立通过 A* 级别科学会议同行评审的AI,同时宣布开放Zochi的Beta 测试。

  这一发布的含金量在于,ACL是自然语言处理领域全球排名第一的顶会,其主会议平均录用率通常低于20%,论文需具备突破性创新。据悉,Zochi的论文获得评审最终评分4分,在所有投稿论文中排名前8.2%。

  Intology是一家较为陌生的初创公司,从目前官网和博客的信息梳理来看,这家公司是在2025年初新成立的,定位是一个研究智能科学的实验室,两名联创分别是连续创业者Ron Arel和前Meta华人研究员Andy Zhou,两人均毕业于伊利诺伊大学厄巴纳-香槟分校(UIUC)。

  Intology成立后,此前3月团队就推出了智能体Zochi,称其为AI科学家,并宣布其研究成果已被ICLR 2025研讨会接收。不过,此前的这一研讨会的论文接收率在60%-70%,要求比顶会的主会低了不少,官方认为,此次更进一步的顶会突破标志着AI达到博士级科研水平,人类博士通常需数年才能在此类会议发表。

  具体看此次AI科学家Zochi“写”的论文,主题是关于大模型安全的,名为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》,直译过来是《Tempest:基于树搜索的大模型自主多轮越狱》,简单来说,Zochi利用了一种“树搜索”技术,来探索多种对话路径,逐步突破大模型的安全防线。

  研究提出的Tempest框架,能通过多轮对话逐步瓦解模型的安全防线,绕过安全检测,通过小让步的累积完成违规的内容输出。例如,直接让模型回答敏感信息“制作炸弹”,基于安全机制模型会直接拒绝,但通过多轮委婉地引导提问,最终却可以让模型回答出正确的信息。

  评估结果显示,Tempest在OpenAI的旧模型GPT-3.5-turbo上的成功率为100%,在GPT-4上的成功率为97%。这一研究主要是揭示了多轮对话攻击的漏洞,可以为设计更佳的AI安全防御提供参考。

  值得一提的是,论文的署名是两位联创,但官方博客表示,除论文格式调整与绘图外,内容全程无人工参与,“我们对这项工作负责,但主要的智力贡献是由AI系统完成的” 。

  据官方介绍,人类仅输入研究领域,Zochi就可以独立完成后续全流程。Zochi 首先会采集并分析数千篇研究论文,以确定特定领域内有潜力的研究方向。其检索系统能够识别文献中的关键贡献、方法论、局限性以及新兴模式,识别论文之间不明显的联系,并提出创新的解决方案。从提出假设到完成实验,就像一个真正的科学家。

  AI科学家并非个例,除了Intology外,Transformer作者Llion Jones去年创立的Sakana AI,也推出了一个基于AI的科研系统“AI Scientist”,论文也已被ICLR 2025研讨会接收,分数为6/7/6。

  AI for Science(AI4Science)一直是AI行业最前沿的落地领域之一,人工智能可以极大地促进科学的进步,提高科学家的效率、准确性和创造力。不过,新事物的出现也伴随着合理性和规则适配的争议。

  此前3月Intology 推出Zochi、宣布论文被会议接收时,就被不少学术界人士批评,认为这是对科学同行评审过程的滥用,在提交论文前,团队并未知会相关方是AI生成的论文,也未获得同行评审者的同意。

  在此次博客最后,官方提到了AI带来的学术伦理问题,认为AI驱动的研究给科学问责和可重复性带来了挑战。但他们认为,虽然 Zochi 自主运营,但人类研究员仍然是作者,并负责验证方法、解释结果并确保符合伦理规范。对于论文,人类作者进行多轮内部审查,并在提交前仔细核实了所有结果和代码。

  “我们鼓励在致谢中列出AI系统,而不是将其列为作者。虽然AI驱动的研究提出了关于归属、透明度和问责制的重要问题,但我们认为,智力贡献应该以实质内容而非来源来评判。”Intology官方表示,他们的主要关注点是通过AI工具协助人类研究者。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
已打完广东最后一场?球队落后,玩手机漠不关心,解说员:不应该

已打完广东最后一场?球队落后,玩手机漠不关心,解说员:不应该

理工男评篮球
2026-02-06 22:21:18
东北释放冰雪经济“热动能”

东北释放冰雪经济“热动能”

新华社
2026-02-06 14:44:38
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
12月6日北京雪飞天!苏翊鸣最后一跳绝杀日本选手夺冠

12月6日北京雪飞天!苏翊鸣最后一跳绝杀日本选手夺冠

林子说事
2026-02-06 19:02:58
爱泼斯坦那座岛上,真的“吃人”吗?

爱泼斯坦那座岛上,真的“吃人”吗?

基本常识
2026-02-05 23:02:46
卡里克:多古会缺阵很久;梅努抓住了机会,相信他能保持下去

卡里克:多古会缺阵很久;梅努抓住了机会,相信他能保持下去

懂球帝
2026-02-07 07:16:41
2026年第一批韭菜:被埋在白银巨坑里

2026年第一批韭菜:被埋在白银巨坑里

说财猫
2026-02-06 20:50:51
有机会卖到日本的电车起火,东风奕派禁言了评论区

有机会卖到日本的电车起火,东风奕派禁言了评论区

源Auto
2026-02-05 15:56:21
经济下行,很多公司已经不把员工当人看了!

经济下行,很多公司已经不把员工当人看了!

黯泉
2026-02-06 23:43:43
日本东京发布警报

日本东京发布警报

吉刻新闻
2026-02-06 16:01:40
10个最常被误用的汉语典故,错了几千年!

10个最常被误用的汉语典故,错了几千年!

每日一首古诗词
2026-01-10 12:17:01
网红“神药”更新说明书:可能影响性功能

网红“神药”更新说明书:可能影响性功能

南方都市报
2026-02-06 09:29:02
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
谁碰中巴项目灭谁?瓜达尔港遇袭,48小时击毙177人,中方4字回应

谁碰中巴项目灭谁?瓜达尔港遇袭,48小时击毙177人,中方4字回应

快看张同学
2026-02-06 16:25:35
“顺丰速孕”无底线擦边不是幽默表达 | 新京报快评

“顺丰速孕”无底线擦边不是幽默表达 | 新京报快评

新京报评论
2026-02-06 15:55:55
2025年中国综合经济实力TOP20城市排名

2025年中国综合经济实力TOP20城市排名

格上理财网
2026-02-06 21:06:04
未来大学生的出路,大概率只剩下这三条了…建议收藏

未来大学生的出路,大概率只剩下这三条了…建议收藏

小鬼头体育
2026-02-06 10:32:44
不向中国供货,代价来了!

不向中国供货,代价来了!

荆楚寰宇文枢
2026-02-06 23:09:13
她10年前为中国短道夺金创历史 却连续3届冬奥最后一刻落选

她10年前为中国短道夺金创历史 却连续3届冬奥最后一刻落选

篮球看比赛
2026-02-06 17:48:12
让“油电混动技术”悲哀的是:打败了所有对手,却输给了时代!

让“油电混动技术”悲哀的是:打败了所有对手,却输给了时代!

张鴘喜欢软软糯糯
2026-01-15 19:22:59
2026-02-07 08:24:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2140408文章数 5385关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

大V称生活被助理"复制":她在我家穿我的衣服拍照

头条要闻

大V称生活被助理"复制":她在我家穿我的衣服拍照

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜抢C风波 杨幂工作室9字讨说法

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

艺术
时尚
数码
本地
军事航空

艺术要闻

过年,邻居家贴的对联,差点没把我笑死……

豆瓣8.5分,人美剧甜衣品好,小韩拍恋爱剧还是有两把刷子

数码要闻

【IT之家开箱】罗技GPW5雪豹电竞鼠标图赏,业界首发可调电磁微动

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

军事要闻

美国“肯尼迪”号核动力航母完成首次海试

无障碍浏览 进入关怀版