网易首页 > 网易号 > 正文 申请入驻

Rebuttal是带着镣铐舞蹈?港科RebuttalAgent心智理论读懂审稿人

0
分享至



面对同行评审,许多作者都有过这样的经历:明明回答了审稿人的每一个问题,态度也足够谦卑,为什么最终还是没能打动对方?

现有的通用大模型在处理这类任务时,往往陷入一种 “表面礼貌” 的陷阱:它们擅长生成流畅、委婉的 “Thank you for your insightful comment”,却缺乏对审稿人言外之意的深度洞察,导致回复虽然客气,但缺乏直击痛点的说服力。

究竟什么样的回复策略,才能在有限的篇幅内,有效消除误解、赢得共识?

针对这一问题,来自香港科技大学的研究团队提出了一种全新的框架 ——RebuttalAgent。该研究首次将认知科学中的心智理论(Theory of Mind, ToM)引入学术 Rebuttal 任务,让 AI 能够像资深学者一样 “读懂” 审稿人,从而生成兼具战略性与说服力的回复。

目前,该论文已被ICLR 2026接收。



  • 论文标题:Dancing in Chains: Strategic Persuasion in Academic Rebuttal via Theory of Mind
  • 论文链接:https://arxiv.org/pdf/2601.15715
  • 代码链接:https://github.com/Zhitao-He/RebuttalAgent

Rebuttal 需要怎样的博弈智慧?


在学术界的博弈论视角下,Rebuttal 是一个典型的“不完全信息动态博弈”(Dynamic Game of Incomplete Information)。作者不仅要面对审稿人显性的质疑,还要应对隐性的信息不对称,你不知道审稿人的知识背景、潜在偏见,也不知道你的解释会引发怎样的连锁反应。

现有的基于监督微调的模型,大多止步于对人类回复的‘语言学拟态’。它们精准复刻了礼貌的‘外壳’,却未能触及审稿人意图的‘内核’,即缺乏对审稿人的深度建模。 针对这一痛点,研究者提出了 RebuttalAgent,其核心洞察:有效的说服机制,必须建立在对他人的‘心智理论’建模之上。



图一:RebuttalAgent 框架总览图,展示 Data Preparation, TSR Framework 和 Agent Training 三个阶段

TSR 框架 —— 先 “读心” 再 “落笔”,

重构 AI 的思考链路


RebuttalAgent 并没有直接端到端地生成回复,而是模拟了人类专家的思维过程,通过ToM-Strategy-Response (TSR)框架来拆解这一复杂任务:

1. ToM(心智理论建模):不仅仅是读文本 AI 首先充当一名 “分析师”,对审稿意见进行分层剖析。

  • 宏观层面(Macro-level): 判断审稿人的整体立场(接受 / 拒绝)、态度(建设性 / 消极)以及领域专业度。
  • 微观层面(Micro-level): 拆解每一条评论背后的核心关切(是方法论缺陷?还是单纯的表达不清?)。 这种建模让 AI 不再盲目回复,而是先构建出审稿人的 “心理画像”。

2. Strategy(谋定而后动):基于上述画像,AI 会生成一个明确的战略计划。例如,面对一个 “专业度高但态度怀疑” 的审稿人,策略可能是 “先承认局限性以建立信任,再用补充实验数据进行强力反击”;而面对 “误解型” 评论,策略则是 “澄清概念,重述核心贡献”。

3. Response(精准打击):最后,AI 结合原始论文片段、战略计划和审稿人画像,生成最终的回复。



表一:评估的一致性:Rebuttal-RM 在对齐人类偏好上超越 GPT-4.1

无需外部导师,

“自我博弈” 中习得说服的艺术


为了训练这样一个能够 “运筹帷幄” 的 Agent,研究团队面临的最大挑战是数据的稀缺与主观性。为此,他们构建了RebuttalBench,包含超过 7 万条高质量的 “分析 - 策略 - 回复” 链条数据。

更进一步,研究者引入了Self-Reward 机制的强化学习策略。与传统的依赖外部奖励模型不同,RebuttalAgent 利用自身生成的评价信号进行迭代:

  • 格式与逻辑奖励: 确保 AI 真的在进行思考和布局,而不是形式主义。
  • 多样性奖励: 这是一个关键设计。为了防止 AI 偷懒生成 “万金油” 式的套话(如反复使用 "We thank the reviewer..." 模板),研究者设计了多样性惩罚,迫使模型探索更多样、更像人类专家的表达方式。

从 “辞藻堆砌” 到 “攻心为上”:

当 AI 学会了换位思考


为了量化评估效果,研究团队开发了Rebuttal-RM,这是一个专门针对学术反驳场景训练的奖励模型。在与人类专家评分的一致性测试中,Rebuttal-RM 的表现超越了 GPT-4.1。

在这一评估体系下,RebuttalAgent 展现出了显著优势:

  • 在综合得分上,RebuttalAgent 达到了9.42,显著优于 GPT-4.1 和 O3 。
  • 在说服力(Persuasiveness)这一核心指标上,提升尤为明显,表明引入 “心智理论” 确实增强了模型在观点交锋中的有效性。



表二:RebuttalAgent 与其他强基线的性能对比

“即插即用” 的思维外挂:

让小模型也能像专家一样思考

RebuttalAgent 生成的 “分析(Analysis)” 和 “策略(Strategy)” 是否具有普适性?研究者设计了一个巧妙的实验:将 RebuttalAgent 生成的策略作为上下文(Context),喂给参数量较小的基础模型(如 Qwen3-8B 和 Llama-3.1-8B),观察它们的表现变化 (Average Score)。

实验发现,这是一个通用的 “思维外挂”。仅需引入 RebuttalAgent 的策略指导,Qwen3-8B 在 “表达清晰度” 上的得分就暴涨了 21.0%,这有力地证明了 TSR 框架的可迁移性。



做科研路上的 “理性副驾驶”,

而非 “幽灵写手”


RebuttalAgent 的提出,展示了 LLM 在处理高阶认知任务,特别是涉及复杂人际博弈和战略沟通场景的巨大潜力。但 Agent 无法替你完成实验,也不会凭空捏造数据,模型在训练之初就刻意剥离了涉及实验结果生成的指令,杜绝了 “幻觉造假” 的可能。

  • 打破 “新手墙”:对于许多刚踏入学术圈的新手而言,面对犀利甚至尖锐的审稿意见,往往容易陷入恐慌或产生防御性心态。RebuttalAgent 的价值正是在于提供战略性的建议与实用的技巧,帮助作者克服情绪干扰,理清逻辑脉络,组织得体的语言。

  • 促进学术交流:论文的核心价值在于 “提升学术对话的清晰度与建设性”。它致力于消除因表达不当或沟通策略缺失而造成的误解,让审稿人与作者的对话回归真理本身,而非陷入情绪对抗或单纯的语言技巧博弈。

RebuttalAgent 本质上是对大语言模型在严重信息不对称条件下战略说服能力的一次探索性研究。最终的科学判断与责任,始终掌握在人类作者手中。

作者介绍:

何致涛,香港科技大学计算机系博士生,导师 Yi R. (May) Fung。曾在中国科学院自动化研究所、清华大学 AIR、蚂蚁集团从事研究,并在 ACL、NeurIPS、COLM、ICLR 等机器学习与自然语言处理顶级会议上发表多篇论文。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哪些酷刑是人类意志不能承受的?网友:人彘就是早期的感官剥夺!

哪些酷刑是人类意志不能承受的?网友:人彘就是早期的感官剥夺!

解读热点事件
2025-11-19 00:05:05
输球后福法纳落泪,默森:他应该哭,因为他们根本没拼过

输球后福法纳落泪,默森:他应该哭,因为他们根本没拼过

懂球帝
2026-02-04 09:33:06
留学一年嘴都变大了?女留学生“面相变化图”走红

留学一年嘴都变大了?女留学生“面相变化图”走红

没有偏旁的常庆
2026-02-02 06:10:03
笑不活了胡先煦!飞机上睡成“晕倒状”,空姐暖心上前关切

笑不活了胡先煦!飞机上睡成“晕倒状”,空姐暖心上前关切

陶寻爱说
2026-02-04 06:53:07
浙江女子200万巨款被“吃干抹净”事件:白手起家的孩子,一定要多长几个心眼子……

浙江女子200万巨款被“吃干抹净”事件:白手起家的孩子,一定要多长几个心眼子……

桌子的生活观
2026-02-03 12:26:18
卖地收入四年少4.6万亿,今年多省要涨

卖地收入四年少4.6万亿,今年多省要涨

谢晖说房
2026-02-03 19:30:04
张雪轩:辽宁省政府原副主席、辽宁省政协原副主席

张雪轩:辽宁省政府原副主席、辽宁省政协原副主席

王姐懒人家常菜
2026-02-04 10:39:51
38岁张馨予身体异常,警示中年女星健康重于金钱

38岁张馨予身体异常,警示中年女星健康重于金钱

孙镴北漂拍客
2026-02-04 07:28:22
别再聊戚薇金晨了!宋小宝600多刀微调真相才是真的绝

别再聊戚薇金晨了!宋小宝600多刀微调真相才是真的绝

乡野小珥
2026-02-03 01:22:50
双色球第2026015期中出一等奖5注筹集公益金1.29亿元

双色球第2026015期中出一等奖5注筹集公益金1.29亿元

齐鲁壹点
2026-02-04 15:26:13
定了!两大通信运营商合并,终于可以和老大势均力敌了

定了!两大通信运营商合并,终于可以和老大势均力敌了

通信老柳
2026-02-02 07:51:43
河南小伙娶小18岁伊拉克媳妇,认识4天就结婚,彩礼花了3000万!

河南小伙娶小18岁伊拉克媳妇,认识4天就结婚,彩礼花了3000万!

凡知
2026-01-17 10:15:33
王光美追悼会上刘源罕见失态,李讷见状嘱咐儿子:快去帮帮你刘叔

王光美追悼会上刘源罕见失态,李讷见状嘱咐儿子:快去帮帮你刘叔

搜史君
2026-02-03 18:50:05
学医后才明白,增强骨密度最好的运动,不是散步游泳,其实是它!

学医后才明白,增强骨密度最好的运动,不是散步游泳,其实是它!

路医生健康科普
2026-02-03 08:05:03
美国说中俄被吓住了,印度突然点头,可上合组织却悄悄扩员了。

美国说中俄被吓住了,印度突然点头,可上合组织却悄悄扩员了。

冒泡泡的鱼儿
2026-02-04 15:43:41
伊朗退了,叙利亚退了,巴勒斯坦退了,黎巴嫩退了,塞尔维亚退了

伊朗退了,叙利亚退了,巴勒斯坦退了,黎巴嫩退了,塞尔维亚退了

南权先生
2026-01-23 15:37:57
困守黑水营的八旗军有多狠?抓住敌人夫妇,先吃男人再吃女人!

困守黑水营的八旗军有多狠?抓住敌人夫妇,先吃男人再吃女人!

小豫讲故事
2026-02-04 06:00:24
1746个螺母判4年?五金老板崩溃:明明是玩具,法院说是枪支散件

1746个螺母判4年?五金老板崩溃:明明是玩具,法院说是枪支散件

云中浮生
2026-02-04 15:24:08
继承三亿后我装穷欠债,妻子骂完却掏出百万嫁妆:这债我们一起扛

继承三亿后我装穷欠债,妻子骂完却掏出百万嫁妆:这债我们一起扛

晓艾故事汇
2026-01-16 14:13:59
袁悦扔拍庆祝!3小时24分钟赢下马拉松大战,王欣瑜追平生涯最佳

袁悦扔拍庆祝!3小时24分钟赢下马拉松大战,王欣瑜追平生涯最佳

排球黄金眼
2026-02-04 00:37:45
2026-02-04 17:03:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12249文章数 142562关注度
往期回顾 全部

科技要闻

太烦人遭投诉!元宝红包链接被微信屏蔽

头条要闻

爱泼斯坦死前48小时签信托文件豪掷遗产 还和女友通话

头条要闻

爱泼斯坦死前48小时签信托文件豪掷遗产 还和女友通话

体育要闻

哈登回应交易:不想让自己拖累快船的未来

娱乐要闻

姜元来在大S墓碑前哭泣,与具俊晔拥抱

财经要闻

多家中小银行宣布上调存款利率

汽车要闻

全伪装雪地现身 一汽-大众纯电车型线索曝光

态度原创

数码
艺术
游戏
房产
军事航空

数码要闻

iPod拿到「复活剧本」,AI可能是最大亮点

艺术要闻

一篇文章看懂“传统吉祥图案”的寓意

AMD确认!Steam新主机推进顺利 仍计划年初发布

房产要闻

龙湖对面,突然要出新宅地!海口商改住又爆狠料!

军事要闻

卡扎菲儿子被暗杀:4名蒙面人员闯入住所

无障碍浏览 进入关怀版