网易首页 > 网易号 > 正文 申请入驻

ToMAP:赋予大模型「读心术」,打造更聪明的AI说服者

0
分享至

本文第一作者为韩沛煊,本科毕业于清华大学计算机系,现为伊利诺伊大学香槟分校(UIUC)计算与数据科学学院一年级博士生,接受 Jiaxuan You 教授指导。其主要研究方向为:大语言模型的安全性及其在复杂场景中的推理。

说服,是影响他人信念、态度甚至行为的过程,广泛存在于人类社会之中。作为一种常见而复杂的交流形式,这一颇具挑战的任务也自然地成为了日趋强大的大语言模型的试金石。

人们发现,顶尖大模型能生成条理清晰的说服语段,甚至在 Reddit 等用户平台以假乱真,但大模型在心智感知方面的缺失却成为了进一步发展说服力的瓶颈。

成功的说服不仅需要清晰有力的论据,更需要精准地洞察对方的立场和思维过程。这种洞察被心理学称为「心智理论」(ToM),即认识到他人拥有独立的想法、信念和动机,并基于此进行推理。这是人类与生俱来的认知能力,而大模型在对话中却往往缺乏心智感知,这导致了两个显著的缺陷:

  • 模型往往仅围绕核心论点展开讨论,而无法根据论点之间的联系提出新的角度;
  • 模型往往仅关注并重复己方观点,而无法因应对方态度变化做出策略调整。

为解决这一问题,伊利诺伊大学香槟分校的研究者提出了 ToMAP(Theory of Mind Augmented Persuader),一种引入「心智理论」机制的全新说服模型,让 AI 更能「设身处地」从对方的角度思考,从而实现更具个性化、灵活性和逻辑性的说服过程。

  • 论文标题:ToMAP: Training Opponent-Aware LLM Persuaders with Theory of Mind
  • 论文地址:
  • https://arxiv.org/pdf/2505.22961
  • 开源代码仓库:
  • https://github.com/ulab-uiuc/ToMAP

ToMAP:知己知彼,百战不殆

ToMAP 创新性地在说服者框架中引入两大心智模块:反驳预测器和态度预测器。

反驳预测器模拟人类在说服中主动预判对方可能持有的反对观点。本文发现,大模型说服者本身就具备反驳预测的能力,只需要通过提示词设计「激活」这一能力即可。定性与定量分析显示,基于模型生成的反驳观点与真实被说服者的观点在语义上高度相似。这让说服者在对话中占据「先发优势」,从而主动化解对方的疑虑。在主张「素食食谱」的例子中,反驳预测器能主动识别出「烹饪麻烦」「味道不好」等对方反对素食的理由,构建出围绕核心论点的复合关系。

仅仅识别反论点并不能刻画复杂对话中的态度变化,因此,态度预测器进一步评估对手对上述反论点的态度——是坚定认可,还是中立或已被说服?该模块以对话历史和论点为输入,利用 BGE-M3 文本编码器与多层感知机(MLP)分类器,在对话过程中动态估算对方对各个论点的态度倾向,使说服者能有的放矢地展开论证。

实验表明,预测器在 5 点预测上的表现显著优于直接使用大模型推理。例如,在上图的对话中,对方已经认可素食对健康的好处,却提到其并不「享受」素食。这说明其很可能对素食的味道持保留态度,为下一轮的说服侧重点提供了关键线索。

两大预测器的引入使得说服者在作出决策时掌握更为丰富的信息:其不仅能预知对方可能的反驳意见,还能动态评估对方心理状态。这有利于其设计更多样化、有针对性的对话,切实有效地影响对方观点。

然而,LLM 本身未必能有效利用这些信息,为了充分发挥上述模块的优势,ToMAP 采用了强化学习(RL)方法,通过大量对话对模型进行训练。在每轮对话中,模型会根据「说服力得分」进行奖励,该得分衡量的是对方在一轮交互前后态度的变化。为避免重复、冗长、格式不当等问题,训练还引入了格式奖励、重复惩罚、超长惩罚等辅助信号,帮助模型生成通顺、有说服力的对话。

实验分析:运筹帷幄,策略制胜

本文在多种数据集与对手模型上对说服者模型进行了系统测试,评估对手模型在 3 轮对话前后的态度转变。

结果显示,基于 Qwen-2.5-3B 的ToMAP 模型显著优于基线模型和无心智模块的 RL 版本。值得注意的是,尽管 ToMAP 仅使用 3B 参数的小模型,其性能却超越了多种参数规模更大的模型,包括 GPT-4o 与 DeepSeek-R1。这说明即使是规模较小的模型,在合适的训练配方和模块设计的加持下,也能展现出惊人的说服力。

回顾 ToMAP 模型的训练轨迹,我们得以一窥其能力增长背后的原理。从图中可以看出,在说服奖励不断增加的过程中,ToMAP 的重复度惩罚始终保持在较低水平,说明心智模块的信息有效地提高了模型输出的多样性。

另外,在对话长度相对稳定的条件下,ToMAP 的思考长度显著高于基线,表明 RL 赋予了模型深度思考策略的能力,具有不可或缺的作用。另外,ToMAP 更倾向于使用理性和有针对性策略,而非空洞的情绪煽动或权威引用——策略的改进正是其说服力提升的重要原因。

我们还发现,ToMAP 在长对话中依然稳定提升说服力。基准模型和常规 RL 模型在早期几轮对话中效果较好,但随着对话轮次增加,说服力趋于饱和甚至下降;相比之下,ToMAP 在 10 轮对话中依然保持稳定增长,显示出优秀的策略调整能力和论点的多样性。

结语:为 AI 注入「人性认知」的火花

本研究提出了 ToMAP,一种融合心智理论的 AI 说服框架,致力于解决当前大语言模型在说服任务中缺乏对手建模与策略灵活性的问题。论文通过「反论点预测器」模拟人类预判异议的能力,通过「态度预测器」感知对方态度的细微变化,使 AI 在说服过程中更加敏锐与应变。通过精心设计的强化学习机制,促进模型生成内容多样、结构规范、逻辑清晰的高质量论证。

ToMAP 不仅提升了模型的说服能力,在多个数据集和模型组合中显著超越强大基线,更是在大模型「心智建模」方向上迈出的重要一步。通过主动理解对方认知结构与态度倾向,ToMAP 展现出初步的「社会认知」特征,使得语言模型在复杂交互任务中更具人性化与策略性。

总之,ToMAP 不仅是一种有效的说服者训练框架,更是推动 AI 迈向具备「类人思维模式」的创新尝试,为构建可信、灵活的 AI 交流系统提供了坚实基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
38岁德约快哭了 长时间埋头 眼含热泪受访:重返澳网决赛太不真实

38岁德约快哭了 长时间埋头 眼含热泪受访:重返澳网决赛太不真实

我爱英超
2026-01-30 23:19:40
特朗普听取多种打击伊朗方案

特朗普听取多种打击伊朗方案

每日经济新闻
2026-01-30 12:56:54
刘强东母亲让人泪目,她和奶茶妹妹根本就不是同一个世界的人!

刘强东母亲让人泪目,她和奶茶妹妹根本就不是同一个世界的人!

小娱乐悠悠
2026-01-30 08:58:00
1970年江青哥哥带儿子来北京,江青得知对方想见自己后:这事难办

1970年江青哥哥带儿子来北京,江青得知对方想见自己后:这事难办

南书房
2026-01-31 06:00:10
特朗普这回踩到“地雷”了,犹太集团突然下场,伊朗不打也得打了

特朗普这回踩到“地雷”了,犹太集团突然下场,伊朗不打也得打了

去山野间追风
2026-01-31 09:31:27
本菲卡能做到吗?皇马队史唯一一次无缘欧冠16强在1962年

本菲卡能做到吗?皇马队史唯一一次无缘欧冠16强在1962年

懂球帝
2026-01-30 20:54:47
这算不算是顶级阳谋?修建厦金大桥台当局不同意,我们是照修不误

这算不算是顶级阳谋?修建厦金大桥台当局不同意,我们是照修不误

百态人间
2026-01-29 16:04:26
CCTV5直播!中国金花冲澳网冠军 赢球=197万奖金 数据证明稳夺冠

CCTV5直播!中国金花冲澳网冠军 赢球=197万奖金 数据证明稳夺冠

侃球熊弟
2026-01-31 00:40:03
每年报废百万吨!旧铁轨为啥不回收重铸,而是用土埋掉?

每年报废百万吨!旧铁轨为啥不回收重铸,而是用土埋掉?

心中的麦田
2026-01-28 20:56:41
国家下狠手了!体制内大地震,少爷、公主们的“天”,要塌了

国家下狠手了!体制内大地震,少爷、公主们的“天”,要塌了

霹雳炮
2026-01-19 22:24:13
一句话戳破牢A,不过是收割韭菜的最新一把镰刀

一句话戳破牢A,不过是收割韭菜的最新一把镰刀

壹家言
2026-01-30 21:48:40
全明星新秀赛对阵:G联赛队对阵拥有弗拉格和克林根的安东尼队

全明星新秀赛对阵:G联赛队对阵拥有弗拉格和克林根的安东尼队

懂球帝
2026-01-31 09:57:12
“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

复转这些年
2026-01-27 03:00:03
廖锡龙将军去世!他曾怒骂谷俊山:我死都不怕,还怕一个贪官?

廖锡龙将军去世!他曾怒骂谷俊山:我死都不怕,还怕一个贪官?

帝哥说史
2026-01-29 22:15:39
回暖别急!辽宁2月天气走向如何?

回暖别急!辽宁2月天气走向如何?

辽宁卫视
2026-01-31 06:32:09
四分之一的以色列儿童生活在贫困线以下,月收入低于7940元每人

四分之一的以色列儿童生活在贫困线以下,月收入低于7940元每人

桂系007
2026-01-30 20:27:24
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
提前受死?美军公海挑衅中国海军,不料先手优势几秒内就丧失

提前受死?美军公海挑衅中国海军,不料先手优势几秒内就丧失

卷史
2026-01-28 10:32:16
大妈花50万买基金,账号忘了15年,孙子找回看到余额,全家愣住了

大妈花50万买基金,账号忘了15年,孙子找回看到余额,全家愣住了

黄家湖的忧伤
2025-08-12 17:05:12
糖尿病患者别自己吓自己了,若这4个指标正常,基本不会有并发症

糖尿病患者别自己吓自己了,若这4个指标正常,基本不会有并发症

健康之光
2026-01-23 11:25:06
2026-01-31 10:31:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12225文章数 142557关注度
往期回顾 全部

科技要闻

中国车企和特斯拉的下一战,战场已定

头条要闻

牛弹琴:战争脚步又逼近一些 真可能这个周末就见分晓

头条要闻

牛弹琴:战争脚步又逼近一些 真可能这个周末就见分晓

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

成龙入驻小红书,怼脸近照没有老年斑

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

家居
教育
时尚
艺术
数码

家居要闻

蓝调空舍 自由与个性

教育要闻

无痛背英语之犀牛哥闪亮登场!

女友BELLA+封面 | Ginny&Jayna:连锁反应

艺术要闻

仅3秒认全14字草书,赵孟頫书法为何备受争议?

数码要闻

英伟达推出RTX Remix Logic:无代码动态MOD创作

无障碍浏览 进入关怀版