网易首页 > 网易号 > 正文 申请入驻

新研究让大模型学会主动追问,人机协作效果大幅提升

0
分享至

在写作等开放性任务中,AI 能跳出现有信息框架,提出类似人类的、甚至人类没有想到的建议吗?

在以往的研究中,AI 聊天机器人与用户的对话一般是被动的事实性问答,即对已有信息进行相关澄清和梳理。尽管可直接通过指令让 AI 提出解决方案,但其并不承担创造性任务。

在近期的一项研究中,研究人员为 AI 输出创造性内容提供了一种可能的方案。美国南加州大学与微软公司、加州大学戴维斯分校团队合作,引入了一种主动信息收集的任务范式,通过强化学习训练大语言模型,即便面对不完整或模糊的提示,大语言模型也可以主动识别信息缺口。

并且,基于特定问题主动挖掘用户隐含的信息或知识,通过提升模型在复杂、开放性任务中的协作能力,来更好地完成任务,特别是在社会科学、商业等深层次的上下文推理任务中具有优势。

可以这样来理解:面试者需要通过面试官提出有启发性的问题以及互动,才能更好地展示自身价值,让 AI 解读相对复杂文档的原理亦是如此。


图丨左至右依次是杨珑颀、黄腾昊、周沛和陈斯昊(来源:该团队)

相关论文以《教会语言模型主动收集信息》(Teaching Language Models To Gather Information Proactively)为题,已经被 EMNLP-Findings 2025 接收 [1]。南加州大学博士生黄腾昊(目前在微软实习)是第一作者,微软公司资深研究科学家周沛和陈斯昊担任共同通讯作者。


图丨相关论文(来源:EMNLP)

为确保模拟的模糊性既真实又可学习,研究团队基于涵盖 25 个专业领域、1,000 多条数据的 DOLOMITES 数据集进行测试,并设计了掩盖关键信息并模拟真实的模糊性的机制。

据介绍,在强化学习的奖励设计中,研究人员希望奖励机制更专注于“提出创造性问题”这一行为本身,而非具体问题的内容。重点在于鼓励模型提出在已有数据中不存在的新问题,并以此作为强化奖励的依据。


图丨主动澄清有助于实现最佳的大模型响应(来源:EMNLP)

陈斯昊指出,如果针对其中一个答案去做特定训练,并不会得到很好的泛化性。“我们的做法是将最终输出的评估作为奖励信号,相当于在机器学习时专门去学习怎样生成和人类标注出来的答案一样。最后,生成符合奖励模式的答案。”

研究人员将已有的数据转化成奖励信号,通过设计对话模拟引擎,把用来做监督学习的任务转变成对话形式。相当于两个 AI 之间通过互动的方式,一个 AI 提出澄清问题,另一个 AI 基于问题质量/回答有效性打分,进而获得奖励信号。


图丨评估框架下的实验结果(来源:EMNLP)

研究结果显示,经过该方法微调的 Qwen-2.5-7B 模型,在自动评估指标上比基线模型 o3-mini 提高了 18%;而在人类评估中,基于该方法生成的澄清问题以及最终大纲分别获得 42% 和 28% 的偏好率。


(来源:EMNLP)

该研究并不是简单地训练模型完成任务,而是通过奖励机制,让模型微调后提出建设性、启发性观点或前瞻性建议,进而展现出类人的系统性思考方式。

周沛对 DeepTech 解释道:“它具有很好的泛化性,相当于‘授人以鱼不如授人以渔’,即不是直接教 AI 该提什么问题、该给什么答案,而是教它主动发现信息缺口、提出创造性澄清问题的思考方式,从而靠自身的互动能力获得最优解。”

此外,基于该方法微调的模型不只是给出一个答案,它可能需要提出需要澄清问题,也有可能需要多核协作,甚至还可能需要质疑之前提出的假设是否有问题。

研究团队认为,这项研究本质上是在进行用户与 AI 之间的深度研究,通过对话同步上下文、缩小信息差。因为当 AI 和用户都更清楚最终输出的目标时,有利于后续的人机协作,从而创造性地完成更深度的任务。

这种主动信息收集的方法适用于开放性任务,例如包括文献综述和报告的写作任务,或布置画廊展览在内的场景。黄腾昊解释说道:“AI 本身可能在这些方面没有太多知识,需要和用户进行多轮对话和互动来获取新知识,再用这些新知识来解决新任务。”

此外,该方法还有可能推动人类和智能体互动的形式。例如,在 AI+教育场景应用中发挥作用,让 AI 在用户没有表达信息的情况下,主动引导学生向某个方向学习。

在人与 AI 互动中,补充信息差的方式有多种:一是让 AI 通过提出好问题来主动获取缺失信息;另一种是,在同步或非同步的场景下,模型可以通过给出提示协助获取其他信息。这也是研究团队未来将继续探索的方向之一。

参考资料:

1.https://arxiv.org/abs/2507.21389v1

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
志愿军被俘最高级将领,回国后遭开除党籍公职,离世后一个秘密让人潸然泪下

志愿军被俘最高级将领,回国后遭开除党籍公职,离世后一个秘密让人潸然泪下

文史明鉴
2026-01-28 19:27:09
10万亿度电需求停摆,中俄输电专线停运,国产电价教训太深刻

10万亿度电需求停摆,中俄输电专线停运,国产电价教训太深刻

老特有话说
2026-02-02 22:12:12
上期所沪银期货低开低走,触及跌停,跌幅20%

上期所沪银期货低开低走,触及跌停,跌幅20%

每日经济新闻
2026-02-02 21:12:03
卖袜子女主播,靠“大腿战术”爆火,这擦边球打的比袜子还滑溜!

卖袜子女主播,靠“大腿战术”爆火,这擦边球打的比袜子还滑溜!

达文西看世界
2026-01-31 12:00:50
2026年,东莞要开5座“王炸”商业项目

2026年,东莞要开5座“王炸”商业项目

赢商网新媒体
2026-02-02 20:47:37
“尼帕病毒”来势汹汹,建议:每家备好6样东西,关键时刻能救命

“尼帕病毒”来势汹汹,建议:每家备好6样东西,关键时刻能救命

路医生健康科普
2026-01-28 12:18:49
中概股,深夜大跌!

中概股,深夜大跌!

证券时报
2026-02-02 23:53:04
火箭控卫争议升级,首轮出局预言下的实力大考

火箭控卫争议升级,首轮出局预言下的实力大考

麦咪熊熊
2026-02-03 00:49:09
李亚鹏确认,靠卖北京房子和直播卖茶具,5000万债务已还清!

李亚鹏确认,靠卖北京房子和直播卖茶具,5000万债务已还清!

荆楚寰宇文枢
2025-12-31 21:55:47
金银“大跳水”下的深圳水贝市场:有档口单日卖出超200万元金条,有商家称银条不敢收“怕砸在手里”

金银“大跳水”下的深圳水贝市场:有档口单日卖出超200万元金条,有商家称银条不敢收“怕砸在手里”

红星新闻
2026-02-02 00:13:43
人民日报怒批!炫富、偷税749万、跑国外,现又来“割内地韭菜”

人民日报怒批!炫富、偷税749万、跑国外,现又来“割内地韭菜”

小熊侃史
2026-01-18 07:20:09
大s忌日现场揭幕雕像,网友吐槽“太丑”,这次谁也救不了具俊晔

大s忌日现场揭幕雕像,网友吐槽“太丑”,这次谁也救不了具俊晔

白面书誏
2026-02-02 23:04:30
吴京《镖人》被抵制,出现难堪一幕,李连杰成众矢之的,理由一致

吴京《镖人》被抵制,出现难堪一幕,李连杰成众矢之的,理由一致

漫婷侃娱乐
2026-01-23 13:00:01
离婚7年,王小玮高调官宣喜讯,让前夫王小海和凤凰传奇沉默了

离婚7年,王小玮高调官宣喜讯,让前夫王小海和凤凰传奇沉默了

白面书誏
2026-02-02 23:12:00
地主王学文救起晕倒的女红军,她拉开衣襟的那刻,王学文吓一跳

地主王学文救起晕倒的女红军,她拉开衣襟的那刻,王学文吓一跳

磊子讲史
2026-01-06 10:38:15
沪银期货主力合约打开跌停板

沪银期货主力合约打开跌停板

新京报
2026-02-02 23:33:07
孟豆状态回升,赛后荣膺最佳!天津锁定第五分组有利,但不可轻敌

孟豆状态回升,赛后荣膺最佳!天津锁定第五分组有利,但不可轻敌

金毛爱女排
2026-02-03 00:00:04
青岛假中医侯元祥案件被列入2025刑事民事执行典型案例

青岛假中医侯元祥案件被列入2025刑事民事执行典型案例

元爸体育
2026-02-02 19:39:00
总统是间谍?美国最新机密文件显示:特朗普是傀儡,早已被以色列收买

总统是间谍?美国最新机密文件显示:特朗普是傀儡,早已被以色列收买

不掉线电波
2026-02-01 15:52:15
【2026.2.2】爆姐的饭后爆料:生命不止,爆料不息!

【2026.2.2】爆姐的饭后爆料:生命不止,爆料不息!

娱乐真爆姐
2026-02-02 23:26:35
2026-02-03 04:55:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16213文章数 514584关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

江苏在建大桥垮塌致2死3失联 现场画面公布

头条要闻

江苏在建大桥垮塌致2死3失联 现场画面公布

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

家居
旅游
艺术
公开课
军事航空

家居要闻

现代几何彩拼 智焕童梦居

旅游要闻

解锁勐泐 4 大玩法,读懂真正的傣家风情!

艺术要闻

2026年,中国最值得期待的20个新建筑

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版