网易首页 > 网易号 > 正文 申请入驻

新加坡大学发现机器也需要"适可而止"的智慧

0
分享至


这项由新加坡大学的卢炯宇(Hyung Gyu Rho)研究员完成的突破性研究于2025年10月发表在arXiv预印本平台,论文编号为arXiv:2510.04087v1。对于想要深入了解这项研究的读者,可以通过该编号查询完整论文原文。

当我们要求AI语言模型给出答案时,系统通常会生成多个候选回答,然后从中挑选最好的一个。这就像是在多个选择题答案中选择正确的那一个。然而,研究人员发现了一个令人意外的问题:当AI生成更多候选答案时,它反而更容易选择错误的答案。这就好比一个学生面对越来越多的错误选项时,反而更容易被误导选择"相对不那么错"的答案,而不是真正正确的答案。

这个现象就像是在一群表现都不好的学生中选班长一样。当候选人数量增加时,你可能会选到那个"看起来最不坏"的人,但这个人其实根本不适合当班长。AI语言模型在面对复杂问题时也会遇到类似困境:它们会从一堆质量都不高的答案中选择相对较好的那个,但这个答案可能仍然达不到基本的可接受标准。

研究团队通过大量实验证实了这个问题的严重性。他们发现,当AI系统从1个候选答案增加到32个候选答案时,选择错误答案的情况竟然增加了一倍多。这个发现对于那些依赖AI系统提供准确信息的应用场景来说是个重大警报,比如客服机器人、医疗咨询系统等。

为了解决这个问题,研究团队开发了一套全新的AI训练和评估方法。他们的核心创新在于教会AI系统不仅要判断哪个答案更好,还要判断哪个答案是真正"够好"的。这就像教会一个评委不仅要从参赛者中选出相对最佳的,还要判断这个最佳选手是否真的达到了参赛标准。

这套新方法的巧妙之处在于引入了"拒绝选项"。在传统的AI训练中,系统只能在给定的答案中选择,就像强制性的单选题。而新方法允许AI说"这些选项都不够好",就像在选择题中增加了"以上皆非"的选项。通过这种方式,AI学会了区分"相对较好"和"绝对够好"之间的关键差别。

研究团队基于这个核心思想设计了一个名为"迷你批次循环"的智能策略。这个策略不再是一次性生成大量候选答案然后挑选,而是像分批次考试一样:先生成一小批答案,检查是否有足够好的答案,如果有就立即采用,如果没有就继续生成下一批。这种方法既提高了答案质量的可靠性,又大大节省了计算资源。

更令人兴奋的是,这套方法可以根据不同的应用需求进行调整。对于那些对准确性要求极高的场景,比如法律咨询或医疗建议,系统可以设置很高的标准,宁可拒绝回答也不提供可能错误的信息。而对于那些对速度要求更高的场景,比如文档摘要或创意写作辅助,系统可以采用相对宽松的标准,在保证基本质量的前提下快速给出回答。

在具体的实验验证中,研究团队使用了电影评论数据进行测试。他们让AI系统学会识别积极的电影评论,然后测试不同策略的效果。结果显示,采用新方法的"可靠性守护模式"能够将错误接受率降低70%,这意味着系统犯错的概率大大降低。同时,"速度优化模式"能够将平均响应时间缩短22%以上,在保证答案质量的前提下显著提升了效率。

这项研究的理论基础来源于经济学中的"离散选择模型"。这个模型最初用于分析消费者的购买决策,比如当面对多种商品时,消费者如何在"购买商品A"、"购买商品B"或"什么都不买"之间做选择。研究团队巧妙地将这个理论应用到AI系统的决策过程中,让AI学会了"什么都不选"这个重要选项。

从技术实现的角度来看,研究团队设计了一套数学模型来量化答案的"绝对质量"而不仅仅是"相对质量"。他们假设每个答案都有一个内在的质量分数,当这个分数超过某个阈值时,答案就被认为是可接受的。通过大量的人工标注数据,他们训练出了能够准确预测这种绝对质量的评估模型。

在实际应用中,这套方法表现出了令人印象深刻的适应性。研究团队发现,当面对特别困难的问题时,传统方法会"硬着头皮"给出一个答案,即使这个答案质量很差。而新方法会识别出这种情况,要么继续寻找更好的答案,要么诚实地表示"这个问题超出了我的能力范围"。

这种"知道自己不知道"的能力对于AI系统的可信度来说至关重要。在现实应用中,一个会承认自己局限性的AI系统往往比一个总是强行给出答案的系统更值得信赖。这就像一个医生说"我需要进一步检查才能确诊"比盲目下结论要负责任得多。

研究团队还发现了一个有趣的现象:当AI系统生成的候选答案质量普遍较高时,引入"拒绝选项"的效果并不明显,因为大多数答案都已经达到了可接受的标准。但当面对困难问题导致候选答案质量普遍较低时,这个机制就显得格外重要。这说明该方法具有很好的自适应性,会在最需要的时候发挥作用。

从计算效率的角度来说,新方法的"早退机制"带来了意想不到的好处。传统方法需要生成所有候选答案后再进行选择,而新方法一旦找到满意的答案就立即停止。这就像在商场购物时,一旦找到心仪的商品就立即购买,而不是逛完所有商店后再做决定。实验结果显示,这种策略在保证质量的同时平均节省了22%的计算时间。

研究团队特别强调了他们方法的理论严谨性。他们从数学角度证明了为什么传统的"最佳选择"策略在面对困难问题时会失效。简单来说,当所有候选答案质量都不高时,选择其中相对最好的那个并不意味着选择了一个绝对好的答案。这个洞察虽然听起来简单,但在AI系统设计中却经常被忽视。

这项研究还揭示了AI训练数据中一个重要但常被忽视的信号。在传统的训练方法中,如果人工标注者选择"以上选项都不好",这样的数据通常会被丢弃,被视为"无效数据"。然而,新研究发现这些"拒绝数据"实际上包含了关于质量标准的宝贵信息,应该被纳入训练过程而不是被丢弃。

从更广泛的应用前景来看,这套方法对于构建更加可靠的AI系统具有重要意义。在自动驾驶、医疗诊断、金融决策等高风险应用中,AI系统的"拒绝回答"能力可能比"强行给出答案"更加重要。一个能够识别自己能力边界的AI系统在这些关键应用中会更加安全和可信。

研究团队还讨论了他们方法的局限性和未来改进方向。目前的实验主要集中在文本生成任务上,未来需要验证该方法在图像、音频等其他模态上的效果。此外,如何在更复杂的多轮对话场景中应用这套方法也是一个有待探索的问题。

这项研究的另一个重要贡献是提供了一套系统性的评估框架。研究团队不仅开发了新的训练方法,还设计了相应的评估指标来衡量AI系统的"绝对质量判断能力"。这些指标包括精确率、召回率和误报率等,为未来的相关研究提供了标准化的评估工具。

值得注意的是,这种方法还可以与现有的其他AI优化技术相结合。比如,可以与"推测性拒绝采样"等技术结合使用,进一步提升效率。研究团队认为这种组合应用代表了未来AI系统优化的一个重要方向。

总的来说,这项研究解决了当前AI语言模型中一个基础但关键的问题。通过教会AI系统区分"相对好"和"绝对好",研究团队为构建更加可靠、高效的AI系统铺平了道路。这不仅是一个技术突破,更是AI系统设计理念的一次重要转变:从"总是给出答案"转向"给出好答案或诚实承认不知道"。

这种转变对于AI技术的实际应用具有深远影响。它意味着未来的AI助手将更加诚实和可靠,用户可以更加信任AI系统的回答,同时也知道什么时候应该寻求人工帮助。这种平衡对于AI技术的健康发展和广泛应用来说都是至关重要的。

Q&A

Q1:什么是"迷你批次循环"方法?它是如何工作的?

A:迷你批次循环是一种新的AI答案生成策略。它不再一次性生成大量候选答案,而是分批次进行:先生成少量答案,检查是否有足够好的答案,如果有就立即采用,如果没有就继续生成下一批。这样既能提高答案质量又能节省计算资源。

Q2:为什么AI生成更多候选答案反而容易选错?

A:当AI面对困难问题时,生成的候选答案质量普遍较低。候选答案越多,AI越容易从一堆不够好的选项中选择"相对最不坏"的那个,但这个答案可能仍然达不到基本的可接受标准。就像在一群表现都不好的候选人中选择一样,数量增加并不能保证质量。

Q3:这项研究对普通用户使用AI有什么影响?

A:未来的AI系统将更加诚实可靠。它们不仅能给出更准确的答案,还会在不确定时坦诚承认"不知道",而不是强行给出可能错误的答案。这意味着用户可以更加信任AI的回答,同时也能更清楚地知道什么时候需要寻求人工帮助。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗武装部队向以色列发射新一轮导弹

伊朗武装部队向以色列发射新一轮导弹

财联社
2026-03-26 19:42:42
4000万求购罗马指挥官,国米为齐沃新思路“拼了”

4000万求购罗马指挥官,国米为齐沃新思路“拼了”

里芃芃体育
2026-03-26 11:15:07
在哪一瞬间,对你老公彻底失望了?网友:强行分居两年,然后离婚

在哪一瞬间,对你老公彻底失望了?网友:强行分居两年,然后离婚

另子维爱读史
2026-03-24 21:15:00
4月1日起,微信支付宝转账规则大变!这3个习惯赶紧改

4月1日起,微信支付宝转账规则大变!这3个习惯赶紧改

老特有话说
2026-03-25 15:30:13
掀掉洋葱顶,整治宗教泛滥的第一步

掀掉洋葱顶,整治宗教泛滥的第一步

黑哥讲现代史
2026-03-14 15:46:38
我发现一个真相:资本爱找孙颖莎代言,根本不只是因为她有流量,

我发现一个真相:资本爱找孙颖莎代言,根本不只是因为她有流量,

小光侃娱乐
2026-03-25 13:40:05
净利润暴跌90%!理想的销量神话破灭

净利润暴跌90%!理想的销量神话破灭

大佬灼见
2026-03-13 12:23:26
扎心!俄爱国军事博主摊牌:再征40万大军也白搭,战场早已变天!

扎心!俄爱国军事博主摊牌:再征40万大军也白搭,战场早已变天!

老马拉车莫少装
2026-03-25 07:41:30
王楚钦师娘爆料!孙颖莎无论是长相性格还是人品,都是无以伦比的

王楚钦师娘爆料!孙颖莎无论是长相性格还是人品,都是无以伦比的

大中国
2026-03-24 15:25:36
卡塔尔正式宣布暂停跟中国的合同,而且短时间内不会恢复

卡塔尔正式宣布暂停跟中国的合同,而且短时间内不会恢复

南权先生
2026-03-25 15:19:55
49岁翁帆突传“喜讯”!丧夫5个月后高调露面,状态好到出人意料

49岁翁帆突传“喜讯”!丧夫5个月后高调露面,状态好到出人意料

查尔菲的笔记
2026-03-16 19:12:07
中共中央批准,开除刘慧党籍

中共中央批准,开除刘慧党籍

新京报政事儿
2026-03-26 17:13:05
人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

掠影后有感
2026-03-26 10:39:36
哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

说历史的老牢
2026-03-26 01:18:38
小米捷报,误伤宁德时代

小米捷报,误伤宁德时代

ZAKER新闻
2026-03-26 22:10:32
2-0晋级八强!中国女网15岁新星连续爆冷真猛:下一轮对决王曦雨

2-0晋级八强!中国女网15岁新星连续爆冷真猛:下一轮对决王曦雨

李喜林篮球绝杀
2026-03-26 17:04:26
美军发布战果,摧毁中国产战机,伊朗空军损失殆尽

美军发布战果,摧毁中国产战机,伊朗空军损失殆尽

爱吃醋的猫咪
2026-03-22 22:29:08
看了“秦岚”的穿搭,我悟了:灰色不配亮色、白色,才更时髦减龄

看了“秦岚”的穿搭,我悟了:灰色不配亮色、白色,才更时髦减龄

蓓小西
2026-03-23 08:31:26
倒计时36天预警!黄金或迎抛售潮,多国限金条出口,中国已抢先布局

倒计时36天预警!黄金或迎抛售潮,多国限金条出口,中国已抢先布局

哄动一时啊
2026-03-26 20:23:42
富人的生活能有多夸张?网友:根本找不到心动还门当户对的人

富人的生活能有多夸张?网友:根本找不到心动还门当户对的人

带你感受人间冷暖
2026-03-27 00:05:14
2026-03-27 01:35:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7765文章数 556关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
亲子
艺术
健康
公开课

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

亲子要闻

看看把孩子吓得哈哈哈

艺术要闻

都说乌克兰美女多,看完摄影师贝格玛 的作品我信了!

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版