网易首页 > 网易号 > 正文 申请入驻

MIT团队用AI检验AI:AI给出的“最优解”真的公平吗?

0
分享至


(来源:麻省理工科技评论)

AI 正越来越多地被用于辅助高风险场景下的决策。比如一个自主系统可以找出一种电力分配策略,在保持电压稳定的前提下把成本降到最低。

这些由 AI 给出的方案虽然在技术上可能是最优的,它们真的公平吗?如果一个低成本的电力分配策略让条件不佳的社区比高收入地区更容易遭遇停电,这算不算问题?

为了帮助相关方在 AI 系统部署之前就能快速发现潜在的伦理困境,MIT 的研究人员开发了一套自动化评估方法。这套方法的目标是在可量化指标(比如成本或稳定性)与那些定性或主观的价值(比如公平性)之间找到平衡。

该系统把客观评估与用户定义的人类价值观分开处理,使用一个大语言模型作为“人类代理”来捕捉和整合相关方的偏好。

这套自适应框架会挑选出最值得进一步评估的场景,从而简化原本需要耗费大量人力和时间的手工流程。这些测试用例既能展示自动系统与人类价值观高度吻合的情况,也能揭示那些意外偏离伦理标准的情境。

“我们可以给 AI 系统加上很多规则和护栏,但这些防护只能拦住我们事先能想到的那些风险。不能因为 AI 是在这些数据上训练过的,就觉得让它直接上岗就行。我们想做的是找到一种更系统的方法,把那些‘未知的未知’提前挖出来,在坏事发生之前就预判到它。”论文的通讯作者、MIT 航空航天系(AeroAstro)副教授、MIT 信息与决策系统实验室(LIDS)首席研究员范楚楚(Chuchu Fan)说。

论文的第一作者是机械工程系研究生安嘉丽·帕拉沙尔(Anjali Parashar),合著者包括 AeroAstro 博士后 Yingke Li,以及 MIT 和萨博公司(Saab)的其他研究人员。该研究将在国际学习表征大会(ICLR)上发表。



为伦理打分

在电网这样的大型系统里,要全面评估 AI 推荐方案是否符合伦理,兼顾所有目标,是一件特别困难的事。

大多数测试框架依赖预先收集的数据,但涉及主观伦理标准的标注数据往往很难拿到。另外,伦理价值观和 AI 系统本身都在不断变化,基于成文规则或监管文件的静态评估方法需要频繁更新。

范楚楚和她的团队从另一个角度切入这个问题。他们借鉴了自己之前在机器人系统评估方面的工作,开发出一套实验设计框架,专门用来识别那些最有信息量的场景,供人类相关方进一步仔细评估。

这套由两部分组成的系统叫做 SEED-SET(Scalable Experimental Design for System-level Ethical Testing,系统级伦理测试的可扩展实验设计),结合了量化指标与伦理标准。它既能识别出那些既满足可量化要求、又符合人类价值观的场景,也能找出反过来的情况。

“我们不想把所有资源都花在随机评估上。所以关键是让框架聚焦在我们最关心的那些测试用例上,”Yingke Li 说。

SEED-SET 的一个重要优势是:它不需要预先存在的评估数据,而且可以适配多个目标。以一个电网为例,它可能有多个用户群体,比如一个较大的农村社区和一个数据中心。两类用户都希望电力便宜又可靠,但从伦理角度看,他们各自的优先级可能差异很大。

这些伦理标准往往没有明确定义,因此无法用分析方法直接度量。电网运营方想要找到一种最具成本效益的策略,同时尽可能满足所有相关方的主观伦理偏好。

SEED-SET 应对这个挑战的方法是把问题拆成两层,按层级结构处理。第一层是客观模型,评估系统在成本等具体指标上的表现;第二层是主观模型,在客观评估的基础上,考虑相关方的判断,比如他们感受到的公平程度。

“我们方法中客观的那一部分对应的是 AI 系统,主观的那一部分对应的是评估它的用户。通过以层级方式拆解偏好,我们可以用更少的评估次数生成理想的场景,”帕拉沙尔说。



把主观评价编码进来

为了完成主观评估,系统用一个大语言模型来替代人类评估者。研究人员把每个用户群体的偏好编码成自然语言提示词交给模型,大语言模型按照这些指令对两个场景进行比较,根据伦理标准选出更合意的那个。

“一个人类评估者在看过几百甚至几千个场景之后会疲劳,评估也会变得不一致,所以我们用基于大语言模型的策略来代替,”帕拉沙尔解释说。SEED-SET 会用选出的场景来模拟整个系统(在这个例子里就是电力分配策略)。模拟结果又会反过来引导系统去寻找下一个最值得测试的候选场景。

最终,SEED-SET 能智能地筛选出最具代表性的场景,无论是那些同时达标客观指标和伦理标准的场景,还是那些明显偏离的场景。用户可以据此分析 AI 系统的表现,并调整它的策略。

举个例子,SEED-SET 能精准找出那些在用电高峰期优先保障高收入区域、让条件较差的社区更容易停电的电力分配方案。

为了测试 SEED-SET,研究人员对若干真实的自主系统做了评估,包括一个 AI 驱动的电网和一个城市交通调度系统。他们测量了所生成的场景与伦理标准的吻合程度。在相同时间里,该系统生成的最优测试用例数量超过了基准方法的两倍,还发现了许多其他方法忽略的场景。

“当我们改变用户偏好时,SEED-SET 生成的场景集合也会发生明显变化。这说明评估策略对用户的偏好反应灵敏,”帕拉沙尔说。

要验证 SEED-SET 在实际应用中的价值,研究人员还需要开展一项用户研究,看看它生成的场景能不能帮助真实的决策过程。

除了这项用户研究,研究人员还计划探索使用更高效的模型,把这套方法扩展到规模更大、评估标准更多的问题上,比如用来评估大语言模型自己的决策过程。

https://news.mit.edu/2026/evaluating-autonomous-systems-ethics-0402

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
什么是气象站——关于自动气象站

什么是气象站——关于自动气象站

测控技术有限公司
2025-07-03 17:16:08
高考699分女生分享学习经验:不靠补课,普通学生值得借鉴

高考699分女生分享学习经验:不靠补课,普通学生值得借鉴

户外阿毽
2026-07-04 08:43:57
男子硬摸老板娘后续!短裙丝袜大长腿,长得很漂亮

男子硬摸老板娘后续!短裙丝袜大长腿,长得很漂亮

观察鉴娱
2026-07-05 09:34:24
C罗合体Drake,晒照感谢招待!

C罗合体Drake,晒照感谢招待!

动物奇奇怪怪
2026-07-05 00:22:54
1935年刘文辉故意不炸泸定桥,临终含泪说出真相:那十三根铁索是川康百姓的命根子!

1935年刘文辉故意不炸泸定桥,临终含泪说出真相:那十三根铁索是川康百姓的命根子!

白驹谈人机
2026-06-29 11:19:27
北京4区发布暴雨预警,7区发布冰雹预警

北京4区发布暴雨预警,7区发布冰雹预警

新京报
2026-07-05 18:28:25
为什么中国人那么介意有纹身的人,但是外国人却不介意纹身呢?

为什么中国人那么介意有纹身的人,但是外国人却不介意纹身呢?

另子维爱读史
2026-07-04 21:40:13
《特立独行》3天票房倒挂,26位明星也撑不起,导演破防发长文

《特立独行》3天票房倒挂,26位明星也撑不起,导演破防发长文

花语舞者
2026-07-05 14:15:35
同掌国民党文传会,尹乃菁冷清,陈以信上任就出圈,差距根源在哪

同掌国民党文传会,尹乃菁冷清,陈以信上任就出圈,差距根源在哪

娱乐的宅急便
2026-07-05 10:43:59
7月开始中国或将迎来五大降价潮:除房价以外,这四类也要降价了

7月开始中国或将迎来五大降价潮:除房价以外,这四类也要降价了

漫婷侃娱乐
2026-07-05 11:58:19
世界杯乌龙球引来杀身之祸?32年后幕后大佬横死街头

世界杯乌龙球引来杀身之祸?32年后幕后大佬横死街头

老牛体育解说
2026-07-05 04:32:55
外蒙宣布独立时,只有一个部落支持留在中国,如今情况怎么样了?

外蒙宣布独立时,只有一个部落支持留在中国,如今情况怎么样了?

抽象派大师
2026-06-29 16:55:46
花生再次被关注!调查发现:常吃花生的人,不出半年,或有4改善

花生再次被关注!调查发现:常吃花生的人,不出半年,或有4改善

今日养生之道
2026-07-03 18:18:55
哈佛大学惊人发现:寿命长的人,从来不是靠多运动,而是靠这3点

哈佛大学惊人发现:寿命长的人,从来不是靠多运动,而是靠这3点

千秋文化
2026-06-21 19:47:58
多名演员发文抵制!业内人士:很悲哀,收入猛降八成,几乎成“免费劳动力”

多名演员发文抵制!业内人士:很悲哀,收入猛降八成,几乎成“免费劳动力”

浙江之声
2026-07-04 08:13:16
巴西能否冲破欧洲魔咒?英格兰复仇地狱球场?世界杯1/8决赛前瞻

巴西能否冲破欧洲魔咒?英格兰复仇地狱球场?世界杯1/8决赛前瞻

世界BALL
2026-07-05 07:45:20
安妮·海瑟薇穿反万元连身裤,自嘲反应亮了

安妮·海瑟薇穿反万元连身裤,自嘲反应亮了

浅遇时光
2026-07-04 01:11:05
全集上线,Netflix又一高能新剧,建议收藏!

全集上线,Netflix又一高能新剧,建议收藏!

陈意小可爱
2026-07-05 18:31:07
5年2.51亿!文班亚马将签下NBA史上最大新秀合同 !

5年2.51亿!文班亚马将签下NBA史上最大新秀合同 !

林子说事
2026-07-05 15:42:07
广州3名乘客用高德打车,因要求开窗遭司机怒怼:“十几块钱的车还打出优越感了!”司机在行驶中多次猛踩油门后刹车;高德平台回应→

广州3名乘客用高德打车,因要求开窗遭司机怒怼:“十几块钱的车还打出优越感了!”司机在行驶中多次猛踩油门后刹车;高德平台回应→

江西晨报
2026-07-05 18:51:08
2026-07-05 21:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16927文章数 515080关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

世界杯带火岛国佛得角 当地中国人:最近国人多了起来

头条要闻

世界杯带火岛国佛得角 当地中国人:最近国人多了起来

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

霉霉婚礼照片泄露 有四人违规

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

教育
亲子
手机
健康
公开课

教育要闻

全国仅6人!14岁成都篮球少年拿下重磅奖学金,将入读“NBA摇篮”高中

亲子要闻

奉劝大家:超市里这5种食物少给孩子吃,看似有营养,实则没好处

手机要闻

全网吵翻!到底是谁带头取消了有线耳机?网友:错怪苹果了

听说少吃点能抗衰老?专家讲解!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版