网易首页 > 网易号 > 正文 申请入驻

构建你能信任的AI系统

0
分享至

Building AI systems you can trust

构建你能信任的AI系统

https://www.gi-de.com/en/spotlight/trends-insights/building-ai-systems-you-can-trust

本文探讨了如何构建可信的AI系统,提出了五个关键原则:

1) 信任需从系统底层构建,而非假设,包括公平性、鲁棒性测试等;

2) 可信性是多维度且依赖于上下文的;

3) 信任是动态的,需持续监测和评估;

4) 量化可信性有助于治理;

5) 创建信任需要跨学科团队合作。强调将可信性作为基础层构建AI系统,可转化为竞争优势,帮助组织在AI经济中脱颖而出。


2022年,富国银行(Wells Fargo)因其信用评估算法被发现对黑人和拉丁裔申请人系统性地分配更高的风险分数而受到审查,与财务背景相似的白人申请人相比,这种情况更为突出。1 这一案例突显了组织在匆忙部署AI系统时面临的最大挑战之一:AI真的可以被信任吗?

在富国银行的案例中,这并不是恶意设计的问题;相反,该AI只是从反映了数十年歧视性实践的历史借贷模式中学习,然后大规模地延续了这些模式。但是,如果要在银行和金融、身份验证以及公共基础设施等安全关键领域成功实施AI,此类偏见是不可接受的。除了潜在的监管罚款外,此类事件还会对客户关系造成不可修复的损害,并侵蚀组织长期成功所依赖的信任。

新的法规,例如欧盟AI法案,对于不合规行为可处以高达3500万欧元或全球年度收入7%的罚款,2 被引入以帮助组织实现AI合规,并为安全且可靠地部署AI系统设立护栏。然而,仅从合规角度看待安全AI会错失一个更大的机会。

用可信AI应对AI威胁

“消费者、利益相关者和监管机构越来越要求像AI这样的技术提供更大的透明度和问责制,”Veridos的AI负责人Letizia Bordoli表示。“这特别具有挑战性,因为AI系统往往作为黑箱运行,具有复杂的依赖关系,并在新环境中表现出不可预测的行为。因此,组织有责任以可信的方式部署AI,尤其是在那些可能显著影响人们生活的应用中。”

许多组织面临的一个问题是:究竟如何构建值得信任的AI系统?以及,如何可靠地评估、量化并将对AI系统的信任嵌入到开发过程中?


什么是可信AI?

组织必须采取的第一步是理解可信AI究竟意味着什么。为了支持这一点,在欧洲委员会人工智能高级别专家组的推动下,AI社区确立了七项原则,这些原则作为可信且符合伦理的AI的通用定义。

这些原则成为了诸如欧盟AI法案等框架的基础,包括人类能动性和监督;技术鲁棒性和安全性;隐私和数据治理;透明度;多样性、非歧视和公平性;社会和环境福祉;以及问责制。

然而,这些原则往往仍然是抽象的,为实际应用提供了很少的指导。组织需要一个框架,将这些高层原则转化为可衡量的实践,这些实践可以嵌入到开发过程和组织文化中。


可信AI的基础

这只是Veridos与纽伦堡-埃尔兰根弗里德里希-亚历山大大学(Friedrich-Alexander University of Erlangen-Nuremberg)的专家合作,开发一个全面的、基于度量的框架来评估和量化AI可信性的原因之一。以下是该研究中的五个关键要点:

1. 信任必须被设计出来,而不是被假设 许多组织会等待信任问题出现——通过丑闻、审计失败或监管行动——然后才做出反应。这是错误的方法。可信性必须从底层开始构建到系统中,使用与已知风险相关的特定评估方法。这些方法可以包括:

  • 群体公平性度量,这些度量通过评估AI结果是否在人口统计群体(例如年龄、性别、种族)之间公平分布,来识别并消除隐藏的歧视。

  • 显著性图鲁棒性测试(这些测试检查当输入略微变化时,AI解释是否保持一致),以验证AI决策过程的可靠性,确保长期信任。

  • 成员推断测试(这些测试检查攻击者是否能够逆向工程模型来确定使用了哪些数据训练AI),通过模拟攻击者是否能够确定特定数据点是否被用于模型训练,来检测隐私漏洞,从而揭示潜在的数据泄露风险和隐私保护不足的问题。

2. 可信性是多维度的且依赖于上下文 不存在通用的可信AI度量。最重要的维度完全取决于所涉及的应用和风险。高风险系统(如身份验证)可能将鲁棒性和问责制置于首位,而面向消费者的应用可能强调透明度和人类监督,以维持用户信心。

3. 信任不是静态的——它可能随时间变化 大多数AI治理框架错误地将评估视为一次性任务。但是AI系统在持续演化:模型发生漂移,对手开发新型攻击方法,运营环境发生变化。监测和持续评估必须成为AI运营的标准部分,就像云服务的正常运行时间监测一样。

4. 量化能够实现治理 通过将公平性和隐私等原则转化为量化指标,可信性变得可审计且可问责。这为有意义的AI风险管理、合规自动化以及提供对AI系统可信性实时可见性的内部治理仪表板打开了大门。

5. 创造信心需要跨学科团队 没有单一团队能够“拥有”信任。AI工程师、UX研究人员、伦理学者、安全专家以及广泛的专业人员必须在整个开发生命周期中协作,以确保可信性贯穿系统嵌入。

将信任转化为竞争优势采用这些原则将帮助组织设计和构建将信任嵌入作为基础层的可信AI系统。这种主动方法将帮助它们与那些在信任失败发生后才做出反应的组织区分开来。 在一个将越来越以AI为基础的未来经济中,将会有压力要求跟上每一个发展,以保持领先。与其尽快部署最先进的AI系统,真正的领导者将是那些花时间可持续地构建利益相关者可以信任的系统的人。

关键要点

• 随着AI采用的加速,组织迫切需要框架,以便构建和评估可信系统。

• 信任必须被设计出来,而不是被假设。然而,不存在“可信AI”的通用定义。

• 采取主动的合规方法可以创造竞争优势。构建可信AI系统的组织将使自己与竞争对手区分开来。


https://www.gi-de.com/en/spotlight/trends-insights/building-ai-systems-you-can-trust

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赖清德准备抓人,郑丽文也有危险?大陆出手,对台独打手终身追责

赖清德准备抓人,郑丽文也有危险?大陆出手,对台独打手终身追责

触摸史迹
2026-01-07 13:55:48
演员闫学晶陷舆论争议,遭网友集体抵制!儿子发声:网上所有回应都不实

演员闫学晶陷舆论争议,遭网友集体抵制!儿子发声:网上所有回应都不实

现代快报
2026-01-07 17:23:46
深圳信息职业技术大学正式成立

深圳信息职业技术大学正式成立

南方都市报
2026-01-08 13:01:48
比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

芳芳历史烩
2025-12-25 20:32:52
若中美开战,美摧毁北斗卫星,中国将如何应对?4大杀手锏已就位

若中美开战,美摧毁北斗卫星,中国将如何应对?4大杀手锏已就位

春风秋雨
2025-10-29 19:55:04
全季的避孕套和曹操出行的相机

全季的避孕套和曹操出行的相机

长三角momo
2026-01-07 12:10:42
1970年江青哥哥带儿子来北京,江青得知对方想见自己后:这事难办

1970年江青哥哥带儿子来北京,江青得知对方想见自己后:这事难办

谈古论今历史有道
2026-01-08 11:50:03
湖人输西部第二之争!东契奇空砍38+10+10 第86次三双历史第七

湖人输西部第二之争!东契奇空砍38+10+10 第86次三双历史第七

醉卧浮生
2026-01-08 13:02:52
让农民挨冻的环保,是坏保

让农民挨冻的环保,是坏保

不主流讲话
2026-01-08 09:32:40
马杜罗被“绑架”到美国,彻底打脸国内的某些军事专家

马杜罗被“绑架”到美国,彻底打脸国内的某些军事专家

微评社
2026-01-05 11:17:53
马杜罗反击了,内鬼嫌疑人逐渐浮出水面,加拉加斯传出枪声

马杜罗反击了,内鬼嫌疑人逐渐浮出水面,加拉加斯传出枪声

蛙斯基娱乐中
2026-01-07 06:47:02
法国第一美人消失25年,被救时竟已沦为46斤人畜,亲妈在阁楼里藏了整整25年的秘密终于曝光了

法国第一美人消失25年,被救时竟已沦为46斤人畜,亲妈在阁楼里藏了整整25年的秘密终于曝光了

历史回忆室
2026-01-02 19:54:11
火箭102-103开拓者4坏消息!3将狂铁展露弊端,球队无突破太被动

火箭102-103开拓者4坏消息!3将狂铁展露弊端,球队无突破太被动

篮球资讯达人
2026-01-08 14:20:32
把玄戒O1念成“玄戒零一”,雷军认错:确实是讲错了

把玄戒O1念成“玄戒零一”,雷军认错:确实是讲错了

三言科技
2026-01-07 22:40:05
妻子拿着28克金手镯去金店,回来后丈夫觉得不对劲……他:妻子当时喝了酒

妻子拿着28克金手镯去金店,回来后丈夫觉得不对劲……他:妻子当时喝了酒

北青网-北京青年报
2026-01-06 13:50:08
钱再多有啥用!“展昭”何家劲的现状,给所有老年男性提了个醒

钱再多有啥用!“展昭”何家劲的现状,给所有老年男性提了个醒

阿笎评论哥
2026-01-08 06:40:37
分手8年,自曝私密事的Coco,没给谢贤留体面,原来谢霆锋没说谎

分手8年,自曝私密事的Coco,没给谢贤留体面,原来谢霆锋没说谎

娱说瑜悦
2026-01-06 17:28:42
宝马开年挥刀,2026豪华车卷生卷死

宝马开年挥刀,2026豪华车卷生卷死

每日资本论
2026-01-08 07:00:03
美方积极讨论“购买”格陵兰岛 鲁比奥下周或与丹麦官员会面

美方积极讨论“购买”格陵兰岛 鲁比奥下周或与丹麦官员会面

环球网资讯
2026-01-08 07:11:05
法国外长:美国攻击另一个北约国家完全违背自身利益

法国外长:美国攻击另一个北约国家完全违背自身利益

新华社
2026-01-07 19:59:03
2026-01-08 14:44:49
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1134文章数 18关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

国家级射击教练因走私武器罪获刑10年:多省射击队购买

头条要闻

国家级射击教练因走私武器罪获刑10年:多省射击队购买

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

本地
旅游
数码
游戏
艺术

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

旅游要闻

不止“故乡的云”!泰安九女峰片区用两项省级大奖定义文旅融合新美学

数码要闻

微星发布全新星爵Modern 14S/16S:11.1mm、1.3kg轻薄机身

外媒痛批仙剑4RE盲目抄袭光与影!称其简直是可笑

艺术要闻

颐和园金光穿洞

无障碍浏览 进入关怀版