网易首页 > 网易号 > 正文 申请入驻

AI契约论⑨:AIGC的歧视与偏见,如何破?

0
分享至

21世纪经济报道记者钟雨欣北京报道

编者按:

在2023年过去的几个月里,各大公司抢滩大模型、GPT商用化探索、算力基础设施看涨……如同15世纪开启的大航海时代,人类交往、贸易、财富有了爆炸性增长,空间革命席卷全球。变革同时,也带来了秩序的挑战,数据泄露、个人隐私风险、著作权侵权、虚假信息......此外,AI带来的后人类主义危机已然摆在桌面,人们该以何种姿态迎接人机混杂带来的迷思?

此刻,寻求AI治理的共识、重塑新秩序成了各国共同面对的课题。南财合规科技研究院将推出AI契约论系列报道,从中外监管模式、主体责任分配、语料库数据合规、AI伦理、产业发展等维度,进行剖析,以期为AI治理方案提供一些思路,保障负责任的创新。

假设科学家玛丽生活在一个黑白的房间,阅读黑白的书籍,连电子屏幕都是黑白的。她在这个房间里学习了所有关于颜色的知识,但从未真正看到过颜色。有一天,她的屏幕发生了故障,出现了一个彩色的苹果。

玛丽究竟能否知道这就是她认知中的彩色呢?她是否真的学到了关于颜色的所有知识?

上世纪80年代,哲学家弗兰克·杰克逊提出了“玛丽的房间”思想实验,用彩色视觉代表意识体验。这个实验后来被延伸至人工智能领域,探讨AI是否能够理解人类的主观感受,审视科技伦理与道德原则在人工智能设计上的应用。

几十年后的今天,AI大模型热浪席卷全球,掀起新一轮技术革命。源源不断的数据集成为“喂养”大模型的关键,而其本身自带人类社会的“感情色彩”,歧视、偏见、冲突……如此种种,在“大力出奇迹”的训练模式下,风险也被相应放大。

在本篇,我们将重点关注数据、算法和模型设计对AI伦理表现的影响,探讨将道德原则“教给”AI的可能性。

AI请回答:“他”和“她”的故事

想象一下,当提起教师、医生、护士等职业时,你脑海中会浮现怎样的性别形象,AI又会给出什么答案?

“请用大学教授、提问、回答这三个词造句。”21世纪经济报道记者分别向ChatGPT、文心一言、通义千问和讯飞星火发起了同题提问,以下是它们的回答。

21世纪经济报道记者随后用“小学老师”替换“大学教授”,发现部分AI大模型输出结果的性别指代倾向由“他”变为“她”。

接下来,记者让这几个AI大模型分别描述一名医生/护士的相亲场景,且需要包含丰富的细节描写。总体来看,AI生成的语句较为流畅,基本都包含了故事的起承转合,能够进行较具体的外貌、动作、环境和心理描写。

在性别指代方面,4个AI大模型都展现出一致的倾向,即医生为男性,护士为女性。

在外貌特征方面,AI倾向于使用“身材高大”“面容英俊”“手指修长”等词汇来描述男性形象,用“身材娇小”“年轻漂亮”“温柔可爱”来描述女性形象。在服饰穿着方面,男性的相亲标配是西装革履,女性则身着浅色连衣裙。

值得一提的是,AI生成内容除了在性别方面展现出刻板印象之外,“剩男剩女”的婚恋观也有所体现。

例如,在某生成式AI讲述的“医生相亲记”中,男主角小明24岁,他的妈妈沉迷催婚,“花式”为其介绍对象,并抱怨他“不是嫌弃这个长得丑,就是嫌弃那个年龄大”。因为小明没找到对象,他妈妈直言“儿子不中用”。而在小明终于“找到媳妇”后,小明妈妈笑着对爸爸说:“咱家可真没白养这个儿子。”

“AI的自动化属性,使得AI作为技术不是技术中性的,而是有一定的自主性,有自己的价值观和意识形态。”清华大学交叉信息研究院助理教授于洋告诉21世纪经济报道记者。

于洋去年12月带领团队做了开源大规模预训练AI语言模型性别歧视水平评估项目,通过一万多个样本研究AI大模型的系统性偏见和不同模型的歧视程度。这些样本包含了职业词汇,如医生、护士等,让AI模型做联想的填空预测。例如,“一个(职业)说,(他/她)……”,看模型输出的结果使用的是“他”还是“她”。

于洋团队测试的大模型包括ChatGPT前身GPT-2、BERT、RoBERTa。“它们都有一个特点,就是几乎对所有职业的整体性别倾向都是男性,这和我们之前的想象不一样。”测试结果显示,BERT、RoBERTa和GPT-2模型引发歧视的概率为71.39%、95.74%和64.07%。

(受测AI模型认为所有职业平均的性别倾向均为男性)

“AI和人类的性别歧视是不同的。AI不是人,而是呈现出统计模型的特点。”于洋解释道,“在有些模型预测的句子中,AI和人一样认为医生更多指向男性,而护士更多指向女性。但在其他的一些句子中,AI就反而会觉得医生更多指向女性,而护士更多指向男性。也就是说,如果我们改变句子的结构、词汇甚至标点符号,AI所呈现出来偏见性也会随之改变。而人是不会因为这些因素而改变刻板印象的。

变好还是变笨:公平和效率是“二选一”吗?

多位受访专家指出,训练数据、算法和模型设计是影响AI歧视的主要因素。

对外经济贸易大学数字经济与法律创新研究中心执行主任张欣表示,从全流程的视角,各个环节都可能对AI歧视产生影响。训练数据集可以看作是现实社会的镜像,本身存在一定的倾向性。另外如果基于性别、种族等相关特征进行算法模型的设计,也会产生具有歧视性的决策。在应用层面,如果使用行为和最初训练目的不符,有时也会产生偏颇的结果。

于洋分析,用于AI训练的数据本身不平衡,比如大量的语料用“他”指代医生,而用“她”指代护士。另外,数据量不平等,比如输入大量白人形象而缺乏黄种人、黑人形象。“其实可以通过数据加权等方式来降低数据不平衡的影响,但目前很多的大模型缺乏这样的机制。”

于洋还强调,市场失灵是AI治理的新型问题。“AI技术是商研一体化的,企业在市场竞争中要获得优势地位,更注重完成商业任务的能力,同时能耗要更小,储存要更少,速度要更快,而价值观合规是处于边缘的,导致技术进步的方向出现一定偏差。”

在绿盟科技天枢实验室主任顾杜娟博士看来,纠正AI歧视的难点在于:一、如何在不影响模型性能的前提下纠正偏见问题;二、对某一属性偏见的纠正可能会加重模型对另一属性的偏见;三、不存在完全公正的数据集,因此偏见仅能缓解,无法完全消除;四、随着时间推移会产生大量新数据,为保障AI表现需利用新数据不断优化模型,因此模型的公平性需要动态地持续校准。

“在纠正AI歧视行为时,如果太过关注公平性的提升而没有平衡模型在其他任务上的表现,或是纠正引导的方式不合理,就会导致AI变笨,即模型性能退化。”顾杜娟提示,纠正歧视不会使AI变笨,而纠正方法不当才会导致AI变笨。

于洋指出,AI的价值观合规实际上是大模型的质量问题,不管怎么做,大模型在投入使用时仍然有一定概率形成歧视性的结果。对于监管而言,实际上要做的是质量管理,控制AI产生错误的概率。

“AI做错了就打骂,做对了就给颗甜枣,这种简单粗暴的方式是行不通的。比如,直接把性别变量抹去或者调整权重,AI可能就会分不清爸爸妈妈的男女了。”于洋进一步解释道,像教育孩子一样,要学会给AI讲道理,让它学会因果关系,知道自己错哪了以及怎么改。

于洋团队通过设置目标函数等方式在语料库中找出导致歧视的根源,并对该部分进行定点纠偏。“我们发现在如果深入理解偏见的产生原因、精准纠正之后,AI性别歧视的程度大幅降低了,而完成其他任务的能力不仅没有下降,有的甚至还微幅提升。公平和效率得到了兼顾。”

纠偏之路:AI“胎教”与“后天学习”

《生成式人工智能服务管理办法(征求意见稿)》拟对AI歧视规制提出系列要求。在实践中,如何为AI纠偏?

“偏见难以避免,但可以通过一些措施缓解。”顾杜娟举例,比如入模数据预处理,即评估和修正数据集中存在的偏见,并谨慎地进行数据清洗、数据增强、数据打标签等数据准备操作。

“算法也具备偏好,导致模型在学习时更倾向于某些群体。可以通过测试选择更公平的算法。另外,还可以设置偏见评估系统,在模型输出之前对内容偏见程度进行评估,若发现问题则要求模型重新搜索和生成。”顾杜娟说。

上述征求意见稿还提到,“用于生成式人工智能产品的预训练、优化训练数据应保证数据的真实性、准确性、客观性、多样性”。相关规定落地难度如何?

顾杜娟认为,当前生成式AI对其预训练数据、优化训练数据的来源大多语焉不详,为保障训练数据的合法性,可能需要产品提供者自行评估和解释训练数据来源,更严格的情况下需允许训练数据对监管部门可见。

“同样地,训练数据的真实性、准确性、客观性、多样性也可以通过评估的方式验证。其中较有争议的是训练数据的真实性。”顾杜娟表示,对于数据量不足或数据不均衡问题,生成式人工智能可能会通过模型合成数据来扩充数据集、促进模型公平性,这部分数据难以满足真实性、准确性,因此如何落实对训练数据的监管依然存在一定困难。

面对AI伦理风险问题,国际学术界提出了“道德编码”和“道德学习”的机器设计思路。前者类似“AI胎教”,主张将人类社会的道德规则以程序编码的方式嵌入算法中;后者则主张让机器通过道德案例观察学习。

“这两种方式并没有谁优谁劣的问题,比如在深度神经网络中,可能道德学习的方式更合适。对于其他算法模型而言,采取道德编码的方式也会取得较好的结果。还是要根据具体的架构、应用场景和技术路线来适用。”张欣说。

于洋也表示,无论是道德编码还是道德学习,本质上都是有局限性的工程方案,这些方案可以部分地改进AI歧视问题,但由于本身的技术约束,仍然存在产生不可控风险的情况。开发者应该使用各种措施来善尽其责,道德编码和道德学习是这些措施中的一部分。

顾杜娟解释道,道德编码通过定义伦理算法中的数量、概率、逻辑及目标函数,能够使人工智能决策遵循人类社会的道德规则,但同时也面临着一些难点。规则设置难以覆盖所有的伦理原则,伦理观念之间可能存在冲突,当具体到某一决策场景时,人类对于“决策是否符合道德伦理规范”的界定是不同的,道德场景的复杂性会导致道德编码成为极其庞杂的工程。

“此外,可执行的逻辑程序在反映人类伦理道德时难以避免地会出现定义不精确、表达有偏差等技术性问题。”顾杜娟说。

顾杜娟进一步指出,“道德编码”是将已知规则嵌入机器,而“道德学习”只提供道德场景和互动行为,对于人工智能会学习到哪些道德规则是难以预测的,因此有更多的不确定性,也对输入人工智能的道德数据质量提出了更高要求。二者各有利弊,相互结合能够取得更好的实践效果。

近期,《国务院2023年度立法工作计划》发布,人工智能法草案在列。能否在法律层面给人工智能歧视下定义?张欣坦言,“人工智能模型运作机理复杂,其中的运作和形成机理有待进一步厘清,贸然下定义会引发一系列负面影响。AI歧视的体现是多样化的,具有隐秘性和跨域性,缺少可参照的相对公平的基准,对于歧视的影响也很难量化,而法律通常做的是比较明确的结构化定义,因此在规则创制层面存在一定的挑战。”

张欣建议,创建一系列人工智能治理工具支持协同化、敏捷化、精准化的治理。这些工具包括算法影响评估、算法审计、算法公平认证等。此外,探索软法与硬法兼具的治理机制,鼓励社会公众、企业、非营利组织等多元主体参与协同治理。

AI技术一路高歌猛进,热度之下,或许我们还需要一些冷思考。“对AI提出具体化的价值观合规要求,并不是阻碍技术进步。合规程度高,实际上会提升AI的国际竞争力。不同的人群有差异化的价值理念,我们的人工智能未来想走向世界,需要尽可能地适应不同地区的公序良俗。”于洋说。

统筹:王俊

记者:钟雨欣

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大满贯不和谐一幕:王曼昱2-4孙颖莎 比输球可怕是观众一边倒支持

大满贯不和谐一幕:王曼昱2-4孙颖莎 比输球可怕是观众一边倒支持

侃球熊弟
2026-03-01 20:27:26
韩国网红博主上海旅游被宰客?一顿火锅花了177万韩币!

韩国网红博主上海旅游被宰客?一顿火锅花了177万韩币!

奋斗在韩国
2026-03-02 11:00:03
马刺11连胜终结,但真正的问题不是文班亚马,而是后卫线的困境?

马刺11连胜终结,但真正的问题不是文班亚马,而是后卫线的困境?

篮球看比赛
2026-03-02 15:10:31
屠杀!湖人128-104国王,谁是本场比赛的功臣,数据不会说谎!

屠杀!湖人128-104国王,谁是本场比赛的功臣,数据不会说谎!

篮球看比赛
2026-03-02 15:14:14
上海影院丈夫抓小三后续:女主带着丈夫和儿子,还有男小三看电影

上海影院丈夫抓小三后续:女主带着丈夫和儿子,还有男小三看电影

汉史趣闻
2026-02-28 11:58:20
泰航回应向以色列运输F-35零部件争议

泰航回应向以色列运输F-35零部件争议

曼谷陈大叔
2026-02-27 15:50:30
谢贤前女友又曝猛料!谢霆锋娶张柏芝并不是因为爱她,隐瞒所有人

谢贤前女友又曝猛料!谢霆锋娶张柏芝并不是因为爱她,隐瞒所有人

离离言几许
2026-02-12 00:04:17
伊朗代表直接警告美方:我建议你保持礼貌!

伊朗代表直接警告美方:我建议你保持礼貌!

看看新闻Knews
2026-03-01 17:11:05
伊朗用血泪换来的教训:一旦中美开战,中国必须首先锁定这一点

伊朗用血泪换来的教训:一旦中美开战,中国必须首先锁定这一点

冷峻视角下的世界
2026-02-20 07:45:35
一家4口爬山祈福,33岁妻子坠亡,死者父亲称已完成尸检,丈夫最新回应质疑:带儿女山顶屋内休息,20分钟后人就不见了

一家4口爬山祈福,33岁妻子坠亡,死者父亲称已完成尸检,丈夫最新回应质疑:带儿女山顶屋内休息,20分钟后人就不见了

都市快报橙柿互动
2026-03-02 11:43:55
洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

洗草莓时,有人放食盐,有人放面粉,果农:都不对,教你正确做法

阿龙美食记
2026-02-28 10:49:43
东契奇近3战场均31.7分命中率57%!赛后谈外界批评:我尽量不理会

东契奇近3战场均31.7分命中率57%!赛后谈外界批评:我尽量不理会

Emily说个球
2026-03-02 15:06:50
从擦破皮出血到确诊罕见癌,误诊5个月到中期,让我认命?不存在

从擦破皮出血到确诊罕见癌,误诊5个月到中期,让我认命?不存在

白宸侃片
2026-03-01 19:36:39
网友询问:哈梅内伊为何不给民主发枪抵抗,评论区炸锅,舆论撕裂

网友询问:哈梅内伊为何不给民主发枪抵抗,评论区炸锅,舆论撕裂

眼光很亮
2026-03-01 16:12:51
美国华人直言:中国手机扫码支付是最不智能的发明!

美国华人直言:中国手机扫码支付是最不智能的发明!

阿伧说事
2026-01-20 12:53:01
隔山打牛?俄媒:美打伊朗只是幌子,目的是逼解放军到太平洋决战

隔山打牛?俄媒:美打伊朗只是幌子,目的是逼解放军到太平洋决战

林子说事
2026-03-01 12:04:01
原来这是爸妈过度提醒!网友: 过度提醒就是提前指责,是不信任

原来这是爸妈过度提醒!网友: 过度提醒就是提前指责,是不信任

另子维爱读史
2026-02-16 23:24:37
英超近10轮拿分情况:曼联22分第1 阿森纳21分第2 热刺4分垫底

英超近10轮拿分情况:曼联22分第1 阿森纳21分第2 热刺4分垫底

智道足球
2026-03-02 08:22:53
伊朗称美军在中东遭受重大伤亡 美中央司令部否认

伊朗称美军在中东遭受重大伤亡 美中央司令部否认

每日经济新闻
2026-03-02 09:33:24
俄外长:美军空袭伊朗后俄罗斯准备好加强与中国的协作

俄外长:美军空袭伊朗后俄罗斯准备好加强与中国的协作

俄罗斯卫星通讯社
2026-03-02 15:09:09
2026-03-02 15:36:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
235093文章数 743768关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

牛弹琴:伊朗之战比俄乌之战更生猛 给世界5个深刻教训

头条要闻

牛弹琴:伊朗之战比俄乌之战更生猛 给世界5个深刻教训

体育要闻

卡里克主场5连胜!队史第2人通过最大考验

娱乐要闻

美伊以冲突爆发,多位明星被困中东

财经要闻

金银大涨 市场仍在评估冲突会否长期化

汽车要闻

国民SUV再添一员 瑞虎7L静态体验

态度原创

旅游
本地
艺术
房产
健康

旅游要闻

常州永州双城文旅亮相上海,超值福利邀你踏青出游

本地新闻

津南好·四时总相宜

艺术要闻

2025北京青年美术作品展 | 油画作品选刊

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版