网易首页 > 网易号 > 正文 申请入驻

全球首个!Nature重磅研究:计算机视觉告别“偷数据”时代

0
分享至


计算机视觉(CV)技术,广泛应用于自动驾驶汽车、消费电子设备等众多领域。其中,图像数据集扮演着基础性的角色,ImageNet 等大型图像数据集的出现,使计算机视觉领域实现了革命性突破。

然而,过去十年,大多数数据集的数据采集依赖网络抓取,仍然存在未经授权、缺乏多样性、知情同意以及补偿相关的伦理问题

数据的“先天不足”不仅削弱了人工智能(AI)系统的公平性和准确性,还在无形中强化了种族、性别等社会偏见

例如,有研究指出,商业人脸识别系统在识别深肤色女性时的错误率远高于浅肤色男性;部分知名数据集因数据收集的伦理争议相继撤回,即便仍在使用的数据集,如 COCO、VQA2.0 或 MIAP,在人口多样性和自我报告信息方面仍存在明显缺陷。

在这一背景下,Sony AI 推出了全球首个公开可用的、全球多样化的、基于用户同意的数据集——FHIBE,专门用于评估以人为中心的计算机视觉任务的公平性。

据介绍,FHIBE 收录了来自 81 个国家和地区的 10318 张图像,涉及 1981 位独立个体,涵盖从人脸识别到视觉问答等广泛视觉任务。

此外,FHIBE 拥有迄今最全面的标注信息,包括人口统计特征、物理属性、环境因素、仪器参数及像素级标注数据,能够实现更细致的偏见诊断,帮助从业者精准定位偏见来源并有效防范潜在风险。

相关研究论文以“

Fair human-centric image dataset for ethical AI benchmarking
”为题,已发表在权威科学期刊
Nature
上。


论文链接:https://www.nature.com/articles/s41586-025-09716-2

“由于大多数计算机视觉任务缺乏公开可用的、符合伦理规范的数据集,即使是检查偏见这一最基本的第一步也十分困难,”索尼全球人工智能治理负责人兼 FHIBE 首席研究员 Alice Xiang 表示,“我们希望开发者能够在无需使用存在问题的数据集的情况下检查人工智能中的偏见。”

这一成果是可信人工智能(Trustworthy AI)发展的重要里程碑,不仅提高了人工智能公平性基准的衡量标准,更为人工智能领域的负责任的数据管理提供了实现路径。

全球首个,“以人为中心”

与以往不同,FHIBE 采用全球众包和自我报告(self-reporting)的形式,由数据供应商面向 81 个国家地区征集图像。每位参与者上传自己拍摄的照片,并提供年龄、代词(pronouns)、祖源区域、肤色等自我报告信息,形成 1234 个交叉群组。

为保障图像数据的多样性,图像拍摄设备涵盖 45 家厂商的 785 种相机型号,真实还原了 16 种场景类型、6 种光照条件、7 种天气状况、3 种拍摄角度及 5 种拍摄距离等。

与其他同类数据集相比,FHIBE 在区域分布上尤为均衡:非洲占 44.7%,亚洲与大洋洲占 40.6%,显著改善了以往人像数据过度集中于北美与欧洲的问题。


图|图像主题、仪器和环境的注释,FHIBE 中所有图像的元数据均可获取。

FHIBE 的每张图像均附有自述姿势、互动、外观特征、年龄类别标注以及人脸、人物编辑框的像素级标注,包括 33 个关键点与 28 类分割标签。每条标注均附有匿名化编号以及标注者主动披露的人口统计信息,以保证可追溯性与透明度。据论文介绍,这种像素级标注与属性标签相结合的方式,使得FHIBE成为“当前最全面标注的公平性数据集”。


图|FHIBE 图像示例,包含详细的像素级标注、关键点、分割掩码和边界框。

值得一提的是,研究团队在数据收集过程中严格遵守《通用数据保护条例》(GDPR)等保护法规,包含清晰条款的同意书,明确数据收集用途与披露要求、生物特征数据及敏感信息的处理方式等。参与者在充分了解用途后自愿签署知情同意书,明确同意其生物特征数据用于 AI 公平性研究,并保留随时撤回同意的权利。

此外,通过生成式扩散模型,研究团队对出现在画面中的非自愿主体及可识别个人身份的信息进行图像修复(如移除旁观者或车牌)与人工复核,避免了传统隐私保护措施可能造成的再识别风险。

AI也会“看走眼”:对现有模型的公平性评估

除了在伦理上符合规范,FHIBE 在方法论上同样十分严谨,主要包括:

  • 人口统计 + 表型细节:参与者自我报告的属性,如代词、祖源、年龄组、发型、妆容和头饰。

  • 环境背景:图像包含有关光照、天气和场景类型的元数据。

  • 精确标注:边界框、关键点和分割掩码等。

  • 仅评估设计:FHIBE 是一个偏见审查数据集。确保仅用于衡量公平性,而不是强化偏见。

这为其广泛应用于模型的公平性评估提供了条件。通过 FHIBE,研究团队对当前多种主流窄模型和通用基础模型的偏见问题进行了系统测试,具体包括8类计算机视觉任务:姿态估计、人物分割、人物检测、人脸检测、人脸解析、人脸验证、人脸重建及人脸超分辨率。

研究发现,基于交叉群组(代词×年龄×祖源×肤色)的分析,年轻(18-29 岁)、肤色较浅、亚洲血统的群体往往获得较高准确率;而对于年长(50 岁以上)、肤色较深、非洲血统的群体,模型识别的准确率较低。

不同模型在具体交叉组合中的表现同样存在差异。例如,在人脸检测方面,RetinaFace 在“she/her/hers × I型 × 亚洲”组合中表现最佳,在“he/him/his × II型 × 非洲”组合中表现最差;而 MTCNN 则在“she/her/hers × II型 × 非洲”组合中表现最佳,在“he/him/his × IV型 × 欧洲”组合中表现最差。

此外,FHIBE 还发现了之前未被识别的细微偏见,例如:

  • 由于对灰白发色人群的识别能力不足,面部解析模型在处理年长个体时的表现较差。

  • 由于发型差异性较大,人脸验证模型识别女性群体的准确率更低。

针对以上差异,FHIBE 能够通过特征回归与决策树分析的方式,识别出与人物检测性能相关的干扰因素,包括身体姿态(如躺卧姿势)、主体互动(如拥抱/亲吻)、图像纵横比以及关键点可见度等(反映身体遮挡程度)等。

在多模态基础模型方面,团队重点测试了 CLIP 与 BLIP-2 两款主流模型。结果显示:

  • CLIP:在图像分类任务中,CLIP 对使用“he/him/his”代词的图像(0.69)比使用“she/her/hers”代词的图像(0.38)更倾向于赋予中性标签(未指定),反映出男性的默认化倾向;存在对其他图像属性的关联偏差,例如常常将非洲或亚裔个体与“户外”“农村”场景相绑定等。


图|CLIP 在 FHIBE 数据集预测中的偏差

  • BLIP-2:在开放式问答中,即使问题未涉及性别或种族信息,BLIP-2 也会生成带有性别或种族偏见的描述;对于“犯罪”等负面提示,在非洲或亚洲个体、肤色较深的个体、“he/him/his”的个体中引发了更高的有害刻板印象。


图|BLIP-2 分析结果

论文指出,FHIBE 是推动更负责任的人工智能发展的转折点,为未来开展伦理化的数据收集工作铺平道路。但与此同时,研究团队也坦承,这种以伦理为驱动、以人为本的共识式采集模式仍存在现实局限性,具体包括:

  • 成本高昂。参与者招募、审核与补偿需要大量人力与资金,远高于网络爬取方式。

  • 视觉多样性不足。相较于网络抓取,共识式收集的数据具有更高的标准化程度,视觉多样性较低,但明显优于其他基于同意的数据集(如CCv1、CCv2)。

  • 存在欺诈风险。个体自我报告存在误填或虚报的可能,高额补偿可能诱发参与者虚假申报身份,需要依赖反向搜索与人工审核排查可疑样本。

在未来,研究团队希望,以 FHIBE 为起点整合全面且经共识获取的图像与标注数据,推动计算机视觉领域在数据收集、知情同意、隐私保护与多样性设计上的制度化实践。

另一方面,他们也希望发挥 FHIBE 作为检测工具的作用,通过对模型的性能与偏见的评估监测,助力开发更具包容性与可信度的人工智能系统。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
vivo X300系列真机入网了,三款一起,3月见。

vivo X300系列真机入网了,三款一起,3月见。

小柱解说游戏
2026-02-17 16:04:56
换心风波仅1个月,李连杰再传噩耗,沦落到如今的下场怪不了别人

换心风波仅1个月,李连杰再传噩耗,沦落到如今的下场怪不了别人

乡野小珥
2026-02-05 15:03:34
中国驻越南总领馆紧急预警:别去!去了就是九死一生

中国驻越南总领馆紧急预警:别去!去了就是九死一生

好笑娱乐君每一天
2026-02-17 10:35:30
程潇:这姐一直都是,汹涌澎湃的

程潇:这姐一直都是,汹涌澎湃的

手工制作阿歼
2026-02-06 11:10:47
痛心!10岁男童吃猪脚卡喉身亡!母亲发声:为什么一口肉就要了他的命

痛心!10岁男童吃猪脚卡喉身亡!母亲发声:为什么一口肉就要了他的命

福建卫生报
2026-02-15 17:59:57
中日开战可能性增大,但收场太难,若真动手,中方估计半步都不退

中日开战可能性增大,但收场太难,若真动手,中方估计半步都不退

百态人间
2026-01-03 16:42:15
女子喊话亲戚:过年别送华丽礼盒,要送就送米面粮油卫生纸

女子喊话亲戚:过年别送华丽礼盒,要送就送米面粮油卫生纸

看晓天下事
2026-02-17 15:27:38
台湾终极解决方案:土地回归中国,人员往来自由,逃走不是中国人

台湾终极解决方案:土地回归中国,人员往来自由,逃走不是中国人

混沌录
2026-02-10 22:36:08
央媒怒批、坑害老百姓!臭名昭著的五大相声演员,各个难以原谅

央媒怒批、坑害老百姓!臭名昭著的五大相声演员,各个难以原谅

青橘罐头
2026-02-16 16:23:28
注意!春节不要乱发这种视频,有风险

注意!春节不要乱发这种视频,有风险

南安融媒
2026-02-17 16:04:40
断层收视第一,骂声全网刷屏!2026辽视春晚,烂得彻头彻尾

断层收视第一,骂声全网刷屏!2026辽视春晚,烂得彻头彻尾

翰飞观事
2026-02-16 09:22:31
爷爷把拆迁款346万全给了堂哥,我没吵,除夕夜大伯打电话

爷爷把拆迁款346万全给了堂哥,我没吵,除夕夜大伯打电话

小秋情感说
2026-02-17 15:20:03
发现广东一女子,奇思妙想“用绿植做隔断墙”,一进门就被治愈了

发现广东一女子,奇思妙想“用绿植做隔断墙”,一进门就被治愈了

三农老历
2026-02-17 09:11:23
不出意外的话,中国未来有超过一半的人口,或将会流入到这些地方

不出意外的话,中国未来有超过一半的人口,或将会流入到这些地方

灿若银烂
2026-02-12 01:17:52
租地赚钱?小心“钱地两空”!三大陷阱农民必须警惕!

租地赚钱?小心“钱地两空”!三大陷阱农民必须警惕!

眼界看视野
2026-02-17 15:50:22
打脸!特朗普“金主”要把业务外包给中国

打脸!特朗普“金主”要把业务外包给中国

观察者网
2026-02-17 16:06:43
在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

南权先生
2026-02-12 15:39:07
闫学晶最愁的不是代言掉没掉,儿子上啥班,而是儿媳妇徐梦迪

闫学晶最愁的不是代言掉没掉,儿子上啥班,而是儿媳妇徐梦迪

冷紫葉
2026-01-23 15:34:10
坐3.6亿飞机,戴1000万名表,拿5000万炒股的秦奋究竟什么背景

坐3.6亿飞机,戴1000万名表,拿5000万炒股的秦奋究竟什么背景

涵豆说娱
2026-01-19 17:21:55
专家确认世界稀有,贵州农民曾拿来烧火,2013年明令禁止外流

专家确认世界稀有,贵州农民曾拿来烧火,2013年明令禁止外流

万象硬核本尊
2025-11-21 23:54:23
2026-02-17 16:36:50
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1430文章数 5081关注度
往期回顾 全部

科技要闻

春晚这些机器人是怎样做到的?

头条要闻

易烊千玺提醒:境外势力渗透手法极具欺骗性

头条要闻

易烊千玺提醒:境外势力渗透手法极具欺骗性

体育要闻

谷爱凌:'不小心"拿到了银牌 祝大家马年大吉

娱乐要闻

春晚三大感人瞬间:周深于和伟上榜

财经要闻

大年初一,这三件事很不寻常

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

手机
本地
家居
数码
教育

手机要闻

马年快乐!苹果CEO库克给大家拜年了

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

家居要闻

中古雅韵 乐韵伴日常

数码要闻

战意永燃:雷蛇推出《反恐精英》职业选手NiKo联名款外设

教育要闻

高考红包数字揭秘!这样送才吉利

无障碍浏览 进入关怀版