网易首页 > 网易号 > 正文 申请入驻

Science子刊 |首个面向医学图像生成公平性方法FairDiffusion来了

0
分享至

编辑 | ScienceAI

随着人工智能在医学影像领域的广泛应用,文本到图像扩散模型(如 Stable Diffusion)正逐步渗透到医学数据合成、医学教育和数据共享中。然而,尽管生成质量整体较高,模型在不同人口统计属性(性别、种族、族裔)上却存在明显差异。例如,实验表明,Stable Diffusion 在生成女性、白人及非西班牙裔样本时图像细节和临床特征更为突出,而在男性、亚洲人及西班牙裔样本上则表现欠佳。这种不均衡现象直接影响了后续临床特征检测、病情预测及诊断准确性,进而可能加剧医疗资源分配的不公平问题。

最近,来自哈佛大学和纽约大学等机构的研究者首次探讨了医学影像生成中的公平性问题,研究论文以《FairDiffusion: Enhancing Equity in Latent Diffusion Models via Fair Bayesian Perturbation》为题发表在《Science Advances》上。

  • 论文链接:https://www.science.org/doi/full/10.1126/sciadv.ads4593
  • 数据集和代码链接:https://github.com/Harvard-Ophthalmology-AI-Lab/FairDiffusion

研究团队认为医学影像生成存在以下挑战:

  • 噪声建模与分布不匹配问题

扩散模型的噪声去除假设数据服从统一分布,但真实医学数据在不同群体间存在分布偏移,导致单一全局损失难以平衡各群体的生成质量。

  • 公平性指标缺乏

传统指标(如 FID、IS)只关注总体质量,无法揭示不同群体间的性能差异。因此,该研究提出了 ES-FID、ES-IS 和公平 AUC(ES-AUC)等新指标,用于量化群体间的公平性。

  • 公平调控机制设计难题

如何在保证整体生成质量的同时,自适应地调节各群体的损失权重,是当前技术的一大难点。为此,该研究引入了公平贝叶斯扰动机制,通过针对不同群体施加自适应高斯扰动,缩小群体间的误差差距。

数据集与公平性问题探讨

公平性研究需要高质量且具备多维敏感属性标注的数据。为此,该研究构建了 FairGenMed 数据集,其主要特点如下:

  • 数据来源与采集

FairGenMed 基于真实临床 SLO 眼底图像,数据采自一家大型学术眼科医院,覆盖 2015 至 2022 年期间的患者数据,并附带详细的临床指标(如青光眼风险、杯盘比、视野缺损程度等)。

  • 多维敏感属性标注

数据集中详细标注了性别、种族、族裔、首选语言、婚姻状况等敏感属性,允许针对不同群体单独分析,揭示模型在弱势群体上存在的性能不足问题。

  • 公平性问题的实际背景

在医学影像领域,不同群体由于生理差异和疾病风险的不同,在病理表现上可能存在细微区别。如果生成模型不能平衡学习这些差异,可能导致弱势群体的影像质量不达标,增加误诊风险,进而引发伦理和社会公平问题。

  • 数据集意义

FairGenMed 不仅为生成模型提供了充足且多样化的训练样本,同时也为公平性指标(如 ES-FID、ES-IS、ES-AUC)的设计提供了坚实的数据基础,有助于推动医学生成模型在公平性与实用性上的双重提升。

方法与技术细节

在上述背景与数据集支持下,该研究提出了 FairDiffusion 方法,其核心技术细节包括:

基础扩散模型损失:标准 LDM 的去噪损失定义为:

公平贝叶斯扰动机制:为自适应调节各群体损失贡献,该研究在损失中引入扰动因子:

群体间损失差异量化为衡量批次内各群体误差的不均衡,该研究定义了平均损失差异这一指标用于指导贝叶斯优化过程中扰动参数的更新。

贝叶斯优化与参数更新:该研究将扰动参数的最优求解转化为贝叶斯优化问题:

采用上置信界(UCB)作为采集函数,并用以下规则更新参数:

这一过程实现了探索与利用的平衡,逐步缩小群体间的性能差异。

公平评价指标:除了传统的 FID 和 IS 指标,该研究设计了公平扩展指标:

以及公平 AUC(ES-AUC)指标,用于评估生成图像与文本提示间的语义一致性。

结果

  • 图像视觉效果对比

在新增的定性可视化图(图 2)中,该研究展示了真实 SLO 眼底图像、Stable Diffusion 生成的图像与 FairDiffusion 生成图像的对比。可以明显看出,FairDiffusion 生成的图像不仅结构更为清晰,而且在纹理和细节上更接近真实图像,尤其是在原本容易出现模糊和细节缺失的弱势群体样本上,优势更为明显。

  • 整体生成性能提升

如下面几张图所示,该研究在 SLO 眼底图像上对比了 FairDiffusion 与 Baseline 模型(例如 Stable Diffusion 和 Debiased Diffusion)的 FID 和 IS 指标。FairDiffusion 取得了显著更低的 FID 值和更高的 IS 值,证明了其在整体图像生成质量上的优势。此外,通过 ES-FID 和 ES-IS 指标,可以看到各敏感群体(性别、种族、族裔)之间的性能差距明显缩小。例如,在白人、亚洲人和黑人群体中,FairDiffusion 减少了最大误差差距(最大 - 最小 FID 值)的幅度,确保生成图像在各群体间更为一致。

非眼科数据集结果

在 HAM10000 皮肤病图像(图 6,8)和 CheXpert 胸部 X 光影像(图 6,8)上,该研究同样验证了 FairDiffusion 的有效性。对于 HAM10000 数据集,下图展示了 FairDiffusion 在不同年龄和性别组上的 ES-FID 和 ES-IS 指标均有大幅提升;而在 CheXpert 数据集中,无论是针对性别还是种族的细分指标,FairDiffusion 均实现了 FID 降低和 IS 提升的目标。这表明该研究的公平贝叶斯扰动机制在跨模态任务中均能稳定发挥作用,提升各群体的生成质量和公平性。

语义一致性与临床相关性

该研究还设计了分类任务,对生成图像与文本提示之间的语义相关性进行评估。通过公平 AUC(ES-AUC)指标(图 7),可以观察到 FairDiffusion 生成的图像与临床特征描述具有更高的一致性,特别是在青光眼和杯盘比的分类任务中,弱势群体的 AUC 值均有明显提升。这一结果进一步证明了方法在提升医学语义相关性方面的有效性。

总结与展望

本论文首次探讨了医学影像生成中的公平性问题,并提出了基于公平贝叶斯扰动的 FairDiffusion 方法,并构建了具备多维敏感属性标注的 FairGenMed 数据集。通过对比实验,该研究证明了该方法在整体图像质量和各群体间公平性(通过 ES-FID、ES-IS 和 ES-AUC 指标)的双重提升效果。未来,研究团队将进一步扩充数据集规模、丰富敏感属性维度,并探索更多应用场景下的公平生成策略,以推动医学生成模型在全球医疗影像领域实现更为普惠、公正的应用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“跟儿子有啥区别?”女子晒博士老公不会穿裤子,网友看不下去了

“跟儿子有啥区别?”女子晒博士老公不会穿裤子,网友看不下去了

妍妍教育日记
2026-01-16 16:45:46
皇马最大的麻烦是维尼修斯,阿韦洛亚有魄力与他“决裂”吗?

皇马最大的麻烦是维尼修斯,阿韦洛亚有魄力与他“决裂”吗?

篮球看比赛
2026-01-17 12:20:18
中俄情侣的生理差异:婚前未了解或引发婚后矛盾

中俄情侣的生理差异:婚前未了解或引发婚后矛盾

特约前排观众
2025-12-16 00:10:07
57岁孔祥东现状:和80母亲上海生活,女儿定居美国,祖孙三代真像

57岁孔祥东现状:和80母亲上海生活,女儿定居美国,祖孙三代真像

比利
2025-12-30 15:50:09
97岁田华现状曝光,和小孙子相依为命,住破旧老房子,日子清贫

97岁田华现状曝光,和小孙子相依为命,住破旧老房子,日子清贫

以茶带书
2025-12-02 18:11:43
儿子失业后我才发现:比不孝更可悲的是,把孩子养成高学历的废物

儿子失业后我才发现:比不孝更可悲的是,把孩子养成高学历的废物

人间百态大全
2026-01-17 06:35:03
李小孩的“小绿瓶”,在国博很没存在感,为何永久禁止出境?

李小孩的“小绿瓶”,在国博很没存在感,为何永久禁止出境?

收藏大视界
2026-01-04 17:32:26
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
国乒爆冷丢冠!蒯曼陈熠惨败!世界冠军2:0遭逆转,日本包揽冠亚军!

国乒爆冷丢冠!蒯曼陈熠惨败!世界冠军2:0遭逆转,日本包揽冠亚军!

好乒乓
2026-01-17 12:57:37
46岁秦岚大孤山素颜祈福引爆网络,皮肤状态惊呆网友:这哪是奔五的人?

46岁秦岚大孤山素颜祈福引爆网络,皮肤状态惊呆网友:这哪是奔五的人?

草莓解说体育
2026-01-17 13:19:47
乞讨母女睡地铁站7年,站务员从不驱逐,母亲:你过来给你看样东西

乞讨母女睡地铁站7年,站务员从不驱逐,母亲:你过来给你看样东西

星宇共鸣
2025-09-17 17:52:27
人民日报曾怒批餐饮粗暴干预!禁止违规吃喝不是禁止吃喝!

人民日报曾怒批餐饮粗暴干预!禁止违规吃喝不是禁止吃喝!

达文西看世界
2026-01-16 18:30:36
铁杆朋友临阵倒戈?签下屈辱条约,只为避美锋芒,中国真心终错付

铁杆朋友临阵倒戈?签下屈辱条约,只为避美锋芒,中国真心终错付

墨印斋
2026-01-17 15:03:09
很多东西正着不好用,一旦你将它反过来,就会打开新世界大门

很多东西正着不好用,一旦你将它反过来,就会打开新世界大门

新住家居
2025-12-21 18:09:16
软饭硬吃?18次上春晚全靠老婆,结婚28年身上没有一分积蓄

软饭硬吃?18次上春晚全靠老婆,结婚28年身上没有一分积蓄

庸人自扰0607
2026-01-17 12:21:58
恭喜皇马!齐达内考虑复出,采访透露秘诀,姆巴佩偷着乐

恭喜皇马!齐达内考虑复出,采访透露秘诀,姆巴佩偷着乐

阿泰希特
2026-01-17 11:24:55
他是我军首任王牌军长,55年被降级授衔,毛主席震怒:开除党籍

他是我军首任王牌军长,55年被降级授衔,毛主席震怒:开除党籍

大运河时空
2026-01-16 14:45:03
美国政府又有新点子,赖清德彻底栽了,台湾舆论炸锅:怎么不去抢

美国政府又有新点子,赖清德彻底栽了,台湾舆论炸锅:怎么不去抢

乐天闲聊
2026-01-17 14:43:52
每吃一次,大脑萎缩就快一步?劝告:6种食物或是老年痴呆“催化剂”

每吃一次,大脑萎缩就快一步?劝告:6种食物或是老年痴呆“催化剂”

今日养生之道
2026-01-11 11:29:46
翁帆发文思念杨振宁:我不图锦衣玉食,而是把灵魂放在更高的坐标

翁帆发文思念杨振宁:我不图锦衣玉食,而是把灵魂放在更高的坐标

金牌娱乐
2026-01-16 09:18:29
2026-01-17 15:48:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1210文章数 223关注度
往期回顾 全部

科技要闻

8亿周活扛不住烧钱 ChatGPT终向广告"低头"

头条要闻

女儿被前男友杀害 癌症晚期母亲熬439天等到死刑判决

头条要闻

女儿被前男友杀害 癌症晚期母亲熬439天等到死刑判决

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

徐家还是爱孩子的,在马筱梅生产前选择和解

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

房产
手机
教育
时尚
健康

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

手机要闻

iPhone 18 Pro和iPhone Fold将首发苹果A20 Pro芯片:2nm工艺

教育要闻

1335 万!高考人数 8 年首降,这些省份反而逆势增长

岁月不败美人,50岁她们比20岁更好看

血常规3项异常,是身体警报!

无障碍浏览 进入关怀版