网易首页 > 网易号 > 正文 申请入驻

Science子刊 |首个面向医学图像生成公平性方法FairDiffusion来了

0
分享至

编辑 | ScienceAI

随着人工智能在医学影像领域的广泛应用,文本到图像扩散模型(如 Stable Diffusion)正逐步渗透到医学数据合成、医学教育和数据共享中。然而,尽管生成质量整体较高,模型在不同人口统计属性(性别、种族、族裔)上却存在明显差异。例如,实验表明,Stable Diffusion 在生成女性、白人及非西班牙裔样本时图像细节和临床特征更为突出,而在男性、亚洲人及西班牙裔样本上则表现欠佳。这种不均衡现象直接影响了后续临床特征检测、病情预测及诊断准确性,进而可能加剧医疗资源分配的不公平问题。

最近,来自哈佛大学和纽约大学等机构的研究者首次探讨了医学影像生成中的公平性问题,研究论文以《FairDiffusion: Enhancing Equity in Latent Diffusion Models via Fair Bayesian Perturbation》为题发表在《Science Advances》上。

  • 论文链接:https://www.science.org/doi/full/10.1126/sciadv.ads4593
  • 数据集和代码链接:https://github.com/Harvard-Ophthalmology-AI-Lab/FairDiffusion

研究团队认为医学影像生成存在以下挑战:

  • 噪声建模与分布不匹配问题

扩散模型的噪声去除假设数据服从统一分布,但真实医学数据在不同群体间存在分布偏移,导致单一全局损失难以平衡各群体的生成质量。

  • 公平性指标缺乏

传统指标(如 FID、IS)只关注总体质量,无法揭示不同群体间的性能差异。因此,该研究提出了 ES-FID、ES-IS 和公平 AUC(ES-AUC)等新指标,用于量化群体间的公平性。

  • 公平调控机制设计难题

如何在保证整体生成质量的同时,自适应地调节各群体的损失权重,是当前技术的一大难点。为此,该研究引入了公平贝叶斯扰动机制,通过针对不同群体施加自适应高斯扰动,缩小群体间的误差差距。

数据集与公平性问题探讨

公平性研究需要高质量且具备多维敏感属性标注的数据。为此,该研究构建了 FairGenMed 数据集,其主要特点如下:

  • 数据来源与采集

FairGenMed 基于真实临床 SLO 眼底图像,数据采自一家大型学术眼科医院,覆盖 2015 至 2022 年期间的患者数据,并附带详细的临床指标(如青光眼风险、杯盘比、视野缺损程度等)。

  • 多维敏感属性标注

数据集中详细标注了性别、种族、族裔、首选语言、婚姻状况等敏感属性,允许针对不同群体单独分析,揭示模型在弱势群体上存在的性能不足问题。

  • 公平性问题的实际背景

在医学影像领域,不同群体由于生理差异和疾病风险的不同,在病理表现上可能存在细微区别。如果生成模型不能平衡学习这些差异,可能导致弱势群体的影像质量不达标,增加误诊风险,进而引发伦理和社会公平问题。

  • 数据集意义

FairGenMed 不仅为生成模型提供了充足且多样化的训练样本,同时也为公平性指标(如 ES-FID、ES-IS、ES-AUC)的设计提供了坚实的数据基础,有助于推动医学生成模型在公平性与实用性上的双重提升。

方法与技术细节

在上述背景与数据集支持下,该研究提出了 FairDiffusion 方法,其核心技术细节包括:

基础扩散模型损失:标准 LDM 的去噪损失定义为:

公平贝叶斯扰动机制:为自适应调节各群体损失贡献,该研究在损失中引入扰动因子:

群体间损失差异量化为衡量批次内各群体误差的不均衡,该研究定义了平均损失差异这一指标用于指导贝叶斯优化过程中扰动参数的更新。

贝叶斯优化与参数更新:该研究将扰动参数的最优求解转化为贝叶斯优化问题:

采用上置信界(UCB)作为采集函数,并用以下规则更新参数:

这一过程实现了探索与利用的平衡,逐步缩小群体间的性能差异。

公平评价指标:除了传统的 FID 和 IS 指标,该研究设计了公平扩展指标:

以及公平 AUC(ES-AUC)指标,用于评估生成图像与文本提示间的语义一致性。

结果

  • 图像视觉效果对比

在新增的定性可视化图(图 2)中,该研究展示了真实 SLO 眼底图像、Stable Diffusion 生成的图像与 FairDiffusion 生成图像的对比。可以明显看出,FairDiffusion 生成的图像不仅结构更为清晰,而且在纹理和细节上更接近真实图像,尤其是在原本容易出现模糊和细节缺失的弱势群体样本上,优势更为明显。

  • 整体生成性能提升

如下面几张图所示,该研究在 SLO 眼底图像上对比了 FairDiffusion 与 Baseline 模型(例如 Stable Diffusion 和 Debiased Diffusion)的 FID 和 IS 指标。FairDiffusion 取得了显著更低的 FID 值和更高的 IS 值,证明了其在整体图像生成质量上的优势。此外,通过 ES-FID 和 ES-IS 指标,可以看到各敏感群体(性别、种族、族裔)之间的性能差距明显缩小。例如,在白人、亚洲人和黑人群体中,FairDiffusion 减少了最大误差差距(最大 - 最小 FID 值)的幅度,确保生成图像在各群体间更为一致。

非眼科数据集结果

在 HAM10000 皮肤病图像(图 6,8)和 CheXpert 胸部 X 光影像(图 6,8)上,该研究同样验证了 FairDiffusion 的有效性。对于 HAM10000 数据集,下图展示了 FairDiffusion 在不同年龄和性别组上的 ES-FID 和 ES-IS 指标均有大幅提升;而在 CheXpert 数据集中,无论是针对性别还是种族的细分指标,FairDiffusion 均实现了 FID 降低和 IS 提升的目标。这表明该研究的公平贝叶斯扰动机制在跨模态任务中均能稳定发挥作用,提升各群体的生成质量和公平性。

语义一致性与临床相关性

该研究还设计了分类任务,对生成图像与文本提示之间的语义相关性进行评估。通过公平 AUC(ES-AUC)指标(图 7),可以观察到 FairDiffusion 生成的图像与临床特征描述具有更高的一致性,特别是在青光眼和杯盘比的分类任务中,弱势群体的 AUC 值均有明显提升。这一结果进一步证明了方法在提升医学语义相关性方面的有效性。

总结与展望

本论文首次探讨了医学影像生成中的公平性问题,并提出了基于公平贝叶斯扰动的 FairDiffusion 方法,并构建了具备多维敏感属性标注的 FairGenMed 数据集。通过对比实验,该研究证明了该方法在整体图像质量和各群体间公平性(通过 ES-FID、ES-IS 和 ES-AUC 指标)的双重提升效果。未来,研究团队将进一步扩充数据集规模、丰富敏感属性维度,并探索更多应用场景下的公平生成策略,以推动医学生成模型在全球医疗影像领域实现更为普惠、公正的应用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
澳网演绎神剧本:首位前十种子出局 王欣瑜创造最佳 32强对阵如下

澳网演绎神剧本:首位前十种子出局 王欣瑜创造最佳 32强对阵如下

侃球熊弟
2026-01-23 00:05:03
2026 年最严麻将馆整治,打牌不能再“任性”!

2026 年最严麻将馆整治,打牌不能再“任性”!

达文西看世界
2026-01-22 16:23:28
贝克汉姆家族彻底决裂,大儿子被逼反目成仇,婚外情当事人发声

贝克汉姆家族彻底决裂,大儿子被逼反目成仇,婚外情当事人发声

艺兔体坛
2026-01-21 23:20:16
房东服软想过个好年?与嫣然有一次沟通,望法院协调拿捐款抵房租

房东服软想过个好年?与嫣然有一次沟通,望法院协调拿捐款抵房租

安宁007
2026-01-22 03:41:54
国家下狠手了!体制内大地震,少爷、公主们的“天”,要塌了

国家下狠手了!体制内大地震,少爷、公主们的“天”,要塌了

霹雳炮
2026-01-19 22:24:13
敢拦就开战?美国给“台独”递刀,中方:公海销毁没商量

敢拦就开战?美国给“台独”递刀,中方:公海销毁没商量

华山穹剑
2026-01-19 21:32:59
美图公司向全体员工发放股票奖励,总价值超2000万元

美图公司向全体员工发放股票奖励,总价值超2000万元

IT之家
2026-01-22 20:53:10
重庆警方通报“男子因摩托车加油纠纷把燃油喷洒地面”:张某因加油被拒,向地面喷洒约1升汽油,已被行拘,罚款100元,驾驶证记1分

重庆警方通报“男子因摩托车加油纠纷把燃油喷洒地面”:张某因加油被拒,向地面喷洒约1升汽油,已被行拘,罚款100元,驾驶证记1分

极目新闻
2026-01-22 19:28:40
自然资源部:坚决拥护党中央决定

自然资源部:坚决拥护党中央决定

新京报
2026-01-22 21:25:13
难以置信!一家长称已放弃初二女儿的学习,并退出家长群,引争议

难以置信!一家长称已放弃初二女儿的学习,并退出家长群,引争议

火山诗话
2026-01-21 06:07:03
问政江苏|镇江丹徒一处3600平违建存续8年?属地政府:违建人患病,不能强拆

问政江苏|镇江丹徒一处3600平违建存续8年?属地政府:违建人患病,不能强拆

扬子晚报
2026-01-22 14:32:57
贾国龙适合办机关食堂

贾国龙适合办机关食堂

次元君情感
2026-01-22 04:03:48
十年前:“中国真是搞笑,搞什么中欧班列,现在成为笑柄了吧!”

十年前:“中国真是搞笑,搞什么中欧班列,现在成为笑柄了吧!”

扶苏聊历史
2026-01-22 12:13:57
几十年前,人们拿河蚌打牙祭,为啥现在没人吃了?有多难吃难做?

几十年前,人们拿河蚌打牙祭,为啥现在没人吃了?有多难吃难做?

向航说
2026-01-22 00:25:03
西贝拿到“救命钱”,然后呢

西贝拿到“救命钱”,然后呢

中国新闻周刊
2026-01-22 16:05:02
1982年河南200枪支失窃,多年未破,一退休干警查出真相,遭灭口

1982年河南200枪支失窃,多年未破,一退休干警查出真相,遭灭口

文史道
2026-01-21 18:08:19
马云预言兑现?2026年手上还握有存款的人,别忽视这三大现实

马云预言兑现?2026年手上还握有存款的人,别忽视这三大现实

来科点谱
2025-12-29 09:01:09
美军舰护航对台军售船闯台海,百架F35撑腰,中方亮杀招硬刚到底

美军舰护航对台军售船闯台海,百架F35撑腰,中方亮杀招硬刚到底

达文西看世界
2026-01-22 09:28:01
贝克汉姆次子在家族风波后首露面,带着哥哥布鲁克林的“前女友”

贝克汉姆次子在家族风波后首露面,带着哥哥布鲁克林的“前女友”

译言
2026-01-21 21:34:08
40岁童瑶罕秀恩爱,和富商老公云南旅游,夫妻俩穿藏服吃浪漫晚餐

40岁童瑶罕秀恩爱,和富商老公云南旅游,夫妻俩穿藏服吃浪漫晚餐

离离言几许
2026-01-22 21:50:30
2026-01-23 00:35:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1215文章数 223关注度
往期回顾 全部

科技要闻

几千亿只是开胃菜,AI基建还得再砸几万亿

头条要闻

猝死程序员底薪3千24小时待命 公司前三季度营收180亿

头条要闻

猝死程序员底薪3千24小时待命 公司前三季度营收180亿

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

车银优赚800亿 涉嫌逃税200亿!

财经要闻

西贝拿到“救命钱”,然后呢

汽车要闻

配备多块娱乐屏 极氪8X内饰曝光

态度原创

游戏
艺术
亲子
旅游
军事航空

LPL春季赛:让一追二,NIP三局击溃WE

艺术要闻

一场雪,飘进了唐诗

亲子要闻

真相很可怕!终于揭秘:为什么你记不住3岁前的事?

旅游要闻

当“魔法世界”遇见大湾区:一次文旅投资的双向探索

军事要闻

普京:愿意向"和平委员会"提供10亿美元

无障碍浏览 进入关怀版