网易首页 > 网易号 > 正文 申请入驻

MICCAI 2024 | 开创性Point-Image Diffusion助力医学图像公平分割

0
分享至

近日,来自清华大学智能产业研究院助理教授赵昊老师( https://sites.google.com/view/fromandto )的团队,联合哈佛大学眼科AI实验室,提出了一种名为 Point-Image Diffusion 的眼底图像合成方案。

该方案率先提出“先生成标签,再由标签生成图像”的两段式图像生成范式。point2mask 和 mask2image 的两阶段合成框架既能得到配对标签,又能改善对生成图像分割边界控制。实验结果表明,合成数据质量优于现有方法。面对医学眼底图像分割中针对少数群体的偏见问题,团队通过合成数据与真实数据相结合的方案,提升了医学图像分割模型的公平性。

论文题目: FairDiff: Fair Segmentation with Point-Image Diffusion 论文链接: https://arxiv.org/abs/2407.06250 代码链接: https://github.com/wenyi-li/FairDiff

一、背景介绍

公平性在医学影像分析中是一个重要课题,特别是在不同目标群体训练数据不平衡的情况下。为了解决这一问题,我们提出了一种基于混合数据的策略,通过引入少数群体的合成图像来增强数据公平性。

通过扫描激光眼底成像(SLO)来判断眼部的杯盘比(Cup-Disc Ratio),在诊断一系列眼部疾病中非常重要。然而,不同种族的眼底解剖结构存在差异。例如,黑人通常比其他种族有更大的杯盘比,而亚洲人比白人更容易患上角闭性青光眼。因此,当训练数据不平衡时,针对SLO图像的分割模型往往会带有对某一特定群体的偏见。但是,获取少数群体中患者的真实样本数据是一件十分费时费力的事情,因此,引入合成数据成为了一种解决方案。

然而,在生成合成图像方面,以往的工作要么缺乏配对标签,要么无法精确控制合成图像的边界与标签对齐。为解决这个问题,我们采用了一种联合优化的方法,通过优化三个网络以实现经验风险最小化和公平性最大化。具体实现上,我们创新地提出了一种Point-Image Diffusion 架构,利用 3D 点云通过 point-mask-image 合成框架既能得到配对标签,又能改善边界控制。实验证明,这种方法在扫描激光眼底成像(SLO)图像上的合成效果显著优于现有技术。通过在训练阶段将高质量合成数据与真实数据结合,我们的模型与目前最好的公平学习模型相比,实现了更高的公平分割性能。

二、方法

2.1 概述

本文采用了一种全新的 Point-Image Diffusion 架构。首先,我们将图像的分割 mask 从 2D 转化为 3D,以更好的利用三维空间坐标。然后,通过点云扩散模型生成丰富的 3D 点云分布,增强分割 mask 的多样性。接下来,利用mask 作为 ControlNet 的控制条件,生成高质量的 SLO 图像。最后,将生成的合成数据与真实数据混合,以弥补少数群体样本的不足。训练时的目标是优化整个模型的公平性和分割性能。

2.2 Point-Mask 生成

为了生成多样的眼底图像并获得精确的配对标签,我们首先使用真实数据的标签来增强分割 mask。具体来说,我们将 2D mask 图像转换为 3D 点云,以更好地捕捉分割边界的坐标。给定一个大小为 的 2D 掩模图像, 和 分别是图像的宽度和高度。函数 将 映射到 3D 点云 进行训练。 定义如下:

其中 是图像 中像素的坐标, 表示位于分割边界上的像素, 是一个基于像素位置分配 值的函数。 定义如下:

将现有的 2D 标签转换为 3D 点云后,我们采用点云扩散模型学习来学习这些点云的分布。这个模型的主要训练目标是模拟一个随机扩散过程的逆过程,学习从正态分布到真实点云的分布。在训练阶段,我们在点云中引入不同程度的随机噪声,并确保去噪模型预测的噪声与实际添加的噪声非常接近。对于敏感属性 的每个组 ,我们训练一个点云扩散模型 。由于 能够有效捕捉不同人群的眼底杯盘轮廓特征,我们可以有选择地增强不同组的样本,特别是对于少数群体。通过这种方法,我们为后续的数据混合准备了标签集。

2.3 Mask-Image 生成

在生成了分割 mask 后,下一步是合成图像。我们使用了 ControlNet ,将上一步的 mask 作为控制条件指导图像生成。ControlNet 通过冻结原始的 Stable Diffusion 模块参数,并将其复制到一个可训练的副本中,通过额外的卷积层进行连接。在训练过程中,网络逐渐根据输入条件调整输出,从而实现对原始特征图的控制,生成高质量的图像。利用 ControlNet,我们不仅能生成与真实图像风格相似的眼底SLO图像,还能保证生成的图像与分割 mask 之间的一致性,从而得到配对的图像-标签。

具体来说, 上一步生成的标签 被编码成 token ,然后将这些 token 输入到 ControlNet 中。ControlNet 的输出 如下所示:

其中 是 ControlNet 块的输出, 表示零卷积层, 和 是两个零卷积层的参数。在训练开始时,由于零卷积层的权重和偏置初始化为零, 等于 ,确保不会向网络的隐藏状态引入有害噪声。随着训练的进行,零卷积层根据输入条件 逐 渐调整输出,从而实现对原始特征图 的控制。

2.4 等规模数据组合

为了最终使得我们合成的数据能够提升整个医学图像分割任务中的公平性,我们提出了一种简单而有效的数据组合方法,即等规模数据组合。通过在所有敏感群体样本规模来确保公平性。

假设我们有来自真实数据分布和合成数据分布的样本点集合,如果某个群体的样本量不足,我们会生成额外的合成样本;如果样本量过多,则进行随机抽样。最终目标是让不同群体的样本数量一致。例如,由于医疗设备有限,黑人的眼底数据样本数远低于白人,我们可以通过数据的合成和采样的方式,增加黑人眼底数据的样本数量,达到与白人样本数量相同的规模。这种方法能够从数据角度解决不平衡问题,确保每个敏感群体在训练数据集中都有足够的样本量。

三、实验和结果

3.1 数据集

我们使用 Harvard-FairSeg 数据集作为真实的 SLO 眼底图像数据集,该数据集涵盖了六个关键属性:年龄、性别、种族、族裔、语言偏好和婚姻状况。测试上,无论是只使用真实数据,还是使用合成数据与真实数据的混合,所有模型都在 Harvard-FairSeg 的 2000 张真实的 SLO 眼底图像上进行测试。

3.2 合成图像结果

评估指标为了评估生成质量,我们采用了几种度量指标,包括Fréchet Inception 距离(FID)、最小匹配距离(MMD)和覆盖率得分(COV)。

FID基于 Inception 网络的特征提取能力,评估生成图像的分布与真实图像分布之间的差异。

最小匹配距离(Minimum Matching Distance, MMD)得分用于衡量生成样本的保真度。它通过计算生成样本与真实样本之间的最小匹配距离的平均值来评估生成模型的质量。这里定义了图像 与图像 之间的距离 为:

其中 表示两幅图像之间的余弦相似度。

覆盖率得分(Coverage, COV)表示真实样本中至少与生成图像中的一幅图像匹配的比例。对于生成集 和参考的真实集 , COV 得分定义为:

实验结果我们将我们的 Point-Image 图像生成方法与几种最先进的方法进行了比较,包括 Stable Diffusion 1.5 , pix2pixHD, OASIS, SPADE 和ControlNet 。如表1所示,我们的方法在SLO眼底图像合成方面显著优于现有技术。值得注意的是,我们的方法获得了最低的FID得分,这表明与其它方法相比,我们生成的图像与实际图像更为相似。此外,MMD结果表明,我们的方法也能更准确地复制原始图像数据集的分布。

针对 two-stage 扩散模型的消融研究与 ControlNet(one-stage的标签到图像生成模型)相比,我们的 two-stage 流程首先采样标签,然后合成图像,在生成多样化图像方面显示出了有效性。这一点反映在评估方法中最高的覆盖率(COV)得分上。图像质量和多样性的提升凸显了我们图像合成技术的有效性。下图展示了合成图像的结果。

3.3 公平性分割结果

为了验证我们的合成数据对分割和公平性的影响,我们选择了两种分割模型,包括一个较小的模型 TransUNet 和一个较大的模型 SAMed。

在分割模型的训练中,遵循 Harvard-FairSeg的实验设置,我们采用了交叉熵和 Dice 损失的组合作为训练损失。对于训练样本的数量,无论是使用全部真实数据还是真实与合成数据的混合,我们都控制在8000个样本。

按照之前的研究,我们使用公平性分割性能(Equity-Scaled Segmentation Performance,ESSP来衡量分割结果的公平性。ESSP 的定义为:

其中, 是 Dice 或 IoU 指标。ES-Dice 和 ES-IoU 指标考虑了所有群体的分割性能和公平性,而传统的总体 Dice 和 IoU 指标只评估分割性能。

在比较分析中,我们对比了我们提出的等规模数据组合(Equal Scale)方法与几种最先进的公平性学习方法(包括 ADV、GroupDRO 和 FairSeg)的性能差异。实验涵盖了四个公平性敏感属性(种族、性别、语言、民族)。部分实验结果如下表所示。

从种族公平性的角度来看,表2体现了我们的等规模方法的有效性,在所有种族群体(包括亚洲人、黑人和白人)中,cup 区和 rim 区均取得了最高的 ES-Dice 分数,分别为 0.8397 和 0.7697。ES-IoU 指标也验证了我们的方法,证明其在实现准确且公平的分割方面的有效性。

其他实验结果也表明,我们的方法提高公平性指标(ES-Dice 和 ES-IoU)以及分割指标(Dice 和 IoU)上的能力。

四、总结

在本研究中,我们分析了医学图像分割中的公平性问题,并通过使用合成数据来解决数据不平衡的挑战。我们提出了一种新颖的 Point-Image Diffusion方法,用于合成 SLO 眼底图像,并且在该领域显著优于现有技术。在训练阶段通过使用等规模方法结合合成数据和真实数据,我们在多个敏感属性上实现了准确性和公平性的全面提升。这一研究不仅为医学图像分析提供了新的解决方案,还为未来的公平性研究奠定了基础。

llustration From IconScout By Delesign Graphic

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

www.techbeat.net
) 。 社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
党龄满50年老党员,每月补贴多少?3步自查分三类

党龄满50年老党员,每月补贴多少?3步自查分三类

王二哥老搞笑
2026-07-01 16:33:24
金价真的是一夜变天,7月1日新报价,全国金价竟然差这么多?

金价真的是一夜变天,7月1日新报价,全国金价竟然差这么多?

次元君情感
2026-07-01 14:28:08
全球拒接奥运,奥委会关注中国,中方回应2036台北见

全球拒接奥运,奥委会关注中国,中方回应2036台北见

烟雨洛神生
2026-06-23 22:54:59
赌王千金何超欣追星宋雨琦后台合影,贴脸挽手宛如闺蜜,关系很好

赌王千金何超欣追星宋雨琦后台合影,贴脸挽手宛如闺蜜,关系很好

奇怪的鲨鱼们
2026-06-30 10:13:42
33岁章泽天谈“死亡”,想满足3个条件,只谈3个孩子绝口不提老公

33岁章泽天谈“死亡”,想满足3个条件,只谈3个孩子绝口不提老公

椰黄娱乐
2026-07-01 11:12:44
刘世锦:建议划拨20万亿国资充实社保,3年内将储蓄率降至40%以下

刘世锦:建议划拨20万亿国资充实社保,3年内将储蓄率降至40%以下

混沌录
2026-07-01 18:19:12
吉利汽车集团:去年已全系通过电池新国标测试

吉利汽车集团:去年已全系通过电池新国标测试

IT之家
2026-07-01 21:48:09
世界杯:比利时vs塞内加尔,高估与低估之争

世界杯:比利时vs塞内加尔,高估与低估之争

阿错田间生活
2026-07-02 00:20:20
NBA疯狂一夜!9笔签约达成,伦纳德史诗级1换7,詹姆斯官宣离队

NBA疯狂一夜!9笔签约达成,伦纳德史诗级1换7,詹姆斯官宣离队

老侃侃球
2026-07-01 11:17:11
许家印英国豪宅被流浪汉“霸占”?真相:在房屋外搭建临时住处居住3年,未进入或占据豪宅内部

许家印英国豪宅被流浪汉“霸占”?真相:在房屋外搭建临时住处居住3年,未进入或占据豪宅内部

大象新闻
2026-07-02 00:54:16
疯狂!英超第17名砸1.16亿欧签26岁中场:今夏已投2亿 保级保怕了

疯狂!英超第17名砸1.16亿欧签26岁中场:今夏已投2亿 保级保怕了

风过乡
2026-07-02 05:32:04
美国大满贯爆冷!世界第二遭淘汰,温瑞博立功了,国乒赢4场外战

美国大满贯爆冷!世界第二遭淘汰,温瑞博立功了,国乒赢4场外战

十点街球体育
2026-07-01 09:33:51
【2026.7.1】爆姐的饭后爆料:生命不止,爆料不息!

【2026.7.1】爆姐的饭后爆料:生命不止,爆料不息!

娱乐真爆姐
2026-07-02 03:30:59
北京校额到校新政:防住了投机,却误伤了谁?

北京校额到校新政:防住了投机,却误伤了谁?

娱乐的宅急便
2026-07-01 20:29:07
女子每次回婆家都丢首饰,今年她直接戴假金镯,成功揪出“黑手”

女子每次回婆家都丢首饰,今年她直接戴假金镯,成功揪出“黑手”

林林故事揭秘
2025-04-30 13:42:39
比芯片更稀缺!2026四大隐形材料黑马,彻底碾压六氟化钨

比芯片更稀缺!2026四大隐形材料黑马,彻底碾压六氟化钨

林子说事
2026-07-01 13:58:19
为什么荷兰对华态度转变如此急切?

为什么荷兰对华态度转变如此急切?

小眼睛小世界
2026-07-01 06:23:32
WTT爆大冷!男双8强出其4:国乒3-0淘汰2号种子 林诗栋组合也晋级

WTT爆大冷!男双8强出其4:国乒3-0淘汰2号种子 林诗栋组合也晋级

越岭寻踪
2026-07-01 06:37:19
赚翻了!阿森纳放弃 1.3 亿世界杯水货,转头要捡漏顶级边锋!

赚翻了!阿森纳放弃 1.3 亿世界杯水货,转头要捡漏顶级边锋!

澜归序
2026-07-01 06:35:40
始料未及!针对哈里梅根入住皇家庄园,查尔斯方回应“从未邀请”

始料未及!针对哈里梅根入住皇家庄园,查尔斯方回应“从未邀请”

聪明的橙子hj
2026-06-30 16:49:18
2026-07-02 06:36:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2419文章数 596关注度
往期回顾 全部

科技要闻

Claude Code被曝“植入木马”识别中国用户

头条要闻

凯恩梅开二度 英格兰2-1逆转民主刚果将战墨西哥

头条要闻

凯恩梅开二度 英格兰2-1逆转民主刚果将战墨西哥

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

77岁牛群公证裸捐全部财产,清贫独居坚持月捐

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

同比暴涨188.4% 方程豹6月热销35607台

态度原创

艺术
房产
数码
教育
手机

艺术要闻

宋朝:生活品味,比权力和财富更重要!

房产要闻

洞察新局 | 2026年天河置业红盘图鉴

数码要闻

苹果MacBook全面涨价!2026年全球笔记本出货恐下跌13.6%

教育要闻

2026年高考地理广东卷“十宗罪”

手机要闻

TCL华星宣布独供REDMI K90至尊版屏幕:165Hz高刷 40+款游戏原生适配

无障碍浏览 进入关怀版