网易首页 > 网易号 > 正文 申请入驻

香港理工突破:5%标注数据实现AI超声图像精准识别能力提升

0
分享至


这项由香港理工大学、香港中文大学等机构联合开展的研究发表于2024年的《IEEE神经网络与学习系统汇刊》,该研究提出了一种名为"Switch"的创新医学图像分析方法。有兴趣深入了解的读者可以通过DOI编号10.1109/TNNLS.2026.3669814查询完整论文。

在医院里,医生每天都需要观察大量的超声图像来诊断疾病。就像看一张模糊的黑白照片来判断里面是否有异常一样,这是一项既耗时又需要丰富经验的工作。超声图像有着独特的挑战:画面中充满了颗粒状的斑点噪声,组织边界往往模糊不清,而且同样的器官在不同患者身上可能呈现完全不同的形状和位置。

传统的人工智能系统就像一个新手医生,需要看过成千上万张已经标注好的图像才能学会诊断。但是,让专业医生逐一标注这些图像既昂贵又耗时。研究团队面临的核心问题是:能否让人工智能系统像经验丰富的医生一样,仅仅看过少量标注样本,就能准确分析大量未标注的超声图像?

研究团队想出了一个巧妙的解决方案,就像教一个学生通过"拼图游戏"和"变声练习"来快速掌握诊断技能。他们开发的Switch方法包含两个核心创新:多尺度切换策略和频域切换技术。

一、像拼图高手一样组合图像信息

多尺度切换策略的工作原理就像一个经验丰富的拼图爱好者。当你拼一幅复杂的拼图时,你会同时关注大块的色彩区域和小巧的细节部分。研究团队让人工智能系统模仿这种思维方式,将图像分成不同大小的"拼图块":大块用来捕捉器官的整体形状和位置,小块则专门识别病灶的细微特征。

这种方法的巧妙之处在于它解决了传统方法的一个重大缺陷。以往的技术就像只会用固定形状的模具切割面团,无论面团是什么形状都用同样的切法,这样往往会错过重要信息或引入无关干扰。而新方法则像一个灵活的面点师,会根据面团的实际形状选择最合适的切割方式。

在实际应用中,当系统分析一张淋巴结超声图像时,它会先用大尺度的"画笔"勾勒出整个淋巴结的轮廓,同时用小尺度的"画笔"仔细描绘边界的细节。通过这种多层次的信息融合,即使只看过少量的标注样本,系统也能准确理解图像的整体结构。

二、通过"变声术"增强学习能力

频域切换技术则像一种神奇的"变声术"。当你听一首歌时,既能听到低沉的贝斯声部,也能听到清脆的高音部分。超声图像也类似,包含着不同"频率"的信息:低频信息描述整体的纹理和风格,高频信息则包含边缘和细节。

研究团队发现了一个有趣的现象:如果保持图像的"骨架结构"不变,只是调换不同图像的"皮肤纹理",就能创造出新的训练样本,而且这些样本的诊断标签依然准确。这就像给同一个人换了不同的衣服,虽然外观有所变化,但本质特征保持不变。

这种技术的精妙之处在于它能让人工智能系统学会忽略那些无关紧要的表面变化,专注于真正重要的结构信息。比如,不同患者的超声图像可能因为设备设置、操作手法等因素呈现不同的整体亮度和纹理,但病变区域的形状和边界特征是相对稳定的。通过频域切换,系统学会了在各种"伪装"下识别疾病的真实面目。

三、师生协作的智能学习机制

整个系统的运作就像一个经验丰富的老师指导一个聪明学生的过程。在这个比喻中,"老师"网络负责为未标注的图像生成可靠的诊断建议,而"学生"网络则在老师的指导下不断改进自己的诊断能力。

这种师生关系的设计非常巧妙。老师网络不是通过传统的课堂教学方式训练出来的,而是通过持续观察学生的学习过程,逐步积累经验。具体来说,老师网络的参数是学生网络历史表现的加权平均,就像一个导师通过长期观察学生的进步轨迹,逐渐形成了稳定而准确的判断标准。

当面对一张没有标注的超声图像时,老师网络会给出它的诊断建议,学生网络则需要学习同时满足两个目标:在有标注的图像上达到准确诊断,在无标注的图像上与老师保持一致。这种双重约束确保了学习过程的稳定性和可靠性。

为了进一步提高学习效率,研究团队还引入了对比学习机制。这就像让学生同时看两张相似但略有不同的图像,学会识别哪些差异是重要的,哪些是可以忽略的。通过这种对比练习,系统逐渐建立起对疾病特征的深层理解。

四、数据增强技术的精心设计

考虑到超声图像的脆弱特性,研究团队在数据增强策略上下了很大功夫。不同于自然图像可以承受各种强烈变换,医学图像需要更加小心的处理。就像修复古董文物需要轻拿轻放一样,对超声图像的任何改动都必须确保不会破坏其医学诊断价值。

研究团队将数据增强分为两个级别:温和增强和适度增强。温和增强包括图像尺寸调整、水平翻转等基本操作,这些就像给照片换个相框或镜像显示,不会改变图像的本质内容。适度增强则包括对比度调整、亮度微调等操作,就像调节相机的拍摄参数,能够模拟不同的成像条件。

特别值得注意的是,研究团队特意避免了那些可能严重扭曲图像特征的增强方法,比如直方图均衡化等。这种谨慎的态度确保了增强后的图像依然保持原有的医学诊断价值,不会误导人工智能系统学习到错误的特征。

五、损失函数的巧妙平衡

在训练过程中,系统需要同时优化多个目标,这就像一个杂技演员需要同时保持多个球在空中。研究团队设计了一个复合损失函数,巧妙地平衡了三个重要目标:分割准确性、特征一致性和预测稳定性。

分割准确性确保系统能够准确识别病变区域的边界,就像用精确的剪刀沿着轮廓线剪纸。特征一致性则确保系统学会忽略表面变化,专注于结构特征,就像一个化妆师能透过浓妆看出一个人的真实面貌。预测稳定性保证系统的判断不会因为微小的输入变化而产生剧烈波动,就像一个稳定的天平不会因为轻微的震动就给出完全不同的读数。

通过大量的实验调优,研究团队找到了这三个目标之间的最佳平衡点。当对比学习的权重设置为0.1时,系统能够在保持诊断准确性的同时,获得良好的特征学习效果和预测稳定性。

六、六大数据集的全面验证

为了证明Switch方法的广泛适用性,研究团队在六个不同的超声图像数据集上进行了全面测试,涵盖了人体的多个重要部位:淋巴结、乳腺、甲状腺和前列腺。这就像让一个医学生在不同科室轮转实习,检验其诊断技能的全面性。

在淋巴结诊断方面,研究团队使用了两个数据集:一个来自威尔斯亲王医院的内部数据集,包含1292张图像;另一个来自外部医院的374张图像,专门用于测试系统的跨医院适应能力。这种设计就像让一个医生先在本院熟悉环境,然后去其他医院证明自己的真实水平。

乳腺超声图像分析使用了BUSI数据集,包含647张有效图像,涵盖良性和恶性病变。甲状腺诊断则采用了两个数据集:DDTI数据集包含637张图像,涵盖多种甲状腺疾病类型;TN3K数据集规模更大,包含约3500张图像,为系统提供了丰富的学习样本。

前列腺超声图像分析使用了包含2910张图像的专业数据集,这些图像来自接受微创超声引导前列腺活检的患者。通过在这些不同特征的数据集上测试,研究团队全面评估了Switch方法的泛化能力和稳定性。

七、令人震撼的实验结果

实验结果展现了Switch方法的卓越性能,特别是在数据稀缺场景下的表现令人印象深刻。当仅使用5%的标注数据进行训练时,Switch方法在多个数据集上都达到了令人惊叹的诊断准确率:淋巴结内部数据集达到80.04%的Dice系数,甲状腺DDTI数据集达到85.52%,前列腺数据集达到83.48%。

这些数字背后的意义需要用更直观的方式来理解。Dice系数是衡量分割准确性的标准指标,80%以上的Dice系数意味着AI系统的诊断边界与专家医生的标注有80%以上的重合度。考虑到即使是不同的专家医生对同一张图像的标注也可能存在细微差异,这样的准确率已经达到了临床实用的水平。

更令人惊讶的是,在某些情况下,使用50%标注数据训练的Switch方法甚至超越了使用100%数据训练的传统完全监督方法。在淋巴结内部数据集上,Switch方法达到了84.29%的Dice系数,而完全监督的U-Net方法只达到了83.49%。这种现象表明,合理的半监督学习策略不仅能够节省标注成本,还可能发现人类专家遗漏的图像特征模式。

在跨医院的泛化测试中,Switch方法同样表现出色。在从未见过的外部医院数据上,该方法依然保持了较高的诊断准确率,证明了其良好的跨域适应能力。这种泛化能力对于实际临床应用至关重要,因为不同医院的超声设备、操作习惯和患者群体可能存在显著差异。

八、深度技术剖析与创新突破

Switch方法的技术创新主要体现在两个关键突破上。第一个突破是多尺度切换策略的设计。传统的图像切换方法就像用饼干模具压面团,无论面团形状如何都用固定的圆形或方形模具。这种方法在处理形状规则的自然物体时效果尚可,但面对复杂多变的医学图像就显得力不从心。

Switch方法则采用了层次化的切换策略,同时使用大小两种"模具"。大尺度的切换块(128×128像素)专门负责捕捉器官的整体轮廓和空间关系,小尺度的切换块(32×32像素)则专注于细节特征和边界信息。这种设计确保了无论病变区域是大是小、形状如何,都能被恰当地处理。

第二个突破是频域切换技术的引入。这种技术的灵感来源于音频处理领域的经验。就像调音师可以分别调节音乐的低音和高音部分一样,频域切换技术可以分别处理图像的整体纹理信息和细节边缘信息。通过快速傅里叶变换,系统将图像分解为幅度谱和相位谱,然后在不破坏空间结构的前提下交换不同图像的纹理特征。

这种交换的妙处在于它创造了新的训练样本,同时保持了标签的准确性。就像给同一座建筑换上不同的外墙材料,建筑的结构和功能保持不变,但外观呈现出新的变化。这样,人工智能系统就能学会忽略那些与诊断无关的表面特征,专注于真正重要的结构信息。

九、极限挑战下的卓越表现

为了测试Switch方法的极限性能,研究团队设计了极低数据标注比例的实验。当标注数据比例降至仅仅1%时,大多数传统方法的性能会急剧下降,就像一个学生只看过一两个例题就要参加期末考试一样。但Switch方法在这种极端条件下依然表现出令人惊叹的稳定性。

在1%标注数据的条件下,Switch方法在淋巴结内部数据集上达到了66.62%的Dice系数,显著超越了第二名方法的53.10%。这种差距不是微小的改进,而是质的飞跃。在外部验证数据集上,Switch方法达到了60.49%的Dice系数,比第二名高出惊人的18.56%。

这种极限性能的实现并非偶然,而是源于Switch方法对未标注数据的充分利用。当标注样本极度稀少时,传统方法往往陷入过拟合的困境,就像一个学生死记硬背了几道例题,却无法举一反三。而Switch方法通过巧妙的半监督学习策略,从大量未标注数据中挖掘出有价值的信息,形成了更加鲁棒的诊断能力。

十、计算效率与实用性分析

在追求高性能的同时,Switch方法也注重计算效率和实际可部署性。整个模型的参数量仅为1.8百万,相比许多竞争方法的3.6-3.8百万参数实现了近一半的压缩。这种参数效率意味着模型可以在资源受限的环境下运行,比如普通的医院工作站或移动设备。

在训练策略上,Switch方法采用了两阶段的训练流程。第一阶段是预训练,仅使用标注数据训练学生网络10000次迭代,为后续的半监督学习打下坚实基础。第二阶段是自训练,同时使用标注和未标注数据训练30000次迭代,在这个过程中老师网络通过指数移动平均不断更新。

这种训练策略的设计考虑了实际部署的需求。预训练阶段确保了模型的基本诊断能力,即使在半监督训练出现问题时也有兜底保障。自训练阶段则充分挖掘未标注数据的价值,实现性能的进一步提升。整个训练过程在单个GPU上可以在合理时间内完成,没有对硬件资源提出过高要求。

十一、临床应用前景与社会价值

Switch方法的成功不仅仅是技术上的突破,更重要的是它为解决医疗资源不平衡问题提供了新的可能性。在发展中国家或偏远地区,专业的影像科医生往往严重短缺,而标注高质量的医学图像数据更是困难重重。Switch方法仅需极少量的专家标注就能达到临床实用的诊断水平,这为这些地区部署智能诊断系统铺平了道路。

从经济效益角度来看,传统的AI医学诊断系统开发需要雇用大量专家医生进行数据标注,成本高昂且耗时巨大。Switch方法将标注需求降低到原来的5%,这意味着开发成本可以大幅降低,从而让更多医疗机构有能力引入智能诊断技术。

在实际临床工作流程中,Switch方法可以作为医生的智能助手,提供初步的诊断建议和病灶定位。这不仅可以提高诊断效率,减少医生的工作负担,还能够减少因疲劳或经验不足导致的漏诊误诊。特别是在夜班急诊或基层医院,这种智能辅助系统的价值更加凸显。

十二、方法局限性与未来改进方向

尽管Switch方法取得了显著的成功,研究团队也坦诚地指出了当前方法的局限性。首先是领域特异性的问题。目前的系统参数,如频域切换的频率区域比例、多尺度切换的块大小等,都是针对超声图像的特点精心调优的。如果要将这种方法应用到CT或MRI图像上,可能需要重新调整这些参数,甚至修改核心算法。

计算复杂度是另一个需要考虑的因素。虽然Switch方法的参数量相对较少,但频域切换涉及的快速傅里叶变换操作和两阶段训练流程确实增加了计算开销。在资源极度受限的环境下,可能需要进一步优化算法效率或开发近似计算方法。

多类别分割是一个尚待探索的方向。目前的Switch方法主要针对二分类问题,即区分病变组织和正常组织。但在实际临床应用中,医生往往需要识别多种不同类型的组织或病变。将Switch方法扩展到多类别场景需要重新设计伪标签生成策略和一致性约束机制。

未来的改进方向包括开发自适应参数选择机制,让系统能够根据输入数据的特点自动调整关键参数。此外,探索更高效的频域操作和近似计算方法也是重要的研究方向。在多类别扩展方面,可以考虑引入层次化的分类策略和类别感知的混合机制。

十三、与现有技术的深度对比

在与最新技术的对比中,Switch方法展现出了明显的优势。与传统的Mean Teacher方法相比,Switch在5%标注数据条件下的性能提升超过了20个百分点。这种提升不是渐进式的改进,而是质的飞跃,表明Switch方法确实抓住了半监督学习的核心要素。

相比最近提出的BCP方法,Switch方法的优势在于多尺度策略的灵活性。BCP方法采用固定大小的切换块,而Switch的层次化设计能够更好地适应不同大小和形状的病变区域。在复杂形状的病变诊断中,这种适应性带来了显著的性能提升。

与参数量更大的方法如ABD和β-FFT相比,Switch方法展现了令人印象深刻的参数效率。在使用仅一半参数量的情况下,Switch往往能够达到相当甚至更好的性能,这对实际部署具有重要意义。

特别值得注意的是,在跨医院的外部验证中,Switch方法的泛化能力表现突出。许多看起来在内部数据集上表现优秀的方法,在外部数据上都出现了显著的性能下降,而Switch方法保持了相对稳定的表现,这证明了其学到的特征确实是本质性和可迁移的。

说到底,香港理工大学团队开发的Switch方法为医学图像智能诊断领域带来了一场小小的革命。这种方法就像一个聪明的学生,不需要死记硬背大量的课本内容,而是掌握了举一反三的学习方法,仅仅通过少量的例题练习就能应对各种复杂的考试题目。

这项研究的意义远超技术本身的突破。它为解决医疗资源分配不均的问题提供了新的思路,让偏远地区和资源有限的医疗机构也能享受到人工智能带来的诊断辅助。当我们想象一个乡村诊所的医生通过一台普通的超声设备和一套智能软件就能获得接近专家级的诊断建议时,这种技术的社会价值就显得格外珍贵。

当然,任何技术都不是完美的。Switch方法目前还需要针对不同的医学影像类型进行参数调优,计算复杂度也有进一步优化的空间。但这些局限性并不掩盖其开创性的贡献。正如所有伟大的发明一样,Switch方法为后续的研究指明了方向,相信在不久的将来,我们会看到更多基于这种思路的改进和应用。

对于普通人而言,这项研究意味着未来的医疗诊断可能会变得更加准确、高效和普惠。或许不久的将来,当你在医院做超声检查时,医生已经可以借助这种智能系统提供的建议,给出更加精确的诊断。而这种改变的背后,正是科研工作者们在实验室里日复一日的努力钻研。

Q&A

Q1:Switch方法相比传统AI诊断有什么优势?

A:Switch方法最大的优势是只需要极少的标注数据就能达到很高的诊断准确率。传统AI方法需要成千上万张专家标注的图像才能训练出可用的模型,而Switch方法仅用5%的标注数据就能在多个数据集上达到80%以上的诊断准确率,有些情况下甚至超过了使用全部数据训练的传统方法。这大大降低了开发成本和部署门槛。

Q2:Switch方法是如何实现用少量数据训练出高性能模型的?

A:Switch方法采用了两个核心技术:多尺度切换和频域切换。多尺度切换就像拼图高手同时关注大块和小块区域,能更好地捕捉不同尺寸的病变特征。频域切换则像变声术一样,保持图像的骨架结构不变,只调换不同图像的纹理信息,这样创造出更多有效的训练样本。配合师生协作的学习机制,系统能从大量未标注数据中学到有用信息。

Q3:这项技术什么时候能在医院实际应用?

A:从技术成熟度来看,Switch方法已经达到了临床实用的准确率水平,且计算资源需求不高,可以在普通医院工作站上运行。但要真正进入临床应用,还需要通过医疗器械审批、临床试验验证等流程。研究团队已经在六个不同的超声图像数据集上验证了方法的有效性和泛化能力,为后续的产业化应用奠定了基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
悬疑剧《危险关系》开播!连看4集后,我想说:孙俪又押对了宝

悬疑剧《危险关系》开播!连看4集后,我想说:孙俪又押对了宝

小丸子的娱乐圈
2026-04-01 00:01:02
老年人的性需求可能比年轻人更旺盛!

老年人的性需求可能比年轻人更旺盛!

黯泉
2026-03-30 13:58:50
“拆迁潮”又要重启?自然部定调!2026年起6类房子或通通拆迁

“拆迁潮”又要重启?自然部定调!2026年起6类房子或通通拆迁

巢客HOME
2026-03-30 19:14:13
一点别同情她!被教练性侵27次,却在奥运赛场上,把队友撞出赛道

一点别同情她!被教练性侵27次,却在奥运赛场上,把队友撞出赛道

来科点谱
2026-02-27 07:42:10
奥地利1-0韩国,萨比策破门,施拉格尔献助攻,孙兴慜失单刀

奥地利1-0韩国,萨比策破门,施拉格尔献助攻,孙兴慜失单刀

懂球帝
2026-04-01 04:45:56
意大利vs波黑:基恩PK哲科,托纳利、雷特吉、巴雷拉出战

意大利vs波黑:基恩PK哲科,托纳利、雷特吉、巴雷拉出战

懂球帝
2026-04-01 01:27:07
48小时被打残一个装甲营!以色列以人命为代价,给特朗普上了一课

48小时被打残一个装甲营!以色列以人命为代价,给特朗普上了一课

小蔑谈事
2026-03-31 19:18:28
大的要来了!伊朗公开最后底牌,美军迎战世界第二大军事集团总攻

大的要来了!伊朗公开最后底牌,美军迎战世界第二大军事集团总攻

兴史兴谈
2026-04-01 01:04:20
这是巩俐年轻时的剧照,张艺谋导演,特别真实的,很贴近生活。

这是巩俐年轻时的剧照,张艺谋导演,特别真实的,很贴近生活。

可乐谈情感
2026-03-30 00:15:45
路特斯ForMe与宝马X5L对比,ForMe更具选购价值

路特斯ForMe与宝马X5L对比,ForMe更具选购价值

凡兮说
2026-03-31 22:09:41
异性发生亲密关系前 大都会有这三种“生理越界”的信号 有一个准成

异性发生亲密关系前 大都会有这三种“生理越界”的信号 有一个准成

朗威谈星座
2026-03-31 20:07:43
对肝特别好的四大食物,轮流着吃,第三种你可能想不到

对肝特别好的四大食物,轮流着吃,第三种你可能想不到

距离距离
2026-03-28 17:23:37
俞敏洪:如果拼了命,英年早逝的话,和不那么拼命,而活到八九十岁,是一件更加合算的事

俞敏洪:如果拼了命,英年早逝的话,和不那么拼命,而活到八九十岁,是一件更加合算的事

南京择校
2026-03-29 22:42:47
江苏省南京江北新区党工委原委员周金良接受纪律审查和监察调查

江苏省南京江北新区党工委原委员周金良接受纪律审查和监察调查

环球网资讯
2026-03-31 17:07:15
天生一张娃娃脸都已经46了,你敢想?

天生一张娃娃脸都已经46了,你敢想?

奇思妙想生活家
2026-03-31 11:19:19
4000+1500+4000!吉林化纤火力全开,国产碳纤维彻底爆发

4000+1500+4000!吉林化纤火力全开,国产碳纤维彻底爆发

户外钓鱼哥阿旱
2026-03-31 15:55:44
张雪峰二婚妻子付幸:几个月婚姻分走数亿,11岁女儿遗产继承复杂

张雪峰二婚妻子付幸:几个月婚姻分走数亿,11岁女儿遗产继承复杂

眼光很亮
2026-03-27 16:04:09
奉陪到底,外交部宣布动手,高市军师遭制裁,日方急求中国派人谈

奉陪到底,外交部宣布动手,高市军师遭制裁,日方急求中国派人谈

甜柠聊史
2026-04-01 03:43:02
日本警察厅就自卫队员强闯中国使馆事件召开会议,日本警察厅长:该事件“极为特殊且性质严重”

日本警察厅就自卫队员强闯中国使馆事件召开会议,日本警察厅长:该事件“极为特殊且性质严重”

每日经济新闻
2026-03-30 18:03:24
印度媒体渲染“胜利”实为政治闹剧

印度媒体渲染“胜利”实为政治闹剧

烽火瞭望者
2026-03-31 06:16:26
2026-04-01 05:03:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7825文章数 556关注度
往期回顾 全部

科技要闻

华为2025年销售收入8809亿,净利润680亿元

头条要闻

伊朗总统:愿意结束战争 前提是诉求得到满足

头条要闻

伊朗总统:愿意结束战争 前提是诉求得到满足

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

《月鳞绮纪》空降 鞠婧祎却被举报偷税

财经要闻

油价暴涨 我们的生活成本会飙升多少?

汽车要闻

腾势Z9GT到底GT在哪?

态度原创

家居
游戏
旅游
手机
公开课

家居要闻

新婚爱巢 甜蜜情趣拉满

上一秒还在嘲笑瓦学弟,下一秒就去“抗癌”了

旅游要闻

沿沪宁好去处丨上海西站出发,逛花海、品早茶、看球赛!泰州发布三大春季主题线路

手机要闻

vivo X300s线下上手:体验后,不吐不快!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版