网易首页 > 网易号 > 正文 申请入驻

港科大突破:AI实现医学文本引导图像精准分割

0
分享至

来源:市场资讯

(来源:科技行者)


这项由香港科技大学(广州)的刘安林和薛润东,伊利诺伊大学香槟分校的曹旭然、沈翼帆和李翔,东南大学的陈倩倩,以及香港科技大学的陈锦泰等研究人员共同完成的突破性研究发表于2025年11月的arXiv预印本平台,论文编号为arXiv:2511.19046v1。对这项前沿研究感兴趣的读者可以通过该编号查询完整论文内容。

医学图像分析一直是现代医疗诊断的重要基石,就像侦探需要仔细观察案发现场的每一个细节来破解案情一样,医生也需要从X光片、CT扫描、核磁共振等医学图像中找出病变部位,为患者制定精确的治疗方案。然而,现有的医学图像分析系统就像只会按图索骥的新手侦探,它们只能识别预先设定好的固定模式,无法理解医生用自然语言描述的复杂医学概念。

当一位医生说"请帮我分割出这张CT图像中的肺部肿瘤及其周围水肿区域"时,传统的AI系统往往无法理解这种开放式的自然语言指令,就像一个只会按照严格流程办事的机器人,面对灵活变化的任务时就显得束手无策。这种局限性不仅大大增加了医生的工作负担,还限制了AI在复杂临床场景中的应用潜力。

为了解决这个关键问题,研究团队开发了一个名为MedSAM-3的革命性系统。这个系统最大的突破在于它能够真正理解医学概念,就像一位经验丰富的老医生一样,仅仅通过文字描述就能在医学图像中精确找到目标区域。更令人兴奋的是,研究团队还开发了一个智能代理框架MedSAM-3 Agent,这个代理就像一位智能助理,能够处理复杂的临床指令并通过多轮交互不断优化结果。

一、从几何提示到概念理解:医学图像分析的重大转变

在医学图像分析领域,传统方法就像要求侦探只能通过指出具体坐标来描述犯罪现场,而不能用"客厅沙发旁边的血迹"这样的自然语言来表达。现有的医学图像分割系统主要依赖几何提示,比如医生需要在图像上点击特定位置、画出边界框或者提供精确的坐标点,系统才能理解要分析的目标区域。

这种工作模式存在明显的弊端。当面对复杂的解剖结构或病变区域时,医生往往需要花费大量时间在图像上进行精确标注,就像要求一位经验丰富的医生放下专业判断,转而去做繁琐的技术操作。更重要的是,这种方式完全忽略了医学实践中丰富的概念化语言传统。在真实的临床环境中,医生们习惯用"左侧基底节区梗死灶"、"双侧胸腔积液"、"肝脏右叶占位性病变"等概念性描述来交流,这些表达承载着丰富的医学知识和临床经验。

MedSAM-3的出现彻底改变了这种状况。这个系统基于最新的SAM 3架构开发,SAM 3本身就是一个具有突破性意义的视觉AI模型,它首次实现了"可提示概念分割"功能。如果把传统的图像分割比作一个只能按照固定模板工作的裁缝,那么SAM 3就像一位真正理解客户需求的设计师,能够根据客户的描述创造出符合要求的作品。

研究团队发现,虽然SAM 3在自然图像处理方面表现出色,但当它直接应用到医学领域时,就像一位城市侦探突然被派到乡村办案,虽然基本技能还在,但对当地的特殊情况却不够了解。医学图像具有独特的特征:对比度通常较低、边界往往模糊、不同患者之间存在显著差异,而且医学术语的精确性要求极高。

因此,研究团队对SAM 3进行了专门的医学领域适配。他们收集了来自多种医学成像模态的图像数据,包括X射线、核磁共振、超声、CT、眼底镜、皮肤镜、病理切片等,并为这些图像配上了精确的医学概念标签。这个过程就像给一位优秀的通用侦探提供专门的医学法医学培训,让他能够更好地理解和分析医学证据。

在训练过程中,研究团队特别注重概念标签的精确性和简洁性。他们将每个概念描述限制在三个单词以内,比如"肺部感染"、"乳腺肿瘤"、"视网膜血管"等。这种做法背后有深层的考量:过于复杂的描述可能会引入噪音和歧义,而简洁精确的概念更容易被AI系统准确理解和学习。这就像教一个学生新概念时,最好从最核心、最清晰的定义开始,然后逐步扩展到更复杂的应用。

经过这种专门训练后的MedSAM-3展现出了令人惊叹的能力。它不仅能够理解基本的解剖学概念,还能处理病理学术语,甚至能够理解带有位置修饰的复合概念,如"左侧肺叶"、"右心室"等。这种能力的获得标志着医学图像分析从纯粹的技术操作向智能化诊断辅助的重要转变。

二、智能代理框架:让AI具备医生般的推理能力

单纯的图像分割能力虽然已经很强大,但在真实的临床环境中,医生往往需要处理更加复杂和开放性的任务。比如,一位医生可能会说:"请帮我分析这张胸部CT中所有可能与患者胸痛症状相关的异常区域,并重点关注心脏和肺部的病变。"这种指令不仅涉及多个器官的分割,还需要医学知识推理和症状关联分析,这已经超出了单纯图像分割的范畴。

为了应对这种挑战,研究团队开发了MedSAM-3 Agent智能代理框架。这个代理系统就像一位经验丰富的医学研究助理,不仅具备专业的图像分析能力,还能够进行复杂的医学推理和多轮交互优化。

MedSAM-3 Agent的工作流程充满了智能化特色。当接收到一个复杂的临床任务时,代理首先会像一位资深医生一样分析任务需求,将复杂的指令分解为多个可执行的子任务。然后,它会制定一个详细的分析计划,明确每个步骤的目标和方法。接下来,代理会调用MedSAM-3进行具体的图像分割工作,就像一位主治医生指导住院医师进行具体操作一样。

这个过程最有趣的部分是代理的自我反思和优化能力。每完成一个分割步骤后,代理都会仔细检查结果,分析是否符合预期,是否遗漏了重要信息,是否需要调整策略。如果发现问题,它会自动修正分析计划,重新执行分割任务,或者尝试不同的概念描述来获得更好的结果。这种迭代优化的过程就像一位严谨的医生在诊断过程中不断验证和完善自己的判断。

在实际测试中,研究团队使用Google的Gemini 3 Pro作为代理的"大脑",这是一个强大的多模态大语言模型,具备处理文本和图像的综合能力。实验结果显示,MedSAM-3 Agent在乳腺超声图像分析任务中的表现显著超过了单纯的MedSAM-3模型,Dice系数从0.7772提升到了0.8064。这个提升看似微小,但在医学图像分析领域,这样的改进往往意味着诊断准确性的显著提升。

代理系统的另一个重要优势是它的交互能力。在传统的医学图像分析流程中,如果AI系统的结果不理想,用户往往需要重新调整参数或重新标注数据,这个过程既耗时又需要专业知识。而MedSAM-3 Agent能够通过自然语言与用户进行多轮对话,理解用户的反馈和需求调整,然后自动优化分析结果。这就像有了一位永不疲倦、反应迅速的医学助理,能够根据医生的指导不断改进工作质量。

三、全方位的性能表现:跨越多种医学成像模态的卓越能力

MedSAM-3的能力验证是一个相当全面的过程,研究团队精心设计了涵盖14个不同医学数据集的综合评估体系。这些数据集就像一个完整的医学图像博物馆,包含了现代医学中几乎所有重要的成像技术和临床应用场景。

在二维医学图像处理方面,MedSAM-3接受了来自七个不同成像模态的挑战。首先是胸部X射线图像分析,研究团队使用了包含11,956个COVID-19感染病例的大型数据集。在这个任务中,MedSAM-3需要仅仅通过"肺部感染"这样的简单文字描述,就在X射线图像中准确识别出感染区域。这就像要求一位放射科医生仅凭经验就能快速识别肺部异常,而不需要任何额外的提示信息。

在乳腺超声图像分析中,MedSAM-3面临的挑战是识别"乳腺肿瘤"。超声图像的特点是噪声较多、对比度变化大,肿瘤边界往往模糊不清。传统方法在处理这类图像时往往需要大量的预处理和参数调整,而MedSAM-3仅通过概念理解就能实现精确分割,这展现了其强大的语义理解能力。

眼科医学成像是另一个重要的测试领域。研究团队使用了视网膜OCT图像和眼底照片,要求MedSAM-3分别识别"视网膜神经纤维层"和"视杯"等精细的眼部结构。眼科图像的特点是结构复杂、层次丰富,对分割精度要求极高。MedSAM-3在这些任务中的出色表现证明了它对精细医学结构的准确理解能力。

皮肤病学图像分析测试了MedSAM-3对"皮肤病变"的识别能力。皮肤病变的形状、大小、颜色变化极大,而且往往与正常皮肤的边界不够清晰。MedSAM-3能够仅通过"皮肤病变"的概念描述就准确定位这些病变区域,展现了其对医学概念的深度理解。

在病理学图像分析中,MedSAM-3需要处理显微镜下的组织切片图像,识别"细胞核"等微观结构。病理图像的复杂性在于细胞数量众多、重叠密集、形态变化显著。传统方法往往需要复杂的预处理和后处理步骤,而MedSAM-3的概念驱动方法大大简化了这个过程。

内窥镜图像分析测试了系统对"息肉"的识别能力。内窥镜图像的挑战在于光照不均匀、视角多变、目标物体形状不规则。MedSAM-3在这种充满挑战的环境中依然保持了稳定的性能表现。

红外成像是一个相对特殊的应用领域,研究团队测试了MedSAM-3对"视网膜动脉"和"视网膜静脉"的区分能力。红外图像的对比度通常较低,血管结构细微,需要系统具备精细的概念区分能力。

在三维医学图像处理方面,MedSAM-3同样表现出色。肺动脉CT分割要求系统从复杂的胸部三维图像中精确提取"肺动脉"结构。肺动脉的三维形态复杂,与周围组织的边界往往模糊,这对任何图像分析系统都是极大的挑战。

肝脏肿瘤分割是另一个重要的三维分割任务。系统需要同时识别"肝脏"和"肝脏肿瘤"两个相关但不同的结构。肝脏是人体最大的实质器官,形态变化大,而肝脏肿瘤往往与正常肝脏组织在影像学上区别微妙。MedSAM-3能够准确区分这两种结构,体现了其对医学概念层次关系的深度理解。

前列腺MRI分割测试了系统对软组织结构的分析能力。前列腺在MRI图像中的边界往往不够清晰,与周围组织的对比度较低,这对基于概念的分割方法提出了更高要求。

脑卒中病变分割可能是所有测试中最具挑战性的任务之一。系统需要识别"缺血性卒中病变"这样的复杂病理概念。脑卒中病变在影像学上表现多样,大小不一,位置不定,而且往往与正常脑组织的界限模糊。MedSAM-3在这个任务中的成功展示了其处理复杂病理概念的强大能力。

实验结果显示,MedSAM-3在绝大多数测试中都达到或超过了传统专门化模型的性能水平。在某些任务中,比如皮肤病变分割,MedSAM-3的表现甚至超越了专门为该任务优化的U-Net模型。这种跨模态的一致性表现证明了概念驱动方法的普适性和有效性。

四、技术细节解析:从SAM 3到MedSAM-3的智能进化

MedSAM-3的技术架构设计充满了巧思,整个系统的核心是对原始SAM 3模型的精心改造和医学领域适配。研究团队采用了一种既保持原有优势又针对医学特点进行优化的策略,就像在一栋结构良好的建筑基础上进行专业化装修,既保留了原有的坚固框架,又增加了专门的功能设施。

SAM 3本身是一个双编码器-解码器的Transformer架构,包含一个用于图像级任务的检测器和一个配备记忆模块的跟踪器用于视频任务。这种设计就像给系统配备了两种不同的专业技能:静态图像分析能力和动态序列理解能力。检测器专门负责在单张图像中识别和分割目标物体,而跟踪器则能够在视频序列中维持对目标的持续跟踪,这对于分析医学视频(如超声检查或内窥镜检查的实时录像)特别有用。

系统的感知编码器是整个架构的核心组件,它负责将视觉信息和语言信息进行融合处理。这个编码器就像一位同时精通视觉艺术和文学的专家,能够将图像中的视觉特征与文字描述中的语义信息有机结合。当医生输入"肺动脉"这样的概念时,编码器不仅理解这个词汇的语言学含义,还能将其与图像中相应的视觉特征建立关联。

在训练策略方面,研究团队采用了一种精心设计的冻结-微调方案。他们保持图像编码器和文本编码器的参数不变,只对检测器的相关组件进行更新。这种做法的智慧在于既保留了SAM 3在大规模自然图像数据上学到的强大视觉和语言理解能力,又允许系统学习医学领域的专门知识。这就像让一位已经具备良好基础教育的学生接受医学专业培训,既不需要从头开始,又能获得专业技能。

记忆模块的设计对于处理医学视频序列特别重要。这个模块采用了自注意力和交叉注意力机制,能够将当前帧的分析结果与历史帧的信息进行整合。在医学应用中,这种时间连续性的理解能力极其宝贵,比如在超声心动图分析中,系统需要跟踪心脏在不同时刻的状态变化,或者在内窥镜检查中持续监测病变区域的变化。

研究团队在训练数据的准备上也展现了专业的医学素养。他们严格按照各个数据集的官方文档和仓库描述来确定概念标签,确保每个标签都准确反映相应的医学概念。概念短语被严格限制在三个词以内,这种限制并非任意决定,而是基于对SAM 3原始设计和医学术语特点的深度理解。简洁的概念描述能够减少语义歧义,提高系统的理解准确性,同时也符合医学实践中术语使用的精确性要求。

在推理过程中,MedSAM-3支持两种不同的提示模式。第一种是纯文本提示模式,系统仅根据文字描述进行分割,这种模式最能体现系统的概念理解能力。第二种是文本加边界框的混合提示模式,在概念描述的基础上增加空间位置信息,这种模式在实际临床应用中往往能获得更稳定的结果。这种设计体现了研究团队对实用性的充分考虑,既保留了概念驱动的创新特色,又为用户提供了灵活的使用选择。

系统的训练过程采用了专门优化的损失函数,能够同时处理图像分割的空间精度要求和概念理解的语义准确性要求。这种多目标优化的方法确保了系统在获得强大概念理解能力的同时,不会牺牲分割结果的视觉质量。

五、对比实验揭示的重要发现:SAM 3在医学领域的挑战与机遇

在开发MedSAM-3之前,研究团队进行了一系列深入的对比实验,这些实验就像医学研究中的对照试验一样,为理解现有技术的局限性和改进方向提供了宝贵的洞察。通过系统地评估原始SAM 3在医学图像分割任务中的表现,研究团队发现了一些令人深思的现象和规律。

原始SAM 3在医学图像处理中表现出了极大的不稳定性,这种不稳定性就像一位技艺高超的厨师突然要在完全陌生的食材和工具环境中工作,虽然基本技能还在,但效果却大打折扣。在某些数据集上,比如RIM-ONE视网膜图像分析,SAM 3能够达到相对较好的性能水平,但在其他数据集上,如DSB 2018细胞核分割和RAVIR视网膜血管分析,系统几乎完全失败,分割准确度接近于零。

这种性能差异的背后反映出SAM 3对医学概念理解的系统性偏差。研究团队发现了一个特别有趣的现象:当使用"细胞核"或"细胞"这样的精确医学术语时,SAM 3往往表现不佳,但当改用更通用的词汇如"细胞"时,系统的表现会有显著改善。这个发现揭示了一个重要问题:SAM 3虽然具备强大的自然语言理解能力,但对于医学专业术语的精确含义理解还存在明显不足。

更令人惊讶的是,研究团队发现SAM 3存在系统性的语义对齐错误。在肝脏分割任务中,当给出"肝脏"这个概念时,系统经常错误地分割肺部区域,完全忽略真正的肝脏位置。在皮肤病变分割中,系统往往分割大面积的正常皮肤区域,而漏掉实际的病变部位。这种错误不是简单的边界不准确问题,而是概念与视觉目标之间的根本性错配。

这种概念错配现象的发现具有重要的理论和实践意义。它表明,即使是在大规模自然图像数据上训练的强大视觉-语言模型,也无法自动泛化到医学这样的专业领域。医学图像有其独特的视觉特征:对比度通常较低、解剖结构复杂、病理变化多样,而且医学术语的语义精确性要求远超日常用语。

当研究团队在SAM 3的分割提示中加入边界框信息时,系统性能出现了显著改善。这个现象就像给一个在黑暗中摸索的人提供了手电筒,空间定位信息大大补偿了概念理解的不足。在大多数任务中,文本加边界框的组合提示能够让SAM 3的性能接近甚至超越传统的专门化分割模型。这个发现证实了几何信息和语义信息结合的重要性,也为MedSAM-3的设计提供了重要启发。

在三维医学图像分析方面,原始SAM 3的表现更加不尽如人意。三维医学图像的复杂性远超二维图像:不仅需要理解单个切片中的解剖结构,还需要整合跨切片的三维空间关系。SAM 3在处理肝脏肿瘤分割、脑卒中病变检测等复杂三维任务时表现出明显的能力不足,这进一步证实了专门医学领域适配的必要性。

通过这些对比实验,研究团队还发现了不同医学成像模态对AI系统的不同挑战。X射线图像由于其二维投影特性,通常具有较好的对比度,SAM 3在这类图像上的表现相对较好。而MRI和CT图像由于其三维层析特性和丰富的软组织对比度信息,对系统的空间理解能力提出了更高要求。超声图像由于其实时性和操作者依赖性,在图像质量和标准化方面存在更大变异,这些特点都需要专门的算法优化。

这些发现不仅为MedSAM-3的开发提供了明确的改进方向,也为整个医学AI领域提供了宝贵的经验教训。它们表明,将通用AI模型应用到医学这样的专业领域时,不能简单地期待模型的自动泛化,而需要进行系统性的领域适配和专门优化。

六、实际应用效果:医学图像分析的实质性突破

MedSAM-3在实际应用中的表现证明了概念驱动分割方法的实用价值。研究团队精心设计的测试结果展现了这项技术对医学实践可能带来的深远影响,就像一位经验丰富的医生终于有了一位既理解医学语言又具备快速分析能力的智能助手。

在乳腺超声图像分析中,MedSAM-3展现出了令人印象深刻的能力。乳腺癌是全球女性最常见的恶性肿瘤之一,超声检查是重要的早期筛查手段。传统的超声图像分析往往需要经验丰富的超声医生仔细观察和手工标注,这不仅耗时耗力,还容易受到主观因素影响。MedSAM-3仅仅通过"乳腺肿瘤"这样的简单概念描述,就能在超声图像中准确识别出肿瘤区域,其分割精度达到了0.7772的Dice系数,这个数值在医学图像分析领域已经达到了临床实用的水平。

更重要的是,当结合MedSAM-3 Agent的智能代理功能时,系统的表现进一步提升至0.8064。这种改善看似微小,但在医学应用中却意义重大。每一个百分点的准确度提升都可能意味着更早发现的病例、更准确的诊断结果和更好的患者预后。

在眼科应用中,MedSAM-3对视杯分割的准确表现具有特殊的临床意义。青光眼是全球第二大致盲眼病,早期诊断对于保护视功能至关重要。视杯与视盘比值是青光眼诊断的重要指标之一,传统上需要眼科医生在眼底照片上仔细测量。MedSAM-3能够仅根据"视杯"的概念描述就准确分割出这一关键结构,为青光眼的自动化筛查提供了可能。

皮肤病变分割是另一个展现MedSAM-3实用价值的领域。皮肤癌的早期发现对治疗效果有决定性影响,但皮肤病变的形态变化极大,边界往往不清楚,传统的自动分割方法往往需要复杂的预处理和参数调优。MedSAM-3通过概念理解能够适应各种不同形态的皮肤病变,在ISIC 2018数据集上取得了优异的分割效果。

在消化内科应用中,MedSAM-3对息肉的识别能力展现了其在内窥镜图像分析中的潜力。结直肠癌是消化系统最常见的恶性肿瘤之一,而息肉是其重要的癌前病变。内窥镜检查中息肉的准确识别对于早期干预具有重要意义。MedSAM-3能够在复杂的内窥镜图像环境中准确识别息肉区域,为临床医生提供有价值的辅助信息。

特别值得关注的是MedSAM-3在处理罕见或复杂病例时展现的稳定性。传统的专门化分割模型往往在训练数据覆盖范围之外的病例上表现不佳,而MedSAM-3的概念驱动方法使其具备了更好的泛化能力。即使面对训练时未见过的病例类型或图像特征,系统仍能根据概念理解提供合理的分割结果。

在计算效率方面,MedSAM-3也表现出实用的优势。传统方法往往需要针对不同的分割任务训练不同的专门模型,这不仅增加了模型维护的复杂性,也占用了大量的存储和计算资源。MedSAM-3作为一个统一的框架,能够处理多种不同的医学图像分割任务,大大简化了系统部署和维护的复杂性。

系统的用户友好性也是其实用价值的重要体现。医生无需学习复杂的技术参数或操作流程,只需要用自然的医学语言描述分析目标,系统就能提供相应的分割结果。这种交互方式符合医生的思维习惯和工作流程,能够无缝融入现有的临床实践中。

七、技术局限性与未来发展方向:迈向更智能的医学AI

尽管MedSAM-3展现出了令人鼓舞的能力,但研究团队也坦诚地指出了当前技术的局限性和未来需要改进的方向。这种科学的态度就像医学研究中对新药效果的客观评估一样,既要看到进步,也要认识到不足,这样才能指导未来的研究方向。

概念粒度的限制是当前系统面临的一个重要挑战。MedSAM-3目前主要处理简洁的三词以内概念描述,虽然这种设计在很多情况下都很有效,但在处理复杂的复合医学概念时可能显得力不从心。比如,当医生需要分割"造影剂增强的肝脏转移性肿瘤"这样的复杂概念时,系统可能需要进一步的技术改进才能准确理解和执行。

医学概念的层次性理解是另一个需要深入研究的方向。医学知识具有复杂的层次结构和关联关系,比如"肺炎"和"肺部感染"在某些情况下可以互换使用,但在另一些情况下又有微妙的区别。系统如何理解这些概念之间的关系,如何在不同的临床语境中做出准确的判断,这些问题还需要更多的研究工作。

训练数据的规模和多样性仍然是限制系统性能进一步提升的重要因素。虽然研究团队已经收集了涵盖多种成像模态的数据集,但与医学实践的丰富性相比,现有的训练数据仍然显得不够充分。特别是对于一些罕见疾病或特殊病例,系统的表现可能还不够稳定。未来需要构建更大规模、更具代表性的医学图像-概念配对数据集。

多模态信息融合是一个具有巨大潜力但技术挑战也很大的发展方向。在实际临床实践中,医生往往需要综合多种不同的图像信息来做出诊断,比如同时参考CT、MRI和超声检查结果。如何让MedSAM-3具备整合多模态医学信息的能力,这将是一个重要的技术突破点。

实时性能优化也是临床应用中的关键考量。虽然MedSAM-3的分析速度已经远超人工标注,但在某些需要实时反馈的临床场景中,比如手术导航或急救诊断,系统的响应速度还需要进一步提升。这不仅涉及算法优化,也需要在硬件部署方面进行专门的考虑。

个性化适配是医学AI发展的重要趋势。不同医院、不同科室、不同医生可能有各自的图像采集习惯和诊断标准,如何让MedSAM-3能够快速适应这些个性化需求,而不需要重新进行大量的训练工作,这是一个既有理论意义又有实践价值的研究方向。

安全性和可解释性是医学AI应用中永远不能忽视的重要问题。医生需要理解AI系统的决策过程,特别是当系统给出的结果与临床经验不符时。如何让MedSAM-3提供更好的可解释性,如何建立有效的质量控制机制,这些都是未来研究需要重点关注的方向。

标准化和监管合规也是技术走向临床应用必须解决的问题。医学AI系统需要通过严格的临床验证和监管审批,这要求技术不仅在实验室环境中表现良好,还要在真实临床环境中证明其安全性和有效性。

跨语言和跨文化适配是全球化应用的重要考虑。不同国家和地区的医学术语使用可能存在差异,如何让系统能够理解和适应这些差异,是推动技术全球应用的重要前提。

说到底,MedSAM-3的出现代表了医学图像分析领域向概念化、智能化方向发展的重要一步。这项技术的意义不仅在于其当前展现的能力,更在于它为未来医学AI的发展开辟了新的可能性。通过让AI系统真正理解医学概念,我们朝着构建更加智能、更加人性化的医疗辅助系统迈出了坚实的步伐。

这种技术进步最终的受益者将是广大患者和医务工作者。患者将能够获得更加精准、高效的医学图像分析服务,而医生则可以从繁重的图像标注工作中解放出来,将更多精力投入到真正需要人类专业判断的临床决策中。随着技术的不断完善和应用的逐步推广,我们有理由相信,概念驱动的医学图像分析将成为未来智能医疗的重要组成部分,为提升医疗质量和效率做出重要贡献。

Q&A

Q1:MedSAM-3与普通的医学图像分析系统有什么不同?

A:MedSAM-3最大的突破是能够理解医学概念。传统系统需要医生在图像上精确标点或画框才能工作,而MedSAM-3只需要简单的文字描述,比如说"肺部肿瘤"或"乳腺病变",就能准确找到并分割出相应区域。这就像从需要手把手指导的助手升级为能听懂专业术语的智能助理。

Q2:MedSAM-3 Agent的智能代理功能是如何工作的?

A:MedSAM-3 Agent就像一位经验丰富的医学助理,能够处理复杂的临床指令。当医生提出复杂要求时,代理会自动分析任务、制定计划、执行分割、检查结果,如果不满意还会自动调整策略重新分析。在测试中,这种智能代理将分割准确度从77.72%提升到了80.64%,显著改善了分析效果。

Q3:普通医院能使用MedSAM-3技术吗?

A:目前MedSAM-3还处于研究阶段,研究团队承诺会开放代码和模型供学术研究使用。但要在临床实际应用,还需要经过严格的医学验证和监管审批。不过这项技术为医学图像分析的未来发展指明了方向,相信经过进一步完善后会逐步进入临床实践。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
知名央企迎来最终审判!全烂透了,9个董监高无一清白,强制清退

知名央企迎来最终审判!全烂透了,9个董监高无一清白,强制清退

慕名而来只为你
2026-01-20 05:59:04
市人大代表建议:公交专用道优化后,公交车“大换小”

市人大代表建议:公交专用道优化后,公交车“大换小”

新京报
2026-01-24 23:13:07
民众党团大换血,新任总召是他。黄国昌表态,郑丽文布局稳了

民众党团大换血,新任总召是他。黄国昌表态,郑丽文布局稳了

时时有聊
2026-01-25 13:25:02
据说生肖最配的夫妻:

据说生肖最配的夫妻:

LULU生活家
2026-01-26 06:33:35
山东一66岁“领导”被纪委带走调查,青州人认识吗?

山东一66岁“领导”被纪委带走调查,青州人认识吗?

青州论坛
2026-01-26 04:56:25
300万就能解雇穆帅?本菲卡双线崩盘,穆里尼奥却铁了心不走!

300万就能解雇穆帅?本菲卡双线崩盘,穆里尼奥却铁了心不走!

田先生篮球
2026-01-25 07:23:48
“这是被摧毁前的我”—英国逆天网红再发多人事前事后视频

“这是被摧毁前的我”—英国逆天网红再发多人事前事后视频

随波荡漾的漂流瓶
2026-01-24 20:28:36
印度尼帕疫情告急:人传人风险高,邻国严阵以待

印度尼帕疫情告急:人传人风险高,邻国严阵以待

超喜欢我
2026-01-26 06:45:17
一场伟大的胜利!第4艘航母细节曝光,弃用10万吨核动力,美方慌了

一场伟大的胜利!第4艘航母细节曝光,弃用10万吨核动力,美方慌了

芯火相承
2026-01-25 18:01:24
广东3消息!朱芳雨上诉成功,徐杰拍片出炉,杜锋称王少杰毁容

广东3消息!朱芳雨上诉成功,徐杰拍片出炉,杜锋称王少杰毁容

多特体育说
2026-01-25 22:16:28
当你接触的人多了,你会明白:如果一个人还在穿5年前的衣服,只说明3个问题

当你接触的人多了,你会明白:如果一个人还在穿5年前的衣服,只说明3个问题

二胡的岁月如歌
2026-01-16 18:51:52
女子网购童装穿脏后退款被拒辱骂商家“关门大吉”,山东惠民县融媒体中心通报:确系我单位员工王某,其已道歉并主动辞职,已解除劳动关系

女子网购童装穿脏后退款被拒辱骂商家“关门大吉”,山东惠民县融媒体中心通报:确系我单位员工王某,其已道歉并主动辞职,已解除劳动关系

极目新闻
2026-01-25 13:07:49
银价涨太猛!女子三年前6000元买的钻戒,现在只值几百元,赠品足银保温杯却已价值2000元!

银价涨太猛!女子三年前6000元买的钻戒,现在只值几百元,赠品足银保温杯却已价值2000元!

每日经济新闻
2026-01-25 14:39:10
钱天一26岁生日宴温馨落幕 陈幸同素颜状态惊艳

钱天一26岁生日宴温馨落幕 陈幸同素颜状态惊艳

最爱乒乓球
2026-01-26 00:07:21
卡尼号召加拿大人“购买国货”以回应美国关税威胁

卡尼号召加拿大人“购买国货”以回应美国关税威胁

环球网资讯
2026-01-25 06:13:20
身材保密!东契奇婉拒当众换球衣:一会儿回去给你,我不想露出身体

身材保密!东契奇婉拒当众换球衣:一会儿回去给你,我不想露出身体

懂球帝
2026-01-25 13:53:36
2吨原材料炼出191克黄金!对话当代“炼金客”:只能赚到10克金,普通人没有资质根本做不了

2吨原材料炼出191克黄金!对话当代“炼金客”:只能赚到10克金,普通人没有资质根本做不了

每日经济新闻
2026-01-25 15:11:08
王玉雯回应《突然的喜欢》官微道歉,否认此事是炒作

王玉雯回应《突然的喜欢》官微道歉,否认此事是炒作

小兔子的快乐
2026-01-25 19:25:04
侄女上学我给5万,升学宴没请我毕业找上门,我:现在知道找我?

侄女上学我给5万,升学宴没请我毕业找上门,我:现在知道找我?

温情邮局
2025-11-24 10:25:22
172:233!高市重新洗牌,日本新首相人选出炉,对中国态度不简单

172:233!高市重新洗牌,日本新首相人选出炉,对中国态度不简单

叹知
2026-01-26 00:02:36
2026-01-26 07:15:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2057561文章数 5296关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

游戏
家居
时尚
数码
本地

LCK春季赛:道心没有破碎,KT找回状态,三局战胜BRO

家居要闻

在家度假 160平南洋混搭宅

看了鲁豫对章小蕙的采访,最大感触是这一点

数码要闻

AMD最强APU更新!锐龙AI Max+ 400详细规格曝光:5.2GHz CPU、3.0GHz GPU

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

无障碍浏览 进入关怀版