网易首页 > 网易号 > 正文 申请入驻

格拉斯哥大学新技术解决AI医生"看图说话"的致命缺陷

0
分享至


这项由格拉斯哥大学计算科学学院的张曦、孟再桥、杰克·莱弗和何淑琳团队完成的研究发表于2025年9月,论文编号为arXiv:2509.23379v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下,你正在医院里,面前坐着一位AI医生。它仔细观察着你的胸部X光片,然后开始向你描述它所看到的情况。但是,这位AI医生有一个严重的问题——它经常会"看错"或者"瞎说",明明片子上没有的病症,它却说得有鼻子有眼。这种现象在医学界被称为"医学幻觉",就像人在发烧时会产生幻觉一样,AI也会产生不真实的医学判断。

这个问题可不是小事。在医疗领域,哪怕是一个微小的错误判断都可能影响病人的治疗方案,甚至危及生命。正因如此,格拉斯哥大学的研究团队开发了一种全新的技术,叫做"临床对比解码"(CCD),专门用来纠正AI医生的这种"胡说八道"问题。

这项技术的巧妙之处在于,它不需要重新训练AI模型,也不需要额外的数据库支持,而是在AI"说话"的过程中实时进行纠正。就像给AI医生配了一位经验丰富的专家顾问,随时提醒它哪些判断是合理的,哪些是不靠谱的。

研究团队在三个不同的数据集上测试了这项技术,结果令人鼓舞。在最重要的MIMIC-CXR数据集上,这项技术让AI医生的准确性提高了17%,在其他测试中也都表现出了显著的改善。更重要的是,这种改善不仅体现在生成报告的质量上,在回答医学问题时也表现得更加准确可靠。

一、AI医生为什么会"胡说八道"

要理解AI医生的问题,我们可以把AI想象成一个刚从医学院毕业的实习生。这个实习生读了很多医学教科书,记住了大量的医学知识,但是在实际看X光片时,却经常会被一些无关紧要的信息误导。

比如说,当我们给AI提供一张胸部X光片,并告诉它"这位病人有心房颤动病史,因为胸痛和呼吸困难来就诊"时,AI可能会过度关注这些背景信息,而忽视了图片本身显示的真实情况。就像一个实习医生听到"胸痛"这个词,立刻就联想到心脏病,即使X光片上根本没有显示心脏问题的迹象。

研究团队发现,这种"过度敏感"的现象在现有的AI医疗系统中非常普遍。他们通过大量实验证明,当给AI提供不同类型的临床信息时,AI的表现会出现明显的波动。特别是当提供的信息与实际图像不符时,AI往往会被误导,产生错误的判断。

举个具体例子,研究人员发现,当他们在提示信息中提到"侧位片"(一种从侧面拍摄的X光片)时,即使实际提供的是正面X光片,AI也会坚持按照侧位片的特征来进行分析,结果自然是错误百出。这就像告诉一个人"你面前是一辆红色汽车",即使他看到的明明是一辆蓝色自行车,他也会努力从中找出汽车和红色的特征。

更令人担忧的是,AI在某些疾病的诊断上表现出了明显的偏差。比如在检测"胸腔积液"和"肺不张"这类需要仔细观察细微变化的疾病时,AI的准确率会显著下降。相反,对于"心脏肥大"这类在病史中经常被提及的疾病,AI却表现出了过度的敏感性,经常会"看到"实际上并不存在的症状。

二、"临床对比解码"技术的工作原理

为了解决AI医生的"胡说八道"问题,研究团队开发了一种名为"临床对比解码"的创新技术。这个技术的工作原理可以用一个简单的比喻来解释:想象AI医生就像一个正在学习的学生,而临床对比解码就像是给这个学生配备了一位经验丰富的导师。

这位"导师"其实是另一个专门的AI系统,它的任务很简单但很重要——专门识别X光片上的各种疾病征象。当学生AI开始分析X光片并准备"开口说话"时,导师AI会同时分析同一张片子,然后实时地向学生AI提供指导意见。

整个纠错过程分为两个阶段,就像一个两步走的质量控制流程。第一个阶段叫做"症状引导的对比解码",这个阶段主要解决"漏诊"问题——也就是AI没有发现实际存在的疾病。导师AI会告诉学生AI:"嘿,这张片子上很可能有肺不张和心脏肥大,你在分析时要特别注意这些地方。"这样一来,学生AI就不容易遗漏重要的病变。

第二个阶段叫做"专家引导的对比解码",主要解决"误诊"问题——也就是AI声称看到了实际上不存在的疾病。在这个阶段,导师AI会根据自己的分析结果,对学生AI的每一句话进行实时校正。如果学生AI想要说"患者有严重的胸腔积液",但导师AI认为积液的可能性很低,那么系统就会降低这种表述的可能性,引导AI说出更准确的描述。

这个过程就像是在AI"说话"的每一个瞬间,都有一个内置的"事实核查员"在工作。这个核查员不会完全否定AI的判断,而是会调整AI表达的倾向性,让它更倾向于说出与实际情况相符的内容。

值得注意的是,这种技术最大的优势在于它的"即插即用"特性。就像给汽车安装一个新的导航系统一样,你不需要重新制造整辆车,只需要安装这个新系统就能改善驾驶体验。研究团队可以将这项技术应用到任何现有的AI医疗系统上,而不需要重新训练或修改原有的AI模型。

三、技术效果的惊人表现

研究团队对这项技术进行了全面而严格的测试,结果令人印象深刻。他们使用了三个不同的医学数据库,包括著名的MIMIC-CXR数据库,这些数据库包含了数十万张真实的胸部X光片和对应的医学报告。

在最重要的MIMIC-CXR测试中,使用临床对比解码技术的AI系统在生成医学报告的准确性上提高了17%。这个数字听起来可能不算特别大,但在医学领域,哪怕是几个百分点的提升都可能意味着挽救更多的生命。更具体地说,AI在识别常见疾病方面的准确率提升了67%,这意味着原本可能被遗漏的疾病现在能够被及时发现。

除了提高准确性,这项技术还显著改善了AI生成医学报告的质量。研究人员使用了多种评估标准,包括语言流畅性、医学术语的准确使用、以及与真实医生报告的相似度等。结果显示,使用新技术的AI不仅在医学准确性上有所提升,在报告的可读性和专业性方面也有了明显改善。

特别令人鼓舞的是,这项技术在处理不同类型医学问题时都表现出了稳定的改善效果。无论是回答"这张X光片显示了什么异常"这样的开放性问题,还是回答"患者是否有胸腔积液"这样的具体诊断问题,AI的准确率都有了显著提升。

研究团队还特别测试了技术的稳定性和可靠性。他们发现,即使在故意提供错误或误导性信息的情况下,使用新技术的AI系统也能保持相对稳定的表现,不会因为错误信息而产生严重的误判。这就像给AI装了一个"免疫系统",让它能够抵抗各种可能的干扰因素。

四、技术的创新之处和独特优势

临床对比解码技术的最大创新在于它采用了一种全新的"实时校正"理念。与传统方法不同,这项技术不是试图改变AI的"大脑"结构,而是在AI"说话"的过程中进行实时指导和纠正。

这种方法的优势是多方面的。首先,它完全不需要重新训练现有的AI模型。要知道,训练一个医学AI模型通常需要数月的时间和大量的计算资源,成本极其昂贵。而临床对比解码技术可以直接应用到任何现有的AI系统上,就像给手机安装一个新的应用程序一样简单。

其次,这项技术不依赖于外部数据库或网络连接。许多现有的AI纠错技术需要在庞大的医学数据库中搜索相关信息,这不仅速度慢,还可能涉及患者隐私问题。临床对比解码技术完全在本地运行,既保证了速度,也保护了隐私。

技术的另一个独特之处在于它的"双阶段纠错机制"。第一阶段专门处理"遗漏"问题,确保AI不会错过重要的病变;第二阶段专门处理"误判"问题,防止AI产生不存在的诊断。这种分工明确的设计让整个系统的纠错效果更加精准和可靠。

研究团队还特别关注了技术的实用性。他们设计了一套简单的参数调节机制,允许医生根据具体情况调整系统的敏感度。比如在急诊科,可能需要更高的敏感度来避免遗漏危急疾病;而在健康体检中,则可能需要降低敏感度来减少不必要的恐慌。

更重要的是,这项技术具有很强的通用性。虽然目前的研究主要集中在胸部X光片的分析上,但其基本原理可以扩展到其他类型的医学影像,如CT扫描、核磁共振等。这意味着这项技术有潜力成为整个医学AI领域的通用解决方案。

五、对医疗行业的深远影响

临床对比解码技术的成功不仅仅是一个技术突破,更可能引发医疗行业的深刻变革。在当前医疗资源紧张的背景下,AI辅助诊断已经成为缓解医生工作压力、提高诊断效率的重要手段。

这项技术的应用前景广阔且实际。在偏远地区或医疗资源不足的地方,AI医生可能是患者能够获得专业医疗建议的唯一途径。有了更加可靠的AI诊断系统,这些地区的患者就能获得更加准确的初步诊断,减少因误诊或漏诊导致的治疗延误。

对于大型医院来说,这项技术可以显著提高放射科医生的工作效率。现在,一个经验丰富的放射科医生每天需要阅读和分析数百张医学影像,工作负担极其沉重。有了更加可靠的AI助手,医生可以将更多时间用于处理复杂病例和与患者沟通,而将常规的影像分析工作交给AI来完成。

这项技术还可能改变医学教育的模式。医学院的学生可以使用这种更加准确的AI系统来练习影像诊断,获得即时的反馈和指导。这不仅能提高学习效率,还能确保学生学到的是正确的诊断方法。

从患者的角度来看,更准确的AI诊断意味着更早的疾病发现和更及时的治疗。许多疾病,特别是癌症,早期发现和晚期发现的治疗效果天差地别。如果AI能够更准确地识别早期病变,就能为更多患者赢得宝贵的治疗时间。

六、技术局限性和未来发展方向

尽管临床对比解码技术取得了令人瞩目的成果,但研究团队也诚实地指出了当前技术的一些局限性。首先,目前的研究主要集中在胸部X光片上,虽然原理具有通用性,但要扩展到其他类型的医学影像还需要进一步的研究和验证。

其次,现有的测试数据主要来自同一家医院,这可能存在一定的局限性。不同医院的设备、拍摄标准、患者群体都可能存在差异,技术在更广泛的医疗环境中的表现还需要更多的验证。

技术的另一个局限在于它依赖于专门的"导师AI"系统。虽然这种设计带来了很多优势,但也意味着系统的整体性能会受到导师AI质量的影响。如果导师AI本身存在偏差或错误,那么整个系统的纠错效果就会受到影响。

研究团队已经在规划下一步的研究方向。他们计划将技术扩展到更多类型的医学影像,包括CT扫描、核磁共振、超声检查等。同时,他们也在考虑如何将这项技术应用到其他医学AI任务中,比如病理诊断、药物推荐等。

另一个重要的发展方向是提高技术的个性化程度。目前的系统采用的是"一刀切"的方法,但不同的医生和不同的临床场景可能需要不同的纠错策略。未来的版本可能会根据具体的使用场景和用户偏好进行个性化调整。

研究团队还在探索如何让技术更好地解释自己的决策过程。在医疗领域,可解释性至关重要——医生和患者都需要理解AI为什么做出某个判断。未来的系统可能会提供更详细的解释,告诉用户为什么某个诊断更可能正确,为什么排除了其他可能性。

说到底,这项研究代表了AI医疗技术发展的一个重要里程碑。它不仅解决了当前AI医疗系统面临的一个关键问题,更为未来的技术发展指明了方向。随着技术的不断完善和应用范围的扩大,我们有理由相信,AI将在医疗领域发挥越来越重要的作用,为人类健康事业做出更大的贡献。

这项技术的成功也提醒我们,解决复杂问题往往需要创新的思路。研究团队没有选择重新发明轮子,而是巧妙地利用了现有资源,通过"实时校正"的方法实现了技术突破。这种务实而创新的方法值得其他领域的研究者借鉴。

对于普通人来说,这项技术的意义可能还需要时间才能充分体现。但可以肯定的是,当我们将来再次面对AI医生时,可以对它的诊断结果更加放心。毕竟,在医疗这个关乎生命的领域,准确性永远是第一位的。

Q&A

Q1:临床对比解码技术是什么?它如何提高AI医生的准确性?

A:临床对比解码是一种专门纠正AI医疗诊断错误的技术。它就像给AI医生配备了一位经验丰富的导师,在AI分析X光片时提供实时指导。技术分两个阶段工作:第一阶段防止AI遗漏疾病,第二阶段防止AI误诊不存在的疾病。

Q2:这项技术需要重新训练AI模型吗?使用起来复杂吗?

A:不需要重新训练。这是该技术的最大优势之一,可以直接应用到任何现有的AI医疗系统上,就像给手机安装新应用一样简单。技术完全在本地运行,不需要外部数据库或网络连接,既保证了速度也保护了隐私。

Q3:临床对比解码技术的准确率提升有多大?适用于哪些医学检查?

A:在重要的MIMIC-CXR测试中,技术让AI诊断准确性提高了17%,常见疾病识别准确率提升67%。目前主要应用于胸部X光片分析,但其基本原理可以扩展到CT扫描、核磁共振等其他医学影像检查。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
笑麻了!娃他爸别再打电话了,你娃很忙且不想你!评论区太逗了

笑麻了!娃他爸别再打电话了,你娃很忙且不想你!评论区太逗了

另子维爱读史
2026-02-25 22:07:46
前中天主播吴中纯淋巴癌猝逝!蔡正元:非常不舍

前中天主播吴中纯淋巴癌猝逝!蔡正元:非常不舍

新时光点滴
2026-02-26 00:02:00
新外援是贾巴里帕克?广东队被迫裁掉萨林杰,朱芳雨这次真赌对了

新外援是贾巴里帕克?广东队被迫裁掉萨林杰,朱芳雨这次真赌对了

绯雨儿
2026-02-25 14:47:19
恒大到底如何亏出八千亿的?终于搞懂了!许家印不跑是有原因的!

恒大到底如何亏出八千亿的?终于搞懂了!许家印不跑是有原因的!

历史伟人录
2026-02-25 18:17:16
美国航母的麻烦真的来了!

美国航母的麻烦真的来了!

安安说
2026-02-26 10:55:53
离岸人民币兑美元一度升破6.84

离岸人民币兑美元一度升破6.84

每日经济新闻
2026-02-26 09:53:05
日本发出最后通牒,高市喊话要见金正恩,明摆着让对方下不来台

日本发出最后通牒,高市喊话要见金正恩,明摆着让对方下不来台

爱史纪
2026-02-25 02:23:54
76年尼克松访华,毛主席临时修改接待名单:让国锋与江青一同出席

76年尼克松访华,毛主席临时修改接待名单:让国锋与江青一同出席

元哥说历史
2026-02-25 14:55:03
日本队公布2026年伦敦团体世乒赛名单,伊藤美诚无缘

日本队公布2026年伦敦团体世乒赛名单,伊藤美诚无缘

懂球帝
2026-02-25 13:00:23
总裁看到离职申请时困惑:你年终奖不是刚领90万吗?我:只有900

总裁看到离职申请时困惑:你年终奖不是刚领90万吗?我:只有900

一口娱乐
2026-02-26 02:35:04
瓜子被点名!医生提醒:高血脂还常吃瓜子,很快或迎来3个后果

瓜子被点名!医生提醒:高血脂还常吃瓜子,很快或迎来3个后果

荆医生科普
2026-02-25 18:25:49
好消息:2026年起70岁以上老人可享优待,农民也不例外

好消息:2026年起70岁以上老人可享优待,农民也不例外

风雨与阳光
2026-02-25 22:03:05
笑喷了!汪大爷能屈能伸,积极配合张兰,小孙孙出生详情曝光

笑喷了!汪大爷能屈能伸,积极配合张兰,小孙孙出生详情曝光

小娱乐悠悠
2026-02-26 08:00:55
德转:方昊从北京国安加盟浙江队的转会费约500万人民币

德转:方昊从北京国安加盟浙江队的转会费约500万人民币

懂球帝
2026-02-26 11:00:07
知名作家、编剧墨宝非宝宣布已在21年离婚:男方过错方,财产分割干净

知名作家、编剧墨宝非宝宣布已在21年离婚:男方过错方,财产分割干净

现代快报
2026-02-25 21:58:14
乌军发射ATACMS导弹,摧毁乌东俄军总部、军火库和防空系统

乌军发射ATACMS导弹,摧毁乌东俄军总部、军火库和防空系统

火星宏观
2026-02-25 11:20:11
超越美国日本!中国建全球最大海上机场,为何不在陆地建?

超越美国日本!中国建全球最大海上机场,为何不在陆地建?

领悟看世界
2026-02-26 01:42:24
午盘|抄底的电网CPO大爆发!A股调整要变天?

午盘|抄底的电网CPO大爆发!A股调整要变天?

龙行天下虎
2026-02-26 11:39:42
2023年,985女硕士王懿在东京活活饿死,父母拒绝为其收尸

2023年,985女硕士王懿在东京活活饿死,父母拒绝为其收尸

谈史论天地
2026-02-18 17:45:40
黄晓明带新女伴新加坡旅游,绅士给女方撑伞,身材不如杨颖叶珂

黄晓明带新女伴新加坡旅游,绅士给女方撑伞,身材不如杨颖叶珂

观察鉴娱
2026-02-26 09:30:39
2026-02-26 12:20:49
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7329文章数 553关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

"霍金与比基尼女性同游照"现爱泼斯坦档案 曾被"辟谣"

头条要闻

"霍金与比基尼女性同游照"现爱泼斯坦档案 曾被"辟谣"

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

尼格买提撒贝宁滑雪被偶遇 17年老友情

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

第五代宏光MINIEV焕新 四门玩趣代步车来袭

态度原创

时尚
本地
家居
艺术
数码

伦敦时装周|2026秋冬流行趋势早知道

本地新闻

津南好·四时总相宜

家居要闻

归隐于都市 慢享自由

艺术要闻

2025年百家金陵画展 | 油画作品选刊

数码要闻

博世宣布4月起停用冰箱内置摄像头功能

无障碍浏览 进入关怀版