网易首页 > 网易号 > 正文 申请入驻

震撼研究:AI在检验领域已展现远超专业医生的水准!

0
分享至

近年来随着计算机芯片的迭代、数学算法的发展以及数据库质量的提升,人工智能(AI)历经神经网络、机器学习、深度学习、生成式AI,其与医学融合,已广泛涉及医疗影像、辅助诊断、药物研发、健康管理、疾病预测等领域。

ChatGPT作为生成式AI最典型的代表,一直是医学领域热衷研究的对象。其在各国执业医师考试中的表现,回答社交媒体论坛上发布的患者问题的实用性以及协助医生的临床查询方面都已经有了细致研究。

随着大众对于健康知识的愈发看重,快速准确的获取检验知识,解读检验报告已成为患者迫切的实际需求。将ChatGPT 等生成式AI用于实验室结果解释的研究自然也就应运而生。

检验顶刊最新研究

AI在检验领域的表现远超专业人士

这些研究评估了 ChatGPT 在解释模拟报告和回答基本或技术知识问题方面的准确性。

不久前,检验领域的顶刊《Clinical Chemistry》上发表了一项最新研究,《ChatGPT vs Medical Professional: Analyzing Responses to Laboratory Medicine Questions on Social Media》。

研究人员在美版知乎Quora和社交网站Reddit上搜集了49个有关检验医学的热门问答,并将相同的问题提给ChatGPT,将它们与 ChatGPT 3.5 和 4.0 版生成的回答进行了比较。由资深的检验医学专业人员对不同的答案进行质量评价。

每个问题都会对应3个匿名回答,3名拥有15年以上经验的检验主任级专业人士作为评估人员,同时考虑准确性、相关性、时效性和清晰度等因素,在评估表中选出1~2个首选的答案,并为每个答案评级。

文献截图

结果显示,ChatGPT 的回答获得的优秀评分明显多于医疗专业人员的回答(下图绿色部分),同时ChatGPT 的回答获得的较差评分明显少于医疗专业人员的回答(下图粉色部分)。

文献截图

评估人员首选回答倾向ChatGPT 的占比达到75.9%(95% CI,68.8%-83.1%)。

文献截图

总体而言,评估人员认为,ChatGPT 的回答更加全面且准确,而医疗专业人员的回答则更加简洁且易于理解。

华西医院最新研究

AI参加中级考试,正确率高于平均值

类似的研究国内也已经有相关报道。

四川大学华西医院实验医学科路小琴等发表在《临床检验杂志》的研究《大语言模型在检验医学领域的应用潜力与挑战评估》中,同时对比了中外大语言模型ChatGPT-4.0和ERNIE Bot-4.0在检验医学领域的应用表现。

该研究以全国临床医学检验技术(中级)考试真题作为基准,对于2个模型在检验医学知识掌握和答题一致性方面的表现;通过30个检验医学病例评估模型在检验结果解读和辅助诊断方面的能力。

结果显示,在临床医学检验技术测试中,2个模型均通过了60%的合格线。ChatCPT-4.0在答题正确率上明显低于ERNIE Bot-4.0(73.25% vs 80.75% ) ,ERNE Bot-4.0正确率已经高于临床检验人员此项考试的平均正确率78.03%。

在病例分析测试中,两者均在常规病例分析上表现良好,但在复杂病例分析中会发生错误。

通用大语言模型

现阶段难以直接应用于检验领域

以上2项研究中均是以通用大语言模型为对象,其在复杂病例的分析能力以及结果输出的准确性和一致性方面都存在问题,现阶段直接将这类通用型大语言模型应用于临床检验结果解读及辅助诊断存在相当大的风险,极容易出现“一本正经的胡说八道”的情况,也就是所谓大模型幻觉。

除了技术问题之外,通用大语言模型缺乏特定医学训练且无法甄别过时医学知识是主要原因。

但根据特定领域知识量身定制的小语言模型(SLM)通过在精选医学数据集上进行训练,可以更精确地理解和处理医学知识和概念,为特定的健康问题提供更准确、相关性更强的结果。

图像识别相关的研究已经相当成熟!

检验的最后一片【净土】正在被AI攻破!

形态学检验作为广大检验人心中坚信难以被机器取代的最后一片“净土”,现在也正在被AI攻破!

图像识别作为计算机视觉的重要分支,在医学领域中迅速发展,目前已被广泛应用于生物医学成像。与此同时,相关技术也拓展至检验医学领域。作为医学检验的重要组成部分,形态学检验在AI技术的参与下,正处于技术变革的前沿。

AI在血液形态学检验中的研究相对成熟,硬件方面包括WSI、自动对焦等,应用方面包括外周血细胞形态学分析、罕见血细胞筛查、血液寄生虫检验 等,均已取得了突破性进展,基于AI的体外诊断形态学检验产品已开始进入可实质性服务临床医疗阶段。

在微生物形态学检查方面,AI技术主要应用于镜下形态和菌落特征两方面。虽然AI在微生物涂片形态学检查中的研究目前处于起步阶段,但也已突破革兰染色镜检仅能区分革兰阴性和阳性的限制;微生物培养平板的菌落形态识别方面,AI技术的引入使以手工为主的微生物检验实现全面自动化成为可能。

参考文献

1.Girton MR, Greene DN, Messerlian G, Keren DF, Yu M. ChatGPT vs Medical Professional: Analyzing Responses to Laboratory Medicine Questions on Social Media. Clin Chem. 2024 Sep 3;70(9):1122-1139. doi: 10.1093/clinchem/hvae093. PMID: 39013110.

2.陆小琴,佳薇,武宇翔,武永康.大语言模型在检验医学领域的应用潜力与挑战评估[J].临床检验杂志,2024,42(08):619-623

3.奕巧莲,吴卫,徐英春. 人工智能在形态学检验中的研究进展[J]. 中华检验医学杂志,2024,47(05):578-584.

近期直播推荐

编辑:笪文武 审校:徐少卿

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
辞职央视嫁大20岁美国富豪,婚后挨毒打吃剩饭死不离婚,如今怎样

辞职央视嫁大20岁美国富豪,婚后挨毒打吃剩饭死不离婚,如今怎样

小椰的奶奶
2026-02-22 01:36:32
甜馨回贾乃亮老家过春节,爷爷奶奶让出C位,父女俩共用一张脸!

甜馨回贾乃亮老家过春节,爷爷奶奶让出C位,父女俩共用一张脸!

地理三体说
2026-02-21 23:22:48
里昂13连胜,丰塞卡:我们能创造特别的事情;恩德里克是天才

里昂13连胜,丰塞卡:我们能创造特别的事情;恩德里克是天才

懂球帝
2026-02-21 23:48:17
中方诚心邀请俄罗斯访华!普京开心回应,中俄关系再次升温!

中方诚心邀请俄罗斯访华!普京开心回应,中俄关系再次升温!

现代小青青慕慕
2026-02-21 10:40:31
深度长文:冥王星为何被降级为矮行星?

深度长文:冥王星为何被降级为矮行星?

宇宙时空
2026-02-20 22:15:03
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
给人养了7年闲人,广汽终于要关闭洛杉矶的研发中心

给人养了7年闲人,广汽终于要关闭洛杉矶的研发中心

与车同乐
2025-12-04 10:05:02
金巧巧一家三亚过年,富豪老公于东罕携子女追星显恩爱

金巧巧一家三亚过年,富豪老公于东罕携子女追星显恩爱

无人倾听无人倾听
2026-02-21 17:36:50
54岁洪欣太拼了!大年初三露天商演,穿吊带短裙冻到单薄,现状令人唏嘘

54岁洪欣太拼了!大年初三露天商演,穿吊带短裙冻到单薄,现状令人唏嘘

草莓解说体育
2026-02-22 01:45:33
第一代独生子女们的悲哀:无家可回

第一代独生子女们的悲哀:无家可回

黑哥讲现代史
2026-02-19 17:54:54
娜然已经融入霍家?相比章子怡当年的“被嫌弃”,她做对了什么

娜然已经融入霍家?相比章子怡当年的“被嫌弃”,她做对了什么

扒点半吃瓜
2026-02-21 07:00:09
谷爱凌不再回避!坦言“世界不会原谅我了”,彻底走上朱婷的老路

谷爱凌不再回避!坦言“世界不会原谅我了”,彻底走上朱婷的老路

有范又有料
2026-01-29 16:02:11
1967年,梁兴初视察成都军区时,被流氓威胁:这条街,你们出不去

1967年,梁兴初视察成都军区时,被流氓威胁:这条街,你们出不去

大运河时空
2026-02-21 13:40:03
就冲这个胸,这个扣子,不颁奖给她,都说不过去!

就冲这个胸,这个扣子,不颁奖给她,都说不过去!

另子维爱读史
2025-08-31 19:15:27
王濛:领队上过几回冰?教练不愿改变!花那么多钱,得有人负责!

王濛:领队上过几回冰?教练不愿改变!花那么多钱,得有人负责!

风过乡
2026-02-21 19:25:09
万万没想到,6年前反中乱港分子的幕后金主,竟是个“爱国”商人

万万没想到,6年前反中乱港分子的幕后金主,竟是个“爱国”商人

百态人间
2026-01-17 16:16:00
先敬罗衣后敬人!网友:很多服务行业,都是看菜下碟的

先敬罗衣后敬人!网友:很多服务行业,都是看菜下碟的

夜深爱杂谈
2026-02-19 22:20:41
留几手发文:韩寒真是厉害,我服了,彻底服了!他透露多年前韩寒曾经给他发过短信,自己有韩寒手机号,但没好意思打扰

留几手发文:韩寒真是厉害,我服了,彻底服了!他透露多年前韩寒曾经给他发过短信,自己有韩寒手机号,但没好意思打扰

大风新闻
2026-02-20 15:51:03
23岁伊拉克国王费萨尔二世被处决,他的双脚被砍掉,衣服也被扒光

23岁伊拉克国王费萨尔二世被处决,他的双脚被砍掉,衣服也被扒光

南权先生
2026-02-13 15:23:32
朱珠回天津婆家过年,婆婆在师范大学工作,做13道菜热情招待儿媳

朱珠回天津婆家过年,婆婆在师范大学工作,做13道菜热情招待儿媳

八怪娱
2026-02-19 20:39:37
2026-02-22 02:20:49
中华检验医学网 incentive-icons
中华检验医学网
全国最具影响力检验医学新媒体
11940文章数 47815关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

黄晓明澳门赌博输十几亿 本人亲自回应

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

游戏
亲子
本地
教育
健康

卡婊总算玩明白了,《安魂曲》双主角盘活生化30周年

亲子要闻

中韩宝宝得要从小灌输中国文化 真正的年味是什么?

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

教育要闻

就业数据:未落实毕业去向5032人!太吓人!

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版