网易首页 > 网易号 > 正文 申请入驻

临床PK完胜ChatGPT-5!国内团队造出首个OCT影像AI系统

0
分享至



机器之心发布

通用大模型(LLM)的狂飙突进,终于在医疗垂直领域的「最后一公里」撞上了硬墙。虽然 ChatGPT 在 USMLE(美国执业医师资格考试)中表现优异,但在面对需要「火眼金睛」和「毫厘必争」的心脏手术台上,通用大模型的表现究竟如何?

近日,一项由空军军医大学唐都医院李妍教授团队牵头,与深圳清华大学研究院朱锐团队联合完成的 COMPARE 研究在 arXivs 上发表预印版。研究揭示:在经皮冠状动脉介入治疗(PCI)的决策制定中,CA-GPT垂直领域 CA-GPT 系统(一项基于 OCT 影像的 AI 系统),在关键决策指标上显著优于 Open AI 的通用大模型 ChatGPT-5。该研究是基于中科微光医疗(Vivolight Medtech)OCT 系统搭建的 RAG 增强型 AI-OCT 整合决策支持模型。



  • 论文标题:COMPARE: Clinical Optimization with Modular Planning and Assessment via RAG-Enhanced AI-OCT: Superior Decision Support for Percutaneous Coronary Intervention Compared to ChatGPT-5 and Junior Operators
  • 论文地址:https://arxiv.org/abs/2512.10702

这不仅是一次算法的胜利,某种程度上可以称得上是中国腔内影像领域的「DeepSeek 时刻」。这套 CA-GPT 系统有望重新定义心脏介入手术的智能化标准。

01. 巅峰对决

通用大模型在专业战场「水土不服」

据《2023 年全球心血管疾病负担报告》统计,每年因心血管疾病死亡的人数达 1920 万,而经皮冠状动脉介入治疗(PCI)作为最核心的血运重建手术,全球年手术量已超过 400 万例。在 PCI 手术中,OCT(光学相干断层成像)被称为医生的「第三只眼」,可清晰看到血管内病变情况,但是其图像解读高度依赖医生经验,初级医师与资深专家在手术成功率、并发症发生率等关键指标上的差距高达 40% 以上。



腔内影像中不同技术与分辨率的对比示意图

在这项纳入了 96 名患者、160 处病变的临床研究中,团队构建了一个严苛的竞技场:将 CA-GPT 系统、ChatGPT-5 以及拥有 1-5 年经验的初级介入医师放在同一维度下,以资深专家团队制定的手术记录为金标准进行盲测 。所有方案均与患者实际接受的手术记录(由年手术量≥ 200 例、经验≥ 10 年的高级专家完成)进行比对。评估涵盖 10 项预设决策指标,分为术前规划 5 项和术后评估 5 项,每项一致得 1 分,总分 0-5 分。



10 项不同 PCI 策略的评分标准

值得一提的是,传统 OCT 图像解读还需要医师逐帧分析,耗时数分钟至十数分钟。相比之下,CA-GPT 系统可在 20 秒内完成全面分析并生成结构化报告,将影像解读时间缩短 95% 以上。

结果显示,在术前规划(Pre-PCI)阶段,CA-GPTChatGPT形成了「降维打击」:

  • 总体决策评分:CA-GPT 系统的评分中位数达到满分 5.0,显著高于 ChatGPT-5 的 3.0(P<0.001),同时也优于初级医师的 4.0。
  • 支架直径选择(关键指标):CA-GPT 的准确率高达90.3%,而 ChatGPT-5 仅为 63.9%,甚至低于初级医生的 72.2%。
  • 支架长度选择:CA-GPT 准确率达80.6%,ChatGPT-5 仅为 54.2%。



决策一致性亚组分析



各评分项目的性能分布

而在术后评估(Post-PCI)阶段,三方总体表现都比术前更好,因为这个阶段有了术前方案和实际结果可以参考。但 CA-GPT 依然在一些关键指标上表现出优势,比如:对「最小支架面积是否达标」的判断,CA-GPT 与专家判断的吻合度接近 100%;年轻医生略有差距。

对「支架是否扩张不足」、「是否存在严重贴壁不良」的识别,CA-GPT 在支架贴壁评估(93.2% 准确率)等需要精细判断的项目上,优于初级医师组(76.1%)。

那为何拥有海量参数的 ChatGPT-5 会败下阵来?研究指出,通用大模型虽然语言推理能力强,但缺乏对图像数据的数值敏感性和空间理解力。特别是在面对功能性缺血(OCT-FFR≤0.80)或严重钙化等复杂病变时,通用模型容易产生「幻觉」,而 CA-GPT 则展现了极高的稳定性,在复杂病变亚组分析中依然保持了中位数 5.0 的高分。

02. 解密架构

RAG + DeepSeek 的工程化胜利

CA-GPT 之所以能实现高稳定性和准确性,核心在于摒弃了对单一端到端大模型的迷信,构建了一套严密的「小模型 + 大数据 + 大模型」的 RAG 复合智能体架构。



CA-GPT 训练模型架构:小模型 + 大数据 + 大模型

据其技术披露,该系统并非简单的聊天机器人,而是一个精密的协作系统:

  1. 「感官」精准化(小模型层):系统底层集成了13 项核心功能(含 6 项自研专有算法)。它们负责像「显微镜」一样对 OCT 影像进行结构化分析,在5-10 秒内即可完成管腔分割、斑块定性、钙化积分计算等定量工作,为决策提供精准的数据地基。
  2. 「大脑」逻辑化(DeepSeek):在大模型推理层,该系统基于开源的DeepSeek构建。它不再依赖概率生成文本,而是基于小模型提供的精准量化数据,进行符合医学逻辑的深度推理。
  3. 「知识」实时化(RAG 技术):通过检索增强生成(RAG)技术,系统链接了包含超过 100 万篇心血管文献及指南的知识库(DBdata)。这意味着,AI 的每一次决策建议,都能追溯到具体的专家共识或最新指南,有效抑制了 AI 幻觉。



基于 CA-GPT 的 AI-OCT 系统辅助决策案例介绍

03. 普惠价值

让县域医生拥有「顶级三甲专家」视野

这项技术突破的终极意义,不在于在论文中战胜 ChatGPT,而在于解决医疗资源分布不均的现实痛点。全球心血管疾病负担日益加重,但资深介入专家(完成 1000+ 例手术)却是极度稀缺资源。培养一名能独立处理复杂病变的医生,往往需要 8-12 年的漫长周期。研究数据显示,初级医生在处理复杂病变时,与专家存在显著差距。

因此,CA-GPT 系统在本质上是在做「医疗能力的平权」

想象一下,在偏远的县级医院,一位刚工作不久的医生,在面对复杂的钙化病变时手足无措。此时,CA-GPT 系统在 5-10 秒内给出了手术策略:

  • 「建议预处理使用旋磨术,旋磨头选择 1.5mm」
  • 「建议支架尺寸 3.0 x 28mm,释放压力 12atm」
  • 「注意:远端存在边缘夹层风险」

这相当于每台手术都有一位顶尖专家在旁「手把手」指导。

04. 结语

做垂直领域的「定义者」

过去十年,中国医疗器械行业更多是在追赶西方的脚步。但此次发布的 CA-GPT 系统及其临床成果,标志着中国企业在高端腔内影像领域开始掌握定义权。

不做通用大模型的「套壳」,而是深耕垂直场景的「窄门」。 用数据证明:在医疗这种容错率为零的领域,唯有将深度学习的精准度与大模型的推理能力完美结合,才是 AI 落地的正途。

这或许就是中国医疗科技的「DeepSeek 时刻」—— 把 AI 技术落地业务场景,用自己的技术,解决最真实的临床痛点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
OPPO母亲节文案冒犯公序良俗,中广协、武大发声

OPPO母亲节文案冒犯公序良俗,中广协、武大发声

南方都市报
2026-05-10 20:27:01
北方迎高温“快闪” 之后,冷空气将“断崖式”降温

北方迎高温“快闪” 之后,冷空气将“断崖式”降温

中国能源网
2026-05-11 10:22:05
心理学上有个效应:父母越勤快,孩子越自私;学会“放手”这两件事,孩子未来越成功

心理学上有个效应:父母越勤快,孩子越自私;学会“放手”这两件事,孩子未来越成功

心理观察局
2026-05-09 09:10:22
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
烂就是烂,永远不能指望的国民党

烂就是烂,永远不能指望的国民党

超级学爸蛋总
2026-05-11 07:58:42
华西村被骂死爱面子的3亿金牛,15年后成功逆袭!变身最强压舱石

华西村被骂死爱面子的3亿金牛,15年后成功逆袭!变身最强压舱石

三农雷哥
2026-05-10 17:46:34
有暴雨大暴雨!广东下一轮强对流天气时间,确定了

有暴雨大暴雨!广东下一轮强对流天气时间,确定了

鲁中晨报
2026-05-11 07:26:07
杨鸣一句话撕开山东遮羞布:没了打封闭的铁人,平民球队只剩绝望

杨鸣一句话撕开山东遮羞布:没了打封闭的铁人,平民球队只剩绝望

林子说事
2026-05-11 09:45:50
回顾深圳母子神秘失踪,14年后,房东在出租屋纸箱里发现干尸

回顾深圳母子神秘失踪,14年后,房东在出租屋纸箱里发现干尸

莫地方
2026-05-11 01:15:03
老伴凌晨心梗,我打女儿8个电话没人接,女婿:你能不能懂点分寸

老伴凌晨心梗,我打女儿8个电话没人接,女婿:你能不能懂点分寸

木言观
2026-05-10 07:02:33
高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

次元君情感
2026-05-10 21:14:41
梁靖崑都没想到,王皓竟然因为一句话,直接被封神级赛场心理导师

梁靖崑都没想到,王皓竟然因为一句话,直接被封神级赛场心理导师

汪镛的创业之路
2026-05-11 11:53:15
分手29年后,肖战成国乒副总教练,而她嫁给富商,已是大学教授

分手29年后,肖战成国乒副总教练,而她嫁给富商,已是大学教授

做一个合格的吃瓜群众
2026-04-06 10:16:48
老兵不死!周鹏续写传奇,深圳晋级四强,冲冠之路仍有短板

老兵不死!周鹏续写传奇,深圳晋级四强,冲冠之路仍有短板

诺诺谈史
2026-05-11 12:24:56
这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

潮鹿逐梦
2026-03-02 17:19:02
随巴萨夺得西甲冠军,拉什福德职业生涯首次夺得联赛冠军

随巴萨夺得西甲冠军,拉什福德职业生涯首次夺得联赛冠军

懂球帝
2026-05-11 05:17:17
“日光盘”重现、认购破千套:楼市的信心,涨回来了?

“日光盘”重现、认购破千套:楼市的信心,涨回来了?

秦朔朋友圈
2026-05-11 00:03:51
“太疯狂”!价格大跳水!深圳多家超市排长队,一上架遭疯抢!网友:刚买完

“太疯狂”!价格大跳水!深圳多家超市排长队,一上架遭疯抢!网友:刚买完

南方都市报
2026-05-11 07:55:34
尼克斯横扫费城:唐斯与恩比德的命运与角色

尼克斯横扫费城:唐斯与恩比德的命运与角色

张佳玮写字的地方
2026-05-11 06:55:13
坐不住?美企CEO放话:若中国搞定先进光刻机,就会掀翻芯片格局

坐不住?美企CEO放话:若中国搞定先进光刻机,就会掀翻芯片格局

Thurman在昆明
2026-05-10 12:13:29
2026-05-11 13:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12965文章数 142648关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

媒体:特朗普确定本周访华 中美在东亚有个共同的敌人

头条要闻

媒体:特朗普确定本周访华 中美在东亚有个共同的敌人

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

谢霆锋没想到,王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手,谁是出海最强"水手"?

态度原创

旅游
健康
房产
本地
艺术

旅游要闻

核心路线!四川剑门关空气清新氧气充足,一夫当关千年一叹!

干细胞能让人“返老还童”吗

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

本地新闻

用苏绣的方式,打开江西婺源

艺术要闻

2026中央美术学院博士生毕业作品选

无障碍浏览 进入关怀版