网易首页 > 网易号 > 正文 申请入驻

让大模型和医生搭档,蚂蚁AI医疗的「少数派」之路

0
分享至

一家三甲医院顶级专科和一家大厂,拥抱AI医疗的决心。

作者丨洪雨欣

编辑丨陈彩娴

“DeepSeek 一上线,行业有个声音是医生以后可能就没饭吃了。”

近期在一场公开活动中,上海交通大学医学院附属仁济医院(下简称“仁济医院”)副院长、泌尿科学科带头人薛蔚说道。这番话的另一面,是传统医疗机构对新一代AI技术的价值重估。

2025 年开年,DeepSeek掀起了大模型领域的新走向,将行业落地的算力、算法门槛都大幅降低,使得AI与产业融合开始爆发,医疗就是其中的热门场景之一。一时间,涌入了更多参赛者。有以腾讯、华为、京东、蚂蚁为代表的头部大厂,也有商汤、讯飞这样的科技巨头。

一方面,医疗行业需要AI:医患比例不平衡,使医院增效需求明显,分级诊疗的推进,也需要快速缩小各级机构诊断能力的差别。当前,先进模型在医学问答测试中的部分表现已经超越全科医生水平。

另一方面,AI也需要医疗:AI医疗上限还远未到达,专才大模型得靠高质量医疗数据的调教,需要行业进一步合理利用数据、驱动创新发生。

在仁济医院,更早一步的探索已经显露出阶段性成果:

基于蚂蚁医疗大模型开发的仁济医院泌尿外科智能体(简称“RJUA智能体”),涵盖98%常见泌尿系统疾病类别,上线支付宝AI健康管家运行8个月以来,服务30多万病人,已超出仁济医院泌尿科半年的门诊量。

这是首个用疾病结构化数据训练、在真实医疗场景运行的专科智能体,采用上海仁济医院97.6%疾病谱的标准化病例数据集,以及20多个专科医生撰写的场景疾病知识图谱,首次将三甲医院诊疗逻辑与AI技术结合。

根据院方评测结果显示,在该智能体的辅助下,基层医生诊断准确率可提升4%-8%,已初步具备“下基层”的能力。

01

大模型需要医生

专攻专攻,有专才可攻,这句话放在AI医疗领域依然适用。

“其实很多医院接入DeepSeek还不知道怎么用,一些医院推出大模型还没有具备临床使用的能力。科技和医疗的结合,不是丢给大模型一些医院数据就够用了。”一位医生坦言。

目前,通用大模型在一些基础全科疾病的诊疗上已拥有较高准确率,但专科诊疗智能体仍然是探索AI医疗的深水区。

仁济医院在内部做过一个研究:50位仁济医院的实习医生(平均年龄21岁)、50位上海各个社区卫生服务中心的全科医生(平均年龄49岁)和50位来仁济进修的区县级三级医院的泌尿外科专科医生(平均年龄39岁)对1000名真实患者进行问诊,并分别和RJUA、DeepSeek等主流产品的诊断结果进行比对。

对比测试中,市面上的医疗大模型,包括DeepSeek,准确率都在40-50%之间,只相当于全科医生的水平。而RJUA以69.81%的准确率击败了社区医生(48.33%)和实习医生(43.85%),基本接近专科医生的水平(73.65%)。

70%和50%的数据差异,其关键在于“大模型的老师是谁,是不是这个学科最顶级的医生”。大多数医疗大模型的“语料”来自临床指南、科研文献及少量的真实诊疗数据,而RJUA的知识库则完全由仁济医院医生团队共同完成。

仁济泌尿科是国内体量最大的泌尿外科临床诊疗中心。仁济医院泌尿科主任潘家骅提到,“我们每年有55万人次的就诊量,手术量在3万例以上,将近120位临床医生,每年的产值将近达到12个亿。如此之大的临床体量,为形成仁济泌尿智能体语料库提供了非常重要的数据来源。”

历时半年时间,仁济医院和蚂蚁集团共同完成国内首个临床专科推理数据集的构建,总共包含2132个问答对,对应25000多条诊疗依据和临床数据,涉及67个泌尿系统常见疾病,病种覆盖人群超过泌尿科就医人群的97.6%。

“在医疗领域,精准知识的训练比注入规模化数据更重要,除了教给AI医学文献和指南,关键还在让AI学会医生的逻辑和思维,因此在这个过程中顶尖医生与技术应该成为搭档。”仁济医院泌尿外科主治医生、RJUA智能体项目的主要参与者迟辰斐对雷峰网表示。

医生深度参与,专科大模型才能够更加真实地模拟诊疗路径。

02

蚂蚁医疗大模型进医院的730天

2023年3月,蚂蚁医疗大模型团队和仁济医院泌尿科医生第一次见面。

“老教授黄翼然分享自己在陕西农村义诊的经历,看到一些基层患者因为得不到及时和专业的救治最终走向生命的终点。基层患者也因缺乏诊疗认知,得了病要不忍着,要不找村医,往往不能对症下药。”蚂蚁集团仁济合作项目核心技术成员申月对此印象深刻。

当时,百亿规模的大模型仅具备对话的能力,推理能力处于明显的弱势。如果能通过知识图谱和医疗专家的合作,数字化三甲医生的临床经验,结合大模型去做to b的产品,就能点对点地到相关的基层里面去给老百姓们做诊疗。

于是,在仁济医院泌尿科和蚂蚁集团的合作下,由7个权威医生、10个专业技术团队构成的项目组成立了。

愿景虽美,难度却大。如果单是给模型喂养文献数据,大部分的通用模型都能做到。最大的挑战是——如何把医生脑袋里的知识“蒸馏”出来。在和医生沟通的过程中,申月发现,医生的决策判断和经验很难被数字化,而不能数字化,大模型就学不会。

对此,双方确认了两条训练路径来突破瓶颈。第一条,围绕近5年泌尿专科的权威诊疗指南和论文,搭建一个模型基座。第二条,构建一个专科的推理数据库,对模型进行数据训练。

为了搭建专科数据库,蚂蚁算法团队翻出了2019到2023年五年间仁济医院的所有病例资料,涵盖门诊诊疗、急诊抢救、住院手术和操作及日常科普等多种形式。覆盖的病例范围不仅有常见疾病,还有复杂罕见的疾病。蚂蚁先后挑选了2132个病例,在此基础上模拟设计出各种各样的虚拟患者,让医生对他们进行问诊,再将问答过程投喂给模型。

在知识图谱的构建上,蚂蚁和仁济磨和了很久。图谱的搭建触及到主导权的问题:医生、算法、工程,到底由谁来主导?如果完全由医生主导,他更多重心是在两个症状之间的关系,而非知识图谱的底层设计。但由技术人员主导,很多经验和数据又没法验证。为了平衡医生和技术团队的知识,双方每周基本上每个时间都会在钉钉上面交流,“医生每天也很忙,我们经常半夜的时候打电话让他们验收数据,就是这样一步步过来的。”

迟辰斐回忆道,光是构建专业语料库,前后就耗时数月。光前列腺增生这一个病种,就需要参考上万条病例信息,把可能涉及的症状,影像资料、化验指标全都编出来,再在模型给出的诊断结果上进行标注。

但是,拿出数据以后呢?需要参考什么资料进行诊疗?要融合医生的思维链,还得结合指南里的诊疗方案和医生的临床经验对病例进行修改。这又是一个难题,因为专科指南和论文涉及大量复杂的医学知识,而且现实中医生也不会完全照着指南上的步骤进行诊疗。申月认为,如果技术人员不懂怎么看病例,那大模型肯定也学不会。只有懂了,才能更好地训练它。

为了加深对医学知识的理解,在项目启动的三、四个月里,申月的团队有80%以上的时间都花在学习泌尿相关专业知识上,也曾穿着白大褂和医生一块出门诊,大家在办公室里也开始频繁地聊起PSA值之类的临床术语。申月每周都要和医生开至少两次会,讨论病例、梳理指南。他们还向基层医生和专家请教,结合医生理性和非理性的思维,打造大模型的思维链路。

申月开玩笑道,大模型出来之后,你会感觉这个世界上的各种知识一下子离你很近了。她甚至利用业余时间研读在职医学博士课程。

他们还做了一个很有意思的事,申月给了仁济医院的医生一个录音笔,在经门诊患者同意的情况下进行了多段录音,以此收集更多真实患者反馈的数据。“我们希望拿到更多患者的诉求数据,让大模型看看他的能力怎么样。” 通过验证,他们发现大模型已具备理解患者的能力。“如果患者的需求是不考虑手术方案,那大模型就不会推给他。”

从23年9月到24年9月,整整一年多的时间,蚂蚁和仁济都在磨合专科推理的数据集和大模型的推理能力。在双方的推动下,模型的尺寸从最开始的10B扩大到现在的600B,能够帮助智能体的能力越来越像一个真正的医生。

深度绑定的合作形态,也带来了突破性的研究成果。2023年12月,首个基于中文语料的专科问答数据集RJUA-QA发布;2024年4月,基于医疗真实场景的场景AI专科测评体系——RJUA测评体系面世;2024年9月,国内首个由医生深度参与开发的专科智能体——RJUA智能体上线。

“将三甲医师的水平封装进大模型”,这句话正在逐步成真。正所谓长风破浪会有时,蚂蚁和仁济的合作,也许会是一个AI向下扎根医疗行业的有效路径。

03

向下扎根,步入医疗行业的深处

与仁济医院的共建,是行业中的一条“少数派”路径,也可以被视为蚂蚁布局AI医疗的内在思路。

“在医疗这个领域,我们要‘敬畏行业,趴地而行’。11年前开始,我们就深知干医疗没有捷径,支付宝从能做的事开始做起,啃的都是医疗行业的硬骨头。“蚂蚁集团数字医疗健康事业部总经理张俊杰曾表示。

以支付为起点,2014年蚂蚁开始探索与医院合作,2016年上线医保线上支付服务、打造“未来医院”,如今,支付宝医疗健康已经是国内规模最大的医保第三方在线服务平台。

以大模型为支点,2023年,蚂蚁在大模型发展中选择医疗健康作为重点发力方向。自研底座通用大模型加入了强大的专家知识增强,使得医疗大模型可以更严谨、更符合产业落地的实际需求。蚂蚁还联合硬件厂商、医疗信息化领域企业,共同探索AI医疗产品。

由此,面向下一个十年,蚂蚁构建出了一个以AI为核心能力,衔接底层技术厂商、上层医疗机构客户等维度的AI医疗开放生态。

互联网医疗是连接,AI医疗则是扩容。医疗大模型的赛道从不缺乏竞争的身影,各家能否抵达彼岸,仍是一个未知数,但可以明确的是,蚂蚁已先行一步。

虚弱的金山云,股价飙涨 10 倍背后

留给哪吒汽车的时间不多了

一个智驾泊车霸主的消亡史

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当年揭露“三鹿奶粉”的上海记者,4年后辞职,17年后变成这样了

当年揭露“三鹿奶粉”的上海记者,4年后辞职,17年后变成这样了

凡知
2026-07-01 10:22:40
注意!高温持续烘烤广东全省 7月初台风或将携大风暴雨突袭

注意!高温持续烘烤广东全省 7月初台风或将携大风暴雨突袭

21世纪经济报道
2026-07-01 16:11:26
“光储市值一哥”市值跌破3000亿元,早盘蒸发600亿元

“光储市值一哥”市值跌破3000亿元,早盘蒸发600亿元

第一财经资讯
2026-07-01 10:57:57
广州东站一女子疑因进站问题与车站人员起冲突砸摔对讲机,多方回应

广州东站一女子疑因进站问题与车站人员起冲突砸摔对讲机,多方回应

潇湘晨报
2026-07-01 15:35:11
问界M5买两年异味不散:门店两次测甲醛超标,厂家一测就“合格”!市监局回应:当年没抽检同批次车辆

问界M5买两年异味不散:门店两次测甲醛超标,厂家一测就“合格”!市监局回应:当年没抽检同批次车辆

中国山东网
2026-06-29 09:25:07
名记:科比死的时候、湖人悲痛!是詹姆斯团队所有人!

名记:科比死的时候、湖人悲痛!是詹姆斯团队所有人!

历史第一人梅西
2026-07-01 11:02:57
没有这种食物,你的肌肉将消失!医生:55岁后恢复肌力的8种食物

没有这种食物,你的肌肉将消失!医生:55岁后恢复肌力的8种食物

垚垚分享健康
2026-06-30 21:25:03
《百年孤独》:永远不要太操心你的孩子,也不要操心你的父母,你所有的操心基本上是白费,每个人都有自己的三生因果

《百年孤独》:永远不要太操心你的孩子,也不要操心你的父母,你所有的操心基本上是白费,每个人都有自己的三生因果

心理观察局
2026-07-01 07:27:21
堪称吃绝户!新婚一年离婚分割财产,上海男子分得女方6800多万​

堪称吃绝户!新婚一年离婚分割财产,上海男子分得女方6800多万​

火山詩话
2026-06-30 09:01:21
一女子出差3月,她养了8年的狗每晚对衣柜狂叫,丈夫忍无可忍砸开柜门,谁料,里面的东西却让他浑身发抖…

一女子出差3月,她养了8年的狗每晚对衣柜狂叫,丈夫忍无可忍砸开柜门,谁料,里面的东西却让他浑身发抖…

二胡的岁月如歌
2026-06-30 20:58:22
2026高考出现反常一幕:国防科大暴跌,另一所军校却涨了102分

2026高考出现反常一幕:国防科大暴跌,另一所军校却涨了102分

妍妍教育日记
2026-06-29 19:27:46
单局2-11惨败心态不崩!蒯曼3-1力克华裔老将,下轮大战韩国一姐

单局2-11惨败心态不崩!蒯曼3-1力克华裔老将,下轮大战韩国一姐

钉钉陌上花开
2026-07-01 10:41:57
48小时内!高市开始反击:召见中国大使后,日本又爆发一个噩耗

48小时内!高市开始反击:召见中国大使后,日本又爆发一个噩耗

羽逸地之光
2026-06-30 17:15:53
果然早有准备?詹姆斯确定离队后,湖人迅速谈成两笔补强

果然早有准备?詹姆斯确定离队后,湖人迅速谈成两笔补强

移动挡拆
2026-07-01 15:20:22
外媒:库尔图瓦等比利时老将开会自救,主教练没有参与

外媒:库尔图瓦等比利时老将开会自救,主教练没有参与

懂球帝
2026-07-01 15:49:14
洋人的恶意高薪

洋人的恶意高薪

难得君
2026-06-30 18:03:01
死亡人数破千!欧洲正式摊牌,宁可社会崩溃也不让中国办成一件事

死亡人数破千!欧洲正式摊牌,宁可社会崩溃也不让中国办成一件事

标体
2026-07-01 13:47:51
倒计时2天!男篮传来坏消息,事关赵继伟,郭士强或紧急调整名单

倒计时2天!男篮传来坏消息,事关赵继伟,郭士强或紧急调整名单

萌兰聊个球
2026-07-01 10:53:17
要不是世界杯,恐怕没人知道,中国在52万人的佛得角投入了多少

要不是世界杯,恐怕没人知道,中国在52万人的佛得角投入了多少

铭记历史呀
2026-07-01 00:45:09
蔚来、小米、理想、小鹏等,6月份各品牌交付量大盘点

蔚来、小米、理想、小鹏等,6月份各品牌交付量大盘点

科技锋说
2026-07-01 13:36:28
2026-07-01 17:07:00
雷峰网 incentive-icons
雷峰网
关注智能与未来!
69939文章数 656150关注度
往期回顾 全部

科技要闻

Claude Code被曝“植入木马”识别中国用户

头条要闻

女生考驾照留下心理阴影 还被练车的"人情世故"整崩溃

头条要闻

女生考驾照留下心理阴影 还被练车的"人情世故"整崩溃

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

张凌赫:我连心疼你都隔着时差

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

交付持续攀升再破纪录 零跑6月全球交付93376台

态度原创

游戏
时尚
旅游
教育
公开课

舅舅党坚称《GTA6》PS5 Pro版一定有60帧 否则注销账号

Meiinpsn的穿衣风格,清新又叛逆

旅游要闻

一城山色一池荷,满湖荷花映华山!

教育要闻

来!测测你对中考作文的认知吧,敢吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版