网易首页 > 网易号 > 正文 申请入驻

GPT-5败下阵,这款中国AI拿下全球第一,众多医生已在用它做诊断

0
分享至

来源:市场资讯

(来源:量子位)

在多数基层门诊里,一个医生往往要从早忙到晚,患者一拨接一拨。

病种繁杂、节奏飞快,查文献、请会诊这些理想中的操作,根本挤不进大夫有限的工作时间。

与此同时,慢病患者增多、随访任务越来越重,也让诊室之外的工作变得越来越难应付。

就在这样的日常困境里,一条政策落地了。

本月,国家卫健委发布了《促进和规范“人工智能+医疗卫生”应用发展的实施意见(以下简称“实施意见”)》。其中,“人工智能+基层应用”被列为八大重点方向之首。

国家层面还点明:

而将其转化为临床实效,才是真正的考验。政策在推进,临床仍然拥堵;科研在进步,基层依旧高负荷。

基层医生真正需要的AI,一定不是炫技的AI,而是能在临床真正派上用场的助手。

可怎样的AI才能做到后者?

量子位走访多名专家,得到了一个统一的答案:能真正帮到中国基层医生的AI,必须同时做到两件事。

可目前的AI,能在诊中给出有依据、可溯源、不误判的建议了吗?能在诊后帮忙顶住随访的压力、把慢病管得住吗?

最近,不少专家和基层医生,都在使用一个AI系统来把这两件事真正跑通。

它的名字,叫未来医生AI工作室。

AI能背指南、能写病历,并不代表能真正走进临床。

能否用于真实诊疗,医生只看两件事:安全&有效。

北京大学第三医院运动医学科江东教授说得很直接:“医疗AI的第一性原理,不是聪明,而是安全。”

可“安全有效”不是一句口号,得让医生来检验。

就在今年,一项由32位国内顶尖临床专家组织的“多模型临床实战测评”中,未来医生AI工作室的核心模型MedGPT,以明显优势击败OpenAI-o3、DeepSeek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B等当时国际最前沿的知名大模型,夺得临床“安全”与“有效性”评测的全球第一。

这项测评已于7月正式公开发布,并接受学术同行评议。

△图源:arXiv:2507.23486

这场测评的意义非同一般。

过去几年,模型之间比的是“知识竞赛”,谁背得快、论文写得好,谁的名字在评测榜单上更亮。

但真正到了临床现场,医生最在意的不是模型偶尔答对,而是每次都不能出错。

这也是国家卫健委《实施意见》中明确写出的底线:

要坚持安全可控的原则,促进人工智能在医疗卫生领域的规范应用。

具体回到这场测试,本次比赛中,专家们首先围绕“安全性/有效性”,搭建了一套可量化的临床评估标准;然后从真实病历中抽丝剥茧,整理出2069道开放式问题,对所有模型进行了测试。

结果发现AI们总体不错,但“安全”上,却拉开了明显差距:

而在同一标准下的MedGPT ,表现则是另一种风格:

△图源:arXiv:2507.23486

为什么差别会这么大?

因为路线完全不同。

GPT-5这一类通用大模型,本质是“根据概率生成最可能的那句话”。

而MedGPT从底层架构开始,就围绕临床推理、安全可控、循证链可追溯来打造。它的目标不是“回答得像人”,而是每一句话都安全、可验证、能复盘。

这才是临床要的东西。

走访的专家和医生告诉我们,在真实临床现场,最让人压力陡增的地方往往出现在两个环节:

任何一环的疏漏,都是医疗质量的风险点。

围绕这两个最容易掉链子的关键时刻,未来医生AI工作室的破题思路很直接。

那就是用两个场景化的AI助手,一前一后,精准卡位。

诊中:怕误判?临床决策AI助手当你的「智能参谋」

诊室如战场,关键的几分钟往往决定全局。

信息有限,病情复杂,时间分秒流逝,医生必须在巨大压力下快速厘清:风险在哪?用药是否安全?有没有被遗漏的关键?还缺什么检查?

这时,基层医生最需要的不是一个冷冰冰的知识库,而是一个真正懂临床、能并肩作战的“智能参谋”——未来医生AI工作室·临床决策AI助手。

△邓春华在日常工作中使用未来医生·临床决策AI助手(已获教授本人授权)

它的工作方式极其贴合临床实际:

更重要的是,它不是靠宣传赢得认同,而是靠实战医生的检验赢得口碑。

多位专家与基层门诊的医生向我们反馈,未来医生·临床决策AI助手特别适合在高强度高负荷的节奏中,帮助医生更快看到风险点,理清复杂病例。

中⼭⼤学附属第⼀医院泌尿男科主任邓春华教授就是其中一名使用者。而之所以信赖使用,也与他和多位专家进行的一场“同题测评”有关。

他们曾从真实病例中抽取出一批分歧较大的典型疑难病例,分别交由GPT-5、OpenEvidence,以及未来医生·临床决策AI助手进行分析和决策,再从8个临床最关键的维度进行盲评。

结果显示,未来医生AI工作室·临床决策AI助手,在所有临床决策维度上均优于GPT-5和OpenEvidence。

△图源:https://ai.doctorwork.com/comparison

“它会帮我看到盲区,启发思考。”邓春华教授说,“这类思维链式的AI,能让基层医生也像专家那样看病例——有理、有据、有边界。”

这句话,也成了许多医生对这款工具最常见的反馈。

因为临床上最让人疲惫的不是“不会”,而是面对复杂病情时,怕遗漏、怕踩雷、怕不够稳。

如果有一个经过专家验证的工具,能帮你先把思路理顺,把风险点亮出来,那种心里的底气是实实在在的。

未来医生·临床决策AI助手真正做到的,就是让医生少一点焦虑,多一份把握。

诊后:怕失管?患者随访AI助手当你的「懂事助理」

诊中不易,但很多医生都清楚,真正容易出事的,往往发生在诊后。

尤其是慢病管理。

一个基层社区医生动辄要负责几百名患者,谁今天有点不舒服、谁症状悄悄变化了,很难有人能第一时间捕捉到。

医生嘴上不说,心里其实一直揪着。

未来医生·患者随访AI助手,就是专为这个阶段设计的。它代替医生“盯着”每一个诊后阶段的患者。

它像一位懂事的助理:

不少社区医生体验后,都惊喜地说了同一句话:“原来随访也能这么省心。”

这种感受,在大医院同样出现。

解放军总医院第六医学中心(海军总医院)内分泌科主任医师、全科教研室主任郭启煜在连续使用一段时间后,给出了非常朴素却分量极重的评价:

这句话说出来很轻,但每一位经历过慢病管理的医生都懂,平常真正让人担心的,从来不止在病房里的那几天,更是患者回家后的那几个月、几年。

能让这些人重新被“看见”,就是随访价值的核心。

△郭启煜教授在使用未来医生AI工作室 · 患者随访AI助手进行随访(已获教授本人授权)

诊中帮你“想得更全”,诊后帮你“看得更远”。

就这样一前一后,未来医生AI工作室的两款助手,接住了医生每天最吃力的两个环节。

好AI的标准很简单,那就是医生愿意用、放心用。

这种“少即是多”的设计理念,恰恰是未来医生AI工作室抓住了医疗AI落地的关键,没有追求花哨的功能,而是深耕临床最痛的两个环节。

不是替代医生,而是放大医生的价值。当AI真正融入工作流,成为医生敢依赖、离不开的伙伴,这场人机协同的变革才真正开始。

很多医生跟我们说过一句很真实的话:“不是不想用AI,是一直找不到能放心托付的那一个。”

未来医生AI工作室能在一线快速用起来,其实靠的不是“功能多”,而是解决了最朴素、也是最关键的几个临床疑问:

这三点,是医生判断一款AI能不能用的底线。

一句话总结就是:安全不安全?有效不有效?能不能掌控?

首先,未来医生AI工作室,先把“安全有效”拉满了。

从底层技术出发,未来医生AI工作室的大模型MedGPT就在安全性、有效性上大幅领先,并且还在临床推理实战中依然全面超越,被多位专家点赞。

它的建议,是安全有效、可信的,这就让医生有了第一重安全感。

其次,在产品层面,未来医生AI工作室又把“安全有效”拆成了医生能直接看懂的三层:可回溯、可解释、可预警。

这三点,精准击中医生最在意的东西,即不允许AI自作主张,不允许黑箱,不允许模棱两可。

它说的每句话都有出处、有边界,给了医生群体第二重安全感。

第三点也是最关键的一点,它一直坚持“人机协同”,而非取代医生。

不管是诊中还是诊后的协同过程,未来医生AI工作室的底层哲学都很明确:医生是所有诊疗行为的核心。

在整个诊疗链路中,AI的角色都是底层的思路提示、证据索引和风险提示支撑,只有医生牢牢掌握最终判断权。

这就带来了第三重安全感:不是“AI带着医生走”,而是“医生多了一双可靠的眼睛”。

三重安全感叠在一起,就构成了很多医生给我们的真实反馈——它不是替我做决定,而是让我做决定更稳。

这句话,也解释了为什么未来医生AI工作室能在一线快速落地,因为它不是在炫技,是给医生每天真正需要的那份放心感与掌控感。

目前,未来医生AI工作室已被数十位全国学科主委纳入日常使用。他们的使用反过来也在推动产品更贴近临床。

这次走访中,我们向所有专家都抛出了同一个问题:您心里AI赋能基层医疗的最佳实践是什么?

几乎所有人的回答都指向了同一个名字——未来医生AI工作室。

它的路径很简单。从临床中来,往临床里走。不浮夸,不炫技,也从不试图替代谁。

它关乎着每一位医生——无论身处顶尖医院还是基层卫生站——当面对复杂、模糊、容易踩雷的病情时,能让医生多一分从容、少一分不安。

未来医生AI工作室的价值,始终由临床现场的真实使用来定义,我们期待这样的AI助手能走进更多诊室,让AI真正融入基层医生的日常节奏,成为医疗现场里那份悄悄托底的力量。

如需体验,微信搜索“未来医生AI工作室”,即可进入超级医生个体时代。

参考文献:

[1]Shirui Wang, Zhihui Tang.A Novel Evaluation Benchmark for Medical LLMs: Illuminating Safety and Effectiveness in Clinical Domains.

https://doi.org/10.48550/arXiv.2507.23486

[2]未来医生AI工作室与美国OpenEvidence、GPT5临床决策辅助场景评测对比.

https://ai.doctorwork.com/comparison

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全网求救:女大学生疑因举报社区书记被关精神病8年!

全网求救:女大学生疑因举报社区书记被关精神病8年!

兵叔评说
2025-11-17 12:03:30
生育津贴有办法让你退回去,生出来的孩子没办法塞回去

生育津贴有办法让你退回去,生出来的孩子没办法塞回去

历史总在押韵
2025-11-18 00:02:41
11.11元秒杀到小米冰箱却无法发货?官方回应:系统配置错误,补偿30元

11.11元秒杀到小米冰箱却无法发货?官方回应:系统配置错误,补偿30元

扬子晚报
2025-11-18 07:17:13
特斯拉响应,通用响应,福特响应,美系车巨头集体去中国化

特斯拉响应,通用响应,福特响应,美系车巨头集体去中国化

克莱恩财经
2025-11-17 13:55:33
留给韩国的时间不多了!十大出口支柱产业竞争力或五年内被中国全面反超

留给韩国的时间不多了!十大出口支柱产业竞争力或五年内被中国全面反超

新浪财经
2025-11-17 17:14:39
血迹太空可见,苏丹这场大屠杀何以发生?

血迹太空可见,苏丹这场大屠杀何以发生?

新京报
2025-11-17 13:13:52
又走了一家外企

又走了一家外企

曹多鱼的财经世界
2025-11-17 15:03:31
广东豪宅“壕无人性”!3.5亿造价堪比皇宫,院里一棵树顶一套房

广东豪宅“壕无人性”!3.5亿造价堪比皇宫,院里一棵树顶一套房

GA环球建筑
2025-11-17 11:11:32
重磅!朝鲜将在台海爆发战争时保卫中国,以防美国及其盟友参战

重磅!朝鲜将在台海爆发战争时保卫中国,以防美国及其盟友参战

环球热点快评
2025-11-17 16:31:34
11月17日俄乌最新:历史性的协议

11月17日俄乌最新:历史性的协议

西楼饮月
2025-11-17 15:06:37
防止规模性返乡滞乡,可以赋黄码红码治理

防止规模性返乡滞乡,可以赋黄码红码治理

上峰视点
2025-11-17 18:35:31
奇迹!广东女子的手机落在新疆乱石堆,3年后竟被人跨越5000公里送还,双方当事人发声

奇迹!广东女子的手机落在新疆乱石堆,3年后竟被人跨越5000公里送还,双方当事人发声

极目新闻
2025-11-17 22:42:00
越来越疯了!高市早苗再有新动作,日本准备拥核,中俄要早做准备

越来越疯了!高市早苗再有新动作,日本准备拥核,中俄要早做准备

头条爆料007
2025-11-16 21:21:37
随着德国6-0,荷兰4-0,克罗地亚3-2,世预赛积分榜:欧洲7队直通

随着德国6-0,荷兰4-0,克罗地亚3-2,世预赛积分榜:欧洲7队直通

侃球熊弟
2025-11-18 04:43:02
十年陪练无人知!何卓佳被罚分情绪失控,万万没想到郭焱会这样说

十年陪练无人知!何卓佳被罚分情绪失控,万万没想到郭焱会这样说

揽星河的笔记
2025-11-17 15:08:10
本轮冷空气过程19日结束 江苏部分地区将加速入冬

本轮冷空气过程19日结束 江苏部分地区将加速入冬

金台资讯
2025-11-18 07:35:37
震撼!杨兰兰澳洲案庭审惊天逆转,律师发言掀起轩然大波

震撼!杨兰兰澳洲案庭审惊天逆转,律师发言掀起轩然大波

热点菌本君
2025-11-17 15:53:13
日本冲绳、长崎两县知事反对高市早苗修订“无核三原则”

日本冲绳、长崎两县知事反对高市早苗修订“无核三原则”

新华社
2025-11-17 22:57:02
解放军开始算总账,舰队已起航,不到24小时,高市早苗求见金正恩

解放军开始算总账,舰队已起航,不到24小时,高市早苗求见金正恩

现代小青青慕慕
2025-11-17 13:06:04
妻贤夫祸少!赵春晖是区政协委员,她才是狗咬人反杀案的始作俑者

妻贤夫祸少!赵春晖是区政协委员,她才是狗咬人反杀案的始作俑者

恪守原则和底线
2025-11-17 07:13:03
2025-11-18 08:55:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1409555文章数 4539关注度
往期回顾 全部

科技要闻

京东外卖要“独立” 刘强东还宣战“点评”

头条要闻

中国多地旅行团游客退订 日本旅游股遭抛售大跌超10%

头条要闻

中国多地旅行团游客退订 日本旅游股遭抛售大跌超10%

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

英伟达遭“硅谷风投教父”清仓

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

手机
教育
亲子
时尚
军事航空

手机要闻

轻薄续航神机!荣耀500确认全系8000mAh超大电池

教育要闻

教育观察:医学专业,就业形势严峻、复杂!

亲子要闻

这样对西蒙是不是有点儿残忍了啊?哈哈哈哈我居然忍不住笑了

听说冷帽是“美女检验神器”?

军事要闻

韩国提议举行朝韩军事会谈

无障碍浏览 进入关怀版