网易首页 > 网易号 > 正文 申请入驻

当大模型遇见医学推理:香港理工大学等发布AI医学推理综述

0
分享至



作者 | 论文团队

编辑 | ScienceAI

在临床工作中,医生每天都要面对复杂的推理过程:从病人主诉、化验数据、影像学检查,到诊断、治疗方案和随访决策。

但这些过程不仅繁琐,还充满不确定性。能否让人工智能来帮忙?

近年来,大型语言模型(LLMs)在医疗健康领域展现出前所未有的潜力。它们能读懂病历、生成诊断意见,甚至和患者对话。但要真正成为临床的「智慧助手」,LLMs 需要的不仅是语言能力,更是医学推理能力。

最近,一项由香港理工大学的研究者主导完成的综述 ——《Aligning Clinical Needs and AI Capabilities: A Survey on LLMs for Medical Reasoning》,首次系统梳理了医学推理的全景图:需求、方法、数据、挑战与未来方向。



论文链接:https://www.techrxiv.org/users/966100/articles/1334596-aligning-clinical-needs-and-ai-capabilities-a-survey-on-llms-for-medical-reasoning

Github链接(整理的现有的工作,更新中,欢迎补充):https://github.com/pqpq17/Awesome-LLM-Reasoning-on-Medicine

五级医学推理能力框架



该综述基于 Miller’s Pyramid(米勒金字塔),提出了五级医学推理能力分层体系:

  • Level 1:医学知识识别与标准化(Knows)
  • Level 2:信息分类与初步分诊(Knows How)
  • Level 3:因果推理与综合诊断(Shows How)
  • Level 4:临床决策支持与个性化推荐(Shows How / Does)
  • Level 5:动态交互与复杂场景管理(Does)

这个框架清晰描绘了 LLM 从「会认知识」到「能当助手」的进阶路径,对现有benchmark/dataset的做出了清晰的划分。

此外,基于这个五级分类体系以及Reasoning类型的讨论,该综述明确指出一个双视角(即computational & clinical)的对齐框架。

首个标准化五级基准数据集



该综述构建了一个包含 5,000 条标注样本的基准数据集,覆盖五个层次的能力要求,并首次系统评测了 18 个代表性模型。

结果显示:

  • 专科模型 → 在诊断类任务上更突出
  • 通用大模型 → 在决策支持、对话和总结上表现更佳

这为未来的模型选择和任务分工提供了实证依据。

前沿方法全景回顾



该综述全面回顾了医学 LLM 中的主流推理范式:

  • 链式推理(CoT):逐步解释,思路清晰
  • 长链推理(Long-CoT):更深入的逐步分析,包含自我修正
  • 检索增强推理(RAG):结合医学文献和知识库
  • 多模态推理:同时理解病历、影像和文本
  • 智能体推理(Agentic Reasoning):主动规划、调用外部工具、动态决策

同时,也直面四大挑战:

  • 高质量医学数据不足
  • 「幻觉」问题仍然存在
  • 缺乏证据溯源与临床可解释性
  • 模型结果不确定性难以控制

社会意义

这项工作不仅仅是综述,更是一种「对齐」的尝试:

  • 对齐临床需求:明确医生真正需要的推理能力
  • 对齐 AI 能力:梳理当前模型能做什么、还欠缺什么
  • 对齐未来方向:为科研、产业和医疗实践提供参考

研究团队希望这项工作能推动医学大模型真正落地临床,从「实验室里的聪明模型」变成「病房里的可靠助手」。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
晚间暴雷 证监会放利好

晚间暴雷 证监会放利好

趋势巡航
2025-11-01 08:19:10
英首相:就算中国施压,也不会批准这件事,但中方得答应一个要求

英首相:就算中国施压,也不会批准这件事,但中方得答应一个要求

策略述
2025-11-01 15:17:41
通背拳传人与老外互扇耳光!第一下被打出血,第三下被打晕翻白眼

通背拳传人与老外互扇耳光!第一下被打出血,第三下被打晕翻白眼

念洲
2025-11-01 12:37:45
杨国福麻辣烫回应“1斤豆芽卖28元”

杨国福麻辣烫回应“1斤豆芽卖28元”

大象新闻
2025-11-01 18:26:07
俄罗斯被排除,特朗普不再遮掩,一句话暗示将由中美两国领导全球

俄罗斯被排除,特朗普不再遮掩,一句话暗示将由中美两国领导全球

井普椿的独白
2025-10-31 21:25:25
雷军突然发文!5亿元!网友彻底沸了

雷军突然发文!5亿元!网友彻底沸了

极目新闻
2025-10-31 11:51:39
美国正式批准向乌克兰转移战斧导弹,俄向红军村增兵至17万人

美国正式批准向乌克兰转移战斧导弹,俄向红军村增兵至17万人

史政先锋
2025-11-01 15:04:59
王晶发文悼念冯淬帆:做人欺善怕恶,爱骂人和单身有关,称呼改变

王晶发文悼念冯淬帆:做人欺善怕恶,爱骂人和单身有关,称呼改变

一娱三分地
2025-11-01 17:26:04
反腐月报:6名中管干部被查

反腐月报:6名中管干部被查

上观新闻
2025-11-01 15:41:09
段永平向江西水利电力大学捐赠贵州茅台股票!市值达1500万元

段永平向江西水利电力大学捐赠贵州茅台股票!市值达1500万元

红星资本局
2025-11-01 17:58:43
工信部突然鼓励燃油车?给燃油车补贴,释放什么信号?

工信部突然鼓励燃油车?给燃油车补贴,释放什么信号?

大道微言
2025-11-01 08:58:16
里子面子都丢了,辞去乒协主席仅6个月的刘国梁,被陈梦撕光体面

里子面子都丢了,辞去乒协主席仅6个月的刘国梁,被陈梦撕光体面

仙味少女心
2025-11-01 16:04:03
突发:莫斯科遇袭大面积停电!乌克兰海王星导弹击中电厂

突发:莫斯科遇袭大面积停电!乌克兰海王星导弹击中电厂

项鹏飞
2025-11-01 14:55:42
6万球迷见证!苏超联赛冠军诞生:泰州点球4-3击败南通,一黑到底

6万球迷见证!苏超联赛冠军诞生:泰州点球4-3击败南通,一黑到底

侃球熊弟
2025-11-01 20:26:47
网传某律所合伙人带小三产检被抓,正妻质问:叫你妹妹还是姐姐?怀上没?

网传某律所合伙人带小三产检被抓,正妻质问:叫你妹妹还是姐姐?怀上没?

互联网大观
2025-11-01 09:51:44
“上午立冬,冻死牛;下午立冬,暖烘烘”,2025年立冬是几点?

“上午立冬,冻死牛;下午立冬,暖烘烘”,2025年立冬是几点?

阿龙美食记
2025-10-30 09:52:04
诺奖级突破? 破解140年难题,抗癌药成本或断崖下降

诺奖级突破? 破解140年难题,抗癌药成本或断崖下降

生命科学前沿
2025-11-01 23:08:54
弃车保帅!太子集团陈志末日已到,是被“自己人”灭口的

弃车保帅!太子集团陈志末日已到,是被“自己人”灭口的

吃瓜局
2025-10-31 21:11:55
上海63岁儿子与94岁父亲一起居家养老:父亲负责买菜做饭,“除了吃饭各做各的”

上海63岁儿子与94岁父亲一起居家养老:父亲负责买菜做饭,“除了吃饭各做各的”

黄河新闻网吕梁频道
2025-11-01 09:19:32
悲情!南通队一赛季就输了一场球:全员呆立+泪洒现场 曾4-0泰州

悲情!南通队一赛季就输了一场球:全员呆立+泪洒现场 曾4-0泰州

风过乡
2025-11-01 22:19:22
2025-11-02 00:00:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1135文章数 218关注度
往期回顾 全部

科技要闻

事关安世半导体,商务部最新发声!

头条要闻

郑丽文:台湾正处于最困难、最危险的时刻

头条要闻

郑丽文:台湾正处于最困难、最危险的时刻

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

前CTO索赔42.87亿 158亿股权归属成谜?

汽车要闻

M3旅行版上市售94.39万元 告别平行进口

态度原创

房产
健康
亲子
数码
教育

房产要闻

实力破圈!这个豪宅交付,正在定义海口品质样本!

核磁VS肌骨超声,谁更胜一筹?

亲子要闻

后续!新生儿在医院坠床摔成重伤,护工已被停职,孩子状况已好转

数码要闻

OPPO手机上线苹果手表互联互通功能:支持同步来电、通知

教育要闻

最近的校园霸凌事件警醒家长:女儿过了11岁,一定要拴在裤腰带上

无障碍浏览 进入关怀版