编辑丨王多鱼
排版丨水成文
如今,越来越多的人开始向大语言模型(LLM)寻求医疗建议,然而,这些模型在医疗领域的准确性仍然偏低,给出的答案市场模棱两可,甚至因受到未经证实的信息影响而给出错误答案。
2026 年 4 月 20 日,加州大学圣地亚哥分校及谷歌研究院的研究人员合作,在 Nature 子刊Nature Health上发表了题为:A multi-agent framework combining large language models with medical flowcharts for self-triage 的研究论文。
该研究开发了一个结合大语言模型与医疗流程图的多智能体系统——TriageMD,用于患者的自我分诊。它就像一个不再自由发挥,而是严格遵循权威医学流程图来看病的 AI 医生。该研究证明了透明、准确且通用的 AI 辅助自我分诊的可行性,有可能在临床环境之外支持患者的知情决策,同时提高医疗资源的利用效率。
![]()
如今,在线健康资源和 AI 聊天机器人已成为许多人寻求医疗建议的第一站。数据显示,超过 95% 的美国成年人在网上搜索过健康信息,近三分之一的人使用过 ChatGPT 等工具来咨询医疗问题。然而,这些工具存在明显缺陷:诊断准确率低、建议模糊、容易“幻觉”(生成错误信息),且决策过程不透明,就像一个“黑箱”。
这导致了严重的医疗资源错配:近 40% 的美国急诊就诊者实际上并不紧急。人们要么因不确定而延误治疗,要么因误判而涌入急诊室,加剧了医疗系统的负担。因此,一个可靠、透明且易于使用的自我分诊工具,对患者和整个医疗体系都至关重要。
TriageMD 如何工作?三步走,像护士一样问诊
TriageMD的核心思想很简单:将 AI 灵活的自然语言对话能力,与标准化临床流程图的严谨性相结合。它模拟了分诊护士一步步询问病情的过程。
整个系统就像一个三人协作的医疗团队——
1、检索智能体:相当于“分诊台”。根据你的人口信息(例如年龄、性别)和主诉(对症状的描述),从 100 个美国医学学会流程图中,快速找到最相关的那一个。
2、决策智能体:相当于“分析医生”。解读你对每个问题的回答(是/否/不确定),并根据流程图逻辑,决定下一个该问什么问题。
3、对话智能体:相当于“沟通护士”。将决策结果转化为简洁、共情的语言,用通俗易懂的方式向你提问或给出建议。
最终,系统会给出一个清晰的行动建议,例如“建议在 24 小时内看急诊”或“可在家观察,如果出现 XX 症状再就医”。整个过程都有据可循,你可以看到 AI 是基于哪条权威路径在为你分析。
![]()
多智能体自我分诊系统概述
表现如何?用数万次模拟对话严格测试
为了全面评估该系统的可靠性,研究团队没有使用难以获取的真实患者对话记录,而是利用多个大语言模型生成了大规模、多样化的合成数据集进行测试。
找得准吗? 在 2000 条模拟患者开场白测试中,系统准确找到最相关流程图的成功率是84.1%。如果放宽到相似度排名前 3 的流程图,命中率高达95.2%。这意味着系统能很好地理解你的核心问题。
聊得通吗? 在导航测试中,系统面对 37200 条风格各异的模拟患者回复(包括简洁的、描述的、模糊的、不确定的甚至跑题的),整体导航准确率达到了99.1%。即使患者回答含糊其辞(例如“我猜不是吧”),系统也能敏锐地识别出其中的不确定性,并停下来要求澄清,而不是武断地继续。
更安全、更透明的 AI 医疗未来
这项研究为 AI 在消费级医疗应用领域指明了一条新路:通过引入“流程图”这一人类医生和 AI 都能理解的共同语言,打破了 AI 的“黑箱”。
对患者而言:你获得的不再是一个不知来源的模糊建议,而是一个基于权威临床路径的、可追溯的个性化指导。这能帮助你在焦虑和不确定中,做出更明智的就医决策。
对医疗系统而言:它能有效分流非紧急患者,减轻急诊压力,让资源更合理地配置。
对AI开发者而言:它提供了一种可控、可审计的AI部署框架。医生可以审查和编辑背后的流程图数据库,确保AI输出的安全性与专业性。
当然,TriageMD仍是一个“概念验证”系统。未来,它需要在实际临床环境中进行进一步验证,并考虑更复杂的症状和多病共存的情况。但毫无疑问,TriageMD 为我们展示了一个 AI 与人类专业知识深度融合的未来:AI 不再是一个令人不安的“预言家”,而是一个严格遵循操作规程、值得信赖的“智能助手”。
论文链接:
https://www.nature.com/articles/s44360-026-00112-2
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.