网易首页 > 网易科技 > IT业界 > 正文

微软发布AI诊断工具,自称准确率是医学专家4倍,还能“会诊辩论”

0
分享至
核心提示
  • 01 微软开发出一款医疗工具。在一项基于《新英格兰医学杂志》复杂病例的测试中,该工具通过协调多个大语言模型,取得了85.5%的诊断成功率,据称是对比试验中人类医生的四倍。
  • 02 该技术被认为能加速诊疗进程,有望解决医疗人员短缺和患者候诊时间过长的问题。研究还显示,它在提升诊断准确性的同时,能显著减少检查项目以节约成本。
  • 03 此成果是微软新组建的人工智能健康部门的首个研究,该部门由前DeepMind联合创始人领导。研究采用了“辩论链”新技术,并聚合了OpenAI等多个主流大语言模型。

7月1日消息,微软开发出一款人工智能驱动的医疗工具,称其在诊断复杂疾病方面的成功率是人类医生的四倍。微软认为,这项技术能够加速诊疗进程。

去年,前DeepMind联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)在微软组建人工智能健康部门,成员基本来自他曾共同创立、现归谷歌所有的DeepMind研究院。这款名为“微软人工智能诊断协调器”(MAI-DxO)的工具也是该部门的首个研究成果。

现任微软人工智能首席执行官的苏莱曼在接受采访时表示,此次试验是迈向“医疗超级智能”的一步,有望帮助解决医疗系统人员短缺和患者候诊时间过长等问题。

微软这套新系统的核心是一个“协调器”,它能创建5个扮演“医生”角色的智能体并组成虚拟专家组,其中每个智能体分工明确,有的提出假设、有的专门选择诊断测试,并通过相互协作和“辩论”来共同制定诊疗方案。

为了测试其性能,研究人员让MAI-DxO学习了《新英格兰医学杂志》(NEJM)上发表的304份研究病例,这些案例详细描述了医生是如何解决最复杂病例的。

这使得研究人员能够验证程序能否正确完成诊断并阐明其决策过程。测试采用了一种名为“辩论链”(chain of debate)的新技术,能让人工智能推理模型逐步说明解决问题的思路。

微软调用了来自OpenAI、Meta、Anthropic、谷歌、xAI和DeepSeek的主流大语言模型。协调器让所有大语言模型的表现都有提升,但与OpenAI的o3推理模型配合效果最佳,成功解决了85.5%的《新英格兰医学杂志》案例。

相比之下,经验丰富的人类医生在对比试验中的成功率约为20%。但在试验中,这些医生不允许查阅教科书或向同事请教,否则他们的成功率本可以更高。

这项技术可能很快会部署到微软的Copilot人工智能聊天机器人和必应搜索引擎中,目前这两个平台每天处理约5000万次健康咨询。

苏莱曼表示,微软正接近于实现“不仅仅是略优于人类,而是远超人类表现的AI模型:速度更快、成本更低、准确率高出四倍”。

“这将带来真正的变革,”他补充道。

苏莱曼取得这项研究成果之前,DeepMind在人工智能相关的医疗保健领域已取得一系列突破并处于领先地位。谷歌实验室负责人戴密斯·哈萨比斯(Demis Hassabis)去年因利用人工智能揭示支撑生命的蛋白质的生物奥秘,与他人共同获得诺贝尔化学奖。

微软已向OpenAI投资近140亿美元,并拥有其技术的独家使用权和销售权。然而,这家科技巨头正与试图转型为营利性实体的OpenAI陷入激烈博弈,双方在未来合作条款上存在分歧。

苏莱曼表示,尽管OpenAI的模型表现最佳,但微软对于“MAI-DxO”具体使用的四种“世界级模型”持“中立态度”。

“我们一直认为,它们终将成为商品……真正的差异化在于我们的聚合协调器。”他说。

去年末加入微软的前DeepMind健康部门负责人多米尼克·金(Dominic King)表示,程序的“表现超越了以往任何技术”,并且“如今有机会成为医疗服务的新入口”。

他表示,研究人员还引导人工智能模型考虑成本效益,在试验中显著减少了正确诊断所需的检查项目,在某些情况下可节省数十万美元。

但金也强调,这项技术仍处于早期阶段,尚未经过同行评审,也未准备好在临床环境中使用。

“这是一项具有里程碑意义的研究,”心脏病学家、斯克里普斯研究所转化医学中心(Scripps Research Translational Institute)创始人兼主任埃里克·托波尔(Eric Topol)说道。“尽管这项工作并非在真实的医疗实践环境中完成,但它首次为生成式人工智能在医学领域提升准确性和节约成本的潜力提供了证据。”

麻省理工学院科学家、医疗人工智能初创公司Layer Health联合创始人戴维·桑塔格(David Sontag)也表示,“这项研究振奋人心”。他认为,这项研究之所以重要,不仅因为它更贴近医生的实际操作方式,还因为它对底层方法论中的潜在问题进行了严谨的处理。“这正是这项研究的强大之处。”桑塔格说。

不过桑塔格也提醒,对微软的研究成果需持审慎态度,因为参与研究的医生不得借助任何工具来辅助诊断,这可能无法真实反映临床实践。他补充说,这种人工智能系统能否在实践中显著降低成本仍有待验证。参与研究的医生可能会考虑到人工智能无法涉及的因素,比如患者对某项操作的耐受性,或某些医疗器械的可获得性。

“这份报告令人印象深刻,因为它诊断的都是高度复杂病例,”斯克里普斯研究所(Scripps Research Institute)科学家埃里克·托波尔(Eric Topol)说。他补充道,证明人工智能理论上可降低医疗成本具有开创性意义。

托波尔和桑塔格都认为,在大规模推广前,验证微软系统潜力的下一步,应是在临床试验中将其与医生为真实患者治疗的结果进行对比。桑塔格强调,“这样才能获得对成本的非常严谨的评估。”(辰辰)

相关推荐
热点推荐
他本应被军委授予一级战斗英雄,却因作战太惨烈,军区先授了荣誉

他本应被军委授予一级战斗英雄,却因作战太惨烈,军区先授了荣誉

大运河时空
2025-12-17 07:40:03
昏招啊!57岁主帅生死2分钟,连换7次外援导致输球,球迷: 让贤吧

昏招啊!57岁主帅生死2分钟,连换7次外援导致输球,球迷: 让贤吧

金山话体育
2025-12-17 08:05:58
TVB花旦内地唱《海阔天空》!表情狰狞引热议!网友:太吓人了

TVB花旦内地唱《海阔天空》!表情狰狞引热议!网友:太吓人了

我爱追港剧
2025-12-17 00:03:48
《人间有味》开机!胡歌李沁首搭,黄磊导演,演绎90年代餐饮江湖

《人间有味》开机!胡歌李沁首搭,黄磊导演,演绎90年代餐饮江湖

露珠聊影视
2025-12-16 22:04:31
2025“广西制造”龙头:一年营收高达1113亿,累计纳税超百亿元

2025“广西制造”龙头:一年营收高达1113亿,累计纳税超百亿元

柳先说
2025-12-16 19:47:24
惊!网传香港沦落,原700万店铺租金骤降至20万,到底发生了什么

惊!网传香港沦落,原700万店铺租金骤降至20万,到底发生了什么

慧翔百科
2025-09-29 11:51:51
马兴全与他的深圳生意

马兴全与他的深圳生意

法经网
2025-12-15 17:52:35
沉浸过头,看《疯狂动物城》4D版被喷一脸臭水,这股下水道味到底是不是特效?

沉浸过头,看《疯狂动物城》4D版被喷一脸臭水,这股下水道味到底是不是特效?

万物杂志
2025-12-17 06:08:48
愤怒!邱毅爆出惊天猛料,高市早苗祖父竟是南京大屠杀刽子手

愤怒!邱毅爆出惊天猛料,高市早苗祖父竟是南京大屠杀刽子手

菊宝视界
2025-12-16 13:00:03
坚持喝苹果水 1 个月,身体悄悄变舒服?煮错等于白喝 这些坑别踩

坚持喝苹果水 1 个月,身体悄悄变舒服?煮错等于白喝 这些坑别踩

开心美食白科
2025-12-17 04:53:04
巴厘岛驱逐令:业界明星Bonnie Blue十年禁足,背后真相揭秘

巴厘岛驱逐令:业界明星Bonnie Blue十年禁足,背后真相揭秘

吃瓜党二号头目
2025-12-16 10:50:28
马斯克收心了?官宣了39岁印度裔伴侣:相貌普通为他生了4个孩子

马斯克收心了?官宣了39岁印度裔伴侣:相貌普通为他生了4个孩子

丰谭笔录
2025-12-12 11:16:23
张学良晚年吐真言:西安事变我只是名义上的,真正的主角是他!杨虎城后人上门,他为何闭口不谈?

张学良晚年吐真言:西安事变我只是名义上的,真正的主角是他!杨虎城后人上门,他为何闭口不谈?

历史回忆室
2025-12-16 14:26:14
经济下行,大家对任何东西都提不起兴趣了

经济下行,大家对任何东西都提不起兴趣了

诗词中国
2025-12-16 20:38:12
特朗普签了!进一步限制外国公民入境美国

特朗普签了!进一步限制外国公民入境美国

证券时报e公司
2025-12-17 08:13:24
上海市消保委四问南极磷虾油产品问题

上海市消保委四问南极磷虾油产品问题

上观新闻
2025-12-17 00:37:25
德国公布挺乌“十点计划”,对美发出信号

德国公布挺乌“十点计划”,对美发出信号

参考消息
2025-12-16 13:42:07
前球员:我不喜欢谢尔基的插花脚,瓜帅也说梅西也没这样踢过

前球员:我不喜欢谢尔基的插花脚,瓜帅也说梅西也没这样踢过

懂球帝
2025-12-16 18:39:38
英超BIG6防线人均身价排名:阿森纳5500万第1,曼联2100万垫底

英超BIG6防线人均身价排名:阿森纳5500万第1,曼联2100万垫底

懂球帝
2025-12-17 04:00:09
最高60元/时!广州停车场刺客,名单出炉!

最高60元/时!广州停车场刺客,名单出炉!

房二娃
2025-12-16 10:27:55
2025-12-17 08:28:49

科技要闻

Waymo据称洽谈新融资,估值至少近千亿美元

头条要闻

上海一鱼塘遭"垃圾围困"9年 10多斤的大鱼频频死亡

头条要闻

上海一鱼塘遭"垃圾围困"9年 10多斤的大鱼频频死亡

体育要闻

杨瀚森18+10首次两双 关键攻防统治G联赛

娱乐要闻

《双轨》遭网友举报,称剧情三观不正

财经要闻

浙金中心暴雷始末:祥源控股设计的骗局?

汽车要闻

打造全域安全2.0,吉利的新“长征”

态度原创

健康
旅游
教育
房产
公开课

这些新疗法,让化疗不再那么痛苦

旅游要闻

国际旅客量跃居全球第二,多项世界级评比名列前茅,2025年香港旅游业交出亮眼成绩单

教育要闻

2026年考研、考公、留学、就业该选哪个?

房产要闻

6.66亿摘地,海南封关大动作,千亩海澄新城震撼登场

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×