网易首页 > 网易号 > 正文 申请入驻

百川智能发布最强循证增强大模型M2 Plus,打造“医生版ChatGPT”

0
分享至


超越美国最火医疗应用OpenEvidence。

据IPO早知道消息,百川智能于10月22日发布循证增强医疗大模型Baichuan-M2 Plus,同步升级配套应用百小应并开放API。这是百川自8月开源Baichuan-M2以来的又一次重要动作。

评测显示,M2 Plus的医疗幻觉率较通用大模型显著降低,相比DeepSeek低约3倍,优于美国最火医疗产品OpenEvidence,可信度比肩资深临床医生水准。

不可否认的是,通用大模型固有的幻觉问题导致其在严肃医疗场景中难以真实应用。国内众多医院虽积极尝试部署和优化DeepSeek,但实际效果不尽人意。反观大洋彼岸的现象级医疗大模型产品OpenEvidence,该产品因符合医学认知的循证增强,已有40%美国医生在临床场景中注册使用,每月咨询量达1650万次。两天前,该公司C轮融资2亿美金,估值达60亿美元。

百川M2 Plus首创六源循证推理(EAR)范式,打造“医生版ChatGPT”,让大模型技术在辅助临床诊疗场景迈过“敢用、可用”关键门槛,不仅适合中国医疗环境,在美、日、英的医疗评测中均超过OpenEvidence,代表中国在世界大模型擂台上再下一城。

美国执业医师资格考试(USMLE)是评估临床知识和推理能力的黄金标准,即便是经验丰富的临床专家,要突破90分也极具挑战。在此项考试中,M2-Plus取得了惊人的97分,不仅远超人类考生平均水平,更与GPT-5的成绩持平,稳居全球第一梯队,展示了其世界级的临床问题解决能力。


中国执业医师资格考试(NMLE)及格线为360分,对于广大医学生而言,能考到450分以上已是高分,超过500分则被视为“学神”级别。M2 Plus取得了568分的“碾压级”成绩,在所有公开测试的主流大模型中位列第一

如果说执医考是“从业门槛”,那么中国硕士研究生招生考试临床医学综合能力(西医)考试则是顶尖医学生竞争的“华山论剑”。该考试不仅知识面广,且题目设计极为复杂,对临床思维要求高。通常,能考到280分以上的考生,都是协和、北医等顶尖学府的头部学霸。M2 Plus在此项考试中取得了282分。同时,在日本、英国、澳大利亚等国高级医师职称晋升考试中,准确率85%以上,远超各国及格线。

这些压倒性的成绩充分说明,M2 Plus 在复杂医学知识运用上的能力,已经超越了人类医生水准。

接入M2 Plus的百小应已在各大手机应用商店更新,成为"医生版ChatGPT"。为方便电脑端使用,网页版(ying.ai)也同步上线。

除了需要高效地辅助临床决策,医生还开始面对新的挑战:患者用DeepSeek自诊和带着DeepSeek就医的现象越来越多。虽然知道大模型可能有幻觉和偏颇,但没有时间和精力去甄别哪句对哪句错。通过百小应,医生有了面对通用模型挑战的“专属武器”。

对于希望深入理解诊断、治疗、预后、病因、检查等背后科学逻辑的患者及家属,面对复杂的就医环境和不同医生给出的诊疗方案,百小应让他们有机会获得最新最权威的知识、顶尖专家的思维和视角,得到无限耐心的专业解答。

Baichuan-M2 Plus也提供了标准化API接口,医院信息化部门、互联网医疗、大健康服务等各类泛医学机构,以及从事医疗AI行业的开发者,则可以通过API将循证推理接入服务场景,提升AI服务的医学专业性。

通过开源Baichuan-M2、发布Baichuan-M2 plus、百小应,开放API,百川致力于持续提升AI医疗在真实临床场景的可用性,推动大模型在严肃医疗场景进入落地可用新阶段。

本文为IPO早知道原创

作者|Stone Jin

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南通报:唐邦国、梁巨伟被查

湖南通报:唐邦国、梁巨伟被查

鲁中晨报
2025-11-10 14:55:04
北京这一夜,妖艳四射的朱珠和巩俐,却败给了全裹出镜的郭晶晶

北京这一夜,妖艳四射的朱珠和巩俐,却败给了全裹出镜的郭晶晶

崽下愚乐圈
2025-11-10 11:22:22
俄罗斯提出一个新概念——俄罗斯历史领土

俄罗斯提出一个新概念——俄罗斯历史领土

每日一见
2025-11-10 14:09:17
美国前总统拜登通告全球:特朗普让国家蒙羞,罕见措辞引全球关注

美国前总统拜登通告全球:特朗普让国家蒙羞,罕见措辞引全球关注

现代小青青慕慕
2025-11-10 09:01:05
东风日产X华为,将燃油车智能化进行到底

东风日产X华为,将燃油车智能化进行到底

汽车商业评论
2025-11-10 10:54:02
泽连斯基接受采访期间马林斯基宫两度停电,俄官员回应

泽连斯基接受采访期间马林斯基宫两度停电,俄官员回应

环球网资讯
2025-11-10 09:36:57
为中小学教师减负!教育部发布8条措施:不得要求教师上街执勤;无学生在校期间,原则上不安排专任教师值班值守

为中小学教师减负!教育部发布8条措施:不得要求教师上街执勤;无学生在校期间,原则上不安排专任教师值班值守

每日经济新闻
2025-11-10 14:08:19
斯诺克无缝对接!冠中冠开杆,赵心童领衔,中国创纪录4人参赛!

斯诺克无缝对接!冠中冠开杆,赵心童领衔,中国创纪录4人参赛!

刘姚尧的文字城堡
2025-11-10 09:09:58
太惨了!烟台渣土车压扁宝马车,死亡司机身份曝光,是年轻女教师

太惨了!烟台渣土车压扁宝马车,死亡司机身份曝光,是年轻女教师

火山诗话
2025-11-09 16:09:29
人民日报刊文,要学会用辩证法看待当前经济形势…

人民日报刊文,要学会用辩证法看待当前经济形势…

慧翔百科
2025-11-10 08:40:46
俄加密货币富翁殒命迪拜:夫妇二人遭绑架勒索,被肢解后埋尸沙漠,8名俄公民涉案

俄加密货币富翁殒命迪拜:夫妇二人遭绑架勒索,被肢解后埋尸沙漠,8名俄公民涉案

红星新闻
2025-11-10 16:09:43
幼儿园园长贪污千万案二审再开庭:一审被判11年,是否“租赁园”引争论

幼儿园园长贪污千万案二审再开庭:一审被判11年,是否“租赁园”引争论

澎湃新闻
2025-11-10 14:46:32
霍启刚也没想到,79岁的老父亲霍震霆,如今还能再为霍家“争光”

霍启刚也没想到,79岁的老父亲霍震霆,如今还能再为霍家“争光”

揽星河的笔记
2025-11-07 16:26:36
美媒:在詹姆斯缺阵的情况下,NBA揭幕战收视率创下15年来新高

美媒:在詹姆斯缺阵的情况下,NBA揭幕战收视率创下15年来新高

懂球帝
2025-11-10 12:58:03
买了66台苹果手机总价50多万!男子放在平台出租,如今租金拿不到,手机也要不回来

买了66台苹果手机总价50多万!男子放在平台出租,如今租金拿不到,手机也要不回来

潇湘晨报
2025-11-09 22:27:27
女儿养了三个月,出院记录显示是“男婴”!海口一女子怀疑孩子抱错,医院回应

女儿养了三个月,出院记录显示是“男婴”!海口一女子怀疑孩子抱错,医院回应

极目新闻
2025-11-10 13:31:39
“翻墙”?假猎奇,真危险

“翻墙”?假猎奇,真危险

大象新闻
2025-11-10 08:38:03
七星山荒野求生赛进入第三十三天,安徽选手靠“续命三件套”火出圈

七星山荒野求生赛进入第三十三天,安徽选手靠“续命三件套”火出圈

极目新闻
2025-11-10 13:12:15
拿人家顶薪却还要打人家:全运会尴尬对决 周琦高诗岩谁会下狠手

拿人家顶薪却还要打人家:全运会尴尬对决 周琦高诗岩谁会下狠手

萌兰聊个球
2025-11-10 07:49:58
俄罗斯大幅加税,中国 汽车出口骤降58%!

俄罗斯大幅加税,中国 汽车出口骤降58%!

每日经济新闻
2025-11-10 08:06:17
2025-11-10 16:59:00
IPO早知道 incentive-icons
IPO早知道
IPO情报专家。
6257文章数 2404关注度
往期回顾 全部

科技要闻

荷兰“玩脱”后,大众本田终于拿到芯片了

头条要闻

幼儿园园长被指贪污1079万:承包幼儿园 没有非法占有

头条要闻

幼儿园园长被指贪污1079万:承包幼儿园 没有非法占有

体育要闻

战绩崩盘!东契奇交易余震撕裂独行侠

娱乐要闻

郝蕾风波升级?

财经要闻

俄罗斯大幅加税 中国汽车出口骤降58%

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

艺术
手机
游戏
房产
公开课

艺术要闻

“隶书之冠”刘炳森:楷书艺术之美惊艳四座

手机要闻

三星 Galaxy S22~S24 系列曝零点击漏洞,一张图片即可被远程监控

《刺客信条:幻景》DLC成就列表泄露 共计11项

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版