网易首页 > 网易号 > 正文 申请入驻

王小川批医疗AI“假东西太多”!新模型幻觉率仅2.6%,两周免费

0
分享至


智东西
作者 陈骏达
编辑 李水青

智东西1月22日报道,今天,百川智能发布了Baichuan-M3-Plus询证增强医疗大模型,这一模型采用了M2-Plus同款的“六源询证”方法,再次刷新行业SOTA,幻觉率仅为2.6%。

此外,Baichuan-M3-Plus还首创了“证据锚定”技术,让AI回答中的每个结论和证据都能精准匹配到原文献的具体位置,据称匹配率高达95%,远超行业40%-50%的平均水准。

这一模型采用API模式对外提供服务,价格较前代模型下降70%,并在发布后两周内免费,为医务工作者提供服务的机构可通过“海纳百川计划”长期免费使用。

Baichuan-M3-Plus发布之际,智东西等媒体来到百川总部与百川智能创始人兼CEO王小川和百川智能模型技术负责人鞠强面对面沟通,他们分享了M3 Plus背后的技术细节,以及对行业热点议题的看法。


在交流中,王小川多次强调,医疗AI的核心目标应始终指向患者利益本身。他主动回应了近期张文宏关于“拒绝在病历系统中引入AI、担心影响年轻医生成长”的观点,直言如果因为担忧AI影响医生训练而限制其应用,本质上就是将当下的患者作为医生成长的成本。

在他看来,“AI+医生”已在多个场景中展现出优于单纯依靠医生的潜力,而医生同样存在判断偏差与“幻觉”,从客观数据看,当前医疗AI的幻觉率并不高于人类医生。

与此同时,王小川还谈到,中国医生对AI工具接纳度偏低,并非模型能力不足,而是医疗系统高强度运转与行业风气的影响。

一方面,国内医生单日接诊量远高于海外,几乎没有时间真正使用和验证AI工具;另一方面,医疗AI领域缺乏求真的状态,“假的东西太多了”,真正有技术突破的产品反而难以快速建立信任。

他呼吁,国内行业应该良性竞争,把医疗行业做得更真实,这样发展速度才会加快,否则就会有很多“皇帝的新衣”。

当智东西问及百川目前API客户群体的画像时,王小川回应道,M3发布前百川已经拥有一批机构用户,包括医院和为医院提供科研辅助能力的中小企业。M3模型发布后,伴随着近期价格调整和合作伙伴关系的推进,客户结构预计会发生较大变化。

体验链接:https://www.baichuan-ai.com

一、从六源询证到证据锚定,如何把医疗AI“拉回白盒”

上周,百川智能正式开源了当前业界医学能力最出色的开源模型Baichuan-M3。该模型在权威医疗AI基准测试HealthBench中位列全球第一,表现超越了OpenAI最强模型。

Baichuan-M3-Plus以M3底座为基础,结合百川首创的“六元循证系统”,在M3原有抗幻觉能力之上进一步降低了幻觉发生率。


百川对“降低幻觉率”的执着,源于当前医疗AI领域中一些较为突出的问题。现场演示中,鞠强揭示了部分医疗AI产品存在的幻觉现象:AI生成的答案表面看来专业性强,引用了论文、指南、药品说明书等来源,但实际内容错误率可能高达90%。这种“看似专业”的幻觉,对于经验尚浅的医生或普通用户而言,潜藏的风险更为显著。

此类幻觉往往源于一个常见问题:AI引用的内容与其所要支持的表述之间缺乏实质关联。

对医生和用户来说,核验这些引用的正确性过程繁琐,需要耗费大量时间逐条核对,反而可能增加工作负担。

为此,百川创新性地引入“证据锚定技术”,确保模型引用的段落与表述严格对应,并可精确定位至原文位置,使证据具备可核验、可追溯的特性,最终实现诊疗辅助过程的“白盒化”。


本次Baichuan-M3-Plus将采用低成本API的模式对外提供服务。通过模型架构、Infra等层面的工程优化,Baichuan-M3-Plus的API价格较前代模型下降70%。

发布后两周内,Baichuan-M3-Plus将完全免费。此外,百川智能创始人兼CEO王小川还宣布了“海纳百川计划”,将面向所有为医务工作者提供服务的机构免费提供询证增强的M3-Plus API服务,以促进行业的协作和发展。王小川称,这项免费服务的成本最高可能达到1亿元左右。

新模型API价格的大幅下调背后有多重驱动因素。鞠强介绍,上一代M2模型仍是稠密模型,而M3架构已经切换为MoE,这一变化本身就能带来不少成本收益。

此外,百川还对业内广受采用的投机采样技术Eagle3进行了升级,加入了门控机制,进一步提升推理效率。

二、王小川回应“AI影响医生成长”言论:患者不该为医生成长买单

日前,张文宏拒绝把AI引入医院病历系统,认为其会影响年轻医生成长的言论,引发广泛讨论。

王小川在采访中主动提到了这一讨论,并做出全面的回应。

他认为,患者利益应置于首位,当前“AI+医生”模式已显示出优于单纯依靠医生的潜力,符合医学发展规律。若因担忧AI可能影响医生成长而限制其应用,实则可能阻碍对患者有益的技术进步——“医生的成长不能以当下的患者作为成本”。医生也有幻觉,而目前AI的幻觉率其实比医生更低。

在应用方法上,王小川认为尚有探索空间。若担心医生能力因AI而退化,可调整使用方式,例如让AI辅助年轻医生,在诊疗过程中提供实时提醒与校验。

王小川还谈到了许多医院做大模型的现象,他认为:“医生不是造模型的,医生是用模型的,AlphaGo也不是围棋选手造的,而是谷歌造的。”双方应做好专业分工。

其实,百川与医生群体有较为密切的合作。鞠强提到,百川与其它通用大模型公司的一个核心区别是,他们拥有一支专业的专职医生团队。

这个团队的成员拥有丰富的一线医疗经验。有曾在国内三甲医院任职的医生以全职身份加入百川,此外百川还与合作的医院建立了深度协作,有医生长期驻场,提供医学指导。

第二部分的支持来自一个更为广泛的专家网络。百川内部的专职医生团队组建并管理着一个覆盖所有主要临床学科的兼职医学专家团,规模达数百人。他们为百川的模型研发提供高质量的专业知识输入和数据支持。

三、察言观色的医疗AGI三年内实现,国内采用率低不是模型原因

王小川还给出了他对AGI(通用人工智能)级别AI医生何时到来的预判。他认为,在具身智能领域,能完成做手术这类操作的AI可能还较远,但进行表达、察言观色的AGI级别AI医生,有望在3年内实现。

采访中,有一组数据被反复提及,在美国医疗AI工具OpenEvidence在医生群体中的渗透率已经达到45%,但中国医生对AI工具接纳度、使用率仍不高。

王小川认为,这一现象不是由模型能力导致的,而是与国内的医疗系统现状和医疗AI行业的风气有关。

一方面,中国医生的工作压力很大,美国医生可能一天需要看10个病人,而中国医生可能是50-100人,平均到每个患者身上只有3-5分钟。这导致国内医生没有时间好好地使用AI产品。

另一方面,王小川认为国内的医疗AI产品并没有真实地表达技术进展,虚假的产品过多,而真东西发布后也难以快速取得信任。他呼吁行业真诚地评价、表达技术进展,推动良性竞争,把医疗行业做得更真实,这样速度才会加快,否则就会有很多“皇帝的新衣”。

围绕AI医疗的责任边界、商业模式和未来方向,王小川认为,在现行法规下,AI模型不能直接给出最终诊断,权力和责任仍由医生承担,AI只是辅助工具;同时,美国已在部分地区允许AI直接开处方,这为中国未来制度探索提供了参考。

在商业模式上,百川不会简单复制美国OpenEvidence通过药企营销变现的路径,而是坚持符合中国国情,在合规前提下通过学术体系等方式参与医疗生态建设。相比美国医院提效带来的巨大市场空间,中国医疗AI必须寻找不同的价值回报方式。

在AI制药领域,百川目前的重点不在早期分子发现或患者招募,而是通过药效评价、药物伴随和数字化伴随(Digital Companion)体系,提高真实世界中的药物疗效,本质上属于精准医疗方向。

针对医疗AI“幻觉”的可接受阈值问题,王小川指出,是否接受由医院和医疗体系决定,而非由企业单方面设定;百川的定位是先辅助医生,再服务患者。随着医生对AI工具的逐步适应,未来两到三年内,医疗行业对AI的接受度有望显著提升,这需要政策、行业伙伴与技术共同推动。

结语:医疗AI热度攀升,落地与信任成关键因素

近几周,AI医疗健康领域迎来多个新玩家,国外的OpenAI、Anthropic,国内的京东等大厂与多家创企都相继发布了新品,赛道热度不断攀升。

不过,正如今天采访中反复提到的那样,影响医疗AI落地的因素不只是模型能力本身。如何获取用户和专业医生群体的信赖,如何与真实场景结合并解决具体问题,或许比发布模型和产品本身更为关键,也更考验企业的长期投入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大年初一,河南省委书记随机调度六市,视频连线六单位

大年初一,河南省委书记随机调度六市,视频连线六单位

小影的娱乐
2026-02-17 19:50:33
济公在佛门中是什么地位?相当于什么神仙?为什么无人敢惹?

济公在佛门中是什么地位?相当于什么神仙?为什么无人敢惹?

千秋文化
2026-02-10 20:49:39
日经225指数跌幅扩大,现跌1.0%,最新报56200.73点

日经225指数跌幅扩大,现跌1.0%,最新报56200.73点

每日经济新闻
2026-02-17 11:39:05
穆斯卡特:去年为联赛争冠牺牲了亚冠,但从中看到了球队进步

穆斯卡特:去年为联赛争冠牺牲了亚冠,但从中看到了球队进步

懂球帝
2026-02-17 20:35:17
马来西亚总理安瓦尔选用刘德华歌曲《恭喜发财》送新春祝福,还提到孔子思想

马来西亚总理安瓦尔选用刘德华歌曲《恭喜发财》送新春祝福,还提到孔子思想

环球网资讯
2026-02-17 13:00:45
你祖上有啥很大的机缘转折点?网友:但凡发生一下改变,就没你了

你祖上有啥很大的机缘转折点?网友:但凡发生一下改变,就没你了

带你感受人间冷暖
2026-02-13 15:23:12
蔡明时隔30年再演机器人,撒贝宁的眉毛又上热搜了!宇树科技机器人春晚表演武术,一个动作让观众惊呼:时间倒流了?

蔡明时隔30年再演机器人,撒贝宁的眉毛又上热搜了!宇树科技机器人春晚表演武术,一个动作让观众惊呼:时间倒流了?

每日经济新闻
2026-02-16 21:43:14
连日本都不如!高市用中文拜年,赖清德新春贺词只字不提“中国”

连日本都不如!高市用中文拜年,赖清德新春贺词只字不提“中国”

现代小青青慕慕
2026-02-17 18:11:45
马英九言论引关注:统一最后时刻,大陆准备战争,台美需深思

马英九言论引关注:统一最后时刻,大陆准备战争,台美需深思

领悟看世界
2026-02-15 01:21:14
哪一刻意识到自己没见过世面?网友:从此再没喝过茶

哪一刻意识到自己没见过世面?网友:从此再没喝过茶

另子维爱读史
2025-12-13 21:53:50
别说超过台积电了,说实话,目前中芯国际还落后太远了

别说超过台积电了,说实话,目前中芯国际还落后太远了

Thurman在昆明
2026-02-17 23:00:36
伊朗宣布大动作,原油快速反弹!美股盘前走低,科技股普跌!金银下挫,加密货币超8万人爆仓

伊朗宣布大动作,原油快速反弹!美股盘前走低,科技股普跌!金银下挫,加密货币超8万人爆仓

每日经济新闻
2026-02-17 19:37:08
128GB+4TB!AMD新品官宣:正式上市

128GB+4TB!AMD新品官宣:正式上市

高科技爱好者
2026-02-16 23:09:12
市政府副市长,市公安局党委书记、局长走访慰问基层一线民警辅警

市政府副市长,市公安局党委书记、局长走访慰问基层一线民警辅警

警界君
2026-02-17 12:38:49
如果你计划三年内买车的话,那请听一句劝:未来多半会感谢我!

如果你计划三年内买车的话,那请听一句劝:未来多半会感谢我!

刘哥谈体育
2026-02-17 13:40:53
1960年代,许世友想要安徽一个湖,省委书记拍桌子:手伸太长!结局谁也没想到

1960年代,许世友想要安徽一个湖,省委书记拍桌子:手伸太长!结局谁也没想到

源溯历史
2025-12-22 12:14:11
外资撤不走,中国拦不住,如今的中国广东,制造早已不是代工

外资撤不走,中国拦不住,如今的中国广东,制造早已不是代工

甜柠聊史
2026-01-23 14:01:57
2月17日俄乌:乌克兰反击取得重大进展

2月17日俄乌:乌克兰反击取得重大进展

山河路口
2026-02-17 21:45:42
深扒之下才明白,国家为什么不再原谅,曾经为国争光的孔令辉了

深扒之下才明白,国家为什么不再原谅,曾经为国争光的孔令辉了

两只米老鼠
2026-02-17 00:23:49
女子去养老院看望外婆,却被护工告知:有个50岁女人也经常来

女子去养老院看望外婆,却被护工告知:有个50岁女人也经常来

墨印斋
2025-09-16 11:48:57
2026-02-17 23:47:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11239文章数 116972关注度
往期回顾 全部

科技要闻

春晚这些机器人是怎样做到的?

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

体育要闻

谷爱凌:'不小心"拿到了银牌 祝大家马年大吉

娱乐要闻

春节档电影首波口碑出炉!

财经要闻

大年初一,这三件事很不寻常

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

教育
旅游
家居
艺术
时尚

教育要闻

按照规律填一填,下面3个括号里分别填几呢?

旅游要闻

大年初一南京夫子庙景区迎来大客流,交通优化措施落地游客出行安全有序

家居要闻

中古雅韵 乐韵伴日常

艺术要闻

名家笔下话过年,别有风味!

今年春天最流行的4组配色,过年穿时髦又高级!

无障碍浏览 进入关怀版