网易首页 > 网易号 > 正文 申请入驻

百川智能将发布新一代医疗大模型,事实性幻觉率降至3.3%

0
分享至

来源:市场资讯

(来源:钛媒体APP)


百川智能创始人、CEO王小川,图片来源:百川智能

近日,在清华大学百川楼举办的“AI医疗新范式”学术论坛上,百川智能创始人兼CEO王小川展示了即将发布的新一代医疗大模型Baichuan-M4与AI家庭医生“百小医”。

北京儿童医院、中国医学科学院肿瘤医院和上海交通大学医学院附属瑞金医院等三家国家顶尖医院,与百川联合开展临床研究的成果。

王小川认为,coding对应创造、video对应快乐,健康是智力模型尚未解开的一环。

AI真正进入医疗,必须依靠医疗增强大模型。王小川将医疗对大模型的刚性要求总结为三点:

低幻觉。医疗容不得编造,一个错误判断可能危及生命。《BMJ Open》2026年的研究系统评估了主流通用模型的医疗回答,约50%被评为“有问题”,近20%属于“高度有问题”。通用模型当前的幻觉率在严肃医疗场景下不可接受。

强循证。临床诊断有严格的循证路径,不是“根据症状猜一个最可能的病”。通用模型缺乏系统性的循证推理能力。《JAMA Network Open》2026年评测了21款主流大模型在29个标准化临床案例中的表现,鉴别诊断阶段的错误率普遍超过 80%——不按指南逻辑层层排除,而是过早锁定一个答案。

会提问。任何受过训练的医生都不会在患者说完第一句话时就下结论。牛津大学2026年发表于《Nature Medicine》的研究揭示了一个关键差距:AI读标准化病历时准确率可达94.9%,但真实患者自助使用时骤降至34.5%。原因在于患者描述往往不完整,而通用模型不会像医生一样追问。

三条刚需,通用模型一条都不达标。为此,百川在M系列医疗专用大模型做了针对性的优化。

据百川智能方面介绍,新一代医疗大模型Baichuan-M4,在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗榜单中同时位列世界第一,超越GPT-5.5、Opus 4.7、DeepSeek-V4-Pro等模型。依托原创的事实性感知强化学习算法,Baichuan-M4将裸模型的事实性幻觉率降至3.3%。

不过,模型能力再强,并不直接等同于患者的最终获益。大脑解决的是能力问题,身体解决的是触达问题。中国医疗核心的矛盾,是优质医疗资源供给不足。AI的发展,前提是找到对的产品形态。

百川即将发布的AI家庭医生“百小医”,产品核心定位是,“明明白白看医生,安安心心管家人”。

值得关注的是,百小医将基于微信生态运作,主动引导用户添加企业微信“百小医@百川家医”,拉入家庭群后自动为每位成员建立独立的健康档案,在对话中捕捉并结构化每个人的身体状态、用药历史和检查数据,识别日常闲聊中的高危信号,主动提醒复诊和用药等行为。(本文首发于钛媒体APP,作者|李程程)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别不信!退休金拿到这个数,你就赢了

别不信!退休金拿到这个数,你就赢了

音乐时光的娱乐
2026-06-01 05:44:50
山大博士就业拿到4个offer,电网、选调、医院、留校,选哪个?

山大博士就业拿到4个offer,电网、选调、医院、留校,选哪个?

趣笔谈
2026-06-01 08:21:09
一代女神沦落豪门玩物?结婚8年牙齿全掉,器官切除,面似骷髅

一代女神沦落豪门玩物?结婚8年牙齿全掉,器官切除,面似骷髅

荒野老五
2026-05-31 02:53:04
中超间歇期刚到,北京国安就连迎两个利好消息,中超争四还有戏

中超间歇期刚到,北京国安就连迎两个利好消息,中超争四还有戏

零度眼看球
2026-06-01 06:43:59
周日炸雷!8股狂减持5股亮红灯1股收函1股要退市

周日炸雷!8股狂减持5股亮红灯1股收函1股要退市

慧眼看世界哈哈
2026-05-31 21:52:05
姆巴佩尴尬,巴黎大将:追随恩里克,集体大于任何人

姆巴佩尴尬,巴黎大将:追随恩里克,集体大于任何人

体坛周报
2026-05-31 06:46:23
云南第一人口大县,城区人口45万!

云南第一人口大县,城区人口45万!

镇雄微生活
2026-05-31 19:03:04
国足爆冷胜沙特,主帅盛赞一人撑起国足未来

国足爆冷胜沙特,主帅盛赞一人撑起国足未来

小皷拍客在北漂
2026-06-01 06:59:36
华为“t定律”被指是过时概念,台积电高管:在业界已存在相当长时间

华为“t定律”被指是过时概念,台积电高管:在业界已存在相当长时间

风向观察
2026-05-30 19:10:22
日媒:香会变味,小泉当众乞求联美遏华,中方主动“离场”不玩了

日媒:香会变味,小泉当众乞求联美遏华,中方主动“离场”不玩了

曦言说
2026-05-30 21:40:24
《家业》大结局:入赘生龙凤胎,昔日对头抢当带娃保姆

《家业》大结局:入赘生龙凤胎,昔日对头抢当带娃保姆

陈意小可爱
2026-05-31 01:13:31
日本媒体:如何评价张本智和、张本美和家族?

日本媒体:如何评价张本智和、张本美和家族?

最爱乒乓球
2026-06-01 05:03:53
30位情妇、60辆豪车,有钱人的生活能有多奢淫?比赌王过得还潇洒

30位情妇、60辆豪车,有钱人的生活能有多奢淫?比赌王过得还潇洒

历史伟人录
2026-05-24 20:05:31
优势崩盘!申真谞痛失好局,惨遭连败止步赛场!

优势崩盘!申真谞痛失好局,惨遭连败止步赛场!

L76号
2026-06-01 07:49:29
一张没头没尾的照片,怎么让玩家集体破防了?

一张没头没尾的照片,怎么让玩家集体破防了?

峡谷一级保护废物
2026-06-01 03:22:40
74岁老人烧杨絮引燃20辆汽车:起因是认为大量杨絮影响其健身走步,因涉嫌失火罪,被采取刑事强制措施

74岁老人烧杨絮引燃20辆汽车:起因是认为大量杨絮影响其健身走步,因涉嫌失火罪,被采取刑事强制措施

极目新闻
2026-05-31 18:46:22
颠覆认知!近2万人研究:每周一次性生活,男性癌症风险降低69%

颠覆认知!近2万人研究:每周一次性生活,男性癌症风险降低69%

科技虎虎
2026-05-31 10:09:27
5亿美元重压下雷霆被迫拆队,亚历山大超越杜兰特难度增大

5亿美元重压下雷霆被迫拆队,亚历山大超越杜兰特难度增大

郭蛹包工头
2026-05-31 14:14:57
形势有多严峻?坐标上海:80末90初程序员都开始失业,评论区炸了

形势有多严峻?坐标上海:80末90初程序员都开始失业,评论区炸了

慧翔百科
2026-05-14 09:00:11
东部第一开启阵容清洗!哈里斯年薪2600万恐离队,三将告别底特律

东部第一开启阵容清洗!哈里斯年薪2600万恐离队,三将告别底特律

奕辰说球
2026-05-31 10:40:57
2026-06-01 08:59:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3407316文章数 7733关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

媒体:中国防长不去"香会" 主办方的意图落空了

头条要闻

媒体:中国防长不去"香会" 主办方的意图落空了

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

时尚
游戏
家居
旅游
军事航空

女人不管多大年纪,夏天都要准备一条白色阔腿裤,百搭又清爽

超越十年二游皇帝,登顶手游氪金榜!胜利女神是怎么做到的?

家居要闻

云栖 舒展如流云

旅游要闻

小游哥探城记|神奇的“503”,解锁涪陵新玩法

军事要闻

解放军代表质问日防卫大臣:日本何时道歉

无障碍浏览 进入关怀版