网易首页 > 网易号 > 正文 申请入驻

国内首个全场景深度思考模型Baichuan-M1-preview发布:囊括三大推理能力,解锁医疗循证模式

0
分享至

1月24日,百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。在数学、代码等多个权威评测中,Baichuan-M1-preview的表现均超越了o1-preview,展现了其在多领域推理方面的独特优势。

此外,作为国内唯一专注医疗领域的头部大模型公司推出的深度思考模型,它还解锁了医疗循证模式,实现了从医疗证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。

Baichuan-M1-preview现已在百小应中正式上线,在深度思考模式下不仅能准确解答数学、代码、逻辑推理等问题,面对复杂医疗问题,还能像资深医疗专家一样,通过深度思考构建严谨的医学推理过程,为用户提供全面的疾病分析和个性化健康管理建议。

为了更好地繁荣AI医疗生态,助力医疗事业发展,百川智能还同时推出了行业首个开源医疗增强大模型Baichuan-M1-14B,其医疗能力超越了更大参数量的Qwen2.5-72B,与o1-mini相差无几。

Github: https://github.com/baichuan-inc/Baichuan-M1-14B

Huggingface(base): https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base

Huggingface(Instruct): https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct

Baichuan-M1-preview多项能力超越o1-preview,解锁医疗循证模式

作为一个全场景深度思考模型,Baichuan-M1-preview的能力全面,具备强大的语言推理、视觉推理及搜索推理能力。语言推理方面,其在AIME和Math等数学基准测试,以及LiveCodeBench代码任务上的成绩均超越了o1-preview等模型。

视觉推理方面,在MMMU-val、MathVista等权威评测中的成绩,超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等国内外头部模型。

Baichuan-M1-preview的另一大亮点是解锁了医疗循证模式。在面对复杂医学问题时,会将专业可靠的医疗知识作为推理依据,帮助用户做出最佳的医疗决策。

为实现这一能力,百川智能自建了涵盖亿级条目的循证医学知识库,囊括了国内外海量医学论文、权威指南、专家共识、疾病与症状解析、药品说明等专业医疗内容,且以天为单位进行动态更新,及时收录医疗领域的新突破、新进展。

众所周知,医学知识多样性强、因果关系复杂。因此,即使构建了庞大的医疗知识库,在调用其中的医学知识,尤其叠加了互联网上搜索到的医疗信息时依然会遇到部分医学数据、医学理论不一致的情况。

针对这一问题,医疗循证模式能运用医学知识和证据评估标准,对证据进行多层分级,并对不同权威等级的证据进行专业分析与整合,精准识别各类权威信息的来源和可信度,从而避免因信息混杂导致的误判,然后基于这些医学证据进行可靠、准确的医学推理,最终提供可信赖的医疗答案。

通过“医疗循证模式”,Baichuan-M1-preview实现了从证据检索到深度推理的完整端到端服务,能够有效地解决医疗场景中信息过载、不确定性和碎片化等痛点。无论是医生面对复杂病案,还是患者寻求权威建议,它都能通过“摆事实、讲道理”的循证方式提供言之有物、有理有据的解答。不仅能在临床场景中帮助医生提升诊疗效率,在医学科研场景中大幅缩短科研探索时间,还能帮助普通用户更好地理解自身健康状况,帮助患者科学管理生活方式,提升治疗效果。

行业首个开源医疗增强通用大模型 ,Baichuan-M1-14B医疗能力超越Qwen2.5-72B

为了推动AI技术在医疗领域的创新发展,增强AI医疗技术的透明度和可信性,提高医疗服务的可及性,繁荣AI医疗生态,百川智能还开源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。

作为行业首个开源医疗增强通用大模型Baichuan-M1-14B的表现非常优异,不仅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等权威医学知识和临床能力评测上的成绩超越了更大参数量的Qwen2.5-72B-Instruct,并且与o1-mini也相差无几。

为了提升Baichuan-M1-14B的医疗能力,百川智能多管齐下:数据构建方面,面向细分医疗场景,收集了万亿级 token 的严肃医疗数据,涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例,亿级的医疗问答、医疗问诊、临床数据等,还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估,确保模型能学习到有价值且全面的医疗知识。

在此基础上,百川智能还针对病例、医学教材、医学指南等不同类别的高质量医疗数据生成了超千亿 token 的多样化数据,包含了医疗复杂决策推理链条、决策依据以及问答对等多样化形式。这些合成数据拥有丰富的知识呈现形式以及与医生一致的思维过程,进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。

进入到模型训练阶段,百川智能运用行业首创的多阶段领域提升方案,将整个训练过程分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段,依次提升模型的基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO强化学习法,优化思维链路径,避免传统奖励模型偏差,有效提升了模型的生成质量与逻辑推理能力。

Baichuan-M1-preview是百川智能在AI医疗领域的又一次重要突破,为其实现“造医生、改路径、促医学”的AI医疗愿景提供了有力支撑。于此同时,Baichuan-M1-14B开源模型则为中国AI医疗健康生态建设提供了强大助力。百川智能不仅希望加速AI技术在医疗领域的广泛应用,更旨在激发更多创新力量,共同推动中国医疗健康生态的持续进步,助力实现更公平、更高效的高质量医疗服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曝小S老公泄露大S出殡照约女粉,包含骨灰遗像,汪小菲曾曝其出轨

曝小S老公泄露大S出殡照约女粉,包含骨灰遗像,汪小菲曾曝其出轨

180视角
2026-03-11 11:43:53
伊朗导弹为何失去饱和攻击能力:地下导弹城正在崩塌

伊朗导弹为何失去饱和攻击能力:地下导弹城正在崩塌

斌闻天下
2026-03-11 07:00:04
驻韩美军6部萨德发射车全部运出

驻韩美军6部萨德发射车全部运出

界面新闻
2026-03-11 09:47:13
霍尔木兹危机升级!特朗普再度警告伊朗:若布雷,将遭空前打击

霍尔木兹危机升级!特朗普再度警告伊朗:若布雷,将遭空前打击

财联社
2026-03-11 08:30:10
笑不活!网传贵州一狸花猫跟邻居家猫狗打架,打空主人8000元工资

笑不活!网传贵州一狸花猫跟邻居家猫狗打架,打空主人8000元工资

火山詩话
2026-03-11 09:15:39
工信部专家: 党政机关、企事业单位和个人用户要审慎使用“龙虾”!国家互联网应急中心提示四大严重安全风险

工信部专家: 党政机关、企事业单位和个人用户要审慎使用“龙虾”!国家互联网应急中心提示四大严重安全风险

每日经济新闻
2026-03-10 22:55:30
特朗普一换说法,油价就回归,而他与万斯矛盾显现无遗!

特朗普一换说法,油价就回归,而他与万斯矛盾显现无遗!

新民晚报
2026-03-11 10:31:59
4月1号起,银行存款10万以上50万以下的,这个消息一定要知道

4月1号起,银行存款10万以上50万以下的,这个消息一定要知道

另子维爱读史
2026-03-10 23:10:33
登机前决定不回国 伊朗女足又有2人获签证 留澳7人摘头巾激动拥抱

登机前决定不回国 伊朗女足又有2人获签证 留澳7人摘头巾激动拥抱

我爱英超
2026-03-11 09:11:36
12年前,那个美国抓捕未果,入籍俄罗斯的斯诺登,如今过得怎样?

12年前,那个美国抓捕未果,入籍俄罗斯的斯诺登,如今过得怎样?

就一点
2026-03-08 23:09:47
马克龙宣布前所未有海军部署,将向中东地区派10艘军舰,称“攻击塞浦路斯就是攻击欧洲”,此前航母“戴高乐”已抵达附近水域

马克龙宣布前所未有海军部署,将向中东地区派10艘军舰,称“攻击塞浦路斯就是攻击欧洲”,此前航母“戴高乐”已抵达附近水域

极目新闻
2026-03-11 09:15:26
黄仁勋罕见发长文:未来传统软件和APP或将消失,智能体极有可能成主流

黄仁勋罕见发长文:未来传统软件和APP或将消失,智能体极有可能成主流

界面新闻
2026-03-11 10:40:18
西贝换帅求生,贾国龙终于知道疼了:活下去比什么都重要

西贝换帅求生,贾国龙终于知道疼了:活下去比什么都重要

北向财经
2026-03-10 21:05:35
《权游》主题曲为伊朗裔作曲,伊朗女乐团曾用波斯传统乐器演奏版爆火

《权游》主题曲为伊朗裔作曲,伊朗女乐团曾用波斯传统乐器演奏版爆火

知识圈
2026-03-11 14:12:23
基因、权力、药物:特朗普80岁的身体,咋就这么能折腾?

基因、权力、药物:特朗普80岁的身体,咋就这么能折腾?

热辣茉莉说
2026-03-09 15:17:48
霍尔木兹海峡,突发!原油,巨震!

霍尔木兹海峡,突发!原油,巨震!

证券时报
2026-03-11 08:11:24
《逐玉》热播,女主田曦薇扛的猪被浙江网友一眼认出:金华两头乌!本地人认证:真的很好吃

《逐玉》热播,女主田曦薇扛的猪被浙江网友一眼认出:金华两头乌!本地人认证:真的很好吃

极目新闻
2026-03-10 17:14:59
澳大利亚关闭驻以色列大使馆

澳大利亚关闭驻以色列大使馆

界面新闻
2026-03-11 13:02:24
伊朗再袭美军基地,发射“加德尔”导弹携带1吨多弹头;以军武器制造设施和卫星数据中心遭打击!伊外交部发言人:要给美以一个教训

伊朗再袭美军基地,发射“加德尔”导弹携带1吨多弹头;以军武器制造设施和卫星数据中心遭打击!伊外交部发言人:要给美以一个教训

每日经济新闻
2026-03-11 12:39:17
美国打不过伊朗?你的问题,就是报道看得太多了

美国打不过伊朗?你的问题,就是报道看得太多了

走读新生
2026-03-09 22:30:33
2026-03-11 14:35:00
硅星Breaknews incentive-icons
硅星Breaknews
Break news
7111文章数 71关注度
往期回顾 全部

科技要闻

腾讯急了急了,微信绝密AI智能体首度曝光

头条要闻

承诺全屋智能装修老板失联 女子:花3万就摆几张桌椅

头条要闻

承诺全屋智能装修老板失联 女子:花3万就摆几张桌椅

体育要闻

执教过李铁的英国老头,77岁又出山了

娱乐要闻

杨幂连续五年为刘诗诗庆生,刘诗诗回应

财经要闻

油价大转头?一天,从末日到曙光!

汽车要闻

丰田向左,本田向右

态度原创

房产
家居
教育
本地
军事航空

房产要闻

信号!千亿巨头入局,三亚开启新一轮大征拆!

家居要闻

中式风格 人间朝与暮

教育要闻

原料有区别,分辨很重要

本地新闻

云游中国|候鸟高颜值亮相!沉浸式打卡青海湿地

军事要闻

刚说完战争很快结束 特朗普改口

无障碍浏览 进入关怀版