网易首页 > 网易号 > 正文 申请入驻

首个全场景深度思考模型Baichuan-M1-preview发布:囊括三大推理能力

0
分享至

DoNews1月24日消息,1月24日,百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。在数学、代码等多个权威评测中,Baichuan-M1-preview的表现均超越了o1-preview,展现了其在多领域推理方面的独特优势。

此外,作为国内唯一专注医疗领域的头部大模型公司推出的深度思考模型,它还解锁了医疗循证模式,实现了从医疗证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。

Baichuan-M1-preview现已在百小应中正式上线,在深度思考模式下不仅能准确解答数学、代码、逻辑推理等问题,面对复杂医疗问题,还能像资深医疗专家一样,通过深度思考构建严谨的医学推理过程,为用户提供全面的疾病分析和个性化健康管理建议。

为了更好地繁荣AI医疗生态,助力医疗事业发展,百川智能还同时推出了行业首个开源医疗增强大模型Baichuan-M1-14B,其医疗能力超越了更大参数量的Qwen2.5-72B,与o1-mini相差无几。

Baichuan-M1-preview多项能力超越o1-preview,解锁医疗循证模式

作为一个全场景深度思考模型,Baichuan-M1-preview的能力全面,具备强大的语言推理、视觉推理及搜索推理能力。语言推理方面,其在AIME和Math等数学基准测试,以及LiveCodeBench代码任务上的成绩均超越了o1-preview等模型。

视觉推理方面,在MMMU-val、MathVista等权威评测中的成绩,超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等国内外头部模型。

Baichuan-M1-preview的另一大亮点是解锁了医疗循证模式。在面对复杂医学问题时,会将专业可靠的医疗知识作为推理依据,帮助用户做出最佳的医疗决策。

为实现这一能力,百川智能自建了涵盖亿级条目的循证医学知识库,囊括了国内外海量医学论文、权威指南、专家共识、疾病与症状解析、药品说明等专业医疗内容,且以天为单位进行动态更新,及时收录医疗领域的新突破、新进展。

众所周知,医学知识多样性强、因果关系复杂。因此,即使构建了庞大的医疗知识库,在调用其中的医学知识,尤其叠加了互联网上搜索到的医疗信息时依然会遇到部分医学数据、医学理论不一致的情况。

针对这一问题,医疗循证模式能运用医学知识和证据评估标准,对证据进行多层分级,并对不同权威等级的证据进行专业分析与整合,精准识别各类权威信息的来源和可信度,从而避免因信息混杂导致的误判,然后基于这些医学证据进行可靠、准确的医学推理,最终提供可信赖的医疗答案。

通过“医疗循证模式”,Baichuan-M1-preview实现了从证据检索到深度推理的完整端到端服务,能够有效地解决医疗场景中信息过载、不确定性和碎片化等痛点。无论是医生面对复杂病案,还是患者寻求权威建议,它都能通过“摆事实、讲道理”的循证方式提供言之有物、有理有据的解答。不仅能在临床场景中帮助医生提升诊疗效率,在医学科研场景中大幅缩短科研探索时间,还能帮助普通用户更好地理解自身健康状况,帮助患者科学管理生活方式,提升治疗效果。

行业首个开源医疗增强通用大模型 ,Baichuan-M1-14B医疗能力超越Qwen2.5-72B

为了推动AI技术在医疗领域的创新发展,增强AI医疗技术的透明度和可信性,提高医疗服务的可及性,繁荣AI医疗生态,百川智能还开源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。

作为行业首个开源医疗增强通用大模型Baichuan-M1-14B的表现非常优异,不仅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等权威医学知识和临床能力评测上的成绩超越了更大参数量的Qwen2.5-72B-Instruct,并且与o1-mini也相差无几。

为了提升Baichuan-M1-14B的医疗能力,百川智能多管齐下:数据构建方面,面向细分医疗场景,收集了万亿级 token 的严肃医疗数据,涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例,亿级的医疗问答、医疗问诊、临床数据等,还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估,确保模型能学习到有价值且全面的医疗知识。

在此基础上,百川智能还针对病例、医学教材、医学指南等不同类别的高质量医疗数据生成了超千亿 token 的多样化数据,包含了医疗复杂决策推理链条、决策依据以及问答对等多样化形式。这些合成数据拥有丰富的知识呈现形式以及与医生一致的思维过程,进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。

进入到模型训练阶段,百川智能运用行业首创的多阶段领域提升方案,将整个训练过程分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段,依次提升模型的基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO强化学习法,优化思维链路径,避免传统奖励模型偏差,有效提升了模型的生成质量与逻辑推理能力。

Baichuan-M1-preview是百川智能在AI医疗领域的又一次重要突破,为其实现“造医生、改路径、促医学”的AI医疗愿景提供了有力支撑。于此同时,Baichuan-M1-14B开源模型则为中国AI医疗健康生态建设提供了强大助力。百川智能不仅希望加速AI技术在医疗领域的广泛应用,更旨在激发更多创新力量,共同推动中国医疗健康生态的持续进步,助力实现更公平、更高效的高质量医疗服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李连杰当面一句“我刚换了心脏”,谢苗脸唰一下白了,气都不敢喘

李连杰当面一句“我刚换了心脏”,谢苗脸唰一下白了,气都不敢喘

西楼知趣杂谈
2026-02-28 21:36:48
三家连锁轻食品牌被曝用发霉西红柿、黄瓜榨汁 官方通报:已立案调查

三家连锁轻食品牌被曝用发霉西红柿、黄瓜榨汁 官方通报:已立案调查

北京商报
2026-03-13 21:14:12
中国34岁女子在泰国被抛尸水沟,生前最后影像曝光!参加泳池派对后昏迷,被一男子拖上宝马车,警方已锁定嫌疑人,目前案件正在侦破中

中国34岁女子在泰国被抛尸水沟,生前最后影像曝光!参加泳池派对后昏迷,被一男子拖上宝马车,警方已锁定嫌疑人,目前案件正在侦破中

扬子晚报
2026-03-14 19:58:14
乌克兰美女嫁河南农村,丈夫死后把3子国籍改了,公婆称她是恩人

乌克兰美女嫁河南农村,丈夫死后把3子国籍改了,公婆称她是恩人

就一点
2026-03-05 09:40:31
重庆冠军赛:女单四强已出3席!陈熠3-4大藤沙月,决胜局仅输2分

重庆冠军赛:女单四强已出3席!陈熠3-4大藤沙月,决胜局仅输2分

莼侃体育
2026-03-14 19:49:31
苏联“人猿杂交”实验:5名女孩与11只猩猩参与,结局如何?

苏联“人猿杂交”实验:5名女孩与11只猩猩参与,结局如何?

就一点
2026-03-10 13:08:36
揭秘宋佳与小8岁导演王伟的低调婚姻生活

揭秘宋佳与小8岁导演王伟的低调婚姻生活

代军哥哥谈娱乐
2026-03-14 08:40:31
72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

毒sir财经
2026-02-22 10:38:14
生育大局已定,2026年起中国人口将迎三大变化

生育大局已定,2026年起中国人口将迎三大变化

今夜繁星坠落
2026-03-12 13:27:04
向华强侄子晒18万爱马仕限量球鞋,高调炫富被网友吐槽:一身铜臭

向华强侄子晒18万爱马仕限量球鞋,高调炫富被网友吐槽:一身铜臭

娱乐E君
2026-03-13 17:10:03
美国化肥告急,“看看人家中国”

美国化肥告急,“看看人家中国”

观察者网
2026-03-14 12:16:03
天助曼联:0-1大冷门,切尔西遭英超第12掀翻,落后前三3分

天助曼联:0-1大冷门,切尔西遭英超第12掀翻,落后前三3分

侧身凌空斩
2026-03-15 03:39:00
持假证混进F1 嘉定警方两天查获31人

持假证混进F1 嘉定警方两天查获31人

看看新闻Knews
2026-03-14 17:29:13
章子怡香港再拿奖,现场略显寒酸,脸肿下巴尖,身边张家辉好活泼

章子怡香港再拿奖,现场略显寒酸,脸肿下巴尖,身边张家辉好活泼

以茶带书
2026-03-12 12:12:10
女人偷吃后晚上跟丈夫同房是什么体验?这位46岁出轨女人说出答案

女人偷吃后晚上跟丈夫同房是什么体验?这位46岁出轨女人说出答案

混音情感
2026-02-28 09:28:36
顺产分娩手术时直肠被切漏,女子:手术操作失误引发直肠阴道瘘,医院隐瞒术中损伤事实,追责两年无果,涉事医院因未履行告知义务被处罚

顺产分娩手术时直肠被切漏,女子:手术操作失误引发直肠阴道瘘,医院隐瞒术中损伤事实,追责两年无果,涉事医院因未履行告知义务被处罚

极目新闻
2026-03-14 17:27:32
什么原因,让“台独”旗手变成了“我是中国人”

什么原因,让“台独”旗手变成了“我是中国人”

侠客栈
2026-03-13 16:25:28
项英之女回忆:项英死后,康生为何下令杀害了项英的妻子?

项英之女回忆:项英死后,康生为何下令杀害了项英的妻子?

历史龙元阁
2026-02-21 13:40:07
大陆18份通缉令没白发,“台独”分子大倒苦水,小金库被一锅端

大陆18份通缉令没白发,“台独”分子大倒苦水,小金库被一锅端

混沌录
2026-03-14 14:54:17
世界杯,中国队来了!

世界杯,中国队来了!

五星体育
2026-03-14 15:58:50
2026-03-15 09:43:00
DoNews incentive-icons
DoNews
不局限于对互联网行业的追踪与探索,更要向未来、向未知的方向迈进。
105937文章数 26807关注度
往期回顾 全部

科技要闻

传大裁员20%,新模型难产:Meta AI仍然没理顺

头条要闻

知名便利店成卖假烟重灾区:10家店查出问题卷烟854包

头条要闻

知名便利店成卖假烟重灾区:10家店查出问题卷烟854包

体育要闻

NBA唯一巴西球员,增重20KG顶内线

娱乐要闻

九成美曝田栩宁孕期出轨 AI反转引热议

财经要闻

315策划|泡泡玛特假盲盒制售产业链调查

汽车要闻

倾听用户声音 东风奕派三款新车亮相

态度原创

旅游
艺术
房产
亲子
健康

旅游要闻

四川省遂宁市安居区拦江镇依托“赏花经济”带动乡村振兴

艺术要闻

毛主席罕见手迹现身台北,揭示千年碑帖的失传之谜!

房产要闻

不容易啊!海口终于又要卖地了!

亲子要闻

童装专场~童装童鞋上新,几十块钱搞定,高品质舒适不心疼!

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版