网易首页 > 新闻中心 > 新闻 > 正文

智明堂大模型获国家中医执业医师测试最佳成绩,首创TCM-Eval基准促行业标准化

0
分享至

(原标题:智明堂大模型获国家中医执业医师测试最佳成绩,首创TCM-Eval基准促行业标准化)

2025年12月20日,北京智明堂科技有限公司联合北京航空航天大学、原广州中医药大学博士生导师佘世锋教授团队、北京知言吉智科技有限公司正式发布自主研发的“智明堂”中医大语言模型ZMT-M1。该大模型在近期国家中医执业医师资格考试模拟测试中,以96.26的高分斩获迄今该领域最佳成绩,远超其它已公开宣布的大模型。

同时,团队正式推出全球首个动态可扩展的中医大模型评测基准 TCM-Eval 及测试平台,为中医大模型提供了公开、透明的竞技平台。自平台测试上线以来,已收到十余家机构及企业的试用申请,这标志着中医大模型首次拥有了标准化与可落地的临床级大模型,产业智能化升级将进入快车道。

图:已参与测试大模型的主实验结果,智明堂ZMT大模型以96.26的高分斩获迄今该领域最佳成绩

长期以来,中医大模型缺乏公开、可复现的评估标准,研发者往往“自说自话”难以横向对比。TCM-Eval填补了行业缺乏统一、科学评估标准的空白,为中医药智能化发展奠定了标准化基石。

TCM-Eval设置中医执业医师考试、中医医师职称考试、中医研究生入学考试、中医理论专题问答、中医临床实践等5大模块,共18个数据集。其中考试类数据集由权威中医专家团队根据国家医考大纲命题,中医理论问答数据集由权威中医专家团队根据中医专业教科书等通过国家认证的教材构建,中医临床实践数据集来源于真实病例并经过匿名化处理。

目前该平台精选、编纂了6,099道高质量试题,涵盖“理论认知、临床辨证、方剂应用、针灸实操”四大维度,并由多位权威中医专家交叉审定,支持全球机构参加评测与排名。

在同一批模拟测试中,智明堂ZMT-M1大模型综合得分刷新行业纪录,其“中医内科学”、“中医外科学”正确率超92%,“辨证论治”、“方剂配伍”、“针灸选穴”与资深中医师决策一致性达88%,不仅领先行业平均水平,也远超其它已公开宣布的大模型。

据智明堂团队公开发表的论文显示,其大模型的卓越性能,源于团队首创的SI-CoTE(Self-Iterative Chain-of-Thought Enhancement)训练框架:以DeepSeek-R1 671B为基座,通过“模型自举+人在环路”多轮迭代,累计构建384,807条高质量思维链样本,难例正确率提升42%,在有限的计算资源下(单节点8张H20 141G)将训练周期压缩至45天,成本降低35%,实现数据质量与模型能力同步进化。

在数据侧,团队严格限定数据源为国家中医执业资格考试指定的18本权威教材,经OCR+人工双重清洗获得99.8%纯净文本,拆分为1.2万个知识块,结合6万道公开模拟题去重与可信度过滤,最终建成384,807条指令问答、约1.59亿中文词元,临床类样本占比超60%,确保模型“懂理论,更懂实战”。

2025年7月,智明堂ZMT-M1模型已在银川、西安8家中医门诊中试点应用,9月扩展至全国100余间诊室。AI完成病历整理、处方建议、经典方剂推荐、方解自动生成等功能,单店接诊效率提升了115%,用户处方支付率提升34%,复诊率提升25.8%,实现年轻医生经验补足、资深医生效率倍增的双赢,首次证实了中医大模型具备临床辅助级能力。

据了解,智明堂CEO王刚毕业于哈尔滨工业大学自然语言理解专业,CTO付瑞吉与王刚师出同门,为哈工大本硕博、中科大博士后,曾任科大讯飞AI研究院副院长、快手AI技术总监,曾获吴文俊人工智能科技进步奖一等奖,在 顶级国际会议和期刊上发表学术论文30余篇,申请(获得)国家发明专利60项。

同时,CTO付瑞吉在人工智能领域拥有丰富的实战经验:曾主持研发业界首个亿级别多模态短视频百科知识图谱“快知”和快手大模型Agent技术KwaiAgents;负责研发的智能评阅技术在多地中高考、CET等大规模考试阅卷中广泛应用;负责研发的个性化学习技术应用于讯飞学习机等多款教育产品中等。

随着现代AI技术的快速发展,AI+中医辅助诊断的发展空间巨大。据智明堂负责人介绍,公司下一步将推进大模型的智能化硬件落地,不断更新和完善中医大模型及评测体系,面向体检机构、医疗机构、科研院所、终端渠道开放,携手合作伙伴完善中医智能化基础设施,共同推动中医药的现代化、标准化、国际化发展。

相关推荐
热点推荐
张水华辞职惊动美国著名医疗网站,如果在西方她或成为医院的骄傲

张水华辞职惊动美国著名医疗网站,如果在西方她或成为医院的骄傲

杨华评论
2026-01-07 02:45:11
流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

潇湘晨报
2026-01-06 17:20:18
技术分析:美军轻松进入委内瑞拉,东大造的雷达为啥没管用?

技术分析:美军轻松进入委内瑞拉,东大造的雷达为啥没管用?

趣生活
2026-01-06 20:40:13
小米公关紧急道歉,一场丢脸的“闹剧”!

小米公关紧急道歉,一场丢脸的“闹剧”!

互联网品牌官
2026-01-06 14:41:58
1盒内存条堪比上海1套房?内存涨价凶猛,业内人士:有钱的,上亿资金囤货

1盒内存条堪比上海1套房?内存涨价凶猛,业内人士:有钱的,上亿资金囤货

时代周报
2026-01-05 22:12:25
美媒:马杜罗对美国赋予的权利表示震惊,从没想到自己还能申请保释

美媒:马杜罗对美国赋予的权利表示震惊,从没想到自己还能申请保释

回旋镖
2026-01-06 08:21:11
上海千亿集团塌房!企业要求员工“裸辞”,老板早已携款“跑路”

上海千亿集团塌房!企业要求员工“裸辞”,老板早已携款“跑路”

时光在作祟
2026-01-05 19:54:32
快观察 | 李在明访华,除了“超时长”元首外交,还释放了哪些信号?

快观察 | 李在明访华,除了“超时长”元首外交,还释放了哪些信号?

上观新闻
2026-01-06 20:01:07
天呀,杜海涛竟然现成这样了,沈梦辰对他是真爱啊

天呀,杜海涛竟然现成这样了,沈梦辰对他是真爱啊

草莓解说体育
2026-01-07 01:43:18
小米公关紧急道歉!雷军评论区彻底沦陷了

小米公关紧急道歉!雷军评论区彻底沦陷了

李东阳朋友圈
2026-01-06 22:04:07
外交部亚洲司司长刘劲松意外“闯入”李在明自拍

外交部亚洲司司长刘劲松意外“闯入”李在明自拍

看看新闻Knews
2026-01-06 20:13:03
格局打开了!广汽埃安承诺,向永州足球胜利的队员一人提供一台车

格局打开了!广汽埃安承诺,向永州足球胜利的队员一人提供一台车

火山詩话
2026-01-07 07:06:30
新华社消息|外交部:没有哪个国家可以充当国际警察,没有哪个国家可以自诩为国际法官

新华社消息|外交部:没有哪个国家可以充当国际警察,没有哪个国家可以自诩为国际法官

新华社
2026-01-06 17:32:44
委内瑞拉被古巴寄生的二十年

委内瑞拉被古巴寄生的二十年

码头青年
2026-01-06 15:26:51
女人染上“性瘾”是一种怎样的体验?可能和你想象得不同

女人染上“性瘾”是一种怎样的体验?可能和你想象得不同

纸上的心语
2025-11-23 11:36:00
西半球的暗影:从委内瑞拉到哥伦比亚,美国的战略野心与困境

西半球的暗影:从委内瑞拉到哥伦比亚,美国的战略野心与困境

南方都市报
2026-01-06 17:42:12
“卖房借款投资《酱园弄》300万,现在我倾家荡产!”

“卖房借款投资《酱园弄》300万,现在我倾家荡产!”

文娱春秋Plus
2026-01-06 11:05:44
高市新年首次喊中国对话,不到24小时,中方用对日反制作出回应

高市新年首次喊中国对话,不到24小时,中方用对日反制作出回应

时时有聊
2026-01-06 20:52:09
司法机关请回答:新华社功勋记者汤计,究竟有无“受贿房产”?

司法机关请回答:新华社功勋记者汤计,究竟有无“受贿房产”?

塔子山评说
2026-01-06 10:26:30
讽刺的对比下,老百姓将会越来越清醒!

讽刺的对比下,老百姓将会越来越清醒!

胖胖说他不胖
2026-01-06 10:00:08
2026-01-07 08:27:00

头条要闻

河北农村居民:"煤改气"后 160平空间燃气费最少8千元

头条要闻

河北农村居民:"煤改气"后 160平空间燃气费最少8千元

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

2026年央视春晚彩排照曝光!

财经要闻

50万亿存款"洪流"将至 四大去向引关注

科技要闻

米粉终于赢了一次

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

数码
亲子
房产
艺术
公开课

数码要闻

2025年度数码好物大赏【年度评选】

亲子要闻

流感季宝妈必看:网上说奥司他韦致幻觉纯属误导

房产要闻

爆发!三亚开年超千亩城更计划曝光,香港城砸下100亿!

艺术要闻

行书正道:探讨《圣教序》与《兰亭序》的发展历程

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×