网易首页 > 网易科技 > 网易科技 > 正文

MedBench最新榜单出炉!润达医疗联合华为揽获评测双冠

0
分享至

(原标题:MedBench最新榜单出炉!润达医疗联合华为揽获评测双冠)

5月6日,医疗大模型评测平台MedBench发布新版评测榜单,润达医疗与华为基于华为云盘古大模型创新研发的润医医疗大模型以92.9分在自测榜单中拔得头筹,在专业评测榜单中以85.2分荣膺桂冠。润医医疗大模型在医学语言理解、医学安全和伦理等核心测评维度中表现突出。

最新版MedBench榜单(2025年2月版)

MedBench作为中文医疗大模型权威评测平台,由上海人工智能实验室、上海市数字医学创新中心联合多家机构打造,已成为全球医疗AI领域重要参照标准之一。目前,平台已累计评测全球387个医疗大模型,从医学语言理解、生成、知识问答、复杂推理及医疗安全伦理五大维度,提供客观科学的性能评估。

润医医疗大模型能够一举斩获双料第一,甚至在自测榜单中,医学语言理解、医疗安全和伦理维度分别斩获122.1、103.1高分,及在专业评测榜中,医学语言理解维度斩获119.7高分,充分佐证了润达医疗在医疗大模型研发领域深厚的技术积累与强大的创新硬实力。此外,在医学复杂推理等高阶复杂医疗场景中,模型也取得了领先的效果,凸显了模型运用医学知识进行复杂分析和严谨推理的能力,将在医学辅助诊疗、提升医疗效率和准确率等方面发挥重要作用。

多维能力突出 重构人机协同范式

润医医疗大模型在华为云盘古大模型L0层的基础上,训练使用了千亿级高质量的中英文医学文献、医学指南、书籍,及千万量级医疗健康档案和知识图谱等数据,融合高质量通用数据,构成了润医医疗大模型底座。

从技术特性来看,380亿高参数量赋予模型强大的学习能力,使其能够精准捕捉医疗数据中的复杂模式与内在关系,显著提升语言理解和生成能力,足以胜任各类复杂医疗任务。而支持32k序列长度,则确保模型具备卓越的长文本处理能力,能够充分理解上下文语义,极大增强对复杂医疗文本的分析解读效能,可在多轮对话、复杂病例分析等应用场景中优势明显。作为大模型训练的核心要素,海量高质量数据为模型提供了丰富且准确的知识来源,可有效提升模型泛化能力,使其在各类实际医疗场景中能够做出更精准的判断与决策。

基于模型底座,润达医疗还创新研发了循证推理引擎,通过构建“动态权重分配、证据链追溯与不确定性量化”的“三位一体”临床决策系统。其中,动态权重分配确保了模型可实时聚焦关键医学信息;证据链追溯则通过知识图谱,能够验证推理路径;不确定性量化则对模糊信息进行概率评估。三项创新机制的协同运作,有效将模型幻觉率严格控制了在医疗级安全阈值内。不仅如此,润达医疗还打造具有双向进化机制的可信AI大脑,在服务医生的过程中持续学习临床反馈,反向优化自身推理路径,重构人机协同范式,让AI成为医生智慧的延伸,更精准地满足医生和患者的知识需求,真正成为医疗场景中可靠的智能助手。

得益于多项核心创新技术的有力支撑,润医医疗大模型在MedBench评测的多个维度中均展现卓越性能,尤其是语言理解与医疗安全和伦理维度。在医学语言理解上,动态权重分配、证据链追溯与不确定性量化机制协同,可精准捕捉文本关键信息与逻辑。而在医疗安全与伦理维度,“循证推理+可信AI”架构深度剖析复杂场景,严格审查伦理风险,为医疗质效提升与合规安全筑牢双重保障。

真实场景验证 赋能医疗质效革新

从技术突破到民生福祉,润达医疗基于大模型和数据治理的智慧医疗解决方案,贯穿“防-治-管”全流程,提供覆盖疾病预防、诊断治疗、患者管理的全生命周期服务,已在智慧检验、病情分析、病历生成与质控、区域健康管理等多维度真实医疗场景中完成实践验证,成功实现智慧诊疗全场景落地应用。

基于润医医疗大模型,润达医疗与美年健康共同孵化的国内首款AI私人健康管理师“健康小美”,截至今年3月底,其智能主检应用已在美年健康109家体检中心上线应用,且审核并生成超39万份体检报告,重点指标精准率90%+。

相关推荐
热点推荐
苏州一高校副教授在凌晨去世,终年仅42岁,履历优秀让人惋惜

苏州一高校副教授在凌晨去世,终年仅42岁,履历优秀让人惋惜

凯旋学长
2025-12-15 16:09:26
越南将允许外籍人士担任法院法官,改革力度前所未有获称赞

越南将允许外籍人士担任法院法官,改革力度前所未有获称赞

环球热点快评
2025-12-15 18:23:57
对FMVP甩脸色?被王岚嵚打爆心态崩了,球迷:郭士强不带你没毛病

对FMVP甩脸色?被王岚嵚打爆心态崩了,球迷:郭士强不带你没毛病

弄月公子
2025-12-15 22:43:33
4-3!4-1!苏格兰公开赛:2位中国冠军名将开门红!占据32强前2席

4-3!4-1!苏格兰公开赛:2位中国冠军名将开门红!占据32强前2席

球场没跑道
2025-12-15 20:45:21
房贷族注意:1% 贴息政策敲定,你的月供能降多少?答案来了

房贷族注意:1% 贴息政策敲定,你的月供能降多少?答案来了

新浪财经
2025-12-15 16:51:12
冷空气持续“发威” 广州最低气温跌至1.7℃

冷空气持续“发威” 广州最低气温跌至1.7℃

中国能源网
2025-12-15 18:15:04
这件衣服支配了贵族100多年,现在普通人也能随便买

这件衣服支配了贵族100多年,现在普通人也能随便买

《买手客buyerkey》
2025-12-14 22:04:51
43岁王鸥没想到,低调生下的2岁女儿,如今竟让自己“口碑暴增”

43岁王鸥没想到,低调生下的2岁女儿,如今竟让自己“口碑暴增”

石场阿鑫
2025-12-15 16:49:02
古典第一美人何晴病逝,前夫携现任探病,遗产只剩一套旧房

古典第一美人何晴病逝,前夫携现任探病,遗产只剩一套旧房

老吴教育课堂
2025-12-15 15:01:26
1972年,缅甸的昂山素季和老公阿里斯新婚燕尔的合影

1972年,缅甸的昂山素季和老公阿里斯新婚燕尔的合影

小椰的奶奶
2025-12-14 07:10:44
002853,实控人变更,明天复牌!停牌前尾盘拉升涨停

002853,实控人变更,明天复牌!停牌前尾盘拉升涨停

证券时报e公司
2025-12-15 22:11:13
三亚不香了?东北人撤离成潮,压垮他们的不是物价,而是生活现实

三亚不香了?东北人撤离成潮,压垮他们的不是物价,而是生活现实

历史有些冷
2025-12-04 20:20:06
特朗普不想当老二,拉9国组成联盟,要废除中国王牌,外交部发话

特朗普不想当老二,拉9国组成联盟,要废除中国王牌,外交部发话

博览历史
2025-12-14 18:29:56
路虎新款6座SUV比大揽胜还大!售价40万起PK理想L8

路虎新款6座SUV比大揽胜还大!售价40万起PK理想L8

网上车市
2025-12-15 13:26:27
告别全华班!欠薪四川男篮签NBA落选秀庞兹 何时登场未知

告别全华班!欠薪四川男篮签NBA落选秀庞兹 何时登场未知

醉卧浮生
2025-12-15 13:10:10
1949 年,朱可夫元帅品尝可口可乐时提议:可否消除其棕褐色泽,让它像伏特加一样?

1949 年,朱可夫元帅品尝可口可乐时提议:可否消除其棕褐色泽,让它像伏特加一样?

桃烟读史
2025-12-14 18:55:18
中国终于明白战胜国的优势!美国意识到:自己也被中国装进去了!

中国终于明白战胜国的优势!美国意识到:自己也被中国装进去了!

布拉旅游说
2025-12-09 11:27:15
26岁史上最年轻博导,原来取的是马克思的真经

26岁史上最年轻博导,原来取的是马克思的真经

基本常识
2025-12-14 23:09:22
后台差点干架!为了揉个脚踝?这幕撕开了明星“完美机器”遮羞布

后台差点干架!为了揉个脚踝?这幕撕开了明星“完美机器”遮羞布

做一个合格的吃瓜群众
2025-12-14 17:56:26
曾师说的赤马红羊到了,人多的地方不要去,用三帖心药,安然无恙

曾师说的赤马红羊到了,人多的地方不要去,用三帖心药,安然无恙

山九
2025-12-14 08:10:09
2025-12-15 23:00:49

科技要闻

大佬冷酷预言:未来15年 人形机器人成废铁

头条要闻

55岁丈夫收到小卡片半年花30多万 妻子:一天就13人次

头条要闻

55岁丈夫收到小卡片半年花30多万 妻子:一天就13人次

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

何晴告别式现场,前夫许亚军双眼泛红?

财经要闻

新农合涨到400元 农民断缴背后的扎心真相

汽车要闻

主驾配按摩还可选6座 新款捷途X90PRO售13.59万起

态度原创

手机
时尚
本地
艺术
军事航空

手机要闻

一加Turbo系列确定,性能、续航全面提升

冬天别只穿黑白灰,看看这些“蓝色系”穿搭,清爽减龄又高级

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

艺术要闻

Gustav Klimt 高清风景油画作品集

军事要闻

泽连斯基称乌方已妥协不加入北约 俄方发声

无障碍浏览 进入关怀版
×