关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
蚂蚁集团刚刚开源了全球最大医疗AI模型AntAngelMed。
AntAngelMed是一个混合专家架构模型,有1000亿参数但仅激活了61亿参数,并基于Ling-flash-2.0-base开发而成。
![]()
根据测试数据显示,AntAngelMed在OpenAI的HealthBench高难度医疗测试中,以39.6分超过了DeepSeek-R1、GLM-4.5、Kimi-k2等知名模型,成为全球最强的开源医疗AI模型。
![]()
首先得说,这模型来头不小,是浙江省卫生健康信息中心、蚂蚁健康还有安诊儿医疗AI联合研发的,算是开源医疗模型里规模最大、性能最能打的一款。
除了在OpenAI的HealthBench中霸榜第一,在国内的MedAIBench、MedBench评测中也是直接拿第一。
MedBench里它以68分的综合成绩领跑,比微医、云知声这些大厂的医疗模型都高,要知道MedBench可是涵盖了70万个样本的中文医疗评测,能拿第一实力是相当强的。
![]()
而且这模型不是光成绩好看,实用性也拉满。它总共有1000亿参数,但实际干活只需要激活61亿,就能达到400亿参数稠密模型的效果,相当于花小钱办大事。
在H20硬件上推理速度能超200 tokens/秒,比普通的360亿参数模型快3倍,还能处理128K的超长文本,不管是看大段病历还是复杂的诊疗记录,都不费劲。
AntAngelMed之所以这么强,与它的特殊训练流程和架构有很大关系。第一步是持续预训练,基于Ling-flash-2.0这个基础模型,喂了海量的医疗语料,比如医学百科、学术论文这些,先让模型把医疗基础知识啃透。
第二步是监督微调,不光用医疗场景的对话、诊断案例这些数据,还加了数学、编程、逻辑类的通用数据,既让模型懂医疗,又让它有清晰的思维逻辑,不会答非所问。
第三步是强化学习,用专门的算法调教模型,让它说话既有同理心,又能严格遵守医疗安全规范,减少胡说八道的情况,毕竟医疗模型可不能乱给建议。
![]()
架构方面,AntAngelMed是基于Ling-flash-2.0的混合专家架构开发而成。简单来说就是把模型分成一个个小专家,处理不同的医疗问题时,只叫对应的专家出来干活,不用全员上阵。
就像医院里看感冒找呼吸科医生,看骨折找骨科医生,各司其职效率才高。而且研发团队还把这个架构优化到了极致,激活比例只有1/32,再加上一些细节优化,比如注意力平衡、QK归一化这些,让模型效率直接提升7倍。
我特意看了下,还做了FP8量化优化,在多并发场景下,推理速度又能再提一大截,比如做代码类任务能快71%,数学任务甚至能快94%,又快又稳。
如果只是想体验下模型效果,用HuggingFace的transformers库就行,复制几行代码,把模型地址换成MedAIBase/AntAngelMed,输入个问题比如头痛该怎么办,模型就能给出回答。
![]()
咱们国内用户更推荐用ModelScope,下载速度快很多,不用折腾半天。如果想长期用,不管是用NvidiaA100还是华为的Ascend910B都能部署。
用Nvidia的话,推荐用vLLM或者SGLang,这俩都是现在主流的高效推理框架,先装对应的包,再跑几行命令就能启动服务,还能兼容OpenAI的API格式,调用起来很方便。
![]()
说实话,我扒完这个模型的资料,第一感觉就是诚意满满。开源、性能强、效率高,还考虑到了不同硬件的部署场景,不管是做医疗 AI 研究的,还是想落地医疗相关应用的,都能直接用。
最近阿里的医疗助手阿福挺火的,现在用这个模型可以试着打造自己的阿福。而且它的许可证是 apache-2.0,商用也没啥大问题,比起那些闭源的医疗模型,门槛低太多了。
开源地址:https://huggingface.co/MedAIBase/AntAngelMed
Github:https://github.com/MedAIBase/AntAngelMed
魔搭:https://modelscope.cn/models/MedAIBase/AntAngelMed
想转型AI,不被时代淘汰
CAIE注册人工智能工程师认证
岗位能力 × AI工具 ×转型方向 × 场景落地 = 新AI职业价值
扫码免费领取《AI工程师入门学习指南》
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.