网易首页 > 网易号 > 正文 申请入驻

184M参数模型跑赢Claude:医疗文本分类的22倍速方案

0
分享至

医疗诊所每天被海量患者消息淹没——邮件、表单、在线聊天、短信、语音留言转录,每个渠道的消息都需要被路由到预约、账单、临床或前台。这是一个高并发、确定性、对延迟极度敏感的任务。

2026年的直觉解法是调用前沿大模型API。Claude Haiku 4.5能给出95%的分类准确率,GPT-4o也行。但每次调用都要花钱,增加约1秒网络往返,还要把患者文本发给没有签署BAA(商业伙伴协议)的第三方。


我造了一个替代方案——184M参数的DeBERTa-v3-base微调模型,在1154条测试样本上与Claude Haiku 4.5、Claude Sonnet 4.6和GPT-4o对打。结果:准确率与最强前沿模型差距在4个百分点以内,CPU上运行速度快22倍,推理边际成本几乎为零。总构建成本不到3美元。

模型已开源:Hugging Face搜索raihan-js/clarioscope-intent-deberta-v1。

这是ClarioScope SLM套件三个模型中的第一个——面向医疗接诊的智能流水线。另外两个是PHI检测器和保险信息提取器,仍在开发中。本文聚焦第一个模型的方法论与基准测试。

任务定义

七个意图标签,专为医疗诊所生产环境的路由设计:

这些类别带有主观判断,边界确实存在模糊地带。新患者预约首诊,同时属于"新患者"和"预约请求";愤怒患者描述医疗问题,同时触发"临床"和"投诉"。数据生成提示词中编码了明确的消歧规则(投诉信号并存时投诉优先;预付费定价问题即使提到保险也算"价格询价"),但边界案例正是所有模型——无论微调还是前沿模型——丢F1分的地方。

为什么不用API

三个硬约束:

延迟。从我的孟加拉国ISP调用前沿API,往返1000-1600毫秒。对路由场景而言,这是"收件箱即时更新"与"明显卡顿"的区别。微调模型CPU推理48毫秒。若上GPU还能再快5-10倍。而托管API的物理下限就是数百毫秒,模型还没开始处理就已经存在。

成本。Claude Sonnet 4.6在该任务上每1000次推理0.76美元,Haiku 0.25美元,GPT-4o 0.53美元。单诊所日均1万条入站消息(多点位牙科或皮肤科集团并不罕见),年成本912至2774美元——这是SaaS经济模型中一道硬杠杠。微调模型一次性训练成本,推理边际成本约等于零。

隐私。前沿API很好,但也是第三方数据通路。涉及受保护健康信息需要BAA,并非所有API提供商都提供。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

杰丝聊古今
2026-05-03 13:35:27
干了20年殡葬,我希望所有家属拿到骨灰后,不要把亲人塞进后备箱

干了20年殡葬,我希望所有家属拿到骨灰后,不要把亲人塞进后备箱

千秋文化
2026-05-12 20:21:18
福建一县委书记,升副厅

福建一县委书记,升副厅

人民资讯
2026-05-13 19:11:04
曝林俊旸创业!首轮估值136亿

曝林俊旸创业!首轮估值136亿

智东西
2026-05-13 16:16:41
铁证面前,还能撤案?深扒无果、信息全封,路虎车主背景有多硬?

铁证面前,还能撤案?深扒无果、信息全封,路虎车主背景有多硬?

世界圈
2026-03-24 12:52:50
90%的中年女人承认:让她们真正上头的,往往是这两种“坏男人”

90%的中年女人承认:让她们真正上头的,往往是这两种“坏男人”

朗威谈星座
2026-05-14 02:31:49
一季度营收暴增684%,英伟达持仓股盘前拉升涨超13%

一季度营收暴增684%,英伟达持仓股盘前拉升涨超13%

财闻
2026-05-13 19:49:37
中天科技,这家被低估的科技创新龙头有十倍潜质吗?

中天科技,这家被低估的科技创新龙头有十倍潜质吗?

普陀动物世界
2026-05-13 12:19:24
马云预言成真?2026年,手握存款的人,或将面临三大挑战

马云预言成真?2026年,手握存款的人,或将面临三大挑战

知鉴明史
2025-09-14 08:05:18
特朗普还没落地,俄有两大动作:普京专机飞入中国,发射超级导弹

特朗普还没落地,俄有两大动作:普京专机飞入中国,发射超级导弹

音乐时光的娱乐
2026-05-14 00:38:01
心理学有个残忍真相:子女长大后不心疼你,从来不是他不懂感恩,也不是他薄情寡义,而是你早年这两种“隐形伤害”,亲手关闭他心疼人开关

心理学有个残忍真相:子女长大后不心疼你,从来不是他不懂感恩,也不是他薄情寡义,而是你早年这两种“隐形伤害”,亲手关闭他心疼人开关

心理观察局
2026-05-07 10:05:05
文化中国行|解码贵州“村字号”出圈密码

文化中国行|解码贵州“村字号”出圈密码

新华社
2026-05-11 11:06:32
事发上海!八旬老伯公交车上突然昏迷,抢救无效不幸离世,家属索赔11万余元

事发上海!八旬老伯公交车上突然昏迷,抢救无效不幸离世,家属索赔11万余元

新民晚报
2026-05-13 12:19:56
九寨沟实行“双向检票”?工作人员:出园检票并非新政策,一直严禁沟内住宿

九寨沟实行“双向检票”?工作人员:出园检票并非新政策,一直严禁沟内住宿

上游新闻
2026-05-11 15:40:24
穿越者预言2027全球资源危机,记者:不止他一个人说过

穿越者预言2027全球资源危机,记者:不止他一个人说过

阿郑的读书日常
2025-01-15 10:11:46
不能说的秘密

不能说的秘密

贵圈真乱
2026-05-02 12:20:52
扬言“闯过去,我能搞定”!多次在深圳违法,舒某、裴某被判有期徒刑

扬言“闯过去,我能搞定”!多次在深圳违法,舒某、裴某被判有期徒刑

南方都市报
2026-05-13 19:13:31
当俄罗斯不再提顿巴斯

当俄罗斯不再提顿巴斯

民间胡扯老哥
2026-05-12 18:07:35
“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

妍妍教育日记
2026-04-15 09:30:09
高志凯:拜登是美国最卑鄙、最无耻的总统!在位四年煽动多国战争

高志凯:拜登是美国最卑鄙、最无耻的总统!在位四年煽动多国战争

扶苏聊历史
2025-12-26 09:53:52
2026-05-14 05:11:00
灰度测试中
灰度测试中
生活正在重构,目前还在灰度测试阶段,暂不全量发布。
2575文章数 26关注度
往期回顾 全部

科技要闻

阿里年营收首破万亿,AI终于不再是画大饼

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

房产
旅游
时尚
本地
手机

房产要闻

卷疯了!最低杀到7字头!手握30万,海口楼市横着走!

旅游要闻

四大入口协同发力 让外国游客“丝滑”逛北京

专栏 | 进入心流后,不被洪流裹挟

本地新闻

用苏绣的方式,打开江西婺源

手机要闻

iOS 27新功能全面爆料!相机App界面支持定制,Siri将彻底重塑

无障碍浏览 进入关怀版