一股脑儿把AI塞进医生手里,这事儿现在特别火。OpenEvidence这样的专用临床工具被大力吹捧,好像不给白大褂配个AI助手就落伍了。
但一份最新论文直接泼了盆冷水。结论很干脆:前沿通用大语言模型,打得这些专用工具毫无还手之力。“在所有三项评估中,前沿大语言模型都完胜临床AI工具。”论文原话就这么直白。
![]()
这就很讽刺了。花大价钱、对着医学文献精细打磨的“专业特长选手”,结果在多维度评测里,愣是没干过没穿白大褂的“通才”。所谓医疗场景的深度优化,效果到底在哪?
对医院和开发者来说,这事儿得琢磨琢磨。到底是继续砸钱养专用模型,还是直接接入一个强悍的通用底座再微调?钱和效果,总得占一样。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.