医生们以为找到了减负神器,结果AI在病历里写满了不存在的事。
安大略省审计长办公室最近测试了20家获政府认证的AI医疗速记服务商,结果全军覆没——每一家都在基础测试中暴露出问题。9家凭空捏造患者信息,12家录错内容,17家漏掉心理健康讨论的关键细节。这些被官方盖章"可采购"的产品,正在把幻觉写进正式医疗档案。
![]()
测试场景并不复杂:两段模拟医患对话,让AI生成结构化病历。但出来的结果让审计人员倒吸冷气。有的AI编造了根本不存在的验血转诊单,有的把处方药名抄错,还有的干脆漏记了患者主动提及的抑郁症状。审计报告的原话是:这些错误"可能导致不充分或有害的治疗方案,进而影响患者健康结果"。
![]()
这背后是一整套采购逻辑的崩塌。安大略省政府为缓解医生文书负担,批量认证了这批AI速记供应商,相当于用官方背书替医院做了筛选。但认证标准显然没跟上AI的"创作能力"——20家供应商里,没有一家能同时保证准确、完整、不幻觉。
更微妙的是使用场景的风险叠加。医疗速记的特殊之处在于,它的输出不是参考材料,而是直接进入电子健康档案的正式记录。医生如果基于这份档案做后续诊疗决策,错误信息就会层层传导。审计报告提到的"验血转诊单幻觉"尤其典型:患者可能因此白跑实验室,或因未做必要检查而延误病情。
心理健康信息的遗漏则是另一类隐患。17家供应商在这个维度失守,意味着焦虑、自杀倾向、创伤史等关键信息可能被系统性地过滤掉。AI速记工具通常以"提高效率"为卖点,但当效率优先于临床敏感性时,最脆弱的患者群体反而被算法隐形了。
![]()
安大略省的案例并非孤例,但罕见地提供了规模化审计的样本。20家供应商同时出问题,说明这已经不是单个产品的技术缺陷,而是整个品类在医疗场景下的适配性危机。政府认证本应是一道防火墙,现在却变成了风险放大器——医院基于信任采购,医生基于信任使用,患者基于信任被诊疗。
审计报告没有点名具体供应商,但留下了更棘手的追问:当AI开始承担关键中间环节,谁来为它的幻觉负责?是开发模型的公司,是认证它的政府,还是最终签字确认的医生?安大略省的医生们现在面临一个悖论:不用AI,文书负担压垮人;用了AI,得花更多时间核对它写的东西对不对。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.