凌晨三点,硅谷的科技论坛突然被一条爆炸性消息刷屏——“Grok 3公开打假DeepMind癌症检测系统,三秒诊癌神话竟是泡沫?”这个反转来得比AI诊断还快。
就在五天前,谷歌DeepMind实验室宣布他们的AI系统能通过血检在3秒内揪出13种早期癌症,准确率碾压三甲医院专家,连纽约长老会医院都准备好了试运行床位。可谁都没想到,马斯克旗下的人工智能团队Grok 3会在这个节骨眼扔出“技术打假报告”,直指这套系统存在“数据污染”“算法漏洞”和“临床误导”三大致命伤。
Grok 3的技术总监在社交媒体晒出关键证据:DeepMind使用的训练数据里混入了大量合成数据,这些虚构的血液指标让AI模型误以为某些健康样本属于癌症患者。
更尴尬的是,当Grok 3团队用真实患者数据测试时,系统把15%的胰腺炎误诊为胰腺癌,把12%的妊娠期激素波动判定为卵巢癌。网友翻出DeepMind技术白皮书第27页的小字注释,发现所谓的“13种癌症”其实包含3种癌前病变,真正符合临床诊断标准的只有10种。
这场技术打假牵出更多疑点。FDA绿色通道审批文件显示,DeepMind系统仅在乳腺癌、肺癌等5种癌症上达到宣称的准确率,其余类型的数据集样本量不足百例。
纽约长老会医院原定试运行的日程表也被曝推迟,院方发言人改口称“需要更多验证”。最让投资者心惊的是,Grok 3揭露该系统的“基因预判”功能存在严重偏差——它对亚洲人群的患癌风险预测误差高达47%,相当于抛硬币的概率。
面对质疑,DeepMind CEO哈萨比斯连夜召开视频会议,承认合成数据占比达28%,但强调这是“保护患者隐私的必要手段”。
他现场演示系统识别结直肠癌的流程,结果扫描到第4秒才跳出诊断结论,与宣传的“3秒闪电检测”明显不符。这场危机让医疗AI概念股两天蒸发1200亿美元,高盛紧急撤回“五年替代800万医生”的预测报告。
医学界倒是松了口气。北京协和肿瘤科张主任在直播中坦言:“AI把炎症误诊成癌症会引发过度治疗,可能让健康人白挨一刀。”他展示的对比图显示,AI系统标注的“胃癌高风险区域”其实是胃溃疡愈合疤痕。湖南省肿瘤医院专家指出,DeepMind系统无法识别患者疼痛时的微表情,更理解不了家属签放弃治疗同意书时颤抖的笔迹。
这场闹剧暴露了AI医疗的深层困境。当科技公司把实验室数据包装成临床神器,当资本炒作超越技术实际,最终买单的却是患者。
有网友扒出DeepMind系统每年收取999美元年费,试用期内误诊不赔的条款,调侃这是“花钱买惊吓”。
话说回来,如果AI诊断像天气预报一样时常“局部有误差”,你还敢把性命托付给算法吗?评论区等你聊聊真实想法。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.