网易首页 > 网易号 > 正文 申请入驻

研究显示谷歌AI模型Veo-3可伪造手术视频,缺乏实质性医学理解

0
分享至

IT之家 11 月 9 日消息,研究人员用真实的手术录像对谷歌最新视频生成人工智能模型 Veo-3 进行了测试,结果发现该模型虽能生成高度逼真的视觉内容,却严重缺乏对医学操作流程的实质性理解。


研究中,研究人员仅提供单张手术图像作为输入,要求 Veo-3 预测接下来 8 秒内的手术进展。为系统评估其表现,一支国际研究团队构建了名为 SurgVeo 的专用评测基准,涵盖 50 段真实腹腔与脑部手术视频。评估环节由四位经验丰富的外科医生独立完成,从视觉真实性、器械使用合理性、组织反馈表现及操作医学逻辑性四个维度对 AI 生成视频进行打分(满分 5 分)。

Veo-3 生成的视频初看极具欺骗性,部分外科医生甚至评价其画质“令人震惊地清晰”。然而深入分析后,其内容逻辑迅速崩塌:在腹腔手术测试中,模型在 1 秒时的视觉合理性尚达 3.72 分;但一旦涉及医学准确性,得分便大幅下滑 —— 器械操作仅 1.78 分、组织反应仅 1.64 分,而最核心的手术逻辑性评分最低,仅为 1.61 分。模型虽能生成高度拟真的影像,却无法再现真实手术室中应有的操作流程与因果关系



IT之家注意到,在对精细度要求极高的神经外科场景中,Veo-3 表现更为逊色。自第 1 秒起,其即难以把握神经外科所需的精准操作:器械使用得分降至 2.77 分(腹腔手术为 3.36 分),而 8 秒后的手术逻辑性评分更是跌至 1.13 分。

研究团队进一步归类错误类型发现:超 93% 的错误源于医学逻辑层面 —— 例如凭空“发明”不存在的手术器械、虚构违反生理规律的组织反应,或执行在临床上毫无意义的操作;而仅极小比例的错误(腹腔手术 6.2%、脑部手术 2.8%)与图像质量相关。

研究人员尝试为模型提供更多上下文线索(如手术类型、具体操作阶段等),但结果未呈现显著或稳定的改善。团队指出,问题核心并非信息缺失,而在于模型根本缺乏对医学知识的理解与推理能力。

SurgVeo 研究清晰表明:当前视频生成 AI 距离真正的医学理解仍有巨大鸿沟。尽管未来系统或有望用于医生培训、术前规划乃至术中引导,但现有模型远未达到安全、可靠的应用门槛 —— 它们可生成“以假乱真”的影像,却缺乏支撑正确临床决策的知识基础。

研究团队计划将 SurgVeo 基准数据集开源至 GitHub,以推动学界共同提升模型医学理解能力。

该研究亦警示:将此类 AI 生成视频用于医学培训存在重大隐患。与英伟达利用 AI 视频训练通用任务机器人不同,在医疗领域,此类“幻觉”可能带来严重后果 —— 若 Veo-3 类系统生成看似合理实则违反医学规范的操作视频,或将误导手术机器人或医学生习得错误技术。

结果还表明,当前将视频模型视为“世界模型”(world models)的设想仍过于超前。现有系统仅能模仿表观运动与形态变化,却无法可靠掌握解剖结构、生物力学及手术中的因果逻辑。其输出视频虽具表面说服力,实则无法捕捉手术背后真实的生理机制与操作逻辑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山东外卖小哥见义勇为救火 次日被索赔新灭火器 最新回应:无需赔偿

山东外卖小哥见义勇为救火 次日被索赔新灭火器 最新回应:无需赔偿

双色球的方向舵
2025-11-09 12:35:26
ATP年终总决赛,阿尔卡拉斯两盘击败澳洲一哥

ATP年终总决赛,阿尔卡拉斯两盘击败澳洲一哥

萧壛记录风土人情
2025-11-10 00:13:10
李连杰脱光上衣自证清白后,有网红提出质疑,吃的什么神丹妙药?

李连杰脱光上衣自证清白后,有网红提出质疑,吃的什么神丹妙药?

心静物娱
2025-11-08 11:24:51
美方报道的中国大使馆被炸事件,中国军事顾问团遭重创,秘而不宣

美方报道的中国大使馆被炸事件,中国军事顾问团遭重创,秘而不宣

干史人
2025-10-22 20:10:03
王家卫和李爽的录音大瓜!

王家卫和李爽的录音大瓜!

八卦疯叔
2025-11-09 10:13:44
重磅信号!A股四千点之上央行突然出手,背后是万亿级资金布局

重磅信号!A股四千点之上央行突然出手,背后是万亿级资金布局

单手搓核弹
2025-11-09 11:44:08
29轮仅出场4次!国足后防希望之星惨遭斯帅冷落,沦为中超鸡肋

29轮仅出场4次!国足后防希望之星惨遭斯帅冷落,沦为中超鸡肋

零度眼看球
2025-11-09 09:13:14
4国派兵堵门,不让统一,解放军上演大包围战术,不准南海生乱

4国派兵堵门,不让统一,解放军上演大包围战术,不准南海生乱

阿芒娱乐说
2025-11-10 00:37:32
游乐场里宝妈走光了自己却没察觉?这场景看着尴尬

游乐场里宝妈走光了自己却没察觉?这场景看着尴尬

没有偏旁的常庆
2025-10-31 07:20:21
广西、江西、山西、陕西,哪个未来经济发展更好?

广西、江西、山西、陕西,哪个未来经济发展更好?

牛锅巴小钒
2025-11-10 00:34:09
杭州多地已出现,看见立即上报!切记不要直接动手

杭州多地已出现,看见立即上报!切记不要直接动手

FM93浙江交通之声
2025-11-09 06:03:13
李嘉诚曾和梁洛施私下做交易,不把3个孙子纳入李家,是一种算计

李嘉诚曾和梁洛施私下做交易,不把3个孙子纳入李家,是一种算计

娱乐团长
2025-11-09 14:33:37
富勒姆旧将瑞安-威廉斯:入籍印度是为了完成我外祖父的愿望

富勒姆旧将瑞安-威廉斯:入籍印度是为了完成我外祖父的愿望

懂球帝
2025-11-09 11:26:58
单位通知我被辞退,收拾时主管问我是干啥的,我笑了:明天就知道了

单位通知我被辞退,收拾时主管问我是干啥的,我笑了:明天就知道了

温情邮局
2025-10-29 10:16:06
90天倒闭230家,多地关店老板跑路,毛利高达60%的生意也扛不住了

90天倒闭230家,多地关店老板跑路,毛利高达60%的生意也扛不住了

泠泠说史
2025-10-24 15:44:20
曾被吹上天,如今却跌落神坛的4个国产运动鞋,你穿过哪些?

曾被吹上天,如今却跌落神坛的4个国产运动鞋,你穿过哪些?

诗意世界
2025-08-15 14:26:52
杨振宁院士临终留下的10个字,值得每个人思考!是哪10字?

杨振宁院士临终留下的10个字,值得每个人思考!是哪10字?

凡人侃史
2025-10-20 16:14:55
重庆大拆迁!两江新区清单公布!新机遇来了!

重庆大拆迁!两江新区清单公布!新机遇来了!

阿离家居
2025-11-09 12:38:17
郎咸平:建航母目的是保护055驱逐舰,一艘055大驱能消灭一个舰队

郎咸平:建航母目的是保护055驱逐舰,一艘055大驱能消灭一个舰队

文史旺旺旺
2025-10-27 19:47:09
红军城一丢,捷克扯旗、波兰骂街、美国摆烂:泽连斯基满手是血

红军城一丢,捷克扯旗、波兰骂街、美国摆烂:泽连斯基满手是血

今日养生之道
2025-11-08 15:13:35
2025-11-10 02:07:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
314287文章数 606726关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

陕西男子打晕妻子误以为已死 将人扔下土崖致其死亡

头条要闻

陕西男子打晕妻子误以为已死 将人扔下土崖致其死亡

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

健康
数码
亲子
教育
军事航空

超声探头会加重受伤情况吗?

数码要闻

内存、硬盘价格暴涨到扛不住!铭凡官宣旗下迷你主机涨价

亲子要闻

矫正头盔真的有用吗?

教育要闻

收藏!2026艺术类文化课录取分数线要求

军事要闻

俄媒:俄军即将攻占乌克兰"第三首都"

无障碍浏览 进入关怀版