网易首页 > 网易号 > 正文 申请入驻

研究显示谷歌AI模型Veo-3可伪造手术视频,缺乏实质性医学理解

0
分享至

IT之家 11 月 9 日消息,研究人员用真实的手术录像对谷歌最新视频生成人工智能模型 Veo-3 进行了测试,结果发现该模型虽能生成高度逼真的视觉内容,却严重缺乏对医学操作流程的实质性理解。


研究中,研究人员仅提供单张手术图像作为输入,要求 Veo-3 预测接下来 8 秒内的手术进展。为系统评估其表现,一支国际研究团队构建了名为 SurgVeo 的专用评测基准,涵盖 50 段真实腹腔与脑部手术视频。评估环节由四位经验丰富的外科医生独立完成,从视觉真实性、器械使用合理性、组织反馈表现及操作医学逻辑性四个维度对 AI 生成视频进行打分(满分 5 分)。

Veo-3 生成的视频初看极具欺骗性,部分外科医生甚至评价其画质“令人震惊地清晰”。然而深入分析后,其内容逻辑迅速崩塌:在腹腔手术测试中,模型在 1 秒时的视觉合理性尚达 3.72 分;但一旦涉及医学准确性,得分便大幅下滑 —— 器械操作仅 1.78 分、组织反应仅 1.64 分,而最核心的手术逻辑性评分最低,仅为 1.61 分。模型虽能生成高度拟真的影像,却无法再现真实手术室中应有的操作流程与因果关系



IT之家注意到,在对精细度要求极高的神经外科场景中,Veo-3 表现更为逊色。自第 1 秒起,其即难以把握神经外科所需的精准操作:器械使用得分降至 2.77 分(腹腔手术为 3.36 分),而 8 秒后的手术逻辑性评分更是跌至 1.13 分。

研究团队进一步归类错误类型发现:超 93% 的错误源于医学逻辑层面 —— 例如凭空“发明”不存在的手术器械、虚构违反生理规律的组织反应,或执行在临床上毫无意义的操作;而仅极小比例的错误(腹腔手术 6.2%、脑部手术 2.8%)与图像质量相关。

研究人员尝试为模型提供更多上下文线索(如手术类型、具体操作阶段等),但结果未呈现显著或稳定的改善。团队指出,问题核心并非信息缺失,而在于模型根本缺乏对医学知识的理解与推理能力。

SurgVeo 研究清晰表明:当前视频生成 AI 距离真正的医学理解仍有巨大鸿沟。尽管未来系统或有望用于医生培训、术前规划乃至术中引导,但现有模型远未达到安全、可靠的应用门槛 —— 它们可生成“以假乱真”的影像,却缺乏支撑正确临床决策的知识基础。

研究团队计划将 SurgVeo 基准数据集开源至 GitHub,以推动学界共同提升模型医学理解能力。

该研究亦警示:将此类 AI 生成视频用于医学培训存在重大隐患。与英伟达利用 AI 视频训练通用任务机器人不同,在医疗领域,此类“幻觉”可能带来严重后果 —— 若 Veo-3 类系统生成看似合理实则违反医学规范的操作视频,或将误导手术机器人或医学生习得错误技术。

结果还表明,当前将视频模型视为“世界模型”(world models)的设想仍过于超前。现有系统仅能模仿表观运动与形态变化,却无法可靠掌握解剖结构、生物力学及手术中的因果逻辑。其输出视频虽具表面说服力,实则无法捕捉手术背后真实的生理机制与操作逻辑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
没选上!32岁武大靖宣布退役,无缘米兰冬奥,曾自曝生活不能自理

没选上!32岁武大靖宣布退役,无缘米兰冬奥,曾自曝生活不能自理

李健政观察
2026-01-07 09:26:02
陈慧琳素颜现身美国超市,腮帮子鼓起来了,一笑就看出牙不整齐

陈慧琳素颜现身美国超市,腮帮子鼓起来了,一笑就看出牙不整齐

徐帮阳
2026-01-07 15:30:57
赛季首站跻身八强!王欣瑜两盘激战胜出,晋级奥克兰站1/4决赛

赛季首站跻身八强!王欣瑜两盘激战胜出,晋级奥克兰站1/4决赛

全景体育V
2026-01-07 15:03:38
平民教练执掌切尔西,能否逃过波特的命运?

平民教练执掌切尔西,能否逃过波特的命运?

足球周刊
2026-01-07 11:08:15
威少毫无借口,德罗赞话里有话!状元带好消息,克莱两人也真该批

威少毫无借口,德罗赞话里有话!状元带好消息,克莱两人也真该批

鱼崖大话篮球
2026-01-07 16:17:54
美国绑架马杜罗后,郑丽文只说了几句话,就让赖清德心跌到谷底

美国绑架马杜罗后,郑丽文只说了几句话,就让赖清德心跌到谷底

聚焦热点直击
2026-01-07 09:05:48
流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

潇湘晨报
2026-01-06 17:20:18
1962年雷锋因公殉职,41年后调查人员揭露真相,令人泪目!

1962年雷锋因公殉职,41年后调查人员揭露真相,令人泪目!

抽象派大师
2025-12-22 01:46:01
筱梅湾湾办节日家宴!箖箖和玥儿露正脸!玥儿坐在那神态太像大S

筱梅湾湾办节日家宴!箖箖和玥儿露正脸!玥儿坐在那神态太像大S

锋哥与八卦哥
2026-01-06 16:03:26
美司令曾警告:若大陆武力收台,美军将摧毁中方火箭军和核武库!

美司令曾警告:若大陆武力收台,美军将摧毁中方火箭军和核武库!

壹知眠羊
2025-12-21 07:15:19
CBA大结局,北京队接触NBA冠军中锋,联手周琦打爆广东广厦

CBA大结局,北京队接触NBA冠军中锋,联手周琦打爆广东广厦

宗介说体育
2026-01-07 16:43:49
中美达成默契共识,委内瑞拉要交给关键人物?马杜罗后手让人为难

中美达成默契共识,委内瑞拉要交给关键人物?马杜罗后手让人为难

花寒弦絮
2026-01-07 16:49:14
“流氓作家”贾平凹语出惊人:跟睡过的女人比暧昧的女人更有感觉

“流氓作家”贾平凹语出惊人:跟睡过的女人比暧昧的女人更有感觉

百态人间
2026-01-04 16:18:53
顺差一万亿美元你知道是啥概念不?放200年前八国联军早到家门口

顺差一万亿美元你知道是啥概念不?放200年前八国联军早到家门口

沈言论
2025-12-21 11:50:03
马筱梅晒孕晚期状态,肚子光滑没长纹,一餐五菜两汤,拍了孕妇照

马筱梅晒孕晚期状态,肚子光滑没长纹,一餐五菜两汤,拍了孕妇照

非常先生看娱乐
2026-01-07 10:35:17
这三国向全球发出警告:谁动我兄弟就灭谁!如今却把枪口对准中国

这三国向全球发出警告:谁动我兄弟就灭谁!如今却把枪口对准中国

青田花姑娘
2025-12-16 17:50:51
武汉大学女教授献血事件,它们的行为不翻车都难

武汉大学女教授献血事件,它们的行为不翻车都难

吴女士
2026-01-07 12:44:51
周迅,陈红对他一见倾心,一生未婚未育,如今65岁在乡下养猫种花

周迅,陈红对他一见倾心,一生未婚未育,如今65岁在乡下养猫种花

青史楼兰
2026-01-07 09:41:28
深圳要率先取消中考?

深圳要率先取消中考?

Dr小鱼
2026-01-07 10:11:23
一个日本人说她又来到了最爱的中国……

一个日本人说她又来到了最爱的中国……

日本物语
2026-01-06 11:02:41
2026-01-07 17:36:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
323362文章数 606866关注度
往期回顾 全部

科技要闻

豪掷世界第一"球" 杨元庆亮出联想AI护城河

头条要闻

中方被问是否计划采取行动帮助马杜罗夫妇 外交部回应

头条要闻

中方被问是否计划采取行动帮助马杜罗夫妇 外交部回应

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

蔚来2025百万台收官 一场迟到的自我修复

态度原创

亲子
时尚
健康
房产
军事航空

亲子要闻

帮忙带娃被网暴后续,小姑子晒出多张证据,亲戚透露更多内情

看起来很好亲的唇,能养出来?

这些新疗法,让化疗不再那么痛苦

房产要闻

海珠双冠王!中交天翠以强兑现力+生活温度,筑就长期主义产品

军事要闻

特朗普政府正在讨论获取格陵兰岛的方案 包括军事选项

无障碍浏览 进入关怀版