网易首页 > 网易号 > 正文 申请入驻

研究显示谷歌AI模型Veo-3可伪造手术视频,缺乏实质性医学理解

0
分享至

IT之家 11 月 9 日消息,研究人员用真实的手术录像对谷歌最新视频生成人工智能模型 Veo-3 进行了测试,结果发现该模型虽能生成高度逼真的视觉内容,却严重缺乏对医学操作流程的实质性理解。


研究中,研究人员仅提供单张手术图像作为输入,要求 Veo-3 预测接下来 8 秒内的手术进展。为系统评估其表现,一支国际研究团队构建了名为 SurgVeo 的专用评测基准,涵盖 50 段真实腹腔与脑部手术视频。评估环节由四位经验丰富的外科医生独立完成,从视觉真实性、器械使用合理性、组织反馈表现及操作医学逻辑性四个维度对 AI 生成视频进行打分(满分 5 分)。

Veo-3 生成的视频初看极具欺骗性,部分外科医生甚至评价其画质“令人震惊地清晰”。然而深入分析后,其内容逻辑迅速崩塌:在腹腔手术测试中,模型在 1 秒时的视觉合理性尚达 3.72 分;但一旦涉及医学准确性,得分便大幅下滑 —— 器械操作仅 1.78 分、组织反应仅 1.64 分,而最核心的手术逻辑性评分最低,仅为 1.61 分。模型虽能生成高度拟真的影像,却无法再现真实手术室中应有的操作流程与因果关系



IT之家注意到,在对精细度要求极高的神经外科场景中,Veo-3 表现更为逊色。自第 1 秒起,其即难以把握神经外科所需的精准操作:器械使用得分降至 2.77 分(腹腔手术为 3.36 分),而 8 秒后的手术逻辑性评分更是跌至 1.13 分。

研究团队进一步归类错误类型发现:超 93% 的错误源于医学逻辑层面 —— 例如凭空“发明”不存在的手术器械、虚构违反生理规律的组织反应,或执行在临床上毫无意义的操作;而仅极小比例的错误(腹腔手术 6.2%、脑部手术 2.8%)与图像质量相关。

研究人员尝试为模型提供更多上下文线索(如手术类型、具体操作阶段等),但结果未呈现显著或稳定的改善。团队指出,问题核心并非信息缺失,而在于模型根本缺乏对医学知识的理解与推理能力。

SurgVeo 研究清晰表明:当前视频生成 AI 距离真正的医学理解仍有巨大鸿沟。尽管未来系统或有望用于医生培训、术前规划乃至术中引导,但现有模型远未达到安全、可靠的应用门槛 —— 它们可生成“以假乱真”的影像,却缺乏支撑正确临床决策的知识基础。

研究团队计划将 SurgVeo 基准数据集开源至 GitHub,以推动学界共同提升模型医学理解能力。

该研究亦警示:将此类 AI 生成视频用于医学培训存在重大隐患。与英伟达利用 AI 视频训练通用任务机器人不同,在医疗领域,此类“幻觉”可能带来严重后果 —— 若 Veo-3 类系统生成看似合理实则违反医学规范的操作视频,或将误导手术机器人或医学生习得错误技术。

结果还表明,当前将视频模型视为“世界模型”(world models)的设想仍过于超前。现有系统仅能模仿表观运动与形态变化,却无法可靠掌握解剖结构、生物力学及手术中的因果逻辑。其输出视频虽具表面说服力,实则无法捕捉手术背后真实的生理机制与操作逻辑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马卡:吕迪格很可能缺席决赛,罗德里戈和阿森西奥还需检查

马卡:吕迪格很可能缺席决赛,罗德里戈和阿森西奥还需检查

懂球帝
2026-01-09 14:50:10
名将有后!前国羽一姐高调宣布怀孕,曾两夺世界冠军可惜25岁退役

名将有后!前国羽一姐高调宣布怀孕,曾两夺世界冠军可惜25岁退役

揽星河的笔记
2026-01-08 18:24:10
10余位村民采石修路工资被村委会拖欠18年,有人至死未领到;镇党委书记:立即核实,争取逐步支付

10余位村民采石修路工资被村委会拖欠18年,有人至死未领到;镇党委书记:立即核实,争取逐步支付

大风新闻
2026-01-09 12:48:08
“明天再来吧,我得接孙子了!”北京“刻小猫章的大爷”火了,但他有点茫然……

“明天再来吧,我得接孙子了!”北京“刻小猫章的大爷”火了,但他有点茫然……

环球网资讯
2026-01-08 14:25:20
夫妻性生活:女人最讨厌的5种“床上行为”,男人千万别犯!

夫妻性生活:女人最讨厌的5种“床上行为”,男人千万别犯!

精彩分享快乐
2025-11-25 00:05:03
被约基奇掩盖的超级后卫!两战49分33助,当代纳什,2亿真不贵

被约基奇掩盖的超级后卫!两战49分33助,当代纳什,2亿真不贵

你的篮球频道
2026-01-09 09:13:40
少报2岁,王楚钦年龄造假?尘埃落定,妈妈亲笔信日期曝光

少报2岁,王楚钦年龄造假?尘埃落定,妈妈亲笔信日期曝光

乐聊球
2026-01-08 12:36:52
委临时总统最新发声:不从属也不屈从于美国

委临时总统最新发声:不从属也不屈从于美国

参考消息
2026-01-09 14:39:28
知名学者、211大学副教授病逝,年仅48岁

知名学者、211大学副教授病逝,年仅48岁

双一流高校
2026-01-08 20:39:21
被曝有私生女!成人女星携视频实锤锡安,网友:他比哈登还重口

被曝有私生女!成人女星携视频实锤锡安,网友:他比哈登还重口

听我说球
2026-01-08 08:47:49
医生发现:每天饭后要午睡的人,不出3个月,身体或有4种改变!

医生发现:每天饭后要午睡的人,不出3个月,身体或有4种改变!

岐黄传人孙大夫
2026-01-08 10:35:44
摊牌了!中国国防部重磅表态:全员待命,是时候给他们点颜色看了

摊牌了!中国国防部重磅表态:全员待命,是时候给他们点颜色看了

小lu侃侃而谈
2026-01-05 19:09:18
伊朗大范围断网,特朗普再度威胁

伊朗大范围断网,特朗普再度威胁

第一财经资讯
2026-01-09 15:26:24
解说:开拓者最适合杨瀚森 管理层重视 斯普利特对杨瀚森也算负责

解说:开拓者最适合杨瀚森 管理层重视 斯普利特对杨瀚森也算负责

砚底沉香
2026-01-09 15:24:05
被垫脚!再见了,伦纳德

被垫脚!再见了,伦纳德

刘笤说体坛
2026-01-09 13:00:45
韩国总统李在明将于13日访日并与日本首相高市早苗举行会面!

韩国总统李在明将于13日访日并与日本首相高市早苗举行会面!

AI商业论
2026-01-09 10:49:02
57岁伊能静晒泳装蜂腰翘臀,胸部打码引秦昊生理性心动

57岁伊能静晒泳装蜂腰翘臀,胸部打码引秦昊生理性心动

王投吃吃喝喝
2026-01-08 00:15:39
乌美安全协议基本就绪 俄指认“战争轴心”

乌美安全协议基本就绪 俄指认“战争轴心”

新华社
2026-01-09 07:35:09
0-2大逆转!蒯曼再战张本美和,多哈上演中日新锐对决

0-2大逆转!蒯曼再战张本美和,多哈上演中日新锐对决

阿晞体育
2026-01-08 13:27:29
凯特王妃的 “新年战袍” 太绝了!枣红西装 ,美得很有力量感

凯特王妃的 “新年战袍” 太绝了!枣红西装 ,美得很有力量感

述家娱记
2026-01-09 10:37:09
2026-01-09 16:07:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
323739文章数 606872关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

"老板"拉群开口就要150万 女财务付100万后感觉天塌了

头条要闻

"老板"拉群开口就要150万 女财务付100万后感觉天塌了

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

檀健次恋爱风波越演越烈 上学经历被扒

财经要闻

郁亮的万科35年:从"宝万之争"到"活下去"

汽车要闻

英伟达的野心:做一套自动驾驶的“安卓系统”

态度原创

手机
游戏
房产
旅游
军事航空

手机要闻

摩根大通正式接替高盛,成为苹果Apple Card发卡机构

马丁构想大变样 宫崎英高称其或惊讶于《艾尔登法环》

房产要闻

豪宅抢疯、刚需捡漏……2025年,一张房票改写了广州市场格局

旅游要闻

“冷资源”迸发“热动能” 冰雪季成为经济增长“黄金季”

军事要闻

特朗普:已开始从委石油资源中赚钱

无障碍浏览 进入关怀版