网易首页 > 网易号 > 正文 申请入驻

研究显示谷歌AI模型Veo-3可伪造手术视频,缺乏实质性医学理解

0
分享至

IT之家 11 月 9 日消息,研究人员用真实的手术录像对谷歌最新视频生成人工智能模型 Veo-3 进行了测试,结果发现该模型虽能生成高度逼真的视觉内容,却严重缺乏对医学操作流程的实质性理解。


研究中,研究人员仅提供单张手术图像作为输入,要求 Veo-3 预测接下来 8 秒内的手术进展。为系统评估其表现,一支国际研究团队构建了名为 SurgVeo 的专用评测基准,涵盖 50 段真实腹腔与脑部手术视频。评估环节由四位经验丰富的外科医生独立完成,从视觉真实性、器械使用合理性、组织反馈表现及操作医学逻辑性四个维度对 AI 生成视频进行打分(满分 5 分)。

Veo-3 生成的视频初看极具欺骗性,部分外科医生甚至评价其画质“令人震惊地清晰”。然而深入分析后,其内容逻辑迅速崩塌:在腹腔手术测试中,模型在 1 秒时的视觉合理性尚达 3.72 分;但一旦涉及医学准确性,得分便大幅下滑 —— 器械操作仅 1.78 分、组织反应仅 1.64 分,而最核心的手术逻辑性评分最低,仅为 1.61 分。模型虽能生成高度拟真的影像,却无法再现真实手术室中应有的操作流程与因果关系



IT之家注意到,在对精细度要求极高的神经外科场景中,Veo-3 表现更为逊色。自第 1 秒起,其即难以把握神经外科所需的精准操作:器械使用得分降至 2.77 分(腹腔手术为 3.36 分),而 8 秒后的手术逻辑性评分更是跌至 1.13 分。

研究团队进一步归类错误类型发现:超 93% 的错误源于医学逻辑层面 —— 例如凭空“发明”不存在的手术器械、虚构违反生理规律的组织反应,或执行在临床上毫无意义的操作;而仅极小比例的错误(腹腔手术 6.2%、脑部手术 2.8%)与图像质量相关。

研究人员尝试为模型提供更多上下文线索(如手术类型、具体操作阶段等),但结果未呈现显著或稳定的改善。团队指出,问题核心并非信息缺失,而在于模型根本缺乏对医学知识的理解与推理能力。

SurgVeo 研究清晰表明:当前视频生成 AI 距离真正的医学理解仍有巨大鸿沟。尽管未来系统或有望用于医生培训、术前规划乃至术中引导,但现有模型远未达到安全、可靠的应用门槛 —— 它们可生成“以假乱真”的影像,却缺乏支撑正确临床决策的知识基础。

研究团队计划将 SurgVeo 基准数据集开源至 GitHub,以推动学界共同提升模型医学理解能力。

该研究亦警示:将此类 AI 生成视频用于医学培训存在重大隐患。与英伟达利用 AI 视频训练通用任务机器人不同,在医疗领域,此类“幻觉”可能带来严重后果 —— 若 Veo-3 类系统生成看似合理实则违反医学规范的操作视频,或将误导手术机器人或医学生习得错误技术。

结果还表明,当前将视频模型视为“世界模型”(world models)的设想仍过于超前。现有系统仅能模仿表观运动与形态变化,却无法可靠掌握解剖结构、生物力学及手术中的因果逻辑。其输出视频虽具表面说服力,实则无法捕捉手术背后真实的生理机制与操作逻辑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
市井、病榻与战场,晚清影像里的时代肌理

市井、病榻与战场,晚清影像里的时代肌理

历史小破站
2025-12-17 05:00:03
小鹏汽车高层再变动:传副总裁陈永海离职 王凤英暂代

小鹏汽车高层再变动:传副总裁陈永海离职 王凤英暂代

环球网资讯
2026-01-05 11:31:42
深圳人炸锅!深圳前海扩容升级,周边区域价值飙升!

深圳人炸锅!深圳前海扩容升级,周边区域价值飙升!

小陆搞笑日常
2026-01-05 14:11:17
中美迎来第3个历史转折点?抓完马杜罗后,特朗普马上喊话中国

中美迎来第3个历史转折点?抓完马杜罗后,特朗普马上喊话中国

荐史
2026-01-04 16:33:30
美媒:受委内瑞拉局势影响,莱昂纳多无法返回加州参加电影节颁奖礼

美媒:受委内瑞拉局势影响,莱昂纳多无法返回加州参加电影节颁奖礼

环球网资讯
2026-01-04 20:36:03
俄大将坐镇委内瑞拉沦为摆设,马杜罗被抓走后,还不知道怎么回事

俄大将坐镇委内瑞拉沦为摆设,马杜罗被抓走后,还不知道怎么回事

爱史纪
2026-01-05 04:14:27
36岁便慷慨就义的瞿秋白,建国后毛主席为何会有 “以后少纪念他” 这样的评价?

36岁便慷慨就义的瞿秋白,建国后毛主席为何会有 “以后少纪念他” 这样的评价?

桃烟读史
2025-12-31 21:38:26
马卡:卡马文加兼具硬度和活力,居莱尔对比之下还是替补最好

马卡:卡马文加兼具硬度和活力,居莱尔对比之下还是替补最好

懂球帝
2026-01-05 13:25:36
山东两地迎来新任区委书记

山东两地迎来新任区委书记

滨州日报
2026-01-05 09:42:18
向太曝马伊琍已再婚:当年文章过不了心理那关

向太曝马伊琍已再婚:当年文章过不了心理那关

娱乐看阿敞
2025-12-12 15:50:00
我妈90岁还能生活自理,她的长寿秘诀就一句:“别老想着走动”

我妈90岁还能生活自理,她的长寿秘诀就一句:“别老想着走动”

蝉吟槐蕊
2025-12-28 14:32:30
“帮领导买东西,领导问:“多少钱?我转给你”,千万别说“没多少钱,不用了”,聪明人这样回复!

“帮领导买东西,领导问:“多少钱?我转给你”,千万别说“没多少钱,不用了”,聪明人这样回复!

上海约饭局
2026-01-04 20:41:57
赵本山:我拯救了一个恶毒女人的演艺生涯,她却忘恩负义踩我上位

赵本山:我拯救了一个恶毒女人的演艺生涯,她却忘恩负义踩我上位

芳芳历史烩
2025-07-23 17:53:28
“装B”到无懈可击是什么体验?这哥们,装得老天爷都看不下去了

“装B”到无懈可击是什么体验?这哥们,装得老天爷都看不下去了

滑稽斑马呀
2025-12-28 18:04:18
施工难、管理难、资金难?4G免布线云门禁,破解老旧小区改造困局

施工难、管理难、资金难?4G免布线云门禁,破解老旧小区改造困局

ZUU中优门禁
2026-01-05 16:55:10
年薪50万被妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

年薪50万被妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

好贤观史记
2026-01-04 18:36:13
再见,程序员!马斯克宣判:奇点就在2026

再见,程序员!马斯克宣判:奇点就在2026

新智元
2026-01-05 11:23:24
男星得奖太嗨「台上敲断奖杯」!吓到两眼瞪大 全场瞬间尴尬

男星得奖太嗨「台上敲断奖杯」!吓到两眼瞪大 全场瞬间尴尬

ETtoday星光云
2026-01-05 13:54:04
小米汽车今年交付目标55万辆!雷军回应“小字营销”:行业陋习,马上就改!辟谣“小米不让农民卖小米”

小米汽车今年交付目标55万辆!雷军回应“小字营销”:行业陋习,马上就改!辟谣“小米不让农民卖小米”

每日经济新闻
2026-01-04 00:11:07
广州一经营20余年韩资工厂宣布解散

广州一经营20余年韩资工厂宣布解散

微微热评
2026-01-05 00:20:46
2026-01-05 17:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
322914文章数 606862关注度
往期回顾 全部

科技要闻

雷军新年首播:确认汽车业务降速

头条要闻

主持马杜罗庭审的法官披露 今年92岁

头条要闻

主持马杜罗庭审的法官披露 今年92岁

体育要闻

41岁詹皇26+10+6又迎里程碑 湖媒赞GOAT

娱乐要闻

黄宗泽夺双料视帝,泪洒颁奖台忆往昔

财经要闻

李迅雷:扩内需要把重心从"投"转向"消"

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

手机
旅游
数码
本地
公开课

手机要闻

元旦“国补”拉动手机销量同比增长16.2%

旅游要闻

引客流促消费 泉州文旅多元焕新显活力

数码要闻

消息称英伟达计划复产RTX 3060,应对DRAM短缺与玩家需求

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版