![]()
AI视频现在能画出以假乱真的画面,却搞不定一只正常走动的钟。研究人员发现,主流视频生成模型——包括Runway、Pika、可灵在内——生成的时钟不是指针乱飞,就是数字排列成外星文,甚至出现"88:77"这种人类看了窒息的时间。
这个问题被业内称为"隐形坏钟"。它不像画面崩坏那么显眼,观众潜意识觉得"哪里不对",却说不清原因。类比一下:就像餐厅装修奢华,但服务员递来的菜单上日期印错了——信任感瞬间漏了个洞。
问题根源在于训练数据的偷懒。模型学的是"钟大概长这样",而非"钟必须遵守物理规则"。OpenAI前研究员Andrej Karpathy曾吐槽:「视频模型对时间的理解,堪比醉汉对直线的认知。」
更扎心的是修复难度。给模型加"时钟约束"不难,难的是用户不会只为看对时间而多等30秒渲染。目前Runway已在内部测试物理一致性模块,但上线时间未定——毕竟,比起时钟准不准,大家更想先让AI画出6根手指的人。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.