网易首页 > 网易号 > 正文 申请入驻

Utopai联手LG、中东主权基金加码韩娱,新模型颠覆AI视频格局!

0
分享至

机器之心发布

机器之心编辑部

当 Sora 2、Google Veo 3 还在卷短视频逼真度,AI 影视的下一站该是长片叙事了?

在 AI 视频生成技术日新月异的今天,主流模型如 Sora 2、Google Veo 3 等已能生成视觉惊艳的短视频片段,但想要创作长视频甚至是影视作品时,AI 模型似乎开始变得力不从心。

然而,在好莱坞,一家 AI 影视公司却已经拔地而起,开始将 AI 影视生成技术从模型验证推向大规模产业化。

11 月 3 日,据 Deadline 报道,AI 原生影视工作室 Utopai Studios 与全球创新投资平台 Stock Farm Road(SFR)宣布成立资本规模达数十亿美元的合资公司 Utopai East,以加速韩国影视的国际化进程。

SFR 背后,一面是 LG 集团继承人 Brian Koo,另一面是阿联酋主权基金推动者 Amin Badr-El-Din。



报道显示,此次合作中 Utopai Studios 将成为 SFR 在娱乐领域的独家 AI 技术合作伙伴,依托 SFR 在韩国规划的 350 亿美元 AI 数据中心枢纽,构建下一代影视制作基础设施。



在这场以韩娱为核心的产业协同背后,隐藏着 Utopai 希望系统性攻克的关键命题:如何让 AI 真正理解并驾驭影视长片的叙事逻辑,进而实现从「短片生成」到 「长片制作」的工业级跨越?



视频链接:https://mp.weixin.qq.com/s/ACTi_DYghRP2rFKSungTeQ

核心问题:为何传统视频模型难以驾驭长片制作?

目前主流视频生成模型(如 Diffusion)的本质还是概率性生成器,它们逐帧或短片段独立生成视频,缺乏对长叙事逻辑的全局规划能力。

当视频生成目标从「生成片段」升级为「制作长片」时,Diffusion 模型的短板开始凸显:

  • 长程一致性崩塌:角色外貌、场景元素在跨镜头时容易出现「漂移」,例如服装颜色突变、人物外貌畸变等。
  • 叙事可控性不足:模型难以理解剧本中的因果链条(如情绪的递进转换),生成的内容往往与导演意图偏离。
  • 物理合理性缺失:模型仅学习 2D 像素统计规律,缺乏对三维空间遮挡、碰撞等规则的认知,易产生反物理的「幻觉」。

Utopai 带来的解决方案则是直击痛点 ——不再追求单一模型的极致优化,而是通过架构重组,让不同模型各司其职。

技术架构:规划与渲染解耦的协同范式

Utopai 在技术上的重要创新是构建了分层协同架构,其中自回归模型(AR)负责「规划」,扩散模型(Diffusion)负责「渲染」,二者通过统一状态空间耦合。

1.规划层:自回归模型作为「导演大脑」

  • 序列预测机制:AR 模型以剧本为输入,通过前帧预测后帧的机制,生成涵盖角色 ID 向量、摄像机轨迹、光影变化等要素的时空计划。该计划本质是一个机器可执行的「拍摄蓝图」,确保长达数十分钟的片长中元素演进逻辑保持一致。
  • 状态记忆与因果推理:模型能够维护可回放的长程状态记忆,例如追踪角色从第 1 镜到第 50 镜的动作轨迹,避免传统模型因局部生成导致的逻辑断裂。

2.渲染层:扩散模型作为「执行引擎」

  • 条件化生成:扩散模型不再随机「抽卡」,而是严格依据规划层输出的结构化指令(如深度图、光流信号)生成画面。例如,当规划层指定「摄像机以俯角拍摄雨夜小巷」 时,扩散模型就会据此渲染细节。
  • 物理规律注入:通过训练时引入带精确标注的 3D 合成数据,模型学习空间遮挡、材质反射等规则,避免生成内容违反重力或碰撞逻辑。

3.协同接口:统一状态空间

  • 规划层与渲染层通过统一状态空间交换信息:规划器输出未来帧的几何与语义约束,渲染器据此生成像素,并反馈生成结果供规划器优化后续计划。这一闭环解决了扩散模型「生成即遗忘」的缺陷。

简单来说,Utopai 的突破就在于构建了一种融合自回归模型与扩散模型的协同架构,通过「规划 — 渲染」解耦的协同范式,将 AI 从「画面生成工具」升级为「叙事协作伙伴」。

训练方法论:从 2D 统计到 3D 物理规律的跃迁

Utopai 模型能力的基石是其独特的训练策略,训练的核心是用 3D 物理规律替代 2D 像素统计。

1.预训练阶段:几何与语义对齐

通过使用高质量 3D 合成数据(如虚拟城市、动态物体),训练模型去理解场景的深度信息,如材质属性、运动轨迹等,而非仅学习网络视频的像素分布;通过构建「下一状态预测」「掩码重建」等任务,强制模型推理物体遮挡关系(如角色绕过桌椅而非穿模)。

2.微调阶段:多模态指令遵循

在这一阶段,引入剧本、分镜等专业数据,训练模型将抽象指令(如「史诗感」)转化为具体视觉元素(如低角度镜头、暖色调光影)。

这样的训练方式使模型能处理复杂指令,例如当要求角色「由怀疑转为恍然大悟」时,模型能够协调人物角色的面部微表情、肢体语言、镜头焦距的同步变化,而非简单替换表情贴图。

可量化的技术优势:定义 AI 电影叙事的新指标

当前 AI 视频领域的通用指标(如 FVD、CLIP Score)主要衡量视觉逼真度和文本符合度,但无法有效评估「叙事质量」。

Utopai 的核心优势之一,正是建立一套基于专业影视标准的内部评估体系,其在三个维度超越传统方案:

1.一致性指标

相较于通用模型在几秒后可能出现角色特征「漂移」的现象,Utopai 的系统旨在跨越数十甚至上百个镜头,仍然稳定保持核心角色身份、场景布景和光影逻辑的连续性。这种一致性不是简单的「不变化」,而是按照叙事逻辑的「合理演进」。

2.剧本指令遵从度

Utopai 能够量化生成内容与复杂剧本指令的匹配程度。例如,当剧本要求「角色从犹豫转为决绝」时,AI 模型能通过姿态、视线、镜头语言与光影的协同变化,呈现出符合表演逻辑的情感转变,而非生硬的表情切换。

3.制作效率的跃升

这样的架构能极大优化专业影视制作的前期流程,导演可通过修改时空计划(如调整摄像机轨迹)精准控制生成结果,无需反复「抽卡」,将创意迭代周期从数周缩短至几天。

Utopai 的实践揭示了一条代表范式转变的技术路径:影视级 AI 模型的未来不是替代 Diffusion 或 AR,而是通过架构创新实现专业化分工。

在这里,AI 不再是辅助工具,而是能够理解导演愿景、具备电影级思维的真实创作伙伴。

正如 Utopai 创始人兼 CEO Cecilia Shen 所言:「AI 可以生成无穷选项,但定义品味的永远是会讲故事和有艺术审美的人。」

而此次合作也不仅是资本层面的联手,更是以韩国为战略枢纽,整合 AI 技术、算力基建与内容生态的系统性布局。

当技术的成本壁垒被 AI 击穿,电影制作的未来将更多地取决于想象力的边界,而非预算的多少。那些曾因「拍不起」而被搁置的宏大叙事,或许正奔跑着拥抱 AI 影视,阔步走向好莱坞大荧幕。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
去了一次上海和平饭店,我才明白什么叫“贫穷限制了想象”!

去了一次上海和平饭店,我才明白什么叫“贫穷限制了想象”!

诗意世界
2025-11-05 22:33:13
周琦全运会奖金受损,季军战失利再扣,最高仅得310万

周琦全运会奖金受损,季军战失利再扣,最高仅得310万

徐醇老表哥
2025-11-12 11:42:26
奉陪到底!联合国爆发激战,中方开始算总账,第一个就要收拾美国

奉陪到底!联合国爆发激战,中方开始算总账,第一个就要收拾美国

坠入二次元的海洋
2025-11-12 11:40:10
荒野求生成员体检单出炉!网友最看好建哥建弟:荒野技能可得满分

荒野求生成员体检单出炉!网友最看好建哥建弟:荒野技能可得满分

星河也灿烂
2025-11-12 10:59:23
天呐!刘亦菲妈妈被偶遇,都65岁了,还是美得不像话!太让人羡慕

天呐!刘亦菲妈妈被偶遇,都65岁了,还是美得不像话!太让人羡慕

陈意小可爱
2025-11-12 11:17:31
全运会乒乓:女单8强赛对阵出炉,蒯曼朱雨玲苦战,孙颖莎对手强

全运会乒乓:女单8强赛对阵出炉,蒯曼朱雨玲苦战,孙颖莎对手强

禾寒叙
2025-11-11 15:33:09
世预赛开战 6天之内:欧洲11队直通世界杯 5队赢球=提前出线

世预赛开战 6天之内:欧洲11队直通世界杯 5队赢球=提前出线

叶青足球世界
2025-11-12 08:39:06
“闹腾”过头了!新能源汽车被踢出“十五五”,上头彻底失望了?

“闹腾”过头了!新能源汽车被踢出“十五五”,上头彻底失望了?

小李车评李建红
2025-11-11 07:39:46
她这大体格真绝了,目测身高180,这才是无数人心中的女神形象

她这大体格真绝了,目测身高180,这才是无数人心中的女神形象

TVB的四小花
2025-11-12 06:53:38
最近吵得沸沸扬扬的西安暖气空置费,到底应不应该缴

最近吵得沸沸扬扬的西安暖气空置费,到底应不应该缴

螺丝钉的咖啡时间
2025-11-12 10:27:28
去了浙江才发现,电线早已不埋墙里了!瞧人家这么设计,真是先进

去了浙江才发现,电线早已不埋墙里了!瞧人家这么设计,真是先进

阿离家居
2025-11-11 13:12:24
44岁郭晶晶任全运会火炬手,扎高马尾淡妆出镜,霍震霆坐贵宾席一脸自豪

44岁郭晶晶任全运会火炬手,扎高马尾淡妆出镜,霍震霆坐贵宾席一脸自豪

喜欢历史的阿繁
2025-11-12 04:48:18
男星大张伟自曝在欧洲遭砸车:能够着的全偷走了,以为节目组故意整蛊;当地警察称“你应该带着行李逛街”,调监控要花约4.1万元

男星大张伟自曝在欧洲遭砸车:能够着的全偷走了,以为节目组故意整蛊;当地警察称“你应该带着行李逛街”,调监控要花约4.1万元

极目新闻
2025-11-12 10:16:09
细思极恐!祖院长和曾主任背后有一位没露面的“高手”!

细思极恐!祖院长和曾主任背后有一位没露面的“高手”!

甜柠聊史
2025-11-12 08:35:01
人事把我开除了,临走前问我还有什么想说的,我:被开除的是你

人事把我开除了,临走前问我还有什么想说的,我:被开除的是你

小秋情感说
2025-11-02 14:17:32
县委书记被双规,他的妻子去找市委书记,不久县委书记官复原职

县委书记被双规,他的妻子去找市委书记,不久县委书记官复原职

乔生桂
2024-08-28 10:45:06
人心不足蛇吞象,赵薇突传消息,因胃癌去世5个月前已真相大白

人心不足蛇吞象,赵薇突传消息,因胃癌去世5个月前已真相大白

广西阿妹香香
2025-11-11 12:09:41
李鹏总理儿媳罕见留影,五官端正长相大气,爷爷功勋卓著比肩元帅

李鹏总理儿媳罕见留影,五官端正长相大气,爷爷功勋卓著比肩元帅

混沌录
2025-11-11 22:06:07
法媒:泽连斯基亲信卷入腐败大案

法媒:泽连斯基亲信卷入腐败大案

参考消息
2025-11-12 12:23:02
东汉历史上最搞笑的政变:废太子带着十几个宦官,就成功夺权登基

东汉历史上最搞笑的政变:废太子带着十几个宦官,就成功夺权登基

铭记历史呀
2025-11-11 15:42:04
2025-11-12 12:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11696文章数 142502关注度
往期回顾 全部

科技要闻

Meta"宫斗"持续,AI教父杨立昆被"气"走了

头条要闻

国台办发言人读赖氏家庙祖训:怕他没听清 我再念一遍

头条要闻

国台办发言人读赖氏家庙祖训:怕他没听清 我再念一遍

体育要闻

太阳三连胜&活塞东部第一 哪个更想不到

娱乐要闻

辛芷蕾配得上威尼斯影后吗?

财经要闻

专家建议设立5万亿房地产稳定基金

汽车要闻

能得到央视的肯定 长安马自达EZ-60可不简单

态度原创

艺术
健康
数码
教育
军事航空

艺术要闻

毛主席珍贵签名照曝光,鲜为人知的历史瞬间!

血液科专家揭秘白血病七大误区

数码要闻

微软史上销量最惨淡产品:仅售出 11 套,还被退回 8 套

教育要闻

贵阳21所高中“比武”竞技!国防教育与体育融合,点燃青年爱国强军梦

军事要闻

空军发布重磅视频 多款新型战机亮相

无障碍浏览 进入关怀版