网易首页 > 网易号 > 正文 申请入驻

可灵 O1:多模态视频创作的“大一统时刻”终于到来

0
分享至


营销快讯

当所有内容平台都在谈论“AI 视频的下一秒”,可灵 O1 的出现让这句口号第一次有了真正的技术感落地。它不是一个新功能,也不是单一模型能力的升级,而是一种创作范式的重构——一个从语义理解到视频生产全链路统一的“大一统多模态引擎”。它试图回答的问题并不新鲜:视频创作为什么仍然复杂、碎片、割裂?而它提供的答案,则是以 MVL(Multi-modal Visual Language,多模态视觉语言)为底层逻辑,把一切创作行为都收束到“理解指令”这一核心动作之上。

在可灵 O1 的语境里,用户上传的图片、视频、文字、角色、场景都不再是“素材”,而是语义矩阵的一部分。模型不再区分模态类型,而是像一个真正理解镜头语言的导演,把所有输入视为指令,并在同一个推理体系内完成从生成到编辑的全部过程——不跳模型、不切工具,也无需在多个任务间重新建立语境。一个创作者提出的“换天空、删路人、保持角色一致”在过去意味着复杂的 masking、跟踪、调色与补帧,而在这里,它只是一次对话。



这正是“大一统”的力量。

可灵 O1 将参考生视频、文生视频、首尾帧生成、内容增删、风格重绘、镜头延展等任务拉入同一条语义链,使得视频的生成与编辑不再呈现工具碎片化,而更像是一段连续叙事。创作者不必为了一个效果在不同 App、插件和工作流之间切换,技术障碍也不再成为创意边界的上限。

最令人着迷的是可灵 O1 对“主体一致性”的处理方式。在 AI 视频迟迟无法进入专业生产体系的诸多原因中,这一项几乎是最核心的阻碍——角色变脸、道具变形、场景跳变,一直是行业无法接受的硬伤。可灵 O1 在底层重建了对图像和视频的深层理解,能够像导演一样记住主角的脸、衣服的纹理、灯光的方向,甚至记住场景里的道具如何在镜头之间延续。更复杂的多主体场景,它也可以独立锁定每个人物的特征并保持稳定,让群像戏第一次有了可规模化生成的可能。

对创作者来说,这种理解力意味着一种全新的指令尺度:不再是“把这个区域换成×××”,而是“让黄昏更柔和一些”“把主角的衣服换成黑色”“沿着这条街道往前三秒”。AI 不再是修图工具,而变成能听懂语义、读懂镜头、把控风格的“影片实现者”。

可灵 O1 最大胆的变化之一,是把叙事时长的控制权也交还给用户。3 到 10 秒的自由生成区间,让故事的呼吸节奏第一次可以独立于任务类型:同样是首尾帧生成,也可以是短促的视觉冲击,也可以是缓慢的镜头推移。创意不再被模板牵着走,技术退到了叙事之后。

与此同时,图像模型可灵图像 O1 与视频能力共同构成了一个完整的多模态创作体系。它能稳定保持主体、精准修改细节、锁定风格调性,用高度一致的视觉呈现支持视频生产——也让“所想即所得”变得比以往更接近字面意义。

这一整套统一模型带来的,是跨场景的适配能力。在影视行业,它能生成多镜头的连贯叙事片段,服化道、角色特征都能被牢牢抓住;在自媒体创作中,删除路人、调色、替换背景不再需要复杂的后期,而是一句自然语言;在广告电商场景里,它则成为了一个永不落幕的虚拟摄影棚——商品、模特、场景,只需组合与指令即可批量生成大片级 Lookbook。

更重要的是,成本结构正在悄悄被颠覆。过去需要模特、场地、灯光团队以及多轮拍摄的商业广告,如今只需一张产品图和几句指令,就能产出多套视觉方案。广告行业过往习惯的“拍摄—修图—再拍—再修”的迭代被压缩到分钟级,对于追求时效的电商品牌来说,这几乎是在重写内容生产的物理规律。

站在技术维度,可灵 O1 的意义不仅在于功能叠加,而在于它真正实现了生成、编辑与理解的融合。新的 Multimodal Transformer 和长上下文结构让不同任务不再被割裂对待,而能在共同的语义底座上完成推理。这种“技能组合”的可能性让创作者可以同时提出多个目标,让 AI 自行统筹逻辑关系——先理解主体,再换背景,再重绘风格,而不需要用户拆分流程。创意突然拥有了一种前所未有的弹性。

在 AI 视频进化的漫长赛道上,人们不断追问:什么时候可以像写一句话一样创作一个镜头?什么时候 AI 可以理解叙事,而不是堆砌像素?什么时候视频制作可以像图片编辑一样直觉?

可灵 O1 给出的答案是,它愿意提前一步走向这个未来。不是用更快的生成速度,也不是更炫目的效果,而是把“统一”作为底层语言,把模态边界抹平,把技术的复杂性藏在模型的深处,让创作者第一次感到:视频生产这件事,并不应该这么难。

这是一个真正面向创意的时代开端,而可灵 O1 让那扇门第一次被轻轻推开。

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
夺冠代价!阿森纳冲刺双冠或送切尔西5800万,哈弗茨成关键

夺冠代价!阿森纳冲刺双冠或送切尔西5800万,哈弗茨成关键

星耀国际足坛
2026-05-13 14:03:59
夜景中的美女,身材真好

夜景中的美女,身材真好

蓝色海洋009
2026-05-13 17:06:46
“老战友”彻底反目!他信出狱开启大复仇,洪森父子恐将身败名裂

“老战友”彻底反目!他信出狱开启大复仇,洪森父子恐将身败名裂

流史岁月
2026-05-13 15:00:03
特朗普访华前,中美先后放出两个消息,高下早已注定

特朗普访华前,中美先后放出两个消息,高下早已注定

呼呼历史论
2026-05-14 00:32:50
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
同日告别!孙颖莎两大闺蜜官宣退出国家队,互相送祝福

同日告别!孙颖莎两大闺蜜官宣退出国家队,互相送祝福

湘楚风云聊体育
2026-05-14 01:46:50
杀了5万日军的“绝密战犯”,回归时受到周公相迎,至今身份成谜

杀了5万日军的“绝密战犯”,回归时受到周公相迎,至今身份成谜

文史达观
2026-05-11 06:45:17
郑丽文遭当头一棒,中方严正通告,对岸不准参会,傅崐萁临阵倒戈

郑丽文遭当头一棒,中方严正通告,对岸不准参会,傅崐萁临阵倒戈

御前带刀大人
2026-05-13 03:57:37
大瓜!许家印昔日恒大奢靡细节流出,丁玉梅海外包养30岁白人小伙

大瓜!许家印昔日恒大奢靡细节流出,丁玉梅海外包养30岁白人小伙

壹月情感
2026-05-09 00:00:07
特朗普还未抵京,美贸易代表突然改口,财长摊牌:求中方办三件事

特朗普还未抵京,美贸易代表突然改口,财长摊牌:求中方办三件事

龙隐天下
2026-05-14 03:16:27
女子线上买榴莲破防,5房果开出3房几乎没肉的“榴莲糖”,联系客服后退款50%

女子线上买榴莲破防,5房果开出3房几乎没肉的“榴莲糖”,联系客服后退款50%

大象新闻
2026-05-12 22:46:09
欧美为什么希望我们也不要加班?

欧美为什么希望我们也不要加班?

罗sir财话
2026-05-11 17:35:24
保留火箭5子?斯通摊牌,打消球员疑虑!联手3位老将,可再试1年

保留火箭5子?斯通摊牌,打消球员疑虑!联手3位老将,可再试1年

熊哥爱篮球
2026-05-14 03:00:36
网红水果黑幕曝光!全是添加剂泡的,很多人天天买给孩子吃

网红水果黑幕曝光!全是添加剂泡的,很多人天天买给孩子吃

泠泠说史
2026-05-12 19:57:36
新疆一女生没电脑在电竞馆学习,女店主得知后免费:只要是不打游戏,来学习的都免费

新疆一女生没电脑在电竞馆学习,女店主得知后免费:只要是不打游戏,来学习的都免费

潇湘晨报
2026-05-13 15:32:29
寿命与大便次数有关!研究发现:寿命长的人,每天排便在这个次数

寿命与大便次数有关!研究发现:寿命长的人,每天排便在这个次数

荔子言
2026-05-13 11:41:19
日本高官称168小时可全歼中国海军,但中国禁用导弹

日本高官称168小时可全歼中国海军,但中国禁用导弹

明天后天大后天
2026-03-17 15:30:37
重庆一大桥桥底崖壁上现佛头塑像,文旅部门:系现代塑像,不具备文物价值;雕刻者已找到,与重庆少年宫“小萝卜头”雕像作者系同一人

重庆一大桥桥底崖壁上现佛头塑像,文旅部门:系现代塑像,不具备文物价值;雕刻者已找到,与重庆少年宫“小萝卜头”雕像作者系同一人

三湘都市报
2026-05-13 21:54:13
美媒揭秘:其实不止美国以色列,一直有第三国在暗中袭击伊朗

美媒揭秘:其实不止美国以色列,一直有第三国在暗中袭击伊朗

起喜电影
2026-05-14 01:32:38
妻子住院14天娘家无人看,我沉默,18天后小舅子问180万合作为什么取消?

妻子住院14天娘家无人看,我沉默,18天后小舅子问180万合作为什么取消?

麦子情感故事
2026-05-13 23:57:36
2026-05-14 05:32:49
经济观察网 incentive-icons
经济观察网
以“理性、建设性”为基本价值观,赋能中国商业全球决策的财经资讯平台
11622文章数 76894关注度
往期回顾 全部

科技要闻

阿里年营收首破万亿,AI终于不再是画大饼

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

房产
本地
亲子
家居
数码

房产要闻

卷疯了!最低杀到7字头!手握30万,海口楼市横着走!

本地新闻

用苏绣的方式,打开江西婺源

亲子要闻

农村童趣日常,树上果糖拌奶吃,一口下去太解馋

家居要闻

内在自叙,无域有方

数码要闻

徕芬智能卷发棒Styler发布,499元

无障碍浏览 进入关怀版