网易首页 > 新闻中心 > 新闻 > 正文

全球首个大一统多模态视频模型可灵O1发布 让P视频像P图一样简单

0
分享至

近日,全球首个大一统的多模态视频、图片创作工具"可灵O1"正式上线。可灵O1基于全新的视频和图像模型,以自然语言作为语义骨架,配合视频、图片、主体等多模态描述,将所有生成和编辑任务融合于一个全能引擎之中,为用户搭建全新的多模态创作流,实现从灵感到成品的一站式闭环。

大一统模型,解决视频创作的所有难题

作为首个大一统多模态视频模型,可灵O1基于MVL(Multi-modal Visual Language,多模态视觉语言)理念,打破了传统单一视频生成任务的模型边界,将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务,融合于同一个全能引擎之中,使得用户无需在多个模型及工具间跳转,即可一站式完成从生成到修改的全部创作流程。

依托可灵视频O1模型的深层语义理解力,用户上传的图片、视频、主体、文字——在可灵O1眼中,皆是指令。模型打破了模态限制,能够综合理解一张照片、一段视频或一个主体,甚至一个角色的不同视角,精准生成各种细节。

可灵O1的多模态指令输入区,让繁琐的剪辑后期变成了简单的对话。用户无需手动遮罩或关键帧,只需输入「移除路人」、「将白天改为黄昏」或「替换主角服装」,模型即可读懂影像逻辑,从局部的主体替换,到整体的视频风格重绘,自动完成像素级的语义重构。此外,如图片/主体参考;指令变换(视频增加、删除内容、切换景别/视角、视频修改任务等)、视频参考、首尾帧、文生视频等能力也一并支持。

针对AI视频难以落地的痛点——角色与场景的一致性,可灵O1底层强化了对输入图像及视频的理解。 它能像人类导演一样,“记住”主角、道具和场景。无论镜头如何流转,主体特征始终稳定如一。 此外,该模型展现了强大的多主体融合能力。用户可以自由组合多个不同主体,或将主体与参考图混搭。即便是在复杂的群像戏或互动场景中,模型也能独立锁定并保持每一位角色或道具的特征,确保“主角”在不同镜头中实现工业级的特征统一。

不再局限于单点任务,而是支持“技能组合”。 用户可以要求可灵O1“在视频中增加主体的同时修改背景”,或者“在图片参考生成时,同步修改风格”。这种一次生成多种创意变化的能力,极大地拓展了创作的自由度,让创意的化学反应成为可能。

叙事时长自由定义,让每一段故事都有其独特的呼吸感。可灵O1将定义时间的权力交还给创作者,支持3-10秒自由生成。无论是短促的视觉冲击,还是悠长的故事铺陈,都由用户自由掌控。 值得注意的是,作为统一模型的一部分,可灵O1的首尾帧能力也将支持3-10秒的生成时长选择(即将发布),这将进一步增强叙事的张弛度。

一同登场的还有可灵图像O1模型,可实现从基础图像生成到高阶细节编辑全链路无缝衔接,用户既可通过纯文本生成图像,也可上传最多10张参考图进行融合再创作。 该模型具备四大核心优势:特征高度保持,让主体元素稳定不偏差;细节修改精准响应,让每一处调整都符合预期;风格调性准确把控,让画面氛围始终统一;超丰富想象力,让创意呈现更具张力,真正实现“所想即所得”。

一个模型,搞定影视、自媒体、广告电商等多视频创作场景

全新的可灵O1集生成与编辑于一体,可广泛适用于影视、自媒体、广告电商等多种场景。无论是从零构建的叙事生成,还是对既有素材的深度重塑,可灵O1都能根据不同需求,灵活调用其参考、编辑的能力,轻松完成创作。

在影视创作领域,凭借可灵O1的超强一致性的图片(主体)参考,配合主体库功能,可以精准锁定每个分镜的角色及服化道,轻松创作生成多个连贯的影视镜头;而对于视频后期、自媒体创作者来说,可通过简单对话式的提示词,如输入“删除背景中的路人”、“让天空变蓝”,就能让可灵O1自动完成像素级的智能修补与重构。

针对传统线下广告实拍成本高,制作周期长的问题。如今用户只需上传商品图、模特图和场景图,配合简单指令描述,即可快速生成多个酷炫的商品展示广告,大幅降低实拍成本。针对模特约拍麻烦、更换背景/服装需要重复拍摄等问题,使用可灵O1,能搭建你的永不落幕的虚拟T台:上传模特 + 服装实拍图,输入指令,完美还原服饰的质感和细节,批量生产高质量的 Lookbook 视频。

据悉,可灵O1能实现上述强大而全面的功能,源于在技术底座上的深层创新。全新的可灵视频O1模型打破视频模型在生成、编辑与理解上的功能割裂,构建了全新的生成式底座。融合多模态理解的Multimodal Transformer和多模态长上下文,实现了多任务的深度融合与统一。

相关推荐
热点推荐
继福原爱怀三胎后,前夫圣诞节晒8岁女儿漂亮,2个娃被养得很明媚

继福原爱怀三胎后,前夫圣诞节晒8岁女儿漂亮,2个娃被养得很明媚

动物奇奇怪怪
2025-12-28 16:39:11
国产奔驰GLE售价曝光!进口版车主吐槽:后悔买早了

国产奔驰GLE售价曝光!进口版车主吐槽:后悔买早了

汽车网评
2025-12-27 20:46:36
财政工作会议在北京召开

财政工作会议在北京召开

财联社
2025-12-28 12:07:04
长江策|苏北或将迎首个“万亿之城”,为什么是徐州?

长江策|苏北或将迎首个“万亿之城”,为什么是徐州?

现代快报
2025-12-28 17:32:04
越南谈中越战争:中国不是给越南一个教训,而是摧毁,他们做到了

越南谈中越战争:中国不是给越南一个教训,而是摧毁,他们做到了

爱史纪
2025-12-28 19:31:40
增长278%,692亿!韩国船企再获15艘大单,中企却刚刚“破零”?

增长278%,692亿!韩国船企再获15艘大单,中企却刚刚“破零”?

品牌观察官
2025-12-27 18:06:04
光刻机巨头开始慌了,中国造不成光刻机,但是要造一个光刻工厂!

光刻机巨头开始慌了,中国造不成光刻机,但是要造一个光刻工厂!

隐龙天下
2025-12-12 00:57:51
冲上热搜!黄子韬因脑淤血接受开颅手术缝了43针,本人回应

冲上热搜!黄子韬因脑淤血接受开颅手术缝了43针,本人回应

半岛晨报
2025-12-28 18:04:45
杨少华长子杨威,对儿子杨化然说:我去德云社演出,郭德纲给钱了

杨少华长子杨威,对儿子杨化然说:我去德云社演出,郭德纲给钱了

知法而形
2025-12-27 19:44:29
连续两场比赛命中20+三分,且三分命中率超50%,这不会是常规操作

连续两场比赛命中20+三分,且三分命中率超50%,这不会是常规操作

小七说篮球
2025-12-28 20:10:15
饲料大王刘永好坦言:我们吃的猪肉90%是“三元猪”,所以不香了

饲料大王刘永好坦言:我们吃的猪肉90%是“三元猪”,所以不香了

丁丁鲤史纪
2025-12-23 16:14:18
西伯利亚零下71度如何生活?当地女性直言,最怕解决生理问题

西伯利亚零下71度如何生活?当地女性直言,最怕解决生理问题

忠于法纪
2025-12-10 11:23:33
邓小平视察二汽,得知王兆国38岁就当副厂长后大喜:要好好培养他

邓小平视察二汽,得知王兆国38岁就当副厂长后大喜:要好好培养他

帝哥说史
2025-12-23 06:30:03
对越自卫反击战胜利结束后,邓小平不再兼任总参谋长,由杨得志接任该职务,许世友也随之离开军队

对越自卫反击战胜利结束后,邓小平不再兼任总参谋长,由杨得志接任该职务,许世友也随之离开军队

史海孤雁
2025-12-19 17:46:12
独生女不愿接班,天津老板套现7.2亿,把家族产业卖给了安徽国资

独生女不愿接班,天津老板套现7.2亿,把家族产业卖给了安徽国资

素衣读史
2025-12-23 17:03:03
大量食用油被检测出致癌物?快看你家厨房有没有这4种油,别吃了

大量食用油被检测出致癌物?快看你家厨房有没有这4种油,别吃了

今朝牛马
2025-12-28 16:29:09
抗美援朝彭总大骂梁兴初,后来彭总落难,梁的一句话让人肃然起敬

抗美援朝彭总大骂梁兴初,后来彭总落难,梁的一句话让人肃然起敬

云霄纪史观
2025-12-28 19:08:56
重庆机场集团声明:公司无任何 “特殊招聘渠道”

重庆机场集团声明:公司无任何 “特殊招聘渠道”

界面新闻
2025-12-28 18:06:47
残忍的遗传规律:父母如果患上以下4种癌,下一代可能会复制

残忍的遗传规律:父母如果患上以下4种癌,下一代可能会复制

柏拉图的诉说1
2025-10-30 18:45:15
姜昆翻车,美国境内唱红歌,早年抵制洋节挂在嘴边,回应未移民!

姜昆翻车,美国境内唱红歌,早年抵制洋节挂在嘴边,回应未移民!

你食不食油饼
2025-12-26 06:13:35
2025-12-28 21:04:49

头条要闻

新华社发文:积蓄统一大势

头条要闻

新华社发文:积蓄统一大势

体育要闻

83分钟绝杀!曼城2-1年度收官:英超6连胜狂飙

娱乐要闻

白敬亭现身冰雪大世界 拍视频还翻车了

财经要闻

英伟达的收购史

科技要闻

特斯拉将在华布局自动驾驶?记者求证→

汽车要闻

理想的2026:L9不容有失,i9再战纯电?

态度原创

教育
手机
游戏
时尚
军事航空

教育要闻

雅思3个月提2分,因为我们做对了这几件事!

手机要闻

HMD新机曝光:高刷LCD屏+大电池

《生化危机6》是否为系列败笔?来看看爆料大佬咋说!

2026年了,最好看还是这件大衣!

军事要闻

与特朗普会晤前 泽连斯基亮明“红线”

无障碍浏览 进入关怀版
×