作者|子川
来源|AI先锋官
快手带着大家伙来了!
12月1号,可灵AI突然放出一个重磅消息——推出了O1模型。
官方称其为"全球首个统一多模态视频模型"。
从官方给出的介绍来看,这次可灵O1的核心亮点在于把文生视频、图生视频、视频编辑、内容增删、风格变换等一大堆功能,全部集成到一个统一的模型里。
以前我们用AI视频工具,基本都是这样的:想文生视频,就去文生视频的入口;想图生视频,就得切换到图生视频功能;想编辑视频,又得找视频编辑工具。
每个功能都是独立的,切换起来麻烦不说,效果还不一定连贯。
但可灵O1不一样,它把这些功能全部融合到一个模型里。
你上传一张图片、一段视频,或者直接输入文字描述,模型都能理解你想干什么,然后直接给你生成出来。
更厉害的是,这个模型还结合了Chain-of-thought技术,也就是思维链推理能力。
这意味着它不仅能理解你的指令,还能像导演一样记住主角、道具和场景,无论镜头怎么切换,主体特征都能保持一致。
说了这么多理论,那实际效果到底怎么样?下面我们来试玩一番。
视频内容增删是可灵O1最让人惊喜的功能之一。
你可以在视频中任意增加或删除内容,比如给角色添加一件衣服、消除路人、增加道具等等。
比如上传一个女生打伞的视频,但是我需要去除这把伞,效果是这样的——
原视频
可以很清楚地看到,原视频中的伞被删除掉。而且视频的一致性保持的相当出色,除了伞以外,其他都没有任何变化。
不过也会去除不完整的情况出现。
像下面这一段,原本视频中有一只小兔子。
![]()
把它删除效果是这样的,细看可以看出兔子原有的位置扣除的并不干净。
除了增删,可灵O1还能修改视频中的特定部分。比如你想把角色的衣服从红色改成蓝色,想把夏天的场景变成冬天,或者给视频加上特效,都能轻松实现。
比如把原有视频中的形象进行替换。
原视频
一致性的效果依旧出色,这次我们可以用蜡烛作为参考物,原视频的蜡烛燃烧的状态和修改后视频的一致的。
还能把骑自行的车傻狍子换成一只兔子。
![]()
不过也有失败的案例,比如左侧的杯子凭空长出了一条尾巴。
同时你还可以在原有视频中增加一些元素,比如在跳舞女孩的后面添加一个外星人。
还有之前很火的风格转换可也以在可灵O1中完成。
把风景视频转换成日本动漫风格。
整体体验下来会发现,可灵O1提供了统一的Omni界面,支持图片、视频、主体等多模态输入。整个操作流程非常简单,学习成本比较低。
同时在实际体验过程中发现可灵O1在某些复杂场景下可能还会有一些瑕疵,但这种"大一统"的设计理念,很可能会成为未来AI工具发展的方向。
毕竟,谁不想要一个能解决所有问题的全能工具呢?
目前可灵O1已经全量上线,感兴趣的可以去体验一下。
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.