网易首页 > 网易号 > 正文 申请入驻

以假乱真!文字直接生成视频,AI 视频工具 Sora 是怎么做到的?

0
分享至

2024年2月16日,Open AI在X(原 Twitter)上发布了一条消息,隆重介绍了自己的新文本转视频模型——Sora

这个模型可以生成最长60秒的视频,并且在这个过程中,还能够自己切换镜头,甚至给出特写。下面这些,就是视频提示词译文及Sora直接根据提示词英文原文生成的“作品”。

一位时尚的女士走在亮着霓虹灯和广告牌的东京街头。她穿着黑色皮夹克、红色长裙和黑色靴子,手提一只黑色包包。她戴着太阳镜,涂着红色口红。她走路既自信又随意。街道潮湿,地面上的水能够像镜面一样反射色彩斑斓的灯光,路上有很多行人来来往往。

一段3D动画,展现一种又小又圆的毛茸茸生物在一个充满活力的、被魔法环绕的森林中探险。这种生物是兔子和松鼠的混合体,拥有柔软的蓝色皮毛和一条蓬松的带有条纹的尾巴。它沿着一条闪闪发光的小溪跳跃,眼睛充满了好奇。森林里充满了魔法元素:有发光并能变换颜色的花朵,有紫色和银色叶子的树木,以及有类似萤火虫的漂浮的光点。这个生物最终停下来与一群围绕着蘑菇跳舞的小仙子玩耍。这个生物抬头敬畏地看着一棵巨大发光树木,这棵树似乎是森林的心脏。

乍一看这些视频,你可能会以为它们是专业拍摄团队或者是动画公司制作的视频短片。在OpenAI的社区中,也不乏同样感受的网友评论称担心Sora会抢走动画师的饭碗。


还有一些人担心这样的技术会不会被用来伪造视频,甚至被用来在法庭上作伪证。


那Sora是如何生成这样的视频的?它真的无所不能,会抢走人类饭碗吗?

Sora怎么生成视频?

从2022年下半年开始,Midjourney、Stable Diffusion之类的应用已经可以根据文本提示词生成对应的图片了。在2023年9月,GPT 4.0和DALLE 3结合,也让我们能够用聊天化的方式生成、修改图片。

AI生成视频也不是什么新鲜事了。在这次的Sora发布之前,也已经有一些视频生成AI,比如Pika、Stable video、RunwayML等等。但与Sora相比,其他模型生成视频的时长都比较短,而且在摄像机的运动、镜头切换等方面也要弱很多。

那么,Sora又是如何生成视频的呢?

Open AI发布了一份Sora的技术报告,在报告中提到“Sora是一个扩散模型”。


扩散模型本身很复杂,我们不去讲具体的细节,仅仅通过一个简单的例子,大致理解扩散模型的思路。

假如我们现在有一张狗狗的照片,我们可以一步步给这张照片增加噪点,让它变得越来越模糊,最终会变成一堆杂乱的噪点。


假如把这个过程倒过来,对于一堆杂乱无章的噪点,我们同样可以一步步去除噪点,把它还原成目标图片,扩散模型的关键就是学会逆向去除噪点

当然了,扩散模型不仅可以用来生成图片,还可以用来生成视频。比如,在Sora的技术报告中提到了,Open AI对视频数据进行了一些转换处理,让视频数据可以直接用来训练模型,从而让Sora能够直接根据提示词生成视频。


Sora强大的视频创作能力

按照Open AI的说法,Sora“继承”了Open AI对文本的理解能力,能够根据提示词生成出高质量的图片和视频,并且能够对视频进行向前或者向后的拓展。比如,可以基于同一个视频开头继续拓展,延伸出不一样的结尾。或者是从不同的开头引入,最终汇聚到同一个结尾。


另外,Sora不仅可以根据文本生成视频,也可以直接输入图片或者视频,对图片和视频进行编辑调整

比如可以将这辆行驶在普通道路上的汽车变得更“赛博朋克”一些。


另外,Sora也表现出了一些之前未曾想到的本领,比如它可以跟随着对象移动镜头,并且在移动镜头转换角度的时候,依然能保持周围的景象的合理、完整

“强大的Sora”仍有一些缺陷

虽然Sora展现出了强大的能力,但现阶段它还不够完美。

并不是每一次Sora都能生成出令人满意的视频。《麻省理工科技评论(MIT Technology Review)》主笔Will Douglas Heaven写道:“Sora发布出来的视频已经是从大量的成果中挑选出的佼佼者了。”但即便是这些“经过挑选的佼佼者”也不完美。

在Sora的技术报告中也承认,现阶段Sora生成的视频存在一些缺陷。比如,下面这个“考古工作者们挖掘出一个塑料椅”的视频片段里,这个塑料椅显然有点不遵守客观的物理规律。

另外,下面这个玻璃杯破碎的过程也不那么“科学”——在杯子破裂之前,杯子里的液体就已经流出来了。

所以,Sora还有很多需要完善的地方。但毫无疑问,目前Sora展现出来的能力已经说明了,这是一条非常有前景的道路。

Sora安全吗?

会取代人类吗?

这几天,Sora生成的视频刷爆了许多人的朋友圈,人们除了感叹Sora的厉害,同样也展现出了担忧,这些担忧集中在两个方面。

第一个担忧是:Sora生成视频的能力实在是太厉害了,如果这样的技术被用来造假,岂不是太可怕了?未来我们怎么知道看到的视频是真的还是假的?

而另一个担忧主要来自视频行业的从业者,如果Sora这样的模型普及开来,视频行业从业者是不是都要丢了饭碗?

先说说安全问题。其实,Open AI也考虑到了Sora可能带来的安全问题。目前,Sora仅对少数人开放,在确保它不会被用来做坏事之前,Sora是不会向大众开放的。

那Sora是否会代替人类视频工作者?

可以肯定的是,Sora的出现可能会威胁一些动画素材的制作者。

比如,今年1月,《好莱坞报道》进行了一项针对300名娱乐行业领导者的调查,有四分之三的受访者表示AI会减少未来的工作岗位,未来3年内大约会有20多万个职位受到影响。而Sora优异的表现会加重这一影响。

但换一个角度想,每一次新兴技术的出现在带来威胁的同时也会带来新的机会

包括Sora在内的视频生成AI只是一个工具,视频的创意来源还是需要人类提供。Sora或许能够帮助人类更高效地生产视频,同时,也让每一个普通人都有机会制作自己的创意视频。

转载自:科普中国

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1994年,尼克松遗言:我很后悔访华,我们可能创造了一个科学怪物

1994年,尼克松遗言:我很后悔访华,我们可能创造了一个科学怪物

百年历史老号
2024-04-26 16:47:47
《浪姐5》出事了!29岁女星「高空惨摔骨裂」首发声逼哭粉丝

《浪姐5》出事了!29岁女星「高空惨摔骨裂」首发声逼哭粉丝

阿芒娱乐说
2024-04-27 10:25:50
人要是到了 70 岁,还能符合以下这 10 个标准,那真的是太了不起了

人要是到了 70 岁,还能符合以下这 10 个标准,那真的是太了不起了

户外阿崭
2024-04-27 09:27:21
公诉人:“别人打你,你为何要还手”?这起案子引起网友的民愤!

公诉人:“别人打你,你为何要还手”?这起案子引起网友的民愤!

辉哥说动漫
2024-04-24 18:49:38
田馥甄违约黑内地?孙俪打压邓超?何炅遭背叛?林允养小鲜肉?田嘉瑞上位?王子奇搭关系户?

田馥甄违约黑内地?孙俪打压邓超?何炅遭背叛?林允养小鲜肉?田嘉瑞上位?王子奇搭关系户?

毒舌扒姨太
2024-04-28 22:22:34
关于问界M7起火事故-需要批判的不是事故,而是过度的宣传夸大

关于问界M7起火事故-需要批判的不是事故,而是过度的宣传夸大

户外小阿隋
2024-04-28 14:43:47
三大消息:大批轰炸机出动!特朗普彻底没戏;普京不给中国面子?

三大消息:大批轰炸机出动!特朗普彻底没戏;普京不给中国面子?

身边小事情
2024-04-26 09:39:06
这是日本侵略者在武汉大学校门口拍摄的照片,这是日本侵华的罪证

这是日本侵略者在武汉大学校门口拍摄的照片,这是日本侵华的罪证

作家李楠枫
2024-04-27 22:30:30
他公开自己是双性恋!

他公开自己是双性恋!

下水道男孩
2024-04-28 23:14:49
央妈“排查”结果出来了:国内能一次性拿出50万的家庭,超乎想象

央妈“排查”结果出来了:国内能一次性拿出50万的家庭,超乎想象

猫叔东山再起
2024-04-23 13:24:09
强势回应美联储收割,中国释放信号,亚洲的金融秩序,变天了

强势回应美联储收割,中国释放信号,亚洲的金融秩序,变天了

允华说
2024-04-28 15:31:07
谷歌裁掉整个 Python 团队!PyTorch 创始人急得直骂人:“WTF!核心语言团队无可替换”

谷歌裁掉整个 Python 团队!PyTorch 创始人急得直骂人:“WTF!核心语言团队无可替换”

InfoQ
2024-04-28 15:00:54
烂尾网红景点谁之过

烂尾网红景点谁之过

半月谈APP
2024-04-27 14:20:01
美若天仙!中国33岁跳水女神上节目:穿旗袍惊艳,保持完美身材

美若天仙!中国33岁跳水女神上节目:穿旗袍惊艳,保持完美身材

李喜林篮球绝杀
2024-04-27 10:15:03
44+42+39!创生涯最高纪录,哈登如梦初醒了,还不如答应火箭啊

44+42+39!创生涯最高纪录,哈登如梦初醒了,还不如答应火箭啊

巴叔GO聊体育
2024-04-28 15:32:45
同学聚会,我偷偷把单买了,聚餐结束时餐厅老板却说:请买下单

同学聚会,我偷偷把单买了,聚餐结束时餐厅老板却说:请买下单

社会潜伏者
2024-04-28 01:47:28
田馥甄年收入仅剩2000万台币左右!怪不得不肯放弃内地市场

田馥甄年收入仅剩2000万台币左右!怪不得不肯放弃内地市场

金牌娱乐
2024-04-28 10:18:15
2比2平!登乔66+12+15!快船5打8尽力了

2比2平!登乔66+12+15!快船5打8尽力了

篮球教学论坛
2024-04-29 07:08:31
穆斯林公开谈论如何推翻英国政府并建立哈里发国

穆斯林公开谈论如何推翻英国政府并建立哈里发国

桂系007
2024-04-29 00:11:46
暴雨要扩大!特大暴雨暴雪高温同日出现,五一长假南方继续多雨

暴雨要扩大!特大暴雨暴雪高温同日出现,五一长假南方继续多雨

中国气象爱好者
2024-04-28 21:21:39
2024-04-29 09:50:44
蝌蚪五线谱
蝌蚪五线谱
权威、有趣、贴近生活
1862文章数 149618关注度
往期回顾 全部

科技要闻

马斯克想把特斯拉中国数据送出国 这事太难

头条要闻

男子将车停小区车位被贴"违停单" 直言燃油车主太难了

头条要闻

男子将车停小区车位被贴"违停单" 直言燃油车主太难了

体育要闻

湖人的G4,尽人事得到了回报

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

问界M7追尾起火3人遇难 四大疑问待解

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

手机
旅游
数码
本地
公开课

手机要闻

Xiaomi Hyper OS将增加重磅功能,米粉表示非常的期待

旅游要闻

年轻人出游:为了爱好说走就走 好玩不贵很重要

数码要闻

OPPO Pad 3 平板电脑搭 3K 面板,配骁龙 8 Gen 3 + 16GB RAM

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版