AI生成视频工具远比你想象的可怕,其恐怖学习能力将颠覆整个时代

分享至

太可怕了,Sora不仅是生成视频这么简单,它还是世界模拟器。



谁也没有想到人工智能这么快就要超越人类,相信大家都看过Sora生成的短视频,影片以假乱真跟真实世界几乎没有区别,但你肯定要有几个很懵逼的问题,不就是生成了几个视频而已,这都说明啥问题?

视频我们拿手机也可以拍出来,电影特效人类可以用计算机CG给做出来,只不过是费时费力而已,Sora貌似只是提高了视频生产力的一个工具而已,那为啥大家反应这么激烈?为什么会觉得Sora很可怕?Sora现在的能力到底意味着啥?它会对人类产生怎样的影响?今天我们就一个事情要搞明白这些问题,不得不说人工智能的发展简直快的是无法形容是吧?



威尔·史密斯的视频大约是一年前人工智能生成的,那就会觉得人工智能还有很长的路要走,但今天一个时尚的女人在东京的街头行走,这个视频就是Sora凭空合成的,你会发现视频里有精确的灯光、材料、肤色动作,甚至还有路面的反射。

我们作为外行人当然不懂摄影,我们之所以觉得这个视频好,只是简单的认为这个视频很符合我们对现实世界的理解,比如说这个视频里面呈现出来的所有的景象都符合我们在现实世界中应该看到的样子。

你再看那段小狗在雪地里玩耍的视频,那狗像毛血看起来像雪,一切都那么的真实,雪会粘在毛上,会粘在鼻子上,只会扬到空中,然后落下来的那种轻柔非常符合我们现实世界中的物理规律,所以我们才觉得人家的视频是正常的视频,是吧?

Sora为啥能够生成这么好的视频?Open AI从推出了GPT 3,就不发表他们先进模型的论文原理了,目前大家仍然不知道GPT 3的具体参数的数量,这次发布的文章依旧对Sora的原理公开不多,基本上使用的就是变换模型和扩散模型的结构,所以几乎没有人能够把这个原理能讲清楚,就算人家公开了,我们不是专业的人也很难看懂是吧?

但我们也可以从大的方向上理解Sora生成视频的方式。

首先我们要知道目前的网络工作方式,其实就是对人脑神经网络的一种模拟。我们知道人脑当中有大约860亿个神经元,单个生物神经元有一个带细胞核的细胞体,它是神经元的核心,在细胞体的周围有数通它的信号接收器在另外一个投入轴突,它可以将信号传递给下一个神经元树突,单个神经元其实并没有啥特殊的地方,它干不了任何事情。

但是当这些神经元通过突破互相连接在一起以后,通过信号大量复杂的传递之后,就会产生不可思议的学习能力,甚至还会让我们产生意识。

那么在人工神经网络当中也有类似的神经元,它有中心处理器,本质上就是一个具有一些参数的函数,这个函数在接收输入在处理输入以后就会生成一个输出信号,然后传递给另外一个人工神经元,我们把这些大量的人工神经元通过一定的模式组合在一起,就构成了一个类似于人脑的人工神经网络,它模拟的就是我们人脑学习和认知世界的过程。

这里有个非常好的例子,可以理解Sora人工智能是如何学习最终智能视频吗?好。

付费解锁全篇
购买本篇
《购买须知》  支付遇到问题 提交反馈
相关推荐
无障碍浏览 进入关怀版