网易首页 > 网易号 > 正文 申请入驻

刘润:OpenAI全新发布的Sora,到底意味着什么?

0
分享至

1、2024年2月16日凌晨(美国时间2月15日),OpenAI发布了“文生视频”(text-to-video)的工具,Sora。整个世界再次被震撼了。人类用无数种语言,在全球的社交媒体上惊呼:现实,不存在了。

2、那么,Sora到底是什么?

3、这是一段咒语(Prompt):

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

翻译成中文(by ChatGPT)就是:

一位时尚的女士穿着黑色皮夹克、长红裙和黑色靴子,手拿黑色手袋,在东京一条灯光温暖、霓虹灯闪烁、带有动感城市标志的街道上自信而随意地行走。她戴着太阳镜,涂着红色口红。街道潮湿而有反光效果,色彩缤纷的灯光仿佛在地面上创造了镜面效果。许多行人在街上来往。

4、文生视频。文有了。现在,看视频。

5、看完之后,什么感觉?是不是感觉:这……不可能是AI生成的吧?你看她脸上,雀斑和瑕疵那么明显,不像是假的;镜头移动时,水里的倒影也在移动,不像是假的;旁边一起走的那些人,每个人心中有自己的故事,不像是假的;更重要的是,她的墨镜里还有街景的映射,不像是假的。

6、以前不相信是真的。现在不相信是假的。

7、OpenAI知道你会这么想,所以在官网留了一句话:

所有本页面上的视频都是直接由Sora生成,未经修改。

8、Sora的能耐,还不仅仅是“文生视频”。他还能把两个视频,连在一起,实现无缝过渡。比如这个,从现实的乡村,无缝过渡到虚幻的城市。

9、这样的视频,还有很多。Sora还能做很多很多其它事。你可能也已经看到了不少。我就不发了。网上到处都是。

10、比起这些震撼视频,其实我更想知道的是,Sora的出现,对人工智能的整体发展,到底意味着什么?于是,我专门找来OpenAI官方公布的Sora的技术文档,仔细看了一遍。

11、看完之后我发现,这份技术文档,比那些不可思议的视频,更让人震撼。

12、这篇技术文档,没有泄露太多Sora的技术细节。但还是介绍了它的基本原理。

13、简单来说,Sora通过学习视频,来理解现实世界的动态变化,并用计算机视觉技术模拟这些变化,从而创造出新的视觉内容。换句话说,Sora学习的不仅仅是视频,也不仅仅是视频里的画面、像素点,还在学习视频里面那个世界的“物理规律”。

14、听上去,很抽象。我解释一下。

15、比如,你咬一口食物,食物应该出现一个咬痕。这是“物理规律”。如果咬完之后,食物还是完整的,那就不符合“物理规律”。

16、大部分的视频软件,并不理解“物理规律”。他们处理的对象,只是画面。而不是画面里的食物和人。但是Sora,似乎理解。当Sora学习人咬食物的视频时,它记住的,不仅是食物和嘴在一起的“具体画面”,还有“咬就会有痕”这个“物理规律”。以后生成视频时,一旦有“咬”这个动作,Sora就会知道,下面应该出现一个咬痕了。

17、比如,下面这段。

18、用Sora生成的视频,并不总是能“咬就会有痕”。它“有时”也会出错。但这已经很厉害,很可怕了。因为“先记忆,再预测”,这种理解世界的方式,是人类理解世界的方式。这种方式有个名字,叫:世界模型。

19、什么是,世界模型?我举个例子。

20、你的“记忆”中,知道一杯咖啡的重量。所以当你想拿起一杯咖啡时,大脑准确“预测”了应该用多大的力。于是,杯子被顺利拿起来。你都没意识到。但如果,杯子里碰巧没有咖啡呢?你就会用很大的力,去拿很轻的杯子。你的手,立刻能感觉到不对。然后,你的“记忆”里会加上一条:杯子也有可能是空的。于是,下次再“预测”,就不会错了。你做的事情越多,大脑里就会形成越复杂的世界模型,用于更准确地预测这个世界的反应。这就是人类与世界交互的方式:世界模型。

21、关于世界模型,如果感兴趣,我建议你读一本书,叫《千脑智能》。

22、回到Sora。Sora的技术文档里有一句话:

Our results suggest that scaling video generation models is a promising path towards building general purpose simulators of the physical world.

翻译成中文就是:

我们的结果表明,扩展视频生成模型是向着构建通用物理世界模拟器迈进的有希望的路径。

23、什么意思?意思就是说,OpenAI最终想做的,其实不是一个“文生视频”的工具,而是一个通用的“物理世界模拟器”。也就是世界模型,为真实世界建模。

24、而Sora,只是验证了,这条道路可行的一个里程碑。

25、如果从“视频”中,可以开始学习物理的规律了,那么,未来可以不可以从“摄像头”里学习呢?如果也可以的话,那么,给AI装一双“眼睛”,让他满世界跑,会发生什么?如果也可以的话,那么,把全世界的公共摄像头,都开放给OpenAI,会发生什么?

26、Sora的出现,可能意味着,通用人工智能(AGI),正在加速到来。

27、这才是OpenAI,真正想做的事情。

28、所以,这时你就能理解,为什么Sam Altman要筹集7万亿美金,重塑全球AI芯片的基础设施了。7万亿,相当于全球GDP的10%,能买2.5个微软,4个英伟达,或者11.5个特斯拉。为什么?因为,通往通用人工智能的道路上,需要大量、大量、大量的算力。

29、Sora来了,通用人工智能还会远吗?

30、这个世界正在发生着难以想象的变化。看似很远,但又瞬间近在眼前。

31、最后,要感谢Sam Altman,选择初六宣布此事。

32、不然,我们整个春节,都要用来见证历史了。

*个人观点,仅供参考。

责任编辑:史伟民_NS5464

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不演了?畸形儿传闻真相大白仅2天,阚清子被曝猛料,孙怡赢麻了

不演了?畸形儿传闻真相大白仅2天,阚清子被曝猛料,孙怡赢麻了

论事的老枢
2026-04-06 20:45:22
“我只是长大了,不是变丑了”:她的一句话炸出多少人的外貌焦虑

“我只是长大了,不是变丑了”:她的一句话炸出多少人的外貌焦虑

老吴教育课堂
2026-04-06 22:37:10
广东新华发行集团东莞新华书店有限公司总经理高伟文接受审查调查

广东新华发行集团东莞新华书店有限公司总经理高伟文接受审查调查

界面新闻
2026-04-07 09:05:29
林彪叛逃后,周恩来嚎啕大哭,纪登奎上前劝说,他却摆手:你不懂

林彪叛逃后,周恩来嚎啕大哭,纪登奎上前劝说,他却摆手:你不懂

历史甄有趣
2026-04-06 09:15:20
张纪中刮掉三十年白胡子,全家没人认出他

张纪中刮掉三十年白胡子,全家没人认出他

歪歌社团
2026-04-06 15:58:32
本菲卡争冠梦碎!穆帅不满裁判:补时只给6分钟,不会放弃机会!

本菲卡争冠梦碎!穆帅不满裁判:补时只给6分钟,不会放弃机会!

海浪星体育
2026-04-07 09:10:42
费迪南德:居然有人要阿尔特塔下课?阿森纳球迷究竟在想什么

费迪南德:居然有人要阿尔特塔下课?阿森纳球迷究竟在想什么

懂球帝
2026-04-07 09:45:26
找炮灰参选台北市长?港媒:民进党年底选举或全台大翻车

找炮灰参选台北市长?港媒:民进党年底选举或全台大翻车

海峡导报社
2026-04-06 08:13:15
赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

芳芳历史烩
2026-03-23 03:53:23
这个男士是郭延军,他的鼻子的宽度、面积、体积为普通人2倍以上

这个男士是郭延军,他的鼻子的宽度、面积、体积为普通人2倍以上

岁月有情1314
2026-04-01 11:25:58
当铲屎官养了只爱凑热闹的狗狗:人,你在干嘛?

当铲屎官养了只爱凑热闹的狗狗:人,你在干嘛?

英国那些事儿
2026-04-06 23:18:16
大伯每年都来我家借钱,今年除夕又来了,母亲的做法让我暗自叫好

大伯每年都来我家借钱,今年除夕又来了,母亲的做法让我暗自叫好

奶茶麦子
2026-04-06 23:26:19
是两百年难遇的美人,靠美貌征服无数男人,如今49岁仍未婚

是两百年难遇的美人,靠美貌征服无数男人,如今49岁仍未婚

喜欢历史的阿繁
2026-04-07 08:43:08
周杰伦演唱会口碑崩塌,3小时划水2小时,万元门票听了个寂寞

周杰伦演唱会口碑崩塌,3小时划水2小时,万元门票听了个寂寞

观察者海风
2026-04-04 22:06:54
伊朗宣布决定,霍尔木兹海峡通航,高人指点,打起石油持久战

伊朗宣布决定,霍尔木兹海峡通航,高人指点,打起石油持久战

阿芒娱乐说
2026-04-06 17:40:03
伊朗媒体称多名美军士兵在营救飞行员的行动中身亡,“美军试图摧毁被击落飞机的残骸,甚至摧毁身亡美军士兵的遗体”

伊朗媒体称多名美军士兵在营救飞行员的行动中身亡,“美军试图摧毁被击落飞机的残骸,甚至摧毁身亡美军士兵的遗体”

扬子晚报
2026-04-05 21:07:52
三星把表降到289美元,安卓用户集体破防了

三星把表降到289美元,安卓用户集体破防了

爬虫饲养员
2026-04-07 00:45:37
新疆换帅如换刀!与深圳决战最后时刻,只输在国内核心和外援差距

新疆换帅如换刀!与深圳决战最后时刻,只输在国内核心和外援差距

篮球资讯达人
2026-04-06 23:05:21
张雪母亲改嫁后成为作家!回应:张雪骑车撞人我赔3万 借给他55万

张雪母亲改嫁后成为作家!回应:张雪骑车撞人我赔3万 借给他55万

念洲
2026-04-07 09:37:27
老宣传画里的坚决解放台湾 拯救苦难中的台湾人民

老宣传画里的坚决解放台湾 拯救苦难中的台湾人民

那些看得见的老照片
2026-04-07 07:00:05
2026-04-07 10:15:00
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
105949文章数 61736关注度
往期回顾 全部

科技要闻

年化营收300亿美元!Anthropic砸算力大单

头条要闻

特朗普:伊朗人民甘愿承受苦难 他们"想听炸弹的声音"

头条要闻

特朗普:伊朗人民甘愿承受苦难 他们"想听炸弹的声音"

体育要闻

官方:中国女足球员邵子钦加盟本菲卡

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

2026年,全国租房市场还有波降价潮

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

教育
数码
手机
旅游
公开课

教育要闻

强基计划专业,怎么选才不后悔?顶尖学霸“用脚投票”的真实结果,出乎所有人意料!

数码要闻

苹果Studio Display XDR获FDA批准支持医学影像

手机要闻

vivo X300 Ultra、X300s首销分析,这成绩如何?

旅游要闻

仁怀苍龙:清明踏青焕活力 乡村颜值变产值

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版