网易首页 > 网易号 > 正文 申请入驻

OpenAI首个视频生成模型发布,60秒高清大作,网友已叹服

0
分享至

机器之心报道

机器之心编辑部

欢迎来到 bling zoo!

北京时间今天凌晨,OpenAI 正式发布了文本到视频生成模型 Sora,继 Runway、Pika、谷歌和 Meta 之后,OpenAI 终于加入视频生成领域的战争。

山姆・奥特曼的消息放出后,看到 OpenAI 工程师第一时间展示的 AI 生成视频效果,人们纷纷表示感叹:好莱坞的时代结束了?

OpenAI 声称,如果给定一段简短或详细的描述或一张静态图片,Sora 就能生成类似电影的 1080p 场景,其中包含多个角色、不同类型的动作和背景细节。

Sora 有哪些特别之处呢?它对语言有着深刻的理解,能够准确地解释 prompt 并生成吸引人的字符来表达充满活力的情感。同时,Sora 不仅能够了解用户在 prompt 中提出的要求,还能 get 到在物理世界中的存在方式。

在官方博客中,OpenAI 提供了很多 Sora 生成的视频示例,展示了令人印象深刻的效果,至少与此前出现过的文本生成视频技术相比是这样。

对于初学者来说,Sora 可以生成各种风格的视频(例如,真实感、动画、黑白),最长可达一分钟 —— 比大多数文本到视频模型要长得多。

这些视频保持了合理的连贯性,它们并不总是屈服于所说的「人工智能怪异」,比如物体朝物理上不可能的方向移动。

先让 Sora 生成一张中国龙年舞龙的视频。

比如输入 prompt:加州淘金热时期的历史镜头。

输入 prompt:玻璃球的特写视图,里面有一个禅宗花园。球体中有一个小矮人正在沙子上创造图案。

输入 prompt:一位 24 岁女性眨眼的极端特写,在魔法时刻站在马拉喀什,70 毫米拍摄的电影,景深,鲜艳的色彩,电影。

输入 prompt:穿过东京郊区的火车窗外的倒影。

输入 promot:赛博朋克背景下机器人的生活故事。

画面太真实,同时太诡异

但 OpenAI 承认,当前的模型也有弱点。它可能难以准确模拟复杂场景中的物理现象,也可能无法理解具体的因果关系。该模型还可能混淆提示的空间细节,例如混淆左和右,并可能难以精确描述随时间发生的事件,如跟随特定的摄像机轨迹。

比如他们发现,在生成的过程中动物和人会自发出现,尤其是在包含许多实体的场景中。

在下面这个例子中,Prompt 本来是「五只灰狼幼崽在草丛环绕的偏僻碎石路上嬉戏追逐。幼狼们奔跑着、跳跃着,互相追逐着、咬着,嬉戏着。」但所生成的这种「复制粘贴」的画面很容易让人想起某些神异鬼怪传说:

还有下面这个例子,吹蜡烛之前和吹蜡烛之后,火苗没有丝毫变化,透露出一种诡异:

技术细节

对 Sora 背后的模型细节,我们知之甚少。据 OpenAI 博客,更多的信息将在后续的技术论文中公布。

博客中透露了一些基础信息:Sora 是一种扩散模型,它生成的视频一开始看起来像静态噪音,然后通过多个步骤去除噪音,逐步转换视频。

Midjourney 和 Stable Diffusion 的图像和视频生成器同样基于扩散模型。但我们可以看出,OpenAI Sora 生成视频的质量好得多。Sora 感觉像是创建了真实的视频,而以往这些竞争对手的模型则感觉像是 AI 生成图像的定格动画。

Sora 可以一次性生成整个视频,也可以扩展生成的视频,使其更长。通过让模型一次预见多帧画面,OpenAI 解决了一个具有挑战性的问题,即确保被摄体即使暂时离开视线也能保持不变。

与 GPT 模型类似,Sora 也使用了 transformer 架构,从而实现了卓越的扩展性能。

OpenAI 将视频和图像表示为称为 patch 的较小数据单元的集合,每个 patch 类似于 GPT 中的 token。通过统一数据表示方式,OpenAI 能够在比以往更广泛的视觉数据上训练扩散 transformer,包括不同的持续时间、分辨率和宽高比。

Sora 建立在过去 DALL・E 和 GPT 模型的研究基础之上。它采用了 DALL・E 3 中的重述技术,即为视觉训练数据生成高度描述性的字幕。因此,该模型能够在生成的视频中更忠实地遵循用户的文字提示。

除了能够仅根据文字说明生成视频外,该模型还能根据现有的静态图像生成视频,并准确、细致地对图像内容进行动画处理。该模型还能提取现有视频,并对其进行扩展或填充缺失的帧。

参考链接:https://openai.com/sora

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
韩红风波升级, 北京人装半辈子藏族人引争议,恐步闫学晶“后尘”

韩红风波升级, 北京人装半辈子藏族人引争议,恐步闫学晶“后尘”

乡野小珥
2026-06-25 12:26:14
71岁汪文华:满头白发,退休后夫妻隐居黄山,女儿孝顺时常看望

71岁汪文华:满头白发,退休后夫妻隐居黄山,女儿孝顺时常看望

白面书誏
2026-06-24 14:57:50
中国银行逃税23.67亿元

中国银行逃税23.67亿元

新民周刊
2026-06-25 09:20:35
“穿得跟女佣一样!”初三女生的廉价毕业照火了,校长都看不下去

“穿得跟女佣一样!”初三女生的廉价毕业照火了,校长都看不下去

妍妍教育日记
2026-06-23 21:43:30
全新理想L8 贵了

全新理想L8 贵了

车文驿
2026-06-24 20:19:15
骑士交易阿伦换詹姆斯,风险大仅一年使用权

骑士交易阿伦换詹姆斯,风险大仅一年使用权

小僫搞笑解说
2026-06-25 13:11:12
“此北大非彼北大!”男生晒北大录取通知书被喷,家长看清现实!

“此北大非彼北大!”男生晒北大录取通知书被喷,家长看清现实!

林林先生
2026-06-24 10:00:08
社保卡里突然多一笔钱?别慌,这是国家给你的,6月30号前到账

社保卡里突然多一笔钱?别慌,这是国家给你的,6月30号前到账

三农雷哥
2026-06-24 21:41:25
为了8000块奖学金,举报全班师生,女大学生成功败光后半生人缘

为了8000块奖学金,举报全班师生,女大学生成功败光后半生人缘

世界圈
2026-06-25 12:26:44
《置身米内》炸了小米内网:其实大厂校招早已变味

《置身米内》炸了小米内网:其实大厂校招早已变味

华庭讲美食
2026-06-25 12:24:29
钟美美不再隐瞒!回应入学波士顿大学的真相,原来董宇辉真没说错

钟美美不再隐瞒!回应入学波士顿大学的真相,原来董宇辉真没说错

社会日日鲜
2026-06-25 13:01:17
油价调整:注意,预计下调720元/吨,油价能大跌?

油价调整:注意,预计下调720元/吨,油价能大跌?

爱看剧的阿峰
2026-06-25 12:44:06
周鸿祎谈“放弃龙虾”:对Token的消耗太浪费了,没有道理的消耗

周鸿祎谈“放弃龙虾”:对Token的消耗太浪费了,没有道理的消耗

红星资本局
2026-06-24 17:02:15
医生反复强调:人老了,宁可多喝几口酒,都不要随便喝这3样

医生反复强调:人老了,宁可多喝几口酒,都不要随便喝这3样

健康之光
2026-06-18 21:30:03
上海女子在公司上厕所时闻到一股恶臭,当晚喉咙肿到没法吞口水,第二天确诊!医生紧急提醒→

上海女子在公司上厕所时闻到一股恶臭,当晚喉咙肿到没法吞口水,第二天确诊!医生紧急提醒→

新民晚报
2026-06-24 18:24:40
玄学提醒:无法解释,但每一条都准到骨子里!

玄学提醒:无法解释,但每一条都准到骨子里!

智慧生活笔记
2026-06-20 15:18:00
女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

蝴蝶花雨话教育
2026-05-07 00:05:04
身价千亿也得听话!马斯克被老妈硬拽走红毯,全程放飞自我

身价千亿也得听话!马斯克被老妈硬拽走红毯,全程放飞自我

雷科技
2026-06-25 11:20:31
PS商店显示《GTA6》竟在中国、俄罗斯等国家被禁

PS商店显示《GTA6》竟在中国、俄罗斯等国家被禁

3DM游戏
2026-06-25 10:39:05
成都大爷强拽女孩社死!多官媒怒批,网友抵制举报,退休金恐难保

成都大爷强拽女孩社死!多官媒怒批,网友抵制举报,退休金恐难保

北纬的咖啡豆
2026-06-24 19:45:36
2026-06-25 14:04:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13354文章数 142681关注度
往期回顾 全部

科技要闻

盘后大涨16%!AI存储需求带飞美光业绩

头条要闻

盖茨第三段婚外情对象披露 正面回应引诱未成年人卖淫

头条要闻

盖茨第三段婚外情对象披露 正面回应引诱未成年人卖淫

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

白玉兰颁奖预测,杨幂胜算大吗?

财经要闻

财报炸裂!美光让空头闭嘴

汽车要闻

少个轮子也能跑?方程豹豹8闪充版云辇P Ultra让新手越野不心慌

态度原创

教育
数码
艺术
旅游
亲子

教育要闻

数字推理,1,2,3,7,16,( )

数码要闻

泰坦军团预热裸眼3D显示器M27E6V-3D:UHD 190Hz,HDR 1400

艺术要闻

2026年第三届全国大学生美术作品展 油画选(一)

旅游要闻

中国文旅看山西丨娘子关:一座兼具巾帼风骨与水乡柔情的长城雄关

亲子要闻

孩子脾胃调理 没有效果 是家长做错了这件事

无障碍浏览 进入关怀版