网易首页 > 网易号 > 正文 申请入驻

前沿趋势|OpenAI首个文生视频模型Sora惊艳发布,听听园企技术专家怎么说······

0
分享至

2月16日凌晨,OpenAI又展开了一次超乎所有人想象的发布,其首款文生视频模型Sora正式对外亮相。从ChatGPT、DALL-E3,再到Sora,如果用一句话来总结OpenAI的与众不同之处,那就是:技术想象力和工程能力,要远比技术路线或者黑科技重要。

首款文生视频模型Sora火爆“出道”

2023年及以前,文生视频的模型虽然出现Runway、Pika等现象级产品,但从整个行业来看,把扩散模型和语言模型相结合的工作并没有被业内放在“最高优先级”。OpenAI指出,Sora与之前的文生视频思路并不一样,是让模型一次预测多帧画面,并且确保视频主体保持不变。

Sora在视频帧上做突破,巧妙地提升生成视频的使用上限。把Transformer引入到文生视频的扩散模型中,实现视频帧之间的语义信息预测,让语言模型在其中发挥出巨大的价值。也就是说:Transformer+Diffusion Model,在2024年初实现融合,不再是独立两条发展路径。

Sora的效果已经在科技圈内不断刷屏,以至于很多人对于OpenAI新技术的发布,如同期待苹果乔布斯时代的发布一样,总有超乎预期的技术让人眼前一亮。

Sora 1.0版本将如何升级?

Sora模型能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景。该模型不仅能理解用户在提示中所要求的内容,还能理解这些事物在现实世界中的存在方式。该模型对语言有深刻理解,能准确解读提示,并生成表达丰富情感的引人入胜的角色。Sora还能在单个生成的视频中创建多个镜头,使角色和视觉风格保持准确一致。

当然,对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,有的狼崽凭空出现或消失。

该模型还可能混淆提示词的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。如根据提示词“篮球穿过篮筐然后爆炸”生成的视频中,篮球撞到篮筐边缘竟然没有反弹而是直接穿过。

OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。

关于Sora,园企这样说

达观数据有限公司

副总裁 王文广

语言是人类智能的基础,人类之所以成为人类就是出现了语言,所以人类制造的智能体,需要以语言为基础。但要在人工智能中真正实现AGI,这中间还有一个关键环节,那就是让机器能够自主地从物理世界中学习,这就要求AGI具备连续的视觉理解能力,构建出能够模拟现实物理世界的时空模型。也就是说,连续的视觉理解能力是AGI从物理世界学习的基础。Sora的出现,正是在时空模型和视觉理解上往前推进了一大步。这有点像ChatGPT的出现,在语言智能上往前推进了一大步一样。也正是因为这个原因,Sora一出世即获得极大关注,再一次重现一年多前的ChatGPT的场景。

另外,在技术上,Sora是在视觉领域重复了GPT3的路径,是规模化的智能涌现,而不是模型或算法上的突破。通过Sora,证实了不断扩大视频模型的规模,将有可能模拟整个物理世界,并让人造智能体能够理解世界,为改造世界打下基础。

当然,上面是从通用人工智能的视角来看待Sora的。Sora的直接影响是整个影视制作和媒体行业,这是颠覆性的影响,有如火车的出现,改变了整个运输行业一样。马车不会消失,但成了小众,未来的影视制作形态也会完全变了样。

上海森亿医疗科技有限公司

联合创始人兼首席技术官 殷嘉珩

Sora模型一经推出,就在视频生成领域做到了SOTA(State of the Art),一下子就将相关领域的效果推进了很多,获得广泛关注。Sora使用基于视频时空patch的方式,将视频可以表示成类似大语言模型Token的形式,从而可以用类似LLM的方式使用Diffusion Transformer(DiT)进行训练和生成。Sora可以根据文本和图片提示,生成60秒任意分辨率和长宽比的视频,更令人兴奋的是,这个视频中会更好地模拟每个对象的物理特性,从而看起来非常真实。

不过就目前来看,Sora距离真正的强人工智能和世界模型还是有较大的差距。Meta的首席AI科学家Yann LeCun指出,Sora能生成出4条腿的蚂蚁,就说明了Sora不能真正地像人一下理解世界的常识。比如幼儿哪怕是小动物,都能从简单的观察中意识到,一切抛掷的物体终将落向地面,但Sora这样的模型,只能通过海量的训练数据,去模拟这样的行为,并不能真正地实现“世界模型”。

上海智位机器人股份有限公司

高级工程师/AIGC小组主理人 夏青

Sora是一个在工程领域成功的模型,其创新性地结合了扩展模型和Transformer模型。它的物理过程、长距离关联性、3D连续性等特性让人震惊,让我们再次看到大规模参数训练后产生的涌现。它是否代表人工智能已经理解了现实世界,甚至是通向AGI的第一步?同时,其生成60秒的视频的能力也超越了许多现有的工具。虽然目前Sora并未提供接口供公众使用,但我们预见其在短视频领域的巨大潜力。然而,其稳定性可能是一个问题,需要进一步地训练和使用以稳定输出。对于监管,利用区块链技术进行可追溯的水印可能是一个解决方案。

派欧云计算(上海)有限公司(PPIO)

Sora之所以能引起如此大的震动,是因为它在一定程度上实现了物理世界的虚拟化,是当前最接近AGI概念的产品。Sora不仅能理解用户在提示中提出的要求,还能模仿这些物体在物理世界中的存在方式。比如一大群纸飞机在树林中飞过,Sora知道碰撞后会发生什么,并表现其中的光影变化,这其中的技术突破是远超预期的。Sora的问世也正印证了硅谷的新摩尔定律:模型能力1-2年提升一代,训练成本18个月下降4倍,推理成本18个月下降10倍。

从商业上看,AI在应用层如雨后春笋般发展,各行各业都在涉及。而大模型的训练与推理、生成式AI应用的规模化落地,需要新一代的基础设施来支撑。GPU和云作为AI的军火,其市场需求将更加旺盛,未来几年甚至会供不应求。当下的AI模型训练主要依靠英伟达GPU,但主流算力芯片已经供不应求,有机构预测到2024年需求将达到150-200万。虽然现在来看ARM、英伟达、台积电构建的全球AI半导体产业链可能是短期的最大收益者,但未来或许会迎来更大的竞争。目前,对于中国企业来讲,算力基础设施的自主化建设、尤其是算力芯片,仍是在AI赛道上与全球保持同步进步的重要方向。

来源|央视网、腾讯科技、北京新闻广播微信公众号,达观数据、森亿智能、智位机器人、PPIO

编辑|王芳

审核|姚远

校对|办公室

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日媒:美“新型”稀土技术,可高效清洁回收稀土,或动摇稀土霸权

日媒:美“新型”稀土技术,可高效清洁回收稀土,或动摇稀土霸权

爆角追踪
2026-03-27 14:43:47
“咬死”ASML,禁止维修光刻机只是开始,轮到中国工程师头疼了!

“咬死”ASML,禁止维修光刻机只是开始,轮到中国工程师头疼了!

流史岁月
2026-03-27 12:05:09
时代最令人失望者!加州州长怒批马斯克:亲手将美国电车王冠让给了中国

时代最令人失望者!加州州长怒批马斯克:亲手将美国电车王冠让给了中国

快科技
2026-03-27 14:18:12
独家|中远海运集运旗下两艘集装箱船已向波斯湾方向折返 暂未通过霍尔木兹海峡

独家|中远海运集运旗下两艘集装箱船已向波斯湾方向折返 暂未通过霍尔木兹海峡

财联社
2026-03-27 15:20:06
美国内阁花式夸夸群再上演,美国内政部长:委内瑞拉应为特朗普立雕像;美国国防部长:特朗普为“自由世界”所作的努力“应载入史册”

美国内阁花式夸夸群再上演,美国内政部长:委内瑞拉应为特朗普立雕像;美国国防部长:特朗普为“自由世界”所作的努力“应载入史册”

极目新闻
2026-03-27 20:01:33
女教师回家途中被撞倒后遭碾压拖行5.9公里后身亡,肇事司机涉嫌超速醉驾、销毁证据、找人“顶包”,车上多人被公诉

女教师回家途中被撞倒后遭碾压拖行5.9公里后身亡,肇事司机涉嫌超速醉驾、销毁证据、找人“顶包”,车上多人被公诉

每日经济新闻
2026-03-27 20:23:04
荷媒:世界杯正赛队库拉索面对中国表现平平,没展示出任何竞争力

荷媒:世界杯正赛队库拉索面对中国表现平平,没展示出任何竞争力

懂球帝
2026-03-27 20:30:12
伊朗宣布:关闭霍尔木兹海峡,通过者将遭严厉打击,敦促西亚各国民众立即撤离美军驻扎区域!特朗普:伊朗想让我当最高领袖,但我拒绝了

伊朗宣布:关闭霍尔木兹海峡,通过者将遭严厉打击,敦促西亚各国民众立即撤离美军驻扎区域!特朗普:伊朗想让我当最高领袖,但我拒绝了

每日经济新闻
2026-03-27 18:47:26
打虎!广东省政协副主席郭永航被查

打虎!广东省政协副主席郭永航被查

极目新闻
2026-03-27 18:37:06
浙江宣传批《逐玉》男主演“粉底液将军”:肌肤细腻、形象轻佻

浙江宣传批《逐玉》男主演“粉底液将军”:肌肤细腻、形象轻佻

互联网大观
2026-03-27 10:39:27
邓超孙俪正式解绑:16年婚姻,各自安好

邓超孙俪正式解绑:16年婚姻,各自安好

手工制作阿歼
2026-03-27 20:41:14
张本智和回击中国网友:我是自愿加入日本籍的,凭啥让我滚出四川?哭诉:那是我老家

张本智和回击中国网友:我是自愿加入日本籍的,凭啥让我滚出四川?哭诉:那是我老家

乒乓网国球汇
2026-03-27 00:03:40
张雪峰女儿张姩菡发文缅怀爸爸,引网友泪目

张雪峰女儿张姩菡发文缅怀爸爸,引网友泪目

环球网资讯
2026-03-27 10:41:04
打虎!郭永航被查

打虎!郭永航被查

新京报
2026-03-27 18:25:25
张雪峰去世事件升级!网传有健身房的跑步机空无一人,恐慌加剧…

张雪峰去世事件升级!网传有健身房的跑步机空无一人,恐慌加剧…

火山詩话
2026-03-27 17:20:58
惨烈!刘传兴仅打1分钟遭陶汉林肘击痛苦倒地 被担架车推下场

惨烈!刘传兴仅打1分钟遭陶汉林肘击痛苦倒地 被担架车推下场

醉卧浮生
2026-03-27 20:16:10
一女子在湖南省道县人民医院生产后,与新生儿不幸双双离世,多方回应

一女子在湖南省道县人民医院生产后,与新生儿不幸双双离世,多方回应

半岛官网
2026-03-27 15:13:26
库拉索怎么进世界杯的?国足并不菜!张玉宁8.5分最高 韦世豪第二

库拉索怎么进世界杯的?国足并不菜!张玉宁8.5分最高 韦世豪第二

刀锋体育
2026-03-27 16:37:11
法国发布重磅提醒?美军若强行插手台海,法国军事分析做出推演

法国发布重磅提醒?美军若强行插手台海,法国军事分析做出推演

安安说
2026-03-27 12:18:51
杨希今天单挑完胜2大欧洲联赛主力前锋:坐稳国足主力右后卫!

杨希今天单挑完胜2大欧洲联赛主力前锋:坐稳国足主力右后卫!

邱泽云
2026-03-27 17:57:00
2026-03-27 22:11:00
上海浦东软件园
上海浦东软件园
这里是浦软,高科技企业高地!
2904文章数 271关注度
往期回顾 全部

科技要闻

杨植麟张鹏夏立雪罗福莉,聊龙虾、聊涨价

头条要闻

男生欲性侵15岁女同学将其杀害 事后去事发地查看情况

头条要闻

男生欲性侵15岁女同学将其杀害 事后去事发地查看情况

体育要闻

邵佳一:足球就像一场马拉松

娱乐要闻

范玮琪加盟,官宣《浪姐7》遭全网抵制

财经要闻

我在小吃培训机构学习“科技与狠活”

汽车要闻

与众08,金标大众不能输的一战

态度原创

时尚
本地
家居
数码
健康

女友BELLA+封面 | 张哲旭&弭金:寻找与契合

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

家居要闻

曲线华尔兹 现代简约

数码要闻

哈趣Ace1:百元价位千元体验,IP67防护+杜比级声场的全能耳夹耳机

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版