全文 3,000字 | 阅读约 8 分钟
(Sora 2 发布会完整实录:技术负责人详解产品理念)
2025 年 9 月30 日,OpenAI 发布 Sora 2(网页:https://sora.chatgpt.com/explore) 及其配套的APP Sora( 苹果下载:https://openai.com/sora/, 安卓版本即将推出)。
这不仅是一次模型升级,更是一次产品形态的根本转变。OpenAI 首次把生成式视频能力,放进了一个类 TikTok/抖音 的信息流应用中。但它不只是想让你刷内容,而是想让你出现在内容里。
Sora 2 的核心是一个名为 Cameo 的功能:通过 10 秒视频录制,你可以把自己上传进模型,让 AI 在任意场景中复现你的外貌、声音和表情。
OpenAI 首席执行官 Sam Altman 在博客中说:
我们想打造的,不是下一个 AI 内容工具,而是新一代创作和连接的媒介。
与此同时,AI 视频生成正成为科技巨头的新战场。MiniMax 公司推出海螺 AI,快手发布可灵,智谱上线清影;海外,Meta 推出 Vibes,Google 也在测试 Veo 3并计划整合入YouTube。
但 Sora 的产品定位不同。
它没有把重点放在视频质量、生成速度或内容推荐上,而是押注在一个更深层的问题:
AI 视频,能不能成为人类关系的新表达方式?
第一节|它开始看懂世界了
在发布会现场,研究科学家、Sora 项目负责人 Bill Peebles 点出了核心:
“你上手 Sora 2 后第一感受是:它对世界的反应更自然、更真实。”
重点不是效果好,而是它的反应符合物理直觉。
在 Sora 1 的时代,如果你让 AI 生成“篮球运动员投篮”的视频,它可能会这么做:动作看起来差不多,但如果球没进,它会让球“瞬移”进篮筐,或者直接跳过结果。
技术人员 Thomas Dimson 说,这不是 bug,而是早期模型太想让事情成功,以至于会违背常理。
而 Sora 2 变了。
如果球没进,它就没进。球会撞到篮板,弹回来。
这听起来像是个小变化,但其实是AI 在开始理解失败、接受失败、呈现失败。
✅ 为什么重要?AI 视频第一次“承认失败”
因为这是视频生成技术第一次出现“物理感”。
Sora 2 可以理解:
什么是重力;
什么是惯性;
什么是物体与地面的摩擦;
人翻身跳跃之后会怎么落地。
(Sora 2生成花样滑冰运动员,完成跳跃,再稳稳落地)
发布会中展示的一个场景是:
“一个花样滑冰运动员头顶一只猫,完成三周半跳。”
过去 AI 会让猫直接消失、人物穿模、画面崩塌。
但这次,猫在头上挣扎地保持平衡,滑冰选手完成跳跃,再稳稳落地,一切动作看起来就像是物理真实发生的一样。
Thomas 说:“这不是预设动作库,而是 AI 自己生成这些动作。就像它在脑海里构建了一个动态世界,然后让画面自然演绎出来。”
✅ 不再是“视频特效”,而是“世界模拟”
在现场演示中,还有两个重要变化:
一次性生成多镜头的长场景
以前,AI 做视频是“一段段拼接”;现在,它可以理解故事结构,用镜头语言讲清楚情节。
声音也能同步生成
包括背景音、人物语音、甚至唇形都能对应上。角色说什么话、嘴怎么动、周围什么声音,全都同步。
OpenAI 的目标不是让 AI 画出几个漂亮画面,而是搭建一个可感知、可互动的世界。
✅ 技术升级的核心:AI 开始“建立自己的世界观”
不是效果更强,而是它开始像人一样有“直觉”。
不是画出你要的画面,而是先想象一个世界,再让画面自然发生。
不是机械地执行提示词指令,而是理解场景会怎么展开。
这就是 OpenAI 所说的模拟真实世界的能力(world simulation capabilities)。Sora 2 正在往那个方向迈出第一步。
而这个变化的意义不仅在技术上,更决定了它之后能不能成为真正的平台。
如果它能“看懂”世界,那它未来就可能成为 AI 帮你讲故事、表达想法、沟通情绪的媒介,而不仅仅是个做视频的工具。
第二节|Sora 要你和朋友一起玩
Rohan 是 Sora 产品团队领导。
他在发布会开场就明确表示:
“你看到的不是算法推荐的热门视频,而是朋友圈里的创作。视频里会出现你认识的人,你的朋友可以把你、把他们自己、把共同好友放进任何场景。”
这是 Sora 跟现在主流平台最大的不同。
而让这一切成立的核心功能,叫 Cameo。
✅ Cameo 是什么?
你只需要录一段十几秒的短视频,说几句话、左右转转头,系统就会抓取你的样子、声音和习惯动作。之后,你就可以:
把自己放进任何一个 Sora 生成的场景;
跟朋友的头像一起同框出现在“太空战斗”或“浪漫广告”里;
或者,被朋友“加入”他们的视频项目中,你完全不需要拍摄,只要授权就行。
Rohan 还现场展示了几个真实例子:
他和 OpenAI CEO Sam Altman 一起出现在同一支广告片段里,说着话,唇形对得上,动作自然切换;他让狗狗 Rocket 以动漫风格出现在雪地视频里;他还演示了怎么在自己的 Cameo 设定里添加偏好,比如“我总是戴金链子”、“我想穿西装”、“别给我奇怪口音”等等。
这不是滤镜,也不是贴图,而是把你变成可参与的角色
✅ OpenAI 社交方向怎么走的?
① 从内容关注转向人际关注
默认信息流,不是推荐热门话题,而是优先展示你熟人生成的视频、你互动过的账户内容。
也就是说:不是推荐最好看的,而是你最可能参与的。
Rohan 说:
“如果你看到一个香水广告,你可以点进去 Remix,然后把自己加进去,变成主角,换成你自己的旁白。”
这一机制,让视频不是终点,而是下一次互动的邀请。
② Cameo 权限机制设计得非常细
每个用户都可以完全控制谁可以用你的形象:
只有我自己
我允许的人
我关注的 + 互相关注的人
所有人(完全公开)
每个视频里如果用到了你的肖像,你都能收到提醒,哪怕那条视频只是草稿、还没发布。你还可以随时撤回某段视频的授权,甚至永久删除一切有关你形象的生成内容。
Rohan 强调:
“你的脸是你的,不是平台的。谁能用你的形象生成视频,完全由你决定。”
✅ 为什么这个方向重要?
现在大多数视频平台,都在比谁算法更准、谁流量更多、谁用户黏性更强。
但 OpenAI 走的是另一条路,让朋友之间用视频互动起来。
这让 Sora 成为一种新的媒介形态:
你不需要成为创作者,不需要剪辑能力;
你只要上传自己,就能参与别人创作的世界;
每个视频都可以是一次社交互动:不是点赞评论,而是“我也做了一个跟你有关的版本”;不是打榜上墙,而是“我让你出现在了这条视频里”。
也正因如此,Sora 没有加入流量竞争,而是找到了另一个空间:AI 不只是你用的工具,而是你和朋友共同创作的空间。
第三节|做一条,胜过刷十条
Sora 看起来像是一个短视频平台, 但真正用过之后,你会发现,它想要的不是你多刷几条视频,
而是让你停下来,动手做一条属于你自己的。
✅ 激发创作,而非吸引眼球
Rohan 展示了 Sora 应用的主界面。和 TikTok 类似,用户可以上下滑动浏览视频。但与众不同的是:
页面上每一条视频下方,都有一个显眼的按钮:Remix(混合)
你可以点击后,直接把自己加进去,改画面、加动作、换主题、讲同一个故事的新版本
比如你看到朋友生成了一条“在海边庆祝生日”的视频,你可以直接用它的模版,加入自己的 Cameo,改成“在雪山顶庆祝”,还可以换台词和音乐。
你从旁观者变成了参与者。
✅ 设计细节处处围绕“创作优先”
不仅是界面动线,整个产品结构都在鼓励你参与进去。
反无限滑动机制: Thomas 透露,Sora 不鼓励用户一直往下刷。如果用户滑得太久,系统会弹窗提醒,引导他们尝试创作。
青少年保护设置: 针对未成年用户,默认不开放无限浏览权限。信息流观看时长被自动限制,鼓励先体验再创作。
控制内容节奏的“情绪引导”设计: 在 Sora 的信息流顶部,有一个测试功能,你可以用一句话告诉它:我想放松一下;给我看点轻松的动物视频;想找创作灵感。
这些设计的核心是把控制权交给用户。
不是算法推荐内容,而是你告诉 AI 想看什么,从而找到健康的创作起点。
Altman 给出了一个清晰的评估标准:半年后,如果用户觉得“我变得更有创造力”,那就成功了;如果觉得“花了时间但没留下什么”,那就失败了。
今天,绝大多数内容平台都在优化:“沉浸感”和“推送精准度”,让用户停留更久。
但 Sora 的逻辑不同:
它想成为一个生成表达的空间,而不是内容消费的平台。第四节|Sora 想避开的,不只是竞品,而是旧路
(Sora APP 界面:竖屏视频、有滑动信息流、有点赞评论)
Sora 一发布,很多人第一反应是: “这是不是 OpenAI 的 AI 抖音?”
确实,它有竖屏视频、有滑动信息流、有点赞评论。 甚至在视觉风格上,也刻意做得轻巧、上手快、像社交平台。
但如果你认真看完发布会,就会发现:
Sora 并不想成为 TikTok 的“替代品”,它在尝试的,是一种“内容 + 人”的新组合方式。
✅ 为什么说它不是在挑战 TikTok?
我们先看几个基本事实:
TikTok 已经是超 10 亿级用户的平台,拥有全球最强内容分发网络之一。
用户来 TikTok 的动机,是看内容,不是创作内容。生成式视频的成本高、速度慢,远比滑动播放现有视频的效率低。
如果 Sora 只是想在这些地方跟 TikTok 比,很难找到突破口。
Altman 很清楚这一点。他的观点是:OpenAI 不想做另一个 AI 化的短视频 App,而是想创造一种基于共同创作的新型互动媒介。
✅ 换条赛道:从内容平台到社交媒介
回到产品最核心的设计:Cameo + Remix。
这是 Sora 真正押注的东西靠关系链加上创作意愿。
大部分平台都在从“内容做得更好”这条线上迭代:TikTok 做分发更精准;Instagram 做呈现更美观;YouTube 做内容更长、更深。但本质上都还是创作者生产,观众观看。
Sora 换了方向。
它问的问题是:怎么让你愿意做一条视频,拉上朋友,一起玩?
这也是为什么 Altman 多次提到:“Sora 不是工具,是媒介。”
✅ 所以,Sora 要建立是一种新型社交媒介
不是靠爆款吸粉,也不是靠推荐抓人,而是靠一个新的底层逻辑:
每条视频都是一次邀请,
每个好友都可能成为你创作的角色,
每段内容都连接着你们的关系。
从这个角度看,Sora 做的不只是 AI 视频产品,而是在探索一种全新的表达方式:
重点不是谁发得多、谁火,而是你和谁一起做、一起笑、一起留下回忆。
结语|入口变了
(从工具到媒介:Sora 2 官方宣传片)
Sora 不是生成更快的视频工具,而是换了一个思路:不靠信息流争夺注意力,而是靠你和朋友之间的关系,激发创作的欲望。
它做到的,不是让你看更多 AI 视频,而是让你用 AI 把记忆、想象和关系变成一次创作。
未来这一轮 AI 视频竞争,比的不是谁内容好、谁流量大,而是谁能让用户产生一个念头:
我想做一个视频,把我和你放进去。
这就是“朋友圈入口”的意义:当生成视频成为社交表达,当 AI 不再只是工具而是媒介,视频的使用场景就彻底变了。
这些故事才刚开始,而主角是你,是你的朋友。
本文由AI深度研究院出品,内容整理自 Sora 2 发布会实录、Sam Altman 博客、OpenAI 官方博客及相关公开资料。未经授权,不得转载。
星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标
https://www.wired.com/story/openai-launches-sora-2-tiktok-like-app/
https://blog.samaltman.com/sora-2
https://www.youtube.com/watch?v=1PaoWKvcJP0
https://www.youtube.com/watch?v=gzneGhpXwjU
https://openai.com/index/sora-2/
https://www.wired.com/story/openai-launches-sora-2-tiktok-like-app/
来源:官方媒体/网络新闻,
排版:Atlas
编辑:深思
主编:图灵
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.