4月16日,阿里ATH创新事业部突然扔出一款产品——HappyOyster(快乐生蚝)。这个名字和去年爆火的HappyHorse出自同一支团队,但玩法完全不同:它不是生成一段视频让你看,而是造一个能逛、能改、能演的数字世界。
同一天,谷歌Genie3也在刷屏。两家巨头撞车,把「世界模型」这个冷僻概念推到了台前。
![]()
从「生成内容」到「模拟世界」,技术路线变了
传统文生视频的流程你很熟悉:写提示词、等渲染、收成片。HappyOyster和Genie3走的不是这条路。
它们的核心叫「世界演化建模」——让AI学习海量长视频里的空间关系、物理规律、因果链条,然后主动预测画面怎么变。不是被动响应指令,而是持续模拟一个世界的运转。
阿里团队在这个基础上做了差异化设计。HappyOyster采用更长的时间跨度建模,把生成质量、长时序连贯性、实时可控性塞进同一个时序框架里优化。简单说:画面要好,故事要长,中途还能插手改剧本。
漫游+导演:两种打开方式
产品落地成两个模式。
「漫游」模式像第一人称游戏。你扔一句话或一张图,AI生成带物理一致性的完整空间——物体位置固定、场景持久存在,视角和光照跟着你走。目前支持1分钟连续实时位移,镜头方向随便切,风格也能换。
「导演」模式更激进。你可以在视频任意节点介入,用文字、语音或图像调度角色、改写剧情、切换镜头。系统实时生成后续画面,保持光照、重力、动作逻辑的连贯演化。当前支持3分钟以上480p或720p实时生成。
两个模式还没打通,但路线图很清晰:未来要让你在逛的过程中随时改规则,边探索边创造。
ATH团队:阿里内部的「创新特区」
HappyOyster的研发方ATH创新事业部,去年靠HappyHorse出过一次圈。那款产品主攻多模态生成,这次换了个更难的赛道。
世界模型目前没成熟的技术范式,属于前沿探索。阿里选这个时机入场,明显是盯上了交互范式的迁移——从「看内容」到「进世界」。
这个判断和谷歌一致,但产品侧重点不同。Genie3强调通用世界模拟,HappyOyster更聚焦创作工具属性:实时导演、风格切换、可保存可二次创作的世界文件。
三个场景,生产逻辑在变
游戏开发是第一批受益者。开发者能快速生成可玩原型,玩家实时驱动世界演化,动态剧情分支不再需要预设脚本堆量。成本结构和沉浸感同时改善。
影视创作更直观。导演用自然语言描述创意,系统实时生成分镜,任意节点改镜头、换角色、调剧情。创意验证周期从「等渲染」变成「边聊边出片」。
文旅和教育则是体验升级。用户以第一视角走进名画或历史场景,交互中探索因果、改写走向。知识传递变成沉浸体验,这个转换的价值很难用旧指标衡量。
阿里还提了更远期的想象:线下智能空间、穿戴设备联动,根据人的位置、动作、语言实时生成内容,让数字世界和现实共振。
数据收束
1分钟连续漫游、3分钟实时导演、480p/720p输出规格——这些数字框定了HappyOyster当下的能力边界。世界模型赛道,谷歌Genie3和阿里HappyOyster已经站上了同一起跑线,但产品化路径开始分化:一个偏通用模拟,一个偏创作工具。
真正的竞争不在技术论文,而在谁能先让用户愿意为「可交互的世界」付费。这个转化漏斗的数据,目前还是空白。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.