今天,阿里巴巴 ATH 事业群推出了开放式世界模型产品 Happy Oyster(快乐牡蛎)。
![]()
与此前在排行榜霸榜、主打高品质视频生成的“Happy Horse”不同,Happy Oyster 的定位是“实时世界引擎”。
四百年前,莎士比亚曾写下:"The world is your oyster." 世界是你的牡蛎,等你亲手打开。
“Happy Oyster”名字应起源于此。
和世界模型的产品设定也很搭:说一句话,就能拥有一个以创造(Create)、漫游(Wander)、导演(Direct)、分享(Share)四大核心能力为支点的AI世界,你可以像导演一样掌控剧情与事件,也可以像旅人一样在无边想象中沉浸体验。
Happy Oyster 基于原生多模态架构,其底层是一个支持音视频联合生成的流式生成世界模型。
在过去,类似 Sora 或 Gen-3 的工具更像是“后期剪辑师”,你输入指令,它渲染出一段固定的短片。
而 Happy Oyster 的逻辑更接近于“实时渲染引擎”,它不再是单次交付,而是在生成过程中持续接收指令,让场景随你的意志实时演化。
从目前放出的作品 Demo 来看,堪称惊艳。
目前 Happy Oyster 主要提供两种深度交互模式,以满足不同创作需求:
一个是导演模式(Director Mode):支持最长 3 分钟的视频生成,最高分辨率为 720p。
创作者可以在生成过程中随时切换机位、指挥角色行动,甚至改变剧情走向。
一个是漫游模式(Roam Mode):支持 1 分钟的实时生成,分辨率为 480p。这一模式允许用户以第一人称视角在生成的 3D 环境中自由移动,支持键盘控制与摄像头实时驱动,真正实现“所言即所见,所行即所得”。
根据目前披露的产品细节,Happy Oyster 最大的特点在于,低延迟的交互反馈。
相比于传统世界模型长达数分钟的渲染等待,它具有以下代际优势:
1. 流式反馈:它打破了“Prompt-渲染-成品”的线性流。在生成过程中,你可以通过文字、语音或图片动态干预,世界会立即做出反应。
2. 物理逻辑一致性:依托阿里强大的多模态训练,Happy Oyster 对物理规律(如重力、碰撞、光影变化)有更深层的模拟,生成的 3D 动态环境在视角转换时能保持极高的稳定性。
3. 音画同步生:它是行业内少有的原生支持音视频联合生成的模型,环境音效会随场景变化自动匹配,无需二次配音。
![]()
目前 Happy Oyster 已正式开启内测,可以通过官网 happyoyster.cn 加入候补名单。
从“Happy Horse”到“Happy Oyster”,阿里看起来正通过一套完整的 AI 内容生态链打造其“happy 宇宙”。
下一个“happy”产品会是什么?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.