网易首页 > 网易号 > 正文 申请入驻

刚刚!阿里开放世界模型“快乐生蚝”来了,从视频到一个新世界

0
分享至


智东西
作者|王涵
编辑|李水青

智东西4月16日报道,刚刚,阿里ATH创新事业部也发布了其首款开放式世界模型HappyOyster(快乐生蚝)

基于原生多模态架构,该模型支持多模态理解、音视频联合生成以及实时世界构建与交互。

▲一个自由行走的伐木棕熊,角色与场景在转向后都可以保持一致性

在HappyOyster中,仅凭一行文本或一张图片,用户就可以生成一个完整的物理世界。并且,其生成的并非仅仅是视频片段,而是一个持续运行的物理世界。在这个世界里,光照、重力、角色动作以及场景间的因果关系都保持时间和逻辑上的连续一致。

▲真实还原梵高画作风格和细节,元素依照物理规律放置,随着视角转换无畸变现象

与传统的「写提示词—等待渲染—收到成片」一次性工作流的AI视频工具不同,在整个生成过程中HappyOyster可以实时接收指令,场景会实时作出反应,并随着用户的持续指令不断演化。同时,用户生成的数字世界,不仅能被完整保存,还能开放给其他用户进行二次创作。

▲用户可以创造出一个实时滑雪的场景,角色转向自如,雪地上的滑板印清晰明显

智东西第一时间获取了邀请码,体验后发现HappyOyster在“世界一致性”上确实带来了惊喜,主角形象、场景风格和物体位置都可以保持稳定,没有出现常见的畸变或错乱。同时,实时修改指令后,世界画面能够立刻响应。不过目前,模型的流畅度还有待提升,控制人物移动与镜头旋转,都能感知到卡顿。

自3月阿里巴巴CEO吴泳铭带队组建ATH以来,团队动作不断。此前在开发者圈引发热潮的HappyHorse尚未登场,HappyOyster就已试图将布局拓展至更远:从 “生成视频”,正式迈向AI领域专家李飞飞所提出的 “生成世界” 全新高地。

该模型于今日开启内测,内测名额还在持续释放中。

体验地址:https://www.happyoyster.cn/

一、亲测生成世界:人物不畸变、场景丝滑切换,但视角切换有卡顿

据HappyOyster官网介绍,目前该模型具备导演模式漫游模式。其中,导演模式生成的世界最多可以有3分钟,分辨率可以选择480p或720p;漫游模式则至多生成1分钟的世界,且清晰度只有480p。两种模式下,世界都是声画同时生成的。


▲导演模式与漫游模式参数

在导演模式中,用户可以随时介入所生成的世界,通过文本、语音或图像来切换镜头角度、指导角色行动,或改变故事的走向,世界会立即响应,并按照这些指令继续展开。

▲潜水员在海底接近沉船

我们在导演模式下,选择480p的清晰度和“Regular”和“Steady”模式,输入提示词如下:

[开场] 你是一名火星基地的宇航员,结束舱外作业,进入气闸舱。关闭厚重舱门,气压读数上升。摘下头盔,汗水顺着脸颊滑落,深吸一口循环空气中的金属味。 [走进生活舱] 绿色植物在LED灯下生长,跑步机靠墙,舷窗外红色荒漠延伸至地平线。坐到电脑前,敲下:“第287天,一切正常。” [推开植物舱门] 湿润的热浪扑面而来。番茄藤爬满支架,LED灯光闪烁,自动灌溉系统发出轻微的嘶嘶声。 [爬上观测台] 进入穹顶观测台。360度全景玻璃外,火星星空璀璨夺目,火卫一正快速划过天际。 [进入休息舱] 穿过走廊进入休息舱。窄小的床铺,墙上贴着家人的照片。躺下时,飞船金属骨架发出熟悉的吱呀声。

HappyOyster生成世界的效果如下:

从视频清晰度来看,HappyOyster生成的画面整体清晰,场景切换时画质稳定无断层;在真实感上,主角身材、衣着、样貌均未出现畸变,宇宙飞船风格也保持统一,不过在场景切换时仍带有一定AI生成痕迹。视频所配的背景音乐也符合画面调性。

指令遵循方面,输入修改指令后世界能够立即响应并实时更改画面,执行效率较高;物理规律层面,整体符合基础物理逻辑,但也存在少量bug,比如角色从窗户进入时,窗框出现了像橡皮一样被扯开的变形问题。

在漫游模式中,用户能以第一人称漫游,自由改变方向和镜头运动,突破原有画面边界,而世界则会持续生成并保持连贯。在这个世界里,物体的位置保持稳定,环境随时间持续存在,用户移动时视角与光照也会连续响应。

▲一个男人在废土世界中行走

我们在漫游模式下选择第三人称视角,输入提示词如下:

一位穿着冰蓝色长裙的银发女子站在冰封的湖面上。雪花围绕她飞舞,她的长发和裙摆随风飘动。背景是极光和雪山,冰面反射出她的身影和极光。镜头围绕她旋转,捕捉冰晶在阳光下折射的七彩光芒。

从视频清晰度来看,HappyOyster生成的世界画面清晰,漫游过程中视角转动、场景切换都十分流畅,光影效果会跟随视角自然变化,镜头旋转一周后,场景内物体位置依旧保持固定,没有出现漂移错乱。

在真实感与AI痕迹上,生成的环境与主角形象高度贴合提示词描述,人物无畸变、无穿模,整体自然真实,AI生成痕迹较弱。在指令遵循程度上,模型能准确响应操控指令,可顺畅控制角色行进方向,以及镜头的朝向与角度。

在物理规律层面,场景物体空间位置稳定,视角与光影的联动变化符合现实逻辑,整体物理表现连贯合理。

美中不足的是,无论是在导演模式还是漫游模式下,控制人物和镜头还会出现卡顿的情况。

在X上,也有用户分享出了自己的作品。她制作了一一个颜色鲜艳、光怪陆离的世界,在世界中有一个小男孩背着背包在行走。这位网友说(她)使用的是导演模式,分辨率480p,选择「常规」与「稳定」设定,然后输入提示词即可。

▲网友实例(来源:X)

除了现实风格,用户在HappyOyster中还可以生成漫画、水墨画、素描等不同画风 的世界。

▲漫画风格的世界,汽车川流不息

此外,世界中的主角也不仅仅局限于人类,在HappyOyster里,用户还可以创造以物品或动物、昆虫等为第一视角的世界。

▲足球视角在足球场上滚动

▲蚂蚁视角在衣服上爬行

二、对标谷歌Genie3,阿里押注“世界模拟器”路线

相比大语言模型相对成熟的模型架构和技术范式,世界模型仍属于前沿探索领域。

据HappyOyster团队介绍,阿里的HappyOyster与谷歌的Genie3同属于世界模拟器流派。区别于传统文生视频模型输入提示词、等待渲染、获得成片的被动流程,这一流派采用长时间跨度上的世界演化建模方式

通过学习海量长视频数据,以及文本、动作指令、图像参考等多样控制信号,模型能够主动理解空间、物理与因果规律,预测情节和画面的演变,从而把“被动生成内容”转变为“主动模拟世界演化”。

此次阿里发布的HappyOyster采用了时间跨度更长的世界演化建模方式,使得模型能够保持高保真、长时序的动态场景生成。

同时,该模型在建模初始就设计了多样的控制信号,使模型能够在统一的时序框架下同时实现生成质量、长时序与实时可控性的协同优化。

结语:阿里入局,给世界模型再添一把火

阿里ATH创新事业部在2026年3月正式成立,到今天是整一个月。

在这一个月的时间里,ATH创新事业部发布了企业级AI原生工作平台“悟空”、AI开发工具秒悟Meoo、视频大模型HappyHorse,进度不可谓不惊人。

今天阿里ATH正式入局世界模型,给世界模型赛道再添一把猛火。

在阿里发布世界模型的同一天,腾讯也推出了混元3D世界模型2.0。前一天李飞飞的渲染引擎Spark 2.0开源,1月爱诗科技发布了世界模型PixVerse R1。

这4个月以来,世界模型更新的节奏快得让人喘不过气,也能从侧面反映出:世界模型已经开始真刀真枪地抢地盘了。

这场关于“谁能造出更真、更活、更好玩的数字世界”的较量,才刚刚热起来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国西湖市91岁奶奶不接电话,警方上门找人,发现她正忙着打破游戏里的个人纪录……

美国西湖市91岁奶奶不接电话,警方上门找人,发现她正忙着打破游戏里的个人纪录……

都市快报橙柿互动
2026-04-16 22:22:55
突发!以色列发动大规模空袭

突发!以色列发动大规模空袭

农民日报
2026-04-17 00:59:15
西双版纳泼水节一汽车车门及后备箱被人拉开,多人向车内喷水,车主称父母全身淋湿、内饰冒烟,汽车如检查出问题会报警

西双版纳泼水节一汽车车门及后备箱被人拉开,多人向车内喷水,车主称父母全身淋湿、内饰冒烟,汽车如检查出问题会报警

大象新闻
2026-04-16 08:45:11
主持人曝何超蕸终身未婚原因:和二太蓝琼缨有关,她有知心伴侣

主持人曝何超蕸终身未婚原因:和二太蓝琼缨有关,她有知心伴侣

悦君兮君不知
2026-04-16 05:18:41
不是克洛普!弗洛伦蒂诺锁定皇马新帅,英超传奇成终极人选

不是克洛普!弗洛伦蒂诺锁定皇马新帅,英超传奇成终极人选

澜归序
2026-04-17 05:18:42
哈登两度逃出局!果然是真大腿啊!

哈登两度逃出局!果然是真大腿啊!

柚子说球
2026-04-16 22:46:27
《乘风2026》嘉宾赵子琪喊话芒果TV:是逼我爆所有的料吗,我跟慧雯吵架的视频是怎么被你们剪辑出来的

《乘风2026》嘉宾赵子琪喊话芒果TV:是逼我爆所有的料吗,我跟慧雯吵架的视频是怎么被你们剪辑出来的

鲁中晨报
2026-04-16 09:25:03
五百块从树农手里买走,数万、十几万卖到别墅区:一棵老柿树的奇幻漂流

五百块从树农手里买走,数万、十几万卖到别墅区:一棵老柿树的奇幻漂流

新京报
2026-04-16 08:03:24
明明是联盟前五球星,却被烂摊子拖垮!或许该走了,你不亏欠什么

明明是联盟前五球星,却被烂摊子拖垮!或许该走了,你不亏欠什么

老梁体育漫谈
2026-04-17 00:54:18
浪姐7:姐姐cos经典角色,李小冉的安琪太美,陈瑶的岳绮罗太惊艳

浪姐7:姐姐cos经典角色,李小冉的安琪太美,陈瑶的岳绮罗太惊艳

星宿影视鸭
2026-04-16 18:07:30
中国向伊朗提供紧急人道主义援助

中国向伊朗提供紧急人道主义援助

新华社
2026-04-16 23:43:04
4月17日精选热点:核聚变再次重磅利好,这些三大核心龙头要大涨

4月17日精选热点:核聚变再次重磅利好,这些三大核心龙头要大涨

元芳说投资
2026-04-16 21:12:07
脸没恢复就别出来拍剧了,顶着膨胀脸、说话嘴歪全是痘坑,太出戏

脸没恢复就别出来拍剧了,顶着膨胀脸、说话嘴歪全是痘坑,太出戏

翰飞观事
2026-04-16 17:03:30
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
坐后座不系安全带,北京一市民晒出罚单!

坐后座不系安全带,北京一市民晒出罚单!

家住东西城
2026-04-16 19:32:29
许家印认罪后老家的功德碑还在,村民:一定会永久保留

许家印认罪后老家的功德碑还在,村民:一定会永久保留

映射生活的身影
2026-04-16 19:18:33
哎呀,见到了真人才知道她真的有多美!比电视上还好看还自然

哎呀,见到了真人才知道她真的有多美!比电视上还好看还自然

喜欢历史的阿繁
2026-04-16 14:37:01
中国足球小将邝兆镭读秒进球绝平巴萨,收到了转会通知引发热议

中国足球小将邝兆镭读秒进球绝平巴萨,收到了转会通知引发热议

烟浔渺渺
2026-04-16 18:02:47
全欧看不懂的豪赌!带队降级的孔帕尼,把拜仁焊成了欧洲头号噩梦

全欧看不懂的豪赌!带队降级的孔帕尼,把拜仁焊成了欧洲头号噩梦

老骾体育解说
2026-04-15 21:21:31
吴昕带男友郑凯与何炅聚餐,曝已相恋7年,比吴昕小两岁又高又帅

吴昕带男友郑凯与何炅聚餐,曝已相恋7年,比吴昕小两岁又高又帅

林轻吟
2026-04-16 19:49:36
2026-04-17 07:19:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11612文章数 117031关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

特朗普:伊朗已同意几乎所有要求

头条要闻

特朗普:伊朗已同意几乎所有要求

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰谁的生意?

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

艺术
游戏
数码
公开课
军事航空

艺术要闻

这 4 个红底黑字,藏着毛主席给一位普通母亲的最高赞誉,看完泪目

可爱又凶狠!卡牌新游《小熊牌屋》中文上线特惠开启

数码要闻

荣耀史上最短发布会,发布荣耀史上最强MagicBook数字系列

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

封锁霍尔木兹海峡后 美释放双重信号

无障碍浏览 进入关怀版