网易首页 > 网易号 > 正文 申请入驻

48小时见证AI新战场:阿里入局腾讯开源群核上市,世界模型迎来ChatGPT时刻了吗?

0
分享至


中国AI产业接连上演三场重磅戏码。

上周4月16日至17日,短短48小时内,阿里云发布世界模型HappyOyster(快乐生蚊),腾讯同日开源混元3D世界模型2.0,而专注空间智能的群核科技则于次日登陆港交所,成为“全球空间智能第一股”。这或许并非巧合,他们正在释放一个清晰信号:世界模型赛道正从技术探索迈向商业化临界点。

当Google DeepMind在2025年8月发布Genie 3时,行业还在讨论“什么是世界模型”;八个月后的今天,中国厂商已用集体行动给出答案:这是一场关乎AI未来十年走向的基础设施之争。

据笔者统计,截至2026年4月,全球已有至少12家主要玩家布局世界模型/模拟器赛道,包括Google、OpenAI、Meta、NVIDIA等巨头,以及群核科技、Runway等垂直领域创新企业。其中,群核科技IPO超额认购530倍、上市首日涨144%、市值超300亿港元的资本热情,与阿里、腾讯的战略级投入形成呼应。

一个关键问题浮出水面:世界模型会不会成为继ChatGPT之后的下一个现象级突破?

48小时三大事件:从技术发布到资本验证

2026年4月16日,阿里云ATH创新事业部(Token Hub)正式发布世界模型HappyOyster。这款产品被定位为“世界模拟器”而非单纯的视频生成工具,核心功能包括漫游模式(支持1分钟连续实时位移)和导演模式(支持3分钟以上480p/720p画面)。

HappyOyster采用原生多模态+长时序建模技术路线,与谷歌Genie 3同属“生成式视频派”,但在交互时长上实现突破。值得注意的是,此时距离阿里云在2026年3月财报会上宣布“五年内云+AI收入超1000亿美元”目标仅过去不到一个月。

财报数据显示,阿里云2026财年Q3收入同比增长36%,AI相关产品收入连续10个季度保持三位数增长。HappyOyster的发布,既是技术实力的展示,更是阿里AI战略从“大模型军备赛”转向“世界模型基础设施”的关键落子。

同样在4月16日,腾讯混元团队宣布开源Hunyuan3D 2.0(HY-World 2.0)。与阿里的闭源策略不同,腾讯选择将这款3D世界模型完全开源,并支持与Unity等游戏引擎无缝对接。

HY-World 2.0的核心差异化在于“可导出性”——生成的3D资产文件(Mesh/3DGS/点云)可直接用于二次编辑,而非仅能观看的视频。这一设计直指游戏开发、影视预演等B端场景的工程化需求。

腾讯的开源策略并非偶然。早在2024年,腾讯就通过开源混元系列大模型积累了开发者生态。此次HY-World 2.0的开源,意在抢占“空间智能基础设施”的生态位,与阿里形成差异化竞争。

2026年4月17日,群核科技(Manycore Tech,股票代码0068.HK)在港交所挂牌上市。招股书显示,公司2025年实现营收8.2亿元,毛利率高达82.2%,经调整净利润5710万元,成功实现从亏损到盈利的跨越。

与其他玩家的“烧钱研发”模式不同,群核科技的独特之处在于已验证的商业闭环。公司围绕空间智能构建了“空间编辑工具-空间数据-空间大模型”的业务飞轮,核心产品包括SpatialLM、SpatialGen、SpatialVerse等。

据群核科技创始人兼CEO黄晓煤在上市后交流中表示:“我们用了15年时间积累了全球最大的物理正确空间数据集,这是短期无法复制的护城河。”

IPO阶段,群核科技引入泰康人寿、阳光人寿、广发基金、Redwood、Mirae Asset等全明星基石阵容,合计认资4.55亿港元。香港公开发售获1591倍认购,国际发售获14.46倍认购,上市首日收盘价18.6港元,涨144%,总市值超300亿港元。

这三起事件的集中爆发,标志着中国厂商在世界模型赛道已从“跟随者”转变为“定义者”。阿里、腾讯、群核分别代表了三种不同的战略路径:阿里的“云+模型”一体化、腾讯的“开源生态”卡位、群核的“垂直盈利”验证。这种多元化的竞争格局,为全球世界模型的发展提供了中国样本。

三大流派与12玩家

随着“世界模型”概念迅速走红,一个尴尬的现实是:不同玩家口中的“世界模型”,可能根本不是同一回事。正如研究员Chris Paxton所言,这个术语“相当模糊”。基于对12家主要玩家的技术路线梳理,逼着发现当前世界模型领域已形成三大主流流派,分别由不同的AI领袖押注,且暂无收敛趋势。

首先是生成式视频派(“世界即视频”),代表玩家包括Google Genie 3、OpenAI Sora、阿里HappyOyster、Runway GWM-1。这一流派的核心理念是通过视频生成技术模拟世界演化,认为“能够生成逼真视频就意味着理解了物理规律”。

其技术特点是采用Diffusion Transformer或AR-Transformer架构,强调时序连贯性和画面质量,追求长时长生成(1分钟以上)。Google Genie 3作为该流派标杆,支持实时交互、每秒24帧生成、完全交互式3D宇宙。阿里HappyOyster则在交互时长上实现突破,漫游模式支持1分钟连续实时位移,导演模式支持3分钟以上画面。

优势在于直观、易理解,直接面向内容创作场景,商业化路径清晰。但短板同样明显:对物理规律的理解停留在表象,难以支撑机器人训练等硬核场景。

其次是抽象预测派(“世界即因果”),代表玩家为Meta V-JEPA 2(Yann LeCun主导)。其核心理念是反对像素级重建,主张学习世界的抽象表征和因果逻辑,认为“真正的世界模型应该是预测未来的抽象大脑”。

Meta首席AI科学家Yann LeCun是这一路线的最坚定拥护者。V-JEPA 2采用JEPA(联合嵌入预测架构),在latent space进行预测而非像素空间,强调因果推理和可解释性。据公开测试数据,V-JEPA 2的运行速度是英伟达Cosmos的30倍。

优势在于更接近人类认知方式,适合决策规划任务,算力需求相对较低。但劣势同样突出:缺乏直观输出,难以直接应用于内容创作,商业化场景有限。LeCun本人曾多次公开质疑像素级预测路线,认为那是“低效的表面功夫”。

最后是空间智能派(“世界即3D”),代表玩家包括斯坦福World Labs、腾讯HY-World 2.0、NVIDIA Omniverse、群核科技。其核心理念是真正的世界模型必须理解三维空间和物体关系,能够生成可编辑、可导出的3D资产而非仅视频。

这一流派采用3DGS、NeRF等技术,输出可二次编辑的3D模型文件,强调几何稳定性和空间一致性,并与现有游戏/机器人工作流无缝对接。腾讯HY-World 2.0的核心差异化正是“可导出性”——生成的3D资产文件可直接用于游戏开发。

群核科技则更进一步,拥有全球最大的空间数据集(15年积累),推出SpatialLM空间语言模型和SpatialGen空间生成模型,并开放Aholo空间智能开放平台。优势在于可直接用于游戏开发、机器人仿真,工程化落地最快。

劣势在于实时交互性受限,计算复杂度高,难以实现超长时序推演。

基于技术指标、产品成熟度、商业化进展三个维度,全球12家主要玩家可划分为三个梯队。

第一梯队(产品化领先)包括Google Genie 3、阿里HappyOyster、腾讯HY-World 2.0、群核科技,共同特征是已发布可用产品,技术指标明确,具备实时交互能力,且有清晰的场景定位。其中,群核科技是唯一实现盈利的空间智能企业,2025年营收8.2亿元,毛利率82.2%。

第二梯队(技术独特但场景有限)包括Meta V-JEPA 2、Tesla FSD、NVIDIA Omniverse,技术路线独特但聚焦特定垂直场景,不直接面向大众消费者。

第三梯队(早期探索)包括百度文心、字节豆包、Runway GWM-1、斯坦福World Labs、OpenAI Sora,仍在技术验证阶段,商业化路径不清晰。具体对比详见下图。


中美博弈与商业化突围:谁在真正赚钱

在全球世界模型竞赛中,中美两国呈现出明显的差异化优势。美国的优势在于基础研究、算力垄断和数据资源。LeCun的JEPA架构、DeepMind的AR-Transformer等底层创新均来自美国实验室。NVIDIA GPU和谷歌TPU的算力垄断,以及YouTube视频库、Instagram图像库的数据优势,构成了美国玩家的天然护城河。

中国的优势则体现在工程化能力、应用场景和资本化进程。阿里、腾讯能够在Google Genie 3发布八个月后迅速推出对标产品,体现了强大的工程优化能力。游戏、影视、文旅等消费市场的巨大需求,为技术落地提供了丰富场景。而群核科技的上市,则标志着中国在空间智能赛道率先完成资本化布局。

但一个不容忽视的现实是:底层架构创新目前仍由美国主导,中国厂商更多是快速跟进和工程优化。HappyOyster与Genie 3同属“生成式视频派”,HY-World 2.0的技术路线也与World Labs Marble高度相似。这种“跟随式创新”能否在长期竞争中胜出,仍需时间验证。

尽管技术层面百花齐放,但世界模型的商业化之路仍面临多重挑战。首要问题是推理成本。实时交互意味着更高的算力消耗,Genie 3和HappyOyster均支持每秒24帧生成,但这背后的GPU成本如何消化?To B场景中,哪些企业愿意为这项新技术买单?To C场景中,普通用户为什么需要世界模型?

群核科技提供了一个可行样本。公司聚焦家装设计等垂直场景,通过SaaS+API服务模式实现盈利。2025年8.2亿元营收、82.2%毛利率、5710万元净利润的数据,证明空间智能在特定场景下具备商业可行性。但这一模式能否扩展至通用世界模型,仍是未知数。

另一个关键变量是开源vs闭源的战略选择。Meta V-JEPA 2、腾讯HY-World 2.0选择开源,意在建立生态标准、吸引开发者;Google Genie 3、阿里HappyOyster选择闭源,意在保护核心技术、构建商业壁垒。

短期来看,闭源有助于保护投资回报;长期来看,开源方案可能凭借生态优势实现超越。此外,地缘政治风险也不容忽视。高端GPU出口管制对中国厂商的影响,数据跨境流动限制,技术标准分裂(中美各自主导的生态体系),都可能成为世界模型全球化发展的阻碍。

对于中国厂商而言,如何在有限的算力资源下优化模型效率,如何利用本土数据优势构建差异化壁垒,将是未来竞争的关键。

三种情景与终极逻辑:谁是下一站的基础设施

回到最初的问题:世界模型会不会是继ChatGPT之后的下一个现象级突破?基于当前技术进展和产业动态,钛媒体对世界模型的未来发展做出三种情景化推演。

乐观情景(概率30%):2028年出现杀手级应用。假设技术瓶颈在2-3年内突破,长时序一致性和物理精度达到实用水平。某个垂直场景率先爆发,出现千万级用户的killer app。头部玩家确立行业地位,世界模型成为AI基础设施,与具身智能、机器人产业深度融合。

2030年后,世界模型可能真正成为AGI的“底层操作系统”。

中性情景(概率50%):场景分化,长期共存。技术路线收敛至2-3种主流方案,但不同流派服务不同场景。生成式视频派主导内容创作,空间智能派主导游戏/机器人,抽象预测派主导决策规划。10+玩家淘汰至3-5家,但无明显赢家通吃。世界模型成为AI工具箱中的重要组件,而非替代LLM的下一代基础模型。

悲观情景(概率20%):泡沫破裂,回归理性。技术瓶颈长期无法突破,商业化进展缓慢。大部分玩家因资金压力退出,仅剩Google、Meta等巨头维持研发。“世界模型”概念被证伪或重新定义,行业回归到更务实的“视频生成+3D建模+强化学习”组合方案。AGI路径转向其他技术路线。

透过48小时三大事件的喧嚣,钛媒体观察到一个深层趋势:世界模型的终极竞争不是技术竞赛,而是生态竞赛。

Google凭借DeepMind技术积累和TPU算力垄断,构建的是“技术+算力”双壁垒;阿里依托阿里云和企业客户资源,走的是“云+模型”一体化路径;腾讯通过开源策略,意在吸引开发者、建立游戏/影视生态;群核科技则用15年数据积累和盈利验证,卡位空间智能基础设施。

每一种策略都有其合理性,但最终胜出的,一定是能够构建最完整生态的那一家。这不仅需要技术领先,更需要场景落地、开发者支持、资本助力、政策友好的多维协同。

对于中国厂商而言,短期内的工程优化可以快速缩小差距,但长期来看,必须在底层架构创新上有所突破。否则,即便赢得某一轮产品竞赛,也难以在AGI时代的生态格局中占据主导地位。

2026年4月的这48小时,或许会被后世视为AI发展的一个关键节点。阿里、腾讯、群核的集体行动,标志着世界模型从“实验室玩具”迈向“产业基础设施”。但真正的ChatGPT时刻何时到来,取决于技术突破的速度,更取决于生态建设的深度。

在未来2-3年的窗口期内,我们或将见证第一批标杆案例的出现,也可能目睹部分玩家的黣然退场。唯一确定的是:谁掌控了空间,谁就能掌控物理AI的未来。而这一次,中国企业已经抢先站在了赛道最前方。(本文首发钛媒体APP,文 | DeepWrite秦报局,作者|赵虹宇 )

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马筱梅直播时儿子意外出镜,白皮肤肉嘟嘟的,筱梅满眼爱意藏不住

马筱梅直播时儿子意外出镜,白皮肤肉嘟嘟的,筱梅满眼爱意藏不住

日不西沉
2026-05-10 04:17:07
锁死海峡!阿联酋突袭伊朗,埃及阵风战机驰援:伊朗遭遇凶险包围

锁死海峡!阿联酋突袭伊朗,埃及阵风战机驰援:伊朗遭遇凶险包围

知法而形
2026-05-08 16:39:04
难怪特朗普访华中方迟迟不表态,美媒:原来中方早看不上我们了

难怪特朗普访华中方迟迟不表态,美媒:原来中方早看不上我们了

云舟史策
2026-05-10 07:19:49
中国男乒四大“贵公子”:家境优渥不缺钱,仍为梦想拼尽全力

中国男乒四大“贵公子”:家境优渥不缺钱,仍为梦想拼尽全力

郭揦包工头
2026-04-29 16:09:40
高市早苗表情管理又崩了:与澳大利亚总理同行时,突然张大嘴巴!

高市早苗表情管理又崩了:与澳大利亚总理同行时,突然张大嘴巴!

阿龙聊军事
2026-05-09 19:23:40
日乒录像研究孙颖莎,莎莎训练新招式逗笑马琳邱贻可

日乒录像研究孙颖莎,莎莎训练新招式逗笑马琳邱贻可

乒乓网国球汇
2026-05-10 10:04:28
罗翔:如果一个人突然努力工作,业余时间开始学习,不再参加社交活动,那么,身边的人可能不仅不会帮他,还会拉他下来,原因就一个!

罗翔:如果一个人突然努力工作,业余时间开始学习,不再参加社交活动,那么,身边的人可能不仅不会帮他,还会拉他下来,原因就一个!

谭老师地理大课堂
2026-04-22 00:03:57
“典型的恶婆婆面相”,3年级男孩还要喂饭,母亲的面相暴露问题

“典型的恶婆婆面相”,3年级男孩还要喂饭,母亲的面相暴露问题

妍妍教育日记
2026-05-04 15:49:36
禁止所有中国外交官入境,不让两岸统一,这个国家比美嚣张多了

禁止所有中国外交官入境,不让两岸统一,这个国家比美嚣张多了

共工之锚
2026-05-03 00:08:08
队报:登贝莱续约大框架已确定,他将和巴黎签长期合同

队报:登贝莱续约大框架已确定,他将和巴黎签长期合同

懂球帝
2026-05-10 04:24:05
山东男篮惨败,邱彪赛后爆粗:觉得很丢人,有球员就不是职业球员

山东男篮惨败,邱彪赛后爆粗:觉得很丢人,有球员就不是职业球员

中国篮坛快讯
2026-05-10 09:30:18
河北多地漫天杨絮似大雪纷飞 省绿办:多年前曾定下治理时间表 每年都有打药等防治措施

河北多地漫天杨絮似大雪纷飞 省绿办:多年前曾定下治理时间表 每年都有打药等防治措施

闪电新闻
2026-05-09 12:40:08
担心克雷桑!马纳法红牌冤枉!鲁媒:搞心态,克雷桑也难逃红牌

担心克雷桑!马纳法红牌冤枉!鲁媒:搞心态,克雷桑也难逃红牌

建哥说体育
2026-05-10 08:38:14
出轨的人都在想:为什么偷来的更刺激

出轨的人都在想:为什么偷来的更刺激

时光慢邮啊
2026-05-10 06:06:12
哈登19+7创历史第1神迹还刷爆纪录,骑士拒绝17分逆转!双塔归位

哈登19+7创历史第1神迹还刷爆纪录,骑士拒绝17分逆转!双塔归位

一将篮球
2026-05-10 08:53:23
为什么新冠阳过以后,大部分人查出肺结节?为你揭开真相!

为什么新冠阳过以后,大部分人查出肺结节?为你揭开真相!

健康之光
2026-05-10 06:30:08
推猴男子72小时被扒透:从一段视频到单位找上门,他踩中了几颗雷

推猴男子72小时被扒透:从一段视频到单位找上门,他踩中了几颗雷

水泥土的搞笑
2026-05-10 09:35:05
米切尔35分10板,火箭登限时返场,这一战让我彻底看清3个事实

米切尔35分10板,火箭登限时返场,这一战让我彻底看清3个事实

世界体育圈
2026-05-10 09:49:50
北京开展“僵尸车”清理 公示7天无认领车辆将被集中处理

北京开展“僵尸车”清理 公示7天无认领车辆将被集中处理

环球网资讯
2026-05-09 16:24:22
委内瑞拉的转身:当反美口号输给了石油工人的饭碗

委内瑞拉的转身:当反美口号输给了石油工人的饭碗

民间胡扯老哥
2026-05-05 06:15:03
2026-05-10 11:07:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
133366文章数 862151关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

媒体:高市要建日版"中情局" 不仅是为重启"军国主义"

头条要闻

媒体:高市要建日版"中情局" 不仅是为重启"军国主义"

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

消失已久的陈宝国,近况曝光惹人揪心

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

本地
时尚
旅游
公开课
军事航空

本地新闻

用苏绣的方式,打开江西婺源

越减越胖的人 ,被“0糖0脂”做局了

旅游要闻

秀北山森林公园:玫瑰盛放 醉美山海

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊突然再次交火 伊朗外长:战争准备程度是1000%

无障碍浏览 进入关怀版