当所有人还在讨论AI生成图片和视频时,腾讯直接把赛道拉到了3D世界生成。4月16日,混元世界模型2.0开源上线,输入一句话就能导出可编辑的3D资产文件——不是视频,是能进Unity、UE引擎的真·3D世界。
为什么这次不一样:从"看视频"到"能动手"
![]()
谷歌Genie 3和混元1.5只能生成视频文件,本质是"AI拍了一段动画"。世界模型2.0直接生成Mesh、3DGS、点云等多格式3D资产,意味着生成物可二次编辑、永久复用。
实机演示很直观:输入"日式RPG风格的中世纪地牢",输出的是完整3D空间资产;输入"温馨绘本风格小木屋",游戏角色能在里面自由穿行,有物理碰撞,不限时间——就像真的在游戏里。
这背后是架构的全面升级。相比1.0版本,2.0的画面精细度和真实感大幅提升,支持真实风、漫画风、游戏风自定义。关键是生成结果能直接导入现有游戏工作流,地图创作门槛被显著拉低。
技术拆解:WorldMirror 2.0架构的三重能力
混元世界模型2.0的核心是统一空间理解、生成、重建的架构。具体实现上,模型支持任意尺寸图像与视频输入,一次性预测密集点云、多视角深度图、表面法线及相机参数。
三个落地场景已经跑通:
一是文/图生3D世界。输入文字或图片,一键生成可漫游空间,场景完整度(物体侧面和背面)和输入遵循度优于同类产品。
二是角色模式交互。用户可操作角色在生成场景中探索,3DGS与Mesh混合表征支撑真实物理碰撞——这直接指向游戏原型快速验证的需求。
三是真实场景复刻。输入视频或多视角图片,构建高精度数字孪生空间。室内装修预览、城市规划、文化遗产保护等场景,未来都能快速构建。
开源背后的战略:腾讯混元的多模态加速
HY-World系列的进化节奏很快:1.0是首个开源3D世界模型,1.5实现实时在线交互,2.0直接解锁一键生成3D空间资产。这条路径清晰指向"AI造世界"的工程化落地。
更值得关注的是整体研发提速。2025年下半年以来,腾讯引入多位高级人才、加快架构升级,12月发布的大语言模型2.0已居国内顶尖行列,内部测试中的HY3模型在元宝App也获得明显正向收益。世界模型2.0的发布,是混元在多模态领域的又一突破。
目前模型已上线腾讯混元3D创作引擎官网开放申请。对于游戏开发者、空间设计师、具身智能研究者来说,这是一个值得立即试用的节点——3D生成从"玩具"变成"工具"的临界点,可能就在这次开源之后。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.