“世界”真能装进手机了?
4月15日,李飞飞旗下空间智能公司World Labs发布并开源Spark 2.0渲染引擎。这是其“世界模型”战略的最新落地成果,让AI生成的3D世界,能在任何设备的浏览器里跑起来。
所谓“世界模型”,是李飞飞一直推动的AI方向:让机器理解并模拟真实的三维物理世界,而非仅仅处理文字和图像。Spark 2.0正是这个世界模型拼图中的“交付层”。解决AI生成的大尺度3D内容“怎么让人看到”的问题。
3D高斯泼溅技术通过数百万个半透明彩色椭球体还原真实场景,无需传统建模。但一个高质量扫描场景动辄4000万个点云,手机通常只能处理100万到500万个。Spark 2.0用三项技术解决了这对矛盾:连续LoD细节层级让设备只渲染“够用”的点云数量;新.RAD格式实现渐进式流加载,打开网页先见轮廓再逐步细化;GPU虚拟内存让多个场景共享显存池。
这个引擎前身是World Labs内部工具。团队发现市面渲染器要么只支持单对象,要么依赖尚未普及的WebGPU,于是决定自己造一个。去年Spark 1.0解决了多对象共存问题,2.0则攻克了手机跑不动大场景的硬骨头。
目前已有落地案例。Webby奖得主James C. Kane用Spark 2.0开发了太空射击游戏Starspeed,整个场景由超1亿个点云构成,浏览器直接运行。艺术项目《Dormant Memories》将真实地点3D扫描与虚构空间并置。
值得注意的是,Spark 2.0与World Labs的AI创作平台Marble深度绑定。用户可在Marble中用文字或图片生成3D世界,再用Spark渲染成可分享的网页链接。这意味着从“AI生成世界”到“普通人交付世界”的闭环已经跑通。
有网友评论:“李飞飞这是要把‘世界’做成一个文件格式啊,以后分享旅行不是发照片,是发一个.RAD链接,朋友点进去就能在你站过的地方散步。”“一个链接就是一座城市,这才是世界模型该有的样子。”也有开发者调侃:“上次她说空间智能是AI的下一个前沿,我以为是画饼。现在手机都能跑亿级粒子了,这饼是真烙出来了。”
李飞飞在社交平台表示:“能为基于网页的3D高斯泼溅渲染开源生态贡献力量,我深感自豪。”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.