几个月前,一段机器人单手打鸡蛋、双手切番茄、颠勺炒菜的视频在科技圈刷了屏。评论区清一色惊叹——"机器人终于要会做饭了"。
但如果你以为这段视频的重点是做菜本身,那就漏掉了真正值得关注的信息。
机器人能炒菜,这件事固然吸引眼球。但比"能炒一次"更关键的问题是:它能不能稳定复现?如果换一个厨房、换一种灶具、换一批食材,它还能不能完成?
这个问题,才是整个具身智能行业真正的拦路虎。
机器人研发最贵的不是模型,是评测
过去几年,人形机器人行业最擅长的展示,是跳舞、翻跟头、搬箱子。这些动作看起来很酷,但本质上都是"一次性表演"——录好了一条视频,发出来,全世界点赞。很少有人追问:这个动作它能稳定重复多少次?
原因很现实:真的去测,成本太高了。
要测试一个机器人模型好不好,你得把它放到真实环境里,一遍一遍跑任务。跑一次不够,要跑几百次、上千次,才能确定这个模型是"凑巧成功"还是"真的学会了"。
一台机器人、一名操作员,连续运行 200 多个小时,才能完成一轮像样的评测。硬件磨损、场地占用、人工成本,每一项都在烧钱。更别提安全风险——机器人失控撞坏设备,都是真金白银的损失。
结果就是,很多团队在"训练模型"上投入大量精力,在"评估模型"上却只能草草了事。因为根本没有足够的资源去测。
这就是 Genesis AI 想解决的真正问题。
一个比真实世界快 400 倍的训练场
5 月底,这家因炒番茄蛋视频走红的法国机器人公司,正式开源了它的核心平台:Genesis World 1.0。
这不是一个简单的仿真工具,而是一整套为机器人和 Physical AI 准备的"全栈仿真基础设施"——包括三个自研核心组件:物理仿真引擎 Genesis World、跨平台 GPU 编译器 Quadrants、以及写实渲染器 Nyx。
先看最硬核的数据。
按照官方披露,一次覆盖数百个任务、每个任务重复数百次的模型评测,在真实世界需要 200 多小时。而在 Genesis World 仿真中,数万次 episode 可以在不到半小时内完成。效率提升超过 400 倍。
但这还不是最关键的。真正值得关注的是另一个数字:仿真评测结果与真实硬件运行结果的相关性达到了 89%。
这意味着什么?开发者在虚拟环境中得出的结论,有接近九成的概率能反映真实世界中的表现。仿真不再是"仅供参考",而是可以真正替代部分真实测试。
这背后的底气在于三个环节全部自研。大多数仿真平台要么只做物理引擎,要么只做渲染器。Genesis AI 把物理模拟、视觉渲染、编译计算全部打通,从底层统一设计。
物理层处理柔体形变、复杂碰撞、灵巧操作——垃圾袋的皱褶、鸡蛋的碎裂、食材的翻滚,这些过去仿真中最棘手的细节,被放进了同一个框架。
渲染层不追求画面多好看,而是追求最接近机器人的"眼睛"——摄像头看到的真实世界,包括光照畸变、镜头模糊、材质反射,让模型在仿真中看到的环境和真实世界高度一致。
编译层则保证这套系统能在不同硬件上运行——从 MacBook 到 GPU 集群,从 NVIDIA 到 AMD,不被任何单一硬件锁死。
三层合一,才构成一个真正"可信的虚拟世界"。
从"生成数据"到"检验模型"
Genesis AI 这条技术路线的演变,本身就是一个值得品味的故事。
公司 CEO 周衔在卡内基梅隆完成博士研究后,最早推出的开源项目就叫 Genesis——一个号称"一句话生成物理世界"的仿真平台。它的核心理念是:用大语言模型驱动物理引擎,自动生成场景、任务、动作和训练数据,变成一个机器人数据的工厂。
这个愿景在当时极具想象力。机器人行业最缺的就是数据,特别是高质量的真实物理交互数据。一个人倒水、切菜、系线,里面包含大量隐含的接触、摩擦、力反馈。用真机一点点采集,既慢又贵。
如果能用生成式仿真自动产出这些数据,问题不就解决了吗?
但到了 Genesis World 1.0 发布时,团队的表述变了。他们不再说这是"数据生成器",而是称之为"机器人基础模型的评估与迭代引擎"。
这一转变值得细品。
原因很现实:如果一个模型用仿真数据训练,又在同一个仿真环境里评测,效果好只能说明它"擅长这个模拟器",不一定真的适应真实世界。这就像学生在模拟考卷上拿满分,上了高考却翻车。
所以 Genesis AI 选择先做一件更基础的事——让仿真先通过"信任测试":仿真里的模型排名,和真实世界的模型排名,是否一致?
他们的实验方法很扎实:在 14 个任务上评估 3 个不同规模的模型,每个任务在真实世界和仿真中各跑 200 轮,再用 100 万次 bootstrap 估计置信区间。最终 Pearson 相关系数达到 0.8996。
这个数字的意义不止于好看。它意味着仿真可以作为模型迭代的"筛选漏斗"——让模型在虚拟世界中先跑几千轮,表现最好的再送到真实世界做最终验证。成本降下来了,效率提上去了。
开源不是慈善,是策略
这次开源,Genesis AI 放出的不是某个单点工具,而是从物理引擎到渲染器到编译器的三层全套代码。全部公开,全部可商用。
为什么全给出去?
一个合理的推测是:Genesis AI 很清楚,仅靠一家公司之力,不可能覆盖所有机器人的评测场景。要让仿真真正成为行业基础设施,就得让全世界的开发者一起来用、一起来测、一起来反馈。开源是让这套平台快速进入真实世界闭环的最短路径。
另一个角度看:Genesis AI 的核心竞争力从来不在仿真工具本身,而在于它已经验证的模型能力(GENE-26.5)和硬件能力(灵巧手及其下一代 Genesis Hand 1.0)。开源仿真平台,反而能吸引更多生态伙伴,加速整个 Physical AI 的商业化进程。
就像当年 Android 开源,Google 赚的不是系统授权的钱,而是生态和服务的钱。
机器人进化的新范式
把这一切串起来,能看到 Genesis AI 真正想做的事情,远比"让机器人炒菜"要大。
他们在技术博客里写了一个概念:self-evolving physical AI——自我进化的物理人工智能。
这分为内外两个循环。内循环发生在仿真里:AI 自动生成环境,模型执行任务,仿真系统评分,策略持续改进。外循环发生在真实世界里:真实部署暴露边缘情况,反过来校准仿真器和任务分布。
换句话说,未来的机器人研发,不再是工程师手工设计每个任务、手动调整每个参数、排队等真机测试。而是一个能自动提出问题、验证答案、再回到现实中修正自己的系统。
如果这条路走通,仿真就不再只是现实世界的"替身",它会变成机器人学习现实世界的主要方式。
当然,这还只是方向,不是终点。Genesis AI 自己也承认,具身智能要达到类似 GPT-4 的阶段,可能还需要 5 年甚至更久。实验室里的能力跃迁,和老百姓家里能用上稳定可靠的机器人,中间隔着巨大的工程鸿沟。
但至少方向已经很清楚了:当机器人开始"自我迭代",而不是"人工调参",这个行业才真正开始加速。
如果这篇文章里的某个点说到了你心坎里,点个赞让我知道;如果这类内容对你有帮助,不妨点个关注,后续还会继续深挖。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.